Mathematische Methoden der Physik I Sommersemester 2016 Gebhard Grübl Institut für Theoretische Physik Universität Innsbruck Inhaltsverzeichnis Vorwort vi 1 Gewöhnliche Differentialgleichungen 1.1 Skalare Gleichungen erster Ordnung . . . . . . . . . . . . 1.1.1 Definition und einfachste Beispiele . . . . . . . . 1.1.2 AWP: Existenz und Eindeutigkeit . . . . . . . . . 1.1.3 Differentialgleichungen mit getrennten Variablen . 1.1.4 *Magnetfeldlinien eines Dipols 1 . . . . . . . . . . 1.1.5 *Die Kettenlinie . . . . . . . . . . . . . . . . . . . 1.1.6 *Der freie Fall aus großer Höhe . . . . . . . . . . 1.1.7 Lineare Differentialgleichungen . . . . . . . . . . . 1.1.8 Atmosphärische 14 C-Konzentration . . . . . . . . 1.2 Systeme erster Ordnung . . . . . . . . . . . . . . . . . . 1.2.1 Definition und motivierende Beispiele . . . . . . . 1.2.2 Feldlinien einer Punktladung . . . . . . . . . . . . 1.2.3 AWP: Existenz- und Eindeutigkeit der Lösung . . 1.3 Lineare Systeme erster Ordnung . . . . . . . . . . . . . . 1.3.1 2d Drehungen . . . . . . . . . . . . . . . . . . . . 1.3.2 Homogen lineare Systeme . . . . . . . . . . . . . 1.3.3 Autonome homogen lineare Systeme . . . . . . . 1.3.4 3d Drehvektorfelder und ihre Flussabbildungen . 1.3.5 *Drehbewegungen starrer Körper: Trägheitstensor 1.3.6 *Allgemeine Bewegungen starrer Körper . . . . . 1.3.7 *Lageabhängigkeit des Trägheitstensors . . . . . . 1.3.8 *Trägheitstensor eines Ellipsoides . . . . . . . . . 1.3.9 *Kraftbedarf von Drehbewegungen . . . . . . . . 1.3.10 *Coriolis- und Zentrifugalkraft . . . . . . . . . . . 1.3.11 Inhomogen lineare Systeme . . . . . . . . . . . . 1.3.12 *E × B - Drift einer Punktladung . . . . . . . . . 1.3.13 Getriebene lineare Schwingungen: ungedämpft . . 1.3.14 *Der mechanische Fourieranalysator 1 . . . . . . . 1.3.15 Die retardierte Lösung von ẍ + ω 2 x = b . . . . . . 1.4 Lineare Differentialgleichungen 2-ter Ordnung . . . . . . 1.4.1 Äquivalenz zu System erster Ordnung . . . . . . . 1.4.2 Eine Eulersche Differentialgleichung . . . . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 2 6 8 14 17 20 25 27 29 29 34 34 35 36 38 39 40 42 44 46 49 52 53 55 57 60 62 64 67 67 69 INHALTSVERZEICHNIS 1.4.3 Getriebene lineare Schwingungen: gedämpft . . . 1.4.4 Eine retardierte gedämpfte Schwingung . . . . . . 1.4.5 Symmetrien einer Differentialgleichung . . . . . . 1.4.6 *Dehnungssymmetrie und 3. Keplersches Gesetz . 1.4.7 *Potential einer homogen geladenen Kugel . . . . 1.4.8 *Thomson- und Rayleighstreuung von Licht . . . 1.4.9 *Klassischer Zeemaneffekt . . . . . . . . . . . . . 1.4.10 Legendresche Differentialgleichung 1 . . . . . . . . 1.4.11 d’Alemberts Reduktionsverfahren . . . . . . . . . 1.4.12 Methode des Potenzreihenansatzes . . . . . . . . 1.4.13 Legendresche Differentialgleichung 2 . . . . . . . . 1.4.14 *Hermitesche Differentialgleichung . . . . . . . . 1.4.15 *Airys Differentialgleichung . . . . . . . . . . . . 1.4.16 Ein lineares Rand- und Eigenwertproblem . . . . 1.4.17 *Green’sche Funktion eines Randwertproblems . . 1.5 *Harmonisch angeregte lineare Schwingung . . . . . . . . 1.5.1 Übersicht über L0 . . . . . . . . . . . . . . . . . . 1.5.2 Partikuläre Lösungen ypart für harmonische Kraft 1.5.3 Qualitatives Resümee . . . . . . . . . . . . . . . . 1.6 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Fourieranalysis 2.1 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Trigonometrische Polynome . . . . . . . . . . . . . . 2.1.2 Beispiele trigonometrischer Polynome . . . . . . . . . 2.1.3 Dirichlets Kern . . . . . . . . . . . . . . . . . . . . . 2.1.4 Grenzfunktionen trigonometrischer Reihen . . . . . . 2.1.5 Approximation durch Fourierreihen . . . . . . . . . . 2.1.6 Fourierreihe der Rechteckschwingung . . . . . . . . . 2.1.7 Fouriereihen allgemeiner Periode . . . . . . . . . . . 2.1.8 *Lokalisierungsenergie im Potentialtopf . . . . . . . . 2.1.9 Periodisch getriebener Oszillator: Fourierreihenlösung 2.1.10 *Der mechanische Fourieranalysator 2 . . . . . . . . . 2.1.11 Allgemeine Eigenschaften der Fourierkoeffizienten . . 2.1.12 Konvergenz der Fourierreihe . . . . . . . . . . . . . . 2.1.13 Fourierreihen einiger Standardfunktionen . . . . . . . 2.2 Fouriertransformation auf L1 (R) . . . . . . . . . . . . . . . 2.2.1 Von der Fourierreihe zum Fourierintegral . . . . . . . 2.2.2 Der Hauptsatz der Fouriertransformation . . . . . . . 2.2.3 Beispiele zur Fouriertransformation . . . . . . . . . . 2.2.4 *Frequenzmessung an einem harmonischen Signal . . 2.2.5 *Störung einer Quantendynamik . . . . . . . . . . . . 2.2.6 *Beugung am Spalt und Fouriertransformation . . . . 2.2.7 *Faltung und Messung . . . . . . . . . . . . . . . . . 2.2.8 *Faltung und Bildfehlerkorrektur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 72 73 77 78 80 83 86 92 94 95 99 104 108 109 112 113 116 122 122 . . . . . . . . . . . . . . . . . . . . . . . 136 . 137 . 137 . 140 . 143 . 144 . 147 . 150 . 151 . 153 . 156 . 159 . 160 . 162 . 166 . 167 . 167 . 168 . 173 . 181 . 182 . 184 . 186 . 188 INHALTSVERZEICHNIS iii 2.2.9 *Streuung von Wellen und Fouriertransformation . . . . . . . 189 2.2.10 *Einige 3d-Fouriertransformierte . . . . . . . . . . . . . . . . . 191 2.3 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 3 Vektoranalysis 3.1 Differenzieren von Skalarfeldern . . . . . . . . . . . . . . . . . 3.1.1 Richtungsableitung und Differential . . . . . . . . . . . 3.1.2 Beispiele zum Differential . . . . . . . . . . . . . . . . 3.1.3 Skalarpotential eines Punktdipols . . . . . . . . . . . . 3.1.4 *Lineare Richtungsableitungen ohne D’barkeit . . . . . 3.1.5 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . 3.1.6 Beispiele zur partiellen Ableitung . . . . . . . . . . . . 3.1.7 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.8 *Kräftefreie relativistische Bewegung . . . . . . . . . . 3.1.9 *Konstante relativistische Kraft . . . . . . . . . . . . . 3.1.10 *Relativistischer harmonischer Oszillator . . . . . . . . 3.1.11 Basisdarstellung eines Gradienten . . . . . . . . . . . . 3.1.12 Faulenzerregeln zum Gradienten . . . . . . . . . . . . . 3.1.13 Gradientenfeld des Punktdipolpotentials . . . . . . . . 3.1.14 Gradientenfeld des Polarwinkels . . . . . . . . . . . . . 3.1.15 *Gradient zur Minkowskigeometrie . . . . . . . . . . . 3.1.16 *Symplektischer Gradient - Hamiltons Vektorfeld . . . 3.2 Differenzieren von Vektorfeldern . . . . . . . . . . . . . . . . . 3.2.1 Differential und Richtungsableitung . . . . . . . . . . . 3.2.2 *Lieprodukt von Vektorfeldern . . . . . . . . . . . . . . 3.2.3 Transport von Skalar- und Tangentenvektorfeldern . . . 3.2.4 *Lieableitung von Skalar- und Tangentenvektorfeldern . 3.2.5 *Beschleunigung einer Integralkurve von γ̇ = X (t, γ) . 3.2.6 Wegintegrale eines Vektorfeldes . . . . . . . . . . . . . 3.2.7 Wegintegrale des Vortexfeldes . . . . . . . . . . . . . . 3.2.8 *Flächeninhalt und Drehvektorfeld . . . . . . . . . . . 3.2.9 Konservative Vektorfelder und Potentiale . . . . . . . . 3.2.10 *Landvermessung: Wegabhängige Höhendifferenz? . . . 3.2.11 Poincarés Existenzsatz für skalare Potentiale . . . . . . 3.2.12 Divergenz eines Vektorfeldes . . . . . . . . . . . . . . . 3.2.13 Faulenzerregeln zur Divergenz und Beispiele . . . . . . 3.2.14 Laplace-Operator . . . . . . . . . . . . . . . . . . . . . 3.2.15 Potential einer Punktladung (dim V = n) . . . . . . . . 3.2.16 *Homogene Linienladung: Halbgerade (dim V = 3) . . . 3.2.17 *Homogen geladenes Geradenstück (dim V = 3) . . . . 3.2.18 *Inhomogen geladene Halbgerade (dim V = 3) . . . . . 3.2.19 *Dipolbelegte Halbgerade (dim V = 2) . . . . . . . . . 3.2.20 Helmholtzgleichung: alle radialen Lösungen . . . . . . . 3.2.21 Orientierung eines Vektorraums . . . . . . . . . . . . . 3.2.22 Rotation eines 3d-Vektorfeldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 199 199 204 206 207 208 208 209 211 214 215 223 224 225 225 227 228 230 231 232 235 236 237 237 238 239 240 242 243 244 248 250 251 252 256 257 259 259 259 263 INHALTSVERZEICHNIS iv 3.2.23 Faulenzerregeln zur Rotation . . . . . . . . . . . . . 3.2.24 Existenz von (Vektor)Potentialen . . . . . . . . . . 3.2.25 *Lorentzkraft: Lagrange- und Hamiltonfunktion . . 3.2.26 *Vektorpotential des freien Vortexfeldes . . . . . . 3.2.27 *Vektorpotential des Punktdipols . . . . . . . . . . 3.2.28 *Das elektromagnetische Nahfeld eines Pulsars . . . 3.2.29 *Uneigentliches Vektorpotential A′ eines Monopols 3.2.30 *Rekonstruktion des Dipolvektorpotentials aus A′ . 3.3 Krummlinige Koordinatensysteme . . . . . . . . . . . . . . 3.3.1 Lokale Karten von Rn . . . . . . . . . . . . . . . . 3.3.2 Navigation auf der Sphäre . . . . . . . . . . . . . . 3.3.3 Kartenbasis . . . . . . . . . . . . . . . . . . . . . . 3.3.4 Vektorfeldkomponenten zu Kartenbasen . . . . . . 3.3.5 Polarkoordinaten . . . . . . . . . . . . . . . . . . . 3.3.6 Kugelkoordinaten . . . . . . . . . . . . . . . . . . . 3.3.7 Kartenabhängigkeit partieller Ableitungen . . . . . 3.3.8 Geschwindigkeit zerlegt nach Kartenbasis . . . . . . 3.3.9 *Beschleunigung zerlegt nach Kartenbasis . . . . . 3.3.10 *Berechnung der Christoffelsymbole einer Karte . . 3.3.11 *Beschleunigung sphärisch zerlegt . . . . . . . . . . 3.3.12 *Bewegung im Zentralkraftfeld . . . . . . . . . . . 3.3.13 *Keplerproblem . . . . . . . . . . . . . . . . . . . . 3.3.14 *Richtungsableitung eines Vektorfeldes . . . . . . . 3.3.15 Div, Rot, Grad und ∆ in krummen Karten . . . . . 3.3.16 *Drehgeneratoren in Kugelkoordinaten . . . . . . . 3.3.17 *Magnetfeldlinien eines Dipols 2 . . . . . . . . . . . 3.4 *Kartenfreie Mechanik in Galileis Raumzeit . . . . . . . . 3.4.1 Affine Räume . . . . . . . . . . . . . . . . . . . . . 3.4.2 Flache Galilei Raumzeit M . . . . . . . . . . . . . 3.4.3 Bewegung und Bezugssysteme in M . . . . . . . . 3.4.4 Geschwindigkeit und Beschleunigung . . . . . . . . 3.4.5 Galileigruppe . . . . . . . . . . . . . . . . . . . . . 3.4.6 G-trafo von Geschwindigkeit und Beschleunigung . 3.4.7 Newtons Grundgesetze der Mechanik . . . . . . . . 3.4.8 Die Erhaltungssätze . . . . . . . . . . . . . . . . . 3.5 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . . 4 Wahrscheinlichkeit 4.1 Endliche Wahrscheinlichkeitsräume . . . . . . . . . . 4.1.1 Wahrscheinlichkeit als Mengenfunktion . . . . 4.1.2 Konstruktion von Wahrscheinlichkeitsräumen 4.1.3 Binomialverteilung . . . . . . . . . . . . . . . 4.1.4 *Multinomialverteilung . . . . . . . . . . . . . 4.1.5 *Hypergeometrische Verteilung . . . . . . . . 4.1.6 Erwartungswert und Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 267 268 271 272 272 274 275 276 276 278 281 282 284 286 288 289 290 292 294 295 297 299 301 303 305 307 308 309 311 312 314 318 319 320 321 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 330 331 332 336 337 337 338 INHALTSVERZEICHNIS 4.1.7 *Kovarianz und Korrelationskoeffizient . . . . . . . 4.1.8 Das Gesetz der großen Zahl . . . . . . . . . . . . . 4.2 Abzählbar unendliche W-räume . . . . . . . . . . . . . . . 4.2.1 Geometrische Verteilung . . . . . . . . . . . . . . . 4.2.2 Poissonverteilung . . . . . . . . . . . . . . . . . . . 4.3 Wahrscheinlichkeitsmaße auf Rn . . . . . . . . . . . . . . . 4.3.1 Wahrscheinlichkeitsmaße auf R mit Dichtefunktion 4.3.2 Gauß’sche Normalverteilung . . . . . . . . . . . . . 4.3.3 Exponentialverteilung . . . . . . . . . . . . . . . . 4.3.4 *Cauchyverteilung . . . . . . . . . . . . . . . . . . 4.3.5 Erwartungswert und Varianz . . . . . . . . . . . . . 4.3.6 Gleichverteilung auf Intervall . . . . . . . . . . . . 4.3.7 W-Maße auf Rn und ihr Transport . . . . . . . . . 4.4 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . . v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 343 350 351 353 355 355 356 358 360 360 361 362 369 Vorwort Seit einigen hundert Jahren begleitet die Mathematik das Bemühen der Menschen um ein besseres Verstehen der Natur. Ganz besonders in den Theorien der Physik schaffen mathematische Denkmuster eine Wirklichkeit, die vielfach in einer geradezu gespenstisch weitreichenden Analogie zur sinnlichen Wirklichkeit steht. Mathematik wird damit materiell erfahrbar! Wer an diesem Erleben teilhaben will, muss sich einer intensiven mathematischen Schulung unterziehen. Als Lohn der Mühe erschließt sich ein unerschöpfliches kulturelles Erbe, auf dem Physik - und manchmal sogar die Mathematik selbst - dann weiter wachsen können. Traditionellerweise ergänzen Vorlesungen über mathematische Methoden der Physik die eigentlichen, professionellen Mathematikvorlesungen, die von den Physikstudienplänen vorgesehen sind. Sie vermitteln vorrangig rechnerische Fertigkeiten und bringen uns wie Seilbahnen rasch in Regionen, die wir durchstreifen wollen, ohne dass wir uns durch alle darunterbefindlichen Zonen hocharbeiten müssen. Natürlich um den Preis, dass wir wie Seilbahntouristen auf die nähere Umgebung der Bergstation festgenagelt bleiben. Allgemeine Theorie tritt zugunsten einprägsamer Beispiele etwas in den Hintergrund. So auch in dieser Vorlesung. Das Manuskript entstand zu meinen Vorlesungen Mathematische Methoden der Physik I der Sommersemester 2002 bis 2015 an der Universität Innsbruck. Es ist um einiges genauer und umfassender als der Vortrag. Es enthält einige (mit einem Stern gekennzeichnete) nicht vorgetragene Abschnitte. Diese vertiefen entweder die gerade behandelte mathematische Technik oder wenden sie auf ein physikalisches Problem an. Sie schweifen aber auch gelegentlich vom aktuellen Kernthema ab, um physikalisch angrenzende Motive in der zuvor dargelegten mathematischen Sprache der Vorlesung aufzunehmen. Vielleicht kann es so die ’Aficionados’ der Theorie zu einer eigenständigen Verfestigung ihrer Kenntnisse quer über verschiedene Vorlesungen hinweg anregen. Um eigene Gedanken angereichert, könnte der Text im Verlauf des weiteren Physikstudiums zu einer langsam vertrauten Werkzeugkiste breiter Einsetzbarkeit werden. Hans Embacher, Peter Girtler, Gerhard Kirchner und Sabine Kreidl steuerten einige Diagramme, Korrekturen und Anregungen bei. Ihnen und allen Student(inn)en, die durch unbeirrt bohrendes Fragen der Vorlesung zu größerer Klarheit verhalfen, danke ich sehr herzlich. 4. Feber 2016, Gebhard Grübl vi Kapitel 1 Gewöhnliche Differentialgleichungen Die Punktmechanik sieht die Bewegung von Materie als eine Bewegung von ausdehnungslosen Bausteinen, die aufeinander durch scheinbar leeren Raum mittels Fernkräften einwirken. Diese fiktiven Elemente der Materie heißen Massenpunkte. Die grundlegenden frei wählbaren Bestimmungsstücke eines jeden Massenpunkts zu einer bestimmten Zeit sind sein Ort und seine Geschwindigkeit (in Newtons fiktivem absolutem Raum oder relativ zu einem Bezugssystem). Alles weitere einer komplexen Bewegungsgeschichte folgt dann aus den mechanischen Bewegungsgesetzen, denn Masse und Kraftgesetze sind (meist) unveränderlich und vorgegeben. Manchmal ersetzt ein einziger Massenpunkt eine riesige Materieansammlung, wie eine Kanonenkugel, einen Planeten, einen Stern oder auch eine Galaxie. Nämlich dann, wenn die inneren Veränderungen des zum Punkt stilisierten Aggregats für seine kollektive Bewegung belanglos zu sein scheinen. Die Bewegung der Massenpunkte eines Systems regelt die Mechanik indem sie deren momentanen Beschleunigungen eindeutig festlegt und zwar mithilfe von Kraftgesetzen und Massen. Diese drücken die momentanen Beschleunigungen durch die gleichzeitigen Orte und Geschwindigkeiten aller im System vorhandenen Massenpunkte aus. So scheiden die meisten naiv vorstellbaren Bewegungen als unmöglich aus und nur ganz bestimmte bleiben übrig. Physikalisch möglich sind nur die Lösungungen der für das jeweilige System charakteristischen Bewegungsgleichungen. Solche Gleichungen heißen unter noch näher zu erläuternden Begleitumständen Differentialgleichungen und von ihnen handelt das vorliegende Kapitel. Das mechanische Beispiel eines fundamentalen Naturgesetzes in der Form von Differentialgleichungen hat die Physik gründlich geprägt. Differentialgleichungen sind heute in Naturwissenschaft und Technik allgegenwärtig. 1 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1.1 1.1.1 2 Skalare Gleichungen erster Ordnung Definition und einfachste Beispiele Wie kommt es zu einer Differentialgleichung? Hier ein Beispiel: Ein mit Wasser gefülltes Gefäß rinnt durch einen Auslass im Boden aus. Die Querschnittsfläche des Gefäßes in der Höhe h > 0 über dem Boden sei A (h) > 0 und die Querschnittsfläche des Auslasses sei a > 0. Sinkt der Wasserspiegel in einem kleinen Zeitintervall ∆t > 0 von der Höhe h auf die Höhe 0 < h + ∆h < h ab, dann strömt Wasser desselben Volumens mit der Geschwindigkeit v (h) durch den Auslass. Daher gilt A (h) · (−∆h) = a · v (h) ∆t + o (∆t) (Volumserhaltung bei einer inkompressiblen Flüssigkeit). Dabei bezeichnet o (∆t) eine (im Detail unbekannte) Funktion, die aber für ∆t → 0 so rasch gegen 0 geht, dass lim∆t→0 o (∆t) /∆t = 0 gilt. Die Funktion v (h) lässt sich aus der Energieerhaltung erschließen. Diese besagt, dass die Abnahme der potentiellen Energie durch das Verschwinden einer kleinen Wassermenge in der Höhe h, also die Energie ∆m · g · h der kinetischen Energie der ausströmenden Wassermenge ∆m · √ v (h)2 /2 gleicht. Es gilt also ∆m · g · h = 2 ∆m · v (h) /2 + o (∆m) , also v (h) = 2gh. (Energieerhaltung) Einsetzen dieses Zusammenhangs zwischen v und h in die Volumsbilanz ergibt im Grenzübergang ∆t → 0 die Beziehung zwischen der Sinkgeschschwindigkeit des Wasserspiegels und der gerade vorliegenden Füllhöhe − dh a = dt A (h) 2gh. (1.1) Derartige Beziehungen werden in der folgenden Definition präzisiert und verallgemeinert. Ein wichtiges Ziel wird es nun sein, zu erlernen was sich aus Gleichung (1.1) über die Funktion t → h (t) erschließen lässt. Wir werden bald sehen, dass sich diese Funktion berechnen lässt, wenn der Füllstand anfänglich, wenn das Gefäß geöffnet wird, bekannt ist. Definition 1 (Anfangswertproblem) Sei M = D1 × D2 ⊂ R2 , wobei D1 und D2 allgemeine reelle Intervalle sind. (Sie können offen, halboffen, geschlossen, uneigentlich sein.) Eine Funktion f : M → R sei gegeben. Auf einem allgemeinen Intervall D ⊂ R sei eine Funktion α : D → R gegeben. Falls der Graph von α in M enthalten ist, und für alle x ∈ D α′ (x) = f (x, α(x)) gilt, dann heißt α eine Lösung der (gewöhnlichen, skalaren) Differentialgleichung (erster Ordnung) y ′ = f (x, y). Falls α(x0 ) = y0 gilt, sagt man α sei eine Lösung zum Anfangswert (x0 , y0 ) ∈ M. Falls zu einer Lösung α keine Lösung β : D′ → R existiert, für die D echt in D′ enthalten ist und β(x) = α(x) für alle x ∈ D gilt, dann heißt die Lösung α maximal. Anmerkungen: 1) Der Definitionsbereich D einer Lösung α ist zwangsläufig Teilmenge von D1 . 2) Oft wird lose formuliert: Eine Differentialgleichung ist eine Gleichung, in der eine Funktion und ihre Ableitungen vorkommen. Das ist zu KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 3 weitläufig, denn gilt für eine Funktion α, dass α′ (x) = f(x, α(x/2)) oder dass α′ (α(x)) = f (x, α(x)), so sind dies keine Differentialgleichungen im Sinn der hier zugrunde gelegten Definition. 3) Die hier gewählte Beschränkung auf offene Rechtecke M als Definitionsbereiche von f schließt übrigens auch folgendes aus: y ′ = 1/(x2 −y 2 ) auf {(x, y) ∈ R2 | x2 = y 2 } . Diese Beschränkung ist nicht wirklich notwendig und es würde genügen, M ⊂ R2 als zusammenhängend und offen vorauszusetzen. Die Beschränkung auf offene Rechtecke vereinfacht aber manche Überlegungen. Definition 2 Sei y ′ = f(x, y) eine Differentialgleichung. Sei M der Definitionsbereich von f. Dann heißt V : M → R2 , (x, y) → (1, f (x, y)) das Vektorfeld von y ′ = f (x, y). Jedes Vektorfeld des Typs g · V mit einer Funktion g : M → R 0 heißt Richtungsfeld von y ′ = f (x, y).1 Abbildung (1.1) zeigt ein Richtungsfeld der Differentialgleichung y ′ = xy. y 2 1 0 -2 -1 0 1 2 x -1 -2 Abbildung 1.1: Richtungsfeld zu y ′ = xy Ist α Lösung von y ′ = f (x, y) und ist x0 im Definitionsbereich von α, dann stimmt die Tangente des Graphen von α in (x0 , α(x0 )) mit (x0 , α(x0 )) + R · V (x0 , α(x0 )) überein. Ein Richtungsfeld der Differentialgleichung ist somit in den Punkten des Graphen einer Lösung tangential zu diesem. Damit vermittelt ein Richtungsfeld einen qualitativen Eindruck von den Lösungen einer Differentailgleichung. Beispiel 3 Sei f : R2 → R, (x, y) → λy für ein λ ∈ R. Abbildung 1.2 veranschaulicht ein Richtungsfeld für λ = 1. Lösungen der Differentialgleichung y ′ = λy sind leicht zu erraten: Für jedes c ∈ R ist αc : R → R, x → c exp (λx) eine maximale Lösung. Abbildung 1.3 zeigt αc für λ = 1 und c = ±1, ±2. Gibt es neben den Einschränkungen der Lösungen αc auf Intervalle weitere Lösungen von y ′ = λy? Nein, denn für jede Lösung α gilt in ihrem Definitionsintervall D (α (x) exp (−λx))′ = α′ (x) exp (−λx) + α(x) (exp (−λx))′ = λα(x) exp (−λx) − λα(x) exp (−λx) = 0. 1 Vielfach wird auch die Äquivalenzklasse von Vektorfeldern {g · V |g : M → R 0 } als ’das’ Richtungsfeld der Differentialgleichung bezeichnet. Gezeichnet wird dann nur ein Repräsentant (ohne Orientierungspfeil), meist mit konstanter Länge. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 4 Abbildung 1.2: Richtungsfeld von y ′ = y Abbildung 1.3: Lösungen von y ′ = y Daher ist α (x) exp (−λx) konstant auf D. (Hier wird davon Gebrauch gemacht, dass D ein Intervall ist.) Damit gilt für die Menge L aller maximalen Lösungen von y ′ = λy, dass L = {αc | c ∈ R}. Eine maximale Lösung zum Anfangswert (x0 , y0 ) ∈ R2 erfüllt y0 = αc (x0 ) = c exp(λx0 ). Damit folgt c = y0 exp (−λx0 ). Es existiert somit genau eine maximale Lösung von y ′ = λy zu einem gegebenen Anfangswert. Die naive Erwartung, dass die Differentialgleichung die maximale Lösung determiniert, wird von diesem Beispiel bestätigt. L enthält die Nulllösung α0 = 0. Ihr Graph trennt den Definitionsbereich R2 der Differentialgleichung in die disjunkten Bereiche M> := R × R>0 und M< := R × R<0 . Für c > 0 ist der Graph von αc (zur Gänze) in M> und für c < 0 in M< enthalten. Eine Differentialgleichung mit f : R×D2 → R heißt autonom, falls f konstant im ersten Argument ist. Ist α : D → R eine Lösung einer autonomen Diffgl, dann KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 5 ist für jedes τ ∈ R auch ihr Translat2 ατ : Dτ := {x ∈ R | x − τ ∈ D} → R, x → α(x − τ ) eine Lösung. Warum? Für x ∈ Dτ gilt d ατ dx d α(x − τ + ε) − α(x − τ ) = α (x) ε→0 ε dx τ d = α (x − τ ) = f (x − τ , α(x − τ )) = f (x, ατ (x)) . dx (x) = lim Die Funktion f der Differentialgleichung von Beispiel 3 ist konstant im ersten Argument. Für αc ∈ L gilt (αc )τ = αc exp(−λτ ) . Die Translationen erzeugen aus α1 alle Lösungen αc mit c > 0 und aus α−1 alle Lösungen αc mit c < 0. Die Nulllösung ist translationsinvariant: (α0 )τ = α0 . Dies illustriert die Rolle von Symmetriegruppen: Symmetrien erzeugen aus einer Lösung andere. Beispiel 4 Sei f : R2 → R, (x, y) → y 2 . Abbildung 1.4 zeigt ein Richtungsfeld von y ′ = y 2 . Drei maximale Lösungen sind leicht zu erraten: • α0 : R → R, x → 0 (konstante Lösung) • α+ : R<0 → R>0 , x → −1/x • α− : R>0 → R<0 , x → −1/x Abbildung 1.4: Richtungsfeld von y ′ = y 2 Obwohl die Lösung α+ maximal ist, ist sie nur für alle x ∈ R<0 definiert. Ihr Graph entschwindet für x ↑ 0 ins Unendliche. Analoges gilt für α− . Da die Differentialgleichung autonom ist, kann durch Translationen daraus die folgende Menge L maximaler Lösungen gewonnen werden. L = {α0 } ∪ {(α+ )τ | τ ∈ R} ∪ {(α− )τ | τ ∈ R} . 2 Es gilt also ατ (x + τ) = α(x) für alle x ∈ D. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 6 Der Definitionsbereich von (α+ )τ ist das Intervall R<0 +τ = (−∞, τ ), der von (α− )τ ist R>0 + τ = (τ , ∞). Es gilt (α+ )τ (x) = 1 1 für x < τ und (α− )τ (x) = für x > τ . τ −x τ −x In L gibt es zu jedem Anfangswert (x0 , y0 ) ∈ R2 genau eine Lösung. Für y0 = 0 ist dies die Lösung α0 . Für y0 > 0 ist es die Lösung (α+ )τ mit τ = x0 + y10 > x0 , was aus y0 = (α+ )τ (x0 ) = 1/ (τ − x0 ) folgt. Analog ist für y0 < 0 die einzige Lösung in L mit α(x0 ) = y0 die Funktion (α− )τ mit τ = x0 + y10 < x0 . Der folgende Satz zieht nach sich, dass L die Menge aller maximalen Lösungen von y ′ = y 2 ist. 1.1.2 AWP: Existenz und Eindeutigkeit Die Frage, ob eine Differentialgleichung y ′ = f (x, y) überhaupt Lösungen besitzt, und inwiefern verschiedene Lösungen zum selben Anfangswert sich voneinander unterscheiden können, ist natürlich für physikalische Zwecke äußerst interessant und öffnet ein weites Aufgabenfeld. Für die Existenz von Lösungen zu beliebigem Anfangswert reicht die Stetigkeit von f. Für die Eindeutigkeit von lokalen Lösungen durch einen Punkt p braucht es jedoch etwas stärkere Annahmen an f. Hier ein einigermaßen weitreichender Satz zu beiden Fragen. Ein Beweis ist in Kap. II, §6 von [18] ausgeführt. Satz 5 Seien D1 und D2 allgemeine, offene, reelle Intervalle und M := D1 × D2 . Die Funktion f : M → R sei stetig. Für jedes p ∈ M existiere ein offenes Rechteck Rp ⊂ M mit p ∈ M und eine reelle Zahl Lp > 0, sodass |f (x, y1 ) − f (x, y2 )| ≤ Lp |y1 − y2 | (1.2) für alle (x, y1 ) und (x, y2 ) in Rp .3 Die Funktionen α : D → R und β : D → R seien Lösungen von y ′ = f (x, y) mit α(x0 ) = β(x0 ) für ein x0 ∈ D. Dann gilt α = β. Der Graph einer maximalen Lösung kommt dem Rand von M beliebig nahe. Durch jeden Punkt von M existiert genau eine maximale Lösung. Der Satz stellt klar, dass durch jeden Punkt von M Lösungen von y ′ = f (x, y) existieren. Eine Lösung durch einen Punkt p, deren Definitionsintervall nicht mehr ausgedehnt werden kann, ist eine maximale Lösung. Sie ist eindeutig bestimmt. Jede weitere Lösung durch p ist Einschränkung der maximalen Lösung durch p. Der Satz zeigt überdies, dass bei einer Abänderung der Funktion f in eine Funktion g mit g(x, y) = f (x, y) für alle (x, y) in einem Rechteck M ′ ⊂ M mit (x0 , y0 ) ∈ M ′ die Lösung zum Anfangswert (x0 , y0 ) ∈ M innerhalb von M ′ unverändert bleibt. Man sagt, dass der Satz ein Nahewirkungsprinzip zum Ausdruck bringt. Falls es für eine Differentialgleichung y ′ = f (x, y), deren Funktion f die Voraussetzungen des Satzes erfüllt, gelungen ist, zu jedem Anfangswert in M eine maximale 3 Man sagt, dass f lokal Lipschitzbeschränkt ist. Lp heißt Lipschitzkonstante. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 7 Lösung zu finden, dann sagt der Satz, dass die Gleichung keine weiteren maximalen Lösungen hat. Eine hinreichende Bedingung dafür, dass f lokal Lipschitzbeschränkt ist, lautet: Ist die stetige Funktion f von Satz 5 nach dem zweiten Argument stetig partiell differenzierbar, dann erfüllt f die lokale Lipschitzbedingung (1.2). Die beiden Beispiele 3 und 4 erfüllen somit die Voraussetzungen des Satzes. Die für die Beispiele angegebenen Mengen L an maximalen Lösungen enthalten zu jeder möglichen Anfangsbedingung genau eine Lösung. Nach Satz 5 existieren daher keine weiteren maximalen Lösungen. Hier noch eine Funktion f, die nicht auf ganz M lokal Lipschitzbeschränkt ist. f : R2 → R, (x, y) → |y|. (1.3) f ist stetig aber f ist nicht auf ganz R2 lokal Lipschitzbeschränkt. Warum: Wähle den Punkt p = (x0 , 0). Ist f lokal Lipschitzbeschränkt um p, dann existiert ein ε > 0 und eine Konstante L > 0 mit |y| ≤ L |y| für alle y ∈ (−ε, ε). Daraus folgt 0 ≤ limy↓0 √1y ≤ L. Das ist bekanntlich nicht der Fall. Also ist f nicht lokal Lipschitzbeschränkt. Beachte jedoch: die Einschränkung von f auf R × R>0 ist lokal Lipschitzbeschränkt, da f dort stetig partiell diffbar ist. Ohne Lipschitzbedingung kann die Eindeutigkeit fehlen - ein Beispiel Untersuchen wir die Differentialgleichung y ′ = 2 |y|. Satz 5 ist nicht anwendbar. Das Richtungsfeld, siehe Figur 1.5, unterscheidet sich nicht besonders auffällig von Abbildung 1.5: Richtungsfeld von y ′ = 2 |y| jenem aus Beispiel 4. Wir erraten neben der Nulllösung α0 : R → R, x → 0 die Lösungen: α− : R≤0 → R≤0 , x → −x2 und α+ : R≥0 → R≥0 , x → x2 und deren Translate (α± )τ . Die Lösungen (α± )τ sind jedoch nicht maximal. Sie können stetig differenzierbar durch die Nulllösung fortgesetzt werden. So entsteht die folgende Menge L von KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 8 maximalen Lösungen αa,b mit a ≤ b ∈ R und −(x − a)2 für x < a 0 für a ≤ x ≤ b . αa,b : R → R, x → (x − b)2 für b < x Es gilt also L = {αa,b | a, b ∈ R und a ≤ b}. Figur 1.6 zeigt die Lösung αa,b mit a = −1 und b = 2. Zu jedem Anfangswert (x0 , y0 ) mit y0 = 0 existiert lokal genau y 4 2 0 -2.5 -1.25 0 1.25 2.5 3.75 x -2 -4 Abbildung 1.6: Eine Lösung von y ′ = 2 |y| eine Lösung. Global existieren zu jedem Anfangswert unendlich viele verschiedene Lösungen. Für Anfangswerte (x0 , 0) existieren auch lokal unendlich viele verschiedene Lösungen. Der Unterschied zur Lösungsmenge von Beispiel 4 ist also doch erheblich. 1.1.3 Differentialgleichungen mit getrennten Variablen Definition 6 Seien D1 und D2 allgemeine, offene Intervalle und g : D1 → R und h : D2 → R stetig. Sei f : D1 × D2 → R, (x, y) → g(x)h(y). Dann heißt die Differentialgleichung y ′ = f (x, y) vom Typ der getrennten Variablen. Ist h stetig differenzierbar, dann ist f lokal Lipschitzbeschränkt und der Eindeutigkeitssatz ist somit anwendbar. Satz 7 Sei E ⊂ D2 ein maximales Intervall, auf dem h keine Nullstelle hat, und sei hE die Einschränkung von h auf E. Sei ΦE eine Stammfunktion der Funktion 1 . Sei G eine Stammfunktion von g. Sei I ⊂ D1 ein allgemeines Intervall und hE α : I → E so, dass für ein reelles c und für alle x ∈ I gilt: ΦE (α(x)) = G (x) + c. Dann ist α eine Lösung der Differentialgleichung y ′ = g(x)h(y) und es gilt für alle x∈I α(x) = Φ−1 E (G (x) + c) . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 9 Kann I für festes c nicht vergrößert werden, ist α eine maximale Lösung. Weitere maximale Lösungen der Differentialgleichung sind die konstanten Funktionen αi : D1 → R, x → yi , wobei yi eine Nullstelle von h ist. Der Beweis des Satzes ist in [10] zu finden. Eine heuristische Merkhilfe geht so dy = h(y) g(x)dx. Für Lipschitzbeschränktes f ist die Menge aller maximalen Funktionen α des im Satz (7) angeführten Typs, wenn alle nullstellenfreien Teilintervalle E abgearbeitet werden, die Menge aller maximalen Lösungen der Differentialgleichung. Beispiel 1: y ′ = y Sei f (x, y) = y auf R2 . Es gilt somit f (x, y) = g (x) h (y) für g (x) = 1 und h(y) = y für alle x, y ∈ R. Die Funktion f hat die beiden maximalen, nullstellenfreien Teilintervalle E1 := R>0 und E2 := R<0 . Eine Stammfunktion ΦE1 von 1/y auf E1 ist ln(y) und eine Stammfunktion von g(x) = 1 auf R ist x. Somit ist eine Funktion α(x) > 0 mit ln (α (x)) = x + c Lösung. Da ln : E1 → R bijektiv ist, kann c beliebig in R gewählt, und α auf ganz R definiert werden. Es folgt somit α(x) = ec ex für alle x ∈ R. Die positiven Vielfachen der Exponentialfunktion sind somit als maximale Lösungen identifiziert. Auf E2 hat 1/y die Stammfunktion ln (−y). Somit ist eine Funktion α(x) < 0 mit ln (−α (x)) = x + c Lösung. Wie oben folgt für beliebiges c ∈ R, dass −α(x) = ec ex für alle x ∈ R. Schließlich bleibt die auf ganz R konstante Funktion α(x) = 0 als Lösung. Wir haben somit die folgende Menge L von maximalen Lösungen gefunden: L = {αC : R → R, x → C exp (x) | C ∈ R} . Gibt es weitere maximale Lösungen, die noch nicht in L enthalten sind? Zu jedem Anfangswert (x0 , y0 ) ∈ R2 existiert genau eine Funktion αC ∈ L mit αC (x0 ) = y0 . Es ist dies die Funktion αC mit C = y0 · e−x0 . Da es durch jeden Punkt (x0 , y0 ) ∈ R2 nach dem Eindeutigkeitssatz höchstens eine maximale Lösung gibt, ist L aber auch schon die Menge aller maximalen Lösungen der Differentialgleichung y ′ = y. Beispiel 2 Sei f : R2 → R mit f (x, y) = g(x)h(y), wobei g(x) = −2x auf R und h(y) = y für y > 0 . y 2 für y ≤ 0 Die maximalen nullstellenfreien Teilintervalle von h sind E1 := R>0 und E2 := R<0 . Eine Stammfunktion von g ist G(x) = −x2 auf R. Eine Stammfunktion von 1/h auf E1 ist ln(y). Somit ist eine positive Funktion α mit ln (α(x)) = −x2 + c für c ∈ R 2 eine Lösung. Für sie folgt α(x) = ec e−x . Ihr maximaler Definitionsbereich ist für beliebiges c ∈ R ganz R. Setze α+ (x) := exp (−x2 ) für x ∈ R. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 10 Eine Stammfunktion von 1/h auf E2 ist −1/y. Sie nimmt nur positive Werte an. Somit ist eine Funktion αc mit Werten in R<0 und −1/αc (x) = −x2 + c für c ∈ R>0 2 eine Lösung. Für sie folgt √ α √c (x) = 1/ (x − c) . Ihr maximaler Definitionsbereich ist das offene Intervall (− c, c) . Die Menge L aller so bestimmten maximalen Lösungen erfüllt also L = {C · α+ |C ≥ 0} ∪ {αc |c > 0} . Durch jeden Punkt (x0 , y0 ) ∈ R2 geht genau eine Funktion aus L. Somit ist L die Menge aller maximalen Lösungen der Differentialgleichung. Abbildung (1.7) zeigt die Graphen von α+ , 2α+ , α1 und α4 . y 2 1 0 -5 -2.5 0 2.5 5 x -1 -2 Abbildung 1.7: Die Lösungen α+ , 2α+ , α1 , α4 Beispiel 3 Sei f : R × R → R mit f(x, y) = 2xy 2 . Die Abbildung (1.8) zeigt ein Richtungsfeld von y ′ = f (x, y). Für die Funktionen g, h : R → R mit g(x) = 2x und h(y) = y 2 gilt Abbildung 1.8: Richtungsfeld von y ′ = 2xy 2 f (x, y) = g(x)h(y). KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 11 Die maximalen nullstellenfreien Teilintervalle von h sind R<0 und R>0 . Die Funktion G mit G(x) = x2 auf R ist eine Stammfunktion von g. Die Funktion Φ> mit Φ> (y) = −1/y auf R>0 ist eine Stammfunktion von 1/h auf R>0 . Eine Lösung α > 0 erfüllt somit 1/α(x) = −x2 + c > 0 für ein c ∈ R>0 . Für jedes c > 0 ist somit die Funktion √ √ 1 α+ c : − c, c → R>0 , x → c − x2 eine maximale Lösung. Die Funktion Φ< mit Φ< (y) = −1/y auf R<0 ist eine Stammfunktion von 1/h auf R<0 . Eine Lösung α < 0 erfüllt daher 1/α(x) = −x2 + c′ < 0 für ein c′ ∈ R und für alle x mit c′ < x2 . Für jedes c =: −c′ > 0 ist somit die Funktion α− c : R → R<0 , x → −1 c + x2 eine maximale Lösung. Für jedes c = c′ ≥ 0 sind die Funktionen α> : c α< : c √ c, ∞ → R<0 , x → −1 −c √ −1 −∞, − c → R<0 , x → 2 x −c x2 maximale Lösungen. Abbildung (1.9) zeigt einige maximalen Lösungen. y 1.5 1 0.5 0 -2.5 -1.25 0 -0.5 1.25 2.5 x -1 < + − Abbildung 1.9: Die Lösungen α> c , αc , αc und αc für c = 1 und c = 3 Schließlich gibt es noch die konstante Lösung α0 : R → R mit α0 (x) = 0. Somit haben wir die folgende Menge L von maximalen Lösungen gefunden. − < > L = α+ c |c > 0 ∪ αc |c > 0 ∪ {αc |c ≥ 0 } ∪ {αc |c ≥ 0 } ∪ {α0 } . Gibt es weitere maximale Lösungen unserer Differentialgleichung, die uns entgangen sind? Durch einen Punkt (x0 , y0 ) in der Halbebene y0 > 0 geht genau eine der Lösungen {α+ c |c > 0 } . Durch einen Punkt der unteren Halbebene y0 < 0 mit x0 = 0 und y0 > −1/x20 geht genau eine der Lösungen {α− c |c > 0 } . Dasselbe gilt für einen KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 12 Punkt (0, y0 ) mit y0 < 0. Durch einen Punkt (x0 , y0 ) der unteren Halbebene y0 < 0 mit x0 < 0 und y0 ≤ −1/x20 < 0 geht genau eine der Lösungen {α< c |c ≥ 0 } . Durch einen Punkt (x0 , y0 ) der unteren Halbebene y0 < 0 mit x0 > 0 und y0 ≤ −1/x20 < 0 geht genau eine der Lösungen {α> c |c ≥ 0 } . Durch einen Punkt (x0 , 0) mit x0 ∈ R schließlich geht genau die 0-Lösung α0 . In Übereinstimmung mit dem Eindeutigkeitssatz, der ja auf y ′ = 2xy 2 anwendbar ist, gibt es durch einen Punkt (x0 , y0 ) höchstens eine maximale Lösung der Differentialgleichung y ′ = 2xy 2 . Da zu jedem Punkt (x0 , y0 ) ∈ R2 eine maximale Lösung in L existiert, ist die Menge L aber tatsächlich die Menge aller maximalen Lösungen von y ′ = 2xy 2 . Beispiel 4 Für die autonome Differentialgleichung y ′ = cos y kann g = 1 auf R und h = cos auf R gewählt werden. Die Nullstellenmenge von h ist (2n + 1) π2 |n ∈ Z . Die maximalen nullstellenfreien Teilintervalle des Definitionsbereiches von h sind somit die Intervalle In = (2n − 1) π2 , (2n + 1) π2 . Abbildung 1.10: Richtungsfeld zu y ′ = cos y für − π2 < y < π 2 Wegen cos (y + kπ) = (−1)k cos (y) genügt es, die maximalen Lösungen im Intervall I0 = − π2 , π2 zu bestimmen. Eine Stammfunktion4 Φ von 1/ cos auf diesem Intervall ist die (bijektive, steigende) Funktion Φ : − π2 , π2 → R mit Φ (y) = ln 1 + tan y , cos y denn cos y Φ (y) = 1 + sin y 1 = 1 + sin y ′ 4 (1 + sin)′ (y) cos (y) − (1 + sin) (y) cos′ (y) · cos2 y cos2 (y) + (1 + sin) (y) sin (y) 1 · = . cos y cos y Zum systematischen Bestimmen von Φ siehe: Kap. III, §10 in [4] Vol 1. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 13 Somit existiert für jede maximale Lösung α mit Werten in I0 eine Zahl c ∈ R, sodass ln Da 1/ cos y = zu cos2 y+sin2 y cos2 y 1 + tan α (x) cos α (x) = (1.4) = x + c. 1 + tan2 y auf I0 gilt, ist Gleichung (1.4) äquivalent 1 + tan2 α (x) + tan α (x) = ex+c . √ Suche daher die Zahlen z ∈ R mit 1 + z 2 + z = w > 0. Es folgt durch Quadrieren 1 + z 2 = (w − z)2 und weiter 1 = w 2 − 2wz. Letzteres gilt für z= 1 2 w− 1 w . Tatsächlich ist dies eine Lösung der Ausgangsgleichung. Somit folgt ex+c − e−(x+c) tan α (x) = = sinh (x + c) . 2 Die Menge L0 der maximalen Lösungen mit Werten im Intervall I0 ist daher die Menge aller Funktionen αc : R → − π2 , π2 mit c ∈ R und αc (x) = arctan sinh (x − c) . Alpha 1 0.5 0 -10 -5 0 5 10 x -0.5 -1 Abbildung 1.11: 2 π arctan sinh x (rot) und 2 π arctan x Für die Menge Ln aller maximalen Lösungen mit Werten im Intervall In gilt Ln = {(−1)n αc + nπ |c ∈ R} . Figur 1.12 zeigt α0 , −α0 + π, α0 + 2π, −α0 − π. Die Lösungen mit Werten in In streben für gerades n bei x → ∞ gegen den oberen Rand des Intervalls In und für KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 14 Abbildung 1.12: Lösungen von y ′ = cos y ungerades n gegen den unteren. Die konstante Lösung yn = (2n + 1) π/2, die auf einer Nullstelle von cos liegt, scheint also für gerades n die Lösungen in den beiden angrenzenden Intervallen „anzuziehen“ und ansonsten „abzustoßen“.5 1.1.4 *Magnetfeldlinien eines Dipols 1 Das Magnetfeld eines magnetischen Dipols6 , der ausdehnungslos im Punkt 0 des dreidimensionalen Ortsvektorraums mit Skalarprodukt ·, · und zugehöriger Norm |·| ruht, ist durch das Vektorfeld B : V 0 → V mit B (v) = D |v|3 3 e, v v−e . |v|2 gegeben. Dabei gibt D ∈ R>0 die Stärke und e ∈ V mit |e| = 1 die Richtung des (konstanten) Dipolmoments an. Das Vektorfeld B ist invariant unter Drehungen um e. Daher genügt es, sich das Vektorfeld B innerhalb einer Ebene durch 0, die e enthält, mittels Feldlinien zu veranschaulichen. Ist (e1 , e2 , e3 ) eine Orthonormalbasis von V mit e2 = e, dann gilt für Vektoren v = xe1 + ye2 = 0, also Vektoren ungleich 0 in der Ebene {v ∈ V : v, e3 = 0} B (xe1 + ye) = = = D y 2 )3/2 (x2 + D (x2 + y 2 )3/2 D (x2 + y 2 )3/2 3 x2 y y xe1 + 3 2 ye2 − e2 2 +y x + y2 3 xy 3y 2 − (x2 + y 2 ) e + e2 1 x2 + y 2 x2 + y 2 3 xy 2y 2 − x2 e + e2 . 1 x2 + y 2 x2 + y 2 Figur (1.13) zeigt das Vektorfeld B/ |B| . 5 6 In diesem Bild wird x als Zeit interpretiert. Analoges gilt für das elektrische Feld eines elektrischen Dipols. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 15 Abbildung 1.13: Richtungsverlauf eines Dipolvektorfeldes Ein Blick auf Figur (1.13) lässt vermuten, dass eine Feldlinie im ersten Quadranten der Graph einer Funktion x → α (x) ist. Der Anstieg einer solchen Feldlinie durch den Punkt (x, y) ∈ U = R>0 × R>0 hat im Punkt (x, y) offenbar den Wert 2y 2 − x2 2α (x)2 − x2 α (x) = = . 3xy 3xα (x) ′ Die Funktion α ist somit eine Lösung der Differentialgleichung y ′ = f (x, y) mit f : R>0 × R>0 → R und f (x, y) = 2y 2 − x2 . 3xy Nun gilt f (x, y) = 23 xy − 13 xy =: g (y/x) für alle (x, y) ∈ U. Die Funktion f ist also homogen vom Grad 0. Solche Differentialgleichungen lassen sich auf U durch einen simplen Trick in Differentialgleichungen vom Typ der separierten Variablen umformen. Für α (x) = x · β (x) gilt ja α′ (x) = β (x) + x · β ′ (x) , sodass β eine Lösung von β (x) + x · β ′ (x) = f (x, α (x)) = g (β (x)) . Somit gilt g (β (x)) − β (x) . x Im gegenwärtigen Fall erfüllt β somit die Differentialgleichung β ′ (x) = ′ β (x) = 2 β 3 (x) − x 1 3β(x) − β (x) = − 1 1 (β (x) + 1/β (x)) = − h (β (x)) 3x 3x mit h : R>0 → R>0 und h (y) = y + y −1 . Die Funktion h ist nullstellenfrei und ihr Kehrwert hat die Stammfunktion H : R>0 → R>0 mit H (y) = 12 ln (1 + y 2 ) , da ja 2y 1 H ′ (y) = 12 1+y 2 = y+y −1 gilt. 1 Damit erfüllt eine Lösung β von β ′ = − 3x h (β) die Beziehung 1 1 ln 1 + β (x)2 = − ln (x) + c 2 3 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 16 für ein c ∈ R und für alle x in einem hinreichend kleinen Intervall. Exponenzieren dieser Beziehung ergibt 2 1 + β (x)2 = ec e− 3 ln(x) = ec x−2/3 . Daraus folgt β (x)2 = ec x−2/3 −1 = (C/x)2/3 −1 für ein C = e3c/2 > 0. Die zugehörige maximale Lösung β C ist somit die Funktion (C/x)2/3 − 1. β C : (0, C) → R>0 mit β C (x) = Die zu β C gehörige Funktion αC ist die Funktion αC : (0, C) → R>0 mit αC (x) = x (C/x)2/3 − 1 = (Cx2 )2/3 − x2 . Man beachte limx→C αC (x) = 0. Die Menge aller Feldlinien im ersten Quadranten ist somit die Menge der Graphen zur Funktionenfamilie {αC : C > 0} . Die Feldlinie durch einen Punkt (x0 , y0 ) ∈ U ist Graph der Funktion αC mit C > 0 so, dass αC (x0 ) = y0 . Daraus folgt (y0 /x0 )2 +1 = (C/x0 )2/3 und somit 3/2 C = x0 1 + (y0 /x0 )2 . Eine analoge Überlegung zeigt, dass im Quadranten U ′ = R>0 ×R<0 die Feldlinien die Graphen der Funktionen −αC sind. Eine gesamte Feldlinie im Bereich R>0 × R ist somit der Abschluss der Menge {(x, y) : x > 0, |y| = αC (x)} in R>0 × R. Durch Spiegelung an der Ebene y = 0 ergeben sich schließlich die (richtig orientierten!) Feldlinien im Bereich x < 0. Im Bereich x < 0 bildet eine Feldlinie die Menge {(x, y) : x < 0, |y| = αC (|x|)} . Die einzigen beiden davon nicht erfassten Feldlinien sind die Halbgeraden {(0, ±y) : y > 0} , der Grenzfall C = 0. Durch jeden Punkt der Ebene (ohne 0!) geht genau eine Feldlinie. Jede Feldlinie kommt dem Rand des Definitionsbereiches von B, nämlich dem Punkt 0 beliebig nahe. Abbildung 1.14: Feldlinien eines Dipols Polardarstellung einer Feldlinie mit C > 0 3 Es gilt x2 + αC (x)2 = C 2/3 x4/3 , also x2 + αC (x)2 = C 2 x4 . Für Polarkoordinaten (r, ϕ) mit x = r cos ϕ und y = r sin ϕ besteht auf einer Feldlinie somit der Zusammenhang r6 = C 2 r4 cos4 ϕ. Die Feldlinie hat daher die Polardarstellung r = C cos2 ϕ. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 17 Dabei kann ϕ ∈ (−π/2, π/2) für eine Feldlinie im Bereich x > 0 und ϕ ∈ (π/2, 3π/2) für eine Feldlinie im Bereich x < 0 gewählt werden. Lässt man ϕ ∈ [0, 2π] zu, werden zwei zueinander spiegelgleiche Feldlinien in den Halbräumen x > 0 bzw x > 0 zu einer einzigen Feldlinie durch die Singularität in 0 hindurch verbunden. 1.1.5 *Die Kettenlinie Eine Kette sei an zwei Punkten A und B aufgehängt, die nicht direkt übereinander liegen. Welche Linie im Raum belegt die ruhende Kette, wenn ihre Länge unveränderlich ist, und die einzelnen Kettenglieder zu Punkten idealisiert werden? Im folgenden wird die Überlegung erläutert, die - zumindest gemäß der Darstellung in Kap. B.11 von [17] - Johann Bernoulli 1691 zur Lösung des Problems führte.7 Johann Bernoulli scheint Newtons Mechanik, wie sie 1687 in den Prinzipia dargelegt war, gekannt und zur Grundlage seiner Überlegung gemacht zu haben. Denn er nimmt an: Die Ketteninie γ liegt in einer (affinen) Ebene des 3d euklidischen Raumes. Diese Ebene wird vom Vektor, der A in B schiebt, und dem Richtungsvektor der Schwerkraft aufgespannt. (Dies lässt sich beweisen!) OEdA wird A = 0 gesetzt, und in der Ebene eine ONB (e1 , e2 ) mit den zugehörigen Koordinaten (x, y) so gewählt, dass das Schwerkraftfeld die Richtung −e2 hat, und xB = x (B) > 0 gilt. Weiter nimmt er an, dass γ der Graph einer zwei mal stetig differenzierbaren Funktion von x ist: d.h. es gibt8 eine C 2 -Funktion α : I → R, wobei I das reelle Intervall [0, xB ] ist, sodass {(x, y) (p) |p ∈ γ } = {(x, α (x)) |x ∈ I } . Sei nun p ∈ γ mit x (p) = xp > 0. Die Zahl xp s (xp ) = 1 + (α′ )2 (ξ)dξ 0 gibt die Länge jenes Teils der Linie γ an, der zwischen 0 und p liegt. Sei ϕ (xp ) der Anstiegswinkel von α bei xp . Es gilt also π π . α′ (xp ) = tan ϕ (xp ) mit ϕ (xp ) ∈ − , 2 2 An dem Kettenstück zwischen A und p greifen drei Kräfte an: • Schwerkraft Fg = −ρgs (xp ) e2 ; hier sind ρ die konstante Kettenmasse pro Längeneinheit und g die Erdbeschleunigung; • Befestigungskraft F0 = − |F0 | (cos (ϕ (0)) e1 + sin (ϕ (0)) e2 ) mit |F0 | > 0 in A; • Kettenspannkraft Fp = |Fp | (cos ϕ (xp ) e1 + sin ϕ (xp ) e2 ) greift in p. 7 Galilei hatte vermutet, dass diese Kettenlinie eine Parabel sei. Huygens widersprach zwar schon 1646, also mit 17(!) Jahren, dieser Vermutung, fand aber erst 1691, also mit 62 Jahren, die richtige Kurve, nachdem Jakob Bernoulli das Problem zur Herausforderung an seine Kollegenschaft erklärt hatte. Jakob Bernoullis Problem wurde von seinem jüngeren Bruder Johann, von Leibniz, Huygens und schließlich auch von Jakob Bernoulli selbst gelöst. 8 Dies ist hier eine Einengung des ursprünglichen Problems. Auch diese Annahme kann aber aus etwas allgemeineren Voraussetzungen abgeleitet werden. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 18 Die Kettenspannkraft wird vom Kettenstück, das zwischen p und B liegt, ausgeübt. Sie ist tangential zur Kette in p und nach rechts gerichtet. Eine elastische Feder, die zwischen dem Kettenglied bei p und dem rechts davon angrenzenden Kettenglied eingebaut wäre, würde die Kettenspannkraft sichtbar machen. Da die Kette als ruhend vorausgesetzt ist, addieren sich alle drei Kräfte zu 0. Es gilt somit 0 = |Fp | cos ϕ (xp ) − |F0 | cos ϕ (0) , ρgs (xp ) = |Fp | sin ϕ (xp ) − |F0 | sin ϕ (0) . Diese beiden Gleichungen sind äquivalent zu cos ϕ (0) , cos ϕ (xp ) ρgs (xp ) = |F0 | [cos ϕ (0) tan ϕ (xp ) − sin ϕ (0)] |Fp | = |F0 | Die zweite Gleichung ist äquivalent zu tan ϕ (xp ) − tan ϕ (0) = Es gilt also mit k = ρg |F0 | cos ϕ(0) ρg s (xp ) . |F0 | cos ϕ (0) > 0 für alle x ∈ I x α′ (x) = k 1 + (α′ )2 (ξ)dξ + tan ϕ (0) . (1.5) 0 Durch Ableiten von (1.5) nach x ergibt sich schließlich auf ganz I die Differentialgleichung α′′ (x) = k 1 + (α′ )2 (x). (1.6) Es liegt also die etwas ungewöhnliche Situation vor, dass die Differentialgleichung über den Parameter k von der Anfangsbedingung α′ (0) = tan ϕ (0) abhängt. Löse zunächst die Differentialgleichung erster Ordnung für die Funktion y = α′ y ′ (x) = k 1 + y 2 (x). Diese Differentialgleichung ist vom Typ der getrennten Variablen und kann mit dem (vergrößerten) Definitionsbereich (x, y) ∈ R2 versehen werden. Die Funktion h (y) = 1 + y 2 hat keine Nullstelle auf R. Eine Stammfunktion von 1/h ist Φ (y) = sinh−1 (y) . Daher existiert ein c ∈ R mit sinh−1 (y (x)) = kx − c für alle x ∈ R. Daraus folgt α′ (x) = sinh (kx − c) . Nochmalige Integration ergibt wegen α (0) = 0 für die Kettenlinie α α (x) = 1 (cosh (kx − c) − cosh (c)) . k KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 19 Die Funktion α hat auf R ein globales Minimum. Es hat den Wert (1 − cosh (c)) /k und wird nur im Punkt x = c/k angenommen. In diesem Punkt hat α die Krümmung α′′ kc = k. Der Schmiegekreis ans Minimum hat daher den Radius 1/k. Die Parameter k und c sind durch α (xB ) und die Länge L > x2B + α (xB )2 der Kette eindeutig festgelegt. Es gilt kα (xB ) = cosh (kxB − c) − cosh (c) und wegen Gleichung (1.6) xB kL = k xB 1 + α′ (x)2 dx = 0 α′′ (x) dx 0 = α′ (xB ) − α′ (0) = sinh (kxB − c) + sinh (c) . Für die symmetrische Randvorgabe α (xB ) = 0 etwa folgt, dass c = kxB /2 und = sinh x2B k . Das Minimum von α wird in xB /2 angenommen. Für c gilt also die Bestimmungsgleichung L c = sinh c. xB Als Lösung existiert wegen L > xB in R>0 genau ein c. Aus diesem Wert für c ergibt sich k mit k = 2c/xB . Bei symmetrischer Randvorgabe α (xB ) = 0 mit xB = 1 m und L = 10 m folgt aus 10c = sinh c, dass c ≈ 4, 5. Somit gilt k = 2c/xB ≈ 9, 0 m−1 . Der Betrag der Kraft, mit der die Kette im Punkt A befestigt ist, lässt sich nun auch berechnen. Es gilt mit M = ρL (Kettenmasse) L k 2 |F0 | = = ρg ρg = k cos ϕ (0) k ρg k = Mg 1 + tan2 ϕ (0) = 1 + sinh (c)2 = ρgL 1 kL 2 + 1 2 2 1 kL Mg = 2 ρg k 1 + α′ (ϕ (0))2 2 sinh (c) kL + 1+ 2 Lk 2 2 Mg ≈ 2 1+ 1 45 2 . Figur 1.15 vergleicht die (in symmetrische Lage gebrachte) Kettenlinie (rot) der Länge L ≈ 2, 4xB mit der Parabel gleicher Länge. Beide Kurven gehen durch die Punkte (±xB /2, 0) . Sie sind sichtbar voneinander verschieden. Welche Differentialgleichung gilt für den Anstiegswinkel der Kettenlinie? Für die Funktion ϕ mit α′ = tan ϕ folgt auf I eine Differentialgleichung erster Ordnung vom Typ der getrennten Variablen, denn einerseits gilt α′′ (x) = tan′ (ϕ (x)) ϕ′ (x) = und andererseits gilt wegen − π2 < ϕ (x) < k 1 + (α′ )2 (x) = k = cos2 π 2 1 + tan2 (ϕ (x)) = k k . cos (ϕ (x)) 1 ϕ′ (x) , ϕ (x) cos2 (ϕ (x)) + sin2 (ϕ (x)) cos2 (ϕ (x)) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN -1 -0.5 0 0.5 20 1 0 -0.5 -1 -1.5 -2 Abbildung 1.15: Kettenlinie (rot) mit Parabel gleicher Länge Somit ist die Gleichung (1.6) äquivalent zu ϕ′ (x) = k cos (ϕ (x)) . (1.7) Für die Funktion φ : [0, kxB ] → R mit φ (kx) = ϕ (x) gilt dann die schon behandelte parameterfreie Differentialgleichung φ′ = cos φ. Die Menge ihrer maximalen Lösungen mit Werten im Intervall − π2 , π2 ist die Menge φc : R → − π2 , π2 |c ∈ R mit φc (x) = arctan sinh (x − c) . Daraus folgt für die Kettenlinie, dass ein c ∈ R existiert, sodass α′ (x) = tan ϕ (x) = sinh (kx − c) für alle x ∈ [0, xB ] . Damit ist also ein zweiter Weg zur Bestimmung der Kettenlinie gefunden. 1.1.6 *Der freie Fall aus großer Höhe Ein apokalyptischer Engel stoppt die Erde auf ihrem Umlauf um die Sonne und läßt sie angesichts dessen, was er zu sehen bekommt, erschrocken wieder los. Wie lange dauert der Sturz der Erde in die Sonne? Für inertiale, kartesische Erdbahnkoordinaten xi , (i = 1, 2, 3) mit Nullpunkt im (beinahe ruhenden) Sonnenzentrum als Funktion einer inertialen Zeit t gilt mẍi (t) = −GmM xi (t) r3 (t) (1.8) (Newtons Bewegungsgleichungen). G ist Newtons Gravitationskonstante, M die Masse der Sonne und m die Masse der Erde. Die Funktion r := (x1 )2 + (x2 )2 + (x3 )2 gibt den momentanen Abstand zwischen Erde und Sonne an. Die Anfangsbedingung der Sturzbewegung ist o.E.d.A. x1 (0) = R, x2 (0) = x3 (0) = 0; ẋ1 (0) = ẋ2 (0) = ẋ3 (0) = 0 (1.9) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 21 mit R ≈ 1, 5 · 1011 m. Wegen x1 (0) = R > 0 gibt es ein ε > 0, sodass x1 (t) > 0 für alle t ∈ D := [0, ε) gilt. Eine R3 -wertige Funktion (x1 , x2 , x3 ) = (x, 0, 0), die auf dem Intervall D definiert ist, und für die x > 0 gilt, ist genau dann eine Lösung von (1.8) und (1.9), wenn die auf D definierte Funktion x eine Lösung des Anfangswertproblems ẍ(t) = − γ mit x(0) = R und ẋ(0) = 0 x(t)2 (1.10) mit γ := GM > 0 ist. Wegen (1.10) gilt ẍ(t) = dtd (ẋ(t)) < 0. Die Geschwindigkeit ẋ ist somit für Lösungen x > 0 streng monoton fallend. Daher folgt aus der gegebenen Anfangsbedingung ẋ(0) = 0 die Ungleichung ẋ(t) < 0 für alle 0 < t < ε. (Die Lösung x ist also auf D streng monoton fallend, d.h. die Erde bewegt sich, einmal ausgelassen, ausschließlich in Richtung Sonne). Zusammen mit der Nebenbedingung ẋ(t) < 0 (für alle 0 < t < ε) ist (1.10) äquivalent zu ẍ(t) · ẋ(t) = − γ ẋ(t). x(t)2 2 γ γ d Dies wiederum ist wegen ẍ(t) · ẋ(t) = dtd (ẋ(t)) und − x(t) 2 ẋ(t) = dt 2 x(t) zu d (ẋ(t))2 γ − = 0 mit ẋ(t) < 0 für alle 0 < t < ε. dt 2 x(t) äquivalent (1.11) Somit ist eine Funktion x : (0, ε) → R genau dann Einschränkung einer Lösung des Anfangswertproblems (1.10), wenn für alle t ∈ (0, ε) die Differentialgleichung γ γ (ẋ(t))2 − =− 2 x(t) R (1.12) zusammen mit ẋ(t) < 0 und der Anfangsbedingung limt↓0 x(t) = R gilt. Die Differentialgleichung (1.12) sagt, dass die Summe aus kinetischer und potentieller Energie für Lösungen von (1.10) konstant ist. Gleichung (1.12) ist eine implizite, gewöhnliche, nichtlineare Differentialgleichung erster Ordnung. Mit der Nebenbedingung ẋ(t) < 0 ist (1.12) äquivalent zu ẋ(t) = − 2γ/R (R/x(t)) − 1. (1.13) Beachte dabei, dass aus ẋ < 0 die Ungleichung x(t) < R für alle t ∈ (0, ε) folgt. Mit den dimensionslosen Koordinaten τ und ξ, definiert durch τ = t 2γ/R3 , ξ(τ ) = x(t)/R < 1, schließlich ist (1.13) äquivalent zu d ξ(τ ) = − ξ (τ )−1 − 1, dτ (1.14a) (1.14b) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 22 und die Anfangsbedingung ist für die Funktion ξ durch limτ ↓0 ξ(τ ) = 1 gegeben. dξ (τ ) . Beachte dabei ẋ(t) = 2γ/R dτ Das Problem der stürzenden Erde ist nun in die folgende „dimensionsbereinigte Form” gebracht. Sei f : R × (0, 1) → R, (x, y) → − y −1 − 1. Gesucht ist die maximale Lösung α : (0, xs ) → R von y ′ = f (x, y) mit der Anfangsbedingung lim α(x) = 1. x↓0 Aus der Obergrenze xs des Definitionsbereichs von α ergibt sich dann für die Fallzeit T T = xs R3 / (2γ). Die Differentialgleichung ist autonom und vom Typ der separierten Variablen. Die Funktion f ist lokal Lipschitzbeschränkt, sodass der Eindeutigkeitssatz anwendbar ist. Es gilt f (x, y) = g(y) mit der stetig differenzierbaren Funktion g : (0, 1) → R, y → − y −1 − 1 g ist negativ definit und streng monoton wachsend. Für y ↓ 0 wächst |g(y)| unbeschränkt und für y ↑ 1 strebt g(y) gegen 0. Die Funktion g hat keine Nullstelle. Den Graphen von g im Bereich 0.1 < y < 1 und ein Richtungsfeld von y ′ = f (x, y) zeigen die beiden folgenden Figuren. g(y) ist die Fallgeschwindigkeit der Erde in Einheiten von v := 2γ/R, die √ sie bei einer Annäherung an die Sonne bis zum Abstand yR erreicht. (Es gilt9 v ≈ 2(2πR)/1Jahr ≈ 3, 65 · 106 km/Tag ≈ 42, 3 · 103 m s−1 .) Beim Eintauchen der Erde in die Sonne, √ das ist bei ca. y = 1/150, hat die Erde also eine Geschwindigkeit mit dem Betrag v 150 − 1 ≈ 516 km s−1 . 0.2 0.4 0.6 0.8 1 0 -0.5 -1 -1.5 -2 -2.5 -3 Der Graph von g 9 Einsetzen der Modellparameter oder siehe die Schlußbemerkung. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN y 23 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 x Richtungsfeld zu f Achtung: Wird der Definitionsbereich von g um den Randpunkt 1 vergrößert, dann hat y ′ = f(x, y) = g(y) auch die konstante Lösung α(x) = 1. Die zugehörige Funktion x(t) = R erfüllt jedoch nicht die Newtonsche Bewegungsgleichung. Diese zusätzliche Lösung kommt durch das Multilplizieren der Newtonschen Gleichung mit ẋ zustande, das in die Umformung von (1.10) in (1.13) eingeht. Nun zur Bestimmung einer Stammfunktion Φ von 1/g. Es gilt für 0 < y < 1 1 1 y 1 − 2y y − y2 + 1 y − y2 y − y2 −1 = − 1 2 y = d dy Eine Stammfunktion von 1/ =− y − y2 2 − 1 y − y2 y − y 2 im Bereich (0, 1) ist die Funktion y → − arcsin (1 − 2y) . √ Dies folgt mit der Kettenregel aus arcsin′ (x) = 1/ 1 − x2 für −1 < x < 1. Die Funktion arcsin ist die inverse Funktion der Einschränkung der Funktion sin auf das Intervall − π2 , π2 . Beachte, dass die Funktion y → − arcsin (1 − 2y) das Intervall (0, 1) stetig und streng monoton steigend auf − π2 , π2 abbildet. Damit ist eine Stamfunktion Φ : (0, 1) → R von 1/g die Funktion Φ(y) = y − y2 + 1 arcsin (1 − 2y) . 2 1 Φ ist wegen Φ′ (y) = g(y) < 0 streng monoton fallend. Die gesuchte Lösung α von ′ y = f(x, y) erfüllt somit x + C = Φ (α(x)) für ein festes reelles C. Die Integrationskonstante C ist durch die Randbedingung limx↓0 α(x) = 1 zu 1 π C = lim Φ(y) = arcsin (−1) = − y↑1 2 4 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 24 bestimmt. Der maximale Definitionsbereich (0, xs ) von α ergibt sich aus der unteren Grenze des Definitionsbereichs (0, 1) von Φ. Es gilt xs = lim Φ(y) − C = y↓0 1 π π arcsin (1) + = . 2 4 2 Für den Graphen Γ von α gilt Γ= (x, y) ∈ R × (0, 1) | x = y − y2 + π 1 arcsin (1 − 2y) + 2 4 . Das folgende Bild zeigt Γ (mit horizontaler y-Achse). x 1.5 1.25 1 0.75 0.5 0.25 0 0 0.25 0.5 0.75 1 Der Graph von α Die Fallzeit der Erde in die Sonne ist somit π T = xs R3 / (2γ) = 2 R3 / (2γ). Einsetzen der Zahlenwerte der Modellkonstanten ergibt dann den gesuchten Zahlenwert für die Fallzeit zu T ≈ 65Tage. Schlußbemerkung: Hat man keine Tabellen zur Hand, dann geht es auch so. Die Zahl Rγ2 = GM ist aufgrund von Newtons Bewegungsgleichung der radialen R2 Beschleunigung der annähernd gleichförmigen Kreisbewegung der Erde im Abstand R um die Sonne gleich. Diese Beschleunigung ist durch Rω 2 gegeben, wobei ω die Winkelgeschwindigkeit, also 2π/Umlaufzeit der Kreisbewegung ist. Damit gilt T = π 2 √ R/ (2Rω 2 ) = π/ 2 2ω . Für die Erde gilt ω = 2π/1 y. Daraus folgt 1y 365Tage T ≈ √ ≈ √ ≈ 65Tage. 4 2 32 Diese Fallzeit lässt sich auch über Keplers drittes Gesetz berechnen, das besagt, dass die Umlaufzeiten T1 , T2 zweier Planetenbahnen um die Sonne mit ihren großen Halbachsen a1 , a2 durch (T1 /T2 )2 = (a1 /a2 )3 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 25 verknüpft sind. Wir vergleichen die annähernd kreisförmige Erdbahn, für die T1 = 1 y und a1 = R gilt, mit dem Grenzfall einer zu einer Geraden verkümmerten Ellipse. Für die Fallzeit der Erde in die Sonne gilt dann T = T2 /2, da im Fall ja nur die halbe Ellipse durchlaufen wird, und a2 = R/2, da im Grenzfall die Sonne mit dem Perihel der extrem exzentrischen Ellipse zur Deckung kommt. Somit gilt 2T 1y 2 3 1 23 √ und daher das oben erhaltene Ergebnis T = 1 y/ 4 2 . Schließlich wird noch der Graph der Funktion y → R3 / (2γ)α−1 (1 − y) angeführt, die dem zurückgelegten Weg y (in Einheiten von R) für 0 < y < 1 die = R/2 R = 3 benötigte Fallzeit in Tagen zuordnet. Mit R2γ ≈ π2 65Tage ≈ 41.38Tage ergibt sich das folgende Bild. Es zeigt, dass die erste Hälfte des finalen Weges in etwa 55 Tagen und die zweite, wärmere Hälfte in nur mehr 10 Tagen zurückgelegt wird. t 62.5 50 37.5 25 12.5 0 0 0.25 0.5 0.75 1 y Reisezeit t in Tagen als Funktion der zurückgelegten Strecke y 1.1.7 Lineare Differentialgleichungen Bei einer linearen Differentialgleichung ist die Funktion f nach einem Muster gebildet, das die Menge aller maximalen Lösungen besonders überschaubar macht. Definition 8 Sei D ein allgemeines Intervall und a : D → R und b : D → R stetig. Sei f : D × R → R mit f (x, y) = a(x)y + b(x). Die Differentialgleichung y ′ = f(x, y) heißt inhomogen linear, falls b = 0. Die Funktion b heißt Inhomogenität. Die Gleichung und y ′ = a(x)y heißt homogen linear. Beide Fälle werden als linear bezeichnet. Vorbemerkung über die Lösungsmenge im homogen linearen Fall y ′ = a (x) y : Sind α1 , α2 : D ⊃ I → R Lösungen auf einem Intervall I, dann ist für λ ∈ R auch λα1 + α2 eine Lösung mit dem Definitionsbereich I. Die Menge aller Lösungen desselben Definitionsintervalls I ist also ein (reeller) Vektorraum. Welche Dimension KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 26 hat er? Hängt seine Dimension von I ab? Der folgende Satz beantwortet derlei Fragen und führt die Bestimmung der Menge L0 aller maximalen Lösungen auf die Bestimmung einer Stammfunktion A zurück. Satz 9 Sei a : D → R stetig und A : D → R eine Stammfunktion von a, dh es gilt A′ = a. Die Menge aller maximalen Lösungen von y ′ = a (x) · y ist der eindimensionale Vektorraum L0 mit L0 = R · eA := αC : D → R mit αC (x) = C · eA(x) |C ∈ R . Die Menge aller Lösungen mit Definitionsbereich I ⊂ D ist der (ebenfalls eindimensionale) Vektorraum R · eAI , wobei AI die Einschränkung von A auf das Teilintervall I ⊂ D ist. Beweis. Eine homogen lineare Differentialgleichung ist vom Typ der getrennten Variablen. Wegen f (x, y) = a (x)·y ist der Eindeutigkeitssatz anwendbar. Daher hat der Graph einer von der 0-Lösung verschiedenen Lösung α keinen Schnittpunkt mit dem Graphen der 0-Lösung und α hat keine Nullstelle. Eine solche (’nichttriviale’) Lösung mit dem Definitionsbereich I erfüllt somit ln |α (x)| = A (x) + C für alle x ∈ I. Daraus folgt α (x) = α (x0 ) eA(x)−A(x0 ) für alle x ∈ I und für ein x0 ∈ I. Dabei ist A : D → R eine Stammfunktion von a. (Die gibt es, da a stetig ist.) Eine maximale Lösung hat offenbar den Definitionsbereich I = D. Somit gilt für die Menge L0 aller maximalen Lösungen der homogenen Gleichung y ′ = a(x)y : Sie ist die Menge aller reellen Vielfachen von eA , also der Vektorraum L0 = R· exp A. Die eindeutige maximale Lösung von y ′ = a (x) · y zum Anfangswert (x0 , y0 ) ∈ D × R ist somit die Funktion x αC : D → R mit αC (x) = C · exp a (ξ) dξ und C = y0 . x0 Nun zu den inhomogen linearen Gleichungen. Sei I ⊂ D ein Intervall. Sind α1 : I → R und α2 : I → R zwei Lösungen derselben inhomogenen Gleichung y ′ = a(x)y + b(x), dann ist α1 − α2 eine Lösung der homogenen Gleichung y ′ = a(x)y. (Nachrechnen!) Ist umgekehrt α : I → R eine Lösung der homogenen und β : I → R eine Lösung der inhomogenen, dann ist auch α + β eine Lösung der inhomogenen Gleichung. Existiert eine Lösung α der inhomogenen Gleichung mit dem Definitionsbereich D der Funktionen a, b? Ja, denn es gilt für die Menge Lb aller maximalen Lösungen der inhomogenen Gleichung der Satz von der Variation der Konstanten Formel. Satz 10 Sei D ⊂ R ein Intervall, seien a, b : D → R stetig und sei A : D → R eine Stammfunktion von a. Sei αc : D → R mit x αc (x) = eA(x) c + e−A(ξ) b(ξ)dξ (1.15) s für ein fest gewähltes s ∈ D. Dann gilt Lb = {αc | c ∈ R} . Die Lösung zum Anfangswert (x0 , y0 ) ∈ D × R ist die Funktion αc mit der Integrationskonstanten c = y0 e−A(x0 ) − x0 s e−A(ξ) b(ξ)dξ. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 27 Beweis. Versuchsweiser Ansatz: α (x) = C (x) eA(x) für alle x aus einem noch zu bestimmenden Teilintervall I ⊂ D. Die Funktion α ist genau dann eine Lösung der inhomogenen Gleichung, wenn für alle x ∈ I C ′ (x) eA(x) + C (x) a (x) eA(x) = a (x) C (x) eA(x) + b (x) . Dies ist äquivalent zu C ′ (x) = e−A(x) b (x) . Diese Differentialgleichung für C hat die maximale Lösung x C : D → R mit C (x) = e−A(ξ) b (ξ) dξ, s für alle x ∈ D. Es gilt C (s) = 0. Jede weitere maximale Lösung der inhomogenen Gleichung y ′ = a (x) y + b (x) ist aus der Lösung C durch Addition einer Funktion aus L0 zu erhalten. Die Variation der Konstantenformel (1.15) zeigt, dass Lb = L0 +αp , wobei αp ein beliebiges fest gewähltes Element von Lb ist. Die Menge der maximalen Lösungen einer inhomogen linearen Differentialgleichung ist somit ein eindimensionaler affiner Unterraum von Abb (D : R) . Die partikuläre Lösung α0 zu c = 0 hängt linear von b ab. Sei für x ∈ D x eA(x)−A(ξ) b(ξ)dξ. yb (x) = x0 Dann gilt yλb1 +b2 (x) = λyb1 (x) + yb2 (x) für λ ∈ R und für b1 , b2 ∈ C (D : R) . Benutzung dieses Sachverhalts erspart manche Rechnung. Das Nahewirkungsprinzip des Eindeutigkeitssatzes wird von der Variation der Konstantenformel deutlich sichtbar gemacht: Wählt man die Stammfunktion A(x) = x a(ξ)dξ, dann ist die maximale Lösung der Gleichung y ′ = a(x)y + b(x) zum Anx0 fangswert (x0 , y0 ) die Funktion αy0 . Sei nun I ⊂ D ein Intervall mit x0 ∈ I. Die Variation der Konstantenformel zeigt dann, dass die Einschränkung von αy0 auf I bei Änderungen von a oder b außerhalb von I unverändert bleibt. In manchen physikalischen Anwendungen bewirkt dieser Sachverhalt, dass künftige, oft unbekannte Umstände keine Auswirkung auf das Gegenwärtige haben. 1.1.8 Atmosphärische 14 C-Konzentration Ein Teilchen des Sonnenwindes setzt in der oberen Atmosphäre Neutronen frei, wenn es einen der Kerne eines Luftmoleküls trifft und zertrümmert. Aus einem solchen ’Spallationsneutron’ und einem intakten 14 N Kern (eines Luftmoleküls) kann an1 14 1 schließend in der Ladungstauschreaktion 14 7 N +0 n →6 C +1 p ein Kern des instabilen Kohlenstoffisotops 14 C entstehen. Andererseits zerfällt 14 C mit einer Halbwertszeit 14 − von 5730 Jahren durch den Betazerfall 14 6 C →7 N + e + ν e . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 28 Auf diese Weise erbrütet die Sonne in der hohen Atmosphäre laufend neues 14 C, das natürlich auch in den Kreislauf organischen Materials Eingang findet und langsam wieder zerfällt. Nach Beendigung der Stoffaufnahme eines Lebewesens10 sinkt das Konzentrationverhältnis von 14 C zu 12 C in dessen Überresten und ermöglicht einen Rückschluss auf den Todeszeitpunkt, wenn das Konzentrationsverhälnis von 14 C zu 12 C zur Zeit des Einbaus bekannt ist. Die Intensität des Sonnenwindes ist nun aber, auch wenn sie über mehrere Wochen und über die ganze Erdkugel gemittelt wird, zeitlich nicht konstant, sodass auch das atmosphärische Konzentrationverhältnis von 14 C zu 12 C im Lauf der Erdgeschichte veränderlich ist. Schwankt beispielsweise die mittlere Intensität des Sonnenwindes harmonisch um einen Mittelwert, dann gilt für die (entsprechend gemittelte) Konzentration N (t) von 14 C in der Erdatmosphäre zur Zeit t Ṅ (t) = −γN (t) + c + d · cos (ωt − δ) . (1.16) Dabei ist γ > 0 die Zerfallskonstante von 14 C, die Zahl c > 0 ein Langzeitmittel der Produktions- oder Brutrate und d > 0 die Amplitude der harmonischen Oszillationen des Kurzzeitmittels der Brutrate. Die Frequenz ω dieser Oszillationen kann positiv angenommen werden. Da die Brutrate von 14 C nicht negativ sein kann, gilt 0 ≤ d ≤ c. Die Phase δ ∈ [0, 2π) legt die Lage der Oszillationsfunktion auf der Zeitskala fest. Duch Wahl eines Nullpunkts in der Zeit kann δ = 0 erreicht werden. Welche Schlüsse können aus der Differentialgleichung (1.16) auf die zeitliche Entwicklung von N, also auf die Funktion t → N (t) , gezogen werden? Die Funktion α : R → R mit α (γt) = N (t)− γc erfüllt an der Stelle x = γt die parameterreduzierte Differentialgleichung d Ṅ (t) c d N (x/γ)) = = −N (t) + + · cos (ωt) dx γ γ γ c d d ω = − N (t) − + · cos (ωt) = −α (x) + · cos x . γ γ γ γ α′ (x) = α ist also Lösung von y ′ = f (x, y) mit f : R2 → R und f (x, y) = −y + λ cos (kx) . Dabei gilt k = ω/γ > 0 und λ = d/γ ≥ 0. Wir untersuchen nun diese vereinfachte Differentialgleichung für λ ∈ R. Die Funktionen a, b : R → R mit f (x, y) = a (x) · y + b (x) erfüllen also a (x) = −1 und b (x) = λ cos kx. Im Fall dieser Gleichung lässt sich eine maximale Lösung der inhomogenen Gleichung leicht über den Ansatz αp (x) = α cos kx+β sin kx für x ∈ R finden. Die Funktion αp löst y ′ = −y + λ cos kx genau dann, wenn für alle x ∈ R k (−α sin kx + β cos kx) = −α cos kx − β sin kx + λ cos kx. Koeffizientenvergleich der Faktoren vor den linear unabhängigen Funktionen cos und sin ergibt das inhomogen lineare Gleichungssystem für α, β ∈ R 10 βk = −α + λ und αk = β. Wie etwa jenes Mannes, der vor ca 5250(±125) Jahren am Hauslabjoch, einem Übergang zwischen Schnals- und Ötztal, sein Leben verlor und dessen mumifizierte Überreste am Tag des ’magischen Datums’ 19.9.1991 von Bergwanderern entdeckt wurden. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 29 Dieses gilt genau dann, wenn α = λ/ (1 + k 2 ) , β = kλ/ (1 + k 2 ) . Zu jeder maximalen Lösung α von y ′ = −y + λ cos kx existiert somit eine Zahl C ∈ R, sodass α = αC . Dabei erfüllt die Funktion αC : R → R für alle x ∈ R αC (x) = λ (cos kx + k sin kx) + C · e−x . 1 + k2 Die Menge L aller maximalen Lösungen von y ′ = −y + λ cos kx ist somit durch L = {αC |C ∈ R} gegeben. Überprüfen wir dieses Ergebnis mit der Variation der Konstantenformel. Die Funktion A : R → R mit A(x) = −x ist eine Stammfunktion von a. Daher folgt für die maximale Lösung α des Anfangswertproblems zu x0 = 0 und y0 = 0 an der Stelle x ∈ R, dass x α(x) = e−x x λ cos (kξ) eξ dξ = λℜe−x 0 e(1+ik)ξ dξ 0 eikx − e−x λ = λℜ = ℜ (1 − ik) eikx − e−x 1 + ik 1 + k2 λ = [cos (kx) − exp (−x) + k sin (kx)] . 1 + k2 folgt α = α0 + αp , wobei αp die schon durch Für α0 ∈ L0 mit α0 (x) = − λ exp(−x) 1+k2 Ansatz erhaltene Lösung der inhomogenen Gleichung ist. Für sie gilt übrigens λ λ cos (kx) k sin (kx) √ [cos (kx) + k sin (kx)] = √ + √ 2 1+k 1 + k2 1 + k2 1 + k2 λ λ = √ [cos (δ) cos (kx) + sin (δ) sin (kx)] = √ cos (kx − δ) 1 + k2 1 + k2 αp (x) = mit δ = arctan (k) ∈ 0, π2 . Die Lösung αp ist also eine harmonische Schwingung derselben Periode wie die Inhomogenität der Gleichung. Sie ist jedoch um δ > 0 gegen die Inhomogenität (nach rechts) verschoben. Ihre Amplitude ist fallend in k. Für jede weitere maximale Lösung α der Differentialgleichung y ′ = −y +λ cos ωx existiert ein C ∈ R, sodass α (x) = αp (x) + Ce−x für alle x ∈ R. Es gilt folglich limx→∞ (α − αp ) (x) = 0, d.h. der Einfluss der Anfangsbedingung auf die Lösung α geht mit wachsendem x gegen 0 ohne dass die Lösung selbst gegen 0 konvergiert. Die Lösung αp nähert also das Langzeitverhalten jeder anderen Lösung. Die zur Lösung αp gehörige 14 C-Konzentration Np erfüllt zur Zeit t Np (t) = 1.2 1.2.1 d γ2 + ω2 cos (ωt − δ) + c ω mit δ = arctan γ γ ∈ 0, π . 2 Systeme erster Ordnung Definition und motivierende Beispiele Ein Fluss strömt ruhig durch die Lande. An manchen Orten schneller, woanders langsamer. An einem Ort p der Wasseroberfläche U ⊂ R2 und zu einer Zeit t ∈ D KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 30 habe das Wasser eine Strömungsgeschwindigkeit V (p, t) . Kurz gesagt, die Oberflächenströmung gibt eine Funktion V : D × U → R2 , (t, p) → V (t, p) vor. Ein welkes Blatt löst sich von einem Baum und segelt schwankend auf unseren Fluss herab. Die Strömung trägt das Blatt ungerührt davon. Zur Zeit t befindet sich das Blatt am Ort γ (t) ∈ U. Längs seiner Bahn macht das Blatt die Strömung und ihr Geschwindigkeitsfeld V sichtbar, denn es nimmt zu jeder Zeit t die Geschwindigkeit V (t, γ(t)) an, die das Wasser gerade am Ort γ(t) ∈ U des Blattes hat. V wirkt als ein Führungsfeld. Die ganze schöne Wasserreise des Blattes ist somit zu einer Kurve γ : I → U mit I ⊂ D verdichtet und eine Filmaufnahme würde zeigen, dass für alle t ∈ I die Differentialgleichung γ̇(t) = V (t, γ(t)) gilt. Etwas ausführlicher notiert besteht die Kurve γ aus zwei Funktionen γ 1 , γ 2 : I → R. Auch die Funktion V ist aus zwei reellwertigen Funktionen V 1 , V 2 : D × U → R aufgebaut. Die Differentialgleichung wird mit dieser Notation zum folgenden System von Gleichungen für γ 1 , γ 2 . t 1 1 2 dγ 1 V (t), γ (t)) t, (γ (t) dt = dγ 2 t 2 1 2 (t) t, (γ (t), γ (t)) V dt In diesem Abschnitt werden wir aus V Schlüsse über γ ziehen. Lässt sich die Reise unseres Blattes gar berechnen? Radioaktive Zerfallskette Eine radioaktive Substanz A zerfalle in eine Substanz B, die wiederum weiter zerfällt. Für die Stoffmenge NA (t) von A zur Zeit t und NB (t) von B gilt mit λA , λB ∈ R>0 NA′ (t) = −λA NA (t) und NB′ (t) = −λB NB (t) + λA NA (t). (Beim Zerfall von n mol Stoff A werden n mol Stoff B gebildet.) Es gilt somit d dt NA (t) NB (t) = 0 −λA λA −λB · NA (t) NB (t) . Es liegen zwei gekoppelte Differentialgleichungen (erster Ordnung) für zwei Funktionen vor. Allerdings ist die Kopplung so einfach, dass sich die beiden Gleichungen nacheinander lösen lassen. Die Menge aller maximalen Lösungen der ersten Gleichungszeile ist {NA : R → R, t → NA (0) exp (−λA t) | NA (0) ∈ R} . Setzt man das Element NA (0) exp (−λA t) dieser Menge in die zweite Gleichung ein, wird diese zu einer inhomogen linearen Differentialgleichung erster Ordnung, nämlich NB′ (t) + λB NB (t) = λA NA (0) exp (−λA t) . Ihre maximale Lösung zum Anfangswert NB (0) kann mit der Variation der Konstanten Formel erhalten werden. Für diese gilt mit NA (0), NB (0) ∈ R NB (t) = NB (0) exp (−λB t) + λA NA (0) · exp(−λA t)−exp(−λB t) λB −λA t exp (−λB t) falls λA = λB . falls λA = λB KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 31 y 1 0.75 0.5 0.25 0 0 1.25 2.5 3.75 5 x Abbildung 1.16: Stoffmengen von A und B in Einheiten von NA (0). Als Stoffmengen interpretierbar sind natürlich nur Konstante NA (0), NB (0) ∈ R≥0 . In diesem Fall folgt NA (t), NB (t) ∈ R≥0 für alle t > 0. Abbildung (1.16) zeigt für λA = 1 und NB (0) = 0 den Graphen von NA (t)/NA (0) in schwarz. Für λB = 2 zeigt sie NB (t)/NA (0) in rot und NB (t)/NA (0) für λB = 1/2 in braun. Die grüne B NB (t) Kurve zeigt die (relative) Aktivität λA NAλ(t)+λ für λA = 1 und λB = 2. Sie steigt A NA (0) 11 bei 0 kurzzeitig an. Dass jede Lösung des Systems, die den Quadranten (R≥0 )2 erreicht, also etwa (NA (0), NB (0)) ∈ (R≥0 )2 erfüllt, diesen Quadranten später nicht mehr verlässt, folgt aus der Gestalt des Vektorfeldes. Es ist am Rand des Quadranten nirgends aus diesem herausgerichtet. Abbildung 1.17 zeigt das Vektorfeld für λA = 1 und λB = 2. Abbildung 1.17: Das Vektorfeld der Zerfallskette für λA = 1 und λB = 2 11 Beim Zerfall 226 Ra →222 Rn + α etwa entweicht das Radon („Radiumemanation“) der Probe und kann gesammelt werden. Die HWZ von 226 Ra ist 1602 Jahre und 222 Rn zerfällt mit einer HWZ von 3, 8 Tagen. Die gesamte Aktivität einer umschlossenen Radium Probe ist λA NA + λB NB . Die einer belüfteten ist λA NA . Dies hat die Enträtselung der Vorgänge nicht gerade erleichtert. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 32 Lineare Schwingungen: Integration im komplexen Phasenraum Die Bewegungsgleichung eines harmonischen Oszillators mit der Kreisfrequenz ω > 0 ist eine gewöhnliche Differentialgleichung zweiter Ordnung: d2 x (t) = −ω 2 x(t). dt2 (1.17) Für die beiden Funktionen x1 := x und x2 := ω1 dx folgt x′1 = ωx2 und x′2 = dt −ωx1 . Fasst man die beiden reellwertigen Funktionen zur R2×1 -wertigen Funktion (x1 , x2 )T zusammen, dann ist Gleichung (1.17) äquivalent zum folgenden System erster Ordnung d dt x1 x2 =ω 0 1 −1 0 · x1 x2 x2 −x1 =ω am reell 2-dimensionalen Phasenraum R2×1 äquivalent. Das hier auftretende (lineare) Geschwindigkeitsvektorfeld A : R2×1 → R2×1 mit x1 x2 → 0 1 −1 0 · x1 x2 = x2 −x1 ordnet einem Punkt seinen um 90◦ im ’Uhrzeigersinn’ gedrehten ’Ortsvektor’ zu. Es ist tangential an Kreise um 0. Ein Kurve γ : I → R2×1 mit γ̇ = ωAγ sollte daher den Punkt 0 mit konstanter Winkelgeschwindigkeit ω umkreisen (Fig 1.18). Abbildung 1.18: Drehvektorfeld ωA Ein erster besonders einfacher Weg, dies rechnerisch zu beweisen, nutzt die komplexe Multiplikation in der Ebene R2×1 ≃ C aus. Für die C-wertige Funktion z := x1 + ix2 folgt nämlich ż (t) = −iωz(t). Maximale Lösungen sind nun leicht zu erraten12 : zc : R → C, t → exp (−iωt) · c mit c ∈ C. 12 Wie im Fall y ′ = y zeigt man, dass weitere maximale Lösungen nicht existieren. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 33 Daraus ergibt sich mit c = a + ib für den Realteil der Lösung zc xa,b (t) := ℜ (zc (t)) = a cos (ωt) + b sin (ωt) . Zur Veranschaulichung der Lösung xa,b dient die folgende Überlegung. Sei (0, 0) = (a, b) ∈ R2 . Dann existiert bekanntlich genau eine Zahl δ ∈ [0, 2π) mit √ (a, b) = a2 + b2 (cos δ, sin δ) . Damit folgt √ xa,b (t) = ℜ (a − ib) · eiωt = ℜ a2 + b2 (cos δ − i sin δ) · eiωt √ √ = a2 + b2 ℜ e−iδ · eiωt = a2 + b2 cos (ωt − δ) . √ Die Lösung xa,b geht also aus einer Cosinusschwingung der Amplitude a2 + b2 und der Frequenz ω, durch Verschiebung des Zeitarguments t um δ/ω hervor. Zwei reelle „Integrationskonstanten” a und b stehen zur Anpassung der „allgemeinen Lösung” xa,b an eine Anfangsbedingung zur Verfügung. Es folgt etwa, dass die Funktion xa,b eine maximale Lösung von (1.17) zur Anfangsbedingung x(0) = a und ẋ(0) = ωb ist. Dass xa,b durch diese Anfangsbedingung eindeutig festgelegt ist, werden wir etwas später einem Eindeutigkeitssatz für Systeme erster Ordnung entnehmen. Dazu brauchen wir zuvor eine präzise etwas allgemeinere Definition eines Systems von Differentialgleichungen erster Ordnung. Definition 11 (Anfangswertproblem) Sei V ein endlichdimensionaler Vektorraum über R. Sei U ⊂ V offen und X : U → V. Sei D ⊂ R ein allgemeines Intervall. Eine Abbildung γ : D → V heißt eine Lösung des autonomen Differentialgleichungssystems erster Ordnung γ̇ = X (γ) , falls γ (D) ⊂ U und falls γ̇(t) = X (γ(t)) für alle t ∈ D. Falls γ(t0 ) = v0 ∈ U, sagt man γ sei Lösung zum Anfangswert (t0 , v0 ) ∈ R × U. Falls keine Lösung β : D′ → V existiert, für die D ⊂ D′ (echt enthalten) und γ(t) = β(t) für alle t ∈ D, dann heißt die Lösung γ maximal.13 Sei γ : D → V eine Lösung des Systems γ̇ = X (γ) und sei e = (e1 , ...en ) eine Basis von V . Seien γ i : D → R und X i : U ′ ⊂ R1×n → R so, dass für alle t ∈ D und für alle v = nj=1 vj ej ∈ U n n i γ (t)ei und X( γ(t) = i=1 n j X i (v 1 , ..., v n )ei . v ej ) = j=1 i=1 Die reellwertigen Funktionen γ i und X i heißen die Komponentenfunktionen von γ und X zur Basis e. Für sie folgt durch Koeffizientenvergleich γ̇ 1 (t) = X 1 γ 1 (t), ..., γ n (t) , .. . n γ̇ (t) = X n γ 1 (t), ..., γ n (t) . 13 In der Quantentheorie ist die Zeitentwicklung eines Zustands ein (lineares) System erster Ordnung auf einem komplexen Vektorraum. Dieser Fall kann auf den reellen zurückgeführt werden. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 34 Diese Formulierung der Gleichung γ̇ = X ◦ γ rechtfertigt den Namen „System erster Ordnung“. Eine Abbildung γ : D → V heißt eine Kurve in V . Ihr Bild γ (D) ⊂ V heißt die Bahn der Kurve. Die Feldlinie eines elektrischen oder magnetischen Feldes X durch v ist also einfach die Bahn der maximalen Lösung von γ̇ = X (γ) mit γ(0) = v. Der Vektor γ̇(t) heißt Tangentenvektor von γ in t. Der Tangentenvektor γ̇(t) ist tangential an das Bild γ(D) im Punkt γ(t). Eine Kurve γ : D → V ist somit Lösung von γ̇ = X ◦ γ, falls für alle t ∈ D die Tangente von γ in t mit dem Vektor X (γ(t)) übereinstimmt. Ist der Punkt γ(t) gegeben, dann legt X die Tangente von γ in t fest. Eine Lösung γ schmiegt sich an das gegebene Vektorfeld. 1.2.2 Feldlinien einer Punktladung Sei |·| die euklidische Norm auf R3 und Q = q/4πε0 ∈ R>0 . Das elektrische Feld einer positiven Punktladung ist X : R3 0 → R3 , v → Qv/ |v|3 . Ansatz: Eine Lösung γ von γ̇ = X (γ) mit γ(0) = p wird von der Form γ(t) = α(t)p mit α(0) = 1 sein. Da eine Lösungskurve den Nullpunkt, der außerhalb des Definitionsbereiches von X liegt, nicht erreichen kann, muss α > 0 gelten. Daraus folgt α̇(t) = Q |p|−3 · α(t)−2 . Diese Gleichung ist vom Typ der separierten Variablen y ′ = g(x)h(y) mit konstanter Funktion g(x) = Q′ := Q/ |p|3 für x ∈ R und h : R>0 → R mit h(y) = 1/y 2 . Die Funktion h hat keine Nullstelle. Eine Stammfunktion von 1/h ist die Funktion Φ(y) = y 3 /3. Somit folgt für eine Lösung α, dass α > 0 und α(x)3 /3 = Q′ · (x + c/3) für ein reelles c. Der maximale Definitionsbereich von α ist − 3c , ∞ . Die Anfangsbedingung α(0) = 1 verlangt c = 1/Q′ . Eine maximale Lösung des Systems γ̇ = X (γ) mit γ(0) = p ist somit die Kurve γ : − (3Q′ ) −1 , ∞ → R3 , 1/3 t → ((3Q′ t + 1)) p. Die Bahn von γ ist γ(t) | t > − (3Q′ )−1 = R>0 · p, ein Halbstrahl in R3 . Das ist also die Feldlinie durch p. Sie „beginnt” in der Singularität des elektrischen Feldes und „endet” im Unendlichen. Ihre Eindeutigkeit folgt aus einem Satz des nächsten Abschnitts. 1.2.3 AWP: Existenz- und Eindeutigkeit der Lösung Es soll zunächst der Begriff eines Systems erster Ornung so verallgemeinert werden, dass auch zeitabhängige Vektorfelder erfasst werden. Definition 12 Sei U ⊂ R × V offen und sei X : U → V. Eine Kurve γ : I → V deren Graph {(t, γ(t)) | t ∈ I} in U enthalten ist, heißt eine Lösung des Systems erster Ordnung γ̇ = X (t, γ) , falls γ̇(t) = X (t, γ (t)) für alle t ∈ I.Falls für eine Lösung γ(t0 ) = v gilt, heißt γ Lösung zum Anfangswert (t0 , v) ∈ U. Falls γ nicht die Einschränkung einer weiteren Lösung des Systems ist, heißt γ maximal. Die Dimension von V wird auch als die Dimension des Systems erster Ordnung bezeichnet. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 35 Durch Übergang von der Abbildung X : U → V zum Vektorfeld X auf U mit X : U → R × V, (t, v) → (1, X(t, v)) kann das nichtautonome System in ein autonomes verwandelt werden. Daher genügt es, Existenz und Eindeutigkeitssätze für autonome Systeme zu finden. Beim konkreten Aufsuchen von Lösungen hilft die Einbettung jedoch im allgemeinen nicht. Im folgenden werden zwei Existenz- und Eindeutigkeitssätze für die Lösung von Anfangswertproblemen, einer für nichtautonome und einer für autonome Systeme wiedergegeben. [18] Satz 13 Sei U ⊂ R × V offen und die stetige Abbildung X : U → V sei lokal Lipschitzbeschränkt im folgenden Sinn. Für jedes p = (t, v) ∈ U existiert eine offene Umgebung Rp := {(t′ , v ′ ) ∈ R × V : |t − t′ | < ε, |v − v ′ | < δ} von p und eine Konstante Lp , sodass |X (t′ , v ′ ) − X (t′ , v)| ≤ Lp |v ′ − v| für alle (t′ , v′ ) ∈ Rp ∩ U. Dann besitzt das System γ̇(t) = X(t, γ(t)) zu einem Anfangswert (t0 , v0 ) ∈ U genau eine maximale Lösung. Etwas ungenauer Nachsatz: Der Graph dieser Lösung „reicht“ bis zum Rand von U . Für autonome Systeme vereinfacht sich die lokale Lipschitzbeschränkung und es vereinfachen sich einige weitergehenden Aussagen über die stetige Abhängigkeit der Lösung von den Anfangsbedingungen. Definition 14 Sei U ⊂ V offen, dann heißt ein Vektorfeld X : U → V lokal Lipschitzbeschränkt, falls zu jedem v ∈ U Konstanten εv > 0 und Lv > 0 existieren, sodass |X (v ′ ) − X (v)| ≤ Lv |v − v ′ | für alle v ′ ∈ V mit |v − v ′ | < εv . Beachte, dass ein lokal Lipschitzbeschränktes Vektorfeld automatisch stetig ist. Satz 15 (Picard - Lindelöf) Sei U ⊂ V offen und das Vektorfeld X : U → V sei lokal Lipschitzbeschränkt. Dann existiert zu jedem v ∈ U genau eine maximale Lösung des Systems γ̇ = X (γ) mit γ(0) = v. Diese Lösung wird mit γ v bezeichnet und ihr Definitionsintervall mit Iv . Die Menge D mit D = v∈U (Iv × {v}) ist offen in R × U und die lokale Flussabbbildung Φ : D → V, (t, v) → γ v (t) ist stetig. Ist X vom C k -Typ, dann ist auch Φ vom C k -Typ. Die Bestimmung aller maximalen Lösungen eines autonomen Systems erster Ordnung zum Vektorfeld X wird als ’Integration’ des Vektorfeldes X bezeichnet. Die maximalen Lösungen des Systems werden auch Integralkurven genannt. 1.3 Lineare Systeme erster Ordnung Im Fall der (inhomogen) linearen Systeme ist eine gemeinsame Behandlung des komlexen und reellen Falles leicht möglich. Im Hinblich auf die Quantendynamik wird der komplexe Fall gleich mitbehandelt. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 36 Definition 16 Sei V ein endlichdimensionaler Vektorraum über K = R oder K = C und I ⊂ R sei ein allgemeines Intervall. Die beiden Abbildungen A : I → L (V, V ) und b : I → V seien stetig. L (V, V ) ist der K-Vektrorraum der linearen Abbildungen von V nach V und das Bild von v ∈ V unter einer linearen Abbildung A(t) ∈ L (V, V ) wird mit A(t)v bezeichnet.14 Das System γ̇(t) = A(t)γ(t) + b(t) heißt inhomogen linear falls b = 0 und homogen linear falls b = 0. Beide Fälle werden als linear bezeichnet. Ein lineares System erfüllt die lokale Lipschitzbedingung. Daher existiert durch jeden Anfangswert (t0 , v) ∈ I × V genau eine maximale Lösung. Über ihren Definitionsbereich gibt der folgende Satz Auskunft. Er ist in Kap. III, §14.VI von [18] zu finden. Satz 17 Jede maximale Lösung eines linearen Systems über einem reellen Intervall I ist auf ganz I definiert. Eine Illustration für die Behauptung des Satzes gibt der folgende Abschnitt. 1.3.1 2d Drehungen Wir beginnen mit einem Beispiel, das uns noch wiederholt beschäftigen wird. Es ist die Bewegungsgleichung eines harmonischen Oszillators y ′′ + ω 2 y = 0. Sie wurde bereits in ein homogen lineares System erster Ordnung umgeformt und gelöst. Jetzt wird dieses System nochmals aber ohne die Verwendung der komplexen Struktur im R2 für beliebige Anfangsvorgabe gelöst. Wir werden dabei die Flussabbildung als eine Drehbewegung von R2 um 0 mit konstanter Winkelgeschwindigkeit erkennen. Die Bewegungsgleichung ẍ + ω 2 x = 0 ist mit γ 1 = x und γ 2 = ẋ/ω bekanntlich dem System erster Ordnung γ̇ = −ωLγ auf dem ’Phasenraum’ V = R2×1 mit dem ’Geschwindigkeitsvektorfeld’ −ωL : V → V mit L: a b → −b a = 0 −1 1 0 · a b äquivalent. Versuchen wir nun ohne Nutzung der komplexen Sruktur von R2 die maximalen Lösungen des Systems γ̇ = ωL (γ) zu finden. Der Graph von L kann dadurch veranschaulicht werden, dass an einigen Stellen v seines Definitionsbereichs der Vektor λL(v) eingezeichnet wird. Die Konstante λ > 0 wird dabei so gewählt, dass sich die Vektoren nicht überschneiden. Die so gezeichneten Vektoren sind tangential zur Bahn einer Lösung von γ̇ = ωL ◦ γ. Im vorliegenden Beispiel gilt L(v), v = L(v)t ·v = 0. Daher sind als Bahnen maximaler Lösungen Kreise um 0 zu erwarten. 14 Die Größe A(t)γ(t) ist somit das Bild des Wertes der Kurve γ zur Zeit t unter der linearen Abbildung A(t). Die systematische, aber unübliche Schreibweise dafür ist A(t, γ(t)), wobei A als Abbildung von I × V nach V aufgefasst wird. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 37 In Analogie zur reellen Differentialgleichung y ′ = λy ist zu vermuten, dass für v ∈ V die Kurve γ v : R → V, t → etωL v eine Lösung des Systems γ̇ = ωLγ ist. Für das Exponential eA einer linearen Abbildung A : V → V gilt eA : V → V, v→ ∞ n=0 1 n A (v), n! wobei die lineare Abbildung An rekursiv durch A0 = id und An+1 (v) = A (An (v)) definiert ist. Die Abbildung eA : V → V ist somit als (unendliche) Summe linearer Abbildungen auch linear. (Konvergenzfragen werden vorläufig ignoriert.) Im vorliegenden Beispiel gilt L2 = −id. Daraus folgt tL e = = ∞ n=0 ∞ n=0 tn n L = n! ∞ n=0 n 2n ∞ t2n 2n t2n+1 L + L2n+1 (2n)! (2n + 1)! n=0 ∞ (−1) t (−1)n t2n+1 id + L = cos (t) · id + sin (t) · L. (2n)! (2n + 1)! n=0 Daher ist eωtL eine Drehung von V um den Winkel ωt eωtL = cos(ωt) − sin(ωt) sin(ωt) cos(ωt) . (1.18) Durch Ableiten nach t rechnet man dtd eωtL = ωLetL nach. Folglich gilt auch für γ v : R → V mit γ v (t) = eωtL v, dass γ̇ v (t) = ωLγ v (t) und γ v (0) = v. Die Kurve γ v ist also tatsächlich eine maximale Lösung des homogen linearen Systems γ̇ v = ωLγ v mit der Anfangsbedingung γ v (0) = v. Gibt es weitere maximale Lösungen? Sei γ : I → V eine solche. Dann folgt d −ωtL e γ (t) = (−ωL) e−ωtL γ (t) + e−ωtL γ̇ (t) = −ωLe−tL + e−tL ωL γ (t) = 0. dt Somit ist t → e−ωtL γ (t) konstant. Daher existiert ein v ∈ V, sodass e−ωtL γ (t) = v für alle t ∈ I. Man rechnet an Gleichung (1.18) leicht nach, dass für x ∈ R die KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 38 Abbildung e−xL invers zu exL ist. Daher gilt γ (t) = eωtL v für alle t ∈ I. Damit ist klar, dass {γ v : v ∈ V } alle maximalen Lösungen des Systems γ̇ = ωLγ enthält. Sei nun γ v : R → V, t → exp (ωtL) v und v = (a, b)t . Es gilt somit γ v (t) = a cos(ωt) − b sin(ωt) a sin(ωt) + b cos(ωt) . Das Bild von γ v ist der Kreis um 0 durch den Punkt v. Zwei spezielle Lösungen γ v ergeben sich für v = e1 = (1, 0)t bzw. v = e2 = (0, 1)t . Es sind dies die beiden Spalten der Matrix von eωtL zur Standardbasis. Jede andere der Lösungen γ v ist eine Linearkombination der beiden Lösungen γ e1 und γ e2 . Es gilt für v = ae1 − be2 γ v = γ ae1 −be2 = aγ e1 − bγ e2 . Der erste Eintrag der Lösungskurve γ v ist die reelle Funktion x(t) = a cos (ωt) + b sin (ωt) . Dies stimmt mit den schon auf anderem Weg gefundenen maximalen Lösungen der Gleichung (1.17) überein. 1.3.2 Homogen lineare Systeme Für homogen lineare Systeme genügt es ganz allgemein und nicht nur im obigen Beispiel des Drehvektorfeldes L, eine endliche Anzahl maximaler Lösungen zu berechnen. Alle weiteren Lösungen können nämlich daraus durch Linearkombination gewonnen werden. Genaueres dazu im folgenden Satz. Satz 18 Sei γ̇(t) = A(t)γ(t) ein homogen lineares System auf einem Intervall I und einem n-dimensionalen K-VR V. Dann ist die Menge LA,0 aller maximalen Lösungen des Systems ein n-dimensionaler K-VR. Für γ 1 , . . . γ k ∈ LA,0 sind äquivalent: 1. γ 1 , . . . γ k sind linear unabhängig in LA,0 , 2. für t0 ∈ I sind γ 1 (t0 ), . . . γ k (t0 ) linear unabhängig in V. Definition 19 Eine Basis von LA,0 heißt ein Fundamentalsystem des homogen linearen Systems γ̇(t) = A(t)γ(t). Ist (v1 , . . . vn ) eine Basis von V und gilt für γ 1 , . . . γ n ∈ LA,0 γ 1 (t0 ) = v1 , . . . γ n (t0 ) = vn , dann gilt für die Kurve γ = ni=1 ci γ i die Anfangsbedingung γ(t0 ) = ni=1 ci vi . Die maximale lokale Flussabbildung eines homogen linearen Systems ist daher für t0 ∈ I über die Lösungen γ t0 ,v ∈ LA,0 mit γ t0 ,v (t0 ) = v durch Φt0 : I × V → V, (t, v) → γ t0 ,v (t) auf ganz I × V definiert. Die Abbildung Φt0 ist im zweiten Argument K-linear: Φt0 (t, v + λw) = Φt0 (t, v) + λΦt0 (t, w) für alle v, w ∈ V und für alle λ ∈ K. Die Abbildung Ut,t0 : V → V, v → Φt0 (t, v) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 39 ist wegen Satz 18 sogar für jedes t ∈ I ein Vektorraumisomorphismus, also invertierbar. Sei e = (e1 , . . . en ) eine Basis von V und sei (γ 1 , . . . γ n ) jenes Fundamentalsystem von γ̇(t) = A(t)γ(t), für das γ 1 (t0 ) = e1 , . . . γ n (t0 ) = en gilt. Sind γ ji : I → K so, dass γ i (t) = nj=1 γ ji (t) ej für alle t ∈ I, dann folgt v1 γ 11 (t) , . . . γ 1n (t) n .. .. Ut,t0 vi ei = (e1 , . . . en ) · · . . . n n i=1 γ 1 (t) , . . . γ n (t) vn Die i-te Spalte der Matrix von Ut,t0 zur Basis e besteht also aus den Koordinatenfunktionen der Kurve γ i zur Basis e. An einem Fundamentalsystem können daher die „Evolutionsabbildungen” Ut,t0 für t ∈ I abgelesen werden. 1.3.3 Autonome homogen lineare Systeme Für die Physik15 besonders wichtig sind autonome homogene lineare Systeme. Daher wird auf diese noch etwas genauer eingegangen. Für Ut,t0 gilt wie schon beim Beispiel des Drehvektorfeldes die folgende Exponentialformel. Satz 20 Sei γ̇(t) = Aγ(t) ein autonomes homogen lineares System auf R und einem n-dimensionalen K-VR V mit A : V → V. Dann gilt Ut,t0 = Ut−t0 ,0 =: Ut−t0 und Ut = e tA :V →V v → γ 0,v (t) = ∞ n=0 tn n A v. n! Beweis. Ist γ v jene maximale Lösung des autonomen Systems γ̇ = Aγ, für die γ v (0) = v. Dann ist auch ihr Translat γ (t) = γ v (t − t0 ) eine Lösung. Für sie gilt γ (t0 ) = v. Daraus folgt Ut,t0 v = γ (t) = γ v (t − t0 ) = Ut−t0 ,0 v für alle v ∈ V. Sei · eine Norm von V . Eine Reihe ∞ n=0 vn konvergiert in V genau dann, wenn ∞ die Zahlenreihe n=0 vn konvergiert. Es existiert ein C > 0 mit Av ≤ C v für alle v ∈ V. Daraus folgt # n # # t n # tn n # A v# ≤ C v . # n! # n! Die Reihe Reihe ∞ n=0 vn mit vn = tn n A v n! ∞ n=0 ist somit majorisiert von der konvergenten tn n C v = v etC n! und damit selbst konvergent. Wir rechnen nun nach, dass γ t0 ,v das System γ̇ = Aγ löst. d d γ 0,v (t) = dt dt 15 ∞ n=0 tn n A v= n! ∞ n=1 ∞ ∞ ntn−1 n tn−1 tn n n−1 A v=A A v=A A v. n! (n − 1)! n! n=1 n=0 Die Schrödingergleichung i ∂t Ψt = HΨt ist von diesem Typ, wenngleich der Vektorraum, in dem Ψt liegt, meist unendlichdimensional ist. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 40 n t n Schließlich nimmt die Reihe ∞ n=0 n! A v für t = 0 den Wert v an. Hier noch einige Eigenschaften des Exponentials von linearen Abbildungen. Für −1 = e−A und det eA = A : V → V linear und s, t ∈ R gilt esA ◦ etA = e(s+t)A , eA eSp(A) > 0. Man beachte jedoch, dass für lineare Abbildungen A, B : V → V im allgemeinen eA ◦ eB = eA+B . Eine explizite Berechnung von etA ist nur in einigen wenigen Fällen, wie beim Drehvektorfeld L direkt durch Aufsummieren der Exponentialreihe möglich. Dennoch gibt es weitere lösbare Fälle. Falls Av = av für ein a ∈ K, dann folgt (mit Reihe Nachrechnen!) etA v = eta v. Falls A Eigenvektoren v1 , ..., vn zu Eigenwerten a1 , ..., an hat, dann folgt16 aus der Linearität von etA n tA n i e c vi i=1 ci etai vi . = i=1 Ist (v1 , ..., vn ) eine Basis von V, dann ist damit die (maximale) Flussabbildung von γ̇ = Aγ ermittelt. 1.3.4 3d Drehvektorfelder und ihre Flussabbildungen Sei V ein reeller Vektroraum der Dimension 3. Eines der Skalarprodukte von V sei ausgewählt und mit ·, · bezeichnet. Von den beiden Mengen aller gleichsinnig orientierten Basen sei eine als die positiv orientierte Klasse ausgezeichnet. Damit ist in V ein schiefsymmetrisches bilineares Vektorprodukt × : V × V → V eindeutig festgelegt. Es bildet zwei orthogonale Einheitsvektoren u, v ∈ V auf jenen Einheitsvektor w = u × v ab, der (u, v, w) zu einer positiv orientierten ONB von V macht. Wie bewegen sich die Elemente von V, wenn sie alle um eine Gerade R· n gedreht werden? Sei n ∈ V mit |n| = 1. Ein Vektor v ∈ V wird in einen Teil im Unterraum R · n und einen dazu senkrechten Teil zerlegt: v = n, v n + (v − n, v n) . Der Teil n, v n liegt in R · n. Der Teil v − n, v n liegt in der Ebene n⊥ durch 0, die senkrecht auf R · n steht. Beim Drehen von v um die Achse R · n bleibt n, v n unverändert. Nur der Teil v ′ = v − n, v n wird in der Ebene n⊥ gedreht. Ist ein Drehwinkel α ∈ R gewählt, dann bleibt noch die Entscheidung über den Drehsinn zu fällen: wird ein Vektor v ∈ / R · n in die Richtung n × v weggedreht oder entgegengesetzt dazu? Jetzt ist klar, wozu der achsenerzeugende Vektor n dient. Er gibt die Möglichkeit den Drehsinn zu formulieren. Wird v für α > 0 in die Richtung n × v um den Winkel α weggedreht, dann sagt man die Drehung um die orientierte Achse R · n hat positiven Drehsinn. Andernfalls wird der Drehsinn als negativ bezeichnet. Eine positive Drehung Rn (α) um die orientierte Achse R · n und um den Winkel α erzeugt aus v ′ ∈ n⊥ einen Vektor Rn (α) v ′ ∈ n⊥ derselben Länge wie v ′ . Die 16 Dies ist das Lösungsschema für die zeitabhängige Schrödingergleichung mit statischem Hamiltonoperator. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 41 Zerlegung von Rn (α) v′ nach den beiden 1d orthogonalen Unterräumen R · v′ und R · (n × v ′ ) ergibt somit (Bild!) Rn (α) v ′ = cos (α) · v ′ + sin (α) · (n × v ′ ) . Damit folgt für einen belieben Vektor v ∈ V, dass Rn (α) v = = n, v n + cos (α) (v − n, v n) + sin (α) (n × (v − n, v n)) n, v n + cos (α) (v − n, v n) + sin (α) (n × v) . Die Ableitung der Kurve γ v : R ∋ α → Rn (α) v an der Stelle α = 0 ergibt den Tangentenvektor γ̇ v (0) = n × v. Damit ist die folgende Definition motiviert. Definition 21 Ist Ω ∈ V, dann heißt die lineare Abbildung LΩ : V → V mit LΩ (v) = Ω × v Drehvektorfeld zum Vektor Ω. Es ist das Geschwindigkeitsvektorfeld einer (starren) Drehung mit dem Winkelgeschwindigkeitsvektor Ω. Die nichtnegative Zahl |Ω| wird als die (skalare) Winkelgeschwindigkeit von LΩ und für Ω = 0 wird R · Ω als die (orientierte) Drehachse von LΩ bezeichnet. Winkelgeschwindigkeitsvektoren werden als Axialvektoren im Gegensatz zu ’polaren’ Vektoren bezeichnet. Was ist mit dieser absurd anmutenden Rede gemeint, wenn doch alle Vektoren in V Elemente ein und desselben Raumes sind? Gibt es da etwa eine Klasseneinteilung von V ? Nein, der Grund ist der folgende. Die Spiegelung π : V → V mit π (v) = −v überträgt sich auf die Tangentenvektorfelder von V indem für X : V → V das gespiegelte Vektorfeld π ∗ X : V → V durch π ∗ X : x → −X (−x) definiert wird. (Die Regel motiviert sich über die Tangenten von Kurven in V.) Was passiert mit dem Vektorfeld LΩ bei Spiegelung? Es gilt (π ∗ LΩ ) (v) = −LΩ (−v) = LΩ (v) für alle v ∈ V und somit π∗ LΩ = LΩ . Man sagt dazu: ’der Winkelgeschwindigkeitsvektor eines Systems (bezüglich 0) geht bei Spiegelung des Systems (am Punkt 0) in sich über’. Es ist also die Parametrisierung der Drehvektorfelder auf V durch Elemente von V, die ’polar’ heißen sollte. Man veranschauliche sich den Sachverhalt am Beispiel eines rotierenden Balls. Bei Spiegelung an seinem Mittelpunkt geht der Bewegungszustand des Balls in sich über. Ein weiteres Beispiel liefert die um die Sonne umlaufende Erde. Bei Spiegelung an der Sonne bleiben Dreh- und Umlaufsinn der Erde erhalten, wenn auch Nordund Südpol ihren Platz tauschen. Aufgrund der Bilinearität des Vektorproduktes (v, w) → v×w von V ist die Menge aller Drehvektorfelder selbst ein dreidimensionaler Vektorraum, da für A, B ∈ V und λ ∈ R gilt, dass LA + LB = LA+B und λLA = LλA . Die Hintereinanderausführung zweier Drehvektorfelder ergibt LA ◦ LB : v → A × (B × v) = B A, v − v B, A . Für A = 0 = B steht der Vektor L (A LB v) nicht für jedes v ∈ V senkrecht zu v. (Übung) Damit ist LA ◦ LB kein Drehvektorfeld. Aber es folgt [LA , LB ] := LA ◦ LB − LB ◦ LA : v → B A, v − A B, v . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 42 Wegen LA×B (v) = (A × B) × v = −v × (A × B) = −A v, B + B A, v gilt somit [LA , LB ] = LA×B . Das (bilineare und schiefsymmetrische) Kommutatorprodukt zweier Drehvektorfelder ist wieder ein Drehvektorfeld. Satz 22 Die Evolutionsabbildung Ut (zur Anfangszeit t0 = 0) des Systems erster Ordnung γ̇ = LΩ γ zum Geschwindigkeitsvektorfeld einer Drehung mit Winkelgeschwindigkeit Ω = 0 erfüllt U (t) = etLΩ = eωtLn = Rn (ωt) mit n = Ω/ |Ω| und ω = |Ω| . Für alle v ∈ V gilt Ut v = n, v n+cos (ωt) (v − n, v n)+sin (ωt) (n × v) . Beweis. Der entscheidende Sachverhalt ist a × (b × c) = b a, c − c a, b für a, b, c ∈ V. Daraus folgt für alle v ∈ V, dass L2n v = n × (n × v) = n, v n − n, n v = − (v − n, v n) = −Pn′ v, mit der Abkürzung Pn′ : V → V, v → v − n, v n. Die Abbildung Pn′ ist somit die Orthogonalprojektion auf n⊥ . Damit gilt für v ∈ n⊥ k 2k+1 L2k v = (−1)k n × v für alle k ∈ N0 , n v = (−1) v und Ln während für v ∈ R · n folgt, dass L0n v = v und Lk>0 n v = 0. Anwendung der ExpoωtLn nentialreihe von e auf die Zerlegung v = n, v n + (v − n, v n) ergibt dann die Behauptung des Satzes. 1.3.5 *Drehbewegungen starrer Körper: Trägheitstensor An dieser Stelle bietet sich ein Exkurs zur Physik der Drehbewegungen starrer Körper an. Dabei wird das Gebiet der gewöhnlichen Differentialgleichungssysteme zwar kurz verlassen, aber die Übersichtlichkeit und Transparenz der basisfreien Vektorrechnung kann illustriert werden. Sei X = {x1 , . . . xn } ⊂ V die Menge der Orte der ausdehnungslosen Bestandteile eines Körpers zur Zeit t = 0. So ein Körper wird als starr bezeichnet, wenn seine Bestandteile C 2 -Kurven γ i : I → V mit γ i (0) = xi durchlaufen, für die eine gemeinsame Kurve R : I → SO (V ) und eine gemeinsame Kurve a : I → V existiert, sodass γ i (t) = a (t) + R (t) xi für alle i ∈ {1, . . . n} und für alle t ∈ I gilt. Hier bezeichnet SO (V ) die Menge aller linearen Abbildungen A : V → V mit |Av| = |v| für alle v ∈ V und det A > 0. Es ist dies die Menge aller Drehungen von V und es folgt det A = 1 für alle A ∈ SO (V ) .17 Im folgenden wird der Spezialfall a = 0 fehlenden Translationsanteils behandelt. Tragen die Massenpunkte γ i die Massen mi ∈ R>0 , und rotieren sie zur Zeit t = 0 mit der Winkelgeschwindigkeit Ω ∈ V um 0 ∈ V, dann hat der ’Massenpunkt’ zur Zeit t = 0 die Geschwindigkeit vi = Ṙ (0) xi = LΩ xi mit LΩ = Ṙ (0) . Das rotierende Massenpunktsystem hat in diesem Augenblick die kinetische Energie n Tkin = i=1 17 mi |vi |2 = 2 n i=1 mi LΩ xi , LΩ xi = 2 n i=1 mi Ω × xi , Ω × xi . 2 Der Konfigurationsraum eines starren Körpers ist somit V × SO (V ) , eine differenzierbare Mannigfaltigkeit, die kein Vektorraum ist. Daher benötigt die Mechanik des starren Körpers eine Verallgemeinerung der Differential- und Integralrechnung auf nichlineare Mannigfaltigkeiten. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 43 Mit a × b, v × w = a, v b, w − a, w b, v für alle a, b, v, w ∈ V folgt % $ n n mi mi 2 2 2 2 Tkin = |Ω| |γ i | − Ω, xi = Ω, |xi | ιdV − xi xi , · Ω . 2 2 i=1 i=1 Die lineare Abbildung Θm : V → V mit n Θm = i=1 mi |xi |2 ιdV − xi xi , · (1.19) heißt Trägheitstensor der Massenverteilung m : X → R>0 mit xi → mi bezüglich der Rotationen um 0. Bei Rotation von m mit der momentanen Winkelgeschwindigkeit Ω hat das System also die kinetische Energie Tkin = Ω, Θm Ω /2. Als Funktion von Ω ist Tkin also die zum Trägheitstensor gehörige quadratische Form. Der Trägheitstensor ΘRm der drehgespiegelten Massenverteilung Rm : RX → R>0 mit Rxi → mi für ein R ∈ O (V ) hängt offenbar mit Θm gemäß ΘRm = RΘm R∗ = RΘm R−1 zusammen. Zu einer beliebigen Zeit t haben wegen γ i (t) = R (t) xi die Massenpunkte des Körpers die Geschwindigkeiten γ̇ i (t) = Ṙ (t) xi = Ṙ (t) R (t)−1 γ i (t) = LΩ(t) γ i (t) mit LΩ(t) = Ṙ (t) R (t)−1 . Die kinetische Energie des Körpers hat daher zur Zeit t den Wert & ' & ' Tkin (t) = Ω (t) , ΘR(t)m Ω (t) = R (t)−1 Ω (t) , Θm R (t)−1 Ω (t) . Dreht sich ein Körper im Lauf der Zeit mit konstanter Winkelgeschwindigkeit Ω, dann hat er zur Zeit t die Massenverteilung & −tL ' mt = R (t) m mit R (t) = exp (tLΩ ) . −tLΩ Ω Daher gilt Ω, Θmt Ω = e Ω, Θm e Ω = Ω, Θm Ω , dh die kinetische Energie ist zeitlich konstant. Ist eine Massenverteilung m unter einer Drehspiegelung R ∈ O (V ) invariant, gilt also Rm = m, dann folgt RΘm R∗ = ΘRm = Θm , oder auch RΘm = Θm R, der Trägheitstensor kommutiert mit der Symmetrie R von m. Ist v ∈ V ein Eigenvektor von Θm zum Eigenwert ϑ, dann folgt daraus Θm (Rv) = RΘm v = ϑ · (Rv) , dh R bildet die Eigenräume von Θm jeweils auf sich ab. Ist ein Eigenraum eindimensional, dann sind seine Elemente v = 0 auch Eigenvektoren von R. Die Eigenwerte von Θm heißen Hauptträgheitsmomente und die Eigenräume die Hauptträgheitsachsen von m. Da Θm bezüglich ·, · symmetrisch ist, existiert eine Orthonormalbasis von V aus Eigenvektoren von Θm . Im folgenden ist m fest gewählt, sodass die Notation Θm gefahrlos zu Θ verkürzt werden kann. Die Gramsche Matrix der Bilinearform Θ : V × V → R mit Θ (v, w) = v, Θw zu einer beliebigen Orthonormalbasis (e1 , e2 , e3 ) von V hat die Einträge n Θrs = er , Θes = i=1 mi |xi |2 δ rs − er , xi xi , es Diese basisabhängige Matrix wird vielfach auch als Trägheitstensor bezeichnet. Was hat Θ oder auch Θ mit einem Tensor der linearen Algebra zu tun? Ist V ∗ der Vektrorraum aller linearen Abbildungen von V nach R, dann existieren zu einer KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 44 beliebigen Basis e = (e1 , e2 , e3 ) von V drei Elemente (E 1 , E 2 , E 3 ) von V ∗ , sodass E i (ej ) = δ ij . Diese drei Element bilden eine Basis von V ∗ , die sogenannte duale Basis, und es gilt v = 3i=1 E i (v) ei für alle v ∈ V. Daraus ergibt sich 3 Θ (v, w) = r,s=1 Θrs E r (v) · E s (w) . Die bilineare Abbildung18 ⊗ : V ∗ × V ∗ → Bil (V × V ) mit ⊗ (X, Y ) ≡ X ⊗ Y : V × V ∋ (v, w) → X (v) · Y (w) ∈ R ist ein sogenanntes Tensorprodukt im Sinn der linearen Algebra. Mit diesem gilt daher Θ = 3r,s=1 Θrs · (E r ⊗ E s ) . Der gesamte (kinetische) Drehimpuls lkin eines zusammengesetzten Systems setzt sich aus den Drehimpulsen seiner Bestandteile additiv zusammen. Es gilt daher für ein starr um 0 rotierendenes System wegen a × (b × c) = b a, c − c a, b n lkin = i=1 n mi xi × vi = n i=1 mi xi × (Ω × xi ) = i=1 mi |xi |2 Ω − xi , Ω xi = ΘΩ. Θ bildet die Winkelgeschwindigkeit einer Massenverteilung auf ihren Drehimpuls ab. 1.3.6 *Allgemeine Bewegungen starrer Körper Sei V ein reeller Vektorraum der Dimension 3 und sei ·, · ein Skalarprodukt von V. Die Menge aller linearen Abbildungen A : V → V mit Av, Aw = v, w für alle v, w ∈ V ist bezüglich der Hintereinanderausführung die Gruppe O3 . Für A ∈ O3 gilt somit A∗ = A−1 und detA = ±1. Die Untergruppe SO3 = {A ∈ O3 : detA = 1} bildet zusammen mit der Translationsgruppe V die Gruppe B = SO3 ⋊ V von V : B ∋ gA,a : V → V, v → Av + a. Wegen [gA2 ,a2 ◦ gA1 ,a1 ] (v) = A2 (A1 v + a1 ) + a2 = A2 A1 v + A2 a1 + a2 = (A2 A1 , A2 a1 + a2 ) v gilt das Gruppenmultiplikationsgesetz eines semidirekten Produktes gA2 ,a2 ◦ gA1 ,a1 = gA2 A1 ,A2 a1 +a2 für alle (A1 , a1 ) , (A2 , a2 ) ∈ SO3 × V. Zwei Abbildungen gA1 ,a1 , gA2 ,a2 ∈ B sind übrigens genau dann gleich, wenn A1 = A2 und a1 = a2 . Gilt nämlich A1 v + a1 = A2 v + a2 für alle v ∈ V, dann folgt aus dem Fall v = 0, dass a1 = a2 . Daraus wiederum folgt nun für alle v ∈ V, dass A1 v = A2 v, also A1 = A2 . Daher wird abgekürzt: gA,a = (A, a) . 18 Hier bezeichnet Bil (V × V ) den Vektorraum aller bilinearen Abbildungen von V × V nach R. Man beachte, dass dim (V × V ) = 6 und dim Bil (V × V ) = 9. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 45 Definition 23 Eine Abbildung f : V → V mit |f (x) − f (y)| = |x − y| für alle x, y ∈ V heißt Isometrie von V. Satz 24 Die Menge aller Isometrien von V stimmt mit B überein. Beweis. Siehe Kap. 1 der Vorlesung von Franz Pauer, ’Gruppentheorie für Mathematiker, Physiker und Chemiker’, SoSe 1986. Definition 25 Sei I ⊂ R ein offenes Intervall und Φ : I × V → V d’bar mit Φ (t, ·) ∈ B für alle t ∈ I. Dann heißt Φ d’bare Bewegung von V. Ist Φ : I × V → V eine d’bare Bewegung von V, dann existiert also für alle t ∈ I genau ein (A (t) , a (t)) ∈ B mit Φ (t, v) = A (t) v +a (t) . Für zwei Vektoren v, w ∈ V folgt Φ (t, v) = Φ (t, w) + A (t) (v − w) . Diese Formel stellt die Bewegung von v als Hintereinanderausführung einer Drehung von v um w und einer anschließenden Translation um Φ (t, w) dar. Daraus folgt mit der Bezeichnung Φ (t, v) = γ v (t) wegen γ v (t) − γ w (t) = A (t) (v − w) , dass γ̇ v (t) = γ̇ w (t) + Ȧ (t) A (t)−1 [γ v (t) − γ w (t)] . Lemma 26 Ist A : I → SO3 d’bar, dann ist für t ∈ I die Abbildung C (t) := Ȧ (t) A (t)−1 antisymmetrisch, d.h. es gilt w, C (t) v = − C (t) w, v für alle v, w ∈ V, oder äquivalent dazu C (t)∗ = −C (t) . Beweis. Es gilt für alle v, w ∈ V ( ) ( ) d d w, v = A (t) w, A (t) v = Ȧ (t) w, A (t) v + A (t) w, Ȧ (t) v dt dt ( ) ( ) −1 = Ȧ (t) A (t) A (t) w, A (t) v + A (t) w, Ȧ (t) A (t)−1 A (t) v . 0 = Da A (t) bijektiv ist, gilt somit auch ( ) ( ) −1 −1 Ȧ (t) A (t) x, y + x, Ȧ (t) A (t) y = 0 für alle x, y ∈ V. Anmerkung: Die Liealgebra der SO3 kann mit dem Tangentialraum der SO3 im Einselement e = ιdV , also mit Te SO3 = so3 identifiziert werden. Sie stimmt mit den antisymmetrischen linearen Abbildungen von V nach V überein. Ȧ (t) ist Element des Tangentalraumes von SO3 im Punkt A (t) . Lemma 27 Ist die lineare Abbildung C : V → V antisymmetrisch und ist eine Orientierung von V gewählt, dann existiert genau ein ω ∈ V mit Cv = ω × v ≡ Lω v für alle v ∈ V. (Dabei ist × das äußere Produkt von V bezüglich der gewählten Orientierung. Für eine positiv orientierte ONB e = (e1 , e2 , e3 ) von V gilt also e1 × e2 = e3 zyklisch.) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 46 Beweis. Sei e eine positiv orientierte ONB von V. Dann existieren eindeutig bestimmte reelle Zahlen a, b, c sodass für die Matrix M (C, e) gilt: 0 −c b 0 −a . M (C, e) = c −b a 0 Für alle v = i v i · ei ∈ V gilt dann 1 0 −c b v 0 −a · v 2 . Cv = (e1 , e2 , e3 ) · c −b a 0 v3 ω i · ei für alle v ∈ V 1 0 −ω 3 ω 2 v 3 1 2 ω 0 −ω v ω × v = (e1 , e2 , e3 ) · · . 2 1 3 −ω ω 0 v Andererseits gilt mit ω = i Cv = ω × v gilt nun genau dann, wenn (ω 1 , ω 2 , ω 3 ) = (a, b, c) . Damit ist nun gezeigt: Satz 28 Ist Φ : I × V → V eine d’bare Bewegung von V, dann existiert eine stetige Abbildung Ω : I → V, sodass γ̇ v (t) = γ̇ w (t)+Ω (t)×[γ v (t) − γ w (t)] für alle v, w ∈ V. Dieser Satz zerlegt die Geschwindigkeit der Kurve γ v zur Zeit t in die Geschwindigkeit γ̇ w (t) des Referenzpunktes w zur Zeit t und die momentane Geschwindigkeit einer Drehung von γ v (t) um γ w (t) . 1.3.7 *Lageabhängigkeit des Trägheitstensors Sei K eine endliche Menge von Punkten {v1 , . . . vN } ⊂ V und sei Φ : I ×V → V eine d’bare Bewegung von V. Man stellt sich die Punkte von K als jene Raumpunkte vor, die von fiktiven ausdehnungslosen Elementarbausteinen des Körpers (in der Lage K) eingenommen werden. Dann durchlaufen die Punkte vi ∈ K unter Φ die Kurven γ i = Φ (·, vi ) : I → V. Eine Abbildung m : K → R>0 sei gegeben. Sie gibt die Massen der Bausteine des Körpers an. Ist mi = m (vi ) > 0 die Masse jenes Massenpunktes des starren Körpers, der die Kurve γ i durchläuft, dann ist die kinetische Energie T (t) des Körpers zur Zeit t gegeben durch N mi T (t) := |γ̇ i (t)|2 . 2 i=1 Sei nun w ∈ V ein beliebiger Punkt, der Element von K sein kann aber nicht sein muss. Es kann w zB der Schwerpunkt19 des Körpers in der Lage K sein. In diesem Fall gilt N N 1 ∗ w = v := mi vi mit M = mi . M i=1 i=1 19 Dieser ist iA nicht Element von K. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 47 Im Fall eines beliebigen Referenzpunktes w ∈ V folgt mit der Abkürzung δ i (t) := γ i (t) − γ w (t) ∈ V, dass N T (t) = i=1 = M |γ̇ w (t)|2 + 2 N i=1 mi |γ̇ w (t) + Ω (t) × δ i (t)|2 2 $ mi |Ω (t) × δ i (t)|2 + 2 % N γ̇ w (t) , Ω (t) × mi δ i (t) . i=1 Nach der Spatproduktformel a, b × c = c, a × b = a × b, c gilt für den letzten Summanden $ % $ % N N γ̇ w (t) , Ω (t) × mi δ i (t) i=1 = γ̇ w (t) × Ω (t) , 2 2 mi δ i (t) . i=1 2 Für den zweiten Summanden gilt wegen |a × b| = |a| |b| − a, b N i=1 mi |Ω (t) × δ i (t)|2 = 2 N i=1 2 mi |Ω (t)|2 |δ i (t)|2 − Ω (t) , δ i (t) 2 2 . Die lineare Abbildung ΘK(t),w : V → V mit N ΘK(t),w = i=1 mi |δ i (t)|2 ιdV − δ i (t) δ i (t) , · heißt Trägheitstensor des Körpers in der Lage Φ (t, K) =: K (t) ⊂ V bezüglich des Referenzpunktes Φ (t, w) = γ w (t) . Es gilt also $ % N ' M 1& 2 |γ̇ (t)| + Ω (t) , ΘK(t),w Ω (t) + γ̇ w (t) × Ω (t) , T (t) = mi δ i (t) . 2 w 2 i=1 Wegen δ i (t) = A (t) (vi − w) und wegen A (t) ∈ SO3 gilt ΘK(t),w = A (t) ΘK,w A (t)−1 mit N ΘK,w = i=1 mi |ζ i |2 ιdV − ζ i ζ i , · und ζ i := vi − w. Die lineare Abbildung ΘK,w heißt Trägheitstensor des Körpers in Lage K bezüglich des Referenzpunktes w. Offenbar gilt ΘK,w = ΘK−w,0 . Wie hängt ΘK,w mit ΘK,v∗ zusammen, wenn v ∗ der Schwerpunkt des Körpers ist? ∗ Es folgt für beliebiges δ := w − v ∗ ∈ V unter Verwendung von N i=1 mi (vi − v ) = 0 N ΘK,v∗ +δ = i=1 mi |vi − v ∗ − δ|2 ιdV − (vi − v ∗ − δ) vi − v∗ − δ, · N = i=1 mi |vi − v∗ |2 ιdV − (vi − v ∗ ) vi − v ∗ , · + M |δ|2 ιdV − δ δ, · . Also gilt eine Formel, die als Steinerscher Satz bezeichnet wird. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 48 Satz 29 Sei ΘK,v∗ der Trägheitstensor eines Körpers in Lage K bezüglich seines Schwerpunktes v ∗ . Dann gilt für den Trägheitstensor des Körpers in Lage K bezüglich eines allgemeinen Referenzpunktes w = v ∗ + δ ΘK,w = ΘK,v∗ + M |δ|2 ιdV − δ δ, · . Im Fall w = v ∗ vereinfacht sich die kinetische Energie T (t) zu T (t) = ' M 1& |γ̇ v∗ (t)|2 + Ω (t) , ΘK(t),v∗ Ω (t) . 2 2 Sie zerfällt also in einen Beitrag der Schwerpunktsgeschwindigkeit und einen der Winkelgeschwindigkeit. Die Definition des Trägheitstensors kann auf den Fall einer kontinuierlichen Massendichte verallgemeinert werden. Ist ρ : V → R≥0 eine integrable Funktion, die außerhalb einer endlichen Kugel nur den Wert 0 annimmt, dann wird definiert: Θρ,w = V ρ (v) |v − w|2 ιdV − (v − w) v − w, · d3 v. Ein Trägheitstensor ΘK,w ist eine positiv gewichtete Summe von Abbildungen des Typs |v|2 ιdV − v v, · . Jeder Summand ist symmetrisch bezüglich des Skalarproduktes. Somit gilt auch Θ∗K,w = ΘK,w . Für v = 0 gilt * + v v, · 2 2 |v| ιdV − v v, · = |v| ιdV − = |v|2 [ιdV − PR·v ] = |v|2 Pv⊥ . 2 |v| Für v = 0 ist |v|2 ιdV − v v, · ein positives Vielfaches der Orthogonalprojektion von V auf das orthogonale Komplement von R · v. Für v = 0 ist |v|2 ιdV − v v, · = 0, also die Orthogonalprojektion auf 0. Als Summe positiver linearer Abbildungen ist ΘK,w somit positiv. Die Eigenwerte von ΘK,w werden als Hauptträgheitsmomente bezeichnet. Sie sind nicht negativ. Eindimensionale Eigenräume von ΘK,w werden Hauptträgheitsachsen genannt. Weiter gilt folgende Ungleichung für die Eigenwerte eines Trägheitstensors. Satz 30 Ist θ ein Eigenwert von ΘK,w , dann gilt Sp (ΘK,w ) − 2θ ≥ 0. Beweis. Sei e = (e1 , e2 , e3 ) eine ONB von V. Mit vi = 3j=1 vij ej hat die Abbildung Θ = ΘK,w die Matrix M (Θ, e) bezüglich e. Für jedes ihrer Diagonalelemente gilt wegen vi , ek = vik N M (Θ, e)kk = i=1 mi |vi |2 − vik 2 . Für die Spur von Θ folgt daher N 3 M SpΘ = j=1 (Θ, e)jj N 2 =2 i=1 mi |vi | ≥ 2 i=1 mi |vi |2 − vik 2 = 2M (Θ, e)kk KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 49 für jedes k ∈ {1, 2, 3} . Ist nun e eine ONB aus Eigenvektoren von Θ, dann ist M (Θ, e)kk ein Eigenwert θ von Θ. Sind also θ1 ≥ θ2 ≥ θ3 ≥ 0 die drei Diagonalmatrixelemente der Matrix von Θ bezüglich einer ONB, dann gilt θ2 + θ3 ≥ θ1 . Daraus folgt θ1 + θ2 + θ3 − 2θ1 ≥ 0 und wegen θ 1 ≥ θ2 ≥ θ3 auch θ1 + θ 2 + θ3 − 2θ 2 ≥ 0 und θ1 + θ2 + θ 3 − 2θ3 ≥ 0. Es gilt also20 θ1 + θ2 + θ3 − 2θi ≥ 0 für alle i ∈ {1, 2, 3} . Anmerkung: Falls eine ONB e aus Eigenvektoren von Θ besteht, ist jedes Diagonalmatrixelement θi von Θ zu dieser ONB ein Hauptträgheitsmoment. Beobachtung: Das größte der Hauptträgheitsmomente stimmt mit der Spektralnorm Θ = sup {|Θv| : v ∈ V mit |v| ≤ 1} überein. (Siehe zB V2, § 21, sect 1.3 und 2.1, p 548-550 in [4].) Wegen #√ #2 √ ∗√ # # Sp (Θ) = Sp Θ Θ = # Θ# HS (Hilbert-Schmidt Norm-Quadrat) ist obiger Satz somit äquivalent zur Formel #√ #2 # # # Θ# ≥ 2 Θ . HS 1.3.8 *Trägheitstensor eines Ellipsoides Es wird nun der Trägheitstensor eines starr um sein Zentrum rotierenden Ellipsoides homogener Massendichte bestimmt. Als einfacherem Spezialfall wenden wir uns zunächst der Kugel mit konstanter Massendichte zu. Die Summenformel (1.19) für den Trägheitstensor überträgt sich auf eine Massenverteilung mit Dichtefunktion ρ : V → R≥0 wie folgt Θ= V ρ (x) |x|2 ιdV − x x, · dτ = 3M 4πR3 |x|<R |x|2 ιdV − x x, · dτ . Hier bezeichnet R > 0 den Radius und M > 0 die Gesamtmasse der Kugel. Das metrische Volumselement in V zu ·, · ist mit dτ notiert. Wir zeigen nun, dass 2 Θ = M R2 · ιdV (1.20) 5 gilt. Gleichung (1.20) ist - man beachte die Polarisierungsformel quadratischer Formen - äquivalent zu v, Θv = (2/5) M R2 · |v|2 für alle v ∈ V. Berechnen wir also v, Θv für ein beliebiges v ∈ V. Es gilt v, Θv = 20 3M 4πR3 |x|<R |x|2 |v|2 − x, v 2 dτ . Dies erinnert an die CHSH-Ungleichungen. Gibt es tatsächlich einen tieferen mathematischen Zusammenhang? KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 50 Unter Verwendung von Kugelkoordinaten (r, θ, ϕ) mit r (x) = |x| und x, v = |x| |v| cos θ (x) folgt mit der Substitution z = cos θ v, Θv = 3M |v|2 2π = 4πR3 3M |v|2 4πR3 R 0 −1 π 2π 0 r2 1 − cos2 θ r2 sin θdϕdθdr 0 3M |v|2 R5 1 1 − z 2 (−1) dz = 1 − z 2 dz 3 2R 5 0 1 −1 , 2 2 2 2 3 ,1 z , 2M R2 2 3M |v| R 3M |v| R 2 = 2 z− = = |v| . 2 5 3 ,0 5 3 5 R r4 dr Damit ist Gleichung (1.20) bewiesen. Ein Ellipsoid in V wird mithilfe einer positiven quadratischen Form q beschrieben. Das Ellipsoid ist dann die Punktmenge {x ∈ V : q (x) ≤ 1} . Zu einer quadratischen Form q : V → R existiert genau eine symmetrische lineare Abbildung Q : V → V mit q (x) = x, Qx für alle x ∈ V. Ein Ellipsoid, dessen Halbachsen die Längen R1 , R2 , R3 ∈ R>0 und die Richtungseinheitsvektoren e1 , e2 , e3 besitzen, hat die quadratische Form q mit 3 1 2 xi Ri 3 q x e1 + x e2 + x e3 = i=1 2 für alle x1 , x2 , x3 ∈ R3 . Die zugehörige lineare Abbildung Q ist somit durch 3 Q= i=1 Ri−2 ei ei , · (1.21) gegeben. Sie ist positiv definit, und erfüllt Qei = Ri−2 ei . Die zu Q inverse Abbildung erfüllt Q−1 = 3i=1 Ri2 ei ei , · . Lemma 31 Sei Q wie in Gleichung (1.21). Das Ellipsoid {x ∈ V : x, Qx ≤ 1} hat dann das (zum Skalarprodukt ·, · gehörige) Volumen VQ = 4πR1 R2 R3 /3. Beweis. Das Volumen ist definiert durch VQ = dx1 dx2 dx3 . dτ = q(x)≤1 q(x)≤1 Mit der Substitution xi = Ri ξ i und der Definition ξ = dξ 1 dξ 2 dξ 3 = VQ = R1 R2 R3 |ξ|≤1 3 i=1 ξ i ei folgt 4π R1 R2 R3 . 3 Satz 32 Sei Q wie in Gleichung (1.21). Der Trägheitstensor Θ eines Ellipsoides {x ∈ V : x, Qx ≤ 1} der Masse M und homogener Massendichte erfüllt M Sp Q−1 · ιdV − Q−1 5 M R22 + R32 e1 e1 , · + R12 + R32 e2 e2 , · + R12 + R22 e3 e3 , · . = 5 Θ = KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 51 Beweis. Die Massendichte ist gegeben durch ρ = M/VQ im Bereich x, Qx ≤ 1 und ρ = 0 für x, Qx > 1. Die Definition von Θ spezialisiert sich somit auf Θ= M VQ q(x)≤1 |x|2 ιdV − x x, · dτ . Wir zeigen zunächst, dass ei , Θej = 0 für i = j. Dies ergibt sich aus der Antisymmetrie des Integranden unter der Spiegelung Πi mit Πei = −ei und Πej = ej für j = i wegen M xi xj dx1 dx2 dx3 = 0. ei , Θej = − VQ q(x)≤1 Damit ist klar, dass die Vektoren ei in Richtung der Halbachsen des Ellipsoides Eigenvektoren des Trägheitstensors Θ des Ellipsoides sind. Wir bestimmen nun die Eigenwerte von Θ, die Hauptträgheitsmomente. Es gilt ei , Θei = M VQ q(x)≤1 |x|2 − xi 2 dτ = M VQ 3 xj 3 i=1 3 ei , Θei = 3 Rj2 = j=1,j=i * M R1 R2 R3 Rj2 VQ j=1,j=i 3M 4π ξ j 2 1 ξj ξ i ei folgt 2 dξ 1 dξ 2 dξ 3 |ξ|≤1 2 dξ dξ dξ |ξ|≤1 dx1 dx2 dx3 . q(x)≤1 j=1,j=i Mit der Substitution xi = Ri ξ i und der Definition ξ = Θii ≡ 2 3 + . Der Ausdruck in der eckigen Klammer ist unabhängig von den Parametern R1 , R2 und R3 und konstant in j. Daher folgt * + 3 3M 1 2 1 2 3 Θii = ξ dξ dξ dξ Rj2 . 4π |ξ|≤1 j=1,j=i Spezialisierung dieser Formel auf den Fall R1 = R2 = R3 = R ergibt * + 3M 1 2 1 2 3 Θii = ξ dξ dξ dξ 2R2 . 4π |ξ|≤1 In diesem Fall wissen wir aber vom Trägheitstensor der Kugel vom Radius R, dass Θii = (M/5) 2R2 . Somit folgt, dass der Ausdruck in der eckigen Klammer den Wert M/5 hat. Damit ist gezeigt, dass für alle R1 , R2 , R3 ∈ R>0 M Θii = 5 Daraus folgt nun Θ = M = 5 3 Rj2 = j=1,j=i 3 i=1 M Sp Q−1 − Ri2 . 5 Θii ei ei , · = 3 −1 Sp Q · ιdV − i=1 Ri2 ei ei , · = M Sp Q−1 · ιdV − Q−1 . 5 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1.3.9 52 *Kraftbedarf von Drehbewegungen Ein Beispiel für den Nutzen von Drehungen und Winkelgeschwindigkeit liefert das Studium von Bewegungkurven γ : I → V, deren zeitabhängige Zerlegung nach einer rotierenden Basis von V einfacher als die Zerlegung nach einer fest gewählten Basis, ja vielleicht sogar konstant ist. Sei zunächst γ 0 : I → V mit dim V = 3 eine zwei mal differenzierbare Kurve. Soll ein (kleiner) Gegenstand der Masse m seinen Ort gemäß der Kurve γ 0 im Laufe der Zeit verändernen, dann ist auf diesen Gegenstand zur Zeit t die Kraft mγ̈ 0 (t) auszuüben.21 Nun kann die Hilfskurve γ 0 unserer Konstruktion in eine gleichförmige Drehbewegung mit der Winkelgeschwindigkeit Ω = ωn versetzt werden, dh die aus zwei Abbildungen zusammengestzte Kurve γ : I → V mit γ (t) = eωtLn γ 0 (t) wird gebildet. Welche Kraft muss auf einen Massenpunkt einwirken, damit er der modifizierten Kurve γ folgt? Solche Fragen tauchen auf, wenn man einen Gegenstand auf einer fest mit einer rotierenden Scheibe verbundenen geraden Schiene von der Peripherie ins Zentrum bewegen will. Welche Kraft muss die Schiene ausüben können und mit welcher Kraft ist zu schieben? Eine ganz ähnliche Frage ist die: Bewegt man sich auf einem Erdmeridian nach Norden und überstreicht in gleichen Zeiten gleichlange Meridianstücke benötigt man welche Kraft? Würde die Erde nicht rotieren, bräuchte man keine Kraft aufzuwenden. Durch Ableiten von γ (t) = eωtLn γ 0 (t) folgt γ̇ (t) = ωLn γ (t) + eωtLn γ̇ 0 (t) und γ̈ (t) = ωLn γ̇ (t) + ωLn eωtLn γ̇ 0 (t) + eωtLn γ̈ 0 (t) = ωLn ωLn γ (t) + 2eωtLn γ̇ 0 (t) + eωtLn γ̈ 0 (t) = ω 2 L2n γ (t) + 2ωLn eωtLn γ̇ 0 (t) + eωtLn γ̈ 0 (t) = eωtLn −ω 2 Pn′ γ 0 (t) + 2ω (n × γ̇ 0 (t)) + γ̈ 0 (t) . Die zum ersten Summanden gehörige Kraft −mω 2 Pn′ γ (t) heißt Zentripetalkraft. Sie ist der Komponente Pn′ γ (t) des momentanen Ortsvektors γ (t) , die senkrecht zur Drehachse steht, entgegengerichtet und ihr Betrag ist proportional ω 2 . Die zum zweiten Summanden gehörige Kraft 2mΩ × eωtLn γ̇ 0 (t) ist unabhängig vom Ort aber linear in Geschwindigkeit γ̇ (t) und Winkelgeschwindigkeit Ω. Beide Kräfte sind zur Zeit t zusätzlich zur gedrehten Kraft eωtLn γ̈ 0 (t) der Trajektorie γ 0 aufzubringen, um das Teilchen zu einer Bewegung gemäß γ zu zwingen. Das einfachste Beispiel bietet die kräftefreie Kurve γ 0 : R → V mit γ 0 (t) = x für ein festes x ∈ V und für alle t ∈ R. Dann folgt für γ : R → V mit γ (t) = eωtLn x im Fall von x ∈ n⊥ mγ̈ (t) = −mω 2 γ (t) . 21 V ist also eine mathematische Präzisierung von Newtons absolutem, ruhendem Raum, der für eine begrifflich möglichst reduzierte Formulierung der Mechanik eigentlich entbehrlich ist. Er wird aber als metaphysische Krücke eines ausgezeichneten inertialen ’Weltenruhsystems’, immer noch in elementaren Erläuterungen (meist unausgesprochen) genutzt, weil er eine einfachere Formulierung der mechanischen Grundgesetze erlaubt. Die moderne Mechanik ist auf einer Raumzeit mit Zeitform, Riemannscher Metrik auf den instantanen Räumen und Affinzusammenhang, aber ohne ausgezeichnetem Inertialsystem errichtet. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 53 Um ein Teilchen der Masse m auf einer Kreisbahn vom Radius |x| mit konstanter Winkelgeschwindigkeit ω umlaufen zu lassen, ist also eine Kraft vom (zeitlich konstanten) Betrag |mω 2 γ (t)| = mω 2 |x| auf das Teilchen auszuüben. Etwas interessanter ist die kräftefreie Kurve γ 0 : R → V mit γ 0 (t) = tv für ein festes v ∈ V und für alle t ∈ R. Dann folgt für γ : R → V mit γ (t) = teωtLn v im Fall von v ∈ n⊥ mγ̈ (t) = m −ω 2 t + 2ωLn eωtLn v. 1.3.10 *Coriolis- und Zentrifugalkraft Manchmal bietet es sich an, eine Kurve γ 0 , die den Zeitablauf einer Bewegung in V beschreibt, nach einer rotierenden Basis von V zu zerlegen. Dann gibt die zeitliche Änderung der Koordinaten von γ 0 (t) bezüglich der zeitabhängigen Basis ein trügerisches Bild der tatsächlich vorliegenden Kräfte, die γ 0 erzeugen. Werden nämlich beim Ableiten von γ 0 nur die Koordinaten nicht aber die Basisvektoren differenziert, dann erscheint sogar eine konstante Kurve γ 0 als relativ zur rotierenden Basis beschleunigt. Die so identifizierten ’Kräfte’ werden als Scheinkräfte bezeichnet. Um das etwas detaillierter darzulegen, zerlegen wir eine C 2 -Kurve γ 0 : I → V nach einer (hier der Einfachheit halber) gleichförmig rotierende Basis von V. Sei also e = (e1 , e2 , e3 ) eine Basis von V und R (t) = eωtLn . Dann ist auch f (t) = (R (t) e1 , R (t) e2 , R (t) e3 ) eine Basis von V. Die Koordinaten von γ 0 (t) zur gedrehten Basis f (t) sind dieselben wie jene von γ (t) := R (t)−1 γ 0 (t) = e−ωtLn γ 0 (t) zur konstanten Basis e. Die Geschwindigkeit dieser Hilfskurve γ zur Zeit t, also γ̇ (t) = −ωn × γ (t) + e−ωtLn γ̇ 0 (t) wird als Geschwindigkeit von γ 0 zur Zeit t relativ zur rotierenden Basis f (t) aufgefasst. Die Beschleunigung γ̈ (t) der Krurve γ : I → V mit t → γ (t) zur Zeit t wird demgemäß als ’Beschleunigung’ und mγ̈ (t) als ’Scheinkraft’ von γ 0 zur Zeit t relativ zur rotierenden Basis f (t) zum Zeitpunkt t gedeutet. Berechnung der Realtivbeschleunigung γ̈ (t) : Es gilt wie im vorigen Abschnitt nach Ersetzung von n durch −n γ̈ (t) = −ω 2 Pn′ γ (t) − 2ωLn e−ωtLn γ̇ 0 (t) + e−ωtLn γ̈ 0 (t) . Ersetzen von e−ωtLn γ̇ 0 (t) durch γ̇ (t) + ωLn γ (t) ergibt γ̈ (t) = −ω 2 Pn′ γ (t) − 2ωLn (γ̇ (t) + ωLn γ (t)) + e−ωtLn γ̈ 0 (t) = ω 2 Pn′ γ (t) − 2ωLn γ̇ (t) + e−ωtLn γ̈ 0 (t) . Erfüllt γ 0 die Newtonsche Bewegungsgleichung γ̈ 0 (t) = f (|γ 0 (t)|) · γ 0 (t) eines Zentralkraftproblems für eine stetige Funktion f : R≥0 → R, dann folgt mit |γ 0 (t)| = |γ (t)| die Bewegungsgleichung γ̈ (t) = f (|γ (t)|) + ω 2 Pn · γ (t) − 2ω (n × γ̇ (t)) (1.22) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 54 für die Kurve γ. Die radial von der Drehachse weg gerichtete Scheinkraft der Stärke mω 2 Pn γ (t) heißt Zentrifugalkraft. Sie ist verantwortlich dafür, dass eine am Erdboden befestigte Waage nicht das tatsächliche Gewicht des Wägegutes anzeigt. Die Scheinkraft −2mωn × γ̇ (t) wird als Corioliskraft bezeichnet. Sie bewirkt, dass eine auf der Nordhalbkugel nach Norden strömende Luftmasse dem Erdboden bei seiner nach Osten gerichteten Drehbewegung etwas vorauseilt, bei naiver Betrachtung somit als ostwärts beschleunigt erscheint.22 Ein Stein fällt vom Himmel23 Als Illustration eignet sich ein Stein, der aus h = 5 km Höhe über dem Äquator (reibungsfrei) zum Boden fällt. Am Beginn des Falls zur Zeit t = 0 ruhe der Stein relativ zur Erde. In welchem Abstand vom Fußpunkt unter dem Startpunkt des Steins schlägt dieser nach welcher Zeit auf? Der Erdmittelpunkt ruhe im Punkt 0 von V. Die Funktion f ist dann annähernd gegeben durch f (r) = −g/r, wobei g = 9, 81 m s−2 die Erdbeschleunigungskonstante ist. Die Kreisfrequenz der Erde hat den Wert ω = 2π/ (24 · 3600) = 7, 27 · 10−5 s−1 . Die Basis e sei eine ONB und so gewählt, dass die Kurve γ 0 die Vorgaben γ 0 (0) = (R + h) · e1 , und γ̇ 0 (0) = ω (R + h) · e2 erfüllt. Dabei ist R = 6378 km der Erdradius. Der Vektor R · e1 ist der Fußpunkt unter dem Stein am Beginn des Falls. Der Einheitsvektor n in Richtung der Erdachse zu rechtshändigem Drehsinn erfüllt n = e1 × e2 = e3 . Rotiert die Basis f (t) mit der Erde und erfüllt f (0) = e, dann gilt für die Hilfskurve γ, dass γ (0) = γ 0 (0) = (R + h) e1 und γ̇ (0) = −ωn × γ (0) + γ̇ 0 (t) = −ω (R + h) e3 × e1 + ω (R + h) · e2 = 0, sowie γ̈ (t) = −g |γ (t)|−1 + ω 2 Pn · γ (t) − 2ω (n × γ̇ (t)) . (1.23) Die Drehsymmetrie der Differentialgleichung um die Achse R · e3 legt zusammen mit den in der Ebene R · e1 + R · e2 liegenden Anfangswerten den Lösungsansatz γ (t) = (R + x (t)) · e1 + y (t) · e2 = R · e1 + ξ (t) nahe. Einsetzen in Gleichung (1.23) ergibt ξ̈ (t) = ω 2 − g |R · e1 + ξ (t)|−1 (R · e1 + ξ (t)) − 2ωn × ξ̇ (t) mit der Anfangsvorgabe ξ (0) = he1 und ξ̇ (0) = γ̇ (0) = 0. Ohne Fehlerabschätzung wird nun - nicht ganz unplausibel - approximiert: ω 2 − g/ |R · e1 + ξ (t)| (R · e1 + ξ (t)) ≈ −g · e1 . Dies führt auf das inhomogen lineare System 2. Ordnung ξ̈ (t) = −g · e1 − 2ωn × ξ̇ (t) . 22 (1.24) Ein weiteres Beispiel liefert ein rotierender Kran, dessen Last längs des Kranarmes verschoben wird. Bei einer Bewegung nach innen eilt die Last der Drehbewegung des Kranarms voraus, bei einer Verschiebung nach außen hingegen hinkt sie hingegen der Drehung nach. 23 Aufgabe 1 zu § 39 in L D Landau, E M Lifschitz, Mechanik, Vieweg, Braunschweig, 1970 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 55 Die komponentenweise Form von Gleichung (1.24) für ξ (t) = x (t) · e1 + y (t) · e2 ist (ẍ (t) , ÿ (t)) = (−g, 0) + 2ω (ẏ (t) , −ẋ (t)) . Man beachte, dass ω 2 = 5, 3 · 10−9 s−2 ≪ g/R = 1, 5 · 10−6 s−2 gilt, und überprüft später an der Lösung die Vermutung, dass x2 (t) + y 2 (t) ≪ R2 zu allen Zeiten t > 0 bis zum Aufschlag erfüllt ist. Die Anfangsvorgabe ist x (0) = h, y (0) = 0, ẋ (0) = 0, ẏ (0) = 0. Im Abschnitt über die E × B-Drift wird das inhomogen lineare System v̇ (t) = −g · e1 − 2ωn × v (t) , (1.25) das sich aus (1.24) mit v = ξ̇ ergibt, exakt gelöst. Vorläufig wird das Problem durch eine nochmalige plausible Approximation vereinfacht, nämlich zu (ẍ (t) , ÿ (t)) = − (g, 2ω ẋ (t)) . (1.26) Die Lösung von Gleichung (1.26) mit x (0) = h, ẋ (0) = 0, y (0) = 0, ẏ (0) = 0 erfüllt x (t) , y (t) = h − gt2 /2, ωgt3 /3 für alle t > 0. Der Stein erreicht den Erdboden genau zu jener Zeit t > 0, wenn (R + x (t))2 + y (t)2 = R2 gilt. Annähernd ist dies die Zeit T, zu der x (T ) = 0 gilt. Es folgt T = 2h/g = 32 s und y (T ) = ωgT 3 /3 = (2hω/3) 2h/g = 7, 7 m. Der Stein schlägt also in dieser unkontrollierten Approximation 7, 7 m östlich des Abwurffußpunkts nach 32 s auf. 1.3.11 Inhomogen lineare Systeme Nun zum Fall der inhomogen linearen Systeme. Ähnlich wie im eindimensionalen Fall genügt für die Lösung eines inhomogen linearen Systems die Kenntnis von LA,0 und einer einzigen („partikulären”) Lösung des inhomogenen Systems γ̇ = Aγ + b. Genaueres sagt der folgende Satz. Satz 33 Sei γ̇(t) = A(t)γ(t) + b(t) ein inhomogen lineares System auf einem Intervall I und einem n-dimensionalen K-VR V. Sei LA,b die Menge aller maximalen Lösungen dieses Sytems und sei γ b : I → V ein beliebiges Element von LA,b . Dann gilt LA,b = LA,0 + γ b . Eine weitergehende Lösungsformel für das Anfangswertproblem gibt die folgende Variation der Konstantenformel. Satz 34 Sei γ̇(t) = A(t)γ(t) + b(t) ein inhomogen lineares System auf einem Intervall I und einem n-dimensionalen K-VR V . Die Evolutionsabbildung des homogenen Systems γ̇(t) = A(t)γ(t) zur Anfangszeit t0 ∈ I sei t → Ut,t0 für t ∈ I. Dann gilt für die maximale Lösung γ t0 ,v des inhomogen linearen Systems zum Anfangswert (t0 , v) für jedes t ∈ I t γ t0 ,v (t) = Ut,t0 v + t0 −1 Uξ,t b (ξ) dξ . 0 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 56 Beweis. Es genügt zu zeigen, dass die Kurve γ : I → V mit t γ (t) = Ut,t0 v + t0 −1 Uξ,t b (ξ) dξ 0 die 1) Differentialgleichung γ̇(t) = A(t)γ(t) + b(t) für alle t ∈ I und 2) die Anfangsbedingung γ (t0 ) = v erfüllt. Aufgrund des Eindeutigkeitssatzes folgt dann γ = γ t0 ,v . Sei γ 0 : I → V mit γ 0 (t) = Ut,t0 v. Dann gilt nach Konstruktion von Ut,t0 , dass γ̇ 0 (t) = A (t) γ 0 (t) und γ 0 (t0 ) = v. Es genügt also zu zeigen, dass die Kurve γ p : I → V mit t γ p (t) = γ (t) − γ 0 (t) = Ut,t0 −1 Uξ,t b (ξ) dξ 0 t0 die inhomogene Gleichung γ̇ p (t) = A(t)γ p (t) + b(t) für alle t ∈ I erfüllt und zudem γ p (t0 ) = 0. Ersteres folgt mit Produktregel und Hauptsatz der Integralrechnung so: t γ̇ p (t) = (∂t Ut,t0 ) t0 t −1 Uξ,t b (ξ) dξ 0 + Ut,t0 ∂t t0 −1 Uξ,t b (ξ) dξ 0 t = (A (t) Ut,t0 ) t0 −1 −1 Uξ,t b (ξ) dξ + Ut,t0 Ut,t b (t) = A (t) γ p (t) + b (t) . 0 0 Die Anfangsbedingung γ p (t0 ) = 0 ergibt sich wegen t0 γ p (t0 ) = Ut0 ,t0 t0 −1 Uξ,t b (ξ) dξ = ιd (0) = 0. 0 −1 Bemerkung 35 Es gilt Ut,t0 Uξ,t = Ut,ξ und daher auch 0 t γ t0 ,v (t) = Ut,t0 v + Ut,ξ b (ξ) dξ. t0 Die partikuläre Lösung γ t0 ,0 mit dem Anfangswert (t0 , 0), für die ja t γ t0 ,0 (t) = Ut,ξ b (ξ) dξ t0 für alle t ∈ I gilt, erhält eine besonders anschauliche Bedeutung, wenn das Integral durch eine Riemannsumme approximiert wird. Die Inhomogenität b(ξ i ) an den Stützstellen t0 < ξ i < t tritt als Anfangswert (ξ i , b(ξ i )) der Lösung Ut,ξi b (ξ i ) der homogenen Gleichung in Erscheinung. Über diese homogenen Lösungen wird dann aufsummiert. Wie im eindimensionalen Fall hängt γ t0 ,0 linear von b ab. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1.3.12 57 *E × B - Drift einer Punktladung Sei V ein reeller Vektorraum der Dimension 3. In V sind ein Skalarprodukt ·, · und eine Orientierung gewählt. Damit ist auch das Kreuzprodukt zweier Vektoren von V erklärt. Die Kurve γ : I → V (’Bewegungsgeschichte’) eines elektrisch geladenen Massenpunktes in einem (räumlich und zeitlich) konstanten elektromagnetischen Feld ist durch die Lorentzsche Bewegungsgleichung mγ̈ (t) = q (E + γ̇ (t) × B) . (1.27) geregelt. In ihr bezeichnet m ∈ R>0 die Masse und q ∈ R die elektrische Ladung des Teilchens. Die Vektoren E ∈ V und B ∈ V bezeichnen die (konstante) elektrische Feldstärke und die (konstante) magnetische Flussdichte, denen das Teilchen ausgesetzt ist. Gesucht ist die maximale Lösung von Gleichung (1.27) zur Anfangsvorgabe γ (0) = x0 und γ̇ (0) = v0 . Zerlegt man für B = 0 die Kurve γ in eine Komponente γ ⊥ im Unterraum B ⊥ = {v ∈ V : B, v = 0} und eine Komponente γ in R · B, dann gilt unter Verwendung des Einheitsvektors n = B/ |B| γ = γ ⊥ + γ mit γ = n n, γ und γ ⊥ = γ − n n, γ . Die Bewegungsgleichung (1.27) entkoppelt die beiden Komponenten voneinander, denn es gilt wegen n × B = 0 mγ̈ ⊥ (t) = q γ̇ ⊥ (t) × B + E ⊥ und mγ̈ (t) = qE . Dabei gilt E = E ⊥ + E mit E = n n, E und E ⊥ = E − n n, E . Die maximale Lösung γ : R → R·B der Gleichung mγ̈ (t) = qE mit γ (0) = x0 und γ̇ (0) = v0 erfüllt q 2 γ (t) = x0 + v0 t + tE . 2m Die Anfangswerte x0 und v0 werden dabei natürlich einer analogen Zerlegung wie γ unterworfen. Für die Komponente γ ⊥ gilt mit24 ω = q |B| /m ∈ R γ̈ ⊥ (t) = −ωn × γ̇ ⊥ (t) + q ⊥ E . m (1.28) Die Kurve v = γ̇ ⊥ : R → B ⊥ ⊂ V erfüllt also mit Ln : B ⊥ → B⊥ , v → n × v und E = mq E ⊥ ∈ B ⊥ das inhomogen lineare System erster Ordnung v̇ (t) = −ωLn v (t) + E. (1.29) Für die Evolutionsabbildung Ut = exp (−ωtLn) der homogenen Gleichung gilt wegen25 L2n = −PB⊥ = − (ιdV − n n, · ) e−ωtLn = n n, · + cos (ωt) (ιdV − n n, · ) − sin (ωt) Ln . 24 25 Die Zahl |ω| = |qB| /m heißt ’Zyklotronkreisfrequenz’. PB⊥ bezeichnet die Orthogonalprojektion auf den Untervektorraum B⊥ . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 58 Mit v0⊥ ∈ B⊥ folgt daraus Ut v0⊥ = cos (ωt) v0⊥ − sin (ωt) Ln v0⊥ . Sie beschreibt eine Drehbewegung des Vektors v0⊥ um 0 in der Ebene B⊥ mit konstanter Winkelgeschwindigkeit ω. Der Drehsinn ist so, dass zur Zeit t = 0 der Vektor v0⊥ in die Richtung −Ln v0 = −n × v0⊥ bewegt. Eine partikuläre Lösung der inhomogenen Gleichung (1.29) ergibt sich mit dem Ansatz v (t) = w ∈ B⊥ für alle t ∈ R. Dieser Ansatz ist genau dann Lösung, wenn ωLn w = E gilt. Anwendung von Ln auf diese Gleichung liefert ωL2n w = Ln E, also w=− n×E q Ln E q E⊥ × B =− =− n × E⊥ = E⊥ × B = . ω ω mω mω |B| |B|2 Die Geschwindigkeit vD := − Ln E E⊥ × B E×B ⊥ = = 2 2 ∈ B ω |B| |B| wird im folgenden wiederholt vorkommen und erhält deshalb eine eigene Bezeichnung, nämlich ’Driftgeschwindigkeit’ vD . Sie ist jene Geschwindigkeit in B⊥ , die von den vorgegebenen Feldern E und B nicht verändert wird. Die Komponente der Lorentzkraft im Unterraum B⊥ verschwindet. Warum sie Driftgeschwindigkeit genannt wird, wird gleich klar werden. Die maximale Lösung v von Gleichung (1.29) mit Anfangswert v0⊥ ∈ B⊥ ergibt sich durch Addition einer Lösung der homogenen Gleichung zu v (t) = vD + Ut v0⊥ − vD . Die Geschwindigkeit v rotiert also auf einem Kreis in B⊥ um den Mittelpunkt vD mit konstanter Winkelgeschwindigkeit |ω| = |qB| /m. Der Radius des, Kreises ist , der Betrag der Abweichung der Anfangsgeschwindigkeit v0⊥ von vD , also ,v0⊥ − vD , . Der Drehsinn ist so, dass sich zur Zeit 0 der Vektor v0⊥ − vD in die Richtung des Vektors −ωLn v0⊥ − vD = mq v0⊥ − vD × B dreht. ⊥ Für die maximale Lösung γ ⊥ von Gleichung (1.28) mit γ ⊥ (0) = x⊥ 0 und γ̇ (0) = v0⊥ folgt also für alle t ∈ R t γ ⊥ (t) − x⊥ 0 = t 0 t Us v0⊥ − vD + vD ds = v (s) ds = 0 d Unter Beachtung von ds Us v0⊥ − vD ⊥ v0 − vD und [Us , Ln ] = 0 folgt nun t 0 0 = −ωLn Us v0⊥ − vD , −L2n v0⊥ − vD t Us v0⊥ − vD ds = − t = Ln 0 0 Us v0⊥ − vD ds + tvD = t Us L2n v0⊥ − vD ds = −Ln 0 Ln Us v0⊥ − vD ds 1 d Ln ⊥ Ln Us v0⊥ − vD ds = (Ut − ιd) v0⊥ − vD = (Ut − ιd) v − vD . ω ds ω ω 0 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 59 Somit gilt wegen Ln vD = −L2n E/ω = E/ω = qE ⊥ / (mω) = E ⊥ / |B| Ln ⊥ n × v0⊥ E⊥ v0 − vD = − . ω ω ω |B| Mit der Abkürzung ξ = E ⊥ / (ω |B|) = mE ⊥ / q |B|2 gilt daher für alle t ∈ R γ ⊥ (t) = (Ut − ιd) n × v0⊥ −ξ ω + tvD + x⊥ 0. (1.30) Die Lösungsformel (1.30) überlagert eine gleichförmige Drehbewegung des Vektors n × v0⊥ /ω − ξ mit einer gleichförmige Translationsbewegung auf der Geraden R · E × B. Die Kurve t → (Ut − ιd) w dreht den Vektor w um den Punkt −w. Sie durchläuft einen Kreis mit dem Radius |w| und geht zur Zeit t = 0 durch 0. Die Kurve t → tvD beschreibt eine unbeschränkte, gleichförmige Bewegung auf der Geraden R · E × B. Daher der Name E × B-Drift für die Bewegung eines geladenen Teilchens in einem statischen und homogenen elektromagnetischen Feld mit E × B = 0. Die Driftgeschwindigkeit vD ist unabhängig von Betrag und Vorzeichen der Ladung q! Spezialisierung auf den Fall n = B/ |B| = e3 , v0 /ω = λe1 und ξ = E ⊥ / (ω |B|) = µe2 für eine positiv orientierte ONB e = (e1 , e2 , e3 ) von V ergibt γ ⊥ (t) − x⊥ 0 = (1 − cos (ωt)) (µe2 − e3 × λe1 ) + sin (ωt) e3 × (µe2 − e3 × λe1 ) + ωt (µe2 × e3 ) = (1 − cos (ωt)) (µ − λ) e2 + sin (ωt) (µ + λ) e1 + ωtµe1 = (µ − λ) (1 − cos (ωt)) e2 + ((µ + λ) sin (ωt) + µωt) e1 , also etwas übersichtlicher γ ⊥ (t) − x⊥ 0 = (e1 , e2 ) · (µ + λ) sin (ωt) + µωt (µ − λ) (1 − cos (ωt)) . Figur 1.19 zeigt einen Ausschnitt der Bahn von γ ⊥ − x⊥ 0 für λ = 1 und µ = 1/8 in rot, für λ = −1 und µ = 1/8 in grün, und für λ = 1 und µ = 0 in schwarz.Für y 2 1 0 -1 0 1 2 3 x -1 -2 Abbildung 1.19: γ ⊥ (0 < s < 6π) − x⊥ 0 für einige Parameterkombinationen KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 60 E ⊥ = 0 spezialisiert sich γ ⊥ wegen vD = 0 = ξ zu γ ⊥ (t) = (Ut − ιd) n × v0⊥ ω + x0 . ⊥ ⊥ ⊥ Die Kurve, γ ⊥ umkreist , , also , für E = 0 den Punkt x0 −n×v0 /ω (in der Ebene B ) im ⊥ ⊥ Abstand ,v0 /ω , = m ,v0 , / |qB| mit konstanter (orientierter) Winkelgeschwindigkeit ω = q |B| /m. Diese Komponente der Kurve γ ist somit periodisch. 1.3.13 Getriebene lineare Schwingungen: ungedämpft Der harmonische Oszillator mit äußerer Kraft ist wie die E × B -Drift ein Fall für die Variation der Konstanten. Wir behandeln ihn nun aber nicht als reell 2d inhomogen lineares System sondern als komplex 1-dimensionales. So wird’s noch einfacher. Zudem betrachen wir hier nur den reibungslosen Grenzfall. Sei ω ∈ R>0 , sei I ⊂ R ein Intervall und sei b : I → R stetig. Für x : I → R gelte x′′ + ω 2 x = b und x (t0 ) = x0 und x′ (t0 ) = v0 für ein t0 ∈ I. Dazu äquivalent ist die Kurve γ : I → C mit γ = x + ix′ /ω die maximale Lösung des komplex 1d Systems γ ′ = −iωγ + ib/ω auf I mit γ (t0 ) = x0 + iv0 /ω =: γ 0 . Es gilt ja γ ′ = x′ + i ′′ i i i x = x′ + b − ω 2 x = −iω x + x′ + b. ω ω ω ω Eine Lösung des homogenen Systems ist die Funktion t → exp (−iωt) auf I. Für die Lösung γ : I → C des inhomogenen Systems mit γ (t0 ) = γ 0 gilt für alle t ∈ I i t iω(ξ−t0 ) γ (t) = e γ0 + e b (ξ) dξ ω t0 ie−iωt t iωξ = e−iω(t−t0 ) γ 0 + e b (ξ) dξ. ω t0 −iω(t−t0 ) Daraus folgt durch Bildung des Realteils der folgende Satz. Satz 36 Sei I ein Intervall I ⊂ R und sei b : I → R stetig. Dann gilt für die maximale Lösung x von x′′ + ω 2 x = b zur Anfangsbedingung x(t0 ) = x0 und x′ (t0 ) = v0 für ein t0 ∈ I für alle t ∈ I x (t) = x0 cos (ω (t − t0 )) + v0 1 sin (ω (t − t0 )) + ω ω t t0 sin (ω (t − ξ)) b (ξ) dξ. (1.31) Beweis. Hier ein Beweis ohne Verwendung komplexer Zahlen. Für h : I → R mit v0 h(t) = x0 cos (ω (t − t0 )) + sin (ω (t − t0 )) ω KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 61 gilt offensichtlich h′′ + ω 2 h = 0. Also bleibt für die Funktion xb : I → R mit 1 xb (t) := ω t t0 sin(ω (t − ξ))b(ξ)dξ zu zeigen, dass x′′b + ω 2 xb = b. Wegen sin(α − β) = sin (α) cos (β) − cos (α) sin (β) gilt sin (ωt) t cos (ωt) t xb (t) = cos (ωξ) b(ξ)dξ − sin (ωξ) b(ξ)dξ. ω ω t0 t0 Dies wird mit der Produktregel und dem Hauptsatz der Integralrechnung zweimal differenziert. Es folgt x′′b + ω 2 xb = b. Analog sind die Anfangsbedingungen zu zeigen. Mit Gleichung (1.31) ist die Berechnung der Bewegung eines harmonischen Oszillators, der von einer beliebigen, stetig zeitabhängigen äußeren Kraft angetrieben wird, bei gegebener Anfangbedingung auf die Integration von sin(ω (t − ξ))b(ξ) über ξ zurückgeführt. Zur Illustration sei I = R, t0 = 0 und b (t) = b0 ωt für ein b0 ∈ R. Dann folgt 1 ω t 0 t sin (ω (t − ξ)) b (ξ) dξ = b0 Für alle t ∈ R gilt somit ξ sin (ω (t − ξ)) dξ * + t cos (ω (t − ξ)) d sin (ω (t − ξ)) +ξ dξ = b0 ω2 ω 0 dξ * + b0 sin (ωt) b0 t− = 2 [ωt − sin (ωt)] . = ω ω ω x (t) = x0 cos (ωt) + 0 v0 b0 − 2 ω ω sin (ωt) + b0 ωt. ω2 Nun noch ein paar Anmerkungen zu verschiedenen graphischen Veranschaulichungen von Lösungen eines Systems erster Ordnung. Abbildung (1.20) zeigt zwei Lösungen x für ω = 1 = b0 . Sie stellen die „Wann-wo-Protokolle” der Schwingungen eines Oszillators um die Gleichgewichtslösung ξ(t) = t der Schwingungsgleichung x′′ + x = t dar. Die „Wann-wie-schnell” Information ist dem Graphen von x nur indirekt über seinen Anstieg im Punkt über t zu entnehmen. Die Graphen verschiedener Lösungen x können einander schneiden, obwohl sich die Graphen der Lösungen γ selbst aufgrund des Eindeutigkeitssatzes nicht schneiden können. Abbildung (1.21) zeigt die Bahn einer Lösung γ in der komplexen Ebene. Sie wird von links nach rechts durchlaufen. Die Bahn der Lösung gibt ein „Wo-wieschnell Protokoll”. Beim Durchlaufen der etwas überraschenden Spitzen26 bei y = 0 gilt γ̇ = 0. Dem Bild ist jedoch nicht zu entnehmen, wann die Lösung γ einen bestimmten Punkt des Graphen durchläuft. Abbildung (1.22) zeigt eine Bahn, die kein Funktionsgraph ist. (Es ist natürlich auch gar nicht zu erwarten, dass eine Projektion eines Funktionsgraphen wieder ein Funktionsgraph ist.) 26 Obwohl γ differenzierbar ist, kann die Bahn von γ einen derart „nichtdifferenzierbaren” Eindruck machen. Das geht, da in den Spitzen die Geschwindigkeit gleich Null ist. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN x 62 15 10 5 0 -15 -10 -5 0 5 10 15 -5 t -10 -15 Abbildung 1.20: x für x0 = 0, v0 = 0 (schwarz) und für x0 = 3, v0 = 1 (rot) y 2 1.5 1 0.5 0 -10 -5 0 5 10 x Abbildung 1.21: Die Bahn von γ zu x0 = v0 = 0 Die gesamte Information über eine Lösung γ schließlich ist im Graphen von γ enthalten. Abbildung (1.23) zeigt den Graphen einer Lösung γ (mit vertikaler tAchse). Liegt ein Punkt (x, y, t) am Graphen, dann hat der Oszillator zur Zeit t den Ort x und die Geschwindigkeit y. Die Graphen verschiedener Lösungen können einander aufgrund des Eindeutigkeitssatzes (für inhomogen lineare Systeme) nicht schneiden. 1.3.14 *Der mechanische Fourieranalysator 1 Sei b : R → R stetig mit b(t) = 0 für alle t ∈ / [0, T ] für ein genügend großes T > 0. Sei x die maximale Lösung von x′′ + ω 2 x = b mit x(t0 ) = x′ (t0 ) = 0 für ein t0 ≤ 0. Für alle t ∈ R gilt somit γ (t) := x (t) + i ′ i x (t) = e−iωt ω ω t eiωξ b (ξ) dξ. 0 T Für t ≤ 0 folgt daraus γ(t) = 0 und für t > T folgt γ (t) = ωi e−iωt 0 eiωξ b (ξ) dξ. Nach Einwirkung der Kraft schwingt der Oszillator mit der Kreisfrequenz ω und der KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN y 63 3 2 1 0 -10 -5 0 5 10 x -1 Abbildung 1.22: Die Bahn von γ zu x0 = 0, y0 = −1 Abbildung 1.23: Der Graph von γ für x0 = 0, y0 = −2. , , , 1 T iωt , T Amplitude A = , ω 0 e b (t) dt, . Für A > 0 ist durch ω1 0 eiωt b (t) dt = Aeiδ eine Phase δ ∈ [0, 2π) eindeutig festgelegt. Es gilt dann x (t) = A sin (ωt − δ) .27 Die Geschwindigkeit x′ schwingt für t > T mit der Amplitude ωA. Die Energie E dieser Schwingung ist zeitlich konstant. Zu den Zeiten mit Auslenkung 0 besteht sie nur aus dem kinetischen Teil. x′ hat zu diesen Zeiten den Betrag ωA. Es gilt daher , ,2 , ,2 , , (ωA)2 m ,, T iωt 1 ,, T iωt , E=m = , e b (t) dt, = e f (t) dt,, , , 2 2 2m 0 0 27 In einem Fourieranalysator wirkt die Inhomogenität b auf n Oszillatoren der Eigenfrequenzen ω 1 , . . . ωn ein und versetzt diese in Schwingung. Aus den Amplituden und Phasen von γ 1 , . . . γ n im Bereich t > T ergeben sich die n komplexen Zahlen T eiωk t b (t) dt. bk = 0 Im Kapitel über Fourierreihen werden wir lernen, wie die Funktion b aus den b1 , . . . bn (annähernd) berechnet werden kann, wenn die Frequenzen ω1 , . . . ω n geschickt gewählt sind. So ist es möglich, eine rasch veränderliche Größe b durch Ankopplung an hochfrequente Resonatoren zu vermessen. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 64 wobei f = mb die auf den Oszillator der Masse m einwirkende Kraftfunktion ist. 1.3.15 Die retardierte Lösung von ẍ + ω 2x = b Die Lösungsformel aus Satz 36 setzt sich aus zwei Anteilen zusammen. Einerseits aus der Lösung h (t) = x0 cos (ω (t − t0 )) + v0 sin (ω (t − t0 )) ω der homogenen Gleichung. Sie ist durch die Anfangsvorgabe (x0 , v0 ) zur Zeit t0 eindeutig festgelegt. Andererseits enthält die Lösungsformel die partikuläre Lösung xb (t) = 1 ω t t0 sin (ω (t − ξ)) b (ξ) dξ der inhomogenen Gleichung. Für eine Inhomogenität b, die in einer genügend fernen Vergangenheit verschwindet, hängt xb nicht vom genauen Wert der Anfangszeit t0 ab, wenn dieser nur in dieser fernen Vergangenheit liegt. Warum ist das so? Sei also b so, dass ein T ∈ R existiert, dass b (t) = 0 für alle t < T. Weiter sei t0 < T. Sei Θ Heavisides Stufenfunktion, d.h. es gilt Θ(t) = 0 für t < 0 und Θ(t) = 1 für t ≥ 0. Damit folgt für alle t ∈ R xb (t) = 1 ω t −∞ sin (ω (t − ξ)) b (ξ) dξ = 1 ω ∞ −∞ Θ (t − ξ) sin (ω (t − ξ)) b (ξ) dξ. Definition 37 Die Funktion Gret : R → R mit Gret (t) = Θ (t) sin (ωt) /ω heißt retardierte Fundamentallösung oder auch retardierte Greensche Funktion zu ∂ 2 + ω 2 . Wir fassen zusammen: Satz 38 Sei b : R → R stetig und es gebe eine Konstante T ∈ R, sodass b(t) = 0 für alle t < T. Sei x die maximale Lösung von x′′ + ω 2 x = b mit x(t0 ) = x′ (t0 ) = 0 für ein t0 < T. Dann gilt x(t) = ∞ −∞ Θ(t − ξ) sin (ω(t − ξ)) b(ξ)dξ =: (Gret ∗ b) (t) ω für alle t ∈ R. (Die Funktion Gret ∗ b heißt Faltung von Gret mit b. Sie ist jene Lösung der inhomogenen Schwingungsgleichung, die vor dem Einsetzen der äußeren Kraft ruht.) Die Funktion Gret ist zwar stetig, aber bei 0 nicht differenzierbar. Auf den Intervallen x > 0 und x < 0 stimmt Gret mit Lösungen der homogenen Schwingungsgleichung überein. In 0 springt die Ableitung von Gret von 0 auf 1, sodass eine Differentialgleichung im bisher entwickelten Sinn für x = 0 nicht formulierbar ist. Gret ist also selbst keine Lösung der Schwingungsgleichung. In der Vorlesung Math. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 65 Meth. II wird klar werden, dass der Funktion Gret eine Lösung Gret einer distributionellen Differentialgleichung entspricht, die Diracs Delta-Distribution enthält. Es gilt G′′ret + ω 2 Gret = δ. Eine andere Fundamentallösung zur Schwingungsgleichung ist für alle t ∈ R durch Gav (t) = Gret (−t) = −Θ (−t) sin (ωt) /ω gegeben. Sie heißt avancierte Fundamentallösung. Für sie gilt Satz 39 Sei b : R → R stetig und es gebe eine Konstante T ∈ R, sodass b(t) = 0 für alle t > T. Sei x die maximale Lösung von x′′ + ω 2 x = b mit x(t0 ) = x′ (t0 ) = 0 für ein t0 > T. Dann gilt x(t) = (Gav ∗ b) (t) für alle t ∈ R. Beweis. Da b(ξ) = 0 für alle ξ > T, gilt auch b (ξ) = 0 für alle ξ > t0 . Daraus folgt mit Satz 36 t ∞ sin (ω (t − ξ)) sin (ω (t − ξ)) b(ξ)dξ = − b(ξ)dξ ω ω ∞ t ∞ ∞ sin (ω (t − ξ)) = − Θ(ξ − t) b(ξ)dξ = Gav (t − ξ)b(ξ)dξ. ω −∞ −∞ x(t) = Die Lösung Gav ∗ b ist jene getriebene Schwingung, die von der Quelle zum Stillstand gebracht wird. Die Differenz Gret − Gav ist eine Lösung der homogenen Schwingungsgleichung ′′ x + ω 2 x = 0, denn Gret (t) − Gav (t) = sin (ωt) /ω. Ferner ist (Gret − Gav ) ∗ b eine Lösung der homogenen Gleichung. Die Funktion 12 (Gret + Gav ) ∗ b hingegen ist Lösung von x′′ + ω 2 x = b. Sie gehört zur Fundamentallösung Gsym mit Gsym (t) = 1 1 sin (ω |t|) (Gret + Gav ) (t) = [Θ (t) sin (ωt) − Θ (−t) sin (ωt)] = . 2 2ω 2ω Feynman erkannte eine komplexwertige Fundamentallösung, nämlich GF mit i −iω|t| GF (t) = 2ω e als nützlich für die Beschreibung von Teilchenerzeugungsprozesi i sen. Es gilt GF (t) = 2ω [cos (ω |t|) − i sin (ω |t|)] = Gsym (t) + 2ω cos (ωt) . Schwingung nach einem Einheitskraftstoß Wir zeigen nun, dass Gret eine Näherung an eine Lösung der inhomogenen Schwingungsgleichung mit einem kurzzeitig wirkenden Kraftstoß mit (annähernd) EinheitsGeschwindigkeitsübertrag (δ-Stoß) ist. Gret approximiert jene Lösung, die vor dem Kraftstoß mit der Nulllösung übereinstimmt. Für ein τ ∈ R>0 gelte bτ (t) = 0 für alle t ∈ / [−τ , τ ] und bτ (t) = 1 τ 1− |t| τ KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 66 sonst. Daraus folgt limτ →0 bτ (t) = 0 für t = 0. Hingegen divergiert bτ (0) = 1/τ für τ → 0. Für alle τ > 0 gilt ∞ bτ (t) dt = 1. −∞ xτ sei die maximale Lösung von x′′ + ω 2 x = bτ mit xτ (t0 ) = 0 = x′τ (t0 ) für ein t0 < −τ . Konvergiert xτ (t) für τ → 0? Für t < −τ gilt xτ (t) = 0. Für alle t < 0 folgt daher limτ →0 xτ (t) = 0. Nun zur Berechnung von xτ (t) für t > τ nach Satz 36. Es gilt τ = 2 τω 2 τ ξ cos (ωξ) bτ (ξ) dξ = cos (ωξ) 1 − dξ τ 0 τ −τ * + 2 sin (ωτ ) 1 cos (ωξ) ξ sin (ωξ) τ − = + τ ω τ ω2 ω 0 * + 1 cos (ωτ ) − 1 2 sin (ωτ ) − + τ sin (ωτ ) = 2 2 [1 − cos (ωτ )] . τ ω τ ω Da bτ gerade ist, folgt τ −τ sin (ωξ) bτ (ξ) dξ = 0. Mit Satz 36 folgt für alle t > τ 2 sin (ωt) . 2 [1 − cos (ωτ )] ω (ωτ ) Für ωτ ∈ 2π · N schwingt der Oszillator nach der Einwirkung des Kraftstoßes also nicht nach. Die Schwingungsamplitude von xτ im Bereich t > τ wird von der (dimensionslosen) Funktion x → 2 (1 − cos x) /x2 für x > 0 bestimmt. Sie ist in Figur (1.24) für x = ωτ ∈ [0, 15] skizziert. xτ (t) = 1 0.75 0.5 0.25 0 0 2.5 5 7.5 10 12.5 15 Abbildung 1.24: 2 (1 − cos x) /x2 Wegen limx→0 x22 [1 − cos x] = 1 folgt limτ →0 xτ (t) = sin (ωt) /ω für alle t > 0. Für t = 0 gilt τ 1 0 1 ξ sin (ωξ) bτ (ξ) dξ = sin (ωξ) 1 − ω −τ ωτ 0 τ ωτ 1 u du → 0 für τ → 0. = sin (u) 1 − τ ω2 0 ωτ Damit gilt limτ →0 xτ (t) = Θ (t) sin (ωt) /ω = Gret (t) für alle t ∈ R. xτ (0) = − dξ KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1.4 67 Lineare Differentialgleichungen 2-ter Ordnung Einige einfache Differentialgleichungen zweiter Ordnung konnten wir schon als Systeme erster Ordnung behandeln. Wie etwa den getriebenen ungedämpften harmonischen Oszillator oder die ExB-Drift eines geladenen Teilchens. Wir sehen uns nun an, wie eine lineare (sakalare) Differentialgleichung beliebiger Ordnung in ein äquivalentes lineares System von Differentialgleichungen erster Ordnung übersetzt werden kann. Die Äquivalenz zeigt ihren Nutzen nicht so sehr beim Aufsuchen spezieller Lösungen. Vielmehr erlaubt sie eine einfache Übertragung von strukturellen Eigenschaften der Systeme erster Ordnung, wie Dimension des Lösungsraums, auf Gleichungen höherer Ordnung. Auch die Variation der Konstantenformel für Systeme erster Ordnung lässt sich so auf Gleichungen höherer Ordnung umlegen. 1.4.1 Äquivalenz zu System erster Ordnung Definition 40 Sei I ⊂ R ein allgemeines Intervall. Die Funktionen a0 , ..., an−1 , b : I → R seien stetig. Eine Funktion α : D ⊂ I → R auf einem Intervall D, mit dn α dn−1 α (x) + an−1 (x) n−1 (x) + ... + a0 (x)α(x) = b(x) dxn dx (1.32) für alle x ∈ D heißt Lösung der gewöhnlichen Differentialgleichung n-ter Ordnung di y (0) = y notiert. y (n) + an−1 y (n−1) + ... + a0 y (0) = b. Hier wird y (i) = dx i für i ∈ N und y Die Gleichung heißt inhomogen linear falls b = 0 und homogen linear falls b = 0. Beide Fälle werden als linear bezeichnet. Gilt für eine Lösung α und ein x0 ∈ D, dass α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = (c0 , c1 , ...cn−1 ) , sagt man, α sei eine Lösung zum Anfangswert (x0 ; c0 , c1 , ...cn−1 ) . Eine Lösung α : D → R heißt maximal, wenn keine Lösung β : D′ → R mit D ⊂ D′ (echt) existiert, sodass α mit β auf D übereinstimmt. Die Menge aller Lösungen von Gleichung (1.32) wird durch die lineare Abbildung t α → α(0) , α(1) , . . . α(n−1) bijektiv auf die Menge aller Lösungen des Systems erster Ordnung auf I × Rn×1 y0 0 1 0 ··· 0 y0 0 0 1 ··· 0 d y1 0 y1 0 . = .. · .. + .. (1.33) .. dx .. . . . . yn−1 −a0 −a1 −a2 · · · −an−1 yn−1 b abgebildet. Damit übertragen sich die Sätze für (in)homogen lineare Systeme erster Ordnung auf (in)homogen lineare Diffgleichungen n-ter Ordnung. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 68 Satz 41 Jede maximale Lösung von (1.32) ist auf ganz I definiert. Die Menge L0 aller maximalen Lösungen von (1.32) für b = 0 ist ein n-dimensionaler reeller Vektorraum. (Eine Basis von L0 heißt ein Fundamentalsystem.) Sei yb eine maximale Lösung von (1.32), dann gilt für die Menge Lb aller maximalen Lösungen dieser Gleichung Lb = L0 + yb . Maximale Lösungen einer homogenen Gleichung, also α0 , ...αn−1 ∈ L0 , sind genau dann linear unabhängig, wenn die Wronskideterminante · · · αn−1 (x) α0 (x) (1) α(1) (x) αn−1 (x) 0 W (x) := det .. .. . . (n−1) α0 (n−1) (x) · · · αn−1 (x) für ein x ∈ I ungleich 0 ist. Aus W (x0 ) = 0 für ein x0 ∈ I folgt W (x) = 0 für alle x ∈ I. Sei x0 ∈ I. Dann existiert zu jedem c ∈ R1×n genau ein α ∈ Lb mit α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = c. Jede Lösung α ∈ L0 mit α = 0 kann zu einem Fundamentalsystem ergänzt werden. Da die zugehörige Wronskideterminante nirgends gleich Null ist, gilt für jedes x ∈ I α(x), α(1) (x), ..., α(n−1) (x) = (0, 0, ..., 0) . Sei für i = 0, 1, ..., n − 1 die Funktion αi,x0 die maximale Lösung von Gleichung (j) (1.32) mit b = 0 zur Anfangsbedingung αi,x0 (x0 ) = δ ji für j = 0, 1, ..., n − 1, wobei x0 im Definitionsintervall I der Differentialgleichung liegt. Dann ist gemäß dem Abschnitt über die Evolutionsabbildung von linearen Systemen erster Ordnung die Matrix der Evolutionsabbildung Ux,x0 des Systems (1.33) zur Standardbasis von Rn×1 für x ∈ I durch α0,x0 (x) · · · αn−1,x0 (x) (1) α(1) (x) αn−1,x0 (x) 0,x0 .. .. . . (n−1) α0,x0 (x) · · · (n−1) αn−1,x0 (x) gegeben. Tatsächlich gilt Ux0 ,x0 = ιd. Für die maximale Lösung α von Gleichung (1.32) mit b = 0 zur allgemeinen Anfangsbedingung α(x0 ), α(1) (x0 ), . . . , α(n−1) (x0 ) = (c0 , c1 , . . . , cn−1 ) folgt daher α(x) = c0 α0,x0 (x) + . . . + cn−1 αn−1,x0 (x). Für die maximale Lösung α der inhomogenen Gleichung (1.32) zur Anfangsbedingung α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = (c0 , c1 , ..., cn−1 ) folgt durch Anwenden von Bemerkung (35) auf Gleichung (1.33) x αn−1,ξ (x)b(ξ)dξ. α(x) = α(x) + x0 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 69 Im Fall einer Gleichung mit konstanten Koeffizientenfunktionen ai gilt αn−1,ξ (x) = αn−1,0 (x − ξ), sodass daraus folgt x α(x) = α(x) + x0 αn−1,0 (x − ξ)b(ξ)dξ. Falls b nur in einem endlichen Intervall von 0 verschiedene Werte annimmt, kann am Integral der Grenzübergang x0 → −∞ durchgeführt werden. Es folgt daher, dass die Lösung α der inhomogenen Gleichung zur homogenen Anfangsbedingung α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = (0, 0, ..., 0) , für x0 → −∞ punktweise gegen die sogenannte „retardierte Lösung” αret (x) = (Gret ∗ b) (x) = ∞ −∞ Θ(x − ξ)αn−1,0 (x − ξ)b(ξ)dξ (1.34) der inhomogenen Gleichung konvergiert. Die Funktion Gret : x → Θ(x)αn−1,0 (x) heißt retardierte Fundamentallösung der homogenen Differentialgleichung (1.32). Das Integral (1.34) heißt Faltungsintegral von Gret mit der Inhomogenität b. Legendre, Hermite und Laguerre Die folgenden linearen Differentialgleichungen zweiter Ordnung treten in beim Lösen von Potential- und Wellenproblemen auf. Einigen von ihnen werden wir uns noch eingehender zuwenden. Sei n ∈ N0 . 1. (1 − x2 ) y ′′ − 2xy ′ + n(n + 1)y = 0 auf I = (−1, 1) (Legendresche Diffgl.) 2. y ′′ − 2xy ′ + 2ny = 0 auf I = R (Hermitesche Diffgl.) 3. xy ′′ + (1 − x) y ′ + ny = 0 auf I = R>0 (Laguerresche Diffgl.) 4. Eine maximale Polynomlösung zu jeder der drei Gleichungen ist wie folgt: 5. Pn (x) = 1 2n n! d n dx 2 6. Hn (x) = (−1)n ex 7. Ln (x) = ex 1.4.2 n (x2 − 1) (n-tes Legendrepolynom) d n −x2 e dx d n (xn e−x ) dx (n-tes Hermitepolynom) (n-tes Laguerrepolynom) Eine Eulersche Differentialgleichung 1 ′ Für x ∈ R>0 sei y ′′ (x) − 2x y (x) + 2x12 y(x) = 0. Die Gleichung ist homogen linear. Potenzansatz: die Funktion y(x) = xα ist eine Lösung genau dann, wenn für alle x>0 α 1 xα−2 = 0. α(α − 1) − + 2 2 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 70 Dies ist äquivalent zu α√ ∈ {1, 1/2} . Daraus folgen die beiden maximalen Lösungen α1 (x) = x und α2 (x) = x auf R>0 . Für ihre Wronskideterminante folgt √ √ x x x < 0. W (x) = det =− 1 2√1 x 2 (α1 , α2 ) ist somit eine Basis des Lösungsraumes der Differentialgleichung, ein Fundamentalsystem. Zur Lösung einer inhomogenen Gleichung y ′′ (x) − 1 ′ 1 y (x) + 2 y(x) = b(x) für alle x ∈ R>0 2x 2x (1.35) nach der Variation der Konstantenformel für Systeme erster Ordnung wird die maximale Lösung α1,ξ =: αξ der homogenen Gleichung zur Anfangsbedingung αξ (ξ) = 0 und α′ξ (ξ) = 1 benötigt. Für sie gilt für alle x > 0 αξ (x) = 2 x − ξx . Somit folgt für die maximale Lösung y der inhomogenen Gleichung mit der Anfangsbedingung α(1) = α′ (1) = 0 für alle x > 0, dass x α(x) = x αξ (x)b(ξ)dξ = 2 x 1 1 b(ξ)dξ − x √ x ξb(ξ)dξ . 1 Rechnen Sie zur Übung nach, dass die Funktion α tatsächlich eine Lösung der Differentialgleichung 1.35 ist. 1.4.3 Getriebene lineare Schwingungen: gedämpft Die (parameterreduzierte) Bewegungsgleichung des getriebenen, gedämpften harmonischen Oszillators ist mit α ≥ 0 und stetiger Inhomogenität f : R → R durch y ′′ + 2αy ′ + y = f (1.36) gegeben. Der Ansatz y (x) = e−αx u (x) für alle x ∈ R führt die Gleichung mit Dämpfung auf eine ohne Dämpfung zurück. Es folgt nämlich (y + 2αy ′ + y ′′ ) (x) = = e−αx u (x) + 2α [−αu (x) + u′ (x)] + α2 u (x) − 2αu′ (x) + u′′ (x) = e−αx u′′ (x) + 1 − α2 u (x) . Die Differentialgleichung für u enthält u′ nicht: u′′ (x) + 1 − α2 u (x) = eαxf (x) . Sei zunächst der homogene Fall f = 0 betrachtet: Wegen u′′ = − (1 − α2 ) u liegt für α2 < 1 folgender Sachverhalt vor: Die Krümmung (oder auch Beschleunigung) von u ist positiv für negatives u und negativ für positives u. Der Graph von u ist KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 71 oberhalb der x-Achse nach unten und unterhalb nach oben gekrümmt. Dabei nimmt der Betrag der Krümmung linear mit dem Abstand von der Achse zu. Die Funktion u oszilliert dementsprechend mit unendlich vielen Nulldurchgängen zwischen positiven und negativen Werten. Genauer gilt: Es existieren a, b ∈ R, sodass für alle x ∈ R √ √ 1 − α2 x + b sin 1 − α2 x . u (x) = a cos Es ist, als würde u zum Wert u = 0 hingezogen. Für y folgt bei f = 0 somit für alle x∈R √ √ y (x) = e−αx a cos 1 − α2 x + b sin 1 − α2 x . y wechselt wie u das Vorzeichen in denselben Nullstellen wie u. Für α > 0 geht y (x) für x → ∞ gegen 0. Für x → −∞ wächst der Betrag der lokalen Extrema von y (x) unbeschränkt an. Für α2 > 1 ist u im positiven Bereich nach oben gekrümmt, im negativen nach unten. Der Wert u = 0 scheint abzustoßen. Genauer gilt für α2 > 1 : Es existieren a, b ∈ R, sodass für alle x ∈ R √ α2 −1x u (x) = ae √ α2 −1x + be− . u hat höchstens eine Nullstelle. Für y folgt bei f = 0 somit für alle x ∈ R √ α2 −1)x y (x) = ae−(α− √ α2 −1)x + be−(α+ . Auch y hat höchstens eine Nullstelle. Diese stimmt mit jener von u überein. Für x → ∞ konvergiert y (x) gegen 0. Für x → −∞ divergiert y (x) . Im Grenzfall α2 = 1 gilt: Es existieren a, b ∈ R, sodass für alle x ∈ R u (x) = a + bx und y (x) = e−x [a + bx] . ′′ ′ Sei nun 0 ≤ α2 < 1. Dann gilt für y0 : R → R genau √ dann y0 + 2αy0 + y0 = 0, wenn reelle Konstanten a, b existieren, sodass mit ω = 1 − α2 für alle x ∈ R y0 (x) = e−αx [a cos (ωx) + b sin (ωx)] Die beiden Lösungen ri : R → R mit r1 (x) = e−αx cos (ωx) und r2 (x) = e−αx sin (ωx) bilden ein Fundamentalsystem der homogenen Differentialgleichung, da Wr (0) = r1 (0) r2 (0) r1′ (0) r2′ (0) 1 0 −α ω = . Das Fundamentalsystem α = (α1 , α2 ) ≡ (α0,0 , α1,0 ) , dessen Wronskimatrix Wα (x) im Punkt x = 0 die Einheitsmatrix ist, geht aus der Basis r = (r1 , r2 ) mit einer konstanten Matrix M ∈ R2×2 gemäß α = r · M hervor. Es gilt daher auch Wα (x) = Wr (x) · M und somit M = Wr (0)−1 = 1 ω ω 0 α 1 = 1 0 α ω 1 ω . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 72 Für die maximalen Lösungen αi : R → R der homogenen Gleichung mit α1 (0) = 1 und α′1 (0) = 1 und α2 (0) = 0 und α′2 (0) = 1 gilt daher für alle x ∈ R α1 (x) = e−αx cos (ωx) + α sin (ωx) ω und α2 (x) = e−αx sin (ωx) . ω Daraus folgt für die maximale Lösung y0 : R → R der inhomogenen Gleichung mit Inhomogenität f zur Anfangsbedingung y0 (x0 ) = y0′ (x0 ) = 0 für ein x0 ∈ R, dass für alle x ∈ R e−αx x sin (ω (x − ξ)) eαξ f (ξ)dξ ω x0 * + x x e−αx αξ αξ = sin (ωx) cos (ωξ) e f (ξ)dξ − cos (ωx) sin (ωξ) e f(ξ)dξ . ω x0 x0 √ Dabei gilt 0 ≤ α < 1 und ω = 1 − α2 . Ist die Inhomogenität f für x < 0 polynomial beschränkt, dh es existiert ein Polynom p mit |f (x)| ≤ |p (x)| für alle x < 0, dann existiert das uneigentliche Integral y0 (x) = x lim x0 →−∞ x0 sin (ω (x − ξ)) eαξ f (ξ)dξ, aufgrund der exponentiellen Dämpfung durch eαξ , sodass die Funktion yret : R ∋ x → limx0 →−∞ y0 (x) existiert. Sie löst Gleichung (1.36) und wird als die retardierte Lösung bezeichnet. Damit hingegen eine avancierte Lösung yav (x) = limx0 →∞ y0 (x) existiert, benötigt f im Bereich x > 0 eine stärkere als nur polynomiale Schranke. Der folgende Abschnitt gibt ein Beispiel einer retardierten Lösung für eine Inhomogenität ohne Nullstelle. 1.4.4 Eine retardierte gedämpfte Schwingung Sei wieder die Dämpfungskonstante α ∈ [0, 1) . Die Differentialgleichung (1.36) mit f (x) = exp (−λ |x|) für alle x ∈ R und für ein festes λ ∈ R>0 besitzt also eine Lösung yret : R → R, für die limx→−∞ yret (x) = 0 gilt. Sie kann entweder mittels yret (x) = e−αx ω x −∞ sin (ω (x − ξ)) eαξ e−λ|ξ| dξ berechnet werden, oder aber für x ≤ 0 mittels des Ansatzes yret (x) = c · eλx . Dieser gibt der reellen Konstante c den Wert c = 1/ λ2 + 2αλ + 1 . Im Punkt ′ x = 0 gilt somit yret (0) = c und yret (0) = λc. Die Addition einer nichttrivialen Lösung der homogenen Gleichung im Bereich x ≤ 0 zu yret (x) = c exp (λx) wird von limx→−∞ yret (x) = 0 ausgeschlossen. Keine von ihnen geht für x → −∞ gegen 0. In den Bereich x ≥ 0 wird die Lösung wieder durch Ansatz fortgesetzt. Es gilt f (x) = e−λx für x > 0 und daher gibt der Ansatz yp (x) = c′ exp (−λx) eine Lösung KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 73 von (1.36) im Bereich x ≥ 0 mit c′ = 1/ λ2 − 2αλ + 1 . Daher existieren Zahlen A, B ∈ R mit yret (x) = yp (x) + Aα1 (x) + Bα2 (x) für alle x ≥ 0. Dabei ist (α1 , α2 ) jenes Fundamentalsystem der homogenen Gleichung, dessen Wronskimatrix in x = 0 die Einheitsmatrix ist. Aus der Anschlussbedingung für yret im ′ Punkt x = 0 folgt somit A = yret (0) − yp (0) und B = yret (0) − yp′ (0) , also A = c − c′ = −4αλ λ2 + 1 2 − (2αλ)2 und B = λ (c + c′ ) = 2 λ2 + 1 λ2 + 1 √ Zusammenfassend gilt mit ω = 1 − α2 eλx λ2 +2αλ+1 (λ2 +1)−2α2 λ sin(ωx)−cos(ωx) yret (x) = 2αω e−λx + 4λαe−αx λ2 −2αλ+1 2 (λ2 +1) −(2αλ)2 1.4.5 2 − (2αλ)2 . für x ≤ 0 für x > 0 Symmetrien einer Differentialgleichung Für manche Differentialgleichungen lassen sich einfache Prozeduren, sogenannte Symmetrien, finden, die aus bereits bekannten Lösungen weitere Lösungen erzeugen. Das hilft gelegentlich beim Auffinden der gesamten Lösungsmenge. Wichtiger aber ist die von Symmetrien errichtete Struktur der Lösungsmenge, denn sie fassen auseinander hervorgehende Lösungen zu Klassen ’ähnlicher’ Lösungen zusammen. Wir sehen uns das an einem Beispiel an. Die Abbildung Π : C (R : R) → C (R : R) ordne einer Funktion f ∈ C (R : R) die Funktion Π (f ) ≡ Πf zu, die Πf : x → f (−x) erfüllt. Der Funktionsgraph von Πf geht also aus jenem von f durch Spiegelung an der y-Achse hervor. Je nach physikalischem Kontext kann Π als Raum- oder Zeitspiegelung auftreten. Es gilt: Π ◦ Π = ιd und daher Π−1 = Π. Für alle f ∈ C 1 (R : R) gilt (Πf )′ = −Πf ′ (Kettenregel). Die Abbildung Ta : C (R : R) → C (R : R) ordne einer Funktion f ∈ C (R : R) für a ∈ R die Funktion Ta f ≡ Ta (f) zu, die Ta f : x → f (x − a) erfüllt. Der Funktionsgraph von Ta f geht also aus jenem von f durch Verschieben um a längs der x-Achse hervor. Es folgt Ta ◦ Tb = Ta+b und weiter Ta−1 = T−a . Zudem gilt Π ◦ Ta = T−a ◦ Π und (Ta f)′ = Ta f ′ für alle f ∈ C 1 (R : R) und für alle a ∈ R. Sei L für ein ω > 0 die Menge aller Funktionen y : R → R mit y ′′ (x) + y (x) = 1 − cos (ωx) für alle x ∈ R. (1.37) L ist also die Menge aller maximalen Lösungen der Differentialgleichung (1.37). Man beachte, dass 1 − cos (ωx) = 2 sin2 (ωx/2) . Satz 42 Für y ∈ L folgt Πy ∈ L und Tkτ y ∈ L für alle k ∈ Z und τ = 2π/ω. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 74 Beweis. 1) Spiegelung: Aufgrund der Kettenregel gilt (Πy)′′ (x) = y ′′ (−x) = (Πy ′′ ) (x) für alle x ∈ R. Daraus folgt (Πy)′′ (x) + (Πy) (x) = y ′′ (−x) + y (−x) = 1 − cos (ω (−x)) = 1 − cos (ωx) . Also ist auch Πy Element von L. 2) Translation: Aufgrund der Kettenregel gilt (Ta y)′′ (x) = y ′′ (x − a) = (Ta y ′′ ) (x) für alle x ∈ R. Daraus folgt (Ta y)′′ (x) + (Ta y) (x) = y ′′ (x − a) + y (x − a) = 1 − cos (ω (x − a)) . Für a = kτ folgt aus cos (ω (x − a)) = cos (ωx − k2π) = cos (ωx) , dass Ta y ∈ L. Da die linearen Abbildungen Π und {Tkτ : k ∈ Z} den affinen Unterraum L ⊂ C (R : R) auf sich abbilden, heißen sie Symmetrien oder auch Invarianzen von L bzw Gleichung (1.37).28 Für eine Funktion y ∈ L gilt typischerweise Πy = y und Tkτ y = y. Eine Lösung y ∈ L mit Πy = y und Tτ y = y stellt einen hochsymmetrischen Sonderfall dar und sie wird als invariant unter Π und Tτ bezeichnet. Sie ist also gerade und τ -periodisch. Sie ist auch invariant unter Tkτ für alle k ∈ Z. Ziehen wir ein paar Schlüsse aus diesen einfachen Überlegungen: Ist y ∈ L, dann folgt für den geraden Teil von y, dass y+ := (y + Πy) /2 ∈ L. Hingegen ist der ungerade Teil y− = (y − Πy) /2 ∈ / L. Vielmehr ist y− eine Lösung der homogenen DG zu (1.37). Es ist sogar so, dass in L keine einzige ungerade Funktion enthalten ist. Gäbe es nämlich eine ungerade Funktion u ∈ L, dann wäre auch die Funktion u+ = (u + Πu) /2 = 0 ∈ L. Das ist aber nach Gl (1.37) nicht der Fall. Jede Funktion y ∈ L mit y ′ (0) = 0 ist gerade, denn aus (Πy) (0) = y (0) und (Πy)′ (0) = −y ′ (0) = 0 = y ′ (0) folgt, dass die beiden maximalen Lösungen y und Πy von Gl (1.37) dieselben Anfangsbedingungen bei x = 0 erfüllen und somit nach dem Eindeutigkeitssatz übereinstimmen, dh y = Πy. Eine Regel zeichnet sich ab: Sind Differentialgleichung und Anfangsvoragbe invariant unter einer Symmetrie, dann ist - bei Wirksamkeit des Eindeutigkeitssatzes - die zugehörige maximale Lösung invariant unter dieser Symmetrie. Ähnlich folgt für y ∈ L, dass für eine endliche Teilmenge J ⊂ Z die Funktion k∈J (Tkτ y) / |J| in L liegt. Der Grenzfall yp := limN→∞ |k|≤N Tkτ y/ (2N + 1) schließlich sollte analog zur Bildung von y+ aus y eine τ -periodische Lösung ergeben, soferne der Limes existiert. Überprüfen wir an L all diese Überlegungen. Nichtresonanter Fall ω = 1 : Eine unter Π und Tτ invariante Lösung kann mit dem Ansatz yp (x) = a + b cos (ωx) gesucht werden. Es gilt dann yp′′ (x) + yp (x) = a + b 1 − ω 2 cos (ωx) . yp erfüllt genau dann die DG, wenn a = 1 und b = −1/ (1 − ω 2 ) . Es gilt also yp (x) = 1 − 28 cos (ωx) für alle x ∈ R. 1 − ω2 (1.38) Jede Permutation einer Menge M heißt Symmetrie von M. Die Menge aller Permutationen von M bildet bezüglich der Hintereinanderausführung eine Gruppe, die symmetrische Gruppe S (M) . Jede Untergruppe von S (M) wird als Symmetriegruppe von M bezeichnet. Die Einschränkungen von Π und Tkτ auf L sind also in S (L) . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 75 Die Lösung yp ∈ L ist periodisch. Ihre kleinste Periode ist τ = 2π/ω > 0. Ihr Periodenmittel hat den Wert 1, denn 1 τ τ yp (x) dx = 1. 0 Für ω < 1 gilt 1 − ω 2 > 0 und die Schwingung yp hat die Amplitude Aω = −1 (1 − ω 2 ) > 1. Die Amplitudenfunktion ω → Aω ist im Intervall (0, 1) streng monoton wachsend und für ω → 1 unbeschränkt. Für ω → 0 gilt Aω → 1. Die Schwingung folgt der Inhomogenität in Phase, dh sie nimmt ein Maximum genau dann an, wenn die Inhomogenität maximal ist & vice versa. In ihren Tiefpunkten nimmt yp einen negativen Wert an, nämlich yp (0) = 1 − 1 ω2 = − = ω 2 Aω = −yp′′ (0) < 0. 1 − ω2 1 − ω2 Für ω > 1 gilt 1 − ω 2 < 0 und die Schwingung yp hat die Amplitude Aω mit −1 Aω = (ω 2 − 1) > 0. Die Amplitudenfunktion ω → Aω ist im Intervall (1, ∞) streng monoton fallend und für ω → 1 unbeschränkt. Für ω → ∞ konvergiert sie gegen 0. Die Schwingung folgt der Inhomogenität mit einen Phasenschub von π, dh sie nimmt ein Maximum genau dann an, wenn die Inhomogenität minimal ist & vice versa. Für 1 < ω 2 < 2 gilt Aω > 1 und für ω 2 > 2 gilt Aω < 1. Die Lösungen yp sind für die unterkritische Frequenz ω = 1/2 und die beiden überkritischen Frequenzen √ ω = 1, 2 < 2 und ω = 3/2 in Figur 1.25 wiedergegeben. Die Lösung − cos (x) der homogenen Gleichung ist als Referenztaktgeber in grau eingefügt. Abbildung 1.25: yp für ω = 1/2 (rot), ω = 1, 2 (grün), ω = 3/2 (schwarz) Zu jeder Lösung y ∈ L existiert für ω = 1 somit ein Dupel (A, B) ∈ R2 , sodass y = y(A,B) mit y(A,B) (x) = A cos (x) + B sin (x) + yp (x) für alle x ∈ R. Es gilt Πy(A,B) = y(A,−B) und Tτ y(A,B) = y(A cos τ −B sin τ ,A sin τ +B cos τ ) . Die Translation um τ dreht den Parametervektor (A, B) um den Winkel τ . Für (A, B) = (0, 0) hat y(A,B) die Periode τ genau dann, wenn (A, B) bei einer Drehung um τ in sich übergeht. Dies ist genau dann der Fall, wenn τ ∈ 2π · N. In diesem Fall hat jedes Element von L die Periode τ . Für τ ∈ / 2π · N ist yp die einzige τ -periodische Lösung. Es bleibt nun die Frage, ob y(A,B) für (A, B) = (0, 0) eine andere Periode als τ besitzt. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 76 Satz 43 Die Funktion y(A,B) mit A2 + B 2 > 0 ist genau dann periodisch, wenn τ ∈ 2π · Q. Gilt τ = 2πn/m mit m, n ∈ N, dann hat y(A,B) die Periode T = 2πn = mτ . Beweis. Sei y(A,B) periodisch mit der Periode T > 0. Dann haben auch die ′′ ′′ Funktionen y(A,B) und y(A,B) + y(A,B) die Periode T. Wegen y(A,B) ∈ L folgt nun, dass T auch Periode der Inhomogenität 1 − cos ωx ist. Das ist genau dann der Fall, wenn ωT = 2πT /τ = 2πm für ein m ∈ N, oder äquivalent dazu, wenn T = τ m. Da yp die Periode τ besitzt, hat yp auch die Periode T = τ m. Damit folgt nun, dass auch A cos x + B sin x die Periode T besitzt. Dies ist aber nur dann der Fall, wenn T = 2πn für ein n ∈ N. Es folgt also τ = T /m = 2πn/m ∈ 2π · Q. Gilt umgekehrt τ = 2πn/m für zwei natürliche Zahlen m, n, dann folgt für T := 2πn, die T -Periodizität von y(A,B) . Bemerkung: y(A,B) ist also genau dann periodisch, wenn eine der Perioden n · 2π für n ∈ N des homogenen Lösungsteils mit einer der Perioden m · τ für m ∈ N von yp übereinstimmt. Im resonanten Fall ω = 1 kann der Ansatz yp (x) = a + bx sin x genutzt werden, um eine Lösung zu suchen, die unter Π invariant ist. Wegen yp′′ (x) + yp (x) = a + 2b cos x gilt yp ∈ L genau dann, wenn a = 1 und b = −1/2, also für yp (x) = 1− x2 sin x. (Figur 1.26) Die Funktion y0 ∈ L mit y0 (x) = yp (x) − cos x erfüllt y0 (0) = 0 = y0′ (0) . (Beachte: y0 stimmt auf x > 0 mit der retardierten Lösung zur Inhomogenität Θ (x) (1 − cos x) überein.) Zu jedem y ∈ L existieren somit Zahlen A, B ∈ R, für die y = y(A,B) = A cos +B sin +yp . Es gilt Tτ y(A,B) = y(A,B+π) . Da eine Verschiebung Abbildung 1.26: yp für ω = 1 (rot), y0 (grün) und − cos (x) (grau) der Ebene keinen Fixpunkt hat, existiert keine 2π-periodische Lösung. Zusammenfassung: Aus der Menge L aller maximalen Lösungen der Differentialgleichung (1.37) sind je nach Wert von ω kein einziges, genau eines oder alle Elemente invariant unter Tτ . Für ω = 1 ist kein y ∈ L invariant unter Tτ . Für ω = 1/n mit n ∈ N 1 ist jedes y ∈ L invariant unter Tτ . Für ω ∈ R>0 {1/n : n ∈ N} ist yp aus Gleichung (1.38) die einzige unter Tτ invariante Lösung. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1.4.6 77 *Dehnungssymmetrie und 3. Keplersches Gesetz Sei V ein (endlichdimensionaler) Vektorraum und |·| sei eine Norm von V. Die Kurve γ : I → V 0 erfülle für alle t im offenen reellen Intervall I die Newtonsche Bewegungsgleichung c γ (t) . (1.39) γ̈ (t) = − |γ (t)|3 Dabei ist c eine reelle Konstante. Im Fall der Bewegung eines Planeten um die Sonne ist c das Produkt aus Gravitationskonstante G und Sonnenmasse M und V hat die Dimension 3. Gibt es eine Zahl α ∈ R, sodass für ein λ ∈ R>0 die gedehnte Funktion Dλ γ : λ · I → V mit (Dλ γ) (t) = λα γ (λt) ebenfalls Gleichung (1.39) erfüllt? Es gilt (Dλ γ)′′ (t) = λ2+α γ̈ (λt) und (Dλ γ) (t) −2α γ (λt) . 3 = λ |(Dλ γ) (t)| |γ (λt)|3 Die Kurve Dλ γ erfüllt daher genau dann Gleichung (1.39), wenn λ2+α = λ−2α , wenn also 2 = −3α. Damit ist gezeigt: Die Abbildung Dλ : γ → Dλ γ mit (Dλ γ) (t) = λ−2/3 γ (λt) bildet für jedes λ ∈ R>0 die Menge aller (lokalen) Lösungen von Gleichung (1.39) auf sich ab, ist also eine Symmetrie. Dieser Sachverhalt wird als Skaleninvarianz der Bewegungsgleichung (1.39) bezeichnet. Sei nun γ : R → V 0 eine periodische Lösung. Ihre kleinste Periodenlänge wird mit T und ihr Maximalabstand von 0 wird mit L := maxt |γ (t)| bezeichnet. Dann hat die Lösung Dλ γ von Gleichung (1.39) die kleinste Periodenlänge Tλ = T /λ und den maximalen Nullpunktsabstand Lλ = λ−2/3 M. Es gilt also 1 Tλ = = λ T Lλ L 3/2 bzw Tλ T 2 = Lλ L 3 . Analog gilt für die Minimalabstände von 0, nämlich l = mint |γ (t)| und lλ = mint |(Dλ γ) (t)| , dass (Tλ /T )2 = (lλ /l)3 . Daraus folgt für A = (l + L) /2 und Aλ = (lλ + Lλ ) /2 der Spezialfall des dritten Keplerschen Gesetzes29 (Tλ /T )2 = (Aλ /A)3 . PS: Kepler abstrahierte aus den ihm bekannten Planetendaten: 1) Die Bahnen der Planeten sind Ellipsen und die Sonne befindet sich in einem der Brennpunkte. 2) Das Geradenstück zwischen Sonne und Planet überstreicht in gleichen Zeiten Sektoren gleicher Flächeninhalte. 3) Die Quadrate der Umlaufzeiten verhalten sich zueinander so wie die Kuben der großen Halbachsen. (Die große Halbachse einer Ellipse ist das arithmetische Mittel von Perihel- und Apheldistanz.) Newton erkannte, dass Gleichung (1.39) eine Erklärung für Keplers Gesetze liefert. 29 Das dritte Keplergesetz gilt nicht nur für 2 Lösungen, die auseinander durch Dehnung hervorgehen, sondern für alle Paare von periodischen Lösungen. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1.4.7 78 *Potential einer homogen geladenen Kugel Bisher haben wir eine maximale Lösung y einer gewöhnlichen Differentialgleichung zweiter Ordnung durch die Vorgabe der Werte y (x0 ) und der Ableitung y ′ (x0 ) in einem Punkt x0 des Definitionsbereiches der Differentialgleichung festgelegt. Es gibt aber auch andere Möglichkeiten, eine spezielle Lösung aus der Menge aller maximalen Lösungen auszuwählen. Das folgende Beispiel zeigt, dass maximale Lösungen einer Differentialgleichung (unter Umständen) auch durch Wachstumsschranken enger eingegrenzt werden. Überdies zeigt es, wie Lösungen verschiedener Differentialgleichungen sich zur Gesamtlösung einer komplexeren Aufgabenstellung zusammenfügen können. Das Beispiel liefert das elektrische Potential einer homogen geladenen Vollkugel oder auch Yukawas Mesonpotential eines ausgedehnten Nukleons. Sei für ein R ∈ R>0 und ein ρ0 ∈ R die Funktion ρ : R3 → R durch ρ (p) = ρ0 für |p| < R und ρ (p) = 0 sonst gegeben. Die Normfunktion |·| wird im Folgenden als r notiert. Die Funktion ρ beschreibt die Ladungsdichte einer homogen geladenen Kugel. Gesucht ist eine beschränkte C 1 -Funktion Φ : R3 → R mit Φ = ϕ (r) für ein ϕ : R≥0 → R und (−∆ + κ2 ) Φ = ρ/ε0 auf R3 R · S2 . Dabei ist ε0 die elektrische Feldkonstante und κ ∈ R>0 beschreibt die Induktion von Ladungsdichte in einem Elektrolyten (Debye-Hückel Abschirmung). Die Vakuumelektrostatik ergibt sich im Grenzübergang κ → 0. Durch den Ansatz ϕ (r) = u (r) /r auf R>0 wird das Problem mittels ∆ (u (r) /r) = u′′ (r) /r übersetzt in die folgende (äquivalente) Aufgabe: Problem 44 Gesucht ist eine C 1 -Funktion u : R>0 → R mit u′′ (x) − κ2 u (x) = cx für 0 < x < R und u′′ (x)−κ2 u (x) = 0 für R < x. Dabei gilt c = −ρ0 /ε0 . Zudem ist u so, dass die Abbildung x → u (x) /x erstens auf R>0 beschränkt ist, und zweitens ihr Grenzwert für x → 0 existiert. Diese beiden Bedingungen werden als (uneigentliche) ’Randbedingung’ bezeichnet. Im Bereich x > R gilt also u (x) = Ae−κx + Beκx mit Zahlen A, B ∈ R. Nur für B = 0 ist u (x) /x im Bereich x > R beschränkt. Daher gilt u (x) = Ae−κx für alle x > R mit A ∈ R. Im Bereich 0 < x < R ist up (x) = −cx/κ2 eine partikuläre Lösung der dort gültigen Differentialgleichung. Somit gibt es a, b ∈ R mit u (x) = a cosh (κx) + b sinh (κx) − c x für alle x ∈ (0, R) . κ2 Der Grenzwert limx→0 u (x) /x existiert genau dann, wenn a = 0. Somit erfüllt u die beiden Differentialgleichungen und die ’Randbedingung’ genau dann, wenn zwei Zahlen A, b ∈ R existieren, sodass u (x) = Ae−κx b sinh (κx) − c x κ2 für alle x > R . für alle x ∈ (0, R) (1.40) Eine Funktion u : R>0 → R, für die Gleichung (1.40) gilt, ist genau dann stetig differenzierbar, wenn lim u (R + ε) = lim u (R − ε) und lim u′ (R + ε) = lim u′ (R − ε) . ε→0 ε→0 ε→0 ε→0 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 79 Dies ist genau dann der Fall, wenn c c Ae−κR = b sinh (κR) − 2 R und − κAe−κR = bκ cosh (κR) − 2 . κ κ Es liegt also ein lineares Gleichungssystem für die Integrationskonstanten A, b vor, nämlich c −e−κR sinh (κR) A R · = 2 . −κR κe κ cosh (κR) b 1 κ Die Determinante der Matrix −e−κR sinh (κR) κe−κR κ cosh (κR) M := hat den Wert det M = −κe−κR (cosh (κR) + sinh (κR)) = −κ < 0. Damit folgt, dass A b = c · M −1 2 κ = R 1 c κ3 c −κ cosh (κR) sinh (κR) 3 κe−κR e−κR κ sinh (κR) − κR cosh (κR) . (1 + κR) e−κR = · R 1 Daraus folgt nun für das Potential ρ 1 Φ=− 0· 2 · ε0 κ −κr (sinh (κR) − κR cosh (κR)) e κr (1 + κR) e−κR sinh(κr) −1 κr für r > R . für 0 < r < R (1.41) Mit der Gesamtladung Q = (4πR3 /3) ρ0 drückt sich Φ durch x = r/R und α = κR wie in Gl (1.42) angeführt aus. . −αx Q 3 (α cosh (α) − sinh (α)) e x für x > 1 · 3· Φ= (1.42) e−α sinh(αx) 4πε0 R α α − (1 + α) für 0 < x < 1 x Die Taylorentwicklung bezüglich α um α = 0 der Terme in der geschwungenen Klammer ergibt im Limes κ → 0 bei festgehaltenem Ort das Coulombsche Potential einer homogen geladenen Kugel30 Φ= Q · 4πε0 R x−1 für x > 1 . 1 2 (3 − x ) für 0 < x < 1 2 (1.43) −1 Figur 1.27 zeigt die Abbildung x → 4πεQ0 R · Φ für α = 1 in grün, für α = 1/2 in rot und den Grenzfall κ → 0 in schwarz. Das Phänomen einer mit wachsendem κ zunehmenden Ladungsabschirmung ist sichtbar. Die elektrische Feldstärke E = − grad Φ ist stetig und erfüllt im Grenzfall κ → 0 E (p) = 30 Q · 4πε0 p |p|3 p R3 für |p| > R . für |p| ≤ R Ersetzung von Q/ (4πε0 ) durch −GN M in Φ ergibt das Newtonsche Gravitationspotential ΦN einer Kugel homogener Massendichte mit Radius R und Masse M. Die Konstante GN bezeichnet Newtons Gravitationskonstante. Die Kraft auf eine Masse m am Ort p ist dann −m gradp ΦN . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 80 1.5 1.25 1 0.75 0.5 0.25 0 1 2 3 4 x Abbildung 1.27: Potentialverlauf für α = 1 (grün), α = 1/2 (rot) und α = 0 Die Umlaufzeit einer Testladung q mit Qq < 0 auf einer Kreisbahn an der Grenzfläche |p| = R ist daher für κ = 0 unabhängig davon, ob die Bewegung als Grenzfall einer Bewegung im Inneren oder Äußeren der geladenen Vollkugel formuliert wird. Da alle Bewegungen von Testladungen mit denselben spezifischen Ladungen q/m im Inneren der Kugel ein und dieselbe Periode haben, dauert ein Umlauf knapp außerhalb der Grenzfläche gleich lang wie der Sturz von der Kugeloberfläche durch den Kugelmittelpunkt zum Antipoden und zurück. Im Kontext der Gravitation impliziert dies, dass Münchhausens Sturz vom Nordpol zum Südpol und zurück gleich lange dauert, wie der Umlauf eines erdnahen Satelliten, also ca 1, 5 h. 1.4.8 *Thomson- und Rayleighstreuung von Licht Sei V ein Vektorraum der Dimension 3 und ·, · sei ein Skalarprodukt von V mit zugehöriger Norm |·| . Eine elektrische Punktladung der Stärke q ∈ R sei harmonisch an die Gleichgewichtslage 0 ∈ V gebunden. In Thomsons Modell eines Wasserstoffatoms ist dies für das Elektron, solange es sich im Inneren der positiven Ladungswolke befindet, der Fall. Hat die Ladung die Masse m und wird sie von einer (freien, ebenen) elektromagnetischen Welle der Frequenz ω überstrichen, dann gilt für ihren zeitabhängigen Ort γ (t) γ̈ (t) + ω 20 γ (t) = q E cos (ωt − δ) für alle t ∈ R. m (1.44) Dabei sind E ∈ V und δ ∈ R fest gwählt. Die Eigenfrequenz ω 0 des gebundenen Teilchens und seine Masse m sind positiv reell und es wird ω 0 = ω angenommen. Die angeführte Bewegungsgleichung vernachlässigt die Lorentzkraft, die von jenem Magnetfeld ausgeht, welches das Feld E begleitet, sowie eine relativistische Teilchenkinematik. Im Fall eines Thomsonatoms, also einer homogen positiv geladenen Kugel mit KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 81 Radius R und Ladung Ze, gilt für das eingebettete Elektron q = −e und31 ω 20 = Z r0 c R R 2 mit r0 = e2 . 4πε0 mc2 Spezialisierung auf Elektronenladung und -masse in r0 ergibt den sogenannten klassischen Elektronenradius re ≈ 2, 82 · 10−15 m. Daraus folgt mit R = 0, 5 · 10−10 m und Z = 1 für ν 0 = ω 0 /2π der Wert ν 0 ≈ 7 · 1015 Hz. Der sichtbare Frequenzbereich von Licht erstreckt sich über das Intervall 4, 5 · 1014 Hz < ν < 8 · 1014 Hz. Ein ohne einfallende Strahlung schwingendes Elektron eines Thomsonschen H-Atoms emittiert, soferne |γ| < R gilt, daher eine elektromagnetische Strahlung mit nur einer einzigen Frequenz. Diese liegt im UV-Bereich. Thomsons Modell scheint mit der Wirklichkeit also wenig zu tun zu haben, wenngleich die Größenordnung der Schwingungsfrequenz stimmig ist. Eine maximale partikuläre Lösung von Gleichung (1.44) ist γ p : R → V mit γ p (t) = qE cos (ωt − δ) . m (ω 20 − ω 2 ) Unter Berufung auf eine winzige - in Gleichung (1.44) nicht aufgenommene Strahlungsdämpfung - ist es plausibel, dass γ p jede Lösung der ’realen’ Schwingungsgleichung nach Ablauf des Einschwingvorgangs approximiert. Eine auf Larmor zurückgehende Formel32 nähert (ohne Fehlerschranken anzugeben) die elektromagnetische Strahlungsleistung einer bewegten Punktladung bei gegebenen Bewegungskurve γ : I → V. Sie besagt, dass zur Zeit t ∈ I pro Zeiteinheit ∆t eine Energie Pt (Ω) ∆t in den (messbaren) Raumwinkelbereich Ω ⊂ S2 ⊂ V abströmt, wobei Pt (Ω) = n∈Ω dP dP q 2 |γ̈ (t)|2 − n, γ̈ (t) (t, n) dΩ mit (t, n) = dΩ dΩ 4πε0 4πc3 2 gilt. Die Funktion dP : I × S2 → R≥0 heißt Richtungsdichte der Strahlungsleistung. dΩ 2 Die Größe |γ̈ (t)| − n, γ̈ (t) 2 ist das Betragsquadrat der Normalkomponente der Beschleunigung γ̈ (t) zur Richtung n. Die Spezialisierung von Larmors Formel auf die Bewegungskurve γ p ergibt dP q2 (t, n) = dΩ 4πε0 qω 2 m (ω 20 − ω 2 ) 2 |E|2 − n, E 4πc3 2 cos2 (ωt − δ) . Für E = 0 existiert genau ein33 θ ∈ [0, π] mit n, E = |E| cos θ, sodass dann für die über eine Schwingungsperiode zeitgemittelte Richtungsdichte dP /dΩ (n) folgt dP ω (n) = dΩ 2π 31 2π/ω 0 dP q2 (t, n) dt = dΩ 4πε0 qω 2 m (ω 20 − ω 2 ) 2 |E|2 − n, E 4πc3 2 1 · , 2 c bezeichnet die Lichtgeschwindigkeit, deren Wert sich aus ω 0 herauskürzt. Siehe zB Gl 20.114 in A Zangwill, Modern Electrodynamics, Cambridge UP, 2013 33 θ ist also der ungerichtete Winkel zwischen der (linear angenommenen) Polarisationsrichtung der elektrischen Feldstärke und der betrachteten Abstrahlungsrichtung n. 32 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN also dP q2 (n) = Π · sin2 θ mit Π = dΩ 4πε0 q m 2 |E| 2 ω2 ω 2 − ω 20 2 82 1 . 8πc3 Im Grenzfall ω 0 ≪ ω schwach gebundener Ladung gilt ω 2 / (ω 2 − ω 20 ) ≈ 1, sodass die Strahlungsleistung frequenzunabhängig wird (Thomsonstreuung). Im Grenzfall ω 0 ≫ ω stark gebundener Ladung hingegen gilt ω 2 / (ω 20 − ω 2 ) ≈ (ω/ω 0 )2 . In diesem Bereich wächst die Strahlungsleistung mit (ω/ω 0 )4 (Rayleighstreuung). Von dieser Beobachtung gehen Erkläungen für das Blau des Himmels aus. 2 Figur (1.28) zeigt den Graphen der Funktion x → (x2 / (x2 − 1)) , der die Frequenzabhängigkeit von Π als Funktion von ω/ω 0 bestimmt, im Rayleighbereich rot und im Thomsonbereich blau. Um x = 1 ist die Funktion unbeschränkt, dh für ω → ω 0 wächst die Strahlungsleistung unbeschränkt an. Dieser Sachverhalt weist auf ein resonantes Anwachsen der Ausstrahlung hin, ist aber natürlich nicht beim Wort zu nehmen. Er ist das Resultat einer unvollständigen Modellierung. Die Rückwirkung der Ausstrahlung auf die erzwungene Bewegung γ fehlt. 1.5 1.25 1 0.75 0.5 0.25 0 0 1.25 2.5 3.75 5 x 2 Abbildung 1.28: Die Funktion (x2 / (x2 − 1)) Die gemittelte Richtungsdichte dP /dΩ (n) wird vielfach auch auf die pro Flächeneinheit einfallende periodengemittelte Einstrahlungsleistung bezogen. Diese einfallende Strahlungsintensität I ist im vorliegenden Fall34 durch I = ε0 c |E|2 /2 gegeben. Somit folgt für den differentiellen Streuquerschnitt (dσ/dΩ) (n) = dP (n) /I dΩ dσ Π (n) = · sin2 θ. dΩ I Der richtungsunabhängige Vorfaktor Π/I hat die Dimension einer Fläche: Π = r02 · I ω2 ω 2 − ω 20 2 mit r0 = q2 . 4πε0 mc2 Der Vektor E steht senkrecht auf die Ausbreitungsrichtung m ∈ V einer ebenen elektromagnetischen Welle. Ist diese Ausbreitungsrichtung gewählt, dann ist E auf 34 Siehe zB Gl (16.42), (16.44) in A Zangwill, Modern Electodynamics, Cambridge UP, 2013. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 83 den 2d Untervektorraum m⊥ eingeschränkt. Sei auch |E| > 0 gewählt und es sei die Richtung ε = E/ |E| gleichverteilt am Einheitskreis S1m ⊂ m⊥ . Sei (ε1 , ε2 , m) eine ONB von V. Dann gilt für den Erwartungswert der periodengemittelten Strahlungsleistung in Richtung von n Π dP (n) = dΩ 2π 2π 0 1 − n, cos (α) ε1 + sin (α) ε2 2 dα. Aufgrund der Invarianz der Gleichverteilung auf S1m unter Drehungen um m, kann oEdA die ONB (ε1 , ε2 , m) so gewählt werden, dass ε1 in der von n und m erzeugten Ebene liegt. Dann folgt, dass n, ε2 = 0, und daher 1 dP (n) = Π dΩ 2π 2π 0 1 − cos2 (α) cos2 (θ1 ) dα = Π · 1 − 1 cos2 θ1 . 2 Dabei ist θ1 der ungerichtete Winkel zwischen ε1 und n. Für den Winkel Θ zwischen Einfallsrichtung m und Ausstrahlungsrichtung n folgt 1− 1 1 1 1 cos2 θ1 = 1 − sin2 Θ = 2 − sin2 Θ = 1 + cos2 Θ 2 2 2 2 und somit für die perioden- und polarisationsgemittelte Strahlungsleistung als Funktion des Streuwinkels Θ zwischen Einfallsrichtung und Ausstrahlungsrichtung dP 1 q2 q (n) = Π · 1 + cos2 Θ mit Π = dΩ 2 4πε0 m 2 |E|2 8πc3 2 ω2 ω 2 − ω 20 . Schließlich wird noch die insgesamt in alle Richtungen n abgestrahlte periodengemittelte Leistung berechnet. Dazu ist n über die Einheitssphäre S2 aufzuintegrieren, wofür sich Kugelkoordinaten zur Polarrichtung m anbieten. Dann ist Θ ≡ θ der Polarwinkel der Kugelkoordinaten. Es gilt π 2π dϕ 0 0 cos2 θ sin θdθ = − 2π 3 π 0 ′ cos3 θ dθ = − 2π cos3 θ 3 θ=π θ=0 = 4π . 3 Daher folgt dP 1 1 8π (n) dΩ = Π4π 1 + = Π. 2 3 3 n∈S2 dΩ Der zugehörige polarisationsgemittelte gesamte Wirkungsquerschnitt erfüllt dementsprechend 2 dσ 8π 2 ω2 σ= (n) dΩ = · r0 · . 3 ω 2 − ω 20 n∈S2 dΩ P = 1.4.9 *Klassischer Zeemaneffekt In der Endphase seines ungeheuer ertragreichen Entdeckerlebens, im Jahr 1862, versuchte Faraday die Erzeugung von Licht durch ein Magnetfeld zu beeinflussen.35 Er 35 Siehe p. 122-3 in N Forbes, B Mahon, Faraday, Maxwell and the electromagnetic Field, Prometheus, 2014. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 84 färbte eine zwischen den Polen eines Elektromagneten brennende Gasflamme mit Kochsalz ein und beobachtete, ob die Frequenz der Natrium D-Linie von der Stärke des Magnetfeldes abhängt. Er konnte eine solche Abhängigkeit nicht nachweisen. Erst um 1896 gelang es Zeeman mit stärkeren Magneten, als sie Fraday zur Verfügung standen, den Effekt nachzuweisen. Mit Unterstützung durch Lorentz konnte Zeeman die entscheidende Frage nach dem Zusammenhang zwischen Polarisation und Richtung des ausgesandten Lichtes angehen.36 So konnte geklärt werden, dass eine negative Ladung im Atom für die Abstrahlung des Lichtes sorgt. Die folgende Modellrechnung zeigt, wie diese Überlegung funktioniert. Sei V ein reeller Vektorraum der Dimension 3. In V sind ein Skalarprodukt ·, · und eine Orientierung gewählt. Damit ist auch das Kreuzprodukt zweier Vektoren von V erklärt. Das Elektron eines Thomsonschen Wasserstoffatoms ist im Inneren der positiven Ladungswolke harmonisch an seine Gleichgewichtslage 0 ∈ V gebunden. Wird das Atom einem (räumlich und zeitlich konstanten) Magnetfeld B ∈ V ausgesetzt, dann erfüllt der Elektronenort γ (t) zur Zeit t das homogen lineare System zweiter Ordnung γ̈ (t) − e B × γ̇ (t) + ω 20 γ (t) = 0 für alle t ∈ R. m (1.45) Hier bezeichnet −e < 0 die Ladung und m die Masse des an die positive Wolke gebundenen Punktteilchens (Elektrons). Die Frequenzkonstante ω 0 > 0 wird vom Radius der Ladungswolke bestimmt. Für B = 0 wird n = B/ |B| gesetzt und die Kurve γ wie im Fall der E × BDrift in eine Komponente γ parallel zu B und eine Komponente γ ⊥ senkrecht zu B zerlegt. Es gilt also γ = γ + γ ⊥ mit γ = n n, γ und γ ⊥ = γ − n n, γ . Die Bewegungsgleichungen der beiden Komponenten entkoppeln voneinander. Es gilt erstens (1.46) γ̈ (t) + ω 20 γ (t) = 0 für alle t ∈ R. Zweitens gilt mit ω = e |B| /m > 0 und Ln : n⊥ → n⊥ , v → n × v γ̈ ⊥ (t) − ωLn γ̇ ⊥ (t) + ω 20 γ ⊥ (t) = 0 für alle t ∈ R. (1.47) Dabei ist n⊥ = {v ∈ V : v, n = 0} das orthogonale Komplement von R · n. Zu jeder maximalen Lösungen γ von Gleichung (1.46) existieren Konstanten A, B ∈ R, sodass γ (t) = [A cos (ω 0 t) + B sin (ω 0 t)] · n für alle t ∈ R. Die Bewegung parallel zu B bleibt also von B unbeeinflusst. Einige maximale Lösungen von Gleichung (1.47) lassen sich über einen symmetriemotivierten Ansatz finden. Die 2-dimensionale Bewegungsgleichung (1.47) ist 36 Siehe sect 40 in F K Richtmeyer, E H Kennard, Introduction to modern Physics, McGraw-Hill, 1947. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 85 invariant unter Drehungen um 0 und zudem autonom. Es könnten daher gleichförmige Drehbewegungen als Lösungen geben. Versuchen wir es also mit dem Ansatz γ ⊥ (t) = eΩtLn γ ⊥ 0 ⊥ mit Ω ∈ R und γ ⊥ 0 ∈ n . Der Ansatz löst die Differentialgleichung (1.47) genau 2 dann, wenn Ω − ωΩ − ω 20 = 0 gilt. Ω kann also einen der beiden Werte / ω ω 2 + ω 20 Ω± = ± 2 2 annehmen. Die Frequenz Ω+ ist positiv und Ω− ist negativ. Siehe Fig. (1.29). 2 1.5 1 0.5 0 0 0.5 1 1.5 2 Abbildung 1.29: Die Abbildungen ω/ω 0 → Ω+ /ω 0 (rot) und ω/ω 0 → −Ω− /ω 0 (grün) Damit gibt es zwei 2d Räume maximaler Lösungen, die aus ’Eigenmoden’ ⊥ γ⊥ ± : R → n , ⊥ ⊥ t → eΩ± tLn γ ⊥ ± (0) mit γ ± (0) ∈ n bestehen. Eine Lösung γ ⊥ + umkreist 0 mit der Kreisfrequenz Ω+ > ω 0 im Rechtsschraubensinn um B und eine Lösung γ ⊥ − umkreist 0 mit der Kreisfrequenz |Ω− | > 0 im Linksschraubensinn um B. Der Drehsinn von γ ⊥ ± überträgt sich auf die in Richtung von B bei einer Bewegung ⊥ γ ± ausgesandte Strahlung. Sie ist vollständig zirkular polarisiert, da die Bewegung γ in Richtung von B nicht abstrahlt. (Zeeman musste ein Loch durch einen der Magnetpole bohren, um die Flamme in Richtung n durch Polarisationsfilter und Prisma zu beobachten.) Anmerkungen: 1. Jede maximale Lösung von (1.47) ist Summe einer Lösung des Typs γ ⊥ + und einer des Typs γ ⊥ , denn so lässt sich jede Anfangsvorgabe erfüllen. Fig (1.30) − Ω+ tLn Ω− tLn ⊥ zeigt einen Bahnausschnitt von Γ = e + 0, 5 · e e mit e ∈ n . Fig Ω+ tLn Ω− tLn (1.31) zeigt G = |Ω− | e + Ω+ e e. Hier ruht das Teilchen in den Punkten maximalen Abstands von 0. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 86 2. Zu Zemanns Zeit waren nur Werte von ω erreichbar, die ω/ω 0 ≪ 1 erfüllen. Daher genügt es, die Frequenzen |Ω± | durch ihre Tangentialapproximation bei 0 zu nähern. Es gilt |Ω± | ≈ ω 0 ± ω/2. Die Verschiebung ω/2 der ungestörten Frequenz ω 0 durch das Magnetfeld wird als Larmorkreisfrequenz bezeichnet. Sie ist die Hälfte der Zyklotronkreisfrequenz. 3. Mit besseren Messmethoden wurde später klar, dass auch die Aufspaltung der Natrium D-Linie in einem Magnetfeld etwas komplexer ist, als es das hier beschriebene Modell denkbar macht. (Das Modell kennt zB keinen Spin.) Die genaueren Messungen fanden erst eine Erklärung durch die Quantentheorie. Abbildung 1.30: Bahn von Γ Abbildung 1.31: Bahn von G 1.4.10 Legendresche Differentialgleichung 1 Es soll nun die Legendresche Differentialgleichung 1 − x2 y ′′ (x) − 2xy ′ (x) + n(n + 1)y(x) = 0 (1.48) genauer behandelt werden. Natürlich kann anstelle des Definitionsintervalls (−1, 1) auch ganz R als Definitionsbereich für die Legendresche Differentialgleichung (1.48) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 87 gewählt werden. Da aber die Koeffizientenfunktion (1 − x2 ) vor der höchsten Ableitung y ′′ bei x = ±1 Nullstellen hat, ist die Legendresche Differentialgleichung auf ganz R nicht von dem in Definition 40 betrachteten Typ. Auf das Legendrepolynom Pn , das auf ganz R Lösung der Legendreschen Differentialgleichung mit Parameter n ∈ N0 ist, soll zunächst etwas auführlicher eingegangen werden. Eine zweite, von Pn linear unabhängige Lösung der Legendreschen Differentialgleichung auf (−1, 1), die Legendrefunktion der „zweiten Art”, wird am Ende des Kapitels ermittelt. Sie hat keine stetige Fortsetzung auf das abgeschlossene Intervall [−1, 1]. Definition 45 (Rodrigues’ Formel) Sei n ∈ N0 . Dann heißt das Polynom Pn : R → R mit Pn (x) = 1 2n n! d dx n x2 − 1 n n-tes Legendrepolynom. Einige offensichtliche Eigenschaften der Legendrepolynome: • Das reelle Polynom Pn hat als n-fache Ableitung eines Polynoms vom Grad 2n den Grad n. • Pn ist als n fache Ableitung der geraden Funktion x → (x2 − 1)n Cn gerade, falls n gerade ist und ungerade sonst. Es gilt also Pn (−x) = (−1)n Pn (x) • Pn (1) = 1, denn wiederholtes Ableiten von (x2 − 1)n ergibt ein Polynom Q, sodass d dx = d dx n (x2 − 1)n = d dx n−1 n(x2 − 1)n−1 2x n−2 n(n − 1)(x2 − 1)n−2 (2x)2 + n(x2 − 1)n−1 2 = . . . . = n! (2x)n + (x2 − 1)Q(x). Also folgt Pn (1) = 1. • Pn hat genau n Nullstellen. Sie sind alle im Intervall I = (−1, 1) . Das sieht n man so: Das Polynom Rn (x) = (x2 − 1) hat keine Nullstelle in I, hat aber Nullstellen in den Randpunkten von I. Nach dem Satz von Rolle hat daher Rn′ mindestens eine Nullstelle in I. Für n > 1 hat aber Rn′ Nullstellen in den Randpunkten von I. Daher hat wieder nach dem Satz von Rolle Rn′′ mindestens zwei Nullstellen in I. Diese trennen die Nullstellen von Rn′ . Dieses Argument wiederholt sich bis zur n-ten Ableitung von Rn , die ein Vielfaches von Pn ist. Daher hat Pn mindestens n Nullstellen im Intervall I. Als Polynom n-ten Grades hat aber Pn höchstens n Nullstellen. Somit ist die Zahl der Nullstellen von Pn genau n und sie liegen alle in I. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 88 • Einige Spezialfälle sind: P0 (x) = 1, P3 (x) = 1 3x2 − 1 , 2 1 P4 (x) = 35x4 − 30x2 + 3 . 8 P1 (x) = x, P2 (x) = 1 5x3 − 3x , 2 Abbildung (1.32) zeigt die Graphen von P1 , . . . P4 im Bereich −1, 1 < x < 1, 1. y 2 1.5 1 0.5 0 -1 -0.5 0 -0.5 0.5 1 x -1 -1.5 Abbildung 1.32: Legendrepolynome Pn für n = 1, . . . 4 Satz 46 Für alle x ∈ R gilt (1 − x2 ) Pn′′ (x) − 2xPn′ (x) + n(n + 1)Pn (x) = 0. Beweis. Zunächst eine Vorüberlegung: Rechne nach, dass für alle x ∈ R (1 − x2 ) d 2 (x − 1)n + 2nx(x2 − 1)n = 0. dx Diese Gleichung wird nun n + 1 mal nach x differenziert. Dies gelingt überschaubar mithilfe der Leibnizregel, die für beliebige n-mal differenzierbare reellwertige Funktionen f und g mit reellem Definitionsbereich gilt. Sie sagt dn (f g) = dxn n k=0 n (k) (n−k) f g . k Der Beweis der Leibnizregel geht induktiv und wird weiter unten nachgeholt. Mithilfe d der Leibnizregel folgt mit der Abkürzung D = dx zunächst Dn+1 (1 − x2 )D(x2 − 1)n * + n+1 n+1 n+1 2 n+2 n+1 n = (1 − x ) D − 2x D −2 D (x2 − 1)n 0 1 2 = (1 − x2 )Dn+2 − 2(n + 1)xDn+1 − n(n + 1)Dn (x2 − 1)n . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Analog ergibt sich D n+1 89 * + n+1 n+1 n+1 n 2nx(x − 1) = 2nxD + 2nD (x2 − 1)n 0 1 n+1 n 2 = 2n xD + (n + 1) D (x − 1)n . n 2 Daraus folgt durch Addition 0 = Dn+1 (1 − x2 )D + 2nx (x2 −1)n = (1 − x2 )D2 − 2xD + n(n + 1) Dn (x2 −1)n . Daher löst das Polynom (n-ten Grades) cDn (x2 − 1)n für jedes c ∈ R auf ganz R die Legendresche Differentialgleichung. Nun zum Beweis der Leibnizregel. Lemma 47 Sei I ⊂ R und f, g : I → R. Die beiden Funktionen f und g seien n-mal diffbar in x. Dann gilt die Leibnizregel n (f g)(n) (x) = k=0 n (k) (n−k) f g (x) . k Beweis. Der Beweis wird durch Induktion geführt. Für n = 0 ist die Formel offensichtlich richtig. Für n = 1 spezialisiert sich die Formel auf die Produktregel. Annahme: die Formel gilt für ein n ≥ 1. Zeige nun, dass sie dann auch für n + 1 gilt, falls f und g nicht nur n-mal, sondern n + 1-mal diffbar sind. Dazu wird n (f g)(n) = k=0 n (k) (n−k) f g k mithilfe der Produktregel einmal abgeleitet. Dies geht, da die Funktionen f (k) und g (n−k) für k = 0, . . . n mindestens einmal differenzierbar sind. Es folgt (n+1) (fg) n−1 = k=0 n = k=1 d = dx n k=0 n (k) (n−k) f g = k n k=0 n k f (k+1) g (n−k) + f (k) g (n+1−k) n n (k+1) (n−k) n (n+1) n n (k) (n+1−k) f g + f g+ fg (n+1) + f g k k n 0 k=1 n n n (k) (n+1−k) f (k) g (n+1−k) + 1 · f (n+1) g + 1 · fg (n+1) + f g k−1 k k=1 + n * n n = + f (k) g (n+1−k) + f (n+1) g + f g (n+1) k − 1 k k=1 Aus der Definition der Binomialkoeffizienten folgt n n n! n! + + = k−1 k (k − 1)! (n + 1 − k)! (k)! (n − k)! * + (n + 1)! k n+1−k n+1 = + = . k! (n + 1 − k)! n + 1 n+1 k Damit gilt die Leibnizregel auch für n + 1 und in der Folge für alle n ∈ N0 . Eine nützliche Eigenschaft der Legendrepolynome auf (−1, 1) ist ihre „Orthogonalität”. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1 −1 Satz 48 Sei n, m ∈ N0 . Dann gilt Pn (x)Pm (x)dx = 90 2 δ . 2n+1 nm Beweis. Sei zunächst n = m. Weiter sei oEdA n < m und daher m = 0. Dann gilt aufgrund der Legendreschen Differentialgleichung + * 1 1 −1 d 2 d (1 − x ) Pm (x)dx. Pn (x)Pm (x)dx = Pn (x) m(m + 1) −1 dx dx −1 Partielle Integration der Ableitungen * + 1 d 2 d Pn (x) (1 − x ) Pm (x)dx dx dx −1 + 1 * dPm 2 dPn = − (1 − x ) (x) (x)dx + (1 − x2 )Pn Pm′ |1−1 dx dx −1 führt unter Berücksichtigung des Verschwindens der Randterme schließlich zu 1 n(n + 1) m(m + 1) Pn (x)Pm (x)dx = −1 1 1 Pn (x)Pm (x)dx. −1 Wäre −1 Pn (x)Pm (x)dx = 0, dann folgte n(n + 1) = m(m + 1), was m = −n − 1 oder n = m verlangt. Beides steht im Widerspruch zu n, m ∈ N0 und n = m. Also folgt die Behauptung für n = m. Nun zum Fall n = m. Es gilt nach Rodrigues’ Formel und mit n-facher partieller Integration +* n + 2 1 1 * n 1 d d n n 2 2 2 (Pn (x)) dx = dx x −1 x −1 n 2n n! dxn −1 −1 dx = 2 1 n 2 n! 1 −1 2 (−1)n x2 − 1 1 1 = (−1)n x2 − 1 2n n! −1 Einschub: Für n ∈ N0 gilt n 1 −1 Damit folgt 1 1 − x2 n d2n x2 − 1 dx2n 1 (2n)!dx = (2n)! n 2 n! n dx = 22n+1 1 (Pn (x)) dx = (2n)! n 2 n! −1 2 2n+1 Nun wird noch der Einschub bewiesen. Sei In := folgt für n ∈ N mit partieller Integration 1 In = −1 = In−1 + 1 − x2 1 2n 1 − x2 1 x −1 n−1 1 −1 = In−1 − 1 −1 n 1 − x2 dx. 1 dx = In−1 − 1 In . 2n n (1 − x2 ) dx für n ∈ N0 . Dann −1 n 2 (n!)2 2 = . (2n + 1)! 2n + 1 dx = In−1 + d 1 − x2 dx dx (n!)2 . (2n + 1)! 2 2 n x (−x) 1 − x2 1 2n n−1 1 −1 1 − x2 dx n dx KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Damit gilt für alle n ∈ N die Rekursion In = 2n I . 2n+1 n−1 91 Ihre Auflösung ergibt 2n 2 (n − 1) 2n n! · In−2 = . . . = I0 2n + 1 2 (n − 1) + 1 (2n + 1) (2n − 1) . . . · 3 · 1 2n n! = · 2n · (2n − 2) . . . · 4 · 2 · I0 (2n + 1) 2n (2n − 1) (2n − 2) . . . · 4 · 3 · 2 · 1 (2n n!)2 = I0 . (2n + 1)! In = Wegen I0 = 2 folgt schließlich der Einschub. Eine Zerlegung von Pn in Monome gibt der folgende Satz. Satz 49 Sei x ∈ R und n ∈ N. Dann gilt 1 Pn (x) = n 2 [n/2] (−1)k k=0 n k 2n − 2k n−2k x . n n Beweis. Man entwickelt das Polynom (x2 − 1) in der Formel von Rodrigues mit dem binomischen Lehrsatz und leitet dann n-mal ab. Die Details werden in den Übungen ausgeführt. Der folgende Satz ist für die Multipolentwicklung der Potentialtheorie wichtig. −1/2 Er zeigt, dass die Abbildung t → (1 − 2xt + t2 ) auf dem Intervall (−1, 1) für x ∈ (−1, 1) die Werte Pn (x) als Koeffizienten ihrer Potenzreihe um 0 hat. Diese Abbildung heißt daher die erzeugnede Funktion der Legendrepolynome. Satz 50 Seien t, x ∈ (−1, 1) . Dann gilt (1 − 2xt + t2 ) −1/2 = ∞ n=0 Pn (x) tn. Den Beweis wird in Math. Meth. 2 im Kapitel über radial separierte Lösungen der 3d Laplacegleichung geführt. Ein direkter Beweis ist in Kap. II, §4.3.2 d von [4] (p. 76) angedeutet. Eine Rückführung des Legenrepolynoms Pn auf Pn−1 und Pn−2 gibt die folgende Rekursionsrelation. Satz 51 Für n ∈ N und x ∈ R gilt (n + 1) Pn+1 (x) = (2n + 1) xPn (x) − nPn−1 (x) . Beweis. Die n+1 Koeffizienten eines Polynoms vom Grad n sind durch die Werte des Polynoms an n + 1 voneinander verschiedenen Stellen festgelegt. Also gilt: Sind zwei Polynome auf einem nichtleeren offenen Intervall gleich, so sind sie auch auf −1/2 n ganz R gleich. Sei daher x ∈ (−1, 1) . Leite t → (1 − 2xt + t2 ) = ∞ n=0 Pn (x) t mit −1 < t < 1 nach t ab und multipliziere dann mit (1 − 2xt + t2 ) . Das ergibt 1 − 1 − 2xt + t2 2 −1/2 2 (2t − 2x) = 1 − 2xt + t ∞ n=1 nPn (x) tn−1 . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 92 (Potenzreihen können gliedweise differenziert werden!) Die linke Seite hat nach dem Satz von der erzeugenden Funktion die Potenzreihe ∞ n n=0 xPn (x) t − ∞ Pn−1 (x) tn . n=1 Die rechte Seite hingegen hat die Potenzreihe ∞ n n=0 (n + 1) Pn+1 (x) t − 2x ∞ n nPn (x) t + n=1 ∞ n=1 (n − 1) Pn−1 (x) tn . Koeffizientenvergleich zum Monom tn ergibt für n ∈ N xPn (x) − Pn−1 (x) = (n + 1) Pn+1 (x) − 2xnPn (x) + (n − 1) Pn−1 (x) . Das ist äquivalent zu (n + 1) Pn+1 (x) = (2n + 1) xPn (x) − nPn−1 (x) . Koeffizientenvergleich zum Monom t0 ergibt P1 (x) = xP0 (x) . Eingeschränkt auf das Intervall (−1, 1) ist die Legendresche Differentialgleichung vom Typ der Definition 40. Es gibt daher ein Paar von linear unabhängigen Lösungen mit Definitionsbereich (−1, 1). Die Restriktion von Pn auf (−1, 1) ist eine maximale Lösung der auf (−1, 1) eingeschränkten Gleichung (1.48). Es soll nun eine weitere maximale Lösung auf (−1, 1) („Legendrefunktion zweiter Art”) bestimmt werden, die Pn zu einem Fundamentalsystem ergänzt. 1.4.11 d’Alemberts Reduktionsverfahren Jede Lösung y einer homogen linearen Differentialgleichung zweiter Ordnung kann lokal um einen Punkt x0 ∈ I, für den y(x0 ) = 0, mit der folgenden Methode sie heißt d’Alemberts Reduktionsverfahren - zu einem Fundamentalsystem ergänzt werden. Seien p und q reelle stetige Funktionen auf dem Intervall I. Seien y1 , y2 : I → R Lösungen der linearen Diffgleichung y ′′ + py ′ + qy = 0. Dann gilt für die Wronskideterminante W : I → R, x → y1 y2′ − y1′ y2 , dass W ′ = −pW. (Übung) Daraus folgt für x0 , x ∈ I, dass x W (x) = W (x0 ) exp − p(ξ)dξ . x0 Aus W (x0 ) = 0 folgt somit W (x) = 0 für alle x ∈ I. Für y1 (x0 ) = 0 ist y1 in einer genügend kleinen Umgebung von x0 nirgends 0. In einer solchen Umgebung folgt mit der Quotientenregel W (x) = y1 (x)2 d dx y2 y1 (x). KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Ersetzen von W (x) durch W (x0 ) exp − d dx y2 y1 (x) = x x0 93 p(ξ)dξ führt auf W (x0 ) exp − y1 (x)2 x p(ξ)dξ . x0 Integration ergibt y2 (x) = y1 (x) y2 (x0 ) + W (x0 ) y1 (x0 ) x exp − z x0 p(ξ)dξ y1 (z)2 x0 dz . Dieser Zusammenhang zwischen den beiden Lösungen y1 und y2 kann in einer Umgebung von x0 ∈ I mit y1 (x0 ) = 0 dazu benützt werden, um etwa mit W (x0 ) = 1 und y2 (x0 ) = 0 aus einer gegebenen Lösung y1 eine zweite lokale, linear unabhängige Lösung y2 zu berechnen. Im Fall der Legendreschen Differentialgleichung gilt p(x) = − und daher mit x0 ∈ (−1, 1) 2x d = ln 1 − x2 2 1−x dx W (x) = W (x0 ) exp − ln 1 − x2 1 − x20 = W (x0 ) 1 − x20 . 1 − x2 Die Wronskideterminante eines Fundamentalsystems auf (−1, 1) divergiert somit für x → ±1 und das Fundamentalsystem kann nicht auf das abgeschlossene Intervall fortgesetzt werden. Das ist auch nicht verwunderlich, da aus der Legendreschen Differentialgleichung für eine Lösung, deren Definitionsbereich x = 1 enthält, −2y ′ (1) + n(n + 1)y (1) = 0 folgt. Daraus ergibt sich, dass die Wronskideterminante W (1) zweier beliebiger in 1 definierter Lösungen gleich 0 ist. Damit ist der Raum aller auf [−1, 1] definierten Lösungen der Legendreschen Differentialgleichung mit Parameter n der Raum R·Pn . Das oben skizzierte Verfahren liefert, trotz Nullstellen von Pn , eine maximale linear unabhängige Lösung der Legendreschen Differentialgleichung auf dem ganzen Bereich (−1, 1). (Für n = 0 wird das Verfahren gar nicht benötigt.) Für den 2-dimensionalen Vektorraum Ln der auf ganz (−1, 1) definierten Lösungen der Legendreschen Differentialgleichung mit Parameter n folgt so 1+x L0 = {αa,b | a, b ∈ R} mit αa,b (x) := a + b ln für x ∈ (−1, 1) , 1−x * + 1+x L1 = {αa,b | a, b ∈ R} mit αa,b (x) := ax + b x ln − 2 für x ∈ (−1, 1) . 1−x Wir zeigen die Aussage über L1 . Wähle y1 (x) = x. Dann ergibt sich als eine linear unabhängige Lösung auf (0, 1) die Funktion y2 mit d’Alemberts Formel x y2 (x) = x x0 W (u) du. u2 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 94 Mit der Wahl W (x0 ) (1 − x20 ) = 1 und x0 = 1/2 folgt für 0 < x < 1 x du . u2 (1 − u2 ) y2 (x) = x 1/2 Das Integral ergibt sich mittels der Partialbruchzerlegung x2 zu y2 (x) = x 1 1 1 = 2+ 2 (1 − x ) x 2 1 1 1+x 1 ln − + 2 − ln 3 2 1−x x 2 1 1 + 1+x 1−x * + * + 1 1+x 1 = x ln − 2 + x 2 − ln 3 . 2 1−x 2 Subtrahiert man auf (0, 1) von y2 die Lösung 2 − 12 ln 3 y1 und multipliziert dann mit 2, so erhält man die Lösung f2 (x) = x ln 1+x − 2. 1−x Die Funktion f2 ist die Einschränkung einer geraden C 2 -Funktion auf (−1, 1) . Diese ergänzt daher y1 zu einem Fundamentalsystem der Legendre’schen Differentialgleichung für n = 1. Eine Verallgemeinerung der Legendreschen Differentialgleichung ist 1 − x2 y ′′ (x) − 2xy ′ (x) + λ − m2 1 − x2 y(x) = 0 (1.49) auf I = (−1, 1) mit m ∈ N0 und λ ∈ R. Auch diese Gleichung heißt Legendresche Differentialgleichung. Eine Methode zu ihrer Lösung wird im folgenden Abschnitt über Potenzreihenlösungen erläutert. Diese Methode bringt den folgende Sachverhalt zutage: Gleichung (1.49) hat genau dann eine von 0 verschiedene Lösung, die sich stetig auf den Rand des Intervalls (−1, 1) fortsetzen lässt, wenn λ = n(n + 1) für ein n ∈ N0 mit n ≥ m. Dieses Faktum ist bei der Bestimmung dreidimensionaler Potentiale und Schwingungsvorgänge bedeutsam. Dort regelt die (verallgemeinerte) Legendresche Differentialgleichung die Abhängigkeit des betrachteten Feldes vom Polarwinkel eines Kugelkoordinatensystems. Die stetige Fortsetzbarkeit eines Feldes in die polare Achsensingularität der Kugelkoordinaten erzwingt dann die „Diskretisierung” von λ ∈ R zu λ ∈ {n(n + 1) | n ∈ N0 }. Genaueres dazu findet sich in der Vorlesung Math. Meth. Phys. 2 oder in Kapitel 13 von [12]. 1.4.12 Methode des Potenzreihenansatzes Ein systematisches Verfahren, die Legendrepolynome als Lösungen der Legendreschen Differentialgleichung zu finden, ist die Methode des Potenzreihenansatzes. Siehe Übung 22. Diese Methode funktioniert auch bei vielen anderen gewöhnlichen homogen linearen Differentialgleichungen mit nichtkonstanten Koeffizientenfunktionen. Den Grund für das Funktionieren der einfachsten Variante der Lösungsmethode durch Potenzreihenansatz (Frobeniusmethode) gibt der folgende Satz. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 95 Satz 52 Sei I ⊂ R ein Intervall mit 0 ∈ I. Zwei Funktionen p und q von I nach R mögen um 0 die Potenzreihenentwicklungen p(x) = ∞ k ak x und q(x) = k=0 ∞ bk xk k=0 mit den Konvergenzradien rp > 0 und rq > 0 haben. Die Konvergenzintervalle (−rp , rp ) und (−rq , rq ) der Potenzreihen seien in I enthalten. Dann hat die maximale Lösung αc0 ,c1 der Differentialgleichung y ′′ (x) + p(x)y ′ (x) + q(x)y(x) = 0 zur Anfangsbedingung y(0) = c0 und y ′ (0) = c1 eine Potenzreihenentwicklung um 0 mit einem Konvergenzradius r ≥ min {rp , rq }. Es gilt dann für alle x ∈ (−r, r) n ck xk . αc0 ,c1 (x) = c0 + c1 x + lim n→∞ k=2 Die Koeffizenten ck sind für alle k ∈ {2, 3, 4, . . .} durch die Rekursionsformeln k (k + 1) (k + 2) ck+2 = − k (k + 1) ck+1 = − m=0 k−1 m=0 [(k − m + 1) am ck−m+1 + bm ck−m ] für k ∈ N0 , [(k − m) ak ck−m + bk ck−m−1 ] für k ∈ N0 auf c0 , c1 zurückgeführt und durch eine Wahl von (c0 , c1 ) ∈ R2 eindeutig festgelegt. Die Beweisidee wird an den einfacheren Spezialfällen der Legendreschen und Hermiteschen Differentialgleichung klar gemacht. 1.4.13 Legendresche Differentialgleichung 2 Für y : (−1, 1) → R gelte für alle x ∈ (−1, 1) und für ein λ ∈ R 1 − x2 y ′′ (x) − 2xy ′ (x) + λy (x) = 0. k Lösungsansatz: Ist y (x) = ∞ k=0 ck x eine Potenzreihe mit dem Konvergenzradius ρ > 0, dann gilt für alle x mit |x| < ρ ′ y (x) = ′′ y (x) = ∞ k=1 ∞ k=2 kck xk−1 , k (k − 1) ck x k−2 = ∞ k=0 (k + 2) (k + 1) ck+2 xk . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 96 Für x2 y ′′ (x) und xy ′ (x) gilt daher für alle x mit |x| < ρ xy ′ (x) = 2 ′′ x y (x) = ∞ kck xk = k=1 ∞ ∞ kck xk , k=0 ∞ k k (k − 1) ck x = k=2 k=0 k (k − 1) ck xk . Daraus folgt für |x| < ρ wegen x2 y ′′ (x) + 2xy ′ (x) − λy (x) = = ∞ k=0 dass ∞ [k (k − 1) + 2k − λ] ck xk = k (k + 2) (k + 1) ck+2 x = k=0 ∞ k=0 ∞ k=0 [k (k + 1) − λ] ck xk , [k (k + 1) − λ] ck xk . Aus dem Identitätssatz für Potenzreihen folgt somit für alle k ∈ N0 die Rekursion ck+2 = Rk ck , mit Rk := (k + 1) k − λ (k + 2) (k + 1) Die Teilfolgen (c2k )k∈N0 und (c2k+1 )k∈N0 sind über die Rekursion jeweils durch c0 und c1 festgelegt. Für alle k mit k (k + 1) > λ ist der Faktor Rk , der die Rekursion bestimmt, für alle hinreichend großen k positiv. Es gilt also für alle k ≥ k0 mit hinreichend großem k0 Rk := (k + 1) k − λ k λ = 1− (k + 2) (k + 1) k+2 (k + 1) k > 0. Das Vorzeichen der Folgenglieder ck ändert sich also ab einem hinreichend großen k0 nicht mehr. Wenn ein n ∈ N0 existiert, für das λ = n (n + 1) gilt, folgt Rn = 0 und daher 0 = cn+2j für alle j ∈ N. (Falls solch ein n mit λ = n (n + 1) existiert, dann ist es eindeutig, da n → n (n + 1) streng monoton ist.) Gilt λ = n (n + 1) für ein gerades n, dann „bricht die gerade indizierte Teilfolge ab“, d.h. es gilt c2k = 0 für alle k > n/2. Die ungerade indizierte Teilfolge bricht in diesem Fall nicht ab. Gilt hingegen λ = n (n + 1) für ein ungerades n, dann „bricht die ungerade indizierte Teilfolge ab“, d.h. es gilt c2k+1 = 0 für alle 2k + 1 > n, und die gerade indizierte Teilfolge bricht nicht ab. Falls kein n ∈ N0 existiert, sodass λ = n (n + 1) , dann folgt aus c0 = 0, dass auch c2k = 0 für alle k ∈ N. Analog folgt aus c1 = 0, dass c2k+1 = 0 für alle k ∈ N. Mit der Wahl c1 = 0 ergibt sich für c0 = 0 eine Potenzreihe c0 y+ mit ausschließlich geraden Potenzen. Mit der Wahl c0 = 0 und c1 = 0 hingegen ergibt sich eine Potenzreihe c1 y− mit ausschließlich ungeraden Potenzen. Es gilt also y+ (x) = 1 + ∞ k=1 2k c2k x und y− (x) = x 1 + ∞ k=1 c2k+1 x2k . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 97 Für λ = n (n + 1) mit n ∈ N0 ist - je nach dem ob n gerade oder ungerade ist entweder y+ oder y− ein Polynom vom Grad n, dessen Potenzreihe dann natürlich auf ganz R konvergiert. In allen anderen Fällen ergibt sich der Konvergenzradius von y± wie folgt. ak k Der Konvergenzradius einer Potenzreihe ∞ k=0 ak x ist durch ρ = limk→∞ ak+1 gegeben, soferne dieser Limes existiert. Siehe Satz 38, §8, Kap. 3, Vol I von [3]. Anwendung dieser Formel auf die Potenzreihe y+ ergibt wegen y+ (x) = ∞ c2k x2 k k=0 c2k mit ak = c2k die Konvergenz der Reihe für alle x2 < limk→∞ c2k+2 = limk→∞ (1/Rk ) = 1. Also hat y+ den Konvergenzradius 1. Analog folgt auch für y− der Konvergenzradius 1. y+ und y− sind also gemäß Konstruktion gerade bzw. ungerade Lösungen der Legendreschen Differentialgleichung auf (−1, 1) . Im Fall einer abbrechenden Potenzreihe mit λ = n (n + 1) gilt die Differentialgleichung sogar auf ganz R. Sei nun u eine der beiden Funktionen y+ und y− mit nicht abbrechender Potenzreihenentwicklung. Welches Konvergenzverhalten hat die Potenzreihe von u (x) für x → 1? Es gilt für N = k + 2n mit k, n ∈ N so, dass Rk > 0 cN = = λ N N −2 N 1− 1 N λ N (N − 1) 1− N −1 · N −4 N −2 · 1− 1− λ N−2 N −3 ...· k k+2 1− λ k k+1 λ λ ...· 1 − (N − 2) (N − 3) (k + 1) k · ck k · ck . Zwischenbehauptung: Das Produkt ΠN mit ΠN = 1− λ N (N − 1) · 1− λ λ ... · 1 − (N − 2) (N − 3) (k + 1) k strebt für N → ∞ einem Grenzwert zu. Warum? Das sieht man so: λ Jeder der Faktoren π j = 1 − j(j−1) liegt zwischen 0 und 1. Daher kann das Produkt logarithmiert werden und es gilt ln ΠN = das asymptotische Verhalten (Taylorentwicklung) ln π j = − N j=k+1 ln π j . Für j → ∞ hat π j λ λ +o . j (j − 1) j (j − 1) Daraus folgt für alle hinreichend großen j die Abschätzung − Die unendliche Reihe 2λ < ln π j < 0. j (j − 1) ∞ j=2 1 j (j − 1) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN ist aber absolut konvergent. Daher konvergiert auch die Reihe Stetigkeit der Exponentialfunktion folgt nun, dass N j=k+1 98 ln π i . Aus der lim ΠN = lim eln ΠN = elimN →∞ ln ΠN . N→∞ N→∞ Wegen N cN = ΠN ·k·ck gibt es somit auch ein γ > 0 mit limn→∞ (N · cN ) = γ ·ck . Daraus folgt aber für die Koeffizienten ck+2n der Reihe für u für alle n > N0 mit hinreichend großem N0 ∈ N die Abschätzung ck+2n 1 γ > . ck 2 k + 2n Der Reihenrest der Reihe für u mit den Termen der Ordnung xk+2n für alle n > N0 > k erfüllt daher für alle x > 0 ∞ n=N0 ∞ ∞ ∞ ck+2n k+2n 1 γ 1 γ k+2n γ k x2n x > xk+2n > x = x . ck 2 n=N k + 2n 2 n=N 3n 6 n=N n 0 0 0 Für x = 1 divergiert diese Reihe bestimmt gegen ∞. Daher divergiert auch die Reihe von u bei x = 1. Gibt es für λ = n (n + 1) eine Linearkombination von von y+ und y− , die in beiden Randpunkten x = ±1 beschränkt ist? Nein, denn die Partialsummen der Reihen y± divergieren wegen des gleichbleibenden Vorzeichens der Koeffizienten ck in den beiden Randpunkten ±1 monoton. Die Partialsummen der geraden Funktion y+ divergieren in beiden Randpunkten gleich, während jene von y− dort gegenläufig divergieren. Damit kann eine Linearkombination zwar in einem Randpunkt konvergieren, nicht aber in beiden. Die Funktionen y± sind also ein Fundamentalsystem der Legendreschen Differentialgleichung. Für λ = n (n + 1) ist genau eine der beiden Funktionen ein Polynom, während die andere eine Potenzreihendarstellung mit dem Konvergenzradius 1 hat. Eine Polynomlösung der DG ist uns jedoch schon bekannt, das Legendrepolynom Pn , das daher eine Linearkombination von y+ und y− sein muss. Der Entwicklungskoeffizient vor der nichtpolynomialen Lösung muss aber 0 sein. Fassen wir das Ergebnis dieser etwas längeren Überlegung zusammen zum Satz 53 Die Legendresche Differentialgleichung auf (−1, 1) mit Parameter λ ∈ R 1 − x2 y ′′ (x) − 2xy ′ (x) + λy (x) = 0 besitzt genau dann nichttriviale maximale Lösungen mit stetiger Fortsetzung auf [−1, 1] , wenn ein n ∈ N0 existiert, sodass λ = n (n + 1) . Für jede solche Lösung y der Legendreschen Differentialgleichung mit λ = n (n + 1) existiert eine Zahl c ∈ R, sodass y (x) = c · Pn (x) für alle x ∈ (−1, 1) . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1.4.14 99 *Hermitesche Differentialgleichung Die Schrödingergleichung für eine Energieeigenfunktion ψ : R → R eines harmonischen Oszillators lautet mit gegebenen Konstanten m, ω, ∈ R>0 2 − 2m ψ ′′ (x) + mω 2 2 x ψ (x) = Eψ (x) für alle x ∈ R. 2 (1.50) Gesucht sind jene Werte von E ∈ R, für die Gleichung (1.50) eine nichttriviale Lösung ψ besitzt, für die der Limes L ψ 2 (x) dx lim L→∞ −L existiert. Für solche Werte von E sind überdies die Lösungen ψ von Gleichung (1.50) zu bestimmen. Äquivalent zu Gleichung (1.50) ist * + ω mω 2 ′′ − ψ (x) + x ψ (x) = Eψ (x) . (1.51) 2 mω Über die Substitution u mω x = ψ (x) ist Gleichung (1.51) äquivalent zu u′′ (ξ) − ξ 2 u (ξ) = − 2E u (ξ) ω Die Bestimmung der stationären Zustände eines quantenmechanischen harmonischen Oszillators führt also nach obiger Parameterreduktion auf die folgende Fragestellung. Zu welchen Werten von ε = E/ ω ∈ R hat die auf ganz R definierte Differentialgleichung u′′ (x) − x2 u(x) + 2εu(x) = 0 (1.52) eine maximale von der Nullfunktion verschiedene Lösung u : R → R, für die das ∞ uneigentliche Integral −∞ u(x)2 dx existiert? Eine kleine Nebenrechnung zeigt: Für u : R → R gilt Gleichung (1.52) genau dann, wenn die Funktion y : R → R mit u(x) = exp (−x2 /2) y(x) eine Lösung der Hermiteschen Differentialgleichung mit λ := ε − 12 ∈ R y ′′ (x) − 2xy ′ (x) + 2λy(x) = 0 (1.53) ist. Sei Lλ der 2-dimensionale Raum der auf ganz R definierten maximalen Lösungen von Gleichung (1.53). Die Spiegelungssymmetrie von Lλ Lλ hat eine nützliche Spiegelungssymmetrie: Aus α ∈ Lλ folgt nämlich mit der Kettenregel, dass auch die gespiegelte Funktion Πα : R → R, mit Πα (x) := α (−x) in Lλ liegt. Zu einer beliebigen Funktion α : R → R heißt α+ := 12 (α + Πα) ihr gerader Anteil und α− := 12 (α − Πα) ihr ungerader Anteil. Es gilt dann Πα± = ±α± und α = α+ + α− . Aus α ∈ Lλ folgt somit, dass auch α± ∈ Lλ . Es wird nun gezeigt, dass Lλ gerade und ungerade Funktionen enthält, die nicht die Nulllösung sind. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 100 Sei α die maximale Lösung zur Anfangsbedingung α(0) = 1, α′ (0) = 0. Daraus folgt Πα (0) = 1 und (Πα)′ (0) = 0. Da die maximale Lösung des Anfangswertproblems eindeutig ist, gilt α = Πα. Die Lösung α ist daher gerade. Eine ganz ähnliche Überlegung zeigt, dass die maximale Lösung β mit β(0) = 0, β ′ (0) = 1 ungerade ist. Die gerade Lösung α erzeugt also einen 1-dimensionalen Unterraum (Lλ )+ gerader Lösungen, und die ungerade Lösung β erzeugt einen 1-dimensionalen Unterraum (Lλ )− ungerader Lösungen. Zusammenfassend gilt Lλ = R · α ⊕ R · β. Potenzreihenansatz für α ∈ Lλ Da die Koeffizientenfunktionen der Hermiteschen Differentialgleichung als Polynome eine auf ganz R konvergente Potenzreihenentwicklung um 0 haben, hat jede maximale Lösung dieser Differentialgleichung eine auf ganz R konvergente Potenzreihenentwicklung. Der etwas schlauer gewählte Potenzreihenansatz α(x) = ∞ k=0 ergibt α′ (x) = ∞ k=1 kck xk−1 = k! ∞ k=0 ck+1 ck xk k! xk und α′′ (x) = k! (1.54) ∞ k=0 ck+2 xk . k! Einsetzen in die Hermitesche Differentialgleichung ergibt für alle x im Konvergenzbereich der Reihe ∞ xk [ck+2 − 2 (k − λ) ck ] = 0. k! k=0 Eine Potenzreihe ist auf ihrem Konvergenzintervall genau dann überall gleich 0, wenn alle ihre Koeffizienten gleich 0 sind. Siehe Kapitel III.8.4 in Vol I von [3]. Die Funktion α ist somit genau dann eine Lösung von Gleichung 1.53, wenn für alle k ∈ N0 die Rekursion ck+2 = 2 (k − λ) ck (1.55) gilt. Die Koeffiziententeilfolge (c0 , c2 , c4 , . . .) , also der gerade Anteil α+ von α ist somit durch c0 festgelegt. Analog ist (c1 , c3 , c5 , . . .) , also der ungerade Anteil α− durch c1 eindeutig festgelegt. Es gilt α(0) = c0 und α′ (0) = c1 . Polynomlösungen Eine erhebliche Vereinfachung ergibt sich, falls λ = n ∈ N0 . Dann gilt nämlich cn+2 = cn+4 = cn+6 = . . . = 0. Für gerades λ = n sind dann die geraden Lösungen Polynome vom Grad n. Die ungeraden Lösungen sind in diesem Fall natürlich keine Polynome. Für ungerades λ = n sind die ungeraden Lösungen Polynome vom Grad n und die geraden Lösungen sind keine Polynome. Für λ = 0 folgt c2 = c4 = . . . = 0. Damit ist die konstante Funktion α = 1 auf ganz R eine Lösung. (Probe machen!) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 101 Für λ = 1 folgt c3 = c5 = . . . = 0. Damit ist die Funktion α (x) = x auf ganz R eine Lösung. (Probe machen!) Für λ = 2 folgt c2 = −4c0 und c4 = c6 = . . . = 0. Damit ist die Funktion α (x) = 2x2 − 1 auf ganz R eine Lösung. (Probe machen!) Der folgende Satz zeigt, warum im Hinblick auf unsere Ausgangsfragestellung den Polynomlösungen ein Sonderstatus zukommt. Satz 54 Sei y : R → R eine Lösung von Gleichung (1.53). Dann existiert das Integral ∞ −∞ exp −x2 y(x)2 dx genau dann, wenn y ein Polynom ist. Beweis. Der ist ausführlich in Kap. 4.3.3 von [4] vorgeführt. Aus der Rekursion der Koeffizienten folgt also, dass (Lλ )pol := {α ∈ Lλ | α ist Polynom} = 0 genau dann, wenn λ ∈ N0 . Für gerades n gilt (Ln )pol = (Ln )+ und für ungerades n gilt (Ln )pol = (Ln )− . Der Unterraum (Ln )pol ist also eindimensional. Das eingangs erwähnte quantenmechanische Problem hat also die folgende Antwort: Gleichung (1.52) hat eine quadratintegrable von 0 verschiedene Lösung genau dann, wenn ε = 1/2 + n für ein n ∈ N0 . Diese Lösung ist bis auf einen konstanten Faktor eindeutig bestimmt. Die so charakterisierten Zahlen ε ∈ R werden als die Eigenwerte des Problems bezeichnet. Wir wenden uns nun den Polynomlösungen von Gleichung (1.53) für λ ∈ N0 etwas eingehender zu. Definition 55 Sei n ∈ N0 und [n/2] das größte Ganze von n/2. Für gerades n ist dies n/2 und für ungerades ist dies (n − 1)/2. Das Polynom Hn : R → R mit [n/2] (−1)k Hn (x) := k=0 n! (2x)n−2k k!(n − 2k)! (1.56) heißt n-tes Hermitepolynom. Bemerkung 56 Das Polynom Hn hat den Grad n und der Koeffizient von xn ist 2n und es gilt Hn (−x) = (−1)n Hn (x). Satz 57 Für n ∈ N0 gilt (Ln )pol = R · Hn . Beweis. Wir betrachten nur den Fall n = 2m mit m ∈ N0 . Die Funktion α von Gleichung (1.54) ist eine Polynomlösung der Hermiteschen Differentialgleichung genau dann, wenn c1 = 0. Dann gilt α− = 0. Für die Koeffizienten ak := c2k mit KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 102 k ∈ N0 gilt nach Gleichung (1.55) die Rekursion ak+1 = 4 (k − m) ak . Die Lösung der Rekursion ergibt für alle k ∈ {0, 1, . . . , m} ak = (−1)k 22k m! a0 (m − k)! und ak = 0 für alle k ∈ {m + 1, . . .}. Daraus folgt m m x2k m! x2k α(x) = ak (−1)k 22k = a0 . (2k)! (m − k)! (2k)! k=0 k=0 Mit der Substitution k = m − i folgt n/2 (−1) α(x) = a0 n −i 2 i=0 n 2 n n ! ! xn−2i = a0 2 (−1) 2 i! (n − 2i)! n! Mit der Wahl a0 = n! n 2 n/2 (−1)i i=0 n! xn−2i . i! (n − 2i)! n ! (−1) 2 ergibt sich α = Hn . Der Fall n = 2m + 1 wird analog bewiesen. Hier noch einige nützliche Eigenschaften der Hermitepolynome. Satz 58 Für alle x ∈ R gilt die Formel von Rodrigues Hn (x) = (−1)n exp x2 dn exp −x2 dxn und die Rekursion Hn+1 (x) = 2xHn (x) − 2nHn−1 (x). 2 Beweis. Sei Yn (x) := (−1)n ex dung der Leibnizregel dn −x2 e dxn für alle x ∈ R. Dann folgt unter Verwen- n n d −x2 2 d n x2 d −x2 e Yn+1 (x) = −(−1)n ex = −(−1) e −2xe dxn dx dxn * + n n−1 d d 2 2 2 = −(−1)n ex (−2x) n e−x − 2n n−1 e−x = 2xYn (x) − 2nYn−1 (x). dx dx Es gilt also für alle n ∈ N die Rekusionsformel Yn+1 (x) = 2xYn (x) − 2nYn−1 (x). (1.57) Damit lässt sich nun zeigen, dass Yn eine Lösung von Gleichung (1.53) ist. Zunächst folgt aus der Produktregel Yn′ (x) = 2 (−1)n 2xex n+1 dn −x2 2 n x2 d e + (−1) e e−x = 2xYn (x) − Yn+1 (x) n n+1 dx dx KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 103 Daraus ergibt sich ′ (x) Yn′′ (x) = 2Yn (x) + 2xYn′ (x) − Yn+1 = 2Yn (x) + 2x [2xYn (x) − Yn+1 (x)] − [2xYn+1 (x) − Yn+2 (x)] = 2Yn (x) + (2x)2 Yn (x) − 4xYn+1 (x) + Yn+2 (x). Ersetzt man in der letzten Zeile Yn+2 (x) durch 2xYn+1 (x) − 2 (n + 1) Yn (x), so ergibt sich Yn′′ (x) − 2xYn′ (x) = −2nYn (x). Also ist Yn eine Lösung der Hermiteschen Differentialgleichung (1.53) zu λ = n. Überdies ist Yn offenbar ein Polynom vom Grad n und der Koeffizient vor der höchsten Potenz ist 2n . Da der Unterraum polynomialer Lösungen von Gleichung (1.53) zu λ = n eindimensional ist, gilt aufgrund des Eindeutigkeitsatzes, dass Yn (x) = cn Hn (x) für alle x ∈ R. Da die Koeffizienten von xn in Yn und Hn übereinstimmen, gilt cn = 1. Somit gilt die für Yn bewiesene Rekusionsformel (1.57) auch für Hn . Schließlich seien noch die Polynome Hn für n = 0, 1, 2, 3 aufgelistet. Man verschafft sich z.B. H0 und H1 aus Rodrigues’ Formel und gewinnt dann die höheren aus der Rekursion (1.57). H0 (x) = 1, H2 (x) = 2 2x2 − 1 , H1 (x) = 2x, H3 (x) = 4x 2x2 − 3 . Die folgenden zwei Bilder zeigen die quadratintegrablen Lösungen hn (x) = von Gleichung (1.52) mit ε = 1 2 exp (−x2 /2) Hn (x) . √ n!2n π + n für n = 0, 1, 2, 3. Es sind dies die Graphen von 2 exp − x2 √ h0 (x) = , 4 π h2 (x) = 2 x2 √ x exp − π 2 h1 (x) = (2x2 − 1) x2 exp − √ 2 2 π , h3 (x) = , x (2x2 − 3) x2 exp − √ 2 3 π 0.75 0.5 0.25 0 -4 -2 0 -0.25 -0.5 h0 und h1 2 4 . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 104 0.5 0.25 0 -4 -2 0 2 4 -0.25 -0.5 h2 und h3 1.4.15 *Airys Differentialgleichung Gesucht sind alle C 2 -Funktionen y : R → R, die Airys Differentialgleichung y ′′ (x) − xy (x) = 0 für alle x ∈ R (1.58) erfüllen. Dazu genügt es, ein Fundamentalsystem im Raum der maximalen Lösungen von Gleichung (1.58) zu finden.37 Über das qualitative Verhalten der Lösungen von Gleichung (1.58) lässt sich mit recht allgemeinen Überlegungen schon einiges erschließen, denn es folgt ja: • für x > 0 gilt y ′′ (x) < 0 für y (x) < 0 und y ′′ (x) > 0 für y (x) > 0 • für x < 0 gilt y ′′ (x) > 0 für y (x) < 0 und y ′′ (x) < 0 für y (x) > 0 Die Gleichung (1.58) beschreibt also einen mechanischen Oszillator, dessen ’Rückstellkonstante’ in x linear ansteigt. Im Bereich x < 0 wirkt sie tatsächlich auf die Auslenkung rückstellend, im Bereich x > 0 verstärkt sie hingegen eine vorhandene Auslenkung. Von den Lösungen ist also zu erwarten (und auch zu beweisen), dass benachbarte Nullstellen für x → −∞ immer enger zusammenrücken. Für x > 0 ist y ′ im Fall y > 0 streng monoton wachsend und im Fall y < 0 streng monoton fallend. Daraus ergibt sich, dass y im Bereich x > 0 höchstens eine Nullstelle hat. Eine einzige der Lösungen mit y (0) = 1 konvergiert für x → ∞ gegen 0. Alle anderen wachsen unbeschränkt gegen +∞ oder −∞. 37 Ist y eine Lösung von Gleichung (1.58), dann erfüllt die um τ ∈ R verschobene Funktion yτ mit yτ (x) = y (x − τ) wegen (yτ )′′ (x) = (y ′′ )τ (x) = y ′′ (x − τ) = (x − τ ) y (x − τ ) = (x − τ ) yτ (x) die Gleichung −yτ′′ (x) + xyτ (x) = τ yτ (x) . Daher lassen sich die Lösungen der stationären 1dimensionalen Schrödingergleichung mit einem linearen Potential aus den Lösungen von Airys Differentialgleichung durch Umskalieren und Verschieben erzeugen. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Der Potenzreihenansatz y (x) = ∞ 105 ck xk k=0 ergibt: y ′′ (x) − xy (x) = ∞ k=2 ck k (k − 1) xk−2 − = c2 · 2 · 1 + = 2c2 + ∞ k=0 ∞ ′ ∞ ck xk+1 k=0 ′ k′ +1 ck′ +3 (k + 3) (k + 2) x k′ =0 − ∞ ck xk+1 k=0 [ck+3 (k + 3) (k + 2) − ck ] xk+1 . Für jede Potenzreihenlösung von Airys Differentialgleichung gilt somit c2 = 0 und ck+3 = ck für alle k ∈ N0 . (k + 3) (k + 2) Die Rekursion führt die Koeffizienten c3 , c6 , c9 , . . . auf c0 zurück, die Koeffizienten c4 , c7 , c10 , . . . sind durch c1 festgelegt und c5 , c8 , c11 , . . . ergeben sich durch ihre Rückführung auf c2 zu 0. Mit der Wahl c0 = 1 und c1 = 0 ergibt sich daraus die Potenzreihe 1 3 1 1 x + x6 + x9 + . . . 3·2 6·5·3·2 9·8·6·5·3·2 4·1 6 7·4·1 9 1 = 1 + x3 + x + x + ... 3! 6! 9! y1 (x) = 1 + Wie vom Hauptsatz über Potenzreihenlösungen schon festgestellt, ist der Konvergenzradius dieser Reihe unendlich. Und tatsächlich gilt für den Quotienten zweier aufeinanderfolgender nichtverschwindender Summanden dieser Reihe , , ck+3 ,xk+3 , |x|3 = −→ 0 für k → ∞, ck |xk | (k + 3) (k + 2) sodass das Quotientenkriterium den unendlichen Konvergenzradius liefert. Die durch die Potenzreihe auf ganz R definierte Funktion y1 ist also die maximale Lösung von Airys Differentialgleichung zur Anfangsvorgabe y1 (0) = 1 und y1′ (0) = 0. Mit der Wahl c0 = 0 und c1 = 1 ergibt sich analog die Potenzreihe 1 4 1 1 x + x7 + x10 + . . . 4·3 7·6·4·3 10 · 9 · 7 · 6 · 4 · 3 2 4 5 · 2 7 8 · 5 · 2 10 = x+ x + x + x + ... 4! 7! 10! y2 (x) = x + Auch diese Potenzreihe konvergiert auf ganz R. Die durch sie definierte maximale Lösung erfüllt die Anfangsvorgabe y2 (0) = 0 und y2′ (0) = 1. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 106 Die beiden Funktionen y1 und y2 sind auf R>0 positiv und streng monoton wachsend. Jeder Summand der Potenzreihe wächst für x → ∞ unbeschränkt an, sodass dies auch y1 und y2 tun. Das Reduktionsverfahren von d’Alembert ergibt einen Zusammenhang zwischen den beiden Lösungen y1 und y2 . Dieser ergibt sich folgendermaßen. Für die Wronskideterminante der beiden Lösungen gilt W (0) = y1 (0) y2′ (0) − y1′ (0) y2 (0) = 1. Da die Koeffizientenfunktion p des Ableitungsterms erster Ordnung für Airys Differentialgleichung verschwindet, spezialisiert sich die Reduktionsformel mit x0 = 0 für die beiden Lösungen y1 und y2 zu x y2 (x) = y1 (x) 0 1 dξ y1 (ξ)2 zumindest für alle x ∈ R>0 , wo y1 ja keine Nullstelle hat. Das Integral über y1−2 von 0 bis x > 0 erfüllt wegen y1 (ξ) = 1 + 1 3 4·1 6 7·4·1 9 ξ + ξ + ξ + ... 3! 6! 9! >1+ 1 3 ξ 3! die Abschätzungen x 0< 0 1 dξ < y1 (ξ)2 x 0 1 1 + 3!1 ξ 3 2 dξ. Da die obere Schranke für x → ∞ gegen einen endlichen Wert konvergiert, und x das Integral I (x) = 0 y1 (ξ)−2 dξ in x streng monoton steigend ist, konvergiert auch I (x) für x → ∞ gegen einen endlichen positiven Grenzwert c. Daraus lässt sich nun schließen, dass cy1 (x) − y2 (x) für x → ∞ gegen 0 konvergiert. Das geht so: Es gilt * ∞ + x ∞ dξ dξ dξ − (x) · . cy1 (x) − y2 (x) = y1 (x) · = y 1 2 2 y1 (ξ) y1 (ξ)2 0 0 y1 (ξ) x Wegen y1 (x) > 0 für x > 0 folgt daraus für alle x > 0 ∞ dξ inf {y1 (z) : x < z < ∞} · y1 (ξ) x ∞ ∞ dξ dξ dξ = < 3 y1 (x) · y1 (ξ) y1 (ξ) x x 1+ ξ 0 < cy1 (x) − y2 (x) < y1 (x) · = y1 (x) · ∞ < 3! x ∞ x 3! dξ 3! → 0 für x → ∞. 3 = 2x2 ξ Im Lösungsraum von Airys Differentialgleichung existiert somit genau ein eindimensionaler Unterraum von Lösungen y mit der Eigenschaft, dass limx→∞ y (x) = 0. Eine Mitteilung ohne Beweis38 : Die Konstante c hat den Wert c= 38 Γ 1 3 31/3 Γ 2 3 ≈ 1, 3717. Siehe Abramowitz & Stegun, Chapt. 10.4. Ein Beweis der Behauptung ist in Chapt. 2, § 8 von F W J Olver, Asymptotics and Special Functions, New York, 1974, nachzulesen. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 107 (Die Gammafunktion wird in Math Meth 2 behandelt.) Die Linearkombination y0 = c1 y1 − c2 y2 mit c1 = 1 32/3 Γ 2 3 ≈ 0, 35503 und c2 = 1 31/3 Γ 1 3 ≈ 0, 25882 liegt also in dem Unterraum von Lösungen, die für x → ∞ gegen 0 konvergieren. Sie wird üblicherweise als Airyfunktion Ai bezeichnet. Figur (1.33) zeigt ihren Graphen. Ai 0.4 0.2 0 -15 -12.5 -10 -7.5 -5 -2.5 0 2.5 -0.2 -0.4 Abbildung 1.33: Airys Funktion Die Airyfunktion erfüllt: y0 (0) = c1 und y0′ (0) = −c2 . Sie trennt auf R>0 die Menge L+ aller Lösungen mit y (0) = c1 und y ′ (0) > −c2 von der Menge L− aller Lösungen mit y (0) = c1 und y ′ (0) < −c2 . Die Elemente von L+ haben in R>0 keine Nullstelle und wachsen für x → ∞ gegen +∞. Die Elemente von L− hingegen haben in R>0 genau eine Nullstelle und sinken auf R>0 streng monoton und unbeschränkt von c1 gegen −∞. Überdies gilt: Zu jedem Punkt (a, b) ∈ R>0 × (R 0) existiert genau eine Lösung y in L+ ∪ L− mit y (a) = b. Die Graphen aller Lösungen mit y (0) = c bilden somit für jedes beliebige c eine Faserung von R>0 × R. Die Koeffizienten der Potenzreihen der Funktionen y1 und y2 für allgemeines k lassen sich durch Eulers Gammafunktion ausdrücken. Deren Kenntnis wird im Rest dieses Abschnitts vorausgesetzt. Mit der Bezeichnung ck = c3k für alle k ∈ N0 gilt also y1 (x) = ∞ k=0 ck x3k mit c0 = 1 und ck = ck−1 für alle k ∈ N. 3k (3k − 1) Die Auflösung der Rekursion ergibt unter Verwendung von Γ (x + 1) = xΓ (x) für KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN alle x ∈ R 108 (−N0 ) 1 ck−2 ck−1 = · = ... 3k [3k − 1] 3k [3k − 1] 3 (k − 1) [3 (k − 1) − 1] 1 1 c0 = · · ... · 3k [3k − 1] 3 (k − 1) [3 (k − 1) − 1] 3 · 1 (3 · 1 − 1) 1 1 1 c0 = 2k · · · ... · 1 1 3 k k − 3 (k − 1) (k − 1) − 3 1 1 − 13 ck = = Γ 23 1 · 32k k!Γ k + 2 3 · c0 = Γ 23 1 · 32k k!Γ k + . 2 3 Somit gilt für alle x ∈ R 2 y1 (x) = Γ 3 ∞ k=0 x3k 32k k!Γ k + 2 3 . Nun zur Potenzreihe von y2 . Mit der Bezeichnung ck = c3k+1 für alle k ∈ N0 gilt y2 (x) = ∞ ck x3k+1 mit c0 = 1 und ck = k=0 ck−1 für alle k ∈ N. (3k + 1) 3k Die Auflösung der Rekursion geschieht wie für y1 und ergibt für alle x ∈ R y2 (x) = Γ 1.4.16 4 3 ∞ k=0 x3k+1 32k k!Γ k + 4 3 . Ein lineares Rand- und Eigenwertproblem Im vorigen Abschnitt haben wir die quadratintegrablen Lösungen der Differentialgleichung (1.52) bestimmt. Nur für Werte ε ∈ N0 +1/2 hat Gleichung (1.52) eine von der Nulllösung verschiedene, man sagt nichttriviale, quadratintegrable Lösung. Das Problem hat eine Ähnlichkeit zu den Eigenwertproblemen der linearen Algebra: Die Zahlen ε ∈ N0 +1/2 können als die Eigenwerte des Differentialoperators 12 (−∂x2 + x2 ) auf dem Vektorraum der quadratintegrablen (unendlich oft differenzierbaren) Funktionen und die Funktionen hn als seine Eigenvektoren aufgefasst werden. Da bei der Bestimmung der Eigenwerte ε im vorigen Abschnitt gewisse Lücken bestehen blieben, der Satz 54 wurde ja nicht bewiesen, soll in diesem Abschnitt ein sehr einfaches Eigenwertproblem39 eines Differentialoperators vollständig gelöst werden. Eine maximale Lösung α einer (inhomogen) linearen Differentialgleichung n-ter Ordnung mit Anfangswerten α(x0 ), α(1) (x0 ) . . . α(n−1) (x0 ) existiert und ist eindeutig. Gilt ähnliches, wenn die n Vorgaben α(i) (xi ) an voneinander verschiedenen Stellen x0 , . . . xn−1 gewählt werden? Das folgende kleine Beispiel zeigt, dass dies im allgemeinen mit Nein zu beantworten ist. 39 Diesem Eigenwertproblem kommt in der Quantenmechanik eines eingesperrten Teilchens eine tragende Rolle zu. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 109 Definition 59 (Homogenes Randwertproblem) Seien λ, L ∈ R mit L > 0. Eine stetige Funktion α : [0, L] → R mit α(0) = 0 = α(L) und α′′ (x) + λα(x) = 0 d2 für alle x ∈ (0, L) heißt Lösung des homogenen Randwertproblems zu dx 2 + λ auf [0, L]. √ √ Für λ < 0 bilden die beiden Funktionen cosh −λx und sinh −λx ein Fundamentalsystem der Differentialgleichung auf (0, L). Mit α(x) = A cosh √ √ −λx + B sinh −λx folgt aus α(0) = 0, dass A = 0 und dann aus α(L) = 0, dass B = 0. Für λ < 0 hat das Randwertproblem also eine eindeutige Lösung, nämlich die 0-Lösung. Für λ = 0 folgt dasselbe. √ √ Für λ > 0 bilden die beiden Funktionen cos λx und sin λx ein Fundamentalsystem der Differentialgleichung auf (0, L). Mit α(x) = A cos √ √ λx + B sin λx √ folgt aus α(0) = 0, dass A = 0 und aus α(L) = 0, dass B sin λL = 0. Dies ist einerseits wiederum für B = 0 erfüllt. √ Lösungen mit B = 0 existieren aber auch √ (wegen λL > 0) genau dann, wenn λL ∈ πN. Das Randwertproblem hat also für 2 λ = n Lπ mit n ∈ N unendlich viele Lösungen π α(x) = B sin n x . L Eine Zahl λ, für die das homogene Randwertproblem einen (mindestens) eindimend2 sionalen Lösungsraum hat, heißt Eigenwert von Randbedin0 − dx2 zur homogenen 1 2 gung auf [0, L]. Im gegenwärtigen Beispiel ist n Lπ | n ∈ N die Menge aller Eigenwerte. Die zugehörigen Lösungsräume, auch Eigenräume genannt, sind alle eindimensional. Der mathematische Mechanismus, der im Rahmen der Quantentheorie zur Diskretisierung von klassisch kontinuierlichen Größen, wie Energie und Drehimpuls führt, ist eine Verallgemeinerung des hier beschriebenen. 1.4.17 *Green’sche Funktion eines Randwertproblems Für y : [0, 1] → R gelte y ′′ (x) = b (x) mit stetiger Funktion b : [0, 1] → R. Gibt es unter allen solchen Funktionen y eine, für die die homogene Randvorgabe y (0) = y (1) = 0 gilt?40 Ja, es gibt genau eine. Warum? 40 Dieses Randwertproblem legt etwa das Potential im Gebiet zwischen den geerdeten Platten eines (ebenen) Kondensators fest, wenn sich dort auch eine eben verteilte Ladungsdichte befindet. Eine andere Interpretation gibt die Bewegung eines 1d Massenpunktes unter dem Einfluss einer äußeren Kraft. Gesucht ist jene Bewegung, bei der sich der Massenpunkt zu den Zeiten 0 und 1 im Nullpunkt befindet. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 110 Ein Fundamentalsystem der homogenen Gleichung y ′′ = 0 ist (α1 , α2 ) mit α1 (x) = 1 und α2 (x) = x für alle x ∈ [0, 1] . Für jede Funktion y mit y ′′ = b auf [0, 1] existieren daher α, β ∈ R, sodass x y (x) = α + βx + 0 (x − ξ) b (ξ) dξ. Die Randvorgabe für y gilt genau dann, wenn α = 0 und 1 0=β+ 0 (1 − ξ) b (ξ) dξ. Damit ist die Funktion y : [0, 1] → R mit x 1 y (x) = − 0 x (1 − ξ) b (ξ) dξ + 0 (x − ξ) b (ξ) dξ die eindeutige Lösung der inhomogenen Gleichung mit der homogenen Randvorgabe. Durch Aufspalten des Integrals von 0 bis 1 in eines von 0 bis x und eines von x bis 1 ergibt sich: x 1 [(x − ξ) − x (1 − ξ)] b (ξ) dξ − y (x) = 0 x 0 x (1 − ξ) b (ξ) dξ 1 ξ (x − 1) b (ξ) dξ − = x x x (1 − ξ) b (ξ) dξ 1 = Γ (x, ξ) b (ξ) dξ. 0 Hierbei gilt für die Funktion Γ : Q = [0, 1] × [0, 1] → R Γ (x, ξ) = ξ (x − 1) für 0 ≤ ξ ≤ x ≤ 1 . x (ξ − 1) für 0 ≤ x ≤ ξ ≤ 1 (1.59) Offensichtlich ist Γ stetig und es gilt Γ (x, ξ) = Γ (ξ, x) auf Q. Die Einschränkungen der Funktion Γ (·, ξ) auf [0, ξ] und [ξ, 1] sind jeweils Lösungen der homogenen Gleichung y ′′ = 0. Bei x = ξ macht ihre Ableitung jedoch einen Sprung um 1, d.h. es gilt lim Γ′ (·, ξ)|x=ξ+ε − lim Γ′ (·, ξ)|x=ξ−ε = 1. ε→0 ε→0 Weiter gilt für jedes ξ ∈ [0, 1] , dass Γ (0, ξ) = Γ (1, ξ) = 0. Die Funktion Γ heißt Green’sche Funktion zu y ′′ = 0 und zur Randvorgabe y (0) = y (1) = 0. Sie ist eine durch die Randvorgabe eindeutig festgelegte Fundamentallösung von y ′′ = 0 mit nichtdifferenzierbarer Stelle bei ξ ∈ [0, 1] . Sie legt - selbst unabhängig von b - die der Inhomogenität b zugehörige eindeutige Lösung des halbhomogenen Randwertproblems über eine Integration fest. Wir fassen zusammen: Satz 60 Sei b : [0, 1] → R stetig. Für y : [0, 1] → R gelte y ′′ = b und y (0) = y (1) = 0. Dann gilt für alle x ∈ [0, 1] mit der Green’schen Funktion Γ aus Gleichung (1.59) 1 Γ (x, ξ) b (ξ) dξ. y (x) = 0 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 111 Diese Lösungsformel mittels eines linearen Integraloperators lässt sich auf allgemeinere lineare Randwertprobleme erweitern. Siehe etwa Kap. V, §26 in [18]. Die Green’sche Funktion hängt dann natürlich vom homogenen Teil der Differentialgleichung und den Randbedingungen ab. Im Fall der Differentialgleichung y ′′ = b auf dem Intervall [0, 1] existiert also genau eine Lösung y mit der Randvorgabe y (0) = y (1) = 0. Für b = 0 entspricht dies d2 der uns schon bekannten Tatsache, dass 0 kein Eigenwert von − dx 2 zur homogenen Randbedingung auf [0, 1] ist. Welche Lösungen hat aber die inhomogene Gleichung y ′′ + y = b mit stetiger Funktion b : [0, π] → R wenn y (0) = y (π) = 0 als homogene Randvorgabe verlangt wird? Wir wissen ja, dass y (x) = C sin x für jedes C ∈ R eine Lösung im homogenen Fall b = 0 ist. Ein Fundamentalsystem der homogenen Gleichung ist (α1 , α2 ) mit α1 (x) = cos x und α2 (x) = sin x. Daher gibt es für jede Lösung y von y ′′ + y = b Zahlen α, β ∈ R, sodass für alle x ∈ [0, π] x sin (x − ξ) b (ξ) dξ y (x) = α cos x + β sin x + 0 gilt. Die Randvorgabe y (0) = 0 gilt genau dann, wenn α = 0. Für α = 0 folgt mit sin (π − ξ) = sin ξ π y (π) = 0 π sin (π − ξ) b (ξ) dξ = sin (ξ) b (ξ) dξ, 0 da ja β sin π = 0 gilt. Die Bedingung y (π) = 0 lässt sich daher genau dann erfüllen, wenn für die Inhomogenität b die „Orthogonalitätsbedingung” π sin (ξ) b (ξ) dξ = 0 0 gilt. Wenn diese erfüllt ist, dann hat das Randwertproblem unendlich viele Lösungen. Andernfalls hat es keine einzige Lösung. Mithilfe der Orthogonalitätsbedingung lässt sich nun eine Greensche Funktion für das vorliegende Randwertproblem finden. Es gilt π x sin (|x − ξ|) b (ξ) dξ = 0 0 π sin (x − ξ) b (ξ) dξ − sin (x − ξ) b (ξ) dξ x (1.60) Umformen des zweiten Integrals mit dem Sinussatz ergibt π x π sin (x − ξ) b (ξ) dξ = sin (x) x π cos (ξ) b (ξ) dξ − cos (x) sin (ξ) b (ξ) dξ. x Aus der Orthogonalitätsbedingung folgt π x x sin (ξ) b (ξ) dξ = − sin (ξ) b (ξ) dξ. 0 Weiter gilt π π cos (ξ) b (ξ) dξ = x 0 x cos (ξ) b (ξ) dξ − cos (ξ) b (ξ) dξ. 0 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 112 Daraus folgt nun π sin (x − ξ) b (ξ) dξ = sin (x) x * π x cos (ξ) b (ξ) dξ − 0 x + cos (x) 0 sin (ξ) b (ξ) dξ 0 x = − cos (ξ) b (ξ) dξ 0 + π sin (x − ξ) b (ξ) dξ + sin (x) cos (ξ) b (ξ) dξ. 0 Einsetzen in (1.60) ergibt π 0 x sin (|x − ξ|) b (ξ) dξ = 2 π sin (x − ξ) b (ξ) dξ − sin (x) 0 cos (ξ) b (ξ) dξ. 0 Sei nun die Green’sche Funktion Γ : Q = [0, π] × [0, π] → R so, dass Γ (x, ξ) = 1 sin (|x − ξ|) für alle (x, ξ) ∈ Q. Dann gilt also 2 x 0 π sin (x − ξ) b (ξ) dξ = Γ (x, ξ) b (ξ) dξ + 0 sin (x) 2 π cos (ξ) b (ξ) dξ. 0 Γ ist stetig und es gilt Γ (x, ξ) = Γ (ξ, x) auf Q. Die Ableitung von Γ (·, ξ) springt bei x = ξ um 1. Aber Achtung41 : 2Γ (0, ξ) = sin ξ = 2Γ (π, ξ) = 0 für alle ξ ∈ (0, π) . Wir fassen diese Ergebnisse zusammen: Satz 61 Sei b : [0, π] → R stetig und es gelte die Orthogonalitätsbedingung π sin (ξ) b (ξ) dξ = 0. 0 Eine C 2 -Funktion y : [0, π] → R ist Lösung von y ′′ + y = b mit y (0) = y (π) = 0 genau dann, wenn eine Zahl β ∈ R existiert, sodass für alle x ∈ [0, π] 1 y (x) = β sin x + 2 π 0 sin (|x − ξ|) b (ξ) dξ. Für eine Funktion b, die die Orthogonalitätsbedingung nicht erfüllt, hat das Randwertproblem keine Lösung. 1.5 *Harmonisch angeregte lineare Schwingung In diesem Abschnitt wird auf einen sehr speziellen Fall von inhomogen linearen Gleichungen zweiter Ordnung mit konstanten Koeffizienten ausführlicher eingegangen, auf die Gleichung einer gedämpften, linearen Schwingung mit „harmonischer“ äußerer Anregung. Die mechanische Bewegungsgleichung für die Auslenkung ξ eines 41 Das sollte nicht verwundern, denn der Einheitskraftstoß auf den Oszillator erfüllt die Orthogonalitätsbedingung nicht! Daher gibt es auch keine Fundamentallösung zu y ′′ + y = 0, die in 0 und π Nullstellen hat. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 113 eindimensionalen, linearen Oszillators der Masse m, der von einer zeitabhängigen Kraft F angetrieben wird, lautet ξ̈ + 2ρξ̇ + ω 20 ξ = F/m. Hier sind ω 0 , m ∈ R>0 und ρ ∈ R≥0 . Die Funktion F : R → R sei stetig. Eine sogenannte ’harmonische’ Anregung ist eine Kraftfunktion F, für die F (t) = A cos (ωt − δ) mit A, ω, δ ∈ R für alle t ∈ R gilt.42 Mit der dimensionslosen Zeit x := ω 0 t, dem dimensionlosen Dämpfungsparameter α := ρ/ω 0 ∈ R≥0 ergibt sich für y(x) := ξ(t) die parameterbereinigte Gleichung y ′′ + 2αy ′ + y = g (1.61) mit der Inhomogenität g := F/mω 20 . Das dazu äquivalente System erster Ordnung für (y 1 , y 2 ) := (y, y ′ ) ist d dx y1 y2 0 1 −1 −2α = y1 y2 + 0 g . (1.62) Nach den Sätzen über inhomogen lineare Systeme erster Ordnung gibt es für x0 ∈ R und für v ∈ R2 genau eine Lösung γ v : R → R2 von (1.62) mit γ v (x0 ) = v. Daher existiert zu jedem x0 ∈ R und zu jedem (a, b) ∈ R2 genau eine Lösung y : R → R von (1.61) mit y(x0 ) = a und y ′ (x0 ) = b. Ist ypart eine maximale Lösung von (1.61), dann gilt für die Menge aller maximalen Lösungen Lg dieser Gleichung Lg = L0 + ypart . Hier ist L0 der Vektorraum der maximalen Lösungen von (1.61) mit g = 0. 1.5.1 Übersicht über L0 Einsetzen der Versuchsfunktion y : R → R mit y(x) = exp (µx) für ein µ ∈ R in (1.61) ergibt: y ist Lösung genau dann, wenn µ Nullstelle des reellen „charakteristischen“ Polynoms P zweiten Grades mit P (λ) := λ2 + 2αλ + 1 = (λ + α)2 − α2 − 1 ist, dh wenn P (µ) = 0. Für einer Diskussion der Nullstellenmenge von P ist eine Trennung der Fälle α > 1, α = 1 und 0 ≤ α < 1 hilfreich. 1. Überkritische Dämpfung: α > 1. Das charakteristische Polynom P hat zwei (reelle) Nullstellen. Es sind dies √ µ± = −α ± α2 − 1. 42 Die Bezeichnung ’harmonisch’ dürfte in der Tatsache gründen, dass eine solche (monofrequente) Schwingung eines menschlichen Trommelfells von seinem zugehörigen Gehirn als rein oder ’harmonisch’ empfunden wird. Aber Achtung: In der Theorie der partiellen Differentialgleichen wird der Begriff ’harmonische Funktion’ mit einer gänzlich anderen Bedeutung verwendet. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 114 Es gilt: −2α < µ− < µ+ < 0. Die beiden zu den Nullstellen gehörigen Lösungen y± : R → R mit y+ (x) = eµ+ x, y− (x) = eµ− x sind im Fall α > 1 linear unabhängig und daher eine Basis des Lösungsraumes L0 oder ein sogenanntes Fundamentalsystem von (1.61). Dies zeigt man etwa mithilfe der Wronskideterminante bei 0. Beide Lösungen y+ , y− sind streng monoton fallend. Sie werden für α = 3/2 von Abbildung (1.34) gezeigt.Die y 1.5 1.25 1 0.75 0.5 0.25 0 -0.5 0 0.5 1 1.5 2 2.5 3 x Abbildung 1.34: Fundamentalsystem für α = 3/2, y+ strichliert Lösung y+ − y− für α = 3/2 zeigt Figur (1.35). Die Auslenkung schwingt einmal durch 0 und kehrt für x → ∞ dorthin zurück. Für große negative x dominiert y− und für große positive x dominiert y+ . Jargon: Eine Lösung hat im allgemeinen zwei Zeitskalen eine schnelle (µ− ) und eine langsame (µ+ ). y 0.5 0.25 0 0 -0.25 1.25 2.5 3.75 5 x -0.5 -0.75 -1 Abbildung 1.35: Die Überschwinglösung y+ − y− Für die zum Fundamentalsystem (y+ , y− ) gehörigen physikalisch parametrisierten Funktionen ξ + und ξ − gilt √ − ρ∓ ρ2 −ω20 t für alle t ∈ R. ξ ± (t) = e KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 115 2. Kritische Dämpfung: α = 1. Das charakteristische Polynom P hat genau eine (reelle) Nullstelle. Es ist dies µ0 = −1. Die zugehörige Lösung ist y1 (x) := exp(−x). Eine weitere Lösung wird mit dem Ansatz xn exp(−x) gesucht. Sie ergibt sich zu y2 (x) = x exp(−x). Die beiden Funktionen y1 , y2 : R → R mit y1 (x) = e−x , y2 (x) = xe−x sind ein Fundamentalsystem von (1.61) für α = 1. Abbildung (1.36) zeigt die Funktionen y1 (rot) und y2 (grün). y 1.25 1 0.75 0.5 0.25 0 0 -0.25 1.25 2.5 3.75 5 x Abbildung 1.36: y1 und y2 für α = 1 (kritische Dämpfung) 3. Unterkritische Dämpfung: α < 1. Das charakteristische Polynom hat keine reelle Nullstelle. Es hat dann zwei Nullstellen über C. Diese sind √ µ± = −α ± i 1 − α2 . , , Es gilt: µ− = µ∗+ , ,µ+ , = 1, ℜµ+ ≤ 0 und ℑµ+ > 0. Die Nullstelle µ+ liegt am Einheitskreis im 2. Quadranten. Die Funktion exp µ+ x ist nicht reellwertig, aber da die Koeffizienten der Diffgleichung (1.61) reell sind, sind die reellen Funktionen yi : R → R mit √ 1 − α2 x √ : x → ℑ exp µ+ x = e−αx sin 1 − α2 x y1 : x → ℜ exp µ+ x = e−αx cos y2 Lösungen von (1.61), wenn 0 ≤ α < 1 gilt. Sie bilden ein Fundamentalsystem. Eine Dämpfung α > 0 verlangsamt die Schwingung gegenüber dem ungedämpften Fall α = 0. Darüberhinaus sorgt sie wie in den Fällen 1) und 2) für ein Abklingen √ des Schwingungsvorgangs. Die beiden Zeitskalen der Lösungen sind α und 1 − α2 . Die Lösungen sind nur für α = 0 periodisch. Für α ≥ 0 haben aber benachbarte Nulldurchgänge √ und benachbarte Maxima voneinander den gleichbleibenden Abstand 2π/ 1 − α2 . (Übung!) Für die zum Fundamentalsystem (y1 , y2 ) gehörigen, physikalisch parametrisierten Funktionen ξ 1 und KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 116 ξ 1 gilt ξ 1 (t) = e−ρt cos ω 20 − ρ2 t , ξ 2 (t) = e−ρt sin ω 20 − ρ2 t . Für α = 1/10 zeigt Abbildung (1.37) das Fundamentalsystem (y1 , y2 ). y 1.5 1 0.5 0 -5 0 5 10 15 20 25 x -0.5 -1 Abbildung 1.37: Fundamentalsystem (y1 , y2 ) für α = 1/10; y2 strichliert Für jede reelle Linearkombination y = c1 y1 + c2 y2 = 0 existiert genau ein Paar von Zahlen * 2π (a, x0 ) ∈ R>0 × 0, √ , 1 − α2 sodass für alle x ∈ R √ y(x) = ae−αx cos 1 − α2 (x − x0 ) . Diese Zahlen sind bestimmt durch √ c1 = a cos 1 − α2 x0 , c2 = a sin √ 1 − α 2 x0 . (Nachrechnen mit Additionstheorem für sin und cos . Übung!) Jedes Element von L0 ist somit ein Translat eines Vielfachen von y1 (und auch von y2 ). 1.5.2 Partikuläre Lösungen ypart für harmonische Kraft F0 ω Sei F (t) = F0 cos(ωt) mit ω ∈ R>0 und F0 ∈ R. Daher gilt g(x) = mω x . 2 cos ω0 0 ω Suche eine Lösung ypart von (1.61) für g0 (x) = cos(qx) mit q := ω0 ∈ R>0 . Zunächst jedoch etwas allgemeiner: Suche komplexwertige Lösungen yc von (1.61) für die Inhomogenität g(x) = exp(µx) mit µ ∈ C. Auf dem C-VR V der zwei mal diffbaren Funktionen von R nach C ist die lineare Abbildung L durch L [y] = y ′′ + 2αy ′ + y definiert. Für die gesuchte Funktion yc gilt daher L [yc ] (x) = eµx . (1.63) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 117 Es gilt L [exp (µx)] = P (µ) exp (µx) , mit P (λ) = λ2 + 2αλ + 1 (charakteristisches Polynom von L). Dieses dient der folgenden Fallunterscheidung. 1. P (µ) = 0: Falls µ keine (möglicherweise komplexe) Nullstelle von P ist, dann ist yc : R → R mit 1 µx yc (x) = e P (µ) eine Lösung von (1.63). 2. P (µ) = 0, P ′ (µ) = 0: Dies ist der Fall für µ ∈ µ+ , µ− . Es gilt dann * + ∂ µx ∂ µx = L [xe ] = L e L [eµx ] ∂µ ∂µ ∂ = (P (µ)eµx ) = (P ′ (µ) + xP (µ)) eµx = P ′ (µ)eµx . ∂µ Somit ist die Funktion yc : R → R mit yc (x) = xeµx P ′ (µ) eine Lösung von (1.63). 3. P (µ) = 0, P ′ (µ) = 0 : Dies ist genau dann der Fall, wenn α = 1 (Doppelnullstelle, kritische Dämpfung) und µ = −1. Dann gilt wegen P ′′ = 2 2 3 2 2 ∂ ∂ 2 µx µx =L L xe e = L [eµx ] ∂µ ∂µ = ∂2 (P (µ)eµx ) = P ′′ (µ) + 2xP ′ (µ) + x2 P (µ) eµx = 2eµx . ∂µ2 Somit ist die Funktion yc : R → R mit yc (x) = x2 eµx 2 eine Lösung von (1.63). Zur Inhomogenität g0 (x) = cos(qx) = ℜ exp(iqx) gewinnt man Lösungen wie folgt. Wähle in den partikulären Lösungen yc zur Inhomogenität exp(µx) den Parameter µ = iq und nehme davon den Realteil ypart := ℜyc . Dann gilt wegen der Linearität von L, dass ypart : R → R eine Lösung von (1.61) mit g0 (x) = cos(ωx) ist. Der Fall 3) tritt für α ∈ R≥0 nicht ein wegen der beiden für q ∈ R>0 unverträglichen Bedingungen µ = iq und µ = −1. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 118 Der Fall 2) liegt genau dann vor, wenn µ = iq = µ+ . Die Nullstelle µ+ ist genau dann rein imaginär, wenn α = 0. Dann gilt µ+ = i und daher q = 1. Dies ist der Fall einer ungedämpften Schwingung mit resonanter Erregungsfrequenz ω = ω 0 . Es gilt dann P ′ (µ) = 2µ + 2α = 2i. Die Lösung ypart : R → R ergibt sich damit zu x x exp(ix) = sin(x). 2i 2 Das ist eine aperiodische Schwingung. Sie wird von Abbildung (1.38) gezeigt. Für die physikalisch parametrisierte Lösung ξ part zu F (t) = F0 cos(ωt) ergibt sich mit (ω0 t) ξ part (t) = F0 ypart . Es folgt mω2 ypart (x) = ℜ 0 ξ part (t) = F0 t sin(ω 0 t) für alle t ∈ R. m 2ω 0 y 15 10 5 0 -20 -10 0 10 -5 20 x -10 -15 Abbildung 1.38: ξ part und cos für ω 0 = 1 Der Fall 1) ist der typische und reichhaltigste. Er liegt genau dann vor, wenn (α, q) = (0, 1). Es gilt P (µ) = P (iq) = −q 2 + 2αiq + 1. Damit folgt in diesem Fall ypart (x) = ℜ exp(iqx) . 1 − q 2 + i2αq (1.64) Zur Berechnung des Realteils des Quotienten ist eine Fallunterscheidung hilfreich. Wir unterscheiden danach, ob der Nenner reell ist, oder nicht. a) Reeller Nenner: Die Zahl P (iq) = 1 − q2 + i2αq ist für α = 0 reell und nicht Null, da ja (α, q) = (0, 1) vorausgesetzt ist. Für ypart : R → R folgt ypart (x) = cos(qx) . 1 − q2 Dies ist eine ungedämpfte Schwingung mit nichtresonanter Erregungsfrequenz. Die physikalisch parametrisierte Lösung ξ part : R → R zu F (t) = F0 cos (ωt) ergibt sich (ω0 t) mit ξ part (t) = F0 ypart . Es folgt mω 2 0 ξ part (t) = F0 cos(ωt) für alle t ∈ R. m ω 20 − ω 2 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 119 In diesem ungedämpften, nichtresonanten Fall folgt die (periodische) Schwingung der Erregung für ω 0 > ω ohne Phasenschub mit der Amplitude F0 F0 1 . 2 ≥ 2 mω 0 1 − (ω/ω 0 ) mω 20 Die Maxima der treibenden Kraft fallen mit den Maxima der Schwingung zusammen und die Amplitude ist größer als die Auslenkung des statisch belasteten Oszillators. Für ω 0 < ω hingegen ist die Schwingung gegenüber der Erregung um eine halbe Periode versetzt. Die Maxima der Kraft fallen auf Minima der Schwingung. Abbil−1 dung (1.39) zeigt die Funktion x → |1 − x2 | . 3.5 3 2.5 2 1.5 1 0.5 0 0.5 1 1.5 2 2.5 3 −1 Abbildung 1.39: Die Amplitudenfunktion |1 − x2 | b) Der Nenner ist nicht reell: Für α > 0 liegt P (iq) = 1 − q 2 + i2αq wegen q > 0 in der oberen Halbebene. Als Beispiel zeigt Abbildung (1.40) die Menge P (iR>0 ) = {1 − q 2 + i2αq | q ∈ R>0 } ⊂ C für α = 1/2. 2 y 1.5 1 0.5 0 -3 -2 -1 0 1 x Abbildung 1.40: P (iR>0 ) für α = 1/2 Die Polardarstellung des Nenners P (iq) = 1 − q 2 + i2αq ist hilfreich bei der Berechnung des Realteils von ypart nach (1.64). Für jedes z ∈ C 0 existiert genau ein δ ∈ [0, 2π) mit z = |z| exp(iδ). Die Zahl δ heißt das Argument von z. Sie ist implizit durch ℜ(z) = |z| cos(δ) und ℑ(z) = |z| sin(δ) bestimmt. Die Abbildung arg : C 0 → [0, 2π) , z → arg(z) heißt Argumentfunktion. Für z in der oberen Halbebene gilt δ = arg(z) ∈ (0, π). Die Funktion arccot : R → (0, π) ist die Umkehrfunktion KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 120 y 2.5 2 1.5 1 0.5 -5 -2.5 0 2.5 5 x Abbildung 1.41: Der Graph von arccot von cot = cos auf (0, π). Den Graphen von arccot zeigt Abbildung (1.41). Der Nenner sin P (iq) hat somit die Polardarstellung (1 − q 2 )2 + (2αq)2 exp i arccot 1 − q 2 + i2αq = 1 − q2 2αq . Daraus folgt ypart (x) = ℜ exp(iqx − iδ) (1 − q 2 )2 + (2αq)2 = cos(qx − δ) (1 − q 2 )2 + (2αq)2 mit 1 − q2 δ = arccot . 2αq Die periodische Schwingung ypart geht der Kraft um den Phasenschub 0 < δ < π und mit einer dynamisch bestimmten Amplitude voran. Für q > 1 gilt limα→0 δ = π und für q < 1 gilt limα→0 δ = 0. Für q = 1 gilt limα→0 δ = π/2. Den Graphen der Funktion Φ : R>0 → (0, π) , q→ 1 1 − q2 arccot π 2αq zeigt Abbildung (1.42) für α = 1/5, für α = 1 (rot) und α = 2 (grün). Der Amplitudenfaktor in ypart (x), nämlich die Funktion σ α : R>0 → R>0 mit σ α (q) = 1 − q2 2 + (2αq)2 −1/2 heißt dynamische Suszeptibilität des Oszillators. Sie bestimmt die Amplitude von ypart . Es gilt lim σ α (q) = 1 und lim σ α (q) = 0. q→0 q→∞ Abbildung (1.43) zeigt σ α für die unterkritisch gedämpften Fälle α = 1/3, α = 1/15 (rot) und α = 3/4 (grün) im Bereich 0 < q < 2. Eine Verstärkung der Schwingungsamplitude im Bereich q ≈ 1 ist für α = 1/15 sichtbar. Bei schwächerer Dämpfung ist die Verstärkung ausgeprägter. Bei stärkerer Dämpfung scheint sie zu fehlen. Warum? KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 121 0.8 0.6 0.4 0.2 0 0 1.25 2.5 3.75 5 q Abbildung 1.42: Φ für α = 1, 5 (schwarz), α = 1 (rot) und α = 2 (grün) 7.5 6.25 5 3.75 2.5 1.25 0 0.5 1 1.5 2 q Abbildung 1.43: σ α für α = 1/15 (rot), α = 1/3 (schwarz) und α = 3/4 (grün) Der Amplitudenfaktor σ α hat ein lokales Maximum, wenn σ ′α (q) = − −2 (1 − q 2 ) + (2α)2 (1 − q 2 )2 + (2αq)2 3/2 q=0 gilt. Dies ist genau dann der Fall, wenn −2 (1 − q 2 ) + (2α)2 = 0, wenn also 1 − 2 2α√ = q 2 . Ein lokales Maximum besitzt der Amplitudenfaktor daher nur für α < 1/ 2 ≈ 0, 71. Das Maximum hat den Wert σ α (qmax ) = 1 2 )2 + (2α)2 q 2 (1 − qmax max = 1 (2α2 )2 + (2α)2 (1 − 2α2 ) = 1 √ . 2α 1 − α2 √ Für α ր 1/ 2 konvergiert qmax gegen 0 und σ α (qmax ) gegen 1. Für α2 ≥ 1/2 ist die Funktion σ α streng monoton fallend. Die physikalisch parametrisierte Lösung ξ part zu F (t) = F0 cos(ωt) ergibt sich (ω0 t) aus ξ part (t) = F0 ypart . Mit q = ω/ω 0 folgt mω2 0 ξ part (t) = F0 cos(ωt − δ) mω 20 (1 − q 2 )2 + (2αq) 2 = F0 m cos(ωt − δ) (ω 20 − 2 ω2 ) + (2ρω) 2 . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 122 Für den Phasenschub δ folgt δ = arccot 1.5.3 ω 20 − ω 2 2ρω . Qualitatives Resümee Jede Lösung der inhomogenen Gleichung (1.61) ist vom Typ y = y0 + ypart mit y0 ∈ L0 . Für α > 0 konvergiert y0 (x) für x → ∞ gegen 0 und y schmiegt sich daher für x → ∞ an ypart . Jede gedämpfte, harmonisch getriebene Schwingungen nähert sich also der Lösung ypart . Der Einfluß der Anfangsbedingungen wird durch die Dämpfung praktisch ausgelöscht. Einwand: Keine reale Kraft produziert cos auf ganz R. Entgegnung: Ist die Kraft auf einem hinreichend großen reellen Intervall I vom Typ cos, dann ist die hier diskutierte Funktion ypart für Zeiten aus dem späteren Teil von I, auf dem der Einfluß der Vorgeschichte bereits schwach ist, eine Näherung der Lösung zur tatsächlichen Inhomogenität. Frage: Warum verdient der sehr spezielle Fall einer cos-Kraft so große Aufmerksamkeit? Antwort: Die Theorie der Fourieranalyse zeigt, dass sich eine große Klasse von Funktionen durch Summen (Integrale) von cos und sin Funktionen diverser Frequenzen beliebig gut approximieren lassen. Sei g eine solche Funktion, also Ai cos (ω i x) + Bi sin (ω i x) . g(x) = i Sind Ci bzw Si partikuläre Lösungen von Ly = cos(ω i x) bzw Ly = sin(ω i x), dann ist i Ai Ci (x) + Bi Si (x) eine partikuläre Lösung von Ly = g. Damit ebnet die Diskussion harmonischer Inhomogenitäten zusammen mit der Fourieranalyse den Weg zum Verständnis von Lg für viele physikalisch relevante allgemeinerer Inhomogenitäten. Das Resonanzphänomen der dynamischen Suszeptibilität zeigt, dass die partikuläre Lösung ypart zu einer Summe von harmonischen Kräften von jenen Anteilen dominiert wird, deren Antriebsfrequenz ω nahe der Eigenfrequenz ω 0 des Systems liegt. 1.6 Übungsbeispiele 1. (Separierte Variable) Ein Kondensator habe die Kapazität C > 0. Zur Zeit t = 0 bestehe eine Spannung von U0 > 0 zwischen seinen Platten. Auf seiner positiv geladenen Platte befindet sich daher die Ladung Q0 = CU0 . Wird zur Zeit t = 0 zwischen den Platten eine leitende Verbindung vom Widerstand R hergestellt, so verändert sich die Ladung auf der positiven Platte derart, dass diese Ladung Q (t) zur Zeit t für alle t > 0 RQ̇ (t) + Q (t) =0 C KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 123 erfüllt. Zeigen Sie, dass zur Zeit t > 0 zwischen den Platten die Spannung U (t) = U0 e−t/RC vorliegt. In einer Zeit der Dauer τ = RC verringert sich also U (t) um den Faktor 1/e ≈ 0, 368. Ist der Kondensator zur Zeit t = 0 ungeladen und wird er zu t = 0 über einen Widerstand R an eine Spannungsquelle mit der Spannung U0 > 0 angeschlossen, dann gilt für die Ladung Q (t) auf seiner positiven Platte für alle t>0 Q (t) RQ̇ (t) + = U0 . C Zeigen Sie, dass zur Zeit t > 0 zwischen den Platten die Spannung U (t) = U0 1 − e−t/RC vorliegt. 2. (Separierte Variable) Für die Füllhöhe y(t) > 0 eines mit Wasser gefüllten Gefäßes zur Zeit t, das sich über ein Loch im waagrechten Boden entleert, gilt mit α > 0 d y(t) = −α y(t). dt (a) Skizzieren Sie das Richtungsfeld der Differentialgleichung y ′ = f (x, y) mit √ f : R × R>0 → R, (x, y) → −α y für α > 0. (b) Bestimmen Sie die maximale Lösung zur Anfangsbedingung y(0) = y0 > 0. Nach welcher Zeit ist das Gefäß leer? 3. (Separierte Variable) Für die Geschwindigkeit v(t) der vertikalen Bewegung im homogenen Schwerefeld (Beschleunigungskonstante g > 0) gilt bei linearer Reibung, (Reibungskoeffizient γ > 0) d v(t) = −g − γv(t). dt Der Definitionsbereich der Diffenrentialgleichung sei maximal. (a) Skizzieren Sie das Richtungsfeld dieser Differentialgleichung. (b) Bestimmen Sie die maximale Lösung zur Anfangsbedingung v(0) = v0 > 0. Hat v(t) Grenzwerte für t → ±∞? 4. (Separierte Variable) Sei f : R × R>0 → R, (x, y) → − xy . (a) Skizzieren Sie das Richtungsfeld der Differentialgleichung y ′ = f (x, y). (b) Bestimmen Sie die Menge L der maximalen Lösungen der Differentialgleichung y ′ = f (x, y). (Geben Sie zu jeder maximalen Lösung ihren Definitionsbereich an; zeigen Sie, dass durch jeden Punkt von R × R>0 genau eine maximale Lösung geht; Skizze!) (c) Zeigen Sie (ohne Verwendung der expliziten Kenntnis der Menge aller maximalen Lösungen L), dass für Lösungen y der Differentialgleichung ′ gilt: (x2 + y 2 ) = 0. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 124 (d) Sei g : R×R<0 → R, (x, y) → − xy . Bestimmen Sie die Menge M der maximalen Lösungen der Differentialgleichung y ′ = g(x, y). Hinweis: Beachten Sie die Symmetrie: g(x, y) = −f (x, −y) für (x, y) ∈ R × R<0 . 5. (Separierte Variable) Sei f : R × R → R, (x, y) → xy . 1+x2 (a) Skizzieren Sie das Richtungsfeld der Differentialgleichung y ′ = f (x, y). (Siehe Abbildung 1.44.) (b) Bestimmen Sie die Menge L der maximalen Lösungen der Differentialgleichung y ′ = f (x, y). (Geben Sie zu jeder maximalen Lösung ihren Definitionsbereich an; zeigen Sie, dass durch jeden Punkt von R × R genau eine maximale Lösung geht; Skizze!) (Siehe Abbildung 1.45.) (c) Zeigen Sie (ohne Verwendung von L), dass für Lösungen y der Differentialgleichung gilt: ′ √ y 1+x2 = 0. y 5 3.75 2.5 1.25 0 -5 -4 -3 -2 -1 -1.25 0 1 2 3 4 5 x -2.5 -3.75 -5 Abbildung 1.44: Das Richtungsfeld zu y ′ = xy/(1 + x2 ) y 4 2 0 -2 -1 0 1 2 x -2 -4 Abbildung 1.45: Lösungen von y ′ = xy/(1 + x2 ) KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 125 6. (Separierte Variable) Sei ∆ := R {1,,−1}, und α : ∆ → R und β : ∆ → R −1 ,. Skizzieren Sie den Graphen von mit α(x) = (x2 − 1) und β(x) = 12 ln , x−1 x+1 ′ α und zeigen Sie, dass β = α. (a) Zeigen Sie, dass die Funktionen tanh : R → (−1, 1) und coth : R 0 → sinh(x) 1 R [−1, 1] mit tanh(x) := cosh(x) und coth(x) := tanh(x) bijektiv sind. Skizzieren Sie die Graphen von tanh, coth und der Umkehrfunktionen tanh−1 und coth−1 . (b) Zeigen Sie tanh−1 (x) = −β(x) für −1 < x < 1 und coth−1 (x) = −β(x) für |x| > 1.Hinweis: Rechnen Sie nach, dass tanh (−β(x)) = x für −1 < x < 1 und dass coth (−β(x)) = x für |x| > 1. (c) Zeigen Sie mithilfe des Eindeutigkeitssatzes aus der Vorlesung, dass die Menge L aller maximalen Lösungen der Differentialgleichung y ′ = f(x, y) mit f : R2 → R, (x, y) → y 2 − 1 aus genau den folgenden Funktionen besteht: • y : R → R, • y : R → R, x → 1, x → −1, • y : R → (−1, 1) , x → tanh(c − x) mit c ∈ R beliebig, • y : (−∞, c) → (1, ∞) , • y : (c, ∞) → (−∞, −1) x → coth(c − x) mit c ∈ R beliebig, x → coth(c − x) mit c ∈ R beliebig. y 2 1 0 -5 -2.5 0 2.5 5 x -1 -2 Abbildung 1.46: Lösungen von y ′ = y 2 − 1 7. (Symmetrie einer Diffgl) Zeigen Sie, dass die Abbildungen (Spiegelung und Translationen)43 Π : F (R) → F (R) , Tτ : F (R) → F (R) , 43 (Πy) (x) := −y(−x) für − x ∈ Dy , (Tτ y) (x) := y(x − τ ), für x − τ ∈ Dy , τ ∈ R F (R) ist die Menge aller auf einer Teilmenge von R definierten reellwertigen Funktionen. Für y ∈ F (R) bezeichnet Dy ⊂ R den Definitionsbereich von y. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 126 die Lösungsmenge L aus Beispiel 6) auf sich abbilden. Man sagt: Π und Tτ sind Symmetrien von y ′ = y 2 − 1. Diese Symmetrien ermöglichen es, sich bei der Lösung des Anfangswertproblems auf Anfangswerte (x0 , y0 ) mit x0 = 0 und y0 ≥ 0 zu beschränken. Warum? 8. (Inhomogen linear mit Variation der Konstanten) Die radiale Komponentenfunktion r → Er eines kugelsymmetrischen, statischen elektrischen Feldes ist eine Lösung der Diffgleichung y ′ = f (x, y) mit f : R>0 × R → R, (x, y) → − 2y + g(x). x Hier ist g : R>0 → R stetig. (g = ρ/4πε0 für die Ladungsdichte ρ.) Die Diffgl ist also inhomogen linear. (a) Zeigen Sie mit der Variation der Konstantenformel, dass für die Menge L aller maximalen Lösungen von y ′ = f (x, y) gilt: , x , , 1 2 , L = αC : R>0 → R, x → 2 C + ξ g(ξ)dξ , C ∈ R . x , 0 (b) Seien g0 ∈ R und R ∈ R>0 . Berechnen Sie die Funktion α0 : R>0 → R, x x→ ξ 2 g(ξ)dξ für die (unstetige!) Ladungsdichte, für die 1 x2 0 g(x) = g0 für 0 < x < R . 0 für R ≤ x Skizzieren Sie den Graphen von α0 . Wo ist der Betrag von α0 maximal? Zeigen Sie, dass α0 auf R>0 stetig ist, und dass für x = R α′0 (x) = − 2α0 (x) + g(x) x gilt. 9. Sie v ∈ R. Bestimmen Sie die Menge L aller Funktionen y : R → R mit y ′ (x) = y (x) sin x + v sin x für alle x ∈ R. Lösung: Sei yc : R → R so, dass yc (x) = ce− cos x − v für alle x ∈ R. Dann gilt L = {yc |c ∈ R} . Für welche der Funktionen yc gilt die Anfangsbedingung yc (0) = 0? Lösung: Nur jene Funktion yc mit c = ev. 10. (Inhomogen linear mit Variation der Konstanten) Zwischen den Enden eines Drahtes mit dem Widerstand R ∈ R>0 und der Selbstinduktivität L ∈ R>0 liege zur Zeit t die Spannung U(t) an. Die Funktion U : R → R sei stetig. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 127 Für die Stromstärke I(t), die zur Zeit t durch den Draht fließt, gilt dann44 (näherungsweise) für alle t ∈ R die Differentialgleichung L d I(t) + RI(t) = U(t). dt (1.65) (a) Zeigen Sie, dass für U (t) = U0 cos (ωt) genau eine beschränkte maximale Lösung I von (1.65) existiert, und dass für diese gilt I (t) = U0 cos (ωt − δ) R2 + (Lω)2 mit δ = arctan π Lω ∈ 0, . R 2 (b) Berechnen Sie die maximale Lösung von (1.65) zur Anfangsbedingung I(0) = 0 für die Inhomogenität U = Ue (stetiger Einschaltvorgang), wobei für t < 0 0 U0 Ue (t) = t für 0≤t<T T U0 für T ≤ t mit T ∈ R>0 und U0 ∈ R. Hinweis: Setzen Sie eine partikuläre Lösung in den Bereichen 0 ≤ t < T und T ≤ t inhomogen linear an. Bestimmen Sie die gesuchte Lösung zum Vergleich auch mit der Variation der Konstantenformel. Lösung: für t < 0 0 für 0 ≤ t < T I0 Tτ exp − τt + τt − 1 I(t) = τ T t I0 1 − T exp τ − 1 exp − τ für T ≤ t mit den Konstanten τ = L/R und I0 = U0 /R. Abbildung 1.47 zeigt U(t)/U0 für T = 1 (grün) und I(t)/I0 für T = 1 und τ = 1/2 (schwarz) bzw. τ = 2 (rot). Der Strom im Schaltkreis mit der höheren Induktivität baut sich also langsamer auf. (c) Sei c > 0 und Ue,c (t) := Ue (t − c). Geben Sie die maximale Lösung von (1.65) im Fall der Inhomogenität Ue,c und der Anfangsbedingung I(0) = 0 an. (d) Gegen welche Funktion konvergiert die Lösung von a) für T → 0? (e) Berechnen Sie die maximale Lösung von (1.65) mit der Inhomogenität U = U0 − Ue zur Anfangsbedingung I(0) = U0 /R (stetiger Ausschaltvorgang). Achtung: Die Lösung kann aus jener von a) ganz einfach gewonnen werden. 11. (Inhomogen linear mit Variation der Konstanten) Die Differentialgleichung (1.65) kann auch für unstetige Inhomogenität U formuliert werden. Dazu ein Beispiel: Sei U0 für 0 < t < T U (t) = . 0 sonst 44 Siehe etwa: R Resnik, D Halliday, K S Crane, Physics, New York, 1992; Kap 38-3 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 128 1 0.75 0.5 0.25 0 -2 0 2 4 6 t Abbildung 1.47: Einschaltvorgang mit U0 ∈ R (”Rechteckpuls”). Die Funktion U ist auf den drei Intervallen D1 = (−∞, 0) , D2 = (0, T ) und D3 = (T, ∞) stetig. Damit sind drei Differentialgleichungen y ′ = ai (x)y +bi (x) = fi (x, y) im Sinn der Vorlesung auf offenen Definitionsbereichen Di gegeben. (a) Berechnen Sie jene drei Lösungen αi von y ′ = fi (x, y), die Einschränkungen einer (einzigen!) stetigen Funktion α auf R mit y(0) = 0 sind. Geben Sie α an. (b) Wo ist α diffbar? Skizzieren Sie den Graphen der Abbildung x → α′ (x). (LI˙ gibt im Fall der Serienschaltung einer Spule und eines Ohmschen Widerstandes die Spannung zwischen den Enden der Spule an.) 12. (Autonomes lineares System erster Ordnung; Bahnen der Lorentzgruppe) Für die Abbildung X : R2×1 → R2×1 gelte X: x y y x → . Der Graph der Abbildung X, also die Menge Γ (X) := (v, X (v)) | v ∈ R2×1 ⊂ R2×1 × R2×1 , wird als das Vektorfeld (zu) X bezeichnet. Siehe Abbildung 1.48. (a) Zeigen Sie, dass für die Menge L aller maximalen Lösungen des Systems γ̇ = X(γ) gilt L = {γ v | v ∈ R2×1 } mit γ v : R → R2×1 und γ v (t) = cosh(t) sinh(t) sinh(t) cosh(t) · v1 v2 für v = v1 v2 ∈ R2×1 . (b) Skizzieren Sie die Bahnen durch die Punkte (1, 0)t , (0, 1)t und (1, 1)t . Die Bahn durch (1, 0)t ist die Menge cosh(t) sinh(t) sinh(t) cosh(t) · 1 0 |t∈R . KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 129 y 0 0 x Abbildung 1.48: Das Vektorfeld zu X Die anderen Bahnen sind analog zu bilden. Ist (0, 0)t in der Bahn durch (1, 1)t enthalten? 13. (Hamiltonsyteme) Seien x1 , . . . x2n die Standardkoordinaten von V = R2n und sei U ⊂ V offen. Sei H : U → R zwei mal stetig differenzierbar. Das Vektorfeld X : U → V habe in der Standardbasis (e1 , . . . e2n ) die Zerlegung n X= i=1 ∂H ei − ∂xi+n n i=1 ∂H ei+n . ∂xi Sei γ : I → U eine Lösung von γ̇ = X ◦ γ. Zeigen Sie, dass H ◦ γ konstant ist. Geben Sie eine solche Funktion H für das Oszillatorsystem ẋ1 = x2 , ẋ2 = −x1 auf U = R2 an. Ist das System der Zerfallskette ẋ1 = −x1 , ẋ2 = −x2 + x1 auf U = R2 ein Hamiltonsystem? (Die Funktion H heißt Hamiltonfunktion und X das zugehörige Hamilton’sche Vektorfeld.) 14. (Autonomes lineares System erster Ordnung; dreidimensionale Drehbewegung mit konstanter Winkelgeschwindigkeit) Sei V ein dreidimensionaler, orientierter, reeller Vektorraum mit Skalarprodukt ·, · . Für ein festes n ∈ V ist die Abbildung Ln : V → V, v → n × v linear. Hier bezeichnet n × v das Vektorprodukt von n mit v. Sei nun |n| = 1 und ω ∈ R. (a) Es sei die Kurve γ v : R → V durch γ v (t) = n n, v + cos (ωt) (v − n n, v ) + sin (ωt) n × v für alle t ∈ R definiert. Zeigen Sie, dass γ v die maximale Lösung des Systems v̇ = ωLn (v) mit γ v (0) = v ist. Welche Bahn hat γ v ? Geben Sie die (maximale) Flussabbildung Φ des Vektorfeldes ωLn an. Hinweis: a × (b × c) = b a, c − c a, b . (b) Kontrollieren Sie durch Aufsummieren der Exponentialreihe, dass γ v (t) = exp (tωLn ) (v). KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 130 00 0 z y x Abbildung 1.49: Das Drehvektorfeld Le3 (c) Zeigen Sie für die Beschleunigung bv (t) = d2 γ v (t) dt2 der Integralkurve bv (t) = −ω 2 (γ v (t) − n n, γ v (t) ) . 15. (Autonomes lineares System erster Ordnung; Quantenevolution eines Spin1/2-Systems) Es sei V ein zweidimensionaler komplexer Vektorraum mit Skalarprodukt ·, · . Für zwei Vektoren e1 und e2 gelte ei , ej = δ i,j . Für die lineare Abbildung σ : V → V gelte σe1 = e2 und σe2 = e1 . (a) Zeigen Sie45 Φ : R × V → V, (t, v) → exp (−itσ) v = cos (t) v − i sin (t) σv = U (t)v. Hinweis: σ 2n = id für alle n ∈ N0 . (b) Kontrollieren Sie U (t)v, U (tw) = v, w für alle v, w ∈ V und für alle t ∈ R. (Unitarität) (c) Zeigen Sie | U (t)e1 , e1 |2 = cos2 (t). 16. (Getriebene ungedämpfte Schwingung) Finden Sie für g : R → R, x → cos(q1 x) cos(q2 x) mit q2 > q1 + 1 > 1 per Ansatz eine (maximale) Lösung von y ′′ + y = g. Hinweis: cos(α) cos(β) = (cos(α + β) + cos(α − β)) /2. Machen Sie für eine partikuläre Lösung von y ′′ (x) + y(x) = cos (qx) den Ansatz y(x) = A cos(qx). Lösung: y(x) = − 1 2 cos ((q2 + q1 ) x) cos ((q2 − q1 ) x) + (q2 + q1 )2 − 1 (q2 − q1 )2 − 1 Die Abbildung 1.50 zeigt g (strichliert) und y (durchgezogen) für den Fall q1 = 9 und q2 = 11. Liegt hier Resonanz vor? 45 Φ ist also der maximale Fluss des Systems iγ̇ = σγ. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 131 y 0.75 0.5 0.25 0 -2 -1 0 1 2 -0.25 x -0.5 -0.75 Abbildung 1.50: ypart (durchgezogen) zur cos(9x) cos(11x)-Inhomogenität (strichliert) 17. Sei λ > 0 und x : R → R die maximale Lösung der Schwingungsgleichung (1.66) zum Anfangswert x(0) = x′ (0) = 0. (Die Inhomogenität nimmt ihr Maximum von 1/e nur bei t = 1/λ an.) y ′′ (t) + y(t) = λte−λ|t| (1.66) (a) Zeigen Sie (mit der Variation der Konstantenformel) für t = 0, dass x(t) = λ λ2 − 1 sin t + 2λ |t|t e−λ|t| − cos t + λ2 + 1 te−λ|t| λ2 + 1 2 . Hinweis: Aufgrund des Eindeutigkeitssatzes gilt x(−t) = −x(t) für alle t ∈ R. Daher genügt die Berechnung von x(t) für alle t > 0. (b) Die retardierte Lösung xret von Gleichung (1.66) ist durch lim xret (t) = 0 t→−∞ eindeutig bestimmt. Zeigen Sie für t = 0 und mit Θ(t) := 1 für t > 0 und Θ(t) := 0 für t < 0, dass xret (t) = λ 2 λ +1 2 λ2 + 1 t + 2λ t e−λ|t| − 4λΘ (t) cos t . |t| Die Amplitude der für t → ∞ asymptotisch freien Schwingung ist 4λ2 / λ2 + 1 2 . Siehe Figur 1.51. Die Amplitude ist maximal bei λ = 1. Figur 1.52 zeigt xret für λ = 1. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 132 1 0.75 0.5 0.25 0 0 2.5 5 7.5 10 Abbildung 1.51: Asymptotische Amplitude 1 0.5 0 -10 -5 0 5 10 15 20 25 t -0.5 -1 Abbildung 1.52: xret (t) für λ = 1 und t exp (− |t|) 18. (Homogen lineare Diffgl zweiter Ordnung; Wronskideterminante, d’Alemberts Reduktionsverfahren) I sei ein offenes, reelles Intervall. Die Funktionen p : I → R und q : I → R seien stetig und y1 , y2 : I → R seien Lösungen von y ′′ + py ′ + qy = 0. (1.67) Die Wronskideterminante W : I → R von y1 und y2 ist definiert durch W (x) = det y1 (x) y2 (x) y1′ (x) y2′ (x) . (a) Zeigen Sie zunächst W ′ = −pW . Dann beweisen Sie: Aus W (x0 ) = 0 für ein x0 ∈ I folgt, dass W (x) = 0 für alle x ∈ I. (b) Sei (y1 , y2 ) ein Fundamentalsystem von (1.67), für das y1 (x0 ) = 0, y2 (x0 ) = 0 und W (x0 ) = 1 gilt. Dann existiert eine Umgebung J ⊂ I von x0 mit y1 (x) = 0 für alle x ∈ J. Leiten Sie aus x W (x) = exp − p(ξ)dξ x0 die folgende Integraldarstellung von y2 (x) x y2 (x) = y1 (x) x0 1 exp − y1 (ξ)2 ξ p(t)dt dξ x0 KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 133 für x ∈ J ab. (c) Formulieren Sie Gleichung (1.67) als (nichtautonomes) lineares System erster Ordnung v ′ = A(x)v auf V = R2×1 ; geben Sie also die Abbildung A : I → R2×2 an. 19. (Homogen lineare Diffgl zweiter Ordnung mit konstanten Koeffizienten, Fundamentalsystem) Sei α ∈ R≥0 und die parameterbereinigte gedämpften Schwingungsgleichung y ′′ + 2αy ′ + y = 0. (1.68) (a) Bestimmen Sie mittels Exponentialansatzes ein Fundamentalsystem von (1.68). Unterscheiden Sie dabei die 3 Fälle 0 ≤ α < 1, α = 1, α > 1. Zeigen Sie die lineare Unabhängigkeit des gefundenen Lösungspaares mit der Wronskideterminante. (b) Bestimmen Sie die Lösung mit y(0) = 0 und y ′ (0) = 1. (c) Benützen Sie das Verfahren von Beispiel 18, um für α = 1 aus der Lösung y1 (x) = exp(−x) eine zweite linear unabhängige Lösung zu erhalten. 20. (Rodriguesformel) Schließen Sie aus der Definition der Legendrepolynome Pn : R → R für n ∈ N0 1 Pn (x) := n 2 n! n d dx x2 − 1 n , dass P0 (x) = 1, P1 (x) = x, P2 (x) = 12 (3x2 − 1) , P3 (x) = 12 (5x3 − 3x) , P4 (x) = 1 (35x4 − 30x2 + 3). 8 y 2 1.5 1 0.5 0 -1 -0.5 0 -0.5 0.5 1 x -1 -1.5 Die Legendrepolynome P0 , . . . P4 21. Sei n ∈ N0 . Dann lautet die Legendresche Differentialgleichung für alle x ∈ (−1, 1) 1 − x2 y ′′ − 2xy ′ + n(n + 1)y = 0. (1.69) Zeigen Sie, dass jede maximale Lösung y von (1.69) mit y ′ (0) = 0 eine gerade Funktion ist. Zeigen Sie, dass jede maximale Lösung y mit y(0) = 0 eine ungerade Funktion ist. Hinweis: Zeigen Sie, dass zu jeder Lösung α auch die gespiegelte Funktion Πα (x) := α(−x) eine Lösung ist. KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 134 22. (Frobeniusmethode zur Berechnung der Legendrepolynome) Nach dem Entwicklungssatz hat jede maximale Lösung von Gleichung (1.69) eine Potenzreihenentwicklung (1.70) mit einem Konvergenzradius r ≥ 1. y(x) = k∈N0 xk ck k! (1.70) (a) Zeigen Sie: Ist y eine maximale Lösung von (1.69), dann gilt für alle k ∈ N0 die Rekursion (1.71) ck+2 = (k(k + 1) − λ) ck . (b) Zeigen Sie: y ist ein Polynom genau dann, wenn λ = n(n + 1) für ein n ∈ N0 und wenn Πy = (−1)n y. (Da das Legendrepolynom Pn Lösung von Gleichung (1.69) mit λ = n(n+1) ist, ist nach dem Eindeutigkeitssatz der Raum der Polynomlösungen durch R · Pn gegeben.) (c) Sei λ = 3(3+1). Berechnen Sie die Polynomlösung y von Gleichung (1.69) mit limx→1 y(x) = 1 über die Reihenformel. Überprüfen Sie, dass y = P3 . (d) Prüfen Sie mit dem Quotientenkriterium, dass eine Potenzreihe (1.70), für deren Koeffizienten (1.71) gilt, tatsächlich für alle |x| < 1 konvergiert. Bemerkung: (Ohne Beweis) α hat genau dann eine stetige Fortsetzung nach [−1, 1], wenn y ein Polynom ist. (e) Sei n ∈ N0 . Zeigen Sie für Pn (x) = n Binomialreihe für (x2 − 1) , dass 1 Pn (x) = n 2 [n/2] (−1)k k=0 n k dn dxn n (x2 − 1) /2n n! mit Hilfe der 2n − 2k n xn−2k . Überprüfen Sie daran die Rekursionsformel (1.71). [n/2] bezeichnet das Größte Ganze von n/2. 23. (Fundamentalsystem der Legendreschen Differentialgleichung für n = 0 und für n = 1) Berechnen Sie für n = 0 und n = 1 jeweils die Menge aller maximalen Lösungen der auf (−1, 1) eigeschränkten Differentialgleichung (1.69). Hinweis: Die Lösung Pn kann mit d’Alemberts Reduktionsverfahren auf (−1, 1) zu einem Fundamentalsystem ergänzt werden. Lösung (Fig. 2): Ln=0 = αa,b : (−1, 1) → R, Ln=1 = αa,b : (−1, 1) → R, 1+x x → a + b ln | a, b ∈ R2 , 1−x * + 1+x x → ax + b x ln − 2 | a, b ∈ R2 . 1−x KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 135 y 2.5 1.25 0 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 x -1.25 -2.5 Die Lösungen α0,1 für n = 0 und n = 1 (strichliert) 24. (Erzeugende Funktion der Legenre Polynome) Seien x, y ∈ R3 mit r := |x| , und r0 := |y|. Ist θ der Winkel zwischen x und y, dann gilt für x = y 1 1 = . 2 |x − y| r2 + r0 − 2rr0 cos θ Behauptung46 : Für −1 < λ < 1 gilt 1 2 1 − 2λ cos θ + λ ∞ = Pn (cos θ) λn . n=0 Kontrollieren Sie diese Behauptung an den ersten 3 Summanden unter Verwendung der Taylorreihe 1 1.3 2 1.3.5 3 1 √ = 1− x+ x − x + . . . für − 1 < x ≤ 1. 2 2.4 2.4.6 1+x Zeigen Sie nun, dass 1 1 = |x − y| r ∞ Pn (cos θ) n=0 r0 r n für r0 < r. 25. (Orthogonalisierung von Polynomen) Sei ek : [−1, 1] → R, x → xk für k ∈ N0 . Die Folge Bn := (ek )k≤n ist eine geordnete Basis des Vektorraums Vn aller reellen Polynome auf [−1, 1] , deren Grad kleiner oder gleich n ist. Auf dem Vektorraum C ([−1, 1]) aller stetigen Funktionen von [−1, 1] nach R ist durch 1 f, g := f(x)g(x)dx −1 ein Skalarprodukt definiert. Wenden Sie auf die Basis B2 von V2 das GramSchmidt Verfahren zu ·, · an. Kontrollieren Sie, dass dies auf die Basis k + 1/2Pk 0≤k≤2 von V2 führt. 46 Der Beweis folgt in der Vorlesung Mathematische Methoden der Physik II. Kapitel 2 Fourieranalysis Das Studium der Schwingungsgleichung y ′′ (t) + y (t) = f (t) zeigte uns, dass im Fall von f (t) = cos ωt für ω = 1 eine maximale Lösung Cω mit dem Ansatz A cos(ωt) zu erhalten ist1 . Es ergibt sich A = 1/ (1 − ω 2 ) . Eine Rechtstranslation um π/2 erzeugt aus Cω eine maximale Lösung Sω zur Inhomogenität sin ωt. Für die allgemeinere Inhomogenität f : R → R des Typs f (t) = (2.1) [aω cos(ωt) + bω sin(ωt)] ω∈Ω mit aω , bω ∈ R ist daher, für endliche Menge Ω, eine Lösung durch die Überlagerung von Einzellösungen durch y (t) = ω∈Ω [aω Cω (t) + bω Sω (t)] gegeben. Dieses Lösungsverfahren funktioniert in leicht abgewandelter Form für alle inhomogen linearen Differentialgleichungen mit konstanten Koeffizienten und einer Inhomogenität des Typs von Gleichung (2.1). Damit stellt sich die Frage, welche Funktionen durch eine Funktion f des Typs von Gleichung (2.1) auf kontrollierbare Weise approximiert werden können. Kelvin benutzte z.B. einen solchen Ansatz, um den Gezeitengang des Wasserspiegels in einem englischen Kriegshafen auf Jahre im voraus aus Aufzeichnungen über zurückliegende Werte vorauszusagen. Die britische Marine zog ihren Nutzen daraus. Erheblich einfacher wird die Frage nach der Approximierbarkeit einer Funktion durch Summen von Sinus- und Cosinusfunktionen für stetige Funktionen mit einem endlichen Definitionsintervall, also für f : [0, T ] → R. Schon J. B. Fourier vermutete, dass solche Funktionen im Fall von f (0) = f (T ) durch endliche Summen des Typs (2.1) mit Ω ⊂ (2π/T ) N0 punktweise beliebig genau approximiert werden können. Seine Vermutung wurde später von Weierstraß bewiesen: Sei f : [0, T ] → R stetig und es gelte f (0) = f(T ). Dann existieren zu jedem ε > 0 reelle Zahlen a0 , . . . an und b1 , . . . bn , sodass für die Funktion fn : R → R mit n a0 t fn (t) := + ak cos 2πk 2 T k=1 + bk sin 2πk t T (2.2) für alle t ∈ [0, T ] die Abschätzung |f(t) − fn (t)| < ε gilt. (Die Zahlen n und a1 , . . . bn hängen dabei im Allgemeinen von ε ab.) 1 Im ungedämpften, resonanten Fall ω = 1 führt der Ansatz Ct cos(ωt − δ) zum Ziel. 136 KAPITEL 2. FOURIERANALYSIS 137 Fourier gab auch eine Rezeptur an, wie zwei unendliche Zahlenfolgen, die Fourierkoeffizienten, (a0 , a1 , . . .) und (b1 , b2 , . . .) zu berechnen sein könnten, sodass für alle t ∈ [0, T ] die punktweise Konvergenz n f (t) = a0 t ak cos 2πk + lim n→∞ 2 T k=1 + bk sin 2πk t T (2.3) gilt. Fouriers Rezeptur stellte sich zwar in vielen aber nicht in allen Fällen als korrekt heraus. Eine korrekte Konstruktion stammt von Fejér. Sie realisiert eine Variante von Gleichung (2.3) für stetige Funktion f mit Koeffizienten ank und bnk , die sich mit n ändern. Das Erstaunliche an der Approximation (2.2) ist jedenfalls die Tatsache, dass ein Frequenzspektrum Ω ⊂ (2π/T ) N0 ausreicht. Die weitere Ausarbeitung von Fouriers Approximationsrezeptur zeigte, dass sie zwar nicht unbedingt punktweise aber wenigstens „im quadratischen Mittel“ funktioniert. Und dies sogar auch für gewisse unstetige Funktionen. Fouriers Idee durchdringt heute die Physik. Sinus und Cosinus sind die Bausteine, aus denen viele Schwingungen und Wellen zusammengesetzt sind. Akustische oder optische Spektralanalyse ist eine Methode, die (annähernd) monofrequenten Anteile von Schall oder Licht zu isolieren. Dabei werden Geräusche in (fast) reine Töne oder Licht in seine Bestandteile (fast) reiner Spektralfarben zerlegt. Wirklich reine Töne oder Farben bleiben allerdings eine von der Natur grundsätzlich unerreichbare Fiktion. 2.1 Fourierreihen Eine Fourierreihe ist eine unendliche Folge von zunehmend besseren Approximationen an eine (stückweise stetige, komplexe) Funktion auf [0, L] . Die Approximationen sind die Partialsummen einer Reihe aus Sinus- und Cosinusfunktionen derselben Periode L. Der Fall aperiodischer Funktionen auf R wird im Abschnitt über Fourierintegration behandelt. 2.1.1 Trigonometrische Polynome Definition 62 Eine Funktion F : R → C mit F (x + L) = F (x) für alle x ∈ R heißt periodisch mit der Periode L (oder kurz L-periodisch). Die Funktionen sin, cos sind 2π-periodisch. Jede auf einem halboffenen Intervall der Länge L definierte Funktion kann eindeutig zu einer L-periodischen Funktion fortgesetzt werden. Durch Umskalierung einer L-periodischen Funktion ist eine Standardisierung der Periode möglich: Ist F eine L-periodische Funktion, dann ist die x Funktion f (x) := F L 2π eine 2π-periodische. Umkehrung: F (x) = f 2π Lx . Definition 63 Seien n ∈ N0 und a0 , a1 , . . . , an , b1 , . . . , bn ∈ C. Die Funktion n n a0 + ak cos(kx) + bk sin(kx) f : R → C mit f (x) = 2 k=1 k=1 KAPITEL 2. FOURIERANALYSIS 138 heißt trigonometrisches Polynom der Ordnung n. Die Menge aller trigonometrischen Polynome der Ordnung n wird in diesem Kapitel mit Vn bezeichnet. Jedes trigonometrische Polynom ist als endliche Linearkombiation von 2π-periodischen C ∞ -Funktionen selbst beliebig oft stetig differenzierbar und 2π-periodisch. Da für f, g ∈ Vn und λ ∈ C auch f + g ∈ Vn und λf ∈ Vn gilt, ist Vn ein CVektorraum. Für m < n ist Vm ein (echter) UnterVR von Vn . Der Vektorraum Vn wird von den 2n + 1 Funktionen {1, cos (kx) , sin (kx)}nk=1 aufgespannt. Somit gilt dim (Vn ) ≤ 2n + 1. Wir werden nun zeigen, dass dim (Vn ) = 2n + 1 gilt. Dazu verschaffen wir uns ein weiteres erzeugendes System von Vn . Lemma 64 Für k ∈ Z sei ek : R → C mit ek (x) := exp(ikx). Das Funktionensystem {ek : |k| ≤ n} spannt Vn auf. Beweis. Mit cos(kx) = eikx + e−ikx /2 und sin(kx) = eikx − e−ikx /2i folgt für f ∈ Vn n n a0 f (x) = + ak cos(kx) + bk sin(kx) 2 k=1 k=1 a0 1 + = 2 2 n n ikx k=1 (ak − ibk ) e −ikx + (ak + ibk ) e ck exp(ikx), = k=−n mit den Zahlen {ck : k ∈ Z, |k| ≤ n} ⊂ C, die durch c0 = a0 /2, ck = (ak − ibk )/2 für k = 1, . . . , n und ck = (a−k + ib−k )/2 für k = −1, . . . , −n gegeben sind. Also ist auch {exp(ikx) | k ∈ Z und − n ≤ k ≤ n} ein erzeugendes System von Vn . Die Definition der Koeffizienten ck ist nach ak , bk auflösbar. Es gilt ak = ck + c−k für k = 0, . . . , n, und bk = i (ck − c−k ) für k = 1, . . . , n. Zudem ist nun klar: aus f ∈ Vm und g ∈ Vn folgt f · g ∈ Vm+n . Lemma 65 Das Funktionensystem {ek }k∈Z ist ein Orthonormalsystem im Vektorraum aller stetigen 2π-periodischen Funktionen mit dem Skalarprodukt f, g := 1 2π 2π f (x)g(x)dx, 0 ′ ′ , ek = δ k′ k für alle k, k ∈ Z. Das Funktionensystem {1, Ck , Sk |k ∈ N} d.h. es gilt ek√ √ mit Ck (x) = 2 cos (kx) , Sk (x) = 2 sin (kx) ist ein weiteres Orthonormalsystem. Beweis. Seien zunächst k, k ′ ∈ Z mit k = k ′ . Dann gilt ,2π 2π exp(i(k − k ′ )x) ,, 1−1 ′ exp(i(k − k )x)dx = = = 0. , ′ i(k − k ) i(k − k ′ ) 0 0 2π 2π Für k = k ′ gilt aber 0 exp(i(k − k ′ )x)dx = 0 dx = 2π. Daher gilt ek′ , ek = δ k′ k . Für Ck = √12 (ek + e−k ) , Sk = i√1 2 (ek − e−k ) mit k ∈ N folgt für alle l, m ∈ N, dass Cl , Cm = Sl , Sm = δ l,m , Cl , Sm = Cl , 1 = Sl , 1 = 0 und 1, 1 = 1. KAPITEL 2. FOURIERANALYSIS 139 Satz 66 Die Funktionensysteme {ek }nk=−n und {1, Ck , Sk }nk=1 sind Orthonormalbasen von Vn . Es gilt dim (Vn ) = 2n + 1. Für f ∈ Vn mit f = nk=−n ck ek gilt a0 f (x) = + 2 1 2π 1 = π 1 = π n ak cos(kx) + k=1 2π ck = ak bk n 0 2π bk sin(kx), k=1 exp(−ikx)f (x)dx für alle k = −n, . . . n, cos(kx)f (x)dx für alle k = 0, . . . n, 0 2π sin(kx)f(x)dx für alle k = 1, . . . n. 0 Beweis. Das System {ek }nk=−n ist ein erzeugendes Sytem von Vn . Sei f = n k=−n ck ek . Wegen n el , f = ck el , ek = cl k=−n folgt aus f = 0, dass cl = 0 für alle l = −n, . . . n. Damit ist {ek }nk=−n ein linear unabhängiges, orthonormales, erzeugendes System von Vn , eine sogenannte Orthonormalbasis. Das erzeugende System {1, Ck , Sk }nk=1 von Vn ist nach dem vorangehenden Lemma ebenfalls ein Orthonormalsystem und somit eine Orthonormalbasis von Vn . Für die Entwicklungskoeffizienten ak , bk von f ∈ Vn folgt ak = ck + c−k = ek + e−k , f = 1 = π bk 1 2π 2π e−ikx + eikx f (x)dx 0 2π cos(kx)f (x)dx, 0 1 = i (ck − c−k ) = π 2π sin(kx)f (x)dx. 0 Dieser Satz zeigt also, dass die Entwicklungskoeffizienten (ck )nk=−n eines trigonometrischen Polynoms f ∈ Vn erstens eindeutig sind und zweitens durch Skalarproduktbildung zu berechnen sind. Gerade das macht ja die Orthonormalbasen eines Vektorraums so praktisch. Als weitere unmittelbare Folge gilt für f ∈ Vn mit f = nk=−n ck ek , dass f 2 = f, f = nk=−n |ck |2 . Eine weitere bemerkenswerte Eigenschaft von Vn ist, dass eine beliebige Translation den Raum Vn in sich überführt, denn es gilt ja für δ ∈ R und f ∈ V n (Tδ f ) (x) := f (x − δ) = n ik(x−δ) ck e k=−n ck e−ikδ eikx . = k=−n Bei einer Translation um δ geht die Funktion f ∈ V mit den Koeffizienten (ck )nk=−n n in die Funktion Tδ f ∈ Vn mit den Koeffizienten e−ikδ ck k=−n über. Insbesondere gilt Tδ ek = e−ikδ ek . KAPITEL 2. FOURIERANALYSIS 2.1.2 140 Beispiele trigonometrischer Polynome 1. Potenzen von Sinus oder Cosinus Die Hintereinanderausführung eines (komplexen) Polynoms Qn vom Grad n nach einer trigonometrischen Funktion des Typs αeix + βe−ix ergibt offenbar ein Element von Vn . Es gilt also insbesonders sinn , cosn ∈ Vn für n ∈ N. Die Zerlegung von cosn nach der sin / cos-Basis ergibt sich folgendermaßen. n n −ix n ix 2 cos (x) = e + e n = k=0 = n k eix n inx n n −inx e + ei(n−2)x + . . . + e =2 n n−1 0 n−k ⌊n/2⌋ k=0 e−ix k n cos ((n − 2k) x) k Hier bezeichnet ⌊n/2⌋ die größte ganze Zahl kleiner oder gleich n/2. n Für sinn ergibt sich die Basiszerlegung: (2i)n sinn x = (eix − e−ix) = = einx 1 − e−2ix n n = einx k=0 n (−1)k e−ikx = k n k=0 n (−1)k ei(n−2k)x . k Sei nun n ungerade. Dann gilt * + * + n inx n −inx n i(n−2)x n n n −i(n−2)x (2i) sin x = e − e − e − e + ... 1 0 n n−1 * + n n ⌊n/2⌋ ix −ix + (−1) e − e ⌊n/2⌋ ⌊n/2⌋ + 1 * + n n n ⌊n/2⌋ = 2i sin (nx) − sin ((n − 2) x) + . . . + (−1) sin x . ⌊n/2⌋ 0 1 Damit folgt für n = 2m − 1 mit m ∈ N 2m−1 sin 4 x= m 4 m (−1)k−1 k=1 2m − 1 sin ((2k − 1) x) . m−k Eine ähnlich Zerlegung besitzen die geradzahligen Potenzen sin2m , wobei allerdings die Basisfunktionen sin ((2k − 1) x) durch cos ((2k − 1) x) abgelöst werden, da sin2m ja eine gerade Funktion ist. 2. Chebyshev - Polynome Für n ∈ N existiert genau ein (reelles) Polynom Tn vom Grad n mit cos (nx) = Tn (cos x) für alle x ∈ R, das sogenannte n-te Chebyshev - Polynom. (Siehe nachfolgendes Lemma.) Offenbar gilt Tn (x) = cos (n arccos x) und |Tn (x)| ≤ 1 für alle x ∈ [−1, 1] . Es gilt weiter T0 = 1, T1 (x) = x, T2 (x) = 2x2 − 1. Der Koeffizient des Monoms xn in Tn hat nach Beispiel 1) für n ≥ 1 den Wert 2n−1 . Zweimaliges Ableiten von cos (nx) = Tn (cos x) nach x ergibt 1 − x2 Tn′′ (x) − xTn′ (x) + n2 Tn (x) = 0. KAPITEL 2. FOURIERANALYSIS 141 Der Funktionsgraph von Tn über [−1, 1] entsteht bei Orthogonalprojektion des Graphen der Funktion cos (nϕ) über dem Einheitskreis um 0 in der z = 0 Ebene auf die Ebene y = 0. Siehe Figuren 2.1 und 2.2. 1 0.5 1 -1 0.5 -0.5 0 -0.5 0 0.5 1 -1 x -0.5 y -1 z Abbildung 2.1: Raumkurven (cos ϕ, sin ϕ, cos (nϕ)) für n = 0, 1, 3 1 0.5 0 -1 -0.5 0 0.5 1 -0.5 -1 Abbildung 2.2: Chebyshev Polynome T0 , . . . T5 Höhere Chebyshev - Polynome wie T3 (x) = x (4x2 − 3) , T4 (x) = 8x2 (x2 − 1)+1, T5 (x) = 4x3 (4x2 − 5) + 5x können über die folgende Rekursion berechnet werden, die zudem einen Induktionsbeweis für die Existenz der Polynome Tn abgibt. Lemma 67 Für n ∈ N und x ∈ R gilt Tn+1 (x) = 2xTn (x) − Tn−1 (x) . Beweis. Es gilt für alle x ∈ R Tn+1 (cos x) = cos ((n + 1) x) = cos ((n + 1) x) + cos ((n − 1) x) − cos ((n − 1) x) = cos (nx + x) + cos (nx − x) − cos ((n − 1) x) = 2 cos (x) cos (nx) − cos ((n − 1) x) = 2 cos (x) Tn (cos x) − Tn−1 (cos x) . Dies ist aber genau die behauptete Rekursion auf [−1, 1] . Stimmen zwei Polynome auf einem endlichen Intervall überein, dann sind sie auf ganz R gleich. Die Chebyshev - Polynome haben die folgende merkwürdige Eigenschaft: Unter allen Polynomen des Typs 2n−1 xn + an−1 xn−1 + . . . ist Tn das einzige Polynom, das am Intervall [−1, 1] um höchstens den Betrag 1 von 0 abweicht. Etwas präziser ausgedrückt: KAPITEL 2. FOURIERANALYSIS 142 Lemma 68 Ist Qn−1 ein Polynom von höchstens dem Grad n − 1 ≥ 0, dann gilt sup−1≤x≤1 |Tn (x) + Qn−1 (x)| ≥ 1. Es gilt sup−1≤x≤1 |Tn (x) + Qn−1 (x)| = 1 genau dann, wenn Qn−1 = 0. Beweis. Definitionsgemäß hat Tn an den Stellen xk = cos (kπ/n) mit k ∈ {0, 1, . . . n} den Wert Tn (xk ) = cos (kπ) = (−1)k . Wegen |Tn (x)| ≤ 1 für alle x ∈ [−1, 1] gilt daher sup−1≤x≤1 |Tn (x)| = 1. Die Ungleichung wird indirekt bewiesen: Angenommen es gibt ein nichtverschwindendes Polynom Qn−1 mit sup−1≤x≤1 |Tn (x) + Qn−1 (x)| ≤ 1, dann folgt Qn−1 (x0 ) ≤ 0, Qn−1 (x1 ) ≥ 0, Qn−1 (x1 ) ≤ 0, ... Das Polynom Qn−1 hätte also mindestens n Nullstellen (im Intervall [−1, 1]). Ein Polynom vom Grad n − 1 hat jedoch höchstens n − 1 Nullstellen. Damit führt die Annahme sup−1≤x≤1 |Tn (x) + Qn−1 (x)| ≤ 1 auf einen Widerspruch. Korollar 69 Ist Qn−1 ein Polynom von höchstens dem Grad n − 1 ≥ 0, dann gilt sup−1≤x≤1 |xn − Qn−1 (x)| ≥ 21−n . Gleichheit liegt genau dann vor, wenn Qn−1 (x) = xn − 21−n Tn (x) . Beweis. Sei n ∈ N. Gemäß Definition von Tn ist x → xn −21−n Tn (x) ein (reelles) Polynom vom Grad n − 1. Ist Qn−1 ein Polynom vom Grad n − 1, dann ist auch Pn−1 mit Qn−1 (x) = xn − 21−n (Tn (x) + Pn−1 (x)) ein Polynom vom Grad n − 1. Somit gilt sup |xn − Qn−1 (x)| = 21−n sup |Tn (x) + Pn−1 (x)| ≥ 21−n . −1≤x≤1 −1≤x≤1 Gleichheit gilt genau dann, wenn Pn−1 = 0, also Qn−1 (x) = xn − 21−n Tn (x) . Es gibt somit genau ein Polynom vom Grad n − 1, nämlich xn − 21−n Tn (x) , das am Intervall [−1, 1] in der Supremumsnorm dem Monom xn am nächsten kommt. Dieser Minimalabstand beträgt 21−n . 3. Lissajoufiguren Sei γ : R → R2 mit γ (t) = 2 sin t, 12 sin 2t . Die Menge γ (R) ist eine Lissajousfigur.2 (Siehe Figur 2.3.) Mit sin2 t = (1 − cos 2t) /2 folgt |γ (t)|2 = 4 sin2 (t) + sin2 (2t) 1 − cos 4t 17 cos 4t = 2 (1 − cos 2t) + = − 2 cos 2t − . 4 8 8 8 Die Funktion t → |γ (t)|2 ist also ein trigonometrisches Polynom vom Grad 4. Wegen γ̇ (t) = (2 cot s, cos 2t) und 2 cos2 t = 1 + cos 2t ist auch |γ̇|2 ∈ V4 : |γ̇ (t)|2 = 4 cos2 t + cos2 2t = 2 (1 + cos 2t) + 2 1 + cos 4t 5 cos 4t = + 2 cos 2t + . 2 2 2 Die Kurve γ = (x, y) ist eine Lösung der Newtonschen Bewegungsgleichungen eines anisotropen, 2d harmonischen Oszillators da ja x′′ = −x und y ′′ = −4y. KAPITEL 2. FOURIERANALYSIS 143 y 0.5 0.25 0 -2 -1 0 1 2 x -0.25 -0.5 Abbildung 2.3: Bahn von γ Aus γ̈ (t) = −2 (sin t, sin 2t) folgt für das Normquadrat der Beschleunigung3 |γ̈ (t)|2 = 4 sin2 t + sin2 2t = 2 (2 − cos 2t − cos 4t) . Es gilt also |γ|2 , |γ̇|2 , |γ̈|2 ∈ V4 . (Siehe Figur 2.4.) 6.25 5 3.75 2.5 1.25 0 0 0.25 0.5 0.75 1 Abbildung 2.4: |γ|2 , (grau), |γ̇|2 (grün) und |γ̈|2 (rot) als Funktion von t/2π 2.1.3 Dirichlets Kern 2π n 1 ik(x−y) Für f ∈ Vn und x ∈ R gilt f (x) = nk=−n eikx ek , f = 2π f (y) dy. k=−n e 0 Das trigonometrische Polynom Dn ∈ Vn mit den Koeffizienten ck = 1 erfüllt also Dn (x) = nk=−n exp(ikx) = 1 + 2 nk=1 cos (kx) und für alle f ∈ Vn 1 f (x) = 2π 2π 0 Dn (x − y) f (y) dy. Dn stellt auf Vn die identische Abbildung als Integraloperator dar. Die Funktionenfolge (Dn )n∈N0 heißt Dirichletkern. 3 Die elektromagnetische Strahlungsleistung einer elektrischen Punkladung q, die sich gemäß 2 q2 2 einer Kurve γ mit |γ̇| ≪ c bewegt, ist zur Zeit t annähernd durch P (t) = 4πε 3c3 |γ̈ ((t))| 0 gegeben. (Larmors Strahlungsformel; c bezeichnet die Lichtgeschwindigkeit) KAPITEL 2. FOURIERANALYSIS 144 Untersuchen wir die Funktion Dn etwas genauer. Offenbar ist Dn reellwertig und k gerade. Mit z = eix folgt Dn (x) = z −n 2n k=0 z . Mit der Formel für die Partialsumme einer geometrischen Reihe ergibt sich nun für z = 1, also für x ∈ / 2πZ, Dn (x) = z −n 1 1 1 sin 2n+1 x z −n − z n z e−i(n+ 2 )x − ei(n+ 2 )x − z 2n+1 2 = = = . x x x −i i 1−z 1−z sin 2 e 2 −e 2 n k=−n Für x ∈ 2πZ folgt Dn (x) = Dn (x) = . 1 = 2n + 1. Es gilt somit sin( 2n+1 x) 2 sin( x2 ) für x ∈ R 2πZ für x ∈ 2πZ 2n + 1 Dn ist stetig. Die Funktion Dn fällt zwischen 0 und ihrer kleinsten positiven Nullstelle 2π/(2n+1) von ihrem größten Wert, nämlich 2n+1, auf 0 ab. Die Breite der Spitze bei 0 geht mit wachsendem n gegen 0. Hier zeigt sich erstmals die Faustregel: Je schärfer ein Signal eingegrenzt sein soll, umso mehr Frequenzen müssen beitragen. y 15 12.5 10 7.5 5 2.5 0 -0.25 0 0.25 0.5 0.75 1 1.25 -2.5 x Abbildung 2.5: x → D7 (2πx) (rot) und x → F7 (2πx) (grün) Für die Norm von Dn folgt Dn 2 = nk=−n |ck |2 = 2n + 1. Für die Funktion Fn : R → R mit (2n + 1) · Fn (x) = |Dn (x)|2 = sin2 2n+1 x / sin2 x2 ≥ 0 gilt daher 2 −1 π Fn ∈ V2n und (2π) F (x) dx = 1. Die Funktion Fn /2π ist also Dichte eines W−π n maßes auf dem Intervall [−π, π] , das sich mit wachsendem n zunehmend auf x = 0 zusammenzieht. (Die Folge (Fn ) spielt in Fejers Approximation eine wichtige Rolle.) Abbildung 2.5 zeigt D7 (2πx) und F7 (2πx) . 2.1.4 Grenzfunktionen trigonometrischer Reihen Definition 70 Ist (ck )k∈Z eine Folge in C, dann heißt die Folge (Tn )n∈N0 von trigonometrischen Polynomen Tn ∈ Vn mit Tn (x) = nk=−n ck eikx trigonometrische Reihe mit den Koeffizienten ck . Mit a0 /2 = c0 , ak = ck + c−k und bk = i (ck − c−k ) kann eine trigonometrische Reihe auch in die äquivalente sin / cos-Form gebracht werden: n n ck eikx = Tn (x) = k=−n n a0 + ak cos (kx) + bk sin (kx) . 2 k=1 k=1 KAPITEL 2. FOURIERANALYSIS 145 Falls limn→∞ nk=−n |ck | existiert, sind wegen |ak | ≤ |ck | + |c−k | und |bk | ≤ |ck | + ∞ |c−k | auch die Reihen ∞ k=1 |ak | und k=1 |bk | konvergent. In diesem Fall sind sowohl die trigonometrische Reihe (Tn )n∈N0 als auch die zugeordneten trigonometrischen Reihen (Cn )n∈N0 und (Sn )n∈N mit n a0 Cn (x) = + ak cos (kx) und Sn (x) = 2 k=1 n bk sin (kx) k=1 nach dem Weierstrasskriterium (Kap.II, §4.2 in [3], Vol I) gleichmäßig absolut konvergent. Z.B. gilt ja n n |a0 | |a0 | |Cn (x)| ≤ |ak cos (kx)| ≤ |ak | . + + 2 2 k=1 k=1 Nach Kap III, §1.4, Satz 13 von [3], Vol I, konvergieren die stetigen Funktionen Tn , Cn , Sn punktweise gegen eine stetige Grenzfunktionen. Es gibt aber auch wichtige Beispiele von punktweise konvergenten trigonometrischen Reihen, für die nk=−n |ck | nicht konvergiert. Hier ein Beispiel, das mit einem sehr schlauen Trick arbeitet. Für das Folgenglied Dn des Dirichletkerns gilt auf R 2πZ n sin 2n+1 x 2 Dn (x) = 1 + 2 cos (kx) = . x sin 2 k=1 Sei nun Yn : (0, 2π) → R (hier steckt der Trick!) mit x Yn (x) = Dn (t) dt + 0 n = x+2 k=1 x 2 cos 2n+1 2 x 2n + 1 sin 2 x sin (kx) 2 cos 2n+1 2 + . x k 2n + 1 sin 2 Für jedes n gilt Yn (π) = π und somit auch limn→∞ Yn (π) = π. Es folgt weiter für 0 < x < 2π Yn′ (x) = Dn (x) − = − sin 2n+1 x 1 cos 2 − x 2n + 1 sin 2 2n+1 x cos 2 2 x sin 2 1 cos 2n + 1 x 2 2n+1 x cos 2 2 x sin 2 x 2 . Somit konvergiert Yn′ auf jedem abgeschlossenen Intervall [a, b] ⊂ (0, 2π) gleichmäßig gegen 0. Daher gilt für alle x ∈ (0, 2π) x lim Yn (x) − π = n→∞ = lim (Yn (x) − Yn (π)) = lim n→∞ x lim Yn′ (t) dt = 0. π n→∞ n→∞ π Yn′ (t) dt KAPITEL 2. FOURIERANALYSIS 146 Also gilt für alle x ∈ (0, 2π) n π = lim Yn (x) = x + 2 lim n→∞ n→∞ k=1 sin (kx) . k n sin(k0) k=1 k Für x = 0 gilt limn→∞ = 0. Alle weiteren Werte x ergeben sich aus der 2π-Periodizität. Damit ist die punktweise Konvergenz der trigonometrischen Reihe sin x sin 2x sin 3x + + + ... 1 2 3 gezeigt. Siehe Abbildung 2.6. Und dies, obwohl die Reihe ihrer Koeffizienten bk = 1/k divergiert (harmonische Reihe). Wir fassen zusammen. sin(kx) konvergiert punktweise. Auf jeLemma 71 Die trigonometrische Reihe ∞ k=1 k dem abgeschlossenen Intervall, das keinen Punkt aus 2πZ enthält, ist die Konvergenz gleichmäßig. Es gilt n lim n→∞ k=1 sin (kx) = k π−x 2 0 für x ∈ (0, 2π) . für x ∈ 2πZ Für x = π/2 ergibt sich somit der Wert der alternierenden Reihe zu ∞ k=1 Abbildung 2.6: n sin kx k=1 k sin k π2 = k ∞ k=0 (−1)k π = . 2k + 1 4 für n = 5 und n = 10 (grün) und Grenzfunktion (rot) Als eine Folgerung ergibt sich eine weitere trigonometrische Reihe durch Symmetrisierung um π/2. sin((2k+1)x) Korollar 72 Die trigonometrische Reihe ∞ konvergiert punktweise. k=1 2k+1 Auf jedem abgeschlossenen Intervall, das keinen Punkt aus πZ enthält, ist die Konvergenz gleichmäßig. Es gilt π n für 0 < x < π sin ((2k + 1) x) 4 0 für x ∈ πZ = . lim n→∞ π 2k + 1 k=1 − 4 für − π < x < 0 KAPITEL 2. FOURIERANALYSIS 147 Beweis. Sei −π/2 < ξ < π/2. Damit folgt wegen n lim n→∞ sin k π 2 n +ξ k k=1 sin k + lim n→∞ π 2 k k=1 −ξ = π 2 ± ξ ∈ (0, π) aus dem Lemma π− π 2 +ξ 2 + π− π 2 2 −ξ = π . 2 Nun gilt sin k ik eikξ − (−i)k e−ikξ (−i)k eikξ − ik e−ikξ = (−1)k 2i 2i k ikξ k −ikξ i e − (−i) e π = (−1)k+1 = (−1)k+1 sin k −ξ 2i 2 π +ξ 2 = . Daher ergibt die gliedweise Addition der beiden (konvergenten!) Reihen n lim n→∞ sin k π 2 +ξ k=1 n = 2 lim n→∞ k=1 π 2 + sin k k n −ξ = lim n→∞ π 2 sin (2k + 1) + ξ 2k + 1 sin k k=1 n = 2 lim n→∞ k=1 π +ξ 2 1 + (−1)k+1 k sin ((2k + 1) x) . 2k + 1 Damit ist für 0 < x < π gezeigt, dass n lim n→∞ k=1 sin ((2k + 1) x) π = . 2k + 1 4 Für x = 0 ist die Behauptung des Korollars offensichtlich und der Fall −π < x < 0 wird auf 0 < x < π zurückgeführt: n lim n→∞ 2.1.5 k=1 n sin ((2k + 1) x) sin ((2k + 1) |x|) π = − lim =− . n→∞ 2k + 1 2k + 1 4 k=1 Approximation durch Fourierreihen Ziel ist es nun, eine gegebene Funktion f : [0, 2π] → C durch trigonometrische Polynome „möglichst gut” zu approximieren. Da die approximierenden trigonometrischen Polynome 2π-periodisch sind, setzen wir auch f periodisch nach ganz R fort. (Dazu muss eventuell der Wert von f im Punkt 2π an den Wert im Punkt 0 angeglichen werden. Das schränkt uns aber nicht ein, da unstetige f zulässig sind, und eine punktweise Approximation unstetiger Funktionen ohnehin nur in ganz speziellen Fällen möglich ist.) Welches fn ∈ Vn ist die „beste“ Approximation an f ? Eine Möglichkeit über die Nähe von fn zu f zu räsonieren gibt die mittlere quadratische Abweichung zwischen f und fn , nämlich f − fn 2 1 = 2π 2π 0 |f (x) − fn (x)|2 dx. KAPITEL 2. FOURIERANALYSIS 148 Man sucht also nach einem fn ∈ Vn , für das f − fn minimal ist. Mit steigendem n kann die Approximation fn sicher nicht schlechter werden, da ja V0 ⊂ V1 ⊂ V2 ⊂ . . . Einen Hinweis darauf, welches fn ∈ Vn den Ausdruck f − fn minimiert, liefert die Geometrie eines unitären Vektorraumes mit dem folgenden Satz.4 Satz 73 Sei V ein endlichdimensionaler C−VR mit dem Skalarprodukt ·, · und dem Untervektorraum U. Sei (e1 , ..., en ) eine ONB von U. Sei v ∈ V. Dann folgt 1. u ∈ U und v − u, u′ = 0 ∀u′ ∈ U ⇔ u = PU (v) := n k=1 ek , v ek . 2. v − u′ ≥ v − PU (v) für alle u′ ∈ U. 3. Für ein u′ ∈ U gilt v − PU (v) = v − u′ genau dann, wenn u′ = PU (v) . Beweis. Sei u ∈ U. Dann existieren ck ∈ C mit u = nk=1 ck ek . Daraus folgt ek , v − u = ek , v −ck . Ist der Vektor v−u senkrecht auf U, folgt ek , v − u = 0 für alle k, also ck = ek , v für alle k. Damit ist gezeigt, dass (v − u) ⊥ U ⇒ u = PU (v) . Die Umkehrung folgt durch direktes Nachrechnen. Sei nun u = PU (v) . Dann gilt für alle u′ ∈ U v − u′ 2 = = = 2 v − u − (u′ − u) v − u 2 + 2ℜ v − u, u′ − u + u′ − u 2 v − u 2 + u′ − u ≥ v − u 2 , 2 da ja u′ − u ∈ U und somit v − u, u′ − u = 0. Die Gleichheit v − u′ 2 = v − u 2 gilt genau dann, wenn u − u′ 2 = 0, also genau dann, wenn u′ = u. Dieser Satz gibt eine eindeutige Zerlegung eines beliebigen Vektors v ∈ V in eine Komponente PU (v) ∈ U und eine dazu senkrechte Komponente v − PU (v) . Die Abbildung PU : V → U mit v → PU (v) ist linear und heißt Orthogonalprojektion auf U. Weiter identifiziert der Satz PU (v) als den einzigen Vektor in U mit minimalem Abstand zu v. Definition 74 Sei V der Vektorraum aller 2π-periodischen, beschränkten Funktionen f : R → C, die auf dem Intervall [0, 2π] Riemann-integrierbar5 sind. Die Abbildung ·, · : V × V → C mit f, g = 1 2π 2π f (x)g(x)dx 0 ist ein inneres Produkt auf V . Es wird notiert f = f, f . Für f ∈ V und k ∈ Z heißen die Zahlen ck := ek , f die Fourierkoeffizienten von f. Die Folge (Pn [f])n∈N0 der trigonometrischen Polynome Pn [f ] ∈ Vn mit Pn [f ] := nk=−n ck ek ist eine trigonometrische Reihe. Sie heißt Fouriereihe von f. Kurzschreibweise: f ≃ k∈Z ck ek . 4 Eine andere Art der Approximation ist es, das kleinste ε ≥ 0 zu bestimmen, für das eine Funktion fn ∈ Vn existiert, sodass |f (x) − fn (x)| ≤ ε für alle x ∈ R gilt. Diese Approximation ist jedoch viel schwieriger zu behandeln als jene im Sinn des quadratischen Mittels. 5 Jede beschränkte 2π-periodische Funktion mit höchstens endlich vielen Unstetigkeitsstellen in [0, 2π] ist daher in V . Überdies gilt Vn ⊂ V für alle n ∈ N0 . KAPITEL 2. FOURIERANALYSIS 149 Die Definition von Pn [f ] ist offenbar äquivalent zu Pn [f ] (x) = 1 2π 2π 0 Dn (x − y) f (y) dy, n 2n+1 x / sin x2 (für mit der Dirichletfunktion Dn (x) = k=−n exp (ikx) = sin 2 x ∈ R 2πZ). Der Unterschied zur Elementargeometrie: V ist unendlichdimensional und ·, · ist kein Skalarprodukt, weil f, f = 0 nicht f = 0 impliziert. Die Einschränkung von ·, · auf Vn × Vn ist jedoch ein Skalarprodukt, da die Elemente von Vn stetig sind. Dies genügt, um ein zum endlichdimensionalen Fall analoges Resultat zu erzielen: Satz 75 Sei f ∈ V und fn ∈ Vn . Dann gilt f − fn heit gilt genau dann, wenn fn = Pn [f] . 2 ≥ f − Pn [f ] 2 . Die Gleich- Beweis. Aus der Definition von Pn [f ] folgt f − Pn [f] , ek = 0 für alle k = −n, . . . n. Somit gilt auch f − Pn [f ] , u = 0 für alle u ∈ Vn , insbesondere auch für u = Pn [f ] − fn . Damit folgt f − fn 2 = = = f − Pn [f ] + Pn [f] − fn 2 = f − Pn [f] + u f − Pn [f ] 2 + u 2 + 2ℜ f − Pn [f ] , u f − Pn [f ] 2 + u 2 ≥ f − Pn [f] 2 . Also gilt f − fn 2 f − fn 2 − f − Pn [f ] 2 = u 2 ≥ 0. − f − Pn [f ] 2 = u 2 =0 Da ·, · auf Vn × Vn ein Skalarprodukt ist, gilt 2 genau dann, wenn u = 0, d.h., wenn Pn [f ] = fn . Das trigonometrische Polynom Pn [f ] ist also das einzige Element von Vn , das die quadratische Abweichung zu f minimiert. Es wird als das n-te Fourierpolynom von f bezeichnet und lässt sich mit exp(ikx) = cos(kx) + i sin(kx) natürlich auch in sin und cos Funktionen entwickeln: n a0 Pn [f ] (x) = + (ak cos(kx) + bk sin(kx)) , mit 2 k=1 ak≥0 = ck + c−k = bk>0 1 π 2π cos(kx)f(x)dx, 0 1 = i(ck − c−k ) = π 2π sin(kx)f (x)dx. 0 KAPITEL 2. FOURIERANALYSIS 2.1.6 150 Fourierreihe der Rechteckschwingung Sei f ∈ V ungerade mit f (0) = f (π) = 0 und f (x) = 1 für 0 < x < π. Da f ungerade ist, folgt π π e−ikx f (x) dx = −i 2πck = −π −π π sin (kx) f (x) dx = −2i sin (kx) dx, 0 also c0 = 0 und 2πck = 2ik cos (kx)|π0 = 2ik (−1)k − 1 für k = 0. Es gilt somit ck = 0 2 für k ∈ 2Z und ck = iπk für k ∈ 2Z + 1. Die Fourierreihe von f ergibt sich zu f (x) ≃ ∞ k=0 c2k+1 ei(2k+1)x − e−i(2k+1)x = = 4 π sin x + 4 π ∞ k=0 sin ((2k + 1) x) 2k + 1 1 1 sin 3x + sin 5x + . . . . 3 5 Dass die Reihe sin x+ 13 sin 3x+ 15 sin 5x+. . . für alle x ∈ (0, π) gegen ein und denselben Wert π/4 konvergiert, ist, wie wir aus dem Abschnitt über trigonometrische Reihen wissen, der Fall, aber beileibe nicht offensichtlich.6 Für x = 0 konvergiert die Reihe natürlich gegen 0, da alle ihre Glieder gleich 0 sind. Der Versuch, aus der Fourierreihe von f eine Potenzreihe von f um 0 abzulesen, scheitert schon beim in x linearen Teil, da für x → 0 gilt sin x + 1 1 sin 3x + . . . + sin (2n + 1) x = (n + 1) x + o (x) . 3 2n + 1 Die Entwicklung nach Funktionen, die selbst schon durch Potenzreihen gegeben sind, hat also unsere Approximationsmöglichkeiten erheblich ausgeweitet. Die Abbildungen 2.7 und 2.8 zeigen die Fourierpolynome Pn [f] für n = 1, 3, 5, 7 und f. Wie gut approximiert Pn [f ] die Rechteckfunktion f im quadratischen Mittel? Da f − Pn [f ] nach Konstruktion senkrecht auf Vn ist, gilt 1 1= 2π 2π f 2 (x) dx = f 0 2 = Pn [f ] 2 + f − Pn [f ] 2 . √ Da 2 sin ((2k + 1) x) : k = 1, . . . n ein orthonormales Funktionensystem in V2n+1 ist, gilt n n |b2k+1 |2 8 1 2 P2n+1 [f ] = = 2 . 2 π k=1 (2k + 1)2 k=1 1 1 Für n = 7 folgt z.B. P7 [f] 2 = π82 1 + 19 + 25 + 49 ≈ 0, 949. Der (relative) mittlere quadratische Fehler der Approximation P7 [f] beträgt also f − P7 [f ] 2 / f 2 ≈ 5%. 6 Für x = π/2 etwa ergibt sich die Leibniz’sche Reihe 1 − 1/3 + 1/5 − 1/7 + . . . Sie konvergiert als alternierende Reihe von Gliedern, deren Beträge eine monotone Nullfolge bilden. (Leibnizkriterium) Ihr Grenzwert ist π/4. Siehe [3] Vol I, Kap IV.4.3. KAPITEL 2. FOURIERANALYSIS 151 1 0.5 0 -1.5 -1 -0.5 0 0.5 1 1.5 x/pi -0.5 -1 Abbildung 2.7: P1 [f] and P3 [f] 1 0.5 0 -1.5 -1 -0.5 0 0.5 1 1.5 x/pi -0.5 -1 Abbildung 2.8: P5 [f] and P7 [f] Welchen Grenzwert hat die Folge Pn [f ] −2 von [3] ∞ = π 2 /6. Daraus folgt wegen k=1 k ∞ k=1 dass 1 = k2 ∞ k=1 2 ∞ n ? Es gilt nach Kap. IV.3.6 in Vol.I 1 1 1 2 + 2 = 4 (2k) (2k + 1) k=0 ∞ k=0 1 3 2 = 4 (2k + 1) ∞ k=1 ∞ k=1 ∞ 1 1 + , 2 k (2k + 1)2 k=0 1 π2 = . k2 8 Also gilt limn→∞ Pn [f ] = 1 = f und daher limn→∞ f − Pn [f ] = 0. Die mittlere quadratische Abweichung zwischen Pn [f ] und f geht (wie es aufgrund der punktweisen Konvergenz sein muss) für n → ∞ gegen 0. 2.1.7 Fouriereihen allgemeiner Periode Ist F : R → C eine L-periodische, Riemann-integrierbare Funktion, dann ist x → f (x) = F ( Lx ) eine 2π-periodische Funktion in V , und ihre Fourierreihe ist die Funk2π KAPITEL 2. FOURIERANALYSIS 152 tionenfolge (sn )n∈N0 mit n ck eikx , sn (x) := ck := k=−n 2π 1 2π e−ikx f (x)dx. 0 Die Fourierreihe von F ist dann mit ω := 2π/L F (x) = f 2π x L ≃ ck ei 2πkx L ck eiωkx . = k∈Z k∈Z k∈ Das Frequenzspektrum der Fourierreihe von F ist die Menge der Zahlen ωk = 2π L 2π 2π Z, für die ck = 0. Die Zahl ω = L heißt „Grundfrequenz”. Achtung: Die Redeweise L verwischt den Unterschied zwischen Frequenz ν := 1/L und Kreisfrequenz ω = 2π/L. Übrigens: Durch Übergang zur Sinus/Cosinus-Zerlegung von sn gelangt man analog zu zwei nichtnegativen Frequenzspektren, Teilmengen von ωN0 . Eines für die Sinusund eines für die Cosinusanteile. Der Fourierkoeffizient ck drückt sich durch F folgendermaßen aus: ck = 1 2π 2π e−ikx f (x)dx = 0 1 2π 2π Lx 1 dx = 2π L e−ikx F 0 L e−i 2πky L F (y)dy. 0 Besitzt eine L-periodische Funktion F mit der Fourierreihe k∈Z ck exp(iωkx) auch die kleinere Periode L/n mit einem n ∈ N, dann hat F auch eine Fourierreihe zur Grundfrequenz ωn, also F (x) ≃ ck einωkx . k∈Z Wegen der linearen Unabhängigkeit der Funktionen ek erfordert dies, dass ck = 0, falls k ∈ / nZ. Das Frequenzspektrum von F kann also zu einer Teilmenge von ωnZ ⊂ωZ präzisiert werden. Ist F : [0, L] → C mit F (0) = 0 = F (L) Riemann-integrierbar, dann lässt sich F eindeutig zu einer ungeraden 2L-periodischen Funktion G : R → C fortsetzen. Ihre Fourierreihe ist G(x) ≃ ck eiωkx k∈Z L 1 mit ck := 2L exp(−iωkx)G(x)dx und ω := 2π/(2L) = π/L. Da G schief ist, folgt −L c−k = −ck und daher G(x) ≃ 2ick sin(ωkx). k∈N Für den Koeffizienten bk = 2ick dieser Sinusreihe gilt i L 2 = L L e−iωkx G(x)dx = bk = −L L 0 i L L (−i sin(ωkx)) G(x)dx −L 2 sin(ωkx)G(x)dx = L L sin 0 π kx F (x)dx. L KAPITEL 2. FOURIERANALYSIS 153 Damit hat die Funktion F : [0, L] → C die Fourierreihe7 π kx F (x) ≃ bk sin L k∈N L 2 mit bk = L π kx F (x)dx. L sin 0 Sei etwa die ungerade Funktion f ∈ V die Rechteckschwingung mit f(0) = f (π) = 0 und f (x) = 1 für 0 < x < π. Für B ∈ R, T ∈ R>0 sei F : R → R mit F (t) = Bf ( 2πt ). Dann hat F die Periode T und die (punktweise gültige) Fourierreihe T 4 F (t) = B π ∞ k=0 sin ((2k + 1) ωt) 2k + 1 mit ω := 2π/T > 0. Das (Kreis-)Frequenzspektrum von F ist die Menge ω (2N0 + 1) . Gilt zB T = 10−1 s, dann ist die Grundfrequenz ν = 1/T von 10 Hz unhörbar. Aber der Koeffizient der hörbaren Frequenz 90 Hz beträgt noch 1/9 des Koeffizienten der Grundfrequenz und kann somit zu Lärmbelästigung führen, wenn F die ruckartige Bewegung eines Maschinenteils modelliert. 2.1.8 *Lokalisierungsenergie im Potentialtopf Ist ein nichtrelativistisches Quantenteilchen in das Intervall [0, L] gesperrt, dann ist sein Grundzustand durch ϕ : [0, L] → C mit ϕ (x) = 2/L sin (πx/L) repräsentiert. Diese Funktion ϕ minimiert den Erwartungswert u, Hu / u, u des ’Energieoperators’ H = − ( 2 / (2m)) ∂x2 in {u ∈ C 2 ([0, L] : C) : u = 0 und u (0) = u (L) = 0} , wobei m die Masse des Teilchens ist. Es gilt Hϕ = εϕ mit ε = (π /L)2 / (2m) und somit wegen ϕ 2 = ϕ, ϕ = 1 auch ϕ, Hϕ = ε. Es wird nun der Energieerwartungswert von Wellenfunktionen ϕn berechnet, die das Teilchen im Zentrum des Intervalls mit steigendem n zunehmend schärfer lokalisieren. Die Ortswahrscheinlichkeitsdichten bilden eine δ-Folge. Es zeigt sich dabei, dass der Energieerwartungswert von ϕn in n streng monoton und unbeschränkt anwächst. (Durch Produktbildung ist dieses Beispiel auf mehr als nur eine Raumdimension zu übertragen.) Sei L ∈ R>0 und n ∈ N. Für ϕn : [0, L] → R gelte ϕn (x) = sinn (πx/L) für 0 ≤ x ≤ L. Diese Funktion steigt also zwischen 0 und L/2 streng monoton von 0 auf 1 und fällt zwischen L/2 und L streng monoton von 1 auf 0 ab. Je größer der Wert n ist, umso schmäler ist die Spitze des Graphen von sin2n . Gesucht sind die Zahl Cn ∈ R>0 Cn := ϕn 2 L = 0 |ϕn (x)|2 dx = L π π sin2n (s) ds 0 und der Energieerwartungswert der ’Wellenfunktion’ ϕn eines Schrödingerteilchens der Masse m > 0, dh die Zahl E n ∈ R mit L 2 Cn · E n = ϕn , Hϕn = − 7 2m 0 ϕn (x) ϕ′′n (x) dx. Von diesem Sachverhalt macht die Wellenmechanik eines Teilchens im Würfel Gebrauch. KAPITEL 2. FOURIERANALYSIS 154 Durch partielle Integration und anschließende Substition s = πx/L folgt L 2 Cn · E n = 2m 2 (ϕ′n (x)) dx = 0 π 2 π 2m L (∂s sinn s)2 ds 0 und somit 2 π En = 2m L 2 π 0 (∂s sinn s)2 ds =ε· π sin2n (s) ds 0 π 0 (∂s sinn s)2 ds . π sin2n (s) ds 0 Lemma 76 Für n ∈ N gilt π π 2n sin (x) dx = n 4 n 2n 0 π und (∂x sinn x)2 dx = 0 2nπ 2n − 2 . 4n n − 1 Beweis. Teil 1) Es gilt für x ∈ R (eix − e−ix ) sin (x) = (−4)n 2n 2n 2n n = (−1) 4 k=0 2n = (−1)n 4−n (−1)k k=0 −n 2n i(2n−k)x e (−1)k e−ikx k 2n i2(n−k)x e . k Die Funktion sin2n ist ein trigonometrisches Polynom vom Grad 2n. Es enthält allerdings nur Beiträge proportional zu e2k mit k ∈ {−n, −n + 1, . . . n} und hat somit der Periode π. Zum Integral über das Periodenintervall [0, π] trägt daher nur der konstante Summand proportional e0 bei, also jener mit k = n. Somit gilt π sin2n (x) dx = 4−n 0 2n π. n Teil 2) Für x ∈ R gilt ∂x (sinn x) = n cos (x) sinn−1 x. Damit folgt (∂x (sinn x))2 = n2 cos2 (x) sin2n−2 x = n2 1 − sin2 x sin2n−2 x = n2 sin2n−2 x − sin2n x und daher π 0 (∂x (sinn x))2 dx = n2 (Cn−1 − Cn ) n2 π 2n − 2 2n (2n − 1) 2n − 2 = n 4 − 4 n−1 n2 n−1 2 n π 2n − 2 2 2nπ 2n − 2 = n 4−4+ = n . 4 n−1 n 4 n−1 Mit Hilfe des Lemmas folgt nun, dass E n in n streng monoton - und mit asymptotischer Schrittweite limn→∞ E n+1 − E n = ε/2 - wächst: KAPITEL 2. FOURIERANALYSIS 155 Satz 77 Es gilt Cn = 4−n L (2n)!/n!2 und E n = ε · n 2−1/n =ε· 1+ (n−1)2 2n−1 . Beweis. Die zwei Hilfsformeln des Lemmas ergeben L 2n Cn = n 4 n und E n = ε · 2n 2n−2 n−1 2n n . Nun gilt 2n n und daher 2n n = Damit ergibt sich E n = ε · 2n = (2n)! n!n! 2n (2n − 1) 2n − 2 . n2 n−1 n2 n2 n = ε· =ε· . 2n (2n − 1) 2n − 1 2 − 1/n Es soll nun die Funktion ϕn : [0, L] → R mit ϕn (x) = sinn (πx/L) nach den Energieeigenfunktionen ψ k : [0, L] → R mit ψ k (x) = 2/L sin (kπx/L) für k ∈ N des Teilchens im Intervall [0, L] entwickelt werden. Es gilt 2 − 2m ∂x2 ψ k = Ek ψ k mit Ek = εk 2 . Das Funktionensystem {ψ k : k ∈ N} erfüllt ψm, ψn = 2 L L sin mπ 0 = 1 π x x 2 sin nπ dx = L L π π sin (ms) sin (ns) ds 0 2π sin (ms) sin (ns) ds = δm,n. 0 Sei Φn : R → R ungerade und 2L-periodisch. Auf [0, L] stimme Φn mit ϕn überein. Ganz analog sei Ψn die ungerade 2L-periodische Fortsetzung von ψ n nach R. Es gilt also Ψn (x) = 2/L sin (kπx/L) für alle x ∈ R. Für ungerades n gilt Φn (x) = sinn (πx/L) für alle x ∈ R. Dann liegt Φn in Vn , ist ungerade und besitzt somit eine Zerlegung nach den Funktionen {Ψk }nk=1 . Es gilt für x ∈ R und n ∈ N (Übung) sin 2n−1 4 (x) = n 4 n (−1)k−1 k=1 2n − 1 sin ((2k − 1) x) n−k KAPITEL 2. FOURIERANALYSIS und daher ϕ2n−1 = / L 4 2 4n 156 n (−1)k−1 k=1 Für gerades n gilt hingegen Φn (x) = 2n − 1 ψ 2k−1 . n−k sinn (πx/L) für 0 ≤ x ≤ π . − sinn (πx/L) für − π ≤ x ≤ 0 Die ungerade Funktion Φ2n ist für jedes n ∈ N zwar mindestens einmal aber nicht beliebig oft stetig differenzierbar. Sie besitzt daher lediglich eine gleichmäßig konvergente Fourierreiheentwicklung in Form einer Sinusreihe. Es gilt also für x ∈ [0, L] ϕ2n (x) = ∞ k=1 2.1.9 2 L L sin2n π 0 s x s sin kπ ds sin kπ = L L L ∞ ϕ2n , ψ k ψ k (x) . k=1 Periodisch getriebener Oszillator: Fourierreihenlösung Welche Lösungen besitzt die Bewegungsgleichung eines (ungedämpften) harmonischen Oszillators, auf den eine (hinreichend glatte) periodische Kraft einwirkt? Die Bewegungsgleichung ist ẍ + ω 20 x = f auf R. (2.4) Für f (t) = cos ωt und ω = ω 0 ist x : R → R mit x (t) = cos (ωt) / (ω 20 − ω 2 ) eine Lösung von Gleichung (2.4). Für f (t) = sin ωt und ω = ω 0 ist x : R → R mit x (t) = sin (ωt) / (ω 20 − ω 2 ) eine Lösung. Hat daher eine T -periodische Inhomogenität f die punktweise (gleichmäßig und absolut)) konvergente Fourierreihenentwicklung ∞ a0 f (t) = + (ak cos (kωt) + bk sin (kωt)) 2 k=1 mit ω = 2π/T, dann ist die Funktion xF : R → R mit ∞ a0 ak cos (kωt) + bk sin (kωt) xF (t) = + 2 2ω 0 k=1 ω 20 − k 2 ω 2 eine maximale Lösung von Gleichung (2.4), falls k 2 ω 2 = ω 20 für alle k ∈ N. Sie ist T -periodisch. Alle weiteren maximalen Lösungen gehen aus xF durch Addieren einer Lösung der homogenen Schwingungsgleichung hervor. Als Beispiel für eine Funktion f kann die Rechtecksfunktion des vorigen Abschnittes herangezogen werden, wenn sie zur Glättung durch ihr Fourierpolynom 4 fn (t) = B π n k=0 sin ((2k + 1) ωt) 2k + 1 ersetzt wird. fn ist 2π/ω-periodisch. Falls ω (2k + 1) = ω 0 für alle k ∈ N0 gilt, hat Gleichung (2.4) die 2π/ω-periodische Lösung x : R → C mit 4 x (t) = B π n k=0 1 sin ((2k + 1) ωt) . 2k + 1 ω 20 − (2k + 1)2 ω 2 KAPITEL 2. FOURIERANALYSIS 157 Die Bedingung ω (2k + 1) = ω 0 für alle k ∈ N0 stellt sicher, dass die Eigenfrequenz ω 0 des Oszillators im Fourierspektrum der Inhomogenität f nicht vorkommt, und daher kein Resonanzfall vorliegt. Figur (2.9) zeigt für den Fall B/ω 20 = 1, ω = ω 0 /2 und n = 3 die Schwingung x und ihre Teilschwingungen xk , für die x = nk=0 xk gilt, als Funktion von τ = ω 0 t/2π im Bereich 0 < τ < 2. Die höherfrequenten Teilschwingungen modifizieren das Bild 2 1 0 0 0.5 1 1.5 2 -1 -2 Abbildung 2.9: x in purpur und xk für k = 1, 2, 3 in schwarz, rot, grün. für größere n kaum, da die Amplituden der Teilschwingungen rasch abnehmen. Ein weiteres etwas interessanteres Beispiel für f gibt die stetige 2π-periodische Funktion b mit b (t) = |t| für −π < t ≤ π ab. Wir bestimmen nun die (einzige!) 2π-periodische Lösung xF von Gleichung (2.4), wenn ω 0 keine natürliche Zahl ist. Dazu benützen wir zunächst die Fourierreihe von b, also π 4 b (t) = − 2 π ∞ k=0 cos ((2k + 1) t) . (2k + 1)2 Daraus folgt mit der Fourierreihenlösungsformel unmittelbar π 4 xF (t) = + 2 2ω 0 π ∞ k=0 cos ((2k + 1) t) . (2k + 1)2 (2k + 1)2 − ω 20 An der Lösung xF ist abzulesen, dass x′F (0) = 0 = x′F (π) . Abbildung 2.10 zeigt b und xF für zwei Werte von ω 0 . Ein Phasenschub um π zwischen b und xF ist im Fall ω 0 < 1 klar zu sehen, während für ω 0 > 1 die Anregung b mit der Reaktion xF im Gleichklang steht. Eine direkte Berechnung der 2π-periodischen Lösung von x′′ + ω 20 x = b zur 2πperiodischen Funktion b, für die b (t) = |t| im Bereich −π < t ≤ π gilt, ist die folgende. Berechne im Bereich 0 ≤ t ≤ π eine Lösung von x′′ (t) + ω 20 x (t) = t mit den Eigenschaften x′ (0) = 0 = x′ (π) . Wenn(!) eine solche Lösung existiert, dann kann diese auf genau eine Weise zu einer geraden 2π-periodischen Funktion fortgesetzt werden. KAPITEL 2. FOURIERANALYSIS 158 x 5 3.75 2.5 1.25 0 -1 0 1 2 3 t/pi Abbildung 2.10: b (grau) und xF für ω 20 = 2 (grün) und ω 20 = 1/2 (rot) Zu jeder Lösung im Bereich 0 ≤ t ≤ π existieren Zahlen A, B ∈ R, sodass für alle t ∈ [0, π] t x (t) = 2 + A cos (ω 0 t) + B sin (ω 0 t) . ω0 Die Vorgabe x′ (0) = 0 ist genau dann erfüllt, wenn Bω 0 = −ω −2 0 . Damit gilt x (t) = t− sin(ω0 t) ω0 2 ω0 + A cos (ω 0 t) . Die Vorgabe x′ (π) = 0 ist genau dann erfüllt, wenn 0= 1 − cos (ω 0 π) − Aω 0 sin (ω 0 π) , ω 20 wenn also A sin (ω 0 π) = (1 − cos (ω 0 π)) /ω 30 . Da ω 0 ∈ / N vorausgesetzt ist, folgt A= also x (t) = t− sin(ω0 t) ω0 2 ω0 + 1 − cos (ω 0 π) , ω 30 sin (ω 0 π) 1 − cos (ω 0 π) cos (ω 0 t) für alle t ∈ [0, π] . ω 30 sin (ω 0 π) Die gerade Fortsetzung auf das Intervall [−π, π] dieser Lösung erfüllt somit x (t) = ω 0 |t| − sin (ω 0 |t|) 1 − cos (ω 0 π) + 3 cos (ω 0 t) für alle t ∈ [−π, π] . ω 30 ω 0 sin (ω 0 π) Da es für ω 0 ∈ / N genau eine 2π-periodische Lösung von Gl (2.10) gibt, muss die 2π-periodische Fortsetzung von x mit xF übereinstimmen. Daher gilt für t ∈ [−π, π] 4 π + 2 2ω 0 π ∞ k=0 cos ((2k + 1) t) ω 0 |t| − sin (ω 0 |t|) 1 − cos (ω 0 π) 1 = + 3 cos (ω 0 t) . 2· 2 2 ω 30 ω 0 sin (ω 0 π) (2k + 1) (2k + 1) − ω 0 KAPITEL 2. FOURIERANALYSIS 2.1.10 159 *Der mechanische Fourieranalysator 2 Sei b : R → R (stückweise) stetig mit b (t) = 0 für alle t ∈ / [0, T ] . Sei für ω ≥ 0 die Funktion xω : R → R zwei mal (stückweise) stetig differenzierbar. In allen Stetigkeitspunkten von b gelte x′′ω + ω 2 xω = b. Weiter gelte die Anfangsvorgabe xω (0) = x′ω (0) = 0. Dann folgt für alle t > T und ω > 0 e−iωt xω (t) = ℜ i ω T eiωξ b (ξ) dξ . 0 Am Intervall [0, T ] hat b die Fourierreihe b (t) ≃ 2π ck [b] ei T kt mit ck [b] = k∈Z 1 T T 0 2π e−i T kt b (t) dt = c−k [b]. (2.5) Außerhalb von [0, T ] gibt Gleichung (2.5) die Fourierreihe jener T -periodischen Funktion, die auf [0, T ] mit b übereinstimmt und natürlich keinesfalls der Funktion b, die ja gar nicht periodisch ist. Daher gilt für einen Oszillator mit der an die Beobachtungsdauer T angepassten Eigenfrequenz ω = ω k := 2π k mit k ∈ N für alle t > T T . 7 . 7 2π 2π e−i T kt T i 2π kξ e−i T kt xωk (t) = ℜ i 2π e T b (ξ) dξ = ℜ i 2π T c−k [b] k k 0 T T 0 1 2π T2 = ℜ ie−i T kt ck [b] . 2πk Für die Amplitude8 Ak von xωk im Bereich t > T gilt Ak = Sei etwa speziell T = 2π und 1 für 0 < t < π −1 für π < t < 2π . b (t) = 0 sonst Dann gilt ck [b] = 0 für k ∈ 2Z und ck [b] = t > 2π mit der Abkürzung xk = xωk xk (t) = −2i πk T2 2πk |ck [b]| . für k ∈ 2Z + 1. Daraus folgt für alle 0 für k ∈ 2N . − k42 cos (kt) für k ∈ 2N0 + 1 So schwingt also der Oszillator mit der Eigenfrequenz k nach der Einwirkung von b. Unter http://physik.uibk.ac.at/muw/physlets/fourier/Rechteck.html findet sich eine mechanische Simulation eines Fourieranalysators, die Emmerich Kneringer mit einem Baukasten für „virtuelle Experimente“ programmiert hat. Dort wird die Inhomogenität der Schwingungsgleichung eines der Resonatoren indirekt dadurch festgelegt, dass für seine Gleichgewichtslage eine zeitabhängige Funktion vorgegeben wird. 8 Durch Messung von Ak lässt sich somit der Betrag des Fourierkoeffizienten ck [b] ermitteln. Der Koeffizient c0 [b] ergibt sich analog aus dem (konstanten) Wert von x′0 (t) im Bereich t > T. KAPITEL 2. FOURIERANALYSIS 160 Dies geschieht im Detail so: Der Oszillator wird durch einen Körper der Masse m, der auf einer reibungsfreien Schiene gleitet und durch eine Feder an einen festen Punkt gebunden ist, realisiert. Hat die Feder die Federkonstante k > 0, dann erfüllt die Auslenkung des Körpers aus seiner Gleichgewichtslage die Bewegungsgleichung mx′′ (t) = −kx (t) . Hat das kontrolliert geregelte Ende der Feder zur Zeit t den Ort ξ (t) , dann gilt die Bewegungsgleichung mx′′ (t) = −k [x (t) − ξ (t)] . Es gilt daher mit ω 2 = k/m x′′ + ω 2 x = ω 2 ξ. Hängt also der Oszillator mit der Eigenfrequenz ω an einem manipulierten Nullpunkt mit der Auslenkung ξ (t) zur Zeit t, dann gilt b = ω 2 ξ. Es sei ξ (t) = 0 für alle t∈ / [0, T ] . Der Oszillator schwingt daher zur Zeit t > T mit der Amplitude A= Speziell für ω = ω k := Ak = 2π k T T 2ω2 |c−k [ξ]| . 2πk mit k ∈ Z ergibt sich für die Amplitude Ak von xk , T2 T 2 ,, |c−k [b]| = c−k ω 2k ξ , = 2πk |c−k [ξ]| . 2πk 2πk Für die Nullpunktsverschiebung mit L > 0 folgt daher L für 0 < t < π −L für π < t < 2π ξ (t) = 0 sonst , , Ak = 2πk |c−k [ξ]| = 2πkL ,, 0 2i πk , , für k ∈ 2Z ,= für k ∈ 2Z + 1 , 0 für k ∈ 2Z . 4L für k ∈ 2Z + 1 Jeder Resonator, dessen Eigenfrequenz ein ungerades Vielfaches der Grundfrequenz 2π/T ist, schwingt also mit derselben Amplitude 4L nach. 2.1.11 Allgemeine Eigenschaften der Fourierkoeffizienten Aus bereits berechneten Fourierkoeffizientenen können gelegentlich weitere mit folgenden Formeln ohne großen Aufwand bezogen werden. Auch zum Aufspüren von Rechenfehlern eignen sich diese Faulenzerregeln gut. Lemma 78 Sei ck (f ) := ek , f der k-te Fourierkoeffizient von f. Seien f, g ∈ V und λ ∈ C. Dann gilt: 1. ck (f + g) = ck (f ) + ck (g), ck (λf ) = λck (f ). 2. f (R) ⊂ R ⇒ c−k (f ) = ck (f) ⇒ ak (f ) = 2ℜck (f), bk (f ) = −2ℑck (f ) für k ≥ 0. Sinus/Cosinusreihe hat reelle Koeffizienten. KAPITEL 2. FOURIERANALYSIS 161 3. ck (Tξ f) = exp(−ikξ)ck (f ) mit Tξ f (x) = f (x − ξ) (Translation um ξ ∈ R). 4. f gerade ⇒ c−k (f) = ck (f ) für alle k ∈ Z ⇒ f(x) ≃ c0 + ∞ k=1 2ck cos(kx). 5. f ungerade ⇒ c−k (f) = −ck (f) für alle k ∈ Z ⇒ f (x) ≃ ∞ k=1 2ick sin(kx). 6. f ∈ C 1 ⇒ ck (f ′ ) = ikck (f ) für alle k ∈ Z ⇒ ak (f ′ ) = kbk (f) , bk (f ′ ) = −kak (f ′ ) für k ∈ N und a0 (f ′ ) = 0. Beweis. Einfach nachrechnen. Probieren wir diese Regeln am Beispiel der Rechteckschwingung f aus. Die Fourierkoeffizienten 0 für k ∈ 2Z ck = 2/(iπk) für k ∈ 2Z + 1 erfüllen die aus der Realität von f folgende Bedingung c−k = ck offenbar. Weiter ist f ungerade. Tatsächlich ist auch die Spektralfunktion k → ck ungerade. Vielleicht können wir auch noch das Faktum c2k = 0 als Folge einer Symmetrie verstehen? Das geht so: Das Rechtstranslat Tπ/2 f der Funktion f um den Betrag π/2 ist eine gerade Funktion. Daher muss die Spektralfunktion von Tπ/2 f ebenfalls gerade sein. Nach der 3. Faulenzerregel ist diese Spektralfunktion durch k → exp (−ikπ/2) ck gegeben. Also folgt exp (ikπ/2) c−k = exp (−ikπ/2) ck . Dies ist äquivalent zu c−k = exp (−ikπ) ck = (−1)k ck . Für k ∈ 2Z folgt somit −ck = c−k = ck und daher ck = 0. Die folgende Abschätzung für die Fourierkoeffizienten ck einer Funktion f kann einerseits zum Nachweis der punktweisen absoluten Konvergenz von Fourierreihen benutzt werden, kann aber dann auch die Abschätzung des Fehlers bei Approximation von f(x) durch das n-te Fourierpolynom Pn [f ] ermöglichen, wenn die punktweise Konvergenz limn→∞ Pn [f ] (x) = f (x) sichergestellt ist. Satz 79 Sei f ∈ V stetig und n ∈ N. Die Funktion f sei n − 1 mal stetig differenzierbar und die Funktion f (n−1) sei stückweise stetig differenzierbar. Das heißt, dass Punkte 0 =: x0 ≤ x1 < . . . < xM−1 ≤ xM := 2π existieren, sodass die Einschränkung von f (n−1) auf das Intervall (xi , xi+1 ) für alle i ∈ {0, 1, . . . M − 1} differenzierbar ist, und dass die einseitigen Limiten limε↓0 f (n) (xi ±ε) für ,alle i ∈ ,{1, . . . M − 1} existieM−1 xi+1 , (n) 1 ren. Dann gilt |ck | ≤ C/ |k|n mit C := 2π f (x), dx für alle k ∈ Z 0. i=0 xi KAPITEL 2. FOURIERANALYSIS 162 Beweis. Mit partieller Integration folgt 2π 2πck = 0 i = k f (x) · e−ikx |2π 0 − = − = = = i k f(x) · e−ikx dx = f(x) · 0 2π 0 d −ikx dx e dx f (1) (x) · e−ikx dx 2π i k f (1) (x) · e−ikx dx = . . . = 0 i k n−1 − i k n i k n − − 2π 2π 0 M−1 · · f (n−1) (x) · xi+1 xi i=0 M−1 xi+1 xi i=0 − i k n−1 2π 0 f (n−1) (x) · e−ikx dx i d −ikx e dx k dx f (n) (x) · e−ikx dx − f (n−1) (x) · e−ikx |xxi+1 i f (n) (x) · e−ikx dx . Also gilt 1 ck = 2π i − k M−1 n · i=0 xi+1 xi f (n) (x) · e−ikx dx . (Für die n-te partielle Integration wurde hier das Intervall [0, 2π] in die von den Ausnahmepunkten x1 , . . . xM−1 vorgegebenen Teilintervalle zerlegt. Die Funktion f (n−1) ist in allen Punkten von [0, 2π] außer den Punkten x1 , . . . xM−1 differenzierbar. Es wird weiter x0 = 0 und xM = 2π gesetzt. Der Beitrag der Randterme von den Integralen über die einzelnen Teilintervalle verschwindet im allgemeinen nicht; ihre Summe jedoch schon.) Unter Verwendung der Dreiecksungleichung folgt schließlich die Behauptung. 2.1.12 Konvergenz der Fourierreihe Es soll nun beschrieben werden, in welchem Sinn die Fourierreihe einer Funktion f ∈ V die Funktion f selbst eindeutig festlegt. Unterscheiden sich im Intervall [0, 2π] zwei Funktionen f, g ∈ V nur in endlich vielen Punkten, dann sind die Fourierkoeffizienten von f und g gleich. Die Funktionen f und g haben dann natürlich auch die selbe Fourierreihe ohne selbst gleich zu sein. Nun könnte man vermuten, dass wenigstens stetige Funktionen f ∈ V durch ihre Fourierkoeffizienten eindeutig festgelegt sind. Das ist tatsächlich so, wenngleich auch die Fouriereihe einer stetigen Funktion f ∈ V nicht notwendig an jeder Stelle x gegen f (x) konvergiert. (Gegenbeispiel von Du Bois-Reymond, Sätze von Carleson, Kahane und Katznelson, siehe Kapitel 18, 19 in [13]) Im Allgemeinen konvergiert die Fourierreihe von f ∈ V nur im quadratischen Mittel gegen f. Eine Rekonstruktion von f aus seiner Fourierreihe ist dann „fast überall” möglich. „Fast überall” bedeutet: überall bis auf eine Ausnahmemenge vom „Volumen” 0. Z.B. hat eine abzählbare Teilmenge von R das Volumen 0. KAPITEL 2. FOURIERANALYSIS 163 Satz 80 Sei f ∈ V und Pn f = nk=−n ck ek mit ck = ek , f . Sei9 ak = ck + c−k für k ∈ N0 und bk = i (ck − c−k ) für k ∈ N. Dann gilt 1. f 2 2. Pn f 2 = Pn f 2 + f − Pn f n k=−n = |ck |2 = 1 2 2 2 ≥ Pn f |a0 |2 2 und n k=1 + |ak |2 + |bk |2 . Beweis. Wegen Pn f, f − Pn f = 0 folgt die erste Behauptung aus f 2 = f − Pn f + Pn f 2 = Pn f 2 + f − Pn f 2 + 2ℜ Pn f, f − Pn f . Die zweite Behauptung folgt aus der Tatsache, dass (ek )nk=−n eine ONB von Vn ist: n Pn f 2 = Pn f, Pn f = n ci ck ei , ek = i,j=−n k=−n |ck |2 . Mit |a0 |2 = 4 |c0 |2 und |ak |2 + |bk |2 = |ck + c−k |2 + |ck − c−k |2 = 2 |ck |2 + |c−k |2 folgt die letzte Gleichheit von Teil 2). Korollar 81 Sei f ∈ V. Dann konvergiert nk=−n |ck |2 und es gilt die Bessel’sche Ungleichung f 2 ≥ limn→∞ nk=−n |ck |2 . Weiter gilt limn→∞ Pn f − f = 0 genau dann, wenn f 2 = limn→∞ nk=−n |ck |2 . (Parseval’sche Gleichung oder Vollständigkeitsrelation.) n 2 Beweis. Die Konvergenz der monoton wachsenden Folge folgt k=−n |ck | 2 2 2 2 aus ihrer oberen Schranke f . Wegen f = Pn f + f − Pn f gilt f 2 = lim Pn f 2 genau dann, wenn lim f − Pn f 2 = 0. Da für f ∈ V die Reihe k∈N |ak |2 + |bk |2 konvergiert, gilt limn→∞ ak = 0 = limn→∞ bk . Daraus folgt das Lemma 82 (Riemann) Für f ∈ V gilt 2π lim k→∞ 2π f (x) sin(kx)dx = lim 0 k→∞ f (x) cos(kx)dx = 0. 0 Redeweise: Eine Funktionenfolge (fn )n∈N in V mit limn→∞ fn − f = 0 konvergiert gegen f ∈ V im quadratischen Mittel. Der Nachweis der Parselval’schen Gleichung ist für manche Funktionen f, wie z.B. die Rechteckschwingung, möglich. Damit ist dann in diesen Fällen die Konvergenz der Fourierreihe von f im quadratischen Mittel gegen f sichergestellt. Allgemeinere Auskunft gibt der folgende Satz. (Siehe [5], p. 196) Satz 83 Für alle f ∈ V gilt: limn→∞ Pn f − f = 0. 9 ak und bk sind also die Koeffizienten der Sinus-Cosinus Darstellung von Pn f. KAPITEL 2. FOURIERANALYSIS 164 Die Fourierreihe jeder Funktion f in V konvergiert also im quadratischen Mittel gegen f. Für beschränkte Funktionen mit höchstens endlich vielen Unstetigkeitsstellen in [0, 2π] ist der Beweis auf p. 287 von [10] geführt. Es folgen 3 Sätze über die Konvergenz von Fourierreihen unter etwas stärkeren Voraussetzungen als nur f ∈ V . Alles ohne Beweise. Satz 84 Sei f : R → C eine stetige 2π-periodische Funktion. (Also gilt f ∈ V ). Weiter sei f so, dass Zahlen 0 = x0 < x1 < . . . < xn = 2π existieren, sodass die Einschränkungen von f auf die Intervalle [xi−1 , xi ] für alle i = 1, . . . , n stetig diffbar sind 10 . Dann konvergiert die Fourierreihe von f punktweise gleichmäßig gegen f . Beweis. Siehe p. 199 von [5]. Fouriereihe von f : R → C mit f (x) = |sin(x)| . Da f reell und gerade ist, gilt c−k = ck ∈ R. Für den Fourierkoeffizienten ck von f als 2π-periodische Funktion ergibt sich, da f gerade ist, π 2π e−ikx |sin x| dx = 2πck = 0 π −π [cos (kx) − i sin (kx)] |sin x| dx π cos (kx) sin (x) dx = 2 = 2 0 Für k = 1 folgt daraus 2πc1 = 2 0 [sin ((k + 1) x) − sin ((k − 1) x)] dx. π 0 sin (2x) dx = 0. Für k = ±1 folgt 2πck = ,π ,π π cos ((k + 1) x) ,, cos ((k − 1) x) ,, [sin ((k + 1) x) − sin ((k − 1) x)] dx = − 2 , + , k+1 k−1 0 0 0 = 1 − cos ((k + 1) π) cos ((k − 1) π) − 1 1 − (−1)k+1 (−1)k−1 − 1 + = + k+1 k−1 k+1 k−1 * + k 1 1 1 + (−1) = 1 + (−1)k − = −2 2 . k+1 k−1 k −1 Somit gilt für alle k ∈ Z, dass11 c2k+1 = 0 und c2k = − π2 4k21−1 . Daher hat f = |sin| die gleichmäßig konvergente Fourierreihe 2 3 ∞ ∞ 2 cos (2kx) |sin (x)| = c2k ei2kx = c0 + c2k e2ikx + e−2ikx = 1−2 . 2−1 π 4k k∈Z k=1 k=1 Abbildung 2.11 zeigt die Fourierpolynome P4 und P6 von |sin x| . (Gleichgerichtete Wechselspannung) 10 Man sagt f ist stückweise stetig diffbar. Das Verschwinden der Fourierkoeffizienten mit ungeradem Index ist eine Folge der πPeriodizität von f. Das sieht man so. Da f und die um π nach rechts verschobene Funktion f miteinander übereinstimmen gilt ck = eikπ ck = (−1)k ck . Für ungerades k gilt daher ck = −ck , also ck = 0. 11 KAPITEL 2. FOURIERANALYSIS 165 1 0.75 0.5 0.25 0 -1 -0.5 0 0.5 1 x/pi Abbildung 2.11: Die Fourierpolynome 4. (grün) und 6. Grades (rot) von |sin x| Satz 85 Sei f : R → C eine beschränkte 2π-periodische Funktion mit höchstens endlich vielen Unstetigkeitsstellen im Intervall [0, 2π] (also gilt f ∈ V ). Es sei x ∈ R eine Stelle, für die ein C > 0 existiert, sodass für alle h ∈ R |f(x + h) − f (x)| ≤ C |h| gilt. 12 Dann konvergiert die Fourierreihe von f an der Stelle x gegen f (x). Der Beweis ist auf p. 284 von [10] gegeben. Beispiel: In den Stetigkeitsstellen der Rechteckschwingung f konvergiert ihre Fourierreihe punktweise gegen f . Satz 86 Sei f : R → C eine beschränkte 2π-periodische Funktion mit höchstens endlich vielen Unstetigkeitsstellen im Intervall [0, 2π] (also gilt f ∈ V ). Es sei x ∈ R eine Stelle, für die f± (x) = limh↓0 f (x ± h) existieren und für die überdies ein C > 0 existiert, sodass für alle h ∈ R>0 |f (x ± h) − f± (x)| ≤ C · h. Dann gilt lim (Pn f ) (x) = n→∞ f+ (x) + f− (x) . 2 Der Beweis ist auf p. 286 von [10] gegeben. Beispiel: In den Unstetigkeitsstellen der Rechteckschwingung f konvergiert ihre Fourierreihe punktweise gegen 0. Abschließend noch ein Satz des 19-jährigen Fejér, der zeigt, dass die Werte einer Funktion f ∈ V in ihren Stetigkeitspunkten durch die Fourierkoeffizienten ck von f festgelegt sind. Fejérs Formel greift auch in Punkten, in denen die Fourierreihe nicht konvergiert. Der Beweis ist in [13] ausgeführt. 12 f ist bei x Lipschitzbeschränkt; f ist in x stetig. KAPITEL 2. FOURIERANALYSIS 166 Satz 87 (a) Sei f ∈ V stetig in x. Dann gilt n lim n→∞ k=−n * + |k| 1− ck exp (ikx) = f (x). n+1 (b) Sei f ∈ V überall stetig. Dann konvergiert die Funktionenfolge n σ n : R → C, x → k=−n * + |k| 1− ck exp (ikx) n+1 gleichmäßig gegen f. 2.1.13 Fourierreihen einiger Standardfunktionen Die folgenden Funktionen f : R → C sind alle 2π-periodisch und über eine Periode riemannintegrierbar. Ihre Fouriereihen konvergieren nach den im vorigen Abschnitt angeführten Sätzen überall punktweise gegen die Funktion. Es gilt 1. Kippschwingung f (x) = x für 0 < x < 2π und f (0) = π F-Reihe: f (x) = π − 2 ∞ sin(kx) k=1 k 2. Rechteckschwingung f ∈ V ungerade mit f(0) = f (π) = 0 und f (x) = 1 für 0 < x < π. F-Reihe: f (x) = ∞ 1 k=0 2k+1 4 π sin ((2k + 1) x) . 3. Sägezahn: f (x) = |x| für −π < x ≤ π. F-Reihe: f (x) = π 2 − 4 π ∞ cos[(2k+1)x] k=0 (2k+1)2 4. Gleichgerichteter Wechselstrom , , f (x) = ,sin( x2 ), F-Reihe: f (x) = 2 π 1− ∞ 2 cos(kx) k=0 (2k)2 −1 KAPITEL 2. FOURIERANALYSIS 2.2 167 Fouriertransformation auf L1 (R) Jede Funktion f ∈ C 1 ([a, b] : C) mit f (a) = f (b) ist also durch die Fourierreihe ihrer (b − a)-periodischen Fortsetzung punktweise korrekt wiedergegeben. Für eine riemannintegrierbare Funktion f : [a, b] → C gibt die Fourierreihe zumindest eine Darstellung im quadratischen Mittel. Lässt sich die Darstellung von Funktionen durch ihre Fourierreihen auf nichtperiodische Funktionen mit Definitionsbereich R ausweiten? Es gelingt für eine große Menge an Funktionen, wenn die Summen durch Integrale ersetzt werden. 2.2.1 Von der Fourierreihe zum Fourierintegral Für welche nichtperiodischen Funktionen f : R → C existiert eine stetige Funktion c : R → C mit ∞ −∞ |c (ω)| dω < ∞ und f (t) = ∞ c (ω) exp (iωt) dω −∞ für alle t ∈ R? Eine heuristische Überlegung, welche Funktionen f eine solche Darstellung als sogenanntes Fourierintegral haben, ist die folgende. Gegeben sei eine beschränkte Riemann-integrable Funktion fl : [0, l] → C. Ihr zugeordnet ist für L > l die L-periodische Funktion fL : R → C mit fL (t) = fl (t) für 0 ≤ t ≤ l und fL (t) = 0 für l < t < L. Für die Funktion f : R → C gelte f (t) = fl (t) für 0 ≤ t ≤ l und f (t) = 0 sonst. Für die Fourierkoeffizienten ck (fL ) von fL gilt mit k ∈ Z 1 L 2π 1 exp −i kt fL (t)dt = L 0 L L √ 2π 2π = (F f) k , L L ck (fL ) = ∞ −∞ exp −i 2π kt f (t)dt L wobei ∞ 1 (F f ) (ω) := √ exp (−iωt) f (t)dt. 2π −∞ Die Funktion Ff heißt die Fouriertransformierte von f . Die ck (fL ) ergeben sich Z. Das Raster der somit aus den Werten der L-unabhängigen Funktion Ff auf 2π L 2π Punkte L Z wird mit wachsendem L feiner und die Fourierkoeffizienten ck (fL ) gehen für L → ∞ wie 1/L gegen 0. Die Funktion fL hat also die Fourierreihe 1 2π fL (t) ≃ √ (F f) (ω) exp (iωt) . 2π 2π L Ff : R → C, ω∈ L Z Die Summe ist eine Riemannsummenapproximation der Schrittweite 2π/L des Inte∞ grals −∞ (Ff ) (ω) exp (iωt) dω. Daher vermutet man im Limes L → ∞ die folgende Fourierintegraldarstellung von f ∞ 1 (F f) (ω) exp (iωt) dω. f(t) ≃ √ 2π −∞ KAPITEL 2. FOURIERANALYSIS 2.2.2 168 Der Hauptsatz der Fouriertransformation Definition 88 Der Vektorraum R der absolut riemannintegrierbaren Funktionen ist die Menge aller Funktionen f : R → C mit: f ist auf jedem endlichen Intervall stückweise stetig13 und |f | ist auf R (uneigentlich) riemannintegrierbar. Für f ∈ R und k ∈ R ist die auf R definierte Abbildung x → f(x) exp(−ikx) ∞ auch in R. Daher existiert für jedes k ∈ R das Integral −∞ f(x) exp(−ikx)dx. Definition 89 Für f ∈ R ist die Fouriertransformierte von f die Funktion 1 F f : R → C mit (Ff ) (k) = √ 2π ∞ f (x) exp(−ikx)dx. −∞ Beispiel 90 Sei f : R → C mit f (x) = exp (−λ |x|) für ein λ > 0. Dann folgt √ 2π (F f) (k) = ∞ ∞ 0 e−ikx−λ|x| dx = e−ikx+λx dx + e−ikx−λx dx −∞ −∞ 0 ,0 ,∞ , exp(−ikx + λx) , exp(−ikx − λx) ,, = + , , −ik + λ −ik − λ −∞ 0 1 1 λ + ik λ − ik 2λ + = 2 = . 2 + 2 2 = 2 −ik + λ ik + λ k +λ k +λ k + λ2 Also gilt für die Fouriertransformierte von f (x) = e−λ|x| / 2 λ (F f) (k) = . π k 2 + λ2 Mit wachsendem λ wird die Funktion f „schmäler” und F f „breiter”. f 1 0.75 0.5 0.25 -5 -2.5 0 2.5 5 Abbildung 2.12: Graphen von f für λ = 1 (rot) und λ = 1/2 13 D.h., es existieren höchstens endlich viele Unstetigkeitsstellen und in diesen die rechts- und linksseitigen Limiten. KAPITEL 2. FOURIERANALYSIS 169 Ff 1.5 1.25 1 0.75 0.5 0.25 -5 -2.5 0 2.5 5 k Abbildung 2.13: Graphen von F f für λ = 1 (rot) und λ = 1/2 Welche Funktion ist die Fouriertransformierte von Ff aus Beispiel 90? Mit den Methoden der Funktionentheorie lässt sich diese berechnen. Siehe etwa Lemma 50.2 in [13]. Es ergibt sich tatsächlich, wie aufgrund der heuristischen Einleitung zu erwarten ist, dass (FF f) (x) = f (−x) . Der folgende Satz steckt allgemeinere Umstände ab, unter denen die Fourierumkehrformel gilt. Diese Formel ist sehr nützlich, denn sie macht so manche schwierige Integration überflüssig. Satz 91 (Fouriertransformation) Seien f, g ∈ R und sei (f ∗ g) (x) := ∞ −∞ f (x − y)g(y)dy die Faltung 14 von f mit g. Dann folgt: 1) Ff ist eine stetige und beschränkte Funktion mit der Schranke 1 |(Ff ) (k)| ≤ √ 2π ∞ −∞ |f(x)| dx. √ 2) Falls f ∗ g ∈ R, dann gilt F (f ∗ g) = 2π (Ff ) · (Fg) (Faltungssatz). 3) Ist f stetig differenzierbar und Null außerhalb eines endlichen Intervalls, dann gilt für alle k ∈ R (F (f ′ )) (k) = ik (Ff ) (k). 4) Ist id · f : x → xf (x) in R, dann ist Ff stetig differenzierbar und es gilt F (id · f ) = i (F f)′ . 5) Es gilt (F f ) · g ∈ R, f · F g ∈ R und (Parseval) ∞ −∞ 14 (Ff ) (k)g(k)dk = ∞ f (x) (Fg) (x)dx. −∞ Das Integral existiert für alle x ∈ R außer in einer Menge vom Volumen 0. Wo es nicht existiert, kann der Faltung ein beliebiger Wert gegeben werden. KAPITEL 2. FOURIERANALYSIS 170 6) Falls |f |2 ∈ R, dann gilt |F f|2 ∈ R und (Plancherel) ∞ −∞ ∞ |f (x)|2 dx = −∞ |(Ff ) (k)|2 dk. 7) Falls Ff ∈ R, dann existiert eine stetige Funktion frev ∈ R, die mit f fast überall übereinstimmt. Für diese gilt Ff = Ffrev und limx→±∞ frev (x) = 0. Für alle x ∈ R gilt die Umkehrformel 1 frev (x) = √ 2π ∞ (Ff ) (k) exp(ikx)dk. −∞ Ein Beweis dieser Aussagen ist in [7] gegeben. Wir machen sie zumindest plausibel. Zu 1) Ist eine Folge eines allgemeinen Satzes über Parametrintegrale und der Dreiecksungleichung für Integrale. Zu 2): Durch Vertauschen der Integrationsreihenfolgen folgt + ∞ −ikx * ∞ e √ f (x − y) g (y) dy dx F (f ∗ g) (k) = 2π −∞ −∞ * ∞ −ik(x−y) + ∞ e −iky √ = f (x − y) dx g (y) dy e 2π −∞ −∞ ∞ −iky √ √ e √ g (y) dy = 2πFf (k) Fg (k) = 2πF f (k) 2π −∞ Zu 3): Sei L > 0 so, dass f (x) = 0 für alle x mit |x| ≥ L. Dann folgt durch partielle Integration √ 2π (F (f ′ )) (k) = ,L = −ike−ikx f (x),−L + ik L L e−ikx f ′ (x) dx −L e−ikx f (x) dx = √ 2πik (F (f )) (k). −L Zu 4): Nach einem Satz über die Ableitung uneigentlicher Parameterintegrale gilt ∞ −∞ e−ikx xf (x) dx = ∞ −∞ i d −ikx d e f (x) dx = i dk dk ∞ e−ikx f (x) dx. −∞ Zu 5): Durch Vertauschen der Integrationsreihenfolgen folgt + ∞ ∞ * ∞ −ikx e √ f(x)dx g(k)dk (Ff ) (k)g(k)dk = 2π −∞ −∞ −∞ + * ∞ −ikx ∞ ∞ e √ g(k)dk dx = = f (x) f (x) (F g) (x)dx. 2π −∞ −∞ −∞ KAPITEL 2. FOURIERANALYSIS 171 Einschub: Diracs δ-„Funktion“ Die Unterscheidung zwischen f und frev in der Umkehrformel wird in heuristischen Texten meist unterdrückt. Die Umkehrformel wird auch oft als Definition des Dirac δ-s vorgeführt. Dabei geht es recht formal zu: f (x) = = ∞ f (x′ ) −∞ ∞ −∞ ∞ 1 2π ′ ∞ eikx √ 2π e−ikx √ f (x′ )dx′ dk 2π −∞ ∞ ′ eik(x−x ) dk dx′ = −∞ −∞ Also 1 2π δ(x) = ∞ f (x′ )δ(x − x′ )dx′ . eikx dk. −∞ Dieses parameterabhängige uneigentliche Riemannintegral existiert nicht, denn für K > 0 gilt ,K . K 1 eixk , 1 = sin(Kx) für x = 0 2π ix , πx . eixk dk = δ K (x) = −K K 2π −K für x = 0 π Die Funktion K → δ K (x) hat somit keinen Grenzwert für K → ∞. Abbildung 2.14 zeigt δ K für K = 5π (rot) und für K = 10π (schwarz). y 10 7.5 5 2.5 0 -1 -0.5 0 0.5 1 x Abbildung 2.14: Die Graphen von sin(5πx) πx und sin(10πx) πx Die Funktion δ K ist stetig und nimmt in 0 ihr absolutes Maximum vom Wert K/π an. Für L > 0 folgt mit der Substitution y = Kx und Y = KL L lim K→∞ Y δ K (x)dx = lim −L Y →∞ −Y sin (y) dy = 1. πy (Beweis siehe Bd. II, Kap. VI.8.4 von [3].) Für K → ∞ wird das Integral von δ K über das Intervall [−L, L] also unabhängig von L. Die Beiträge vom Bereich außerhalb KAPITEL 2. FOURIERANALYSIS 172 von [−L, L] heben sich aufgrund der zunehmend rascheren Oszillationen weg. Für hinreichend glatte und im Unendlichen abfallende Funktionen f gilt ∞ lim K→∞ −∞ δ K (x − x′ )f(x′ )dx′ = f (x). Für K > 0 folgt L KL sin (y) lim δ K (x)dx = lim dy = lim L→∞ −L L→∞ −KL Y →∞ πy Y −Y sin (y) dy = 1. πy Mit Diracs δ lassen sich nun die Teile 6) und 7) von Satz 91 plausibel machen. Für Teil 7) etwa so + * ∞ −iky + ∞ ∞ * ∞ eikx e 2 √ f (x)dx √ f (y) dy dk |(Ff ) (k)| dk = 2π 2π −∞ −∞ −∞ −∞ * ∞ + ∞ ∞ ik(x−y) e f (x) f (y) dk dy dx = 2π −∞ −∞ −∞ * ∞ + ∞ ∞ ∞ = f (x) f (y) δ (x − y) dy dx = f (x)f (x) dx = |f (x)|2 dx. −∞ −∞ −∞ −∞ Die cos / sin-Version der Fouriertransformation Mit Eulers Formel und den Bezeichnungen / / 2 ∞ 2 a(k) := f(x) cos(kx)dx, b(k) := π −∞ π ∞ f (x) sin(kx)dx −∞ für k ∈ R gilt (F f) (k) = (a(k) − ib(k)) /2 und die Umkehrformel 1 frev (x) = √ 2π ∞ [a(k) cos(kx) + b(k) sin(kx)] dk. 0 Die Funktion a bzw. b heißt Cosinus- bzw. Sinus - Transformierte von f . Die Funktion a ist gerade und b ist ungerade. Daher sind a und b durch ihre Einschränkungen auf R≥0 eindeutig bestimmt. Allgemein gilt für k ∈ R a(k) = (F f) (k) + (Ff ) (−k) , b(k) = i [(F f ) (k) − (Ff ) (−k)] . Im Fall einer reellwertigen Funktion f sind a und b ebenfalls reellwertig. Faulenzerregeln Wie bei den Fourierreihen gibt es einige einfach zu beweisende Faulenzerregeln, die gelegentlich den Rechenaufwand verringern helfen. Neue Fouriertranformierte werden auf schon bekannte zurückgeführt. Der Beweis dieser Regeln ist einfach durch direktes Nachrechnen zu führen. Seien f, g ∈ R. Dann gilt: KAPITEL 2. FOURIERANALYSIS 173 1. Für λ ∈ C gilt F (f +λg) = F f +λF g (Die „Fouriertransformation” ist linear.) 2. Ist f reellwertig, dann gilt (Ff ) (−k) = (Ff ) (k) für alle k ∈ R. 3. Ist f gerade, dann ist F f gerade. Ist f ungerade, dann ist F f ungerade. 4. Für ξ ∈ R ist Tξ f : x → f (x − ξ) die Translation von f um ξ. Dann gilt (F (Tξ f )) (k) = exp(−ikξ) (Ff ) (k) für alle k ∈ R. 5. Sei fλ (x) := f (λx) für alle x ∈ R mit festem λ ∈ R>0 (Streckung für λ < 1 bzw. Stauchung für λ > 1). Dann gilt F (fλ ) = λ−1 (F f)λ−1 : k → 2.2.3 1 (F f) λ k λ für alle k ∈ R. Beispiele zur Fouriertransformation Beidseitig gedämpfter Sinus und Cosinus Für λ > 0 und Ω ∈ R sind die Funktionen g, h : R → R mit g(t) = exp (−λ |t|) cos (Ωt) und h(t) = exp (−λ |t|) sin (Ωt) in R. Es sollen ihre Fouriertransformierten aus jener von fΩ : R → R mit fΩ (t) = exp (−λ |t|) exp (iΩt) berechnet werden. Es gilt nach Beispiel 90 (FfΩ ) (ω) = ∞ e−i(ω−Ω)t −λ|t| 1 2λ √ e dt = √ . 2 2π 2π λ + (ω − Ω)2 −∞ Daraus folgt mit g = (fΩ + f−Ω ) /2 und h = (fΩ − f−Ω ) /2i * + λ 1 1 F g (ω) = √ + 2π λ2 + (ω − Ω)2 λ2 + (ω + Ω)2 2λ λ2 + Ω2 + ω 2 = √ 2π λ4 + 2λ2 (ω 2 + Ω2 ) + (ω 2 − Ω2 )2 und * + −iλ 1 1 Fh (ω) = √ − 2π λ2 + (ω − Ω)2 λ2 + (ω + Ω)2 4iλ ωΩ = −√ . 4 2 2 2π λ + 2λ (ω + Ω2 ) + (ω 2 − Ω2 )2 Man beachte: Die Funktionen g und h sind beide reellwertig. g ist gerade und h ist ungerade. Nach den Faulenzerregeln 2 und 3 ist die Funktion Fg somit zwangsläufig reellwertig und gerade, während F (ih) = iFh reellwertig und ungerade sein muss. Unser Ergebnis bestätigt diese allgemeine Einsicht. KAPITEL 2. FOURIERANALYSIS 174 Die Umkehrformel ergibt für g daher die Cosinuszerlegung 1 g (t) = √ 2π 1 = √ 2π ∞ 1 e Fg (ω) dω = √ 2π −∞ ∞ iωt ∞ −∞ cos (ωt) F g (ω) dω a (ω) cos (ωt) dω 0 mit der Spektralfunktion 4λ λ2 + Ω2 + ω 2 . a (ω) = 2Fg (ω) = √ 2π λ4 + 2λ2 (ω 2 + Ω2 ) + (ω 2 − Ω2 )2 Für h folgt analog die Sinuszerlegung 1 h(t) = √ 2π ∞ b(ω) sin(ωt)dω. 0 mit der Spektralfunktion ωΩ 8λ . b(ω) = 2iFh(ω) = √ 4 2 2 2π λ + 2λ (ω + Ω2 ) + (ω 2 − Ω2 )2 Die Abbildungen 2.15 und 2.16 zeigen die Funktionen h und b auf R>0 für die Parameterwerte Ω = 10 und λ = 1. Das Ein- und Ausschalten der Sinusschwingung führt zu einer um die Trägerfrequenz Ω lokalisierten Spektralfunktion. Die unübersichtlichen, hektischen Oszillationen der Funktion h werden durch die Fouriertransformation zum Verschwinden gebracht: die Funktion b hat nur einen einzigen breiten Buckel bei ω ≈ Ω, was bei einer numerischen Weiterverarbeitung ein erheblicher Vorteil sein kann. Fig 2.17 zeigt b für λ = 1 und Ω = 20. Die Spektralfunktionen a und b werden mit wachsendem Ω bei gleichbleibendem λ zunehmend besser approximiert durch / 2 1 a (ω) = 2Fg (ω) ≈ λ , 2 π λ + (ω − Ω)2 / 1 2 b(ω) = 2iF h(ω) ≈ λ . 2 π λ + (ω − Ω)2 Oszilliert das elektrische Dipolmoment eines angeregten Atoms, dann hat λ einen Wert von etwa 108 Hz und Ω einen Wert im Bereich von 1015 Hz. Die Spektralanalyse des vom oszillierenden Dipolmoment emittierten Lichtes macht dementsprechend eine um die Frequenz Ω ganz scharf lokalisierte Spektrallinie sichtbar. Je kleiner λ ist, umso länger dauert der atomare Emissionsprozess und umso schärfer ist die Spektralverteilung. Heavisidefunktion - gedämpft Eine ruckartig einsetzende und exponentiell gedämpften Schwingung: Seien Ω, γ ∈ R mit γ > 0 und sei fγ,Ω : R → C, mit fγ,Ω (t) = exp (−γt) exp (iΩt) für t ≥ 0 und KAPITEL 2. FOURIERANALYSIS 175 h 0.75 0.5 0.25 0 -5 -2.5 0 2.5 5 -0.25 t -0.5 -0.75 Abbildung 2.15: h für λ = 1 und Ω = 10 b 0.6 0.4 0.2 0 0 5 10 15 20 w Abbildung 2.16: b für λ = 1 und Ω = 10 fγ,Ω (t) = 0 sonst. Es gilt speziell für Ω = 0 lim fγ,0 (t) = Θ (t) = γ↓0 1 für t ≥ 0 0 für t < 0 Für die Fouriertransformierte von fγ,Ω folgt 1 (Ffγ,Ω ) (ω) = √ 2π ∞ 0 1 1 exp (−i (ω − Ω − iγ) t) dt = √ . 2π i (ω − Ω − iγ) F fγ,Ω liegt nicht in R, denn für ω → ±∞ geht F fγ,Ω (ω) nur wie 1/ |ω| gegen 0. Dass Ffγ,Ω gar nicht in R sein kann, folgt schon aus Teil 7 von Satz 91. Es gibt nämlich gar keine stetige Funktion, mit der fγ,Ω fast überall übereinstimmt. Daher ist der Umkehrsatz nicht anwendbar. Und tatsächlich gilt die Umkehrformel15 Θ (t) exp (−γt) = 1 2πi ∞ eiωt dω −∞ ω − iγ (2.6) nur für alle t ∈ R 0. Das wird im Kapitel über Funktionentheorie von Math. Meth. II mit dem Residuensatz gezeigt. Folglich gilt für alle t ∈ R 0 Θ (t) = lim γ↓0 15 1 2πi ∞ −∞ eiωt dω = ω − iγ Es genügt eine Diskussion des Falles Ω = 0. 1 für t > 0 . 0 für t < 0 KAPITEL 2. FOURIERANALYSIS 176 y 0.6 0.4 0.2 0 0 10 20 30 40 x Abbildung 2.17: b für λ = 1 und Ω = 20 Für t = 0 ist Gleichung (2.6) ohne eine weitere Präzisierung sinnlos, da für −a < 0 < b b −a 1 dω = ω − iγ ,b , 1 2 2 , = ln ω + γ , + i 2 −a b/γ −a/γ b −a ω dω + 2 ω + γ2 1 dx = ln 2 x +1 8 9 91 + b = ln + ln : a 1+ γ 2 b γ 2 a b −a ω2 iγ dω + γ2 b b2 + γ 2 a + i arctan − arctan 2 2 a +γ γ γ + i arctan b a − arctan γ γ gilt. Der Limes a → ∞ oder b → ∞ von ln ab existiert nicht. Die beiden weiteren Terme hingegen konvergieren gegen 0 und iπ unabhängig von der Reihenfolge der beiden Grenzübergänge. Korreliert man a mit b durch b = λa mit λ > 0, dann folgt bei festem λ > 0 λa dω = ln λ + iπ. lim a→∞ −a ω − iγ ∞ dω Der Wert des formalen Integrals −∞ ω−iγ ist also erst nach Vorgabe einer weiteren Zusatzvorschrift, z.B. λ = 1, festgelegt. Für λ = 1 ergibt sich damit 1 lim 2πi a→∞ a −a 1 dω = . ω − iγ 2 Halbseitiger Sinus - gedämpft Sei nun g(t) = exp (−γt) sin (Ωt) /Ω für t ≥ 0 und g(t) = 0 sonst. g ist in 0 stetig und g ′ springt in 0 von 0 auf 1. Die Funktion g ist daher für γ < ω 0 und Ω = ω 20 − γ 2 die retardierte Fundamentallösung der (unterkritisch) gedämpften Schwingungsgleichung y ′′ +2γy ′ +ω 20 y = 0. Welches Fourierspektrum hat diese von einem δ-Kraftstoß erzeugte Schwingung? √ Es gilt g = (fγ,Ω − fγ,−Ω ) /2iΩ und daher 2π (Fg) (ω) = * + 1 1 1 1 1 1 − = − . 2iΩ i (ω − Ω − iγ) i (ω + Ω − iγ) 2Ω ω + Ω − iγ ω − Ω − iγ KAPITEL 2. FOURIERANALYSIS 177 g 0.75 0.5 0.25 0 0 10 20 30 t -0.25 -0.5 Abbildung 2.18: g für γ = 1/10 und Ω = 1 Auf gemeinsamen Nenner gebracht ergibt sich √ 2π (F g) (ω) = 1 Ω2 − ω 2 + γ 2 − 2iγω = . Ω2 − ω 2 + γ 2 + 2iγω (Ω2 − ω 2 + γ 2 )2 + (2γω)2 Daher gilt Fg ∈ R und der Fourierumkehrsatz sagt, da g stetig ist, mit ω ± = ±Ω+iγ für alle t ∈ R Θ (t) exp (−γt) sin (Ωt) = Ω ∞ −∞ −eiωt dω. 2π (ω − ω + ) (ω − ω − ) Diese (punktweise) Fourierdarstellung der retardierten Fundamentallösung g werden wir im Kapitel über Funktionentheorie mithilfe des Residuensatzes verifizieren. Die reellen Sinus/Cosinus Transformierten a und b von g sind an (Fg) (ω) = (a(ω) − ib(ω)) /2 abzulesen. Es gilt / / 2 Ω2 − ω 2 + γ 2 2 2γω a(ω) = b(ω) = . 2 2, 2 2 2 2 2 π (Ω − ω + γ ) + (2γω) π (Ω − ω + γ 2 )2 + (2γω)2 Figur 2.19 zeigt diese beiden Spektralamplituden von f für Ω = 10 und γ = 1/10. Für Ω ≫ γ sind die Spektralamplituden nur in der Nähe der Trägerfrequenz Ω deutlich von 0 verschieden. Eine unbeschränkte Funktion √ Sei λ > 0 und √ f : R → R, mit f (x) = e−λx / x für x > 0 und f (x) = 0 sonst. Dann folgt mit u = x und dem Gaußschen Integral aus Kap I / 2 ∞ −ikx −λx ∞ e e 1 e−(λ+ik)u 2 ∞ −(λ+ik)x2 √ √ dx = √ Ff (k) = 2udu = e dx u π 0 2π x 2π 0 0 / i k ∞ 1 e− 2 arctan λ 1 1 π −(λ+ik)x2 =√ 4 =√ e dx = √ . 2π −∞ 2π λ + ik 2 λ2 + k 2 KAPITEL 2. FOURIERANALYSIS 178 0.375 0.25 0.125 0 5 7.5 10 12.5 15 -0.125 Abbildung 2.19: Spektralamplituden a (grün) und b (rot) für Ω = 10 und γ = 1/10. F f liegt nicht in R, denn für k → ±∞ geht Ff (k) nur wie |k|−1/2 gegen 0. Dass F f gar nicht in R sein kann, folgt schon aus Teil 7 von Satz 91. Es gibt nämlich gar keine stetige Funktion, mit der f fast überall übereinstimmt. Wegen |f |2 ∈ / R ist Plancherels Formel nicht anwendbar. Sei nun g : R → R, mit g (x) = e−λ|x| / |x| für alle x ∈ R 0. Der Wert, den g bei 0 annimmt, ist für die Fouriertransformierte von g belanglos. Es gilt 0 ∞ −ikx −λx e−ikx e−λ|x| eik(−x) e−λ(−x) e e √ √ √ √ dx dx = dx + 2π |x| 2π 2π x (−x) −∞ −∞ 0 ∞ ikx −λx ∞ −ikx −λx e e e e √ √ dx + √ √ dx = F f (−k) + Ff (k) = 2π x 2π x 0 0 √ i k i k 2 e 2 arctan λ + e− 2 arctan λ = 4 . 2 λ2 + k 2 F g (k) = ∞ Somit gilt Fg (k) = √ 2 4 λ2 + k 2 cos 1 k arctan . 2 λ Wegen arctan (k/λ) ∈ (−π/2, π/2) folgt cos (arctan (k/λ) /2) = (1 + cos arctan (k/λ)) /2 = / 1 + λ/ k 2 + λ2 /2. Daraus ergibt sich F g (k) = / λ+ λ2 + k 2 / λ2 + k 2 . Abbildung (2.20) zeigt die positiven geraden Funktionen g und Fg (rot) für λ = 1. Gaußfunktion Satz 92 Für die Funktion f : R → R, x → exp (−x2 /2) gilt F f = f. KAPITEL 2. FOURIERANALYSIS 179 1.5 1.25 1 0.75 0.5 0.25 0 0.5 1 1.5 2 2.5 3 Abbildung 2.20: g und Fg (rot) Beweis. Die Funktion g : R → R mit g(x) = xf(x) ist wie auch f in R. Nach Teil 4) des Fouriertransformationssatzes 91 gilt (F f )′ = −iFg. Mit partieller Integration folgt ∞ ∞ x2 1 1 d x2 (F g) (k) = √ xe− 2 e−ikx dx = √ − e− 2 e−ikx dx dx 2π −∞ 2π −∞ ∞ ∞ x2 d x2 1 −ik e−ikx dx = √ =√ e− 2 e− 2 e−ikx dx = −ik (F f) (k) , dx 2π −∞ 2π −∞ also (Ff )′ (k) = −i (F g) (k) = −k (Ff ) (k) . Damit ist Ff eine maximale Lösung der auf R2 definierten gewöhnlichen Differentialgleichung y ′ = −xy. Also gilt F f ∈ {y : R → R, x → c exp (−x2 /2) | c ∈ R} und somit (Ff ) (k) = (F f ) (0) · exp −k 2 /2 . ∞ Der Wert von (F f ) (0) = √12π −∞ exp (−x2 /2) dx wird im Kapitel über Wahrscheinlichkeit (Gaußverteilung) berechnet. Es gilt 1 √ 2π ∞ 2 /2 e−x dx = 1 −∞ 2 und daher (F f) (k) = e−k /2 = f (k) für alle k ∈ R. Anmerkung: Ein Beweis für F f = f mit den Mitteln der Funktionentheorie ist im Beweis von Lemma 50.2 von [13] angeführt. Übertragung auf g(x) := exp (−x2 / (2a2 )) = f (x/a) für a > 0 : Mit Regel 5 folgt 2 k2 /2 (Fg) (k) = ae−a . Man beachte wieder die Reziprozität der Breiten von g und F g. Übertragung auf h(x) := exp − (x − ξ)2 / (2a2 ) = g(x − ξ) für ξ ∈ R : Mit Regel 4 folgt 2 2 (Fh) (k) = ae−ikξ e−a k /2 . KAPITEL 2. FOURIERANALYSIS 180 Rechtecksfunktion Sei h : R → R mit h(x) = 1 falls |x| < L und h(x) = 0 sonst. Dann gilt für k = 0 / ∞ −ikx L −ikx e e 2 sin(kL) e−ikL − eikL √ h(x)dx = √ dx = √ (Fh) (k) := =L . π kL 2π 2π −ik 2π −∞ −L Weiter gilt (Fh) (0) = L 2/π. Die Funktion Fh ist also tatsächlich stetig, liegt R aber nicht in R, denn −R |(F h) (k)| dk wächst für R → ∞ unbeschränkt. (Siehe etwa Bsp. 46.4 von [13]) Dass Fh nicht in R sein kann, folgt auch schon aus Teil 7 von Satz 91. Es gibt nämlich gar keine stetige Funktion, mit der h fast überall übereinstimmt. 1 0.75 0.5 0.25 0 -10 -5 0 5 10 k Abbildung 2.21: Graph von (sin(k)/k)2 Da aber h ∈ R und |h|2 ∈ R, gilt nach Teil 6) des Hauptsatzes ∞ −∞ ∞ |h (x)|2 dx = −∞ |Fh (k)|2 dk. Daraus ergibt sich mit der Substitution u = kL L 2L = dx = −L ∞ −∞ ∞ |h (x)|2 dx = −∞ |(F h) (k)|2 dk = ∞ 2L π −∞ sin u u 2 du. Somit gilt die nützliche Integralformel ∞ −∞ sin x x 2 dx = π. Man beachte auch, dass für alle L > 0 ∞ L 1= −∞ π sin (kL) kL 2 dk = 1 2πL ∞ 1 − cos (2Lk) dk. k2 −∞ 2 ≥ 0 hat unabhängig Die Fläche unter dem Graphen von k → gL (k) = Lπ sin(kL) kL von L den Wert 1, konzentriert sich aber mit wachsendem L zunehmend bei k = 0. KAPITEL 2. FOURIERANALYSIS 2.2.4 181 *Frequenzmessung an einem harmonischen Signal Ein Fourieranalysator wird über eine endliche Zeitspanne hinweg an ein harmonisches Signal, an die Funktion f (t) = cos (Ωt − δ) , gekoppelt. Welches Fourierspektrum sieht der Analysator und wie kann die Signalfrequenz Ω am Spektrum abgelesen werden? Wie ist der Phasenparameter δ zu bestimmen? Sei Ω > 0 und δ ∈ R. Es gelte f (t) = cos (Ωt − δ) für alle t ∈ − T2 , T2 und f (t) = 0 sonst. Dann folgt für die Fouriertransformierte des abgehackten Signals 1 F f (ω) = √ 2π T /2 e−iωt −T /2 eiΩt−iδ + e−iΩt+iδ dt = e−iδ g (ω − Ω) + eiδ g (ω + Ω) 2 mit T /2 1 g (ω) = √ 2 2π e−iωt dt. −T /2 Es gilt somit für ω = 0 ωT 1 e−i 2 − ei g (ω) = √ −iω 2 2π ωT 2 1 sin ωT 2 =√ ω 2π T sin ωT 2 = √ 2 2π ωT 2 und g (0) = 2√T2π = π2 ω10 mit ω 0 = 2π/T. Da g gerade ist, folgt Ff (−ω) = F f (ω), so wie es für ein reelle Funktion f nach den Faulenzerregeln auch sein muss. Folglich ist auch die Funktion |F f|2 gerade. √ Die Funktion |g| nimmt nur bei 0 ihr Maximum an. Es hat den Wert (π/ω 0 ) / 2π. Die Nullstellenmenge von g ist ω 0 ·(Z 0) . Das Maximum von |g| liegt also zwischen den beiden benachbarten Nullstellen ω = ±ω 0 . Im Intervall (0, ω 0 ) ist |g| streng monoton fallend. Zwischen den benachbarten positiven Nullstellen kω 0 und (k + 1) ω 0 von √ |g| hat |g| genau ein lokales Maximum (k ∈ N) . Dessen Wert ist kleiner als 1/ 2πkω 0 = g (0) /πk. Zur qualitativen Diskussion der Funktion |Ff |2 formen wir um auf dimensionslose Variable. Es gilt , ,2 |Ff (ω)|2 = ,e−iδ g (ω − Ω) + eiδ g (ω + Ω), = |g (ω − Ω)|2 + |g (ω + Ω)|2 + 2 cos (δ) g (ω − Ω) g (ω + Ω) . Mit der Abkürzung S (x) = sin (x) /x und den dimensionslosen Variablen x = ω/Ω und y = Ω/ω 0 folgt somit Py (x) 2ω 20 |Ff (ω)|2 π 2 ω−Ω ω+Ω = S π +S π ω0 ω0 : = 2 + 2 cos (δ) S π ω−Ω ω0 S π ω+Ω ω0 = S (πy (x − 1))2 + S (πy (x + 1))2 + 2 cos (δ) S (πy (x − 1)) S (πy (x + 1)) . Daher kann Py (x) eingegrenzt werden durch die Abschätzungen [|S (πy (x − 1))| − |S (πy (x + 1))|]2 ≤ Py (x) ≤ [|S (πy (x − 1))| + |S (πy (x + 1))|]2 . KAPITEL 2. FOURIERANALYSIS 182 Für y = Ω/ω 0 ≫ 1 ist einer der beiden Terme |S (πy (x − 1))| und |S (πy (x + 1))| jeweils viel kleiner als der andere, sodass die Eingrenzung von Py (x) eng ist. Dann hat |F f|2 zwei scharf voneinander getrennte Maxima in der Nähe von ±Ω. Die Abbildung (2.22) zeigt den Graphen von x → Py (x) für cos δ = 1 und einige Werte von y. Ein Fourieranalysator misst |F f (ω)|2 für ω ∈ ω 0 · I mit I = {1, 2 . . . N} . Er bestimmt also die Werte Py (x) für x = kω 0 /Ω = k/y mit k ∈ I. Ist die Vermessungsdauer T viel größer als die Schwingungsperiode 2π/Ω des Signals, dann kann die Signalfrequenz Ω eines harmonischen Signals aus der Lage des absoluten Maximums von |Ff (ω)|2 im Bereich ω > 0 mit einem Fourieranalysator einigermaßen genau ermittelt werden, falls N ω 0 ≥ Ω. Es gilt in diesem Fall natürlich Ω ≫ ω 0 . Soll hingegen der Phasenlageparameter δ bestimmt werden, ist sein Einfluss deutlicher, wenn Ω ≈ ω 0 gewählt wird. Dann ist nämlich der die δ-Abhängigkeit steuernde Interferenzterm S (πy (x − 1)) S (πy (x + 1)) von derselben Größenordnung wie S (πy (x − 1))2 + S (πy (x + 1))2 . Moral: Zur Bestimmung der Frequenz eines harmonischen Signals einerseits und seiner Phasenlage andererseits eignen sich zwei einander ausschließende Vermessungsprozeduren. 1.5 1.25 1 0.75 0.5 0.25 0 -5 -2.5 0 2.5 5 Abbildung 2.22: x → Py (x) für y = 0.5 (grün), y = 1 (schwarz) und y = 5 (rot) 2.2.5 *Störung einer Quantendynamik Sei H ein endlichdimensionaler C-Vektorraum. ·, · sei ein Skalarprodukt von H. Die lineare Abbildung h0 sei bezüglich ·, · symmetrisch, dh es gilt ϕ, h0 ψ = h0 ϕ, ψ für alle ϕ, ψ ∈ H. Die lineare Abbildung h0 definiert ein lineares System erster Ordnung auf H, eine Quantendynamik. Sie ist durch i d ψ (t) = h0 ψ (t) dt für alle t ∈ R gegeben. Für die maximalen Lösungen des Systems gilt ψ (t) = e−ih0 (t−t0 ) ψ (t0 ) für alle t ∈ R. Manchmal interessiert der Fall, dass während eines KAPITEL 2. FOURIERANALYSIS 183 endlichen Zeitintervalls die Dynamik h0 durch eine andere, i.A. zeitabhängige, lineare Abbildung h (t) ersetzt wird. Wählt man als Zeitintervall der gestörten Dynamik das Intervall [0, T ] , dann versteht man unter einer Lösung des gestörten Systems eine stetige Funktion ψ : R → H mit i h0 ψ (t) für alle t ∈ / [0, T ] . h (t) ψ (t) für alle t ∈ (0, T ) d ψ (t) = dt Bei t = 0 und t = T braucht ψ nicht differenzierbar zu sein. Hier ist aber ψ jedenfalls stetig. Für jede maximale Lösung der gestörten Dynamik folgt somit e−ih0 t ψ (0) für t < 0 . −ih0 (t−T )t e ψ (T ) für t > T ψ (t) = Der Vektor ψ (T ) ergibt sich aus einer Vorgabe für ψ (0) durch Lösung des Anfangswertproblems im Zeitintervall t ∈ (0, T ) . Dies ist bei schwacher Störung näherungsweise möglich. Die Abbildung16 h′ : [0, T ] → Ls (H) sei stetig. Die zu h (t) = h0 +εh′ (t) gehörige Quantendynamik ist das (nichtautonome) lineare System auf H, das durch i d ψ (t) = h (t) ψ (t) dt (2.7) gegeben ist. Dabei ist ε ∈ R. Die autonome Dynamik h0 wird im Zeitintervall [0, T ] also durch Addition von h′ „gestört“. Durch den Ansatz ψ (t) = e−ih0 t ϕ (t) geht das System 2.7 über in das dazu äquivalente System i d ϕ (t) = ε; h (t) ϕ (t) mit ; h (t) = eih0 t h′ (t) e−ih0 t für alle t ∈ (0, T ) . dt (2.8) Wird als Anfangswert des Systems 2.7 zu t = 0 ein (beliebiger) Vektor ψ (0) = ϕ (0) ∈ H vorgegeben, dann folgt für die maximale Lösung des Anfangswertproblems ψ (T ) = e−ih0 T ϕ (T ) mit T ϕ (T ) = ϕ (0) + (−iε) 0 ; h (t) ϕdt + (−iε)2 T 0 ; h (t) t 0 ; h (t′ ) ϕdt′ dt + . . . Der Vektor ϕ (T ) ist als Potenzreihe in ε gegeben. Die Reihe konvergiert für alle ε ∈ R. Seien nun insbesondere e und e′ zwei auf 1 normierte Eigenvektoren von h0 . Es gelte also e = e′ = 1 und h0 e = ωe und h0 e′ = ω ′ e′ . Da h0 symmetrisch ist, gilt ω, ω ′ ∈ R. Damit folgt für ϕ (0) = e & ' & ' ′ e′ , ψ (T ) = e′ , e−ih0 T ϕ (T ) = eih0 T e′ , ϕ (T ) = e−iω T e′ , ϕ (T ) 16 Ls (H) ist der Vektorraum aller linearen, symmetrischen Abbildungen von H nach H. Die lineare Abbildung h′ (t) ist also wie h0 symmetrisch für alle t ∈ [0, T ] . KAPITEL 2. FOURIERANALYSIS 184 T 0 und unter Verwendung von ϕ (T ) = ϕ (0) + (−iε) folgt e′ , ϕ (T ) − e′ , e = T = −iε T = −iε 0 0 ( ) e′ , ; h (t) e dt + o (ε) = −iε T 0 & −ih0 t ′ ′ ' e e , h (t) e−ih0 t e dt + o (ε) ) ( ′ e−iω t e′ , h′ (t) e−iωt e dt + o (ε) = −iε T = −iε 0 ; h (t) ϕ (0) dt + o (ε) für ε → 0 T ′ e−i(ω−ω )t e′ , h′ (t) e dt + o (ε) 0 √ ′ e−i(ω−ω )t e′ , h′ (t) e dt + o (ε) = −iε 2πFV (ω − ω ′ ) + o (ε) . Hierbei bezeichnet F V die Fouriertransformierte der Funktion V : R → C V (t) = e′ , h′ (t) e 0 für t ∈ [0, T ] . sonst Im Spezialfall einer im Intervall [0, T ] konstanten Störung folgt für ω = 0 ,T T √ e−iωt ,, e−iωT − 1 −iωt 2πF V (ω) = V (0) e dt = V (0) = V (0) −iω ,0 −iω 0 T T 2 . = V (0) e−iω 2 sin ω ω 2 √ Für ω = 0 folgt 2πF V (0) = V (0) T. Somit gilt im Fall konstanter Störung für ε → 0 für die Lösung ϕ des Systems 2.8 mit ϕ (0) = e ′ T e′ , ϕ (T ) = e′ , e − iεT e′ , h′ (0) e e−i(ω−ω ) 2 S (ω − ω ′ ) wobei S (ω − ω ′ ) 2.2.6 T 2 = T 2 + o (ε) , sin (ω − ω ′ ) T2 . (ω − ω ′ ) T2 *Beugung am Spalt und Fouriertransformation In der Einführungsvorlesung über Physik wird die Beugung am unendlich langen Spalt behandelt. Dabei wird die (ungefähre) Intensität einer monochromatischen elektromagnetischen Welle auf einem Schirm hinter dem Spalt und in großer Entfernung vom Spalt als Funktion des Ablenkwinkels α gegenüber der geraden Durchgangsrichtung durch den Spalt plausibel gemacht. Diese Überlegung zeigt, dass die Fouriertransformierte der Rechtecksfunktion das Beugungsbild des Spaltes am Schirm bestimmt.17 Das kommt folgendermaßen zustande. Zunächst wird das Problem wegen seiner Translationsinvarianz in Spaltrichtung zu einem 2d Problem verkürzt und der Vektorcharakter des Signals ignoriert. Der Spalt sei das Gebiet −L < x < L und y = 0. Das Signal am Ort p = R (sin α, cos α) mit − π2 < α < π2 ist die „Summe“ der Signale von einzelnen Kreiswellen, die 17 Chapt. 46-2, 46-3 von D Halliday, R Resnik, K Krane, Physics Vol II, New York, 1992 KAPITEL 2. FOURIERANALYSIS 185 von den Punkten des Spaltes ausgehen.18 Die Quellpunkte (x, 0) dieser fiktiven 2dKreiswellen der Frequenz ω und Wellenzahl k = ω/c haben alle vom Aufpunkt p einen etwas anderen Abstand19 l (x) = |p − (x, 0)| ≈ R − x sin α. Die genaue Formel für 2d Kreiswellen kann hier nicht erläutert werden. Sie enthält die Hankelfunkti(2) on H0 , eine Lösung der Besselschen Differentialgleichung mit Parameter 0. Für großen Abstand r zwischen Quell- und Aufpunkt vereinfacht sich jedoch die auslau√ fende monofrequente (komplexe) Kreiswelle zu annähernd − exp i (ωt − kr) / 8πr. Daher ist das Summensignal in einem „fernen“ Punkt p annähernd proportional zum Realteil von L −L e−i(ωt−kl(x)) ei(ωt−kR) √ dx ≈ R l (x) L eik sin(α)x dx = L −L i(ωt−kR) = 2L e √ R ei(ωt−kR) √ R 1 eikL sin(α)x dx −1 sin (kL sin α) . kL sin α Die Intensität I (α) , die dem Absolutquadrat der Amplitude proportional ist, erfüllt somit bei festem R annähernd I (α) = I (0) sin (kL sin α) kL sin α 2 . In optischen Situationen gilt kL ≈ 103 . I hat die kleinste positive Nullstelle bei kL sin α = π. Der zugehörige Beugungswinkel α hat für kL = 103 den Wert von 10−3 π, was 10, 8′ entspricht. Im Fall einer komplexeren Mehrfachspaltanordnung überträgt sich die obige Überlegung offenbar zu / ∞ e−i(ωt−kl(x)) 2π χ (x) (Fχ) (−k sin α) . dx ≈ ei(ωt−kR) R l (x) −∞ Dabei gilt χ (x) = 1, für alle x, die in einem Spalt liegen, und χ (x) = 0 sonst. Für die Intensitätsverteilung folgt daraus unter Beachtung von (Fχ) (−k) = (F χ) (k) und von (F χ) (0) = 0 , , , (Fχ) (k sin α) ,2 , . I (α) = I (0) ,, (F χ) (0) , Sei beispielsweise χ die charakteristische Funktion zweier symmetrisch um x = 0 platzierten Spalte. Jeder habe die Breite 2L und ihre Mittellinien haben die Lagen x = ±a. Dabei gilt a > L > 0. Dann folgt mit χ0 = Θ (L − |x|) und mit √ 2π (F χ0 ) (k) = L e−ikx dx = −L e−ikL − eikL sin (kL) = 2L −ik kL 18 Dieses intuitive Rezept von Huyghens wurde erst später durch Kirchhoff aus der Maxwellschen Theorie heraus mit der Methode der Greenschen Funktionen plausibel gemacht. Exakt lösbar ist die das Beugungsproblem darstellende Integralgleichung auch heute noch nicht. 19 x Da für x ∈ [−L, L] gilt: l (x) = |R (sin α, cos α) − (x, 0)| = R 1 − 2 R sin α + L L x sin α + o R für R → 0. x 2 R = R− KAPITEL 2. FOURIERANALYSIS 186 für die Fouriertransformierte von χ = Ta χ0 + T−a χ0 mit (Ta f ) (x) = f (x − a) sin (kL) 4L (F χ) (k) = e−iak (F χ0 ) (k) + eiak (Fχ0 ) (k) = √ cos (ka) . kL 2π Für die Intensitätsverteilung hinter der Doppelspaltanordnung folgt daraus sin (kL sin (α)) I (α) = I (0) cos (ka sin (α)) kL sin (α) 2 . Bei experimentell zugänglichen kleinen Beugungswinkeln reicht es, sin α durch α zu approximieren. Figur 2.23 zeigt I (α) /I (0) für a/L = 10 im Bereich 0 < kLα < 2π. 0.75 0.5 0.25 0 0.25 Abbildung 2.23: Die Funktion 2.2.7 0.5 0.75 kLα 2π 1 → I (α) /I (0) für a = 10L *Faltung und Messung In diesem Abschnitt wird an einem sehr einfachen Beispiel klar gemacht, warum bei der Vermessung einer in der Natur ’realisierten’ Funktion von Ort, Zeit, Frequenz oder dergleichen die Anzeige des Messgeräts, zB einer Waage, einerseits von der Funktion selbst und andererseits von einer für das Messverfahren charakteristischen ’Empfindlichkeitsfunktion’ abhängt. Es zeigt sich, dass die Anzeige des Messgeräts die Faltung der Empfindlichkeitsfunktion mit der zu vermessenden Funktion ist. Der Fachjargon sagt dazu: ’Die Sensitivität wird ins Signal gefaltet’. Regen fällt während einer Nacht in einen Garten mit einer zeitveränderlichen Niederschlagsintensität. Man sagt: Zur Zeit t fallen I (t) Kilogramm Wasser pro Quadratmeter und Sekunde. Gemeint ist damit eigentlich, dass während eines Zeitintervalls [a, b] auf einen Quadratmeter Gartenfläche die Wassermasse von b m (a, b) = I (t) dt a fällt. Die als stetig angenommene Funktion I : [−T, T ] → R≥0 ist ähnlich einer Wahrscheinlichkeitsdichte nur über ihre bestimmten Integrale empirisch zugänglich. Soll die Funktion I zumindest annähernd vermessen werden, wird man während der Nacht zu einigen Zeiten t1 , t2 . . . einen Kübel in den Garten stellen und jeweils während einer kurzen Zeitspanne der Dauer ∆t um ti das Regenwasser im Kübel KAPITEL 2. FOURIERANALYSIS 187 sammeln und anschließend abwiegen. Die Größe I (ti ) ergibt sich aus der im Intervall mi [ti − ε, ti + ε] gesammelten Wassermasse mi zu ungefähr I (ti ) ≈ 2εF , wenn F die Querschnittsfläche des Kübels ist. Bei Verwendung der Heavisidestufe Θ : R → R mit Θ (x) = 1 für x ≥ 0 und Θ (x) = 0 sonst, folgt für die im Kübel um die Zeit ti gesammelte Wassermasse mi = F ti +ε I (t) dt = ti −ε ∞ −∞ Θ (ε − |ti − t|) I (t) dt = (χε ∗ I) (ti ) . Dabei ist χε : R → R die Indikatorfunktion des Intervalls [−ε, ε] . Es gilt also χε (x) = 1 für |x| ≤ ε und χε (x) = 0 sonst. Das Messverfahren kann etwas verfeinert werden, indem der Kübel während des Transports in den Garten und auch beim Rücktransport zugedeckt wird. Beim Öffnen des Kübels wird dann nicht schlagartig sondern nur nach und nach seine ganze Querschnittsfläche zum Regensammeln wirksam, sodass χε zu einer stetigen Funktion g mit g (x) = 0 für x ∈ / [−ε, ε] geglättet wird. ZB zur Funktion g von Figur (2.24) mit g (x) = exp (−1/ (ε2 − x2 )) für x2 < ε und g (x) = 0 für x2 ≥ ε. Abbildung 2.24: Eine Empfindlichkeitsfunktion g Das Messverfahren - zur Zeit ti ausgeführt - tastet somit die Funktion I in einem Intervall um den Punkt ti summarisch ab und ergibt den Messwert (g ∗ I) (ti ) . Der Wert I (ti ) bleibt dabei unzugänglich; die Empfindlichkeitsfunktion g geht in den Messwert ein. Wird I durch I (t) = 0 für alle t ∈ / [−T, T ] auf ganz R fortgesetzt, dann kann I aus g ∗ I über den Faltungssatz rekonstruiert werden. Dazu wäre ’nur’ eine Messung von g ∗ I in jedem Punkt des Intervalls [−T − ε, T + ε] nötig, da (g ∗ I) (t) = 0 für t∈ / [−T − ε, T + ε] . Auch die Messung von g ∗ I in einem beschränkten Intervall ist natürlich lückenlos nicht durchführbar. Ein Mangel, der durch Hypothesen über die Variation von I auf kleinster Skala kaschiert wird. Aber die Körnigkeit der Regentropfen selbst setzt der Vorstellung von einer stetigen Niederschlagsintensität I ja ganz offenbar ihre Grenzen, sodass derlei Ungenauigkeiten für das, was vom Modell erwartet wird, belanglos sind. √ Wegen g ∗ I ∈ R gilt (Faltungssatz!) F (g ∗ I) = 2π (F g) · (F I) und daher F (g∗I) , also für t ∈ R I = F −1 √ 2πFg I (t) = ∞ eiωt F (g ∗ I) (ω) dω. (Fg) (ω) −∞ 2π Man beachte, dass auch in den Nullstellen von Fg der Integrand F (g ∗ I) /F g = F I aufgrund der Stetigkeit von FI stetig ist. KAPITEL 2. FOURIERANALYSIS 2.2.8 188 *Faltung und Bildfehlerkorrektur Das Licht eines Sterns fällt durch ein Teleskop auf eine lichtempfindliche ebene Schicht. Licht, das parallel zur optischen Achse läuft, hinterlässt im fiktiven Idealfall auf der Schicht einen hellen Punkt p0 der Belichtungsstärke f > 0. Wir wählen diesen Punkt als Nullpunkt der Bildebene. Realistischerweise wird jedoch durch Beugung an den optischen Teilen und durch atmosphärische Brechung ein ausgedehnter Lichtfleck um p0 herum erzeugt. Er wird durch eine Belichtungsfunktion f · Kt : R2 → R≥0 beschrieben. Es gilt dabei R2 Kt (x) d2 x = 1, da die gesamte Belichtungsstärke den Wert f behalten soll. Die Funktion Kt hängt vom Zeitpunkt t der Aufnahme ab, da die Atmosphäre flimmert. Fällt nun Licht gleichzeitig aus mehreren achsennahen Richtungen ein, dann würden im Idealfall an Stellen x1 , . . . xn Lichtpunkte der Stärken f1 , . . . fn entstehen. Im Realfall hingegen wird jeder Lichtpunkt xi zu einer Belichtungsfunktion fi Txi Kt verwaschen. Hier bezeichnet Txi Kt das Translat von Kt um xi . Diese Belichtungsfunktionen addieren sich zu einer Gesamtbelichtung, die an der Stelle x den Wert ni=1 fi Kt (x − xi ) hat. Im Grenzfall eines Kontinuums von Lichtquellen wird aus der Summe ein Integral des Typs Bt (x) = R2 f (ξ) Kt (x − ξ) d2 ξ. Es gilt also Bt = Kt ∗ f, wobei f eine fiktive idealisierte Belichtung angibt. Über Kt ist zu wenig bekannt, als dass f aus einem gemessenen Bild Bt berechnet werden könnte. Man gewinnt, indem man Bescheideneres versucht. Aus einem Bild Bt berechnet man zunächst seine 2d-Fouriertransformierte F Bt : 2 R → C mit 1 e−ik·x Bt (x) d2 x (FBt ) (k) = 2π R2 und k·x = k 1 x1 +k 2 x2 . Nach dem Faltungssatz gilt F Bt = 2π (F f) (FKt ) . Mittelung über die Beträge |FBti | , die aus n verschiedenen Aufnahmen bei den Zeiten ti zu errechnen sind, ergibt 1 A := n n i=1 1 |F Bti | = 2π |Ff | n n i=1 |FKti | . Da die Nullstellenmengen der Funktionen F Kti verschieden sein werden, gilt wohl n i=1 |FKti | > 0. Jede Nullstelle von A wird somit auch Nullstelle von |Ff | sein. Nun wird noch eine Hypothese über f benötigt. Bei der Vermessung von Sterndurchmessern etwa wird man - unter Vernachlässigung von Beugung - von f (x) = Θ (R − |x|) ausgehen, wobei R > 0 der fiktive Radius des idealisierten Sternabbilds auf der lichtempfindlichen Ebene ist. Existiert ein R > 0, sodass die Nullstellen von A mit jenen von Ff übereinstimmen, dann wird man f als das idealisierte aus der Bildserie (Bti ) errechnete Bild auffassen können. 2 Es gilt (Ff ) (0) = R2 . Die Berechnung von (Ff ) (k = 0) kann nur angedeutet KAPITEL 2. FOURIERANALYSIS 189 werden. (Siehe Kap. 95 in [13].) (F f ) (k = 0) = 1 = 2π = −ik·x e R2 1 |k|2 |k|R 1 Θ (R − |x|) d x = 2π 1 2π x 0 R 2 2π e−i|k|r cos φ dφ dr r 0 2π e−ix cos φ dφ dx = 0 0 1 |k|2 |k|R xJ0 (x) dx = R2 0 J1 (R |k|) . R |k| Hier bezeichnet Jn : R → R mit n ∈ N0 die Besselfunktion, die durch die Potenzreihe mit unendlichem Konvergenzradius gegeben ist: x Jn (x) = 2 n ∞ k=0 (−1)k x k! (k + n)! 2 2k . Figur (2.25) zeigt J1 im Bereich 0 < x < 15. Die kleinsten drei Nullstellen von J1 sind y 0.4 0.2 0 0 5 10 15 20 x -0.2 Abbildung 2.25: Besselfunktion J1 (gerundet) die Zahlen 3, 83; 7, 02; 10, 17. Die Nullstellenmengen von A müssten also konzentrische Kreise sein. Die innersten Kreise müssten die Radien 3, 83 · R−1 ; 7, 02 · R−1 ; 10, 17 · R−1 haben. Aus einem Kreis wird R bestimmt, und an den weiteren Kreisen muss sich das Konglomerat von Vermutungen bewähren. Dieses Verfahren wird tatsächlich zur Bestimmung von Sternradien benützt. 2.2.9 *Streuung von Wellen und Fouriertransformation Manche physikalischen Qualitäten sind orts- und zeitabhängig. Sie können sich von Ort zu Ort und von Augenblick zu Augenblick ändern. In manchen Fällen ist ein Gesetz, das die möglichen Zeit- und Ortsabhängigkeiten regelt, durch eine lineare partielle Differentialgleichungen gegeben. Vielfach haben diese Gleichungen ebene Wellenlösungen20 des Typs Uk : R × R3 → C mit Uk (t, x) = ei(ωt− k,x ) , wobei 20 Hier wird mit komplexen Lösungen argumentiert, um die Diskussion der Phasenlagen abzukürzen. Direkte physikalische Realität haben im Bereich der klassischen Physik nur reelle Lösungen. Da die der Diskussion zugrunde liegenden Differentialgleichungen alle (inhomogen) linear und reell sind, ist die vorgelegte Argumentation schlüssig. KAPITEL 2. FOURIERANALYSIS 190 k ∈ R3 , ω ∈ R>0 und k, x das Standardskalarprodukt in R3 bezeichnet. Der Wellenzahlvektor k ist beliebig und die Kreisfrequenz ω ist aus k durch eine zur Wellengleichung gehörige Formel, die Dispersionsrelation, zu berechnen. Im Fall von Schall gilt etwa ω = c |k| . Fällt auf eine Störstelle am Ort ξ ∈ R3 eine Welle, die während einer gewissen Zeit in einer Umgebung von ξ durch Uk genähert wird, ein, so spürt die Störstelle die Erregung e−iωt ei k,ξ . Sie reagiert darauf nach einem Einschwingvorgang durch eine stationäre, periodische Veränderung der Frequenz ω. Dabei erzeugt die Störstelle selbst eine Welle, die der einfallenden Welle Uk zu addieren ist. Vielfach kann diese Streuwelle in einer endlichen Umgebung von ξ als Kugelwellenlösung des Typs S|k| : R × (R3 ξ) → C mit −i k,ξ S|k| (t, x) = e ei(ωt−|k||x−ξ|) Aξ |x − ξ| genähert werden. Dabei beschreibt Aξ ∈ C die Stärke und Phasenlage der Reaktion der Störstelle auf die einlaufende Welle.21 Die Zahl Aξ kann dabei von k abhängig sein. In einem Punkt p ∈ R3 , der von der Störstelle ξ großen, aber nicht zu großen, Abstand hat, kann die Streuwelle mithilfe von −i k,ξ S|k| (t, p) = e Aξ e i |k|n,ξ ei(ωt−|k|r) (1 + O (ε)) für ε → 0 r genähert werden. Dabei gilt n = p/ |p| und r = |p| und ε = |ξ| /r. Die Näherung erhält man aus / 1 2 p − ξ, p − ξ = r2 − 2 p, ξ + |ξ| = r 1 − 2 2 p, ξ + |ξ|2 |p − ξ| = r n, ξ = r 1− + o (ε) für ε → 0. r Durch Integration über eine kontinuierliche Störstellenreaktionsamplitudendichte A : R3 → C ergibt sich die Streuwelle in stationärer Fernfeldnäherung S |k| (t, p) ≈ ei(ωt−|k|r) r A (ξ) ei |k|n−k,ξ d3 ξ. R3 Die auslaufende Streuwelle hat also am (fernen) Halbstrahl n eine mit 1/r abnehmende Amplitude, die der dreidimensionalen Fouriertransformierten von A im Punkt k − |k| n proportional ist. Die Differenz q := k − |k| n zwischen einlaufendem Wellenzahlvektor und dem lokalen Wellenzahlvektor der Streuwelle bei p hat den Betrag 2 |k| sin (θ/2) , wobei θ der Winkel zwischen k und Auslaufrichtung n ist. Es gilt 0 ≤ |2q| ≤ |k| . 21 Hat die einlaufende Welle die Amplitude α, so ist auch die erzeugte Kugelwelle mit α zu multiplizieren. KAPITEL 2. FOURIERANALYSIS 2.2.10 191 *Einige 3d-Fouriertransformierte Yukawapotential −κ|x| Sei κ ∈ R>0 . Für Y : R3 → R gelte Y (x) = e4π|x| für x = 0. Der Wert Y (0) ist für das folgende belanglos. Für x → 0 wächst Y (x) unbeschränkt an. Trotzdem gilt |Y (x)| d3 x < ∞. Daher existiert die Fouriertransformierte FY : R3 → C mit R3 F Y (k) = 1 3/2 (2π) e−i k,x Y (x) d3 x. R3 Aus der Drehinvarianz von Y folgt die Drehinvarianz von FY, denn für eine Drehung R : R3 → R3 gilt (2π)3/2 F Y (Rk) = e−i e−i Rk,x Y (x) d3 x = = R3 R3 R3 e−i Y (x) d3 x = R3 e−i k,y Y (Ry) d3 y = = Rk,RR−1 x k,R−1 x Y (x) d3 x R3 e−i k,y Y (y) d3 y = (2π)3/2 F Y (k) . Es genügt daher F Y (k) für k = (0, 0, q) mit q > 0 zu berechnen. Unter Verwendung von Kugelkoordinaten folgt (2π)3/2 FY (qe3 ) = ∞ = 0 e−κr 4πr π 2π e−iqr cos θ r2 sin θdθdφdr 0 0 ∞ 1 1 ∞ −κr π 1 d −iqr cos θ = re dθdr = e−κr eiqr − e−iqr dr e 2 0 2iq 0 0 iqr dθ 1 1 1 1 1 (κ + iq) − (κ − iq) = − = = 2 . 2 2 2iq κ − iq κ + iq 2iq q +κ q + κ2 Berechnen wir noch zur Kontrolle (2π)3/2 FY (0) = * ∞ 1 ∞ d 1 d −κr −κr = re dr = r − e dr = r − κ dr κ dr 0 , + 0 * −κr ,∞ 1 e , 1 = 0+ = 2. , κ −κ 0 κ ,∞ , −κr , e , + 0 ∞ −κr e dr 0 + F Y ist also wie vom Hauptsatz behauptet stetig und es gilt22 für alle k ∈ R3 (2π)3/2 F Y (k) = |k|2 + κ2 −1 (2.9) . Wenig überraschend ist die Funktion |FY | = F Y nicht über ganz R3 riemannintegrierbar. Dies entspricht der Tatsache, dass Y (x) für x → 0 divergiert. Trotzdem 22 ∞ Man beachte, dass für κ = 0 die obige Definition von FY unsinnig ist, da 0 sin (qr) dr nicht existiert. Trotzdem ergibt limκ→0 FY eine Funktion auf R3 \ 0, die lokal Riemannintegrabel ist. Davon macht die distributionelle Fouriertransformation Gebrauch. KAPITEL 2. FOURIERANALYSIS 192 lässt sich mit den Methoden der Funktionentheorie, siehe Math. Meth. 2, zeigen, dass für alle x = 0 die Umkehrformel Y (x) = 1 lim (2π)3 K→∞ |k|<K ei k,x d3 k 2 2 |k| + κ gilt. Die Oszillationen von exp (i k, x ) machen es möglich. Die Funktionen |Y |2 und |FY |2 sind beide Riemannintegrabel. Es gilt R3 ∞ |Y (x)|2 d3 x = r2 0 1 e−2κr . 2 4πdr = 8πκ (4πr) Die dreidimensionale Version des Satzes von Parseval sagt R3 |F Y (k)|2 d3 k = R3 |Y (x)|2 d3 x = 1 . 8πκ Wegen 1 |FY (k)| d k = 4π (2π)3 R3 2 ∞ 3 folgt somit 0 k2 1 2 dk = 2 2 (k + κ ) (2π)2 ∞ Und tatsächlich gilt ∞ x2 dx 2 = 2 −∞ (x + 1) k2 1 dk = 2 2 2 κ −∞ (k + κ ) ∞ 1 d x − 2 dx −∞ ∞ −∞ ∞ k2 dk 2 2 2 −∞ (k + κ ) x2 π . dx = 2 2κ (x2 + 1) 1 dx = 2 1+x 2 ∞ 1 π dx = arctan (x)|∞ . −∞ = 2 2 2 −∞ 1 + x Coulombpotential Im Sonderfall κ = 0 hat Y eine „Fourierdarstellung“ ohne selbst im Sinn von Funktionen eine Fouriertransformierte zu besitzen. Die „Fourierdarstellung“ besteht in der Aussage, dass für alle x = 0 1 1 = lim 4π |x| (2π)3 K→∞ |k|<K ei k,x 3 d k. |k|2 Dies lässt sich folgendermaßen ableiten. Sei x = 0. dann gilt 1 2π K |k|<K 1 ei k,x 3 dk= |k|2 K 0 0 −1 e 0 K 0 K iqr cos θ dq eiqrξ dξ dq = = π sin θdθ = − ,1 eiqrξ ,, dq = 2 iqr ,−1 K 0 0 −1 1 sin (qr) 2 dq = qr r x sin(t) dt 0 t eiqrξ dξ dq Kr 0 sin (t) dt. t Die (ungerade) Funktion Si : R → R mit Si (x) = heißt Integralsinus und es gilt limx→∞ Si (x) = π/2. (Ein Beweis ist in Vol. 2, Kap. VI.8.4 von [3] angeführt.) Damit folgt 1 1 ei k,x 3 dk= . lim 3 2 K→∞ (2π) 4π |x| |k|<K |k| KAPITEL 2. FOURIERANALYSIS 193 Gleichverteilung in einer Kugel 3 Sei R ∈ R>0 . Für ρ : R3 → R gelte ρ (x) = 4πR 3 für |x| ≤ R und ρ (x) = 0 sonst. Es 3/2 gilt also (2π) F ρ (0) = R3 ρ (x) d3 x = 1. Unter Verwendung von Kugelkoordinaten folgt für q > 0 (2π)3/2 Fρ (qe3 ) = 3 = 2R3 = 3 q 2 R3 R R 3 4πR3 π 2π e−iqr cos θ r2 sin θdθdφdr 0 0 0 π R 1 d −iqr cos θ 3 r2 r eiqr − e−iqr dr e dθdr = 3 2iqR 0 0 0 iqr dθ ∞ R 3 3 d r sin (qr) dr = 2 3 r − cos (qr) dr = 3 qR 0 q R 0 dr R sin (qR) 3 − r cos (qr)|R + cos (qr) dr = 2 2 − cos (qR) . 0 q R Rq 0 Also gilt (2π)3/2 Fρ (k) = . 1 3 |k|2 R2 0 sin(|k|R) |k|R 1 für k = 0 . − cos (|k| R) sonst F ρ ist stetig. Figur 2.26 zeigt die Funktion |k| R → (2π)3/2 Fρ (k) . 1 0.75 0.5 0.25 0 0 2.5 5 7.5 10 Abbildung 2.26: Die Funktion 12.5 3 x2 15 sin(x) x − cos (x) Die Funktion (2π)3/2 Fρ hat als Formfaktor einer ausgedehnten, homogenen Ladungsverteilung Bedeutung in Kern- und Teilchenphysik. Ein ausgedehnter Kern erzeugt ein Streupotential Y ∗ ρ mit Y = e−κr /4πr für ein κ > 0. In einem Streuexperiment wird |F (Y ∗ ρ) (k)|2 gemessen. Nun kommt der Faltungssatz ins Spiel. Es gilt F (Y ∗ ρ) (k) = (2π)3/2 (FY ) (k) (F ρ) (k) . Aus gemessenen Werten |F (Y ∗ ρ) (k)|2 für diverse k werden die Modellparameter κ und R durch Anpassung bestimmt. (Die Nullstellen von |F (Y ∗ ρ) (k)|2 sind auch die von (2π)3 |F (ρ) (k)|2 , da FY nach Gleichung (2.9) keine Nullstelle hat. Da k einstellbar ist, legt die erste Nullstelle bei |k| R ≈ 4, 49 den Wert R schon fest.) KAPITEL 2. FOURIERANALYSIS 2.3 194 Übungsbeispiele 1. (Trigonometrische Polynome) Rechnen Sie nach, dass die reelle Funktion cos3 das trigonometrische Polynom vom Grad 3 mit den Koeffizienten a0 = a2 = b1 = b2 = b3 = 0 und a1 = 3/4 und a3 = 1/4 ist. 2. (Integration trigonometrischer Polynome) Seien m, ω, ω 0 , ρ ∈ R>0 und F0 ∈ R. Dann existiert genau eine periodische Lösung x : R → R der gedämpften Schwingungsgleichung y ′′ (t) + 2ρy ′ (t) + ω 20 y (t) = F0 cos (ωt) /m. Für diese Lösung gilt für alle t ∈ R cos (ωt − δ) F0 , x (t) = m 2 2 2 2 (ω 0 − ω ) + (2ρω) ω 2 −ω2 wobei 0 < δ < π und cot δ = 02ρω . (Für jede andere maximale Lösung y gilt aufgrund der Dämpfung, dass limt→∞ |y (t) − x (t)| = 0.) Zeigen Sie, dass die am Oszillator angreifende Kraft F0 cos (ωt) bei Vorliegen der Lösung x eine T periodengemittelte Leistung P = 0 x′ (t) F0 cos (ωt) dt/T von P = F02 F02 ρω 2 αq2 = >0 m (ω 20 − ω 2 )2 + (2ρω)2 mω 0 (1 − q 2 )2 + (2αq)2 erbringt, wobei T = 2π/ω, α = ρ/ω 0 und q = ω/ω 0 . Die Figur (2.27) zeigt die 2 Funktion (1−q2 )αq , die den Energieverbrauch regelt, für α = 1/10 und für 2 +(2αq)2 α = 1/5 (rot). 2 1.5 1 0.5 0 0 0.5 1 1.5 2 2.5 3 q Abbildung 2.27: 3. Sei n ∈ N. Die Extrema23 von cosn (x) bei x ∈ π · Z, in denen cosn abwechselnd die Werte (±1)n annimmt, werden mit wachsendem n schärfer ausgeprägt, da 23 Das „Signal“ cosn (ωt) ist also für großes n nur in sehr kurzen Zeitfenstern um t ∈ ωπ Z merklich von 0 verschieden. Sein Fourierspektrum umfasst für (un)gerades n alle (un)geradzahligen Vielfachen der Grundfrequenz ω bis hinauf zu nω. Derartige Signale werden als Taktgeber benutzt. Je schärfer das Signal sein soll, umso breiter muss sein Fourierspektrum angelegt sein. Realistische Größenordnungen bei einem Frequenzkammgenerator sind ω ≈ 2π GHz und n ≈ 5 · 105 . KAPITEL 2. FOURIERANALYSIS 195 limn→∞ cosn (x) = 0 für alle x ∈ / π ·Z. Ein Maß für die Breite24 der Spitzen von 2π 1 cosn ist In := 2π cos2n (x) dx = Pulsbreite / Abstand benachbarter Pulse. 0 (a) Zeigen Sie In = (2n)! . (n!)2 (2.10) 4n Hinweis: Berechnen Sie von cos2n (x) = eix +e−ix 2 2n den Fourierkoeffizi- enten c0 über die binomische Formel. Es gilt dann c0 [cos2n ] = In . n n! e (b) Verwenden Sie nun Stirlings Formel limn→∞ √2πn = 1, um aus Glein √ chung (2.10) abzuleiten, dass limn→∞ √ nπIn = 1. Mit wachsendem n wird somit die Approximation In ≈ 1/ nπ immer besser. cos100 hat (in dieser Approximation) daher die relative Breite I100 ≈ 0, 056. Abbildung 2.28: cos200 auf [0, 2π] 4. (Grundbeispiele für Fourierreihen) Berechnen Sie die Fourierkoeffizienten ck = 1 2π 2π e−ikx f(x)dx, 0 k∈Z der folgenden 2π-periodischen Funktionen und skizzieren Sie jeweils den Graphen der Abbildung k → |ck | (Fourierspektrum). (a) f(x) = |x| für −π < x ≤ π (Sägezahn) (b) f(x) = x für 0 ≤ x < 2π (Kippschwingung) 24 , , (c) f(x) = ,sin( x2 ), (gleichgerichteter Wechselstrom) Als Pulsbreite ist dabei jene Zahl δ gemeint, für die π/2 2n (x) dx −π/2 cos = δ/2 −δ/2 1dx = δ gilt. KAPITEL 2. FOURIERANALYSIS 196 (d) f(x) = sin2 ( x2 ) Achtung: f ist ein trigonome- trisches Polynom. Daher sind Integrationen hier unnötig. 5. (Fourierreihe des δ-Kamms) Zeigen Sie für die Fourierkoeffizienten ck der Lperiodischen Funktion f , für die f (x) = f (−x) und mit 0 < ε < L2 (ε − x)/ε2 für 0 ≤ x < ε , 0 ε ≤ x ≤ L2 f (x) = dass c0 = 1/L und mit ω := 2π/L für alle k ∈ Z ck = 1 L sin (εωk/2) εωk/2 0 2 gilt. Skizzieren Sie die Abbildung ω k := 2π k → |ck |. Wie verändert diese sich, L wenn L vergrößert wird? Zeigen Sie limε↓0 ck = 1/L für alle k ∈ Z bei festem L. (δ-Kamm) L = 2, ε = 0.2 0.5 0.4 k |c | 0.3 0.2 0.1 0 -100 -80 -60 -40 -20 0 ωk 20 40 60 80 100 6. (Aperiodische Sinus-Cosinus Überlagerung) Seien ω 1 , ω 2 , . . . ω N ∈ R>0 voneinander verschieden. Für f : R → C gelte mit a0 , a1 , . . . aN , b1 , . . . bN ∈ C für alle t ∈ R N a0 f (t) = + (ak cos (ω k t) + bk sin (ω k t)) . 2 k=1 Die Funktion f ist also im Allgemeinen nicht periodisch. Zeigen Sie25 , dass für 25 Kelvin approximierte den gezeitenbhängigen Wasserstand in einem englischen Meereshafen durch eine Funktion t → f (t) des obigen Typs. Aus den Aufzeichnungen während der Zeit S < t < S + T ermittelte er annähernd die Konstanten a0 , . . . bN . Dabei wählte er ω 1 = 2π 12d , ω 2 = 2 2 28 d , ω3 = 365 d und nahm noch die ersten paar ganzzahligen Vielfachen davon dazu. Damit konnte er f im Beobachtungszeitraum recht gut approximieren. Die Marine verließ sich auf den weiteren Verlauf der Funktion f und war mit Kelvins Prognose zufrieden. Da die Berechnungen sehr mühsam waren, erfand Kelvin gleich auch noch einen mechanischen Analogrechner, der die Fourieramplituden a0 , . . . bN „berechnete”, und einen, der den künftigen Verlauf von f auf ein Jahr im Voraus mit einer Auflösung von wenigen Minuten aufzeichnen konnte. KAPITEL 2. FOURIERANALYSIS 197 jedes S ∈ R gilt 2 T →∞ T 2 = lim T →∞ T a0 = ak S+T lim f (t)dt, S S+T S 2 cos (ω k t) f (t)dt, bk = lim T →∞ T S+T sin (ω k t) f (t)dt. S 7. (Fouriertransformation) Berechnen Sie die Fouriertransformierte 1 (Ff ) (k) = √ 2π ∞ e−ikx f (x)dx, −∞ k∈R der folgenden auf R definierten Funktionen. Geben Sie auch die Funktionen a, b der sin / cos-Version 1 f(x) = √ 2π ∞ [a(k) cos(kx) + b(k) sin(kx)] dk 0 der Umkehrformel an. (a) f(x) = 1 für −1 < x < 1 und f(x) = 0 sonst. Überprüfen Sie die Regeln 2 und 3 von Bemerkung 2.2.2 an Ff . (b) g(x) = f x−ξ L mit f wie in a) und für ein L > 0 und ein ξ ∈ R. (c) f(x) = x für −1 < x < 1 und f (x) = 0 sonst. Überprüfen Sie an F f die Regeln 2 und 3 von Bemerkung 2.2.2 und unter Verwendung von Beispiel 3a den Teil 4) von Satz 91. 8. Sei f wie in Beispiel 6a (a) Überprüfen Sie daran Teil 1) von Satz 91. (b) Berechnen Sie die Faltung f ∗ f und überprüfen Sie Teil 2) von Satz 91. Kapitel 3 Vektoranalysis Die Physik kennt neben dem Teilchenbild der Materie auch ein Kontinuumsbild. Während das Teilchenbild von vereinzelten Weltlinien als den Elementarbausteinen einer „Weltgeschichte“ ausgeht, unterstellt das Kontinuumsbild, dass Materie ausgedehnte Raumgebiete lückenlos ausfüllt.1 Um die zeitliche Entwicklung von Kontinuumsmaterie zu beschreiben, werden Funktionen benützt, die auf offenen Teilmengen der Raumzeit definiert sind. Solche Funktionen werden Felder genannt. Die Bildbereiche der Felder können R, C, ein höherdimensionaler Vektorraum, oder auch ein ganzes „Bündel“ von Vektorräumen sein. Beispiele sind Massendichte, Strömungsgeschwindigkeit, Ladungsstromdichte, elektrisches Feld, Gravitationspotential. Zur Formulierung von Naturgesetzen werden Differentiations- und Integrationsprozeduren für Felder benötigt. Einen ersten Eindruck davon gibt das vorliegende Kapitel. Dabei wird die Zeit vorläufig aus dem Spiel gelassen und als (instantaner) Raum wird ein reeller Vektorraum mit einem ausgewählten Skalarprodukt benützt. Die Relativitätsprinzipien der Physik verlangen nach Naturgesetzen, die ohne Verwendung allzu spezieller, die Symmetrie brechende Vektorraumstrukturen, also insbesonders ohne spezielle Wahl einer Basis formulierbar sind. Daher sollten Differentiation und Integration basisfrei definiert werden. Bis zu einem bescheidenen Grad werden wir dieses „absolute2 Programm“ hier in seiner euklidischen Variante kennenlernen. Es werden Richtungsableitung, Differential, Gradient, Divergenz und Rotation vorgestellt. Die Einbettung dieser Rechenoperationen in Modelle mit Raum und Zeit erfordert, soweit dies überhaupt möglich ist, weitere oder andere Strukturen, wie die absolute Gleichzeitigkeit der galileischen Raumzeit, oder das indefinite innere Produkt der minkowskischen Raumzeit. In seiner vorläufig letzten Konsequenz gibt das absolute Programm auch die Vektorräume als Bühne für Differential und Integral auf und ersetzt sie durch differenzierbare Mannigfaltigkeiten. 1 Newton selbst hatte den Weg zur Überwindung der Fernwirkungsgesetze gewiesen. Er schrieb 1692 an seinen Freund Richard Bentley: (zitiert nach p. 46 in N Forbes, B Mahon, Faraday, Maxwell and the Electromagnetic Field, Prometheus, Amherst, New York, 2014): That gravity should be innate, inherent, and essential to matter, so that one body can act on another at a distance, through the vacuum, without the mediation of anything else, by and through which their action and force may be conveyed from one to another, is to me so great an absurdity that I believe no man who has in philosophical matters a competent faculty of thinking, can ever fall into it. 2 Das heißt von Zusatzstrukturen losgelöst, befreit. 198 KAPITEL 3. VEKTORANALYSIS 3.1 199 Differenzieren von Skalarfeldern Wie können Skalarfelder differenziert werden? Ein erstes Problem gegenüber dem Fall einer auf R definierten Funktion ist die Vielzahl von Richtungen mithilfe derer eine Folge von Differenzenquotienten gebildet werden kann. Aus der Rechts- und Linksableitung wird im höherdimensionalen Fall die Richtungsableitung. 3.1.1 Richtungsableitung und Differential Notation Zunächst zur Festlegung der Notation eine Wiederholung aus dem Bereich der linearen Algebra. Sei V ein n-dimensionaler reeller Vektorraum und e = (e1 , ..., en) eine Basis von V . Die Abbildung ·, · : V × V → R sei ein Skalarprodukt. Zum Skalarprodukt gehört eine Norm |·| von V , nämlich |v| := v, v . Die Matrix e1 , e1 · · · e1 , en .. .. ... Ge := . . en , e1 ··· en , en heißt Gramsche Matrix des Skalarproduktes ·, · zur Basis e. Eine Basis, deren Gramsche Matrix die Einheitsmatrix In ∈ Rn×n ist, heißt Orthonormalbasis (ONB) von V. Solche gibt es für jedes Paar (V, ·, · ) unendlich viele. Zu jedem Vektor v ∈ V existiert genau eine von der Wahl von e abhängige Spalte t ve := (v 1 , . . . , v n ) ∈ Rn×1 , sodass n v = e · ve = v i ei . i=1 Die Spalte ve heißt kontravariante Koordinatenspalte von v zur Basis e. Die lineare bijektive Funktion Φe : V → Rn×1 , v → ve heißt kontravariante Karte von V zur Basis e. Es gilt für alle v, w ∈ V v, w = vet · Ge · we . Ist f eine weitere Basis von V und ist M die zugehörige Übergangsmatrix, d.h. es gilt f = e · M, dann folgt für alle v ∈ V vf = M −1 · ve . (3.1) Ist U ⊂ V, dann heißt eine Abbildung f : U → R Skalarfeld auf U. Die Abbildung fe : Φe (U ) → R, für die f (v) = fe(ve) für , alle v ∈ U gilt, heißt Kartenausdruck von −1 , f zur Basis e. Es gilt also fe = f ◦ Φe Φ (U) . e Ist U ⊂ V, dann heißt eine Abbildung X : U → V Vektorfeld auf U. Bisher haben wir nur den Graphen von X als Vektorfeld bezeichnet. Im gegenwärtigen KAPITEL 3. VEKTORANALYSIS 200 Zusammenhang ist es üblich und praktisch, die V -wertigen Abbildungen selbst als Vektorfelder zu bezeichnen. Nach Wahl einer Basis e ist jedem Vektorfeld die Funktion Φe ◦ X : U → Rn×1 zugeordnet. Für sie gilt X = e · Φe ◦ X. Die Skalarfelder Xei := Φie ◦ X : U → R für i = 1, ..., n heißen die Komponentenfunktionen von X. Sind für offenes U ihre Kartenausdrücke alle vom C k -Typ, dann heißt X ein C k -Vektorfeld. Vektorfelder auf U können addiert und mit Skalarfeldern auf U multipliziert werden. Das geschieht punktweise mittels der Vektorraumrechenoperationen gemäß X + Y : U → V, f X : U → V, v → X(v) + Y (v), v → f (v) · X(v). Richtungsableitung Bewegt sich ein (kleiner) Sensor als Funktion der Zeit gemäß einer Kurve γ : I → U durch den Definitionsbereich U eines Skalarfeldes f, dann ist es vielfach von Interesse zu wissen, wie rasch sich die Größe f am Ort γ (t) des Sensors zur Zeit t ändert. Gesucht ist also die Ableitung (f ◦ γ)′ (t) und damit die beste inhomogen lineare Approximation der Funktion ε → f (γ (t + ε)) = a + bε bei ε = 0. Ist die Kurve γ in t ∈ I differenzierbar, wird erstens die Kurve γ selbst in der Nähe von p = γ (t) durch ein hinreichend kleines Stück der Gerade p + R · γ̇ (t) approximiert und zweitens die Funktion f über dem Geradenstück inhomogen linear genähert. Für manche Funktionen f existiert eine beste inhomogen lineare Approximation nur für die einseitig definierte Funktion 0 ≤ ε → f (γ (t + ε)) ≈ f (p + εγ̇ (t)) bei ε = 0. In solchen Fällen liefert die (etwas allgemeinere) Definition der einseitigen Richtungsableitung die gesuchte Approximation. Definition 93 (Richtungsableitung eines Skalarfeldes) Sei U ⊂ V offen und f : U → R. Falls für ein p ∈ U und ein X ∈ V der Grenzwert [X]p f := lim ε↓0 f (p + εX) − f (p) ∈R ε existiert, dann heißt die reelle Zahl [X]p f einseitige Richtungsableitung3 von f in p unter X. Existiert der beidseitige Limes limε→0 (f (p + εX) − f (p)) /ε ∈ R, dann wird er als die Richtungsableitung [X]p f von f im Punkt p unter X ∈ V bezeichnet. Anmerkungen: 1. Zur Definition von [X]p f wird keine Norm von V benötigt. 2. Die einseitige Richtungsableitung [X]p f gibt - falls existent - die beste inhomogen lineare Approximation an die Funktion f auf dem Halbstrahl p+R≥0 ·X (hinreichend nahe) bei p, denn für den ’Fehler’ ψ mit ψ (ε) = f (p + εX) − f (p) − ε [X]p f 3 Der Name ’Richtungsableitung’ ist etwas irreführend, da [X]p f nicht nur von der Richtung des Vektors X abhängt, sondern auch von seinem Betrag. Besser wäre die Bezeichnung ’Geschwindigkeitsableitung’. KAPITEL 3. VEKTORANALYSIS 201 gilt limεց0 ψ (ε) /ε = 0. Für eine Zahl c ∈ R mit c = [X]p f folgt ja für den Fehler ψ c der Approximation f(p + εX) ≈ f(p) + cε im Limes ε ց 0 ψ (ε) + ε [X]p f − εc ψ c (ε) f (p + εX) − f(p) − εc = = → [X]p f − c = 0. ε ε ε In diesem Sinn ist f (p + εX) ≈ f (p) + ε [X]p f die beste inhomogen lineare Approximation an ε → f (p + εX) bei ε = 0 im Bereich ε > 0. Existiert die (beidseitige) Richtungsableitung [X]p f, dann ist f (p + εX) ≈ f (p) + ε [X]p f die beste inhomogen lineare Approximation an ε → f (p + εX) beidseitig um ε = 0. 3. Ist γ : I → U ⊂ V eine differenzierbare Kurve und existiert für ein Skalarfeld f : U → R in p = γ (t) die Richtungsableitung unter X = γ̇ (t) für ein t ∈ I, dann ist ε → f (p) + ε [X]p f auch die beste inhomogen lineare Approximation an die Funktion ε → f (γ (t + ε)) bei ε = 0. 4. Seien auf einer offenen Menge U ⊂ V ein Skalarfeld f und ein Vektorfeld X gegeben. Existieren in jedem Punkt p ∈ U die (einseitigen) Richtungsableitungen [X (p)]p f, dann ist durch die Abbildung [X] f : U → R mit ([X] f) (p) = [X (p)]p f das Skalarfeld der (einseitigen) Richtungsableitungen von f unter X gegeben. 5. Die (einseitige) Richtungsableitung kann auch für Funktionen f : U → W erklärt werden, wenn W irgendein reeller Vektorraum ist. Es kommt ja nur darauf an, dass im Bildraum addiert und mit Skalaren multipliziert werden kann. Die Richtungsableitung ist dann, falls existent, ein Element von W. Satz 94 Besitzen die beiden Skalarfelder f, g : U → R in p die (einseitigen) Richtungsableitungen unter X, dann gilt [X]p (f + g) = [X]p f + [X]p g (Additivität) und die Produktregel [X]p (f · g) = g (p) · [X]p f + f (p) · [X]p g. Beweis. Die Additivität der Richtungsableitung ist aus der Definition klar. Zur Produktregel: es gilt f (p + εX) g (p + εX) − f (p) g (p) ε↓0 ε f (p + εX) g (p + εX) − f (p + εX) g (p) + f (p + εX) g (p) − f (p) g (p) = lim ε↓0 ε [X]p (f · g) = lim = f (p) [X]p g + [X]p f g (p) . Satz 95 Sind zwei Vektoren X, Y ∈ V 0 gleichgerichtet, dh es existiert ein λ > 0 mit Y = λX, dann folgt bei existenter einseitiger Richtungsableitung [X]p f, dass [Y ]p f = λ [X]p f. Existiert die beidseitige(!) Richtungsableitung [X]p f, dann gilt [λX]p f = λ [X]p f für alle λ ∈ R. KAPITEL 3. VEKTORANALYSIS 202 Beweis. Existiert die einseitige Richtungsableitung, dann gilt f (p + εY ) − f (p) f (p + ελX) − f (p) = λ lim ε↓0 ε↓0 ε λε f (p + ηX) − f (p) = λ lim = λ [X]p f. η↓0 η [Y ]p f = lim Existiert die beidseitige Richtungsableitung, dann folgt für λ = 0 f (p + ελX) − f (p) f(p + ελX) − f (p) = λ lim ε→0 ε→0 ε λε f (p + ηX) − f (p) = λ lim = λ [X]p f. η→0 η [λX]p f = lim Für λ = 0 folgt [0 · X]p f = 0 = 0 · [X]p f. Soll das Verhalten von f bei p in verschiedene Richtungen quantitativ bewertet werden, werden die Richtungsableitungen mit Einheitsvektoren gebildet und miteinander verglichen. Dazu 0 muss natürlich erst eine 1Norm in V ausgewählt werden. An der Menge der Zahlen [X]p f : X ∈ V, |X| = 1 lässt sich dann gegebenenfalls ermitteln, in welche Richtung - bei Abwanderung von p - der Wert der Funktion f am stärksten zu- bzw abnimmt. Richtungsableitung der Norm r = |·| Ist r = |·| : V → R durch ein Skalarprodukt von V gemäß r (p) = dann gilt für einen Punkt p = 0 und X ∈ V p, p definiert, r (p + εX)2 − r (p)2 p + εX, p + εX − p, p = = 2 p, X + ε |X|2 . ε ε Es existiert also der Limes ε → 0 und somit die Richtungsableitung [X]p r2 . Sie erfüllt [X]p r2 = 2 p, X . Wegen r (p) = r (p)2 folgt nun mit der Kettenregel , , , , d 1 d 1 p, X 2, 2, [X]p r = r (p + εX) , = r (p + εX) , = [X]p r2 = . dε 2r (p) dε 2 |p| |p| ε=0 ε=0 Für p = 0 funktioniert diese zweistufige Art der Berechnung der Richtungsableitung von r nicht, da die Wurzelfunktion in 0 nicht differenzierbar ist. Wir gehen die Richtungsableitung direkt an. Es gilt für ε > 0 r (0 + εX) − r (0) r (εX) = = |X| . ε ε Für ε < 0 hingegen gilt r (0 + εX) − r (0) r (εX) = = − |X| . ε ε Es existiert also zwar die einseitige Richtungsableitung von r in 0 unter X = 0, nicht aber die beidseitige. Für die einseitige Richtungsableitung gilt [X]0 r = |X| . KAPITEL 3. VEKTORANALYSIS 203 Totales Differential Eine Verschärfung des Differenzierbarkeitsbegriffes, der über die Richtungsableitung hinausgeht, ist möglich, indem nach einer linearen Approximation der Funktion X → f (p + X) − f (p) nicht nur auf einem hinreichend kurzen Geradenstück durch 0, sondern in einer genügend kleinen offenen Umgebung von 0 gefragt wird. Definition 96 (Differential eines Skalarfeldes) Sei f : U → R mit U ⊂ V offen. Existiert für p ∈ U eine lineare Abbildung dp f : V → R, sodass f (p + X) − f (p) − dp f (X) = 0, X→0 |X| lim dann heißt f differenzierbar in p und dp f heißt das (totale) Differential von f in p. Anmerkungen: 1. Diese implizite Definition des Differentials einer in p differenzierbaren Funktion f legt dp f eindeutig fest, denn für eine von dp f verschiedene lineare Funktion L : V → R gilt für den Fehler der Approximation X → f (p) + L (X) von X → f (p + X) auf einer hinreichend kleinen Umgebung U0 von 0 ∈ V ψ L (X) f (p + X) − (f (p) + L (X)) |X| f (p + X) − f (p) − dp f (X) (dp f − L) (X) + = |X| |X| : = und dieser Ausdruck konvergiert für X → 0 nicht gegen 0. Das Differential gibt also die beste lineare Approximation an die Funktion f im Punkt p, weil sie die einzige ist, deren Fehler ψ so rasch gegen 0 geht, dass limX→0 ψ (X) / |X| = 0 folgt. 2. Das Differential einer Funktion f in einem Punkt p ist also keine „infinitesimale” Größe, sondern eine lineare Abbildung. Die Vorstellung vom Differential als kleine Zahl rührt von der Tatsache her, dass dp f (X) in der Regel nur für hinreichend kleine X die Differenz f (p + X) − f (p) gut nähert. Und für kleine X ist natürlich auch dp f (X) klein. 3. Die Definition des Differentials eines Skalarfeldes macht Gebrauch von einer Norm von V. Da jedoch alle Normen eines endlichdimensionalen Vektorraums zueinander äquivalent4 sind, ergeben alle Normen dasselbe Differential. 4. Ist f : U → R in p ∈ U differenzierbar, dann liefert das Differential von f in p alle seine Richtungsableitungen in p. Aus der Linearität von dp f folgt nämlich 4 Zwei Normen |·|1 und |·|2 heißen äquivalent, wenn zwei positive reelle Zahlen c1 , c2 existieren, sodass für alle v ∈ V gilt, dass |v|1 ≤ c1 |v|2 und |v|2 ≤ c2 |v|1 . KAPITEL 3. VEKTORANALYSIS 204 f (εX) f (εX) für X ∈ V und ε = 0, dass dp f (X) = |X| dpε|X| = sgn (ε) |X| dp|εX| . Daraus folgt weiter dp f (εX) f(p + εX) − f(p) = |X| lim sgn (ε) ε→0 |εX| |εX| f(p + εX) − f (p) = lim = [X]p f. ε→0 ε dp f (X) = |X| lim sgn (ε) ε→0 5. Ist f überall differenzierbar, dann heißt die Abbildung df : U → Hom (V : R) mit p → dp f das Differential von f. Hier bezeichnet Hom (V : R) die Menge aller linearen Abbildungen von V nach R, also den Vektorraum der ’Linearformen’ von V. 6. Das analog definierte Differential existiert für Funktionen f : U → W, wenn W irgendein reeller Vektorraum ist. Skalarfelder können punktweise addiert und multipliziert werden. Diesbezüglich gibt es wieder einfache aber umso nützlichere Regeln. Satz 97 Seien f, g : U → R (mit U ⊂ V offen) in p ∈ U differenzierbar und λ ∈ R. Dann gilt dp (λf + g) (X) = λdp f (X) + dp g (X) (Linearität) und die Produktregel dp (f · g) (X) = g (p) · dp f (X) + f (p) · dp g (X) für alle X ∈ V. 3.1.2 Beispiele zum Differential Differential einer konstanten Funktion Sei f : V → R konstant. Dann gilt f (p + X) − f (p) = 0 und daher f (p + X) − f (p) − 0 = 0. X→0 |X| lim Somit gilt dp f (X) = 0 für alle p, X ∈ V. Differential einer Linearform Das einfachste Beispiel nach den konstanten Funktionen liefert eine lineare Funktion f : V → R. Es gilt für p, X ∈ V f (p + X) − f (p) − f (X) = 0. |X| Die Abbildung f ist somit differenzierbar und es gilt dp f (X) = f (X) für alle p, X ∈ V. Beispielsweise folgt für f : V → R mit f (p) = k, p , wobei ·, · ein Skalarprodukt von V und k ∈ V ein fest gewählter Vektor ist, dp f (X) = k, X . KAPITEL 3. VEKTORANALYSIS 205 Differential und Kettenregel Etwas allgemeiner ergibt sich für h : V → R mit h (p) = k, p n und n ∈ Z das Differential dp h mit der Kettenregel. Sie besagt für die Hintereinanderausführung h = g ◦ f zweier differenzierbarer Funktionen f : V → R und g : R → R dass für alle X ∈ V dp h (X) = df (p) g (dp f (X)) = g ′ (f (p)) · dp f (X) . Im vorliegenden Fall setzen wir f (p) = k, p für alle p ∈ V und g (x) = xn für alle x ∈ R. Dann ergibt die Kettenregel dp h (X) = n k, p n−1 k, X für alle X ∈ V. Differential eines Normquadrats Für f : V → R mit f (p) = p, p = |p|2 gilt f(p + h) = p + X, p + X = p, p + 2 p, X + X, X und somit f (p + X) − f (p) − 2 p, X X, X = lim = lim |X| = 0. X→0 X→0 |X| X→0 |X| lim Ein Skalarprodukt ist bilinear. Daher ist die Abbildung von V nach R mit X → 2 p, X linear und es gilt dp |·|2 (X) = 2 p, X für alle X ∈ V. Differential einer quadratischen Form Sei A : V → V linear und symmetrisch bezüglich des Skalarprodukts ·, · von V. Dann gilt für die Abbildung f : V → R mit f (p) = p, Ap f (p + X) − f (p) = p, AX + X, Ap + X, AX = 2 p, AX + X, AX . Daraus folgt f (p + X) − f (p) − 2 p, AX = 0. X→0 |X| Somit ist die Funktion f, eine sogenannte quadratische Form, überall differenzierbar und es gilt dp f (X) = 2 p, AX für alle X ∈ V. lim Differential einer Norm Sei r := |·| mit |p| = p, p . An der Stelle p = 0 gilt für ε > 0 und X ∈ V r(0 + εX) − r(0) ε |X| − 0 = = |X| = [X]0 r. ε ε Alle einseitigen Richtungsableitungen von r existieren also an der Stelle p = 0. Aber die Abbildung X → [X]0 r = |X| ist nicht linear. Wäre sie das, müsste |−X| = − |X| gelten, was für X = 0 im Widerspruch zu 0 < |X| = |−X| steht. Somit ist r in 0 nicht differenzierbar. Dass r an einer Stelle p = 0 differenzierbar ist, folgt aus der Differenzierbarkeit der Wurzelfunktion auf R>0 . Es gilt nach der Kettenregel √ 1 1 dp r 2 = · 2 p, · , dp r = dp · ◦ r2 = 2 |p| 2 r2 (p) KAPITEL 3. VEKTORANALYSIS 206 also dp r (X) = p/ |p| , X für alle p ∈ V 0 und für alle X ∈ V. (3.2) Richtungsableitung der Norm unter Drehvektorfeld Schließlich soll noch für einen dreidimensionalen, orientierten Vektorraum V das skalare Feld der Richtungsableitungen von r = |·| mit dem Drehvektorfeld zur Achsenrichtung n L : V → V, p → n × p berechnet werden. Dabei gehört die Norm r zu jenem Skalarprodukt von V, das zur Bildung des Vektorproduktes benutzt wird. Für p = 0 kann der Vektor L(p) in das Differential dp r eingesetzt werden. Dies ergibt [L]p r = (dp r) (n × p) = 1 p, n × p = 0. |p| Für p = 0 steht kein Differential von r zur Verfügung und es ist die Definition 93 der Richtungsableitung zu verwenden. Wegen L(0) = 0 folgt also auch [L]0 r = 0. Das Faktum [L]p r = 0 für alle p ∈ V signalisiert die Drehinvarianz der Funktion r, denn es bewirkt, dass die Integralkurven von L in den Niveauflächen von r verlaufen, dass also r auf zwei Punkten, die auseinander durch Drehen hervorgehen, denselben Wert hat. 3.1.3 Skalarpotential eines Punktdipols Die elektrische Potentialfunktion eines Punktdipols entsteht aus der einer Punktladung durch die Bildung einer Richtungsableitung. Und zwar so: Eine im Ort X ∈ V ruhende Punktladung der Stärke q ∈ R trägt für dim V = 3 das elektrische Potentialfeld ΦX : V X → R mit ΦX (p) = q 1 . · 4πε0 |p − X| Befindet sich zusätzlich eine Punktladung −q am Ort 0, dann addieren sich die beiden Potentialfunktionen zum Gesamtpotential, das in p ∈ V {0, X} den Wert ΦX (p) − Φ0 (p) = Φ0 (p − X) − Φ0 (p) = − (dp Φ0 ) (X) + Ψp (X) hat, wobei der Fehler Ψp (X) der Tangentialapproximation für X → 0 so rasch gegen 0 strebt, dass limX→0 Ψp (X) / |X| = 0. Mit dp r−1 = − |p|−3 p, · folgt − (dp Φ0 ) (X) = − [X]p Φ0 = q p, X 1 qX, p . 3 = 4πε0 |p| 4πε0 |p|3 Der Vektor δ = qX ∈ V heißt Dipolmoment der beiden Punktladungen und D0 : V 0 → R mit D0 (p) = − [δ]p 1 1 · 4πε0 |·| = 1 δ, p 4πε0 |p|3 KAPITEL 3. VEKTORANALYSIS 207 heißt Potentialfunktion eines (fiktiven) Punktdipols im Ort 0 mit Dipolmoment δ. Aber D0 ≈ ΦX − Φ0 gilt nur im Bereich |p| ≫ |X| . Sitzt ein Punktdipol in einem beliebigen Ort X, dann trägt er das Potential DX mit DX (p) = D0 (p − X) . Vielfach ist von einem realen Dipol weder q noch X bekannt, sondern lediglich der Vektor δ. Für das Dipolmoment eines HF-Moleküls etwa gilt |δ| = 6 · 10−30 C m, wobei aber das HF-Molekül nicht als neutrales Paar von zwei ruhenden Punktladungen verstanden wird und es die Größen q und X im HF-Molekül gar nicht zu geben scheint. Eher stimmt das Bild einer stetigen auf kleinem Raum lokalisierten Ladungsdichte, deren Potential weit weg vom Molekül durch D0 approximiert wird. 3.1.4 *Lineare Richtungsableitungen ohne D’barkeit Eine Funktion, deren Richtungsableitungen in 0 alle gleich 0 sind, die aber trotzdem in 0 nicht differenzierbar ist, ist die folgende: Seien f : V → R und e = (e1 , e2 ) eine Basis von V mit f (x · e1 + y · e2 ) = x3 y für x2 + y 2 > 0 und f (0) = 0. x4 + y 2 Dann gilt für X = cos α · e1 + sin α · e2 und ε > 0 f (εX) − f (0) ε cos3 α sin α = 2 → 0 für ε ց 0. ε ε cos4 α + sin2 α Alle Richtungsableitungen von f in 0 existieren und haben den Wert 0. Die Abbildung V ∋ X → [X]0 f ist also linear. Ist f in 0 auch differenzierbar? Dazu müsste limp→0 (f (p) − f (0)) / |p| = 0 für irgendeine5 beliebige Norm |·| von V gelten, da ja alle Richtungsableitungen in 0 verschwinden. Wegen f (0) = 0 ist also der Grenzwert limp→0 f (p) / |p| zu untersuchen. Sei also |·| die Norm zu jenem Skalarprodukt, das die Basis e zu einer ONB macht. Dann gilt f (x · e1 + y · e2 ) x3 y = . |x · e1 + y · e2 | (x4 + y 2 ) x2 + y 2 Wir werten nun f längs der C 1 -Kurve γ : [0, 1] → V mit γ (t) = t · e1 + t2 · e2 aus, setzen also x = t und y = t2 . Dies ergibt f (0 + γ (t)) − f (0) t3 t2 t5 1 1 √ √ = = = √ → für t → 0. 4 4 2 4 5 2 2 |γ (t)| 2 (t + t ) t + t 2t 1 + t 2 1+t Somit ist f in 0 nicht differenzierbar. 5 Gilt dies für eine Norm, dann gilt es auch für jede andere, da ja alle Normen eines endlichdimensionalen Vektorraumes zueinander äquivalent sind. KAPITEL 3. VEKTORANALYSIS 3.1.5 208 Partielle Ableitungen Sei U ⊂ V offen und f : U → R. Sei e eine Basis von V. Für p ∈ U existiere der Grenzwert limε→0 (f (p + εei ) − f (p)) /ε. Es gilt dann (f (p + εei ) − f (p)) = [ei ]p f = − [−ei ]p f. ε→0 ε Sei fe der Kartenausdruck von f zur Basis e. Dann folgt mit der Standardbasis δ von Rn×1 fe (pe + εδ i ) − fe (pe ) ∂fe [ei ]p f = lim (pe ). = ε→0 ε ∂xi Die Richtungsableitung [ei ]p f von f in p unter dem Basisvektor ei stimmt also mit der i-ten partiellen Ableitung des Kartenausdrucks fe von f zur Basis e im Punkt pe überein. Daher wird unter den vorliegenden Umständen das Skalarfeld p → [ei ]p f auf U kurz als die i-te partielle Ableitung ∂ie f von f bezüglich der Basis e bezeichnet lim ∂fe ∂xi e ∂i f := ◦ Φe |U = [ei ] f. Zur Berechnung des Skalarfeldes [ei ] f durch partielles Differenzieren wird also der Koordinatenausdruck von f zur Basis e benötigt. Ein Skalarfeld f : U → R sei in jedem Punkt p ∈ U ⊂ V differenzierbar. Dann kann mit einem Vektorfeld X : U → V das Skalarfeld [X] f : U → R gebildet werden, das einem Punkt p die Richtungsableitung von f an der Stelle p unter dem Vektor X(p) zuordnet. Sein Wert an der Stelle p ∈ U wird mit [X]p f := [X(p)]p f bezeichnet. In den Koordinaten zur Basis e gilt n n ei Φie [X]p f = dp f i=1 (X (p)) n Φie (X = (p)) dp f (ei ) = i=1 i=1 Φie ◦ X · ∂ie f (p) . Ein nützliches Kriterium für die Differenzierbarkeit eines Skalarfeldes in Termen der partiellen Ableitungen gibt der folgende Satz. (§6, Satz 2, p 47 in [6]) Satz 98 Sei U ⊂ V offen und e eine Basis von V . Der Koordinatenausdruck fe von f : U → R sei überall partiell differenzierbar. Die partiellen Ableitungen ∂fe (x1 , ..., xn ) seien stetig im Punkt p ∈ U. Dann ist f in p differenzierbar. ∂xi 3.1.6 Beispiele zur partiellen Ableitung Richtungsableitung unter Drehvektorfeld Nun soll die Berechnung der Richtungsableitung der Norm mit dem Drehvektorfeld unter Verwendung von Koordinaten zur Standardbasis e von V = R3×1 wiederholt werden. Es gilt r = re (x1 , x2 , x3 ) = (x1 )2 + (x2 )2 + (x3 )2 . Das Drehvektorfeld t L : p → n × p ist für n = (n1 , n2 , n3 ) durch 2 3 n x − n3 x2 L = n3 x1 − n1 x3 =: n1 x2 − n2 x1 3 i=1 Li x1 , x2 , x3 · ei KAPITEL 3. VEKTORANALYSIS 209 gegeben. Für die partiellen Ableitungen von r gilt auf V ∂ie r = xi ∂re 1 2 3 x ,x ,x = ∂xi (x1 )2 + (x2 )2 + (x3 )2 Damit folgt für das Skalarfeld [L] r auf V 3 Li [L] r = i=1 ∂re ∂xi 0 = xi . r 0, dass (x1 , x2 , x3 ) 1 1 2 3 = x n x − n3 x2 + x2 n3 x1 − n1 x3 + x3 n1 x2 − n2 x1 r = 0. Partielle DGen und Vektorfelder Seien auf U = (R 0)×R das Skalarfeld f = y/x und das Vektorfeld Y = (2x, −3y) gegeben. Dann gilt [Y ] f = 2x∂x xy − 3y∂y xy = −2xy/x2 − 3y/x = −5y/x. Man sagt: f ist Lösung der „partiellen Differentialgleichung“ [Y ] f + 5f = 0. Vektorfelder induzieren also nicht nur Systeme von gewöhnlichen Differentialgleichungen sondern auch partielle Differentialgleichungen (beide erster Ordnung). Partielle Ableitungen ohne D’barkeit Seien f : V → R und e = (e1 , e2 ) eine Basis von V mit f (0) = 0 und f (x · e1 + y · e2 ) = x2 xy für x2 + y 2 > 0. + y2 Es folgt f (y · e2 ) = f (x · e1 ) = 0 für alle x, y ∈ R. Daher gilt ∂1e f (0) = ∂2e f (0) = 0. Für α ∈ R und r > 0 folgt fe (r cos α, r sin α) = cos α sin α = sin (2α) /2. Auf jeder noch so kleinen Kreisscheibe um 0 nimmt somit f jeden Wert zwischen −1/2 und 1/2 an. Daher ist f in 0 unstetig und nicht differenzierbar. Die Richtungsableitung von f in 0 mit X = cos α · e1 + sin α · e2 existiert für 0 < α < π/2 nicht, da für alle ε>0 f (εX) − f (0) sin (2α) = ε 2ε für ε ց 0 nach ∞ divergiert. Also gilt: die partiellen Ableitungen (∂ie f ) (0) existieren, nicht aber die Richtungsableitung [X]0 f unter X = x · e1 + y · e2 mit x · y = 0. 3.1.7 Gradient Das Differential einer differenzierbaren Funktion f : V ⊃ U → R im Punkt p ∈ U ist eine lineare Abbildung von V nach R, eine sogenannte Linearform. Das folgende Lemma hält fest, dass sich jede Linearform auf V als Skalarprodukt mit einem geeigneten Vektor in V darstellen lässt. Damit ist über die Darstellung des Differentials eines Skalarfeldes als Skalarprodukt der Weg zur Definition des Gradienten geebnet. KAPITEL 3. VEKTORANALYSIS 210 Lemma 99 Seien e = (e1 , . . . en ) eine Basis und ·, · ein Skalarprodukt von V. n i Zu jeder Linearform L : V → R existiert genau ein Vektor l = i=1 l ei ∈ V, sodass L(X) = l, X für alle X ∈ V gilt. Die Koordinaten li von l bezüglich e sind ij durch li = nj=1 G−1 L (ej ) gegeben. Dabei bezeichnet G−1 e e die inverse Matrix der Gramschen Matrix Ge zur Basis e und zum Skalarprodukt ·, · . Beweis. Zur Eindeutigkeit: Angenommen es gibt zwei Vektoren l1 , l2 ∈ V, für die l1 , X = L(X) und l2 , X = L(X) für alle X ∈ V. Dann wäre l1 − l2 , X = 0 für alle X ∈ V die Folge. Für X = l1 − l2 folgt daraus |l1 − l2 |2 = 0, also l1 = l2 . Wie lässt sich l bestimmen? Sei e = (e1 , . . . en ) eine Basis und l = ni=1 li ei . Dann ist L(X) = l, X für alle X ∈ V genau dann erfüllt, wenn n n i L (ej ) = l, ej = li (Ge )ij l ei , ej = i=1 i=1 für alle j ∈ {1, . . . n} gilt. Wegen6 det Ge = 0 ist die Matrix Ge invertierbar und es n i −1 ij folgt mit ihrer als G−1 L (ej ) . e notierten inversen Matrix l = j=1 Ge Die Darstellung einer beliebigen Linearform L : V → R als Skalarprodukt L = l, · mit einem eindeutig durch L und ·, · bestimmten Vektor l ∈ V ermöglicht nun die folgende Definition des Gradienten. Definition 100 (Gradient) Sei U ⊂ V offen und f : U → R sei differenzierbar in p ∈ U. Dann heißt der Vektor gradp (f ) ∈ V mit & ' gradp (f) , X = [X]p f = dp f (X) für alle X ∈ V Gradient von f im Punkt p. Ist f überall differenzierbar, dann heißt das Vektorfeld grad (f ) : U → V, p → gradp (f) das Gradientenfeld von f. Die hier getroffene koordinatenfreie Definition des Gradienten enthält die Wahl eines Skalarproduktes. Ein und dieselbe Funktion f hat also je nach Skalarprodukt einen anderen Gradientenvektor in p. Die Definition des Differentials dp f hingegen macht keinen Gebrauch von der Wahl eines Skalarprodukts und ist daher weniger stark von zusätzlichen Strukturen auf V beeinflusst. Gradient einer Linearform Sei g : V → R mit g (p) = k, p für ein k ∈ V. Wegen dp g (X) = k, X gilt somit gradp (g) = k für alle p ∈ V. Gradient einer quadratischen Form Sei A : V → V linear und symmetrisch bezüglich des Skalarprodukts ·, · von V. Dann hat die quadratische Form f : V → R mit f (p) = p, Ap an der Stelle p ∈ V das Differential dp f : X → 2 p, AX = 2 Ap, X . Somit folgt gradp f = 2Ap. 6 Aus det Ge = 0 würde folgen, dass Ge den Eigenwert 0 hat. Dies steht im Widerspruch zur Eigenschaft der Nichtausgeartetheit des Skalarproduktes, die besagt, dass v, w = 0 für alle w ∈ V nur dann gilt, wenn v = 0. KAPITEL 3. VEKTORANALYSIS 211 Geometrische Bedeutung des Gradienten Sei f ein in p differenzierbares Skalarfeld. Für gradp (f ) = 0 und X ∈ V dann genau ein θ ∈ [0, π] mit , , & ' [X]p f = gradp (f ) , X = |X| ,gradp (f ), cos θ. 0 existiert (θ wird als der ungerichtete Winkel zwischen den Vektoren grad, p (f ) und X bezeich, , net.) Daraus folgt max {Xp [f ] | X ∈ V, |X| = 1} = gradp (f ), . Das Maximum der Richtungsableitungen Xp [f ] für X ∈ V mit |X| = 1 wird also genau dann angenom,−1 , men, wenn X = ,gradp (f ), gradp (f ) . Ein von 0 verschiedener Gradientenvektor gradp (f ) gibt somit am Punkt p jene Richtung in V an, in welche die Funktion f am stärksten zunimmt.7 Nimmt die Funktion f um p in keine Richtung zu, dann gilt gradp (f ) = 0. Der Punkt p wird dann als kritischer Punkt von f bezeichnet. Eine Kurve γ : (−ε, ε) → U ⊂ V sei differenzierbar in 0 und es gelte γ(0) = p. Weiter sei f (γ(t)) = f (p) für alle t ∈ (−ε, ε) . Die Kurve γ nimmt also nur Werte auf jener Niveaumenge von f an, in der p liegt, also in {q ∈ U | f (q) = f(p)} . Aus der Konstanz von f ◦ γ folgt , , & ' d (f ◦ γ),, = dp f (γ̇ (0)) = gradp (f) , γ̇(0) . 0= dt t=0 Der Gradientenvektor gradp (f ) steht somit senkrecht auf die Tangentenvektoren der Niveaumenge von f im Punkt p. Gradient der Norm √ Sei f : V → R, mit f (p) = p, p und r = |·| = f . Dann gilt dp f = 2 p, · , woraus gradp (f ) = 2p folgt. Analog ergibt sich aus dp r = p/ |p| , · , dass gradp (r) = p/ |p| für p ∈ V 0. Beide Vektorfelder sind in p = 0 radial nach außen gerichtet und stehen in p senkrecht auf die Niveaufläche von f, eine Sphäre um 0 mit dem Radius r(p). Wir fassen als Funktionsgleichungen auf V 0 zusammen: grad r2 = 2ιd und grad (r) = 3.1.8 ιd . r *Kräftefreie relativistische Bewegung Zur Illustration des Gradienten eignet sich die relativistische Mechanik eines kräftefreien Massenpunktes. Seine Lagrangefunktion spezialisiert sich durch Wahl eines Inertialsystems zu L : V × Kc → R mit L (x, v) = −mc2 7 1 − |v/c|2 . Die Sphäre der Vektoren X mit |X| = 1 hängt vom benützten Skalarprodukt ab, und damit auch die Richtung von gradp (f ) . Die Aussage, dass der Gradient in die Richtung der stärksten Änderung weist, täuscht daher eine Unabhängigkeit vom Skalarprodukt bloß vor. KAPITEL 3. VEKTORANALYSIS 212 Man beachte, dass −mc2 1 − |v/c|2 = −mc2 + m 2 |v| + O |v/c|4 für v/c → 0. 2 Dabei bezeichnet V einen reellen Vektorraum, ·, · ein Skalarprodukt von V mit √ Abbildung 3.1: − 1 − x2 (rot) und Taylorpolynom −1 + x2 /2 zugehöriger Norm |·| und Kc ⊂ V die offene Kugel um 0 mit Radius c für eine reelle positive Konstante c, die Lichtgeschwindigkeit. L ist also im ersten Argument, dem Ort, konstant. Die Euler-Lagrangegleichung zu L für eine C 2 -Kurve γ : I → V mit |γ̇| < c ist d gradγ̇(t) L (γ (t) , ·) = 0. dt (3.3) Es bietet sich nun an, die Funktion f : Kc → R mit L (x, v) = −mcf (v) zu benützen. Das Gradientenfeld von f = c2 − |·|2 > 0 erfüllt für alle v ∈ Kc gradv (f ) = −gradv |·|2 2 c2 − |v|2 = −v . f (v) Gleichung (3.3) besagt also, dass mc d dt γ̇ (t) f (γ̇ (t)) = 0. Es gilt nach Quotienten- und Kettenregel γ̈ (t) f (γ̇ (t)) − γ̇ (t) [γ̈ (t)]γ̇(t) (f) d γ̇ (t) = dt f (γ̇ (t)) f (γ̇ (t))2 = γ̈ (t) f (γ̇ (t)) + γ̇ (t) γ̈ (t) , γ̇ (t) /f (γ̇ (t)) f (γ̇ (t))2 γ̈ (t) + γ̈ (t) , γ̇ (t) γ̇ (t) = . f (γ̇ (t))2 f (γ̇ (t))3 Gleichung (3.3) ist daher äquivalent zu f (γ̇ (t))2 γ̈ (t) + γ̈ (t) , γ̇ (t) γ̇ (t) = 0. (3.4) KAPITEL 3. VEKTORANALYSIS 213 Bildung des Skalarproduktes von Gleichung (3.4) mit γ̇ (t) ergibt f (γ̇ (t))2 + |γ̇ (t)|2 γ̈ (t) , γ̇ (t) = c2 γ̈ (t) , γ̇ (t) = 0, also γ̈ (t) , γ̇ (t) = 0. Berücksichtigung dieser Tatsache in Gleichung (3.4) ergibt schließlich γ̈ (t) = 0. Die maximalen Lösungen dieser Gleichung sind γ : R → V mit γ (t) = x0 + v0 t für ein x0 ∈ V und ein v0 ∈ Kc . Wie im newtonschen Fall kann sich ein freies Teilchen nur mit konstanter Geschwindigkeit bewegen. Neu ist die Beschränkung der Geschwindigkeit v0 durch |v0 | < c. Die Hamiltonfunktion H zu L ist (im gegenwärtigen Kontext!) definiert durch mv H (x, p (x, v)) = p (x, v) , v − L (x, v) und p (x, v) = gradv L (x, ·) = . 2 2 1 − |v| /c Daraus folgt erstens Einsteins Beziehung zwischen Energie und Geschwindigkeit H (x, p (x, v)) = mc |v|2 c2 − |v|2 + mc c2 − |v|2 = mit der Niederenergieasymptote mc2 1 − |v/c|2 = mc2 + m 2 v +O 2 v c 4 mc2 1 − |v/c|2 für v/c → 0. Weiters folgt, da die Abbildung p (x, ·) : Kc → V bijektiv ist, für die Hamiltonfunktion H : V × V → R eines kräftefreien relativistischen Massenpunkts H (x, p) = c m2 c2 + |p|2 . Dies ist so zu sehen: c m2 c2 + |p|2 = c m2 c2 + m2 |v|2 =c 1 − |v/c|2 m2 c2 1 − |v|2 /c2 + m2 |v|2 1 − |v/c|2 = mc2 2 . 1 − |v/c| Hier noch die Inversion der relativistischen Abbildung von Geschwindigkeit auf Impuls. Lemma 101 Sei V ein endlichdimensionaler Vektorraum mit Norm |·| und seien m, c ∈ R>0 . Für zwei Vektoren v, p ∈ V gilt p = mv/ 1 − |v/c|2 ⇐⇒ v = p/ m2 + |p/c|2 . Beweis. Aus p = mv/ 1 − |v/c|2 folgt |p|2 1 − |v/c|2 = m2 |v|2 und weiter |p|2 = |v|2 m2 + |p/c|2 , also |v|2 = |p|2 / m2 + |p/c|2 . Aus v = (p/m) 1 − |v/c|2 ergibt sich damit / , v ,2 p p |p/c|2 p m2 p , , v= 1−, , = 1− = = . 2 2 m c m m m2 + |p/c| 2 m2 + |p/c| 2 m + |p/c| Der Umkehrschluss geht völlig analog. KAPITEL 3. VEKTORANALYSIS 3.1.9 214 *Konstante relativistische Kraft Die Lagrangefunktion L : V × Kc → R eines relativistischen Teilchens in einem vorgegeben (im gewählten Inertialsystem zeitlich konstanten) Kraftfeld mit Potential Φ erfüllt L (x, v) = −mc c2 − |v|2 − Φ (x) . Die zugehörige Eeuler-Lagrangegleichung ist mγ̇ (t) d dt 2 1 − |γ̇ (t) /c| (3.5) = −gradγ(t) Φ. Der Zusammenhang zwischen Geschwindigkeit und Impuls ist dann wie im Fall Φ = 0. Die zugehörige Hamiltonfunktion H : V × V → R erfüllt H (x, p) = c m2 c2 + |p|2 + Φ (x) . Lösungen der Hamiltonschen Bewegungsgleichung verlaufen innerhalb einer Niveaufläche von H. Daher ist auch die Energie , , 2 , mc E [γ] := + Φ (x),, , 1 − |v/c|2 x=γ(t),v=γ̇(t) einer Lösung γ der Euler-Lagrangegleichung (3.5) unabhängig von t. Sei nun Φ für ein g ∈ V durch die Linearform Φ : V → R mit Φ (x) = −m g, x gegeben. Es gilt also L (x, v) = −mc c2 − |v|2 + m g, x . Die zugehörige Euler-Lagrangegleichung ist d dt mγ̇ (t) 1 − |γ̇ (t) /c|2 (3.6) = mg. Ist γ : I → V eine Lösung dieser Bewegungsgleichung, dann existiert ein Vektor v0 ∈ V, sodass γ̇ (t) = gt + v0 für alle t ∈ I. (3.7) 1 − |γ̇ (t) /c|2 Daraus folgt nun, dass eine differenzierbare Funktion λ : I → R>0 mit γ̇ (t) = λ (t) (gt + v0 ) für alle t ∈ I existiert. Gleichung (3.7) ist genau dann erfüllt, wenn λ (t) 1− 0| λ (t)2 |gt+v c2 2 1 = 1 bzw λ (t) = 1+ |gt+v0 |2 c2 für alle t ∈ I. KAPITEL 3. VEKTORANALYSIS 215 Für die Geschwindigkeit einer Lösung γ : I → V gilt somit γ̇ (t) = gt + v0 1+ |gt+v0 |2 c2 für alle t ∈ I. Man beachte, dass daraus |γ̇ (t)| < c und limt→±∞ |γ̇ (t)| = c folgt. Der Impuls des Teilchens wächst also unbeschränkt in der Zeit an, nicht aber die Geschwindigkeit. Ihr Betrag ist durch c begrenzt. Der Vektor v0 stimmt nicht mit der Geschwindigkeit zur Zeit t = 0 überein, vielmehr gibt mv0 den Impuls zur Zeit t = 0 an. Die maximalen Lösungen der Euler-Lagrangegleichung (3.6) sind somit die Kurven γ : R → V mit t 0 t s γ (t) = x0 + g 1+ |gs+v0 | c2 ds + v0 2 0 ds 1+ |gs+v0 |2 c2 für beliebige Vektoren x0 , v0 ∈ V. Für die maximalen Lösungen zur Anfangsvorgabe v0 = 0 folgt somit t γ (t) = x0 + g 0 s 1+ |g|2 2 s c2 ds. Diese Kurve erfüllt γ (−t) = γ (t) und ihre Bildmenge ist der Halbstrahl x0 + R≥0 · g. Mit der Substitution u = |g| s/c ergibt sich γ (t) für g = 0 zu γ (t) = x0 + g c2 |g|2 |g|t/c c2 u d√ √ du = x + g 1 + u2 du 0 2 du 1 + u2 |g| 0 0 * + c2 2 = x0 + g 2 1 + |tg/c| − 1 . |g| |g|t/c 2 c Für den Abstand zwischen γ (t) und dem Punkt X = x0 − g |g| 2 gilt daher |γ (t) − X| = c2 / |g| 1 + |tg/c|2 . Daraus ergibt sich für die Weltlinie {(ct, γ (t)) : t ∈ R} ⊂ R × V die Hyperbelgleichung |γ (t) − X|2 − c2 t2 = c4 / |g|2 . 3.1.10 *Relativistischer harmonischer Oszillator Die Potentialfunktion Φ : R → R eines harmonischen Oszillators erfüllt Φ (x) = kx2 /2 für ein k ∈ R>0 . Die Menge aller maximalen Lösungen der Bewegungsgleichung eines nichtrelativistischen harmonischen Oszillators mit der Masse m > 0 und der Federkonstante k > 0 umfasst bekanntlich die Funktionen xA,B : R → R mit xA,B (t) = A cos (ωt) + B sin (ωt) für A, B ∈ R und ω = k/m. Jede Lösung ist ein Vielfaches eines Translats von x1,0 . Der relativistische Fall hat eine weit weniger durchsichtige Lösungsmenge. KAPITEL 3. VEKTORANALYSIS 216 Versuchen wir daher wenigstens teilweise Einsichten in die maximalen Lösungen der (nichtlinearen!) Bewegungsgleichung des relativistischen harmonischen Oszillators zu gewinnen. Zunächst ist es praktisch, den Parameter k durch mω 2 zu ersetzen, was natürlich nur eine Umbenennung und nichts weiter sonst ist. Dann fällt nämlich - ähnlich dem nichtrelativistischen Fall - die Masse auch aus der relativistischen Bewegungsgleichung heraus. Es wird sich herausstellen, dass die maximalen Lösungen dieser Bewegungsgleichung ebenfalls periodisch sind. Die kleinste Periode einer maximalen Lösung, also ihre Schwingungsdauer, ist allerdings, anders als beim nichtrelativistischen Oszillator, abhängig von der Schwingungsamplitude, mit der sie streng monoton wächst. Die Zeit T = 2π/ω tritt nur als Grenzwert der Schwingungsdauer für gegen 0 strebende Amplitude auf. Die Lagrangefunktion sei also für m, ω ∈ R>0 durch L : R × (−c, c) → R mit L (x, v) = −mc2 1 − (v/c)2 − mω 2 2 x = −mc2 2 1 − (v/c)2 + 1 ω x 2 c 2 . (3.8) gegeben. Man beachte, dass v/c und ωx/c physikalisch dimensionslos sind, dh ihre Zahlenwerte sind invariant unter beliebigen Änderungen von Längen-, Zeit- und Masseneinheit. Die zu L gehörige Hamiltonfunktion H ist H : R × R → R mit H (x, p) = c (mc)2 + p2 + mω 2 2 x = mc2 2 1 + (p/mc)2 + 1 ω x 2 c 2 . Das zu H gehörige Phasenraumgeschwindigkeitsfeld XH = (∂p H, −∂x H) erfüllt p/m , −mω 2 x . XH (x, p) = 1 + (p/mc)2 Aus (ẋ, ṗ) = X (x, p) folgt die Phasenraumbewegungsgleichung (in dimensionslosen aber nichtkanonischen Phasenraumkoordinaten ωx/c und p/mc) d ω x =ω dt c p/mc 1 + (p/mc)2 und d p ω = −ω x . dt mc c Eine Phasenraumkurve γ = (x, p) : I → R2 erfüllt somit genau dann γ̇ = XH ◦ γ, wenn die zugeordnete dimensionslose Kurve ω p (t) x (t) , c mc √ das System erster Ordnung η̇ = Y ◦ η mit Y (a, b) = b/ 1 + b2 , −a löst. Daraus folgt für η 2 =: ξ die DG zweiter Ordnung η : ω · I → R2 mit η (t) = η 1 (ωt) , η2 (ωt) = d2 ξ (t) = − dt2 ξ (t) 1 + ξ (t) 2 . (3.9) KAPITEL 3. VEKTORANALYSIS 217 Gleichung (3.9) ist die Bewegungsgleichung eines (nichtlinearen) 1-dimensionalen √ 2 , da ja V ′ (x) = Oszillators im (asymptotisch linearen) Potential V (x) = 1 + x √ x/ 1 + x2 . Für ihre Lösungen gilt der Erhaltungssatz 2 ξ̇ + 2 d dt 1 + ξ2 = 0. Für jede Lösung existiert somit eine Zahl ε > 1, sodass 2 ξ̇ + 2 1 + ξ 2 = ε. Daraus folgt für eine Lösung ξ : I → R mit ξ̇ (0) > 0 und ξ (0) = 0, / √ ξ̇ (t) = 2 ε − 1 + ξ (t)2 für alle t ∈ I. Für kleinen Impulsbetrag kann H approximiert werden gemäß H (x, p) = mc2 1 + 1 p 2 mc 2 + 1 ω x 2 c 2 p mc +O 4 für p/mc → 0. Dementsprechend ist die Newtonsche Asymptote Hnr : R × R → R von H durch Hnr (x, p) = mc2 1 + 1 p 2 mc 2 + 1 ω x 2 c 2 = mc2 + p2 mω 2 x2 + 2m 2 gegeben. Fig. (3.2) zeigt die Niveaulinien von H (rot) und Hnr (grün) mit H = 2mc2 = Hnr mit x in Einheiten von c/ω und p in Einheiten von mc. y 1.5 1 0.5 0 -1 -0.5 0 0.5 -0.5 1 x -1 -1.5 Abbildung 3.2: Line H = 2mc2 (rot) und Hnr = 2mc2 (grün) Die Euler-Lagrangesche Bewegungsgleichung zur Lagrangefunktion (3.8) ist d dt ẋ (t) /c 1 − (ẋ (t) /c) 2 = −ω · ω x (t) c (3.10) KAPITEL 3. VEKTORANALYSIS 218 oder äquivalent dazu ẍ + ω 2 · 1 − (ẋ/c)2 3/2 (3.11) · x = 0. Wachsender Geschwindigkeitsbetrag verkleinert gleichsam die Federkonstante ω, setzt also die Festigkeit der Feder herab. Der zu Gleichung (3.11) gehörige Energieerhaltungssatz besagt für jede ihrer Lösungen x : I → R mc2 d dt 1 − (ẋ (t) /c)2 −1/2 + 1 ω x (t) 2 c 2 = 0 für alle t ∈ I. (3.12) Die Größe in der runden Klammer ist somit konstant. Sie ist zudem nichtnegativ. Wegen 0 < 1 − (v/c)2 < 1 ist der Ausdruck in der runden Klammer größer als 1. Damit existiert zu jeder Lösung x eine von der Wahl der Lösung abhängige Zahl ε > 0, sodass 1 − (ẋ (t) /c)2 −1/2 + 1 ω x (t) 2 c 2 = 1 + ε für alle t ∈ I. (3.13) Der zulässige Wertebereich der betrachteten Lösung x √ mit der Energie mc2 √ (1 + ε) ist damit eingegrenzt auf das Intervall mit ω |x| /c < 2ε. Die Zahl a = c 2ε/ω gibt die Amplitude einer maximalen Lösung von Gleichung (3.11) an, deren Energie den Wert mc2 (1 + ε) hat. Eine Parameterreduktion wird nun durch Übergang von der Lösung x zur dimensionslosen Funktion y : ω · I → R mit y (ωt) = ωx (t) /c erzielt. Die Funktion y erfüllt dann wegen ẋ (t) /c = y ′ (ωt) auf ihrem Definitionsbereich ω · I d dτ y ′ (τ ) 1− y′ 2 (τ ) (3.14) = −y (τ ) oder äquivalent dazu y ′′ + 1 − y ′2 3/2 (3.15) y = 0. Die Energieerhaltung nimmt auf ω · I die parameterreduzierte Form 1 1 − y ′2 + y2 =1+ε 2 (3.16) √ an. Die Funktion y ist dadurch auf den Wertebereich |y| < 2ε =: α eingegrenzt. −1/2 Fig. (3.3) zeigt die kinetische Energie (1 − y ′2 ) − 1 samt ihrem Taylorpolynom y ′2 /2 an der Stelle 0. In einer hinreichend kleinen Umgebung eines Punktes τ 0 mit y ′ (τ 0 ) > 0 ist (3.16) äquivalent zur expliziten autonomen DG erster Ordnung vom Typ der separierten Variablen y ′ = h (y) mit h : (−α, α) → R>0 und h (y) = −2 1 − (1 + ε − y 2 /2) = (1 + ε − y 2 /2)2 − 1 1 + ε − y 2 /2 . (3.17) KAPITEL 3. VEKTORANALYSIS 219 y 1.25 1 0.75 0.5 0.25 0 -1 -0.5 0 0.5 1 x Abbildung 3.3: Kinetische Energie (1 − v 2 ) −1/2 − 1 und Taylorpolynom v 2 /2 (gün) Es gilt also limy→α h (y) = 0. Die Funktion 1/h ist über das Intervall (0, α) integrierbar. Daher wird der Umkehrpunkt y = α in endlicher Zeit erreicht und die maximalen Lösungen von Gleichung (3.15) sind periodisch. Die analoge Differentialgleichung des nichtrelativistischen Oszillators ergibt sich aus der Niederenergieasymtote an Gleichung (3.16). Letztere besagt, dass y ′2 + y 2 = 2ε. Daraus folgt in einer hinreichend kleinen Umgebung eines Punktes τ 0 mit y ′ (τ 0 ) > 0 die explizite Differentialgleichung y ′ = 2ε − y 2 . Fig. (3.3) lässt somit vermuten, dass die maximale Lösung von y ′ = h (y) bei jeder Auslenkung y eine kleinere Geschwindigkeit y ′ hat, als die maximale Lösung von y ′ = 2ε − y 2 . Daher sollte die Dauer einer relativistischen Oszillatorschwingung größer sein als die des nichtrelativistischen Oszillators gleicher Amplitude und Frequenzkonstante ω. Problem: Zeige h (y) < 2ε − y 2 für alle √ gleicher √ y ∈ − 2ε, 2ε . Fig. (3.4) zeigt für ε = 1 die Menge aller Punkte (y, y ′ ) mit y ′ = ±h (y) in rot und die Menge aller Punkte (y, y ′ ) mit y ′ = ± 2ε − y 2 in grün. Es sind dies Niveaulinien der jeweiligen Energiefunktionen von Auslenkung und Geschwindigkeit. Die Auswirkung der relativistischen Geschwindigkeitsschranke ist klar ersichtlich. Die Schwingungsdauer des nichtrelativistischen Oszillators ergibt sich wie folgt. √ mit z = y/ 2ε ∈ (−1, 1) äquivalent zur Die Differentialgleichung y ′ = 2ε − y 2 ist √ parameterfreien Differentialgleichung z ′ = 1 − z 2 . Die maximale Lösung der DG für z zur Anfangsvorgabe z (0) = 0 ist die Funktion z : (−π/2, π/2) → (−1, 1) mit z (x) = sin x. Damit folgt für die Schwingungsdauer Tnr der Lösungen von y ′′ + y = 0 unabhängig √ von der Amplitude 2ε, dass Tnr = 2π. Was lässt sich über die maximale Lösung η von y ′ = h (y) zur Anfangsvorgabe KAPITEL 3. VEKTORANALYSIS 220 y' 1 0.5 0 -1 -0.5 0 0.5 1 y -0.5 -1 Abbildung 3.4: Linien mit ε = 1 : relativistisch (rot), nichtrelativistisch (grün) √ √ η (0) = 0 schließen? Für alle τ mit |η (τ )| < α = 2ε folgt mit s = y/ 2 √ √ η(τ ) η(τ )/ 2 dy 2 (1 + ε − s2 ) ds = τ= . h (y) 2 0 0 2 (1 + ε − s ) − 1 (3.18) Da h eine gerade Funktion ist, ist η auf dem Intervall (−τ 0 , τ 0 ) definiert, wobei √ ε √ 2 1 + ε − s2 0 (1 + ε − s2 )2 ds = τ 0 −1 gilt. Aus Symmetriegründen ist die Zeit T = 4τ 0 /ω die Schwingungsdauer der Lösung x von Gleichung (3.11) mit x (t) = cη (ωt) /ω. Man beachte auch, dass η ′ (0) = h (0) = ε (2 + ε)/ (1 + ε) . Eine weitere Umformung der Bestimmungsgleichung (3.18) für η ergibt sich mit √ der Substitution s = ε sin θ. Damit folgt für alle τ ∈ (−τ 0 , τ 0 ) √ τ = 2ε arcsin 0 η(τ ) √ 2ε (1 + ε cos2 θ) cos θdθ (1 + ε cos2 θ)2 − 1 Für τ 0 folgt π/2 τ0 = 0 arcsin = 0 η(τ) √ 2ε 1 + ε cos2 θ dθ. 1 + 2ε cos2 θ 1 + ε cos2 θ dθ. 1 + 2ε cos2 θ Zur Kontrolle dieses Ergebnisses für τ 0 wird nun der nichtrelativistische Grenzfall ε → 0 betrachtet. Es sollte limε→0 τ 0 = π/2 gelten. Tatsächlich folgt für ε → 0 π/2 1 + ε cos2 θ dθ = 1 + 2ε cos2 θ τ0 = 0 π/2 = 0 π/2 1 + ε cos2 θ 0 3 1 + ε cos2 θ + O ε2 cos4 θ 4 1− dθ = π 2 ε cos2 θ + O ε2 cos4 θ 4 3 1 + ε + O ε2 8 . dθ KAPITEL 3. VEKTORANALYSIS 221 Eine weitere Kontrolle gibt der hochenergetische Grenzfall ε → ∞, bei dem der Oszillator sich entlang des Großteils seines Weges mit nahezu √ Lichtgeschwindigkeit bewegt. Dann sollte τ 0 sich dem Wert der Amplitude α = 2ε zunehmend nähern. Tatsächlich gilt τ0 = lim √ ε→∞ 2ε π/2 √1 2ε lim ε→∞ lim = ε→∞ 0 ε 2 cos2 θ 1 + 2ε cos2 θ 0 π/2 + 1 ε + cos2 θ 2 ε + cos2 θ π/2 dθ = lim ε→∞ 0 1 ε + cos2 θ 2 ε dθ + cos2 θ π/2 cos θdθ = 1. dθ = 0 Fig. (3.5) zeigt in schwarz die Abbildung α → τ 0 , also die Dauer einer Viertelperiode √ der maximalen Lösung η von Gleichung (3.15) als Funktion ihrer Amplitude α = 2ε. Rot eingezeichnet ist die Hochenergieasymtote α → α und in grün die zwei Niederenergieasymptoten α → π/2 und α → (π/2) (1 + 3α2 /16) . 5 3.75 2.5 1.25 0 0 1.25 2.5 3.75 5 a Abbildung 3.5: α → τ 0 mit Asymptoten für α → ∞ (rot) und für α → 0 (grün) Eine graphische Konstruktion der Abbildung τ → η (τ ) für gegebenen Wert ε gelingt mit einem Bild, das den Funktionsgraphen von ϕ 1 + ε cos2 θ dθ 1 + 2ε cos2 θ 0 √ zusammen mit dem Graphen der Funktion ϕ → S (ϕ) = 2ε sin ϕ jeweils über dem Bereich 0 < ϕ < π/2 enthält. Fig. (3.6) zeigt den Fall ε = 1, wobei ϕ in Einheiten von π/2 angegeben ist. Wählt man nun am Graphen der √ Funktion R einen Punkt (ϕ (τ ) , τ ) , so ist am ’darunter liegenden’ Punkt ϕ (τ ) , 2ε sin ϕ (τ ) des Graphen √ von S offenbar der Wert 2ε sin ϕ (τ ) = η (τ ) abzulesen. Gemäß Fig. (3.6) erreicht die Lösung für ε = 1 zur Zeit τ = 3/2 ungefähr eine Auslenkung von η (1, 5) = 1, 2. Die implizite Bestimmungsgleichung des funktionalen Zusammenhanges zwischen τ und η (τ ) enthält das Integral R (ϕ) und ist mit 0 < ϕ < π/2 äquivalent √ zur Parametrisierung der Weltlinie {(τ , η (τ )) : 0 < τ < τ 0 } durch ϕ → R (ϕ) , 2ε sin ϕ . ϕ → R (ϕ) = KAPITEL 3. VEKTORANALYSIS 222 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0.9802 Abbildung 3.6: Bewegung eines relativistischen Oszillators Das Integral R (ϕ) kann auf tabellierte Integrale zurückgeführt werden. Und zwar so: ϕ ϕ 2 + ε cos2 θ − 1 dθ = 2 R (ϕ) = 1 + 2ε cos2 θ 0 0 / ϕ ε = 2 1 − sin2 θ dθ − 1+ 2 0 / 0 1+ ϕ ε cos2 θdθ − 2 ϕ 0 dθ 1+ ε 2 dθ 1 + 2ε cos2 θ 2 . 1 − sin θ Für den ersten Summanden gilt mit k = ε/ (2 + ε) ∈ (0, 1) / √ ϕ ε 2+ε 2 1 − sin θ dθ = √ E (ϕ, k) und E (ϕ, k) = 1+ 2 2 0 ϕ 1 − k 2 sin2 θdθ. 0 Für den zweiten Summanden gilt / ϕ dθ 2 = F (ϕ, k) und F (ϕ, k) = 2+ε 0 1 + ε 1 − sin2 θ ϕ 0 2 dθ 1 − k 2 sin2 θ . Somit gilt für 0 < ϕ < π/2 mit k = ε/ (2 + ε) und mit dem unvollständigen elliptischen Integral erster Art F bzw zweiter Art E (beide in Legendre Form) R (ϕ) = aus √ √ F (ϕ, k) 2 2 + εE (ϕ, k) − √ 2+ε . Das Taylorpolynom vom Grad 1 der Abbildung ε → R (ϕ) bei ε = 0 ergibt sich ϕ ϕ 3 1 + ε cos2 θ dθ = 1 + ε cos2 θ + O ε2 cos4 θ ε 2θ 4 1 + cos 0 0 2 ϕ 3 cos2 θdθ + O ε2 cos4 θ = ϕ+ ε 4 0 R (ϕ) = dθ KAPITEL 3. VEKTORANALYSIS zu 3 R1 (ϕ) = ϕ + ε 4 ϕ 0 223 3ε 1 (1 + cos (2θ)) dθ = ϕ + 2 8 ϕ+ sin (2ϕ) 2 . √ Die Viertelperiode der Weltlinie ϕ → R1 (ϕ) , η (ϕ) / 2ε = (R1 (ϕ) , sin (ϕ)) mit 0 < ϕ < π/2 zu ε = 0, 1 ist zusammen mit der Newtonschen Weltlinie ϕ → (ϕ, sin (ϕ)) in Fig. (3.7) dargestellt. Der Newtonsche Oszillator benötigt für die Viertelperiode eine sichtbar kürzere Zeit. Abbildung 3.7: Oszillator nach Newton (grün), relativistisch (rot) 3.1.11 Basisdarstellung eines Gradienten Wie lässt sich der Gradient eines Skalarfeldes als Linearkombination der Elemente irgendeiner Basis von V darstellen? Satz 102 Sei U ⊂ V offen und f : U → R sei differenzierbar. Sei e = (e1 , ..., en) eine Basis von V mit der Gramschen Matrix Ge . Ihre Inverse wird oben indiziert.8 Dann gilt n ij ei G−1 e grad (f) = ∂je f. (3.19) i,j=1 & ' Beweis. Gemäß Definition 100 gilt gradp (f ) , X = dp f (X) für alle X ∈ V. Somit folgt gemäß der einleitend beschriebenen Konstruktion des Vektors l zu einer Linearform L, dass n ei G−1 e gradp (f ) = ij dp f (ej ) . i,j=1 ∂je f Mit dp f (ej ) = folgt die Behauptung. Es ist aufschlussreich, zu verifizieren, dass Gleichung (3.19) tatsächlich für jede Basis von V gilt, wenn sie für eine gilt. Sei b eine weitere Basis von V mit e = 8 Es gilt also n k=1 G−1 e ik Ge kj = δ ij = 1 für i = j . 0 sonst KAPITEL 3. VEKTORANALYSIS 224 b · M. (Ausführlicher: ei = nj=1 bj M ji ) Dann folgt Ge = M t · Gb · M. Angenommen Gleichung (3.19) gilt für die Basis e. Mit der Zeile [e] f = ([e1 ] f, ..., [en ] f ) ist diese t Gleichung wegen [ei ] f = ∂ie f zu grad(f ) = e · G−1 e · [e] f äquivalent. Wegen der Linearität des Differentials dp f gilt n n bj M ji df (ei ) = df M ji df (bj ) . = j=1 j=1 Als Matrixgleichung gilt somit [e] f = [b] f · M. Daraus folgt grad(f) = b · M · M t · Gb · M −1 t = b · M · M −1 · G−1 b · M · [b] f · M −1 t t · M t · [b] f t = b · G−1 b · [b] f . Im Fall V = Rn×1 und der Standardbasis e folgt grad (f ) = 3.1.12 ∂f ∂f t , ..., ∂x n ∂x1 . Faulenzerregeln zum Gradienten Die folgenden einfach zu beweisenden Regeln dienen der Arbeitsersparnis. Seien f, g differenzierbare Skalarfelder auf U ⊂ V (offen) und λ ∈ R. Weiter sei F : D → R differenzierbar mit f (U) ⊂ D ⊂ R und D offen. Dann gilt für p ∈ U 1. grad(f + λg) = grad(f ) + λ grad(g), 2. grad(f · g) = grad(f ) · g + f · grad(g), 3. gradp (F ◦ f) = F ′ (f (p)) · gradp (f ) . Weitere 9 Regeln ergeben sich für umskalierte, translahierte und gedrehte differenzierbare Skalarfelder f mit Definitionsbereich U. In solchen Fällen seien für ξ ∈ V und λ > 0 die Skalarfelder (Dλ f ) (p) := f (λp) auf U ′ := λ1 · U, Tξ f (p) := f (p − ξ) auf U ′ := U + ξ und (Rf ) (p) := f (R−1 p) auf U ′ := R (U) mit R : V → V einer n-dimensionalen Drehspiegelung. Dann gelten für p ∈ U ′ die folgenden Regeln, oft als Kovarianzregeln bezeichnet. 4. gradp (Dλ f ) = λ · gradλp (f ) (Dilatation), 5. gradp (Tξ f ) = gradp−ξ (f ) (Translation), 6. gradp (Rf ) = R gradR−1 p (f) (Drehspiegelung). 9 Diese Regeln folgen aus Spezialfällen der Kettenregel für Differentiale. Seien f : U → R und g : U ′ → U mit U, U ′ ⊂ V offen. Für differenzierbare f und g gilt die Kettenregel dp (f ◦ g) = dg(p) f ◦ dp g. Durch Dualisieren dieser Formel mit dem Skalarprodukt gelangt man zu den drei angeführten Regeln. Dabei gehen Linearität und On -Invarianz des Skalarproduktes ein. KAPITEL 3. VEKTORANALYSIS 225 Ein Beispiel zu Regel 4: Sei f : V wegen grad (r) = ιd/r 0 → R mit f = rα für ein α ∈ R. Dann gilt grad (f ) = αrα−1 · 3.1.13 ιd = αrα−2 · ιd. r Gradientenfeld des Punktdipolpotentials Für dim V = 3 ist das elektrostatische Potential eines Punktdipols mit Dipolmoment δ ∈ V durch Φ (p) = γ δ, p / |p|3 mit γ = 1/4πε0 gegeben. Bei beliebiger Dimension von V liefern Produkt- und Kettenregel ohne Umwege über Koordinaten gradp (Φ) = γ δ δ, p p 3 −3 4 · |p| |p| |p| für p ∈ V 0. Das elektrische Feldstärkefeld E : V 0 → V eines Punktdipols, der im Punkt 0 lokalisiert ist, erfüllt somit (im Fall dim V = 3) E (p) = −gradp (Φ) = 3.1.14 γ |p|3 3 δ, p p−δ . |p|2 Gradientenfeld des Polarwinkels Sei V = R1×2 mit den Standardkoordinatenfunktionen x, y. Auf der geschlitzten Ebene U := {(a, b) ∈ R1×2 | b = 0 ⇒ a < 0} sind die Polarkoordinatenfunktionen r : U → R>0 und φ : U → (0, 2π) ⊂ R implizit durch x = r cos φ, y = r sin φ definiert. Es gilt wegen r > 0, dass r = x2 + y 2 und somit gradp (r) = p/r(p) für p ∈ U . Aus den impliziten Definitionsgleichungen für r und φ folgt auf U durch Gradientenbildung (1, 0) = grad (x) = grad (r) cos (φ) − r sin (φ) grad (φ) , (0, 1) = grad (y) = grad (r) sin (φ) + r cos (φ) grad (φ) . Multiplikation der ersten Gleichung mit − sin φ und der zweiten mit cos φ und anschließender Addition der beiden Gleichungen ergibt auf U r · grad (φ) = (− sin φ, cos φ) = 1 (−y, x) . r Daraus folgt auf U, dass grad (φ) = r12 (−y, x) . Siehe Fig 3.8. Das Vektorfeld grad (φ) ist auf U ein Vielfaches des Drehvektorfeldes der Ebene. Es steht senkrecht auf die Niveauflächen von φ, die von 0 ausgehende Halbstrahlen sind. Der Betrag von grad (φ) nimmt mit der Entfernung von 0 ab: |grad (φ)| = 1/r. Für V = R1×3 mit den Standardkoordinatenfunktionen x, y, z sind die Zylinderkoordinatenfunktionen (r, φ, z) auf U := {(a, b, c) ∈ R1×3 | b = 0 ⇒ a < 0} implizit durch (x, y, z) = (r cos φ, r sin φ, z) definiert. Ähnlich wie im Fall der Ebene folgen r = x2 + y 2 und grad (r) = (x, y, 0) /r auf U. Der Gradient des Polarwinkels φ KAPITEL 3. VEKTORANALYSIS 226 Abbildung 3.8: Gradientenfeld des Polarwinkels ergibt sich zu grad (φ) = (−y, x, 0) /r2 . Das Vektorfeld grad (φ) hat eine stetige Fortsetzung von U auf R1×3 R·e3 . Es gilt dort nämlich X = r−2 (−y, x, 0) = r−2 L. Das Feld X ist tangential an die Ebenen senkrecht zur Drehachse und L bezeichnet das Drehvektorfeld um die Achse R·e3 . Das magnetische Flussdichtefeld eines unendlich langen den Strom I führenden 0I X gegeben. Drahtes der Dicke 0, der auf der Achse R·e3 positioniert ist, ist durch µ2π Ähnlich idealisierend gibt vRX die lokalen Windgeschwindigkeiten eines Wirbelsturms wieder.10 Die Summe bzw Differenz des Translates von X um e1 = (1, 0, 0) und des Translates von X um −e1 gibt das magnetische Flussdichtefeld zweier paralleler Drähte, die von Strömen derselben bzw gegengesetzter Richtung und gleicher Stärke durchflossen sind. Sie werden von Fig. (3.9) bzw (3.10) gezeigt. Abbildung 3.9: B-Feld paralleler Stromfäden 10 Daher heißt das Vektorfeld X in der Strömungslehre „freier“ Wirbel (Vortex). Natürlich wächst die Geschwindigkeit bei Annäherung an die Drehachse eines Hurricans nicht wirklich unbeschränkt an. Vielmehr ist vRX nur in einem äußeren Bereich r > R zutreffend. Im Innenbereich r < R gilt ungefähr vL/R. Der Geschwindigkeitsbetrag steigt also für r < R linear mit dem Abstand r zur Wirbelachse. Bei r = R ist die Windgeschwindigkeit maximal. KAPITEL 3. VEKTORANALYSIS 227 Abbildung 3.10: B-Feld antiparalleler Stromfäden Existiert zum Vektorfeld X ein Skalarfeld f auf R1×3 R·e3 , sodass X = grad (f) gilt? Ein Skalarfeld, dessen Gradientenfeld mit einem vorgegebenen Vektorfeld übereinstimmt, heißt ein Potential des Vektorfeldes. Der Abschnitt über konservative Vektorfelder wird zeigen, dass es zu X eine solche Funktion f nicht gibt.11 3.1.15 *Gradient zur Minkowskigeometrie Bisher wurde das Gradientenvektorfeld für differenzierbare Skalarfelder auf offenen Teilmengen eines enlichdimensionalen, reellen Vektorraums V formuliert. Der entscheidende Sachverhalt bei der Bildung des Gradienten einer Funktion f in einem Punkt p aus dem Differential dp f ist die Tatsache, dass zu einer Linearform L : V → R und einem Skalarprodukt ·, · : V × V → R genau ein Vektor l ∈ V existiert, sodass L (X) = l, X für alle X aus V gilt. Dazu wird die Inverse der Gramschen Matrix Ge von ·, · zu irgendeiner Basis e von V benötigt. Für ein Skalarprodukt gilt det Ge > 0, da v, v > 0 für alle v ∈ V 0. Für die Invertierbarkeit von Ge reicht es aber nach dem folgenden Lemma aus, dass ·, · eine nicht ausgeartete symmetrische Bilinearform ist. Eine symmetrische Bilinearform ·, · : V × V → R heißt nicht ausgeartet, wenn aus v, w = 0 für alle w ∈ V folgt dass v = 0. Lemma 103 Ist Ge die Gramsche Matrix einer symmetrischen nicht ausgearteten Bilinearform, dann gilt det Ge = 0. Beweis. Ge ist als symmetrische Matrix diagonalisierbar und in der Diagonale stehen die Eigenwerte von Ge . Aus det Ge = 0 folgt, dass 0 Eigenwert von Ge ist. t Sei (v01 , . . . v0n ) ∈ Rn×1 ein Eigenvektor von Ge zum Eigenwert 0. Dann folgt für alle w ∈ V mit v0 = ni=1 v0i ei v0 , w = w, v0 = w1 , . . . wn · Ge · v01 , . . . v0n 11 t = 0. Trotzdem wird X auch als „Potentialwirbel“ bezeichnet, weil X eben überall mit Ausnahme einer Halbebene mit dem Gradientenfeld von φ übereinstimmt. KAPITEL 3. VEKTORANALYSIS 228 t Dies bedingt nun v0 = 0 im Widerspruch zur Annahme, dass (v01 , . . . v0n ) ein Eigenvektor von Ge ist. Damit ist die folgende Verallgemeinerung des Gradienten möglich. Definition 104 Ist ·, · : V × V → R bilinear, symmetrisch und nicht ausgeartet, dann heißt der Vektor gradp (f ) mit dp f (X) = gradp (f ) , X für alle X ∈ V der Gradient in p des in p differenzierbaren Skalarfeldes f : V ⊃ U → R bezüglich ·, · . Dabei ist U offen in V und p ∈ U. Offenbar zerfällt auch der verallgemeinerte Gradient nach einer Basis von V gemäß n ei (Ge )−1 gradp (f) = ij ∂je f (p) . i=1 Die spezielle Realtivitätstheorie nutzt beispielsweise eine Minkowskische Pseudometrik, eine nicht ausgeartete symmetrische Bilinearform ·, · : V × V → R, deren Gramsche Matrix genau einen positiven Eigenwert besitzt. Für diese Pseudometrik existieren daher Normalbasen e = (e0 , e1 , . . . en ) mit 1 für i = j = 0 e −1 für i = j ∈ {1, . . . n} . Gij = ei , ej = 0 sonst Bezüglich einer NB e gilt daher mit den partiellen Ableitungen des Kartenausdrucks von f in den kontravarianten Koordinaten zu e n gradp (f ) = (∂0 fe ) (p) · e0 − i=1 (∂i fe ) (p) · ei . Im folgenden Abschnitt wird die Symmetrie der Bilinearform ·, · durch Antisymmetrie ersetzt. Auch in diesem Fall kann ein Gradient gebildet werden, soferne nur die Bilinearform nicht ausgeartet ist. 3.1.16 *Symplektischer Gradient - Hamiltons Vektorfeld Sei V ein reeller Vektorraum gerader Dimension. Auf V sei eine schiefsymmetrische bilineare Abbildung ω : V ×V → R gewählt. Es gilt also ω (v, w) = −ω (w, v) für alle v, w ∈ V. Überdies sei ω nicht ausgeartet, dh, wenn ω (v, x) = 0 für alle x ∈ V gilt, dann folgt v = 0. Eine solche Abbildung ω heißt symplektische Form. Ähnlich wie mit einem Skalarprodukt von V der Gradient eines Skalarfeldes gebildet wird, kann mit ω ein ’symplektischer Gradient’ eines Skalarfeldes gebildet werden. Er regelt als Hamiltonsches Vektorfeld die Bewegung eines mechanischen Systems durch ein System von gewöhnlichen Differentialgleichungen erster Ordnung. Lemma 105 Ist ω eine symplektische Form auf V, dann existiert eine Basis e = (e1 , . . . en , en+1 , . . . e2n ) von V mit ω (ei , ej ) = ω (en+i , en+j ) = 0 und ω (ei , en+j ) = δ ij für alle i, j ∈ {1, . . . n} , eine sogenannte symplektische Normalbasis (SNB). KAPITEL 3. VEKTORANALYSIS 229 Beweis. Der Beweis nutzt die Jordansche Normalform einer schiefsymmetrischen reellen Matrix. Lemma 106 Ist ω eine symplektische Form auf V und ist L : V → R linear, dann existiert genau ein l ∈ V, sodass L (v) = ω (l, v) für alle v ∈ V. Ist e eine SNB von V, dann gilt l = ni=1 (L (en+i ) · ei − L (ei ) · en+i ) . Beweis. Dazu ist erstens zu prüfen, dass L (ej ) = ω (l, ej ) und L (en+j ) = ω (l, en+j ) für alle j ∈ {1, . . . n} gilt: n n ω (l, ej ) = i=1 n ω (l, en+j ) = i=1 [L (en+i ) ω (ei , ej ) − L (ei ) ω (en+i , ej )] = L (ei ) δ ji = L (ej ) , i=1 [L (en+i ) ω (ei , en+j ) − L (ei ) ω (en+i , en+j )] = L (en+j ) . Ist l′ ein weiterer Vektor mit L (ej ) = ω (l′ , ej ) und L (en+j ) = ω (l′ , en+j ) für alle j ∈ {1, . . . n} , dann folgt ω (l′ − l, v) = 0 für alle v ∈ V und somit l′ − l = 0. Damit ist die Eindeutigkeit von l gezeigt. Definition 107 Ist U ⊂ V offen und das Skalarfeld H : U → R differenzierbar, dann heißt das Vektorfeld XH : U → V, das in jedem Punkt p ∈ U die Bedingung dv H (·) = ω (XH (v) , ·) erfüllt, das Hamiltonsche Vektorfeld zu H. Eine Integralkurve γ eines Hamiltonschen Vektorfeldes XH erfüllt γ̇ = XH ◦ γ. Wegen (H ◦ γ)′ (t) = dγ(t) H (XH (γ (t))) = ω (XH (γ (t)) , XH (γ (t))) = 0 ist H ◦ γ eine konstante Abbildung und XH (v) ist in v tangential an die Niveaufläche von H durch v. Man sagt daher: H ist unter der Evolution zu XH ’erhalten’. Satz 108 Ist e eine SNB von V und das Skalarfeld H : U → R differenzierbar, e dann gilt XH = ni=1 ∂n+i H · ei − ∂ie H · en+i . Beweis. Zu zeigen ist für alle j ∈ {1, . . . n} , dass dv H (ej ) = ω (XH (v) , ej ) und dv H (en+j ) = ω (XH (p) , en+j ) . Nun gilt aber für alle j ∈ {1, . . . n} einerseits dv H (ej ) = ∂je H (v) , e dv H (en+j ) = ∂n+j H (v) und andererseits n ω (XH (v) , ej ) = i=1 n − (∂ie H) (v) ω (en+i , ej ) = ∂je H (v) , e e ∂n+i H (v) ω (ei , en+j ) = ∂n+j H (v) . ω (XH (v) , en+j ) = i=1 KAPITEL 3. VEKTORANALYSIS 230 Unter Verwendung der kontravarianten Karte Φe ≡ (q 1 , . . . q n , p1 , . . . pn ) zu einer SNB e von V ist das System γ̇ = XH ◦ γ offenbar äquivalent zu , , d i d i q ◦ γ (t) = ∂pi H ,γ(t) und p ◦ γ (t) = − ∂qi H ,γ(t) dt dt für alle i ∈ {1, . . . n} , den Hamiltonschen Bewegungsgleichungen zu H. Für die Änderung eines differenzierbaren Skalarfeldes f : U → R entlang einer Integralkurve γ : I → U des Hamiltonschen Vektorfeldes XH gilt mit γ (t) = v d (f ◦ γ) (t) = dv f (γ̇ (t)) = dv f (XH (v)) = dv f dt n e ∂n+i H v i=1 ei − (∂ie H)v en+i n e H ∂n+i = v i=1 e (∂ie f)v − (∂ie H)v ∂n+i f v . Definition 109 Sei U ⊂ V offen und f, g : U → R differenzierbar. Das Skalarfeld {f, g} : U → R mit {f, g} (v) = [Xg ]v f = dv f (Xg (v)) = ω (Xf (v) , Xg (v)) heißt Poissonklammer von f mit g. Für differenzierbare f, g : U → R mit offenem U ⊂ V folgt also {f, g} = ω (Xf , Xg ) = − {g, f } und bezüglich der kontravarianten Karte zu einer SNB gilt n {f, g} = i=1 ∂f ∂g ∂f ∂g − ∂q i ∂pi ∂pi ∂q i . Das oben abgeleitete Resultat für die Änderung eines Skalarfeldes entlang einer Integralkurve eines Hamiltonschen Vektorfeldes lässt sich wie folgt zusammenfassen. Satz 110 Für eine Integralkurve γ des Hamiltonschen Vektorfeldes XH und ein differenzierbares Skalarfeld f : U → R, dessen offener Definitionsbereich U das Bild von γ enthält, gilt (f ◦ γ)′ = {f, H} ◦ γ. Ein Skalarfeld f mit {f, H} = 0 ist eine Erhaltungsgröße der Dynamik zu H, da jede Integralkurve von XH innerhalb einer Niveaumenge von f verläuft. Insbesondere ist H selbst eine Erhaltungsgröße unter der Dynamik zu H. 3.2 Differenzieren von Vektorfeldern Vektorfelder eignen sich zur Darstellung von mehrdimensionalen Größen auf einem vorgegeben Raum, wenn diese sich von Punkt zu Punkt ändern. So ordnet etwa die Wellenfunktion eines Elektrons jedem Raumzeitpunkt (t, x) ∈ R × R3 in einem reellen Vektorraum einen Punkt Ψ (t, x) im komplexen Vektorraum C2 zu. Einen wichtigen Spezialfall geben die Tangentenvektorfelder, die jedem Punkt einer (offenen) Teilmenge eines Vektorraums V einen Vektor im selben Raum V zuweist. Man denke etwa an das Geschwindigkeitsfeld einer strömenden Flüssigkeit. Es gibt für jeden Punkt des flüssigkeitgefüllten Raumgebietes linear nähernd seine Verschiebung in diesem Raum während einer kurzen Zeitspanne an. Im Folgenden werden nur mehr Tangentenvektorfelder behandelt und die Bezeichnung zu Vektorfeld verkürzt. KAPITEL 3. VEKTORANALYSIS 3.2.1 231 Differential und Richtungsableitung Ganz ähnlich wie bei Skalarfeldern kann auch bei Vektorfeldern auf offenen Teilmengen eines Vektorraums nach Richtungsableitungen und Differential gefragt werden. Wir beschränken uns hier auf differenzierbare Vektorfelder X. Definition 111 Ein Vektorfeld X : U → V, für das in jedem Punkt p seines (in V offenen) Definitionsbereiches U eine lineare Abbildung dp X : V → V existiert, sodass die in einer hinreichend kleinen offenen Umgebung von 0 ∈ V definierte Abbildung ψ p mit X (p + h) = X (p) + dp X (h) + ψ p (h) die Eigenschaft limh→0 ψ p (h) / h = 0 hat, heißt differenzierbar. Die Abbildung dp X heißt das Differential oder die Tangentialabbildung von X in p. Für ein lineares Vektorfeld X : V → V gilt offenbar X (p + h) = X (p) + X (h) , sodass dp X (h) = X (h) für alle p, h ∈ V folgt. Wie ist der Vektor [h]p X = dp X (h) ∈ V, die Richtungsableitung von X in p unter h in den Koordinaten zu einer Basis von V zu ermitteln? Sei U ⊂ V offen und X : U → V ein C 1 -Vektorfeld. e = (e1 , . . . en ) bezeichnet eine Basis von V und X = ni=1 X i ei definiert die Komponentenfunktionen von X zu dieser Basis. Es gilt also X i ≡ Xei . Dann ist durch 1 [X (p + εei ) − X (p)] = ε→0 ε n n [ei ]p X = lim j=1 [ei ]p X j · ej = ∂ie X j j=1 p · ej die Richtungsableitung von X mit dem Vektor ei definiert. Etwas allgemeiner geht es wie folgt. Definition 112 Für ein C 1 -Vektorfeld X mit offenem Definitionsbereich U ⊂ V und ein Vektorfeld Y : U → V heißt das Vektorfeld [Y ] X, das in p ∈ U den Wert X (p + εY (p)) − X (p) ε→0 ε [Y (p)]p X = dp X (Y (p)) = lim hat, Feld der Richtungsableitung oder kovariante Ableitung von X mit dem Vektorfeld Y. Statt [Y (p)]p X wird auch [Y ]p X oder (∇Y X) (p) notiert. Ist das Vektorfeld X die Einschränkung einer linearen Abbildung auf U, dann folgt aus der Definition von [Y ] X unmittelbar [Y ] X = X ◦ Y. In komplizierteren Fällen kann die Richtungsableitung [Y ] X unter Zuhilfenahme einer Basis von V berechnet werden gemäß n [Y ]p X = n [Y ]p X j=1 j Y i (p) ∂ie X j ej = i,j=1 p · ej . Die beiden folgenden Produktregeln sind ebenfalls brauchbare Rechenhilfen. KAPITEL 3. VEKTORANALYSIS 232 Satz 113 Seien f : U → R und X, Y : U → V mit U ⊂ V offen vom C 1 -Typ. Weiter seien Z : U → V und ein Skalarprodukt ·, · von V gewählt. Dann gilt [Y ] (f · X) = ([Y ] f ) · X + f · ([Y ] X) und [Z] X, Y = [Z] X, Y + X, [Z] Y . Sollen Tangentenvektorfelder differenziert werden, die auf gekrümmten Mannigfaltigkeiten wie einer Kugeloberfläche definiert sind, dann versagt die hier beschriebene Konstruktion von Richtungsableitung und Differential. Es muss eine Vorschrift formuliert werden, die als Paralleltransport von Tangentenvektoren bezeichnet wird. Erst eine solche Vorschrift, die auch als ’Affinzusammenhang’ bezeichnet wird, erlaubt es, Vektoren, die in verschiedenen Tangentenräumen liegen, aufeinander zu beziehen und einen Differenzenquotienen zu bilden. Ein von einem Affinzusammenhang unabhängiger Begriff einer Richtungsableitung eines Vektorfeldes ist die sogenannte Lieableitung. Diese wird in den drei folgenden Abschnitten im einfachen Fall von Vektorfeldern auf Vektorräumen erklärt. Der Transport mit dem Fluss eines Vektorfeldes übernimmt dabei die Rolle des Paralleltransports. 3.2.2 *Lieprodukt von Vektorfeldern In diesem Abschnitt wird eine schiefsymmetrische, bilineare Multiplikation von Vektorfeldern beschrieben, die als Ergebnis ein neues Vektorfeld ergibt. Dabei erweist es sich als hilfreich, ein Vektorfeld als eine bestimmte lineare Abbildung, als ’Derivation’, auf dem Vektorraum der C ∞ -Skalarfelder aufzufassen. Einige dieser Derivationen dienen (in einer komplexifizierten) Version als Impuls- und Drehimpulsoperatoren der Quantenmechanik. Impulse sind mit konstanten Vektorfeldern der Länge 1 assoziiert und Drehimpulse mit den Drehvektorfeldern. Seien X, Y : U → V Vektorfelder mit offenem Definitionsbereich U ⊂ V. Die Komponentenfunktionen Xei und Yei von X und Y zu einer beliebigen Basis e von V seien C ∞ -Funktionen. Für jedes Skalarfeld f ∈ C ∞ (U : R) ist das Skalarfeld der Richtungsableitungen [X] f : U → R mit [X] f (v) = dv f (X (v)) wieder ein Skalarfeld in C ∞ (U : R) . Sei nun X die dem Vektorfeld zugeordnete lineare(!) Abbildung X : C ∞ (U : R) → C ∞ (U : R) mit Xf = [X] f für alle f ∈ C ∞ (U : R) . Es gilt die Produktregel X (f · g) = g · X (f ) + f · X (g) für alle f, g ∈ C ∞ (U : R) . Für zwei C ∞ -Vektorfelder X, Y auf U ist auch der ihnen zugeordnete Kommutator X, Y = X ◦ Y − Y ◦ X eine lineare Abbildung von C ∞ (U : R) nach C ∞ (U : R) . Es wird nun gezeigt, dass ein C ∞-Vektorfeld Z : U → V mit Z = X, Y existiert. Auf U gilt Y ◦ X f = [Y ] ([X] f ) = n n Yei ∂ie = j=1 n Xej ∂je f i=1 Yei = i,j=1 ∂ie Xej ∂je f + Xej ∂ie ∂je f . KAPITEL 3. VEKTORANALYSIS 233 Für die Differenz der beiden Skalarfelder [X] ([Y ] f) und [Y ] ([X] f) ergibt sich daraus wegen des Weghebens der zweiten Ableitungen von f X ◦ Y − Y ◦ X f = [X] ([Y ] f ) − [Y ] ([X] f ) n = i,j=1 Xei ∂ie Yej − Yei ∂ie Xej ∂je f = [[X] Y ] f − [Y [X]] f. Dies aber ist das Feld der Richtungsableitungen von f unter dem Vektorfeld Z = [X] Y −[Y ] X. Die Komponentenfunktionen Zej von Z mit Z = nj=1 ej ·Zej : U → V erfüllen daher n Zej = i=1 Xei ∂ie Yej − Yei ∂ie Xej (3.20) . Die Bestimmung von Z wurde hier basisfrei ausgeführt. Sehen wir uns trotzdem noch an, warum auch die komponentenweise Definition von Z ein von der Basis e unabhängiges Vektorfeld ergibt. Lemma 114 Seien X, Y ∈ C ∞ (U : V ) . Dann ist das Vektorfeld Z = nj=1 Zej · ej ∈ C ∞ (U : V ) mit Zej wie in Gleichung (3.20) wohldefiniert, dh unabhängig von der Wahl der Basis e. Beweis. Sei f = e · A eine weitere Basis von V. Dann gilt wegen der Konstanz der Basiswechselmatrix A ∈ Rn×n n Xei ∂ie Yej − Yei ∂ie Xej Zej = i=1 n n = i=1 α,β=1 n Ajβ = α,β=1 n β=1 n j=1 . n n Zej · ej = α=1 n Aiα ∂ie Yfβ Xfα Ajβ = und somit 0 1 Aiα Ajβ Xfα ∂ie Yfβ − Yfα ∂ieXfβ i=1 − Yfα Aiα ∂ieXfβ i=1 0 1 f β f β α α Xf ∂α Yf − Yf ∂α Xf = n j=1 n β=1 Ajβ Zfβ · n α=1 7 n Ajβ Zfβ β=1 α (A−1 )j fα = n α=1 Zfα · fα . Definition 115 Zu zwei Vektorfeldern X, Y ∈ C ∞ (U : V ) heißt das Vektorfeld Z = [X] Y − Y [X] ∈ C ∞ (U : V ) das Lieprodukt (die Lieklammer) von X mit Y. Es wird notiert Z = [X, Y ]L . Es gilt also X, Y = [X, Y ]L . Das Lieprodukt [·, ·]L : C ∞ (U : V ) × C ∞ (U : V ) → C ∞ (U : V ) KAPITEL 3. VEKTORANALYSIS 234 ist offenbar schiefsymmetrisch und bilinear. Es erfüllt zudem die Jacobiidentität [A, [B, C]L ]L + [B, [C, A]L ]L + [C, [A, B]L ]L = 0 für alle A, B, C ∈ C ∞ (U : V ) . Die Jacobiidentität lässt sich anhand der entsprechenden Kommutatoridentität der Derivationen ganz einfach nachrechnen, da sich von den zwölf Summanden sechs Paare zu 0 aufaddieren. Lieprodukt zweier Drehvektorfelder Sei zunächst V von beliebiger endlicher Dimension und X, Y : V → V seien linear. Dann gilt [X] Y = Y ◦ X und [Y ] X = X ◦ Y. Daraus folgt [X, Y ]L = Y ◦ X − X ◦ Y = [Y, X] . Das Lieprodukt von zwei linearen Vektorfeldern stimmt also mit dem negativen(!) Kommutator der beiden Vektorfelder im Abbildungssinn überein. Nutzen wir diesen Sachverhalt, um das Lieprodukt von zwei Drehvektorfeldern zu berechnen. Der Vektorraum V habe also nun die Dimension 3. Ein Skalarprodukt ·, · und eine Orientierung von V seien gewählt. Das zugehörige Vektorprodukt zweier Vektoren u, v wird als u × v bezeichnet. Das Drehvektorfeld Ln : V → V zu einem n ∈ V erfülle Ln (v) = n × v für alle v ∈ V. Das Vektorfeld Ln ist linear. Lemma 116 Für m, n ∈ V gilt [Ln , Lm ] = Ln ◦ Lm − Lm ◦ Ln = Ln×m . Beweis. Für v ∈ V gilt Ln (Lm v) = n × (m × v) = m n, v − v m, n . Daraus folgt Ln (Lm (v)) − Lm (Ln (v)) = m n, v − n m, v . Andererseits gilt Ln×m (v) = (n × m) × v = −v × (n × m) = −n v, m + m n, v . Der Kommutator zweier Drehvektorfelder ist also wieder ein Drehvektorfeld. Ist e = (e1 , e2 , e3 ) eine positiv orientierte Orthonormalbasis von V, dann gelten für die Vektorfelder Li ≡ Lei [L1 , L2 ] = L3 (zyklisch). Man beachte, dass aus L2n v ≡ (Ln ◦ Ln ) v = n n, v − v |n|2 folgt 3 C := i=1 L2i = −2ιdV . Das lineare Vektorfeld C ist also ein Vielfaches der identischen Abbildung, eine sogenannte ’Casimirinvariante’. Der Kommutator von C mit Ln verschwindet offenbar, wie auch die zugehörige Lieklammer, für alle n ∈ V. <n der Richtungsableitung mit dem Drehvektorfeld Ln auf Der lineare Operator L ∞ der Menge der C -Skalarfelder auf V erfüllt für alle v ∈ V <n f (v) = [Ln (v)] f = dv f (n × v) = n × v, gradv (f ) . L v Es gilt daher auch [Ln (v)]v f = n, v × gradv (f ) . KAPITEL 3. VEKTORANALYSIS 235 Für n = e3 spezialisiert sich diese Definition beispielsweise zu e e [Le3 (v)]v f = ve1 (∂2 f) (v) − ve2 (∂1 f) (v) . Da die Lieklammer [Ln , Lm ]L der Vektorfelder Ln und Lm mit dem Kommutator [Lm , Ln ] übereinstimmt, gilt <n , L <m = −Ln×m . L <n = Ln als Die Quantenmechanik nutzt für n ∈ V mit |n| = 1 die Operatoren −i L Bahndrehimpulskomponenten zur Achse R · n. Diese erfüllen daher die Kommutatorrelationen [Ln , Lm ] = i Ln×m . 3.2.3 Transport von Skalar- und Tangentenvektorfeldern Es wird nun ein natürlicher abbildungsinduzierter Transport von skalaren und Tangentenvektorfeldern beschrieben, welcher im Fall der Flussabbildung eines Vektorfeldes X der Lieableitung ’unter’ X zugrunde liegt. Sei ϕ : U → ϕ (U ) ⊂ V eine bijektive C ∞-Funktion mit offenem Definitionsbereich U ⊂ V. Die Umkehrabbildung ϕ−1 sei ebenfalls eine C ∞-Funktion. Zu einer C ∞ -Funktion f : U → R ist die Funktion ϕ∗ f : ϕ (U ) → R mit (ϕ∗ f ) (ϕ (v)) = f (v) dann ein skalares C ∞-Feld auf dem Bildbereich von ϕ. Die Abbildung ϕ überträgt so die Funktionswerte eines Skalarfeldes punktweise in ihren Bildbereich. Die Abbildung ϕ∗ f heißt der Transport des Skalarfeldes f unter (dem Diffeomorphismus) ϕ. Es gilt kurz ϕ∗ f = f ◦ ϕ−1 . Ein anschauliches Bild dieser Konstruktion vermittelt etwa ein Körper aus endlich vielen Massenpunkten, welche die offene Menge U ’sampeln’. f ordnet diesen Punkten reelle Massen zu ϕ transportiert die Punkte unter Beibehaltung ihrer Massen in neue Positionen. Die Abbildung ϕ überhöht die ’reale’ endliche Menge also zu einem Kontinuum. Ein Beispiel: Sei ϕ = A : V → V linear mit det A = 0. Dann folgt für f ∈ ∞ C (V : R) , dass (A∗ f) (v) = f (A−1 v) . Mit ϕ lassen sich auch C ∞ -Kurven γ : I → U von U nach ϕ (U ) übertragen. Eine naheliegende Definition ist ϕ∗ γ = ϕ ◦ γ : I → ϕ (U ) . Aufgrund der Kettenregel gilt d (ϕ γ) (t) = dγ(t) ϕ (γ̇ (t)) . dt ∗ Beim Transport einer Kurve γ werden die Tangentenvektoren nicht wie die Werte eines Skalarfeldes unverändert von ϕ∗ mitgenommen, sondern der Tangentialapproximation von ϕ entsprechend linear verzerrt. Dieses ’Transformationsverhalten’ der Tangentenvektoren von Kurven motiviert die folgende Definition des Transports von Tangentenvektorfeldern. Definition 117 Sei U ⊂ V offen und ϕ : U → ϕ (U ) ⊂ V eine bijektive C ∞ Funktion. Für ein Vektorfeld X ∈ C ∞ (U : V ) heißt das Vektorfeld ϕ∗ X : ϕ (U ) → V mit (ϕ∗ X) (ϕ (v)) = (dv ϕ) (X (v)) der Transport von X unter ϕ. Ein Beispiel: Sei ϕ = A : V → V linear mit det A = 0. Dann folgt für X ∈ C (V : V ) , dass (A∗ X) (Av) = A (X (v)) oder auch kurz A∗ X = A ◦ X ◦ A−1 . ∞ KAPITEL 3. VEKTORANALYSIS 3.2.4 236 *Lieableitung von Skalar- und Tangentenvektorfeldern Sei U ⊂ V offen und X ∈ C ∞ (U : V ) . Dann existiert zu jedem Punkt p ∈ U eine lokale Flussabbildung Φ : (−ε, ε) × Up → U mit ∂t Φ (t, v) = X (Φ (t, v)) für alle (t, v) ∈ (−ε, ε) × Up . Der lokale Fluss transportiert ein Skalarfeld f ∈ C ∞ (U : R) in einer hinreichend kleinen Umgebung von p in die Abbildung Φ (t, ·)∗ f mit (Φ (t, ·)∗ f) (v) = f (Φ (−t, v)) für alle (t, v) ∈ (−ε, ε) × Up . Der Limes (Φ (t, ·)∗ f ) (v) − f (v) f (Φ (−t, v)) − f (v) = lim t→0 t→0 t t f (v − tX (v)) − f (v) = −dv f (X (v)) = − [X]v f = lim t→0 t (LX f ) (v) := lim gibt somit die beste lineare Approximation an die Kurve t → (Φ (t, ·)∗ f ) (v) bei t = 0. Das Skalarfeld LX f = − [X] f wird als die Lieableitung von f unter dem Vektorfeld X bezeichnet. Für ein Tangentenvektorfeld Y ∈ C ∞ (U : V ) ist eine analoge Konstruktion möglich, nämlich die folgende. (Φ (t, ·)∗ Y ) (v) − Y (v) (Φ (t, ·)∗ Y ) (Φ (t, v)) − Y (Φ (t, v)) = lim t→0 t→0 t t (dv Φ (t, ·)) Y (v) − Y (v + tX (v)) = lim t→0 t Y (v) + tdv X (Y (v)) − Y (v + tX (v)) = lim = dv X (Y (v)) − dv Y (X (v)) t→0 t = − [X, Y ]L (v) (LX Y ) (v) := lim Das Vektorfeld LX Y : U → V mit LX Y = − [X, Y ]L wird als Lieableitung des Vektorfeldes Y unter dem Vektorfeld X bezeichnet. Sie gibt der Lieklammer zweier Vektorfelder eine neue Bedeutung. Ein Vektorfeld Y ist ganau dann unter dem Transport mit dem Fluss des Vektorfeldes X invariant, wenn [X, Y ]L = 0. Ein anschauliches Bild der Lieableitung eines Vektorfeldes liefert das folgende Phänomen. Markieren Sie (zB mit Sägemehl) kleine Pfeile auf einer langsam strömenden Flüssigkeitsoberfläche (mit dem Geschwindigkeitsfeld X) und beobachten Sie, wie sich die Fußpunkte der Pfeile während eines kurzen Zeitintervalls verschieben und sich die Pfeile selbst drehen und dehnen. Mit ein bischen Phantasie können Sie die Lieableitung von Y unter dem Geschwindigkeitsfeld X an der lokalen Evolution der Pfeile um t = 0, nämlich Y (t, v) = Y (0, v) + t (LX Y ) (v) + o (t) = Y (0, v) − t [X, Y ] (v) + o (t) ablesen. KAPITEL 3. VEKTORANALYSIS 3.2.5 237 *Beschleunigung einer Integralkurve von γ̇ = X (t, γ) Die Kurve γ : I → V sei Lösung des nichtautonomen Differentialgleichungssystems erster Ordnung γ̇ (t) = X (t, γ (t)) für alle t im offenen reellen Intervall I. Die differenzierbare Abbildung X : D → V sei auf einer offenen Teilmenge D von R × V erklärt. Unter diesen Voraussetzungen lässt sich die ’Beschleunigung’ γ̈ (t) zur Zeit t bei Kenntnis des Ortes γ (t) zur Zeit t alleine aus der Funktion X berechnen. Man braucht also die Funktion γ selbst gar nicht wirklich zu kennen. Es gilt nämlich γ̈ (t) = ∂t X (t, γ (t)) + [X (t, γ (t))]γ(t) X (t, ·) . Warum ist das so? Es gilt γ̇ (t + ε) − γ̇ (t) X (t + ε, γ (t + ε)) − X (t, γ (t)) = lim ε→0 ε→0 ε ε X (t + ε, γ (t + ε)) − X (t, γ (t + ε)) + X (t, γ (t + ε)) − X (t, γ (t)) = lim ε→0 ε X (t + ε, γ (t + ε)) − X (t, γ (t + ε)) X (t, γ (t + ε)) − X (t, γ (t)) + lim = lim ε→0 ε→0 ε ε X (t, γ (t + ε)) − X (t, γ (t)) = ∂t X (t, γ (t)) + lim . ε→0 ε γ̈ (t) := lim Wegen γ (t + ε) = γ (t) + εγ̇ (t) + ψ (ε) mit limε→0 ψ (ε) /ε = 0 folgt X (t, γ (t + ε)) − X (t, γ (t)) X (t, γ (t) + εγ̇ (t) + ψ (ε)) − X (t, γ (t)) = lim ε→0 ε→0 ε ε = dγ(t) X (t, ·) (γ̇ (t)) = [γ̇ (t)]γ(t) X (t, ·) = [X (t, γ (t))]γ(t) X (t, ·) . lim Somit ist gezeigt, dass γ̈ (t) = ∂t X (t, γ (t)) + [X (t, γ (t))]γ(t) X (t, ·) . 3.2.6 Wegintegrale eines Vektorfeldes Ein Vektorfeld auf einem n-dimensionalen Raum ist durch n reellwertige Komponentenfunktionen der n Koordinaten bestimmt. Manche Vektorfelder lassen sich aus einem Skalarfeld durch Gradientenbildung, also aus einer einzigen reellwertigen Funktion der n Koordinaten erzeugen. Welche Vektorfelder sind das? Inwiefern sind sie ausgezeichnet? Eine Kurve γ : [a, b] → V heißt stückweise C 1 -Kurve, falls Zahlen a = t0 < t1 < t2 < ... < tk = b existieren, sodass die Einschränkungen der Kurve γ auf die Teilintervalle [ti , ti+1 ] allesamt C 1 -Kurven sind. Da für eine stückweise C 1 -Kurve die einseitigen Ableitungen auch in den Randpunkten ti der Teilintervalle existieren, ist eine solche Kurve überall stetig. KAPITEL 3. VEKTORANALYSIS 238 Definition 118 Sei U ⊂ V offen und X : U → V ein stetiges Vektorfeld. Die Abbildung γ : [a, b] → U sei eine stückweise C 1 -Kurve. Dann heißt k ti i=1 ti−1 X := γ X ◦ γ (t) , γ̇(t) dt das Kurvenintegral von X längs γ, wobei ·, · ein Skalarprodukt von V bezeichnet. Satz 119 (Reparametrisierungsinvarianz) Sei φ : [a′ , b′ ] → [a, b] eine stetig differenzierbare Abbildung mit φ(a′ ) = a und φ(b′ ) = b. Dann gilt für das Kurvenintegral eines stetigen Vektorfeldes X auf U längs γ : [a, b] → U, dass γ X = γ◦φ X. Falls φ(a′ ) = b und φ(b′ ) = a, dann gilt γ X = − γ◦φ X. Beweis. Siehe zB sect 16.3, p 352 in [10]. Aufgrund der Invarianz von Kurvenintegralen unter orientierungserhaltenden Umparametrisierungen werden Kurvenintegrale meist als Wegintegrale bezeichnet, da der Weg als (orientierte) Bildmenge der Kurve das Integral bereits festlegt. Ist ein Vektorfeld ein Gradientenfeld, dann sind Kurvenintegrale besonders einfach zu berechnen. Es gilt nämlich für X = grad (f ) und eine C 1 -Kurve γ aufgrund der Kettenregel b X = a γ b = a & ' gradγ(t) (f ) , γ̇ (t) dt = b dγ(t) f (γ̇ (t)) a d (f ◦ γ) (t) dt = f (γ (b)) − f (γ (a)) . dt Das Kurvenintegral eines Gradientenfeldes hängt also nicht vom detaillierten Verlauf der Kurve ab, sondern nur von ihren Anfangs- und Endpunkten. Eine stückweise C 1 Kurve γ : [a, b] → U ⊂ V heißt geschlossen, falls γ(a) = γ(b). Für eine geschlossene Kurve γ und ein Gradientenfeld X gilt daher γ X = 0. 3.2.7 Wegintegrale des Vortexfeldes Sei X der freie Vortex auf der Ebene ohne Nullpunkt, d.h. X : R2 0 → R2 mit X (x, y) = (−y, x) / x2 + y 2 . Sei γ : [0, ε] → R2 mit γ (t) = R (cos t, sin t) mit R ∈ R>0 und 0 < ε. Für das Skalarprodukt gelte (a, b) , (x, y) = ax + by. Dies ergibt γ̇ (t) = R (− sin t, cos t) und = > 1 X ◦ γ (t) , γ̇ (t) = (− sin t, cos t) , R (− sin t, cos t) = 1. R ε Daraus folgt γ X = 0 dt = ε. Insbesondere ist für ε = 2π die Kurve γ geschlossen und es gilt γ X = 2π. Moral: X ist kein Gradientenfeld! KAPITEL 3. VEKTORANALYSIS 3.2.8 239 *Flächeninhalt und Drehvektorfeld Sei L : R2 → R2 mit L (x, y) = (−y, x) . Das Kurvenintegral von L/2 längs einer Kurve γ : [a, b] → R2 1 2 1 L= 2 γ b a −γ 2 (t) γ̇ 1 (t) + γ 1 (t) γ̇ 2 (t) dt ergibt den (gewichteten, euklidischen) Inhalt der Fläche, die von γ überstrichen wird. Dabei wird ein ’infinitesimales’ Flächenelement positiv gewichtet, wenn (γ (t) , γ̇ (t)) zur Standardbasis gleichsinnig orientiert ist, und andernfalls negativ. Umrundet eine geschlossene Kurve das eingeschlossene Gebiet G einmal so, dass G in Laufrichtung gesehen links der Kurve liegt, dann ist γ L der Flächeninhalt von G. Der Grund dafür ist der: Wir wählen eine positiv orientierte ONB (e1 , e2 ) in R2 , sodass γ (t) = |γ (t)| e1 . Es gilt dann L ◦ γ (t) = |γ (t)| e2 . Weiters existiert genau ein Winkel ϕ (t) ∈ [0, 2π) , sodass γ̇ (t) = |γ̇ (t)| · (cos ϕ (t) · e1 + sin ϕ (t) · e2 ) . Damit folgt 1 1 L ◦ γ (t) , γ̇ (t) ∆t = |γ (t)| · |γ̇ (t)| · sin [ϕ (t)] · ∆t. 2 2 Für 0 ≤ ϕ (t) ≤ π ist somit L ◦ γ (t) , γ̇ (t) /2 die Fläche des Dreiecks mit den Eckpunkten 0, γ (t) , γ (t) + ∆t · γ̇ (t) , sodass der Name „Flächengeschwindigkeit” für L ◦ γ (t) , γ̇ (t) zutrifft. Für π < ϕ (t) < 2π gibt L ◦ γ (t) , γ̇ (t) die mit −1 multipliziere Fläche des Dreiecks, die Flächengeschwindigkeit ist negativ. Am Kartenbereich der Polarkoordinaten (r, φ) gilt übrigens, wie schon gezeigt, L = r2 gradφ und somit nach der Kettenregel & 2 ' L ◦ γ (t) , γ̇ (t) = r gradφ ◦ γ (t) , γ̇ (t) = |γ (t)|2 (φ ◦ γ)′ (t) . Überprüfen wir diese Überlegung an einem Kreis mit dem Radius R und dem Mittelpunkt (a, b) . Es gilt mit γ (t) = (a + R cos t, b + R sin t) 2π L = γ [− (b + R sin t) (−R sin t) + (a + R cos t) (R cos t)] dt 0 2π = R2 sin2 t + cos2 t dt = 2R2 π. 0 Das Integral γ L/2 stimmt also wirklich mit dem Flächeninhalt eines Kreises vom Radius R überein. Johannes Kepler konnte den Aufzeichnungen Tycho de Brahes über seine Planetenbeobachtungen Hinweise darauf entnehmen, dass erstens jede Planetenbahn in einer Ebene durch die Sonne liegt und zweitens die Flächengeschwindigkeit des Vektors von der Sonne zum betrachteten Planeten im Lauf der Zeit konstant ist. Isaak Newton gelang es dann, diese ersten beiden „Keplerschen Gesetze” als eine Folge der Drehimpulserhaltung bei Bewegungen in einem Zentralkraftfeld F = |F | · ιd/ |·| zu deuten und zwar so. KAPITEL 3. VEKTORANALYSIS 240 Die Abbildung t → γ (t)× γ̇ (t) ist konstant, wenn γ (t) den Vektor von der Sonne zum Planeten zur Zeit t bezeichnet, da wegen mγ̈ (t) = (F ◦ γ) (t) γ (t) d (γ (t) × mγ̇ (t)) = γ (t) × mγ̈ (t) = − |F (γ (t))| γ (t) × =0 dt |γ (t)| folgt. Hier bezeichnen m die Masse des Planeten, F das von der Sonne erzeugte Kraftvektorfeld und γ (t) × mγ̇ (t) den Bahndrehimpuls(vektor) des Planeten zur Zeit t. Er ist, wie natürlich auch γ (t) × γ̇ (t) , eine (vektorielle) Konstante der Bewegung. Der Bahndrehimpuls definiert, falls er nicht 0 ist, somit die t-unabhängige Flächeneinheitsnormale γ (t) × γ̇ (t) n= |γ (t) × γ̇ (t)| auf die Bahnebene. Es folgt daraus γ (t) , n = 0 für alle t. Daher liegt γ (t) zu jeder Zeit in jener Ebene durch 0, die senkrecht auf n steht. Die Flächengeschwindigkeit des Planeten zur Zeit t ist dann mit dem Drehvektorfeld Ln : p → n × p durch (Ln ◦ γ) (t) , γ̇ (t) = n × γ (t) , γ̇ (t) = γ (t) × γ̇ (t) , n = |γ (t) × γ̇ (t)| gegeben und ist somit zeitlich konstant. Sie ist positiv, da das Tripel (γ (t) , γ̇ (t) , n) positiv orientiert ist. Für γ (t) × γ̇ (t) = 0 verläuft die Bahn in einer Geraden durch 0. Die Flächengeschwindigkeit |γ (t) × γ̇ (t)| verschwindet in diesem Fall. 3.2.9 Konservative Vektorfelder und Potentiale Bewegt sich ein Körper unter dem ausschließlichen Einfluss eines vorgegebenen Kraftfeldes12 X : V → V, dann folgt seine Bewegung einer (zeitparametrisierten) Kurve γ : [t0 , t1 ] → V, die Newtons Bewegungsgleichung mγ̈ = X ◦ γ löst. Existiert für das das Kraftfeld X eine Potentialfunktion Φ mit X = −grad (Φ) , dann ist die Gesamtenergie der Lösung γ, nämlich die Summe aus kinetischer und potentieller Energie längs γ m E γ = |γ̇|2 + Φ ◦ γ 2 eine konstante Funktion. Das kommt so zustande: d m md |γ̇ (t)|2 + Φ (γ (t)) = γ̇ (t) , γ̇ (t) + dγ(t) Φ (γ̇ (t)) dt 2 &2 dt ' = m γ̈ (t) , γ̇ (t) + gradγ(t) Φ, γ̇ (t) = 0. Wird der Körper unter Zuhilfenahme von regelbaren Zusatzkräften (’Zwangskräften’) längs einer beliebigen C 1 -Kurve γ : [0, 1] → V mit γ̇ (0) = 0 = γ̇ (1) durch das Kraftfeld X vom Punkt γ (0) zum Punkt γ (1) geführt, dann gibt − γ X die von den Zwangskräften verrichtete Arbeit an. Ist diese positiv, dann nimmt die potentielle Energie des Körpers im Kraftfeld X zu. (Die kinetische Energie am Anfang und 12 ZB dem Schwerefeld der Erde. KAPITEL 3. VEKTORANALYSIS 241 am Ende des Weges verschwindet ja wegen γ̇ (0) = 0 = γ̇ (1) .) Ist die Arbeit negativ, nimmt die potentielle Energie des Körpers im Feld X ab. Der die Zwangskräfte erzeugende Rest der Welt ’bezieht’ dann Energie aus dem System, das aus dem Körper im Kraftfeld X besteht. Die Gesamtenergie bleibt auch hier ’konserviert’. Ist γ ein geschlossener Weg und X das statische Kraftfeld einer in der Natur realisierten Bewegungsgleichung des Typs mγ̈ = X ◦ γ, dann gilt nach heutigem Wissensstand jedenfalls γ X = 0. Wäre das nicht so, gäbe es periodische Prozesse, aus denen unbegrenzt Energie bezogen werden könnten. Eine solche Welt wäre ziemlich sicher instabil. Energie und damit die Vehemenz der Vorgänge dieser Welt würde unbegrenzt anwachsen und lebende Organismen wären bald ausgelöscht. Definition 120 Ein stetiges Vektorfeld X : U → V heißt konservativ, wenn für alle geschlossenen C 1 -Kurven γ mit Werten in U gilt, dass γ X = 0. Anmerkung: Jedes Gradientenvektorfeld ist offenbar konservativ. Das Vektorfeld X von Abschnitt 3.1.14, das durch Fortsetzung des Gradientenvektorfeldes des Polarwinkels ϕ entsteht, ist also nicht konservativ. Es gilt ja für eine geschlossene Kurve γ, welche den Ursprung einmal umläuft γ X = 2π. Die Einschränkung von X auf R2 R≥0 · e1 ist hingegen konstruktiongemäß das Gradientenfeld von ϕ. Der folgende Satz legt klar, dass nicht nur jedes Gradientenfeld konservativ ist, sondern auch jedes konservative Vektorfeld Gradient eines Skalarfeldes ist. Satz 121 Ein stetiges Vektorfeld X : U → V mit offenem U ⊂ V ist genau dann konservativ, wenn es eine C 1 -Funktion f : U → R gibt, für die X = grad (f ) gilt. (Die Funktion −f wird dann als ein Potential von X bezeichnet.) Ist U kurvenzusammenhängend und sind f und g Potentiale von X, dann ist f − g konstant. Beweis. Siehe: [10], p. 358. Anmerkung: Auf den kurvenzusammenhängenden Teilen des Definitionsbereiches eines konservativen Vektorfeldes X ist ein Potential von X also bis auf eine additive Konstante eindeutig bestimmt. Jedes stetige, drehinvariante, radiale Vektorfeld ist konservativ f : (a, b) → R mit 0 ≤ a < b sei stetig. Für X : {p ∈ V : a < |p| < b} → V gelte X (p) = 2f |p|2 p. In jedem Punkt p ist X (p) ein skalares Vielfaches von p. Man sagt daher X sei ein radiales Vektorfeld. Außerdem gilt X ◦ R = R ◦ X für alle R ∈ SOn , da |Rp| = |p| für alle p ∈ U und für alle R ∈ SOn . Man sagt daher X ist ein drehinvariantes Vektorfeld. (Jedes radiale, drehinvariante und stetige Vektorfeld ist vom hier angegebenen Typ.) Sei F eine Stammfunktion von f. Wegen X (p) = 2F ′ |p|2 p = F ′ |p|2 gradp |·|2 = gradp F ◦ r2 ist X ein Gradientenfeld und somit konservativ. Die Kraft, mit der die Erde an einer Masse zieht, ist als Funktion des Ortes der Masse zwar ein Gradientenfeld, aber nur annähernd radial und drehinvariant. Dies erschwert die Höhenbestimmung von Bergen. KAPITEL 3. VEKTORANALYSIS 3.2.10 242 *Landvermessung: Wegabhängige Höhendifferenz? Bei der Landvermessung spielen Wegintegrale eines konservativen Vektorfeldes eine Rolle: Was ist mit der Aussage gemeint, dass der Großglockner eine Höhe von 3798m über Meeresniveau hat? Wo ist das Meeresniveau unter dem Großglockner, zu dem man durch einen Schacht ein Lot hinunterlassen könnte? Eine Ersatzkonstruktion hilft aus: Längs einer Kurve γ, die von einem Ort p1 am Meer in Venedig zum Gipfel p2 des Großglockners führt, wird mit einer Wasserwaage und einer Federwaage das Gradientenfeld des Gravitationspotentials φ einer Testmasse m im Feld der Erde bestimmt, und durch Triangulieren die Arbeit W = γ grad (φ) = φ (p2 ) − φ (p1 ) gemessen. W/mg ist ein Höhenunterschied, der nicht vom Weg γ abhängt. Dabei ist g ein standardisierter Wert der Erdbeschleunigung. Würde man auf die Federwaage verzichten und lediglich mit Wasserwaage, Längen- und Winkelmessern arbeiten, so könnte man nur das Wegintegral γ grad (φ) |grad (φ)| messen. Dieses ergibt aber eine wegabhängige Seehöhe, da im Fall des Gravitationspotentials φ der Erde das Vektorfeld grad (φ) / |grad (φ)| nicht konservativ ist.13 Hier ein 2d Beispiel dazu. Sei φ : R2 → R mit dem Standardkartenausdruck φ = x2 − y 2 . Auf R2 0 gilt X := grad (φ) = |grad (φ)| 1 x2 + y 2 (x · e1 − y · e2 ) . Für die beiden Komponentenfunktionen X 1 = x/ x2 + y 2 und X 2 = −y/ x2 + y 2 −3/2 des Vektorfeldes X gilt ∂1 X 2 − ∂2 X 1 = 2xy (x2 + y 2 ) . Die Tatsache ∂1 X 2 = ∂2 X 1 stellt nun, wie im nächsten Abschnitt klar wird, bereits sicher, dass X nicht konservativ ist. Figur 3.11 zeigt das Vektorfeld X. Um gleich hier zu sehen, dass X nichtkonservativ ist, basteln wir einen geschlossenen Weg γ mit nichtverschwindendem Wegintegral über X. Er ist die Zusammensetzung von vier Wegen, nämlich einem (im Gegenuhrzeigersinn durchlaufenen) Viertelkreis um 0 von R · e1 nach R · e2 mir R > 0. Anschließend wird die y-Achse von R · e2 bis r · e2 mit 0 < r durchlaufen, dann der Viertelkreis um 0 von r · e2 nach r · e1 im Uhrzeigersinn. Der Rest des Weges wird entlang der x-Achse von re1 bis R · e1 zurückgelegt. Es folgt (Übung!) γ X = R − r. 13 Nun sind Sie für einen Besuch der wunderbaren Abteilung für Geodäsie des technischen Museums in München gerüstet. KAPITEL 3. VEKTORANALYSIS 243 Abbildung 3.11: Das Vektorfeld grad (φ) / |grad (φ)| zu φ = x2 − y 2 3.2.11 Poincarés Existenzsatz für skalare Potentiale Definition 122 Ein C 1 -Vektorfeld X : U → V mit offenem U ⊂ V heißt rotationsfrei, falls bezüglich einer Basis e von V auf U die Gleichungen ∂ie ej , X = ∂je ei , X für alle i, j gelten. Das folgende Lemma gibt der Rotationsfreiheit Bedeutung. Lemma 123 Jedes C 1 -Vektorfeld mit Potential ist rotationsfrei. −1 gilt ∂i ∂j fe = ∂j ∂i fe und wegen Beweis. Für die C 2 -Funktion fe := f ◦ Φe|U ej , X = ej , grad f = ∂je f auch ∂ie [ ej , X ] = ∂ie ∂je f = ∂je ∂ie f = ∂je [ ei , X ] . Ist e eine ONB(!) und ist Xei := Φie ◦ X, d.h. es gilt X = ni=1 Xei ei , ist X wegen i Xe = ei , X genau dann rotationsfrei, wenn ∂ie Xej = ∂je Xei für alle i, j. Will man erkennen, ob ein C 1 -Vektorfeld X konservativ ist, wird man zunächst prüfen, ob X rotationsfrei ist. (Das ist eine einfache Differentiationsaufgabe.) Ist X nicht rotationsfrei, dann ist X sicher kein Gradientenfeld und somit auch nicht konservativ. Ist X aber rotationsfrei, wird man als nächsten Schritt versuchen, einige Kurvenintegrale von X längs geschlossener Kurven zu berechnen. Ist ein solches Integral ungleich 0, dann ist X nicht konservativ. Sind aber alle berechneten Kurvenintegrale gleich 0, und schafft man es nicht, wirklich alle existenten geschlossenen Kurvenintegrale zu berechnen, dann wird man untersuchen, ob X ein Potential hat. (Dazu sind partielle Differentialgleichungen zu lösen.) Findet man ein Potential von X, dann ist klar, dass X konservativ ist. Findet man keines, dann bleibt weiter unklar, ob X konservativ ist. Als Beispiel für dieses Vorgehen nehmen wir das Gradientenfeld X des Polarwinkels aus Abschnitt 3.1.14. Der erste Schritt zeigt: X ist rotationsfrei und könnte somit konservativ sein. Der zweite Schritt zeigt, dass X nicht konservativ ist. Daher hat X auch kein Potential. Der folgende Satz gibt eine einschränkende Bedingung für den Definitionsbereich eines Vektorfeldes X an, die sicherstellt, dass aus der Rotationsfreiheit von X folgt, dass X konservativ ist. Erfüllt der Definitionsbereich von X die Bedingung KAPITEL 3. VEKTORANALYSIS 244 des Satzes, dann reduziert sich die Untersuchung, ob X konservativ ist, auf die Berechnung der Rotation von X. Für solche Vektorfelder X gilt also: X ist genau dann konservativ, wenn es rotationsfrei ist. Definition 124 Eine Teilmenge U ⊂ V heißt sternförmig, wenn ein Punkt p0 ∈ U existiert, sodass für jeden Punkt p ∈ U die Verbindungsstrecke zwischen p0 und p zur Gänze in U liegt, d.h. es gilt {tp0 + (1 − t)p | 0 ≤ t ≤ 1} ⊂ U. Satz 125 (Poincaré-Lemma) Sei U ⊂ V offen und sternförmig. X : U → V sei ein rotationsfreies C 1 -Vektorfeld. Dann existiert eine Funktion f : U → R mit X = grad (f ) . Beweis. (Siehe: [10], p. 362; [4], Vol 1, Kap VI, § 24.5.5) Eine nützliche Anwendung von Poincarés Lemma: Ein elektrostatisches Naturgesetz besagt, dass das (statische!) elektrische Kraftfeld E : R3 → R3 einer statischen (und hinreichend glatten) Ladungsdichte ein rotationsfreies C 1 -Vektorfeld ist. Daher existiert ein Potential Φ : R3 → R mit E = −grad (Φ) . 3.2.12 Divergenz eines Vektorfeldes Ein Vektorfeld X kann in der Nähe eines Punktes p ∈ V im Mittel mehr oder weniger auf p hinweisen oder auch weggerichtet sein. Wie kann man diese vage formulierte Eigenschaft quantifizieren? Der Fluss des Vektorfeldes durch die Oberfläche einer ’sehr’ kleinen, (stückweise) glatt berandeten Umgebung von p ist das entscheidende Instrument: Lege einen kleinen achsenparallelen Würfel um den Punkt, multipliziere zu jeder der 2n Würfelflächen die nach außen gerichtete Flächeneinheitsnormale skalar mit einem repräsentativen Wert des Vektorfeldes auf der jeweiligen Oberfläche. Addition der Flüsse und anschließende Division durch das Volumen des Würfels ergibt im Grenzübergang zur Kantenlänge 0 einen das lokale Auseineanderstreben von X in p quantifizierenden Zahlenwert, die Divergenz des Vektorfeldes in p. Die Ausarbeitung dieser Idee gelingt mit der Tangentialapproximation n ek ε (∂ie )p X k + o (ε) . X (p + εei ) = X (p) + k=1 Die beiden gegenüberliegenden Würfelseiten, die zur Achse ei senkrecht stehen, tragen dann im Fall einer ONB e folgendermaßen bei: ( ) ( ) ε ε X p + ei , εn−1 ei + X p − ei , −εn−1 ei = εn ∂ie X i (p) + εn−1 o (ε) . 2 2 Daher gilt 1 ε→0 εn n lim i=1 0 1 εn (∂ie )p X i + εn−1 o (ε) = n (∂ie )p X i . i=1 KAPITEL 3. VEKTORANALYSIS 245 Definition 126 Sei U ⊂ V offen. Das Vektorfeld X : U → V sei ein C 1 -Vektorfeld auf U. Sei e eine beliebige Basis von V. Die Komponentenfunktionen Xei : U → R von X erfüllen X =: ni=1 Xei ei . Dann heißt das Skalarfeld div (X) : U → R mit e i n div (X) := i=1 ∂i Xe Divergenz oder Quelldichte von X. Ein Vektorfeld X mit div (X) = 0 wird divergenzfrei genannt. In die Bildung der Divergenz geht die Wahl einer Basis ein. Trotzdem ist das Skalarfeld div (X) unabhängig von dieser Wahl. Ist nämlich f = e · M eine weitere Basis von V, dann gilt 2 n 3 n n n n n f ∂i Xfi = i=1 n n M −1 [fi ] i=1 Mij M −1 k=1 j=1 i=1 Xek = k=1 n = i k i k M −1 k=1 i=1 n δjk [ej ] Xek k=1 j=1 ej Mij Xek j=1 n [ej ] Xek = i k n [ek ] Xek = div (X) . = k=1 Obwohl die Definition der Divergenz hier mithilfe einer Überlegung motiviert wurde, die neben einer Basis auch ein Skalarprodukt benützt, ist die Divergenz eines Vektorfeldes auch unabhängig von der Wahl des Skalarproduktes.14 Im 3d Fall ist die Divergenz eines Vektorfeldes eine wichtige Größe der Elektrostatik. Sie dient der Formulierung eines Zusammenhangs zwischen elektrostatischem Feld E und elektrischer Ladungsdichte ρ. Es gilt nämlich das Naturgesetz div E = ρ/ε0 . Der Integralsatz von Gauß gibt der Divergenz eines Vektorfeldes eine recht anschauliche Bedeutung. Er sagt im Fall des Vektorfeldes E (in etwas präziserer Form), dass der Fluss von E durch den 2-dimensionalen, auswärts orientierten Rand eines kompakten Bereiches mit dem Volumsintegral der Ladungsdichte ρ/ε0 übereinstimmt. Die Größe ρ/ε0 ist deshalb die Quelldichte von E. Ganz ähnlich liegen die Dinge in der Strömungslehre. Die Divergenz des Geschwindigkeitsfeldes X einer Strömung gibt Auskunft darüber, ob diese Strömung als tatsächlich zeitunabhängige Strömung ohne Quellen oder Senken realisiert werden kann. Wäre etwa divp X < 0, dann müsste im Inneren einer genügend kleinen Kugel um p die in ihr enthaltene Flüssigkeitsmenge permanent zunehmen. Das geht allem Anschein nach im 2d Fall nur, wenn aus dem Punkt p Flüssigkeit seitlich, also in eine zusätzliche Dimension, abgesaugt wird. Im 3d Fall scheint divX = 0 statisch, also dauerhaft, gar nicht physikalisch realisierbar zu sein. Ist das Vektorfeld X : U → V vom C 1 -Typ, dann hat die Differentialgleichung γ̇ = X ◦ γ eindeutig bestimmte maximale Lösungen γ p zur Anfangsvorgabe γ (0) = p. Es existiert also eine (eindeutig bestimmte) lokale Flussabbildung Φ mit Φ (t, p) = γ p (t) und es steht für hinreichend kurze Evolutionszeiten t fest, in welche Punktmenge die Strömung mit dem Geschwindigkeitsfeld X eine Punktmenge 14 Der tiefere Grund dafür ist die Tatsache, dass der Fluss eines Vektorfeldes X durch eine Fläche der Kodimension 1 nach Wahl einer Volumsform τ ∈ Ωn (V ) bereits eindeutig festgelegt ist. Im Quotineten von Fluss und Volumen kürzt sich die einzige willkürliche Normierungskonstante der Volumsform heraus. Eine explizit basis- und skalarproduktfreie Definition der Divergenz von X liefert Cartans Kalkül der Differentialformen durch d [τ (X, ·)] = div (X) τ . KAPITEL 3. VEKTORANALYSIS 246 Ω ⊂ U überführt. Ist Ω eine glatt berandete messbare Menge, dann folgt (ein Bild zusammen mit dem Integralsatz von Gauß macht es zumindest plausibel) , , n , d x, = X, n df = div (X) dn x. ∂t Φ(t,Ω) t=0 ∂Ω Ω Für div (X) = 0 ist das Volumen von Ω unter dem Transport mit der Strömung des Geschwindigkeitsfeldes X daher unverändert. Man sagt: eine divergenzfreie Strömung ist volumserhaltend. Ganz einfache Beispiele sind die Vektorfelder X = id = (x, y) , und Y = (x, −y) auf R1×2 . Es gilt div (X) = 2 und div (Y ) = 0. Berechnen wir noch zur Kontrolle und Übung div (Y ) mithilfe der Basis f1 = (1, 1) , f2 = (0, 1) . Es gilt (x, y) = (x, x) + (0, y − x) = xf1 + (y − x) f2 . Die kontravarianten Koordinatenfunktionen von R1×2 zur Basis f sind somit u = x und v = y − x. Daraus folgt Y = (x, −y) = (x, x) + (0, −x − y) = xf1 − (x + y) f2 = uf1 − (v + 2u) f2 . f f Also gilt Yf1 = u und Yf2 = −2u − v. Nun folgt div (Y ) = ∂1 Yf1 + ∂2 Yf2 = 1 − 1 = 0. Stellt man sich die Vektorfelder X und Y als Geschwindigkeitsfelder von ebenen Wasserströmungen zwischen zwei Glasplatten vor, ist klar, dass ohne seitliche Wasserzufuhr X nicht zu realisieren ist, Y hingegen schon. Siehe Abbildungen 3.12, 3.13. In der Strömung X müssten Hohlräume entstehen, da das Wasser in immer größerer Entfernung vom Zentrum immer schneller abfließt. Es muss also überall durch Löcher in den Glasplatten Wasser nachgeliefert werden. Im Fall von Y strömt Wasser aus großer Entfernung zum Zentrum hin, wird dabei langsamer und strömt wieder nach außen ab. Diese Strömung kommt ohne seitliche Wasserzufuhr aus. 0 0 Abbildung 3.12: Das Vektorfeld X = (x, y) Das elektrische Feld einer Punktladung Sei r : V → R die Norm zu einem Skalarprodukt von V und sei e eine Basis von V. Zu ihr gehören die Koordinatenfunktionen x1 , . . . , xn . Die reelle Funktion f : (a, b) → R mit 0 ≤ a < b sei differenzierbar. Setze X(p) = f(|p|) · p. Es gilt also auf U := {p ∈ V | a < |p| < b} die Funktionsgleichung X = ni=1 f (r)xi ei . KAPITEL 3. VEKTORANALYSIS 247 0 0 Abbildung 3.13: Das Vektorfeld Y = (x, −y) Ist e orthonormiert, dann gilt auf U nach Produkt- und Kettenregel ∂je f (r)xi = f ′ (r) xj i x + f (r)δ ij r und somit div (X) = rf ′ (r) + nf (r). Insbesondere folgt durch Wahl der konstanten Funktion f = 1, dass div (id) = n auf ganz V . Welche Funktionen f machen X divergenzfrei? Offenbar ist X genau dann divergenzfrei, wenn f eine Lösung der auf dem Gebiet (x, y) ∈ R>0 × R definierten Differentialgleichung y ′ = −ny/x ist. Für die Menge L aller maximalen Lösungen dieser Differentialgleichung, sie ist vom Typ der separierten Variablen, gilt (Nachrechnen!): L = {α : R>0 → R, x → Cx−n | C ∈ R} . Somit existiert für jedes radiale, drehinvariante, divergenzfreie Vektorfeld X eine Konstante C ∈ R, sodass X auf seinem Definitionsbereich mit XC : V 0 → V, XC (p) = Cp/ |p|n übereinstimmt. XC ist das elektrische Feld einer Punktladung im n-dimensionalen Raum. Die Fälle n = 1 bzw. n = 2 ergeben das elektrische Feld einer Flächen-, bzw. Linienladung im 3dimensionalen Raum. Für C = 0 hat XC keine stetige Fortsetzung auf ganz V. Es existiert also kein drehinvariantes, radiales, von 0 verschiedenes Vektorfeld, das auf ganz V divergenzfrei ist. Für n = 2 zeigen die Abbildungen 3.14 bzw 3.15 die Summe bzw die Differenz der Translate von XC um e bzw −e. Diese Felder repräsentieren das elektrische Feld zweier Punktladungen gleicher Stärke und gleichen bzw gegengesetzten Vorzeichens. Drehvektorfelder sind divergenzfrei Sei dim V = 3 und n ∈ V. Setze15 L : V → V, p → n × p. Bezüglich einer ONB hat L den Koordinatenausdruck 2 3 n x − n3 x2 L = e · n3 x1 − n1 x3 . n1 x2 − n2 x1 15 Das Vektorfeld ωL ist also das Geschwindigkeitsfeld eines starren Körpers, der mit der Winkelgeschindigkeit ωn rotiert. KAPITEL 3. VEKTORANALYSIS 248 Abbildung 3.14: E-Feld gleicher Punktladungen Abbildung 3.15: E-Feld gegengesetzter Punktladungen i Wegen ∂L = 0 folgt div (L) = 0. Jedes Drehvektorfeld ist also divergenzfrei und ∂xi damit volumserhaltend. Hamiltonsche Vektorfelder sind divergenzfrei Sei H : U → R zwei mal stetig differenzierbar. (Hamiltonfunktion) Dabei ist U ⊂ V offen in einem Vektorraum V mit dim V = 2n. Das Hamiltonsche Vektorfeld XH hat in der Karte (q 1 , . . . q n , p1 , . . . pn ) zu einer symplektischen Normalbasis (e1 , . . . e2n) von V die Zerlegung n XH = i=1 n ∂pi H · ei − i=1 ∂qi H · en+i . Daher gilt div (XH ) = ni=1 ∂qi ∂pi H − ∂pi ∂qi H = 0. Hamiltonsche Flussabbildungen sind somit volumserhaltend, ein berühmtes Ergebnis von Liouville. 3.2.13 Faulenzerregeln zur Divergenz und Beispiele Lemma 127 Seien X, Y in p differenzierbare Vektorfelder und sei f eine in p differenzierbare Skalarfunktion. Weiter sei λ ∈ R. Dann gilt: KAPITEL 3. VEKTORANALYSIS 249 Abbildung 3.16: Das Drehvektorfeld L in einer Ebene senkrecht zu n 1. divp (X + Y ) = divp (X) + divp (Y ) 2. divp (λX) = λ divp (X) & ' 3. divp (f X) = gradp (f ) , X (p) + f (p) divp (X) Das Vektorpotential eines Punktdipols ist quellenfrei Für X : V 0 → V ≃ R3 mit X (p) = f (|p|) L (p) = f (|p|) n × p und f ∈ C 1 (R>0 : R) folgt divp (X) = f ′ (|p|) p/ |p| , n × p + f (|p|) divp L = 0. Was das Vektorpotential X mit dem magnetischen Feld eines magnetischen Punktdipolmoments zu tun hat, wird im Kapitel über die Rotation eines Vektorfeldes klar werden. Die Quelldichte eines radialen Vektorfelds Ein radiales Vektorfeld X erfüllt X = f (r) · id mit differenzierbarem f : I → R auf einem offenen Intervall I ⊂ R>0 . Dann gilt divp X = |p| f ′ (|p|) + nf (|p|) . Das ergibt sich mit Regel 3 folgendermaßen & ' divp X = divp [(f ◦ r) · id] = gradp (f ◦ r) , p + f (|p|) divp (id) = > p ′ = f (|p|) , p + nf (|p|) = |p| f ′ (|p|) + nf (|p|) . |p| Allgemeine Vortexfelder sind divergenzfrei Sei dim V = 3 und n ∈ V mit |n| = 1. Sei L : V → V, p → n×p und sei f : R>0 → R differenzierbar. Dann ist mit ρ := |L| : V → R auf U := V (R·n) das Vektorfeld X : U → V, p → f (ρ(p)) · (n × p) ein C 1 -Vektorfeld. Es heißt allgemeines Vortexfeld. ZB das Magnetfeld eines langen stromführenden Drahtes endlicher Dicke ist von dieser Art X = f (ρ)L. KAPITEL 3. VEKTORANALYSIS 250 Die Zahl ρ(p) = |n × p| ist der Normalabstand von p zur Achse R·n. Somit gilt X (p + λn) = X (p) für alle λ ∈ R. Man sagt: X ist invariant unter Verschiebungen parallel zu n. Weiter folgt X eαLn p = eαLn X (p) für alle α ∈ R. Man sagt: X ist invariant unter den Drehungen um n. Aus dem Gradienten der 2d-Abstandsfunktion folgt gradp (ρ) = |p − n n, p |−1 (p − n n, p ) . Dieser Gradientenvektor steht in p senkrecht zum Zylindermantel durch p mit Achse R·n. Der Vektor L(p) hingegen ist tangental zum Mantel in p. Somit gilt & ' divp (X) = divp (f (ρ) · L) = gradp (f (ρ)) , L (p) + f (ρ(p)) · divp (L) & ' = f ′ (ρ(p)) gradp (ρ) , L (p) + 0 = 0. 3.2.14 Laplace-Operator Nun zur Quelldichte des Gradientenfeldes eines skalaren Feldes. Definition 128 Sei U ⊂ V offen und f : U → R sei eine C 2 -Funktion. Dann heißt das Skalarfeld ∆f : U → R, p → divp (grad (f)) Laplace von f zum Skalarprodukt ·, · von V. Die zugehörige lineare Abbildung ∆ : C 2 (U : R) → C (U : R) heißt Laplace-Operator auf U. ij Ist e eine Basis von V, dann gilt ∆f = ni,j=1 G−1 ∂ie ∂je f. Im Fall einer ONB e folgt weiter (∆f ) (v) = ni=1 ∂i ∂i fe (ve ) . Ist beispielsweise V = R2 mit der Standardbasis e = (e1 , e2 ) und den zugehörigen Standardkoordinatenfunktionen (x, y) dann folgt für die Funktion u = x2 − y 2 , dass ∆u = 0, wenn ∆ mit dem Standardskalarprodukt gebildet wird. Ein weiteres Skalarprodukt auf V hat bezüglich der Basis e die Gramsche Matrix Ge = 2 1 1 1 mit der Inversen G−1 e = 1 −1 −1 2 . Dann folgt für den Laplaceoperator ∆ zu diesem zweiten Skalarprodukt ∆u = ∂x2 + 2∂y2 − 2∂x ∂y u = −2. Der Laplaceoperator hängt also wenig überraschend wie der Gradient von der Wahl des Skalarprodukts ab. ∆u für radialsymmetrische Funktionen u Eine Funktion u : V ⊃ U → R ist genau dann invariant unter allen Drehungen um 0, wenn U selbst unter diesen invariant und u konstant auf den Niveauflächen der Norm von V ist. Eine solche Funktion u wird als radialsymmetrisch bezeichnet. Lemma 129 Sei r : V → R, p → |p| und sei f : R>0 ⊃ D → R eine C 2 -Funktion. D sei offen. Für u = f ◦ r ≡ f (r) auf U := {v ∈ V : |v| ∈ D} folgt dann ∆u = f ′ (r) mit n = dim(V ). f ′′ (r) + n−1 r KAPITEL 3. VEKTORANALYSIS 251 Beweis. Zunächst folgt auf U, dass grad (f ◦ r) = f ′ (r) grad (r) = (f ′ (r)/r) · id. Weiter folgt mit Faulenzerregel 3. von Bemerkung 127 zur Divergenz, dass > = f ′ (r) f ′ (r) div (grad (f ◦ r)) = grad , id + div (id) r r $ % ′ = ′′ > f ′ (r) f ′ (r) f (r) f ′ (r) id f ′ (r) grad (r) , id + n · , id + n = = − 2 r r r r r r = f ′′ (r) + (n − 1) ′ f (r). r Beispiel: ∆rα = α (n + α − 2) rα−2 auf V 0 für α ∈ R. (*Daher ist −r/8π bzw r3 /12 Fundamentallösung von ∆23 bzw ∆21 .) In den folgenden vier Abschnitten werden reellwertige Funktionen u untersucht, die auf beinahe ganz V definiert sind und ∆u = λu für ein λ ∈ R erfüllen. Überdies haben diese Funktionen ein hohes Maß an Symmetrie. Die Fehlstellen im Definitionsbereich von u sind entweder ein einziger Punkt, eine Halbgerade, eine Gerade, oder eine Ebene. Die hohe Symmetrie reduziert die Gleichung ∆u = λu auf eine gewöhnliche Differentialgleichung, wodurch solche Funktionen systematisch aufgefunden werden können. Zuerst wird der für die Elektrostatik wichtige Fall λ = 0 behandelt und dann der Fall λ = 0, der in der (zB quantenmechanischen) Streutheorie benötigt wird. Einige der hier behandelten Funktionen sind Greensche Funktionen der Laplace- bzw Helmholtzgleichung. Sie werden im zweiten Teil der Vorlesung weiter behandelt. 3.2.15 Potential einer Punktladung (dim V = n) Für welche Funktionen f : R>0 → R gilt ∆ (f ◦ r) = 0? Dies gilt genau dann, wenn f ′ eine Lösung der Differentialgleichung y ′ = 1−n y auf (x, y) ∈ R>0 × R ist. Die x allgemeine maximale Lösung dieser Gleichung lautet y = Cx1−n mit C ∈ R. Also gilt f ′ (r) = Cr1−n . Daraus folgt durch Integration, dass f(r) eine Funktion des Typs f (r) = A rn−2 +B für n = 1, 3, 4, ... A ln (r) + B für n = 2 mit A, B ∈ R ist. Für A = 0 und n > 1 lässt sich f (r) nicht stetig auf V fortsetzen. Die Funktionen f (r) sind als Potentiale von Flächen-, Linien- und Punktladungen in der Elektrostatik von Bedeutung. Warum? Im wichtigsten Fall n = 3 folgt für den Fluss von −grad (Ar−1 + B) = Ar−2 (ιd/r) durch eine (nach außen orientierte) Kugeloberfläche um 0 = > A ιd −grad +B , R2 dΩ = 4πA r r ∂KR mit KR = {v ∈ V : |v| < R} . Ist A/r + B für A, B ∈ R ein elektrisches Potential, dann wird das Integral > = ιd A +B , R2 dΩ = 4πA · ε0 =: Q ε0 · −grad r r ∂KR KAPITEL 3. VEKTORANALYSIS 252 als die elektrische Ladung des Potentials A/r + B bezeichnet. Die Funktion Φ= Q +B :V 4πε0 r 0→R heißt daher Potential einer Punktladung der Stärke Q in 0. Die Konstante B ist durch kein physikalisches Gesetz geregelt und wird meist gleich 0 gewählt. Im Fall n = 2 folgt für den Fluss von −grad (A ln r + B) = −Ar−1 (ιd/r) durch eine (nach außen orientierte) Kreislinie um 0 = > ιd −grad (A ln r + B) , Rdϕ = −2πA. r ∂KR Ist A ln r + B für A, B ∈ R ein elektrisches Potential, dann wird das Integral = > ιd −grad (A ln r + B) , ε0 · R2 dΩ = −2πA · ε0 =: σ r ∂KR als die elektrische Linienladungsdichte des Potentials A ln r + B bezeichnet. Die Funktion Φ = −σ (ln (r) /2πε0 ) + B : V 0 → R dient als Potential einer Linienladungsdichte der Stärke σ durch 0 in folgendem Sinn: Ein homogen geladener, langer, gerader Draht befinde sich in einem Raum V ′ der Dimension 3. Geht der Draht, der zu einer unendlichen Geraden hochstilisiert wird, durch 0 ∈ V ′ , dann wird das orthogonale Komplement zur Geraden als V bezeichnet. In der Nähe des Drahtes, genügend weit weg von seinen Enden, ist dann das Potential einer solchen σ Ladungsverteilung in p ∈ V ′ durch Φ (p) = − 2πε ln r (p) + B gegeben, wobei r (p) = 0 |p − n n, p | die Norm der Normalkomponente von p zum Einheitsrichtungsvektor n ∈ V ′ , also den Normalabstand des Punktes p vom Draht bezeichnet. 3.2.16 *Homogene Linienladung: Halbgerade (dim V = 3) Auf dem Vektorraum V mit dim V = 3 sei ein Skalarprodukt ·, · samt zugehöriger Norm |·| gewählt. Für ein e ∈ V mit |e| = 1 und ζ ∈ R≥0 ist auf V ζe das Skalarfeld ϕζ mit ϕζ (p) = 1/ |p − ζe| definiert und erfüllt ∆ϕζ = 0. Der Fluss von − grad ϕζ durch eine Kugeloberfläche um ζ · e hat den Wert 4π. Können die Potentiale ϕζ für alle ζ im Intervall 0 < ζ < ∞ mit konstantem Gewicht zu einer neuen Lösung der Laplacegleichung aufaddiert werden? Genauer: gelingt es, das Integral L IL (p) = 0 ϕζ (p) dζ für p ∈ V [0, L] · e und L > 0 zu berechnen, und definiert p → limL→∞ IL (p) auf V R≥0 · e eine Lösung der Laplacegleichung? , ,2 Mit der Zerlegung p = p⊥ + e, p e = p⊥ + ze und ρ2 = ,p⊥ , folgt L 0 L−z dζ IL (p) = ρ2 + (ζ − z) 2 = −z dζ ρ2 + ζ 2 . KAPITEL 3. VEKTORANALYSIS Für alle x ∈ R gilt ln x + √ 1 + x2 253 ′ 1 =√ . 1 + x2 Damit folgt für ρ2 > 0 ρ2 + (L − z)2 − ln −z + ρ2 + z 2 / z ρ2 z 2 = ln (L) + ln 1 − + + 1 − − ln −z + L L2 L IL (p) = ln L − z + ρ2 + z 2 . Der Grenzwert von IL (p) für L → ∞ existiert offenbar nicht, aber es gilt für alle p mit ρ2 > 0 lim (IL (p) − ln L) = ln 2 − ln −z + L→∞ ρ2 + z 2 = ln 2 − ln (|p| − e, p ) . Für ρ2 = 0 existiert das Integral IL (p) genau dann, wenn z ∈ R mit ρ2 = 0 und z < 0 gilt somit L−z IL (p) = −z dζ = |ζ| L−z −z [0, L] . Für p z dζ = ln (L − z)−ln (−z) = ln (L)+ln 1 − −ln (−z) . ζ L Daraus folgt für alle p mit ρ2 = 0 und z = e, p < 0 lim (IL (p) − ln L) = − ln (− e, p ) = − ln − L→∞ 2 e, p 2 = ln (2) − ln (−2 e, p ) = ln (2) − ln (|p| − e, p ) . Damit ist gezeigt, dass für alle p ∈ V L lim L→∞ 0 R≥0 · e und für L0 > 0 dζ L − ln 2 |p − ζe| L0 gilt, und die Definition des Skalarfeldes Φe : V = − ln |p| − e, p L0 R≥0 · e → R mit Φe (p) = ln (|p| − e, p ) ist motiviert. Die Funktion Φe wird nun eingehender untersucht. Nach der Ungleichung von Cauchy und Schwarz gilt |p|− e, p ≥ 0 für alle p ∈ V. Zudem gilt |p| − e, p = 0 genau dann, wenn p ∈ R≥0 · e. Für eine konvergente Punktfolge (pn ) mit pn → p0 ∈ R≥0 · e für n → ∞ ist die Folge der |Φe (pn )| unbeschränkt. Der Definitionsbereich von Φe ist daher maximal. Es gilt also auf Ue := V R≥0 · e mit r = |·| , cos θ = e, · /r und 0 ≤ θ ≤ π Φe = ln (r − e, · ) = ln (r (1 − cos θ)) . Ist (e1 , e2 , e3 ) eine ONB von V mit den zugehörigen Koordinatenfunktionen (x, y, z) , dann folgt für e = e3 Φe = ln x2 + y 2 + z 2 − z . KAPITEL 3. VEKTORANALYSIS 254 Die Niveaufläche von Φe mit Φe = ln c für ein c > 0 ist das Rotationsparaboloid mit z = (x2 + y 2 − c2 ) /2c. Sein Brennpunkt liegt in 0 und seine Leitebene ist gegeben durch z = −c. Der Schnitt der Niveaufläche Φe = ln c mit der Ebene y = 0 ist für c = 1 (blau), c = 0, 5 (schwarz) und c = 2 (grün) in Fig. 3.17 zu sehen. Fig. 3.18 zeigt das Gradientenfeld von Φe in der Ebene y = 0. Die Feldlinien von grad Φ sind ebene Halbparabeln mit Brennpunkt 0, denn genau diese stehen in jedem ihrer Punkte p senkrecht auf die Niveaufläche von Φ durch p. Sie sind in Fig. 3.17 grau dargestellt. z 2 1 0 -2.5 -1.25 0 1.25 2.5 x -1 -2 Abbildung 3.17: Äquipotentiale und Feldlinien (grau) der Halbgerade Abbildung 3.18: E-Feld der Halbgerade Am gemeinsamen Definitionsbereich Ue ∩U−e = V definiert und erfüllt dort R·e ist die Funktion Φe +Φ−e (Φe + Φ−e) (p) = ln (|p| − e, p ) + ln (|p| + e, p ) = ln |p|2 − e, p 2 = 2 ln ρ (p) . Hier bezeichnet ρ (p) > 0 mit ρ (p)2 = |p|2 − e, p 2 den Abstand von p zur Geraden R· e. Wir kennen Φe +Φ−e bereits als das Potential einer konstanten Linienladungsdichte auf der Geraden R·e. Die Funktion Φ−e entsteht durch Spiegelung von Φe am Punkt 0 ∈ V, dh es gilt Φ−e (−p) = Φe (p) für alle p ∈ V R≥0 · e. Vergewissern wir uns abschließend, dass Φe tatsächlich harmonisch ist. Lemma 130 ∆Φe = 0. KAPITEL 3. VEKTORANALYSIS 255 Beweis. Das Gradientenfeld von Φe ergibt sich auf Ue zu 1 grad (r) − e = r − e, · r − e, · grad (Φe ) = ιdV −e . r Weiter folgt ∆Φe = > div ιdrV − e grad (r − e, · ) ιdV = − , −e + r r − e, · (r − e, · )2 , ,2 ιd V , ιdV , −1 , , + div r . = − e , r − e, · (r − e, · )2 , r Nebenrechnung 1: ,2 , , ιdV , , = 1 |ιdV − re|2 = 1 |ιdV |2 − 2r ιdV , e + r2 |e|2 = 2 (1 − cos θ) . , − e , , r r2 r2 Hier bezeichnet θ (p) ∈ (0, π] den ungerichteten Winkel zwischen p und e. Somit gilt , ιd , , V − e,2 r (r − e, · ) 2 = 2 (1 − cos θ) 2 . 2 = 2 2 r (1 − cos θ) r (1 − cos θ) Nebenrechnung 2: div ιdV r 1 div (ιd) 1 = − 2 grad (r) , ιd + =− 2 r r r = > ιd div (ιd) 2 , ιd + = . r r r Somit gilt div ιdrV / (r − e, · ) = 2/r2 (1 − cos θ) , sodass die Behauptung folgt. Als Nebenprodukt des Beweises für ∆Φe = 0 fiel das Ergebnis / , , , ιdV , 1 1 2 1 , , |grad (Φe )| = − e, = = , r − e, · r r 1 − cos θ r sin (θ/2) an. Der Betrag der elektrischen Feldstärke einer homogen geladenen Halbgerade fällt also mit wachsendem Abstand r vom Endpunkt der Halbgerade bei festem Polarwinkel θ wie 1/r ab. Die Steilheit des Abfalls ist dabei 1/ sin (θ/2) . Auf der Niveaufläche r = R > 0 ist |grad (Φe )| im Punkt −R · e minimal. Auf einer Äquipotentialfläche ist r − z konstant und positiv. Auf der Äquipotentialfläche Γc mit Φe = ln (2c) gilt also 0 < 2c = r − z = r (1 − cos θ) . Die Fläche Γc hat den Scheitelpunkt −c · e bei θ = π. Für den Betrag der Feldstärke auf Γc folgt / / 2 1 1 − cos θ 1 θ |grad (Φe )| = = = = sin . 2 r (r − z) rc 2c c 2 Bei Annäherung auf einer Äquipotentialfläche an deren Scheitelpunkt wächst der Betrag der Feldstärke also mit dem steigenden Polarwinkel θ wie sin θ/2 bzw mit KAPITEL 3. VEKTORANALYSIS 256 √ dem fallenden Abstand r wie 1/ r. Tatsachen wie diese werden als Erklärung für Spitzenentladungen angeführt. Die Zerlegung von gradp Φe nach dem Raum R · e und dessen orthogonales Komplement ist ersichtlich aus & ' & ' gradp Φe = e · e, gradp Φe + gradp Φe − e · e, gradp Φe . & ' Es gilt e, gradp Φe = −1/ |p| und daher gradp Φe = − e + |p| 1 |p| − e, p p e −e + |p| |p| =− e p − e, p e + . |p| |p| (|p| − e, p ) Die Komponente −e/ |p| von gradp Φe ist parallel zu e und wird Parallelkomponente genannt. Ihre Norm hat den Wert 1/ |p| . Die Komponente proportional zu p − e, p e ist senkrecht zu e und heißt daher Normalkomponente. Deren Norm hat den Wert |p|2 − e, p 2 1 |p − e, p e| = = |p| (|p| − e, p ) |p| (|p| − e, p ) |p| = 1 |p| |p| + e, p |p| − e, p 1 + cos θ (p) 1 θ (p) = cot . 1 − cos θ (p) |p| 2 Bei Annäherung an die Halbgerade R≥0 · e bei festem r wächst die Norm der Normalkomponente von grad Φe unbeschränkt an; die Norm der Tangentialkomponente ist aber konstant. Damit münden die Feldlinien von grad Φe senkrecht in R≥0 · e ein. 3.2.17 *Homogen geladenes Geradenstück (dim V = 3) Das Potential Φ : V [−L, L]·e → R eines geladenen Geradenstücks der Länge 2L > 0, das den Bereich [−L, L] · e belegt, soll nun aus dem Potential Φe der geladenen Halbgeraden berechnet werden. Φ ergibt sich durch Addieren des Translats von Φe um den Vektor −Le und dem Translat von −Φe um den Vektor Le. Es gilt zunächst für p ∈ V [−L, ∞) · e Φ (p) = ln (|p + Le| − e, p + Le ) − ln (|p − Le| − e, p − Le ) |p + Le| − e, p + Le |p + Le| − ( e, p + L) = ln = ln . |p − Le| − e, p − Le |p − Le| − ( e, p − L) Zähler und Nenner des zu logarithmierenden Bruches sind bei Verwendung der Abstandsfunktionen r± : V → R≥0 von den Punkten ±Le, also für r± (p) = |p ∓ Le| gegeben durch r± − e, · ± L. Mit u = (r+ + r− ) /2 und v = (r+ − r− ) /2 folgt nun 2 2 wegen uv = r+ − r− /4 = −L e, · =: −Lz, dass r± − e, · ±L = u±v−z±L = u±v+ uv v v ±L = u±L+(u ± L) = (u ± L) 1 + . L L L KAPITEL 3. VEKTORANALYSIS 257 Somit gilt für das Potential der geladenen Strecke [−L, L] · e auf V Φ = ln [−L, ∞) · e r+ + r− − 2L u−L = ln . u+L r+ + r− + 2L Φ hat offenbar eine C ∞ -Fortsetzung nach V [−L, L] · e. Diese ist invariant unter der Punktspiegelung p → −p und erfüllt ∆Φ = 0. Die Niveauflächen von Φ sind die Rotationsellipsoide mit den Brennpunkten ±Le. Die Feldlinien sind ebene Hyperbelasthälften mit den Brennpunkten ±Le. Siehe Fig (3.19). Abbildung 3.19: Äquipotentiale und Feldlinien eines Geradenstücks 3.2.18 *Inhomogen geladene Halbgerade (dim V = 3) Kann das Potential Φe einer geladenen Halbgerade mit ∆Φe = 0 auch für dim V = 3 mit dem Ansatz Φe = f (r − e, · ) auf V R≥0 ·e gefunden werden? Sei also V, ·, · , r wie im Abschnitt über die geladene Halbgerade im dreidimensionalen Raum. Lediglich die Abänderung auf dim V = 3 wird vorgenommen. Es gelte weiterhin e ∈ V mit |e| = 1. Der Ansatz für Φe ergibt grad Φe = f ′ (r − e, · ) · ιdV −e r und weiter ∆Φe = div grad Φe = = > ιdV ιdV ιdV ′′ − e, − e + f ′ (r − e, · ) · div −e f (r − e, · ) · r r r = > 2 ιdV n ′′ ′ −2 = f (r − e, · ) · (r − e, · ) + f (r − e, · ) · −r , ιdV + r r r 1 = · [f ′′ (r − e, · ) · 2 (r − e, · ) + (n − 1) f ′ (r − e, · )] . r Es gilt also ∆Φe = 0 genau dann, wenn 2xf ′′ (x) + (n − 1) f ′ (x) = 0 für alle x > 0. Der Raum der maximalen Lösungen dieser Eulerschen Differentialgleichung KAPITEL 3. VEKTORANALYSIS 258 hat die Basis u1 , u2 : R>0 → R mit u1 (x) = 1 und u2 (x) = x(3−n)/2 . Folglich ist Φe = (r − e, · )3−n eines der gesuchten Skalarpotentiale. Alle weiteren sind vom Typ AΦe + B mit A, B ∈ R. Im physikalisch interessanten Fall n = 2 spezialisiert sich Φe zu √ √ θ Φe = r − e, · = r (1 − cos θ) = 2r sin2 (θ/2) = 2r sin 2 Hierbei gilt e, · = r cos θ mit 0 < θ ≤ π auf V (x, y) mit e = e1 gilt R≥0 ·e. In kartesischen Koordinaten x2 + y 2 − x. Φe = Der Funktionsgraph von Φe (Fig. 3.20) erinnert an einen Schiffskiel. Abbildung 3.20: Potential Φe einer geladenen Halbachse für dim V = 2 Ist Φe das Potential einer auf R≥0 · e konstanten Linienladungsdichte? Einen Hinweis darauf gibt die Summe Φe + Φ−e. Ist sie wie im Fall dim V = 3 invariant unter allen Verschiebungen in Richtung e? Nein, das ist nicht der Fall. Sehen wir uns daher den Grenzwert der Richtungsableitung von Φe unter e⊥ bei Annäherung an die Achse R>0 · e an. Es gilt für x > 0 1 ∂y Φe = 2 x2 + y2 −x · y x2 + y 2 = 1 2 x2 + y 2 · y x2 + . y2 −x Es gilt weiter bei festgehaltenem x > 0 √ y y = → 2 für y ց 0. 2 x2 + y 2 − x x 12 xy + o (y 2 ) √ √ Somit gilt limyց0 ∂y Φe = 1/ 2x und limyր0 ∂y Φe = −1/ 2x . Die Sprunghöhe √ von ∂y Φe über die Achse R>0 ·e an der Stelle x·e ist 2/x. Sie ist also nicht konstant! Daher ist auch die Linienladungsdichte von Φe nicht konstant. KAPITEL 3. VEKTORANALYSIS 3.2.19 259 *Dipolbelegte Halbgerade (dim V = 2) Auf der geschlitzten Ebene U = R2 R≥0 ·e1 gilt x = r cos ϕ und y = r sin ϕ mit r > 0 und 0 < ϕ < 2π. Daraus folgt auf U, dass (bezüglich des Standardskalarprodukts) grad ϕ = (−y, x) / (x2 + y 2 ) und weiter = > −2 (x, y) div (−y, x) + (−y, x) , = 0. ∆ϕ = x2 + y 2 (x2 + y 2 )2 Die dehnungsinvariante Polarwinkelfunktion ϕ erfüllt also ∆ϕ = 0 auf U. Die Niveaulinien von ϕ sind offene Halbgerade, die von 0 ausgehen, und die Feldlinien von grad ϕ sind punktierte Kreise um 0. Nach Einbettung in den R3 kann ϕ als das Potential der dipolbelegten Halbebene R≥0 · e1 + R · e3 genutzt werden. 3.2.20 Helmholtzgleichung: alle radialen Lösungen Gesucht sind nun all jene Funktionen f : R>0 → R, für die ∆ (f (r)) = λf (r) für ein λ ∈ R, die soganannten radialen Lösungen der Helmholtzgleichung auf Rn 0. Wir beschränken uns auf den Fall n = 3, sodass ∆ (f (r)) = λf (r) zu 2 f ′′ (r) + f ′ (r) − λf (r) = 0 r (3.21) auf R>0 äquivalent ist. Mit dem Ansatz f (x) = y (x) /x ergibt sich f ′ (x) = y ′ (x) y (x) ′′ 2 2 1 − 2 , f (x) = 3 y (x) − 2 y ′ (x) + y ′′ (x) . x x x x x Daher ist Gleichung (3.21) äquivalent zu y ′′ − λy = 0. Für λ = κ2 > 0 mit κ > 0 gilt somit e−κr eκr f (r) = A +B r r 2 mit A, B ∈ R. Für λ = −κ mit κ > 0 hingegen gilt mit A, B ∈ R f (r) = A 3.2.21 cos (κr) sin (κr) +B . r r Orientierung eines Vektorraums Im nächsten Abschnitt wird eine weitere Differentiationsvorschrift für dreidimensionale Vektorfelder beschrieben. Ihr Ergebnis, die sogenannte Rotation, ist wieder ein dreidimensionales Vektorfeld. Zur Bildung der Rotation eines Vektorfeldes wird auf dem Vektorraum V neben dem Skalarprodukt, das den Winkel- und Längenbegriff festlegt, eine Formalisierung der anschaulichen Begriffe ’links’ und ’rechts’ benötigt. Gibt es hilfreichere Erklärungen als jene des Typs „rechts ist dort, wo der Daumen links ist”? Oder gar eine, die ein Computer verstehen kann? Die Anweisung „gehe zehn Schritte geradeaus und dann fünf Schritte nach links” macht nur Sinn, wenn die Person, an welche die Anweisung gerichtet ist, ihre linke KAPITEL 3. VEKTORANALYSIS 260 von der rechten Hand unterscheiden kann. Sie muss aber auch wissen, welche Richtung mit „geradeaus” gemeint ist. Wollte man einen Taucher im trüben Gewässer mit solchen Anweisungen wo hinschicken, wird bewusst, dass neben der Richtung „geradeaus” noch die Orientierung der Körperachse bestimmt sein muss, wenn die Anweisung „zehn Meter geradeaus und dann fünf Meter nach links” eine Endposition festlegen soll. Die Vorgabe einer Blickrichtung und einer Orientierung der Körperachse von den Füßen zum Kopf legt also erst fest, was mit links oder rechts gemeint ist. Wie aber lässt sich ohne direktes Hinweisen jemandem erklären, was seine rechte Hand ist? Anstatt Kindern immer wieder zu zeigen, welche Hand es denn ist, die sie zur Begrüßung zu reichen haben, könnte in unseren Breiten der folgende physikalische Sachverhalt genutzt werden. Steht das Kind bei Sonnenschein aufrecht irgendwo in der gemäßigten Zone der Nordhalbkugel, kann es ein paar Minuten die Sonne betrachten und dabei beobachten, in welche Richtung sie wandert. Es bildet dann in seinem Standpunkt einen Vektor ’nach oben’ und nennt ihn e3 . Dann bildet es einen Richtungsvektor vom eigenen Standpunkt ’zur Sonne’ und nennt ihn e2 . Zuletzt wählt das Kind einen Vektor, der in den Halbraum weist, in den sich die Sonne hineinbewegt. Diesen Vektor nennt es e1 . Nun kann das Kind ausprobieren, für welche seiner beiden Hände es, so wie in Abbildung 3.21, den Daumen an e1 , den Zeigefinger an e2 und den Mittelfinger an e3 auszurichten vermag. Diese Hand nennt es fortan seine ’rechte’ Hand und die Basis e = (e1 , e2 , e3 ) nennt es rechtshändig oder positiv orientierte Basis des Raums aller möglichen Örter physikalischer Gegenstände. Eine weitere Basis f = (f1 , f2 , f3 ) , die ja aus e durch eine invertierbare lineare Abbildung A : V → V mit Aei = fi hervorgeht, wird ebenfalls als rechtshändig bezeichnet, wenn det A > 0 gilt und als linkshändig, wenn det A < 0 gilt. Der Fall det A = 0 kann ja nicht eintreten. Die Menge aller Basen von V zerfällt so in zwei disjunkte Teilmengen von rechts- bzw linkshändig orientierten Basen. Hier ein Beispiel: Ist e = (e1 , e2 , e3 ) eine Basis von V, dann sind f = (e2 , e1 , e3 ) und g = (e2 , e3 , e1 ) auch Basen von V. Die Basen e und f sind gegengesetzt orientiert, während e und g gleichsinnig orientiert sind. Jede Vertauschung zweier benachbarter Basiselemente führt zu einem Orientierungswechsel. Die Basis g geht durch eine sogenannte zyklische Vertauschung aus der Basis e hervor. Die Basen e und h = (e1 , −e2 , e3 ) sind gegengesetzt orientiert, hingegen f und h gleich. Die eben ausgebreitete Überlegung zeigt, wie ohne Sichtkontakt und Gefuchtel mit den Händen jemandem erklärt werden kann, was rechts und was links ist. Einem Kind der Südhalbkugel muss natürlich gesagt werden, dass sich die Sonne von rechts nach links und nicht von links nach rechts bewegt und dass die nach obiger Regel erzeugte Basis linkshändig heißt.16 Was aber tun, wenn einer Person unabhängig von deren Aufenthaltsort unser Begriff von links und rechts nahegebracht werden soll? Offenbar wird ein allen Beteiligten zugängliches Objekt benötigt, an dem eine Orientierung festzumachen ist, weil es bei Raumspiegelung nicht in sich über geht. 16 Wir ignorieren die Komplikationen, die für Bewohner der Tropen auftreten. KAPITEL 3. VEKTORANALYSIS 261 Abbildung 3.21: Schwerkraft und Sonnengang orientieren den Raum Ein Ball wie in Abbildung 3.22 etwa, bei dem einer der beiden Pole markiert und ein Breitenkreis mit einem Orientierungspfeil versehen ist. Den könnte man in Paris neben das Urmeter legen, als Standard der rechtshändigen Orientierung aufbewahren, und Kopien davon verschicken. So etwas ist aber unnötig, denn die Eigenrotation der Sonne, die an der Bewegung der Sonnenflecken zu erkennen ist, kann statt dessen überall im Sonnensystem genutzt werden. Versetze dich (nur in Gedanken!) in den Mittelpunkt M der Sonne. Wähle einen Vektor e1 , der von M zu einem bewegten Sonnenfleck p gerichtet ist. Wähle e2 in die Bewegungsrichtung von p. Richte schließlich e3 von M auf den Polarstern aus. Die so erzeugte Basis ist rechtshändig. Abbildung 3.22: Ein Orientierungsstandard und sein raumgespiegeltes Gegenstück Bewohnt eine außerirdische Person unsere Galaxis, dann ließe sich ihr auf analoge Weise aus dem Drehsinn unserer Galaxis und einer weiteren eindeutig identifizierten Nachbargalaxie, zB der kleinen Maghellanschen Wolke, die deutlich außerhalb der galaktischen Ebene liegt, klar machen, was wir mit links und rechts meinen. Neben den dauerhaft rotierenden Makroobjekten, die wir der Drehimpulserhaltung verdanken, dient aber auch die schwache Wechselwirkung mikroskopischer Krei- KAPITEL 3. VEKTORANALYSIS 262 sel als bleibender Orientierungsstandard: Beim Betazerfall polarisierter Kobaltkerne entstehen in Richtung der Spulenachse Elektronen mit einer bevorzugten Laufrichtung. Die magnetischen Momenterwartungswerte der positiv geladenen Kobaltkerne richten sich am Magnetfeld B im Inneren der Spule aus.17 Betastrahlen verlassen dann diese Probe, wie das Wu-Experiment zeigt, eher gegen die Richtung von B als in dessen Richtung. Abbildung 3.23: β − -Zerfall polarisierter 60 Co Kerne orientiert den Raum Inwiefern zeichnet das Wu-Experiment eine Orientierung des Raumes aus? Der (technische) Strom J in der Spule wechselt aus einer vertikal nach oben weisenden Richtung e1 in eine auf den Betrachter weisende Richtung e2 . Der Strom J definiert also einen Drehsinn der Ebenen senkrecht zur Spulenachse. Die Richtung e3 zeigt in den Halbraum, in den die β − -aktive Kobaltprobe Elektronen bevorzugt abstrahlt. Die vom Experiment gelieferte Figur 3.23 zeigt: die Basis (e1 , e2 , e3 ) ist eine linkshändige. Wie lässt sich eine Orientierung für allgemeine Vektorräume formulieren? Im Fall eines beliebigen reellen Vektorraumes V endlicher Dimension besteht eine Orientierung des Vektorraums in einer (willkürlichen) Auswahl einer der beiden Teilmengen gleich orientierter Basen als die Menge der positiv orientierten Basen. Die zweite Klasse von Basen wird als die Klasse der negativ orientierten Basen bezeichnet. Im Fall eines 2d reellen Vektorraums besteht eine Basis e = (e1 , e2 ) nur aus zwei Elementen. Der Halbstrahl R>0 · e2 geht aus R>0 · e1 durch eine Drehung um einen Winkel θ mit 0 < θ < π hervor. Der Drehsinn dieser Drehung ist durch e eindeutig festgelegt. Eine Basis als positiv orientiert auszuzeichnen ist somit äquivalent zur Auszeichnung eines Drehsinns der Ebene V als den positiven. Man deutet ihn grafisch durch einen Kreisbogen mit Pfeil an. Nun ist klar, wie die technische Stromrichtung einer Spule zur Orientierung der Ebenen senkrecht zur Spulenachse genutzt werden kann. 17 Das merkt man sich mit einer Eselsbrücke: Der positiv geladene, rotierende Kern stellt einen Kreisstrom dar. Dieser richtet sich parallel zur technischen Stromrichtung aus. (Amperesches Gesetz). Die Orientierung von magnetischem Moment bzw von Drehimpuls werden beide mit der ’rechten Hand Regel’ aus der Bewegungsrichtung von positiver Ladung bzw Masse gebildet. KAPITEL 3. VEKTORANALYSIS 3.2.22 263 Rotation eines 3d-Vektorfeldes Schränkt man ein Vektorfeld in einem n-dim Vektorraum auf eine 2-dim Ebene durch den Punkt p ein, so kann sich das Feld auf dieser Ebene in der unmittelbaren Umgebung von p mehr oder weniger um p winden. Das Kurvenintegral des Vektorfeldes längs einer kleinen geschlossenen Kurve γ um p, die in der Ebene verläuft, zeigt eine Stärke der Windung um p herum an. Lässt man die Kurve auf den Punkt p zusammenschrumpfen und bildet den Limes von Windungsintegral durch Flächeninhalt der von γ umzingelten Fläche, ergibt sich ein Maß der lokalen Windung um p. Man nennt sie die Rotation des Vektorfelds in p bezüglich der Ebene. Eine 2-dim Ebene wird durch ein Paar von Basisvektoren (ei , ej ) mit i < j gekennzeichnet. In einem n-dim Vektorraum existieren durch jeden Punkt n (n − 1) /2 „linear unabhängige“ Ebenen. Zu jeder solchen Ebene gehört eine Komponente der Rotation in p. Für n = 3 sind dies 3 Komponenten, die (nach Wahl einer Orientierung) zu einem Vektorfeld zusammengefasst werden können. Für n = 4 sind es schon 6 Komponenten. Seien also ei , ej zwei Elemente einer Orthonormalbasis von V und sei p im Definitionsbereich des C 1 -Vektorfeldes X. Die Tangentialapproximation an Xi := X, ei in p besagt, dass X (p + λei + µej ) , ej = X (p) , ej + λ (∂ie)p Xj + µ ∂je p Xj + o ( λei + µej ) . Daraus folgt für das Kurvenintegral von X längs einer Kurve γ, die das quadratische , ε ε , Gebiet p + λei + µej λ, µ ∈ − 2 , 2 mit hinreichend kleinem ε > 0 umschließt, ( ) ε ε X = X p + ei + tej − X p − ei − tej , ej dt + 2 2 −ε/2 γ ) ε/2 ( ε ε + X p + ej − tei − X p − ej + tei , −ei dt 2 2 −ε/2 ε/2 Tangentialapproximation der Integranden ergibt ε/2 X = γ 0 −ε/2 ε/2 − ε (∂ie )p X, ej + 2t ∂je −ε/2 0 ε ∂je p p X, ej 1 X, ei − 2t (∂ie)p X, ei dt 1 ε/2 dt + o (ε) dt. −ε/2 Die in t linearen Terme des Integranden integrieren sich zu 0 auf, sodass folgt 0 1 ε/2 X = ε (∂ie )p X, ej − ∂je p X, ei · dt + ε · o (ε) γ −ε/2 0 1 e e 2 = ε (∂i )p X, ej − ∂j p X, ei + o ε2 . Die Orientierung der Randkurve des Quadrats wurde dabei so gewählt, dass an die Kante, die in Richtung +ei durchlaufen wird, jene Kante anschließt, die in +ej KAPITEL 3. VEKTORANALYSIS 264 Richtung durchlaufen wird. Bei Vertauschung von i mit j wechselt das Integral sein Vorzeichen. Die Fläche des Quadrats ist ε2 und daher gilt γ 1 ε→0 Fläche e lim γ X e X = ∂i X, ej − ∂j X, ei . Soll im Fall n = 3 aus Zij = ∂ie X, ej − ∂je X, ei ein Vektorfeld rot (X) gebildet werden, wird eine Konvention benötigt, die etwa sagt, ob Z12 oder Z21 die 3-Komponente ist. Und dabei sollte rot (X) aber von der speziellen Wahl der ONB unabhängig sein. Dies gelingt erst durch die Auszeichnung der „rechtshändig“ orientierten Basen, für die Z12 die 3-Komponente ist. Im Fall allgemeiner Dimension spricht man in Ermangelung einer „rechten“ Hand von positiv orientierten Basen. Das äußere Vektorprodukt in einem 3-dim Vektorraum, das zu einem Skalarprodukt ·, · gehört, spielt bei der Definition der Rotation eine wichtige Rolle. Daher sei an die Definition des äußeren Produktes erinnert. Sie benötigt neben einem Skalarprodukt von V auch eine Orientierung von V. Definition 131 Der reelle, orientierte Vektorraum V habe die Dimension 3 und ·, · sei ein Skalarprodukt von V. Das vektorielle Produkt zu Skalarprodukt und Orientierung von V ist die schiefsymmetrische, bilineare Abbildung × : V × V → V mit e1 ×e2 = e3 , e3 ×e1 = e2 , e2 ×e3 = e1 für eine beliebig gewählte positiv orientierte ONB e. Das vektorielle Produkt ist unabhängig von der Wahl von e, soferne e aus der Klasse der positiv orientierten Basen gewählt ist. Definition 132 Der reelle Vektorraum V habe die Dimension 3 und ·, · sei ein Skalarprodukt von V. Eine Orientierung von V sei gewählt. Sei U ⊂ V offen und X : U → V ein C 1 -Vektorfeld mit den Komponentenfunktionen X i : U → R bezügt lich einer positiv orientierten ONB e, d.h. X = e · (X 1 , X 2 , X 3 ) . Dann heißt das t Vektorfeld rot (X) = e · (∂2e X 3 − ∂3e X 2 , ∂3e X 1 − ∂1e X 3 , ∂1e X 2 − ∂2e X 1 ) die Rotation von X. Sein Wert im Punkt p wird als rotp (X) notiert. Formal gilt 1 ∂1 X ∂2 X 2 . × rot (X) = e · ∂3 X3 Nach Definition 122 ist für dim (V ) = 3 ein C 1 -Vektorfeld X genau dann rotationsfrei, wenn rot (X) = 0 gilt. Das komponentenweise definierte Vektorfeld rot (X) ist unabhängig von der Wahl von e, soferne e nur eine positiv orientierte ONB ist. Eine explizit basisfreie Definition der Rotation ist über den Cartanschen Kalkül der Differentialformen möglich. Außerdem zeigt diese Theorie was die Rotation im Fall höherdimensionaler Räume ist. Historisch gab die Abänderung der ätherbezogenen Maxwellgleichungen, in denen die Rotation ja vorkommt, zu einer relativistischen Feldgleichung den Anstoß zur Entwicklung dieses Kalküls. KAPITEL 3. VEKTORANALYSIS 265 Der klassische Satz von Stokes gibt der Rotation eines Vektorfeldes eine recht anschauliche Bedeutung. Er besagt, dass der Fluss der Rotation durch eine stückweise glatt berandete, kompakte 2-dimensionale Fläche mit dem Wegintegral des Vektorfeldes längs des zugehörig orientierten Randes übereinstimmt. Die Sätze von Gauß und von Stokes sind n = 3 Spezialfälle eines weitaus allgemeineren Satzes über die Integration von Differentialformen im (äußeren) Differentialkalkül von Cartan. Diese Theorie bringt die begriffliche Struktur der Vektoranalysis viel besser zum Vorschein als die hier skizzierte klassischen Vorstufe. 3.2.23 Faulenzerregeln zur Rotation Rotation von Einheits- und Drehvektorfeld mit Koordinaten Der reelle Vektorraum V habe die Dimension 3 und ·, · bezeichne ein Skalarprodukt von V. Eine Orientierung von V sei gewählt. Für das Einheitsvektorfeld ιd : V → V gilt offenbar rot (ιd) = 0. Für das Drehvektorfeld Ln : V → V mit Ln (p) = n × p für ein n ∈ V gilt rot (Ln ) = 2n, denn 2 3 1 ∂1 n x − n3 x2 n + n1 rot (Ln ) = e · ∂2 × n3 x1 − n1 x3 = e · n2 + n2 = 2n. ∂3 n1 x2 − n2 x1 n3 + n3 Das Vektorfeld LB/2 dient wegen rotLB/2 = B als Vektorpotential der konstanten magnetischen Flussdichte B im Inneren einer unendlich langen Spule. Faulenzerregeln Sei λ ∈ R, und seien f : U → R und X, Y : U → V vom C 1 -Typ, mit U ⊂ V offen und dim(V ) = 3. Dann gilt 1. rot (λX + Y ) = λ rot (X) + rot (Y ) , 2. rot (f X) = grad (f ) × X + f rot (X) (Regel 1. ist hierin enthalten), 3. div (X × Y ) = rot (X) , Y − X, rot (Y ) , 4. grad X, Y = X × rot (Y ) + Y × rot (X) + [Y ] X + [X] Y, 5. grad X, X = 2 (X × rot (X) + [X] X) , 6. rot (X × Y ) = X div (Y ) − Y div (X) − [X] Y + [Y ] X, 7. rot (R ◦ X ◦ R−1 ) = det (R) · (R ◦ rot (X) ◦ R−1 ) für R ∈ O (V ) , 8. Die folgende Regel18 benötigt die Wahl einer (beliebigen) Basis e = (e1 , e2 , e3 ) von V. Ist X : U → V vom C 2 -Typ, mit X = 3i=1 Xei · ei , dann gilt 3 rot (rot (X)) = grad div (X) − 18 i=1 ∆Xei · ei . Achtung: Diese Regel ist nicht naiv auf die Zerlegung von X nach einer krummlinigen Kartenbasis zu übertragen. KAPITEL 3. VEKTORANALYSIS 266 Rotation von Ln koordinatenfrei Mit Regel 6. kann das Ergebnis rot (Ln ) = 2n koordinatenfrei erhalten werden: Es gilt Ln = X × Y mit X = n und Y = ιd. Daraus folgt wegen der Konstanz von X und unter Beachtung von [X] Y = dY (X) = Y (X) = X rot (Ln ) = rot (X × Y ) = X div (Y ) − [X] Y = 3n − n = 2n. Rotation des freien Vortexfeldes Benutzen wir diese Regeln, um die Rotation des freien Vortex X : V R· n → V mit X (p) = n × p/ |n × p|2 zu berechnen. Für den freien Vortex X gilt also X = f L mit f = |L|−2 . Sei oEdA |n| = 1. In diesem Fall stimmt |L (p)| mit dem Normalabstand des Punktes p von der Achse R · n überein. Warum? Für alle a, b, c, d ∈ V gilt a × b, c × d = a, c b, d − a, d b, c . Daraus folgt L (p) , L (p) = n × p, n × p = |p|2 − n, p 2 . Somit stimmt |L (p)| mit dem Normalabstand des Punktes p von der Achse R · n überein. Wollen wir die dritte Regel bei der Berechnung von rot (f L) nutzen, benötigen wir den Gradienten von |L| . Den berechnen wir uns über die Kettenregel gradp |L| = gradp L, L = 1 2 L (p) , L (p) gradp L, L . Nun brauchen wir gradp L, L : gradp L, L = gradp |·|2 − n, · Es gilt daher gradp |L| = 2 = 2 (p − n n, p ) . (p − n n, p ) |L (p)| (Das wäre auch zu erraten gewesen, da ja |L (p)| gerade die Norm der Komponente von p senkrecht zu R · n ist.) Damit folgt aus der dritten Faulenzerregel zur Rotation −2 1 rotp (L) 3 gradp |L| × L (p) + |L (p)| |L (p)|2 −2 p − n n, p 2n = × (n × p) + . 3 |L (p)| |L (p)| |L (p)|2 rotp (X) = Nun gilt für das iterierte Kreuzprodukt dreier Vektoren a, b, c ∈ V : a × (b × c) = b a, c − c a, b . Daraus ergibt sich wegen |n| = 1 [p − n n, p ] × (n × p) = n p, p − p p, n − n, p (n n, p − p n, n ) = n |p|2 − n, p 2 = n |L (p)|2 . KAPITEL 3. VEKTORANALYSIS 267 Daraus folgt nun schließlich rot (X) = 0. Ohne jede Rechnerei lässt sich diese Tatsache aber, wie bald klar sein wird, auch aus dem folgenden Satz erschließen. Satz 133 Sei U ⊂ V offen und dim(V ) = 3. Die Abbildungen f : U → R und X : U → V seien C 2 . Dann gilt 1) rot (grad (f)) = 0, und 2) div (rot (X)) = 0. Beweis. Für Teil 1 benützt man eine positiv orientierte ONB e, sodass mit Unterdrückung der Basisindizierung die Behauptung aus ∂i ∂j f = ∂j ∂i f folgt: ∂1 ∂1 f ∂2 ∂3 f − ∂3 ∂2 f rot (grad (f)) = e · ∂2 × ∂2 f = e · ∂3 ∂1 f − ∂1 ∂3 f = 0. ∂3 f ∂1 ∂2 f − ∂2 ∂1 f ∂3 Teil 2 folgt analog mit div (rot (X)) = ∂1 ∂2 X 3 − ∂3 X 2 + ∂2 ∂3 X 1 − ∂1 X 3 + ∂3 ∂1 X 2 − ∂2 X 1 = 0. Die Definition von Rotation und Divergenz über Limesprozesse macht div (rot (X)) = 0 und rot (grad (f)) = 0 ohne jede Rechnung klar. Die Komponenten der Rotation von X in p ergeben sich aus den Wegintegralen von X längs einer Familie von geschlossenen, ebenen Kurven um p in einem Grenzprozess kleiner werdender Kurven. Ist X ein Gradientenfeld, so hat jedes dieser Integrale den Wert 0. Der Quotient aus Wegintegral und umlaufenem Flächeninhalt strebt somit erst recht gegen 0. Die Divergenz eines Vektorfeldes Y in p ergibt sich aus den Oberflächenintegralen von Y durch geschlossene Flächen, die p einschließen. (Wir haben in einer heuristischen Motivation des Divergenzbegriffes die Oberfläche von Würfeln benützt.) Ist das Vektorfeld Y die Rotation eines Vektorfeldes X, dann stimmt nach dem Satz von Stokes das Oberflächenintegral von Y mit dem Integral von X längs des Randes der gewählten Fläche überein. Für jede geschlossene Fläche ist aber der Rand leer. Somit hat das Oberflächenintegral von Y über eine geschlossene Fläche den Wert 0. Damit folgt div (rot (X)) = 0. Da für |n| = 1 der freie Vortex X überall, mit Ausnahme einer Halbebene, mit dem Gradientenfeld des Polarwinkels in der Ebene senkrecht zu n übereinstimmt, siehe Abschnitt 3.1.14, ergibt sich ohne Rechnung rot (X) = 0. 3.2.24 Existenz von (Vektor)Potentialen Der folgende Satz gibt Umstände an, unter denen durch einfaches Differenzieren des Vektorfeldes X festgestellt werden kann, ob es zu X ein skalares oder ein Vektorpotential gibt. Teil 1 ist ein Spezialfall von Satz 125. Satz 134 Sei U ⊂ V offen, sternförmig und dim(V ) = 3. Dann gilt: KAPITEL 3. VEKTORANALYSIS 268 1. Ist X : U → V vom C 1 -Typ mit rot (X) = 0, dann existiert eine C 2 -Funktion f : U → R mit X = grad (f) , das skalare Potential von X. 2. Ist X : U → V vom C 1 -Typ mit div (X) = 0, dann existiert ein C 2 -Vektorfeld Y : U → V mit X = rot (Y ) , das Vektorpotential von X. Beweis. Ein Beweis ist auf pp. 362-364 von [10] und pp. 158-160 von [11] angegeben. Dieser Beweis gibt eine explizite Konstruktion von Potentialen f bzw. Y an. Sei p0 ein Punkt im Definitionsbereich U von X, sodass γ p (t) := p0 + t (p − p0 ) ∈ U für alle p ∈ U und t ∈ [0, 1]. Ist X rotationsfrei, dann ist die Skalarfunktion f : U → R mit = 1 > f(p) := X= X γ p (t) dt, (p − p0 ) γp 0 ein skalares Potential von X. Ist X divergenzfrei, dann ist das Vektorfeld Y : U → V mit 1 Y (p) := (p0 − p) × tX γ p (t) dt 0 ein Vektorpotential von X. Mit diesen Ansätzen bleibt dann nur mehr zu zeigen, dass grad (f) = X bzw. rot Y = X, falls X rotationsfrei bzw. divergenzfrei ist. 3.2.25 *Lorentzkraft: Lagrange- und Hamiltonfunktion Die Newton’sche Bewegungsgleichung eines geladenen Massenpunktes in einem vorgegebenen, zeitabhängigen, elektromagnetischen Feld schränkt die möglichen Ortsgeschichten des Massenpunktes γ:R⊃I→Ω⊂V dadurch ein, dass die Gültigkeit der Differentialgleichung zweiter Ordnung mγ̈ (t) = e [E (t, γ (t)) + γ̇ (t) × B (t, γ (t))] (3.22) angenommen wird. Dabei bezeichnet m ∈ R>0 die Masse, e ∈ R die elektrische Ladung des Massenpunkts. V ist ein dreidimensionaler, orientierter, reeller Vektorraum. ·, · bezeichnet ein Skalarprodukt von V. In einer offenen und einfach zusammenhängenden Teilmenge Ω von V könne sich das Teilchen bewegen, d.h. die zeitliche Abfolge der Orte des Teilchens ist durch eine C 2 -Kurve γ : I → Ω beschrieben, wobei I ein reelles Intervall ist. Das elektromagnetische Feld ist ein Paar von zeitabhängigen Vektorfeldern auf Ω ⊂ V, d.h. Abbildungen E, B : R × Ω → V. Die beiden Funktionen E, B seien stetig. Die rechte Seite von Gleichung (3.22) ist nach dem niederländischen Physiker H A Lorentz (1853 - 1928) benannt. Diese ’Lorentzkraft’ erklärt die gekrümmten Bahnen eines schnell bewegten Teilchens in einem homogenen Magnetfeld. KAPITEL 3. VEKTORANALYSIS 269 Für ein systematisches Studium Newton’scher Bewegungsgleichungen ist es nützlich, jedem solchen Gleichungssystem zweiter Ordnung eine Lagrangefunktion zuzuordnen, aus der sich die Bewegungsgleichung durch Differenzieren ableiten lässt. In einem sehr vagen Sinn ist die Lagrangefunktion einer Bewegungsgleichung so etwas wie das Potential eines Vektorfeldes. Im gegenwärtigen Kontext ist die Lagrangefunktion L eine C 2 -Funktion L : R × Ω × V → R, sodass die Lorentzgleichung (3.22) äquivalent ist zur sogenannten Euler-Lagrange Gleichung der Lagrangefunktion L, also zu19 d gradγ̇(t) L (t, γ (t) , ·) = gradγ(t) L (t, ·, γ̇ (t)) . dt (3.23) Tatsächlich existiert eine solche Funktion L. Sie enthält als Bausteine die folgenden Potentiale Φ, A der Funktionen E und B. Dass es diese Potentiale gibt, ist nicht selbstverständlich, sondern eine Folge der Naturgesetze, die die zulässigen Funktionen E, B einschränken. (Die Maxwellgleichungen gelten auf R × Ω und Ω ist einfach zusammenhängend.) Es existieren also Funktionen Φ : R × Ω → R und A : R × Ω → V, sodass für alle (t, x) ∈ R × Ω E (t, x) = −gradx Φ (t, ·) − 1∂ A (t, x) und cB (t, x) = rotx A (t, ·) c ∂t gilt.20 Die Konstante c ∈ R>0 hat den Wert der Lichtgeschwindigkeit und ist im gegenwärtigen Kontext belanglos, da sie durch Übergang von A zu A/c aus allen hier behandelten Aussagen zum Verschwinden gebracht wird. Sie gewinnt erst Substanz, wenn die Gesetze für E und B ausformuliert werden. Dann erweist es sich als praktisch, die Potentiale so zu dimensionieren, wie es hier geschehen ist. Satz 135 Sei Ω ⊂ V offen und einfach zusammenhängend. Dann ist die EulerLagrange Gleichung (3.23) zur Lagrangefunktion L : R × Ω × V → R mit (v ) m L (t, x, v) = |v|2 − e Φ (t, x) − , A (t, x) 2 c zur Lorentzgleichung (3.22) äquivalent. Hierbei gilt |v|2 = v, v . Beweis. Es gilt mit der Abkürzung A/c = α gradxL (t, ·, v) = e [−gradxΦ (t, ·) + gradx v, α (t, ·) ] , gradv L (t, x, ·) = mv + eα (t, x) . 19 Hier bezeichnet etwa L (t, ·, v) : Ω → R die Funktion, für die gilt L (t, ·, v) : x → L (t, x, v) . Es existieren unendlich viele verschiedene solche Potentiale zu ein und demselben Paar (E, B). Man nennt dies die Eichfreiheit bei der Auswahl von (Φ, A) . 20 KAPITEL 3. VEKTORANALYSIS 270 Daraus folgt für die linke Seite der Euler-Lagrange Gleichung d d gradγ̇(t) L (t, γ (t) , ·) = [mγ̇ (t) + eα (t, γ (t))] dt dt 3 = mγ̈ (t) + e [∂t α] (t, γ (t)) + e j=1 [γ̇ (t)]γ(t) αj (t, ·) δ j = : mγ̈ (t) + e [∂t α] (t, γ (t)) + e [γ̇ (t)]γ(t) α (t, ·) . Hier ist (δ j ) eine Basis von V und α (t, x) = 3j=1 αj (t, x) δ j für alle (t, x) ∈ R × Ω. Für die rechte Seite der Euler-Lagrange Gleichung ergibt sich gradγ(t) L (t, ·, γ̇ (t)) = e −gradγ(t) Φ (t, ·) + gradγ(t) γ̇ (t) , α (t, ·) . Somit ist die Euler-Lagrange Gleichung äquivalent zu mγ̈ (t) = e −gradγ(t) Φ (t, ·) − [∂t α] (t, γ (t)) + gradγ(t) γ̇ (t) , α (t, ·) − [γ̇ (t)]γ(t) α (t, ·) = e E (t, γ (t)) + gradγ(t) γ̇ (t) , α (t, ·) − [γ̇ (t)]γ(t) α (t, ·) . Sehen wir uns die letzten beiden Terme der rechten Seite dieser Newton’schen Bewegungsgleichung an. Sie sind mit (t, x, v) ∈ R × Ω × V vom Typ gradx v, α (t, ·) − [v]x α (t, ·) . Andererseits gilt analog zur Tripelvektorproduktformel a×(b × c) = b a, c −c a, b v × rotx α (t, ·) = gradx ( v, α (t, ·) − [v]x α (t, ·)) . (Komponentenweises Nachrechnen mit einer positiv orientierten Orthonormalbasis beruhigt vielleicht noch etwas.) Also gilt tatsächlich mγ̈ (t) = e (E (t, γ (t)) + γ̇ (t) × B (t, γ (t))) . Die Umformung der Bewegungsgleichung zweiter Ordnung (3.22) in eine Bewegungsgleichung erster Ordnung auf einem geeigneten Phasenraum kann durch Einführung einer Hamiltonfunktion H als Legendretransformierter von L erreicht werden. Die Hamiltonfunktion ist festgelegt durch p (t, x, v) = gradv L (t, x, ·) und H (t, x, p (t, x, v)) = v, p (t, x, v) − L (t, x, v) für alle (t, x, v) ∈ R × Ω × V. Daraus folgt wegen p (t, x, v) = mv + ec A (t, x) ( ) m (v ) e H (t, x, p (t, x, v)) = v, mv + A (t, x) − |v|2 + e Φ (t, x) − , A (t, x) c 2 c m 2 = |v| + eΦ (t, x) 2 , ,2 e 1 , , = ,p (t, x, v) − A (t, x), + eΦ (t, x) , 2m c KAPITEL 3. VEKTORANALYSIS 271 also H : R × Ω × V → R mit ,2 e 1 ,, , ,p − A (t, x), + eΦ (t, x) . 2m c Die nichtautonome Hamiltonsche Bewegungsgleichung erster Ordnung am Phasenraum Ω × V lautet somit γ̇ (t) = XH (t, γ (t)) mit dem zeitabhängigen Hamiltonvektorfeld XH (t, ·) : Ω × V → V × V H (t, x, p) = XH (t, x, p) = (gradp H (t, x, ·) , −gradx H (t, ·, p)) . 3.2.26 *Vektorpotential des freien Vortexfeldes Sei V dreidimensional und eine Orientierung sei gewählt. Sei n ∈ V mit |n| = 1 und sei X : V R · n → V mit X (p) = n × p/ |n × p|2 . Bis auf einen konstanten Faktor stimmt X mit dem Magnetfeld eines unendlich langen stromführenden Drahtes der Dicke 0 überein. Gesucht ist ein Vektorfeld Y : V R · n → V mit X = rot (Y ) . Versuche den Ansatz Y (p) = f (|n × p|) n mit einer C 1 -Funktion f : R>0 → R. Daraus folgt mit L (p) = n × p für p ∈ V R · n rotp (Y ) = gradp (f ◦ |L|) × n = f ′ (|n × p|) gradp |L| × n. Aus dem Abschnitt über die Rotation des freien Vortex ist bekannt, dass gradp |L| = Daraus folgt für p ∈ V (p − n n, p ) für alle p ∈ V |L (p)| R·n rotp (Y ) = f ′ (|n × p|) R · n. (p − n n, p ) f ′ (|n × p|) ×n=− n × p. |L (p)| |L (p)| Es gilt also rotp (Y ) = X (p) = n × p/ |n × p|2 genau dann, wenn f ′ (|n × p|) = −1/ |n × p| . Dies ist genau dann der Fall, wenn ein A ∈ R existiert, sodass f (x) = − ln (x) + A für alle x > 0. Somit ist das Vektorfeld Y : V R · n → V mit Y (p) = − (ln |n × p|) n + An für eine beliebe Zahl A ∈ R ein Vektorpotential des freien Vortexfeldes X. Das konstante Vektorfeld An = grad An, · trägt zu rot (Y ) nicht bei. Weitere Vektorpotentiale ergeben sich aus Y durch Übergang zu Y + gradφ mit einer beliebigen C 2 -Funktion φ : V R·n → R. (In der Elektrodynamik wird diese Unterbestimmtheit eines Vektorpotentials als „Eichfreiheit“ bezeichnet.) Der Definitionsbereich V R · n von X ist nicht sternförmig. Daher garantiert Satz 134 die Existenz des vorliegenden Vektorpotentials Y nicht. Nimmt man aus V R · n jedoch eine Halbebene heraus, die von R · n berandet ist, so ist dieses Gebiet sternförmig. Für dieses Gebiet garantiert Satz 134 die Existenz eines Vektorpotentials Y. Wir haben ein solches gefunden, das eine C 2 -Fortsetzung auf ganz V R · n hat. Dass eine solche Fortsetzbarkeit nicht immer gegeben ist, zeigt der spätere Abschnitt über das Vektorpotential eines Punktmonopols. KAPITEL 3. VEKTORANALYSIS 3.2.27 272 *Vektorpotential des Punktdipols Sei V dreidimensional und orientiert. Ein Skalarprodukt ·, · sei gewählt. Das elektrische Feldstärkefeld E oder magnetische Flussdichtefeld21 B eines Punktdipols mit dem elektrischen bzw magnetischen Dipolmoment m ∈ V, das in 0 ∈ V ruht, stimmt für p ∈ V 0 mit dem Vektorfeld X : V 0 → V überein, für das X (p) = γ |p|3 3 m, p p−m |p|2 für alle p ∈ V 0 gilt. Dabei ist im elektrischen Fall γ = 1/4πε0 und im magnetischen Fall γ = µ0 /4π zu setzen.22 Es folgt daraus div X = 0. Gibt es ein Vektorfeld A : V 0 → V mit X = rot A? Mit dem durch die Drehinvarianz von X um die Achse R · p motivierten Ansatz A (p) = f (|p|) Lm (p) = f (|p|) m × p folgt rotp A = f ′ (|p|) p f ′ (|p|) × (m × p) + f (|p|) rotp Lm = m |p|2 − p m, p |p| |p| m, p = (f ′ (|p|) |p| + 2f (|p|)) m − f ′ (|p|) p. |p| + f (|p|) 2m Die Bedingung X = rot A ist genau dann überall erfüllt, wenn für alle p = 0 −f ′ (|p|) m, p γ m, p und f ′ (|p|) |p| + 2f (|p|) = − 3 = 3γ 5 |p| |p| |p| gilt. Dies ist äquivalent zu −f ′ (|p|) = 3 γ γ γ für alle p = 0. 4 und − 3 3 + 2f (|p|) = − |p| |p| |p|3 Die zweite dieser Gleichungen ist äquivalent zu f (|p|) = γ/ |p|3 (für alle p = 0) und die erste ist dann auch erfüllt. Ergebnis: Für das Vektorfeld A : V 0 → V mit A (p) = γm × p/ |p|3 gilt X = rot A. Das Feld A ist homogen vom Grad −2 und divergenzfrei. 3.2.28 *Das elektromagnetische Nahfeld eines Pulsars Pulsare werden heute als Überreste einer Supernovaexplosion gedeutet. In diesem Bild rotiert eine Kugel mit dem Radius R ≈ 10 km und einer Masse von ungefähr 21 Das Vektorpotential eines magnetischen Dipols ist für die Physik viel wichtiger als das Vektorpotential eines elektrischen Dipols, da in die Lagrangefunktion eines geladenen Teilchens einerseits das Vektorpotential des magnetischen und andererseits das skalare Potential des elektrischen Feldes, welche gemeinsam auf das Teilchen einwirken, eingehen. 22 Das magnetische Dipolmoment einer ’kleinen’, ebenen stromführenden Leiterschleife hat den Betrag IA, wenn I die Stromstärke im Leiter und A der Flächeninhalt des von der Schleife berandeten ebenen Gebietes ist. Der Vektor m liegt in der Achse senkrecht zur Schleife und ist so orientiert, dass die technische Stromrichtung rechtshändig um m rotiert. KAPITEL 3. VEKTORANALYSIS 273 einer Sonnenmasse mit einer Periode T von einigen Millisekunden bis einigen Sekunden. Das magnetische Moment des explodierten Sternes ist so wie ein erheblicher Teil seiner Masse und seines Eigendrehimpulses im verdichteten Rest konserviert. Seine Leptonenzahl hingegen strahlt der explodierende Sternkern über Neutrinos weitgehend ab und wird so zu einem Neutronenstern, einem gravitativ gebundenden Riesenbaryon mit der Massendichte eines Atomkerns. Beim Schrumpfen des Sternradius von 106 km auf 10 km steigt die magnetische Flussdichte an der Sternoberfläche um den Faktor 1015 an. Fällt das magnetische Moment eines Neutronensterns nicht auf seine Drehachse, dann rotiert das Magnetfeld des Sterns und regt das umgebende ionisierte Gas zu scharf ausgerichteter elektromagnetischer Abstrahlung in Richtung der momentan vorliegenden magnetischen Achse an. Überstreicht ein solcher Scheinwerferkegel bei seiner Rotation auch noch die Erde, dann macht sich der Neutronenstern in einem breiten Frequenzbereich als pulsierende Strahlungsquelle bemerkbar. Der Pulsarmittelpunkt wird in den Punkt 0 ∈ V gesetzt. Er rotiere mit der Kreisfrequenz ω = 2π/T > 0 im Rechtsschraubensinn um die Achse R · n für ein n ∈ V mit |n| = 1. Sein magnetisches Moment zur Zeit t sei eωtLn m ∈ V. Für Punkte p ∈ V mit R < |p| ≪ cT kann23 das exakte Flussdichtefeld B durch die quasistatischer Näherung B0 : R × (V 0) → V mit γ B0 (t, p) = 3 |p| 3 ' & ωtL e n m, p |p|2 p − eωtLn m genähert werden. Für das Vektorpotential A0 : R × (V 0) → V mit rot A0 (t, ·) = B0 (t, ·) gilt dann A0 (t, p) = γ eωtLn m × p/ |p|3 mit γ = µ0 /4π. Damit geht ein elektrisches Feld E0 einher. Diese erfüllt im Bereich R < |p| ≪ cT E (t, p) ≈ E0 (t, p) = −∂t A0 (t, p) = −γωn × eωtLn m × p |p|3 . Die beiden Felder E0 und B0 erfüllen offenbar die homogene Maxwellgleichung rotE0 (t, ·) + ∂t B0 (t, ·) = 0. Zudem gilt auf V 0 div B0 (t, ·) = 0, rot B0 (t, ·) = 0, div E0 (t, ·) = 0. Die (inhomogene) Maxwellgleichung rot B = µ0 j + ε0 µ0 ∂t E wird von den quasistatischen Näherungsfeldern E0 und B0 jedoch nicht erfüllt, da ja j = 0 und ∂t E0 = 0, aber rot B0 (t, ·) = 0 überall auf V 0 gilt. Der Betrag von B0 beträgt an den magnetischen Polen 2γ |m| /R3 = µ0 |m| /R3 2π. Wenn die kolportierten Flussdichten von bis zu 108 Tesla korrekt sind, dann hätte das magnetische Dipolmoment eines solchen Pulsars einen Betrag von |m| = 2πR3 · 23 108 T = 2π · 104 m µ0 3 · 108 T 1 = · 1027 A m2 . −7 4π · 10 T m/ A 2 c bezeichnet die Vakuumlichtgeschwindigkeit. Also liegt cT bei nur 300 km für T = 1 ms. KAPITEL 3. VEKTORANALYSIS 274 Das Dipolmoment der Erde beträgt etwa 7, 7 · 1022 A m2 . Die Querschnittsfläche der Erde ist π · 63802 · 106 m2 = 1, 3 · 1014 m2 . Eine Leiterschleife von der Größe des Erdäquators müsste also einen Strom von ca 108 A führen, um eine solches Dipolmoment zu erzeugen. Im Fall des Pulsars hätte der Strom eine Stärke von ca 1018 A. Der Betrag des elektrischen Feldes E0 hat an der Oberfläche des Sterns eine Größenordnung von Rω · 108 T. Für R = 104 m und ω = 2π · 10 Hz ergibt dies einen Wert von etwa 104 · 2π · 10 · 108 T m s−1 = 2π · 1013 V m−1 . Bis in eine Entfernung von 100 · R sinkt die elektrische Feldstärke auf 10−4 · 2π · 1013 V m−1 = 2π · 109 V m−1 ab. 3.2.29 *Uneigentliches Vektorpotential A′ eines Monopols Zur Illustration der Sätze 133 und 134 dient uns das elektrische Feldstärkefeld X einer Punktladung in 0 ∈ V mit dim(V ) = 3. Es gilt X : V 0 → V, X (p) := p/ |p|3 . Hat X ein skalares und ein Vektorpotential? Die nach Satz 133 dafür notwendigen Bedingungen sind wegen div (X) = 0, rot (X) = 0 erfüllt. Da U := V 0 nicht sternförmig (aber einfach zusammenhängend) ist, sind jedoch die hinreichenden Bedingungen von Satz 134 nicht gegeben. Nur eine etwas allgemeinere Version dieses Satzes, die für einfach zusammenhängende Gebiete gilt, stellt klar, dass ein skalares Potential existiert. Dieses kennen wir auch schon, da X = − grad 1r mit r = |·| . Im vorliegenden Fall lässt sich die Existenz eines skalaren Potentials von X auf die Aussage von Satz 134 zurückführen. Und zwar so: Wir können X auf das offene und sternförmige Gebiet U ′ := V (R≥0 · n) einschränken, wobei n ∈ V mit |n| = 1 sei. Zu einem so eingeschränkten X ′ := X |U ′ existieren gemäß Satz 134 sowohl ein skalares als auch ein Vektorpotential. Klarerweise gilt X ′ = − grad (1/r) auf U ′ . Das Potential 1/r auf U ′ kann nun offensichtlich zu einem differenzierbaren Skalarfeld auf U fortgesetzt werden. Damit findet die Existenz des skalaren Potentials von X mit seinem einfach zusammenhängenden aber nicht sternförmigen Definitionsbereich eine Erklärung. Die Frage nach einem skalaren Potential von X stellt sich in der Elektrostatik. In der Magnetostatik ist X das magnetische Induktionsfeld eines (fiktiven) magnetischen Monopols. Für die Lagrangeformulierung der Mechanik einer Punktladung im Feld X benötigt man ein Vektorpotential von X. Wegen div (X) = 0 könnte es eines geben. Ob ein solches tatsächlich existiert, lässt Satz 134 offen. Er sagt jedoch, dass die Einschränkung X ′ von X ein Vektorpotential hat. Ein solches Vektorpotential A′ : U ′ → V von X ′ ist auf U ′ gegeben durch A′ (p) := − n×p , r(p) (r(p) − n, p ) da X ′ = rot (A′ ) gilt. (Dies koordinatenfrei nachzurechnen ist eine nützliche Übung!) Sei nun θ(p) ∈ [0, π] der Winkel zwischen p und n, d.h. n, p = r(p) cos (θ(p)) . Da |A′ (p)| = sin (θ(p)) → ∞ für θ(p) → 0. r(p) (1 − cos (θ(p))) kann das Vektorfeld A′ offenbar nicht stetig von U ′ nach U fortgesetzt werden. KAPITEL 3. VEKTORANALYSIS 275 Eine etwas weitergehende Überlegung mit dem Satz von Stokes zeigt, dass und warum es auch kein anderes Vektorpotential zum maximal definierten Vektorfeld X geben kann. Das divergenz- und rotationsfreie Vektorfeld X hat also zwar ein skalares, aber kein Vektorpotential. Nur die Einschränkungen von X auf die Mengen U ′ haben Vektorpotentiale. U ′ entsteht aus V durch Entfernen eines von 0 ausgehenden Halbstrahles.24 Das Vektorpotential A′ von X|U ′ idealisiert das reale Vektorpotential einer sehr langen stromführenden Spule, die sich sehr eng um die Halbachse R≥0 · n windet. A′ wird hier als uneigentliches Vektorpotential des Punktmonopols bezeichnet, da X = rot A′ nicht auf dem ganzen Definitionsbereich von X gilt. 3.2.30 *Rekonstruktion des Dipolvektorpotentials aus A′ Das skalare Potential eines Punktdipols geht durch Richtungsableitung aus dem skalaren Potential eines Punktmonopols hervor. (Siehe Beispiele zur Richtungsableitung) Geht auch das Vektorpotential eines Punktdipols A:V 0 → V mit A (p) = n×p |p|3 mit n ∈ V und |n| = 1 aus dem Beinahe-Vektorpotential A′ eines Punktmonopols A′ : V (R≥0 · n) → V mit A′ (p) := − n×p Ln =− 2 (p) r(p) (r(p) − n, p ) r (1 − cos θ) in ähnlicher Weise hervor? Zieht man von dem in n-Richtung etwas verschobenen Vektorpotential A′ das unverschobene Vektorpotential ab, dann könnten sich die Singularitäten auf der Achse R≥0 · n gegenseitig ausgleichen und vielleicht ein differenzierbares Vektorfeld auf V 0 ergeben. Probieren wir das aus. Sei ε > 0. Dann gilt für alle p ∈ V {(−∞, ε] · n} wegen n × (p − εn) = n × p A′ (p − εn) − A′ (p) (n × p) =− · ε ε , , , , 1 1 , , . − r2 (1 − cos θ) ,p−εn r2 (1 − cos θ) ,p Für den Grenzübergang zu ε → 0 folgt somit A′ (p − εn) − A′ (p) = (n × p) · [n]p ε→0 ε lim 24 r2 1 (1 − cos θ) . Dirac erkannte, dass die Wahl von n, die in A′ eingeht, auf die quantenmechanischen Eigenschaften eines elektrisch geladenes Teilchens, das dem Feld A′ ausgesetzt ist, genau dann keinen Einfluss hat, wenn die elektrische Ladung des Teilchens ein ganzzahliges Vielfaches einer universellen Ladungseinheit ist. Das führte ihn zur Vermutung, dass die Existenz von (hypothetischen) magnetischen Monopolen die Erklärung für die „Quantisierung“ aller elektrischen Ladungen geben könnte. Darum wird immer wieder nach magnetischen Monopolen gesucht. KAPITEL 3. VEKTORANALYSIS 276 Es ist also die Richtungsableitung von r−2 (1 − cos θ)−1 = |·|−1 (|·| − n, · )−1 an der Stelle p unter n zu berechnen. Es gilt [n]p =− 2 p, n − p,n |p| 1 |·| (|·| − n, · ) n, p − |p| n, n |p|2 (|p| − n, p )2 =− [n]p |·|2 − |·| n, · |p|2 (|p| − n, p )2 n, p 2 + |p|2 − 2 p, n |p| 1 = = 3. 3 2 |p| (|p| − n, p ) |p| Für die Richtungsableitung von A′ unter n gilt somit für alle p ∈ V (R≥0 · n) A′ (p − εn) − A′ (p) n×p = . ε→0 ε |p|3 − [n]p A′ := lim Das Vektorfeld − [n]p A′ hat offenbar eine stetige Fortsetzung nach V das Vektorpotential eines Punktdipols. 3.3 0. Diese ist Krummlinige Koordinatensysteme Um die Notation zu vereinfachen, sei in diesem Abschnitt V = Rn mit dem Standardskalarprodukt. Die (kontravariante) Karte Φe =: Ξ von V bzüglich der Standardbasis e wird als Ξ = (x1 , . . . , xn ) bezeichnet.25 Für n = 2, 3 wird auch Ξ = (x, y) bzw. Ξ = (x, y, z) notiert. Zwischen Zeilen- und Spaltenvektoren wird nicht systematisch unterschieden, sondern meist nach graphischen Vorteilen notiert. Ein Koordinatensystem von Rn ist ein Schema, mit dem alle Punkte einer offenen Teilmenge von Rn durch n-Tupel reeller Zahlen eindeutig addressiert werden. Die von uns bisher benützten (globalen) Koordinatensysteme entstehen durch die Wahl einer Basis des betrachteten Vektorraums. Solche an die Vektorraumstruktur angepasste Koordinaten heißen lineare Koordinaten. Zwischen linearen Koordinaten zu verschiedenen Basen besteht der lineare Zusammenhang von Gleichung (3.1). In diesem Abschnitt werden wir allgemeinere Koordinatensysteme kennenlernen. Die Verwendung eines geschickt gewählten allgemeineren Koordinatensystems kann manche konkrete numerische Rechnung erheblich vereinfachen. Manche Koordinatensysteme sind etwa an die Symmetrie einer speziellen Situation angepasst und bieten sich in solchen Fällen an. Wirklich zwingend wird die Einführung allgemeinerer Koordinaten jedoch dann, wenn Vektorräume als Bühne für Differential und Integral verlassen werden. Was ist der Gradient eines Skalarfeldes, das nur auf der Oberfläche einer Kugel gegeben ist? Solchen Fragen, die sich z. B. im Bereich der Mechanik mit Zwangsbedingungen ergeben, werden wir hier nicht nachgehen. 3.3.1 Lokale Karten von Rn Definition 136 Sei U ⊂ V offen. Eine C ∞-Abbildung Φ = Φ1 , ..., Φn : U → Φ (U ) ⊂ Rn , 25 i x ist also jene Funktion von V nach R, die einen Punkt (p1 , . . . pn ) auf pi abbildet. KAPITEL 3. VEKTORANALYSIS 277 die bijektiv ist, und deren Umkehrabbildung auch vom C ∞ -Typ ist, heißt eine lokale Karte oder ein lokales Koordinatensystem von Rn . Die reellwertigen Funktionen Φi für i = 1, . . . , n heißen Koordinatenfunktionen von Φ. Polarkoordinaten Für n = 2 sei U die geschlitzte Ebene U := {p ∈ V | y(p) = 0 ⇒ x(p) < 0} . Dann ist die Abbildung Φ = (r, φ) : U → (0, ∞)×(0, 2π) implizit durch x = r cos (φ) und y = r sin (φ) auf U definiert. Beachte: r = x2 + y 2 ; φ (p) ist der orientierte Winkel zwischen (1, 0) und p. Der Beweis, dass Φ eine lokale Karte ist, benötigt den Satz über implizite Funktionen. Die Koordinatenlinien durch p ∈ U: Die Niveaulinie φ = φ(p) ∈ (0, 2π) ist der von 0 ausgehende Halbstrahl durch p. Auf ihr ist r nicht konstant. Sie heißt Koordinatenlinie zu r durch p. Die Niveaulinie r = r(p) > 0 ist der Kreis um (0, 0) durch p, aus dem der Punkt (r(p), 0) entfernt ist. Diese Linie heißt Koordinatenlinie zu φ durch p. Sie ist gekrümmt und darauf spielt die Bezeichnung krummliniges Koordinatensystem an. Zylinderkoordinaten Sei n = 3 und U := {p ∈ V | y(p) = 0 ⇒ x(p) < 0} . Dann ist die Abbildung Φ = (r, φ, z) : U → (0, ∞) × (0, 2π) × R implizit definiert durch x = r cos (φ) und y = r sin (φ). Beachte: r = x2 + y 2 ; φ (p) ist der orientierte Winkel zwischen (1, 0, 0) und der Parallelprojektion (x(p), y(p), 0) von p in die Ebene z = 0 längs der z-Achse. Die Koordinatenlinien durch p ∈ U : Die Niveaufläche φ = φ(p) ∈ (0, 2π) ist die von der z-Achse ausgehende Halbebene durch p. Die Niveaufläche r = r(p) > 0 ist der Zylindermantel um R · (0, 0, 1) durch p, aus dem die affine Gerade (r(p), 0, R) entfernt ist. Die Niveaufläche zu z = z(p) ist wie bei kartesischen Koordinaten die affine Ebene durch p senkrecht zur z-Achse, aus der die Halbgerade (R≥0 , 0, z(p)) entfernt ist. Die Koordinatenlinie zu r durch p ist die Schnittmenge der Niveauflächen zu φ und z durch p, also eine Halbgerade. Die Koordinatenlinie zu φ durch p, also die Schnittmenge der Niveauflächen zu r und z durch p, ist der Kreis, dem der Punkt (r(p), 0, z(p)) fehlt. Etc., etc... Kugelkoordinaten Sei n = 3 und U = {p ∈ V | y(p) = 0 ⇒ x(p) < 0} . KAPITEL 3. VEKTORANALYSIS 278 Dann ist Φ = (r, θ, φ) : U → (0, ∞) × (0, π) × (0, 2π) implizit definiert durch x = r sin (θ) cos (φ) , y = r sin (θ) sin (φ) und z = r cos (θ) . Beachte: r = x2 + y 2 + z 2 ; φ (p) ist der (orientierte) Winkel zwischen (1, 0, 0) und der Parallelprojektion von p in die Ebene z = 0 längs der z-Achse; θ(p) ist der eindeutig bestimmte Winkel im Intervall (0, π) , für den e3 , p = |p| cos (θ(p)) gilt. Die Niveauflächen von r, θ und φ sind Sphären ohne Nullmeridian, Kegelmäntel ohne φ-Schweissnaht und offene von der z-Achse begrenzte Halbebenen. Die Koordinatenlinien sind Halbgerade, Meridiane und (punktierte) Breitenkreise. In allen drei Beispielen ist der Definitionsbereich der Karte Φ nicht der gesamte Raum V. Der Definitionsbereich der Abbildungen Φ könnte etwas ausgedehnt werden. Dabei würde Φ jedoch unstetig und nicht differenzierbar werden und somit die Karteneigenschaft verlieren. 3.3.2 Navigation auf der Sphäre Polarstern und Erdradius Welchen Abstand haben die Breitenkreise auf der Erde, deren Polarwinkel die Werte 0 < θ1 < θ 2 < π haben? Es gilt D = (θ2 − θ1 ) · R mit R = 6370 km. Soll also der Polarstern um 1◦ höher am Himmel stehen, muss man sich auf der Nordhalbkugel auf einem Meridian um D = π · R/180 = 111, 2 km nach Norden bewegen. Nach Kontroversen über die Erdabplattung wurde im 19. Jahrhundert ein mittlerer Wert von R durch Vermessung von D für einige Meridianbögen mit ebenfalls genau vermessenen Werten θ 2 − θ1 ermittelt. Diese Meridianbögen waren auf mehrere Kontinente verteilt. Eine der ’Messkampagnen’ leitete Gauß. Dabei wurde der 2◦ Bogen eines Meridians zwischen Göttingen und Hamburg Altona durch damals noch schwer zugänglich Sümpfe hindurch markiert und vermessen.26 Wie weit muss man von Innsbruck nach Osten gehen, damit sich die geographische Länge um 1◦ erhöht, dass also die Sonne um 4 Minuten früher ihren Zenit erreicht als in Innsbruck? Innsbruck liegt auf 47◦ nördlicher Breite und hat somit den Polarwinkel von θ = 43◦ . Der Breitenkreis durch Innsbruck hat dann den Um43 fang von 2Rπ · sin θ = 2π sin 180 π · 6370 km = 27296 km = 360 · 75, 822 km. Man muss also um ca. 76 km nach Osten, also nach Wörgl gehen. Damit ist klar, warum die englischen Seefahrer, die den Pazifik erkundeten und kartierten, auf möglichst genaue und vor allem seetüchtige Uhren angewiesen waren. An die Strapazen der Navigatoren bei Polarexpeditionen, die mit Sextant und Uhr bei Sturm und Minusgraden durch unkartiertes Gelände den Weg zum Pol wiesen, will man gar nicht denken! Ein Magnetkompass ist ja in Polnähe völlig unbrauchbar. Erst Kreiselkompass und später GPS brachten hier eine deutliche Erleichterung. Unterseeboote sind bei polnahen Tauchgängen immer noch auf den Kreiselkompass angewiesen, da das Wasser sie nicht nur vom Feind, sondern auch von den eigenen GPS-Satelliten abschirmt. 26 http://de.wikipedia.org/wiki/Gradmessung KAPITEL 3. VEKTORANALYSIS 279 Sphärischer Abstand Als Beispiel für den etwas komplexeren Einsatz von Kugelkoordinaten bestimmen wir den sphärischen Abstand zweier Punkte p, q der Oberfläche einer Kugel vom Radius R. Was ist ein sphärischer Abstand? Die Ebene durch den Mittelpunkt der Sphäre und durch die Oberflächenpunkte p und q schneidet die Oberfläche. Das Schnittgebilde ist ein Großkreis durch p und q. Die Punkte p, q zerlegen den Großkreis in zwei Teile, sogenannte Großkreisbögen. Das Minimum der Längen der beiden Großkreisbögen wird als ’Abstand auf der Kugel’ zwischen p und q oder auch als der sphärische Abstand zwischen p und q bezeichnet. Er ist auch die Länge des kürzesten Weges auf der Kugeloberfläche, der p und q verbindet. Ein Tunnelweg von p nach q, der einer Sekante folgt, wird also nicht in Erwägung gezogen. Die Kugelkoodinaten von p bzw q werden als r (p) = rp , θ (p) = θp etc bezeichent. Es gilt rp = rq = R. Der Kreisbogen von p nach q hat demnach die Länge d (p, q) = R · arccos p, q . R2 Nun gilt wegen p/R = sin θp cos ϕp · ex + sin θp sin ϕp · ey + cos θp · ez p, q R2 = sin θp cos ϕp sin θ q cos ϕq + sin θp sin ϕp sin θq sin ϕq + cos θp cos θ q = sin θp sin θq cos ϕp cos ϕq + sin ϕp sin ϕq + cos θp cos θq = sin θp sin θq cos ϕp − ϕq + cos θp cos θq . Welchen spärischen Abstand hat also Innsbruck (= q) von Perth (= p) in Australien? Innsbruck hat die (gerundeten) geographischen Koordinaten 47◦ N, 11◦ O während Perth auf 32◦ S, 116◦ O liegt. Es gilt also θq = 43 · π/180, θp = 122 · π/180 und ϕq − ϕp = 105 · π/180. Daraus folgt mit R = 6370 km d (p, q) = R · arccos sin θp sin θq cos ϕp − ϕq + cos θp cos θ q = 13619 km. Wollte man von Innsbruck aus auf kürzestem Weg nach Perth gelangen, müsste man in welche Richtung losfliegen? Ersetzt man Perth durch Mekka, ergibt sich die für Muslime in q wichtige Frage ’Wohin sich wenden zum Gebet?’. Geophysikalisch interessanter ist aber: In welcher Richtung liegt der magnetische Südpol? Berechnen wir nun diese Richtung für Innsbruck. Sphärische Peilung Der magnetische Südpol der Erde liegt gegenwärtig (2013) zwar in der Nähe des geographischen Nordpols, aber eben nicht genau in ihm. Diese Abweichung ist eine der Ursachen dafür, dass der Nordpol einer Kompassnadel nicht genau nach Norden weist. In welche Richtung zeigte eine Kompassnadel, wenn alle anderen Beiträge zur magnetischen ’Missweisung’ belanglos wären? KAPITEL 3. VEKTORANALYSIS 280 Der magnetische Südpol liegt derzeit auf 85, 75◦ nördlicher Breite und 144, 46◦ westlicher Länge. Seine Entfernung zum geographischen Nordpol beträgt somit etwa ◦ RE · 4,25 π = 6370 km · 7, 417 × 10−2 ≈ 470 km. 180◦ Sei (x, y, z) jene kartesische Karte, für die der Erdmittelpunkt in 0, der geographische Nordpol auf der positiven z-Achse und der magnetische Südpol in der Halbebene y = 0 mit x > 0 liegt. Dies fixiert die zugehörigen Kugelkoodinaten des ◦ magnetischen Südpols p zu θp = 4,25 π = 7, 417 × 10−2 und ϕp = 0. 180◦ Sei q ein Ort auf der Erde im Kartenbereich der Kugelkoordinaten. Die Werte von θ und ϕ in q werden wieder mit θq und ϕq bezeichnet. Innsbruck zB liegt auf 43◦ 47◦ nördlicher Breite und 11◦ östlicher Länge, sodass in diesem Fall θq = 180 ◦ · π = 144,46◦ +11◦ 0, 75049 und ϕq = · π = 2, 7133 folgt. 180◦ Der Richtungseinheitsvektor vom Erdmittelpunkt zum Ort q zerlegt sich nach der kartesischen Standardbasis (ex , ey , ez ) gemäß eq = sin θq cos ϕq · ex + sin θq sin ϕq · ey + cos θ q · ez . Die Ebene durch Erdmittelpunkt, geographischen Nordpol und q hat den Normaleneinheitsvektor nq = (ez × eq ) / |ez × eq | = − sin ϕq · ex + cos ϕq · ey . Die Ebene, in der Erdmittelpunkt, magnetischer Südpol p und q liegen, hat den Normaleneinheitsvektor ep × eq . pq := |ep × eq | Der (ungerichtete) Winkel δ zwischen den beiden Einheitsvektoren nq und pq stimmt mit dem (ungerichteten) Winkel zwischen der wahren Nordrichtung in q und der Tangente jenes Großkreises durch q überein, der auch durch p geht. Würde ein Kompass in q in Richtung des kürzesten Weges nach p weisen, wäre dies die vom Kompass angezeigte (falsche) Nordrichtung. Es gilt also cos δ = nq · pq = nq · (ep × eq ) . |ep × eq | Wenden wir uns zunächst dem Zähler zu. Es gilt nq · (ep × eq ) = − sin ϕq (ep × eq )x + cos ϕq (ep × eq )y . Nun folgt unter Verwendung von ep = sin θ p · ex + cos θp · ez (ep × eq )x = eyp ezq − ezp eyq = −ezp eyq = − cos θp sin θq sin ϕq , (ep × eq )y = ezp exq − exp ezq = cos θp sin θq cos ϕq − sin θp cos θ q . Daher gilt nq · (ep × eq ) = cos θp sin θq sin2 ϕq + cos ϕq cos θp sin θq cos ϕq − sin θp cos θ q = cos θp sin θq − sin θp cos θq cos ϕq . Nun zum Nenner |ep × eq | . Wegen |ep × eq |2 = 1 − (ep · eq )2 = 1 − sin θp sin θq cos ϕq + cos θp cos θq 2 KAPITEL 3. VEKTORANALYSIS folgt 281 cos θp sin θq − sin θp cos θq cos ϕq cos δ = 1 − sin θp sin θ q cos ϕq + cos θp cos θ q 2 1/2 . Einsetzen der Winkel ergibt für Innsbruck δ = 2, 4175◦ . Ein Tangentenvektor in Innsbruck an jenen Großkreisbogen, der Innsbruck mit dem magnetischen Nordpol verbindet, weist also in die Richtung von ca 2, 5◦ West. Die tatsächliche Abweichung zwischen der geographischen und magnetischen Nordrichtung ist jedoch eine andere. Die magnetische Nordrichtung ist momentan in Innsbruck um eine Missweisung von etwa 2◦ nach Osten(!) aus der geographischen Nordrichtung gedreht. Und dann verlaufen auch noch die Linien gleicher Missweisung in Mitteleuropa nahezu in Nord-Süd Richtung.27 3.3.3 Kartenbasis Eine Karte erzeugt in jedem Punkt p ihres Definitionsbereiches U ⊂ V = Rn eine Basis des Vektorraumes V. Im allgemeinen variiert diese Basis von Punkt zu Punkt. Wie wird diese Kartenbasis gebildet? Der i-te Basisvektor in p weist von p aus in jene Richtung, in die in linearer Approximation die i-te Koordinatenfunktion zunimmt und alle anderen Koordinatenfunktionen konstant sind. Die Länge des iten Basisvektors δ Φ i p wird so gewählt, dass für ε → 0 Φj p + ε δ Φ i p = Φj (p) + εδ ji + o (ε) . Der folgende Satz zeigt, wie diese Kartenbasis berechnet werden kann. Satz 137 (Kartenbasis) Sei Φ : U → Φ (U ) ⊂ Rn eine lokale Karte von Rn . Sei p ∈ U und q = Φ(p). Dann sind für genügend kleines ε > 0 die Kurven γΦ p,i : (−ε, ε) → U, t → Φ−1 (q + tei ) für i = 1, ..., n wohldefiniert. Sie erfüllen γ Φ p,i (0) = p und sind in 0 differenzierbar. Die Tangentenvektoren n δΦ i p ∂iΦ xj := γ̇ Φ p,i (0) = j=1 p · ej für i = 1, ..., n bilden eine Basis von V. Sie heißt Kartenbasis zu Φ im Punkt p. Die Richtungsableitung δ Φ i p f einer differenzierbaren Funktion f : U → R an der Stelle p erfüllt δΦ i 27 f= p ∂ (f ◦ Φ−1 ) (Φ (p)) . ∂xi Siehe http://www.zamg.ac.at/cms/de/geophysik/magnetik/landesaufnahme und die Erklärungen auf http://de.wikipedia.org/wiki/Missweisung. KAPITEL 3. VEKTORANALYSIS 282 Die Funktion f Φ := f ◦ Φ−1 heißt der Φ-Kartenausdruck von f. Daher die BeΦ Φ zeichnung: δ Φ i p f =: ∂i f (p) . Um ∂i f zu berechnen, sind also zwei Schritte auszuführen: 1) Bestimmung des Kartenausdrucks von f in der Karte Φ und 2) diesen Kartenausdruck partiell nach der i-ten Variablen differenzieren. Beweis. Da Φ bijektiv ist und mit Φ auch Φ−1 eine C ∞ -Funktion ist, ist die Jakobimatrix ∂iΦ xj p in jedem Punkt p invertierbar. Damit ist das Vektorensystem δ Φ p eine Basis. Die Formel für die Richtungsableitung von f unter δ Φ i p folgt so: δΦ i f = lim p f p + ε δΦ i ε→0 = lim (f ◦ Φ −1 p − f (p) ε ◦ Φ) p + ε δ Φ i p − (f ◦ Φ−1 ◦ Φ) (p) ε f (Φ (p) + εei ) − f (Φ (p)) ∂ (f ◦ Φ−1 ) (Φ (p)) . = lim = ε→0 ε ∂xi ε→0 Φ Φ Satz 138 Auf dem Durchschnitt der Definitionsbereiche zweier lokaler Karten Φ und Ψ gilt die Kartenwechselformel ∂iΦ f = nj=1 ∂iΦ Ψj · ∂jΨ f für i = 1, . . . , n. Beweis. Das ist einfach die Kettenregel angewandt auf f ◦ Φ−1 = (f ◦ Ψ−1 ) ◦ (Ψ ◦ Φ−1 ) am Bereich Φ U Φ ∩ U Ψ . Anmerkungen: i i 1) Auf U gilt die Dualitätsrelation δ Φ j Φ = δ j . Dazu äquivalent ist jede der drei Aussagen: & ' i grad Φi , δ Φ dΦi δ Φ = δ ij , ∂jΦ Φi = δ ij . j = δj , j Damit ist für p ∈ U auch die Familie von Vektoren (gradp Φ1 , . . . gradp Φn ) eine Basis von Rn . Sie wird wegen ihrer Dualität zur Kartenbasis als die duale (oder auch reziproke) Kartenbasis in p bezeichnet. 2) Für die Einträge der Gramschen Matrix des Standardskalarproduktes zur Kartenbasis gilt in p ∈ U GΦ ij (p) = ( δΦ i p , δΦ j p ) n n ∂iΦ xk p = k,l=1 ek , el ∂jΦ xl p ∂iΦ xk = p ∂jΦ xk p . k=1 Φ i also im Durchschnitt C 3) Das Bild der Kurve γ p,i ist in der Φ -Koordinatenlinie, j j j=i Nj,p der Niveauflächen Nj,p := {q ∈ U | Φ (q) = Φ (p)} enthalten. Φ ∞ 4) Die Vektorfelder δ Φ i : U → V, p → δ i p mit i = 1, ..., n sind C -Vektorfelder. 3.3.4 Vektorfeldkomponenten zu Kartenbasen Ist X : U → V ein Vektorfeld, dann hat es an jeder Stelle p ∈ U eine Zerlegung nach der Standardbasis (e1 , . . . en ) und natürlich eine nach der Kartenbasis Φ einer beliebigen Karte Φ : U → Rn . Diese sind gegeben durch δΦ 1 p , . . . δn p KAPITEL 3. VEKTORANALYSIS 283 die beiden Sätze von kontravarianten Komponentenfunktionen XΞi : U → R und XΦi : U → R mit n n XΞi X (p) = i=1 n XΦi (p) · ei = i=1 (p) · δΦ i p n XΦi = i=1 (p) · ∂iΦ xj j=1 p · ej . Somit gilt die Kartenwechselformel auf U n XΞj = i=1 XΦi · ∂iΦ xj . Multiplikation dieser Gleichung mit der Funktion ∂jΞ Φk und Summation über j ergibt die Auflösung nach XΦk , denn aufgrund der Kettenregel gilt ja n n j=1 XΞj · ∂jΞ Φk = n n XΦi ∂iΦ xj ∂jΞ Φk = j=1 i=1 n XΦi δ ki = XΦk . XΦi ∂iΦ Φk = i=1 i=1 Somit gilt für die Komponentenfunktionen XΦi zur allgemeinen Karte der folgende Zusammenhang mit den Komponentenfunktionen zur Standardkarte Ξ : n XΦi = j=1 XΞj · ∂jΞ Φi . Die Komponente XΦi (p) stimmt also mit der Richtungsableitung der Koordinatenfunktion Φi an der Stelle p mit dem Vektor X (p) überein: [Xp ] Φi = XΦi (p) . Ein weiterer Satz von Bestimmungsstücken für das Vektorfeld X ist durch die n Funktionen XiΦ : U → R für i = 1, . . . n mit XiΦ (p) = GΦ ij (p) = ( ( δΦ i p δΦ i p ) n i GΦ ij (p) XΦ (p) und , X (p) = , δΦ j p ) j=1 n ∂iΦ xk = p ∂jΦ xk p . k=1 gegeben. Sie heißen kovariante Komponentenfunktionen des Vektorfeldes X. Die Gramsche Matrix vermittelt also zwischen den beiden n-Tupeln von Funktionen über die ’Indexherunterziehformel’ n XiΦ j GΦ ij XΦ . = j=1 Wie drücken sich die kovarianten Komponentenfunktionen bezüglich einer allgemeinen Karte Φ durch jene der Standardkarte aus? Es gilt XiΦ (p) = ( δΦ i p ) n n ∂iΦ xj p , X (p) = i=1 ∂iΦ xj ej , X (p) = i=1 p XjΞ (p) . KAPITEL 3. VEKTORANALYSIS 284 Um die kontravarianten Komponentenfunktionen XΦi aus den kovarianten zu −1 berechnen, wird die inverse Matrix von GΦ (p) := GΦ (p) der Grammatrix GΦ (p) benötigt. Ihre Einträge werden oben indiziert, sodass als Funktionsgleichung n XΦi Φ Gij Φ Xj = j=1 gilt. Damit wird eine Automatik bezüglich des Transformationsverhaltens der Komponenten unter Kartenwechsel in der Schreibweise etabliert. Sie hat aber lediglich den Charakter einer Merkhilfe. Behauptung: Die Gramsche Matrix der dualen Kartenbasis in p stimmt mit −1 GΦ (p) überein, dh für die Einträge Gij Φ (p) mit p ∈ U gilt & ' i j Gij = Φ (p) = gradp Φ , gradp Φ n n ∂kΞ Φi δ kl ∂lΞ Φj p p ∂kΞ Φi = k,l=1 p ∂kΞ Φj p . k=1 Zum Beweis genügt es über die Kettenregel nachzurechnen, dass n i Φ Gij Φ (p) Gjk (p) = δ k = j=1 1 für i = k 0 sonst folgt. Dies geht so n n Gij Φ j=1 (p) · GΦ jk n n ∂lΞ Φi p (p) = ∂lΞ Φj p j=1 l=1 n n ∂lΞ Φi = p ∂kΦ xr = 3.3.5 p ∂kΦ xr p r=1 n ∂lΞ Φj j=1 p · ∂jΦ xr p n ∂lΞ Φi p l=1 r=1 ∂kΦ Φi p ∂jΦ xr p l=1 r=1 n n = · ∂kΦ xr p δ rl ∂kΦ xr = p ∂rΞ Φi p r=1 = δ ik . Polarkoordinaten Seien Φ = (r, φ) die Polarkoordinaten von R2 . Dann gilt für p ∈ U , d p (r(p) + t) cos (φ(p)) ,, cos (φ(p)) Φ δ1 p = = = . , sin (φ(p)) dt (r(p) + t) sin (φ(p)) r(p) t=0 , d r(p) cos (φ(p) + t) ,, − sin (φ(p)) −y(p) Φ δ2 p = = r(p) = , cos (φ(p)) x(p) dt r(p) sin (φ(p) + t) t=0 . Φ Das Vektorfeld δ Φ 1 ist ein radial nach außen gerichtetes Einheitsvektorfeld und δ 2 Ξ Ξ 28 stimmt auf U mit dem Drehvektorfeld L = −yδ 1 + xδ 2 überein. Ein reellwertiges 28 Ξ bezeichnet wieder die Standardkarte. KAPITEL 3. VEKTORANALYSIS 285 Skalarfeld f ∈ C 1 (R2 0) erfüllt daher genau dann die partielle Differentialgleichung Φ [L] f = 0, wenn 0 = δ Φ 2 f = ∂2 f, wenn also der polare Kartenausdruck von f nicht von φ abhängt. Dies ist genau dann der Fall, wenn f invariant unter allen Drehungen um 0 ist. Die Quantenmechanik macht von komplexwertigen Skalarfeldern f ∈ C 1 (R2 0) Gebrauch, die [L] f = λf für ein λ ∈ C lösen. Solch eine Funktion f erfüllt also ∂2Φ f = λf auf U. Es existiert somit eine Funktion g ∈ C 1 (R>0 ) mit f = g (r) eλφ auf U. Für g = 0 ist f aber genau dann in C 1 (R2 0) , wenn λ = im für ein m ∈ Z. Es gilt somit für jede Funktion fm , die auf U fm = g (r) eimφ erfüllt, die Eigenwertgleichung [−iL] fm = mfm auf ganz R2 0. Für eine Drehung Rα von fm um den Winkel α im positiven Sinn folgt weiters Rα fm (p) := fm Rα−1 p = g (|p|) eim(φ(p)−α) = e−imα fm (p) für alle p ∈ U mit Rα−1 p ∈ U. Wegen der Stetigkeit von fm gilt Rα fm = e−imα fm auf ganz R2 0. Die Funktion |fm |2 ist folglich invariant unter allen Drehungen um 0. Die Gramsche Matrix GΦ (p) der Kartenbasis δ Φ p ergibt sich somit zu GΦ (p) = 1 0 0 r(p)2 . Wir abstrahieren aus dem vorangehenden Beispiel das Kurzrezept x1 (Φ1 , . . . , Φn ) ∂ .. δΦ auf U, . i = i ∂Φ n 1 n x (Φ , . . . , Φ ) das zum Tragen kommt, wenn die Karte Φ implizit gegeben ist. Laplaceoperator in Polarkoordinaten Sei Ξ = (x, y) die Standardkarte von R2 . Dann gilt für die Karte der Polarkoodinaten Φ = (r, ϕ) auf der geschlitzten Ebene U cos ϕ −r sin ϕ sin ϕ r cos ϕ Φ Ξ Ξ δΦ 1 , δ 2 = δ 1 , δ2 · . Die Inversion des Basiswechsels gibt Φ δ Ξ1 , δ Ξ2 = δ Φ 1 , δ2 · cos ϕ sin ϕ −1 −1 −r sin ϕ r cos ϕ . Für eine C 2 -Funktion f : U → R gilt daher δ Ξ1 f = cos ϕ δ Φ 1 f − sin ϕ Φ cos ϕ Φ δ 2 f, und δ Ξ2 f = sin ϕ δ Φ δ 2 f. 1 f + r r Wir kürzen die Richtungsableitungen als partielle Ableitungen ab δ Ξ1 f = ∂x f, δ Ξ2 f = ∂y f, δΦ 1 f = ∂ρ f, δΦ 2 f = ∂ϕ f. KAPITEL 3. VEKTORANALYSIS 286 Damit gilt ∂x f = ∂y f = sin ϕ ∂ϕ f, r cos ϕ sin ϕ∂r + ∂ϕ f. r cos ϕ∂r − Iteration der Richtungsableitung δ Ξ1 δ Ξ1 f = ∂x2 f ergibt nun sin ϕ sin ϕ cos ϕ∂r − ∂ϕ ∂ϕ f r r sin ϕ cos ϕ sin ϕ = cos2 ϕ∂r2 + cos ϕ 2 ∂ϕ − ∂r ∂ϕ f r r sin2 ϕ sin ϕ cos ϕ sin ϕ cos ϕ sin2 ϕ + ∂r − ∂ϕ ∂r + ∂ + ∂ϕ ∂ϕ f. ϕ r r r2 r2 ∂x2 f = cos ϕ∂r − Analog ergibt sich cos ϕ cos ϕ ∂ϕ sin ϕ∂r + ∂ϕ f r r cos ϕ cos ϕ ∂r ∂ϕ f = sin2 ϕ∂r2 − sin ϕ 2 ∂ϕ + sin ϕ r r cos ϕ sin ϕ cos ϕ sin ϕ cos2 ϕ 2 cos2 ϕ + ∂ f. ∂r + ∂ϕ ∂r − ∂ϕ + r r r r2 ϕ ∂y2 f = sin ϕ∂r + Daraus folgt für den Lpalaceoperator in Polarkoordinaten 1 1 1 1 ∂r (r∂r ) + 2 ∂ϕ2 f. ∂r2 + ∂r + 2 ∂ϕ2 f = r r r r √ Nutzen wir dies, um am Potential Φ = r sin (ϕ/2) einer (inhomogen) geladenen Halbgeraden in der Ebene zu überprüfen, dass ∆Φ = 0. Es gilt ∂r Φ = sin (ϕ/2) /2r1/2 und ∂r2 Φ = − sin (ϕ/2) /4r3/2 . Daraus folgt ∆f = ∂x2 f + ∂y2 f = 1 1 ∂r2 + ∂r + 2 ∂ϕ2 Φ = r r 3.3.6 − 1 1 1 + 3/2 − 3/2 3/2 4r 2r 4r sin (ϕ/2) = 0. Kugelkoordinaten Seien Φ = (r, θ, ϕ) Kugelkoordinaten und Ξ = (x, y, z) die Standardkarte. Anwendung des Kurzrezeptes ergibt die Vektorfelder auf U sin (θ) cos (ϕ) id δΦ = sin (θ) sin (ϕ) = , 1 r cos (θ) cos (θ) cos (ϕ) δΦ = r · cos (θ) sin (ϕ) , 2 − sin (θ) − sin (θ) sin (ϕ) = r · sin (θ) cos (ϕ) . δΦ 3 0 KAPITEL 3. VEKTORANALYSIS 287 Φ δΦ 1 ist ein radial nach außen gerichtetes Einheitsvektorfeld. Der Vektor δ 1 p ist im Punkt p tangential an die Schnittlinie der beiden Niveauflächen θ = θ (p) und ϕ = ϕ (p) . Analog ist δ Φ 2 p ist in p tangential an den Meridian r = r(p) und ϕ = ϕ(p) durch p. Das Vektorfeld δ Φ 3 stimmt auf U mit dem Drehvektorfeld um die z-Achse zur Standardorientierung überein. δ Φ 3 p ist in p tangential an den Breitenkreis, der durch θ = θ (p) und r = r (p) bestimmt ist. Gemäß Konstruktion gilt 3 δΦ i = j=1 oder in Matrixnotation δ Φ = δ Ξ · J t mit Φ 1 ∂1 Ξ t ∂1Φ Ξ2 J = ∂1Φ Ξ3 δ Ξj · ∂iΦ Ξj der Jakobimatrix ∂2Φ Ξ1 ∂3Φ Ξ1 ∂2Φ Ξ2 ∂3Φ Ξ2 . ∂2Φ Ξ3 ∂3Φ Ξ3 Φ Φ δΦ = δΦ 1 , δ 2 , δ 3 ist genau dann in jedem Punkt p ∈ U eine Basis, wenn die Determinante der Jakobimatrix sin (θ) cos (ϕ) r cos (θ) cos (ϕ) −r sin (θ) sin (ϕ) J t = sin (θ) sin (ϕ) r cos (θ) sin (ϕ) r sin (θ) cos (ϕ) cos (θ) −r sin (θ) 0 nirgends gleich 0 ist. Tatsächlich ergibt sich (zB durch Entwicklung nach der letzten Zeile) detJ t = r2 sin θ > 0 auf U. Die Basen δ Φ (p) und δ Ξ (p) sind also in jedem Punkt p ∈ U gleich orientiert. Die Gramsche Matrixfunktion auf U ergibt sich zu 1 0 0 . GΦ = 0 r2 0 2 2 0 0 r sin (θ) Laplaceoperator in Kugelkoordinaten Der Laplaceoperator in Kugelkoordinaten Φ = (r, θ, ϕ) ergibt sich scheinbar recht einfach durch Verwendung unvollständiger Notation. Am Kartenbereich von Φ gilt mit ρ = x2 + y 2 = r sin θ x = ρ cos ϕ und y = ρ sin ϕ. In jeder Niveaufläche von z ist Ψ = (ρ, ϕ) eine ebene polare Karte. Daher gilt für den polaren Kartenausdruck von ∂x2 + ∂y2 unter Verschleierung der Karte Ψ 1 1 ∂x2 + ∂y2 = ∂ρ2 + ∂ρ + 2 ∂ϕ2 . ρ ρ (3.24) KAPITEL 3. VEKTORANALYSIS 288 Außerdem ist (r, θ) die Einschränkung von ebenen polaren Koordinaten auf eine Niveaufläche von ϕ. In dieser Halbebene ist aber χ = (ρ, z) eine kartesische Karte. Daher gilt wieder etwas verschleiernd 1 1 ∂ρ2 + ∂z2 = ∂r2 + ∂r + 2 ∂θ2 . r r (3.25) Addition der Gleichungen (3.24) und (3.25) ergibt 1 1 1 1 ∂x2 + ∂y2 + ∂z2 = ∂ρ + 2 ∂ϕ2 + ∂r2 + ∂r + 2 ∂θ2 . ρ ρ r r Entscheidend für ∂ρΨ = ∂ρχ ist die Tatsache, dass die partielle Ableitung ∂ρ in beiden der Gleichungen (3.24) und (3.25) die Richtungsableitung mit dem Einheitsvektor cos θ 1 (xex + yey ) = sin θ · δ r + · δθ ρ r ist. Damit folgt 1 sin θ cos θ 1 cot θ ∂ρ = · ∂r + 2 · ∂θ = · ∂r + 2 · ∂θ ρ r sin θ r sin θ r r und daher 2 cot θ 1 1 ∂x2 + ∂y2 + ∂z2 = ∂r2 + ∂r + 2 · ∂θ + 2 ∂θ2 + 2 2 ∂ϕ2 r r r r sin θ 2 1 1 2 = ∂r2 + ∂r + 2 ∂θ2 + cot θ · ∂θ + 2 ∂ϕ . r r sin θ 3.3.7 Kartenabhängigkeit partieller Ableitungen Auf V = R2 sei die Funktion g durch g := x2 + xy gegeben. Es sollen zwei partielle Ableitungen von g berechnet werden, die zur Vorsicht mahnen. Neben der Standardkarte Ξ := Φe := (x, y) = id der kontravarianten Koordinaten von V zur Standardbasis e ist auch die Karte Φ := Φf zur Basis f = (f1 , f2 ) := (e1 , e2 ) · 1 0 −1 1 eine globale, lineare Karte von R2 . Es gilt Φ = (x, x + y). Die lineare Funktion Φ : R2 → R2 mit 1 0 x Φ= · 1 1 y ist als Hintereinanderschaltung zweier linearer Funktionen, die erste davon eine Kar1 0 te, natürlich eine C ∞-Funktion. Wegen det = 1 ist sie invertierbar und 1 1 somit eine Karte. Es gilt weiter g = Φ1 Φ2 und daher ∂1Ξ g = 2x + y und ∂1Φ g = Φ2 = x + y. KAPITEL 3. VEKTORANALYSIS 289 Die Verschiedenheit der beiden partiellen Ableitungen ist wegen δ Ξ1 = e1 = (1, 0) und δ Φ 1 = f1 = (1, −1) zu erwarten. Wenn aber der Kartenname an den Symbolen Ξ ∂1 und ∂1Φ weggelassen wird, und wenn man wegen Φ1 = Ξ1 = x dann noch statt ∂1 das Symbol ∂x verwendet, hat man zur Kenntnis zu nehmen, dass ∂x g ohne weitere Angaben sinnlos ist, da es davon abhängt, durch welche weiteren Funktionen die Funktion x zu einer Karte ergänzt wird. Dieser Sachverhalt sorgt in der Wärmelehre für zwei unterschiedliche spezifische Wärmen. Eine bei konstantem Volumen und eine bei konstantem Druck. Eine Verallgemeinerung des vorigen Beispiels bietet die Galileitransformation. Sie wechselt von der Standardkarte Ξ := (t, x) von R2 zur linearen Karte (t′ , x′ ) gemäß t′ = t und x′ = x − vt. Hier ist v ∈ R die Relativgeschwindigkeit der beiden Karten. Wir notieren systematischer: t′ 1 0 t Φ := = · =: M · Ξ. ′ x −v 1 x Wegen der Kartenwechselformel für die partiellen Ableitungen eines Skalarfeldes g ∂iΞ g = j=1,2 ∂iΞ Φj · ∂jΦ g folgt mit ∂1Ξ Φ1 ∂1Ξ Φ2 ∂2Ξ Φ1 ∂2Ξ Φ2 = Mt dass ∂1Ξ g, ∂2Ξ g = ∂1Φ g, ∂2Φ g ·M = ∂1Φ g − v∂2Φ g, ∂2Φ g . Mit der Kurznotation ∂1Ξ g = ∂t g, ∂1Φ g = ∂t′ g und ∂2Ξ g = ∂x g, ∂2Φ g = ∂x′ g folgt somit ∂t g = ∂t′ g − v∂x′ g und ∂xg = ∂x′ g, wegen t′ = t und x′ = x etwas irritierend. Dieser Sachverhalt ist für die Galileisymmetrie der freien Schrödingergleichung oder auch der Wärmeleitungsgleichung von Bedeutung. 3.3.8 Geschwindigkeit zerlegt nach Kartenbasis Ein Flugkörper nähert sich einem Schiff, indem er eine Kurve γ : R ⊃ I → R3 verwirklicht. I ist dabei ein offenes Intervall. Die Radarstation des Schiffes misst eine zeitliche Abfolge des Abstands zwischen Schiff und Flugobjekt. Der Mann am Fernrohr notiert zeitliche Abfolgen der Winkel, um die das Fernrohr aus der Nordrichtung gedreht und gegen den Horizont geneigt werden muss, um das Objekt ins Fadenkreuz zu bekommen. Die Frau an der Kanone wird unruhig und möchte wissen mit welcher Geschwindigkeit sich das Objekt nähert. Sie erinnert sich an ihre Vorlesung über Math Phys. Irgendwie bestimmen die drei Funktionen r ◦ γ, θ ◦ γ, ϕ ◦ γ die Größe γ̇ (t)! Aber wie geht das nochmals? KAPITEL 3. VEKTORANALYSIS 290 Der folgende Satz illustriert, inwiefern Kartenbasen die Lösung des Problems übersichtlich gestalten. Er ist eine Folge der Kettenregel und er zeigt, wie der Tangentenvektor einer Kurve γ in einem Punkt γ (t) nach einer Kartenbasis im Punkt γ (t) zu zerlegen ist. Die Komponenten dieses meist als Geschwindigkeit von γ in γ (t) bezeichneten Vektors bezüglich der Kartenbasis ergeben sich einfach durch Differenzieren der Komponenten des Kartenbildes Φ ◦ γ der Kurve an der Stelle t. Satz 139 Sei Φ : U → Φ (U) eine lokale Karte von Rn . Die Kurve γ : I → U sei dγ iΦ (t) differenzierbar. Sei γ iΦ := Φi ◦ γ. Dann gilt γ̇(t) = ni=1 dt δΦ i γ(t) und 8 9 9 |γ̇(t)| = : n dγ iΦ (t) Φ dγ j (t) Gij (γ (t)) Φ . dt dt i,j=1 Beweis. Der Beweis benützt die Kettenregel für die Hintereinanderschaltung γ = Φ−1 ◦ (Φ ◦ γ). Mit γ(t) = p und mit Φ = ni=1 Φi ei folgt γ̇(t) = (dt γ) (1) = dΦ(p) Φ−1 ◦ dt (Φ ◦ γ) (1) = dΦ(p) Φ−1 (dt (Φ ◦ γ) (1)) n = dΦ(p) Φ i=1 n = i=1 n dΦi (γ (t)) ei dt −1 i dΦ (γ (t)) Φ lim ε→0 dt −1 = i=1 dΦi (γ (t)) dΦ(p) Φ−1 (ei ) dt (Φ(p) + εei ) − Φ−1 (Φ(p)) = ε n i=1 dγ iΦ (t) Φ δi dt p . Als Beispiel diene der Kugelkoordinatenausdruck der kinetischen Energie. Seien Φ = (r, θ, φ) Kugelkoordinaten mit dem Kartenbereich U und sei γ : I → R3 differenzierbar. Für alle t ∈ I mit γ(t) ∈ U folgt dann γ̇(t), γ̇(t) = dγ iΦ (t) ( Φ = δi dt i,j=1 3 = (r ◦ γ)′ (t) 2 γ(t) , δΦ j γ(t) + (θ ◦ γ)′ (t) 2 ) dγ j (t) Φ dt 3 dγ iΦ (t) Φ dγ jΦ (t) = Gij (γ(t)) dt dt i,j=1 r2 ◦ γ (t) + (φ ◦ γ)′ (t) 2 (r sin (θ))2 ◦ γ (t) . In Physiktexten wird diese Formel verkürzt zu |γ̇|2 = ṙ2 + (rθ̇)2 + (r sin (θ) φ̇)2 . Man beachte jedoch, dass diese Schreibweise Φi und Φi ◦γ nicht voneinander unterscheidet. 3.3.9 *Beschleunigung zerlegt nach Kartenbasis Sei nun γ : I → U ⊂ Rn eine C 2 -Kurve mit γ (t) = p und sei (e1 , . . . en ) die Standardbasis von Rn und Ξ = (x1 , . . . , xn ) die zugehörige Standardkarte von Rn . Es gilt also idRn = ni=1 xi · ei . Die Abbildung Φ : U → Rn sei eine lokale Karte. Die Geschwindigkeit zur Zeit t ist der folgende Vektor aus V : dγ (t) = dt n i i=1 ′ Φ ◦ γ (t) · n δΦ i p i = i=1 ′ Φ ◦ γ (t) · n j=1 ∂iΦ xj (p) · ej KAPITEL 3. VEKTORANALYSIS 291 Die Beschleunigung von γ zur Zeit t ist die zweite Ableitung von γ an der Stelle dγ i t. Sie ergibt sich mit den Abkürzung γ iΦ := Φi ◦ γ und γ̇ iΦ = dtΦ zu n d2 γ d i (t) = γ̇ Φ (t) · ∂iΦ xj (γ (t)) · ej . 2 dt dt i,j=1 2 Satz 140 Für die Beschleunigung ddt2γ einer C 2 -Kurve γ : I → Rn gilt für alle t ∈ I, für die γ (t) Element des Definitionsbereiches U der Karte Φ : U → Rn ist, mit der Abkürzung γ iΦ = Φi ◦ γ 2 3 n n d2 γ d2 γ kΦ (t) = (t) + γ̇ iΦ (t) γ̇ jΦ (t) Γkij ◦ γ (t) · δ Φ (3.26) k γ(t) . 2 dt2 dt i,j=1 k=1 Dabei sind die Christoffelsymbole Γkij : U → R der Karte Φ für i, j, k ∈ {1, . . . n} durch n Γkij (p) = ∂jΦ ∂iΦ xl p ∂lΞ Φk p l=1 definiert. Beweis. Die Zerlegung von ej nach der Basis δ Φ n Φ j j=1 ∂i x (p) · ej zu n n ∂kΞ Φi p δΦ i p n ∂kΞ Φi = i=1 i=1 n p j=1 ∂kΞ Ξj = n ∂iΦ xj p j=1 p p · ej = j=1 ergibt sich aus δ Φ i 2 n ∂iΦ Ξj p ∂kΞ Φi i=1 p p = 3 · ej · ej = ek . Unter Verwendung dieser Zerlegung und, wo gefahrlos möglich, unter Verwendung der Abkürzung p = γ (t) folgt ddtγ̇ (t) = n d i γ̇ Φ (t) · ∂iΦ xj dt i,j=1 γ(t) n · ej n d i = γ̇ Φ (t) · ∂iΦ xj γ(t) ∂jΞ Φk · δ Φ k p dt i,j=1 k=1 * i + n dγ̇ Φ d Φ j Φ j i = (t) · ∂i x p + γ̇ Φ (t) · ∂i x p ∂jΞ Φk · δ Φ k p dt dt i,j,k=1 2 3 n n d2 γ iΦ = (t) · ∂iΦ xj p + γ̇ iΦ (t) γ̇ lΦ (t) ∂lΦ ∂iΦ xj p ∂jΞ Φk 2 dt i,j,k=1 l=1 Da für alle p ∈ U n n ∂iΦ xj p j=1 ∂jΞ Φk p ∂iΦ Φk = j=1 p = δ ki p · δΦ k p . KAPITEL 3. VEKTORANALYSIS 292 gilt, folgt weiter dγ̇ (t) = dt n i,k=1 n = k=1 2 2 n d2 γ iΦ (t) i δ k + γ̇ iΦ (t) γ̇ lΦ (t) ∂lΦ ∂iΦ xj dt2 j,l=1 n p ∂jΞ Φk p 3 n d2 γ kΦ (t) + γ̇ iΦ (t) γ̇ jΦ (t) 2 dt i,j=1 ∂jΦ ∂iΦ xl p ∂lΞ Φk p l=1 δΦ k 3 δΦ k p p . Sind die von γ unabhängigen Funktionen Γkij : U → R (Zusammenhangskomponenten oder Christoffelsymbole der Karte Φ) so definiert, dass für p ∈ U n Γkij ∂jΦ ∂iΦ xl (p) = p ∂lΞ Φk p (3.27) , l=1 dann gilt folglich d2 γ (t) = dt2 n k=1 2 3 n d2 γ kΦ (t) + γ̇ iΦ (t) γ̇ jΦ (t) Γkij ◦ γ (t) · δ Φ k dt2 i,j=1 γ(t) . Man beachte, dass wegen ∂jΦ ∂iΦ xl = ∂iΦ ∂jΦ xl auch Γkij = Γkji . Die k-Komponente der Beschleunigung zur Zeit t setzt sich also additiv aus der zweiten Ableitung von Φk (γ (t)) und einer ortsabhängigen quadratischen Form Γkγ(t) (γ̇ (t)) des Geschwindigkeitsvektors zusammen. 3.3.10 *Berechnung der Christoffelsymbole einer Karte Die definierende Formel (3.27) ist für eine Berechnung der Funktionen Γkij oft ungeeignet, da etwa in Kugelkoordinaten die Berechnung der partiellen Ableitungen ∂lΞ Φk sehr umständlich ist. Oft erweist sich der folgende Umweg über die ’indexgezogene’ Größe Γikj als hilfreich. Sei also Γikj : U → R mit n l GΦ kl (p) Γij (p) . Γikj (p) := l=1 Dann folgt daraus n l=1 n = = = n ∂jΦ ∂iΦ xr GΦ kl Γikj = ∂rΞ Φl r=1 n n ∂kΦ xs l=1 s=1 n ∂kΦ xs s=1 n ∂kΦ xs s=1 ∂lΦ xs ∂jΦ ∂iΦ xr ∂rΞ Φl r=1 n n ∂jΦ ∂iΦ xr r=1 n ∂rΞ Φl l=1 n ∂jΦ ∂iΦ xr r=1 ∂lΦ xs δ sr ∂kΦ xs = s=1 ∂jΦ ∂iΦ xs . KAPITEL 3. VEKTORANALYSIS 293 Offenbar gilt Γikj = Γjki ebenso wie Γkij = Γkji für alle i, j, k. Der Zusammenhang n ∂kΦ xs Γikj = ∂jΦ ∂iΦ xs (3.28) s=1 enthält nun keine Ableitungen des Typs ∂lΞ Φk sondern nur mehr Ableitungen der Standardkoordinatenfunktionen nach den allgemeinen. Aber auch Formel (3.28) ist für praktische Rechnungen noch mühselig. Eine weitere Vereinfachung schafft die folgende Einsicht. Satz 141 Für die Zusammenhangskomponenten der Karte Φ : U → Rn gilt auf U 1 Φ Φ Φ Φ Γikj = ∂i Gjk + ∂jΦ GΦ (3.29) ik − ∂k Gij . 2 Beweis. Auf der rechten Seite die drei Matrixelemente der Gramschen Matrix durch die Darstellung n GΦ ij ∂iΦ xs = ∂jΦ xs s=1 ersetzen, ausdifferenzieren mit Produktregel und wegheben. Christoffelsymbole der Kugelkoordinaten Probieren wir die Kraft von Gleichung (3.29) am Beispiel der Kugelkoordinaten aus. Sei Φ = (r, θ, ϕ) und Ξ = (x, y, z) mit x sin θ cos ϕ y = r sin θ sin ϕ z cos θ auf dem Kartenbereich U der Kugelkoordinaten. Um bei der Berechnung der Funktionen Γikj die Übersicht behalten zu können, empfiehlt sich die Bildung von MatrixPaketen Γk = [Γikj ] . Es ergibt sich mithilfe von Gleichung (3.29) 0 0 0 0 r 0 , Γ2 = r 0 , 0 0 Γ1 = 0 −r (3.30) 2 2 2 0 0 −r sin θ 0 0 −r sin θ cos θ 0 0 r sin2 θ 0 0 r2 sin θ cos θ . Γ3 = r sin2 θ r2 sin θ cos θ 0 k Wegen der Diagonalität von GΦ folgen die Matrizen Γk = Γkij mit Γk = GΦ kk Γ zu 0 0 0 0 1r 0 , Γ2 = 1 Γ2 = 1 0 , 0 0 Γ1 = Γ1 = 0 −r r r2 2 2 0 0 −r sin θ 0 0 − sin θ cos θ (3.31) 1 0 0 r 1 3 θ . Γ = 2 2 Γ3 = 0 0 cos sin θ r sin θ 1 cos θ 0 r sin θ KAPITEL 3. VEKTORANALYSIS 3.3.11 294 *Beschleunigung sphärisch zerlegt Die Beschleunigung a : I → R3 einer C 2 -Kurve γ : I → R3 soll nun zur Zeit t für γ (t) ∈ U nach den Elementen der Kartenbasis der Karte Φ : U → R3 der Kugelkoordinaten im Punkt γ (t) zerlegt werden. Die entsprechenden Komponentenfunktionen ai : I → R werden also wie folgt definiert: für t ∈ I gilt d2 γ a (t) = 2 (t) = dt 3 ai (t) δ Φ i γ(t) . i=1 Um die Suggestivkraft der Formeln zu erhöhen wird vereinfachend notiert a1 = ar , a2 = aθ , a3 = aϕ . Darüberhinaus wird etwas sinnentstellend (Φi ◦ γ) = ′ ′′ (r, θ, ϕ) , (Φi ◦ γ) = ṙ, θ̇, ϕ̇ und (Φi ◦ γ) = r̈, θ̈, ϕ̈ abgekürzt. Die Spezialisierung von Formel (3.26) auf die Christoffelsymbole von Gleichung (3.31) ergibt dann 2 ar = r̈ − rθ̇ − r sin2 (θ) ϕ̇2 , 2 aθ = θ̈ + ṙθ̇ − sin (θ) cos (θ) ϕ̇2 , r cos θ 2 θ̇ϕ̇. aϕ = ϕ̈ + ṙϕ̇ + 2 r sin θ Beispiel 142 Sehen wir uns an, ob die Beschleunigungskomponenten ar , aθ und aϕ der folgenden unbeschleunigten ’Bewegung’ γ : R>0 → R3 tatsächlich gleich 0 sind. Es gelte mit s, v ∈ R>0 γ (t) = vt · e1 + s · e2 , d.h. die Bewegung führt vom Punkt s · e2 mit konstanter Geschwindigkeit in positive 1-Richtung. Es gilt also r (t) = s2 + (vt)2 , θ (t) = π/2, ϕ (t) = arctan vts und daher v2t (sv)2 ṙ (t) = , r̈ (t) = . 3/2 s2 + (vt)2 s2 + (vt)2 Weiter folgt θ̇ = 0 = θ̈ und ϕ̇ (t) = −sv 2 s + (vt)2 ϕ̈ (t) = 2sv 3 t s2 + (vt)2 2. Daraus folgt r (sv)2 2 a (t) = r̈ (t) − r (t) ϕ̇ (t) = s2 + (vt)2 3/2 − s2 2 + (vt) · (sv)2 s2 + (vt)2 aθ (t) = 0, aϕ (t) = 2sv 3 t s2 + (vt) 2 2 + 2 s2 + (vt)2 · v2t s2 + (vt)2 · s2 −sv = 0. + (vt)2 2 = 0, KAPITEL 3. VEKTORANALYSIS 3.3.12 295 *Bewegung im Zentralkraftfeld Als Anwendung der Zerlegung eines Beschleunigungsvektors nach der Kartenbasis der Kugelkoordinaten soll nun noch das Beispiel von Newtons Bewegungsgleichung mit einem stetigen, drehinvarianten und radial gerichteten Kraftfeld behandelt werden. Wir wissen bereits, dass so ein Kraftfeld ein Gradientenfeld ist. Wirkt auf einen (klassischen) Massenpunkt der Masse m eine solche Kraft, dann ist die zeitliche Abfolge der Orte des Massenpunktes eine Kurve γ : I → R3 , für die mγ̈ (t) = −gradγ(t) (V ◦ r) gilt. Dabei ist V : R>0 → R eine C 1 -Funktion und r (p) bezeichnet den Abstand von p ∈ R3 zum Kraftzentrum. Wird das Kraftzentrum in 0 angesiedelt, dann gilt für alle t ∈ I γ (t) mγ̈ (t) = −V ′ (|γ (t)|) . (3.32) |γ (t)| Gesucht sind letztlich alle maximalen Lösungen γ dieser Bewegungsgleichung. Diese Aufgabenstellung werden wir jedoch nicht lösen können. Wir werden aber zumindest einige Eigenschaften der Lösungen γ von Gleichung (3.32) ableiten. Verwendung von Standardkoordinaten Ψ bringt Newtons Gleichung in die Form i mẍ (t) = − V′ j j (xj (t))2 (xj (t)) 2 xi (t) . Dabei wurde xi = Ψi ◦ γ gesetzt. Die Gleichungen sind außer für V (r) = kr2 nichtlinear und miteinander verkoppelt. Verwendung von Kugelkoordinaten Φ um das Kraftzentrum führt, wegen gradγ(t) (V ◦ r) = V ′ (|γ (t)|) δ Φ 1 γ(t) , auf die Komponentenform 2 m r̈ − rθ̇ − r sin2 θϕ̇2 = −V ′ (r) , 2 m θ̈ + ṙθ̇ − sin θ cos θ ϕ̇2 = 0, r 2 cos θ θ̇ϕ̇ = 0. m ϕ̈ + ṙϕ̇ + 2 r sin θ (3.33a) (3.33b) (3.33c) Wieder wurde verkürzend notiert: Φ1 ◦ γ = r etc. Auch dieser Satz von gekoppelten Gleichungen erscheint zunächst unlösbar. Aber zwei Erhaltungssätze helfen weiter. Zunächst beachtet man, dass d (γ (t) × γ̇ (t)) = γ̇ (t) × γ̇ (t) + γ (t) × γ̈ (t) = 0, dt KAPITEL 3. VEKTORANALYSIS 296 da γ̈ (t) und γ (t) gemäß Gleichung (3.32) kollinear sind. Somit gilt für alle t, t0 ∈ I, dass γ (t) × γ̇ (t) = γ (t0 ) × γ̇ (t0 ) . Wegen 0 = γ (t) , γ (t) × γ̇ (t) = γ (t) , γ (t0 ) × γ̇ (t0 ) liegen das Bild von γ in der Ebene durch 0 mit dem Normalenvektor γ (t0 ) × γ̇ (t0 ) , wobei t0 ∈ I beliebig ist. Da jede Lösung γ von (3.32) durch eine Drehung R in eine Lösung R ◦ γ mit Bild in der z = 0 Ebene übergeführt werden kann, genügt es, Lösungen γ zu untersuchen, für die θ◦γ = π/2 gilt. Für diese ist (3.33b) trivial erfüllt und die Gleichungen (3.33a) und (3.33c) vereinfachen sich zu m r̈ − rϕ̇2 = −V ′ (r) , 2 m ϕ̈ + ṙϕ̇ = 0. r (3.34a) (3.34b) Der Vektor γ (t) × γ̇ (t) spezialisiert sich für Lösungen mit z = 0 zu γ (t) × γ̇ (t) = r (t) δ Φ 1 2 γ(t) × ṙ (t) δ Φ 1 γ(t) + ϕ̇ (t) δ Φ 3 γ(t) = −r (t) ϕ̇ (t) δ Φ 2 γ(t) = r (t) ϕ̇ (t) e3 . Da dieser Vektor von t unabhängig ist, existiert eine Zahl l ∈ R, sodass für alle t ∈ I l = mr2 (t) ϕ̇ (t) . (3.35) l ist die dritte Komponente des Drehimpulses mγ (t) × γ̇ (t) bezüglich der Zerlegung nach der Standardbasis. Mittels (3.35) lässt sich nun ϕ̇ aus Gleichung (3.34a) eliminieren. Damit ergibt sich die folgende 1-dimensionale Bewegungsgleichung auf R>0 l2 m r̈ − 2 3 mr = −V ′ (r) . (3.36) Multiplikation dieser Gleichung (3.36) mit ṙ ergibt m r̈ṙ − l2 ṙ + V ′ (r) ṙ = 0 m2 r 3 Dies wiederum ist äquivalent zu * d m 2 l2 ṙ + 2 2 dt 2 mr + + V (r) = 0. Es existiert also eine Zahl E ∈ R, sie heißt Energie des Massenpunktes, für die l2 m 2 ṙ + 2 2 E= 2 mr + V (r) . (3.37) KAPITEL 3. VEKTORANALYSIS 297 Damit sind von den ursprünglich drei gekoppelten Gleichungen zweiter Ordnung nur mehr die beiden Gleichungen (3.37) und (3.35) erster Ordnung übrig. Die Gleichung (3.37) kann nach ṙ aufgelöst und dann nach Wahl einer Anfangsvorgabe zumindest numerisch gelöst werden. Diese Lösung kann dann in (3.35) eingesezt werden, womit auch diese Gleichung einer numerischen Integration zugänglich ist. In speziellen Fällen wie etwa V (r) = α/r mit α ∈ R lässt sich auch die exakte Analyse weitertreiben. Details davon gibt eine Vorlesung über klassische Mechanik im Kapitel über das Keplerproblem. 3.3.13 *Keplerproblem Weil dieses Ergebnis eines der Kronjuwelen der Physik ist, soll hier noch aus den beiden Gleichungen (3.35) und (3.37) abgeleitet werden, dass die Bildmenge einer maximalen Lösung von Newtons Bewegungsgleichung (3.32) im Fall V (r) = α/r mit α ∈ R ein Kegelschnitt ist. Dazu wird aus den beiden Bewegungsgleichungen (3.35) und (3.37) eine Differentialgleichung für den lokalen Funktionszusammenhang zwischen r und ϕ abgeleitet. Das geht so: Sei r (0) = r0 und ϕ (0) = ϕ0 und für 0 < t < ε gelte r (t) = ρ (ϕ (t)) mit einer differenzierbaren Funktion ρ : J = (ϕ0 − ∆1 , ϕ0 + ∆2 ) → R>0 größtmöglichen Definitionsbereichs. Dann folgt für alle t∈J ṙ (t) = ρ′ (ϕ (t)) · ϕ̇ (t) = ρ′ (ϕ (t)) · l mr2 (t) = ρ′ (ϕ (t)) · mρ2 l . (ϕ (t)) Einsetzen dieses Ausdrucks für ṙ in (3.37) ergibt auf J E= l2 l2 m ′2 ρ · 2 4+ 2 2 2 mρ mρ + V (ρ) . OEdA29 kann dies zumindest30 für l = 0 aufgelöst werden zu / dρ 2m =ρ (E − V (ρ)) ρ2 − 1. dϕ l2 Diese Differentialgleichung ist vom Typ des separierten Variablen und es folgt für alle ϕ ∈ J ρ(ϕ) dx ϕ − ϕ0 = . 2−1 r0 x 2m (E − V (x)) x 2 l Mit a := 2mE/l2 und b := mα/l2 ist dieses Integral für V (r) = α/r elementar zu lösen: ,ρ(ϕ) ρ(ϕ) dx bx + 1 ,, √ √ ϕ − ϕ0 = = − arcsin . x ax2 − 2bx − 1 x a + b2 ,r0 r0 29 30 Die Bewegungsumkehrinvarianz kann dazu benützt werden ρ′ > 0 herbeizuführen. Für l = 0 liegt die Bahnkurve auf einer Graden durch 0. KAPITEL 3. VEKTORANALYSIS 298 Anwendung von sin ergibt br0 + 1 bρ (ϕ) + 1 √ √ = r0 a + b2 ρ (ϕ) a + b2 b 1 √ =√ + , a + b2 ρ (ϕ) a + b2 − sin ϕ − ϕ0 − arcsin also für alle ϕ ∈ J √ a + b2 1+ sin (ϕ − δ) b 1 = −b · ρ (ϕ) mit δ = ϕ0 + arcsin br0 + 1 √ r0 a + b2 . Es ist dies die Polardarstellung eines (Teils eines) Kegelschnitts. Ein zweiter Weg zu diesem Ergebnis, startet direkt von der 1-d Bewegungsgleichung (3.36). In dieser werden die Zeitableitungen von r über die Kettenregel durch die Winkelableitungen einer zumindest lokal existierenden Funktion u, für die u (ϕ (t)) = 1/r (t) gilt, ausgedrückt. Aus der Kettenregel ergibt sich ṙ (t) = d dt 1 u (ϕ (t)) =− u′ (ϕ (t)) l l ′ u′ (ϕ (t)) ϕ̇ (t) = − u (ϕ (t)) 2 2 · 2 = − m u (ϕ (t)) u (ϕ (t)) mr (t) und daher auch r̈ (t) = − l d ′ l l l u (ϕ (t)) = − u′′ (ϕ (t)) ϕ̇ (t) = − u′′ (ϕ (t)) · m dt m m mr (t)2 l = − m 2 u′′ (ϕ (t)) · u (ϕ (t))2 . Ersetzen von r̈ (t) in der radialen Bewegungsgleichung (3.36) durch − l m 2 u′′ (ϕ (t)) · u (ϕ (t))2 ergibt 0 = m r̈ (t) − = −m · l m l2 m2 r3 (t) + V ′ (r (t)) 2 · [u′′ (ϕ (t)) + u (ϕ (t))] · u (ϕ (t))2 − α · u (ϕ (t))2 oder äquivalent dazu u′′ (ϕ (t)) + u (ϕ (t)) = − αm . l2 (3.38) KAPITEL 3. VEKTORANALYSIS 299 Für jede Lösung u auf dem Intervall (0, 2π) von Gleichung (3.38) existieren Zahlen p, δ ∈ R, sodass αm 1 = u (ϕ (t)) = p cos (ϕ (t) − δ) − 2 r (t) l für alle t mit ϕ (t) ∈ (0, 2π) . Natürlich bleibt hier die Funktion t → ϕ (t) im Dunkeln, aber zumindest der Zusammenhang zwischen r (t) und ϕ (t) ist bis auf die Integrationskonstanten p, l und δ vollkommen festgelegt. Für die Bestimmung der Integrationskonstanten sind Anfangsbedingungen zu stellen. 3.3.14 *Richtungsableitung eines Vektorfeldes Zunächst eine Erinnerung an die Richtungsableitung eines Vektorfeldes, das auf einer offenen Teilmenge U des Vektorraums V = Rn definiert ist. Sei X : U → Rn ein C 1 -Vektorfeld. (e1 , . . . en ) bezeichnet wieder die Standardbasis von Rn und X = n i i=1 X ei definiert die Komponentenfunktionen von X zur Standardbasis. Ξ sei die Standardkarte von Rn . Es gilt also X i = Xei = XΞi . Dann ist durch 1 [X (p + εei ) − X (p)] = ε→0 ε n n [ei ]p X j · ej = [ei ]p X = lim j=1 ∂iΞ X j p j=1 · ej eine Richtungsableitung von X mit dem Vektor ei definiert. Sie ist selbst vektorwertig. Etwas allgemeiner geht es wie folgt. Definition 143 Für ein C 1 -Vektorfeld X mit offenem Definitionsbereich U ⊂ Rn und ein Vektorfeld Y : U → Rn heißt das Vektorfeld [Y ] X, das in p ∈ U den Wert [Y ]p X = lim 1 ε→0 X (p + εY (p)) − X (p) ε hat, Richtungsableitung oder kovariante Ableitung von X mit dem Vektorfeld Y. Statt [Y ]p X wird auch (∇Y X) (p) notiert. Mit den Komponentenfunktionen zur Standardkarte ergibt sich offenbar n [Y ]p X = n [Y ]p X j=1 j Y i (p) ∂iΞ X j ej = i,j=1 p · ej Die beiden folgenden Produktregeln sind brauchbare Rechenhilfen. Satz 144 Seien f : U → R und X, Y : U → Rn mit U ⊂ Rn offen vom C 1 -Typ. Weiter seien Z : U → Rn und ein Skalarprodukt ·, · von Rn gewählt. Dann gilt [Y ] (f · X) = ([Y ] f ) · X + f · ([Y ] X) und [Z] X, Y = [Z] X, Y + X, [Z] Y . KAPITEL 3. VEKTORANALYSIS 300 Seien X, Y Vektorfelder auf dem Kartenbereich U einer beliebigen lokalen Karte Φ : U → Rn , wobei X ein C 1 -Vektorfeld ist. Wie drückt sich das Vektorfeld [Y ] X : U → Rn durch die partiellen Ableitungen und die Komponentenfunktionen von X und Y bezüglich der Karte Φ aus? Satz 145 Seien X, Y : U → Rn mit X vom C 1 -Typ. Φ : U → Rn sei eine lokale Karte. Die Komponentenfunktionen des Vektorfelds X bezüglich der Kartenbasis zu Φ sind durch X = ni=1 XΦi ·δ Φ i definiert. Analoge Bezeichnungen sind für Y gewählt. Dann gilt mit den Zusammenhangskomponenten Γkij der Karte Φ . 7 n n n YΦi [Y ] X = Γkij XΦj ∂iΦ XΦk + k=1 i=1 · δΦ k. j=1 (3.39) Beweis. Es gilt n n n YΦi δ Φ i X = [Y ] X = i=1 n i=1 i=1 j=1 n n XΦj YΦi δ Φ i = XΦj δ Φ j YΦi δ Φ i j=1 k=1 n ∂jΦ xk · ek = YΦi XΦj ∂jΦ xk δΦ i i,j,k=1 · ek . XΦj ∂jΦ xk zunächst weiter. Verfolgen wir das Skalarfeld der Richtungsableitung δΦ i Es gilt δΦ XΦj ∂jΦ xk = ∂iΦ XΦj ∂jΦ xk + XΦj ∂iΦ ∂jΦ xk i und daher n k=1 XΦj ∂jΦ xk · ek = δΦ i n ∂iΦ XΦj ∂jΦ xk + XΦj ∂iΦ ∂jΦ xk k=1 n n ∂iΦ XΦj = k=1 n = l=1 · ek . ∂jΦ xk + XΦj ∂iΦ ∂jΦ xk l=1 ∂kΞ Φl · δ Φ l n ∂iΦ XΦj δ lj + XΦj ∂iΦ ∂jΦ xk k=1 ∂kΞ Φl 7 · δΦ l . Somit ist gezeigt, dass [Y ] X = n n n YΦi l=1 i,j=1 ∂iΦ XΦj δ lj + Γlij XΦj · δ Φ l = n YΦi l=1 i=1 . n Γlij XΦj ∂iΦ XΦl + j=1 7 · δΦ l . n Φ Φ l Als Spezialfall von (3.39) ergibt sich δ Φ i δj = l=1 Γij · δ l . Zusammen mit der Produktregel [Y ] (f X) = ([Y ] f) X + f [Y ] X für ein Skalarfeld f und ein Vektorfeld X ergibt sich daraus wieder der allgemeine Fall. KAPITEL 3. VEKTORANALYSIS 301 Man beachte, dass für zwei C 1 -Vektorfelder X, Y wegen Γlij = Γlji folgt, dass n [Y, X] := [Y ] X − [X] Y = i,j=1 YΦi ∂iΦ XΦj − XΦi ∂iΦ YΦj · δΦ j. Die Christoffelsymbole fallen also aus dem Lieprodukt der Vektorfelder X und Y heraus! Überdies folgt für f ∈ C 2 (U : R) und X, Y ∈ C 1 (U : Rn ) , dass [Y ] ([X] f ) − [X] ([Y ] f) = [[Y, X]] f auf U gilt. Dabei bezeichnet [X] f das Skalarfeld auf U, für das [X] f : p → [X]p f. Die letzte Behauptung ergibt sich unter Verwendung einer Karte Φ am Kartenbereich der Karte wegen ∂iΦ ∂jΦ f = ∂jΦ ∂iΦ f so: n [Y ] ([X] f ) − [X] ([Y ] f ) = i,j=1 n = i,j=1 3.3.15 YΦi ∂iΦ XΦj ∂jΦ f − XΦi ∂iΦ YΦj ∂jΦ f YΦi ∂iΦ XΦj − XΦi ∂iΦ YΦj ∂jΦ f = [[Y, X]] f. Div, Rot, Grad und ∆ in krummen Karten Große rechnerische Bedeutung haben auch die Kartenausdrücke von Gradient, Divergenz, Rotation und Laplace in krummlinigen Koordinatensystemen. Der folgende Satz gibt allgemeine Formeln an. Die Spezialisierungen auf einzelne Koordinatensysteme sind tabelliert. [14] Satz 146 Sei Φ : U → Φ(U) ⊂ Rn eine lokale Karte. Die Abbildungen f : U → R und X : U → V seien vom C 1 -Typ. Die skalaren Komponentenfunktionen XΦi von X bezüglich der Kartenbasis zu Φ sind durch X = ni=1 XΦi δ Φ i definiert. Dann gilt n i GΦ (p) (a) X (p) = −1 ij j=1 n ∂iΦ f (b) grad (f ) = ( δΦ j , X(p) p GΦ −1 ij ∂iΦ √ det GΦ XΦi , ) für p ∈ U, δΦ j, i,j=1 1 (c) div (X) = √ det GΦ n i=1 n √ 1 (d) ∆f = √ ∂iΦ det GΦ det GΦ i,j=1 GΦ −1 ij ∂jΦ f für f ∈ C 2 . Für n = 3 und eine Karte Φ mit positiv orientierter Kartenbasis gilt 2 3 3 3 1 i (e) rot (X) = √ εklm ∂kΦ GΦ δΦ li XΦ m. det GΦ k,l,m=1 i=1 Hier ist εklm = det (ek , el , em ). Für eine Karte mit negativ orientierter Kartenbasis ist εklm durch −εklm zu ersetzen. KAPITEL 3. VEKTORANALYSIS 302 Verwunderlich ist auf den ersten Blick das Vorkommen des Skalarprodukts in der Formel für div (X). Die beiden Funktionen det GΦ zu zwei Skalarprodukten unterscheiden sich jedoch nur um einen konstanten, positiv reellen Faktor voneinander. Dieser Faktor kürzt sich im Ausdruck für div (X) heraus, sodass div (X) nicht von der Wahl des Skalarproduktes abhängt. Das gilt nicht mehr für die allgemeinere Situation Riemann’scher Mannigfaltigkeiten anstelle von Vektorräumen. Dort ist der Faktor nicht notwendig konstant. Beweis. Zu (a): Sei δ eine beliebige Basis eines reellen Vektorraums V und sei ·, · ein Skalarprodukt von V. Die Gram’sche Matrix von ·, · zu δ sei G. Dann gilt für den Vektor X = nj=1 X j δ j n n X j δi, δj = δi , X = j=1 X j Gij . j=1 ji Daraus folgt X j = nj=1 (G−1 ) δ i , X . Damit ist (a) gezeigt. n i Φ Zu (b): Ein beliebiges Vektorfeld X = i=1 XΦ δ i ergibt das Skalarfeld der Richtungsableitungen von f zu n n XΦi δ Φ i f = [X] f = i=1 Andererseits gilt mit grad (f ) = i=1 n j=1 grad (f )j δ Φ j n [X] f = grad (f) , X = i=1 n XΦi = i,j=1 XΦi ∂iΦ f. & ' XΦi grad (f) , δ Φ i & ' Φ grad (f ) δ Φ = j , δi n j XΦi grad (f )j GΦ ji . i,j=1 Wähle nun das Vektorfeld X so, dass XΦi = δ ik für ein k ∈ {1, . . . n} . Da dies für alle k = 1, . . . n möglich ist, folgt für alle k n grad (f)j GΦ jk . ∂kΦ f = j=1 ji Somit folgt grad (f )j = ni=1 GΦ−1 ∂iΦ f und (b) ist gezeigt. Der Beweis von (c) ist in Vol 3 von [4] zu finden. (d) schließlich ist durch Einsetzen von (b) in (c) offensichtlich. (e) ist in [10] zu finden. Kugelkoordinaten Sei n = 3 und Φ = (r, θ, ϕ) Kugelkoordinaten. Dann gilt für f : U → R vom C 1 -Typ mit der Kurznotation ∂r = ∂1Φ , δ r = δ Φ 1 etc. grad (f ) = (∂r f ) δ r + ∂θ f ∂ϕ f δ θ + 2 2 δϕ . 2 r r sin θ KAPITEL 3. VEKTORANALYSIS 303 Insbesondere gilt: grad (r) = δ r , grad (θ) = r−2 δ θ und grad (ϕ) = r−2 sin−2 (θ) δ ϕ . Mit f ∈ C 2 (U : R) folgt aus Satzteil c) für ∆f in Kugelkoordinaten * + ∂ϕ2 f 1 1 2 div grad f = 2 ∂r r ∂r f + 2 ∂θ (sin θ · ∂θ f ) + r r sin θ sin θ 2 1 1 ∂2 f. = ∂r2 + ∂r + 2 ∂θ2 + cot θ · ∂θ + r r sin2 θ ϕ Anwendungsbeispiele 1. Welche Divergenz hat das Vektorfeld δ θ auf U ? Es gilt 1 daher div (δ θ ) = r2 sin ∂ (r2 sin θ) = cot θ. θ θ √ det GΦ = r2 sin θ und 2. Das Potential einer (homogen) geladenen Halbgerade ist Φe = ln (|·| − e, · ) mit |e| = 1. Rechnen wir nach, dass ∆Φe = 0. Mit Kugelkoordinaten (r, θ, ϕ) zur Polrichtung e gilt Φe = ln (r (1 − cos θ)) = ln r sin2 (θ/2) + ln 2. Daraus folgt nun ∆Φe = 2 1 ∂r2 + ∂r ln r + 2 ∂θ2 + cot θ · ∂θ ln (1 − cos θ) . r r Es gilt erstens ∂r2 + 2r ∂r ln r = (−r−2 + 2r−2 ) = 1/r2 und zweitens sin θ 1 − cos θ 2 cos θ (1 − cos θ) cos θ − sin θ −1 cos θ + = + = −1. = 2 1 − cos θ 1 − cos θ 1 − cos θ (1 − cos θ) ∂θ2 + cot θ · ∂θ ln (1 − cos θ) = (∂θ + cot θ) Damit folgt nun ∆Φe = 0. 3. Die Koordinatenfunktion ϕ selbst ist das elektrostatische Potential der dipolbelegten Halbebene y = 0 und x ≥ 0. Es gilt ∆ϕ = r−2 sin−2 θ∂ϕ2 ϕ = 0. 3.3.16 *Drehgeneratoren in Kugelkoordinaten Sei V ein dreidimensionaler reeller Vektorraum. Eine Orientierung und ein Skalarprodukt ·, · mit zugehöriger Norm |·| seien gewählt. Ebenso eine positiv orientierte Orthonormalbasis e = (e1 , e2 , e3 ) . Zu einem Vektor n ∈ V mit |n| = 1 ist Ln : V → V mit Ln (v) = n × v das Tangentenvektorfeld einer starren Drehung um die Achse R · n. Im folgenden sei f : V → R ein C ∞ -Skalarfeld. Das Skalarfeld der Richtungsableitungen von f mit dem Drehvektorfeld Ln erfüllt aufgrund der ’Spatproduktformel’ a, b × c = b, c × a [Ln ]v f = gradv (f ) , Ln (v) = gradv (f ) , n × v = n, v × gradv (f ) . Definition 147 Die Abbildung Ln : C ∞ (V : R) → C ∞ (V : R) mit Ln (f ) = [Ln ] f heißt Drehgenerator zur Achsenrichtung n ∈ S2 ⊂ V. Also Ln (f ) : v → [Ln ]v f. KAPITEL 3. VEKTORANALYSIS 304 3 i=1 Ist (x, y, z) die lineare Karte von V zur Basis e, dann gilt mit n = ni ei Ln (f ) = n1 (y∂z − z∂y ) + n2 (z∂x − x∂z ) + n3 (x∂y − y∂x ) f. Die drei Drehgeneratoren Li ≡ Lei zur gewählten ONB, also L1 = y∂z − z∂y etc, sollen nun durch die drei ’Derivationen’ δ Φ : C ∞ (V : R) → C ∞ (V : R) mit i Φ δΦ i f = ∂i f zur Karte Φ = (r, θ, ϕ) der Kugelkoordinaten ausgedrückt werden. Dies gelingt ohne großen Rechenaufwand, wenn zunächst für v im Kartenbereich U Φ Φ von Φ der Vektor v × gradv (f ) nach der Kartenbasis δ Φ 1 , δ 2 , δ 3 v = (δ r , δ θ , δ ϕ )v im Punkt v zerlegt wird. Es gilt wegen v = r (v) · δ r v × gradv (f ) = |v| · (δ r )v × (∂r f ) δ r + ∂θ f ∂ϕ f δϕ δ + θ r2 r2 sin2 θ . v Der ’Rahmen’31 (δ r , δ θ /r, δ ϕ /r sin θ) ist in jedem Punkt von U orthonormiert und positiv orientiert, sodass δr × δθ δϕ δϕ δθ = und δ r × =− r r sin θ r sin θ r folgt. Daher gilt v × gradv (f ) = ∂θ f ∂ϕ f δϕ − δθ r sin θ r sin θ . v Aus den Darstellungen r cos θ cos ϕ −r sin θ sin ϕ δ θ = (e1 , e2 , e3 ) · r cos θ sin ϕ und δ ϕ = (e1 , e2 , e3 ) · r sin θ cos ϕ −r sin θ 0 folgt nun für die drei Drehgeneratoren Li = ei , δ ϕ ei , δ θ ∂θ − ∂ϕ r sin θ r sin θ die Zerlegung nach den Derivationen ∂iΦ L1 = − sin ϕ · ∂θ − cot θ cos ϕ · ∂ϕ , L2 = cos ϕ · ∂θ − cot θ sin ϕ · ∂ϕ , L3 = ∂ϕ . In der Quantenmechanik treten die Richtungsableitungen −i Li auf den komplexwertigen Skalarfeldern von V als Bahndrehimpulsoperatoren auf. Satz 148 Für die Abbildungen L2i = Li ◦ Li : C ∞ (V : R) → C ∞ (V : R) gilt auf U L21 + L22 + L23 f = 31 ∂ϕ2 f 1 ∂θ (sin θ∂θ f ) + . sin θ sin2 θ Ein Rahmen ordnet jedem Punkt einer fest gewählten offenen Teilmenge von V eine Basis von V zu. KAPITEL 3. VEKTORANALYSIS 305 Beweis. Einfach unter Beachtung der Produktregel mit der sphärischen Zerlegung der Li nachrechnen. Korollar 149 Für die Summe der Abbildungen L2i gilt auf U L21 + L22 + L23 f = r2 ∆f − ∂r r2 ∂r f . Beweis. Dies ist aus der Darstellung des Laplaceoperators in Kugelkoordinaten direkt abzulesen. 3.3.17 *Magnetfeldlinien eines Dipols 2 Das elektrische bzw magnetische Feldstärkevektorfeld eines elektrischen bzw magnetischen Punktdipols ist bis auf einen konstanten Faktor das Gradientenfeld des skalaren Potentials f : R3 0 → R mit f = e3 , · /r3 . Auf U gilt somit f = cos (θ) /r2 . Im Bereich z > 0 folgt daraus f > 0 und im Bereich z < 0 hingegen f < 0. Die Gradientenformel in Kugelkoordinaten ergibt im Kartenbereich U * + 1 sin (θ) grad (f ) = − 3 2 cos (θ) δ r + δθ . r r Nach stetiger Fortsetzung von U nach R3 0 zeigt sich: an den Polen ist das Feld radial und am Äquator tangential. Es folgt weiter auf U |grad (f)| = 1 r3 (2 cos (θ))2 + (sin (θ))2 = 1 r3 1 + 3 cos2 (θ). Das Magnetfeld B der Erde ist außerhalb der Erdkugel annähernd vom Typ c · grad (f) . Daher variiert |B| auf der Erdoberfläche mit der geografischen Breite. An den Polen ist |B| maximal, am Äquator hingegen minimal und nur halb so groß wie am Pol. Am Pol steht B senkrecht zur Erdoberfläche, am Äquator ist B tangential zum Meridian. Eine weitere Veranschaulichung des Feldes eines Punktdipols liefern die Feldlinien des Vektorfeldes grad (f ) . Dazu sind alle maximalen Lösungen des Systems erster Ordnung γ̇ (t) = gradγ(t) (f) zu bestimmen. Die Bildmenge einer solchen Lösung γ ergibt dann eine Feldlinie oder ’Integralmannigfaltigkeit’ von grad (f ) . Zwei Vektorfelder X und Y, für die eine stetige skalare Funktion α ohne Nullstelle existiert, sodass X = αY gilt, haben aber dieselben Feldlinien. Wir gehen daher im Bereich U mit cos θ = 0 vom Vektorfeld grad (f ) zum Vektorfeld r4 X := − grad (f ) = 2rδ r + tan (θ) δ θ cos θ über. Unter Verwendung von r ◦ γ =: rγ und θ ◦ γ =: θγ nimmt nun das System γ̇ (t) = X (γ (t)) die komponentenweise Form ṙγ (t) = 2rγ (t) und θ̇γ (t) = tan θγ (t) KAPITEL 3. VEKTORANALYSIS 306 an. Das System X entkoppelt also (lokal32 ) die beiden Funktionen rγ und θγ . Die Menge der maximalen Lösungen der radialen Gleichung y ′ = 2y umfasst wegen der Einschränkung des Definitionsbereiches der Differentialgleichung auf y > 0 nur die Funktionen ρc : R → R>0 mit ρc (t) = ce2t mit c ∈ R>0 . Die Polarwinkelgleichung y ′ = tan y im Bereich 0 < y < π/2 ist vom Typ der separierten Variablen. Wegen 1 d = ln sin y tan y dy erfüllt eine Lösung y die Gleichung ln sin y (t) = t + k für ein k ∈ R. Äquivalent dazu ist et sin y (t) = C für ein C ∈ R>0 . Die Menge aller maximalen Lösungen im Wertebereich 0 < y < π/2 besteht somit aus den (bijektiven, wachsenden) Funktionen αC : (−∞, ln C) → 0, π 2 mit αC (t) = arcsin et mit C ∈ R>0 . C Eine maximale Lösung (ρc , αC ) des Systems ist somit nur auf (−∞, ln C) definiert.33 In diesem Bereich erfüllt sie ρc (t) = e2t = C sin2 αC (t) . c Damit sind die Bahnen der maximalen Integralkurven von X die Punktmengen in U mit ϕ = const und r = r0 sin2 θ im Bereich 0 < θ < π/2. Dabei ist r0 das Supremum der Restriktion von r auf die jeweilige Bahn. Eine analoge Überlegung im Bereich π/2 < θ < π zeigt, dass jede Bahn im ’oberen’ Halbraum z > 0 an genau eine Bahn im Bereich z < 0 stetig anschließt. Die Feldlinien eines Dipols im Schnitt der Ebene x = 0 mit U sind somit die Punktmengen in U, auf denen x = 0 und r = r0 sin2 θ für ein r0 ∈ R>0 gilt. Dabei gibt r0 die maximale Entfernung der Feldlinie von 0 an. Nur zwei Feldlinien in R3 0 entschwinden in unendliche Entfernung, nämlich die Halbstrahlen x = y = 0 mit z > 0 bzw z < 0. Sie besitzen keine Polardarstellung. Alle anderen Feldlinien beginnen und enden in der Singularität des Nullpunktes. Eine magnetische Feldlinie, die auf einer geografischen Breite von 45◦ aus dem Erdinneren austritt, steigt wegen R = r0 sin2 π/4 = r0 /2 bis zu einer maximalen Höhe eines Erdradiuses über dem Äquator auf. Feldlinien, die im Bereich des Polarkreises von θ = 23◦ ≈ 20◦ austreten, erreichen einen maximalen Abstand von r0 ≈ R/ sin2 π/9 = 54455 km zum Erdmittelpunkt. Dies entspricht einer Höhe von 32 33 Global, werden wir gleich sehen, ist dies nicht der Fall. Dies ist eine globale Kopplung der beiden Funktionen ργ und θγ durch das DG-System X. KAPITEL 3. VEKTORANALYSIS 307 etwa 7, 5 Erdradien über dem Äquator. Dieser Bereich des Erdmagnetfeldes fängt die Teilchen des Sonnenwindes ab und leitet sie zu den Polen um, wo sie tiefer in die Atmosphäre eindringen und ihr das sanfte Leuchten der ’Aurora borealis’ entlocken. Einige Feldlinien von grad (f) werden in Abb. 3.24 in rot gezeigt. Die grünen Linien zeigen Schnitte von Niveauflächen von f mit der Ebene x = 0. Der blaue Kreis ist der Einheitskreis. Alle anderen Feldlinien enstehen aus jenen in der Ebene x = 0 durch Drehung um die z-Achse. z 2 1 0 -2 -1 0 1 2 y -1 -2 Abbildung 3.24: Punktdipol: Feldlinien (rot) und Äquipotentiale (grün) Wir rechnen abschließend für das skalare Dipolpotential f = cos θ/r2 auf U in Kugelkoordinaten noch nach, dass ∆f = 0 gilt. 1 1 ∂r r2 ∂r f + 2 [∂θ (sin (θ) ∂θ f )] 2 r r sin (θ) 1 2 cos θ 1 2 cos θ 2 cos θ = 2 ∂r − + 4 ∂θ − sin2 θ = − = 0. r r r sin (θ) r4 r4 ∆f = Wegen f ∈ C 2 (R3 3.4 0 : R) gilt somit ∆f = 0 auf ganz R3 0. *Kartenfreie Mechanik in Galileis Raumzeit Seit der Entdeckung von Einsteins Relativität vollzog sich die Entwicklung fundamentaler physikalischer Theorien weitgehend am Boden einer vierdimensionalen Raumzeit mit pseudoriemannscher Geometrie. Dabei wurde zunehmend klar, dass die kartenfreie Formulierung einer Theorie die Symmetrien derselben am klarsten hervortreten lässt. Bei einer solchen Formulierung der Naturgesetze werden alle mathematischen Strukturen, die den Naturgesetzen innewohnen, ja notgedrungen explizit und bewusst gemacht. KAPITEL 3. VEKTORANALYSIS 308 Aufgrund dieser Erfahrungen erscheint es nur naheliegend, auch Newtons Mechanik innerhalb einer vierdimensionalen Raumzeit kartenfrei darzustellen. Dabei zeigt sich, dass Begriffe wie Bezugssystem mathematisch greifbar werden und nicht in die umrahmenden Reden verbannt werden müssen. Geschwindigkeit und Beschleunigung werden explizit von der Wahl eines Bezugssystems abhängig, da die Weltlinie eines Teilchens als absolutes Objekt frei von der Wahl eines Bezugs- oder gar Koordinatensytsems formuliert wird. Newtons Bewegungsgesetze abgeschlossener Systeme werden so gebildet, dass ihre Galileiinvarianz offensichtlich ist. 3.4.1 Affine Räume Galileis flache Raumzeit, auf der Newtons Mechanik ähnlich der relativistischen Mechanik formuliert werden soll, kann als ein spezieller affiner Raum konzipiert werden. Daher wird zunächst beschrieben, was ein affiner Raum ist. Ein solcher besitzt wie ein Vektorraum einen natürlichen Fernparallelismus zwischen je zwei seiner Tangentialräume. Dadurch wird die Beschreibung von Differential, Vektorfeldern und kovarianter Ableitung wesentlich einfacher als für allgemeine differenzierbare Mannigfaltigkeiten. Das entscheidende Bestimmungsstück eines affinen Raumes ist die Operation einer Gruppe auf einer Menge. Definition 150 Sei G eine Gruppe und M eine Menge. Die Verknüpfung zweier Gruppenelemente g1 , g2 ∈ G wird als g2 · g1 notiert. Das neutrale Element von G wird durch 0 bezeichnet. Eine Abbildung µ : G × M → M heißt Linksoperation der Gruppe G auf M, falls µ (g2 , µ (g1 , x)) = µ (g2 · g1 , x) für alle g1 , g2 ∈ G und für alle x ∈ M. Existiert für je zwei Elemente x, y ∈ M ein g ∈ G, sodass µ (g, x) = y, dann heißt µ transitiv. Falls µ (g, x) = x für ein x ∈ M impliziert, dass g = 0, dann heißt µ frei. Ein affiner Raum ist eine Menge M, deren Punkte aus einem beliebigen Punkt von M durch ’Schieben’ mit den Elementen eines Vektorraums hervorgehen. Genauer ist damit das Folgende gemeint. Definition 151 Sei V ein reeller Vektorraum endlicher Dimension. Bezüglich der Addition + seiner Elemente ist V eine Gruppe, (V, +) . Eine Menge M mit einer freien und transitiven Operation µ von (V, +) auf M heißt affiner Raum. Nach Wahl eines Punktes p in einem affinen Raum M über dem Vektorraum V lässt sich somit jeder weitere Punkt q ∈ M mit einem Element v ∈ V als q = µ (v, p) ≡ p + v darstellen. Dieser durch p und q eindeutig (!) bestimmte Vektor v wird als q − p notiert, obwohl M kein Vektorraum ist. Die Dimension von V ist auch die Dimension von M als Mannigfaltigkeit. Ein Beispiel eines affinen Raumes der Dimension 2 ist mit komponentenweiser Addition M = (x, y, z) ∈ R3 : x + y + z = 1 , V = (x, y, z) ∈ R3 : x + y + z = 0 . Sei I ⊂ R ein offenes Intervall und p ∈ M ein beliebiger Punkt. Zu einer Kurve γ : I → M existiert dann genau eine Kurve γ : I → V mit γ (t) = p + γ (t) für alle KAPITEL 3. VEKTORANALYSIS 309 t ∈ I. Ist γ stetig bzw differenzierbar, dann heißt auch γ stetig bzw differenzierbar. Im Fall der Differenzierbarkeit von γ wird der Vektor dγ (t) /dt als γ̇ (t) bezeichnet. Dieser Vektor γ̇ (t) hängt nicht von der Wahl von p ab. Es gilt dann γ (t + ε) = γ (t) + εγ̇ (t) + ψ (ε) mit ψ (ε) /ε → 0 für ε → 0. Sei f : M ⊃ U → R mit U offen in M und sei γ : I → U differenzierbar mit γ (t0 ) = p für ein t0 im offenen Intervall I ⊂ R. Existiert die Ableitung f (p + γ (t0 + ε)) − f (p) d (f ◦ γ) (t0 ) = lim ε→0 dt ε f p + γ̇ (t0 ) ε − f (p) = lim ≡ [γ̇ (t0 )]p f, ε→0 ε wird sie als Richtungsableitung von f unter γ̇ (t0 ) bezeichnet. Eine Funktion f wie oben heißt differenzierbar in p, falls eine lineare Abbildung dp f : V → R existiert, sodass die Funktion ψ mit f (p + ξ) = f (ξ) + dp f (ξ) + ψ (ξ) , die auf einer hinreichend kleinen Umgebung von 0 definiert ist, die Bedingung limξ→0 ψ (ξ) / |ξ| = 0 erfüllt. Dabei ist |·| irgendeine Norm von V. Die Abbildung dp f hängt, falls existent, nicht von der Wahl von |·| ab. Sie wird als das Differential von f im Punkt p bezeichnet. Eine Abbildung X : M ⊃ U → V heißt Tangentenvektorfeld auf U. Genau genommen ist ein Tangentenvektor also ein Dupel (p, v) ∈ M × V. Vielfach wird auch v alleine als Tangentenvektor aufgefasst. Diese Vereinfachung macht hier Sinn, da die Gruppenoperation von V auf M einen kanonischen Isomorphismus zwischen den Tangentialräumen in zwei Punkten von M erzeugt. 3.4.2 Flache Galilei Raumzeit M In einer flachen Galilei Raumzeit existiert eine Äquivalenzrelation, welche die Raumzeit in ’instantane Räume’ gleichzeitiger Ereignisse blättert. Zusätzlich wird für je zwei instantane Räume deren zeitlicher Abstand erklärt. Diese Struktur versucht das zu formalisieren, was Newton ’absolute Zeit’ nannte. Zudem trägt jeder instantane Raum eine euklidische Metrik. Daher das Attribut ’flach’, da ungekrümmt. Auf eine Faserung der Raumzeit in Weltlinien gleicher Orte, wie sie in Newtons absolutem Raum zum Ausdruck kommt, wird verzichtet. Eine solche Struktur hat sich als unnötiger Ballast entpuppt, denn ’absolute Orte’ können in einem Newtonschen Universum aufgrund dessen Galileiinvarianz nicht identifiziert werden. Die von Maxwells Elektrodynamik vorübergehend angebotene Möglichkeit eines Ätherruhsystems von absoluten Orten hat sich ja bekanntlich auch nicht verwirklichen lassen. Definition 152 Im Vektorraum V eines affinen Raumes (M, V, µ) sei eine lineare Abbildung Z : V → R gewählt. (Zeitform) Im Untervektorraum V0 = ker Z von V sei ein Skalarprodukt ·, · gewählt. Dann wird der Datensatz M = (M, V, µ, Z, ·, · ) KAPITEL 3. VEKTORANALYSIS 310 als flache Galileische Raumzeit bezeichnet. Sind p, q ∈ M, dann heißt Z (q − p) die Zeit, die von p bis q verstreicht, oder auch Zeitdauer von p bis q. Ein Vektor v ∈ V mit Z (v) = 1 heißt zeitnormiert. Für Z (q − p) = 0 werden p und q als gleichzeitig q − p, q − p heißt Abstand zwischen den gleichzeitibezeichnet, und |q − p| = gen Punkten p und q. Ein Vektor v ∈ V0 heißt raumartig. Sind drei Punkte q, r, s gleichzeitig, dann heißt für r = q = s die Zahl θ ∈ [0, π] mit |r − q| |s − q| cos θ = r − q, s − q der Winkel zwischen den Strecken von q nach r und von q nach s. Die übliche koordinatenweise Formulierung der Mechanik wird durch die Wahl einer Karte von M ermöglicht. Dabei wird meist eine an die Strukturen V, Z und ·, · angepasste globale Karte gewählt. Eine solche Karte ’identifiziert’ M mit R × Rn . Wie sind diese Karten gebildet? Definition 153 Eine Basis e = (e0 , e1 , . . . en ) von V mit Z (e0 ) = 1, Z (ei ) = 0 für i = 1, . . . n und ei , ej = δ ij heißt Galileibasis (G-basis) von V. Ist ein Punkt p ∈ M gewählt, dann heißt die Abbildung Φe,p : M → Rn+1 mit n x=p+ i=0 Φie,p (x) · ei die zu (p, e) gehörige galileische Karte von M. Es gilt also Φie,p (p) = 0 für i = 0, 1, . . . n. Lemma 154 Ist Φe,p eine galileische Karte von M, dann gilt Z (y − x) = Φ0e,p (y) − Φ0e,p (x) für alle x, y ∈ M und n 2 |y − x| Φie,p (y) − Φie,p (x) = i=1 2 für alle gleichzeitigen x, y ∈ M. Beweis. Zu je zwei Punkten x, y ∈ M existieren Vektoren vx, vy ∈ V, sodass x = p + vx und y = p + vy gilt. Daraus folgt y = x + (vy − vx ) und daher n Z (y − x) = Z (vy − vx) = Z = Φ0e,p Für Z (y − x) = 0 folgt $ n |y − x|2 = i=0 n = i,j=1 n = i,j=1 (y) − Φ0e,p n i=0 Φie,p (y) ei − Φie,p (x) ei i=0 (x) . n Φie,p (y) − Φie,p (x) ei , Φie,p (y) − Φie,p (x) Φie,p (y) − Φie,p (x) j=0 Φje,p (y) − Φje,p (x) ej % Φje,p (y) − Φje,p (x) δ ij 2 . Die Größen Zeitdauer, Abstand und Winkel berechnen sich also in allen galileischen Karten gleich. KAPITEL 3. VEKTORANALYSIS 3.4.3 311 Bewegung und Bezugssysteme in M Einen Schwarm von Teilchen fassen wir als eine Teilmenge X eines instantanen Raumes p + V0 ⊂ M einer flachen Galileischen Raumzeit M auf. Die Bewegung eines Schwarmteilchens, dh eines Punktes x ∈ X, ist dann eine stetige injektive Abbildung γ x : J → M eines reellen Intervalls J nach M, sodass x in der Bildmenge von γ x enthalten ist, und diese Bildmenge jeden instantanen Unterraum von M in höchstens einem Punkt schneidet. Die Bewegung des ganzen Schwarms X wird durch eine Schar von stetig differenzierbaren Kurven γ x : J → M erfasst. Dabei ist J ⊂ R ein offenes Intervall. Für alle Kurven γ x existiert oEdA ein gemeinsames t0 ∈ J, sodass γ x (t0 ) = x für alle x ∈ X. Weiter gilt Z γ x (t) − γ y (t) = 0 für alle x, y ∈ X und für alle t ∈ J. Überdies gelte Z (γ̇ x (t)) = 0 für alle t ∈ J. Eine differenzierbare Kurve γ : J → M mit Z (γ̇ (t)) = 0 für alle t ∈ J heißt zeitartig. Durch eine Umparametrisierung der Kurven γ x lässt sich offenbar immer die Zeitnormierung Z (γ̇ x (t)) = 1 für alle t ∈ J erreichen. Die Parametrisierung einer zeitartigen Kurve γ x ist willkürlich und ohne physikalischen Gehalt. Die Bildmenge von γ x , die sogenannte Weltline zu γ x , enthält bereits die gesamte Information wieviel Zeit zwischen dem Punkt x ∈ p + V0 und einem Punkt y = γ x (t) liegt. Sie hat den Wert Z (y − x) . Der Parameterwert t spielt dabei keine Rolle. Inertialsysteme idealisieren die Bewegung eines raumerfüllenden Schwarmes von ausdehnungslosen Referenzteilchen, die sich gegenseitig nicht beeinflussen und die auch von keinen weiteren eventuell vorhandenen Körpern beeinflusst werden und die sich alle in dieselbe Richtung bewegen. Die Bewegung eines derart (kräfte)freien (inertialen) Schwarmteilchens folgt einer Kurve des Typs γ x : R → M mit konstanter Ableitung γ̇ x = I ∈ V und Z (I) = 1. Dabei ist x ein beliebiges Element eines instantanen Raumes p + V0 ⊂ M. Überdies gilt γ̇ x = γ̇ y für alle x, y ∈ p + V0 . Etwas allgemeiner ist die Definition eines Bezugssystems als zeitnormiertes Tangentenvektorfeld, dessen Integralkurven die Bewegung eines idealisierten Schwarms von eventuell nichtinertialen Referenzteilchen beschreiben. Auch diese Integralkurven dienen der (lokalen) Koordinatisierung des Raumes, welche eine Einordnung dessen erlaubt, was wann wo ist. Definition 155 Ein unendlich oft differenzierbares Tangentenvektorfeld B : M → V auf einer flachen Galileischen Raumzeit M = (M, V, µ, Z, ·, · ) mit Z ◦ B = 1 heißt Bezugssytem von M. Ist B konstant, dann heißt B Inertialsystem von M. Zu zwei Inertialsystemen B1 und B2 existiert ein u ∈ V0 , sodass B2 = B1 + u. Der raumartige Vektor u heißt Geschwindigkeit von B2 relativ zu B1 . Ein rotierendes Bezugssystem mit inertial bewegtem Drehpunkt ist für dim M = 4 gegeben durch das folgende Vektorfeld. Seien eine Zahl ω ∈ R, ein Punkt p ∈ M und Vektoren e0 , n ∈ V mit Z (e0 ) = 1, Z (n) = 0 und |n| = 1 fest gewählt. Dann gilt für alle t ∈ R und für alle v ∈ V0 B (p + te0 + v) = e0 + ωn × v. Die maximale Integralkurve γ p+x : R → M von B mit γ p+x (0) = p+x für ein x ∈ V0 erfüllt γ p+x (t) = p + te0 + eωtLn x. KAPITEL 3. VEKTORANALYSIS 312 Sie windet sich mit der Winkelgeschwindigkeit ω·n ∈ V0 um die Integralkurve γ p . Die Kurve γ p ist auch Integralkurve des Inertialsystems mit B = e0 . Natürlich benötigt das Vektorprodukt n × v die Wahl einer Orientierung von V0 . 3.4.4 Geschwindigkeit und Beschleunigung Mechanische Geschwindigkeit und Beschleunigung einer Weltlinie γ (J) sind durch die Kurve γ : J → M alleine nicht festgelegt. Vielmehr gehen neben den ersten beiden Ableitungen von γ auch die Wahl eines Bezugssystems in die Größen Geschwindigkeit und Beschleunigung ein. Und zwar so, dass letzere reparametrisierungsinvariant sind, also nur von der Weltlinie abhängen. Sei B ein Bezugssytem und γ : J → M eine differenzierbare Kurve. Dann lässt sich jeder Vektor v ∈ V eindeutig bezüglich der direkten Summe V = R · B (p) ⊕ V0 zerlegen. Die zu dieser Zerlegung gehörige Projektion ΠB(p) in den Raum V0 erfüllt ΠB(p) : V → V0 , v → v − Z (v) · B (p) . Definition 156 Sei γ : J → M differenzierbar und zeitartig. B sei ein Bezugssytem. Dann heißt der Vektor vγB (t) ∈ V0 mit γ̇ (t) = λ B (γ (t)) + vγB (t) für ein λ ∈ R 0 die Geschwindigkeit von γ an der Stelle t relativ zu B. Aus der Definitionsgleichung von vγB (t) folgt durch Anwendung von Z Z (γ̇ (t)) = λZ B (γ (t)) + vγB (t) = λZ (B (γ (t))) + 0 = λ. Somit gilt vγB (t) = ΠB(γ(t)) (γ̇ (t)) . Z (γ̇ (t)) Die Geschwindigkeit einer Kurve an der Stelle t ist reparametrisierungsinvariant. Definition 157 Sei γ : J → M zwei mal differenzierbar und B ein Bezugssystem. Dann heißt der raumartige Vektor bB γ (t) = v̇γB (t) d B 1 vγ (t) ≡ Z (γ̇ (t)) dt Z (γ̇ (t)) die Beschleunigung von γ an der Stelle t ∈ J relativ zum Bezugssystem B. Relativ zu einem Inertialsystem I spezialisieren sich Geschwindigkeit und Beschleunigung zu vγI (t) = ΠI (γ̇ (t)) Z (γ̇ (t)) ΠI (γ̈ (t)) − Z (γ̈ (t)) ΠI (γ̇ (t)) und bIγ (t) = . Z (γ̇ (t)) Z (γ̇ (t))3 Beispiel: Sei p ∈ M und I ein Inertialsystem von M. Dann hat die Kurve γ : R → M mit γ (t) = p + tI wegen γ̇ (t) = I die Geschwindigkeit vγI (t) = 0 relativ zu I. Die KAPITEL 3. VEKTORANALYSIS 313 Geschwindigkeit von γ relativ zum Inertialsystem I ′ = I +u, das sich relativ zu I mit ′ der Geschwindigkeit u bewegt, hat wegen γ̇ (t) = I = I ′ − u den Wert vγI (t) = −u. Die Beschleunigung von γ relativ zu I ′ erfüllt wegen Z (γ̇ (t)) = Z (I ′ ) = 1 und wegen γ̈ = 0 ′ bIγ (t) = Z (γ̇ (t)) ΠI ′ (γ̈ (t)) − Z (γ̈ (t)) ΠI ′ (γ̇ (t)) = 0. Z (γ̇ (t))3 Lemma 158 Besteht zwischen zwei Inertialsystemen der Zusammenhang I ′ = I +u mit u ∈ V0 und ist γ : J → M eine C 2 -Kurve, dann folgt ′ ′ vγI (t) = vγI (t) − u und bIγ (t) = bIγ (t) für alle t ∈ J. Insbesondere ist also die Beschleunigung relativ zu einem Inertialsystem I eine Größe, die nicht von der speziellen Wahl von I abhängt, sie ist ’absolut’. Daher kann der Index I im Fall der Beschleunigung relativ zu einem Inertialsystem gefahrlos weggelassen werden. ′ ′ Beweis. Die Definitionsgleichung für vγI (t) ∈ V0 ist γ̇ (t) = Z (γ̇ (t)) I ′ + vγI (t) . Daher gilt ′ ′ γ̇ (t) = Z (γ̇ (t)) I ′ + vγI (t) = Z (γ̇ (t)) I + u + vγI (t) = Z (γ̇ (t)) I + vγI (t) . ′ Somit folgt vγI (t) + u = vγI (t) . Für die Beschleunigungen folgt daraus ′ bIγ d I′ v dt γ (t) (t) = = Z (γ̇ (t)) d dt d I vγI (t) − u v (t) dt γ = = bIγ (t) . Z (γ̇ (t)) Z (γ̇ (t)) Sei γ : J → M zeitartig und zwei mal differenzierbar und I = e0 ∈ V ein Inertialsystem. Durch eine Umparametrisierung von γ lässt sich immer Z (γ̇) = 1 herbeiführen. OEdA kann daher ein Punkt p ∈ M und ein t0 ∈ J gewählt werden, sodass eine (von I abhängige!) zwei mal d’bare Kurve xI : J → V0 existiert, für die γ (t) = p + (t − t0 ) e0 + xI (t) für alle t ∈ J gilt. Geschwindigkeit vγI und Beschleunigung bIγ von γ bezüglich des Inertialsystems I erfüllen dann wegen γ̇ = e0 + ẋI und γ̈ = ẍI vγI = ẋI und bIγ = ẍI . In dieser vereinfachten auf ein Inertialsystem abgestimmten Form wird die Bewegung von Massenpunkten in elementaren Physiktexten meist abgehandelt. KAPITEL 3. VEKTORANALYSIS 3.4.5 314 Galileigruppe Die Galileigruppe operiert als Untergruppe der Permutationsgruppe von M auf der flachen Galileiraumzeit und lässt dabei ihre Strukturelemente wie zeitliche Abstände zwischen Punkten, oder Winkel und Abstände zwischen gleichzeitigen Punkten unverändert. Definition 159 Sei p ein fest gewählter Punkt in einer galileischen Raumzeit M = (M, V, µ, Z, ·, · ) . Zu einer Abbildung G : M → M existiert genau eine Abbildung g : V → V mit G (p + v) = G (p) + g (v) für alle v ∈ V. Ist g linear und gelten Z ◦ g = Z und |·| ◦ g = |·| , dann heißt G Galileitransformation (G-trafo) von M. Sei G eine G-trafo bezüglich eines Punktes p ∈ M und sei p′ ein weiterer Punkt in M. Dann gilt für a = p′ − p ∈ V G (p′ + v) = G (p + a + v) = G (p) + g (a) + g (v) = G (p′ ) + g (v) für alle v ∈ V. Die Menge der G-trafos hängt also nicht von der Wahl des Referenzpunktes p ∈ M ab. Zudem hängt die zu einer G-trafo G gehörige lineare Abbildung g nicht von der Wahl von p ab. Man beachte jedoch, dass wegen G (p′ ) − p′ = G (p + a) − p − a = G (p) − p + g (a) − a der Translationsanteil G (p′ ) − p′ von G bezüglich p′ für g = ιdV von der Wahl von p′ abhängt. Die identische Abbildung ιdM ist wegen ιdM (p + v) = p + v eine G-trafo. Satz 160 Sei G eine G-trafo von M = (M, V, µ, Z, ·, · ) . Dann gilt Z (G (x) − G (y)) = Z (x − y) für alle x, y ∈ M und |G (x) − G (y)| = |x − y| für alle x, y ∈ M mit Z (x − y) = 0. Beweis. Sei x = p + a und y = p + b. Dann folgt Z (G (x) − G (y)) = Z (g (a) − g (b)) = Z ◦ g (a − b) = Z (a − b) = Z (x − y) . Für x, y ∈ M mit Z (x − y) = 0 gilt Z (a − b) = 0 und somit |G (x) − G (y)| = |g (a) − g (b)| = |g (a − b)| = |a − b| = |x − y| . Lemma 161 Sei M = (M, V, µ, Z, ·, · ) eine galileischen Raumzeit und p, p′ ∈ M. Die Abbildung g : V → V sei linear. Die Abbildung G : M → M mit G (p + v) = p′ + g (v) ist genau dann eine G-trafo, wenn das Bild einer G-basis von V unter g wieder eine G-basis ist. KAPITEL 3. VEKTORANALYSIS 315 Beweis. Sei zunächst e = (e0 , e1 , . . . en ) eine G-basis von V und G eine G-trafo. Dann folgt wegen G (p) = p′ G (p + e0 ) = p′ + g (e0 ) mit Z (g (e0 )) = Z (e0 ) = 1 und G (p + ei ) = p′ + g (ei ) mit Z (g (ei )) = Z (ei ) = 0 für i = 1, . . . n. Überdies gilt (Polarisierungstrick) für i, j = 1, . . . n. g (ei ) , g (ej ) = ei , ej = δ ij . Damit ist ge = (g (e0 ) , . . . g (en )) eine G-Basis von V. Seien nun e und ge = (g (e0 ) , . . . g (en )) G-Basen von V. Dann folgt für v = n i i=0 v ei ∈ V Z (g (v)) = v0 Z (g (e0 )) = v 0 = Z (v) . Es gilt also Z◦g = Z. Weiter folgt für v = V0 und n i=1 v i ei ∈ V0 , dass g (v) = n 2 |g (v)| = v i g (ei ) ∈ n i j v v g (ei ) , g (ej ) = i,j=1 n i=1 i,j=1 v i v j δ ij = |v|2 . Es gilt also auch |·| ◦ g = |·| . Daher ist G eine G-trafo. Die lineare Abbildung g einer G-trafo G ist invertierbar, da sie eine Basis von V auf eine Basis von V abbildet. Satz 162 Sei M = (M, V, µ, Z, ·, · ) eine Galileiraumzeit und seien p ∈ M und a, a′ ∈ V. Die Abbildungen G, G′ : M → M mit G (p + v) = p + a + g (v) und G′ (p + v) = p + a′ + g ′ (v) für alle v ∈ V seien G-trafos von M. Dann folgt für alle v ∈ V (G′ ◦ G) (p + v) = p + a′ + g ′ (a) + (g ′ ◦ g) (v) . Beweis. Es gilt für alle v ∈ V (G′ ◦ G) (p + v) = G′ (p + a + g (v)) = G′ (p) + g ′ (a) + g ′ (g (v)) = p + a′ + g ′ (a) + g ′ (g (v)) Wählt man in diesem Satz g ′ = g −1 und a′ = −g −1 (a) , dann folgt G′ ◦ G = ιdM . Vertauscht man die Abbildungen G und G′ im Satz und wählt wiederum g ′ = g −1 und a′ = −g −1 (a) , dann folgt G ◦ G′ = ιdM und somit G′ = G−1 . Die Menge aller Galileitransformationen bildet somit eine Gruppe, wenn als Gruppenprodukt G′ · G die Hintereinanderausführung G′ ◦ G der beiden Abbildungen G und G′ gewählt wird. KAPITEL 3. VEKTORANALYSIS 316 Definition 163 Die Untergruppe der Permutationsgruppe S (M ) einer flachen Galileiraumzeit M, die von der Menge aller Galileitransformationen von M gebildet wird, heißt inhomogene Galileigruppe ΓM über M. Nach Wahl eines Punktes p ∈ M lassen sich homogene G-trafos bezüglich p definieren. Gilt für ein G ∈ ΓM, dass G (p) = p, dann wird G als homogene G-trafo bezüglich p bezeichnet. Die Menge aller homogenen G-trafos bezüglich p ist eine Untergruppe von ΓM. Sie wird als Stabilisatorgruppe Γp M von p bezeichnet. Ist G homogen bezüglich p, dann gilt G (p + v) = p + g (v) für alle v ∈ V. Bezüglich eines Punktes p′ = p + a ∈ M gilt G (p′ + v) = G (p + a + v) = p + g (a) + g (v) . Für g (a) = a folgt dann G (p′ ) = p + g (a) = p′ . Eine bezüglich p homogene G-trafo braucht also bezüglich eines anderen Punktes p′ nicht homogen zu sein. Eine weitere Untergruppe von ΓM ist die Menge der Translationen. Ein G ∈ ΓM mit G (p + v) = G (p) + v für alle v ∈ M heißt Translation. Es gilt für alle x ∈ M G (x) = G (p + (x − p)) = G (p) + (x − p) = x + (G (p) − p) . G verschiebt also jeden Punkt in M um den Vektor a = (G (p) − p) ∈ V. Man notiert dann G = Ta . Die Untergruppe der Translationen hängt also nicht von der Wahl von p ab. Jedes G ∈ ΓM besitzt somit eine eindeutige Zerlegung G = Ta ◦ Gp0 mit a = G (p) − p ∈ V und Gp0 ∈ Γp M. Man beachte jedoch, dass a von p abhängt, denn es gilt für p′ = p + b mit b ∈ V G (p′ + v) = (p′ + g (v)) + G (p′ ) − p′ und G (p′ ) − p′ = G (p + b) − p′ = G (p) + g (b) − p + p − p′ = (G (p) − p) + g (b) − b. Somit gilt G = Ta+g(b)−b ◦ G0p+b mit G0p+b ∈ Γp+b M. Sehen wir uns noch die Stabilisatorgruppe Γp M eines Punktes p genauer an. Es gilt für G ∈ Γp M, dass G (p + v) = p + g (v) für alle v ∈ V, wobei die lineare Abbildung g : V → V die Invarianzbedingungen Z ◦ g = Z und |·| ◦ g = |·| erfüllt. Sei e0 ∈ V mit Z (e0 ) = 1. Jeder Vektor v ∈ V besitzt dann eine eindeutige Zerlegung der Art v = Z (v) e0 + v0 mit v0 ∈ V0 . Eine lineare Abbildung g erfüllt die Invarianzbedingungen genau dann, wenn erstens g (v0 ) ∈ V0 für alle v0 ∈ V0 , zweitens g|V0 ∈ O (V0 ) und drittens g (e0 ) = e0 + u für ein u ∈ V0 gilt. Wird nach Wahl eines zeitnormierten Vektors e0 ∈ V die lineare Abbildung g : V → V mit g (e0 ) = e0 + u und g|V0 = R zu den Daten (u, R) ∈ V0 × O (V0 ) als e0 0 und die zugehörige G-trafo in Γp M als Gp,e gu,R u,R notiert, dann gilt 0 Γp M = Gp,e u,R : (u, R) ∈ V0 × O (V0 ) . Satz 164 Sind (u, R) und (u′ , R′ ) in V0 × O (V0 ) , dann gilt e0 = gue0′ +R′ (u),R′ ·R . gue0′ ,R′ ◦ gu,R KAPITEL 3. VEKTORANALYSIS 317 Beweis. Es genügt die Bilder des zeitnormierten Vektors e0 und von Vektoren v ∈ V0 unter gu′ ,R′ ◦ gu,R zu berechnen. Es gilt unter Weglassen des Superskripts e0 gu′ ,R′ ◦ gu,R : e0 → gu′ ,R′ (e0 + u) = e0 + u′ + R′ u und gu′ ,R′ ◦ gu,R : v → gu′ ,R′ (Rv) = R′ R (v) . e0 Die Menge der linearen Abbildungen gu,R : (u, R) ∈ V0 × O (V0 ) ist somit eine Untergruppe der Gl (V ) . Sie ist das semidirekte Produkt der Gruppe (V0 , +) mit O (V0 ) und wird als V0 ⋉ O (V0 ) notiert. Übrigens gilt als Korollar zum Satz: e0 −1 e0 = g−R gu,R t u,Rt . e0 Die Matrix von g ≡ gu,R ∈ V0 ⋉ O (V0 ) zu einer G-basis e = (e0 , e1 , . . . en ) erfüllt 1 0 ... 0 u1 R1 . . . R1 1 n i M (g, e) = .. .. . . .. = gj . . . . . un Rn1 . . . Rnn Entwicklung nach der ersten Zeile zeigt, dass det g = det R. Und für R ∈ O (V0 ) gilt bekanntlich |det R| = 1. Welcher Zusammenhang besteht zwischen zwei Galileikarten? Definitionsgemäß gilt für alle x ∈ M n p+ i=0 n Φie,p (x) · ei = p′ + i=0 Φie′ ,p′ (x) · e′i . Es existiert ein G ∈ ΓM mit G (p + v) = G (p) + g (v) und g (ei ) = e′i . Damit folgt für alle x ∈ M n n i=0 Φie′ ,p′ (x) · g (ei ) = p − p′ + i=0 Φie,p (x) · ei . ′ Mit der Zerlegung von p − p ∈ V nach der Basis e folgt n n n j Φie′ ,p′ (x) gij ej = j=0 i=0 j=0 (p − p′ ) + Φje,p (x) ej . Koeffizientenvergleich ergibt daher n Φie′ ,p′ g −1 = j=0 i j j (p − p′ ) + Φje,p . Vorgreifende Anmerkung: Sei für p ∈ M und eine G-basis e die alternierende n + 1-Form τ = dΦ0e,p ∧ dΦ1e,p ∧ . . . ∧ dΦne,p . Sie hängt wegen |det g| = 1 für g ∈ V0 ⋉ O (V0 ) nur von der Orientierung von e ab, nicht aber von p oder den weiteren Details von e. Nach Wahl einer Orientierung von KAPITEL 3. VEKTORANALYSIS 318 V und bei Zugrundelegung einer positiv orientierten G-basis e ist die so definierte Form τ eindeutig und unabhängig von p und e. Sie dient als Volumsform der Galileiraumzeit zur Integration über offene Raumzeitgebiete. Sie ermöglicht es auch, die Divergenz von Vektorfeldern auf M ohne zusätzliche Strukturen zu definieren. Die Kontinuitätsgleichung etwa greift darauf zu. 3.4.6 G-trafo von Geschwindigkeit und Beschleunigung Sei J ⊂ R ein offenes Intervall. Die C 2 -Kurve γ : J → M sei zeitartig. Für G ∈ ΓM ist G◦γ die mit G galileitransformierte Kurve γ. Wie verändern sich Geschwindigkeit und Beschleunigung von G ◦ γ an der Stelle t bezüglich eines Inertialsystems I mit G? Die Antwort gibt der folgende ’Kovarianzsatz’. Satz 165 Sei M = (M, V, µ, Z, ·, · ) eine flache Galileiraumzeit und I = e0 sei ein Inertialsystem von M. Sei γ : J → M eine zeitartige C 2 -Kurve. Für die Galileitrafo G ∈ ΓM gelte G (p + v) = G (p) + g (v) für alle v ∈ V. Dann folgt für Geschwindigkeit und Beschleunigung der G-transformierten Kurve G ◦ γ mit u = g (e0 ) − e0 I vG◦γ (t) = g vγI (t) + u und bIG◦γ (t) = g bIγ (t) für alle t ∈ J. Beweis. Die Geschwindigkeit von (G ◦ γ) in (G ◦ γ) (t) relativ zu I ist festgelegt durch d I (G ◦ γ) (t) = λ e0 + vG◦γ (t) mit λ = 0. dt Da γ zeitartig ist, kann oEdA Z (γ̇ (t)) = 1 für alle t ∈ J vorausgesetzt werden. Nach Wahl eines Punktes p ∈ M hat G die (eindeutige) Zerlegung G = Ta ◦ Gp0 0 mit Gp0 ∈ Γp M für ein a ∈ V. Weiter hat Gp0 eine Darstellung als Gp0 = Gp,e u,R mit einem eindeutig bestimmten Paar (u, R) ∈ V0 × O (V0 ) . Nun gilt mit der durch γ (t) = p + γ (t) eindeutig bestimmten Abbildung γ : J → V Ableiten nach t ergibt d e0 (G ◦ γ) (t) = gu,R dt e0 (G ◦ γ) (t) = p + a + gu,R (γ (t)) . d γ (t) dt e0 = gu,R e0 + vγI (t) = e0 + u + R vγI (t) . I (t) = R vγI (t) + u. Somit gilt vG◦γ Für die Beschleunigung von G ◦ γ bezüglich I ergibt sich daraus wegen d2 (G ◦ γ) (t) = R v̇γI (t) und Z (γ̇ (t)) = 1 dt2 Z (γ̇ (t)) ΠI (γ̈ (t)) − Z (γ̈ (t)) ΠI (γ̇ (t)) bIG◦γ (t) = = R v̇γI (t) = R bIγ (t) . Z (γ̇ (t))3 Beide Resultate sind zusammengefasst in den für das Inertialsystem I = e0 und für alle G ∈ ΓM gültigen Gleichungen I vG◦γ (t) = g vγI (t) + u und bIG◦γ (t) = g bIγ (t) . Dabei gilt G (p + v) = G (p) + g (v) für alle v ∈ V mit g (e0 ) = e0 + u für ein u ∈ V0 und g (v) = R (v) für alle v ∈ V0 . KAPITEL 3. VEKTORANALYSIS 3.4.7 319 Newtons Grundgesetze der Mechanik 1. Newton I: Ein ’freies’ Teilchen, dh eines, das vom Rest der Welt unbeeinflusst ist, durchläuft das Bild einer zeitartigen Kurve γ : J → M, für die bIγ (t) = 0 für alle t ∈ J. Dabei ist J ⊂ R ein (evt uneigentliches) offenes Intervall und I irgendein Inertialsystem. 2. Newton II: Ein System aus N Teilchen, das vom Rest der Welt unbeeinflusst ist, wird von N (N − 1) stetigen Funktionen Fi←j : V0 ⊃ Ui←j → V0 mit i = j und i, j ∈ {1, . . . N} , und N reelle Zahlen mi > 0 charakterisiert. Dabei ist mit Ui←j offen in V0 . Für die Funktionen Fi←j : V0 → V0 gilt dabei die Äquivarianzbedingung Fi←j ◦ g|V0 = g ◦ Fi←j für alle g ∈ Gal (V0 ) . Jede mögliche Bewegung eines solchen Systems durchläuft das Bild einer Kurve Γ = (γ 1 , . . . γ N ) : J → M N mit Z ◦ γ i − γ j = 0 für alle i, j ∈ {1, . . . N} . Dabei ist J ⊂ R ein (evt uneigentliches) offenes Intervall. Zudem erfüllt die Kurve Γ das System von gewöhnlichen Differentialgleichungen zweiter Ordnung N mi bIγ i (t) = j=1,j=i Fi←j γ i (t) − γ j (t) für alle t ∈ J. Die Funktion Fi←j heißt Kraftfunktion des Teilchens j auf das Teilchen i. Die Zahl mi ∈ R>0 heißt Masse des Teilchens i und I ist irgendein Inertialsystem. Beachte: bIγ i hängt nicht von I ab. 3. Newton III: Für ein System aus N Teilchen, das vom Rest der Welt unbeeinflusst ist, erfüllen die Kraftfunktionen Fi←j die ’Aktio ist gleich Reaktio Bedingung’ Fi←j (x) = −Fj←i (−x) . Insbesondere gilt −Ui←j = Uj←i . Man beachte, dass dieses Regelwerk (fast offensichtlich) galileiinvariant im folgenden Sinn ist. Satz 166 Ist Γ = (γ 1 , . . . γ N ) : J → M N mit Z ◦ γ i − γ j = 0 für alle i, j ∈ {1, . . . N} eine mögliche Bewegung eines Systems mit Kraftfunktionen {Fi←j : i = j} , dann ist die Kurve G ◦ Γ ebenso eine mögliche Bewegung desselben Systems. Beweis. Es gilt G ◦ Γ = (G ◦ γ 1 , . . . G ◦ γ N ) und somit nach Newton II und dem Kovarianzsatz mit G (p + v) = G (p) + g (v) für ein p ∈ M und für alle v ∈ V N mi bIG◦γ i (t) − j=1,j=i Fi←j G ◦ γ i (t) − G ◦ γ j (t) N = g mi bIγ i (t) − j=1,j=i Fi←j g γ i (t) − γ j (t) N = g mi bIγ i (t) − j=1,j=i Fi←j γ i (t) − γ j (t) =0 KAPITEL 3. VEKTORANALYSIS 320 Anmerkungen • Newtons Grundgesetze haben keinesfalls den Status mathematischer Axiome oder auch Sätze oder Definitionen. Vielmehr formulieren sie faktische Aussagen über die Natur unter Zuhilfenahme eines sehr hoch entwickelten mathematischen Begriffsgebäudes. Wie wir heute wissen, sind diese Aussagen streng genommen falsch. Dennoch treffen sie einen wichtigen und großen Teil der Wirklichkeit sehr genau. • Wie stellt man fest, ob ein (System von) Teilchen frei ist? Es reagiert nicht auf Änderungen im Rest der Welt. Dazu sind wiederholte Beobachtungen ähnlicher Vorgänge nötig. • Reale Objekte eines klassisch mechanisch beschriebenen Problemkreises sind immer ausgedehnt und zusammengesetzt. Wann ist eine Beschreibung als ’Punkt’ angebracht? Wenn die Ausdehnung im Verhältnis zu den sonst vorkommenden Abständen winzig ist. • Die angeführten Grundgesetze sind noch nicht hinreichend allgemein, denn die auf ein Teilchen wirkende Gesamtkraft setzt sich nach dem Prinzip der ungestörten Kräfteüberlagerung ausschließlich additiv aus Paarkräften zusammen. Das Regelwerk schließt zudem geschwindigkeitsabhängige Kräfte aus. Verallgemeinerungen existieren. • Wird einem N -Teilchensystem ein weiteres Teilchen hinzugefügt, werden die Funktionen Fi←j für i, j ∈ {1, . . . N } unverändert übernommen. Lediglich die neuen Funktionen FN+1←j für j ∈ {1, . . . N} sind einzuführen. Die Funktionen Fj←N+1 für j ∈ {1, . . . N} ergeben sich aus Newton III. • Das Beispiel eines gravitativen Zweikörperproblems ergibt sich für N = 2 und dim (V ) = 4 mit F1←2 (x) = −Km1 m2 x/ |x|3 = −F2←1 (−x) für alle x ∈ V0 0. Hier bezeichnet K Newtons Gravitationskonstante. 3.4.8 Die Erhaltungssätze Durch Wahl eines Inertialsystems I = e0 und bei zeitnormierter Parametrisierung der Kurven γ i gemäß γ i (t) = p + (t − t0 ) e0 + xIi (t) mit xIi : J → V0 vereinfacht sich die Bewegungsgleichung in Newton II zu N mi ẍIi (t) = j=1,j=i Fi←j xIi (t) − xIj (t) für alle t ∈ J. Damit folgt aus II und III: Die Kurve X : J → M (Schwerpunkt; hängt nicht von I ab!) mit m = und N 1 mi xIi ((t)) X (t) = p + (t − t0 ) e0 + m i=1 N i=1 mi KAPITEL 3. VEKTORANALYSIS 321 ist unbeschleunigt, dh es gilt bIX = 0. (Schwerpunktsatz) Die Abbildung P I : J → V0 (Gesamtimpuls bezüglich I) mit N P I (t) = mi ẋIi ((t)) i=1 ist konstant. (Impulserhaltungssatz) Die Abbildung LI : J → V0 (Gesamtdrehimpuls bezüglich I) mit N LI (t) = i=1 mi xIi (t) × ẋIi ((t)) ist konstant. (Drehimpulserhaltungssatz) Zu jeder Kraftfunktion Fi←j existiert ein Potential Φi←j : V0 ⊃ Ui←j → R mit Fi←j (x) = −gradx (Φi←j ) . Die Abbildung E I : J → R (Gesamtenergie bezüglich I) mit N N mi ,, I ,,2 1 I ẋi (t) + Φi←j xIi (t) − xIj (t) E (t) = 2 2 i,j=1,i=j i=1 ist konstant. (Energieerhaltungssatz) 3.5 Übungsbeispiele 1. (Richtungsableitung ohne Differential) V sei ein reeller, 3-dimensionaler, orientierter Vektorraum. ·, · bezeichne ein Skalarprodukt von V und |·| die zugehörige Norm. Für p1 , p2 ∈ V sei34 0 → R, Φ:V x → |x|−3 p1 , p2 − 3 |x|−2 p1 , x p2 , x . Das radiale Einheitsvektorfeld E und das Drehvektorfeld L um R · p1 = 0 sind die folgenden beiden Abbildungen. E:V 0 → V, x → |x|−1 x und L : V → V, x → |p1 |−1 p1 × x. Zeigen Sie für die Richtungsableitungen von Φ unter E und unter L, also z.B. für E [Φ] : V 0 → R, dass für alle x ∈ V x → lim [Φ(x + εE(x)) − Φ(x)] /ε =: Ex [Φ] , ε↓0 0 gilt: Ex [Φ] = −3 |x|−1 Φ(x) und Lx [Φ] = 3 |x|−5 |p1 |−1 p1 , x p1 × p2 , x . d Hinweis: Zeigen und benützen Sie Ex [Φ] = |x|−1 dλ Φ (λx) |λ=1 . Der Umweg über dΦ oder grad Φ ist mühsamer. Ähnliches gilt für Lx [Φ]. 34 Φ ist im SI-System 4πε0 mal der Wechselwirkungsenergie zweier elektrischer Dipolmomente p1 , p2 mit dem Verbindungsvektor x. KAPITEL 3. VEKTORANALYSIS 322 2. (Gradient) Sei V = R2×1 und e = (e1 , e2 ) sei die Standardbasis. Zwei weitere Basen f und g sind durch f1 = e1 + e2 , f2 = e2 , g1 = e1 + e2 , g2 = e2 − e1 t gegeben. Sei Φe = φ1e , φ2e = (x, y)t die kontravariante Karte zur Basis e, d.h. es gilt idV = e · Φe . Sei h : R → R differenzierbar. Dann ist ψ : V → R mit ψ = h (y − x) ein differenzierbares Skalarfeld. Sei ·, · jenes Skalarprodukt, für das e eine ONB ist. (a) Zeigen Sie für die zu den Basen f und g gehörigen kontravarianten Karten Φf = 1 0 −1 1 · Φe und Φg = 2 1 1 1 Gf = 1 2 und Gg = 2 1 1 −1 1 1 0 0 1 · Φe , . Skizzieren Sie einige Koordinatenlinien der drei Karten. Bestimmen Sie die Niveaulinien von ψ. (b) Zeigen Sie für die partiellen Ableitungen von ψ ∂1e ψ = −h′ (y − x) = −∂2e ψ, f f ∂1 ψ = 0, ∂2 ψ = h′ (y − x) , g g ∂1 ψ = 0, ∂2 ψ = 2h′ (y − x) . f Beachten Sie: Obwohl φ1e = φ1f gilt, gilt ∂1 ψ = ∂1e ψ. (c) Berechnen Sie das Gradientenvektorfeld von ψ mit der Entwicklungsformel nach einer beliebigen Basis mit den drei Basen e, f und g. Kontrollieren Sie, dass die drei Rechnungen übereinstimmend auf grad (ψ) = h′ (y − x) (e2 − e1 ) führen. (d) Berechnen Sie das Gradientenvektorfeld von ψ bezüglich jenes Skalarproduktes, zu dem f eine ONB ist. Lösung: grad (ψ) = h′ (y − x) e2 . Wie kann grad (ψ) senkrecht auf die Niveaulinien von ψ stehen, wenn dies auch grad (ψ) tut? 3. (Kurvenintegral) Sei V = R2 und X : V → V, (x, y) → (x2 y, xy 2 ) (Figur 3.25). Berechnen Sie das Kurvenintegral von X längs γ : [0, 1] → V, t → (1 − t, t2 ) . KAPITEL 3. VEKTORANALYSIS 323 y 5 3.75 2.5 1.25 0 -5 -3.75 -2.5 -1.25 -1.25 0 1.25 2.5 3.75 5 x -2.5 -3.75 -5 Abbildung 3.25: Das Vektorfeld (x2 y, xy 2 ) 4. Sei (x, y) die Standardkarte von V = R2×1 . Für L : V → V gelte L = (−y, x) (Drehvektorfeld). Es soll nun mit verschiedenen Methoden gezeigt werden, dass das Vektorfeld L kein Potential hat, d.h., dass keine Funktion f : V → R existiert, sodass L = grad (f ). (a) Direkte Methode: Zeigen Sie, dass die beiden Differentialgleichungen (bezüglich der Standardbasis) −y = ∂1 f und x = ∂2 f keine Lösung f haben. (b) Indirekt: Zeigen Sie, dass L nicht rotationsfrei ist. (c) Sei γ 1 : [−R, R] → V mit γ 1 (t) = (t, 0) . Zeigen Sie γ L = 0. Sei 1 γ 2 : [0, π] → V mit γ 2 (t) = (R cos t, R sin t) . Zeigen Sie γ L = R2 π. 2 Warum folgt daraus, dass L kein Potential hat? (d) Sei γ eine Kurve in V, deren Bildmenge der Rand eines achsenparallelen Quadrats mit der Seitenlänge 2ε und mit dem Mittelpunkt (a, b) ∈ V ist. Die Kurve durchlaufe den Rand im Gegenuhrzeigersinn einmal. Zeigen Sie, dass γ L = 8ε2 = Doppelte Fläche des Quadrats. Das Integral ist also unabhängig von (a, b) . Hinweis: Die untere Seite des Quadrats kann folgendermaßen durchlaufen werden γ 1 : [−ε, ε] → V mit γ 1 (t) = (a + t, b − ε) . Wählen Sie für die drei weiteren Seiten analoge Kurven. 1 (e) Sei nun X = x2 +y 0. Sei γ wie oben eine Kurve, die den 2 L auf V Rand eines (beliebigen) Quadrats im Gegenuhrzeigersinn einmal durchläuft. Zeigen Sie X= γ 2π falls (0, 0) innerhalb des Quadrats liegt . 0 falls (0, 0) außerhalb des Quadrats liegt Falls γ durch (0, 0) führt, ist γ X nicht definiert. Hinweis: Auf der geschlitzten Ebene gilt X = grad (φ) . KAPITEL 3. VEKTORANALYSIS 324 5. (Gradient, Divergenz) V sei ein n-dimensionaler reeller Vektorraum. ·, · bezeichne ein Skalarprodukt von V und r := |·| die zugehörige Norm. Berechnen Sie grad(f ) und div (grad (f )) der folgenden Funktionen vom Typ f : U → R mit U ⊂ V offen.35 (a) Sei ki ∈ V für i = 1, ..., m und f(p) := (b) f := − 1r auf U = V m i=1 ki , p 2 für alle p ∈ V . 0. Skizzieren Sie grad(f ) für n = 2. (c) Sei e ∈ V mit |e| = 1 und f(p) := (d) f = Φ mit Φ von Beispiel 1. 1 r(p) e, p für alle p ∈ U = V 0. 36 6. (Richtungsableitung über Gradient, Kurvenintegral) Sei U die geschlitzte Ebene. U = (x, y) ∈ R2 | y = 0 ⇒ x < 0 Für φ : U → (0, 2π) gelte idU = r · (cos φ, sin φ) auf U, wobei r(x, y) := x2 + y 2 . Für grad (φ) (bezüglich des Standardskalarproduktes) folgt für alle p ∈ U (siehe Beispiel 3.1.14) gradp (φ) = X(p) mit X : R2 0 → R2 , (x, y) → 1 (−y, x). Figur 3.26 zeigt das Drehvektorfeld (−y, x). Achtung: Der Defix2 +y2 nitionsbereich von X ist größer als jener von grad(φ). ' & (a) Berechnen Sie die Abbildung X [f ] : p → gradp (f) , X(p) = Xp [f ] für alle p ∈ R2 0 zu f : R2 → R mit f(x, y) = xy. Richtungsableitung von f bei p mit X(p). (b) Zeigen Sie div(X) = 0 auf R2 0. (c) Berechnen Sie das Linienintegral von X längs eines Kreises um 0 mit Radius R > 0. Gibt es eine differenzierbare Funktion F , sodass grad (F ) = X auf R2 0? Abbildung 3.26: Drehvektorfeld 35 Arbeiten Sie dabei entweder ohne Benützung einer Basis, also koordinatenfrei, oder mithilfe der Koordinaten des Vektorraumes zu einer ONB e. Benützen Sie die Kettenregel. 36 f(p) ist also der Kosinus des Winkels zwischen e und p. Fig. 1 zeigt das Vektorfeld −xy, x2 . KAPITEL 3. VEKTORANALYSIS 325 7. (Divergenz, Rotation des Linienvortexfeldes) Für n ∈ V = R3 gelte |n| = 1. Auf U = V (R · n) ist das Vektorfeld B(p) = C n×p |n × p|2 mit C ∈ R definiert.37 Es hat die Symmetrien: B(p + λn) = B(p) und B(R (p)) = R (B(p)) mit λ ∈ R und R Drehung um n. Beachte: |n × p| ist der Abstand zwischen p und der Achse R · n. (a) Zeigen Sie div(B) = 0 und rot(B) = 0 auf U. (b) Berechnen Sie mit dem Ansatz A(p) = f (|n × p|) · n (auf U ) ein Vektorpotential zu B. Finden Sie also eine Lösung A von B = rot(A). Gibt es mehrere Lösungen? 38 (c) Ist B konservativ? 8. (Rotation eines allgemeinen Vortexfeldes) Sei V ein 3-dim Vektorraum. Eine Orientierung und ein Skalarprodukt ·, · seien gewählt. Sei n ∈ V mit |n| = 1. Sei f : R>0 → R differenzierbar. Für X : V → V gelte für alle p ∈ V R · n X (p) = f (|n × p|) Zeigen Sie rotp (X) = n×p . |n × p|2 f ′ (|n × p|) n. |n × p| 9. Bestimmen Sie für dim (V ) = 2 die elektrische Potentialfunktion Φp eines Punktdipols, der in 0 ∈ V sitzt, und das Dipolmoment p ∈ V hat. Überprüfen Sie, dass ∆Φp = 0.39 Hinweis: Φp (v) ergibt sich für das Dipolmoment p = |p|·e ∈ V für alle v ∈ V durch den Grenzübergang , , |p| ε ,, ε ,, , , 2πε0 · Φp (v) := lim ln ,v − e, − ln ,v + e, . εց0 ε 2 2 0 Rechnen Sie nach, dass 2πε0 · Φp (v) = − [p]v ln |·| = − p, v / |v|2 . 10. (Rotation in allgemeiner Basis) Sei e = (e1 , . . . en ) eine Basis des Vektorraums V mit dem Skalarprodukt ·, · . Das Vektorfeld X : V ⊃ U → V sei auf U differenzierbar. γ ij : I → U sei eine stückweise C 1 -Kurve. Sie durchlaufe den Rand des Parallelogramms Γij = p + λei + µej : λ, µ ∈ − 2ε , 2ε zuerst in Richtung ei , dann in Richtung ej usw. 37 I. 38 I B ist für C = µ0 2π das Magnetfeld eines auf R · e in Richtung e fließenden Stromes der Stärke Eine Lösung ergibt sich mit f(x) = −C ln (x). Φp idealisiert das Potential zweier langer, entgegengesetzt geladener, zureinander paralleler, dünner Drähte im Nahbereich der Drähte. Der Abstand der Drähte ist viel kleiner als ihre Länge. 39 KAPITEL 3. VEKTORANALYSIS 326 (a) Zeigen Sie, dass mit den kovarianten Komponentenfunktionen Xi = ei , X von X und den partiellen Ableitungen ∂i = ∂ie für p ∈ U folgt: 1 ε→0 ε2 lim γ ij X = [∂i Xj − ∂j Xi ] (p) . (b) Für die n2 Zahlen Iij := [∂i Xj − ∂j Xi ] (p) gilt Iij = −Iji und daher Iii = 0. Wie viele Paare (i, j) ∈ {1, . . . n}2 mit i < j gibt es? Für welches n sind es genau n Stück? (c) Sei nun n = 3 und e positiv orientiert. Mit einem noch unbekannten Skalarfeld C auf U sei das Vektorfeld rotX durch rotX = C [(∂2 X3 − ∂3 X2 ) · e1 + (∂3 X1 − ∂1 X3 ) · e2 + (∂1 X2 − ∂2 X1 ) · e3 ] definiert. Kann C so gewählt werden, dass für das Flussintegral von rotX durch Γij 1 lim 2 rotX, dfij = Iij ε→0 ε Γij gilt? Lösung: C = 1/ det (Ge ). (d) Überprüfen Sie, dass rotX mit C = 1/ det (Ge ) nicht von der Wahl der (positiv orientierten) Basis e abhängt. 11. (Polarkoordinaten) Sei Ψ = (x, y) die Standardkarte von R2 und sei U := R2 {(a, 0) ∈ R2 : a ≥ 0} (geschlitzte Ebene). Sei Φ = (ρ, φ) die Karte der Polarkoordinaten auf U. (a) Skizzieren sie einige Niveaulinien ρ = const bzw. φ = const. (b) Drücken Sie die Kartenbasis in p ∈ U mit Φ (p) = (ρ0 , φ0 ) durch die Standardbasis aus. (c) Zeigen Sie, dass die Funktionalmatrix ∂jΦ Ψi überall maximalen Rang hat. (d) Berechnen Sie die Gram’sche Matrix40 GΦ in p ∈ U mit Φ (p) = (ρ0 , φ0 ) . 12. (Parabolische Koordinaten) Sei Ψ = (x, y) die Standardkarte von R2 und sei U := R2 {(a, 0) ∈ R2 : a ≥ 0} (geschlitzte Ebene). Für die „parabolische” Karte Φ = (u, v) gilt auf U x= 1 2 u − v2 , 2 y = uv mit v > 0. (a) Skizzieren sie einige Niveaulinien u = const bzw. v = const. (b) Drücken Sie die Kartenbasis in p ∈ U mit Φ (p) = (u0 , v0 ) durch die Standardbasis aus. 40 Zum Standardskalarprodukt von R2 . KAPITEL 3. VEKTORANALYSIS 327 (c) Zeigen Sie, dass die Funktionalmatrix ∂jΦ Ψi überall maximalen Rang hat. (d) Berechnen Sie die Gram’sche Matrix GΦ in p ∈ U mit Φ (p) = (u0 , v0 ) . 13. (grad, div, ∆ in krummlinigen Koordinaten) Seien (x, y) die Standardkoordinaten von R2 . Sei U := R2 {(a, 0) ∈ R2 : a ≥ 0} . (a) Sei f = x2 − y 2 auf R2 . Berechnen Sie grad (f ) und ∆f (bezüglich des Standardskalarproduktes) auf U unter Benützung von Polarkoordinaten. Kontrollieren Sie ihre Ergebnisse durch eine zweite Berechnung von grad (f) und ∆f unter Benützung von Standardkoordinaten. (Siehe Figur 3.27) (b) Sei f = x/ (x2 + y 2 ) auf R2 0. Berechnen Sie grad (f ) und ∆f (bezüglich des Standardskalarproduktes) auf U unter Benützung von Polarkoordinaten. Kontrollieren Sie ihre Ergebnisse durch eine zweite Berechnung von grad (f ) und ∆f unter Benützung von Standardkoordinaten. (c) Sei f = x2 + y 2 . Berechnen Sie grad (f ) und ∆f (bezüglich des Standardskalarproduktes) auf U unter Benützung von parabolischen Koordinaten. Kontrollieren Sie ihre Ergebnisse durch eine zweite Berechnung von grad (f ) und ∆f unter Benützung von Standardkoordinaten. Abbildung 3.27: Die Funktion x2 − y 2 14. (grad, div, ∆ in Kugelkoordinaten) Für das Skalarfeld f : R3 in der Standardkarte (x, y, z) von R3 mit r = x2 + y 2 + z 2 f= 0 → R gelte 2xy . r5 (f ist ein Beispiel für ein Quadrupolpotential.) Auf dem Definitionsbereich U der Kugelkoordinaten Φ = (r, θ, φ) gilt daher f= 1 sin2 (θ) sin (2φ) . 3 r KAPITEL 3. VEKTORANALYSIS y z 0.375 0.75 0.5 0.25 0.25 0.125 0 -0.75 -0.5 328 -0.25 0 0 -0.25 0.25 0.5 0 0.75 x -0.5 -0.25 -0.75 -0.375 Polardiagramm von |sin (2φ)| 0.25 0.5 0.75 1 -0.125 Polardiagramm von sin2 θ (a) Berechnen Sie auf U bezüglich des Standardskalarproduktes die Komponenten von grad (f ) zur Kartenbasis von Φ. (b) Leiten Sie aus dem Ergebnis von a) ab, dass ∆f = 0 auf U. (c) Zeigen Sie ∆f = 0 auf R3 0 unter Verwendung der Standardkarte. 15. (rot in Kugelkoordinaten) Seien (r, φ, z) Zylinderkoordinaten im R3 und sei f : R>0 → R differenzierbar. Auf dem Kartenbereich U von (r, φ, z) gelte X = fr(r) 2 δ φ . Zeigen Sie (unter Verwendung der Formel für die Rotation in ′ einem krummlinigen Koordinatensystem), dass rot (X) = f r(r) (0, 0, 1) auf U. Kapitel 4 Wahrscheinlichkeit Schon lange erfreuen sich Menschen an Glücksspielen. Der Ausgang eines solchen Spiels ist nicht vorhersehbar und erst recht nicht beeinflussbar. Denn das Spiel macht Gebrauch von Naturvorgängen, die von den Spielern nur unvollkommen gesteuert werden können. In der großen Welt, die uns umgibt, sind solche unabsehbaren Naturvorgänge eher die Regel als die Ausnahme, sodass sich die Physik mit diesem sogenannten Zufall auseinandersetzen muss. Jede Naturbeobachtung wird ja von unkontrollierten Umständen beeinflusst. Was kann also aus gestörten Beobachtungen über die Natur eines idealisierten Systems ermittelt werden? Gibt es so etwas wie ’durchschnittliche’ Eigenschaften von einer goßen Zahl von ähnlichen, im Detail aber doch verschiedenen Systemzuständen? Die Antwort auf derlei Fragen kommt in Reichweite, wenn es gelingt im Zufall Regelhaftigkeit auszumachen. Etwas verkürzt gesagt ist also darüber nachzudenken, wie aus einem Glücksspiel ein sicheres Geschäft zu machen ist. Wird ein kommerzielles Glücksspiel hinreichend oft gespielt, dann zeichnet sich eine Regelmäßigkeit ab, die eine der spielenden Parteien, in der Regel jene Partei, welche die Regeln vorschlägt, nahezu sicher zur Gewinnerin macht. Der entscheidende Sachverhalt ist uns aus dem einfachen Würfelspiel geläufig. Ein Würfel werde N mal geworfen. Dabei sei ni die Anzahl jener Würfe, die als Ergebnis die Augenzahl i ergeben. Für ’hinreichend’ große Zahl N liegt dann die Häufigkeit ni /N der Augenzahl i in der ’Nähe’ von 1/6. Je größer N, umso besser ist ’in der Regel’ die Übereinstimmug zwischen ni /N und 1/6. Es gibt also Aussagen über die Ausgänge einer großen Zahl von Glückspielen, die (fast) sicher wahr sind und auf die sich daher sorglos wetten lässt. Von solchen Einsichten leben alle Kasinos und in einem übertragenen Sinn die gesamte ’statistische Physik’. Probieren Sie es aus, indem Sie mit einer großen Zahl von Freunden gegen Zahlung von einem Euro pro Würfelversuch die Auszahlung von zwei Euro im Falle eines geworfenen Sechsers vereinbaren. Endet ein Würfelversuch mit einer anderen Augenzahl als Sechs, gehört der Einsatz Ihnen. Nach 1000 Würfelversuchen werden Sie um etwa 500 Euro reicher sein. Dass Sie um 2000 Euro ärmer sind, ist zwar möglich, aber äußerst unwahrscheinlich. Natürlich geben empirische Häufigkeiten keine mathematische Definition von 329 KAPITEL 4. WAHRSCHEINLICHKEIT 330 Wahrscheinlichkeit ab. Vielmehr geben sie ein Ziel dafür vor, was erklärt werden soll: Man versuche, Regelmäßigkeiten in einer großen Anzahl von ähnlich gelagerten Vorgängen zu erkennen und zu verstehen. Auch dann, wenn die einzelnen Vorgänge völlig regellos erscheinen mögen. Das Galtonbrett1 lässt eine solche Regelhaftigkeit im Zufall besonders klar hervortreten. Eine Kugel ist entlang einer vertikalen Fallstrecke immer wieder an einem Hindernis (Nagel) gezwungen, vom geraden Weg nach links oder rechts um einen Einheitsschritt abzuweichen. Nach sagen wir 10 Hindernissen ist die Kugel um n Schritte horizontal versetzt, wobei −10 ≤ n ≤ 10 gilt. Der genaue Weg oder auch nur der Endversatz einer einzelnen Kugel ist nicht vorhersehbar. Lässt man aber eine große Zahl von Kugeln das Brett durchfallen, dann ergibt sich ein zumindest in seinen groben Zügen reproduzierbares Muster in der Verteilung der Ankunftsorte der einzelnen Kugeln. Gewisse Zufallsgrößen werden mit wachsendem N zunehmend deterministisch. So schwankt etwa der Prozentsatz der Kugeln mit Gesamtversatz n bei einer Wiederholung eines Experiments mit N Kugeln umso weniger, je größer N ist. Oder es geht die Wahrscheinlichkeit des Ereignisses, dass alle Kugeln denselben Endversatz haben, mit wachsendem N gegen 0. Der Weg einer Kugel durch ein Galtonbrett liefert ein vielfach zutreffendes Bild vom Zustandekommen eines Einzelmesswertes, in den eine ganze Reihe von zufälligen, unvermeidlichen Störungen Eingang findet. Die Verteilung der gestörten Einzelmesswerte (bei oftmaliger Wiederholung der Messung) ist in ihren groben Zügen determiniert. Sie hat ihr Maximum nahezu sicher über dem unverfälschten Wert. Nur Ereignisse mit Wahrscheinlichkeiten nahe bei 0 oder 1 geben die Möglichkeit zum Vergleich einer wahrscheinlichkeitsbehafteten Theorie mit Beobachtungen. Solche Ereignisse gilt es zu finden, wenn ein Wahrscheinlichkeitsmodell empirischen Gehalt bekommen soll. 4.1 Endliche Wahrscheinlichkeitsräume Etwa 300 Jahre mathematischen Räsonierens haben einen präzisen Wahrscheinlichkeitsbegriff hervorgebracht, der von empirischen Häufigkeiten und dem Versuch befreit ist, den Zufall selbst zu definieren. Er stammt von Andrei N. Kolmogorow2 und fasst Wahrscheinlichkeit als etwas auf, das den Teilmengen einer Grundmenge Ω in ähnlicher Weise zukommt, wie Volumia oder Massen den Teilen eines (physischen) Körpers zuzuweisen sind. Allerdings ist der moderne mathematische Wahrscheinlichkeitsbegriff erstaunlich weit vom realitätsnahen Häufigkeitsbegriff entfernt. Er ist als rein mathematischer Begriff zunächst ohne jeden Bezug zur materiellen Wirklichkeit gefasst. Wie Wahrscheinlichkeit ’gemessen’ werden kann, ist nicht mehr Teil der Definition. Dementsprechend werden Häufigkeiten erst in einem höher entwickelten Stadium der Theorie eingeführt und erst dann wird klar werden, wie empirische Wahrscheinlichkeiten zu1 Siehe: http://en.wikipedia.org/wiki/Bean_machine Eine Simulation wird von http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html gezeigt. 2 http://de.wikipedia.org/wiki/Kolmogorow KAPITEL 4. WAHRSCHEINLICHKEIT 331 mindest halbwegs sicher ermittelt werden können. Eine vollkommene Sicherheit wird sich dabei jedoch als unerreichbar erweisen. Das wiederum löst naturphilosophische Zweifel und Fragen aus, welche die Mathematik aber unberührt lassen.3 4.1.1 Wahrscheinlichkeit als Mengenfunktion Definition 167 Ein endlicher Wahrscheinlichkeitsraum ist eine endliche Menge Ω zusammen mit einer Funktion W : pot(Ω) → R, sodass (i) W (A) ≥ 0 für alle A ⊂ Ω, (ii) W (A ∪ B) = W (A) + W (B) für alle A, B ⊂ Ω mit A ∩ B = {} , (iii) W (Ω) = 1. Die Elemente von Ω repräsentieren die in einem Zufallsexperiment möglichen Ergebnisse, die als Versuchsausgänge bezeichnet werden. Teilmengen A ⊂ Ω heißen Ereignisse und für ω ∈ Ω wird die einelementige Teilmenge {ω} als Elementarereignis bezeichnet. Ein Ereignis A tritt in einem Zufallsexperiment genau dann ein, wenn der Versuchsausgang Element von A ist. Die Potenzmenge pot(Ω) von Ω ist die Menge aller Teilmengen von Ω. Die Funktion W , die jeder Teilmenge von Ω eine Zahl zuordnet, wird als ein Wahrscheinlichkeitsmaß (W-maß) auf Ω bezeichnet. Die Zahl W (A) heißt Wahrscheinlichkeit des Ereignisses A. Zur Beschreibung verschiedener Zufallsexperimente werden im allgemeinen verschiedene Grundmengen Ω und Wmaße W benötigt. Die Zahlen W (A) sind gemäß (i) nicht negativ. Aus (ii) folgt W ({}) = 0. Im Beispiel eines Münzwurfs besteht Ω nur aus zwei Elementen nämlich K (Kopf) und Z (Zahl). Die Menge der Teilmengen pot(Ω) besteht aus {} , {K} , {Z} , {K, Z} = Ω. Gilt etwa bei einer (etwas ungerechten) Münze W ({K}) = 0, 95, dann folgt aus (ii), dass W ({Z}) = 0, 05. Gleichung W ({}) = 0 sagt, dass die Wahrscheinlichkeit dafür, dass nach einem Münzwurf weder Kopf noch Zahl obenauf liegt, 0 ist. Beispiel 168 (Würfel) Sei Ω := {1, 2, 3, 4, 5, 6} mit pi := W ({i}) := 1/6 für alle i ∈ Ω. Nach Regel (ii) folgt W ({1, 4}) = W ({1}) + W ({4}) = 16 + 16 = 13 . So kann die Wahrscheinlichkeit eines jeden Ereignisses aus den Wahrscheinlichkeiten der Elementarereignisse durch Addition berechnet werden. Im Beispiel ist das Ereignis {1, 4} das mathematische Bild des Ereignisses: beim einmaligen Wurf eines Würfels wird eine der beiden Augenzahlen 1 oder 4 geworfen. Definition 169 Ein endlicher W-raum (Ω, W )mit W ({ω}) = 1/ |Ω| für alle ω ∈ Ω heißt Gleichverteilung. Hier bezeichnet |Ω| die Zahl der Elemente von Ω. Ist (Ω, W ) Gleichverteilung, dann gilt für jedes A ⊂ Ω, dass W (A) = |A| / |Ω| . Gleichverteilungen werden wegen ihrer Einfachheit oft als Beispiele diskutiert, sind 3 Solche Fragen werden z.B. Kapitel VIII und diversen Anhängen in Karl Popper, Logik der Forschung, J CB Mohr, Tübingen, 1973, untersucht. KAPITEL 4. WAHRSCHEINLICHKEIT 332 jedoch „winzige Inseln im Meer der Wahrscheinlichkeitsräume”. Ein gezinkter Würfel ist etwa durch die sechs im allgemeinen voneinander verschiedenen Elementarwahrscheinlichkeiten 0 ≤ W ({i}) =: pi mit der Nebenbedingung 6i=1 pi = 1 charakterisiert. Der Extremfall eines gezinkten Würfels ist mit pi = 1 für i = k 0 sonst für ein fest gegebenes k ∈ Ω realisiert. Dieser Würfel wirft mit Sicherheit die Augenzahl k. Definition 170 Ein W-maß Wk , für das gilt Wk (A) = 1 für k ∈ A und Wk (A) = 0 für k ∈ / A, heißt Punktmaß, lokalisiert in k. Das Beispiel des Würfels macht klar, dass jedes Wahrscheinlichkeitsmaß W einer endlichen Menge Ω durch die endlich vielen Werte pω := W ({ω}) für ω ∈ Ω eindeutig bestimmt ist. Es gilt ja nach (ii) W ({ω 1 , . . . ω k }) = W ({ω 1 }) + . . . + W ({ω k }) Die Funktion p : Ω → [0, 1] , ω → pω hat einen eigenen Namen. Sie heißt Wahrscheinlichkeitsfunktion. Falls also p auf Ω konstant ist und daher überall den Wert 1/ |Ω| annimmt, ist W eine Gleichverteilung. 4.1.2 Konstruktion von Wahrscheinlichkeitsräumen Wie kann aus einem oder mehreren Wahrscheinlichkeitsräumen ein neuer gebildet werden? Dieser Abschnitt stellt einige wichtige Konstruktionsverfahren für dermaßen „abgeleitete“ Wahrscheinlichkeitsräume vor. Bedingte Wahrscheinlichkeit Zwei unterscheidbare Münzen werden geworfen. Das Ergebnis des Wurfes der ersten Münze wird mit ε ∈ {1, −1} , jenes der zweiten mit η ∈ {1, −1} bezeichnet. Die Grundmenge aller möglichen Versuchsausgänge ist somit die vierelementige Menge Ω = {(ε, η) |ε, η ∈ {1, −1} } . Jedes Wahrscheinlichkeitsmaß W auf Ω ist durch seine Wahrscheinlichkeitsfunktion p festgelegt. Wir notieren p (1, 1) = λ, p (1, −1) = µ und p (−1, 1) = ν mit λ, µ, ν ∈ R≥0 und λ+µ+ν ≤ 1, sodass p (−1, −1) = 1−λ−µ−ν ≥ 0 folgt. Die Gleichverteilung liegt genau dann vor, wenn λ = µ = ν = 1/4. Hat das Ergebnis ε des Wurfes der ersten Münze Einfluss auf das Ergebnis η des zweiten Wurfes? Zunächst ein Wort über eine praktische und übliche Kurzschreibweise. Das Ereignis {(ε, η) ∈ Ω : ε = 1} wird kurz als das Ereignis ε = 1 bezeichnet. Für die Wahrscheinlichkeit von ε = 1 gilt unter Verwendung dieser Kurznotation W (ε = 1) = W ({(1, 1) , (1, −1)}) = λ + µ. Falls nun W (ε = 1 und η = 1) = W (ε = 1) · W (η = 1) gilt, dann hat das Ereignis η = 1 bei Vorliegen des Ereignisses ε = 1 bezogen auf die Wahrscheinlichkeit von ε = 1 dieselbe Wahrscheinlichkeit wie im gesamten Raum Ω. Die Zusatzbedingung ε = 1 hat keinen Einfluss auf die Wahrscheinlichkeit für das Eintreten von η = 1. Wegen W (η = 1) = λ + ν ist dies also genau dann der KAPITEL 4. WAHRSCHEINLICHKEIT 333 Fall, wenn λ = (λ + µ) (λ + ν) gilt. Ist zB W eine Gleichverteilung, dann gilt also W ({(1, 1)}) = W (ε = 1) · W (η = 1) . Für W ({ε = 1 = η}) = W (ε = 1) · W (η = 1) aber, besteht ein stochastischer Zusammenhang zwischen den Ereignissen ε = 1 und η = 1. Ein extremer Fall eines solchen Zusammenhangs liegt für λ = 1/2 und µ = ν = 0 vor. Es gilt dann W (ε = 1) = 1/2 = W (η = 1) und W (ε = η) = 1. Die beiden Münzen fallen mit Sicherheit auf dieselbe Seite.4 Definition 171 Zwei Ereignisse A, B ⊂ Ω eines W-raumes (Ω, W ) heißen stochastisch unabhängig, falls W (A ∩ B) = W (A)W (B). Ein quantitatives Maß für den Einfluß eines Ereignisses B auf die Wahrscheinlichkeit des gemeinsamen Vorliegens von A und B gibt die folgende Definition. Definition 172 Sei (Ω, W ) ein W-raum und B ⊂ Ω ein fest gewähltes Ereignis die Wahrscheinlichkeit von A relativ mit W (B) > 0. Dann heißt WB (A) := WW(A∩B) (B) zu B. Oft wird statt WB (A) die Schreibweise W (A | B) benutzt und als bedingte Wahrscheinlichkeit bezeichnet. Satz 173 Die Mengenfunktion WB auf pot(Ω) ist ein W-maß auf Ω. Beweis. (i) ist klar. Für A1 , A2 ⊂ Ω mit A1 ∩ A2 = {} gilt W ((A1 ∪ A2 ) ∩ B) W ((A1 ∩ B) ∪ (A2 ∩ B)) = W (B) W (B) W (A1 ∩ B) + W (A2 ∩ B) = = WB (A1 ) + WB (A2 ). W (B) WB (A1 ∪ A2 ) = Die Normiertheit WB (Ω) = 1 ist klar. Mischen und Produktbildung Satz 174 Sind Wi für i = 1, . . . n W-maße auf Ω, und sind λi für i = 1, . . . n positive reelle Zahlen mit i λi = 1, dann ist auch W := ni=1 λi Wi ein W-maß auf Ω. (W wird als Mischung der Maße Wi bezeichnet.) Beweis. (Induktion) Zunächst für n = 2: Die Bedingung (i) aus Kolmogorows Definition ist erfüllt. (ii) folgt so: W (A ∪ B) = λ1 W1 (A ∪ B) + λ2 W2 (A ∪ B). Da W1 und W2 beides W-maße sind, gilt für disjunkte Mengen A und B, dass Wi (A ∪ B) = Wi (A) + Wi (B). Somit folgt W (A ∪ B) = λ1 W1 (A) + λ2 W2 (A) + λ1 W1 (B) + λ2 W2 (B) = W (A) + W (B). 4 Liest man das Ereignis ε = 1 als „Die Person X hat mehr als 1000 Zigaretten geraucht“ und η = 1 als „Die Person X erkrankt an Lungenkrebs“, dann wird die praktische Bedeutung von bedingten Wahrscheinlichkeiten drastisch sichtbar, denn für W ({(1, 1)}) > W (ε = 1) · W (η = 1) erhöht Rauchen das Erkrankungsrisiko. KAPITEL 4. WAHRSCHEINLICHKEIT 334 Die Normiertheit W (Ω) = 1 folgt aus W (Ω) = λ1 W1 (Ω) + λ2 W2 (Ω) = λ1 + λ2 = 1. Der Fall n > 2 kann nun mittels Induktion nach n gezeigt werden. Wir nehmen dazu an, dass für n − 1 die Behauptung gilt. Nun gilt n n−1 λi Wi = i=1 i=1 n−1 λi Wi + λn Wn = (1 − λn ) i=1 λi Wi + λn Wn . 1 − λn n−1 λi λi ′ Wegen n−1 i=1 1−λn = 1 ist gemäß Induktionsvoraussetzung W := i=1 1−λn Wi ein ′ W-maß. Die Mischung der beiden Maße W und Wn ist dann gemäß n = 2 ein W-maß. Die Mischung zweier W-maße λW1 + (1 − λ)W2 kann man sich so vorstellen. Beim Würfeln mit einem Würfel wird der Würfel selbst zunächst zufällig aus einer Palette von zwei Würfelsorten ausgewählt. Die Würfelsorte 1 hat die Wahrscheinlichkeit λ und ein Würfel dieser Sorte wirft gemäß W1 . Die Würfelsorte 2 hat die Wahrscheinlichkeit 1 − λ und ein Würfel dieser Sorte wirft gemäß W2 . Satz 175 Sind (Ωi , Wi ) für i = 1, . . . n W-räume, dann existiert auf Ω1 × ... × Ωn genau ein W-maß W , sodass W (A1 ×. . .×An ) = W1 (A1 ) . . . Wn (An ) für alle Ai ⊂ Ωi gilt. Notation: W = W1 × . . . × Wn („Produktmaß”). Beweis. Jede Mengenfunktion W mit W (A1 × . . . × An ) = W1 (A1 ) . . . Wn (An) hat auf den Elementarereignissen wegen {(ω 1 , . . . ω n )} = {ω 1 } × . . . × {ω n } die eindeutig bestimmten Werte D D Wi ({ω i }) = pi (ω i ) . p(ω 1 , . . . ω n ) := W ({(ω 1 , . . . , ω n )}) = i i Über die Additivität wird W dann auf alle anderen Teilmengen von Ω eindeutig fortgesetzt. Für W (A1 × . . . × An ) folgt somit D W (A1 × . . . × An ) = ... p(ω 1 , . . . ω n ) = ... pi (ω i ) ω 1 ∈A1 = D i ωn ∈An pi (ω i ) ωi ∈Ai = D ω1 ∈A1 ωn ∈An i Wi (Ai ). i Die Positivität von W ist klar. Die Normierungsbedingung gilt wegen D W (Ω) = W (Ω1 × . . . × Ωn ) = Wi (Ωi ) = 1. i Das zweimalige Werfen eines Würfels gibt ein Beispiel für das Produktmaß. Sei Ω1 = Ω2 = {1, 2, . . . 6} mit der Gleichverteilung W1 = W2 auf Ωi . Dann ist 1 p(i, j) := p1 (i)p2 (j) = 36 für alle i, j. Das Produkt W1 × W2 ist also wieder eine Gleichverteilung. Analog hat das n-malige Werfen eines Würfels den Wahrscheinlichkeitsraum {1, 2, . . . 6}n mit der Gleichverteilung. Sie gibt jeder Folge (ω 1 , . . . ω n ) von KAPITEL 4. WAHRSCHEINLICHKEIT 335 Augenzahlen dieselbe Wahrscheinlichkeit p (ω 1 , . . . ω n ) = 6−n. Bei 10 mal Würfeln 10 Sechser zu werfen hat also eine Wahrscheinlichkeit von 6−10 = e−10 ln 6 ≈ 1, 65 · 10−8 . Wer so eine Wurffolge erlebt, wird wohl den Würfel beginnen zu untersuchen. Ein physikalisch interessanteres Beispiel liefert das Isotopengemisch von normalem Wasser, halbschwerem Wasser und schwerem Wasser, also von H2 O, HDO und D2 O, im natürlichen Wasser. Dort kommen diese Moleküle in einem Zahlenverhältnis von 1 : 3, 1 · 10−4 : 2, 4 · 10−8 vor. Können wir das mit einem einfachen Modell verstehen? Bei der Bildung von Wasser bindet ein Sauerstoffatom aus dem es umgebenden Isotopengemisch an Wasserstoff zwei Wasserstoffatome. Es „zieht“ also ein Element des Raumes {H, D} × {H, D} . Mit der Wahrscheinlichkeit x wird ein H und mit der Wahrscheinlichkeit 1 − x = x′ wird ein D gezogen. Angenommen die Ziehung zweier Atome geschieht unabhängig, also mit dem Produktmaß, dann verbrennt das O-Atom mit den Wahrscheinlichkeiten W ({(H, H)}) = x2 , W ({(H, D) , (D, H)}) = 2xx′ und W ({(D, D)}) = x′2 zu jeweils H2 O, HDO und D2 O. Die Wahrscheinlichkeiten stehen also gemäß dieser Vorstellung im Verhältnis 1 : 2x′ /x : (x′ /x)2 . Aus 3, 1 · 10−4 = 2x′ /x folgt x′ /x = 1, 55 · 10−4 und damit (x′ /x)2 = 2, 4 · 10−8 . Das Modell erklärt also den Anteil an D2 O aus jenem von HDO. Der Wert von x′ ergibt sich zu x′ ≈ 1/6500. Eines von 6500 Wasserstoffatomen ist ein schweres. Transport von W-Maßen Satz 176 Ist (Ω, W ) ein W-raum und f : Ω → Ω′ mit Ω′ endlich. Dann ist Ω′ zusammen mit Wf : pot (Ω′ ) → R und Wf (A′ ) := W (f −1 (A′ )) ein W-raum. Er heißt Transport von W unter f, oder Verteilung von f unter W. Hier bezeichnet f −1 (A′ ) = {ω ∈ Ω |f (ω) ∈ A′ } das Urbild von A′ unter f. Zur Abbildung f braucht keine inverse Abbildung zu existierenen. Für die Wahrscheinlichkeitsfunktion pf : Ω′ → [0, 1] von Wf gilt also pf (ω ′ ) = W ({ω ∈ Ω |f (ω) = ω ′ }) . Beweis. Die Positivität ist klar. Zur Additivität: A, B ⊂ Ω′ disjunkt impliziert dass auch f −1 (A) ∩ f −1 (B) = {}. Daher und wegen f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B) gilt Wf (A ∪ B) = W (f −1 (A ∪ B)) = W (f −1 (A) ∪ f −1 (B)) = Wf (A) + Wf (B) . Normiertheit: Wf (Ω′ ) = W (f −1 (Ω′ )) = W (Ω) = 1. Sei Ω := {1, .., 6} × {1, .., 6} und W die Gleichverteilung (zwei Würfel, einer rot, einer grün). Ein Farbenblinder kann das Elementarereignis (i, j) für i = j nicht von (j, i) unterscheiden. Er identifiziert daher für i < j die zwei Würfe (i, j) und (j, i). Sei f : Ω → Ω′ := {(i, j) ∈ Ω | i ≤ j}, mit f(i, j) = (i, j) falls i ≤ j und f (i, j) = (j, i) sonst. Der Farbenblinde sieht also nur das mit der Abbildung f 1 transportierte W-maß Wf . Es hat die Wahrscheinlichkeitsfunktion pf (i, j) = 18 für 1 i > j und pf (i, i) = 36 . Natürlich ist Wf keine Gleichverteilung. KAPITEL 4. WAHRSCHEINLICHKEIT 4.1.3 336 Binomialverteilung Ein weiteres Beispiel zum Produkt und Transport von W-maßen ist der N maligeWurf einer unwuchtigen Münze. Hier ist Ω = {0, 1} mit W ({1}) = x ∈ [0, 1] der W-raum eines einzigen Wurfes. (Siehe auch Übungsbeispiel 14.) Der W-raum des N -maligen Wurfes ist ΩN mit dem Produktmaß W N . Es gilt W N ({(ω 1 , ..., ω N )}) = E N N → R mit (ω 1 , ..., ω N ) → N i=1 W ({ω i }). Die Abbildung ZN : Ω i=1 ω i ordnet jeder Folge von Münzwurfausgängen (ω 1 , ..., ω N ) die Zahl der in ihr vorkommenden Einsen zu.5 Der Wertebereich von ZN ist {0, ..., N }. Auf diesem ist das transportierte W-maß W N Z definiert. Es gilt N WN ZN ({k}) = W N ω ∈ ΩN | ZN (ω) = k = xk (1 − x)N−k N k . , , = xk (1 − x)N−k ,ZN−1 ({k}), N N! := (N−k)!k! die Mächtigkeit der Menge k ZN−1 ({k}), also die Zahl der Möglichkeiten an, genau k Einsen in einer Folge aus N Nullen oder Einsen unterzubringen. Hier gibt der Binomialkoeffizient Definition 177 Für x ∈ [0, 1] und N ∈ N0 heißt das W-maß W auf {0, ..., N } mit W ({k}) := Bi(k; N, x) := xk (1 − x)N−k N k Binomialverteilung. (Siehe Abb. 4.1) 0.175 0.15 0.125 0.1 0.075 0.05 0.025 0 0 25 50 75 100 k Abbildung 4.1: Bi (k; N, x) (interpoliert) für N = 100 und x = 0, 1 (grün), x = 0, 5 (rot) und x = 0, 95. 5 Auch der Weg einer Kugel durch das Galtonbrett kann als Element ω von ΩN aufgefasst werden. Der Wert ZN (ω) gibt dann den Endversatz des Weges nach N Hindernissen an. KAPITEL 4. WAHRSCHEINLICHKEIT 4.1.4 337 *Multinomialverteilung Eine naheliegende Verallgemeinerung der Binomialverteilung ergibt sich aus einem k-elementigen W-Raum (Ω, W ) durch Übergang zum W-Raum ΩN , W N . Sei Ω also eine endliche Menge mit k Elementen: Ω = {ω 1 , . . . ω k } . W sei ein beliebiges W-Maß auf Ω. Abkürzung: W ({ω i }) = pi . Es gilt pi ≥ 0 und ki=1 pi = 1. Das W-Maß W N auf ΩN = Ω × . . . × Ω ist definiert durch W N ({(ω i1 , . . . ω iN )}) = pi1 · . . . · piN . Die Funktion Zi : ΩN → N0 mit i ∈ {1, . . . k} und Zi (ω i1 , . . . ω iN ) = δ i,i1 + . . . + δ i,iN gibt für jeden Punkt (ω i1 , . . . ω iN ) ∈ ΩN an, wieviele seiner Einträge mit ω i übereinstimmen. Sei (n1 , . . . nk ) ∈ Nk0 . Dann gilt W N ({ω ∈ ΩN : Z1 (ω) = n1 , . . . Zk (ω) = nk }) = = N! pn1 n1 !...nk ! 1 0 . . . pnk k für n1 + . . . + nk = N . sonst Dieses W-Maß auf Nk0 heißt N-te Multinomialverteilung über W. Sie ist der Transport von W N unter der Abbildung (Z1 , . . . Zk ) : ΩN → Nk0 . Die Multinomialverteilung beantwortet Fragestellungen des Typs: Ein unfairer Würfel wird 1000 mal geworfen. Wie groß ist die Wahrscheinlichkeit, dass dabei 155 mal die Eins, 201 mal die Zwei, usw geworfen wird, wenn p1 die Wahrscheinlichkeit für eine Eins bei einem einzigen Wurf ist und p2 die ...? Oder auch diese: In einer Urne sind s1 Kugeln der Sorte 1, . . . sk Kugeln der Sorte k. Daher ist bei einer wahllosen Ziehung die Wahrscheinlichkeit gleich pi = si / kr=1 sr eine Kugel der Sorte i zu ziehen. Werden nun N Ziehungen einer Kugel aus der Urne vorgenommen und die Kugeln jeweils vor der nächsten Ziehung in die Urne zurückgelegt, dann hat die Wahrscheinlichkeit dabei n1 Kugeln der Sorte 1, . . . nk Kugeln der Sorte k zu ziehen welchen Wert? 4.1.5 *Hypergeometrische Verteilung In einer Urne sind N Kugeln. Sie tragen die Nummern 1, . . . N. Davon sind die Kugeln mit den Nummern 1, . . . M weiß und die restlichen N − M Kugeln sind schwarz. Nun werden aus der Urne wahllos n Kugeln entnommen. Wie groß ist die Wahrscheinlichkeit, dass von den entnommenen Kugeln k weiße und der Rest schwarze Kugeln sind? Es gilt also N, M, n ∈ N, k ∈ N0 mit M ≤ N und k ≤ n. Jede Ziehung ω kann als n-elementige Teilmenge der Menge {1, . . . N} aufgefasst werden. Der Ereignisraum Ω ist also die Menge aller n-elementigen Teilmengen von {1, . . . N} . Es gilt |Ω| = Nn . Die Zahl aller k-elementigen Teilmengen von {1, . . . M } ist M für k ≤ M und 0 sonst. Setzen wir für k > M die Zahl M = 0, dann k k gilt für alle k ∈ N0 , dass die Zahl der k-elementigen Teilmengen von {1, . . . M } gleich M ist. Die Zahl aller (n − k)-elementigen Teilmengen von {M + 1, . . . N } k KAPITEL 4. WAHRSCHEINLICHKEIT 338 . Die Zahl aller n-elementigen Teilmengen von ist dementsprechend gleich N−M n−k {1, . . . N} deren Durchschnitt mit {1, . . . M } die Mächtigkeit k hat, ist somit gleich M · N−M . Damit ergibt sich nun für die Gleichverteilung W auf Ω, dass k n−k W ({ω ∈ Ω : |ω ∩ {1, . . . M }| = k}) = M k · N−M n−k N n . Das W -maß auf der Menge {0, 1, . . . n} mit WN,M,n ({k}) = M k · N−M n−k N n mit N, M, n ∈ N mit M ≤ N, n ≤ N wird als hypergeometrische Verteilung zu den Parameterwerten N, M, n bezeichnet. Es entsteht aus der Gleichverteilung auf Ω durch Transport mit der Funktion f : Ω → {0, 1, . . . n} , ω → |ω ∩ {1, . . . M}| . Hypergeometrische Verteilungen steuern die Wahrscheinlichkeit mit einem Tip beim Lotto ’Sechs aus 45’ drei ’richtige’ zu erraten. Sie finden weiters Verwendung in der Qualitätskontrolle. Den weißen Kugeln entsprechen dabei etwa die fehlerhaften Stücke einer Produktion, den schwarzen die makellosen. 4.1.6 Erwartungswert und Varianz Reellwertige Funktionen auf einem W-raum, sogenannte (reelle) stochastische Variable, haben besondere Bedeutung. Sie geben etwa bei Glücksspielen Verlust oder Gewinn in Abhängigkeit vom Versuchsausgang an. Wichtige Größen sind Erwartungswert und Varianz einer reellen stochastischen Variable. Definition 178 Sei (Ω, W ) ein Wahrscheinlichkeitsraum und f& : Ω → R. Dann ' heißt f W := ω∈Ω f (ω)W ({ω}) Erwartungswert und VW (f ) := (f − f W )2 W ≥ 0 Varianz von f unter W . Die Zahl (∆f )W := VW (f ) heißt Streuung (oder Standardabweichung) von f. Der Index W an Erwartungswert und Varianz wird weggelassen, wenn das Wahrscheinlichkeitsmaß W aus dem Zusammenhang klar ist. Ein Freund(?) bietet Ihnen ein Würfelspiel an. Wird die gerade Augenzahl n geworfen, bezahlen Sie ihm n Euro. Wird jedoch eine ungerade Augenzahl n geworfen, erhalten Sie von ihm n Euro. Mit welchem Gewinn oder Verlust pro Spiel müssen Sie bei einer großen Anzahl N von Spielen rechnen? Die Gewinnfunktion f erfüllt: f (n) = −(−1)n n. Etwas später werden wir lernen, dass im Grenzübergang N → ∞ die Wahrscheinlichkeit gegen 1 konvergiert, einen Gewinn pro Spiel in der Höhe von G = f Euro zu erhalten. Es gilt somit G= 1 1 (1 − 2 + 3 − 4 + 5 − 6) = − 6 2 und Sie werden das Spiel besser nicht zu oft spielen. KAPITEL 4. WAHRSCHEINLICHKEIT 339 Satz 179 Sei Ω = {1, 2, ..., n} und sei W das gleichverteilte W-maß auf Ω. Die stochastische Variable f := idΩ hat den Erwartungswert f = n+1 und die Varianz 2 n2 −1 V (f) = 12 unter W . Beweis. Es gilt f = (1/n) nk=1 k = (1/n) · (n/2) · (n + 1) = (n + 1) /2. Nun zur Varianz. Es gilt V (f ) = f 2 − f 2 = (1/n) nk=1 k 2 − (n + 1)2 /4. Mit n k2 = k=1 n (n + 1) (2n + 1) 6 (4.1) folgt daraus die Behauptung, denn 2n + 1 n + 1 (n + 1) (2n + 1) (n + 1)2 − = (n + 1) − 6 4 6 4 n−1 n2 − 1 4n + 2 3n + 3 = (n + 1) − = (n + 1) = . 12 12 12 12 V (f) = Gleichung (4.1) zeigt man durch Induktion. Für n = 1 gilt sie. Gilt (4.1) für ein n ≥ 1, dann folgt daraus einerseits n+1 n k 2 k=1 k=1 = Andererseits gilt = k 2 + (n + 1)2 = = n+1 6 n (n + 1) (2n + 1) + (n + 1)2 6 n+1 n+1 2n2 + n + 6n + 6 = 2n2 + 7n + 6 . 6 6 (n + 2) (2(n + 1) + 1) n+1 n+1 2n2 + 2n + 4n + 4 + n + 2 = 2n2 + 7n + 6 6 6 und somit Gleichung (4.1) auch für n + 1 und damit für alle n ∈ N. Der folgende Satz listet eine Reihe nützlicher Eigenschaften von Varianz und Erwartungswert auf. Diese Eigenschaften ersparen manche Rechnung, sind nützlich bei der Fehlersuche oder begründen, wie im Fall der Chebyshevungleichung, die Bedeutung der Varianz. Satz 180 Sei (Ω, W ) ein Wahrscheinlichkeitsraum mit f, g : Ω → R. Dann gilt: 1. αf + βg = α f + β g für α, β ∈ R (Linearität) 2. min f (Ω) ≤ f ≤ max f (Ω) 3. f n W = n x∈f (Ω) x pf (x) = & idf (Ω) n' Wf mit n ∈ N0 und pf (x) := Wf ({x}) = W f −1 {x} = W ({ω ∈ Ω | f (ω) = x}) . (Die Wahrscheinlichkeitsfunktion von Wf , also pf : f (Ω) → [0, 1] , heißt auch Verteilungsfunktion von f unter W ) KAPITEL 4. WAHRSCHEINLICHKEIT 340 4. f λW1 +(1−λ)W2 = λ f W1 + (1 − λ) f W2 (Der Erwartungswert unter einer Mischung ist gleich der Mischung der Erwartungswerte.) 5. Wf ist Punktmaß in x ∈ f (Ω) ⇒ f = x & ' 6. V (f ) = f 2 − f 2 , (f − x)2 = V (f ) + ( f − x)2 für x ∈ R (Der Erwartungswert der quadratischen Abweichung zwischen f und x ist minimal für x = f .) 7. V (f ) = 0 genau dann, wenn der Transport Wf ein Punktmaß ist. 8. W ({ω ∈ Ω : |f(ω) − f | ≥ t}) ≤ gleichung) 1 V t2 (f ) für alle positiven t. (Chebyshev Un2 9. VλW1 +(1−λ)W2 (f) = λVW1 (f ) + (1 − λ)VW2 (f) + λ (1 − λ) f W1 − f W2 (Die Varianz unter einer Mischung ist also nicht kleiner als die Mischung der Varianzen.) Beweis. Die meisten Aussagen sind direkt nachzurechnen. Wir zeigen beispielhaft wie die Aussagen 8) und 9) zustande kommen. Zunächst zu 9): Für die Varianz von f unter der Mischung W = λW1 +(1 − λ) W2 mit p (ω) = λp1 (ω)+(1 − λ) p2 (ω) gilt VW (f ) = 2 2 = ω∈Ω p (ω) f (ω) − & ' = λ f 2 1 + (1 − p (ω) f (ω) ω∈Ω & 2' λ) f 2 − [λ f = λV1 (f) + (1 − λ) V2 (f ) + λ f = λV1 (f) + (1 − λ) V2 (f ) + λ (1 = λV1 (f) + (1 − λ) V2 (f ) + λ (1 2 1 + (1 − λ) f 2 ] 2 2 1 + (1 − λ) f 2 − [λ f 1 − λ) f 21 − 2 f 1 f 2 + − λ) [ f 1 − f 2 ]2 . + (1 − λ) f 2 ]2 f 22 Aussage 8) kann so gezeigt werden. Sei t ∈ R>0 , dann gilt V (f) = ω∈Ω ≥ (f(ω) − f )2 p(ω) ≥ ω∈Ω, mit (f (ω)− f )2 ≥t2 ω∈Ω, mit (f (ω)− f )2 ≥t2 (f(ω) − f )2 p(ω) t2 p(ω) = t2 W ({ω ∈ Ω | |f (ω) − f | ≥ t}) . Die Chebyshev Ungleichung gibt gelegentlich für große t eine nützliche Abschätzung der Wahrscheinlichkeit von Ereignissen, auf denen f vom Erwartungswert mindestens um t abweicht. Satz 181 Sei Ω = {0, 1, ..., N} . Dann gilt idΩ = Nx und V (idΩ ) = Nx(1 − x) unter der Binomialverteilung zum Parameter x ∈ [0, 1] . KAPITEL 4. WAHRSCHEINLICHKEIT 341 Beweis. Der Beweis kann auf den N-maligen Münzwurf zurückgeführt werden. (Siehe unten) Der direkte Beweis geht unter Verwendung des Binomialsatzes wie folgt. Für N = 0 gilt idΩ = Nx offensichtlich. Dann gilt für N > 0 N idΩ = N kBi(k; N, x) = k=0 k=1 xk (1 − x)N−k N = Nx k=1 N−1 = Nx j=0 xk−1 (1 − x)N−1−(k−1) xj (1 − x)N−1−j N! (k − 1)!(N − k)! (N − 1)! (k − 1)!(N − 1 − (k − 1))! (N − 1)! = Nx(1 − x + x)N−1 = Nx. j!(N − 1 − j)! Als Vorstufe zur Varianz berechnen wir für f = idΩ den Erwartungswert von f (f −1). Sei N > 1 N f (f − 1) = k=0 N k (k − 1) Bi(k; N, x) = = N(N − 1)x2 N −2 j=0 k=2 xk (1 − x)N−k xj (1 − x)N−2−j N! (k − 2)!(N − k)! (N − 2)! j!(N − 2 − j)! = N(N − 1)x (1 − x + x)N−2 = N(N − 1)x2 . 2 Für N = 0 und für N = 1 gilt f (f − 1) = N(N − 1)x2 offensichtlich. Damit folgt nun & ' V (f ) = f 2 − f 2 = f (f − 1) + f − f 2 = N(N − 1)x2 + N x − N 2 x2 = Nx(1 − x). Für x = 0 und für x = 1 gilt V (idΩ ) = 0. In genau diesen Fällen ist die Binomialverteilung ein Punktmaß. Für x = 0 ist sie in k = 0 lokalisiert und für x = 1 ist sie in k = N lokalisiert. 4.1.7 *Kovarianz und Korrelationskoeffizient Sei Ω eine endliche Menge von Personen, aus der eine Person durch einen Zufallsmechanismus, also ein W-maß W, gezogen werden kann. Die Funktion m : Ω → R ordne jeder Person ω ∈ Ω ihre Masse (in irgendeiner Einheit) zu und l : Ω → R gebe ihre Länge an. Für viele jener Personen ω, die überdurchschnittlich groß sind, nicht aber unbedingt für alle von ihnen, ist auch ihre Masse überdurchschnittlich. Wie lässt sich diese Beobachtung quantifizieren? Ein Maß für einen solchen „Parallelismus“ gibt die sogenannte Kovarianz zweier Zufallsvariablen. Definition 182 Sei (Ω, W ) ein endlicher W-raum mit den Funktionen f, g : Ω → R. Die Zahl C (f, g) = (f − f ) (g − g ) heißt Kovarianz von f und g. KAPITEL 4. WAHRSCHEINLICHKEIT 342 Falls also f (ω) > f genau dann gilt, wenn g (ω) > g , dann ist die Funktion (f − f ) (g − g ) nicht negativ und erst recht ihr Erwartungswert, also die Kovarianz C (f, g) . Einige Eigenschaften der Kovarianz gibt der folgende Satz. Satz 183 Sei (Ω, W ) ein endlicher W-raum mit reellwertigen Funktionen f, g, h. dann gilt 1. C (f, g) = fg − f g , 2. C (f, g) = C (g, f ) , 3. C (λf, g) = λC (f, g) für alle λ ∈ R 4. C (f + g, h) = C (f, h) + C (g, h) , 5. V (f + g) = V (f ) + V (g) + 2C (f, g) 6. C (f, g) = 0 für jede konstante Funktion f, 7. C (f, f ) = V (f ) , 8. |C (f, g)| ≤ V (f) V (g). Beweis. Die Aussagen 1. bis 7. sind offensichtlich bzw. direkt nachzurechnen. Teil 8. folgt aus der Cauchy-Schwarz Ungleichung des Standardskalarproduktes des Rn so: C (f, g) = (f − f ) (g − g ) = = ω∈Ω = ω∈Ω p (ω) (f (ω) − f ) p (ω) (f (ω) − f ) (g (ω) − g ) p (ω) (g (ω) − g ) x (ω) y (ω) = x, y ω∈Ω mit x (ω) = p (ω) (f (ω) − f ) und y (ω) = p (ω) (g (ω) − g ) . Wegen V (f) = 2 ω∈Ω p (ω) (f (ω) − f ) = x, x folgt nun aus Cauchy Schwarz x, y die Ungleichung 2 ≤ x, x y, y C (f, g)2 ≤ V (f) V (g) und somit Aussage 8. Aufgrund von Teil 8. des Satzes liegt der sogenannte Korrelationskoeffizient C (f, g) K (f, g) = V (f ) V (g) im Intervall [−1, 1] . Offenbar gilt K (f, f ) = 1 und K (f, −f) = −1. Überdies ist K invariant unter einer Umskalierung der Funktionen f oder g, d.h. es gilt für λ > 0 K (λf, g) = K (f, λg) = K (f, g) . Der Korrelationskoeffizient von Länge und Masse für die Elemente ω einer Menschenmenge Ω ist somit unabhängig von den gewählten Längen- und Masseneinheiten. KAPITEL 4. WAHRSCHEINLICHKEIT 4.1.8 343 Das Gesetz der großen Zahl Dieser Abschnitt zeigt wie in einem Wahrscheinlichkeitsmodell Ereignisse mit Wahrscheinlichkeit sehr nahe bei 1 identifiziert werden können. Solche Ereignisse geben die Möglichkeit ein Wahrscheinlichkeitsmodell an der beobachteten Wirklichkeit zu überprüfen. Definition 184 Sei (Ω, W ) ein Wahrscheinlichkeitsraum mit den Funktionen fi : Ω → Xi für i = 1, . . . , n. Die Funktionen fi heißen E stochastisch unabhängig, falls für alle Ai ⊂ Xi gilt W f1−1 (A1 ) ∩ . . . ∩ fn−1 (An ) = ni=1 W fi−1 (Ai ) . Sei (Ω, W ) ein Wahrscheinlichkeitsraum mit den unabhängigen reellwertigen Funktionen f und g. Welche Wahrscheinlichkeitsfunktion pf +g hat Wf +g ? Es gilt für x ∈ f (Ω) + g (Ω) ⊂ R pf +g (x) = W ({ω ∈ Ω |f (ω) + g (ω) = x}) . Aus der Darstellung {ω ∈ Ω |f (ω) + g (ω) = x } = F a∈f (Ω) = F a∈f (Ω) ({ω |f (ω) = a} ∩ {ω |g (ω) = x − a}) f −1 (a) ∩ g −1 (x − a) als disjunkte Vereinigung folgt mit der Additivität von W und der Unabhängigkeit von f und g pf +g (x) = a∈f (Ω) = a∈f (Ω) W f −1 (a) ∩ g −1 (x − a) = pg (x − a) pf (a) = a∈f (Ω)∪g(Ω) a∈f (Ω) W f −1 (a) W g −1 (x − a) pg (x − a) pf (a) = (pg ∗ pf ) (x) . Die Funktion pg ∗ pf : f (Ω) + g (Ω) → [0, 1] wird als die Faltung von pg mit pf an der Stelle x bezeichnet. Substituiert man x − a = b, so ergibt sich auch pf +g (x) = b∈f (Ω)∪g(Ω) pf (x − b) pg (b) = (pf ∗ pg ) (x) . Satz 185 Seien (Ωi , Wi ) für i = 1, . . . , n Wahrscheinlichkeitsräume mit Fi : Ωi → Xi . Am Produktraum Ω := Ω1 ×. . .×Ωn mit dem Produktmaß W sind die Funktionen fi := Fi ◦ pri mit pri (ω 1 , . . . , ω n ) := ω i stochastisch unabhängig. Beweis. Es gilt einerseits W f1−1 (A1 ) ∩ . . . ∩ fn−1 (An ) = = W ({(ω 1 , . . . , ω n ) ∈ Ω | F1 (ω 1 ) ∈ A1 , . . . , Fn (ω n ) ∈ An }) D Wi Fi−1 (Ai ) . = W F1−1 (A1 ) × . . . × Fn−1 (An ) = i KAPITEL 4. WAHRSCHEINLICHKEIT 344 Andererseits gilt W fi−1 (Ai ) = = W ({(ω 1 , . . . , ω n ) ∈ Ω | Fi (ω i ) ∈ Ai }) = W Ω1 × . . . × Fi−1 (Ai ) × . . . × Ωn = W1 (Ω1 ) · . . . · Wi Fi−1 (Ai ) · . . . · Wn (Ωn ) = Wi Fi−1 (Ai ) Somit folgt die Bedingung für die stochastische Unabhängigkeit, nämlich D W fi−1 (Ai ) . W f1−1 (A1 ) ∩ ... ∩ fn−1 (An ) = i Im Fall eines ungezinkten Würfels sind Augenzahl und Quadrat der Augenzahl nicht stochastisch unabhängig. Sei f (ω) := ω und g := f 2 . Somit gilt f −1 ({1}) = {1} und g −1 ({4}) = {2} . Daraus folgt 0 = W f −1 ({1}) ∩ g −1 ({4}) = W f −1 ({1}) W g −1 ({4}) = 1/36. Satz 186 Sei (Ω, W ) ein Wahrscheinlichkeitsraum und fi : Ω → R für i = 1, ..n seien stochastisch unabhängig. Sei k1 , . . . , kn ∈ N0 . Dann gilt n ( ( ) D ) (fi )ki und V (f1 + ... + fn ) = (f1 )k1 ... (fn )kn = i=1 ( ) k1 kn Beweis. (f1 ) ... (fn ) = ... = x1 ∈f1 (Ω) = xn ∈fn (Ω) ... x1 ∈f1 (Ω) = = x1 ∈f1 (Ω) n ( D xn ∈fn (Ω) ω∈Ω i=1 (x1 )k1 · ... · (xn )kn W f1−1 ({x1 }) · ... · W fn−1 ({xn }) ) − fi i=1 n = i=1 n = i=1 & 2' fi + & 2' fi − fi xn ∈fn (Ω) n = i=1 n i=1 n fi fj − i,j=1,i=j n fi i=1 i=1 (x1 )k1 · ... · (xn )kn W f1−1 ({x1 }) ∩ ... ∩ fn−1 ({xn }) Für die Varianz gilt V (f1 + ... + fn ) = $ n $ n %2 2% = V (fi ). (f1 (ω))k1 · ... · (fn (ω))kn W ({ω}) (x1 )k1 W f1−1 ({x1 }) · ... · (fi )ki n fi i=1 n 2 = V (fi ) i=1 & 2' fi + 2 − (xn )kn W fn−1 ({xn}) n i,j=1,i=j n fi fj − fi fj i,j=1,i=j 2 n fi i=1 KAPITEL 4. WAHRSCHEINLICHKEIT 345 Sind zwei Funktionen f, g : Ω → R unter dem W-Maß W auf Ω stochastisch unabhängig, dann gilt also f · g = f · g . Umgekehrt folgt jedoch aus f · g = f · g nicht, dass f und g stochastisch unabhängig sind. Dazu ein Gegenbeispiel. Sei W : pot (Ω) → [0, 1] die Gleichverteilung auf Ω = {1, 2, 3} . Es gilt also W ({ω}) = 1/3 für alle ω ∈ Ω. Die Funktionen f, g seien wie folgt gewählt: f (1) = 1, g (1) = 0, f (2) = 0, g (2) = 1, f (3) = −1, g (3) = 0. Somit gilt f · g = 0 and f = 0, g = 1/3. Daraus folgt weiter, dass f · g = f · g . Die Funktionen f und g sind somit unkorreliert. Die Ereignisse A = {1} ⊂ Ω und B = {2} ⊂ Ω erfüllen A = f −1 (1) = {ω : f (ω) = 1} and B = g −1 (1) = {ω : g (ω) = 1} . A und B haben beide die Wahrscheinlichkeit 1/3, sind aber disjunkt, sodass W f −1 (1) ∩ g −1 (1) = 0 = (1/3)2 = W f −1 (1) · W g −1 (1) . f und g sind also stochastisch abhängig und dennoch unkorreliert. Der Transport von W unter der Abbildung f × g ist dementsprechend auch kein Produktmaß auf f (Ω) × g (Ω) . Für die W-Funktion pf ×g von Wf ×g gilt vielmehr die folgende Tabelle, aus der ersichtlich ist, dass die beiden Zeilen pf ×g (x, 0) und pf ×g (x, 1) linear unabhängig sind. Im Fall eines Produktmaßes wären sie linear abhängig. pf ×g (x, y) y=0 y=1 x = −1 1/3 0 x=0 0 1/3 x=1 1/3 0 Beispiel 187 Die Seitenlängen x und y eines Rechtecks werden aus den Vielfachen i · L einer Längeneinheit L > 0 mit i ∈ Ω1 = {1, 2, . . . 6} gewürfelt. Der Wahrscheinlichkeitsraum ist also Ω = Ω1 × Ω1 mit der Gleichverteilung W. Welchen Erwartungswert und welche Varianz haben Fläche und Umfang der Rechtecke? Welche Kovarianz haben Fläche und Umfang? Das Rechteck (i, j) hat die Fläche A (i, j) = L2 ij und den Umfang U (i, j) = 2L (i + j) . Also ergeben sich mit x (i, j) = Li und y (i, j) = Lj die Erwartungswerte U A = 2 ( x + y ) = 4 x = 14L, 49 = xy = x y = x 2 = L2 , 4 von Umfang und Fläche. Für die Varianz des Umfangs folgt V (U) = 4 (V (x) + V (y)) = 8V (x) = 8L2 35 70 = L2 . 12 3 KAPITEL 4. WAHRSCHEINLICHKEIT 346 Für die Varianz der Fläche folgt & '& ' & ' V (A) = x2 y 2 − xy 2 = x2 y 2 − x 2 y 2 2 & '2 = x2 − x V (x) + x 2 − x 4 = V (x)2 + 2V (x) x 35 35 49 35 7 5 = L4 + = L4 +7 12 12 2 12 2 6 = 4 = L 35 12 2 2 4 = V (x) V (x) + 2 x 2 47 ≈ 79. 965L4 . 5 Die Kovarianz von Umfang und Fläche ergibt sich daraus so & ' & ' & ' UA = 2 (x + y) xy = 2 x2 y + xy 2 = 4 x2 x = 4 V (x) + x 35 49 7 = 4L3 + 12 4 2 35 49 7 49 + − 14L3 C (U, A) = U A − U A = 4L3 12 4 2 4 * + 35 35 49 5 49 = 14L3 + − = L3 7 = L3 72 . 12 4 4 6 6 2 x Daraus folgt nun der Korrelationskoeffizient K (U, A) = = 72 56 C (U, A) = V (U) V (A) 72 56 73 122 10 5 3 / =2 · 47 70 3 35 12 35 12 + 49 2 105 ≈ 0.945 31. 470 Beispiel 188 Ein ungezinkter Würfel wird 1000 mal geworfen. Lässt sich die Wahrscheinlichkeit abschätzen, mit der die Summe der geworfenen Augenzahlen vom Erwartungswert 3500 um mindestens 1000 abweicht? Chebyshevs Ungleichung gibt eine Antwort. Sei Ω = {1, . . . 6} und Wn die Gleichverteilung auf Ωn . Sei fn : Ωn → R mit fn (ω 1 , . . . ω n ) = ni=1 ω i . Dann gilt Wn Mit fn Wn = n f1 , ω ∈ Ωn : ,fn (ω) − fn Wn , ,≥t ≤ VWn (fn ) . t2 = n · 7/2 und VWn (fn ) = nVW1 (f1 ) = n 36−1 folgt daraus 12 , , , 7 ,, n 35 n , Wn ω ∈ Ω : ,fn (ω) − n , ≥ t ≤ 2 . 2 t 12 W1 Wählen wir nun n = 1000 und t = 1000, dann ergibt sich , , , 7 ,, 35 n , ≤ ≈ 2, 9 · 10−3 . Wn ω ∈ Ω : ,f1000 (ω) − 1000 , ≥ 1000 2 12000 KAPITEL 4. WAHRSCHEINLICHKEIT 347 Der folgende Satz baut das vorangehende Beispiel zu einem allgemeinen Resultat aus. Er zeigt, wie bei einer großen Anzahl von Wiederholungen eines Zufallsexperiments Mittelwerte gebildet werden können, deren Varianzen gegen 0 gehen. Er bildet somit eine Version des „Gesetzes der großen Zahl“. Satz 189 Sei (Ω1 , W1 ) ein endlicher Wahrscheinlichkeitsraum und f : Ω1 → R. Dann gilt für die Funktionen fi = f ◦ pri auf (Ωn1 , W1 × . . . W1 ) VWn 1 n fi = i 1 VW (f) . n 1 Beweis. Sei Ωn := (Ω1 )n und Wn := W1 × . . . × W1 mit(den Funktionen i := ( f) ) k k f ◦ pri . Sie sind stochastisch unabhängig. Es folgt zunächst (fi ) = (f ) Wn für i = 1, ..., n und k ∈ N0 . Wegen 1 n n i=1 1 fi (ω 1 , ..., ω n ) = n W1 n f (ω i ) i=1 heißt n1 i fi (ω) für ω ∈ Ωn der Mittelwert von f in der Folge ω = (ω 1 , ..., ω n ) von n Elementen ω i ∈ Ω1 . Aus der Linearität des Erwartungswertes folgt $ n % 1 fi = f W1 . n i=1 Wn Aus der Formel für die Varianz einer Summe von stochastisch unabhängigen Variablen folgt VWn 1 n fi = i 1 VW n2 n fi = i 1 n2 VWn (fi ) = i 1 nVW1 (f ) . n2 Beispiel 190 Sei Ω = {0, 1} mit W ({1}) = x ∈ [0, 1] (gezinkter Münzwurf, Kernzerfall, ...). Wn sei das Produktmaß auf Ωn . Wir wissen schon, dass der Transport von Wn mit der Funktion n n Zn : Ω → {0, 1, .., n} , (ω 1 , ..ω n ) → n ωi = k=1 pri (ω 1 , ..ω n ) , k=1 die Binomialverteilung mit Parameter x auf {0, 1, .., n} ist. Es gilt also (Wn )Zn ({k}) = Bi(k; n, x). Da die Funktionen pri stochastisch unabhängig sind, folgt n Zn Wn = pri k=1 Wn = nx und VWn (Zn ) = nx(1 − x). KAPITEL 4. WAHRSCHEINLICHKEIT 348 Also stimmen Zn Wn und VWn (Zn ) mit Erwartungswert und Varianz von id unter der Binomialverteilung überein: Zn Wn = id (Wn )Zn , VWn (Zn ) = V(Wn )Zn (id) . Dies ist also eine etwas indirekte, zweite Möglichkeit, Erwartungswert und Varianz von id unter der Binomialverteilung zu berechnen. Aus Satz 189 folgt, dass für n → ∞ die Varianz des Mittelwerts gegen 0 geht, der Mittelwert wird also deterministisch. Auf solche Mittelwerte von f läßt sich mit wenig Risiko wetten! Man beachte dazu auch die Übungsbeispiele 14, 15. Satz 189 lässt sich noch weiter auswerten. Wähle dazu ein Element x ∈ Ω1 und die zugehörige Indikatorfunktion f = δ x : Ω1 → R, ω→ 1 für ω = x . 0 sonst Für den Erwartungswert von f gilt f W1 = W1 ({x}) = p(x). Er gibt also die Wahrscheinlichkeit des Elementarereignisses {x} an. Die Funktion i fi auf Ωn gibt für ω := (ω 1 , ..., ω n ) ∈ Ωn an, wie oft x ∈ Ω1 in ω auftritt. Der Quotient hn,x (ω) := 1 i fi (ω) heißt die relative Häufigkeit von x in der Folge ω von n Zufallsereignissen. n Es gilt hn,x Wn = p(x). Wegen VWn (hn,x ) = ω∈Ωn (hn,x (ω) − p(x))2 Wn ({ω}) → 0 bei n → ∞, gilt für jedes feste ε > 0 nach der Ungleichung von Chebyshev, dass lim Wn ({ω ∈ Ωn | |hn,x (ω) − p(x)| > ε}) = 0. n→∞ Deshalb nähert für genügend großes n ein einzelner „zufälliger”6 Wert hn,x (ω) die Wahrscheinlichkeit W1 ({x}) mit „großer” Wahrscheinlichkeit. Diese mathematischen Fakten („Gesetz der großen Zahl”) bilden die Basis für die Benützung von Wahrscheinlichkeit in den empirischen Wissenschaften. Ein Beispiel liefert das radioaktive Zerfallsgesetz. Eine Probe enthalte zur Zeit t = 0 eine Anzahl von n0 instabilen Kernen. Für jeden dieser Kerne sei die Wahrscheinlichkeit zur Zeit t > 0 noch unzerfallen zu sein, durch pt = e−λt gegeben. Die Konstante λ > 0 heißt Zerfallskonstante. Sie hängt nicht von t ab. Die Zahl der zur Zeit t noch unzerfallenen Kerne in der Probe erfüllt somit für großes n (mit hoher Wahrscheinlichkeit) nt ≈ n0 e−λt . Für die Zahl Z der Kerne, die zwischen t und t + τ zerfallen, gilt für λτ ≪ 1 nt − nt+τ ≈ n0 e−λt 1 − e−λτ ≈ λτ n0 e−λt . 6 Dh jedes Element der Folge ω wird von einem Zufallsgenerator erzeugt, der durch W1 beschrieben ist. Man denke etwa an eine Folge von Würfelexperimenten. KAPITEL 4. WAHRSCHEINLICHKEIT 349 Für die Aktivität At der Probe zur Zeit t gilt somit At = nt − nt+τ ≈ λn0 e−λt . τ Das Gesetz der großen Zahl bildet auch den Ausgangspunkt der mathematischen Statistik, Fehlerrechnung und Schätztheorie. Dort geht es um die Frage, wie aus endlich vielen Zufallsexperimenten die Verteilung einer Funktion f mit möglichst großer Wahrscheinlichkeit richtig zu erraten ist. Immer gehen dabei Hypothesen über den Typ des Maßes Wf ein, und ermittelt werden Parameter, die das Maß dann nur mehr im Detail bestimmen. (Achtung: Oft hat man keine klare Vorstellung vom Definitionsbereich von f.) Eine rezeptartige Zusammenfassung der für die statistische Auswertung von Messreihen wichtigen Formeln ist in Kapitel 12 von K. Weltner, Mathematik für Physiker 1, Springer 2001, gegeben. Einige Resultate sind die folgenden. Die beste Schätzung des Erwartungswertes f ist der Mittelwert f := f1 + ... + fn n der aus den n zur Verfügung stehenden (unabhängigen) Stichproben von Werten fi := f (ω i ) ∈ R, der einen(!) Funktion f zu bilden ist. Die beste Schätzung der Varianz V (f ) ist aus der mittleren quadratischen Abweichung 1 s := n n 2 i=1 fi − f 2 n mit n−1 s2 gegeben. Beachte: Die auf R definierte differenzierbare Abbildung S, das Polynom zweiten Grades n 1 (fi − x)2 , S:x→ n i=1 hat bei x = f ihr globales Minimum. Denn 2 S (x) = − n n ′ i=1 (fi − x) = −2(f − x) und somit S ′ (x) = 0 genau dann, wenn x = f . Wegen S ≥ 0 ist der kritische Punkt des Polynoms zweiten Grades das globale Minimum von S. Die mittlere quadratische Abweichung der Messwerte fi von irgendeinem Referenzwert x ist minimal für x = f. Abschließend wird noch eine etwas allgemeinere Version des Gesetzes der großen Zahl für (unendliche) W-räume angegeben. Satz 191 Sei (Ω, W ) ein W-raum. Die Funktionen fi : Ω → R für i ∈ N seien stochastisch unabhängig. Die Zahlenfolge (V (fi ))i∈N sei beschränkt . Sei ε > 0. Dann gilt , = > , , f1 (ω) + ... + fn (ω) , f1 + ... + fn nε , ,< √ ω∈Ω:, − = 1. lim W , n→∞ n n n W KAPITEL 4. WAHRSCHEINLICHKEIT 350 Beweis. Anwendung der Chebyshevungleichung (Eigenschaft 8 in Bemerkung 180) auf Zn := n1 ni=1 fi ergibt wegen der stochastischen Unabhängigkeit der fi nach Satz 186 1 1 W ({ω ∈ Ω : |Zn (ω) − Zn W | ≥ t}) ≤ 2 VW (Zn ) = 2 2 t tn n i=1 VW (fi ) ≤ K , t2 n √ wobei K ∈ R mit VW (fi ) ≤ K für alle i ∈ N. Mit t = nε / n für ε > 0 folgt W ω ∈ Ω : |Zn (ω) − Zn √ ε | ≥ n / n W ≤ K . n2ε Damit folgt 1≥W 4.2 ω ∈ Ω : |Zn (ω) − Zn W| √ < nε / n ≥1− K → 1 für n → ∞. n2ε Abzählbar unendliche W-räume Auf abzählbar unendliche Mengen Ω übertragen sich die Begriffe und Sätze, die für endliche Mengen formuliert wurden, weitgehend. Im folgenden wird anhand von zwei physikalisch vielgenutzten Beispielen ein erster Eindruck der neuen Situation vermittelt. Es sind dies die geometrische und die Poissonverteilung. Die Boltzmann - Gibbs Konstruktion der „thermischen” W-maße zu einer „Energie”-funktion auf Ω wird auch kurz gestreift. Eine Mengenfunktion W : pot(Ω) → R für eine abzählbar unendliche Menge Ω heißt W-maß auf Ω, falls analog zu Bedingung (ii) in Kolmogorows Definition für alle abzählbaren Familien (Ai )i∈I disjunkter Teilmengen von Ω W F i∈I Ai = i∈I W (Ai ) gilt. Bedingung (i) und (iii) werden unverändert übernommen. Analog zum Fall endlicher W-räume gilt dann für jede Menge A ⊂ Ω, dass W (A) = ω∈A W ({ω}) . Die Normierungsbedingung (iii) sagt W (Ω) = ω∈Ω W ({ω}) = 1. Damit kann aus einer beliebigen nichtnegativen Funktion q : Ω → R ein W-maß auf Ω erzeugt werden, sofern die Reihe Z := ω∈Ω q(ω) konvergiert. Man wählt die Wahrscheinlichkeitsfunktion p : Ω → R, ω → q(ω)/Z und definiert für A ⊂ Ω W (A) = p (ω) . ω∈A In der physikalischen Anwendung auf thermische Quantenzustände ist Ω die Menge aller stationären Zustände des jeweils zugrundegelegten Quantensystems. Für KAPITEL 4. WAHRSCHEINLICHKEIT 351 jeden Zustand ω ∈ Ω ist eine Energie E (ω) gegeben. Falls die Reihe („Zustandssumme”) ω∈Ω exp (−βE(ω)) konvergiert, existiert das W-maß Wβ zur Wahrscheinlichkeitsfunktion pβ pβ (ω) := exp (−βE(ω)) mit Z(β) := exp (−βE(ω)) Z(β) ω∈Ω mit β = 1/kT (Boltzmannkonstante k > 0).7 (Boltzmann-Gibbs Verteilung der Temperatur T zur Energiefunktion E.) Falls die Abbildung β → ω∈Ω E(ω) exp (−βE(ω)) als Grenzfunktion einer Folge von Funktionen auf R>0 gewisse Konvergenzbedingungen8 erfüllt, dann folgt für den Erwartungswert der Energie, dass für alle β > 0 E Wβ = E(ω)pβ (ω) = ω∈Ω 1 1 E(ω) exp (−βE(ω)) = − Z ′ (β). Z(β) ω∈Ω Z(β) Ein wichtiger Spezialfall der Konstruktion ergibt sich für den quantenmechanischen harmonischen Oszillator. Hier gilt Ω = N0 und E(n) = ε0 +hνn. (Dann ist Wβ das thermische Gleichgewichts-W-maß einer Hohlraumstrahlungsmode der Frequenz ν > 0, wobei h die Plancksche Konstante ist. Das Elementarereignis {n} steht für das Vorhandensein von n Photonen in der Mode.) Es gilt für n ∈ N0 pβ (n) = exp(−β (hνn + ε0 )) , Z(β) Z(β) = exp(−βε0 ) xn = exp(−βhνn) = exp(−βε0 ) n∈N0 n∈N0 exp(−βε0 ) 1−x mit x := exp (−βhν) ∈ (0, 1) . Damit ergibt sich pβ (n) = (1 − x)xn . 4.2.1 Geometrische Verteilung Ein unverbesserlicher Optimist kauft jeden Freitag Abend einen Tipp für die nächste Ziehung von 6 aus 45. Seine Wahrscheinlichkeit auf einen Sechser ist p = 1/8145060 ≈ 10−7 . Er nimmt sich vor, so lange zu spielen, bis er den ersten Sechser einfährt. Sein Spiel hat also den Wahrscheinlichkeitsraum N0 . Dabei steht n ∈ N0 für die Zahl seiner sechserlosen Tipps bis zu seinem finalen Sechser. Die Wahrscheinlichkeit, dass er nach n Fehltipps einen Sechser tippt, ist gleich px (n) = xn · p mit x = 1 − p. Kontrolle der Normierungsbedingung: ∞ k=0 px (n) = p ∞ k=0 xn = p = 1. 1−x Definition 192 Sei x ∈ (0, 1) und Ω := N0 . Dann heißt der W-raum (Ω, Wx ) mit der Wahrscheinlichkeitsfunktion px : Ω → [0, 1] , n → (1 − x)xn geometrische Verteilung zum Parameterwert x. 7 8 Natürlich funktioniert die Konstruktion bei endlichen Mengen Ω immer. Siehe Satz 35 samt Bemerkung in Kapitel III, Abschnitt 7, Band I von [3]. KAPITEL 4. WAHRSCHEINLICHKEIT 352 Wegen px (n + 1) = xpx (n) ist die Funktion px streng monoton fallend. Von zwei Elementarereignissen {m} und {n} mit m < n hat also {m} die größere Wahrscheinlichkeit. Mit steigendem x wird px „flacher”. Für x ↓ 0 geht Wx gegen das Punktmaß, das auf 0 lokalisiert ist, denn limx→0 (1 − x)xn = δ 0,n . 0.5 0.375 0.25 0.125 0 0 1 2 3 4 5 6 7 8 9 10 n Abbildung 4.2: Geometrische Verteilung für x = 0.5 und x = 0.8 (rot) Nun zu Erwartungswert und Varianz von id unter der geometrischen Verteilung. (Die Beweise werden in Übungsbeispiel 12) geführt.) Satz 193 Für die geometrische Verteilung zum Parameterwert x ∈ (0, 1) gilt: id Wx = x x und VWx (id) = . 1−x (1 − x)2 Man beachte: limx↓0 id = 0 = min id(Ω) und limx↓0 V (id) = 0. Für x → 1 wachsen id und V (id) unbeschränkt. Wieviele sechserlose Tipps muss unser Optimist bis zu seinem ersten Sechser erwarten? Ungefähr (1 − 10−7 ) /10−7 ≈ 107 . Wenn er wöchentlich einen Tipp abgibt, muss er sich auf ca. 2 · 105 Jahre einrichten. Münzwurfspiel mit Gewinnwahrscheinlichkeit x ∈ [0, 1] Das folgende Beispiel zerlegt den Ereignisraum N mit der geometrischen Verteilung zum Parameter 1/2 in zwei komplementäre Ereignisse mit den Wahrscheinlichkeiten x ∈ [0, 1] und 1 − x. Auf diese Weise lässt sich mit einer fairen Münze jedes W-Maß auf einer zweielementigen Menge erzeugen. Die Zahl x ∈ [0, 1] habe die Binärentwicklung 0, x1 x2 . . . , d.h. für die unendliche Folge (x1 , x2 , . . .) mit Einträgen aus der Menge {0, 1} gilt x= ∞ k=1 xk 1 . 2k Werfen Sie nun eine (gleichverteilte) Münze. Wenn Kopf fällt, werten Sie dies als die Zahl 0, fällt hingegen Zahl, werten Sie dies als 1. Werfen Sie die Münze n-mal KAPITEL 4. WAHRSCHEINLICHKEIT 353 hintereinander, so erzeugen Sie eine Folge ω = (ω 1 , . . . ω n ) in {0, 1} . Sie wählen nun die Zahl n der Würfe nicht fest, sondern lassen den Zufall über n nach der Regel ω i = xi für i = 1, . . . n − 1 und ω n = xn entscheiden. Sie werfen also so oft, bis die geworfene Folge erstmals von der Binärfolge von x abweicht. Der Wahrscheinlichkeitsraum Ω dieses Spiels ist also N. Die Wahrscheinlichkeit, dass Sie eine Folge der Länge n werfen, ist durch pn = 21n gegeben. Es gilt übrigens ∞ pk = n=1 ∞ n=0 1 1 − 1 = 2k 1− 1 2 − 1 = 1. Wie groß ist die Wahrscheinlichkeit, dass der erste Fehlwurf, der zum Spielende führt, ω n < xn erfüllt? Für xn = 0 kann ω n < xn nicht gelten. Für xn = 1 hingegen folgt aus ω n = xn , dass ω n < xn . Daher gilt für eine Folge ω der Länge n, dass ω n < xn , genau dann, wenn xn = 1. Wegen xn ∈ {0, 1} gilt W ({n ∈ N : xn = 1}) = ∞ pn = n=1,xn =1 ∞ xn pn = x. n=1 Die beiden komplementären Ereignisse: Spiel abgebrochen wegen ω n < xn bzw. wegen ω n > xn haben somit die Wahrscheinlichkeiten x bzw. 1 − x. 4.2.2 Poissonverteilung Eine radioaktive Probe enthalte n = 1020 instabile Kerne. Jeder der Kerne habe die winzige Wahrscheinlichkeit von x = 10−18 =: δ/n innerhalb der nächsten Sekunde zu zerfallen. Es gilt also δ = 100. Die Wahrscheinlichkeit, dass in der nächsten Sekunde genau k ∈ {0, 1, . . . n} der Kerne zerfallen, ist Bi (k, n, x) = Bi (k, n, δ/n) . Wir werden nun zeigen, dass Bi (k, n, δ/n) ≈ e−δ δ k /k! gilt.9 (Gesetz der kleinen Wahrscheinlichkeiten) Definition 194 Für δ > 0 heißt der W-raum (N0 , Wδ ) mit pδ (n) → e−δ · δ n /n! Poissonverteilung zum Parameter δ. Es gilt die Normierungsbedingung ∞ n=0 pδ (n) = 1. Wegen pδ (n) = pδ (n − 1) · δ/n gilt pδ (n) > pδ (n − 1) für alle n < δ und pδ (n) < pδ (n − 1) für alle n > δ. Der Graph von pδ wird mit wachsendem δ flacher. Für δ ↓ 0 geht Wδ gegen das Punktmaß, das auf 0 lokalisiert ist. Abbildung 4.4 zeigt für δ = 100 und für δ = 120 den Graphen jener reellen Interpolation Pδ (x) der Poissonverteilung pδ , die für x ∈ R≥0 mittels Eulers Gammafunktion Γ durch ∞ x −δ Pδ (x) := δ e /x! mit x! := Γ(1 + x) := e−t tx dt 0 gegeben ist. Die vorliegende graphische Auflösung kann Pδ nicht von pδ unterscheiden. 9 Den Fehler werden wir allerdings nicht abschätzen können. KAPITEL 4. WAHRSCHEINLICHKEIT 354 0.5 0.375 0.25 0.125 0 0 2.5 5 7.5 10 Abbildung 4.3: Poisson Verteilung für δ = 0.5 und δ = 5 0.03 0.02 0.01 0 0 50 100 150 200 Abbildung 4.4: Poissonverteilung für δ = 100 und δ = 120 Satz 195 Für die Poissonverteilung Wδ gilt id Wδ = δ, VWδ (id) = δ. Beweis. id ∞ ∞ δ n −δ = npδ (n) = n e = n! n=0 n=0 = δe−δ ∞ n=1 & id 2 ' ∞ n−1 ∞ ∞ n=1 n δn e−δ (n − 1)! δ δ = δe−δ = δe−δ eδ = δ (n − 1)! (n)! n=0 ∞ ∞ δn δ n−1 = n pδ (n) = n e−δ = δe−δ n (n − 1)! (n − 1)! n=0 n=1 n=1 .∞ 7 ∞ δ n−1 δn−1 −δ = δe (n − 1) + (n − 1)! n=1 (n − 1)! . n=1∞ 7 ∞ n−2 n δ δ = δe−δ δ + = δe−δ δeδ + eδ = δ 2 + δ (n − 2)! n! n=2 n=0 2 Daraus folgt V (id) = id2 − id 2 = δ 2 + δ − δ 2 = δ. Der folgende Satz zeigt einen Zusammenhang zwischen der Binomoialverteilung und der Poissonverteilung. Satz 196 Für n, k ∈ N0 , x ∈ (0, 1) , δ ∈ R>0 gilt limn→∞ Bi k; n, nδ = pδ (k). KAPITEL 4. WAHRSCHEINLICHKEIT 355 Beweis. Sei ohne Einschränkung n > δ und n > k. Dann gilt δ Bi(k; n, ) = n n k δ n k δ 1− n n−k δk = k! δ 1− n −k δ 1− n n n! (n − k)!nk Nun gilt wegen der Stetigkeit von x → (1 − x)−k bei x = 0, dass limn→∞ (1 − δ/n)−k = 1. Für das k-fache Produkt n! n (n − 1) ... (n − k + 1) 1 = =1· 1− k k (n − k)!n n n · ... · 1 − k−1 n n n! δ = exp (−δ) folgt folgt limn→∞ (n−k)!n k = 1. Mit Eulers Formel limn→∞ 1 − n schließlich die Behauptung. Eine Approximation der Binomialverteilung zu festem Parameter x gibt der folgende Grenzwertsatz von de-Moivre und Laplace. Satz 197 Sei Wn die Binomialverteilung10 auf Ωn = {0, 1, . . . n} zum Parameter id −nα α ∈ (0, 1) . Sei Yn = √ Ωn . Dann gilt Yn = 0 und V (Yn ) = 1 und nα(1−α) 1 lim Wn ({k ∈ Ωn : Yn (k) ≤ x}) = √ n→∞ 2π x u2 e− 2 du. −∞ Dieser Satz erklärt also die Gauß’sche Glockenkurve am Galtonbrett. Darüberhinaus führt er uns zu überabzählbar unendlichen W-Räumen. 4.3 Wahrscheinlichkeitsmaße auf Rn Für W-maße auf überabzählbar unendlichen Mengen Ω muß die Potenzmenge pot(Ω) zwar zu einer darin enthaltenen σ-Algebra von Teilmengen von Ω verkleinert werden, aber viele Analogien zum Fall einer endlichen Menge Ω bleiben bestehen. Wir behandeln überabzählbar unendliche Mengen Ω nur beispielhaft und weichen der Formulierung allgemeiner Sachverhalte aus. 4.3.1 Wahrscheinlichkeitsmaße auf R mit Dichtefunktion Der Grenzwertsatz von de Moivre und Laplace legt die folgende allgemeine Konstruktion für W-Maße auf R nahe. Sei ρ0 : R → R eine stetige nichtnegative Funkti∞ on, für die das Integral −∞ ρ0 (x) dx existiert. Durch Übergang zu ρ = cρ0 mit einer ∞ positiven reellen Zahl c kann dann immer erreicht werden, dass −∞ ρ (x) dx = 1 gilt. Damit wird nun die Funktion F : R → [0, 1] mit x F (x) = ρ (t) dt −∞ 10 Es gilt also pn (k) = n k αk (1 − α)n−k . KAPITEL 4. WAHRSCHEINLICHKEIT 356 monoton wachsend und es gilt F ′ = ρ und limx→−∞ F (x) = 0, limx→∞ F (x) = 1. Die Zahl F (x) kann als Definition der Wahrscheinlichkeit des Ereignisses (−∞, x] in R gewählt werden. Die Funktion F heißt Verteilungsfunktion des W-Maßes und ρ heißt Dichte von F. Einem endlichen Intervall (a, b] wird die Wahrscheinlichkeit b W ((a, b]) = a ρ (x) dx = F (b) − F (a) zugeordnet. W ((a, b]) gleicht also dem Inhalt jener Fläche, die zwischen a und b unter dem Graphen von ρ liegt. Nach dem Mittelwertsatz der Integralrechnung existiert ein x ∈ [a, b] , sodass b W ((a, b]) = a ρ(x)dx = (b − a) · ρ(x). Für eine (abzählbare) Vereinigung von disjunkten Intervallen Iα wird W (∪α Iα ) = α W (Iα ) gesetzt. 4.3.2 Gauß’sche Normalverteilung Ein Beispiel für das Konstruktionsschema11 des vorigen Abschnitts liefert die nach Gauß benannte Normalverteilung. Definition 198 Das W-Maß auf R, das für alle x ∈ R dem Ereignis (−∞, x] die Wahrscheinlichkeit x (t−x0 )2 1 − 2δ 2 √ e dt (4.2) F (x) = 2 −∞ 2πδ zuordnet, heißt (Gauß’sche) Normalverteilung zu den Parameterwerten δ > 0 und x0 ∈ R. Die Funktion F heißt Verteilungsfunktion und die Ableitung ρ = F ′ ihre Dichte. Die Verteilungsfunktion F der Normalverteilung zu (δ, x0 ) geht aus der parameterfreien Gauß’schen Fehlerfunktion12 erf : R → R, 2 erf(x) := √ π x −t2 e 0 1 dt = √ π x 2 e−t dt −x folgendermaßen hervor F (x) = 11 1 2 1 + erf x − x0 √ 2δ 2 . (4.3) Noch allgemeiner ist die Vorgabe einer Verteilungsfunktion F : R → R mit den Eigenschaften: F ist nicht fallend, F ist stetig bis auf höchstens abzählbar viele Sprungstellen, in den Sprungstellen ist F rechtsseitig stetig, limx→−∞ F (x) = 0 und limx→∞ F (x) = 1. 12 Das Kürzel erf leitet sich von error function ab. KAPITEL 4. WAHRSCHEINLICHKEIT 357 Die Parameter x0 und δ der Verteilung F schieben und strecken die Fehlerfunktion. √ 2 Warum gilt Gleichung (4.3)? Substitutiere t := (x − x0 ) / 2δ in Gleichung (4.2). Damit folgt 1 F (x) = √ π 1 = √ π x−x0 √ 2δ −t2 e −∞ ∞ 0 0 1 dt = √ π 1 2 e−t dt + √ π −t2 e −∞ x−x0 √ 2δ 1 dt + √ π 2 e−t dt = 0 x−x0 √ 2δ 2 e−t dt 0 1 1 + erf 2 x − x0 √ 2δ . Für das letzte Gleichheitszeichen wurde limx→∞ erf(x) = 1 benützt, was weiter unten bewiesen wird. Wegen Gleichung (4.3) stellt dies sicher, dass limx→∞ F (x) = 1. Die Abbildung 4.5 zeigt ρ für x0 = 0 und δ = 1 bzw. δ = 1/2. Die Abbildung 4.6 zeigt F für x0 = 0 und δ = 1 bzw. δ = 1/2. Der Fall x0 > 0 entsteht durch Verschieben der Graphen um x0 nach rechts. 0.6 0.4 0.2 0 -5 -2.5 0 2.5 5 Abbildung 4.5: ρ für δ = 1 bzw. δ = 1/2 (die schmälere) und x0 = 0 1 0.75 0.5 0.25 0 -5 -2.5 0 2.5 5 Abbildung 4.6: F für δ = 1 bzw. δ = 1/2 (die steilere) mit x0 = 0 Nun zeigen wir noch limx→∞ erf(x) = 1. Mit Polarkoordinaten des R2 , nämlich x = r cos (φ) und y = r sin (φ), folgt für das Quadrat der positiven Zahl KAPITEL 4. WAHRSCHEINLICHKEIT 358 √ ∞ exp (−x2 ) dx/ π −∞ I = limx→∞ erf(x) = ∞ ∞ 1 −(x2 +y2 ) 1 2π 2 I = e dx dy = e−r rdr dφ π 0 −∞ −∞ π 0 2π ∞ 2π 1 d 1 2 1 dφ = 1. = − e−r drdφ = π 0 dr 2 2π 0 0 √ √ ∞ Bemerkung 199 Substituieren von x = t/ 2δ 2 in −∞ exp (−x2 ) dx = π ergibt mit δ > 0 ∞ √ t2 e− 2δ2 dt = δ 2π. 2 ∞ −∞ Diese Formel gilt jedoch nicht nur für δ ∈ R>0 , sondern auch für δ ∈ C 0, sofern − π4 < arg(δ) < π4 . (Das Argument einer von Null verschiedenen komplexen Zahl δ ist dabei durch δ = |δ| exp (i arg(δ)) mit −π < arg(δ) ≤ π definiert.) Im Fall δ ∈ C 0 mit − π4 < arg(δ) < π4 gilt übrigens die für die Konvergenz des Integrals nötige Ungleichung ℜ δ 2 > 0. 4.3.3 Exponentialverteilung Die Beobachtung radioaktiver Zerfälle zeigt: Die Wahrscheinlichkeit p (τ ) , dass ein instabiler Atomkern (eines festgelegten Typs) eine Zeitspanne der Dauer τ > 0 unzerfallen übersteht, sinkt für τ → ∞ gegen 0 ab. Umgekehrt strebt für τ → 0 diese ’Überlebenswahrscheinlichkeit’ p (τ ) gegen 1. Für Zeiten τ > 0 nahe bei 0 gilt eine (einseitige) Tangentialapproximation p (τ ) ≈ 1 − λτ mit λ ∈ R>0 , deren Fehler ψ (τ ) = p (τ )−(1 − λτ ) die Bedingung limτ →0 ψ (τ ) /τ = 0 erfüllt. Die positive reelle Zahl λ wird als ’Zerfallsrate’ bezeichnet. Mit welcher Wahrscheinlichkeit überlebt der Atomkern höchstens N Zeitspannen der Dauer τ ? Gibt es eine stetige Funktion auf R, welche die Wahrscheinlichkeit angibt, dass ein zur Zeit 0 vorliegender Kern irgendwann vor der Zeit t ∈ R zerfällt? Unter der physikalischen Hypothese, dass der Kern jedes Zeitintervall der Dauer τ mit Wahrscheinlichkeit p (τ ) intakt übersteht, ist die Wahrscheinlichkeit für das Überleben von höchstens N ∈ N0 solchen (aneinander gereihten) Intervallen durch die geometrische Verteilung Wx auf N0 mit Parameter x = p (τ ) gegeben, dh N Wx ({n ∈ N0 : n ≤ N }) = Sei nun t ∈ R>0 . Dann gilt mit Wx t τ n ∈ N0 : n ≤ = t τ t τ n=0 + t τ (1 − x) xn = 1 − xN+1 . und t τ ∈ N0 und 0 ≤ t τ <1 = 1 − x[ τ ]+1 = 1 − x τ x1−{ τ } . t t t Die Zahl α = 1 − τt liegt im Intervall (0, 1] . Die Zahl xα = eα ln p(τ ) erfüllt wegen ln p (τ ) < 0 die Abschätzung eln p(τ ) ≤ xα < e0 = 1. Aus limτ→0 eln p(τ ) = 1 folgt daher limτ→0 xα = 1. KAPITEL 4. WAHRSCHEINLICHKEIT 359 t Den Faktor x τ formen wir um zu t τ t τ x = (1 − λτ + ψ (τ )) = λt λt ψ (τ ) 1− + t/τ t/τ λτ t τ . Für τ → 0 ergibt sich daher mit s = t/τ t lim x τ = lim τ →0 s→∞ 1− s ψ (t/s) λt 1− s λt/s = e−λt . Für die Wahrscheinlichkeit Pλ (t) , dass ein Kern, der eine ’Zerfallsrate’ λ besitzt und der zur Zeit 0 intakt vorliegt, irgendwann vor einer Zeit t > 0 zerfällt, gilt somit Pλ (t) = lim W1−λτ ({n ∈ N0 : n ≤ t/τ }) = 1 − e−λt . τ ↓0 Für t = 0 ergibt sich Pλ (0) = lim W1−λτ ({n ∈ N0 : n ≤ 0}) = lim W1−λτ ({0}) = lim (1 − p (τ )) = 0. τ ↓0 τ ↓0 τ ↓0 Definition 200 Sei λ ∈ R>0 . Dann heißt das Wahrscheinlichkeitsmaß auf R mit der Verteilungsfunktion Fλ (x) = 1 − e−λx für x > 0 und Fλ (x) = 0 sonst, Exponentialverteilung zum Parameter λ. Anmerkung: Die Funktion ρλ mit ρλ (x) = λe−λx für x > 0 und ρλ (x) = 0 für x ≤ 0 ist eine Dichte der Verteilungsfunktion Fλ . Damit bekommt Curies Zerfallsgesetz eine probabilistische Form: Ein zur Zeit t0 vorliegender Kern mit der Zerfallsrate λ > 0 zerfällt mit der Wahrscheinlichkeit Fλ (t) vor der Zeit t0 + t. Figur 4.7 zeigt diese Zerfallswahrscheinlichkeit bis zur Zeit t0 + t als Funktion von x = λt in rot und die dazu komplementäre Überlebenswahrscheinlichkeit in grün. Achtung: Für t < 0 ist die Wahrscheinlichkeit, dass der Kern vor der Zeit t0 + t, also auch vor t0 zerfallen ist, gleich 0. Das erscheint plausibel, wenn ein Zerfall ein einmaliger, irreversibler Vorgang ist, hat aber wenig mit dem tatsächlichen Vorliegen des Kerns zu tun. y 1 0.75 0.5 0.25 0 0 1.25 2.5 3.75 5 x Abbildung 4.7: Exponentialverteilung F1 (rot) und 1 − F1 (grün) KAPITEL 4. WAHRSCHEINLICHKEIT 4.3.4 360 *Cauchyverteilung Die Gaußverteilung haben wir aus einer Dichtefunktion konstruiert. Umgekehrt bietet sich auch manch nichtnegative, beschränkte, monoton wachsende Funktion direkt als Verteilungsfunktion an. Die arctan - Funktion etwa ist monoton wachsend und bildet R auf (−π/2, π/2) bijektiv ab. Sie legt daher die folgende Konstruktion eines W-maßes auf R nahe. 0 ist Definition 201 Die Funktion F : R → (0, 1) mit F (x) = 12 + π1 arctan x−x δ 2 für jedes Paar (x0 , δ) ∈ R mit δ > 0 eine Verteilungsfunktion. Diese Verteilung auf R heißt Cauchy- oder auch Lorentzverteilung zu den Parametern x0 , δ. F hat wegen arctan′ (x) = ρ(x) = 1 1+x2 die Dichte ρ : R → R>0 mit 1 1 · δπ 1 + x−x0 δ 2 = 1 δ . · 2 π δ + (x − x0 )2 Die Dichte ρ ist maximal bei x = x0 mit ρ (x0 ) = 1/δπ. Der Parameter δ regelt die Breite von ρ, denn für |x − x0 | = δ gilt ρ (x) = ρ (x0 ) /2. Siehe Figur 4.8. Obwohl 0.8 0.6 0.4 0.2 -5 -2.5 0 2.5 5 Abbildung 4.8: Cauchyverteilung mit Dichte für δ = 1 und x0 = 0 jede Cauchyverteilung einer Gaußverteilung ähnlich sieht, bestehen im Detail doch erhebliche Unterschiede. Figur 4.9 vergleicht die Dichte der Lorenzverteilung mit δ = 1 und x0 = 0 mit der Dichte der Gaußverteilung für δ = π/2 und x0 = 0. Beide haben zwar bei x = 0 denselben Wert, die Gaußverteilung gibt jedoch größeren Werten von |x| weniger Gewicht. Dies lässt sich mit den Begriffen Erwartungswert und Varianz präzisieren. 4.3.5 Erwartungswert und Varianz Definition 202 Sei ρ : R → R Dichte eines W-Maßes auf R und f : R → R sei derart, dass die Funktionen |f | ρ und f 2 ρ über R uneigentlich riemannintegrierbar sind. Dann sind Erwartungswert f und Varianz V (f ) von f unter dem W-maß mit der Dichte ρ wie folgt definiert. ∞ & ' & ' f(x)ρ(x)dx und V (f ) := (f − f )2 = f 2 − f 2 . f := −∞ KAPITEL 4. WAHRSCHEINLICHKEIT 361 0.3 0.25 0.2 0.15 0.1 0.05 0 -5 -2.5 0 2.5 5 Abbildung 4.9: Dichte von Cauchy und Gaußverteilung Für eine Cauchyverteilung etwa existieren weder Erwartungswert noch Varianz der identischen Funktion. Satz 203 Für Erwartungswert und Varianz der stochastischen Variable X := idR unter der Gaußverteilung zu (δ, x0 ) gilt X = x0 und V (X) = δ 2 . Beweis. Es gilt X − x0 = 0, da der Integrand um x0 ungerade ist. Also gilt X = x0 . Die Varianz von X folgt dann mit α := 1/2δ 2 zu / ∞ & (x − x0 )2 − (x−x20 )2 α ∞ 2 −αx2 2' 2δ √ V (X) = (X − x0 ) = e dx = xe dx 2 π −∞ −∞ 2πδ / / ∞ α ∞ d −αx2 α d 2 = − e dx = − e−αx dx π dα π dα −∞ / / −∞ / 1 α √ −3/2 1 α d π = − = πα = = δ2. π dα α 2 π 2α Satz 204 Für Erwartungswert und Varianz der stochastischen Variable X := idR unter der Exponentialverteilung mit der Dichte ρλ (x) = λe−λx für x > 0 und ρλ (x) = 0 für x ≤ 0 gilt X = 1/λ und V (X) = 1/λ2 . Beweis. Wird in den Übungen ausgeführt. 4.3.6 Gleichverteilung auf Intervall Definition 205 Sei I ⊂ R ein Intervall. |I| bezeichne die Länge13 von I. Das WMaß W auf R, das dem Ereignis Ex := (−∞, x] die Wahrscheinlichkeit W (Ex) := |Ex ∩ I| / |I| zuordnet, heißt Gleichverteilung auf I. Satz 206 Sei W die Gleichverteilung auf I = (a, b). Dann gilt für die Verteilungsfunktion F von W für x < a 0 x−a für a ≤ x < b . F (x) = W (Ex ) = b−a 1 für b ≤ x 13 Also |(a, b)| := b − a KAPITEL 4. WAHRSCHEINLICHKEIT 362 1 F hat die Dichte ρ(x) = b−a für a < x < b und ρ(x) = 0 sonst. Für den Erwartungswert und die Varianz der stochastischen Variable X := idR gilt X = b+a und 2 V (X) = (b−a)2 . 12 Beweis. Für x ≤ a gilt (−∞, x] ∩ (a, b) = ∅ und daher F (x) = W (∅) = 0. Für a < x < b gilt (−∞, x] ∩ (a, b) = (a, x] und daher F (x) = W ((a, x]) = x−a . Für b−a x ≥ b gilt (−∞, x] ∩ (a, b) = (a, b) und daher F (x) = W ((a, b)) = 1. Die Formel x ρ (u) du F (x) = −∞ ist offensichtlich. Der Erwartungswert von X ergibt sich mit X = ∞ b xρ (x) dx = −∞ a 1 1 a+b x dx = b2 − a2 = . b−a 2b−a 2 Die Varianz von X ergibt sich mit der Substitution u = x − a+b 2 b 1 a+b 2 dx x− b−a a 2 −∞ ,(b−a)/2 (b−a)/2 1 2 u3 ,, 2 1 b−a 2 = u du = = , b − a −(b−a)/2 b−a 3 0 b−a3 2 ∞ V (X) = 4.3.7 x− a+b 2 2 ρ (x) dx = 3 = (b − a)2 . 12 W-Maße auf Rn und ihr Transport Ist U eine Kugel, ein Quader oder ähnliches im Rn , dann ist die Gleichverteilung auf U durch das W-maß W (A) := |U∩A| für A ⊂ Rn (messbar) definiert, wobei |X| |U | das euklidische Volumen einer (meßbaren) Menge X ⊂ Rn bezeichnet. Für n > 1 sind etwas allgemeinere W-maße durch eine integrable Dichte ρ : Rn → R mit ρ ≥ 0 und Rn ρ(x)dn x = 1 charakterisiert. Dann ist die Wahrscheinlichkeit W (A) des Ereignisses A ⊂ Rn (messbar) definiert durch ρ(x)dn x. W (A) = A Die Gleichverteilung auf U hat die Dichte ρ mit ρ (x) = 1/ |U | für x ∈ U und ρ (x) = 0 sonst. Sei f : Rn → R eine stochastische Variable. Falls |f| ρ und f 2 ρ über ganz Rn integrierbar sind, dann existieren Erwartungswert und Varianz von f unter W f W := Rn & f (x)ρ(x)dn x, und VW (f ) = (f − f 2 W) Der Transport Wf von W unter f ist analog zu Satz 176 durch Wf (A′ ) := W f −1 (A′ ) für A′ ⊂ R (messbar) ' W . KAPITEL 4. WAHRSCHEINLICHKEIT 363 definiert. Das W-maß Wf hat die Verteilungsfunktion Ff : R → R mit Ff (x) := W f −1 (−∞, x] . Falls Ff stetig und überall (außer möglicherweise in endlich vielen Stellen) differenzierbar ist, hat Ff eine Dichte ρf , die folgendermaßen gewählt werden kann: In den Differenzierbarkeitsstellen x von Ff sei ρf (x) = Ff′ (x) , in Punkten x, in denen Ff nicht differenzierbar ist, ist ρf (x) beliebig in R≥0 . Dann gilt nämlich x Ff (x) = −∞ ρf (u) du für alle x ∈ R. Falls der Erwartungswert von f n für ein n ∈ N unter W existiert, lässt er sich auch aus ρf durch 1-dim Integration berechnen: fn W = ∞ −∞ xn ρf (x) dx = (idR )n Wf . Gleichverteilung auf Rechteck Sei W die Gleichverteilung auf R = [0, 1] × [0, 1] und für die Funktion14 f : R2 → R gelte f (a, b) = a2 für alle (a, b) ∈ R. Ein Blick auf den Funktionsgraphen von f, siehe Figur (4.10), zeigt, dass bei gleichverteilter Ziehung von (a, b) Funktionswerte f (a, b) < 1/2 eher als Funktionswerte f (a, b) >√1/2 zu erwarten sind. Etwas genauer: Für 0 ≤ x ≤ 1 gilt f −1 ((−∞, x]) = [0, x] × [0, 1] . Daraus folgt für die Verteilungsfunktion von f , √ , √ Ff (x) = , 0, x × [0, 1], = x für 0 ≤ x ≤ 1. Für x < 0 gilt Ff (x) = 0 und für x > 1 gilt√Ff (x) = 1. (Siehe Figur 4.11) Für die Dichte ρf von Ff gilt ρf (x) = Ff′ (x) = 1/ (2 x) für 0 < x < 1 und ρf (x) = 0 sonst. √ Die Wahrscheinlichkeit von f (x) < 1/2 ist somit 1/ 2 ≈ 0.7, jene von f (x) > 1/2 √ ist dann 1 − 1/ 2 ≈ 0.3. Berechnen wir noch f n W . Es gilt 1 fn W 1 a2n da db = = 0 0 1 . 2n + 1 Für den Erwartungswert von f gilt somit f W = 1/3. Die Varianz von f ergibt sich 4 zu V (f ) = f 2 W − f 2W = 15 − 19 = 45 . Eine Kontrolle gibt ,1 ∞ 1 xn 1 1 1 n n n n+ 12 , √ dx = · f W = id Wf = ρf (x) x dx = . , = 1 x 2 n+ 2 0 2n + 1 −∞ 0 2 x Gleichverteilung auf Kreisscheibe Sei W die√Gleichverteilung auf KR = {(a, b) ∈ R2 |a2 + b2 ≤ R2 } für ein R > 0. Sei r (a, b) = a2 + b2 für (a, b) ∈ R2 . Für die Verteilungsfunktion Fr von Wr folgt dann für 0 ≤ x ≤ R Fr (x) = W ({p ∈ KR |r (p) ≤ x }) = 14 x x2 π = R2 π R Wie f außerhalb von R definiert ist, spielt im Folgenden keine Rolle. 2 . KAPITEL 4. WAHRSCHEINLICHKEIT 364 Abbildung 4.10: Graph von f und z = 1/2 1.25 1 0.75 0.5 0.25 0 -0.5 0 0.5 1 1.5 Abbildung 4.11: Ff und ρf (rot) für f (a, b) = a2 unter Gleichverteilung auf R Für x < 0 folgt Fr (x) = 0 und für x > R gilt Fr (x) = 1. Die Funktion ρr mit ρr (x) = 2x/R2 für 0 < x < R und ρr (x) = 0 sonst ist eine Dichte von Fr . Für den Erwartungswert von r gilt ,R 2π R 2π 1 1 1 3 ,, 2 2 r W = 2 ξ dξ dφ = 2 · ξ , · dφ = R. R π 0 R π 3 0 0 3 0 Kontrolle: R r W = idR Wr = 0 R ρr (x) xdx = Eine Gaußverteilung auf R2 0 2x 2 3 ,,R 2 xdx = x 0 = R. R2 3R2 3 Sei δ > 0. Die Funktion ρG : R2 → R mit ρG (a, b) = 1 − a2 +b2 2 e 2δ 2δ 2 π KAPITEL 4. WAHRSCHEINLICHKEIT 365 2 ist Dichte eines √ W-Maßes. Für die Verteilung der Betragsfunktion r = |·| : R → R mit |(a, b)| = a2 + b2 unter ρG ergibt sich für ξ ≥ 0 p ∈ R2 ||p| ≤ x Fr (x) = W x 2π 2δ 2 π = 2 − t2 2δ e = = 1−e t2 e− 2δ2 tdt dφ 0 √ x/ 2δ 2 2 2ue−u du = − 0 2 − x2 2δ 0 √ x/ 2δ 2 tdt = 0 x 2π 1 2δ 2 π 0 d −u2 e du du . x2 Für x < 0 gilt Fr (x) = 0. Die Funktion ρr mit ρr (x) = δx2 e− 2δ2 für x > 0 und ρr (x) = 0 für x < 0 ist eine Dichte von Fr . Damit ergibt sich der Erwartungswert der Betragsfunktion r unter ρG zu r ∞ = 0 xρr (x) dx = ∞ 0 x2 − x22 e 2δ dx = δ2 2 − x2 2δ ∞ −∞ ∞ π πδ 2 2 e √ √ √ = x dx = = 2δ 2 π −∞ 2δ 2 π 2δ 2 π Für den Erwartungswert von r2 folgt ∞ ∞ 3 & 2' x − x22 2 2δ dx = 2δ r x2 ρr (x) dx = = 2e δ 0 0 = 2δ 2 Das Ergebnis r & 2' = r ∞ x2 − x22 e 2δ dx 2δ2 πδ 2 . 2 ∞ 0 x2 − x22 2xdx e 2δ 2δ 2 2δ 2 te−t dt = 2δ 2 . 0 2 2 = 2δ ist auch ganz einfach mit 2d Integration über ρG zu erhalten: x2 + y 2 R2 ∞ − x2 e− 2δ2 x2 √ 2 dx −∞ 2δ π ∞ 1 − x2 +y2 2 e 2δ dxdy = 2 2δ 2 π x2 2δ 2 ∞ −∞ y2 e− 2δ2 √ dy 2δ 2 π e x2 √ 2 dx = 2δ 2 . −∞ 2δ π Für die Varianz von r gilt somit V (r) = (2 − π/2) δ 2 . = 2 Eine Gaußverteilung auf R3 Sei δ > 0. Die Funktion ρG : R3 → R mit ρG (v) = 1 2δ 2 π |v|2 e− 2δ2 3/2 ist Dichte eines W-Maßes. Für die Verteilung Fr der Betragsfunktion r = |·| : R3 → R unter ρG folgt für x ≥ 0 Fr (x) = W = v ∈ R3 ||v| ≤ x x 4π 2δ 2 π 3/2 0 = 2δ 2 π t2 4 e− 2δ2 t2 dt = √ π π 2π 1 dφ 3/2 x/2δ 0 0 2 2 e−u u2 du. 0 x sin θdθ 0 t2 e− 2δ2 t2 dt KAPITEL 4. WAHRSCHEINLICHKEIT 366 Für x < 0 gilt Fr (x) = 0. Die Funktion15 ρr : R → R mit ρr (x) = x > 0 und ρr (x) = 0 für x < 0 ist eine Dichte von Fr . 0 ∞ 4π xρr (x) dx = 2δ 2 π = 2 3/2 2δ 2 π 0 ∞ 0 x2 4 x3 e− 2δ2 dx = √ π te−t dt = −2 2δ 2 π 3/2 (2δ2 π) e− 2δ2 für 8δ 2 /π, denn Für den Erwartungswert von r unter ρG gilt r = ∞ x2 4πx2 ∞ 2δ 2 2 u3 e−u du 0 ∞ 2δ 2 . π ′ t e−t dt = 2 0 Für den Erwartungswert von r2 gilt analog zum 2d Fall r2 = 3δ 2 . Mit der Dichte ρr folgt dies auch mithilfe der Gammafunktion, da ∞ 0 5 2 = 32 Γ 3 2 = 31 Γ 22 3/2 2 2δ π 4δ 2 = √ π Mit Γ ∞ 4π x2 ρr (x) dx = 1 2 0 x2 4 x4 e− 2δ2 dx = √ 2δ 2 π 4δ 2 5 t3/2 e−t dt = √ Γ π 2 0 √ = 34 π folgt schließlich ∞ ∞ 0 ∞ 2 u4 e−u du 0 . x2 ρr (x) dx = 3δ 2 . Die Varianz von r ergibt sich somit zu V (r) = (3 − 8/π) δ 2 . Gleichverteilung am Halbkreis Hier ein Beispiel, das eine Cauchyverteilung aus einer Gleichverteilung erzeugt. Der Halbstrahl R>0 · (cos φ, sin φ) ⊂ R2 mit − π2 < φ < π2 schneidet die Gerade (δ, 0) + R · (0, 1) mit δ > 0 im Punkt S = (δ, δ tan φ) . Siehe Figur 4.12. Ist auf dem Winkelintervall − π2 < φ < π2 eine Gleichverteilung gegeben, so gilt für die Wahrscheinlichkeit des Ereignisses φ ∈ − π2 , π2 : δ · tan φ < y , π , , − , arctan y , 1 1 y 2 δ W ({φ : δ · tan φ < y}) = = + arctan . π 2 π δ Die y-Koordinate des Schnittpunkts S ist also Cauchy-verteilt. Moral: Der Transport der Gleichverteilung auf − π2 , π2 mit der Funktion δ · tan ergibt eine Cauchyverteilung. In der Physik tritt Fr mit δ 2 = kT/m als Maxwells thermische Geschwindigkeitsverteilung eines einzelnen Teilchens von einem Massenpunktgas der Temperatur T auf. Der Erwartungswert der kinetischen Energie m |v|2 /2 des Teilchens ergibt sich zu 3kT/2. Da die Geschwindigkeiten aller Teilchen voneinander unabhängig verteilt sind, gilt für die Zahl N (x) der Teilchen mit |v| < x, dass N (x) /Nges ≈ Fr (x) . 15 KAPITEL 4. WAHRSCHEINLICHKEIT 367 Abbildung 4.12: Halbstrahl schneidet achsenparallele Gerade Gleichverteilung am Intervall Ein Auto fährt mit der Geschwindigkeit v und ist zu einer Vollbremsung gezwungen. Für seinen Bremsweg s gilt bei einer konstanten Bremsbeschleunigung b, dass s = v2 . Die für eine Vollbremsung zur Verfügung stehende Bremsbeschleunigung eines 2b zufällig herausgegriffenen Autos sei im Intervall I := [b1 , b2 ] ⊂ R>0 gleichverteilt. Unter diesen Annahmen sollen die folgenden Größen berechnet werden. 1. Der Erwartungswert s des Bremsweges für v = 30 m/ s und b1 = 4 m/ s2 und b2 = 8 m/ s2 . 2. Die Verteilungsfunktion des Bremsweges und ihre Dichte. (Graphen) 3. Für v = 30 m/ s und b1 = 4 m/ s2 und b2 = 8 m/ s2 die Wahrscheinlichkeit, dass ein zufällig herausgegriffenes Auto einen Bremsweg hat, der kleiner als s ist. Der Bremsweg ist am Intervall I der möglichen Werte von b durch die streng monoton fallende Funktion s : I → R, b→ v2 2b s 112.5 100 87.5 75 62.5 4 5 6 7 8 b Die Funktion s KAPITEL 4. WAHRSCHEINLICHKEIT 368 gegeben. Sie fällt von s1 := s(b1 ) = 112, 5 m auf s2 := s(b2 ) = 56, 25 m ab. Ihr Erwartungswert unter der Gleichverteilung ist b2 s b2 s(b)db db v2 = 2 (b2 − b1 ) b1 b b1 b2 − b1 v2 b2 900 = = ln ln (2) ≈ 87 m. 2 (b2 − b1 ) b1 8 = Beachte, dass s nicht mit s( id ) = s(6 m s−2 ) = 75 m übereinstimmt. Für die Verteilungsfunktion Fs von s gilt für x ≤ s2 0 −1 b2 −s (x) Fs (x) = W ({b | s(b) ≤ x}) = für s2 < x < s1 b2 −b1 1 für s1 ≤ x 0 2 für x ≤ s2 b2 − v2x = für s2 < x < s1 b2 −b1 1 für s1 ≤ x für x ≤ s2 0 s2 s1 1− x für s2 < x < s1 . = s1 −s2 1 für s1 ≤ x Einsetzen der Zahlenwerte ergibt bei Verwendung der Einheit Meter für den Bremsweg x für x ≤ 56, 25 0 für 56, 25 < x < 112, 5 . Fs (x) = 2 1 − 56,25 x 1 für 112, 5 ≤ x F 1 0.75 0.5 0.25 0 50 75 100 125 x Die Verteilung von s Die Dichte ρs der Verteilung ist für alle x ∈ R {s2 , s1 } durch die Ableitung ρs (x) = Fs′ (x) gegeben. In den Ausnahmepunkten kann sie beliebig gewählt werden. Wir wählen den Wert 0. Daraus folgt ρs (x) = = s1 s2 s1 −s2 0 s1 · 0 · 1 x2 1 x2 für s2 < x < s1 sonst für s2 < x < s1 . sonst KAPITEL 4. WAHRSCHEINLICHKEIT 369 rho 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 40 60 80 100 120 x Die Dichte von s Die Wahrscheinlichkeit, dass der Bremsweg eines Autos kleiner als s ist, ergibt 1 1 sich aus der Verteilungsfunktion zu Fs ( s ) = s1s−s 1 − ss2 = 2 − ln(2) ≈ 0, 56. 2 4.4 Übungsbeispiele 1. Sei Ω = {a, b, c}. Geben Sie die Potenzmenge von Ω an. Wieviele Elemente enthält sie? Geben Sie ein Beispiel für ein Wahrscheinlichkeitsmaß auf Ω. 2. Wieviele Elemente enthält die Potenzmenge einer Menge Ω, die aus n Elementen besteht? 3. In einer Schachtel sind 2n Kugeln. Sie sind von 1 bis 2n durchnummeriert. Die Kugeln mit den Nummern 1, . . . n sind rot und jene mit den Nummern n + 1, . . . 2n sind grün. Es wird erst eine und dann noch eine Kugel wahllos aus der Schachtel gezogen, ohne dass die erste zuvor in die Schachtel zurückgelegt wird. (a) Überlegen Sie, dass der Ereignisraum dieses Vorgangs die Menge Ω ist. Ω = {(i, j) | i, j ∈ {1, . . . 2n} und i = j} Wieviele Elemente hat Ω? (b) Berechnen Sie zur Gleichverteilung W auf Ω die Wahrscheinlichkeit W (A) des Ereignisses A, dass beide Kugeln dieselbe Farbe haben. Ist diese Wahrscheinlichkeit kleiner als 1/2? (c) Zeigen Sie, dass limn→∞ W (A) = 1/2. (d) Sei B das Ereignis, dass die zuerst gezogene Kugel rot ist, und sei C das Ereignis, dass die zweitgezogene Kugel rot ist. Sind diese beiden Ereignisse stochastisch unabhängig? Untersuchen Sie also ob W (B ∩ C) = W (B) W (C) . KAPITEL 4. WAHRSCHEINLICHKEIT 370 4. In einem Becher sind zwei unterscheidbare, ungezinkte Würfel. Der Becher wird geschüttelt und auf ein Tablett geleert. Ein Elementarereignis dieses Spiels ist somit ein Paar (i, j) von Augenzahlen i, j ∈ {1, .., 6}. (a) Geben Sie für den Wahrscheinlichkeitsraum (Ω, W ) dieses Würfelspiels die Werte der Wahrscheinlichkeitsfunktion p(ω) := W ({ω}) für alle ω ∈ Ω an. (b) Die Teilmenge A ⊂ Ω steht für das Ereignis „Mindestens eine der gewürfelten Augenzahlen ist 1 oder prim”? Welche Wahrscheinlichkeit hat A? (c) B ⊂ Ω steht für: ”Die Summe der Augenzahlen ist größer als 11”. Sind A und B stochastisch unabhängig, d. h. gilt W (A ∩ B) = W (A)W (B)? (d) Sei f : Ω → R, (i, j) → i + j. Berechnen Sie den Erwartungswert und die Varianz von f : & ' p (ω) f (ω), V (f ) = f 2 W − f 2W . f W = ω∈Ω (e) Geben Sie für den Transport16 Wf von W mit f die Wahrscheinlichkeitsfunktion pf auf f(Ω) an. Berechnen Sie also für jedes x ∈ f(Ω) die Zahl pf (x) := W ({ω ∈ Ω | f (ω) = x}) =? Zeigen Sie f W = x∈f (Ω) xpf (x). 5. Beantworten Sie die Frage 4a) für zwei ununterscheidbare, ungezinkte Würfel. Liegt wie in 4a) eine Gleichverteilung vor? 6. Ein ungezinkter Würfel wird n mal geworfen. Wie groß ist die Wahrscheinlichkeit, dass die ersten k Würfe eine 6 und die restlichen Würfe keine einzige 6 ergeben? Welcher Wert ergibt sich für n = 600 und k = 100? 7. Welchen Wahrscheinlichkeitsraum hat das Lotto Sechs aus 45 ? Welche Wahrscheinlichkeit hat ein Elementarereignis? Hinweis: Eine Ziehung ist eine injektive17 Abbildung f : {1, 2, . . . 6} → {1, 2, . . . 45}. Wieviele solche Abbildungen gibt es? Sind f und g zwei solche Abbildungen mit g ({1, 2, . . . 6}) = f ({1, 2, . . . 6}), dann werden sie als dasselbe Zufallsereignis aufgefasst, da die Reihenfolge der gezogenen Zahlen ignoriert wird. Wieviele sechselementige Teilmengen hat also {1, 2, .., 45}? Für N, k ∈ N0 , k ≤ N heißen die Zahlen N k := N! k! (N − k)! Binomialkoeffizienten18 . Für k ∈ N ist k! := k(k − 1) . . . 1 und 0! := 1. 16 Es gilt für jedes A ⊂ f (Ω) dass Wf (A) = W f −1 (A) , wobei f −1 (A) = {ω ∈ Ω | f(ω) ∈ A}. Eine Abbildung f : X → Y heißt injektiv, falls für alle a, b ∈ X mit a = b gilt: f (a) = f (b). 18 Es gilt 17 N (x + y)N = k=0 N k xk y N−k KAPITEL 4. WAHRSCHEINLICHKEIT 371 8. Ein ungezinkter Würfel wird n mal geworfen. Wie groß ist die Wahrscheinlichkeit, dass genau k Würfe eine 6 werfen? Welchen Wert hat sie für n = 600 und k = 100? 9. Ein Signalprozessor liest eine Folge aus Nullen und Einsen. Die Wahrscheinlichkeit, dass er ein Zeichen falsch liest sei 0, 05. Wie groß ist die Wahrscheinlichkeit, dass er beim Lesen einer Folge von 39 Zeichen mindestens 7 Zeichen falsch liest? 10. Ein instabiler Atomkern sei nach Ablauf der Zeitspanne τ mit der Wahrscheinlichkeit x ∈ [0, 1] zerfallen. Der W-raum (Ω, W ) dieses Versuchs ist Ω = {0, 1} mit dem W-maß W , für das W ({1}) = x gilt. Die Zahl 1 steht also für das Elementarereignis ”Der Kern ist zerfallen”. (a) Welchen Erwartungswert und welche Varianz hat Z : Ω → R, ω → ω? (b) Wenn N unterscheidbare Kerne sich gegenseitig nicht beeinflussen, hat der Zufallsversuch ”Welche der N Kerne zerfallen innerhalb einer Sekunde?” den W-raum (ΩN , WN ) mit ΩN := ΩN und WN (A1 × .. × AN ) := N D W (Ai ). i=1 Die Zahl der in einem Elementarereignis (ω 1 , .., ω N ) ∈ ΩN zerfallenen Kerne wird von der stochastischen Variablen ZN : ΩN → R mit N ZN (ω 1 , .., ω N ) := Z(ω i ) i=1 angegeben. Welchen Erwartungswert und welche Varianz hat ZN ? (c) Zeigen Sie, dass der Transport von WN mit ZN die Binomialverteilung auf {0, 1, .., N} ist. Es gilt für k ∈ {0, 1, .., N } WN (ZN−1 ({k})) = Bi (k; N, x) := xk (1 − x)N−k N! . (N − k)!k! Die Abbildungen 1 und 2 zeigen die Binomialverteilung k → WN (ZN−1 ({k})) für N = 10 und N = 100 und x = 1/3 und x = 2/3. (d) Sei nun x = 10−3 . Welchen Wert hat die Wahrscheinlichkeit, dass von N = 103 Kernen innerhalb von einer Sekunde mehr als 2 (bzw. 3) zerfallen? Hinweis: Berechnen Sie zunächst die Wahrscheinlichkeit des komplementären Ereignisses. KAPITEL 4. WAHRSCHEINLICHKEIT 372 N=10, x=1/3 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 k 7 8 9 10 k N=10, x=2/3 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 Abbildung 4.13: N=100, x=1/3 0.1 0.05 0 0 20 40 60 80 k N=100, x=2/3 0.1 0.05 0 0 20 40 60 Abbildung 4.14: 80 k KAPITEL 4. WAHRSCHEINLICHKEIT 373 (e) Kontrollieren Sie Ihr Ergebnis für d) an der Chebyshev Ungleichung19 . 11. Die Wahrscheinlichkeit x, dass ein Atomkern während einer Zeitspanne der Dauer τ > 0 zerfällt, sei für hinreichend kleine τ durch γτ gegeben. Dabei sei γ > 0 und γτ ≪ 1. (a) Der Kern wird für ein n ∈ N über eine Zeitspanne der Dauer nτ beobachtet. Falls der Kern zerfällt, wird festgestellt, in welchem der n Teilintervalle der Dauer τ er zerfällt. Mit welcher Wahrscheinlichkeit zerfällt er im k-ten Zeitintervall? (b) Sei P (t) die Wahrscheinlichkeit, dass der Kern ein Zeitintervall der Dauer t > 0 überlebt. Zeigen Sie, dass lim P (t) = e−γt . τ →0 Hinweis: Überlegen Sie, dass limτ →0 P (t) = limn→∞ P t n n . 12. Geometrische Verteilung zum Parameter x : Ein instabiler Atomkern, zerfalle unabhängig von seinem Alter in einer Sekunde mit der Wahrscheinlichkeit (1 − x) ∈ ]0, 1[. Die Wahrscheinlichkeit, dass er n ∈ N0 Sekunden überlebt und dann bis zum Zeitpunkt n + 1 zerfällt, ist p(n) := W ({n}) := xn (1 − x). Seine Lebensdauer ist also in diesem diskreten Modell geometrisch verteilt. Es ist, als würde der Kern, so lange er lebt, jede Sekunde eine Münze werfen, die über sein Leben entscheidet. Wenn er zum ersten Mal „Tod” wirft, ist sein Zufallsexperiment beendet. (a) Sei N ∈ N0 gegeben. Mit welcher Wahrscheinlichkeit zerfällt der Kern vor der Zeit N + 1? Gilt W (N0 ) = 1? (b) Die stochastische Variable τ := idN0 heißt Lebensdauer. Welchen Erwartungswert und welche Varianz hat τ ? Hinweis: ∞ n=0 nxn = x d dx ∞ n=0 xn und ∞ n=0 n(n − 1)xn = x2 d2 dx2 ∞ xn n=0 (c) Skizzieren Sie den Graphen der Verteilung p (von τ ). (d) Seien M, m ∈ N0 gegeben. Mit welcher Wahrscheinlichkeit zerfällt ein Kern, der in einem Intervall n ≥ M zerfällt, in irgendeinem Intervall mit n < M + m? Hinweis: Die bedingte Wahrscheinlichkeit W (A | B) = W (A∩B) für A = {n ∈ N0 | n < M + m} und B = {n ∈ N0 | n ≥ M } ist W (B) zu ermitteln. 19 Für eine reelle stochastische Variable f auf einem endlichen Wahrscheinlichkeitsraum (Ω, W ) gilt W ({ω ∈ Ω : |f(ω) − f | ≥ t}) ≤ V (f)t−2 . KAPITEL 4. WAHRSCHEINLICHKEIT 374 (e) Seien M, m ∈ N0 . Mit welcher Wahrscheinlichkeit zerfällt ein Kern in irgendeinem Intervall n mit M ≤ n < M +m? Sind A und B stochastisch unabhängig? Hinweis: W (A ∩ B) =? 13. Für Unausgelastete eine Brücke von Beispiel 12 hin zur Physik mit einer kleinen Fingerübung in Sachen Limesberechnung und Kettenregel. Das Beispiel zählt nicht zum PS-Stoff, Sie sollten es aber benützen, um Ihr Wissen aus MfP zu festigen. Im thermischen Gleichgewichtszustand eines elektromagnetischen Hohlraumresonators mit einer Schwingungsmode der Frequenz ν ist die Zahl n der Phohν ). tonen in dieser Mode geometrisch verteilt mit Parameter x = exp(− kT (T ...Temperatur, h...Plancksche Konstante, k...Boltzmannkonstante) Kontrollieren Sie, dass sich die Funktion T → n für T → ∞ an eine lineare Funktion annähert. Zeigen Sie auch, dass diese Funktion für T → 0 stärker als T gegen 0 geht. Hinweis: Zeigen Sie, dass die Funktion F : R>0 → R>0 , Θ := kT 1 → n /Θ = hν Θ exp (1/Θ) − Θ für Θ → ∞ gegen 1 und für Θ → 0 gegen 0 konvergiert20 . Die Größe Θ ist eine dimensionslose, problemangepasste Temperaturvariable. Zeigen Sie weiter, dass für die Ableitung G′ der Funktion G(Θ) := ΘF (Θ) = n gilt G′ (Θ) = 2Θ sinh 1 2Θ −2 . G′ ist der Beitrag der betrachteten Mode zur spezifischen Wärme des Hohlraumresonators. Berechnen Sie die Limiten von G′ (Θ) für Θ → 0 und Θ → ∞. 0.75 0.5 0.25 0 1.25 2.5 3.75 5 Die Graphen von F (durchgezogen) und von G′ (strichliert) 20 Es gilt sogar für alle m ∈ N, dass limΘ→0 n /Θm = 0. KAPITEL 4. WAHRSCHEINLICHKEIT 375 0.5 0.375 0.25 0.125 0 0.25 0.5 0.75 1 Der Graph von G 14. Ein ungezinkter Würfel wird n mal geworfen. Die Funktion 1 f : {1, . . . 6} → R mit f (ω 1 , . . . ω n ) = n n n ωi i=1 gibt den Mittelwert der Augenzahlen einer Wurffolge an. Welchen Erwartungswert und welche Varianz hat die Funktion f ? Lösung: der Erwartungswert ist 7/2 und die Varianz ist 35/12n. Schätzen Sie im Fall n = 100 mit der Cehbyshevungleichung die Wahrscheinlichkeit ab, einen Mittelwert kleiner gleich 3 oder größer gleich 4 zu erwürfeln. Lösung: W < 11, 7%. Welchen Erwartungswert und welche Varianz hat das Produkt der geworfenen Augenzahlen bei n Würfen? Lösung: der Erwartungswert ist (7/2)n und die Varianz ist (7 · 13/6)n − (7/2)2n . Beachte: 7 · 13/6 > (7/2)2 . 15. Ein Zufallsexperiment hat die zwei möglichen Ausgänge A und B. Die Wahrscheinlichkeit des Ausganges B sei x. Wird das Experiment N mal wiederholt, dann bezeichnet NB die Anzahl der Experimente mit Ausgang B. Die Chebyshevungleichung zu NB gibt eine obere Schranke für die Wahrscheinlichkeit an, dass die Häufigkeit des Ausgangs B, nämlich NB /N , von x um mehr als εx abweicht. (ε > 0) Berechnen Sie diese Schranke für N = 1022 , x = 10−3 und ε = 10−3 . 16. Die Poissonverteilung zum Parameter δ ∈ R>0 ist der W -raum (N0 , W ) mit pδ : N0 → R, Rechnen Sie nach: δ n exp(−δ) . n → W ({n}) = n! 21 (a) W (N0 ) = 1, W (2 · N0 ) = e−δ cosh(δ) > 1/2, W (2 · N0 + 1) = e−δ sinh(δ). (b) idN0 = δ. (c) V (idN0 ) = δ, Hinweis: differenzieren Sie b) nach δ. 21 2 · N0 := {2n | n ∈ N0 } KAPITEL 4. WAHRSCHEINLICHKEIT 376 (d) Für f : N0 → R, n → (−1)n gilt f = e−2δ , V (f) = 1 − e−4δ . (e) f · idN0 = −δe−2δ . Sind f und idN0 unter W stochastisch unabhängig? Die Abbildung zeigt den Graphen von pδ für δ = 10 (durchgezogen) und für δ = 1. 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 5 10 15 20 25 17. In einer Stadt wie Innsbruck kommen täglich im Mittel 5, 5 Kinder zur Welt. Die Wahrscheinlichkeit, dass an einem Tag n ∈ N0 Kinder geboren werden, ist dann (etwas idealisierend) poissonverteilt mit δ = 5, 5. Wie groß ist die Wahrscheinlichkeit dafür, dass an einem bestimmten Tag mehr als 10 Kinder geboren werden? Wie groß ist die Wahrscheinlichkeit, dass kein Kind geboren wird?22 18. Ein harmonischer Oszillator habe zur Zeit t die Auslenkung f (t) = A sin ωt mit A, ω ∈ R>0 . Wird die Zeit t gleichverteilt aus dem Intervall − T2 , T2 mit T = 2π/ω gewählt, so hat die zu dieser Zufallszeit vorliegende Auslenkung f (t) die Verteilungsfunktion Ff . Zeigen Sie, dass für x < −A 0 x arcsin( A ) 1 Ff (x) = + für − A ≤ x ≤ A . π 12 für x > A Zeigen Sie für die Dichte von Ff , dass Ff′ (x) = π√A12 −x2 für −A < x < A. Figur 4.15 zeigt den Fall A = 1. Wie groß ist die Wahrscheinlichkeit von |f (t)| /A < T 10−1 und jene von |f (t)| /A > 1 − 10−1 ? Zeigen Sie für |f| = T1 0 |f (t)| dt |f | = 2 A= π A −A Ff′ (x) |x| dx. 19. Die Exponentialverteilung ist ein W-maß W auf R. Sie hat die Dichte ρ(x) = λ exp (−λx) mit λ > 0 für x > 0 und ρ(x) = 0 sonst. 22 Ersetzen Sie Geburt durch Zerfall, dann haben Sie die Poissonverteilung der Zahl der Zerfälle einer (makroskopischen) radioaktiven Probe in einer Zeitspanne, die viel kleiner als die Halbwertszeit ist. KAPITEL 4. WAHRSCHEINLICHKEIT 377 1.25 1 0.75 0.5 0.25 0 -1.5 -1 -0.5 0 0.5 1 1.5 Abbildung 4.15: Verteilung und Dichte (rot) der Auslenkung (a) Berechnen Sie die Verteilungsfunktion F : R → R mit x → W ((−∞, x]) von W. Zeigen Sie, dass lim F (x) = 0, x→0 lim F (x) = 1. x→∞ Skizzieren Sie die Graphen von F und F ′ . (b) Zeigen Sie durch Induktion nach n für den Erwartungswert der stochastischen Variablen Xn := (idΩ )n mit n ∈ N0 , dass Xn = n!/λn . (c) Welche Verteilungsfunktion Ff : R → R und Dichte Ff′ hat der Transport Wf von W unter der stochastischen Variablen f := |X1 | : R → R? Lösung: 0 1 Ff (ξ) : = Wf ((−∞, ξ]) = W x ∈ R | |x| ≤ ξ = 0 1 − exp −λξ 2 für ξ ≤ 0 . für ξ > 0 Skizzieren Sie die Graphen von Ff und Ff′ . (d) Sei L > 0, das Ereignis B = (L, ∞) und WB das konditionelle W-maß zu ′ B. Welche Verteilungsfunktion Fg,B und Dichte Fg,B hat die stochastische Variable g := X1 − L : R → R unter WB ? Hinweis: Fg,B (ξ) := (WB )g ((−∞, ξ]) = W (g −1 ((−∞, ξ]) ∩ B) W (B) (e) Welche bedingte Wahrscheinlichkeit W (A | B) hat das Ereignis A = (0, L1 ) bezüglich B = (0, L2 )? Sind A und B stochastisch unabhängig? KAPITEL 4. WAHRSCHEINLICHKEIT 378 20. Das W-maß W auf R3 , sei für ein R > 0 in der Kugel KR := (x, y, z) ∈ R3 | x2 + y 2 + z 2 < R2 gleichverteilt. (a) Welche Verteilungsfunktion Fr : R → R und Dichte Fr′ hat der Transport Wr von W unter der stochastischen Variablen r : R3 → R, (x, y, z) → x2 + y 2 + z 2 . Lösung: Fr (ξ) := W r −1 ((−∞, ξ]) = (b) Zeigen Sie, dass ∞ r W := 3 Fr′ (ξ) ξdξ = R, 4 0 ξ 3 R 1 für ξ ≤ 0 für 0 < ξ < R . für ξ ≥ R VW (r) = 3R2 80 −∞ (c) Welche Verteilungsfunktion Fπ1 hat der Transport von W unter π 1 : R3 → R, (x, y, z) → x? 21. Der Abstand r zwischen Kern und Elektron eines H-Atoms ist eine (nichtnegative) reelle stochastische Variable auf R3 . Sie hat im Grundzustand die Verteilungsfunktion F : R>0 → R mit x F (x) := ρ(ξ)dξ, ρ(x) := Nx2 exp(−x). 0 (Hier ist der halbe Bohrsche Radius als Längeneinheit gewählt.) N ∈ R (a) N =? Hinweis: limx→∞ F (x) = 1. (b) Skizzieren Sie die Graphen von F und ρ. (c) r =?, V (r) =? Literaturverzeichnis [1] V. I. Arnold, Gewöhnliche Differentialgleichungen, Springer, Berlin, 1979 [2] H. Dehling, B. Haupt, Einführung in die Wahrscheinlichkeitstheorie und Statistik, Springer, Berlin, 2004 [3] F. Erwe, Differential- und Integralrechnung, Vol. 1,2, BI, Mannheim, 1962 [4] H. Fischer, H. Kaul, Mathematik für Physiker, Vol.1, 2, 3, Teubner, Stuttgart, 1998-2006 [5] O. Forster, Analysis 1, Vieweg, Braunschweig, 1983 [6] O. Forster, Analysis 2, Vieweg, Braunschweig, 1984 [7] O. Forster, Analysis 3, Vieweg, Braunschweig, 1984 [8] L. Garding, Encounter with Mathematics, Springer, Berlin, 1977 [9] K. Jänich, Vektoranalysis, Springer, Berlin, 1993 [10] K. Jänich, Mathematik 1 Geschrieben für Physiker, Springer, Berlin, 2001 [11] K. Jänich, Mathematik 2 Geschrieben für Physiker, Springer, Berlin, 2002 [12] K. Jänich, Analysis für Physiker und Ingenieure, Springer, Berlin, 2001 [13] T. W. Körner, Fourier Analysis, Cambridge UP, Cambridge, 1988 [14] W. Neutsch, Koordinaten, Spektrum, Heidelberg, 1995 [15] F. Pauer, Mathematik für Physiker 1, Skriptum WS99/00, Universität Innsbruck [16] L. Rade, B. Westergren, Springers mathematische Formeln, Springer, Berlin, 1996 [17] G. F. Simmons, Calculus Gems, The Mathematical Association of Amerika (Inc), 2007 [18] W. Walter, Gewöhnliche Differentialgleichungen, Springer, Berlin, 2000 379