Skriptum zur Vorlesung Einführung in die Physikalischen Rechenmethoden I + II Univ. Prof. Dr. Christoph Dellago Universität Wien Fakultät für Physik Institut für Experimentalphysik Boltzmanngasse 5, 1090 Wien [email protected] http://comp-phys.univie.ac.at Literatur Lehrbücher - George Arfken, Mathematical Methods for Physicists, Academic Press, San Diego (1985). - Siegfried Großmann, Mathematischer Einführungskurs für die Physik, Teubner, Stuttgart (1974). - Sadri Hassani, Mathematical Methods for Students of Physics and Related Fields, SpringerVerlag, New York (2000). - Helmuth Horvath, Rechenmethoden und ihre Anwendungen in Physik und Chemie, Bibliographisches Institut, Mannheim, Wien, Zürich (1977). - May-Britt Kallenrode, Rechenmethoden der Physik, Springer-Verlag, Berlin (2003). - Klaus Weltner, Mathematik für Physiker I und II, Springer-Verlag, Berlin (2001). - Helmut Fischer und Helmut Kaul, Mathematik für Physiker, Teubner, Stuttgart (1988). - Gerhard Berendt und Evelyn Weimar, Mathematik für Physiker, Physik-Verlag, Weinheim (1979). Formelsammlungen - Johann Rast (Heinrich Netz), Formeln der Mathematik, Carl Hanser Verlag, München, Wien (1983). - Hans-Jochen Bartsch, Taschenbuch Mathematischer Formeln, Fachbuchverlag Leipzig (2004). - Ilja N. Bronstein, Konstantin A. Semendjajew, Gerhard Musiol, Taschenbuch der Mathematik, Verlag Harri Deutsch, Frankfurt am Main (2000). Web-Ressourcen - http://mathworld.wolfram.com - http://www.mathe-online.at 3 4 Inhaltsverzeichnis I Einführung in die Physikalischen Rechenmethoden I 1 Funktionen 1.1 Der Funktionsbegriff . . . . . . . . . . . 1.2 Darstellung von Funktionen . . . . . . . 1.2.1 Analytische Darstellung . . . . . 1.2.2 Funktionstafel (Wertetabelle) . . 1.2.3 Graphische Darstellung . . . . . 1.3 Eigenschaften von Funktionen . . . . . . 1.3.1 Definitionsbereich . . . . . . . . 1.3.2 Nullstellen . . . . . . . . . . . . . 1.3.3 Gerade und ungerade Funktionen 1.3.4 Monotonie . . . . . . . . . . . . . 1.3.5 Grenzwert . . . . . . . . . . . . . 1.3.6 Stetigkeit . . . . . . . . . . . . . 1.3.7 Singularitäten . . . . . . . . . . . 1.4 Neue Funktionen aus alten . . . . . . . . 1.4.1 Verkettung von Funktionen . . . 1.4.2 Umkehrfunktion . . . . . . . . . 1.5 Wichtige Funktionen . . . . . . . . . . . 1.5.1 Lineare Funktionen . . . . . . . . 1.5.2 Potenzfunktionen . . . . . . . . . 1.5.3 Exponentialfunktion . . . . . . . 1.5.4 Logarithmus . . . . . . . . . . . 1.5.5 Winkelfunktionen . . . . . . . . . 1.5.6 Arcusfunktionen . . . . . . . . . 1.5.7 Hyperbolische Funktionen . . . . 1.5.8 Areafunktionen . . . . . . . . . . 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 12 12 13 13 14 14 14 14 15 15 16 17 18 18 19 21 21 22 24 26 27 30 32 33 2 Vektoren 2.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . 2.2 Koordinatensysteme . . . . . . . . . . . . . . . . . . 2.2.1 Kartesische Koordinaten . . . . . . . . . . . . 2.2.2 Polarkoordinaten . . . . . . . . . . . . . . . . 2.2.3 Zylinderkoordinaten . . . . . . . . . . . . . . 2.2.4 Kugelkoordinaten . . . . . . . . . . . . . . . . 2.3 Vektoralgebra . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Gleiche, inverse und parallele Vektoren . . . . 2.3.2 Vektoraddition und -subtraktion . . . . . . . 2.3.3 Multiplikation eines Vektors mit einem Skalar 2.4 Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Definition . . . . . . . . . . . . . . . . . . . . 2.4.2 Rechenregeln . . . . . . . . . . . . . . . . . . 2.4.3 Komponentenweise Darstellung . . . . . . . . 2.4.4 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 35 37 37 38 42 43 44 44 45 47 48 48 48 50 50 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 INHALTSVERZEICHNIS 2.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 54 58 59 59 59 60 60 61 61 61 62 64 3 Differentiation 3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . 3.2 Differenzierbarkeit . . . . . . . . . . . . . . . . . 3.3 Wichtige Ableitungen . . . . . . . . . . . . . . . 3.4 Differentiationsregeln . . . . . . . . . . . . . . . . 3.4.1 Faktorregel . . . . . . . . . . . . . . . . . 3.4.2 Summenregel . . . . . . . . . . . . . . . . 3.4.3 Produktregel . . . . . . . . . . . . . . . . 3.4.4 Quotientenregel . . . . . . . . . . . . . . . 3.4.5 Kettenregel . . . . . . . . . . . . . . . . . 3.4.6 Umkehrregel . . . . . . . . . . . . . . . . 3.5 Höhere Ableitungen . . . . . . . . . . . . . . . . 3.6 Maxima und Minima von Funktionen . . . . . . . 3.7 Differentiation von Funktionen in Parameterform 3.8 Differentiation von Vektoren . . . . . . . . . . . . 3.9 Partielle Differentiation . . . . . . . . . . . . . . 3.9.1 Funktionen mehrerer Variabler . . . . . . 3.9.2 Partielle Ableitung . . . . . . . . . . . . . 3.9.3 Anstieg einer impliziten Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 67 70 71 71 71 71 71 72 72 72 73 73 74 76 78 78 79 81 . . . . . . . . . . . . . . . Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 83 85 85 89 93 94 94 95 95 97 98 101 106 108 108 110 114 116 116 118 2.6 2.7 2.8 Vektorprodukt . . . . . . . . . . . . . 2.5.1 Definition . . . . . . . . . . . . 2.5.2 Rechenregeln . . . . . . . . . . 2.5.3 Komponentenweise Darstellung 2.5.4 Anwendungen . . . . . . . . . . Spatprodukt . . . . . . . . . . . . . . . 2.6.1 Definition . . . . . . . . . . . . 2.6.2 Komponentenweise Darstellung 2.6.3 Rechenregeln und Anwendung Mehrfachprodukte . . . . . . . . . . . Anwendungsbeispiele für Vektoren . . 2.8.1 Strömung durch eine Fläche . . 2.8.2 Rotation eines Körpers . . . . 2.8.3 Volumen einer Einheitszelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Integration 4.1 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . 4.2 Wichtige unbestimmte Integrale . . . . . . . . . . . . . . . 4.3 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . 4.4 Zusammenhang zwischen bestimmtem und unbestimmtem 4.5 Rechenregeln für das bestimmte Integral . . . . . . . . . . 4.6 Grundregeln des Integrierens . . . . . . . . . . . . . . . . 4.6.1 Faktorregel . . . . . . . . . . . . . . . . . . . . . . 4.6.2 Summenregel . . . . . . . . . . . . . . . . . . . . . 4.6.3 Substitutionsmethode . . . . . . . . . . . . . . . . 4.6.4 Partielle Integration . . . . . . . . . . . . . . . . . 4.7 Rotationskörper . . . . . . . . . . . . . . . . . . . . . . . . 4.8 Berechnung von Bogenlängen . . . . . . . . . . . . . . . . 4.9 Mittelwerte von Funktionen . . . . . . . . . . . . . . . . . 4.10 Doppelintegrale . . . . . . . . . . . . . . . . . . . . . . . . 4.10.1 Definition . . . . . . . . . . . . . . . . . . . . . . . 4.10.2 Berechnung von Doppelintegralen . . . . . . . . . . 4.10.3 Doppelintegrale in Polarkoordinaten . . . . . . . . 4.11 Dreifachintegrale . . . . . . . . . . . . . . . . . . . . . . . 4.11.1 Definition . . . . . . . . . . . . . . . . . . . . . . . 4.11.2 Berechnung von Dreifachintegralen . . . . . . . . . INHALTSVERZEICHNIS 7 4.11.3 Dreifachintegrale in Zylinder- und Kugelkoordinaten . . . . . . . . . . . . . 120 4.12 Integration von vektorwertigen Funktionen . . . . . . . . . . . . . . . . . . . . . . 121 II Einführung in die Physikalischen Rechenmethoden II 5 Die 5.1 5.2 5.3 5.4 5.5 Taylorreihe Folgen und Reihen . . . . . . . . . . . . . . . . Entwicklung einer Funktion in eine Taylorreihe Allgemeine Taylorentwicklung . . . . . . . . . . Abgebrochene Taylorreihenentwicklung . . . . . Fehlerabschätzung . . . . . . . . . . . . . . . . 123 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 125 127 130 130 133 6 Komplexe Zahlen 6.1 Definition und Darstellung . . . . . . . . . . . . . . . . . . . . . . . 6.2 Rechenregeln für komplexe Zahlen . . . . . . . . . . . . . . . . . . 6.2.1 Addition und Subtraktion . . . . . . . . . . . . . . . . . . . 6.2.2 Multiplikation einer komplexen Zahl mit einer reellen Zahl 6.2.3 Komplex konjugierte Zahl . . . . . . . . . . . . . . . . . . . 6.2.4 Multiplikation . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.5 Division . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Die Exponentialform von komplexen Zahlen . . . . . . . . . . . . . 6.3.1 Eulersche Formel . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Polardarstellung von komplexen Zahlen . . . . . . . . . . . 6.3.3 Umkehrung der Eulerschen Formel . . . . . . . . . . . . . . 6.3.4 Additionstheoreme für Winkelfunktionen . . . . . . . . . . 6.3.5 Komplexe Zahlen als Exponenten . . . . . . . . . . . . . . . 6.4 Potenzieren und komplexe Wurzeln . . . . . . . . . . . . . . . . . . 6.5 Darstellung von Kurven mit komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 137 139 139 140 141 142 143 144 144 146 147 147 148 148 151 7 Fehlerrechnung 7.1 Systematische und statistische Fehler . . . . . . . . 7.2 Mittelwert und Varianz . . . . . . . . . . . . . . . 7.3 Verteilungen und Histogramme . . . . . . . . . . . 7.3.1 Grundlagen . . . . . . . . . . . . . . . . . . 7.3.2 Erwartungswert, Momente einer Verteilung 7.3.3 x und s2 als Schätzer für µ und σ 2 . . . . . 7.3.4 Fehler des Mittelwerts . . . . . . . . . . . . 7.3.5 Die Gaußsche Normalverteilung . . . . . . . 7.3.6 Verteilung diskreter Größen . . . . . . . . . 7.3.7 Poissonverteilung . . . . . . . . . . . . . . . 7.4 Fehlerfortpflanzung . . . . . . . . . . . . . . . . . . 7.4.1 Fortpflanzung von Maximalfehlern . . . . . 7.4.2 Fortpflanzung statistischer Kennwerte . . . 7.5 Ausgleichsrechnung (Fitten) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 153 155 157 157 161 163 164 165 167 168 170 171 172 175 8 Differentiation von Feldern: 8.1 Felder . . . . . . . . . . . 8.1.1 Skalarfelder . . . . 8.1.2 Vektorfelder . . . . 8.2 Gradient . . . . . . . . . . 8.2.1 Definition . . . . . 8.2.2 Eigenschaften . . . 8.2.3 Richtungsableitung 8.2.4 Rechenregeln . . . 8.3 Divergenz . . . . . . . . . 8.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 179 179 180 183 183 183 185 185 186 186 grad, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . div und rot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 INHALTSVERZEICHNIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 189 190 191 191 191 194 195 196 9 Integration von Feldern: Kurven- und Flächenintegrale 9.1 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . 9.1.2 Eigenschaften . . . . . . . . . . . . . . . . . . . . . . 9.1.3 Berechnungsverfahren . . . . . . . . . . . . . . . . . 9.1.4 Kurvenintegrale über Gradientenfelder . . . . . . . . 9.2 Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . 9.2.2 Darstellung der Fläche und des Flächenelements . . 9.2.3 Das Flächenelement . . . . . . . . . . . . . . . . . . 9.2.4 Berechnung des Oberflächenintegrals . . . . . . . . . 9.3 Der Integralsatz von Gauß . . . . . . . . . . . . . . . . . . . 9.3.1 Integraldarstellung der Divergenz . . . . . . . . . . . 9.3.2 Formulierung und Herleitung . . . . . . . . . . . . . 9.3.3 Partielle Integration mit Hilfe des Gaußschen Satzes 9.3.4 Die Sätze von Green . . . . . . . . . . . . . . . . . . 9.4 Der Integralsatz von Stokes . . . . . . . . . . . . . . . . . . 9.4.1 Integraldarstellung der Rotation . . . . . . . . . . . 9.4.2 Formulierung und Herleitung . . . . . . . . . . . . . 9.4.3 Bedeutung . . . . . . . . . . . . . . . . . . . . . . . 9.4.4 Das Vektorpotential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 200 200 201 202 206 210 210 212 214 216 218 218 219 224 226 229 229 231 234 236 10 Differentialgleichungen 10.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Differentialgleichungen erster Ordnung . . . . . . . . . . . . . . . . . . . . . . . 10.2.1 Differentialgleichungen mit separierbaren Variablen . . . . . . . . . . . . 10.2.2 Homogene lineare Differentialgleichung . . . . . . . . . . . . . . . . . . . 10.2.3 Inhomogene lineare Differentialgleichung . . . . . . . . . . . . . . . . . . 10.3 Differentialgleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . 10.3.1 Homogene Differentialgleichung mit konstanten Koeffizienten . . . . . . 10.3.2 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.3 Die gedämpfte Schwingung . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.4 Die inhomogene lineare Diffgl. 2. Ordnung mit konstanten Koeffizienten . . . . . . . . . . . . . . . . . . . . 239 239 241 242 247 249 258 258 261 264 268 8.4 8.5 8.6 8.3.2 Anschauliche Interpretation als lokale Quellstärke . 8.3.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . . Laplace-Operator . . . . . . . . . . . . . . . . . . . . . . . Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.5.1 Definition . . . . . . . . . . . . . . . . . . . . . . . 8.5.2 Anschauliche Interpretation als lokale Wirbelstärke 8.5.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . . 8.5.4 Wirbelfreie und quellenfreie Felder . . . . . . . . . Zusammenfassung Nabla-Operator ∇ . . . . . . . . . . . . Teil I Einführung in die Physikalischen Rechenmethoden I 9 Kapitel 1 Funktionen 1.1 Der Funktionsbegriff In der Physik (und in den Naturwissenschaften im Allgemeinen) arbeiten wir mit Größen, die entweder konstant sind (d.h. sie nehmen wie die Lichtgeschwindigkeit oder die Erdbeschleunigung nur bestimmte, fixe Werte an) oder eine ganze Fülle von Werten annehmen können. Wir unterscheiden deshalb zwischen Konstanten und Variablen (z.B. verstrichene Zeit, Länge eines Objekts, Position eines Objekts, Temperatur eines gewissen Materials, Druck eines Gases, etc.). Um physikalische Zusammenhänge zu verstehen, betrachten wir oft eine Variable in Abhängigkeit einer anderen Variablen. So könnten wir zum Beispiel daran interessiert sein, wie sich der Druck p eines in einem bestimmten Volumen V eingeschlossenen Gases verhält, wenn dessen Temperatur T verändert wird. Für jede Temperatur T herrscht im Gas ein bestimmter Druck p. In anderen Worten: der Druck p ändert sich mit der Temperatur T . Zur Beschreibung solcher Zusammenhänge zwischen Variablen benutzen wir Funktionen. Definition: Eine Funktion f (x) ordnet jedem Element x des Definitionsbereichs D eindeutig ein Element y des Wertebereichs W zu: y = f (x) (siehe Abb. 1.1). Abbildung 1.1: Die Funktion f (x) mit Definitionsbereich D und Wertebereich W . Wir sagen dann, dass wir y als Funktion von x betrachten. In unserem Beispiel mit dem Gas betrachten wir etwa den Druck p als Funktion der Temperatur T und schreiben p(T ). Wichtig ist hier, dass die Zuordnung eindeutig ist. Das heißt, dass jedem Wert x genau ein Wert y zugeordnet wird (sonst ist f (x) keine Funktion) (siehe Abb. 1.2). Es ist also nicht erlaubt, einem Element des Definitionsbereichs zwei oder mehr Elemente des Wertebereichs zuzuordnen. Hingegen darf sehr wohl ein Element des Wertebereichs mehreren Werten des Definitionsbereichs angehören. Auch muss nicht jedes Element des Wertebereichs vom Definitionsbereich aus erreicht werden. Die √ Wurzelfunktion f (x) = ± x ist daher beispielsweise keine echte Funktion, da sowohl der negative als auch der positive Wert der Wurzel zulässig sind. Betrachtet man hingegen nur den positiven oder den negativen Zweig der “Wurzelfunktion”, sind alle geforderten Eigenschaften erfüllt. Die Funktion f (x) ist also eine Zuordnungsvorschrift. Dabei wird x als unabhängige Variable 11 12 1 Funktionen Abbildung 1.2: Nur eine eindeutige Zuordnung ist eine Funktion. oder Argument (auch Stelle) bezeichnet und y als abhängige Variable oder Funktionswert. Man kann die Zuordnung auch schreiben als f x− →y f : x → y. oder (1.1) Dies bedeutet, dass die Funktion f dem Wert x einen Wert y zuordnet. Diese Notation werden Sie jedoch kaum in Physikbüchern finden. Oft wird in der Physik auch der Definitionsbereich nicht explizit erwähnt. Dieser ergibt sich meistens aus dem Zusammenhang. Funktionen werden auch Abbildungen genannt und man sagt “x wird auf y abgebildet”. Die Notation f (x) für eine Funktion ist eigentlich ungenau, denn genau genommen bezeichnet f (x) den Funktionswert an der Stelle x und nicht die Zuordnungsvorschrift. Diese Schreibweise ist jedoch sehr praktisch und wird daher in der Physik gerne benutzt. 1.2 Darstellung von Funktionen Funktionen lassen sich auf verschiedene Weisen darstellen, wie wir im Folgenden besprechen werden. 1.2.1 Analytische Darstellung In der analytischen Darstellung wird die Zuordnungsvorschrift als Gleichung (Funktionsgleichung) in einer von drei Formen angegeben: • Explizite Darstellung: y = f (x) Die Funktion ist nach einer Variablen aufgelöst und der Wert y kann für ein bestimmtes Argument x sofort berechnet werden, zum Beispiel y = x2 . In diesem Fall haben wir eine Rechenvorschrift, mit der wir f (x) direkt aus x ermitteln können. • Implizite Darstellung: F (x, y) = 0 Die Funktion ist nicht nach einer der beiden Variablen aufgelöst. Ein Beispiel ist die Gleichung eines Kreises mit Radius 1 um den Ursprung: x2 + y 2 − 1 = 0. In vielen Fällen ist es möglich, 2 2 die implizite Darstellung in √ √ eine explizite zu verwandeln, zum Beispiel (x + y − 1 = 0) → y1 = 1 − x2 und y2 = − 1 − x2 . Diese Verwandlung von impliziter zu expliziter Form ist jedoch nicht immer möglich. • Parameterdarstellung: Bei dieser Form der Darstellung werden beide Variablen (sowohl das Argument als auch der Funktionswert) als Funktion einer Hilfsvariablen t ausgedrückt: x = x(t), (1.2) y y(t). (1.3) = 1 Funktionen 13 Abbildung 1.3: Wurfparabel für horizontale Anfangsgeschwindigkeit. Die Hilfsvariable, hier t, wird auch als Parameter bezeichnet. Betrachten wir zum Beispiel die Bahnkurve eines im Erdschwerefeld in horizontaler Richtung geworfenen Objekts (siehe Abb. 1.3). Dabei können wir versuchen, die vertikale Lage y als Funktion der horizontalen Entfernung x anzugeben, also y = f (x). In diesem Fall ist es jedoch einfacher, zunächst sowohl x als auch y als Funktion der Zeit t auszudrücken. Unter Vernachlässigung der Reibung gilt: x = y = v0 t, g − t2 . 2 (1.4) (1.5) Die Gleichungen (1.4) und (1.5) sind die Parameterdarstellung der in Abb. 1.3 abgebildeten Wurfparabel. Dabei ist v0 die Anfangsgeschwindigkeit in x-Richtung und g die Erdbeschleunigung. Der Anfangspunkt liegt im Ursprung: x(0) = 0 und y(0) = 0. Durch die obige Vorschrift erhalten wir für jedes t ein Paar (x(t), y(t)). Durch Auflösen der ersten Gleichung nach t und Einsetzen in die zweite Gleichung erhalten wir die explizite Form der Wurfparabel: 2 g g x = − 2 x2 . (1.6) y=− 2 v0 2v0 1.2.2 Funktionstafel (Wertetabelle) Hier werden Paare von unabhängigen und abhängigen Variablen in tabellarischer Form dargestellt, zum Beispiel: x 0 1 2 3 4 5 ... y 0 -1 -4 -9 -16 -25 ... (Diese Daten ergeben sich für das obige Beispiel im Falle g/2v02 = 1.) Die tabellarische Darstellung wird häufig für empirisch bestimmte Messdaten verwendet oder wenn es auf den genauen Zahlenwert ankommt. 1.2.3 Graphische Darstellung Funktionen lassen sich in der graphischen Darstellungsart besonders gut veranschaulichen. Dabei werden die Wertepaare der Funktion in einem rechtwinkligen (kartesischen) Koordinatensystem als Funktionsgraph dargestellt (siehe Abb. 1.4). Üblicherweise wird auf der horizontalen Achse der x-Wert und auf der vertikalen Achse der y-Wert aufgetragen. Die x-Achse wird auch Abszisse und die y-Achse Ordinate genannt. 14 1 Funktionen Abbildung 1.4: Graph einer Funktion in einem kartesischen Koordinatensystem. 1.3 Eigenschaften von Funktionen In diesem Abschnitt fassen wir einige wichtige Eigenschaften von Funktionen zusammen. 1.3.1 Definitionsbereich Der Definitionsbereich besteht aus der Menge aller Argumente, für welche die Funktion definiert ist. In dieser Vorlesung werden wir vor allem verschiedene Intervalle der reellen Zahlen R als Definitionsbereich betrachten. Dabei unterscheiden wir offene Intervalle (a, b) = {x ∈ R|a < x < b}, (1.7) welche die Endpunkte a und b nicht enthalten, und geschlossene Intervalle [a, b] = {x ∈ R|a ≤ x ≤ b}, (1.8) welche die Endpunkte a und b enthalten. Oft können Funktionen nur für einen recht eingeschränk√ ten Definitionsbereich definiert werden. Zum Beispiel kann bei der Funktion y = 1 − x2 das Argument nur Werte im Intervall −1 ≤ x ≤ 1 annehmen. Für reelle Werte außerhalb dieses Bereichs ist das Argument der Wurzel negativ und der Funktionswert somit nicht reell. Falls wir nur reelle Funktionswerte betrachten wollen, müssen wir den Definitionsbereich auf |x| ≤ 1 einschränken (Grenzen mit eingeschlossen).Wir schreiben dafür auch x ∈ [−1, 1]. Oft schließen wir auch einzelne Punkte aus dem Definitionsbereich aus. Zum Beispiel ist die Funktion f (x) = 1/x für den Definitionsbereich R\{0} (das sind die reellen Zahlen ohne die Null) definiert. 1.3.2 Nullstellen Eine Funktion y = f (x) besitzt an der Stelle x0 eine Nullstelle, falls f (x0 ) = 0. Zum Beispiel besitzt die Funktion f (x) = x2 − 1 an den Stellen x1 = −1 und x2 = 1 Nullstellen. 1.3.3 Gerade und ungerade Funktionen Eine Funktion mit symmetrischem Definitionsbereich heißt gerade (siehe Abb. 1.5), falls gilt f (x) = f (−x). (1.9) 1 Funktionen 15 Eine Funktion heißt ungerade (siehe Abb. 1.6), falls f (x) = −f (−x). (1.10) Anschaulich ist eine gerade Funktion spiegelsymmetrisch (achsensymmetrisch) zur y-Achse; eine ungerade Funktion ist punktsymmetrisch zum Ursprung. Abbildung 1.5: Gerade Funktionen. 1.3.4 Abbildung 1.6: Ungerade Funktionen. Monotonie Es seien x1 und x2 zwei beliebige Werte aus dem Definitionsbereich (x1 , x2 ∈ D) einer Funktion f (x), die der Bedingung x1 < x2 genügen. Dann heißt die Funktion: • monoton wachsend, falls f (x1 ) ≤ f (x2 ), • streng monoton wachsend, falls f (x1 ) < f (x2 ), • monoton fallend, falls f (x1 ) ≥ f (x2 ), • streng monoton fallend, falls f (x1 ) > f (x2 ). Abbildung 1.7: Monotonieeigenschaften von Funktionen. 1.3.5 Grenzwert Eine Funktion y = f (x) sei in einer Umgebung von x0 definiert. Gilt dann für jede im Definitionsbereich der Funktion liegende und gegen x0 konvergente Zahlenfolge {xn } mit xn = x0 lim f (xn ) = g, n→∞ (1.11) 16 1 Funktionen so heißt g der Grenzwert von y = f (x) an der Stelle x0 : lim f (x) = g. x→x0 (1.12) Eine Folge ist dabei eine Abbildung mit den natürlichen Zahlen N = {0, 1, 2, 3, . . .} als Definitionsbereich. (Für die genaue Definition einer Folge siehe Kapitel 5.) Ein Beispiel einer Folge ist 1, 1/2, 1/3, 1/4, . . .. Diese Folge nähert sich dem Wert 0. Damit der Grenzwert einer Funktion f (x) an der Stelle x0 existiert, darf es also nicht darauf ankommen, auf welche Weise man sich dem Punkt x0 nähert. Abbildung 1.8: An der Stelle x1 besitzt die Funktion einen Grenzwert, an der Stelle x2 nicht. Beispiel: Gesucht ist x2 . x→∞ x2 + x + 1 lim (1.13) Wir dividieren zunächst Zähler und Nenner durch x2 : lim x→∞ x2 x2 1 = lim . + x + 1 x→∞ 1 + 1/x + 1/x2 (1.14) Da sowohl 1/x als 1/x2 für x → ∞ gegen 0 gehen, erhalten wir: x2 = 1. x→∞ x2 + x + 1 lim 1.3.6 Stetigkeit Abbildung 1.9: Diese Funktion hat an der Stelle x0 eine Unstetigkeitsstelle. (1.15) 1 Funktionen 17 Eine in x0 und in einer gewissen Umgebung von x0 definierte Funktion y = f (x) heißt an der Stelle x0 stetig, wenn der Grenzwert der Funktion an dieser Stelle existiert und mit dem dortigen Funktionswert übereinstimmt: lim f (x) = f (x0 ). (1.16) x→x0 Anschaulich kann man Stetigkeit folgendermaßen verstehen: Zeichnet man einen Graphen, kann es vorkommen, dass die Funktion einen Sprung aufweist (die in Abb. 1.9 dargestellte Funktion etwa hat bei x0 einen Sprung). In der Nähe von x0 kann man x-Werte finden, die sich nur wenig voneinander unterscheiden (z.B. ein Punkt knapp links und ein Punkt knapp rechts von x0 ), deren y-Werte sich aber um einen großen Betrag voneinander unterscheiden. Nähert man sich x0 von links (ohne x0 genau zu erreichen), erhält man einen anderen Funktionswert, als wenn man das von rechts tut, d.h. limx→x0− f (x) = limx→x0+ f (x). An der Stelle x0 ist die Funktion nicht stetig. Eine Unstetigkeitsstelle dieser Art bezeichnet man auch als Sprungstelle. Beispiel: Die Funktion +1 f (x) = sign x = 0 −1 falls falls falls x>0 x=0 x<0 (1.17) hat an der Stelle x = 0 eine Unstetigkeitsstelle (siehe Abb. 1.10). Für x = 0 gilt sign x = |x|/x. Abbildung 1.10: Die Funktion f (x) = sign x. Knickstellen, bei denen sich die Steigung einer Funktion unstetig ändert, können auch in stetigen Funktionen auftreten. Beispiel: Die Funktion |x| y= 1 −1 ≤ x < ∞ x < −1 (1.18) hat Knickstellen bei x = −1 und x = 0, ist aber überall stetig (siehe Abb. 1.11). Die erste Ableitung ist jedoch an den Stellen x = −1 und x = 0 unstetig. 1.3.7 Singularitäten Stellen, in deren unmittelbarer Umgebung die Funktionswerte über alle Grenzen hinaus fallen oder wachsen, heißen Singularitäten oder Unendlichkeitsstellen der Funktion. Diese Stellen sind ebenfalls Unstetigkeitsstellen. 18 1 Funktionen Abbildung 1.11: Eine stetige Funktion mit Knickstellen. Beispiel: Die Funktion y = 1/x wächst bei Annäherung an x = 0 über alle Grenzen: 1 x 1 lim− x→0 x lim x→0+ = ∞, (1.19) = −∞. (1.20) An dieser Stelle hat die Funktion eine Singularität. Abbildung 1.12: Die Funktion f (x) = 1/x hat an der Stelle x = 0 eine Singularität. 1.4 Neue Funktionen aus alten Durch Addition, Subtraktion, Multiplikation und Division kann man aus alten Funktionen neue definieren. Zum Beispiel: h(x) = f (x) + g(x) oder h(x) = f (x) · g(x). Dabei muss natürlich auf einen passenden Definitionsbereich geachtet werden. In den beiden nächsten Abschnitten werden wir zwei weitere wichtige Arten kennen lernen, um aus alten Funktionen neue zu definieren. 1.4.1 Verkettung von Funktionen Gegeben seien zwei Funktionen f (x) und g(x). Die Funktion f (x) ordnet einer Zahl x eine Zahl z zu: z = f (x). Die Zahl z wird dann als unabhängige Variable für die Funktion g verwendet. Dadurch wird der Zahl z eine Zahl y zugeordnet: y = g(z). Durch die Hintereinanderanwendung von f 1 Funktionen 19 und g wird der Zahl x eine Zahl y zugeordnet: y = g(z) = g(f (x)) (1.21) x → f (x) → g(f (x)). (1.22) Die Variable z ist nur als Zwischenergebnis interessant, kann also wegfallen. Für die verkettete (oder auch zusammengesetzte) Funktion schreibt man auch y = (g ◦ f )(x). (1.23) Beispiel: Die Funktionen f (x) = x2 und g(x) = sin(x) (1.24) ergeben zusammengesetzt g(f (x)) = (g ◦ f )(x) = sin(x2 ). (1.25) Die Verkettung (oder Zusammensetzung) von Funktionen ist im Allgemeinen nicht kommutativ: (g ◦ f )(x) = (f ◦ g)(x). (1.26) Das heißt, bei der Verkettung von Funktionen kommt es auf die Reihenfolge an. Beispiel: Gegeben seien die beiden Funktionen f (x) = 1 + x und g(x) = 1/x. (1.27) Während die Zusammensetzung g ◦ f g(f (x)) = 1 1+x (1.28) 1 . x (1.29) ergibt, erhält man für die Zusammensetzung f ◦ g f (g(x)) = 1 + 1.4.2 Umkehrfunktion Häufig ist es notwendig, für einen gegebenen Wert der abhängigen Variablen den Wert der unabhängigen Variablen zu bestimmen. Betrachten wir zum Beispiel den Flächeninhalt y = x2 eines Quadrats mit Seitenlänge x (siehe Abb. 1.13). Abbildung 1.13: Flächeninhalt y eines Quadrats mit Seitenlänge x. 20 1 Funktionen √ Aus der Fläche können wir natürlich die Kantenlänge x = y bestimmen. Hier haben wir die √ Funktion y = f (x) = x2 für x ≥ 0 umgekehrt zu x = f −1 (y) = y. Die Funktion x = f −1 (y) ist die Umkehrfunktion (oder inverse Funktion) von y = f (x). Dabei haben Argument und Funktionswert die Rollen vertauscht. Gewissermaßen ermittelt die Umkehrfunktion, woher der Funktionswert f gekommen ist. In der Umkehrfunktion f −1 (y) ist nun y die unabhängige Variable. Da wir die unabhängige Variable meistens mit x bezeichnen, nennen wir y in x um und erhalten folgendes Paar von Funktion und Umkehrfunktion: f (x) und f −1 (x). Abbildung 1.15: Umkehrfunktion x = f −1 (y). Abbildung 1.14: Funktion y = f (x). Setzt man eine Funktion mit ihrer Umkehrfunktion zusammen, so wird das Argument x auf sich selbst abgebildet: (f ◦ f −1 )(x) = (f −1 ◦ f )(x) = f −1 (f (x)) = x. Als weiteres Beispiel bestimmen wir die Umkehrfunktion der Funktion y = 1 − 4x2 , für D = [0, 1/2] y = 2 y 4x2 = = x = 1 − 4x , 1 − y2, 1 1 − y2 2 2 (1.30) √ 1 − 4x2 : (1.31) (1.32) (1.33) y ∈ [0, 1]. (1.34) Somit gilt: f (x) = 1 − 4x2 ; f −1 (x) = 1 1 − x2 . 2 (1.35) Der Zusammenhang zwischen Funktion und Umkehrfunktion ist in Abb. 1.16 graphisch dargestellt. Abbildung 1.16: Aus der Funktion f (x) erhalten wir durch Spiegelung an der 45◦ -Geraden die Umkehrfunktion f −1 (y). 1 Funktionen 21 Natürlich können wir eine Funktion nur umkehren, wenn jedem Element y aus dem Wertebereich genau ein Wert x aus dem Definitionsbereich zugeordnet ist. Wenn, wie in Abb. 1.17 dargestellt, mehrere Werte aus dem Definitionsbereich (hier x1 und x2 ) auf denselben Wert des Wertebereichs (hier y1 ) abgebildet werden, können wir die Funktion nicht umkehren, da wir für Punkt y1 nicht wissen, welches Argument wir nehmen sollen. Anders gesagt: Eine Funktion y = f (x) ist umkehrbar, wenn aus x1 = x2 stets f (x1 ) = f (x2 ) folgt. Falls dies nicht gilt, kann durch geeignete Einschränkung des Definitionsbereichs die Umkehrung einer solchen Funktion doch ermöglicht werden. Zum Beispiel besitzt die Funktion f (x) = x2 mit D = R für +x und −x jeweils den selben Funktionswert und ist somit nicht umkehrbar. Schränken wir den Definitionsbereich jedoch auf D = {x ∈ R|x ≥ 0} ein, ist die Funktion umkehrbar. Eine Funktion, für die aus x1 = x2 stets f (x1 ) = f (x2 ) folgt, nennt man injektiv. Falls für alle Werte y im Wertebereich ein Argument x existiert, sodass f (x) = y, ist die Funktion surjektiv. Eine sowohl injektive als auch surjektive Funktion nennt man bijektiv und genau diese Funktionen sind umkehrbar. Abbildung 1.17: Eine Funktion, bei der mehrere Argumente denselben Funktionswert besitzen, ist nicht umkehrbar. Wir halten zusammenfassend fest: • Jede streng monoton wachsende oder fallende Funktion ist umkehrbar. • Bei der Umkehrung einer Funktion werden der Definitionsbereich und der (gegebenenfalls passend eingeschränkte) Wertebereich vertauscht. • Analytisch erhält man die Umkehrfunktion durch Auflösen nach der unabhängigen Variablen und anschließendes formales Vertauschen der beiden Variablen. • Graphisch ergibt sich die Umkehrfunktion durch Spiegelung an der 45◦ -Geraden. 1.5 Wichtige Funktionen Im Folgenden werden wir einige in der Physik wichtige Funktionen kurz in Erinnerung rufen. Die Auswahl ist aus Platzgründen sehr beschränkt und so sei der Leser für eine vollständigere Behandlung auf die in der Literaturliste angeführten Nachschlagewerke verwiesen. Eine Fülle von Informationen über eine Vielzahl von Funktionen (und über Mathematik im Allgemeinen) ist auf der Webseite http://mathworld.wolfram.com verfügbar. 1.5.1 Lineare Funktionen Bei der linearen Funktion (eigentlich affine Funktion) f (x) = kx + b (1.36) hängt der Funktionswert in einfacher Potenz, d.h. linear vom Argument ab. Die lineare Funktion besitzt zwei Parameter, k und b. Die Bedeutung dieser beiden Parameter wird in der graphischen 22 1 Funktionen Darstellung der Funktion als eine Gerade klar (siehe Abb. 1.18). Der Parameter k ist dabei die Steigung der Geraden und der Parameter b ihr Schnittpunkt mit der y-Achse. Der Definitionsbereich umfasst die gesamte x-Achse und der Wertebereich die gesamte y-Achse (für k = 0). Abbildung 1.18: Die linear Funktion y = kx + b. Die lineare Funktion f (x) = kx + b ist für k = 0 im gesamten Definitionsbereich (reelle Zahlen) streng monoton und daher umkehrbar. Auch die Umkehrfunktion einer linearen Funktion ist eine lineare Funktion: x = y/k − b/k. Lineare Funktionen werden häufig für “Fits” verwendet (siehe Kapitel 7). Die identische Funktion y = x und die konstante Funktion y = b sind Spezialfälle der linearen Funktion. 1.5.2 Potenzfunktionen Die Potenz xn ist das Produkt von n gleichen Faktoren: xn = x · x · x · · · · · x . (1.37) n−mal Hier werden x die Basis und n der Exponent genannt. Rechenregeln für Potenzen: x0 xn · xm xn xm (xn )m = = 1, xn+m , (1.38) (1.39) = xn−m , (1.40) = nm (1.41) x . Dabei sind n und m beliebige ganze Zahlen. Die Regel x0 = 1 ergibt sich aus der Beobachtung, dass sich durch Division durch x der Exponent in xn um 1 verringert: xn /x = xn−1 . Für n = 1 gilt also x/x = x1−1 = x0 = 1. Analog folgt auch, dass 1/x = x−1 oder allgemein: 1/xn = x−n . Die anderen Rechenregeln ergeben sich aus ähnlichen Überlegungen. Zum Beispiel: xn · xm = x · x · · · · · x · x · · · · · x = xn+m · x n−mal (1.42) m−mal und · · · · · xm = xnm . (xn )m = xm · xm (1.43) n−mal Durch Addition von Potenzen erhält man die Potenzfunktion (oder ganz rationale Funktion): f (x) = a0 + a1 x + a2 x2 + a3 x3 + · · · + an xn = n i=0 ai xi , (1.44) 1 Funktionen 23 wobei die Koeffizienten ai beliebige reelle Zahlen sind. Die Potenzfunktion aus der obigen Gleichung wird auch Polynom n-ten Grades genannt (falls an = 0). Dabei ist n die höchste vorkommende Potenz. Beispiele: • Potenzfunktion 2. Grades f (x) = a0 + a1 x + a2 x2 (mit a2 = 0), • Potenzfunktion 3. Grades f (x) = a0 + a1 x + a2 x2 + a3 x3 (mit a3 = 0). Der Definitionsbereich der Potenzfunktion umfasst die gesamte x-Achse, −∞ < x < ∞ und die Funktion ist überall stetig. Für x → ±∞ divergiert die Funktion nach −∞ oder +∞. Abbildung 1.19: Beispiele für Potenzfunktionen unterschiedlichen Grades. Gebrochen rationale Funktionen lassen sich als Quotient zweier ganz rationaler Funktionen darstellen: n ai xi . (1.45) f (x) = i=0 m i i=0 bi x Der Definitionsbereich ist −∞ < x < ∞. Die Nullstellen des Nenners, an denen die Funktion divergiert, sind jedoch davon ausgeschlossen. √ Die Wurzelfunktion f (x) = ± x ist die Umkehrfunktion der Potenzfunktion f (x) = x2 . Da die Quadrate von x und −x identisch sind, (x)2 = (−x)2 (siehe Abb. 1.20), ist die Quadratwurzel 24 1 Funktionen Abbildung 1.20: Für jeden Wert y0 auf der Ordinate gibt es für die Quadratfunktion y = x2 zwei Werte auf der Abszisse. √ √ nicht eindeutig und die beiden Zweige f (x) = + x und f (x) =√− x müssen getrennt voneinander behandelt werden. Für die Quadratwurzel schreiben wir auch x = x1/2 . Die Wurzelfunktion lässt sich auch für beliebige Exponenten n verallgemeinern. Für die Potenzfunktion f (x) = xn (1.46) definieren wir die n-te Wurzel als die entsprechende Umkehrfunktion x1/n = f −1 (x). (1.47) Die Schreibweise der Wurzelfunktion mit Hilfe des Exponenten erlaubt die Anwendung der Rechenregeln für Potenzen, z. B. (x1/n )1/m = x1/(nm) . Es gibt auch die Zusammensetzung von Potenzfunktion und Wurzelfunktion: 1/m f (x) = (xn ) = xn/m . (1.48) Auch dafür gelten die Rechenregeln für Potenzen. 1.5.3 Exponentialfunktion Die Exponentialfunktion und ihre Umkehrung, die Logarithmusfunktion, sind transzendente Funktionen, d.h. sie lassen sich nicht als endliche Kombination von algebraischen Termen darstellen (sehr wohl aber durch unendliche Reihen). Die allgemeine Form der Exponentialfunktion lautet: f (x) = ax . (1.49) Dabei ist die reelle positive Zahl a die Basis und x der Exponent. Die Bedeutung von ax für rationale Exponenten haben wir bereits im letzten Abschnitt kennen gelernt. Für irrationale Exponenten x, also für jene x-Werte, die sich nicht durch einen Bruch darstellen lassen, können wir x beliebig genau durch einen solchen Bruch annähern und somit ax beliebig genau durch Verkettung von Potenz- und Wurzelfunktion erhalten. Wichtige Spezialfälle sind die Exponentialfunktionen mit Basis 10 und e: f (x) f (x) = 10x, (1.50) = x (1.51) e . 1 Funktionen 25 Die Exponentialfunktion mit Basis e schreiben wir auch oft als f (x) = exp(x). (1.52) Exakt ist die Exponentialfunktion für die Basis e über eine Potenzreihe mit unendlich vielen Gliedern definiert: ex = 1 + x + x3 x4 x2 + + + ··· 2! 3! 4! (1.53) (Im Kapitel 5 werden wir mehr über Potenzreihen erfahren.) Dabei ist e = 2.718281828 . . . die Eulersche Zahl, eine der wichtigsten Zahlen der Mathematik. Eine alternative Definition ist über den Grenzwert ex = lim k→∞ 1+ x k k (1.54) möglich. Der Definitionsbereich der Exponentialfunktion umfasst die gesamte reelle Achse, −∞ < x < ∞ und der Wertebereich besteht aus allen positiven reellen Zahlen, 0 < y < ∞ (falls a = 1). Die Exponentialfunktion ax ist überall stetig. Für a > 1 ist sie streng monoton wachsend und für a < 1 streng monoton fallend (siehe Abb. 1.21). Die Exponentialfunktion für a > 1 wächst für positive x stärker an als jede Potenzfunktion, d. h. ax =∞ x→∞ xn lim für alle n ∈ N. (1.55) Abbildung 1.21: Die Exponentialfunktion ax für a > 1 (links) und 0 < a < 1 (rechts). Für die Exponentialfunktion gelten folgende Rechenregeln: a0 a−x x y (a ) ax ay ax ay = 1, 1 = , ax = axy , (1.56) = ax+y , (1.59) = ax−y . (1.60) (1.57) (1.58) (1.61) Diese Rechenregeln folgen aus den Rechenregeln für die Potenz- und Wurzelfunktion. 26 1.5.4 1 Funktionen Logarithmus Die Umkehrfunktion der Exponentialfunktion ist der Logarithmus (wir erhalten ihn graphisch durch Spiegelung der Exponentialfunktion an der 45◦ -Geraden). Zu verschiedenen Basen a der Exponentialfunktion gibt es auch unterschiedliche Logarithmen. Wir bezeichnen den Logarithmus zur Basis a der Zahl x als loga (x). (1.62) Der Logarithmus der Zahl x zur Basis a ist also jene Zahl, mit der man a potenzieren muss, um x zu erhalten: (1.63) y = loga (x) ⇔ ay = x. Folgende Exponentialfunktionen und zugehörige Logarithmen werden in der Physik besonders häufig verwendet: y = 10x y = ex log10 (y) = log(y) = x loge (y) = ln(y) = x dekadischer Logarithmus natürlicher Logarithmus (1.64) (1.65) Abbildung 1.22: Die Logarithmusfunktion loga (x) für verschiedene Basen a. Für alle Basen a folgt aus a0 = 1, dass loga 1 = 0. Der Definitionsbereich der Exponentialfunktion erstreckt sich über alle positiven reellen Zahlen, 0 < x < ∞, und der Wertebereich ist −∞ < y < ∞. Für die Logarithmusfunktion gelten folgende Rechenregeln: loga (1) = 0, 1 loga = − loga (x), x loga (xz ) = z loga (x), loga (x · y) = loga (x) + loga (y), x loga = loga (x) − loga (y). y (1.66) (1.67) (1.68) (1.69) (1.70) Diese Rechenregeln folgen aus den Rechenregeln für die Exponentialfunktion. Zum Beispiel: 1 1 loga = loga a− loga x = − loga x, (1.71) = loga log x x a a oder: loga (xy) = loga aloga x · aloga y = loga aloga x+loga y = loga x + loga y. (1.72) 1 Funktionen 27 Auf ähnliche Weise erhalten wir loga (xz ) = loga (aloga x )z = loga az loga x = z loga x. (1.73) Die Logarithmusfunktion wächst für a > 1 langsamer als jede beliebige Potenz von x, d.h. lim x→∞ loga (x) =0 xn für alle n ∈ N. (1.74) Wie die Exponentialfunktion lässt sich auch der Logarithmus von einer Basis in eine andere umformen: (1.75) loga (x) = loga blogb (x) = logb (x) · loga (b), loga (x) , loga (b) logb (x) loga (x) = . logb (a) logb (x) = (1.76) (1.77) Mit Hilfe der Logarithmusfunktion lässt sich die Exponentialfunktion zu einer beliebigen Basis a in eine auf der Eulerschen Zahl e beruhende Darstellungsform umwandeln: x x ax = eln a = ex ln a = eln(a ) . (1.78) Für eine beliebige Basis b gilt: x x ax = blogb a = bx logb a = blogb (a ) . 1.5.5 (1.79) Winkelfunktionen Die Winkelfunktionen (trigonometrische Funktionen) sind ebenfalls transzendente Funktionen. Zur Definition dieser Funktion ist es sehr zweckmäßig, Winkel im Bogenmaß anzugeben. Dazu zeichnen wir zunächst einen Kreis mit Radius 1 durch den Scheitel des Winkels, den wir im Bogenmaß ausdrücken wollen (siehe Abb. 1.23). Abbildung 1.23: Das Bogenmaß des Winkels α ist die Bogenlänge b, die vom Winkel am Einheitskreis (Radius=1) begrenzt wird. Die Länge des Kreisbogens zwischen den Winkelschenkeln ist das Bogenmaß dieses Winkels. Der volle Kreis hat einen Umfang von 2π und der zugehörige Winkel beträgt daher im Bogenmaß 2π. Zwischen dem üblichen Gradmaß und dem Bogenmaß gilt daher die Beziehung: Bogenmaß = Gradmaß × 2π/360. (1.80) Die trigonometrischen Funktionen lassen sich geometrisch sehr anschaulich am Einheitskreis definieren. Eine exakte Definition dieser Funktionen erfolgt jedoch durch Potenzreihen. Auf diese 28 1 Funktionen Abbildung 1.24: Verschiedene Winkel in Gradmaß und in Bogenmaß. Abbildung 1.25: Definition der Winkelfunktionen für den Winkel α am Einheitskreis (Radius=1). exakte Definition wollen wir hier jedoch verzichten. Die Winkelfunktionen setzen den Winkel α mit verschiedenen Längen in Beziehung (siehe Abb. 1.25). Mit Hilfe des in Abb. 1.25 dargestellten rechtwinkligen Dreiecks lassen sich geometrisch folgende Funktionen des Winkels α definieren: Sinus: Kosinus: Tangens: Kotanges: sin α = Gegenkathete / Hypotenuse cos α = Ankathete / Hypotenuse tan α =Gegenkathete / Ankathete cot α =Ankathete / Gegenkathete Tragen wir sin(α) und cos(α) als Funktion von α in einem kartesischen Koordinatensystem auf, erhalten wir die in Abbildung 1.26 dargestellten Funktionsgraphen. Während der Sinus eine ungerade Funktion ist, sin(x) = − sin(−x), (1.81) cos(−x) = cos(x). (1.82) ist der Kosinus gerade, Nachdem der Winkel α die Werte 0 bis 2π durchlaufen hat, zeigen die Funktionen wieder dieselben Werte wie vorher, d.h. die Funktionen sind periodisch mit der Periode 2π: sin(x + 2πn) = sin(x) (1.83) cos(x + 2πn) = cos(x), (1.84) 1 Funktionen 29 wobei n eine ganze Zahl ist. Die Werte von Sinus und Kosinus schwanken zwischen -1 und +1. Abbildung 1.26: Sinus und Kosinus. Der Tangens und der Kotangens sind ebenfalls periodische Funktionen, haben aber eine Periodenlänge von π statt 2π (siehe Abb. 1.27). Sowohl der Tangens als auch der Kotangens sind ungerade Funktionen: tan(x) = − tan(−x), cot(x) = − cot(−x). Die Tangensfunktion tan α ist singulär bei α = α = 0, π, 2π, . . . . π 3π 2, 2 ,... (1.85) (1.86) und die Kotangensfunktion cot α bei Abbildung 1.27: Tangens (links) und Kotangens (rechts). Winkelfunktionen können ineinander umgewandelt werden. Zum Beispiel gelten folgende Beziehungen, die man leicht durch Anwendung des Satzes von Pythagoras auf das in Abb. 1.25 dargestellte rechtwinklige Dreieck ableiten kann (sin2 α + cos2 α = 1): 1 − cos2 α, tan α sin α = √ , 1 + tan2 α 1 . tan α = cot α sin α = (1.87) (1.88) (1.89) Weitere Formeln zur Umformung trigonometrischer Funktionen sowie die Werte der Winkelfunktion an besonderen Stellen können den gängigen Formelsammlungen entnommen werden. Äußerst wichtig sind zudem die Additionstheoreme für die Winkelfunktionen: sin(α + β) = sin α cos β + cos α sin β, (1.90) cos(α + β) = cos α cos β − sin α sin β. (1.91) 30 1 Funktionen Diese Ausdrücke kann man zur Umformung von trigonometrischen Ausdrücken verwenden. So können wir zum Beispiel folgende Vereinfachung durchführen: x) cos x (1 − tan2 x) cos x (1 + tan x) cos x (1 − tan2 x) (1 − tan = = x) tan x (cot x − 1) (1 − tan x) (1 − tan sin x = cos x + sin x = cos x 1 + cos x π + sin x = sin x + 2 π π π π + sin x − + = sin x + + 4 4 4 4 π π π π cos + sin cos x + = sin x + 4 4 π 4 π 4 π π + sin x + cos − + sin − cos x + 4 4 4 4 1 π π 1 + x = √ sin x + + √cos 4 4 2 2 1 π 1 π + + √ sin x + − √cos x 4 4 2 2 √ 2 π π = √ sin x + = 2 sin x + . 4 4 2 (1.92) Die Winkelfunktionen hängen eng mit der Exponentialfunktion zusammen. Dieser Zusammenhang ist durch die Eulersche Formel gegeben (eiϕ = cos ϕ+i sin ϕ), die wir im Kapitel 6 näher behandeln werden. 1.5.6 Arcusfunktionen Oft kennen wir beispielsweise den Sinus eines Winkels und möchten daraus den Winkel selbst bestimmen. Dies können wir mit der Umkehrfunktion des Sinus, dem Arcussinus tun: x = arcsin y (y = sin x). (1.93) Die Bezeichnung Arcussinus stammt von arcus ab, der lateinischen Bezeichnung für Bogen (wir bestimmen ja das “Bogenmaß” des Winkels aus dem Sinus). Da jetzt y die unabhängige Variable ist, benennen wir sie um in x: y = arcsin x. (1.94) Der Definitionsbereich des Arcussinus ist −1 ≤ x ≤ 1. Da ein bestimmter Wert der Winkelfunktionen durch eine Vielzahl von Winkeln erzeugt wird (siehe Abb. 1.28), muss der Wertebereich auf einen gewissen Bereich eingeschränkt werden. Wir beschränken den Wertebereich so, dass jeder Wert des Sinus genau einmal angenommen wird. Damit erreichen wir eine eindeutige Zuordnung. Der zugeordnete Wert heißt Hauptwert. Der Hauptwert ist jener Wert y, der mit x = sin(y) konsistent ist und den kleinsten Absolutwert |y| besitzt. Für y = arcsin(x) gilt also ein Wertebereich von − π2 ≤ y ≤ π2 (siehe Abb. 1.29). Analog verfährt man mit arccos, arctan und arccot. 1 Funktionen 31 Abbildung 1.28: Die Sinusfunktion nimmt einen bestimmten Funktionswert an verschiedenen Stellen an. Abbildung 1.29: Arcussinus und Arcuskosinus. Die folgende Tabelle enthält die Definitionsbereiche D und Wertebereiche W der Arcusfunktionen: Funktion D W arcsin [−1, +1] [− π2 , π2 ] arccos [−1, +1] [0, π] arctan [−∞, +∞] [− π2 , π2 ] arccot [−∞, +∞] [0, π] Alternative Schreibweisen für die Arcusfunktionen sind: arcsin(x) = sin−1 (x) = asin(x), arccos(x) = cos−1 (x) = acos(x), arctan(x) = tan−1 (x) = atan(x), arccot(x) = cot−1 (x) = acot(x). Die Arcusfunktionen werden auch zyklometrische Funktionen genannt. Für die Arcusfunktionen gibt es zahlreiche nützliche Beziehungen, die Sie bei Bedarf den gängigen Formelsammlungen entnehmen können. 32 1 Funktionen Abbildung 1.30: Arcustangens und Arcuskotangens. 1.5.7 Hyperbolische Funktionen Während die trigonometrischen Funktionen durch den Schnitt einer Geraden mit einem Kreis erzeugt werden können, werden die hyperbolischen Funktionen durch den Schnitt mit den Hyper√ belästen der Einheitshyperbel y = ± x2 − 1 erzeugt. Die Funktionen werden aber nicht angegeben als Funktion des Steigungswinkels wie bei den trigonometrischen Funktionen, √ sondern als Funktion der von den Geraden mit Steigung g und −g und der Hyperbel y = ± x2 − 1 eingeschlossenen Fläche A. Die geometrische Bedeutung der hyperbolischen Funktionen sinh und cosh ist in Abb. 1.31 dargestellt. Abbildung 1.31: Geometrische Interpretation der hyperbolischen Funktionen sinh und cosh. Analog zu den trigonometrischen Funktionen Sinus, Kosinus, Tangens und Kotangens können auch 1 Funktionen 33 die entsprechenden hyperbolischen Funktionen definiert werden: Sinus hyperbolicus Cosinus hyperbolicus Tangens hyperbolicus Cotangens hyperbolicus sinh(x), cosh(x), tanh(x) = sinh(x)/ cosh(x), coth(x) = 1/ tanh(x). Die Hyperbelfunktionen lassen sich mit Hilfe der Exponentialfunktion ausdrücken: sinh x = cosh x = tanh x = coth x = ex − e−x , 2 ex + e−x , 2 x −x e −e , ex + e−x ex + e−x . ex − e−x (1.95) (1.96) (1.97) (1.98) Hyperbolische und trigonometrische Funktionen können in der komplexen Ebene als gleichwertige Funktionen dargestellt werden. Durch Verwendung imaginärer Argumente werden die Funktionen ineinander übergeführt. Diesen Zusammenhang werden wir im Kapitel 6 näher behandeln. Die Funktionsgraphen der wichtigsten dieser Funktionen sind in Abb. 1.32 und 1.33 dargestellt. Abbildung 1.32: Die hyperbolischen Funktionen sinh and cosh. Abbildung 1.33: Die hyperbolischen Funktionen tanh and coth. Wichtige Zusammenhänge zwischen den hyperbolischen Funktionen lassen sich aus der Gleichung sinh2 (x) = cosh2 (x) − 1 (1.99) ableiten. 1.5.8 Areafunktionen Die inversen Hyperbelfunktionen werden als Areafunktionen bezeichnet. (Der Name kommt daher, dass wir die eingeschlossene Fläche A, also lateinisch “area”, erhalten, wenn wir die hyperbolischen Funktionen umkehren.) 34 1 Funktionen Abbildung 1.34: Die Areafunktionen Arsinh und Arcosh (links) sowie Artanh und Arcoth (rechts). Die Areafunktionen können mit Hilfe von Logarithmen ausgedrückt werden: Arsinh(x) = ln(x + x2 + 1), Arcosh(x) = ln(x + x2 − 1), 1 1+x ln , Artanh(x) = 2 1−x 1 x+1 ln . Arcoth(x) = 2 x−1 (1.100) (1.101) (1.102) (1.103) Diese Formeln erhält man durch direkte Umkehrung der hyperbolischen Funktionen. Zusammenhänge zwischen den verschiedenen Areafunktionen können den gängigen Formelsammlungen entnommen werden. Kapitel 2 Vektoren 2.1 Grundlagen In der Physik ist es oft notwendig, von gewissen Größen nicht nur deren Betrag, sondern auch deren Richtung zu kennen. Wenn wir mit dem Fahrrad irgendwohin fahren, ist unsere Bewegungsrichtung genau so wichtig wie der Betrag unserer Geschwindigkeit. Solche Größen nennt man Vektoren. Beispiele für Vektoren sind: Kraft, Geschwindigkeit, Beschleunigung, Feldstärke, Flächenelement, Impuls und Dipolmoment. Größen, die keine Richtung besitzen, nennen wir Skalare. Dazu zählen: Zeit, Masse, Volumen, Dichte, elektrische Ladung und Energie. Wir definieren also Vektoren wie folgt: Definition: Ein Vektor ist eine gerichtete Größe. Er wird durch eine Richtung und eine Länge (einen Betrag) beschrieben. Im Folgenden werden wir Vektoren durch einen Pfeil kennzeichnen, zum Beispiel F und v . Häufig werden Vektoren aber auch im Fettdruck angegeben, zum Beispiel F und v. Bei einer physikalischen Vektorgröße gehört zur vollständigen Beschreibung auch die Angabe einer Maßeinheit. Der Betrag besteht aus Maßzahl und Einheit. Kräfte messen wir zum Beispiel in der Einheit Newton (abgekürzt N): |F1 | = F1 = 100N. Hier haben wir den Betrag eines Vektors, also dessen Länge, mit Hilfe von senkrechten Strichen ausgedrückt. Graphisch können wir Vektoren als Pfeile darstellen mit Länge und Richtung (siehe Abb. 2.1). Abbildung 2.1: Ein Vektor r lässt sich als Pfeil in einem rechtwinkligen Koordinatensystem darstellen. In diesem zweidimensionalen Beispiel hat der Vektor r die Komponenten ∆x und ∆y: r = (∆x, ∆y). Der Vektor ist durch Angabe des Anfangspunktes Q und des Endpunktes P eindeutig festgelegt. 35 36 2 Vektoren Ein Vektor lässt sich auch durch Angabe von Anfangspunkt Q und Endpunkt P eindeutig festlegen. −− → Dann schreiben wir QP . Wenn wir als Anfangspunkt Q den Ursprung (0, 0, 0) des Koordinatensystems wählen (siehe Abb. 2.2 für den 2-dimensionalen Fall), so kann der Ortsvektor r des Punktes P = P (x, y, z) in kartesischen Koordinaten geschrieben werden als r = (x, y, z). (2.1) r = (rx , ry , rz ). (2.2) Oft finden wir auch die Notation Abbildung 2.2: Falls wir als Ausgangspunkt Q den Ursprung wählen, können wir r als den Ortsvektor des Punktes P = (x, y) deuten. Der Ortsvektor r gibt die Lage des Punktes P relativ zum Ursprung an. Abbildung 2.3: Der Verschiebungsvektor r = r2 − r1 ist der Verbindungsvektor zwischen Punkt P1 mit Ortsvektor r1 und Punkt P2 mit Ortsvektor r2 . Vektoren können auch Verschiebungen beschreiben. Der Verschiebungsvektor zwischen den Punkten P1 und P2 ist die Differenz der Ortsvektoren r1 und r2 der Punkte P1 und P2 : r = r2 − r1 . (2.3) Was genau die Differenz zweier Vektoren bedeutet, werden wir später sehen. Hier ist es wichtig anzumerken, dass in der graphischen Darstellung Pfeile mit gleicher Richtung und gleichem Betrag aber unterschiedlichen Ausgangspunkten zum selben Vektor gehören. Ein graphisch dargestellter Pfeil ist also nur einer von vielen Repräsentanten eines Vektors (siehe Abb. 2.4). Von besonderer Bedeutung sind der Nullvektor und der Einheitsvektor: Nullvektor: 0, |0| = 0, hat Länge Null und keine Richtung. 2 Vektoren 37 Abbildung 2.4: Pfeile, welche durch Parallelverschiebung ineinander übergeführt werden können, also gleichen Betrag und gleiche Richtung besitzen, gehören zum selben Vektor. Einheitsvektor: e, |e| = 1, hat Länge 1, wird verwendet, um Richtungen anzugeben (z. B. Einheitsvektoren ex , ey , ez entlang der Achsen eines kartesischen Koordinatensystems). Einheitsvektoren werden auch als normiert bezeichnet. 2.2 Koordinatensysteme Vektoren können auf verschiedene Weise dargestellt werden. Bisher haben wir dazu kartesische Koordinaten verwendet. Bei gewissen Problemen sind andere Koordinatensysteme, die die Symmetrien des Problems auf natürliche Weise berücksichtigen, oft günstiger (z.B. Kugelkoordinaten, Zylinderkoordinaten). Im Folgenden werden wir kurz die Darstellung von Vektoren in verschiedenen Koordinatensystemen besprechen. 2.2.1 Kartesische Koordinaten Unter einem kartesischen Koordinatensystem versteht man rechtwinklige Koordinatensysteme, die wir bereits zur Darstellung von Funktionen verwendet haben (siehe Abb. 2.5). Die Achsen eines kartesischen Koordinatensystems stehen senkrecht aufeinander. Kartesische Koordinatensysteme können für beliebig viele Dimensionen definiert werden. Abbildung 2.5 zeigt ein zweidimensionales und ein dreidimensionales Beispiel. Mit Hilfe der Einheitsvektoren ex , ey und ez (auch Basisvektoren genannt) in Richtung der Koordinatenachsen können wir den Ortsvektor r auch darstellen als so genannte Linearkombination: r = (x, y, z) = (rx , ry , rz ) = xex + yey + zez . (2.4) In kartesischen Koordinaten ergibt sich der Betrag (Länge) des Vektors aus dem Satz von Pythagoras: r = |r| = x2 + y 2 = rx2 + ry2 , (2.5) (2.6) r = |r| = x2 + y 2 + z 2 = rx2 + ry2 + rz2 . Der Einheitsvektor er in Richtung eines bestimmten Vektors r = 0 ergibt sich durch Division des Vektors durch seinen Betrag: er = r . |r| Dadurch erhält der Einheitsvektor er die Länge 1. (2.7) 38 2 Vektoren Abbildung 2.5: Zweidimensionales (2d) und dreidimensionales (3d) kartesisches Koordinatensystem. Die Einheitsvektoren ex , ey und ez zeigen in Richtung der Koordinatenachsen. Die Achsen des dreidimensionalen Koordinatensystems bilden ein so genanntes “Rechtssystem”, das wir weiter unten genauer besprechen werden. Beispiel: r = (3, 4, 5) = 3ex + 4ey − 5ez , √ √ r = |r| = 32 + 42 + (−5)2 = 9 + 16 + 25 = 50. (2.8) (2.9) Einheitsvektor: 3 1 r er = = √ 4 . |r| 50 −5 2.2.2 (2.10) Polarkoordinaten Anstelle der x- und y-Koordinate eines Punktes P in der Ebene können wir seine Lage auch durch seine Entfernung r vom Ursprung und durch den Winkel ϕ, den die Verbindungslinie vom Punkt zum Ursprung mit der x-Achse einschließt, angeben (siehe Abb. 2.6). Dabei wird der Winkel ϕ gegen den Uhrzeigersinn bestimmt. Der Abstand r und der Winkel ϕ sind die so genannten Polarkoordinaten des Punktes P (und seines Ortsvektors r). Abbildung 2.6: Polarkoordinaten r und ϕ des Vektors r. Wie aus Abb. 2.6 ersichtlich ergeben sich die kartesischen Koordinaten wie folgt aus den Polarko- 2 Vektoren 39 ordinaten: x = y = r cos ϕ, r sin ϕ. (2.11) (2.12) Umgekehrt kommen wir durch r = x2 + y 2 y ϕ = arctan x r>0 (2.13) 0 ≤ ϕ < 2π (2.14) von kartesischen zu Polarkoordinaten. Polarkoordinaten bilden ein so genanntes krummliniges Koordinatensystem (siehe Abb. 2.7). Abbildung 2.7: Durch Angabe von r und ϕ definieren wir einen Punkt in der Ebene. Die durch r = const definierten Kurven sind Kreise um den Ursprung und ϕ = const definiert vom Ursprung ausgehende Halbgeraden. Beispiel: P = (3, −4) ⇒ Ortsvektor r = 3 −4 √ 32 + 42 = 25 = 5 −4 ϕ = arctan (die Umkehrung des tan ist nicht eindeutig). = −53◦ 3 r = |r| = (2.15) (2.16) (2.17) Im Kapitel 1.1 haben wir Kurven (Funktionsgraphen) in kartesischen Koordinaten dargestellt. Wir können das aber auch in Polarkoordinaten tun, indem wir den Abstand r vom Ursprung als Funktion des Winkels darstellen, zum Beispiel 1 . r(ϕ) = √ cos 2ϕ (2.18) Durch Einsetzen dieser Gleichung in die Formel zur Umrechnung von Polarkoordinaten in kartesische Koordinaten erhalten wir die Kurve in Parameterform mit ϕ als Parameter: x y cos ϕ , = r cos ϕ = √ cos 2ϕ sin ϕ = r sin ϕ = √ . cos 2ϕ (2.19) (2.20) 40 2 Vektoren √ Abbildung 2.8: In Polarkoordinaten kann die Hyperbel durch r = 1/ cos 2ϕ ausgedrückt werden. Wir wollen nun den Parameter ϕ eliminieren. Dazu stellen wir fest, dass cos 2ϕ = cos2 ϕ − sin2 ϕ und erhalten cos ϕ , (2.21) x = 2 cos ϕ − sin2 ϕ sin ϕ . (2.22) y = 2 cos ϕ − sin2 ϕ Quadrieren ergibt x2 = y2 = cos2 ϕ , cos2 ϕ − sin2 ϕ sin2 ϕ . cos2 ϕ − sin2 ϕ (2.23) (2.24) Wenn wir nun y 2 von x2 subtrahieren, erhalten wir: x2 − y 2 = cos2 ϕ sin2 ϕ cos2 ϕ − sin2 ϕ − = = 1. cos2 ϕ − sin2 ϕ cos2 ϕ − sin2 ϕ cos2 ϕ − sin2 ϕ (2.25) Dies ist die Kurvengleichung für eine Hyperbel x2 − y 2 = 1, y=± x2 − 1. (2.26) Eine der ersten Anwendungen von ebenen Polarkoordinaten, die Ihnen im 1. Semester begegnen wird, ist die Kreisbewegung. Im Allgemeinen beschrieben wird die Bewegung eines Objektes durch Angabe seines Ortes als Funktion der Zeit: r = r(t). (2.27) Ein zweidimensionales Beispiel einer dadurch entstehenden Bahnkurve ist in Abb. 2.9 dargestellt. Bei einer Kreisbewegung bewegt sich das Objekt (durch einen Punkt dargestellt) auf einer Kreisbahn (siehe Abb. 2.10). Um die Kreisbewegung zu beschreiben, suchen wir die kartesischen Koordinaten x(t) und y(t) als Funktion der Zeit t. Dies lässt sich in Polarkoordinaten sehr einfach bewerkstelligen. Bei einer 2 Vektoren 41 Abbildung 2.9: Bahnkurve (auch Trajektorie genannt) eines Punktes, der sich in der Ebene bewegt. Abbildung 2.10: Kreisbewegung eines Punktes in der Ebene. gleichförmigen Kreisbewegung ist der Abstand vom Ursprung konstant, d. h. r = const. Der Winkel aber ändert sich mit der Zeit. Da die Bewegung gleichförmig ist, wächst der Winkel linear mit der Zeit: ϕ(t) = ωt. (2.28) Dabei ist ω die so genannte Winkelgeschwindigkeit, die in unserem Fall konstant ist. In kartesischen Koordinaten können wir dann die Bewegung beschreiben durch: x = r cos(ϕ(t)) = r cos ωt, (2.29) y = r sin(ϕ(t)) = r sin ωt. (2.30) Sowohl die x- als auch die y-Koordinate des Punktes ändern sich auf nicht triviale Weise mit der Zeit. Hier haben wir ausgenutzt, dass sich das Problem durch Wahl eines geeigneten Koordinatensystems wesentlich vereinfacht. Beispiel: Zykloide Als weiteres Beispiel suchen wir nach der Kurve, die ein Punkt eines auf einer Ebene rollenden Rades beschreibt (siehe Abb. 2.11). Wir nehmen an, dass zu Beginn der Punkt im Ursprung ist. 42 2 Vektoren Abbildung 2.11: Ein Punkt auf einem rollenden Rad beschreibt eine Zykloide. Nachdem sich das Rad um den Winkel ϕ gedreht hat, hat sein Mittelpunkt die Strecke ϕr zurückgelegt. Der Punkt ist in x-Richtung jedoch um r sin ϕ zurückgeblieben: x = ϕ · r − r sin ϕ. (2.31) Für die y-Koordinate des Punktes gilt y = r − r cos ϕ. (2.32) Die Bahnkurve in kartesischen Koordinaten ergibt sich also durch Addition von linearer Bewegung und Kreisbewegung. 2.2.3 Zylinderkoordinaten Durch ebene Polarkoordinaten können wir einen Punkt in der xy-Ebene definieren. Wenn wir zu diesen Koordinaten noch eine z-Koordinate hinzufügen, legen wir damit einen Punkt im Raum fest. Diese Koordinaten nennen wir die Zylinderkoordinaten ρ, ϕ und z (siehe Abb. 2.12). Hier verwenden wir ρ statt r für die Länge der Projektion des Vektors r in die xy-Ebene, um diese Länge vom Betrag des Ortsvektors r zu unterscheiden. Durch ρ =const, ϕ =const und z =const werden folgende Flächen definiert: ϕ = const: ρ = const: z = const: Halbebene durch z-Achse, Zylinder mit der z-Achse als Rotationsachse, Ebene normal zur z-Achse. Aus bekannten Zylinderkoordinaten lassen sich die kartesischen Koordinaten bestimmen: x = y = ρ cos ϕ, ρ sin ϕ, (2.33) (2.34) z z. (2.35) = Umgekehrt gilt: ρ = ϕ = z = x2 + y 2 , y , arctan x z. (2.36) (2.37) (2.38) 2 Vektoren 43 Abbildung 2.12: Zylinderkoordinaten. Zylinderkoordinaten sind bei Situationen sinnvoll, bei denen die betrachteten Größen rotationssymmetrisch bezüglich einer Achse sind, z.B. das Magnetfeld um einen stromdurchflossenen Draht oder das Trägheitsmoment eines Zylinders. 2.2.4 Kugelkoordinaten In Kugelkoordinaten stellen wir die Lage eines Punktes mit Ortsvektor r durch seinen Abstand r = |r| vom Ursprung sowie zwei Winkel ϕ (Azimut) und ϑ (Elevation) dar. Dabei ist ϑ der Winkel zwischen dem Ortsvektor r und der positiven z-Achse. ϑ ist ähnlich der geographischen Breite (die geographische Breite ist jedoch am Äquator identisch 0, während ϑ am Nordpol verschwindet) und ϕ entspricht der geographischen Länge. Der Winkel ϕ ist der Winkel zwischen der Projektion von r in die xy-Ebene und der positiven x-Achse. Die Geometrie der Kugelkoordinaten ist in Abb. 2.13 dargestellt. Die Kugelkoordinaten r, ϕ und ϑ haben folgende Wertebereiche: 0 ≤ r, (2.39) 0 ≤ ϕ < 2π, 0 ≤ ϑ ≤ π. (2.40) (2.41) Kugelkoordinaten können durch folgende Ausdrücke in kartesische Koordinaten umgewandelt werden. Am einfachsten ist der Ausdruck für die z-Koordinate: z = r cos ϑ. (2.42) Die x- und y-Koordinaten schreiben wir zunächst als x = y = ρ cos ϕ, ρ sin ϕ. (2.43) (2.44) Da aber ρ = r sin ϑ ist, erhalten wir schließlich x y = r sin ϑ cos ϕ, = r sin ϑ sin ϕ, (2.45) (2.46) z = r cos ϑ. (2.47) 44 2 Vektoren Abbildung 2.13: Kugelkoordinaten. Aus den kartesischen Koordinaten können die Kugelkoordinaten durch r = x2 + y 2 + z 2 , z x2 + y 2 = arccos ϑ = arctan , z x2 + y 2 + z 2 y ϕ = arctan x (2.48) (2.49) (2.50) bestimmt werden. Durch r =const, ϕ =const und ϑ =const werden folgende Flächen definiert: r = const: ϕ = const: ϑ = const: 2.3 Kugeln um den Ursprung, Halbebenen durch z-Achse, Kegel um z-Achse mit Ursprung als Spitze. Vektoralgebra Wir befassen uns als nächstes mit den Rechenregeln für Vektoren in kartesischen Koordinaten. 2.3.1 Gleiche, inverse und parallele Vektoren • Zwei Vektoren sind gleich, a = b, wenn sie in Betrag und Richtung übereinstimmen. • Zwei Vektoren a und b sind invers, wenn sie denselben Betrag besitzen aber entgegengesetzte Richtung, das heißt a = −b. • Zwei Vektoren sind parallel (oder genauer: gleichsinnig parallel), a||b, wenn sie gleiche Richtung haben. Das heißt, a = λb mit λ > 0. Wenn die beiden Vektoren die entgegengesetzte 2 Vektoren 45 Richtung haben, nennt man sie antiparallel (oder gegensinnig parallel). In diesem Fall ist a = λb mit λ < 0. Der zu Vektor a gehörende Gegenvektor (oder inverse Vektor) −a besitzt den gleichen Betrag aber entgegengesetzte Richtung. Komponentenweise können wir den inversen Vektor schreiben als −ax ax −a = −ay . (2.51) a = ay , −az az 2.3.2 Vektoraddition und -subtraktion Abbildung 2.14: Vektoraddition. Die Addition zweier Vektoren a und b, c = a + b, (2.52) kann graphisch durch Aneinanderhängen erfolgen. Dazu verschieben wir den Vektor b parallel und hängen seinen Anfangspunkt an den Endpunkt von a. Der Summenvektor c ist dann der Vektor vom Anfangspunkt von a zum Endpunkt des verschobenen Vektors b. Dies ist in Abb. 2.14 graphisch dargestellt. In kartesischen Koordinaten erfolgt die Addition zweier Vektoren komponentenweise: bx ax + b x cx ax c = a + b = ay + by = ay + by = cy . az bz az + b z (2.53) cz In der Darstellung mit Einheitsvektoren gilt für die Addition: c = a + b = axex + ay ey + az ez + bxex + byey + bzez = = (ax + bx )ex + (ay + by )ey + (az + bz )ez cxex + cyey + cz ez . Der Nullvektor 0 = 0 0 0 (2.54) (2.55) 46 2 Vektoren ist das neutrale Element der Addition. Das heißt, dass die Addition des Nullvektors zu einem beliebigen Vektor diesen nicht verändert: a + 0 = a. (2.56) Das inverse Element der Vektoraddition ist: −ax −ay . −az − a = (2.57) Addition eines Vektors und seines inversen Elements ergibt den Nullvektor: ax − ax 0 a + (−a) = ay − ay = 0 = 0. az − az 0 (2.58) Abbildung 2.15: Der Vektor b wird vom Vektor a subtrahiert, indem der inverse Vektor −b zum Vektor a addiert wird. Die Subtraktion eines Vektors b vom Vektor a ergibt sich aus der Addition des inversen Elements: ax − b x a − b = a + (−b) = ay − by . az − b z (2.59) Die Vektorsubtraktion ist in Abb. 2.15 graphisch dargestellt. Weiters gelten das Kommutativgesetz a + b = b + a (2.60) (a + b) + c = a + (b + c) = a + b + c. (2.61) und das Assoziativgesetz 2 Vektoren 2.3.3 47 Multiplikation eines Vektors mit einem Skalar Die Multiplikation eines Vektors a mit einem Skalar α kann als eine α-fach hintereinander ausgeführte Verschiebung um a aufgefasst werden. Damit kann man sie auf eine wiederholte Addition zurückführen, z.B. a + a = 2a, (2.62) a + a + a = 3a. (2.63) Graphisch (siehe Abb. 2.16) erkennt man, dass dabei die Richtung des Vektors erhalten bleibt, sich seine Länge jedoch ändert. Abbildung 2.16: Multiplikation eines Vektors mit einem Skalar (hier ist der Skalar gleich 3). Während durch die Multiplikation die Richtung des Vektors unverändert bleibt, hat sich seine Länge um den Faktor 3 verändert. In kartesischen Koordinaten erfolgt die Multiplikation mit einem Skalar komponentenweise αax αa = αay . αaz (2.64) Für den Betrag von b = αa gilt: |b| = |αa| = (αax )2 + (αay )2 + (αaz )2 = α2 (a2x + a2y + a2z ) = |α||a|. (2.65) Die Division eines Vektor durch einen Skalar λ entspricht der Multiplikation des Vektors mit dem Skalar µ = 1/λ. Weiters gelten für die Multiplikation eines Vektors mit einem Skalar die Distributivgesetze α(a + b) = αa + αb (2.66) (α + β)a = αa + βa (2.67) α(βa) = (αβ)a = αβa. (2.68) und sowie das Assoziativgesetz 48 2.4 2.4.1 2 Vektoren Skalarprodukt Definition Das Skalarprodukt (innere Produkt) zweier Vektoren a und b ist die Zahl c = a · b = |a||b| cos α. (2.69) Dabei sind |a| und |b| die Beträge von a und b, und α ist der von ihnen eingeschlossene Winkel (siehe Abb. 2.17). Für das Skalarprodukt verwendet man auch (vor allem in der Quantenmechanik) die so genannte Bra-und-Ket-Notation a · b oder a|b. Abbildung 2.17: Das Skalarprodukt von a und b ist c = |a||b| cos α. Geometrisch betrachtet ist das Skalarprodukt das Produkt des Betrages von a mit dem Betrag des Anteils von b in Richtung a (siehe Abb. 2.17). (Natürlich könnte man auch sagen: das Skalarprodukt ist das Produkt des Betrages von b mit dem Betrag des Anteils von a in Richtung b.) 2.4.2 Rechenregeln Für das Skalarprodukt gelten das Kommutativgesetz a · b = b · a, (2.70) (λa) · b = λ(a · b) = a · (λb) = λa · b, (2.71) a · (b + c) = a · b + a · c. (2.72) das Assoziativgesetz und das Distributivgesetz Im Folgenden werden wir diese Rechenregeln aus der geometrischen Definition des Skalarproduktes ableiten. Zunächst halten wir fest, dass die Definition (2.69) bezüglich einer Vertauschung von a und b symmetrisch ist, d. h. eine Vertauschung von a und b ändert das Skalarprodukt nicht. Infolgedessen gilt das Kommutativgesetz: a · b = b · a. (2.73) Weiters beobachten wir, dass die Multiplikation des Vektors a mit einem positiven Skalar λ auf das Skalarprodukt folgende Wirkung hat (siehe Abb. 2.18a): (λa) · b = |λa||b| cos α = λ|a||b| cos α. (2.74) 2 Vektoren 49 Abbildung 2.18: (a) Durch Multiplikation des Vektors a mit einem positiven Skalar λ ändert sich nur die Länge des Vektors, aber nicht der eingeschlossen Winkel α. (b) Multiplizieren wir a mit einem negativen Skalar, ändert sich der eingeschlossene Winkel von α auf π − α. Ist λ negativ, müssen wir berücksichtigen, dass der eingeschlossene Winkel sich von α auf (π − α) ändert (siehe Abb. 2.18b): (λa) · b = |λa||b| cos(π − α) = |λ||a||b|(− cos α) = λ|a||b| cos α. (2.75) Somit haben wir in beiden Fällen: (λa) · b = λ(a · b). (2.76) Aufgrund der Kommutativität erhalten wir auch a · (λb) = λ(a · b). (2.77) Wir fassen diese Ergebnisse im Assoziativgesetz zusammen: (αa) · b = α(a · b) = a · (αb) = αa · b. (2.78) Abbildung 2.19: Skalarprodukt des Vektors a mit der Summe b + c. Schließlich betrachten wir das Skalarprodukt eines Vektors a mit der Summe b + c der Vektoren b und c. Wie man in Abb. 2.19 sehen kann, ist die Projektion d = |b+c| cos α des Summenvektors b+c auf den Vektor a gleich der Summe der Projektionen b = |b| cos β und c = |c| cos γ der Vektoren b und c auf den Vektor a. (Dies gilt sowohl in zwei als auch in drei Dimensionen.) Folglich gilt: a · (b + c) = |a||b + c| cos α = |a|d = |a|(b + c ) = |a|(|b| cos β + |c| cos γ) (2.80) = |a||b| cos β + |a||c| cos γ = a · b + a · c. (2.81) (2.79) Diese Eigenschaft ist das Distributivgesetz: a · (b + c) = a · b + a · c. (2.82) 50 2.4.3 2 Vektoren Komponentenweise Darstellung In kartesischen Koordinaten ist das Skalarprodukt gegeben durch: ax bx a · b = ay · by = ax bx + ay by + az bz . az bz (2.83) Durch diese Gleichung besitzen wir eine einfache Vorschrift, um das Skalarprodukt zu berechnen. Von ihrer Gültigkeit kann man sich leicht in der Darstellung mit Basisvektoren überzeugen: a · b = (axex + ay ey + az ez ) · (bxex + by ey + bz ez ) = ax bx (ex · ex ) + ax by (ex · ey ) + ax bz (ex · ez ) + ay bx (ey · ex ) + ay by (ey · ey ) + ay bz (ey · ez ) + az bx (ez · ex ) + az by (ez · ey ) + az bz (ez · ez ), (2.84) wobei wir das Distributivgesetz verwendet haben. Da die Einheitsvektoren ex , ey und ez definitionsgemäß Länge eins besitzen, ex · ex = ey · ey = ez · ez = 1, (2.85) und aufeinander senkrecht stehen (d.h. cos α = 0), ei · ej = 0 für i = j, (2.86) gilt a · b = ax bx + ay by + az bz . 2.4.4 (2.87) Anwendungen Das Skalarprodukt findet vielfältige Verwendung. So können wir beispielsweise den Betrag eines Vektors a mit Hilfe des Skalarprodukts berechnen: √ (2.88) a · a = |a| · |a| cos α = |a| · |a| ⇒ |a| = a · a. =1 Mit dem Skalarprodukt können wir Vektoren auf Orthogonalität prüfen. Falls der Vektor a auf den Vektor b senkrecht steht (d.h., wenn sie orthogonal sind, a ⊥ b), ist der Winkel α ein rechter Winkel, α = π2 , und cos α = 0. Also gilt: a · b = |a| · |b| cos α = 0. (2.89) Da cos α nur für rechte Winkel verschwindet, haben wir a · b = 0 ⇔ a ⊥ b. (2.90) Beispiel: 1 4 6 · 2 = 4 + 12 − 16 = 0. 4 −4 (2.91) 2 Vektoren 51 Man kann das Skalarprodukt auch dazu verwenden, um den Winkel zwischen zwei Vektoren a und b zu bestimmen. Aus a · b = |a||b| cos α folgt nämlich α = arccos a · b |a| · |b| (2.92) . (2.93) Der Winkel zwischen der Koordinatenachse mit Einheitsvektor ei und einem Vektor a ist cos αi = ai a · ei = . |a| |a| (2.94) Dabei ist ai die Komponente des Vektors a in Richtung des Einheitsvektors ei . Ferner gilt: cos2 αx + cos2 αy + cos2 αz = 1, (2.95) wobei αx , αy und αz die Winkel sind, die der Vektor a mit der x-, y- und z-Achse einschließt. Wegen | cos ϕ| ≤ 1 ergibt sich aus der Definition des Skalarpodukts die Cauchy-Schwarzsche Ungleichung: |a · b| ≤ |a||b|. (2.96) Das Gleichheitszeichen gilt bei Parallelität beziehungsweise Antiparallelität, da in diesem Fall | cos α| = 1. Abbildung 2.20: Der Kosinussatz c2 = a2 + b2 − 2ab cos α setzt die Seiten eines Dreiecks mit einem der Winkel in Beziehung. Mit Hilfe des Skalarprodukts können wir auch den so genannten Kosinussatz herleiten. Betrachten wir dazu das Dreieck, das von den Vektoren a, b, und c = a − b begrenzt wird (siehe Abb. 2.20). Das Skalarprodukt von c mit sich selbst ergibt |c|2 = c ·c = (a −b)·(a −b) = a ·a − 2a ·b +b ·b. Unter Verwendung der Schreibweise a = |a|, b = |b| und c = |c| lässt sich der Kosinussatz ausdrücken als: c2 = a2 + b2 − 2ab cos α. (2.97) Für ein rechtwinkliges Dreieck, also α = π/2, ist das der Pythagoräische Lehrsatz. Wir wollen nun die Projektion eines Vektors auf einen anderen näher betrachten. In Abb. 2.21 ist ba die Projektion des Vektors b auf den Vektor a. Man kann ba auch als die Komponente von b in Richtung von a auffassen. Für den Betrag der Projektion gilt |ba | = |b| cos ϕ. (2.98) Wegen a · b = |a||b| cos ϕ haben wir cos ϕ = (a · b)/(|a||b|) und somit a · b |ba | = = ea · b. |a| (2.99) 52 2 Vektoren Abbildung 2.21: Projektion ba des Vektors b auf den Vektor a. Da ba die selbe Richtung hat wie a, muss gelten: ba = = a |ba |ea = |ba | |a| a · b · a. |a|2 (2.100) Abbildung 2.22: Die Kraft F leistet durch Verschiebung eines Objektes um den Vektor s die Arbeit W = F · s. Eine Anwendung, in dem die Projektion eines Vektors auf einen anderen benötigt wird, ist die Berechnung der entlang eines geradlinigen Weges s durch die konstante Kraft F geleisteten Arbeit (siehe Abb. 2.22). Da nur die Kraftkomponente Fs in Richtung des Verschiebungsvektors Arbeit leistet, gilt W = |Fs ||s|. (2.101) Hier haben wir die aus der Mechanik bekannte Beziehung Arbeit = Kraft × Weg (oder genauer: Arbeit = Kraftkomponente in Wegrichtung × zurückgelegtem Weg) verwendet. Der Vektor Fs ist die Projektion der Kraft F auf den Verschiebungsvektor s. Unter Verwendung der obigen Formeln für den Betrag der Projektion erhalten wir F · s · |s| = F · s. W = |Fs ||s| = |s| (2.102) Beispiel: Ein Massenpunkt wird von einer konstanten Kraft F = (−10N, 2N, 5N) von P1 = (0m, −1m, −4m) nach P2 = (−1m, 5m, −3m) verschoben. Wir messen hier Abstände in Metern (m) und Kräfte in Newton (N). Welche Arbeit wird dabei verrichtet und wie groß ist der Winkel zwischen F und dem Verschiebungsvektor? 2 Vektoren 53 Der Massenpunkt wird um den Vektor −1m 0m −1m −−−→ s = P1 P2 = 5m − −1m = 6m −3m −4m 1m verschoben. Dadurch leistet die Kraft die Arbeit −1m −10N W = F · s = 2N · 6m = (10 + 12 + 5)Nm = 27Nm. (2.103) (2.104) 1m 5N Die Beträge der Verschiebung und der Kraft sind √ |s| = 38m und |F | = √ 129N, (2.105) sodass der Winkel zwischen Kraft und Verschiebungsvektor gegeben ist durch: ϕ = arccos 2.5 2.5.1 F · s 27Nm = arccos 0.386 = 67.32◦ . = arccos √ 129 · 38Nm |F ||s| (2.106) Vektorprodukt Definition Das äußere Produkt (auch Kreuzprodukt oder Vektorprodukt) zweier Vektoren a und b, geschrieben als c = a × b, (2.107) |c| = |a||b| sin α, (2.108) ist ein Vektor mit Betrag wobei α der von den Vektoren a und b eingeschlossene Winkel ist. Der Vektor c ist orthogonal sowohl zu a als auch zu b und zwar so, dass a, b und c ein Rechtssystem bilden (siehe Abb. 2.23). Abbildung 2.23: Das Vektorprodukt c = a×b steht sowohl auf a als auch auf b senkrecht. Zusammen bilden die Vektoren ein Rechtssystem. Abbildung 2.24: Die “rechte-Hand-Regel” ist eine Merkhilfe für die Richtung des äußeren Vektorprodukts. 54 2 Vektoren Abbildung 2.25: Die “gekrümmte-HandRegel”. Abbildung 2.26: Die Schraubenregel. In einem Rechtssystem stehen die Vektoren a, b, c zueinander wie Daumen, Zeigefinger und Mittelfinger der gespreizten rechten Hand (rechte-Hand-Regel, siehe Abb. 2.24). Als Alternative dazu können Sie sich die gekrümmte rechte Hand vorstellen. Wenn die gekrümmten Finger in die Richtung weisen, in der man a am schnellsten in b überführen kann, zeigt der Daumen in Richtung c = a × b (siehe Abb. 2.25). Sie können sich auch eine Schraube vorstellen, mit der Sie a nach b drehen (siehe Abb. 2.26). Dann bewegt sich die Schraube in Richtung von c = a × b. Als dreidimensionales kartesisches Koordinatensystem wird meistens ein Rechtssystem verwendet. Ein Linkssystem wird analog definiert. Vertauschen von a und b macht ein Rechtssystem zu einem Linkssystem. Abbildung 2.27: Der Betrag des Vektorprodukts a × b ist gleich der Fläche des von den Vektoren a und b aufgespannten Parallelogramms. Anschaulich lässt sich der Betrag des Vektorprodukts a × b als die Fläche des von den Vektoren a und b aufgespannten Parallelogramms betrachten (siehe Abb. 2.27): A = |a|h = |a||b| sin α = |a × b|. (2.109) Wir können somit das Vektorprodukt verwenden, um die Fläche des Parallelogramms zu berechnen, das von zwei Vektoren aufgespannt wird. 2.5.2 Rechenregeln Für das Vektorprodukt gelten die folgenden Rechenregeln: • Im Unterschied zum Skalarprodukt ist das Vektorprodukt nicht kommutativ. Das heißt, dass es beim Vektorprodukt auf die Reihenfolge ankommt. Anschaulich ist das klar, denn wenn die Vektoren a, b und a × b ein Rechtssystem bilden, dann müssen die Vektoren a, b und b ×a 2 Vektoren 55 ein Linkssystem bilden (siehe Abb. 2.28). Bei Vertauschung der Multiplikanden weist das Vektorprodukt also in die entgegengesetzte Richtung. Es gilt das Antikommutativgesetz: a × b = −(b × a). (2.110) • Assoziativgesetz für Multiplikation mit einem Skalar λ: (λa) × b = λ(a × b) = a × (λb) = λa × b. (2.111) a × (b + c) = a × b + a × c. (2.112) • Distributivgesetz: Wir wollen diese Rechenregeln nun aus der Definition des Vektorprodukts ableiten. Das Antikommutativgesetz a × b = −(b × a) folgt direkt aus der “rechten-Hand-Regel”: durch Vertauschen von a und b kehrt sich die Richtung des Vektorprodukts einfach um. Betrachten wir nun, was passiert, wenn wir einen der beiden Vektoren, sagen wir a, mit einer positiven Zahl λ multiplizieren (siehe Abb. 2.29). Da sich durch Multiplikation mit λ die Länge der Grundlinie um einen Faktor λ ändert, erhalten wir für die Fläche A des von b und λa aufgespannten Parallelogramms: A = |λa||b| sin α = λ|a||b| sin α = λA. (2.113) Hier ist A die Fläche des von a und b aufgespannten Parallelogramms. Das heißt, |(λa) × b| = λ|a × b| = |λ(a × b)|. (2.114) Da a und λa die selbe Richtung haben, sind (λa)×b und a ×b und somit auch λ(a ×b) parallel. Der Vektor (λa) × b stimmt also sowohl im Betrag als auch in der Richtung mit dem Vektor λ(a × b) überein. Diese beiden Vektoren sind deshalb gleich: (λa) × b = λ(a × b). (2.115) Falls λ negativ ist, müssen wir berücksichtigen, dass λa und a zueinander antiparallel sind und deshalb der Winkel zwischen λa und b zu π − α wird (siehe Abb. 2.30). In diesem Fall ist die Fläche A gegeben durch: A = |λa||b| sin(π − α) = |λ||a||b| sin α = |λ|A. (2.116) Das heißt, |(λa) × b| = |λ||a × b| = |λ(a × b)|. (2.117) Aus der rechten-Hand-Regel folgt nun, dass (λa) × b und a × b antiparallel sind. Somit hat (λa) × b jedoch die selbe Richtung wie λ(a × b) (vergessen wir nicht, dass wir gerade den Fall λ < 0 Abbildung 2.28: Während die Vektoren a, b und a ×b ein Rechtssystem bilden, spannen die Vektoren a, b und b × a ein Linkssystem auf. 56 2 Vektoren Abbildung 2.29: Durch Multiplikation des Vektors a mit dem positiven Skalar λ ändert sich die Grundlinie des aufgespannten Parallelogramms um den Faktor λ. betrachten). Der Vektor (λa) × b stimmt auch in diesem Fall mit dem Vektor λ(a × b) sowohl in Länge als auch im Betrag überein, sodass allgemein gilt: (λa) × b = λ(a × b). (2.118) a × (λb) = λ(a × b) (2.119) (λa) × b = a × (λb) = λ(a × b). (2.120) Analoge Überlegungen führen auf und wir können schreiben: Es bleibt uns noch zu zeigen, dass a × (b + c) = a × b + a × c. Um dies zu tun, wollen wir die Komponenten von a × (b + c) sowie von a × b und a × c explizit bestimmen. Wir wählen dazu ein Koordinatensystem, dessen z-Achse in Richtung des Vektors a zeigt, das heißt 0 (2.121) a = 0 . az Die Vektoren b = (bx , by , bz ) und c = (cx , cy , cz ) sind jedoch beliebig. Durch die spezielle Wahl des Koordinatensystems schränken wir die Gültigkeit der nachfolgenden Überlegungen nicht ein. Wir definieren nun den neuen Vektor b = (bx , by , 0), den wir aus b erhalten, indem wir dessen z-Komponente durch 0 ersetzen. Der Vektor b ist die Projektion von b in die xy-Ebene. Wie Abbildung 2.30: Durch Multiplikation des Vektors a mit dem negativen Skalar λ ändert sich der eingeschlossene Winkel von α auf π − α. 2 Vektoren 57 Abbildung 2.31: Die von a und b sowie von a und b aufgespannten Parallelogramme haben den selben Flächeninhalt. aus Abb. 2.31 ersichtlich ist, haben die Parallelogramme, welche von a und b sowie von a und b aufgespannt werden, den selben Flächeninhalt. Beide besitzen nämlich die selbe Grundlinie, |a|, und die selbe Höhe, |b| sin α = |b |. Somit gilt |a × b| = |a × b |. (2.122) Der Vektor a × b, der in der xy-Ebene liegt, steht normal sowohl auf b als auch auf b . Da auch a × b auf b normal steht und in der xy-Ebene liegt, bedeutet dies, dass a × b und a × b die selbe Richtung haben. Da sie auch im Betrag übereinstimmen (siehe Gleichung (2.122)), sind sie gleich: a × b = a × b . (2.123) Zum Vektor b = (bx , by , 0) bilden wir nun den Vektor b = (−by , bx , 0). Durch Bildung des Skalarprodukts können wir leicht feststellen, dass der Vektor b sowohl auf a als auch auf b normal steht. Aus der rechten-Hand-Regel folgt, dass b genau die Richtung von a × b und somit auch von a × b besitzt. Wenn wir nun den Vektor b mit |a| multiplizieren, erhalten wir einen Vektor, der sowohl in der Richtung als auch im Betrag mit a × b übereinstimmt: |(−|a|by , |a|bx , 0)| = |a||b | = |a × b | = |a × b|. (2.124) −|a|by a × b = |a|bx . 0 (2.125) −|a|cy a × c = |a|cx 0 (2.126) −|a|(by + cy ) a × (b + c) = |a|(bx + cx ) . 0 (2.127) Somit gilt: Analoge Überlegungen führen auf und 58 2 Vektoren Durch komponentenweisen Vergleich der Vektoren erhalten wir das Distributivgesetz für das Vektorprodukt: −|a|cy −|a|(by + cy ) −|a|cy a × (b + c) = |a|(bx + cx ) = |a|cx + |a|cx = a × b + a × c. 0 0 0 2.5.3 (2.128) Komponentenweise Darstellung In kartesischen Koordinaten kann das Vektorprodukt komponentenweise ausgedrückt werden als: ax bx ay b z − az b y a × b = ay × by = az bx − ax bz . az bz ax b y − ay b x (2.129) Dies kann man sich klar machen, indem man a und b mit Hilfe der Einheitsvektoren darstellt und das Distributivgesetz ausnutzt: a × b = (axex + ay ey + az ez ) × (bxex + by ey + bz ez ) = ax bx (ex × ex ) + ax by (ex × ey ) + ax bz (ex × ez ) + ay bx (ey × ex ) + ay by (ey × ey ) + ay bz (ey × ez ) + az bx (ez × ex ) + az by (ez × ey ) + az bz (ez × ez ). (2.130) Da ei × ei = 0 (der Vektor ei ist parallel zu sich selbst) (2.131) und die Einheitsvektoren ex , ey und ez ein Rechtssystem bilden und somit gilt ex × ey = ez , ey × ez = ex , ey × ex = −ez , ez × ey = −ex , (2.132) (2.133) ez × ex = ey , ex × ez = −ey , (2.134) erhalten wir schließlich a × b = ax byez − ax bz ey − ay bxez + ay bzex + az bxey − az byex = (ay bz − az by )ex + (az bx − ax bz )ey + (ax by − ay bx )ez , (2.135) was genau der komponentenweisen Darstellung entspricht, die wir weiter oben angeführt haben. Leichter merken kann man sich die Bildung des Kreuzprodukts folgendermaßen: Zur Berechnung der x-Komponente decken wir auf der linken Seite der Gleichung bx ay b z − az b y ax ay × b y = az b x − ax b z az bz ax b y − ay b x (2.136) zunächst die x-Zeile ab und multiplizieren kreuzweise: (links oben × rechts unten) minus (links unten × rechts oben). Für die y-Komponente des Kreuzprodukts gehen wir analog vor und decken die y-Zeile ab und berechnen wieder (links oben × rechts unten) minus (links unten × rechts oben), wobei wir uns aber das gesamte Schema nach unten durch Kopien der oberen beiden Zeilen ergänzt denken. Für die z-Komponente decken wir schließlich die z-Zeile ab und verfahren analog. 2 Vektoren 2.5.4 59 Anwendungen Durch Berechnung des Vektorprodukts kann man prüfen, ob zwei Vektoren parallel zueinander sind. Wenn a parallel zu b ist (und infolgedessen der eingeschlossene Winkel α verschwindet oder π beträgt), ist sin α = 0 und das Vektorprodukt verschwindet: a × b = 0 ⇔ a||b. (2.137) Eine weitere wichtige Anwendung des Vektorprodukts besteht in der Konstruktion eines Vektors, der auf zwei gegebene Vektoren a und b normal stehen soll. Beispiel: 1 a = 2 3 3 b = 4 5 1 3 2·5−3·4 −2 c = a × b = 2 × 4 = 3 · 3 − 1 · 5 = 4 3 5 1·4−2·3 −2 √ √ |a| = 1 + 4 + 9 = 14 √ √ |b| = 9 + 16 + 25 = 50 √ √ |a × b| = 4 + 16 + 4 = 24. Den Winkel zwischen a und b bestimmen wir folgendermaßen: √ 24 |a × b| = 0.185 . . . sin α = =√ 50 · 14 |a||b| α = 10.67◦. (2.138) (2.139) (2.140) (2.141) (2.142) (2.143) (2.144) Haben wir richtig gerechnet, sollten a und b zu a × b orthogonal stehen, was wir durch Berechnung der entsprechenden Skalarprodukte prüfen können: 1 −2 (2.145) c · a = 4 · 2 = −2 + 8 − 6 = 0, −2 3 3 −2 c · b = 4 · 4 = −6 + 16 − 10 = 0. 5 −2 2.6 2.6.1 (2.146) Spatprodukt Definition Das Spatprodukt (oder gemischtes Produkt) dreier Vektoren a, b und c ist ein Skalar und ist definiert als [abc] = (a × b) · c. (2.147) Anschaulich ist das Spatprodukt (genauer gesagt der Betrag des Spatprodukts) das Volumen des von den drei Vektoren a, b und c aufgespannten Parallelepipeds, das auch Parallelflach oder Spat genannt wird (siehe Abb. 2.32). 60 2 Vektoren Abbildung 2.32: Das Spatprodukt Die geometrische Interpretation des Spatprodukts ergibt sich aus folgender Überlegung. Das Volumen V des von den drei Vektoren aufgespannten Parallelepipeds ist gegeben durch V = A h, (2.148) wobei A die Fläche des von a und b aufgespannten Parallelogramms und h die in Abb. 2.32 dargestellte Höhe des Parallelepipeds ist. Die Fläche A erhalten wir aus dem Vektorprodukt von a und b, A = |a||b| sin α = |a × b|. (2.149) Die Höhe h erhalten wir durch Projektion des Vektors c auf a × b: h = |c|| cos β|. (2.150) Die Betragsstriche garantieren dabei, dass die Höhe nicht negativ wird. Einsetzen ergibt schließlich V = A · h = |a × b||c|| cos β| = |(a × b) · c|. 2.6.2 (2.151) Komponentenweise Darstellung Das Spatprodukt kann mit Hilfe der Komponenten von a, b und c ausgedrückt werden: ax bx cx (a × b) · c = ay × by · cy az bz cz cx ay b z − az b y = a z b x − a x b z · cy ax b y − ay b x = 2.6.3 cz cx (ay bz − az by ) + cy (az bx − ax bz ) + cz (ax by − ay bx ). (2.152) Rechenregeln und Anwendung • Durch die Nichtkommutativität des Kreuzprodukts ist das Spatprodukt nicht kommutativ. Das Vertauschen von zwei Vektoren ändert das Vorzeichen des Spatprodukts: [ abc ] = −[ bac ]. (2.153) • Vektoren können zyklisch vertauscht werden, ohne das Spatprodukt zu ändern: [ abc ] = [ bca ] = [ cab ], (a × b) · c = (b × c) · a = (c × a) · b. (2.154) (2.155) 2 Vektoren 61 • Aus a · b = b · a und der zyklischen Vertauschbarkeit folgt außerdem: (a × b) · c = a · (b × c). • Das Spatprodukt kann als Determinante dargestellt werden: ! ! !a a a ! y z! ! x ! ! [ abc ] = ! bx by bz ! . ! ! !c c c ! x y (2.156) (2.157) z • Das Spatprodukt verschwindet, wenn die Vektoren a und b × c zueinander orthogonal sind. Das ist der Fall, wenn alle Vektoren in der selben Ebene liegen, d.h. wenn sie komplanar sind: [ abc ] = 0 2.7 ⇔ a, b, c komplanar. (2.158) Mehrfachprodukte Für Mehrfachprodukte gelten folgende Rechenregeln: • Doppeltes Kreuzprodukt (bac-cab Regel) a × (b × c) = b(a · c) − c(a · b). (2.159) • Kreuzprodukt von zwei Kreuzprodukten = c[(a × b) · d] − d[( a × b) · c] (a × b) × (c × d) · a] − a[(c × d) · b]. = b[(c × d) (2.160) • Skalarprodukt von zwei Kreuzprodukten = a · (b × (c × d)) (a × b) · (c × d) − (a · d)( b · c). = (a · c)(b · d) (2.161) • Quadrat eines Kreuzprodukts (a × b)2 = |a|2 |b|2 − (a · b)2 . 2.8 2.8.1 (2.162) Anwendungsbeispiele für Vektoren Strömung durch eine Fläche Stellen wir uns eine Flüssigkeit vor, die mit gleichförmiger Geschwindigkeit v strömt (siehe Abb. 2.33). In der Flüssigkeit denken wir uns eine ebene Fläche mit beliebigem Umriss und einem Flächeninhalt f . Wir wollen nun den Fluss durch diese imaginäre Fläche berechnen. Unter dem Fluss verstehen wir das pro Zeiteinheit durch die Fläche hindurch tretende Flüssigkeitsvolumen. Ist die Fläche parallel zur Flussrichtung, tritt keine Flüssigkeit hindurch. In jeder anderen Orientierung tritt Flüssigkeit hindurch. Die Orientierung der Fläche spielt also eine wesentliche 62 2 Vektoren Abbildung 2.33: Strömung durch eine Fläche mit Flächenvektor f. Rolle und es genügt nicht, nur den Flächeninhalt anzugeben. Wir führen daher den Flächenvektor f ein, der neben dem Flächeninhalt von f auch die Orientierung der Fläche im Raum beschreibt: f |f| = f ist orthogonal zur Fläche, der Betrag von f ist gleich dem Flächeninhalt. Zur Berechnung des Flusses betrachten wir nun alle Teilchen, die sich zum Zeitpunkt 0 in der imaginären Fläche befinden. Nach einer Zeit t haben sich alle diese Teilchen um die Distanz v t (2.163) weiterbewegt. Sie liegen jetzt auf einer Fläche, die gleich ist der um v t parallel verschobenen ursprünglichen Fläche. Alle Flüssigkeitsteilchen, die in der Zeit t durch die Fläche hindurch getreten sind, befinden sich in einem schiefen Zylinder. Das Volumen des Zylinders ist Grundfläche f mal Höhe h: V = f h. Um die Höhe h zu bestimmen, berechnen wir die Projektion von v t auf f f . h = (v t)f = v t · f (2.164) (2.165) Das Volumen ist deshalb V = tf v · f = tv · f. f (2.166) Der Fluss ist gleich dem Volumen V pro Zeit t und wir erhalten schließlich Fluss = V = v · f. t (2.167) Der Fluss ist also gegeben durch das Skalarprodukt von v und f. 2.8.2 Rotation eines Körpers Um die Rotation eines Körpers um eine Achse zu beschreiben, verwenden wir die Winkelgeschwindigkeit ω. Sie gibt den Winkel in Bogenmaß an, um den sich der Körper pro Zeiteinheit 2 Vektoren 63 dreht. Um auch die Richtung der Drehachse zu berücksichtigen, führen wir den Winkelgeschwindigkeitsvektor ω ein: ω | ω| = ω ist parallel zur Rotationsachse, der Betrag ist gleich der Winkelgeschwindigkeit. Die Richtung von ω ist so gewählt, dass von der Spitze von ω aus gesehen die Rotation in positiver Richtung, also gegen den Uhrzeigersinn, erfolgt (siehe Abb. 2.34). Wenn die gekrümmten Finger der rechten Hand also der Rotation folgen, zeigt der Daumen in Richtung von ω (siehe Abb. 2.25). Abbildung 2.34: Die Winkelgeschwindigkeit ω ist so definiert, dass von der Spitze aus gesehen die Rotation gegen den Uhrzeigersinn erfolgt. Nun wollen wir den Winkelgeschwindigkeitsvektor ω benutzen, um die Momentangeschwindigkeit eines Punktes auf einem rotierenden Körper zu ermitteln. Der Punkt bewegt sich dabei auf einer Kreisbahn mit dem Radius r (siehe Abb. 2.35). Der pro Zeiteinheit zurückgelegte Winkel ist ω. Daher ist die pro Zeiteinheit zurückgelegte Strecke, also die Geschwindigkeit v = ωr. (2.168) Zur Berechnung von v müssen wir den Radius r bestimmen. Zudem müssen wir beachten, dass v parallel zur Tangente an die Kreisbahn sein muss. Abbildung 2.35: Rotation eines Körpers um eine Achse. All dies lässt sich durch Verwendung des Vektorprodukts sehr einfach erreichen. Es sei x ein Vektor von einem beliebigen Punkt auf der Drehachse zu jenem Punkt, dessen Geschwindigkeit v wir bestimmen möchten. Der Betrag v = |v | ist dann gegeben durch: v = ωr = ω · |x| · sin α = |ω × x|. (2.169) Weiters ist ω ×x sowohl zu ω als auch zu x orthogonal, sodass die Geschwindigkeit auch die richtige Richtung hat. Mit der rechten-Hand-Regel sieht man leicht, dass der Vektor v = ω × x auch die richtige Orientierung hat. (2.170) 64 2.8.3 2 Vektoren Volumen einer Einheitszelle Abbildung 2.36: Einheitszelle eines triklinen Kristalls. Gegeben sei die Einheitszelle eines Kristalls, die von den Vektoren a, b und c aufgespannt wird. Die Längen der Vektoren sind a = 3Å, b = 2Å, und c=2Å. (Die Längeneinheit Ångström, abgekürzt als Å, ist im atomaren Bereich gebräuchlich. Es gilt 1Å=10−10 m.) Der Winkel zwischen den Vektoren ist jeweils 60◦ . Wie groß ist das Volumen der Einheitszelle? Wir wählen zunächst ein kartesisches Koordinatensystem, in dem die x-Achse parallel zum Vektor a ist und die y-Achse so orientiert ist, dass der Vektor b in der xy-Ebene liegt (wir können das Koordinatensystem so orientieren, wie wir wollen). Dann ist a = (3Å, 0, 0) und √ √ b = (2 cos α, 2 sin α, 0) = (2 1 Å, 2 3 Å, 0) = (1Å, 3Å, 0). 2 2 (2.171) (2.172) Abbildung 2.37: Einheitszelle dargestellt in einem geeigneten kartesischen Koordinatensystem. Um c zu finden, beachten wir, dass ac 2 = 3Å , 2 b · c = bc cos 60◦ = bc = 2Å2 . 2 a · c = ac cos 60◦ = (2.173) (2.174) 2 Vektoren 65 Einsetzen ergibt 3Å cx 2 0 · cy = 3cx Å = 3Å cz 0 (2.175) und somit cx = 1Å. (2.176) Weiteres Einsetzen ergibt 1Å cx √ √ 2 2 √ 3Å · cy = cx Å + 3cy Å = 1Å + 3Åcy = 2Å , 0 cz (2.177) woraus folgt 1 cy = √ Å. 3 (2.178) Da der Betrag von c bekannt ist, können wir schreiben 2 c2z + c2x + c2y = 4Å . (2.179) Daraus können wir die z-Komponente des Vektors c bestimmen: c2z " 1 2 8 2 = 4Å − 1Å − Å = Å 3 3 2 2 ⇒ cz = 8 Å. 3 (2.180) Wir erhalten schließlich für den Vektor c: 1 1 √ c = 3 Å. (2.181) 8 3 Aus den nun explizit bekannten Vektoren a, b und c können wir mit Hilfe des Spatprodukts das Volumen der Einheitszelle des Kristalls berechnen: 1 3 1 √ √1 3 V = (a × b) · c = 0 × 3 · 3 Å 0 1 0 √1 0 · 3 √ 8 3 3 3 = 0 8 3 √ 3 Å = 3 8Å3 . (2.182) 66 2 Vektoren Kapitel 3 Differentiation 3.1 Grundbegriffe Betrachten wir ein Objekt (z.B. ein Fahrzeug), das sich gleichförmig fortbewegt. Die Geschwindigkeit ist in diesem Fall durch die pro Zeit zurückgelegte Strecke definiert: v= ∆s s2 − s1 . = t2 − t1 ∆t (3.1) Hier ist ∆s = (s2 − s1 ) die im Zeitintervall ∆t = (t2 − t1 ) zurückgelegte Strecke. Bei gleichförmiger Bewegung könnten wir die Zeiten t2 und t1 beliebig wählen und wir würden immer dasselbe Resultat für die Geschwindigkeit v erhalten. Wenn wir die gleichförmige Bewegung in einem Raumzeitdiagramm graphisch darstellen, indem wir die zurückgelegte Entfernung s als Funktion der Zeit t auftragen, erhalten wir eine Gerade, dessen Steigung die Geschwindigkeit ist (siehe Abb. 3.1). Abbildung 3.1: Raumzeitdiagramm für ein Objekt, das sich gleichförmig, das heißt mit konstanter Geschwindigkeit, fortbewegt. Bei einer ungleichförmigen Bewegung ist dies jedoch anders. In diesem Fall hängt der Quotient (s2 −s1 )/(t2 −t1 ) sehr wohl vom gewählten Intervall [t1 , t2 ] ab. (s2 −s1 )/(t2 −t1 ) ist in diesem Fall die mittlere Geschwindigkeit im Zeitintervall [t1 , t2 ]. In der graphischen Darstellung der Entfernung als Funktion der Zeit erhalten wir in diesem Fall eine gekrümmte Kurve, die in Abb. 3.2 beispielhaft dargestellt ist. Die mittlere Geschwindigkeit (s2 − s1 )/(t2 − t1 ) ist die Steigung der Sekante, die durch die Punkte (t1 , s1 ) und (t2 , s2 ) geht. Wie aus der Abbildung ersichtlich ist, würde ein anders 67 68 3 Differentiation gewähltes Zeitintervall, sagen wir [t1 , t2 ], eine andere Steigung der Sekante und somit eine andere mittlere Geschwindigkeit, nämlich (s2 − s1 )/(t2 − t1 ), ergeben. Abbildung 3.2: Raumzeitdiagramm für ein Objekt, das sich ungleichförmig, das heißt mit einer sich verändernden Geschwindigkeit, fortbewegt. Die Momentangeschwindigkeit v des Objekts zu einem bestimmten Zeitpunkt t (also die Geschwindigkeit, die man etwa vom Tachometer eines Autos ablesen würde) erhalten wir, indem wir zu sehr kleinen Zeitintervallen ∆t übergehen: v = lim ∆t→0 ∆s . ∆t (3.2) In diesem Grenzfall wird aus der Sekante in Abb. 3.2 die Tangente an die Raumzeitkurve und die Geschwindgkeit v(t), die nun von der Zeit t abhängt, ist die Steigung dieser Tangente (siehe Abb. 3.3). Man nennt v(t) auch die Ableitung von s(t) an der Stelle t. Abbildung 3.3: Im Grenzfall eines unendlich kleinen Zeitintervalls wird aus der Sekante aus Abb. 3.2 die Tangente der Kurve. Die Steigung der Tangente der Raum-Zeit-Kurve zur Zeit t ist die Geschwindigkeit des Objekts zur Zeit t . Um nach diesem anschaulichen Beispiel den Begriff der Ableitung formaler einzuführen, betrachten wir zunächst den Differenzenquotienten. Der Differenzenquotient m für eine Funktion y = f (x) ist der Quotient aus der Differenz der Funktionswerte y1 = f (x1 ) und y2 = f (x2 ) und der Differenz der Argumente an den Stellen x1 und x2 : m= y2 − y1 f (x1 + ∆x) − f (x1 ) ∆y = . = ∆x x2 − x1 ∆x (3.3) 3 Differentiation 69 Abbildung 3.4: Der Differenzenquotient m = ∆y/∆x ist die Steigung der Sekante durch die Punkte (x1 , f (x1 )) und (x2 , f (x2 )). Dabei ist ∆y = y2 − y1 und ∆x = x2 − x1 . Der Differenzenquotient ist die Steigung der Sekante durch die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) (siehe Abb. 3.4). Beispiel: Der Differenzenquotient der Funktion f (x) = 2x3 + 4x2 − 1 (3.4) ist: m(x) = = = = f (x + ∆x) − f (x) ∆x 2(x + ∆x)3 + 4(x + ∆x)2 − 1 − 2x3 − 4x2 + 1 ∆x 2(x3 + 3x2 ∆x + 3x∆x2 + ∆x3 ) + 4(x2 + 2x∆x + ∆x2 ) − 1 − 2x3 − 4x2 + 1 ∆x (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x). (3.5) Wenn wir nun zum Grenzfall unendlich kleiner Differenzen übergehen, wird aus dem Differenzenquotienten der Differentialquotient (wir lassen ∆x gegen 0 gehen): f (x) = df (x) ∆f (x) f (x + ∆x) − f (x) = lim = lim . ∆x→0 ∆x ∆x→0 dx ∆x (3.6) Die Notationen f (x) und df (x)/dx sind äquivalent und bezeichnen beide den Differentialquotienten. Der Differentialquotient f (x) wird auch die Ableitung von f (x) nach x genannt. Anschaulich ist der Differentialquotient f (x) die Steigung der Tangente an den Funktionsgraphen der Funktion f (x) an der Stelle x. Verläuft der Funktionsgraph steil, ist der Differentialquotient (oder die Ableitung) groß, für eine flache Kurve ist er klein. Da sich die Steigung des Funktionsgraphen von Ort zu Ort im Allgemeinen ändert, ist - so wie die Funktion f (x) selbst - auch ihre Ableitung f (x) von x abhängig. Das Differential df der Funktion f (x) ist definiert als: df (x) = f (x)dx. (3.7) Das Differential kann betrachtet werden als die infinitesimale Änderung df der Funktion f (x), welche durch eine infinitesimale Änderung dx des Arguments x hervorgerufen wird. Wenn die unabhängige Variable die Zeit ist, verwendet man für die 1. Ableitung auch folgende Notation mit einem Punkt: dx(t) . (3.8) ẋ(t) = dt 70 3 Differentiation Diese Notation ist vor allem in der klassischen Mechanik gebräuchlich. Wir wollen nun für das obige Beispiel den Grenzübergang ∆x → 0 durchführen und den Differentialquotienten f (x) explizit berechnen. Dazu gehen wir vom Ausdruck für den Differenzenquotienten aus: ∆f (x) ∆x = (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x). (3.9) Alle Terme, die ∆x enthalten, verschwinden bei diesem Grenzübergang und wir erhalten: df dx ∆f (x) = lim (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x) ∆x→0 ∆x = 6x + 8x. = lim ∆x→0 2 (3.10) Durch ähnliche Überlegungen lassen sich Differentiationsregeln für die wichtigsten Funktionen ableiten, die wir im nächsten Abschnitt kurz und ohne Herleitung behandeln. 3.2 Differenzierbarkeit Eine Funktion f (x) nennt man an der Stelle x differenzierbar, falls an dieser Stelle die Ableitung f (x) existiert. Die Funktion ist in einem Intervall stetig differenzierbar, falls ihre Ableitung in diesem Intervall stetig ist. Ist eine Funktion an der Stelle x differenzierbar, ist sie dort auch stetig. Hingegen muss eine stetige Funktion nicht überall differenzierbar sein (an Knickstellen ist die Ableitung nicht definiert, siehe Abb. 3.5). An diesen Punkten ist die Funktion nicht differenzierbar (wir können hier keine Tangente anlegen) und die Ableitung existiert daher nicht. Abbildung 3.5: Die Funktion s(t) ist im dargestellten Bereich zwar überall stetig, aber an den Stellen t1 und t2 nicht differenzierbar. Die Ableitung ds(t)/dt ist an diesen Stellen nicht stetig. 3 Differentiation 3.3 71 Wichtige Ableitungen Die Ableitungen der wichtigsten Funktionen sind hier zusammengefasst. Weitere Ableitungen können Sie einer Formelsammlung entnehmen oder mit den folgenden Differentiationsregeln selbst herleiten. 3.4 f (x) f (x) f (x) f (x) xn nxn−1 arcsin x x 1 arccos x sin x cos x arctan x √ 1 1−x2 1 − √1−x 2 1 2 1+x cos x sinh x cosh x ln x − sin x cosh x sinh x a ax ex ax 0 a ex (ln a)ax 1 x Differentiationsregeln Mit Hilfe der im letzten Abschnitt angegebenen Ableitungen und der folgenden Differentiationsregeln können wir auch komplizierte zusammengesetzte Funktionen ableiten. Gegeben seien zwei (differenzierbare) Funktionen f (x) und g(x) und eine Konstante a. 3.4.1 Faktorregel df (x) d (af (x)) = a . dx dx (3.11) Zum Beispiel: y = 7 cos x 3.4.2 ⇒ y = −7 sin x. (3.12) Summenregel df (x) dg(x) d (f (x) + g(x)) = + . dx dx dx (3.13) Zum Beispiel: y = 3x + sin x 3.4.3 ⇒ y = 3 + cos x. (3.14) Produktregel d (f (x) · g(x)) = dx df (x) dx · g(x) + dg(x) dx · f (x). (3.15) y = 2xex + x2 ex = ex x(2 + x). (3.16) Zum Beispiel: y = x2 ex ⇒ 72 3.4.4 3 Differentiation Quotientenregel # $ d f (x) = dx g(x) df (x) dx · g(x) − dg(x) dx · f (x) g(x)2 . (3.17) Zum Beispiel: y= 3.4.5 sin x cos x ⇒ y = 1 cos x cos x + sin x sin x = . cos2 x cos2 x (3.18) Kettenregel d d df dg (f ◦ g)(x) = f (g(x)) = f (g(x)) · g (x) = · . dx dx dg dx (3.19) Bei der Kettenregel leiten wir also die Funktion zunächst nach dem Argument ab und multiplizieren das Resultat mit der Ableitung des Arguments nach der Variablen. Wir multiplizieren also die “äußere Ableitung” mit der “inneren Ableitung”. Zum Beispiel: y = sin(x2 ) f (z) = sin z ⇒ dy = cos x2 · 2x. dx (3.20) ⇒ dy = cos 2x · 2. dx (3.21) ⇒ 2 dy = ex · 2x. dx (3.22) 2 z = g(x) = x y = sin(2x) f (z) = sin z z = g(x) = 2x y = ex 2 f (z) = ez z = g(x) = x2 y = xx = eln x·x ⇒ f (z) = ez z = g(x) = ln x · x 3.4.6 dy 1 = eln x·x ( x + ln x) dx x = xx (1 + ln x). (3.23) Umkehrregel Durch Verkettung einer Funktion mit ihrer Umkehrfunktion ergibt sich die Identität: (f −1 ◦ f )(x) = f −1 (f (x)) = x. (3.24) Wenden wir die Kettenregel auf diesen Ausdruck an, erhalten wir: d −1 f (f (x)) = (f −1 ) (f (x)) · f (x) = 1. dx (3.25) Daraus folgt die praktische Umkehrregel: (f −1 ) (y) = 1 f (f −1 (y)) , (3.26) 3 Differentiation 73 wobei wir f (x) durch y ersetzt und x durch x = f −1 (y) ausgedrückt haben. Zum Beispiel: y = sin x, 3.5 1 d arcsin(y) = . dy 1 − y2 ⇒ x = arcsin y (3.27) Höhere Ableitungen df Wenn wir die Ableitung f (x) = dx einer Funktion f (x) noch einmal nach der Variablen x ableiten, erhalten wir die zweite Ableitung: d d2 f d f (x) . (3.28) f (x) = 2 = dx dx dx Wir können natürlich die Funktion f (x) mehr als zweimal differenzieren. Die n-te Ableitung erhält man durch n-maliges Differenzieren: f (n) (x) = dn f . dxn (3.29) Zum Beispiel: f (x) 3.6 = x5 , (3.30) 4 f (x) f (x) = 5x , = 20x3 , (3.31) (3.32) f (x) f (4) (x) = 60x2 , = 120x, (3.33) (3.34) f (5) (x) f (6) (x) = 120, = 0, (3.35) (3.36) f (n) (x) = 0, ∀n ≥ 6. (3.37) Maxima und Minima von Funktionen An Punkten, wo eine differenzierbare Funktion f (x) Maxima und Minima besitzt, verschwindet ihre Ableitung f (x). Das heißt, wir können Maxima und Minima von Funktionen finden, indem wir die Gleichung f (x) = 0 lösen. Falls ein Minimum den kleinsten Wert der Funktion im gesamten Definitionsbereich besitzt, nennt man es globales Minimum. Ansonsten ist es ein lokales Minimum. Globale und lokale Maxima sind analog definiert. Maxima und Minima zusammen nennt man Extremwerte. Maxima und Minima kann man durch Bestimmung der zweiten Ableitung an diesen Stellen unterscheiden (siehe Abbildungen 3.7 und 3.8). Für Minima haben wir positive Krümmung, das heißt, f (xmin ) > 0. Für Maxima hingegen ist die Krümmung negativ, das heißt f (xmax ) < 0. Beispiel: Zu bestimmen sind Lage und Wert der Extrema der Funktion f (x) = (1 − x2 )2 . (3.38) f (x) = −2(1 − x2 ) · 2x = −4x + 4x3 . (3.39) Wir bilden zunächst die erste Ableitung 74 3 Differentiation Abbildung 3.6: Die dargestellte Funktion f (x) besitzt an den Stellen xmin und xmin jeweils Minima und an der Stelle xmax ein Maximum. Da an der Stelle xmin die Funktion den kleinsten Wert im gesamten Definitionsbereich annimmt, nennt man das zugehörige Minimum ein globales Minimum. Abbildung 3.7: Die Funktion ax2 + bx + c hat für a > 0 an der Stelle xmin = −b/2a ein Minimum. An der Stelle des Minimums hat die Funktion eine positive Krümmung, d.h f (xmin ) = 2a > 0. Die Bedingung f (x) = 0 ist an den Stellen x = −1, x = 0 und x = +1 erfüllt. Um herauszufinden, ob die Funktion an diesen Stellen ein Maximum oder ein Minimum besitzt, berechnen wir die zweite Ableitung (3.40) f (x) = 12x2 − 4 und werten sie an den Stellen der Extremwerte aus: f (0) = −4 f (±1) = 8. und (3.41) Die Funktion f (x) = (1 − x2 )2 hat also an den Stellen x = −1 und x = 1 jeweils ein Minimum und an der Stelle x = 0 ein Maximum. 3.7 Differentiation von Funktionen in Parameterform Eine Funktion sei in Parameterform gegeben: x = y = Die Ableitung y = dy dx x(t), y(t). (3.42) (3.43) kann dann aus den Ableitungen nach dem Parameter t berechnet werden : ẏ dy = = dx ẋ dy dt dx dt . (3.44) 3 Differentiation 75 Abbildung 3.8: Die Funktion ax2 + bx + c hat für a < 0 an der Stelle xmax = −b/2a ein Maximum. An der Stelle des Maximums hat die Funktion eine negative Krümmung, d.h f (xax ) = 2a < 0. Abbildung 3.9: Die Funktion f (x) = (1 − x2 )2 hat zwei Minima und ein Maximum. Wir erhalten diese Beziehungen, indem wir zunächst auf y = f (x(t)) die Kettenregel anwenden, df dx dy dx dy = · = · . dt dx dt dx dt (3.45) Umformung dieser Gleichung ergibt schließlich: dy = dx dy dt dx dt . (3.46) Dieselben Ausdrücke können wir auch auf Funktionen anwenden, welche in Polarkoordinaten gegeben sind. In diesem Fall betrachtet man r als Funktion von ϕ: r = r(ϕ). Wir haben dann x = r(ϕ) · cos ϕ, y = r(ϕ) · sin ϕ. (3.47) (3.48) Durch Anwendung von Gleichung (3.44) erhalten wir dy = dx dy dϕ dx dϕ dr dϕ · sin ϕ + r(ϕ) · cos ϕ . dr dϕ · cos ϕ − r(ϕ) sin ϕ = (3.49) Beispiel: √ Für die Funktion r(ϕ) = 1/ cos 2ϕ erhalten wir durch Differentiation sin 2ϕ 1 dr = − (cos 2ϕ)−3/2 (− sin 2ϕ)2 = 3 , dϕ 2 (cos 2ϕ) 2 (3.50) woraus folgt: sin 2ϕ dy = dx 3 (cos 2ϕ) 2 sin 2ϕ 3 (cos 2ϕ) 2 sin ϕ + √cos ϕ cos 2ϕ cos ϕ − √sin ϕ cos 2ϕ = 1 cos ϕ = . sin ϕ tan ϕ (3.51) 76 3 Differentiation Beispiel: Archimedische Spirale Für die Funktion r(ϕ) = aϕ gilt dr = a, dϕ (3.52) dy a sin ϕ + aϕ cos ϕ sin ϕ + ϕ cos ϕ = = . dx a cos ϕ − aϕ sin ϕ cos ϕ − ϕ sin ϕ (3.53) und somit Die Ableitung dy/dx hängt also nicht von a ab. 3.8 Differentiation von Vektoren Betrachten wir die Bewegung eines Massenpunktes durch den Raum. Diese Bewegung beschreiben wir durch den Ortsvektor r(t) des Massenpunktes als Funktion der Zeit (siehe Abb. 3.10). Die Bahnkurve des Massenpunktes nennen wir auch Trajektorie. Abbildung 3.10: Trajektorie r(t) eines Massenpunktes. Die Geschwindigkeit v (t) ist die erste Ableitung von r(t) nach der Zeit. Wir können jetzt analog zum skalaren Fall vorgehen und eine vektorartige Geschwindigkeit v als den Grenzwert r(t + ∆t) − r(t) ∆t→0 ∆t v (t) = lim (3.54) definieren. Die Ableitung eines Vektors ist wiederum ein Vektor. In Komponentenschreibweise können wir diese Grenzwertbildung ausdrücken als: dx vx (t) lim∆t→0 x(t+∆t)−x(t) ẋ(t) ∆t dt dy v (t) = vy (t) = lim∆t→0 y(t+∆t)−y(t) (3.55) = dt = ẏ(t) . ∆t z(t+∆t)−z(t) dz vz (t) lim∆t→0 ż(t) ∆t dt Eine etwas kürzere Schreibweise dafür ist: v (t) = d r(t) = r˙ (t). dt (3.56) Die Geschwindigkeit v (t) ist also die zeitliche Ableitung des Vektors r(t). Der Geschwindigkeitsvektor v ist tangential zur Trajektorie und sein Betrag ist gleich der Geschwindigkeit in Richtung der Trajektorie. 3 Differentiation 77 Abbildung 3.11: Geschwindigkeit v und Beschleunigung a für die gleichförmige Kreisbewegung in der Ebene. Beispiel: Kreisbewegung Für die gleichförmige Kreisbewegung in der Ebene auf einer Bahn mit Radius r um den Ursprung gilt (siehe Abb. 3.11): x = r cos ωt, (3.57) y = r sin ωt, (3.58) wobei ω die Winkelgeschwindigkeit ist. Durch Differentiation erhalten wir die x- und y-Komponenten der Geschwindigkeit: vx = −rω sin ωt, (3.59) vy = rω cos ωt. (3.60) Wie man durch Bildung des Skalarproduktes r(t) · v (t) leicht sehen kann, sind r(t) und v (t) zu jedem Zeitpunkt normal aufeinander. Die Beschleunigung beschreibt die zeitliche Änderung der Geschwindigkeit mit der Zeit: d d2 v = 2 r. dt dt (3.61) ax = −rω 2 cos ωt, (3.62) ay = −rω sin ωt. (3.63) a = Für die Kreisbewegung erhalten wir somit 2 In Vektorschreibweise ist die Beschleunigung also gegeben durch a = −ω 2r. (3.64) Die Beschleunigung a(t) und der Ortsvektor r(t) sind also zu jedem Zeitpunkt antiparallel. Für Vektoren gelten folgende Differentiationsregeln, welche man sich durch Anwendung der weiter oben behandelten einfachen Differentiationsregeln auf die jeweiligen Ausdrücke in Komponentenschreibweise leicht überlegen kann. Hier sind die Vektoren a und b zeitabhängig: a = a(t) und b = b(t). f (t) ist eine beliebige skalare Funktion der Zeit. • Summenregel d da db (a + b) = + . dt dt dt (3.65) 78 3 Differentiation • Produktregeln – Skalar × Vektor df da d [f (t)a] = a + f . dt dt dt (3.66) d da db (a · b) = · b + a · . dt dt dt (3.67) d da db (a × b) = × b + a × . dt dt dt (3.68) d da db dc [(a × b) · c)] = ( × b) · c + (a × ) · c + (a × b) · dt dt dt dt (3.69) – Skalarprodukt – Kreuzprodukt – Spatprodukt • Quotientenregel d dt a f (t) = d a dt f − a df dt . f2 (3.70) • Kettenregel da(f (t)) da df = . dt df dt 3.9 3.9.1 (3.71) Partielle Differentiation Funktionen mehrerer Variabler Eine Funktion kann von mehr als einer Variablen abhängen. Zum Beispiel könnte f (x, y) das Höhenrelief eines Gebirges darstellen. In diesem Fall gibt f (x, y) für jeden Punkt (x, y), der etwa durch die geographische Breite x und die geographische Länge y definiert ist, die Höhe über dem Meeresspiegel an. Im Allgemeinen versteht man unter einer Funktion von zwei unabhängigen Variablen eine Vorschrift, die jedem geordneten Zahlenpaar (x, y) aus dem Definitionsbereich genau ein Element z aus dem Wertebereich zuordnet: z = f (x, y). (3.72) (Diese Definition kann direkt auf eine beliebige Zahl von Argumenten übertragen werden.) So wie eine Funktion y = f (x) in einem kartesischen Koordinatensystem einen Kurve definiert (den Funktionsgraphen), definiert eine Funktion z = f (x, y) in einem dreidimensionalen Koordinatensystem eine Fläche. Diese Fläche entsteht dadurch, dass jedem Punkt in der xy-Ebene eine gewisse Höhe senkrecht zur xy-Ebene zugeordnet wird. Die Fläche besteht also aus allen Zahlentriplets (x, y, z = f (x, y)). Beispiel: Die durch die Funktion f (x, y) = y 2 − x (3.73) definierte Fläche ist in Abb. 3.12 graphisch dargestellt. Die Funktionsfläche ist ein für fallende Werte von x ansteigendes Tal. Für x = const erhalten wir eine Schar von Parabeln, z = y 2 − const, und für y = const eine Schar von Geraden mit Steigung -1, z = const − x. 3 Differentiation 79 Abbildung 3.12: Darstellung der Funktion z = f (x, y) = y 2 − x in einem dreidimensionalen kartesischen Koordinatensystem. 3.9.2 Partielle Ableitung Wir können nun die Funktion f (x, y) nach einer der beiden Variablen ableiten und dabei die andere Variable als konstant betrachten: f (x + ∆x, y) − f (x, y) ∂f (x, y) = lim (y = const). (3.74) ∆x→0 ∂x ∆x Genauso können wir die Funktion nach y ableiten: ∂f (x, y) f (x, y + ∆y) − f (x, y) = lim ∆y→0 ∂y ∆y (x = const). (3.75) Solche Ableitungen nennt man partielle Ableitungen, da die Funktion nur nach einer der Variablen abgeleitet wird, also nur “zum Teil”, und alle anderen Variablen festgehalten werden. Um den Unterschied zur Differentiation einer Funktion einer einzelnen Variablen zu betonen, verwenden wir für die partielle Ableitung das geschwungene Delta: ∂. Alternativ zur Notation mit dem geschwungenen Delta ∂ findet auch die folgende Schreibweise mit Indizes Verwendung: fx = fy = ∂f ∂x ∂f . ∂y (3.76) (3.77) Für partielle Ableitungen gelten dieselben Rechenregeln wie für die Differentiation einer Funktion einer einzelnen Variablen. Beispiel: Die Funktion f (x, y) = xy 2 + 4x5 y + 16x (3.78) 80 3 Differentiation kann sowohl nach x als auch nach y differenziert werden: ∂f = y 2 + 20x4 y + 16, ∂x ∂f = 2xy + 4x5 . ∂y (3.79) (3.80) Durch wiederholtes partielles Ableiten lassen sich partielle Ableitungen höherer Ordnung (höhere Ableitungen) bilden: ∂2f ∂ ∂f = (3.81) = fxx , ∂x2 ∂x ∂x ∂ ∂f ∂2f = (3.82) = fxy , ∂y∂x ∂y ∂x ∂ ∂f ∂2f = (3.83) = fyx , ∂x∂y ∂x ∂y ∂2f ∂ ∂f = (3.84) = fyy . ∂y 2 ∂y ∂y Beispiel: Thermodynamik In der Thermodynamik verwendet man eine weitere, leicht unterschiedliche Schreibweise für partielle Ableitungen. So ist zum Beispiel die Wärmekapazität eines Körpers gegeben als ∂S Cp = T , (3.85) ∂T p wobei T die Temperatur ist, S die Entropie und p der Druck. Diese Wärmekapazität Cp ist die Wärme, die einem Körper zugeführt (oder abgeführt) werden muss, um die Temperatur T des Körpers um einen gewissen Betrag zu ändern und zwar bei konstantem Druck p. Der Index p zeigt an, dass die Temperaturänderung bei konstantem Druck erfolgt. Analog dazu gibt es auch die Wärmekapazität bei konstantem Volumen V : ∂S CV = T . ∂T V (3.86) Auch hier wird explizit angegeben, welche Variable sich ändert (T ) und welche unverändert bleibt (V ). Beispiel: Mechanik Aus der potentiellen Energie U (x, y, z) kann die Kraft, die auf einen gewissen Körper wirkt, durch partielle Ableitung berechnet werden: − ∂U ∂x Fx (3.87) F = Fy = − ∂U . ∂y Fz − ∂U ∂z Nach dem Satz von Schwarz kann bei gemischten partiellen Ableitungen die Reihenfolge der Differentiation vertauscht werden, falls die partiellen Ableitungen stetig sind. Dies gilt auch für partielle Ableitungen höherer Ordnung. Demnach gilt etwa: ∂2f ∂ 2f = . ∂x∂y ∂y∂x (3.88) 3 Differentiation 81 In Analogie zum Differential lassen sich auch partielle Differentiale definieren: ∂x f (x, y) = ∂f (x, y) dx ∂x (3.89) ∂y f (x, y) = ∂f (x, y) dy. ∂y (3.90) und Das totale Differential (auch vollständiges Differential genannt) ergibt sich aus der Summe der partiellen Differentiale: df (x, y) = ∂f ∂f dx + dy. ∂x ∂y (3.91) Das totale Differential, das in der Fehlerrechnung und in der Thermodynamik von Bedeutung ist, gibt an, um wie viel sich die Funktion f (x, y) ändert, wenn wir ihre Argumente um dx und dy verschieben. 3.9.3 Anstieg einer impliziten Funktion Eine Funktion sei in impliziter Form als F (x, y) = 0 gegeben (siehe Abb. 3.13). In einem gewissen Punkt (x, y) ist der Anstieg der Kurve dann gegeben durch: ∂F ∂x k = − ∂F . (3.92) ∂y Um zu verstehen, woher dieser Ausdruck kommt, betrachten wir F (x, y) als eine Funktion z = F (x, y) von x und y. Das vollständige Differential der Funktion ist ∂F ∂F dF (x, y) = dx + dy. (3.93) ∂x ∂y Wir wissen nun, dass entlang der durch F (x, y) = 0 definierten Kurve sich F (x, y) nicht ändert (F (x, y) ist ja auf dieser Kurve überall gleich 0). Daher ist dF = 0. Wenn wir diesen Ausdruck dann noch durch dx dividieren, erhalten wir schließlich ∂F dy ∂x = − ∂F . dx ∂y (3.94) Abbildung 3.13: Der Anstieg (oder die Steigung) k der durch F (x, y) = 0 definierten Kurve im Punkt (x, y) ist gegeben durch k = −(∂F/∂x)/(∂F/∂y). 82 3 Differentiation Beispiel: Die Gleichung F (x, y) = x2 + y 2 − 1 = 0 (3.95) stellt einen Kreis in der Ebene mit Mittelpunkt im Ursprung und Radius 1 dar. Die Steigung des Kreises an der Stelle (x, y) ist gegeben durch: dy −2x x = =− . dx 2y y (3.96) (3.97) √ √ Demnach ist die Steigung der Kreislinie im Punkt (0, 1) gleich 0, im Punkt ( 2, 2) ist sie gleich -1 und im Punkt (1, 0) ist sie gleich −∞. Kapitel 4 Integration 4.1 Das unbestimmte Integral Die Integration ist die Umkehrung der Differentiation. Während wir bei der Differentiation für eine bestimmte Funktion ihre Ableitung bestimmen, wollen wir beim Integrieren aus der Ableitung die Funktion bestimmen. Oder, mit anderen Worten, wir wollen aus der Steigung einer Kurve die Kurve selbst bestimmen. Dies ist eine der beiden Grundaufgaben der Integralrechnung. Die zweite Grundaufgabe der Integralrechnung, der wir uns später zuwenden werden, besteht in der Berechnung von Flächen unter Funktionsgraphen. Gegeben sei also eine Funktion f (x). Zu dieser Funktion suchen wir jetzt eine andere Funktion F (x), sodass f (x) die Ableitung von F (x) ist: F (x) = f (x). (4.1) F (x) wird die Stammfunktion genannt. Das Auffinden der Stammfunktion wird Integration genannt. Zum Beispiel hat die Funktion f (x) = x2 die Funktion F (x) = 13 x3 als Stammfunktion, denn d 1 3 x = x2 . dx 3 (4.2) Während bei der Differentiation F (x) gegeben und f (x) = F (x) gesucht ist, gilt es also bei der Integration für eine gegebene Funktion f (x) eine Funktion F (x) zu finden, sodass F (x) = f (x). Man nennt F (x) auch das unbestimmte Integral von f (x) und schreibt: % % F (x) = f (x) dx oder F (x) = dxf (x). (4.3) Hier ist es wichtig anzumerken, dass das unbestimmte Integral einer Funktion wiederum eine Funktion ist. Genauer müsste man eigentlich schreiben: % F (x) = f (x) dx + C, (4.4) wobei C die so genannte Integrationskonstante ist. Diese Konstante wird deshalb benötigt, weil die Integration kein eindeutiger Vorgang ist. So haben z.B. die Funktionen f (x) = 2x f (x) = x2 2 g(x) = x + 5 g (x) = 2x 83 (4.5) (4.6) 84 4 Integration dieselbe Ableitung, weil eine Konstante bei der Differentiation verschwindet. Falls F (x) eine Stammfunktion von f (x) ist, ist F (x) + C also auch eine, denn die Ableitungen dieser beiden Funktionen sind identisch (siehe Abb. 4.1). Außerdem ist jede beliebige Stammfunktion F̃ (x) der Gestalt F̃ (x) = F (x) + C. Sind nämlich sowohl F (x) als auch F̃ (x) Stammfunktionen, gilt dF̃ dF d (F̃ (x) − F (x)) = − = f − f = 0. dx dx dx (4.7) Deshalb ist F̃ (x) − F (x) eine Konstante und F̃ (x) kann geschrieben werden als F̃ (x) = F (x) + C. Abbildung 4.1: Falls die Funktion F (x) eine Stammfunktion von f (x) ist, so ist es auch eine ganze Schar von Funktionen, die sich jeweils um eine Konstante unterscheiden. Die Gleichung F (x) = f (x) gibt für jeden Wert von x die Steigung der Tangente vor. Die Integrationskonstante ist eine zunächst unbestimmte Konstante, die wir zur Stammfunktion dazu schreiben, um diesen Sachverhalt anzudeuten. Wenn wir den Wert von F (x) an einer einzelnen Stelle kennen, können wir daraus C bestimmen (Anfangswert, Randbedingung). Weil durch die Differentiation Konstanten verloren gehen, können wir sie nicht mehr durch Integration zurückgewinnen und es gibt eine unendliche Schar von Stammfunktionen, die sich nur durch eine Konstante unterscheiden und die alle die gleiche Ableitung besitzen (siehe Abb. 4.1). Beispiel: Wir betrachten einen Körper, der sich mit zunehmender Geschwindigkeit v entlang einer Geraden bewegt. Wir nehmen dabei an, dass die Geschwindigkeit linear mit der Zeit zunimmt (wir haben es also mit einer gleichförmigen Beschleunigung zu tun): v = at, (4.8) wobei v = q̇ und a = v̇ und wir für die Beschleunigung den Wert a = 4m/s2 annehmen. Der in einer Zeit t zurückgelegte Weg q(t) ist gegeben durch: % q(t) = % v dt = at dt = at2 + C. 2 (4.9) (Hier heißt unsere Variable t statt x, was natürlich völlig belanglos ist.) Nehmen wir nun an, dass zum Zeitpunkt t = 0 der Körper schon einen Weg von 4 Metern zurückgelegt hat, also q(t = 0) = 4m (man nennt so etwas eine Anfangsbedingung). Diese Anfangsbedingung können wir benutzen, um die Integrationskonstante zu bestimmen: q(0) = a02 m + C = 4m 2 ⇒ C = 4m. (4.10) 4 Integration 85 Die Anfangsbedingung wählt aus der Schar aller Lösungen eine bestimmte Lösung aus. Zusammenfassend halten wir fest: • Zu jeder stetigen Funktion f (x) gibt es unendlich viele Stammfunktionen F (x), sodass F (x) = f (x). • Zwei beliebige Stammfunktionen F1 (x) und F2 (x) unterscheiden sich nur durch eine Konstante: F1 (x) − F2 (x) = C. (4.11) Wenn F (x) eine Stammfunktion ist, dann ist also auch F (x) + C eine Stammfunktion. 4.2 Wichtige unbestimmte Integrale In der unten stehenden Tabelle sind ein paar der wichtigsten unbestimmten Integrale angeführt. Durch Differenzieren von F (x) kann man sich leicht von der Richtigkeit dieser Beziehungen überzeugen. Funktion f (x) Stammfunktion & F (x) = dxf (x) a xn ax 1 x x ln x ex 1 ax ae 1 x ln a a − cos x sin x cosh x sinh x e eax ax sin x cos x sinh x cosh x 1 n+1 n+1 x Diese Tabelle enthält nur die allerwichtigsten (und einfachsten) Integrale. Weitere Integrale können Sie den Integraltafeln in den gängigen Formelsammlungen entnehmen oder Sie können Computerprogramme wie “Mathematica” zur Bestimmung von Integralen benutzen. Falls Sie keinen Zugang zu “Mathematica” oder einem ähnlichen Programm haben, gehen Sie einfach mit Ihrem Browser zu integrals.wolfram.com und tippen Sie Ihr Integral ein. 4.3 Das bestimmte Integral Wir wenden uns nun der zweiten Grundaufgabe der Integralrechnung zu, nämlich der Berechnung des Flächeninhalts eines Bereichs, der vom Graphen einer Funktion f (x) in einem Intervall [a, b] mit der x-Achse eingeschlossen wird (siehe Abb. 4.2). Dieser Flächeninhalt ist das bestimmte Integral. Obwohl es auf den ersten Blick nicht offensichtlich ist, gibt es einen fundamentalen Zusammenhang zwischen der ersten Grundaufgabe der Integralrechnung, dem Auffinden einer Stammfunktion F (x), und der Flächenberechnung. Im Folgenden werden wir uns mit diesem Zusammenhang beschäftigen. 86 4 Integration Abbildung 4.2: Die zweite Grundaufgabe der Integralrechnung besteht in der Berechnung der Fläche Sab (schraffierter Bereich) unter dem Graphen einer Funktion f (x) im Intervall [a, b]. Um die Fläche Sab unter dem Funktionsgraphen f (x) zu berechnen, teilen wir das Intervall [a, b] auf der x-Achse in n gleich lange Teile der Breite ∆x = (b−a)/n ein (siehe Abb. 4.3). Die äquidistanten Endpunkte dieser Intervalle nennen wir xi . Für die Endpunkte der Intervalle gilt demnach: xi = a + i∆x, i = 0, . . . , n. (4.12) Wir nehmen hier der Einfachheit halber an, dass die Kurve f (x) vollständig über der x-Achse liegt. Funktionen, die im Intervall [a, b] sowohl positive als auch negative Werte annehmen, bieten jedoch keine wesentlichen Schwierigkeiten, wie wir später sehen werden. Diese Einteilung des Intervalls [a, b] in n kleine Abschnitte zerlegt die Fläche Sab in n vertikale Streifen. Die Gesamtfläche Sab ist dann gegeben durch die Summe der Flächeninhalte der einzelnen Streifen: Sab = = s1 + s2 + s3 + · · · + sn n si . (4.13) i=1 Dabei ist si der Flächeninhalt des i-ten Streifens (das ist der Streifen, der zum Intervall [xi−1 , xi ] gehört). Hier ist uns zum ersten Mal das Summenzeichen Σ (das große griechische Sigma) begegnet, dessen Bedeutung aus dem obigen Ausdruck klar sein sollte. Das Summenzeichen erlaubt es, Summen (sogar unendliche) auf kompakte Weise zu schreiben. Abbildung 4.3: Zur Berechnung der Fläche unter der Kurve von f (x) teilen wir das Intervall [a, b] in viele kleine Teile. Die Gesamtfläche unter der Kurve ergibt sich dann aus der Summe aller schmalen senkrechten Streifen. 4 Integration 87 Abbildung 4.4: Die Fläche eines schmalen Streifens setzt sich zusammen aus einem Rechteck mit den Kantenlängen ∆x und f (xi ) und einem Rest εi (schraffierter Bereich). Schauen wir uns nun die Fläche si etwas genauer an (siehe Abb. 4.4). Die Fläche des Streifens setzt sich zusammen aus einem Rechteck mit den Kantenlängen ∆x und f (xi ) und dem Rest εi : si = f (xi )∆x + εi . (4.14) Das heißt: Sab = n si = i=1 n f (xi )∆x + i=1 n εi . (4.15) i=1 Abbildung 4.5: Der schraffierte Bereich ist der Fehler, der gemacht wird, falls die Fläche der senkrechten Streifen durch die Fläche der Rechtecke mit Kantenlängen ∆x und f (xi ) angenähert wird. n Für eine grobe Einteilung von [a,b] kann der Term i=1 εi recht groß sein. Wenn wir die Einteilung n feiner und feiner machen, wird i=1 εi immer kleiner und die Fläche immer besser durch Sab ≈ n f (xi )∆x (4.16) i=1 angenähert. In dieser Approximation behandelt man also die senkrechten als Rechtecke mit Streifen n Kantenlängen ∆x und f (xi ). Der Fehler, der dabei gemacht wird, ist i=1 εi (siehe Abbildungen 4.5 und 4.6). n Für unendlich kleine ∆x verschwindet schließlich i=1 εi und die Fläche Sab ist exakt durch den Grenzwert n Sab = lim f (xi )∆x (4.17) ∆x→0 i=1 88 4 Integration Abbildung 4.6: Für eine kleiner werdende Intervallbreite ∆ wird der Fehler, der durch die Approximation der senkrechten Streifen durch Rechtecke gemacht wird, immer kleiner. gegeben, bei dem wir die Anzahl n der Teilintervalle unbegrenzt wachsen lassen. Diesen Grenzwert nennen wir das bestimmte Integral über dem Intervall [a, b] und wir bezeichnen es mit: %b f (x)dx = lim ∆x→0 a n f (xi )∆x. (4.18) i=1 & Das Zeichen ist eine Stilisierung des Buchstabens S und soll uns daran erinnern, dass das bestimmte Integral durch Grenzwertbildung aus einer Summe hervorgegangen ist. Der Ausdruck f (x)dx hinter dem Integralzeichen soll an die Form f (xi )∆x der Terme in dieser Summe erinnern. Die Variable x wird Integrationsvariable genannt. &b Das bestimmte Integral a f (x)dx ist eine Zahl, im Gegensatz zum unbestimmten Integral, das &b eine Funktion von x ist. Das bestimmte Integral a f (x)dx hängt nur von den Integrationsgrenzen a und b und von der Funktion f (x) im Intervall [a, b] ab. Daher ist die genaue Bezeichnung &b &b der Integrationsvariablen belanglos. Statt a f (x)dx hätten wir genauso gut a f (z)dz schreiben können ohne das Ergebnis zu verändern. Wir haben bisher vorausgesetzt, dass die Funktion f (x) im gesamten Intervall [a, b] positiv ist. Das muss jedoch nicht der Fall sein. Im allgemeinen Fall liegen einige Teile des Funktionsgraphen über und einige Teile unter der x-Achse (siehe Abb. 4.7). Abbildung 4.7: Bei einer Funktion, deren Graph sowohl über als auch unter der x-Achse liegt, tragen die Flächenbereiche mit negativen Funktionswerten mit einem negativen Vorzeichen zum Integral bei. 4 Integration 89 Wenn wir in diesem Fall das bestimmte Integral mit Hilfe von Gleichung (4.18) durch Grenzwertbildung berechnen, erhalten wir in den Bereichen mit negativem Funktionswert negative Beiträge zur Summe. Auch in diesem Fall ist das bestimmte Integral %b f (x)dx (4.19) a die Summe der Inhalte der Flächen, die von der x-Achse, dem Funktionsgraphen f (x) und der Abszissenwerte x = a und x = b begrenzt werden. Dabei tragen die Flächen oberhalb der x-Achse allerdings positiv und die Flächen unterhalb der x-Achse negativ zum Integral bei. 4.4 Zusammenhang zwischen bestimmtem und unbestimmtem Integral Abbildung 4.8: Die Funktion f (x) begrenzt im Intervall [a, b] mit der x-Achse einen Bereich mit Flächeninhalt Sab und im kleineren Intervall [a, x] einen Bereich mit Flächeninhalt Sax . Gegeben sei eine Funktion f (x), die im Intervall [a, b] mit der x-Achse eine Fläche Sab eingrenzt (siehe Abb. 4.8). Wir betrachten jetzt aber nur einen Teil der Fläche Sab , nämlich den, der von der Funktion f (x), der x-Achse und den senkrechten Geraden durch die Abszisse a und durch eine bewegliche Abszisse x begrenzt wird. Wir nennen diese Fläche Sax . Die Größe dieser Fläche hängt davon ab, an welche Stelle im Intervall wir die Abszisse x legen. Wir können die Fläche Sax ausdrücken als bestimmtes Integral der Funktion f (x) mit unterer Grenze a und oberer Grenze x. Da wir die Buchstaben x zur Bezeichnung der oberen Grenze verwenden, verwenden wir einen anderen Buchstaben (z.B. u) als Integrationsvariable. Die Fläche Sax ist gegeben durch: %x Sax = f (u)du. (4.20) a Das Integral in dieser Gleichung ist ein bestimmtes Integral mit einer veränderlichen oberen Grenze x. Das bestimmte Integral Sax ist also eine Funktion dieser Grenze x. Als nächstes werden wir zeigen, dass Sax (betrachtet als Funktion von x) eine Stammfunktion von f (x) ist: d Sax = f (x). dx (4.21) Dies wird den gesuchten Zusammenhang zwischen dem bestimmten Integral und dem unbestimmten Integral herstellen. Um zu zeigen, dass Sax eine Stammfunktion von f (x) ist, betrachten wir 90 4 Integration Abbildung & x 4.9: Die Fläche des schraffierten Bereichs ist gleich der Änderung ∆Sax der Fläche Sax = a f (x)dx aufgrund einer Änderung der oberen Grenze des Integrals von x auf x + ∆x. die Zunahme ∆Sax von Sax durch einen Zuwachs ∆x der veränderlichen oberen Grenze x. Der Zuwachs ∆Sax ist einfach die Größe des zusätzlichen Streifens, der durch x, x + ∆x, f (x) und die x-Achse begrenzt wird (siehe Abb. 4.9). Für sehr kleine ∆x ist ∆Sax gegeben durch die Fläche eines Rechtecks mit der Breite ∆x und der Höhe f (x), ∆Sax ≈ f (x) · ∆x. (4.22) Für ∆x → 0 strebt der Fehler, den wir in dieser Näherung machen, gegen 0 und wir erhalten aus obiger Gleichung: ∆Sax = f (x). ∆x→0 ∆x lim (4.23) Die linke Seite der Gleichung ist aber genau die Definition der Ableitung von Sax nach der Variablen x. Somit gilt d d Sax = dx dx %x f (u)du = f (x). (4.24) a Das heißt, das bestimmte Integral der Funktion f (u) mit veränderlicher Grenze x ist eine Stammfunktion des Integranden. Somit haben wir den gesuchten Zusammenhang erhalten. Durch Ausnutzung dieses Zusammenhangs können wir das bestimmte Integral %b f (x)dx (4.25) a durch Auffinden der Stammfunktion F (x) von f (x) berechnen. Dies können wir auf folgende Weise tun. Da wir wissen, dass Sax eine Stammfunktion von f (x) ist, kann sich die Stammfunktion F (x) nur um eine Konstante C (Integrationskonstante) von diesem bestimmten Integral unterscheiden: %x f (u)du = F (x) + C. (4.26) a Zu Bestimmung von C beachten wir nun, dass das Integral auf der linken Seite verschwindet, falls die obere Grenze x mit der unteren Grenze a zusammenfällt, das heißt wenn a = x. Für x = a 4 Integration 91 erhalten wir daher: %a f (u)du = 0 = F (a) + C. (4.27) a Daraus folgt: C = −F (a). (4.28) Somit gilt %x f (u)du = F (x) − F (a). (4.29) a Indem wir x = b setzen, erhalten wir schließlich %b f (u)du = F (b) − F (a). (4.30) a Da wir jetzt den Buchstaben x nicht mehr für die obere Integrationsgrenze benötigen, können wir natürlich auch schreiben: %b f (x)dx = F (b) − F (a). (4.31) a Eine alternative Schreibweise dafür ist: %b !b ! f (x)dx = F (x)!! . (4.32) a a Wir erhalten also den Wert des bestimmten Integrals aus der Differenz einer Stammfunktion des Integranden an der oberen und unteren Integrationsgrenze. Dieses Ergebnis nennt man den Hauptsatz der Differential- und Integralrechnung. Dieser sehr praktische Zusammenhang erspart uns bei der Berechnung des bestimmten Integrals die schwierige Grenzwertbildung. Beispiel: Wir berechnen nun das bestimmte Integral der Funktion f (x) = x im Intervall [a, b] zunächst mit Hilfe des Hauptsatzes der Differential- und Integralrechnung und dann explizit durch Einteilung des Intervalls in schmale Unterintervalle der Breite ∆x und anschließender Grenzwertbildung ∆x → 0. Durch Bestimmen der Stammfunktion von f (x) = x, F (x) = x2 /2, finden wir %b xdx = a !b x2 !! b 2 − a2 . = ! 2 a 2 (4.33) Wir könnten alternativ dazu auch eine Summe schmaler Streifen bilden und dann ∆x gegen 0 gehen lassen: Sab ≈ n i=1 f (xi ) · ∆x. (4.34) 92 4 Integration Für die Abszisse xi gilt xi = x0 + i∆x = a + i∆x. Daher ist f (xi ) = a + i∆x und wir haben Sab n n n (a + i∆x) · ∆x = a∆x + i∆x2 ≈ i=1 = i=1 a∆x n 1 + ∆x2 i=1 na∆x + ∆x2 = n i=1 i i=1 n i. (4.35) i=1 Da ∆x = b−a n gilt Sab ≈ na n (b − a) (b − a)2 + i n n2 i=1 ≈ a(b − a) + (b − a)2 (1 + 2 + 3 + · · · + (n − 1) + n). n2 (4.36) Die Summe aller natürlichen Zahlen von 1 bis n ist bekannt, 1 + 2 + 3 + · · · + (n − 1) + n = n(n + 1) , 2 (4.37) und somit erhalten wir schließlich: Sab (b − a)2 n(n + 1) · n2 2 2 1 (b − a) · 1+ a(b − a) + . 2 n ≈ a(b − a) + ≈ (4.38) Um das bestimmte Integral Sab zu berechnen, müssen wir den Grenzübergang ∆x → 0 oder äquivalent dazu den Grenzübergang n → ∞ durchführen. Das heißt # $ 1 (b − a)2 · 1+ Sab = lim a(b − a) + n→∞ 2 n (b − a)2 = a(b − a) + 2 2 2ab b2 + a 2 − = a b−a + 2 2 2 1 2 2 = (b − a ), (4.39) 2 was mit dem Ergebnis weiter oben übereinstimmt, jedoch weitaus komplizierter zu berechnen war (selbst für die einfache Funktion f (x) = x). Beispiel: Gesucht ist die Fläche unter der Kurve y = x3 zwischen a = 0 und b = 1. Diese Fläche ist gleich dem bestimmten Integral %1 x3 dx = 0 !1 x4 !! 1 = . 4 !0 4 (4.40) 4 Integration 93 Abbildung 4.10: Die Fläche eines Viertelkreises kann durch Integration der Funktion y = im Intervall [0, r] berechnet werden. √ r2 − x2 Beispiel: Gesucht ist die Fläche eines Viertelkreises mit Radius r. Der implizite Ausdruck für einen Kreis mit Radius r um den Ursprung, x2 + y 2 = r2 , lässt sich leicht in einen expliziten Ausdruck für die Kreislinie umwandeln: y = r2 − x2 . (4.41) (4.42) Die Fläche A des Viertelkreises lässt sich somit als bestimmtes Integral schreiben: %r A= r2 − x2 dx. (4.43) 0 Durch Nachschlagen in einer Formelsammlung finden wir: % x x 2 r2 arcsin . r2 − x2 dx = r − x2 + 2 2 r (4.44) Das heißt A = !r %r x x !! r2 2 2 2 2 arcsin r − x dx = r −x + 2 2 r !0 0 = r r2 r2 r2 π r2 π r2 arcsin − arcsin(0) = arcsin(1) = = . 2 r 2 2 2 2 4 (4.45) Die Fläche des Viertelkreises ist also r2 π/4. 4.5 Rechenregeln für das bestimmte Integral Für das bestimmte Integral gelten folgende Rechenregeln: • Das bestimmte Integral verschwindet, wenn die untere und obere Integrationsgrenze zusammenfallen: %a f (x)dx = 0. a (4.46) 94 4 Integration • Ein Integral kann in eine Summe von zwei Integralen über aneinander grenzende Intervalle zerlegt werden: %c %b f (x)dx = a %c f (x)dx + a f (x)dx. (4.47) b • Vertauschung der Integrationsgrenzen führt zur Umkehrung des Vorzeichens: %b %a f (x)dx = − a 4.6 f (x)dx. (4.48) b Grundregeln des Integrierens Wir wollen jetzt auf Methoden zur Ermittlung der Stammfunktion (also des unbestimmten Integrals) eingehen. Die folgenden Regeln ergeben sich aus den bereits besprochenen Differentiationsregeln. Im Folgenden werden wir die Integrationskonstante, die wir genau genommen immer ausdrücklich hinschreiben müssten, meistens weglassen. 4.6.1 Faktorregel Ein konstanter Faktor kann vor das Integral gezogen werden: % % af (x)dx = a f (x)dx. (4.49) Diese Regel ist eine direkte Umkehrung der Faktorregel für die Differentiation. Beispiel: % f (x) = f (x)dx = = = 3 , 4 x % % % 3 1 dx = 3 dx = 3 x−4 dx x4 x4 1 3 x−4+1 + C = −x−3 + C −4 + 1 1 − 3 + C. x (4.50) (4.51) Beispiel: %4 − 72 5x !4 2 7 5! x− 2 dx = 5 − x− 2 !! = 5 2 2 # $ # $ 1 1 1 1 −√ −√ −2 √ = −2 32 ( 4)5 16 · 2 25 # $ 1 1 1 1 − √ = √ − −2 32 4 2 2 2 16 √ √ √ √ √ 4 2−1 8− 2 8 2−2 2 16 − 2 2 √ √ = = . = √ 2 · 16 16 2 2 · 16 2 · 16 2 %4 dx = 2 = = = 5 (4.52) 4 Integration 4.6.2 95 Summenregel Das Integral einer Summe ist gleich der Summe der Integrale: % % % [f (x) + g(x)]dx = f (x)dx + g(x)dx. (4.53) Beispiel: f (x) = x3 + 2x % % % x2 x4 x4 +2 = + x2 . (x3 + 2x)dx = x3 dx + 2x dx = 4 2 4 4.6.3 (4.54) (4.55) Substitutionsmethode Bei der Substitutionsmethode versucht man, die zu integrierende Funktion durch Einführen einer neuen Variablen zu vereinfachen oder auf eine Form zu bringen, die in einer Formelsammlung gefunden werden kann. Im Allgemeinen führt man in der Substitutionsmethode eine Transformation auf eine neue Variable u = g(x) durch. Im Integral % f (x)dx (4.56) muss dazu sowohl die Funktion f (x) als auch das Differential dx transformiert werden. Für die Transformation benötigen wir die Umkehrfunktion x = g −1 (u) der Substitutionsfunktion u = g(x). Mit Hilfe von g und g −1 können wir die Wirkung der Variablentransformation auf die Funktion ausdrücken als (4.57) f (x) = f (g −1 (u)). Das transformierte Differential bestimmen wir, indem wir den Ausdruck du = g (x) dx nach dx auflösen: dx = du du = −1 . g (x) g (g (u)) Somit können wir das Integral ausdrücken als % % % du du f (x)dx = f (g −1 (u)) = f (g −1 (u)) −1 . g (x) g (g (u)) (4.58) (4.59) (4.60) Wenn wir die Funktion g −1 (u) umbenennen in ϕ(u) = g −1 (u), (4.61) dx = ϕ (u) ⇒ dx = ϕ (u)du, du (4.62) können wir auch schreiben: x = ϕ(u), und somit % % f (x)dx = f (ϕ(u))ϕ (u)du. (4.63) Nach Bestimmung des unbestimmten Integrals, d.h. der Stammfunktion, in der Variablen u erhalten wir das Integral als Funktion von x durch Rücktransformation zur ursprünglichen Variablen. 96 4 Integration Die obigen Ausdrücke schauen zunächst beträchtlich komplizierter aus als der Ausdruck, von dem wir ausgegangen sind. Dass es aber tatsächlich zu einer Vereinfachung kommen kann, zeigen die folgenden Beispiele. Beispiel: Zu berechnen ist das Integral % (4 + 5x)7 dx. (4.64) Hier könnten wir die siebente Potenz der Klammer explizit berechnen und dann Term für Term integrieren. Einfacher ist es, eine neue Variable einzuführen: u = 4 + 5x. (4.65) Dann gilt du/dx = 5 und somit dx = du/5. Durch Einsetzen erhalten wir % % 1 1 8 u8 du = u = . (4 + 5x)7 dx = u7 5 58 40 (4.66) Um zur ursprünglichen Variablen zurückzukehren, setzen wir einfach u = 4 + 5x oben ein: % (4 + 5x)8 . (4.67) (4 + 5x)7 dx = 40 Beispiel: Zu berechnen ist das Integral % 1 x 6 − 3x2 dx. (4.68) 2 Hier versuchen wir es mit u = 6 − 3x2 als Substitutionsfunktion. In diesem Fall ist du du = −3 · 2x = −6x d.h. dx = − . (4.69) dx 6x Wir drücken hier das x im Nenner nicht durch u aus, sondern lassen es einfach stehen und erkennen, dass es sich nach Einsetzen des Differentials mit einem Faktor des Integrals kürzt: % % % √ 1 1 √ du 1 x 6 − 3x2 dx = x u − udu =− 2 2 6x 12 1 2 3 1 3 = − (4.70) u2 = − u2 . 12 3 18 Rücktransformation ergibt: % 3 1 1 x 6 − 3x2 dx = − (6 − 3x2 ) 2 . (4.71) 2 18 Eine so vorteilhafte Kürzung wie in diesem Beispiel ist jedoch nicht immer möglich. Beispiel: Wir berechnen das Integral % cos(ωt + ϕ)dt, (4.72) indem wir die Substitution u = ωt + ϕ durchführen. Dann gilt du =ω dt Wir haben also % und somit % cos(ωt + ϕ)dt = cos u dt = du . w du sin(u) 1 = = sin(ωt + ϕ). ω ω ω (4.73) (4.74) 4 Integration 4.6.4 97 Partielle Integration Durch Anwendung der Produktregel kann das Produkt zweier Funktionen f (x) und g(x) leicht differenziert werden: d(f (x)g(x)) df dg = g(x) + f (x) , dx dx dx (4.75) (f g) = f g + f g . (4.76) oder, etwas kürzer, Diese Regel kann uns bei der Integration eines Produkts zweier Funktionen behilflich sein, falls für eine oder beide Funktionen die Stammfunktion erkennbar ist und wir also das Integral schreiben können als: % (4.77) f (x)g(x)dx. Wenn der Integrand in einer derartigen Form vorliegt, können wir die Produktregel der Differentiation anwenden und erhalten: % % % f (x)g(x)dx = (f (x)g(x)) dx − f (x)g (x)dx % = f (x)g(x) − f (x)g (x)dx, (4.78) wobei wir einfach ausgenützt haben, dass f (x)g(x) die Stammfunktion von (f (x)g(x)) ist. In Worten ausgedrückt: die Stammfunktion eines Produktes ist gleich dem Produkt der Stammfunktion der ersten Funktion mit der zweiten Funktion minus dem Integral des Produkts der Stammfunktion der ersten Funktion mit der& Ableitung der zweiten Funktion. &Natürlich hat diese Prozedur nur dann Sinn, wenn das Integral f g dx einfacher als das Integral f gdx ist. Beispiel: Zu berechnen ist das Integral % xex dx. (4.79) Hier wählen wir f (x) = ex (da ex einfach zu integrieren ist) und g(x) = x. Dann ist % % x x e dx = e x − 1 ex dx = ex x − ex = ex (x − 1). x g f f g g (4.80) f Die Wahl f (x) = x und g(x) = ex wäre weniger sinnvoll gewesen, denn dann hätten wir % % 2 x2 x x x e dx = e − ex dx x 2 2 g g g f f (4.81) f erhalten und unser Problem wäre nur schwieriger geworden, da die Funktion x2 ex nicht leichter zu integrieren ist als die Funktion xex . Beispiel: Zu berechnen ist das Integral % ln xdx. (4.82) 98 4 Integration Hier ist auf den ersten Blick kein Produkt vorhanden, aber wir können den Integranden durch Multiplikation mit 1 leicht als ein Produkt anschreiben: % % ln xdx = 1 · ln xdx. (4.83) Wir wählen jetzt f (x) = 1 und g(x) = ln x und erhalten so % % % 1 · ln x dx = x ln x − x dx ln xdx = 1 x g g f f f g % = x ln x − 1dx = x ln x − x = x(ln x − 1). Beispiel: Zu berechnen ist das Integral (4.84) % cos2 (x)dx. (4.85) Wir wählen für dieses Beispiel f (x) = cos(x) und g(x) = cos(x) und erhalten durch partielle Integration: % % % 2 cos (x)dx = cos(x) cos(x)dx = sin(x) cos(x) + sin(x) sin(x)dx % = sin(x) cos(x) + (1 − cos2 (x))dx % % = sin(x) cos(x) + 1dx − cos2 (x)dx. (4.86) Das Integral 4.7 & 1dx = x und durch einfaches Umformen erhalten wir schließlich: % 1 [sin(x) cos(x) + x] . cos2 (x)dx = 2 (4.87) Rotationskörper Rotieren wir eine durch die Funktion f (x), die beiden Abszissen a und b und die x-Achse begrenzte Fläche um die x-Achse, so entsteht ein dreidimensionaler Rotationskörper. Zur Berechnung seines Volumens zerteilen wir das Intervall [a, b] in n gleiche Unterintervalle der Breite ∆x = (b−a)/n. Zu jedem dieser n Intervalle gehört nun eine dünne Scheibe mit kreisförmiger Grundfläche und einer Dicke ∆x (siehe Abb. 4.11). Der Radius der Grundfläche im i-ten Intervall ist für sehr kleine Dicken ∆x gleich dem Funktionswert f (xi ) an der Stelle xi = a + i∆x. Das Volumen der Scheibe ist daher ∆Vi = Grundfläche × Höhe ≈ f (xi )2 π∆x. (4.88) Durch Summation der Volumina aller dünnen Scheiben erhalten wir schließlich das Gesamtvolumen des Rotationskörpers V = n ∆Vi ≈ i=1 n f (xi )2 π∆x. (4.89) i=1 Im Grenzwert ∆x → 0 geht dieser Ausdruck in das Integral %b %b 2 V = f (x)2 dx f (x) πdx = π a a (4.90) 4 Integration 99 Abbildung 4.11: Rotation einer durch eine Funktion f (x) und der x-Achse in einem Intervall [a, b] begrenzten Fläche führt zu einem so genannten Rotationskörper. über. Wir können somit das Volumen eines Rotationskörpers als bestimmtes Integral über die Funktion f (x)2 ausdrücken. Beispiel: Zu berechnen ist das Volumen eines Kegels mit einer Grundfläche mit Radius r und einer Höhe h (siehe Abb. 4.12). Die Funktion f (x) ist in diesem Fall eine Gerade durch den Ursprung mit Steigung r/h: f (x) = r x. h (4.91) Das Volumen des Kegels ist demnach das bestimmte Integral %b !h %h 2 πr2 x3 !! 1 πr2 h3 r 2 f (x) dx = π x dx = 2 · ! = . h h 3 0 3 h2 2 V =π a (4.92) 0 Somit ist das Volumen des Kegels gegeben durch: V = 1 2 πr h. 3 (4.93) Beispiel: Die Parabel f (x) = 9 − x2 rotiert zwischen ihren Nullstellen um die x-Achse und erzeugt dadurch einen Rotationskörper (siehe Abb. 4.13). Zu bestimmen ist das Volumen des Rotationskörpers. Die Nullstellen der Parabel befinden sich bei x = ±3. Das Volumen V des Rotationskörpers ist 100 4 Integration Abbildung 4.12: Durch Rotation der Geraden y = (r/h)x im Intervall [0, h] um die x-Achse entsteht ein Kegel mit Höhe h und mit Grundflächenradius r. Abbildung 4.13: Durch Rotation der Parabel f (x) = 9 − x2 zwischen ihren Nullstellen um die x-Achse entsteht ein Rotationskörper. demnach gegeben durch: %3 V %3 (9 − x ) dx = π 2 2 = π −3 # (81 − 18x2 + x4 )dx −3 $3 18x x 243 = π 81x − + = 2π 81 · 3 − 6 · 27 + 3 5 −3 5 243 648 . = 2π 243 − 162 + = 2π · 5 5 3 5 (4.94) Beispiel: Zu bestimmen ist das Volumen einer Kugel mit Radius r. Wir stellen uns dazu vor, dass die Halbkugel durch Rotation der Kurve f (x) = r2 − x2 (4.95) 4 Integration 101 Abbildung 4.14: Durch Rotation eines Halbkreises um die x-Achse entsteht eine Halbkugel. im Intervall [0, r] um die x-Achse entstanden ist (siehe Abb. 4.14). Das Volumen der Kugel ist somit zweimal das Volumen des Rotationskörpers: r %r % %r V = 2π (r2 − x2 )dx = 2π r2 dx − x2 dx 0 0 !r !r ! x3 !! r3 2 ! = 2πr x! − 2π ! = 2πr3 − 2π 3 3 0 0 1 4 = 2πr3 1 − = πr3 . 3 3 4.8 0 (4.96) Berechnung von Bogenlängen Abbildung 4.15: Die Bogenlänge des Funktionsgraphen von f (x) kann durch Integration ermittelt werden. Das Differential ds der Bogenlänge kann mit Hilfe des Pythagoräischen Lehrsatzes aus den Differentialen dx und dy ermittelt werden. Gegeben sei die Funktion f (x) mit dem dazugehörige Funktionsgraphen in der xy-Ebene. Wir wollen nun in einem bestimmten Intervall die Länge s des Funktionsgraphen von f (x) berechnen. (Die Länge einer Kurve wird auch Bogenlänge genannt.) Dazu betrachten wir ein kleines Unterintervall der Länge dx, wobei wir das Differential benutzen, um anzudeuten, dass es sich hier um infinitesimale Differenzen handelt. Das dazugehörige Differential in der y-Richtung ist gegeben 102 4 Integration durch: dy = f (x)dx. (4.97) Die Länge ds des von den Abszissen x und x + dx begrenzten Kurvenstücks erhalten wir durch Anwendung des Pythagoräischen Lehrsatzes: ds = dy 2 + dx2 . (4.98) Hier haben wir ausgenutzt, dass sich die Kurve für infinitesimale dx im Intervall [x, x + dx] durch eine Gerade approximieren lässt. Wir formen nun die obige Gleichung unter Verwendung von Gleichung (4.97) um: ds = dy 2 + dx2 = (f (x)dx)2 + dx2 = 1 + f (x)2 dx. (4.99) Um die Gesamtlänge der Kurve zwischen x = a und x = b zu erhalten, summieren wir über alle infinitesimalen Unterintervalle und erhalten die Bogenlänge: s= %b 1 + f (x)2 dx. (4.100) a Beispiel: Zu bestimmen ist der Umfang des Kreises mit Radius r. Wir berechnen zunächst den Umfang des √ Halbkreises. Der Halbkreis ist der Graph der Funktion f (x) = r2 − x2 und die Integrationsgrenzen sind −r und r (siehe Abb. 4.16). Abbildung 4.16: Der dargestellte Halbkreis ist der Graph der Funktion y = [−r, r]. √ r2 − x2 im Intervall Die Ableitung von f (x) ist 2x 1 x f (x) = − √ = −√ . 2 r2 − x2 r2 − x2 (4.101) Somit ist die Bogenlänge s gegeben durch: s = %r " 1+ −r %r = −r x2 dx = r2 − x2 r √ dx = 2 r − x2 %r −r %r " −r r2 − x2 + x2 dx r2 − x2 1 2 dx. 1 − xr (4.102) 4 Integration 103 Zur Lösung des Integrals substituieren wir t = x/r, das heißt dt = dx/r und dx = rdt. Hier müssen auch die Integrationsgrenzen transformiert werden: an den Stellen x = −r und x = r hat die neue Variable t die Werte t = −1 und t = 1. Durch die Transformation wird die Bogenlänge zu: !1 %1 ! r 1 √ √ = dt = r dt = r arcsin t!! 2 2 1−t 1−t −1 −1 −1 ' π π ( − − = rπ. = r 2 2 %1 s (4.103) Der Umfang des Kreises ist dann einfach U = 2πr. (4.104) Für eine in Parameterform gegebene Kurve x = x(t), (4.105) y y(t), (4.106) = drücken wir die Differentiale in x- und y-Richtung aus als: dx dx = dt = ẋ(t)dt, dt dy dy = dt = ẏ(t)dt. dt (4.107) (4.108) Abbildung 4.17: Für eine Kurve in Parameterform, r = r(t), kann die Bogenlänge zwischen t = α und t = β durch Integration berechnet werden. In diesem Fall ist die infinitesimale Bogenlänge ds gegeben durch ds = dx2 + dy 2 = ẋ(t)2 dt2 + ẏ(t)2 dt2 = ẋ(t)2 + ẏ(t)2 dt (4.109) und die Gesamtbogenlänge ergibt sich aus der Integration über die Hilfsvariable t: %β s= ẋ(t)2 + ẏ(t)2 dt. (4.110) α Die Integrationsgrenzen t = α und t = β entsprechen den Punkten, zwischen denen die Bogenlänge berechnet werden soll (siehe Abb. 4.17). 104 4 Integration Beispiel: Zu berechnen ist der Umfang der in Parameterform gegebenen Ellipse x(t) = a sin t, (4.111) y(t) = b cos t. (4.112) a und b sind die Halbachsen der Ellipse und wir nehmen an, dass a > b. Der Parameter t durchläuft das Intervall [0, 2π]. Die Ableitungen von x(t) und y(t) nach t sind ẋ = ẏ = a cos t, −b sin t, (4.113) (4.114) und somit kann der Umfang der Ellipse als das Vierfache der Bogenlänge im ersten Quadranten ausgedrückt werden: %2 %2 " b2 2 2 2 2 4 a cos t + b sin tdt = 4a cos2 t + 2 sin2 tdt a π s = π 0 0 π 2 % " %2 ) 2 a − b2 b 1 − sin2 t + 2 sin2 tdt = 4a 1− 4a sin2 tdt a a2 π 2 = 0 0 π 2 = 4a % 1 − K 2 sin2 tdt, (4.115) 0 wobei wir hier die Exzentrizität K = (a2 − b2 )/a2 der Ellipse eingeführt haben. Für einen Kreis ist K = 0 und für eine Ellipse mit a > b ist K > 0. & 1 − K 2 sin2 t dt hat keine Lösung, die sich mit Hilfe einfacher, bekannter FunktioDas Integral nen ausdrücken lässt. Man definiert daher einfach eine neue Funktion %α E(α, K) ≡ 1 − K 2 sin2 tdt |K| < 1. (4.116) 0 Man nennt diese Funktion ein elliptisches Integral (genauer: ein elliptisches Integral der 2. Art). Die Funktion kann für ein bestimmtes α und ein bestimmtes K mit dem Computer ausgewertet werden (z.B. mit Mathematica). In Abb. 4.18 ist die Funktion E(α, K) für α = π/2 als Funktion von K dargestellt. Mit Hilfe des elliptischen Integrals E(α, K) kann der Ellipsenumfang schließlich ausgedrückt werden als " a2 − b 2 π , . (4.117) s = 4aE 2 a2 Beispiel: Archimedische Spirale Zu bestimmen ist die Länge der Archimedischen Spirale r = aϕ im Bereich von ϕ = 0 bis ϕ = ϑ (siehe Abb. 4.19). In Parameterform ist die Spirale gegeben durch x(ϕ) = aϕ cos ϕ, (4.118) y(ϕ) = aϕ sin ϕ. (4.119) 4 Integration 105 Abbildung 4.18: Das elliptische Integral der 2. Art E(α, K) für α = π/2 in Abhängigkeit von K. Die Ableitungen von x(ϕ) und y(ϕ) nach dem Winkel ϕ sind ẋ = ẏ = a cos ϕ − aϕ sin ϕ, a sin ϕ + aϕ cos ϕ. (4.120) (4.121) Die Bogenlänge der Spirale zwischen ϕ = 0 und ϕ = ϑ ist somit: s = %ϑ (a cos ϕ − aϕ sin ϕ)2 + (a sin ϕ + aϕ cos ϕ)2 dϕ 0 = %ϑ a (cos ϕ − ϕ sin ϕ)2 + (sin ϕ + ϕ cos ϕ)2 dϕ = %ϑ (( (( (sin (sin (ϕ (ϕ a cos2 ϕ − ( 2ϕ( cos ϕ + ϕ2 sin2 ϕ + sin2 ϕ + ( 2ϕ( cos ϕ + ϕ2 cos2 ϕdϕ 0 0 = %ϑ ) a cos2 ϕ + sin2 ϕ +ϕ2 (sin2 ϕ + cos2 ϕ)dϕ 0 =1 =1 ( !!ϑ a' 2 2 ϕ 1 + ϕ + Arsinh(ϕ) !! a 1 + ϕ dϕ = 2 0 0 ' ( a ϑ 1 + ϑ2 + Arsinh(ϑ) 2 %ϑ = = = ( a' ϑ 1 + ϑ2 + ln(ϑ + 1 + ϑ2 ) . 2 (4.122) 106 4 Integration Abbildung 4.19: Die Archimedische Spirale r = aϕ. 4.9 Mittelwerte von Funktionen Um den Mittelwert von n Zahlen ai zu bestimmen, addiert man die Zahlen und dividiert sie durch deren Anzahl: a= a1 + a2 + a3 + · · · + an−1 + an , n (4.123) wobei der horizontale Strich über dem a auf der linken Seite der obigen Gleichung einen Mittelwert bedeutet. a könnte zum Beispiel der Mittelwert einer Reihe von Messdaten sein. Wir wollen nun das zeitliche Mittel einer Funktion f (t) bestimmen. Dazu stellen wir uns vor, dass wir den Wert der Funktion beginnend bei t = a nach Zeitschritten ∆t bestimmen. Das heißt, wir bestimmen f (t) zuerst bei t = a und messen dann f (t) wiederholt zu den Zeitpunkten ti = a + i∆t (siehe Abb. 4.20). Durch diesen Messvorgang erhalten wir n Messwerte f (ti ), die man tabellarisch darstellen kann als: ti t1 t2 t3 ... tn f (ti ) f (t1 ) f (t2 ) f (t3 ) ... f (tn ) . Der Mittelwert aller dieser Messwerte ist f= f (t1 ) + f (t2 ) + · · · + f (tn ) . n Wir multiplizieren jetzt sowohl Zähler als auch Nenner mit ∆t n f (ti )∆t . f = i=1 n · ∆t (4.124) (4.125) Wir erkennen, dass für sehr kurze Zeitintervalle ∆t der Zähler übergeht in das bestimmte Integral &b f (t)dt. Der Nenner ist einfach die Länge des gesamten Intervalls, n∆t = (b − a). Das heißt a &b f= f (t)dt 1 = (b − a) (b − a) % a b f (t)dt. (4.126) a In Worten kann man dies wie folgt ausdrücken: Der Mittelwert f einer Funktion im Intervall (a, b) ist gleich dem bestimmten Integral der Funktion f (t) zwischen den Integrationsgrenzen a und b dividiert durch die Länge des Intervalls [a, b]. 4 Integration 107 Abbildung 4.20: Die Funktion f (t) wird zu äquidistanten Zeitpunkten ti bestimmt. Natürlich gilt auch: % b f (t)dt = f (b − a). (4.127) a Beispiel: Durch einen Widerstand fließt ein Wechselstrom I(t) = I0 sin ωt und es fällt am Widerstand eine Spannung U (t) = U0 sin ωt ab. Zu berechnen ist der Mittelwert der Leistung über eine Periode. Die momentane Leistung ist Strom × Spannung, das heißt P (t) = U (t) · I(t) = U0 I0 sin2 ωt. (4.128) Die Länge der Periode ist T = 2π/ω. Das heißt, die mittlere Leistung ist gegeben durch (siehe Abb. 4.21) P = = 1 T % T 0 I0 U0 T 1 P (t)dt = T %T U0 I0 sin2 ωt dt 0 %T sin2 ωt dt. (4.129) 0 Durch partielle Integration hatten wir weiter oben das Integral ermittelt. Da cos2 x = 1 − sin2 x, folgt für das Integral von sin2 x: % & cos2 xdx = x 1 1 sin2 x dx = x − (sin x cos x + x) = − sin x cos x. 2 2 2 1 2 (sin x cos x + x) (4.130) Mit der Substitution u = ωt ⇒ dt = du/ω erhalten wir % # $ 1 ωt 1 sin ωt dt = − sin ωt cos ωt . ω 2 2 2 (4.131) 108 4 Integration Abbildung 4.21: Die durchschnittliche an einem Ohmschen Widerstand verbrauchte Leistung lässt sich durch Integration der Leistung als Funktion der Zeit bestimmen. und somit P = $ !T # ! I0 U0 1 ωt 1 − sin ωt cos ωt !! T ω 2 2 0 = 1 2π 2π I0 U0 1 ωT ω) cos( ω) −0 + sin(0) cos(0) − sin( ωT ω ω 2 2 2 = I0 U0 . 2 =0 4.10 0 (4.132) Doppelintegrale So wie wir Funktionen von zwei, drei oder noch mehr Variablen differenzieren können, können wir sie auch integrieren. Integration solcher Funktionen führt zu Mehrfachintegralen, die in der Physik sehr oft auftreten, zum Beispiel bei der Bestimmung von Volumina, Massen, Schwerpunkten, Trägheitsmomenten, Zustandssummen usw. Mehrfachintegrale lassen sich auf die Nacheinanderausführung von gewöhnlichen Integralen zurückführen. 4.10.1 Definition Bisher haben wir die durch eine Kurve begrenzte Fläche als bestimmtes Integral berechnet (siehe Abb. 4.22): %b Sab = f (x)dx. (4.133) a Wir wollen uns nun mit der analogen Aufgabe beschäftigen, das Volumen eines Körpers zu berechnen, der von einer Fläche f (x, y), von einem Bereich A der xy-Ebene und vom vertikal bis zur Fläche fortgesetzten Rand von A begrenzt wird (siehe Abb. 4.23). Um dieses Volumen zu bestimmen, gehen wir ähnlich vor wie bei der Berechnung der Fläche Sab , die wir in schmale senkrechte Streifen eingeteilt hatten. Wir teilen dazu den Bereich A in kleine Rechtecke mit Kantenlängen ∆x und ∆y ein, indem wir ein Gitter über die xy-Ebene legen (siehe Abb. 4.24). Jedes Rechteck wird durch zwei Indizes beschrieben, einem in der x-Richtung (i) und einem in der y-Richtung (j). In jedem Rechteck (das wir auch Zelle nennen) wählen wir einen Punkt (xi , yj ). 4 Integration 109 Abbildung 4.22: Die Fläche Sab unter einer Kurve kann durch einfache Integration bestimmt werden. Abbildung 4.23: Zur Bestimmung des Volumens unter einer Fläche ist eine Doppelintegration notwendig. Abbildung 4.24: Zur Berechnung des von einer Fläche begrenzten Volumens teilen wir den Bereich A in der xy-Ebene in viele kleine Rechtecke ein. Abbildung 4.25: Ein Teilvolumen über einem der kleinen Rechtecke im Bereich A. Die Höhe des Volumens ist etwa der Funktionswert f (xi , yi ) an der Stelle xi , yi . Dieser Punkt kann der Mittelpunkt der Zelle sein oder irgendwo anders in der Zelle liegen (auch am Rand). Zu jedem dieser Punkte (xi , yj ) gibt es einen Funktionswert f (xi , yj ). Das Volumen über der Zelle, das von der Fläche f (x, y) oben begrenzt wird, ergibt sich näherungsweise aus der Grundfläche ∆x∆y der Zelle multipliziert mit deren Höhe f (xi , yj ) (siehe Abb. 4.25): ∆V ≈ ∆x∆y · f (xi , yj ). (4.134) Hier machen wir natürlich einen Fehler, weil dieses Teilvolumen oben nicht durch eine ebene, horizontale Fläche begrenzt wird. Für kleiner werdende ∆x und ∆y wird dieser Fehler jedoch immer kleiner. Durch Summation über alle Quader, deren zugehörige Punkte (xi , yj ) in A liegen, erhalten wir schließlich annäherungsweise das gesuchte Gesamtvolumen V V ≈ f (xi , yj )∆x∆y. (4.135) i j Wie beim eindimensionalen Fall nähert die Summe das Volumen immer besser an, je feiner die Einteilung der xy-Ebene gewählt wird, das heißt je kleiner ∆x und ∆y sind. Im Grenzfall ∆x → 0 und ∆y → 0 erhalten wir das exakte Volumen: %% f (xi , yj )∆x∆y = f (x, y)dxdy. (4.136) V = lim lim ∆x→0 ∆y→0 i j A 110 4 Integration Dieser Grenzwert ist das Doppelintegral der Funktion f (x, y) im Gebiet A. Das Produkt dxdy nennt man auch das Flächenelement. Da das Gebiet A kompliziert sein kann, können wir nicht wie im eindimensionalen Fall einfache Integrationsgrenzen angeben. Wir schreiben daher &b das Gebiet A einfach unter das Doppelintegral. Wie beim Integral a f (x)dx müssen wir diesen Grenzübergang nicht für jedes Integral neu durchführen. Statt dessen können wir die Berechnung des Doppelintegrals auf die Berechnung einfacher Integrale zurückführen. 4.10.2 Berechnung von Doppelintegralen Zur Berechnung eines Doppelintegrals gehen wir von der Summe V ≈ f (xi , yj )∆x∆y i (4.137) j aus und führen die Summation über i und j getrennt durch. Zunächst summieren wir für ein bestimmtes i über alle möglichen Werte von j. Diese Summation entspricht der Berechnung des Volumens einer Schicht der Dicke ∆x parallel zur yz-Ebene (siehe Abb. 4.26): Vi = f (xi , yj )∆y ∆x. (4.138) j Abbildung 4.26: Die Summation über alle j für einen bestimmten Wert i ergibt das Volumen einer Schicht mit der Dicke ∆x, die parallel zur yz-Ebene liegt. Führen wir jetzt den Grenzwert ∆y → 0 durch, erhalten wir b(x % i) f (xi , y)dy ∆x. Vi = (4.139) a(xi ) Dabei hängen die Integrationsgrenzen vom Ort xi ab. In der xy-Ebene wird der Integrationsbereich A durch die zwei Kurven a(x) und b(x) begrenzt (siehe Abb. 4.27). Hier gehen wir der Einfachheit halber davon aus, dass der Integrationsbereich nur zwei senkrechte Tangenten besitzt. Falls das nicht der Fall ist (siehe zum Beispiel Abb. 4.28), muss man dies berücksichtigen. Auch in diesem Fall ändert sich jedoch die prinzipielle Vorgangsweise nicht. Das Volumen Vi aus Gleichung (4.139) entspricht dem Volumen über der schraffierten Fläche in Abb. 4.27. Um das Gesamtvolumen zu berechnen, müssen wir noch über alle Teilvolumina Vi 4 Integration 111 Abbildung 4.27: Die Integrationsgrenzen a(x) und b(x) für die Integrationsgrenzen in y-Richtung hängen von der x-Position ab. Abbildung 4.28: Falls der Integrationsbereich wie hier mehr als zwei senkrechte Tangenten besitzt, muss man die Integration in mehrere Doppelintegrale aufteilen. summieren: V ≈ Vi = i Dieses bestimmte Integral b(x & i) i b(x % i) f (xi , y)dy ∆x. (4.140) a(xi ) f (xi , y)dy auf der rechten Seite der obigen Gleichung ist eine Funk- a(xi ) tion von xi . Die Abhängigkeit von y ist bereits verschwunden, weil wir über die Integrationsvariable y integriert haben. Durch Bildung des Grenzübergangs ∆x → 0 erhalten wir schließlich b(x b(x) d i) % % % f (xi , y)dy ∆x = f (x, y)dy dx, (4.141) V = lim ∆x→0 i a(xi ) c a(x) wobei wir wieder die Definition des Integrals als Grenzfall einer Summe benutzt haben. Wir haben somit die Berechnung des Doppelintegrals auf die hintereinander ausgeführte Berechnung zweier einfacher Integrale zurückgeführt. Natürlich hätten wir auch die Integrationsreihenfolge umkehren können: %b d(y) % %b d(y) % f (x, y)dx dy = f (x, y)dxdy. V = a c(y) (4.142) a c(y) In diesem Fall müssen wir die Integrationsgrenzen für die Integration nach x als Funktion von y ausdrücken. 112 4 Integration Beispiel: Zu berechnen ist das Integral durch: && √ x + y dxdy für einen rechteckigen Bereich A, der gegeben ist A 1 ≤ x ≤ 2, (4.143) 0 ≤ y ≤ 5. (4.144) Abbildung 4.29: Integrationsbereich A. In diesem Fall vereinfacht sich die Berechnung, weil die Integrationsgrenzen in y-Richtung nicht von x abhängen: %% √ %5 %2 x + y dxdy = A 0 = 2 3 1 %5 0 = = = √ x + y dxdy = 22 35 %5 0 !2 2 3! (x + y) 2 !! dy 3 x=1 3 3 (y + 2) 2 − (y + 1) 2 dy !5 !5 ! 5! (y + 2) !! − (y + 1) 2 !! 5 2 0 0 5 5 22 5 72 − 22 − 62 + 1 35 5 5 4 5 72 − 22 − 62 + 1 . 15 (4.145) Wenn wir die Integrationsreihenfolge umkehren, erhalten wir: %% √ %2 %5 x + ydxdy = A 1 = 2 3 √ x + ydydx = 0 %2 %2 1 !5 3! 2 (x + y) 2 !! dx 3 y=0 3 3 (x + 5) 2 − x 2 dx 1 = = !2 !2 2 5! 5! 2 (x + 5) 2 !! − x 2 !! 5 5 1 1 5 5 5 4 72 − 22 − 62 + 1 , 15 2 3 was mit dem oben erhaltenen Resultat übereinstimmt. (4.146) 4 Integration 113 Beispiel: Zu berechnen ist das Volumen des Kugeloktanten einer Kugel mit Radius r (siehe Abb. 4.30). Im Unterschied zum vorherigen Beispiel müssen wir hier die x-Abhängigkeit der Integrationsgrenzen in y berücksichtigen. Abbildung 4.30: Der Kugeloktant ist im ersten Quadranten durch die Fläche z = nach oben begrenzt. r2 − x2 − y 2 Die Kugeloberfläche im ersten Oktanten ist gegeben durch: x2 + y 2 + z 2 = r2 ⇒ f (x, y) = r2 − x2 − y 2 . (4.147) Das Volumen V8 des Kugeloktanten lässt sich somit als folgendes Doppelintegral ausdrücken: b(x) %r % r2 − x2 − y 2 dy dx. V8 = (4.148) 0 a(x) Da die Grenzen für die Integration in y-Richtung a(x) = 0 sind, erhalten wir: %r V8 = 0 √ und b(x) = r2 − x2 dy r2 − x2 − y 2 dx. (4.149) r%2 −x2 (4.150) 0 Aus einer Formelsammlung entnehmen wir, dass % 1' 2 y( y a − y 2 + a2 arcsin . a2 − y 2 dy = 2 a (4.151) Somit erhalten wir für die Integration in y-Richtung: √ r%2 −x2 (r2 − x2 ) − y 2 dy = 0 $√r2 −x2 # 1 2 y 2 2 y (r − x2 ) − y 2 + (r − x ) arcsin √ 2 r2 − x2 0 + π 1* 0 + (r2 − x2 ) arcsin(1) − 0 − 0 = (r2 − x2 ). 2 4 Einsetzen dieses Resultats und Integration in x-Richtung ergibt schließlich !r %r π x3 !! π 2 V8 = (r − x2 )dx = r2 x − 4 4 3 !0 0 π r3 r3 π 2 π 3 = r − = · · r3 = , 4 3 3 4 6 = (4.152) (4.153) 114 4 Integration sodass wir für das Kugelvolumen das erwartete Resultat V =8 4 r3 π = πr3 6 3 (4.154) erhalten. 4.10.3 Doppelintegrale in Polarkoordinaten Oft ist es leichter, den Integrationsbereich A für ein Doppelintegral in Polarkoordinaten auszudrücken. So ist es zum Beispiel bei Integration über einen Kreis mit Radius R einfacher, den Inte√ grationsbereich durch 0 ≤ r ≤ R und 0 ≤ ϕ ≤ 2π als durch −R ≤ x ≤ R und − R2 − x2 ≤ y ≤ √ R2 − x2 zu beschreiben. In Polarkoordinaten ist der Integrationsbereich also einfach ein Rechteck, während wir in kartesischen Koordinaten mit komplizierteren Funktionen arbeiten müssen. Um diese Vereinfachung auszunützen, können wir die Integration in Polarkoordinaten durchführen. Dazu drücken wir zuerst die zu integrierende Funktion in Polarkoordinaten aus: f (x, y) = f (r cos ϕ, r sin ϕ). (4.155) Wir müssen allerdings auch das Flächenelement dxdy = dA richtig transformieren. Das Flächenelement dA ergibt sich ja dadurch, dass wir die Variablen x und y um einen kleinen Betrag dx bzw. dy ändern und dadurch das Flächenelement dA = dxdy erzeugen. Welches Flächenelement entsteht aber, wenn wir ϕ um dϕ und r um dr ändern? Abbildung 4.31: Das Flächenelement dA entsteht durch eine Änderung des Winkels ϕ um dϕ und eine Änderung des Radius r um dr. Dieses Flächenelement ist von gekrümmten Linien begrenzt (siehe Abb. 4.31). Für sehr kleine dϕ und dr kann man das Flächenelement mit vernachlässigbarem Fehler als Rechteck mit Seitenlängen dr und rdϕ betrachten (der Winkel ϕ wird in Bogenmaß angegeben). Der Flächeninhalt dieses kleinen Rechtecks ist daher: dA = rdϕdr. (4.156) Somit ergibt sich für die Transformation des Integrals von kartesischen Koordinaten zu Polarkoordinaten: %% %% f (x, y)dxdy = f (r cos ϕ, r sin ϕ)rdϕdr. (4.157) A A Hier ist A der in Polarkoordinaten beschriebene Integrationsbereich. 4 Integration 115 Beispiel: Wieder soll das Volumen des Kugeloktanten berechnet werden, diesmal allerdings unter Verwendung von Polarkoordinaten. Transformation des Integrationsbereichs in der xy-Ebene nach Polarkoordinaten ergibt: %% %% R2 − x2 − y 2 dxdy = R2 − r2 cos2 ϕ − r2 sin2 ϕrdϕdr V8 = K K π 2 % = %R R2 − r2 rdr dϕ, 0 2 (4.158) 0 2 wobei wir ausgenutzt haben, dass sin ϕ + cos ϕ = 1. Da der Integrand nicht vom Winkel ϕ abhängt, können wir die Integration über ϕ sofort durchführen und erhalten π V8 = 2 %R R2 − r2 rdr. (4.159) 0 Um dieses Integral über r zu bestimmen, führen wir die Substitution u = R2 − r2 durch. Da du/dr = −2r und somit dr = −du/2r, erhalten wir % % √ du R2 − r2 rdr = ur −2r 3 21 3 u2 − u2 = − 3 2 3 1 2 2 32 − (R − r ) . 3 = = (4.160) Einsetzen ergibt schließlich V8 = π 2 !R ! πR3 1 3 − (R2 − r2 ) 2 !! = , 3 6 0 (4.161) was mit dem früher erhaltenen Ergebnis übereinstimmt. Beispiel: Wir wollen das so genannte Gaußsche Integral %∞ 2 e−x dx (4.162) −∞ berechnen. Dieses Integral spielt in der Wahrscheinlichkeitsrechnung und in der statistischen Mechanik eine wichtige Rolle. Das Gaußsche Integral ist auf direkte Weise nicht leicht zu bestimmen, wir können es aber mit dem folgenden Trick berechnen. Wir schreiben das Integral zunächst als ∞ 12 %∞ % %∞ 2 2 2 e−x dx = e−x dx e−y dy . (4.163) A= −∞ −∞ −∞ Das können wir ohne weiteres tun, weil der Name der Integrationsvariablen (x oder y) belanglos ist. Das Produkt der beiden Integrale über x und über y können wir nun als ein Doppelintegral über die gesamte xy-Ebene auffassen. %∞ 2 A = e −∞ −x2 %∞ dx · −∞ e −y 2 %∞ %∞ dy = −∞ −∞ e−(x 2 +y 2 ) dxdy. (4.164) 116 4 Integration Abbildung 4.32: Die Fläche unter der Gaußschen Glockenkurve exp(−x2 ) ist A = √ π. Diese Darstellung erlaubt eine Transformation auf Polarkoordinaten: %2π%∞ 2 A = e 0 −r 2 %∞ rdrdϕ = 2π 0 2 e−r rdr. (4.165) 0 Hier haben wir ausgenützt, dass gilt r2 = x2 + y 2 . Der Integrand ist somit nicht mehr abhängig von ϕ, sodass wir die Integration über ϕ gleich ausführen konnten, was einen Faktor von 2π verursacht hat. Das noch verbleibende Integral über r ist leicht zu lösen. Wir erkennen, dass 2 d −r2 = e−r (−2r) e dr und somit 2 2 1 − e−r = e−r r. 2 d dr Durch Einsetzen erhalten wir schließlich !∞ ! 2 1 1 A2 = 2π − e−r !! = 2π (−0 + 1) = π. 2 2 0 (4.166) (4.167) (4.168) Das Gaußsche Integral ist also: %∞ 2 e−x dx = √ π. (4.169) −∞ 4.11 Dreifachintegrale 4.11.1 Definition Analog zum Doppelintegral können wir auch ein Dreifachintegral (oder im Allgemeinen ein nfaches Integral) definieren und berechnen. Gegeben sei ein Gebiet B im dreidimensionalen Raum, das von einer geschlossenen Fläche umgeben wird. Innerhalb dieses Gebiets sei eine Funktion f (x, y, z) definiert. Als Beispiel können wir uns einen Körper mit einer räumlich nicht uniformen Dichte ρ(x, y, z) vorstellen. Wir können die Funktion f (x, y, z) über den Bereich B integrieren, indem wir diesen in kleine Quader mit Kantenlängen ∆x, ∆y und ∆z einteilen. Das Volumen ∆V jedes Quaders ist ∆V = ∆x∆y∆z. (4.170) 4 Integration 117 Abbildung 4.33: Bei einer Dreifachintegration wird das Integrationsvolumen in infinitesimale Quader mit Kantenlängen dx, dy und dz, so genannte Volumselemente, eingeteilt. Wir summieren jetzt den Funktionswert f (xi , yj , zk ) in jedem Quader (z.B. im Quadermittelpunkt) multipliziert mit dem Volumen ∆V über alle kleinen Quader: f (xi , yj , zk )∆x∆y∆z. (4.171) i j k Wenn wir den Grenzwert ∆x → 0, ∆y → 0 und ∆z → 0 bilden, erhalten wir das Dreifachintegral von f (x, y, z) über den Bereich B: %%% f (x, y, z)dxdydz. (4.172) I= B Das infinitesimale Volumen dV nennt man das Volumselement. Oft schreiben wir auch %%% I= f (x, y, z)dV (4.173) B oder noch kürzer % I= f (x, y, z)dV. (4.174) B Für das 3d-Integral haben wir keine anschauliche Interpretation als Fläche oder Volumen, da wir dazu in den 4d-Raum ausweichen müssten. Analog zum Doppel- und Dreifachintegral lassen sich auch in beliebig hochdimensionalen Räumen Volumsintegrale bilden. Beispiel: Wir betrachten einen Körper mit einer inhomogenen Dichteverteilung, der also an unterschiedlichen Stellen unterschiedlich dicht ist. Denken Sie beispielsweise an den Planeten Erde, der einen metallischen Kern mit hoher Dichte besitzt, der von mineralischen Schichten mit niedrigerer Dichte umgeben ist. Die Dichteverteilung im Körper sei ρ(x, y, z), wobei die Dichte definiert ist als die Masse pro Volumen: ρ(x, y, z) = dm(x, y, z) . dV (4.175) Wir wollen nun die Gesamtmasse dieses Körpers berechnen. Dazu addieren wir die Massen aller infinitesimaler Volumselemente im Körper. Die Masse dm(x, y, z) des Volumselementes dV im 118 4 Integration Punkt (x, y, z) ist gegeben durch: dm(x, y, z) = ρ(x, y, z)dV. (4.176) Durch Summation (Integration) über alle Volumselemente erhalten wir die Gesamtmasse des Körpers: %%% ρ(x, y, z)dxdydz, (4.177) M= B wobei B der Bereich ist, der vom Körper ausgefüllt wird. 4.11.2 Berechnung von Dreifachintegralen Abbildung 4.34: Der Integrationsbereich B wird durch die Flächen ψ1 (x, y) und ψ2 (x, y) begrenzt. Die Projektion des Bereiches B in die xy-Ebene wird durch die Kurven ϕ1 (x) und ϕ2 (x) begrenzt. Durch zum zweidimensionalen Fall analoge Überlegungen lässt sich auch das Volumsintegral auf die Hintereinanderausführung von einfachen Integralen zurückführen (siehe Abb. 4.34). Dazu bezeichnen wir die beiden Begrenzungskurven der Projektion des räumlichen Bereiches B in die xy-Ebene mit y = ϕ1 (x) und y = ϕ2 (x). Die Grenzen in x-Richtung bezeichnen wir mit x1 und x2 und die beiden Begrenzungsflächen des räumlichen Bereichs mit z = ψ1 (x, y) und z = ψ2 (x, y). Dann kann das Dreifachintegral ausgedrückt werden als ϕ%2 (x) ψ2%(x,y) % %%% f (x, y, z)dxdydz = dx dy dzf (x, y, z) . (4.178) B ϕ1 (x) ψ1 (x,y) Eine andere Integrationsreihenfolge mit passend geänderten Integrationsgrenzen ist natürlich möglich. Beispiel: Wir berechnen als Beispiel das Volumen eines Ellipsoids mit Halbachsen a, b und c (siehe Abb. 4.35). Das Volumen können wir berechnen, indem wir die Funktion f (x, y, z) = 1 über das Ellipsoid integrieren: %%% V = 1 dxdydz, (4.179) wobei das Integrationsvolumen durch die Gleichung x 2 y 2 z 2 + + ≤1 a b c (4.180) 4 Integration 119 Abbildung 4.35: Ein Ellipsoid, dessen Achsen entlang der Koordinatenachsen verlaufen. gegeben ist. Das Volumen erhalten wir hier also einfach durch Summation aller Volumselemente, die sich im Inneren des Ellipsoids befinden. Die Begrenzungskurve der Projektion des Integrationsbereichs in die xy-Ebene ist für das Ellipsoid gegeben durch x2 y2 + 2 =1 2 a b und wird infolgedessen durch die beiden Funktionen " x2 ϕ1 (x) = −b 1 − 2 und a (4.181) " ϕ2 (x) = b 1− x2 a2 (4.182) beschrieben. Die Begrenzungsflächen im Raum folgen aus der Gleichung y2 z2 x2 + 2 + 2 =1 2 a b c (4.183) und werden durch die Funktionen " ψ1 (x, y) = −c " x2 y2 1− 2 − 2 a b und 1− ψ2 (x, y) = c x2 y2 − a2 b2 (4.184) beschrieben. In der x-Richtung wir das Ellipsoid durch die beiden Punkte x1 = −a x2 = a (4.185) begrenzt. Wir können nun die Integrale hintereinander ausführen, wobei wir mit dem Integral über die Integrationsvariable z beginnen. Für das Integral über z erhalten wir mit den beiden obigen Begrenzungsflächen: " ψ2%(x,y) 1dz = ψ2 (x, y) − ψ1 (x, y) = 2c 1− x2 y2 − . a2 b2 (4.186) ψ1 (x,y) Als nächstes führen wir die Integration ϕ%2 (x) " 2c 1 − x2 y2 − 2 dy 2 a b (4.187) ϕ1 (x) über die Variable y durch. Um dieses Integral zu berechnen, führen wir zur Abkürzung den Ausdruck A2 = 1 − x2 /a2 ein und führen die Substitution u = y/b durch. Somit ergibt sich wegen dy = bdu: % " % u x2 y2 u 2 bA2 arcsin , (4.188) 1 − 2 − 2 dy = A2 − u2 bdu = b A − u2 + a b 2 2 A 120 4 Integration &√ wobei wir das Integral A2 − u2 in der Formelsammlung nachgeschlagen haben. Einsetzen gefolgt von einigen algebraischen Umformungen ergibt ϕ%2 (x)) 1− x2 a2 − y2 dy = b2 ϕ1 (x) ) y x2 b x2 y2 by arcsin b = 1− 2 − 2 + 1− 2 a b a 2 2b 1− " x2 =b 1− 2 a q !y=b ! ! ! x2 ! 2 1− x a2 q x2 a2 y=−b 1− a2 ) x2 b x2 x2 [arcsin(1) − arcsin(−1)] . (4.189) 1− 2 − 1− 2 + 1− 2 a a a 2 =0 Durch Auswerten der Arkussinusfunktion an den Stellen −1 und +1 erhalten wir schließlich: ϕ%2 (x)) 1− x2 a2 − y2 dy = b2 x2 bπ . 1− 2 a 2 (4.190) ϕ1 (x) Um das Volumen V zu berechnen, müssen wir noch die Integration über x durchführen. Da x als einfaches Quadrat im Integranden vorkommt, verursacht dies keine Schwierigkeiten: !a %a bπ x2 x3 ! x2 = 2c 1 − 2 dx = cbπ x − 2 !! 1 − 2 dx = cbπ 2 a a 3a −a −a −a 3 2a 2a 6−2 . = cbπ 2a − 2 = cbπ 2a − = acbπ 3a 3 3 %a V (4.191) Das Volumen des Ellipsoids ist also V = 4.11.3 4 πacb. 3 (4.192) Dreifachintegrale in Zylinder- und Kugelkoordinaten In manchen Fällen kann es auch vorteilhaft sein, Volumsintegrale in Zylinderkoordinaten oder in Kugelkoordinaten zu berechnen. In Zylinderkoordinaten müssen wir beachten, dass das Volumselement wie folgt transformiert (anschaulich ergibt sich dies aus zum Doppelintegral analogen Überlegungen): dxdydz = ρdρdϕdz. Somit ist das Integral gegeben durch %%% %%% f (x, y, z)dxdydz = B f (ρ cos ϕ, ρ sin ϕ, z)ρdρdϕdz, B wobei B das in Zylinderkoordinaten ausgedrückte Integrationsgebiet ist. (4.193) (4.194) 4 Integration 121 Beispiel: Volumen eines Zylinders Wir berechnen das Volumen eines Zylinders mit Radius r und Höhe h als Integral V = das Innere des Zylinders: % r % h % 2π V = ρdϕdzdρ 0 % 0 r % = & dV über 0 h 2πρdhdρ 0 % 0 r 2πhρdρ = 2πh = 0 r2 = πr2 h. 2 (4.195) In Kugelkoordinaten ist das Volumselement: dV = dxdydz = r2 dr sin ϑdϑdϕ, was man sich geometrisch leicht klarmachen kann. Das Integral wird zu %%% %%% f (x, y, z)dxdydz = f (r sin ϑ cos ϕ, r sin ϑ cos ϕ, r cos ϑ)r2 dr sin ϑdϑdϕ, B (4.196) (4.197) B wobei B das in Kugelkoordinaten definierte Integrationsgebiet ist. Beispiel: Schwerpunkt einer Halbkugel Zu bestimmen ist der Schwerpunkt einer homogenen Halbkugel mit Radius R. Im Allgemeinen ist der Schwerpunkt eines Körpers mit homogener Dichte gegeben durch % 1 rdV. (4.198) rS = V V Wir legen die Halbkugel so in ein kartesisches Koordinatensystem, dass die Schnittfläche in der xy-Ebene liegt und sich die Halbkugel auf der Seite der positiven z-Achse befindet. Aus Symmetriegründen muss der Schwerpunkt auf der z-Achse liegen, d. h. xS = 0 und yS = 0. Zu berechnen bleibt die z-Komponente des Schwerpunktes. In Kugelkoordinaten haben wir: % 1 zdV zS = V V % % % 1 R π/2 2π = (r cos ϑ)r2 sin ϑdϕdϑdr V 0 0 0 % % 2π R π/2 3 = r cos ϑ sin ϑdϑdr V 0 0 % 2π 1 R 3 = r dr V 2 0 π R4 6π R4 3 = = = R, (4.199) V 4 4πR3 4 8 wobei wir verwendet haben, dass das Volumen der Halbkugel 4πR3 /6 ist. 4.12 Integration von vektorwertigen Funktionen Betrachten wir eine vektorwertige Funktion A(t) einer skalaren Variablen t, z.B. die Geschwindigkeit v (t) eines Teilchens. Wir können nun ein Integral über diese Funktion definieren, indem wir 122 4 Integration ein Intervall [ta , tb ] in die Teilintervalle [ti , ti+1 ] zerlegen und die Summe N i )∆ti A(t (4.200) i=1 bilden. Hier besteht A(t) aus drei Komponenten A(t) = (Ax (t), Ay (t), Az (t)). Da die Summe von Vektoren komponentenweise durchgeführt wird, haben wir (t )∆t A N x i i i )∆ti = A(t (4.201) Ay (ti )∆ti . i=1 Az (ti )∆ti Im Grenzfall einer unendlich feinen Intervallzerlegung erhalten wir das Integral & % Ax (t)dt & A(t)dt = Ay (t)dt . & Az (t)dt (4.202) Das heißt, das Integral über eine vektorwertige Funktion einer skalaren Variablen ist ein Vektor, dessen Komponenten die Integrale der Komponentenfunktionen Ax (t), Ay (t) und Az (t) sind. Beispiel: Das Integral der vektorwertigen Funktion t + t2 = A(t) e−6t 1 (4.203) sei über das Intervall [0, 1] zu berechnen. Wir führen die Integration über t komponentenweise durch: &1 2 !1 2 t t3 ! (t + t )dt + 5 2 0 3 !0 % 1 &1 6 ! = 1 −6 A(t)dt = (4.204) 1 −6t !1 e−6t dt = 6 (1 − e ) . − e 0 6 0 0 1 &1 1 t|0 1 dt 0 Beispiel: Ein zum Zeitpunkt t = 0 ruhendes Objekt erfährt eine zeitlich veränderliche Beschleunigung a(t). Die Geschwindigkeit zum Zeitpunkt t ist dann gegeben durch: % t v (t) = a(s)ds (4.205) 0 Teil II Einführung in die Physikalischen Rechenmethoden II 123 Kapitel 5 Die Taylorreihe In der Physik ist es oft zweckmäßig, Funktionen als so genannte Potenzreihen auszudrücken, zum Beispiel: sin x = x − x5 x7 x3 + − − ··· 3! 5! 7! (5.1) In den folgenden Abschnitten werden wir lernen, wie man dies auf eine systematische Weise tun kann. 5.1 Folgen und Reihen Um den Begriff der Reihe einzuführen, müssen wir uns zunächst mit Folgen auseinander setzen. Eine Folge ist eine Funktion, die als Definitionsbereich die natürlichen Zahlen besitzt. Diese Funktion ordnet jeder natürlichen Zahl n (dem Index) einen Funktionswert an zu. Die einzelnen Funktionswerte an werden die Glieder der Folge genannt. Für die Gesamtheit der Folgenglieder a1 , a2 , a3 , · · · schreiben wir oft auch {an } und verwenden den Begriff Folge auch, um diese Menge zu bezeichnen. Beispiel: Die Folge an = 1/n hat die Glieder a1 = 1, a2 = 1/2, a3 = 1/3 und so weiter. Die Folge an = (−1)n n besteht aus den Zahlen a1 = −1, a2 = 2, a3 = −3, a4 = 4, usw. Wenn wir bei der Zahlenfolge an = 1/n die Zahl n unbegrenzt wachsen lassen, strebt 1/n gegen Null. Man nennt dies den Grenzwert der Folge an = 1/n für n → ∞. Im Allgemeinen strebt die Zahlenfolge an gegen einen Grenzwert a, wenn für jede positive (und beliebig kleine) Zahl ε eine Zahl nε existiert, sodass |an − a| < ε für n > nε . Das heißt, dass sich die Folge an beliebig genau der Zahl a nähert, wenn wir n gegen unendlich gehen lassen. Wir schreiben dafür a = lim an . n→∞ (5.2) Man sagt auch: die Zahlenfolge an konvergiert gegen a. Eine Zahlenfolge, die keinen Grenzwert besitzt, heißt divergent. Zum Beispiel konvergiert die Zahlenfolge an = 1 + 1/n gegen 1: limn→∞ (1 + 1/n) = 1. Die Zahlenfolge an = n2 wächst mit zunehmendem n unbegrenzt. Diese Folge ist divergent. Reihen können als spezielle Folgen aufgefasst werden. Für eine gegebene Zahlenfolge {an } defi125 126 5 Die Taylorreihe nieren wir die m-te Partialsumme als a1 + a2 + a3 + · · · + am = m a i = sm . (5.3) i=1 Die Folge {sm } der Partialsummen bezeichnet man als Reihe. Falls der Grenzwert S = lim sm = lim m→∞ m→∞ m ai (5.4) i=1 der Folge der Partialsummen existiert, sagt man die Reihe konvergiert. Man nennt S dann die Summe der Reihe oder auch den Wert der Reihe. Beispiel: Gegeben sei die Zahlenfolge 1 1 1 1 1, , , , · · · , , · · · . 2 3 4 n (5.5) Die Partialsummen dieser Folge sind: s1 = s2 = s3 = s4 = ··· sn 1, (5.6) 1 1+ , 2 1 1+ + 2 1 1+ + 2 (5.7) 1 , 3 1 1 + , 3 4 1 1 1 1 = 1 + + + + ···+ , 2 3 4 n ··· (5.8) (5.9) (5.10) Beispiel: Die geometrische Reihe Bei der geometrischen Reihe ergibt sich jeder Summand aus dem vorhergehenden durch Multiplikation mit einem (reellen) Faktor q: a + aq + aq 2 + · · · + aq n + · · · (5.11) Wir wollen zunächst die m-te Partialsumme sm = m aq i (5.12) i=0 der ersten m + 1 Glieder berechnen (wir zählen hier zur Abwechslung von 0 weg). Dazu multiplizieren wir die Reihe mit q und subtrahieren dann davon die ursprüngliche Reihe: sm q = −sm = sm (q − 1) = aq + aq 2 + aq 3 + · · · + aq m + aq m+1 (5.13) −a − aq − aq 2 − aq 3 − · · · − aq m (5.14) −a + 0 + 0 + 0 + · · · + 0 + aq m+1 . (5.15) Daraus folgt sm = a(q m+1 − 1) . q−1 (5.16) 5 Die Taylorreihe 127 Wir können nun auch den Wert der geometrischen Reihe für unendlich viele Summenglieder betrachten: s = lim a m→∞ q m+1 − 1 . q−1 (5.17) Falls |q| > 1, wächst q m+1 über alle Grenzen und damit auch s. Die Reihe konvergiert in diesem Fall also nicht. Falls aber |q| < 1, verschwindet q m+1 im Limes m → ∞ und wir erhalten s=a a 0−1 = . q−1 1−q (5.18) Für |q| < 1 ist die geometrische Reihe also konvergent. Zum Beispiel gilt: 1+ 5.2 1 1 1 1 + + + ··· = 2 4 8 1− 1 2 = 2. (5.19) Entwicklung einer Funktion in eine Taylorreihe Wir haben gerade gesehen, dass für −1 < x < 1 gilt 1 + x + x2 + x3 + · · · = 1 . 1−x (5.20) (Wir haben in der Summenformel für die geometrische Reihe einfach q in x umbenannt.) Wir betrachten nun beide Seiten dieser Gleichung als Funktion von x und erkennen, dass man die 1 im Bereich −1 < x < 1 als eine unendliche Summe von Potenzen von x schreiben Funktion 1−x kann. Die Reihe 1 + x + x2 + x3 + . . . ist ein Beispiel für eine Potenzreihe. Im Allgemeinen hat eine unendliche Potenzreihe die Form a0 + a1 x + a2 x2 + a3 x3 + · · · = ∞ an xn . (5.21) n=0 1 Es stellt sich natürlich sofort die Frage, ob neben 1−x auch andere Funktionen als unendliche Potenzreihe dargestellt werden können und, wenn ja, wie die zugehörigen Koeffizienten ai auf systematische Art und Weise ermittelt werden können. Die Antwort auf diese Frage liegt im Begriff der Taylorreihe, die wir in diesem Abschnitt besprechen wollen. Wir machen zunächst die Annahme, dass eine bestimmte Funktion f (x) als Potenzreihe mit reellem Koeffizienten an dargestellt werden kann f (x) = ∞ an xn = a0 + a1 x + a2 x2 + a3 x3 + · · · . (5.22) n=0 Eine solche Darstellung nennen wir auch die Potenzreihenentwicklung von f (x) und sagen, dass die Funktion f (x) in eine Potenzreihe entwickelt wurde. Wir müssen nun für die Funktion f (x) die passenden Koeffizienten ermitteln. Dies können wir tun, indem wir verlangen, dass die Funktion f (x) und alle ihre Ableitungen mit der Reihe beziehungsweise mit allen ihren Ableitungen übereinstimmen. Wenn die Darstellung aus Gleichung (5.22) möglich ist, muss das an jeder Stelle x gelten und somit auch für x = 0. Für die Funktion selbst folgt daraus f (0) = a0 + a1 0 + a2 0 + · · · = a0 , (5.23) weil alle Terme, die ein x enthalten, wegen x = 0 verschwinden. Ableiten beider Seiten von Gleichung (5.22) nach x liefert f (x) = a1 + 2a2 x + 3a3 x2 + 4a4 x3 + · · · , (5.24) 128 5 Die Taylorreihe wobei wir die Reihe auf der rechten Seite Glied für Glied differenziert haben. An der Stelle x = 0 gilt infolgedessen: f (0) = a1 , (5.25) da wieder alle Terme, die ein x enthalten, verschwinden. Durch nochmaliges Ableiten erhalten wir f (x) = 2a2 + 2 · 3a3 x + 3 · 4a4 x2 · · · (5.26) und somit f (0) = 2a2 oder a2 = f (0) . 2 (5.27) Ganz analog finden wir durch weiteres Differenzieren und Auswertung bei x = 0: f (0) = a3 , 2·3 f (0) = a4 , 4·3·2 usw. (5.28) Für den Koeffizienten an erhalten wir aus der Forderung nach Übereinstimmung der n-ten Ableitung von Funktion und Reihe: f (n) (0) = n · (n − 1)(n − 2) · · · 2 · 1 · an (5.29) oder an = f (n) (0) . n! (5.30) Wir einigen uns darauf, dass 0! = 1 sein soll. Falls die Funktion f (x) also als Potenzreihe dargestellt werden kann und die Funktion f (x) beliebig oft differenzierbar ist, finden wir durch Einsetzen der Koeffizienten f (x) = f (0) + ∞ f (0) f (x) 2 f (0) 3 f (n) (0) n x+ x + x + ··· = x . 1! 2! 3! n! n=0 (5.31) Diese Potenzreihe ist die so genannte Taylorreihe (oft wird diese Reihe auch MacLaurin-Reihe genannt). Beispiel: Wir wollen die Exponentialfunktion ex in eine Taylorreihe entwickeln. Dazu ermitteln wir zunächst die Ableitungen: f (x) = ex , f (x) = ex , (5.32) (5.33) f (x) = ex , f (x) = ex , .. . (5.34) (5.35) f (n) (x) = ex , .. . (5.36) An der Stelle x = 0 sind also alle Ableitungen gleich: f (n) (x = 0) = 1. (5.37) Somit ist die Taylorentwicklung von ex gegeben durch: ex = 1 + ∞ x2 x3 xn x + + + ··· = . 1! 2! 3! n! n=0 (5.38) 5 Die Taylorreihe 129 Da die Fakultät n! für jede Zahl x mit n schneller wächst als xn , werden die Reihenglieder immer kleiner und die Reihe konvergiert. Für x = 1 haben wir zum Beispiel e=1+1+ 1 1 1 + + + · · · = 2, 71828 . . . 2 6 24 (5.39) Beispiel: Zur Taylorreihenentwicklung der Funktion sin(x) bestimmen wir zunächst die Ableitungen: f (x) = sin x, (5.40) f (x) = cos x, f (x) = − sin x, (5.41) (5.42) f (x) = − cos x, (5.43) f (x) = sin x, .. . (5.44) An der Stelle x = 0 haben wir also f (0) = 0; f (0) = 1; f (0) = 0; f (0) = −1, usw. (5.45) Damit wird die Reihe zu sin x = x − ∞ x5 x7 x3 x2n+1 + − + ··· = . (−1)n 3 5! 7! (2n + 1)! n=0 (5.46) Beispiel: 1 Wir wollen nun die Funktion 1−x taylorentwickeln (obwohl wir die zugehörige Potenzreihe ja bereits kennen) und bestimmen zunächst die Ableitungen f (x) = (1 − x)−1 , f (x) = (−1)(1 − x)−2 (−1) = (1 − x)−2 , (5.47) (5.48) f (x) = (−2)(1 − x)−3 (−1) = 2(1 − x)−3 , 2·3 , f (x) = 2(−3)(1 − x)−4 (−1) = (1 − x)4 2·3·4 4! = , f (x) = 5 (1 − x) (1 − x)5 .. . n! (n) . f (x) = (1 − x)n+1 (5.49) (5.50) (5.51) (5.52) An der Stelle x = 0 haben wir also f (0) = 1; f (0) = 1; f (0) = 2; f (0) = 3!; ... f n (0) = n! (5.53) Einsetzen ergibt dann wie erwartet ∞ 1 = 1 + x + x2 + · · · = xn . 1−x n=0 (5.54) 130 5.3 5 Die Taylorreihe Allgemeine Taylorentwicklung Bisher haben wir eine Funktion f (x) an der Stelle x = 0 in eine Potenzreihe entwickelt, das heißt, wir haben die Ableitungen der Funktion an der Stelle x = 0 verwendet, um den Wert der Funktion an einer anderen Stelle zu ermitteln. Oft ist es jedoch zweckmäßig, eine Funktion an einer von 0 verschiedenen Stelle x0 zu entwickeln. Eine solche Entwicklung hat die Gestalt: f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . . (5.55) Um die Werte der Koeffizienten a0 , a1 , a2 , . . . , usw. zu bestimmen, könnten wir jetzt genauso vorgehen wie bei der Taylorentwicklung an der Stelle x = 0. Einfacher ist es jedoch, eine Variablentransformation durchzuführen. Wir definieren die Hilfsvariable u als u = x − x0 . (5.56) Diese Variable hat an der Stelle x = x0 den Wert 0. Wir drücken jetzt die Variable x aus als x = u + x0 und betrachten die Funktion f (x) als eine Funktion der Hilfsvariablen u: f (x) = f (u + x0 ). (5.57) Diese Funktion entwickeln wir in der Variablen u an der Stelle u = 0 in eine Taylorreihe. Dazu benötigen wir die Ableitung von f (u + x0 ) nach u. Da dx/du = 1, ergibt die Anwendung der Kettenregel für die erste Ableitung df dx df df = = . du dx du dx (5.58) Durch wiederholte Anwendung der Kettenregel erhalten wir ebenso für die n-te Ableitung dn f dn f = n. n du dx (5.59) Infolgedessen ist die Taylorentwicklung von f (u + x0 ) an der Stelle u = 0 gegeben durch: f (u + x0 ) = f (0 + x0 ) + f (0 + x0 )u + f (0 + x0 ) ∞ f (n) (0 + x0 )un u2 + ··· = . 2 n! n=0 (5.60) Wir transformieren wieder zurück zu x, indem wir u durch x − x0 ersetzen und erhalten f (x) = f (x0 ) + f (x0 )(x − x0 ) + ∞ f (n) (x0 ) f (x0 ) (x − x0 )2 + · · · = (x − x0 )n . 2! n! n=0 Die Kenntnis der Funktion und aller ihrer Ableitungen an der Stelle x0 versetzt uns also in die Lage, den Wert der Funktion an einer anderen Stelle x zu bestimmen. Geometrisch entspricht das Einführen der Hilfsvariablen u = x − x0 einer Transformation (Verschiebung) in ein neues Koordinatensystem mit Ursprung in x0 (siehe Abb. 5.1). Beispiel: Entwicklung der Funktion ex an der Stelle x = 2 ergibt ex = e2 ex−2 = e2 + e2 (x − 2) + 5.4 ∞ (x − 2)n e2 (x − 2)2 + · · · = e2 . 2! n! n=0 (5.61) Abgebrochene Taylorreihenentwicklung Der große Nutzen der Taylorreihenentwicklung besteht darin, dass komplizierte Funktionen wie sin(x) oder exp(x) in eine Summe von einfachen Potenzen verwandelt werden können. Erst eine solche Reihenentwicklung erlaubt es uns, numerische Werte für diese Funktion zu bestimmen. 5 Die Taylorreihe 131 Abbildung 5.1: Die Taylorentwicklung einer Funktion an der Stelle x0 entspricht der Taylorentwicklung der um x0 verschobenen Funktion an der Stelle 0. (Wenn wir zum Beispiel mit unserem Taschenrechner den Sinus eines bestimmten Winkels berechnen, wird dies mittels einer Reihenentwicklung erledigt.) Allerdings können wir nicht unendlich viele Glieder einer Taylorreihe auswerten. Das müssen wir aber auch nicht. Bei einer konvergenten Potenzreihe werden die Beiträge der Reihenglieder mit höheren Potenzen von x zunehmend kleiner und die Reihe kann nach endlich vielen Gliedern abgebrochen werden. Dabei nimmt man natürlich einen Fehler in Kauf, der umso kleiner ist, je später die Reihe abgebrochen wird. Wir gehen von der Potenzreihe f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . . (5.62) aus und brechen sie nach dem Glied mit der n-ten Potenz ab. Wir teilen die Reihenentwicklung also in zwei Teile ein: in ein Näherungspolynom n-ten Grades, pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n (5.63) und einen Rest Rn (x) = an+1 (x − x0 )n+1 + · · · = ∞ ai (x − x0 )i . (5.64) i=n+1 Das Näherungspolynom pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n ist eine Näherung n-ter Ordnung der Funktion f (x). Der Rest Rn (x) ist der Fehler, den wir machen, wenn wir die Reihe nach dem Glied n-ter Ordnung abbrechen und die Funktion durch das Näherungspolynom ersetzen. Je mehr Glieder die Entwicklung enthält, umso kleiner wird dieser Fehler. Die Größe des Fehlers hängt natürlich auch vom Ort x ab. Je näher wir der Entwicklungsstelle x0 sind, umso kleiner ist (x − x0 ) und umso schneller konvergiert deshalb die Reihe. Betrachten wir als Beispiel die Taylorentwicklung der Funktion sin x an der Stelle x0 = 0 (siehe Abb. 5.2): x5 x7 x3 + − + ... (5.65) 3! 5! 7! Wenn wir diese Entwicklung nach dem ersten Glied abbrechen, approximieren wir den Sinus durch sin x = x − sin x ≈ x, (5.66) 132 5 Die Taylorreihe Abbildung 5.2: Taylorentwicklung der Funktion sin(x) abgebrochen nach dem Term 1. Ordnung, dem Term 3. Ordnung und dem Term 5. Ordnung. also durch eine Gerade mit Steigung 1, die durch den Ursprung geht. An der Stelle x = 0 stimmt unsere lineare Näherung also mit dem Sinus überein und hat an dieser Stelle auch dieselbe Steigung. Für größere x-Werte weicht unsere Näherung jedoch zunehmend von der Funktion sin x ab. Wenn wir den nächsten nichtverschwindenden Term der Entwicklung mitnehmen, also sin x durch sin x ≈ x − x3 3! (5.67) approximieren, dehnen wir den Bereich, in dem die Funktion und ihre Näherung (Approximation) gut übereinstimmen, etwas aus. Noch etwas größer wird dieser Bereich, wenn wir erst nach dem Term 5. Ordnung abbrechen: sin x ≈ x − x5 x3 + . 3! 5! (5.68) Zusätzliche Glieder dehnen den Übereinstimmungsbereich weiter aus. Mit Hilfe der Taylorentwicklung können wir nun auch verstehen, warum Schwingungsvorgänge mit kleiner Amplitude immer auf die Bewegungsgleichung des harmonischen Oszillators führen (siehe Abb. 5.3). Stellen wir uns dazu ein mechanisches System vor, das sich in seiner stabilen Ruhelage befindet. Der Einfachheit halber beschränken wir uns hier auf ein eindimensionales System. Eine analoge Behandlung ist aber auch in höherdimensionalen Systemen möglich. Das heißt, dass keine Kräfte auf das System wirken und es sich infolgedessen in einem Minimum seiner potentiellen Energie aufhalten muss. Wir entwickeln nun die potentielle Energie V (x) an der Stelle des Minimums x0 in eine Taylorreihe V (x) = V (x0 ) + V (x0 )(x − x0 ) + V (x0 ) (x − x0 )2 (x − x0 )3 + V (x0 ) + ··· 2! 3! (5.69) Da nach Voraussetzung die potentielle Energie an der Stelle x0 ein Minimum besitzt, verschwindet die erste Ableitung an dieser Stelle. Infolgedessen ist das quadratische Glied der erste Term in der Entwicklung, der von x abhängt. Für kleine Auslenkungen (x − x0 ) können wir die Taylorreihe 5 Die Taylorreihe 133 Abbildung 5.3: In der Nähe des Potentialenergieminimums lässt sich die potentielle Energie als quadratische Funktion der Koordinaten betrachten. nach dem quadratischen Term abbrechen, (x − x0 )2 . 2! Damit nähern wir das Potential V (x) also durch eine Parabel an. V (x) ≈ V (x0 ) + V (x0 ) (5.70) Die Kraft F , die auf das System wirkt, ergibt sich aus der Ableitung der potentiellen Energie: dV V (x0 ) =− 2(x − x0 ) = −V (x0 )(x − x0 ). dx 2 Die Newtonsche Bewegungsgleichung für unser System ist also F (x) = − (5.71) d2 x = F (x) = −k(x − x0 ), (5.72) dt2 wobei wir die Krümmung des Potentials an der Stelle x0 mit k bezeichnet haben, k = V (x0 ). m Wir definieren jetzt die Auslenkung aus der Ruhelage als u = x − x0 . Wegen du dt = schreiben als: d(x−x0 ) dt = dx dt gilt auch 2 d u dt2 m = 2 d x dt2 (5.73) und wir können die Bewegungsgleichung (5.72) d2 u = −ku. dt2 (5.74) Das ist genau die Bewegungsgleichung des harmonischen Oszillators (siehe Kapitel 10), bei dem die Rückstellkraft proportional zur Auslenkung ist. Die Proportionalitätskonstante ist die Krümmung des Potentials im Minimum. Für größere Auslenkungen aus der Ruhelage kann die Näherung des Potentials als Parabel jedoch zusammenbrechen. Ist dies der Fall, kann das System nicht mehr als harmonischer Oszillator beschrieben werden. 5.5 Fehlerabschätzung Wenn man eine Taylorreihe abbricht, ist damit immer ein gewisser Fehler verbunden. Der Mathematiker Joseph-Louis Lagrange hat bewiesen, dass der Rest Rn der Potenzreihe, also der Fehler, 134 5 Die Taylorreihe ausgedrückt werden kann als Rn (x) = f (n+1) (ξ) (x − x0 )n+1 . (n + 1)! (5.75) Dies ist das Lagrangesche Restglied. Hier ist ξ eine Zahl, die zwischen x0 (die Stelle, an der entwickelt wird) und x liegt. Die Zahl ξ ist jedoch nicht genauer bestimmt: wir wissen nur, dass im Intervall zwischen x0 und x eine Zahl ξ existiert, sodass Gleichung (5.75) gilt. Um den Fehler abzuschätzen, können wir nun ξ von x0 bis x variieren. An irgendeiner Stelle ξ0 wird das Restglied Rn (x) maximal sein. Wir wissen dann, dass der tatsächliche Fehler, der durch das Abbrechen der Taylorreihe entsteht, nicht größer sein kann als dieser maximale Wert. Die Formel (5.75) für das Lagrangesche Restglied kann auf folgende Weise hergeleitet werden. Der Wert einer differenzierbaren Funktion f (x) an der Stelle x kann ausgedrückt werden als: % x f (x) = f (x0 ) + f (t)dt. (5.76) x0 Durch partielle Integration erhalten wir % % x x f (t)dt = f (x)(t − x)|x0 − x f (t)(t − x)dt x0 % x f (t)(x − t)dt. = f (x)(x − x) − f (x0 )(x0 − x) + x0 (5.77) x0 & & Hier haben wir die partielle Integrationsregel uv dx = uv − u v dx mit u = f und u = f sowie v = 1 und v = t − x verwendet. Einsetzen in den Ausdruck (5.76) ergibt: % x f (x) = f (x0 ) + f (x0 )(x − x0 ) + f (t)(x − t)dt. (5.78) x0 Nochmalige partielle Integration, diesmal mit u = f v = −(t − x)2 /2, liefert: f (x) = f (x0 ) + f (x0 )(x − x0 ) + f (x0 ) und u = f sowie v = (x − t) und (x − x0 )2 + 2 % x x0 f (t) (x − t)2 dt. 2 (5.79) Nach n-maliger partieller Integration erhalten wir f (x) = (x − x0 )2 + ··· f (x0 ) + f (x0 )(x − x0 ) + f (x0 ) 2 % x (x − x0 )n (x − t)n +f (n) (x0 ) + dt. f (n+1) (t) n! n! x0 (5.80) Dies ist einfach die Taylorentwicklung von f (x) um die Stelle x0 nun aber mit einem expliziten Ausdruck für das Restglied: % x (x − t)n dt. (5.81) f (n+1) (t) Rn (x) = n! x0 Diese Formel für das Restglied war schon Brook Taylor (1685-1731) selbst bekannt. Lagrange hat gezeigt, wie das Restglied Rn auf einfache Weise abgeschätzt werden kann. Wir bezeichnen die Stelle, an der die (n + 1)-te Ableitung f (n+1) (x) im Intervall [x0 , x] ein Minimum einnimmt, mit x1 und die Stelle des Maximums mit x2 . Dann gilt % x % x (x − t)n (x − t)n (n+1) (n+1) dt ≥ f dt (5.82) f (t) (x1 ) n! n! x0 x0 5 Die Taylorreihe 135 und % x f (n+1) x0 (x − t)n (t) dt ≤ f (n+1) (x2 ) n! % x x0 (x − t)n dt. n! Wir können daher das Restglied folgendermaßen beschränken: % x % x (x − t)n (x − t)n dt ≤ Rn (x) ≤ f (n+1) (x2 ) dt. f (n+1) (x1 ) n! n! x0 x0 Das Integral &x x0 (x−t)n n! (5.83) (5.84) dt kann ausgeführt werden, % x x0 (x − x0 )n+1 (x − t)n dt = , n! (n + 1)! (5.85) und wir erhalten: f (n+1) (x1 ) (x − x0 )n+1 (x − x0 )n+1 ≤ Rn (x) ≤ f (n+1) (x2 ) . (n + 1)! (n + 1)! (5.86) Da f (n+1) (x) eine stetige Funktion ist, muss es zwischen x1 und x2 ein ξ geben, sodass Rn (x) = f (n+1) (ξ) (x − x0 )n+1 . (n + 1)! (5.87) Das ist das Lagrangesche Restglied. Natürlich ist im allgemeinen Fall der Wert von ξ unbekannt, aber wir können, wie weiter oben bereits besprochen, nach jenem Wert ξ im Intervall [x, x0 ]suchen, für welchen der Betrag des Restgliedes maximal wird, und daraus eine obere Schranke für den Fehler gewinnen. Beispiel: Wir entwickeln die Funktion exp(x) an der Stelle x = 0 in eine Taylorreihe und brechen diese nach dem Term 3. Ordnung ab: exp(x) = 1 + x + x3 x2 + + R3 (x). 2! 3! (5.88) Wie groß ist der Fehler, den wir bei x = 0.5 damit machen? Das Restglied nach Lagrange ist: R3 (x) = f (4) (ξ) 4 x . 4! (5.89) Die vierte Ableitung von ex ist ex . Das ist eine monoton steigende Funktion, die im Intervall [0, 0.5] ihren größten Wert bei ξ = 0.5 hat. Infolgedessen gilt für den Fehler R3 (x) ≤ e0.5 4 x ≈ 0.07x4 . 4! (5.90) Der Fehler, der durch Abbrechen nach dem Term 3. Ordnung entsteht, ist also kleiner als 0.07x4 . Beispiel: Als weiteres Beispiel für die Anwendung der Taylorreihe betrachten wir noch folgendes Problem: Zwischen den Orten A und B existiert eine gerade Straßenverbindung der Länge s. Man kann jedoch auch über C von A nach B gelangen. Punkt C bildet mit den Punkten A und B ein gleichseitiges Dreieck der Höhe h (siehe Abb. 5.4). Wie lang ist der Weg über C verglichen mit der direkten Verbindung von A nach B? 136 5 Die Taylorreihe Abbildung 5.4: Man kann direkt von A nach B gelangen oder über C. Der Umweg U (also die Differenz der beiden Wege) ist eine Funktion von h: ) " 2 s 2 2h s U =2 = s 1 + + h2 − − 1 . 2 2 s (5.91) Für ein kleines Verhältnis h/s können wir diesen Ausdruck durch Taylorreihenentwicklung der √ Wurzel sehr vereinfachen. Wir führen die√Variable x = (2h/s)2 ein und entwickeln 1 + x nach x. Dazu brauchen wir die Ableitungen von 1 + x: √ 1 (5.92) y = 1 + x = (1 + x) 2 , 1 1 (5.93) y = (1 + x)− 2 , 2 1 1 1 3 3 y = · − (5.94) (1 + x)− 2 = − (1 + x)− 2 , 2 2 4 5 5 3 1 3 y = − · − (5.95) (1 + x)− 2 = (1 + x)− 2 . 4 2 8 An der Stelle x = 0 sind die Funktion und ihre Ableitungen: y = 1, y = 1 , 2 1 y = − , 4 y = 3 . 8 (5.96) Die Taylorreihe ist also gegeben durch: √ 1 1 x3 ... 1 + x = 1 + x − x2 + 2 8 16 (5.97) Wir brechen nun nach dem linearen Term ab und erhalten als Näherung √ 1 1+x≈1+ x 2 (5.98) und somit ) 1+ 2h s 2 1 ≈1+ 2 2h s 2 2 h =1+2 . s (5.99) Der Umweg U wird infolgedessen zu 2 2h2 h . −1 = U ≈s 1+2 s s (5.100) Dieser Ausdruck gilt für h s und ist viel einfacher als der ursprüngliche Ausdruck. Wir sehen daraus gleich, dass für kleine h der Umweg U nur sehr langsam (quadratisch) wächst. Für s = 100 km und h = 5 km ergibt sich beispielsweise nur ein Umweg von 0.5 km (für s = 100 km und h = 1 km ist der Umweg U gar nur 0.02 km= 20 m lang). Kapitel 6 Komplexe Zahlen Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die Quadratwurzel einer negativen Zahl ziehen. Für die quadratische Gleichung mit reellen Koeffizienten beispielsweise ax2 + bx + c = 0, (6.1) existieren die reellen Lösungen √ b2 − 4ac (6.2) x1,2 = 2a nur dann, wenn das Argument der Wurzel nicht negativ ist, das heißt wenn gilt b2 ≥ 4ac. Wir können den Zahlenraum jedoch so erweitern, dass algebraische Gleichungen wie die quadratische Gleichung (6.1) immer eine Lösung haben. Diesen erweiterten Raum nennen wir die komplexen Zahlen und werden sehen, dass dieser Übergang von den reellen zu den komplexen Zahlen dem Übergang von der Zahlengerade R zu der Zahlenebene R2 = R × R entspricht. Für komplexe Zahlen lassen sich Rechenoperationen so definieren, dass alle für die Operationen mit reellen Zahlen geltenden Gesetze in Kraft bleiben. Die reellen Zahlen sind dann als Spezialfall in den komplexen Zahlen enthalten. Komplexe Zahlen spielen in der gesamten Physik eine äußerst wichtige Rolle und wir werden uns im Folgenden mit der Definition und den Rechenregeln für komplexe Zahlen beschäftigen. −b ± 6.1 Definition und Darstellung Zur Erweiterung der reellen Zahlen führen wir imaginäre Zahlen ein. Dazu definieren wir die imaginäre Einheit als die Zahl i, deren Quadrat -1 ergibt: √ i2 = −1 (oder, mathematisch etwas salopp ausgedrückt, i = −1). (6.3) (Die Wurzel aus einer negativen Zahl können wir eigentlich nicht ziehen. Wir tun jetzt aber “so als ob” und wir werden sehen, dass wir damit sehr weit kommen.) Wir können jetzt formal die Wurzel aus einer negativen Zahl ziehen, z.B. √ √ √ √ −5 = 5 · (−1) = 5 · −1 = 5i. (6.4) Die Wurzel aus einer negativen reellen Zahl ist eine imaginäre Zahl. Eine imaginäre Zahl setzt sich aus der imaginären Einheit i und einer reellen Zahl y zusammen: yi. (6.5) Wie die reellen Zahlen lassen sich auch die imaginären Zahlen auf einem Zahlenstrahl darstellen (siehe Abb. 6.1). 137 138 6 Komplexe Zahlen Abbildung 6.1: Zahlenstrahl für die imaginären Zahlen. Höhere Potenzen der imaginären Einheit ergeben imaginäre oder reelle Zahlen: i2 3 i i4 i5 = −1, (6.6) = = 2 i i = −1i = −i, i2 i2 = −1 · −1 = 1, (6.7) (6.8) = i4 · i = i, usw. (6.9) Die Zusammensetzung einer reellen Zahl x und einer imaginären Zahl iy (y reell) nennt man eine komplexe Zahl: z = x + iy. (6.10) Solche komplexen Zahlen ergeben sich bei der Lösung quadratischer Gleichungen. Zum Beispiel hat die Gleichung x2 − 4x + 29 = 0 (6.11) die komplexen Lösungen x1,2 = +4 ± √ √ √ 16 − 4 · 29 = 2 ± −25 = 2 ± 5 −1 = 2 ± 5i. 2 (6.12) Die Darstellungsform z = x + iy bezeichnet man auch als Normalform oder kartesische Darstellung einer komplexen Zahl. In dieser Darstellungsform nennt man x = (z) den Realteil der komplexen Zahl z und y = (z) den Imaginärteil. Gebräuchlich ist auch die Notation x = Re(z) und y = Im(z). Sowohl der Realteil als auch der Imaginärteil einer komplexen Zahl sind reelle Zahlen (obwohl die Bezeichnung Imaginärteil das Gegenteil suggeriert). Abbildung 6.2: Graphische Darstellung einer komplexen Zahl in der Gaußschen Zahlenebene. Graphisch kann man komplexe Zahlen in der Gaußschen Zahlenebene darstellen (siehe Abb. 6.2). Dabei wird der Realteil (z) der komplexen Zahl z = x + iy auf der x-Achse aufgetragen 6 Komplexe Zahlen 139 und der Imaginärteil (z) auf der y-Achse (genauso wie wir es für die Komponenten eines Vektors r = (x, y) getan haben). Im Fall der komplexen Zahlen bezeichnen wir die x-Achse als die reelle Achse und die y-Achse als die imaginäre Achse. Eine komplexe Zahl z entspricht also einem Punkt P (x, y) und somit einem Ortsvektor r = (x, y) in der Gaußschen Zahlenebene. Alternativ zur kartesischen Darstellung kann man für komplexe Zahlen auch die so genannte trigonometrische Darstellung verwenden. In dieser Darstellung beschreiben wir die komplexe Zahl z = x + iy durch den Winkel ϕ zwischen der reellen Achse und dem Ortsvektor r und dem Abstand des Punktes P (x, y) vom Ursprung der Gaußschen Zahlenebene. Dies entspricht der Darstellung des Punktes P (x, y) in Polarkoordinaten. Der Abstand von P (x, y) vom Ursprung, oder Betrag |z| der komplexen Zahl, ergibt sich durch Anwendung des Satzes von Pythagoras: (6.13) |z| = x2 + y 2 = 2 (z) + 2 (z). Für den Winkel ϕ, auch Phasenwinkel oder Argument genannt, gilt: ϕ = arctan (z) y = arctan . x (z) (6.14) Umgekehrt lauten die Transformationsgleichungen von der trigonometrischen zur kartesischen Darstellung: (z) = x = |z| cos ϕ, (z) = y = |z| sin ϕ. (6.15) (6.16) Somit kann die komplexe Zahl z auch geschrieben werden als: z = |z| cos ϕ + i|z| sin ϕ oder z = |z|(cos ϕ + i sin ϕ). 6.2 (6.17) Rechenregeln für komplexe Zahlen Die komplexen Zahlen enthalten die reellen Zahlen als einen Spezialfall. Setzen wir nämlich in der komplexen Zahl z = x + iy den Imaginärteil y gleich 0, erhalten wir die reelle Zahl x und wir beschränken uns dadurch auf die reelle Achse der Gaußschen Zahlenebene. Die Rechenregeln für komplexe Zahlen sollten also so definiert sein, dass sie für diesen Spezialfall in die üblichen Rechenregeln für die reellen Zahlen übergehen. Wie wir im Folgenden sehen werden, lässt sich dies erreichen, indem man einfach die üblichen algebraischen Rechenregeln anwendet und dabei beachtet, dass i2 = −1. Zunächst definieren wir zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 als gleich, wenn sie sowohl in ihrem Realteil als auch in ihrem Imaginärteil übereinstimmen. Das heißt: z1 = z2 ⇔ (z1 ) = (z2 ) und (z1 ) = (z2 ). (6.18) Eine komplexe Zahl z = x + iy ist Null, wenn sowohl ihr Realteil als auch ihr Imaginärteil verschwinden: z=0 6.2.1 ⇔ (z) = 0 und (z) = 0. (6.19) Addition und Subtraktion Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden addiert bzw. subtrahiert, indem man ihre reellen und imaginären Anteile jeweils getrennt voneinander addiert bzw. subtrahiert: z1 + z2 = (x1 + x2 ) + i(y1 + y2 ), (6.20) z1 − z2 = (x1 − x2 ) + i(y1 − y2 ). (6.21) 140 6 Komplexe Zahlen Abbildung 6.3: Addition der komplexen Zahlen z1 und z2 . Abbildung 6.4: Subtraktion der komplexen Zahl z2 von der komplexen Zahl z1 . Dies entspricht der komponentenweisen Addition bzw. Subtraktion der zugehörigen Vektoren in der Gaußschen Zahlenebene. Wie aus Abb. 6.3 ersichtlich ist, können wir graphisch die Addition und Subtraktion von komplexen Zahlen durch passendes Aneinanderhängen der zugehörigen Vektoren durchführen. Addition und Subtraktion von komplexen Zahlen funktionieren analog zur Addition und Subtraktion der zugehörigen zweidimensionalen Vektoren. Beispiel: (4 + 3i) + (6 − 2i) = (4 + 6) + (3 + (−2))i = 10 + i, (6.22) (4 + 3i) − (6 − 2i) = (4 − 6) + (3 − (−2))i = −2 + 5i. (6.23) Die Addition von komplexen Zahlen ist assoziativ, z1 + (z2 + z3 ) = (z1 + z2 ) + z3 = z1 + z2 + z3 , (6.24) z1 + z2 = z2 + z1 . (6.25) und kommutativ, Weiters existiert das neutrale Element 0, sodass z+0=z (0 = 0 + i0), (6.26) und das inverse Element zinv , sodass z + zinv = 0. (6.27) Für die komplexe Zahl z = x + iy ist die inverse komplexe Zahl zinv = −z = −x − iy. Die Subtraktion z = z1 − z2 kann also aufgefasst werden als die Addition von z1 mit dem inversen Element der Zahl z2 , z = z1 + (−z2 ). 6.2.2 Multiplikation einer komplexen Zahl mit einer reellen Zahl Die Multiplikation einer komplexen Zahl z mit einer reellen Zahl a kann als eine wiederholte Addition aufgefasst werden: az = a(x + iy) = ax + iay. (6.28) 6 Komplexe Zahlen 141 Beispiel: 2z = 2(x + iy) = 2x + 2iy. (6.29) Diese Operation entspricht also der Multiplikation des entsprechenden Vektors in der Gaußschen Zahlenebene mit einem Skalar (siehe Abb. 6.5). Abbildung 6.5: Multiplikation einer komplexen Zahl mit einer reellen Zahl. 6.2.3 Komplex konjugierte Zahl Für eine komplexe Zahl z = x + iy lässt sich durch Umkehrung des Vorzeichens des Imaginärteils die komplex konjugierte Zahl z ∗ definieren: z ∗ = x − iy. (6.30) Wir verwenden auch oft die Notation z für die komplex konjugierte Zahl. Graphisch erhält man die komplex konjugierte Zahl durch Spiegelung des zugehörigen Vektors an der reellen Achse. Abbildung 6.6: Die komplex konjugierte Zahl z ∗ der komplexen Zahl z erhält man durch Spiegelung von z an der reellen Achse. Beispiel: z z ∗ = 4 + 3i, (6.31) = 4 − 3i. (6.32) 142 6 Komplexe Zahlen Wir können den Realteil und den Imaginärteil einer komplexen Zahl mit Hilfe der komplex konjugierten Zahl ausdrücken. Indem wir z ∗ zu z addieren, erhalten wir z + z ∗ = (x + iy) + (x − iy) = 2x, (6.33) woraus folgt 1 (z + z ∗ ). 2 Um den Imaginärteil zu bestimmen, subtrahieren wir z ∗ von z, x= z − z ∗ = (x + iy) − (x − iy) = 2iy, und finden dadurch y= 1 (z − z ∗ ). 2i (6.34) (6.35) (6.36) Ferner folgt aus den Rechenregeln für die Addition komplexer Zahlen: (z1 + z2 )∗ = z1∗ + z2∗ . 6.2.4 (6.37) Multiplikation Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden miteinander multipliziert, indem man die Rechenregeln der Algebra anwendet und dabei beachtet, dass i2 = −1: z1 z2 = = (x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + ix2 y1 + i2 y1 y2 (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ). (6.38) Beispiel: (4 + 3i)(6 − 2i) = 24 − 8i + 18i − 6i2 = 24 + 6 + (18 − 8)i = 30 + 10i. (6.39) Multipliziert man eine komplexe Zahl z mit ihrer komplex konjugierten Zahl z ∗ , erhält man: zz ∗ = (x + iy)(x − iy) = x2 − (iy)2 = x2 + y 2 = |z|2 . (6.40) Der Betrag |z| lässt sich also ausdrücken als |z| = √ zz ∗. (6.41) Die Multiplikation zweier komplexer Zahlen ist kommutativ, z1 z2 = z2 z1 , (6.42) z1 (z2 z3 ) = (z1 z2 )z3 = z1 z2 z3 , (6.43) z1 (z2 + z3 ) = z1 z2 + z1 z3 . (6.44) assoziativ, und distributiv, Weiters gibt es für eine komplexe Zahl z ein neutrales Element 1=1+i0, z · 1 = z, (6.45) 6 Komplexe Zahlen 143 und, falls z = 0, ein inverses Element zinv , sodass z · zinv = 1. (6.46) Für das inverse Element der Multiplikation gilt: zinv = z∗ 1 z∗ = ∗ = 2. z zz |z| (6.47) Da für alle komplexen Zahlen z gilt, dass z · 0 = 0, hat 0 kein inverses Element. Durch Anwendung der Rechenregeln für die Multiplikation von komplexen Zahlen können wir uns leicht klar machen, dass ferner gilt: (z1 z2 )∗ = z1∗ z2∗ (6.48) (z n )∗ = (z ∗ )n . (6.49) und somit auch Dieses Resultat erhalten wir durch n-fache Anwendung von Gleichung (6.48). 6.2.5 Division Zur Division einer komplexen Zahl z1 = x1 + iy1 durch eine komplexe Zahl z2 = x2 + iy2 erweitern wir zunächst den Bruch mit der komplex konjugierten Zahl des Nenners: z1 z1 · z2∗ (x1 + iy1 )(x2 − iy2 ) . = = ∗ z2 z2 · z2 (x2 + iy2 )(x2 − iy2 ) (6.50) Ausmultiplizieren und Zusammenfassen der reellen und imaginären Terme ergibt: z1 x1 x2 + y1 y2 + i(x2 y1 − x1 y2 ) . = z2 (x22 + y22 ) (6.51) Der Nenner ist jetzt reell und nur der Zähler bleibt komplex. Daher können wir einfach die Regeln für die Multiplikation einer komplexen Zahl mit einer reellen Zahl anwenden und erhalten: x1 x2 + y1 y2 y1 x2 − x1 y2 z1 = +i . (6.52) z2 x22 + y22 x22 + y22 Der Nenner (x22 + y22 ) ist immer eine strikt positive Zahl (x22 + y22 > 0), außer für z2 = 0. In diesem Fall können wir die Division nicht durchführen. Beispiel: (4 + 3i) (6 − 2i) (4 + 3i)(6 + 2i) 24 + 8i + 18i − 6 18 + 26i = = (6 − 2i)(6 + 2i) 36 + 4 40 9 13 + i. 20 20 = = (6.53) Beispiel: z = zinv = = 4 + 3i, 1 (4 − 3i) 4 − 3i 1 = = = z 4 + 3i (4 + 3i)(4 − 3i) 16 + 9 4 3 − i. 25 25 (6.54) (6.55) 144 6 Komplexe Zahlen Wir testen jetzt, ob zinv wirklich die zu z inverse komplexe Zahl ist: 3 1 2 1 4 − i = (4 + 3i)(4 − 3i) = (4 + 32 ) z · zinv = (4 + 3i) 25 25 25 25 16 + 9 = = 1. 25 6.3 6.3.1 (6.56) Die Exponentialform von komplexen Zahlen Eulersche Formel Wir haben bis jetzt nur die Grundrechnungsarten für komplexe Zahlen besprochen. Aus diesen Grundoperationen können wir auch komplexe Funktionen f (z) von komplexen Zahlen konstruieren. Eine solche Funktion f (z) bildet eine komplexe Zahl z in die komplexe Zahl u = f (z) ab: f z− → u. (6.57) Zum Beispiel können wir durch Hintereinanderausführen der Multiplikation ganzzahlige Potenzen einer komplexen Zahl bilden: z 2 = z · z, z 3 = z · z · z, .. . z n = z · · · · · z . (6.58) (6.59) (6.60) (6.61) n-mal Wie wir im Kapitel 5 gesehen haben, lassen sich für reelle Zahlen ganz allgemeine Funktionen als so genannte Potenzreihen ausdrücken. Zum Beispiel können wir die Exponentialfunktion ex ausdrücken als: ex = 1 + x + x3 x4 x2 + + + ..., 2! 3! 4! (6.62) wobei die so genannte Fakultät n! einer natürlichen Zahl n definiert ist als das Produkt aller natürlichen Zahlen von 1 bis n: n! = n(n − 1)(n − 2) . . . 3 · 2 · 1 z.B. 4! = 4 · 3 · 2 · 1 = 24. (6.63) Die Potenzreihe in Gleichung (6.62) hat unendlich viele Terme. Weil die Terme immer kleiner werden, kann die Summe doch gegen den endlichen Wert ex streben. Ähnlich gilt für die beiden Winkelfunktionen sin(x) und cos(x) x5 x7 x3 + − + ..., 3! 5! 7! x2 x4 x6 cos(x) = 1 − + − + .... 2! 4! 6! sin(x) = x − (6.64) (6.65) (Probieren Sie das mit Ihrem Taschenrechner aus.) Im Allgemeinen lässt sich jede Funktion f (x) als eine Potenzreihe ausdrücken f (x) = a0 + a1 x + a2 x2 + a3 x3 + . . . (6.66) und wir haben im Kapitel 5 gesehen, wie wir auf systematische Weise die passenden Koeffizienten ai ermitteln können. 6 Komplexe Zahlen 145 Die Potenzreihen für die trigonometrischen Funktionen bestehen aus den selben Termen wie die Exponentialfunktion (jedoch jeweils nicht aus allen). Dies lässt uns schon erahnen, dass es einen Zusammenhang zwischen der Exponentialfunktion und den trigonometrischen Funktionen geben muss. Da für komplexe Zahlen ganzzahlige Potenzen, wie wir oben gesehen haben, definiert sind, können wir versuchen, mit Hilfe der Potenzreihe (6.62) die Exponentialfunktion für komplexe Zahlen zu erweitern. Betrachten wir zunächst was passiert, wenn wir in (6.62) die reelle Zahl x durch eine imaginäre Zahl iϕ ersetzen (ϕ ist dabei reell): eiϕ = 1 + (iϕ) + (iϕ)3 (iϕ)4 (iϕ)5 (iϕ)6 (iϕ)2 + + + + ... 2! 3! 4! 5! 6! (6.67) Durch explizite Berechnung der Potenzen der imaginären Einheit erhalten wir: eiϕ = 1 + iϕ − iϕ3 ϕ4 iϕ5 ϕ6 ϕ2 − + + − ... 2! 3! 4! 5! 6! Zusammenfassung der reellen und imaginären Terme ergibt: ϕ4 ϕ6 ϕ5 ϕ7 ϕ2 ϕ3 eiϕ = 1 − + − + ... +i ϕ − + − + ... . 2! 4! 6! 3! 5! 7! =cos ϕ (6.68) (6.69) =sin ϕ Durch Vergleich mit den Potenzreihen für sin(x) und cos(x) mit reellem Argument erhalten wir: eiϕ = cos ϕ + i sin ϕ. (6.70) Das ist die berühmte Eulersche Formel. Für den Spezialfall ϕ = π erhalten wir die schöne Formel eiπ + 1 = 0, (6.71) welche die wichtigen Zahlen e, i, π, 1 und 0 miteinander verknüpft. Eine weitere interessante Beziehung ist: 2 π i π = (eiπ/2 )i = ei π/2 = e−π/2 . (6.72) ii = (0 + i)i = cos + i sin 2 2 Leonhard Euler hat dies in einem Brief an Goldbach (1746) folgendermaßen kommentiert: “Letztens √ √−1 habe gefunden, dass diese expressio −1 einen valorem realem habe, welche in fractionibus decimalibus=0.2078795763, welches mir merkwürdig zu seyn scheinet.” Ein alternativer Beweis der Eulerschen Formel lässt sich mit Hilfe eines komplexen Integrals konstruieren, wobei wir hier nur die Idee grob skizzieren. Wir betrachten dazu die komplexe Zahl z = cos ϑ + i sin ϑ, (6.73) welche einen Betrag von 1 besitzt, |z| = 1. Das Differential dieser Zahl ist: dz = (− sin ϑdϑ + i cos ϑdϑ) = (− sin ϑ + i cos ϑ)dϑ = i(cos ϑ + i sin ϑ)dϑ = izdϑ, (6.74) dz z (6.75) sodass wir erhalten: = idϑ. Integration auf beiden Seiten liefert (wir lösen hier eigentlich eine Differentialgleichung): ln z = iϑ (6.76) z = eiϑ = cos ϑ + i sin ϑ. (6.77) und somit 146 6.3.2 6 Komplexe Zahlen Polardarstellung von komplexen Zahlen Die Eulersche Formel ermöglicht die so genannte Polardarstellung der komplexen Zahlen. Wie wir weiter oben gesehen haben (siehe Gleichung (6.17)), kann eine komplexe Zahl dargestellt werden als z = |z|(cos ϕ + i sin ϕ). (6.78) Unter Verwendung der Eulerschen Formel ergibt sich daraus z = |z|eiϕ . (6.79) Das ist die Polardarstellung der komplexen Zahl z. In dieser Darstellung ist die komplex konjugierte Zahl einfach gegeben durch: z ∗ = |z|e−iϕ . (6.80) Abbildung 6.7: Multiplikation zweier komplexer Zahlen in der Polardarstellung. In der Polardarstellung können wir durch Rechenregeln für die Exponentialfunktion die Multiplikation und Division von komplexen Zahlen stark vereinfachen: z1 z2 = (|z1 |eiϕ1 )(|z2 |eiϕ2 ) = |z1 ||z2 |ei(ϕ1 +ϕ2 ) . (6.81) Anschaulich bedeutet das, dass man zwei komplexe Zahlen miteinander multipliziert, indem man die zugehörigen Winkel ϕ1 und ϕ2 addiert und die Beträge |z1 | und |z2 | miteinander multipliziert (siehe Abb. 6.7). Das heißt, die Multiplikation von z1 mit z2 ist eine Drehstreckung: der Winkel ϕ1 wird um den Winkel ϕ2 weitergedreht und der Betrag |z1 | wird um den Faktor |z2 | gestreckt. Für die Division gilt: z1 |z1 | i(ϕ1 −ϕ2 ) e = . z2 |z2 | (6.82) Der Kehrwert von z ist also gegeben durch 1 1 −iϕ = e . z |z| (6.83) 6 Komplexe Zahlen 6.3.3 147 Umkehrung der Eulerschen Formel Wir wollen nun die trigonometrischen Funktionen durch die Exponentialfunktion ausdrücken. Wenn wir ϕ durch −ϕ ersetzen, erhalten wir die zu eiϕ konjugierte komplexe Zahl: ∗ e−iϕ = cos(−ϕ) + i sin(−ϕ) = cos ϕ − i sin ϕ = eiϕ . (6.84) Durch Addition der Eulerschen Formel für eiϕ und für die komplex konjugierte Zahl e−iϕ erhalten wir: eiϕ e −iϕ eiϕ + e−iϕ = cos ϕ + i sin ϕ (6.85) = cos ϕ − i sin ϕ (6.86) = 2 cos ϕ, (6.87) eiϕ + e−iϕ . 2 (6.88) woraus folgt cos ϕ = Subtrahieren wir hingegen e−iϕ von eiϕ erhalten wir: eiϕ −e −iϕ eiϕ − e−iϕ = cos ϕ + i sin ϕ (6.89) = − cos ϕ + i sin ϕ (6.90) = 2i sin ϕ, (6.91) woraus sich sin ϕ = eiϕ − e−iϕ 2i (6.92) ergibt. Vergleich der Gleichungen (6.88) und (6.92) mit den Gleichungen (1.96) und (1.95) zeigt den Zusammenhang zwischen den trigonometrischen und den hyperbolischen Funktionen. 6.3.4 Additionstheoreme für Winkelfunktionen Die Eulersche Formel können wir auch benutzen, um die Additionstheoreme für die Winkelfunktionen herzuleiten. Aus der Eulerschen Formel folgt: ei(ϕ1 +ϕ2 ) = cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 ). (6.93) Gleichzeitig gilt aber auch: ei(ϕ1 +ϕ2 ) = eiϕ1 · eiϕ2 = (cos ϕ1 + i sin ϕ1 ) · (cos ϕ2 + i sin ϕ2 ) = = cos ϕ1 cos ϕ2 + i cos ϕ1 sin ϕ2 + i cos ϕ2 sin ϕ1 − sin ϕ1 sin ϕ2 cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 + i(cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 ). (6.94) Der Vergleich der Real- und Imaginärteile der beiden obigen Formeln liefert: cos(ϕ1 + ϕ2 ) = sin(ϕ1 + ϕ2 ) = cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 , cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 . (6.95) (6.96) Diese beiden Formeln sind die Additionstheoreme für die Sinus- und die Kosinusfunktion. Weitere Beziehungen kann man durch analoge Berechnungen für Vielfache des Winkels ϕ ableiten. 148 6.3.5 6 Komplexe Zahlen Komplexe Zahlen als Exponenten Bisher haben wir nur die rein imaginäre Zahl iϕ als Argument der Exponentialfunktion betrachtet. Für ein komplexes Argument w = x + iy erhält man z = ew = e(x+iy) = ex eiy . (6.97) z = reiϕ (6.98) Der Vergleich mit zeigt, dass der Realteil x den Betrag |ew | = ex der komplexen Zahl z = ew bestimmt und der Imaginärteil y den Phasenwinkel ϕ = y. 6.4 Potenzieren und komplexe Wurzeln In der kartesischen Darstellung können wir Potenzen von komplexen Zahlen einfach durch Ausmultiplizieren berechnen: z2 = (x + iy)2 = x2 + 2ixy + (iy)2 = x2 − y 2 + 2ixy, 3 = (x + iy)3 = x3 + 3ix2 y + 3x(iy)2 + (iy)3 = x3 − 3xy 2 + i(3x2 y − y 3 ). z (6.99) (6.100) Im Allgemeinen brauchen wir binomische Formeln (oder das Pascalsche Dreieck), um die Koeffizienten zu bestimmen. Das Pascalsche Dreieck 1 1 1 1 1 1 2 3 4 5 1 1 3 6 10 1 4 10 1 5 1 .. . n=0 n=1 n=2 n=3 n=4 n=5 .. . In der polaren Darstellung ist das Potenzieren einfacher: n z n = |z|eiϕ = |z|n einϕ , (6.101) (6.102) oder, in trigonometrischer Schreibweise, z n = [|z|(cos ϕ + i sin ϕ)]n = |z|n [cos(nϕ) + i sin(nϕ)]. Zur Herleitung der letzten Gleichung haben wir die Tatsache benutzt, dass iϕ n e = einϕ , (6.103) (6.104) woraus (cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ) (6.105) folgt. Dieses Ergebnis nennt man die Formel von Moivre. Die n-te Potenz einer komplexen Zahl kann man also bestimmen, indem man den n-fachen Phasenwinkel ϕ nimmt und den Betrag z, der eine reelle Zahl ist, zur n-ten Potenz nimmt. 6 Komplexe Zahlen 149 Auch die Umkehrung der Potenz, die komplexe Wurzel, lässt sich in der polaren Darstellung leicht bestimmen: 1 √ iϕ iϕ 1 1 n z = z n = |z|eiϕ n = |z| n e n = n |z|e n . (6.106) In der trigonometrischen Darstellung haben wir also: ' ϕ ϕ( 1 n |z|(cos ϕ + i sin ϕ) = |z| n cos + i sin . n n (6.107) Abbildung 6.8: Wenn wir den zu z gehörigen Vektor um 2π (oder ein Vielfaches davon) drehen, kehrt der Vektor zu seinem Ausgangspunkt zurück. Wenn wir jedoch berücksichtigen, dass eine komplexe Zahl im Phasenwinkel ϕ mit einer Periode 2π √ periodisch ist, kann man zusätzliche Wurzeln n z konstruieren. Da die trigonometrischen Funktionen sin ϕ und cos ϕ periodisch mit Periode 2π sind, ist dies leicht einzusehen. Zum Phasenwinkel ϕ einer komplexen Zahl z = |z|eiϕ können wir deswegen ganzzahlige Vielfache von 2π addieren, ohne die Zahl zu verändern z = |z|eiϕ = |z|ei(ϕ+k2π) k = 0, ±1, ±2, . . . (6.108) Anschaulich heißt das, dass wir zum Ausgangspunkt zurückkehren, wenn wir den zugehörigen Ortsvektor um eine (oder mehrere) ganze Umdrehung(en) weiter drehen (siehe Abb. 6.8). Das heißt aber auch, dass √ (ϕ+k2π) 1 n z = n |z|eiϕ = n |z|ei(ϕ+k2π) = |z| n ei n . (6.109) Daraus folgt, dass für alle k = 0, ±1, ±2, . . . die Zahl 1 |z| n ei (ϕ+k2π) n iϕ 1 = |z| n e n + i2πk n (6.110) eine n-te Wurzel von z ist. Wie viele verschiedene gibt es nun von diesen Zahlen? Für k = 0 erhalten wir die Wurzel 1 iϕ z0 = |z| n e n (6.111) und für k = 1 die Wurzel 1 iϕ z1 = |z| n e n + Das heißt, der Phasenwinkel von z1 ist um 2π n i2π n . (6.112) größer als der von z0 : ϕ1 = ϕ0 + 2π . n (6.113) 150 6 Komplexe Zahlen Wir erhalten also z1 aus z0 , indem wir den zugehörigen Vektor in der Gaußschen Zahlenebene um ein n-tel von 2π weiter drehen. Die nächste Lösung 1 iϕ z2 = |z| n e n + i2·2π n (6.114) hat einen Phasenwinkel, der um 2π/n größer ist als der von z1 . Auf ähnliche Weise erhalten wir z3 aus z2 . Nachdem wir den Zeiger n-mal um 2π/n weiter gedreht haben, sind wir wieder bei der ursprünglichen Wurzel z0 angelangt. Es gibt also insgesamt n n-te Wurzeln einer komplexen Zahl z: 1 ϕ 2π zk = |z| n ei( n +k n ) k = 0, . . . , n − 1. (6.115) Anschaulich liegen diese n-ten Wurzeln in der Gaußschen Zahlenebene auf einem Kreis mit Radius 1 |z| n und bilden ein regelmäßiges n-Eck (siehe Abb. 6.9). 1 Abbildung 6.9: Die n-ten Wurzeln der komplexen Zahl z liegen auf einem Kreis mit Radius |z| n in der Gaußschen Zahlenebene und bilden ein regelmäßiges n-Eck. Beispiel: Wir wollen die Wurzel √ 6 3 − 8i (6.116) berechnen. Dazu drücken wir die Zahl z = 3 − 8i zunächst in Polarform aus. Da √ 8 und ϕ = arctan − |z| = 32 + 82 = 73 = −1.21, 3 (6.117) haben wir z= √ −i1.21 73e . (6.118) Die komplexen 6-ten Wurzeln von 3 − 8i sind somit die 6 Zahlen 1 zk = 73 12 ei(−1.21+ 2π 6 k) mit k = 0, 1, . . . , 5. 1 Diese Zahlen bilden ein Sechseck mit Kantenlänge 73 12 in der Gaußschen Zahlenebene. (6.119) 6 Komplexe Zahlen 151 Beispiel: Zu berechnen sind die dritten Wurzeln von 1: √ 3 1. (6.120) Im Allgemeinen sind die n n-ten Wurzeln der Zahl 1 gegeben durch: zk = 1eik2π/n , (6.121) wobei k von 0 bis n − 1 läuft. Die drei dritten Wurzeln von 1 sind daher: 6.5 z0 = z1 = z2 = 1, √ 3 1 i, ei2π/3 = − + 2 √2 1 3 i. ei4π/3 = − − 2 2 (6.122) (6.123) (6.124) Darstellung von Kurven mit komplexen Zahlen Kurven in der Gaußschen Zahlenebene können durch Gleichungen der Form f (z) = 0 (6.125) dargestellt werden. Dabei ist z = x + iy eine komplexe Zahl und f (z) eine Funktion dieser Zahl. Beispielsweise ist |z| = 1 die Gleichung für einen Kreise mit Radius 1 und Mittelpunkt im Nullpunkt. Die Gleichung |z − 1| = 1 stellt einen Kreis mit Radius 1 dar, dessen Mittelpunkt bei x = 1 auf der reellen Achse liegt. Ein komplizierteres Beispiel ist die Gleichung für eine Hyperbel in der komplexen Ebene: ||z + 1| − |z − 1|| = 1 (6.126) Hier ist |z − 1| der Abstand des Punktes (1, 0) von z und |z + 1| ist der Abstand des Punktes (−1, 0) von z. Die Gleichung (6.126) wird also von allen Punkten erfüllt, für die die Differenz der Entfernung von den Punkten (1, 0) und (−1, 0) konstant gleich 1 ist. Diese Forderung definiert eine Hyperbel. Abbildung 6.10: Durch Verknüpfung der Abstände |z + 1| und |z − 1| lässt sich eine Hyperbel definieren. Analytisch folgt dies aus folgender Berechnung: Für z = x + iy ist z − 1 = (x − 1) + iy und z + 1 = (x + 1) + iy. Somit haben wir |z + 1| = (x + 1)2 + y 2 und |z − 1| = (x − 1)2 + y 2 (6.127) 152 6 Komplexe Zahlen und folglich (x + 1)2 + y 2 − (x − 1)2 + y 2 = ±1. (6.128) Umformen und anschließendes Quadrieren liefert 2 2 (x + 1)2 + y 2 = ±1 + (x − 1)2 + y 2 x2 + 2x + 1 2 = 1 ± 2 (x − 1)2 + y 2 + (x2 − 2x + 1) + y 2 + y 4x − 1 2 16x − 8x + 1 + 1 16x2 −8x = = 12x2 − 4y 2 = = 4y 2 = y2 = y = ±2 (x − 1)2 + y 2 4((x2 − 2x + 1) + y 2 ) + 4 + 4y 2 4x2 −8x 3 12x2 − 3 3 3x2 − " 4 3 ± 3x2 − . 4 (6.129) (6.130) (6.131) (6.132) (6.133) (6.134) (6.135) (6.136) (6.137) Dies ist die Gleichung einer Hyperbel, die sich asymptotisch zwei Geraden durch den Ursprung mit √ √ Steigungen 3 und − 3 annähert (siehe Abb. 6.11). Abbildung 6.11: Die Hyperbel y = ± 3x2 − 34 . Beispiel: Ein weiteres Beispiel einer mit Hilfe von komplexen Zahlen darstellbare Kurve ist die Ellipse |z − 1| + |z + 1| = 4. (6.138) Kapitel 7 Fehlerrechnung 7.1 Systematische und statistische Fehler Im Experiment gemessene physikalische Größen sind immer mit einem gewissen Fehler behaftet. (Um den negativen Beigeschmack des Wortes Fehler zu vermeiden, sprechen wir auch oft von einer Abweichung oder einer Messabweichung.) Zur Beurteilung von Messwerten ist es sehr wichtig zu wissen, wie groß diese Fehler sind. Die Abschätzung von Fehlern ist Aufgabe der Fehlerrechnung. Streng genommen ist die Angabe eines Messwertes ohne Angabe eines Messfehlers sinnlos. Graphisch stellen wir Fehler mit Hilfe von Fehlerbalken dar (siehe Abb. 7.1). Abbildung 7.1: Graphisch stellen wir Fehler mit Hilfe so genannter Fehlerbalken dar. Die Höhe des Fehlerbalkens entspricht der erwarteten Größe des Fehlers. In diesem Beispiel wurde für verschiedene Werte von x die Größe y experimentell bestimmt. Somit ist y fehlerbehaftet. Aus den Messdaten können wir in diesem Beispiel lediglich schließen, dass die wahren Werte von y mit großer Wahrscheinlichkeit irgendwo innerhalb der Fehlerbalken liegen. Üblicherweise geben wir Messwerte in der folgenden Form an: A ± ε. (7.1) Hier ist A die im Experiment ermittelte Messgröße und ε ist der zugehörige Messfehler. Die Schreibweise ±ε deutet an, dass die Abweichung ε sowohl positiv als auch negativ sein kann. Zum Beispiel bedeutet v = (600 ± 30) m/s, (7.2) dass die gemessene Geschwindigkeit von 600 m/s mit einem wahrscheinlichen Fehler von etwa 30 m/s behaftet ist. Das heißt, der wahre Wert der Geschwindigkeit v liegt wahrscheinlich im 153 154 7 Fehlerrechnung Intervall zwischen 570 m/s und 630 m/s. Was in diesem Zusammenhang “wahrscheinlich” heißt, werden wir später genauer definieren. Übrigens sind Angaben wie v = (600.125 ± 30)m/s (7.3) nicht sehr sinnvoll, da der Messwert 600.125 mit einer viel höheren Genauigkeit angegeben wird, als in Anbetracht des Fehlers von ± 30 m/s möglich ist. Üblicherweise sollte die letzte signifikante Stelle in der Angabe des Messwerts von der Größenordnung des Messfehlers sein. Fehler müssen auch berücksichtigt werden, wenn wir unterscheiden wollen, ob zwei Größen gleich sind oder sich unterscheiden. Sind z.B. 71.5 ± 0.5 und 71.9 ± 0.3 gleich oder verschieden? Da die Fehlerbereiche der beiden Messwerte überlappen, sind die beiden Werte nicht voneinander zu unterscheiden. Dasselbe gilt für 60±8 und 52±7 . Hingegen sind 2.3751±0.0003 und 2.3758±0.0001 eindeutig voneinander verschieden. Fehler in den Messwerten können im Wesentlichen zwei Ursachen haben, die eine unterschiedliche Behandlung erfordern. Man unterscheidet zwischen systematischen und statistischen Fehlern. Systematische Fehler sind Abweichungen, die durch Fehler in den Messinstrumenten oder im Messverfahren selbst entstehen, z. B. durch falsche Kalibrierung der Apparatur oder durch Änderung der Messbedingungen während der Messung. Solche Fehler beeinflussen die Messgröße meist in einer bestimmten Richtung. In Computersimulationen entstehen systematische Fehler oft durch die Anwendung von Näherungen in den zugrunde liegenden theoretischen Ausdrücken oder durch Verwendung zu kleiner Systemgrößen. Das Erkennen und Minimieren von systematischen Fehlern ist ein essentieller Bestandteil eines jeden Experiments. Statistische Fehler (oder zufällige Fehler) haben ihre Ursache in verschiedenen Störeinflüssen während der Messung, die nur schwer beeinflusst werden können. Auch wenn systematische Fehler im Experiment weitgehend eliminiert worden sind, wird die mehrmalige Messung einer bestimmten Größe nicht immer dasselbe Ergebnis liefern. Diese Abweichungen, die wir statistische Fehler nennen, verändern den Messwert sowohl in negativer als auch in positiver Richtung. Anschaulich können wir uns den Unterschied zwischen systematischen und statistischen Fehlern anhand folgender Beispiele klarmachen (siehe Abb. 7.2). Wir stellen uns vor, dass wir in einer Schießübung mehrmals auf eine Zielscheibe schießen. Dabei kann es zu folgenden Ergebnissen kommen: (a) Die Einschüsse liegen eng beisammen, d.h. der statistische Fehler ist klein. Die Punkte liegen auch alle in der Nähe des Zentrums. Somit ist auch der systematische Fehler klein. (b) Hier liegen die Punkte eng beisammen, was bedeutet, dass der statistische Fehler klein ist. Der systematische Fehler ist groß, da die Punkte weit weg vom Zentrum liegen. (c) Der systematische Fehler ist klein, der statistische Fehler ist groß. (d) Beide Fehler sind groß. Im Folgenden wollen wir uns nun hauptsächlich mit statistischen Fehlern beschäftigen. Systematische Fehler, die schwieriger zu erkennen sind, werden wir nur im Zusammenhang mit der Fehlerfortpflanzung besprechen. Aufgaben der Fehlerrechnung: • Wir wollen von den Messergebnissen auf den wahren Wert der gemessenen Größe schließen. • Wir wollen die Zuverlässigkeit der Messung abschätzen. 7 Fehlerrechnung 155 Abbildung 7.2: (a) statistischer Fehler klein, systematischer Fehler klein; (b) statistischer Fehler klein, systematischer Fehler groß; (c) statistischer Fehler groß, systematischer Fehler klein; (d) statistischer Fehler groß, systematischer Fehler groß. 7.2 Mittelwert und Varianz Stellen wir uns vor, dass wir die Fallbeschleunigung aus einem Fallexperiment ermitteln wollen. Dazu wird die Fallzeit t einer Kugel mit einer Stoppuhr für eine gewisse Fallstrecke h bestimmt. Aus h = 12 gt2 können wir dann die Fallbeschleunigung g = 2h t2 bestimmen. Abbildung 7.3: In einem Fallexperiment messen wir die Zeit t, die ein im Schwerefeld fallender Körper benötigt, um die Strecke h zurückzulegen. Um die Zuverlässigkeit der Messung zu verbessern, wiederholen wir die Messung N mal in Form einer Messreihe. Die erhaltenen Messwerte xi nennen wir eine Stichprobe aus der Menge aller möglichen Messungen. Da jede Messung fehlerbehaftet ist, unterscheiden sich die N Messungen einer Stichprobe. Als beste Schätzung des unbekannten “wahren” Wertes betrachten wir den arith- 156 7 Fehlerrechnung metischen Mittelwert der N Messwerte xi : N 1 x= xi N i=1 Stichprobe = {x1 , . . . , xN }. (7.4) Dieser Definition liegt der Gedanke zugrunde, dass statistische Abweichungen nach oben und unten gleich wahrscheinlich sind und sich im Mittel deshalb ausgleichen. Je größer unsere Stichprobe ist, umso genauer können wir durch den Mittelwert x den wahren Wert der Messgröße abschätzen. Wir werden dies später quantitativ untersuchen. Abbildung 7.4: (a) Kleine Streuung der Daten um den Mittelwert; (b) große Streuung der Daten um den Mittelwert. Zusätzlich zum Mittelwert ist es auch nützlich zu wissen, wie stark die Messwerte im Durchschnitt vom Mittelwert abweichen. Wir könnten nun versuchen, die mittlere Abweichung der Messwerte vom Mittelwert zu berechnen: N N N 1 1 1 (xi − x) = xi − x N i=1 N i=1 N i=1 N 1 N = xi − x = 0. (7.5) N i=1 N =x =x Dieser Mittelwert verschwindet jedoch, weil sich die positiven und negativen Abweichungen vom Mittelwert genau kompensieren. Ein besseres Maß für die statistische Streuung der Messwerte ist die Varianz s2 , bei der statt der Abweichungen die Abweichungsquadrate summiert werden: s2 = N 1 (xi − x)2 . N i=1 (7.6) Summe der Abweichungsquadrate Hier ist der Beitrag jedes Messwertes zur Varianz wegen des Quadrats positiv und es kommt zu keiner Kompensation der positiven und negativen Abweichungen. Die Varianz s2 ist das mittlere Abweichungsquadrat der Messwerte xi vom Mittelwert x. Die Varianz hat die Dimension des Quadrats der Dimension der gemessenen Größe. Um ein Abweichungsmaß mit der gleichen Dimension wie die Messgröße zu erhalten, ziehen wir die Wurzel aus der Varianz: , N -1 (xi − x)2 . (7.7) s=. N i=1 Man nennt s die Standardabweichung. 7 Fehlerrechnung 157 Wir können uns jetzt die Frage stellen, ob wir nicht einen vom arithmetischen Mittelwert verschiedenen Bezugswert x̃ wählen können, sodass die für diesen Wert definierte Varianz s2 = N 1 (xi − x̃)2 N i=1 (7.8) kleiner wird als die bezüglich des arithmetischen Mittelwerts x. Um diese Frage zu beantworten, minimieren wir s2 bezüglich x̃, indem wir s2 nach x̃ ableiten und die Ableitung gleich Null setzen: 1 d(s2 ) ! = 2(xi − x̃)(−1) = 0. dx̃ N (7.9) Daraus folgt N (xi − x̃) = 0 ⇒ i=1 N xi = i=1 N x̃ = N x̃ (7.10) i=1 und somit x̃ = N 1 xi . N i=1 (7.11) Mit anderen Worten bedeutet dies, dass der arithmetische Mittelwert x einer Stichprobe ihre Varianz und somit auch ihre Standardabweichung minimiert. 7.3 7.3.1 Verteilungen und Histogramme Grundlagen Eine Stichprobe bestehend aus N Messwerten einer bestimmten Größe kann als zufällige Auswahl aus der Menge aller möglichen Messwerte betrachtet werden. Diese Menge nennen wir die Grundgesamtheit. Nun kann es sein, dass nicht alle möglichen Messwerte der Grundgesamtheit gleich häufig vorkommen. Kleine Abweichungen vom Mittelwert sind im Allgemeinen weitaus häufiger als große. Wir berücksichtigen diese Tatsache, indem wir die Grundgesamtheit statistisch mit Hilfe von so genannten Wahrscheinlichkeitsverteilungen und Wahrscheinlichkeitsdichten beschreiben. Abbildung 7.5: Zur Bestimmung der Häufigkeit unterschiedlicher Messfehler teilen wir das Intervall [a, b] in kleine Bereiche und zählen, wie viele Messwerte in jedes Intervall fallen. Dazu verfahren wir folgendermaßen. Stellen wir uns vor, dass wir eine Größe x N mal messen und dadurch die Messwerte xi erhalten. Wir teilen nun die x-Achse, auf die wir die Messwerte auftragen können, in M kleine Intervalle (oder Zellen) der Breite ∆x ein und nummerieren die Intervalle mit dem Index j (siehe Abb. 7.5). Wir nehmen weiters an, dass alle Messwerte xi im Bereich [a, b] liegen. (Diese Einschränkung kann leicht aufgehoben werden.) Das Intervall j wird von den Werten a + (j − 1)∆x und a + j∆x begrenzt, wobei a + M ∆x = b. 158 7 Fehlerrechnung Wir zählen jetzt, wie viele der Messwerte in jedem der Intervalle liegen und bezeichnen die Zahl der Messwerte im Intervall j mit n(j). Da die Gesamtanzahl der Messungen N ist, muss die Summation von n(j) über alle Zellen M n(j) = N (7.12) j=1 ergeben. Wenn wir n(j) graphisch darstellen, erhalten wir ein Histogramm (siehe Abb. 7.6). Messwerte aus einem Intervall mit großem n(j) kommen häufig vor, solche mit kleinem n(j) weniger häufig. Abbildung 7.6: Ein Histogramm erhält man, wenn man die Anzahl n(j) der im Intervall j gezählten Messwerte graphisch darstellt. Indem wir die Zahlen n(j) durch die Gesamtzahl N der Messwerte dividieren, h(j) = n(j) , N (7.13) erhalten wir ein normiertes Histogramm mit den Eigenschaften M j=1 h(j) = M n(j) j=1 N = N = 1. N (7.14) Die Zahl h(j) entspricht für große N der Wahrscheinlichkeit, dass ein Messwert xi im Intervall j (also zwischen a + (j − 1)∆x und a + j∆x) liegt. Im Grenzwert sehr kleiner Intervallgrößen ∆x können wir eine kontinuierliche Funktion f (x), die so genannte Verteilungsdichte (oder Wahrscheinlichkeitsdichte), definieren, die in diesem Fall die Rolle des Histogramms übernimmt. Dazu betrachten wir den Grenzübergang n(x) , ∆x→0 N →∞ N ∆x f (x) = lim lim (7.15) wobei n(x) die Anzahl der Messwerte im Intervall [x, x + ∆x] ist. Hier wird durch den Grenzübergang ∆x → 0 das Verhältnis n(x)/N immer kleiner (da das Intervall schrumpft). Da ∆x in der obigen Gleichung jedoch auch im Nenner auftritt, konvergiert n(x)/N ∆x gegen einen endlichen Wert. Die Wahrscheinlichkeitsdichte f (x) hat die Dimension [1/x]. Nach dieser Definition ist df = f (x)dx (7.16) 7 Fehlerrechnung 159 der infinitesimale Bruchteil der Messungen, die im infinitesimalen Intervall [x, x+dx] liegen. f (x)dx kann auch als die Wahrscheinlichkeit, einen Messwert im Intervall [x, x+dx] zu finden, interpretiert werden. Aus der Normierung von h(j) = n(j)/N folgt, dass das Integral über die Wahrscheinlichkeitsdichte gleich 1 ist: %b f (x)dx = 1. (7.17) a Dies entspricht der Tatsache, dass ein Messwert irgendwo zwischen a und b liegen muss. Man bezeichnet die Wahrscheinlichkeitsdichte deshalb als normiert. Im Gegensatz zum Histogramm ist die Wahrscheinlichkeitsdichte eine kontinuierliche Funktion. Abbildung 7.7: Die Warscheinlichkeitsdichte f (x) ist eine kontinuierliche Funktion, die die infinitesimale Wahrscheinlichkeit df = f (x)dx angibt, dass ein Messwert im infinitesimalen Intervall [x, x + dx] liegt. Natürlich besteht keine Notwendigkeit, uns auf ein endliches Intervall [a, b] zu beschränken und wir können ohne weiteres den gesamten Zahlenbereich von −∞ bis +∞ betrachten. (Falls die Wahrscheinlichkeitsdichte f (x) auf ein Intervall [a, b] beschränkt ist, kann sie auf die gesamte Zahlengerade erweitert werden, indem man f (x) = 0 für x < a und x > b (7.18) setzt.) Abbildung 7.8: Die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) dafür, einen Messwert im Intervall [x1 , x2 ] zu finden, ist gleich der Fläche unter der Wahrscheinlichkeitsdichte f (x) zwischen x1 und x2 (schraffierter Bereich). Aus der Wahrscheinlichkeitsdichte f (x) können wir die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) be- 160 7 Fehlerrechnung rechnen, dass sich ein Messwert zwischen zwei beliebigen Grenzen x1 und x2 befindet: %x2 P (x1 ≤ x ≤ x2 ) = f (x)dx. (7.19) x1 Wenn wir in diesem Ausdruck x1 = −∞ als untere Schranke wählen, erhalten wir die so genannte Wahrscheinlichkeitsverteilung (oder Wahrscheinlichkeitsfunktion oder Verteilungsfunktion oder Verteilung): %x f (u)du. F (x) = (7.20) −∞ F (x) ist die Wahrscheinlichkeit, einen Messwert zu finden, der kleiner oder gleich x ist. Beispiel: Die Maxwellsche Verteilung beschreibt die Wahrscheinlichkeitsdichte der Geschwindigkeitskomponenten eines einzelnen Teilchens in einem klassischen Vielteilchensystem mit Temperatur T . Für die x-Komponente vx der Geschwindigkeit lautet sie " 2 m 1 e− 2 βmvx f (vx ) = β = 1/kB T. (7.21) 2πkB T Die Geschwindigkeitskomponenten in y- und in z-Richtung haben identische Wahrscheinlichkeitsdichten. Hier ist kB die nach dem österreichischen Physiker Ludwig Boltzmann (1844-1906) benannte Boltzmannkonstante und β = 1/kB T . Diese Wahrscheinlichkeitsdichte ist normiert, das heißt % (7.22) f (vx )dvx = 1. Allgemeine Eigenschaften der Wahrscheinlichkeitsdichte f (x) und der Wahrscheinlichkeitsverteilung F (x) sind: 1. f (x) ≥ 0. 2. f (x) ist normiert, das heißt: %∞ f (x)dx = 1. (7.23) −∞ 3. F (x) ist monoton wachsend und eine Stammfunktion von f (x) (siehe Abb. 7.9): F (x) = f (x). (7.24) 4. F (−∞) = 0 und F (∞) = 1. 5. Die Wahrscheinlichkeit, dass die Variable x einen Wert im Intervall zwischen a und b annimmt, ist: %b P (a ≤ x ≤ b) = F (b) − F (a) = f (x)dx. (7.25) a (Genau genommen ist F (x) so definiert, dass der Wert a ausgeschlossen und der Wert b eingeschlossen ist. Für stetige Wahrscheinlichkeitsverteilungen macht dies jedoch keinen Unterschied.) 7 Fehlerrechnung 161 Abbildung 7.9: Die Wahrscheinlichkeitsdichte f (x) ist die erste Ableitung der Wahrscheinlichkeitsverteilung F (x). 7.3.2 Erwartungswert, Momente einer Verteilung Mittelwert Der Begriff des Mittelwerts und der Varianz lassen sich auch auf kontinuierliche Verteilungsdichten f (x) übertragen. Betrachten wir eine Grundgesamtheit, die durch die Verteilung f (x) beschrieben wird. Wir führen zunächst N mal eine Messung aus und erhalten die Messwerte xi . Der Mittelwert dieser Messwerte ist N 1 x= xi . N i=1 (7.26) Wir teilen die x-Achse nun wieder in M kleine Intervalle der Breite ∆x ein und nummerieren diese Zellen mit dem Index j. Wir zählen die Messwerte in jedem Intervall und bezeichnen diese Zahl mit n(j). Außerdem bezeichnen wir den Mittelpunkt jeder Zelle mit x(j). Abbildung 7.10: Bei der Berechnung von Mittelwerten aus einem Histogramm nähern wir jeden x-Wert im Intervall j durch x(j) an. Wenn ∆x klein ist, können wir jeden Messwert im Intervall j durch den Wert x(j) annähern. Mit dieser Näherung können wir die Summe in Gleichung (7.26) über alle Messwerte in eine Summe über alle M Intervalle (Zellen) umschreiben: N M 1 1 x= xi ≈ n(j)x(j). N i=1 N j=1 (7.27) 162 7 Fehlerrechnung Die zweite Summe geht aus der ersten Summe einfach durch Zusammenfassen der Messwerte in der jeweils gleichen Zelle hervor. Durch Multiplikation mit ∆x und gleichzeitiger Division durch ∆x erhalten wir x≈ M n(j)x(j) N ∆x j=1 ∆x. (7.28) Führen wir die Grenzwerte ∆x → 0 und N → ∞ aus, verwandelt sich diese Summe in ein Integral: %∞ x= xf (x)dx, (7.29) −∞ wobei wir die Definition (7.15) benutzt und den Wertebereich auf −∞ und ∞ ausgedehnt haben. Für den Mittelwert einer Verteilungsdichte verwenden wir oft den Buchstaben µ, um ihn vom Mittelwert x einer Stichprobe zu unterscheiden. µ ist der Mittelwert der Grundgesamtheit. (Im Allgemeinen verwenden wir griechische Buchstaben für Eigenschaften der Grundgesamtheit und lateinische Buchstaben für Eigenschaften von Stichproben.) Erwartungswert Der Mittelwert µ wird auch oft Erwartungswert E(x) von x genannt: %∞ E(x) = xf (x)dx = µ. (7.30) −∞ Im Allgemeinen ist der Erwartungswert einer Größe g(x), die eine Funktion der Variablen x mit Verteilungsdichte f (x) ist, gegeben durch: %∞ E[g(x)] = g(x)f (x)dx. (7.31) −∞ Den Erwartungswert bezeichnen wir oft auch mit spitzen Klammern: E[g(x)] = g(x). (7.32) Aus der Definition des Erwartungswertes folgt, dass der Erwartungswert einer Summe gleich der Summe der Erwartungswerte ist: E[g(x) + h(x)] = E[g(x)] + E[h(x)]. (7.33) Ferner kann eine reelle Zahl α vor den Erwartungswert gezogen werden: E[αg(x)] = αE[g(x)]. (7.34) Varianz Analog zum Mittelwert µ können wir für die Verteilungsdichte f (x) auch eine Varianz definieren: %∞ (x − µ)2 f (x)dx. σ2 = (7.35) −∞ Wir verwenden oft auch die Schreibweise: Var(x) = σ 2 . (7.36) 7 Fehlerrechnung 163 Die Varianz ist die mittlere quadratische Abweichung der Messwerte x vom Mittelwert µ. In anderen Worten, die Varianz ist der Erwartungswert von (x − µ)2 , also σ 2 = E[(x − µ)2 ]. Die Wurzel aus der Varianz ist die Standardabweichung σ. Durch Ausmultiplizieren des Quadrats im Integranden und Verwendung obiger Rechenregeln erhalten wir aus Gleichung (7.35) den Ausdruck σ2 = = = E[(x − µ)2 ] = E x2 − 2E(xµ) + µ2 E x2 − 2µ E(x) +µ2 =µ = E x2 − µ2 = E x2 − (E(x))2 = x2 − x2 . (7.37) Momente Der hier auftretende Erwartungswert E(x2 ) wird das 2. Moment der Verteilungsdichte f (x) genannt. Der Mittelwert E(x) ist das 1. Moment von f (x). Im Allgemeinen ist das n-te Moment einer Verteilung f (x) definiert als: %∞ E (x ) = x = n n xn f (x)dx. (7.38) −∞ 7.3.3 x und s2 als Schätzer für µ und σ 2 Die Kenngrößen µ und σ 2 der Grundgesamtheit sind meist unbekannt und können nur aufgrund der Stichprobendaten geschätzt werden. So können wir etwa x als einen Schätzer für µ verwenden. Das ist unter anderem dadurch gerechtfertigt, dass der Erwartungswert von x gleich µ ist / 0 1 Nµ 1 = µ. (7.39) E(x) = E xi = E(xi ) = N i N i N Etwas anders verhält es sich mit der Varianz s2 , die wir als Schätzer für σ 2 verwenden könnten. Der Erwartungswert der Varianz ist / 0 + 2 1 1 * 2 = E (xi − x) = E (xi − x)2 E s N i N i 1 2 1 2 = E xi − 2xi x + x2 N i 1 2 2 1 2 E xi − 2 E(xi x) + E x = N i i i 1 1 1 1 = N E x2 − 2 E xi xj + E xk · xl N N j N N i i k l 1 2 1 = E (xi xj ) + 2 E (xk xl ) . N E x2 − (7.40) N N N i,j i k,l Der Erwartungswert E(xi xj ) des Produkts xi xj hängt davon ab, ob die beiden Indizes i und j gleich sind. Für i = j gilt E(xi xj ) = E(x2i ) = E(x2 ). (7.41) 164 7 Fehlerrechnung Für i = j können wir im Falle statistisch unabhängiger xi schreiben E(xi xj ) = E (xi ) E (xj ) = E(x)2 . (7.42) (Zur Definition des Erwartungswertes E(xi xj ) ist es notwendig, Wahrscheinlichkeitsdichten zu betrachten, die von zwei Variablen abhängen. Dazu verweisen wir die Leser an die einschlägige Literatur). Durch Verwendung dieser Ausdrücke können wir vereinfachen: 2 2 1 2 2 E xi + E (xi ) E (xj ) E s = NE x − N N i i=j 1 2 E xk + E (xk ) E (xl ) + 2 N i k k=l 6 7 (7.43) 2 2 2 2 1 1 2 2 N E x + N (N − 1)µ + N E x + N (N − 1)µ NE x − = N N N 9 1 8 (N − 1)E x2 − (N − 1)µ2 = N 9 N −1 2 N − 1 8 2 = σ E x − µ2 = N N und somit erhalten wir σ2 = N E s2 . N −1 (7.44) (Das selbe Ergebnis erhält man auch, wenn man den Erwartungswert E[(as2 − σ 2 )] betrachtet und jene Konstante a bestimmt, für die dieser Erwartungswert minimal ist.) Das heißt, der Erwartungswert des Schätzers ist um einen Faktor NN−1 kleiner als die Varianz der Grundgesamtheit. Für große N ist das irrelevant. Damit der Erwartungswert der Stichprobenvarianz gleich σ 2 ist, definiert man die Varianz oft als 1 (xi − x)2 . N − 1 i=1 N s2 = 7.3.4 (7.45) Fehler des Mittelwerts Wie wir oben besprochen haben, betrachten wir den Mittelwert x einer Stichprobe von Messungen als Schätzwert für den “wahren” Mittelwert µ, den Mittelwert der zur Grundgesamtheit gehörenden Verteilungsdichte f (x). Da die Stichprobe jedoch nur endlich viele Werte beinhaltet, machen wir bei so einer Schätzung immer einen gewissen Fehler. Wir wollen nun diesen Fehler abschätzen. Abbildung 7.11: Da jede Stichprobe aus N unterschiedlichen Werten besteht, unterscheiden sich die zugehörigen Mittelwerte xk . Zu diesem Zwecke betrachten wir mehrere Stichproben von jeweils gleicher Größe N (das heißt, jede Stichprobe besteht aus N Messwerten) (siehe Abb. 7.11). Jede dieser Stichproben liefert 7 Fehlerrechnung 165 einen unterschiedlichen Mittelwert xk . Für L Stichproben erhalten wir L verschiedene Mittelwerte xk . Die durchschnittliche quadratische Abweichung dieser Mittelwerte von µ, dem Mittelwert der Grundgesamtheit, ist: 1 (xk − µ)2 . L L (7.46) k=1 Für sehr große L wird dieser Ausdruck zu * + σx2 = E (x − µ)2 . (7.47) Dies ist die Varianz der aus den Stichproben der Größe N ermittelten Mittelwerte x. Die Varianz beschreibt die Streuung der Mittelwerte, die man aus einer Vielzahl verschiedener Stichproben erhält. Einige algebraische Umformungen liefern: + * σx2 = E (x − µ)2 = E x2 − 2E(xµ) + E µ2 1 = E x x − 2µ E(x) +µ2 2 i j N i,j =µ = 1 1 E (xi xj ) − µ2 = 2 E x2i + E(xi )E(xj ) − µ2 N 2 i,j N i i=j = = + 1 * N E x2 + N (N − 1)µ2 − µ2 N2 + 1 * 2 E x − µ2 . N (7.48) Wegen E x2 − µ2 = σ 2 erhalten wir also 1 2 σ N (7.49) σ σx = √ , N (7.50) σx2 = oder wobei σ die Standardabweichung der Grundgesamtheit ist. Das heißt, dass die Standardabweichung des Mittelwerts umso kleiner ist, je größer die Stichprobe ist. Durch Erhöhung der Anzahl N der unabhängigen Messungen können wir die Genauigkeit der Messung steigern. Um den Fehler σx im Mittelwert zu halbieren, müssen wir gemäß Gleichung (7.50) den Umfang der Stichprobe vervierfachen. 7.3.5 Die Gaußsche Normalverteilung In allen bisherigen Betrachtungen haben wir auf keine spezifische funktionale Form der Verteilungsfunktion Bezug genommen. Die genaue Gestalt der Verteilung hängt natürlich vom betrachteten Messprozess ab. In vielen Fällen und unter recht allgemeinen Bedingungen folgen Messfehler jedoch der Gaußschen Normalverteilung, benannt nach Carl Friedrich Gauß (1777-1855). Dies ist immer dann der Fall, wenn statistische Fehler durch die Überlagerung sehr vieler kleiner unabhängiger “Störfaktoren” entstehen. Mathematisch kann dies mit Hilfe des zentralen Grenzwertsatzes gezeigt werden, auf den hier aus Platzgründen nicht weiter eingegangen werden kann. Die Gaußsche Normalverteilung (auch Gaußsche Glockenkurve genannt) ist gegeben durch f (x) = √ (x−µ)2 1 e− 2σ2 2πσ (7.51) 166 7 Fehlerrechnung Abbildung 7.12: Die Gaußsche Normalverteilung. und hat die Gestalt einer Glocke mit Maximum an der Stelle µ und einer Breite von 2σ (die Wendepunkte der Kurve liegen bei µ ± σ) (siehe Abb. 7.12). Der Mittelwert und die Varianz der Gaußschen Normalverteilung sind %∞ (x−µ)2 x √ e− 2σ2 dx = µ 2πσ (7.52) 2 (x − µ)2 − (x−µ) √ e 2σ2 dx = σ 2 . 2πσ (7.53) −∞ und %∞ −∞ Das heißt, die Gaußsche Normalverteilung ist durch Angabe des 1. und 2. Moments vollständig bestimmt. Die Gaußsche Normalverteilung ist normiert, %∞ √ −∞ (x−µ)2 1 e− 2σ2 dx = 1 2πσ (7.54) und ist um µ symmetrisch, das heißt f (µ + x) = f (µ − x). (7.55) Die Wahrscheinlichkeit, dass ein Messwert im Bereich zwischen a und b liegt, ist durch das Integral %b P (a ≤ x ≤ b) = f (x)dx (7.56) a gegeben. Solche Wahrscheinlichkeiten kann man auch mit Hilfe der so genannten Errorfunktion ausdrücken, die wie folgt definiert ist: 2 erf(x) = √ π %x 2 e−t dt. (7.57) 0 Die Errorfunktion ist so definiert, dass erf(∞) = 1. Mit dieser Definition können wir die Wahrscheinlichkeit P (a ≤ x ≤ b) ausdrücken als: 7 6 a−µ b−µ 1 − erf √ . (7.58) erf √ P (a ≤ x ≤ b) = 2 2σ 2σ 7 Fehlerrechnung 167 Die Wahrscheinlichkeit, dass ein Messwert kleiner ist als a, ist gegeben durch: 6 7 1 a−µ P (x ≤ a) = 1 + erf √ . 2 2σ (7.59) Für die Gaußsche Normalverteilung (siehe Abb. 7.13) sollten wir demnach 68 % 95 % 99.7 % aller Messwerte im Intervall aller Messwerte im Intervall aller Messwerte im Intervall (µ ± σ), (µ ± 2σ) und (µ ± 3σ) erwarten, das heißt, eine Abweichung vom Mittelwert von mehr als ±3σ ist statistisch nur etwa alle 300 Messungen zu erwarten. Abbildung 7.13: Die Wahrscheinlichkeit, einen Messwert im Intervall (µ ± σ) zu finden, ist 68%, im Intervall (µ ± 2σ) ist sie 95% und im Intervall (µ ± 3σ) 99.7%. Ist die Variable x gaußverteilt, so ist es auch der Mittelwert x = N1 N i=1 xi . Sowohl die Verteilungen von x selbst als auch die des Mittelwerts x haben einen Mittelwert von µ. Die Varianzen σ und σx der beiden Verteilungen unterscheiden sich jedoch und sind durch σx2 = σ2 N (7.60) miteinander verknüpft. Die Verteilung des Mittelwerts x ist also um den Faktor die Verteilung der Variablen x selbst. √ N schmäler als Aus der Gaußverteilung ergibt sich, dass der “wahre” Mittelwert der Verteilung mit einer Wahrscheinlichkeit von mit einer Wahrscheinlichkeit von mit einer Wahrscheinlichkeit von 68 % 95 % 99.07 % im Intervall im Intervall im Intervall x ± σx , x ± 2σx und x ± 3σx liegt. Diese Intervalle nennt man Konfidenzintervalle oder Vertrauensintervalle. 7.3.6 Verteilung diskreter Größen Bis jetzt haben wir uns mit der Verteilung von kontinuierlichen Größen beschäftigt. Es kann aber in der Physik durchaus vorkommen, dass die Messgröße nur diskrete (endlich viele oder abzählbar unendlich viele) Werte annehmen kann. Zum Beispiel kann die Anzahl der in einer gewissen Zeit 168 7 Fehlerrechnung zerfallenden Kerne eines radioaktiven Materials nur eine ganze Zahl sein, also einen der Werte 0,1,2,... usw. annehmen. Im Falle diskreter Größe beschreiben wir die Verteilung der Messwerte durch die Wahrscheinlichkeitsfunktion f (xi ), welche die Wahrscheinlichkeit ist, bei einer Messung der Größe x den Wert xi zu beobachten. Die Wahrscheinlichkeitsfunktion f (xi ) muss normiert sein: f (xi ) = 1. (7.61) i (Das Integral für die kontinuierliche Wahrscheinlichkeitsdichte haben wir hier also durch eine Summe ersetzt.) Die zugehörige Verteilungsfunktion ist F (x) = f (x ). (7.62) x ≤x Die Verteilungsfunktion F (x) ist die Wahrscheinlichkeit, einen Messwert zu beobachten, der kleiner oder gleich x ist. Der Mittelwert und die Varianz einer diskreten Verteilung sind gegeben durch: xi f (xi ), (7.63) E(x) = i Var(x) = f (xi )(xi − µ)2 . (7.64) i Der Erwartungswert einer Funktion g(x) ist E [g(x)] = f (xi )g(xi ). (7.65) i √ Auch für diskrete Verteilung gilt σx = σ/ N für die Standardabweichung des Mittelwerts. Folgende Ausdrücke sind gebräuchlich: 7.3.7 diskret kontinuierlich f (x) • Wahrscheinlichkeitsfunktion • Verteilungsdichte • Dichtefunktion • Wahrscheinlichkeitsdichte F (x) • Verteilungsfunktion • Wahrscheinlichkeitssumme • Verteilungsfunktion • Wahrscheinlichkeitsintegral • Wahrscheinlichkeitsverteilung Poissonverteilung Die Anzahl von zufälligen intervall stattfinden, folgt Monat geborenen Babies, kerne oder die Anzahl der durch und statistisch unabhängigen Ergebnissen, die in einem gewissen Zeitder Poissonverteilung. Beispiele sind die in einem Krankenhaus pro die in einer radioaktiven Substanz pro Zeiteinheit zerfallenden AtomFehler pro Seite in diesem Skriptum. Die Poissonverteilung ist gegeben f (x) = µx e−µ x! (für ganzzahliges x). (7.66) Wir schreiben auch oft P (n) statt f (x), um anzudeuten, dass die Poissonverteilung nur für ganzzahlige Werte des Arguments definiert ist (siehe Abb. 7.14). 7 Fehlerrechnung 169 Abbildung 7.14: Die Poissonverteilung für µ = 10. Die Poissonverteilung ist normiert: ∞ P (n) = n=0 ∞ ∞ µn e−µ µn = e−µ = e−µ eµ = 1 n! n! n=0 n=0 (7.67) eµ (Da n nur diskrete Werte annimmt, haben wir hier summiert statt integriert.) Die Poissonverteilung ist durch einen einzigen Parameter µ vollständig bestimmt. Der Parameter µ ist der Mittelwert E(n) der Verteilung: E(n) = ∞ nP (n) = n=0 ∞ µn e−µ . n n! n=0 (7.68) Da das erste Summenglied verschwindet, können wir schreiben: E(n) = ∞ ∞ ∞ ∞ µn e−µ µn µn−1 µn = e−µ = µe−µ = µe−µ n = µ. n! (n − 1)! (n − 1)! n! n=1 n=1 n=1 n=0 (7.69) eµ Der Mittelwert µ ist gleich der Anzahl der Ereignisse, die im Mittel in der betrachteten Zeit stattfinden. Besonders interessant ist die Varianz der Poissonverteilung: σ 2 = E(n2 ) − E(n)2 . (7.70) Der Erwartungswert von n2 ist: 2 E(n ) = ∞ n=0 2 n P (n) = ∞ n n −µ 2µ e n=0 n! = µe −µ ∞ nµn−1 . (n − 1)! n=1 (7.71) Durch Umnummerierung der Summe erhalten wir: E(n2 ) = µe−µ ∞ ∞ ∞ nµn (n + 1)µn µn = µ2 + µ. = µe−µ + n! n! n! n=0 n=0 n=0 (7.72) σ 2 = E(n2 ) − E(n)2 = µ2 + µ − µ2 = µ. (7.73) µeµ eµ Daraus folgt: 170 7 Fehlerrechnung Das heißt, für die Poissonverteilung ist die Varianz gleich dem Mittelwert. Diese Formel ist sehr wichtig zur Abschätzung des Fehlers bei Messvorgängen, bei denen wir Ereignisse zählen. Für große µ wird die Poissonverteilung zu einer Gaußverteilung. Beispiel: In einer gewissen Zeit zählen wir 625 Zerfälle in einem radioaktiven Präparat. Der Fehler, den wir durchschnittlich bei einer solchen Messung machen, ist √ √ (7.74) σ = µ ≈ 625 = 25. Daher ist unser Messergebnis: 625 ± 25. 7.4 (7.75) Fehlerfortpflanzung Oft können physikalische Größen nicht direkt gemessen werden. Man bestimmt dann diese Größen, indem man sie als Funktion von anderen Größen ausdrückt, welche messbar sind. So kann man zum Beispiel die Dichte einer Flüssigkeit bestimmen, indem man für eine gewisse Menge an Substanz sowohl das Volumen V als auch die Masse m misst. Die Dichte ρ ergibt sich dann aus ρ= m . V (7.76) Da sowohl die Masse m als auch das Volumen V als experimentell ermittelte Größen fehlerbehaftet sind, ist auch die daraus bestimmte Dichte ρ fehlerbehaftet. Man sagt, der Fehler in den unabhängigen Größen m und V pflanzt sich auf die abhängige Größe ρ = m/V fort. Wir wollen jetzt den Fehler in der abhängigen Größe aus den Fehlern der unabhängigen Größen bestimmen. Im Allgemeinen betrachten wir eine Größe u, die von den N Größen x1 , x2 , . . . , xN abhängt: u = u(x1 , x2 , . . . , xN ). (7.77) Wir nehmen an, dass x1 bis xN experimentell bestimmte Größen sind und dass deren Statistik durch die Verteilungsdichten f1 (x1 ), f2 (x2 ), . . . , fN (xN ) beschrieben wird. Die zugehörigen Mittelwerte und Varianzen sind µ1 , µ2 , . . . , µN (7.78) 2 . σ12 , σ22 , . . . , σN (7.79) und Für jede Messgröße xi bestimmen wir nun für eine Stichprobe aus M Messungen den Mittelwert xi . Die Standardabweichung dieser Mittelwerte ist gegeben durch (siehe Abschnitt 7.3.4): σi σxi = √ . M (7.80) Wir können nun die Größe u für die Mittelwerte xi bestimmen, u ≡ u(x1 , x2 , . . . , xN ), (7.81) und nach dem Fehler in u fragen, der durch die Fehler σxi der Mittelwerte entsteht. Um diese Frage zu beantworten, können wir auf zwei verschiedene Weisen vorgehen: Wir können entweder den Maximalfehler in der abhängigen Größe u abschätzen oder die statistischen Kennwerte der Verteilung von u ermitteln. 7 Fehlerrechnung 7.4.1 171 Fortpflanzung von Maximalfehlern Unter der Annahme, dass die Fehler ∆xi in den unabhängigen Größen klein sind, können wir den dadurch hervorgerufenen Fehler ∆u einfach durch Anwendung des Differentials abschätzen ∆u ≈ N ∂u i=1 ∂xi ∆xi . (7.82) Das heißt, hier haben wir den Fehler durch das Differential angenähert, das wir in Kapitel 3 kennengelernt haben. Das Differential von u gibt an, um wie viel sich u ändert, wenn die Größen xi um jeweils ∆xi verändert werden. So würde man etwa im Falle von systematischen Fehlern vorgehen. Da wir pessimistisch veranlagt sind, wollen wir den “worst case” annehmen und den Betrag des größtmöglichen Fehlers bestimmen. Dazu nehmen wir an, dass alle Terme einen positiven Beitrag zum Fehler in u liefern, das heißt, dass alle Fehler in die gleiche Richtung gehen und erhalten somit: ! N ! ! ∂u ! ! ! ! !. !∆u! ≈ ∆x i ! ∂xi ! (7.83) i=1 Wenn wir die Standardabweichungen σxi als Maß für die Fehler in xi benutzen, erhalten wir ! N ! ! ∂u ! ! ! ! ! !∆u! ≈ ! ∂xi !σxi , i=1 (7.84) wobei die partiellen Ableitungen an der Stelle (x1 , x1 , . . . , xN ) ausgewertet werden. Beispiel: Betrachten wir wieder die Bestimmung der Dichte ρ aus dem gemessenen Volumen V und der gemessenen Masse m. Wir nehmen an, dass wir sowohl das Volumen als auch die Masse in M wiederholten Messungen bestimmt haben. Aus diesen Messreihen erhalten wir die Mittelwerte V und m und die Varianzen s2V und s2m . Wir identifizieren diese Varianzen mit den Varianzen σV2 2 und σm der zugehörigen Grundgesamtheiten. Als Maß für die Fehler in den Mittelwerten V und m verwenden wir σV (7.85) σV = √ M und σm σm = √ . M Dann ist der Maximalfehler in der Dichte gegeben durch ! ! ! ! ! ∂ρ ! ! ∂ρ ! ! !·σ ! ! |∆ρ| ≈ ! · σm + ! ∂m ! ∂V ! V m 1 σm + 2 σV = V V ρ 1 σm + σV , = V V (7.86) (7.87) wobei wir ρ ≡ m/V verwendet haben. Der relative Fehler |∆ρ|/ρ ist also gegeben durch: σ σm |∆ρ| ≈ + V. ρ m V (7.88) 172 7 Fehlerrechnung Der relative Fehler in ρ ist also die Summe der relativen Fehler in m und V . Die Methode der Fortpflanzung der Maximalfehler kann den Fehler aber leicht überschätzen. Realistischer ist es in vielen Fällen, die Wirkung der Fehler σxi auf die statistischen Kennwerte der Verteilung von u zu betrachten. 7.4.2 Fortpflanzung statistischer Kennwerte Wir betrachten zunächst den Fall, dass die Größe u nur von einer Variablen x abhängt, die wir im Experiment direkt bestimmen können. Aus einer Messserie erhalten wir den Mittelwert x der Größe x und berechnen daraus die Größe u ≡ u(x). (7.89) Da x als Mittelwert von fehlerbehafteten Größen selbst fehlerbehaftet ist (siehe Abschnitt 7.3.4), wird auch u mit einem Fehler behaftet sein. Um diesen Fehler zu bestimmen, berechnen wir die Varianz von u: ' ( 2 Var(u) = σu2 = E (u(x) − u(µ)) , (7.90) wobei µ = E(x) = E(x) der Erwartungswert von x ist. Wir schreiben nun den Mittelwert x als Summe des Erwartungswerts µ und einer kleinen Abweichung δx: x = µ + δx. (7.91) Unter der Annahme, dass sich der Mittelwert x nur wenig vom Erwartungswert µ unterscheidet, dass δx also klein ist, können wir die Funktion u(x) in eine Taylorreihe um µ entwickeln (siehe Kapitel 5) und nach dem linearen Glied abbrechen: ' ( ' ( E (u(x) − u(µ))2 = E (u(µ + δx) − u(µ))2 / 2 0 du u(µ) + = E δx − u(µ) dx / 0 2 2 + * du du 2 (7.92) = E (δx) = E (δx)2 , dx dx wobei die Ableitung von + u(x) an der Stelle x = µ bzw. als Näherung für µ an der Stelle x ausgewer* tet wird. Da E (δx)2 = σx2 , erhalten wir schließlich das Gaußsche Fehlerfortpflanzungsgesetz für den Fall einer Funktion u(x), die nur von einer einzelnen Variablen abhängt: σu2 = du dx 2 σx2 . (7.93) Als nächtes betrachten wir den Fall einer Funktion u(x, y), welche von zwei Variablen x und y abhängt. Wir fragen nun nach dem Fehler, den wir begehen, wenn wir u ≡ u(x, y) aus den Mittelwerten x und y bestimmen. Dazu berechnen wir wieder die Varianz: ( ' Var(u) = σu2 = E (u(x, y) − u(µ, ν))2 . (7.94) (7.95) Hier sind µ = E(x) = E(x) und ν = E(y) = E(y) die Erwartungswerte von x und y. Indem wir x und y jeweils als Summe des Erwartungswerts und einer kleinen Abweichung ausdrücken, können wir schreiben ( ' (7.96) σu2 = E (u(µ + δx, ν + δy) − u(µ, ν))2 7 Fehlerrechnung 173 und erhalten mit einer nach den linearen Gliedern abgebrochenen Taylorreihe / 2 0 ∂u ∂u 2 σu = E u(µ, ν) + δx + δy − u(µ, ν) ∂x ∂y / 2 0 ∂u ∂u = E . δx + δy ∂x ∂y (7.97) Hier müssen die partiellen Ableitungen ∂u/∂x und ∂u/∂y an der Stelle (µ, ν) ≈ (x, y) ausgewertet werden. Ausführung des Quadrats ergibt: 2 2 ∂u ∂u ∂u ∂u 2 2 σu2 = E[(δx) ] + 2 E[(δy) ]. (7.98) E[δxδy] + ∂x ∂x ∂y ∂y Für unkorrelierte Messwerte x und y gilt E[δxδy] = E[δx]E[δy] = 0 und wir erhalten schließlich das Gaußsche Fehlerfortpflanzungsgesetz für den Fall von zwei Variablen: σu2 = ∂u ∂x 2 σx2 + 2 ∂u ∂y σy2 , 2 (7.99) 2 wobei wir benutzt haben, dass σx2 = E[(δx) ] und σy2 = E[(δy) ]. Das Gaußsche Fehlerfortpflanzungsgesetz für den allgemeinen Fall einer Funktion von N Variablen, u = u(x1 , x2 , . . . , xN ), lässt sich auf analoge Weise herleiten. Man erhält als Ergebnis: σu2 = 2 N ∂u ∂xi i=1 σx2i , (7.100) wobei σx2i die Varianzen der zugehörigen Mittelwerte x1 , x2 , . . . , xN sind. Die Standardabweichung σu kann als Maß für den zu erwartenden Fehler in der abhängigen Größe u aufgefasst werden. Das Gaußsche Fehlerfortpflanzungsgesetz gilt, falls • die Varianzen σxi der Mittelwerte xi klein sind und • die Mittelwerte xi voneinander statistisch unabhängig sind. Beispiel: Mit der Gaußschen Fehlerfortpflanzung können wir die Standardabweichung der Dichte ρ = der Standardabweichung von m und V bestimmen: aus σρ2 = = 2 2 ∂ρ ∂ρ 2 σm + σV2 ∂m ∂V 2 2 1 m 2 σm + − 2 σV2 . V V m V (7.101) Für den relativen Fehler erhalten wir: σρ2 ρ2 oder σρ ρ = = 2 σV2 σm + 2 m2 V ) σ 2 m m + σV V (7.102) 2 . (7.103) 174 7 Fehlerrechnung 2 Abbildung 7.15: Der durch Gaußsche Fortpflanzung berechnete Relativfehler σρ /ρ = (σm /m2 + 2 σV2 /V )1/2 ist kleiner als der Relativfehler |∆ρ| ρ = σm /m + σV /V , den man durch Fortpflanzung der Maximalfehler erhält. Statt wie bei der Abschätzung des Maximalfehlers die relativen Fehler einfach zu addieren, addieren wir die Quadrate der relativen Fehler und ziehen daraus die Wurzel. Durch die Anwendung der Gaußschen Fehlerfortpflanzung erhalten wir also einen im Vergleich zum Maximalfehler kleineren Fehler. Dies sieht man anhand der Dreiecksungleichung √leicht ein (siehe Abb. 7.15). Falls zum Beispiel σm /m = σV /V , ist dieser Fehler um den Faktor 2 kleiner als der Maximalfehler. Für bestimmte funktionale Zusammenhänge der abhängigen von der unabhängigen Größe ergeben sich besonders einfache Fälle des Gaußschen Fehlerfortpflanzungsgesetzes, die im Folgenden angeführt sind. Summen oder Differenzen Für u = x + y oder u = x − y gilt ∂u = 1 und ∂x ∂u = ±1. ∂y (7.104) Daraus ergibt sich σu2 = 12 σx2 + (±1)2 σy2 = σx2 + σy2 (7.105) und somit σu = σx2 + σy2 . (7.106) Das heißt, die Varianz der abhängigen Größe ist die Summe der Varianzen der unabhängigen Größen. Multiplikation mit einer Konstanten Für u = αx gilt σu2 = ∂u ∂x 2 σx2 = α2 σx2 (7.107) und deshalb σu = ασx . (7.108) Das heißt, die Standardabweichung von u ergibt sich einfach durch Multiplikation von α mit der Standardabweichung von x. 7 Fehlerrechnung 175 Multiplikation oder Division Für u = xy erhalten wir durch Anwendung von Gleichung (7.100) σu2 = y 2 σx2 + x2 σy2 . (7.109) Division durch x2 y 2 ergibt σ 2 σy2 σx2 σu2 x = + = + 2 2 2 u x x y σy y 2 . (7.110) Das heißt, das Quadrat des relativen Fehlers in u ist die Summe der Quadrate der relativen Fehler in x und y. Für die Division u = x/y gilt ganz analog: σu2 2 2 1 x 2 = σx + σy2 . y y2 (7.111) Nach Division durch u = x/y erhalten wir: σ 2 σx2y σx2x σu2 xx = + = + u2 x x2 y2 7.5 σxy y 2 . (7.112) Ausgleichsrechnung (Fitten) In Experimenten bestimmt man oft eine Größe y in Abhängigkeit einer anderen Größe x. Zum Beispiel könnte in einem Experiment das Volumen V einer Flüssigkeit als Funktion der Temperatur T gemessen werden. Als Ergebnis eines solchen Experiments erhält man für jeden der N Werte xi der unabhängigen Größe (in unserem Beispiel die Temperatur) einen Messwert yi (in unserem Beispiel das Volumen). Wir suchen nun nach einer Funktion f (x), die möglichst gut beschreibt, wie y von x abhängt (siehe Abb. 7.16). Abbildung 7.16: Ziel der Ausgleichsrechnung ist es, eine Funktion f (x) zu bestimmen, die möglichst gut zu den Messdaten passt. Im Idealfall hätten wir yi = f (xi ). Sowohl xi als auch yi sind im Allgemeinen fehlerbehaftet, sodass es zu Abweichungen von dieser funktionalen Abhängigkeit kommt. Wir können jedoch verlangen, 176 7 Fehlerrechnung dass die Abweichung der Funktionswerte f (xi ) von den gemessenen Werten möglichst klein ist. Demzufolge suchen wir nach einer Funktion f (x), die die Summe der Abweichungsquadrate 2 χ = N 2 [f (xi ) − yi ] (7.113) i minimiert. Die dazugehörige Kurve nennt man die Ausgleichskurve. Sie ist die Kurve, die im Sinne der kleinsten Summe der Abweichungsquadrate am besten zu den Messwerten passt. Das Anpassen der Ausgleichskurve an die gemessenen Daten nennt man in Anlehnung an das Englische auch “Fitten”. Beim praktischen Fitten wird meistens eine Funktion f (x, a1 , . . . , aL ) angenommen, deren Form entweder von der zugrunde liegenden Physik nahe gelegt wird oder aus Gründen der Einfachheit gewählt wird. Die Funktion hängt im Allgemeinen auch von einer Reihe von freien Parametern ai ab, die wir nun so bestimmen, dass die Summe der Abweichungsquadrate χ2 möglichst klein wird. Wir stellen also an die freien Parameter ai die Bedingung, dass ∂ 2 χ =0 ∂ai für i = 1, . . . , L. (7.114) Das heißt, dass χ2 bezüglich der Parameter ai ein Minimum (genauer: ein Extremum) annimmt. Durch Lösung dieses Satzes von L Gleichungen erhalten wir die Werte für die Parameter, die den besten “Fit” der Funktion an die Messwerte ergeben. Lineare Regression Die einfachste und am häufigsten verwendete Ausgleichsfunktion ist die Gerade f (x) = ax + b, (7.115) die von den zwei freien Parametern a (Steigung) und b (Schnittpunkt mit der y-Achse) abhängt. Man spricht in diesem Fall von linearer Regression. Die Steigung a wird auch Regressionskoeffizient genannt. Um die Parameter a und b zu ermitteln, setzen wir die Ableitungen von χ2 nach a und b gleich 0: ∂ 2 ∂ χ = (axi + b − yi )2 = 2(axi + b − yi )xi = 0 ∂a ∂a i=1 i=1 (7.116) ∂ 2 ∂ χ = (axi + b − yi )2 = 2(axi + b − yi ) = 0. ∂b ∂b i=1 i=1 (7.117) N N und N N Daraus erhalten wir: a N i=1 a N i=1 x2i + b N xi − i=1 xi + N b − N xi yi = 0, (7.118) i=1 N i=1 yi = 0. (7.119) 7 Fehlerrechnung 177 Wir definieren nun: Sx = N xi , (7.120) yi , (7.121) x2i , (7.122) xi yi (7.123) i=1 Sy = N i=1 Sxx = N i=1 Sxy = N i=1 und schreiben die obigen Gleichungen als aSxx + bSx − Sxy = 0, (7.124) aSx + N b − Sy = 0. (7.125) Durch Multiplikation von Gleichung (7.125) mit Sxx /Sx und Subtraktion der zweiten von der ersten Gleichung erhalten wir Sxx N Sxx = 0, (7.126) b Sx − − Sxy + Sy Sx Sx woraus folgt: b= Sy Sxx − Sx Sxy . N Sxx − Sx2 (7.127) Multiplikation von Gleichung (7.125) mit Sx /N und anschließender Subtraktion von Gleichung (7.124) hingegen ergibt: Sx2 Sy Sx a Sxx − − Sxy + =0 (7.128) N N und somit: a= N Sxy − Sx Sy . N Sxx − Sx2 (7.129) Damit haben wir die Parameter a und b der Ausgleichsgeraden bestimmt. Wenn wir den Fehler σi in den Messwerten berücksichtigen und die Terme in der Summe der Abweichungsquadrate damit gewichten, ergeben sich ähnliche Ausdrücke für a und b. Statt der linearen Funktion f (x) = ax + b können wir auch andere Funktionen an die Messdaten anpassen. Die Gleichungen, die sich dann aus ∂χ2 /∂ai ergeben, sind jedoch schwieriger zu lösen als im linearen Fall. 178 7 Fehlerrechnung Kapitel 8 Differentiation von Feldern: grad, div und rot Im Folgenden werden wir uns mit Vektoranalysis beschäftigen. Dabei geht es um die mathematische Beschreibung von Feldern im dreidimensionalen Raum. Für die Beschreibung sind die Begriffe des Gradienten, der Rotation und der Divergenz von zentraler Bedeutung. 8.1 8.1.1 Felder Skalarfelder Betrachten wir als Beispiel die Atmosphäre über einem bestimmten Gebiet, sagen wir über Wien. Es ist ein sonniger Tag und die Sonnenstrahlen erwärmen Straßen, Häuser, etc. Die Temperatur der Luft über dem Boden hängt nur von der Beschaffenheit des Bodens ab. Während dunkler Asphalt die Sonnenstrahlen absorbiert und dadurch die darüber liegende Luft erwärmt, bleibt die Luft über begrünten Flächen eher kühl. Am kühlsten bleibt es in beschatteten Bereichen. Ferner hängt die Lufttemperatur von der Höhe über dem Boden ab: je höher wir steigen, umso kühler wird es. Durch Messung mit einem Thermometer können wir die Temperatur an jedem durch die Koordinaten (x, y, z) beschriebenen Punkt bestimmen und erhalten T (x, y, z). (8.1) Da die Temperatur auch von der Tageszeit abhängt, können wir auch die Zeit t in die Variablenliste aufnehmen: T (x, y, z, t). (8.2) Dies ist ein Beispiel für ein zeitabhängiges, skalares Feld. Das Feld T (x, y, z, t) heißt deshalb skalar, weil die Temperatur T eine skalare Größe ist. Im Allgemeinen ordnet ein Skalarfeld jedem Punkt (x, y, z) eines räumlichen (oder ebenen) Bereichs in eindeutiger Weise einen Skalar A zu (siehe Abb. 8.1): A(x, y, z) = A(r). (8.3) Das Feld A(x, y, z) kann man sich mit Hilfe der Flächen veranschaulichen, auf denen die skalare Größe einen konstanten Wert hat: A(x, y, z) =const. Man nennt diese Flächen Niveau- oder Äquipotentialflächen. In der Ebene definiert die Bedingung A(x, y) =const Niveaulinien (oder 179 180 8 Differentiation von Feldern: grad, div und rot Abbildung 8.1: Ein Skalarfeld ordnet jedem Punkt r in der Ebene (r = (x, y), links) oder im Raum (r = (x, y, z), rechts) eine skalare Größe A(r) zu. Äquipotentiallinien). Solche Niveaulinien kennen wir von topographischen Karten, in denen sie Punkte gleicher Meereshöhe verbinden, oder vom Wetterbericht, wo in der Temperaturkarte für einen diskreten Satz von Temperaturen Punkte gleicher Temperatur durch Niveaulinien miteinander verbunden sind. Ein weiteres 2D-Beispiel ist eine metallische Platte, die an einer Ecke erhitzt und an den gegenüberliegenden Seiten gekühlt wird (siehe Abb. 8.2). Abbildung 8.2: Eine metallische Platte wird an der rechten hinteren Ecke erwärmt und gleichzeitig an der linken und der vorderen Kante gekühlt. Dadurch stellt sich ein Zustand ein, bei dem die Temperatur der Platte vom Ort abhängt. Orte gleicher Temperatur sind durch so genannte Niveaulinien miteinander verbunden. 8.1.2 Vektorfelder In anderen Fällen ist es notwendig, an jeder Stelle x, y, z einen Vektor zu definieren. So möchte man beispielsweise zusätzlich zur Temperatur auch die Windgeschwindigkeit v als Funktion des Ortes angeben: v (x, y, z). (8.4) Da sich Windgeschwindigkeit und Windrichtung mit der Zeit ändern, können wir auch in diesem Fall die Zeit t in die Liste der Argumente aufnehmen und erhalten damit ein zeitabhängiges Geschwindigkeitsfeld: v (x, y, z, t). (8.5) 8 Differentiation von Feldern: grad, div und rot 181 Ein solches Feld nennt man ein Vektorfeld. Im Allgemeinen ordnet ein Vektorfeld jedem Ort (x, y, z) eines Bereichs und (falls nötig) auch jedem Zeitpunkt aus einem bestimmten Intervall einen Vektor zu: y, z) = A( r ). A(x, (8.6) y) analog definiert (siehe Abb. 8.3). Beispiele für Vektorfelder In der Ebene ist ein Vektorfeld A(x, sind das elektrische Feld, das magnetische Feld und das Geschwindigkeitsfeld einer strömenden Flüssigkeit. r ) zu. Abbildung 8.3: Ein Vektorfeld ordnet jedem Punkt r (hier in der Ebene) einen Vektor A( Vektorfelder kann man mit Feldlinien veranschaulichen. Das sind Linien, für die in jedem Punkt der dortige Feldvektor tangential zur Linie ist. Feldlinien können sich nicht schneiden, da in jedem Punkt der Feldvektor eine eindeutige Richtung hat. Würden sich Feldlinien unter einem Winkel schneiden, gäbe es an einem Punkt zwei verschiedene Feldvektoren, was jedoch nicht zulässig ist. Felder, die sich zeitlich nicht ändern, nennt man stationär. Die Dichte der Feldlinien ist ein Maß für die Stärke des Vektorfeldes. Abbildung 8.4: Ein Vektorfeld (hier das zweidimensionale Geschwindigkeitsfeld einer Strömung um eine Scheibe) kann mit Hilfe von Feldlinien, zu denen die Feldvektoren tangential sind, dargestellt werden. Einige Felder von besonderer Bedeutung sind: • Homogene Felder: In einem homogenen Feld hat der Feldvektor überall die gleiche Richtung und den gleichen Betrag. Ein homogenes Feld kann geschrieben werden als y, z) = (cx , cy , cz ), A(x, wobei cx , cy , cz Konstanten sind. (8.7) 182 8 Differentiation von Feldern: grad, div und rot • Kugelsymmetrische Felder (Zentralfelder): Abbildung 8.5: Ein kugelsymmetrisches Vektorfeld. Der Feldvektor zeigt in jedem Punkt radial nach außen oder innen, also vom Ursprung weg oder zum Ursprung hin. Der Betrag hängt nur vom Abstand r vom Zentrum ab. Ein kugelsymmetrisches Feld lässt sich ausdrücken als: r ) = A(r) r , A( r (8.8) wobei r = |r| der Abstand des Punktes vom Ursprung ist. Beispiele für ein kugelsymmetrisches Feld sind das Gravitationsfeld der Erde und das elektrische Feld einer Punktladung. • Zylinder- oder axialsymmetrische Felder: Abbildung 8.6: Ein zylindersymmetrisches Vektorfeld. Der Feldvektor zeigt radial von einer Achse weg und hat keine Komponente in Achsenrichtung. Der Betrag hängt nur vom Abstand des Punktes zur Achse ab. Ein zylindersymmetrisches Feld lässt sich schreiben als: r ) = A(ρ)eρ . A( (8.9) Hier ist ρ der Normalabstand zur z-Achse und eρ der Einheitsvektor normal zur z-Achse in Richtung zum Punkt r. 8 Differentiation von Feldern: grad, div und rot 8.2 Gradient 8.2.1 Definition 183 Betrachten wir ein Skalarfeld A(x, y, z) im dreidimensionalen Raum (zum Beispiel die Temperatur T (x, y, z) eines ungleichmäßig erwärmten Körpers). Wir fragen uns nun, wie sich die skalare Größe A ändert, wenn wir uns vom Punkt r = (x, y, z) leicht wegbewegen, wenn wir also von r = (x, y, z) auf r + dr = (x + dx, y + dy, z + dz) übergehen. In linearer Näherung (für sehr kleine dx, dy und dz) ist die Änderung dA in der Größe A gegeben durch dA = ∂A ∂A ∂A dx + dy + dz. ∂x ∂y ∂z (8.10) (Dies ist einfach das bereits bekannte totale Differential der Funktion A(x, y, z).) Wir können die rechte Seite der obigen Gleichung als das Skalarprodukt des Vektors dr = (dx, dy, dz) mit dem Vektor (∂A/∂x, ∂A/∂y, ∂A/∂z) betrachten. Dieser im Allgemeinen ortsabhängige Vektor ist der Gradient des Skalarfeldes A(x, y, z). Wir schreiben dafür grad A = ∂A ∂x ∂A ∂y ∂A ∂z = ∇A(x, y, z). (8.11) ∇A(x, y, z) nennt man auch das Gradientenfeld von A(x, y, z). Das Symbol ∇ ist der Nabla-Operator, der in der Vektoranalysis eine zentrale Rolle einnimmt und formal als Vektor geschrieben werden kann: ∇= ∂ ∂x ∂ ∂y ∂ ∂z . (8.12) Der Nabla-Operator ∇ (auf Englisch auch “del” genannt) wurde zum ersten Mal vom irischen Physiker William Rowan Hamilton (1805-1865) verwendet. Das Wort “Nabla” bezeichnet eine antike Harfe und wurde vermutlich wegen der Ähnlichkeit des Symbols ∇ mit einer Harfe eingeführt. Der Gradient des Skalarfeldes A(x, y, z) ist also ein Vektorfeld, dessen Komponenten die partiellen Ableitungen von A(x, y, z) nach den Raumkoordinaten sind. Der Gradient von A entsteht durch Anwendung des Nabla-Operators auf A. Man kann den Gradienten auch mit Hilfe der Basisvektoren ex , ey , ez ausdrücken: grad A = ∇A = ∂A ∂A ∂A ex + ey + ez . ∂x ∂y ∂z Auch die Schreibweise ∇A = ∂A ∂r (8.13) (8.14) wird oft verwendet. 8.2.2 Eigenschaften Der Gradient steht senkrecht auf die Äquipotentialflächen (Niveauflächen), auf denen A = const. Um das einzusehen, betrachten wir die Änderung dA, die durch Verschiebung des Ortsvektors r(x, y, z) um dr = (dx, dy, dz) entsteht: dA = ∇A · dr. (8.15) 184 8 Differentiation von Feldern: grad, div und rot Ist dr tangential zur Niveaufläche, bleibt A konstant und wir haben: dA = ∇A · dr = 0. (8.16) Das bedeutet, dass ∇A senkrecht auf die Flächen mit A = const steht. In der Ebene können wir uns das für das Temperaturfeld T (x, y) leicht veranschaulichen: Auf diesen Linien ist T konstant. Das heißt, wenn wir auf ihnen entlangfahren, ändert sich die Temperatur nicht. Wenn wir dr in Richtung einer solchen Linie wählen, muss daher für kleine dr gelten: dA = 0. Das Differential dA ist aber das Skalarprodukt von dr und ∇A: dA = ∇A · dr. Daher haben wir ∇A · dr = 0. Somit ist ∇A orthogonal zu dr und, da dr tangential an die Niveaulinie ist, auch orthogonal zur Niveaulinie selbst. Analog gilt das auch in höheren Dimensionen. Abbildung 8.7: Der Gradient ∇A eines skalaren Feldes A(r) (hier das Temperaturfeld von Abb. 8.2) steht normal zu den Niveaulinien des Feldes. Der Gradient ∇A zeigt in die Richtung, in der die Funktion A(x, y, z) am schnellsten anwächst. Man kann dies zum Beispiel mit Hilfe der Lagrangeschen Multiplikatoren beweisen, worauf wir aber hier nicht eingehen können. Anschaulich ist dies plausibel, da wir natürlich am schnellsten von einer Niveaulinie (oder Niveaufläche) zur nächsten kommen, wenn wir uns senkrecht dazu, also in Richtung des Gradienten, bewegen. (Denken Sie zum Beispiel an die Höhenschichtenlinien auf einer Wanderkarte.) Der negative Gradient zeigt in die Richtung der schnellsten Abnahme der Funktion A(x, y, z). Der Betrag des Gradienten ist die Steigung (oder Ableitung) der Funktion in der Richtung ihres stärksten Zuwachses. Beispiel: Betrachten wir das Gravitationspotential, das von einer Masse M im Ursprung erzeugt wird: GM GM . =− u(x, y, z) = − 2 2 2 r x +y +z (8.17) Hier ist r der Abstand einer Probemasse m vom Ursprung und mu(x, y, z) ist die potentielle Energie dieser Probemasse. G ist die Gravitationskonstante. Der Gradient des Gravitationspotentials lautet: 1 GM − · 2x 3 ∂u 2 (x2 +y2 +z2 ) 2 ∂x 1 ∂u GM ∇u = ∂y = − − 2 2 2 2 32 · 2y (x +y +z ) 1 ∂u GM − 2 2 2 2 3 · 2z ∂z (x +y +z ) 2 x x GM GM GM y = 2 er . 3 · y = r3 r (x2 + y 2 + z 2 ) 2 z z = (8.18) Die Äquipotentialflächen dieses Feldes sind konzentrische Kugeln und ∇u ist orthogonal zur entsprechenden Kugeloberfläche. Die Kraft auf die Probemasse m GM m F (r) = −m∇u = − 2 er r (8.19) 8 Differentiation von Feldern: grad, div und rot 185 zeigt zum Ursprung und ist somit attraktiv. Beispiel: Das Feld u(x, y) = x2 + y 2 (8.20) hat den Gradienten ∇u 8.2.3 = ∂u ∂x ∂u ∂y = 2x 2y . (8.21) Richtungsableitung Die Ableitung der Funktion A(x, y, z) in Richtung eines beliebigen Vektors a lässt sich ebenfalls mit Hilfe des Gradienten ausdrücken: ∇A(x, y, z) · a = ∇A · ea . |a| (8.22) Die Größe nennt man die Richtungsableitung in Richtung des Vektors a. Man erhält sie durch Projektion des Gradienten ∇A auf den normierten Richtungsvektor ea = |aa| . Die Richtungsableitung ist in Richtung des Gradienten am größten. 8.2.4 Rechenregeln Für den Gradienten gelten folgende Rechenregeln: • • • • Für ein konstantes Feld A(r) = c folgt: Summenregel: Faktorregel: Produktregel: ∇A = 0, ∇(A + B) = ∇A + ∇B, ∇(αA) = α∇A, ∇(AB) = A∇B + B∇A. Diese Regeln folgen aus den Regeln für die partielle Differentiation. Zusammenfassend halten wir fest: • Der Gradient von A(r ) ist ein Vektor (eigentlich ein Vektorfeld), dessen Komponenten die partiellen Ableitungen nach den Koordinaten sind. • Der Gradient entsteht durch Anwendung des Nabla-Operators auf A(r). • ∇A steht orthogonal zu den Niveauflächen. • ∇A zeigt in Richtung des stärksten Zuwachses von A(r). • ∇A · ea = ∇A · (a/|a|) ist die Richtungsableitung von A in Richtung von a. 186 8 Differentiation von Feldern: grad, div und rot 8.3 Divergenz 8.3.1 Definition Die Divergenz eines Vektorfeldes beschreibt die Quellstärke eines Feldes. Im Falle des elektrischen Feldes zum Beispiel verknüpft die Divergenz das elektrische Feld mit dessen Quellen, also mit den eines Vektorfeldes A( r ) als das Skalarprodukt Ladungen. Formal definiert man die Divergenz divA des Nabla-Operators mit dem Feld: = ∇·A = ∂Ax + ∂Ay + ∂Az . divA ∂x ∂y ∂z (8.23) Die Divergenz eines Vektorfeldes ist ein skalares Feld. (Ganz im Gegensatz zum Gradienten, der aus einem Skalarfeld ein Vektorfeld macht.) Beispiel: Die Divergenz des Vektorfeldes x2 y r) = A( zxy x2 + y 2 (8.24) ist 2 2 2 = ∇·A = ∂(x y) + ∂(zyx) + ∂(x + y ) = 2xy + zx = x(2y + z). divA ∂x ∂y ∂z 8.3.2 (8.25) Anschauliche Interpretation als lokale Quellstärke Ein anschauliches Verständnis der Divergenz können wir durch folgende Überlegung erreichen. Betrachten wir eine strömende Flüssigkeit, deren räumliche Strömung durch das Geschwindigkeitsfeld vx (x, y, z) v (x, y, z) = vy (x, y, z) vz (x, y, z) (8.26) beschrieben wird. Wir wollen nun die Flüssigkeitsmenge berechnen, welche pro Zeiteinheit in ein kleines Volumen um den willkürlich gewählten Punkt P (x, y, z) eintritt, beziehungsweise aus diesem Volumen austritt (siehe Abb. 8.8). Dieses infinitesimale Volumen wird durch ebene Seitenflächen begrenzt, die parallel zu den Koordinatenebenen liegen. Die Seitenlängen des dadurch entstehenden Quaders sind in x-, y- und z-Richtung jeweils dx, dy und dz. Der Punkt P (x, y, z) liegt im Mittelpunkt des Quaders, das heißt die Seitenflächen haben einen Abstand von dx/2 beziehungsweise dy/2 und dz/2 vom Punkt P . Zu jeder Seitenfläche definieren wir einen Flächenvektor, dessen Betrag gleich dem Flächeninhalt der jeweiligen Seitenfläche ist. Die Flächenvektoren stehen senkrecht auf die jeweiligen Seitenflächen 8 Differentiation von Feldern: grad, div und rot 187 Abbildung 8.8: Ein kleines quaderförmiges Volumen um Punkt P mit Flächenvektoren f1 , f2 , f3 , f4 , f5 und f6 . Am Punkt P = (x, y, z) herrscht die Geschwindigkeit v(x, y, z) vor. und zeigen nach außen. Diese in Abb. 8.8 eingezeichneten Flächenvektoren sind: dydz f1 = 0 = −f2 , 0 0 f3 = dzdx = −f4 , (8.27) (8.28) 0 0 f5 = 0 = −f6 . dxdy (8.29) Wir bestimmen nun die Flüssigkeitsmenge, die pro Zeiteinheit durch die Seitenwände des Quaders strömt (also den Fluss). Wie wir früher bereits gesehen haben, ist der Fluss durch eine Fläche gleich dem Skalarprodukt des Geschwindigkeitsvektors mit dem Flächenvektor. Wenn wir für jede Fläche den Geschwindigkeitsvektor in der Mitte der Fläche nehmen, ergibt sich zum Beispiel für die Seitenfläche mit dem Flächenvektor f1 der Fluss: dx , y, z). f1 · v (x + 2 (8.30) Dabei ist v (x+ dx 2 , y, z) der Geschwindigkeitsvektor in der Mitte der Fläche mit dem Flächenvektor f1 . Durch Verwendung der Komponentendarstellung des Vektors f1 ergibt sich für den Fluss vx (x + dx , y, z)dydz. 2 (8.31) Auf ähnliche Weise erhalten wir für die gegenüberliegende Seitenfläche mit dem Vektor f2 einen Fluss von − vx (x − dx , y, z)dydz. 2 (8.32) 188 8 Differentiation von Feldern: grad, div und rot Für die Flüsse durch die anderen Flächen erhalten wir jeweils: f3 : f4 : f5 : f6 : dy , z)dxdz, 2 dy , z)dxdz, −vy (x, y − 2 dz vz (x, y, z + )dxdy, 2 dz −vz (x, y, z − )dxdy. 2 vy (x, y + (8.33) (8.34) (8.35) (8.36) Die Änderung der Flüssigkeitsmenge in unserem kleinen Quader ergibt sich aus den Flüssigkeitsmengen, die in den Quader hinein oder aus dem Quader heraus fließen. Durch Addition der Flüssigkeitsmengen, die durch die einzelnen Flächen fließen, erhalten wir den Verlust oder den Überschuss an Flüssigkeit, der pro Zeiteinheit für unser kleines Volumen zu verzeichnen ist: $ # dx dx , y, z) − vx (x − , y, z) dydz vx (x + 2 2 $ # dy dy , z) − vy (x, y − , z) dxdz + vy (x, y + 2 2 # $ dz dz + vz (x, y, z + ) − vz (x, y, z − ) dxdy. (8.37) 2 2 Wir multiplizieren und dividieren nun den ersten dieser drei Terme mit dx, den zweiten mit dy und den dritten mit dz: vx (x + + + dx 2 , y, z) − vx (x − dx 2 , y, z) dxdydz dx dy vy (x, y + dy 2 , z) − vy (x, y − 2 , z) dxdydz dy dz vz (x, y, z + dz 2 ) − vz (x, y, z − 2 ) dxdydz. dz (8.38) Für kleine Kantenlängen werden aus den drei Quotienten im obigen Ausdruck partielle Ableitungen und wir erhalten: ∂vx ∂vy ∂vz ∂vy ∂vz ∂vx dV + dV + dV = + + dV. (8.39) ∂x ∂y ∂z ∂x ∂y ∂z Mit Hilfe der Divergenz können wir diesen Ausdruck schreiben als: div v dV = (∇ · v )dV. (8.40) Die zeitliche Änderung der Flüssigkeitsmenge in unserem Quader ist also durch das Produkt der Divergenz des Strömungsfeldes mit dem infinitesimalen Volumen dV gegeben. Die Divergenz beschreibt also den Gewinn oder Verlust an Flüssigkeit pro Zeiteinheit in einem kleinen Volumselement dV um (x, y, z). Für eine inkompressible Flüssigkeit ist die Flüssigkeitsmenge im Volumen natürlich konstant. Für eine kompressible Flüssigkeit hingegen kann diese Menge fluktuieren und ∇ · v kann verschieden von 0 sein. (Genau genommen müssen wir hier ∇(ρv ) statt ∇v betrachten.) Falls div v > 0, überwiegt der Abfluss. Das heißt, es fließt mehr Flüssigkeit aus dem Volumen heraus als in das Volumen hinein. Man sagt in diesem Fall, dass sich im Volumen dV eine Quelle befindet. Falls hingegen div v < 0, überwiegt der Zufluss und es fließt eine größere Flüssigkeitsmenge in das Volumen dV hinein als aus dem Volumen dV heraus. Im Volumen dV befindet sich dann eine Senke. Für div v = 0 halten sich Zufluss und Abfluss genau die Waage und man sagt, das Feld ist in diesem Punkt quellenfrei. 8 Differentiation von Feldern: grad, div und rot 189 eines Feldes A wird auch als dessen lokale Quellstärke bezeichnet. Die Die Divergenz divA Divergenz ist eine lokale Größe, die sich von einem Punkt zum anderen verändern kann. Die des Vektorfeldes A ist selbst ein Skalarfeld. Divergenz div A Beispiel: Betrachten wir die Kraft F auf eine Masse m im Gravitationsfeld, das durch die Masse M im Ursprung erzeugt wird (siehe Abb. 8.9): x GM m (8.41) F = − 3 y . r z Die Divergenz des Gravitationsfeldes ist ∂Fx ∂Fy ∂Fz divF = ∇ · F = + + . ∂x ∂y ∂z (8.42) Die partielle Ableitung der x-Komponente der Kraft nach der Koordinate x ist ∂Fx ∂x = −GM m ∂ x ∂x (x2 + y 2 + z 2 ) 32 = −GM m (x2 + y 2 + z 2 ) 2 − x 32 (x2 + y 2 + z 2 ) 2 · 2x (x2 + y 2 + z 2 )3 3 3 1 1 (x2 + y 2 + z 2 ) 2 − 3x2 (x2 + y 2 + z 2 ) 2 (x2 + y 2 + z 2 )3 r3 − 3x2 r = −GM m . r6 = −GM m (8.43) Auf ähnliche Weise erhalten wir: r3 − 3y 2 r ∂Fy = −GM m ∂y r6 und r3 − 3z 2 r ∂Fz = −GM m . ∂z r6 (8.44) Durch Addieren dieser drei partiellen Ableitungen ergibt sich div F = −GM m 3r3 − 3(x2 + y 2 + z 2 )r 3r3 − 3r3 = −GM m = 0. 6 r r6 (8.45) Das Gravitationsfeld ist also überall, wo es definiert ist (für r = 0), quellenfrei. Über den Ursprung, also den Punkt (0,0,0), können wir hier keine Aussage machen, da in diesem Punkt das Feld F divergiert. Eine mathematisch weiterführende Betrachtung zeigt jedoch, dass das Gravitationsfeld genau im Ursprung eine punktförmige Quelle besitzt, die durch eine δ-Funktion dargestellt werden kann. Überall sonst ist das Gravitationsfeld quellenfrei, da wir ja keine zusätzliche Masse betrachtet haben. Beispiel: y, z) = (xy 2 , z 2 + y 2 , 12xyz 3 ). Die Divergenz dieses Feldes ist: Gegeben sei das Feld A(x, = ∂Ax + ∂Ay + ∂Az = y 2 + 2y + 36xyz 2. div A ∂x ∂y ∂z 8.3.3 Rechenregeln Für die Divergenz gelten folgende Rechenregeln: (8.46) 190 8 Differentiation von Feldern: grad, div und rot Abbildung 8.9: Die Kraft F auf eine Masse m im Gravitationsfeld der Masse M im Ursprung. y, z) = c gilt: • Für ein konstantes Feld A(x, = 0. div A (8.47) • Summenregel: + B) div (A + B) = ∇·A +∇·B = ∇ · (A + div B. = div A (8.48) • Faktorregel: = αdiv A. div (αA) (8.49) • Produktregel für das Produkt eines Skalarfeldes A mit einem Vektorfeld B: div (AB) = A(∇ · B) +B · ∇A = ∇ · (AB) +B · grad A. = A div B (8.50) Diese Beziehung lässt sich leicht durch explizites Ausführen der partiellen Differentiation verstehen: ∇ · (AB) = = = ∂ABx ∂ABy ∂ABz + + ∂x ∂y ∂z ∂Bx ∂By ∂Bz ∂A ∂A ∂A Bx +A + By +A + Bz +A ∂x ∂x ∂y ∂y ∂z ∂z ∂Bx ∂By ∂Bz ∂A ∂A ∂A + By + Bz + + +A Bx ∂x ∂y ∂z ∂x ∂y ∂z B·∇A = 8.4 A∇·B · ∇A + A∇ · B =B · grad A + A div B. B (8.51) Laplace-Operator Wenn wir den Gradienten eines Skalarfeldes A bilden, erhalten wir das Vektorfeld ∂A ∂A ∂A grad A = ∇A = , , . ∂x ∂y ∂z (8.52) 8 Differentiation von Feldern: grad, div und rot 191 Wenden wir nun den Nabla-Operator auf dieses Vektorfeld an (wir bilden also dessen Divergenz), erhalten wir ∂A ∂x ∂A ∂y ∂A ∂z div grad A = ∇ · (∇A) = ∇ · ∂2A ∂2A ∂2A + + . = ∂x2 ∂y 2 ∂z 2 (8.53) Wir schreiben dafür auch div grad A = ∇2 A = ∆A 2 2 (8.54) 2 ∂ ∂ ∂ und nennen den Operator ∆ = ∂x 2 + ∂y 2 + ∂z 2 den Laplace-Operator. Der Laplace-Operator ist ein Differentialoperator, der zum Beispiel in der Poissongleichung vorkommt, welche das von einer Ladungsverteilung erzeugte elektrische Potential beschreibt. 8.5 Rotation 8.5.1 Definition r ) können wir auch das Neben dem Skalarprodukt des Nabla-Operators mit dem Vektorfeld A( Vektorprodukt von ∇ und A bilden und erhalten dadurch die Rotation (Englisch: curl ) von A: r) = ∇ × A = rot A( ∂ ∂x ∂ ∂y ∂ ∂z Ax × Ay = Az ∂Az ∂y ∂Ax ∂z ∂Ay ∂x − − − ∂Ay ∂z ∂Az ∂x ∂Ax ∂y . (8.55) des Vektorfeldes A ist selbst ein Vektorfeld. Man nennt dieses Feld auch WirDie Rotation rot A belfeld. 8.5.2 Anschauliche Interpretation als lokale Wirbelstärke Zur anschaulichen Interpretation der Rotation (als lokale Wirbelstärke) betrachten wir ein konkretes Beispiel. Wir stellen uns eine Flüssigkeit vor, in der ein Wirbel vorhanden ist. Von oben betrachtet sind die Feldlinien des zugehörigen Geschwindigkeitsfeldes konzentrische Kreise um den Ursprung (siehe Abb. 8.10). Die Geschwindigkeit v der Flüssigkeit am Ort r sei gegeben durch (siehe Abschnitt 2.8.2) v (r) = ω × r. (8.56) wobei ω ein Winkelgeschwindigkeitsvektor mit Betrag |ω | = ω ist und normal zur Zeichenebene steht sowie zum Betrachter hin zeigt. Gemäß Gleichung (8.56) ist die Geschwindigkeit v (r) senkrecht auf r und ω und liegt deshalb in der Zeichenebene. Für alle Entfernungen vom Mittelpunkt bewegt sich die Flüssigkeit mit derselben Winkelgeschwindigkeit ω um den Ursprung. Man nennt so einen Wirbel einen homogenen Wirbel mit der Drehachse durch den Ursprung. Je großer ω ist, umso schneller dreht sich der Wirbel (umso stärker ist er also). Die Rotation dieses Strömungsfeldes ist gemäß der Definition in Gleichung (8.55) gegeben durch: rot v (r) = ∇ × v (r) = ∇ × (ω × r). (8.57) 192 8 Differentiation von Feldern: grad, div und rot Abbildung 8.10: Geschwindigkeitsfeld v = ω × r einer rotierenden Flüssigkeit. Falls wir die z-Achse in Richtung ω legen, haben wir 0 x −ωy × r = 0 × y = ωx ω ω z 0 (8.58) und deshalb ∂ −ωy −ωy ∂x ∂ = ∇ × ωx = ∂y × ωx ∂ 0 0 ∂z ∂ (ωx) − ∂z 0 ∂ = = − ∂z (ωy) 0 , ∂ ∂ 2ω ∂x ωx + ∂y ωy rot v (r) (8.59) das heißt, die Rotation von diesem speziellen Strömungsfeld ist gleich dem doppelten Winkelgeschwindigkeitsvektor ω : rot v = 2ω. (8.60) Wir können die Rotation von v also sowohl nach Richtung als auch nach Größe als eine lokale r ) auch das Wirbelfeld von A( r ). In unserem Wirbelstärke auffassen. Man nennt daher rot A( Beispiel ist rot v konstant, im Allgemeinen ändert sich aber die Rotation rot v von Ort zu Ort. Zur weiteren Veranschaulichung der Rotation betrachten wir eine inhomogene Strömung, in der die Strömungsgeschwindigkeit v (r) vom Ort abhängt. Die in Abb. 8.11 dargestellte Strömung beispielsweise hat ein Geschwindigkeitsprofil, bei dem die Geschwindigkeit in x-Richtung linear mit der y-Koordinate zunimmt, das heißt, die Strömungsgeschwindigkeit ist oben höher als unten. Wir stellen uns nun einen kleinen Quader vor, der mit der Strömung mitschwimmt (etwa einen kleinen Holzblock, der in einem Bach mit der Strömung mittreibt) (siehe Abb. 8.12). Aus der Perspektive des Quaders, also in einem mitbewegten Bezugssystem, bewegt sich die Flüssigkeit oberhalb und unterhalb des Quaders in entgegengesetzte Richtung und verursacht dadurch eine Drehung des Quaders (siehe Abb. 8.13). 8 Differentiation von Feldern: grad, div und rot 193 Abbildung 8.11: Geschwindigkeitsfeld einer Strömung mit linearem Geschwindigkeitsprofil. Abbildung 8.12: Mitschwimmendes Objekt in der Strömung von Abb. 8.11. Wie schnell rotiert nun dieser Quader? Unter der Annahme, dass die Translation des Quaders mit der an seinem Mittelpunkt vorherrschenden Geschwindigkeit v (x, y) erfolgt und die oberen und unteren Seitenflächen sich mit der Strömung mitbewegen, ist die Winkelgeschwindigkeit des Quaders gegeben durch ( ' dy − v x, y − vx x, y + dy x 2 2 , (8.61) ω= dy wobei dy die Kantenlänge des Quaders in y-Richtung ist. Für kleine Quader gilt also ω= ∂vx . ∂y (8.62) Für eine solche Strömung, in der die x-Komponente der Geschwindigkeit linear von der y-Komponente abhängt (man nennt eine solche Strömung eine Scherströmung mit linearem Geschwindigkeitsprofil), vx = γy, (8.63) vy vz = = 0, 0, (8.64) (8.65) x erhalten wir für die Winkelgeschwindigkeit des Quaders ω = ∂v ∂y = γ. Die Konstante γ beschreibt dabei den Anstieg des Geschwindigkeitsprofils. Die Rotation dieses Geschwindigkeitsfeldes ist folglich: ∂ γy 0 0 ∂x ∂ rot v = ∇ × v = ∂y (8.66) × 0 = 0 = 0 = −ω. ∂ ∂z 0 −γ −ω Auch hier ist also die Rotation ein Maß für die lokale Wirbelstärke. (Das Minuszeichen haben wir hier, weil die Rotation in der xy-Ebene in mathematisch negativer Richtung erfolgt.) Die Rotation beschreibt also, wie ein kleines Teilchen rotiert, das mit der Strömung mittreibt. r ) nennt man an der Stelle r wirbelfrei, wenn rot A an der Stelle r verschwindet. Ein Feld A( Beispiel: Wir betrachten wieder das Schwerefeld x GM m F = − 3 · y . (x2 + y 2 + z 2 ) 2 z (8.67) 194 8 Differentiation von Feldern: grad, div und rot Abbildung 8.13: Geschwindigkeitsfeld der Strömung von Abb. 8.11 aus der Perspektive des mitschwimmenden Objekt. Die Rotation dieses Feldes ist rot F = ∇ × F = ∂Fz ∂y ∂Fx ∂z ∂Fy ∂x − − − ∂Fy ∂z ∂Fz ∂x ∂Fx ∂y . (8.68) Die partielle Ableitung ∂Fz /∂y ist gegeben durch: ∂Fz ∂y ∂ z 2y −GM m = −GM mz 5 2 ∂y (x2 + y 2 + z 2 ) 32 (x + y 2 + z 2 ) 2 3GM mzy 3GM mzy . 5 = 2 2 2 r5 2 (x + y + z ) = = 3 − 2 (8.69) Allgemein gilt 3GM mαβ ∂Fα = ∂β r5 für α, β = x, y, z und α = β. (8.70) Das heißt aber, dass ∂Fα ∂Fβ = . ∂β ∂α Infolgedessen verschwinden alle Komponenten der Rotation in Gleichung (8.68): 0 rot F = 0 = 0. (8.71) (8.72) 0 Das Gravitationsfeld ist also wirbelfrei (so wie alle radialen (kugelsymmetrischen) Vektorfelder). 8.5.3 Rechenregeln Für die Rotation gelten folgende Rechenregeln: r ) = c gilt: • Für ein konstantes Feld A( = 0. rot A (8.73) • Summenregel: + B) rot (A + rot B. = rot A (8.74) • Faktorregel: = α(∇ × A) ∇ × (αA) = αrot A). (rot αA (8.75) 8 Differentiation von Feldern: grad, div und rot 195 • Produktregel für Produkt aus Skalar- und Vektorfeld: rot (AB) = + grad A × B. A rot B Diese Regeln ergeben sich einfach durch Anwendung der Regeln Insbesondere haben wir für die letzte Regel: ∂ ABx ∂x ∂ rot (AB) = ∇ × (AB) = ∂y × ABy ∂ ABz ∂z ∂ ∂ (ABz ) − ∂z (ABy ) ∂y ∂ ∂ = ∂z (ABx ) − ∂x (ABz ) = ∂ ∂x (ABy ) ∂A ∂y ∂A ∂z ∂A ∂x ∂A ∂y ∂A ∂z ∂A ∂x − x · Bx + A ∂B ∂z − ∂By · By + A ∂x − · Bz − für die partielle Differentiation. ∂ ∂y (ABx ) z · Bz + A ∂B ∂y − ∂A ∂z ∂A ∂x ∂A ∂y · By ∂A ∂z ∂A ∂x ∂A ∂y ∂By ∂z z · Bz − A ∂B ∂x ∂Bx · Bx − A ∂y · By − A · Bz + · Bx (8.76) ∂By ∂z ∂Bz x A ∂B − A ∂z ∂x ∂B x A ∂xy − A ∂B ∂y z A ∂B ∂y − A = = + A(∇ × B) = grad A × B + A rot B. ∇A × B · Bx − · By − (8.77) Da die Rotation eines Vektorfeldes wieder ein Vektorfeld ist, können wir auch die Rotation eines Wirbelfeldes bilden: = ∇ × (∇ × A). rot (rot A) (8.78) Nach einigen algebraischen Umformungen findet man = ∇(∇ · A) − ∆A ∇ × (∇ × A) (8.79) = grad (divA) − div grad A, rot (rot A) (8.80) oder, anders ausgedrückt, wobei die Anwendung des Laplace-Operators auf ein Vektorfeld komponentenweise definiert ist. 8.5.4 Wirbelfreie und quellenfreie Felder • Ein Gradientenfeld ∇A = ∂A ∂A ∂A , , ∂x ∂y ∂z ist nach dem Satz von Schwarz wirbelfrei: ∂ ∂A ∇ × ∇A = ∂x ∂ ∂y ∂ ∂z × ∂x ∂A ∂y ∂A ∂z = ∂2A ∂y∂z ∂2A ∂z∂x ∂2A ∂x∂y (8.81) − − − ∂2 A ∂z∂y ∂2 A ∂x∂z ∂2A ∂y∂x = 0. (8.82) Umgekehrt gilt auch, dass man in einem einfach zusammenhängenden Gebiet (das ist ein Ge als Gradienten eines Skalarfeldes ϕ darstellen biet ohne “Löcher”) jedes wirbelfreie Feld B kann: =0 ∇×B ⇒ es existiert ein Skalarfeld ϕ sodass : = ∇ϕ. B (8.83) 196 8 Differentiation von Feldern: grad, div und rot Das Skalarfeld ϕ ist nur bis auf eine Konstante bestimmt, da ∇(ϕ + C) = ∇ϕ. (8.84) Dieser Zusammenhang wird in Abschnitt 9.4.3 ausführlich diskutiert. • Ein Wirbelfeld = ∇×A ∂ ∂x ∂ ∂y ∂ ∂z Ax × Ay = Az ∂Az ∂y ∂Ax ∂z ∂Ay ∂x − − − ∂Ay ∂z ∂Az ∂x ∂Ax ∂y (8.85) ist quellenfrei: = ∇ · (∇ × A) ∂ 2 Az ∂ 2 Ay ∂ 2 Ax ∂ 2 Az ∂ 2 Ay ∂ 2 Ax − + − + − = 0. ∂x∂y ∂x∂z ∂y∂z ∂y∂x ∂z∂x ∂z∂y (8.86) als die Rotation eines anderen Es kann gezeigt werden, dass das quellenfreie Feld B dargestellt werden kann: Vekorfeldes A =0 divB ⇒ sodass B = ∇ × A. es existiert ein Vektorfeld A (8.87) wird das Vektorpotential genannt. Es ist nur bis auf den Gradienten eines Skalarfeldes A bestimmt: = ∇ × (A + grad χ). ∇×A (8.88) Die Eichung trägt nicht zum Der Gradient grad χ ist die so genannte Eichung von A. Wirbelfeld bei und kann deshalb benutzt werden, um Nebenbedingungen zu erfüllen. In Abschnitt 9.4.4 werden wir uns näher mit dem Vektorpotential beschäftigen. 8.6 Zusammenfassung Nabla-Operator ∇ Der Nabla-Operator ist ein Differentialoperator, der auf Felder angewandt wird. Je nach Feldart entstehen durch unterschiedliche Anwendung des Nabla-Operators verschiedene Felder: Gradient: Divergenz: Rotation: ∇A(r) r) ∇ · A( r) ∇ × A( (Richtung und Betrag des stärksten Anstiegs), (Quellstärke), (Wirbelstärke). Durch Anwendung der Rechenregeln kann man zeigen: • Gradientenfelder sind wirbelfrei: ∇ × (∇A) = 0. = 0. • Wirbelfelder sind quellenfrei: ∇ · (∇ × A) können als Gradient eines Skalarfeldes ϕ dargestellt werden: • Wirbelfreie Felder A = ∇ϕ falls A = 0. ∇×A (8.89) können als Rotation eines anderen Vektorfeldes B dargestellt werden: • Quellenfreie Felder A =∇×B A falls = 0. ∇·A (8.90) 8 Differentiation von Feldern: grad, div und rot 197 Die zweifache Anwendung des Nabla-Operators ergibt den Laplace-Operator ∇ · (∇A) = ∂2A ∂2A ∂2A + + . ∂x2 ∂y 2 ∂z 2 (8.91) Weiters gelten die folgenden Rechenregeln: × B) ∇(A = × B) ∇ × (A = ∇ × (∇ × A) = ·∇×A −A · ∇ × B, B · ∇)A − B(∇ − (A · ∇)B + A(∇ (B · A) · B), (8.93) − ∆A. ∇(∇A) (8.94) (8.92) 198 8 Differentiation von Feldern: grad, div und rot Kapitel 9 Integration von Feldern: Kurvenund Flächenintegrale Im Kapitel 2 haben wir gesehen, dass wir die bei der Verschiebung eines Körpers verrichtete Arbeit mit Hilfe des Skalarproduktes der angewendeten Kraft F und der vektoriellen Verschiebung r ausdrücken können: W = F · r. (9.1) Wenn wir jedoch den Körper nicht auf einer geraden Linie bewegen beziehungsweise die Kraft entlang des Weges nicht konstant ist, können wir diesen einfachen Ausdruck nicht mehr verwenden (siehe Abb. 9.1). Das wäre etwa bei einem auf einem kurvigen Gleis gezogenen Fahrzeug oder einer Seilbahn der Fall. Wenn wir die gesamte Strecke jedoch in kleine, annähernd gerade Stücke zerlegen, können wir die in jedem kleinen Intervall verrichtete Arbeit mit Hilfe von Gleichung (9.1) berechnen. Abbildung 9.1: Verschiebung eines Körpers entlang eines geradlinigen (links) und eines gekrümmten Weges (rechts). Die Gesamtarbeit ergibt sich dann aus der Summe aller Arbeiten in den Teilstücken. Im Grenzfall unendlich kleiner Intervalle wird diese Prozedur exakt und führt uns auf den Begriff des Kurvenintegrals. Auf ähnliche Weise können wir zum Beispiel auch den Fluss durch eine gekrümmte Fläche als Summe der Flüsse durch viele kleine, annähernd ebene Flächenelemente ausdrücken und gelangen so zum Flächenintegral. Wir werden ferner sehen, wie diese Integrale durch die Sätze von Stokes und Gauß mit der Rotation und Divergenz von Vektorfeldern zusammenhängen. 199 200 9.1 9.1.1 9 Integration von Feldern: Kurven- und Flächenintegrale Kurvenintegrale Definition Ein wichtiges Beispiel für ein Kurvenintegral ergibt sich bei der Berechnung der Arbeit, die geleistet wird, wenn ein Körper in einem Kraftfeld entlang einer gegebenen Kurve verschoben wird. Wir betrachten ein Kraftfeld F (r), zum Beispiel das Gravitationsfeld, das die Kraft beschreibt, die im Punkt r auf einen Körper wirkt. Wir stellen uns nun vor, dass in diesem Kraftfeld der Körper auf einer vorgegebenen Kurve C vom Punkt ra zum Punkt rb verschoben wird (siehe Abb. 9.2). Abbildung 9.2: Ein Körper wird im Kraftfeld F (r) entlang eines gekrümmten Weges von ra nach rb verschoben. An jedem Punkt entlang dieses Weges herrscht eine bestimmte Kraft F , die Arbeit verrichtet. Zur Berechnung dieser Arbeit können wir nun nicht den Ausdruck W = F · s aus Kapitel 2 verwenden, weil sich die Kraft sowohl in Betrag als auch in Richtung entlang des Weges ändern kann und der Weg im Allgemeinen nicht geradlinig ist. Um die gesamte Arbeit zu ermitteln, die bei Verschiebung des Körpers von ra nach rb geleistet wird, zerlegen wir den Weg C in N kleine, gerade Stücke ∆ri , die sich aus den Differenzen ∆ri = ri+1 − ri , i = 0, . . . N − 1 auf der Kurve liegender Punkte ri ergeben (siehe Abb. 9.3). Durch Wahl einer genügend großen Zahl N kann die Kurve C durch die geraden Segmente ∆ri beliebig gut angenähert werden. Abbildung 9.3: Durch Zerlegen des Weges in viele kurze und annähernd gerade Teilstücke ∆ri können wir die geleistete Arbeit als ein Wegintegral ausdrücken. Für eine genügend feine Zerlegung, das heißt, für genügend kleine Kurventeilstücke ∆ri , können wir die Kraft F in jedem Teilstück als konstant betrachten. Daher kann die im Teilstück i geleistete Arbeit ∆Wi als das bekannte Skalarprodukt der Kraft F (ri ) am Ort ri mit der kleinen Verschiebung ∆ri geschrieben werden: ∆Wi = F (ri ) · ∆ri . (9.2) Die insgesamt geleistete Arbeit ist die Summe der in den Teilstücken geleisteten Arbeiten ∆Wi W ≈ N −1 i=0 ∆Wi = N −1 F (ri ) · ∆ri . (9.3) i=0 Im Grenzwert unendlich kleiner (und unendlich vieler) Wegstücke ∆ri erhalten wir den exakten 9 Integration von Feldern: Kurven- und Flächenintegrale 201 Wert der im Kraftfeld F (r) auf dem vorgegebenen Weg geleisteten Arbeit: W = lim N →∞ N −1 % F (ri ) · ∆ri = F (r) · dr. (9.4) C i=0 Wir nennen dies das Kurvenintegral (oder Linienintegral) des Vektorfeldes F längs der Raumkurve C. (Wir können das Kurvenintegral für ein beliebiges Vektorfeld definieren, nicht nur für die Kraft F .) Oft schreibt man für das Kurvenintegral auch: %rb %rb F (r) · dr W = F (r) · dr. oder W = ra (9.5) ra ,C Abbildung 9.4: Bei einem geschlossenen Weg C sind Ausgangspunkt ra und Endpunkt rb identisch: ra = rb . Falls ra = rb , die Kurve C also geschlossen ist (siehe Abb. 9.4), schreibt man für das Integral : F (r) · dr = Zc (9.6) C und nennt es die Zirkulation von F entlang C oder auch das geschlossene Kurvenintegral oder Ringintegral. 9.1.2 Eigenschaften Da im oben definierten Kurvenintegral der Ausdruck, über den integriert wird, ein Skalarprodukt ist, ist das Kurvenintegral selbst auch ein Skalar. Wenn man bei einem Kurvenintegral den Integrationsweg umkehrt (also den Integrationsweg in umgekehrter Richtung durchläuft), ändert sich das Vorzeichen des Integrals % % F (r) · dr = − F (r) · dr, (9.7) C −C wobei −C den in umgekehrter Richtung durchlaufenen Integrationsweg bezeichnet. Diese Eigenschaft folgt daraus, dass bei einer Umkehrung des Integrationsweges alle ∆ri ihr Vorzeichen wechseln und somit das Kurvenintegral selbst auch sein Vorzeichen wechselt. Abbildung 9.5: Der Weg C besteht aus den beiden Teilwegen C1 und C2 . 202 9 Integration von Feldern: Kurven- und Flächenintegrale Ferner ist das Kurvenintegral additiv, das heißt das Kurvenintegral über einem aus zwei Teilstücken C1 und C2 bestehenden Weg C ist die Summe der Kurvenintegrale über C1 und C2 : % % % F (r) · dr = F (r) · dr + F (r) · dr. (9.8) C C1 C2 Wenn also die Zirkulation ZC entlang eines geschlossenen Weges C verschwindet, sind die Kurvenintegrale entlang der beiden Kurven C1 und C2 , die die beiden Punkte ra und rb miteinander verbinden, gleich (siehe Abb. 9.6): % % % % : F (r) · dr = F (r) · dr + F (r) · dr = F (r) · dr − F (r) · dr. (9.9) ZC = C −C2 C1 C1 C2 Da aber ZC = 0, folgt: % % F (r) · dr = C1 F (r) · dr. (9.10) C2 Abbildung 9.6: Die Punkte ra und rb liegen auf einer geschlossenen Kurve. Man kann sowohl über die Kurve C1 als auch über die Kurve C2 von ra nach rb gelangen. 9.1.3 Berechnungsverfahren Um Kurvenintegrale auszuwerten, führen wir sie auf gewöhnliche Integrale zurück. Falls die Kurve C in Parameterform gegeben ist, das heißt, falls der Ortsvektor x(t) r(t) = y(t) (9.11) z(t) als Funktion eines Parameters t im Bereich ta ≤ t ≤ tb gegeben ist, können wir das Kurvenintegral in ein einfaches Integral über den Parameter t verwandeln. In diesem Fall entspricht jeder Punkt ri = r(ti ) in der Zerlegung der Kurve einem bestimmten Parameterwert ti . Die beiden Randpunkte der Kurve, ra und rb , erhalten wir für die Parameterwerte ta und tb : ra = r(ta ) und rb = r(tb ). (9.12) Jedes gerade Teilstück ∆ri = ri+1 − ri entspricht dann einem Teilintervall ∆ti = ti+1 − ti des Parameters. In der Summe in Gleichung (9.3) dividieren und multiplizieren wir nun jeden Term mit ∆ti und erhalten dadurch: W ≈ N −1 i=0 F (ri ) · ∆ri = N −1 i=0 ∆ri F (ri ) · ∆ti . ∆ti (9.13) 9 Integration von Feldern: Kurven- und Flächenintegrale 203 Im Grenzfall N → ∞ wird aus ∆ri /∆ti die Ableitung des Ortsvektors nach dem Parameter t: lim N →∞ dr(t) ∆ri = . ∆ti dt (9.14) Damit wird das Linienintegral zu %tb F (r(t)) · W = dr dt dt. (9.15) ta Dieses Integral ist ein gewöhnliches Integral, dessen Integrand, der Skalar F (r(t)) · (dr /dt), eine Funktion des Parameters t ist. Dabei beinhaltet der Vektor dr(t)/dt, der in jedem Punkt tangential zur Kurve ist, die Information über den Verlauf der Kurve (siehe Abb. 9.7). (Wenn man den Vektor dr(t)/dt normiert, erhält man den Tangentialvektor t = (dr (t)/dt)/|dr(t)/dt|.) Falls t die Zeit ist, ist dr(t)/dt = v (t) die Geschwindigkeit des Körpers, der sich gemäß r(t) entlang C bewegt. Abbildung 9.7: Der Geschwindigkeitsvektor dr(t)/dt ist tangential zur Kurve r(t). Aus dieser Darstellung des Linienintegrals ergibt sich folgendes Rezept zur Berechnung von Linienintegralen in Parameterform: 1. Zunächst drücken wir den Feldvektor F (r) durch Einsetzen der parameterabhängigen Koordinaten x(t), y(t) und z(t) als Funktion des Parameters t aus. 2. Dann differenzieren wir den Vektor r(t) nach t und bilden das Skalarprodukt F (r(t))·(dr /dt). 3. Schließlich integrieren wir dieses Skalarprodukt, das nur mehr eine Funktion von t ist, in den Grenzen von ta bis tb . Beispiel: Wir bestimmen das Integral des Feldes F (x, y) = (2x + y, x) entlang der in Parameterform gegebenen Kurve r(t) = (t, t2 ) (das ist eine Parabel) zwischen den Punkten, die zu den Parametern ta = 0 und tb = 1 gehören. Die Kurve beginnt im Ursprung, r(ta = 0) = (0, 0), und endet im Punkt r(tb = 1) = (1, 1). Der Feldvektor als Funktion von t ist gegeben durch: 2 2x(t) + y(t) 2t + t F (x(t), y(t)) = = . (9.16) x(t) t Ableitung des Ortsvektors nach t liefert dr = dt 1 2t (9.17) 204 9 Integration von Feldern: Kurven- und Flächenintegrale Abbildung 9.8: Eine Kraft F (r) verrichtet Arbeit entlang einer Parabel. und somit dr F · = dt 2t + t2 t 1 2t · = 2t + t2 + 2t2 = 2t + 3t2 . (9.18) Das Kurvenintegral ist deshalb gegeben als: %tb % F (r) · dr = C dr F · dt %1 !1 3t3 !! 2t2 + (2t + 3t )dt = = 1 + 1 = 2. 2 3 !0 2 dt = ta 0 (9.19) Falls die Integrationskurve C nicht in Parameterform vorliegt, können wir folgendermaßen vorgehen. In der Summe in Gleichung (9.3) lässt sich jedes Teilstück und der dazugehörige Vektor F (ri ) in Komponenten zerlegen: ∆ri = ∆xiex + ∆yiey + ∆ziez (9.20) und F (ri ) = Fx (ri )ex + Fy (ri )ey + Fz (ri )ez . (9.21) Das Skalarprodukt F (ri ) · ∆ri können wir somit schreiben als F (ri ) · ∆ri = Fx (ri )∆xi + Fy (ri )∆yi + Fz (ri )∆zi (9.22) und die Summe in Gleichung (9.3) besteht somit aus drei Termen, die zu den drei Koordinatenrichtungen gehören: W ≈ Fx (ri )∆xi + Fy (ri )∆yi + Fz (ri )∆zi . (9.23) Im Grenzwert einer unendlich feinen Zerlegung des Integrationsweges in Teilstücke erhalten wir daraus die Summe dreier gewöhnlicher Integrale: %xb W = %yb Fx (r)dx + xa %zb Fy (r)dy + ya %xb = za %yb Fx (x, y, z)dx + xa Fz (r)dz %zb Fy (x, y, z)dy + ya Fz (x, y, z)dz. (9.24) za Das Problem ist hier, dass die Integranden von allen drei Variablen x, y und z abhängen und nicht nur von der jeweiligen Integrationsvariablen. Betrachten wir zum Beispiel das erste Integral. Hier 9 Integration von Feldern: Kurven- und Flächenintegrale 205 &Abbildung 9.9: Räumliche Kurve und ihre Projektion in die xy-Ebene. Bei der Berechnung von Fx (r)dx müssen sowohl y als auch z als Funktion von x ausgedrückt werden. gehören zu jedem x-Wert auch wohldefinierte Werte von y und z (siehe Abb. 9.9). Diese hängen von der Gestalt der Integrationskurve ab. Falls wir nun y und z mit Hilfe der Kurve als Funktion von x ausdrücken, erhalten wir für das erste Integral %xb Fx (x, y(x), z(x))dx, (9.25) xa ein gewöhnliches Integral über x. (Falls wir y und z aus Eindeutigkeitsgründen nicht als Funktion von x ausdrücken können, zerlegen wir die Integrationskurve in Teilbereiche, sodass dies möglich ist.) Mit den anderen beiden Integralen verfahren wir analog und erhalten schließlich %xb %yb Fx (x)dx + W = xa %zb Fy (y)dy + ya Fz (z)dz, (9.26) za wobei Fx (x) = Fx (x, y(x), z(x)), Fy (y) = Fy (x(y), y, z(y)) und Fz (z) = Fz (x(z), y(z), z). Die Information über die Gestalt der Kurve C ist nun in den Funktionen Fx (x), Fy (y) und Fz (z) enthalten. Beispiel: Wir berechnen wieder das Kurvenintegral aus dem letzten Beispiel. Hier war F (x, y) = (2x + y, x) (9.27) und die Kurve war gegeben durch r(t) = (t, t2 ) oder, in nichtparametrischer Form, durch y = x2 . Für das Kurvenintegral haben wir also: %xb %yb Fx (x, y)dx + W = xa Fy (x, y)dy, (9.28) ya wobei gemäß Angabe xa = ya = 0 und xb = yb = 1. Da wir mit y = x2 keine Eindeutigkeitsprobleme haben, können wir im ersten Term y und im zweiten Term x durch die jeweilige 206 9 Integration von Feldern: Kurven- und Flächenintegrale Integrationsvariable ausdrücken: %xb %yb 2 W = Fx (x, x )dx + xa √ Fy ( y, y)dy. (9.29) ya Unter Berücksichtigung von F (x, y) = (Fx (x, y), Fy (x, y)) = (2x + y, x) erhalten wir %1 %1 2 (2x + x )dx + W = 0 √ ydy = 2x2 x3 + 2 3 0 !1 !1 ! ! ! + 2 y 23 ! = 1 + 1 + 2 = 2, ! 3 !0 3 3 0 (9.30) was mit dem Resultat aus dem vorherigen Beispiel, bei dem eine Parameterdarstellung der Kurve verwendet wurde, übereinstimmt. 9.1.4 Kurvenintegrale über Gradientenfelder & Kurvenintegrale der Form C F (r) · dr hängen im Allgemeinen sowohl vom Vektorfeld F als auch von der Integrationskurve C ab (insbesondere von deren Anfangs- und Endpunkt). Unter gewissen & Umständen kann es jedoch vorkommen, dass das Kurvenintegral C F (r) · dr nur vom Kraftfeld selbst und den Endpunkten ra und rb abhängt, nicht aber von der Form des Weges, der ra und rb verbindet. Wir wollen uns in diesem Abschnitt mit der Frage beschäftigen, unter welchen Bedingungen dies der Fall ist. Als Beispiel betrachten wir das Linienintegral im Kraftfeld F (r) = 2r = (2x, 2y, 2z) und verbinden den Anfangspunkt ra = (0, 0, 0) mit dem Endpunkt rb = (1, 1, 1) durch drei unterschiedliche Kurven C1 , C2 und C3 (siehe Abb. 9.10): C1 : C2 : C3 : Gerade von (0,0,0) nach (1,1,1), Polygonzug (0, 0, 0) → (1, 0, 0) → (1, 1, 0) → (1, 1, 1), Parabelbogen von (0,0,0) nach (1,1,1). Für die Kurve C1 ist die Parameterdarstellung dr = (1, 1, 1) und ta = 0, tb = 1. dt (9.31) !1 %1 2t 1 6t2 !! · dt = 6tdt = = 3. 2t 1 2 !0 0 2t 1 (9.32) r(t) = (t, t, t) also ist Das Kurvenintegral lautet somit % %1 F (r) · dr = C2 0 Entlang der Kurve C2 erhalten wir %1 % F (r) · dr = C2 %1 2xdx 0 + %1 2ydy 0 + 2zdz 0 r(x)=(x,0,0) x als Parameter r(y)=(1,y,0) y als Parameter r(z)=(1,1,z) z als Parameter !1 2x2 !! =3 = 3. 2 !0 Die Parabel C3 ist in Parameterform gegeben durch: r(t) = (t, t, t2 ), d. h. d r dt (9.33) = (1, 1, 2t) und somit 9 Integration von Feldern: Kurven- und Flächenintegrale 207 Abbildung 9.10: (a) Integrationsweg C1 , (b) Integrationsweg C2 und (c) Integrationsweg C3 . gilt %1 2t 1 2t · 1 dt = (4t + 4t3 )dt 0 0 2t2 2t ! 2 4 !1 4t 4t ! = 2 + 1 = 3. + 2 4 !0 % %1 F (r) · dr = C3 = (9.34) Das heißt, für alle drei Wege C1 , C2 und C3 erhalten wir den selben Wert für das Kurvenintegral. Es stellt sich nun die Frage, ob auch für andere Wege das Kurvenintegral dasselbe ist. Die Antwort auf diese Frage ist ja, denn wir können das Integral schreiben als: % % F (r) · dr 2r · dr = = C = % C rb2 − ra2 2 C = 3. !rb ! 2! d(r ) = r ! ra (9.35) Hier kommt es also nur auf den Anfangspunkt ra und den Endpunkt rb der Kurve an. Für das spezielle Vektorfeld F (r) = 2r ist also offensichtlich das Kurvenintegral unabhängig vom Weg. Welche Bedingung erfüllen Kraftfelder, für die das der Fall ist? Um diese wichtige Frage zu beantworten, gehen wir zunächst davon aus, dass ein bestimmtes r ) die Eigenschaft besitzt, dass das Kurvenintegral nicht von der Form der Kurve C Vektorfeld A( abhängt sondern nur von den beiden Punkten ra und rb , die von der Kurve C verbunden werden. Wir stellen uns also vor, dass es viele verschiedene Wege C1 , C2 , C3 , usw. gibt (siehe Abb. 9.11), die alle von ra nach rb verlaufen und alle das gleiche Kurvenintegral liefern, dessen Wert wir φ nennen: % % r ) · dr = . . . . A(r) · dr = A( (9.36) φ= C1 C2 Obwohl das Kurvenintegral φ nicht von der Form der Kurve abhängt, hängt es sehr wohl von dessen Anfangs- und Endpunkt ab. Wir wollen uns nun überlegen, wie genau φ von ra und rb abhängt. Es genügt dabei, die Abhängigkeit vom Endpunkt rb zu betrachten. Wenn wir die Abhängigkeit vom Ausgangspunkt ermitteln wollen, drehen wir einfach die Richtung der Wege um und machen so Endpunkte zu Anfangspunkten. Der Einfachheit halber nennen wir den Endpunkt der Wege jetzt r (statt rb ) und betrachten die Abhängigkeit von φ von r, wobei wir den Anfangspunkt ra festhalten: %r q ) · dq. A( φ(r ) = ra (9.37) 208 9 Integration von Feldern: Kurven- und Flächenintegrale Abbildung 9.11: Alle Integrationswege (C1 , C2 , C3 und C4 ) verbinden ra mit rb und führen zum & r ) · dr. selben Kurvenintegral Ci A( Hier haben wir die Integrationsvariable in q umgetauft, um Verwechslungen zu vermeiden. (Der Name einer Integrationsvariablen spielt keine Rolle, sollte sich jedoch von den Namen der anderen Variablen unterscheiden.) Abbildung 9.12: Durch Verschiebung des Kurvenendpunktes von r nach r + ∆r ändert sich die r ) · ∆r. Funktion φ(r) näherungsweise um ∆φ(r) = A( Um herauszufinden, wie genau φ(r ) von r abhängt, verschieben wir r um einen kleinen Vektor ∆r (siehe Abb. 9.12). Wie ändert sich nun φ(r), wenn wir den Endpunkt von r nach r +∆r verschieben? Falls der Weg C2 von ra nach r + ∆r nicht durch r geht, können wir ihn so verbiegen, dass er das tut. Laut Voraussetzung ändert das ja nicht den Wert φ(r + ∆r), weil das Kurvenintegral unabhängig von der Form des Weges ist. Wir können jetzt φ(r + ∆r) ausdrücken als Summe von zwei Kurvenintegralen, nämlich einem von ra bis r entlang C2 und einem von r nach r + ∆r entlang C2 : % % q ) · dq = A( φ(r + ∆r) = C2 r% +∆ r C2 q ) · dq + A( q ) · dq. A( (9.38) r,C2 Das erste Integral auf der rechten Seite ist jedoch gleich φ(r ) (laut Voraussetzung spielt es ja keine Rolle, ob wir über C1 oder C2 integrieren). Somit erhalten wir r% +∆ r q ) · dq. A( φ(r + ∆r) = φ(r ) + (9.39) r r ) nicht entlang der kurzen Strecke von r nach Falls ∆r sehr klein ist, ändert sich der Vektor A( 9 Integration von Feldern: Kurven- und Flächenintegrale 209 r + ∆r. Also können wir in diesem Fall das Integral in der obigen Gleichung annähern durch r ) · ∆r und wir erhalten schließlich: A( r ) · ∆r. φ(r + ∆r) − φ(r) ≈ A( (9.40) Die linke Seite ist aber (für ∆r → 0) das totale Differential φ der Funktion φ(r), das wir als dφ = grad φ · dr (9.41) ausdrücken können. Im Limes kleiner Verschiebungen dr gilt also r ) · dr = grad φ · dr. A( (9.42) Da diese Beziehung für jede beliebige Verschiebung dr gilt, folgt schließlich r ). grad φ(r ) = A( (9.43) nur vom Anfangs- und Endpunkt des Weges, Wenn also das Kurvenintegral über ein Vektorfeld A nicht aber von der Form des Weges abhängt, dann ist das Vektorfeld durch den Gradienten eines skalaren Feldes darstellbar. Das heißt, es existiert in diesem Fall ein geeignetes skalares Feld φ(r), = grad φ. Die Wahl der Konstanten ist das bis auf eine additive Konstante bestimmt ist, sodass A der Wahl des Anfangspunktes ra äquivalent. Die Darstellbarkeit eines Vektorfeldes als Gradient eines skalaren Feldes ist also eine notwendige Bedingung für die Unabhängigkeit des Kurvenintegrals von der Form des Weges. Bemerkenswer als Gradient terweise ist es auch eine hinreichende Bedingung. Wenn nämlich das Vektorfeld A eines skalaren Feldes dargestellt werden kann, das heißt, wenn A = grad φ, dann gilt für das Kurvenintegral: %rb %rb r ) · dr = A( ra ,C %rb grad φ · dr = ra ,C dφ = φ(rb ) − φ(ra ). (9.44) ra ,C Das Integral hängt somit nur vom Anfangs- und vom Endpunkt ab. Wir erhalten also folgenden Satz: r ) sind genau dann (und nur dann) vom Weg unabhängig, Kurvenintegrale über ein Vektorfeld A( = grad φ. Legt man φ an einer Stelle ra fest, ist φ wenn eine Funktion φ(r) existiert, sodass A eindeutig bestimmmt. Die Funktion φ wird Potential genannt. (In der Physik bezeichnet man meistens −φ als das nennt man Potential. Die potentielle Energie in der Mechanik ist ein Beispiel dafür.) Das Feld A auch ein konservatives Vektorfeld. Wie man einem Vektorfeld A ansehen kann, ob wir es als Gradientenfeld darstellen können, werden wir im Abschnitt 9.4 sehen. Aus dem obigen Satz folgt, dass genau dann geschlossene Kurvenintegrale über das Vektorfeld A verschwinden, wenn ; sich das Vektorfeld A als Gradient eines skalaren Feldes φ darstellen lässt. r ) · dr kann nämlich durch Wahl zweier beliebiger Punkte ra und rb auf der Das Ringintegral C A( Kurve C in zwei Teile zerlegt werden, die den Wegen C1 und C2 entsprechen (siehe Abb. 9.13): % % : r ) · dr. A(r) · dr = A(r) · dr + A( (9.45) C C1 C2 Wir durchlaufen nun C2 in entgegengesetzter Richtung und drehen damit das Vorzeichen des zweiten Integrals um: : % % r ) · dr. A(r) · dr = A(r) · dr − A( (9.46) C C1 −C2 210 9 Integration von Feldern: Kurven- und Flächenintegrale Abbildung 9.13: Durch Wahl zweier Punkte ra und rb zerlegen wir das Ringintegral in zwei Linienintegrale entlang C1 und C2 . Da aber C1 und −C2 Anfangs- und Endpunkt gemeinsam haben und laut Voraussetzung das nicht von der Form des Weges abhängt, sind die beiden Integrale auf der Kurvenintegral über A rechten Seite der obigen Gleichung gleich. Demzufolge verschwindet das Ringintegral: : r ) · dr = 0. A( (9.47) C 9.2 9.2.1 Oberflächenintegrale Definition Im Kapitel 2 haben wir gesehen, dass wir das pro Zeiteinheit durch eine Fläche strömende Flüssigkeitsvolumen, also den Fluss, als Skalarprodukt des die Strömung beschreibenden Geschwindigkeitsvektors v und des Flächenvektors f darstellen können (siehe Abb. 9.14): φ = Fluss = f · v . (9.48) Dabei sind wir davon ausgegangen, dass die Fläche eben ist und der Geschwindigkeitsvektor v nicht vom Ort abhängt (ein solches Vektorfeld nennt man homogen). Abbildung 9.14: Homogenene Strömung durch eine ebene Fläche mit Flächenvektor f. Abbildung 9.15: Inhomogene durch eine gekrümmte Fläche. Strömung Wie können wir nun dieses Ergebnis auf eine beliebige, räumlich (und möglicherweise zeitlich) veränderliche Strömung durch eine gekrümmte Fläche verallgemeinern (siehe Abb. 9.15)? In diesem 9 Integration von Feldern: Kurven- und Flächenintegrale 211 Fall wird die Strömungsgeschwindigkeit durch ein Vektorfeld v (r) beschrieben und die Fläche F kann nicht durch einen einzelnen Flächenvektor dargestellt werden. Um den Fluss durch diese (wirkliche oder gedachte) Fläche F zu berechnen, gehen wir in Analogie zum Kurvenintegral vor, bei dem wir eine Kurve in kleine Teilstücke ∆ri eingeteilt haben, und zerlegen die Fläche F in viele kleine Teilstücke, die wir durch ebene Flächenstücke ∆fi , die so genannten Facetten, approximieren (siehe Abb. 9.16). In der Praxis benötigen wir natürlich eine analytische Darstellung dieser Facetten. Hier wollen wir zunächst jedoch nur davon ausgehen, dass wir eine solche Zerlegung in Facetten durchführen können, ohne auf ihre spezifische analytische Darstellung einzugehen. Für jede der Facetten, die wir mit dem Index i nummerieren, definieren wir nun einen Flächenvektor ∆f(ri ), dessen Betrag gleich dem Flächeninhalt der Facette um den Punkt ri ist und der normal auf diese Facette steht. Der Punkt ri ist ein beliebiger Punkt im Inneren der i-ten Facette. Abbildung 9.16: Zerlegung der Fläche F in kleine Facetten mit Flächenvektoren ∆fi . Wir wählen die Facetten so klein, dass das Vektorfeld innerhalb jeder Facette näherungsweise konstant ist. Das heißt, innerhalb der Facette um ri mit dem Flächenvektor ∆f(ri ) ist das Vektorfeld konstant und gleich v (ri ). Wir können nun den Fluss durch das Flächenelement ∆fi als Skalarprodukt berechnen: ∆φi = v (ri ) · ∆f(ri ). (9.49) Der Gesamtfluss φ durch die Fläche F ergibt sich als Summe aller Teilflüsse: φ≈ N v (ri ) · ∆f(ri ). (9.50) i=1 Im Limes unendlich vieler (N → ∞) und unendlich kleiner Facetten wird aus dieser Summe ein Flächenintegral: % N φ = lim v (ri ) · ∆f(ri ) = v (r) · df(r). (9.51) N →∞ F i=1 r ) definiert werden (nicht nur für ein StrömungsFlächenintegrale können für beliebige Vektorfelder A( feld v (r)): % % % % A(r) · df (r) = Ax dfx + Ay dfy + Az dfz . (9.52) φ= F F F F Oft ist es notwendig, ein Flächenintegral über einer geschlossenen Fläche F (zum Beispiel die Oberfläche einer Kugel) zu berechnen. Wir bezeichnen ein solches Integral mit : · df A (9.53) F und definieren die Flächennormalen üblicherweise so, dass sie aus dem geschlossenen Gebiet herauszeigen. 212 9 Integration von Feldern: Kurven- und Flächenintegrale 9.2.2 Darstellung der Fläche und des Flächenelements In der praktischen Berechnung von Oberflächenintegralen ist es notwendig, eine analytische Darstellung der Fläche im Raum zu wählen. In kartesischen Koordinaten können wir, wie wir bereits früher gesehen haben, Flächen im Raum darstellen, indem wir jedem Punkt der xy-Ebene eine z-Koordinate zuordnen, z = z(x, y) (siehe Abb. 9.17). Die Fläche F besteht dann aus den Punkten (x, y, z(x, y)), wobei x und y aus einem bestimmten Definitionsbereich D der xy-Ebene stammen (nämlich der Projektion der Fläche F in die xy-Ebene). Abbildung 9.17: Die Fläche F wird durch die Funktion z = z(x, y) beschrieben. Abbildung 9.18: Da zu einem Punkt (x, y) in der xy-Ebene mehr als ein Punkt auf der Fläche existiert, muss die Fläche in die zwei Teilflächen F1 und F2 zerlegt werden. Falls es zu einem Punkt (x, y) mehr als einen z-Wert gibt (siehe Abb. 9.18), muss die Fläche in mehrere Teilflächen Fi zerlegt werden. Beispiel: Abbildung 9.19: Die Oberfläche der Kugel besteht aus den zwei Halbkugeln F1 und F2 . In kartesischen Koordinaten kann die Oberfläche einer Kugel mit Radius R und Mittelpunkt im Ursprung durch die zwei Teilflächen F1 mit positiven z-Werten und F2 mit negativen z-Werten dargestellt werden (siehe Abb. 9.19): F1 : (x, y, + R2 − (x2 + y 2 )), (9.54) 2 2 2 F2 : (x, y, − R − (x + y )). (9.55) 9 Integration von Feldern: Kurven- und Flächenintegrale 213 Der Definitionsbereich in der xy-Ebene ist hier ein Kreis mit Radius R und Mittelpunkt im Ursprung. Bis jetzt haben wir x und y als die freien Parameter gewählt. Wir könnten aber Flächen genauso gut mit (y, z) oder (x, z) als freien Parameter wählen. Allgemeiner können wir eine Fläche F durch einen Ortsvektor r(u, v) beschreiben, der von zwei Parametern u und v abhängt: x(u, v) r = r(u, v) = y(u, v) . (9.56) z(u, v) Im Falle der kartesischen Darstellung gilt u = x, v = y (falls x und y als Parameter verwendet werden). Diese allgemeine Parameterdarstellung ist analog zur Parameterdarstellung einer Kurve. Da eine Kurve im Raum jedoch ein eindimensionales Objekt ist, genügt in diesem Fall ein einziger Parameter. Abbildung 9.20: Auf der Mantelfläche eines Zylinders mit Radius ρ = R können die Zylinderkoordinaten ϕ und z beliebige Werte annehmen. Oberflächenintegrale werden einfacher, wenn ein Koordinatensystem mit geeigneter Symmetrie gewählt wird. Wollen wir zum Beispiel die Oberfläche eines unendlich langen Zylinders beschreiben, sind Zylinderkoordinaten (ϕ, ρ, z) zweckmäßig (siehe Kapitel 2). Für die Mantelfläche eines Zylinders mit Radius R gilt (siehe Abb. 9.20): ρ = const = R, ϕ, z beliebig (0 ≤ ϕ < 2π, −∞ < z < ∞). (9.57) Hier spielen ϕ und z die Rolle der Parameter u und v. Die Fläche wird von einem Netz aus so genannten Parameterlinien überdeckt, auf denen ϕ beziehungsweise z konstante Werte annehmen. Ein weiteres Beispiel ist die Darstellung der Kugeloberfläche in den Kugelkoordinaten (r, ϑ, ϕ) (siehe Kapitel 2). Die Oberfläche einer Kugel mit Radius R ist definiert durch (siehe Abb. 9.21): r = const = R, ϕ, ϑ beliebig in (0 ≤ ϕ < 2π, 0 ≤ ϑ ≤ π). (9.58) Hier werden Orte auf der Kugeloberfläche durch Angabe der beiden Parameter ϕ und ϑ definiert. Die Parameterlinien sind die Längen- und Breitengrade. 214 9 Integration von Feldern: Kurven- und Flächenintegrale Abbildung 9.21: Auf der Oberfläche einer Kugel mit Radius r = R können die Kugelkoordinaten ϕ und ϑ beliebige Werte annehmen. 9.2.3 Das Flächenelement Neben einer analytischen Darstellung der Oberfläche ist zur Berechnung von Oberflächenintegralen auch die Darstellung des Oberflächenelements df der Fläche F notwendig. Dann kann das Oberflächenintegral auf ein gewöhnliches Doppelintegral zurückgeführt werden. In kartesischen Koordinaten können wir die Fläche F in kleine Facetten zerlegen, indem wir zum Beispiel die Projektion D von F auf die xy-Ebene in kleine Rechtecke der Kantenlänge ∆x und ∆y einteilen (siehe Abb. 9.22). Abbildung 9.22: Das Flächenelement ∆f der Oberfläche F ist gegenüber der z-Achse um den Winkel α geneigt. Durch die Wahl kleiner Rechtecke kann die Projektion D beliebig genau durch Rechtecke angenähert werden. Die Zerlegung der Projektion in kleine Rechtecke erzeugt auch eine Zerlegung der Fläche F in kleine Facetten mit Fläche ∆f . Da diese Facetten gegenüber der xy-Ebene geneigt sein können, unterscheidet sich der Flächeninhalt der Facetten im Allgemeinen vom Flächeninhalt der Rechtecke in der xy-Ebene. Diese Neigung muss in der Ermittlung der Flächenelemente berücksichtigt werden. Für die Projektion eines Flächenelements mit dem Flächenvektor ∆f auf die xy-Ebene gilt (wir werden später sehen, wie wir die Richtung von ∆f ermitteln können): ∆f · ez = ∆x∆y. (9.59) 9 Integration von Feldern: Kurven- und Flächenintegrale 215 Falls die Facette horizontal ist, ist ∆f parallel zur z-Achse und ∆f · ez = ∆f (ez ist der Einheitsvektor in z-Richtung). Der Flächeninhalt des Flächenelements ist in diesem Fall gleich dem Flächeninhalt seiner Projektion. Schließt ∆f jedoch mit der z-Achse den Winkel α ein, ist die Projektion in die xy-Ebene flächenmäßig kleiner als das Flächenelement. Abbildung 9.23: Die Fläche der Projektion des Flächenelements ist gegenüber der Fläche des Flächenelements um den Faktor cos α vermindert. Die Fläche der Projektion ist um den Faktor cos α gegenüber der Fläche des Flächenelements verringert (siehe Abb. 9.23) und daher gilt: ∆f cos α = ∆x∆y, (9.60) ∆f· ez was wegen ∆f · ez = ∆f cos α genau der vorherigen Gleichung entspricht. Das heißt, für ein bestimmtes Rechteck um den Punkt (x, y) in der xy-Ebene ist die Fläche des zugehörigen Flächenelements gegeben durch ∆f = ∆x∆y ∆x∆y = , cos α n(x, y, z(x, y)) · ez (9.61) wobei n = ∆f/∆f der Einheitsnormalenvektor auf das Flächenelement im Punkt (x, y, z(x, y)) ist. Wir müssen nun noch den Normalenvektor n(x, y, z(x, y)) bestimmen. Dazu benutzen wir die Tatsache, dass der Gradient einer Funktion g(x, y, z) normal auf die durch g(x, y, z) =const definierten Niveauflächen steht. Wir können nun die Fläche F , die aus den Punkten (x, y, z = f (x, y)) (wir haben hier die Funktion f eingeführt, um die Variable z von der Funktion z(x, y) zu unterscheiden) besteht, auffassen als eine Niveaufläche der Funktion g(x, y, z) = z − f (x, y). (9.62) Die Fläche F ist nämlich wegen z = f (x, y) genau jene Niveaufläche von g, für die gilt: g(x, y, z) = 0. (9.63) Der Normalenvektor n im Punkt (x, y, z(x, y)) ist also gegeben durch n = Der Gradient ∇g lautet ∇g = grad g ∇g = . |grad g| |∇g| ∂g ∂x ∂g ∂y ∂g ∂z − ∂f ∂x ∂f = − ∂y und somit erhalten wir für den Normalenvektor (9.64) (9.65) 1 − ∂f ∂x 1 ∂f n = " 2 2 − ∂y . 1 + ∂f + ∂f 1 ∂x ∂y (9.66) 216 9 Integration von Feldern: Kurven- und Flächenintegrale Mit Hilfe dieses Normalenvektors können wir nun den Flächenvektor ∆f ausdrücken als − ∂f ∂x 1 ∆x∆y ∆x∆y ∂f " n = 1 2 2 − ∂y q n · ez 2 ∂f 2 1+( ∂f 1 + ∂f + ∂f 1 ∂x ) +( ∂y ) ∂x ∂y ∂f − ∂x . ∆x∆y − ∂f ∂y ∆f = = (9.67) 1 Wir haben jetzt alle Elemente, die wir zur Berechnung des Flächenintegrals in kartesischen Koordinaten benötigen. Dies wollen wir im nächsten Abschnitt tun. In anderen Koordinatensystemen müssen auch die Ausdrücke für das Flächenelement entsprechend geändert werden. 9.2.4 Berechnung des Oberflächenintegrals Im letzten Abschnitt haben wir uns mit den Zutaten für die praktische Berechnung von Oberflächenintegralen beschäftigt. In diesem Abschnitt wollen wir diese Zutaten verwenden, um das Oberflächenintegral auf ein gewöhnliches Doppelintegral in kartesischen Koordinaten zurückzuführen. Falls die Berechnung nicht mit kartesischen Koordinaten x und y als Parameter sondern mit den allgemeinen Parametern u und v durchgeführt werden soll, muss das Flächenelement auf geeignete Weise transformiert werden. Auf diesen allgemeineren Fall können wir hier jedoch nicht eingehen und die Leserin/der Leser sei dafür auf die weiterführende Literatur verwiesen. Im Limes unendlich kleiner Rechtecke wird aus dem Flächenelement ∆f das infinitesimale Flächenelement ∂f − ∂x df = − ∂f dxdy. (9.68) ∂y 1 Einsetzen in den Ausdruck für das Oberflächenintegral ergibt % % r ) · df = A( F D − ∂f ∂x y, z(x, y)) · A(x, dxdy. − ∂f ∂y (9.69) 1 Wir haben somit das Oberflächenintegral über die Fläche F in ein Doppelintegral über den Bereich D (Projektion von F ) in der xy-Ebene verwandelt. Wir wollen diesen Ausdruck nun anhand eines Beispiels erläutern. Beispiel: r ) = (x3 , y 3 , z 3 ) über die durch z = Zu berechnen sei das Oberflächenintegral des Vektorfeldes A( 2 2 f (x, y) = x + y dargestellte Fläche und zwar in den Grenzen −1 ≤ x ≤ 1 und −1 ≤ y ≤ 1. Die Fläche ist ein abgeschnittenes Rotationsparaboloid (siehe Abb. 9.24). Die partiellen Ableitungen von f (x, y) nach x und y sind: ∂f = 2x und ∂x ∂f = 2y. ∂y (9.70) 9 Integration von Feldern: Kurven- und Flächenintegrale 217 Abbildung 9.24: Rotationsparaboloid über einem quadratischen Bereich. Folglich ergibt sich für das Integral % %1 %1 · df = A F −1 −1 %1 %1 = x3 −2x · −2y dxdy y3 1 (x2 + y 2 )3 * + −2x4 − 2y 4 + (x2 + y 2 )3 dxdy −1 −1 %1 %1 = 2 * + −2x4 − 2y 4 + x6 + 3x4 y 2 + 3x2 y 4 + y 6 dxdy −1 0 %1 # = 2 −1 = 2 $ !1 ! 3x5 2 3x3 4 x7 2x5 4 6 − 2y x + + y + y + y x !! dy − 5 7 5 3 0 %1 1 3 2 − − 2y 4 + + y 2 + y 4 + y 6 dy 5 7 5 −1 = %1 2 6 2 4 4 4 6 2 − − 4y + + y + 2y + 2y dy 5 7 5 0 = = !1 %1 6 3 2 5 2 7 !! 18 6 2 18 4 6 y − y + y ! 2 − + y − 2y + 2y dy = 2 − y + 35 5 35 3·5 5 7 0 0 36 − 20 16 18 2 2 2 2 · 18 4 + =− =− . (9.71) 2 − + − + =− 35 5 5 7 35 7 35 35 In manchen Fällen ist es zweckmäßig, die Integration nicht in einem kartesischen Koordinatensystem, sondern in einem anderen Koordinatensystem durchzuführen. In diesem Fall ist auf eine korrekte Definition der Flächenelemente zu achten, auf die wir hier jedoch nicht näher eingehen können. 218 9.3 9 Integration von Feldern: Kurven- und Flächenintegrale Der Integralsatz von Gauß Der Integralsatz von Gauß stellt einen Zusammenhang her zwischen dem Oberflächenintegral über ein Vektorfeld und dem Volumensintegral über die Divergenz eines Vektorfeldes. Dieser Satz erlaubt nicht nur eine anschauliche Interpretation der Divergenz, sondern ermöglicht auch sehr praktische Umformungen von Integralen. Zum Beispiel können wir den Gaußschen Integralsatz benutzen, um die partielle Integration aus Kapitel 4 auf Vektorintegrale zu verallgemeinern. 9.3.1 Integraldarstellung der Divergenz Wir haben im Abschnitt 8.3.2 bereits gesehen, dass der Gesamtfluss durch die Oberfläche eines kleinen Quaders an der Stelle r(x, y, z) mit den Kantenlängen ∆x, ∆y und ∆z im Strömungsfeld v (r) gegeben ist durch div v (r)∆x∆y∆z = div v (r)∆V. r ) und bilden das Oberflächenintegral Wir betrachten nun ein allgemeines Vektorfeld A( : · df A (9.72) (9.73) ∆F über die geschlossene Oberfläche ∆F eines kleinen Volumens ∆V . Falls das kleine Volumen ein Quader mit Kantenlänge ∆x, ∆y und ∆z ist (siehe Abb. 9.25), können wir dieses Oberflächenintegral einfach aus den Oberflächenintegralen über die sechs Seitenflächen des Quaders zusammensetzen: : 6 % · df = · df. A A (9.74) ∆F i=1 ∆fi Abbildung 9.25: Quader mit Volumen ∆x∆y∆z und Seitenflächen ∆f1 , ∆f2 , ∆f3 , ∆f4 , ∆f5 und ∆f6 . Im Limes eines immer kleiner werdenden Quaders können wir diese Integrale leicht lösen (siehe Abschnitt 8.3.2). Die Annahme, dass das Vektorfeld auf den kleinen Seitenflächen des Quaders konstant ist und dass sich das Feld im Quader nur linear ändert, führt uns zu : · df ≈ div A( r )∆V, A (9.75) ∆F wobei ∆V = ∆x∆y∆z. Im Limes ∆x → 0, ∆y → 0, ∆z → 0 wird diese Beziehung exakt und wir erhalten nach Division durch ∆V : 1 · df = div A( r ). A (9.76) lim ∆V →0 ∆V ∆F 9 Integration von Feldern: Kurven- und Flächenintegrale 219 In diesem Grenzübergang haben wir r, den Mittelpunkt des Quaders, konstant gehalten. (Hier geht natürlich nicht nur ∆V gegen 0, sondern auch der größte Durchmesser des kleinen Quaders.) Diese Beziehung kann als Definition der Divergenz aufgefasst werden. Sie gilt nicht nur für eine Folge von kleiner werdenden Quadern, sondern für jede Folge geschlossener, glatter Flächen, die sich in diesem Grenzprozess auf den Punkt r zusammenziehen. Diese Definition ist sogar dann r ) nicht differenzierbar ist. Falls dies aber der Fall ist, gilt natürlich die Beziehung gültig, wenn A( aus Kapitel 8: : 1 · df = div A( r ) = ∂Ax + ∂Ay + ∂Az . A (9.77) lim ∆V →0 ∆V ∂x ∂y ∂z ∆F Diese Integraldarstellung können wir nun benutzen, um den Integralsatz von Gauß herzuleiten. 9.3.2 Formulierung und Herleitung Aus der Integraldarstellung der Divergenz wissen wir, dass für ein kleines, quaderförmiges Volumen ∆V1 an der Stelle r1 gilt : 1 · df = div A( r1 ), A (9.78) ∆V1 F (∆V1 ) wobei sich das Oberflächenintegral über die geschlossene Fläche F (∆V1 ) dieses Volumselements erstreckt. Wir stellen uns nun vor, dass wir an dieses kleine Volumen ∆V1 ein weiteres quaderförmiges Volumen ∆V2 legen, das mit dem ersten Volumen eine Seitenfläche gemeinsam hat (siehe Abb. 9.26). Abbildung 9.26: An der Fläche S berühren sich die beiden Volumselemente V1 und V2 . Die Flächen(1) (2) elemente ∆fS und ∆fS sind einander entgegengesetzt. Für dieses zweite Volumen gilt natürlich genauso : 1 · df = div A( r2 ), A ∆V2 (9.79) F (∆V2 ) wobei diesmal die Integration über die Oberfläche F (∆V2 ) des kleinen Volumens ∆V2 erfolgt. Somit erhalten wir durch Addition: : : · df + · df = div A( r1 )∆V1 + div A( r2 )∆V2 . A A (9.80) F (∆V1 ) F (∆V2 ) Die linke Seite ist die Summe zweier Oberflächenintegrale, wobei in jedem Oberflächenintegral alle Seitenflächen der beiden quaderförmigen Bereiche einen Beitrag leisten. Da die Trennfläche S 220 9 Integration von Feldern: Kurven- und Flächenintegrale beiden Oberflächen gemeinsam ist, gibt es in jedem der Oberflächenintegrale einen Beitrag, der vom Fluss durch diese Seitenfläche stammt. Bezeichnen wir den Feldvektor in der Mitte dieser rS ), ist der Beitrag zum Oberflächenintegral über F (∆V1 ) gegeben durch Fläche mit A( rS ) · df(1) A( S (9.81) und der Beitrag zum Oberflächenintegral über F (∆V2 ) gleich rS ) · df(2) . A( S (9.82) Da wir vereinbart haben, dass die Flächennormalvektoren stets nach außen gerichtet sind, zeigen (1) (2) dfS und dfS in entgegengesetzte Richtung. Im Betrag sind sie aber gleich (weil sie zur gleichen Fläche gehören) und so gilt (1) (2) dfS = −dfS . (9.83) Die beiden Beiträge (9.81) und (9.82) heben einander genau auf rS ) · df(1) + A( rS ) · df(2) = A( rS ) · df(1) − A( rS ) · df(1) = 0. A( S S S S (9.84) Die gemeinsame Trennfläche S liefert also in der Summe auf der linken Seite der Gleichung keinen Beitrag. Übrig bleiben also nun die Beiträge der Außenseiten F (∆V1 + ∆V2 ) des kombinierten Volumens ∆V1 + ∆V2 : : : : · df. A · df + A · df = A (9.85) F (∆V1 ) F (∆V2 ) F (∆V1 +∆V2 ) Dieser Ausdruck gilt übrigens nicht nur für infinitesimale Volumina, sondern ganz allgemein für die Summe zweier Volumina V1 + V2 , welche eine, möglicherweise gekrümmte, Berührungsfläche S haben (siehe Abb. 9.27). Auch in diesem Fall heben sich die beiden Beiträge der Fläche S zum Oberflächenintegral über V1 und V2 genau auf, da in jedem Punkt die zugehörigen Normalvektoren den gleichen Betrag aber entgegengesetzte Richtung besitzen. Abbildung 9.27: In der Summe der Oberflächenintegrale über die Oberflächen, die die Volumina V1 und V2 umschließen, heben sich die Beiträge, die von der Berührungsfläche S stammen, exakt auf. Wir können nun diese Prozeduren beliebig oft wiederholen und stets neue Quader ∆V3 , ∆V4 , ∆V5 , usw. an die bereits vorhandenen anfügen. Dabei heben sich die Beiträge der gemeinsamen Flächen immer auf und übrig bleibt nur das Oberflächenintegral über die Einhüllende F (∆V1 + ∆V2 + . . . ) aller N Teilvolumina ∆Vi : : : : : · df + · df + · · · + · df = · df. A A A A (9.86) F (∆V1 ) F (∆V2 ) F (∆VN ) F (∆V1 +···+∆VN ) Mit Hilfe des Summenzeichens können wir dies kompakter ausdrücken als: : : N · df = · df. A A i=1 F (∆Vi ) F( P i ∆Vi ) (9.87) 9 Integration von Feldern: Kurven- und Flächenintegrale 221 Abbildung 9.28: Zerlegung eines Volumens in kleine Quader. Wir können nun jedes Volumen V beliebig genau mit Hilfe kleiner Quader ∆Vi annähern, V ≈ i ∆Vi . Das Integral auf der rechten Seite von Gleichung (9.87) wird dann zu einem Oberflächenintegral über die Oberfläche von V . Drücken wir zusätzlich auf der linken Seite dieser Gleichung die Oberflächenintegrale über die Teilvolumina mit Hilfe von Gleichung (9.76) durch die lokale Quellenstärke aus, erhalten wir : · df ≈ A i=1 F (V ) : N · df ≈ A N ri ) · ∆Vi . div A( (9.88) i=1 F (∆Vi ) Im Grenzwert infinitesimal kleiner Teilvolumina wird aus der Summe in dieser Gleichung ein Volumsintegral über V : % : · df = dV. A div A (9.89) V F (V ) Dies ist der Integralsatz von Gauß, der auch oft Satz von Gauß-Ostrogradski genannt wird, weil er von diesen beiden Mathematikern unabhängig voneinander gefunden wurde. In Worten lässt sich der Integralsatz von Gauß ausdrücken als: Das Oberflächenintegral eines über eine geschlossene Fläche F mit nach außen gerichteten Flächennormalen ist Vektorfeldes A gleich dem Volumsintegral über die Divergenz des Vektorfeldes im Volumen V, das von der Fläche F eingeschlossen wird. Der Satz von Gauß verknüpft also die Quellen und Senken eines Feldes im Inneren eines Volumens mit den Eigenschaften des Feldes auf der Oberfläche des Volumens. Anwendung findet der Satz von Gauß zum Beispiel in der Elektrostatik und Elektrodynamik sowie bei der Kontinuitätsgleichung für erhaltene Größen (z.B. Energie, Impuls, Masse). Beispiel: Um die Nützlichkeit des Satzes von Gauß zu demonstrieren, berechnen wir das Oberflächenintegral r ) = r über die Oberfläche F eines Würfels mit Volumen V . Mit Hilfe des Satzes O für das Feld A( von Gauß können wir umformen: % : dV. A · df = div A (9.90) O= F = r haben wir div A = Für A ∂x ∂x ∂y ∂y + + V ∂z ∂z = 3 und somit % % dV = div A O= V 3dV = 3V. (9.91) V Interessanterweise geht hier die Form des Volumens nicht in die Lösung ein. Für eine Kugel oder einen Zylinder mit demselben Rauminhalt ergibt sich also genau dasselbe Oberflächenintegral. 222 9 Integration von Feldern: Kurven- und Flächenintegrale Beispiel: durch eine geschlossene Oberfläche F gilt laut dem Satz Für den Fluss eines Wirbelfeldes rot A von Gauß : % · df = dV. rot A div (rot A) (9.92) F V = 0, bedeutet dies Da Wirbelfelder quellenfrei sind, div (rot A) : % · df = rot A 0 dV = 0. F (9.93) V durch eine geschlossene Oberfläche für Somit verschwindet der Gesamtfluss eines Wirbelfeldes rot A Anschaulich bedeutet dies, dass Wirbel entweder ganz in V verlaufen ein beliebiges Vektorfeld A. oder an einer Stelle genauso viele ein- wie an einer anderen Stelle austreten. (Dies folgt, wie wir sehen werden, auch aus dem Satz von Stokes.) Beispiel: r ) = (x3 , y 3 , z 3 ) Wir wollen nun den Satz von Gauß verifizieren, indem wir für das Vektorfeld A( ; · df über die Oberfläche einer Kugel mit Radius R als auch das sowohl das Oberflächenintegral A & Volumsintegral V div A dV über diese Kugel berechnen (siehe Abb. 9.29). r ) auf der Halbkugel mit Radius R. Abbildung 9.29: Vektorfeld A( Wir berechnen zunächst das Oberflächenintegral. Aus Symmetriegründen genügt es, das Integral nur für eine Halbkugel, also zum Beispiel für z ≥ 0, zu berechnen. Das Integral über die Kugel ist dann einfach zweimal das Integral über die Halbkugel. Die Flächengleichung für die Halbkugel ist z(x, y) = R2 − (x2 + y 2 ). Der Normalenvektor n auf die Fläche zeigt für eine Kugel genau vom Ursprung weg: x 1 (9.94) n = y . 2 2 2 x +y +z z Folglich ist das Flächenelement gegeben durch: x dxdy 1 df = · n = y dxdy. n · ez z z (9.95) 9 Integration von Feldern: Kurven- und Flächenintegrale 223 Das Oberflächenintegral lässt sich also schreiben als %% % x3 x 1 3 · df = A y · y dxdy z F x2 +y 2 ≤R2 z3 z %% 4 4 4 x +y +z dxdy, = z (9.96) x2 +y 2 ≤R2 wobei sich der Integrationsbereich in der xy-Ebene über den Kreis mit Radius R erstreckt. In diesem Ausdruck ist z als Funktion von x und y zu betrachten, z = z(x, y). Durch Einsetzen der Flächengleichung für z(x, y) erhalten wir % %% x4 + y 4 + (R2 − (x2 + y 2 ))2 A · df = dxdy. (9.97) R2 − (x2 + y 2 ) F x2 +y 2 ≤R2 Dieses Integral berechnen wir zweckmäßigerweise in Polarkoordinaten: % %2π%R · df = A F 0 0 r4 (sin4 ϕ + cos4 ϕ) + (R2 − r2 )2 √ rdϕdr R2 − r 2 %2π%R # = 0 0 %2π%R = 0 0 %R √ = 0 Das Integral %R 0 Das Integral & 5 √ r dr R2 −r 2 $ 3 r4 (sin4 ϕ + cos4 ϕ) √ + (R2 − r2 ) 2 rdϕdr R2 − r 2 r5 (sin4 ϕ + cos4 ϕ) √ dϕdr + 2π R2 − r 2 r5 R2 − r 2 %R 3 (R2 − r2 ) 2 rdr 0 %2π %R 3 4 4 dr (sin ϕ + cos ϕ)dϕ + 2π (R2 − r2 ) 2 rdr. 0 √ 1 ergibt laut Integraltafel − 15 R2 − r2 (3r4 + 4r2 R2 + 8R4 ) und somit gilt !R ! r5 1 2 R 8R5 4 2 2 4 ! 2 √ 8R4 = . dr = − R − r (3r + 4r R + 8R )! = 15 15 15 R2 − r 2 0 & 2π 0 (9.98) 0 (9.99) (sin4 ϕ + cos4 ϕ)dϕ ergibt !2π %2π 3ϕ sin(4ϕ) !! 3π 4 4 + . (sin ϕ + cos ϕ)dϕ = = ! 4 16 2 0 (9.100) 0 Schließlich erhalten wir für das letzte Integral: !R %R ! 21 2 1 2 2 32 2 52 ! (R − r ) rdr = − (R − r ) ! = R5 . 52 5 0 (9.101) 0 Das Oberflächenintegral wird somit zu % 4π 2π 8R5 3π 2πR5 6π 5 A · df = + = + R . R5 = 15 2 5 5 5 5 F Für die ganze Kugel ist das Oberflächenintegral also gegeben durch: % · df = 12π R5 . A 5 F (9.102) (9.103) 224 9 Integration von Feldern: Kurven- und Flächenintegrale Wir berechnen nun auch das Volumsintegral über die Divergenz des Vektorfeldes über die ganze Kugel: % % 3 ∂y 3 ∂z 3 ∂x + + div AdV = dV ∂x ∂y ∂z V V % (9.104) = 3 (x2 + y 2 + z 2 )dV. V Wir transformieren auf Kugelkoordinaten und beachten dabei, dass das Volumselement zu r2 sin ϑdϑdϕdr wird: % %2π%π %R div AdV = r2 r2 sin ϑdϑdϕdr 3 V 0 0 0 %R = 3 · 2π %π r dr · 4 0 sin ϑdϑ 0 r5 5 !π !R ! ! ! · (− cos ϑ) ! ! ! = 3 · 2π = 6π 5 12π 5 R (− cos(+π) + cos 0) = R . 5 5 0 0 (9.105) & · df Wie wegen des Integralsatzes von Gauß zu erwarten war, liefern das Oberflächenintegral F A & und das Volumsintegral V div AdV genau dasselbe Ergebnis. Allerdings ist in diesem Fall das Volumsintegral bedeutend einfacher zu berechnen als das Oberflächenintegral. 9.3.3 Partielle Integration mit Hilfe des Gaußschen Satzes Erinnern wir uns zunächst daran, dass bei der partiellen Integration in einer Dimension ein Integral in ein anderes (hoffentlich einfacheres) Integral verwandelt wird: %b !b %b ! f (x)g (x)dx = f (x)g(x)!! − f (x)g(x)dx. a a (9.106) a Die partielle Integration beruht auf der Produktregel der Differentiation, (f g) = f g + f g . Wir können Gleichung (9.106) auch umformen zu: %b %b f (x)g (x)dx + a !b ! f (x)g(x)dx = f (x)g(x)!! . (9.107) a a Hier haben wir also das Integral über eine Ableitung verknüpft mit dem Wert der Funktion an den Rändern (in einer Dimension sind das einfach die Endpunkte) des Integrationsintervalls. Der Satz von Gauß leistet das Analoge für Volumsintegrale. Dieser Analogie folgend können wir die Methode der partiellen Integration auf Volumsintegrale übertragen, falls der Integrand ein Produkt aus einem Feld ψ mit dem Gradienten eines anderen Feldes ist, % % ψ(r)grad ϕ(r)dV = ψ(r)∇ϕ(r )dV. (9.108) V V Da der Gradient ein Vektor ist, hat auch das Integral über ψ∇ϕ Vektorcharakter. Im Allgemeinen kann man natürlich Volumsintegrale statt über skalare Felder auch über Vektorfelder bilden. Da Integrale als Grenzwerte von Summen definiert sind und Vektoren komponentenweise 9 Integration von Feldern: Kurven- und Flächenintegrale 225 r ) ein Vektor, dessen Komponenten addiert werden, ist das Volumsintegral eines Vektorfeldes A( die Volumsintegrale über die Komponenten des Feldes A sind: & % Ax (r)dV V & r )dV = A( (9.109) V Ay (r)dV . & V r )dV V Az ( S eines Ein Beispiel für ein solches Integral ergibt sich bei der Berechnung des Schwerpunktes R Körpers mit Massenverteilung ρ(r): & rρ(r)dV RS = &V . (9.110) ρ(r)dV V Wir kehren nach diesem kurzen Einschub über vektorwertige Volumsintegrale zurück zum Integral in Gleichung (9.108). Aus dem Abschnitt 8.2 über den Gradienten im Kapitel 8 kennen wir die Produktregel ∇(ψϕ) = ϕ∇ψ + ψ∇ϕ. Somit gilt % % % ∇(ψϕ)dV − ψ(r)∇ϕ(r )dV = V (9.111) V ϕ(r)∇ψ(r )dV. (9.112) V Das erste Integral auf der rechten Seite dieser Gleichung kann wie folgt umgeformt werden. Für r ) = aφ(r) mit einem konstanten Vektor a und einem Skalarfeld φ(r) das spezielle Vektorfeld A( folgt nämlich aus dem Satz von Gauß: : : % : · df = A aφ(r ) · df = a · φ(r)df = div (aφ(r))dV. (9.113) F (V ) F (V ) F (V ) V Da aber div (aφ(r)) = = folgt daraus ∂ax φ ∂ay φ ∂az φ + + ∂x ∂y ∂z ∂φ ∂φ ∂φ ax + ay + az = a · grad φ, ∂x ∂y ∂z : % φ(r ) df = a · a · F (V ) grad φ dV. (9.115) V Da dies für beliebige Vektoren a gilt, erhalten wir schließlich die Vektorgleichung: % % : φ(r) df = grad φ dV = ∇φ dV. F (V ) (9.114) V (9.116) V Während auf der linken Seite dieser Gleichung der Vektorcharakter des Integrals vom Flächenelement stammt, kommt er auf der rechten Seite vom Gradienten, der ja ein Vektor ist. Die obige Gleichung ist der Gaußsche Integralsatz für skalare Felder. Durch Anwendung dieses Satzes mit φ = ϕψ erhalten wir aus Gleichung (9.112) % : % ψ(r)∇ϕ(r ) dV = ψ(r)ϕ(r) df − ϕ(r)∇ψ(r) dV. V F (V ) (9.117) V Diese Gleichung ist analog zur partiellen Integration in einer Dimension (siehe auch Gleichung (4.78) bzw. Gleichung (9.106)): die Ableitung wird von einer Funktion (ϕ) zur anderen (ψ) übergewälzt. Zusätzlich haben wir einen Oberflächenterm erhalten. Da dieser zusätzliche Term im Unterschied zum eindimensionalen Fall noch als Integral (wenn auch als Oberflächenintegral) dasteht, 226 9 Integration von Feldern: Kurven- und Flächenintegrale ist der Ausdruck partielle (also teilweise) Integration hier wohl etwas übertrieben. Nichtsdestotrotz kann Gleichung (9.117) in vielen Situationen sehr nützlich sein. Falls auf der Oberfläche des Integrationsvolumens mindestens eine der skalaren Funktionen ϕ(r ) oder ψ(r ) verschwindet, nimmt (9.117) eine besonders einfache Form an. Dann verschwindet nämlich das Oberflächenintegral und wir erhalten: % % ψ(r)∇ϕ(r )dV = − ϕ(r)∇ψ(r )dV. (9.118) V V Bei Anwendung dieses sehr praktischen Ausdrucks muss jedoch sorgfältig darauf geachtet werden, dass entweder ϕ(r) oder ψ(r) auf der Oberfläche wirklich verschwindet. Ein ähnliches Ergebnis erhalten wir, wenn wir die Produktregel für die Divergenz eines Produkts aus einem Skalar- und einem Vektorfeld ausnutzen, r )) = A · ∇ϕ + ϕ∇ · A. ∇ · (ϕ(r)A( Für das Volumsintegral % & dV erhalten wir damit nämlich ϕ∇ · A % % · ∇ϕ dV. A ϕ∇ · A dV = ∇ · (ϕA) dV − (9.119) V V V (9.120) V können wir nun mit Hilfe des Satzes von Gauß in Das Volumsintegral über die Divergenz ∇ · (ϕA) ein Oberflächenintegral verwandeln: % : % · ∇ϕ dV dV = · df − A (9.121) ϕ∇ · A ϕA V oder, äquivalent dazu, F % V : V % · df − ϕA · ∇ϕ dV = A F dV. ϕ∇ · A (9.122) V Falls das Oberflächenintegral verschwindet, wird dieser Ausdruck für die partielle Integration besonders einfach: % % · ∇ϕ dV = − dV. A ϕ∇ · A (9.123) V V Zwei weitere praktische Ausdrücke lassen sich aus dem Satz von Gauß ableiten. Diese sind als Sätze von Green bekannt. 9.3.4 Die Sätze von Green Gegeben seien zwei skalare Felder ψ und ϕ. Für diese Felder betrachten wir jetzt das Volumsintegral % (ϕ∆ψ − ψ∆ϕ)dV, (9.124) V wobei ∆ = ∇ · ∇ der Laplace-Operator ist. Partielle Integration beider Terme mit Hilfe von Gleichung (9.121) liefert % % (ϕ∆ψ − ψ∆ϕ) dV = (ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV V V : % = (ϕ∇ψ − ψ∇ϕ) df − (∇ϕ · ∇ψ − ∇ψ · ∇ϕ) dV. (9.125) F V Das Volumsintegral auf der rechten Seite verschwindet aber und wir erhalten % : (ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV = (ϕ∇ψ − ψ∇ϕ) df. V F (9.126) 9 Integration von Feldern: Kurven- und Flächenintegrale 227 Dies ist der 2. Satz von Green. (Diese Nomenklatur ist nicht ganz einheitlich. Die Sätze werden oft unterschiedlich nummeriert.) Er wurde von George Green bewiesen, kann jedoch als Spezialfall des Satzes von Gauß betrachtet werden. ein Der 1. Satz von Green ergibt sich aus Gleichung (9.121) für den Fall, dass das Vektorfeld A Gradientenfeld ist: A = ∇ψ. Einsetzen in Gleichung (9.121) ergibt : % % ϕ∇ · ∇ψ dV = ϕ∇ψ · df − ∇ϕ · ∇ψ dV (9.127) V oder F : % % ϕ∇ψ · df − ϕ∆ψ dV = V V F ∇ϕ · ∇ψ dV. Weitere praktische Formeln, die man auf ähnliche Weise ableiten kann, sind: % % : × ∇ϕ dV = dV + × df, A ϕ∇ × A ϕA V V V (9.129) F = ϕ∇ × A + ∇ϕ × A beruht, und was auf der Produktregel ∇ × (ϕA) % : % ·∇×A dV = ·∇×B dV + (A × B) · df, B A V (9.128) V (9.130) F × B) =B ·∇×A −A ·∇×B folgt. was aus div (A Beispiel: Die Diffusion eines Teilchens im Raum (siehe Abb. 9.30) wird durch die Diffusionsgleichung ∂ρ = D∆ρ ∂t (9.131) beschrieben, wobei ρ(r, t) die Wahrscheinlichkeit beschreibt, das Teilchen zum Zeitpunkt t am Ort r = (x, y, z) zu finden unter der Bedingung, dass es zum Zeitpunkt t = 0 im Ursprung (r = 0) war. Abbildung 9.30: Bahnkurve eines diffundierenden Teilchens in der Ebene. Für t = 0 ist die Dichte ρ(r, t = 0) also durch eine δ-Funktion gegeben, da wir wissen, dass sich das Teilchen genau im Usprung befindet: ρ(r, 0) = δ(r). (9.132) Da das Teilchen vom ursprünglichen Ort weg diffundiert, wird die Dichte ρ immer breiter. Aus Symmetriegründen verschwindet der mittlere Aufenthaltsort des Teilchens bei wiederholter Durchführung des Diffusionsexperiments: % r = ρ(r)r dV = 0, (9.133) 228 9 Integration von Feldern: Kurven- und Flächenintegrale wobei die Dichte ρ(r) so definiert ist, dass sie normiert ist. Das heißt % ρ(r) dV = 1. Das mittlere Abweichungsquadrat (9.134) % r 2 = ρ(r, t)r 2 dV (9.135) ist jedoch von Null verschieden und wächst mit der Zeit. Um dieses zeitliche Anwachsen quantitativ zu bestimmen, bilden wir die Ableitung von r 2 nach der Zeit: % d 2 ∂ r = ρ(r, t)r 2 dV. (9.136) dt ∂t Indem wir die Diffusionsgleichung ausnutzen, erhalten wir dann: % d 2 r = D ∆ρ(r, t)r 2 dV dt % = D ∇ · (∇ρ(r, t))r 2 dV. (9.137) Anwendung des 1. Greenschen Satzes (Gleichung (9.128)) ergibt: % : % 2 2 r 2 ∇ρ(r, t) · df. ∆ρ(r, t)r dV = − ∇r · ∇ρ dV + (9.138) F Im Unendlichen verschwindet jedoch ρ und auch ∇ρ für beliebige endliche Zeiten t. Deshalb erhalten wir % % (9.139) ∆ρ(r, t)r 2 dV = − ∇r 2 · ∇ρ dV. Der Gradient von r 2 lässt sich leicht auswerten, ∇r 2 = 2r und folglich gilt (9.140) % % ∇r 2 · ∇ρ dV = 2 r · ∇ρ dV. Nochmalige partielle Integration nach Gleichung (9.122) liefert % % : ρr · df. r · ∇ρ dV = − ρ(∇ · r)dV + (9.141) (9.142) F Der Oberflächenterm verschwindet wieder und die Divergenz von r ist ∇ · r = ∂x ∂y ∂z + + = 3. ∂x ∂y ∂z & Da ρ nach Voraussetzung normiert ist, ρ(r) = 1, gilt % % ρ(∇ · r) dV = 3 ρ dV = 3 (9.143) (9.144) und wir erhalten schließlich ∂ 2 r = D · 2 · 3 = 6D. ∂t (9.145) r 2 = 6Dt. (9.146) Integration nach der Zeit ergibt Dies ist die berühmte Einstein-Beziehung, der zufolge bei der Diffusion der mittlere quadratische Abstand vom Ausgangspunkt linear mit der Zeit wächst. 9 Integration von Feldern: Kurven- und Flächenintegrale 9.4 229 Der Integralsatz von Stokes Der Integralsatz von Stokes stellt einen Zusammenhang her zwischen dem Oberflächenintegral des Wirbelfeldes eines Vektorfeldes und dem Kurvenintegral des Feldes entlang des Randes der Oberfläche. 9.4.1 Integraldarstellung der Rotation Wir haben in Abschnitt 9.1.4 gesehen, dass unter gewissen Umständen Kurvenintegrale über Vektorfelder vom Weg unabhängig sind (nämlich genau dann, wenn sich das Vektorfeld als Gradient eines Skalarfeldes darstellen lässt). In diesem Fall verschwindet das Kurvenintegral über jede beliebige geschlossene Kurve C: : · dr = 0. A (9.147) C Es gibt jedoch auch Felder, für die ; das Kurvenintegral längs geschlossener Kurven, also die Zir · dr = 0. Solche Felder nennt man Wirbelfelder. So kann kulation, nicht verschwindet, C A ein ringförmiges elektrisches Feld E erzeubeispielsweise ein zeitlich veränderliches Magnetfeld B gen (siehe Abb. 9.31). Unterschiedliche Integrationswege (etwa C1 , C2 und Abbildung 9.31: Elektrisches Wirbelfeld E. & · dr. C3 ) führen zu unterschiedlichen Wegintegralen C E Wir bewegen in diesem elektrischen Feld nun eine Ladung vom Punkt P1 zum &Punkt P2 und · dr längs wollen dies auf 3 verschiedenen Wegen tun: C1 , C2 und C3 . Das Kurvenintegral C E immer in Richtung des Weges zeigt und deshalb des Weges C1 ist positiv, da das Vektorfeld E · dr > 0 gilt. Das Kurvenintegral längs C2 hingegen ist negativ, da das Feld immer der immer E · dr < 0. Auf der Kurve C3 steht das Feld immer genau Bewegungsrichtung entgegengesetzt ist, E & · dr · dr = 0 und das Kurvenintegral E senkrecht auf die Bewegungsrichtung. Somit gilt E C3 verschwindet. In diesem Fall wird keine Arbeit geleistet. Da diese Kurvenintegrale nicht wegunabhängig sind, verschwindet die Zirkulation für dieses Vektorfeld im Allgemeinen nicht. Zum Beispiel ist : : · dr > 0 und · dr < 0. E E (9.148) C1 −C3 C2 −C1 Hier bezeichnet C1 − C3 den Weg, der aus C1 in Vorwärtsrichtung und C3 in Rückwärtsrichtung besteht. Der Weg C2 − C1 ist auf analoge Weise definiert. Offensichtlich verschwinden Kurvenintegrale über geschlossene Kurven genau dann nicht, wenn das Vektorfeld geschlossene Feldlinien, 230 9 Integration von Feldern: Kurven- und Flächenintegrale also Wirbel, besitzt. Wir haben aber in Kapitel 8 (Abschnitt 8.55) plausibel gemacht, dass die als Maß für die lokale Wirbelstärke betrachtet werden kann. Wir wollen nun sehen, Rotation ∇ × A ob wir die Zirkulation über ein Vektorfeld, die ja ebenfalls von der Stärke der Wirbel abhängt, mit der Rotation in Verbindung bringen können. Abbildung 9.32: Die Umrandung des Flächenelements mit dem Flächenvektor ∆f besteht aus den Kurvensegmenten C1 , C2 , C3 und C4 . Dazu betrachten wir das Kurvenintegral über eine kleine geschlossene Kurve, die eine kleine Fläche ∆f mit Flächenvektor ∆f umrandet. Der Einfachheit halber nehmen wir an, dass die Fläche in der xy-Ebene liegt, also ∆f in Richtung der z-Achse zeigt (siehe Abb. 9.32). Wir bezeichnen die ; r ) · dr entlang der Umrandung Umrandung dieses Rechtecks mit Cz . Das Kurvenintegral Cz A( des Rechtecks besteht aus den vier Beiträgen entlang der Rechteckseiten. Zur Berechnung dieses Integrals wollen wir annehmen, dass die Seiten des Rechtecks so kurz sind, dass sich der Feldvektor r ) entlang der Kanten nicht ändert. Dann ist der Beitrag der Kante C1 gegeben durch A( ∆y A x, y − , z · ∆r, 2 (9.149) y − ∆y , z) der Feldvektor im Mittelwobei r = (x, y, z) der Mittelpunkt des Rechtecks ist und A(x, 2 punkt der Kante C1 . Die Verschiebung ∆r hat jedoch die Länge ∆x und die Richtung ex = (1, 0, 0). Damit erhalten wir für den Beitrag der Rechteckseite C1 zum Integral x, y − ∆y , z · ex ∆x = Ax x, y − ∆y , z ∆x. A 2 2 (9.150) Auf ähnliche Weise erhalten wir für den Beitrag entlang Kante C3 ∆y ∆y A x, y + , z · ∆r = −Ax x, y + , z ∆x. 2 2 (9.151) Dabei haben wir berücksichtigt, dass das Kurvenelement ∆r für diese Kante in die negative xRichtung zeigt. Durch analoge Überlegungen erhalten wir die Beiträge der Kanten C2 und C4 zum Kurvenintegral: ∆x , y, z ∆y Ay x + 2 C2 : und C4 : ∆x , y, z ∆y. −Ay x − 2 (9.152) Durch Addition dieser vier Beiträge erhalten wir das Kurvenintegral längs der (geschlossenen) Umrandung des Rechtecks: ∆y ∆y A · dr = Ax x, y − , z ∆x − Ax x, y + , z ∆x 2 2 Cz ∆x ∆x + Ay x + , y, z ∆y − Ay x − , y, z ∆y. 2 2 : (9.153) 9 Integration von Feldern: Kurven- und Flächenintegrale 231 Die Erweiterung der ersten beiden Terme der rechten Seite dieser Gleichung mit ∆y und der letzten beiden Terme mit ∆x liefert ∆y : x, y − , z − A , z Ax x, y + ∆y x 2 2 · dr = − ∆x∆y A ∆y Cz (9.154) ∆x Ay x + ∆x x − , y, z − A , y, z y 2 2 + ∆x∆y. ∆x Im Limes kleiner ∆x und ∆y (also im Limes ∆f → 0) werden diese Differenzenquotienten zu partiellen Ableitungen und wir erhalten nach Division durch ∆x∆y = ∆f : 1 · dr = ∂Ay − ∂Ax . lim A (9.155) ∆f →0 ∆f C ∂x ∂y z Die rechte Seite dieser Gleichung ist jedoch nichts anderes als die z-Komponente der Rotation ∂A ∂A ∂ z − ∂zy Ax ∂y ∂x ∂Ax ∂ · ∂Az = ∇×A (9.156) ∂y Ay = ∂z − ∂x ∂Ay ∂Ax ∂ Az ∂x − ∂y ∂z r ). Wir können also schreiben des Vektorfeldes A( : 1 · dr = (rot A) z, A lim ∆f →0 ∆f C z (9.157) mit (rot A) z bezeichnet haben. Wenn wir unser wobei wir die z-Komponente der Rotation rot A kleines Rechteck nicht in die xy-Ebene sondern in die yz-Ebene oder in die xz-Ebene legen, erhalten wir auf analoge Weise die x- beziehungsweise die y-Komponente der Rotation: : 1 · dr = ∂Az − ∂Ay = (rot A) x A (9.158) lim ∆f →0 ∆f Cx ∂y ∂z beziehungsweise 1 ∆f →0 ∆f : lim · dr = ∂Ax − ∂Az = (rot A) y. A ∂z ∂x Cy (9.159) Für eine allgemein orientierte Fläche, deren Flächennormale in Richtung des Einheitsvektors n zeigt, ∆f = |∆f| · n = ∆fn, (9.160) gilt 1 lim ∆f →0 ∆f : · dr = n · rot A = n · ∇ × A. A (9.161) C Die Rotation ist also die Flächendichte der Zirkulation (Zirkulation pro Fläche), die auch als ; · dr = rot A · ∆f. Wirbelstärke bezeichnet wird. Für eine kleine Fläche ∆f haben wir also C A Dieser Ausdruck kann auch als Definition der Rotation eines Vektorfeldes aufgefasst werden, die auch dann sinnvoll bleibt, wenn das Feld nicht differenzierbar ist. 9.4.2 Formulierung und Herleitung r ) einen Zusammenhang zwischen dem Der Stokessche Satz stellt für ein beliebiges Vektorfeld A( Oberflächenintegral über eine im Allgemeinen gekrümmte Fläche F und dem Kurvenintegral längs 232 9 Integration von Feldern: Kurven- und Flächenintegrale Abbildung 9.33: Die von der Kurve C umrandete Fläche F wird in kleine Facetten mit Flächenvektoren ∆fi zerlegt. des Randes C dieser beliebig großen und beliebig geformten Fläche her (siehe Abb. 9.33). Wie wir schon bei der Diskussion des Oberflächenintegrals gesehen haben, können wir die gesamte Oberfläche F näherungsweise durch N ebene Teilflächen ∆fi mit Flächenvektoren ∆fi darstellen. Wir bezeichnen die Umrandung des Flächenelements ∆fi mit Ci . Wir bilden nun für ein kleines Flächenelement ∆f1 am Punkt r1 (siehe Abb. 9.34) das Kurvenintegral längs seiner Umrandung, das für eine kleine Fläche geschrieben werden kann als : · dr = rot A · ∆f1 . A (9.162) C1 Wir legen dann um einen benachbarten Punkt r2 eine weitere Fläche ∆f2 und zwar so, dass die Flächen ∆f1 und ∆f2 einen Teil ihrer Berandung gemeinsam haben. Die Flächenvektoren ∆f1 und ∆f2 sind im Allgemeinen nicht parallel zueinander. Abbildung 9.34: Zwei benachbarte Facetten mit Flächenvektoren ∆f1 und ∆f2 und Umrandungen C1 und C2 . Wenn wir die Linienintegrale entlang der beiden Kurven C1 und C2 addieren, heben sich die beiden Beiträge des gemeinsamen Randteiles genau auf, weil dieser Teil von C1 und C2 in entgegengesetzter Richtung umlaufen wird. Was übrig bleibt ist das Kurvenintegral über die Einhüllende C1+2 der aus ∆f1 und ∆f2 bestehenden Gesamtfläche: : : : · dr. A · dr + A · dr = A (9.163) C1 C2 C1+2 Andererseits gilt wegen Gleichung (9.162) aber auch : : · dr + · dr = rot A( r1 ) · ∆f1 + rot A( r2 ) · ∆f2 A A C1 und somit (9.164) C2 : · dr = rot A( r1 ) · ∆f1 + rot A( r2 ) · ∆f2 . A (9.165) C1+2 Wir können diese Prozedur durch Hinzufügen weiterer Facetten ∆fi nun wiederholen, bis die gesamte Fläche F ausgefüllt ist. Bei jedem dieser Schritte bleibt beim Linienintegral nur jener Teil übrig, der von der äußeren Berandung der Fläche stammt (siehe Abb. 9.35). 9 Integration von Feldern: Kurven- und Flächenintegrale 233 Abbildung 9.35: In der Summe der Kurvenintegrale über die Umrandungen der Teilflächen kürzen sich alle Beiträge außer die, die vom äußeren Rand der Gesamtfläche stammen. Die Summe aller Kurvenintegrale über die Umrandung Ci der Teilflächen wird also zum Kurvenintegral über die Einhüllende C1+2+···+N aller N Flächenelemente. Wir erhalten also : · dr = ri ) · ∆fi . A rot A( (9.166) C1+2+···+N i Im Limes N → ∞, also für immer kleiner werdende Flächenelemente, strebt C1+···+N gegen die Randkurve C der Fläche F und die Summe auf der rechten Seite wird zum Oberflächenintegral: % : · dr = · df. A rot A (9.167) C F Dies ist der Stokessche Integralsatz. In Worten lautet der Stokessche Integralsatz: r ) und eine Fläche F ist das Oberflächenintegral über das zugehörige WirFür ein Vektorfeld A( belfeld gleich dem Kurvenintegral über das Vektorfeld längs der Berandung C der Fläche F . Beispiel: Als Beispiel für den Satz von Stokes berechnen wir das Ringintegral ; C · dr des Vektorfeldes A −3y r) = A( 3x 1 (9.168) längs eines Kreises in der xy-Ebene mit Mittelpunkt im Ursprung und Radius r (siehe Abb. 9.36). Aus dem Satz von Stokes folgt, dass : % · df, rot A · dr = A C (9.169) F wobei F eine beliebige glatte Fläche ist, deren Rand der Kreis ist, längs dessen das Kurvenintegral berechnet werden soll. Da die Fläche F beliebig ist, wählen wir einfach die ebene Kreisfläche. Das Oberflächenelement ist demnach df = ez dxdy unabhängig vom Ort. Die Rotation des Vektorfeldes ist A ∂ −3y 0−0 0 −3y ∂x ∂ (9.170) rot 3x = ∂y × 3x = 0 − 0 = 0 . 1 ∂ ∂z 1 3+3 6 234 9 Integration von Feldern: Kurven- und Flächenintegrale Abbildung 9.36: Flächenelement in einem Kreis in der Ebene. Die Flächenvektoren df stehen normal auf die xy-Ebene. Das Oberflächenintegral wird deshalb zu % F 0 0 rot A · df = 0 · 0 dxdy x2 +y 2 ≤r 2 6 1 %% dxdy = 6πr2 . = 6 %% (9.171) x2 +y 2 ≤r 2 Natürlich hätten wir auch das Kurvenintegral direkt auswerten können. Für den Kreis bietet sich die Parametrisierung r cos t mit 0 ≤ t ≤ 2π (9.172) r(t) = r sin t 0 an. Der Tangentenvektor ist folglich gegeben durch: −r sin t dr = r cos t . dt 0 (9.173) Das Kurvenintegral wird mit dieser Parametrisierung zu : %2π −3r sin t −r sin t · dr = A 3r cos t · r cos t dt C 0 1 0 %2π %2π 2 = 2 2 3r (sin t + cos t)dt = 3r 0 2 dt = 6r2 π. (9.174) 0 Das Kurvenintegral ist in diesem Fall nicht viel schwerer zu berechnen als das Oberflächenintegral. Aus dem Oberflächenintegral sehen wir aber, dass in diesem Fall für jede Kurve in der Ebene das Integral nur von der Größe der eingeschlossenen Fläche abhängt. 9.4.3 Bedeutung über Aus dem Satz von Stokes folgt, dass das Oberflächenintegral eines Wirbelfeldes ∇ × A eine geschlossene Oberfläche F verschwindet. Wir können uns nämlich vorstellen, dass eine geschlossene Fläche entsteht, wenn wir die Randkurve C wie bei einem Beutel auf einen Punkt 9 Integration von Feldern: Kurven- und Flächenintegrale 235 zusammenziehen (siehe Abb. 9.37). Die Länge des Randes ist dann 0 und somit verschwindet auch das Kuvenintegral : · dr = 0. A (9.175) C Wegen des Satzes von Stokes muss deshalb auch das Oberflächenintegral : · df rot A (9.176) F über die geschlossene Oberfläche verschwinden. Abbildung 9.37: Wenn sich die Umrandung C auf einen Punkt zusammenzieht, wird die Fläche F zu einer geschlossenen Fläche. Aus dem Satz von Stokes folgt weiters, dass alle Flächen F1 , F2 , . . . mit demselben Rand C auch & · df liefern. dasselbe Oberflächenintegral F rot A Schließlich erlaubt es uns der Satz von Stokes, die Frage nach der Wegunabhängigkeit von Kurvenintegralen noch einmal aufzugreifen. Wir haben ja schon früher gesehen, dass die Wegunabhängigkeit von Integralen äquivalent zum Verschwinden von Kurvenintegralen längs geschlosse; · dr = 0 für beliebige geschlossene Kurven gilt, ner Kurven ist. Wenn wir nun annehmen, dass C A muss dies auch für Kurven um sehr kleine Flächen gelten. Dann gilt jedoch : · dr = rot A · df = 0. A (9.177) C Da dies gemäß Annahme für beliebige (aber sehr kleine) Flächen gelten muss, finden wir, dass die Rotation verschwindet. Verschwindet also das Kurvenintegral für beliebige Kurven, verschwindet auch die Rotation: : · dr = 0 = 0. A für alle geschlossenen Wege C ⇒ rot A (9.178) C Umgekehrt folgt aus dem Stokesschen Satz, dass das Kurvenintegral längs geschlossener Kurven verschwindet, wenn die Rotation gleich 0 ist: : % · dr = · df = 0. A rot A (9.179) C F = 0 eine sowohl notwendige als auch hinreichende Bedingung für die Das heißt, dass rot A Wegunabhängigkeit von Kurvenintegralen ist. Um festzustellen, ob Kurvenintegrale wegunabhängig sind, genügt es also zu prüfen, ob die Rotation des Vektorfeldes verschwindet. Zusammenfassend halten wir fest, dass folgende Aussagen äquivalent sind: • Das Kurvenintegral • Das Kurvenintegral & C r ) · dr ist wegunabhängig. A( C r ) · dr über jede geschlossene Kurve C verschwindet. A( ; 236 9 Integration von Feldern: Kurven- und Flächenintegrale der Gradient von φ ist, A = grad φ. • Es existiert ein skalares Feld φ, sodass das Vektorfeld A konservativ. Die Funktion φ wird Potential genannt und das Vektorfeld A des Vektorfeldes A verschwindet. • Die Rotation rot A (Die Frage, ob das Integrationsgebiet einfach zusammenhängend ist oder nicht, haben wir in allen Überlegungen vernachlässigt. Der interessierte Leser sei in diesem Punkt auf die weiterführende Literatur verwiesen.) 9.4.4 Das Vektorpotential = 0, können wir ein Skalarfeld φ definieren, sodass dessen Gradient gleich dem VekFalls rot A = grad φ. Es stellt sich nun die Frage (zum Beispiel im Zusammenhang mit torfeld A ist: A dessen Divergenz verschwindet (div B = 0), als magnetischen Feldern), ob wir auch ein Feld B, Ableitung eines Feldes darstellen können. Im Falle der Darstellung eines wirbelfreien Feldes als Gradientenfeld kann man von der Beobachtung ausgehen, dass die Rotation eines Gradientenfeldes verschwindet, rot (grad φ) = 0. (9.180) als Gradient eines Skalarfeldes ausgeDies legt die Vermutung nahe, dass ein wirbelfreies Feld E drückt werden kann. Wie wir ja jetzt wissen, kann man das tatsächlich tun. Nun gibt es die analoge Identität = 0, div (rot A) (9.181) die besagt, dass Wirbelfelder quellenfrei sind. Ganz analog zum obigen Fall scheint dieses Ergebnis (div B = 0) als Rotation eines anderen die Vermutung nahe zu legen, dass ein quellenfreies Feld B geschrieben werden könnte: B = rot A. Diese Vermutung kann durch explizite KonVektorfeldes A für ein quellenfreies Feld B bestätigt werden. Ein solches Vektorfeld struktion eines Vektorfeldes A wird Vektorpotential genannt. A = rot A, muss für die Komponenten von A gelten: Falls B Bx = ∂Az ∂Ay − , ∂y ∂z By = ∂Ax ∂Az − , ∂z ∂x Bz = ∂Ay ∂Ax − . ∂x ∂y (9.182) den Gradienten einer skalaren Funktion χ addieren können, Da wir zu jedem Vektorpotential A ohne die Beziehung B = rot A zu stören, + grad χ), = rot A = rot A + rot (grad χ) = rot (A B (9.183) =0 eine gewisse Freiheit. Um A eindeutig zu bestimmen, müssen noch haben wir in der Wahl von A Nebenbedingungen gewählt werden. Man nennt dies die Eichung von A. Wir nutzen nun diese Eichmöglichkeit und versuchen den Ansatz Az = 0. Dann haben wir Bx = − ∂Ay ∂z und By = ∂Ax . ∂z (9.184) Integration nach z liefert: %z Ay = − za Bx (x, y, z )dz (9.185) 9 Integration von Feldern: Kurven- und Flächenintegrale 237 und %z Ax = By (x, y, z )dz + f (x, y). (9.186) za Hier ist f (x, y) eine Integrationskonstante, auf die wir für Ay wegen der Eichmöglichkeit verzichtet haben. Um die dritte Gleichung zu lösen, setzen wir Ax und Ay ein und erhalten: Bz = = ∂Ax ∂Ay − ∂x ∂y %z %z ∂Bx ∂By ∂f − (x, y, z )dz − (x, y, z )dz − ∂x ∂y ∂y za %z = − za # $ ∂Bx ∂By ∂f (x, y, z ) + (x, y, z ) dz − . ∂x ∂y ∂y (9.187) za quellenfrei ist. Demnach gilt: Wir wissen aber, dass B = ∂Bx + ∂By + ∂Bz = 0 div B ∂x ∂y ∂z (9.188) ∂Bx ∂By ∂Bz + =− . ∂x ∂y ∂z (9.189) und somit Wenn wir dieses Ergebnis in Gleichung (9.187) einsetzen, ergibt sich %z # Bz (x, y, z) = $ ∂Bz ∂f . (x, y, z ) dz − ∂z ∂y (9.190) za Wir können das Integral ausführen und erhalten ∂f y, y, (x, z) = (x, z) − Bz (x, y, za ) − Bz . Bz ∂y (9.191) ∂f = −Bz (x, y, za ). ∂y (9.192) Das heißt, Integration liefert schließlich: %y f (x, y) = − Bz (x, y , za )dy . (9.193) ya Somit ist folgendes Feld ein Vektorpotential für B: %z %y By (x, y, z )dz − Ax (x, y, z) = za Bz (x, y , za )dy , (9.194) ya %z Ay (x, y, z) = − Bx (x, y, z )dz , (9.195) za Az (x, y, z) = 0. (9.196) impliziert also die Existenz eines Vektorpotentials A, sodass Die Quellenfreiheit eines Feldes B B = rot A. 238 9 Integration von Feldern: Kurven- und Flächenintegrale Kapitel 10 Differentialgleichungen 10.1 Grundbegriffe Beziehungen zwischen Variablen werden in der Physik oft durch Gleichungen beschrieben, welche Ableitungen enthalten. Ein Beispiel für eine solche Gleichung ist die Newtonsche Bewegungsgleichung 2 d r F = ma = m 2 , dt (10.1) welche die Dynamik eines Objektes der Masse m unter Einwirkung der Kraft F beschreibt. Die Kraft F , die auf den Körper wirkt, kann konstant oder eine Funktion des Ortes sein. Durch Lösung dieser Gleichung erhält man den Ort r(t) des Objekts als Funktion der Zeit. Die Lösung der Gleichung F = mr¨ ist also keine Zahl sondern eine Funktion. Eine Gleichung, die eine oder mehrere Ableitungen einer gesuchten Funktion y(x) enthält, nennt man eine Differentialgleichung. Wenn die höchste Ableitung von y(x), die in der Gleichung auftritt, die n-te Ableitung y (n) (x) ist, hat man es mit einer Differentialgleichung n-ter Ordnung zu tun. Natürlich kann eine Differentialgleichung n-ter Ordnung auch Ableitungen niedrigerer Ordnung beinhalten sowie von der Funktion y(x) selbst und der Variablen x abhängen. Eine Differentialgleichung, bei der die Funktion y(x) nur von einer einzigen Variablen x und den Ableitungen dieser Funktion nach x abhängt, nennt man eine gewöhnliche Differentialgleichung. Im Gegensatz dazu ist eine partielle Differentialgleichung eine Bestimmungsgleichung für eine Funktion y(x1 , x2 , . . . , xn ), die von mehreren Variablen und den partiellen Ableitungen der Funktion abhängt. Auch in diesem Fall bezieht sich die Ordnung der Gleichung auf die höchste vorkommende partielle Ableitung. Die allgemeine Form einer gewöhnlichen Differentialgleichung für die Funktion y(x) ist: F (x, y, y , y , y , . . . , y (n) ) = 0. (10.2) Hier haben wir die Differentialgleichung in impliziter Form dargestellt. Falls wir sie nach der höchsten Ableitung auflösen können, ergibt sich in expliziter Form y (n) = f (x, y, . . . , y (n−1) ). (10.3) Beispiele für gewöhnliche Differentialgleichungen sind y + y = 0, (y )2 + xy = 0, (10.4) (10.5) sin x · y + y 2 = 0. (10.6) 239 240 10 Differentialgleichungen Eine Funktion y(x) bezeichnen wir als Lösung einer gegebenen Differentialgleichung, falls y(x) diese Gleichung erfüllt. Eine Funktion, die die Differentialgleichung löst, wird auch ein Integral der Differentialgleichung genannt und das Finden einer solchen Lösung wird auch Integrieren genannt. Betrachten wir zum Beispiel die Differentialgleichung y = −y. (10.7) Da für die Funktion y(x) = sin x gilt, dass y = cos x und y = − sin x = −y, ist y = sin x eine Lösung dieser Differentialgleichung. Es gibt für diese Differentialgleichung jedoch mehr als eine Lösung. So wird sie auch von y = 3 sin x oder allgemeiner von y = A sin x erfüllt. Weiters ist die Funktion y(x) = cos x wegen y = − sin x und y = − cos x = −y eine Lösung. Genauso löst y = 7 cos x oder allgemeiner y = B cos x die Gleichung. Aus den beiden Lösungen A sin x und B cos x können wir durch Addition eine allgemeine Lösung konstruieren: y(x) = A sin x + B cos x. (10.8) Für beliebige Konstanten A und B löst y(x) die Differentialgleichung y = −y. Die Differentialgleichung hat also eine unendliche Anzahl von Lösungen. Da A und B beliebig gewählt werden können, sprechen wir hier von einer zweiparametrigen Lösungsschar. Für eine Differentialgleichung n-ter Ordnung hat eine solche allgemeine Lösung n frei wählbare Parameter. Durch zusätzliche Bedingungen, welche die Werte der Parameter festsetzen, erhält man aus der allgemeinen Lösung eine Partikulärlösung (oder spezielle Lösung). Wenn man beispielsweise weiß, dass für das obige Beispiel y am Ort x = 0 den Wert 0 besitzt, folgt: y(0) = A sin(0) +B cos(0) = B = 0. =0 (10.9) =1 Der Wert der ersten Ableitung am Ort x = 0 legt dann auch noch den Parameter A fest y (0) = A cos(0) −B sin(0) = A. =1 (10.10) =0 Wenn wir zum Beispiel wissen, dass y (0) = 1 ist, folgt A = 1. Die so genannten Anfangsbedingungen y(0) = 0 und y (0) = 1 legen also die Parameter A = 1 und B = 0 fest und führen so auf die Partikulärlösung y(x) = sin x. (10.11) Für eine allgemeine Lösung y(x) einer Differentialgleichung n-ter Ordnung werden die n Parameter durch Angabe des Funktionswertes y(x0 ) und der Werte der (n − 1) Ableitungen y (x0 ), y (x0 ), . . . , y (n−1) (x0 ) an einer Stelle x0 festgelegt. In diesem Fall spricht man von einem Anfangswertproblem oder einer Anfangswertaufgabe. Diese Bezeichnungsweise stammt natürlich von der Betrachtung einer Variablen y(t) als Funktion der Zeit t. Die Anfangsbedingungen y(t0 ), y (t0 ), . . . , y (n−1) (t0 ) beschreiben den Zustand des Systems zum Zeitpunkt t0 . Die Partikulärlösung beschreibt dann die zeitliche Entwicklung des Systems ausgehend von diesen Anfangsbedingungen. Alternativ dazu können wir die Parameter der allgemeinen Lösung auch durch Angabe der Funktionswerte y(x) an n verschiedenen Stellen x1 , x2 , . . . , xn festlegen. Die Funktionswerte an diesen Stellen werden Randwerte oder Randbedingungen genannt und man spricht in diesem Fall von einem Randwertproblem oder einer Randwertaufgabe. Im obigen Beispiel können wir etwa verlangen, dass y(x) an den Stellen x1 = 0 und x2 = π/2 die Werte y(x1 = 0) = 0 und y(x2 = π/2) = 2 besitzt. Diese Randbedingungen können wir durch 10 Differentialgleichungen 241 Wahl der Parameter A und B erfüllen: A sin(0) +B cos(0) = 0 =0 ⇒ B = 0, (10.12) ⇒ A = 2. (10.13) =1 A sin( π2 ) +B cos( π2 ) = 2 =1 =0 Die Partikulärlösung unter diesen Randbedingungen ist also y(x) = 2 sin x. (10.14) Zur analytischen Lösung von Differentialgleichungen gibt es kein allgemein gültiges Rezept. Es gibt aber einige wichtige gewöhnliche Differentialgleichungen, die wir lösen können. Diese Differentialgleichungen wollen wir im Folgenden diskutieren. Falls für eine gewöhnliche Differentialgleichung keine analytische Lösung existiert, kann man numerische Methoden verwenden, um Lösungen mit beliebiger Genauigkeit zu erhalten. Zur numerischen Integration von Differentialgleichungen existiert eine Vielzahl von Methoden, bei denen die Differentialgleichungen üblicherweise in kleinen Schritten gelöst werden. 10.2 Differentialgleichungen erster Ordnung Differentialgleichungen erster Ordnung enthalten nur die gesuchte Funktion y(x) selbst und ihre erste Ableitung y (x): F (x, y, y ) = 0 (10.15) y = f (x, y). (10.16) oder nach y aufgelöst Beispiele dafür sind y = xy, sin(y + x) cos y = x und y = √ y. (10.17) In dieser Form gibt die Differentialgleichung für jeden Punkt in der xy-Ebene eine Richtung (Steigung) vor. Damit y(x) eine Lösung der Differentialgleichung ist, muss ihr Graph diesen Richtungen in jedem Punkt folgen (siehe Abb. 10.1). Anschaulich ist klar, dass das Richtungsfeld y = f (x, y) für eine bestimmte Anfangsbedingung (x0 , y0 ) die Lösung der Differentialgleichung eindeutig festlegt. Im einfachsten Fall hängt die rechte Seite der Gleichung nicht von y ab und wir erhalten die Differentialgleichung y = f (x) oder dy = f (x). dx (10.18) Diese Differentialgleichung ist uns schon früher begegnet (im Kapitel über die Integration), nur haben wir sie damals nicht als Differentialgleichung bezeichnet. Das Auffinden einer Funktion y(x), sodass ihre Ableitung dy/dx gleich einer gegebenen Funktion f (x) ist, ist nämlich die Hauptaufgabe der Integralrechnung: Finde eine Funktion F (x) (die so genannte Stammfunktion), sodass für ihre Ableitung F (x) = f (x) gilt. Die Lösung y(x) der Differentialgleichung (10.18) ist nichts anderes als die Stammfunktion von f (x). Daher lautet die allgemeine Lösung der Differentialgleichung (10.18) % y(x) = f (x)dx + C, (10.19) wobei hier & f (x)dx das unbestimmte Integral ist, das von der Variablen x abhängt. 242 10 Differentialgleichungen Abbildung 10.1: Eine Differentialgleichung der Form y = f (x, y) gibt an jedem Punkt (x, y) die Steigung y vor. Die Lösungen der Differentialgleichung müssen tangential zu diesem Richtungsfeld sein. Durch Angabe der Anfangsbedingungen (x0 , y0 ) wählt man aus der Schar der möglichen Lösungen eine bestimmte Lösung aus. Die Integrationskonstante C ist hier der freie Parameter, der erst durch die Wahl der Anfangsbedingung (oder Randbedingung) festgelegt wird. Betrachten wir zum Beispiel die Differentialgleichung dy = x. dx (10.20) Die allgemeine Lösung dieser Gleichung ist y(x) = x2 /2 + C. Durch Ableitung von y(x) = x2 /2 + C nach x können wir explizit überprüfen, dass diese Funktion die Differentialgleichung tatsächlich erfüllt. Die Randbedingung y(0) = 1 legt die Konstante C fest: 02 +C =1 2 ⇒ C = 1. (10.21) Eine gewöhnliche Differentialgleichung erster Ordnung hat auch im allgemeinen Fall eine Lösungsschar, die einen freien Parameter c besitzt: y = y(x, c). Um diesen freien Parameter c festzusetzen, genügt für die Differentialgleichung erster Ordnung eine einzelne Anfangs- oder Randbedingung. Im Folgenden werden wir einige Differentialgleichungen erster Ordnung behandeln, die einfach genug sind, dass wir sie leicht analytisch lösen können. 10.2.1 Differentialgleichungen mit separierbaren Variablen Wenn sich eine Differentialgleichung erster Ordnung in der Form dy = f (x)g(y) dx (10.22) schreiben lässt, können wir sie auf einfache Weise lösen. Da die rechte Seite ein Produkt von zwei Funktionen ist, deren eine nur von x und die andere nur von y abhängt, können wir die Gleichung in der Form dy = f (x)dx g(y) (10.23) schreiben. Dabei haben wir die ursprüngliche Gleichung so umgeformt, dass die rechte Seite nur von y abhängt und die linke Seite nur von x. Wir haben die Variablen also separiert (d.h. getrennt). 10 Differentialgleichungen 243 Aus diesem Grund bezeichnet man Differentialgleichungen der Form y = f (x)g(y) als Differentialgleichung mit separierbaren Variablen. Aus dieser Gleichung für die beiden Differentiale folgt, dass sich die zugehörigen unbestimmten Integrale nur um eine willkürliche Konstante C unterscheiden können: % % dy = f (x)dx + C. (10.24) g(y) Nach Integration beider Seiten und Auflösung der Gleichung nach y erhält man die allgemeine Lösung der Differentialgleichung mit dem freien Parameter C in expliziter Form. Falls sich die erhaltene Gleichung nicht nach y auflösen lässt, ist die Lösung in impliziter Form gegeben. Mathematisch etwas exakter lassen sich Differentialgleichungen mit separierbaren Variablen wie folgt behandeln. Zunächst bestimmen wir die Nullstellen y1 , y2 , . . . der Funktion g(y). Durch Einsetzen in die Differentialgleichung erkennen wir, dass die konstanten Funktionen y(x) = y1 , y(x) = y2 , etc. Lösungen sind. Als nächstes betrachten wir die Differentialgleichung in den nullstellenfreien Intervallen zwischen den Nullstellen. Da in diesen Intervallen g(y) = 0, können wir die Differentialgleichung umformen zu: y = f (x). (10.25) g(y) Wir definieren nun die Funktion Φ(y) als die Stammfunktion von 1/g(y) und die Funktion F (x) als die Stammfunktion von f (x). Da in den betrachteten Intervallen Φ (x) = 1/g(x) nullstellenfrei ist, d. h. Φ streng monoton fallend oder wachsend ist, existiert hier die Umkehrfunktion Φ−1 von Φ. Durch Einsetzen in die Differentialgleichung können wir verifizieren, dass y(x) = Φ−1 (F (x) + C) (10.26) die Differentialgleichung löst: y (x) = = (Φ−1 ) (F (x) + C)F (x) f (x) f (x) = = f (x)g(y), Φ (Φ−1 (F (x) + C)) Φ (y) (10.27) wobei wir die Differentiationsregel (3.26) für die Umkehrfunktion verwendet haben. C ist hier wieder eine beliebige Integrationskonstante, die durch Wahl der Anfangsbedingungen festgelegt wird. Beispiel: Gegeben sei die Differentialgleichung xy + y = 0. Wir können diese Gleichung umformen zu dy dx =− . y x (10.28) ln y = − ln x + C. (10.29) Integration auf beiden Seiten ergibt: Wir wenden nun auf beide Seiten der Gleichung die Exponentialfunktion an und erhalten eln y = e− ln x+C = e− ln x · eC . (10.30) Somit gilt y= α , x (10.31) 244 10 Differentialgleichungen wobei wir die Konstante eC in α umbenannt haben. Die allgemeine Lösung ist also die einparametrige Kurvenschar y = α/x. Eine Anfangsbedingung (z. B. y(1) = α/1 = 2) setzt den freien Parameter fest (hier auf α = 2). Beispiel: Barometrische Höhenformel Als weiteres Beispiel wollen wir die Abhängigkeit des Luftdrucks von der Höhe in einer isothermen Atmosphäre betrachten. Dazu müssen wir zunächst eine geeignete Differentialgleichung aufstellen und sie danach auch lösen. (In den meisten Fällen ist das Aufstellen einer Gleichung der einfachere Schritt als die anschließende Lösung der Gleichung.) Der Luftdruck an einem bestimmten Ort wird durch das Gewicht der Luftsäule bestimmt, die sich über diesem Ort befindet. Wenn wir uns nach oben bewegen, wird die Luftmenge, die auf einer bestimmten Fläche lastet, immer kleiner. Daher nimmt der Luftdruck mit der Höhe ab. Um herauszufinden, auf welche Weise der Luftdruck von der Höhe abhängt, betrachten wir eine dünne Luftschicht, die parallel zum Boden ist und sich in der Höhe z befindet (siehe Abb. 10.2). (Wir messen die Höhe z bezüglich des Bodens, den wir in die xy-Ebene legen.) Abbildung 10.2: Der Druck an der Oberseite der Luftschicht mit der Dicke dz unterscheidet sich vom Druck an der Unterseite um das Gewicht pro Flächeneinheit der Luftschicht selbst. An der Unterseite dieser Schicht, also bei der Höhe z, herrscht der Druck p(z). Auf ihrer Oberseite ist der Druck leicht verschieden: p(z + dz) = p(z) + dp. Wir stellen uns jetzt vor, dass wir aus dieser Schicht einen dünnen Quader mit der Grundfläche A herausschneiden. Dieser Quader enthält die Masse ρ(z)dV = ρ(z)Adz an Luft, wobei hier dV = Adz das Volumen des Quaders ist. Der Druckunterschied zwischen der Höhe z und z + dz ist auf das Gewicht der Luftmassen in dieser Schicht zurückzuführen. Das Gewicht gρ(z)Adz der Luft im Quader wirkt auf die Fläche A. Die Druckdifferenz dp ergibt sich aus dieser Kraft dividiert durch die Fläche A (Druck ist Kraft pro Fläche): dp = − gρ(z)Adz = −gρ(z)dz. A (10.32) Das negative Vorzeichen ist notwendig, weil der Druck mit der Höhe abnimmt. Wir benötigen jetzt noch einen Ausdruck für die Dichte ρ der Luft. Die Dichte eines Gases hängt natürlich von den äußeren Bedingungen wie Temperatur und Druck ab. Wir nehmen hier an, dass wir die Luft als ideales Gas behandeln können. Für ein ideales Gas wird der Zusammenhang zwischen Druck p, Volumen V und Temperatur T durch die Zustandsgleichung pV = N kB T (10.33) beschrieben. Dabei ist N die Anzahl der Gasmoleküle und kB ist die so genannte Boltzmannkonstante. Der Druck eines idealen Gases ist demnach gegeben durch: p= N kB T . V (10.34) 10 Differentialgleichungen 245 Die rechte Seite dieser Gleichung hängt von der Teilchendichte N/V ab. Da wir jedoch an der Abhängigkeit des Druckes von der Massendichte ρ = M/V interessiert sind (M ist hier die Gesamtmasse des Gases im Volumen V ), multiplizieren wir Zähler und Nenner auf der rechten Seite der obigen Gleichung mit der Masse m eines individuellen Gasteilchens: p= M kB T kB T N mkB T = =ρ . Vm V m m (10.35) Hier haben wir ausgenutzt, dass die Gesamtmasse M gleich der Masse m einzelner Teilchen multipliziert mit der Anzahl N der Teilchen ist. Wir können die Dichte ρ somit ausdrücken als ρ= pm . kB T (10.36) Diese Beziehung setzen wir nun in Gleichung (10.32) ein und erhalten dp = −gρdz = − gm pdz. kB T (10.37) Diese Gleichung haben wir mit Hilfe von physikalischen Überlegungen aufgestellt. Was nun folgt ist die mathematische Lösung dieser Gleichung. Wir können die Variablen p und z separieren: dp gm =− dz. p kB T (10.38) Integration ergibt (unter der Annahme einer isothermen Atmosphäre, das heißt unter der Annahme, dass die Temperatur T nicht von der Höhe z abhängt und somit gm/kB T konstant ist): ln p = − gm z+C kB T oder durch Anwendung der Exponentialfunktion auf beiden Seiten: 7 6 gm z exp{C}. p = exp − kB T (10.39) (10.40) Die Konstante K ≡ exp{C} ermitteln wir, indem wir verlangen, dass bei z = 0 der Druck einen bestimmten p0 Wert annehmen muss: 7 6 gm 0 exp{C} = exp{C} = p0 . (10.41) p(0) = exp − kB T Somit erhalten wir schließlich die barometrische Höhenformel: 6 7 gm p = p0 exp − z . kB T (10.42) Beispiel: Kompression eines idealen Gases Stellen wir uns ein Rohr mit der Querschnittsfläche A vor, das auf einer Seite von einem beweglichen Kolben und auf der anderen Seite von einer unbeweglichen Wand abgeschlossen wird (siehe Abb. 10.3). Das eingeschlossene Volumen sei mit einem idealen Gas gefüllt, das der Zustandsgleichung pV = N kB T (10.43) gehorcht. Da im Gas ein gewisser Druck p vorherrscht, wirkt auf den Kolben eine Kraft F = Ap, die den Kolben nach außen drückt. Wenn wir das Gas nun komprimieren wollen, indem wir den 246 10 Differentialgleichungen Abbildung 10.3: Ein beweglicher Kolben leistet Arbeit gegen den Druck eines Gases in einem Zylinder. Kolben in das Rohr schieben, verrichten wir gegen diese Kraft Arbeit. Wir wollen bestimmen, welche Arbeit aufgebracht werden muss, um das Volumen von seinem ursprünglichen Wert V0 auf ein kleineres Volumen zu verringern. Dazu betrachten wir zunächst die Arbeit dW , die geleistet wird, wenn wir den Abstand x des Kolbens von der fixen Wand um einen kleinen Betrag dx verringern. Diese kleine Arbeit dW ergibt sich aus dem Produkt von Weg und Kraft dW = −F dx = −pAdx. (10.44) Bei einer Kompression ist die Verschiebung dx negativ. Da die gegen die (positive) Kraft F geleistete Arbeit jedoch positiv sein soll, haben wir in der obigen Gleichung ein negatives Vorzeichen. Durch die Verschiebung des Kolbens ändert sich das eingeschlossene Volumen um dV = Adx. (10.45) Wir können daher in Gleichung (10.44) Adx durch dV ersetzen: dW = −pdV. (10.46) Da sich durch die Kompression nicht nur das Volumen verändert sondern auch der Druck, müssen wir nun den Druck p als Funktion des Volumens V ausdrücken. Aus der Zustandsgleichung des idealen Gases folgt: p= N kB T . V (10.47) Einsetzen in Gleichung (10.46) ergibt: N kB T dV. (10.48) V Wenn wir die Kompression isotherm durchführen, das heißt, wenn die Temperatur des Gases durch Kontakt des Rohres mit einem Wärmebad konstant gehalten wird (dazu muss die Rohrwand natürlich wärmeleitend sein), ergibt die Integration: dW = − W = −N kB T ln V + C. (10.49) Dies ist die allgemeine Lösung der Differentialgleichung. Um eine passende Partikulärlösung zu erhalten, bemerken wir, dass zu Beginn des Prozesses noch keine Arbeit geleistet wurde. Wir verlangen also W (V0 ) = −N kB T ln V0 + C = 0. (10.50) Somit erhalten wir für die Konstante C: C = N kB T ln V0 . Die geleistete Arbeit ist demnach gegeben durch: W = N kB T ln V0 − N kB T ln V = N kB T ln (10.51) V0 V . (10.52) 10 Differentialgleichungen 10.2.2 247 Homogene lineare Differentialgleichung Eine allgemeine Differentialgleichung n-ter Ordnung F (x, y, y , y , . . . , y (n) ) nennt man linear, wenn die Funktion y und alle ihre n Ableitungen maximal in der 1. Potenz und nicht als Produkt auftreten: n ai (x)y (i) = g(x), (10.53) i=0 wobei wir hier die Konvention benutzen, dass y (0) = y. Beispiele für lineare Differentialgleichungen sind: y + ay + by = 0, y + sin x = 0, (10.54) (10.55) y + xy − cos x = 0. (10.56) Hingegen sind die folgenden Differentialgleichungen nichtlinear: y 2 + y = 0 xy y = 0 (zweite Potenz), (Produkt). (10.57) (10.58) Eine lineare Differentialgleichung 1. Ordnung hat die allgemeine Form y + f (x)y = g(x). (10.59) Die Funktion g(x) wird als Störterm oder Störfunktion bezeichnet. Falls der Störterm fehlt, haben wir es mit einer homogenen Differentialgleichung zu tun; falls ein Störterm existiert, nennt man die Differentialgleichung inhomogen. Die allgemeine homogene lineare Differentialgleichung 1. Ordnung hat die Form y + f (x)y = 0. (10.60) Diese Gleichung können wir durch Trennung der Variablen lösen: dy = −f (x)dx. y (10.61) Integration ergibt die allgemeine Lösung % ln y = − f (x)dx + C (10.62) oder anders ausgedrückt 6 % 7 6 % 7 y = exp − f (x)dx exp{C} = K exp − f (x)dx , (10.63) wobei wir die Konstante exp{C} in K umbenannt haben. Beispiel: Radioaktiver Zerfall Durch radioaktiven Zerfall können sich Atomkerne in andere Typen verwandeln. Wir wollen nun untersuchen, wie sich durch radioaktiven Zerfall die Anzahl der Atome der Ausgangssubstanz in einer radioaktiven Substanz mit der Zeit ändert. Da der Zerfall eines Atoms unabhängig von den Zerfällen der anderen Atome ist, zerfallen in einer doppelt so großen Menge von Atomen auch 248 10 Differentialgleichungen doppelt so viele Atome. Die Zahl dN der in einem kurzen Zeitintervall dt in einer radioaktiven Substanz zerfallenden Atome ist somit proportional zur Gesamtzahl N der vorhandenen Atome: dN = −λN dt. (10.64) Wir wählen hier ein negatives Vorzeichen, weil durch jeden Zerfall die Anzahl N der noch nicht zerfallenen Atome abnimmt. Die Proportionalitätskonstate λ, die Zerfallskonstante genannt wird, hängt vom Atomtyp ab. λ besitzt die Dimension 1/Zeit. Durch Separation der Variablen erhalten wir dN = −λdt. (10.65) N Integration liefert ln N = −λt + C (10.66) N (t) = e−λt+C = Ke−λt . (10.67) oder Die Randbedingung N (0) = N0 (Atomanzahl zum Zeitpunkt t = 0) setzt die Konstante K fest: N (0) = Ke−λ0 = K = N0 . (10.68) Das Zerfallsgesetz lautet also N (t) = N0 e−λt . (10.69) Die Anzahl der noch nicht zerfallenen Atome nimmt demnach exponentiell mit der Zeit ab (siehe Abb. 10.4). Nach der Zeit τ1/2 = ln 2/λ ist noch die Hälfte der ursprünglich vorhandenen Atome übrig. Man nennt diese Zeit die Halbwertszeit. Abbildung 10.4: Die Anzahl der noch nicht zerfallenen Atome einer radioaktiven Substanz nimmt mit der Zeit exponentiell ab. Nach der Halbwertszeit τ1/2 sind nur noch die Hälfte der Atome übrig. Beispiel: Exponentielles Wachstum Betrachten wir eine Population von Individuen, die sich vermehren können (z.B Bakterien in einer Nährlösung). Falls die Ressourcen nicht knapp sind, ist die Zunahme der Individuenanzahl proportional zur Individuenanzahl selbst: dN = λN dt. (10.70) Die Proportionalitätskonstante λ ist die Vermehrungsrate. Die Differentialgleichung (10.70) unterscheidet sich nur im Vorzeichen vor der Proportionalitätskonstanten von der Differentialgleichung (10.64) im vorherigen Beispiel. Derselbe Lösungsweg führt uns in diesem Fall zu N (t) = N0 eλt . (10.71) 10 Differentialgleichungen 249 Die Populationsgröße nimmt exponentiell (also explosionsartig) zu. Für biologische Systeme kann ein solches Wachstum natürlich nur weitergehen, bis die Ressourcen sich verknappen. Dann wird λ schrumpfen und das Wachstum verlangsamen. Beispiel: Bewegung mit Reibung Wir betrachten einen Körper der Masse m, der sich unter dem Einfluss einer Reibungskraft entlang einer Geraden bewegt. Die Bewegung des Körpers wird durch die Newtonsche Bewegungsgleichung F = mv̇ (10.72) beschrieben, wobei F die Kraft auf den Körper und v seine Geschwindigkeit ist. Die Kraft setzen wir als proportional zur Geschwindigkeit und als der Bewegungsrichtung entgegengesetzt an: F = −γv. (10.73) (Für einen kugelförmigen Körper mit Radius R in einer Flüssigkeit mit der Zähigkeit η gilt etwa für niedrige Geschwindigkeiten das Stokessche Reibungsgesetz: F = −6πηRv.) In der obigen Gleichung ist γ die so genannte Reibungskonstante. Einsetzen dieses Ausdrucks in die Bewegungsgleichung ergibt: v̇ = γ dv = − v. dt m (10.74) Separation der Variablen und anschließende Integration liefert: γ v = v0 e− m t . (10.75) Dabei ist v0 die Geschwindigkeit zum Zeitpunkt t = 0. Das heißt, das Teilchen bleibt asymptotisch stehen. Um die Zeitabhängigkeit des Ortes x zu bestimmen, können wir wieder die Variablen separieren: γ dx = v0 e− m t dt. (10.76) Integration liefert: x=− v0 m − γ t e m + C. γ (10.77) Die Anfangsbedingung x(t = 0) = x0 setzt die Konstante C fest: C = x0 + Somit erhalten wir x(t) = x0 + v0 m . γ γ v0 m 1 − e− m t . γ (10.78) (10.79) Das heißt, der Körper erreicht für t → ∞ die asymptotische Position (siehe Abb. 10.5) x∞ = x0 + 10.2.3 v0 m . γ (10.80) Inhomogene lineare Differentialgleichung Die allgemeine Form einer inhomogenen linearen Differentialgleichung 1. Ordnung ist y + f (x)y = g(x). (10.81) 250 10 Differentialgleichungen Abbildung 10.5: In einer zähen Flüssigkeit nähert sich ein Körper, auf den keine äußere Kraft wirkt, exponentiell seiner asymptotischen Position x∞ . Die insgesamt zurückgelegte Distanz ist v0 m/γ. Im Gegensatz zur homogenen linearen Differentialgleichung verschwindet für die inhomogene Gleichung der Störterm g(x) nicht. Um die allgemeine Lösung dieser Differentialgleichung zu finden, genügt es, eine beliebige Partikulärlösung yp zu bestimmen, die dann einfach zur allgemeinen Lösung der homogenen Gleichung yh addiert wird: y = yh + yp . (10.82) yh + f (x)yh = 0, (10.83) Da yh die homogene Gleichung erfüllt, und yp eine Partikulärlösung der inhomogenen Gleichung ist, yp + f (x)yp = g(x), (10.84) erfüllt auch (yp + yh ) die inhomogene Gleichung : (yp + yh ) + f (x)(yp + yh ) = yp + f (x)yp + yh + f (x)yh = g(x). =g(x) (10.85) =0 Da wir aus dem letzten Abschnitt schon wissen, wie wir durch Variablenseparation die allgemeine Lösung der homogenen Gleichung ermitteln können, müssen wir uns nur noch um die Bestimmung einer beliebigen Partikulärlösung der inhomogenen Gleichung kümmern. In manchen Fällen können wir eine geeignete Partikulärlösung erraten oder durch einen einfachen Ansatz bestimmen. Beispiel: Betrachten wir zum Beispiel die Differentialgleichung xy − y = x2 . (10.86) Zunächst lösen wir die homogene Differentialgleichung xy − y = 0 durch Variablenseparation: dy dx = . y x (10.87) ln y = ln x + C, (10.88) Integration ergibt woraus folgt yh = kx, (10.89) 10 Differentialgleichungen 251 wobei wir k = eC gesetzt haben. Durch Probieren finden wir, dass yp = x2 die inhomogene Gleichung löst, xy − y = x2x − x2 = 2x2 − x2 = x2 . (10.90) Die allgemeine, einparametrige Lösungsschar der Differentialgleichung xy −y = x2 ist also gegeben durch: y = yp + yh = x2 + kx. (10.91) Durch Einsetzen können wir uns davon überzeugen, dass diese Funktion tatsächlich eine Lösung der inhomogenen Differentialgleichung ist. Eine etwas systematischere Methode zum Auffinden einer Partikulärlösung einer inhomogenen Differentialgleichung ist die so genannte Variation der Konstanten. Bei diesem Verfahren fasst man die Konstante k in der allgemeinen Lösung yh der homogenen Gleichung als eine Funktion von x auf, k = k(x). Diesen Ansatz setzt man dann in die inhomogene Differentialgleichung und erhält dadurch eine Differentialgleichung für k(x), die man durch Separation der Variablen lösen kann. Beispiel: Wir lösen die Differentialgleichung aus dem vorangehenden Beispiel nun auch durch Variation der Konstanten. Dazu betrachten wir die Konstante k in der Lösung yh = kx als Funktion von x: y = k(x) · x. (10.92) Diesen Ausdruck setzen wir nun in die inhomogene Differentialgleichung ein und erhalten nach Anwendung der Produktregel für die Differentiation von k(x) · x die Gleichung: xy − y = x(k(x) · x) − k(x) · x = x(k (x) · x + k(x)) − k(x)x −xk(x) = k (x)x2 +xk(x) = k (x)x2 = x2 . (10.93) Die Differentialgleichung für k(x) lautet also k (x) = dk = 1. dx (10.94) Integration durch Variablentrennung liefert k(x) = x. (Eine Konstante C benötigen wir hier nicht, da wir nur an einer Partikulärlösung der inhomogenen Differentialgleichung interessiert sind.) Die gesuchte Partikulärlösung für die inhomogene Gleichung ist also yp = k(x)x = x2 . (10.95) Für die allgemeine Lösung der inhomogenen Gleichung erhalten wir somit wie oben y = yp + yh = x2 + kx. (10.96) Diesen Lösungsweg durch Variation der Konstanten können wir auch auf die allgemeine Form y + f (x)y = g(x) (10.97) der inhomogenen Differentialgleichung anwenden. (Falls die Gleichung nicht diese Form hat sondern h(x)y + f (x)y = g(x), dividieren wir durch h(x).) Wir lösen zuerst die homogene Gleichung durch Separation der Variablen: dy = −f (x)dx. y (10.98) 252 10 Differentialgleichungen Wir integrieren und erhalten als allgemeine Lösung % ln y = − f (x)dx + C (10.99) oder, durch Anwendung der Exponentialfunktion auf beide Seiten, 6 % 7 y = k exp − f (x)dx , (10.100) wobei wir wieder k für eC geschrieben haben. Wir machen jetzt den Ansatz 6 % 7 y = k(x) exp − f (x)dx (10.101) und setzen ihn in die inhomogene Gleichung ein: # 6 % 7$ 6 % 7 d k(x) exp − f (x)dx + k(x) exp − f (x)dx f (x) = g(x). dx (10.102) Zur Auswertung des ersten Terms in der obigen Gleichung verwenden wir die Produktregel # 6 % 7$ d k(x) exp − f (x)dx = dx 6 % 7 6 % 7 # % $ d dk exp − f (x)dx + k(x) exp − f (x)dx − f (x)dx . (10.103) dx dx =−f (x) Somit erhalten wir 6 % 7 6 % 7 k (x) exp − f (x)dx − k(x) exp − f (x)dx f (x) 6 % 7 + k(x) exp − f (x)dx f (x) = g(x). Der zweite und dritte Term heben einander auf und somit erhalten wir: 6 % 7 k (x) exp − f (x)dx = g(x). (10.104) (10.105) Wir formen diese Gleichung um zu 6% dk = g(x) exp 7 f (x)dx dx, integrieren sie dann und erhalten 6% 7 % k = g(x) exp f (x)dx dx + C. (10.106) (10.107) Einsetzen dieses Ausdrucks in Gleichung (10.101) liefert schließlich die Partikulärlösung #% 6% 7 $ 6 % 7 g(x) exp f (x)dx dx + C exp − f (x)dx . (10.108) yp (x) = Zweckmäßiger, als sich diese Formel zu merken, ist es, sich den allgemeinen Lösungsweg anzueignen, um ihn bei Bedarf direkt auf die gegebene Differentialgleichung anzuwenden. Zusammenfassend halten wir fest, dass wir die lineare inhomogene Differentialgleichung lösen können, indem wir 1. die allgemeine Lösung yh der homogenen Differentialgleichung bestimmen, 10 Differentialgleichungen 253 2. dann durch Variation der Konstanten eine Partikulärlösung yp der inhomogenen Gleichung ermitteln, und schließlich 3. yh und yp addieren, um die allgemeine Lösung der inhomogenen Differentialgleichung zu erhalten: y(x) = yh (x) + yp (x). (10.109) Beispiel: Radioaktiver Zerfall mit Erzeugung der radioaktiven Substanz Wir betrachten wieder den Zerfall einer radioaktiven Substanz, jetzt aber in einer Situation, in der zum Beispiel in einem Reaktor die radioaktive Substanz ständig nachgeliefert wird. Pro Zeiteinheit werden vom Reaktor r Atome erzeugt. Das heißt, dass rdt Atome im Zeitintervall dt dazukommen. Diese dazukommenden Atome müssen auch in der Differentialgleichung für N , die Anzahl der Atome, berücksichtigt werden: dN = −λN dt + rdt (10.110) dN = −λN + r, dt (10.111) oder, äquivalent dazu, wobei r eine Konstante ist. Dies ist eine inhomogene lineare Differentialgleichung. Die Lösung der homogenen Gleichung kennen wir bereits: Nh = Ke−λt . (10.112) Durch Variation der Konstanten ermitteln wir jetzt noch eine Partikulärlösung für die inhomogene Gleichung. Wir setzen an Np = K(t)e−λt (10.113) dNp dK(t) −λt = e + K(t)(−λ)e−λt . dt dt (10.114) und erhalten dadurch Einsetzen in die Differentialgleichung ergibt dK −λt −λt −λt e − λKe = − λKe + r, dt (10.115) woraus folgt dK −λt e =r dt oder dK = eλt r. dt (10.116) Integration liefert 1 K = r eλt λ (10.117) r λt −λt r e ·e = . λ λ (10.118) und somit Np = Die allgemeine Lösung der Differentialgleichung ist also N (t) = Nh (t) + Np (t) = Ke−λt + r . λ (10.119) 254 10 Differentialgleichungen Für t → ∞ ist e−λt → 0 und N strebt dem Gleichgewichtswert r/λ zu. Wir müssen nun noch die Konstante K aus den Anfangsbedingungen bestimmen. Wurde der Reaktor etwa zum Zeitpunkt t = 0 in Betrieb genommen, sodass N (0) = 0, folgt 0=K+ r λ (10.120) und infolgedessen: N (t) = r 1 − e−λt . λ (10.121) Für t → ∞ ist e−λt → 0 und N strebt dem Gleichgewichtswert r/λ zu. Konstanter Störterm und konstante Koeffizienten Falls die Koeffizienten der Differentialgleichung 1. Ordnung konstant sind, können wir die Differentialgleichung y + ay = b (10.122) mit einem konstanten Störterm b auch durch Variablenseparation lösen. Wir formen die obige Gleichung um zu: dy = b − ay. dx (10.123) dy = dx. b − ay (10.124) Daraus folgt: Wir führen nun die neue Variable u = b − ay ein und führen eine Variablentransformation von y nach u durch. Da du = −ady ist, gilt du = dx −au oder du = −adx. u (10.125) Integration ergibt ln u = −ax + C (10.126) oder, nach Anwendung der Exponentialfunktion auf beiden Seiten der Gleichung, u = e−ax eC = ke−ax . (10.127) Rücktransformation nach y liefert schließlich: y= b k − e−ax . a a (10.128) Beispiel: Radioaktiver Zerfall mit Erzeugung der radioaktiven Substanz Wir behandeln das letzte Beispiel noch einmal mit dem oben beschriebenen Ansatz und formen zunächst die Differentialgleichung dN dt = −λN + r (10.129) = dt. (10.130) um zu dN −λN + r 10 Differentialgleichungen 255 Abbildung 10.6: Die Anzahl von Atomen einer radioaktiven Substanz nähert sich exponentiell einer Gleichgewichtsanzahl, die sowohl von der Zerfallskonstanten λ als auch von der Erzeugungsrate r abhängt. Integration liefert − 1 ln(−λN + r) = t + C, λ (10.131) woraus folgt: N (t) = 1 (r − k exp {−λt}), λ (10.132) wobei wir k = exp(−λC) gesetzt haben. Die Anfangsbedingung N (t = 0) = N0 liefert N0 = k r − λ λ ⇒ k = r − λN0 (10.133) und wir erhalten schließlich (siehe Abb. 10.6) N (t) = r r −λt + N0 − e . λ λ (10.134) Dies stimmt mit der bereits erhaltenen Lösung überein. Beispiel: Bewegung mit Reibung im Gravitationsfeld Wir betrachten nun ein Teilchen mit Masse m, das in einer viskosen Flüssigkeit im Gravitationsfeld der Erde nach unten fällt (siehe Abb. 10.7). Abbildung 10.7: Eine Kugel der Masse m sinkt unter der Wirkung der Gravitationskraft in einer viskosen Flüssigkeit. 256 10 Differentialgleichungen Wir lassen den Körper zur Zeit t = 0 an der Stelle x0 los und geben ihm eine Anfangsgeschwindigkeit v0 . Gesucht sind Position x und Geschwindigkeit v des Teilchens als Funktion der Zeit t. Die x-Achse ist hier nach unten orientiert. Die Bewegungsgleichung für das Teilchen ist F = ma F dv = . dt m oder (10.135) Die Kraft, die auf das Teilchen wirkt, besteht einerseits aus der Gravitationskraft Fg = gm und andererseits aus der Reibungskraft Fr = −γv, welche der Bewegungsrichtung entgegengesetzt ist: F = gm − γv. (10.136) γ dv = g − v. dt m (10.137) Einsetzen ergibt: Diese Differentialgleichung unterscheidet sich nur durch den konstanten Term g von der Bewegungsgleichung (10.74). Aus Gleichung (10.137) folgt dv = dt g − γv m (10.138) und nach Transformation zur neuen Variablen u = g − γv m γ wegen du = − m dv du γ = − dt. u m (10.139) Durch Integration finden wir ln u = − γ t + C, m (10.140) was bedeutet γ γ u = e− m t eC = ke− m t . (10.141) Durch Rücksubstitution finden wir g− und somit v= γ γv = ke− m t m γ m g − ke− m t . γ (10.142) (10.143) Aus der Anfangsbedingung v(0) = v0 erhalten wir k=g− v0 γ m (10.144) und infolgedessen v= oder v= mg − γ γ mg − v0 e− m t γ γ γ mg 1 − e− m t + v0 e− m t . γ (10.145) (10.146) Das heißt, dass sich die Geschwindigkeit v von der Anfangsgeschwindigkeit v0 ausgehend der asymptotischen Geschwindigkeit von mg/γ exponentiell nähert (siehe Abb. 10.8). Sobald diese Geschwindigkeit erreicht ist, halten sich mg und −γv genau die Waage. Falls das Teilchen zum Zeitpunkt t = 0 in Ruhe ist, gilt v = (mg/γ) 1 − e−(γ/m)t . 10 Differentialgleichungen 257 Abbildung 10.8: Die Geschwindigkeit v nähert sich exponentiell der Endgeschwindigkeit mg/γ, bei der sich Reibungskraft und Gravitationskraft genau die Waage halten. Die Konstante γ/m gibt uns ein Maß dafür, wie lange es dauert, bis das Teilchen seine Endgeschwindigkeit erreicht hat. Nach t = m/γ ist die ursprüngliche Differenz der Geschwindigkeit zur Endgeschwindigkeit auf den Bruchteil 1/e abgefallen. Falls etwa v0 = 0, unterscheidet sich die Geschwindigkeit nach t = 5m/γ nur mehr um 0.7 % von der Endgeschwindigkeit und nach t = 15m/γ beträgt der Unterscheid nur mehr 3.1 × 10−5 %. Nach einer Zeit t m/γ fällt das Teilchen also im Wesentlichen mit konstanter Geschwindigkeit durch die viskose Flüssigkeit. Um den Ort x als Funktion der Zeit zu bestimmen, gehen wir aus von der Differentialgleichung γ mg dx mg v= = − − v0 e− m t , (10.147) dt γ γ die wir einfach durch Variablenseparation integrieren können: γ mg m mg x = t− − v0 e− m t · − +C γ γ γ γ m mg mg t+ − v0 e− m t + C. = γ γ γ Die Konstante C bestimmen wir aus der Anfangsbedingung x(0) = x0 : m mg − v0 + C. x0 = γ γ (10.148) (10.149) Folglich gilt C = x0 − m γ mg − v0 γ (10.150) und wir erhalten damit x = = γ m mg m mg mg − v0 + t+ − v0 e− m t x0 − γ γ γ γ γ γ m mg mg 1 − e− m t . t− − v0 x0 + γ γ γ (10.151) Da der Term e−(γ/m)t schnell gegen 0 geht, dominiert für Zeiten, die lang sind im Vergleich zu m/γ, der lineare Term (das Teilchen fällt dann mit konstanter Geschwindigkeit). Für lange Zeiten t m/γ gilt dann m mg mg t− − v0 . x(t) ≈ x0 + (10.152) γ γ γ 258 10.3 10 Differentialgleichungen Differentialgleichungen zweiter Ordnung Differentialgleichungen zweiter Ordnung sind bei weitem komplexer (und deswegen auch interessanter) als Differentialgleichungen erster Ordnung. Zu den wichtigen Differentialgleichungen zweiter Ordnung, die einem in der Physik gleich in den ersten Semestern begegnen, gehören die Newtonsche Bewegungsgleichung und insbesondere die Schwingungsgleichung, mit der wir uns im Folgenden vor allem beschäftigen werden. Die allgemeine Form einer Differentialgleichung zweiter Ordnung ist F (x, y, y , y ) = 0. (10.153) Wir konzentrieren uns hier auf die lineare Differentialgleichung zweiter Ordnung, die die Form y (x) + p(x)y (x) + q(x)y(x) = g(x) (10.154) besitzt. Falls der Störterm g(x) verschwindet, spricht man auch hier von einer homogenen Differentialgleichung, anderenfalls von einer inhomogenen Differentialgleichung. Besonders einfach (und trotzdem sehr wichtig) sind Differentialgleichungen 2. Ordnung, bei denen die Koeffizienten p(x) und q(x) konstant sind. Für diese besondere Form betrachten wir zunächst den homogenen Fall. 10.3.1 Homogene Differentialgleichung mit konstanten Koeffizienten Die homogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten hat die allgemeine Form: y + ay + by = 0. (10.155) Für eine lineare Differentialgleichung gilt, dass, wenn y(x) eine Lösung ist, auch das Produkt cy(x) dieser Funktion mit einer Konstanten eine Lösung ist. Dies gilt, da (cy) = cy und (cy) = cy . Weiters ist die Summe zweier Lösungen y1 und y2 auch eine Lösung der Differentialgleichung, da gilt (y1 + y2 ) = y1 + y2 und (y1 + y2 ) = y1 + y2 (die Differentiation ist ein linearer Operator). Allgemeiner: jede Linearkombination y = c1 y 1 + c2 y 2 (10.156) von zwei Lösungen y1 , y2 ist ebenfalls eine Lösung der Differentialgleichung. Man nennt diesen Sachverhalt das Superpositionsprinzip. Die Konstanten c1 und c2 können hier reelle aber auch komplexe Zahlen sein. Um die zwei freien Parameter einer Differentialgleichung 2. Ordnung zu bestimmen, brauchen wir zwei Anfangs- oder Randbedingungen. Für eine homogene lineare Differentialgleichung mit konstanten Koeffizienten können wir mit Hilfe des exponentiellen Ansatzes y = Aeλx immer Lösungen finden, da durch Differentiation von eλx nach x nur ein zusätzlicher Faktor λ entsteht. Dadurch sind alle Ableitungen von y nach x proportional zueinander. Einsetzen des Ansatzes y = Aeλx in die Differentialgleichung (10.155) liefert: Aλ2 eλx + aAλeλx + bAeλx = 0. (10.157) Da eλx > 0 und da A = 0 nur der trivialen Lösung y = 0 entspricht, können wir beide Seiten dieser Gleichung durch Aeλx dividieren und erhalten λ2 + aλ + b = 0. (10.158) Dies ist eine quadratische Gleichung für λ, die so genannte charakteristische Gleichung, mit den Lösungen: √ −a ± a2 − 4b . (10.159) λ1,2 = 2 10 Differentialgleichungen 259 Nur für diese bestimmten Werte von λ löst der exponentielle Ansatz y = A exp(λx) die Differentialgleichung. Der exponentielle Ansatz kann natürlich auch für homogene lineare Differentialgleichungen höherer Ordnung mit konstanten Koeffizienten verwendet werden. In diesem Fall hat die Differentialgleichung die allgemeine Form an y (n) + an−1 y (n−1) + · · · + a1 y + a0 y = 0 (10.160) oder n ai y (i) (x) = 0, (10.161) i=0 wobei die ai konstante Koeffizienten sind und wir festlegen, dass y (0) = y. Einsetzen des exponentiellen Ansatzes y = Aeλx und anschließende Division ergibt: n ai λi = 0 = a0 + a1 λ + a2 λ2 + · · · + an λn . (10.162) i=0 Diese algebraische Gleichung n-ten Grades hat genau n möglicherweise komplexe Lösungen λ1 , λ2 , . . . , λn , mit denen man allgemeine Lösungen der Differentialgleichung (10.160) konstruieren kann. Kehren wir nun nach diesem kurzen Exkurs über Differentialgleichungen höherer Ordnung wieder zu den Differentialgleichungen zweiter Ordnung zurück. Nach Gleichung (10.159) erfüllt der Ansatz y = Aeλx genau für die Werte λ1,2 = −a/2 ± a2 /4 − b die ursprüngliche Differentialgleichung. Diese beiden speziellen Werte werden Eigenwerte der Differentialgleichung genannt. Falls a2 /4 − b ≥ 0, sind die beiden Eigenwerte reell. Anderenfalls sind sie beide komplex und zueinander komplex konjugiert. Wie wir später noch genauer sehen werden, lassen sich aus Lösungen mit komplex konjugierten Eigenwerten λ1 und λ2 durch Superposition immer reelle Lösungen konstruieren. Wenn wir die Eigenwerte λ1 = α + iβ und λ2 = α − iβ haben (α und β reell) mit zugehörigen Lösungen y1 = eλ1 x und y2 = eλ2 x , können wir die reellen Lösungen λ1 x iβx eλ2 x e e + e−iβx αx + y1 = (10.163) =e = eαx cos βx 2 2 2 und y2 = eλ1 x eλ2 x − 2i 2i =e αx eiβx − e−iβx 2i = eαx sin βx (10.164) konstruieren. Durch Superposition der Lösungen, die zu den Eigenwerten λ1 und λ2 gehören, erhalten wir die allgemeine Lösung der Differentialgleichung, die zwei freie Parameter A1 und A2 enthält: y = A1 eλ1 x + A2 eλ2 x (10.165) oder, falls die Eigenwerte komplex sind und wir eine reelle Lösung wollen, y = A1 eαx cos βx + A2 eαx sin βx. (10.166) Die freien Parameter A1 und A2 müssen durch Anfangs- oder Randbedingungen festgelegt werden. Beispiel: Wir betrachten ein ideal biegsames Seil der Länge l, das reibungslos über die Kante eines Tisches gleitet (siehe Abb. 10.9). Wir wollen nun die genaue Lage des Seils sowie seine Geschwindigkeit als Funktion der Zeit bestimmen. Dazu legen wir fest, dass die Koordinate x die Länge des überhängenden Teils des Seils bezeichnet. Die Newtonsche Bewegungsgleichung für das Seil lautet m d2 x = F, dt2 (10.167) 260 10 Differentialgleichungen Abbildung 10.9: Ein biegsames Seil wird von der Gravitationskraft von einem Tisch gezogen. wobei m die Gesamtmasse des Seils ist. Die auf das Seil wirkende Kraft F ist gleich dem Gewicht des herabhängenden Teils. Da die Masse dieses Teils gleich mx/l ist, ergibt sich für die Kraft F = gmx/l und somit gmx d2 x = 2 dt l (10.168) d2 x gx = 0. − dt2 l (10.169) x(t) = Aeλt (10.170) m oder, nach Division durch m: Wir setzen nun als Lösung an. Einsetzen in die Differentialgleichung ergibt: d2 λt g λt Ae Ae − =0 dt2 l (10.171) g Aλ2 eλt − Aeλt = 0. l (10.172) und somit Nach Division durch Aeλt erhalten wir die charakteristische Gleichung g λ2 − = 0, l woraus folgt: " g . λ1,2 = ± l Beide Eigenwerte sind also reell. Die allgemeine Lösung der Differentialgleichung ist: √g √g x(t) = A1 e+ l t + A2 e− l t . (10.173) (10.174) (10.175) Wenn wir uns vorstellen, dass das Seil anfänglich ruht und ein Stück der Länge x0 überhängt, v(0) = 0 und x(0) = x0 , (10.176) können wir aus diesen Bedingungen die Konstanten A1 und A2 bestimmen: x(0) = A1 + A2 = x0 und " v(0) = A1 g − A2 l " g = 0. l (10.177) (10.178) Aus der zweiten Bedingung folgt A1 = A2 , was, eingesetzt in die erste Bedingung, A1 = A2 = x0 /2 ergibt. Somit ist die Lösung für diesen speziellen Fall gegeben durch (siehe Abb. 10.10): " √g x0 +√ g t g − t l l x(t) = t . (10.179) +e = x0 cosh e 2 l 10 Differentialgleichungen 261 Abbildung 10.10: Der überhängende Anteil x des Seiles ist eine rasch anwachsende Funktion der Zeit: x = x0 cosh( g/lt). 10.3.2 Der harmonische Oszillator Schwingungen mit kleinen Amplituden führen uns immer zur so genannten Schwingungsgleichung, die sich von Fall zu Fall nur durch den Wert und die Bedeutung der Koeffizienten sowie die Bedeutung der Variablen unterscheidet. Betrachten wir zum Beispiel einen Massenpunkt der Masse m, der an einer gewichtslosen und undehnbaren Schnur der Länge l aufgehängt ist und im Erdschwerefeld hin und her pendeln kann (siehe Abb. 10.11). Den Zustand eines solchen Pendels beschreiben wir durch den Winkel x, den der Faden mit dem Lot bildet. Abbildung 10.11: Ein Massenpunkt der Masse m hängt an einer Schnur der Länge l. Die rückstellende Kraft Ft ist die Komponente der Gravitationskraft F , die tangential zur Kreisbahn des Massenpunkts steht. s ist die Entfernung entlang des Kreisbogens des Massenpunktes von seiner Ruhelage. Auf den Massenpunkt wirkt die Gravitationskraft F = mg senkrecht nach unten. Wenn das Pendel um einen Winkel x aus der Ruhelage ausgelenkt ist, wirkt die Komponente Fr = mg cos x in Richtung der Schnur und hat daher keine Wirkung. Die Komponente Ft = mg sin x hingegen wirkt normal zur Schnur und in Richtung zurück zur Ruhelage. Die Bewegungsgleichung für das Pendel 262 10 Differentialgleichungen ist ma = m d2 s = −Ft , dt2 (10.180) wobei s = xl die Entfernung des Massenpunktes von seiner Ruhelage längs des Kreisbogens ist. Das Minuszeichen in der Gleichung (10.180) ist notwendig, da die Richtung der Kraft der Auslenkung x entgegengesetzt ist. (Die Kraft −Ft nennt man übrigens die Rückstellkraft.) Ft ist die Kraft, die normal zur Schnur, also in Richtung der Bahnkurve wirkt. Einsetzen von s und Ft in Gleichung (10.180) ergibt: d2 lx = −mg sin x dt2 (10.181) g d2 x sin x. = − dt2 l (10.182) m oder, da l konstant ist, Für kleine Auslenkungen gilt sin x ≈ x und wir erhalten in dieser Näherung die Schwingungsgleichung: g d2 x x. (10.183) = − dt2 l Da es sich später als günstig herausstellen wird, setzen wir (g/l) = ω02 . Die Gleichung (10.183) wird damit zu d2 x = −ω02 x. dt2 (10.184) Dies ist die allgemeine Gleichung des (eindimensionalen) harmonischen Oszillators, bei dem die Rückstellkraft proportional zur Auslenkung ist. Das heißt, F = −kx. Die Konstante k wird übrigens die Federkonstante oder auch die Kraftkonstante genannt. Für eine solche Kraft ergibt sich die Bewegungsgleichung m d2 x = −kx dt2 oder wieder d2 x = −ω02 x, dt2 (10.185) wobei wir ω02 = k/m gesetzt haben. Das ist die Bewegungsgleichung für ein eindimensionales Teilchen der Masse m mit einer parabolischen potentiellen Energie V (x) = kx2 /2 (siehe Abb. 10.12). Die Kraft ergibt sich aus diesem Potential durch Bildung der ersten Ableitung, F = −dV /dx = −kx. Abbildung 10.12: In einem parabolischen Potential V (x) = kx2 /2 führt ein Massenpunkt der Masse m eine harmonische Bewegung mit der Periode T = 2π m/k aus. Wir wollen nun die Gleichung des harmonischen Oszillators lösen. Der Ansatz x = Aeλt liefert die charakteristische Gleichung λ2 + ω02 = 0. (10.186) 10 Differentialgleichungen 263 Die Eigenwerte dieser Gleichung sind rein imaginär: λ1,2 = ± −ω02 = ±iω0 . (10.187) Aus den beiden komplexen Lösungen x1 = eiω0 t und x2 = e−iω0 t (10.188) konstruieren wir die reellen Lösungen 1 iω0 t e + e−iω0 t = cos ω0 t, 2 1 iω0 t e x2 = − e−iω0 t = sin ω0 t. 2i x1 = (10.189) (10.190) Die allgemeine Lösung der Differentialgleichung für den harmonischen Oszillator ist also x = A cos ω0 t + B sin ω0 t. (10.191) Diese Lösung lässt sich auch schreiben als x = C sin(ω0 t + ϕ), (10.192) wobei C die Amplitude der Schwingung und ϕ die so genannte Phasenverschiebung ist. Der Zusammenhang dieser beiden Lösungen lässt sich mit Hilfe des Additionstheorems für die Sinusfunktion herstellen: C sin(ω0 t + ϕ) x = = = C(sin ω0 t cos ϕ + sin ϕ cos ω0 t) (C cos ϕ) sin ω0 t + (C sin ϕ) cos ω0 t. (10.193) Daraus folgt A = C sin ϕ und B = C cos ϕ (10.194) oder umgekehrt ϕ = arctan A B und C= A2 + B 2 . (10.195) Gemäß Gleichung (10.191) oder Gleichung (10.192) führt der harmonische Oszillator eine periodische Schwingung mit Kreisfrequenz ω0 aus. Die freien Parameter A und B, beziehungsweise C und ϕ, können durch die Anfangsbedingungen zum Zeitpunkt t = 0 bestimmt werden. Für x(0) = x0 und dx(t = 0)/dt = v0 ergibt sich: A cos 0 + B sin 0 = −ω0 A sin 0 + ω0 B cos 0 = A = x0 , (10.196) ω0 B = v0 . (10.197) v0 . ω0 (10.198) Daraus folgt A = x0 und B= Die Phase ϕ und die Amplitude C sind ϕ = arctan ω0 x0 v0 ) und C= x20 + v0 ω0 2 . (10.199) Die Lösung für die Anfangsbedingungen x(0) = x0 und v(0) = v0 ist also x = x0 cos ω0 t + v0 sin ω0 t ω0 (10.200) 264 10 Differentialgleichungen Abbildung 10.13: Die Lösung der Differentialgleichung des eindimensionalen harmonischen Oszillators ist eine Sinusfunktion, deren Amplitude und Phase von den Anfangsbedingungen x0 und v0 abhängen. Die Steigung der Kurve zum Zeitpunkt t = 0 ist v0 . oder, etwas anders geschrieben, ) x= x20 + v0 ω0 # 2 sin ω0 t + arctan ω0 x0 v0 $ . (10.201) Die trigonometrischen Funktionen sind periodisch mitPeriode 2π. Das bedeutet, dass der harmonische Oszillatoreine Periode von T = 2π/ω0 = 2π m/k und eine Frequenz von f = 1/T = ω0 /2π = (1/2π) k/m hat. Man bezeichnet ω0 auch als die Kreisfrequenz. 10.3.3 Die gedämpfte Schwingung Bis jetzt haben wir angenommen, dass der Oszillator reibungsfrei schwingen kann. Falls jedoch Reibungskräfte wirksam sind, müssen diese auch in der Differentialgleichung berücksichtigt werden. Mit einer zur Geschwindigkeit proportionalen Reibungskraft F = −γdx/dt wird die Bewegungsgleichung zu m dx d2 x = −kx − γ . dt2 dt (10.202) Hier hat die Reibungskraft ein negatives Vorzeichen, da sie der Bewegung entgegengerichtet ist. Wir dividieren durch m, setzen ω0 = k/m und 2β = γ/m und erhalten dx d2 x + ω02 x = 0. + 2β dt2 dt (10.203) Der Ansatz x = Aeλt liefert die charakteristische Gleichung: λ2 + 2βλ + ω02 = 0. (10.204) Diese quadratische Gleichung hat die Lösungen λ1,2 = −β ± β 2 − ω02 . (10.205) Abhängig von den Werten von β und ω0 sind die Eigenwerte entweder komplex oder rein reell. Wir unterscheiden drei verschiedene Fälle: 10 Differentialgleichungen ω0 < β ω0 = β ω0 > β λ1,2 λ1 = λ2 λ1,2 265 reell: reell: komplex: Kriechfall aperiodischer Grenzfall Schwingfall Kriechfall: Wenn ω0 < β, sind beide Eigenwerte reell aber negativ. Die allgemeine Lösung der Bewegungsgleichung ist also (siehe Abb. 10.14) x(t) = Aeλ1 t + Beλ2 t mit den Koeffizienten λ1 = −β + β 2 − ω02 ; λ2 = −β − (10.206) β 2 − ω02 . (10.207) Da sowohl λ1 als auch λ2 negativ sind, nähert sich x exponentiell seiner Ruhelage. Die Dämpfung durch Reibungsverluste ist in diesem Fall zu stark, um eine Schwingung zuzulassen. So ein Fall würde sich z.B. für ein Pendel in einer viskosen Flüssigkeit ergeben. Abbildung 10.14: Im Kriechfall nähert sich der Oszillator seiner Ruhelage exponentiell. Wir wollen nun die Bewegung des Oszillators für den Fall betrachten, dass er anfänglich in Ruhe ist (ẋ(0) = 0) und die Auslenkung x(0) = x0 hat. Aus x(0) = x0 ergibt sich A + B = x0 . (10.208) Die zeitliche Ableitung der Auslenkung ist ẋ(t) = λ1 Aeλ1 t + λ2 Beλ2 t (10.209) λ1 A + λ2 B = 0. (10.210) und somit folgt aus ẋ(0) = 0 Aus diesen beiden Bedingungen können wir A und B bestimmen: A B x0 λ2 , λ2 − λ1 λ1 x0 . = − λ2 − λ1 = (10.211) (10.212) Wegen λ2 − λ1 = −β − β 2 − ω02 + β − β 2 − ω02 = −2 β 2 − ω02 (10.213) erhalten wir schließlich x(t) = λ1 t x0 λ2 t e − λ e λ . 2 1 −2 β 2 − ω02 (10.214) 266 10 Differentialgleichungen Anders ausgedrückt haben wir: x(t) = x 0 −2 β 2 − ω02 # −β − $ √ 2 2 β 2 − ω02 e(−β+ β −ω0 )t # $ √ 2 2 − −β + β 2 − ω02 e(−β− β −ω0 )t . (10.215) Aperiodischer Grenzfall: Verringern wir den Reibungskoeffizienten so weit, dass ω0 = β, sind beide Eigenwerte gleich und negativ: λ1 = λ2 = −β. Man nennt solche Eigenwerte entartet. Die Lösung der Differentialgleichung wird in diesem Fall zu x = Ae−βt . (10.216) Hier haben wir jedoch nur mehr einen freien Parameter statt zwei, wie wir es von der allgemeinen Lösung einer Differentialgleichung zweiter Ordnung eigentlich verlangen müssen. Wir brauchen also eine zweite vom Ansatz Aeλt verschiedene Lösung, um den zweiten Parameter unterzubringen. Wir versuchen es mit dem Ansatz x = Bte−βt (10.217) mit den Ableitungen ẋ = dx = −Bβte−βt + Be−βt = Be−βt (1 − βt) dt (10.218) und ẍ d2 x = −βBe−βt (1 − βt) + Be−βt (−β) dt2 * + = Be−βt −β + β 2 t − β + * = Be−βt β 2 t − 2β . = Einsetzen dieses Ansatzes in die Differentialgleichung (10.203) ergibt: * + Be−βt β 2 t − 2β + 2βBe−βt (1 − βt) + ω02 Bte−βt = 0 (10.219) (10.220) und somit β2t − 2β 2β + − 2β 2 t + ω02 t = −β 2 t + ω02 t = (−β 2 + ω02 )t = 0. (10.221) Da nach Voraussetzung β = ω0 , verschwindet die linke Seite der obigen Gleichung und wir sehen, dass der Ansatz x = Bte−βt die Differentialgleichung erfüllt. Die allgemeine Lösung ist in diesem Fall also x(t) = Ae−βt + Bte−βt . (10.222) Da die lineare Funktion t viel langsamer wächst als die Exponentialfunktion e−βt abfällt, kehrt der Oszillator im aperiodischen Grenzfall auf monotone Weise von einer Auslenkung x in seine Ruhelage x = 0 zurück. Wenn der Oszillator bei t = 0 eine Auslenkung von x0 hat und seine Anfangsgeschwindigkeit verschwindet, haben wir für die freien Parameter A und B: A = x0 und B = βx0 (10.223) 10 Differentialgleichungen 267 und erhalten als spezielle Lösung x(t) = x0 e−βt + βx0 te−βt = x0 e−βt (1 + βt). (10.224) Da für β = ω0 also keine Schwingung auftritt und für ein etwas kleineres β der Oszillator erstmals seine Ruhelage mit endlicher Geschwindigkeit durchqueren und nicht nur asymptotisch erreichen kann, spricht man vom aperiodischen Grenzfall: Wenn wir β um einen nur kleinen Betrag verringern, kann das System erstmals schwingen. Beim aperiodischen Grenzfall kehrt der Oszillator am schnellsten in seine Ruhelage zurück. Schwingfall: Falls ω0 > β, ist das Argument der Wurzel in Gleichung (10.205) negativ und die beiden Eigenwerte λ1 und λ2 sind komplex. Mit −ω 2 ≡ β 2 − ω02 (damit klar ist, dass β 2 − ω02 eine negative Zahl ist), sind die Eigenwerte gegeben durch λ1 = −β + iω und λ1 = −β − iω. (10.225) Sie sind also komplex konjugiert zueinander. Wie wir bereits wissen (siehe Gleichung (10.166)) können wir in diesem Fall aus den Lösungen x1 = e−(β+iω)t und x2 = e−(β−iω)t durch eine passende Linearkombination reelle Lösungen konstruieren −(β+iω)t e e−(β−iω)t + x1 = (10.226) = e−βt cos ωt, 2 2 −(β+iω)t e e−(β−iω)t − x2 = − (10.227) = e−βt sin ωt. 2i 2i Die allgemeine Lösung ist also x(t) = Ae−βt cos ωt + Be−βt sin ωt = e−βt (A cos ωt + B sin ωt) (10.228) x(t) = Ce−βt sin(ωt + ϕ). (10.229) oder Das ist eine Schwingung, deren Amplitude durch die Dämpfung exponentiell mit der Zeit abnimmt. Die Kreisfrequenz ω = ω02 − β 2 (10.230) ist für den gedämpften Oszillator geringer als für den ungedämpften. Um die freien Parameter A und B (bzw. C und ϕ) für die speziellen Anfangsbedingungen x(0) = x0 und ẋ(0) = 0 zu bestimmen, benötigen wir die erste Ableitung: dx dt = (−β)e−βt (A cos ωt + B sin ωt) + ωe−βt (−A sin ωt + B cos ωt) = e−βt [(ωB − βA) cos ωt − (ωA + βB) sin ωt] . (10.231) Somit folgt aus den Anfangsbedingungen A = x0 (10.232) βx0 βA = . ω ω (10.233) und B= 268 10 Differentialgleichungen Die Lösung der Differentialgleichung ist dann β x(t) = x0 e−βt cos ωt + sin ωt ω (10.234) oder anders ausgedrückt β sin( ω02 − β 2 t) . cos( ω02 − β 2 t) + 2 ω0 − β 2 x(t) = x0 e−βt (10.235) Für β → ω0 oder ω → 0 erhalten wir x(t) = x0 e−βt (1 + βt). Das ist genau der aperiodische Grenzfall aus Gleichung (10.224). Abbildung 10.15: Schwingfall (ω0 > β), Kriechfall (ω0 < β) und aperiodischer Grenzfall (ω0 = β) eines gedämpften harmonischen Oszillators (hier haben wir ω0 = 1 gesetzt). 10.3.4 Die inhomogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten: die erzwungene Schwingung Wir betrachten nun einen harmonischen Oszillator, der zusätzlich durch eine äußere, zeitabhängige Kraft angeregt wird. Beispiele wären etwa ein Pendel, dessen Aufhängepunkt periodisch hin und her bewegt wird oder ein elektrischer Schwingkreis, der an eine Wechselspannung angeschlossen wird. Diese zusätzliche äußere Kraft muss natürlich in der Bewegungsgleichung des Oszillators berücksichtigt werden. Für eine harmonische periodische Kraft F/m = A cos Ωt mit Kreisfrequenz Ω und Amplitude A wird die Bewegungsgleichung zu dx d2 x + ω02 x = A cos Ωt. + 2β dt2 dt (10.236) Der Störterm A cos Ωt macht die ursprüngliche homogene Gleichung zu einer inhomogenen Gleichung mit konstanten Koeffizienten. Auch für eine solche Differentialgleichung gilt, dass die allgemeine Lösung der inhomogenen Gleichung als Summe der allgemeinen Lösung der homogenen Gleichung und einer Partikulärlösung der inhomogenen Gleichung geschrieben werden kann: x(t) = xh (t) + xp (t). (10.237) 10 Differentialgleichungen 269 Dass diese Funktion eine Lösung der inhomogenen Differentialgleichung ist, kann durch Einsetzen leicht überprüft werden. Die allgemeine Lösung xh (t) der homogenen Gleichung kennen wir bereits; wir müssen also jetzt noch nach einer Partikulärlösung xp (t) der inhomogenen Gleichung suchen. Wir könnten das durch Variation der Konstanten versuchen; es ist jedoch einfacher, einen Lösungsansatz zu machen. Mit einer Winkelfunktion als Störfunktion kann auch die Lösung nur eine Winkelfunktion sein, da durch Differenzieren nur aus Winkelfunktionen wieder solche entstehen können. Wir machen also einen Ansatz, der der Störung ähnlich ist x = K cos(Ωt − ϕ). (10.238) ẋ = −KΩ sin(Ωt − ϕ) (10.239) ẍ = −KΩ2 cos(Ωt − ϕ). (10.240) Die zugehörigen Ableitungen sind: und Einsetzen in die Differentialgleichung ergibt: − KΩ2 cos(Ωt − ϕ) − 2βKΩ sin(Ωt − ϕ) + ω02 K cos(Ωt − ϕ) = A cos Ωt. (10.241) Um die linke und die rechte Seite der Gleichung auf eine ähnliche Form zu bringen, formen wir die rechte Seite der Gleichung durch Verwendung des Additionstheorems für den Kosinus folgendermaßen um: A cos Ωt = A cos(Ωt − ϕ + ϕ) = A cos(Ωt − ϕ) cos ϕ − A sin(Ωt − ϕ) sin ϕ. (10.242) Einsetzen ergibt (−KΩ2 + Kω02 ) cos(Ωt − ϕ) − 2βKΩ sin(Ωt − ϕ) = A cos(Ωt − ϕ) cos ϕ − A sin(Ωt − ϕ) sin ϕ. (10.243) Diese Gleichung können wir für alle Zeiten t erfüllen, indem wir die Koeffizienten vor dem Kosinus cos(Ωt − ϕ) bzw. vor dem Sinus sin(Ωt − ϕ) auf beiden Seiten gleichsetzen: − KΩ2 + Kω02 = A cos ϕ, (10.244) 2βKΩ = A sin ϕ. (10.245) Durch Addition der Quadrate beider Gleichungen finden wir (−KΩ2 + Kω02 )2 + 4β 2 K 2 Ω2 = A2 cos2 ϕ + A2 sin2 ϕ = A2 (10.246) oder K2 = A2 (ω02 − Ω2 )2 + 4β 2 Ω2 . (10.247) Division der beiden Gleichungen (10.244) und (10.245) hingegen ergibt tan ϕ = 2βΩ 2βKΩ = 2 2 2 K(ω0 − Ω ) (ω0 − Ω2 ) oder ϕ = arctan 2βΩ ω02 − Ω2 (10.248) . (10.249) Dadurch erhalten wir als Partikulärlösung der inhomogenen Gleichung mit Störterm A cos(Ωt − ϕ) A cos(Ωt − ϕ). xp (t) = 2 (ω0 − Ω2 )2 + 4β 2 Ω2 (10.250) 270 10 Differentialgleichungen Dies ist eine Schwingung mit der gleichen Frequenz wie die Störung, deren Amplitude und Phasenverschiebung von der Eigenfrequenz ω0 des Oszillators, der Erregerfrequenz Ω und dem Reibungskoeffizienten β abhängen. Die allgemeine Lösung der Differentialgleichung ist die Summe der allgemeinen Lösung der homogenen Gleichung und der gerade gefundenen Partikulärlösung. Da jedoch für einen nichtverschwindenden Reibungskoeffizienten die Lösung der homogenen Gleichung in allen Fällen durch die Dämpfung schnell gegen Null konvergiert, bleibt für lange Zeiten nur die Partikulärlösung übrig. Nach Beendigung transienter Einschwingvorgänge mit Frequenz ω = ω02 − β 2 oszilliert das getriebene System infolgedessen mit der Erregerfrequenz Ω. Wir schauen uns nun die Partikulärlösung der inhomogenen Gleichung etwas genauer an. Die Amplitude AF der erzwungenen Schwingung ist (siehe Abb. 10.16) A AF (Ω) = 2 . (ω0 − Ω2 )2 + 4β 2 Ω2 (10.251) Für Erregerfrequenzen Ω, die viel kleiner sind als die Eigenfrequenz ω0 des Oszillators (Ω ω0 ), ist wegen des Terms (ω02 −Ω2 )2 das Argument der Wurzel im Nenner groß und daher die Amplitude klein. Die Amplitude ist in diesem Fall AF = A/ω02 (von der Reibung unabhängig). Wenn sich Ω nun der Eigenfrequenz ω0 nähert, wird der Term (ω02 − Ω2 )2 immer kleiner. Das Argument der Wurzel erreicht dann ein Minimum und wächst danach wieder an. An der Stelle des Minimums des Wurzelarguments im Nenner wird die Amplitude maximal. Um diese Stelle zu finden, setzen wir die Ableitung des Wurzelarguments gleich Null: + ∂ * 2 (ω0 − Ω2 )2 + 4β 2 Ω2 = 0. (10.252) ∂Ω Das heißt, 2(ω02 − Ω2 )(−2Ω) + 4β 2 2Ω = 0, (10.253) Ω(−ω02 + Ω2 ) + 2β 2 Ω = 0. (10.254) woraus folgt Diese Gleichung hat die Lösung Ω = 0 sowie die Lösungen Ω1,2 = ± ω02 − 2β 2 . (10.255) Da Ω eine Frequenz ist, sind wir nur an einer positiven Lösung interessiert: ΩR = ω02 − 2β 2 . (10.256) Für ω02 > 2β 2 ist diese Frequenz ΩR reell. Bei solchen Frequenzen besitzt die Amplitude der erzwungenen Schwingung als Funktion der Erregerfrequenz Ω irgendwo ein Maximum. Ist hingegen ω02 < 2β 2 , hat die Amplitude der erzwungenen Schwingung als Funktion von Ω kein Maximum und die Amplitude nimmt mit wachsendem Ω monoton ab. Dieses Anwachsen der Amplitude in der Nähe der Eigenfrequenz ω0 nennt man Resonanz und die zugehörige Frequenz ΩR Resonanzfrequenz. Wie man aus Gleichung (10.256) sieht, ist die Resonanzfrequenz ΩR verschieden von der Eigenfrequenz ω0 des Oszillators und auch verschieden von ω02 − β 2 , der Frequenz der ungestörten aber gedämpften Schwingung. Nur für den reibungsfreien Fall stimmt die Resonanzfrequenz mit der Eigenfrequenz überein. Die Amplitude bei der Resonanzfrequenz ΩR ist: AF (ΩR ) = = = A 2 2 2 (ω0 − (ω0 − 2β ))2 + 4β 2 (ω02 − 2β 2 ) A 2 2 (2β ) + 4β 2 (ω02 − 2β 2 ) A A . = 4β 2 (ω02 − β 2 ) 2β ω02 − β 2 (10.257) 10 Differentialgleichungen 271 Abbildung 10.16: Amplitude AF der erzwungenen Schwingung als Funktion der Erregerfrequenz Ω für verschiedene Reibungskoeffizienten β. Je kleiner der Reibungskoeffizient β ist, umso größer ist die Resonanzamplitude. Der Locus der Maxima der Amplitude AF ist als unterbrochene Linie dargestellt. Die Resonanzamplitude wächst also mit abnehmender Reibung und divergiert im reibungsfreien Fall. (Der Faktor ω02 − β 2 im Nenner kann nicht verschwinden, da die Funktion AF (Ω) nur für ω02 > 2β 2 ein Maximum bei einer von Null verschiedenen Frequenz Ω besitzt.) Die Amplitude der erzwungenen Schwingung als Funktion der Erregerfrequenz ist für verschiedene Reibungskoeffizienten β in Abb. 10.16 dargestellt. Die erzwungene Schwingung hat zwar dieselbe Frequenz wie die Erregerschwingung, ist jedoch mit dieser nicht in Phase. Die Phasenverschiebung gegenüber der Erregerschwingung ist: 2βΩ ϕ = arctan . (10.258) ω02 − Ω2 Diese Phasenverschiebung ist in Abb. 10.17 für verschiedene Werte von β als Funktion der Erregerfrequenz dargestellt. Für kleine Ω ist ϕ sehr klein (ϕ → 0 für Ω = 0). Wenn sich Ω der Eigenfrequenz ω0 nähert, divergiert (2βΩ)/(ω02 − Ω2 ) und die Phasenverschiebung strebt zu ϕ = π/2. Wenn Ω weiter wächst, wächst auch ϕ weiter und erreicht für Ω → ∞ den Wert ϕ = π. Abbildung 10.17: Phasenverschiebung ϕ der erzwungenen Schwingung als Funktion der Erregerfrequenz Ω für verschiedene Reibungskoeffizienten β.