Skriptum - Fakultät für Physik

Werbung
Skriptum zur Vorlesung
Einführung in die Physikalischen
Rechenmethoden I + II
Univ. Prof. Dr. Christoph Dellago
Universität Wien
Fakultät für Physik
Institut für Experimentalphysik
Boltzmanngasse 5, 1090 Wien
[email protected]
http://comp-phys.univie.ac.at
Literatur
Lehrbücher
- George Arfken, Mathematical Methods for Physicists, Academic Press, San Diego (1985).
- Siegfried Großmann, Mathematischer Einführungskurs für die Physik, Teubner, Stuttgart
(1974).
- Sadri Hassani, Mathematical Methods for Students of Physics and Related Fields, SpringerVerlag, New York (2000).
- Helmuth Horvath, Rechenmethoden und ihre Anwendungen in Physik und Chemie, Bibliographisches Institut, Mannheim, Wien, Zürich (1977).
- May-Britt Kallenrode, Rechenmethoden der Physik, Springer-Verlag, Berlin (2003).
- Klaus Weltner, Mathematik für Physiker I und II, Springer-Verlag, Berlin (2001).
- Helmut Fischer und Helmut Kaul, Mathematik für Physiker, Teubner, Stuttgart (1988).
- Gerhard Berendt und Evelyn Weimar, Mathematik für Physiker, Physik-Verlag, Weinheim
(1979).
Formelsammlungen
- Johann Rast (Heinrich Netz), Formeln der Mathematik, Carl Hanser Verlag, München, Wien
(1983).
- Hans-Jochen Bartsch, Taschenbuch Mathematischer Formeln, Fachbuchverlag Leipzig (2004).
- Ilja N. Bronstein, Konstantin A. Semendjajew, Gerhard Musiol, Taschenbuch der Mathematik, Verlag Harri Deutsch, Frankfurt am Main (2000).
Web-Ressourcen
- http://mathworld.wolfram.com
- http://www.mathe-online.at
3
4
Inhaltsverzeichnis
I
Einführung in die Physikalischen Rechenmethoden I
1 Funktionen
1.1 Der Funktionsbegriff . . . . . . . . . . .
1.2 Darstellung von Funktionen . . . . . . .
1.2.1 Analytische Darstellung . . . . .
1.2.2 Funktionstafel (Wertetabelle) . .
1.2.3 Graphische Darstellung . . . . .
1.3 Eigenschaften von Funktionen . . . . . .
1.3.1 Definitionsbereich . . . . . . . .
1.3.2 Nullstellen . . . . . . . . . . . . .
1.3.3 Gerade und ungerade Funktionen
1.3.4 Monotonie . . . . . . . . . . . . .
1.3.5 Grenzwert . . . . . . . . . . . . .
1.3.6 Stetigkeit . . . . . . . . . . . . .
1.3.7 Singularitäten . . . . . . . . . . .
1.4 Neue Funktionen aus alten . . . . . . . .
1.4.1 Verkettung von Funktionen . . .
1.4.2 Umkehrfunktion . . . . . . . . .
1.5 Wichtige Funktionen . . . . . . . . . . .
1.5.1 Lineare Funktionen . . . . . . . .
1.5.2 Potenzfunktionen . . . . . . . . .
1.5.3 Exponentialfunktion . . . . . . .
1.5.4 Logarithmus . . . . . . . . . . .
1.5.5 Winkelfunktionen . . . . . . . . .
1.5.6 Arcusfunktionen . . . . . . . . .
1.5.7 Hyperbolische Funktionen . . . .
1.5.8 Areafunktionen . . . . . . . . . .
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
12
12
13
13
14
14
14
14
15
15
16
17
18
18
19
21
21
22
24
26
27
30
32
33
2 Vektoren
2.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . .
2.2 Koordinatensysteme . . . . . . . . . . . . . . . . . .
2.2.1 Kartesische Koordinaten . . . . . . . . . . . .
2.2.2 Polarkoordinaten . . . . . . . . . . . . . . . .
2.2.3 Zylinderkoordinaten . . . . . . . . . . . . . .
2.2.4 Kugelkoordinaten . . . . . . . . . . . . . . . .
2.3 Vektoralgebra . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Gleiche, inverse und parallele Vektoren . . . .
2.3.2 Vektoraddition und -subtraktion . . . . . . .
2.3.3 Multiplikation eines Vektors mit einem Skalar
2.4 Skalarprodukt . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Definition . . . . . . . . . . . . . . . . . . . .
2.4.2 Rechenregeln . . . . . . . . . . . . . . . . . .
2.4.3 Komponentenweise Darstellung . . . . . . . .
2.4.4 Anwendungen . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
37
37
38
42
43
44
44
45
47
48
48
48
50
50
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
INHALTSVERZEICHNIS
2.5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
53
54
58
59
59
59
60
60
61
61
61
62
64
3 Differentiation
3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . .
3.2 Differenzierbarkeit . . . . . . . . . . . . . . . . .
3.3 Wichtige Ableitungen . . . . . . . . . . . . . . .
3.4 Differentiationsregeln . . . . . . . . . . . . . . . .
3.4.1 Faktorregel . . . . . . . . . . . . . . . . .
3.4.2 Summenregel . . . . . . . . . . . . . . . .
3.4.3 Produktregel . . . . . . . . . . . . . . . .
3.4.4 Quotientenregel . . . . . . . . . . . . . . .
3.4.5 Kettenregel . . . . . . . . . . . . . . . . .
3.4.6 Umkehrregel . . . . . . . . . . . . . . . .
3.5 Höhere Ableitungen . . . . . . . . . . . . . . . .
3.6 Maxima und Minima von Funktionen . . . . . . .
3.7 Differentiation von Funktionen in Parameterform
3.8 Differentiation von Vektoren . . . . . . . . . . . .
3.9 Partielle Differentiation . . . . . . . . . . . . . .
3.9.1 Funktionen mehrerer Variabler . . . . . .
3.9.2 Partielle Ableitung . . . . . . . . . . . . .
3.9.3 Anstieg einer impliziten Funktion . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
67
67
70
71
71
71
71
71
72
72
72
73
73
74
76
78
78
79
81
. . . . .
. . . . .
. . . . .
Integral
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
83
83
85
85
89
93
94
94
95
95
97
98
101
106
108
108
110
114
116
116
118
2.6
2.7
2.8
Vektorprodukt . . . . . . . . . . . . .
2.5.1 Definition . . . . . . . . . . . .
2.5.2 Rechenregeln . . . . . . . . . .
2.5.3 Komponentenweise Darstellung
2.5.4 Anwendungen . . . . . . . . . .
Spatprodukt . . . . . . . . . . . . . . .
2.6.1 Definition . . . . . . . . . . . .
2.6.2 Komponentenweise Darstellung
2.6.3 Rechenregeln und Anwendung
Mehrfachprodukte . . . . . . . . . . .
Anwendungsbeispiele für Vektoren . .
2.8.1 Strömung durch eine Fläche . .
2.8.2 Rotation eines Körpers . . . .
2.8.3 Volumen einer Einheitszelle . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Integration
4.1 Das unbestimmte Integral . . . . . . . . . . . . . . . . . .
4.2 Wichtige unbestimmte Integrale . . . . . . . . . . . . . . .
4.3 Das bestimmte Integral . . . . . . . . . . . . . . . . . . .
4.4 Zusammenhang zwischen bestimmtem und unbestimmtem
4.5 Rechenregeln für das bestimmte Integral . . . . . . . . . .
4.6 Grundregeln des Integrierens . . . . . . . . . . . . . . . .
4.6.1 Faktorregel . . . . . . . . . . . . . . . . . . . . . .
4.6.2 Summenregel . . . . . . . . . . . . . . . . . . . . .
4.6.3 Substitutionsmethode . . . . . . . . . . . . . . . .
4.6.4 Partielle Integration . . . . . . . . . . . . . . . . .
4.7 Rotationskörper . . . . . . . . . . . . . . . . . . . . . . . .
4.8 Berechnung von Bogenlängen . . . . . . . . . . . . . . . .
4.9 Mittelwerte von Funktionen . . . . . . . . . . . . . . . . .
4.10 Doppelintegrale . . . . . . . . . . . . . . . . . . . . . . . .
4.10.1 Definition . . . . . . . . . . . . . . . . . . . . . . .
4.10.2 Berechnung von Doppelintegralen . . . . . . . . . .
4.10.3 Doppelintegrale in Polarkoordinaten . . . . . . . .
4.11 Dreifachintegrale . . . . . . . . . . . . . . . . . . . . . . .
4.11.1 Definition . . . . . . . . . . . . . . . . . . . . . . .
4.11.2 Berechnung von Dreifachintegralen . . . . . . . . .
INHALTSVERZEICHNIS
7
4.11.3 Dreifachintegrale in Zylinder- und Kugelkoordinaten . . . . . . . . . . . . . 120
4.12 Integration von vektorwertigen Funktionen . . . . . . . . . . . . . . . . . . . . . . 121
II
Einführung in die Physikalischen Rechenmethoden II
5 Die
5.1
5.2
5.3
5.4
5.5
Taylorreihe
Folgen und Reihen . . . . . . . . . . . . . . . .
Entwicklung einer Funktion in eine Taylorreihe
Allgemeine Taylorentwicklung . . . . . . . . . .
Abgebrochene Taylorreihenentwicklung . . . . .
Fehlerabschätzung . . . . . . . . . . . . . . . .
123
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
125
125
127
130
130
133
6 Komplexe Zahlen
6.1 Definition und Darstellung . . . . . . . . . . . . . . . . . . . . . . .
6.2 Rechenregeln für komplexe Zahlen . . . . . . . . . . . . . . . . . .
6.2.1 Addition und Subtraktion . . . . . . . . . . . . . . . . . . .
6.2.2 Multiplikation einer komplexen Zahl mit einer reellen Zahl
6.2.3 Komplex konjugierte Zahl . . . . . . . . . . . . . . . . . . .
6.2.4 Multiplikation . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.5 Division . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Die Exponentialform von komplexen Zahlen . . . . . . . . . . . . .
6.3.1 Eulersche Formel . . . . . . . . . . . . . . . . . . . . . . . .
6.3.2 Polardarstellung von komplexen Zahlen . . . . . . . . . . .
6.3.3 Umkehrung der Eulerschen Formel . . . . . . . . . . . . . .
6.3.4 Additionstheoreme für Winkelfunktionen . . . . . . . . . .
6.3.5 Komplexe Zahlen als Exponenten . . . . . . . . . . . . . . .
6.4 Potenzieren und komplexe Wurzeln . . . . . . . . . . . . . . . . . .
6.5 Darstellung von Kurven mit komplexen Zahlen . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
137
137
139
139
140
141
142
143
144
144
146
147
147
148
148
151
7 Fehlerrechnung
7.1 Systematische und statistische Fehler . . . . . . . .
7.2 Mittelwert und Varianz . . . . . . . . . . . . . . .
7.3 Verteilungen und Histogramme . . . . . . . . . . .
7.3.1 Grundlagen . . . . . . . . . . . . . . . . . .
7.3.2 Erwartungswert, Momente einer Verteilung
7.3.3 x und s2 als Schätzer für µ und σ 2 . . . . .
7.3.4 Fehler des Mittelwerts . . . . . . . . . . . .
7.3.5 Die Gaußsche Normalverteilung . . . . . . .
7.3.6 Verteilung diskreter Größen . . . . . . . . .
7.3.7 Poissonverteilung . . . . . . . . . . . . . . .
7.4 Fehlerfortpflanzung . . . . . . . . . . . . . . . . . .
7.4.1 Fortpflanzung von Maximalfehlern . . . . .
7.4.2 Fortpflanzung statistischer Kennwerte . . .
7.5 Ausgleichsrechnung (Fitten) . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
153
153
155
157
157
161
163
164
165
167
168
170
171
172
175
8 Differentiation von Feldern:
8.1 Felder . . . . . . . . . . .
8.1.1 Skalarfelder . . . .
8.1.2 Vektorfelder . . . .
8.2 Gradient . . . . . . . . . .
8.2.1 Definition . . . . .
8.2.2 Eigenschaften . . .
8.2.3 Richtungsableitung
8.2.4 Rechenregeln . . .
8.3 Divergenz . . . . . . . . .
8.3.1 Definition . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
179
179
179
180
183
183
183
185
185
186
186
grad,
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
div und rot
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
INHALTSVERZEICHNIS
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
186
189
190
191
191
191
194
195
196
9 Integration von Feldern: Kurven- und Flächenintegrale
9.1 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . .
9.1.2 Eigenschaften . . . . . . . . . . . . . . . . . . . . . .
9.1.3 Berechnungsverfahren . . . . . . . . . . . . . . . . .
9.1.4 Kurvenintegrale über Gradientenfelder . . . . . . . .
9.2 Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . .
9.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . .
9.2.2 Darstellung der Fläche und des Flächenelements . .
9.2.3 Das Flächenelement . . . . . . . . . . . . . . . . . .
9.2.4 Berechnung des Oberflächenintegrals . . . . . . . . .
9.3 Der Integralsatz von Gauß . . . . . . . . . . . . . . . . . . .
9.3.1 Integraldarstellung der Divergenz . . . . . . . . . . .
9.3.2 Formulierung und Herleitung . . . . . . . . . . . . .
9.3.3 Partielle Integration mit Hilfe des Gaußschen Satzes
9.3.4 Die Sätze von Green . . . . . . . . . . . . . . . . . .
9.4 Der Integralsatz von Stokes . . . . . . . . . . . . . . . . . .
9.4.1 Integraldarstellung der Rotation . . . . . . . . . . .
9.4.2 Formulierung und Herleitung . . . . . . . . . . . . .
9.4.3 Bedeutung . . . . . . . . . . . . . . . . . . . . . . .
9.4.4 Das Vektorpotential . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
199
200
200
201
202
206
210
210
212
214
216
218
218
219
224
226
229
229
231
234
236
10 Differentialgleichungen
10.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Differentialgleichungen erster Ordnung . . . . . . . . . . . . . . . . . . . . . . .
10.2.1 Differentialgleichungen mit separierbaren Variablen . . . . . . . . . . . .
10.2.2 Homogene lineare Differentialgleichung . . . . . . . . . . . . . . . . . . .
10.2.3 Inhomogene lineare Differentialgleichung . . . . . . . . . . . . . . . . . .
10.3 Differentialgleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Homogene Differentialgleichung mit konstanten Koeffizienten . . . . . .
10.3.2 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.3 Die gedämpfte Schwingung . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.4 Die inhomogene lineare Diffgl. 2. Ordnung mit konstanten Koeffizienten
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
239
239
241
242
247
249
258
258
261
264
268
8.4
8.5
8.6
8.3.2 Anschauliche Interpretation als lokale Quellstärke .
8.3.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . .
Laplace-Operator . . . . . . . . . . . . . . . . . . . . . . .
Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.1 Definition . . . . . . . . . . . . . . . . . . . . . . .
8.5.2 Anschauliche Interpretation als lokale Wirbelstärke
8.5.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . .
8.5.4 Wirbelfreie und quellenfreie Felder . . . . . . . . .
Zusammenfassung Nabla-Operator ∇ . . . . . . . . . . . .
Teil I
Einführung in die Physikalischen
Rechenmethoden I
9
Kapitel 1
Funktionen
1.1
Der Funktionsbegriff
In der Physik (und in den Naturwissenschaften im Allgemeinen) arbeiten wir mit Größen, die entweder konstant sind (d.h. sie nehmen wie die Lichtgeschwindigkeit oder die Erdbeschleunigung nur
bestimmte, fixe Werte an) oder eine ganze Fülle von Werten annehmen können. Wir unterscheiden deshalb zwischen Konstanten und Variablen (z.B. verstrichene Zeit, Länge eines Objekts,
Position eines Objekts, Temperatur eines gewissen Materials, Druck eines Gases, etc.).
Um physikalische Zusammenhänge zu verstehen, betrachten wir oft eine Variable in Abhängigkeit
einer anderen Variablen. So könnten wir zum Beispiel daran interessiert sein, wie sich der Druck
p eines in einem bestimmten Volumen V eingeschlossenen Gases verhält, wenn dessen Temperatur
T verändert wird. Für jede Temperatur T herrscht im Gas ein bestimmter Druck p. In anderen
Worten: der Druck p ändert sich mit der Temperatur T . Zur Beschreibung solcher Zusammenhänge
zwischen Variablen benutzen wir Funktionen.
Definition: Eine Funktion f (x) ordnet jedem Element x des Definitionsbereichs D eindeutig ein
Element y des Wertebereichs W zu: y = f (x) (siehe Abb. 1.1).
Abbildung 1.1: Die Funktion f (x) mit Definitionsbereich D und Wertebereich W .
Wir sagen dann, dass wir y als Funktion von x betrachten. In unserem Beispiel mit dem Gas
betrachten wir etwa den Druck p als Funktion der Temperatur T und schreiben p(T ). Wichtig
ist hier, dass die Zuordnung eindeutig ist. Das heißt, dass jedem Wert x genau ein Wert y
zugeordnet wird (sonst ist f (x) keine Funktion) (siehe Abb. 1.2). Es ist also nicht erlaubt, einem
Element des Definitionsbereichs zwei oder mehr Elemente des Wertebereichs zuzuordnen. Hingegen
darf sehr wohl ein Element des Wertebereichs mehreren Werten des Definitionsbereichs angehören.
Auch muss nicht jedes Element
des Wertebereichs vom Definitionsbereich aus erreicht werden. Die
√
Wurzelfunktion f (x) = ± x ist daher beispielsweise keine echte Funktion, da sowohl der negative
als auch der positive Wert der Wurzel zulässig sind. Betrachtet man hingegen nur den positiven
oder den negativen Zweig der “Wurzelfunktion”, sind alle geforderten Eigenschaften erfüllt.
Die Funktion f (x) ist also eine Zuordnungsvorschrift. Dabei wird x als unabhängige Variable
11
12
1 Funktionen
Abbildung 1.2: Nur eine eindeutige Zuordnung ist eine Funktion.
oder Argument (auch Stelle) bezeichnet und y als abhängige Variable oder Funktionswert.
Man kann die Zuordnung auch schreiben als
f
x−
→y
f : x → y.
oder
(1.1)
Dies bedeutet, dass die Funktion f dem Wert x einen Wert y zuordnet. Diese Notation werden
Sie jedoch kaum in Physikbüchern finden. Oft wird in der Physik auch der Definitionsbereich
nicht explizit erwähnt. Dieser ergibt sich meistens aus dem Zusammenhang. Funktionen werden
auch Abbildungen genannt und man sagt “x wird auf y abgebildet”. Die Notation f (x) für eine
Funktion ist eigentlich ungenau, denn genau genommen bezeichnet f (x) den Funktionswert an der
Stelle x und nicht die Zuordnungsvorschrift. Diese Schreibweise ist jedoch sehr praktisch und wird
daher in der Physik gerne benutzt.
1.2
Darstellung von Funktionen
Funktionen lassen sich auf verschiedene Weisen darstellen, wie wir im Folgenden besprechen werden.
1.2.1
Analytische Darstellung
In der analytischen Darstellung wird die Zuordnungsvorschrift als Gleichung (Funktionsgleichung) in einer von drei Formen angegeben:
• Explizite Darstellung: y = f (x)
Die Funktion ist nach einer Variablen aufgelöst und der Wert y kann für ein bestimmtes
Argument x sofort berechnet werden, zum Beispiel y = x2 . In diesem Fall haben wir eine
Rechenvorschrift, mit der wir f (x) direkt aus x ermitteln können.
• Implizite Darstellung: F (x, y) = 0
Die Funktion ist nicht nach einer der beiden Variablen aufgelöst. Ein Beispiel ist die Gleichung
eines Kreises mit Radius 1 um den Ursprung: x2 + y 2 − 1 = 0. In vielen Fällen ist es möglich,
2
2
die implizite
Darstellung in
√
√ eine explizite zu verwandeln, zum Beispiel (x + y − 1 = 0) →
y1 = 1 − x2 und y2 = − 1 − x2 . Diese Verwandlung von impliziter zu expliziter Form ist
jedoch nicht immer möglich.
• Parameterdarstellung:
Bei dieser Form der Darstellung werden beide Variablen (sowohl das Argument als auch der
Funktionswert) als Funktion einer Hilfsvariablen t ausgedrückt:
x =
x(t),
(1.2)
y
y(t).
(1.3)
=
1 Funktionen
13
Abbildung 1.3: Wurfparabel für horizontale Anfangsgeschwindigkeit.
Die Hilfsvariable, hier t, wird auch als Parameter bezeichnet.
Betrachten wir zum Beispiel die Bahnkurve eines im Erdschwerefeld in horizontaler Richtung
geworfenen Objekts (siehe Abb. 1.3). Dabei können wir versuchen, die vertikale Lage y als
Funktion der horizontalen Entfernung x anzugeben, also y = f (x). In diesem Fall ist es
jedoch einfacher, zunächst sowohl x als auch y als Funktion der Zeit t auszudrücken. Unter
Vernachlässigung der Reibung gilt:
x =
y
=
v0 t,
g
− t2 .
2
(1.4)
(1.5)
Die Gleichungen (1.4) und (1.5) sind die Parameterdarstellung der in Abb. 1.3 abgebildeten
Wurfparabel. Dabei ist v0 die Anfangsgeschwindigkeit in x-Richtung und g die Erdbeschleunigung. Der Anfangspunkt liegt im Ursprung: x(0) = 0 und y(0) = 0. Durch die obige
Vorschrift erhalten wir für jedes t ein Paar (x(t), y(t)).
Durch Auflösen der ersten Gleichung nach t und Einsetzen in die zweite Gleichung erhalten
wir die explizite Form der Wurfparabel:
2
g
g x
= − 2 x2 .
(1.6)
y=−
2 v0
2v0
1.2.2
Funktionstafel (Wertetabelle)
Hier werden Paare von unabhängigen und abhängigen Variablen in tabellarischer Form dargestellt,
zum Beispiel:
x
0
1
2
3
4
5
...
y
0
-1
-4
-9
-16
-25
...
(Diese Daten ergeben sich für das obige Beispiel im Falle g/2v02 = 1.) Die tabellarische Darstellung wird häufig für empirisch bestimmte Messdaten verwendet oder wenn es auf den genauen
Zahlenwert ankommt.
1.2.3
Graphische Darstellung
Funktionen lassen sich in der graphischen Darstellungsart besonders gut veranschaulichen. Dabei
werden die Wertepaare der Funktion in einem rechtwinkligen (kartesischen) Koordinatensystem
als Funktionsgraph dargestellt (siehe Abb. 1.4). Üblicherweise wird auf der horizontalen Achse
der x-Wert und auf der vertikalen Achse der y-Wert aufgetragen. Die x-Achse wird auch Abszisse
und die y-Achse Ordinate genannt.
14
1 Funktionen
Abbildung 1.4: Graph einer Funktion in einem kartesischen Koordinatensystem.
1.3
Eigenschaften von Funktionen
In diesem Abschnitt fassen wir einige wichtige Eigenschaften von Funktionen zusammen.
1.3.1
Definitionsbereich
Der Definitionsbereich besteht aus der Menge aller Argumente, für welche die Funktion definiert
ist. In dieser Vorlesung werden wir vor allem verschiedene Intervalle der reellen Zahlen R als
Definitionsbereich betrachten. Dabei unterscheiden wir offene Intervalle
(a, b) = {x ∈ R|a < x < b},
(1.7)
welche die Endpunkte a und b nicht enthalten, und geschlossene Intervalle
[a, b] = {x ∈ R|a ≤ x ≤ b},
(1.8)
welche die Endpunkte a und b enthalten. Oft können Funktionen nur für einen recht eingeschränk√
ten Definitionsbereich definiert werden. Zum Beispiel kann bei der Funktion y = 1 − x2 das
Argument nur Werte im Intervall −1 ≤ x ≤ 1 annehmen. Für reelle Werte außerhalb dieses Bereichs ist das Argument der Wurzel negativ und der Funktionswert somit nicht reell. Falls wir
nur reelle Funktionswerte betrachten wollen, müssen wir den Definitionsbereich auf |x| ≤ 1 einschränken (Grenzen mit eingeschlossen).Wir schreiben dafür auch x ∈ [−1, 1]. Oft schließen wir
auch einzelne Punkte aus dem Definitionsbereich aus. Zum Beispiel ist die Funktion f (x) = 1/x
für den Definitionsbereich R\{0} (das sind die reellen Zahlen ohne die Null) definiert.
1.3.2
Nullstellen
Eine Funktion y = f (x) besitzt an der Stelle x0 eine Nullstelle, falls f (x0 ) = 0. Zum Beispiel
besitzt die Funktion f (x) = x2 − 1 an den Stellen x1 = −1 und x2 = 1 Nullstellen.
1.3.3
Gerade und ungerade Funktionen
Eine Funktion mit symmetrischem Definitionsbereich heißt gerade (siehe Abb. 1.5), falls gilt
f (x) = f (−x).
(1.9)
1 Funktionen
15
Eine Funktion heißt ungerade (siehe Abb. 1.6), falls
f (x) = −f (−x).
(1.10)
Anschaulich ist eine gerade Funktion spiegelsymmetrisch (achsensymmetrisch) zur y-Achse; eine
ungerade Funktion ist punktsymmetrisch zum Ursprung.
Abbildung 1.5: Gerade Funktionen.
1.3.4
Abbildung 1.6: Ungerade Funktionen.
Monotonie
Es seien x1 und x2 zwei beliebige Werte aus dem Definitionsbereich (x1 , x2 ∈ D) einer Funktion
f (x), die der Bedingung x1 < x2 genügen. Dann heißt die Funktion:
• monoton wachsend, falls f (x1 ) ≤ f (x2 ),
• streng monoton wachsend, falls f (x1 ) < f (x2 ),
• monoton fallend, falls f (x1 ) ≥ f (x2 ),
• streng monoton fallend, falls f (x1 ) > f (x2 ).
Abbildung 1.7: Monotonieeigenschaften von Funktionen.
1.3.5
Grenzwert
Eine Funktion y = f (x) sei in einer Umgebung von x0 definiert. Gilt dann für jede im Definitionsbereich der Funktion liegende und gegen x0 konvergente Zahlenfolge {xn } mit xn = x0
lim f (xn ) = g,
n→∞
(1.11)
16
1 Funktionen
so heißt g der Grenzwert von y = f (x) an der Stelle x0 :
lim f (x) = g.
x→x0
(1.12)
Eine Folge ist dabei eine Abbildung mit den natürlichen Zahlen N = {0, 1, 2, 3, . . .} als Definitionsbereich. (Für die genaue Definition einer Folge siehe Kapitel 5.) Ein Beispiel einer Folge ist
1, 1/2, 1/3, 1/4, . . .. Diese Folge nähert sich dem Wert 0. Damit der Grenzwert einer Funktion f (x)
an der Stelle x0 existiert, darf es also nicht darauf ankommen, auf welche Weise man sich dem
Punkt x0 nähert.
Abbildung 1.8: An der Stelle x1 besitzt die Funktion einen Grenzwert, an der Stelle x2 nicht.
Beispiel:
Gesucht ist
x2
.
x→∞ x2 + x + 1
lim
(1.13)
Wir dividieren zunächst Zähler und Nenner durch x2 :
lim
x→∞ x2
x2
1
= lim
.
+ x + 1 x→∞ 1 + 1/x + 1/x2
(1.14)
Da sowohl 1/x als 1/x2 für x → ∞ gegen 0 gehen, erhalten wir:
x2
= 1.
x→∞ x2 + x + 1
lim
1.3.6
Stetigkeit
Abbildung 1.9: Diese Funktion hat an der Stelle x0 eine Unstetigkeitsstelle.
(1.15)
1 Funktionen
17
Eine in x0 und in einer gewissen Umgebung von x0 definierte Funktion y = f (x) heißt an der
Stelle x0 stetig, wenn der Grenzwert der Funktion an dieser Stelle existiert und mit dem dortigen
Funktionswert übereinstimmt:
lim f (x) = f (x0 ).
(1.16)
x→x0
Anschaulich kann man Stetigkeit folgendermaßen verstehen: Zeichnet man einen Graphen, kann
es vorkommen, dass die Funktion einen Sprung aufweist (die in Abb. 1.9 dargestellte Funktion
etwa hat bei x0 einen Sprung). In der Nähe von x0 kann man x-Werte finden, die sich nur wenig
voneinander unterscheiden (z.B. ein Punkt knapp links und ein Punkt knapp rechts von x0 ), deren
y-Werte sich aber um einen großen Betrag voneinander unterscheiden. Nähert man sich x0 von
links (ohne x0 genau zu erreichen), erhält man einen anderen Funktionswert, als wenn man das
von rechts tut, d.h. limx→x0− f (x) = limx→x0+ f (x). An der Stelle x0 ist die Funktion nicht stetig.
Eine Unstetigkeitsstelle dieser Art bezeichnet man auch als Sprungstelle.
Beispiel:
Die Funktion


 +1
f (x) = sign x =
0


−1
falls
falls
falls
x>0
x=0
x<0
(1.17)
hat an der Stelle x = 0 eine Unstetigkeitsstelle (siehe Abb. 1.10). Für x = 0 gilt sign x = |x|/x.
Abbildung 1.10: Die Funktion f (x) = sign x.
Knickstellen, bei denen sich die Steigung einer Funktion unstetig ändert, können auch in stetigen
Funktionen auftreten.
Beispiel:
Die Funktion

|x|
y=
1
−1 ≤ x < ∞
x < −1
(1.18)
hat Knickstellen bei x = −1 und x = 0, ist aber überall stetig (siehe Abb. 1.11). Die erste Ableitung
ist jedoch an den Stellen x = −1 und x = 0 unstetig.
1.3.7
Singularitäten
Stellen, in deren unmittelbarer Umgebung die Funktionswerte über alle Grenzen hinaus fallen oder
wachsen, heißen Singularitäten oder Unendlichkeitsstellen der Funktion. Diese Stellen sind
ebenfalls Unstetigkeitsstellen.
18
1 Funktionen
Abbildung 1.11: Eine stetige Funktion mit Knickstellen.
Beispiel:
Die Funktion y = 1/x wächst bei Annäherung an x = 0 über alle Grenzen:
1
x
1
lim−
x→0 x
lim
x→0+
=
∞,
(1.19)
=
−∞.
(1.20)
An dieser Stelle hat die Funktion eine Singularität.
Abbildung 1.12: Die Funktion f (x) = 1/x hat an der Stelle x = 0 eine Singularität.
1.4
Neue Funktionen aus alten
Durch Addition, Subtraktion, Multiplikation und Division kann man aus alten Funktionen neue
definieren. Zum Beispiel: h(x) = f (x) + g(x) oder h(x) = f (x) · g(x). Dabei muss natürlich auf
einen passenden Definitionsbereich geachtet werden. In den beiden nächsten Abschnitten werden
wir zwei weitere wichtige Arten kennen lernen, um aus alten Funktionen neue zu definieren.
1.4.1
Verkettung von Funktionen
Gegeben seien zwei Funktionen f (x) und g(x). Die Funktion f (x) ordnet einer Zahl x eine Zahl z
zu: z = f (x). Die Zahl z wird dann als unabhängige Variable für die Funktion g verwendet. Dadurch
wird der Zahl z eine Zahl y zugeordnet: y = g(z). Durch die Hintereinanderanwendung von f
1 Funktionen
19
und g wird der Zahl x eine Zahl y zugeordnet:
y = g(z) = g(f (x))
(1.21)
x → f (x) → g(f (x)).
(1.22)
Die Variable z ist nur als Zwischenergebnis interessant, kann also wegfallen. Für die verkettete
(oder auch zusammengesetzte) Funktion schreibt man auch
y = (g ◦ f )(x).
(1.23)
Beispiel:
Die Funktionen
f (x) = x2
und
g(x) = sin(x)
(1.24)
ergeben zusammengesetzt
g(f (x)) = (g ◦ f )(x) = sin(x2 ).
(1.25)
Die Verkettung (oder Zusammensetzung) von Funktionen ist im Allgemeinen nicht kommutativ:
(g ◦ f )(x) = (f ◦ g)(x).
(1.26)
Das heißt, bei der Verkettung von Funktionen kommt es auf die Reihenfolge an.
Beispiel:
Gegeben seien die beiden Funktionen
f (x) = 1 + x
und
g(x) = 1/x.
(1.27)
Während die Zusammensetzung g ◦ f
g(f (x)) =
1
1+x
(1.28)
1
.
x
(1.29)
ergibt, erhält man für die Zusammensetzung f ◦ g
f (g(x)) = 1 +
1.4.2
Umkehrfunktion
Häufig ist es notwendig, für einen gegebenen Wert der abhängigen Variablen den Wert der unabhängigen Variablen zu bestimmen. Betrachten wir zum Beispiel den Flächeninhalt y = x2 eines
Quadrats mit Seitenlänge x (siehe Abb. 1.13).
Abbildung 1.13: Flächeninhalt y eines Quadrats mit Seitenlänge x.
20
1 Funktionen
√
Aus der Fläche können wir natürlich die Kantenlänge x = y bestimmen. Hier haben wir die
√
Funktion y = f (x) = x2 für x ≥ 0 umgekehrt zu x = f −1 (y) = y. Die Funktion x = f −1 (y)
ist die Umkehrfunktion (oder inverse Funktion) von y = f (x). Dabei haben Argument und
Funktionswert die Rollen vertauscht. Gewissermaßen ermittelt die Umkehrfunktion, woher der
Funktionswert f gekommen ist. In der Umkehrfunktion f −1 (y) ist nun y die unabhängige Variable.
Da wir die unabhängige Variable meistens mit x bezeichnen, nennen wir y in x um und erhalten
folgendes Paar von Funktion und Umkehrfunktion: f (x) und f −1 (x).
Abbildung 1.15: Umkehrfunktion x = f −1 (y).
Abbildung 1.14: Funktion y = f (x).
Setzt man eine Funktion mit ihrer Umkehrfunktion zusammen, so wird das Argument x auf sich
selbst abgebildet:
(f ◦ f −1 )(x) = (f −1 ◦ f )(x) = f −1 (f (x)) = x.
Als weiteres Beispiel bestimmen wir die Umkehrfunktion der Funktion y =
1 − 4x2 ,
für D = [0, 1/2]
y =
2
y
4x2
=
=
x =
1 − 4x ,
1 − y2,
1
1 − y2
2
2
(1.30)
√
1 − 4x2 :
(1.31)
(1.32)
(1.33)
y ∈ [0, 1].
(1.34)
Somit gilt:
f (x) =
1 − 4x2 ;
f −1 (x) =
1
1 − x2 .
2
(1.35)
Der Zusammenhang zwischen Funktion und Umkehrfunktion ist in Abb. 1.16 graphisch dargestellt.
Abbildung 1.16: Aus der Funktion f (x) erhalten wir durch Spiegelung an der 45◦ -Geraden die
Umkehrfunktion f −1 (y).
1 Funktionen
21
Natürlich können wir eine Funktion nur umkehren, wenn jedem Element y aus dem Wertebereich
genau ein Wert x aus dem Definitionsbereich zugeordnet ist. Wenn, wie in Abb. 1.17 dargestellt,
mehrere Werte aus dem Definitionsbereich (hier x1 und x2 ) auf denselben Wert des Wertebereichs
(hier y1 ) abgebildet werden, können wir die Funktion nicht umkehren, da wir für Punkt y1 nicht
wissen, welches Argument wir nehmen sollen. Anders gesagt: Eine Funktion y = f (x) ist umkehrbar, wenn aus x1 = x2 stets f (x1 ) = f (x2 ) folgt. Falls dies nicht gilt, kann durch geeignete
Einschränkung des Definitionsbereichs die Umkehrung einer solchen Funktion doch ermöglicht werden. Zum Beispiel besitzt die Funktion f (x) = x2 mit D = R für +x und −x jeweils den selben
Funktionswert und ist somit nicht umkehrbar. Schränken wir den Definitionsbereich jedoch auf
D = {x ∈ R|x ≥ 0} ein, ist die Funktion umkehrbar.
Eine Funktion, für die aus x1 = x2 stets f (x1 ) = f (x2 ) folgt, nennt man injektiv. Falls für alle
Werte y im Wertebereich ein Argument x existiert, sodass f (x) = y, ist die Funktion surjektiv.
Eine sowohl injektive als auch surjektive Funktion nennt man bijektiv und genau diese Funktionen
sind umkehrbar.
Abbildung 1.17: Eine Funktion, bei der mehrere Argumente denselben Funktionswert besitzen, ist
nicht umkehrbar.
Wir halten zusammenfassend fest:
• Jede streng monoton wachsende oder fallende Funktion ist umkehrbar.
• Bei der Umkehrung einer Funktion werden der Definitionsbereich und der (gegebenenfalls
passend eingeschränkte) Wertebereich vertauscht.
• Analytisch erhält man die Umkehrfunktion durch Auflösen nach der unabhängigen Variablen
und anschließendes formales Vertauschen der beiden Variablen.
• Graphisch ergibt sich die Umkehrfunktion durch Spiegelung an der 45◦ -Geraden.
1.5
Wichtige Funktionen
Im Folgenden werden wir einige in der Physik wichtige Funktionen kurz in Erinnerung rufen.
Die Auswahl ist aus Platzgründen sehr beschränkt und so sei der Leser für eine vollständigere
Behandlung auf die in der Literaturliste angeführten Nachschlagewerke verwiesen. Eine Fülle von
Informationen über eine Vielzahl von Funktionen (und über Mathematik im Allgemeinen) ist auf
der Webseite http://mathworld.wolfram.com verfügbar.
1.5.1
Lineare Funktionen
Bei der linearen Funktion (eigentlich affine Funktion)
f (x) = kx + b
(1.36)
hängt der Funktionswert in einfacher Potenz, d.h. linear vom Argument ab. Die lineare Funktion
besitzt zwei Parameter, k und b. Die Bedeutung dieser beiden Parameter wird in der graphischen
22
1 Funktionen
Darstellung der Funktion als eine Gerade klar (siehe Abb. 1.18). Der Parameter k ist dabei die Steigung der Geraden und der Parameter b ihr Schnittpunkt mit der y-Achse. Der Definitionsbereich
umfasst die gesamte x-Achse und der Wertebereich die gesamte y-Achse (für k = 0).
Abbildung 1.18: Die linear Funktion y = kx + b.
Die lineare Funktion f (x) = kx + b ist für k = 0 im gesamten Definitionsbereich (reelle Zahlen)
streng monoton und daher umkehrbar. Auch die Umkehrfunktion einer linearen Funktion ist eine
lineare Funktion: x = y/k − b/k. Lineare Funktionen werden häufig für “Fits” verwendet (siehe
Kapitel 7). Die identische Funktion y = x und die konstante Funktion y = b sind Spezialfälle
der linearen Funktion.
1.5.2
Potenzfunktionen
Die Potenz xn ist das Produkt von n gleichen Faktoren:
xn = x
· x · x
· · · · · x .
(1.37)
n−mal
Hier werden x die Basis und n der Exponent genannt.
Rechenregeln für Potenzen:
x0
xn · xm
xn
xm
(xn )m
=
=
1,
xn+m ,
(1.38)
(1.39)
=
xn−m ,
(1.40)
=
nm
(1.41)
x
.
Dabei sind n und m beliebige ganze Zahlen.
Die Regel x0 = 1 ergibt sich aus der Beobachtung, dass sich durch Division durch x der Exponent
in xn um 1 verringert: xn /x = xn−1 . Für n = 1 gilt also x/x = x1−1 = x0 = 1. Analog folgt auch,
dass 1/x = x−1 oder allgemein: 1/xn = x−n . Die anderen Rechenregeln ergeben sich aus ähnlichen
Überlegungen. Zum Beispiel:
xn · xm = x · x · · · · · x · x
· · · · · x = xn+m
· x n−mal
(1.42)
m−mal
und
· · · · · xm = xnm .
(xn )m = xm · xm
(1.43)
n−mal
Durch Addition von Potenzen erhält man die Potenzfunktion (oder ganz rationale Funktion):
f (x) = a0 + a1 x + a2 x2 + a3 x3 + · · · + an xn =
n
i=0
ai xi ,
(1.44)
1 Funktionen
23
wobei die Koeffizienten ai beliebige reelle Zahlen sind. Die Potenzfunktion aus der obigen Gleichung wird auch Polynom n-ten Grades genannt (falls an = 0). Dabei ist n die höchste vorkommende Potenz.
Beispiele:
• Potenzfunktion 2. Grades f (x) = a0 + a1 x + a2 x2 (mit a2 = 0),
• Potenzfunktion 3. Grades f (x) = a0 + a1 x + a2 x2 + a3 x3 (mit a3 = 0).
Der Definitionsbereich der Potenzfunktion umfasst die gesamte x-Achse, −∞ < x < ∞ und die
Funktion ist überall stetig. Für x → ±∞ divergiert die Funktion nach −∞ oder +∞.
Abbildung 1.19: Beispiele für Potenzfunktionen unterschiedlichen Grades.
Gebrochen rationale Funktionen lassen sich als Quotient zweier ganz rationaler Funktionen
darstellen:
n
ai xi
.
(1.45)
f (x) = i=0
m
i
i=0 bi x
Der Definitionsbereich ist −∞ < x < ∞. Die Nullstellen des Nenners, an denen die Funktion
divergiert, sind jedoch davon ausgeschlossen.
√
Die Wurzelfunktion f (x) = ± x ist die Umkehrfunktion der Potenzfunktion f (x) = x2 . Da
die Quadrate von x und −x identisch sind, (x)2 = (−x)2 (siehe Abb. 1.20), ist die Quadratwurzel
24
1 Funktionen
Abbildung 1.20: Für jeden Wert y0 auf der Ordinate gibt es für die Quadratfunktion y = x2 zwei
Werte auf der Abszisse.
√
√
nicht eindeutig und die beiden Zweige f (x) = + x und f (x) =√− x müssen getrennt voneinander
behandelt werden. Für die Quadratwurzel schreiben wir auch x = x1/2 .
Die Wurzelfunktion lässt sich auch für beliebige Exponenten n verallgemeinern. Für die Potenzfunktion
f (x) = xn
(1.46)
definieren wir die n-te Wurzel als die entsprechende Umkehrfunktion
x1/n = f −1 (x).
(1.47)
Die Schreibweise der Wurzelfunktion mit Hilfe des Exponenten erlaubt die Anwendung der Rechenregeln für Potenzen, z. B. (x1/n )1/m = x1/(nm) .
Es gibt auch die Zusammensetzung von Potenzfunktion und Wurzelfunktion:
1/m
f (x) = (xn )
= xn/m .
(1.48)
Auch dafür gelten die Rechenregeln für Potenzen.
1.5.3
Exponentialfunktion
Die Exponentialfunktion und ihre Umkehrung, die Logarithmusfunktion, sind transzendente
Funktionen, d.h. sie lassen sich nicht als endliche Kombination von algebraischen Termen darstellen (sehr wohl aber durch unendliche Reihen).
Die allgemeine Form der Exponentialfunktion lautet:
f (x) = ax .
(1.49)
Dabei ist die reelle positive Zahl a die Basis und x der Exponent. Die Bedeutung von ax für
rationale Exponenten haben wir bereits im letzten Abschnitt kennen gelernt. Für irrationale Exponenten x, also für jene x-Werte, die sich nicht durch einen Bruch darstellen lassen, können wir x
beliebig genau durch einen solchen Bruch annähern und somit ax beliebig genau durch Verkettung
von Potenz- und Wurzelfunktion erhalten.
Wichtige Spezialfälle sind die Exponentialfunktionen mit Basis 10 und e:
f (x)
f (x)
=
10x,
(1.50)
=
x
(1.51)
e .
1 Funktionen
25
Die Exponentialfunktion mit Basis e schreiben wir auch oft als
f (x) = exp(x).
(1.52)
Exakt ist die Exponentialfunktion für die Basis e über eine Potenzreihe mit unendlich vielen
Gliedern definiert:
ex = 1 + x +
x3
x4
x2
+
+
+ ···
2!
3!
4!
(1.53)
(Im Kapitel 5 werden wir mehr über Potenzreihen erfahren.) Dabei ist e = 2.718281828 . . . die
Eulersche Zahl, eine der wichtigsten Zahlen der Mathematik. Eine alternative Definition ist über
den Grenzwert
ex = lim
k→∞
1+
x k
k
(1.54)
möglich.
Der Definitionsbereich der Exponentialfunktion umfasst die gesamte reelle Achse, −∞ < x < ∞
und der Wertebereich besteht aus allen positiven reellen Zahlen, 0 < y < ∞ (falls a = 1). Die
Exponentialfunktion ax ist überall stetig. Für a > 1 ist sie streng monoton wachsend und für a < 1
streng monoton fallend (siehe Abb. 1.21). Die Exponentialfunktion für a > 1 wächst für positive
x stärker an als jede Potenzfunktion, d. h.
ax
=∞
x→∞ xn
lim
für alle n ∈ N.
(1.55)
Abbildung 1.21: Die Exponentialfunktion ax für a > 1 (links) und 0 < a < 1 (rechts).
Für die Exponentialfunktion gelten folgende Rechenregeln:
a0
a−x
x y
(a )
ax ay
ax
ay
= 1,
1
=
,
ax
= axy ,
(1.56)
= ax+y ,
(1.59)
= ax−y .
(1.60)
(1.57)
(1.58)
(1.61)
Diese Rechenregeln folgen aus den Rechenregeln für die Potenz- und Wurzelfunktion.
26
1.5.4
1 Funktionen
Logarithmus
Die Umkehrfunktion der Exponentialfunktion ist der Logarithmus (wir erhalten ihn graphisch
durch Spiegelung der Exponentialfunktion an der 45◦ -Geraden). Zu verschiedenen Basen a der
Exponentialfunktion gibt es auch unterschiedliche Logarithmen. Wir bezeichnen den Logarithmus
zur Basis a der Zahl x als
loga (x).
(1.62)
Der Logarithmus der Zahl x zur Basis a ist also jene Zahl, mit der man a potenzieren muss, um x
zu erhalten:
(1.63)
y = loga (x) ⇔ ay = x.
Folgende Exponentialfunktionen und zugehörige Logarithmen werden in der Physik besonders
häufig verwendet:
y = 10x
y = ex
log10 (y) = log(y) = x
loge (y) = ln(y) = x
dekadischer Logarithmus
natürlicher Logarithmus
(1.64)
(1.65)
Abbildung 1.22: Die Logarithmusfunktion loga (x) für verschiedene Basen a.
Für alle Basen a folgt aus a0 = 1, dass loga 1 = 0. Der Definitionsbereich der Exponentialfunktion
erstreckt sich über alle positiven reellen Zahlen, 0 < x < ∞, und der Wertebereich ist −∞ < y < ∞.
Für die Logarithmusfunktion gelten folgende Rechenregeln:
loga (1) = 0,
1
loga
= − loga (x),
x
loga (xz ) = z loga (x),
loga (x · y) = loga (x) + loga (y),
x
loga
= loga (x) − loga (y).
y
(1.66)
(1.67)
(1.68)
(1.69)
(1.70)
Diese Rechenregeln folgen aus den Rechenregeln für die Exponentialfunktion. Zum Beispiel:
1
1
loga
= loga a− loga x = − loga x,
(1.71)
= loga
log
x
x
a a
oder:
loga (xy) = loga aloga x · aloga y = loga aloga x+loga y = loga x + loga y.
(1.72)
1 Funktionen
27
Auf ähnliche Weise erhalten wir
loga (xz ) = loga (aloga x )z = loga az loga x = z loga x.
(1.73)
Die Logarithmusfunktion wächst für a > 1 langsamer als jede beliebige Potenz von x, d.h.
lim
x→∞
loga (x)
=0
xn
für alle n ∈ N.
(1.74)
Wie die Exponentialfunktion lässt sich auch der Logarithmus von einer Basis in eine andere umformen:
(1.75)
loga (x) = loga blogb (x) = logb (x) · loga (b),
loga (x)
,
loga (b)
logb (x)
loga (x) =
.
logb (a)
logb (x) =
(1.76)
(1.77)
Mit Hilfe der Logarithmusfunktion lässt sich die Exponentialfunktion zu einer beliebigen Basis a
in eine auf der Eulerschen Zahl e beruhende Darstellungsform umwandeln:
x
x
ax = eln a = ex ln a = eln(a ) .
(1.78)
Für eine beliebige Basis b gilt:
x
x
ax = blogb a = bx logb a = blogb (a ) .
1.5.5
(1.79)
Winkelfunktionen
Die Winkelfunktionen (trigonometrische Funktionen) sind ebenfalls transzendente Funktionen.
Zur Definition dieser Funktion ist es sehr zweckmäßig, Winkel im Bogenmaß anzugeben. Dazu zeichnen wir zunächst einen Kreis mit Radius 1 durch den Scheitel des Winkels, den wir im
Bogenmaß ausdrücken wollen (siehe Abb. 1.23).
Abbildung 1.23: Das Bogenmaß des Winkels α ist die Bogenlänge b, die vom Winkel am Einheitskreis (Radius=1) begrenzt wird.
Die Länge des Kreisbogens zwischen den Winkelschenkeln ist das Bogenmaß dieses Winkels. Der
volle Kreis hat einen Umfang von 2π und der zugehörige Winkel beträgt daher im Bogenmaß 2π.
Zwischen dem üblichen Gradmaß und dem Bogenmaß gilt daher die Beziehung:
Bogenmaß = Gradmaß × 2π/360.
(1.80)
Die trigonometrischen Funktionen lassen sich geometrisch sehr anschaulich am Einheitskreis definieren. Eine exakte Definition dieser Funktionen erfolgt jedoch durch Potenzreihen. Auf diese
28
1 Funktionen
Abbildung 1.24: Verschiedene Winkel in Gradmaß und in Bogenmaß.
Abbildung 1.25: Definition der Winkelfunktionen für den Winkel α am Einheitskreis (Radius=1).
exakte Definition wollen wir hier jedoch verzichten. Die Winkelfunktionen setzen den Winkel α
mit verschiedenen Längen in Beziehung (siehe Abb. 1.25).
Mit Hilfe des in Abb. 1.25 dargestellten rechtwinkligen Dreiecks lassen sich geometrisch folgende
Funktionen des Winkels α definieren:
Sinus:
Kosinus:
Tangens:
Kotanges:
sin α = Gegenkathete / Hypotenuse
cos α = Ankathete / Hypotenuse
tan α =Gegenkathete / Ankathete
cot α =Ankathete / Gegenkathete
Tragen wir sin(α) und cos(α) als Funktion von α in einem kartesischen Koordinatensystem auf, erhalten wir die in Abbildung 1.26 dargestellten Funktionsgraphen. Während der Sinus eine ungerade
Funktion ist,
sin(x) = − sin(−x),
(1.81)
cos(−x) = cos(x).
(1.82)
ist der Kosinus gerade,
Nachdem der Winkel α die Werte 0 bis 2π durchlaufen hat, zeigen die Funktionen wieder dieselben
Werte wie vorher, d.h. die Funktionen sind periodisch mit der Periode 2π:
sin(x + 2πn) =
sin(x)
(1.83)
cos(x + 2πn) =
cos(x),
(1.84)
1 Funktionen
29
wobei n eine ganze Zahl ist. Die Werte von Sinus und Kosinus schwanken zwischen -1 und +1.
Abbildung 1.26: Sinus und Kosinus.
Der Tangens und der Kotangens sind ebenfalls periodische Funktionen, haben aber eine Periodenlänge von π statt 2π (siehe Abb. 1.27). Sowohl der Tangens als auch der Kotangens sind
ungerade Funktionen:
tan(x) = − tan(−x),
cot(x) = − cot(−x).
Die Tangensfunktion tan α ist singulär bei α =
α = 0, π, 2π, . . . .
π 3π
2, 2 ,...
(1.85)
(1.86)
und die Kotangensfunktion cot α bei
Abbildung 1.27: Tangens (links) und Kotangens (rechts).
Winkelfunktionen können ineinander umgewandelt werden. Zum Beispiel gelten folgende Beziehungen, die man leicht durch Anwendung des Satzes von Pythagoras auf das in Abb. 1.25 dargestellte
rechtwinklige Dreieck ableiten kann (sin2 α + cos2 α = 1):
1 − cos2 α,
tan α
sin α = √
,
1 + tan2 α
1
.
tan α =
cot α
sin α =
(1.87)
(1.88)
(1.89)
Weitere Formeln zur Umformung trigonometrischer Funktionen sowie die Werte der Winkelfunktion
an besonderen Stellen können den gängigen Formelsammlungen entnommen werden.
Äußerst wichtig sind zudem die Additionstheoreme für die Winkelfunktionen:
sin(α + β)
=
sin α cos β + cos α sin β,
(1.90)
cos(α + β)
=
cos α cos β − sin α sin β.
(1.91)
30
1 Funktionen
Diese Ausdrücke kann man zur Umformung von trigonometrischen Ausdrücken verwenden. So
können wir zum Beispiel folgende Vereinfachung durchführen:
x)
cos x (1 − tan2 x)
cos x (1 + tan x)
cos x (1 − tan2 x)
(1
−
tan
=
=
x)
tan x (cot x − 1)
(1 − tan x)
(1
−
tan
sin x
= cos x + sin x
= cos x 1 +
cos x
π
+ sin x
= sin x +
2
π
π
π
π
+ sin x − +
= sin x + +
4
4
4 4 π
π
π
π
cos + sin cos x +
= sin x +
4
4 π 4 π 4
π
π
+ sin x +
cos −
+ sin −
cos x +
4
4
4
4
1
π
π
1
+
x
= √ sin x +
+ √cos
4
4
2 2
1
π
1
π
+
+ √ sin x +
− √cos
x
4
4
2 2
√
2
π
π
= √ sin x +
= 2 sin x +
.
4
4
2
(1.92)
Die Winkelfunktionen hängen eng mit der Exponentialfunktion zusammen. Dieser Zusammenhang
ist durch die Eulersche Formel gegeben (eiϕ = cos ϕ+i sin ϕ), die wir im Kapitel 6 näher behandeln
werden.
1.5.6
Arcusfunktionen
Oft kennen wir beispielsweise den Sinus eines Winkels und möchten daraus den Winkel selbst
bestimmen. Dies können wir mit der Umkehrfunktion des Sinus, dem Arcussinus tun:
x = arcsin y
(y = sin x).
(1.93)
Die Bezeichnung Arcussinus stammt von arcus ab, der lateinischen Bezeichnung für Bogen (wir
bestimmen ja das “Bogenmaß” des Winkels aus dem Sinus). Da jetzt y die unabhängige Variable
ist, benennen wir sie um in x:
y = arcsin x.
(1.94)
Der Definitionsbereich des Arcussinus ist −1 ≤ x ≤ 1. Da ein bestimmter Wert der Winkelfunktionen durch eine Vielzahl von Winkeln erzeugt wird (siehe Abb. 1.28), muss der Wertebereich auf
einen gewissen Bereich eingeschränkt werden. Wir beschränken den Wertebereich so, dass jeder
Wert des Sinus genau einmal angenommen wird. Damit erreichen wir eine eindeutige Zuordnung.
Der zugeordnete Wert heißt Hauptwert. Der Hauptwert ist jener Wert y, der mit x = sin(y) konsistent ist und den kleinsten Absolutwert |y| besitzt. Für y = arcsin(x) gilt also ein Wertebereich
von − π2 ≤ y ≤ π2 (siehe Abb. 1.29). Analog verfährt man mit arccos, arctan und arccot.
1 Funktionen
31
Abbildung 1.28: Die Sinusfunktion nimmt einen bestimmten Funktionswert an verschiedenen Stellen an.
Abbildung 1.29: Arcussinus und Arcuskosinus.
Die folgende Tabelle enthält die Definitionsbereiche D und Wertebereiche W der Arcusfunktionen:
Funktion
D
W
arcsin
[−1, +1]
[− π2 , π2 ]
arccos
[−1, +1]
[0, π]
arctan
[−∞, +∞]
[− π2 , π2 ]
arccot
[−∞, +∞]
[0, π]
Alternative Schreibweisen für die Arcusfunktionen sind:
arcsin(x) = sin−1 (x) = asin(x),
arccos(x) = cos−1 (x) = acos(x),
arctan(x) = tan−1 (x) = atan(x),
arccot(x) = cot−1 (x) = acot(x).
Die Arcusfunktionen werden auch zyklometrische Funktionen genannt. Für die Arcusfunktionen gibt es zahlreiche nützliche Beziehungen, die Sie bei Bedarf den gängigen Formelsammlungen
entnehmen können.
32
1 Funktionen
Abbildung 1.30: Arcustangens und Arcuskotangens.
1.5.7
Hyperbolische Funktionen
Während die trigonometrischen Funktionen durch den Schnitt einer Geraden mit einem Kreis erzeugt werden können, werden die hyperbolischen
Funktionen durch den Schnitt mit den Hyper√
belästen der Einheitshyperbel y = ± x2 − 1 erzeugt. Die Funktionen werden aber nicht angegeben
als Funktion des Steigungswinkels wie bei den trigonometrischen Funktionen,
√ sondern als Funktion
der von den Geraden mit Steigung g und −g und der Hyperbel y = ± x2 − 1 eingeschlossenen
Fläche A. Die geometrische Bedeutung der hyperbolischen Funktionen sinh und cosh ist in Abb.
1.31 dargestellt.
Abbildung 1.31: Geometrische Interpretation der hyperbolischen Funktionen sinh und cosh.
Analog zu den trigonometrischen Funktionen Sinus, Kosinus, Tangens und Kotangens können auch
1 Funktionen
33
die entsprechenden hyperbolischen Funktionen definiert werden:
Sinus hyperbolicus
Cosinus hyperbolicus
Tangens hyperbolicus
Cotangens hyperbolicus
sinh(x),
cosh(x),
tanh(x) = sinh(x)/ cosh(x),
coth(x) = 1/ tanh(x).
Die Hyperbelfunktionen lassen sich mit Hilfe der Exponentialfunktion ausdrücken:
sinh x =
cosh x =
tanh x =
coth x =
ex − e−x
,
2
ex + e−x
,
2
x
−x
e −e
,
ex + e−x
ex + e−x
.
ex − e−x
(1.95)
(1.96)
(1.97)
(1.98)
Hyperbolische und trigonometrische Funktionen können in der komplexen Ebene als gleichwertige Funktionen dargestellt werden. Durch Verwendung imaginärer Argumente werden die
Funktionen ineinander übergeführt. Diesen Zusammenhang werden wir im Kapitel 6 näher behandeln.
Die Funktionsgraphen der wichtigsten dieser Funktionen sind in Abb. 1.32 und 1.33 dargestellt.
Abbildung 1.32: Die hyperbolischen Funktionen sinh and cosh.
Abbildung 1.33: Die hyperbolischen Funktionen tanh and coth.
Wichtige Zusammenhänge zwischen den hyperbolischen Funktionen lassen sich aus der Gleichung
sinh2 (x) = cosh2 (x) − 1
(1.99)
ableiten.
1.5.8
Areafunktionen
Die inversen Hyperbelfunktionen werden als Areafunktionen bezeichnet. (Der Name kommt daher,
dass wir die eingeschlossene Fläche A, also lateinisch “area”, erhalten, wenn wir die hyperbolischen
Funktionen umkehren.)
34
1 Funktionen
Abbildung 1.34: Die Areafunktionen Arsinh und Arcosh (links) sowie Artanh und Arcoth (rechts).
Die Areafunktionen können mit Hilfe von Logarithmen ausgedrückt werden:
Arsinh(x) = ln(x + x2 + 1),
Arcosh(x) = ln(x + x2 − 1),
1 1+x
ln
,
Artanh(x) =
2 1−x
1 x+1
ln
.
Arcoth(x) =
2 x−1
(1.100)
(1.101)
(1.102)
(1.103)
Diese Formeln erhält man durch direkte Umkehrung der hyperbolischen Funktionen. Zusammenhänge zwischen den verschiedenen Areafunktionen können den gängigen Formelsammlungen
entnommen werden.
Kapitel 2
Vektoren
2.1
Grundlagen
In der Physik ist es oft notwendig, von gewissen Größen nicht nur deren Betrag, sondern auch
deren Richtung zu kennen. Wenn wir mit dem Fahrrad irgendwohin fahren, ist unsere Bewegungsrichtung genau so wichtig wie der Betrag unserer Geschwindigkeit. Solche Größen nennt
man Vektoren. Beispiele für Vektoren sind: Kraft, Geschwindigkeit, Beschleunigung, Feldstärke,
Flächenelement, Impuls und Dipolmoment. Größen, die keine Richtung besitzen, nennen wir Skalare. Dazu zählen: Zeit, Masse, Volumen, Dichte, elektrische Ladung und Energie. Wir definieren
also Vektoren wie folgt:
Definition: Ein Vektor ist eine gerichtete Größe. Er wird durch eine Richtung und eine Länge
(einen Betrag) beschrieben.
Im Folgenden werden wir Vektoren durch einen Pfeil kennzeichnen, zum Beispiel F und v . Häufig
werden Vektoren aber auch im Fettdruck angegeben, zum Beispiel F und v.
Bei einer physikalischen Vektorgröße gehört zur vollständigen Beschreibung auch die Angabe einer
Maßeinheit. Der Betrag besteht aus Maßzahl und Einheit. Kräfte messen wir zum Beispiel in
der Einheit Newton (abgekürzt N): |F1 | = F1 = 100N. Hier haben wir den Betrag eines Vektors,
also dessen Länge, mit Hilfe von senkrechten Strichen ausgedrückt.
Graphisch können wir Vektoren als Pfeile darstellen mit Länge und Richtung (siehe Abb. 2.1).
Abbildung 2.1: Ein Vektor r lässt sich als Pfeil in einem rechtwinkligen Koordinatensystem darstellen. In diesem zweidimensionalen Beispiel hat der Vektor r die Komponenten ∆x und ∆y:
r = (∆x, ∆y). Der Vektor ist durch Angabe des Anfangspunktes Q und des Endpunktes P eindeutig festgelegt.
35
36
2 Vektoren
Ein Vektor lässt sich auch durch Angabe von Anfangspunkt Q und Endpunkt P eindeutig festlegen.
−−
→
Dann schreiben wir QP .
Wenn wir als Anfangspunkt Q den Ursprung (0, 0, 0) des Koordinatensystems wählen (siehe Abb.
2.2 für den 2-dimensionalen Fall), so kann der Ortsvektor r des Punktes P = P (x, y, z) in
kartesischen Koordinaten geschrieben werden als
r = (x, y, z).
(2.1)
r = (rx , ry , rz ).
(2.2)
Oft finden wir auch die Notation
Abbildung 2.2: Falls wir als Ausgangspunkt Q den Ursprung wählen, können wir r als den Ortsvektor des Punktes P = (x, y) deuten.
Der Ortsvektor r gibt die Lage des Punktes P relativ zum Ursprung an.
Abbildung 2.3: Der Verschiebungsvektor r = r2 − r1 ist der Verbindungsvektor zwischen Punkt P1
mit Ortsvektor r1 und Punkt P2 mit Ortsvektor r2 .
Vektoren können auch Verschiebungen beschreiben. Der Verschiebungsvektor zwischen den
Punkten P1 und P2 ist die Differenz der Ortsvektoren r1 und r2 der Punkte P1 und P2 :
r = r2 − r1 .
(2.3)
Was genau die Differenz zweier Vektoren bedeutet, werden wir später sehen.
Hier ist es wichtig anzumerken, dass in der graphischen Darstellung Pfeile mit gleicher Richtung
und gleichem Betrag aber unterschiedlichen Ausgangspunkten zum selben Vektor gehören. Ein
graphisch dargestellter Pfeil ist also nur einer von vielen Repräsentanten eines Vektors (siehe Abb.
2.4).
Von besonderer Bedeutung sind der Nullvektor und der Einheitsvektor:
Nullvektor: 0, |0| = 0, hat Länge Null und keine Richtung.
2 Vektoren
37
Abbildung 2.4: Pfeile, welche durch Parallelverschiebung ineinander übergeführt werden können,
also gleichen Betrag und gleiche Richtung besitzen, gehören zum selben Vektor.
Einheitsvektor: e, |e| = 1, hat Länge 1, wird verwendet, um Richtungen anzugeben
(z. B. Einheitsvektoren ex , ey , ez entlang der Achsen eines kartesischen Koordinatensystems). Einheitsvektoren werden auch als normiert bezeichnet.
2.2
Koordinatensysteme
Vektoren können auf verschiedene Weise dargestellt werden. Bisher haben wir dazu kartesische
Koordinaten verwendet. Bei gewissen Problemen sind andere Koordinatensysteme, die die Symmetrien des Problems auf natürliche Weise berücksichtigen, oft günstiger (z.B. Kugelkoordinaten,
Zylinderkoordinaten). Im Folgenden werden wir kurz die Darstellung von Vektoren in verschiedenen
Koordinatensystemen besprechen.
2.2.1
Kartesische Koordinaten
Unter einem kartesischen Koordinatensystem versteht man rechtwinklige Koordinatensysteme, die wir bereits zur Darstellung von Funktionen verwendet haben (siehe Abb. 2.5). Die Achsen
eines kartesischen Koordinatensystems stehen senkrecht aufeinander. Kartesische Koordinatensysteme können für beliebig viele Dimensionen definiert werden. Abbildung 2.5 zeigt ein zweidimensionales und ein dreidimensionales Beispiel.
Mit Hilfe der Einheitsvektoren ex , ey und ez (auch Basisvektoren genannt) in Richtung der Koordinatenachsen können wir den Ortsvektor r auch darstellen als so genannte Linearkombination:
r = (x, y, z) = (rx , ry , rz ) = xex + yey + zez .
(2.4)
In kartesischen Koordinaten ergibt sich der Betrag (Länge) des Vektors aus dem Satz von Pythagoras:
r = |r| = x2 + y 2 = rx2 + ry2 ,
(2.5)
(2.6)
r = |r| = x2 + y 2 + z 2 = rx2 + ry2 + rz2 .
Der Einheitsvektor er in Richtung eines bestimmten Vektors r = 0 ergibt sich durch Division
des Vektors durch seinen Betrag:
er =
r
.
|r|
Dadurch erhält der Einheitsvektor er die Länge 1.
(2.7)
38
2 Vektoren
Abbildung 2.5: Zweidimensionales (2d) und dreidimensionales (3d) kartesisches Koordinatensystem. Die Einheitsvektoren ex , ey und ez zeigen in Richtung der Koordinatenachsen. Die Achsen
des dreidimensionalen Koordinatensystems bilden ein so genanntes “Rechtssystem”, das wir weiter
unten genauer besprechen werden.
Beispiel:
r = (3, 4, 5) = 3ex + 4ey − 5ez ,
√
√
r = |r| = 32 + 42 + (−5)2 = 9 + 16 + 25 = 50.
(2.8)
(2.9)
Einheitsvektor:

3
1 
r

er =
= √  4 .
|r|
50
−5

2.2.2
(2.10)
Polarkoordinaten
Anstelle der x- und y-Koordinate eines Punktes P in der Ebene können wir seine Lage auch durch
seine Entfernung r vom Ursprung und durch den Winkel ϕ, den die Verbindungslinie vom Punkt
zum Ursprung mit der x-Achse einschließt, angeben (siehe Abb. 2.6). Dabei wird der Winkel
ϕ gegen den Uhrzeigersinn bestimmt. Der Abstand r und der Winkel ϕ sind die so genannten
Polarkoordinaten des Punktes P (und seines Ortsvektors r).
Abbildung 2.6: Polarkoordinaten r und ϕ des Vektors r.
Wie aus Abb. 2.6 ersichtlich ergeben sich die kartesischen Koordinaten wie folgt aus den Polarko-
2 Vektoren
39
ordinaten:
x =
y =
r cos ϕ,
r sin ϕ.
(2.11)
(2.12)
Umgekehrt kommen wir durch
r = x2 + y 2
y ϕ = arctan
x
r>0
(2.13)
0 ≤ ϕ < 2π
(2.14)
von kartesischen zu Polarkoordinaten.
Polarkoordinaten bilden ein so genanntes krummliniges Koordinatensystem (siehe Abb. 2.7).
Abbildung 2.7: Durch Angabe von r und ϕ definieren wir einen Punkt in der Ebene. Die durch
r = const definierten Kurven sind Kreise um den Ursprung und ϕ = const definiert vom Ursprung
ausgehende Halbgeraden.
Beispiel:
P = (3, −4)
⇒
Ortsvektor r =
3
−4
√
32 + 42 = 25 = 5
−4
ϕ = arctan
(die Umkehrung des tan ist nicht eindeutig).
= −53◦
3
r = |r| =
(2.15)
(2.16)
(2.17)
Im Kapitel 1.1 haben wir Kurven (Funktionsgraphen) in kartesischen Koordinaten dargestellt.
Wir können das aber auch in Polarkoordinaten tun, indem wir den Abstand r vom Ursprung als
Funktion des Winkels darstellen, zum Beispiel
1
.
r(ϕ) = √
cos 2ϕ
(2.18)
Durch Einsetzen dieser Gleichung in die Formel zur Umrechnung von Polarkoordinaten in kartesische Koordinaten erhalten wir die Kurve in Parameterform mit ϕ als Parameter:
x
y
cos ϕ
,
= r cos ϕ = √
cos 2ϕ
sin ϕ
= r sin ϕ = √
.
cos 2ϕ
(2.19)
(2.20)
40
2 Vektoren
√
Abbildung 2.8: In Polarkoordinaten kann die Hyperbel durch r = 1/ cos 2ϕ ausgedrückt werden.
Wir wollen nun den Parameter ϕ eliminieren. Dazu stellen wir fest, dass cos 2ϕ = cos2 ϕ − sin2 ϕ
und erhalten
cos ϕ
,
(2.21)
x = 2
cos ϕ − sin2 ϕ
sin ϕ
.
(2.22)
y = 2
cos ϕ − sin2 ϕ
Quadrieren ergibt
x2
=
y2
=
cos2 ϕ
,
cos2 ϕ − sin2 ϕ
sin2 ϕ
.
cos2 ϕ − sin2 ϕ
(2.23)
(2.24)
Wenn wir nun y 2 von x2 subtrahieren, erhalten wir:
x2 − y 2 =
cos2 ϕ
sin2 ϕ
cos2 ϕ − sin2 ϕ
−
=
= 1.
cos2 ϕ − sin2 ϕ cos2 ϕ − sin2 ϕ
cos2 ϕ − sin2 ϕ
(2.25)
Dies ist die Kurvengleichung für eine Hyperbel
x2 − y 2 = 1,
y=±
x2 − 1.
(2.26)
Eine der ersten Anwendungen von ebenen Polarkoordinaten, die Ihnen im 1. Semester begegnen
wird, ist die Kreisbewegung. Im Allgemeinen beschrieben wird die Bewegung eines Objektes
durch Angabe seines Ortes als Funktion der Zeit:
r = r(t).
(2.27)
Ein zweidimensionales Beispiel einer dadurch entstehenden Bahnkurve ist in Abb. 2.9 dargestellt.
Bei einer Kreisbewegung bewegt sich das Objekt (durch einen Punkt dargestellt) auf einer Kreisbahn (siehe Abb. 2.10).
Um die Kreisbewegung zu beschreiben, suchen wir die kartesischen Koordinaten x(t) und y(t)
als Funktion der Zeit t. Dies lässt sich in Polarkoordinaten sehr einfach bewerkstelligen. Bei einer
2 Vektoren
41
Abbildung 2.9: Bahnkurve (auch Trajektorie genannt) eines Punktes, der sich in der Ebene
bewegt.
Abbildung 2.10: Kreisbewegung eines Punktes in der Ebene.
gleichförmigen Kreisbewegung ist der Abstand vom Ursprung konstant, d. h. r = const. Der Winkel
aber ändert sich mit der Zeit. Da die Bewegung gleichförmig ist, wächst der Winkel linear mit der
Zeit:
ϕ(t) = ωt.
(2.28)
Dabei ist ω die so genannte Winkelgeschwindigkeit, die in unserem Fall konstant ist.
In kartesischen Koordinaten können wir dann die Bewegung beschreiben durch:
x
= r cos(ϕ(t)) = r cos ωt,
(2.29)
y
= r sin(ϕ(t)) = r sin ωt.
(2.30)
Sowohl die x- als auch die y-Koordinate des Punktes ändern sich auf nicht triviale Weise mit der
Zeit. Hier haben wir ausgenutzt, dass sich das Problem durch Wahl eines geeigneten Koordinatensystems wesentlich vereinfacht.
Beispiel: Zykloide
Als weiteres Beispiel suchen wir nach der Kurve, die ein Punkt eines auf einer Ebene rollenden
Rades beschreibt (siehe Abb. 2.11). Wir nehmen an, dass zu Beginn der Punkt im Ursprung ist.
42
2 Vektoren
Abbildung 2.11: Ein Punkt auf einem rollenden Rad beschreibt eine Zykloide.
Nachdem sich das Rad um den Winkel ϕ gedreht hat, hat sein Mittelpunkt die Strecke ϕr zurückgelegt. Der Punkt ist in x-Richtung jedoch um r sin ϕ zurückgeblieben:
x = ϕ · r − r sin ϕ.
(2.31)
Für die y-Koordinate des Punktes gilt
y = r − r cos ϕ.
(2.32)
Die Bahnkurve in kartesischen Koordinaten ergibt sich also durch Addition von linearer Bewegung
und Kreisbewegung.
2.2.3
Zylinderkoordinaten
Durch ebene Polarkoordinaten können wir einen Punkt in der xy-Ebene definieren. Wenn wir zu
diesen Koordinaten noch eine z-Koordinate hinzufügen, legen wir damit einen Punkt im Raum
fest. Diese Koordinaten nennen wir die Zylinderkoordinaten ρ, ϕ und z (siehe Abb. 2.12). Hier
verwenden wir ρ statt r für die Länge der Projektion des Vektors r in die xy-Ebene, um diese
Länge vom Betrag des Ortsvektors r zu unterscheiden.
Durch ρ =const, ϕ =const und z =const werden folgende Flächen definiert:
ϕ = const:
ρ = const:
z = const:
Halbebene durch z-Achse,
Zylinder mit der z-Achse als Rotationsachse,
Ebene normal zur z-Achse.
Aus bekannten Zylinderkoordinaten lassen sich die kartesischen Koordinaten bestimmen:
x =
y =
ρ cos ϕ,
ρ sin ϕ,
(2.33)
(2.34)
z
z.
(2.35)
=
Umgekehrt gilt:
ρ
=
ϕ =
z
=
x2 + y 2 ,
y
,
arctan
x
z.
(2.36)
(2.37)
(2.38)
2 Vektoren
43
Abbildung 2.12: Zylinderkoordinaten.
Zylinderkoordinaten sind bei Situationen sinnvoll, bei denen die betrachteten Größen rotationssymmetrisch bezüglich einer Achse sind, z.B. das Magnetfeld um einen stromdurchflossenen Draht
oder das Trägheitsmoment eines Zylinders.
2.2.4
Kugelkoordinaten
In Kugelkoordinaten stellen wir die Lage eines Punktes mit Ortsvektor r durch seinen Abstand r =
|r| vom Ursprung sowie zwei Winkel ϕ (Azimut) und ϑ (Elevation) dar. Dabei ist ϑ der Winkel
zwischen dem Ortsvektor r und der positiven z-Achse. ϑ ist ähnlich der geographischen Breite (die
geographische Breite ist jedoch am Äquator identisch 0, während ϑ am Nordpol verschwindet) und
ϕ entspricht der geographischen Länge. Der Winkel ϕ ist der Winkel zwischen der Projektion von
r in die xy-Ebene und der positiven x-Achse. Die Geometrie der Kugelkoordinaten ist in Abb. 2.13
dargestellt.
Die Kugelkoordinaten r, ϕ und ϑ haben folgende Wertebereiche:
0 ≤ r,
(2.39)
0 ≤ ϕ < 2π,
0 ≤ ϑ ≤ π.
(2.40)
(2.41)
Kugelkoordinaten können durch folgende Ausdrücke in kartesische Koordinaten umgewandelt werden. Am einfachsten ist der Ausdruck für die z-Koordinate:
z = r cos ϑ.
(2.42)
Die x- und y-Koordinaten schreiben wir zunächst als
x =
y =
ρ cos ϕ,
ρ sin ϕ.
(2.43)
(2.44)
Da aber ρ = r sin ϑ ist, erhalten wir schließlich
x
y
= r sin ϑ cos ϕ,
= r sin ϑ sin ϕ,
(2.45)
(2.46)
z
= r cos ϑ.
(2.47)
44
2 Vektoren
Abbildung 2.13: Kugelkoordinaten.
Aus den kartesischen Koordinaten können die Kugelkoordinaten durch
r =
x2 + y 2 + z 2 ,
z
x2 + y 2
= arccos ϑ = arctan
,
z
x2 + y 2 + z 2
y
ϕ = arctan
x
(2.48)
(2.49)
(2.50)
bestimmt werden.
Durch r =const, ϕ =const und ϑ =const werden folgende Flächen definiert:
r = const:
ϕ = const:
ϑ = const:
2.3
Kugeln um den Ursprung,
Halbebenen durch z-Achse,
Kegel um z-Achse mit Ursprung als Spitze.
Vektoralgebra
Wir befassen uns als nächstes mit den Rechenregeln für Vektoren in kartesischen Koordinaten.
2.3.1
Gleiche, inverse und parallele Vektoren
• Zwei Vektoren sind gleich, a = b, wenn sie in Betrag und Richtung übereinstimmen.
• Zwei Vektoren a und b sind invers, wenn sie denselben Betrag besitzen aber entgegengesetzte
Richtung, das heißt a = −b.
• Zwei Vektoren sind parallel (oder genauer: gleichsinnig parallel), a||b, wenn sie gleiche Richtung haben. Das heißt, a = λb mit λ > 0. Wenn die beiden Vektoren die entgegengesetzte
2 Vektoren
45
Richtung haben, nennt man sie antiparallel (oder gegensinnig parallel). In diesem Fall ist
a = λb mit λ < 0.
Der zu Vektor a gehörende Gegenvektor (oder inverse Vektor) −a besitzt den gleichen Betrag aber
entgegengesetzte Richtung. Komponentenweise können wir den inversen Vektor schreiben als




−ax
ax




−a =  −ay  .
(2.51)
a =  ay  ,
−az
az
2.3.2
Vektoraddition und -subtraktion
Abbildung 2.14: Vektoraddition.
Die Addition zweier Vektoren a und b,
c = a + b,
(2.52)
kann graphisch durch Aneinanderhängen erfolgen. Dazu verschieben wir den Vektor b parallel und
hängen seinen Anfangspunkt an den Endpunkt von a. Der Summenvektor c ist dann der Vektor vom
Anfangspunkt von a zum Endpunkt des verschobenen Vektors b. Dies ist in Abb. 2.14 graphisch
dargestellt.
In kartesischen Koordinaten erfolgt die Addition zweier Vektoren komponentenweise:
 
 
 


bx
ax + b x
cx
ax
 
 
 


c = a + b =  ay  +  by  =  ay + by  =  cy  .
az
bz
az + b z
(2.53)
cz
In der Darstellung mit Einheitsvektoren gilt für die Addition:
c = a + b = axex + ay ey + az ez + bxex + byey + bzez
=
=
(ax + bx )ex + (ay + by )ey + (az + bz )ez
cxex + cyey + cz ez .
Der Nullvektor

0 =

0
 
 0 
0
(2.54)
(2.55)
46
2 Vektoren
ist das neutrale Element der Addition. Das heißt, dass die Addition des Nullvektors zu einem
beliebigen Vektor diesen nicht verändert:
a + 0 = a.
(2.56)
Das inverse Element der Vektoraddition ist:

−ax


 −ay  .
−az

− a
=
(2.57)
Addition eines Vektors und seines inversen Elements ergibt den Nullvektor:
  
ax − ax
0
  

a + (−a) =  ay − ay  =  0  = 0.
az − az
0

(2.58)
Abbildung 2.15: Der Vektor b wird vom Vektor a subtrahiert, indem der inverse Vektor −b zum
Vektor a addiert wird.
Die Subtraktion eines Vektors b vom Vektor a ergibt sich aus der Addition des inversen Elements:

ax − b x


a − b = a + (−b) =  ay − by  .
az − b z

(2.59)
Die Vektorsubtraktion ist in Abb. 2.15 graphisch dargestellt.
Weiters gelten das Kommutativgesetz
a + b = b + a
(2.60)
(a + b) + c = a + (b + c) = a + b + c.
(2.61)
und das Assoziativgesetz
2 Vektoren
2.3.3
47
Multiplikation eines Vektors mit einem Skalar
Die Multiplikation eines Vektors a mit einem Skalar α kann als eine α-fach hintereinander ausgeführte Verschiebung um a aufgefasst werden. Damit kann man sie auf eine wiederholte Addition
zurückführen, z.B.
a + a = 2a,
(2.62)
a + a + a = 3a.
(2.63)
Graphisch (siehe Abb. 2.16) erkennt man, dass dabei die Richtung des Vektors erhalten bleibt, sich
seine Länge jedoch ändert.
Abbildung 2.16: Multiplikation eines Vektors mit einem Skalar (hier ist der Skalar gleich 3).
Während durch die Multiplikation die Richtung des Vektors unverändert bleibt, hat sich seine
Länge um den Faktor 3 verändert.
In kartesischen Koordinaten erfolgt die Multiplikation mit einem Skalar komponentenweise

αax


αa =  αay  .
αaz

(2.64)
Für den Betrag von b = αa gilt:
|b| = |αa| =
(αax )2 + (αay )2 + (αaz )2 = α2 (a2x + a2y + a2z ) = |α||a|.
(2.65)
Die Division eines Vektor durch einen Skalar λ entspricht der Multiplikation des Vektors mit dem
Skalar µ = 1/λ.
Weiters gelten für die Multiplikation eines Vektors mit einem Skalar die Distributivgesetze
α(a + b) = αa + αb
(2.66)
(α + β)a = αa + βa
(2.67)
α(βa) = (αβ)a = αβa.
(2.68)
und
sowie das Assoziativgesetz
48
2.4
2.4.1
2 Vektoren
Skalarprodukt
Definition
Das Skalarprodukt (innere Produkt) zweier Vektoren a und b ist die Zahl
c = a · b = |a||b| cos α.
(2.69)
Dabei sind |a| und |b| die Beträge von a und b, und α ist der von ihnen eingeschlossene Winkel
(siehe Abb. 2.17). Für das Skalarprodukt verwendet man auch (vor allem in der Quantenmechanik)
die so genannte Bra-und-Ket-Notation a · b oder a|b.
Abbildung 2.17: Das Skalarprodukt von a und b ist c = |a||b| cos α.
Geometrisch betrachtet ist das Skalarprodukt das Produkt des Betrages von a mit dem Betrag des
Anteils von b in Richtung a (siehe Abb. 2.17). (Natürlich könnte man auch sagen: das Skalarprodukt
ist das Produkt des Betrages von b mit dem Betrag des Anteils von a in Richtung b.)
2.4.2
Rechenregeln
Für das Skalarprodukt gelten das Kommutativgesetz
a · b = b · a,
(2.70)
(λa) · b = λ(a · b) = a · (λb) = λa · b,
(2.71)
a · (b + c) = a · b + a · c.
(2.72)
das Assoziativgesetz
und das Distributivgesetz
Im Folgenden werden wir diese Rechenregeln aus der geometrischen Definition des Skalarproduktes
ableiten. Zunächst halten wir fest, dass die Definition (2.69) bezüglich einer Vertauschung von a
und b symmetrisch ist, d. h. eine Vertauschung von a und b ändert das Skalarprodukt nicht.
Infolgedessen gilt das Kommutativgesetz:
a · b = b · a.
(2.73)
Weiters beobachten wir, dass die Multiplikation des Vektors a mit einem positiven Skalar λ auf
das Skalarprodukt folgende Wirkung hat (siehe Abb. 2.18a):
(λa) · b = |λa||b| cos α = λ|a||b| cos α.
(2.74)
2 Vektoren
49
Abbildung 2.18: (a) Durch Multiplikation des Vektors a mit einem positiven Skalar λ ändert sich
nur die Länge des Vektors, aber nicht der eingeschlossen Winkel α. (b) Multiplizieren wir a mit
einem negativen Skalar, ändert sich der eingeschlossene Winkel von α auf π − α.
Ist λ negativ, müssen wir berücksichtigen, dass der eingeschlossene Winkel sich von α auf (π − α)
ändert (siehe Abb. 2.18b):
(λa) · b = |λa||b| cos(π − α) = |λ||a||b|(− cos α) = λ|a||b| cos α.
(2.75)
Somit haben wir in beiden Fällen:
(λa) · b = λ(a · b).
(2.76)
Aufgrund der Kommutativität erhalten wir auch
a · (λb) = λ(a · b).
(2.77)
Wir fassen diese Ergebnisse im Assoziativgesetz zusammen:
(αa) · b = α(a · b) = a · (αb) = αa · b.
(2.78)
Abbildung 2.19: Skalarprodukt des Vektors a mit der Summe b + c.
Schließlich betrachten wir das Skalarprodukt eines Vektors a mit der Summe b + c der Vektoren b
und c. Wie man in Abb. 2.19 sehen kann, ist die Projektion d = |b+c| cos α des Summenvektors b+c
auf den Vektor a gleich der Summe der Projektionen b = |b| cos β und c = |c| cos γ der Vektoren
b und c auf den Vektor a. (Dies gilt sowohl in zwei als auch in drei Dimensionen.) Folglich gilt:
a · (b + c)
= |a||b + c| cos α = |a|d = |a|(b + c )
= |a|(|b| cos β + |c| cos γ)
(2.80)
= |a||b| cos β + |a||c| cos γ = a · b + a · c.
(2.81)
(2.79)
Diese Eigenschaft ist das Distributivgesetz:
a · (b + c) = a · b + a · c.
(2.82)
50
2.4.3
2 Vektoren
Komponentenweise Darstellung
In kartesischen Koordinaten ist das Skalarprodukt gegeben durch:
 

ax
bx
 


a · b =  ay  ·  by  = ax bx + ay by + az bz .
az
bz

(2.83)
Durch diese Gleichung besitzen wir eine einfache Vorschrift, um das Skalarprodukt zu berechnen.
Von ihrer Gültigkeit kann man sich leicht in der Darstellung mit Basisvektoren überzeugen:
a · b = (axex + ay ey + az ez ) · (bxex + by ey + bz ez )
= ax bx (ex · ex ) + ax by (ex · ey ) + ax bz (ex · ez )
+ ay bx (ey · ex ) + ay by (ey · ey ) + ay bz (ey · ez )
+ az bx (ez · ex ) + az by (ez · ey ) + az bz (ez · ez ),
(2.84)
wobei wir das Distributivgesetz verwendet haben. Da die Einheitsvektoren ex , ey und ez definitionsgemäß Länge eins besitzen,
ex · ex = ey · ey = ez · ez = 1,
(2.85)
und aufeinander senkrecht stehen (d.h. cos α = 0),
ei · ej
=
0
für i = j,
(2.86)
gilt
a · b = ax bx + ay by + az bz .
2.4.4
(2.87)
Anwendungen
Das Skalarprodukt findet vielfältige Verwendung. So können wir beispielsweise den Betrag eines
Vektors a mit Hilfe des Skalarprodukts berechnen:
√
(2.88)
a · a = |a| · |a| cos
α = |a| · |a| ⇒ |a| = a · a.
=1
Mit dem Skalarprodukt können wir Vektoren auf Orthogonalität prüfen. Falls der Vektor a auf
den Vektor b senkrecht steht (d.h., wenn sie orthogonal sind, a ⊥ b), ist der Winkel α ein rechter
Winkel, α = π2 , und cos α = 0. Also gilt:
a · b = |a| · |b| cos α = 0.
(2.89)
Da cos α nur für rechte Winkel verschwindet, haben wir
a · b = 0
⇔
a ⊥ b.
(2.90)
Beispiel:

 

1
4
  

 6  ·  2  = 4 + 12 − 16 = 0.
4
−4
(2.91)
2 Vektoren
51
Man kann das Skalarprodukt auch dazu verwenden, um den Winkel zwischen zwei Vektoren a und
b zu bestimmen. Aus
a · b
=
|a||b| cos α
folgt nämlich
α =
arccos
a · b
|a| · |b|
(2.92)
.
(2.93)
Der Winkel zwischen der Koordinatenachse mit Einheitsvektor ei und einem Vektor a ist
cos αi =
ai
a · ei
=
.
|a|
|a|
(2.94)
Dabei ist ai die Komponente des Vektors a in Richtung des Einheitsvektors ei .
Ferner gilt:
cos2 αx + cos2 αy + cos2 αz = 1,
(2.95)
wobei αx , αy und αz die Winkel sind, die der Vektor a mit der x-, y- und z-Achse einschließt.
Wegen | cos ϕ| ≤ 1 ergibt sich aus der Definition des Skalarpodukts die Cauchy-Schwarzsche
Ungleichung:
|a · b| ≤ |a||b|.
(2.96)
Das Gleichheitszeichen gilt bei Parallelität beziehungsweise Antiparallelität, da in diesem Fall
| cos α| = 1.
Abbildung 2.20: Der Kosinussatz c2 = a2 + b2 − 2ab cos α setzt die Seiten eines Dreiecks mit einem
der Winkel in Beziehung.
Mit Hilfe des Skalarprodukts können wir auch den so genannten Kosinussatz herleiten. Betrachten
wir dazu das Dreieck, das von den Vektoren a, b, und c = a − b begrenzt wird (siehe Abb. 2.20).
Das Skalarprodukt von c mit sich selbst ergibt |c|2 = c ·c = (a −b)·(a −b) = a ·a − 2a ·b +b ·b. Unter
Verwendung der Schreibweise a = |a|, b = |b| und c = |c| lässt sich der Kosinussatz ausdrücken als:
c2 = a2 + b2 − 2ab cos α.
(2.97)
Für ein rechtwinkliges Dreieck, also α = π/2, ist das der Pythagoräische Lehrsatz.
Wir wollen nun die Projektion eines Vektors auf einen anderen näher betrachten. In Abb. 2.21
ist ba die Projektion des Vektors b auf den Vektor a. Man kann ba auch als die Komponente von b
in Richtung von a auffassen.
Für den Betrag der Projektion gilt
|ba | = |b| cos ϕ.
(2.98)
Wegen a · b = |a||b| cos ϕ haben wir cos ϕ = (a · b)/(|a||b|) und somit
a · b
|ba | =
= ea · b.
|a|
(2.99)
52
2 Vektoren
Abbildung 2.21: Projektion ba des Vektors b auf den Vektor a.
Da ba die selbe Richtung hat wie a, muss gelten:
ba
=
=
a
|ba |ea = |ba |
|a|
a · b
· a.
|a|2
(2.100)
Abbildung 2.22: Die Kraft F leistet durch Verschiebung eines Objektes um den Vektor s die Arbeit
W = F · s.
Eine Anwendung, in dem die Projektion eines Vektors auf einen anderen benötigt wird, ist die
Berechnung der entlang eines geradlinigen Weges s durch die konstante Kraft F geleisteten Arbeit
(siehe Abb. 2.22). Da nur die Kraftkomponente Fs in Richtung des Verschiebungsvektors Arbeit
leistet, gilt
W = |Fs ||s|.
(2.101)
Hier haben wir die aus der Mechanik bekannte Beziehung Arbeit = Kraft × Weg (oder genauer:
Arbeit = Kraftkomponente in Wegrichtung × zurückgelegtem Weg) verwendet. Der Vektor Fs ist
die Projektion der Kraft F auf den Verschiebungsvektor s. Unter Verwendung der obigen Formeln
für den Betrag der Projektion erhalten wir
F · s
· |s| = F · s.
W = |Fs ||s| =
|s|
(2.102)
Beispiel:
Ein Massenpunkt wird von einer konstanten Kraft F = (−10N, 2N, 5N) von P1 = (0m, −1m, −4m)
nach P2 = (−1m, 5m, −3m) verschoben. Wir messen hier Abstände in Metern (m) und Kräfte in
Newton (N). Welche Arbeit wird dabei verrichtet und wie groß ist der Winkel zwischen F und dem
Verschiebungsvektor?
2 Vektoren
53
Der Massenpunkt wird um den Vektor

 
 

−1m
0m
−1m
−−−→ 
 
 

s = P1 P2 =  5m  −  −1m  =  6m 
−3m
−4m
1m
verschoben. Dadurch leistet die Kraft die Arbeit

 

−1m
−10N

 

W = F · s = 
2N  ·  6m  = (10 + 12 + 5)Nm = 27Nm.
(2.103)
(2.104)
1m
5N
Die Beträge der Verschiebung und der Kraft sind
√
|s| = 38m
und
|F | =
√
129N,
(2.105)
sodass der Winkel zwischen Kraft und Verschiebungsvektor gegeben ist durch:
ϕ = arccos
2.5
2.5.1
F · s
27Nm
= arccos 0.386 = 67.32◦ .
= arccos √
129 · 38Nm
|F ||s|
(2.106)
Vektorprodukt
Definition
Das äußere Produkt (auch Kreuzprodukt oder Vektorprodukt) zweier Vektoren a und b,
geschrieben als
c = a × b,
(2.107)
|c| = |a||b| sin α,
(2.108)
ist ein Vektor mit Betrag
wobei α der von den Vektoren a und b eingeschlossene Winkel ist. Der Vektor c ist orthogonal
sowohl zu a als auch zu b und zwar so, dass a, b und c ein Rechtssystem bilden (siehe Abb. 2.23).
Abbildung 2.23: Das Vektorprodukt c = a×b
steht sowohl auf a als auch auf b senkrecht.
Zusammen bilden die Vektoren ein Rechtssystem.
Abbildung 2.24: Die “rechte-Hand-Regel” ist
eine Merkhilfe für die Richtung des äußeren
Vektorprodukts.
54
2 Vektoren
Abbildung 2.25: Die “gekrümmte-HandRegel”.
Abbildung 2.26: Die Schraubenregel.
In einem Rechtssystem stehen die Vektoren a, b, c zueinander wie Daumen, Zeigefinger und Mittelfinger der gespreizten rechten Hand (rechte-Hand-Regel, siehe Abb. 2.24). Als Alternative dazu
können Sie sich die gekrümmte rechte Hand vorstellen. Wenn die gekrümmten Finger in die Richtung weisen, in der man a am schnellsten in b überführen kann, zeigt der Daumen in Richtung
c = a × b (siehe Abb. 2.25). Sie können sich auch eine Schraube vorstellen, mit der Sie a nach b
drehen (siehe Abb. 2.26). Dann bewegt sich die Schraube in Richtung von c = a × b.
Als dreidimensionales kartesisches Koordinatensystem wird meistens ein Rechtssystem verwendet. Ein Linkssystem wird analog definiert. Vertauschen von a und b macht ein Rechtssystem zu
einem Linkssystem.
Abbildung 2.27: Der Betrag des Vektorprodukts a × b ist gleich der Fläche des von den Vektoren
a und b aufgespannten Parallelogramms.
Anschaulich lässt sich der Betrag des Vektorprodukts a × b als die Fläche des von den Vektoren a
und b aufgespannten Parallelogramms betrachten (siehe Abb. 2.27):
A
= |a|h
= |a||b| sin α
= |a × b|.
(2.109)
Wir können somit das Vektorprodukt verwenden, um die Fläche des Parallelogramms zu berechnen,
das von zwei Vektoren aufgespannt wird.
2.5.2
Rechenregeln
Für das Vektorprodukt gelten die folgenden Rechenregeln:
• Im Unterschied zum Skalarprodukt ist das Vektorprodukt nicht kommutativ. Das heißt, dass
es beim Vektorprodukt auf die Reihenfolge ankommt. Anschaulich ist das klar, denn wenn
die Vektoren a, b und a × b ein Rechtssystem bilden, dann müssen die Vektoren a, b und b ×a
2 Vektoren
55
ein Linkssystem bilden (siehe Abb. 2.28). Bei Vertauschung der Multiplikanden weist das
Vektorprodukt also in die entgegengesetzte Richtung. Es gilt das Antikommutativgesetz:
a × b = −(b × a).
(2.110)
• Assoziativgesetz für Multiplikation mit einem Skalar λ:
(λa) × b = λ(a × b) = a × (λb) = λa × b.
(2.111)
a × (b + c) = a × b + a × c.
(2.112)
• Distributivgesetz:
Wir wollen diese Rechenregeln nun aus der Definition des Vektorprodukts ableiten. Das Antikommutativgesetz a × b = −(b × a) folgt direkt aus der “rechten-Hand-Regel”: durch Vertauschen von
a und b kehrt sich die Richtung des Vektorprodukts einfach um.
Betrachten wir nun, was passiert, wenn wir einen der beiden Vektoren, sagen wir a, mit einer
positiven Zahl λ multiplizieren (siehe Abb. 2.29). Da sich durch Multiplikation mit λ die Länge der
Grundlinie um einen Faktor λ ändert, erhalten wir für die Fläche A des von b und λa aufgespannten
Parallelogramms:
A = |λa||b| sin α = λ|a||b| sin α = λA.
(2.113)
Hier ist A die Fläche des von a und b aufgespannten Parallelogramms. Das heißt,
|(λa) × b| = λ|a × b| = |λ(a × b)|.
(2.114)
Da a und λa die selbe Richtung haben, sind (λa)×b und a ×b und somit auch λ(a ×b) parallel. Der
Vektor (λa) × b stimmt also sowohl im Betrag als auch in der Richtung mit dem Vektor λ(a × b)
überein. Diese beiden Vektoren sind deshalb gleich:
(λa) × b = λ(a × b).
(2.115)
Falls λ negativ ist, müssen wir berücksichtigen, dass λa und a zueinander antiparallel sind und
deshalb der Winkel zwischen λa und b zu π − α wird (siehe Abb. 2.30). In diesem Fall ist die Fläche
A gegeben durch:
A = |λa||b| sin(π − α) = |λ||a||b| sin α = |λ|A.
(2.116)
Das heißt,
|(λa) × b| = |λ||a × b| = |λ(a × b)|.
(2.117)
Aus der rechten-Hand-Regel folgt nun, dass (λa) × b und a × b antiparallel sind. Somit hat (λa) × b
jedoch die selbe Richtung wie λ(a × b) (vergessen wir nicht, dass wir gerade den Fall λ < 0
Abbildung 2.28: Während die Vektoren a, b und a ×b ein Rechtssystem bilden, spannen die Vektoren
a, b und b × a ein Linkssystem auf.
56
2 Vektoren
Abbildung 2.29: Durch Multiplikation des Vektors a mit dem positiven Skalar λ ändert sich die
Grundlinie des aufgespannten Parallelogramms um den Faktor λ.
betrachten). Der Vektor (λa) × b stimmt auch in diesem Fall mit dem Vektor λ(a × b) sowohl in
Länge als auch im Betrag überein, sodass allgemein gilt:
(λa) × b = λ(a × b).
(2.118)
a × (λb) = λ(a × b)
(2.119)
(λa) × b = a × (λb) = λ(a × b).
(2.120)
Analoge Überlegungen führen auf
und wir können schreiben:
Es bleibt uns noch zu zeigen, dass a × (b + c) = a × b + a × c. Um dies zu tun, wollen wir die
Komponenten von a × (b + c) sowie von a × b und a × c explizit bestimmen. Wir wählen dazu ein
Koordinatensystem, dessen z-Achse in Richtung des Vektors a zeigt, das heißt


0


(2.121)
a =  0  .
az
Die Vektoren b = (bx , by , bz ) und c = (cx , cy , cz ) sind jedoch beliebig. Durch die spezielle Wahl des
Koordinatensystems schränken wir die Gültigkeit der nachfolgenden Überlegungen nicht ein.
Wir definieren nun den neuen Vektor b = (bx , by , 0), den wir aus b erhalten, indem wir dessen
z-Komponente durch 0 ersetzen. Der Vektor b ist die Projektion von b in die xy-Ebene. Wie
Abbildung 2.30: Durch Multiplikation des Vektors a mit dem negativen Skalar λ ändert sich der
eingeschlossene Winkel von α auf π − α.
2 Vektoren
57
Abbildung 2.31: Die von a und b sowie von a und b aufgespannten Parallelogramme haben den
selben Flächeninhalt.
aus Abb. 2.31 ersichtlich ist, haben die Parallelogramme, welche von a und b sowie von a und b
aufgespannt werden, den selben Flächeninhalt. Beide besitzen nämlich die selbe Grundlinie, |a|,
und die selbe Höhe, |b| sin α = |b |. Somit gilt
|a × b| = |a × b |.
(2.122)
Der Vektor a × b, der in der xy-Ebene liegt, steht normal sowohl auf b als auch auf b . Da auch
a × b auf b normal steht und in der xy-Ebene liegt, bedeutet dies, dass a × b und a × b die selbe
Richtung haben. Da sie auch im Betrag übereinstimmen (siehe Gleichung (2.122)), sind sie gleich:
a × b = a × b .
(2.123)
Zum Vektor b = (bx , by , 0) bilden wir nun den Vektor b = (−by , bx , 0). Durch Bildung des Skalarprodukts können wir leicht feststellen, dass der Vektor b sowohl auf a als auch auf b normal
steht. Aus der rechten-Hand-Regel folgt, dass b genau die Richtung von a × b und somit auch
von a × b besitzt. Wenn wir nun den Vektor b mit |a| multiplizieren, erhalten wir einen Vektor,
der sowohl in der Richtung als auch im Betrag mit a × b übereinstimmt:
|(−|a|by , |a|bx , 0)| = |a||b | = |a × b | = |a × b|.
(2.124)

−|a|by


a × b =  |a|bx  .
0
(2.125)

−|a|cy


a × c =  |a|cx 
0
(2.126)

−|a|(by + cy )


a × (b + c) =  |a|(bx + cx )  .
0
(2.127)
Somit gilt:

Analoge Überlegungen führen auf

und

58
2 Vektoren
Durch komponentenweisen Vergleich der Vektoren erhalten wir das Distributivgesetz für das Vektorprodukt:
 
 

−|a|cy
−|a|(by + cy )
−|a|cy
 
 


a × (b + c) =  |a|(bx + cx )  =  |a|cx  +  |a|cx  = a × b + a × c.
0
0
0

2.5.3
(2.128)
Komponentenweise Darstellung
In kartesischen Koordinaten kann das Vektorprodukt komponentenweise ausgedrückt werden als:
 
 

ax
bx
ay b z − az b y
 
 


a × b =  ay  ×  by  =  az bx − ax bz  .
az
bz
ax b y − ay b x

(2.129)
Dies kann man sich klar machen, indem man a und b mit Hilfe der Einheitsvektoren darstellt und
das Distributivgesetz ausnutzt:
a × b = (axex + ay ey + az ez ) × (bxex + by ey + bz ez )
= ax bx (ex × ex ) + ax by (ex × ey ) + ax bz (ex × ez )
+ ay bx (ey × ex ) + ay by (ey × ey ) + ay bz (ey × ez )
+ az bx (ez × ex ) + az by (ez × ey ) + az bz (ez × ez ).
(2.130)
Da
ei × ei = 0
(der Vektor ei ist parallel zu sich selbst)
(2.131)
und die Einheitsvektoren ex , ey und ez ein Rechtssystem bilden und somit gilt
ex × ey = ez ,
ey × ez = ex ,
ey × ex = −ez ,
ez × ey = −ex ,
(2.132)
(2.133)
ez × ex = ey ,
ex × ez = −ey ,
(2.134)
erhalten wir schließlich
a × b = ax byez − ax bz ey − ay bxez + ay bzex + az bxey − az byex
= (ay bz − az by )ex + (az bx − ax bz )ey + (ax by − ay bx )ez ,
(2.135)
was genau der komponentenweisen Darstellung entspricht, die wir weiter oben angeführt haben.
Leichter merken kann man sich die Bildung des Kreuzprodukts folgendermaßen: Zur Berechnung
der x-Komponente decken wir auf der linken Seite der Gleichung
 
 

bx
ay b z − az b y
ax
 
 


 ay  ×  b y  =  az b x − ax b z 
az
bz
ax b y − ay b x

(2.136)
zunächst die x-Zeile ab und multiplizieren kreuzweise: (links oben × rechts unten) minus (links
unten × rechts oben). Für die y-Komponente des Kreuzprodukts gehen wir analog vor und decken
die y-Zeile ab und berechnen wieder (links oben × rechts unten) minus (links unten × rechts oben),
wobei wir uns aber das gesamte Schema nach unten durch Kopien der oberen beiden Zeilen ergänzt
denken. Für die z-Komponente decken wir schließlich die z-Zeile ab und verfahren analog.
2 Vektoren
2.5.4
59
Anwendungen
Durch Berechnung des Vektorprodukts kann man prüfen, ob zwei Vektoren parallel zueinander
sind. Wenn a parallel zu b ist (und infolgedessen der eingeschlossene Winkel α verschwindet oder
π beträgt), ist sin α = 0 und das Vektorprodukt verschwindet:
a × b = 0
⇔
a||b.
(2.137)
Eine weitere wichtige Anwendung des Vektorprodukts besteht in der Konstruktion eines Vektors,
der auf zwei gegebene Vektoren a und b normal stehen soll.
Beispiel:


1
 
a =  2 
3


3

b = 
 4 
5

   
 

1
3
2·5−3·4
−2

   
 

c = a × b =  2  ×  4  =  3 · 3 − 1 · 5  =  4 
3
5
1·4−2·3
−2
√
√
|a| = 1 + 4 + 9 = 14
√
√
|b| = 9 + 16 + 25 = 50
√
√
|a × b| = 4 + 16 + 4 = 24.
Den Winkel zwischen a und b bestimmen wir folgendermaßen:
√
24
|a × b|
= 0.185 . . .
sin α =
=√
50 · 14
|a||b|
α = 10.67◦.
(2.138)
(2.139)
(2.140)
(2.141)
(2.142)
(2.143)
(2.144)
Haben wir richtig gerechnet, sollten a und b zu a × b orthogonal stehen, was wir durch Berechnung
der entsprechenden Skalarprodukte prüfen können:
  

1
−2
  

(2.145)
c · a =  4  ·  2  = −2 + 8 − 6 = 0,
−2
3

3
−2

 

c · b =  4  ·  4  = −6 + 16 − 10 = 0.
5
−2

2.6
2.6.1
 
(2.146)
Spatprodukt
Definition
Das Spatprodukt (oder gemischtes Produkt) dreier Vektoren a, b und c ist ein Skalar und ist
definiert als
[abc] = (a × b) · c.
(2.147)
Anschaulich ist das Spatprodukt (genauer gesagt der Betrag des Spatprodukts) das Volumen des
von den drei Vektoren a, b und c aufgespannten Parallelepipeds, das auch Parallelflach oder
Spat genannt wird (siehe Abb. 2.32).
60
2 Vektoren
Abbildung 2.32: Das Spatprodukt
Die geometrische Interpretation des Spatprodukts ergibt sich aus folgender Überlegung. Das Volumen V des von den drei Vektoren aufgespannten Parallelepipeds ist gegeben durch
V = A h,
(2.148)
wobei A die Fläche des von a und b aufgespannten Parallelogramms und h die in Abb. 2.32
dargestellte Höhe des Parallelepipeds ist. Die Fläche A erhalten wir aus dem Vektorprodukt von a
und b,
A = |a||b| sin α = |a × b|.
(2.149)
Die Höhe h erhalten wir durch Projektion des Vektors c auf a × b:
h = |c|| cos β|.
(2.150)
Die Betragsstriche garantieren dabei, dass die Höhe nicht negativ wird. Einsetzen ergibt schließlich
V = A · h = |a × b||c|| cos β| = |(a × b) · c|.
2.6.2
(2.151)
Komponentenweise Darstellung
Das Spatprodukt kann mit Hilfe der Komponenten von a, b und c ausgedrückt werden:

 
 

ax
bx
cx

 
 

(a × b) · c =  ay  ×  by  ·  cy 
az
bz
cz
 


cx
ay b z − az b y
 


=  a z b x − a x b z  ·  cy 
ax b y − ay b x
=
2.6.3
cz
cx (ay bz − az by ) + cy (az bx − ax bz ) + cz (ax by − ay bx ).
(2.152)
Rechenregeln und Anwendung
• Durch die Nichtkommutativität des Kreuzprodukts ist das Spatprodukt nicht kommutativ.
Das Vertauschen von zwei Vektoren ändert das Vorzeichen des Spatprodukts:
[ abc ] = −[ bac ].
(2.153)
• Vektoren können zyklisch vertauscht werden, ohne das Spatprodukt zu ändern:
[ abc ] = [ bca ] = [ cab ],
(a × b) · c = (b × c) · a = (c × a) · b.
(2.154)
(2.155)
2 Vektoren
61
• Aus a · b = b · a und der zyklischen Vertauschbarkeit folgt außerdem:
(a × b) · c = a · (b × c).
• Das Spatprodukt kann als Determinante dargestellt werden:
!
!
!a a a !
y
z!
! x
!
!
[ abc ] = ! bx by bz ! .
!
!
!c
c
c !
x
y
(2.156)
(2.157)
z
• Das Spatprodukt verschwindet, wenn die Vektoren a und b × c zueinander orthogonal sind.
Das ist der Fall, wenn alle Vektoren in der selben Ebene liegen, d.h. wenn sie komplanar
sind:
[ abc ] = 0
2.7
⇔
a, b, c komplanar.
(2.158)
Mehrfachprodukte
Für Mehrfachprodukte gelten folgende Rechenregeln:
• Doppeltes Kreuzprodukt (bac-cab Regel)
a × (b × c) = b(a · c) − c(a · b).
(2.159)
• Kreuzprodukt von zwei Kreuzprodukten
= c[(a × b) · d]
− d[(
a × b) · c]
(a × b) × (c × d)
· a] − a[(c × d)
· b].
= b[(c × d)
(2.160)
• Skalarprodukt von zwei Kreuzprodukten
= a · (b × (c × d))
(a × b) · (c × d)
− (a · d)(
b · c).
= (a · c)(b · d)
(2.161)
• Quadrat eines Kreuzprodukts
(a × b)2 = |a|2 |b|2 − (a · b)2 .
2.8
2.8.1
(2.162)
Anwendungsbeispiele für Vektoren
Strömung durch eine Fläche
Stellen wir uns eine Flüssigkeit vor, die mit gleichförmiger Geschwindigkeit v strömt (siehe Abb.
2.33). In der Flüssigkeit denken wir uns eine ebene Fläche mit beliebigem Umriss und einem
Flächeninhalt f . Wir wollen nun den Fluss durch diese imaginäre Fläche berechnen.
Unter dem Fluss verstehen wir das pro Zeiteinheit durch die Fläche hindurch tretende Flüssigkeitsvolumen. Ist die Fläche parallel zur Flussrichtung, tritt keine Flüssigkeit hindurch. In jeder anderen
Orientierung tritt Flüssigkeit hindurch. Die Orientierung der Fläche spielt also eine wesentliche
62
2 Vektoren
Abbildung 2.33: Strömung durch eine Fläche mit Flächenvektor f.
Rolle und es genügt nicht, nur den Flächeninhalt anzugeben. Wir führen daher den Flächenvektor
f ein, der neben dem Flächeninhalt von f auch die Orientierung der Fläche im Raum beschreibt:
f
|f| = f
ist orthogonal zur Fläche,
der Betrag von f ist gleich dem Flächeninhalt.
Zur Berechnung des Flusses betrachten wir nun alle Teilchen, die sich zum Zeitpunkt 0 in der
imaginären Fläche befinden. Nach einer Zeit t haben sich alle diese Teilchen um die Distanz
v t
(2.163)
weiterbewegt. Sie liegen jetzt auf einer Fläche, die gleich ist der um v t parallel verschobenen
ursprünglichen Fläche. Alle Flüssigkeitsteilchen, die in der Zeit t durch die Fläche hindurch getreten
sind, befinden sich in einem schiefen Zylinder. Das Volumen des Zylinders ist Grundfläche f mal
Höhe h:
V = f h.
Um die Höhe h zu bestimmen, berechnen wir die Projektion von v t auf f
f
.
h = (v t)f = v t ·
f
(2.164)
(2.165)
Das Volumen ist deshalb
V = tf
v · f
= tv · f.
f
(2.166)
Der Fluss ist gleich dem Volumen V pro Zeit t und wir erhalten schließlich
Fluss =
V
= v · f.
t
(2.167)
Der Fluss ist also gegeben durch das Skalarprodukt von v und f.
2.8.2
Rotation eines Körpers
Um die Rotation eines Körpers um eine Achse zu beschreiben, verwenden wir die Winkelgeschwindigkeit ω. Sie gibt den Winkel in Bogenmaß an, um den sich der Körper pro Zeiteinheit
2 Vektoren
63
dreht. Um auch die Richtung der Drehachse zu berücksichtigen, führen wir den Winkelgeschwindigkeitsvektor ω ein:
ω
|
ω| = ω
ist parallel zur Rotationsachse,
der Betrag ist gleich der Winkelgeschwindigkeit.
Die Richtung von ω ist so gewählt, dass von der Spitze von ω aus gesehen die Rotation in positiver
Richtung, also gegen den Uhrzeigersinn, erfolgt (siehe Abb. 2.34). Wenn die gekrümmten Finger
der rechten Hand also der Rotation folgen, zeigt der Daumen in Richtung von ω
(siehe Abb. 2.25).
Abbildung 2.34: Die Winkelgeschwindigkeit ω ist so definiert, dass von der Spitze aus gesehen die
Rotation gegen den Uhrzeigersinn erfolgt.
Nun wollen wir den Winkelgeschwindigkeitsvektor ω benutzen, um die Momentangeschwindigkeit
eines Punktes auf einem rotierenden Körper zu ermitteln. Der Punkt bewegt sich dabei auf einer
Kreisbahn mit dem Radius r (siehe Abb. 2.35). Der pro Zeiteinheit zurückgelegte Winkel ist ω.
Daher ist die pro Zeiteinheit zurückgelegte Strecke, also die Geschwindigkeit
v = ωr.
(2.168)
Zur Berechnung von v müssen wir den Radius r bestimmen. Zudem müssen wir beachten, dass v
parallel zur Tangente an die Kreisbahn sein muss.
Abbildung 2.35: Rotation eines Körpers um eine Achse.
All dies lässt sich durch Verwendung des Vektorprodukts sehr einfach erreichen. Es sei x ein
Vektor von einem beliebigen Punkt auf der Drehachse zu jenem Punkt, dessen Geschwindigkeit v
wir bestimmen möchten. Der Betrag v = |v | ist dann gegeben durch:
v = ωr = ω · |x| · sin α = |ω × x|.
(2.169)
Weiters ist ω ×x sowohl zu ω als auch zu x orthogonal, sodass die Geschwindigkeit auch die richtige
Richtung hat. Mit der rechten-Hand-Regel sieht man leicht, dass der Vektor
v = ω × x
auch die richtige Orientierung hat.
(2.170)
64
2.8.3
2 Vektoren
Volumen einer Einheitszelle
Abbildung 2.36: Einheitszelle eines triklinen Kristalls.
Gegeben sei die Einheitszelle eines Kristalls, die von den Vektoren a, b und c aufgespannt wird. Die
Längen der Vektoren sind a = 3Å, b = 2Å, und c=2Å. (Die Längeneinheit Ångström, abgekürzt als
Å, ist im atomaren Bereich gebräuchlich. Es gilt 1Å=10−10 m.) Der Winkel zwischen den Vektoren
ist jeweils 60◦ . Wie groß ist das Volumen der Einheitszelle?
Wir wählen zunächst ein kartesisches Koordinatensystem, in dem die x-Achse parallel zum Vektor
a ist und die y-Achse so orientiert ist, dass der Vektor b in der xy-Ebene liegt (wir können das
Koordinatensystem so orientieren, wie wir wollen). Dann ist
a = (3Å, 0, 0)
und
√
√
b = (2 cos α, 2 sin α, 0) = (2 1 Å, 2 3 Å, 0) = (1Å, 3Å, 0).
2
2
(2.171)
(2.172)
Abbildung 2.37: Einheitszelle dargestellt in einem geeigneten kartesischen Koordinatensystem.
Um c zu finden, beachten wir, dass
ac
2
= 3Å ,
2
b · c = bc cos 60◦ = bc = 2Å2 .
2
a · c = ac cos 60◦ =
(2.173)
(2.174)
2 Vektoren
65
Einsetzen ergibt

 
3Å
cx
2


 
 0  ·  cy  = 3cx Å = 3Å
cz
0

(2.175)
und somit
cx = 1Å.
(2.176)
Weiteres Einsetzen ergibt
 


1Å
cx
√
√
2
2
 
 √

 3Å  ·  cy  = cx Å + 3cy Å = 1Å + 3Åcy = 2Å ,
0
cz
(2.177)
woraus folgt
1
cy = √ Å.
3
(2.178)
Da der Betrag von c bekannt ist, können wir schreiben
2
c2z + c2x + c2y = 4Å .
(2.179)
Daraus können wir die z-Komponente des Vektors c bestimmen:
c2z
"
1 2
8 2
= 4Å − 1Å − Å = Å
3
3
2
2
⇒
cz =
8
Å.
3
(2.180)
Wir erhalten schließlich für den Vektor c:


1
 1 
√

c = 
 3  Å.
(2.181)
8
3
Aus den nun explizit bekannten Vektoren a, b und c können wir mit Hilfe des Spatprodukts das
Volumen der Einheitszelle des Kristalls berechnen:

 
 

1
3
1
  √   √1 

 3
V = (a × b) · c =  0  ×  3  · 
 3  Å
0
 
1
0
 

√1
 0 ·
 3
√
8
3 3
3

=
0

8
3
√
 3
 Å = 3 8Å3 .

(2.182)
66
2 Vektoren
Kapitel 3
Differentiation
3.1
Grundbegriffe
Betrachten wir ein Objekt (z.B. ein Fahrzeug), das sich gleichförmig fortbewegt. Die Geschwindigkeit ist in diesem Fall durch die pro Zeit zurückgelegte Strecke definiert:
v=
∆s
s2 − s1
.
=
t2 − t1
∆t
(3.1)
Hier ist ∆s = (s2 − s1 ) die im Zeitintervall ∆t = (t2 − t1 ) zurückgelegte Strecke. Bei gleichförmiger Bewegung könnten wir die Zeiten t2 und t1 beliebig wählen und wir würden immer dasselbe
Resultat für die Geschwindigkeit v erhalten. Wenn wir die gleichförmige Bewegung in einem Raumzeitdiagramm graphisch darstellen, indem wir die zurückgelegte Entfernung s als Funktion der Zeit
t auftragen, erhalten wir eine Gerade, dessen Steigung die Geschwindigkeit ist (siehe Abb. 3.1).
Abbildung 3.1: Raumzeitdiagramm für ein Objekt, das sich gleichförmig, das heißt mit konstanter
Geschwindigkeit, fortbewegt.
Bei einer ungleichförmigen Bewegung ist dies jedoch anders. In diesem Fall hängt der Quotient
(s2 −s1 )/(t2 −t1 ) sehr wohl vom gewählten Intervall [t1 , t2 ] ab. (s2 −s1 )/(t2 −t1 ) ist in diesem Fall die
mittlere Geschwindigkeit im Zeitintervall [t1 , t2 ]. In der graphischen Darstellung der Entfernung
als Funktion der Zeit erhalten wir in diesem Fall eine gekrümmte Kurve, die in Abb. 3.2 beispielhaft
dargestellt ist. Die mittlere Geschwindigkeit (s2 − s1 )/(t2 − t1 ) ist die Steigung der Sekante, die
durch die Punkte (t1 , s1 ) und (t2 , s2 ) geht. Wie aus der Abbildung ersichtlich ist, würde ein anders
67
68
3 Differentiation
gewähltes Zeitintervall, sagen wir [t1 , t2 ], eine andere Steigung der Sekante und somit eine andere
mittlere Geschwindigkeit, nämlich (s2 − s1 )/(t2 − t1 ), ergeben.
Abbildung 3.2: Raumzeitdiagramm für ein Objekt, das sich ungleichförmig, das heißt mit einer
sich verändernden Geschwindigkeit, fortbewegt.
Die Momentangeschwindigkeit v des Objekts zu einem bestimmten Zeitpunkt t (also die Geschwindigkeit, die man etwa vom Tachometer eines Autos ablesen würde) erhalten wir, indem wir
zu sehr kleinen Zeitintervallen ∆t übergehen:
v = lim
∆t→0
∆s
.
∆t
(3.2)
In diesem Grenzfall wird aus der Sekante in Abb. 3.2 die Tangente an die Raumzeitkurve und die
Geschwindgkeit v(t), die nun von der Zeit t abhängt, ist die Steigung dieser Tangente (siehe Abb.
3.3). Man nennt v(t) auch die Ableitung von s(t) an der Stelle t.
Abbildung 3.3: Im Grenzfall eines unendlich kleinen Zeitintervalls wird aus der Sekante aus Abb.
3.2 die Tangente der Kurve. Die Steigung der Tangente der Raum-Zeit-Kurve zur Zeit t ist die
Geschwindigkeit des Objekts zur Zeit t .
Um nach diesem anschaulichen Beispiel den Begriff der Ableitung formaler einzuführen, betrachten
wir zunächst den Differenzenquotienten. Der Differenzenquotient m für eine Funktion y = f (x)
ist der Quotient aus der Differenz der Funktionswerte y1 = f (x1 ) und y2 = f (x2 ) und der Differenz
der Argumente an den Stellen x1 und x2 :
m=
y2 − y1
f (x1 + ∆x) − f (x1 )
∆y
=
.
=
∆x
x2 − x1
∆x
(3.3)
3 Differentiation
69
Abbildung 3.4: Der Differenzenquotient m = ∆y/∆x ist die Steigung der Sekante durch die Punkte
(x1 , f (x1 )) und (x2 , f (x2 )).
Dabei ist ∆y = y2 − y1 und ∆x = x2 − x1 . Der Differenzenquotient ist die Steigung der Sekante
durch die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) (siehe Abb. 3.4).
Beispiel: Der Differenzenquotient der Funktion
f (x)
= 2x3 + 4x2 − 1
(3.4)
ist:
m(x)
=
=
=
=
f (x + ∆x) − f (x)
∆x
2(x + ∆x)3 + 4(x + ∆x)2 − 1 − 2x3 − 4x2 + 1
∆x
2(x3 + 3x2 ∆x + 3x∆x2 + ∆x3 ) + 4(x2 + 2x∆x + ∆x2 ) − 1 − 2x3 − 4x2 + 1
∆x
(6x2 + 6x∆x + 2∆x2 + 8x + 4∆x).
(3.5)
Wenn wir nun zum Grenzfall unendlich kleiner Differenzen übergehen, wird aus dem Differenzenquotienten der Differentialquotient (wir lassen ∆x gegen 0 gehen):
f (x) =
df (x)
∆f (x)
f (x + ∆x) − f (x)
= lim
= lim
.
∆x→0 ∆x
∆x→0
dx
∆x
(3.6)
Die Notationen f (x) und df (x)/dx sind äquivalent und bezeichnen beide den Differentialquotienten. Der Differentialquotient f (x) wird auch die Ableitung von f (x) nach x genannt. Anschaulich
ist der Differentialquotient f (x) die Steigung der Tangente an den Funktionsgraphen der Funktion f (x) an der Stelle x. Verläuft der Funktionsgraph steil, ist der Differentialquotient (oder die
Ableitung) groß, für eine flache Kurve ist er klein. Da sich die Steigung des Funktionsgraphen von
Ort zu Ort im Allgemeinen ändert, ist - so wie die Funktion f (x) selbst - auch ihre Ableitung f (x)
von x abhängig.
Das Differential df der Funktion f (x) ist definiert als:
df (x) = f (x)dx.
(3.7)
Das Differential kann betrachtet werden als die infinitesimale Änderung df der Funktion f (x),
welche durch eine infinitesimale Änderung dx des Arguments x hervorgerufen wird.
Wenn die unabhängige Variable die Zeit ist, verwendet man für die 1. Ableitung auch folgende
Notation mit einem Punkt:
dx(t)
.
(3.8)
ẋ(t) =
dt
70
3 Differentiation
Diese Notation ist vor allem in der klassischen Mechanik gebräuchlich.
Wir wollen nun für das obige Beispiel den Grenzübergang ∆x → 0 durchführen und den Differentialquotienten f (x) explizit berechnen. Dazu gehen wir vom Ausdruck für den Differenzenquotienten aus:
∆f (x)
∆x
=
(6x2 + 6x∆x + 2∆x2 + 8x + 4∆x).
(3.9)
Alle Terme, die ∆x enthalten, verschwinden bei diesem Grenzübergang und wir erhalten:
df
dx
∆f (x)
= lim (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x)
∆x→0
∆x
= 6x + 8x.
=
lim
∆x→0
2
(3.10)
Durch ähnliche Überlegungen lassen sich Differentiationsregeln für die wichtigsten Funktionen ableiten, die wir im nächsten Abschnitt kurz und ohne Herleitung behandeln.
3.2
Differenzierbarkeit
Eine Funktion f (x) nennt man an der Stelle x differenzierbar, falls an dieser Stelle die Ableitung
f (x) existiert. Die Funktion ist in einem Intervall stetig differenzierbar, falls ihre Ableitung in
diesem Intervall stetig ist. Ist eine Funktion an der Stelle x differenzierbar, ist sie dort auch stetig.
Hingegen muss eine stetige Funktion nicht überall differenzierbar sein (an Knickstellen ist die Ableitung nicht definiert, siehe Abb. 3.5). An diesen Punkten ist die Funktion nicht differenzierbar
(wir können hier keine Tangente anlegen) und die Ableitung existiert daher nicht.
Abbildung 3.5: Die Funktion s(t) ist im dargestellten Bereich zwar überall stetig, aber an den
Stellen t1 und t2 nicht differenzierbar. Die Ableitung ds(t)/dt ist an diesen Stellen nicht stetig.
3 Differentiation
3.3
71
Wichtige Ableitungen
Die Ableitungen der wichtigsten Funktionen sind hier zusammengefasst. Weitere Ableitungen können Sie einer Formelsammlung entnehmen oder mit den folgenden Differentiationsregeln selbst
herleiten.
3.4
f (x)
f (x)
f (x)
f (x)
xn
nxn−1
arcsin x
x
1
arccos x
sin x
cos x
arctan x
√ 1
1−x2
1
− √1−x
2
1
2
1+x
cos x
sinh x
cosh x
ln x
− sin x
cosh x
sinh x
a
ax
ex
ax
0
a
ex
(ln a)ax
1
x
Differentiationsregeln
Mit Hilfe der im letzten Abschnitt angegebenen Ableitungen und der folgenden Differentiationsregeln können wir auch komplizierte zusammengesetzte Funktionen ableiten. Gegeben seien zwei
(differenzierbare) Funktionen f (x) und g(x) und eine Konstante a.
3.4.1
Faktorregel
df (x)
d
(af (x)) = a
.
dx
dx
(3.11)
Zum Beispiel:
y = 7 cos x
3.4.2
⇒
y = −7 sin x.
(3.12)
Summenregel
df (x) dg(x)
d
(f (x) + g(x)) =
+
.
dx
dx
dx
(3.13)
Zum Beispiel:
y = 3x + sin x
3.4.3
⇒
y = 3 + cos x.
(3.14)
Produktregel
d
(f (x) · g(x)) =
dx
df (x)
dx
· g(x) +
dg(x)
dx
· f (x).
(3.15)
y = 2xex + x2 ex = ex x(2 + x).
(3.16)
Zum Beispiel:
y = x2 ex
⇒
72
3.4.4
3 Differentiation
Quotientenregel
#
$
d f (x)
=
dx g(x)
df (x)
dx
· g(x) −
dg(x)
dx
· f (x)
g(x)2
.
(3.17)
Zum Beispiel:
y=
3.4.5
sin x
cos x
⇒
y =
1
cos x cos x + sin x sin x
=
.
cos2 x
cos2 x
(3.18)
Kettenregel
d
d
df dg
(f ◦ g)(x) =
f (g(x)) = f (g(x)) · g (x) =
·
.
dx
dx
dg dx
(3.19)
Bei der Kettenregel leiten wir also die Funktion zunächst nach dem Argument ab und multiplizieren
das Resultat mit der Ableitung des Arguments nach der Variablen. Wir multiplizieren also die
“äußere Ableitung” mit der “inneren Ableitung”.
Zum Beispiel:
y = sin(x2 )
f (z) = sin z
⇒
dy
= cos x2 · 2x.
dx
(3.20)
⇒
dy
= cos 2x · 2.
dx
(3.21)
⇒
2
dy
= ex · 2x.
dx
(3.22)
2
z = g(x) = x
y = sin(2x)
f (z) = sin z
z = g(x) = 2x
y = ex
2
f (z) = ez
z = g(x) = x2
y = xx = eln x·x
⇒
f (z) = ez
z = g(x) = ln x · x
3.4.6
dy
1
= eln x·x ( x + ln x)
dx
x
= xx (1 + ln x).
(3.23)
Umkehrregel
Durch Verkettung einer Funktion mit ihrer Umkehrfunktion ergibt sich die Identität:
(f −1 ◦ f )(x) = f −1 (f (x)) = x.
(3.24)
Wenden wir die Kettenregel auf diesen Ausdruck an, erhalten wir:
d −1
f (f (x)) = (f −1 ) (f (x)) · f (x) = 1.
dx
(3.25)
Daraus folgt die praktische Umkehrregel:
(f −1 ) (y) =
1
f (f −1 (y))
,
(3.26)
3 Differentiation
73
wobei wir f (x) durch y ersetzt und x durch x = f −1 (y) ausgedrückt haben.
Zum Beispiel:
y = sin x,
3.5
1
d
arcsin(y) = .
dy
1 − y2
⇒
x = arcsin y
(3.27)
Höhere Ableitungen
df
Wenn wir die Ableitung f (x) = dx
einer Funktion f (x) noch einmal nach der Variablen x ableiten,
erhalten wir die zweite Ableitung:
d
d2 f
d
f (x) .
(3.28)
f (x) = 2 =
dx
dx dx
Wir können natürlich die Funktion f (x) mehr als zweimal differenzieren. Die n-te Ableitung erhält
man durch n-maliges Differenzieren:
f (n) (x) =
dn f
.
dxn
(3.29)
Zum Beispiel:
f (x)
3.6
= x5 ,
(3.30)
4
f (x)
f (x)
= 5x ,
= 20x3 ,
(3.31)
(3.32)
f (x)
f (4) (x)
= 60x2 ,
= 120x,
(3.33)
(3.34)
f (5) (x)
f (6) (x)
= 120,
= 0,
(3.35)
(3.36)
f (n) (x)
= 0,
∀n ≥ 6.
(3.37)
Maxima und Minima von Funktionen
An Punkten, wo eine differenzierbare Funktion f (x) Maxima und Minima besitzt, verschwindet
ihre Ableitung f (x). Das heißt, wir können Maxima und Minima von Funktionen finden, indem
wir die Gleichung f (x) = 0 lösen. Falls ein Minimum den kleinsten Wert der Funktion im gesamten Definitionsbereich besitzt, nennt man es globales Minimum. Ansonsten ist es ein lokales
Minimum. Globale und lokale Maxima sind analog definiert. Maxima und Minima zusammen
nennt man Extremwerte.
Maxima und Minima kann man durch Bestimmung der zweiten Ableitung an diesen Stellen unterscheiden (siehe Abbildungen 3.7 und 3.8). Für Minima haben wir positive Krümmung, das
heißt, f (xmin ) > 0. Für Maxima hingegen ist die Krümmung negativ, das heißt f (xmax ) < 0.
Beispiel: Zu bestimmen sind Lage und Wert der Extrema der Funktion
f (x) = (1 − x2 )2 .
(3.38)
f (x) = −2(1 − x2 ) · 2x = −4x + 4x3 .
(3.39)
Wir bilden zunächst die erste Ableitung
74
3 Differentiation
Abbildung 3.6: Die dargestellte Funktion f (x) besitzt an den Stellen xmin und xmin jeweils Minima
und an der Stelle xmax ein Maximum. Da an der Stelle xmin die Funktion den kleinsten Wert im
gesamten Definitionsbereich annimmt, nennt man das zugehörige Minimum ein globales Minimum.
Abbildung 3.7: Die Funktion ax2 + bx + c hat für a > 0 an der Stelle xmin = −b/2a ein Minimum.
An der Stelle des Minimums hat die Funktion eine positive Krümmung, d.h f (xmin ) = 2a > 0.
Die Bedingung f (x) = 0 ist an den Stellen x = −1, x = 0 und x = +1 erfüllt. Um herauszufinden,
ob die Funktion an diesen Stellen ein Maximum oder ein Minimum besitzt, berechnen wir die
zweite Ableitung
(3.40)
f (x) = 12x2 − 4
und werten sie an den Stellen der Extremwerte aus:
f (0) = −4
f (±1) = 8.
und
(3.41)
Die Funktion f (x) = (1 − x2 )2 hat also an den Stellen x = −1 und x = 1 jeweils ein Minimum und
an der Stelle x = 0 ein Maximum.
3.7
Differentiation von Funktionen in Parameterform
Eine Funktion sei in Parameterform gegeben:
x =
y =
Die Ableitung y =
dy
dx
x(t),
y(t).
(3.42)
(3.43)
kann dann aus den Ableitungen nach dem Parameter t berechnet werden :
ẏ
dy
= =
dx
ẋ
dy
dt
dx
dt
.
(3.44)
3 Differentiation
75
Abbildung 3.8: Die Funktion ax2 + bx + c hat für a < 0 an der Stelle xmax = −b/2a ein Maximum.
An der Stelle des Maximums hat die Funktion eine negative Krümmung, d.h f (xax ) = 2a < 0.
Abbildung 3.9: Die Funktion f (x) = (1 − x2 )2 hat zwei Minima und ein Maximum.
Wir erhalten diese Beziehungen, indem wir zunächst auf y = f (x(t)) die Kettenregel anwenden,
df dx
dy dx
dy
=
·
=
·
.
dt
dx dt
dx dt
(3.45)
Umformung dieser Gleichung ergibt schließlich:
dy
=
dx
dy
dt
dx
dt
.
(3.46)
Dieselben Ausdrücke können wir auch auf Funktionen anwenden, welche in Polarkoordinaten
gegeben sind. In diesem Fall betrachtet man r als Funktion von ϕ: r = r(ϕ). Wir haben dann
x = r(ϕ) · cos ϕ,
y = r(ϕ) · sin ϕ.
(3.47)
(3.48)
Durch Anwendung von Gleichung (3.44) erhalten wir
dy
=
dx
dy
dϕ
dx
dϕ
dr
dϕ · sin ϕ + r(ϕ) · cos ϕ
.
dr
dϕ · cos ϕ − r(ϕ) sin ϕ
=
(3.49)
Beispiel:
√
Für die Funktion r(ϕ) = 1/ cos 2ϕ erhalten wir durch Differentiation
sin 2ϕ
1
dr
= −
(cos 2ϕ)−3/2 (− sin 2ϕ)2 =
3 ,
dϕ
2
(cos 2ϕ) 2
(3.50)
woraus folgt:
sin 2ϕ
dy
=
dx
3
(cos 2ϕ) 2
sin 2ϕ
3
(cos 2ϕ) 2
sin ϕ +
√cos ϕ
cos 2ϕ
cos ϕ −
√sin ϕ
cos 2ϕ
=
1
cos ϕ
=
.
sin ϕ
tan ϕ
(3.51)
76
3 Differentiation
Beispiel: Archimedische Spirale
Für die Funktion r(ϕ) = aϕ gilt
dr
= a,
dϕ
(3.52)
dy
a sin ϕ + aϕ cos ϕ
sin ϕ + ϕ cos ϕ
=
=
.
dx
a cos ϕ − aϕ sin ϕ
cos ϕ − ϕ sin ϕ
(3.53)
und somit
Die Ableitung dy/dx hängt also nicht von a ab.
3.8
Differentiation von Vektoren
Betrachten wir die Bewegung eines Massenpunktes durch den Raum. Diese Bewegung beschreiben
wir durch den Ortsvektor r(t) des Massenpunktes als Funktion der Zeit (siehe Abb. 3.10). Die
Bahnkurve des Massenpunktes nennen wir auch Trajektorie.
Abbildung 3.10: Trajektorie r(t) eines Massenpunktes. Die Geschwindigkeit v (t) ist die erste Ableitung von r(t) nach der Zeit.
Wir können jetzt analog zum skalaren Fall vorgehen und eine vektorartige Geschwindigkeit v als
den Grenzwert
r(t + ∆t) − r(t)
∆t→0
∆t
v (t) = lim
(3.54)
definieren. Die Ableitung eines Vektors ist wiederum ein Vektor. In Komponentenschreibweise
können wir diese Grenzwertbildung ausdrücken als:
 
 
 


dx
vx (t)
lim∆t→0 x(t+∆t)−x(t)
ẋ(t)
∆t
dt
 
  dy  


v (t) =  vy (t)  =  lim∆t→0 y(t+∆t)−y(t)
(3.55)
 =  dt  =  ẏ(t)  .
∆t
z(t+∆t)−z(t)
dz
vz (t)
lim∆t→0
ż(t)
∆t
dt
Eine etwas kürzere Schreibweise dafür ist:
v (t) =
d
r(t) = r˙ (t).
dt
(3.56)
Die Geschwindigkeit v (t) ist also die zeitliche Ableitung des Vektors r(t). Der Geschwindigkeitsvektor v ist tangential zur Trajektorie und sein Betrag ist gleich der Geschwindigkeit in Richtung
der Trajektorie.
3 Differentiation
77
Abbildung 3.11: Geschwindigkeit v und Beschleunigung a für die gleichförmige Kreisbewegung in
der Ebene.
Beispiel: Kreisbewegung
Für die gleichförmige Kreisbewegung in der Ebene auf einer Bahn mit Radius r um den Ursprung
gilt (siehe Abb. 3.11):
x = r cos ωt,
(3.57)
y = r sin ωt,
(3.58)
wobei ω die Winkelgeschwindigkeit ist. Durch Differentiation erhalten wir die x- und y-Komponenten
der Geschwindigkeit:
vx = −rω sin ωt,
(3.59)
vy = rω cos ωt.
(3.60)
Wie man durch Bildung des Skalarproduktes r(t) · v (t) leicht sehen kann, sind r(t) und v (t) zu
jedem Zeitpunkt normal aufeinander.
Die Beschleunigung beschreibt die zeitliche Änderung der Geschwindigkeit mit der Zeit:
d
d2
v = 2 r.
dt
dt
(3.61)
ax = −rω 2 cos ωt,
(3.62)
ay = −rω sin ωt.
(3.63)
a =
Für die Kreisbewegung erhalten wir somit
2
In Vektorschreibweise ist die Beschleunigung also gegeben durch
a = −ω 2r.
(3.64)
Die Beschleunigung a(t) und der Ortsvektor r(t) sind also zu jedem Zeitpunkt antiparallel.
Für Vektoren gelten folgende Differentiationsregeln, welche man sich durch Anwendung der
weiter oben behandelten einfachen Differentiationsregeln auf die jeweiligen Ausdrücke in Komponentenschreibweise leicht überlegen kann. Hier sind die Vektoren a und b zeitabhängig: a = a(t)
und b = b(t). f (t) ist eine beliebige skalare Funktion der Zeit.
• Summenregel
d
da db
(a + b) =
+ .
dt
dt
dt
(3.65)
78
3 Differentiation
• Produktregeln
– Skalar × Vektor
df
da
d
[f (t)a] = a + f .
dt
dt
dt
(3.66)
d
da db
(a · b) =
· b + a · .
dt
dt
dt
(3.67)
d
da db
(a × b) =
× b + a × .
dt
dt
dt
(3.68)
d
da db
dc
[(a × b) · c)] = (
× b) · c + (a × ) · c + (a × b) ·
dt
dt
dt
dt
(3.69)
– Skalarprodukt
– Kreuzprodukt
– Spatprodukt
• Quotientenregel
d
dt
a
f (t)
=
d
a
dt f
− a df
dt
.
f2
(3.70)
• Kettenregel
da(f (t))
da df
=
.
dt
df dt
3.9
3.9.1
(3.71)
Partielle Differentiation
Funktionen mehrerer Variabler
Eine Funktion kann von mehr als einer Variablen abhängen. Zum Beispiel könnte f (x, y) das
Höhenrelief eines Gebirges darstellen. In diesem Fall gibt f (x, y) für jeden Punkt (x, y), der etwa
durch die geographische Breite x und die geographische Länge y definiert ist, die Höhe über dem
Meeresspiegel an. Im Allgemeinen versteht man unter einer Funktion von zwei unabhängigen Variablen eine Vorschrift, die jedem geordneten Zahlenpaar (x, y) aus dem Definitionsbereich genau
ein Element z aus dem Wertebereich zuordnet:
z = f (x, y).
(3.72)
(Diese Definition kann direkt auf eine beliebige Zahl von Argumenten übertragen werden.) So
wie eine Funktion y = f (x) in einem kartesischen Koordinatensystem einen Kurve definiert (den
Funktionsgraphen), definiert eine Funktion z = f (x, y) in einem dreidimensionalen Koordinatensystem eine Fläche. Diese Fläche entsteht dadurch, dass jedem Punkt in der xy-Ebene eine gewisse
Höhe senkrecht zur xy-Ebene zugeordnet wird. Die Fläche besteht also aus allen Zahlentriplets
(x, y, z = f (x, y)).
Beispiel:
Die durch die Funktion
f (x, y) = y 2 − x
(3.73)
definierte Fläche ist in Abb. 3.12 graphisch dargestellt. Die Funktionsfläche ist ein für fallende
Werte von x ansteigendes Tal. Für x = const erhalten wir eine Schar von Parabeln, z = y 2 − const,
und für y = const eine Schar von Geraden mit Steigung -1, z = const − x.
3 Differentiation
79
Abbildung 3.12: Darstellung der Funktion z = f (x, y) = y 2 − x in einem dreidimensionalen kartesischen Koordinatensystem.
3.9.2
Partielle Ableitung
Wir können nun die Funktion f (x, y) nach einer der beiden Variablen ableiten und dabei die andere
Variable als konstant betrachten:
f (x + ∆x, y) − f (x, y)
∂f (x, y)
= lim
(y = const).
(3.74)
∆x→0
∂x
∆x
Genauso können wir die Funktion nach y ableiten:
∂f (x, y)
f (x, y + ∆y) − f (x, y)
= lim
∆y→0
∂y
∆y
(x = const).
(3.75)
Solche Ableitungen nennt man partielle Ableitungen, da die Funktion nur nach einer der Variablen abgeleitet wird, also nur “zum Teil”, und alle anderen Variablen festgehalten werden. Um
den Unterschied zur Differentiation einer Funktion einer einzelnen Variablen zu betonen, verwenden wir für die partielle Ableitung das geschwungene Delta: ∂. Alternativ zur Notation mit dem
geschwungenen Delta ∂ findet auch die folgende Schreibweise mit Indizes Verwendung:
fx
=
fy
=
∂f
∂x
∂f
.
∂y
(3.76)
(3.77)
Für partielle Ableitungen gelten dieselben Rechenregeln wie für die Differentiation einer Funktion
einer einzelnen Variablen.
Beispiel:
Die Funktion
f (x, y) = xy 2 + 4x5 y + 16x
(3.78)
80
3 Differentiation
kann sowohl nach x als auch nach y differenziert werden:
∂f
= y 2 + 20x4 y + 16,
∂x
∂f
= 2xy + 4x5 .
∂y
(3.79)
(3.80)
Durch wiederholtes partielles Ableiten lassen sich partielle Ableitungen höherer Ordnung (höhere
Ableitungen) bilden:
∂2f
∂ ∂f
=
(3.81)
= fxx ,
∂x2
∂x ∂x
∂ ∂f
∂2f
=
(3.82)
= fxy ,
∂y∂x
∂y ∂x
∂ ∂f
∂2f
=
(3.83)
= fyx ,
∂x∂y
∂x ∂y
∂2f
∂ ∂f
=
(3.84)
= fyy .
∂y 2
∂y ∂y
Beispiel: Thermodynamik
In der Thermodynamik verwendet man eine weitere, leicht unterschiedliche Schreibweise für partielle Ableitungen. So ist zum Beispiel die Wärmekapazität eines Körpers gegeben als
∂S
Cp = T
,
(3.85)
∂T p
wobei T die Temperatur ist, S die Entropie und p der Druck. Diese Wärmekapazität Cp ist die
Wärme, die einem Körper zugeführt (oder abgeführt) werden muss, um die Temperatur T des
Körpers um einen gewissen Betrag zu ändern und zwar bei konstantem Druck p. Der Index p
zeigt an, dass die Temperaturänderung bei konstantem Druck erfolgt.
Analog dazu gibt es auch die Wärmekapazität bei konstantem Volumen V :
∂S
CV = T
.
∂T V
(3.86)
Auch hier wird explizit angegeben, welche Variable sich ändert (T ) und welche unverändert bleibt
(V ).
Beispiel: Mechanik
Aus der potentiellen Energie U (x, y, z) kann die Kraft, die auf einen gewissen Körper wirkt, durch
partielle Ableitung berechnet werden:




− ∂U
∂x
Fx




 
(3.87)
F =  Fy  =  − ∂U
.
 ∂y 
Fz
− ∂U
∂z
Nach dem Satz von Schwarz kann bei gemischten partiellen Ableitungen die Reihenfolge der
Differentiation vertauscht werden, falls die partiellen Ableitungen stetig sind. Dies gilt auch für
partielle Ableitungen höherer Ordnung. Demnach gilt etwa:
∂2f
∂ 2f
=
.
∂x∂y
∂y∂x
(3.88)
3 Differentiation
81
In Analogie zum Differential lassen sich auch partielle Differentiale definieren:
∂x f (x, y) =
∂f (x, y)
dx
∂x
(3.89)
∂y f (x, y) =
∂f (x, y)
dy.
∂y
(3.90)
und
Das totale Differential (auch vollständiges Differential genannt) ergibt sich aus der Summe
der partiellen Differentiale:
df (x, y) =
∂f
∂f
dx +
dy.
∂x
∂y
(3.91)
Das totale Differential, das in der Fehlerrechnung und in der Thermodynamik von Bedeutung ist,
gibt an, um wie viel sich die Funktion f (x, y) ändert, wenn wir ihre Argumente um dx und dy
verschieben.
3.9.3
Anstieg einer impliziten Funktion
Eine Funktion sei in impliziter Form als F (x, y) = 0 gegeben (siehe Abb. 3.13). In einem gewissen
Punkt (x, y) ist der Anstieg der Kurve dann gegeben durch:
∂F
∂x
k = − ∂F
.
(3.92)
∂y
Um zu verstehen, woher dieser Ausdruck kommt, betrachten wir F (x, y) als eine Funktion z =
F (x, y) von x und y. Das vollständige Differential der Funktion ist
∂F
∂F
dF (x, y) =
dx +
dy.
(3.93)
∂x
∂y
Wir wissen nun, dass entlang der durch F (x, y) = 0 definierten Kurve sich F (x, y) nicht ändert
(F (x, y) ist ja auf dieser Kurve überall gleich 0). Daher ist dF = 0. Wenn wir diesen Ausdruck
dann noch durch dx dividieren, erhalten wir schließlich
∂F
dy
∂x
= − ∂F
.
dx
∂y
(3.94)
Abbildung 3.13: Der Anstieg (oder die Steigung) k der durch F (x, y) = 0 definierten Kurve im
Punkt (x, y) ist gegeben durch k = −(∂F/∂x)/(∂F/∂y).
82
3 Differentiation
Beispiel:
Die Gleichung
F (x, y) = x2 + y 2 − 1 = 0
(3.95)
stellt einen Kreis in der Ebene mit Mittelpunkt im Ursprung und Radius 1 dar. Die Steigung des
Kreises an der Stelle (x, y) ist gegeben durch:
dy
−2x
x
=
=− .
dx
2y
y
(3.96)
(3.97)
√ √
Demnach ist die Steigung der Kreislinie im Punkt (0, 1) gleich 0, im Punkt ( 2, 2) ist sie gleich
-1 und im Punkt (1, 0) ist sie gleich −∞.
Kapitel 4
Integration
4.1
Das unbestimmte Integral
Die Integration ist die Umkehrung der Differentiation. Während wir bei der Differentiation für
eine bestimmte Funktion ihre Ableitung bestimmen, wollen wir beim Integrieren aus der Ableitung
die Funktion bestimmen. Oder, mit anderen Worten, wir wollen aus der Steigung einer Kurve die
Kurve selbst bestimmen. Dies ist eine der beiden Grundaufgaben der Integralrechnung. Die
zweite Grundaufgabe der Integralrechnung, der wir uns später zuwenden werden, besteht in der
Berechnung von Flächen unter Funktionsgraphen.
Gegeben sei also eine Funktion f (x). Zu dieser Funktion suchen wir jetzt eine andere Funktion
F (x), sodass f (x) die Ableitung von F (x) ist:
F (x) = f (x).
(4.1)
F (x) wird die Stammfunktion genannt. Das Auffinden der Stammfunktion wird Integration
genannt. Zum Beispiel hat die Funktion f (x) = x2 die Funktion F (x) = 13 x3 als Stammfunktion,
denn
d 1 3
x = x2 .
dx 3
(4.2)
Während bei der Differentiation F (x) gegeben und f (x) = F (x) gesucht ist, gilt es also bei der
Integration für eine gegebene Funktion f (x) eine Funktion F (x) zu finden, sodass F (x) = f (x).
Man nennt F (x) auch das unbestimmte Integral von f (x) und schreibt:
%
%
F (x) = f (x) dx
oder
F (x) = dxf (x).
(4.3)
Hier ist es wichtig anzumerken, dass das unbestimmte Integral einer Funktion wiederum eine
Funktion ist.
Genauer müsste man eigentlich schreiben:
%
F (x) =
f (x) dx + C,
(4.4)
wobei C die so genannte Integrationskonstante ist. Diese Konstante wird deshalb benötigt, weil
die Integration kein eindeutiger Vorgang ist. So haben z.B. die Funktionen
f (x) = 2x
f (x) = x2
2
g(x) = x + 5
g (x) = 2x
83
(4.5)
(4.6)
84
4 Integration
dieselbe Ableitung, weil eine Konstante bei der Differentiation verschwindet. Falls F (x) eine Stammfunktion von f (x) ist, ist F (x) + C also auch eine, denn die Ableitungen dieser beiden Funktionen
sind identisch (siehe Abb. 4.1). Außerdem ist jede beliebige Stammfunktion F̃ (x) der Gestalt
F̃ (x) = F (x) + C. Sind nämlich sowohl F (x) als auch F̃ (x) Stammfunktionen, gilt
dF̃
dF
d
(F̃ (x) − F (x)) =
−
= f − f = 0.
dx
dx
dx
(4.7)
Deshalb ist F̃ (x) − F (x) eine Konstante und F̃ (x) kann geschrieben werden als F̃ (x) = F (x) + C.
Abbildung 4.1: Falls die Funktion F (x) eine Stammfunktion von f (x) ist, so ist es auch eine
ganze Schar von Funktionen, die sich jeweils um eine Konstante unterscheiden. Die Gleichung
F (x) = f (x) gibt für jeden Wert von x die Steigung der Tangente vor.
Die Integrationskonstante ist eine zunächst unbestimmte Konstante, die wir zur Stammfunktion dazu schreiben, um diesen Sachverhalt anzudeuten. Wenn wir den Wert von F (x) an einer
einzelnen Stelle kennen, können wir daraus C bestimmen (Anfangswert, Randbedingung). Weil
durch die Differentiation Konstanten verloren gehen, können wir sie nicht mehr durch Integration
zurückgewinnen und es gibt eine unendliche Schar von Stammfunktionen, die sich nur durch
eine Konstante unterscheiden und die alle die gleiche Ableitung besitzen (siehe Abb. 4.1).
Beispiel:
Wir betrachten einen Körper, der sich mit zunehmender Geschwindigkeit v entlang einer Geraden
bewegt. Wir nehmen dabei an, dass die Geschwindigkeit linear mit der Zeit zunimmt (wir haben
es also mit einer gleichförmigen Beschleunigung zu tun):
v = at,
(4.8)
wobei v = q̇ und a = v̇ und wir für die Beschleunigung den Wert a = 4m/s2 annehmen. Der in
einer Zeit t zurückgelegte Weg q(t) ist gegeben durch:
%
q(t) =
%
v dt =
at dt =
at2
+ C.
2
(4.9)
(Hier heißt unsere Variable t statt x, was natürlich völlig belanglos ist.) Nehmen wir nun an, dass
zum Zeitpunkt t = 0 der Körper schon einen Weg von 4 Metern zurückgelegt hat, also q(t = 0) = 4m
(man nennt so etwas eine Anfangsbedingung). Diese Anfangsbedingung können wir benutzen,
um die Integrationskonstante zu bestimmen:
q(0) =
a02
m + C = 4m
2
⇒
C = 4m.
(4.10)
4 Integration
85
Die Anfangsbedingung wählt aus der Schar aller Lösungen eine bestimmte Lösung aus.
Zusammenfassend halten wir fest:
• Zu jeder stetigen Funktion f (x) gibt es unendlich viele Stammfunktionen F (x), sodass
F (x) = f (x).
• Zwei beliebige Stammfunktionen F1 (x) und F2 (x) unterscheiden sich nur durch eine Konstante:
F1 (x) − F2 (x) = C.
(4.11)
Wenn F (x) eine Stammfunktion ist, dann ist also auch F (x) + C eine Stammfunktion.
4.2
Wichtige unbestimmte Integrale
In der unten stehenden Tabelle sind ein paar der wichtigsten unbestimmten Integrale angeführt.
Durch Differenzieren von F (x) kann man sich leicht von der Richtigkeit dieser Beziehungen überzeugen.
Funktion
f (x)
Stammfunktion
&
F (x) = dxf (x)
a
xn
ax
1
x
x
ln x
ex
1 ax
ae
1
x
ln a a
− cos x
sin x
cosh x
sinh x
e
eax
ax
sin x
cos x
sinh x
cosh x
1
n+1
n+1 x
Diese Tabelle enthält nur die allerwichtigsten (und einfachsten) Integrale. Weitere Integrale können
Sie den Integraltafeln in den gängigen Formelsammlungen entnehmen oder Sie können Computerprogramme wie “Mathematica” zur Bestimmung von Integralen benutzen. Falls Sie keinen Zugang
zu “Mathematica” oder einem ähnlichen Programm haben, gehen Sie einfach mit Ihrem Browser
zu integrals.wolfram.com und tippen Sie Ihr Integral ein.
4.3
Das bestimmte Integral
Wir wenden uns nun der zweiten Grundaufgabe der Integralrechnung zu, nämlich der Berechnung
des Flächeninhalts eines Bereichs, der vom Graphen einer Funktion f (x) in einem Intervall [a, b]
mit der x-Achse eingeschlossen wird (siehe Abb. 4.2). Dieser Flächeninhalt ist das bestimmte
Integral.
Obwohl es auf den ersten Blick nicht offensichtlich ist, gibt es einen fundamentalen Zusammenhang zwischen der ersten Grundaufgabe der Integralrechnung, dem Auffinden einer Stammfunktion F (x), und der Flächenberechnung. Im Folgenden werden wir uns mit diesem Zusammenhang
beschäftigen.
86
4 Integration
Abbildung 4.2: Die zweite Grundaufgabe der Integralrechnung besteht in der Berechnung der
Fläche Sab (schraffierter Bereich) unter dem Graphen einer Funktion f (x) im Intervall [a, b].
Um die Fläche Sab unter dem Funktionsgraphen f (x) zu berechnen, teilen wir das Intervall [a, b] auf
der x-Achse in n gleich lange Teile der Breite ∆x = (b−a)/n ein (siehe Abb. 4.3). Die äquidistanten
Endpunkte dieser Intervalle nennen wir xi . Für die Endpunkte der Intervalle gilt demnach:
xi = a + i∆x,
i = 0, . . . , n.
(4.12)
Wir nehmen hier der Einfachheit halber an, dass die Kurve f (x) vollständig über der x-Achse liegt.
Funktionen, die im Intervall [a, b] sowohl positive als auch negative Werte annehmen, bieten jedoch
keine wesentlichen Schwierigkeiten, wie wir später sehen werden.
Diese Einteilung des Intervalls [a, b] in n kleine Abschnitte zerlegt die Fläche Sab in n vertikale
Streifen. Die Gesamtfläche Sab ist dann gegeben durch die Summe der Flächeninhalte der einzelnen
Streifen:
Sab
=
=
s1 + s2 + s3 + · · · + sn
n
si .
(4.13)
i=1
Dabei ist si der Flächeninhalt des i-ten Streifens (das ist der Streifen, der zum Intervall [xi−1 , xi ]
gehört). Hier ist uns zum ersten Mal das Summenzeichen Σ (das große griechische Sigma) begegnet, dessen Bedeutung aus dem obigen Ausdruck klar sein sollte. Das Summenzeichen erlaubt es,
Summen (sogar unendliche) auf kompakte Weise zu schreiben.
Abbildung 4.3: Zur Berechnung der Fläche unter der Kurve von f (x) teilen wir das Intervall [a, b] in
viele kleine Teile. Die Gesamtfläche unter der Kurve ergibt sich dann aus der Summe aller schmalen
senkrechten Streifen.
4 Integration
87
Abbildung 4.4: Die Fläche eines schmalen Streifens setzt sich zusammen aus einem Rechteck mit
den Kantenlängen ∆x und f (xi ) und einem Rest εi (schraffierter Bereich).
Schauen wir uns nun die Fläche si etwas genauer an (siehe Abb. 4.4). Die Fläche des Streifens
setzt sich zusammen aus einem Rechteck mit den Kantenlängen ∆x und f (xi ) und dem Rest εi :
si = f (xi )∆x + εi .
(4.14)
Das heißt:
Sab =
n
si =
i=1
n
f (xi )∆x +
i=1
n
εi .
(4.15)
i=1
Abbildung 4.5: Der schraffierte Bereich ist der Fehler, der gemacht wird, falls die Fläche der senkrechten Streifen durch die Fläche der Rechtecke mit Kantenlängen ∆x und f (xi ) angenähert wird.
n
Für eine grobe Einteilung von [a,b] kann der Term i=1 εi recht groß sein. Wenn wir die Einteilung
n
feiner und feiner machen, wird i=1 εi immer kleiner und die Fläche immer besser durch
Sab ≈
n
f (xi )∆x
(4.16)
i=1
angenähert. In dieser Approximation behandelt man also die senkrechten
als Rechtecke mit
Streifen
n
Kantenlängen ∆x und f (xi ). Der Fehler, der dabei gemacht wird, ist i=1 εi (siehe Abbildungen
4.5 und 4.6).
n
Für unendlich kleine ∆x verschwindet schließlich i=1 εi und die Fläche Sab ist exakt durch den
Grenzwert
n
Sab = lim
f (xi )∆x
(4.17)
∆x→0
i=1
88
4 Integration
Abbildung 4.6: Für eine kleiner werdende Intervallbreite ∆ wird der Fehler, der durch die Approximation der senkrechten Streifen durch Rechtecke gemacht wird, immer kleiner.
gegeben, bei dem wir die Anzahl n der Teilintervalle unbegrenzt wachsen lassen. Diesen Grenzwert
nennen wir das bestimmte Integral über dem Intervall [a, b] und wir bezeichnen es mit:
%b
f (x)dx = lim
∆x→0
a
n
f (xi )∆x.
(4.18)
i=1
&
Das Zeichen
ist eine Stilisierung des Buchstabens S und soll uns daran erinnern, dass das
bestimmte Integral durch Grenzwertbildung aus einer Summe hervorgegangen ist. Der Ausdruck
f (x)dx hinter dem Integralzeichen soll an die Form f (xi )∆x der Terme in dieser Summe erinnern.
Die Variable x wird Integrationsvariable genannt.
&b
Das bestimmte Integral a f (x)dx ist eine Zahl, im Gegensatz zum unbestimmten Integral, das
&b
eine Funktion von x ist. Das bestimmte Integral a f (x)dx hängt nur von den Integrationsgrenzen a und b und von der Funktion f (x) im Intervall [a, b] ab. Daher ist die genaue Bezeichnung
&b
&b
der Integrationsvariablen belanglos. Statt a f (x)dx hätten wir genauso gut a f (z)dz schreiben
können ohne das Ergebnis zu verändern.
Wir haben bisher vorausgesetzt, dass die Funktion f (x) im gesamten Intervall [a, b] positiv ist. Das
muss jedoch nicht der Fall sein. Im allgemeinen Fall liegen einige Teile des Funktionsgraphen über
und einige Teile unter der x-Achse (siehe Abb. 4.7).
Abbildung 4.7: Bei einer Funktion, deren Graph sowohl über als auch unter der x-Achse liegt,
tragen die Flächenbereiche mit negativen Funktionswerten mit einem negativen Vorzeichen zum
Integral bei.
4 Integration
89
Wenn wir in diesem Fall das bestimmte Integral mit Hilfe von Gleichung (4.18) durch Grenzwertbildung berechnen, erhalten wir in den Bereichen mit negativem Funktionswert negative Beiträge
zur Summe. Auch in diesem Fall ist das bestimmte Integral
%b
f (x)dx
(4.19)
a
die Summe der Inhalte der Flächen, die von der x-Achse, dem Funktionsgraphen f (x) und der
Abszissenwerte x = a und x = b begrenzt werden. Dabei tragen die Flächen oberhalb der x-Achse
allerdings positiv und die Flächen unterhalb der x-Achse negativ zum Integral bei.
4.4
Zusammenhang zwischen bestimmtem und unbestimmtem Integral
Abbildung 4.8: Die Funktion f (x) begrenzt im Intervall [a, b] mit der x-Achse einen Bereich mit
Flächeninhalt Sab und im kleineren Intervall [a, x] einen Bereich mit Flächeninhalt Sax .
Gegeben sei eine Funktion f (x), die im Intervall [a, b] mit der x-Achse eine Fläche Sab eingrenzt
(siehe Abb. 4.8). Wir betrachten jetzt aber nur einen Teil der Fläche Sab , nämlich den, der von
der Funktion f (x), der x-Achse und den senkrechten Geraden durch die Abszisse a und durch
eine bewegliche Abszisse x begrenzt wird. Wir nennen diese Fläche Sax . Die Größe dieser Fläche
hängt davon ab, an welche Stelle im Intervall wir die Abszisse x legen. Wir können die Fläche Sax
ausdrücken als bestimmtes Integral der Funktion f (x) mit unterer Grenze a und oberer Grenze
x. Da wir die Buchstaben x zur Bezeichnung der oberen Grenze verwenden, verwenden wir einen
anderen Buchstaben (z.B. u) als Integrationsvariable. Die Fläche Sax ist gegeben durch:
%x
Sax =
f (u)du.
(4.20)
a
Das Integral in dieser Gleichung ist ein bestimmtes Integral mit einer veränderlichen oberen Grenze
x. Das bestimmte Integral Sax ist also eine Funktion dieser Grenze x.
Als nächstes werden wir zeigen, dass Sax (betrachtet als Funktion von x) eine Stammfunktion
von f (x) ist:
d
Sax = f (x).
dx
(4.21)
Dies wird den gesuchten Zusammenhang zwischen dem bestimmten Integral und dem unbestimmten Integral herstellen. Um zu zeigen, dass Sax eine Stammfunktion von f (x) ist, betrachten wir
90
4 Integration
Abbildung
& x 4.9: Die Fläche des schraffierten Bereichs ist gleich der Änderung ∆Sax der Fläche
Sax = a f (x)dx aufgrund einer Änderung der oberen Grenze des Integrals von x auf x + ∆x.
die Zunahme ∆Sax von Sax durch einen Zuwachs ∆x der veränderlichen oberen Grenze x. Der
Zuwachs ∆Sax ist einfach die Größe des zusätzlichen Streifens, der durch x, x + ∆x, f (x) und die
x-Achse begrenzt wird (siehe Abb. 4.9).
Für sehr kleine ∆x ist ∆Sax gegeben durch die Fläche eines Rechtecks mit der Breite ∆x und der
Höhe f (x),
∆Sax ≈ f (x) · ∆x.
(4.22)
Für ∆x → 0 strebt der Fehler, den wir in dieser Näherung machen, gegen 0 und wir erhalten aus
obiger Gleichung:
∆Sax
= f (x).
∆x→0 ∆x
lim
(4.23)
Die linke Seite der Gleichung ist aber genau die Definition der Ableitung von Sax nach der Variablen x. Somit gilt
d
d
Sax =
dx
dx
%x
f (u)du = f (x).
(4.24)
a
Das heißt, das bestimmte Integral der Funktion f (u) mit veränderlicher Grenze x ist eine Stammfunktion des Integranden. Somit haben wir den gesuchten Zusammenhang erhalten.
Durch Ausnutzung dieses Zusammenhangs können wir das bestimmte Integral
%b
f (x)dx
(4.25)
a
durch Auffinden der Stammfunktion F (x) von f (x) berechnen. Dies können wir auf folgende Weise
tun. Da wir wissen, dass Sax eine Stammfunktion von f (x) ist, kann sich die Stammfunktion F (x)
nur um eine Konstante C (Integrationskonstante) von diesem bestimmten Integral unterscheiden:
%x
f (u)du = F (x) + C.
(4.26)
a
Zu Bestimmung von C beachten wir nun, dass das Integral auf der linken Seite verschwindet, falls
die obere Grenze x mit der unteren Grenze a zusammenfällt, das heißt wenn a = x. Für x = a
4 Integration
91
erhalten wir daher:
%a
f (u)du = 0 = F (a) + C.
(4.27)
a
Daraus folgt:
C = −F (a).
(4.28)
Somit gilt
%x
f (u)du = F (x) − F (a).
(4.29)
a
Indem wir x = b setzen, erhalten wir schließlich
%b
f (u)du = F (b) − F (a).
(4.30)
a
Da wir jetzt den Buchstaben x nicht mehr für die obere Integrationsgrenze benötigen, können wir
natürlich auch schreiben:
%b
f (x)dx = F (b) − F (a).
(4.31)
a
Eine alternative Schreibweise dafür ist:
%b
!b
!
f (x)dx = F (x)!! .
(4.32)
a
a
Wir erhalten also den Wert des bestimmten Integrals aus der Differenz einer Stammfunktion des
Integranden an der oberen und unteren Integrationsgrenze. Dieses Ergebnis nennt man den Hauptsatz der Differential- und Integralrechnung. Dieser sehr praktische Zusammenhang erspart
uns bei der Berechnung des bestimmten Integrals die schwierige Grenzwertbildung.
Beispiel:
Wir berechnen nun das bestimmte Integral der Funktion f (x) = x im Intervall [a, b] zunächst mit
Hilfe des Hauptsatzes der Differential- und Integralrechnung und dann explizit durch Einteilung des
Intervalls in schmale Unterintervalle der Breite ∆x und anschließender Grenzwertbildung ∆x → 0.
Durch Bestimmen der Stammfunktion von f (x) = x, F (x) = x2 /2, finden wir
%b
xdx =
a
!b
x2 !!
b 2 − a2
.
=
!
2 a
2
(4.33)
Wir könnten alternativ dazu auch eine Summe schmaler Streifen bilden und dann ∆x gegen 0
gehen lassen:
Sab ≈
n
i=1
f (xi ) · ∆x.
(4.34)
92
4 Integration
Für die Abszisse xi gilt xi = x0 + i∆x = a + i∆x. Daher ist f (xi ) = a + i∆x und wir haben
Sab
n
n
n
(a + i∆x) · ∆x =
a∆x +
i∆x2
≈
i=1
=
i=1
a∆x
n
1 + ∆x2
i=1
na∆x + ∆x2
=
n
i=1
i
i=1
n
i.
(4.35)
i=1
Da ∆x =
b−a
n
gilt
Sab
≈ na
n
(b − a) (b − a)2 +
i
n
n2
i=1
≈ a(b − a) +
(b − a)2
(1 + 2 + 3 + · · · + (n − 1) + n).
n2
(4.36)
Die Summe aller natürlichen Zahlen von 1 bis n ist bekannt,
1 + 2 + 3 + · · · + (n − 1) + n =
n(n + 1)
,
2
(4.37)
und somit erhalten wir schließlich:
Sab
(b − a)2 n(n + 1)
·
n2
2 2
1
(b − a)
· 1+
a(b − a) +
.
2
n
≈
a(b − a) +
≈
(4.38)
Um das bestimmte Integral Sab zu berechnen, müssen wir den Grenzübergang ∆x → 0 oder
äquivalent dazu den Grenzübergang n → ∞ durchführen. Das heißt
#
$
1
(b − a)2
· 1+
Sab = lim a(b − a) +
n→∞
2
n
(b − a)2
= a(b − a) +
2
2
2ab
b2
+ a
2
− = a
b−a +
2
2
2
1 2
2
=
(b − a ),
(4.39)
2
was mit dem Ergebnis weiter oben übereinstimmt, jedoch weitaus komplizierter zu berechnen war
(selbst für die einfache Funktion f (x) = x).
Beispiel:
Gesucht ist die Fläche unter der Kurve y = x3 zwischen a = 0 und b = 1. Diese Fläche ist gleich
dem bestimmten Integral
%1
x3 dx =
0
!1
x4 !!
1
= .
4 !0 4
(4.40)
4 Integration
93
Abbildung 4.10: Die Fläche eines Viertelkreises kann durch Integration der Funktion y =
im Intervall [0, r] berechnet werden.
√
r2 − x2
Beispiel:
Gesucht ist die Fläche eines Viertelkreises mit Radius r. Der implizite Ausdruck für einen Kreis
mit Radius r um den Ursprung,
x2 + y 2 = r2 ,
lässt sich leicht in einen expliziten Ausdruck für die Kreislinie umwandeln:
y = r2 − x2 .
(4.41)
(4.42)
Die Fläche A des Viertelkreises lässt sich somit als bestimmtes Integral schreiben:
%r A=
r2 − x2 dx.
(4.43)
0
Durch Nachschlagen in einer Formelsammlung finden wir:
% x
x 2
r2
arcsin .
r2 − x2 dx =
r − x2 +
2
2
r
(4.44)
Das heißt
A =
!r
%r x
x !!
r2
2
2
2
2
arcsin
r − x dx =
r −x +
2
2
r !0
0
=
r r2
r2
r2 π
r2 π
r2
arcsin
−
arcsin(0) =
arcsin(1) =
=
.
2
r
2
2
2 2
4
(4.45)
Die Fläche des Viertelkreises ist also r2 π/4.
4.5
Rechenregeln für das bestimmte Integral
Für das bestimmte Integral gelten folgende Rechenregeln:
• Das bestimmte Integral verschwindet, wenn die untere und obere Integrationsgrenze zusammenfallen:
%a
f (x)dx = 0.
a
(4.46)
94
4 Integration
• Ein Integral kann in eine Summe von zwei Integralen über aneinander grenzende Intervalle
zerlegt werden:
%c
%b
f (x)dx =
a
%c
f (x)dx +
a
f (x)dx.
(4.47)
b
• Vertauschung der Integrationsgrenzen führt zur Umkehrung des Vorzeichens:
%b
%a
f (x)dx = −
a
4.6
f (x)dx.
(4.48)
b
Grundregeln des Integrierens
Wir wollen jetzt auf Methoden zur Ermittlung der Stammfunktion (also des unbestimmten Integrals) eingehen. Die folgenden Regeln ergeben sich aus den bereits besprochenen Differentiationsregeln. Im Folgenden werden wir die Integrationskonstante, die wir genau genommen immer
ausdrücklich hinschreiben müssten, meistens weglassen.
4.6.1
Faktorregel
Ein konstanter Faktor kann vor das Integral gezogen werden:
%
%
af (x)dx = a f (x)dx.
(4.49)
Diese Regel ist eine direkte Umkehrung der Faktorregel für die Differentiation.
Beispiel:
%
f (x) =
f (x)dx
=
=
=
3
,
4
x
%
%
%
3
1
dx = 3
dx = 3 x−4 dx
x4
x4
1
3
x−4+1 + C = −x−3 + C
−4 + 1
1
− 3 + C.
x
(4.50)
(4.51)
Beispiel:
%4
− 72
5x
!4
2
7
5!
x− 2 dx = 5 −
x− 2 !! =
5
2
2
#
$
#
$
1
1
1
1
−√
−√
−2 √
= −2
32
( 4)5
16 · 2
25
#
$
1
1
1
1
− √ = √ −
−2
32 4 2
2 2 16
√
√ √
√
√
4 2−1
8− 2
8 2−2
2
16 − 2 2
√
√ =
=
.
= √
2 · 16
16
2 2 · 16
2 · 16
2
%4
dx =
2
=
=
=
5
(4.52)
4 Integration
4.6.2
95
Summenregel
Das Integral einer Summe ist gleich der Summe der Integrale:
%
%
%
[f (x) + g(x)]dx = f (x)dx + g(x)dx.
(4.53)
Beispiel:
f (x) = x3 + 2x
%
%
%
x2
x4
x4
+2
=
+ x2 .
(x3 + 2x)dx = x3 dx + 2x dx =
4
2
4
4.6.3
(4.54)
(4.55)
Substitutionsmethode
Bei der Substitutionsmethode versucht man, die zu integrierende Funktion durch Einführen einer
neuen Variablen zu vereinfachen oder auf eine Form zu bringen, die in einer Formelsammlung
gefunden werden kann. Im Allgemeinen führt man in der Substitutionsmethode eine Transformation
auf eine neue Variable u = g(x) durch. Im Integral
%
f (x)dx
(4.56)
muss dazu sowohl die Funktion f (x) als auch das Differential dx transformiert werden. Für
die Transformation benötigen wir die Umkehrfunktion x = g −1 (u) der Substitutionsfunktion
u = g(x). Mit Hilfe von g und g −1 können wir die Wirkung der Variablentransformation auf die
Funktion ausdrücken als
(4.57)
f (x) = f (g −1 (u)).
Das transformierte Differential bestimmen wir, indem wir den Ausdruck
du
= g (x)
dx
nach dx auflösen:
dx =
du
du
= −1
.
g (x)
g (g (u))
Somit können wir das Integral ausdrücken als
%
%
%
du
du
f (x)dx = f (g −1 (u)) = f (g −1 (u)) −1
.
g (x)
g (g (u))
(4.58)
(4.59)
(4.60)
Wenn wir die Funktion g −1 (u) umbenennen in
ϕ(u) = g −1 (u),
(4.61)
dx
= ϕ (u) ⇒ dx = ϕ (u)du,
du
(4.62)
können wir auch schreiben:
x = ϕ(u),
und somit
%
%
f (x)dx =
f (ϕ(u))ϕ (u)du.
(4.63)
Nach Bestimmung des unbestimmten Integrals, d.h. der Stammfunktion, in der Variablen u erhalten
wir das Integral als Funktion von x durch Rücktransformation zur ursprünglichen Variablen.
96
4 Integration
Die obigen Ausdrücke schauen zunächst beträchtlich komplizierter aus als der Ausdruck, von dem
wir ausgegangen sind. Dass es aber tatsächlich zu einer Vereinfachung kommen kann, zeigen die
folgenden Beispiele.
Beispiel: Zu berechnen ist das Integral
%
(4 + 5x)7 dx.
(4.64)
Hier könnten wir die siebente Potenz der Klammer explizit berechnen und dann Term für Term
integrieren. Einfacher ist es, eine neue Variable einzuführen:
u = 4 + 5x.
(4.65)
Dann gilt du/dx = 5 und somit dx = du/5. Durch Einsetzen erhalten wir
%
%
1 1 8 u8
du
=
u =
.
(4 + 5x)7 dx = u7
5
58
40
(4.66)
Um zur ursprünglichen Variablen zurückzukehren, setzen wir einfach u = 4 + 5x oben ein:
%
(4 + 5x)8
.
(4.67)
(4 + 5x)7 dx =
40
Beispiel:
Zu berechnen ist das Integral
%
1 x 6 − 3x2 dx.
(4.68)
2
Hier versuchen wir es mit u = 6 − 3x2 als Substitutionsfunktion. In diesem Fall ist
du
du
= −3 · 2x = −6x d.h. dx = − .
(4.69)
dx
6x
Wir drücken hier das x im Nenner nicht durch u aus, sondern lassen es einfach stehen und erkennen,
dass es sich nach Einsetzen des Differentials mit einem Faktor des Integrals kürzt:
%
%
%
√
1 1 √
du
1
x 6 − 3x2 dx =
x u −
udu
=−
2
2
6x
12
1 2 3
1 3
= −
(4.70)
u2 = − u2 .
12 3
18
Rücktransformation ergibt:
%
3
1
1 x 6 − 3x2 dx = − (6 − 3x2 ) 2 .
(4.71)
2
18
Eine so vorteilhafte Kürzung wie in diesem Beispiel ist jedoch nicht immer möglich.
Beispiel:
Wir berechnen das Integral
%
cos(ωt + ϕ)dt,
(4.72)
indem wir die Substitution u = ωt + ϕ durchführen. Dann gilt
du
=ω
dt
Wir haben also
%
und somit
%
cos(ωt + ϕ)dt =
cos u
dt =
du
.
w
du
sin(u)
1
=
= sin(ωt + ϕ).
ω
ω
ω
(4.73)
(4.74)
4 Integration
4.6.4
97
Partielle Integration
Durch Anwendung der Produktregel kann das Produkt zweier Funktionen f (x) und g(x) leicht
differenziert werden:
d(f (x)g(x))
df
dg
=
g(x) + f (x) ,
dx
dx
dx
(4.75)
(f g) = f g + f g .
(4.76)
oder, etwas kürzer,
Diese Regel kann uns bei der Integration eines Produkts zweier Funktionen behilflich sein, falls für
eine oder beide Funktionen die Stammfunktion erkennbar ist und wir also das Integral schreiben
können als:
%
(4.77)
f (x)g(x)dx.
Wenn der Integrand in einer derartigen Form vorliegt, können wir die Produktregel der Differentiation anwenden und erhalten:
%
%
%
f (x)g(x)dx =
(f (x)g(x)) dx − f (x)g (x)dx
%
= f (x)g(x) − f (x)g (x)dx,
(4.78)
wobei wir einfach ausgenützt haben, dass f (x)g(x) die Stammfunktion von (f (x)g(x)) ist. In Worten ausgedrückt: die Stammfunktion eines Produktes ist gleich dem Produkt der Stammfunktion
der ersten Funktion mit der zweiten Funktion minus dem Integral des Produkts der Stammfunktion der ersten Funktion mit der& Ableitung der zweiten Funktion. &Natürlich hat diese Prozedur nur
dann Sinn, wenn das Integral f g dx einfacher als das Integral f gdx ist.
Beispiel:
Zu berechnen ist das Integral
%
xex dx.
(4.79)
Hier wählen wir f (x) = ex (da ex einfach zu integrieren ist) und g(x) = x. Dann ist
%
%
x
x
e
dx
=
e
x
−
1 ex dx = ex x − ex = ex (x − 1).
x
g
f
f
g
g
(4.80)
f
Die Wahl f (x) = x und g(x) = ex wäre weniger sinnvoll gewesen, denn dann hätten wir
%
%
2
x2
x
x x
e
dx
=
e
−
ex dx
x
2
2
g
g
g f
f
(4.81)
f
erhalten und unser Problem wäre nur schwieriger geworden, da die Funktion x2 ex nicht leichter zu
integrieren ist als die Funktion xex .
Beispiel:
Zu berechnen ist das Integral
%
ln xdx.
(4.82)
98
4 Integration
Hier ist auf den ersten Blick kein Produkt vorhanden, aber wir können den Integranden durch
Multiplikation mit 1 leicht als ein Produkt anschreiben:
%
%
ln xdx = 1 · ln xdx.
(4.83)
Wir wählen jetzt f (x) = 1 und g(x) = ln x und erhalten so
%
%
%
1
·
ln
x
dx
=
x
ln
x
−
x
dx
ln xdx =
1
x
g
g
f
f
f
g
%
= x ln x −
1dx = x ln x − x
= x(ln x − 1).
Beispiel: Zu berechnen ist das Integral
(4.84)
%
cos2 (x)dx.
(4.85)
Wir wählen für dieses Beispiel f (x) = cos(x) und g(x) = cos(x) und erhalten durch partielle
Integration:
%
%
%
2
cos (x)dx =
cos(x) cos(x)dx = sin(x) cos(x) + sin(x) sin(x)dx
%
= sin(x) cos(x) + (1 − cos2 (x))dx
%
%
= sin(x) cos(x) + 1dx − cos2 (x)dx.
(4.86)
Das Integral
4.7
&
1dx = x und durch einfaches Umformen erhalten wir schließlich:
%
1
[sin(x) cos(x) + x] .
cos2 (x)dx =
2
(4.87)
Rotationskörper
Rotieren wir eine durch die Funktion f (x), die beiden Abszissen a und b und die x-Achse begrenzte
Fläche um die x-Achse, so entsteht ein dreidimensionaler Rotationskörper. Zur Berechnung
seines Volumens zerteilen wir das Intervall [a, b] in n gleiche Unterintervalle der Breite ∆x =
(b−a)/n. Zu jedem dieser n Intervalle gehört nun eine dünne Scheibe mit kreisförmiger Grundfläche
und einer Dicke ∆x (siehe Abb. 4.11). Der Radius der Grundfläche im i-ten Intervall ist für sehr
kleine Dicken ∆x gleich dem Funktionswert f (xi ) an der Stelle xi = a + i∆x. Das Volumen der
Scheibe ist daher
∆Vi = Grundfläche × Höhe ≈ f (xi )2 π∆x.
(4.88)
Durch Summation der Volumina aller dünnen Scheiben erhalten wir schließlich das Gesamtvolumen
des Rotationskörpers
V =
n
∆Vi ≈
i=1
n
f (xi )2 π∆x.
(4.89)
i=1
Im Grenzwert ∆x → 0 geht dieser Ausdruck in das Integral
%b
%b
2
V =
f (x)2 dx
f (x) πdx = π
a
a
(4.90)
4 Integration
99
Abbildung 4.11: Rotation einer durch eine Funktion f (x) und der x-Achse in einem Intervall [a, b]
begrenzten Fläche führt zu einem so genannten Rotationskörper.
über. Wir können somit das Volumen eines Rotationskörpers als bestimmtes Integral über die
Funktion f (x)2 ausdrücken.
Beispiel:
Zu berechnen ist das Volumen eines Kegels mit einer Grundfläche mit Radius r und einer Höhe
h (siehe Abb. 4.12). Die Funktion f (x) ist in diesem Fall eine Gerade durch den Ursprung mit
Steigung r/h:
f (x) =
r
x.
h
(4.91)
Das Volumen des Kegels ist demnach das bestimmte Integral
%b
!h
%h 2
πr2 x3 !!
1 πr2 h3
r
2
f (x) dx = π
x dx = 2 · ! =
.
h
h
3 0
3 h2
2
V =π
a
(4.92)
0
Somit ist das Volumen des Kegels gegeben durch:
V =
1 2
πr h.
3
(4.93)
Beispiel:
Die Parabel f (x) = 9 − x2 rotiert zwischen ihren Nullstellen um die x-Achse und erzeugt dadurch
einen Rotationskörper (siehe Abb. 4.13). Zu bestimmen ist das Volumen des Rotationskörpers.
Die Nullstellen der Parabel befinden sich bei x = ±3. Das Volumen V des Rotationskörpers ist
100
4 Integration
Abbildung 4.12: Durch Rotation der Geraden y = (r/h)x im Intervall [0, h] um die x-Achse entsteht
ein Kegel mit Höhe h und mit Grundflächenradius r.
Abbildung 4.13: Durch Rotation der Parabel f (x) = 9 − x2 zwischen ihren Nullstellen um die
x-Achse entsteht ein Rotationskörper.
demnach gegeben durch:
%3
V
%3
(9 − x ) dx = π
2 2
= π
−3
#
(81 − 18x2 + x4 )dx
−3
$3
18x
x
243
= π 81x −
+
= 2π 81 · 3 − 6 · 27 +
3
5 −3
5
243
648
.
= 2π 243 − 162 +
= 2π ·
5
5
3
5
(4.94)
Beispiel:
Zu bestimmen ist das Volumen einer Kugel mit Radius r. Wir stellen uns dazu vor, dass die
Halbkugel durch Rotation der Kurve
f (x) = r2 − x2
(4.95)
4 Integration
101
Abbildung 4.14: Durch Rotation eines Halbkreises um die x-Achse entsteht eine Halbkugel.
im Intervall [0, r] um die x-Achse entstanden ist (siehe Abb. 4.14). Das Volumen der Kugel ist
somit zweimal das Volumen des Rotationskörpers:
 r

%r
%
%r
V = 2π (r2 − x2 )dx = 2π  r2 dx − x2 dx
0
0
!r
!r
!
x3 !!
r3
2 !
= 2πr x! − 2π ! = 2πr3 − 2π
3
3
0
0
1
4
= 2πr3 1 −
= πr3 .
3
3
4.8
0
(4.96)
Berechnung von Bogenlängen
Abbildung 4.15: Die Bogenlänge des Funktionsgraphen von f (x) kann durch Integration ermittelt
werden. Das Differential ds der Bogenlänge kann mit Hilfe des Pythagoräischen Lehrsatzes aus den
Differentialen dx und dy ermittelt werden.
Gegeben sei die Funktion f (x) mit dem dazugehörige Funktionsgraphen in der xy-Ebene. Wir
wollen nun in einem bestimmten Intervall die Länge s des Funktionsgraphen von f (x) berechnen.
(Die Länge einer Kurve wird auch Bogenlänge genannt.) Dazu betrachten wir ein kleines Unterintervall der Länge dx, wobei wir das Differential benutzen, um anzudeuten, dass es sich hier
um infinitesimale Differenzen handelt. Das dazugehörige Differential in der y-Richtung ist gegeben
102
4 Integration
durch:
dy = f (x)dx.
(4.97)
Die Länge ds des von den Abszissen x und x + dx begrenzten Kurvenstücks erhalten wir durch
Anwendung des Pythagoräischen Lehrsatzes:
ds = dy 2 + dx2 .
(4.98)
Hier haben wir ausgenutzt, dass sich die Kurve für infinitesimale dx im Intervall [x, x + dx] durch
eine Gerade approximieren lässt. Wir formen nun die obige Gleichung unter Verwendung von
Gleichung (4.97) um:
ds =
dy 2 + dx2 = (f (x)dx)2 + dx2 = 1 + f (x)2 dx.
(4.99)
Um die Gesamtlänge der Kurve zwischen x = a und x = b zu erhalten, summieren wir über alle
infinitesimalen Unterintervalle und erhalten die Bogenlänge:
s=
%b 1 + f (x)2 dx.
(4.100)
a
Beispiel:
Zu bestimmen ist der Umfang des Kreises mit Radius r. Wir berechnen
zunächst den Umfang des
√
Halbkreises. Der Halbkreis ist der Graph der Funktion f (x) = r2 − x2 und die Integrationsgrenzen sind −r und r (siehe Abb. 4.16).
Abbildung 4.16: Der dargestellte Halbkreis ist der Graph der Funktion y =
[−r, r].
√
r2 − x2 im Intervall
Die Ableitung von f (x) ist
2x
1
x
f (x) = − √
= −√
.
2 r2 − x2
r2 − x2
(4.101)
Somit ist die Bogenlänge s gegeben durch:
s
=
%r "
1+
−r
%r
=
−r
x2
dx =
r2 − x2
r
√
dx =
2
r − x2
%r
−r
%r "
−r
r2 − x2 + x2
dx
r2 − x2
1
2 dx.
1 − xr
(4.102)
4 Integration
103
Zur Lösung des Integrals substituieren wir t = x/r, das heißt dt = dx/r und dx = rdt. Hier müssen
auch die Integrationsgrenzen transformiert werden: an den Stellen x = −r und x = r hat die neue
Variable t die Werte t = −1 und t = 1. Durch die Transformation wird die Bogenlänge zu:
!1
%1
!
r
1
√
√
=
dt = r
dt = r arcsin t!!
2
2
1−t
1−t
−1
−1
−1
' π π (
− −
= rπ.
= r
2
2
%1
s
(4.103)
Der Umfang des Kreises ist dann einfach
U = 2πr.
(4.104)
Für eine in Parameterform gegebene Kurve
x =
x(t),
(4.105)
y
y(t),
(4.106)
=
drücken wir die Differentiale in x- und y-Richtung aus als:
dx
dx =
dt = ẋ(t)dt,
dt
dy
dy =
dt = ẏ(t)dt.
dt
(4.107)
(4.108)
Abbildung 4.17: Für eine Kurve in Parameterform, r = r(t), kann die Bogenlänge zwischen t = α
und t = β durch Integration berechnet werden.
In diesem Fall ist die infinitesimale Bogenlänge ds gegeben durch
ds = dx2 + dy 2 = ẋ(t)2 dt2 + ẏ(t)2 dt2 = ẋ(t)2 + ẏ(t)2 dt
(4.109)
und die Gesamtbogenlänge ergibt sich aus der Integration über die Hilfsvariable t:
%β s=
ẋ(t)2 + ẏ(t)2 dt.
(4.110)
α
Die Integrationsgrenzen t = α und t = β entsprechen den Punkten, zwischen denen die Bogenlänge
berechnet werden soll (siehe Abb. 4.17).
104
4 Integration
Beispiel:
Zu berechnen ist der Umfang der in Parameterform gegebenen Ellipse
x(t)
= a sin t,
(4.111)
y(t) = b cos t.
(4.112)
a und b sind die Halbachsen der Ellipse und wir nehmen an, dass a > b. Der Parameter t durchläuft
das Intervall [0, 2π].
Die Ableitungen von x(t) und y(t) nach t sind
ẋ =
ẏ =
a cos t,
−b sin t,
(4.113)
(4.114)
und somit kann der Umfang der Ellipse als das Vierfache der Bogenlänge im ersten Quadranten
ausgedrückt werden:
%2 %2 "
b2
2
2
2
2
4
a cos t + b sin tdt = 4a
cos2 t + 2 sin2 tdt
a
π
s
=
π
0
0
π
2
% "
%2 )
2
a − b2
b
1 − sin2 t + 2 sin2 tdt = 4a
1−
4a
sin2 tdt
a
a2
π
2
=
0
0
π
2
=
4a
% 1 − K 2 sin2 tdt,
(4.115)
0
wobei wir hier die Exzentrizität K = (a2 − b2 )/a2 der Ellipse eingeführt haben. Für einen
Kreis ist K = 0 und für eine Ellipse mit a > b ist K > 0.
&
1 − K 2 sin2 t dt hat keine Lösung, die sich mit Hilfe einfacher, bekannter FunktioDas Integral
nen ausdrücken lässt. Man definiert daher einfach eine neue Funktion
%α E(α, K) ≡
1 − K 2 sin2 tdt
|K| < 1.
(4.116)
0
Man nennt diese Funktion ein elliptisches Integral (genauer: ein elliptisches Integral der 2. Art).
Die Funktion kann für ein bestimmtes α und ein bestimmtes K mit dem Computer ausgewertet
werden (z.B. mit Mathematica). In Abb. 4.18 ist die Funktion E(α, K) für α = π/2 als Funktion
von K dargestellt.
Mit Hilfe des elliptischen Integrals E(α, K) kann der Ellipsenumfang schließlich ausgedrückt werden
als
"
a2 − b 2
π
,
.
(4.117)
s = 4aE
2
a2
Beispiel: Archimedische Spirale
Zu bestimmen ist die Länge der Archimedischen Spirale r = aϕ im Bereich von ϕ = 0 bis ϕ = ϑ
(siehe Abb. 4.19).
In Parameterform ist die Spirale gegeben durch
x(ϕ)
=
aϕ cos ϕ,
(4.118)
y(ϕ)
=
aϕ sin ϕ.
(4.119)
4 Integration
105
Abbildung 4.18: Das elliptische Integral der 2. Art E(α, K) für α = π/2 in Abhängigkeit von K.
Die Ableitungen von x(ϕ) und y(ϕ) nach dem Winkel ϕ sind
ẋ =
ẏ =
a cos ϕ − aϕ sin ϕ,
a sin ϕ + aϕ cos ϕ.
(4.120)
(4.121)
Die Bogenlänge der Spirale zwischen ϕ = 0 und ϕ = ϑ ist somit:
s
=
%ϑ (a cos ϕ − aϕ sin ϕ)2 + (a sin ϕ + aϕ cos ϕ)2 dϕ
0
=
%ϑ a
(cos ϕ − ϕ sin ϕ)2 + (sin ϕ + ϕ cos ϕ)2 dϕ
=
%ϑ ((
((
(sin
(sin
(ϕ
(ϕ
a
cos2 ϕ − (
2ϕ(
cos
ϕ + ϕ2 sin2 ϕ + sin2 ϕ + (
2ϕ(
cos
ϕ + ϕ2 cos2 ϕdϕ
0
0
=
%ϑ )
a
cos2 ϕ + sin2 ϕ +ϕ2 (sin2 ϕ + cos2 ϕ)dϕ
0
=1
=1
( !!ϑ
a' 2
2
ϕ 1 + ϕ + Arsinh(ϕ) !!
a
1 + ϕ dϕ =
2
0
0
'
(
a
ϑ 1 + ϑ2 + Arsinh(ϑ)
2
%ϑ
=
=
=
(
a' ϑ 1 + ϑ2 + ln(ϑ + 1 + ϑ2 ) .
2
(4.122)
106
4 Integration
Abbildung 4.19: Die Archimedische Spirale r = aϕ.
4.9
Mittelwerte von Funktionen
Um den Mittelwert von n Zahlen ai zu bestimmen, addiert man die Zahlen und dividiert sie durch
deren Anzahl:
a=
a1 + a2 + a3 + · · · + an−1 + an
,
n
(4.123)
wobei der horizontale Strich über dem a auf der linken Seite der obigen Gleichung einen Mittelwert
bedeutet. a könnte zum Beispiel der Mittelwert einer Reihe von Messdaten sein. Wir wollen nun
das zeitliche Mittel einer Funktion f (t) bestimmen. Dazu stellen wir uns vor, dass wir den Wert
der Funktion beginnend bei t = a nach Zeitschritten ∆t bestimmen. Das heißt, wir bestimmen f (t)
zuerst bei t = a und messen dann f (t) wiederholt zu den Zeitpunkten ti = a + i∆t (siehe Abb.
4.20). Durch diesen Messvorgang erhalten wir n Messwerte f (ti ), die man tabellarisch darstellen
kann als:
ti
t1
t2
t3
...
tn
f (ti )
f (t1 )
f (t2 )
f (t3 )
...
f (tn )
.
Der Mittelwert aller dieser Messwerte ist
f=
f (t1 ) + f (t2 ) + · · · + f (tn )
.
n
Wir multiplizieren jetzt sowohl Zähler als auch Nenner mit ∆t
n
f (ti )∆t
.
f = i=1
n · ∆t
(4.124)
(4.125)
Wir erkennen, dass für sehr kurze Zeitintervalle ∆t der Zähler übergeht in das bestimmte Integral
&b
f (t)dt. Der Nenner ist einfach die Länge des gesamten Intervalls, n∆t = (b − a). Das heißt
a
&b
f=
f (t)dt
1
=
(b − a)
(b − a)
%
a
b
f (t)dt.
(4.126)
a
In Worten kann man dies wie folgt ausdrücken: Der Mittelwert f einer Funktion im Intervall (a, b)
ist gleich dem bestimmten Integral der Funktion f (t) zwischen den Integrationsgrenzen a und b
dividiert durch die Länge des Intervalls [a, b].
4 Integration
107
Abbildung 4.20: Die Funktion f (t) wird zu äquidistanten Zeitpunkten ti bestimmt.
Natürlich gilt auch:
%
b
f (t)dt = f (b − a).
(4.127)
a
Beispiel:
Durch einen Widerstand fließt ein Wechselstrom I(t) = I0 sin ωt und es fällt am Widerstand eine
Spannung U (t) = U0 sin ωt ab. Zu berechnen ist der Mittelwert der Leistung über eine Periode.
Die momentane Leistung ist Strom × Spannung, das heißt
P (t) = U (t) · I(t) = U0 I0 sin2 ωt.
(4.128)
Die Länge der Periode ist T = 2π/ω. Das heißt, die mittlere Leistung ist gegeben durch (siehe
Abb. 4.21)
P
=
=
1
T
%
T
0
I0 U0
T
1
P (t)dt =
T
%T
U0 I0 sin2 ωt dt
0
%T
sin2 ωt dt.
(4.129)
0
Durch partielle Integration hatten wir weiter oben das Integral
ermittelt. Da cos2 x = 1 − sin2 x, folgt für das Integral von sin2 x:
%
&
cos2 xdx =
x 1
1
sin2 x dx = x − (sin x cos x + x) = − sin x cos x.
2
2 2
1
2 (sin x cos x
+ x)
(4.130)
Mit der Substitution u = ωt ⇒ dt = du/ω erhalten wir
%
#
$
1 ωt 1
sin ωt dt =
− sin ωt cos ωt .
ω 2
2
2
(4.131)
108
4 Integration
Abbildung 4.21: Die durchschnittliche an einem Ohmschen Widerstand verbrauchte Leistung lässt
sich durch Integration der Leistung als Funktion der Zeit bestimmen.
und somit
P
=
$ !T
#
!
I0 U0 1 ωt 1
− sin ωt cos ωt !!
T ω 2
2
0

=
1

2π
2π
I0 U0 
1
ωT

ω) cos( ω) −0 + sin(0) cos(0)
− sin( 

ωT
ω ω 2
2
2
=
I0 U0
.
2
=0
4.10

0
(4.132)
Doppelintegrale
So wie wir Funktionen von zwei, drei oder noch mehr Variablen differenzieren können, können wir
sie auch integrieren. Integration solcher Funktionen führt zu Mehrfachintegralen, die in der Physik sehr oft auftreten, zum Beispiel bei der Bestimmung von Volumina, Massen, Schwerpunkten,
Trägheitsmomenten, Zustandssummen usw. Mehrfachintegrale lassen sich auf die Nacheinanderausführung von gewöhnlichen Integralen zurückführen.
4.10.1
Definition
Bisher haben wir die durch eine Kurve begrenzte Fläche als bestimmtes Integral berechnet (siehe
Abb. 4.22):
%b
Sab =
f (x)dx.
(4.133)
a
Wir wollen uns nun mit der analogen Aufgabe beschäftigen, das Volumen eines Körpers zu berechnen, der von einer Fläche f (x, y), von einem Bereich A der xy-Ebene und vom vertikal bis zur
Fläche fortgesetzten Rand von A begrenzt wird (siehe Abb. 4.23). Um dieses Volumen zu bestimmen, gehen wir ähnlich vor wie bei der Berechnung der Fläche Sab , die wir in schmale senkrechte
Streifen eingeteilt hatten. Wir teilen dazu den Bereich A in kleine Rechtecke mit Kantenlängen
∆x und ∆y ein, indem wir ein Gitter über die xy-Ebene legen (siehe Abb. 4.24).
Jedes Rechteck wird durch zwei Indizes beschrieben, einem in der x-Richtung (i) und einem in der
y-Richtung (j). In jedem Rechteck (das wir auch Zelle nennen) wählen wir einen Punkt (xi , yj ).
4 Integration
109
Abbildung 4.22: Die Fläche Sab unter einer
Kurve kann durch einfache Integration bestimmt werden.
Abbildung 4.23: Zur Bestimmung des Volumens unter einer Fläche ist eine Doppelintegration notwendig.
Abbildung 4.24: Zur Berechnung des von einer Fläche begrenzten Volumens teilen wir
den Bereich A in der xy-Ebene in viele kleine Rechtecke ein.
Abbildung 4.25: Ein Teilvolumen über einem der kleinen Rechtecke im Bereich A. Die
Höhe des Volumens ist etwa der Funktionswert f (xi , yi ) an der Stelle xi , yi .
Dieser Punkt kann der Mittelpunkt der Zelle sein oder irgendwo anders in der Zelle liegen (auch
am Rand). Zu jedem dieser Punkte (xi , yj ) gibt es einen Funktionswert f (xi , yj ). Das Volumen
über der Zelle, das von der Fläche f (x, y) oben begrenzt wird, ergibt sich näherungsweise aus der
Grundfläche ∆x∆y der Zelle multipliziert mit deren Höhe f (xi , yj ) (siehe Abb. 4.25):
∆V ≈ ∆x∆y · f (xi , yj ).
(4.134)
Hier machen wir natürlich einen Fehler, weil dieses Teilvolumen oben nicht durch eine ebene,
horizontale Fläche begrenzt wird. Für kleiner werdende ∆x und ∆y wird dieser Fehler jedoch
immer kleiner. Durch Summation über alle Quader, deren zugehörige Punkte (xi , yj ) in A liegen,
erhalten wir schließlich annäherungsweise das gesuchte Gesamtvolumen V
V ≈
f (xi , yj )∆x∆y.
(4.135)
i
j
Wie beim eindimensionalen Fall nähert die Summe das Volumen immer besser an, je feiner die
Einteilung der xy-Ebene gewählt wird, das heißt je kleiner ∆x und ∆y sind. Im Grenzfall ∆x → 0
und ∆y → 0 erhalten wir das exakte Volumen:
%%
f (xi , yj )∆x∆y =
f (x, y)dxdy.
(4.136)
V = lim lim
∆x→0 ∆y→0
i
j
A
110
4 Integration
Dieser Grenzwert ist das Doppelintegral der Funktion f (x, y) im Gebiet A. Das Produkt
dxdy nennt man auch das Flächenelement. Da das Gebiet A kompliziert sein kann, können wir
nicht wie im eindimensionalen Fall einfache Integrationsgrenzen angeben. Wir schreiben daher
&b
das Gebiet A einfach unter das Doppelintegral. Wie beim Integral a f (x)dx müssen wir diesen
Grenzübergang nicht für jedes Integral neu durchführen. Statt dessen können wir die Berechnung
des Doppelintegrals auf die Berechnung einfacher Integrale zurückführen.
4.10.2
Berechnung von Doppelintegralen
Zur Berechnung eines Doppelintegrals gehen wir von der Summe
V ≈
f (xi , yj )∆x∆y
i
(4.137)
j
aus und führen die Summation über i und j getrennt durch. Zunächst summieren wir für ein
bestimmtes i über alle möglichen Werte von j. Diese Summation entspricht der Berechnung des
Volumens einer Schicht der Dicke ∆x parallel zur yz-Ebene (siehe Abb. 4.26):


Vi = 
f (xi , yj )∆y  ∆x.
(4.138)
j
Abbildung 4.26: Die Summation über alle j für einen bestimmten Wert i ergibt das Volumen einer
Schicht mit der Dicke ∆x, die parallel zur yz-Ebene liegt.
Führen wir jetzt den Grenzwert ∆y → 0 durch, erhalten wir


b(x
% i)


f (xi , y)dy  ∆x.
Vi = 
(4.139)
a(xi )
Dabei hängen die Integrationsgrenzen vom Ort xi ab. In der xy-Ebene wird der Integrationsbereich
A durch die zwei Kurven a(x) und b(x) begrenzt (siehe Abb. 4.27).
Hier gehen wir der Einfachheit halber davon aus, dass der Integrationsbereich nur zwei senkrechte
Tangenten besitzt. Falls das nicht der Fall ist (siehe zum Beispiel Abb. 4.28), muss man dies
berücksichtigen. Auch in diesem Fall ändert sich jedoch die prinzipielle Vorgangsweise nicht.
Das Volumen Vi aus Gleichung (4.139) entspricht dem Volumen über der schraffierten Fläche in
Abb. 4.27. Um das Gesamtvolumen zu berechnen, müssen wir noch über alle Teilvolumina Vi
4 Integration
111
Abbildung 4.27: Die Integrationsgrenzen a(x) und b(x) für die Integrationsgrenzen in y-Richtung
hängen von der x-Position ab.
Abbildung 4.28: Falls der Integrationsbereich wie hier mehr als zwei senkrechte Tangenten besitzt,
muss man die Integration in mehrere Doppelintegrale aufteilen.
summieren:

V ≈
Vi =
i
Dieses bestimmte Integral
b(x
& i)


i

b(x
% i)

f (xi , y)dy  ∆x.
(4.140)
a(xi )
f (xi , y)dy auf der rechten Seite der obigen Gleichung ist eine Funk-
a(xi )
tion von xi . Die Abhängigkeit von y ist bereits verschwunden, weil wir über die Integrationsvariable
y integriert haben. Durch Bildung des Grenzübergangs ∆x → 0 erhalten wir schließlich




b(x
b(x)
d
i)
%
%
%




f (xi , y)dy  ∆x = 
f (x, y)dy  dx,
(4.141)
V = lim

∆x→0
i
a(xi )
c
a(x)
wobei wir wieder die Definition des Integrals als Grenzfall einer Summe benutzt haben. Wir haben
somit die Berechnung des Doppelintegrals auf die hintereinander ausgeführte Berechnung zweier
einfacher Integrale zurückgeführt.
Natürlich hätten wir auch die Integrationsreihenfolge umkehren können:


%b d(y)
%
%b d(y)
%


f (x, y)dx dy =
f (x, y)dxdy.
V = 
a
c(y)
(4.142)
a c(y)
In diesem Fall müssen wir die Integrationsgrenzen für die Integration nach x als Funktion von y
ausdrücken.
112
4 Integration
Beispiel:
Zu berechnen ist das Integral
durch:
&& √
x + y dxdy für einen rechteckigen Bereich A, der gegeben ist
A
1 ≤ x ≤ 2,
(4.143)
0 ≤ y ≤ 5.
(4.144)
Abbildung 4.29: Integrationsbereich A.
In diesem Fall vereinfacht sich die Berechnung, weil die Integrationsgrenzen in y-Richtung nicht
von x abhängen:
%%
√
%5 %2
x + y dxdy
=
A
0
=
2
3
1
%5
0
=
=
=
√
x + y dxdy =
22
35
%5 0
!2 2
3!
(x + y) 2 !!
dy
3
x=1
3
3
(y + 2) 2 − (y + 1) 2 dy
!5
!5 !
5!
(y + 2) !! − (y + 1) 2 !!
5
2
0
0
5
5
22 5
72 − 22 − 62 + 1
35
5
5
4 5
72 − 22 − 62 + 1 .
15
(4.145)
Wenn wir die Integrationsreihenfolge umkehren, erhalten wir:
%%
√
%2 %5
x + ydxdy
=
A
1
=
2
3
√
x + ydydx =
0
%2 %2 1
!5 3!
2
(x + y) 2 !!
dx
3
y=0
3
3
(x + 5) 2 − x 2 dx
1
=
=
!2
!2 2
5!
5!
2
(x + 5) 2 !! − x 2 !!
5
5
1
1
5
5
5
4
72 − 22 − 62 + 1 ,
15
2
3
was mit dem oben erhaltenen Resultat übereinstimmt.
(4.146)
4 Integration
113
Beispiel:
Zu berechnen ist das Volumen des Kugeloktanten einer Kugel mit Radius r (siehe Abb. 4.30). Im
Unterschied zum vorherigen Beispiel müssen wir hier die x-Abhängigkeit der Integrationsgrenzen
in y berücksichtigen.
Abbildung 4.30: Der Kugeloktant ist im ersten Quadranten durch die Fläche z =
nach oben begrenzt.
r2 − x2 − y 2
Die Kugeloberfläche im ersten Oktanten ist gegeben durch:
x2 + y 2 + z 2 = r2 ⇒ f (x, y) = r2 − x2 − y 2 .
(4.147)
Das Volumen V8 des Kugeloktanten lässt sich somit als folgendes Doppelintegral ausdrücken:


b(x)
%r %


r2 − x2 − y 2 dy  dx.
V8 = 
(4.148)
0
a(x)
Da die Grenzen für die Integration in y-Richtung
a(x) = 0
sind, erhalten wir:
%r
V8 =
0
√


und
b(x) =
r2 − x2


dy r2 − x2 − y 2  dx.
(4.149)
r%2 −x2
(4.150)
0
Aus einer Formelsammlung entnehmen wir, dass
% 1' 2
y(
y a − y 2 + a2 arcsin
.
a2 − y 2 dy =
2
a
(4.151)
Somit erhalten wir für die Integration in y-Richtung:
√
r%2 −x2
(r2 − x2 ) − y 2 dy
=
0
$√r2 −x2
#
1 2
y
2
2
y (r − x2 ) − y 2 + (r − x ) arcsin √
2
r2 − x2 0
+ π
1*
0 + (r2 − x2 ) arcsin(1) − 0 − 0 = (r2 − x2 ).
2
4
Einsetzen dieses Resultats und Integration in x-Richtung ergibt schließlich
!r
%r
π
x3 !!
π 2
V8 =
(r − x2 )dx =
r2 x −
4
4
3 !0
0
π
r3
r3 π
2 π
3
=
r −
= · · r3 =
,
4
3
3 4
6
=
(4.152)
(4.153)
114
4 Integration
sodass wir für das Kugelvolumen das erwartete Resultat
V =8
4
r3 π
= πr3
6
3
(4.154)
erhalten.
4.10.3
Doppelintegrale in Polarkoordinaten
Oft ist es leichter, den Integrationsbereich A für ein Doppelintegral in Polarkoordinaten auszudrücken. So ist es zum Beispiel bei Integration über einen Kreis mit Radius R einfacher,
den Inte√
grationsbereich
durch 0 ≤ r ≤ R und 0 ≤ ϕ ≤ 2π als durch −R ≤ x ≤ R und − R2 − x2 ≤ y ≤
√
R2 − x2 zu beschreiben. In Polarkoordinaten ist der Integrationsbereich also einfach ein Rechteck,
während wir in kartesischen Koordinaten mit komplizierteren Funktionen arbeiten müssen.
Um diese Vereinfachung auszunützen, können wir die Integration in Polarkoordinaten durchführen.
Dazu drücken wir zuerst die zu integrierende Funktion in Polarkoordinaten aus:
f (x, y) = f (r cos ϕ, r sin ϕ).
(4.155)
Wir müssen allerdings auch das Flächenelement dxdy = dA richtig transformieren. Das Flächenelement dA ergibt sich ja dadurch, dass wir die Variablen x und y um einen kleinen Betrag dx
bzw. dy ändern und dadurch das Flächenelement dA = dxdy erzeugen. Welches Flächenelement
entsteht aber, wenn wir ϕ um dϕ und r um dr ändern?
Abbildung 4.31: Das Flächenelement dA entsteht durch eine Änderung des Winkels ϕ um dϕ und
eine Änderung des Radius r um dr.
Dieses Flächenelement ist von gekrümmten Linien begrenzt (siehe Abb. 4.31). Für sehr kleine dϕ
und dr kann man das Flächenelement mit vernachlässigbarem Fehler als Rechteck mit Seitenlängen
dr und rdϕ betrachten (der Winkel ϕ wird in Bogenmaß angegeben). Der Flächeninhalt dieses
kleinen Rechtecks ist daher:
dA = rdϕdr.
(4.156)
Somit ergibt sich für die Transformation des Integrals von kartesischen Koordinaten zu Polarkoordinaten:
%%
%%
f (x, y)dxdy =
f (r cos ϕ, r sin ϕ)rdϕdr.
(4.157)
A
A
Hier ist A der in Polarkoordinaten beschriebene Integrationsbereich.
4 Integration
115
Beispiel:
Wieder soll das Volumen des Kugeloktanten berechnet werden, diesmal allerdings unter Verwendung von Polarkoordinaten. Transformation des Integrationsbereichs in der xy-Ebene nach Polarkoordinaten ergibt:
%% %% R2 − x2 − y 2 dxdy =
R2 − r2 cos2 ϕ − r2 sin2 ϕrdϕdr
V8 =
K
K
π
2
%
=


%R 
R2 − r2 rdr dϕ,
0
2
(4.158)
0
2
wobei wir ausgenutzt haben, dass sin ϕ + cos ϕ = 1. Da der Integrand nicht vom Winkel ϕ
abhängt, können wir die Integration über ϕ sofort durchführen und erhalten
π
V8 =
2
%R R2 − r2 rdr.
(4.159)
0
Um dieses Integral über r zu bestimmen, führen wir die Substitution u = R2 − r2 durch. Da
du/dr = −2r und somit dr = −du/2r, erhalten wir
%
% √
du
R2 − r2 rdr =
ur
−2r
3
21 3
u2
− u2 = −
3 2
3
1 2
2 32
− (R − r ) .
3
=
=
(4.160)
Einsetzen ergibt schließlich
V8 =
π
2
!R
!
πR3
1
3
− (R2 − r2 ) 2 !! =
,
3
6
0
(4.161)
was mit dem früher erhaltenen Ergebnis übereinstimmt.
Beispiel:
Wir wollen das so genannte Gaußsche Integral
%∞
2
e−x dx
(4.162)
−∞
berechnen. Dieses Integral spielt in der Wahrscheinlichkeitsrechnung und in der statistischen Mechanik eine wichtige Rolle.
Das Gaußsche Integral ist auf direkte Weise nicht leicht zu bestimmen, wir können es aber mit
dem folgenden Trick berechnen. Wir schreiben das Integral zunächst als
 ∞
 12
%∞
%
%∞
2
2
2
e−x dx = 
e−x dx
e−y dy  .
(4.163)
A=
−∞
−∞
−∞
Das können wir ohne weiteres tun, weil der Name der Integrationsvariablen (x oder y) belanglos
ist. Das Produkt der beiden Integrale über x und über y können wir nun als ein Doppelintegral
über die gesamte xy-Ebene auffassen.
%∞
2
A =
e
−∞
−x2
%∞
dx ·
−∞
e
−y 2
%∞ %∞
dy =
−∞ −∞
e−(x
2
+y 2 )
dxdy.
(4.164)
116
4 Integration
Abbildung 4.32: Die Fläche unter der Gaußschen Glockenkurve exp(−x2 ) ist A =
√
π.
Diese Darstellung erlaubt eine Transformation auf Polarkoordinaten:
%2π%∞
2
A
=
e
0
−r 2
%∞
rdrdϕ = 2π
0
2
e−r rdr.
(4.165)
0
Hier haben wir ausgenützt, dass gilt r2 = x2 + y 2 . Der Integrand ist somit nicht mehr abhängig von
ϕ, sodass wir die Integration über ϕ gleich ausführen konnten, was einen Faktor von 2π verursacht
hat. Das noch verbleibende Integral über r ist leicht zu lösen. Wir erkennen, dass
2
d −r2
= e−r (−2r)
e
dr
und somit
2
2
1
− e−r = e−r r.
2
d
dr
Durch Einsetzen erhalten wir schließlich
!∞
!
2
1
1
A2 = 2π − e−r !! = 2π (−0 + 1) = π.
2
2
0
(4.166)
(4.167)
(4.168)
Das Gaußsche Integral ist also:
%∞
2
e−x dx =
√
π.
(4.169)
−∞
4.11
Dreifachintegrale
4.11.1
Definition
Analog zum Doppelintegral können wir auch ein Dreifachintegral (oder im Allgemeinen ein nfaches Integral) definieren und berechnen. Gegeben sei ein Gebiet B im dreidimensionalen Raum,
das von einer geschlossenen Fläche umgeben wird. Innerhalb dieses Gebiets sei eine Funktion
f (x, y, z) definiert. Als Beispiel können wir uns einen Körper mit einer räumlich nicht uniformen
Dichte ρ(x, y, z) vorstellen.
Wir können die Funktion f (x, y, z) über den Bereich B integrieren, indem wir diesen in kleine
Quader mit Kantenlängen ∆x, ∆y und ∆z einteilen. Das Volumen ∆V jedes Quaders ist
∆V = ∆x∆y∆z.
(4.170)
4 Integration
117
Abbildung 4.33: Bei einer Dreifachintegration wird das Integrationsvolumen in infinitesimale Quader mit Kantenlängen dx, dy und dz, so genannte Volumselemente, eingeteilt.
Wir summieren jetzt den Funktionswert f (xi , yj , zk ) in jedem Quader (z.B. im Quadermittelpunkt)
multipliziert mit dem Volumen ∆V über alle kleinen Quader:
f (xi , yj , zk )∆x∆y∆z.
(4.171)
i
j
k
Wenn wir den Grenzwert ∆x → 0, ∆y → 0 und ∆z → 0 bilden, erhalten wir das Dreifachintegral
von f (x, y, z) über den Bereich B:
%%%
f (x, y, z)dxdydz.
(4.172)
I=
B
Das infinitesimale Volumen dV nennt man das Volumselement. Oft schreiben wir auch
%%%
I=
f (x, y, z)dV
(4.173)
B
oder noch kürzer
%
I=
f (x, y, z)dV.
(4.174)
B
Für das 3d-Integral haben wir keine anschauliche Interpretation als Fläche oder Volumen, da wir
dazu in den 4d-Raum ausweichen müssten. Analog zum Doppel- und Dreifachintegral lassen sich
auch in beliebig hochdimensionalen Räumen Volumsintegrale bilden.
Beispiel:
Wir betrachten einen Körper mit einer inhomogenen Dichteverteilung, der also an unterschiedlichen Stellen unterschiedlich dicht ist. Denken Sie beispielsweise an den Planeten Erde, der einen
metallischen Kern mit hoher Dichte besitzt, der von mineralischen Schichten mit niedrigerer Dichte
umgeben ist. Die Dichteverteilung im Körper sei ρ(x, y, z), wobei die Dichte definiert ist als die
Masse pro Volumen:
ρ(x, y, z) =
dm(x, y, z)
.
dV
(4.175)
Wir wollen nun die Gesamtmasse dieses Körpers berechnen. Dazu addieren wir die Massen aller
infinitesimaler Volumselemente im Körper. Die Masse dm(x, y, z) des Volumselementes dV im
118
4 Integration
Punkt (x, y, z) ist gegeben durch:
dm(x, y, z) = ρ(x, y, z)dV.
(4.176)
Durch Summation (Integration) über alle Volumselemente erhalten wir die Gesamtmasse des
Körpers:
%%%
ρ(x, y, z)dxdydz,
(4.177)
M=
B
wobei B der Bereich ist, der vom Körper ausgefüllt wird.
4.11.2
Berechnung von Dreifachintegralen
Abbildung 4.34: Der Integrationsbereich B wird durch die Flächen ψ1 (x, y) und ψ2 (x, y) begrenzt.
Die Projektion des Bereiches B in die xy-Ebene wird durch die Kurven ϕ1 (x) und ϕ2 (x) begrenzt.
Durch zum zweidimensionalen Fall analoge Überlegungen lässt sich auch das Volumsintegral auf
die Hintereinanderausführung von einfachen Integralen zurückführen (siehe Abb. 4.34). Dazu
bezeichnen wir die beiden Begrenzungskurven der Projektion des räumlichen Bereiches B in die
xy-Ebene mit y = ϕ1 (x) und y = ϕ2 (x). Die Grenzen in x-Richtung bezeichnen wir mit x1 und
x2 und die beiden Begrenzungsflächen des räumlichen Bereichs mit z = ψ1 (x, y) und z = ψ2 (x, y).
Dann kann das Dreifachintegral ausgedrückt werden als



ϕ%2 (x)
ψ2%(x,y)
%
%%%



f (x, y, z)dxdydz = dx 
dy 
dzf (x, y, z) .
(4.178)
B
ϕ1 (x)
ψ1 (x,y)
Eine andere Integrationsreihenfolge mit passend geänderten Integrationsgrenzen ist natürlich möglich.
Beispiel:
Wir berechnen als Beispiel das Volumen eines Ellipsoids mit Halbachsen a, b und c (siehe Abb.
4.35). Das Volumen können wir berechnen, indem wir die Funktion f (x, y, z) = 1 über das Ellipsoid
integrieren:
%%%
V =
1 dxdydz,
(4.179)
wobei das Integrationsvolumen durch die Gleichung
x 2 y 2 z 2
+
+
≤1
a
b
c
(4.180)
4 Integration
119
Abbildung 4.35: Ein Ellipsoid, dessen Achsen entlang der Koordinatenachsen verlaufen.
gegeben ist. Das Volumen erhalten wir hier also einfach durch Summation aller Volumselemente,
die sich im Inneren des Ellipsoids befinden.
Die Begrenzungskurve der Projektion des Integrationsbereichs in die xy-Ebene ist für das Ellipsoid
gegeben durch
x2
y2
+ 2 =1
2
a
b
und wird infolgedessen durch die beiden Funktionen
"
x2
ϕ1 (x) = −b 1 − 2
und
a
(4.181)
"
ϕ2 (x) = b
1−
x2
a2
(4.182)
beschrieben. Die Begrenzungsflächen im Raum folgen aus der Gleichung
y2
z2
x2
+ 2 + 2 =1
2
a
b
c
(4.183)
und werden durch die Funktionen
"
ψ1 (x, y) = −c
"
x2
y2
1− 2 − 2
a
b
und
1−
ψ2 (x, y) = c
x2
y2
−
a2
b2
(4.184)
beschrieben. In der x-Richtung wir das Ellipsoid durch die beiden Punkte
x1 = −a
x2 = a
(4.185)
begrenzt. Wir können nun die Integrale hintereinander ausführen, wobei wir mit dem Integral über
die Integrationsvariable z beginnen. Für das Integral über z erhalten wir mit den beiden obigen
Begrenzungsflächen:
"
ψ2%(x,y)
1dz = ψ2 (x, y) − ψ1 (x, y) = 2c
1−
x2
y2
−
.
a2
b2
(4.186)
ψ1 (x,y)
Als nächstes führen wir die Integration
ϕ%2 (x)
"
2c 1 −
x2
y2
− 2 dy
2
a
b
(4.187)
ϕ1 (x)
über die Variable y durch. Um dieses Integral zu berechnen, führen wir zur Abkürzung den Ausdruck A2 = 1 − x2 /a2 ein und führen die Substitution u = y/b durch. Somit ergibt sich wegen
dy = bdu:
% "
% u
x2
y2
u 2
bA2
arcsin ,
(4.188)
1 − 2 − 2 dy =
A2 − u2 bdu = b
A − u2 +
a
b
2
2
A
120
4 Integration
&√
wobei wir das Integral
A2 − u2 in der Formelsammlung nachgeschlagen haben. Einsetzen gefolgt
von einigen algebraischen Umformungen ergibt
ϕ%2 (x))
1−
x2
a2
−
y2
dy =
b2
ϕ1 (x)
)
y
x2 b
x2
y2
by
arcsin b
=
1− 2 − 2 + 1− 2
a
b
a
2
2b
1−
"
x2
=b 1− 2
a
q
!y=b
!
!
!
x2 !
2
1− x
a2
q
x2
a2 y=−b 1− a2
)
x2 b
x2
x2
[arcsin(1) − arcsin(−1)] . (4.189)
1− 2 − 1− 2 + 1− 2
a
a
a
2
=0
Durch Auswerten der Arkussinusfunktion an den Stellen −1 und +1 erhalten wir schließlich:
ϕ%2 (x))
1−
x2
a2
−
y2
dy =
b2
x2 bπ
.
1− 2
a
2
(4.190)
ϕ1 (x)
Um das Volumen V zu berechnen, müssen wir noch die Integration über x durchführen. Da x als
einfaches Quadrat im Integranden vorkommt, verursacht dies keine Schwierigkeiten:
!a
%a bπ
x2
x3 !
x2
=
2c
1 − 2 dx = cbπ x − 2 !!
1 − 2 dx = cbπ
2
a
a
3a
−a
−a
−a
3
2a
2a
6−2
.
= cbπ 2a − 2 = cbπ 2a −
= acbπ
3a
3
3
%a
V
(4.191)
Das Volumen des Ellipsoids ist also
V =
4.11.3
4
πacb.
3
(4.192)
Dreifachintegrale in Zylinder- und Kugelkoordinaten
In manchen Fällen kann es auch vorteilhaft sein, Volumsintegrale in Zylinderkoordinaten oder in
Kugelkoordinaten zu berechnen. In Zylinderkoordinaten müssen wir beachten, dass das Volumselement wie folgt transformiert (anschaulich ergibt sich dies aus zum Doppelintegral analogen Überlegungen):
dxdydz = ρdρdϕdz.
Somit ist das Integral gegeben durch
%%%
%%%
f (x, y, z)dxdydz =
B
f (ρ cos ϕ, ρ sin ϕ, z)ρdρdϕdz,
B
wobei B das in Zylinderkoordinaten ausgedrückte Integrationsgebiet ist.
(4.193)
(4.194)
4 Integration
121
Beispiel: Volumen eines Zylinders
Wir berechnen das Volumen eines Zylinders mit Radius r und Höhe h als Integral V =
das Innere des Zylinders:
% r % h % 2π
V =
ρdϕdzdρ
0
%
0
r
%
=
&
dV über
0
h
2πρdhdρ
0
%
0
r
2πhρdρ = 2πh
=
0
r2
= πr2 h.
2
(4.195)
In Kugelkoordinaten ist das Volumselement:
dV = dxdydz = r2 dr sin ϑdϑdϕ,
was man sich geometrisch leicht klarmachen kann. Das Integral wird zu
%%%
%%%
f (x, y, z)dxdydz =
f (r sin ϑ cos ϕ, r sin ϑ cos ϕ, r cos ϑ)r2 dr sin ϑdϑdϕ,
B
(4.196)
(4.197)
B
wobei B das in Kugelkoordinaten definierte Integrationsgebiet ist.
Beispiel: Schwerpunkt einer Halbkugel
Zu bestimmen ist der Schwerpunkt einer homogenen Halbkugel mit Radius R. Im Allgemeinen ist
der Schwerpunkt eines Körpers mit homogener Dichte gegeben durch
%
1
rdV.
(4.198)
rS =
V V
Wir legen die Halbkugel so in ein kartesisches Koordinatensystem, dass die Schnittfläche in der
xy-Ebene liegt und sich die Halbkugel auf der Seite der positiven z-Achse befindet. Aus Symmetriegründen muss der Schwerpunkt auf der z-Achse liegen, d. h. xS = 0 und yS = 0. Zu berechnen
bleibt die z-Komponente des Schwerpunktes. In Kugelkoordinaten haben wir:
%
1
zdV
zS =
V V
%
% %
1 R π/2 2π
=
(r cos ϑ)r2 sin ϑdϕdϑdr
V 0 0
0
% %
2π R π/2 3
=
r cos ϑ sin ϑdϑdr
V 0 0
%
2π 1 R 3
=
r dr
V 2 0
π R4
6π R4
3
=
=
= R,
(4.199)
V 4
4πR3 4
8
wobei wir verwendet haben, dass das Volumen der Halbkugel 4πR3 /6 ist.
4.12
Integration von vektorwertigen Funktionen
Betrachten wir eine vektorwertige Funktion A(t)
einer skalaren Variablen t, z.B. die Geschwindigkeit v (t) eines Teilchens. Wir können nun ein Integral über diese Funktion definieren, indem wir
122
4 Integration
ein Intervall [ta , tb ] in die Teilintervalle [ti , ti+1 ] zerlegen und die Summe
N
i )∆ti
A(t
(4.200)
i=1
bilden. Hier besteht A(t)
aus drei Komponenten A(t)
= (Ax (t), Ay (t), Az (t)). Da die Summe von
Vektoren komponentenweise durchgeführt wird, haben wir

 (t
)∆t
A
N
x
i
i

i )∆ti = 
A(t
(4.201)

Ay (ti )∆ti  .
i=1
Az (ti )∆ti
Im Grenzfall einer unendlich feinen Intervallzerlegung erhalten wir das Integral

 &
%
Ax (t)dt

 &
A(t)dt
=  Ay (t)dt  .
&
Az (t)dt
(4.202)
Das heißt, das Integral über eine vektorwertige Funktion einer skalaren Variablen ist ein Vektor,
dessen Komponenten die Integrale der Komponentenfunktionen Ax (t), Ay (t) und Az (t) sind.
Beispiel:
Das Integral der vektorwertigen Funktion


t + t2

=
A(t)
 e−6t 
1
(4.203)
sei über das Intervall [0, 1] zu berechnen. Wir führen die Integration über t komponentenweise
durch:


&1
 2
!1 
2
t
t3 !
 (t + t )dt 


+
5
  2
 0
3 !0 
% 1
 
 &1
6


! = 1
−6 
A(t)dt
= 
(4.204)
1 −6t !1 
e−6t dt  = 
  6 (1 − e )  .

−
e
 
 0
6
0 
0


1
&1


1
t|0
1 dt
0
Beispiel:
Ein zum Zeitpunkt t = 0 ruhendes Objekt erfährt eine zeitlich veränderliche Beschleunigung a(t).
Die Geschwindigkeit zum Zeitpunkt t ist dann gegeben durch:
% t
v (t) =
a(s)ds
(4.205)
0
Teil II
Einführung in die Physikalischen
Rechenmethoden II
123
Kapitel 5
Die Taylorreihe
In der Physik ist es oft zweckmäßig, Funktionen als so genannte Potenzreihen auszudrücken, zum
Beispiel:
sin x = x −
x5
x7
x3
+
−
− ···
3!
5!
7!
(5.1)
In den folgenden Abschnitten werden wir lernen, wie man dies auf eine systematische Weise tun
kann.
5.1
Folgen und Reihen
Um den Begriff der Reihe einzuführen, müssen wir uns zunächst mit Folgen auseinander setzen. Eine Folge ist eine Funktion, die als Definitionsbereich die natürlichen Zahlen besitzt. Diese
Funktion ordnet jeder natürlichen Zahl n (dem Index) einen Funktionswert an zu. Die einzelnen
Funktionswerte an werden die Glieder der Folge genannt. Für die Gesamtheit der Folgenglieder
a1 , a2 , a3 , · · · schreiben wir oft auch {an } und verwenden den Begriff Folge auch, um diese Menge
zu bezeichnen.
Beispiel:
Die Folge an = 1/n hat die Glieder a1 = 1, a2 = 1/2, a3 = 1/3 und so weiter. Die Folge an = (−1)n n
besteht aus den Zahlen a1 = −1, a2 = 2, a3 = −3, a4 = 4, usw.
Wenn wir bei der Zahlenfolge an = 1/n die Zahl n unbegrenzt wachsen lassen, strebt 1/n gegen
Null. Man nennt dies den Grenzwert der Folge an = 1/n für n → ∞. Im Allgemeinen strebt die
Zahlenfolge an gegen einen Grenzwert a, wenn für jede positive (und beliebig kleine) Zahl ε eine
Zahl nε existiert, sodass |an − a| < ε für n > nε . Das heißt, dass sich die Folge an beliebig genau
der Zahl a nähert, wenn wir n gegen unendlich gehen lassen. Wir schreiben dafür
a = lim an .
n→∞
(5.2)
Man sagt auch: die Zahlenfolge an konvergiert gegen a. Eine Zahlenfolge, die keinen Grenzwert besitzt, heißt divergent. Zum Beispiel konvergiert die Zahlenfolge an = 1 + 1/n gegen 1:
limn→∞ (1 + 1/n) = 1. Die Zahlenfolge an = n2 wächst mit zunehmendem n unbegrenzt. Diese
Folge ist divergent.
Reihen können als spezielle Folgen aufgefasst werden. Für eine gegebene Zahlenfolge {an } defi125
126
5 Die Taylorreihe
nieren wir die m-te Partialsumme als
a1 + a2 + a3 + · · · + am =
m
a i = sm .
(5.3)
i=1
Die Folge {sm } der Partialsummen bezeichnet man als Reihe. Falls der Grenzwert
S = lim sm = lim
m→∞
m→∞
m
ai
(5.4)
i=1
der Folge der Partialsummen existiert, sagt man die Reihe konvergiert. Man nennt S dann die
Summe der Reihe oder auch den Wert der Reihe.
Beispiel:
Gegeben sei die Zahlenfolge
1 1 1
1
1, , , , · · · , , · · · .
2 3 4
n
(5.5)
Die Partialsummen dieser Folge sind:
s1
=
s2
=
s3
=
s4
=
···
sn
1,
(5.6)
1
1+ ,
2
1
1+ +
2
1
1+ +
2
(5.7)
1
,
3
1 1
+ ,
3 4
1
1 1 1
= 1 + + + + ···+ ,
2 3 4
n
···
(5.8)
(5.9)
(5.10)
Beispiel: Die geometrische Reihe
Bei der geometrischen Reihe ergibt sich jeder Summand aus dem vorhergehenden durch Multiplikation mit einem (reellen) Faktor q:
a + aq + aq 2 + · · · + aq n + · · ·
(5.11)
Wir wollen zunächst die m-te Partialsumme
sm =
m
aq i
(5.12)
i=0
der ersten m + 1 Glieder berechnen (wir zählen hier zur Abwechslung von 0 weg). Dazu multiplizieren wir die Reihe mit q und subtrahieren dann davon die ursprüngliche Reihe:
sm q
=
−sm
=
sm (q − 1) =
aq + aq 2 + aq 3 + · · · + aq m + aq m+1
(5.13)
−a − aq − aq 2 − aq 3 − · · · − aq m
(5.14)
−a + 0 + 0 + 0 + · · · + 0 + aq m+1 .
(5.15)
Daraus folgt
sm
=
a(q m+1 − 1)
.
q−1
(5.16)
5 Die Taylorreihe
127
Wir können nun auch den Wert der geometrischen Reihe für unendlich viele Summenglieder betrachten:
s = lim a
m→∞
q m+1 − 1
.
q−1
(5.17)
Falls |q| > 1, wächst q m+1 über alle Grenzen und damit auch s. Die Reihe konvergiert in diesem
Fall also nicht. Falls aber |q| < 1, verschwindet q m+1 im Limes m → ∞ und wir erhalten
s=a
a
0−1
=
.
q−1
1−q
(5.18)
Für |q| < 1 ist die geometrische Reihe also konvergent. Zum Beispiel gilt:
1+
5.2
1 1 1
1
+ + + ··· =
2 4 8
1−
1
2
= 2.
(5.19)
Entwicklung einer Funktion in eine Taylorreihe
Wir haben gerade gesehen, dass für −1 < x < 1 gilt
1 + x + x2 + x3 + · · · =
1
.
1−x
(5.20)
(Wir haben in der Summenformel für die geometrische Reihe einfach q in x umbenannt.) Wir
betrachten nun beide Seiten dieser Gleichung als Funktion von x und erkennen, dass man die
1
im Bereich −1 < x < 1 als eine unendliche Summe von Potenzen von x schreiben
Funktion 1−x
kann. Die Reihe 1 + x + x2 + x3 + . . . ist ein Beispiel für eine Potenzreihe. Im Allgemeinen hat eine
unendliche Potenzreihe die Form
a0 + a1 x + a2 x2 + a3 x3 + · · · =
∞
an xn .
(5.21)
n=0
1
Es stellt sich natürlich sofort die Frage, ob neben 1−x
auch andere Funktionen als unendliche
Potenzreihe dargestellt werden können und, wenn ja, wie die zugehörigen Koeffizienten ai auf
systematische Art und Weise ermittelt werden können. Die Antwort auf diese Frage liegt im Begriff
der Taylorreihe, die wir in diesem Abschnitt besprechen wollen.
Wir machen zunächst die Annahme, dass eine bestimmte Funktion f (x) als Potenzreihe mit reellem
Koeffizienten an dargestellt werden kann
f (x) =
∞
an xn = a0 + a1 x + a2 x2 + a3 x3 + · · · .
(5.22)
n=0
Eine solche Darstellung nennen wir auch die Potenzreihenentwicklung von f (x) und sagen,
dass die Funktion f (x) in eine Potenzreihe entwickelt wurde. Wir müssen nun für die Funktion
f (x) die passenden Koeffizienten ermitteln. Dies können wir tun, indem wir verlangen, dass die
Funktion f (x) und alle ihre Ableitungen mit der Reihe beziehungsweise mit allen ihren Ableitungen
übereinstimmen. Wenn die Darstellung aus Gleichung (5.22) möglich ist, muss das an jeder Stelle
x gelten und somit auch für x = 0. Für die Funktion selbst folgt daraus
f (0) = a0 + a1 0 + a2 0 + · · · = a0 ,
(5.23)
weil alle Terme, die ein x enthalten, wegen x = 0 verschwinden. Ableiten beider Seiten von Gleichung (5.22) nach x liefert
f (x) = a1 + 2a2 x + 3a3 x2 + 4a4 x3 + · · · ,
(5.24)
128
5 Die Taylorreihe
wobei wir die Reihe auf der rechten Seite Glied für Glied differenziert haben. An der Stelle x = 0
gilt infolgedessen:
f (0) = a1 ,
(5.25)
da wieder alle Terme, die ein x enthalten, verschwinden. Durch nochmaliges Ableiten erhalten wir
f (x) = 2a2 + 2 · 3a3 x + 3 · 4a4 x2 · · ·
(5.26)
und somit
f (0) = 2a2
oder a2 =
f (0)
.
2
(5.27)
Ganz analog finden wir durch weiteres Differenzieren und Auswertung bei x = 0:
f (0)
= a3 ,
2·3
f (0)
= a4 ,
4·3·2
usw.
(5.28)
Für den Koeffizienten an erhalten wir aus der Forderung nach Übereinstimmung der n-ten Ableitung von Funktion und Reihe:
f (n) (0) = n · (n − 1)(n − 2) · · · 2 · 1 · an
(5.29)
oder
an =
f (n) (0)
.
n!
(5.30)
Wir einigen uns darauf, dass 0! = 1 sein soll. Falls die Funktion f (x) also als Potenzreihe dargestellt
werden kann und die Funktion f (x) beliebig oft differenzierbar ist, finden wir durch Einsetzen der
Koeffizienten
f (x) = f (0) +
∞
f (0)
f (x) 2 f (0) 3
f (n) (0) n
x+
x +
x + ··· =
x .
1!
2!
3!
n!
n=0
(5.31)
Diese Potenzreihe ist die so genannte Taylorreihe (oft wird diese Reihe auch MacLaurin-Reihe
genannt).
Beispiel:
Wir wollen die Exponentialfunktion ex in eine Taylorreihe entwickeln. Dazu ermitteln wir zunächst
die Ableitungen:
f (x) = ex ,
f (x) = ex ,
(5.32)
(5.33)
f (x) = ex ,
f (x) = ex ,
..
.
(5.34)
(5.35)
f (n) (x) = ex ,
..
.
(5.36)
An der Stelle x = 0 sind also alle Ableitungen gleich:
f (n) (x = 0) = 1.
(5.37)
Somit ist die Taylorentwicklung von ex gegeben durch:
ex = 1 +
∞
x2
x3
xn
x
+
+
+ ··· =
.
1!
2!
3!
n!
n=0
(5.38)
5 Die Taylorreihe
129
Da die Fakultät n! für jede Zahl x mit n schneller wächst als xn , werden die Reihenglieder immer
kleiner und die Reihe konvergiert. Für x = 1 haben wir zum Beispiel
e=1+1+
1
1 1
+ +
+ · · · = 2, 71828 . . .
2 6 24
(5.39)
Beispiel:
Zur Taylorreihenentwicklung der Funktion sin(x) bestimmen wir zunächst die Ableitungen:
f (x) = sin x,
(5.40)
f (x) = cos x,
f (x) = − sin x,
(5.41)
(5.42)
f (x) = − cos x,
(5.43)
f (x) = sin x,
..
.
(5.44)
An der Stelle x = 0 haben wir also
f (0) = 0;
f (0) = 1;
f (0) = 0;
f (0) = −1,
usw.
(5.45)
Damit wird die Reihe zu
sin x = x −
∞
x5
x7
x3
x2n+1
+
−
+ ··· =
.
(−1)n
3
5!
7!
(2n + 1)!
n=0
(5.46)
Beispiel:
1
Wir wollen nun die Funktion 1−x
taylorentwickeln (obwohl wir die zugehörige Potenzreihe ja bereits
kennen) und bestimmen zunächst die Ableitungen
f (x) = (1 − x)−1 ,
f (x) = (−1)(1 − x)−2 (−1) = (1 − x)−2 ,
(5.47)
(5.48)
f (x) = (−2)(1 − x)−3 (−1) = 2(1 − x)−3 ,
2·3
,
f (x) = 2(−3)(1 − x)−4 (−1) =
(1 − x)4
2·3·4
4!
=
,
f (x) =
5
(1 − x)
(1 − x)5
..
.
n!
(n)
.
f (x) =
(1 − x)n+1
(5.49)
(5.50)
(5.51)
(5.52)
An der Stelle x = 0 haben wir also
f (0) = 1;
f (0) = 1;
f (0) = 2;
f (0) = 3!;
...
f n (0) = n!
(5.53)
Einsetzen ergibt dann wie erwartet
∞
1
= 1 + x + x2 + · · · =
xn .
1−x
n=0
(5.54)
130
5.3
5 Die Taylorreihe
Allgemeine Taylorentwicklung
Bisher haben wir eine Funktion f (x) an der Stelle x = 0 in eine Potenzreihe entwickelt, das heißt,
wir haben die Ableitungen der Funktion an der Stelle x = 0 verwendet, um den Wert der Funktion
an einer anderen Stelle zu ermitteln. Oft ist es jedoch zweckmäßig, eine Funktion an einer von 0
verschiedenen Stelle x0 zu entwickeln. Eine solche Entwicklung hat die Gestalt:
f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . .
(5.55)
Um die Werte der Koeffizienten a0 , a1 , a2 , . . . , usw. zu bestimmen, könnten wir jetzt genauso
vorgehen wie bei der Taylorentwicklung an der Stelle x = 0. Einfacher ist es jedoch, eine Variablentransformation durchzuführen. Wir definieren die Hilfsvariable u als
u = x − x0 .
(5.56)
Diese Variable hat an der Stelle x = x0 den Wert 0. Wir drücken jetzt die Variable x aus als
x = u + x0 und betrachten die Funktion f (x) als eine Funktion der Hilfsvariablen u:
f (x) = f (u + x0 ).
(5.57)
Diese Funktion entwickeln wir in der Variablen u an der Stelle u = 0 in eine Taylorreihe. Dazu
benötigen wir die Ableitung von f (u + x0 ) nach u. Da dx/du = 1, ergibt die Anwendung der
Kettenregel für die erste Ableitung
df dx
df
df
=
=
.
du
dx du
dx
(5.58)
Durch wiederholte Anwendung der Kettenregel erhalten wir ebenso für die n-te Ableitung
dn f
dn f
= n.
n
du
dx
(5.59)
Infolgedessen ist die Taylorentwicklung von f (u + x0 ) an der Stelle u = 0 gegeben durch:
f (u + x0 ) = f (0 + x0 ) + f (0 + x0 )u + f (0 + x0 )
∞
f (n) (0 + x0 )un
u2
+ ··· =
.
2
n!
n=0
(5.60)
Wir transformieren wieder zurück zu x, indem wir u durch x − x0 ersetzen und erhalten
f (x) = f (x0 ) + f (x0 )(x − x0 ) +
∞
f (n) (x0 )
f (x0 )
(x − x0 )2 + · · · =
(x − x0 )n .
2!
n!
n=0
Die Kenntnis der Funktion und aller ihrer Ableitungen an der Stelle x0 versetzt uns also in die
Lage, den Wert der Funktion an einer anderen Stelle x zu bestimmen. Geometrisch entspricht
das Einführen der Hilfsvariablen u = x − x0 einer Transformation (Verschiebung) in ein neues
Koordinatensystem mit Ursprung in x0 (siehe Abb. 5.1).
Beispiel:
Entwicklung der Funktion ex an der Stelle x = 2 ergibt
ex = e2 ex−2 = e2 + e2 (x − 2) +
5.4
∞
(x − 2)n
e2
(x − 2)2 + · · · = e2
.
2!
n!
n=0
(5.61)
Abgebrochene Taylorreihenentwicklung
Der große Nutzen der Taylorreihenentwicklung besteht darin, dass komplizierte Funktionen wie
sin(x) oder exp(x) in eine Summe von einfachen Potenzen verwandelt werden können. Erst eine solche Reihenentwicklung erlaubt es uns, numerische Werte für diese Funktion zu bestimmen.
5 Die Taylorreihe
131
Abbildung 5.1: Die Taylorentwicklung einer Funktion an der Stelle x0 entspricht der Taylorentwicklung der um x0 verschobenen Funktion an der Stelle 0.
(Wenn wir zum Beispiel mit unserem Taschenrechner den Sinus eines bestimmten Winkels berechnen, wird dies mittels einer Reihenentwicklung erledigt.) Allerdings können wir nicht unendlich
viele Glieder einer Taylorreihe auswerten. Das müssen wir aber auch nicht. Bei einer konvergenten
Potenzreihe werden die Beiträge der Reihenglieder mit höheren Potenzen von x zunehmend kleiner
und die Reihe kann nach endlich vielen Gliedern abgebrochen werden. Dabei nimmt man natürlich
einen Fehler in Kauf, der umso kleiner ist, je später die Reihe abgebrochen wird.
Wir gehen von der Potenzreihe
f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . .
(5.62)
aus und brechen sie nach dem Glied mit der n-ten Potenz ab. Wir teilen die Reihenentwicklung
also in zwei Teile ein: in ein Näherungspolynom n-ten Grades,
pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n
(5.63)
und einen Rest
Rn (x) = an+1 (x − x0 )n+1 + · · · =
∞
ai (x − x0 )i .
(5.64)
i=n+1
Das Näherungspolynom pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n ist eine Näherung
n-ter Ordnung der Funktion f (x). Der Rest Rn (x) ist der Fehler, den wir machen, wenn wir die
Reihe nach dem Glied n-ter Ordnung abbrechen und die Funktion durch das Näherungspolynom
ersetzen.
Je mehr Glieder die Entwicklung enthält, umso kleiner wird dieser Fehler. Die Größe des Fehlers
hängt natürlich auch vom Ort x ab. Je näher wir der Entwicklungsstelle x0 sind, umso kleiner ist
(x − x0 ) und umso schneller konvergiert deshalb die Reihe.
Betrachten wir als Beispiel die Taylorentwicklung der Funktion sin x an der Stelle x0 = 0 (siehe
Abb. 5.2):
x5
x7
x3
+
−
+ ...
(5.65)
3!
5!
7!
Wenn wir diese Entwicklung nach dem ersten Glied abbrechen, approximieren wir den Sinus durch
sin x = x −
sin x ≈ x,
(5.66)
132
5 Die Taylorreihe
Abbildung 5.2: Taylorentwicklung der Funktion sin(x) abgebrochen nach dem Term 1. Ordnung,
dem Term 3. Ordnung und dem Term 5. Ordnung.
also durch eine Gerade mit Steigung 1, die durch den Ursprung geht. An der Stelle x = 0 stimmt
unsere lineare Näherung also mit dem Sinus überein und hat an dieser Stelle auch dieselbe Steigung. Für größere x-Werte weicht unsere Näherung jedoch zunehmend von der Funktion sin x
ab.
Wenn wir den nächsten nichtverschwindenden Term der Entwicklung mitnehmen, also sin x durch
sin x ≈ x −
x3
3!
(5.67)
approximieren, dehnen wir den Bereich, in dem die Funktion und ihre Näherung (Approximation)
gut übereinstimmen, etwas aus. Noch etwas größer wird dieser Bereich, wenn wir erst nach dem
Term 5. Ordnung abbrechen:
sin x ≈ x −
x5
x3
+ .
3!
5!
(5.68)
Zusätzliche Glieder dehnen den Übereinstimmungsbereich weiter aus.
Mit Hilfe der Taylorentwicklung können wir nun auch verstehen, warum Schwingungsvorgänge mit
kleiner Amplitude immer auf die Bewegungsgleichung des harmonischen Oszillators führen (siehe
Abb. 5.3). Stellen wir uns dazu ein mechanisches System vor, das sich in seiner stabilen Ruhelage
befindet. Der Einfachheit halber beschränken wir uns hier auf ein eindimensionales System. Eine
analoge Behandlung ist aber auch in höherdimensionalen Systemen möglich. Das heißt, dass keine
Kräfte auf das System wirken und es sich infolgedessen in einem Minimum seiner potentiellen
Energie aufhalten muss.
Wir entwickeln nun die potentielle Energie V (x) an der Stelle des Minimums x0 in eine Taylorreihe
V (x) = V (x0 ) + V (x0 )(x − x0 ) + V (x0 )
(x − x0 )2
(x − x0 )3
+ V (x0 )
+ ···
2!
3!
(5.69)
Da nach Voraussetzung die potentielle Energie an der Stelle x0 ein Minimum besitzt, verschwindet
die erste Ableitung an dieser Stelle. Infolgedessen ist das quadratische Glied der erste Term in der
Entwicklung, der von x abhängt. Für kleine Auslenkungen (x − x0 ) können wir die Taylorreihe
5 Die Taylorreihe
133
Abbildung 5.3: In der Nähe des Potentialenergieminimums lässt sich die potentielle Energie als
quadratische Funktion der Koordinaten betrachten.
nach dem quadratischen Term abbrechen,
(x − x0 )2
.
2!
Damit nähern wir das Potential V (x) also durch eine Parabel an.
V (x) ≈ V (x0 ) + V (x0 )
(5.70)
Die Kraft F , die auf das System wirkt, ergibt sich aus der Ableitung der potentiellen Energie:
dV
V (x0 )
=−
2(x − x0 ) = −V (x0 )(x − x0 ).
dx
2
Die Newtonsche Bewegungsgleichung für unser System ist also
F (x) = −
(5.71)
d2 x
= F (x) = −k(x − x0 ),
(5.72)
dt2
wobei wir die Krümmung des Potentials an der Stelle x0 mit k bezeichnet haben, k = V (x0 ).
m
Wir definieren jetzt die Auslenkung aus der Ruhelage als
u = x − x0 .
Wegen du
dt =
schreiben als:
d(x−x0 )
dt
=
dx
dt
gilt auch
2
d u
dt2
m
=
2
d x
dt2
(5.73)
und wir können die Bewegungsgleichung (5.72)
d2 u
= −ku.
dt2
(5.74)
Das ist genau die Bewegungsgleichung des harmonischen Oszillators (siehe Kapitel 10), bei dem die
Rückstellkraft proportional zur Auslenkung ist. Die Proportionalitätskonstante ist die Krümmung
des Potentials im Minimum. Für größere Auslenkungen aus der Ruhelage kann die Näherung des
Potentials als Parabel jedoch zusammenbrechen. Ist dies der Fall, kann das System nicht mehr als
harmonischer Oszillator beschrieben werden.
5.5
Fehlerabschätzung
Wenn man eine Taylorreihe abbricht, ist damit immer ein gewisser Fehler verbunden. Der Mathematiker Joseph-Louis Lagrange hat bewiesen, dass der Rest Rn der Potenzreihe, also der Fehler,
134
5 Die Taylorreihe
ausgedrückt werden kann als
Rn (x) =
f (n+1) (ξ)
(x − x0 )n+1 .
(n + 1)!
(5.75)
Dies ist das Lagrangesche Restglied.
Hier ist ξ eine Zahl, die zwischen x0 (die Stelle, an der entwickelt wird) und x liegt. Die Zahl ξ
ist jedoch nicht genauer bestimmt: wir wissen nur, dass im Intervall zwischen x0 und x eine Zahl
ξ existiert, sodass Gleichung (5.75) gilt. Um den Fehler abzuschätzen, können wir nun ξ von x0
bis x variieren. An irgendeiner Stelle ξ0 wird das Restglied Rn (x) maximal sein. Wir wissen dann,
dass der tatsächliche Fehler, der durch das Abbrechen der Taylorreihe entsteht, nicht größer sein
kann als dieser maximale Wert.
Die Formel (5.75) für das Lagrangesche Restglied kann auf folgende Weise hergeleitet werden. Der
Wert einer differenzierbaren Funktion f (x) an der Stelle x kann ausgedrückt werden als:
% x
f (x) = f (x0 ) +
f (t)dt.
(5.76)
x0
Durch partielle Integration erhalten wir
%
% x
x
f (t)dt = f (x)(t − x)|x0 −
x
f (t)(t − x)dt
x0
% x
f (t)(x − t)dt.
= f (x)(x − x) − f (x0 )(x0 − x) +
x0
(5.77)
x0
&
&
Hier haben wir die partielle Integrationsregel uv dx = uv − u v dx mit u = f und u = f sowie v = 1 und v = t − x verwendet. Einsetzen in den Ausdruck (5.76) ergibt:
% x
f (x) = f (x0 ) + f (x0 )(x − x0 ) +
f (t)(x − t)dt.
(5.78)
x0
Nochmalige partielle Integration, diesmal mit u = f
v = −(t − x)2 /2, liefert:
f (x) = f (x0 ) + f (x0 )(x − x0 ) + f (x0 )
und u = f sowie v = (x − t) und
(x − x0 )2
+
2
%
x
x0
f (t)
(x − t)2
dt.
2
(5.79)
Nach n-maliger partieller Integration erhalten wir
f (x) =
(x − x0 )2
+ ···
f (x0 ) + f (x0 )(x − x0 ) + f (x0 )
2
%
x
(x − x0 )n
(x − t)n
+f (n) (x0 )
+
dt.
f (n+1) (t)
n!
n!
x0
(5.80)
Dies ist einfach die Taylorentwicklung von f (x) um die Stelle x0 nun aber mit einem expliziten
Ausdruck für das Restglied:
% x
(x − t)n
dt.
(5.81)
f (n+1) (t)
Rn (x) =
n!
x0
Diese Formel für das Restglied war schon Brook Taylor (1685-1731) selbst bekannt.
Lagrange hat gezeigt, wie das Restglied Rn auf einfache Weise abgeschätzt werden kann. Wir
bezeichnen die Stelle, an der die (n + 1)-te Ableitung f (n+1) (x) im Intervall [x0 , x] ein Minimum
einnimmt, mit x1 und die Stelle des Maximums mit x2 . Dann gilt
% x
% x
(x − t)n
(x − t)n
(n+1)
(n+1)
dt ≥ f
dt
(5.82)
f
(t)
(x1 )
n!
n!
x0
x0
5 Die Taylorreihe
135
und
%
x
f
(n+1)
x0
(x − t)n
(t)
dt ≤ f (n+1) (x2 )
n!
%
x
x0
(x − t)n
dt.
n!
Wir können daher das Restglied folgendermaßen beschränken:
% x
% x
(x − t)n
(x − t)n
dt ≤ Rn (x) ≤ f (n+1) (x2 )
dt.
f (n+1) (x1 )
n!
n!
x0
x0
Das Integral
&x
x0
(x−t)n
n!
(5.83)
(5.84)
dt kann ausgeführt werden,
%
x
x0
(x − x0 )n+1
(x − t)n
dt =
,
n!
(n + 1)!
(5.85)
und wir erhalten:
f (n+1) (x1 )
(x − x0 )n+1
(x − x0 )n+1
≤ Rn (x) ≤ f (n+1) (x2 )
.
(n + 1)!
(n + 1)!
(5.86)
Da f (n+1) (x) eine stetige Funktion ist, muss es zwischen x1 und x2 ein ξ geben, sodass
Rn (x) = f (n+1) (ξ)
(x − x0 )n+1
.
(n + 1)!
(5.87)
Das ist das Lagrangesche Restglied. Natürlich ist im allgemeinen Fall der Wert von ξ unbekannt,
aber wir können, wie weiter oben bereits besprochen, nach jenem Wert ξ im Intervall [x, x0 ]suchen,
für welchen der Betrag des Restgliedes maximal wird, und daraus eine obere Schranke für den
Fehler gewinnen.
Beispiel:
Wir entwickeln die Funktion exp(x) an der Stelle x = 0 in eine Taylorreihe und brechen diese nach
dem Term 3. Ordnung ab:
exp(x) = 1 + x +
x3
x2
+
+ R3 (x).
2!
3!
(5.88)
Wie groß ist der Fehler, den wir bei x = 0.5 damit machen? Das Restglied nach Lagrange ist:
R3 (x) =
f (4) (ξ) 4
x .
4!
(5.89)
Die vierte Ableitung von ex ist ex . Das ist eine monoton steigende Funktion, die im Intervall [0, 0.5]
ihren größten Wert bei ξ = 0.5 hat. Infolgedessen gilt für den Fehler
R3 (x) ≤
e0.5 4
x ≈ 0.07x4 .
4!
(5.90)
Der Fehler, der durch Abbrechen nach dem Term 3. Ordnung entsteht, ist also kleiner als 0.07x4 .
Beispiel:
Als weiteres Beispiel für die Anwendung der Taylorreihe betrachten wir noch folgendes Problem:
Zwischen den Orten A und B existiert eine gerade Straßenverbindung der Länge s. Man kann
jedoch auch über C von A nach B gelangen. Punkt C bildet mit den Punkten A und B ein
gleichseitiges Dreieck der Höhe h (siehe Abb. 5.4). Wie lang ist der Weg über C verglichen mit der
direkten Verbindung von A nach B?
136
5 Die Taylorreihe
Abbildung 5.4: Man kann direkt von A nach B gelangen oder über C.
Der Umweg U (also die Differenz der beiden Wege) ist eine Funktion von h:
)

"
2
s 2
2h
s
U =2
= s 1 +
+ h2 −
− 1 .
2
2
s
(5.91)
Für ein kleines Verhältnis h/s können wir diesen Ausdruck durch Taylorreihenentwicklung
der
√
Wurzel sehr vereinfachen. Wir führen die√Variable x = (2h/s)2 ein und entwickeln 1 + x nach x.
Dazu brauchen wir die Ableitungen von 1 + x:
√
1
(5.92)
y = 1 + x = (1 + x) 2 ,
1
1
(5.93)
y = (1 + x)− 2 ,
2 1
1
1
3
3
y = · −
(5.94)
(1 + x)− 2 = − (1 + x)− 2 ,
2
2
4
5
5
3
1
3
y = − · −
(5.95)
(1 + x)− 2 = (1 + x)− 2 .
4
2
8
An der Stelle x = 0 sind die Funktion und ihre Ableitungen:
y = 1,
y =
1
,
2
1
y = − ,
4
y =
3
.
8
(5.96)
Die Taylorreihe ist also gegeben durch:
√
1
1
x3
...
1 + x = 1 + x − x2 +
2
8
16
(5.97)
Wir brechen nun nach dem linearen Term ab und erhalten als Näherung
√
1
1+x≈1+ x
2
(5.98)
und somit
)
1+
2h
s
2
1
≈1+
2
2h
s
2
2
h
=1+2
.
s
(5.99)
Der Umweg U wird infolgedessen zu
2
2h2
h
.
−1 =
U ≈s 1+2
s
s
(5.100)
Dieser Ausdruck gilt für h s und ist viel einfacher als der ursprüngliche Ausdruck. Wir sehen
daraus gleich, dass für kleine h der Umweg U nur sehr langsam (quadratisch) wächst. Für s = 100
km und h = 5 km ergibt sich beispielsweise nur ein Umweg von 0.5 km (für s = 100 km und h = 1
km ist der Umweg U gar nur 0.02 km= 20 m lang).
Kapitel 6
Komplexe Zahlen
Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die Quadratwurzel
einer negativen Zahl ziehen. Für die quadratische Gleichung mit reellen Koeffizienten beispielsweise
ax2 + bx + c = 0,
(6.1)
existieren die reellen Lösungen
√
b2 − 4ac
(6.2)
x1,2 =
2a
nur dann, wenn das Argument der Wurzel nicht negativ ist, das heißt wenn gilt b2 ≥ 4ac. Wir
können den Zahlenraum jedoch so erweitern, dass algebraische Gleichungen wie die quadratische
Gleichung (6.1) immer eine Lösung haben. Diesen erweiterten Raum nennen wir die komplexen
Zahlen und werden sehen, dass dieser Übergang von den reellen zu den komplexen Zahlen dem
Übergang von der Zahlengerade R zu der Zahlenebene R2 = R × R entspricht. Für komplexe
Zahlen lassen sich Rechenoperationen so definieren, dass alle für die Operationen mit reellen Zahlen
geltenden Gesetze in Kraft bleiben. Die reellen Zahlen sind dann als Spezialfall in den komplexen
Zahlen enthalten. Komplexe Zahlen spielen in der gesamten Physik eine äußerst wichtige Rolle
und wir werden uns im Folgenden mit der Definition und den Rechenregeln für komplexe Zahlen
beschäftigen.
−b ±
6.1
Definition und Darstellung
Zur Erweiterung der reellen Zahlen führen wir imaginäre Zahlen ein. Dazu definieren wir die
imaginäre Einheit als die Zahl i, deren Quadrat -1 ergibt:
√
i2 = −1
(oder, mathematisch etwas salopp ausgedrückt, i = −1).
(6.3)
(Die Wurzel aus einer negativen Zahl können wir eigentlich nicht ziehen. Wir tun jetzt aber “so
als ob” und wir werden sehen, dass wir damit sehr weit kommen.) Wir können jetzt formal die
Wurzel aus einer negativen Zahl ziehen, z.B.
√ √
√
√
−5 = 5 · (−1) = 5 · −1 = 5i.
(6.4)
Die Wurzel aus einer negativen reellen Zahl ist eine imaginäre Zahl. Eine imaginäre Zahl setzt
sich aus der imaginären Einheit i und einer reellen Zahl y zusammen:
yi.
(6.5)
Wie die reellen Zahlen lassen sich auch die imaginären Zahlen auf einem Zahlenstrahl darstellen
(siehe Abb. 6.1).
137
138
6 Komplexe Zahlen
Abbildung 6.1: Zahlenstrahl für die imaginären Zahlen.
Höhere Potenzen der imaginären Einheit ergeben imaginäre oder reelle Zahlen:
i2
3
i
i4
i5
=
−1,
(6.6)
=
=
2
i i = −1i = −i,
i2 i2 = −1 · −1 = 1,
(6.7)
(6.8)
=
i4 · i = i,
usw.
(6.9)
Die Zusammensetzung einer reellen Zahl x und einer imaginären Zahl iy (y reell) nennt man eine
komplexe Zahl:
z = x + iy.
(6.10)
Solche komplexen Zahlen ergeben sich bei der Lösung quadratischer Gleichungen. Zum Beispiel
hat die Gleichung
x2 − 4x + 29 = 0
(6.11)
die komplexen Lösungen
x1,2
=
+4 ±
√
√
√
16 − 4 · 29
= 2 ± −25 = 2 ± 5 −1 = 2 ± 5i.
2
(6.12)
Die Darstellungsform z = x + iy bezeichnet man auch als Normalform oder kartesische Darstellung einer komplexen Zahl. In dieser Darstellungsform nennt man
x = (z) den Realteil der komplexen Zahl z und
y = (z) den Imaginärteil.
Gebräuchlich ist auch die Notation x = Re(z) und y = Im(z). Sowohl der Realteil als auch der
Imaginärteil einer komplexen Zahl sind reelle Zahlen (obwohl die Bezeichnung Imaginärteil das
Gegenteil suggeriert).
Abbildung 6.2: Graphische Darstellung einer komplexen Zahl in der Gaußschen Zahlenebene.
Graphisch kann man komplexe Zahlen in der Gaußschen Zahlenebene darstellen (siehe Abb.
6.2). Dabei wird der Realteil (z) der komplexen Zahl z = x + iy auf der x-Achse aufgetragen
6 Komplexe Zahlen
139
und der Imaginärteil (z) auf der y-Achse (genauso wie wir es für die Komponenten eines Vektors
r = (x, y) getan haben). Im Fall der komplexen Zahlen bezeichnen wir die x-Achse als die reelle
Achse und die y-Achse als die imaginäre Achse. Eine komplexe Zahl z entspricht also einem
Punkt P (x, y) und somit einem Ortsvektor r = (x, y) in der Gaußschen Zahlenebene.
Alternativ zur kartesischen Darstellung kann man für komplexe Zahlen auch die so genannte trigonometrische Darstellung verwenden. In dieser Darstellung beschreiben wir die komplexe Zahl
z = x + iy durch den Winkel ϕ zwischen der reellen Achse und dem Ortsvektor r und dem Abstand
des Punktes P (x, y) vom Ursprung der Gaußschen Zahlenebene. Dies entspricht der Darstellung
des Punktes P (x, y) in Polarkoordinaten. Der Abstand von P (x, y) vom Ursprung, oder Betrag
|z| der komplexen Zahl, ergibt sich durch Anwendung des Satzes von Pythagoras:
(6.13)
|z| = x2 + y 2 = 2 (z) + 2 (z).
Für den Winkel ϕ, auch Phasenwinkel oder Argument genannt, gilt:
ϕ = arctan
(z)
y
= arctan
.
x
(z)
(6.14)
Umgekehrt lauten die Transformationsgleichungen von der trigonometrischen zur kartesischen Darstellung:
(z) = x = |z| cos ϕ,
(z) = y = |z| sin ϕ.
(6.15)
(6.16)
Somit kann die komplexe Zahl z auch geschrieben werden als:
z = |z| cos ϕ + i|z| sin ϕ oder z = |z|(cos ϕ + i sin ϕ).
6.2
(6.17)
Rechenregeln für komplexe Zahlen
Die komplexen Zahlen enthalten die reellen Zahlen als einen Spezialfall. Setzen wir nämlich in
der komplexen Zahl z = x + iy den Imaginärteil y gleich 0, erhalten wir die reelle Zahl x und
wir beschränken uns dadurch auf die reelle Achse der Gaußschen Zahlenebene. Die Rechenregeln
für komplexe Zahlen sollten also so definiert sein, dass sie für diesen Spezialfall in die üblichen
Rechenregeln für die reellen Zahlen übergehen. Wie wir im Folgenden sehen werden, lässt sich
dies erreichen, indem man einfach die üblichen algebraischen Rechenregeln anwendet und dabei
beachtet, dass i2 = −1.
Zunächst definieren wir zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 als gleich, wenn
sie sowohl in ihrem Realteil als auch in ihrem Imaginärteil übereinstimmen. Das heißt:
z1 = z2
⇔
(z1 ) = (z2 )
und (z1 ) = (z2 ).
(6.18)
Eine komplexe Zahl z = x + iy ist Null, wenn sowohl ihr Realteil als auch ihr Imaginärteil
verschwinden:
z=0
6.2.1
⇔
(z) = 0
und (z) = 0.
(6.19)
Addition und Subtraktion
Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden addiert bzw. subtrahiert, indem
man ihre reellen und imaginären Anteile jeweils getrennt voneinander addiert bzw. subtrahiert:
z1 + z2 = (x1 + x2 ) + i(y1 + y2 ),
(6.20)
z1 − z2 = (x1 − x2 ) + i(y1 − y2 ).
(6.21)
140
6 Komplexe Zahlen
Abbildung 6.3: Addition der komplexen Zahlen z1 und z2 .
Abbildung 6.4: Subtraktion der komplexen
Zahl z2 von der komplexen Zahl z1 .
Dies entspricht der komponentenweisen Addition bzw. Subtraktion der zugehörigen Vektoren in der
Gaußschen Zahlenebene. Wie aus Abb. 6.3 ersichtlich ist, können wir graphisch die Addition und
Subtraktion von komplexen Zahlen durch passendes Aneinanderhängen der zugehörigen Vektoren
durchführen. Addition und Subtraktion von komplexen Zahlen funktionieren analog zur Addition
und Subtraktion der zugehörigen zweidimensionalen Vektoren.
Beispiel:
(4 + 3i) + (6 − 2i) =
(4 + 6) + (3 + (−2))i = 10 + i,
(6.22)
(4 + 3i) − (6 − 2i) =
(4 − 6) + (3 − (−2))i = −2 + 5i.
(6.23)
Die Addition von komplexen Zahlen ist assoziativ,
z1 + (z2 + z3 ) = (z1 + z2 ) + z3 = z1 + z2 + z3 ,
(6.24)
z1 + z2 = z2 + z1 .
(6.25)
und kommutativ,
Weiters existiert das neutrale Element 0, sodass
z+0=z
(0 = 0 + i0),
(6.26)
und das inverse Element zinv , sodass
z + zinv = 0.
(6.27)
Für die komplexe Zahl z = x + iy ist die inverse komplexe Zahl zinv = −z = −x − iy. Die
Subtraktion z = z1 − z2 kann also aufgefasst werden als die Addition von z1 mit dem inversen
Element der Zahl z2 , z = z1 + (−z2 ).
6.2.2
Multiplikation einer komplexen Zahl mit einer reellen Zahl
Die Multiplikation einer komplexen Zahl z mit einer reellen Zahl a kann als eine wiederholte
Addition aufgefasst werden:
az = a(x + iy) = ax + iay.
(6.28)
6 Komplexe Zahlen
141
Beispiel:
2z = 2(x + iy) = 2x + 2iy.
(6.29)
Diese Operation entspricht also der Multiplikation des entsprechenden Vektors in der Gaußschen
Zahlenebene mit einem Skalar (siehe Abb. 6.5).
Abbildung 6.5: Multiplikation einer komplexen Zahl mit einer reellen Zahl.
6.2.3
Komplex konjugierte Zahl
Für eine komplexe Zahl z = x + iy lässt sich durch Umkehrung des Vorzeichens des Imaginärteils
die komplex konjugierte Zahl z ∗ definieren:
z ∗ = x − iy.
(6.30)
Wir verwenden auch oft die Notation z für die komplex konjugierte Zahl. Graphisch erhält man
die komplex konjugierte Zahl durch Spiegelung des zugehörigen Vektors an der reellen Achse.
Abbildung 6.6: Die komplex konjugierte Zahl z ∗ der komplexen Zahl z erhält man durch Spiegelung
von z an der reellen Achse.
Beispiel:
z
z
∗
=
4 + 3i,
(6.31)
=
4 − 3i.
(6.32)
142
6 Komplexe Zahlen
Wir können den Realteil und den Imaginärteil einer komplexen Zahl mit Hilfe der komplex konjugierten Zahl ausdrücken. Indem wir z ∗ zu z addieren, erhalten wir
z + z ∗ = (x + iy) + (x − iy) = 2x,
(6.33)
woraus folgt
1
(z + z ∗ ).
2
Um den Imaginärteil zu bestimmen, subtrahieren wir z ∗ von z,
x=
z − z ∗ = (x + iy) − (x − iy) = 2iy,
und finden dadurch
y=
1
(z − z ∗ ).
2i
(6.34)
(6.35)
(6.36)
Ferner folgt aus den Rechenregeln für die Addition komplexer Zahlen:
(z1 + z2 )∗ = z1∗ + z2∗ .
6.2.4
(6.37)
Multiplikation
Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden miteinander multipliziert, indem
man die Rechenregeln der Algebra anwendet und dabei beachtet, dass i2 = −1:
z1 z2
=
=
(x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + ix2 y1 + i2 y1 y2
(x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ).
(6.38)
Beispiel:
(4 + 3i)(6 − 2i) = 24 − 8i + 18i − 6i2 = 24 + 6 + (18 − 8)i = 30 + 10i.
(6.39)
Multipliziert man eine komplexe Zahl z mit ihrer komplex konjugierten Zahl z ∗ , erhält man:
zz ∗ = (x + iy)(x − iy) = x2 − (iy)2 = x2 + y 2 = |z|2 .
(6.40)
Der Betrag |z| lässt sich also ausdrücken als
|z| =
√
zz ∗.
(6.41)
Die Multiplikation zweier komplexer Zahlen ist kommutativ,
z1 z2 = z2 z1 ,
(6.42)
z1 (z2 z3 ) = (z1 z2 )z3 = z1 z2 z3 ,
(6.43)
z1 (z2 + z3 ) = z1 z2 + z1 z3 .
(6.44)
assoziativ,
und distributiv,
Weiters gibt es für eine komplexe Zahl z ein neutrales Element 1=1+i0,
z · 1 = z,
(6.45)
6 Komplexe Zahlen
143
und, falls z = 0, ein inverses Element zinv , sodass
z · zinv = 1.
(6.46)
Für das inverse Element der Multiplikation gilt:
zinv =
z∗
1
z∗
= ∗ = 2.
z
zz
|z|
(6.47)
Da für alle komplexen Zahlen z gilt, dass z · 0 = 0, hat 0 kein inverses Element.
Durch Anwendung der Rechenregeln für die Multiplikation von komplexen Zahlen können wir uns
leicht klar machen, dass ferner gilt:
(z1 z2 )∗ = z1∗ z2∗
(6.48)
(z n )∗ = (z ∗ )n .
(6.49)
und somit auch
Dieses Resultat erhalten wir durch n-fache Anwendung von Gleichung (6.48).
6.2.5
Division
Zur Division einer komplexen Zahl z1 = x1 + iy1 durch eine komplexe Zahl z2 = x2 + iy2 erweitern
wir zunächst den Bruch mit der komplex konjugierten Zahl des Nenners:
z1
z1 · z2∗
(x1 + iy1 )(x2 − iy2 )
.
=
=
∗
z2
z2 · z2
(x2 + iy2 )(x2 − iy2 )
(6.50)
Ausmultiplizieren und Zusammenfassen der reellen und imaginären Terme ergibt:
z1
x1 x2 + y1 y2 + i(x2 y1 − x1 y2 )
.
=
z2
(x22 + y22 )
(6.51)
Der Nenner ist jetzt reell und nur der Zähler bleibt komplex. Daher können wir einfach die Regeln
für die Multiplikation einer komplexen Zahl mit einer reellen Zahl anwenden und erhalten:
x1 x2 + y1 y2
y1 x2 − x1 y2
z1
=
+i
.
(6.52)
z2
x22 + y22
x22 + y22
Der Nenner (x22 + y22 ) ist immer eine strikt positive Zahl (x22 + y22 > 0), außer für z2 = 0. In diesem
Fall können wir die Division nicht durchführen.
Beispiel:
(4 + 3i)
(6 − 2i)
(4 + 3i)(6 + 2i)
24 + 8i + 18i − 6
18 + 26i
=
=
(6 − 2i)(6 + 2i)
36 + 4
40
9
13
+ i.
20 20
=
=
(6.53)
Beispiel:
z
=
zinv
=
=
4 + 3i,
1
(4 − 3i)
4 − 3i
1
=
=
=
z
4 + 3i
(4 + 3i)(4 − 3i)
16 + 9
4
3
− i.
25 25
(6.54)
(6.55)
144
6 Komplexe Zahlen
Wir testen jetzt, ob zinv wirklich die zu z inverse komplexe Zahl ist:
3
1 2
1
4
− i =
(4 + 3i)(4 − 3i) =
(4 + 32 )
z · zinv = (4 + 3i)
25 25
25
25
16 + 9
=
= 1.
25
6.3
6.3.1
(6.56)
Die Exponentialform von komplexen Zahlen
Eulersche Formel
Wir haben bis jetzt nur die Grundrechnungsarten für komplexe Zahlen besprochen. Aus diesen
Grundoperationen können wir auch komplexe Funktionen f (z) von komplexen Zahlen konstruieren.
Eine solche Funktion f (z) bildet eine komplexe Zahl z in die komplexe Zahl u = f (z) ab:
f
z−
→ u.
(6.57)
Zum Beispiel können wir durch Hintereinanderausführen der Multiplikation ganzzahlige Potenzen
einer komplexen Zahl bilden:
z 2 = z · z,
z 3 = z · z · z,
..
.
z
n
= z · ·
· · · z .
(6.58)
(6.59)
(6.60)
(6.61)
n-mal
Wie wir im Kapitel 5 gesehen haben, lassen sich für reelle Zahlen ganz allgemeine Funktionen
als so genannte Potenzreihen ausdrücken. Zum Beispiel können wir die Exponentialfunktion ex
ausdrücken als:
ex = 1 + x +
x3
x4
x2
+
+
+ ...,
2!
3!
4!
(6.62)
wobei die so genannte Fakultät n! einer natürlichen Zahl n definiert ist als das Produkt aller
natürlichen Zahlen von 1 bis n:
n! = n(n − 1)(n − 2) . . . 3 · 2 · 1
z.B. 4! = 4 · 3 · 2 · 1 = 24.
(6.63)
Die Potenzreihe in Gleichung (6.62) hat unendlich viele Terme. Weil die Terme immer kleiner
werden, kann die Summe doch gegen den endlichen Wert ex streben. Ähnlich gilt für die beiden
Winkelfunktionen sin(x) und cos(x)
x5
x7
x3
+
−
+ ...,
3!
5!
7!
x2
x4
x6
cos(x) = 1 −
+
−
+ ....
2!
4!
6!
sin(x) = x −
(6.64)
(6.65)
(Probieren Sie das mit Ihrem Taschenrechner aus.) Im Allgemeinen lässt sich jede Funktion f (x)
als eine Potenzreihe ausdrücken
f (x) = a0 + a1 x + a2 x2 + a3 x3 + . . .
(6.66)
und wir haben im Kapitel 5 gesehen, wie wir auf systematische Weise die passenden Koeffizienten
ai ermitteln können.
6 Komplexe Zahlen
145
Die Potenzreihen für die trigonometrischen Funktionen bestehen aus den selben Termen wie die
Exponentialfunktion (jedoch jeweils nicht aus allen). Dies lässt uns schon erahnen, dass es einen
Zusammenhang zwischen der Exponentialfunktion und den trigonometrischen Funktionen geben
muss. Da für komplexe Zahlen ganzzahlige Potenzen, wie wir oben gesehen haben, definiert sind,
können wir versuchen, mit Hilfe der Potenzreihe (6.62) die Exponentialfunktion für komplexe
Zahlen zu erweitern. Betrachten wir zunächst was passiert, wenn wir in (6.62) die reelle Zahl x
durch eine imaginäre Zahl iϕ ersetzen (ϕ ist dabei reell):
eiϕ
=
1 + (iϕ) +
(iϕ)3
(iϕ)4
(iϕ)5
(iϕ)6
(iϕ)2
+
+
+
+
...
2!
3!
4!
5!
6!
(6.67)
Durch explizite Berechnung der Potenzen der imaginären Einheit erhalten wir:
eiϕ
=
1 + iϕ −
iϕ3
ϕ4
iϕ5
ϕ6
ϕ2
−
+
+
−
...
2!
3!
4!
5!
6!
Zusammenfassung der reellen und imaginären Terme ergibt:
ϕ4
ϕ6
ϕ5
ϕ7
ϕ2
ϕ3
eiϕ = 1 −
+
−
+ ... +i ϕ −
+
−
+ ... .
2!
4!
6!
3!
5!
7!
=cos ϕ
(6.68)
(6.69)
=sin ϕ
Durch Vergleich mit den Potenzreihen für sin(x) und cos(x) mit reellem Argument erhalten wir:
eiϕ = cos ϕ + i sin ϕ.
(6.70)
Das ist die berühmte Eulersche Formel. Für den Spezialfall ϕ = π erhalten wir die schöne Formel
eiπ + 1 = 0,
(6.71)
welche die wichtigen Zahlen e, i, π, 1 und 0 miteinander verknüpft. Eine weitere interessante Beziehung ist:
2
π i
π
= (eiπ/2 )i = ei π/2 = e−π/2 .
(6.72)
ii = (0 + i)i = cos + i sin
2
2
Leonhard Euler hat dies in einem Brief an Goldbach
(1746) folgendermaßen kommentiert: “Letztens
√ √−1
habe gefunden, dass diese expressio −1
einen valorem realem habe, welche in fractionibus
decimalibus=0.2078795763, welches mir merkwürdig zu seyn scheinet.”
Ein alternativer Beweis der Eulerschen Formel lässt sich mit Hilfe eines komplexen Integrals
konstruieren, wobei wir hier nur die Idee grob skizzieren. Wir betrachten dazu die komplexe Zahl
z = cos ϑ + i sin ϑ,
(6.73)
welche einen Betrag von 1 besitzt, |z| = 1. Das Differential dieser Zahl ist:
dz
=
(− sin ϑdϑ + i cos ϑdϑ) = (− sin ϑ + i cos ϑ)dϑ
=
i(cos ϑ + i sin ϑ)dϑ = izdϑ,
(6.74)
dz
z
(6.75)
sodass wir erhalten:
=
idϑ.
Integration auf beiden Seiten liefert (wir lösen hier eigentlich eine Differentialgleichung):
ln z = iϑ
(6.76)
z = eiϑ = cos ϑ + i sin ϑ.
(6.77)
und somit
146
6.3.2
6 Komplexe Zahlen
Polardarstellung von komplexen Zahlen
Die Eulersche Formel ermöglicht die so genannte Polardarstellung der komplexen Zahlen. Wie
wir weiter oben gesehen haben (siehe Gleichung (6.17)), kann eine komplexe Zahl dargestellt werden
als
z = |z|(cos ϕ + i sin ϕ).
(6.78)
Unter Verwendung der Eulerschen Formel ergibt sich daraus
z = |z|eiϕ .
(6.79)
Das ist die Polardarstellung der komplexen Zahl z. In dieser Darstellung ist die komplex konjugierte
Zahl einfach gegeben durch:
z ∗ = |z|e−iϕ .
(6.80)
Abbildung 6.7: Multiplikation zweier komplexer Zahlen in der Polardarstellung.
In der Polardarstellung können wir durch Rechenregeln für die Exponentialfunktion die Multiplikation und Division von komplexen Zahlen stark vereinfachen:
z1 z2 = (|z1 |eiϕ1 )(|z2 |eiϕ2 ) = |z1 ||z2 |ei(ϕ1 +ϕ2 ) .
(6.81)
Anschaulich bedeutet das, dass man zwei komplexe Zahlen miteinander multipliziert, indem man
die zugehörigen Winkel ϕ1 und ϕ2 addiert und die Beträge |z1 | und |z2 | miteinander multipliziert
(siehe Abb. 6.7). Das heißt, die Multiplikation von z1 mit z2 ist eine Drehstreckung: der Winkel ϕ1
wird um den Winkel ϕ2 weitergedreht und der Betrag |z1 | wird um den Faktor |z2 | gestreckt.
Für die Division gilt:
z1
|z1 | i(ϕ1 −ϕ2 )
e
=
.
z2
|z2 |
(6.82)
Der Kehrwert von z ist also gegeben durch
1
1 −iϕ
=
e .
z
|z|
(6.83)
6 Komplexe Zahlen
6.3.3
147
Umkehrung der Eulerschen Formel
Wir wollen nun die trigonometrischen Funktionen durch die Exponentialfunktion ausdrücken. Wenn
wir ϕ durch −ϕ ersetzen, erhalten wir die zu eiϕ konjugierte komplexe Zahl:
∗
e−iϕ = cos(−ϕ) + i sin(−ϕ) = cos ϕ − i sin ϕ = eiϕ .
(6.84)
Durch Addition der Eulerschen Formel für eiϕ und für die komplex konjugierte Zahl e−iϕ erhalten
wir:
eiϕ
e
−iϕ
eiϕ + e−iϕ
=
cos ϕ + i sin ϕ
(6.85)
=
cos ϕ − i sin ϕ
(6.86)
=
2 cos ϕ,
(6.87)
eiϕ + e−iϕ
.
2
(6.88)
woraus folgt
cos ϕ =
Subtrahieren wir hingegen e−iϕ von eiϕ erhalten wir:
eiϕ
−e
−iϕ
eiϕ − e−iϕ
=
cos ϕ + i sin ϕ
(6.89)
=
− cos ϕ + i sin ϕ
(6.90)
=
2i sin ϕ,
(6.91)
woraus sich
sin ϕ =
eiϕ − e−iϕ
2i
(6.92)
ergibt. Vergleich der Gleichungen (6.88) und (6.92) mit den Gleichungen (1.96) und (1.95) zeigt
den Zusammenhang zwischen den trigonometrischen und den hyperbolischen Funktionen.
6.3.4
Additionstheoreme für Winkelfunktionen
Die Eulersche Formel können wir auch benutzen, um die Additionstheoreme für die Winkelfunktionen herzuleiten. Aus der Eulerschen Formel folgt:
ei(ϕ1 +ϕ2 ) = cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 ).
(6.93)
Gleichzeitig gilt aber auch:
ei(ϕ1 +ϕ2 )
=
eiϕ1 · eiϕ2 = (cos ϕ1 + i sin ϕ1 ) · (cos ϕ2 + i sin ϕ2 )
=
=
cos ϕ1 cos ϕ2 + i cos ϕ1 sin ϕ2 + i cos ϕ2 sin ϕ1 − sin ϕ1 sin ϕ2
cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 + i(cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 ).
(6.94)
Der Vergleich der Real- und Imaginärteile der beiden obigen Formeln liefert:
cos(ϕ1 + ϕ2 ) =
sin(ϕ1 + ϕ2 ) =
cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 ,
cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 .
(6.95)
(6.96)
Diese beiden Formeln sind die Additionstheoreme für die Sinus- und die Kosinusfunktion. Weitere
Beziehungen kann man durch analoge Berechnungen für Vielfache des Winkels ϕ ableiten.
148
6.3.5
6 Komplexe Zahlen
Komplexe Zahlen als Exponenten
Bisher haben wir nur die rein imaginäre Zahl iϕ als Argument der Exponentialfunktion betrachtet.
Für ein komplexes Argument w = x + iy erhält man
z = ew = e(x+iy) = ex eiy .
(6.97)
z = reiϕ
(6.98)
Der Vergleich mit
zeigt, dass der Realteil x den Betrag |ew | = ex der komplexen Zahl z = ew bestimmt und der
Imaginärteil y den Phasenwinkel ϕ = y.
6.4
Potenzieren und komplexe Wurzeln
In der kartesischen Darstellung können wir Potenzen von komplexen Zahlen einfach durch Ausmultiplizieren berechnen:
z2
=
(x + iy)2 = x2 + 2ixy + (iy)2 = x2 − y 2 + 2ixy,
3
=
(x + iy)3 = x3 + 3ix2 y + 3x(iy)2 + (iy)3 = x3 − 3xy 2 + i(3x2 y − y 3 ).
z
(6.99)
(6.100)
Im Allgemeinen brauchen wir binomische Formeln (oder das Pascalsche Dreieck), um die Koeffizienten zu bestimmen.
Das Pascalsche Dreieck
1
1
1
1
1
1
2
3
4
5
1
1
3
6
10
1
4
10
1
5
1
..
.
n=0
n=1
n=2
n=3
n=4
n=5
..
.
In der polaren Darstellung ist das Potenzieren einfacher:
n
z n = |z|eiϕ = |z|n einϕ ,
(6.101)
(6.102)
oder, in trigonometrischer Schreibweise,
z n = [|z|(cos ϕ + i sin ϕ)]n = |z|n [cos(nϕ) + i sin(nϕ)].
Zur Herleitung der letzten Gleichung haben wir die Tatsache benutzt, dass
iϕ n
e
= einϕ ,
(6.103)
(6.104)
woraus
(cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ)
(6.105)
folgt. Dieses Ergebnis nennt man die Formel von Moivre. Die n-te Potenz einer komplexen Zahl
kann man also bestimmen, indem man den n-fachen Phasenwinkel ϕ nimmt und den Betrag z, der
eine reelle Zahl ist, zur n-ten Potenz nimmt.
6 Komplexe Zahlen
149
Auch die Umkehrung der Potenz, die komplexe Wurzel, lässt sich in der polaren Darstellung
leicht bestimmen:
1
√
iϕ
iϕ
1
1
n
z = z n = |z|eiϕ n = |z| n e n = n |z|e n .
(6.106)
In der trigonometrischen Darstellung haben wir also:
'
ϕ
ϕ(
1
n
|z|(cos ϕ + i sin ϕ) = |z| n cos + i sin
.
n
n
(6.107)
Abbildung 6.8: Wenn wir den zu z gehörigen Vektor um 2π (oder ein Vielfaches davon) drehen,
kehrt der Vektor zu seinem Ausgangspunkt zurück.
Wenn wir jedoch berücksichtigen, dass eine komplexe
Zahl im Phasenwinkel ϕ mit einer Periode 2π
√
periodisch ist, kann man zusätzliche Wurzeln n z konstruieren. Da die trigonometrischen Funktionen sin ϕ und cos ϕ periodisch mit Periode 2π sind, ist dies leicht einzusehen. Zum Phasenwinkel
ϕ einer komplexen Zahl z = |z|eiϕ können wir deswegen ganzzahlige Vielfache von 2π addieren,
ohne die Zahl zu verändern
z = |z|eiϕ = |z|ei(ϕ+k2π)
k = 0, ±1, ±2, . . .
(6.108)
Anschaulich heißt das, dass wir zum Ausgangspunkt zurückkehren, wenn wir den zugehörigen
Ortsvektor um eine (oder mehrere) ganze Umdrehung(en) weiter drehen (siehe Abb. 6.8). Das
heißt aber auch, dass
√
(ϕ+k2π)
1
n
z = n |z|eiϕ = n |z|ei(ϕ+k2π) = |z| n ei n .
(6.109)
Daraus folgt, dass für alle k = 0, ±1, ±2, . . . die Zahl
1
|z| n ei
(ϕ+k2π)
n
iϕ
1
= |z| n e n +
i2πk
n
(6.110)
eine n-te Wurzel von z ist. Wie viele verschiedene gibt es nun von diesen Zahlen? Für k = 0
erhalten wir die Wurzel
1
iϕ
z0 = |z| n e n
(6.111)
und für k = 1 die Wurzel
1
iϕ
z1 = |z| n e n +
Das heißt, der Phasenwinkel von z1 ist um
2π
n
i2π
n
.
(6.112)
größer als der von z0 :
ϕ1 = ϕ0 +
2π
.
n
(6.113)
150
6 Komplexe Zahlen
Wir erhalten also z1 aus z0 , indem wir den zugehörigen Vektor in der Gaußschen Zahlenebene um
ein n-tel von 2π weiter drehen. Die nächste Lösung
1
iϕ
z2 = |z| n e n +
i2·2π
n
(6.114)
hat einen Phasenwinkel, der um 2π/n größer ist als der von z1 . Auf ähnliche Weise erhalten wir
z3 aus z2 . Nachdem wir den Zeiger n-mal um 2π/n weiter gedreht haben, sind wir wieder bei der
ursprünglichen Wurzel z0 angelangt. Es gibt also insgesamt n n-te Wurzeln einer komplexen Zahl
z:
1
ϕ
2π
zk = |z| n ei( n +k n )
k = 0, . . . , n − 1.
(6.115)
Anschaulich liegen diese n-ten Wurzeln in der Gaußschen Zahlenebene auf einem Kreis mit Radius
1
|z| n und bilden ein regelmäßiges n-Eck (siehe Abb. 6.9).
1
Abbildung 6.9: Die n-ten Wurzeln der komplexen Zahl z liegen auf einem Kreis mit Radius |z| n
in der Gaußschen Zahlenebene und bilden ein regelmäßiges n-Eck.
Beispiel:
Wir wollen die Wurzel
√
6
3 − 8i
(6.116)
berechnen. Dazu drücken wir die Zahl z = 3 − 8i zunächst in Polarform aus. Da
√
8
und
ϕ = arctan −
|z| = 32 + 82 = 73
= −1.21,
3
(6.117)
haben wir
z=
√ −i1.21
73e
.
(6.118)
Die komplexen 6-ten Wurzeln von 3 − 8i sind somit die 6 Zahlen
1
zk = 73 12 ei(−1.21+
2π
6 k)
mit
k = 0, 1, . . . , 5.
1
Diese Zahlen bilden ein Sechseck mit Kantenlänge 73 12 in der Gaußschen Zahlenebene.
(6.119)
6 Komplexe Zahlen
151
Beispiel:
Zu berechnen sind die dritten Wurzeln von 1:
√
3
1.
(6.120)
Im Allgemeinen sind die n n-ten Wurzeln der Zahl 1 gegeben durch:
zk = 1eik2π/n ,
(6.121)
wobei k von 0 bis n − 1 läuft. Die drei dritten Wurzeln von 1 sind daher:
6.5
z0
=
z1
=
z2
=
1,
√
3
1
i,
ei2π/3 = − +
2 √2
1
3
i.
ei4π/3 = − −
2
2
(6.122)
(6.123)
(6.124)
Darstellung von Kurven mit komplexen Zahlen
Kurven in der Gaußschen Zahlenebene können durch Gleichungen der Form
f (z) = 0
(6.125)
dargestellt werden. Dabei ist z = x + iy eine komplexe Zahl und f (z) eine Funktion dieser Zahl.
Beispielsweise ist |z| = 1 die Gleichung für einen Kreise mit Radius 1 und Mittelpunkt im Nullpunkt. Die Gleichung |z − 1| = 1 stellt einen Kreis mit Radius 1 dar, dessen Mittelpunkt bei x = 1
auf der reellen Achse liegt.
Ein komplizierteres Beispiel ist die Gleichung für eine Hyperbel in der komplexen Ebene:
||z + 1| − |z − 1|| = 1
(6.126)
Hier ist |z − 1| der Abstand des Punktes (1, 0) von z und |z + 1| ist der Abstand des Punktes
(−1, 0) von z. Die Gleichung (6.126) wird also von allen Punkten erfüllt, für die die Differenz der
Entfernung von den Punkten (1, 0) und (−1, 0) konstant gleich 1 ist. Diese Forderung definiert eine
Hyperbel.
Abbildung 6.10: Durch Verknüpfung der Abstände |z + 1| und |z − 1| lässt sich eine Hyperbel
definieren.
Analytisch folgt dies aus folgender Berechnung: Für z = x + iy ist z − 1 = (x − 1) + iy und
z + 1 = (x + 1) + iy. Somit haben wir
|z + 1| = (x + 1)2 + y 2 und |z − 1| = (x − 1)2 + y 2
(6.127)
152
6 Komplexe Zahlen
und folglich
(x + 1)2 + y 2 − (x − 1)2 + y 2 = ±1.
(6.128)
Umformen und anschließendes Quadrieren liefert
2 2
(x + 1)2 + y 2 = ±1 + (x − 1)2 + y 2
x2 + 2x + 1
2 = 1 ± 2 (x − 1)2 + y 2 + (x2 − 2x + 1) + y
2
+ y
4x − 1
2
16x − 8x + 1
+ 1
16x2
−8x
=
=
12x2 − 4y 2
=
=
4y 2
=
y2
=
y
=
±2 (x − 1)2 + y 2
4((x2 − 2x + 1) + y 2 )
+ 4 + 4y 2
4x2
−8x
3
12x2 − 3
3
3x2 −
" 4
3
± 3x2 − .
4
(6.129)
(6.130)
(6.131)
(6.132)
(6.133)
(6.134)
(6.135)
(6.136)
(6.137)
Dies ist die Gleichung
einer Hyperbel, die sich asymptotisch zwei Geraden durch den Ursprung mit
√
√
Steigungen 3 und − 3 annähert (siehe Abb. 6.11).
Abbildung 6.11: Die Hyperbel y = ± 3x2 − 34 .
Beispiel:
Ein weiteres Beispiel einer mit Hilfe von komplexen Zahlen darstellbare Kurve ist die Ellipse
|z − 1| + |z + 1| = 4.
(6.138)
Kapitel 7
Fehlerrechnung
7.1
Systematische und statistische Fehler
Im Experiment gemessene physikalische Größen sind immer mit einem gewissen Fehler behaftet.
(Um den negativen Beigeschmack des Wortes Fehler zu vermeiden, sprechen wir auch oft von einer
Abweichung oder einer Messabweichung.) Zur Beurteilung von Messwerten ist es sehr wichtig
zu wissen, wie groß diese Fehler sind. Die Abschätzung von Fehlern ist Aufgabe der Fehlerrechnung.
Streng genommen ist die Angabe eines Messwertes ohne Angabe eines Messfehlers sinnlos. Graphisch stellen wir Fehler mit Hilfe von Fehlerbalken dar (siehe Abb. 7.1).
Abbildung 7.1: Graphisch stellen wir Fehler mit Hilfe so genannter Fehlerbalken dar. Die Höhe
des Fehlerbalkens entspricht der erwarteten Größe des Fehlers. In diesem Beispiel wurde für verschiedene Werte von x die Größe y experimentell bestimmt. Somit ist y fehlerbehaftet. Aus den
Messdaten können wir in diesem Beispiel lediglich schließen, dass die wahren Werte von y mit
großer Wahrscheinlichkeit irgendwo innerhalb der Fehlerbalken liegen.
Üblicherweise geben wir Messwerte in der folgenden Form an:
A ± ε.
(7.1)
Hier ist A die im Experiment ermittelte Messgröße und ε ist der zugehörige Messfehler. Die Schreibweise ±ε deutet an, dass die Abweichung ε sowohl positiv als auch negativ sein kann. Zum Beispiel
bedeutet
v = (600 ± 30) m/s,
(7.2)
dass die gemessene Geschwindigkeit von 600 m/s mit einem wahrscheinlichen Fehler von etwa
30 m/s behaftet ist. Das heißt, der wahre Wert der Geschwindigkeit v liegt wahrscheinlich im
153
154
7 Fehlerrechnung
Intervall zwischen 570 m/s und 630 m/s. Was in diesem Zusammenhang “wahrscheinlich” heißt,
werden wir später genauer definieren. Übrigens sind Angaben wie
v = (600.125 ± 30)m/s
(7.3)
nicht sehr sinnvoll, da der Messwert 600.125 mit einer viel höheren Genauigkeit angegeben wird,
als in Anbetracht des Fehlers von ± 30 m/s möglich ist. Üblicherweise sollte die letzte signifikante
Stelle in der Angabe des Messwerts von der Größenordnung des Messfehlers sein.
Fehler müssen auch berücksichtigt werden, wenn wir unterscheiden wollen, ob zwei Größen gleich
sind oder sich unterscheiden. Sind z.B. 71.5 ± 0.5 und 71.9 ± 0.3 gleich oder verschieden? Da
die Fehlerbereiche der beiden Messwerte überlappen, sind die beiden Werte nicht voneinander zu
unterscheiden. Dasselbe gilt für 60±8 und 52±7 . Hingegen sind 2.3751±0.0003 und 2.3758±0.0001
eindeutig voneinander verschieden.
Fehler in den Messwerten können im Wesentlichen zwei Ursachen haben, die eine unterschiedliche
Behandlung erfordern. Man unterscheidet zwischen systematischen und statistischen Fehlern.
Systematische Fehler sind Abweichungen, die durch Fehler in den Messinstrumenten oder im
Messverfahren selbst entstehen, z. B. durch falsche Kalibrierung der Apparatur oder durch Änderung der Messbedingungen während der Messung. Solche Fehler beeinflussen die Messgröße meist
in einer bestimmten Richtung. In Computersimulationen entstehen systematische Fehler oft durch
die Anwendung von Näherungen in den zugrunde liegenden theoretischen Ausdrücken oder durch
Verwendung zu kleiner Systemgrößen. Das Erkennen und Minimieren von systematischen Fehlern
ist ein essentieller Bestandteil eines jeden Experiments.
Statistische Fehler (oder zufällige Fehler) haben ihre Ursache in verschiedenen Störeinflüssen
während der Messung, die nur schwer beeinflusst werden können. Auch wenn systematische Fehler
im Experiment weitgehend eliminiert worden sind, wird die mehrmalige Messung einer bestimmten Größe nicht immer dasselbe Ergebnis liefern. Diese Abweichungen, die wir statistische Fehler
nennen, verändern den Messwert sowohl in negativer als auch in positiver Richtung.
Anschaulich können wir uns den Unterschied zwischen systematischen und statistischen Fehlern
anhand folgender Beispiele klarmachen (siehe Abb. 7.2). Wir stellen uns vor, dass wir in einer
Schießübung mehrmals auf eine Zielscheibe schießen. Dabei kann es zu folgenden Ergebnissen
kommen:
(a) Die Einschüsse liegen eng beisammen, d.h. der statistische Fehler ist klein. Die Punkte liegen
auch alle in der Nähe des Zentrums. Somit ist auch der systematische Fehler klein.
(b) Hier liegen die Punkte eng beisammen, was bedeutet, dass der statistische Fehler klein ist.
Der systematische Fehler ist groß, da die Punkte weit weg vom Zentrum liegen.
(c) Der systematische Fehler ist klein, der statistische Fehler ist groß.
(d) Beide Fehler sind groß.
Im Folgenden wollen wir uns nun hauptsächlich mit statistischen Fehlern beschäftigen. Systematische Fehler, die schwieriger zu erkennen sind, werden wir nur im Zusammenhang mit der
Fehlerfortpflanzung besprechen.
Aufgaben der Fehlerrechnung:
• Wir wollen von den Messergebnissen auf den wahren Wert der gemessenen Größe schließen.
• Wir wollen die Zuverlässigkeit der Messung abschätzen.
7 Fehlerrechnung
155
Abbildung 7.2: (a) statistischer Fehler klein, systematischer Fehler klein; (b) statistischer Fehler
klein, systematischer Fehler groß; (c) statistischer Fehler groß, systematischer Fehler klein; (d)
statistischer Fehler groß, systematischer Fehler groß.
7.2
Mittelwert und Varianz
Stellen wir uns vor, dass wir die Fallbeschleunigung aus einem Fallexperiment ermitteln wollen.
Dazu wird die Fallzeit t einer Kugel mit einer Stoppuhr für eine gewisse Fallstrecke h bestimmt.
Aus h = 12 gt2 können wir dann die Fallbeschleunigung g = 2h
t2 bestimmen.
Abbildung 7.3: In einem Fallexperiment messen wir die Zeit t, die ein im Schwerefeld fallender
Körper benötigt, um die Strecke h zurückzulegen.
Um die Zuverlässigkeit der Messung zu verbessern, wiederholen wir die Messung N mal in Form
einer Messreihe. Die erhaltenen Messwerte xi nennen wir eine Stichprobe aus der Menge aller
möglichen Messungen. Da jede Messung fehlerbehaftet ist, unterscheiden sich die N Messungen
einer Stichprobe. Als beste Schätzung des unbekannten “wahren” Wertes betrachten wir den arith-
156
7 Fehlerrechnung
metischen Mittelwert der N Messwerte xi :
N
1 x=
xi
N i=1
Stichprobe = {x1 , . . . , xN }.
(7.4)
Dieser Definition liegt der Gedanke zugrunde, dass statistische Abweichungen nach oben und unten gleich wahrscheinlich sind und sich im Mittel deshalb ausgleichen. Je größer unsere Stichprobe
ist, umso genauer können wir durch den Mittelwert x den wahren Wert der Messgröße abschätzen.
Wir werden dies später quantitativ untersuchen.
Abbildung 7.4: (a) Kleine Streuung der Daten um den Mittelwert; (b) große Streuung der Daten
um den Mittelwert.
Zusätzlich zum Mittelwert ist es auch nützlich zu wissen, wie stark die Messwerte im Durchschnitt
vom Mittelwert abweichen. Wir könnten nun versuchen, die mittlere Abweichung der Messwerte
vom Mittelwert zu berechnen:
N
N N
1 1 1 (xi − x) =
xi −
x
N i=1
N i=1
N i=1
N
1 N
=
xi − x = 0.
(7.5)
N i=1
N
=x
=x
Dieser Mittelwert verschwindet jedoch, weil sich die positiven und negativen Abweichungen vom
Mittelwert genau kompensieren.
Ein besseres Maß für die statistische Streuung der Messwerte ist die Varianz s2 , bei der statt der
Abweichungen die Abweichungsquadrate summiert werden:
s2 =
N
1 (xi − x)2 .
N i=1
(7.6)
Summe der Abweichungsquadrate
Hier ist der Beitrag jedes Messwertes zur Varianz wegen des Quadrats positiv und es kommt zu
keiner Kompensation der positiven und negativen Abweichungen. Die Varianz s2 ist das mittlere
Abweichungsquadrat der Messwerte xi vom Mittelwert x.
Die Varianz hat die Dimension des Quadrats der Dimension der gemessenen Größe. Um ein Abweichungsmaß mit der gleichen Dimension wie die Messgröße zu erhalten, ziehen wir die Wurzel
aus der Varianz:
,
N
-1 (xi − x)2 .
(7.7)
s=.
N i=1
Man nennt s die Standardabweichung.
7 Fehlerrechnung
157
Wir können uns jetzt die Frage stellen, ob wir nicht einen vom arithmetischen Mittelwert verschiedenen Bezugswert x̃ wählen können, sodass die für diesen Wert definierte Varianz
s2 =
N
1 (xi − x̃)2
N i=1
(7.8)
kleiner wird als die bezüglich des arithmetischen Mittelwerts x.
Um diese Frage zu beantworten, minimieren wir s2 bezüglich x̃, indem wir s2 nach x̃ ableiten und
die Ableitung gleich Null setzen:
1 d(s2 )
!
=
2(xi − x̃)(−1) = 0.
dx̃
N
(7.9)
Daraus folgt
N
(xi − x̃) = 0
⇒
i=1
N
xi =
i=1
N
x̃ = N x̃
(7.10)
i=1
und somit
x̃ =
N
1 xi .
N i=1
(7.11)
Mit anderen Worten bedeutet dies, dass der arithmetische Mittelwert x einer Stichprobe ihre
Varianz und somit auch ihre Standardabweichung minimiert.
7.3
7.3.1
Verteilungen und Histogramme
Grundlagen
Eine Stichprobe bestehend aus N Messwerten einer bestimmten Größe kann als zufällige Auswahl aus der Menge aller möglichen Messwerte betrachtet werden. Diese Menge nennen wir die
Grundgesamtheit. Nun kann es sein, dass nicht alle möglichen Messwerte der Grundgesamtheit
gleich häufig vorkommen. Kleine Abweichungen vom Mittelwert sind im Allgemeinen weitaus häufiger als große. Wir berücksichtigen diese Tatsache, indem wir die Grundgesamtheit statistisch mit
Hilfe von so genannten Wahrscheinlichkeitsverteilungen und Wahrscheinlichkeitsdichten
beschreiben.
Abbildung 7.5: Zur Bestimmung der Häufigkeit unterschiedlicher Messfehler teilen wir das Intervall
[a, b] in kleine Bereiche und zählen, wie viele Messwerte in jedes Intervall fallen.
Dazu verfahren wir folgendermaßen. Stellen wir uns vor, dass wir eine Größe x N mal messen und
dadurch die Messwerte xi erhalten. Wir teilen nun die x-Achse, auf die wir die Messwerte auftragen
können, in M kleine Intervalle (oder Zellen) der Breite ∆x ein und nummerieren die Intervalle mit
dem Index j (siehe Abb. 7.5). Wir nehmen weiters an, dass alle Messwerte xi im Bereich [a, b]
liegen. (Diese Einschränkung kann leicht aufgehoben werden.) Das Intervall j wird von den Werten
a + (j − 1)∆x und a + j∆x begrenzt, wobei a + M ∆x = b.
158
7 Fehlerrechnung
Wir zählen jetzt, wie viele der Messwerte in jedem der Intervalle liegen und bezeichnen die Zahl der
Messwerte im Intervall j mit n(j). Da die Gesamtanzahl der Messungen N ist, muss die Summation
von n(j) über alle Zellen
M
n(j) = N
(7.12)
j=1
ergeben. Wenn wir n(j) graphisch darstellen, erhalten wir ein Histogramm (siehe Abb. 7.6).
Messwerte aus einem Intervall mit großem n(j) kommen häufig vor, solche mit kleinem n(j) weniger
häufig.
Abbildung 7.6: Ein Histogramm erhält man, wenn man die Anzahl n(j) der im Intervall j gezählten
Messwerte graphisch darstellt.
Indem wir die Zahlen n(j) durch die Gesamtzahl N der Messwerte dividieren,
h(j) =
n(j)
,
N
(7.13)
erhalten wir ein normiertes Histogramm mit den Eigenschaften
M
j=1
h(j) =
M
n(j)
j=1
N
=
N
= 1.
N
(7.14)
Die Zahl h(j) entspricht für große N der Wahrscheinlichkeit, dass ein Messwert xi im Intervall j
(also zwischen a + (j − 1)∆x und a + j∆x) liegt.
Im Grenzwert sehr kleiner Intervallgrößen ∆x können wir eine kontinuierliche Funktion f (x), die so
genannte Verteilungsdichte (oder Wahrscheinlichkeitsdichte), definieren, die in diesem Fall
die Rolle des Histogramms übernimmt. Dazu betrachten wir den Grenzübergang
n(x)
,
∆x→0 N →∞ N ∆x
f (x) = lim
lim
(7.15)
wobei n(x) die Anzahl der Messwerte im Intervall [x, x + ∆x] ist. Hier wird durch den Grenzübergang ∆x → 0 das Verhältnis n(x)/N immer kleiner (da das Intervall schrumpft). Da ∆x in der
obigen Gleichung jedoch auch im Nenner auftritt, konvergiert n(x)/N ∆x gegen einen endlichen
Wert. Die Wahrscheinlichkeitsdichte f (x) hat die Dimension [1/x].
Nach dieser Definition ist
df = f (x)dx
(7.16)
7 Fehlerrechnung
159
der infinitesimale Bruchteil der Messungen, die im infinitesimalen Intervall [x, x+dx] liegen. f (x)dx
kann auch als die Wahrscheinlichkeit, einen Messwert im Intervall [x, x+dx] zu finden, interpretiert
werden. Aus der Normierung von h(j) = n(j)/N folgt, dass das Integral über die Wahrscheinlichkeitsdichte gleich 1 ist:
%b
f (x)dx = 1.
(7.17)
a
Dies entspricht der Tatsache, dass ein Messwert irgendwo zwischen a und b liegen muss. Man
bezeichnet die Wahrscheinlichkeitsdichte deshalb als normiert. Im Gegensatz zum Histogramm
ist die Wahrscheinlichkeitsdichte eine kontinuierliche Funktion.
Abbildung 7.7: Die Warscheinlichkeitsdichte f (x) ist eine kontinuierliche Funktion, die die infinitesimale Wahrscheinlichkeit df = f (x)dx angibt, dass ein Messwert im infinitesimalen Intervall
[x, x + dx] liegt.
Natürlich besteht keine Notwendigkeit, uns auf ein endliches Intervall [a, b] zu beschränken und
wir können ohne weiteres den gesamten Zahlenbereich von −∞ bis +∞ betrachten. (Falls die
Wahrscheinlichkeitsdichte f (x) auf ein Intervall [a, b] beschränkt ist, kann sie auf die gesamte
Zahlengerade erweitert werden, indem man
f (x) = 0
für
x < a und x > b
(7.18)
setzt.)
Abbildung 7.8: Die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) dafür, einen Messwert im Intervall [x1 , x2 ]
zu finden, ist gleich der Fläche unter der Wahrscheinlichkeitsdichte f (x) zwischen x1 und x2 (schraffierter Bereich).
Aus der Wahrscheinlichkeitsdichte f (x) können wir die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) be-
160
7 Fehlerrechnung
rechnen, dass sich ein Messwert zwischen zwei beliebigen Grenzen x1 und x2 befindet:
%x2
P (x1 ≤ x ≤ x2 ) =
f (x)dx.
(7.19)
x1
Wenn wir in diesem Ausdruck x1 = −∞ als untere Schranke wählen, erhalten wir die so genannte
Wahrscheinlichkeitsverteilung (oder Wahrscheinlichkeitsfunktion oder Verteilungsfunktion oder Verteilung):
%x
f (u)du.
F (x) =
(7.20)
−∞
F (x) ist die Wahrscheinlichkeit, einen Messwert zu finden, der kleiner oder gleich x ist.
Beispiel:
Die Maxwellsche Verteilung beschreibt die Wahrscheinlichkeitsdichte der Geschwindigkeitskomponenten eines einzelnen Teilchens in einem klassischen Vielteilchensystem mit Temperatur T . Für
die x-Komponente vx der Geschwindigkeit lautet sie
"
2
m
1
e− 2 βmvx
f (vx ) =
β = 1/kB T.
(7.21)
2πkB T
Die Geschwindigkeitskomponenten in y- und in z-Richtung haben identische Wahrscheinlichkeitsdichten. Hier ist kB die nach dem österreichischen Physiker Ludwig Boltzmann (1844-1906) benannte Boltzmannkonstante und β = 1/kB T . Diese Wahrscheinlichkeitsdichte ist normiert, das
heißt
%
(7.22)
f (vx )dvx = 1.
Allgemeine Eigenschaften der Wahrscheinlichkeitsdichte f (x) und der Wahrscheinlichkeitsverteilung F (x) sind:
1. f (x) ≥ 0.
2. f (x) ist normiert, das heißt:
%∞
f (x)dx = 1.
(7.23)
−∞
3. F (x) ist monoton wachsend und eine Stammfunktion von f (x) (siehe Abb. 7.9):
F (x) = f (x).
(7.24)
4. F (−∞) = 0 und F (∞) = 1.
5. Die Wahrscheinlichkeit, dass die Variable x einen Wert im Intervall zwischen a und b annimmt, ist:
%b
P (a ≤ x ≤ b) = F (b) − F (a) =
f (x)dx.
(7.25)
a
(Genau genommen ist F (x) so definiert, dass der Wert a ausgeschlossen und der Wert b
eingeschlossen ist. Für stetige Wahrscheinlichkeitsverteilungen macht dies jedoch keinen Unterschied.)
7 Fehlerrechnung
161
Abbildung 7.9: Die Wahrscheinlichkeitsdichte f (x) ist die erste Ableitung der Wahrscheinlichkeitsverteilung F (x).
7.3.2
Erwartungswert, Momente einer Verteilung
Mittelwert
Der Begriff des Mittelwerts und der Varianz lassen sich auch auf kontinuierliche Verteilungsdichten
f (x) übertragen. Betrachten wir eine Grundgesamtheit, die durch die Verteilung f (x) beschrieben
wird. Wir führen zunächst N mal eine Messung aus und erhalten die Messwerte xi . Der Mittelwert
dieser Messwerte ist
N
1 x=
xi .
N i=1
(7.26)
Wir teilen die x-Achse nun wieder in M kleine Intervalle der Breite ∆x ein und nummerieren diese
Zellen mit dem Index j. Wir zählen die Messwerte in jedem Intervall und bezeichnen diese Zahl
mit n(j). Außerdem bezeichnen wir den Mittelpunkt jeder Zelle mit x(j).
Abbildung 7.10: Bei der Berechnung von Mittelwerten aus einem Histogramm nähern wir jeden
x-Wert im Intervall j durch x(j) an.
Wenn ∆x klein ist, können wir jeden Messwert im Intervall j durch den Wert x(j) annähern. Mit
dieser Näherung können wir die Summe in Gleichung (7.26) über alle Messwerte in eine Summe
über alle M Intervalle (Zellen) umschreiben:
N
M
1 1 x=
xi ≈
n(j)x(j).
N i=1
N j=1
(7.27)
162
7 Fehlerrechnung
Die zweite Summe geht aus der ersten Summe einfach durch Zusammenfassen der Messwerte in
der jeweils gleichen Zelle hervor. Durch Multiplikation mit ∆x und gleichzeitiger Division durch
∆x erhalten wir
x≈
M
n(j)x(j)
N ∆x
j=1
∆x.
(7.28)
Führen wir die Grenzwerte ∆x → 0 und N → ∞ aus, verwandelt sich diese Summe in ein Integral:
%∞
x=
xf (x)dx,
(7.29)
−∞
wobei wir die Definition (7.15) benutzt und den Wertebereich auf −∞ und ∞ ausgedehnt haben.
Für den Mittelwert einer Verteilungsdichte verwenden wir oft den Buchstaben µ, um ihn vom
Mittelwert x einer Stichprobe zu unterscheiden. µ ist der Mittelwert der Grundgesamtheit. (Im
Allgemeinen verwenden wir griechische Buchstaben für Eigenschaften der Grundgesamtheit und
lateinische Buchstaben für Eigenschaften von Stichproben.)
Erwartungswert
Der Mittelwert µ wird auch oft Erwartungswert E(x) von x genannt:
%∞
E(x) =
xf (x)dx = µ.
(7.30)
−∞
Im Allgemeinen ist der Erwartungswert einer Größe g(x), die eine Funktion der Variablen x mit
Verteilungsdichte f (x) ist, gegeben durch:
%∞
E[g(x)] =
g(x)f (x)dx.
(7.31)
−∞
Den Erwartungswert bezeichnen wir oft auch mit spitzen Klammern:
E[g(x)] = g(x).
(7.32)
Aus der Definition des Erwartungswertes folgt, dass der Erwartungswert einer Summe gleich der
Summe der Erwartungswerte ist:
E[g(x) + h(x)] = E[g(x)] + E[h(x)].
(7.33)
Ferner kann eine reelle Zahl α vor den Erwartungswert gezogen werden:
E[αg(x)] = αE[g(x)].
(7.34)
Varianz
Analog zum Mittelwert µ können wir für die Verteilungsdichte f (x) auch eine Varianz definieren:
%∞
(x − µ)2 f (x)dx.
σ2 =
(7.35)
−∞
Wir verwenden oft auch die Schreibweise:
Var(x) = σ 2 .
(7.36)
7 Fehlerrechnung
163
Die Varianz ist die mittlere quadratische Abweichung der Messwerte x vom Mittelwert µ. In anderen
Worten, die Varianz ist der Erwartungswert von (x − µ)2 , also σ 2 = E[(x − µ)2 ]. Die Wurzel aus
der Varianz ist die Standardabweichung σ.
Durch Ausmultiplizieren des Quadrats im Integranden und Verwendung obiger Rechenregeln erhalten wir aus Gleichung (7.35) den Ausdruck
σ2
=
=
=
E[(x − µ)2 ] =
E x2 − 2E(xµ) + µ2
E x2 − 2µ E(x) +µ2
=µ
=
E x2 − µ2 = E x2 − (E(x))2 = x2 − x2 .
(7.37)
Momente
Der hier auftretende Erwartungswert E(x2 ) wird das 2. Moment der Verteilungsdichte f (x)
genannt. Der Mittelwert E(x) ist das 1. Moment von f (x). Im Allgemeinen ist das n-te Moment
einer Verteilung f (x) definiert als:
%∞
E (x ) = x =
n
n
xn f (x)dx.
(7.38)
−∞
7.3.3
x und s2 als Schätzer für µ und σ 2
Die Kenngrößen µ und σ 2 der Grundgesamtheit sind meist unbekannt und können nur aufgrund
der Stichprobendaten geschätzt werden. So können wir etwa x als einen Schätzer für µ verwenden.
Das ist unter anderem dadurch gerechtfertigt, dass der Erwartungswert von x gleich µ ist
/
0
1 Nµ
1 = µ.
(7.39)
E(x) = E
xi =
E(xi ) =
N i
N i
N
Etwas anders verhält es sich mit der Varianz s2 , die wir als Schätzer für σ 2 verwenden könnten.
Der Erwartungswert der Varianz ist
/
0
+
2
1 1 *
2
= E
(xi − x) =
E (xi − x)2
E s
N i
N i
1
2
1 2
=
E xi − 2xi x + x2
N
i
1
2
2
1
2
E xi − 2
E(xi x) +
E x
=
N
i
i
i






1
1
1
1
=
N E x2 − 2
E xi
xj  +
E
xk ·
xl

N
N j
N
N
i
i
k
l



1 
2 1 =
E (xi xj ) + 2
E (xk xl ) .
N E x2 −
(7.40)

N
N
N
i,j
i
k,l
Der Erwartungswert E(xi xj ) des Produkts xi xj hängt davon ab, ob die beiden Indizes i und j
gleich sind. Für i = j gilt
E(xi xj ) = E(x2i ) = E(x2 ).
(7.41)
164
7 Fehlerrechnung
Für i = j können wir im Falle statistisch unabhängiger xi schreiben
E(xi xj ) = E (xi ) E (xj ) = E(x)2 .
(7.42)
(Zur Definition des Erwartungswertes E(xi xj ) ist es notwendig, Wahrscheinlichkeitsdichten zu
betrachten, die von zwei Variablen abhängen. Dazu verweisen wir die Leser an die einschlägige
Literatur). Durch Verwendung dieser Ausdrücke können wir vereinfachen:



2
2
1 
2  2 E xi +
E (xi ) E (xj )
E s =
NE x −
N 
N
i
i=j



1  2 E xk +
E (xk ) E (xl )
+ 2

N i
k
k=l
6
7 (7.43)
2
2
2
2 1 1
2
2
N E x + N (N − 1)µ +
N E x + N (N − 1)µ
NE x −
=
N
N
N
9
1 8
(N − 1)E x2 − (N − 1)µ2
=
N
9 N −1 2
N − 1 8 2
=
σ
E x − µ2 =
N
N
und somit erhalten wir
σ2 =
N
E s2 .
N −1
(7.44)
(Das selbe Ergebnis erhält man auch, wenn man den Erwartungswert E[(as2 − σ 2 )] betrachtet
und jene Konstante a bestimmt, für die dieser Erwartungswert minimal ist.) Das heißt, der Erwartungswert des Schätzers ist um einen Faktor NN−1 kleiner als die Varianz der Grundgesamtheit.
Für große N ist das irrelevant. Damit der Erwartungswert der Stichprobenvarianz gleich σ 2 ist,
definiert man die Varianz oft als
1 (xi − x)2 .
N − 1 i=1
N
s2 =
7.3.4
(7.45)
Fehler des Mittelwerts
Wie wir oben besprochen haben, betrachten wir den Mittelwert x einer Stichprobe von Messungen
als Schätzwert für den “wahren” Mittelwert µ, den Mittelwert der zur Grundgesamtheit gehörenden
Verteilungsdichte f (x). Da die Stichprobe jedoch nur endlich viele Werte beinhaltet, machen wir
bei so einer Schätzung immer einen gewissen Fehler. Wir wollen nun diesen Fehler abschätzen.
Abbildung 7.11: Da jede Stichprobe aus N unterschiedlichen Werten besteht, unterscheiden sich
die zugehörigen Mittelwerte xk .
Zu diesem Zwecke betrachten wir mehrere Stichproben von jeweils gleicher Größe N (das heißt,
jede Stichprobe besteht aus N Messwerten) (siehe Abb. 7.11). Jede dieser Stichproben liefert
7 Fehlerrechnung
165
einen unterschiedlichen Mittelwert xk . Für L Stichproben erhalten wir L verschiedene Mittelwerte
xk . Die durchschnittliche quadratische Abweichung dieser Mittelwerte von µ, dem Mittelwert der
Grundgesamtheit, ist:
1
(xk − µ)2 .
L
L
(7.46)
k=1
Für sehr große L wird dieser Ausdruck zu
*
+
σx2 = E (x − µ)2 .
(7.47)
Dies ist die Varianz der aus den Stichproben der Größe N ermittelten Mittelwerte x. Die Varianz
beschreibt die Streuung der Mittelwerte, die man aus einer Vielzahl verschiedener Stichproben
erhält.
Einige algebraische Umformungen liefern:
+
*
σx2 = E (x − µ)2 = E x2 − 2E(xµ) + E µ2


1
= E
x x  − 2µ E(x) +µ2
2 i j
N
i,j
=µ
=


1
1
E (xi xj ) − µ2 = 2 
E x2i +
E(xi )E(xj ) − µ2
N 2 i,j
N
i
i=j
=
=
+
1 *
N E x2 + N (N − 1)µ2 − µ2
N2
+
1 * 2
E x − µ2 .
N
(7.48)
Wegen E x2 − µ2 = σ 2 erhalten wir also
1 2
σ
N
(7.49)
σ
σx = √ ,
N
(7.50)
σx2 =
oder
wobei σ die Standardabweichung der Grundgesamtheit ist.
Das heißt, dass die Standardabweichung des Mittelwerts umso kleiner ist, je größer die Stichprobe
ist. Durch Erhöhung der Anzahl N der unabhängigen Messungen können wir die Genauigkeit der
Messung steigern. Um den Fehler σx im Mittelwert zu halbieren, müssen wir gemäß Gleichung
(7.50) den Umfang der Stichprobe vervierfachen.
7.3.5
Die Gaußsche Normalverteilung
In allen bisherigen Betrachtungen haben wir auf keine spezifische funktionale Form der Verteilungsfunktion Bezug genommen. Die genaue Gestalt der Verteilung hängt natürlich vom betrachteten
Messprozess ab. In vielen Fällen und unter recht allgemeinen Bedingungen folgen Messfehler jedoch
der Gaußschen Normalverteilung, benannt nach Carl Friedrich Gauß (1777-1855). Dies ist immer dann der Fall, wenn statistische Fehler durch die Überlagerung sehr vieler kleiner unabhängiger
“Störfaktoren” entstehen. Mathematisch kann dies mit Hilfe des zentralen Grenzwertsatzes gezeigt werden, auf den hier aus Platzgründen nicht weiter eingegangen werden kann. Die Gaußsche
Normalverteilung (auch Gaußsche Glockenkurve genannt) ist gegeben durch
f (x) = √
(x−µ)2
1
e− 2σ2
2πσ
(7.51)
166
7 Fehlerrechnung
Abbildung 7.12: Die Gaußsche Normalverteilung.
und hat die Gestalt einer Glocke mit Maximum an der Stelle µ und einer Breite von 2σ (die
Wendepunkte der Kurve liegen bei µ ± σ) (siehe Abb. 7.12).
Der Mittelwert und die Varianz der Gaußschen Normalverteilung sind
%∞
(x−µ)2
x
√
e− 2σ2 dx = µ
2πσ
(7.52)
2
(x − µ)2 − (x−µ)
√
e 2σ2 dx = σ 2 .
2πσ
(7.53)
−∞
und
%∞
−∞
Das heißt, die Gaußsche Normalverteilung ist durch Angabe des 1. und 2. Moments vollständig
bestimmt. Die Gaußsche Normalverteilung ist normiert,
%∞
√
−∞
(x−µ)2
1
e− 2σ2 dx = 1
2πσ
(7.54)
und ist um µ symmetrisch, das heißt
f (µ + x) = f (µ − x).
(7.55)
Die Wahrscheinlichkeit, dass ein Messwert im Bereich zwischen a und b liegt, ist durch das Integral
%b
P (a ≤ x ≤ b) =
f (x)dx
(7.56)
a
gegeben. Solche Wahrscheinlichkeiten kann man auch mit Hilfe der so genannten Errorfunktion
ausdrücken, die wie folgt definiert ist:
2
erf(x) = √
π
%x
2
e−t dt.
(7.57)
0
Die Errorfunktion ist so definiert, dass erf(∞) = 1. Mit dieser Definition können wir die Wahrscheinlichkeit P (a ≤ x ≤ b) ausdrücken als:
7
6 a−µ
b−µ
1
− erf √
.
(7.58)
erf √
P (a ≤ x ≤ b) =
2
2σ
2σ
7 Fehlerrechnung
167
Die Wahrscheinlichkeit, dass ein Messwert kleiner ist als a, ist gegeben durch:
6
7
1
a−µ
P (x ≤ a) =
1 + erf √
.
2
2σ
(7.59)
Für die Gaußsche Normalverteilung (siehe Abb. 7.13) sollten wir demnach
68 %
95 %
99.7 %
aller Messwerte im Intervall
aller Messwerte im Intervall
aller Messwerte im Intervall
(µ ± σ),
(µ ± 2σ) und
(µ ± 3σ)
erwarten, das heißt, eine Abweichung vom Mittelwert von mehr als ±3σ ist statistisch nur etwa
alle 300 Messungen zu erwarten.
Abbildung 7.13: Die Wahrscheinlichkeit, einen Messwert im Intervall (µ ± σ) zu finden, ist 68%,
im Intervall (µ ± 2σ) ist sie 95% und im Intervall (µ ± 3σ) 99.7%.
Ist die Variable x gaußverteilt, so ist es auch der Mittelwert x = N1 N
i=1 xi . Sowohl die Verteilungen
von x selbst als auch die des Mittelwerts x haben einen Mittelwert von µ. Die Varianzen σ und σx
der beiden Verteilungen unterscheiden sich jedoch und sind durch
σx2 =
σ2
N
(7.60)
miteinander verknüpft. Die Verteilung des Mittelwerts x ist also um den Faktor
die Verteilung der Variablen x selbst.
√
N schmäler als
Aus der Gaußverteilung ergibt sich, dass der “wahre” Mittelwert der Verteilung
mit einer Wahrscheinlichkeit von
mit einer Wahrscheinlichkeit von
mit einer Wahrscheinlichkeit von
68 %
95 %
99.07 %
im Intervall
im Intervall
im Intervall
x ± σx ,
x ± 2σx und
x ± 3σx liegt.
Diese Intervalle nennt man Konfidenzintervalle oder Vertrauensintervalle.
7.3.6
Verteilung diskreter Größen
Bis jetzt haben wir uns mit der Verteilung von kontinuierlichen Größen beschäftigt. Es kann aber
in der Physik durchaus vorkommen, dass die Messgröße nur diskrete (endlich viele oder abzählbar
unendlich viele) Werte annehmen kann. Zum Beispiel kann die Anzahl der in einer gewissen Zeit
168
7 Fehlerrechnung
zerfallenden Kerne eines radioaktiven Materials nur eine ganze Zahl sein, also einen der Werte
0,1,2,... usw. annehmen. Im Falle diskreter Größe beschreiben wir die Verteilung der Messwerte durch die Wahrscheinlichkeitsfunktion f (xi ), welche die Wahrscheinlichkeit ist, bei einer
Messung der Größe x den Wert xi zu beobachten. Die Wahrscheinlichkeitsfunktion f (xi ) muss
normiert sein:
f (xi ) = 1.
(7.61)
i
(Das Integral für die kontinuierliche Wahrscheinlichkeitsdichte haben wir hier also durch eine
Summe ersetzt.)
Die zugehörige Verteilungsfunktion ist
F (x) =
f (x ).
(7.62)
x ≤x
Die Verteilungsfunktion F (x) ist die Wahrscheinlichkeit, einen Messwert zu beobachten, der kleiner
oder gleich x ist. Der Mittelwert und die Varianz einer diskreten Verteilung sind gegeben durch:
xi f (xi ),
(7.63)
E(x) =
i
Var(x)
=
f (xi )(xi − µ)2 .
(7.64)
i
Der Erwartungswert einer Funktion g(x) ist
E [g(x)] =
f (xi )g(xi ).
(7.65)
i
√
Auch für diskrete Verteilung gilt σx = σ/ N für die Standardabweichung des Mittelwerts.
Folgende Ausdrücke sind gebräuchlich:
7.3.7
diskret
kontinuierlich
f (x)
• Wahrscheinlichkeitsfunktion
• Verteilungsdichte
• Dichtefunktion
• Wahrscheinlichkeitsdichte
F (x)
• Verteilungsfunktion
• Wahrscheinlichkeitssumme
• Verteilungsfunktion
• Wahrscheinlichkeitsintegral
• Wahrscheinlichkeitsverteilung
Poissonverteilung
Die Anzahl von zufälligen
intervall stattfinden, folgt
Monat geborenen Babies,
kerne oder die Anzahl der
durch
und statistisch unabhängigen Ergebnissen, die in einem gewissen Zeitder Poissonverteilung. Beispiele sind die in einem Krankenhaus pro
die in einer radioaktiven Substanz pro Zeiteinheit zerfallenden AtomFehler pro Seite in diesem Skriptum. Die Poissonverteilung ist gegeben
f (x) =
µx e−µ
x!
(für ganzzahliges x).
(7.66)
Wir schreiben auch oft P (n) statt f (x), um anzudeuten, dass die Poissonverteilung nur für ganzzahlige Werte des Arguments definiert ist (siehe Abb. 7.14).
7 Fehlerrechnung
169
Abbildung 7.14: Die Poissonverteilung für µ = 10.
Die Poissonverteilung ist normiert:
∞
P (n) =
n=0
∞
∞
µn e−µ
µn
= e−µ
= e−µ eµ = 1
n!
n!
n=0
n=0
(7.67)
eµ
(Da n nur diskrete Werte annimmt, haben wir hier summiert statt integriert.)
Die Poissonverteilung ist durch einen einzigen Parameter µ vollständig bestimmt. Der Parameter
µ ist der Mittelwert E(n) der Verteilung:
E(n) =
∞
nP (n) =
n=0
∞
µn e−µ
.
n
n!
n=0
(7.68)
Da das erste Summenglied verschwindet, können wir schreiben:
E(n) =
∞
∞
∞
∞
µn e−µ
µn
µn−1
µn
= e−µ
= µe−µ
= µe−µ
n
= µ.
n!
(n − 1)!
(n − 1)!
n!
n=1
n=1
n=1
n=0
(7.69)
eµ
Der Mittelwert µ ist gleich der Anzahl der Ereignisse, die im Mittel in der betrachteten Zeit
stattfinden.
Besonders interessant ist die Varianz der Poissonverteilung:
σ 2 = E(n2 ) − E(n)2 .
(7.70)
Der Erwartungswert von n2 ist:
2
E(n ) =
∞
n=0
2
n P (n) =
∞
n
n −µ
2µ e
n=0
n!
= µe
−µ
∞
nµn−1
.
(n − 1)!
n=1
(7.71)
Durch Umnummerierung der Summe erhalten wir:

E(n2 ) = µe−µ



∞
∞
 ∞ nµn (n + 1)µn
µn 
 = µ2 + µ.
= µe−µ 
+


n!
n!
n!
n=0

n=0
n=0
(7.72)
σ 2 = E(n2 ) − E(n)2 = µ2 + µ − µ2 = µ.
(7.73)
µeµ
eµ
Daraus folgt:
170
7 Fehlerrechnung
Das heißt, für die Poissonverteilung ist die Varianz gleich dem Mittelwert. Diese Formel ist sehr
wichtig zur Abschätzung des Fehlers bei Messvorgängen, bei denen wir Ereignisse zählen. Für große
µ wird die Poissonverteilung zu einer Gaußverteilung.
Beispiel:
In einer gewissen Zeit zählen wir 625 Zerfälle in einem radioaktiven Präparat. Der Fehler, den wir
durchschnittlich bei einer solchen Messung machen, ist
√
√
(7.74)
σ = µ ≈ 625 = 25.
Daher ist unser Messergebnis:
625 ± 25.
7.4
(7.75)
Fehlerfortpflanzung
Oft können physikalische Größen nicht direkt gemessen werden. Man bestimmt dann diese Größen,
indem man sie als Funktion von anderen Größen ausdrückt, welche messbar sind. So kann man zum
Beispiel die Dichte einer Flüssigkeit bestimmen, indem man für eine gewisse Menge an Substanz
sowohl das Volumen V als auch die Masse m misst. Die Dichte ρ ergibt sich dann aus
ρ=
m
.
V
(7.76)
Da sowohl die Masse m als auch das Volumen V als experimentell ermittelte Größen fehlerbehaftet sind, ist auch die daraus bestimmte Dichte ρ fehlerbehaftet. Man sagt, der Fehler in den
unabhängigen Größen m und V pflanzt sich auf die abhängige Größe ρ = m/V fort. Wir wollen
jetzt den Fehler in der abhängigen Größe aus den Fehlern der unabhängigen Größen bestimmen.
Im Allgemeinen betrachten wir eine Größe u, die von den N Größen x1 , x2 , . . . , xN abhängt:
u = u(x1 , x2 , . . . , xN ).
(7.77)
Wir nehmen an, dass x1 bis xN experimentell bestimmte Größen sind und dass deren Statistik durch
die Verteilungsdichten f1 (x1 ), f2 (x2 ), . . . , fN (xN ) beschrieben wird. Die zugehörigen Mittelwerte
und Varianzen sind
µ1 , µ2 , . . . , µN
(7.78)
2
.
σ12 , σ22 , . . . , σN
(7.79)
und
Für jede Messgröße xi bestimmen wir nun für eine Stichprobe aus M Messungen den Mittelwert
xi . Die Standardabweichung dieser Mittelwerte ist gegeben durch (siehe Abschnitt 7.3.4):
σi
σxi = √ .
M
(7.80)
Wir können nun die Größe u für die Mittelwerte xi bestimmen,
u ≡ u(x1 , x2 , . . . , xN ),
(7.81)
und nach dem Fehler in u fragen, der durch die Fehler σxi der Mittelwerte entsteht. Um diese
Frage zu beantworten, können wir auf zwei verschiedene Weisen vorgehen: Wir können entweder
den Maximalfehler in der abhängigen Größe u abschätzen oder die statistischen Kennwerte
der Verteilung von u ermitteln.
7 Fehlerrechnung
7.4.1
171
Fortpflanzung von Maximalfehlern
Unter der Annahme, dass die Fehler ∆xi in den unabhängigen Größen klein sind, können wir den
dadurch hervorgerufenen Fehler ∆u einfach durch Anwendung des Differentials abschätzen
∆u ≈
N ∂u
i=1
∂xi
∆xi .
(7.82)
Das heißt, hier haben wir den Fehler durch das Differential angenähert, das wir in Kapitel 3
kennengelernt haben. Das Differential von u gibt an, um wie viel sich u ändert, wenn die Größen
xi um jeweils ∆xi verändert werden. So würde man etwa im Falle von systematischen Fehlern
vorgehen.
Da wir pessimistisch veranlagt sind, wollen wir den “worst case” annehmen und den Betrag des
größtmöglichen Fehlers bestimmen. Dazu nehmen wir an, dass alle Terme einen positiven Beitrag
zum Fehler in u liefern, das heißt, dass alle Fehler in die gleiche Richtung gehen und erhalten somit:
!
N !
! ∂u
!
! ! !
!.
!∆u! ≈
∆x
i
! ∂xi
!
(7.83)
i=1
Wenn wir die Standardabweichungen σxi als Maß für die Fehler in xi benutzen, erhalten wir
!
N !
! ∂u !
! ! !
!
!∆u! ≈
! ∂xi !σxi ,
i=1
(7.84)
wobei die partiellen Ableitungen an der Stelle (x1 , x1 , . . . , xN ) ausgewertet werden.
Beispiel:
Betrachten wir wieder die Bestimmung der Dichte ρ aus dem gemessenen Volumen V und der
gemessenen Masse m. Wir nehmen an, dass wir sowohl das Volumen als auch die Masse in M
wiederholten Messungen bestimmt haben. Aus diesen Messreihen erhalten wir die Mittelwerte V
und m und die Varianzen s2V und s2m . Wir identifizieren diese Varianzen mit den Varianzen σV2
2
und σm
der zugehörigen Grundgesamtheiten. Als Maß für die Fehler in den Mittelwerten V und
m verwenden wir
σV
(7.85)
σV = √
M
und
σm
σm = √ .
M
Dann ist der Maximalfehler in der Dichte gegeben durch
!
!
!
!
! ∂ρ !
! ∂ρ !
!
!·σ
!
!
|∆ρ| ≈ !
· σm + !
∂m !
∂V ! V
m
1
σm + 2 σV
=
V
V
ρ
1
σm + σV ,
=
V
V
(7.86)
(7.87)
wobei wir ρ ≡ m/V verwendet haben. Der relative Fehler |∆ρ|/ρ ist also gegeben durch:
σ
σm
|∆ρ|
≈
+ V.
ρ
m
V
(7.88)
172
7 Fehlerrechnung
Der relative Fehler in ρ ist also die Summe der relativen Fehler in m und V .
Die Methode der Fortpflanzung der Maximalfehler kann den Fehler aber leicht überschätzen. Realistischer ist es in vielen Fällen, die Wirkung der Fehler σxi auf die statistischen Kennwerte der
Verteilung von u zu betrachten.
7.4.2
Fortpflanzung statistischer Kennwerte
Wir betrachten zunächst den Fall, dass die Größe u nur von einer Variablen x abhängt, die wir
im Experiment direkt bestimmen können. Aus einer Messserie erhalten wir den Mittelwert x der
Größe x und berechnen daraus die Größe
u ≡ u(x).
(7.89)
Da x als Mittelwert von fehlerbehafteten Größen selbst fehlerbehaftet ist (siehe Abschnitt 7.3.4),
wird auch u mit einem Fehler behaftet sein. Um diesen Fehler zu bestimmen, berechnen wir die
Varianz von u:
'
(
2
Var(u) = σu2 = E (u(x) − u(µ)) ,
(7.90)
wobei µ = E(x) = E(x) der Erwartungswert von x ist. Wir schreiben nun den Mittelwert x als
Summe des Erwartungswerts µ und einer kleinen Abweichung δx:
x = µ + δx.
(7.91)
Unter der Annahme, dass sich der Mittelwert x nur wenig vom Erwartungswert µ unterscheidet,
dass δx also klein ist, können wir die Funktion u(x) in eine Taylorreihe um µ entwickeln (siehe
Kapitel 5) und nach dem linearen Glied abbrechen:
'
(
'
(
E (u(x) − u(µ))2
= E (u(µ + δx) − u(µ))2
/
2 0
du
u(µ) +
= E
δx − u(µ)
dx
/ 0 2
2
+
*
du
du
2
(7.92)
= E
(δx) =
E (δx)2 ,
dx
dx
wobei die Ableitung
von
+ u(x) an der Stelle x = µ bzw. als Näherung für µ an der Stelle x ausgewer*
tet wird. Da E (δx)2 = σx2 , erhalten wir schließlich das Gaußsche Fehlerfortpflanzungsgesetz
für den Fall einer Funktion u(x), die nur von einer einzelnen Variablen abhängt:
σu2
=
du
dx
2
σx2 .
(7.93)
Als nächtes betrachten wir den Fall einer Funktion u(x, y), welche von zwei Variablen x und y
abhängt. Wir fragen nun nach dem Fehler, den wir begehen, wenn wir
u ≡ u(x, y)
aus den Mittelwerten x und y bestimmen. Dazu berechnen wir wieder die Varianz:
(
'
Var(u) = σu2 = E (u(x, y) − u(µ, ν))2 .
(7.94)
(7.95)
Hier sind µ = E(x) = E(x) und ν = E(y) = E(y) die Erwartungswerte von x und y. Indem wir x
und y jeweils als Summe des Erwartungswerts und einer kleinen Abweichung ausdrücken, können
wir schreiben
(
'
(7.96)
σu2 = E (u(µ + δx, ν + δy) − u(µ, ν))2
7 Fehlerrechnung
173
und erhalten mit einer nach den linearen Gliedern abgebrochenen Taylorreihe
/
2 0
∂u
∂u
2
σu = E
u(µ, ν) +
δx +
δy − u(µ, ν)
∂x
∂y
/ 2 0
∂u
∂u
= E
.
δx +
δy
∂x
∂y
(7.97)
Hier müssen die partiellen Ableitungen ∂u/∂x und ∂u/∂y an der Stelle (µ, ν) ≈ (x, y) ausgewertet
werden. Ausführung des Quadrats ergibt:
2
2
∂u
∂u
∂u
∂u
2
2
σu2 =
E[(δx) ] + 2
E[(δy) ].
(7.98)
E[δxδy] +
∂x
∂x
∂y
∂y
Für unkorrelierte Messwerte x und y gilt E[δxδy] = E[δx]E[δy] = 0 und wir erhalten schließlich
das Gaußsche Fehlerfortpflanzungsgesetz für den Fall von zwei Variablen:
σu2 =
∂u
∂x
2
σx2 +
2
∂u
∂y
σy2 ,
2
(7.99)
2
wobei wir benutzt haben, dass σx2 = E[(δx) ] und σy2 = E[(δy) ].
Das Gaußsche Fehlerfortpflanzungsgesetz für den allgemeinen Fall einer Funktion von N Variablen,
u = u(x1 , x2 , . . . , xN ), lässt sich auf analoge Weise herleiten. Man erhält als Ergebnis:
σu2
=
2
N ∂u
∂xi
i=1
σx2i ,
(7.100)
wobei σx2i die Varianzen der zugehörigen Mittelwerte x1 , x2 , . . . , xN sind. Die Standardabweichung
σu kann als Maß für den zu erwartenden Fehler in der abhängigen Größe u aufgefasst werden.
Das Gaußsche Fehlerfortpflanzungsgesetz gilt, falls
• die Varianzen σxi der Mittelwerte xi klein sind und
• die Mittelwerte xi voneinander statistisch unabhängig sind.
Beispiel:
Mit der Gaußschen Fehlerfortpflanzung können wir die Standardabweichung der Dichte ρ =
der Standardabweichung von m und V bestimmen:
aus
σρ2
=
=
2
2
∂ρ
∂ρ
2
σm +
σV2
∂m
∂V
2
2
1
m
2
σm
+ − 2
σV2 .
V
V
m
V
(7.101)
Für den relativen Fehler erhalten wir:
σρ2
ρ2
oder
σρ
ρ
=
=
2
σV2
σm
+
2
m2
V
)
σ 2
m
m
+
σV
V
(7.102)
2
.
(7.103)
174
7 Fehlerrechnung
2
Abbildung 7.15: Der durch Gaußsche Fortpflanzung berechnete Relativfehler σρ /ρ = (σm
/m2 +
2
σV2 /V )1/2 ist kleiner als der Relativfehler |∆ρ|
ρ = σm /m + σV /V , den man durch Fortpflanzung
der Maximalfehler erhält.
Statt wie bei der Abschätzung des Maximalfehlers die relativen Fehler einfach zu addieren, addieren
wir die Quadrate der relativen Fehler und ziehen daraus die Wurzel. Durch die Anwendung der
Gaußschen Fehlerfortpflanzung erhalten wir also einen im Vergleich zum Maximalfehler kleineren
Fehler. Dies sieht man anhand der Dreiecksungleichung √leicht ein (siehe Abb. 7.15). Falls zum
Beispiel σm /m = σV /V , ist dieser Fehler um den Faktor 2 kleiner als der Maximalfehler.
Für bestimmte funktionale Zusammenhänge der abhängigen von der unabhängigen Größe ergeben sich besonders einfache Fälle des Gaußschen Fehlerfortpflanzungsgesetzes, die im Folgenden
angeführt sind.
Summen oder Differenzen
Für u = x + y oder u = x − y gilt
∂u
= 1 und
∂x
∂u
= ±1.
∂y
(7.104)
Daraus ergibt sich
σu2
= 12 σx2 + (±1)2 σy2
= σx2 + σy2
(7.105)
und somit
σu =
σx2 + σy2 .
(7.106)
Das heißt, die Varianz der abhängigen Größe ist die Summe der Varianzen der unabhängigen
Größen.
Multiplikation mit einer Konstanten
Für u = αx gilt
σu2
=
∂u
∂x
2
σx2 = α2 σx2
(7.107)
und deshalb
σu = ασx .
(7.108)
Das heißt, die Standardabweichung von u ergibt sich einfach durch Multiplikation von α mit der
Standardabweichung von x.
7 Fehlerrechnung
175
Multiplikation oder Division
Für u = xy erhalten wir durch Anwendung von Gleichung (7.100)
σu2 = y 2 σx2 + x2 σy2 .
(7.109)
Division durch x2 y 2 ergibt
σ 2
σy2
σx2
σu2
x
=
+
=
+
2
2
2
u
x
x
y
σy
y
2
.
(7.110)
Das heißt, das Quadrat des relativen Fehlers in u ist die Summe der Quadrate der relativen Fehler
in x und y.
Für die Division u = x/y gilt ganz analog:
σu2
2
2
1
x
2
=
σx +
σy2 .
y
y2
(7.111)
Nach Division durch u = x/y erhalten wir:
σ 2
σx2y
σx2x
σu2
xx
=
+
=
+
u2
x
x2
y2
7.5
σxy
y
2
.
(7.112)
Ausgleichsrechnung (Fitten)
In Experimenten bestimmt man oft eine Größe y in Abhängigkeit einer anderen Größe x. Zum
Beispiel könnte in einem Experiment das Volumen V einer Flüssigkeit als Funktion der Temperatur
T gemessen werden. Als Ergebnis eines solchen Experiments erhält man für jeden der N Werte
xi der unabhängigen Größe (in unserem Beispiel die Temperatur) einen Messwert yi (in unserem
Beispiel das Volumen). Wir suchen nun nach einer Funktion f (x), die möglichst gut beschreibt,
wie y von x abhängt (siehe Abb. 7.16).
Abbildung 7.16: Ziel der Ausgleichsrechnung ist es, eine Funktion f (x) zu bestimmen, die möglichst
gut zu den Messdaten passt.
Im Idealfall hätten wir yi = f (xi ). Sowohl xi als auch yi sind im Allgemeinen fehlerbehaftet, sodass
es zu Abweichungen von dieser funktionalen Abhängigkeit kommt. Wir können jedoch verlangen,
176
7 Fehlerrechnung
dass die Abweichung der Funktionswerte f (xi ) von den gemessenen Werten möglichst klein ist.
Demzufolge suchen wir nach einer Funktion f (x), die die Summe der Abweichungsquadrate
2
χ =
N
2
[f (xi ) − yi ]
(7.113)
i
minimiert. Die dazugehörige Kurve nennt man die Ausgleichskurve. Sie ist die Kurve, die im
Sinne der kleinsten Summe der Abweichungsquadrate am besten zu den Messwerten passt. Das
Anpassen der Ausgleichskurve an die gemessenen Daten nennt man in Anlehnung an das Englische
auch “Fitten”.
Beim praktischen Fitten wird meistens eine Funktion f (x, a1 , . . . , aL ) angenommen, deren Form
entweder von der zugrunde liegenden Physik nahe gelegt wird oder aus Gründen der Einfachheit
gewählt wird. Die Funktion hängt im Allgemeinen auch von einer Reihe von freien Parametern ai
ab, die wir nun so bestimmen, dass die Summe der Abweichungsquadrate χ2 möglichst klein wird.
Wir stellen also an die freien Parameter ai die Bedingung, dass
∂ 2
χ =0
∂ai
für
i = 1, . . . , L.
(7.114)
Das heißt, dass χ2 bezüglich der Parameter ai ein Minimum (genauer: ein Extremum) annimmt.
Durch Lösung dieses Satzes von L Gleichungen erhalten wir die Werte für die Parameter, die den
besten “Fit” der Funktion an die Messwerte ergeben.
Lineare Regression
Die einfachste und am häufigsten verwendete Ausgleichsfunktion ist die Gerade
f (x) = ax + b,
(7.115)
die von den zwei freien Parametern a (Steigung) und b (Schnittpunkt mit der y-Achse) abhängt.
Man spricht in diesem Fall von linearer Regression. Die Steigung a wird auch Regressionskoeffizient genannt. Um die Parameter a und b zu ermitteln, setzen wir die Ableitungen von χ2
nach a und b gleich 0:
∂ 2
∂ χ =
(axi + b − yi )2 =
2(axi + b − yi )xi = 0
∂a
∂a i=1
i=1
(7.116)
∂ 2
∂ χ =
(axi + b − yi )2 =
2(axi + b − yi ) = 0.
∂b
∂b i=1
i=1
(7.117)
N
N
und
N
N
Daraus erhalten wir:
a
N
i=1
a
N
i=1
x2i + b
N
xi −
i=1
xi + N b −
N
xi yi = 0,
(7.118)
i=1
N
i=1
yi = 0.
(7.119)
7 Fehlerrechnung
177
Wir definieren nun:
Sx
=
N
xi ,
(7.120)
yi ,
(7.121)
x2i ,
(7.122)
xi yi
(7.123)
i=1
Sy
=
N
i=1
Sxx
=
N
i=1
Sxy
=
N
i=1
und schreiben die obigen Gleichungen als
aSxx + bSx − Sxy = 0,
(7.124)
aSx + N b − Sy = 0.
(7.125)
Durch Multiplikation von Gleichung (7.125) mit Sxx /Sx und Subtraktion der zweiten von der
ersten Gleichung erhalten wir
Sxx
N Sxx
= 0,
(7.126)
b Sx −
− Sxy + Sy
Sx
Sx
woraus folgt:
b=
Sy Sxx − Sx Sxy
.
N Sxx − Sx2
(7.127)
Multiplikation von Gleichung (7.125) mit Sx /N und anschließender Subtraktion von Gleichung
(7.124) hingegen ergibt:
Sx2
Sy Sx
a Sxx −
− Sxy +
=0
(7.128)
N
N
und somit:
a=
N Sxy − Sx Sy
.
N Sxx − Sx2
(7.129)
Damit haben wir die Parameter a und b der Ausgleichsgeraden bestimmt.
Wenn wir den Fehler σi in den Messwerten berücksichtigen und die Terme in der Summe der
Abweichungsquadrate damit gewichten, ergeben sich ähnliche Ausdrücke für a und b. Statt der
linearen Funktion f (x) = ax + b können wir auch andere Funktionen an die Messdaten anpassen.
Die Gleichungen, die sich dann aus ∂χ2 /∂ai ergeben, sind jedoch schwieriger zu lösen als im linearen
Fall.
178
7 Fehlerrechnung
Kapitel 8
Differentiation von Feldern: grad,
div und rot
Im Folgenden werden wir uns mit Vektoranalysis beschäftigen. Dabei geht es um die mathematische Beschreibung von Feldern im dreidimensionalen Raum. Für die Beschreibung sind die
Begriffe des Gradienten, der Rotation und der Divergenz von zentraler Bedeutung.
8.1
8.1.1
Felder
Skalarfelder
Betrachten wir als Beispiel die Atmosphäre über einem bestimmten Gebiet, sagen wir über Wien.
Es ist ein sonniger Tag und die Sonnenstrahlen erwärmen Straßen, Häuser, etc. Die Temperatur
der Luft über dem Boden hängt nur von der Beschaffenheit des Bodens ab. Während dunkler
Asphalt die Sonnenstrahlen absorbiert und dadurch die darüber liegende Luft erwärmt, bleibt die
Luft über begrünten Flächen eher kühl. Am kühlsten bleibt es in beschatteten Bereichen. Ferner
hängt die Lufttemperatur von der Höhe über dem Boden ab: je höher wir steigen, umso kühler
wird es. Durch Messung mit einem Thermometer können wir die Temperatur an jedem durch die
Koordinaten (x, y, z) beschriebenen Punkt bestimmen und erhalten
T (x, y, z).
(8.1)
Da die Temperatur auch von der Tageszeit abhängt, können wir auch die Zeit t in die Variablenliste
aufnehmen:
T (x, y, z, t).
(8.2)
Dies ist ein Beispiel für ein zeitabhängiges, skalares Feld. Das Feld T (x, y, z, t) heißt deshalb
skalar, weil die Temperatur T eine skalare Größe ist. Im Allgemeinen ordnet ein Skalarfeld jedem
Punkt (x, y, z) eines räumlichen (oder ebenen) Bereichs in eindeutiger Weise einen Skalar A zu
(siehe Abb. 8.1):
A(x, y, z) = A(r).
(8.3)
Das Feld A(x, y, z) kann man sich mit Hilfe der Flächen veranschaulichen, auf denen die skalare Größe einen konstanten Wert hat: A(x, y, z) =const. Man nennt diese Flächen Niveau- oder
Äquipotentialflächen. In der Ebene definiert die Bedingung A(x, y) =const Niveaulinien (oder
179
180
8 Differentiation von Feldern: grad, div und rot
Abbildung 8.1: Ein Skalarfeld ordnet jedem Punkt r in der Ebene (r = (x, y), links) oder im Raum
(r = (x, y, z), rechts) eine skalare Größe A(r) zu.
Äquipotentiallinien). Solche Niveaulinien kennen wir von topographischen Karten, in denen sie
Punkte gleicher Meereshöhe verbinden, oder vom Wetterbericht, wo in der Temperaturkarte für
einen diskreten Satz von Temperaturen Punkte gleicher Temperatur durch Niveaulinien miteinander verbunden sind. Ein weiteres 2D-Beispiel ist eine metallische Platte, die an einer Ecke erhitzt
und an den gegenüberliegenden Seiten gekühlt wird (siehe Abb. 8.2).
Abbildung 8.2: Eine metallische Platte wird an der rechten hinteren Ecke erwärmt und gleichzeitig an der linken und der vorderen Kante gekühlt. Dadurch stellt sich ein Zustand ein, bei dem
die Temperatur der Platte vom Ort abhängt. Orte gleicher Temperatur sind durch so genannte
Niveaulinien miteinander verbunden.
8.1.2
Vektorfelder
In anderen Fällen ist es notwendig, an jeder Stelle x, y, z einen Vektor zu definieren. So möchte
man beispielsweise zusätzlich zur Temperatur auch die Windgeschwindigkeit v als Funktion des
Ortes angeben:
v (x, y, z).
(8.4)
Da sich Windgeschwindigkeit und Windrichtung mit der Zeit ändern, können wir auch in diesem Fall die Zeit t in die Liste der Argumente aufnehmen und erhalten damit ein zeitabhängiges
Geschwindigkeitsfeld:
v (x, y, z, t).
(8.5)
8 Differentiation von Feldern: grad, div und rot
181
Ein solches Feld nennt man ein Vektorfeld. Im Allgemeinen ordnet ein Vektorfeld jedem Ort
(x, y, z) eines Bereichs und (falls nötig) auch jedem Zeitpunkt aus einem bestimmten Intervall
einen Vektor zu:
y, z) = A(
r ).
A(x,
(8.6)
y) analog definiert (siehe Abb. 8.3). Beispiele für Vektorfelder
In der Ebene ist ein Vektorfeld A(x,
sind das elektrische Feld, das magnetische Feld und das Geschwindigkeitsfeld einer strömenden
Flüssigkeit.
r ) zu.
Abbildung 8.3: Ein Vektorfeld ordnet jedem Punkt r (hier in der Ebene) einen Vektor A(
Vektorfelder kann man mit Feldlinien veranschaulichen. Das sind Linien, für die in jedem Punkt
der dortige Feldvektor tangential zur Linie ist. Feldlinien können sich nicht schneiden, da in jedem
Punkt der Feldvektor eine eindeutige Richtung hat. Würden sich Feldlinien unter einem Winkel
schneiden, gäbe es an einem Punkt zwei verschiedene Feldvektoren, was jedoch nicht zulässig ist.
Felder, die sich zeitlich nicht ändern, nennt man stationär. Die Dichte der Feldlinien ist ein Maß
für die Stärke des Vektorfeldes.
Abbildung 8.4: Ein Vektorfeld (hier das zweidimensionale Geschwindigkeitsfeld einer Strömung um
eine Scheibe) kann mit Hilfe von Feldlinien, zu denen die Feldvektoren tangential sind, dargestellt
werden.
Einige Felder von besonderer Bedeutung sind:
• Homogene Felder:
In einem homogenen Feld hat der Feldvektor überall die gleiche Richtung und den gleichen
Betrag. Ein homogenes Feld kann geschrieben werden als
y, z) = (cx , cy , cz ),
A(x,
wobei cx , cy , cz Konstanten sind.
(8.7)
182
8 Differentiation von Feldern: grad, div und rot
• Kugelsymmetrische Felder (Zentralfelder):
Abbildung 8.5: Ein kugelsymmetrisches Vektorfeld.
Der Feldvektor zeigt in jedem Punkt radial nach außen oder innen, also vom Ursprung weg
oder zum Ursprung hin. Der Betrag hängt nur vom Abstand r vom Zentrum ab. Ein kugelsymmetrisches Feld lässt sich ausdrücken als:
r ) = A(r) r ,
A(
r
(8.8)
wobei r = |r| der Abstand des Punktes vom Ursprung ist. Beispiele für ein kugelsymmetrisches Feld sind das Gravitationsfeld der Erde und das elektrische Feld einer Punktladung.
• Zylinder- oder axialsymmetrische Felder:
Abbildung 8.6: Ein zylindersymmetrisches Vektorfeld.
Der Feldvektor zeigt radial von einer Achse weg und hat keine Komponente in Achsenrichtung. Der Betrag hängt nur vom Abstand des Punktes zur Achse ab. Ein zylindersymmetrisches Feld lässt sich schreiben als:
r ) = A(ρ)eρ .
A(
(8.9)
Hier ist ρ der Normalabstand zur z-Achse und eρ der Einheitsvektor normal zur z-Achse in
Richtung zum Punkt r.
8 Differentiation von Feldern: grad, div und rot
8.2
Gradient
8.2.1
Definition
183
Betrachten wir ein Skalarfeld A(x, y, z) im dreidimensionalen Raum (zum Beispiel die Temperatur
T (x, y, z) eines ungleichmäßig erwärmten Körpers). Wir fragen uns nun, wie sich die skalare Größe
A ändert, wenn wir uns vom Punkt r = (x, y, z) leicht wegbewegen, wenn wir also von r = (x, y, z)
auf r + dr = (x + dx, y + dy, z + dz) übergehen. In linearer Näherung (für sehr kleine dx, dy und
dz) ist die Änderung dA in der Größe A gegeben durch
dA =
∂A
∂A
∂A
dx +
dy +
dz.
∂x
∂y
∂z
(8.10)
(Dies ist einfach das bereits bekannte totale Differential der Funktion A(x, y, z).) Wir können
die rechte Seite der obigen Gleichung als das Skalarprodukt des Vektors dr = (dx, dy, dz) mit dem
Vektor (∂A/∂x, ∂A/∂y, ∂A/∂z) betrachten. Dieser im Allgemeinen ortsabhängige Vektor ist der
Gradient des Skalarfeldes A(x, y, z). Wir schreiben dafür


grad A = 
∂A
∂x
∂A
∂y
∂A
∂z


 = ∇A(x, y, z).
(8.11)
∇A(x, y, z) nennt man auch das Gradientenfeld von A(x, y, z).
Das Symbol ∇ ist der Nabla-Operator, der in der Vektoranalysis eine zentrale Rolle einnimmt
und formal als Vektor geschrieben werden kann:


∇=
∂
∂x
∂
∂y
∂
∂z


.
(8.12)
Der Nabla-Operator ∇ (auf Englisch auch “del” genannt) wurde zum ersten Mal vom irischen Physiker William Rowan Hamilton (1805-1865) verwendet. Das Wort “Nabla” bezeichnet eine antike
Harfe und wurde vermutlich wegen der Ähnlichkeit des Symbols ∇ mit einer Harfe eingeführt.
Der Gradient des Skalarfeldes A(x, y, z) ist also ein Vektorfeld, dessen Komponenten die partiellen
Ableitungen von A(x, y, z) nach den Raumkoordinaten sind. Der Gradient von A entsteht durch
Anwendung des Nabla-Operators auf A. Man kann den Gradienten auch mit Hilfe der Basisvektoren
ex , ey , ez ausdrücken:
grad A = ∇A =
∂A
∂A
∂A
ex +
ey +
ez .
∂x
∂y
∂z
Auch die Schreibweise
∇A =
∂A
∂r
(8.13)
(8.14)
wird oft verwendet.
8.2.2
Eigenschaften
Der Gradient steht senkrecht auf die Äquipotentialflächen (Niveauflächen), auf denen A = const.
Um das einzusehen, betrachten wir die Änderung dA, die durch Verschiebung des Ortsvektors
r(x, y, z) um dr = (dx, dy, dz) entsteht:
dA = ∇A · dr.
(8.15)
184
8 Differentiation von Feldern: grad, div und rot
Ist dr tangential zur Niveaufläche, bleibt A konstant und wir haben:
dA = ∇A · dr = 0.
(8.16)
Das bedeutet, dass ∇A senkrecht auf die Flächen mit A = const steht. In der Ebene können wir
uns das für das Temperaturfeld T (x, y) leicht veranschaulichen: Auf diesen Linien ist T konstant.
Das heißt, wenn wir auf ihnen entlangfahren, ändert sich die Temperatur nicht. Wenn wir dr in
Richtung einer solchen Linie wählen, muss daher für kleine dr gelten: dA = 0. Das Differential dA
ist aber das Skalarprodukt von dr und ∇A: dA = ∇A · dr. Daher haben wir ∇A · dr = 0. Somit ist
∇A orthogonal zu dr und, da dr tangential an die Niveaulinie ist, auch orthogonal zur Niveaulinie
selbst. Analog gilt das auch in höheren Dimensionen.
Abbildung 8.7: Der Gradient ∇A eines skalaren Feldes A(r) (hier das Temperaturfeld von Abb.
8.2) steht normal zu den Niveaulinien des Feldes.
Der Gradient ∇A zeigt in die Richtung, in der die Funktion A(x, y, z) am schnellsten anwächst.
Man kann dies zum Beispiel mit Hilfe der Lagrangeschen Multiplikatoren beweisen, worauf
wir aber hier nicht eingehen können. Anschaulich ist dies plausibel, da wir natürlich am schnellsten
von einer Niveaulinie (oder Niveaufläche) zur nächsten kommen, wenn wir uns senkrecht dazu, also
in Richtung des Gradienten, bewegen. (Denken Sie zum Beispiel an die Höhenschichtenlinien auf
einer Wanderkarte.) Der negative Gradient zeigt in die Richtung der schnellsten Abnahme der
Funktion A(x, y, z). Der Betrag des Gradienten ist die Steigung (oder Ableitung) der Funktion
in der Richtung ihres stärksten Zuwachses.
Beispiel:
Betrachten wir das Gravitationspotential, das von einer Masse M im Ursprung erzeugt wird:
GM
GM
.
=−
u(x, y, z) = − 2
2
2
r
x +y +z
(8.17)
Hier ist r der Abstand einer Probemasse m vom Ursprung und mu(x, y, z) ist die potentielle Energie dieser Probemasse. G ist die Gravitationskonstante. Der Gradient des Gravitationspotentials
lautet:


1
GM


−
·
2x
3
∂u
 2 (x2 +y2 +z2 ) 2

∂x
 1

 ∂u 
GM

∇u =  ∂y  = −  − 2 2 2 2 32 · 2y 

(x +y +z )
 1

∂u
GM
− 2 2 2 2 3 · 2z
∂z
(x +y +z ) 2



x
x
GM
 GM

 GM 
 y  = 2 er .
3 ·  y  =
r3
r
(x2 + y 2 + z 2 ) 2
z
z

=
(8.18)
Die Äquipotentialflächen dieses Feldes sind konzentrische Kugeln und ∇u ist orthogonal zur entsprechenden Kugeloberfläche. Die Kraft auf die Probemasse m
GM m
F (r) = −m∇u = − 2 er
r
(8.19)
8 Differentiation von Feldern: grad, div und rot
185
zeigt zum Ursprung und ist somit attraktiv.
Beispiel:
Das Feld
u(x, y) = x2 + y 2
(8.20)
hat den Gradienten
∇u
8.2.3
=
∂u
∂x
∂u
∂y
=
2x
2y
.
(8.21)
Richtungsableitung
Die Ableitung der Funktion A(x, y, z) in Richtung eines beliebigen Vektors a lässt sich ebenfalls
mit Hilfe des Gradienten ausdrücken:
∇A(x, y, z) ·
a
= ∇A · ea .
|a|
(8.22)
Die Größe nennt man die Richtungsableitung in Richtung des Vektors a. Man erhält sie durch
Projektion des Gradienten ∇A auf den normierten Richtungsvektor ea = |aa| . Die Richtungsableitung ist in Richtung des Gradienten am größten.
8.2.4
Rechenregeln
Für den Gradienten gelten folgende Rechenregeln:
•
•
•
•
Für ein konstantes Feld A(r) = c folgt:
Summenregel:
Faktorregel:
Produktregel:
∇A = 0,
∇(A + B) = ∇A + ∇B,
∇(αA) = α∇A,
∇(AB) = A∇B + B∇A.
Diese Regeln folgen aus den Regeln für die partielle Differentiation.
Zusammenfassend halten wir fest:
• Der Gradient von A(r ) ist ein Vektor (eigentlich ein Vektorfeld), dessen Komponenten die partiellen Ableitungen nach den Koordinaten sind.
• Der Gradient entsteht durch Anwendung des Nabla-Operators auf A(r).
• ∇A steht orthogonal zu den Niveauflächen.
• ∇A zeigt in Richtung des stärksten Zuwachses von A(r).
• ∇A · ea = ∇A · (a/|a|) ist die Richtungsableitung von A in Richtung von a.
186
8 Differentiation von Feldern: grad, div und rot
8.3
Divergenz
8.3.1
Definition
Die Divergenz eines Vektorfeldes beschreibt die Quellstärke eines Feldes. Im Falle des elektrischen
Feldes zum Beispiel verknüpft die Divergenz das elektrische Feld mit dessen Quellen, also mit den
eines Vektorfeldes A(
r ) als das Skalarprodukt
Ladungen. Formal definiert man die Divergenz divA
des Nabla-Operators mit dem Feld:
= ∇·A
= ∂Ax + ∂Ay + ∂Az .
divA
∂x
∂y
∂z
(8.23)
Die Divergenz eines Vektorfeldes ist ein skalares Feld. (Ganz im Gegensatz zum Gradienten, der
aus einem Skalarfeld ein Vektorfeld macht.)
Beispiel:
Die Divergenz des Vektorfeldes


x2 y

r) = 
A(
 zxy 
x2 + y 2
(8.24)
ist
2
2
2
= ∇·A
= ∂(x y) + ∂(zyx) + ∂(x + y ) = 2xy + zx = x(2y + z).
divA
∂x
∂y
∂z
8.3.2
(8.25)
Anschauliche Interpretation als lokale Quellstärke
Ein anschauliches Verständnis der Divergenz können wir durch folgende Überlegung erreichen. Betrachten wir eine strömende Flüssigkeit, deren räumliche Strömung durch das Geschwindigkeitsfeld

vx (x, y, z)


v (x, y, z) =  vy (x, y, z) 
vz (x, y, z)

(8.26)
beschrieben wird. Wir wollen nun die Flüssigkeitsmenge berechnen, welche pro Zeiteinheit in ein
kleines Volumen um den willkürlich gewählten Punkt P (x, y, z) eintritt, beziehungsweise aus diesem
Volumen austritt (siehe Abb. 8.8).
Dieses infinitesimale Volumen wird durch ebene Seitenflächen begrenzt, die parallel zu den Koordinatenebenen liegen. Die Seitenlängen des dadurch entstehenden Quaders sind in x-, y- und
z-Richtung jeweils dx, dy und dz. Der Punkt P (x, y, z) liegt im Mittelpunkt des Quaders, das heißt
die Seitenflächen haben einen Abstand von dx/2 beziehungsweise dy/2 und dz/2 vom Punkt P . Zu
jeder Seitenfläche definieren wir einen Flächenvektor, dessen Betrag gleich dem Flächeninhalt der
jeweiligen Seitenfläche ist. Die Flächenvektoren stehen senkrecht auf die jeweiligen Seitenflächen
8 Differentiation von Feldern: grad, div und rot
187
Abbildung 8.8: Ein kleines quaderförmiges Volumen um Punkt P mit Flächenvektoren f1 , f2 , f3 ,
f4 , f5 und f6 . Am Punkt P = (x, y, z) herrscht die Geschwindigkeit v(x, y, z) vor.
und zeigen nach außen. Diese in Abb. 8.8 eingezeichneten Flächenvektoren sind:


dydz


f1 =  0  = −f2 ,
0


0


f3 =  dzdx  = −f4 ,
(8.27)
(8.28)
0


0


f5 =  0  = −f6 .
dxdy
(8.29)
Wir bestimmen nun die Flüssigkeitsmenge, die pro Zeiteinheit durch die Seitenwände des Quaders
strömt (also den Fluss). Wie wir früher bereits gesehen haben, ist der Fluss durch eine Fläche
gleich dem Skalarprodukt des Geschwindigkeitsvektors mit dem Flächenvektor. Wenn wir für jede
Fläche den Geschwindigkeitsvektor in der Mitte der Fläche nehmen, ergibt sich zum Beispiel für
die Seitenfläche mit dem Flächenvektor f1 der Fluss:
dx
, y, z).
f1 · v (x +
2
(8.30)
Dabei ist v (x+ dx
2 , y, z) der Geschwindigkeitsvektor in der Mitte der Fläche mit dem Flächenvektor
f1 . Durch Verwendung der Komponentendarstellung des Vektors f1 ergibt sich für den Fluss
vx (x +
dx
, y, z)dydz.
2
(8.31)
Auf ähnliche Weise erhalten wir für die gegenüberliegende Seitenfläche mit dem Vektor f2 einen
Fluss von
− vx (x −
dx
, y, z)dydz.
2
(8.32)
188
8 Differentiation von Feldern: grad, div und rot
Für die Flüsse durch die anderen Flächen erhalten wir jeweils:
f3 :
f4 :
f5 :
f6 :
dy
, z)dxdz,
2
dy
, z)dxdz,
−vy (x, y −
2
dz
vz (x, y, z + )dxdy,
2
dz
−vz (x, y, z − )dxdy.
2
vy (x, y +
(8.33)
(8.34)
(8.35)
(8.36)
Die Änderung der Flüssigkeitsmenge in unserem kleinen Quader ergibt sich aus den Flüssigkeitsmengen, die in den Quader hinein oder aus dem Quader heraus fließen. Durch Addition der Flüssigkeitsmengen, die durch die einzelnen Flächen fließen, erhalten wir den Verlust oder den Überschuss
an Flüssigkeit, der pro Zeiteinheit für unser kleines Volumen zu verzeichnen ist:
$
#
dx
dx
, y, z) − vx (x −
, y, z) dydz
vx (x +
2
2
$
#
dy
dy
, z) − vy (x, y −
, z) dxdz
+
vy (x, y +
2
2
#
$
dz
dz
+
vz (x, y, z + ) − vz (x, y, z − ) dxdy.
(8.37)
2
2
Wir multiplizieren und dividieren nun den ersten dieser drei Terme mit dx, den zweiten mit dy
und den dritten mit dz:
vx (x +
+
+
dx
2 , y, z) −
vx (x −
dx
2 , y, z)
dxdydz
dx
dy
vy (x, y + dy
2 , z) − vy (x, y − 2 , z)
dxdydz
dy
dz
vz (x, y, z + dz
2 ) − vz (x, y, z − 2 )
dxdydz.
dz
(8.38)
Für kleine Kantenlängen werden aus den drei Quotienten im obigen Ausdruck partielle Ableitungen
und wir erhalten:
∂vx
∂vy
∂vz
∂vy
∂vz
∂vx
dV +
dV +
dV =
+
+
dV.
(8.39)
∂x
∂y
∂z
∂x
∂y
∂z
Mit Hilfe der Divergenz können wir diesen Ausdruck schreiben als:
div v dV = (∇ · v )dV.
(8.40)
Die zeitliche Änderung der Flüssigkeitsmenge in unserem Quader ist also durch das Produkt
der Divergenz des Strömungsfeldes mit dem infinitesimalen Volumen dV gegeben. Die Divergenz
beschreibt also den Gewinn oder Verlust an Flüssigkeit pro Zeiteinheit in einem kleinen Volumselement dV um (x, y, z). Für eine inkompressible Flüssigkeit ist die Flüssigkeitsmenge im Volumen
natürlich konstant. Für eine kompressible Flüssigkeit hingegen kann diese Menge fluktuieren und
∇ · v kann verschieden von 0 sein. (Genau genommen müssen wir hier ∇(ρv ) statt ∇v betrachten.)
Falls div v > 0, überwiegt der Abfluss. Das heißt, es fließt mehr Flüssigkeit aus dem Volumen
heraus als in das Volumen hinein. Man sagt in diesem Fall, dass sich im Volumen dV eine Quelle
befindet. Falls hingegen div v < 0, überwiegt der Zufluss und es fließt eine größere Flüssigkeitsmenge in das Volumen dV hinein als aus dem Volumen dV heraus. Im Volumen dV befindet sich
dann eine Senke. Für div v = 0 halten sich Zufluss und Abfluss genau die Waage und man sagt,
das Feld ist in diesem Punkt quellenfrei.
8 Differentiation von Feldern: grad, div und rot
189
eines Feldes A
wird auch als dessen lokale Quellstärke bezeichnet. Die
Die Divergenz divA
Divergenz ist eine lokale Größe, die sich von einem Punkt zum anderen verändern kann. Die
des Vektorfeldes A
ist selbst ein Skalarfeld.
Divergenz div A
Beispiel:
Betrachten wir die Kraft F auf eine Masse m im Gravitationsfeld, das durch die Masse M im
Ursprung erzeugt wird (siehe Abb. 8.9):


x
GM m 

(8.41)
F = − 3  y  .
r
z
Die Divergenz des Gravitationsfeldes ist
∂Fx
∂Fy
∂Fz
divF = ∇ · F =
+
+
.
∂x
∂y
∂z
(8.42)
Die partielle Ableitung der x-Komponente der Kraft nach der Koordinate x ist
∂Fx
∂x
= −GM m
∂
x
∂x (x2 + y 2 + z 2 ) 32
= −GM m
(x2 + y 2 + z 2 ) 2 − x 32 (x2 + y 2 + z 2 ) 2 · 2x
(x2 + y 2 + z 2 )3
3
3
1
1
(x2 + y 2 + z 2 ) 2 − 3x2 (x2 + y 2 + z 2 ) 2
(x2 + y 2 + z 2 )3
r3 − 3x2 r
= −GM m
.
r6
= −GM m
(8.43)
Auf ähnliche Weise erhalten wir:
r3 − 3y 2 r
∂Fy
= −GM m
∂y
r6
und
r3 − 3z 2 r
∂Fz
= −GM m
.
∂z
r6
(8.44)
Durch Addieren dieser drei partiellen Ableitungen ergibt sich
div F = −GM m
3r3 − 3(x2 + y 2 + z 2 )r
3r3 − 3r3
= −GM m
= 0.
6
r
r6
(8.45)
Das Gravitationsfeld ist also überall, wo es definiert ist (für r = 0), quellenfrei. Über den Ursprung, also den Punkt (0,0,0), können wir hier keine Aussage machen, da in diesem Punkt das
Feld F divergiert. Eine mathematisch weiterführende Betrachtung zeigt jedoch, dass das Gravitationsfeld genau im Ursprung eine punktförmige Quelle besitzt, die durch eine δ-Funktion dargestellt
werden kann. Überall sonst ist das Gravitationsfeld quellenfrei, da wir ja keine zusätzliche Masse
betrachtet haben.
Beispiel:
y, z) = (xy 2 , z 2 + y 2 , 12xyz 3 ). Die Divergenz dieses Feldes ist:
Gegeben sei das Feld A(x,
= ∂Ax + ∂Ay + ∂Az = y 2 + 2y + 36xyz 2.
div A
∂x
∂y
∂z
8.3.3
Rechenregeln
Für die Divergenz gelten folgende Rechenregeln:
(8.46)
190
8 Differentiation von Feldern: grad, div und rot
Abbildung 8.9: Die Kraft F auf eine Masse m im Gravitationsfeld der Masse M im Ursprung.
y, z) = c gilt:
• Für ein konstantes Feld A(x,
= 0.
div A
(8.47)
• Summenregel:
+ B)
div (A
+ B)
= ∇·A
+∇·B
= ∇ · (A
+ div B.
= div A
(8.48)
• Faktorregel:
= αdiv A.
div (αA)
(8.49)
• Produktregel für das Produkt eines Skalarfeldes A mit einem Vektorfeld B:
div (AB)
= A(∇ · B)
+B
· ∇A
= ∇ · (AB)
+B
· grad A.
= A div B
(8.50)
Diese Beziehung lässt sich leicht durch explizites Ausführen der partiellen Differentiation verstehen:
∇ · (AB)
=
=
=
∂ABx
∂ABy
∂ABz
+
+
∂x
∂y
∂z
∂Bx
∂By
∂Bz
∂A
∂A
∂A
Bx
+A
+ By
+A
+ Bz
+A
∂x
∂x
∂y
∂y
∂z
∂z
∂Bx
∂By
∂Bz
∂A
∂A
∂A
+ By
+ Bz
+
+
+A
Bx
∂x
∂y
∂z
∂x
∂y
∂z
B·∇A
=
8.4
A∇·B
· ∇A + A∇ · B
=B
· grad A + A div B.
B
(8.51)
Laplace-Operator
Wenn wir den Gradienten eines Skalarfeldes A bilden, erhalten wir das Vektorfeld
∂A ∂A ∂A
grad A = ∇A =
,
,
.
∂x ∂y ∂z
(8.52)
8 Differentiation von Feldern: grad, div und rot
191
Wenden wir nun den Nabla-Operator auf dieses Vektorfeld an (wir bilden also dessen Divergenz),
erhalten wir


∂A
∂x
∂A
∂y
∂A
∂z

div grad A = ∇ · (∇A) = ∇ · 
 ∂2A ∂2A ∂2A
+
+
.
=
∂x2
∂y 2
∂z 2
(8.53)
Wir schreiben dafür auch
div grad A = ∇2 A = ∆A
2
2
(8.54)
2
∂
∂
∂
und nennen den Operator ∆ = ∂x
2 + ∂y 2 + ∂z 2 den Laplace-Operator. Der Laplace-Operator
ist ein Differentialoperator, der zum Beispiel in der Poissongleichung vorkommt, welche das von
einer Ladungsverteilung erzeugte elektrische Potential beschreibt.
8.5
Rotation
8.5.1
Definition
r ) können wir auch das
Neben dem Skalarprodukt des Nabla-Operators mit dem Vektorfeld A(
Vektorprodukt von ∇ und A bilden und erhalten dadurch die Rotation (Englisch: curl ) von A:

r) = ∇ × A
=
rot A(

∂
∂x
∂
∂y
∂
∂z
 
Ax
 
 
 ×  Ay  = 

Az


∂Az
∂y
∂Ax
∂z
∂Ay
∂x
−
−
−
∂Ay
∂z
∂Az
∂x
∂Ax
∂y


.

(8.55)
des Vektorfeldes A
ist selbst ein Vektorfeld. Man nennt dieses Feld auch WirDie Rotation rot A
belfeld.
8.5.2
Anschauliche Interpretation als lokale Wirbelstärke
Zur anschaulichen Interpretation der Rotation (als lokale Wirbelstärke) betrachten wir ein konkretes Beispiel. Wir stellen uns eine Flüssigkeit vor, in der ein Wirbel vorhanden ist. Von oben
betrachtet sind die Feldlinien des zugehörigen Geschwindigkeitsfeldes konzentrische Kreise um den
Ursprung (siehe Abb. 8.10).
Die Geschwindigkeit v der Flüssigkeit am Ort r sei gegeben durch (siehe Abschnitt 2.8.2)
v (r) = ω × r.
(8.56)
wobei ω ein Winkelgeschwindigkeitsvektor mit Betrag |ω | = ω ist und normal zur Zeichenebene
steht sowie zum Betrachter hin zeigt. Gemäß Gleichung (8.56) ist die Geschwindigkeit v (r) senkrecht auf r und ω und liegt deshalb in der Zeichenebene. Für alle Entfernungen vom Mittelpunkt
bewegt sich die Flüssigkeit mit derselben Winkelgeschwindigkeit ω um den Ursprung. Man nennt
so einen Wirbel einen homogenen Wirbel mit der Drehachse durch den Ursprung. Je großer ω
ist, umso schneller dreht sich der Wirbel (umso stärker ist er also).
Die Rotation dieses Strömungsfeldes ist gemäß der Definition in Gleichung (8.55) gegeben durch:
rot v (r) = ∇ × v (r) = ∇ × (ω × r).
(8.57)
192
8 Differentiation von Feldern: grad, div und rot
Abbildung 8.10: Geschwindigkeitsfeld v = ω × r einer rotierenden Flüssigkeit.
Falls wir die z-Achse in Richtung ω
legen, haben wir

 
 

0
x
−ωy

 
 

× r =  0  ×  y  =  ωx 
ω
ω
z
0
(8.58)
und deshalb
 
 

∂
−ωy
−ωy
∂x
  ∂  


= ∇ ×  ωx  =  ∂y
 ×  ωx 
∂
0
0
∂z
 


∂
(ωx)
− ∂z
0
 


∂
= 
=
− ∂z
(ωy)
  0 ,
∂
∂
2ω
∂x ωx + ∂y ωy

rot v (r)
(8.59)
das heißt, die Rotation von diesem speziellen Strömungsfeld ist gleich dem doppelten Winkelgeschwindigkeitsvektor ω
:
rot v = 2ω.
(8.60)
Wir können die Rotation von v also sowohl nach Richtung als auch nach Größe als eine lokale
r ) auch das Wirbelfeld von A(
r ). In unserem
Wirbelstärke auffassen. Man nennt daher rot A(
Beispiel ist rot v konstant, im Allgemeinen ändert sich aber die Rotation rot v von Ort zu Ort.
Zur weiteren Veranschaulichung der Rotation betrachten wir eine inhomogene Strömung, in der
die Strömungsgeschwindigkeit v (r) vom Ort abhängt. Die in Abb. 8.11 dargestellte Strömung
beispielsweise hat ein Geschwindigkeitsprofil, bei dem die Geschwindigkeit in x-Richtung linear
mit der y-Koordinate zunimmt, das heißt, die Strömungsgeschwindigkeit ist oben höher als unten.
Wir stellen uns nun einen kleinen Quader vor, der mit der Strömung mitschwimmt (etwa einen
kleinen Holzblock, der in einem Bach mit der Strömung mittreibt) (siehe Abb. 8.12).
Aus der Perspektive des Quaders, also in einem mitbewegten Bezugssystem, bewegt sich die Flüssigkeit oberhalb und unterhalb des Quaders in entgegengesetzte Richtung und verursacht dadurch eine
Drehung des Quaders (siehe Abb. 8.13).
8 Differentiation von Feldern: grad, div und rot
193
Abbildung 8.11: Geschwindigkeitsfeld einer Strömung mit linearem Geschwindigkeitsprofil.
Abbildung 8.12: Mitschwimmendes Objekt in der Strömung von Abb. 8.11.
Wie schnell rotiert nun dieser Quader? Unter der Annahme, dass die Translation des Quaders
mit der an seinem Mittelpunkt vorherrschenden Geschwindigkeit v (x, y) erfolgt und die oberen
und unteren Seitenflächen sich mit der Strömung mitbewegen, ist die Winkelgeschwindigkeit des
Quaders gegeben durch
(
' dy
−
v
x,
y
−
vx x, y + dy
x
2
2
,
(8.61)
ω=
dy
wobei dy die Kantenlänge des Quaders in y-Richtung ist. Für kleine Quader gilt also
ω=
∂vx
.
∂y
(8.62)
Für eine solche Strömung, in der die x-Komponente der Geschwindigkeit linear von der y-Komponente
abhängt (man nennt eine solche Strömung eine Scherströmung mit linearem Geschwindigkeitsprofil),
vx
=
γy,
(8.63)
vy
vz
=
=
0,
0,
(8.64)
(8.65)
x
erhalten wir für die Winkelgeschwindigkeit des Quaders ω = ∂v
∂y = γ. Die Konstante γ beschreibt
dabei den Anstieg des Geschwindigkeitsprofils. Die Rotation dieses Geschwindigkeitsfeldes ist folglich:
 ∂  
 
 

γy
0
0
∂x
 ∂  
 
 

rot v = ∇ × v =  ∂y
(8.66)
 ×  0  =  0  =  0  = −ω.
∂
∂z
0
−γ
−ω
Auch hier ist also die Rotation ein Maß für die lokale Wirbelstärke. (Das Minuszeichen haben wir
hier, weil die Rotation in der xy-Ebene in mathematisch negativer Richtung erfolgt.) Die Rotation
beschreibt also, wie ein kleines Teilchen rotiert, das mit der Strömung mittreibt.
r ) nennt man an der Stelle r wirbelfrei, wenn rot A
an der Stelle r verschwindet.
Ein Feld A(
Beispiel:
Wir betrachten wieder das Schwerefeld


x
GM m


F = −
3 ·  y .
(x2 + y 2 + z 2 ) 2
z
(8.67)
194
8 Differentiation von Feldern: grad, div und rot
Abbildung 8.13: Geschwindigkeitsfeld der Strömung von Abb. 8.11 aus der Perspektive des mitschwimmenden Objekt.
Die Rotation dieses Feldes ist


rot F = ∇ × F = 

∂Fz
∂y
∂Fx
∂z
∂Fy
∂x
−
−
−
∂Fy
∂z
∂Fz
∂x
∂Fx
∂y


.

(8.68)
Die partielle Ableitung ∂Fz /∂y ist gegeben durch:
∂Fz
∂y
∂
z
2y
−GM m
= −GM mz
5
2
∂y (x2 + y 2 + z 2 ) 32
(x + y 2 + z 2 ) 2
3GM mzy
3GM mzy
.
5 =
2
2
2
r5
2
(x + y + z )
=
=
3
−
2
(8.69)
Allgemein gilt
3GM mαβ
∂Fα
=
∂β
r5
für α, β = x, y, z und α = β.
(8.70)
Das heißt aber, dass
∂Fα
∂Fβ
=
.
∂β
∂α
Infolgedessen verschwinden alle Komponenten der Rotation in Gleichung (8.68):
 
0
 
rot F =  0  = 0.
(8.71)
(8.72)
0
Das Gravitationsfeld ist also wirbelfrei (so wie alle radialen (kugelsymmetrischen) Vektorfelder).
8.5.3
Rechenregeln
Für die Rotation gelten folgende Rechenregeln:
r ) = c gilt:
• Für ein konstantes Feld A(
= 0.
rot A
(8.73)
• Summenregel:
+ B)
rot (A
+ rot B.
= rot A
(8.74)
• Faktorregel:
= α(∇ × A)
∇ × (αA)
= αrot A).
(rot αA
(8.75)
8 Differentiation von Feldern: grad, div und rot
195
• Produktregel für Produkt aus Skalar- und Vektorfeld:
rot (AB)
=
+ grad A × B.
A rot B
Diese Regeln ergeben sich einfach durch Anwendung der Regeln
Insbesondere haben wir für die letzte Regel:
 

∂
ABx
∂x
 ∂  
rot (AB) = ∇ × (AB) =  ∂y  ×  ABy
∂
ABz
∂z


∂
∂
(ABz ) − ∂z
(ABy )
 ∂y

∂
∂

=  ∂z (ABx ) − ∂x (ABz ) 





=

∂
∂x (ABy )
∂A
∂y
∂A
∂z
∂A
∂x
∂A
∂y
∂A
∂z
∂A
∂x
−
x
· Bx + A ∂B
∂z −
∂By
· By + A ∂x −
· Bz −
für die partielle Differentiation.



∂
∂y (ABx )
z
· Bz + A ∂B
∂y −
∂A
∂z
∂A
∂x
∂A
∂y
· By
∂A
∂z
∂A
∂x
∂A
∂y

∂By
∂z
z
· Bz − A ∂B
∂x
∂Bx
· Bx − A ∂y
· By − A

 

· Bz 
+
· Bx
(8.76)




∂By
∂z
∂Bz
x
A ∂B
−
A
∂z
∂x
∂B
x
A ∂xy − A ∂B
∂y
z
A ∂B
∂y − A




=



=
+ A(∇ × B)
= grad A × B
+ A rot B.
∇A × B
· Bx −
· By −
(8.77)
Da die Rotation eines Vektorfeldes wieder ein Vektorfeld ist, können wir auch die Rotation eines
Wirbelfeldes bilden:
= ∇ × (∇ × A).
rot (rot A)
(8.78)
Nach einigen algebraischen Umformungen findet man
= ∇(∇ · A)
− ∆A
∇ × (∇ × A)
(8.79)
= grad (divA)
− div grad A,
rot (rot A)
(8.80)
oder, anders ausgedrückt,
wobei die Anwendung des Laplace-Operators auf ein Vektorfeld komponentenweise definiert ist.
8.5.4
Wirbelfreie und quellenfreie Felder
• Ein Gradientenfeld
∇A =
∂A ∂A ∂A
,
,
∂x ∂y ∂z
ist nach dem Satz von Schwarz wirbelfrei:
 ∂   ∂A 

∇ × ∇A = 
∂x
∂
∂y
∂
∂z
 
×
∂x
∂A
∂y
∂A
∂z

 
=

∂2A
∂y∂z
∂2A
∂z∂x
∂2A
∂x∂y
(8.81)
−
−
−
∂2 A
∂z∂y
∂2 A
∂x∂z
∂2A
∂y∂x


 = 0.

(8.82)
Umgekehrt gilt auch, dass man in einem einfach zusammenhängenden Gebiet (das ist ein Ge als Gradienten eines Skalarfeldes ϕ darstellen
biet ohne “Löcher”) jedes wirbelfreie Feld B
kann:
=0
∇×B
⇒
es existiert ein Skalarfeld ϕ sodass :
= ∇ϕ.
B
(8.83)
196
8 Differentiation von Feldern: grad, div und rot
Das Skalarfeld ϕ ist nur bis auf eine Konstante bestimmt, da
∇(ϕ + C) = ∇ϕ.
(8.84)
Dieser Zusammenhang wird in Abschnitt 9.4.3 ausführlich diskutiert.
• Ein Wirbelfeld

=
∇×A

∂
∂x
∂
∂y
∂
∂z




Ax
 
 
 ×  Ay  = 

Az
∂Az
∂y
∂Ax
∂z
∂Ay
∂x
−
−
−
∂Ay
∂z
∂Az
∂x
∂Ax
∂y




(8.85)
ist quellenfrei:
=
∇ · (∇ × A)
∂ 2 Az
∂ 2 Ay
∂ 2 Ax
∂ 2 Az
∂ 2 Ay
∂ 2 Ax
−
+
−
+
−
= 0.
∂x∂y
∂x∂z
∂y∂z
∂y∂x ∂z∂x ∂z∂y
(8.86)
als die Rotation eines anderen
Es kann gezeigt werden, dass das quellenfreie Feld B
dargestellt werden kann:
Vekorfeldes A
=0
divB
⇒
sodass B
= ∇ × A.
es existiert ein Vektorfeld A
(8.87)
wird das Vektorpotential genannt. Es ist nur bis auf den Gradienten eines Skalarfeldes
A
bestimmt:
= ∇ × (A
+ grad χ).
∇×A
(8.88)
Die Eichung trägt nicht zum
Der Gradient grad χ ist die so genannte Eichung von A.
Wirbelfeld bei und kann deshalb benutzt werden, um Nebenbedingungen zu erfüllen. In
Abschnitt 9.4.4 werden wir uns näher mit dem Vektorpotential beschäftigen.
8.6
Zusammenfassung Nabla-Operator ∇
Der Nabla-Operator ist ein Differentialoperator, der auf Felder angewandt wird. Je nach Feldart
entstehen durch unterschiedliche Anwendung des Nabla-Operators verschiedene Felder:
Gradient:
Divergenz:
Rotation:
∇A(r)
r)
∇ · A(
r)
∇ × A(
(Richtung und Betrag des stärksten Anstiegs),
(Quellstärke),
(Wirbelstärke).
Durch Anwendung der Rechenregeln kann man zeigen:
• Gradientenfelder sind wirbelfrei: ∇ × (∇A) = 0.
= 0.
• Wirbelfelder sind quellenfrei: ∇ · (∇ × A)
können als Gradient eines Skalarfeldes ϕ dargestellt werden:
• Wirbelfreie Felder A
= ∇ϕ falls
A
= 0.
∇×A
(8.89)
können als Rotation eines anderen Vektorfeldes B
dargestellt werden:
• Quellenfreie Felder A
=∇×B
A
falls
= 0.
∇·A
(8.90)
8 Differentiation von Feldern: grad, div und rot
197
Die zweifache Anwendung des Nabla-Operators ergibt den Laplace-Operator
∇ · (∇A) =
∂2A ∂2A ∂2A
+
+
.
∂x2
∂y 2
∂z 2
(8.91)
Weiters gelten die folgenden Rechenregeln:
× B)
∇(A
=
× B)
∇ × (A
=
∇ × (∇ × A) =
·∇×A
−A
· ∇ × B,
B
· ∇)A
− B(∇
− (A
· ∇)B
+ A(∇
(B
· A)
· B),
(8.93)
− ∆A.
∇(∇A)
(8.94)
(8.92)
198
8 Differentiation von Feldern: grad, div und rot
Kapitel 9
Integration von Feldern: Kurvenund Flächenintegrale
Im Kapitel 2 haben wir gesehen, dass wir die bei der Verschiebung eines Körpers verrichtete
Arbeit mit Hilfe des Skalarproduktes der angewendeten Kraft F und der vektoriellen Verschiebung
r ausdrücken können:
W = F · r.
(9.1)
Wenn wir jedoch den Körper nicht auf einer geraden Linie bewegen beziehungsweise die Kraft
entlang des Weges nicht konstant ist, können wir diesen einfachen Ausdruck nicht mehr verwenden
(siehe Abb. 9.1). Das wäre etwa bei einem auf einem kurvigen Gleis gezogenen Fahrzeug oder
einer Seilbahn der Fall. Wenn wir die gesamte Strecke jedoch in kleine, annähernd gerade Stücke
zerlegen, können wir die in jedem kleinen Intervall verrichtete Arbeit mit Hilfe von Gleichung (9.1)
berechnen.
Abbildung 9.1: Verschiebung eines Körpers entlang eines geradlinigen (links) und eines gekrümmten
Weges (rechts).
Die Gesamtarbeit ergibt sich dann aus der Summe aller Arbeiten in den Teilstücken. Im Grenzfall
unendlich kleiner Intervalle wird diese Prozedur exakt und führt uns auf den Begriff des Kurvenintegrals. Auf ähnliche Weise können wir zum Beispiel auch den Fluss durch eine gekrümmte
Fläche als Summe der Flüsse durch viele kleine, annähernd ebene Flächenelemente ausdrücken und
gelangen so zum Flächenintegral. Wir werden ferner sehen, wie diese Integrale durch die Sätze
von Stokes und Gauß mit der Rotation und Divergenz von Vektorfeldern zusammenhängen.
199
200
9.1
9.1.1
9 Integration von Feldern: Kurven- und Flächenintegrale
Kurvenintegrale
Definition
Ein wichtiges Beispiel für ein Kurvenintegral ergibt sich bei der Berechnung der Arbeit, die geleistet
wird, wenn ein Körper in einem Kraftfeld entlang einer gegebenen Kurve verschoben wird. Wir
betrachten ein Kraftfeld F (r), zum Beispiel das Gravitationsfeld, das die Kraft beschreibt, die im
Punkt r auf einen Körper wirkt. Wir stellen uns nun vor, dass in diesem Kraftfeld der Körper auf
einer vorgegebenen Kurve C vom Punkt ra zum Punkt rb verschoben wird (siehe Abb. 9.2).
Abbildung 9.2: Ein Körper wird im Kraftfeld F (r) entlang eines gekrümmten Weges von ra nach
rb verschoben.
An jedem Punkt entlang dieses Weges herrscht eine bestimmte Kraft F , die Arbeit verrichtet. Zur
Berechnung dieser Arbeit können wir nun nicht den Ausdruck W = F · s aus Kapitel 2 verwenden,
weil sich die Kraft sowohl in Betrag als auch in Richtung entlang des Weges ändern kann und der
Weg im Allgemeinen nicht geradlinig ist. Um die gesamte Arbeit zu ermitteln, die bei Verschiebung
des Körpers von ra nach rb geleistet wird, zerlegen wir den Weg C in N kleine, gerade Stücke ∆ri ,
die sich aus den Differenzen ∆ri = ri+1 − ri , i = 0, . . . N − 1 auf der Kurve liegender Punkte ri
ergeben (siehe Abb. 9.3). Durch Wahl einer genügend großen Zahl N kann die Kurve C durch die
geraden Segmente ∆ri beliebig gut angenähert werden.
Abbildung 9.3: Durch Zerlegen des Weges in viele kurze und annähernd gerade Teilstücke ∆ri
können wir die geleistete Arbeit als ein Wegintegral ausdrücken.
Für eine genügend feine Zerlegung, das heißt, für genügend kleine Kurventeilstücke ∆ri , können
wir die Kraft F in jedem Teilstück als konstant betrachten. Daher kann die im Teilstück i geleistete
Arbeit ∆Wi als das bekannte Skalarprodukt der Kraft F (ri ) am Ort ri mit der kleinen Verschiebung
∆ri geschrieben werden:
∆Wi = F (ri ) · ∆ri .
(9.2)
Die insgesamt geleistete Arbeit ist die Summe der in den Teilstücken geleisteten Arbeiten ∆Wi
W ≈
N
−1
i=0
∆Wi =
N
−1
F (ri ) · ∆ri .
(9.3)
i=0
Im Grenzwert unendlich kleiner (und unendlich vieler) Wegstücke ∆ri erhalten wir den exakten
9 Integration von Feldern: Kurven- und Flächenintegrale
201
Wert der im Kraftfeld F (r) auf dem vorgegebenen Weg geleisteten Arbeit:
W = lim
N →∞
N
−1
%
F (ri ) · ∆ri =
F (r) · dr.
(9.4)
C
i=0
Wir nennen dies das Kurvenintegral (oder Linienintegral) des Vektorfeldes F längs der Raumkurve C. (Wir können das Kurvenintegral für ein beliebiges Vektorfeld definieren, nicht nur für die
Kraft F .) Oft schreibt man für das Kurvenintegral auch:
%rb
%rb
F (r) · dr
W =
F (r) · dr.
oder W =
ra
(9.5)
ra ,C
Abbildung 9.4: Bei einem geschlossenen Weg C sind Ausgangspunkt ra und Endpunkt rb identisch:
ra = rb .
Falls ra = rb , die Kurve C also geschlossen ist (siehe Abb. 9.4), schreibt man für das Integral
:
F (r) · dr = Zc
(9.6)
C
und nennt es die Zirkulation von F entlang C oder auch das geschlossene Kurvenintegral
oder Ringintegral.
9.1.2
Eigenschaften
Da im oben definierten Kurvenintegral der Ausdruck, über den integriert wird, ein Skalarprodukt
ist, ist das Kurvenintegral selbst auch ein Skalar.
Wenn man bei einem Kurvenintegral den Integrationsweg umkehrt (also den Integrationsweg in
umgekehrter Richtung durchläuft), ändert sich das Vorzeichen des Integrals
%
%
F (r) · dr = −
F (r) · dr,
(9.7)
C
−C
wobei −C den in umgekehrter Richtung durchlaufenen Integrationsweg bezeichnet. Diese Eigenschaft folgt daraus, dass bei einer Umkehrung des Integrationsweges alle ∆ri ihr Vorzeichen wechseln und somit das Kurvenintegral selbst auch sein Vorzeichen wechselt.
Abbildung 9.5: Der Weg C besteht aus den beiden Teilwegen C1 und C2 .
202
9 Integration von Feldern: Kurven- und Flächenintegrale
Ferner ist das Kurvenintegral additiv, das heißt das Kurvenintegral über einem aus zwei Teilstücken
C1 und C2 bestehenden Weg C ist die Summe der Kurvenintegrale über C1 und C2 :
%
%
%
F (r) · dr =
F (r) · dr +
F (r) · dr.
(9.8)
C
C1
C2
Wenn also die Zirkulation ZC entlang eines geschlossenen Weges C verschwindet, sind die Kurvenintegrale entlang der beiden Kurven C1 und C2 , die die beiden Punkte ra und rb miteinander
verbinden, gleich (siehe Abb. 9.6):
%
%
%
%
:
F (r) · dr =
F (r) · dr +
F (r) · dr =
F (r) · dr −
F (r) · dr.
(9.9)
ZC =
C
−C2
C1
C1
C2
Da aber ZC = 0, folgt:
%
%
F (r) · dr =
C1
F (r) · dr.
(9.10)
C2
Abbildung 9.6: Die Punkte ra und rb liegen auf einer geschlossenen Kurve. Man kann sowohl über
die Kurve C1 als auch über die Kurve C2 von ra nach rb gelangen.
9.1.3
Berechnungsverfahren
Um Kurvenintegrale auszuwerten, führen wir sie auf gewöhnliche Integrale zurück. Falls die Kurve
C in Parameterform gegeben ist, das heißt, falls der Ortsvektor


x(t)


r(t) =  y(t) 
(9.11)
z(t)
als Funktion eines Parameters t im Bereich ta ≤ t ≤ tb gegeben ist, können wir das Kurvenintegral
in ein einfaches Integral über den Parameter t verwandeln. In diesem Fall entspricht jeder Punkt
ri = r(ti ) in der Zerlegung der Kurve einem bestimmten Parameterwert ti . Die beiden Randpunkte
der Kurve, ra und rb , erhalten wir für die Parameterwerte ta und tb :
ra = r(ta ) und rb = r(tb ).
(9.12)
Jedes gerade Teilstück ∆ri = ri+1 − ri entspricht dann einem Teilintervall ∆ti = ti+1 − ti des
Parameters. In der Summe in Gleichung (9.3) dividieren und multiplizieren wir nun jeden Term
mit ∆ti und erhalten dadurch:
W ≈
N
−1
i=0
F (ri ) · ∆ri =
N
−1
i=0
∆ri
F (ri ) ·
∆ti .
∆ti
(9.13)
9 Integration von Feldern: Kurven- und Flächenintegrale
203
Im Grenzfall N → ∞ wird aus ∆ri /∆ti die Ableitung des Ortsvektors nach dem Parameter t:
lim
N →∞
dr(t)
∆ri
=
.
∆ti
dt
(9.14)
Damit wird das Linienintegral zu
%tb
F (r(t)) ·
W =
dr
dt
dt.
(9.15)
ta
Dieses Integral ist ein gewöhnliches Integral, dessen Integrand, der Skalar F (r(t)) · (dr /dt), eine
Funktion des Parameters t ist. Dabei beinhaltet der Vektor dr(t)/dt, der in jedem Punkt tangential zur Kurve ist, die Information über den Verlauf der Kurve (siehe Abb. 9.7). (Wenn man den
Vektor dr(t)/dt normiert, erhält man den Tangentialvektor t = (dr (t)/dt)/|dr(t)/dt|.) Falls t die
Zeit ist, ist dr(t)/dt = v (t) die Geschwindigkeit des Körpers, der sich gemäß r(t) entlang C bewegt.
Abbildung 9.7: Der Geschwindigkeitsvektor dr(t)/dt ist tangential zur Kurve r(t).
Aus dieser Darstellung des Linienintegrals ergibt sich folgendes Rezept zur Berechnung von Linienintegralen in Parameterform:
1. Zunächst drücken wir den Feldvektor F (r) durch Einsetzen der parameterabhängigen Koordinaten x(t), y(t) und z(t) als Funktion des Parameters t aus.
2. Dann differenzieren wir den Vektor r(t) nach t und bilden das Skalarprodukt F (r(t))·(dr /dt).
3. Schließlich integrieren wir dieses Skalarprodukt, das nur mehr eine Funktion von t ist, in den
Grenzen von ta bis tb .
Beispiel:
Wir bestimmen das Integral des Feldes F (x, y) = (2x + y, x) entlang der in Parameterform gegebenen Kurve r(t) = (t, t2 ) (das ist eine Parabel) zwischen den Punkten, die zu den Parametern
ta = 0 und tb = 1 gehören. Die Kurve beginnt im Ursprung, r(ta = 0) = (0, 0), und endet im
Punkt r(tb = 1) = (1, 1). Der Feldvektor als Funktion von t ist gegeben durch:
2
2x(t)
+
y(t)
2t
+
t
F (x(t), y(t)) =
=
.
(9.16)
x(t)
t
Ableitung des Ortsvektors nach t liefert
dr
=
dt
1
2t
(9.17)
204
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.8: Eine Kraft F (r) verrichtet Arbeit entlang einer Parabel.
und somit
dr
F ·
=
dt
2t + t2
t
1
2t
·
= 2t + t2 + 2t2 = 2t + 3t2 .
(9.18)
Das Kurvenintegral ist deshalb gegeben als:
%tb %
F (r) · dr =
C
dr
F ·
dt
%1
!1
3t3 !!
2t2
+
(2t + 3t )dt =
= 1 + 1 = 2.
2
3 !0
2
dt =
ta
0
(9.19)
Falls die Integrationskurve C nicht in Parameterform vorliegt, können wir folgendermaßen vorgehen. In der Summe in Gleichung (9.3) lässt sich jedes Teilstück und der dazugehörige Vektor F (ri )
in Komponenten zerlegen:
∆ri
=
∆xiex + ∆yiey + ∆ziez
(9.20)
und
F (ri )
= Fx (ri )ex + Fy (ri )ey + Fz (ri )ez .
(9.21)
Das Skalarprodukt F (ri ) · ∆ri können wir somit schreiben als
F (ri ) · ∆ri = Fx (ri )∆xi + Fy (ri )∆yi + Fz (ri )∆zi
(9.22)
und die Summe in Gleichung (9.3) besteht somit aus drei Termen, die zu den drei Koordinatenrichtungen gehören:
W ≈
Fx (ri )∆xi +
Fy (ri )∆yi +
Fz (ri )∆zi .
(9.23)
Im Grenzwert einer unendlich feinen Zerlegung des Integrationsweges in Teilstücke erhalten wir
daraus die Summe dreier gewöhnlicher Integrale:
%xb
W
=
%yb
Fx (r)dx +
xa
%zb
Fy (r)dy +
ya
%xb
=
za
%yb
Fx (x, y, z)dx +
xa
Fz (r)dz
%zb
Fy (x, y, z)dy +
ya
Fz (x, y, z)dz.
(9.24)
za
Das Problem ist hier, dass die Integranden von allen drei Variablen x, y und z abhängen und nicht
nur von der jeweiligen Integrationsvariablen. Betrachten wir zum Beispiel das erste Integral. Hier
9 Integration von Feldern: Kurven- und Flächenintegrale
205
&Abbildung 9.9: Räumliche Kurve und ihre Projektion in die xy-Ebene. Bei der Berechnung von
Fx (r)dx müssen sowohl y als auch z als Funktion von x ausgedrückt werden.
gehören zu jedem x-Wert auch wohldefinierte Werte von y und z (siehe Abb. 9.9). Diese hängen
von der Gestalt der Integrationskurve ab. Falls wir nun y und z mit Hilfe der Kurve als Funktion
von x ausdrücken, erhalten wir für das erste Integral
%xb
Fx (x, y(x), z(x))dx,
(9.25)
xa
ein gewöhnliches Integral über x. (Falls wir y und z aus Eindeutigkeitsgründen nicht als Funktion
von x ausdrücken können, zerlegen wir die Integrationskurve in Teilbereiche, sodass dies möglich
ist.)
Mit den anderen beiden Integralen verfahren wir analog und erhalten schließlich
%xb
%yb
Fx (x)dx +
W =
xa
%zb
Fy (y)dy +
ya
Fz (z)dz,
(9.26)
za
wobei Fx (x) = Fx (x, y(x), z(x)), Fy (y) = Fy (x(y), y, z(y)) und Fz (z) = Fz (x(z), y(z), z). Die
Information über die Gestalt der Kurve C ist nun in den Funktionen Fx (x), Fy (y) und Fz (z)
enthalten.
Beispiel:
Wir berechnen wieder das Kurvenintegral aus dem letzten Beispiel. Hier war
F (x, y) = (2x + y, x)
(9.27)
und die Kurve war gegeben durch r(t) = (t, t2 ) oder, in nichtparametrischer Form, durch y = x2 .
Für das Kurvenintegral haben wir also:
%xb
%yb
Fx (x, y)dx +
W =
xa
Fy (x, y)dy,
(9.28)
ya
wobei gemäß Angabe xa = ya = 0 und xb = yb = 1. Da wir mit y = x2 keine Eindeutigkeitsprobleme haben, können wir im ersten Term y und im zweiten Term x durch die jeweilige
206
9 Integration von Feldern: Kurven- und Flächenintegrale
Integrationsvariable ausdrücken:
%xb
%yb
2
W =
Fx (x, x )dx +
xa
√
Fy ( y, y)dy.
(9.29)
ya
Unter Berücksichtigung von F (x, y) = (Fx (x, y), Fy (x, y)) = (2x + y, x) erhalten wir
%1
%1
2
(2x + x )dx +
W =
0
√
ydy =
2x2
x3
+
2
3
0
!1
!1
!
!
! + 2 y 23 ! = 1 + 1 + 2 = 2,
!
3 !0
3 3
0
(9.30)
was mit dem Resultat aus dem vorherigen Beispiel, bei dem eine Parameterdarstellung der Kurve
verwendet wurde, übereinstimmt.
9.1.4
Kurvenintegrale über Gradientenfelder
&
Kurvenintegrale der Form C F (r) · dr hängen im Allgemeinen sowohl vom Vektorfeld F als auch
von der Integrationskurve C ab (insbesondere von deren Anfangs- und Endpunkt). Unter gewissen
&
Umständen kann es jedoch vorkommen, dass das Kurvenintegral C F (r) · dr nur vom Kraftfeld
selbst und den Endpunkten ra und rb abhängt, nicht aber von der Form des Weges, der ra und rb
verbindet. Wir wollen uns in diesem Abschnitt mit der Frage beschäftigen, unter welchen Bedingungen dies der Fall ist.
Als Beispiel betrachten wir das Linienintegral im Kraftfeld F (r) = 2r = (2x, 2y, 2z) und verbinden
den Anfangspunkt ra = (0, 0, 0) mit dem Endpunkt rb = (1, 1, 1) durch drei unterschiedliche
Kurven C1 , C2 und C3 (siehe Abb. 9.10):
C1 :
C2 :
C3 :
Gerade von (0,0,0) nach (1,1,1),
Polygonzug (0, 0, 0) → (1, 0, 0) → (1, 1, 0) → (1, 1, 1),
Parabelbogen von (0,0,0) nach (1,1,1).
Für die Kurve C1 ist die Parameterdarstellung
dr
= (1, 1, 1) und ta = 0, tb = 1.
dt
(9.31)
  
!1
%1
2t
1
6t2 !!
  

·
dt
=
6tdt
=
= 3.
 2t   1 
2 !0
0
2t
1
(9.32)
r(t) = (t, t, t) also ist
Das Kurvenintegral lautet somit
%
%1
F (r) · dr =
C2
0

Entlang der Kurve C2 erhalten wir
%1
%
F (r) · dr =
C2
%1
2xdx
0
+
%1
2ydy
0
+
2zdz
0
r(x)=(x,0,0)
x als Parameter
r(y)=(1,y,0)
y als Parameter
r(z)=(1,1,z)
z als Parameter
!1
2x2 !!
=3
= 3.
2 !0
Die Parabel C3 ist in Parameterform gegeben durch: r(t) = (t, t, t2 ), d. h.
d
r
dt
(9.33)
= (1, 1, 2t) und somit
9 Integration von Feldern: Kurven- und Flächenintegrale
207
Abbildung 9.10: (a) Integrationsweg C1 , (b) Integrationsweg C2 und (c) Integrationsweg C3 .
gilt
 

%1
2t
1

 

 2t  ·  1  dt = (4t + 4t3 )dt
0
0
2t2
2t
!
2
4 !1
4t
4t !
= 2 + 1 = 3.
+
2
4 !0
%
%1
F (r) · dr
=
C3
=

(9.34)
Das heißt, für alle drei Wege C1 , C2 und C3 erhalten wir den selben Wert für das Kurvenintegral.
Es stellt sich nun die Frage, ob auch für andere Wege das Kurvenintegral dasselbe ist. Die Antwort
auf diese Frage ist ja, denn wir können das Integral schreiben als:
%
%
F (r) · dr
2r · dr =
=
C
=
%
C
rb2 − ra2
2
C
= 3.
!rb
!
2!
d(r ) = r !
ra
(9.35)
Hier kommt es also nur auf den Anfangspunkt ra und den Endpunkt rb der Kurve an. Für das
spezielle Vektorfeld F (r) = 2r ist also offensichtlich das Kurvenintegral unabhängig vom Weg.
Welche Bedingung erfüllen Kraftfelder, für die das der Fall ist?
Um diese wichtige Frage zu beantworten, gehen wir zunächst davon aus, dass ein bestimmtes
r ) die Eigenschaft besitzt, dass das Kurvenintegral nicht von der Form der Kurve C
Vektorfeld A(
abhängt sondern nur von den beiden Punkten ra und rb , die von der Kurve C verbunden werden.
Wir stellen uns also vor, dass es viele verschiedene Wege C1 , C2 , C3 , usw. gibt (siehe Abb. 9.11),
die alle von ra nach rb verlaufen und alle das gleiche Kurvenintegral liefern, dessen Wert wir φ
nennen:
%
%
r ) · dr = . . . .
A(r) · dr =
A(
(9.36)
φ=
C1
C2
Obwohl das Kurvenintegral φ nicht von der Form der Kurve abhängt, hängt es sehr wohl von dessen
Anfangs- und Endpunkt ab. Wir wollen uns nun überlegen, wie genau φ von ra und rb abhängt.
Es genügt dabei, die Abhängigkeit vom Endpunkt rb zu betrachten. Wenn wir die Abhängigkeit
vom Ausgangspunkt ermitteln wollen, drehen wir einfach die Richtung der Wege um und machen
so Endpunkte zu Anfangspunkten.
Der Einfachheit halber nennen wir den Endpunkt der Wege jetzt r (statt rb ) und betrachten die
Abhängigkeit von φ von r, wobei wir den Anfangspunkt ra festhalten:
%r
q ) · dq.
A(
φ(r ) =
ra
(9.37)
208
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.11: Alle Integrationswege (C1 , C2 , C3 und C4 ) verbinden ra mit rb und führen zum
&
r ) · dr.
selben Kurvenintegral Ci A(
Hier haben wir die Integrationsvariable in q umgetauft, um Verwechslungen zu vermeiden. (Der
Name einer Integrationsvariablen spielt keine Rolle, sollte sich jedoch von den Namen der anderen
Variablen unterscheiden.)
Abbildung 9.12: Durch Verschiebung des Kurvenendpunktes von r nach r + ∆r ändert sich die
r ) · ∆r.
Funktion φ(r) näherungsweise um ∆φ(r) = A(
Um herauszufinden, wie genau φ(r ) von r abhängt, verschieben wir r um einen kleinen Vektor ∆r
(siehe Abb. 9.12). Wie ändert sich nun φ(r), wenn wir den Endpunkt von r nach r +∆r verschieben?
Falls der Weg C2 von ra nach r + ∆r nicht durch r geht, können wir ihn so verbiegen, dass er
das tut. Laut Voraussetzung ändert das ja nicht den Wert φ(r + ∆r), weil das Kurvenintegral
unabhängig von der Form des Weges ist.
Wir können jetzt φ(r + ∆r) ausdrücken als Summe von zwei Kurvenintegralen, nämlich einem von
ra bis r entlang C2 und einem von r nach r + ∆r entlang C2 :
%
%
q ) · dq =
A(
φ(r + ∆r) =
C2
r%
+∆
r
C2
q ) · dq +
A(
q ) · dq.
A(
(9.38)
r,C2
Das erste Integral auf der rechten Seite ist jedoch gleich φ(r ) (laut Voraussetzung spielt es ja keine
Rolle, ob wir über C1 oder C2 integrieren). Somit erhalten wir
r%
+∆
r
q ) · dq.
A(
φ(r + ∆r) = φ(r ) +
(9.39)
r
r ) nicht entlang der kurzen Strecke von r nach
Falls ∆r sehr klein ist, ändert sich der Vektor A(
9 Integration von Feldern: Kurven- und Flächenintegrale
209
r + ∆r. Also können wir in diesem Fall das Integral in der obigen Gleichung annähern durch
r ) · ∆r und wir erhalten schließlich:
A(
r ) · ∆r.
φ(r + ∆r) − φ(r) ≈ A(
(9.40)
Die linke Seite ist aber (für ∆r → 0) das totale Differential φ der Funktion φ(r), das wir als
dφ = grad φ · dr
(9.41)
ausdrücken können. Im Limes kleiner Verschiebungen dr gilt also
r ) · dr = grad φ · dr.
A(
(9.42)
Da diese Beziehung für jede beliebige Verschiebung dr gilt, folgt schließlich
r ).
grad φ(r ) = A(
(9.43)
nur vom Anfangs- und Endpunkt des Weges,
Wenn also das Kurvenintegral über ein Vektorfeld A
nicht aber von der Form des Weges abhängt, dann ist das Vektorfeld durch den Gradienten eines
skalaren Feldes darstellbar. Das heißt, es existiert in diesem Fall ein geeignetes skalares Feld φ(r),
= grad φ. Die Wahl der Konstanten ist
das bis auf eine additive Konstante bestimmt ist, sodass A
der Wahl des Anfangspunktes ra äquivalent.
Die Darstellbarkeit eines Vektorfeldes als Gradient eines skalaren Feldes ist also eine notwendige
Bedingung für die Unabhängigkeit des Kurvenintegrals von der Form des Weges. Bemerkenswer als Gradient
terweise ist es auch eine hinreichende Bedingung. Wenn nämlich das Vektorfeld A
eines skalaren Feldes dargestellt werden kann, das heißt, wenn A = grad φ, dann gilt für das
Kurvenintegral:
%rb
%rb
r ) · dr =
A(
ra ,C
%rb
grad φ · dr =
ra ,C
dφ = φ(rb ) − φ(ra ).
(9.44)
ra ,C
Das Integral hängt somit nur vom Anfangs- und vom Endpunkt ab.
Wir erhalten also folgenden Satz:
r ) sind genau dann (und nur dann) vom Weg unabhängig,
Kurvenintegrale über ein Vektorfeld A(
= grad φ. Legt man φ an einer Stelle ra fest, ist φ
wenn eine Funktion φ(r) existiert, sodass A
eindeutig bestimmmt.
Die Funktion φ wird Potential genannt. (In der Physik bezeichnet man meistens −φ als das
nennt man
Potential. Die potentielle Energie in der Mechanik ist ein Beispiel dafür.) Das Feld A
auch ein konservatives Vektorfeld. Wie man einem Vektorfeld A ansehen kann, ob wir es als
Gradientenfeld darstellen können, werden wir im Abschnitt 9.4 sehen.
Aus dem obigen Satz folgt, dass genau dann geschlossene Kurvenintegrale über das Vektorfeld A
verschwinden, wenn
; sich das Vektorfeld A als Gradient eines skalaren Feldes φ darstellen lässt.
r ) · dr kann nämlich durch Wahl zweier beliebiger Punkte ra und rb auf der
Das Ringintegral C A(
Kurve C in zwei Teile zerlegt werden, die den Wegen C1 und C2 entsprechen (siehe Abb. 9.13):
%
%
:
r ) · dr.
A(r) · dr =
A(r) · dr +
A(
(9.45)
C
C1
C2
Wir durchlaufen nun C2 in entgegengesetzter Richtung und drehen damit das Vorzeichen des
zweiten Integrals um:
:
%
%
r ) · dr.
A(r) · dr =
A(r) · dr −
A(
(9.46)
C
C1
−C2
210
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.13: Durch Wahl zweier Punkte ra und rb zerlegen wir das Ringintegral in zwei Linienintegrale entlang C1 und C2 .
Da aber C1 und −C2 Anfangs- und Endpunkt gemeinsam haben und laut Voraussetzung das
nicht von der Form des Weges abhängt, sind die beiden Integrale auf der
Kurvenintegral über A
rechten Seite der obigen Gleichung gleich. Demzufolge verschwindet das Ringintegral:
:
r ) · dr = 0.
A(
(9.47)
C
9.2
9.2.1
Oberflächenintegrale
Definition
Im Kapitel 2 haben wir gesehen, dass wir das pro Zeiteinheit durch eine Fläche strömende Flüssigkeitsvolumen, also den Fluss, als Skalarprodukt des die Strömung beschreibenden Geschwindigkeitsvektors v und des Flächenvektors f darstellen können (siehe Abb. 9.14):
φ = Fluss = f · v .
(9.48)
Dabei sind wir davon ausgegangen, dass die Fläche eben ist und der Geschwindigkeitsvektor v
nicht vom Ort abhängt (ein solches Vektorfeld nennt man homogen).
Abbildung 9.14: Homogenene Strömung
durch eine ebene Fläche mit Flächenvektor
f.
Abbildung 9.15: Inhomogene
durch eine gekrümmte Fläche.
Strömung
Wie können wir nun dieses Ergebnis auf eine beliebige, räumlich (und möglicherweise zeitlich)
veränderliche Strömung durch eine gekrümmte Fläche verallgemeinern (siehe Abb. 9.15)? In diesem
9 Integration von Feldern: Kurven- und Flächenintegrale
211
Fall wird die Strömungsgeschwindigkeit durch ein Vektorfeld v (r) beschrieben und die Fläche F
kann nicht durch einen einzelnen Flächenvektor dargestellt werden. Um den Fluss durch diese
(wirkliche oder gedachte) Fläche F zu berechnen, gehen wir in Analogie zum Kurvenintegral vor,
bei dem wir eine Kurve in kleine Teilstücke ∆ri eingeteilt haben, und zerlegen die Fläche F
in viele kleine Teilstücke, die wir durch ebene Flächenstücke ∆fi , die so genannten Facetten,
approximieren (siehe Abb. 9.16). In der Praxis benötigen wir natürlich eine analytische Darstellung
dieser Facetten. Hier wollen wir zunächst jedoch nur davon ausgehen, dass wir eine solche Zerlegung
in Facetten durchführen können, ohne auf ihre spezifische analytische Darstellung einzugehen.
Für jede der Facetten, die wir mit dem Index i nummerieren, definieren wir nun einen Flächenvektor
∆f(ri ), dessen Betrag gleich dem Flächeninhalt der Facette um den Punkt ri ist und der normal
auf diese Facette steht. Der Punkt ri ist ein beliebiger Punkt im Inneren der i-ten Facette.
Abbildung 9.16: Zerlegung der Fläche F in kleine Facetten mit Flächenvektoren ∆fi .
Wir wählen die Facetten so klein, dass das Vektorfeld innerhalb jeder Facette näherungsweise
konstant ist. Das heißt, innerhalb der Facette um ri mit dem Flächenvektor ∆f(ri ) ist das Vektorfeld konstant und gleich v (ri ). Wir können nun den Fluss durch das Flächenelement ∆fi als
Skalarprodukt berechnen:
∆φi = v (ri ) · ∆f(ri ).
(9.49)
Der Gesamtfluss φ durch die Fläche F ergibt sich als Summe aller Teilflüsse:
φ≈
N
v (ri ) · ∆f(ri ).
(9.50)
i=1
Im Limes unendlich vieler (N → ∞) und unendlich kleiner Facetten wird aus dieser Summe ein
Flächenintegral:
%
N
φ = lim
v (ri ) · ∆f(ri ) =
v (r) · df(r).
(9.51)
N →∞
F
i=1
r ) definiert werden (nicht nur für ein StrömungsFlächenintegrale können für beliebige Vektorfelder A(
feld v (r)):
%
%
%
%
A(r) · df (r) =
Ax dfx +
Ay dfy +
Az dfz .
(9.52)
φ=
F
F
F
F
Oft ist es notwendig, ein Flächenintegral über einer geschlossenen Fläche F (zum Beispiel die
Oberfläche einer Kugel) zu berechnen. Wir bezeichnen ein solches Integral mit
:
· df
A
(9.53)
F
und definieren die Flächennormalen üblicherweise so, dass sie aus dem geschlossenen Gebiet herauszeigen.
212
9 Integration von Feldern: Kurven- und Flächenintegrale
9.2.2
Darstellung der Fläche und des Flächenelements
In der praktischen Berechnung von Oberflächenintegralen ist es notwendig, eine analytische Darstellung der Fläche im Raum zu wählen. In kartesischen Koordinaten können wir, wie wir
bereits früher gesehen haben, Flächen im Raum darstellen, indem wir jedem Punkt der xy-Ebene
eine z-Koordinate zuordnen, z = z(x, y) (siehe Abb. 9.17). Die Fläche F besteht dann aus den
Punkten (x, y, z(x, y)), wobei x und y aus einem bestimmten Definitionsbereich D der xy-Ebene
stammen (nämlich der Projektion der Fläche F in die xy-Ebene).
Abbildung 9.17: Die Fläche F wird durch die
Funktion z = z(x, y) beschrieben.
Abbildung 9.18: Da zu einem Punkt (x, y)
in der xy-Ebene mehr als ein Punkt auf der
Fläche existiert, muss die Fläche in die zwei
Teilflächen F1 und F2 zerlegt werden.
Falls es zu einem Punkt (x, y) mehr als einen z-Wert gibt (siehe Abb. 9.18), muss die Fläche in
mehrere Teilflächen Fi zerlegt werden.
Beispiel:
Abbildung 9.19: Die Oberfläche der Kugel besteht aus den zwei Halbkugeln F1 und F2 .
In kartesischen Koordinaten kann die Oberfläche einer Kugel mit Radius R und Mittelpunkt im
Ursprung durch die zwei Teilflächen F1 mit positiven z-Werten und F2 mit negativen z-Werten
dargestellt werden (siehe Abb. 9.19):
F1 : (x, y, + R2 − (x2 + y 2 )),
(9.54)
2
2
2
F2 : (x, y, − R − (x + y )).
(9.55)
9 Integration von Feldern: Kurven- und Flächenintegrale
213
Der Definitionsbereich in der xy-Ebene ist hier ein Kreis mit Radius R und Mittelpunkt im Ursprung.
Bis jetzt haben wir x und y als die freien Parameter gewählt. Wir könnten aber Flächen genauso
gut mit (y, z) oder (x, z) als freien Parameter wählen. Allgemeiner können wir eine Fläche F durch
einen Ortsvektor r(u, v) beschreiben, der von zwei Parametern u und v abhängt:


x(u, v)


r = r(u, v) =  y(u, v)  .
(9.56)
z(u, v)
Im Falle der kartesischen Darstellung gilt u = x, v = y (falls x und y als Parameter verwendet
werden). Diese allgemeine Parameterdarstellung ist analog zur Parameterdarstellung einer Kurve.
Da eine Kurve im Raum jedoch ein eindimensionales Objekt ist, genügt in diesem Fall ein einziger
Parameter.
Abbildung 9.20: Auf der Mantelfläche eines Zylinders mit Radius ρ = R können die Zylinderkoordinaten ϕ und z beliebige Werte annehmen.
Oberflächenintegrale werden einfacher, wenn ein Koordinatensystem mit geeigneter Symmetrie
gewählt wird. Wollen wir zum Beispiel die Oberfläche eines unendlich langen Zylinders beschreiben,
sind Zylinderkoordinaten (ϕ, ρ, z) zweckmäßig (siehe Kapitel 2). Für die Mantelfläche eines
Zylinders mit Radius R gilt (siehe Abb. 9.20):
ρ = const = R,
ϕ, z beliebig
(0 ≤ ϕ < 2π, −∞ < z < ∞).
(9.57)
Hier spielen ϕ und z die Rolle der Parameter u und v. Die Fläche wird von einem Netz aus so genannten Parameterlinien überdeckt, auf denen ϕ beziehungsweise z konstante Werte annehmen.
Ein weiteres Beispiel ist die Darstellung der Kugeloberfläche in den Kugelkoordinaten (r, ϑ, ϕ)
(siehe Kapitel 2). Die Oberfläche einer Kugel mit Radius R ist definiert durch (siehe Abb. 9.21):
r = const = R,
ϕ, ϑ beliebig in
(0 ≤ ϕ < 2π, 0 ≤ ϑ ≤ π).
(9.58)
Hier werden Orte auf der Kugeloberfläche durch Angabe der beiden Parameter ϕ und ϑ definiert.
Die Parameterlinien sind die Längen- und Breitengrade.
214
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.21: Auf der Oberfläche einer Kugel mit Radius r = R können die Kugelkoordinaten
ϕ und ϑ beliebige Werte annehmen.
9.2.3
Das Flächenelement
Neben einer analytischen Darstellung der Oberfläche ist zur Berechnung von Oberflächenintegralen
auch die Darstellung des Oberflächenelements df der Fläche F notwendig. Dann kann das Oberflächenintegral auf ein gewöhnliches Doppelintegral zurückgeführt werden. In kartesischen Koordinaten können wir die Fläche F in kleine Facetten zerlegen, indem wir zum Beispiel die Projektion
D von F auf die xy-Ebene in kleine Rechtecke der Kantenlänge ∆x und ∆y einteilen (siehe Abb.
9.22).
Abbildung 9.22: Das Flächenelement ∆f der Oberfläche F ist gegenüber der z-Achse um den
Winkel α geneigt.
Durch die Wahl kleiner Rechtecke kann die Projektion D beliebig genau durch Rechtecke angenähert werden. Die Zerlegung der Projektion in kleine Rechtecke erzeugt auch eine Zerlegung
der Fläche F in kleine Facetten mit Fläche ∆f . Da diese Facetten gegenüber der xy-Ebene geneigt
sein können, unterscheidet sich der Flächeninhalt der Facetten im Allgemeinen vom Flächeninhalt der Rechtecke in der xy-Ebene. Diese Neigung muss in der Ermittlung der Flächenelemente
berücksichtigt werden. Für die Projektion eines Flächenelements mit dem Flächenvektor ∆f auf
die xy-Ebene gilt (wir werden später sehen, wie wir die Richtung von ∆f ermitteln können):
∆f · ez = ∆x∆y.
(9.59)
9 Integration von Feldern: Kurven- und Flächenintegrale
215
Falls die Facette horizontal ist, ist ∆f parallel zur z-Achse und ∆f · ez = ∆f (ez ist der Einheitsvektor in z-Richtung). Der Flächeninhalt des Flächenelements ist in diesem Fall gleich dem
Flächeninhalt seiner Projektion. Schließt ∆f jedoch mit der z-Achse den Winkel α ein, ist die
Projektion in die xy-Ebene flächenmäßig kleiner als das Flächenelement.
Abbildung 9.23: Die Fläche der Projektion des Flächenelements ist gegenüber der Fläche des
Flächenelements um den Faktor cos α vermindert.
Die Fläche der Projektion ist um den Faktor cos α gegenüber der Fläche des Flächenelements
verringert (siehe Abb. 9.23) und daher gilt:
∆f cos α = ∆x∆y,
(9.60)
∆f·
ez
was wegen ∆f · ez = ∆f cos α genau der vorherigen Gleichung entspricht. Das heißt, für ein
bestimmtes Rechteck um den Punkt (x, y) in der xy-Ebene ist die Fläche des zugehörigen Flächenelements gegeben durch
∆f =
∆x∆y
∆x∆y
=
,
cos α
n(x, y, z(x, y)) · ez
(9.61)
wobei n = ∆f/∆f der Einheitsnormalenvektor auf das Flächenelement im Punkt (x, y, z(x, y)) ist.
Wir müssen nun noch den Normalenvektor n(x, y, z(x, y)) bestimmen. Dazu benutzen wir die
Tatsache, dass der Gradient einer Funktion g(x, y, z) normal auf die durch g(x, y, z) =const definierten Niveauflächen steht. Wir können nun die Fläche F , die aus den Punkten (x, y, z = f (x, y))
(wir haben hier die Funktion f eingeführt, um die Variable z von der Funktion z(x, y) zu unterscheiden) besteht, auffassen als eine Niveaufläche der Funktion
g(x, y, z) = z − f (x, y).
(9.62)
Die Fläche F ist nämlich wegen z = f (x, y) genau jene Niveaufläche von g, für die gilt:
g(x, y, z) = 0.
(9.63)
Der Normalenvektor n im Punkt (x, y, z(x, y)) ist also gegeben durch
n =
Der Gradient ∇g lautet


∇g = 
grad g
∇g
=
.
|grad g|
|∇g|
∂g
∂x
∂g
∂y
∂g
∂z



− ∂f
∂x
  ∂f 
 =  − ∂y 
und somit erhalten wir für den Normalenvektor
(9.64)
(9.65)
1


− ∂f
∂x
1
 ∂f 
n = "
2 2  − ∂y  .
1 + ∂f
+ ∂f
1
∂x
∂y
(9.66)
216
9 Integration von Feldern: Kurven- und Flächenintegrale
Mit Hilfe dieses Normalenvektors können wir nun den Flächenvektor ∆f ausdrücken als


− ∂f
∂x
1
∆x∆y
∆x∆y
 ∂f 
"
n =
1
2 2  − ∂y 
q
n · ez
2
∂f 2
1+( ∂f
1 + ∂f
+ ∂f
1
∂x ) +( ∂y )
∂x
∂y
 ∂f 
− ∂x


.
∆x∆y  − ∂f
∂y 
∆f =
=
(9.67)
1
Wir haben jetzt alle Elemente, die wir zur Berechnung des Flächenintegrals in kartesischen Koordinaten benötigen. Dies wollen wir im nächsten Abschnitt tun. In anderen Koordinatensystemen
müssen auch die Ausdrücke für das Flächenelement entsprechend geändert werden.
9.2.4
Berechnung des Oberflächenintegrals
Im letzten Abschnitt haben wir uns mit den Zutaten für die praktische Berechnung von Oberflächenintegralen beschäftigt. In diesem Abschnitt wollen wir diese Zutaten verwenden, um das
Oberflächenintegral auf ein gewöhnliches Doppelintegral in kartesischen Koordinaten zurückzuführen. Falls die Berechnung nicht mit kartesischen Koordinaten x und y als Parameter sondern
mit den allgemeinen Parametern u und v durchgeführt werden soll, muss das Flächenelement auf
geeignete Weise transformiert werden. Auf diesen allgemeineren Fall können wir hier jedoch nicht
eingehen und die Leserin/der Leser sei dafür auf die weiterführende Literatur verwiesen.
Im Limes unendlich kleiner Rechtecke wird aus dem Flächenelement ∆f das infinitesimale Flächenelement
 ∂f 
− ∂x


df =  − ∂f
dxdy.
(9.68)
∂y 
1
Einsetzen in den Ausdruck für das Oberflächenintegral ergibt
%
%
r ) · df =
A(
F
D


− ∂f
∂x

y, z(x, y)) · 
A(x,
dxdy.
 − ∂f
∂y 
(9.69)
1
Wir haben somit das Oberflächenintegral über die Fläche F in ein Doppelintegral über den Bereich
D (Projektion von F ) in der xy-Ebene verwandelt. Wir wollen diesen Ausdruck nun anhand eines
Beispiels erläutern.
Beispiel:
r ) = (x3 , y 3 , z 3 ) über die durch z =
Zu berechnen sei das Oberflächenintegral des Vektorfeldes A(
2
2
f (x, y) = x + y dargestellte Fläche und zwar in den Grenzen −1 ≤ x ≤ 1 und −1 ≤ y ≤ 1. Die
Fläche ist ein abgeschnittenes Rotationsparaboloid (siehe Abb. 9.24).
Die partiellen Ableitungen von f (x, y) nach x und y sind:
∂f
= 2x und
∂x
∂f
= 2y.
∂y
(9.70)
9 Integration von Feldern: Kurven- und Flächenintegrale
217
Abbildung 9.24: Rotationsparaboloid über einem quadratischen Bereich.
Folglich ergibt sich für das Integral
%
%1 %1
· df =
A
F
−1 −1
%1 %1
=

 
x3
−2x


 

 ·  −2y  dxdy
y3
1
(x2 + y 2 )3

*
+
−2x4 − 2y 4 + (x2 + y 2 )3 dxdy
−1 −1
%1 %1
=
2
*
+
−2x4 − 2y 4 + x6 + 3x4 y 2 + 3x2 y 4 + y 6 dxdy
−1 0
%1 #
=
2
−1
=
2
$ !1
!
3x5 2 3x3 4
x7
2x5
4
6
− 2y x +
+
y +
y + y x !! dy
−
5
7
5
3
0
%1 1 3
2
− − 2y 4 + + y 2 + y 4 + y 6 dy
5
7 5
−1
=
%1 2 6 2
4
4
4
6
2
− − 4y + + y + 2y + 2y dy
5
7 5
0
=
=
!1
%1 6 3 2 5 2 7 !!
18 6 2
18
4
6
y − y + y !
2
− + y − 2y + 2y dy = 2 − y +
35 5
35
3·5
5
7
0
0
36 − 20
16
18 2 2 2
2 · 18 4
+ =−
=− .
(9.71)
2 − + − +
=−
35 5 5 7
35
7
35
35
In manchen Fällen ist es zweckmäßig, die Integration nicht in einem kartesischen Koordinatensystem, sondern in einem anderen Koordinatensystem durchzuführen. In diesem Fall ist auf eine
korrekte Definition der Flächenelemente zu achten, auf die wir hier jedoch nicht näher eingehen
können.
218
9.3
9 Integration von Feldern: Kurven- und Flächenintegrale
Der Integralsatz von Gauß
Der Integralsatz von Gauß stellt einen Zusammenhang her zwischen dem Oberflächenintegral über
ein Vektorfeld und dem Volumensintegral über die Divergenz eines Vektorfeldes. Dieser Satz erlaubt
nicht nur eine anschauliche Interpretation der Divergenz, sondern ermöglicht auch sehr praktische
Umformungen von Integralen. Zum Beispiel können wir den Gaußschen Integralsatz benutzen, um
die partielle Integration aus Kapitel 4 auf Vektorintegrale zu verallgemeinern.
9.3.1
Integraldarstellung der Divergenz
Wir haben im Abschnitt 8.3.2 bereits gesehen, dass der Gesamtfluss durch die Oberfläche eines
kleinen Quaders an der Stelle r(x, y, z) mit den Kantenlängen ∆x, ∆y und ∆z im Strömungsfeld
v (r) gegeben ist durch
div v (r)∆x∆y∆z = div v (r)∆V.
r ) und bilden das Oberflächenintegral
Wir betrachten nun ein allgemeines Vektorfeld A(
:
· df
A
(9.72)
(9.73)
∆F
über die geschlossene Oberfläche ∆F eines kleinen Volumens ∆V . Falls das kleine Volumen ein Quader mit Kantenlänge ∆x, ∆y und ∆z ist (siehe Abb. 9.25), können wir dieses Oberflächenintegral
einfach aus den Oberflächenintegralen über die sechs Seitenflächen des Quaders zusammensetzen:
:
6 %
· df =
· df.
A
A
(9.74)
∆F
i=1
∆fi
Abbildung 9.25: Quader mit Volumen ∆x∆y∆z und Seitenflächen ∆f1 , ∆f2 , ∆f3 , ∆f4 , ∆f5 und
∆f6 .
Im Limes eines immer kleiner werdenden Quaders können wir diese Integrale leicht lösen (siehe
Abschnitt 8.3.2). Die Annahme, dass das Vektorfeld auf den kleinen Seitenflächen des Quaders
konstant ist und dass sich das Feld im Quader nur linear ändert, führt uns zu
:
· df ≈ div A(
r )∆V,
A
(9.75)
∆F
wobei ∆V = ∆x∆y∆z. Im Limes ∆x → 0, ∆y → 0, ∆z → 0 wird diese Beziehung exakt und wir
erhalten nach Division durch ∆V
:
1
· df = div A(
r ).
A
(9.76)
lim
∆V →0 ∆V
∆F
9 Integration von Feldern: Kurven- und Flächenintegrale
219
In diesem Grenzübergang haben wir r, den Mittelpunkt des Quaders, konstant gehalten. (Hier geht
natürlich nicht nur ∆V gegen 0, sondern auch der größte Durchmesser des kleinen Quaders.)
Diese Beziehung kann als Definition der Divergenz aufgefasst werden. Sie gilt nicht nur für eine
Folge von kleiner werdenden Quadern, sondern für jede Folge geschlossener, glatter Flächen, die
sich in diesem Grenzprozess auf den Punkt r zusammenziehen. Diese Definition ist sogar dann
r ) nicht differenzierbar ist. Falls dies aber der Fall ist, gilt natürlich die Beziehung
gültig, wenn A(
aus Kapitel 8:
:
1
· df = div A(
r ) = ∂Ax + ∂Ay + ∂Az .
A
(9.77)
lim
∆V →0 ∆V
∂x
∂y
∂z
∆F
Diese Integraldarstellung können wir nun benutzen, um den Integralsatz von Gauß herzuleiten.
9.3.2
Formulierung und Herleitung
Aus der Integraldarstellung der Divergenz wissen wir, dass für ein kleines, quaderförmiges Volumen
∆V1 an der Stelle r1 gilt
:
1
· df = div A(
r1 ),
A
(9.78)
∆V1
F (∆V1 )
wobei sich das Oberflächenintegral über die geschlossene Fläche F (∆V1 ) dieses Volumselements
erstreckt. Wir stellen uns nun vor, dass wir an dieses kleine Volumen ∆V1 ein weiteres quaderförmiges Volumen ∆V2 legen, das mit dem ersten Volumen eine Seitenfläche gemeinsam hat (siehe Abb.
9.26).
Abbildung 9.26: An der Fläche S berühren sich die beiden Volumselemente V1 und V2 . Die Flächen(1)
(2)
elemente ∆fS und ∆fS sind einander entgegengesetzt.
Für dieses zweite Volumen gilt natürlich genauso
:
1
· df = div A(
r2 ),
A
∆V2
(9.79)
F (∆V2 )
wobei diesmal die Integration über die Oberfläche F (∆V2 ) des kleinen Volumens ∆V2 erfolgt. Somit
erhalten wir durch Addition:
:
:
· df +
· df = div A(
r1 )∆V1 + div A(
r2 )∆V2 .
A
A
(9.80)
F (∆V1 )
F (∆V2 )
Die linke Seite ist die Summe zweier Oberflächenintegrale, wobei in jedem Oberflächenintegral
alle Seitenflächen der beiden quaderförmigen Bereiche einen Beitrag leisten. Da die Trennfläche S
220
9 Integration von Feldern: Kurven- und Flächenintegrale
beiden Oberflächen gemeinsam ist, gibt es in jedem der Oberflächenintegrale einen Beitrag, der
vom Fluss durch diese Seitenfläche stammt. Bezeichnen wir den Feldvektor in der Mitte dieser
rS ), ist der Beitrag zum Oberflächenintegral über F (∆V1 ) gegeben durch
Fläche mit A(
rS ) · df(1)
A(
S
(9.81)
und der Beitrag zum Oberflächenintegral über F (∆V2 ) gleich
rS ) · df(2) .
A(
S
(9.82)
Da wir vereinbart haben, dass die Flächennormalvektoren stets nach außen gerichtet sind, zeigen
(1)
(2)
dfS und dfS in entgegengesetzte Richtung. Im Betrag sind sie aber gleich (weil sie zur gleichen
Fläche gehören) und so gilt
(1)
(2)
dfS = −dfS .
(9.83)
Die beiden Beiträge (9.81) und (9.82) heben einander genau auf
rS ) · df(1) + A(
rS ) · df(2) = A(
rS ) · df(1) − A(
rS ) · df(1) = 0.
A(
S
S
S
S
(9.84)
Die gemeinsame Trennfläche S liefert also in der Summe auf der linken Seite der Gleichung keinen
Beitrag. Übrig bleiben also nun die Beiträge der Außenseiten F (∆V1 + ∆V2 ) des kombinierten
Volumens ∆V1 + ∆V2 :
:
:
:
· df.
A · df +
A · df =
A
(9.85)
F (∆V1 )
F (∆V2 )
F (∆V1 +∆V2 )
Dieser Ausdruck gilt übrigens nicht nur für infinitesimale Volumina, sondern ganz allgemein für
die Summe zweier Volumina V1 + V2 , welche eine, möglicherweise gekrümmte, Berührungsfläche S
haben (siehe Abb. 9.27). Auch in diesem Fall heben sich die beiden Beiträge der Fläche S zum
Oberflächenintegral über V1 und V2 genau auf, da in jedem Punkt die zugehörigen Normalvektoren
den gleichen Betrag aber entgegengesetzte Richtung besitzen.
Abbildung 9.27: In der Summe der Oberflächenintegrale über die Oberflächen, die die Volumina
V1 und V2 umschließen, heben sich die Beiträge, die von der Berührungsfläche S stammen, exakt
auf.
Wir können nun diese Prozeduren beliebig oft wiederholen und stets neue Quader ∆V3 , ∆V4 , ∆V5 ,
usw. an die bereits vorhandenen anfügen. Dabei heben sich die Beiträge der gemeinsamen Flächen
immer auf und übrig bleibt nur das Oberflächenintegral über die Einhüllende F (∆V1 + ∆V2 + . . . )
aller N Teilvolumina ∆Vi :
:
:
:
:
· df +
· df + · · · +
· df =
· df.
A
A
A
A
(9.86)
F (∆V1 )
F (∆V2 )
F (∆VN )
F (∆V1 +···+∆VN )
Mit Hilfe des Summenzeichens können wir dies kompakter ausdrücken als:
:
:
N
· df =
· df.
A
A
i=1
F (∆Vi )
F(
P
i
∆Vi )
(9.87)
9 Integration von Feldern: Kurven- und Flächenintegrale
221
Abbildung 9.28: Zerlegung eines Volumens in kleine Quader.
Wir
können nun jedes Volumen V beliebig genau mit Hilfe kleiner Quader ∆Vi annähern, V ≈
i ∆Vi . Das Integral auf der rechten Seite von Gleichung (9.87) wird dann zu einem Oberflächenintegral über die Oberfläche von V . Drücken wir zusätzlich auf der linken Seite dieser Gleichung
die Oberflächenintegrale über die Teilvolumina mit Hilfe von Gleichung (9.76) durch die lokale
Quellenstärke aus, erhalten wir
:
· df ≈
A
i=1
F (V )
:
N
· df ≈
A
N
ri ) · ∆Vi .
div A(
(9.88)
i=1
F (∆Vi )
Im Grenzwert infinitesimal kleiner Teilvolumina wird aus der Summe in dieser Gleichung ein Volumsintegral über V :
%
:
· df =
dV.
A
div A
(9.89)
V
F (V )
Dies ist der Integralsatz von Gauß, der auch oft Satz von Gauß-Ostrogradski genannt wird,
weil er von diesen beiden Mathematikern unabhängig voneinander gefunden wurde.
In Worten lässt sich der Integralsatz von Gauß ausdrücken als: Das Oberflächenintegral eines
über eine geschlossene Fläche F mit nach außen gerichteten Flächennormalen ist
Vektorfeldes A
gleich dem Volumsintegral über die Divergenz des Vektorfeldes im Volumen V, das von der Fläche
F eingeschlossen wird.
Der Satz von Gauß verknüpft also die Quellen und Senken eines Feldes im Inneren eines Volumens
mit den Eigenschaften des Feldes auf der Oberfläche des Volumens. Anwendung findet der Satz
von Gauß zum Beispiel in der Elektrostatik und Elektrodynamik sowie bei der Kontinuitätsgleichung für erhaltene Größen (z.B. Energie, Impuls, Masse).
Beispiel:
Um die Nützlichkeit des Satzes von Gauß zu demonstrieren, berechnen wir das Oberflächenintegral
r ) = r über die Oberfläche F eines Würfels mit Volumen V . Mit Hilfe des Satzes
O für das Feld A(
von Gauß können wir umformen:
%
:
dV.
A · df =
div A
(9.90)
O=
F
= r haben wir div A
=
Für A
∂x
∂x
∂y
∂y
+
+
V
∂z
∂z
= 3 und somit
%
%
dV =
div A
O=
V
3dV = 3V.
(9.91)
V
Interessanterweise geht hier die Form des Volumens nicht in die Lösung ein. Für eine Kugel oder
einen Zylinder mit demselben Rauminhalt ergibt sich also genau dasselbe Oberflächenintegral.
222
9 Integration von Feldern: Kurven- und Flächenintegrale
Beispiel:
durch eine geschlossene Oberfläche F gilt laut dem Satz
Für den Fluss eines Wirbelfeldes rot A
von Gauß
:
%
· df =
dV.
rot A
div (rot A)
(9.92)
F
V
= 0, bedeutet dies
Da Wirbelfelder quellenfrei sind, div (rot A)
:
%
· df =
rot A
0 dV = 0.
F
(9.93)
V
durch eine geschlossene Oberfläche für
Somit verschwindet der Gesamtfluss eines Wirbelfeldes rot A
Anschaulich bedeutet dies, dass Wirbel entweder ganz in V verlaufen
ein beliebiges Vektorfeld A.
oder an einer Stelle genauso viele ein- wie an einer anderen Stelle austreten. (Dies folgt, wie wir
sehen werden, auch aus dem Satz von Stokes.)
Beispiel:
r ) = (x3 , y 3 , z 3 )
Wir wollen nun den Satz von Gauß verifizieren, indem wir für das Vektorfeld A(
;
· df über die Oberfläche einer Kugel mit Radius R als auch das
sowohl das Oberflächenintegral A
&
Volumsintegral V div A dV über diese Kugel berechnen (siehe Abb. 9.29).
r ) auf der Halbkugel mit Radius R.
Abbildung 9.29: Vektorfeld A(
Wir berechnen zunächst das Oberflächenintegral. Aus Symmetriegründen genügt es, das Integral
nur für eine Halbkugel, also zum Beispiel für z ≥ 0, zu berechnen. Das Integral über die Kugel ist
dann einfach
zweimal das Integral über die Halbkugel. Die Flächengleichung für die Halbkugel ist
z(x, y) = R2 − (x2 + y 2 ). Der Normalenvektor n auf die Fläche zeigt für eine Kugel genau vom
Ursprung weg:


x
1


(9.94)
n =  y .
2
2
2
x +y +z
z
Folglich ist das Flächenelement gegeben durch:


x
dxdy
1

df =
· n =  y  dxdy.
n · ez
z
z
(9.95)
9 Integration von Feldern: Kurven- und Flächenintegrale
223
Das Oberflächenintegral lässt sich also schreiben als
 


%%
%
x3
x
1 3  

· df =
A
 y  ·  y  dxdy
z
F
x2 +y 2 ≤R2
z3
z
%%
4
4
4
x +y +z
dxdy,
=
z
(9.96)
x2 +y 2 ≤R2
wobei sich der Integrationsbereich in der xy-Ebene über den Kreis mit Radius R erstreckt. In
diesem Ausdruck ist z als Funktion von x und y zu betrachten, z = z(x, y). Durch Einsetzen der
Flächengleichung für z(x, y) erhalten wir
%
%%
x4 + y 4 + (R2 − (x2 + y 2 ))2
A · df =
dxdy.
(9.97)
R2 − (x2 + y 2 )
F
x2 +y 2 ≤R2
Dieses Integral berechnen wir zweckmäßigerweise in Polarkoordinaten:
%
%2π%R
· df =
A
F
0
0
r4 (sin4 ϕ + cos4 ϕ) + (R2 − r2 )2
√
rdϕdr
R2 − r 2
%2π%R #
=
0
0
%2π%R
=
0
0
%R
√
=
0
Das Integral
%R
0
Das Integral
&
5
√ r
dr
R2 −r 2
$
3
r4 (sin4 ϕ + cos4 ϕ)
√
+ (R2 − r2 ) 2 rdϕdr
R2 − r 2
r5 (sin4 ϕ + cos4 ϕ)
√
dϕdr + 2π
R2 − r 2
r5
R2 − r 2
%R
3
(R2 − r2 ) 2 rdr
0
%2π
%R
3
4
4
dr (sin ϕ + cos ϕ)dϕ + 2π (R2 − r2 ) 2 rdr.
0
√
1
ergibt laut Integraltafel − 15
R2 − r2 (3r4 + 4r2 R2 + 8R4 ) und somit gilt
!R
!
r5
1 2
R
8R5
4
2 2
4 !
2
√
8R4 =
.
dr = −
R − r (3r + 4r R + 8R )! =
15
15
15
R2 − r 2
0
& 2π
0
(9.98)
0
(9.99)
(sin4 ϕ + cos4 ϕ)dϕ ergibt
!2π
%2π
3ϕ sin(4ϕ) !!
3π
4
4
+
.
(sin ϕ + cos ϕ)dϕ =
=
!
4
16
2
0
(9.100)
0
Schließlich erhalten wir für das letzte Integral:
!R
%R
!
21 2
1
2
2 32
2 52 !
(R − r ) rdr = − (R − r ) ! = R5 .
52
5
0
(9.101)
0
Das Oberflächenintegral wird somit zu
%
4π 2π
8R5 3π 2πR5
6π 5
A · df =
+
=
+
R .
R5 =
15
2
5
5
5
5
F
Für die ganze Kugel ist das Oberflächenintegral also gegeben durch:
%
· df = 12π R5 .
A
5
F
(9.102)
(9.103)
224
9 Integration von Feldern: Kurven- und Flächenintegrale
Wir berechnen nun auch das Volumsintegral über die Divergenz des Vektorfeldes über die ganze
Kugel:
%
% 3
∂y 3
∂z 3
∂x
+
+
div AdV
=
dV
∂x
∂y
∂z
V
V
%
(9.104)
= 3 (x2 + y 2 + z 2 )dV.
V
Wir transformieren auf Kugelkoordinaten und beachten dabei, dass das Volumselement zu r2 sin ϑdϑdϕdr
wird:
%
%2π%π %R
div AdV
=
r2 r2 sin ϑdϑdϕdr
3
V
0
0
0
%R
=
3 · 2π
%π
r dr ·
4
0
sin ϑdϑ
0
r5
5
!π
!R
!
!
! · (− cos ϑ) !
!
!
=
3 · 2π
=
6π 5
12π 5
R (− cos(+π) + cos 0) =
R .
5
5
0
0
(9.105)
&
· df
Wie wegen des Integralsatzes von Gauß zu erwarten war, liefern das Oberflächenintegral F A
&
und das Volumsintegral V div AdV
genau dasselbe Ergebnis. Allerdings ist in diesem Fall das
Volumsintegral bedeutend einfacher zu berechnen als das Oberflächenintegral.
9.3.3
Partielle Integration mit Hilfe des Gaußschen Satzes
Erinnern wir uns zunächst daran, dass bei der partiellen Integration in einer Dimension ein Integral
in ein anderes (hoffentlich einfacheres) Integral verwandelt wird:
%b
!b %b
!
f (x)g (x)dx = f (x)g(x)!! − f (x)g(x)dx.
a
a
(9.106)
a
Die partielle Integration beruht auf der Produktregel der Differentiation, (f g) = f g + f g . Wir
können Gleichung (9.106) auch umformen zu:
%b
%b
f (x)g (x)dx +
a
!b
!
f (x)g(x)dx = f (x)g(x)!! .
(9.107)
a
a
Hier haben wir also das Integral über eine Ableitung verknüpft mit dem Wert der Funktion an den
Rändern (in einer Dimension sind das einfach die Endpunkte) des Integrationsintervalls.
Der Satz von Gauß leistet das Analoge für Volumsintegrale. Dieser Analogie folgend können wir die
Methode der partiellen Integration auf Volumsintegrale übertragen, falls der Integrand ein Produkt
aus einem Feld ψ mit dem Gradienten eines anderen Feldes ist,
%
%
ψ(r)grad ϕ(r)dV =
ψ(r)∇ϕ(r )dV.
(9.108)
V
V
Da der Gradient ein Vektor ist, hat auch das Integral über ψ∇ϕ Vektorcharakter. Im Allgemeinen kann man natürlich Volumsintegrale statt über skalare Felder auch über Vektorfelder
bilden. Da Integrale als Grenzwerte von Summen definiert sind und Vektoren komponentenweise
9 Integration von Feldern: Kurven- und Flächenintegrale
225
r ) ein Vektor, dessen Komponenten
addiert werden, ist das Volumsintegral eines Vektorfeldes A(
die Volumsintegrale über die Komponenten des Feldes A sind:
 &

%
Ax (r)dV
V
&

r )dV = 
A(
(9.109)
 V Ay (r)dV  .
&
V
r )dV
V Az (
S eines
Ein Beispiel für ein solches Integral ergibt sich bei der Berechnung des Schwerpunktes R
Körpers mit Massenverteilung ρ(r):
&
rρ(r)dV
RS = &V
.
(9.110)
ρ(r)dV
V
Wir kehren nach diesem kurzen Einschub über vektorwertige Volumsintegrale zurück zum Integral
in Gleichung (9.108). Aus dem Abschnitt 8.2 über den Gradienten im Kapitel 8 kennen wir die
Produktregel
∇(ψϕ) = ϕ∇ψ + ψ∇ϕ.
Somit gilt
%
%
%
∇(ψϕ)dV −
ψ(r)∇ϕ(r )dV =
V
(9.111)
V
ϕ(r)∇ψ(r )dV.
(9.112)
V
Das erste Integral auf der rechten Seite dieser Gleichung kann wie folgt umgeformt werden. Für
r ) = aφ(r) mit einem konstanten Vektor a und einem Skalarfeld φ(r)
das spezielle Vektorfeld A(
folgt nämlich aus dem Satz von Gauß:
:
:
%
:
· df =
A
aφ(r ) · df = a ·
φ(r)df =
div (aφ(r))dV.
(9.113)
F (V )
F (V )
F (V )
V
Da aber
div (aφ(r))
=
=
folgt daraus
∂ax φ ∂ay φ ∂az φ
+
+
∂x
∂y
∂z
∂φ
∂φ
∂φ
ax
+ ay
+ az
= a · grad φ,
∂x
∂y
∂z
:
%
φ(r ) df = a ·
a ·
F (V )
grad φ dV.
(9.115)
V
Da dies für beliebige Vektoren a gilt, erhalten wir schließlich die Vektorgleichung:
%
%
:
φ(r) df =
grad φ dV =
∇φ dV.
F (V )
(9.114)
V
(9.116)
V
Während auf der linken Seite dieser Gleichung der Vektorcharakter des Integrals vom Flächenelement stammt, kommt er auf der rechten Seite vom Gradienten, der ja ein Vektor ist. Die obige
Gleichung ist der Gaußsche Integralsatz für skalare Felder.
Durch Anwendung dieses Satzes mit φ = ϕψ erhalten wir aus Gleichung (9.112)
%
:
%
ψ(r)∇ϕ(r ) dV =
ψ(r)ϕ(r) df −
ϕ(r)∇ψ(r) dV.
V
F (V )
(9.117)
V
Diese Gleichung ist analog zur partiellen Integration in einer Dimension (siehe auch Gleichung
(4.78) bzw. Gleichung (9.106)): die Ableitung wird von einer Funktion (ϕ) zur anderen (ψ) übergewälzt. Zusätzlich haben wir einen Oberflächenterm erhalten. Da dieser zusätzliche Term im Unterschied zum eindimensionalen Fall noch als Integral (wenn auch als Oberflächenintegral) dasteht,
226
9 Integration von Feldern: Kurven- und Flächenintegrale
ist der Ausdruck partielle (also teilweise) Integration hier wohl etwas übertrieben. Nichtsdestotrotz
kann Gleichung (9.117) in vielen Situationen sehr nützlich sein.
Falls auf der Oberfläche des Integrationsvolumens mindestens eine der skalaren Funktionen ϕ(r )
oder ψ(r ) verschwindet, nimmt (9.117) eine besonders einfache Form an. Dann verschwindet
nämlich das Oberflächenintegral und wir erhalten:
%
%
ψ(r)∇ϕ(r )dV = −
ϕ(r)∇ψ(r )dV.
(9.118)
V
V
Bei Anwendung dieses sehr praktischen Ausdrucks muss jedoch sorgfältig darauf geachtet werden,
dass entweder ϕ(r) oder ψ(r) auf der Oberfläche wirklich verschwindet.
Ein ähnliches Ergebnis erhalten wir, wenn wir die Produktregel für die Divergenz eines Produkts
aus einem Skalar- und einem Vektorfeld ausnutzen,
r )) = A
· ∇ϕ + ϕ∇ · A.
∇ · (ϕ(r)A(
Für das Volumsintegral
%
&
dV erhalten wir damit nämlich
ϕ∇ · A
%
%
· ∇ϕ dV.
A
ϕ∇ · A dV =
∇ · (ϕA) dV −
(9.119)
V
V
V
(9.120)
V
können wir nun mit Hilfe des Satzes von Gauß in
Das Volumsintegral über die Divergenz ∇ · (ϕA)
ein Oberflächenintegral verwandeln:
%
:
%
· ∇ϕ dV
dV =
· df −
A
(9.121)
ϕ∇ · A
ϕA
V
oder, äquivalent dazu,
F
%
V
:
V
%
· df −
ϕA
· ∇ϕ dV =
A
F
dV.
ϕ∇ · A
(9.122)
V
Falls das Oberflächenintegral verschwindet, wird dieser Ausdruck für die partielle Integration besonders einfach:
%
%
· ∇ϕ dV = −
dV.
A
ϕ∇ · A
(9.123)
V
V
Zwei weitere praktische Ausdrücke lassen sich aus dem Satz von Gauß ableiten. Diese sind als
Sätze von Green bekannt.
9.3.4
Die Sätze von Green
Gegeben seien zwei skalare Felder ψ und ϕ. Für diese Felder betrachten wir jetzt das Volumsintegral
%
(ϕ∆ψ − ψ∆ϕ)dV,
(9.124)
V
wobei ∆ = ∇ · ∇ der Laplace-Operator ist. Partielle Integration beider Terme mit Hilfe von
Gleichung (9.121) liefert
%
%
(ϕ∆ψ − ψ∆ϕ) dV =
(ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV
V
V
:
%
= (ϕ∇ψ − ψ∇ϕ) df − (∇ϕ · ∇ψ − ∇ψ · ∇ϕ) dV. (9.125)
F
V
Das Volumsintegral auf der rechten Seite verschwindet aber und wir erhalten
%
:
(ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV = (ϕ∇ψ − ψ∇ϕ) df.
V
F
(9.126)
9 Integration von Feldern: Kurven- und Flächenintegrale
227
Dies ist der 2. Satz von Green. (Diese Nomenklatur ist nicht ganz einheitlich. Die Sätze werden
oft unterschiedlich nummeriert.) Er wurde von George Green bewiesen, kann jedoch als Spezialfall
des Satzes von Gauß betrachtet werden.
ein
Der 1. Satz von Green ergibt sich aus Gleichung (9.121) für den Fall, dass das Vektorfeld A
Gradientenfeld ist: A = ∇ψ. Einsetzen in Gleichung (9.121) ergibt
:
%
%
ϕ∇ · ∇ψ dV =
ϕ∇ψ · df −
∇ϕ · ∇ψ dV
(9.127)
V
oder
F
:
%
%
ϕ∇ψ · df −
ϕ∆ψ dV =
V
V
F
∇ϕ · ∇ψ dV.
Weitere praktische Formeln, die man auf ähnliche Weise ableiten kann, sind:
%
%
:
× ∇ϕ dV =
dV +
× df,
A
ϕ∇ × A
ϕA
V
V
V
(9.129)
F
= ϕ∇ × A
+ ∇ϕ × A
beruht, und
was auf der Produktregel ∇ × (ϕA)
%
:
%
·∇×A
dV =
·∇×B
dV + (A
× B)
· df,
B
A
V
(9.128)
V
(9.130)
F
× B)
=B
·∇×A
−A
·∇×B
folgt.
was aus div (A
Beispiel:
Die Diffusion eines Teilchens im Raum (siehe Abb. 9.30) wird durch die Diffusionsgleichung
∂ρ
= D∆ρ
∂t
(9.131)
beschrieben, wobei ρ(r, t) die Wahrscheinlichkeit beschreibt, das Teilchen zum Zeitpunkt t am Ort
r = (x, y, z) zu finden unter der Bedingung, dass es zum Zeitpunkt t = 0 im Ursprung (r = 0) war.
Abbildung 9.30: Bahnkurve eines diffundierenden Teilchens in der Ebene.
Für t = 0 ist die Dichte ρ(r, t = 0) also durch eine δ-Funktion gegeben, da wir wissen, dass sich
das Teilchen genau im Usprung befindet:
ρ(r, 0) = δ(r).
(9.132)
Da das Teilchen vom ursprünglichen Ort weg diffundiert, wird die Dichte ρ immer breiter. Aus Symmetriegründen verschwindet der mittlere Aufenthaltsort des Teilchens bei wiederholter Durchführung
des Diffusionsexperiments:
%
r = ρ(r)r dV = 0,
(9.133)
228
9 Integration von Feldern: Kurven- und Flächenintegrale
wobei die Dichte ρ(r) so definiert ist, dass sie normiert ist. Das heißt
%
ρ(r) dV = 1.
Das mittlere Abweichungsquadrat
(9.134)
%
r 2 =
ρ(r, t)r 2 dV
(9.135)
ist jedoch von Null verschieden und wächst mit der Zeit. Um dieses zeitliche Anwachsen quantitativ
zu bestimmen, bilden wir die Ableitung von r 2 nach der Zeit:
%
d 2
∂
r =
ρ(r, t)r 2 dV.
(9.136)
dt
∂t
Indem wir die Diffusionsgleichung ausnutzen, erhalten wir dann:
%
d 2
r = D ∆ρ(r, t)r 2 dV
dt
%
= D ∇ · (∇ρ(r, t))r 2 dV.
(9.137)
Anwendung des 1. Greenschen Satzes (Gleichung (9.128)) ergibt:
%
:
%
2
2
r 2 ∇ρ(r, t) · df.
∆ρ(r, t)r dV = − ∇r · ∇ρ dV +
(9.138)
F
Im Unendlichen verschwindet jedoch ρ und auch ∇ρ für beliebige endliche Zeiten t. Deshalb erhalten
wir
%
%
(9.139)
∆ρ(r, t)r 2 dV = − ∇r 2 · ∇ρ dV.
Der Gradient von r 2 lässt sich leicht auswerten,
∇r 2 = 2r
und folglich gilt
(9.140)
%
%
∇r 2 · ∇ρ dV = 2
r · ∇ρ dV.
Nochmalige partielle Integration nach Gleichung (9.122) liefert
%
%
:
ρr · df.
r · ∇ρ dV = − ρ(∇ · r)dV +
(9.141)
(9.142)
F
Der Oberflächenterm verschwindet wieder und die Divergenz von r ist
∇ · r =
∂x ∂y ∂z
+
+
= 3.
∂x ∂y ∂z
&
Da ρ nach Voraussetzung normiert ist, ρ(r) = 1, gilt
%
%
ρ(∇ · r) dV = 3 ρ dV = 3
(9.143)
(9.144)
und wir erhalten schließlich
∂ 2
r = D · 2 · 3 = 6D.
∂t
(9.145)
r 2 = 6Dt.
(9.146)
Integration nach der Zeit ergibt
Dies ist die berühmte Einstein-Beziehung, der zufolge bei der Diffusion der mittlere quadratische
Abstand vom Ausgangspunkt linear mit der Zeit wächst.
9 Integration von Feldern: Kurven- und Flächenintegrale
9.4
229
Der Integralsatz von Stokes
Der Integralsatz von Stokes stellt einen Zusammenhang her zwischen dem Oberflächenintegral
des Wirbelfeldes eines Vektorfeldes und dem Kurvenintegral des Feldes entlang des Randes der
Oberfläche.
9.4.1
Integraldarstellung der Rotation
Wir haben in Abschnitt 9.1.4 gesehen, dass unter gewissen Umständen Kurvenintegrale über Vektorfelder vom Weg unabhängig sind (nämlich genau dann, wenn sich das Vektorfeld als Gradient
eines Skalarfeldes darstellen lässt). In diesem Fall verschwindet das Kurvenintegral über jede beliebige geschlossene Kurve C:
:
· dr = 0.
A
(9.147)
C
Es gibt jedoch auch Felder, für die
; das Kurvenintegral längs geschlossener Kurven, also die Zir · dr = 0. Solche Felder nennt man Wirbelfelder. So kann
kulation, nicht verschwindet, C A
ein ringförmiges elektrisches Feld E
erzeubeispielsweise ein zeitlich veränderliches Magnetfeld B
gen (siehe Abb. 9.31).
Unterschiedliche Integrationswege (etwa C1 , C2 und
Abbildung 9.31: Elektrisches Wirbelfeld E.
&
· dr.
C3 ) führen zu unterschiedlichen Wegintegralen C E
Wir bewegen in diesem elektrischen Feld nun eine Ladung vom Punkt P1 zum &Punkt P2 und
· dr längs
wollen dies auf 3 verschiedenen Wegen tun: C1 , C2 und C3 . Das Kurvenintegral C E
immer in Richtung des Weges zeigt und deshalb
des Weges C1 ist positiv, da das Vektorfeld E
· dr > 0 gilt. Das Kurvenintegral längs C2 hingegen ist negativ, da das Feld immer der
immer E
· dr < 0. Auf der Kurve C3 steht das Feld immer genau
Bewegungsrichtung entgegengesetzt ist, E
&
· dr
· dr = 0 und das Kurvenintegral
E
senkrecht auf die Bewegungsrichtung. Somit gilt E
C3
verschwindet. In diesem Fall wird keine Arbeit geleistet.
Da diese Kurvenintegrale nicht wegunabhängig sind, verschwindet die Zirkulation für dieses Vektorfeld im Allgemeinen nicht. Zum Beispiel ist
:
:
· dr > 0 und
· dr < 0.
E
E
(9.148)
C1 −C3
C2 −C1
Hier bezeichnet C1 − C3 den Weg, der aus C1 in Vorwärtsrichtung und C3 in Rückwärtsrichtung
besteht. Der Weg C2 − C1 ist auf analoge Weise definiert. Offensichtlich verschwinden Kurvenintegrale über geschlossene Kurven genau dann nicht, wenn das Vektorfeld geschlossene Feldlinien,
230
9 Integration von Feldern: Kurven- und Flächenintegrale
also Wirbel, besitzt. Wir haben aber in Kapitel 8 (Abschnitt 8.55) plausibel gemacht, dass die
als Maß für die lokale Wirbelstärke betrachtet werden kann. Wir wollen nun sehen,
Rotation ∇ × A
ob wir die Zirkulation über ein Vektorfeld, die ja ebenfalls von der Stärke der Wirbel abhängt, mit
der Rotation in Verbindung bringen können.
Abbildung 9.32: Die Umrandung des Flächenelements mit dem Flächenvektor ∆f besteht aus den
Kurvensegmenten C1 , C2 , C3 und C4 .
Dazu betrachten wir das Kurvenintegral über eine kleine geschlossene Kurve, die eine kleine Fläche
∆f mit Flächenvektor ∆f umrandet. Der Einfachheit halber nehmen wir an, dass die Fläche in
der xy-Ebene liegt, also ∆f in Richtung der z-Achse zeigt (siehe Abb. 9.32). Wir bezeichnen die
;
r ) · dr entlang der Umrandung
Umrandung dieses Rechtecks mit Cz . Das Kurvenintegral Cz A(
des Rechtecks besteht aus den vier Beiträgen entlang der Rechteckseiten. Zur Berechnung dieses
Integrals wollen wir annehmen, dass die Seiten des Rechtecks so kurz sind, dass sich der Feldvektor
r ) entlang der Kanten nicht ändert. Dann ist der Beitrag der Kante C1 gegeben durch
A(
∆y
A x, y −
, z · ∆r,
2
(9.149)
y − ∆y , z) der Feldvektor im Mittelwobei r = (x, y, z) der Mittelpunkt des Rechtecks ist und A(x,
2
punkt der Kante C1 . Die Verschiebung ∆r hat jedoch die Länge ∆x und die Richtung ex = (1, 0, 0).
Damit erhalten wir für den Beitrag der Rechteckseite C1 zum Integral
x, y − ∆y , z · ex ∆x = Ax x, y − ∆y , z ∆x.
A
2
2
(9.150)
Auf ähnliche Weise erhalten wir für den Beitrag entlang Kante C3
∆y
∆y
A x, y +
, z · ∆r = −Ax x, y +
, z ∆x.
2
2
(9.151)
Dabei haben wir berücksichtigt, dass das Kurvenelement ∆r für diese Kante in die negative xRichtung zeigt. Durch analoge Überlegungen erhalten wir die Beiträge der Kanten C2 und C4 zum
Kurvenintegral:
∆x
, y, z ∆y
Ay x +
2
C2 :
und
C4 :
∆x
, y, z ∆y.
−Ay x −
2
(9.152)
Durch Addition dieser vier Beiträge erhalten wir das Kurvenintegral längs der (geschlossenen)
Umrandung des Rechtecks:
∆y
∆y
A · dr = Ax x, y −
, z ∆x − Ax x, y +
, z ∆x
2
2
Cz
∆x
∆x
+ Ay x +
, y, z ∆y − Ay x −
, y, z ∆y.
2
2
:
(9.153)
9 Integration von Feldern: Kurven- und Flächenintegrale
231
Die Erweiterung der ersten beiden Terme der rechten Seite dieser Gleichung mit ∆y und der letzten
beiden Terme mit ∆x liefert
∆y
:
x,
y
−
,
z
−
A
,
z
Ax x, y + ∆y
x
2
2
· dr = −
∆x∆y
A
∆y
Cz
(9.154)
∆x
Ay x + ∆x
x
−
,
y,
z
−
A
,
y,
z
y
2
2
+
∆x∆y.
∆x
Im Limes kleiner ∆x und ∆y (also im Limes ∆f → 0) werden diese Differenzenquotienten zu
partiellen Ableitungen und wir erhalten nach Division durch ∆x∆y = ∆f
:
1
· dr = ∂Ay − ∂Ax .
lim
A
(9.155)
∆f →0 ∆f C
∂x
∂y
z
Die rechte Seite dieser Gleichung ist jedoch nichts anderes als die z-Komponente der Rotation


 
  ∂A
∂A
∂
z
− ∂zy
Ax
∂y
∂x

  ∂Ax
∂ ·
∂Az 
=
∇×A
(9.156)
 ∂y
  Ay  = 
 ∂z − ∂x 
∂Ay
∂Ax
∂
Az
∂x − ∂y
∂z
r ). Wir können also schreiben
des Vektorfeldes A(
:
1
· dr = (rot A)
z,
A
lim
∆f →0 ∆f C
z
(9.157)
mit (rot A)
z bezeichnet haben. Wenn wir unser
wobei wir die z-Komponente der Rotation rot A
kleines Rechteck nicht in die xy-Ebene sondern in die yz-Ebene oder in die xz-Ebene legen, erhalten
wir auf analoge Weise die x- beziehungsweise die y-Komponente der Rotation:
:
1
· dr = ∂Az − ∂Ay = (rot A)
x
A
(9.158)
lim
∆f →0 ∆f Cx
∂y
∂z
beziehungsweise
1
∆f →0 ∆f
:
lim
· dr = ∂Ax − ∂Az = (rot A)
y.
A
∂z
∂x
Cy
(9.159)
Für eine allgemein orientierte Fläche, deren Flächennormale in Richtung des Einheitsvektors n
zeigt,
∆f = |∆f| · n = ∆fn,
(9.160)
gilt
1
lim
∆f →0 ∆f
:
· dr = n · rot A
= n · ∇ × A.
A
(9.161)
C
Die Rotation ist also die Flächendichte der Zirkulation (Zirkulation pro Fläche), die auch als
;
· dr = rot A
· ∆f.
Wirbelstärke bezeichnet wird. Für eine kleine Fläche ∆f haben wir also C A
Dieser Ausdruck kann auch als Definition der Rotation eines Vektorfeldes aufgefasst werden, die
auch dann sinnvoll bleibt, wenn das Feld nicht differenzierbar ist.
9.4.2
Formulierung und Herleitung
r ) einen Zusammenhang zwischen dem
Der Stokessche Satz stellt für ein beliebiges Vektorfeld A(
Oberflächenintegral über eine im Allgemeinen gekrümmte Fläche F und dem Kurvenintegral längs
232
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.33: Die von der Kurve C umrandete Fläche F wird in kleine Facetten mit Flächenvektoren ∆fi zerlegt.
des Randes C dieser beliebig großen und beliebig geformten Fläche her (siehe Abb. 9.33). Wie
wir schon bei der Diskussion des Oberflächenintegrals gesehen haben, können wir die gesamte
Oberfläche F näherungsweise durch N ebene Teilflächen ∆fi mit Flächenvektoren ∆fi darstellen.
Wir bezeichnen die Umrandung des Flächenelements ∆fi mit Ci .
Wir bilden nun für ein kleines Flächenelement ∆f1 am Punkt r1 (siehe Abb. 9.34) das Kurvenintegral längs seiner Umrandung, das für eine kleine Fläche geschrieben werden kann als
:
· dr = rot A
· ∆f1 .
A
(9.162)
C1
Wir legen dann um einen benachbarten Punkt r2 eine weitere Fläche ∆f2 und zwar so, dass die
Flächen ∆f1 und ∆f2 einen Teil ihrer Berandung gemeinsam haben. Die Flächenvektoren ∆f1 und
∆f2 sind im Allgemeinen nicht parallel zueinander.
Abbildung 9.34: Zwei benachbarte Facetten mit Flächenvektoren ∆f1 und ∆f2 und Umrandungen
C1 und C2 .
Wenn wir die Linienintegrale entlang der beiden Kurven C1 und C2 addieren, heben sich die beiden
Beiträge des gemeinsamen Randteiles genau auf, weil dieser Teil von C1 und C2 in entgegengesetzter
Richtung umlaufen wird. Was übrig bleibt ist das Kurvenintegral über die Einhüllende C1+2 der
aus ∆f1 und ∆f2 bestehenden Gesamtfläche:
:
:
:
· dr.
A · dr +
A · dr =
A
(9.163)
C1
C2
C1+2
Andererseits gilt wegen Gleichung (9.162) aber auch
:
:
· dr +
· dr = rot A(
r1 ) · ∆f1 + rot A(
r2 ) · ∆f2
A
A
C1
und somit
(9.164)
C2
:
· dr = rot A(
r1 ) · ∆f1 + rot A(
r2 ) · ∆f2 .
A
(9.165)
C1+2
Wir können diese Prozedur durch Hinzufügen weiterer Facetten ∆fi nun wiederholen, bis die
gesamte Fläche F ausgefüllt ist. Bei jedem dieser Schritte bleibt beim Linienintegral nur jener Teil
übrig, der von der äußeren Berandung der Fläche stammt (siehe Abb. 9.35).
9 Integration von Feldern: Kurven- und Flächenintegrale
233
Abbildung 9.35: In der Summe der Kurvenintegrale über die Umrandungen der Teilflächen kürzen
sich alle Beiträge außer die, die vom äußeren Rand der Gesamtfläche stammen.
Die Summe aller Kurvenintegrale über die Umrandung Ci der Teilflächen wird also zum Kurvenintegral über die Einhüllende C1+2+···+N aller N Flächenelemente. Wir erhalten also
:
· dr =
ri ) · ∆fi .
A
rot A(
(9.166)
C1+2+···+N
i
Im Limes N → ∞, also für immer kleiner werdende Flächenelemente, strebt C1+···+N gegen die
Randkurve C der Fläche F und die Summe auf der rechten Seite wird zum Oberflächenintegral:
%
:
· dr =
· df.
A
rot A
(9.167)
C
F
Dies ist der Stokessche Integralsatz.
In Worten lautet der Stokessche Integralsatz:
r ) und eine Fläche F ist das Oberflächenintegral über das zugehörige WirFür ein Vektorfeld A(
belfeld gleich dem Kurvenintegral über das Vektorfeld längs der Berandung C der Fläche F .
Beispiel:
Als Beispiel für den Satz von Stokes berechnen wir das Ringintegral
;
C
· dr des Vektorfeldes
A


−3y

r) = 
A(
 3x 
1
(9.168)
längs eines Kreises in der xy-Ebene mit Mittelpunkt im Ursprung und Radius r (siehe Abb. 9.36).
Aus dem Satz von Stokes folgt, dass
:
%
· df,
rot A
· dr =
A
C
(9.169)
F
wobei F eine beliebige glatte Fläche ist, deren Rand der Kreis ist, längs dessen das Kurvenintegral
berechnet werden soll. Da die Fläche F beliebig ist, wählen wir einfach die ebene Kreisfläche. Das
Oberflächenelement ist demnach df = ez dxdy unabhängig vom Ort. Die Rotation des Vektorfeldes
ist
A
 
 
  

 
∂
−3y
0−0
0
−3y
∂x
 
  

  ∂  
(9.170)
rot  3x  =  ∂y
 ×  3x  =  0 − 0  =  0  .
1
∂
∂z
1
3+3
6
234
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.36: Flächenelement in einem Kreis in der Ebene. Die Flächenvektoren df stehen
normal auf die xy-Ebene.
Das Oberflächenintegral wird deshalb zu
%
F

  
0
0
   
rot A · df =
 0  ·  0  dxdy
x2 +y 2 ≤r 2
6
1
%%
dxdy = 6πr2 .
= 6
%%
(9.171)
x2 +y 2 ≤r 2
Natürlich hätten wir auch das Kurvenintegral direkt auswerten können. Für den Kreis bietet sich
die Parametrisierung


r cos t


mit 0 ≤ t ≤ 2π
(9.172)
r(t) =  r sin t 
0
an. Der Tangentenvektor ist folglich gegeben durch:


−r sin t
dr 

=  r cos t  .
dt
0
(9.173)
Das Kurvenintegral wird mit dieser Parametrisierung zu
 


:
%2π −3r sin t
−r sin t
 


· dr =
A
 3r cos t  ·  r cos t  dt
C
0
1
0
%2π
%2π
2
=
2
2
3r (sin t + cos t)dt = 3r
0
2
dt = 6r2 π.
(9.174)
0
Das Kurvenintegral ist in diesem Fall nicht viel schwerer zu berechnen als das Oberflächenintegral.
Aus dem Oberflächenintegral sehen wir aber, dass in diesem Fall für jede Kurve in der Ebene das
Integral nur von der Größe der eingeschlossenen Fläche abhängt.
9.4.3
Bedeutung
über
Aus dem Satz von Stokes folgt, dass das Oberflächenintegral eines Wirbelfeldes ∇ × A
eine geschlossene Oberfläche F verschwindet. Wir können uns nämlich vorstellen, dass eine geschlossene Fläche entsteht, wenn wir die Randkurve C wie bei einem Beutel auf einen Punkt
9 Integration von Feldern: Kurven- und Flächenintegrale
235
zusammenziehen (siehe Abb. 9.37). Die Länge des Randes ist dann 0 und somit verschwindet auch
das Kuvenintegral
:
· dr = 0.
A
(9.175)
C
Wegen des Satzes von Stokes muss deshalb auch das Oberflächenintegral
:
· df
rot A
(9.176)
F
über die geschlossene Oberfläche verschwinden.
Abbildung 9.37: Wenn sich die Umrandung C auf einen Punkt zusammenzieht, wird die Fläche F
zu einer geschlossenen Fläche.
Aus dem Satz von Stokes folgt weiters,
dass alle Flächen F1 , F2 , . . . mit demselben Rand C auch
&
· df liefern.
dasselbe Oberflächenintegral F rot A
Schließlich erlaubt es uns der Satz von Stokes, die Frage nach der Wegunabhängigkeit von
Kurvenintegralen noch einmal aufzugreifen. Wir haben ja schon früher gesehen, dass die Wegunabhängigkeit von Integralen äquivalent zum Verschwinden
von Kurvenintegralen längs geschlosse;
· dr = 0 für beliebige geschlossene Kurven gilt,
ner Kurven ist. Wenn wir nun annehmen, dass C A
muss dies auch für Kurven um sehr kleine Flächen gelten. Dann gilt jedoch
:
· dr = rot A
· df = 0.
A
(9.177)
C
Da dies gemäß Annahme für beliebige (aber sehr kleine) Flächen gelten muss, finden wir, dass die
Rotation verschwindet. Verschwindet also das Kurvenintegral für beliebige Kurven, verschwindet
auch die Rotation:
:
· dr = 0
= 0.
A
für alle geschlossenen Wege C ⇒ rot A
(9.178)
C
Umgekehrt folgt aus dem Stokesschen Satz, dass das Kurvenintegral längs geschlossener Kurven
verschwindet, wenn die Rotation gleich 0 ist:
:
%
· dr =
· df = 0.
A
rot A
(9.179)
C
F
= 0 eine sowohl notwendige als auch hinreichende Bedingung für die
Das heißt, dass rot A
Wegunabhängigkeit von Kurvenintegralen ist. Um festzustellen, ob Kurvenintegrale wegunabhängig
sind, genügt es also zu prüfen, ob die Rotation des Vektorfeldes verschwindet.
Zusammenfassend halten wir fest, dass folgende Aussagen äquivalent sind:
• Das Kurvenintegral
• Das Kurvenintegral
&
C
r ) · dr ist wegunabhängig.
A(
C
r ) · dr über jede geschlossene Kurve C verschwindet.
A(
;
236
9 Integration von Feldern: Kurven- und Flächenintegrale
der Gradient von φ ist, A
= grad φ.
• Es existiert ein skalares Feld φ, sodass das Vektorfeld A
konservativ.
Die Funktion φ wird Potential genannt und das Vektorfeld A
des Vektorfeldes A
verschwindet.
• Die Rotation rot A
(Die Frage, ob das Integrationsgebiet einfach zusammenhängend ist oder nicht, haben wir in allen
Überlegungen vernachlässigt. Der interessierte Leser sei in diesem Punkt auf die weiterführende
Literatur verwiesen.)
9.4.4
Das Vektorpotential
= 0, können wir ein Skalarfeld φ definieren, sodass dessen Gradient gleich dem VekFalls rot A
= grad φ. Es stellt sich nun die Frage (zum Beispiel im Zusammenhang mit
torfeld A ist: A
dessen Divergenz verschwindet (div B
= 0), als
magnetischen Feldern), ob wir auch ein Feld B,
Ableitung eines Feldes darstellen können.
Im Falle der Darstellung eines wirbelfreien Feldes als Gradientenfeld kann man von der Beobachtung ausgehen, dass die Rotation eines Gradientenfeldes verschwindet,
rot (grad φ) = 0.
(9.180)
als Gradient eines Skalarfeldes ausgeDies legt die Vermutung nahe, dass ein wirbelfreies Feld E
drückt werden kann. Wie wir ja jetzt wissen, kann man das tatsächlich tun. Nun gibt es die analoge
Identität
= 0,
div (rot A)
(9.181)
die besagt, dass Wirbelfelder quellenfrei sind. Ganz analog zum obigen Fall scheint dieses Ergebnis
(div B
= 0) als Rotation eines anderen
die Vermutung nahe zu legen, dass ein quellenfreies Feld B
geschrieben werden könnte: B
= rot A.
Diese Vermutung kann durch explizite KonVektorfeldes A
für ein quellenfreies Feld B
bestätigt werden. Ein solches Vektorfeld
struktion eines Vektorfeldes A
wird Vektorpotential genannt.
A
= rot A,
muss für die Komponenten von A
gelten:
Falls B
Bx =
∂Az
∂Ay
−
,
∂y
∂z
By =
∂Ax
∂Az
−
,
∂z
∂x
Bz =
∂Ay
∂Ax
−
.
∂x
∂y
(9.182)
den Gradienten einer skalaren Funktion χ addieren können,
Da wir zu jedem Vektorpotential A
ohne die Beziehung B = rot A zu stören,
+ grad χ),
= rot A
= rot A
+ rot (grad χ) = rot (A
B
(9.183)
=0
eine gewisse Freiheit. Um A
eindeutig zu bestimmen, müssen noch
haben wir in der Wahl von A
Nebenbedingungen gewählt werden. Man nennt dies die Eichung von A.
Wir nutzen nun diese Eichmöglichkeit und versuchen den Ansatz Az = 0. Dann haben wir
Bx = −
∂Ay
∂z
und By =
∂Ax
.
∂z
(9.184)
Integration nach z liefert:
%z
Ay = −
za
Bx (x, y, z )dz (9.185)
9 Integration von Feldern: Kurven- und Flächenintegrale
237
und
%z
Ax =
By (x, y, z )dz + f (x, y).
(9.186)
za
Hier ist f (x, y) eine Integrationskonstante, auf die wir für Ay wegen der Eichmöglichkeit verzichtet
haben. Um die dritte Gleichung zu lösen, setzen wir Ax und Ay ein und erhalten:
Bz
=
=
∂Ax
∂Ay
−
∂x
∂y
%z
%z
∂Bx
∂By
∂f
−
(x, y, z )dz −
(x, y, z )dz −
∂x
∂y
∂y
za
%z
=
−
za
#
$
∂Bx
∂By
∂f
(x, y, z ) +
(x, y, z ) dz −
.
∂x
∂y
∂y
(9.187)
za
quellenfrei ist. Demnach gilt:
Wir wissen aber, dass B
= ∂Bx + ∂By + ∂Bz = 0
div B
∂x
∂y
∂z
(9.188)
∂Bx
∂By
∂Bz
+
=−
.
∂x
∂y
∂z
(9.189)
und somit
Wenn wir dieses Ergebnis in Gleichung (9.187) einsetzen, ergibt sich
%z #
Bz (x, y, z) =
$
∂Bz
∂f
.
(x, y, z ) dz −
∂z
∂y
(9.190)
za
Wir können das Integral ausführen und erhalten
∂f
y,
y,
(x,
z) = (x,
z) − Bz (x, y, za ) −
Bz
.
Bz
∂y
(9.191)
∂f
= −Bz (x, y, za ).
∂y
(9.192)
Das heißt,
Integration liefert schließlich:
%y
f (x, y) = −
Bz (x, y , za )dy .
(9.193)
ya
Somit ist folgendes Feld ein Vektorpotential für B:
%z
%y
By (x, y, z )dz −
Ax (x, y, z) =
za
Bz (x, y , za )dy ,
(9.194)
ya
%z
Ay (x, y, z) =
−
Bx (x, y, z )dz ,
(9.195)
za
Az (x, y, z) =
0.
(9.196)
impliziert also die Existenz eines Vektorpotentials A,
sodass
Die Quellenfreiheit eines Feldes B
B = rot A.
238
9 Integration von Feldern: Kurven- und Flächenintegrale
Kapitel 10
Differentialgleichungen
10.1
Grundbegriffe
Beziehungen zwischen Variablen werden in der Physik oft durch Gleichungen beschrieben, welche
Ableitungen enthalten. Ein Beispiel für eine solche Gleichung ist die Newtonsche Bewegungsgleichung
2
d r
F = ma = m 2 ,
dt
(10.1)
welche die Dynamik eines Objektes der Masse m unter Einwirkung der Kraft F beschreibt. Die
Kraft F , die auf den Körper wirkt, kann konstant oder eine Funktion des Ortes sein. Durch Lösung
dieser Gleichung erhält man den Ort r(t) des Objekts als Funktion der Zeit. Die Lösung der
Gleichung F = mr¨ ist also keine Zahl sondern eine Funktion.
Eine Gleichung, die eine oder mehrere Ableitungen einer gesuchten Funktion y(x) enthält, nennt
man eine Differentialgleichung. Wenn die höchste Ableitung von y(x), die in der Gleichung
auftritt, die n-te Ableitung y (n) (x) ist, hat man es mit einer Differentialgleichung n-ter Ordnung zu tun. Natürlich kann eine Differentialgleichung n-ter Ordnung auch Ableitungen niedrigerer Ordnung beinhalten sowie von der Funktion y(x) selbst und der Variablen x abhängen. Eine
Differentialgleichung, bei der die Funktion y(x) nur von einer einzigen Variablen x und den Ableitungen dieser Funktion nach x abhängt, nennt man eine gewöhnliche Differentialgleichung. Im
Gegensatz dazu ist eine partielle Differentialgleichung eine Bestimmungsgleichung für eine Funktion y(x1 , x2 , . . . , xn ), die von mehreren Variablen und den partiellen Ableitungen der Funktion
abhängt. Auch in diesem Fall bezieht sich die Ordnung der Gleichung auf die höchste vorkommende
partielle Ableitung.
Die allgemeine Form einer gewöhnlichen Differentialgleichung für die Funktion y(x) ist:
F (x, y, y , y , y , . . . , y (n) ) = 0.
(10.2)
Hier haben wir die Differentialgleichung in impliziter Form dargestellt. Falls wir sie nach der
höchsten Ableitung auflösen können, ergibt sich in expliziter Form
y (n) = f (x, y, . . . , y (n−1) ).
(10.3)
Beispiele für gewöhnliche Differentialgleichungen sind
y + y = 0,
(y )2 + xy = 0,
(10.4)
(10.5)
sin x · y + y 2 = 0.
(10.6)
239
240
10 Differentialgleichungen
Eine Funktion y(x) bezeichnen wir als Lösung einer gegebenen Differentialgleichung, falls y(x)
diese Gleichung erfüllt. Eine Funktion, die die Differentialgleichung löst, wird auch ein Integral
der Differentialgleichung genannt und das Finden einer solchen Lösung wird auch Integrieren
genannt.
Betrachten wir zum Beispiel die Differentialgleichung
y = −y.
(10.7)
Da für die Funktion y(x) = sin x gilt, dass y = cos x und y = − sin x = −y, ist y = sin x eine
Lösung dieser Differentialgleichung. Es gibt für diese Differentialgleichung jedoch mehr als eine
Lösung. So wird sie auch von y = 3 sin x oder allgemeiner von y = A sin x erfüllt. Weiters ist
die Funktion y(x) = cos x wegen y = − sin x und y = − cos x = −y eine Lösung. Genauso löst
y = 7 cos x oder allgemeiner y = B cos x die Gleichung. Aus den beiden Lösungen A sin x und
B cos x können wir durch Addition eine allgemeine Lösung konstruieren:
y(x) = A sin x + B cos x.
(10.8)
Für beliebige Konstanten A und B löst y(x) die Differentialgleichung y = −y. Die Differentialgleichung hat also eine unendliche Anzahl von Lösungen. Da A und B beliebig gewählt werden
können, sprechen wir hier von einer zweiparametrigen Lösungsschar. Für eine Differentialgleichung n-ter Ordnung hat eine solche allgemeine Lösung n frei wählbare Parameter.
Durch zusätzliche Bedingungen, welche die Werte der Parameter festsetzen, erhält man aus der
allgemeinen Lösung eine Partikulärlösung (oder spezielle Lösung). Wenn man beispielsweise
weiß, dass für das obige Beispiel y am Ort x = 0 den Wert 0 besitzt, folgt:
y(0) = A sin(0) +B cos(0) = B = 0.
=0
(10.9)
=1
Der Wert der ersten Ableitung am Ort x = 0 legt dann auch noch den Parameter A fest
y (0) = A cos(0) −B sin(0) = A.
=1
(10.10)
=0
Wenn wir zum Beispiel wissen, dass y (0) = 1 ist, folgt A = 1. Die so genannten Anfangsbedingungen y(0) = 0 und y (0) = 1 legen also die Parameter A = 1 und B = 0 fest und führen so auf
die Partikulärlösung
y(x) = sin x.
(10.11)
Für eine allgemeine Lösung y(x) einer Differentialgleichung n-ter Ordnung werden die n Parameter
durch Angabe des Funktionswertes y(x0 ) und der Werte der (n − 1) Ableitungen y (x0 ), y (x0 ),
. . . , y (n−1) (x0 ) an einer Stelle x0 festgelegt. In diesem Fall spricht man von einem Anfangswertproblem oder einer Anfangswertaufgabe. Diese Bezeichnungsweise stammt natürlich von der
Betrachtung einer Variablen y(t) als Funktion der Zeit t. Die Anfangsbedingungen y(t0 ), y (t0 ),
. . . , y (n−1) (t0 ) beschreiben den Zustand des Systems zum Zeitpunkt t0 . Die Partikulärlösung beschreibt dann die zeitliche Entwicklung des Systems ausgehend von diesen Anfangsbedingungen.
Alternativ dazu können wir die Parameter der allgemeinen Lösung auch durch Angabe der Funktionswerte y(x) an n verschiedenen Stellen x1 , x2 , . . . , xn festlegen. Die Funktionswerte an diesen
Stellen werden Randwerte oder Randbedingungen genannt und man spricht in diesem Fall von
einem Randwertproblem oder einer Randwertaufgabe.
Im obigen Beispiel können wir etwa verlangen, dass y(x) an den Stellen x1 = 0 und x2 = π/2 die
Werte y(x1 = 0) = 0 und y(x2 = π/2) = 2 besitzt. Diese Randbedingungen können wir durch
10 Differentialgleichungen
241
Wahl der Parameter A und B erfüllen:
A sin(0) +B cos(0) = 0
=0
⇒
B = 0,
(10.12)
⇒
A = 2.
(10.13)
=1
A sin( π2 ) +B cos( π2 ) = 2
=1
=0
Die Partikulärlösung unter diesen Randbedingungen ist also
y(x) = 2 sin x.
(10.14)
Zur analytischen Lösung von Differentialgleichungen gibt es kein allgemein gültiges Rezept. Es gibt
aber einige wichtige gewöhnliche Differentialgleichungen, die wir lösen können. Diese Differentialgleichungen wollen wir im Folgenden diskutieren. Falls für eine gewöhnliche Differentialgleichung
keine analytische Lösung existiert, kann man numerische Methoden verwenden, um Lösungen
mit beliebiger Genauigkeit zu erhalten. Zur numerischen Integration von Differentialgleichungen existiert eine Vielzahl von Methoden, bei denen die Differentialgleichungen üblicherweise in
kleinen Schritten gelöst werden.
10.2
Differentialgleichungen erster Ordnung
Differentialgleichungen erster Ordnung enthalten nur die gesuchte Funktion y(x) selbst und ihre
erste Ableitung y (x):
F (x, y, y ) = 0
(10.15)
y = f (x, y).
(10.16)
oder nach y aufgelöst
Beispiele dafür sind
y = xy,
sin(y + x) cos y = x
und
y =
√
y.
(10.17)
In dieser Form gibt die Differentialgleichung für jeden Punkt in der xy-Ebene eine Richtung (Steigung) vor. Damit y(x) eine Lösung der Differentialgleichung ist, muss ihr Graph diesen Richtungen
in jedem Punkt folgen (siehe Abb. 10.1). Anschaulich ist klar, dass das Richtungsfeld y = f (x, y)
für eine bestimmte Anfangsbedingung (x0 , y0 ) die Lösung der Differentialgleichung eindeutig festlegt.
Im einfachsten Fall hängt die rechte Seite der Gleichung nicht von y ab und wir erhalten die
Differentialgleichung
y = f (x)
oder
dy
= f (x).
dx
(10.18)
Diese Differentialgleichung ist uns schon früher begegnet (im Kapitel über die Integration), nur
haben wir sie damals nicht als Differentialgleichung bezeichnet. Das Auffinden einer Funktion y(x),
sodass ihre Ableitung dy/dx gleich einer gegebenen Funktion f (x) ist, ist nämlich die Hauptaufgabe
der Integralrechnung: Finde eine Funktion F (x) (die so genannte Stammfunktion), sodass für ihre
Ableitung F (x) = f (x) gilt. Die Lösung y(x) der Differentialgleichung (10.18) ist nichts anderes
als die Stammfunktion von f (x). Daher lautet die allgemeine Lösung der Differentialgleichung
(10.18)
%
y(x) = f (x)dx + C,
(10.19)
wobei hier
&
f (x)dx das unbestimmte Integral ist, das von der Variablen x abhängt.
242
10 Differentialgleichungen
Abbildung 10.1: Eine Differentialgleichung der Form y = f (x, y) gibt an jedem Punkt (x, y) die
Steigung y vor. Die Lösungen der Differentialgleichung müssen tangential zu diesem Richtungsfeld
sein. Durch Angabe der Anfangsbedingungen (x0 , y0 ) wählt man aus der Schar der möglichen
Lösungen eine bestimmte Lösung aus.
Die Integrationskonstante C ist hier der freie Parameter, der erst durch die Wahl der Anfangsbedingung (oder Randbedingung) festgelegt wird. Betrachten wir zum Beispiel die Differentialgleichung
dy
= x.
dx
(10.20)
Die allgemeine Lösung dieser Gleichung ist y(x) = x2 /2 + C. Durch Ableitung von y(x) = x2 /2 + C
nach x können wir explizit überprüfen, dass diese Funktion die Differentialgleichung tatsächlich
erfüllt. Die Randbedingung y(0) = 1 legt die Konstante C fest:
02
+C =1
2
⇒
C = 1.
(10.21)
Eine gewöhnliche Differentialgleichung erster Ordnung hat auch im allgemeinen Fall eine Lösungsschar, die einen freien Parameter c besitzt: y = y(x, c). Um diesen freien Parameter c festzusetzen,
genügt für die Differentialgleichung erster Ordnung eine einzelne Anfangs- oder Randbedingung.
Im Folgenden werden wir einige Differentialgleichungen erster Ordnung behandeln, die einfach
genug sind, dass wir sie leicht analytisch lösen können.
10.2.1
Differentialgleichungen mit separierbaren Variablen
Wenn sich eine Differentialgleichung erster Ordnung in der Form
dy
= f (x)g(y)
dx
(10.22)
schreiben lässt, können wir sie auf einfache Weise lösen. Da die rechte Seite ein Produkt von zwei
Funktionen ist, deren eine nur von x und die andere nur von y abhängt, können wir die Gleichung
in der Form
dy
= f (x)dx
g(y)
(10.23)
schreiben. Dabei haben wir die ursprüngliche Gleichung so umgeformt, dass die rechte Seite nur von
y abhängt und die linke Seite nur von x. Wir haben die Variablen also separiert (d.h. getrennt).
10 Differentialgleichungen
243
Aus diesem Grund bezeichnet man Differentialgleichungen der Form y = f (x)g(y) als Differentialgleichung mit separierbaren Variablen. Aus dieser Gleichung für die beiden Differentiale folgt, dass
sich die zugehörigen unbestimmten Integrale nur um eine willkürliche Konstante C unterscheiden
können:
%
%
dy
= f (x)dx + C.
(10.24)
g(y)
Nach Integration beider Seiten und Auflösung der Gleichung nach y erhält man die allgemeine
Lösung der Differentialgleichung mit dem freien Parameter C in expliziter Form. Falls sich die
erhaltene Gleichung nicht nach y auflösen lässt, ist die Lösung in impliziter Form gegeben.
Mathematisch etwas exakter lassen sich Differentialgleichungen mit separierbaren Variablen wie
folgt behandeln. Zunächst bestimmen wir die Nullstellen y1 , y2 , . . . der Funktion g(y). Durch
Einsetzen in die Differentialgleichung erkennen wir, dass die konstanten Funktionen y(x) = y1 ,
y(x) = y2 , etc. Lösungen sind.
Als nächstes betrachten wir die Differentialgleichung in den nullstellenfreien Intervallen zwischen
den Nullstellen. Da in diesen Intervallen g(y) = 0, können wir die Differentialgleichung umformen
zu:
y
= f (x).
(10.25)
g(y)
Wir definieren nun die Funktion Φ(y) als die Stammfunktion von 1/g(y) und die Funktion F (x)
als die Stammfunktion von f (x). Da in den betrachteten Intervallen Φ (x) = 1/g(x) nullstellenfrei
ist, d. h. Φ streng monoton fallend oder wachsend ist, existiert hier die Umkehrfunktion Φ−1 von
Φ. Durch Einsetzen in die Differentialgleichung können wir verifizieren, dass
y(x) = Φ−1 (F (x) + C)
(10.26)
die Differentialgleichung löst:
y (x)
=
=
(Φ−1 ) (F (x) + C)F (x)
f (x)
f (x)
= = f (x)g(y),
Φ (Φ−1 (F (x) + C))
Φ (y)
(10.27)
wobei wir die Differentiationsregel (3.26) für die Umkehrfunktion verwendet haben. C ist hier
wieder eine beliebige Integrationskonstante, die durch Wahl der Anfangsbedingungen festgelegt
wird.
Beispiel:
Gegeben sei die Differentialgleichung xy + y = 0. Wir können diese Gleichung umformen zu
dy
dx
=− .
y
x
(10.28)
ln y = − ln x + C.
(10.29)
Integration auf beiden Seiten ergibt:
Wir wenden nun auf beide Seiten der Gleichung die Exponentialfunktion an und erhalten
eln y = e− ln x+C = e− ln x · eC .
(10.30)
Somit gilt
y=
α
,
x
(10.31)
244
10 Differentialgleichungen
wobei wir die Konstante eC in α umbenannt haben. Die allgemeine Lösung ist also die einparametrige Kurvenschar y = α/x. Eine Anfangsbedingung (z. B. y(1) = α/1 = 2) setzt den freien
Parameter fest (hier auf α = 2).
Beispiel: Barometrische Höhenformel
Als weiteres Beispiel wollen wir die Abhängigkeit des Luftdrucks von der Höhe in einer isothermen
Atmosphäre betrachten. Dazu müssen wir zunächst eine geeignete Differentialgleichung aufstellen
und sie danach auch lösen. (In den meisten Fällen ist das Aufstellen einer Gleichung der einfachere
Schritt als die anschließende Lösung der Gleichung.)
Der Luftdruck an einem bestimmten Ort wird durch das Gewicht der Luftsäule bestimmt, die
sich über diesem Ort befindet. Wenn wir uns nach oben bewegen, wird die Luftmenge, die auf
einer bestimmten Fläche lastet, immer kleiner. Daher nimmt der Luftdruck mit der Höhe ab. Um
herauszufinden, auf welche Weise der Luftdruck von der Höhe abhängt, betrachten wir eine dünne
Luftschicht, die parallel zum Boden ist und sich in der Höhe z befindet (siehe Abb. 10.2). (Wir
messen die Höhe z bezüglich des Bodens, den wir in die xy-Ebene legen.)
Abbildung 10.2: Der Druck an der Oberseite der Luftschicht mit der Dicke dz unterscheidet sich
vom Druck an der Unterseite um das Gewicht pro Flächeneinheit der Luftschicht selbst.
An der Unterseite dieser Schicht, also bei der Höhe z, herrscht der Druck p(z). Auf ihrer Oberseite
ist der Druck leicht verschieden: p(z + dz) = p(z) + dp. Wir stellen uns jetzt vor, dass wir aus dieser
Schicht einen dünnen Quader mit der Grundfläche A herausschneiden. Dieser Quader enthält die
Masse ρ(z)dV = ρ(z)Adz an Luft, wobei hier dV = Adz das Volumen des Quaders ist. Der
Druckunterschied zwischen der Höhe z und z + dz ist auf das Gewicht der Luftmassen in dieser
Schicht zurückzuführen. Das Gewicht gρ(z)Adz der Luft im Quader wirkt auf die Fläche A. Die
Druckdifferenz dp ergibt sich aus dieser Kraft dividiert durch die Fläche A (Druck ist Kraft pro
Fläche):
dp = −
gρ(z)Adz
= −gρ(z)dz.
A
(10.32)
Das negative Vorzeichen ist notwendig, weil der Druck mit der Höhe abnimmt.
Wir benötigen jetzt noch einen Ausdruck für die Dichte ρ der Luft. Die Dichte eines Gases hängt
natürlich von den äußeren Bedingungen wie Temperatur und Druck ab. Wir nehmen hier an, dass
wir die Luft als ideales Gas behandeln können. Für ein ideales Gas wird der Zusammenhang
zwischen Druck p, Volumen V und Temperatur T durch die Zustandsgleichung
pV = N kB T
(10.33)
beschrieben. Dabei ist N die Anzahl der Gasmoleküle und kB ist die so genannte Boltzmannkonstante. Der Druck eines idealen Gases ist demnach gegeben durch:
p=
N kB T
.
V
(10.34)
10 Differentialgleichungen
245
Die rechte Seite dieser Gleichung hängt von der Teilchendichte N/V ab. Da wir jedoch an der
Abhängigkeit des Druckes von der Massendichte ρ = M/V interessiert sind (M ist hier die
Gesamtmasse des Gases im Volumen V ), multiplizieren wir Zähler und Nenner auf der rechten
Seite der obigen Gleichung mit der Masse m eines individuellen Gasteilchens:
p=
M kB T
kB T
N mkB T
=
=ρ
.
Vm
V m
m
(10.35)
Hier haben wir ausgenutzt, dass die Gesamtmasse M gleich der Masse m einzelner Teilchen multipliziert mit der Anzahl N der Teilchen ist. Wir können die Dichte ρ somit ausdrücken als
ρ=
pm
.
kB T
(10.36)
Diese Beziehung setzen wir nun in Gleichung (10.32) ein und erhalten
dp = −gρdz = −
gm
pdz.
kB T
(10.37)
Diese Gleichung haben wir mit Hilfe von physikalischen Überlegungen aufgestellt. Was nun folgt
ist die mathematische Lösung dieser Gleichung.
Wir können die Variablen p und z separieren:
dp
gm
=−
dz.
p
kB T
(10.38)
Integration ergibt (unter der Annahme einer isothermen Atmosphäre, das heißt unter der Annahme,
dass die Temperatur T nicht von der Höhe z abhängt und somit gm/kB T konstant ist):
ln p = −
gm
z+C
kB T
oder durch Anwendung der Exponentialfunktion auf beiden Seiten:
7
6
gm
z exp{C}.
p = exp −
kB T
(10.39)
(10.40)
Die Konstante K ≡ exp{C} ermitteln wir, indem wir verlangen, dass bei z = 0 der Druck einen
bestimmten p0 Wert annehmen muss:
7
6
gm
0 exp{C} = exp{C} = p0 .
(10.41)
p(0) = exp −
kB T
Somit erhalten wir schließlich die barometrische Höhenformel:
6
7
gm
p = p0 exp −
z .
kB T
(10.42)
Beispiel: Kompression eines idealen Gases
Stellen wir uns ein Rohr mit der Querschnittsfläche A vor, das auf einer Seite von einem beweglichen
Kolben und auf der anderen Seite von einer unbeweglichen Wand abgeschlossen wird (siehe Abb.
10.3).
Das eingeschlossene Volumen sei mit einem idealen Gas gefüllt, das der Zustandsgleichung
pV = N kB T
(10.43)
gehorcht. Da im Gas ein gewisser Druck p vorherrscht, wirkt auf den Kolben eine Kraft F = Ap,
die den Kolben nach außen drückt. Wenn wir das Gas nun komprimieren wollen, indem wir den
246
10 Differentialgleichungen
Abbildung 10.3: Ein beweglicher Kolben leistet Arbeit gegen den Druck eines Gases in einem
Zylinder.
Kolben in das Rohr schieben, verrichten wir gegen diese Kraft Arbeit. Wir wollen bestimmen,
welche Arbeit aufgebracht werden muss, um das Volumen von seinem ursprünglichen Wert V0 auf
ein kleineres Volumen zu verringern. Dazu betrachten wir zunächst die Arbeit dW , die geleistet
wird, wenn wir den Abstand x des Kolbens von der fixen Wand um einen kleinen Betrag dx
verringern. Diese kleine Arbeit dW ergibt sich aus dem Produkt von Weg und Kraft
dW = −F dx = −pAdx.
(10.44)
Bei einer Kompression ist die Verschiebung dx negativ. Da die gegen die (positive) Kraft F geleistete Arbeit jedoch positiv sein soll, haben wir in der obigen Gleichung ein negatives Vorzeichen.
Durch die Verschiebung des Kolbens ändert sich das eingeschlossene Volumen um
dV = Adx.
(10.45)
Wir können daher in Gleichung (10.44) Adx durch dV ersetzen:
dW = −pdV.
(10.46)
Da sich durch die Kompression nicht nur das Volumen verändert sondern auch der Druck, müssen
wir nun den Druck p als Funktion des Volumens V ausdrücken. Aus der Zustandsgleichung des
idealen Gases folgt:
p=
N kB T
.
V
(10.47)
Einsetzen in Gleichung (10.46) ergibt:
N kB T
dV.
(10.48)
V
Wenn wir die Kompression isotherm durchführen, das heißt, wenn die Temperatur des Gases
durch Kontakt des Rohres mit einem Wärmebad konstant gehalten wird (dazu muss die Rohrwand natürlich wärmeleitend sein), ergibt die Integration:
dW = −
W = −N kB T ln V + C.
(10.49)
Dies ist die allgemeine Lösung der Differentialgleichung. Um eine passende Partikulärlösung zu
erhalten, bemerken wir, dass zu Beginn des Prozesses noch keine Arbeit geleistet wurde. Wir
verlangen also
W (V0 ) = −N kB T ln V0 + C = 0.
(10.50)
Somit erhalten wir für die Konstante C:
C = N kB T ln V0 .
Die geleistete Arbeit ist demnach gegeben durch:
W = N kB T ln V0 − N kB T ln V = N kB T ln
(10.51)
V0
V
.
(10.52)
10 Differentialgleichungen
10.2.2
247
Homogene lineare Differentialgleichung
Eine allgemeine Differentialgleichung n-ter Ordnung F (x, y, y , y , . . . , y (n) ) nennt man linear,
wenn die Funktion y und alle ihre n Ableitungen maximal in der 1. Potenz und nicht als Produkt
auftreten:
n
ai (x)y (i) = g(x),
(10.53)
i=0
wobei wir hier die Konvention benutzen, dass y (0) = y.
Beispiele für lineare Differentialgleichungen sind:
y + ay + by = 0,
y + sin x = 0,
(10.54)
(10.55)
y + xy − cos x = 0.
(10.56)
Hingegen sind die folgenden Differentialgleichungen nichtlinear:
y 2 + y = 0
xy y = 0
(zweite Potenz),
(Produkt).
(10.57)
(10.58)
Eine lineare Differentialgleichung 1. Ordnung hat die allgemeine Form
y + f (x)y = g(x).
(10.59)
Die Funktion g(x) wird als Störterm oder Störfunktion bezeichnet. Falls der Störterm fehlt,
haben wir es mit einer homogenen Differentialgleichung zu tun; falls ein Störterm existiert, nennt
man die Differentialgleichung inhomogen.
Die allgemeine homogene lineare Differentialgleichung 1. Ordnung hat die Form
y + f (x)y = 0.
(10.60)
Diese Gleichung können wir durch Trennung der Variablen lösen:
dy
= −f (x)dx.
y
(10.61)
Integration ergibt die allgemeine Lösung
%
ln y = −
f (x)dx + C
(10.62)
oder anders ausgedrückt
6 %
7
6 %
7
y = exp − f (x)dx exp{C} = K exp − f (x)dx ,
(10.63)
wobei wir die Konstante exp{C} in K umbenannt haben.
Beispiel: Radioaktiver Zerfall
Durch radioaktiven Zerfall können sich Atomkerne in andere Typen verwandeln. Wir wollen nun
untersuchen, wie sich durch radioaktiven Zerfall die Anzahl der Atome der Ausgangssubstanz in
einer radioaktiven Substanz mit der Zeit ändert. Da der Zerfall eines Atoms unabhängig von den
Zerfällen der anderen Atome ist, zerfallen in einer doppelt so großen Menge von Atomen auch
248
10 Differentialgleichungen
doppelt so viele Atome. Die Zahl dN der in einem kurzen Zeitintervall dt in einer radioaktiven
Substanz zerfallenden Atome ist somit proportional zur Gesamtzahl N der vorhandenen Atome:
dN = −λN dt.
(10.64)
Wir wählen hier ein negatives Vorzeichen, weil durch jeden Zerfall die Anzahl N der noch nicht zerfallenen Atome abnimmt. Die Proportionalitätskonstate λ, die Zerfallskonstante genannt wird,
hängt vom Atomtyp ab. λ besitzt die Dimension 1/Zeit. Durch Separation der Variablen erhalten
wir
dN
= −λdt.
(10.65)
N
Integration liefert
ln N = −λt + C
(10.66)
N (t) = e−λt+C = Ke−λt .
(10.67)
oder
Die Randbedingung N (0) = N0 (Atomanzahl zum Zeitpunkt t = 0) setzt die Konstante K fest:
N (0) = Ke−λ0 = K = N0 .
(10.68)
Das Zerfallsgesetz lautet also
N (t) = N0 e−λt .
(10.69)
Die Anzahl der noch nicht zerfallenen Atome nimmt demnach exponentiell mit der Zeit ab (siehe
Abb. 10.4). Nach der Zeit τ1/2 = ln 2/λ ist noch die Hälfte der ursprünglich vorhandenen Atome
übrig. Man nennt diese Zeit die Halbwertszeit.
Abbildung 10.4: Die Anzahl der noch nicht zerfallenen Atome einer radioaktiven Substanz nimmt
mit der Zeit exponentiell ab. Nach der Halbwertszeit τ1/2 sind nur noch die Hälfte der Atome übrig.
Beispiel: Exponentielles Wachstum
Betrachten wir eine Population von Individuen, die sich vermehren können (z.B Bakterien in einer Nährlösung). Falls die Ressourcen nicht knapp sind, ist die Zunahme der Individuenanzahl
proportional zur Individuenanzahl selbst:
dN = λN dt.
(10.70)
Die Proportionalitätskonstante λ ist die Vermehrungsrate. Die Differentialgleichung (10.70) unterscheidet sich nur im Vorzeichen vor der Proportionalitätskonstanten von der Differentialgleichung (10.64) im vorherigen Beispiel. Derselbe Lösungsweg führt uns in diesem Fall zu
N (t) = N0 eλt .
(10.71)
10 Differentialgleichungen
249
Die Populationsgröße nimmt exponentiell (also explosionsartig) zu. Für biologische Systeme kann
ein solches Wachstum natürlich nur weitergehen, bis die Ressourcen sich verknappen. Dann wird
λ schrumpfen und das Wachstum verlangsamen.
Beispiel: Bewegung mit Reibung
Wir betrachten einen Körper der Masse m, der sich unter dem Einfluss einer Reibungskraft entlang
einer Geraden bewegt. Die Bewegung des Körpers wird durch die Newtonsche Bewegungsgleichung
F = mv̇
(10.72)
beschrieben, wobei F die Kraft auf den Körper und v seine Geschwindigkeit ist. Die Kraft setzen
wir als proportional zur Geschwindigkeit und als der Bewegungsrichtung entgegengesetzt an:
F = −γv.
(10.73)
(Für einen kugelförmigen Körper mit Radius R in einer Flüssigkeit mit der Zähigkeit η gilt etwa für
niedrige Geschwindigkeiten das Stokessche Reibungsgesetz: F = −6πηRv.) In der obigen Gleichung
ist γ die so genannte Reibungskonstante. Einsetzen dieses Ausdrucks in die Bewegungsgleichung
ergibt:
v̇ =
γ
dv
= − v.
dt
m
(10.74)
Separation der Variablen und anschließende Integration liefert:
γ
v = v0 e− m t .
(10.75)
Dabei ist v0 die Geschwindigkeit zum Zeitpunkt t = 0. Das heißt, das Teilchen bleibt asymptotisch
stehen.
Um die Zeitabhängigkeit des Ortes x zu bestimmen, können wir wieder die Variablen separieren:
γ
dx = v0 e− m t dt.
(10.76)
Integration liefert:
x=−
v0 m − γ t
e m + C.
γ
(10.77)
Die Anfangsbedingung x(t = 0) = x0 setzt die Konstante C fest:
C = x0 +
Somit erhalten wir
x(t) = x0 +
v0 m
.
γ
γ
v0 m 1 − e− m t .
γ
(10.78)
(10.79)
Das heißt, der Körper erreicht für t → ∞ die asymptotische Position (siehe Abb. 10.5)
x∞ = x0 +
10.2.3
v0 m
.
γ
(10.80)
Inhomogene lineare Differentialgleichung
Die allgemeine Form einer inhomogenen linearen Differentialgleichung 1. Ordnung ist
y + f (x)y = g(x).
(10.81)
250
10 Differentialgleichungen
Abbildung 10.5: In einer zähen Flüssigkeit nähert sich ein Körper, auf den keine äußere Kraft wirkt,
exponentiell seiner asymptotischen Position x∞ . Die insgesamt zurückgelegte Distanz ist v0 m/γ.
Im Gegensatz zur homogenen linearen Differentialgleichung verschwindet für die inhomogene Gleichung der Störterm g(x) nicht. Um die allgemeine Lösung dieser Differentialgleichung zu finden,
genügt es, eine beliebige Partikulärlösung yp zu bestimmen, die dann einfach zur allgemeinen
Lösung der homogenen Gleichung yh addiert wird:
y = yh + yp .
(10.82)
yh + f (x)yh = 0,
(10.83)
Da yh die homogene Gleichung erfüllt,
und yp eine Partikulärlösung der inhomogenen Gleichung ist,
yp + f (x)yp = g(x),
(10.84)
erfüllt auch (yp + yh ) die inhomogene Gleichung :
(yp + yh ) + f (x)(yp + yh ) = yp + f (x)yp + yh + f (x)yh = g(x).
=g(x)
(10.85)
=0
Da wir aus dem letzten Abschnitt schon wissen, wie wir durch Variablenseparation die allgemeine
Lösung der homogenen Gleichung ermitteln können, müssen wir uns nur noch um die Bestimmung
einer beliebigen Partikulärlösung der inhomogenen Gleichung kümmern. In manchen Fällen können
wir eine geeignete Partikulärlösung erraten oder durch einen einfachen Ansatz bestimmen.
Beispiel:
Betrachten wir zum Beispiel die Differentialgleichung
xy − y = x2 .
(10.86)
Zunächst lösen wir die homogene Differentialgleichung xy − y = 0 durch Variablenseparation:
dy
dx
=
.
y
x
(10.87)
ln y = ln x + C,
(10.88)
Integration ergibt
woraus folgt
yh = kx,
(10.89)
10 Differentialgleichungen
251
wobei wir k = eC gesetzt haben. Durch Probieren finden wir, dass yp = x2 die inhomogene
Gleichung löst,
xy − y = x2x − x2 = 2x2 − x2 = x2 .
(10.90)
Die allgemeine, einparametrige Lösungsschar der Differentialgleichung xy −y = x2 ist also gegeben
durch:
y = yp + yh = x2 + kx.
(10.91)
Durch Einsetzen können wir uns davon überzeugen, dass diese Funktion tatsächlich eine Lösung
der inhomogenen Differentialgleichung ist.
Eine etwas systematischere Methode zum Auffinden einer Partikulärlösung einer inhomogenen Differentialgleichung ist die so genannte Variation der Konstanten. Bei diesem Verfahren fasst man
die Konstante k in der allgemeinen Lösung yh der homogenen Gleichung als eine Funktion von x
auf, k = k(x). Diesen Ansatz setzt man dann in die inhomogene Differentialgleichung und erhält
dadurch eine Differentialgleichung für k(x), die man durch Separation der Variablen lösen kann.
Beispiel:
Wir lösen die Differentialgleichung aus dem vorangehenden Beispiel nun auch durch Variation der
Konstanten. Dazu betrachten wir die Konstante k in der Lösung yh = kx als Funktion von x:
y = k(x) · x.
(10.92)
Diesen Ausdruck setzen wir nun in die inhomogene Differentialgleichung ein und erhalten nach
Anwendung der Produktregel für die Differentiation von k(x) · x die Gleichung:
xy − y
= x(k(x) · x) − k(x) · x
= x(k (x) · x + k(x)) − k(x)x
−xk(x)
= k (x)x2
+xk(x)
= k (x)x2 = x2 .
(10.93)
Die Differentialgleichung für k(x) lautet also
k (x) =
dk
= 1.
dx
(10.94)
Integration durch Variablentrennung liefert k(x) = x. (Eine Konstante C benötigen wir hier nicht,
da wir nur an einer Partikulärlösung der inhomogenen Differentialgleichung interessiert sind.) Die
gesuchte Partikulärlösung für die inhomogene Gleichung ist also
yp = k(x)x = x2 .
(10.95)
Für die allgemeine Lösung der inhomogenen Gleichung erhalten wir somit wie oben
y = yp + yh = x2 + kx.
(10.96)
Diesen Lösungsweg durch Variation der Konstanten können wir auch auf die allgemeine Form
y + f (x)y = g(x)
(10.97)
der inhomogenen Differentialgleichung anwenden. (Falls die Gleichung nicht diese Form hat sondern
h(x)y + f (x)y = g(x), dividieren wir durch h(x).) Wir lösen zuerst die homogene Gleichung durch
Separation der Variablen:
dy
= −f (x)dx.
y
(10.98)
252
10 Differentialgleichungen
Wir integrieren und erhalten als allgemeine Lösung
%
ln y = − f (x)dx + C
(10.99)
oder, durch Anwendung der Exponentialfunktion auf beide Seiten,
6 %
7
y = k exp − f (x)dx ,
(10.100)
wobei wir wieder k für eC geschrieben haben. Wir machen jetzt den Ansatz
6 %
7
y = k(x) exp − f (x)dx
(10.101)
und setzen ihn in die inhomogene Gleichung ein:
#
6 %
7$
6 %
7
d
k(x) exp − f (x)dx
+ k(x) exp − f (x)dx f (x) = g(x).
dx
(10.102)
Zur Auswertung des ersten Terms in der obigen Gleichung verwenden wir die Produktregel
#
6 %
7$
d
k(x) exp − f (x)dx
=
dx
6 %
7
6 %
7
# %
$
d
dk
exp − f (x)dx + k(x) exp − f (x)dx
− f (x)dx . (10.103)
dx
dx
=−f (x)
Somit erhalten wir
6 %
7
6 %
7
k (x) exp − f (x)dx − k(x) exp − f (x)dx f (x)
6 %
7
+ k(x) exp − f (x)dx f (x) = g(x).
Der zweite und dritte Term heben einander auf und somit erhalten wir:
6 %
7
k (x) exp − f (x)dx = g(x).
(10.104)
(10.105)
Wir formen diese Gleichung um zu
6%
dk = g(x) exp
7
f (x)dx dx,
integrieren sie dann und erhalten
6%
7
%
k = g(x) exp
f (x)dx dx + C.
(10.106)
(10.107)
Einsetzen dieses Ausdrucks in Gleichung (10.101) liefert schließlich die Partikulärlösung
#% 6%
7
$
6 %
7
g(x) exp
f (x)dx
dx + C exp − f (x)dx .
(10.108)
yp (x) =
Zweckmäßiger, als sich diese Formel zu merken, ist es, sich den allgemeinen Lösungsweg anzueignen,
um ihn bei Bedarf direkt auf die gegebene Differentialgleichung anzuwenden. Zusammenfassend
halten wir fest, dass wir die lineare inhomogene Differentialgleichung lösen können, indem wir
1. die allgemeine Lösung yh der homogenen Differentialgleichung bestimmen,
10 Differentialgleichungen
253
2. dann durch Variation der Konstanten eine Partikulärlösung yp der inhomogenen Gleichung
ermitteln, und schließlich
3. yh und yp addieren, um die allgemeine Lösung der inhomogenen Differentialgleichung zu
erhalten:
y(x) = yh (x) + yp (x).
(10.109)
Beispiel: Radioaktiver Zerfall mit Erzeugung der radioaktiven Substanz
Wir betrachten wieder den Zerfall einer radioaktiven Substanz, jetzt aber in einer Situation, in der
zum Beispiel in einem Reaktor die radioaktive Substanz ständig nachgeliefert wird. Pro Zeiteinheit
werden vom Reaktor r Atome erzeugt. Das heißt, dass rdt Atome im Zeitintervall dt dazukommen.
Diese dazukommenden Atome müssen auch in der Differentialgleichung für N , die Anzahl der
Atome, berücksichtigt werden:
dN = −λN dt + rdt
(10.110)
dN
= −λN + r,
dt
(10.111)
oder, äquivalent dazu,
wobei r eine Konstante ist. Dies ist eine inhomogene lineare Differentialgleichung. Die Lösung
der homogenen Gleichung kennen wir bereits:
Nh = Ke−λt .
(10.112)
Durch Variation der Konstanten ermitteln wir jetzt noch eine Partikulärlösung für die inhomogene
Gleichung. Wir setzen an
Np = K(t)e−λt
(10.113)
dNp
dK(t) −λt
=
e
+ K(t)(−λ)e−λt .
dt
dt
(10.114)
und erhalten dadurch
Einsetzen in die Differentialgleichung ergibt
dK −λt
−λt
−λt
e
−
λKe
= −
λKe
+ r,
dt
(10.115)
woraus folgt
dK −λt
e
=r
dt
oder
dK
= eλt r.
dt
(10.116)
Integration liefert
1
K = r eλt
λ
(10.117)
r λt −λt
r
e ·e
= .
λ
λ
(10.118)
und somit
Np =
Die allgemeine Lösung der Differentialgleichung ist also
N (t) = Nh (t) + Np (t) = Ke−λt +
r
.
λ
(10.119)
254
10 Differentialgleichungen
Für t → ∞ ist e−λt → 0 und N strebt dem Gleichgewichtswert r/λ zu. Wir müssen nun noch die
Konstante K aus den Anfangsbedingungen bestimmen. Wurde der Reaktor etwa zum Zeitpunkt
t = 0 in Betrieb genommen, sodass N (0) = 0, folgt
0=K+
r
λ
(10.120)
und infolgedessen:
N (t) =
r
1 − e−λt .
λ
(10.121)
Für t → ∞ ist e−λt → 0 und N strebt dem Gleichgewichtswert r/λ zu.
Konstanter Störterm und konstante Koeffizienten
Falls die Koeffizienten der Differentialgleichung 1. Ordnung konstant sind, können wir die Differentialgleichung
y + ay = b
(10.122)
mit einem konstanten Störterm b auch durch Variablenseparation lösen. Wir formen die obige
Gleichung um zu:
dy
= b − ay.
dx
(10.123)
dy
= dx.
b − ay
(10.124)
Daraus folgt:
Wir führen nun die neue Variable u = b − ay ein und führen eine Variablentransformation von y
nach u durch. Da du = −ady ist, gilt
du
= dx
−au
oder
du
= −adx.
u
(10.125)
Integration ergibt
ln u = −ax + C
(10.126)
oder, nach Anwendung der Exponentialfunktion auf beiden Seiten der Gleichung,
u = e−ax eC = ke−ax .
(10.127)
Rücktransformation nach y liefert schließlich:
y=
b
k
− e−ax .
a a
(10.128)
Beispiel: Radioaktiver Zerfall mit Erzeugung der radioaktiven Substanz
Wir behandeln das letzte Beispiel noch einmal mit dem oben beschriebenen Ansatz und formen
zunächst die Differentialgleichung
dN
dt
=
−λN + r
(10.129)
= dt.
(10.130)
um zu
dN
−λN + r
10 Differentialgleichungen
255
Abbildung 10.6: Die Anzahl von Atomen einer radioaktiven Substanz nähert sich exponentiell einer
Gleichgewichtsanzahl, die sowohl von der Zerfallskonstanten λ als auch von der Erzeugungsrate r
abhängt.
Integration liefert
−
1
ln(−λN + r) = t + C,
λ
(10.131)
woraus folgt:
N (t)
=
1
(r − k exp {−λt}),
λ
(10.132)
wobei wir k = exp(−λC) gesetzt haben. Die Anfangsbedingung N (t = 0) = N0 liefert
N0 =
k
r
−
λ λ
⇒
k = r − λN0
(10.133)
und wir erhalten schließlich (siehe Abb. 10.6)
N (t) =
r r −λt
+ N0 −
e .
λ
λ
(10.134)
Dies stimmt mit der bereits erhaltenen Lösung überein.
Beispiel: Bewegung mit Reibung im Gravitationsfeld
Wir betrachten nun ein Teilchen mit Masse m, das in einer viskosen Flüssigkeit im Gravitationsfeld
der Erde nach unten fällt (siehe Abb. 10.7).
Abbildung 10.7: Eine Kugel der Masse m sinkt unter der Wirkung der Gravitationskraft in einer
viskosen Flüssigkeit.
256
10 Differentialgleichungen
Wir lassen den Körper zur Zeit t = 0 an der Stelle x0 los und geben ihm eine Anfangsgeschwindigkeit v0 . Gesucht sind Position x und Geschwindigkeit v des Teilchens als Funktion der Zeit t.
Die x-Achse ist hier nach unten orientiert. Die Bewegungsgleichung für das Teilchen ist
F = ma
F
dv
= .
dt
m
oder
(10.135)
Die Kraft, die auf das Teilchen wirkt, besteht einerseits aus der Gravitationskraft Fg = gm und
andererseits aus der Reibungskraft Fr = −γv, welche der Bewegungsrichtung entgegengesetzt ist:
F = gm − γv.
(10.136)
γ
dv
= g − v.
dt
m
(10.137)
Einsetzen ergibt:
Diese Differentialgleichung unterscheidet sich nur durch den konstanten Term g von der Bewegungsgleichung (10.74). Aus Gleichung (10.137) folgt
dv
= dt
g − γv
m
(10.138)
und nach Transformation zur neuen Variablen u = g −
γv
m
γ
wegen du = − m
dv
du
γ
= − dt.
u
m
(10.139)
Durch Integration finden wir
ln u = −
γ
t + C,
m
(10.140)
was bedeutet
γ
γ
u = e− m t eC = ke− m t .
(10.141)
Durch Rücksubstitution finden wir
g−
und somit
v=
γ
γv
= ke− m t
m
γ
m
g − ke− m t .
γ
(10.142)
(10.143)
Aus der Anfangsbedingung v(0) = v0 erhalten wir
k=g−
v0 γ
m
(10.144)
und infolgedessen
v=
oder
v=
mg
−
γ
γ
mg
− v0 e− m t
γ
γ
γ
mg 1 − e− m t + v0 e− m t .
γ
(10.145)
(10.146)
Das heißt, dass sich die Geschwindigkeit v von der Anfangsgeschwindigkeit v0 ausgehend der asymptotischen Geschwindigkeit von mg/γ exponentiell nähert (siehe Abb. 10.8). Sobald diese Geschwindigkeit erreicht ist, halten sich mg und −γv genau
die Waage. Falls das Teilchen zum Zeitpunkt
t = 0 in Ruhe ist, gilt v = (mg/γ) 1 − e−(γ/m)t .
10 Differentialgleichungen
257
Abbildung 10.8: Die Geschwindigkeit v nähert sich exponentiell der Endgeschwindigkeit mg/γ, bei
der sich Reibungskraft und Gravitationskraft genau die Waage halten.
Die Konstante γ/m gibt uns ein Maß dafür, wie lange es dauert, bis das Teilchen seine Endgeschwindigkeit erreicht hat. Nach t = m/γ ist die ursprüngliche Differenz der Geschwindigkeit zur
Endgeschwindigkeit auf den Bruchteil 1/e abgefallen. Falls etwa v0 = 0, unterscheidet sich die Geschwindigkeit nach t = 5m/γ nur mehr um 0.7 % von der Endgeschwindigkeit und nach t = 15m/γ
beträgt der Unterscheid nur mehr 3.1 × 10−5 %. Nach einer Zeit t m/γ fällt das Teilchen also
im Wesentlichen mit konstanter Geschwindigkeit durch die viskose Flüssigkeit.
Um den Ort x als Funktion der Zeit zu bestimmen, gehen wir aus von der Differentialgleichung
γ
mg
dx
mg
v=
=
−
− v0 e− m t ,
(10.147)
dt
γ
γ
die wir einfach durch Variablenseparation integrieren können:
γ
mg
m
mg
x =
t−
− v0 e− m t · −
+C
γ
γ
γ
γ
m mg
mg
t+
− v0 e− m t + C.
=
γ
γ
γ
Die Konstante C bestimmen wir aus der Anfangsbedingung x(0) = x0 :
m mg
− v0 + C.
x0 =
γ
γ
(10.148)
(10.149)
Folglich gilt
C = x0 −
m
γ
mg
− v0
γ
(10.150)
und wir erhalten damit
x =
=
γ
m mg
m mg
mg
− v0 +
t+
− v0 e− m t
x0 −
γ
γ
γ
γ
γ
γ
m mg
mg
1 − e− m t .
t−
− v0
x0 +
γ
γ
γ
(10.151)
Da der Term e−(γ/m)t schnell gegen 0 geht, dominiert für Zeiten, die lang sind im Vergleich zu
m/γ, der lineare Term (das Teilchen fällt dann mit konstanter Geschwindigkeit). Für lange Zeiten
t m/γ gilt dann
m mg
mg
t−
− v0 .
x(t) ≈ x0 +
(10.152)
γ
γ
γ
258
10.3
10 Differentialgleichungen
Differentialgleichungen zweiter Ordnung
Differentialgleichungen zweiter Ordnung sind bei weitem komplexer (und deswegen auch interessanter) als Differentialgleichungen erster Ordnung. Zu den wichtigen Differentialgleichungen zweiter
Ordnung, die einem in der Physik gleich in den ersten Semestern begegnen, gehören die Newtonsche
Bewegungsgleichung und insbesondere die Schwingungsgleichung, mit der wir uns im Folgenden
vor allem beschäftigen werden.
Die allgemeine Form einer Differentialgleichung zweiter Ordnung ist
F (x, y, y , y ) = 0.
(10.153)
Wir konzentrieren uns hier auf die lineare Differentialgleichung zweiter Ordnung, die die Form
y (x) + p(x)y (x) + q(x)y(x) = g(x)
(10.154)
besitzt. Falls der Störterm g(x) verschwindet, spricht man auch hier von einer homogenen Differentialgleichung, anderenfalls von einer inhomogenen Differentialgleichung.
Besonders einfach (und trotzdem sehr wichtig) sind Differentialgleichungen 2. Ordnung, bei denen
die Koeffizienten p(x) und q(x) konstant sind. Für diese besondere Form betrachten wir zunächst
den homogenen Fall.
10.3.1
Homogene Differentialgleichung mit konstanten Koeffizienten
Die homogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten hat die allgemeine Form:
y + ay + by = 0.
(10.155)
Für eine lineare Differentialgleichung gilt, dass, wenn y(x) eine Lösung ist, auch das Produkt cy(x)
dieser Funktion mit einer Konstanten eine Lösung ist. Dies gilt, da (cy) = cy und (cy) = cy .
Weiters ist die Summe zweier Lösungen y1 und y2 auch eine Lösung der Differentialgleichung, da
gilt (y1 + y2 ) = y1 + y2 und (y1 + y2 ) = y1 + y2 (die Differentiation ist ein linearer Operator).
Allgemeiner: jede Linearkombination
y = c1 y 1 + c2 y 2
(10.156)
von zwei Lösungen y1 , y2 ist ebenfalls eine Lösung der Differentialgleichung. Man nennt diesen
Sachverhalt das Superpositionsprinzip. Die Konstanten c1 und c2 können hier reelle aber auch
komplexe Zahlen sein. Um die zwei freien Parameter einer Differentialgleichung 2. Ordnung zu
bestimmen, brauchen wir zwei Anfangs- oder Randbedingungen.
Für eine homogene lineare Differentialgleichung mit konstanten Koeffizienten können wir mit
Hilfe des exponentiellen Ansatzes y = Aeλx immer Lösungen finden, da durch Differentiation von
eλx nach x nur ein zusätzlicher Faktor λ entsteht. Dadurch sind alle Ableitungen von y nach x
proportional zueinander. Einsetzen des Ansatzes y = Aeλx in die Differentialgleichung (10.155)
liefert:
Aλ2 eλx + aAλeλx + bAeλx = 0.
(10.157)
Da eλx > 0 und da A = 0 nur der trivialen Lösung y = 0 entspricht, können wir beide Seiten dieser
Gleichung durch Aeλx dividieren und erhalten
λ2 + aλ + b = 0.
(10.158)
Dies ist eine quadratische Gleichung für λ, die so genannte charakteristische Gleichung, mit
den Lösungen:
√
−a ± a2 − 4b
.
(10.159)
λ1,2 =
2
10 Differentialgleichungen
259
Nur für diese bestimmten Werte von λ löst der exponentielle Ansatz y = A exp(λx) die Differentialgleichung.
Der exponentielle Ansatz kann natürlich auch für homogene lineare Differentialgleichungen höherer
Ordnung mit konstanten Koeffizienten verwendet werden. In diesem Fall hat die Differentialgleichung die allgemeine Form
an y (n) + an−1 y (n−1) + · · · + a1 y + a0 y = 0
(10.160)
oder
n
ai y (i) (x) = 0,
(10.161)
i=0
wobei die ai konstante Koeffizienten sind und wir festlegen, dass y (0) = y. Einsetzen des exponentiellen Ansatzes y = Aeλx und anschließende Division ergibt:
n
ai λi = 0 = a0 + a1 λ + a2 λ2 + · · · + an λn .
(10.162)
i=0
Diese algebraische Gleichung n-ten Grades hat genau n möglicherweise komplexe Lösungen λ1 , λ2 ,
. . . , λn , mit denen man allgemeine Lösungen der Differentialgleichung (10.160) konstruieren kann.
Kehren wir nun nach diesem kurzen Exkurs über Differentialgleichungen höherer Ordnung wieder
zu den Differentialgleichungen zweiter Ordnung zurück. Nach Gleichung (10.159) erfüllt der Ansatz
y = Aeλx genau für die Werte λ1,2 = −a/2 ± a2 /4 − b die ursprüngliche Differentialgleichung.
Diese beiden speziellen Werte werden Eigenwerte der Differentialgleichung genannt. Falls a2 /4 −
b ≥ 0, sind die beiden Eigenwerte reell. Anderenfalls sind sie beide komplex und zueinander komplex
konjugiert. Wie wir später noch genauer sehen werden, lassen sich aus Lösungen mit komplex
konjugierten Eigenwerten λ1 und λ2 durch Superposition immer reelle Lösungen konstruieren.
Wenn wir die Eigenwerte λ1 = α + iβ und λ2 = α − iβ haben (α und β reell) mit zugehörigen
Lösungen y1 = eλ1 x und y2 = eλ2 x , können wir die reellen Lösungen
λ1 x
iβx
eλ2 x
e
e + e−iβx
αx
+
y1 =
(10.163)
=e
= eαx cos βx
2
2
2
und
y2 =
eλ1 x
eλ2 x
−
2i
2i
=e
αx
eiβx − e−iβx
2i
= eαx sin βx
(10.164)
konstruieren. Durch Superposition der Lösungen, die zu den Eigenwerten λ1 und λ2 gehören,
erhalten wir die allgemeine Lösung der Differentialgleichung, die zwei freie Parameter A1 und A2
enthält:
y = A1 eλ1 x + A2 eλ2 x
(10.165)
oder, falls die Eigenwerte komplex sind und wir eine reelle Lösung wollen,
y = A1 eαx cos βx + A2 eαx sin βx.
(10.166)
Die freien Parameter A1 und A2 müssen durch Anfangs- oder Randbedingungen festgelegt werden.
Beispiel:
Wir betrachten ein ideal biegsames Seil der Länge l, das reibungslos über die Kante eines Tisches
gleitet (siehe Abb. 10.9). Wir wollen nun die genaue Lage des Seils sowie seine Geschwindigkeit als Funktion der Zeit bestimmen. Dazu legen wir fest, dass die Koordinate x die Länge des
überhängenden Teils des Seils bezeichnet. Die Newtonsche Bewegungsgleichung für das Seil lautet
m
d2 x
= F,
dt2
(10.167)
260
10 Differentialgleichungen
Abbildung 10.9: Ein biegsames Seil wird von der Gravitationskraft von einem Tisch gezogen.
wobei m die Gesamtmasse des Seils ist. Die auf das Seil wirkende Kraft F ist gleich dem Gewicht
des herabhängenden Teils. Da die Masse dieses Teils gleich mx/l ist, ergibt sich für die Kraft
F = gmx/l und somit
gmx
d2 x
=
2
dt
l
(10.168)
d2 x gx
= 0.
−
dt2
l
(10.169)
x(t) = Aeλt
(10.170)
m
oder, nach Division durch m:
Wir setzen nun als Lösung
an. Einsetzen in die Differentialgleichung ergibt:
d2 λt g λt Ae
Ae
−
=0
dt2
l
(10.171)
g
Aλ2 eλt − Aeλt = 0.
l
(10.172)
und somit
Nach Division durch Aeλt erhalten wir die charakteristische Gleichung
g
λ2 − = 0,
l
woraus folgt:
"
g
.
λ1,2 = ±
l
Beide Eigenwerte sind also reell. Die allgemeine Lösung der Differentialgleichung ist:
√g
√g
x(t) = A1 e+ l t + A2 e− l t .
(10.173)
(10.174)
(10.175)
Wenn wir uns vorstellen, dass das Seil anfänglich ruht und ein Stück der Länge x0 überhängt,
v(0) = 0
und
x(0) = x0 ,
(10.176)
können wir aus diesen Bedingungen die Konstanten A1 und A2 bestimmen:
x(0) = A1 + A2 = x0
und
"
v(0) = A1
g
− A2
l
"
g
= 0.
l
(10.177)
(10.178)
Aus der zweiten Bedingung folgt A1 = A2 , was, eingesetzt in die erste Bedingung, A1 = A2 = x0 /2
ergibt. Somit ist die Lösung für diesen speziellen Fall gegeben durch (siehe Abb. 10.10):
" √g x0 +√ g t
g
−
t
l
l
x(t) =
t .
(10.179)
+e
= x0 cosh
e
2
l
10 Differentialgleichungen
261
Abbildung 10.10: Der überhängende Anteil x des Seiles ist eine rasch anwachsende Funktion der
Zeit: x = x0 cosh( g/lt).
10.3.2
Der harmonische Oszillator
Schwingungen mit kleinen Amplituden führen uns immer zur so genannten Schwingungsgleichung,
die sich von Fall zu Fall nur durch den Wert und die Bedeutung der Koeffizienten sowie die Bedeutung der Variablen unterscheidet. Betrachten wir zum Beispiel einen Massenpunkt der Masse m,
der an einer gewichtslosen und undehnbaren Schnur der Länge l aufgehängt ist und im Erdschwerefeld hin und her pendeln kann (siehe Abb. 10.11). Den Zustand eines solchen Pendels beschreiben
wir durch den Winkel x, den der Faden mit dem Lot bildet.
Abbildung 10.11: Ein Massenpunkt der Masse m hängt an einer Schnur der Länge l. Die rückstellende Kraft Ft ist die Komponente der Gravitationskraft F , die tangential zur Kreisbahn des
Massenpunkts steht. s ist die Entfernung entlang des Kreisbogens des Massenpunktes von seiner
Ruhelage.
Auf den Massenpunkt wirkt die Gravitationskraft F = mg senkrecht nach unten. Wenn das Pendel
um einen Winkel x aus der Ruhelage ausgelenkt ist, wirkt die Komponente Fr = mg cos x in
Richtung der Schnur und hat daher keine Wirkung. Die Komponente Ft = mg sin x hingegen wirkt
normal zur Schnur und in Richtung zurück zur Ruhelage. Die Bewegungsgleichung für das Pendel
262
10 Differentialgleichungen
ist
ma = m
d2 s
= −Ft ,
dt2
(10.180)
wobei s = xl die Entfernung des Massenpunktes von seiner Ruhelage längs des Kreisbogens ist. Das
Minuszeichen in der Gleichung (10.180) ist notwendig, da die Richtung der Kraft der Auslenkung
x entgegengesetzt ist. (Die Kraft −Ft nennt man übrigens die Rückstellkraft.) Ft ist die Kraft,
die normal zur Schnur, also in Richtung der Bahnkurve wirkt. Einsetzen von s und Ft in Gleichung
(10.180) ergibt:
d2 lx
= −mg sin x
dt2
(10.181)
g d2 x
sin x.
=
−
dt2
l
(10.182)
m
oder, da l konstant ist,
Für kleine Auslenkungen gilt sin x ≈ x und wir erhalten in dieser Näherung die Schwingungsgleichung:
g d2 x
x.
(10.183)
=
−
dt2
l
Da es sich später als günstig herausstellen wird, setzen wir (g/l) = ω02 . Die Gleichung (10.183) wird
damit zu
d2 x
= −ω02 x.
dt2
(10.184)
Dies ist die allgemeine Gleichung des (eindimensionalen) harmonischen Oszillators, bei dem
die Rückstellkraft proportional zur Auslenkung ist. Das heißt, F = −kx. Die Konstante k
wird übrigens die Federkonstante oder auch die Kraftkonstante genannt. Für eine solche Kraft
ergibt sich die Bewegungsgleichung
m
d2 x
= −kx
dt2
oder wieder
d2 x
= −ω02 x,
dt2
(10.185)
wobei wir ω02 = k/m gesetzt haben. Das ist die Bewegungsgleichung für ein eindimensionales Teilchen der Masse m mit einer parabolischen potentiellen Energie V (x) = kx2 /2 (siehe
Abb. 10.12). Die Kraft ergibt sich aus diesem Potential durch Bildung der ersten Ableitung,
F = −dV /dx = −kx.
Abbildung 10.12: In einem parabolischen Potential V (x)
= kx2 /2 führt ein Massenpunkt der Masse
m eine harmonische Bewegung mit der Periode T = 2π m/k aus.
Wir wollen nun die Gleichung des harmonischen Oszillators lösen. Der Ansatz x = Aeλt liefert die
charakteristische Gleichung
λ2 + ω02 = 0.
(10.186)
10 Differentialgleichungen
263
Die Eigenwerte dieser Gleichung sind rein imaginär:
λ1,2 = ± −ω02 = ±iω0 .
(10.187)
Aus den beiden komplexen Lösungen
x1 = eiω0 t
und
x2 = e−iω0 t
(10.188)
konstruieren wir die reellen Lösungen
1 iω0 t
e
+ e−iω0 t = cos ω0 t,
2
1 iω0 t
e
x2 =
− e−iω0 t = sin ω0 t.
2i
x1 =
(10.189)
(10.190)
Die allgemeine Lösung der Differentialgleichung für den harmonischen Oszillator ist also
x = A cos ω0 t + B sin ω0 t.
(10.191)
Diese Lösung lässt sich auch schreiben als
x = C sin(ω0 t + ϕ),
(10.192)
wobei C die Amplitude der Schwingung und ϕ die so genannte Phasenverschiebung ist. Der
Zusammenhang dieser beiden Lösungen lässt sich mit Hilfe des Additionstheorems für die Sinusfunktion herstellen:
C sin(ω0 t + ϕ)
x =
=
=
C(sin ω0 t cos ϕ + sin ϕ cos ω0 t)
(C cos ϕ) sin ω0 t + (C sin ϕ) cos ω0 t.
(10.193)
Daraus folgt
A = C sin ϕ
und
B = C cos ϕ
(10.194)
oder umgekehrt
ϕ = arctan
A
B
und
C=
A2 + B 2 .
(10.195)
Gemäß Gleichung (10.191) oder Gleichung (10.192) führt der harmonische Oszillator eine periodische Schwingung mit Kreisfrequenz ω0 aus. Die freien Parameter A und B, beziehungsweise
C und ϕ, können durch die Anfangsbedingungen zum Zeitpunkt t = 0 bestimmt werden. Für
x(0) = x0 und dx(t = 0)/dt = v0 ergibt sich:
A cos 0 + B sin 0 =
−ω0 A sin 0 + ω0 B cos 0 =
A = x0 ,
(10.196)
ω0 B = v0 .
(10.197)
v0
.
ω0
(10.198)
Daraus folgt
A = x0
und
B=
Die Phase ϕ und die Amplitude C sind
ϕ = arctan
ω0 x0
v0
)
und
C=
x20 +
v0
ω0
2
.
(10.199)
Die Lösung für die Anfangsbedingungen x(0) = x0 und v(0) = v0 ist also
x = x0 cos ω0 t +
v0
sin ω0 t
ω0
(10.200)
264
10 Differentialgleichungen
Abbildung 10.13: Die Lösung der Differentialgleichung des eindimensionalen harmonischen Oszillators ist eine Sinusfunktion, deren Amplitude und Phase von den Anfangsbedingungen x0 und v0
abhängen. Die Steigung der Kurve zum Zeitpunkt t = 0 ist v0 .
oder, etwas anders geschrieben,
)
x=
x20
+
v0
ω0
#
2
sin ω0 t + arctan
ω0 x0
v0
$
.
(10.201)
Die trigonometrischen Funktionen sind periodisch mitPeriode 2π. Das bedeutet, dass der harmonische Oszillatoreine Periode von T = 2π/ω0 = 2π m/k und eine Frequenz von f = 1/T =
ω0 /2π = (1/2π) k/m hat. Man bezeichnet ω0 auch als die Kreisfrequenz.
10.3.3
Die gedämpfte Schwingung
Bis jetzt haben wir angenommen, dass der Oszillator reibungsfrei schwingen kann. Falls jedoch Reibungskräfte wirksam sind, müssen diese auch in der Differentialgleichung berücksichtigt werden.
Mit einer zur Geschwindigkeit proportionalen Reibungskraft F = −γdx/dt wird die Bewegungsgleichung zu
m
dx
d2 x
= −kx − γ .
dt2
dt
(10.202)
Hier hat die Reibungskraft ein negatives
Vorzeichen, da sie der Bewegung entgegengerichtet ist.
Wir dividieren durch m, setzen ω0 = k/m und 2β = γ/m und erhalten
dx
d2 x
+ ω02 x = 0.
+ 2β
dt2
dt
(10.203)
Der Ansatz x = Aeλt liefert die charakteristische Gleichung:
λ2 + 2βλ + ω02 = 0.
(10.204)
Diese quadratische Gleichung hat die Lösungen
λ1,2 = −β ±
β 2 − ω02 .
(10.205)
Abhängig von den Werten von β und ω0 sind die Eigenwerte entweder komplex oder rein reell.
Wir unterscheiden drei verschiedene Fälle:
10 Differentialgleichungen
ω0 < β
ω0 = β
ω0 > β
λ1,2
λ1 = λ2
λ1,2
265
reell:
reell:
komplex:
Kriechfall
aperiodischer Grenzfall
Schwingfall
Kriechfall:
Wenn ω0 < β, sind beide Eigenwerte reell aber negativ. Die allgemeine Lösung der Bewegungsgleichung ist also (siehe Abb. 10.14)
x(t) = Aeλ1 t + Beλ2 t
mit den Koeffizienten
λ1 = −β +
β 2 − ω02 ;
λ2 = −β −
(10.206)
β 2 − ω02 .
(10.207)
Da sowohl λ1 als auch λ2 negativ sind, nähert sich x exponentiell seiner Ruhelage. Die Dämpfung
durch Reibungsverluste ist in diesem Fall zu stark, um eine Schwingung zuzulassen. So ein Fall
würde sich z.B. für ein Pendel in einer viskosen Flüssigkeit ergeben.
Abbildung 10.14: Im Kriechfall nähert sich der Oszillator seiner Ruhelage exponentiell.
Wir wollen nun die Bewegung des Oszillators für den Fall betrachten, dass er anfänglich in Ruhe
ist (ẋ(0) = 0) und die Auslenkung x(0) = x0 hat. Aus x(0) = x0 ergibt sich
A + B = x0 .
(10.208)
Die zeitliche Ableitung der Auslenkung ist
ẋ(t) = λ1 Aeλ1 t + λ2 Beλ2 t
(10.209)
λ1 A + λ2 B = 0.
(10.210)
und somit folgt aus ẋ(0) = 0
Aus diesen beiden Bedingungen können wir A und B bestimmen:
A
B
x0 λ2
,
λ2 − λ1
λ1 x0
.
= −
λ2 − λ1
=
(10.211)
(10.212)
Wegen
λ2 − λ1 = −β −
β 2 − ω02 + β − β 2 − ω02 = −2 β 2 − ω02
(10.213)
erhalten wir schließlich
x(t) =
λ1 t
x0
λ2 t
e
−
λ
e
λ
.
2
1
−2 β 2 − ω02
(10.214)
266
10 Differentialgleichungen
Anders ausgedrückt haben wir:
x(t) =
x
0
−2 β 2 − ω02
#
−β −
$
√ 2 2
β 2 − ω02 e(−β+ β −ω0 )t
#
$
√ 2 2 − −β + β 2 − ω02 e(−β− β −ω0 )t . (10.215)
Aperiodischer Grenzfall:
Verringern wir den Reibungskoeffizienten so weit, dass ω0 = β, sind beide Eigenwerte gleich und
negativ: λ1 = λ2 = −β. Man nennt solche Eigenwerte entartet. Die Lösung der Differentialgleichung
wird in diesem Fall zu
x = Ae−βt .
(10.216)
Hier haben wir jedoch nur mehr einen freien Parameter statt zwei, wie wir es von der allgemeinen
Lösung einer Differentialgleichung zweiter Ordnung eigentlich verlangen müssen. Wir brauchen also
eine zweite vom Ansatz Aeλt verschiedene Lösung, um den zweiten Parameter unterzubringen. Wir
versuchen es mit dem Ansatz
x = Bte−βt
(10.217)
mit den Ableitungen
ẋ =
dx
= −Bβte−βt + Be−βt = Be−βt (1 − βt)
dt
(10.218)
und
ẍ
d2 x
= −βBe−βt (1 − βt) + Be−βt (−β)
dt2 *
+
= Be−βt −β + β 2 t − β
+
*
= Be−βt β 2 t − 2β .
=
Einsetzen dieses Ansatzes in die Differentialgleichung (10.203) ergibt:
*
+
Be−βt β 2 t − 2β + 2βBe−βt (1 − βt) + ω02 Bte−βt = 0
(10.219)
(10.220)
und somit
β2t − 2β
2β
+
− 2β 2 t + ω02 t
= −β 2 t + ω02 t
= (−β 2 + ω02 )t = 0.
(10.221)
Da nach Voraussetzung β = ω0 , verschwindet die linke Seite der obigen Gleichung und wir sehen,
dass der Ansatz x = Bte−βt die Differentialgleichung erfüllt. Die allgemeine Lösung ist in diesem
Fall also
x(t) = Ae−βt + Bte−βt .
(10.222)
Da die lineare Funktion t viel langsamer wächst als die Exponentialfunktion e−βt abfällt, kehrt
der Oszillator im aperiodischen Grenzfall auf monotone Weise von einer Auslenkung x in seine
Ruhelage x = 0 zurück.
Wenn der Oszillator bei t = 0 eine Auslenkung von x0 hat und seine Anfangsgeschwindigkeit
verschwindet, haben wir für die freien Parameter A und B:
A = x0
und
B = βx0
(10.223)
10 Differentialgleichungen
267
und erhalten als spezielle Lösung
x(t) = x0 e−βt + βx0 te−βt = x0 e−βt (1 + βt).
(10.224)
Da für β = ω0 also keine Schwingung auftritt und für ein etwas kleineres β der Oszillator erstmals
seine Ruhelage mit endlicher Geschwindigkeit durchqueren und nicht nur asymptotisch erreichen
kann, spricht man vom aperiodischen Grenzfall: Wenn wir β um einen nur kleinen Betrag verringern, kann das System erstmals schwingen. Beim aperiodischen Grenzfall kehrt der Oszillator am
schnellsten in seine Ruhelage zurück.
Schwingfall:
Falls ω0 > β, ist das Argument der Wurzel in Gleichung (10.205) negativ und die beiden Eigenwerte
λ1 und λ2 sind komplex. Mit −ω 2 ≡ β 2 − ω02 (damit klar ist, dass β 2 − ω02 eine negative Zahl ist),
sind die Eigenwerte gegeben durch
λ1 = −β + iω
und
λ1 = −β − iω.
(10.225)
Sie sind also komplex konjugiert zueinander.
Wie wir bereits wissen (siehe Gleichung (10.166)) können wir in diesem Fall aus den Lösungen x1 =
e−(β+iω)t und x2 = e−(β−iω)t durch eine passende Linearkombination reelle Lösungen konstruieren
−(β+iω)t
e
e−(β−iω)t
+
x1 =
(10.226)
= e−βt cos ωt,
2
2
−(β+iω)t
e
e−(β−iω)t
−
x2 = −
(10.227)
= e−βt sin ωt.
2i
2i
Die allgemeine Lösung ist also
x(t) = Ae−βt cos ωt + Be−βt sin ωt = e−βt (A cos ωt + B sin ωt)
(10.228)
x(t) = Ce−βt sin(ωt + ϕ).
(10.229)
oder
Das ist eine Schwingung, deren Amplitude durch die Dämpfung exponentiell mit der Zeit abnimmt.
Die Kreisfrequenz
ω = ω02 − β 2
(10.230)
ist für den gedämpften Oszillator geringer als für den ungedämpften.
Um die freien Parameter A und B (bzw. C und ϕ) für die speziellen Anfangsbedingungen x(0) = x0
und ẋ(0) = 0 zu bestimmen, benötigen wir die erste Ableitung:
dx
dt
=
(−β)e−βt (A cos ωt + B sin ωt) + ωe−βt (−A sin ωt + B cos ωt)
=
e−βt [(ωB − βA) cos ωt − (ωA + βB) sin ωt] .
(10.231)
Somit folgt aus den Anfangsbedingungen
A = x0
(10.232)
βx0
βA
=
.
ω
ω
(10.233)
und
B=
268
10 Differentialgleichungen
Die Lösung der Differentialgleichung ist dann
β
x(t) = x0 e−βt cos ωt + sin ωt
ω
(10.234)
oder anders ausgedrückt
β
sin( ω02 − β 2 t) .
cos( ω02 − β 2 t) + 2
ω0 − β 2
x(t) = x0 e−βt
(10.235)
Für β → ω0 oder ω → 0 erhalten wir x(t) = x0 e−βt (1 + βt). Das ist genau der aperiodische
Grenzfall aus Gleichung (10.224).
Abbildung 10.15: Schwingfall (ω0 > β), Kriechfall (ω0 < β) und aperiodischer Grenzfall (ω0 = β)
eines gedämpften harmonischen Oszillators (hier haben wir ω0 = 1 gesetzt).
10.3.4
Die inhomogene lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten: die erzwungene Schwingung
Wir betrachten nun einen harmonischen Oszillator, der zusätzlich durch eine äußere, zeitabhängige
Kraft angeregt wird. Beispiele wären etwa ein Pendel, dessen Aufhängepunkt periodisch hin und
her bewegt wird oder ein elektrischer Schwingkreis, der an eine Wechselspannung angeschlossen
wird. Diese zusätzliche äußere Kraft muss natürlich in der Bewegungsgleichung des Oszillators
berücksichtigt werden. Für eine harmonische periodische Kraft F/m = A cos Ωt mit Kreisfrequenz
Ω und Amplitude A wird die Bewegungsgleichung zu
dx
d2 x
+ ω02 x = A cos Ωt.
+ 2β
dt2
dt
(10.236)
Der Störterm A cos Ωt macht die ursprüngliche homogene Gleichung zu einer inhomogenen
Gleichung mit konstanten Koeffizienten.
Auch für eine solche Differentialgleichung gilt, dass die allgemeine Lösung der inhomogenen Gleichung als Summe der allgemeinen Lösung der homogenen Gleichung und einer Partikulärlösung
der inhomogenen Gleichung geschrieben werden kann:
x(t) = xh (t) + xp (t).
(10.237)
10 Differentialgleichungen
269
Dass diese Funktion eine Lösung der inhomogenen Differentialgleichung ist, kann durch Einsetzen
leicht überprüft werden. Die allgemeine Lösung xh (t) der homogenen Gleichung kennen wir bereits;
wir müssen also jetzt noch nach einer Partikulärlösung xp (t) der inhomogenen Gleichung suchen.
Wir könnten das durch Variation der Konstanten versuchen; es ist jedoch einfacher, einen Lösungsansatz zu machen. Mit einer Winkelfunktion als Störfunktion kann auch die Lösung nur eine Winkelfunktion sein, da durch Differenzieren nur aus Winkelfunktionen wieder solche entstehen können.
Wir machen also einen Ansatz, der der Störung ähnlich ist
x = K cos(Ωt − ϕ).
(10.238)
ẋ = −KΩ sin(Ωt − ϕ)
(10.239)
ẍ = −KΩ2 cos(Ωt − ϕ).
(10.240)
Die zugehörigen Ableitungen sind:
und
Einsetzen in die Differentialgleichung ergibt:
− KΩ2 cos(Ωt − ϕ) − 2βKΩ sin(Ωt − ϕ) + ω02 K cos(Ωt − ϕ) = A cos Ωt.
(10.241)
Um die linke und die rechte Seite der Gleichung auf eine ähnliche Form zu bringen, formen wir die
rechte Seite der Gleichung durch Verwendung des Additionstheorems für den Kosinus folgendermaßen um:
A cos Ωt = A cos(Ωt − ϕ + ϕ) = A cos(Ωt − ϕ) cos ϕ − A sin(Ωt − ϕ) sin ϕ.
(10.242)
Einsetzen ergibt
(−KΩ2 + Kω02 ) cos(Ωt − ϕ) − 2βKΩ sin(Ωt − ϕ)
= A cos(Ωt − ϕ) cos ϕ − A sin(Ωt − ϕ) sin ϕ. (10.243)
Diese Gleichung können wir für alle Zeiten t erfüllen, indem wir die Koeffizienten vor dem Kosinus
cos(Ωt − ϕ) bzw. vor dem Sinus sin(Ωt − ϕ) auf beiden Seiten gleichsetzen:
− KΩ2 + Kω02 = A cos ϕ,
(10.244)
2βKΩ = A sin ϕ.
(10.245)
Durch Addition der Quadrate beider Gleichungen finden wir
(−KΩ2 + Kω02 )2 + 4β 2 K 2 Ω2 = A2 cos2 ϕ + A2 sin2 ϕ = A2
(10.246)
oder
K2 =
A2
(ω02
−
Ω2 )2
+ 4β 2 Ω2
.
(10.247)
Division der beiden Gleichungen (10.244) und (10.245) hingegen ergibt
tan ϕ =
2βΩ
2βKΩ
= 2
2
2
K(ω0 − Ω )
(ω0 − Ω2 )
oder
ϕ = arctan
2βΩ
ω02 − Ω2
(10.248)
.
(10.249)
Dadurch erhalten wir als Partikulärlösung der inhomogenen Gleichung mit Störterm A cos(Ωt − ϕ)
A
cos(Ωt − ϕ).
xp (t) = 2
(ω0 − Ω2 )2 + 4β 2 Ω2
(10.250)
270
10 Differentialgleichungen
Dies ist eine Schwingung mit der gleichen Frequenz wie die Störung, deren Amplitude und Phasenverschiebung von der Eigenfrequenz ω0 des Oszillators, der Erregerfrequenz Ω und dem Reibungskoeffizienten β abhängen.
Die allgemeine Lösung der Differentialgleichung ist die Summe der allgemeinen Lösung der homogenen Gleichung und der gerade gefundenen Partikulärlösung. Da jedoch für einen nichtverschwindenden Reibungskoeffizienten die Lösung der homogenen Gleichung in allen Fällen durch
die Dämpfung schnell gegen Null konvergiert, bleibt für lange Zeiten nur die Partikulärlösung übrig.
Nach Beendigung transienter Einschwingvorgänge mit Frequenz ω = ω02 − β 2 oszilliert das
getriebene System infolgedessen mit der Erregerfrequenz Ω.
Wir schauen uns nun die Partikulärlösung der inhomogenen Gleichung etwas genauer an. Die
Amplitude AF der erzwungenen Schwingung ist (siehe Abb. 10.16)
A
AF (Ω) = 2
.
(ω0 − Ω2 )2 + 4β 2 Ω2
(10.251)
Für Erregerfrequenzen Ω, die viel kleiner sind als die Eigenfrequenz ω0 des Oszillators (Ω ω0 ),
ist wegen des Terms (ω02 −Ω2 )2 das Argument der Wurzel im Nenner groß und daher die Amplitude
klein. Die Amplitude ist in diesem Fall AF = A/ω02 (von der Reibung unabhängig). Wenn sich Ω
nun der Eigenfrequenz ω0 nähert, wird der Term (ω02 − Ω2 )2 immer kleiner. Das Argument der
Wurzel erreicht dann ein Minimum und wächst danach wieder an. An der Stelle des Minimums des
Wurzelarguments im Nenner wird die Amplitude maximal. Um diese Stelle zu finden, setzen wir
die Ableitung des Wurzelarguments gleich Null:
+
∂ * 2
(ω0 − Ω2 )2 + 4β 2 Ω2 = 0.
(10.252)
∂Ω
Das heißt,
2(ω02 − Ω2 )(−2Ω) + 4β 2 2Ω = 0,
(10.253)
Ω(−ω02 + Ω2 ) + 2β 2 Ω = 0.
(10.254)
woraus folgt
Diese Gleichung hat die Lösung Ω = 0 sowie die Lösungen
Ω1,2 = ± ω02 − 2β 2 .
(10.255)
Da Ω eine Frequenz ist, sind wir nur an einer positiven Lösung interessiert:
ΩR = ω02 − 2β 2 .
(10.256)
Für ω02 > 2β 2 ist diese Frequenz ΩR reell. Bei solchen Frequenzen besitzt die Amplitude der
erzwungenen Schwingung als Funktion der Erregerfrequenz Ω irgendwo ein Maximum. Ist hingegen
ω02 < 2β 2 , hat die Amplitude der erzwungenen Schwingung als Funktion von Ω kein Maximum und
die Amplitude nimmt mit wachsendem Ω monoton ab.
Dieses Anwachsen der Amplitude in der Nähe der Eigenfrequenz ω0 nennt man Resonanz und die
zugehörige Frequenz ΩR Resonanzfrequenz. Wie man aus Gleichung (10.256) sieht, ist die Resonanzfrequenz
ΩR verschieden von der Eigenfrequenz ω0 des Oszillators und auch verschieden von
ω02 − β 2 , der Frequenz der ungestörten aber gedämpften Schwingung. Nur für den reibungsfreien
Fall stimmt die Resonanzfrequenz mit der Eigenfrequenz überein.
Die Amplitude bei der Resonanzfrequenz ΩR ist:
AF (ΩR ) =
=
=
A
2
2
2
(ω0 − (ω0 − 2β ))2 + 4β 2 (ω02 − 2β 2 )
A
2
2
(2β ) + 4β 2 (ω02 − 2β 2 )
A
A
.
=
4β 2 (ω02 − β 2 )
2β ω02 − β 2
(10.257)
10 Differentialgleichungen
271
Abbildung 10.16: Amplitude AF der erzwungenen Schwingung als Funktion der Erregerfrequenz
Ω für verschiedene Reibungskoeffizienten β. Je kleiner der Reibungskoeffizient β ist, umso größer
ist die Resonanzamplitude. Der Locus der Maxima der Amplitude AF ist als unterbrochene Linie
dargestellt.
Die Resonanzamplitude
wächst also mit abnehmender Reibung und divergiert im reibungsfreien
Fall. (Der Faktor ω02 − β 2 im Nenner kann nicht verschwinden, da die Funktion AF (Ω) nur für
ω02 > 2β 2 ein Maximum bei einer von Null verschiedenen Frequenz Ω besitzt.) Die Amplitude der
erzwungenen Schwingung als Funktion der Erregerfrequenz ist für verschiedene Reibungskoeffizienten β in Abb. 10.16 dargestellt.
Die erzwungene Schwingung hat zwar dieselbe Frequenz wie die Erregerschwingung, ist jedoch mit
dieser nicht in Phase. Die Phasenverschiebung gegenüber der Erregerschwingung ist:
2βΩ
ϕ = arctan
.
(10.258)
ω02 − Ω2
Diese Phasenverschiebung ist in Abb. 10.17 für verschiedene Werte von β als Funktion der
Erregerfrequenz dargestellt. Für kleine Ω ist ϕ sehr klein (ϕ → 0 für Ω = 0). Wenn sich Ω
der Eigenfrequenz ω0 nähert, divergiert (2βΩ)/(ω02 − Ω2 ) und die Phasenverschiebung strebt zu
ϕ = π/2. Wenn Ω weiter wächst, wächst auch ϕ weiter und erreicht für Ω → ∞ den Wert ϕ = π.
Abbildung 10.17: Phasenverschiebung ϕ der erzwungenen Schwingung als Funktion der Erregerfrequenz Ω für verschiedene Reibungskoeffizienten β.
Herunterladen