Skriptum - Fakultät für Physik

Skriptum zur Vorlesung
Einführung in die Physikalischen
Rechenmethoden I + II
Univ. Prof. Dr. Christoph Dellago
Universität Wien
Fakultät für Physik
Institut für Experimentalphysik
Boltzmanngasse 5, 1090 Wien
[email protected]
http://comp-phys.univie.ac.at
Literatur
Lehrbücher
- George Arfken, Mathematical Methods for Physicists, Academic Press, San Diego (1985).
- Siegfried Großmann, Mathematischer Einführungskurs für die Physik, Teubner, Stuttgart
(1974).
- Sadri Hassani, Mathematical Methods for Students of Physics and Related Fields, SpringerVerlag, New York (2000).
- Helmuth Horvath, Rechenmethoden und ihre Anwendungen in Physik und Chemie, Bibliographisches Institut, Mannheim, Wien, Zürich (1977).
- May-Britt Kallenrode, Rechenmethoden der Physik, Springer-Verlag, Berlin (2003).
- Klaus Weltner, Mathematik für Physiker I und II, Springer-Verlag, Berlin (2001).
- Helmut Fischer und Helmut Kaul, Mathematik für Physiker, Teubner, Stuttgart (1988).
- Gerhard Berendt und Evelyn Weimar, Mathematik für Physiker, Physik-Verlag, Weinheim
(1979).
Formelsammlungen
- Johann Rast (Heinrich Netz), Formeln der Mathematik, Carl Hanser Verlag, München, Wien
(1983).
- Hans-Jochen Bartsch, Taschenbuch Mathematischer Formeln, Fachbuchverlag Leipzig (2004).
- Ilja N. Bronstein, Konstantin A. Semendjajew, Gerhard Musiol, Taschenbuch der Mathematik, Verlag Harri Deutsch, Frankfurt am Main (2000).
Web-Ressourcen
- http://mathworld.wolfram.com
- http://www.mathe-online.at
3
4
Inhaltsverzeichnis
I
Einführung in die Physikalischen Rechenmethoden I
1 Funktionen
1.1 Der Funktionsbegriﬀ . . . . . . . . . . .
1.2 Darstellung von Funktionen . . . . . . .
1.2.1 Analytische Darstellung . . . . .
1.2.2 Funktionstafel (Wertetabelle) . .
1.2.3 Graphische Darstellung . . . . .
1.3 Eigenschaften von Funktionen . . . . . .
1.3.1 Deﬁnitionsbereich . . . . . . . .
1.3.2 Nullstellen . . . . . . . . . . . . .
1.3.3 Gerade und ungerade Funktionen
1.3.4 Monotonie . . . . . . . . . . . . .
1.3.5 Grenzwert . . . . . . . . . . . . .
1.3.6 Stetigkeit . . . . . . . . . . . . .
1.3.7 Singularitäten . . . . . . . . . . .
1.4 Neue Funktionen aus alten . . . . . . . .
1.4.1 Verkettung von Funktionen . . .
1.4.2 Umkehrfunktion . . . . . . . . .
1.5 Wichtige Funktionen . . . . . . . . . . .
1.5.1 Lineare Funktionen . . . . . . . .
1.5.2 Potenzfunktionen . . . . . . . . .
1.5.3 Exponentialfunktion . . . . . . .
1.5.4 Logarithmus . . . . . . . . . . .
1.5.5 Winkelfunktionen . . . . . . . . .
1.5.6 Arcusfunktionen . . . . . . . . .
1.5.7 Hyperbolische Funktionen . . . .
1.5.8 Areafunktionen . . . . . . . . . .
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
12
12
13
13
14
14
14
14
15
15
16
17
18
18
19
21
21
22
24
26
27
30
32
33
2 Vektoren
2.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . .
2.2 Koordinatensysteme . . . . . . . . . . . . . . . . . .
2.2.1 Kartesische Koordinaten . . . . . . . . . . . .
2.2.2 Polarkoordinaten . . . . . . . . . . . . . . . .
2.2.3 Zylinderkoordinaten . . . . . . . . . . . . . .
2.2.4 Kugelkoordinaten . . . . . . . . . . . . . . . .
2.3 Vektoralgebra . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Gleiche, inverse und parallele Vektoren . . . .
2.3.2 Vektoraddition und -subtraktion . . . . . . .
2.3.3 Multiplikation eines Vektors mit einem Skalar
2.4 Skalarprodukt . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Deﬁnition . . . . . . . . . . . . . . . . . . . .
2.4.2 Rechenregeln . . . . . . . . . . . . . . . . . .
2.4.3 Komponentenweise Darstellung . . . . . . . .
2.4.4 Anwendungen . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
37
37
38
42
43
44
44
45
47
48
48
48
50
50
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
INHALTSVERZEICHNIS
2.5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
53
54
58
59
59
59
60
60
61
61
61
62
64
3 Diﬀerentiation
3.1 Grundbegriﬀe . . . . . . . . . . . . . . . . . . . .
3.2 Diﬀerenzierbarkeit . . . . . . . . . . . . . . . . .
3.3 Wichtige Ableitungen . . . . . . . . . . . . . . .
3.4 Diﬀerentiationsregeln . . . . . . . . . . . . . . . .
3.4.1 Faktorregel . . . . . . . . . . . . . . . . .
3.4.2 Summenregel . . . . . . . . . . . . . . . .
3.4.3 Produktregel . . . . . . . . . . . . . . . .
3.4.4 Quotientenregel . . . . . . . . . . . . . . .
3.4.5 Kettenregel . . . . . . . . . . . . . . . . .
3.4.6 Umkehrregel . . . . . . . . . . . . . . . .
3.5 Höhere Ableitungen . . . . . . . . . . . . . . . .
3.6 Maxima und Minima von Funktionen . . . . . . .
3.7 Diﬀerentiation von Funktionen in Parameterform
3.8 Diﬀerentiation von Vektoren . . . . . . . . . . . .
3.9 Partielle Diﬀerentiation . . . . . . . . . . . . . .
3.9.1 Funktionen mehrerer Variabler . . . . . .
3.9.2 Partielle Ableitung . . . . . . . . . . . . .
3.9.3 Anstieg einer impliziten Funktion . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
67
67
70
71
71
71
71
71
72
72
72
73
73
74
76
78
78
79
81
. . . . .
. . . . .
. . . . .
Integral
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
83
83
85
85
89
93
94
94
95
95
97
98
101
106
108
108
110
114
116
116
118
2.6
2.7
2.8
Vektorprodukt . . . . . . . . . . . . .
2.5.1 Deﬁnition . . . . . . . . . . . .
2.5.2 Rechenregeln . . . . . . . . . .
2.5.3 Komponentenweise Darstellung
2.5.4 Anwendungen . . . . . . . . . .
Spatprodukt . . . . . . . . . . . . . . .
2.6.1 Deﬁnition . . . . . . . . . . . .
2.6.2 Komponentenweise Darstellung
2.6.3 Rechenregeln und Anwendung
Mehrfachprodukte . . . . . . . . . . .
Anwendungsbeispiele für Vektoren . .
2.8.1 Strömung durch eine Fläche . .
2.8.2 Rotation eines Körpers . . . .
2.8.3 Volumen einer Einheitszelle . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Integration
4.1 Das unbestimmte Integral . . . . . . . . . . . . . . . . . .
4.2 Wichtige unbestimmte Integrale . . . . . . . . . . . . . . .
4.3 Das bestimmte Integral . . . . . . . . . . . . . . . . . . .
4.4 Zusammenhang zwischen bestimmtem und unbestimmtem
4.5 Rechenregeln für das bestimmte Integral . . . . . . . . . .
4.6 Grundregeln des Integrierens . . . . . . . . . . . . . . . .
4.6.1 Faktorregel . . . . . . . . . . . . . . . . . . . . . .
4.6.2 Summenregel . . . . . . . . . . . . . . . . . . . . .
4.6.3 Substitutionsmethode . . . . . . . . . . . . . . . .
4.6.4 Partielle Integration . . . . . . . . . . . . . . . . .
4.7 Rotationskörper . . . . . . . . . . . . . . . . . . . . . . . .
4.8 Berechnung von Bogenlängen . . . . . . . . . . . . . . . .
4.9 Mittelwerte von Funktionen . . . . . . . . . . . . . . . . .
4.10 Doppelintegrale . . . . . . . . . . . . . . . . . . . . . . . .
4.10.1 Deﬁnition . . . . . . . . . . . . . . . . . . . . . . .
4.10.2 Berechnung von Doppelintegralen . . . . . . . . . .
4.10.3 Doppelintegrale in Polarkoordinaten . . . . . . . .
4.11 Dreifachintegrale . . . . . . . . . . . . . . . . . . . . . . .
4.11.1 Deﬁnition . . . . . . . . . . . . . . . . . . . . . . .
4.11.2 Berechnung von Dreifachintegralen . . . . . . . . .
INHALTSVERZEICHNIS
7
4.11.3 Dreifachintegrale in Zylinder- und Kugelkoordinaten . . . . . . . . . . . . . 120
4.12 Integration von vektorwertigen Funktionen . . . . . . . . . . . . . . . . . . . . . . 121
II
Einführung in die Physikalischen Rechenmethoden II
5 Die
5.1
5.2
5.3
5.4
5.5
Taylorreihe
Folgen und Reihen . . . . . . . . . . . . . . . .
Entwicklung einer Funktion in eine Taylorreihe
Allgemeine Taylorentwicklung . . . . . . . . . .
Abgebrochene Taylorreihenentwicklung . . . . .
Fehlerabschätzung . . . . . . . . . . . . . . . .
123
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
125
125
127
130
130
133
6 Komplexe Zahlen
6.1 Deﬁnition und Darstellung . . . . . . . . . . . . . . . . . . . . . . .
6.2 Rechenregeln für komplexe Zahlen . . . . . . . . . . . . . . . . . .
6.2.1 Addition und Subtraktion . . . . . . . . . . . . . . . . . . .
6.2.2 Multiplikation einer komplexen Zahl mit einer reellen Zahl
6.2.3 Komplex konjugierte Zahl . . . . . . . . . . . . . . . . . . .
6.2.4 Multiplikation . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.5 Division . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Die Exponentialform von komplexen Zahlen . . . . . . . . . . . . .
6.3.1 Eulersche Formel . . . . . . . . . . . . . . . . . . . . . . . .
6.3.2 Polardarstellung von komplexen Zahlen . . . . . . . . . . .
6.3.3 Umkehrung der Eulerschen Formel . . . . . . . . . . . . . .
6.3.4 Additionstheoreme für Winkelfunktionen . . . . . . . . . .
6.3.5 Komplexe Zahlen als Exponenten . . . . . . . . . . . . . . .
6.4 Potenzieren und komplexe Wurzeln . . . . . . . . . . . . . . . . . .
6.5 Darstellung von Kurven mit komplexen Zahlen . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
137
137
139
139
140
141
142
143
144
144
146
147
147
148
148
151
7 Fehlerrechnung
7.1 Systematische und statistische Fehler . . . . . . . .
7.2 Mittelwert und Varianz . . . . . . . . . . . . . . .
7.3 Verteilungen und Histogramme . . . . . . . . . . .
7.3.1 Grundlagen . . . . . . . . . . . . . . . . . .
7.3.2 Erwartungswert, Momente einer Verteilung
7.3.3 x und s2 als Schätzer für µ und σ 2 . . . . .
7.3.4 Fehler des Mittelwerts . . . . . . . . . . . .
7.3.5 Die Gaußsche Normalverteilung . . . . . . .
7.3.6 Verteilung diskreter Größen . . . . . . . . .
7.3.7 Poissonverteilung . . . . . . . . . . . . . . .
7.4 Fehlerfortpﬂanzung . . . . . . . . . . . . . . . . . .
7.4.1 Fortpﬂanzung von Maximalfehlern . . . . .
7.4.2 Fortpﬂanzung statistischer Kennwerte . . .
7.5 Ausgleichsrechnung (Fitten) . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
153
153
155
157
157
161
163
164
165
167
168
170
171
172
175
8 Diﬀerentiation von Feldern:
8.1 Felder . . . . . . . . . . .
8.1.1 Skalarfelder . . . .
8.1.2 Vektorfelder . . . .
8.2 Gradient . . . . . . . . . .
8.2.1 Deﬁnition . . . . .
8.2.2 Eigenschaften . . .
8.2.3 Richtungsableitung
8.2.4 Rechenregeln . . .
8.3 Divergenz . . . . . . . . .
8.3.1 Deﬁnition . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
179
179
179
180
183
183
183
185
185
186
186
grad,
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
div und rot
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
INHALTSVERZEICHNIS
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
186
189
190
191
191
191
194
195
196
9 Integration von Feldern: Kurven- und Flächenintegrale
9.1 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Deﬁnition . . . . . . . . . . . . . . . . . . . . . . . .
9.1.2 Eigenschaften . . . . . . . . . . . . . . . . . . . . . .
9.1.3 Berechnungsverfahren . . . . . . . . . . . . . . . . .
9.1.4 Kurvenintegrale über Gradientenfelder . . . . . . . .
9.2 Oberﬂächenintegrale . . . . . . . . . . . . . . . . . . . . . .
9.2.1 Deﬁnition . . . . . . . . . . . . . . . . . . . . . . . .
9.2.2 Darstellung der Fläche und des Flächenelements . .
9.2.3 Das Flächenelement . . . . . . . . . . . . . . . . . .
9.2.4 Berechnung des Oberﬂächenintegrals . . . . . . . . .
9.3 Der Integralsatz von Gauß . . . . . . . . . . . . . . . . . . .
9.3.1 Integraldarstellung der Divergenz . . . . . . . . . . .
9.3.2 Formulierung und Herleitung . . . . . . . . . . . . .
9.3.3 Partielle Integration mit Hilfe des Gaußschen Satzes
9.3.4 Die Sätze von Green . . . . . . . . . . . . . . . . . .
9.4 Der Integralsatz von Stokes . . . . . . . . . . . . . . . . . .
9.4.1 Integraldarstellung der Rotation . . . . . . . . . . .
9.4.2 Formulierung und Herleitung . . . . . . . . . . . . .
9.4.3 Bedeutung . . . . . . . . . . . . . . . . . . . . . . .
9.4.4 Das Vektorpotential . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
199
200
200
201
202
206
210
210
212
214
216
218
218
219
224
226
229
229
231
234
236
10 Diﬀerentialgleichungen
10.1 Grundbegriﬀe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Diﬀerentialgleichungen erster Ordnung . . . . . . . . . . . . . . . . . . . . . . .
10.2.1 Diﬀerentialgleichungen mit separierbaren Variablen . . . . . . . . . . . .
10.2.2 Homogene lineare Diﬀerentialgleichung . . . . . . . . . . . . . . . . . . .
10.2.3 Inhomogene lineare Diﬀerentialgleichung . . . . . . . . . . . . . . . . . .
10.3 Diﬀerentialgleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Homogene Diﬀerentialgleichung mit konstanten Koeﬃzienten . . . . . .
10.3.2 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.3 Die gedämpfte Schwingung . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.4 Die inhomogene lineare Diﬀgl. 2. Ordnung mit konstanten Koeﬃzienten
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
239
239
241
242
247
249
258
258
261
264
268
8.4
8.5
8.6
8.3.2 Anschauliche Interpretation als lokale Quellstärke .
8.3.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . .
Laplace-Operator . . . . . . . . . . . . . . . . . . . . . . .
Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.1 Deﬁnition . . . . . . . . . . . . . . . . . . . . . . .
8.5.2 Anschauliche Interpretation als lokale Wirbelstärke
8.5.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . .
8.5.4 Wirbelfreie und quellenfreie Felder . . . . . . . . .
Zusammenfassung Nabla-Operator ∇ . . . . . . . . . . . .
Teil I
Einführung in die Physikalischen
Rechenmethoden I
9
Kapitel 1
Funktionen
1.1
Der Funktionsbegriﬀ
In der Physik (und in den Naturwissenschaften im Allgemeinen) arbeiten wir mit Größen, die entweder konstant sind (d.h. sie nehmen wie die Lichtgeschwindigkeit oder die Erdbeschleunigung nur
bestimmte, ﬁxe Werte an) oder eine ganze Fülle von Werten annehmen können. Wir unterscheiden deshalb zwischen Konstanten und Variablen (z.B. verstrichene Zeit, Länge eines Objekts,
Position eines Objekts, Temperatur eines gewissen Materials, Druck eines Gases, etc.).
Um physikalische Zusammenhänge zu verstehen, betrachten wir oft eine Variable in Abhängigkeit
einer anderen Variablen. So könnten wir zum Beispiel daran interessiert sein, wie sich der Druck
p eines in einem bestimmten Volumen V eingeschlossenen Gases verhält, wenn dessen Temperatur
T verändert wird. Für jede Temperatur T herrscht im Gas ein bestimmter Druck p. In anderen
Worten: der Druck p ändert sich mit der Temperatur T . Zur Beschreibung solcher Zusammenhänge
zwischen Variablen benutzen wir Funktionen.
Definition: Eine Funktion f (x) ordnet jedem Element x des Deﬁnitionsbereichs D eindeutig ein
Element y des Wertebereichs W zu: y = f (x) (siehe Abb. 1.1).
Abbildung 1.1: Die Funktion f (x) mit Deﬁnitionsbereich D und Wertebereich W .
Wir sagen dann, dass wir y als Funktion von x betrachten. In unserem Beispiel mit dem Gas
betrachten wir etwa den Druck p als Funktion der Temperatur T und schreiben p(T ). Wichtig
ist hier, dass die Zuordnung eindeutig ist. Das heißt, dass jedem Wert x genau ein Wert y
zugeordnet wird (sonst ist f (x) keine Funktion) (siehe Abb. 1.2). Es ist also nicht erlaubt, einem
Element des Deﬁnitionsbereichs zwei oder mehr Elemente des Wertebereichs zuzuordnen. Hingegen
darf sehr wohl ein Element des Wertebereichs mehreren Werten des Deﬁnitionsbereichs angehören.
Auch muss nicht jedes Element
des Wertebereichs vom Deﬁnitionsbereich aus erreicht werden. Die
√
Wurzelfunktion f (x) = ± x ist daher beispielsweise keine echte Funktion, da sowohl der negative
als auch der positive Wert der Wurzel zulässig sind. Betrachtet man hingegen nur den positiven
oder den negativen Zweig der “Wurzelfunktion”, sind alle geforderten Eigenschaften erfüllt.
Die Funktion f (x) ist also eine Zuordnungsvorschrift. Dabei wird x als unabhängige Variable
11
12
1 Funktionen
Abbildung 1.2: Nur eine eindeutige Zuordnung ist eine Funktion.
oder Argument (auch Stelle) bezeichnet und y als abhängige Variable oder Funktionswert.
Man kann die Zuordnung auch schreiben als
f
x−
→y
f : x → y.
oder
(1.1)
Dies bedeutet, dass die Funktion f dem Wert x einen Wert y zuordnet. Diese Notation werden
Sie jedoch kaum in Physikbüchern ﬁnden. Oft wird in der Physik auch der Deﬁnitionsbereich
nicht explizit erwähnt. Dieser ergibt sich meistens aus dem Zusammenhang. Funktionen werden
auch Abbildungen genannt und man sagt “x wird auf y abgebildet”. Die Notation f (x) für eine
Funktion ist eigentlich ungenau, denn genau genommen bezeichnet f (x) den Funktionswert an der
Stelle x und nicht die Zuordnungsvorschrift. Diese Schreibweise ist jedoch sehr praktisch und wird
daher in der Physik gerne benutzt.
1.2
Darstellung von Funktionen
Funktionen lassen sich auf verschiedene Weisen darstellen, wie wir im Folgenden besprechen werden.
1.2.1
Analytische Darstellung
In der analytischen Darstellung wird die Zuordnungsvorschrift als Gleichung (Funktionsgleichung) in einer von drei Formen angegeben:
• Explizite Darstellung: y = f (x)
Die Funktion ist nach einer Variablen aufgelöst und der Wert y kann für ein bestimmtes
Argument x sofort berechnet werden, zum Beispiel y = x2 . In diesem Fall haben wir eine
Rechenvorschrift, mit der wir f (x) direkt aus x ermitteln können.
• Implizite Darstellung: F (x, y) = 0
Die Funktion ist nicht nach einer der beiden Variablen aufgelöst. Ein Beispiel ist die Gleichung
eines Kreises mit Radius 1 um den Ursprung: x2 + y 2 − 1 = 0. In vielen Fällen ist es möglich,
2
2
die implizite
Darstellung in
√
√ eine explizite zu verwandeln, zum Beispiel (x + y − 1 = 0) →
y1 = 1 − x2 und y2 = − 1 − x2 . Diese Verwandlung von impliziter zu expliziter Form ist
jedoch nicht immer möglich.
• Parameterdarstellung:
Bei dieser Form der Darstellung werden beide Variablen (sowohl das Argument als auch der
Funktionswert) als Funktion einer Hilfsvariablen t ausgedrückt:
x =
x(t),
(1.2)
y
y(t).
(1.3)
=
1 Funktionen
13
Abbildung 1.3: Wurfparabel für horizontale Anfangsgeschwindigkeit.
Die Hilfsvariable, hier t, wird auch als Parameter bezeichnet.
Betrachten wir zum Beispiel die Bahnkurve eines im Erdschwerefeld in horizontaler Richtung
geworfenen Objekts (siehe Abb. 1.3). Dabei können wir versuchen, die vertikale Lage y als
Funktion der horizontalen Entfernung x anzugeben, also y = f (x). In diesem Fall ist es
jedoch einfacher, zunächst sowohl x als auch y als Funktion der Zeit t auszudrücken. Unter
Vernachlässigung der Reibung gilt:
x =
y
=
v0 t,
g
− t2 .
2
(1.4)
(1.5)
Die Gleichungen (1.4) und (1.5) sind die Parameterdarstellung der in Abb. 1.3 abgebildeten
Wurfparabel. Dabei ist v0 die Anfangsgeschwindigkeit in x-Richtung und g die Erdbeschleunigung. Der Anfangspunkt liegt im Ursprung: x(0) = 0 und y(0) = 0. Durch die obige
Vorschrift erhalten wir für jedes t ein Paar (x(t), y(t)).
Durch Auﬂösen der ersten Gleichung nach t und Einsetzen in die zweite Gleichung erhalten
wir die explizite Form der Wurfparabel:
2
g
g x
= − 2 x2 .
(1.6)
y=−
2 v0
2v0
1.2.2
Funktionstafel (Wertetabelle)
Hier werden Paare von unabhängigen und abhängigen Variablen in tabellarischer Form dargestellt,
zum Beispiel:
x
0
1
2
3
4
5
...
y
0
-1
-4
-9
-16
-25
...
(Diese Daten ergeben sich für das obige Beispiel im Falle g/2v02 = 1.) Die tabellarische Darstellung wird häuﬁg für empirisch bestimmte Messdaten verwendet oder wenn es auf den genauen
Zahlenwert ankommt.
1.2.3
Graphische Darstellung
Funktionen lassen sich in der graphischen Darstellungsart besonders gut veranschaulichen. Dabei
werden die Wertepaare der Funktion in einem rechtwinkligen (kartesischen) Koordinatensystem
als Funktionsgraph dargestellt (siehe Abb. 1.4). Üblicherweise wird auf der horizontalen Achse
der x-Wert und auf der vertikalen Achse der y-Wert aufgetragen. Die x-Achse wird auch Abszisse
und die y-Achse Ordinate genannt.
14
1 Funktionen
Abbildung 1.4: Graph einer Funktion in einem kartesischen Koordinatensystem.
1.3
Eigenschaften von Funktionen
In diesem Abschnitt fassen wir einige wichtige Eigenschaften von Funktionen zusammen.
1.3.1
Deﬁnitionsbereich
Der Deﬁnitionsbereich besteht aus der Menge aller Argumente, für welche die Funktion deﬁniert
ist. In dieser Vorlesung werden wir vor allem verschiedene Intervalle der reellen Zahlen R als
Deﬁnitionsbereich betrachten. Dabei unterscheiden wir oﬀene Intervalle
(a, b) = {x ∈ R|a < x < b},
(1.7)
welche die Endpunkte a und b nicht enthalten, und geschlossene Intervalle
[a, b] = {x ∈ R|a ≤ x ≤ b},
(1.8)
welche die Endpunkte a und b enthalten. Oft können Funktionen nur für einen recht eingeschränk√
ten Deﬁnitionsbereich deﬁniert werden. Zum Beispiel kann bei der Funktion y = 1 − x2 das
Argument nur Werte im Intervall −1 ≤ x ≤ 1 annehmen. Für reelle Werte außerhalb dieses Bereichs ist das Argument der Wurzel negativ und der Funktionswert somit nicht reell. Falls wir
nur reelle Funktionswerte betrachten wollen, müssen wir den Deﬁnitionsbereich auf |x| ≤ 1 einschränken (Grenzen mit eingeschlossen).Wir schreiben dafür auch x ∈ [−1, 1]. Oft schließen wir
auch einzelne Punkte aus dem Deﬁnitionsbereich aus. Zum Beispiel ist die Funktion f (x) = 1/x
für den Deﬁnitionsbereich R\{0} (das sind die reellen Zahlen ohne die Null) deﬁniert.
1.3.2
Nullstellen
Eine Funktion y = f (x) besitzt an der Stelle x0 eine Nullstelle, falls f (x0 ) = 0. Zum Beispiel
besitzt die Funktion f (x) = x2 − 1 an den Stellen x1 = −1 und x2 = 1 Nullstellen.
1.3.3
Gerade und ungerade Funktionen
Eine Funktion mit symmetrischem Deﬁnitionsbereich heißt gerade (siehe Abb. 1.5), falls gilt
f (x) = f (−x).
(1.9)
1 Funktionen
15
Eine Funktion heißt ungerade (siehe Abb. 1.6), falls
f (x) = −f (−x).
(1.10)
Anschaulich ist eine gerade Funktion spiegelsymmetrisch (achsensymmetrisch) zur y-Achse; eine
ungerade Funktion ist punktsymmetrisch zum Ursprung.
Abbildung 1.5: Gerade Funktionen.
1.3.4
Abbildung 1.6: Ungerade Funktionen.
Monotonie
Es seien x1 und x2 zwei beliebige Werte aus dem Deﬁnitionsbereich (x1 , x2 ∈ D) einer Funktion
f (x), die der Bedingung x1 < x2 genügen. Dann heißt die Funktion:
• monoton wachsend, falls f (x1 ) ≤ f (x2 ),
• streng monoton wachsend, falls f (x1 ) < f (x2 ),
• monoton fallend, falls f (x1 ) ≥ f (x2 ),
• streng monoton fallend, falls f (x1 ) > f (x2 ).
Abbildung 1.7: Monotonieeigenschaften von Funktionen.
1.3.5
Grenzwert
Eine Funktion y = f (x) sei in einer Umgebung von x0 deﬁniert. Gilt dann für jede im Deﬁnitionsbereich der Funktion liegende und gegen x0 konvergente Zahlenfolge {xn } mit xn = x0
lim f (xn ) = g,
n→∞
(1.11)
16
1 Funktionen
so heißt g der Grenzwert von y = f (x) an der Stelle x0 :
lim f (x) = g.
x→x0
(1.12)
Eine Folge ist dabei eine Abbildung mit den natürlichen Zahlen N = {0, 1, 2, 3, . . .} als Deﬁnitionsbereich. (Für die genaue Deﬁnition einer Folge siehe Kapitel 5.) Ein Beispiel einer Folge ist
1, 1/2, 1/3, 1/4, . . .. Diese Folge nähert sich dem Wert 0. Damit der Grenzwert einer Funktion f (x)
an der Stelle x0 existiert, darf es also nicht darauf ankommen, auf welche Weise man sich dem
Punkt x0 nähert.
Abbildung 1.8: An der Stelle x1 besitzt die Funktion einen Grenzwert, an der Stelle x2 nicht.
Beispiel:
Gesucht ist
x2
.
x→∞ x2 + x + 1
lim
(1.13)
Wir dividieren zunächst Zähler und Nenner durch x2 :
lim
x→∞ x2
x2
1
= lim
.
+ x + 1 x→∞ 1 + 1/x + 1/x2
(1.14)
Da sowohl 1/x als 1/x2 für x → ∞ gegen 0 gehen, erhalten wir:
x2
= 1.
x→∞ x2 + x + 1
lim
1.3.6
Stetigkeit
Abbildung 1.9: Diese Funktion hat an der Stelle x0 eine Unstetigkeitsstelle.
(1.15)
1 Funktionen
17
Eine in x0 und in einer gewissen Umgebung von x0 deﬁnierte Funktion y = f (x) heißt an der
Stelle x0 stetig, wenn der Grenzwert der Funktion an dieser Stelle existiert und mit dem dortigen
Funktionswert übereinstimmt:
lim f (x) = f (x0 ).
(1.16)
x→x0
Anschaulich kann man Stetigkeit folgendermaßen verstehen: Zeichnet man einen Graphen, kann
es vorkommen, dass die Funktion einen Sprung aufweist (die in Abb. 1.9 dargestellte Funktion
etwa hat bei x0 einen Sprung). In der Nähe von x0 kann man x-Werte ﬁnden, die sich nur wenig
voneinander unterscheiden (z.B. ein Punkt knapp links und ein Punkt knapp rechts von x0 ), deren
y-Werte sich aber um einen großen Betrag voneinander unterscheiden. Nähert man sich x0 von
links (ohne x0 genau zu erreichen), erhält man einen anderen Funktionswert, als wenn man das
von rechts tut, d.h. limx→x0− f (x) = limx→x0+ f (x). An der Stelle x0 ist die Funktion nicht stetig.
Eine Unstetigkeitsstelle dieser Art bezeichnet man auch als Sprungstelle.
Beispiel:
Die Funktion


 +1
f (x) = sign x =
0


−1
falls
falls
falls
x>0
x=0
x<0
(1.17)
hat an der Stelle x = 0 eine Unstetigkeitsstelle (siehe Abb. 1.10). Für x = 0 gilt sign x = |x|/x.
Abbildung 1.10: Die Funktion f (x) = sign x.
Knickstellen, bei denen sich die Steigung einer Funktion unstetig ändert, können auch in stetigen
Funktionen auftreten.
Beispiel:
Die Funktion

|x|
y=
1
−1 ≤ x < ∞
x < −1
(1.18)
hat Knickstellen bei x = −1 und x = 0, ist aber überall stetig (siehe Abb. 1.11). Die erste Ableitung
ist jedoch an den Stellen x = −1 und x = 0 unstetig.
1.3.7
Singularitäten
Stellen, in deren unmittelbarer Umgebung die Funktionswerte über alle Grenzen hinaus fallen oder
wachsen, heißen Singularitäten oder Unendlichkeitsstellen der Funktion. Diese Stellen sind
ebenfalls Unstetigkeitsstellen.
18
1 Funktionen
Abbildung 1.11: Eine stetige Funktion mit Knickstellen.
Beispiel:
Die Funktion y = 1/x wächst bei Annäherung an x = 0 über alle Grenzen:
1
x
1
lim−
x→0 x
lim
x→0+
=
∞,
(1.19)
=
−∞.
(1.20)
An dieser Stelle hat die Funktion eine Singularität.
Abbildung 1.12: Die Funktion f (x) = 1/x hat an der Stelle x = 0 eine Singularität.
1.4
Neue Funktionen aus alten
Durch Addition, Subtraktion, Multiplikation und Division kann man aus alten Funktionen neue
deﬁnieren. Zum Beispiel: h(x) = f (x) + g(x) oder h(x) = f (x) · g(x). Dabei muss natürlich auf
einen passenden Deﬁnitionsbereich geachtet werden. In den beiden nächsten Abschnitten werden
wir zwei weitere wichtige Arten kennen lernen, um aus alten Funktionen neue zu deﬁnieren.
1.4.1
Verkettung von Funktionen
Gegeben seien zwei Funktionen f (x) und g(x). Die Funktion f (x) ordnet einer Zahl x eine Zahl z
zu: z = f (x). Die Zahl z wird dann als unabhängige Variable für die Funktion g verwendet. Dadurch
wird der Zahl z eine Zahl y zugeordnet: y = g(z). Durch die Hintereinanderanwendung von f
1 Funktionen
19
und g wird der Zahl x eine Zahl y zugeordnet:
y = g(z) = g(f (x))
(1.21)
x → f (x) → g(f (x)).
(1.22)
Die Variable z ist nur als Zwischenergebnis interessant, kann also wegfallen. Für die verkettete
(oder auch zusammengesetzte) Funktion schreibt man auch
y = (g ◦ f )(x).
(1.23)
Beispiel:
Die Funktionen
f (x) = x2
und
g(x) = sin(x)
(1.24)
ergeben zusammengesetzt
g(f (x)) = (g ◦ f )(x) = sin(x2 ).
(1.25)
Die Verkettung (oder Zusammensetzung) von Funktionen ist im Allgemeinen nicht kommutativ:
(g ◦ f )(x) = (f ◦ g)(x).
(1.26)
Das heißt, bei der Verkettung von Funktionen kommt es auf die Reihenfolge an.
Beispiel:
Gegeben seien die beiden Funktionen
f (x) = 1 + x
und
g(x) = 1/x.
(1.27)
Während die Zusammensetzung g ◦ f
g(f (x)) =
1
1+x
(1.28)
1
.
x
(1.29)
ergibt, erhält man für die Zusammensetzung f ◦ g
f (g(x)) = 1 +
1.4.2
Umkehrfunktion
Häuﬁg ist es notwendig, für einen gegebenen Wert der abhängigen Variablen den Wert der unabhängigen Variablen zu bestimmen. Betrachten wir zum Beispiel den Flächeninhalt y = x2 eines
Quadrats mit Seitenlänge x (siehe Abb. 1.13).
Abbildung 1.13: Flächeninhalt y eines Quadrats mit Seitenlänge x.
20
1 Funktionen
√
Aus der Fläche können wir natürlich die Kantenlänge x = y bestimmen. Hier haben wir die
√
Funktion y = f (x) = x2 für x ≥ 0 umgekehrt zu x = f −1 (y) = y. Die Funktion x = f −1 (y)
ist die Umkehrfunktion (oder inverse Funktion) von y = f (x). Dabei haben Argument und
Funktionswert die Rollen vertauscht. Gewissermaßen ermittelt die Umkehrfunktion, woher der
Funktionswert f gekommen ist. In der Umkehrfunktion f −1 (y) ist nun y die unabhängige Variable.
Da wir die unabhängige Variable meistens mit x bezeichnen, nennen wir y in x um und erhalten
folgendes Paar von Funktion und Umkehrfunktion: f (x) und f −1 (x).
Abbildung 1.15: Umkehrfunktion x = f −1 (y).
Abbildung 1.14: Funktion y = f (x).
Setzt man eine Funktion mit ihrer Umkehrfunktion zusammen, so wird das Argument x auf sich
selbst abgebildet:
(f ◦ f −1 )(x) = (f −1 ◦ f )(x) = f −1 (f (x)) = x.
Als weiteres Beispiel bestimmen wir die Umkehrfunktion der Funktion y =
1 − 4x2 ,
für D = [0, 1/2]
y =
2
y
4x2
=
=
x =
1 − 4x ,
1 − y2,
1
1 − y2
2
2
(1.30)
√
1 − 4x2 :
(1.31)
(1.32)
(1.33)
y ∈ [0, 1].
(1.34)
Somit gilt:
f (x) =
1 − 4x2 ;
f −1 (x) =
1
1 − x2 .
2
(1.35)
Der Zusammenhang zwischen Funktion und Umkehrfunktion ist in Abb. 1.16 graphisch dargestellt.
Abbildung 1.16: Aus der Funktion f (x) erhalten wir durch Spiegelung an der 45◦ -Geraden die
Umkehrfunktion f −1 (y).
1 Funktionen
21
Natürlich können wir eine Funktion nur umkehren, wenn jedem Element y aus dem Wertebereich
genau ein Wert x aus dem Deﬁnitionsbereich zugeordnet ist. Wenn, wie in Abb. 1.17 dargestellt,
mehrere Werte aus dem Deﬁnitionsbereich (hier x1 und x2 ) auf denselben Wert des Wertebereichs
(hier y1 ) abgebildet werden, können wir die Funktion nicht umkehren, da wir für Punkt y1 nicht
wissen, welches Argument wir nehmen sollen. Anders gesagt: Eine Funktion y = f (x) ist umkehrbar, wenn aus x1 = x2 stets f (x1 ) = f (x2 ) folgt. Falls dies nicht gilt, kann durch geeignete
Einschränkung des Deﬁnitionsbereichs die Umkehrung einer solchen Funktion doch ermöglicht werden. Zum Beispiel besitzt die Funktion f (x) = x2 mit D = R für +x und −x jeweils den selben
Funktionswert und ist somit nicht umkehrbar. Schränken wir den Deﬁnitionsbereich jedoch auf
D = {x ∈ R|x ≥ 0} ein, ist die Funktion umkehrbar.
Eine Funktion, für die aus x1 = x2 stets f (x1 ) = f (x2 ) folgt, nennt man injektiv. Falls für alle
Werte y im Wertebereich ein Argument x existiert, sodass f (x) = y, ist die Funktion surjektiv.
Eine sowohl injektive als auch surjektive Funktion nennt man bijektiv und genau diese Funktionen
sind umkehrbar.
Abbildung 1.17: Eine Funktion, bei der mehrere Argumente denselben Funktionswert besitzen, ist
nicht umkehrbar.
Wir halten zusammenfassend fest:
• Jede streng monoton wachsende oder fallende Funktion ist umkehrbar.
• Bei der Umkehrung einer Funktion werden der Deﬁnitionsbereich und der (gegebenenfalls
passend eingeschränkte) Wertebereich vertauscht.
• Analytisch erhält man die Umkehrfunktion durch Auﬂösen nach der unabhängigen Variablen
und anschließendes formales Vertauschen der beiden Variablen.
• Graphisch ergibt sich die Umkehrfunktion durch Spiegelung an der 45◦ -Geraden.
1.5
Wichtige Funktionen
Im Folgenden werden wir einige in der Physik wichtige Funktionen kurz in Erinnerung rufen.
Die Auswahl ist aus Platzgründen sehr beschränkt und so sei der Leser für eine vollständigere
Behandlung auf die in der Literaturliste angeführten Nachschlagewerke verwiesen. Eine Fülle von
Informationen über eine Vielzahl von Funktionen (und über Mathematik im Allgemeinen) ist auf
der Webseite http://mathworld.wolfram.com verfügbar.
1.5.1
Lineare Funktionen
Bei der linearen Funktion (eigentlich aﬃne Funktion)
f (x) = kx + b
(1.36)
hängt der Funktionswert in einfacher Potenz, d.h. linear vom Argument ab. Die lineare Funktion
besitzt zwei Parameter, k und b. Die Bedeutung dieser beiden Parameter wird in der graphischen
22
1 Funktionen
Darstellung der Funktion als eine Gerade klar (siehe Abb. 1.18). Der Parameter k ist dabei die Steigung der Geraden und der Parameter b ihr Schnittpunkt mit der y-Achse. Der Deﬁnitionsbereich
umfasst die gesamte x-Achse und der Wertebereich die gesamte y-Achse (für k = 0).
Abbildung 1.18: Die linear Funktion y = kx + b.
Die lineare Funktion f (x) = kx + b ist für k = 0 im gesamten Deﬁnitionsbereich (reelle Zahlen)
streng monoton und daher umkehrbar. Auch die Umkehrfunktion einer linearen Funktion ist eine
lineare Funktion: x = y/k − b/k. Lineare Funktionen werden häuﬁg für “Fits” verwendet (siehe
Kapitel 7). Die identische Funktion y = x und die konstante Funktion y = b sind Spezialfälle
der linearen Funktion.
1.5.2
Potenzfunktionen
Die Potenz xn ist das Produkt von n gleichen Faktoren:
xn = x
· x · x
· · · · · x .
(1.37)
n−mal
Hier werden x die Basis und n der Exponent genannt.
Rechenregeln für Potenzen:
x0
xn · xm
xn
xm
(xn )m
=
=
1,
xn+m ,
(1.38)
(1.39)
=
xn−m ,
(1.40)
=
nm
(1.41)
x
.
Dabei sind n und m beliebige ganze Zahlen.
Die Regel x0 = 1 ergibt sich aus der Beobachtung, dass sich durch Division durch x der Exponent
in xn um 1 verringert: xn /x = xn−1 . Für n = 1 gilt also x/x = x1−1 = x0 = 1. Analog folgt auch,
dass 1/x = x−1 oder allgemein: 1/xn = x−n . Die anderen Rechenregeln ergeben sich aus ähnlichen
Überlegungen. Zum Beispiel:
xn · xm = x · x · · · · · x · x
· · · · · x = xn+m
· x n−mal
(1.42)
m−mal
und
· · · · · xm = xnm .
(xn )m = xm · xm
(1.43)
n−mal
Durch Addition von Potenzen erhält man die Potenzfunktion (oder ganz rationale Funktion):
f (x) = a0 + a1 x + a2 x2 + a3 x3 + · · · + an xn =
n
i=0
ai xi ,
(1.44)
1 Funktionen
23
wobei die Koeﬃzienten ai beliebige reelle Zahlen sind. Die Potenzfunktion aus der obigen Gleichung wird auch Polynom n-ten Grades genannt (falls an = 0). Dabei ist n die höchste vorkommende Potenz.
Beispiele:
• Potenzfunktion 2. Grades f (x) = a0 + a1 x + a2 x2 (mit a2 = 0),
• Potenzfunktion 3. Grades f (x) = a0 + a1 x + a2 x2 + a3 x3 (mit a3 = 0).
Der Deﬁnitionsbereich der Potenzfunktion umfasst die gesamte x-Achse, −∞ < x < ∞ und die
Funktion ist überall stetig. Für x → ±∞ divergiert die Funktion nach −∞ oder +∞.
Abbildung 1.19: Beispiele für Potenzfunktionen unterschiedlichen Grades.
Gebrochen rationale Funktionen lassen sich als Quotient zweier ganz rationaler Funktionen
darstellen:
n
ai xi
.
(1.45)
f (x) = i=0
m
i
i=0 bi x
Der Deﬁnitionsbereich ist −∞ < x < ∞. Die Nullstellen des Nenners, an denen die Funktion
divergiert, sind jedoch davon ausgeschlossen.
√
Die Wurzelfunktion f (x) = ± x ist die Umkehrfunktion der Potenzfunktion f (x) = x2 . Da
die Quadrate von x und −x identisch sind, (x)2 = (−x)2 (siehe Abb. 1.20), ist die Quadratwurzel
24
1 Funktionen
Abbildung 1.20: Für jeden Wert y0 auf der Ordinate gibt es für die Quadratfunktion y = x2 zwei
Werte auf der Abszisse.
√
√
nicht eindeutig und die beiden Zweige f (x) = + x und f (x) =√− x müssen getrennt voneinander
behandelt werden. Für die Quadratwurzel schreiben wir auch x = x1/2 .
Die Wurzelfunktion lässt sich auch für beliebige Exponenten n verallgemeinern. Für die Potenzfunktion
f (x) = xn
(1.46)
deﬁnieren wir die n-te Wurzel als die entsprechende Umkehrfunktion
x1/n = f −1 (x).
(1.47)
Die Schreibweise der Wurzelfunktion mit Hilfe des Exponenten erlaubt die Anwendung der Rechenregeln für Potenzen, z. B. (x1/n )1/m = x1/(nm) .
Es gibt auch die Zusammensetzung von Potenzfunktion und Wurzelfunktion:
1/m
f (x) = (xn )
= xn/m .
(1.48)
Auch dafür gelten die Rechenregeln für Potenzen.
1.5.3
Exponentialfunktion
Die Exponentialfunktion und ihre Umkehrung, die Logarithmusfunktion, sind transzendente
Funktionen, d.h. sie lassen sich nicht als endliche Kombination von algebraischen Termen darstellen (sehr wohl aber durch unendliche Reihen).
Die allgemeine Form der Exponentialfunktion lautet:
f (x) = ax .
(1.49)
Dabei ist die reelle positive Zahl a die Basis und x der Exponent. Die Bedeutung von ax für
rationale Exponenten haben wir bereits im letzten Abschnitt kennen gelernt. Für irrationale Exponenten x, also für jene x-Werte, die sich nicht durch einen Bruch darstellen lassen, können wir x
beliebig genau durch einen solchen Bruch annähern und somit ax beliebig genau durch Verkettung
von Potenz- und Wurzelfunktion erhalten.
Wichtige Spezialfälle sind die Exponentialfunktionen mit Basis 10 und e:
f (x)
f (x)
=
10x,
(1.50)
=
x
(1.51)
e .
1 Funktionen
25
Die Exponentialfunktion mit Basis e schreiben wir auch oft als
f (x) = exp(x).
(1.52)
Exakt ist die Exponentialfunktion für die Basis e über eine Potenzreihe mit unendlich vielen
Gliedern deﬁniert:
ex = 1 + x +
x3
x4
x2
+
+
+ ···
2!
3!
4!
(1.53)
(Im Kapitel 5 werden wir mehr über Potenzreihen erfahren.) Dabei ist e = 2.718281828 . . . die
Eulersche Zahl, eine der wichtigsten Zahlen der Mathematik. Eine alternative Deﬁnition ist über
den Grenzwert
ex = lim
k→∞
1+
x k
k
(1.54)
möglich.
Der Deﬁnitionsbereich der Exponentialfunktion umfasst die gesamte reelle Achse, −∞ < x < ∞
und der Wertebereich besteht aus allen positiven reellen Zahlen, 0 < y < ∞ (falls a = 1). Die
Exponentialfunktion ax ist überall stetig. Für a > 1 ist sie streng monoton wachsend und für a < 1
streng monoton fallend (siehe Abb. 1.21). Die Exponentialfunktion für a > 1 wächst für positive
x stärker an als jede Potenzfunktion, d. h.
ax
=∞
x→∞ xn
lim
für alle n ∈ N.
(1.55)
Abbildung 1.21: Die Exponentialfunktion ax für a > 1 (links) und 0 < a < 1 (rechts).
Für die Exponentialfunktion gelten folgende Rechenregeln:
a0
a−x
x y
(a )
ax ay
ax
ay
= 1,
1
=
,
ax
= axy ,
(1.56)
= ax+y ,
(1.59)
= ax−y .
(1.60)
(1.57)
(1.58)
(1.61)
Diese Rechenregeln folgen aus den Rechenregeln für die Potenz- und Wurzelfunktion.
26
1.5.4
1 Funktionen
Logarithmus
Die Umkehrfunktion der Exponentialfunktion ist der Logarithmus (wir erhalten ihn graphisch
durch Spiegelung der Exponentialfunktion an der 45◦ -Geraden). Zu verschiedenen Basen a der
Exponentialfunktion gibt es auch unterschiedliche Logarithmen. Wir bezeichnen den Logarithmus
zur Basis a der Zahl x als
loga (x).
(1.62)
Der Logarithmus der Zahl x zur Basis a ist also jene Zahl, mit der man a potenzieren muss, um x
zu erhalten:
(1.63)
y = loga (x) ⇔ ay = x.
Folgende Exponentialfunktionen und zugehörige Logarithmen werden in der Physik besonders
häuﬁg verwendet:
y = 10x
y = ex
log10 (y) = log(y) = x
loge (y) = ln(y) = x
dekadischer Logarithmus
natürlicher Logarithmus
(1.64)
(1.65)
Abbildung 1.22: Die Logarithmusfunktion loga (x) für verschiedene Basen a.
Für alle Basen a folgt aus a0 = 1, dass loga 1 = 0. Der Deﬁnitionsbereich der Exponentialfunktion
erstreckt sich über alle positiven reellen Zahlen, 0 < x < ∞, und der Wertebereich ist −∞ < y < ∞.
Für die Logarithmusfunktion gelten folgende Rechenregeln:
loga (1) = 0,
1
loga
= − loga (x),
x
loga (xz ) = z loga (x),
loga (x · y) = loga (x) + loga (y),
x
loga
= loga (x) − loga (y).
y
(1.66)
(1.67)
(1.68)
(1.69)
(1.70)
Diese Rechenregeln folgen aus den Rechenregeln für die Exponentialfunktion. Zum Beispiel:
1
1
loga
= loga a− loga x = − loga x,
(1.71)
= loga
log
x
x
a a
oder:
loga (xy) = loga aloga x · aloga y = loga aloga x+loga y = loga x + loga y.
(1.72)
1 Funktionen
27
Auf ähnliche Weise erhalten wir
loga (xz ) = loga (aloga x )z = loga az loga x = z loga x.
(1.73)
Die Logarithmusfunktion wächst für a > 1 langsamer als jede beliebige Potenz von x, d.h.
lim
x→∞
loga (x)
=0
xn
für alle n ∈ N.
(1.74)
Wie die Exponentialfunktion lässt sich auch der Logarithmus von einer Basis in eine andere umformen:
(1.75)
loga (x) = loga blogb (x) = logb (x) · loga (b),
loga (x)
,
loga (b)
logb (x)
loga (x) =
.
logb (a)
logb (x) =
(1.76)
(1.77)
Mit Hilfe der Logarithmusfunktion lässt sich die Exponentialfunktion zu einer beliebigen Basis a
in eine auf der Eulerschen Zahl e beruhende Darstellungsform umwandeln:
x
x
ax = eln a = ex ln a = eln(a ) .
(1.78)
Für eine beliebige Basis b gilt:
x
x
ax = blogb a = bx logb a = blogb (a ) .
1.5.5
(1.79)
Winkelfunktionen
Die Winkelfunktionen (trigonometrische Funktionen) sind ebenfalls transzendente Funktionen.
Zur Deﬁnition dieser Funktion ist es sehr zweckmäßig, Winkel im Bogenmaß anzugeben. Dazu zeichnen wir zunächst einen Kreis mit Radius 1 durch den Scheitel des Winkels, den wir im
Bogenmaß ausdrücken wollen (siehe Abb. 1.23).
Abbildung 1.23: Das Bogenmaß des Winkels α ist die Bogenlänge b, die vom Winkel am Einheitskreis (Radius=1) begrenzt wird.
Die Länge des Kreisbogens zwischen den Winkelschenkeln ist das Bogenmaß dieses Winkels. Der
volle Kreis hat einen Umfang von 2π und der zugehörige Winkel beträgt daher im Bogenmaß 2π.
Zwischen dem üblichen Gradmaß und dem Bogenmaß gilt daher die Beziehung:
Bogenmaß = Gradmaß × 2π/360.
(1.80)
Die trigonometrischen Funktionen lassen sich geometrisch sehr anschaulich am Einheitskreis deﬁnieren. Eine exakte Deﬁnition dieser Funktionen erfolgt jedoch durch Potenzreihen. Auf diese
28
1 Funktionen
Abbildung 1.24: Verschiedene Winkel in Gradmaß und in Bogenmaß.
Abbildung 1.25: Deﬁnition der Winkelfunktionen für den Winkel α am Einheitskreis (Radius=1).
exakte Deﬁnition wollen wir hier jedoch verzichten. Die Winkelfunktionen setzen den Winkel α
mit verschiedenen Längen in Beziehung (siehe Abb. 1.25).
Mit Hilfe des in Abb. 1.25 dargestellten rechtwinkligen Dreiecks lassen sich geometrisch folgende
Funktionen des Winkels α deﬁnieren:
Sinus:
Kosinus:
Tangens:
Kotanges:
sin α = Gegenkathete / Hypotenuse
cos α = Ankathete / Hypotenuse
tan α =Gegenkathete / Ankathete
cot α =Ankathete / Gegenkathete
Tragen wir sin(α) und cos(α) als Funktion von α in einem kartesischen Koordinatensystem auf, erhalten wir die in Abbildung 1.26 dargestellten Funktionsgraphen. Während der Sinus eine ungerade
Funktion ist,
sin(x) = − sin(−x),
(1.81)
cos(−x) = cos(x).
(1.82)
ist der Kosinus gerade,
Nachdem der Winkel α die Werte 0 bis 2π durchlaufen hat, zeigen die Funktionen wieder dieselben
Werte wie vorher, d.h. die Funktionen sind periodisch mit der Periode 2π:
sin(x + 2πn) =
sin(x)
(1.83)
cos(x + 2πn) =
cos(x),
(1.84)
1 Funktionen
29
wobei n eine ganze Zahl ist. Die Werte von Sinus und Kosinus schwanken zwischen -1 und +1.
Abbildung 1.26: Sinus und Kosinus.
Der Tangens und der Kotangens sind ebenfalls periodische Funktionen, haben aber eine Periodenlänge von π statt 2π (siehe Abb. 1.27). Sowohl der Tangens als auch der Kotangens sind
ungerade Funktionen:
tan(x) = − tan(−x),
cot(x) = − cot(−x).
Die Tangensfunktion tan α ist singulär bei α =
α = 0, π, 2π, . . . .
π 3π
2, 2 ,...
(1.85)
(1.86)
und die Kotangensfunktion cot α bei
Abbildung 1.27: Tangens (links) und Kotangens (rechts).
Winkelfunktionen können ineinander umgewandelt werden. Zum Beispiel gelten folgende Beziehungen, die man leicht durch Anwendung des Satzes von Pythagoras auf das in Abb. 1.25 dargestellte
rechtwinklige Dreieck ableiten kann (sin2 α + cos2 α = 1):
1 − cos2 α,
tan α
sin α = √
,
1 + tan2 α
1
.
tan α =
cot α
sin α =
(1.87)
(1.88)
(1.89)
Weitere Formeln zur Umformung trigonometrischer Funktionen sowie die Werte der Winkelfunktion
an besonderen Stellen können den gängigen Formelsammlungen entnommen werden.
Äußerst wichtig sind zudem die Additionstheoreme für die Winkelfunktionen:
sin(α + β)
=
sin α cos β + cos α sin β,
(1.90)
cos(α + β)
=
cos α cos β − sin α sin β.
(1.91)
30
1 Funktionen
Diese Ausdrücke kann man zur Umformung von trigonometrischen Ausdrücken verwenden. So
können wir zum Beispiel folgende Vereinfachung durchführen:
x)
cos x (1 − tan2 x)
cos x (1 + tan x)
cos x (1 − tan2 x)
(1
−
tan
=
=
x)
tan x (cot x − 1)
(1 − tan x)
(1
−
tan
sin x
= cos x + sin x
= cos x 1 +
cos x
π
+ sin x
= sin x +
2
π
π
π
π
+ sin x − +
= sin x + +
4
4
4 4 π
π
π
π
cos + sin cos x +
= sin x +
4
4 π 4 π 4
π
π
+ sin x +
cos −
+ sin −
cos x +
4
4
4
4
1
π
π
1
+
x
= √ sin x +
+ √cos
4
4
2 2
1
π
1
π
+
+ √ sin x +
− √cos
x
4
4
2 2
√
2
π
π
= √ sin x +
= 2 sin x +
.
4
4
2
(1.92)
Die Winkelfunktionen hängen eng mit der Exponentialfunktion zusammen. Dieser Zusammenhang
ist durch die Eulersche Formel gegeben (eiϕ = cos ϕ+i sin ϕ), die wir im Kapitel 6 näher behandeln
werden.
1.5.6
Arcusfunktionen
Oft kennen wir beispielsweise den Sinus eines Winkels und möchten daraus den Winkel selbst
bestimmen. Dies können wir mit der Umkehrfunktion des Sinus, dem Arcussinus tun:
x = arcsin y
(y = sin x).
(1.93)
Die Bezeichnung Arcussinus stammt von arcus ab, der lateinischen Bezeichnung für Bogen (wir
bestimmen ja das “Bogenmaß” des Winkels aus dem Sinus). Da jetzt y die unabhängige Variable
ist, benennen wir sie um in x:
y = arcsin x.
(1.94)
Der Deﬁnitionsbereich des Arcussinus ist −1 ≤ x ≤ 1. Da ein bestimmter Wert der Winkelfunktionen durch eine Vielzahl von Winkeln erzeugt wird (siehe Abb. 1.28), muss der Wertebereich auf
einen gewissen Bereich eingeschränkt werden. Wir beschränken den Wertebereich so, dass jeder
Wert des Sinus genau einmal angenommen wird. Damit erreichen wir eine eindeutige Zuordnung.
Der zugeordnete Wert heißt Hauptwert. Der Hauptwert ist jener Wert y, der mit x = sin(y) konsistent ist und den kleinsten Absolutwert |y| besitzt. Für y = arcsin(x) gilt also ein Wertebereich
von − π2 ≤ y ≤ π2 (siehe Abb. 1.29). Analog verfährt man mit arccos, arctan und arccot.
1 Funktionen
31
Abbildung 1.28: Die Sinusfunktion nimmt einen bestimmten Funktionswert an verschiedenen Stellen an.
Abbildung 1.29: Arcussinus und Arcuskosinus.
Die folgende Tabelle enthält die Deﬁnitionsbereiche D und Wertebereiche W der Arcusfunktionen:
Funktion
D
W
arcsin
[−1, +1]
[− π2 , π2 ]
arccos
[−1, +1]
[0, π]
arctan
[−∞, +∞]
[− π2 , π2 ]
arccot
[−∞, +∞]
[0, π]
Alternative Schreibweisen für die Arcusfunktionen sind:
arcsin(x) = sin−1 (x) = asin(x),
arccos(x) = cos−1 (x) = acos(x),
arctan(x) = tan−1 (x) = atan(x),
arccot(x) = cot−1 (x) = acot(x).
Die Arcusfunktionen werden auch zyklometrische Funktionen genannt. Für die Arcusfunktionen gibt es zahlreiche nützliche Beziehungen, die Sie bei Bedarf den gängigen Formelsammlungen
entnehmen können.
32
1 Funktionen
Abbildung 1.30: Arcustangens und Arcuskotangens.
1.5.7
Hyperbolische Funktionen
Während die trigonometrischen Funktionen durch den Schnitt einer Geraden mit einem Kreis erzeugt werden können, werden die hyperbolischen
Funktionen durch den Schnitt mit den Hyper√
belästen der Einheitshyperbel y = ± x2 − 1 erzeugt. Die Funktionen werden aber nicht angegeben
als Funktion des Steigungswinkels wie bei den trigonometrischen Funktionen,
√ sondern als Funktion
der von den Geraden mit Steigung g und −g und der Hyperbel y = ± x2 − 1 eingeschlossenen
Fläche A. Die geometrische Bedeutung der hyperbolischen Funktionen sinh und cosh ist in Abb.
1.31 dargestellt.
Abbildung 1.31: Geometrische Interpretation der hyperbolischen Funktionen sinh und cosh.
Analog zu den trigonometrischen Funktionen Sinus, Kosinus, Tangens und Kotangens können auch
1 Funktionen
33
die entsprechenden hyperbolischen Funktionen deﬁniert werden:
Sinus hyperbolicus
Cosinus hyperbolicus
Tangens hyperbolicus
Cotangens hyperbolicus
sinh(x),
cosh(x),
tanh(x) = sinh(x)/ cosh(x),
coth(x) = 1/ tanh(x).
Die Hyperbelfunktionen lassen sich mit Hilfe der Exponentialfunktion ausdrücken:
sinh x =
cosh x =
tanh x =
coth x =
ex − e−x
,
2
ex + e−x
,
2
x
−x
e −e
,
ex + e−x
ex + e−x
.
ex − e−x
(1.95)
(1.96)
(1.97)
(1.98)
Hyperbolische und trigonometrische Funktionen können in der komplexen Ebene als gleichwertige Funktionen dargestellt werden. Durch Verwendung imaginärer Argumente werden die
Funktionen ineinander übergeführt. Diesen Zusammenhang werden wir im Kapitel 6 näher behandeln.
Die Funktionsgraphen der wichtigsten dieser Funktionen sind in Abb. 1.32 und 1.33 dargestellt.
Abbildung 1.32: Die hyperbolischen Funktionen sinh and cosh.
Abbildung 1.33: Die hyperbolischen Funktionen tanh and coth.
Wichtige Zusammenhänge zwischen den hyperbolischen Funktionen lassen sich aus der Gleichung
sinh2 (x) = cosh2 (x) − 1
(1.99)
ableiten.
1.5.8
Areafunktionen
Die inversen Hyperbelfunktionen werden als Areafunktionen bezeichnet. (Der Name kommt daher,
dass wir die eingeschlossene Fläche A, also lateinisch “area”, erhalten, wenn wir die hyperbolischen
Funktionen umkehren.)
34
1 Funktionen
Abbildung 1.34: Die Areafunktionen Arsinh und Arcosh (links) sowie Artanh und Arcoth (rechts).
Die Areafunktionen können mit Hilfe von Logarithmen ausgedrückt werden:
Arsinh(x) = ln(x + x2 + 1),
Arcosh(x) = ln(x + x2 − 1),
1 1+x
ln
,
Artanh(x) =
2 1−x
1 x+1
ln
.
Arcoth(x) =
2 x−1
(1.100)
(1.101)
(1.102)
(1.103)
Diese Formeln erhält man durch direkte Umkehrung der hyperbolischen Funktionen. Zusammenhänge zwischen den verschiedenen Areafunktionen können den gängigen Formelsammlungen
entnommen werden.
Kapitel 2
Vektoren
2.1
Grundlagen
In der Physik ist es oft notwendig, von gewissen Größen nicht nur deren Betrag, sondern auch
deren Richtung zu kennen. Wenn wir mit dem Fahrrad irgendwohin fahren, ist unsere Bewegungsrichtung genau so wichtig wie der Betrag unserer Geschwindigkeit. Solche Größen nennt
man Vektoren. Beispiele für Vektoren sind: Kraft, Geschwindigkeit, Beschleunigung, Feldstärke,
Flächenelement, Impuls und Dipolmoment. Größen, die keine Richtung besitzen, nennen wir Skalare. Dazu zählen: Zeit, Masse, Volumen, Dichte, elektrische Ladung und Energie. Wir deﬁnieren
also Vektoren wie folgt:
Definition: Ein Vektor ist eine gerichtete Größe. Er wird durch eine Richtung und eine Länge
(einen Betrag) beschrieben.
Im Folgenden werden wir Vektoren durch einen Pfeil kennzeichnen, zum Beispiel F und v . Häuﬁg
werden Vektoren aber auch im Fettdruck angegeben, zum Beispiel F und v.
Bei einer physikalischen Vektorgröße gehört zur vollständigen Beschreibung auch die Angabe einer
Maßeinheit. Der Betrag besteht aus Maßzahl und Einheit. Kräfte messen wir zum Beispiel in
der Einheit Newton (abgekürzt N): |F1 | = F1 = 100N. Hier haben wir den Betrag eines Vektors,
also dessen Länge, mit Hilfe von senkrechten Strichen ausgedrückt.
Graphisch können wir Vektoren als Pfeile darstellen mit Länge und Richtung (siehe Abb. 2.1).
Abbildung 2.1: Ein Vektor r lässt sich als Pfeil in einem rechtwinkligen Koordinatensystem darstellen. In diesem zweidimensionalen Beispiel hat der Vektor r die Komponenten ∆x und ∆y:
r = (∆x, ∆y). Der Vektor ist durch Angabe des Anfangspunktes Q und des Endpunktes P eindeutig festgelegt.
35
36
2 Vektoren
Ein Vektor lässt sich auch durch Angabe von Anfangspunkt Q und Endpunkt P eindeutig festlegen.
−−
→
Dann schreiben wir QP .
Wenn wir als Anfangspunkt Q den Ursprung (0, 0, 0) des Koordinatensystems wählen (siehe Abb.
2.2 für den 2-dimensionalen Fall), so kann der Ortsvektor r des Punktes P = P (x, y, z) in
kartesischen Koordinaten geschrieben werden als
r = (x, y, z).
(2.1)
r = (rx , ry , rz ).
(2.2)
Oft ﬁnden wir auch die Notation
Abbildung 2.2: Falls wir als Ausgangspunkt Q den Ursprung wählen, können wir r als den Ortsvektor des Punktes P = (x, y) deuten.
Der Ortsvektor r gibt die Lage des Punktes P relativ zum Ursprung an.
Abbildung 2.3: Der Verschiebungsvektor r = r2 − r1 ist der Verbindungsvektor zwischen Punkt P1
mit Ortsvektor r1 und Punkt P2 mit Ortsvektor r2 .
Vektoren können auch Verschiebungen beschreiben. Der Verschiebungsvektor zwischen den
Punkten P1 und P2 ist die Diﬀerenz der Ortsvektoren r1 und r2 der Punkte P1 und P2 :
r = r2 − r1 .
(2.3)
Was genau die Diﬀerenz zweier Vektoren bedeutet, werden wir später sehen.
Hier ist es wichtig anzumerken, dass in der graphischen Darstellung Pfeile mit gleicher Richtung
und gleichem Betrag aber unterschiedlichen Ausgangspunkten zum selben Vektor gehören. Ein
graphisch dargestellter Pfeil ist also nur einer von vielen Repräsentanten eines Vektors (siehe Abb.
2.4).
Von besonderer Bedeutung sind der Nullvektor und der Einheitsvektor:
Nullvektor: 0, |0| = 0, hat Länge Null und keine Richtung.
2 Vektoren
37
Abbildung 2.4: Pfeile, welche durch Parallelverschiebung ineinander übergeführt werden können,
also gleichen Betrag und gleiche Richtung besitzen, gehören zum selben Vektor.
Einheitsvektor: e, |e| = 1, hat Länge 1, wird verwendet, um Richtungen anzugeben
(z. B. Einheitsvektoren ex , ey , ez entlang der Achsen eines kartesischen Koordinatensystems). Einheitsvektoren werden auch als normiert bezeichnet.
2.2
Koordinatensysteme
Vektoren können auf verschiedene Weise dargestellt werden. Bisher haben wir dazu kartesische
Koordinaten verwendet. Bei gewissen Problemen sind andere Koordinatensysteme, die die Symmetrien des Problems auf natürliche Weise berücksichtigen, oft günstiger (z.B. Kugelkoordinaten,
Zylinderkoordinaten). Im Folgenden werden wir kurz die Darstellung von Vektoren in verschiedenen
Koordinatensystemen besprechen.
2.2.1
Kartesische Koordinaten
Unter einem kartesischen Koordinatensystem versteht man rechtwinklige Koordinatensysteme, die wir bereits zur Darstellung von Funktionen verwendet haben (siehe Abb. 2.5). Die Achsen
eines kartesischen Koordinatensystems stehen senkrecht aufeinander. Kartesische Koordinatensysteme können für beliebig viele Dimensionen deﬁniert werden. Abbildung 2.5 zeigt ein zweidimensionales und ein dreidimensionales Beispiel.
Mit Hilfe der Einheitsvektoren ex , ey und ez (auch Basisvektoren genannt) in Richtung der Koordinatenachsen können wir den Ortsvektor r auch darstellen als so genannte Linearkombination:
r = (x, y, z) = (rx , ry , rz ) = xex + yey + zez .
(2.4)
In kartesischen Koordinaten ergibt sich der Betrag (Länge) des Vektors aus dem Satz von Pythagoras:
r = |r| = x2 + y 2 = rx2 + ry2 ,
(2.5)
(2.6)
r = |r| = x2 + y 2 + z 2 = rx2 + ry2 + rz2 .
Der Einheitsvektor er in Richtung eines bestimmten Vektors r = 0 ergibt sich durch Division
des Vektors durch seinen Betrag:
er =
r
.
|r|
Dadurch erhält der Einheitsvektor er die Länge 1.
(2.7)
38
2 Vektoren
Abbildung 2.5: Zweidimensionales (2d) und dreidimensionales (3d) kartesisches Koordinatensystem. Die Einheitsvektoren ex , ey und ez zeigen in Richtung der Koordinatenachsen. Die Achsen
des dreidimensionalen Koordinatensystems bilden ein so genanntes “Rechtssystem”, das wir weiter
unten genauer besprechen werden.
Beispiel:
r = (3, 4, 5) = 3ex + 4ey − 5ez ,
√
√
r = |r| = 32 + 42 + (−5)2 = 9 + 16 + 25 = 50.
(2.8)
(2.9)
Einheitsvektor:

3
1 
r

er =
= √  4 .
|r|
50
−5

2.2.2
(2.10)
Polarkoordinaten
Anstelle der x- und y-Koordinate eines Punktes P in der Ebene können wir seine Lage auch durch
seine Entfernung r vom Ursprung und durch den Winkel ϕ, den die Verbindungslinie vom Punkt
zum Ursprung mit der x-Achse einschließt, angeben (siehe Abb. 2.6). Dabei wird der Winkel
ϕ gegen den Uhrzeigersinn bestimmt. Der Abstand r und der Winkel ϕ sind die so genannten
Polarkoordinaten des Punktes P (und seines Ortsvektors r).
Abbildung 2.6: Polarkoordinaten r und ϕ des Vektors r.
Wie aus Abb. 2.6 ersichtlich ergeben sich die kartesischen Koordinaten wie folgt aus den Polarko-
2 Vektoren
39
ordinaten:
x =
y =
r cos ϕ,
r sin ϕ.
(2.11)
(2.12)
Umgekehrt kommen wir durch
r = x2 + y 2
y ϕ = arctan
x
r>0
(2.13)
0 ≤ ϕ < 2π
(2.14)
von kartesischen zu Polarkoordinaten.
Polarkoordinaten bilden ein so genanntes krummliniges Koordinatensystem (siehe Abb. 2.7).
Abbildung 2.7: Durch Angabe von r und ϕ deﬁnieren wir einen Punkt in der Ebene. Die durch
r = const deﬁnierten Kurven sind Kreise um den Ursprung und ϕ = const deﬁniert vom Ursprung
ausgehende Halbgeraden.
Beispiel:
P = (3, −4)
⇒
Ortsvektor r =
3
−4
√
32 + 42 = 25 = 5
−4
ϕ = arctan
(die Umkehrung des tan ist nicht eindeutig).
= −53◦
3
r = |r| =
(2.15)
(2.16)
(2.17)
Im Kapitel 1.1 haben wir Kurven (Funktionsgraphen) in kartesischen Koordinaten dargestellt.
Wir können das aber auch in Polarkoordinaten tun, indem wir den Abstand r vom Ursprung als
Funktion des Winkels darstellen, zum Beispiel
1
.
r(ϕ) = √
cos 2ϕ
(2.18)
Durch Einsetzen dieser Gleichung in die Formel zur Umrechnung von Polarkoordinaten in kartesische Koordinaten erhalten wir die Kurve in Parameterform mit ϕ als Parameter:
x
y
cos ϕ
,
= r cos ϕ = √
cos 2ϕ
sin ϕ
= r sin ϕ = √
.
cos 2ϕ
(2.19)
(2.20)
40
2 Vektoren
√
Abbildung 2.8: In Polarkoordinaten kann die Hyperbel durch r = 1/ cos 2ϕ ausgedrückt werden.
Wir wollen nun den Parameter ϕ eliminieren. Dazu stellen wir fest, dass cos 2ϕ = cos2 ϕ − sin2 ϕ
und erhalten
cos ϕ
,
(2.21)
x = 2
cos ϕ − sin2 ϕ
sin ϕ
.
(2.22)
y = 2
cos ϕ − sin2 ϕ
Quadrieren ergibt
x2
=
y2
=
cos2 ϕ
,
cos2 ϕ − sin2 ϕ
sin2 ϕ
.
cos2 ϕ − sin2 ϕ
(2.23)
(2.24)
Wenn wir nun y 2 von x2 subtrahieren, erhalten wir:
x2 − y 2 =
cos2 ϕ
sin2 ϕ
cos2 ϕ − sin2 ϕ
−
=
= 1.
cos2 ϕ − sin2 ϕ cos2 ϕ − sin2 ϕ
cos2 ϕ − sin2 ϕ
(2.25)
Dies ist die Kurvengleichung für eine Hyperbel
x2 − y 2 = 1,
y=±
x2 − 1.
(2.26)
Eine der ersten Anwendungen von ebenen Polarkoordinaten, die Ihnen im 1. Semester begegnen
wird, ist die Kreisbewegung. Im Allgemeinen beschrieben wird die Bewegung eines Objektes
durch Angabe seines Ortes als Funktion der Zeit:
r = r(t).
(2.27)
Ein zweidimensionales Beispiel einer dadurch entstehenden Bahnkurve ist in Abb. 2.9 dargestellt.
Bei einer Kreisbewegung bewegt sich das Objekt (durch einen Punkt dargestellt) auf einer Kreisbahn (siehe Abb. 2.10).
Um die Kreisbewegung zu beschreiben, suchen wir die kartesischen Koordinaten x(t) und y(t)
als Funktion der Zeit t. Dies lässt sich in Polarkoordinaten sehr einfach bewerkstelligen. Bei einer
2 Vektoren
41
Abbildung 2.9: Bahnkurve (auch Trajektorie genannt) eines Punktes, der sich in der Ebene
bewegt.
Abbildung 2.10: Kreisbewegung eines Punktes in der Ebene.
gleichförmigen Kreisbewegung ist der Abstand vom Ursprung konstant, d. h. r = const. Der Winkel
aber ändert sich mit der Zeit. Da die Bewegung gleichförmig ist, wächst der Winkel linear mit der
Zeit:
ϕ(t) = ωt.
(2.28)
Dabei ist ω die so genannte Winkelgeschwindigkeit, die in unserem Fall konstant ist.
In kartesischen Koordinaten können wir dann die Bewegung beschreiben durch:
x
= r cos(ϕ(t)) = r cos ωt,
(2.29)
y
= r sin(ϕ(t)) = r sin ωt.
(2.30)
Sowohl die x- als auch die y-Koordinate des Punktes ändern sich auf nicht triviale Weise mit der
Zeit. Hier haben wir ausgenutzt, dass sich das Problem durch Wahl eines geeigneten Koordinatensystems wesentlich vereinfacht.
Beispiel: Zykloide
Als weiteres Beispiel suchen wir nach der Kurve, die ein Punkt eines auf einer Ebene rollenden
Rades beschreibt (siehe Abb. 2.11). Wir nehmen an, dass zu Beginn der Punkt im Ursprung ist.
42
2 Vektoren
Abbildung 2.11: Ein Punkt auf einem rollenden Rad beschreibt eine Zykloide.
Nachdem sich das Rad um den Winkel ϕ gedreht hat, hat sein Mittelpunkt die Strecke ϕr zurückgelegt. Der Punkt ist in x-Richtung jedoch um r sin ϕ zurückgeblieben:
x = ϕ · r − r sin ϕ.
(2.31)
Für die y-Koordinate des Punktes gilt
y = r − r cos ϕ.
(2.32)
Die Bahnkurve in kartesischen Koordinaten ergibt sich also durch Addition von linearer Bewegung
und Kreisbewegung.
2.2.3
Zylinderkoordinaten
Durch ebene Polarkoordinaten können wir einen Punkt in der xy-Ebene deﬁnieren. Wenn wir zu
diesen Koordinaten noch eine z-Koordinate hinzufügen, legen wir damit einen Punkt im Raum
fest. Diese Koordinaten nennen wir die Zylinderkoordinaten ρ, ϕ und z (siehe Abb. 2.12). Hier
verwenden wir ρ statt r für die Länge der Projektion des Vektors r in die xy-Ebene, um diese
Länge vom Betrag des Ortsvektors r zu unterscheiden.
Durch ρ =const, ϕ =const und z =const werden folgende Flächen deﬁniert:
ϕ = const:
ρ = const:
z = const:
Halbebene durch z-Achse,
Zylinder mit der z-Achse als Rotationsachse,
Ebene normal zur z-Achse.
Aus bekannten Zylinderkoordinaten lassen sich die kartesischen Koordinaten bestimmen:
x =
y =
ρ cos ϕ,
ρ sin ϕ,
(2.33)
(2.34)
z
z.
(2.35)
=
Umgekehrt gilt:
ρ
=
ϕ =
z
=
x2 + y 2 ,
y
,
arctan
x
z.
(2.36)
(2.37)
(2.38)
2 Vektoren
43
Abbildung 2.12: Zylinderkoordinaten.
Zylinderkoordinaten sind bei Situationen sinnvoll, bei denen die betrachteten Größen rotationssymmetrisch bezüglich einer Achse sind, z.B. das Magnetfeld um einen stromdurchﬂossenen Draht
oder das Trägheitsmoment eines Zylinders.
2.2.4
Kugelkoordinaten
In Kugelkoordinaten stellen wir die Lage eines Punktes mit Ortsvektor r durch seinen Abstand r =
|r| vom Ursprung sowie zwei Winkel ϕ (Azimut) und ϑ (Elevation) dar. Dabei ist ϑ der Winkel
zwischen dem Ortsvektor r und der positiven z-Achse. ϑ ist ähnlich der geographischen Breite (die
geographische Breite ist jedoch am Äquator identisch 0, während ϑ am Nordpol verschwindet) und
ϕ entspricht der geographischen Länge. Der Winkel ϕ ist der Winkel zwischen der Projektion von
r in die xy-Ebene und der positiven x-Achse. Die Geometrie der Kugelkoordinaten ist in Abb. 2.13
dargestellt.
Die Kugelkoordinaten r, ϕ und ϑ haben folgende Wertebereiche:
0 ≤ r,
(2.39)
0 ≤ ϕ < 2π,
0 ≤ ϑ ≤ π.
(2.40)
(2.41)
Kugelkoordinaten können durch folgende Ausdrücke in kartesische Koordinaten umgewandelt werden. Am einfachsten ist der Ausdruck für die z-Koordinate:
z = r cos ϑ.
(2.42)
Die x- und y-Koordinaten schreiben wir zunächst als
x =
y =
ρ cos ϕ,
ρ sin ϕ.
(2.43)
(2.44)
Da aber ρ = r sin ϑ ist, erhalten wir schließlich
x
y
= r sin ϑ cos ϕ,
= r sin ϑ sin ϕ,
(2.45)
(2.46)
z
= r cos ϑ.
(2.47)
44
2 Vektoren
Abbildung 2.13: Kugelkoordinaten.
Aus den kartesischen Koordinaten können die Kugelkoordinaten durch
r =
x2 + y 2 + z 2 ,
z
x2 + y 2
= arccos ϑ = arctan
,
z
x2 + y 2 + z 2
y
ϕ = arctan
x
(2.48)
(2.49)
(2.50)
bestimmt werden.
Durch r =const, ϕ =const und ϑ =const werden folgende Flächen deﬁniert:
r = const:
ϕ = const:
ϑ = const:
2.3
Kugeln um den Ursprung,
Halbebenen durch z-Achse,
Kegel um z-Achse mit Ursprung als Spitze.
Vektoralgebra
Wir befassen uns als nächstes mit den Rechenregeln für Vektoren in kartesischen Koordinaten.
2.3.1
Gleiche, inverse und parallele Vektoren
• Zwei Vektoren sind gleich, a = b, wenn sie in Betrag und Richtung übereinstimmen.
• Zwei Vektoren a und b sind invers, wenn sie denselben Betrag besitzen aber entgegengesetzte
Richtung, das heißt a = −b.
• Zwei Vektoren sind parallel (oder genauer: gleichsinnig parallel), a||b, wenn sie gleiche Richtung haben. Das heißt, a = λb mit λ > 0. Wenn die beiden Vektoren die entgegengesetzte
2 Vektoren
45
Richtung haben, nennt man sie antiparallel (oder gegensinnig parallel). In diesem Fall ist
a = λb mit λ < 0.
Der zu Vektor a gehörende Gegenvektor (oder inverse Vektor) −a besitzt den gleichen Betrag aber
entgegengesetzte Richtung. Komponentenweise können wir den inversen Vektor schreiben als




−ax
ax




−a =  −ay  .
(2.51)
a =  ay  ,
−az
az
2.3.2
Vektoraddition und -subtraktion
Abbildung 2.14: Vektoraddition.
Die Addition zweier Vektoren a und b,
c = a + b,
(2.52)
kann graphisch durch Aneinanderhängen erfolgen. Dazu verschieben wir den Vektor b parallel und
hängen seinen Anfangspunkt an den Endpunkt von a. Der Summenvektor c ist dann der Vektor vom
Anfangspunkt von a zum Endpunkt des verschobenen Vektors b. Dies ist in Abb. 2.14 graphisch
dargestellt.
In kartesischen Koordinaten erfolgt die Addition zweier Vektoren komponentenweise:
 
 
 


bx
ax + b x
cx
ax
 
 
 


c = a + b =  ay  +  by  =  ay + by  =  cy  .
az
bz
az + b z
(2.53)
cz
In der Darstellung mit Einheitsvektoren gilt für die Addition:
c = a + b = axex + ay ey + az ez + bxex + byey + bzez
=
=
(ax + bx )ex + (ay + by )ey + (az + bz )ez
cxex + cyey + cz ez .
Der Nullvektor

0 =

0
 
 0 
0
(2.54)
(2.55)
46
2 Vektoren
ist das neutrale Element der Addition. Das heißt, dass die Addition des Nullvektors zu einem
beliebigen Vektor diesen nicht verändert:
a + 0 = a.
(2.56)
Das inverse Element der Vektoraddition ist:

−ax


 −ay  .
−az

− a
=
(2.57)
Addition eines Vektors und seines inversen Elements ergibt den Nullvektor:
  
ax − ax
0
  

a + (−a) =  ay − ay  =  0  = 0.
az − az
0

(2.58)
Abbildung 2.15: Der Vektor b wird vom Vektor a subtrahiert, indem der inverse Vektor −b zum
Vektor a addiert wird.
Die Subtraktion eines Vektors b vom Vektor a ergibt sich aus der Addition des inversen Elements:

ax − b x


a − b = a + (−b) =  ay − by  .
az − b z

(2.59)
Die Vektorsubtraktion ist in Abb. 2.15 graphisch dargestellt.
Weiters gelten das Kommutativgesetz
a + b = b + a
(2.60)
(a + b) + c = a + (b + c) = a + b + c.
(2.61)
und das Assoziativgesetz
2 Vektoren
2.3.3
47
Multiplikation eines Vektors mit einem Skalar
Die Multiplikation eines Vektors a mit einem Skalar α kann als eine α-fach hintereinander ausgeführte Verschiebung um a aufgefasst werden. Damit kann man sie auf eine wiederholte Addition
zurückführen, z.B.
a + a = 2a,
(2.62)
a + a + a = 3a.
(2.63)
Graphisch (siehe Abb. 2.16) erkennt man, dass dabei die Richtung des Vektors erhalten bleibt, sich
seine Länge jedoch ändert.
Abbildung 2.16: Multiplikation eines Vektors mit einem Skalar (hier ist der Skalar gleich 3).
Während durch die Multiplikation die Richtung des Vektors unverändert bleibt, hat sich seine
Länge um den Faktor 3 verändert.
In kartesischen Koordinaten erfolgt die Multiplikation mit einem Skalar komponentenweise

αax


αa =  αay  .
αaz

(2.64)
Für den Betrag von b = αa gilt:
|b| = |αa| =
(αax )2 + (αay )2 + (αaz )2 = α2 (a2x + a2y + a2z ) = |α||a|.
(2.65)
Die Division eines Vektor durch einen Skalar λ entspricht der Multiplikation des Vektors mit dem
Skalar µ = 1/λ.
Weiters gelten für die Multiplikation eines Vektors mit einem Skalar die Distributivgesetze
α(a + b) = αa + αb
(2.66)
(α + β)a = αa + βa
(2.67)
α(βa) = (αβ)a = αβa.
(2.68)
und
sowie das Assoziativgesetz
48
2.4
2.4.1
2 Vektoren
Skalarprodukt
Deﬁnition
Das Skalarprodukt (innere Produkt) zweier Vektoren a und b ist die Zahl
c = a · b = |a||b| cos α.
(2.69)
Dabei sind |a| und |b| die Beträge von a und b, und α ist der von ihnen eingeschlossene Winkel
(siehe Abb. 2.17). Für das Skalarprodukt verwendet man auch (vor allem in der Quantenmechanik)
die so genannte Bra-und-Ket-Notation a · b oder a|b.
Abbildung 2.17: Das Skalarprodukt von a und b ist c = |a||b| cos α.
Geometrisch betrachtet ist das Skalarprodukt das Produkt des Betrages von a mit dem Betrag des
Anteils von b in Richtung a (siehe Abb. 2.17). (Natürlich könnte man auch sagen: das Skalarprodukt
ist das Produkt des Betrages von b mit dem Betrag des Anteils von a in Richtung b.)
2.4.2
Rechenregeln
Für das Skalarprodukt gelten das Kommutativgesetz
a · b = b · a,
(2.70)
(λa) · b = λ(a · b) = a · (λb) = λa · b,
(2.71)
a · (b + c) = a · b + a · c.
(2.72)
das Assoziativgesetz
und das Distributivgesetz
Im Folgenden werden wir diese Rechenregeln aus der geometrischen Deﬁnition des Skalarproduktes
ableiten. Zunächst halten wir fest, dass die Deﬁnition (2.69) bezüglich einer Vertauschung von a
und b symmetrisch ist, d. h. eine Vertauschung von a und b ändert das Skalarprodukt nicht.
Infolgedessen gilt das Kommutativgesetz:
a · b = b · a.
(2.73)
Weiters beobachten wir, dass die Multiplikation des Vektors a mit einem positiven Skalar λ auf
das Skalarprodukt folgende Wirkung hat (siehe Abb. 2.18a):
(λa) · b = |λa||b| cos α = λ|a||b| cos α.
(2.74)
2 Vektoren
49
Abbildung 2.18: (a) Durch Multiplikation des Vektors a mit einem positiven Skalar λ ändert sich
nur die Länge des Vektors, aber nicht der eingeschlossen Winkel α. (b) Multiplizieren wir a mit
einem negativen Skalar, ändert sich der eingeschlossene Winkel von α auf π − α.
Ist λ negativ, müssen wir berücksichtigen, dass der eingeschlossene Winkel sich von α auf (π − α)
ändert (siehe Abb. 2.18b):
(λa) · b = |λa||b| cos(π − α) = |λ||a||b|(− cos α) = λ|a||b| cos α.
(2.75)
Somit haben wir in beiden Fällen:
(λa) · b = λ(a · b).
(2.76)
Aufgrund der Kommutativität erhalten wir auch
a · (λb) = λ(a · b).
(2.77)
Wir fassen diese Ergebnisse im Assoziativgesetz zusammen:
(αa) · b = α(a · b) = a · (αb) = αa · b.
(2.78)
Abbildung 2.19: Skalarprodukt des Vektors a mit der Summe b + c.
Schließlich betrachten wir das Skalarprodukt eines Vektors a mit der Summe b + c der Vektoren b
und c. Wie man in Abb. 2.19 sehen kann, ist die Projektion d = |b+c| cos α des Summenvektors b+c
auf den Vektor a gleich der Summe der Projektionen b = |b| cos β und c = |c| cos γ der Vektoren
b und c auf den Vektor a. (Dies gilt sowohl in zwei als auch in drei Dimensionen.) Folglich gilt:
a · (b + c)
= |a||b + c| cos α = |a|d = |a|(b + c )
= |a|(|b| cos β + |c| cos γ)
(2.80)
= |a||b| cos β + |a||c| cos γ = a · b + a · c.
(2.81)
(2.79)
Diese Eigenschaft ist das Distributivgesetz:
a · (b + c) = a · b + a · c.
(2.82)
50
2.4.3
2 Vektoren
Komponentenweise Darstellung
In kartesischen Koordinaten ist das Skalarprodukt gegeben durch:
 

ax
bx
 


a · b =  ay  ·  by  = ax bx + ay by + az bz .
az
bz

(2.83)
Durch diese Gleichung besitzen wir eine einfache Vorschrift, um das Skalarprodukt zu berechnen.
Von ihrer Gültigkeit kann man sich leicht in der Darstellung mit Basisvektoren überzeugen:
a · b = (axex + ay ey + az ez ) · (bxex + by ey + bz ez )
= ax bx (ex · ex ) + ax by (ex · ey ) + ax bz (ex · ez )
+ ay bx (ey · ex ) + ay by (ey · ey ) + ay bz (ey · ez )
+ az bx (ez · ex ) + az by (ez · ey ) + az bz (ez · ez ),
(2.84)
wobei wir das Distributivgesetz verwendet haben. Da die Einheitsvektoren ex , ey und ez deﬁnitionsgemäß Länge eins besitzen,
ex · ex = ey · ey = ez · ez = 1,
(2.85)
und aufeinander senkrecht stehen (d.h. cos α = 0),
ei · ej
=
0
für i = j,
(2.86)
gilt
a · b = ax bx + ay by + az bz .
2.4.4
(2.87)
Anwendungen
Das Skalarprodukt ﬁndet vielfältige Verwendung. So können wir beispielsweise den Betrag eines
Vektors a mit Hilfe des Skalarprodukts berechnen:
√
(2.88)
a · a = |a| · |a| cos
α = |a| · |a| ⇒ |a| = a · a.
=1
Mit dem Skalarprodukt können wir Vektoren auf Orthogonalität prüfen. Falls der Vektor a auf
den Vektor b senkrecht steht (d.h., wenn sie orthogonal sind, a ⊥ b), ist der Winkel α ein rechter
Winkel, α = π2 , und cos α = 0. Also gilt:
a · b = |a| · |b| cos α = 0.
(2.89)
Da cos α nur für rechte Winkel verschwindet, haben wir
a · b = 0
⇔
a ⊥ b.
(2.90)
Beispiel:

 

1
4
  

 6  ·  2  = 4 + 12 − 16 = 0.
4
−4
(2.91)
2 Vektoren
51
Man kann das Skalarprodukt auch dazu verwenden, um den Winkel zwischen zwei Vektoren a und
b zu bestimmen. Aus
a · b
=
|a||b| cos α
folgt nämlich
α =
arccos
a · b
|a| · |b|
(2.92)
.
(2.93)
Der Winkel zwischen der Koordinatenachse mit Einheitsvektor ei und einem Vektor a ist
cos αi =
ai
a · ei
=
.
|a|
|a|
(2.94)
Dabei ist ai die Komponente des Vektors a in Richtung des Einheitsvektors ei .
Ferner gilt:
cos2 αx + cos2 αy + cos2 αz = 1,
(2.95)
wobei αx , αy und αz die Winkel sind, die der Vektor a mit der x-, y- und z-Achse einschließt.
Wegen | cos ϕ| ≤ 1 ergibt sich aus der Deﬁnition des Skalarpodukts die Cauchy-Schwarzsche
Ungleichung:
|a · b| ≤ |a||b|.
(2.96)
Das Gleichheitszeichen gilt bei Parallelität beziehungsweise Antiparallelität, da in diesem Fall
| cos α| = 1.
Abbildung 2.20: Der Kosinussatz c2 = a2 + b2 − 2ab cos α setzt die Seiten eines Dreiecks mit einem
der Winkel in Beziehung.
Mit Hilfe des Skalarprodukts können wir auch den so genannten Kosinussatz herleiten. Betrachten
wir dazu das Dreieck, das von den Vektoren a, b, und c = a − b begrenzt wird (siehe Abb. 2.20).
Das Skalarprodukt von c mit sich selbst ergibt |c|2 = c ·c = (a −b)·(a −b) = a ·a − 2a ·b +b ·b. Unter
Verwendung der Schreibweise a = |a|, b = |b| und c = |c| lässt sich der Kosinussatz ausdrücken als:
c2 = a2 + b2 − 2ab cos α.
(2.97)
Für ein rechtwinkliges Dreieck, also α = π/2, ist das der Pythagoräische Lehrsatz.
Wir wollen nun die Projektion eines Vektors auf einen anderen näher betrachten. In Abb. 2.21
ist ba die Projektion des Vektors b auf den Vektor a. Man kann ba auch als die Komponente von b
in Richtung von a auﬀassen.
Für den Betrag der Projektion gilt
|ba | = |b| cos ϕ.
(2.98)
Wegen a · b = |a||b| cos ϕ haben wir cos ϕ = (a · b)/(|a||b|) und somit
a · b
|ba | =
= ea · b.
|a|
(2.99)
52
2 Vektoren
Abbildung 2.21: Projektion ba des Vektors b auf den Vektor a.
Da ba die selbe Richtung hat wie a, muss gelten:
ba
=
=
a
|ba |ea = |ba |
|a|
a · b
· a.
|a|2
(2.100)
Abbildung 2.22: Die Kraft F leistet durch Verschiebung eines Objektes um den Vektor s die Arbeit
W = F · s.
Eine Anwendung, in dem die Projektion eines Vektors auf einen anderen benötigt wird, ist die
Berechnung der entlang eines geradlinigen Weges s durch die konstante Kraft F geleisteten Arbeit
(siehe Abb. 2.22). Da nur die Kraftkomponente Fs in Richtung des Verschiebungsvektors Arbeit
leistet, gilt
W = |Fs ||s|.
(2.101)
Hier haben wir die aus der Mechanik bekannte Beziehung Arbeit = Kraft × Weg (oder genauer:
Arbeit = Kraftkomponente in Wegrichtung × zurückgelegtem Weg) verwendet. Der Vektor Fs ist
die Projektion der Kraft F auf den Verschiebungsvektor s. Unter Verwendung der obigen Formeln
für den Betrag der Projektion erhalten wir
F · s
· |s| = F · s.
W = |Fs ||s| =
|s|
(2.102)
Beispiel:
Ein Massenpunkt wird von einer konstanten Kraft F = (−10N, 2N, 5N) von P1 = (0m, −1m, −4m)
nach P2 = (−1m, 5m, −3m) verschoben. Wir messen hier Abstände in Metern (m) und Kräfte in
Newton (N). Welche Arbeit wird dabei verrichtet und wie groß ist der Winkel zwischen F und dem
Verschiebungsvektor?
2 Vektoren
53
Der Massenpunkt wird um den Vektor

 
 

−1m
0m
−1m
−−−→ 
 
 

s = P1 P2 =  5m  −  −1m  =  6m 
−3m
−4m
1m
verschoben. Dadurch leistet die Kraft die Arbeit

 

−1m
−10N

 

W = F · s = 
2N  ·  6m  = (10 + 12 + 5)Nm = 27Nm.
(2.103)
(2.104)
1m
5N
Die Beträge der Verschiebung und der Kraft sind
√
|s| = 38m
und
|F | =
√
129N,
(2.105)
sodass der Winkel zwischen Kraft und Verschiebungsvektor gegeben ist durch:
ϕ = arccos
2.5
2.5.1
F · s
27Nm
= arccos 0.386 = 67.32◦ .
= arccos √
129 · 38Nm
|F ||s|
(2.106)
Vektorprodukt
Deﬁnition
Das äußere Produkt (auch Kreuzprodukt oder Vektorprodukt) zweier Vektoren a und b,
geschrieben als
c = a × b,
(2.107)
|c| = |a||b| sin α,
(2.108)
ist ein Vektor mit Betrag
wobei α der von den Vektoren a und b eingeschlossene Winkel ist. Der Vektor c ist orthogonal
sowohl zu a als auch zu b und zwar so, dass a, b und c ein Rechtssystem bilden (siehe Abb. 2.23).
Abbildung 2.23: Das Vektorprodukt c = a×b
steht sowohl auf a als auch auf b senkrecht.
Zusammen bilden die Vektoren ein Rechtssystem.
Abbildung 2.24: Die “rechte-Hand-Regel” ist
eine Merkhilfe für die Richtung des äußeren
Vektorprodukts.
54
2 Vektoren
Abbildung 2.25: Die “gekrümmte-HandRegel”.
Abbildung 2.26: Die Schraubenregel.
In einem Rechtssystem stehen die Vektoren a, b, c zueinander wie Daumen, Zeigeﬁnger und Mittelﬁnger der gespreizten rechten Hand (rechte-Hand-Regel, siehe Abb. 2.24). Als Alternative dazu
können Sie sich die gekrümmte rechte Hand vorstellen. Wenn die gekrümmten Finger in die Richtung weisen, in der man a am schnellsten in b überführen kann, zeigt der Daumen in Richtung
c = a × b (siehe Abb. 2.25). Sie können sich auch eine Schraube vorstellen, mit der Sie a nach b
drehen (siehe Abb. 2.26). Dann bewegt sich die Schraube in Richtung von c = a × b.
Als dreidimensionales kartesisches Koordinatensystem wird meistens ein Rechtssystem verwendet. Ein Linkssystem wird analog deﬁniert. Vertauschen von a und b macht ein Rechtssystem zu
einem Linkssystem.
Abbildung 2.27: Der Betrag des Vektorprodukts a × b ist gleich der Fläche des von den Vektoren
a und b aufgespannten Parallelogramms.
Anschaulich lässt sich der Betrag des Vektorprodukts a × b als die Fläche des von den Vektoren a
und b aufgespannten Parallelogramms betrachten (siehe Abb. 2.27):
A
= |a|h
= |a||b| sin α
= |a × b|.
(2.109)
Wir können somit das Vektorprodukt verwenden, um die Fläche des Parallelogramms zu berechnen,
das von zwei Vektoren aufgespannt wird.
2.5.2
Rechenregeln
Für das Vektorprodukt gelten die folgenden Rechenregeln:
• Im Unterschied zum Skalarprodukt ist das Vektorprodukt nicht kommutativ. Das heißt, dass
es beim Vektorprodukt auf die Reihenfolge ankommt. Anschaulich ist das klar, denn wenn
die Vektoren a, b und a × b ein Rechtssystem bilden, dann müssen die Vektoren a, b und b ×a
2 Vektoren
55
ein Linkssystem bilden (siehe Abb. 2.28). Bei Vertauschung der Multiplikanden weist das
Vektorprodukt also in die entgegengesetzte Richtung. Es gilt das Antikommutativgesetz:
a × b = −(b × a).
(2.110)
• Assoziativgesetz für Multiplikation mit einem Skalar λ:
(λa) × b = λ(a × b) = a × (λb) = λa × b.
(2.111)
a × (b + c) = a × b + a × c.
(2.112)
• Distributivgesetz:
Wir wollen diese Rechenregeln nun aus der Deﬁnition des Vektorprodukts ableiten. Das Antikommutativgesetz a × b = −(b × a) folgt direkt aus der “rechten-Hand-Regel”: durch Vertauschen von
a und b kehrt sich die Richtung des Vektorprodukts einfach um.
Betrachten wir nun, was passiert, wenn wir einen der beiden Vektoren, sagen wir a, mit einer
positiven Zahl λ multiplizieren (siehe Abb. 2.29). Da sich durch Multiplikation mit λ die Länge der
Grundlinie um einen Faktor λ ändert, erhalten wir für die Fläche A des von b und λa aufgespannten
Parallelogramms:
A = |λa||b| sin α = λ|a||b| sin α = λA.
(2.113)
Hier ist A die Fläche des von a und b aufgespannten Parallelogramms. Das heißt,
|(λa) × b| = λ|a × b| = |λ(a × b)|.
(2.114)
Da a und λa die selbe Richtung haben, sind (λa)×b und a ×b und somit auch λ(a ×b) parallel. Der
Vektor (λa) × b stimmt also sowohl im Betrag als auch in der Richtung mit dem Vektor λ(a × b)
überein. Diese beiden Vektoren sind deshalb gleich:
(λa) × b = λ(a × b).
(2.115)
Falls λ negativ ist, müssen wir berücksichtigen, dass λa und a zueinander antiparallel sind und
deshalb der Winkel zwischen λa und b zu π − α wird (siehe Abb. 2.30). In diesem Fall ist die Fläche
A gegeben durch:
A = |λa||b| sin(π − α) = |λ||a||b| sin α = |λ|A.
(2.116)
Das heißt,
|(λa) × b| = |λ||a × b| = |λ(a × b)|.
(2.117)
Aus der rechten-Hand-Regel folgt nun, dass (λa) × b und a × b antiparallel sind. Somit hat (λa) × b
jedoch die selbe Richtung wie λ(a × b) (vergessen wir nicht, dass wir gerade den Fall λ < 0
Abbildung 2.28: Während die Vektoren a, b und a ×b ein Rechtssystem bilden, spannen die Vektoren
a, b und b × a ein Linkssystem auf.
56
2 Vektoren
Abbildung 2.29: Durch Multiplikation des Vektors a mit dem positiven Skalar λ ändert sich die
Grundlinie des aufgespannten Parallelogramms um den Faktor λ.
betrachten). Der Vektor (λa) × b stimmt auch in diesem Fall mit dem Vektor λ(a × b) sowohl in
Länge als auch im Betrag überein, sodass allgemein gilt:
(λa) × b = λ(a × b).
(2.118)
a × (λb) = λ(a × b)
(2.119)
(λa) × b = a × (λb) = λ(a × b).
(2.120)
Analoge Überlegungen führen auf
und wir können schreiben:
Es bleibt uns noch zu zeigen, dass a × (b + c) = a × b + a × c. Um dies zu tun, wollen wir die
Komponenten von a × (b + c) sowie von a × b und a × c explizit bestimmen. Wir wählen dazu ein
Koordinatensystem, dessen z-Achse in Richtung des Vektors a zeigt, das heißt


0


(2.121)
a =  0  .
az
Die Vektoren b = (bx , by , bz ) und c = (cx , cy , cz ) sind jedoch beliebig. Durch die spezielle Wahl des
Koordinatensystems schränken wir die Gültigkeit der nachfolgenden Überlegungen nicht ein.
Wir deﬁnieren nun den neuen Vektor b = (bx , by , 0), den wir aus b erhalten, indem wir dessen
z-Komponente durch 0 ersetzen. Der Vektor b ist die Projektion von b in die xy-Ebene. Wie
Abbildung 2.30: Durch Multiplikation des Vektors a mit dem negativen Skalar λ ändert sich der
eingeschlossene Winkel von α auf π − α.
2 Vektoren
57
Abbildung 2.31: Die von a und b sowie von a und b aufgespannten Parallelogramme haben den
selben Flächeninhalt.
aus Abb. 2.31 ersichtlich ist, haben die Parallelogramme, welche von a und b sowie von a und b
aufgespannt werden, den selben Flächeninhalt. Beide besitzen nämlich die selbe Grundlinie, |a|,
und die selbe Höhe, |b| sin α = |b |. Somit gilt
|a × b| = |a × b |.
(2.122)
Der Vektor a × b, der in der xy-Ebene liegt, steht normal sowohl auf b als auch auf b . Da auch
a × b auf b normal steht und in der xy-Ebene liegt, bedeutet dies, dass a × b und a × b die selbe
Richtung haben. Da sie auch im Betrag übereinstimmen (siehe Gleichung (2.122)), sind sie gleich:
a × b = a × b .
(2.123)
Zum Vektor b = (bx , by , 0) bilden wir nun den Vektor b = (−by , bx , 0). Durch Bildung des Skalarprodukts können wir leicht feststellen, dass der Vektor b sowohl auf a als auch auf b normal
steht. Aus der rechten-Hand-Regel folgt, dass b genau die Richtung von a × b und somit auch
von a × b besitzt. Wenn wir nun den Vektor b mit |a| multiplizieren, erhalten wir einen Vektor,
der sowohl in der Richtung als auch im Betrag mit a × b übereinstimmt:
|(−|a|by , |a|bx , 0)| = |a||b | = |a × b | = |a × b|.
(2.124)

−|a|by


a × b =  |a|bx  .
0
(2.125)

−|a|cy


a × c =  |a|cx 
0
(2.126)

−|a|(by + cy )


a × (b + c) =  |a|(bx + cx )  .
0
(2.127)
Somit gilt:

Analoge Überlegungen führen auf

und

58
2 Vektoren
Durch komponentenweisen Vergleich der Vektoren erhalten wir das Distributivgesetz für das Vektorprodukt:
 
 

−|a|cy
−|a|(by + cy )
−|a|cy
 
 


a × (b + c) =  |a|(bx + cx )  =  |a|cx  +  |a|cx  = a × b + a × c.
0
0
0

2.5.3
(2.128)
Komponentenweise Darstellung
In kartesischen Koordinaten kann das Vektorprodukt komponentenweise ausgedrückt werden als:
 
 

ax
bx
ay b z − az b y
 
 


a × b =  ay  ×  by  =  az bx − ax bz  .
az
bz
ax b y − ay b x

(2.129)
Dies kann man sich klar machen, indem man a und b mit Hilfe der Einheitsvektoren darstellt und
das Distributivgesetz ausnutzt:
a × b = (axex + ay ey + az ez ) × (bxex + by ey + bz ez )
= ax bx (ex × ex ) + ax by (ex × ey ) + ax bz (ex × ez )
+ ay bx (ey × ex ) + ay by (ey × ey ) + ay bz (ey × ez )
+ az bx (ez × ex ) + az by (ez × ey ) + az bz (ez × ez ).
(2.130)
Da
ei × ei = 0
(der Vektor ei ist parallel zu sich selbst)
(2.131)
und die Einheitsvektoren ex , ey und ez ein Rechtssystem bilden und somit gilt
ex × ey = ez ,
ey × ez = ex ,
ey × ex = −ez ,
ez × ey = −ex ,
(2.132)
(2.133)
ez × ex = ey ,
ex × ez = −ey ,
(2.134)
erhalten wir schließlich
a × b = ax byez − ax bz ey − ay bxez + ay bzex + az bxey − az byex
= (ay bz − az by )ex + (az bx − ax bz )ey + (ax by − ay bx )ez ,
(2.135)
was genau der komponentenweisen Darstellung entspricht, die wir weiter oben angeführt haben.
Leichter merken kann man sich die Bildung des Kreuzprodukts folgendermaßen: Zur Berechnung
der x-Komponente decken wir auf der linken Seite der Gleichung
 
 

bx
ay b z − az b y
ax
 
 


 ay  ×  b y  =  az b x − ax b z 
az
bz
ax b y − ay b x

(2.136)
zunächst die x-Zeile ab und multiplizieren kreuzweise: (links oben × rechts unten) minus (links
unten × rechts oben). Für die y-Komponente des Kreuzprodukts gehen wir analog vor und decken
die y-Zeile ab und berechnen wieder (links oben × rechts unten) minus (links unten × rechts oben),
wobei wir uns aber das gesamte Schema nach unten durch Kopien der oberen beiden Zeilen ergänzt
denken. Für die z-Komponente decken wir schließlich die z-Zeile ab und verfahren analog.
2 Vektoren
2.5.4
59
Anwendungen
Durch Berechnung des Vektorprodukts kann man prüfen, ob zwei Vektoren parallel zueinander
sind. Wenn a parallel zu b ist (und infolgedessen der eingeschlossene Winkel α verschwindet oder
π beträgt), ist sin α = 0 und das Vektorprodukt verschwindet:
a × b = 0
⇔
a||b.
(2.137)
Eine weitere wichtige Anwendung des Vektorprodukts besteht in der Konstruktion eines Vektors,
der auf zwei gegebene Vektoren a und b normal stehen soll.
Beispiel:


1
 
a =  2 
3


3

b = 
 4 
5

   
 

1
3
2·5−3·4
−2

   
 

c = a × b =  2  ×  4  =  3 · 3 − 1 · 5  =  4 
3
5
1·4−2·3
−2
√
√
|a| = 1 + 4 + 9 = 14
√
√
|b| = 9 + 16 + 25 = 50
√
√
|a × b| = 4 + 16 + 4 = 24.
Den Winkel zwischen a und b bestimmen wir folgendermaßen:
√
24
|a × b|
= 0.185 . . .
sin α =
=√
50 · 14
|a||b|
α = 10.67◦.
(2.138)
(2.139)
(2.140)
(2.141)
(2.142)
(2.143)
(2.144)
Haben wir richtig gerechnet, sollten a und b zu a × b orthogonal stehen, was wir durch Berechnung
der entsprechenden Skalarprodukte prüfen können:
  

1
−2
  

(2.145)
c · a =  4  ·  2  = −2 + 8 − 6 = 0,
−2
3

3
−2

 

c · b =  4  ·  4  = −6 + 16 − 10 = 0.
5
−2

2.6
2.6.1
 
(2.146)
Spatprodukt
Deﬁnition
Das Spatprodukt (oder gemischtes Produkt) dreier Vektoren a, b und c ist ein Skalar und ist
deﬁniert als
[abc] = (a × b) · c.
(2.147)
Anschaulich ist das Spatprodukt (genauer gesagt der Betrag des Spatprodukts) das Volumen des
von den drei Vektoren a, b und c aufgespannten Parallelepipeds, das auch Parallelﬂach oder
Spat genannt wird (siehe Abb. 2.32).
60
2 Vektoren
Abbildung 2.32: Das Spatprodukt
Die geometrische Interpretation des Spatprodukts ergibt sich aus folgender Überlegung. Das Volumen V des von den drei Vektoren aufgespannten Parallelepipeds ist gegeben durch
V = A h,
(2.148)
wobei A die Fläche des von a und b aufgespannten Parallelogramms und h die in Abb. 2.32
dargestellte Höhe des Parallelepipeds ist. Die Fläche A erhalten wir aus dem Vektorprodukt von a
und b,
A = |a||b| sin α = |a × b|.
(2.149)
Die Höhe h erhalten wir durch Projektion des Vektors c auf a × b:
h = |c|| cos β|.
(2.150)
Die Betragsstriche garantieren dabei, dass die Höhe nicht negativ wird. Einsetzen ergibt schließlich
V = A · h = |a × b||c|| cos β| = |(a × b) · c|.
2.6.2
(2.151)
Komponentenweise Darstellung
Das Spatprodukt kann mit Hilfe der Komponenten von a, b und c ausgedrückt werden:

 
 

ax
bx
cx

 
 

(a × b) · c =  ay  ×  by  ·  cy 
az
bz
cz
 


cx
ay b z − az b y
 


=  a z b x − a x b z  ·  cy 
ax b y − ay b x
=
2.6.3
cz
cx (ay bz − az by ) + cy (az bx − ax bz ) + cz (ax by − ay bx ).
(2.152)
Rechenregeln und Anwendung
• Durch die Nichtkommutativität des Kreuzprodukts ist das Spatprodukt nicht kommutativ.
Das Vertauschen von zwei Vektoren ändert das Vorzeichen des Spatprodukts:
[ abc ] = −[ bac ].
(2.153)
• Vektoren können zyklisch vertauscht werden, ohne das Spatprodukt zu ändern:
[ abc ] = [ bca ] = [ cab ],
(a × b) · c = (b × c) · a = (c × a) · b.
(2.154)
(2.155)
2 Vektoren
61
• Aus a · b = b · a und der zyklischen Vertauschbarkeit folgt außerdem:
(a × b) · c = a · (b × c).
• Das Spatprodukt kann als Determinante dargestellt werden:
!
!
!a a a !
y
z!
! x
!
!
[ abc ] = ! bx by bz ! .
!
!
!c
c
c !
x
y
(2.156)
(2.157)
z
• Das Spatprodukt verschwindet, wenn die Vektoren a und b × c zueinander orthogonal sind.
Das ist der Fall, wenn alle Vektoren in der selben Ebene liegen, d.h. wenn sie komplanar
sind:
[ abc ] = 0
2.7
⇔
a, b, c komplanar.
(2.158)
Mehrfachprodukte
Für Mehrfachprodukte gelten folgende Rechenregeln:
• Doppeltes Kreuzprodukt (bac-cab Regel)
a × (b × c) = b(a · c) − c(a · b).
(2.159)
• Kreuzprodukt von zwei Kreuzprodukten
= c[(a × b) · d]
− d[(
a × b) · c]
(a × b) × (c × d)
· a] − a[(c × d)
· b].
= b[(c × d)
(2.160)
• Skalarprodukt von zwei Kreuzprodukten
= a · (b × (c × d))
(a × b) · (c × d)
− (a · d)(
b · c).
= (a · c)(b · d)
(2.161)
• Quadrat eines Kreuzprodukts
(a × b)2 = |a|2 |b|2 − (a · b)2 .
2.8
2.8.1
(2.162)
Anwendungsbeispiele für Vektoren
Strömung durch eine Fläche
Stellen wir uns eine Flüssigkeit vor, die mit gleichförmiger Geschwindigkeit v strömt (siehe Abb.
2.33). In der Flüssigkeit denken wir uns eine ebene Fläche mit beliebigem Umriss und einem
Flächeninhalt f . Wir wollen nun den Fluss durch diese imaginäre Fläche berechnen.
Unter dem Fluss verstehen wir das pro Zeiteinheit durch die Fläche hindurch tretende Flüssigkeitsvolumen. Ist die Fläche parallel zur Flussrichtung, tritt keine Flüssigkeit hindurch. In jeder anderen
Orientierung tritt Flüssigkeit hindurch. Die Orientierung der Fläche spielt also eine wesentliche
62
2 Vektoren
Abbildung 2.33: Strömung durch eine Fläche mit Flächenvektor f.
Rolle und es genügt nicht, nur den Flächeninhalt anzugeben. Wir führen daher den Flächenvektor
f ein, der neben dem Flächeninhalt von f auch die Orientierung der Fläche im Raum beschreibt:
f
|f| = f
ist orthogonal zur Fläche,
der Betrag von f ist gleich dem Flächeninhalt.
Zur Berechnung des Flusses betrachten wir nun alle Teilchen, die sich zum Zeitpunkt 0 in der
imaginären Fläche beﬁnden. Nach einer Zeit t haben sich alle diese Teilchen um die Distanz
v t
(2.163)
weiterbewegt. Sie liegen jetzt auf einer Fläche, die gleich ist der um v t parallel verschobenen
ursprünglichen Fläche. Alle Flüssigkeitsteilchen, die in der Zeit t durch die Fläche hindurch getreten
sind, beﬁnden sich in einem schiefen Zylinder. Das Volumen des Zylinders ist Grundﬂäche f mal
Höhe h:
V = f h.
Um die Höhe h zu bestimmen, berechnen wir die Projektion von v t auf f
f
.
h = (v t)f = v t ·
f
(2.164)
(2.165)
Das Volumen ist deshalb
V = tf
v · f
= tv · f.
f
(2.166)
Der Fluss ist gleich dem Volumen V pro Zeit t und wir erhalten schließlich
Fluss =
V
= v · f.
t
(2.167)
Der Fluss ist also gegeben durch das Skalarprodukt von v und f.
2.8.2
Rotation eines Körpers
Um die Rotation eines Körpers um eine Achse zu beschreiben, verwenden wir die Winkelgeschwindigkeit ω. Sie gibt den Winkel in Bogenmaß an, um den sich der Körper pro Zeiteinheit
2 Vektoren
63
dreht. Um auch die Richtung der Drehachse zu berücksichtigen, führen wir den Winkelgeschwindigkeitsvektor ω ein:
ω
|
ω| = ω
ist parallel zur Rotationsachse,
der Betrag ist gleich der Winkelgeschwindigkeit.
Die Richtung von ω ist so gewählt, dass von der Spitze von ω aus gesehen die Rotation in positiver
Richtung, also gegen den Uhrzeigersinn, erfolgt (siehe Abb. 2.34). Wenn die gekrümmten Finger
der rechten Hand also der Rotation folgen, zeigt der Daumen in Richtung von ω
(siehe Abb. 2.25).
Abbildung 2.34: Die Winkelgeschwindigkeit ω ist so deﬁniert, dass von der Spitze aus gesehen die
Rotation gegen den Uhrzeigersinn erfolgt.
Nun wollen wir den Winkelgeschwindigkeitsvektor ω benutzen, um die Momentangeschwindigkeit
eines Punktes auf einem rotierenden Körper zu ermitteln. Der Punkt bewegt sich dabei auf einer
Kreisbahn mit dem Radius r (siehe Abb. 2.35). Der pro Zeiteinheit zurückgelegte Winkel ist ω.
Daher ist die pro Zeiteinheit zurückgelegte Strecke, also die Geschwindigkeit
v = ωr.
(2.168)
Zur Berechnung von v müssen wir den Radius r bestimmen. Zudem müssen wir beachten, dass v
parallel zur Tangente an die Kreisbahn sein muss.
Abbildung 2.35: Rotation eines Körpers um eine Achse.
All dies lässt sich durch Verwendung des Vektorprodukts sehr einfach erreichen. Es sei x ein
Vektor von einem beliebigen Punkt auf der Drehachse zu jenem Punkt, dessen Geschwindigkeit v
wir bestimmen möchten. Der Betrag v = |v | ist dann gegeben durch:
v = ωr = ω · |x| · sin α = |ω × x|.
(2.169)
Weiters ist ω ×x sowohl zu ω als auch zu x orthogonal, sodass die Geschwindigkeit auch die richtige
Richtung hat. Mit der rechten-Hand-Regel sieht man leicht, dass der Vektor
v = ω × x
auch die richtige Orientierung hat.
(2.170)
64
2.8.3
2 Vektoren
Volumen einer Einheitszelle
Abbildung 2.36: Einheitszelle eines triklinen Kristalls.
Gegeben sei die Einheitszelle eines Kristalls, die von den Vektoren a, b und c aufgespannt wird. Die
Längen der Vektoren sind a = 3Å, b = 2Å, und c=2Å. (Die Längeneinheit Ångström, abgekürzt als
Å, ist im atomaren Bereich gebräuchlich. Es gilt 1Å=10−10 m.) Der Winkel zwischen den Vektoren
ist jeweils 60◦ . Wie groß ist das Volumen der Einheitszelle?
Wir wählen zunächst ein kartesisches Koordinatensystem, in dem die x-Achse parallel zum Vektor
a ist und die y-Achse so orientiert ist, dass der Vektor b in der xy-Ebene liegt (wir können das
Koordinatensystem so orientieren, wie wir wollen). Dann ist
a = (3Å, 0, 0)
und
√
√
b = (2 cos α, 2 sin α, 0) = (2 1 Å, 2 3 Å, 0) = (1Å, 3Å, 0).
2
2
(2.171)
(2.172)
Abbildung 2.37: Einheitszelle dargestellt in einem geeigneten kartesischen Koordinatensystem.
Um c zu ﬁnden, beachten wir, dass
ac
2
= 3Å ,
2
b · c = bc cos 60◦ = bc = 2Å2 .
2
a · c = ac cos 60◦ =
(2.173)
(2.174)
2 Vektoren
65
Einsetzen ergibt

 
3Å
cx
2


 
 0  ·  cy  = 3cx Å = 3Å
cz
0

(2.175)
und somit
cx = 1Å.
(2.176)
Weiteres Einsetzen ergibt
 


1Å
cx
√
√
2
2
 
 √

 3Å  ·  cy  = cx Å + 3cy Å = 1Å + 3Åcy = 2Å ,
0
cz
(2.177)
woraus folgt
1
cy = √ Å.
3
(2.178)
Da der Betrag von c bekannt ist, können wir schreiben
2
c2z + c2x + c2y = 4Å .
(2.179)
Daraus können wir die z-Komponente des Vektors c bestimmen:
c2z
"
1 2
8 2
= 4Å − 1Å − Å = Å
3
3
2
2
⇒
cz =
8
Å.
3
(2.180)
Wir erhalten schließlich für den Vektor c:


1
 1 
√

c = 
 3  Å.
(2.181)
8
3
Aus den nun explizit bekannten Vektoren a, b und c können wir mit Hilfe des Spatprodukts das
Volumen der Einheitszelle des Kristalls berechnen:

 
 

1
3
1
  √   √1 

 3
V = (a × b) · c =  0  ×  3  · 
 3  Å
0
 
1
0
 

√1
 0 ·
 3
√
8
3 3
3

=
0

8
3
√
 3
 Å = 3 8Å3 .

(2.182)
66
2 Vektoren
Kapitel 3
Diﬀerentiation
3.1
Grundbegriﬀe
Betrachten wir ein Objekt (z.B. ein Fahrzeug), das sich gleichförmig fortbewegt. Die Geschwindigkeit ist in diesem Fall durch die pro Zeit zurückgelegte Strecke deﬁniert:
v=
∆s
s2 − s1
.
=
t2 − t1
∆t
(3.1)
Hier ist ∆s = (s2 − s1 ) die im Zeitintervall ∆t = (t2 − t1 ) zurückgelegte Strecke. Bei gleichförmiger Bewegung könnten wir die Zeiten t2 und t1 beliebig wählen und wir würden immer dasselbe
Resultat für die Geschwindigkeit v erhalten. Wenn wir die gleichförmige Bewegung in einem Raumzeitdiagramm graphisch darstellen, indem wir die zurückgelegte Entfernung s als Funktion der Zeit
t auftragen, erhalten wir eine Gerade, dessen Steigung die Geschwindigkeit ist (siehe Abb. 3.1).
Abbildung 3.1: Raumzeitdiagramm für ein Objekt, das sich gleichförmig, das heißt mit konstanter
Geschwindigkeit, fortbewegt.
Bei einer ungleichförmigen Bewegung ist dies jedoch anders. In diesem Fall hängt der Quotient
(s2 −s1 )/(t2 −t1 ) sehr wohl vom gewählten Intervall [t1 , t2 ] ab. (s2 −s1 )/(t2 −t1 ) ist in diesem Fall die
mittlere Geschwindigkeit im Zeitintervall [t1 , t2 ]. In der graphischen Darstellung der Entfernung
als Funktion der Zeit erhalten wir in diesem Fall eine gekrümmte Kurve, die in Abb. 3.2 beispielhaft
dargestellt ist. Die mittlere Geschwindigkeit (s2 − s1 )/(t2 − t1 ) ist die Steigung der Sekante, die
durch die Punkte (t1 , s1 ) und (t2 , s2 ) geht. Wie aus der Abbildung ersichtlich ist, würde ein anders
67
68
3 Diﬀerentiation
gewähltes Zeitintervall, sagen wir [t1 , t2 ], eine andere Steigung der Sekante und somit eine andere
mittlere Geschwindigkeit, nämlich (s2 − s1 )/(t2 − t1 ), ergeben.
Abbildung 3.2: Raumzeitdiagramm für ein Objekt, das sich ungleichförmig, das heißt mit einer
sich verändernden Geschwindigkeit, fortbewegt.
Die Momentangeschwindigkeit v des Objekts zu einem bestimmten Zeitpunkt t (also die Geschwindigkeit, die man etwa vom Tachometer eines Autos ablesen würde) erhalten wir, indem wir
zu sehr kleinen Zeitintervallen ∆t übergehen:
v = lim
∆t→0
∆s
.
∆t
(3.2)
In diesem Grenzfall wird aus der Sekante in Abb. 3.2 die Tangente an die Raumzeitkurve und die
Geschwindgkeit v(t), die nun von der Zeit t abhängt, ist die Steigung dieser Tangente (siehe Abb.
3.3). Man nennt v(t) auch die Ableitung von s(t) an der Stelle t.
Abbildung 3.3: Im Grenzfall eines unendlich kleinen Zeitintervalls wird aus der Sekante aus Abb.
3.2 die Tangente der Kurve. Die Steigung der Tangente der Raum-Zeit-Kurve zur Zeit t ist die
Geschwindigkeit des Objekts zur Zeit t .
Um nach diesem anschaulichen Beispiel den Begriﬀ der Ableitung formaler einzuführen, betrachten
wir zunächst den Diﬀerenzenquotienten. Der Diﬀerenzenquotient m für eine Funktion y = f (x)
ist der Quotient aus der Diﬀerenz der Funktionswerte y1 = f (x1 ) und y2 = f (x2 ) und der Diﬀerenz
der Argumente an den Stellen x1 und x2 :
m=
y2 − y1
f (x1 + ∆x) − f (x1 )
∆y
=
.
=
∆x
x2 − x1
∆x
(3.3)
3 Diﬀerentiation
69
Abbildung 3.4: Der Diﬀerenzenquotient m = ∆y/∆x ist die Steigung der Sekante durch die Punkte
(x1 , f (x1 )) und (x2 , f (x2 )).
Dabei ist ∆y = y2 − y1 und ∆x = x2 − x1 . Der Diﬀerenzenquotient ist die Steigung der Sekante
durch die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) (siehe Abb. 3.4).
Beispiel: Der Diﬀerenzenquotient der Funktion
f (x)
= 2x3 + 4x2 − 1
(3.4)
ist:
m(x)
=
=
=
=
f (x + ∆x) − f (x)
∆x
2(x + ∆x)3 + 4(x + ∆x)2 − 1 − 2x3 − 4x2 + 1
∆x
2(x3 + 3x2 ∆x + 3x∆x2 + ∆x3 ) + 4(x2 + 2x∆x + ∆x2 ) − 1 − 2x3 − 4x2 + 1
∆x
(6x2 + 6x∆x + 2∆x2 + 8x + 4∆x).
(3.5)
Wenn wir nun zum Grenzfall unendlich kleiner Diﬀerenzen übergehen, wird aus dem Diﬀerenzenquotienten der Diﬀerentialquotient (wir lassen ∆x gegen 0 gehen):
f (x) =
df (x)
∆f (x)
f (x + ∆x) − f (x)
= lim
= lim
.
∆x→0 ∆x
∆x→0
dx
∆x
(3.6)
Die Notationen f (x) und df (x)/dx sind äquivalent und bezeichnen beide den Diﬀerentialquotienten. Der Diﬀerentialquotient f (x) wird auch die Ableitung von f (x) nach x genannt. Anschaulich
ist der Diﬀerentialquotient f (x) die Steigung der Tangente an den Funktionsgraphen der Funktion f (x) an der Stelle x. Verläuft der Funktionsgraph steil, ist der Diﬀerentialquotient (oder die
Ableitung) groß, für eine ﬂache Kurve ist er klein. Da sich die Steigung des Funktionsgraphen von
Ort zu Ort im Allgemeinen ändert, ist - so wie die Funktion f (x) selbst - auch ihre Ableitung f (x)
von x abhängig.
Das Diﬀerential df der Funktion f (x) ist deﬁniert als:
df (x) = f (x)dx.
(3.7)
Das Diﬀerential kann betrachtet werden als die inﬁnitesimale Änderung df der Funktion f (x),
welche durch eine inﬁnitesimale Änderung dx des Arguments x hervorgerufen wird.
Wenn die unabhängige Variable die Zeit ist, verwendet man für die 1. Ableitung auch folgende
Notation mit einem Punkt:
dx(t)
.
(3.8)
ẋ(t) =
dt
70
3 Diﬀerentiation
Diese Notation ist vor allem in der klassischen Mechanik gebräuchlich.
Wir wollen nun für das obige Beispiel den Grenzübergang ∆x → 0 durchführen und den Diﬀerentialquotienten f (x) explizit berechnen. Dazu gehen wir vom Ausdruck für den Diﬀerenzenquotienten aus:
∆f (x)
∆x
=
(6x2 + 6x∆x + 2∆x2 + 8x + 4∆x).
(3.9)
Alle Terme, die ∆x enthalten, verschwinden bei diesem Grenzübergang und wir erhalten:
df
dx
∆f (x)
= lim (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x)
∆x→0
∆x
= 6x + 8x.
=
lim
∆x→0
2
(3.10)
Durch ähnliche Überlegungen lassen sich Diﬀerentiationsregeln für die wichtigsten Funktionen ableiten, die wir im nächsten Abschnitt kurz und ohne Herleitung behandeln.
3.2
Diﬀerenzierbarkeit
Eine Funktion f (x) nennt man an der Stelle x diﬀerenzierbar, falls an dieser Stelle die Ableitung
f (x) existiert. Die Funktion ist in einem Intervall stetig diﬀerenzierbar, falls ihre Ableitung in
diesem Intervall stetig ist. Ist eine Funktion an der Stelle x diﬀerenzierbar, ist sie dort auch stetig.
Hingegen muss eine stetige Funktion nicht überall diﬀerenzierbar sein (an Knickstellen ist die Ableitung nicht deﬁniert, siehe Abb. 3.5). An diesen Punkten ist die Funktion nicht diﬀerenzierbar
(wir können hier keine Tangente anlegen) und die Ableitung existiert daher nicht.
Abbildung 3.5: Die Funktion s(t) ist im dargestellten Bereich zwar überall stetig, aber an den
Stellen t1 und t2 nicht diﬀerenzierbar. Die Ableitung ds(t)/dt ist an diesen Stellen nicht stetig.
3 Diﬀerentiation
3.3
71
Wichtige Ableitungen
Die Ableitungen der wichtigsten Funktionen sind hier zusammengefasst. Weitere Ableitungen können Sie einer Formelsammlung entnehmen oder mit den folgenden Diﬀerentiationsregeln selbst
herleiten.
3.4
f (x)
f (x)
f (x)
f (x)
xn
nxn−1
arcsin x
x
1
arccos x
sin x
cos x
arctan x
√ 1
1−x2
1
− √1−x
2
1
2
1+x
cos x
sinh x
cosh x
ln x
− sin x
cosh x
sinh x
a
ax
ex
ax
0
a
ex
(ln a)ax
1
x
Diﬀerentiationsregeln
Mit Hilfe der im letzten Abschnitt angegebenen Ableitungen und der folgenden Diﬀerentiationsregeln können wir auch komplizierte zusammengesetzte Funktionen ableiten. Gegeben seien zwei
(diﬀerenzierbare) Funktionen f (x) und g(x) und eine Konstante a.
3.4.1
Faktorregel
df (x)
d
(af (x)) = a
.
dx
dx
(3.11)
Zum Beispiel:
y = 7 cos x
3.4.2
⇒
y = −7 sin x.
(3.12)
Summenregel
df (x) dg(x)
d
(f (x) + g(x)) =
+
.
dx
dx
dx
(3.13)
Zum Beispiel:
y = 3x + sin x
3.4.3
⇒
y = 3 + cos x.
(3.14)
Produktregel
d
(f (x) · g(x)) =
dx
df (x)
dx
· g(x) +
dg(x)
dx
· f (x).
(3.15)
y = 2xex + x2 ex = ex x(2 + x).
(3.16)
Zum Beispiel:
y = x2 ex
⇒
72
3.4.4
3 Diﬀerentiation
Quotientenregel
#
$
d f (x)
=
dx g(x)
df (x)
dx
· g(x) −
dg(x)
dx
· f (x)
g(x)2
.
(3.17)
Zum Beispiel:
y=
3.4.5
sin x
cos x
⇒
y =
1
cos x cos x + sin x sin x
=
.
cos2 x
cos2 x
(3.18)
Kettenregel
d
d
df dg
(f ◦ g)(x) =
f (g(x)) = f (g(x)) · g (x) =
·
.
dx
dx
dg dx
(3.19)
Bei der Kettenregel leiten wir also die Funktion zunächst nach dem Argument ab und multiplizieren
das Resultat mit der Ableitung des Arguments nach der Variablen. Wir multiplizieren also die
“äußere Ableitung” mit der “inneren Ableitung”.
Zum Beispiel:
y = sin(x2 )
f (z) = sin z
⇒
dy
= cos x2 · 2x.
dx
(3.20)
⇒
dy
= cos 2x · 2.
dx
(3.21)
⇒
2
dy
= ex · 2x.
dx
(3.22)
2
z = g(x) = x
y = sin(2x)
f (z) = sin z
z = g(x) = 2x
y = ex
2
f (z) = ez
z = g(x) = x2
y = xx = eln x·x
⇒
f (z) = ez
z = g(x) = ln x · x
3.4.6
dy
1
= eln x·x ( x + ln x)
dx
x
= xx (1 + ln x).
(3.23)
Umkehrregel
Durch Verkettung einer Funktion mit ihrer Umkehrfunktion ergibt sich die Identität:
(f −1 ◦ f )(x) = f −1 (f (x)) = x.
(3.24)
Wenden wir die Kettenregel auf diesen Ausdruck an, erhalten wir:
d −1
f (f (x)) = (f −1 ) (f (x)) · f (x) = 1.
dx
(3.25)
Daraus folgt die praktische Umkehrregel:
(f −1 ) (y) =
1
f (f −1 (y))
,
(3.26)
3 Diﬀerentiation
73
wobei wir f (x) durch y ersetzt und x durch x = f −1 (y) ausgedrückt haben.
Zum Beispiel:
y = sin x,
3.5
1
d
arcsin(y) = .
dy
1 − y2
⇒
x = arcsin y
(3.27)
Höhere Ableitungen
df
Wenn wir die Ableitung f (x) = dx
einer Funktion f (x) noch einmal nach der Variablen x ableiten,
erhalten wir die zweite Ableitung:
d
d2 f
d
f (x) .
(3.28)
f (x) = 2 =
dx
dx dx
Wir können natürlich die Funktion f (x) mehr als zweimal diﬀerenzieren. Die n-te Ableitung erhält
man durch n-maliges Diﬀerenzieren:
f (n) (x) =
dn f
.
dxn
(3.29)
Zum Beispiel:
f (x)
3.6
= x5 ,
(3.30)
4
f (x)
f (x)
= 5x ,
= 20x3 ,
(3.31)
(3.32)
f (x)
f (4) (x)
= 60x2 ,
= 120x,
(3.33)
(3.34)
f (5) (x)
f (6) (x)
= 120,
= 0,
(3.35)
(3.36)
f (n) (x)
= 0,
∀n ≥ 6.
(3.37)
Maxima und Minima von Funktionen
An Punkten, wo eine diﬀerenzierbare Funktion f (x) Maxima und Minima besitzt, verschwindet
ihre Ableitung f (x). Das heißt, wir können Maxima und Minima von Funktionen ﬁnden, indem
wir die Gleichung f (x) = 0 lösen. Falls ein Minimum den kleinsten Wert der Funktion im gesamten Deﬁnitionsbereich besitzt, nennt man es globales Minimum. Ansonsten ist es ein lokales
Minimum. Globale und lokale Maxima sind analog deﬁniert. Maxima und Minima zusammen
nennt man Extremwerte.
Maxima und Minima kann man durch Bestimmung der zweiten Ableitung an diesen Stellen unterscheiden (siehe Abbildungen 3.7 und 3.8). Für Minima haben wir positive Krümmung, das
heißt, f (xmin ) > 0. Für Maxima hingegen ist die Krümmung negativ, das heißt f (xmax ) < 0.
Beispiel: Zu bestimmen sind Lage und Wert der Extrema der Funktion
f (x) = (1 − x2 )2 .
(3.38)
f (x) = −2(1 − x2 ) · 2x = −4x + 4x3 .
(3.39)
Wir bilden zunächst die erste Ableitung
74
3 Diﬀerentiation
Abbildung 3.6: Die dargestellte Funktion f (x) besitzt an den Stellen xmin und xmin jeweils Minima
und an der Stelle xmax ein Maximum. Da an der Stelle xmin die Funktion den kleinsten Wert im
gesamten Deﬁnitionsbereich annimmt, nennt man das zugehörige Minimum ein globales Minimum.
Abbildung 3.7: Die Funktion ax2 + bx + c hat für a > 0 an der Stelle xmin = −b/2a ein Minimum.
An der Stelle des Minimums hat die Funktion eine positive Krümmung, d.h f (xmin ) = 2a > 0.
Die Bedingung f (x) = 0 ist an den Stellen x = −1, x = 0 und x = +1 erfüllt. Um herauszuﬁnden,
ob die Funktion an diesen Stellen ein Maximum oder ein Minimum besitzt, berechnen wir die
zweite Ableitung
(3.40)
f (x) = 12x2 − 4
und werten sie an den Stellen der Extremwerte aus:
f (0) = −4
f (±1) = 8.
und
(3.41)
Die Funktion f (x) = (1 − x2 )2 hat also an den Stellen x = −1 und x = 1 jeweils ein Minimum und
an der Stelle x = 0 ein Maximum.
3.7
Diﬀerentiation von Funktionen in Parameterform
Eine Funktion sei in Parameterform gegeben:
x =
y =
Die Ableitung y =
dy
dx
x(t),
y(t).
(3.42)
(3.43)
kann dann aus den Ableitungen nach dem Parameter t berechnet werden :
ẏ
dy
= =
dx
ẋ
dy
dt
dx
dt
.
(3.44)
3 Diﬀerentiation
75
Abbildung 3.8: Die Funktion ax2 + bx + c hat für a < 0 an der Stelle xmax = −b/2a ein Maximum.
An der Stelle des Maximums hat die Funktion eine negative Krümmung, d.h f (xax ) = 2a < 0.
Abbildung 3.9: Die Funktion f (x) = (1 − x2 )2 hat zwei Minima und ein Maximum.
Wir erhalten diese Beziehungen, indem wir zunächst auf y = f (x(t)) die Kettenregel anwenden,
df dx
dy dx
dy
=
·
=
·
.
dt
dx dt
dx dt
(3.45)
Umformung dieser Gleichung ergibt schließlich:
dy
=
dx
dy
dt
dx
dt
.
(3.46)
Dieselben Ausdrücke können wir auch auf Funktionen anwenden, welche in Polarkoordinaten
gegeben sind. In diesem Fall betrachtet man r als Funktion von ϕ: r = r(ϕ). Wir haben dann
x = r(ϕ) · cos ϕ,
y = r(ϕ) · sin ϕ.
(3.47)
(3.48)
Durch Anwendung von Gleichung (3.44) erhalten wir
dy
=
dx
dy
dϕ
dx
dϕ
dr
dϕ · sin ϕ + r(ϕ) · cos ϕ
.
dr
dϕ · cos ϕ − r(ϕ) sin ϕ
=
(3.49)
Beispiel:
√
Für die Funktion r(ϕ) = 1/ cos 2ϕ erhalten wir durch Diﬀerentiation
sin 2ϕ
1
dr
= −
(cos 2ϕ)−3/2 (− sin 2ϕ)2 =
3 ,
dϕ
2
(cos 2ϕ) 2
(3.50)
woraus folgt:
sin 2ϕ
dy
=
dx
3
(cos 2ϕ) 2
sin 2ϕ
3
(cos 2ϕ) 2
sin ϕ +
√cos ϕ
cos 2ϕ
cos ϕ −
√sin ϕ
cos 2ϕ
=
1
cos ϕ
=
.
sin ϕ
tan ϕ
(3.51)
76
3 Diﬀerentiation
Beispiel: Archimedische Spirale
Für die Funktion r(ϕ) = aϕ gilt
dr
= a,
dϕ
(3.52)
dy
a sin ϕ + aϕ cos ϕ
sin ϕ + ϕ cos ϕ
=
=
.
dx
a cos ϕ − aϕ sin ϕ
cos ϕ − ϕ sin ϕ
(3.53)
und somit
Die Ableitung dy/dx hängt also nicht von a ab.
3.8
Diﬀerentiation von Vektoren
Betrachten wir die Bewegung eines Massenpunktes durch den Raum. Diese Bewegung beschreiben
wir durch den Ortsvektor r(t) des Massenpunktes als Funktion der Zeit (siehe Abb. 3.10). Die
Bahnkurve des Massenpunktes nennen wir auch Trajektorie.
Abbildung 3.10: Trajektorie r(t) eines Massenpunktes. Die Geschwindigkeit v (t) ist die erste Ableitung von r(t) nach der Zeit.
Wir können jetzt analog zum skalaren Fall vorgehen und eine vektorartige Geschwindigkeit v als
den Grenzwert
r(t + ∆t) − r(t)
∆t→0
∆t
v (t) = lim
(3.54)
deﬁnieren. Die Ableitung eines Vektors ist wiederum ein Vektor. In Komponentenschreibweise
können wir diese Grenzwertbildung ausdrücken als:
 
 
 


dx
vx (t)
lim∆t→0 x(t+∆t)−x(t)
ẋ(t)
∆t
dt
 
  dy  


v (t) =  vy (t)  =  lim∆t→0 y(t+∆t)−y(t)
(3.55)
 =  dt  =  ẏ(t)  .
∆t
z(t+∆t)−z(t)
dz
vz (t)
lim∆t→0
ż(t)
∆t
dt
Eine etwas kürzere Schreibweise dafür ist:
v (t) =
d
r(t) = r˙ (t).
dt
(3.56)
Die Geschwindigkeit v (t) ist also die zeitliche Ableitung des Vektors r(t). Der Geschwindigkeitsvektor v ist tangential zur Trajektorie und sein Betrag ist gleich der Geschwindigkeit in Richtung
der Trajektorie.
3 Diﬀerentiation
77
Abbildung 3.11: Geschwindigkeit v und Beschleunigung a für die gleichförmige Kreisbewegung in
der Ebene.
Beispiel: Kreisbewegung
Für die gleichförmige Kreisbewegung in der Ebene auf einer Bahn mit Radius r um den Ursprung
gilt (siehe Abb. 3.11):
x = r cos ωt,
(3.57)
y = r sin ωt,
(3.58)
wobei ω die Winkelgeschwindigkeit ist. Durch Diﬀerentiation erhalten wir die x- und y-Komponenten
der Geschwindigkeit:
vx = −rω sin ωt,
(3.59)
vy = rω cos ωt.
(3.60)
Wie man durch Bildung des Skalarproduktes r(t) · v (t) leicht sehen kann, sind r(t) und v (t) zu
jedem Zeitpunkt normal aufeinander.
Die Beschleunigung beschreibt die zeitliche Änderung der Geschwindigkeit mit der Zeit:
d
d2
v = 2 r.
dt
dt
(3.61)
ax = −rω 2 cos ωt,
(3.62)
ay = −rω sin ωt.
(3.63)
a =
Für die Kreisbewegung erhalten wir somit
2
In Vektorschreibweise ist die Beschleunigung also gegeben durch
a = −ω 2r.
(3.64)
Die Beschleunigung a(t) und der Ortsvektor r(t) sind also zu jedem Zeitpunkt antiparallel.
Für Vektoren gelten folgende Diﬀerentiationsregeln, welche man sich durch Anwendung der
weiter oben behandelten einfachen Diﬀerentiationsregeln auf die jeweiligen Ausdrücke in Komponentenschreibweise leicht überlegen kann. Hier sind die Vektoren a und b zeitabhängig: a = a(t)
und b = b(t). f (t) ist eine beliebige skalare Funktion der Zeit.
• Summenregel
d
da db
(a + b) =
+ .
dt
dt
dt
(3.65)
78
3 Diﬀerentiation
• Produktregeln
– Skalar × Vektor
df
da
d
[f (t)a] = a + f .
dt
dt
dt
(3.66)
d
da db
(a · b) =
· b + a · .
dt
dt
dt
(3.67)
d
da db
(a × b) =
× b + a × .
dt
dt
dt
(3.68)
d
da db
dc
[(a × b) · c)] = (
× b) · c + (a × ) · c + (a × b) ·
dt
dt
dt
dt
(3.69)
– Skalarprodukt
– Kreuzprodukt
– Spatprodukt
• Quotientenregel
d
dt
a
f (t)
=
d
a
dt f
− a df
dt
.
f2
(3.70)
• Kettenregel
da(f (t))
da df
=
.
dt
df dt
3.9
3.9.1
(3.71)
Partielle Diﬀerentiation
Funktionen mehrerer Variabler
Eine Funktion kann von mehr als einer Variablen abhängen. Zum Beispiel könnte f (x, y) das
Höhenrelief eines Gebirges darstellen. In diesem Fall gibt f (x, y) für jeden Punkt (x, y), der etwa
durch die geographische Breite x und die geographische Länge y deﬁniert ist, die Höhe über dem
Meeresspiegel an. Im Allgemeinen versteht man unter einer Funktion von zwei unabhängigen Variablen eine Vorschrift, die jedem geordneten Zahlenpaar (x, y) aus dem Deﬁnitionsbereich genau
ein Element z aus dem Wertebereich zuordnet:
z = f (x, y).
(3.72)
(Diese Deﬁnition kann direkt auf eine beliebige Zahl von Argumenten übertragen werden.) So
wie eine Funktion y = f (x) in einem kartesischen Koordinatensystem einen Kurve deﬁniert (den
Funktionsgraphen), deﬁniert eine Funktion z = f (x, y) in einem dreidimensionalen Koordinatensystem eine Fläche. Diese Fläche entsteht dadurch, dass jedem Punkt in der xy-Ebene eine gewisse
Höhe senkrecht zur xy-Ebene zugeordnet wird. Die Fläche besteht also aus allen Zahlentriplets
(x, y, z = f (x, y)).
Beispiel:
Die durch die Funktion
f (x, y) = y 2 − x
(3.73)
deﬁnierte Fläche ist in Abb. 3.12 graphisch dargestellt. Die Funktionsﬂäche ist ein für fallende
Werte von x ansteigendes Tal. Für x = const erhalten wir eine Schar von Parabeln, z = y 2 − const,
und für y = const eine Schar von Geraden mit Steigung -1, z = const − x.
3 Diﬀerentiation
79
Abbildung 3.12: Darstellung der Funktion z = f (x, y) = y 2 − x in einem dreidimensionalen kartesischen Koordinatensystem.
3.9.2
Partielle Ableitung
Wir können nun die Funktion f (x, y) nach einer der beiden Variablen ableiten und dabei die andere
Variable als konstant betrachten:
f (x + ∆x, y) − f (x, y)
∂f (x, y)
= lim
(y = const).
(3.74)
∆x→0
∂x
∆x
Genauso können wir die Funktion nach y ableiten:
∂f (x, y)
f (x, y + ∆y) − f (x, y)
= lim
∆y→0
∂y
∆y
(x = const).
(3.75)
Solche Ableitungen nennt man partielle Ableitungen, da die Funktion nur nach einer der Variablen abgeleitet wird, also nur “zum Teil”, und alle anderen Variablen festgehalten werden. Um
den Unterschied zur Diﬀerentiation einer Funktion einer einzelnen Variablen zu betonen, verwenden wir für die partielle Ableitung das geschwungene Delta: ∂. Alternativ zur Notation mit dem
geschwungenen Delta ∂ ﬁndet auch die folgende Schreibweise mit Indizes Verwendung:
fx
=
fy
=
∂f
∂x
∂f
.
∂y
(3.76)
(3.77)
Für partielle Ableitungen gelten dieselben Rechenregeln wie für die Diﬀerentiation einer Funktion
einer einzelnen Variablen.
Beispiel:
Die Funktion
f (x, y) = xy 2 + 4x5 y + 16x
(3.78)
80
3 Diﬀerentiation
kann sowohl nach x als auch nach y diﬀerenziert werden:
∂f
= y 2 + 20x4 y + 16,
∂x
∂f
= 2xy + 4x5 .
∂y
(3.79)
(3.80)
Durch wiederholtes partielles Ableiten lassen sich partielle Ableitungen höherer Ordnung (höhere
Ableitungen) bilden:
∂2f
∂ ∂f
=
(3.81)
= fxx ,
∂x2
∂x ∂x
∂ ∂f
∂2f
=
(3.82)
= fxy ,
∂y∂x
∂y ∂x
∂ ∂f
∂2f
=
(3.83)
= fyx ,
∂x∂y
∂x ∂y
∂2f
∂ ∂f
=
(3.84)
= fyy .
∂y 2
∂y ∂y
Beispiel: Thermodynamik
In der Thermodynamik verwendet man eine weitere, leicht unterschiedliche Schreibweise für partielle Ableitungen. So ist zum Beispiel die Wärmekapazität eines Körpers gegeben als
∂S
Cp = T
,
(3.85)
∂T p
wobei T die Temperatur ist, S die Entropie und p der Druck. Diese Wärmekapazität Cp ist die
Wärme, die einem Körper zugeführt (oder abgeführt) werden muss, um die Temperatur T des
Körpers um einen gewissen Betrag zu ändern und zwar bei konstantem Druck p. Der Index p
zeigt an, dass die Temperaturänderung bei konstantem Druck erfolgt.
Analog dazu gibt es auch die Wärmekapazität bei konstantem Volumen V :
∂S
CV = T
.
∂T V
(3.86)
Auch hier wird explizit angegeben, welche Variable sich ändert (T ) und welche unverändert bleibt
(V ).
Beispiel: Mechanik
Aus der potentiellen Energie U (x, y, z) kann die Kraft, die auf einen gewissen Körper wirkt, durch
partielle Ableitung berechnet werden:




− ∂U
∂x
Fx




 
(3.87)
F =  Fy  =  − ∂U
.
 ∂y 
Fz
− ∂U
∂z
Nach dem Satz von Schwarz kann bei gemischten partiellen Ableitungen die Reihenfolge der
Diﬀerentiation vertauscht werden, falls die partiellen Ableitungen stetig sind. Dies gilt auch für
partielle Ableitungen höherer Ordnung. Demnach gilt etwa:
∂2f
∂ 2f
=
.
∂x∂y
∂y∂x
(3.88)
3 Diﬀerentiation
81
In Analogie zum Diﬀerential lassen sich auch partielle Diﬀerentiale deﬁnieren:
∂x f (x, y) =
∂f (x, y)
dx
∂x
(3.89)
∂y f (x, y) =
∂f (x, y)
dy.
∂y
(3.90)
und
Das totale Diﬀerential (auch vollständiges Diﬀerential genannt) ergibt sich aus der Summe
der partiellen Diﬀerentiale:
df (x, y) =
∂f
∂f
dx +
dy.
∂x
∂y
(3.91)
Das totale Diﬀerential, das in der Fehlerrechnung und in der Thermodynamik von Bedeutung ist,
gibt an, um wie viel sich die Funktion f (x, y) ändert, wenn wir ihre Argumente um dx und dy
verschieben.
3.9.3
Anstieg einer impliziten Funktion
Eine Funktion sei in impliziter Form als F (x, y) = 0 gegeben (siehe Abb. 3.13). In einem gewissen
Punkt (x, y) ist der Anstieg der Kurve dann gegeben durch:
∂F
∂x
k = − ∂F
.
(3.92)
∂y
Um zu verstehen, woher dieser Ausdruck kommt, betrachten wir F (x, y) als eine Funktion z =
F (x, y) von x und y. Das vollständige Diﬀerential der Funktion ist
∂F
∂F
dF (x, y) =
dx +
dy.
(3.93)
∂x
∂y
Wir wissen nun, dass entlang der durch F (x, y) = 0 deﬁnierten Kurve sich F (x, y) nicht ändert
(F (x, y) ist ja auf dieser Kurve überall gleich 0). Daher ist dF = 0. Wenn wir diesen Ausdruck
dann noch durch dx dividieren, erhalten wir schließlich
∂F
dy
∂x
= − ∂F
.
dx
∂y
(3.94)
Abbildung 3.13: Der Anstieg (oder die Steigung) k der durch F (x, y) = 0 deﬁnierten Kurve im
Punkt (x, y) ist gegeben durch k = −(∂F/∂x)/(∂F/∂y).
82
3 Diﬀerentiation
Beispiel:
Die Gleichung
F (x, y) = x2 + y 2 − 1 = 0
(3.95)
stellt einen Kreis in der Ebene mit Mittelpunkt im Ursprung und Radius 1 dar. Die Steigung des
Kreises an der Stelle (x, y) ist gegeben durch:
dy
−2x
x
=
=− .
dx
2y
y
(3.96)
(3.97)
√ √
Demnach ist die Steigung der Kreislinie im Punkt (0, 1) gleich 0, im Punkt ( 2, 2) ist sie gleich
-1 und im Punkt (1, 0) ist sie gleich −∞.
Kapitel 4
Integration
4.1
Das unbestimmte Integral
Die Integration ist die Umkehrung der Diﬀerentiation. Während wir bei der Diﬀerentiation für
eine bestimmte Funktion ihre Ableitung bestimmen, wollen wir beim Integrieren aus der Ableitung
die Funktion bestimmen. Oder, mit anderen Worten, wir wollen aus der Steigung einer Kurve die
Kurve selbst bestimmen. Dies ist eine der beiden Grundaufgaben der Integralrechnung. Die
zweite Grundaufgabe der Integralrechnung, der wir uns später zuwenden werden, besteht in der
Berechnung von Flächen unter Funktionsgraphen.
Gegeben sei also eine Funktion f (x). Zu dieser Funktion suchen wir jetzt eine andere Funktion
F (x), sodass f (x) die Ableitung von F (x) ist:
F (x) = f (x).
(4.1)
F (x) wird die Stammfunktion genannt. Das Auﬃnden der Stammfunktion wird Integration
genannt. Zum Beispiel hat die Funktion f (x) = x2 die Funktion F (x) = 13 x3 als Stammfunktion,
denn
d 1 3
x = x2 .
dx 3
(4.2)
Während bei der Diﬀerentiation F (x) gegeben und f (x) = F (x) gesucht ist, gilt es also bei der
Integration für eine gegebene Funktion f (x) eine Funktion F (x) zu ﬁnden, sodass F (x) = f (x).
Man nennt F (x) auch das unbestimmte Integral von f (x) und schreibt:
%
%
F (x) = f (x) dx
oder
F (x) = dxf (x).
(4.3)
Hier ist es wichtig anzumerken, dass das unbestimmte Integral einer Funktion wiederum eine
Funktion ist.
Genauer müsste man eigentlich schreiben:
%
F (x) =
f (x) dx + C,
(4.4)
wobei C die so genannte Integrationskonstante ist. Diese Konstante wird deshalb benötigt, weil
die Integration kein eindeutiger Vorgang ist. So haben z.B. die Funktionen
f (x) = 2x
f (x) = x2
2
g(x) = x + 5
g (x) = 2x
83
(4.5)
(4.6)
84
4 Integration
dieselbe Ableitung, weil eine Konstante bei der Diﬀerentiation verschwindet. Falls F (x) eine Stammfunktion von f (x) ist, ist F (x) + C also auch eine, denn die Ableitungen dieser beiden Funktionen
sind identisch (siehe Abb. 4.1). Außerdem ist jede beliebige Stammfunktion F̃ (x) der Gestalt
F̃ (x) = F (x) + C. Sind nämlich sowohl F (x) als auch F̃ (x) Stammfunktionen, gilt
dF̃
dF
d
(F̃ (x) − F (x)) =
−
= f − f = 0.
dx
dx
dx
(4.7)
Deshalb ist F̃ (x) − F (x) eine Konstante und F̃ (x) kann geschrieben werden als F̃ (x) = F (x) + C.
Abbildung 4.1: Falls die Funktion F (x) eine Stammfunktion von f (x) ist, so ist es auch eine
ganze Schar von Funktionen, die sich jeweils um eine Konstante unterscheiden. Die Gleichung
F (x) = f (x) gibt für jeden Wert von x die Steigung der Tangente vor.
Die Integrationskonstante ist eine zunächst unbestimmte Konstante, die wir zur Stammfunktion dazu schreiben, um diesen Sachverhalt anzudeuten. Wenn wir den Wert von F (x) an einer
einzelnen Stelle kennen, können wir daraus C bestimmen (Anfangswert, Randbedingung). Weil
durch die Diﬀerentiation Konstanten verloren gehen, können wir sie nicht mehr durch Integration
zurückgewinnen und es gibt eine unendliche Schar von Stammfunktionen, die sich nur durch
eine Konstante unterscheiden und die alle die gleiche Ableitung besitzen (siehe Abb. 4.1).
Beispiel:
Wir betrachten einen Körper, der sich mit zunehmender Geschwindigkeit v entlang einer Geraden
bewegt. Wir nehmen dabei an, dass die Geschwindigkeit linear mit der Zeit zunimmt (wir haben
es also mit einer gleichförmigen Beschleunigung zu tun):
v = at,
(4.8)
wobei v = q̇ und a = v̇ und wir für die Beschleunigung den Wert a = 4m/s2 annehmen. Der in
einer Zeit t zurückgelegte Weg q(t) ist gegeben durch:
%
q(t) =
%
v dt =
at dt =
at2
+ C.
2
(4.9)
(Hier heißt unsere Variable t statt x, was natürlich völlig belanglos ist.) Nehmen wir nun an, dass
zum Zeitpunkt t = 0 der Körper schon einen Weg von 4 Metern zurückgelegt hat, also q(t = 0) = 4m
(man nennt so etwas eine Anfangsbedingung). Diese Anfangsbedingung können wir benutzen,
um die Integrationskonstante zu bestimmen:
q(0) =
a02
m + C = 4m
2
⇒
C = 4m.
(4.10)
4 Integration
85
Die Anfangsbedingung wählt aus der Schar aller Lösungen eine bestimmte Lösung aus.
Zusammenfassend halten wir fest:
• Zu jeder stetigen Funktion f (x) gibt es unendlich viele Stammfunktionen F (x), sodass
F (x) = f (x).
• Zwei beliebige Stammfunktionen F1 (x) und F2 (x) unterscheiden sich nur durch eine Konstante:
F1 (x) − F2 (x) = C.
(4.11)
Wenn F (x) eine Stammfunktion ist, dann ist also auch F (x) + C eine Stammfunktion.
4.2
Wichtige unbestimmte Integrale
In der unten stehenden Tabelle sind ein paar der wichtigsten unbestimmten Integrale angeführt.
Durch Diﬀerenzieren von F (x) kann man sich leicht von der Richtigkeit dieser Beziehungen überzeugen.
Funktion
f (x)
Stammfunktion
&
F (x) = dxf (x)
a
xn
ax
1
x
x
ln x
ex
1 ax
ae
1
x
ln a a
− cos x
sin x
cosh x
sinh x
e
eax
ax
sin x
cos x
sinh x
cosh x
1
n+1
n+1 x
Diese Tabelle enthält nur die allerwichtigsten (und einfachsten) Integrale. Weitere Integrale können
Sie den Integraltafeln in den gängigen Formelsammlungen entnehmen oder Sie können Computerprogramme wie “Mathematica” zur Bestimmung von Integralen benutzen. Falls Sie keinen Zugang
zu “Mathematica” oder einem ähnlichen Programm haben, gehen Sie einfach mit Ihrem Browser
zu integrals.wolfram.com und tippen Sie Ihr Integral ein.
4.3
Das bestimmte Integral
Wir wenden uns nun der zweiten Grundaufgabe der Integralrechnung zu, nämlich der Berechnung
des Flächeninhalts eines Bereichs, der vom Graphen einer Funktion f (x) in einem Intervall [a, b]
mit der x-Achse eingeschlossen wird (siehe Abb. 4.2). Dieser Flächeninhalt ist das bestimmte
Integral.
Obwohl es auf den ersten Blick nicht oﬀensichtlich ist, gibt es einen fundamentalen Zusammenhang zwischen der ersten Grundaufgabe der Integralrechnung, dem Auﬃnden einer Stammfunktion F (x), und der Flächenberechnung. Im Folgenden werden wir uns mit diesem Zusammenhang
beschäftigen.
86
4 Integration
Abbildung 4.2: Die zweite Grundaufgabe der Integralrechnung besteht in der Berechnung der
Fläche Sab (schraﬃerter Bereich) unter dem Graphen einer Funktion f (x) im Intervall [a, b].
Um die Fläche Sab unter dem Funktionsgraphen f (x) zu berechnen, teilen wir das Intervall [a, b] auf
der x-Achse in n gleich lange Teile der Breite ∆x = (b−a)/n ein (siehe Abb. 4.3). Die äquidistanten
Endpunkte dieser Intervalle nennen wir xi . Für die Endpunkte der Intervalle gilt demnach:
xi = a + i∆x,
i = 0, . . . , n.
(4.12)
Wir nehmen hier der Einfachheit halber an, dass die Kurve f (x) vollständig über der x-Achse liegt.
Funktionen, die im Intervall [a, b] sowohl positive als auch negative Werte annehmen, bieten jedoch
keine wesentlichen Schwierigkeiten, wie wir später sehen werden.
Diese Einteilung des Intervalls [a, b] in n kleine Abschnitte zerlegt die Fläche Sab in n vertikale
Streifen. Die Gesamtﬂäche Sab ist dann gegeben durch die Summe der Flächeninhalte der einzelnen
Streifen:
Sab
=
=
s1 + s2 + s3 + · · · + sn
n
si .
(4.13)
i=1
Dabei ist si der Flächeninhalt des i-ten Streifens (das ist der Streifen, der zum Intervall [xi−1 , xi ]
gehört). Hier ist uns zum ersten Mal das Summenzeichen Σ (das große griechische Sigma) begegnet, dessen Bedeutung aus dem obigen Ausdruck klar sein sollte. Das Summenzeichen erlaubt es,
Summen (sogar unendliche) auf kompakte Weise zu schreiben.
Abbildung 4.3: Zur Berechnung der Fläche unter der Kurve von f (x) teilen wir das Intervall [a, b] in
viele kleine Teile. Die Gesamtﬂäche unter der Kurve ergibt sich dann aus der Summe aller schmalen
senkrechten Streifen.
4 Integration
87
Abbildung 4.4: Die Fläche eines schmalen Streifens setzt sich zusammen aus einem Rechteck mit
den Kantenlängen ∆x und f (xi ) und einem Rest εi (schraﬃerter Bereich).
Schauen wir uns nun die Fläche si etwas genauer an (siehe Abb. 4.4). Die Fläche des Streifens
setzt sich zusammen aus einem Rechteck mit den Kantenlängen ∆x und f (xi ) und dem Rest εi :
si = f (xi )∆x + εi .
(4.14)
Das heißt:
Sab =
n
si =
i=1
n
f (xi )∆x +
i=1
n
εi .
(4.15)
i=1
Abbildung 4.5: Der schraﬃerte Bereich ist der Fehler, der gemacht wird, falls die Fläche der senkrechten Streifen durch die Fläche der Rechtecke mit Kantenlängen ∆x und f (xi ) angenähert wird.
n
Für eine grobe Einteilung von [a,b] kann der Term i=1 εi recht groß sein. Wenn wir die Einteilung
n
feiner und feiner machen, wird i=1 εi immer kleiner und die Fläche immer besser durch
Sab ≈
n
f (xi )∆x
(4.16)
i=1
angenähert. In dieser Approximation behandelt man also die senkrechten
als Rechtecke mit
Streifen
n
Kantenlängen ∆x und f (xi ). Der Fehler, der dabei gemacht wird, ist i=1 εi (siehe Abbildungen
4.5 und 4.6).
n
Für unendlich kleine ∆x verschwindet schließlich i=1 εi und die Fläche Sab ist exakt durch den
Grenzwert
n
Sab = lim
f (xi )∆x
(4.17)
∆x→0
i=1
88
4 Integration
Abbildung 4.6: Für eine kleiner werdende Intervallbreite ∆ wird der Fehler, der durch die Approximation der senkrechten Streifen durch Rechtecke gemacht wird, immer kleiner.
gegeben, bei dem wir die Anzahl n der Teilintervalle unbegrenzt wachsen lassen. Diesen Grenzwert
nennen wir das bestimmte Integral über dem Intervall [a, b] und wir bezeichnen es mit:
%b
f (x)dx = lim
∆x→0
a
n
f (xi )∆x.
(4.18)
i=1
&
Das Zeichen
ist eine Stilisierung des Buchstabens S und soll uns daran erinnern, dass das
bestimmte Integral durch Grenzwertbildung aus einer Summe hervorgegangen ist. Der Ausdruck
f (x)dx hinter dem Integralzeichen soll an die Form f (xi )∆x der Terme in dieser Summe erinnern.
Die Variable x wird Integrationsvariable genannt.
&b
Das bestimmte Integral a f (x)dx ist eine Zahl, im Gegensatz zum unbestimmten Integral, das
&b
eine Funktion von x ist. Das bestimmte Integral a f (x)dx hängt nur von den Integrationsgrenzen a und b und von der Funktion f (x) im Intervall [a, b] ab. Daher ist die genaue Bezeichnung
&b
&b
der Integrationsvariablen belanglos. Statt a f (x)dx hätten wir genauso gut a f (z)dz schreiben
können ohne das Ergebnis zu verändern.
Wir haben bisher vorausgesetzt, dass die Funktion f (x) im gesamten Intervall [a, b] positiv ist. Das
muss jedoch nicht der Fall sein. Im allgemeinen Fall liegen einige Teile des Funktionsgraphen über
und einige Teile unter der x-Achse (siehe Abb. 4.7).
Abbildung 4.7: Bei einer Funktion, deren Graph sowohl über als auch unter der x-Achse liegt,
tragen die Flächenbereiche mit negativen Funktionswerten mit einem negativen Vorzeichen zum
Integral bei.
4 Integration
89
Wenn wir in diesem Fall das bestimmte Integral mit Hilfe von Gleichung (4.18) durch Grenzwertbildung berechnen, erhalten wir in den Bereichen mit negativem Funktionswert negative Beiträge
zur Summe. Auch in diesem Fall ist das bestimmte Integral
%b
f (x)dx
(4.19)
a
die Summe der Inhalte der Flächen, die von der x-Achse, dem Funktionsgraphen f (x) und der
Abszissenwerte x = a und x = b begrenzt werden. Dabei tragen die Flächen oberhalb der x-Achse
allerdings positiv und die Flächen unterhalb der x-Achse negativ zum Integral bei.
4.4
Zusammenhang zwischen bestimmtem und unbestimmtem Integral
Abbildung 4.8: Die Funktion f (x) begrenzt im Intervall [a, b] mit der x-Achse einen Bereich mit
Flächeninhalt Sab und im kleineren Intervall [a, x] einen Bereich mit Flächeninhalt Sax .
Gegeben sei eine Funktion f (x), die im Intervall [a, b] mit der x-Achse eine Fläche Sab eingrenzt
(siehe Abb. 4.8). Wir betrachten jetzt aber nur einen Teil der Fläche Sab , nämlich den, der von
der Funktion f (x), der x-Achse und den senkrechten Geraden durch die Abszisse a und durch
eine bewegliche Abszisse x begrenzt wird. Wir nennen diese Fläche Sax . Die Größe dieser Fläche
hängt davon ab, an welche Stelle im Intervall wir die Abszisse x legen. Wir können die Fläche Sax
ausdrücken als bestimmtes Integral der Funktion f (x) mit unterer Grenze a und oberer Grenze
x. Da wir die Buchstaben x zur Bezeichnung der oberen Grenze verwenden, verwenden wir einen
anderen Buchstaben (z.B. u) als Integrationsvariable. Die Fläche Sax ist gegeben durch:
%x
Sax =
f (u)du.
(4.20)
a
Das Integral in dieser Gleichung ist ein bestimmtes Integral mit einer veränderlichen oberen Grenze
x. Das bestimmte Integral Sax ist also eine Funktion dieser Grenze x.
Als nächstes werden wir zeigen, dass Sax (betrachtet als Funktion von x) eine Stammfunktion
von f (x) ist:
d
Sax = f (x).
dx
(4.21)
Dies wird den gesuchten Zusammenhang zwischen dem bestimmten Integral und dem unbestimmten Integral herstellen. Um zu zeigen, dass Sax eine Stammfunktion von f (x) ist, betrachten wir
90
4 Integration
Abbildung
& x 4.9: Die Fläche des schraﬃerten Bereichs ist gleich der Änderung ∆Sax der Fläche
Sax = a f (x)dx aufgrund einer Änderung der oberen Grenze des Integrals von x auf x + ∆x.
die Zunahme ∆Sax von Sax durch einen Zuwachs ∆x der veränderlichen oberen Grenze x. Der
Zuwachs ∆Sax ist einfach die Größe des zusätzlichen Streifens, der durch x, x + ∆x, f (x) und die
x-Achse begrenzt wird (siehe Abb. 4.9).
Für sehr kleine ∆x ist ∆Sax gegeben durch die Fläche eines Rechtecks mit der Breite ∆x und der
Höhe f (x),
∆Sax ≈ f (x) · ∆x.
(4.22)
Für ∆x → 0 strebt der Fehler, den wir in dieser Näherung machen, gegen 0 und wir erhalten aus
obiger Gleichung:
∆Sax
= f (x).
∆x→0 ∆x
lim
(4.23)
Die linke Seite der Gleichung ist aber genau die Deﬁnition der Ableitung von Sax nach der Variablen x. Somit gilt
d
d
Sax =
dx
dx
%x
f (u)du = f (x).
(4.24)
a
Das heißt, das bestimmte Integral der Funktion f (u) mit veränderlicher Grenze x ist eine Stammfunktion des Integranden. Somit haben wir den gesuchten Zusammenhang erhalten.
Durch Ausnutzung dieses Zusammenhangs können wir das bestimmte Integral
%b
f (x)dx
(4.25)
a
durch Auﬃnden der Stammfunktion F (x) von f (x) berechnen. Dies können wir auf folgende Weise
tun. Da wir wissen, dass Sax eine Stammfunktion von f (x) ist, kann sich die Stammfunktion F (x)
nur um eine Konstante C (Integrationskonstante) von diesem bestimmten Integral unterscheiden:
%x
f (u)du = F (x) + C.
(4.26)
a
Zu Bestimmung von C beachten wir nun, dass das Integral auf der linken Seite verschwindet, falls
die obere Grenze x mit der unteren Grenze a zusammenfällt, das heißt wenn a = x. Für x = a
4 Integration
91
erhalten wir daher:
%a
f (u)du = 0 = F (a) + C.
(4.27)
a
Daraus folgt:
C = −F (a).
(4.28)
Somit gilt
%x
f (u)du = F (x) − F (a).
(4.29)
a
Indem wir x = b setzen, erhalten wir schließlich
%b
f (u)du = F (b) − F (a).
(4.30)
a
Da wir jetzt den Buchstaben x nicht mehr für die obere Integrationsgrenze benötigen, können wir
natürlich auch schreiben:
%b
f (x)dx = F (b) − F (a).
(4.31)
a
Eine alternative Schreibweise dafür ist:
%b
!b
!
f (x)dx = F (x)!! .
(4.32)
a
a
Wir erhalten also den Wert des bestimmten Integrals aus der Diﬀerenz einer Stammfunktion des
Integranden an der oberen und unteren Integrationsgrenze. Dieses Ergebnis nennt man den Hauptsatz der Diﬀerential- und Integralrechnung. Dieser sehr praktische Zusammenhang erspart
uns bei der Berechnung des bestimmten Integrals die schwierige Grenzwertbildung.
Beispiel:
Wir berechnen nun das bestimmte Integral der Funktion f (x) = x im Intervall [a, b] zunächst mit
Hilfe des Hauptsatzes der Diﬀerential- und Integralrechnung und dann explizit durch Einteilung des
Intervalls in schmale Unterintervalle der Breite ∆x und anschließender Grenzwertbildung ∆x → 0.
Durch Bestimmen der Stammfunktion von f (x) = x, F (x) = x2 /2, ﬁnden wir
%b
xdx =
a
!b
x2 !!
b 2 − a2
.
=
!
2 a
2
(4.33)
Wir könnten alternativ dazu auch eine Summe schmaler Streifen bilden und dann ∆x gegen 0
gehen lassen:
Sab ≈
n
i=1
f (xi ) · ∆x.
(4.34)
92
4 Integration
Für die Abszisse xi gilt xi = x0 + i∆x = a + i∆x. Daher ist f (xi ) = a + i∆x und wir haben
Sab
n
n
n
(a + i∆x) · ∆x =
a∆x +
i∆x2
≈
i=1
=
i=1
a∆x
n
1 + ∆x2
i=1
na∆x + ∆x2
=
n
i=1
i
i=1
n
i.
(4.35)
i=1
Da ∆x =
b−a
n
gilt
Sab
≈ na
n
(b − a) (b − a)2 +
i
n
n2
i=1
≈ a(b − a) +
(b − a)2
(1 + 2 + 3 + · · · + (n − 1) + n).
n2
(4.36)
Die Summe aller natürlichen Zahlen von 1 bis n ist bekannt,
1 + 2 + 3 + · · · + (n − 1) + n =
n(n + 1)
,
2
(4.37)
und somit erhalten wir schließlich:
Sab
(b − a)2 n(n + 1)
·
n2
2 2
1
(b − a)
· 1+
a(b − a) +
.
2
n
≈
a(b − a) +
≈
(4.38)
Um das bestimmte Integral Sab zu berechnen, müssen wir den Grenzübergang ∆x → 0 oder
äquivalent dazu den Grenzübergang n → ∞ durchführen. Das heißt
#
$
1
(b − a)2
· 1+
Sab = lim a(b − a) +
n→∞
2
n
(b − a)2
= a(b − a) +
2
2
2ab
b2
+ a
2
− = a
b−a +
2
2
2
1 2
2
=
(b − a ),
(4.39)
2
was mit dem Ergebnis weiter oben übereinstimmt, jedoch weitaus komplizierter zu berechnen war
(selbst für die einfache Funktion f (x) = x).
Beispiel:
Gesucht ist die Fläche unter der Kurve y = x3 zwischen a = 0 und b = 1. Diese Fläche ist gleich
dem bestimmten Integral
%1
x3 dx =
0
!1
x4 !!
1
= .
4 !0 4
(4.40)
4 Integration
93
Abbildung 4.10: Die Fläche eines Viertelkreises kann durch Integration der Funktion y =
im Intervall [0, r] berechnet werden.
√
r2 − x2
Beispiel:
Gesucht ist die Fläche eines Viertelkreises mit Radius r. Der implizite Ausdruck für einen Kreis
mit Radius r um den Ursprung,
x2 + y 2 = r2 ,
lässt sich leicht in einen expliziten Ausdruck für die Kreislinie umwandeln:
y = r2 − x2 .
(4.41)
(4.42)
Die Fläche A des Viertelkreises lässt sich somit als bestimmtes Integral schreiben:
%r A=
r2 − x2 dx.
(4.43)
0
Durch Nachschlagen in einer Formelsammlung ﬁnden wir:
% x
x 2
r2
arcsin .
r2 − x2 dx =
r − x2 +
2
2
r
(4.44)
Das heißt
A =
!r
%r x
x !!
r2
2
2
2
2
arcsin
r − x dx =
r −x +
2
2
r !0
0
=
r r2
r2
r2 π
r2 π
r2
arcsin
−
arcsin(0) =
arcsin(1) =
=
.
2
r
2
2
2 2
4
(4.45)
Die Fläche des Viertelkreises ist also r2 π/4.
4.5
Rechenregeln für das bestimmte Integral
Für das bestimmte Integral gelten folgende Rechenregeln:
• Das bestimmte Integral verschwindet, wenn die untere und obere Integrationsgrenze zusammenfallen:
%a
f (x)dx = 0.
a
(4.46)
94
4 Integration
• Ein Integral kann in eine Summe von zwei Integralen über aneinander grenzende Intervalle
zerlegt werden:
%c
%b
f (x)dx =
a
%c
f (x)dx +
a
f (x)dx.
(4.47)
b
• Vertauschung der Integrationsgrenzen führt zur Umkehrung des Vorzeichens:
%b
%a
f (x)dx = −
a
4.6
f (x)dx.
(4.48)
b
Grundregeln des Integrierens
Wir wollen jetzt auf Methoden zur Ermittlung der Stammfunktion (also des unbestimmten Integrals) eingehen. Die folgenden Regeln ergeben sich aus den bereits besprochenen Diﬀerentiationsregeln. Im Folgenden werden wir die Integrationskonstante, die wir genau genommen immer
ausdrücklich hinschreiben müssten, meistens weglassen.
4.6.1
Faktorregel
Ein konstanter Faktor kann vor das Integral gezogen werden:
%
%
af (x)dx = a f (x)dx.
(4.49)
Diese Regel ist eine direkte Umkehrung der Faktorregel für die Diﬀerentiation.
Beispiel:
%
f (x) =
f (x)dx
=
=
=
3
,
4
x
%
%
%
3
1
dx = 3
dx = 3 x−4 dx
x4
x4
1
3
x−4+1 + C = −x−3 + C
−4 + 1
1
− 3 + C.
x
(4.50)
(4.51)
Beispiel:
%4
− 72
5x
!4
2
7
5!
x− 2 dx = 5 −
x− 2 !! =
5
2
2
#
$
#
$
1
1
1
1
−√
−√
−2 √
= −2
32
( 4)5
16 · 2
25
#
$
1
1
1
1
− √ = √ −
−2
32 4 2
2 2 16
√
√ √
√
√
4 2−1
8− 2
8 2−2
2
16 − 2 2
√
√ =
=
.
= √
2 · 16
16
2 2 · 16
2 · 16
2
%4
dx =
2
=
=
=
5
(4.52)
4 Integration
4.6.2
95
Summenregel
Das Integral einer Summe ist gleich der Summe der Integrale:
%
%
%
[f (x) + g(x)]dx = f (x)dx + g(x)dx.
(4.53)
Beispiel:
f (x) = x3 + 2x
%
%
%
x2
x4
x4
+2
=
+ x2 .
(x3 + 2x)dx = x3 dx + 2x dx =
4
2
4
4.6.3
(4.54)
(4.55)
Substitutionsmethode
Bei der Substitutionsmethode versucht man, die zu integrierende Funktion durch Einführen einer
neuen Variablen zu vereinfachen oder auf eine Form zu bringen, die in einer Formelsammlung
gefunden werden kann. Im Allgemeinen führt man in der Substitutionsmethode eine Transformation
auf eine neue Variable u = g(x) durch. Im Integral
%
f (x)dx
(4.56)
muss dazu sowohl die Funktion f (x) als auch das Diﬀerential dx transformiert werden. Für
die Transformation benötigen wir die Umkehrfunktion x = g −1 (u) der Substitutionsfunktion
u = g(x). Mit Hilfe von g und g −1 können wir die Wirkung der Variablentransformation auf die
Funktion ausdrücken als
(4.57)
f (x) = f (g −1 (u)).
Das transformierte Diﬀerential bestimmen wir, indem wir den Ausdruck
du
= g (x)
dx
nach dx auﬂösen:
dx =
du
du
= −1
.
g (x)
g (g (u))
Somit können wir das Integral ausdrücken als
%
%
%
du
du
f (x)dx = f (g −1 (u)) = f (g −1 (u)) −1
.
g (x)
g (g (u))
(4.58)
(4.59)
(4.60)
Wenn wir die Funktion g −1 (u) umbenennen in
ϕ(u) = g −1 (u),
(4.61)
dx
= ϕ (u) ⇒ dx = ϕ (u)du,
du
(4.62)
können wir auch schreiben:
x = ϕ(u),
und somit
%
%
f (x)dx =
f (ϕ(u))ϕ (u)du.
(4.63)
Nach Bestimmung des unbestimmten Integrals, d.h. der Stammfunktion, in der Variablen u erhalten
wir das Integral als Funktion von x durch Rücktransformation zur ursprünglichen Variablen.
96
4 Integration
Die obigen Ausdrücke schauen zunächst beträchtlich komplizierter aus als der Ausdruck, von dem
wir ausgegangen sind. Dass es aber tatsächlich zu einer Vereinfachung kommen kann, zeigen die
folgenden Beispiele.
Beispiel: Zu berechnen ist das Integral
%
(4 + 5x)7 dx.
(4.64)
Hier könnten wir die siebente Potenz der Klammer explizit berechnen und dann Term für Term
integrieren. Einfacher ist es, eine neue Variable einzuführen:
u = 4 + 5x.
(4.65)
Dann gilt du/dx = 5 und somit dx = du/5. Durch Einsetzen erhalten wir
%
%
1 1 8 u8
du
=
u =
.
(4 + 5x)7 dx = u7
5
58
40
(4.66)
Um zur ursprünglichen Variablen zurückzukehren, setzen wir einfach u = 4 + 5x oben ein:
%
(4 + 5x)8
.
(4.67)
(4 + 5x)7 dx =
40
Beispiel:
Zu berechnen ist das Integral
%
1 x 6 − 3x2 dx.
(4.68)
2
Hier versuchen wir es mit u = 6 − 3x2 als Substitutionsfunktion. In diesem Fall ist
du
du
= −3 · 2x = −6x d.h. dx = − .
(4.69)
dx
6x
Wir drücken hier das x im Nenner nicht durch u aus, sondern lassen es einfach stehen und erkennen,
dass es sich nach Einsetzen des Diﬀerentials mit einem Faktor des Integrals kürzt:
%
%
%
√
1 1 √
du
1
x 6 − 3x2 dx =
x u −
udu
=−
2
2
6x
12
1 2 3
1 3
= −
(4.70)
u2 = − u2 .
12 3
18
Rücktransformation ergibt:
%
3
1
1 x 6 − 3x2 dx = − (6 − 3x2 ) 2 .
(4.71)
2
18
Eine so vorteilhafte Kürzung wie in diesem Beispiel ist jedoch nicht immer möglich.
Beispiel:
Wir berechnen das Integral
%
cos(ωt + ϕ)dt,
(4.72)
indem wir die Substitution u = ωt + ϕ durchführen. Dann gilt
du
=ω
dt
Wir haben also
%
und somit
%
cos(ωt + ϕ)dt =
cos u
dt =
du
.
w
du
sin(u)
1
=
= sin(ωt + ϕ).
ω
ω
ω
(4.73)
(4.74)
4 Integration
4.6.4
97
Partielle Integration
Durch Anwendung der Produktregel kann das Produkt zweier Funktionen f (x) und g(x) leicht
diﬀerenziert werden:
d(f (x)g(x))
df
dg
=
g(x) + f (x) ,
dx
dx
dx
(4.75)
(f g) = f g + f g .
(4.76)
oder, etwas kürzer,
Diese Regel kann uns bei der Integration eines Produkts zweier Funktionen behilﬂich sein, falls für
eine oder beide Funktionen die Stammfunktion erkennbar ist und wir also das Integral schreiben
können als:
%
(4.77)
f (x)g(x)dx.
Wenn der Integrand in einer derartigen Form vorliegt, können wir die Produktregel der Diﬀerentiation anwenden und erhalten:
%
%
%
f (x)g(x)dx =
(f (x)g(x)) dx − f (x)g (x)dx
%
= f (x)g(x) − f (x)g (x)dx,
(4.78)
wobei wir einfach ausgenützt haben, dass f (x)g(x) die Stammfunktion von (f (x)g(x)) ist. In Worten ausgedrückt: die Stammfunktion eines Produktes ist gleich dem Produkt der Stammfunktion
der ersten Funktion mit der zweiten Funktion minus dem Integral des Produkts der Stammfunktion der ersten Funktion mit der& Ableitung der zweiten Funktion. &Natürlich hat diese Prozedur nur
dann Sinn, wenn das Integral f g dx einfacher als das Integral f gdx ist.
Beispiel:
Zu berechnen ist das Integral
%
xex dx.
(4.79)
Hier wählen wir f (x) = ex (da ex einfach zu integrieren ist) und g(x) = x. Dann ist
%
%
x
x
e
dx
=
e
x
−
1 ex dx = ex x − ex = ex (x − 1).
x
g
f
f
g
g
(4.80)
f
Die Wahl f (x) = x und g(x) = ex wäre weniger sinnvoll gewesen, denn dann hätten wir
%
%
2
x2
x
x x
e
dx
=
e
−
ex dx
x
2
2
g
g
g f
f
(4.81)
f
erhalten und unser Problem wäre nur schwieriger geworden, da die Funktion x2 ex nicht leichter zu
integrieren ist als die Funktion xex .
Beispiel:
Zu berechnen ist das Integral
%
ln xdx.
(4.82)
98
4 Integration
Hier ist auf den ersten Blick kein Produkt vorhanden, aber wir können den Integranden durch
Multiplikation mit 1 leicht als ein Produkt anschreiben:
%
%
ln xdx = 1 · ln xdx.
(4.83)
Wir wählen jetzt f (x) = 1 und g(x) = ln x und erhalten so
%
%
%
1
·
ln
x
dx
=
x
ln
x
−
x
dx
ln xdx =
1
x
g
g
f
f
f
g
%
= x ln x −
1dx = x ln x − x
= x(ln x − 1).
Beispiel: Zu berechnen ist das Integral
(4.84)
%
cos2 (x)dx.
(4.85)
Wir wählen für dieses Beispiel f (x) = cos(x) und g(x) = cos(x) und erhalten durch partielle
Integration:
%
%
%
2
cos (x)dx =
cos(x) cos(x)dx = sin(x) cos(x) + sin(x) sin(x)dx
%
= sin(x) cos(x) + (1 − cos2 (x))dx
%
%
= sin(x) cos(x) + 1dx − cos2 (x)dx.
(4.86)
Das Integral
4.7
&
1dx = x und durch einfaches Umformen erhalten wir schließlich:
%
1
[sin(x) cos(x) + x] .
cos2 (x)dx =
2
(4.87)
Rotationskörper
Rotieren wir eine durch die Funktion f (x), die beiden Abszissen a und b und die x-Achse begrenzte
Fläche um die x-Achse, so entsteht ein dreidimensionaler Rotationskörper. Zur Berechnung
seines Volumens zerteilen wir das Intervall [a, b] in n gleiche Unterintervalle der Breite ∆x =
(b−a)/n. Zu jedem dieser n Intervalle gehört nun eine dünne Scheibe mit kreisförmiger Grundﬂäche
und einer Dicke ∆x (siehe Abb. 4.11). Der Radius der Grundﬂäche im i-ten Intervall ist für sehr
kleine Dicken ∆x gleich dem Funktionswert f (xi ) an der Stelle xi = a + i∆x. Das Volumen der
Scheibe ist daher
∆Vi = Grundﬂäche × Höhe ≈ f (xi )2 π∆x.
(4.88)
Durch Summation der Volumina aller dünnen Scheiben erhalten wir schließlich das Gesamtvolumen
des Rotationskörpers
V =
n
∆Vi ≈
i=1
n
f (xi )2 π∆x.
(4.89)
i=1
Im Grenzwert ∆x → 0 geht dieser Ausdruck in das Integral
%b
%b
2
V =
f (x)2 dx
f (x) πdx = π
a
a
(4.90)
4 Integration
99
Abbildung 4.11: Rotation einer durch eine Funktion f (x) und der x-Achse in einem Intervall [a, b]
begrenzten Fläche führt zu einem so genannten Rotationskörper.
über. Wir können somit das Volumen eines Rotationskörpers als bestimmtes Integral über die
Funktion f (x)2 ausdrücken.
Beispiel:
Zu berechnen ist das Volumen eines Kegels mit einer Grundﬂäche mit Radius r und einer Höhe
h (siehe Abb. 4.12). Die Funktion f (x) ist in diesem Fall eine Gerade durch den Ursprung mit
Steigung r/h:
f (x) =
r
x.
h
(4.91)
Das Volumen des Kegels ist demnach das bestimmte Integral
%b
!h
%h 2
πr2 x3 !!
1 πr2 h3
r
2
f (x) dx = π
x dx = 2 · ! =
.
h
h
3 0
3 h2
2
V =π
a
(4.92)
0
Somit ist das Volumen des Kegels gegeben durch:
V =
1 2
πr h.
3
(4.93)
Beispiel:
Die Parabel f (x) = 9 − x2 rotiert zwischen ihren Nullstellen um die x-Achse und erzeugt dadurch
einen Rotationskörper (siehe Abb. 4.13). Zu bestimmen ist das Volumen des Rotationskörpers.
Die Nullstellen der Parabel beﬁnden sich bei x = ±3. Das Volumen V des Rotationskörpers ist
100
4 Integration
Abbildung 4.12: Durch Rotation der Geraden y = (r/h)x im Intervall [0, h] um die x-Achse entsteht
ein Kegel mit Höhe h und mit Grundﬂächenradius r.
Abbildung 4.13: Durch Rotation der Parabel f (x) = 9 − x2 zwischen ihren Nullstellen um die
x-Achse entsteht ein Rotationskörper.
demnach gegeben durch:
%3
V
%3
(9 − x ) dx = π
2 2
= π
−3
#
(81 − 18x2 + x4 )dx
−3
$3
18x
x
243
= π 81x −
+
= 2π 81 · 3 − 6 · 27 +
3
5 −3
5
243
648
.
= 2π 243 − 162 +
= 2π ·
5
5
3
5
(4.94)
Beispiel:
Zu bestimmen ist das Volumen einer Kugel mit Radius r. Wir stellen uns dazu vor, dass die
Halbkugel durch Rotation der Kurve
f (x) = r2 − x2
(4.95)
4 Integration
101
Abbildung 4.14: Durch Rotation eines Halbkreises um die x-Achse entsteht eine Halbkugel.
im Intervall [0, r] um die x-Achse entstanden ist (siehe Abb. 4.14). Das Volumen der Kugel ist
somit zweimal das Volumen des Rotationskörpers:
 r

%r
%
%r
V = 2π (r2 − x2 )dx = 2π  r2 dx − x2 dx
0
0
!r
!r
!
x3 !!
r3
2 !
= 2πr x! − 2π ! = 2πr3 − 2π
3
3
0
0
1
4
= 2πr3 1 −
= πr3 .
3
3
4.8
0
(4.96)
Berechnung von Bogenlängen
Abbildung 4.15: Die Bogenlänge des Funktionsgraphen von f (x) kann durch Integration ermittelt
werden. Das Diﬀerential ds der Bogenlänge kann mit Hilfe des Pythagoräischen Lehrsatzes aus den
Diﬀerentialen dx und dy ermittelt werden.
Gegeben sei die Funktion f (x) mit dem dazugehörige Funktionsgraphen in der xy-Ebene. Wir
wollen nun in einem bestimmten Intervall die Länge s des Funktionsgraphen von f (x) berechnen.
(Die Länge einer Kurve wird auch Bogenlänge genannt.) Dazu betrachten wir ein kleines Unterintervall der Länge dx, wobei wir das Diﬀerential benutzen, um anzudeuten, dass es sich hier
um inﬁnitesimale Diﬀerenzen handelt. Das dazugehörige Diﬀerential in der y-Richtung ist gegeben
102
4 Integration
durch:
dy = f (x)dx.
(4.97)
Die Länge ds des von den Abszissen x und x + dx begrenzten Kurvenstücks erhalten wir durch
Anwendung des Pythagoräischen Lehrsatzes:
ds = dy 2 + dx2 .
(4.98)
Hier haben wir ausgenutzt, dass sich die Kurve für inﬁnitesimale dx im Intervall [x, x + dx] durch
eine Gerade approximieren lässt. Wir formen nun die obige Gleichung unter Verwendung von
Gleichung (4.97) um:
ds =
dy 2 + dx2 = (f (x)dx)2 + dx2 = 1 + f (x)2 dx.
(4.99)
Um die Gesamtlänge der Kurve zwischen x = a und x = b zu erhalten, summieren wir über alle
inﬁnitesimalen Unterintervalle und erhalten die Bogenlänge:
s=
%b 1 + f (x)2 dx.
(4.100)
a
Beispiel:
Zu bestimmen ist der Umfang des Kreises mit Radius r. Wir berechnen
zunächst den Umfang des
√
Halbkreises. Der Halbkreis ist der Graph der Funktion f (x) = r2 − x2 und die Integrationsgrenzen sind −r und r (siehe Abb. 4.16).
Abbildung 4.16: Der dargestellte Halbkreis ist der Graph der Funktion y =
[−r, r].
√
r2 − x2 im Intervall
Die Ableitung von f (x) ist
2x
1
x
f (x) = − √
= −√
.
2 r2 − x2
r2 − x2
(4.101)
Somit ist die Bogenlänge s gegeben durch:
s
=
%r "
1+
−r
%r
=
−r
x2
dx =
r2 − x2
r
√
dx =
2
r − x2
%r
−r
%r "
−r
r2 − x2 + x2
dx
r2 − x2
1
2 dx.
1 − xr
(4.102)
4 Integration
103
Zur Lösung des Integrals substituieren wir t = x/r, das heißt dt = dx/r und dx = rdt. Hier müssen
auch die Integrationsgrenzen transformiert werden: an den Stellen x = −r und x = r hat die neue
Variable t die Werte t = −1 und t = 1. Durch die Transformation wird die Bogenlänge zu:
!1
%1
!
r
1
√
√
=
dt = r
dt = r arcsin t!!
2
2
1−t
1−t
−1
−1
−1
' π π (
− −
= rπ.
= r
2
2
%1
s
(4.103)
Der Umfang des Kreises ist dann einfach
U = 2πr.
(4.104)
Für eine in Parameterform gegebene Kurve
x =
x(t),
(4.105)
y
y(t),
(4.106)
=
drücken wir die Diﬀerentiale in x- und y-Richtung aus als:
dx
dx =
dt = ẋ(t)dt,
dt
dy
dy =
dt = ẏ(t)dt.
dt
(4.107)
(4.108)
Abbildung 4.17: Für eine Kurve in Parameterform, r = r(t), kann die Bogenlänge zwischen t = α
und t = β durch Integration berechnet werden.
In diesem Fall ist die inﬁnitesimale Bogenlänge ds gegeben durch
ds = dx2 + dy 2 = ẋ(t)2 dt2 + ẏ(t)2 dt2 = ẋ(t)2 + ẏ(t)2 dt
(4.109)
und die Gesamtbogenlänge ergibt sich aus der Integration über die Hilfsvariable t:
%β s=
ẋ(t)2 + ẏ(t)2 dt.
(4.110)
α
Die Integrationsgrenzen t = α und t = β entsprechen den Punkten, zwischen denen die Bogenlänge
berechnet werden soll (siehe Abb. 4.17).
104
4 Integration
Beispiel:
Zu berechnen ist der Umfang der in Parameterform gegebenen Ellipse
x(t)
= a sin t,
(4.111)
y(t) = b cos t.
(4.112)
a und b sind die Halbachsen der Ellipse und wir nehmen an, dass a > b. Der Parameter t durchläuft
das Intervall [0, 2π].
Die Ableitungen von x(t) und y(t) nach t sind
ẋ =
ẏ =
a cos t,
−b sin t,
(4.113)
(4.114)
und somit kann der Umfang der Ellipse als das Vierfache der Bogenlänge im ersten Quadranten
ausgedrückt werden:
%2 %2 "
b2
2
2
2
2
4
a cos t + b sin tdt = 4a
cos2 t + 2 sin2 tdt
a
π
s
=
π
0
0
π
2
% "
%2 )
2
a − b2
b
1 − sin2 t + 2 sin2 tdt = 4a
1−
4a
sin2 tdt
a
a2
π
2
=
0
0
π
2
=
4a
% 1 − K 2 sin2 tdt,
(4.115)
0
wobei wir hier die Exzentrizität K = (a2 − b2 )/a2 der Ellipse eingeführt haben. Für einen
Kreis ist K = 0 und für eine Ellipse mit a > b ist K > 0.
&
1 − K 2 sin2 t dt hat keine Lösung, die sich mit Hilfe einfacher, bekannter FunktioDas Integral
nen ausdrücken lässt. Man deﬁniert daher einfach eine neue Funktion
%α E(α, K) ≡
1 − K 2 sin2 tdt
|K| < 1.
(4.116)
0
Man nennt diese Funktion ein elliptisches Integral (genauer: ein elliptisches Integral der 2. Art).
Die Funktion kann für ein bestimmtes α und ein bestimmtes K mit dem Computer ausgewertet
werden (z.B. mit Mathematica). In Abb. 4.18 ist die Funktion E(α, K) für α = π/2 als Funktion
von K dargestellt.
Mit Hilfe des elliptischen Integrals E(α, K) kann der Ellipsenumfang schließlich ausgedrückt werden
als
"
a2 − b 2
π
,
.
(4.117)
s = 4aE
2
a2
Beispiel: Archimedische Spirale
Zu bestimmen ist die Länge der Archimedischen Spirale r = aϕ im Bereich von ϕ = 0 bis ϕ = ϑ
(siehe Abb. 4.19).
In Parameterform ist die Spirale gegeben durch
x(ϕ)
=
aϕ cos ϕ,
(4.118)
y(ϕ)
=
aϕ sin ϕ.
(4.119)
4 Integration
105
Abbildung 4.18: Das elliptische Integral der 2. Art E(α, K) für α = π/2 in Abhängigkeit von K.
Die Ableitungen von x(ϕ) und y(ϕ) nach dem Winkel ϕ sind
ẋ =
ẏ =
a cos ϕ − aϕ sin ϕ,
a sin ϕ + aϕ cos ϕ.
(4.120)
(4.121)
Die Bogenlänge der Spirale zwischen ϕ = 0 und ϕ = ϑ ist somit:
s
=
%ϑ (a cos ϕ − aϕ sin ϕ)2 + (a sin ϕ + aϕ cos ϕ)2 dϕ
0
=
%ϑ a
(cos ϕ − ϕ sin ϕ)2 + (sin ϕ + ϕ cos ϕ)2 dϕ
=
%ϑ ((
((
(sin
(sin
(ϕ
(ϕ
a
cos2 ϕ − (
2ϕ(
cos
ϕ + ϕ2 sin2 ϕ + sin2 ϕ + (
2ϕ(
cos
ϕ + ϕ2 cos2 ϕdϕ
0
0
=
%ϑ )
a
cos2 ϕ + sin2 ϕ +ϕ2 (sin2 ϕ + cos2 ϕ)dϕ
0
=1
=1
( !!ϑ
a' 2
2
ϕ 1 + ϕ + Arsinh(ϕ) !!
a
1 + ϕ dϕ =
2
0
0
'
(
a
ϑ 1 + ϑ2 + Arsinh(ϑ)
2
%ϑ
=
=
=
(
a' ϑ 1 + ϑ2 + ln(ϑ + 1 + ϑ2 ) .
2
(4.122)
106
4 Integration
Abbildung 4.19: Die Archimedische Spirale r = aϕ.
4.9
Mittelwerte von Funktionen
Um den Mittelwert von n Zahlen ai zu bestimmen, addiert man die Zahlen und dividiert sie durch
deren Anzahl:
a=
a1 + a2 + a3 + · · · + an−1 + an
,
n
(4.123)
wobei der horizontale Strich über dem a auf der linken Seite der obigen Gleichung einen Mittelwert
bedeutet. a könnte zum Beispiel der Mittelwert einer Reihe von Messdaten sein. Wir wollen nun
das zeitliche Mittel einer Funktion f (t) bestimmen. Dazu stellen wir uns vor, dass wir den Wert
der Funktion beginnend bei t = a nach Zeitschritten ∆t bestimmen. Das heißt, wir bestimmen f (t)
zuerst bei t = a und messen dann f (t) wiederholt zu den Zeitpunkten ti = a + i∆t (siehe Abb.
4.20). Durch diesen Messvorgang erhalten wir n Messwerte f (ti ), die man tabellarisch darstellen
kann als:
ti
t1
t2
t3
...
tn
f (ti )
f (t1 )
f (t2 )
f (t3 )
...
f (tn )
.
Der Mittelwert aller dieser Messwerte ist
f=
f (t1 ) + f (t2 ) + · · · + f (tn )
.
n
Wir multiplizieren jetzt sowohl Zähler als auch Nenner mit ∆t
n
f (ti )∆t
.
f = i=1
n · ∆t
(4.124)
(4.125)
Wir erkennen, dass für sehr kurze Zeitintervalle ∆t der Zähler übergeht in das bestimmte Integral
&b
f (t)dt. Der Nenner ist einfach die Länge des gesamten Intervalls, n∆t = (b − a). Das heißt
a
&b
f=
f (t)dt
1
=
(b − a)
(b − a)
%
a
b
f (t)dt.
(4.126)
a
In Worten kann man dies wie folgt ausdrücken: Der Mittelwert f einer Funktion im Intervall (a, b)
ist gleich dem bestimmten Integral der Funktion f (t) zwischen den Integrationsgrenzen a und b
dividiert durch die Länge des Intervalls [a, b].
4 Integration
107
Abbildung 4.20: Die Funktion f (t) wird zu äquidistanten Zeitpunkten ti bestimmt.
Natürlich gilt auch:
%
b
f (t)dt = f (b − a).
(4.127)
a
Beispiel:
Durch einen Widerstand ﬂießt ein Wechselstrom I(t) = I0 sin ωt und es fällt am Widerstand eine
Spannung U (t) = U0 sin ωt ab. Zu berechnen ist der Mittelwert der Leistung über eine Periode.
Die momentane Leistung ist Strom × Spannung, das heißt
P (t) = U (t) · I(t) = U0 I0 sin2 ωt.
(4.128)
Die Länge der Periode ist T = 2π/ω. Das heißt, die mittlere Leistung ist gegeben durch (siehe
Abb. 4.21)
P
=
=
1
T
%
T
0
I0 U0
T
1
P (t)dt =
T
%T
U0 I0 sin2 ωt dt
0
%T
sin2 ωt dt.
(4.129)
0
Durch partielle Integration hatten wir weiter oben das Integral
ermittelt. Da cos2 x = 1 − sin2 x, folgt für das Integral von sin2 x:
%
&
cos2 xdx =
x 1
1
sin2 x dx = x − (sin x cos x + x) = − sin x cos x.
2
2 2
1
2 (sin x cos x
+ x)
(4.130)
Mit der Substitution u = ωt ⇒ dt = du/ω erhalten wir
%
#
$
1 ωt 1
sin ωt dt =
− sin ωt cos ωt .
ω 2
2
2
(4.131)
108
4 Integration
Abbildung 4.21: Die durchschnittliche an einem Ohmschen Widerstand verbrauchte Leistung lässt
sich durch Integration der Leistung als Funktion der Zeit bestimmen.
und somit
P
=
$ !T
#
!
I0 U0 1 ωt 1
− sin ωt cos ωt !!
T ω 2
2
0

=
1

2π
2π
I0 U0 
1
ωT

ω) cos( ω) −0 + sin(0) cos(0)
− sin( 

ωT
ω ω 2
2
2
=
I0 U0
.
2
=0
4.10

0
(4.132)
Doppelintegrale
So wie wir Funktionen von zwei, drei oder noch mehr Variablen diﬀerenzieren können, können wir
sie auch integrieren. Integration solcher Funktionen führt zu Mehrfachintegralen, die in der Physik sehr oft auftreten, zum Beispiel bei der Bestimmung von Volumina, Massen, Schwerpunkten,
Trägheitsmomenten, Zustandssummen usw. Mehrfachintegrale lassen sich auf die Nacheinanderausführung von gewöhnlichen Integralen zurückführen.
4.10.1
Deﬁnition
Bisher haben wir die durch eine Kurve begrenzte Fläche als bestimmtes Integral berechnet (siehe
Abb. 4.22):
%b
Sab =
f (x)dx.
(4.133)
a
Wir wollen uns nun mit der analogen Aufgabe beschäftigen, das Volumen eines Körpers zu berechnen, der von einer Fläche f (x, y), von einem Bereich A der xy-Ebene und vom vertikal bis zur
Fläche fortgesetzten Rand von A begrenzt wird (siehe Abb. 4.23). Um dieses Volumen zu bestimmen, gehen wir ähnlich vor wie bei der Berechnung der Fläche Sab , die wir in schmale senkrechte
Streifen eingeteilt hatten. Wir teilen dazu den Bereich A in kleine Rechtecke mit Kantenlängen
∆x und ∆y ein, indem wir ein Gitter über die xy-Ebene legen (siehe Abb. 4.24).
Jedes Rechteck wird durch zwei Indizes beschrieben, einem in der x-Richtung (i) und einem in der
y-Richtung (j). In jedem Rechteck (das wir auch Zelle nennen) wählen wir einen Punkt (xi , yj ).
4 Integration
109
Abbildung 4.22: Die Fläche Sab unter einer
Kurve kann durch einfache Integration bestimmt werden.
Abbildung 4.23: Zur Bestimmung des Volumens unter einer Fläche ist eine Doppelintegration notwendig.
Abbildung 4.24: Zur Berechnung des von einer Fläche begrenzten Volumens teilen wir
den Bereich A in der xy-Ebene in viele kleine Rechtecke ein.
Abbildung 4.25: Ein Teilvolumen über einem der kleinen Rechtecke im Bereich A. Die
Höhe des Volumens ist etwa der Funktionswert f (xi , yi ) an der Stelle xi , yi .
Dieser Punkt kann der Mittelpunkt der Zelle sein oder irgendwo anders in der Zelle liegen (auch
am Rand). Zu jedem dieser Punkte (xi , yj ) gibt es einen Funktionswert f (xi , yj ). Das Volumen
über der Zelle, das von der Fläche f (x, y) oben begrenzt wird, ergibt sich näherungsweise aus der
Grundﬂäche ∆x∆y der Zelle multipliziert mit deren Höhe f (xi , yj ) (siehe Abb. 4.25):
∆V ≈ ∆x∆y · f (xi , yj ).
(4.134)
Hier machen wir natürlich einen Fehler, weil dieses Teilvolumen oben nicht durch eine ebene,
horizontale Fläche begrenzt wird. Für kleiner werdende ∆x und ∆y wird dieser Fehler jedoch
immer kleiner. Durch Summation über alle Quader, deren zugehörige Punkte (xi , yj ) in A liegen,
erhalten wir schließlich annäherungsweise das gesuchte Gesamtvolumen V
V ≈
f (xi , yj )∆x∆y.
(4.135)
i
j
Wie beim eindimensionalen Fall nähert die Summe das Volumen immer besser an, je feiner die
Einteilung der xy-Ebene gewählt wird, das heißt je kleiner ∆x und ∆y sind. Im Grenzfall ∆x → 0
und ∆y → 0 erhalten wir das exakte Volumen:
%%
f (xi , yj )∆x∆y =
f (x, y)dxdy.
(4.136)
V = lim lim
∆x→0 ∆y→0
i
j
A
110
4 Integration
Dieser Grenzwert ist das Doppelintegral der Funktion f (x, y) im Gebiet A. Das Produkt
dxdy nennt man auch das Flächenelement. Da das Gebiet A kompliziert sein kann, können wir
nicht wie im eindimensionalen Fall einfache Integrationsgrenzen angeben. Wir schreiben daher
&b
das Gebiet A einfach unter das Doppelintegral. Wie beim Integral a f (x)dx müssen wir diesen
Grenzübergang nicht für jedes Integral neu durchführen. Statt dessen können wir die Berechnung
des Doppelintegrals auf die Berechnung einfacher Integrale zurückführen.
4.10.2
Berechnung von Doppelintegralen
Zur Berechnung eines Doppelintegrals gehen wir von der Summe
V ≈
f (xi , yj )∆x∆y
i
(4.137)
j
aus und führen die Summation über i und j getrennt durch. Zunächst summieren wir für ein
bestimmtes i über alle möglichen Werte von j. Diese Summation entspricht der Berechnung des
Volumens einer Schicht der Dicke ∆x parallel zur yz-Ebene (siehe Abb. 4.26):


Vi = 
f (xi , yj )∆y  ∆x.
(4.138)
j
Abbildung 4.26: Die Summation über alle j für einen bestimmten Wert i ergibt das Volumen einer
Schicht mit der Dicke ∆x, die parallel zur yz-Ebene liegt.
Führen wir jetzt den Grenzwert ∆y → 0 durch, erhalten wir


b(x
% i)


f (xi , y)dy  ∆x.
Vi = 
(4.139)
a(xi )
Dabei hängen die Integrationsgrenzen vom Ort xi ab. In der xy-Ebene wird der Integrationsbereich
A durch die zwei Kurven a(x) und b(x) begrenzt (siehe Abb. 4.27).
Hier gehen wir der Einfachheit halber davon aus, dass der Integrationsbereich nur zwei senkrechte
Tangenten besitzt. Falls das nicht der Fall ist (siehe zum Beispiel Abb. 4.28), muss man dies
berücksichtigen. Auch in diesem Fall ändert sich jedoch die prinzipielle Vorgangsweise nicht.
Das Volumen Vi aus Gleichung (4.139) entspricht dem Volumen über der schraﬃerten Fläche in
Abb. 4.27. Um das Gesamtvolumen zu berechnen, müssen wir noch über alle Teilvolumina Vi
4 Integration
111
Abbildung 4.27: Die Integrationsgrenzen a(x) und b(x) für die Integrationsgrenzen in y-Richtung
hängen von der x-Position ab.
Abbildung 4.28: Falls der Integrationsbereich wie hier mehr als zwei senkrechte Tangenten besitzt,
muss man die Integration in mehrere Doppelintegrale aufteilen.
summieren:

V ≈
Vi =
i
Dieses bestimmte Integral
b(x
& i)


i

b(x
% i)

f (xi , y)dy  ∆x.
(4.140)
a(xi )
f (xi , y)dy auf der rechten Seite der obigen Gleichung ist eine Funk-
a(xi )
tion von xi . Die Abhängigkeit von y ist bereits verschwunden, weil wir über die Integrationsvariable
y integriert haben. Durch Bildung des Grenzübergangs ∆x → 0 erhalten wir schließlich




b(x
b(x)
d
i)
%
%
%




f (xi , y)dy  ∆x = 
f (x, y)dy  dx,
(4.141)
V = lim

∆x→0
i
a(xi )
c
a(x)
wobei wir wieder die Deﬁnition des Integrals als Grenzfall einer Summe benutzt haben. Wir haben
somit die Berechnung des Doppelintegrals auf die hintereinander ausgeführte Berechnung zweier
einfacher Integrale zurückgeführt.
Natürlich hätten wir auch die Integrationsreihenfolge umkehren können:


%b d(y)
%
%b d(y)
%


f (x, y)dx dy =
f (x, y)dxdy.
V = 
a
c(y)
(4.142)
a c(y)
In diesem Fall müssen wir die Integrationsgrenzen für die Integration nach x als Funktion von y
ausdrücken.
112
4 Integration
Beispiel:
Zu berechnen ist das Integral
durch:
&& √
x + y dxdy für einen rechteckigen Bereich A, der gegeben ist
A
1 ≤ x ≤ 2,
(4.143)
0 ≤ y ≤ 5.
(4.144)
Abbildung 4.29: Integrationsbereich A.
In diesem Fall vereinfacht sich die Berechnung, weil die Integrationsgrenzen in y-Richtung nicht
von x abhängen:
%%
√
%5 %2
x + y dxdy
=
A
0
=
2
3
1
%5
0
=
=
=
√
x + y dxdy =
22
35
%5 0
!2 2
3!
(x + y) 2 !!
dy
3
x=1
3
3
(y + 2) 2 − (y + 1) 2 dy
!5
!5 !
5!
(y + 2) !! − (y + 1) 2 !!
5
2
0
0
5
5
22 5
72 − 22 − 62 + 1
35
5
5
4 5
72 − 22 − 62 + 1 .
15
(4.145)
Wenn wir die Integrationsreihenfolge umkehren, erhalten wir:
%%
√
%2 %5
x + ydxdy
=
A
1
=
2
3
√
x + ydydx =
0
%2 %2 1
!5 3!
2
(x + y) 2 !!
dx
3
y=0
3
3
(x + 5) 2 − x 2 dx
1
=
=
!2
!2 2
5!
5!
2
(x + 5) 2 !! − x 2 !!
5
5
1
1
5
5
5
4
72 − 22 − 62 + 1 ,
15
2
3
was mit dem oben erhaltenen Resultat übereinstimmt.
(4.146)
4 Integration
113
Beispiel:
Zu berechnen ist das Volumen des Kugeloktanten einer Kugel mit Radius r (siehe Abb. 4.30). Im
Unterschied zum vorherigen Beispiel müssen wir hier die x-Abhängigkeit der Integrationsgrenzen
in y berücksichtigen.
Abbildung 4.30: Der Kugeloktant ist im ersten Quadranten durch die Fläche z =
nach oben begrenzt.
r2 − x2 − y 2
Die Kugeloberﬂäche im ersten Oktanten ist gegeben durch:
x2 + y 2 + z 2 = r2 ⇒ f (x, y) = r2 − x2 − y 2 .
(4.147)
Das Volumen V8 des Kugeloktanten lässt sich somit als folgendes Doppelintegral ausdrücken:


b(x)
%r %


r2 − x2 − y 2 dy  dx.
V8 = 
(4.148)
0
a(x)
Da die Grenzen für die Integration in y-Richtung
a(x) = 0
sind, erhalten wir:
%r
V8 =
0
√


und
b(x) =
r2 − x2


dy r2 − x2 − y 2  dx.
(4.149)
r%2 −x2
(4.150)
0
Aus einer Formelsammlung entnehmen wir, dass
% 1' 2
y(
y a − y 2 + a2 arcsin
.
a2 − y 2 dy =
2
a
(4.151)
Somit erhalten wir für die Integration in y-Richtung:
√
r%2 −x2
(r2 − x2 ) − y 2 dy
=
0
$√r2 −x2
#
1 2
y
2
2
y (r − x2 ) − y 2 + (r − x ) arcsin √
2
r2 − x2 0
+ π
1*
0 + (r2 − x2 ) arcsin(1) − 0 − 0 = (r2 − x2 ).
2
4
Einsetzen dieses Resultats und Integration in x-Richtung ergibt schließlich
!r
%r
π
x3 !!
π 2
V8 =
(r − x2 )dx =
r2 x −
4
4
3 !0
0
π
r3
r3 π
2 π
3
=
r −
= · · r3 =
,
4
3
3 4
6
=
(4.152)
(4.153)
114
4 Integration
sodass wir für das Kugelvolumen das erwartete Resultat
V =8
4
r3 π
= πr3
6
3
(4.154)
erhalten.
4.10.3
Doppelintegrale in Polarkoordinaten
Oft ist es leichter, den Integrationsbereich A für ein Doppelintegral in Polarkoordinaten auszudrücken. So ist es zum Beispiel bei Integration über einen Kreis mit Radius R einfacher,
den Inte√
grationsbereich
durch 0 ≤ r ≤ R und 0 ≤ ϕ ≤ 2π als durch −R ≤ x ≤ R und − R2 − x2 ≤ y ≤
√
R2 − x2 zu beschreiben. In Polarkoordinaten ist der Integrationsbereich also einfach ein Rechteck,
während wir in kartesischen Koordinaten mit komplizierteren Funktionen arbeiten müssen.
Um diese Vereinfachung auszunützen, können wir die Integration in Polarkoordinaten durchführen.
Dazu drücken wir zuerst die zu integrierende Funktion in Polarkoordinaten aus:
f (x, y) = f (r cos ϕ, r sin ϕ).
(4.155)
Wir müssen allerdings auch das Flächenelement dxdy = dA richtig transformieren. Das Flächenelement dA ergibt sich ja dadurch, dass wir die Variablen x und y um einen kleinen Betrag dx
bzw. dy ändern und dadurch das Flächenelement dA = dxdy erzeugen. Welches Flächenelement
entsteht aber, wenn wir ϕ um dϕ und r um dr ändern?
Abbildung 4.31: Das Flächenelement dA entsteht durch eine Änderung des Winkels ϕ um dϕ und
eine Änderung des Radius r um dr.
Dieses Flächenelement ist von gekrümmten Linien begrenzt (siehe Abb. 4.31). Für sehr kleine dϕ
und dr kann man das Flächenelement mit vernachlässigbarem Fehler als Rechteck mit Seitenlängen
dr und rdϕ betrachten (der Winkel ϕ wird in Bogenmaß angegeben). Der Flächeninhalt dieses
kleinen Rechtecks ist daher:
dA = rdϕdr.
(4.156)
Somit ergibt sich für die Transformation des Integrals von kartesischen Koordinaten zu Polarkoordinaten:
%%
%%
f (x, y)dxdy =
f (r cos ϕ, r sin ϕ)rdϕdr.
(4.157)
A
A
Hier ist A der in Polarkoordinaten beschriebene Integrationsbereich.
4 Integration
115
Beispiel:
Wieder soll das Volumen des Kugeloktanten berechnet werden, diesmal allerdings unter Verwendung von Polarkoordinaten. Transformation des Integrationsbereichs in der xy-Ebene nach Polarkoordinaten ergibt:
%% %% R2 − x2 − y 2 dxdy =
R2 − r2 cos2 ϕ − r2 sin2 ϕrdϕdr
V8 =
K
K
π
2
%
=


%R 
R2 − r2 rdr dϕ,
0
2
(4.158)
0
2
wobei wir ausgenutzt haben, dass sin ϕ + cos ϕ = 1. Da der Integrand nicht vom Winkel ϕ
abhängt, können wir die Integration über ϕ sofort durchführen und erhalten
π
V8 =
2
%R R2 − r2 rdr.
(4.159)
0
Um dieses Integral über r zu bestimmen, führen wir die Substitution u = R2 − r2 durch. Da
du/dr = −2r und somit dr = −du/2r, erhalten wir
%
% √
du
R2 − r2 rdr =
ur
−2r
3
21 3
u2
− u2 = −
3 2
3
1 2
2 32
− (R − r ) .
3
=
=
(4.160)
Einsetzen ergibt schließlich
V8 =
π
2
!R
!
πR3
1
3
− (R2 − r2 ) 2 !! =
,
3
6
0
(4.161)
was mit dem früher erhaltenen Ergebnis übereinstimmt.
Beispiel:
Wir wollen das so genannte Gaußsche Integral
%∞
2
e−x dx
(4.162)
−∞
berechnen. Dieses Integral spielt in der Wahrscheinlichkeitsrechnung und in der statistischen Mechanik eine wichtige Rolle.
Das Gaußsche Integral ist auf direkte Weise nicht leicht zu bestimmen, wir können es aber mit
dem folgenden Trick berechnen. Wir schreiben das Integral zunächst als
 ∞
 12
%∞
%
%∞
2
2
2
e−x dx = 
e−x dx
e−y dy  .
(4.163)
A=
−∞
−∞
−∞
Das können wir ohne weiteres tun, weil der Name der Integrationsvariablen (x oder y) belanglos
ist. Das Produkt der beiden Integrale über x und über y können wir nun als ein Doppelintegral
über die gesamte xy-Ebene auﬀassen.
%∞
2
A =
e
−∞
−x2
%∞
dx ·
−∞
e
−y 2
%∞ %∞
dy =
−∞ −∞
e−(x
2
+y 2 )
dxdy.
(4.164)
116
4 Integration
Abbildung 4.32: Die Fläche unter der Gaußschen Glockenkurve exp(−x2 ) ist A =
√
π.
Diese Darstellung erlaubt eine Transformation auf Polarkoordinaten:
%2π%∞
2
A
=
e
0
−r 2
%∞
rdrdϕ = 2π
0
2
e−r rdr.
(4.165)
0
Hier haben wir ausgenützt, dass gilt r2 = x2 + y 2 . Der Integrand ist somit nicht mehr abhängig von
ϕ, sodass wir die Integration über ϕ gleich ausführen konnten, was einen Faktor von 2π verursacht
hat. Das noch verbleibende Integral über r ist leicht zu lösen. Wir erkennen, dass
2
d −r2
= e−r (−2r)
e
dr
und somit
2
2
1
− e−r = e−r r.
2
d
dr
Durch Einsetzen erhalten wir schließlich
!∞
!
2
1
1
A2 = 2π − e−r !! = 2π (−0 + 1) = π.
2
2
0
(4.166)
(4.167)
(4.168)
Das Gaußsche Integral ist also:
%∞
2
e−x dx =
√
π.
(4.169)
−∞
4.11
Dreifachintegrale
4.11.1
Deﬁnition
Analog zum Doppelintegral können wir auch ein Dreifachintegral (oder im Allgemeinen ein nfaches Integral) deﬁnieren und berechnen. Gegeben sei ein Gebiet B im dreidimensionalen Raum,
das von einer geschlossenen Fläche umgeben wird. Innerhalb dieses Gebiets sei eine Funktion
f (x, y, z) deﬁniert. Als Beispiel können wir uns einen Körper mit einer räumlich nicht uniformen
Dichte ρ(x, y, z) vorstellen.
Wir können die Funktion f (x, y, z) über den Bereich B integrieren, indem wir diesen in kleine
Quader mit Kantenlängen ∆x, ∆y und ∆z einteilen. Das Volumen ∆V jedes Quaders ist
∆V = ∆x∆y∆z.
(4.170)
4 Integration
117
Abbildung 4.33: Bei einer Dreifachintegration wird das Integrationsvolumen in inﬁnitesimale Quader mit Kantenlängen dx, dy und dz, so genannte Volumselemente, eingeteilt.
Wir summieren jetzt den Funktionswert f (xi , yj , zk ) in jedem Quader (z.B. im Quadermittelpunkt)
multipliziert mit dem Volumen ∆V über alle kleinen Quader:
f (xi , yj , zk )∆x∆y∆z.
(4.171)
i
j
k
Wenn wir den Grenzwert ∆x → 0, ∆y → 0 und ∆z → 0 bilden, erhalten wir das Dreifachintegral
von f (x, y, z) über den Bereich B:
%%%
f (x, y, z)dxdydz.
(4.172)
I=
B
Das inﬁnitesimale Volumen dV nennt man das Volumselement. Oft schreiben wir auch
%%%
I=
f (x, y, z)dV
(4.173)
B
oder noch kürzer
%
I=
f (x, y, z)dV.
(4.174)
B
Für das 3d-Integral haben wir keine anschauliche Interpretation als Fläche oder Volumen, da wir
dazu in den 4d-Raum ausweichen müssten. Analog zum Doppel- und Dreifachintegral lassen sich
auch in beliebig hochdimensionalen Räumen Volumsintegrale bilden.
Beispiel:
Wir betrachten einen Körper mit einer inhomogenen Dichteverteilung, der also an unterschiedlichen Stellen unterschiedlich dicht ist. Denken Sie beispielsweise an den Planeten Erde, der einen
metallischen Kern mit hoher Dichte besitzt, der von mineralischen Schichten mit niedrigerer Dichte
umgeben ist. Die Dichteverteilung im Körper sei ρ(x, y, z), wobei die Dichte deﬁniert ist als die
Masse pro Volumen:
ρ(x, y, z) =
dm(x, y, z)
.
dV
(4.175)
Wir wollen nun die Gesamtmasse dieses Körpers berechnen. Dazu addieren wir die Massen aller
inﬁnitesimaler Volumselemente im Körper. Die Masse dm(x, y, z) des Volumselementes dV im
118
4 Integration
Punkt (x, y, z) ist gegeben durch:
dm(x, y, z) = ρ(x, y, z)dV.
(4.176)
Durch Summation (Integration) über alle Volumselemente erhalten wir die Gesamtmasse des
Körpers:
%%%
ρ(x, y, z)dxdydz,
(4.177)
M=
B
wobei B der Bereich ist, der vom Körper ausgefüllt wird.
4.11.2
Berechnung von Dreifachintegralen
Abbildung 4.34: Der Integrationsbereich B wird durch die Flächen ψ1 (x, y) und ψ2 (x, y) begrenzt.
Die Projektion des Bereiches B in die xy-Ebene wird durch die Kurven ϕ1 (x) und ϕ2 (x) begrenzt.
Durch zum zweidimensionalen Fall analoge Überlegungen lässt sich auch das Volumsintegral auf
die Hintereinanderausführung von einfachen Integralen zurückführen (siehe Abb. 4.34). Dazu
bezeichnen wir die beiden Begrenzungskurven der Projektion des räumlichen Bereiches B in die
xy-Ebene mit y = ϕ1 (x) und y = ϕ2 (x). Die Grenzen in x-Richtung bezeichnen wir mit x1 und
x2 und die beiden Begrenzungsﬂächen des räumlichen Bereichs mit z = ψ1 (x, y) und z = ψ2 (x, y).
Dann kann das Dreifachintegral ausgedrückt werden als



ϕ%2 (x)
ψ2%(x,y)
%
%%%



f (x, y, z)dxdydz = dx 
dy 
dzf (x, y, z) .
(4.178)
B
ϕ1 (x)
ψ1 (x,y)
Eine andere Integrationsreihenfolge mit passend geänderten Integrationsgrenzen ist natürlich möglich.
Beispiel:
Wir berechnen als Beispiel das Volumen eines Ellipsoids mit Halbachsen a, b und c (siehe Abb.
4.35). Das Volumen können wir berechnen, indem wir die Funktion f (x, y, z) = 1 über das Ellipsoid
integrieren:
%%%
V =
1 dxdydz,
(4.179)
wobei das Integrationsvolumen durch die Gleichung
x 2 y 2 z 2
+
+
≤1
a
b
c
(4.180)
4 Integration
119
Abbildung 4.35: Ein Ellipsoid, dessen Achsen entlang der Koordinatenachsen verlaufen.
gegeben ist. Das Volumen erhalten wir hier also einfach durch Summation aller Volumselemente,
die sich im Inneren des Ellipsoids beﬁnden.
Die Begrenzungskurve der Projektion des Integrationsbereichs in die xy-Ebene ist für das Ellipsoid
gegeben durch
x2
y2
+ 2 =1
2
a
b
und wird infolgedessen durch die beiden Funktionen
"
x2
ϕ1 (x) = −b 1 − 2
und
a
(4.181)
"
ϕ2 (x) = b
1−
x2
a2
(4.182)
beschrieben. Die Begrenzungsﬂächen im Raum folgen aus der Gleichung
y2
z2
x2
+ 2 + 2 =1
2
a
b
c
(4.183)
und werden durch die Funktionen
"
ψ1 (x, y) = −c
"
x2
y2
1− 2 − 2
a
b
und
1−
ψ2 (x, y) = c
x2
y2
−
a2
b2
(4.184)
beschrieben. In der x-Richtung wir das Ellipsoid durch die beiden Punkte
x1 = −a
x2 = a
(4.185)
begrenzt. Wir können nun die Integrale hintereinander ausführen, wobei wir mit dem Integral über
die Integrationsvariable z beginnen. Für das Integral über z erhalten wir mit den beiden obigen
Begrenzungsﬂächen:
"
ψ2%(x,y)
1dz = ψ2 (x, y) − ψ1 (x, y) = 2c
1−
x2
y2
−
.
a2
b2
(4.186)
ψ1 (x,y)
Als nächstes führen wir die Integration
ϕ%2 (x)
"
2c 1 −
x2
y2
− 2 dy
2
a
b
(4.187)
ϕ1 (x)
über die Variable y durch. Um dieses Integral zu berechnen, führen wir zur Abkürzung den Ausdruck A2 = 1 − x2 /a2 ein und führen die Substitution u = y/b durch. Somit ergibt sich wegen
dy = bdu:
% "
% u
x2
y2
u 2
bA2
arcsin ,
(4.188)
1 − 2 − 2 dy =
A2 − u2 bdu = b
A − u2 +
a
b
2
2
A
120
4 Integration
&√
wobei wir das Integral
A2 − u2 in der Formelsammlung nachgeschlagen haben. Einsetzen gefolgt
von einigen algebraischen Umformungen ergibt
ϕ%2 (x))
1−
x2
a2
−
y2
dy =
b2
ϕ1 (x)
)
y
x2 b
x2
y2
by
arcsin b
=
1− 2 − 2 + 1− 2
a
b
a
2
2b
1−
"
x2
=b 1− 2
a
q
!y=b
!
!
!
x2 !
2
1− x
a2
q
x2
a2 y=−b 1− a2
)
x2 b
x2
x2
[arcsin(1) − arcsin(−1)] . (4.189)
1− 2 − 1− 2 + 1− 2
a
a
a
2
=0
Durch Auswerten der Arkussinusfunktion an den Stellen −1 und +1 erhalten wir schließlich:
ϕ%2 (x))
1−
x2
a2
−
y2
dy =
b2
x2 bπ
.
1− 2
a
2
(4.190)
ϕ1 (x)
Um das Volumen V zu berechnen, müssen wir noch die Integration über x durchführen. Da x als
einfaches Quadrat im Integranden vorkommt, verursacht dies keine Schwierigkeiten:
!a
%a bπ
x2
x3 !
x2
=
2c
1 − 2 dx = cbπ x − 2 !!
1 − 2 dx = cbπ
2
a
a
3a
−a
−a
−a
3
2a
2a
6−2
.
= cbπ 2a − 2 = cbπ 2a −
= acbπ
3a
3
3
%a
V
(4.191)
Das Volumen des Ellipsoids ist also
V =
4.11.3
4
πacb.
3
(4.192)
Dreifachintegrale in Zylinder- und Kugelkoordinaten
In manchen Fällen kann es auch vorteilhaft sein, Volumsintegrale in Zylinderkoordinaten oder in
Kugelkoordinaten zu berechnen. In Zylinderkoordinaten müssen wir beachten, dass das Volumselement wie folgt transformiert (anschaulich ergibt sich dies aus zum Doppelintegral analogen Überlegungen):
dxdydz = ρdρdϕdz.
Somit ist das Integral gegeben durch
%%%
%%%
f (x, y, z)dxdydz =
B
f (ρ cos ϕ, ρ sin ϕ, z)ρdρdϕdz,
B
wobei B das in Zylinderkoordinaten ausgedrückte Integrationsgebiet ist.
(4.193)
(4.194)
4 Integration
121
Beispiel: Volumen eines Zylinders
Wir berechnen das Volumen eines Zylinders mit Radius r und Höhe h als Integral V =
das Innere des Zylinders:
% r % h % 2π
V =
ρdϕdzdρ
0
%
0
r
%
=
&
dV über
0
h
2πρdhdρ
0
%
0
r
2πhρdρ = 2πh
=
0
r2
= πr2 h.
2
(4.195)
In Kugelkoordinaten ist das Volumselement:
dV = dxdydz = r2 dr sin ϑdϑdϕ,
was man sich geometrisch leicht klarmachen kann. Das Integral wird zu
%%%
%%%
f (x, y, z)dxdydz =
f (r sin ϑ cos ϕ, r sin ϑ cos ϕ, r cos ϑ)r2 dr sin ϑdϑdϕ,
B
(4.196)
(4.197)
B
wobei B das in Kugelkoordinaten deﬁnierte Integrationsgebiet ist.
Beispiel: Schwerpunkt einer Halbkugel
Zu bestimmen ist der Schwerpunkt einer homogenen Halbkugel mit Radius R. Im Allgemeinen ist
der Schwerpunkt eines Körpers mit homogener Dichte gegeben durch
%
1
rdV.
(4.198)
rS =
V V
Wir legen die Halbkugel so in ein kartesisches Koordinatensystem, dass die Schnittﬂäche in der
xy-Ebene liegt und sich die Halbkugel auf der Seite der positiven z-Achse beﬁndet. Aus Symmetriegründen muss der Schwerpunkt auf der z-Achse liegen, d. h. xS = 0 und yS = 0. Zu berechnen
bleibt die z-Komponente des Schwerpunktes. In Kugelkoordinaten haben wir:
%
1
zdV
zS =
V V
%
% %
1 R π/2 2π
=
(r cos ϑ)r2 sin ϑdϕdϑdr
V 0 0
0
% %
2π R π/2 3
=
r cos ϑ sin ϑdϑdr
V 0 0
%
2π 1 R 3
=
r dr
V 2 0
π R4
6π R4
3
=
=
= R,
(4.199)
V 4
4πR3 4
8
wobei wir verwendet haben, dass das Volumen der Halbkugel 4πR3 /6 ist.
4.12
Integration von vektorwertigen Funktionen
Betrachten wir eine vektorwertige Funktion A(t)
einer skalaren Variablen t, z.B. die Geschwindigkeit v (t) eines Teilchens. Wir können nun ein Integral über diese Funktion deﬁnieren, indem wir
122
4 Integration
ein Intervall [ta , tb ] in die Teilintervalle [ti , ti+1 ] zerlegen und die Summe
N
i )∆ti
A(t
(4.200)
i=1
bilden. Hier besteht A(t)
aus drei Komponenten A(t)
= (Ax (t), Ay (t), Az (t)). Da die Summe von
Vektoren komponentenweise durchgeführt wird, haben wir

 (t
)∆t
A
N
x
i
i

i )∆ti = 
A(t
(4.201)

Ay (ti )∆ti  .
i=1
Az (ti )∆ti
Im Grenzfall einer unendlich feinen Intervallzerlegung erhalten wir das Integral

 &
%
Ax (t)dt

 &
A(t)dt
=  Ay (t)dt  .
&
Az (t)dt
(4.202)
Das heißt, das Integral über eine vektorwertige Funktion einer skalaren Variablen ist ein Vektor,
dessen Komponenten die Integrale der Komponentenfunktionen Ax (t), Ay (t) und Az (t) sind.
Beispiel:
Das Integral der vektorwertigen Funktion


t + t2

=
A(t)
 e−6t 
1
(4.203)
sei über das Intervall [0, 1] zu berechnen. Wir führen die Integration über t komponentenweise
durch:


&1
 2
!1 
2
t
t3 !
 (t + t )dt 


+
5
  2
 0
3 !0 
% 1
 
 &1
6


! = 1
−6 
A(t)dt
= 
(4.204)
1 −6t !1 
e−6t dt  = 
  6 (1 − e )  .

−
e
 
 0
6
0 
0


1
&1


1
t|0
1 dt
0
Beispiel:
Ein zum Zeitpunkt t = 0 ruhendes Objekt erfährt eine zeitlich veränderliche Beschleunigung a(t).
Die Geschwindigkeit zum Zeitpunkt t ist dann gegeben durch:
% t
v (t) =
a(s)ds
(4.205)
0
Teil II
Einführung in die Physikalischen
Rechenmethoden II
123
Kapitel 5
Die Taylorreihe
In der Physik ist es oft zweckmäßig, Funktionen als so genannte Potenzreihen auszudrücken, zum
Beispiel:
sin x = x −
x5
x7
x3
+
−
− ···
3!
5!
7!
(5.1)
In den folgenden Abschnitten werden wir lernen, wie man dies auf eine systematische Weise tun
kann.
5.1
Folgen und Reihen
Um den Begriﬀ der Reihe einzuführen, müssen wir uns zunächst mit Folgen auseinander setzen. Eine Folge ist eine Funktion, die als Deﬁnitionsbereich die natürlichen Zahlen besitzt. Diese
Funktion ordnet jeder natürlichen Zahl n (dem Index) einen Funktionswert an zu. Die einzelnen
Funktionswerte an werden die Glieder der Folge genannt. Für die Gesamtheit der Folgenglieder
a1 , a2 , a3 , · · · schreiben wir oft auch {an } und verwenden den Begriﬀ Folge auch, um diese Menge
zu bezeichnen.
Beispiel:
Die Folge an = 1/n hat die Glieder a1 = 1, a2 = 1/2, a3 = 1/3 und so weiter. Die Folge an = (−1)n n
besteht aus den Zahlen a1 = −1, a2 = 2, a3 = −3, a4 = 4, usw.
Wenn wir bei der Zahlenfolge an = 1/n die Zahl n unbegrenzt wachsen lassen, strebt 1/n gegen
Null. Man nennt dies den Grenzwert der Folge an = 1/n für n → ∞. Im Allgemeinen strebt die
Zahlenfolge an gegen einen Grenzwert a, wenn für jede positive (und beliebig kleine) Zahl ε eine
Zahl nε existiert, sodass |an − a| < ε für n > nε . Das heißt, dass sich die Folge an beliebig genau
der Zahl a nähert, wenn wir n gegen unendlich gehen lassen. Wir schreiben dafür
a = lim an .
n→∞
(5.2)
Man sagt auch: die Zahlenfolge an konvergiert gegen a. Eine Zahlenfolge, die keinen Grenzwert besitzt, heißt divergent. Zum Beispiel konvergiert die Zahlenfolge an = 1 + 1/n gegen 1:
limn→∞ (1 + 1/n) = 1. Die Zahlenfolge an = n2 wächst mit zunehmendem n unbegrenzt. Diese
Folge ist divergent.
Reihen können als spezielle Folgen aufgefasst werden. Für eine gegebene Zahlenfolge {an } deﬁ125
126
5 Die Taylorreihe
nieren wir die m-te Partialsumme als
a1 + a2 + a3 + · · · + am =
m
a i = sm .
(5.3)
i=1
Die Folge {sm } der Partialsummen bezeichnet man als Reihe. Falls der Grenzwert
S = lim sm = lim
m→∞
m→∞
m
ai
(5.4)
i=1
der Folge der Partialsummen existiert, sagt man die Reihe konvergiert. Man nennt S dann die
Summe der Reihe oder auch den Wert der Reihe.
Beispiel:
Gegeben sei die Zahlenfolge
1 1 1
1
1, , , , · · · , , · · · .
2 3 4
n
(5.5)
Die Partialsummen dieser Folge sind:
s1
=
s2
=
s3
=
s4
=
···
sn
1,
(5.6)
1
1+ ,
2
1
1+ +
2
1
1+ +
2
(5.7)
1
,
3
1 1
+ ,
3 4
1
1 1 1
= 1 + + + + ···+ ,
2 3 4
n
···
(5.8)
(5.9)
(5.10)
Beispiel: Die geometrische Reihe
Bei der geometrischen Reihe ergibt sich jeder Summand aus dem vorhergehenden durch Multiplikation mit einem (reellen) Faktor q:
a + aq + aq 2 + · · · + aq n + · · ·
(5.11)
Wir wollen zunächst die m-te Partialsumme
sm =
m
aq i
(5.12)
i=0
der ersten m + 1 Glieder berechnen (wir zählen hier zur Abwechslung von 0 weg). Dazu multiplizieren wir die Reihe mit q und subtrahieren dann davon die ursprüngliche Reihe:
sm q
=
−sm
=
sm (q − 1) =
aq + aq 2 + aq 3 + · · · + aq m + aq m+1
(5.13)
−a − aq − aq 2 − aq 3 − · · · − aq m
(5.14)
−a + 0 + 0 + 0 + · · · + 0 + aq m+1 .
(5.15)
Daraus folgt
sm
=
a(q m+1 − 1)
.
q−1
(5.16)
5 Die Taylorreihe
127
Wir können nun auch den Wert der geometrischen Reihe für unendlich viele Summenglieder betrachten:
s = lim a
m→∞
q m+1 − 1
.
q−1
(5.17)
Falls |q| > 1, wächst q m+1 über alle Grenzen und damit auch s. Die Reihe konvergiert in diesem
Fall also nicht. Falls aber |q| < 1, verschwindet q m+1 im Limes m → ∞ und wir erhalten
s=a
a
0−1
=
.
q−1
1−q
(5.18)
Für |q| < 1 ist die geometrische Reihe also konvergent. Zum Beispiel gilt:
1+
5.2
1 1 1
1
+ + + ··· =
2 4 8
1−
1
2
= 2.
(5.19)
Entwicklung einer Funktion in eine Taylorreihe
Wir haben gerade gesehen, dass für −1 < x < 1 gilt
1 + x + x2 + x3 + · · · =
1
.
1−x
(5.20)
(Wir haben in der Summenformel für die geometrische Reihe einfach q in x umbenannt.) Wir
betrachten nun beide Seiten dieser Gleichung als Funktion von x und erkennen, dass man die
1
im Bereich −1 < x < 1 als eine unendliche Summe von Potenzen von x schreiben
Funktion 1−x
kann. Die Reihe 1 + x + x2 + x3 + . . . ist ein Beispiel für eine Potenzreihe. Im Allgemeinen hat eine
unendliche Potenzreihe die Form
a0 + a1 x + a2 x2 + a3 x3 + · · · =
∞
an xn .
(5.21)
n=0
1
Es stellt sich natürlich sofort die Frage, ob neben 1−x
auch andere Funktionen als unendliche
Potenzreihe dargestellt werden können und, wenn ja, wie die zugehörigen Koeﬃzienten ai auf
systematische Art und Weise ermittelt werden können. Die Antwort auf diese Frage liegt im Begriﬀ
der Taylorreihe, die wir in diesem Abschnitt besprechen wollen.
Wir machen zunächst die Annahme, dass eine bestimmte Funktion f (x) als Potenzreihe mit reellem
Koeﬃzienten an dargestellt werden kann
f (x) =
∞
an xn = a0 + a1 x + a2 x2 + a3 x3 + · · · .
(5.22)
n=0
Eine solche Darstellung nennen wir auch die Potenzreihenentwicklung von f (x) und sagen,
dass die Funktion f (x) in eine Potenzreihe entwickelt wurde. Wir müssen nun für die Funktion
f (x) die passenden Koeﬃzienten ermitteln. Dies können wir tun, indem wir verlangen, dass die
Funktion f (x) und alle ihre Ableitungen mit der Reihe beziehungsweise mit allen ihren Ableitungen
übereinstimmen. Wenn die Darstellung aus Gleichung (5.22) möglich ist, muss das an jeder Stelle
x gelten und somit auch für x = 0. Für die Funktion selbst folgt daraus
f (0) = a0 + a1 0 + a2 0 + · · · = a0 ,
(5.23)
weil alle Terme, die ein x enthalten, wegen x = 0 verschwinden. Ableiten beider Seiten von Gleichung (5.22) nach x liefert
f (x) = a1 + 2a2 x + 3a3 x2 + 4a4 x3 + · · · ,
(5.24)
128
5 Die Taylorreihe
wobei wir die Reihe auf der rechten Seite Glied für Glied diﬀerenziert haben. An der Stelle x = 0
gilt infolgedessen:
f (0) = a1 ,
(5.25)
da wieder alle Terme, die ein x enthalten, verschwinden. Durch nochmaliges Ableiten erhalten wir
f (x) = 2a2 + 2 · 3a3 x + 3 · 4a4 x2 · · ·
(5.26)
und somit
f (0) = 2a2
oder a2 =
f (0)
.
2
(5.27)
Ganz analog ﬁnden wir durch weiteres Diﬀerenzieren und Auswertung bei x = 0:
f (0)
= a3 ,
2·3
f (0)
= a4 ,
4·3·2
usw.
(5.28)
Für den Koeﬃzienten an erhalten wir aus der Forderung nach Übereinstimmung der n-ten Ableitung von Funktion und Reihe:
f (n) (0) = n · (n − 1)(n − 2) · · · 2 · 1 · an
(5.29)
oder
an =
f (n) (0)
.
n!
(5.30)
Wir einigen uns darauf, dass 0! = 1 sein soll. Falls die Funktion f (x) also als Potenzreihe dargestellt
werden kann und die Funktion f (x) beliebig oft diﬀerenzierbar ist, ﬁnden wir durch Einsetzen der
Koeﬃzienten
f (x) = f (0) +
∞
f (0)
f (x) 2 f (0) 3
f (n) (0) n
x+
x +
x + ··· =
x .
1!
2!
3!
n!
n=0
(5.31)
Diese Potenzreihe ist die so genannte Taylorreihe (oft wird diese Reihe auch MacLaurin-Reihe
genannt).
Beispiel:
Wir wollen die Exponentialfunktion ex in eine Taylorreihe entwickeln. Dazu ermitteln wir zunächst
die Ableitungen:
f (x) = ex ,
f (x) = ex ,
(5.32)
(5.33)
f (x) = ex ,
f (x) = ex ,
..
.
(5.34)
(5.35)
f (n) (x) = ex ,
..
.
(5.36)
An der Stelle x = 0 sind also alle Ableitungen gleich:
f (n) (x = 0) = 1.
(5.37)
Somit ist die Taylorentwicklung von ex gegeben durch:
ex = 1 +
∞
x2
x3
xn
x
+
+
+ ··· =
.
1!
2!
3!
n!
n=0
(5.38)
5 Die Taylorreihe
129
Da die Fakultät n! für jede Zahl x mit n schneller wächst als xn , werden die Reihenglieder immer
kleiner und die Reihe konvergiert. Für x = 1 haben wir zum Beispiel
e=1+1+
1
1 1
+ +
+ · · · = 2, 71828 . . .
2 6 24
(5.39)
Beispiel:
Zur Taylorreihenentwicklung der Funktion sin(x) bestimmen wir zunächst die Ableitungen:
f (x) = sin x,
(5.40)
f (x) = cos x,
f (x) = − sin x,
(5.41)
(5.42)
f (x) = − cos x,
(5.43)
f (x) = sin x,
..
.
(5.44)
An der Stelle x = 0 haben wir also
f (0) = 0;
f (0) = 1;
f (0) = 0;
f (0) = −1,
usw.
(5.45)
Damit wird die Reihe zu
sin x = x −
∞
x5
x7
x3
x2n+1
+
−
+ ··· =
.
(−1)n
3
5!
7!
(2n + 1)!
n=0
(5.46)
Beispiel:
1
Wir wollen nun die Funktion 1−x
taylorentwickeln (obwohl wir die zugehörige Potenzreihe ja bereits
kennen) und bestimmen zunächst die Ableitungen
f (x) = (1 − x)−1 ,
f (x) = (−1)(1 − x)−2 (−1) = (1 − x)−2 ,
(5.47)
(5.48)
f (x) = (−2)(1 − x)−3 (−1) = 2(1 − x)−3 ,
2·3
,
f (x) = 2(−3)(1 − x)−4 (−1) =
(1 − x)4
2·3·4
4!
=
,
f (x) =
5
(1 − x)
(1 − x)5
..
.
n!
(n)
.
f (x) =
(1 − x)n+1
(5.49)
(5.50)
(5.51)
(5.52)
An der Stelle x = 0 haben wir also
f (0) = 1;
f (0) = 1;
f (0) = 2;
f (0) = 3!;
...
f n (0) = n!
(5.53)
Einsetzen ergibt dann wie erwartet
∞
1
= 1 + x + x2 + · · · =
xn .
1−x
n=0
(5.54)
130
5.3
5 Die Taylorreihe
Allgemeine Taylorentwicklung
Bisher haben wir eine Funktion f (x) an der Stelle x = 0 in eine Potenzreihe entwickelt, das heißt,
wir haben die Ableitungen der Funktion an der Stelle x = 0 verwendet, um den Wert der Funktion
an einer anderen Stelle zu ermitteln. Oft ist es jedoch zweckmäßig, eine Funktion an einer von 0
verschiedenen Stelle x0 zu entwickeln. Eine solche Entwicklung hat die Gestalt:
f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . .
(5.55)
Um die Werte der Koeﬃzienten a0 , a1 , a2 , . . . , usw. zu bestimmen, könnten wir jetzt genauso
vorgehen wie bei der Taylorentwicklung an der Stelle x = 0. Einfacher ist es jedoch, eine Variablentransformation durchzuführen. Wir deﬁnieren die Hilfsvariable u als
u = x − x0 .
(5.56)
Diese Variable hat an der Stelle x = x0 den Wert 0. Wir drücken jetzt die Variable x aus als
x = u + x0 und betrachten die Funktion f (x) als eine Funktion der Hilfsvariablen u:
f (x) = f (u + x0 ).
(5.57)
Diese Funktion entwickeln wir in der Variablen u an der Stelle u = 0 in eine Taylorreihe. Dazu
benötigen wir die Ableitung von f (u + x0 ) nach u. Da dx/du = 1, ergibt die Anwendung der
Kettenregel für die erste Ableitung
df dx
df
df
=
=
.
du
dx du
dx
(5.58)
Durch wiederholte Anwendung der Kettenregel erhalten wir ebenso für die n-te Ableitung
dn f
dn f
= n.
n
du
dx
(5.59)
Infolgedessen ist die Taylorentwicklung von f (u + x0 ) an der Stelle u = 0 gegeben durch:
f (u + x0 ) = f (0 + x0 ) + f (0 + x0 )u + f (0 + x0 )
∞
f (n) (0 + x0 )un
u2
+ ··· =
.
2
n!
n=0
(5.60)
Wir transformieren wieder zurück zu x, indem wir u durch x − x0 ersetzen und erhalten
f (x) = f (x0 ) + f (x0 )(x − x0 ) +
∞
f (n) (x0 )
f (x0 )
(x − x0 )2 + · · · =
(x − x0 )n .
2!
n!
n=0
Die Kenntnis der Funktion und aller ihrer Ableitungen an der Stelle x0 versetzt uns also in die
Lage, den Wert der Funktion an einer anderen Stelle x zu bestimmen. Geometrisch entspricht
das Einführen der Hilfsvariablen u = x − x0 einer Transformation (Verschiebung) in ein neues
Koordinatensystem mit Ursprung in x0 (siehe Abb. 5.1).
Beispiel:
Entwicklung der Funktion ex an der Stelle x = 2 ergibt
ex = e2 ex−2 = e2 + e2 (x − 2) +
5.4
∞
(x − 2)n
e2
(x − 2)2 + · · · = e2
.
2!
n!
n=0
(5.61)
Abgebrochene Taylorreihenentwicklung
Der große Nutzen der Taylorreihenentwicklung besteht darin, dass komplizierte Funktionen wie
sin(x) oder exp(x) in eine Summe von einfachen Potenzen verwandelt werden können. Erst eine solche Reihenentwicklung erlaubt es uns, numerische Werte für diese Funktion zu bestimmen.
5 Die Taylorreihe
131
Abbildung 5.1: Die Taylorentwicklung einer Funktion an der Stelle x0 entspricht der Taylorentwicklung der um x0 verschobenen Funktion an der Stelle 0.
(Wenn wir zum Beispiel mit unserem Taschenrechner den Sinus eines bestimmten Winkels berechnen, wird dies mittels einer Reihenentwicklung erledigt.) Allerdings können wir nicht unendlich
viele Glieder einer Taylorreihe auswerten. Das müssen wir aber auch nicht. Bei einer konvergenten
Potenzreihe werden die Beiträge der Reihenglieder mit höheren Potenzen von x zunehmend kleiner
und die Reihe kann nach endlich vielen Gliedern abgebrochen werden. Dabei nimmt man natürlich
einen Fehler in Kauf, der umso kleiner ist, je später die Reihe abgebrochen wird.
Wir gehen von der Potenzreihe
f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . .
(5.62)
aus und brechen sie nach dem Glied mit der n-ten Potenz ab. Wir teilen die Reihenentwicklung
also in zwei Teile ein: in ein Näherungspolynom n-ten Grades,
pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n
(5.63)
und einen Rest
Rn (x) = an+1 (x − x0 )n+1 + · · · =
∞
ai (x − x0 )i .
(5.64)
i=n+1
Das Näherungspolynom pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n ist eine Näherung
n-ter Ordnung der Funktion f (x). Der Rest Rn (x) ist der Fehler, den wir machen, wenn wir die
Reihe nach dem Glied n-ter Ordnung abbrechen und die Funktion durch das Näherungspolynom
ersetzen.
Je mehr Glieder die Entwicklung enthält, umso kleiner wird dieser Fehler. Die Größe des Fehlers
hängt natürlich auch vom Ort x ab. Je näher wir der Entwicklungsstelle x0 sind, umso kleiner ist
(x − x0 ) und umso schneller konvergiert deshalb die Reihe.
Betrachten wir als Beispiel die Taylorentwicklung der Funktion sin x an der Stelle x0 = 0 (siehe
Abb. 5.2):
x5
x7
x3
+
−
+ ...
(5.65)
3!
5!
7!
Wenn wir diese Entwicklung nach dem ersten Glied abbrechen, approximieren wir den Sinus durch
sin x = x −
sin x ≈ x,
(5.66)
132
5 Die Taylorreihe
Abbildung 5.2: Taylorentwicklung der Funktion sin(x) abgebrochen nach dem Term 1. Ordnung,
dem Term 3. Ordnung und dem Term 5. Ordnung.
also durch eine Gerade mit Steigung 1, die durch den Ursprung geht. An der Stelle x = 0 stimmt
unsere lineare Näherung also mit dem Sinus überein und hat an dieser Stelle auch dieselbe Steigung. Für größere x-Werte weicht unsere Näherung jedoch zunehmend von der Funktion sin x
ab.
Wenn wir den nächsten nichtverschwindenden Term der Entwicklung mitnehmen, also sin x durch
sin x ≈ x −
x3
3!
(5.67)
approximieren, dehnen wir den Bereich, in dem die Funktion und ihre Näherung (Approximation)
gut übereinstimmen, etwas aus. Noch etwas größer wird dieser Bereich, wenn wir erst nach dem
Term 5. Ordnung abbrechen:
sin x ≈ x −
x5
x3
+ .
3!
5!
(5.68)
Zusätzliche Glieder dehnen den Übereinstimmungsbereich weiter aus.
Mit Hilfe der Taylorentwicklung können wir nun auch verstehen, warum Schwingungsvorgänge mit
kleiner Amplitude immer auf die Bewegungsgleichung des harmonischen Oszillators führen (siehe
Abb. 5.3). Stellen wir uns dazu ein mechanisches System vor, das sich in seiner stabilen Ruhelage
beﬁndet. Der Einfachheit halber beschränken wir uns hier auf ein eindimensionales System. Eine
analoge Behandlung ist aber auch in höherdimensionalen Systemen möglich. Das heißt, dass keine
Kräfte auf das System wirken und es sich infolgedessen in einem Minimum seiner potentiellen
Energie aufhalten muss.
Wir entwickeln nun die potentielle Energie V (x) an der Stelle des Minimums x0 in eine Taylorreihe
V (x) = V (x0 ) + V (x0 )(x − x0 ) + V (x0 )
(x − x0 )2
(x − x0 )3
+ V (x0 )
+ ···
2!
3!
(5.69)
Da nach Voraussetzung die potentielle Energie an der Stelle x0 ein Minimum besitzt, verschwindet
die erste Ableitung an dieser Stelle. Infolgedessen ist das quadratische Glied der erste Term in der
Entwicklung, der von x abhängt. Für kleine Auslenkungen (x − x0 ) können wir die Taylorreihe
5 Die Taylorreihe
133
Abbildung 5.3: In der Nähe des Potentialenergieminimums lässt sich die potentielle Energie als
quadratische Funktion der Koordinaten betrachten.
nach dem quadratischen Term abbrechen,
(x − x0 )2
.
2!
Damit nähern wir das Potential V (x) also durch eine Parabel an.
V (x) ≈ V (x0 ) + V (x0 )
(5.70)
Die Kraft F , die auf das System wirkt, ergibt sich aus der Ableitung der potentiellen Energie:
dV
V (x0 )
=−
2(x − x0 ) = −V (x0 )(x − x0 ).
dx
2
Die Newtonsche Bewegungsgleichung für unser System ist also
F (x) = −
(5.71)
d2 x
= F (x) = −k(x − x0 ),
(5.72)
dt2
wobei wir die Krümmung des Potentials an der Stelle x0 mit k bezeichnet haben, k = V (x0 ).
m
Wir deﬁnieren jetzt die Auslenkung aus der Ruhelage als
u = x − x0 .
Wegen du
dt =
schreiben als:
d(x−x0 )
dt
=
dx
dt
gilt auch
2
d u
dt2
m
=
2
d x
dt2
(5.73)
und wir können die Bewegungsgleichung (5.72)
d2 u
= −ku.
dt2
(5.74)
Das ist genau die Bewegungsgleichung des harmonischen Oszillators (siehe Kapitel 10), bei dem die
Rückstellkraft proportional zur Auslenkung ist. Die Proportionalitätskonstante ist die Krümmung
des Potentials im Minimum. Für größere Auslenkungen aus der Ruhelage kann die Näherung des
Potentials als Parabel jedoch zusammenbrechen. Ist dies der Fall, kann das System nicht mehr als
harmonischer Oszillator beschrieben werden.
5.5
Fehlerabschätzung
Wenn man eine Taylorreihe abbricht, ist damit immer ein gewisser Fehler verbunden. Der Mathematiker Joseph-Louis Lagrange hat bewiesen, dass der Rest Rn der Potenzreihe, also der Fehler,
134
5 Die Taylorreihe
ausgedrückt werden kann als
Rn (x) =
f (n+1) (ξ)
(x − x0 )n+1 .
(n + 1)!
(5.75)
Dies ist das Lagrangesche Restglied.
Hier ist ξ eine Zahl, die zwischen x0 (die Stelle, an der entwickelt wird) und x liegt. Die Zahl ξ
ist jedoch nicht genauer bestimmt: wir wissen nur, dass im Intervall zwischen x0 und x eine Zahl
ξ existiert, sodass Gleichung (5.75) gilt. Um den Fehler abzuschätzen, können wir nun ξ von x0
bis x variieren. An irgendeiner Stelle ξ0 wird das Restglied Rn (x) maximal sein. Wir wissen dann,
dass der tatsächliche Fehler, der durch das Abbrechen der Taylorreihe entsteht, nicht größer sein
kann als dieser maximale Wert.
Die Formel (5.75) für das Lagrangesche Restglied kann auf folgende Weise hergeleitet werden. Der
Wert einer diﬀerenzierbaren Funktion f (x) an der Stelle x kann ausgedrückt werden als:
% x
f (x) = f (x0 ) +
f (t)dt.
(5.76)
x0
Durch partielle Integration erhalten wir
%
% x
x
f (t)dt = f (x)(t − x)|x0 −
x
f (t)(t − x)dt
x0
% x
f (t)(x − t)dt.
= f (x)(x − x) − f (x0 )(x0 − x) +
x0
(5.77)
x0
&
&
Hier haben wir die partielle Integrationsregel uv dx = uv − u v dx mit u = f und u = f sowie v = 1 und v = t − x verwendet. Einsetzen in den Ausdruck (5.76) ergibt:
% x
f (x) = f (x0 ) + f (x0 )(x − x0 ) +
f (t)(x − t)dt.
(5.78)
x0
Nochmalige partielle Integration, diesmal mit u = f
v = −(t − x)2 /2, liefert:
f (x) = f (x0 ) + f (x0 )(x − x0 ) + f (x0 )
und u = f sowie v = (x − t) und
(x − x0 )2
+
2
%
x
x0
f (t)
(x − t)2
dt.
2
(5.79)
Nach n-maliger partieller Integration erhalten wir
f (x) =
(x − x0 )2
+ ···
f (x0 ) + f (x0 )(x − x0 ) + f (x0 )
2
%
x
(x − x0 )n
(x − t)n
+f (n) (x0 )
+
dt.
f (n+1) (t)
n!
n!
x0
(5.80)
Dies ist einfach die Taylorentwicklung von f (x) um die Stelle x0 nun aber mit einem expliziten
Ausdruck für das Restglied:
% x
(x − t)n
dt.
(5.81)
f (n+1) (t)
Rn (x) =
n!
x0
Diese Formel für das Restglied war schon Brook Taylor (1685-1731) selbst bekannt.
Lagrange hat gezeigt, wie das Restglied Rn auf einfache Weise abgeschätzt werden kann. Wir
bezeichnen die Stelle, an der die (n + 1)-te Ableitung f (n+1) (x) im Intervall [x0 , x] ein Minimum
einnimmt, mit x1 und die Stelle des Maximums mit x2 . Dann gilt
% x
% x
(x − t)n
(x − t)n
(n+1)
(n+1)
dt ≥ f
dt
(5.82)
f
(t)
(x1 )
n!
n!
x0
x0
5 Die Taylorreihe
135
und
%
x
f
(n+1)
x0
(x − t)n
(t)
dt ≤ f (n+1) (x2 )
n!
%
x
x0
(x − t)n
dt.
n!
Wir können daher das Restglied folgendermaßen beschränken:
% x
% x
(x − t)n
(x − t)n
dt ≤ Rn (x) ≤ f (n+1) (x2 )
dt.
f (n+1) (x1 )
n!
n!
x0
x0
Das Integral
&x
x0
(x−t)n
n!
(5.83)
(5.84)
dt kann ausgeführt werden,
%
x
x0
(x − x0 )n+1
(x − t)n
dt =
,
n!
(n + 1)!
(5.85)
und wir erhalten:
f (n+1) (x1 )
(x − x0 )n+1
(x − x0 )n+1
≤ Rn (x) ≤ f (n+1) (x2 )
.
(n + 1)!
(n + 1)!
(5.86)
Da f (n+1) (x) eine stetige Funktion ist, muss es zwischen x1 und x2 ein ξ geben, sodass
Rn (x) = f (n+1) (ξ)
(x − x0 )n+1
.
(n + 1)!
(5.87)
Das ist das Lagrangesche Restglied. Natürlich ist im allgemeinen Fall der Wert von ξ unbekannt,
aber wir können, wie weiter oben bereits besprochen, nach jenem Wert ξ im Intervall [x, x0 ]suchen,
für welchen der Betrag des Restgliedes maximal wird, und daraus eine obere Schranke für den
Fehler gewinnen.
Beispiel:
Wir entwickeln die Funktion exp(x) an der Stelle x = 0 in eine Taylorreihe und brechen diese nach
dem Term 3. Ordnung ab:
exp(x) = 1 + x +
x3
x2
+
+ R3 (x).
2!
3!
(5.88)
Wie groß ist der Fehler, den wir bei x = 0.5 damit machen? Das Restglied nach Lagrange ist:
R3 (x) =
f (4) (ξ) 4
x .
4!
(5.89)
Die vierte Ableitung von ex ist ex . Das ist eine monoton steigende Funktion, die im Intervall [0, 0.5]
ihren größten Wert bei ξ = 0.5 hat. Infolgedessen gilt für den Fehler
R3 (x) ≤
e0.5 4
x ≈ 0.07x4 .
4!
(5.90)
Der Fehler, der durch Abbrechen nach dem Term 3. Ordnung entsteht, ist also kleiner als 0.07x4 .
Beispiel:
Als weiteres Beispiel für die Anwendung der Taylorreihe betrachten wir noch folgendes Problem:
Zwischen den Orten A und B existiert eine gerade Straßenverbindung der Länge s. Man kann
jedoch auch über C von A nach B gelangen. Punkt C bildet mit den Punkten A und B ein
gleichseitiges Dreieck der Höhe h (siehe Abb. 5.4). Wie lang ist der Weg über C verglichen mit der
direkten Verbindung von A nach B?
136
5 Die Taylorreihe
Abbildung 5.4: Man kann direkt von A nach B gelangen oder über C.
Der Umweg U (also die Diﬀerenz der beiden Wege) ist eine Funktion von h:
)

"
2
s 2
2h
s
U =2
= s 1 +
+ h2 −
− 1 .
2
2
s
(5.91)
Für ein kleines Verhältnis h/s können wir diesen Ausdruck durch Taylorreihenentwicklung
der
√
Wurzel sehr vereinfachen. Wir führen die√Variable x = (2h/s)2 ein und entwickeln 1 + x nach x.
Dazu brauchen wir die Ableitungen von 1 + x:
√
1
(5.92)
y = 1 + x = (1 + x) 2 ,
1
1
(5.93)
y = (1 + x)− 2 ,
2 1
1
1
3
3
y = · −
(5.94)
(1 + x)− 2 = − (1 + x)− 2 ,
2
2
4
5
5
3
1
3
y = − · −
(5.95)
(1 + x)− 2 = (1 + x)− 2 .
4
2
8
An der Stelle x = 0 sind die Funktion und ihre Ableitungen:
y = 1,
y =
1
,
2
1
y = − ,
4
y =
3
.
8
(5.96)
Die Taylorreihe ist also gegeben durch:
√
1
1
x3
...
1 + x = 1 + x − x2 +
2
8
16
(5.97)
Wir brechen nun nach dem linearen Term ab und erhalten als Näherung
√
1
1+x≈1+ x
2
(5.98)
und somit
)
1+
2h
s
2
1
≈1+
2
2h
s
2
2
h
=1+2
.
s
(5.99)
Der Umweg U wird infolgedessen zu
2
2h2
h
.
−1 =
U ≈s 1+2
s
s
(5.100)
Dieser Ausdruck gilt für h s und ist viel einfacher als der ursprüngliche Ausdruck. Wir sehen
daraus gleich, dass für kleine h der Umweg U nur sehr langsam (quadratisch) wächst. Für s = 100
km und h = 5 km ergibt sich beispielsweise nur ein Umweg von 0.5 km (für s = 100 km und h = 1
km ist der Umweg U gar nur 0.02 km= 20 m lang).
Kapitel 6
Komplexe Zahlen
Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die Quadratwurzel
einer negativen Zahl ziehen. Für die quadratische Gleichung mit reellen Koeﬃzienten beispielsweise
ax2 + bx + c = 0,
(6.1)
existieren die reellen Lösungen
√
b2 − 4ac
(6.2)
x1,2 =
2a
nur dann, wenn das Argument der Wurzel nicht negativ ist, das heißt wenn gilt b2 ≥ 4ac. Wir
können den Zahlenraum jedoch so erweitern, dass algebraische Gleichungen wie die quadratische
Gleichung (6.1) immer eine Lösung haben. Diesen erweiterten Raum nennen wir die komplexen
Zahlen und werden sehen, dass dieser Übergang von den reellen zu den komplexen Zahlen dem
Übergang von der Zahlengerade R zu der Zahlenebene R2 = R × R entspricht. Für komplexe
Zahlen lassen sich Rechenoperationen so deﬁnieren, dass alle für die Operationen mit reellen Zahlen
geltenden Gesetze in Kraft bleiben. Die reellen Zahlen sind dann als Spezialfall in den komplexen
Zahlen enthalten. Komplexe Zahlen spielen in der gesamten Physik eine äußerst wichtige Rolle
und wir werden uns im Folgenden mit der Deﬁnition und den Rechenregeln für komplexe Zahlen
beschäftigen.
−b ±
6.1
Deﬁnition und Darstellung
Zur Erweiterung der reellen Zahlen führen wir imaginäre Zahlen ein. Dazu deﬁnieren wir die
imaginäre Einheit als die Zahl i, deren Quadrat -1 ergibt:
√
i2 = −1
(oder, mathematisch etwas salopp ausgedrückt, i = −1).
(6.3)
(Die Wurzel aus einer negativen Zahl können wir eigentlich nicht ziehen. Wir tun jetzt aber “so
als ob” und wir werden sehen, dass wir damit sehr weit kommen.) Wir können jetzt formal die
Wurzel aus einer negativen Zahl ziehen, z.B.
√ √
√
√
−5 = 5 · (−1) = 5 · −1 = 5i.
(6.4)
Die Wurzel aus einer negativen reellen Zahl ist eine imaginäre Zahl. Eine imaginäre Zahl setzt
sich aus der imaginären Einheit i und einer reellen Zahl y zusammen:
yi.
(6.5)
Wie die reellen Zahlen lassen sich auch die imaginären Zahlen auf einem Zahlenstrahl darstellen
(siehe Abb. 6.1).
137
138
6 Komplexe Zahlen
Abbildung 6.1: Zahlenstrahl für die imaginären Zahlen.
Höhere Potenzen der imaginären Einheit ergeben imaginäre oder reelle Zahlen:
i2
3
i
i4
i5
=
−1,
(6.6)
=
=
2
i i = −1i = −i,
i2 i2 = −1 · −1 = 1,
(6.7)
(6.8)
=
i4 · i = i,
usw.
(6.9)
Die Zusammensetzung einer reellen Zahl x und einer imaginären Zahl iy (y reell) nennt man eine
komplexe Zahl:
z = x + iy.
(6.10)
Solche komplexen Zahlen ergeben sich bei der Lösung quadratischer Gleichungen. Zum Beispiel
hat die Gleichung
x2 − 4x + 29 = 0
(6.11)
die komplexen Lösungen
x1,2
=
+4 ±
√
√
√
16 − 4 · 29
= 2 ± −25 = 2 ± 5 −1 = 2 ± 5i.
2
(6.12)
Die Darstellungsform z = x + iy bezeichnet man auch als Normalform oder kartesische Darstellung einer komplexen Zahl. In dieser Darstellungsform nennt man
x = (z) den Realteil der komplexen Zahl z und
y = (z) den Imaginärteil.
Gebräuchlich ist auch die Notation x = Re(z) und y = Im(z). Sowohl der Realteil als auch der
Imaginärteil einer komplexen Zahl sind reelle Zahlen (obwohl die Bezeichnung Imaginärteil das
Gegenteil suggeriert).
Abbildung 6.2: Graphische Darstellung einer komplexen Zahl in der Gaußschen Zahlenebene.
Graphisch kann man komplexe Zahlen in der Gaußschen Zahlenebene darstellen (siehe Abb.
6.2). Dabei wird der Realteil (z) der komplexen Zahl z = x + iy auf der x-Achse aufgetragen
6 Komplexe Zahlen
139
und der Imaginärteil (z) auf der y-Achse (genauso wie wir es für die Komponenten eines Vektors
r = (x, y) getan haben). Im Fall der komplexen Zahlen bezeichnen wir die x-Achse als die reelle
Achse und die y-Achse als die imaginäre Achse. Eine komplexe Zahl z entspricht also einem
Punkt P (x, y) und somit einem Ortsvektor r = (x, y) in der Gaußschen Zahlenebene.
Alternativ zur kartesischen Darstellung kann man für komplexe Zahlen auch die so genannte trigonometrische Darstellung verwenden. In dieser Darstellung beschreiben wir die komplexe Zahl
z = x + iy durch den Winkel ϕ zwischen der reellen Achse und dem Ortsvektor r und dem Abstand
des Punktes P (x, y) vom Ursprung der Gaußschen Zahlenebene. Dies entspricht der Darstellung
des Punktes P (x, y) in Polarkoordinaten. Der Abstand von P (x, y) vom Ursprung, oder Betrag
|z| der komplexen Zahl, ergibt sich durch Anwendung des Satzes von Pythagoras:
(6.13)
|z| = x2 + y 2 = 2 (z) + 2 (z).
Für den Winkel ϕ, auch Phasenwinkel oder Argument genannt, gilt:
ϕ = arctan
(z)
y
= arctan
.
x
(z)
(6.14)
Umgekehrt lauten die Transformationsgleichungen von der trigonometrischen zur kartesischen Darstellung:
(z) = x = |z| cos ϕ,
(z) = y = |z| sin ϕ.
(6.15)
(6.16)
Somit kann die komplexe Zahl z auch geschrieben werden als:
z = |z| cos ϕ + i|z| sin ϕ oder z = |z|(cos ϕ + i sin ϕ).
6.2
(6.17)
Rechenregeln für komplexe Zahlen
Die komplexen Zahlen enthalten die reellen Zahlen als einen Spezialfall. Setzen wir nämlich in
der komplexen Zahl z = x + iy den Imaginärteil y gleich 0, erhalten wir die reelle Zahl x und
wir beschränken uns dadurch auf die reelle Achse der Gaußschen Zahlenebene. Die Rechenregeln
für komplexe Zahlen sollten also so deﬁniert sein, dass sie für diesen Spezialfall in die üblichen
Rechenregeln für die reellen Zahlen übergehen. Wie wir im Folgenden sehen werden, lässt sich
dies erreichen, indem man einfach die üblichen algebraischen Rechenregeln anwendet und dabei
beachtet, dass i2 = −1.
Zunächst deﬁnieren wir zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 als gleich, wenn
sie sowohl in ihrem Realteil als auch in ihrem Imaginärteil übereinstimmen. Das heißt:
z1 = z2
⇔
(z1 ) = (z2 )
und (z1 ) = (z2 ).
(6.18)
Eine komplexe Zahl z = x + iy ist Null, wenn sowohl ihr Realteil als auch ihr Imaginärteil
verschwinden:
z=0
6.2.1
⇔
(z) = 0
und (z) = 0.
(6.19)
Addition und Subtraktion
Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden addiert bzw. subtrahiert, indem
man ihre reellen und imaginären Anteile jeweils getrennt voneinander addiert bzw. subtrahiert:
z1 + z2 = (x1 + x2 ) + i(y1 + y2 ),
(6.20)
z1 − z2 = (x1 − x2 ) + i(y1 − y2 ).
(6.21)
140
6 Komplexe Zahlen
Abbildung 6.3: Addition der komplexen Zahlen z1 und z2 .
Abbildung 6.4: Subtraktion der komplexen
Zahl z2 von der komplexen Zahl z1 .
Dies entspricht der komponentenweisen Addition bzw. Subtraktion der zugehörigen Vektoren in der
Gaußschen Zahlenebene. Wie aus Abb. 6.3 ersichtlich ist, können wir graphisch die Addition und
Subtraktion von komplexen Zahlen durch passendes Aneinanderhängen der zugehörigen Vektoren
durchführen. Addition und Subtraktion von komplexen Zahlen funktionieren analog zur Addition
und Subtraktion der zugehörigen zweidimensionalen Vektoren.
Beispiel:
(4 + 3i) + (6 − 2i) =
(4 + 6) + (3 + (−2))i = 10 + i,
(6.22)
(4 + 3i) − (6 − 2i) =
(4 − 6) + (3 − (−2))i = −2 + 5i.
(6.23)
Die Addition von komplexen Zahlen ist assoziativ,
z1 + (z2 + z3 ) = (z1 + z2 ) + z3 = z1 + z2 + z3 ,
(6.24)
z1 + z2 = z2 + z1 .
(6.25)
und kommutativ,
Weiters existiert das neutrale Element 0, sodass
z+0=z
(0 = 0 + i0),
(6.26)
und das inverse Element zinv , sodass
z + zinv = 0.
(6.27)
Für die komplexe Zahl z = x + iy ist die inverse komplexe Zahl zinv = −z = −x − iy. Die
Subtraktion z = z1 − z2 kann also aufgefasst werden als die Addition von z1 mit dem inversen
Element der Zahl z2 , z = z1 + (−z2 ).
6.2.2
Multiplikation einer komplexen Zahl mit einer reellen Zahl
Die Multiplikation einer komplexen Zahl z mit einer reellen Zahl a kann als eine wiederholte
Addition aufgefasst werden:
az = a(x + iy) = ax + iay.
(6.28)
6 Komplexe Zahlen
141
Beispiel:
2z = 2(x + iy) = 2x + 2iy.
(6.29)
Diese Operation entspricht also der Multiplikation des entsprechenden Vektors in der Gaußschen
Zahlenebene mit einem Skalar (siehe Abb. 6.5).
Abbildung 6.5: Multiplikation einer komplexen Zahl mit einer reellen Zahl.
6.2.3
Komplex konjugierte Zahl
Für eine komplexe Zahl z = x + iy lässt sich durch Umkehrung des Vorzeichens des Imaginärteils
die komplex konjugierte Zahl z ∗ deﬁnieren:
z ∗ = x − iy.
(6.30)
Wir verwenden auch oft die Notation z für die komplex konjugierte Zahl. Graphisch erhält man
die komplex konjugierte Zahl durch Spiegelung des zugehörigen Vektors an der reellen Achse.
Abbildung 6.6: Die komplex konjugierte Zahl z ∗ der komplexen Zahl z erhält man durch Spiegelung
von z an der reellen Achse.
Beispiel:
z
z
∗
=
4 + 3i,
(6.31)
=
4 − 3i.
(6.32)
142
6 Komplexe Zahlen
Wir können den Realteil und den Imaginärteil einer komplexen Zahl mit Hilfe der komplex konjugierten Zahl ausdrücken. Indem wir z ∗ zu z addieren, erhalten wir
z + z ∗ = (x + iy) + (x − iy) = 2x,
(6.33)
woraus folgt
1
(z + z ∗ ).
2
Um den Imaginärteil zu bestimmen, subtrahieren wir z ∗ von z,
x=
z − z ∗ = (x + iy) − (x − iy) = 2iy,
und ﬁnden dadurch
y=
1
(z − z ∗ ).
2i
(6.34)
(6.35)
(6.36)
Ferner folgt aus den Rechenregeln für die Addition komplexer Zahlen:
(z1 + z2 )∗ = z1∗ + z2∗ .
6.2.4
(6.37)
Multiplikation
Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden miteinander multipliziert, indem
man die Rechenregeln der Algebra anwendet und dabei beachtet, dass i2 = −1:
z1 z2
=
=
(x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + ix2 y1 + i2 y1 y2
(x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ).
(6.38)
Beispiel:
(4 + 3i)(6 − 2i) = 24 − 8i + 18i − 6i2 = 24 + 6 + (18 − 8)i = 30 + 10i.
(6.39)
Multipliziert man eine komplexe Zahl z mit ihrer komplex konjugierten Zahl z ∗ , erhält man:
zz ∗ = (x + iy)(x − iy) = x2 − (iy)2 = x2 + y 2 = |z|2 .
(6.40)
Der Betrag |z| lässt sich also ausdrücken als
|z| =
√
zz ∗.
(6.41)
Die Multiplikation zweier komplexer Zahlen ist kommutativ,
z1 z2 = z2 z1 ,
(6.42)
z1 (z2 z3 ) = (z1 z2 )z3 = z1 z2 z3 ,
(6.43)
z1 (z2 + z3 ) = z1 z2 + z1 z3 .
(6.44)
assoziativ,
und distributiv,
Weiters gibt es für eine komplexe Zahl z ein neutrales Element 1=1+i0,
z · 1 = z,
(6.45)
6 Komplexe Zahlen
143
und, falls z = 0, ein inverses Element zinv , sodass
z · zinv = 1.
(6.46)
Für das inverse Element der Multiplikation gilt:
zinv =
z∗
1
z∗
= ∗ = 2.
z
zz
|z|
(6.47)
Da für alle komplexen Zahlen z gilt, dass z · 0 = 0, hat 0 kein inverses Element.
Durch Anwendung der Rechenregeln für die Multiplikation von komplexen Zahlen können wir uns
leicht klar machen, dass ferner gilt:
(z1 z2 )∗ = z1∗ z2∗
(6.48)
(z n )∗ = (z ∗ )n .
(6.49)
und somit auch
Dieses Resultat erhalten wir durch n-fache Anwendung von Gleichung (6.48).
6.2.5
Division
Zur Division einer komplexen Zahl z1 = x1 + iy1 durch eine komplexe Zahl z2 = x2 + iy2 erweitern
wir zunächst den Bruch mit der komplex konjugierten Zahl des Nenners:
z1
z1 · z2∗
(x1 + iy1 )(x2 − iy2 )
.
=
=
∗
z2
z2 · z2
(x2 + iy2 )(x2 − iy2 )
(6.50)
Ausmultiplizieren und Zusammenfassen der reellen und imaginären Terme ergibt:
z1
x1 x2 + y1 y2 + i(x2 y1 − x1 y2 )
.
=
z2
(x22 + y22 )
(6.51)
Der Nenner ist jetzt reell und nur der Zähler bleibt komplex. Daher können wir einfach die Regeln
für die Multiplikation einer komplexen Zahl mit einer reellen Zahl anwenden und erhalten:
x1 x2 + y1 y2
y1 x2 − x1 y2
z1
=
+i
.
(6.52)
z2
x22 + y22
x22 + y22
Der Nenner (x22 + y22 ) ist immer eine strikt positive Zahl (x22 + y22 > 0), außer für z2 = 0. In diesem
Fall können wir die Division nicht durchführen.
Beispiel:
(4 + 3i)
(6 − 2i)
(4 + 3i)(6 + 2i)
24 + 8i + 18i − 6
18 + 26i
=
=
(6 − 2i)(6 + 2i)
36 + 4
40
9
13
+ i.
20 20
=
=
(6.53)
Beispiel:
z
=
zinv
=
=
4 + 3i,
1
(4 − 3i)
4 − 3i
1
=
=
=
z
4 + 3i
(4 + 3i)(4 − 3i)
16 + 9
4
3
− i.
25 25
(6.54)
(6.55)
144
6 Komplexe Zahlen
Wir testen jetzt, ob zinv wirklich die zu z inverse komplexe Zahl ist:
3
1 2
1
4
− i =
(4 + 3i)(4 − 3i) =
(4 + 32 )
z · zinv = (4 + 3i)
25 25
25
25
16 + 9
=
= 1.
25
6.3
6.3.1
(6.56)
Die Exponentialform von komplexen Zahlen
Eulersche Formel
Wir haben bis jetzt nur die Grundrechnungsarten für komplexe Zahlen besprochen. Aus diesen
Grundoperationen können wir auch komplexe Funktionen f (z) von komplexen Zahlen konstruieren.
Eine solche Funktion f (z) bildet eine komplexe Zahl z in die komplexe Zahl u = f (z) ab:
f
z−
→ u.
(6.57)
Zum Beispiel können wir durch Hintereinanderausführen der Multiplikation ganzzahlige Potenzen
einer komplexen Zahl bilden:
z 2 = z · z,
z 3 = z · z · z,
..
.
z
n
= z · ·
· · · z .
(6.58)
(6.59)
(6.60)
(6.61)
n-mal
Wie wir im Kapitel 5 gesehen haben, lassen sich für reelle Zahlen ganz allgemeine Funktionen
als so genannte Potenzreihen ausdrücken. Zum Beispiel können wir die Exponentialfunktion ex
ausdrücken als:
ex = 1 + x +
x3
x4
x2
+
+
+ ...,
2!
3!
4!
(6.62)
wobei die so genannte Fakultät n! einer natürlichen Zahl n deﬁniert ist als das Produkt aller
natürlichen Zahlen von 1 bis n:
n! = n(n − 1)(n − 2) . . . 3 · 2 · 1
z.B. 4! = 4 · 3 · 2 · 1 = 24.
(6.63)
Die Potenzreihe in Gleichung (6.62) hat unendlich viele Terme. Weil die Terme immer kleiner
werden, kann die Summe doch gegen den endlichen Wert ex streben. Ähnlich gilt für die beiden
Winkelfunktionen sin(x) und cos(x)
x5
x7
x3
+
−
+ ...,
3!
5!
7!
x2
x4
x6
cos(x) = 1 −
+
−
+ ....
2!
4!
6!
sin(x) = x −
(6.64)
(6.65)
(Probieren Sie das mit Ihrem Taschenrechner aus.) Im Allgemeinen lässt sich jede Funktion f (x)
als eine Potenzreihe ausdrücken
f (x) = a0 + a1 x + a2 x2 + a3 x3 + . . .
(6.66)
und wir haben im Kapitel 5 gesehen, wie wir auf systematische Weise die passenden Koeﬃzienten
ai ermitteln können.
6 Komplexe Zahlen
145
Die Potenzreihen für die trigonometrischen Funktionen bestehen aus den selben Termen wie die
Exponentialfunktion (jedoch jeweils nicht aus allen). Dies lässt uns schon erahnen, dass es einen
Zusammenhang zwischen der Exponentialfunktion und den trigonometrischen Funktionen geben
muss. Da für komplexe Zahlen ganzzahlige Potenzen, wie wir oben gesehen haben, deﬁniert sind,
können wir versuchen, mit Hilfe der Potenzreihe (6.62) die Exponentialfunktion für komplexe
Zahlen zu erweitern. Betrachten wir zunächst was passiert, wenn wir in (6.62) die reelle Zahl x
durch eine imaginäre Zahl iϕ ersetzen (ϕ ist dabei reell):
eiϕ
=
1 + (iϕ) +
(iϕ)3
(iϕ)4
(iϕ)5
(iϕ)6
(iϕ)2
+
+
+
+
...
2!
3!
4!
5!
6!
(6.67)
Durch explizite Berechnung der Potenzen der imaginären Einheit erhalten wir:
eiϕ
=
1 + iϕ −
iϕ3
ϕ4
iϕ5
ϕ6
ϕ2
−
+
+
−
...
2!
3!
4!
5!
6!
Zusammenfassung der reellen und imaginären Terme ergibt:
ϕ4
ϕ6
ϕ5
ϕ7
ϕ2
ϕ3
eiϕ = 1 −
+
−
+ ... +i ϕ −
+
−
+ ... .
2!
4!
6!
3!
5!
7!
=cos ϕ
(6.68)
(6.69)
=sin ϕ
Durch Vergleich mit den Potenzreihen für sin(x) und cos(x) mit reellem Argument erhalten wir:
eiϕ = cos ϕ + i sin ϕ.
(6.70)
Das ist die berühmte Eulersche Formel. Für den Spezialfall ϕ = π erhalten wir die schöne Formel
eiπ + 1 = 0,
(6.71)
welche die wichtigen Zahlen e, i, π, 1 und 0 miteinander verknüpft. Eine weitere interessante Beziehung ist:
2
π i
π
= (eiπ/2 )i = ei π/2 = e−π/2 .
(6.72)
ii = (0 + i)i = cos + i sin
2
2
Leonhard Euler hat dies in einem Brief an Goldbach
(1746) folgendermaßen kommentiert: “Letztens
√ √−1
habe gefunden, dass diese expressio −1
einen valorem realem habe, welche in fractionibus
decimalibus=0.2078795763, welches mir merkwürdig zu seyn scheinet.”
Ein alternativer Beweis der Eulerschen Formel lässt sich mit Hilfe eines komplexen Integrals
konstruieren, wobei wir hier nur die Idee grob skizzieren. Wir betrachten dazu die komplexe Zahl
z = cos ϑ + i sin ϑ,
(6.73)
welche einen Betrag von 1 besitzt, |z| = 1. Das Diﬀerential dieser Zahl ist:
dz
=
(− sin ϑdϑ + i cos ϑdϑ) = (− sin ϑ + i cos ϑ)dϑ
=
i(cos ϑ + i sin ϑ)dϑ = izdϑ,
(6.74)
dz
z
(6.75)
sodass wir erhalten:
=
idϑ.
Integration auf beiden Seiten liefert (wir lösen hier eigentlich eine Diﬀerentialgleichung):
ln z = iϑ
(6.76)
z = eiϑ = cos ϑ + i sin ϑ.
(6.77)
und somit
146
6.3.2
6 Komplexe Zahlen
Polardarstellung von komplexen Zahlen
Die Eulersche Formel ermöglicht die so genannte Polardarstellung der komplexen Zahlen. Wie
wir weiter oben gesehen haben (siehe Gleichung (6.17)), kann eine komplexe Zahl dargestellt werden
als
z = |z|(cos ϕ + i sin ϕ).
(6.78)
Unter Verwendung der Eulerschen Formel ergibt sich daraus
z = |z|eiϕ .
(6.79)
Das ist die Polardarstellung der komplexen Zahl z. In dieser Darstellung ist die komplex konjugierte
Zahl einfach gegeben durch:
z ∗ = |z|e−iϕ .
(6.80)
Abbildung 6.7: Multiplikation zweier komplexer Zahlen in der Polardarstellung.
In der Polardarstellung können wir durch Rechenregeln für die Exponentialfunktion die Multiplikation und Division von komplexen Zahlen stark vereinfachen:
z1 z2 = (|z1 |eiϕ1 )(|z2 |eiϕ2 ) = |z1 ||z2 |ei(ϕ1 +ϕ2 ) .
(6.81)
Anschaulich bedeutet das, dass man zwei komplexe Zahlen miteinander multipliziert, indem man
die zugehörigen Winkel ϕ1 und ϕ2 addiert und die Beträge |z1 | und |z2 | miteinander multipliziert
(siehe Abb. 6.7). Das heißt, die Multiplikation von z1 mit z2 ist eine Drehstreckung: der Winkel ϕ1
wird um den Winkel ϕ2 weitergedreht und der Betrag |z1 | wird um den Faktor |z2 | gestreckt.
Für die Division gilt:
z1
|z1 | i(ϕ1 −ϕ2 )
e
=
.
z2
|z2 |
(6.82)
Der Kehrwert von z ist also gegeben durch
1
1 −iϕ
=
e .
z
|z|
(6.83)
6 Komplexe Zahlen
6.3.3
147
Umkehrung der Eulerschen Formel
Wir wollen nun die trigonometrischen Funktionen durch die Exponentialfunktion ausdrücken. Wenn
wir ϕ durch −ϕ ersetzen, erhalten wir die zu eiϕ konjugierte komplexe Zahl:
∗
e−iϕ = cos(−ϕ) + i sin(−ϕ) = cos ϕ − i sin ϕ = eiϕ .
(6.84)
Durch Addition der Eulerschen Formel für eiϕ und für die komplex konjugierte Zahl e−iϕ erhalten
wir:
eiϕ
e
−iϕ
eiϕ + e−iϕ
=
cos ϕ + i sin ϕ
(6.85)
=
cos ϕ − i sin ϕ
(6.86)
=
2 cos ϕ,
(6.87)
eiϕ + e−iϕ
.
2
(6.88)
woraus folgt
cos ϕ =
Subtrahieren wir hingegen e−iϕ von eiϕ erhalten wir:
eiϕ
−e
−iϕ
eiϕ − e−iϕ
=
cos ϕ + i sin ϕ
(6.89)
=
− cos ϕ + i sin ϕ
(6.90)
=
2i sin ϕ,
(6.91)
woraus sich
sin ϕ =
eiϕ − e−iϕ
2i
(6.92)
ergibt. Vergleich der Gleichungen (6.88) und (6.92) mit den Gleichungen (1.96) und (1.95) zeigt
den Zusammenhang zwischen den trigonometrischen und den hyperbolischen Funktionen.
6.3.4
Additionstheoreme für Winkelfunktionen
Die Eulersche Formel können wir auch benutzen, um die Additionstheoreme für die Winkelfunktionen herzuleiten. Aus der Eulerschen Formel folgt:
ei(ϕ1 +ϕ2 ) = cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 ).
(6.93)
Gleichzeitig gilt aber auch:
ei(ϕ1 +ϕ2 )
=
eiϕ1 · eiϕ2 = (cos ϕ1 + i sin ϕ1 ) · (cos ϕ2 + i sin ϕ2 )
=
=
cos ϕ1 cos ϕ2 + i cos ϕ1 sin ϕ2 + i cos ϕ2 sin ϕ1 − sin ϕ1 sin ϕ2
cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 + i(cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 ).
(6.94)
Der Vergleich der Real- und Imaginärteile der beiden obigen Formeln liefert:
cos(ϕ1 + ϕ2 ) =
sin(ϕ1 + ϕ2 ) =
cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 ,
cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 .
(6.95)
(6.96)
Diese beiden Formeln sind die Additionstheoreme für die Sinus- und die Kosinusfunktion. Weitere
Beziehungen kann man durch analoge Berechnungen für Vielfache des Winkels ϕ ableiten.
148
6.3.5
6 Komplexe Zahlen
Komplexe Zahlen als Exponenten
Bisher haben wir nur die rein imaginäre Zahl iϕ als Argument der Exponentialfunktion betrachtet.
Für ein komplexes Argument w = x + iy erhält man
z = ew = e(x+iy) = ex eiy .
(6.97)
z = reiϕ
(6.98)
Der Vergleich mit
zeigt, dass der Realteil x den Betrag |ew | = ex der komplexen Zahl z = ew bestimmt und der
Imaginärteil y den Phasenwinkel ϕ = y.
6.4
Potenzieren und komplexe Wurzeln
In der kartesischen Darstellung können wir Potenzen von komplexen Zahlen einfach durch Ausmultiplizieren berechnen:
z2
=
(x + iy)2 = x2 + 2ixy + (iy)2 = x2 − y 2 + 2ixy,
3
=
(x + iy)3 = x3 + 3ix2 y + 3x(iy)2 + (iy)3 = x3 − 3xy 2 + i(3x2 y − y 3 ).
z
(6.99)
(6.100)
Im Allgemeinen brauchen wir binomische Formeln (oder das Pascalsche Dreieck), um die Koeﬃzienten zu bestimmen.
Das Pascalsche Dreieck
1
1
1
1
1
1
2
3
4
5
1
1
3
6
10
1
4
10
1
5
1
..
.
n=0
n=1
n=2
n=3
n=4
n=5
..
.
In der polaren Darstellung ist das Potenzieren einfacher:
n
z n = |z|eiϕ = |z|n einϕ ,
(6.101)
(6.102)
oder, in trigonometrischer Schreibweise,
z n = [|z|(cos ϕ + i sin ϕ)]n = |z|n [cos(nϕ) + i sin(nϕ)].
Zur Herleitung der letzten Gleichung haben wir die Tatsache benutzt, dass
iϕ n
e
= einϕ ,
(6.103)
(6.104)
woraus
(cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ)
(6.105)
folgt. Dieses Ergebnis nennt man die Formel von Moivre. Die n-te Potenz einer komplexen Zahl
kann man also bestimmen, indem man den n-fachen Phasenwinkel ϕ nimmt und den Betrag z, der
eine reelle Zahl ist, zur n-ten Potenz nimmt.
6 Komplexe Zahlen
149
Auch die Umkehrung der Potenz, die komplexe Wurzel, lässt sich in der polaren Darstellung
leicht bestimmen:
1
√
iϕ
iϕ
1
1
n
z = z n = |z|eiϕ n = |z| n e n = n |z|e n .
(6.106)
In der trigonometrischen Darstellung haben wir also:
'
ϕ
ϕ(
1
n
|z|(cos ϕ + i sin ϕ) = |z| n cos + i sin
.
n
n
(6.107)
Abbildung 6.8: Wenn wir den zu z gehörigen Vektor um 2π (oder ein Vielfaches davon) drehen,
kehrt der Vektor zu seinem Ausgangspunkt zurück.
Wenn wir jedoch berücksichtigen, dass eine komplexe
Zahl im Phasenwinkel ϕ mit einer Periode 2π
√
periodisch ist, kann man zusätzliche Wurzeln n z konstruieren. Da die trigonometrischen Funktionen sin ϕ und cos ϕ periodisch mit Periode 2π sind, ist dies leicht einzusehen. Zum Phasenwinkel
ϕ einer komplexen Zahl z = |z|eiϕ können wir deswegen ganzzahlige Vielfache von 2π addieren,
ohne die Zahl zu verändern
z = |z|eiϕ = |z|ei(ϕ+k2π)
k = 0, ±1, ±2, . . .
(6.108)
Anschaulich heißt das, dass wir zum Ausgangspunkt zurückkehren, wenn wir den zugehörigen
Ortsvektor um eine (oder mehrere) ganze Umdrehung(en) weiter drehen (siehe Abb. 6.8). Das
heißt aber auch, dass
√
(ϕ+k2π)
1
n
z = n |z|eiϕ = n |z|ei(ϕ+k2π) = |z| n ei n .
(6.109)
Daraus folgt, dass für alle k = 0, ±1, ±2, . . . die Zahl
1
|z| n ei
(ϕ+k2π)
n
iϕ
1
= |z| n e n +
i2πk
n
(6.110)
eine n-te Wurzel von z ist. Wie viele verschiedene gibt es nun von diesen Zahlen? Für k = 0
erhalten wir die Wurzel
1
iϕ
z0 = |z| n e n
(6.111)
und für k = 1 die Wurzel
1
iϕ
z1 = |z| n e n +
Das heißt, der Phasenwinkel von z1 ist um
2π
n
i2π
n
.
(6.112)
größer als der von z0 :
ϕ1 = ϕ0 +
2π
.
n
(6.113)
150
6 Komplexe Zahlen
Wir erhalten also z1 aus z0 , indem wir den zugehörigen Vektor in der Gaußschen Zahlenebene um
ein n-tel von 2π weiter drehen. Die nächste Lösung
1
iϕ
z2 = |z| n e n +
i2·2π
n
(6.114)
hat einen Phasenwinkel, der um 2π/n größer ist als der von z1 . Auf ähnliche Weise erhalten wir
z3 aus z2 . Nachdem wir den Zeiger n-mal um 2π/n weiter gedreht haben, sind wir wieder bei der
ursprünglichen Wurzel z0 angelangt. Es gibt also insgesamt n n-te Wurzeln einer komplexen Zahl
z:
1
ϕ
2π
zk = |z| n ei( n +k n )
k = 0, . . . , n − 1.
(6.115)
Anschaulich liegen diese n-ten Wurzeln in der Gaußschen Zahlenebene auf einem Kreis mit Radius
1
|z| n und bilden ein regelmäßiges n-Eck (siehe Abb. 6.9).
1
Abbildung 6.9: Die n-ten Wurzeln der komplexen Zahl z liegen auf einem Kreis mit Radius |z| n
in der Gaußschen Zahlenebene und bilden ein regelmäßiges n-Eck.
Beispiel:
Wir wollen die Wurzel
√
6
3 − 8i
(6.116)
berechnen. Dazu drücken wir die Zahl z = 3 − 8i zunächst in Polarform aus. Da
√
8
und
ϕ = arctan −
|z| = 32 + 82 = 73
= −1.21,
3
(6.117)
haben wir
z=
√ −i1.21
73e
.
(6.118)
Die komplexen 6-ten Wurzeln von 3 − 8i sind somit die 6 Zahlen
1
zk = 73 12 ei(−1.21+
2π
6 k)
mit
k = 0, 1, . . . , 5.
1
Diese Zahlen bilden ein Sechseck mit Kantenlänge 73 12 in der Gaußschen Zahlenebene.
(6.119)
6 Komplexe Zahlen
151
Beispiel:
Zu berechnen sind die dritten Wurzeln von 1:
√
3
1.
(6.120)
Im Allgemeinen sind die n n-ten Wurzeln der Zahl 1 gegeben durch:
zk = 1eik2π/n ,
(6.121)
wobei k von 0 bis n − 1 läuft. Die drei dritten Wurzeln von 1 sind daher:
6.5
z0
=
z1
=
z2
=
1,
√
3
1
i,
ei2π/3 = − +
2 √2
1
3
i.
ei4π/3 = − −
2
2
(6.122)
(6.123)
(6.124)
Darstellung von Kurven mit komplexen Zahlen
Kurven in der Gaußschen Zahlenebene können durch Gleichungen der Form
f (z) = 0
(6.125)
dargestellt werden. Dabei ist z = x + iy eine komplexe Zahl und f (z) eine Funktion dieser Zahl.
Beispielsweise ist |z| = 1 die Gleichung für einen Kreise mit Radius 1 und Mittelpunkt im Nullpunkt. Die Gleichung |z − 1| = 1 stellt einen Kreis mit Radius 1 dar, dessen Mittelpunkt bei x = 1
auf der reellen Achse liegt.
Ein komplizierteres Beispiel ist die Gleichung für eine Hyperbel in der komplexen Ebene:
||z + 1| − |z − 1|| = 1
(6.126)
Hier ist |z − 1| der Abstand des Punktes (1, 0) von z und |z + 1| ist der Abstand des Punktes
(−1, 0) von z. Die Gleichung (6.126) wird also von allen Punkten erfüllt, für die die Diﬀerenz der
Entfernung von den Punkten (1, 0) und (−1, 0) konstant gleich 1 ist. Diese Forderung deﬁniert eine
Hyperbel.
Abbildung 6.10: Durch Verknüpfung der Abstände |z + 1| und |z − 1| lässt sich eine Hyperbel
deﬁnieren.
Analytisch folgt dies aus folgender Berechnung: Für z = x + iy ist z − 1 = (x − 1) + iy und
z + 1 = (x + 1) + iy. Somit haben wir
|z + 1| = (x + 1)2 + y 2 und |z − 1| = (x − 1)2 + y 2
(6.127)
152
6 Komplexe Zahlen
und folglich
(x + 1)2 + y 2 − (x − 1)2 + y 2 = ±1.
(6.128)
Umformen und anschließendes Quadrieren liefert
2 2
(x + 1)2 + y 2 = ±1 + (x − 1)2 + y 2
x2 + 2x + 1
2 = 1 ± 2 (x − 1)2 + y 2 + (x2 − 2x + 1) + y
2
+ y
4x − 1
2
16x − 8x + 1
+ 1
16x2
−8x
=
=
12x2 − 4y 2
=
=
4y 2
=
y2
=
y
=
±2 (x − 1)2 + y 2
4((x2 − 2x + 1) + y 2 )
+ 4 + 4y 2
4x2
−8x
3
12x2 − 3
3
3x2 −
" 4
3
± 3x2 − .
4
(6.129)
(6.130)
(6.131)
(6.132)
(6.133)
(6.134)
(6.135)
(6.136)
(6.137)
Dies ist die Gleichung
einer Hyperbel, die sich asymptotisch zwei Geraden durch den Ursprung mit
√
√
Steigungen 3 und − 3 annähert (siehe Abb. 6.11).
Abbildung 6.11: Die Hyperbel y = ± 3x2 − 34 .
Beispiel:
Ein weiteres Beispiel einer mit Hilfe von komplexen Zahlen darstellbare Kurve ist die Ellipse
|z − 1| + |z + 1| = 4.
(6.138)
Kapitel 7
Fehlerrechnung
7.1
Systematische und statistische Fehler
Im Experiment gemessene physikalische Größen sind immer mit einem gewissen Fehler behaftet.
(Um den negativen Beigeschmack des Wortes Fehler zu vermeiden, sprechen wir auch oft von einer
Abweichung oder einer Messabweichung.) Zur Beurteilung von Messwerten ist es sehr wichtig
zu wissen, wie groß diese Fehler sind. Die Abschätzung von Fehlern ist Aufgabe der Fehlerrechnung.
Streng genommen ist die Angabe eines Messwertes ohne Angabe eines Messfehlers sinnlos. Graphisch stellen wir Fehler mit Hilfe von Fehlerbalken dar (siehe Abb. 7.1).
Abbildung 7.1: Graphisch stellen wir Fehler mit Hilfe so genannter Fehlerbalken dar. Die Höhe
des Fehlerbalkens entspricht der erwarteten Größe des Fehlers. In diesem Beispiel wurde für verschiedene Werte von x die Größe y experimentell bestimmt. Somit ist y fehlerbehaftet. Aus den
Messdaten können wir in diesem Beispiel lediglich schließen, dass die wahren Werte von y mit
großer Wahrscheinlichkeit irgendwo innerhalb der Fehlerbalken liegen.
Üblicherweise geben wir Messwerte in der folgenden Form an:
A ± ε.
(7.1)
Hier ist A die im Experiment ermittelte Messgröße und ε ist der zugehörige Messfehler. Die Schreibweise ±ε deutet an, dass die Abweichung ε sowohl positiv als auch negativ sein kann. Zum Beispiel
bedeutet
v = (600 ± 30) m/s,
(7.2)
dass die gemessene Geschwindigkeit von 600 m/s mit einem wahrscheinlichen Fehler von etwa
30 m/s behaftet ist. Das heißt, der wahre Wert der Geschwindigkeit v liegt wahrscheinlich im
153
154
7 Fehlerrechnung
Intervall zwischen 570 m/s und 630 m/s. Was in diesem Zusammenhang “wahrscheinlich” heißt,
werden wir später genauer deﬁnieren. Übrigens sind Angaben wie
v = (600.125 ± 30)m/s
(7.3)
nicht sehr sinnvoll, da der Messwert 600.125 mit einer viel höheren Genauigkeit angegeben wird,
als in Anbetracht des Fehlers von ± 30 m/s möglich ist. Üblicherweise sollte die letzte signiﬁkante
Stelle in der Angabe des Messwerts von der Größenordnung des Messfehlers sein.
Fehler müssen auch berücksichtigt werden, wenn wir unterscheiden wollen, ob zwei Größen gleich
sind oder sich unterscheiden. Sind z.B. 71.5 ± 0.5 und 71.9 ± 0.3 gleich oder verschieden? Da
die Fehlerbereiche der beiden Messwerte überlappen, sind die beiden Werte nicht voneinander zu
unterscheiden. Dasselbe gilt für 60±8 und 52±7 . Hingegen sind 2.3751±0.0003 und 2.3758±0.0001
eindeutig voneinander verschieden.
Fehler in den Messwerten können im Wesentlichen zwei Ursachen haben, die eine unterschiedliche
Behandlung erfordern. Man unterscheidet zwischen systematischen und statistischen Fehlern.
Systematische Fehler sind Abweichungen, die durch Fehler in den Messinstrumenten oder im
Messverfahren selbst entstehen, z. B. durch falsche Kalibrierung der Apparatur oder durch Änderung der Messbedingungen während der Messung. Solche Fehler beeinﬂussen die Messgröße meist
in einer bestimmten Richtung. In Computersimulationen entstehen systematische Fehler oft durch
die Anwendung von Näherungen in den zugrunde liegenden theoretischen Ausdrücken oder durch
Verwendung zu kleiner Systemgrößen. Das Erkennen und Minimieren von systematischen Fehlern
ist ein essentieller Bestandteil eines jeden Experiments.
Statistische Fehler (oder zufällige Fehler) haben ihre Ursache in verschiedenen Störeinﬂüssen
während der Messung, die nur schwer beeinﬂusst werden können. Auch wenn systematische Fehler
im Experiment weitgehend eliminiert worden sind, wird die mehrmalige Messung einer bestimmten Größe nicht immer dasselbe Ergebnis liefern. Diese Abweichungen, die wir statistische Fehler
nennen, verändern den Messwert sowohl in negativer als auch in positiver Richtung.
Anschaulich können wir uns den Unterschied zwischen systematischen und statistischen Fehlern
anhand folgender Beispiele klarmachen (siehe Abb. 7.2). Wir stellen uns vor, dass wir in einer
Schießübung mehrmals auf eine Zielscheibe schießen. Dabei kann es zu folgenden Ergebnissen
kommen:
(a) Die Einschüsse liegen eng beisammen, d.h. der statistische Fehler ist klein. Die Punkte liegen
auch alle in der Nähe des Zentrums. Somit ist auch der systematische Fehler klein.
(b) Hier liegen die Punkte eng beisammen, was bedeutet, dass der statistische Fehler klein ist.
Der systematische Fehler ist groß, da die Punkte weit weg vom Zentrum liegen.
(c) Der systematische Fehler ist klein, der statistische Fehler ist groß.
(d) Beide Fehler sind groß.
Im Folgenden wollen wir uns nun hauptsächlich mit statistischen Fehlern beschäftigen. Systematische Fehler, die schwieriger zu erkennen sind, werden wir nur im Zusammenhang mit der
Fehlerfortpﬂanzung besprechen.
Aufgaben der Fehlerrechnung:
• Wir wollen von den Messergebnissen auf den wahren Wert der gemessenen Größe schließen.
• Wir wollen die Zuverlässigkeit der Messung abschätzen.
7 Fehlerrechnung
155
Abbildung 7.2: (a) statistischer Fehler klein, systematischer Fehler klein; (b) statistischer Fehler
klein, systematischer Fehler groß; (c) statistischer Fehler groß, systematischer Fehler klein; (d)
statistischer Fehler groß, systematischer Fehler groß.
7.2
Mittelwert und Varianz
Stellen wir uns vor, dass wir die Fallbeschleunigung aus einem Fallexperiment ermitteln wollen.
Dazu wird die Fallzeit t einer Kugel mit einer Stoppuhr für eine gewisse Fallstrecke h bestimmt.
Aus h = 12 gt2 können wir dann die Fallbeschleunigung g = 2h
t2 bestimmen.
Abbildung 7.3: In einem Fallexperiment messen wir die Zeit t, die ein im Schwerefeld fallender
Körper benötigt, um die Strecke h zurückzulegen.
Um die Zuverlässigkeit der Messung zu verbessern, wiederholen wir die Messung N mal in Form
einer Messreihe. Die erhaltenen Messwerte xi nennen wir eine Stichprobe aus der Menge aller
möglichen Messungen. Da jede Messung fehlerbehaftet ist, unterscheiden sich die N Messungen
einer Stichprobe. Als beste Schätzung des unbekannten “wahren” Wertes betrachten wir den arith-
156
7 Fehlerrechnung
metischen Mittelwert der N Messwerte xi :
N
1 x=
xi
N i=1
Stichprobe = {x1 , . . . , xN }.
(7.4)
Dieser Deﬁnition liegt der Gedanke zugrunde, dass statistische Abweichungen nach oben und unten gleich wahrscheinlich sind und sich im Mittel deshalb ausgleichen. Je größer unsere Stichprobe
ist, umso genauer können wir durch den Mittelwert x den wahren Wert der Messgröße abschätzen.
Wir werden dies später quantitativ untersuchen.
Abbildung 7.4: (a) Kleine Streuung der Daten um den Mittelwert; (b) große Streuung der Daten
um den Mittelwert.
Zusätzlich zum Mittelwert ist es auch nützlich zu wissen, wie stark die Messwerte im Durchschnitt
vom Mittelwert abweichen. Wir könnten nun versuchen, die mittlere Abweichung der Messwerte
vom Mittelwert zu berechnen:
N
N N
1 1 1 (xi − x) =
xi −
x
N i=1
N i=1
N i=1
N
1 N
=
xi − x = 0.
(7.5)
N i=1
N
=x
=x
Dieser Mittelwert verschwindet jedoch, weil sich die positiven und negativen Abweichungen vom
Mittelwert genau kompensieren.
Ein besseres Maß für die statistische Streuung der Messwerte ist die Varianz s2 , bei der statt der
Abweichungen die Abweichungsquadrate summiert werden:
s2 =
N
1 (xi − x)2 .
N i=1
(7.6)
Summe der Abweichungsquadrate
Hier ist der Beitrag jedes Messwertes zur Varianz wegen des Quadrats positiv und es kommt zu
keiner Kompensation der positiven und negativen Abweichungen. Die Varianz s2 ist das mittlere
Abweichungsquadrat der Messwerte xi vom Mittelwert x.
Die Varianz hat die Dimension des Quadrats der Dimension der gemessenen Größe. Um ein Abweichungsmaß mit der gleichen Dimension wie die Messgröße zu erhalten, ziehen wir die Wurzel
aus der Varianz:
,
N
-1 (xi − x)2 .
(7.7)
s=.
N i=1
Man nennt s die Standardabweichung.
7 Fehlerrechnung
157
Wir können uns jetzt die Frage stellen, ob wir nicht einen vom arithmetischen Mittelwert verschiedenen Bezugswert x̃ wählen können, sodass die für diesen Wert deﬁnierte Varianz
s2 =
N
1 (xi − x̃)2
N i=1
(7.8)
kleiner wird als die bezüglich des arithmetischen Mittelwerts x.
Um diese Frage zu beantworten, minimieren wir s2 bezüglich x̃, indem wir s2 nach x̃ ableiten und
die Ableitung gleich Null setzen:
1 d(s2 )
!
=
2(xi − x̃)(−1) = 0.
dx̃
N
(7.9)
Daraus folgt
N
(xi − x̃) = 0
⇒
i=1
N
xi =
i=1
N
x̃ = N x̃
(7.10)
i=1
und somit
x̃ =
N
1 xi .
N i=1
(7.11)
Mit anderen Worten bedeutet dies, dass der arithmetische Mittelwert x einer Stichprobe ihre
Varianz und somit auch ihre Standardabweichung minimiert.
7.3
7.3.1
Verteilungen und Histogramme
Grundlagen
Eine Stichprobe bestehend aus N Messwerten einer bestimmten Größe kann als zufällige Auswahl aus der Menge aller möglichen Messwerte betrachtet werden. Diese Menge nennen wir die
Grundgesamtheit. Nun kann es sein, dass nicht alle möglichen Messwerte der Grundgesamtheit
gleich häuﬁg vorkommen. Kleine Abweichungen vom Mittelwert sind im Allgemeinen weitaus häuﬁger als große. Wir berücksichtigen diese Tatsache, indem wir die Grundgesamtheit statistisch mit
Hilfe von so genannten Wahrscheinlichkeitsverteilungen und Wahrscheinlichkeitsdichten
beschreiben.
Abbildung 7.5: Zur Bestimmung der Häuﬁgkeit unterschiedlicher Messfehler teilen wir das Intervall
[a, b] in kleine Bereiche und zählen, wie viele Messwerte in jedes Intervall fallen.
Dazu verfahren wir folgendermaßen. Stellen wir uns vor, dass wir eine Größe x N mal messen und
dadurch die Messwerte xi erhalten. Wir teilen nun die x-Achse, auf die wir die Messwerte auftragen
können, in M kleine Intervalle (oder Zellen) der Breite ∆x ein und nummerieren die Intervalle mit
dem Index j (siehe Abb. 7.5). Wir nehmen weiters an, dass alle Messwerte xi im Bereich [a, b]
liegen. (Diese Einschränkung kann leicht aufgehoben werden.) Das Intervall j wird von den Werten
a + (j − 1)∆x und a + j∆x begrenzt, wobei a + M ∆x = b.
158
7 Fehlerrechnung
Wir zählen jetzt, wie viele der Messwerte in jedem der Intervalle liegen und bezeichnen die Zahl der
Messwerte im Intervall j mit n(j). Da die Gesamtanzahl der Messungen N ist, muss die Summation
von n(j) über alle Zellen
M
n(j) = N
(7.12)
j=1
ergeben. Wenn wir n(j) graphisch darstellen, erhalten wir ein Histogramm (siehe Abb. 7.6).
Messwerte aus einem Intervall mit großem n(j) kommen häuﬁg vor, solche mit kleinem n(j) weniger
häuﬁg.
Abbildung 7.6: Ein Histogramm erhält man, wenn man die Anzahl n(j) der im Intervall j gezählten
Messwerte graphisch darstellt.
Indem wir die Zahlen n(j) durch die Gesamtzahl N der Messwerte dividieren,
h(j) =
n(j)
,
N
(7.13)
erhalten wir ein normiertes Histogramm mit den Eigenschaften
M
j=1
h(j) =
M
n(j)
j=1
N
=
N
= 1.
N
(7.14)
Die Zahl h(j) entspricht für große N der Wahrscheinlichkeit, dass ein Messwert xi im Intervall j
(also zwischen a + (j − 1)∆x und a + j∆x) liegt.
Im Grenzwert sehr kleiner Intervallgrößen ∆x können wir eine kontinuierliche Funktion f (x), die so
genannte Verteilungsdichte (oder Wahrscheinlichkeitsdichte), deﬁnieren, die in diesem Fall
die Rolle des Histogramms übernimmt. Dazu betrachten wir den Grenzübergang
n(x)
,
∆x→0 N →∞ N ∆x
f (x) = lim
lim
(7.15)
wobei n(x) die Anzahl der Messwerte im Intervall [x, x + ∆x] ist. Hier wird durch den Grenzübergang ∆x → 0 das Verhältnis n(x)/N immer kleiner (da das Intervall schrumpft). Da ∆x in der
obigen Gleichung jedoch auch im Nenner auftritt, konvergiert n(x)/N ∆x gegen einen endlichen
Wert. Die Wahrscheinlichkeitsdichte f (x) hat die Dimension [1/x].
Nach dieser Deﬁnition ist
df = f (x)dx
(7.16)
7 Fehlerrechnung
159
der inﬁnitesimale Bruchteil der Messungen, die im inﬁnitesimalen Intervall [x, x+dx] liegen. f (x)dx
kann auch als die Wahrscheinlichkeit, einen Messwert im Intervall [x, x+dx] zu ﬁnden, interpretiert
werden. Aus der Normierung von h(j) = n(j)/N folgt, dass das Integral über die Wahrscheinlichkeitsdichte gleich 1 ist:
%b
f (x)dx = 1.
(7.17)
a
Dies entspricht der Tatsache, dass ein Messwert irgendwo zwischen a und b liegen muss. Man
bezeichnet die Wahrscheinlichkeitsdichte deshalb als normiert. Im Gegensatz zum Histogramm
ist die Wahrscheinlichkeitsdichte eine kontinuierliche Funktion.
Abbildung 7.7: Die Warscheinlichkeitsdichte f (x) ist eine kontinuierliche Funktion, die die inﬁnitesimale Wahrscheinlichkeit df = f (x)dx angibt, dass ein Messwert im inﬁnitesimalen Intervall
[x, x + dx] liegt.
Natürlich besteht keine Notwendigkeit, uns auf ein endliches Intervall [a, b] zu beschränken und
wir können ohne weiteres den gesamten Zahlenbereich von −∞ bis +∞ betrachten. (Falls die
Wahrscheinlichkeitsdichte f (x) auf ein Intervall [a, b] beschränkt ist, kann sie auf die gesamte
Zahlengerade erweitert werden, indem man
f (x) = 0
für
x < a und x > b
(7.18)
setzt.)
Abbildung 7.8: Die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) dafür, einen Messwert im Intervall [x1 , x2 ]
zu ﬁnden, ist gleich der Fläche unter der Wahrscheinlichkeitsdichte f (x) zwischen x1 und x2 (schrafﬁerter Bereich).
Aus der Wahrscheinlichkeitsdichte f (x) können wir die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) be-
160
7 Fehlerrechnung
rechnen, dass sich ein Messwert zwischen zwei beliebigen Grenzen x1 und x2 beﬁndet:
%x2
P (x1 ≤ x ≤ x2 ) =
f (x)dx.
(7.19)
x1
Wenn wir in diesem Ausdruck x1 = −∞ als untere Schranke wählen, erhalten wir die so genannte
Wahrscheinlichkeitsverteilung (oder Wahrscheinlichkeitsfunktion oder Verteilungsfunktion oder Verteilung):
%x
f (u)du.
F (x) =
(7.20)
−∞
F (x) ist die Wahrscheinlichkeit, einen Messwert zu ﬁnden, der kleiner oder gleich x ist.
Beispiel:
Die Maxwellsche Verteilung beschreibt die Wahrscheinlichkeitsdichte der Geschwindigkeitskomponenten eines einzelnen Teilchens in einem klassischen Vielteilchensystem mit Temperatur T . Für
die x-Komponente vx der Geschwindigkeit lautet sie
"
2
m
1
e− 2 βmvx
f (vx ) =
β = 1/kB T.
(7.21)
2πkB T
Die Geschwindigkeitskomponenten in y- und in z-Richtung haben identische Wahrscheinlichkeitsdichten. Hier ist kB die nach dem österreichischen Physiker Ludwig Boltzmann (1844-1906) benannte Boltzmannkonstante und β = 1/kB T . Diese Wahrscheinlichkeitsdichte ist normiert, das
heißt
%
(7.22)
f (vx )dvx = 1.
Allgemeine Eigenschaften der Wahrscheinlichkeitsdichte f (x) und der Wahrscheinlichkeitsverteilung F (x) sind:
1. f (x) ≥ 0.
2. f (x) ist normiert, das heißt:
%∞
f (x)dx = 1.
(7.23)
−∞
3. F (x) ist monoton wachsend und eine Stammfunktion von f (x) (siehe Abb. 7.9):
F (x) = f (x).
(7.24)
4. F (−∞) = 0 und F (∞) = 1.
5. Die Wahrscheinlichkeit, dass die Variable x einen Wert im Intervall zwischen a und b annimmt, ist:
%b
P (a ≤ x ≤ b) = F (b) − F (a) =
f (x)dx.
(7.25)
a
(Genau genommen ist F (x) so deﬁniert, dass der Wert a ausgeschlossen und der Wert b
eingeschlossen ist. Für stetige Wahrscheinlichkeitsverteilungen macht dies jedoch keinen Unterschied.)
7 Fehlerrechnung
161
Abbildung 7.9: Die Wahrscheinlichkeitsdichte f (x) ist die erste Ableitung der Wahrscheinlichkeitsverteilung F (x).
7.3.2
Erwartungswert, Momente einer Verteilung
Mittelwert
Der Begriﬀ des Mittelwerts und der Varianz lassen sich auch auf kontinuierliche Verteilungsdichten
f (x) übertragen. Betrachten wir eine Grundgesamtheit, die durch die Verteilung f (x) beschrieben
wird. Wir führen zunächst N mal eine Messung aus und erhalten die Messwerte xi . Der Mittelwert
dieser Messwerte ist
N
1 x=
xi .
N i=1
(7.26)
Wir teilen die x-Achse nun wieder in M kleine Intervalle der Breite ∆x ein und nummerieren diese
Zellen mit dem Index j. Wir zählen die Messwerte in jedem Intervall und bezeichnen diese Zahl
mit n(j). Außerdem bezeichnen wir den Mittelpunkt jeder Zelle mit x(j).
Abbildung 7.10: Bei der Berechnung von Mittelwerten aus einem Histogramm nähern wir jeden
x-Wert im Intervall j durch x(j) an.
Wenn ∆x klein ist, können wir jeden Messwert im Intervall j durch den Wert x(j) annähern. Mit
dieser Näherung können wir die Summe in Gleichung (7.26) über alle Messwerte in eine Summe
über alle M Intervalle (Zellen) umschreiben:
N
M
1 1 x=
xi ≈
n(j)x(j).
N i=1
N j=1
(7.27)
162
7 Fehlerrechnung
Die zweite Summe geht aus der ersten Summe einfach durch Zusammenfassen der Messwerte in
der jeweils gleichen Zelle hervor. Durch Multiplikation mit ∆x und gleichzeitiger Division durch
∆x erhalten wir
x≈
M
n(j)x(j)
N ∆x
j=1
∆x.
(7.28)
Führen wir die Grenzwerte ∆x → 0 und N → ∞ aus, verwandelt sich diese Summe in ein Integral:
%∞
x=
xf (x)dx,
(7.29)
−∞
wobei wir die Deﬁnition (7.15) benutzt und den Wertebereich auf −∞ und ∞ ausgedehnt haben.
Für den Mittelwert einer Verteilungsdichte verwenden wir oft den Buchstaben µ, um ihn vom
Mittelwert x einer Stichprobe zu unterscheiden. µ ist der Mittelwert der Grundgesamtheit. (Im
Allgemeinen verwenden wir griechische Buchstaben für Eigenschaften der Grundgesamtheit und
lateinische Buchstaben für Eigenschaften von Stichproben.)
Erwartungswert
Der Mittelwert µ wird auch oft Erwartungswert E(x) von x genannt:
%∞
E(x) =
xf (x)dx = µ.
(7.30)
−∞
Im Allgemeinen ist der Erwartungswert einer Größe g(x), die eine Funktion der Variablen x mit
Verteilungsdichte f (x) ist, gegeben durch:
%∞
E[g(x)] =
g(x)f (x)dx.
(7.31)
−∞
Den Erwartungswert bezeichnen wir oft auch mit spitzen Klammern:
E[g(x)] = g(x).
(7.32)
Aus der Deﬁnition des Erwartungswertes folgt, dass der Erwartungswert einer Summe gleich der
Summe der Erwartungswerte ist:
E[g(x) + h(x)] = E[g(x)] + E[h(x)].
(7.33)
Ferner kann eine reelle Zahl α vor den Erwartungswert gezogen werden:
E[αg(x)] = αE[g(x)].
(7.34)
Varianz
Analog zum Mittelwert µ können wir für die Verteilungsdichte f (x) auch eine Varianz deﬁnieren:
%∞
(x − µ)2 f (x)dx.
σ2 =
(7.35)
−∞
Wir verwenden oft auch die Schreibweise:
Var(x) = σ 2 .
(7.36)
7 Fehlerrechnung
163
Die Varianz ist die mittlere quadratische Abweichung der Messwerte x vom Mittelwert µ. In anderen
Worten, die Varianz ist der Erwartungswert von (x − µ)2 , also σ 2 = E[(x − µ)2 ]. Die Wurzel aus
der Varianz ist die Standardabweichung σ.
Durch Ausmultiplizieren des Quadrats im Integranden und Verwendung obiger Rechenregeln erhalten wir aus Gleichung (7.35) den Ausdruck
σ2
=
=
=
E[(x − µ)2 ] =
E x2 − 2E(xµ) + µ2
E x2 − 2µ E(x) +µ2
=µ
=
E x2 − µ2 = E x2 − (E(x))2 = x2 − x2 .
(7.37)
Momente
Der hier auftretende Erwartungswert E(x2 ) wird das 2. Moment der Verteilungsdichte f (x)
genannt. Der Mittelwert E(x) ist das 1. Moment von f (x). Im Allgemeinen ist das n-te Moment
einer Verteilung f (x) deﬁniert als:
%∞
E (x ) = x =
n
n
xn f (x)dx.
(7.38)
−∞
7.3.3
x und s2 als Schätzer für µ und σ 2
Die Kenngrößen µ und σ 2 der Grundgesamtheit sind meist unbekannt und können nur aufgrund
der Stichprobendaten geschätzt werden. So können wir etwa x als einen Schätzer für µ verwenden.
Das ist unter anderem dadurch gerechtfertigt, dass der Erwartungswert von x gleich µ ist
/
0
1 Nµ
1 = µ.
(7.39)
E(x) = E
xi =
E(xi ) =
N i
N i
N
Etwas anders verhält es sich mit der Varianz s2 , die wir als Schätzer für σ 2 verwenden könnten.
Der Erwartungswert der Varianz ist
/
0
+
2
1 1 *
2
= E
(xi − x) =
E (xi − x)2
E s
N i
N i
1
2
1 2
=
E xi − 2xi x + x2
N
i
1
2
2
1
2
E xi − 2
E(xi x) +
E x
=
N
i
i
i






1
1
1
1
=
N E x2 − 2
E xi
xj  +
E
xk ·
xl

N
N j
N
N
i
i
k
l



1 
2 1 =
E (xi xj ) + 2
E (xk xl ) .
N E x2 −
(7.40)

N
N
N
i,j
i
k,l
Der Erwartungswert E(xi xj ) des Produkts xi xj hängt davon ab, ob die beiden Indizes i und j
gleich sind. Für i = j gilt
E(xi xj ) = E(x2i ) = E(x2 ).
(7.41)
164
7 Fehlerrechnung
Für i = j können wir im Falle statistisch unabhängiger xi schreiben
E(xi xj ) = E (xi ) E (xj ) = E(x)2 .
(7.42)
(Zur Deﬁnition des Erwartungswertes E(xi xj ) ist es notwendig, Wahrscheinlichkeitsdichten zu
betrachten, die von zwei Variablen abhängen. Dazu verweisen wir die Leser an die einschlägige
Literatur). Durch Verwendung dieser Ausdrücke können wir vereinfachen:



2
2
1 
2  2 E xi +
E (xi ) E (xj )
E s =
NE x −
N 
N
i
i=j



1  2 E xk +
E (xk ) E (xl )
+ 2

N i
k
k=l
6
7 (7.43)
2
2
2
2 1 1
2
2
N E x + N (N − 1)µ +
N E x + N (N − 1)µ
NE x −
=
N
N
N
9
1 8
(N − 1)E x2 − (N − 1)µ2
=
N
9 N −1 2
N − 1 8 2
=
σ
E x − µ2 =
N
N
und somit erhalten wir
σ2 =
N
E s2 .
N −1
(7.44)
(Das selbe Ergebnis erhält man auch, wenn man den Erwartungswert E[(as2 − σ 2 )] betrachtet
und jene Konstante a bestimmt, für die dieser Erwartungswert minimal ist.) Das heißt, der Erwartungswert des Schätzers ist um einen Faktor NN−1 kleiner als die Varianz der Grundgesamtheit.
Für große N ist das irrelevant. Damit der Erwartungswert der Stichprobenvarianz gleich σ 2 ist,
deﬁniert man die Varianz oft als
1 (xi − x)2 .
N − 1 i=1
N
s2 =
7.3.4
(7.45)
Fehler des Mittelwerts
Wie wir oben besprochen haben, betrachten wir den Mittelwert x einer Stichprobe von Messungen
als Schätzwert für den “wahren” Mittelwert µ, den Mittelwert der zur Grundgesamtheit gehörenden
Verteilungsdichte f (x). Da die Stichprobe jedoch nur endlich viele Werte beinhaltet, machen wir
bei so einer Schätzung immer einen gewissen Fehler. Wir wollen nun diesen Fehler abschätzen.
Abbildung 7.11: Da jede Stichprobe aus N unterschiedlichen Werten besteht, unterscheiden sich
die zugehörigen Mittelwerte xk .
Zu diesem Zwecke betrachten wir mehrere Stichproben von jeweils gleicher Größe N (das heißt,
jede Stichprobe besteht aus N Messwerten) (siehe Abb. 7.11). Jede dieser Stichproben liefert
7 Fehlerrechnung
165
einen unterschiedlichen Mittelwert xk . Für L Stichproben erhalten wir L verschiedene Mittelwerte
xk . Die durchschnittliche quadratische Abweichung dieser Mittelwerte von µ, dem Mittelwert der
Grundgesamtheit, ist:
1
(xk − µ)2 .
L
L
(7.46)
k=1
Für sehr große L wird dieser Ausdruck zu
*
+
σx2 = E (x − µ)2 .
(7.47)
Dies ist die Varianz der aus den Stichproben der Größe N ermittelten Mittelwerte x. Die Varianz
beschreibt die Streuung der Mittelwerte, die man aus einer Vielzahl verschiedener Stichproben
erhält.
Einige algebraische Umformungen liefern:
+
*
σx2 = E (x − µ)2 = E x2 − 2E(xµ) + E µ2


1
= E
x x  − 2µ E(x) +µ2
2 i j
N
i,j
=µ
=


1
1
E (xi xj ) − µ2 = 2 
E x2i +
E(xi )E(xj ) − µ2
N 2 i,j
N
i
i=j
=
=
+
1 *
N E x2 + N (N − 1)µ2 − µ2
N2
+
1 * 2
E x − µ2 .
N
(7.48)
Wegen E x2 − µ2 = σ 2 erhalten wir also
1 2
σ
N
(7.49)
σ
σx = √ ,
N
(7.50)
σx2 =
oder
wobei σ die Standardabweichung der Grundgesamtheit ist.
Das heißt, dass die Standardabweichung des Mittelwerts umso kleiner ist, je größer die Stichprobe
ist. Durch Erhöhung der Anzahl N der unabhängigen Messungen können wir die Genauigkeit der
Messung steigern. Um den Fehler σx im Mittelwert zu halbieren, müssen wir gemäß Gleichung
(7.50) den Umfang der Stichprobe vervierfachen.
7.3.5
Die Gaußsche Normalverteilung
In allen bisherigen Betrachtungen haben wir auf keine speziﬁsche funktionale Form der Verteilungsfunktion Bezug genommen. Die genaue Gestalt der Verteilung hängt natürlich vom betrachteten
Messprozess ab. In vielen Fällen und unter recht allgemeinen Bedingungen folgen Messfehler jedoch
der Gaußschen Normalverteilung, benannt nach Carl Friedrich Gauß (1777-1855). Dies ist immer dann der Fall, wenn statistische Fehler durch die Überlagerung sehr vieler kleiner unabhängiger
“Störfaktoren” entstehen. Mathematisch kann dies mit Hilfe des zentralen Grenzwertsatzes gezeigt werden, auf den hier aus Platzgründen nicht weiter eingegangen werden kann. Die Gaußsche
Normalverteilung (auch Gaußsche Glockenkurve genannt) ist gegeben durch
f (x) = √
(x−µ)2
1
e− 2σ2
2πσ
(7.51)
166
7 Fehlerrechnung
Abbildung 7.12: Die Gaußsche Normalverteilung.
und hat die Gestalt einer Glocke mit Maximum an der Stelle µ und einer Breite von 2σ (die
Wendepunkte der Kurve liegen bei µ ± σ) (siehe Abb. 7.12).
Der Mittelwert und die Varianz der Gaußschen Normalverteilung sind
%∞
(x−µ)2
x
√
e− 2σ2 dx = µ
2πσ
(7.52)
2
(x − µ)2 − (x−µ)
√
e 2σ2 dx = σ 2 .
2πσ
(7.53)
−∞
und
%∞
−∞
Das heißt, die Gaußsche Normalverteilung ist durch Angabe des 1. und 2. Moments vollständig
bestimmt. Die Gaußsche Normalverteilung ist normiert,
%∞
√
−∞
(x−µ)2
1
e− 2σ2 dx = 1
2πσ
(7.54)
und ist um µ symmetrisch, das heißt
f (µ + x) = f (µ − x).
(7.55)
Die Wahrscheinlichkeit, dass ein Messwert im Bereich zwischen a und b liegt, ist durch das Integral
%b
P (a ≤ x ≤ b) =
f (x)dx
(7.56)
a
gegeben. Solche Wahrscheinlichkeiten kann man auch mit Hilfe der so genannten Errorfunktion
ausdrücken, die wie folgt deﬁniert ist:
2
erf(x) = √
π
%x
2
e−t dt.
(7.57)
0
Die Errorfunktion ist so deﬁniert, dass erf(∞) = 1. Mit dieser Deﬁnition können wir die Wahrscheinlichkeit P (a ≤ x ≤ b) ausdrücken als:
7
6 a−µ
b−µ
1
− erf √
.
(7.58)
erf √
P (a ≤ x ≤ b) =
2
2σ
2σ
7 Fehlerrechnung
167
Die Wahrscheinlichkeit, dass ein Messwert kleiner ist als a, ist gegeben durch:
6
7
1
a−µ
P (x ≤ a) =
1 + erf √
.
2
2σ
(7.59)
Für die Gaußsche Normalverteilung (siehe Abb. 7.13) sollten wir demnach
68 %
95 %
99.7 %
aller Messwerte im Intervall
aller Messwerte im Intervall
aller Messwerte im Intervall
(µ ± σ),
(µ ± 2σ) und
(µ ± 3σ)
erwarten, das heißt, eine Abweichung vom Mittelwert von mehr als ±3σ ist statistisch nur etwa
alle 300 Messungen zu erwarten.
Abbildung 7.13: Die Wahrscheinlichkeit, einen Messwert im Intervall (µ ± σ) zu ﬁnden, ist 68%,
im Intervall (µ ± 2σ) ist sie 95% und im Intervall (µ ± 3σ) 99.7%.
Ist die Variable x gaußverteilt, so ist es auch der Mittelwert x = N1 N
i=1 xi . Sowohl die Verteilungen
von x selbst als auch die des Mittelwerts x haben einen Mittelwert von µ. Die Varianzen σ und σx
der beiden Verteilungen unterscheiden sich jedoch und sind durch
σx2 =
σ2
N
(7.60)
miteinander verknüpft. Die Verteilung des Mittelwerts x ist also um den Faktor
die Verteilung der Variablen x selbst.
√
N schmäler als
Aus der Gaußverteilung ergibt sich, dass der “wahre” Mittelwert der Verteilung
mit einer Wahrscheinlichkeit von
mit einer Wahrscheinlichkeit von
mit einer Wahrscheinlichkeit von
68 %
95 %
99.07 %
im Intervall
im Intervall
im Intervall
x ± σx ,
x ± 2σx und
x ± 3σx liegt.
Diese Intervalle nennt man Konﬁdenzintervalle oder Vertrauensintervalle.
7.3.6
Verteilung diskreter Größen
Bis jetzt haben wir uns mit der Verteilung von kontinuierlichen Größen beschäftigt. Es kann aber
in der Physik durchaus vorkommen, dass die Messgröße nur diskrete (endlich viele oder abzählbar
unendlich viele) Werte annehmen kann. Zum Beispiel kann die Anzahl der in einer gewissen Zeit
168
7 Fehlerrechnung
zerfallenden Kerne eines radioaktiven Materials nur eine ganze Zahl sein, also einen der Werte
0,1,2,... usw. annehmen. Im Falle diskreter Größe beschreiben wir die Verteilung der Messwerte durch die Wahrscheinlichkeitsfunktion f (xi ), welche die Wahrscheinlichkeit ist, bei einer
Messung der Größe x den Wert xi zu beobachten. Die Wahrscheinlichkeitsfunktion f (xi ) muss
normiert sein:
f (xi ) = 1.
(7.61)
i
(Das Integral für die kontinuierliche Wahrscheinlichkeitsdichte haben wir hier also durch eine
Summe ersetzt.)
Die zugehörige Verteilungsfunktion ist
F (x) =
f (x ).
(7.62)
x ≤x
Die Verteilungsfunktion F (x) ist die Wahrscheinlichkeit, einen Messwert zu beobachten, der kleiner
oder gleich x ist. Der Mittelwert und die Varianz einer diskreten Verteilung sind gegeben durch:
xi f (xi ),
(7.63)
E(x) =
i
Var(x)
=
f (xi )(xi − µ)2 .
(7.64)
i
Der Erwartungswert einer Funktion g(x) ist
E [g(x)] =
f (xi )g(xi ).
(7.65)
i
√
Auch für diskrete Verteilung gilt σx = σ/ N für die Standardabweichung des Mittelwerts.
Folgende Ausdrücke sind gebräuchlich:
7.3.7
diskret
kontinuierlich
f (x)
• Wahrscheinlichkeitsfunktion
• Verteilungsdichte
• Dichtefunktion
• Wahrscheinlichkeitsdichte
F (x)
• Verteilungsfunktion
• Wahrscheinlichkeitssumme
• Verteilungsfunktion
• Wahrscheinlichkeitsintegral
• Wahrscheinlichkeitsverteilung
Poissonverteilung
Die Anzahl von zufälligen
intervall stattﬁnden, folgt
Monat geborenen Babies,
kerne oder die Anzahl der
durch
und statistisch unabhängigen Ergebnissen, die in einem gewissen Zeitder Poissonverteilung. Beispiele sind die in einem Krankenhaus pro
die in einer radioaktiven Substanz pro Zeiteinheit zerfallenden AtomFehler pro Seite in diesem Skriptum. Die Poissonverteilung ist gegeben
f (x) =
µx e−µ
x!
(für ganzzahliges x).
(7.66)
Wir schreiben auch oft P (n) statt f (x), um anzudeuten, dass die Poissonverteilung nur für ganzzahlige Werte des Arguments deﬁniert ist (siehe Abb. 7.14).
7 Fehlerrechnung
169
Abbildung 7.14: Die Poissonverteilung für µ = 10.
Die Poissonverteilung ist normiert:
∞
P (n) =
n=0
∞
∞
µn e−µ
µn
= e−µ
= e−µ eµ = 1
n!
n!
n=0
n=0
(7.67)
eµ
(Da n nur diskrete Werte annimmt, haben wir hier summiert statt integriert.)
Die Poissonverteilung ist durch einen einzigen Parameter µ vollständig bestimmt. Der Parameter
µ ist der Mittelwert E(n) der Verteilung:
E(n) =
∞
nP (n) =
n=0
∞
µn e−µ
.
n
n!
n=0
(7.68)
Da das erste Summenglied verschwindet, können wir schreiben:
E(n) =
∞
∞
∞
∞
µn e−µ
µn
µn−1
µn
= e−µ
= µe−µ
= µe−µ
n
= µ.
n!
(n − 1)!
(n − 1)!
n!
n=1
n=1
n=1
n=0
(7.69)
eµ
Der Mittelwert µ ist gleich der Anzahl der Ereignisse, die im Mittel in der betrachteten Zeit
stattﬁnden.
Besonders interessant ist die Varianz der Poissonverteilung:
σ 2 = E(n2 ) − E(n)2 .
(7.70)
Der Erwartungswert von n2 ist:
2
E(n ) =
∞
n=0
2
n P (n) =
∞
n
n −µ
2µ e
n=0
n!
= µe
−µ
∞
nµn−1
.
(n − 1)!
n=1
(7.71)
Durch Umnummerierung der Summe erhalten wir:

E(n2 ) = µe−µ



∞
∞
 ∞ nµn (n + 1)µn
µn 
 = µ2 + µ.
= µe−µ 
+


n!
n!
n!
n=0

n=0
n=0
(7.72)
σ 2 = E(n2 ) − E(n)2 = µ2 + µ − µ2 = µ.
(7.73)
µeµ
eµ
Daraus folgt:
170
7 Fehlerrechnung
Das heißt, für die Poissonverteilung ist die Varianz gleich dem Mittelwert. Diese Formel ist sehr
wichtig zur Abschätzung des Fehlers bei Messvorgängen, bei denen wir Ereignisse zählen. Für große
µ wird die Poissonverteilung zu einer Gaußverteilung.
Beispiel:
In einer gewissen Zeit zählen wir 625 Zerfälle in einem radioaktiven Präparat. Der Fehler, den wir
durchschnittlich bei einer solchen Messung machen, ist
√
√
(7.74)
σ = µ ≈ 625 = 25.
Daher ist unser Messergebnis:
625 ± 25.
7.4
(7.75)
Fehlerfortpﬂanzung
Oft können physikalische Größen nicht direkt gemessen werden. Man bestimmt dann diese Größen,
indem man sie als Funktion von anderen Größen ausdrückt, welche messbar sind. So kann man zum
Beispiel die Dichte einer Flüssigkeit bestimmen, indem man für eine gewisse Menge an Substanz
sowohl das Volumen V als auch die Masse m misst. Die Dichte ρ ergibt sich dann aus
ρ=
m
.
V
(7.76)
Da sowohl die Masse m als auch das Volumen V als experimentell ermittelte Größen fehlerbehaftet sind, ist auch die daraus bestimmte Dichte ρ fehlerbehaftet. Man sagt, der Fehler in den
unabhängigen Größen m und V pﬂanzt sich auf die abhängige Größe ρ = m/V fort. Wir wollen
jetzt den Fehler in der abhängigen Größe aus den Fehlern der unabhängigen Größen bestimmen.
Im Allgemeinen betrachten wir eine Größe u, die von den N Größen x1 , x2 , . . . , xN abhängt:
u = u(x1 , x2 , . . . , xN ).
(7.77)
Wir nehmen an, dass x1 bis xN experimentell bestimmte Größen sind und dass deren Statistik durch
die Verteilungsdichten f1 (x1 ), f2 (x2 ), . . . , fN (xN ) beschrieben wird. Die zugehörigen Mittelwerte
und Varianzen sind
µ1 , µ2 , . . . , µN
(7.78)
2
.
σ12 , σ22 , . . . , σN
(7.79)
und
Für jede Messgröße xi bestimmen wir nun für eine Stichprobe aus M Messungen den Mittelwert
xi . Die Standardabweichung dieser Mittelwerte ist gegeben durch (siehe Abschnitt 7.3.4):
σi
σxi = √ .
M
(7.80)
Wir können nun die Größe u für die Mittelwerte xi bestimmen,
u ≡ u(x1 , x2 , . . . , xN ),
(7.81)
und nach dem Fehler in u fragen, der durch die Fehler σxi der Mittelwerte entsteht. Um diese
Frage zu beantworten, können wir auf zwei verschiedene Weisen vorgehen: Wir können entweder
den Maximalfehler in der abhängigen Größe u abschätzen oder die statistischen Kennwerte
der Verteilung von u ermitteln.
7 Fehlerrechnung
7.4.1
171
Fortpﬂanzung von Maximalfehlern
Unter der Annahme, dass die Fehler ∆xi in den unabhängigen Größen klein sind, können wir den
dadurch hervorgerufenen Fehler ∆u einfach durch Anwendung des Diﬀerentials abschätzen
∆u ≈
N ∂u
i=1
∂xi
∆xi .
(7.82)
Das heißt, hier haben wir den Fehler durch das Diﬀerential angenähert, das wir in Kapitel 3
kennengelernt haben. Das Diﬀerential von u gibt an, um wie viel sich u ändert, wenn die Größen
xi um jeweils ∆xi verändert werden. So würde man etwa im Falle von systematischen Fehlern
vorgehen.
Da wir pessimistisch veranlagt sind, wollen wir den “worst case” annehmen und den Betrag des
größtmöglichen Fehlers bestimmen. Dazu nehmen wir an, dass alle Terme einen positiven Beitrag
zum Fehler in u liefern, das heißt, dass alle Fehler in die gleiche Richtung gehen und erhalten somit:
!
N !
! ∂u
!
! ! !
!.
!∆u! ≈
∆x
i
! ∂xi
!
(7.83)
i=1
Wenn wir die Standardabweichungen σxi als Maß für die Fehler in xi benutzen, erhalten wir
!
N !
! ∂u !
! ! !
!
!∆u! ≈
! ∂xi !σxi ,
i=1
(7.84)
wobei die partiellen Ableitungen an der Stelle (x1 , x1 , . . . , xN ) ausgewertet werden.
Beispiel:
Betrachten wir wieder die Bestimmung der Dichte ρ aus dem gemessenen Volumen V und der
gemessenen Masse m. Wir nehmen an, dass wir sowohl das Volumen als auch die Masse in M
wiederholten Messungen bestimmt haben. Aus diesen Messreihen erhalten wir die Mittelwerte V
und m und die Varianzen s2V und s2m . Wir identiﬁzieren diese Varianzen mit den Varianzen σV2
2
und σm
der zugehörigen Grundgesamtheiten. Als Maß für die Fehler in den Mittelwerten V und
m verwenden wir
σV
(7.85)
σV = √
M
und
σm
σm = √ .
M
Dann ist der Maximalfehler in der Dichte gegeben durch
!
!
!
!
! ∂ρ !
! ∂ρ !
!
!·σ
!
!
|∆ρ| ≈ !
· σm + !
∂m !
∂V ! V
m
1
σm + 2 σV
=
V
V
ρ
1
σm + σV ,
=
V
V
(7.86)
(7.87)
wobei wir ρ ≡ m/V verwendet haben. Der relative Fehler |∆ρ|/ρ ist also gegeben durch:
σ
σm
|∆ρ|
≈
+ V.
ρ
m
V
(7.88)
172
7 Fehlerrechnung
Der relative Fehler in ρ ist also die Summe der relativen Fehler in m und V .
Die Methode der Fortpﬂanzung der Maximalfehler kann den Fehler aber leicht überschätzen. Realistischer ist es in vielen Fällen, die Wirkung der Fehler σxi auf die statistischen Kennwerte der
Verteilung von u zu betrachten.
7.4.2
Fortpﬂanzung statistischer Kennwerte
Wir betrachten zunächst den Fall, dass die Größe u nur von einer Variablen x abhängt, die wir
im Experiment direkt bestimmen können. Aus einer Messserie erhalten wir den Mittelwert x der
Größe x und berechnen daraus die Größe
u ≡ u(x).
(7.89)
Da x als Mittelwert von fehlerbehafteten Größen selbst fehlerbehaftet ist (siehe Abschnitt 7.3.4),
wird auch u mit einem Fehler behaftet sein. Um diesen Fehler zu bestimmen, berechnen wir die
Varianz von u:
'
(
2
Var(u) = σu2 = E (u(x) − u(µ)) ,
(7.90)
wobei µ = E(x) = E(x) der Erwartungswert von x ist. Wir schreiben nun den Mittelwert x als
Summe des Erwartungswerts µ und einer kleinen Abweichung δx:
x = µ + δx.
(7.91)
Unter der Annahme, dass sich der Mittelwert x nur wenig vom Erwartungswert µ unterscheidet,
dass δx also klein ist, können wir die Funktion u(x) in eine Taylorreihe um µ entwickeln (siehe
Kapitel 5) und nach dem linearen Glied abbrechen:
'
(
'
(
E (u(x) − u(µ))2
= E (u(µ + δx) − u(µ))2
/
2 0
du
u(µ) +
= E
δx − u(µ)
dx
/ 0 2
2
+
*
du
du
2
(7.92)
= E
(δx) =
E (δx)2 ,
dx
dx
wobei die Ableitung
von
+ u(x) an der Stelle x = µ bzw. als Näherung für µ an der Stelle x ausgewer*
tet wird. Da E (δx)2 = σx2 , erhalten wir schließlich das Gaußsche Fehlerfortpﬂanzungsgesetz
für den Fall einer Funktion u(x), die nur von einer einzelnen Variablen abhängt:
σu2
=
du
dx
2
σx2 .
(7.93)
Als nächtes betrachten wir den Fall einer Funktion u(x, y), welche von zwei Variablen x und y
abhängt. Wir fragen nun nach dem Fehler, den wir begehen, wenn wir
u ≡ u(x, y)
aus den Mittelwerten x und y bestimmen. Dazu berechnen wir wieder die Varianz:
(
'
Var(u) = σu2 = E (u(x, y) − u(µ, ν))2 .
(7.94)
(7.95)
Hier sind µ = E(x) = E(x) und ν = E(y) = E(y) die Erwartungswerte von x und y. Indem wir x
und y jeweils als Summe des Erwartungswerts und einer kleinen Abweichung ausdrücken, können
wir schreiben
(
'
(7.96)
σu2 = E (u(µ + δx, ν + δy) − u(µ, ν))2
7 Fehlerrechnung
173
und erhalten mit einer nach den linearen Gliedern abgebrochenen Taylorreihe
/
2 0
∂u
∂u
2
σu = E
u(µ, ν) +
δx +
δy − u(µ, ν)
∂x
∂y
/ 2 0
∂u
∂u
= E
.
δx +
δy
∂x
∂y
(7.97)
Hier müssen die partiellen Ableitungen ∂u/∂x und ∂u/∂y an der Stelle (µ, ν) ≈ (x, y) ausgewertet
werden. Ausführung des Quadrats ergibt:
2
2
∂u
∂u
∂u
∂u
2
2
σu2 =
E[(δx) ] + 2
E[(δy) ].
(7.98)
E[δxδy] +
∂x
∂x
∂y
∂y
Für unkorrelierte Messwerte x und y gilt E[δxδy] = E[δx]E[δy] = 0 und wir erhalten schließlich
das Gaußsche Fehlerfortpﬂanzungsgesetz für den Fall von zwei Variablen:
σu2 =
∂u
∂x
2
σx2 +
2
∂u
∂y
σy2 ,
2
(7.99)
2
wobei wir benutzt haben, dass σx2 = E[(δx) ] und σy2 = E[(δy) ].
Das Gaußsche Fehlerfortpﬂanzungsgesetz für den allgemeinen Fall einer Funktion von N Variablen,
u = u(x1 , x2 , . . . , xN ), lässt sich auf analoge Weise herleiten. Man erhält als Ergebnis:
σu2
=
2
N ∂u
∂xi
i=1
σx2i ,
(7.100)
wobei σx2i die Varianzen der zugehörigen Mittelwerte x1 , x2 , . . . , xN sind. Die Standardabweichung
σu kann als Maß für den zu erwartenden Fehler in der abhängigen Größe u aufgefasst werden.
Das Gaußsche Fehlerfortpﬂanzungsgesetz gilt, falls
• die Varianzen σxi der Mittelwerte xi klein sind und
• die Mittelwerte xi voneinander statistisch unabhängig sind.
Beispiel:
Mit der Gaußschen Fehlerfortpﬂanzung können wir die Standardabweichung der Dichte ρ =
der Standardabweichung von m und V bestimmen:
aus
σρ2
=
=
2
2
∂ρ
∂ρ
2
σm +
σV2
∂m
∂V
2
2
1
m
2
σm
+ − 2
σV2 .
V
V
m
V
(7.101)
Für den relativen Fehler erhalten wir:
σρ2
ρ2
oder
σρ
ρ
=
=
2
σV2
σm
+
2
m2
V
)
σ 2
m
m
+
σV
V
(7.102)
2
.
(7.103)
174
7 Fehlerrechnung
2
Abbildung 7.15: Der durch Gaußsche Fortpﬂanzung berechnete Relativfehler σρ /ρ = (σm
/m2 +
2
σV2 /V )1/2 ist kleiner als der Relativfehler |∆ρ|
ρ = σm /m + σV /V , den man durch Fortpﬂanzung
der Maximalfehler erhält.
Statt wie bei der Abschätzung des Maximalfehlers die relativen Fehler einfach zu addieren, addieren
wir die Quadrate der relativen Fehler und ziehen daraus die Wurzel. Durch die Anwendung der
Gaußschen Fehlerfortpﬂanzung erhalten wir also einen im Vergleich zum Maximalfehler kleineren
Fehler. Dies sieht man anhand der Dreiecksungleichung √leicht ein (siehe Abb. 7.15). Falls zum
Beispiel σm /m = σV /V , ist dieser Fehler um den Faktor 2 kleiner als der Maximalfehler.
Für bestimmte funktionale Zusammenhänge der abhängigen von der unabhängigen Größe ergeben sich besonders einfache Fälle des Gaußschen Fehlerfortpﬂanzungsgesetzes, die im Folgenden
angeführt sind.
Summen oder Diﬀerenzen
Für u = x + y oder u = x − y gilt
∂u
= 1 und
∂x
∂u
= ±1.
∂y
(7.104)
Daraus ergibt sich
σu2
= 12 σx2 + (±1)2 σy2
= σx2 + σy2
(7.105)
und somit
σu =
σx2 + σy2 .
(7.106)
Das heißt, die Varianz der abhängigen Größe ist die Summe der Varianzen der unabhängigen
Größen.
Multiplikation mit einer Konstanten
Für u = αx gilt
σu2
=
∂u
∂x
2
σx2 = α2 σx2
(7.107)
und deshalb
σu = ασx .
(7.108)
Das heißt, die Standardabweichung von u ergibt sich einfach durch Multiplikation von α mit der
Standardabweichung von x.
7 Fehlerrechnung
175
Multiplikation oder Division
Für u = xy erhalten wir durch Anwendung von Gleichung (7.100)
σu2 = y 2 σx2 + x2 σy2 .
(7.109)
Division durch x2 y 2 ergibt
σ 2
σy2
σx2
σu2
x
=
+
=
+
2
2
2
u
x
x
y
σy
y
2
.
(7.110)
Das heißt, das Quadrat des relativen Fehlers in u ist die Summe der Quadrate der relativen Fehler
in x und y.
Für die Division u = x/y gilt ganz analog:
σu2
2
2
1
x
2
=
σx +
σy2 .
y
y2
(7.111)
Nach Division durch u = x/y erhalten wir:
σ 2
σx2y
σx2x
σu2
xx
=
+
=
+
u2
x
x2
y2
7.5
σxy
y
2
.
(7.112)
Ausgleichsrechnung (Fitten)
In Experimenten bestimmt man oft eine Größe y in Abhängigkeit einer anderen Größe x. Zum
Beispiel könnte in einem Experiment das Volumen V einer Flüssigkeit als Funktion der Temperatur
T gemessen werden. Als Ergebnis eines solchen Experiments erhält man für jeden der N Werte
xi der unabhängigen Größe (in unserem Beispiel die Temperatur) einen Messwert yi (in unserem
Beispiel das Volumen). Wir suchen nun nach einer Funktion f (x), die möglichst gut beschreibt,
wie y von x abhängt (siehe Abb. 7.16).
Abbildung 7.16: Ziel der Ausgleichsrechnung ist es, eine Funktion f (x) zu bestimmen, die möglichst
gut zu den Messdaten passt.
Im Idealfall hätten wir yi = f (xi ). Sowohl xi als auch yi sind im Allgemeinen fehlerbehaftet, sodass
es zu Abweichungen von dieser funktionalen Abhängigkeit kommt. Wir können jedoch verlangen,
176
7 Fehlerrechnung
dass die Abweichung der Funktionswerte f (xi ) von den gemessenen Werten möglichst klein ist.
Demzufolge suchen wir nach einer Funktion f (x), die die Summe der Abweichungsquadrate
2
χ =
N
2
[f (xi ) − yi ]
(7.113)
i
minimiert. Die dazugehörige Kurve nennt man die Ausgleichskurve. Sie ist die Kurve, die im
Sinne der kleinsten Summe der Abweichungsquadrate am besten zu den Messwerten passt. Das
Anpassen der Ausgleichskurve an die gemessenen Daten nennt man in Anlehnung an das Englische
auch “Fitten”.
Beim praktischen Fitten wird meistens eine Funktion f (x, a1 , . . . , aL ) angenommen, deren Form
entweder von der zugrunde liegenden Physik nahe gelegt wird oder aus Gründen der Einfachheit
gewählt wird. Die Funktion hängt im Allgemeinen auch von einer Reihe von freien Parametern ai
ab, die wir nun so bestimmen, dass die Summe der Abweichungsquadrate χ2 möglichst klein wird.
Wir stellen also an die freien Parameter ai die Bedingung, dass
∂ 2
χ =0
∂ai
für
i = 1, . . . , L.
(7.114)
Das heißt, dass χ2 bezüglich der Parameter ai ein Minimum (genauer: ein Extremum) annimmt.
Durch Lösung dieses Satzes von L Gleichungen erhalten wir die Werte für die Parameter, die den
besten “Fit” der Funktion an die Messwerte ergeben.
Lineare Regression
Die einfachste und am häuﬁgsten verwendete Ausgleichsfunktion ist die Gerade
f (x) = ax + b,
(7.115)
die von den zwei freien Parametern a (Steigung) und b (Schnittpunkt mit der y-Achse) abhängt.
Man spricht in diesem Fall von linearer Regression. Die Steigung a wird auch Regressionskoeﬃzient genannt. Um die Parameter a und b zu ermitteln, setzen wir die Ableitungen von χ2
nach a und b gleich 0:
∂ 2
∂ χ =
(axi + b − yi )2 =
2(axi + b − yi )xi = 0
∂a
∂a i=1
i=1
(7.116)
∂ 2
∂ χ =
(axi + b − yi )2 =
2(axi + b − yi ) = 0.
∂b
∂b i=1
i=1
(7.117)
N
N
und
N
N
Daraus erhalten wir:
a
N
i=1
a
N
i=1
x2i + b
N
xi −
i=1
xi + N b −
N
xi yi = 0,
(7.118)
i=1
N
i=1
yi = 0.
(7.119)
7 Fehlerrechnung
177
Wir deﬁnieren nun:
Sx
=
N
xi ,
(7.120)
yi ,
(7.121)
x2i ,
(7.122)
xi yi
(7.123)
i=1
Sy
=
N
i=1
Sxx
=
N
i=1
Sxy
=
N
i=1
und schreiben die obigen Gleichungen als
aSxx + bSx − Sxy = 0,
(7.124)
aSx + N b − Sy = 0.
(7.125)
Durch Multiplikation von Gleichung (7.125) mit Sxx /Sx und Subtraktion der zweiten von der
ersten Gleichung erhalten wir
Sxx
N Sxx
= 0,
(7.126)
b Sx −
− Sxy + Sy
Sx
Sx
woraus folgt:
b=
Sy Sxx − Sx Sxy
.
N Sxx − Sx2
(7.127)
Multiplikation von Gleichung (7.125) mit Sx /N und anschließender Subtraktion von Gleichung
(7.124) hingegen ergibt:
Sx2
Sy Sx
a Sxx −
− Sxy +
=0
(7.128)
N
N
und somit:
a=
N Sxy − Sx Sy
.
N Sxx − Sx2
(7.129)
Damit haben wir die Parameter a und b der Ausgleichsgeraden bestimmt.
Wenn wir den Fehler σi in den Messwerten berücksichtigen und die Terme in der Summe der
Abweichungsquadrate damit gewichten, ergeben sich ähnliche Ausdrücke für a und b. Statt der
linearen Funktion f (x) = ax + b können wir auch andere Funktionen an die Messdaten anpassen.
Die Gleichungen, die sich dann aus ∂χ2 /∂ai ergeben, sind jedoch schwieriger zu lösen als im linearen
Fall.
178
7 Fehlerrechnung
Kapitel 8
Diﬀerentiation von Feldern: grad,
div und rot
Im Folgenden werden wir uns mit Vektoranalysis beschäftigen. Dabei geht es um die mathematische Beschreibung von Feldern im dreidimensionalen Raum. Für die Beschreibung sind die
Begriﬀe des Gradienten, der Rotation und der Divergenz von zentraler Bedeutung.
8.1
8.1.1
Felder
Skalarfelder
Betrachten wir als Beispiel die Atmosphäre über einem bestimmten Gebiet, sagen wir über Wien.
Es ist ein sonniger Tag und die Sonnenstrahlen erwärmen Straßen, Häuser, etc. Die Temperatur
der Luft über dem Boden hängt nur von der Beschaﬀenheit des Bodens ab. Während dunkler
Asphalt die Sonnenstrahlen absorbiert und dadurch die darüber liegende Luft erwärmt, bleibt die
Luft über begrünten Flächen eher kühl. Am kühlsten bleibt es in beschatteten Bereichen. Ferner
hängt die Lufttemperatur von der Höhe über dem Boden ab: je höher wir steigen, umso kühler
wird es. Durch Messung mit einem Thermometer können wir die Temperatur an jedem durch die
Koordinaten (x, y, z) beschriebenen Punkt bestimmen und erhalten
T (x, y, z).
(8.1)
Da die Temperatur auch von der Tageszeit abhängt, können wir auch die Zeit t in die Variablenliste
aufnehmen:
T (x, y, z, t).
(8.2)
Dies ist ein Beispiel für ein zeitabhängiges, skalares Feld. Das Feld T (x, y, z, t) heißt deshalb
skalar, weil die Temperatur T eine skalare Größe ist. Im Allgemeinen ordnet ein Skalarfeld jedem
Punkt (x, y, z) eines räumlichen (oder ebenen) Bereichs in eindeutiger Weise einen Skalar A zu
(siehe Abb. 8.1):
A(x, y, z) = A(r).
(8.3)
Das Feld A(x, y, z) kann man sich mit Hilfe der Flächen veranschaulichen, auf denen die skalare Größe einen konstanten Wert hat: A(x, y, z) =const. Man nennt diese Flächen Niveau- oder
Äquipotentialﬂächen. In der Ebene deﬁniert die Bedingung A(x, y) =const Niveaulinien (oder
179
180
8 Diﬀerentiation von Feldern: grad, div und rot
Abbildung 8.1: Ein Skalarfeld ordnet jedem Punkt r in der Ebene (r = (x, y), links) oder im Raum
(r = (x, y, z), rechts) eine skalare Größe A(r) zu.
Äquipotentiallinien). Solche Niveaulinien kennen wir von topographischen Karten, in denen sie
Punkte gleicher Meereshöhe verbinden, oder vom Wetterbericht, wo in der Temperaturkarte für
einen diskreten Satz von Temperaturen Punkte gleicher Temperatur durch Niveaulinien miteinander verbunden sind. Ein weiteres 2D-Beispiel ist eine metallische Platte, die an einer Ecke erhitzt
und an den gegenüberliegenden Seiten gekühlt wird (siehe Abb. 8.2).
Abbildung 8.2: Eine metallische Platte wird an der rechten hinteren Ecke erwärmt und gleichzeitig an der linken und der vorderen Kante gekühlt. Dadurch stellt sich ein Zustand ein, bei dem
die Temperatur der Platte vom Ort abhängt. Orte gleicher Temperatur sind durch so genannte
Niveaulinien miteinander verbunden.
8.1.2
Vektorfelder
In anderen Fällen ist es notwendig, an jeder Stelle x, y, z einen Vektor zu deﬁnieren. So möchte
man beispielsweise zusätzlich zur Temperatur auch die Windgeschwindigkeit v als Funktion des
Ortes angeben:
v (x, y, z).
(8.4)
Da sich Windgeschwindigkeit und Windrichtung mit der Zeit ändern, können wir auch in diesem Fall die Zeit t in die Liste der Argumente aufnehmen und erhalten damit ein zeitabhängiges
Geschwindigkeitsfeld:
v (x, y, z, t).
(8.5)
8 Diﬀerentiation von Feldern: grad, div und rot
181
Ein solches Feld nennt man ein Vektorfeld. Im Allgemeinen ordnet ein Vektorfeld jedem Ort
(x, y, z) eines Bereichs und (falls nötig) auch jedem Zeitpunkt aus einem bestimmten Intervall
einen Vektor zu:
y, z) = A(
r ).
A(x,
(8.6)
y) analog deﬁniert (siehe Abb. 8.3). Beispiele für Vektorfelder
In der Ebene ist ein Vektorfeld A(x,
sind das elektrische Feld, das magnetische Feld und das Geschwindigkeitsfeld einer strömenden
Flüssigkeit.
r ) zu.
Abbildung 8.3: Ein Vektorfeld ordnet jedem Punkt r (hier in der Ebene) einen Vektor A(
Vektorfelder kann man mit Feldlinien veranschaulichen. Das sind Linien, für die in jedem Punkt
der dortige Feldvektor tangential zur Linie ist. Feldlinien können sich nicht schneiden, da in jedem
Punkt der Feldvektor eine eindeutige Richtung hat. Würden sich Feldlinien unter einem Winkel
schneiden, gäbe es an einem Punkt zwei verschiedene Feldvektoren, was jedoch nicht zulässig ist.
Felder, die sich zeitlich nicht ändern, nennt man stationär. Die Dichte der Feldlinien ist ein Maß
für die Stärke des Vektorfeldes.
Abbildung 8.4: Ein Vektorfeld (hier das zweidimensionale Geschwindigkeitsfeld einer Strömung um
eine Scheibe) kann mit Hilfe von Feldlinien, zu denen die Feldvektoren tangential sind, dargestellt
werden.
Einige Felder von besonderer Bedeutung sind:
• Homogene Felder:
In einem homogenen Feld hat der Feldvektor überall die gleiche Richtung und den gleichen
Betrag. Ein homogenes Feld kann geschrieben werden als
y, z) = (cx , cy , cz ),
A(x,
wobei cx , cy , cz Konstanten sind.
(8.7)
182
8 Diﬀerentiation von Feldern: grad, div und rot
• Kugelsymmetrische Felder (Zentralfelder):
Abbildung 8.5: Ein kugelsymmetrisches Vektorfeld.
Der Feldvektor zeigt in jedem Punkt radial nach außen oder innen, also vom Ursprung weg
oder zum Ursprung hin. Der Betrag hängt nur vom Abstand r vom Zentrum ab. Ein kugelsymmetrisches Feld lässt sich ausdrücken als:
r ) = A(r) r ,
A(
r
(8.8)
wobei r = |r| der Abstand des Punktes vom Ursprung ist. Beispiele für ein kugelsymmetrisches Feld sind das Gravitationsfeld der Erde und das elektrische Feld einer Punktladung.
• Zylinder- oder axialsymmetrische Felder:
Abbildung 8.6: Ein zylindersymmetrisches Vektorfeld.
Der Feldvektor zeigt radial von einer Achse weg und hat keine Komponente in Achsenrichtung. Der Betrag hängt nur vom Abstand des Punktes zur Achse ab. Ein zylindersymmetrisches Feld lässt sich schreiben als:
r ) = A(ρ)eρ .
A(
(8.9)
Hier ist ρ der Normalabstand zur z-Achse und eρ der Einheitsvektor normal zur z-Achse in
Richtung zum Punkt r.
8 Diﬀerentiation von Feldern: grad, div und rot
8.2
Gradient
8.2.1
Deﬁnition
183
Betrachten wir ein Skalarfeld A(x, y, z) im dreidimensionalen Raum (zum Beispiel die Temperatur
T (x, y, z) eines ungleichmäßig erwärmten Körpers). Wir fragen uns nun, wie sich die skalare Größe
A ändert, wenn wir uns vom Punkt r = (x, y, z) leicht wegbewegen, wenn wir also von r = (x, y, z)
auf r + dr = (x + dx, y + dy, z + dz) übergehen. In linearer Näherung (für sehr kleine dx, dy und
dz) ist die Änderung dA in der Größe A gegeben durch
dA =
∂A
∂A
∂A
dx +
dy +
dz.
∂x
∂y
∂z
(8.10)
(Dies ist einfach das bereits bekannte totale Diﬀerential der Funktion A(x, y, z).) Wir können
die rechte Seite der obigen Gleichung als das Skalarprodukt des Vektors dr = (dx, dy, dz) mit dem
Vektor (∂A/∂x, ∂A/∂y, ∂A/∂z) betrachten. Dieser im Allgemeinen ortsabhängige Vektor ist der
Gradient des Skalarfeldes A(x, y, z). Wir schreiben dafür


grad A = 
∂A
∂x
∂A
∂y
∂A
∂z


 = ∇A(x, y, z).
(8.11)
∇A(x, y, z) nennt man auch das Gradientenfeld von A(x, y, z).
Das Symbol ∇ ist der Nabla-Operator, der in der Vektoranalysis eine zentrale Rolle einnimmt
und formal als Vektor geschrieben werden kann:


∇=
∂
∂x
∂
∂y
∂
∂z


.
(8.12)
Der Nabla-Operator ∇ (auf Englisch auch “del” genannt) wurde zum ersten Mal vom irischen Physiker William Rowan Hamilton (1805-1865) verwendet. Das Wort “Nabla” bezeichnet eine antike
Harfe und wurde vermutlich wegen der Ähnlichkeit des Symbols ∇ mit einer Harfe eingeführt.
Der Gradient des Skalarfeldes A(x, y, z) ist also ein Vektorfeld, dessen Komponenten die partiellen
Ableitungen von A(x, y, z) nach den Raumkoordinaten sind. Der Gradient von A entsteht durch
Anwendung des Nabla-Operators auf A. Man kann den Gradienten auch mit Hilfe der Basisvektoren
ex , ey , ez ausdrücken:
grad A = ∇A =
∂A
∂A
∂A
ex +
ey +
ez .
∂x
∂y
∂z
Auch die Schreibweise
∇A =
∂A
∂r
(8.13)
(8.14)
wird oft verwendet.
8.2.2
Eigenschaften
Der Gradient steht senkrecht auf die Äquipotentialﬂächen (Niveauﬂächen), auf denen A = const.
Um das einzusehen, betrachten wir die Änderung dA, die durch Verschiebung des Ortsvektors
r(x, y, z) um dr = (dx, dy, dz) entsteht:
dA = ∇A · dr.
(8.15)
184
8 Diﬀerentiation von Feldern: grad, div und rot
Ist dr tangential zur Niveauﬂäche, bleibt A konstant und wir haben:
dA = ∇A · dr = 0.
(8.16)
Das bedeutet, dass ∇A senkrecht auf die Flächen mit A = const steht. In der Ebene können wir
uns das für das Temperaturfeld T (x, y) leicht veranschaulichen: Auf diesen Linien ist T konstant.
Das heißt, wenn wir auf ihnen entlangfahren, ändert sich die Temperatur nicht. Wenn wir dr in
Richtung einer solchen Linie wählen, muss daher für kleine dr gelten: dA = 0. Das Diﬀerential dA
ist aber das Skalarprodukt von dr und ∇A: dA = ∇A · dr. Daher haben wir ∇A · dr = 0. Somit ist
∇A orthogonal zu dr und, da dr tangential an die Niveaulinie ist, auch orthogonal zur Niveaulinie
selbst. Analog gilt das auch in höheren Dimensionen.
Abbildung 8.7: Der Gradient ∇A eines skalaren Feldes A(r) (hier das Temperaturfeld von Abb.
8.2) steht normal zu den Niveaulinien des Feldes.
Der Gradient ∇A zeigt in die Richtung, in der die Funktion A(x, y, z) am schnellsten anwächst.
Man kann dies zum Beispiel mit Hilfe der Lagrangeschen Multiplikatoren beweisen, worauf
wir aber hier nicht eingehen können. Anschaulich ist dies plausibel, da wir natürlich am schnellsten
von einer Niveaulinie (oder Niveauﬂäche) zur nächsten kommen, wenn wir uns senkrecht dazu, also
in Richtung des Gradienten, bewegen. (Denken Sie zum Beispiel an die Höhenschichtenlinien auf
einer Wanderkarte.) Der negative Gradient zeigt in die Richtung der schnellsten Abnahme der
Funktion A(x, y, z). Der Betrag des Gradienten ist die Steigung (oder Ableitung) der Funktion
in der Richtung ihres stärksten Zuwachses.
Beispiel:
Betrachten wir das Gravitationspotential, das von einer Masse M im Ursprung erzeugt wird:
GM
GM
.
=−
u(x, y, z) = − 2
2
2
r
x +y +z
(8.17)
Hier ist r der Abstand einer Probemasse m vom Ursprung und mu(x, y, z) ist die potentielle Energie dieser Probemasse. G ist die Gravitationskonstante. Der Gradient des Gravitationspotentials
lautet:


1
GM


−
·
2x
3
∂u
 2 (x2 +y2 +z2 ) 2

∂x
 1

 ∂u 
GM

∇u =  ∂y  = −  − 2 2 2 2 32 · 2y 

(x +y +z )
 1

∂u
GM
− 2 2 2 2 3 · 2z
∂z
(x +y +z ) 2



x
x
GM
 GM

 GM 
 y  = 2 er .
3 ·  y  =
r3
r
(x2 + y 2 + z 2 ) 2
z
z

=
(8.18)
Die Äquipotentialﬂächen dieses Feldes sind konzentrische Kugeln und ∇u ist orthogonal zur entsprechenden Kugeloberﬂäche. Die Kraft auf die Probemasse m
GM m
F (r) = −m∇u = − 2 er
r
(8.19)
8 Diﬀerentiation von Feldern: grad, div und rot
185
zeigt zum Ursprung und ist somit attraktiv.
Beispiel:
Das Feld
u(x, y) = x2 + y 2
(8.20)
hat den Gradienten
∇u
8.2.3
=
∂u
∂x
∂u
∂y
=
2x
2y
.
(8.21)
Richtungsableitung
Die Ableitung der Funktion A(x, y, z) in Richtung eines beliebigen Vektors a lässt sich ebenfalls
mit Hilfe des Gradienten ausdrücken:
∇A(x, y, z) ·
a
= ∇A · ea .
|a|
(8.22)
Die Größe nennt man die Richtungsableitung in Richtung des Vektors a. Man erhält sie durch
Projektion des Gradienten ∇A auf den normierten Richtungsvektor ea = |aa| . Die Richtungsableitung ist in Richtung des Gradienten am größten.
8.2.4
Rechenregeln
Für den Gradienten gelten folgende Rechenregeln:
•
•
•
•
Für ein konstantes Feld A(r) = c folgt:
Summenregel:
Faktorregel:
Produktregel:
∇A = 0,
∇(A + B) = ∇A + ∇B,
∇(αA) = α∇A,
∇(AB) = A∇B + B∇A.
Diese Regeln folgen aus den Regeln für die partielle Diﬀerentiation.
Zusammenfassend halten wir fest:
• Der Gradient von A(r ) ist ein Vektor (eigentlich ein Vektorfeld), dessen Komponenten die partiellen Ableitungen nach den Koordinaten sind.
• Der Gradient entsteht durch Anwendung des Nabla-Operators auf A(r).
• ∇A steht orthogonal zu den Niveauﬂächen.
• ∇A zeigt in Richtung des stärksten Zuwachses von A(r).
• ∇A · ea = ∇A · (a/|a|) ist die Richtungsableitung von A in Richtung von a.
186
8 Diﬀerentiation von Feldern: grad, div und rot
8.3
Divergenz
8.3.1
Deﬁnition
Die Divergenz eines Vektorfeldes beschreibt die Quellstärke eines Feldes. Im Falle des elektrischen
Feldes zum Beispiel verknüpft die Divergenz das elektrische Feld mit dessen Quellen, also mit den
eines Vektorfeldes A(
r ) als das Skalarprodukt
Ladungen. Formal deﬁniert man die Divergenz divA
des Nabla-Operators mit dem Feld:
= ∇·A
= ∂Ax + ∂Ay + ∂Az .
divA
∂x
∂y
∂z
(8.23)
Die Divergenz eines Vektorfeldes ist ein skalares Feld. (Ganz im Gegensatz zum Gradienten, der
aus einem Skalarfeld ein Vektorfeld macht.)
Beispiel:
Die Divergenz des Vektorfeldes


x2 y

r) = 
A(
 zxy 
x2 + y 2
(8.24)
ist
2
2
2
= ∇·A
= ∂(x y) + ∂(zyx) + ∂(x + y ) = 2xy + zx = x(2y + z).
divA
∂x
∂y
∂z
8.3.2
(8.25)
Anschauliche Interpretation als lokale Quellstärke
Ein anschauliches Verständnis der Divergenz können wir durch folgende Überlegung erreichen. Betrachten wir eine strömende Flüssigkeit, deren räumliche Strömung durch das Geschwindigkeitsfeld

vx (x, y, z)


v (x, y, z) =  vy (x, y, z) 
vz (x, y, z)

(8.26)
beschrieben wird. Wir wollen nun die Flüssigkeitsmenge berechnen, welche pro Zeiteinheit in ein
kleines Volumen um den willkürlich gewählten Punkt P (x, y, z) eintritt, beziehungsweise aus diesem
Volumen austritt (siehe Abb. 8.8).
Dieses inﬁnitesimale Volumen wird durch ebene Seitenﬂächen begrenzt, die parallel zu den Koordinatenebenen liegen. Die Seitenlängen des dadurch entstehenden Quaders sind in x-, y- und
z-Richtung jeweils dx, dy und dz. Der Punkt P (x, y, z) liegt im Mittelpunkt des Quaders, das heißt
die Seitenﬂächen haben einen Abstand von dx/2 beziehungsweise dy/2 und dz/2 vom Punkt P . Zu
jeder Seitenﬂäche deﬁnieren wir einen Flächenvektor, dessen Betrag gleich dem Flächeninhalt der
jeweiligen Seitenﬂäche ist. Die Flächenvektoren stehen senkrecht auf die jeweiligen Seitenﬂächen
8 Diﬀerentiation von Feldern: grad, div und rot
187
Abbildung 8.8: Ein kleines quaderförmiges Volumen um Punkt P mit Flächenvektoren f1 , f2 , f3 ,
f4 , f5 und f6 . Am Punkt P = (x, y, z) herrscht die Geschwindigkeit v(x, y, z) vor.
und zeigen nach außen. Diese in Abb. 8.8 eingezeichneten Flächenvektoren sind:


dydz


f1 =  0  = −f2 ,
0


0


f3 =  dzdx  = −f4 ,
(8.27)
(8.28)
0


0


f5 =  0  = −f6 .
dxdy
(8.29)
Wir bestimmen nun die Flüssigkeitsmenge, die pro Zeiteinheit durch die Seitenwände des Quaders
strömt (also den Fluss). Wie wir früher bereits gesehen haben, ist der Fluss durch eine Fläche
gleich dem Skalarprodukt des Geschwindigkeitsvektors mit dem Flächenvektor. Wenn wir für jede
Fläche den Geschwindigkeitsvektor in der Mitte der Fläche nehmen, ergibt sich zum Beispiel für
die Seitenﬂäche mit dem Flächenvektor f1 der Fluss:
dx
, y, z).
f1 · v (x +
2
(8.30)
Dabei ist v (x+ dx
2 , y, z) der Geschwindigkeitsvektor in der Mitte der Fläche mit dem Flächenvektor
f1 . Durch Verwendung der Komponentendarstellung des Vektors f1 ergibt sich für den Fluss
vx (x +
dx
, y, z)dydz.
2
(8.31)
Auf ähnliche Weise erhalten wir für die gegenüberliegende Seitenﬂäche mit dem Vektor f2 einen
Fluss von
− vx (x −
dx
, y, z)dydz.
2
(8.32)
188
8 Diﬀerentiation von Feldern: grad, div und rot
Für die Flüsse durch die anderen Flächen erhalten wir jeweils:
f3 :
f4 :
f5 :
f6 :
dy
, z)dxdz,
2
dy
, z)dxdz,
−vy (x, y −
2
dz
vz (x, y, z + )dxdy,
2
dz
−vz (x, y, z − )dxdy.
2
vy (x, y +
(8.33)
(8.34)
(8.35)
(8.36)
Die Änderung der Flüssigkeitsmenge in unserem kleinen Quader ergibt sich aus den Flüssigkeitsmengen, die in den Quader hinein oder aus dem Quader heraus ﬂießen. Durch Addition der Flüssigkeitsmengen, die durch die einzelnen Flächen ﬂießen, erhalten wir den Verlust oder den Überschuss
an Flüssigkeit, der pro Zeiteinheit für unser kleines Volumen zu verzeichnen ist:
$
#
dx
dx
, y, z) − vx (x −
, y, z) dydz
vx (x +
2
2
$
#
dy
dy
, z) − vy (x, y −
, z) dxdz
+
vy (x, y +
2
2
#
$
dz
dz
+
vz (x, y, z + ) − vz (x, y, z − ) dxdy.
(8.37)
2
2
Wir multiplizieren und dividieren nun den ersten dieser drei Terme mit dx, den zweiten mit dy
und den dritten mit dz:
vx (x +
+
+
dx
2 , y, z) −
vx (x −
dx
2 , y, z)
dxdydz
dx
dy
vy (x, y + dy
2 , z) − vy (x, y − 2 , z)
dxdydz
dy
dz
vz (x, y, z + dz
2 ) − vz (x, y, z − 2 )
dxdydz.
dz
(8.38)
Für kleine Kantenlängen werden aus den drei Quotienten im obigen Ausdruck partielle Ableitungen
und wir erhalten:
∂vx
∂vy
∂vz
∂vy
∂vz
∂vx
dV +
dV +
dV =
+
+
dV.
(8.39)
∂x
∂y
∂z
∂x
∂y
∂z
Mit Hilfe der Divergenz können wir diesen Ausdruck schreiben als:
div v dV = (∇ · v )dV.
(8.40)
Die zeitliche Änderung der Flüssigkeitsmenge in unserem Quader ist also durch das Produkt
der Divergenz des Strömungsfeldes mit dem inﬁnitesimalen Volumen dV gegeben. Die Divergenz
beschreibt also den Gewinn oder Verlust an Flüssigkeit pro Zeiteinheit in einem kleinen Volumselement dV um (x, y, z). Für eine inkompressible Flüssigkeit ist die Flüssigkeitsmenge im Volumen
natürlich konstant. Für eine kompressible Flüssigkeit hingegen kann diese Menge ﬂuktuieren und
∇ · v kann verschieden von 0 sein. (Genau genommen müssen wir hier ∇(ρv ) statt ∇v betrachten.)
Falls div v > 0, überwiegt der Abﬂuss. Das heißt, es ﬂießt mehr Flüssigkeit aus dem Volumen
heraus als in das Volumen hinein. Man sagt in diesem Fall, dass sich im Volumen dV eine Quelle
beﬁndet. Falls hingegen div v < 0, überwiegt der Zuﬂuss und es ﬂießt eine größere Flüssigkeitsmenge in das Volumen dV hinein als aus dem Volumen dV heraus. Im Volumen dV beﬁndet sich
dann eine Senke. Für div v = 0 halten sich Zuﬂuss und Abﬂuss genau die Waage und man sagt,
das Feld ist in diesem Punkt quellenfrei.
8 Diﬀerentiation von Feldern: grad, div und rot
189
eines Feldes A
wird auch als dessen lokale Quellstärke bezeichnet. Die
Die Divergenz divA
Divergenz ist eine lokale Größe, die sich von einem Punkt zum anderen verändern kann. Die
des Vektorfeldes A
ist selbst ein Skalarfeld.
Divergenz div A
Beispiel:
Betrachten wir die Kraft F auf eine Masse m im Gravitationsfeld, das durch die Masse M im
Ursprung erzeugt wird (siehe Abb. 8.9):


x
GM m 

(8.41)
F = − 3  y  .
r
z
Die Divergenz des Gravitationsfeldes ist
∂Fx
∂Fy
∂Fz
divF = ∇ · F =
+
+
.
∂x
∂y
∂z
(8.42)
Die partielle Ableitung der x-Komponente der Kraft nach der Koordinate x ist
∂Fx
∂x
= −GM m
∂
x
∂x (x2 + y 2 + z 2 ) 32
= −GM m
(x2 + y 2 + z 2 ) 2 − x 32 (x2 + y 2 + z 2 ) 2 · 2x
(x2 + y 2 + z 2 )3
3
3
1
1
(x2 + y 2 + z 2 ) 2 − 3x2 (x2 + y 2 + z 2 ) 2
(x2 + y 2 + z 2 )3
r3 − 3x2 r
= −GM m
.
r6
= −GM m
(8.43)
Auf ähnliche Weise erhalten wir:
r3 − 3y 2 r
∂Fy
= −GM m
∂y
r6
und
r3 − 3z 2 r
∂Fz
= −GM m
.
∂z
r6
(8.44)
Durch Addieren dieser drei partiellen Ableitungen ergibt sich
div F = −GM m
3r3 − 3(x2 + y 2 + z 2 )r
3r3 − 3r3
= −GM m
= 0.
6
r
r6
(8.45)
Das Gravitationsfeld ist also überall, wo es deﬁniert ist (für r = 0), quellenfrei. Über den Ursprung, also den Punkt (0,0,0), können wir hier keine Aussage machen, da in diesem Punkt das
Feld F divergiert. Eine mathematisch weiterführende Betrachtung zeigt jedoch, dass das Gravitationsfeld genau im Ursprung eine punktförmige Quelle besitzt, die durch eine δ-Funktion dargestellt
werden kann. Überall sonst ist das Gravitationsfeld quellenfrei, da wir ja keine zusätzliche Masse
betrachtet haben.
Beispiel:
y, z) = (xy 2 , z 2 + y 2 , 12xyz 3 ). Die Divergenz dieses Feldes ist:
Gegeben sei das Feld A(x,
= ∂Ax + ∂Ay + ∂Az = y 2 + 2y + 36xyz 2.
div A
∂x
∂y
∂z
8.3.3
Rechenregeln
Für die Divergenz gelten folgende Rechenregeln:
(8.46)
190
8 Diﬀerentiation von Feldern: grad, div und rot
Abbildung 8.9: Die Kraft F auf eine Masse m im Gravitationsfeld der Masse M im Ursprung.
y, z) = c gilt:
• Für ein konstantes Feld A(x,
= 0.
div A
(8.47)
• Summenregel:
+ B)
div (A
+ B)
= ∇·A
+∇·B
= ∇ · (A
+ div B.
= div A
(8.48)
• Faktorregel:
= αdiv A.
div (αA)
(8.49)
• Produktregel für das Produkt eines Skalarfeldes A mit einem Vektorfeld B:
div (AB)
= A(∇ · B)
+B
· ∇A
= ∇ · (AB)
+B
· grad A.
= A div B
(8.50)
Diese Beziehung lässt sich leicht durch explizites Ausführen der partiellen Diﬀerentiation verstehen:
∇ · (AB)
=
=
=
∂ABx
∂ABy
∂ABz
+
+
∂x
∂y
∂z
∂Bx
∂By
∂Bz
∂A
∂A
∂A
Bx
+A
+ By
+A
+ Bz
+A
∂x
∂x
∂y
∂y
∂z
∂z
∂Bx
∂By
∂Bz
∂A
∂A
∂A
+ By
+ Bz
+
+
+A
Bx
∂x
∂y
∂z
∂x
∂y
∂z
B·∇A
=
8.4
A∇·B
· ∇A + A∇ · B
=B
· grad A + A div B.
B
(8.51)
Laplace-Operator
Wenn wir den Gradienten eines Skalarfeldes A bilden, erhalten wir das Vektorfeld
∂A ∂A ∂A
grad A = ∇A =
,
,
.
∂x ∂y ∂z
(8.52)
8 Diﬀerentiation von Feldern: grad, div und rot
191
Wenden wir nun den Nabla-Operator auf dieses Vektorfeld an (wir bilden also dessen Divergenz),
erhalten wir


∂A
∂x
∂A
∂y
∂A
∂z

div grad A = ∇ · (∇A) = ∇ · 
 ∂2A ∂2A ∂2A
+
+
.
=
∂x2
∂y 2
∂z 2
(8.53)
Wir schreiben dafür auch
div grad A = ∇2 A = ∆A
2
2
(8.54)
2
∂
∂
∂
und nennen den Operator ∆ = ∂x
2 + ∂y 2 + ∂z 2 den Laplace-Operator. Der Laplace-Operator
ist ein Diﬀerentialoperator, der zum Beispiel in der Poissongleichung vorkommt, welche das von
einer Ladungsverteilung erzeugte elektrische Potential beschreibt.
8.5
Rotation
8.5.1
Deﬁnition
r ) können wir auch das
Neben dem Skalarprodukt des Nabla-Operators mit dem Vektorfeld A(
Vektorprodukt von ∇ und A bilden und erhalten dadurch die Rotation (Englisch: curl ) von A:

r) = ∇ × A
=
rot A(

∂
∂x
∂
∂y
∂
∂z
 
Ax
 
 
 ×  Ay  = 

Az


∂Az
∂y
∂Ax
∂z
∂Ay
∂x
−
−
−
∂Ay
∂z
∂Az
∂x
∂Ax
∂y


.

(8.55)
des Vektorfeldes A
ist selbst ein Vektorfeld. Man nennt dieses Feld auch WirDie Rotation rot A
belfeld.
8.5.2
Anschauliche Interpretation als lokale Wirbelstärke
Zur anschaulichen Interpretation der Rotation (als lokale Wirbelstärke) betrachten wir ein konkretes Beispiel. Wir stellen uns eine Flüssigkeit vor, in der ein Wirbel vorhanden ist. Von oben
betrachtet sind die Feldlinien des zugehörigen Geschwindigkeitsfeldes konzentrische Kreise um den
Ursprung (siehe Abb. 8.10).
Die Geschwindigkeit v der Flüssigkeit am Ort r sei gegeben durch (siehe Abschnitt 2.8.2)
v (r) = ω × r.
(8.56)
wobei ω ein Winkelgeschwindigkeitsvektor mit Betrag |ω | = ω ist und normal zur Zeichenebene
steht sowie zum Betrachter hin zeigt. Gemäß Gleichung (8.56) ist die Geschwindigkeit v (r) senkrecht auf r und ω und liegt deshalb in der Zeichenebene. Für alle Entfernungen vom Mittelpunkt
bewegt sich die Flüssigkeit mit derselben Winkelgeschwindigkeit ω um den Ursprung. Man nennt
so einen Wirbel einen homogenen Wirbel mit der Drehachse durch den Ursprung. Je großer ω
ist, umso schneller dreht sich der Wirbel (umso stärker ist er also).
Die Rotation dieses Strömungsfeldes ist gemäß der Deﬁnition in Gleichung (8.55) gegeben durch:
rot v (r) = ∇ × v (r) = ∇ × (ω × r).
(8.57)
192
8 Diﬀerentiation von Feldern: grad, div und rot
Abbildung 8.10: Geschwindigkeitsfeld v = ω × r einer rotierenden Flüssigkeit.
Falls wir die z-Achse in Richtung ω
legen, haben wir

 
 

0
x
−ωy

 
 

× r =  0  ×  y  =  ωx 
ω
ω
z
0
(8.58)
und deshalb
 
 

∂
−ωy
−ωy
∂x
  ∂  


= ∇ ×  ωx  =  ∂y
 ×  ωx 
∂
0
0
∂z
 


∂
(ωx)
− ∂z
0
 


∂
= 
=
− ∂z
(ωy)
  0 ,
∂
∂
2ω
∂x ωx + ∂y ωy

rot v (r)
(8.59)
das heißt, die Rotation von diesem speziellen Strömungsfeld ist gleich dem doppelten Winkelgeschwindigkeitsvektor ω
:
rot v = 2ω.
(8.60)
Wir können die Rotation von v also sowohl nach Richtung als auch nach Größe als eine lokale
r ) auch das Wirbelfeld von A(
r ). In unserem
Wirbelstärke auﬀassen. Man nennt daher rot A(
Beispiel ist rot v konstant, im Allgemeinen ändert sich aber die Rotation rot v von Ort zu Ort.
Zur weiteren Veranschaulichung der Rotation betrachten wir eine inhomogene Strömung, in der
die Strömungsgeschwindigkeit v (r) vom Ort abhängt. Die in Abb. 8.11 dargestellte Strömung
beispielsweise hat ein Geschwindigkeitsproﬁl, bei dem die Geschwindigkeit in x-Richtung linear
mit der y-Koordinate zunimmt, das heißt, die Strömungsgeschwindigkeit ist oben höher als unten.
Wir stellen uns nun einen kleinen Quader vor, der mit der Strömung mitschwimmt (etwa einen
kleinen Holzblock, der in einem Bach mit der Strömung mittreibt) (siehe Abb. 8.12).
Aus der Perspektive des Quaders, also in einem mitbewegten Bezugssystem, bewegt sich die Flüssigkeit oberhalb und unterhalb des Quaders in entgegengesetzte Richtung und verursacht dadurch eine
Drehung des Quaders (siehe Abb. 8.13).
8 Diﬀerentiation von Feldern: grad, div und rot
193
Abbildung 8.11: Geschwindigkeitsfeld einer Strömung mit linearem Geschwindigkeitsproﬁl.
Abbildung 8.12: Mitschwimmendes Objekt in der Strömung von Abb. 8.11.
Wie schnell rotiert nun dieser Quader? Unter der Annahme, dass die Translation des Quaders
mit der an seinem Mittelpunkt vorherrschenden Geschwindigkeit v (x, y) erfolgt und die oberen
und unteren Seitenﬂächen sich mit der Strömung mitbewegen, ist die Winkelgeschwindigkeit des
Quaders gegeben durch
(
' dy
−
v
x,
y
−
vx x, y + dy
x
2
2
,
(8.61)
ω=
dy
wobei dy die Kantenlänge des Quaders in y-Richtung ist. Für kleine Quader gilt also
ω=
∂vx
.
∂y
(8.62)
Für eine solche Strömung, in der die x-Komponente der Geschwindigkeit linear von der y-Komponente
abhängt (man nennt eine solche Strömung eine Scherströmung mit linearem Geschwindigkeitsproﬁl),
vx
=
γy,
(8.63)
vy
vz
=
=
0,
0,
(8.64)
(8.65)
x
erhalten wir für die Winkelgeschwindigkeit des Quaders ω = ∂v
∂y = γ. Die Konstante γ beschreibt
dabei den Anstieg des Geschwindigkeitsproﬁls. Die Rotation dieses Geschwindigkeitsfeldes ist folglich:
 ∂  
 
 

γy
0
0
∂x
 ∂  
 
 

rot v = ∇ × v =  ∂y
(8.66)
 ×  0  =  0  =  0  = −ω.
∂
∂z
0
−γ
−ω
Auch hier ist also die Rotation ein Maß für die lokale Wirbelstärke. (Das Minuszeichen haben wir
hier, weil die Rotation in der xy-Ebene in mathematisch negativer Richtung erfolgt.) Die Rotation
beschreibt also, wie ein kleines Teilchen rotiert, das mit der Strömung mittreibt.
r ) nennt man an der Stelle r wirbelfrei, wenn rot A
an der Stelle r verschwindet.
Ein Feld A(
Beispiel:
Wir betrachten wieder das Schwerefeld


x
GM m


F = −
3 ·  y .
(x2 + y 2 + z 2 ) 2
z
(8.67)
194
8 Diﬀerentiation von Feldern: grad, div und rot
Abbildung 8.13: Geschwindigkeitsfeld der Strömung von Abb. 8.11 aus der Perspektive des mitschwimmenden Objekt.
Die Rotation dieses Feldes ist


rot F = ∇ × F = 

∂Fz
∂y
∂Fx
∂z
∂Fy
∂x
−
−
−
∂Fy
∂z
∂Fz
∂x
∂Fx
∂y


.

(8.68)
Die partielle Ableitung ∂Fz /∂y ist gegeben durch:
∂Fz
∂y
∂
z
2y
−GM m
= −GM mz
5
2
∂y (x2 + y 2 + z 2 ) 32
(x + y 2 + z 2 ) 2
3GM mzy
3GM mzy
.
5 =
2
2
2
r5
2
(x + y + z )
=
=
3
−
2
(8.69)
Allgemein gilt
3GM mαβ
∂Fα
=
∂β
r5
für α, β = x, y, z und α = β.
(8.70)
Das heißt aber, dass
∂Fα
∂Fβ
=
.
∂β
∂α
Infolgedessen verschwinden alle Komponenten der Rotation in Gleichung (8.68):
 
0
 
rot F =  0  = 0.
(8.71)
(8.72)
0
Das Gravitationsfeld ist also wirbelfrei (so wie alle radialen (kugelsymmetrischen) Vektorfelder).
8.5.3
Rechenregeln
Für die Rotation gelten folgende Rechenregeln:
r ) = c gilt:
• Für ein konstantes Feld A(
= 0.
rot A
(8.73)
• Summenregel:
+ B)
rot (A
+ rot B.
= rot A
(8.74)
• Faktorregel:
= α(∇ × A)
∇ × (αA)
= αrot A).
(rot αA
(8.75)
8 Diﬀerentiation von Feldern: grad, div und rot
195
• Produktregel für Produkt aus Skalar- und Vektorfeld:
rot (AB)
=
+ grad A × B.
A rot B
Diese Regeln ergeben sich einfach durch Anwendung der Regeln
Insbesondere haben wir für die letzte Regel:
 

∂
ABx
∂x
 ∂  
rot (AB) = ∇ × (AB) =  ∂y  ×  ABy
∂
ABz
∂z


∂
∂
(ABz ) − ∂z
(ABy )
 ∂y

∂
∂

=  ∂z (ABx ) − ∂x (ABz ) 





=

∂
∂x (ABy )
∂A
∂y
∂A
∂z
∂A
∂x
∂A
∂y
∂A
∂z
∂A
∂x
−
x
· Bx + A ∂B
∂z −
∂By
· By + A ∂x −
· Bz −
für die partielle Diﬀerentiation.



∂
∂y (ABx )
z
· Bz + A ∂B
∂y −
∂A
∂z
∂A
∂x
∂A
∂y
· By
∂A
∂z
∂A
∂x
∂A
∂y

∂By
∂z
z
· Bz − A ∂B
∂x
∂Bx
· Bx − A ∂y
· By − A

 

· Bz 
+
· Bx
(8.76)




∂By
∂z
∂Bz
x
A ∂B
−
A
∂z
∂x
∂B
x
A ∂xy − A ∂B
∂y
z
A ∂B
∂y − A




=



=
+ A(∇ × B)
= grad A × B
+ A rot B.
∇A × B
· Bx −
· By −
(8.77)
Da die Rotation eines Vektorfeldes wieder ein Vektorfeld ist, können wir auch die Rotation eines
Wirbelfeldes bilden:
= ∇ × (∇ × A).
rot (rot A)
(8.78)
Nach einigen algebraischen Umformungen ﬁndet man
= ∇(∇ · A)
− ∆A
∇ × (∇ × A)
(8.79)
= grad (divA)
− div grad A,
rot (rot A)
(8.80)
oder, anders ausgedrückt,
wobei die Anwendung des Laplace-Operators auf ein Vektorfeld komponentenweise deﬁniert ist.
8.5.4
Wirbelfreie und quellenfreie Felder
• Ein Gradientenfeld
∇A =
∂A ∂A ∂A
,
,
∂x ∂y ∂z
ist nach dem Satz von Schwarz wirbelfrei:
 ∂   ∂A 

∇ × ∇A = 
∂x
∂
∂y
∂
∂z
 
×
∂x
∂A
∂y
∂A
∂z

 
=

∂2A
∂y∂z
∂2A
∂z∂x
∂2A
∂x∂y
(8.81)
−
−
−
∂2 A
∂z∂y
∂2 A
∂x∂z
∂2A
∂y∂x


 = 0.

(8.82)
Umgekehrt gilt auch, dass man in einem einfach zusammenhängenden Gebiet (das ist ein Ge als Gradienten eines Skalarfeldes ϕ darstellen
biet ohne “Löcher”) jedes wirbelfreie Feld B
kann:
=0
∇×B
⇒
es existiert ein Skalarfeld ϕ sodass :
= ∇ϕ.
B
(8.83)
196
8 Diﬀerentiation von Feldern: grad, div und rot
Das Skalarfeld ϕ ist nur bis auf eine Konstante bestimmt, da
∇(ϕ + C) = ∇ϕ.
(8.84)
Dieser Zusammenhang wird in Abschnitt 9.4.3 ausführlich diskutiert.
• Ein Wirbelfeld

=
∇×A

∂
∂x
∂
∂y
∂
∂z




Ax
 
 
 ×  Ay  = 

Az
∂Az
∂y
∂Ax
∂z
∂Ay
∂x
−
−
−
∂Ay
∂z
∂Az
∂x
∂Ax
∂y




(8.85)
ist quellenfrei:
=
∇ · (∇ × A)
∂ 2 Az
∂ 2 Ay
∂ 2 Ax
∂ 2 Az
∂ 2 Ay
∂ 2 Ax
−
+
−
+
−
= 0.
∂x∂y
∂x∂z
∂y∂z
∂y∂x ∂z∂x ∂z∂y
(8.86)
als die Rotation eines anderen
Es kann gezeigt werden, dass das quellenfreie Feld B
dargestellt werden kann:
Vekorfeldes A
=0
divB
⇒
sodass B
= ∇ × A.
es existiert ein Vektorfeld A
(8.87)
wird das Vektorpotential genannt. Es ist nur bis auf den Gradienten eines Skalarfeldes
A
bestimmt:
= ∇ × (A
+ grad χ).
∇×A
(8.88)
Die Eichung trägt nicht zum
Der Gradient grad χ ist die so genannte Eichung von A.
Wirbelfeld bei und kann deshalb benutzt werden, um Nebenbedingungen zu erfüllen. In
Abschnitt 9.4.4 werden wir uns näher mit dem Vektorpotential beschäftigen.
8.6
Zusammenfassung Nabla-Operator ∇
Der Nabla-Operator ist ein Diﬀerentialoperator, der auf Felder angewandt wird. Je nach Feldart
entstehen durch unterschiedliche Anwendung des Nabla-Operators verschiedene Felder:
Gradient:
Divergenz:
Rotation:
∇A(r)
r)
∇ · A(
r)
∇ × A(
(Richtung und Betrag des stärksten Anstiegs),
(Quellstärke),
(Wirbelstärke).
Durch Anwendung der Rechenregeln kann man zeigen:
• Gradientenfelder sind wirbelfrei: ∇ × (∇A) = 0.
= 0.
• Wirbelfelder sind quellenfrei: ∇ · (∇ × A)
können als Gradient eines Skalarfeldes ϕ dargestellt werden:
• Wirbelfreie Felder A
= ∇ϕ falls
A
= 0.
∇×A
(8.89)
können als Rotation eines anderen Vektorfeldes B
dargestellt werden:
• Quellenfreie Felder A
=∇×B
A
falls
= 0.
∇·A
(8.90)
8 Diﬀerentiation von Feldern: grad, div und rot
197
Die zweifache Anwendung des Nabla-Operators ergibt den Laplace-Operator
∇ · (∇A) =
∂2A ∂2A ∂2A
+
+
.
∂x2
∂y 2
∂z 2
(8.91)
Weiters gelten die folgenden Rechenregeln:
× B)
∇(A
=
× B)
∇ × (A
=
∇ × (∇ × A) =
·∇×A
−A
· ∇ × B,
B
· ∇)A
− B(∇
− (A
· ∇)B
+ A(∇
(B
· A)
· B),
(8.93)
− ∆A.
∇(∇A)
(8.94)
(8.92)
198
8 Diﬀerentiation von Feldern: grad, div und rot
Kapitel 9
Integration von Feldern: Kurvenund Flächenintegrale
Im Kapitel 2 haben wir gesehen, dass wir die bei der Verschiebung eines Körpers verrichtete
Arbeit mit Hilfe des Skalarproduktes der angewendeten Kraft F und der vektoriellen Verschiebung
r ausdrücken können:
W = F · r.
(9.1)
Wenn wir jedoch den Körper nicht auf einer geraden Linie bewegen beziehungsweise die Kraft
entlang des Weges nicht konstant ist, können wir diesen einfachen Ausdruck nicht mehr verwenden
(siehe Abb. 9.1). Das wäre etwa bei einem auf einem kurvigen Gleis gezogenen Fahrzeug oder
einer Seilbahn der Fall. Wenn wir die gesamte Strecke jedoch in kleine, annähernd gerade Stücke
zerlegen, können wir die in jedem kleinen Intervall verrichtete Arbeit mit Hilfe von Gleichung (9.1)
berechnen.
Abbildung 9.1: Verschiebung eines Körpers entlang eines geradlinigen (links) und eines gekrümmten
Weges (rechts).
Die Gesamtarbeit ergibt sich dann aus der Summe aller Arbeiten in den Teilstücken. Im Grenzfall
unendlich kleiner Intervalle wird diese Prozedur exakt und führt uns auf den Begriﬀ des Kurvenintegrals. Auf ähnliche Weise können wir zum Beispiel auch den Fluss durch eine gekrümmte
Fläche als Summe der Flüsse durch viele kleine, annähernd ebene Flächenelemente ausdrücken und
gelangen so zum Flächenintegral. Wir werden ferner sehen, wie diese Integrale durch die Sätze
von Stokes und Gauß mit der Rotation und Divergenz von Vektorfeldern zusammenhängen.
199
200
9.1
9.1.1
9 Integration von Feldern: Kurven- und Flächenintegrale
Kurvenintegrale
Deﬁnition
Ein wichtiges Beispiel für ein Kurvenintegral ergibt sich bei der Berechnung der Arbeit, die geleistet
wird, wenn ein Körper in einem Kraftfeld entlang einer gegebenen Kurve verschoben wird. Wir
betrachten ein Kraftfeld F (r), zum Beispiel das Gravitationsfeld, das die Kraft beschreibt, die im
Punkt r auf einen Körper wirkt. Wir stellen uns nun vor, dass in diesem Kraftfeld der Körper auf
einer vorgegebenen Kurve C vom Punkt ra zum Punkt rb verschoben wird (siehe Abb. 9.2).
Abbildung 9.2: Ein Körper wird im Kraftfeld F (r) entlang eines gekrümmten Weges von ra nach
rb verschoben.
An jedem Punkt entlang dieses Weges herrscht eine bestimmte Kraft F , die Arbeit verrichtet. Zur
Berechnung dieser Arbeit können wir nun nicht den Ausdruck W = F · s aus Kapitel 2 verwenden,
weil sich die Kraft sowohl in Betrag als auch in Richtung entlang des Weges ändern kann und der
Weg im Allgemeinen nicht geradlinig ist. Um die gesamte Arbeit zu ermitteln, die bei Verschiebung
des Körpers von ra nach rb geleistet wird, zerlegen wir den Weg C in N kleine, gerade Stücke ∆ri ,
die sich aus den Diﬀerenzen ∆ri = ri+1 − ri , i = 0, . . . N − 1 auf der Kurve liegender Punkte ri
ergeben (siehe Abb. 9.3). Durch Wahl einer genügend großen Zahl N kann die Kurve C durch die
geraden Segmente ∆ri beliebig gut angenähert werden.
Abbildung 9.3: Durch Zerlegen des Weges in viele kurze und annähernd gerade Teilstücke ∆ri
können wir die geleistete Arbeit als ein Wegintegral ausdrücken.
Für eine genügend feine Zerlegung, das heißt, für genügend kleine Kurventeilstücke ∆ri , können
wir die Kraft F in jedem Teilstück als konstant betrachten. Daher kann die im Teilstück i geleistete
Arbeit ∆Wi als das bekannte Skalarprodukt der Kraft F (ri ) am Ort ri mit der kleinen Verschiebung
∆ri geschrieben werden:
∆Wi = F (ri ) · ∆ri .
(9.2)
Die insgesamt geleistete Arbeit ist die Summe der in den Teilstücken geleisteten Arbeiten ∆Wi
W ≈
N
−1
i=0
∆Wi =
N
−1
F (ri ) · ∆ri .
(9.3)
i=0
Im Grenzwert unendlich kleiner (und unendlich vieler) Wegstücke ∆ri erhalten wir den exakten
9 Integration von Feldern: Kurven- und Flächenintegrale
201
Wert der im Kraftfeld F (r) auf dem vorgegebenen Weg geleisteten Arbeit:
W = lim
N →∞
N
−1
%
F (ri ) · ∆ri =
F (r) · dr.
(9.4)
C
i=0
Wir nennen dies das Kurvenintegral (oder Linienintegral) des Vektorfeldes F längs der Raumkurve C. (Wir können das Kurvenintegral für ein beliebiges Vektorfeld deﬁnieren, nicht nur für die
Kraft F .) Oft schreibt man für das Kurvenintegral auch:
%rb
%rb
F (r) · dr
W =
F (r) · dr.
oder W =
ra
(9.5)
ra ,C
Abbildung 9.4: Bei einem geschlossenen Weg C sind Ausgangspunkt ra und Endpunkt rb identisch:
ra = rb .
Falls ra = rb , die Kurve C also geschlossen ist (siehe Abb. 9.4), schreibt man für das Integral
:
F (r) · dr = Zc
(9.6)
C
und nennt es die Zirkulation von F entlang C oder auch das geschlossene Kurvenintegral
oder Ringintegral.
9.1.2
Eigenschaften
Da im oben deﬁnierten Kurvenintegral der Ausdruck, über den integriert wird, ein Skalarprodukt
ist, ist das Kurvenintegral selbst auch ein Skalar.
Wenn man bei einem Kurvenintegral den Integrationsweg umkehrt (also den Integrationsweg in
umgekehrter Richtung durchläuft), ändert sich das Vorzeichen des Integrals
%
%
F (r) · dr = −
F (r) · dr,
(9.7)
C
−C
wobei −C den in umgekehrter Richtung durchlaufenen Integrationsweg bezeichnet. Diese Eigenschaft folgt daraus, dass bei einer Umkehrung des Integrationsweges alle ∆ri ihr Vorzeichen wechseln und somit das Kurvenintegral selbst auch sein Vorzeichen wechselt.
Abbildung 9.5: Der Weg C besteht aus den beiden Teilwegen C1 und C2 .
202
9 Integration von Feldern: Kurven- und Flächenintegrale
Ferner ist das Kurvenintegral additiv, das heißt das Kurvenintegral über einem aus zwei Teilstücken
C1 und C2 bestehenden Weg C ist die Summe der Kurvenintegrale über C1 und C2 :
%
%
%
F (r) · dr =
F (r) · dr +
F (r) · dr.
(9.8)
C
C1
C2
Wenn also die Zirkulation ZC entlang eines geschlossenen Weges C verschwindet, sind die Kurvenintegrale entlang der beiden Kurven C1 und C2 , die die beiden Punkte ra und rb miteinander
verbinden, gleich (siehe Abb. 9.6):
%
%
%
%
:
F (r) · dr =
F (r) · dr +
F (r) · dr =
F (r) · dr −
F (r) · dr.
(9.9)
ZC =
C
−C2
C1
C1
C2
Da aber ZC = 0, folgt:
%
%
F (r) · dr =
C1
F (r) · dr.
(9.10)
C2
Abbildung 9.6: Die Punkte ra und rb liegen auf einer geschlossenen Kurve. Man kann sowohl über
die Kurve C1 als auch über die Kurve C2 von ra nach rb gelangen.
9.1.3
Berechnungsverfahren
Um Kurvenintegrale auszuwerten, führen wir sie auf gewöhnliche Integrale zurück. Falls die Kurve
C in Parameterform gegeben ist, das heißt, falls der Ortsvektor


x(t)


r(t) =  y(t) 
(9.11)
z(t)
als Funktion eines Parameters t im Bereich ta ≤ t ≤ tb gegeben ist, können wir das Kurvenintegral
in ein einfaches Integral über den Parameter t verwandeln. In diesem Fall entspricht jeder Punkt
ri = r(ti ) in der Zerlegung der Kurve einem bestimmten Parameterwert ti . Die beiden Randpunkte
der Kurve, ra und rb , erhalten wir für die Parameterwerte ta und tb :
ra = r(ta ) und rb = r(tb ).
(9.12)
Jedes gerade Teilstück ∆ri = ri+1 − ri entspricht dann einem Teilintervall ∆ti = ti+1 − ti des
Parameters. In der Summe in Gleichung (9.3) dividieren und multiplizieren wir nun jeden Term
mit ∆ti und erhalten dadurch:
W ≈
N
−1
i=0
F (ri ) · ∆ri =
N
−1
i=0
∆ri
F (ri ) ·
∆ti .
∆ti
(9.13)
9 Integration von Feldern: Kurven- und Flächenintegrale
203
Im Grenzfall N → ∞ wird aus ∆ri /∆ti die Ableitung des Ortsvektors nach dem Parameter t:
lim
N →∞
dr(t)
∆ri
=
.
∆ti
dt
(9.14)
Damit wird das Linienintegral zu
%tb
F (r(t)) ·
W =
dr
dt
dt.
(9.15)
ta
Dieses Integral ist ein gewöhnliches Integral, dessen Integrand, der Skalar F (r(t)) · (dr /dt), eine
Funktion des Parameters t ist. Dabei beinhaltet der Vektor dr(t)/dt, der in jedem Punkt tangential zur Kurve ist, die Information über den Verlauf der Kurve (siehe Abb. 9.7). (Wenn man den
Vektor dr(t)/dt normiert, erhält man den Tangentialvektor t = (dr (t)/dt)/|dr(t)/dt|.) Falls t die
Zeit ist, ist dr(t)/dt = v (t) die Geschwindigkeit des Körpers, der sich gemäß r(t) entlang C bewegt.
Abbildung 9.7: Der Geschwindigkeitsvektor dr(t)/dt ist tangential zur Kurve r(t).
Aus dieser Darstellung des Linienintegrals ergibt sich folgendes Rezept zur Berechnung von Linienintegralen in Parameterform:
1. Zunächst drücken wir den Feldvektor F (r) durch Einsetzen der parameterabhängigen Koordinaten x(t), y(t) und z(t) als Funktion des Parameters t aus.
2. Dann diﬀerenzieren wir den Vektor r(t) nach t und bilden das Skalarprodukt F (r(t))·(dr /dt).
3. Schließlich integrieren wir dieses Skalarprodukt, das nur mehr eine Funktion von t ist, in den
Grenzen von ta bis tb .
Beispiel:
Wir bestimmen das Integral des Feldes F (x, y) = (2x + y, x) entlang der in Parameterform gegebenen Kurve r(t) = (t, t2 ) (das ist eine Parabel) zwischen den Punkten, die zu den Parametern
ta = 0 und tb = 1 gehören. Die Kurve beginnt im Ursprung, r(ta = 0) = (0, 0), und endet im
Punkt r(tb = 1) = (1, 1). Der Feldvektor als Funktion von t ist gegeben durch:
2
2x(t)
+
y(t)
2t
+
t
F (x(t), y(t)) =
=
.
(9.16)
x(t)
t
Ableitung des Ortsvektors nach t liefert
dr
=
dt
1
2t
(9.17)
204
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.8: Eine Kraft F (r) verrichtet Arbeit entlang einer Parabel.
und somit
dr
F ·
=
dt
2t + t2
t
1
2t
·
= 2t + t2 + 2t2 = 2t + 3t2 .
(9.18)
Das Kurvenintegral ist deshalb gegeben als:
%tb %
F (r) · dr =
C
dr
F ·
dt
%1
!1
3t3 !!
2t2
+
(2t + 3t )dt =
= 1 + 1 = 2.
2
3 !0
2
dt =
ta
0
(9.19)
Falls die Integrationskurve C nicht in Parameterform vorliegt, können wir folgendermaßen vorgehen. In der Summe in Gleichung (9.3) lässt sich jedes Teilstück und der dazugehörige Vektor F (ri )
in Komponenten zerlegen:
∆ri
=
∆xiex + ∆yiey + ∆ziez
(9.20)
und
F (ri )
= Fx (ri )ex + Fy (ri )ey + Fz (ri )ez .
(9.21)
Das Skalarprodukt F (ri ) · ∆ri können wir somit schreiben als
F (ri ) · ∆ri = Fx (ri )∆xi + Fy (ri )∆yi + Fz (ri )∆zi
(9.22)
und die Summe in Gleichung (9.3) besteht somit aus drei Termen, die zu den drei Koordinatenrichtungen gehören:
W ≈
Fx (ri )∆xi +
Fy (ri )∆yi +
Fz (ri )∆zi .
(9.23)
Im Grenzwert einer unendlich feinen Zerlegung des Integrationsweges in Teilstücke erhalten wir
daraus die Summe dreier gewöhnlicher Integrale:
%xb
W
=
%yb
Fx (r)dx +
xa
%zb
Fy (r)dy +
ya
%xb
=
za
%yb
Fx (x, y, z)dx +
xa
Fz (r)dz
%zb
Fy (x, y, z)dy +
ya
Fz (x, y, z)dz.
(9.24)
za
Das Problem ist hier, dass die Integranden von allen drei Variablen x, y und z abhängen und nicht
nur von der jeweiligen Integrationsvariablen. Betrachten wir zum Beispiel das erste Integral. Hier
9 Integration von Feldern: Kurven- und Flächenintegrale
205
&Abbildung 9.9: Räumliche Kurve und ihre Projektion in die xy-Ebene. Bei der Berechnung von
Fx (r)dx müssen sowohl y als auch z als Funktion von x ausgedrückt werden.
gehören zu jedem x-Wert auch wohldeﬁnierte Werte von y und z (siehe Abb. 9.9). Diese hängen
von der Gestalt der Integrationskurve ab. Falls wir nun y und z mit Hilfe der Kurve als Funktion
von x ausdrücken, erhalten wir für das erste Integral
%xb
Fx (x, y(x), z(x))dx,
(9.25)
xa
ein gewöhnliches Integral über x. (Falls wir y und z aus Eindeutigkeitsgründen nicht als Funktion
von x ausdrücken können, zerlegen wir die Integrationskurve in Teilbereiche, sodass dies möglich
ist.)
Mit den anderen beiden Integralen verfahren wir analog und erhalten schließlich
%xb
%yb
Fx (x)dx +
W =
xa
%zb
Fy (y)dy +
ya
Fz (z)dz,
(9.26)
za
wobei Fx (x) = Fx (x, y(x), z(x)), Fy (y) = Fy (x(y), y, z(y)) und Fz (z) = Fz (x(z), y(z), z). Die
Information über die Gestalt der Kurve C ist nun in den Funktionen Fx (x), Fy (y) und Fz (z)
enthalten.
Beispiel:
Wir berechnen wieder das Kurvenintegral aus dem letzten Beispiel. Hier war
F (x, y) = (2x + y, x)
(9.27)
und die Kurve war gegeben durch r(t) = (t, t2 ) oder, in nichtparametrischer Form, durch y = x2 .
Für das Kurvenintegral haben wir also:
%xb
%yb
Fx (x, y)dx +
W =
xa
Fy (x, y)dy,
(9.28)
ya
wobei gemäß Angabe xa = ya = 0 und xb = yb = 1. Da wir mit y = x2 keine Eindeutigkeitsprobleme haben, können wir im ersten Term y und im zweiten Term x durch die jeweilige
206
9 Integration von Feldern: Kurven- und Flächenintegrale
Integrationsvariable ausdrücken:
%xb
%yb
2
W =
Fx (x, x )dx +
xa
√
Fy ( y, y)dy.
(9.29)
ya
Unter Berücksichtigung von F (x, y) = (Fx (x, y), Fy (x, y)) = (2x + y, x) erhalten wir
%1
%1
2
(2x + x )dx +
W =
0
√
ydy =
2x2
x3
+
2
3
0
!1
!1
!
!
! + 2 y 23 ! = 1 + 1 + 2 = 2,
!
3 !0
3 3
0
(9.30)
was mit dem Resultat aus dem vorherigen Beispiel, bei dem eine Parameterdarstellung der Kurve
verwendet wurde, übereinstimmt.
9.1.4
Kurvenintegrale über Gradientenfelder
&
Kurvenintegrale der Form C F (r) · dr hängen im Allgemeinen sowohl vom Vektorfeld F als auch
von der Integrationskurve C ab (insbesondere von deren Anfangs- und Endpunkt). Unter gewissen
&
Umständen kann es jedoch vorkommen, dass das Kurvenintegral C F (r) · dr nur vom Kraftfeld
selbst und den Endpunkten ra und rb abhängt, nicht aber von der Form des Weges, der ra und rb
verbindet. Wir wollen uns in diesem Abschnitt mit der Frage beschäftigen, unter welchen Bedingungen dies der Fall ist.
Als Beispiel betrachten wir das Linienintegral im Kraftfeld F (r) = 2r = (2x, 2y, 2z) und verbinden
den Anfangspunkt ra = (0, 0, 0) mit dem Endpunkt rb = (1, 1, 1) durch drei unterschiedliche
Kurven C1 , C2 und C3 (siehe Abb. 9.10):
C1 :
C2 :
C3 :
Gerade von (0,0,0) nach (1,1,1),
Polygonzug (0, 0, 0) → (1, 0, 0) → (1, 1, 0) → (1, 1, 1),
Parabelbogen von (0,0,0) nach (1,1,1).
Für die Kurve C1 ist die Parameterdarstellung
dr
= (1, 1, 1) und ta = 0, tb = 1.
dt
(9.31)
  
!1
%1
2t
1
6t2 !!
  

·
dt
=
6tdt
=
= 3.
 2t   1 
2 !0
0
2t
1
(9.32)
r(t) = (t, t, t) also ist
Das Kurvenintegral lautet somit
%
%1
F (r) · dr =
C2
0

Entlang der Kurve C2 erhalten wir
%1
%
F (r) · dr =
C2
%1
2xdx
0
+
%1
2ydy
0
+
2zdz
0
r(x)=(x,0,0)
x als Parameter
r(y)=(1,y,0)
y als Parameter
r(z)=(1,1,z)
z als Parameter
!1
2x2 !!
=3
= 3.
2 !0
Die Parabel C3 ist in Parameterform gegeben durch: r(t) = (t, t, t2 ), d. h.
d
r
dt
(9.33)
= (1, 1, 2t) und somit
9 Integration von Feldern: Kurven- und Flächenintegrale
207
Abbildung 9.10: (a) Integrationsweg C1 , (b) Integrationsweg C2 und (c) Integrationsweg C3 .
gilt
 

%1
2t
1

 

 2t  ·  1  dt = (4t + 4t3 )dt
0
0
2t2
2t
!
2
4 !1
4t
4t !
= 2 + 1 = 3.
+
2
4 !0
%
%1
F (r) · dr
=
C3
=

(9.34)
Das heißt, für alle drei Wege C1 , C2 und C3 erhalten wir den selben Wert für das Kurvenintegral.
Es stellt sich nun die Frage, ob auch für andere Wege das Kurvenintegral dasselbe ist. Die Antwort
auf diese Frage ist ja, denn wir können das Integral schreiben als:
%
%
F (r) · dr
2r · dr =
=
C
=
%
C
rb2 − ra2
2
C
= 3.
!rb
!
2!
d(r ) = r !
ra
(9.35)
Hier kommt es also nur auf den Anfangspunkt ra und den Endpunkt rb der Kurve an. Für das
spezielle Vektorfeld F (r) = 2r ist also oﬀensichtlich das Kurvenintegral unabhängig vom Weg.
Welche Bedingung erfüllen Kraftfelder, für die das der Fall ist?
Um diese wichtige Frage zu beantworten, gehen wir zunächst davon aus, dass ein bestimmtes
r ) die Eigenschaft besitzt, dass das Kurvenintegral nicht von der Form der Kurve C
Vektorfeld A(
abhängt sondern nur von den beiden Punkten ra und rb , die von der Kurve C verbunden werden.
Wir stellen uns also vor, dass es viele verschiedene Wege C1 , C2 , C3 , usw. gibt (siehe Abb. 9.11),
die alle von ra nach rb verlaufen und alle das gleiche Kurvenintegral liefern, dessen Wert wir φ
nennen:
%
%
r ) · dr = . . . .
A(r) · dr =
A(
(9.36)
φ=
C1
C2
Obwohl das Kurvenintegral φ nicht von der Form der Kurve abhängt, hängt es sehr wohl von dessen
Anfangs- und Endpunkt ab. Wir wollen uns nun überlegen, wie genau φ von ra und rb abhängt.
Es genügt dabei, die Abhängigkeit vom Endpunkt rb zu betrachten. Wenn wir die Abhängigkeit
vom Ausgangspunkt ermitteln wollen, drehen wir einfach die Richtung der Wege um und machen
so Endpunkte zu Anfangspunkten.
Der Einfachheit halber nennen wir den Endpunkt der Wege jetzt r (statt rb ) und betrachten die
Abhängigkeit von φ von r, wobei wir den Anfangspunkt ra festhalten:
%r
q ) · dq.
A(
φ(r ) =
ra
(9.37)
208
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.11: Alle Integrationswege (C1 , C2 , C3 und C4 ) verbinden ra mit rb und führen zum
&
r ) · dr.
selben Kurvenintegral Ci A(
Hier haben wir die Integrationsvariable in q umgetauft, um Verwechslungen zu vermeiden. (Der
Name einer Integrationsvariablen spielt keine Rolle, sollte sich jedoch von den Namen der anderen
Variablen unterscheiden.)
Abbildung 9.12: Durch Verschiebung des Kurvenendpunktes von r nach r + ∆r ändert sich die
r ) · ∆r.
Funktion φ(r) näherungsweise um ∆φ(r) = A(
Um herauszuﬁnden, wie genau φ(r ) von r abhängt, verschieben wir r um einen kleinen Vektor ∆r
(siehe Abb. 9.12). Wie ändert sich nun φ(r), wenn wir den Endpunkt von r nach r +∆r verschieben?
Falls der Weg C2 von ra nach r + ∆r nicht durch r geht, können wir ihn so verbiegen, dass er
das tut. Laut Voraussetzung ändert das ja nicht den Wert φ(r + ∆r), weil das Kurvenintegral
unabhängig von der Form des Weges ist.
Wir können jetzt φ(r + ∆r) ausdrücken als Summe von zwei Kurvenintegralen, nämlich einem von
ra bis r entlang C2 und einem von r nach r + ∆r entlang C2 :
%
%
q ) · dq =
A(
φ(r + ∆r) =
C2
r%
+∆
r
C2
q ) · dq +
A(
q ) · dq.
A(
(9.38)
r,C2
Das erste Integral auf der rechten Seite ist jedoch gleich φ(r ) (laut Voraussetzung spielt es ja keine
Rolle, ob wir über C1 oder C2 integrieren). Somit erhalten wir
r%
+∆
r
q ) · dq.
A(
φ(r + ∆r) = φ(r ) +
(9.39)
r
r ) nicht entlang der kurzen Strecke von r nach
Falls ∆r sehr klein ist, ändert sich der Vektor A(
9 Integration von Feldern: Kurven- und Flächenintegrale
209
r + ∆r. Also können wir in diesem Fall das Integral in der obigen Gleichung annähern durch
r ) · ∆r und wir erhalten schließlich:
A(
r ) · ∆r.
φ(r + ∆r) − φ(r) ≈ A(
(9.40)
Die linke Seite ist aber (für ∆r → 0) das totale Diﬀerential φ der Funktion φ(r), das wir als
dφ = grad φ · dr
(9.41)
ausdrücken können. Im Limes kleiner Verschiebungen dr gilt also
r ) · dr = grad φ · dr.
A(
(9.42)
Da diese Beziehung für jede beliebige Verschiebung dr gilt, folgt schließlich
r ).
grad φ(r ) = A(
(9.43)
nur vom Anfangs- und Endpunkt des Weges,
Wenn also das Kurvenintegral über ein Vektorfeld A
nicht aber von der Form des Weges abhängt, dann ist das Vektorfeld durch den Gradienten eines
skalaren Feldes darstellbar. Das heißt, es existiert in diesem Fall ein geeignetes skalares Feld φ(r),
= grad φ. Die Wahl der Konstanten ist
das bis auf eine additive Konstante bestimmt ist, sodass A
der Wahl des Anfangspunktes ra äquivalent.
Die Darstellbarkeit eines Vektorfeldes als Gradient eines skalaren Feldes ist also eine notwendige
Bedingung für die Unabhängigkeit des Kurvenintegrals von der Form des Weges. Bemerkenswer als Gradient
terweise ist es auch eine hinreichende Bedingung. Wenn nämlich das Vektorfeld A
eines skalaren Feldes dargestellt werden kann, das heißt, wenn A = grad φ, dann gilt für das
Kurvenintegral:
%rb
%rb
r ) · dr =
A(
ra ,C
%rb
grad φ · dr =
ra ,C
dφ = φ(rb ) − φ(ra ).
(9.44)
ra ,C
Das Integral hängt somit nur vom Anfangs- und vom Endpunkt ab.
Wir erhalten also folgenden Satz:
r ) sind genau dann (und nur dann) vom Weg unabhängig,
Kurvenintegrale über ein Vektorfeld A(
= grad φ. Legt man φ an einer Stelle ra fest, ist φ
wenn eine Funktion φ(r) existiert, sodass A
eindeutig bestimmmt.
Die Funktion φ wird Potential genannt. (In der Physik bezeichnet man meistens −φ als das
nennt man
Potential. Die potentielle Energie in der Mechanik ist ein Beispiel dafür.) Das Feld A
auch ein konservatives Vektorfeld. Wie man einem Vektorfeld A ansehen kann, ob wir es als
Gradientenfeld darstellen können, werden wir im Abschnitt 9.4 sehen.
Aus dem obigen Satz folgt, dass genau dann geschlossene Kurvenintegrale über das Vektorfeld A
verschwinden, wenn
; sich das Vektorfeld A als Gradient eines skalaren Feldes φ darstellen lässt.
r ) · dr kann nämlich durch Wahl zweier beliebiger Punkte ra und rb auf der
Das Ringintegral C A(
Kurve C in zwei Teile zerlegt werden, die den Wegen C1 und C2 entsprechen (siehe Abb. 9.13):
%
%
:
r ) · dr.
A(r) · dr =
A(r) · dr +
A(
(9.45)
C
C1
C2
Wir durchlaufen nun C2 in entgegengesetzter Richtung und drehen damit das Vorzeichen des
zweiten Integrals um:
:
%
%
r ) · dr.
A(r) · dr =
A(r) · dr −
A(
(9.46)
C
C1
−C2
210
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.13: Durch Wahl zweier Punkte ra und rb zerlegen wir das Ringintegral in zwei Linienintegrale entlang C1 und C2 .
Da aber C1 und −C2 Anfangs- und Endpunkt gemeinsam haben und laut Voraussetzung das
nicht von der Form des Weges abhängt, sind die beiden Integrale auf der
Kurvenintegral über A
rechten Seite der obigen Gleichung gleich. Demzufolge verschwindet das Ringintegral:
:
r ) · dr = 0.
A(
(9.47)
C
9.2
9.2.1
Oberﬂächenintegrale
Deﬁnition
Im Kapitel 2 haben wir gesehen, dass wir das pro Zeiteinheit durch eine Fläche strömende Flüssigkeitsvolumen, also den Fluss, als Skalarprodukt des die Strömung beschreibenden Geschwindigkeitsvektors v und des Flächenvektors f darstellen können (siehe Abb. 9.14):
φ = Fluss = f · v .
(9.48)
Dabei sind wir davon ausgegangen, dass die Fläche eben ist und der Geschwindigkeitsvektor v
nicht vom Ort abhängt (ein solches Vektorfeld nennt man homogen).
Abbildung 9.14: Homogenene Strömung
durch eine ebene Fläche mit Flächenvektor
f.
Abbildung 9.15: Inhomogene
durch eine gekrümmte Fläche.
Strömung
Wie können wir nun dieses Ergebnis auf eine beliebige, räumlich (und möglicherweise zeitlich)
veränderliche Strömung durch eine gekrümmte Fläche verallgemeinern (siehe Abb. 9.15)? In diesem
9 Integration von Feldern: Kurven- und Flächenintegrale
211
Fall wird die Strömungsgeschwindigkeit durch ein Vektorfeld v (r) beschrieben und die Fläche F
kann nicht durch einen einzelnen Flächenvektor dargestellt werden. Um den Fluss durch diese
(wirkliche oder gedachte) Fläche F zu berechnen, gehen wir in Analogie zum Kurvenintegral vor,
bei dem wir eine Kurve in kleine Teilstücke ∆ri eingeteilt haben, und zerlegen die Fläche F
in viele kleine Teilstücke, die wir durch ebene Flächenstücke ∆fi , die so genannten Facetten,
approximieren (siehe Abb. 9.16). In der Praxis benötigen wir natürlich eine analytische Darstellung
dieser Facetten. Hier wollen wir zunächst jedoch nur davon ausgehen, dass wir eine solche Zerlegung
in Facetten durchführen können, ohne auf ihre speziﬁsche analytische Darstellung einzugehen.
Für jede der Facetten, die wir mit dem Index i nummerieren, deﬁnieren wir nun einen Flächenvektor
∆f(ri ), dessen Betrag gleich dem Flächeninhalt der Facette um den Punkt ri ist und der normal
auf diese Facette steht. Der Punkt ri ist ein beliebiger Punkt im Inneren der i-ten Facette.
Abbildung 9.16: Zerlegung der Fläche F in kleine Facetten mit Flächenvektoren ∆fi .
Wir wählen die Facetten so klein, dass das Vektorfeld innerhalb jeder Facette näherungsweise
konstant ist. Das heißt, innerhalb der Facette um ri mit dem Flächenvektor ∆f(ri ) ist das Vektorfeld konstant und gleich v (ri ). Wir können nun den Fluss durch das Flächenelement ∆fi als
Skalarprodukt berechnen:
∆φi = v (ri ) · ∆f(ri ).
(9.49)
Der Gesamtﬂuss φ durch die Fläche F ergibt sich als Summe aller Teilﬂüsse:
φ≈
N
v (ri ) · ∆f(ri ).
(9.50)
i=1
Im Limes unendlich vieler (N → ∞) und unendlich kleiner Facetten wird aus dieser Summe ein
Flächenintegral:
%
N
φ = lim
v (ri ) · ∆f(ri ) =
v (r) · df(r).
(9.51)
N →∞
F
i=1
r ) deﬁniert werden (nicht nur für ein StrömungsFlächenintegrale können für beliebige Vektorfelder A(
feld v (r)):
%
%
%
%
A(r) · df (r) =
Ax dfx +
Ay dfy +
Az dfz .
(9.52)
φ=
F
F
F
F
Oft ist es notwendig, ein Flächenintegral über einer geschlossenen Fläche F (zum Beispiel die
Oberﬂäche einer Kugel) zu berechnen. Wir bezeichnen ein solches Integral mit
:
· df
A
(9.53)
F
und deﬁnieren die Flächennormalen üblicherweise so, dass sie aus dem geschlossenen Gebiet herauszeigen.
212
9 Integration von Feldern: Kurven- und Flächenintegrale
9.2.2
Darstellung der Fläche und des Flächenelements
In der praktischen Berechnung von Oberﬂächenintegralen ist es notwendig, eine analytische Darstellung der Fläche im Raum zu wählen. In kartesischen Koordinaten können wir, wie wir
bereits früher gesehen haben, Flächen im Raum darstellen, indem wir jedem Punkt der xy-Ebene
eine z-Koordinate zuordnen, z = z(x, y) (siehe Abb. 9.17). Die Fläche F besteht dann aus den
Punkten (x, y, z(x, y)), wobei x und y aus einem bestimmten Deﬁnitionsbereich D der xy-Ebene
stammen (nämlich der Projektion der Fläche F in die xy-Ebene).
Abbildung 9.17: Die Fläche F wird durch die
Funktion z = z(x, y) beschrieben.
Abbildung 9.18: Da zu einem Punkt (x, y)
in der xy-Ebene mehr als ein Punkt auf der
Fläche existiert, muss die Fläche in die zwei
Teilﬂächen F1 und F2 zerlegt werden.
Falls es zu einem Punkt (x, y) mehr als einen z-Wert gibt (siehe Abb. 9.18), muss die Fläche in
mehrere Teilﬂächen Fi zerlegt werden.
Beispiel:
Abbildung 9.19: Die Oberﬂäche der Kugel besteht aus den zwei Halbkugeln F1 und F2 .
In kartesischen Koordinaten kann die Oberﬂäche einer Kugel mit Radius R und Mittelpunkt im
Ursprung durch die zwei Teilﬂächen F1 mit positiven z-Werten und F2 mit negativen z-Werten
dargestellt werden (siehe Abb. 9.19):
F1 : (x, y, + R2 − (x2 + y 2 )),
(9.54)
2
2
2
F2 : (x, y, − R − (x + y )).
(9.55)
9 Integration von Feldern: Kurven- und Flächenintegrale
213
Der Deﬁnitionsbereich in der xy-Ebene ist hier ein Kreis mit Radius R und Mittelpunkt im Ursprung.
Bis jetzt haben wir x und y als die freien Parameter gewählt. Wir könnten aber Flächen genauso
gut mit (y, z) oder (x, z) als freien Parameter wählen. Allgemeiner können wir eine Fläche F durch
einen Ortsvektor r(u, v) beschreiben, der von zwei Parametern u und v abhängt:


x(u, v)


r = r(u, v) =  y(u, v)  .
(9.56)
z(u, v)
Im Falle der kartesischen Darstellung gilt u = x, v = y (falls x und y als Parameter verwendet
werden). Diese allgemeine Parameterdarstellung ist analog zur Parameterdarstellung einer Kurve.
Da eine Kurve im Raum jedoch ein eindimensionales Objekt ist, genügt in diesem Fall ein einziger
Parameter.
Abbildung 9.20: Auf der Mantelﬂäche eines Zylinders mit Radius ρ = R können die Zylinderkoordinaten ϕ und z beliebige Werte annehmen.
Oberﬂächenintegrale werden einfacher, wenn ein Koordinatensystem mit geeigneter Symmetrie
gewählt wird. Wollen wir zum Beispiel die Oberﬂäche eines unendlich langen Zylinders beschreiben,
sind Zylinderkoordinaten (ϕ, ρ, z) zweckmäßig (siehe Kapitel 2). Für die Mantelﬂäche eines
Zylinders mit Radius R gilt (siehe Abb. 9.20):
ρ = const = R,
ϕ, z beliebig
(0 ≤ ϕ < 2π, −∞ < z < ∞).
(9.57)
Hier spielen ϕ und z die Rolle der Parameter u und v. Die Fläche wird von einem Netz aus so genannten Parameterlinien überdeckt, auf denen ϕ beziehungsweise z konstante Werte annehmen.
Ein weiteres Beispiel ist die Darstellung der Kugeloberﬂäche in den Kugelkoordinaten (r, ϑ, ϕ)
(siehe Kapitel 2). Die Oberﬂäche einer Kugel mit Radius R ist deﬁniert durch (siehe Abb. 9.21):
r = const = R,
ϕ, ϑ beliebig in
(0 ≤ ϕ < 2π, 0 ≤ ϑ ≤ π).
(9.58)
Hier werden Orte auf der Kugeloberﬂäche durch Angabe der beiden Parameter ϕ und ϑ deﬁniert.
Die Parameterlinien sind die Längen- und Breitengrade.
214
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.21: Auf der Oberﬂäche einer Kugel mit Radius r = R können die Kugelkoordinaten
ϕ und ϑ beliebige Werte annehmen.
9.2.3
Das Flächenelement
Neben einer analytischen Darstellung der Oberﬂäche ist zur Berechnung von Oberﬂächenintegralen
auch die Darstellung des Oberﬂächenelements df der Fläche F notwendig. Dann kann das Oberﬂächenintegral auf ein gewöhnliches Doppelintegral zurückgeführt werden. In kartesischen Koordinaten können wir die Fläche F in kleine Facetten zerlegen, indem wir zum Beispiel die Projektion
D von F auf die xy-Ebene in kleine Rechtecke der Kantenlänge ∆x und ∆y einteilen (siehe Abb.
9.22).
Abbildung 9.22: Das Flächenelement ∆f der Oberﬂäche F ist gegenüber der z-Achse um den
Winkel α geneigt.
Durch die Wahl kleiner Rechtecke kann die Projektion D beliebig genau durch Rechtecke angenähert werden. Die Zerlegung der Projektion in kleine Rechtecke erzeugt auch eine Zerlegung
der Fläche F in kleine Facetten mit Fläche ∆f . Da diese Facetten gegenüber der xy-Ebene geneigt
sein können, unterscheidet sich der Flächeninhalt der Facetten im Allgemeinen vom Flächeninhalt der Rechtecke in der xy-Ebene. Diese Neigung muss in der Ermittlung der Flächenelemente
berücksichtigt werden. Für die Projektion eines Flächenelements mit dem Flächenvektor ∆f auf
die xy-Ebene gilt (wir werden später sehen, wie wir die Richtung von ∆f ermitteln können):
∆f · ez = ∆x∆y.
(9.59)
9 Integration von Feldern: Kurven- und Flächenintegrale
215
Falls die Facette horizontal ist, ist ∆f parallel zur z-Achse und ∆f · ez = ∆f (ez ist der Einheitsvektor in z-Richtung). Der Flächeninhalt des Flächenelements ist in diesem Fall gleich dem
Flächeninhalt seiner Projektion. Schließt ∆f jedoch mit der z-Achse den Winkel α ein, ist die
Projektion in die xy-Ebene ﬂächenmäßig kleiner als das Flächenelement.
Abbildung 9.23: Die Fläche der Projektion des Flächenelements ist gegenüber der Fläche des
Flächenelements um den Faktor cos α vermindert.
Die Fläche der Projektion ist um den Faktor cos α gegenüber der Fläche des Flächenelements
verringert (siehe Abb. 9.23) und daher gilt:
∆f cos α = ∆x∆y,
(9.60)
∆f·
ez
was wegen ∆f · ez = ∆f cos α genau der vorherigen Gleichung entspricht. Das heißt, für ein
bestimmtes Rechteck um den Punkt (x, y) in der xy-Ebene ist die Fläche des zugehörigen Flächenelements gegeben durch
∆f =
∆x∆y
∆x∆y
=
,
cos α
n(x, y, z(x, y)) · ez
(9.61)
wobei n = ∆f/∆f der Einheitsnormalenvektor auf das Flächenelement im Punkt (x, y, z(x, y)) ist.
Wir müssen nun noch den Normalenvektor n(x, y, z(x, y)) bestimmen. Dazu benutzen wir die
Tatsache, dass der Gradient einer Funktion g(x, y, z) normal auf die durch g(x, y, z) =const deﬁnierten Niveauﬂächen steht. Wir können nun die Fläche F , die aus den Punkten (x, y, z = f (x, y))
(wir haben hier die Funktion f eingeführt, um die Variable z von der Funktion z(x, y) zu unterscheiden) besteht, auﬀassen als eine Niveauﬂäche der Funktion
g(x, y, z) = z − f (x, y).
(9.62)
Die Fläche F ist nämlich wegen z = f (x, y) genau jene Niveauﬂäche von g, für die gilt:
g(x, y, z) = 0.
(9.63)
Der Normalenvektor n im Punkt (x, y, z(x, y)) ist also gegeben durch
n =
Der Gradient ∇g lautet


∇g = 
grad g
∇g
=
.
|grad g|
|∇g|
∂g
∂x
∂g
∂y
∂g
∂z



− ∂f
∂x
  ∂f 
 =  − ∂y 
und somit erhalten wir für den Normalenvektor
(9.64)
(9.65)
1


− ∂f
∂x
1
 ∂f 
n = "
2 2  − ∂y  .
1 + ∂f
+ ∂f
1
∂x
∂y
(9.66)
216
9 Integration von Feldern: Kurven- und Flächenintegrale
Mit Hilfe dieses Normalenvektors können wir nun den Flächenvektor ∆f ausdrücken als


− ∂f
∂x
1
∆x∆y
∆x∆y
 ∂f 
"
n =
1
2 2  − ∂y 
q
n · ez
2
∂f 2
1+( ∂f
1 + ∂f
+ ∂f
1
∂x ) +( ∂y )
∂x
∂y
 ∂f 
− ∂x


.
∆x∆y  − ∂f
∂y 
∆f =
=
(9.67)
1
Wir haben jetzt alle Elemente, die wir zur Berechnung des Flächenintegrals in kartesischen Koordinaten benötigen. Dies wollen wir im nächsten Abschnitt tun. In anderen Koordinatensystemen
müssen auch die Ausdrücke für das Flächenelement entsprechend geändert werden.
9.2.4
Berechnung des Oberﬂächenintegrals
Im letzten Abschnitt haben wir uns mit den Zutaten für die praktische Berechnung von Oberﬂächenintegralen beschäftigt. In diesem Abschnitt wollen wir diese Zutaten verwenden, um das
Oberﬂächenintegral auf ein gewöhnliches Doppelintegral in kartesischen Koordinaten zurückzuführen. Falls die Berechnung nicht mit kartesischen Koordinaten x und y als Parameter sondern
mit den allgemeinen Parametern u und v durchgeführt werden soll, muss das Flächenelement auf
geeignete Weise transformiert werden. Auf diesen allgemeineren Fall können wir hier jedoch nicht
eingehen und die Leserin/der Leser sei dafür auf die weiterführende Literatur verwiesen.
Im Limes unendlich kleiner Rechtecke wird aus dem Flächenelement ∆f das inﬁnitesimale Flächenelement
 ∂f 
− ∂x


df =  − ∂f
dxdy.
(9.68)
∂y 
1
Einsetzen in den Ausdruck für das Oberﬂächenintegral ergibt
%
%
r ) · df =
A(
F
D


− ∂f
∂x

y, z(x, y)) · 
A(x,
dxdy.
 − ∂f
∂y 
(9.69)
1
Wir haben somit das Oberﬂächenintegral über die Fläche F in ein Doppelintegral über den Bereich
D (Projektion von F ) in der xy-Ebene verwandelt. Wir wollen diesen Ausdruck nun anhand eines
Beispiels erläutern.
Beispiel:
r ) = (x3 , y 3 , z 3 ) über die durch z =
Zu berechnen sei das Oberﬂächenintegral des Vektorfeldes A(
2
2
f (x, y) = x + y dargestellte Fläche und zwar in den Grenzen −1 ≤ x ≤ 1 und −1 ≤ y ≤ 1. Die
Fläche ist ein abgeschnittenes Rotationsparaboloid (siehe Abb. 9.24).
Die partiellen Ableitungen von f (x, y) nach x und y sind:
∂f
= 2x und
∂x
∂f
= 2y.
∂y
(9.70)
9 Integration von Feldern: Kurven- und Flächenintegrale
217
Abbildung 9.24: Rotationsparaboloid über einem quadratischen Bereich.
Folglich ergibt sich für das Integral
%
%1 %1
· df =
A
F
−1 −1
%1 %1
=

 
x3
−2x


 

 ·  −2y  dxdy
y3
1
(x2 + y 2 )3

*
+
−2x4 − 2y 4 + (x2 + y 2 )3 dxdy
−1 −1
%1 %1
=
2
*
+
−2x4 − 2y 4 + x6 + 3x4 y 2 + 3x2 y 4 + y 6 dxdy
−1 0
%1 #
=
2
−1
=
2
$ !1
!
3x5 2 3x3 4
x7
2x5
4
6
− 2y x +
+
y +
y + y x !! dy
−
5
7
5
3
0
%1 1 3
2
− − 2y 4 + + y 2 + y 4 + y 6 dy
5
7 5
−1
=
%1 2 6 2
4
4
4
6
2
− − 4y + + y + 2y + 2y dy
5
7 5
0
=
=
!1
%1 6 3 2 5 2 7 !!
18 6 2
18
4
6
y − y + y !
2
− + y − 2y + 2y dy = 2 − y +
35 5
35
3·5
5
7
0
0
36 − 20
16
18 2 2 2
2 · 18 4
+ =−
=− .
(9.71)
2 − + − +
=−
35 5 5 7
35
7
35
35
In manchen Fällen ist es zweckmäßig, die Integration nicht in einem kartesischen Koordinatensystem, sondern in einem anderen Koordinatensystem durchzuführen. In diesem Fall ist auf eine
korrekte Deﬁnition der Flächenelemente zu achten, auf die wir hier jedoch nicht näher eingehen
können.
218
9.3
9 Integration von Feldern: Kurven- und Flächenintegrale
Der Integralsatz von Gauß
Der Integralsatz von Gauß stellt einen Zusammenhang her zwischen dem Oberﬂächenintegral über
ein Vektorfeld und dem Volumensintegral über die Divergenz eines Vektorfeldes. Dieser Satz erlaubt
nicht nur eine anschauliche Interpretation der Divergenz, sondern ermöglicht auch sehr praktische
Umformungen von Integralen. Zum Beispiel können wir den Gaußschen Integralsatz benutzen, um
die partielle Integration aus Kapitel 4 auf Vektorintegrale zu verallgemeinern.
9.3.1
Integraldarstellung der Divergenz
Wir haben im Abschnitt 8.3.2 bereits gesehen, dass der Gesamtﬂuss durch die Oberﬂäche eines
kleinen Quaders an der Stelle r(x, y, z) mit den Kantenlängen ∆x, ∆y und ∆z im Strömungsfeld
v (r) gegeben ist durch
div v (r)∆x∆y∆z = div v (r)∆V.
r ) und bilden das Oberﬂächenintegral
Wir betrachten nun ein allgemeines Vektorfeld A(
:
· df
A
(9.72)
(9.73)
∆F
über die geschlossene Oberﬂäche ∆F eines kleinen Volumens ∆V . Falls das kleine Volumen ein Quader mit Kantenlänge ∆x, ∆y und ∆z ist (siehe Abb. 9.25), können wir dieses Oberﬂächenintegral
einfach aus den Oberﬂächenintegralen über die sechs Seitenﬂächen des Quaders zusammensetzen:
:
6 %
· df =
· df.
A
A
(9.74)
∆F
i=1
∆fi
Abbildung 9.25: Quader mit Volumen ∆x∆y∆z und Seitenﬂächen ∆f1 , ∆f2 , ∆f3 , ∆f4 , ∆f5 und
∆f6 .
Im Limes eines immer kleiner werdenden Quaders können wir diese Integrale leicht lösen (siehe
Abschnitt 8.3.2). Die Annahme, dass das Vektorfeld auf den kleinen Seitenﬂächen des Quaders
konstant ist und dass sich das Feld im Quader nur linear ändert, führt uns zu
:
· df ≈ div A(
r )∆V,
A
(9.75)
∆F
wobei ∆V = ∆x∆y∆z. Im Limes ∆x → 0, ∆y → 0, ∆z → 0 wird diese Beziehung exakt und wir
erhalten nach Division durch ∆V
:
1
· df = div A(
r ).
A
(9.76)
lim
∆V →0 ∆V
∆F
9 Integration von Feldern: Kurven- und Flächenintegrale
219
In diesem Grenzübergang haben wir r, den Mittelpunkt des Quaders, konstant gehalten. (Hier geht
natürlich nicht nur ∆V gegen 0, sondern auch der größte Durchmesser des kleinen Quaders.)
Diese Beziehung kann als Deﬁnition der Divergenz aufgefasst werden. Sie gilt nicht nur für eine
Folge von kleiner werdenden Quadern, sondern für jede Folge geschlossener, glatter Flächen, die
sich in diesem Grenzprozess auf den Punkt r zusammenziehen. Diese Deﬁnition ist sogar dann
r ) nicht diﬀerenzierbar ist. Falls dies aber der Fall ist, gilt natürlich die Beziehung
gültig, wenn A(
aus Kapitel 8:
:
1
· df = div A(
r ) = ∂Ax + ∂Ay + ∂Az .
A
(9.77)
lim
∆V →0 ∆V
∂x
∂y
∂z
∆F
Diese Integraldarstellung können wir nun benutzen, um den Integralsatz von Gauß herzuleiten.
9.3.2
Formulierung und Herleitung
Aus der Integraldarstellung der Divergenz wissen wir, dass für ein kleines, quaderförmiges Volumen
∆V1 an der Stelle r1 gilt
:
1
· df = div A(
r1 ),
A
(9.78)
∆V1
F (∆V1 )
wobei sich das Oberﬂächenintegral über die geschlossene Fläche F (∆V1 ) dieses Volumselements
erstreckt. Wir stellen uns nun vor, dass wir an dieses kleine Volumen ∆V1 ein weiteres quaderförmiges Volumen ∆V2 legen, das mit dem ersten Volumen eine Seitenﬂäche gemeinsam hat (siehe Abb.
9.26).
Abbildung 9.26: An der Fläche S berühren sich die beiden Volumselemente V1 und V2 . Die Flächen(1)
(2)
elemente ∆fS und ∆fS sind einander entgegengesetzt.
Für dieses zweite Volumen gilt natürlich genauso
:
1
· df = div A(
r2 ),
A
∆V2
(9.79)
F (∆V2 )
wobei diesmal die Integration über die Oberﬂäche F (∆V2 ) des kleinen Volumens ∆V2 erfolgt. Somit
erhalten wir durch Addition:
:
:
· df +
· df = div A(
r1 )∆V1 + div A(
r2 )∆V2 .
A
A
(9.80)
F (∆V1 )
F (∆V2 )
Die linke Seite ist die Summe zweier Oberﬂächenintegrale, wobei in jedem Oberﬂächenintegral
alle Seitenﬂächen der beiden quaderförmigen Bereiche einen Beitrag leisten. Da die Trennﬂäche S
220
9 Integration von Feldern: Kurven- und Flächenintegrale
beiden Oberﬂächen gemeinsam ist, gibt es in jedem der Oberﬂächenintegrale einen Beitrag, der
vom Fluss durch diese Seitenﬂäche stammt. Bezeichnen wir den Feldvektor in der Mitte dieser
rS ), ist der Beitrag zum Oberﬂächenintegral über F (∆V1 ) gegeben durch
Fläche mit A(
rS ) · df(1)
A(
S
(9.81)
und der Beitrag zum Oberﬂächenintegral über F (∆V2 ) gleich
rS ) · df(2) .
A(
S
(9.82)
Da wir vereinbart haben, dass die Flächennormalvektoren stets nach außen gerichtet sind, zeigen
(1)
(2)
dfS und dfS in entgegengesetzte Richtung. Im Betrag sind sie aber gleich (weil sie zur gleichen
Fläche gehören) und so gilt
(1)
(2)
dfS = −dfS .
(9.83)
Die beiden Beiträge (9.81) und (9.82) heben einander genau auf
rS ) · df(1) + A(
rS ) · df(2) = A(
rS ) · df(1) − A(
rS ) · df(1) = 0.
A(
S
S
S
S
(9.84)
Die gemeinsame Trennﬂäche S liefert also in der Summe auf der linken Seite der Gleichung keinen
Beitrag. Übrig bleiben also nun die Beiträge der Außenseiten F (∆V1 + ∆V2 ) des kombinierten
Volumens ∆V1 + ∆V2 :
:
:
:
· df.
A · df +
A · df =
A
(9.85)
F (∆V1 )
F (∆V2 )
F (∆V1 +∆V2 )
Dieser Ausdruck gilt übrigens nicht nur für inﬁnitesimale Volumina, sondern ganz allgemein für
die Summe zweier Volumina V1 + V2 , welche eine, möglicherweise gekrümmte, Berührungsﬂäche S
haben (siehe Abb. 9.27). Auch in diesem Fall heben sich die beiden Beiträge der Fläche S zum
Oberﬂächenintegral über V1 und V2 genau auf, da in jedem Punkt die zugehörigen Normalvektoren
den gleichen Betrag aber entgegengesetzte Richtung besitzen.
Abbildung 9.27: In der Summe der Oberﬂächenintegrale über die Oberﬂächen, die die Volumina
V1 und V2 umschließen, heben sich die Beiträge, die von der Berührungsﬂäche S stammen, exakt
auf.
Wir können nun diese Prozeduren beliebig oft wiederholen und stets neue Quader ∆V3 , ∆V4 , ∆V5 ,
usw. an die bereits vorhandenen anfügen. Dabei heben sich die Beiträge der gemeinsamen Flächen
immer auf und übrig bleibt nur das Oberﬂächenintegral über die Einhüllende F (∆V1 + ∆V2 + . . . )
aller N Teilvolumina ∆Vi :
:
:
:
:
· df +
· df + · · · +
· df =
· df.
A
A
A
A
(9.86)
F (∆V1 )
F (∆V2 )
F (∆VN )
F (∆V1 +···+∆VN )
Mit Hilfe des Summenzeichens können wir dies kompakter ausdrücken als:
:
:
N
· df =
· df.
A
A
i=1
F (∆Vi )
F(
P
i
∆Vi )
(9.87)
9 Integration von Feldern: Kurven- und Flächenintegrale
221
Abbildung 9.28: Zerlegung eines Volumens in kleine Quader.
Wir
können nun jedes Volumen V beliebig genau mit Hilfe kleiner Quader ∆Vi annähern, V ≈
i ∆Vi . Das Integral auf der rechten Seite von Gleichung (9.87) wird dann zu einem Oberﬂächenintegral über die Oberﬂäche von V . Drücken wir zusätzlich auf der linken Seite dieser Gleichung
die Oberﬂächenintegrale über die Teilvolumina mit Hilfe von Gleichung (9.76) durch die lokale
Quellenstärke aus, erhalten wir
:
· df ≈
A
i=1
F (V )
:
N
· df ≈
A
N
ri ) · ∆Vi .
div A(
(9.88)
i=1
F (∆Vi )
Im Grenzwert inﬁnitesimal kleiner Teilvolumina wird aus der Summe in dieser Gleichung ein Volumsintegral über V :
%
:
· df =
dV.
A
div A
(9.89)
V
F (V )
Dies ist der Integralsatz von Gauß, der auch oft Satz von Gauß-Ostrogradski genannt wird,
weil er von diesen beiden Mathematikern unabhängig voneinander gefunden wurde.
In Worten lässt sich der Integralsatz von Gauß ausdrücken als: Das Oberflächenintegral eines
über eine geschlossene Fläche F mit nach außen gerichteten Flächennormalen ist
Vektorfeldes A
gleich dem Volumsintegral über die Divergenz des Vektorfeldes im Volumen V, das von der Fläche
F eingeschlossen wird.
Der Satz von Gauß verknüpft also die Quellen und Senken eines Feldes im Inneren eines Volumens
mit den Eigenschaften des Feldes auf der Oberﬂäche des Volumens. Anwendung ﬁndet der Satz
von Gauß zum Beispiel in der Elektrostatik und Elektrodynamik sowie bei der Kontinuitätsgleichung für erhaltene Größen (z.B. Energie, Impuls, Masse).
Beispiel:
Um die Nützlichkeit des Satzes von Gauß zu demonstrieren, berechnen wir das Oberﬂächenintegral
r ) = r über die Oberﬂäche F eines Würfels mit Volumen V . Mit Hilfe des Satzes
O für das Feld A(
von Gauß können wir umformen:
%
:
dV.
A · df =
div A
(9.90)
O=
F
= r haben wir div A
=
Für A
∂x
∂x
∂y
∂y
+
+
V
∂z
∂z
= 3 und somit
%
%
dV =
div A
O=
V
3dV = 3V.
(9.91)
V
Interessanterweise geht hier die Form des Volumens nicht in die Lösung ein. Für eine Kugel oder
einen Zylinder mit demselben Rauminhalt ergibt sich also genau dasselbe Oberﬂächenintegral.
222
9 Integration von Feldern: Kurven- und Flächenintegrale
Beispiel:
durch eine geschlossene Oberﬂäche F gilt laut dem Satz
Für den Fluss eines Wirbelfeldes rot A
von Gauß
:
%
· df =
dV.
rot A
div (rot A)
(9.92)
F
V
= 0, bedeutet dies
Da Wirbelfelder quellenfrei sind, div (rot A)
:
%
· df =
rot A
0 dV = 0.
F
(9.93)
V
durch eine geschlossene Oberﬂäche für
Somit verschwindet der Gesamtﬂuss eines Wirbelfeldes rot A
Anschaulich bedeutet dies, dass Wirbel entweder ganz in V verlaufen
ein beliebiges Vektorfeld A.
oder an einer Stelle genauso viele ein- wie an einer anderen Stelle austreten. (Dies folgt, wie wir
sehen werden, auch aus dem Satz von Stokes.)
Beispiel:
r ) = (x3 , y 3 , z 3 )
Wir wollen nun den Satz von Gauß veriﬁzieren, indem wir für das Vektorfeld A(
;
· df über die Oberﬂäche einer Kugel mit Radius R als auch das
sowohl das Oberﬂächenintegral A
&
Volumsintegral V div A dV über diese Kugel berechnen (siehe Abb. 9.29).
r ) auf der Halbkugel mit Radius R.
Abbildung 9.29: Vektorfeld A(
Wir berechnen zunächst das Oberﬂächenintegral. Aus Symmetriegründen genügt es, das Integral
nur für eine Halbkugel, also zum Beispiel für z ≥ 0, zu berechnen. Das Integral über die Kugel ist
dann einfach
zweimal das Integral über die Halbkugel. Die Flächengleichung für die Halbkugel ist
z(x, y) = R2 − (x2 + y 2 ). Der Normalenvektor n auf die Fläche zeigt für eine Kugel genau vom
Ursprung weg:


x
1


(9.94)
n =  y .
2
2
2
x +y +z
z
Folglich ist das Flächenelement gegeben durch:


x
dxdy
1

df =
· n =  y  dxdy.
n · ez
z
z
(9.95)
9 Integration von Feldern: Kurven- und Flächenintegrale
223
Das Oberﬂächenintegral lässt sich also schreiben als
 


%%
%
x3
x
1 3  

· df =
A
 y  ·  y  dxdy
z
F
x2 +y 2 ≤R2
z3
z
%%
4
4
4
x +y +z
dxdy,
=
z
(9.96)
x2 +y 2 ≤R2
wobei sich der Integrationsbereich in der xy-Ebene über den Kreis mit Radius R erstreckt. In
diesem Ausdruck ist z als Funktion von x und y zu betrachten, z = z(x, y). Durch Einsetzen der
Flächengleichung für z(x, y) erhalten wir
%
%%
x4 + y 4 + (R2 − (x2 + y 2 ))2
A · df =
dxdy.
(9.97)
R2 − (x2 + y 2 )
F
x2 +y 2 ≤R2
Dieses Integral berechnen wir zweckmäßigerweise in Polarkoordinaten:
%
%2π%R
· df =
A
F
0
0
r4 (sin4 ϕ + cos4 ϕ) + (R2 − r2 )2
√
rdϕdr
R2 − r 2
%2π%R #
=
0
0
%2π%R
=
0
0
%R
√
=
0
Das Integral
%R
0
Das Integral
&
5
√ r
dr
R2 −r 2
$
3
r4 (sin4 ϕ + cos4 ϕ)
√
+ (R2 − r2 ) 2 rdϕdr
R2 − r 2
r5 (sin4 ϕ + cos4 ϕ)
√
dϕdr + 2π
R2 − r 2
r5
R2 − r 2
%R
3
(R2 − r2 ) 2 rdr
0
%2π
%R
3
4
4
dr (sin ϕ + cos ϕ)dϕ + 2π (R2 − r2 ) 2 rdr.
0
√
1
ergibt laut Integraltafel − 15
R2 − r2 (3r4 + 4r2 R2 + 8R4 ) und somit gilt
!R
!
r5
1 2
R
8R5
4
2 2
4 !
2
√
8R4 =
.
dr = −
R − r (3r + 4r R + 8R )! =
15
15
15
R2 − r 2
0
& 2π
0
(9.98)
0
(9.99)
(sin4 ϕ + cos4 ϕ)dϕ ergibt
!2π
%2π
3ϕ sin(4ϕ) !!
3π
4
4
+
.
(sin ϕ + cos ϕ)dϕ =
=
!
4
16
2
0
(9.100)
0
Schließlich erhalten wir für das letzte Integral:
!R
%R
!
21 2
1
2
2 32
2 52 !
(R − r ) rdr = − (R − r ) ! = R5 .
52
5
0
(9.101)
0
Das Oberﬂächenintegral wird somit zu
%
4π 2π
8R5 3π 2πR5
6π 5
A · df =
+
=
+
R .
R5 =
15
2
5
5
5
5
F
Für die ganze Kugel ist das Oberﬂächenintegral also gegeben durch:
%
· df = 12π R5 .
A
5
F
(9.102)
(9.103)
224
9 Integration von Feldern: Kurven- und Flächenintegrale
Wir berechnen nun auch das Volumsintegral über die Divergenz des Vektorfeldes über die ganze
Kugel:
%
% 3
∂y 3
∂z 3
∂x
+
+
div AdV
=
dV
∂x
∂y
∂z
V
V
%
(9.104)
= 3 (x2 + y 2 + z 2 )dV.
V
Wir transformieren auf Kugelkoordinaten und beachten dabei, dass das Volumselement zu r2 sin ϑdϑdϕdr
wird:
%
%2π%π %R
div AdV
=
r2 r2 sin ϑdϑdϕdr
3
V
0
0
0
%R
=
3 · 2π
%π
r dr ·
4
0
sin ϑdϑ
0
r5
5
!π
!R
!
!
! · (− cos ϑ) !
!
!
=
3 · 2π
=
6π 5
12π 5
R (− cos(+π) + cos 0) =
R .
5
5
0
0
(9.105)
&
· df
Wie wegen des Integralsatzes von Gauß zu erwarten war, liefern das Oberﬂächenintegral F A
&
und das Volumsintegral V div AdV
genau dasselbe Ergebnis. Allerdings ist in diesem Fall das
Volumsintegral bedeutend einfacher zu berechnen als das Oberﬂächenintegral.
9.3.3
Partielle Integration mit Hilfe des Gaußschen Satzes
Erinnern wir uns zunächst daran, dass bei der partiellen Integration in einer Dimension ein Integral
in ein anderes (hoﬀentlich einfacheres) Integral verwandelt wird:
%b
!b %b
!
f (x)g (x)dx = f (x)g(x)!! − f (x)g(x)dx.
a
a
(9.106)
a
Die partielle Integration beruht auf der Produktregel der Diﬀerentiation, (f g) = f g + f g . Wir
können Gleichung (9.106) auch umformen zu:
%b
%b
f (x)g (x)dx +
a
!b
!
f (x)g(x)dx = f (x)g(x)!! .
(9.107)
a
a
Hier haben wir also das Integral über eine Ableitung verknüpft mit dem Wert der Funktion an den
Rändern (in einer Dimension sind das einfach die Endpunkte) des Integrationsintervalls.
Der Satz von Gauß leistet das Analoge für Volumsintegrale. Dieser Analogie folgend können wir die
Methode der partiellen Integration auf Volumsintegrale übertragen, falls der Integrand ein Produkt
aus einem Feld ψ mit dem Gradienten eines anderen Feldes ist,
%
%
ψ(r)grad ϕ(r)dV =
ψ(r)∇ϕ(r )dV.
(9.108)
V
V
Da der Gradient ein Vektor ist, hat auch das Integral über ψ∇ϕ Vektorcharakter. Im Allgemeinen kann man natürlich Volumsintegrale statt über skalare Felder auch über Vektorfelder
bilden. Da Integrale als Grenzwerte von Summen deﬁniert sind und Vektoren komponentenweise
9 Integration von Feldern: Kurven- und Flächenintegrale
225
r ) ein Vektor, dessen Komponenten
addiert werden, ist das Volumsintegral eines Vektorfeldes A(
die Volumsintegrale über die Komponenten des Feldes A sind:
 &

%
Ax (r)dV
V
&

r )dV = 
A(
(9.109)
 V Ay (r)dV  .
&
V
r )dV
V Az (
S eines
Ein Beispiel für ein solches Integral ergibt sich bei der Berechnung des Schwerpunktes R
Körpers mit Massenverteilung ρ(r):
&
rρ(r)dV
RS = &V
.
(9.110)
ρ(r)dV
V
Wir kehren nach diesem kurzen Einschub über vektorwertige Volumsintegrale zurück zum Integral
in Gleichung (9.108). Aus dem Abschnitt 8.2 über den Gradienten im Kapitel 8 kennen wir die
Produktregel
∇(ψϕ) = ϕ∇ψ + ψ∇ϕ.
Somit gilt
%
%
%
∇(ψϕ)dV −
ψ(r)∇ϕ(r )dV =
V
(9.111)
V
ϕ(r)∇ψ(r )dV.
(9.112)
V
Das erste Integral auf der rechten Seite dieser Gleichung kann wie folgt umgeformt werden. Für
r ) = aφ(r) mit einem konstanten Vektor a und einem Skalarfeld φ(r)
das spezielle Vektorfeld A(
folgt nämlich aus dem Satz von Gauß:
:
:
%
:
· df =
A
aφ(r ) · df = a ·
φ(r)df =
div (aφ(r))dV.
(9.113)
F (V )
F (V )
F (V )
V
Da aber
div (aφ(r))
=
=
folgt daraus
∂ax φ ∂ay φ ∂az φ
+
+
∂x
∂y
∂z
∂φ
∂φ
∂φ
ax
+ ay
+ az
= a · grad φ,
∂x
∂y
∂z
:
%
φ(r ) df = a ·
a ·
F (V )
grad φ dV.
(9.115)
V
Da dies für beliebige Vektoren a gilt, erhalten wir schließlich die Vektorgleichung:
%
%
:
φ(r) df =
grad φ dV =
∇φ dV.
F (V )
(9.114)
V
(9.116)
V
Während auf der linken Seite dieser Gleichung der Vektorcharakter des Integrals vom Flächenelement stammt, kommt er auf der rechten Seite vom Gradienten, der ja ein Vektor ist. Die obige
Gleichung ist der Gaußsche Integralsatz für skalare Felder.
Durch Anwendung dieses Satzes mit φ = ϕψ erhalten wir aus Gleichung (9.112)
%
:
%
ψ(r)∇ϕ(r ) dV =
ψ(r)ϕ(r) df −
ϕ(r)∇ψ(r) dV.
V
F (V )
(9.117)
V
Diese Gleichung ist analog zur partiellen Integration in einer Dimension (siehe auch Gleichung
(4.78) bzw. Gleichung (9.106)): die Ableitung wird von einer Funktion (ϕ) zur anderen (ψ) übergewälzt. Zusätzlich haben wir einen Oberﬂächenterm erhalten. Da dieser zusätzliche Term im Unterschied zum eindimensionalen Fall noch als Integral (wenn auch als Oberﬂächenintegral) dasteht,
226
9 Integration von Feldern: Kurven- und Flächenintegrale
ist der Ausdruck partielle (also teilweise) Integration hier wohl etwas übertrieben. Nichtsdestotrotz
kann Gleichung (9.117) in vielen Situationen sehr nützlich sein.
Falls auf der Oberﬂäche des Integrationsvolumens mindestens eine der skalaren Funktionen ϕ(r )
oder ψ(r ) verschwindet, nimmt (9.117) eine besonders einfache Form an. Dann verschwindet
nämlich das Oberﬂächenintegral und wir erhalten:
%
%
ψ(r)∇ϕ(r )dV = −
ϕ(r)∇ψ(r )dV.
(9.118)
V
V
Bei Anwendung dieses sehr praktischen Ausdrucks muss jedoch sorgfältig darauf geachtet werden,
dass entweder ϕ(r) oder ψ(r) auf der Oberﬂäche wirklich verschwindet.
Ein ähnliches Ergebnis erhalten wir, wenn wir die Produktregel für die Divergenz eines Produkts
aus einem Skalar- und einem Vektorfeld ausnutzen,
r )) = A
· ∇ϕ + ϕ∇ · A.
∇ · (ϕ(r)A(
Für das Volumsintegral
%
&
dV erhalten wir damit nämlich
ϕ∇ · A
%
%
· ∇ϕ dV.
A
ϕ∇ · A dV =
∇ · (ϕA) dV −
(9.119)
V
V
V
(9.120)
V
können wir nun mit Hilfe des Satzes von Gauß in
Das Volumsintegral über die Divergenz ∇ · (ϕA)
ein Oberﬂächenintegral verwandeln:
%
:
%
· ∇ϕ dV
dV =
· df −
A
(9.121)
ϕ∇ · A
ϕA
V
oder, äquivalent dazu,
F
%
V
:
V
%
· df −
ϕA
· ∇ϕ dV =
A
F
dV.
ϕ∇ · A
(9.122)
V
Falls das Oberﬂächenintegral verschwindet, wird dieser Ausdruck für die partielle Integration besonders einfach:
%
%
· ∇ϕ dV = −
dV.
A
ϕ∇ · A
(9.123)
V
V
Zwei weitere praktische Ausdrücke lassen sich aus dem Satz von Gauß ableiten. Diese sind als
Sätze von Green bekannt.
9.3.4
Die Sätze von Green
Gegeben seien zwei skalare Felder ψ und ϕ. Für diese Felder betrachten wir jetzt das Volumsintegral
%
(ϕ∆ψ − ψ∆ϕ)dV,
(9.124)
V
wobei ∆ = ∇ · ∇ der Laplace-Operator ist. Partielle Integration beider Terme mit Hilfe von
Gleichung (9.121) liefert
%
%
(ϕ∆ψ − ψ∆ϕ) dV =
(ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV
V
V
:
%
= (ϕ∇ψ − ψ∇ϕ) df − (∇ϕ · ∇ψ − ∇ψ · ∇ϕ) dV. (9.125)
F
V
Das Volumsintegral auf der rechten Seite verschwindet aber und wir erhalten
%
:
(ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV = (ϕ∇ψ − ψ∇ϕ) df.
V
F
(9.126)
9 Integration von Feldern: Kurven- und Flächenintegrale
227
Dies ist der 2. Satz von Green. (Diese Nomenklatur ist nicht ganz einheitlich. Die Sätze werden
oft unterschiedlich nummeriert.) Er wurde von George Green bewiesen, kann jedoch als Spezialfall
des Satzes von Gauß betrachtet werden.
ein
Der 1. Satz von Green ergibt sich aus Gleichung (9.121) für den Fall, dass das Vektorfeld A
Gradientenfeld ist: A = ∇ψ. Einsetzen in Gleichung (9.121) ergibt
:
%
%
ϕ∇ · ∇ψ dV =
ϕ∇ψ · df −
∇ϕ · ∇ψ dV
(9.127)
V
oder
F
:
%
%
ϕ∇ψ · df −
ϕ∆ψ dV =
V
V
F
∇ϕ · ∇ψ dV.
Weitere praktische Formeln, die man auf ähnliche Weise ableiten kann, sind:
%
%
:
× ∇ϕ dV =
dV +
× df,
A
ϕ∇ × A
ϕA
V
V
V
(9.129)
F
= ϕ∇ × A
+ ∇ϕ × A
beruht, und
was auf der Produktregel ∇ × (ϕA)
%
:
%
·∇×A
dV =
·∇×B
dV + (A
× B)
· df,
B
A
V
(9.128)
V
(9.130)
F
× B)
=B
·∇×A
−A
·∇×B
folgt.
was aus div (A
Beispiel:
Die Diﬀusion eines Teilchens im Raum (siehe Abb. 9.30) wird durch die Diﬀusionsgleichung
∂ρ
= D∆ρ
∂t
(9.131)
beschrieben, wobei ρ(r, t) die Wahrscheinlichkeit beschreibt, das Teilchen zum Zeitpunkt t am Ort
r = (x, y, z) zu ﬁnden unter der Bedingung, dass es zum Zeitpunkt t = 0 im Ursprung (r = 0) war.
Abbildung 9.30: Bahnkurve eines diﬀundierenden Teilchens in der Ebene.
Für t = 0 ist die Dichte ρ(r, t = 0) also durch eine δ-Funktion gegeben, da wir wissen, dass sich
das Teilchen genau im Usprung beﬁndet:
ρ(r, 0) = δ(r).
(9.132)
Da das Teilchen vom ursprünglichen Ort weg diﬀundiert, wird die Dichte ρ immer breiter. Aus Symmetriegründen verschwindet der mittlere Aufenthaltsort des Teilchens bei wiederholter Durchführung
des Diﬀusionsexperiments:
%
r = ρ(r)r dV = 0,
(9.133)
228
9 Integration von Feldern: Kurven- und Flächenintegrale
wobei die Dichte ρ(r) so deﬁniert ist, dass sie normiert ist. Das heißt
%
ρ(r) dV = 1.
Das mittlere Abweichungsquadrat
(9.134)
%
r 2 =
ρ(r, t)r 2 dV
(9.135)
ist jedoch von Null verschieden und wächst mit der Zeit. Um dieses zeitliche Anwachsen quantitativ
zu bestimmen, bilden wir die Ableitung von r 2 nach der Zeit:
%
d 2
∂
r =
ρ(r, t)r 2 dV.
(9.136)
dt
∂t
Indem wir die Diﬀusionsgleichung ausnutzen, erhalten wir dann:
%
d 2
r = D ∆ρ(r, t)r 2 dV
dt
%
= D ∇ · (∇ρ(r, t))r 2 dV.
(9.137)
Anwendung des 1. Greenschen Satzes (Gleichung (9.128)) ergibt:
%
:
%
2
2
r 2 ∇ρ(r, t) · df.
∆ρ(r, t)r dV = − ∇r · ∇ρ dV +
(9.138)
F
Im Unendlichen verschwindet jedoch ρ und auch ∇ρ für beliebige endliche Zeiten t. Deshalb erhalten
wir
%
%
(9.139)
∆ρ(r, t)r 2 dV = − ∇r 2 · ∇ρ dV.
Der Gradient von r 2 lässt sich leicht auswerten,
∇r 2 = 2r
und folglich gilt
(9.140)
%
%
∇r 2 · ∇ρ dV = 2
r · ∇ρ dV.
Nochmalige partielle Integration nach Gleichung (9.122) liefert
%
%
:
ρr · df.
r · ∇ρ dV = − ρ(∇ · r)dV +
(9.141)
(9.142)
F
Der Oberﬂächenterm verschwindet wieder und die Divergenz von r ist
∇ · r =
∂x ∂y ∂z
+
+
= 3.
∂x ∂y ∂z
&
Da ρ nach Voraussetzung normiert ist, ρ(r) = 1, gilt
%
%
ρ(∇ · r) dV = 3 ρ dV = 3
(9.143)
(9.144)
und wir erhalten schließlich
∂ 2
r = D · 2 · 3 = 6D.
∂t
(9.145)
r 2 = 6Dt.
(9.146)
Integration nach der Zeit ergibt
Dies ist die berühmte Einstein-Beziehung, der zufolge bei der Diﬀusion der mittlere quadratische
Abstand vom Ausgangspunkt linear mit der Zeit wächst.
9 Integration von Feldern: Kurven- und Flächenintegrale
9.4
229
Der Integralsatz von Stokes
Der Integralsatz von Stokes stellt einen Zusammenhang her zwischen dem Oberﬂächenintegral
des Wirbelfeldes eines Vektorfeldes und dem Kurvenintegral des Feldes entlang des Randes der
Oberﬂäche.
9.4.1
Integraldarstellung der Rotation
Wir haben in Abschnitt 9.1.4 gesehen, dass unter gewissen Umständen Kurvenintegrale über Vektorfelder vom Weg unabhängig sind (nämlich genau dann, wenn sich das Vektorfeld als Gradient
eines Skalarfeldes darstellen lässt). In diesem Fall verschwindet das Kurvenintegral über jede beliebige geschlossene Kurve C:
:
· dr = 0.
A
(9.147)
C
Es gibt jedoch auch Felder, für die
; das Kurvenintegral längs geschlossener Kurven, also die Zir · dr = 0. Solche Felder nennt man Wirbelfelder. So kann
kulation, nicht verschwindet, C A
ein ringförmiges elektrisches Feld E
erzeubeispielsweise ein zeitlich veränderliches Magnetfeld B
gen (siehe Abb. 9.31).
Unterschiedliche Integrationswege (etwa C1 , C2 und
Abbildung 9.31: Elektrisches Wirbelfeld E.
&
· dr.
C3 ) führen zu unterschiedlichen Wegintegralen C E
Wir bewegen in diesem elektrischen Feld nun eine Ladung vom Punkt P1 zum &Punkt P2 und
· dr längs
wollen dies auf 3 verschiedenen Wegen tun: C1 , C2 und C3 . Das Kurvenintegral C E
immer in Richtung des Weges zeigt und deshalb
des Weges C1 ist positiv, da das Vektorfeld E
· dr > 0 gilt. Das Kurvenintegral längs C2 hingegen ist negativ, da das Feld immer der
immer E
· dr < 0. Auf der Kurve C3 steht das Feld immer genau
Bewegungsrichtung entgegengesetzt ist, E
&
· dr
· dr = 0 und das Kurvenintegral
E
senkrecht auf die Bewegungsrichtung. Somit gilt E
C3
verschwindet. In diesem Fall wird keine Arbeit geleistet.
Da diese Kurvenintegrale nicht wegunabhängig sind, verschwindet die Zirkulation für dieses Vektorfeld im Allgemeinen nicht. Zum Beispiel ist
:
:
· dr > 0 und
· dr < 0.
E
E
(9.148)
C1 −C3
C2 −C1
Hier bezeichnet C1 − C3 den Weg, der aus C1 in Vorwärtsrichtung und C3 in Rückwärtsrichtung
besteht. Der Weg C2 − C1 ist auf analoge Weise deﬁniert. Oﬀensichtlich verschwinden Kurvenintegrale über geschlossene Kurven genau dann nicht, wenn das Vektorfeld geschlossene Feldlinien,
230
9 Integration von Feldern: Kurven- und Flächenintegrale
also Wirbel, besitzt. Wir haben aber in Kapitel 8 (Abschnitt 8.55) plausibel gemacht, dass die
als Maß für die lokale Wirbelstärke betrachtet werden kann. Wir wollen nun sehen,
Rotation ∇ × A
ob wir die Zirkulation über ein Vektorfeld, die ja ebenfalls von der Stärke der Wirbel abhängt, mit
der Rotation in Verbindung bringen können.
Abbildung 9.32: Die Umrandung des Flächenelements mit dem Flächenvektor ∆f besteht aus den
Kurvensegmenten C1 , C2 , C3 und C4 .
Dazu betrachten wir das Kurvenintegral über eine kleine geschlossene Kurve, die eine kleine Fläche
∆f mit Flächenvektor ∆f umrandet. Der Einfachheit halber nehmen wir an, dass die Fläche in
der xy-Ebene liegt, also ∆f in Richtung der z-Achse zeigt (siehe Abb. 9.32). Wir bezeichnen die
;
r ) · dr entlang der Umrandung
Umrandung dieses Rechtecks mit Cz . Das Kurvenintegral Cz A(
des Rechtecks besteht aus den vier Beiträgen entlang der Rechteckseiten. Zur Berechnung dieses
Integrals wollen wir annehmen, dass die Seiten des Rechtecks so kurz sind, dass sich der Feldvektor
r ) entlang der Kanten nicht ändert. Dann ist der Beitrag der Kante C1 gegeben durch
A(
∆y
A x, y −
, z · ∆r,
2
(9.149)
y − ∆y , z) der Feldvektor im Mittelwobei r = (x, y, z) der Mittelpunkt des Rechtecks ist und A(x,
2
punkt der Kante C1 . Die Verschiebung ∆r hat jedoch die Länge ∆x und die Richtung ex = (1, 0, 0).
Damit erhalten wir für den Beitrag der Rechteckseite C1 zum Integral
x, y − ∆y , z · ex ∆x = Ax x, y − ∆y , z ∆x.
A
2
2
(9.150)
Auf ähnliche Weise erhalten wir für den Beitrag entlang Kante C3
∆y
∆y
A x, y +
, z · ∆r = −Ax x, y +
, z ∆x.
2
2
(9.151)
Dabei haben wir berücksichtigt, dass das Kurvenelement ∆r für diese Kante in die negative xRichtung zeigt. Durch analoge Überlegungen erhalten wir die Beiträge der Kanten C2 und C4 zum
Kurvenintegral:
∆x
, y, z ∆y
Ay x +
2
C2 :
und
C4 :
∆x
, y, z ∆y.
−Ay x −
2
(9.152)
Durch Addition dieser vier Beiträge erhalten wir das Kurvenintegral längs der (geschlossenen)
Umrandung des Rechtecks:
∆y
∆y
A · dr = Ax x, y −
, z ∆x − Ax x, y +
, z ∆x
2
2
Cz
∆x
∆x
+ Ay x +
, y, z ∆y − Ay x −
, y, z ∆y.
2
2
:
(9.153)
9 Integration von Feldern: Kurven- und Flächenintegrale
231
Die Erweiterung der ersten beiden Terme der rechten Seite dieser Gleichung mit ∆y und der letzten
beiden Terme mit ∆x liefert
∆y
:
x,
y
−
,
z
−
A
,
z
Ax x, y + ∆y
x
2
2
· dr = −
∆x∆y
A
∆y
Cz
(9.154)
∆x
Ay x + ∆x
x
−
,
y,
z
−
A
,
y,
z
y
2
2
+
∆x∆y.
∆x
Im Limes kleiner ∆x und ∆y (also im Limes ∆f → 0) werden diese Diﬀerenzenquotienten zu
partiellen Ableitungen und wir erhalten nach Division durch ∆x∆y = ∆f
:
1
· dr = ∂Ay − ∂Ax .
lim
A
(9.155)
∆f →0 ∆f C
∂x
∂y
z
Die rechte Seite dieser Gleichung ist jedoch nichts anderes als die z-Komponente der Rotation


 
  ∂A
∂A
∂
z
− ∂zy
Ax
∂y
∂x

  ∂Ax
∂ ·
∂Az 
=
∇×A
(9.156)
 ∂y
  Ay  = 
 ∂z − ∂x 
∂Ay
∂Ax
∂
Az
∂x − ∂y
∂z
r ). Wir können also schreiben
des Vektorfeldes A(
:
1
· dr = (rot A)
z,
A
lim
∆f →0 ∆f C
z
(9.157)
mit (rot A)
z bezeichnet haben. Wenn wir unser
wobei wir die z-Komponente der Rotation rot A
kleines Rechteck nicht in die xy-Ebene sondern in die yz-Ebene oder in die xz-Ebene legen, erhalten
wir auf analoge Weise die x- beziehungsweise die y-Komponente der Rotation:
:
1
· dr = ∂Az − ∂Ay = (rot A)
x
A
(9.158)
lim
∆f →0 ∆f Cx
∂y
∂z
beziehungsweise
1
∆f →0 ∆f
:
lim
· dr = ∂Ax − ∂Az = (rot A)
y.
A
∂z
∂x
Cy
(9.159)
Für eine allgemein orientierte Fläche, deren Flächennormale in Richtung des Einheitsvektors n
zeigt,
∆f = |∆f| · n = ∆fn,
(9.160)
gilt
1
lim
∆f →0 ∆f
:
· dr = n · rot A
= n · ∇ × A.
A
(9.161)
C
Die Rotation ist also die Flächendichte der Zirkulation (Zirkulation pro Fläche), die auch als
;
· dr = rot A
· ∆f.
Wirbelstärke bezeichnet wird. Für eine kleine Fläche ∆f haben wir also C A
Dieser Ausdruck kann auch als Deﬁnition der Rotation eines Vektorfeldes aufgefasst werden, die
auch dann sinnvoll bleibt, wenn das Feld nicht diﬀerenzierbar ist.
9.4.2
Formulierung und Herleitung
r ) einen Zusammenhang zwischen dem
Der Stokessche Satz stellt für ein beliebiges Vektorfeld A(
Oberﬂächenintegral über eine im Allgemeinen gekrümmte Fläche F und dem Kurvenintegral längs
232
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.33: Die von der Kurve C umrandete Fläche F wird in kleine Facetten mit Flächenvektoren ∆fi zerlegt.
des Randes C dieser beliebig großen und beliebig geformten Fläche her (siehe Abb. 9.33). Wie
wir schon bei der Diskussion des Oberﬂächenintegrals gesehen haben, können wir die gesamte
Oberﬂäche F näherungsweise durch N ebene Teilﬂächen ∆fi mit Flächenvektoren ∆fi darstellen.
Wir bezeichnen die Umrandung des Flächenelements ∆fi mit Ci .
Wir bilden nun für ein kleines Flächenelement ∆f1 am Punkt r1 (siehe Abb. 9.34) das Kurvenintegral längs seiner Umrandung, das für eine kleine Fläche geschrieben werden kann als
:
· dr = rot A
· ∆f1 .
A
(9.162)
C1
Wir legen dann um einen benachbarten Punkt r2 eine weitere Fläche ∆f2 und zwar so, dass die
Flächen ∆f1 und ∆f2 einen Teil ihrer Berandung gemeinsam haben. Die Flächenvektoren ∆f1 und
∆f2 sind im Allgemeinen nicht parallel zueinander.
Abbildung 9.34: Zwei benachbarte Facetten mit Flächenvektoren ∆f1 und ∆f2 und Umrandungen
C1 und C2 .
Wenn wir die Linienintegrale entlang der beiden Kurven C1 und C2 addieren, heben sich die beiden
Beiträge des gemeinsamen Randteiles genau auf, weil dieser Teil von C1 und C2 in entgegengesetzter
Richtung umlaufen wird. Was übrig bleibt ist das Kurvenintegral über die Einhüllende C1+2 der
aus ∆f1 und ∆f2 bestehenden Gesamtﬂäche:
:
:
:
· dr.
A · dr +
A · dr =
A
(9.163)
C1
C2
C1+2
Andererseits gilt wegen Gleichung (9.162) aber auch
:
:
· dr +
· dr = rot A(
r1 ) · ∆f1 + rot A(
r2 ) · ∆f2
A
A
C1
und somit
(9.164)
C2
:
· dr = rot A(
r1 ) · ∆f1 + rot A(
r2 ) · ∆f2 .
A
(9.165)
C1+2
Wir können diese Prozedur durch Hinzufügen weiterer Facetten ∆fi nun wiederholen, bis die
gesamte Fläche F ausgefüllt ist. Bei jedem dieser Schritte bleibt beim Linienintegral nur jener Teil
übrig, der von der äußeren Berandung der Fläche stammt (siehe Abb. 9.35).
9 Integration von Feldern: Kurven- und Flächenintegrale
233
Abbildung 9.35: In der Summe der Kurvenintegrale über die Umrandungen der Teilﬂächen kürzen
sich alle Beiträge außer die, die vom äußeren Rand der Gesamtﬂäche stammen.
Die Summe aller Kurvenintegrale über die Umrandung Ci der Teilﬂächen wird also zum Kurvenintegral über die Einhüllende C1+2+···+N aller N Flächenelemente. Wir erhalten also
:
· dr =
ri ) · ∆fi .
A
rot A(
(9.166)
C1+2+···+N
i
Im Limes N → ∞, also für immer kleiner werdende Flächenelemente, strebt C1+···+N gegen die
Randkurve C der Fläche F und die Summe auf der rechten Seite wird zum Oberﬂächenintegral:
%
:
· dr =
· df.
A
rot A
(9.167)
C
F
Dies ist der Stokessche Integralsatz.
In Worten lautet der Stokessche Integralsatz:
r ) und eine Fläche F ist das Oberflächenintegral über das zugehörige WirFür ein Vektorfeld A(
belfeld gleich dem Kurvenintegral über das Vektorfeld längs der Berandung C der Fläche F .
Beispiel:
Als Beispiel für den Satz von Stokes berechnen wir das Ringintegral
;
C
· dr des Vektorfeldes
A


−3y

r) = 
A(
 3x 
1
(9.168)
längs eines Kreises in der xy-Ebene mit Mittelpunkt im Ursprung und Radius r (siehe Abb. 9.36).
Aus dem Satz von Stokes folgt, dass
:
%
· df,
rot A
· dr =
A
C
(9.169)
F
wobei F eine beliebige glatte Fläche ist, deren Rand der Kreis ist, längs dessen das Kurvenintegral
berechnet werden soll. Da die Fläche F beliebig ist, wählen wir einfach die ebene Kreisﬂäche. Das
Oberﬂächenelement ist demnach df = ez dxdy unabhängig vom Ort. Die Rotation des Vektorfeldes
ist
A
 
 
  

 
∂
−3y
0−0
0
−3y
∂x
 
  

  ∂  
(9.170)
rot  3x  =  ∂y
 ×  3x  =  0 − 0  =  0  .
1
∂
∂z
1
3+3
6
234
9 Integration von Feldern: Kurven- und Flächenintegrale
Abbildung 9.36: Flächenelement in einem Kreis in der Ebene. Die Flächenvektoren df stehen
normal auf die xy-Ebene.
Das Oberﬂächenintegral wird deshalb zu
%
F

  
0
0
   
rot A · df =
 0  ·  0  dxdy
x2 +y 2 ≤r 2
6
1
%%
dxdy = 6πr2 .
= 6
%%
(9.171)
x2 +y 2 ≤r 2
Natürlich hätten wir auch das Kurvenintegral direkt auswerten können. Für den Kreis bietet sich
die Parametrisierung


r cos t


mit 0 ≤ t ≤ 2π
(9.172)
r(t) =  r sin t 
0
an. Der Tangentenvektor ist folglich gegeben durch:


−r sin t
dr 

=  r cos t  .
dt
0
(9.173)
Das Kurvenintegral wird mit dieser Parametrisierung zu
 


:
%2π −3r sin t
−r sin t
 


· dr =
A
 3r cos t  ·  r cos t  dt
C
0
1
0
%2π
%2π
2
=
2
2
3r (sin t + cos t)dt = 3r
0
2
dt = 6r2 π.
(9.174)
0
Das Kurvenintegral ist in diesem Fall nicht viel schwerer zu berechnen als das Oberﬂächenintegral.
Aus dem Oberﬂächenintegral sehen wir aber, dass in diesem Fall für jede Kurve in der Ebene das
Integral nur von der Größe der eingeschlossenen Fläche abhängt.
9.4.3
Bedeutung
über
Aus dem Satz von Stokes folgt, dass das Oberﬂächenintegral eines Wirbelfeldes ∇ × A
eine geschlossene Oberﬂäche F verschwindet. Wir können uns nämlich vorstellen, dass eine geschlossene Fläche entsteht, wenn wir die Randkurve C wie bei einem Beutel auf einen Punkt
9 Integration von Feldern: Kurven- und Flächenintegrale
235
zusammenziehen (siehe Abb. 9.37). Die Länge des Randes ist dann 0 und somit verschwindet auch
das Kuvenintegral
:
· dr = 0.
A
(9.175)
C
Wegen des Satzes von Stokes muss deshalb auch das Oberﬂächenintegral
:
· df
rot A
(9.176)
F
über die geschlossene Oberﬂäche verschwinden.
Abbildung 9.37: Wenn sich die Umrandung C auf einen Punkt zusammenzieht, wird die Fläche F
zu einer geschlossenen Fläche.
Aus dem Satz von Stokes folgt weiters,
dass alle Flächen F1 , F2 , . . . mit demselben Rand C auch
&
· df liefern.
dasselbe Oberﬂächenintegral F rot A
Schließlich erlaubt es uns der Satz von Stokes, die Frage nach der Wegunabhängigkeit von
Kurvenintegralen noch einmal aufzugreifen. Wir haben ja schon früher gesehen, dass die Wegunabhängigkeit von Integralen äquivalent zum Verschwinden
von Kurvenintegralen längs geschlosse;
· dr = 0 für beliebige geschlossene Kurven gilt,
ner Kurven ist. Wenn wir nun annehmen, dass C A
muss dies auch für Kurven um sehr kleine Flächen gelten. Dann gilt jedoch
:
· dr = rot A
· df = 0.
A
(9.177)
C
Da dies gemäß Annahme für beliebige (aber sehr kleine) Flächen gelten muss, ﬁnden wir, dass die
Rotation verschwindet. Verschwindet also das Kurvenintegral für beliebige Kurven, verschwindet
auch die Rotation:
:
· dr = 0
= 0.
A
für alle geschlossenen Wege C ⇒ rot A
(9.178)
C
Umgekehrt folgt aus dem Stokesschen Satz, dass das Kurvenintegral längs geschlossener Kurven
verschwindet, wenn die Rotation gleich 0 ist:
:
%
· dr =
· df = 0.
A
rot A
(9.179)
C
F
= 0 eine sowohl notwendige als auch hinreichende Bedingung für die
Das heißt, dass rot A
Wegunabhängigkeit von Kurvenintegralen ist. Um festzustellen, ob Kurvenintegrale wegunabhängig
sind, genügt es also zu prüfen, ob die Rotation des Vektorfeldes verschwindet.
Zusammenfassend halten wir fest, dass folgende Aussagen äquivalent sind:
• Das Kurvenintegral
• Das Kurvenintegral
&
C
r ) · dr ist wegunabhängig.
A(
C
r ) · dr über jede geschlossene Kurve C verschwindet.
A(
;
236
9 Integration von Feldern: Kurven- und Flächenintegrale
der Gradient von φ ist, A
= grad φ.
• Es existiert ein skalares Feld φ, sodass das Vektorfeld A
konservativ.
Die Funktion φ wird Potential genannt und das Vektorfeld A
des Vektorfeldes A
verschwindet.
• Die Rotation rot A
(Die Frage, ob das Integrationsgebiet einfach zusammenhängend ist oder nicht, haben wir in allen
Überlegungen vernachlässigt. Der interessierte Leser sei in diesem Punkt auf die weiterführende
Literatur verwiesen.)
9.4.4
Das Vektorpotential
= 0, können wir ein Skalarfeld φ deﬁnieren, sodass dessen Gradient gleich dem VekFalls rot A
= grad φ. Es stellt sich nun die Frage (zum Beispiel im Zusammenhang mit
torfeld A ist: A
dessen Divergenz verschwindet (div B
= 0), als
magnetischen Feldern), ob wir auch ein Feld B,
Ableitung eines Feldes darstellen können.
Im Falle der Darstellung eines wirbelfreien Feldes als Gradientenfeld kann man von der Beobachtung ausgehen, dass die Rotation eines Gradientenfeldes verschwindet,
rot (grad φ) = 0.
(9.180)
als Gradient eines Skalarfeldes ausgeDies legt die Vermutung nahe, dass ein wirbelfreies Feld E
drückt werden kann. Wie wir ja jetzt wissen, kann man das tatsächlich tun. Nun gibt es die analoge
Identität
= 0,
div (rot A)
(9.181)
die besagt, dass Wirbelfelder quellenfrei sind. Ganz analog zum obigen Fall scheint dieses Ergebnis
(div B
= 0) als Rotation eines anderen
die Vermutung nahe zu legen, dass ein quellenfreies Feld B
geschrieben werden könnte: B
= rot A.
Diese Vermutung kann durch explizite KonVektorfeldes A
für ein quellenfreies Feld B
bestätigt werden. Ein solches Vektorfeld
struktion eines Vektorfeldes A
wird Vektorpotential genannt.
A
= rot A,
muss für die Komponenten von A
gelten:
Falls B
Bx =
∂Az
∂Ay
−
,
∂y
∂z
By =
∂Ax
∂Az
−
,
∂z
∂x
Bz =
∂Ay
∂Ax
−
.
∂x
∂y
(9.182)
den Gradienten einer skalaren Funktion χ addieren können,
Da wir zu jedem Vektorpotential A
ohne die Beziehung B = rot A zu stören,
+ grad χ),
= rot A
= rot A
+ rot (grad χ) = rot (A
B
(9.183)
=0
eine gewisse Freiheit. Um A
eindeutig zu bestimmen, müssen noch
haben wir in der Wahl von A
Nebenbedingungen gewählt werden. Man nennt dies die Eichung von A.
Wir nutzen nun diese Eichmöglichkeit und versuchen den Ansatz Az = 0. Dann haben wir
Bx = −
∂Ay
∂z
und By =
∂Ax
.
∂z
(9.184)
Integration nach z liefert:
%z
Ay = −
za
Bx (x, y, z )dz (9.185)
9 Integration von Feldern: Kurven- und Flächenintegrale
237
und
%z
Ax =
By (x, y, z )dz + f (x, y).
(9.186)
za
Hier ist f (x, y) eine Integrationskonstante, auf die wir für Ay wegen der Eichmöglichkeit verzichtet
haben. Um die dritte Gleichung zu lösen, setzen wir Ax und Ay ein und erhalten:
Bz
=
=
∂Ax
∂Ay
−
∂x
∂y
%z
%z
∂Bx
∂By
∂f
−
(x, y, z )dz −
(x, y, z )dz −
∂x
∂y
∂y
za
%z
=
−
za
#
$
∂Bx
∂By
∂f
(x, y, z ) +
(x, y, z ) dz −
.
∂x
∂y
∂y
(9.187)
za
quellenfrei ist. Demnach gilt:
Wir wissen aber, dass B
= ∂Bx + ∂By + ∂Bz = 0
div B
∂x
∂y
∂z
(9.188)
∂Bx
∂By
∂Bz
+
=−
.
∂x
∂y
∂z
(9.189)
und somit
Wenn wir dieses Ergebnis in Gleichung (9.187) einsetzen, ergibt sich
%z #
Bz (x, y, z) =
$
∂Bz
∂f
.
(x, y, z ) dz −
∂z
∂y
(9.190)
za
Wir können das Integral ausführen und erhalten
∂f
y,
y,
(x,
z) = (x,
z) − Bz (x, y, za ) −
Bz
.
Bz
∂y
(9.191)
∂f
= −Bz (x, y, za ).
∂y
(9.192)
Das heißt,
Integration liefert schließlich:
%y
f (x, y) = −
Bz (x, y , za )dy .
(9.193)
ya
Somit ist folgendes Feld ein Vektorpotential für B:
%z
%y
By (x, y, z )dz −
Ax (x, y, z) =
za
Bz (x, y , za )dy ,
(9.194)
ya
%z
Ay (x, y, z) =
−
Bx (x, y, z )dz ,
(9.195)
za
Az (x, y, z) =
0.
(9.196)
impliziert also die Existenz eines Vektorpotentials A,
sodass
Die Quellenfreiheit eines Feldes B
B = rot A.
238
9 Integration von Feldern: Kurven- und Flächenintegrale
Kapitel 10
Diﬀerentialgleichungen
10.1
Grundbegriﬀe
Beziehungen zwischen Variablen werden in der Physik oft durch Gleichungen beschrieben, welche
Ableitungen enthalten. Ein Beispiel für eine solche Gleichung ist die Newtonsche Bewegungsgleichung
2
d r
F = ma = m 2 ,
dt
(10.1)
welche die Dynamik eines Objektes der Masse m unter Einwirkung der Kraft F beschreibt. Die
Kraft F , die auf den Körper wirkt, kann konstant oder eine Funktion des Ortes sein. Durch Lösung
dieser Gleichung erhält man den Ort r(t) des Objekts als Funktion der Zeit. Die Lösung der
Gleichung F = mr¨ ist also keine Zahl sondern eine Funktion.
Eine Gleichung, die eine oder mehrere Ableitungen einer gesuchten Funktion y(x) enthält, nennt
man eine Diﬀerentialgleichung. Wenn die höchste Ableitung von y(x), die in der Gleichung
auftritt, die n-te Ableitung y (n) (x) ist, hat man es mit einer Diﬀerentialgleichung n-ter Ordnung zu tun. Natürlich kann eine Diﬀerentialgleichung n-ter Ordnung auch Ableitungen niedrigerer Ordnung beinhalten sowie von der Funktion y(x) selbst und der Variablen x abhängen. Eine
Diﬀerentialgleichung, bei der die Funktion y(x) nur von einer einzigen Variablen x und den Ableitungen dieser Funktion nach x abhängt, nennt man eine gewöhnliche Diﬀerentialgleichung. Im
Gegensatz dazu ist eine partielle Diﬀerentialgleichung eine Bestimmungsgleichung für eine Funktion y(x1 , x2 , . . . , xn ), die von mehreren Variablen und den partiellen Ableitungen der Funktion
abhängt. Auch in diesem Fall bezieht sich die Ordnung der Gleichung auf die höchste vorkommende
partielle Ableitung.
Die allgemeine Form einer gewöhnlichen Diﬀerentialgleichung für die Funktion y(x) ist:
F (x, y, y , y , y , . . . , y (n) ) = 0.
(10.2)
Hier haben wir die Diﬀerentialgleichung in impliziter Form dargestellt. Falls wir sie nach der
höchsten Ableitung auﬂösen können, ergibt sich in expliziter Form
y (n) = f (x, y, . . . , y (n−1) ).
(10.3)
Beispiele für gewöhnliche Diﬀerentialgleichungen sind
y + y = 0,
(y )2 + xy = 0,
(10.4)
(10.5)
sin x · y + y 2 = 0.
(10.6)
239
240
10 Diﬀerentialgleichungen
Eine Funktion y(x) bezeichnen wir als Lösung einer gegebenen Diﬀerentialgleichung, falls y(x)
diese Gleichung erfüllt. Eine Funktion, die die Diﬀerentialgleichung löst, wird auch ein Integral
der Diﬀerentialgleichung genannt und das Finden einer solchen Lösung wird auch Integrieren
genannt.
Betrachten wir zum Beispiel die Diﬀerentialgleichung
y = −y.
(10.7)
Da für die Funktion y(x) = sin x gilt, dass y = cos x und y = − sin x = −y, ist y = sin x eine
Lösung dieser Diﬀerentialgleichung. Es gibt für diese Diﬀerentialgleichung jedoch mehr als eine
Lösung. So wird sie auch von y = 3 sin x oder allgemeiner von y = A sin x erfüllt. Weiters ist
die Funktion y(x) = cos x wegen y = − sin x und y = − cos x = −y eine Lösung. Genauso löst
y = 7 cos x oder allgemeiner y = B cos x die Gleichung. Aus den beiden Lösungen A sin x und
B cos x können wir durch Addition eine allgemeine Lösung konstruieren:
y(x) = A sin x + B cos x.
(10.8)
Für beliebige Konstanten A und B löst y(x) die Diﬀerentialgleichung y = −y. Die Diﬀerentialgleichung hat also eine unendliche Anzahl von Lösungen. Da A und B beliebig gewählt werden
können, sprechen wir hier von einer zweiparametrigen Lösungsschar. Für eine Diﬀerentialgleichung n-ter Ordnung hat eine solche allgemeine Lösung n frei wählbare Parameter.
Durch zusätzliche Bedingungen, welche die Werte der Parameter festsetzen, erhält man aus der
allgemeinen Lösung eine Partikulärlösung (oder spezielle Lösung). Wenn man beispielsweise
weiß, dass für das obige Beispiel y am Ort x = 0 den Wert 0 besitzt, folgt:
y(0) = A sin(0) +B cos(0) = B = 0.
=0
(10.9)
=1
Der Wert der ersten Ableitung am Ort x = 0 legt dann auch noch den Parameter A fest
y (0) = A cos(0) −B sin(0) = A.
=1
(10.10)
=0
Wenn wir zum Beispiel wissen, dass y (0) = 1 ist, folgt A = 1. Die so genannten Anfangsbedingungen y(0) = 0 und y (0) = 1 legen also die Parameter A = 1 und B = 0 fest und führen so auf
die Partikulärlösung
y(x) = sin x.
(10.11)
Für eine allgemeine Lösung y(x) einer Diﬀerentialgleichung n-ter Ordnung werden die n Parameter
durch Angabe des Funktionswertes y(x0 ) und der Werte der (n − 1) Ableitungen y (x0 ), y (x0 ),
. . . , y (n−1) (x0 ) an einer Stelle x0 festgelegt. In diesem Fall spricht man von einem Anfangswertproblem oder einer Anfangswertaufgabe. Diese Bezeichnungsweise stammt natürlich von der
Betrachtung einer Variablen y(t) als Funktion der Zeit t. Die Anfangsbedingungen y(t0 ), y (t0 ),
. . . , y (n−1) (t0 ) beschreiben den Zustand des Systems zum Zeitpunkt t0 . Die Partikulärlösung beschreibt dann die zeitliche Entwicklung des Systems ausgehend von diesen Anfangsbedingungen.
Alternativ dazu können wir die Parameter der allgemeinen Lösung auch durch Angabe der Funktionswerte y(x) an n verschiedenen Stellen x1 , x2 , . . . , xn festlegen. Die Funktionswerte an diesen
Stellen werden Randwerte oder Randbedingungen genannt und man spricht in diesem Fall von
einem Randwertproblem oder einer Randwertaufgabe.
Im obigen Beispiel können wir etwa verlangen, dass y(x) an den Stellen x1 = 0 und x2 = π/2 die
Werte y(x1 = 0) = 0 und y(x2 = π/2) = 2 besitzt. Diese Randbedingungen können wir durch
10 Diﬀerentialgleichungen
241
Wahl der Parameter A und B erfüllen:
A sin(0) +B cos(0) = 0
=0
⇒
B = 0,
(10.12)
⇒
A = 2.
(10.13)
=1
A sin( π2 ) +B cos( π2 ) = 2
=1
=0
Die Partikulärlösung unter diesen Randbedingungen ist also
y(x) = 2 sin x.
(10.14)
Zur analytischen Lösung von Diﬀerentialgleichungen gibt es kein allgemein gültiges Rezept. Es gibt
aber einige wichtige gewöhnliche Diﬀerentialgleichungen, die wir lösen können. Diese Diﬀerentialgleichungen wollen wir im Folgenden diskutieren. Falls für eine gewöhnliche Diﬀerentialgleichung
keine analytische Lösung existiert, kann man numerische Methoden verwenden, um Lösungen
mit beliebiger Genauigkeit zu erhalten. Zur numerischen Integration von Diﬀerentialgleichungen existiert eine Vielzahl von Methoden, bei denen die Diﬀerentialgleichungen üblicherweise in
kleinen Schritten gelöst werden.
10.2
Diﬀerentialgleichungen erster Ordnung
Diﬀerentialgleichungen erster Ordnung enthalten nur die gesuchte Funktion y(x) selbst und ihre
erste Ableitung y (x):
F (x, y, y ) = 0
(10.15)
y = f (x, y).
(10.16)
oder nach y aufgelöst
Beispiele dafür sind
y = xy,
sin(y + x) cos y = x
und
y =
√
y.
(10.17)
In dieser Form gibt die Diﬀerentialgleichung für jeden Punkt in der xy-Ebene eine Richtung (Steigung) vor. Damit y(x) eine Lösung der Diﬀerentialgleichung ist, muss ihr Graph diesen Richtungen
in jedem Punkt folgen (siehe Abb. 10.1). Anschaulich ist klar, dass das Richtungsfeld y = f (x, y)
für eine bestimmte Anfangsbedingung (x0 , y0 ) die Lösung der Diﬀerentialgleichung eindeutig festlegt.
Im einfachsten Fall hängt die rechte Seite der Gleichung nicht von y ab und wir erhalten die
Diﬀerentialgleichung
y = f (x)
oder
dy
= f (x).
dx
(10.18)
Diese Diﬀerentialgleichung ist uns schon früher begegnet (im Kapitel über die Integration), nur
haben wir sie damals nicht als Diﬀerentialgleichung bezeichnet. Das Auﬃnden einer Funktion y(x),
sodass ihre Ableitung dy/dx gleich einer gegebenen Funktion f (x) ist, ist nämlich die Hauptaufgabe
der Integralrechnung: Finde eine Funktion F (x) (die so genannte Stammfunktion), sodass für ihre
Ableitung F (x) = f (x) gilt. Die Lösung y(x) der Diﬀerentialgleichung (10.18) ist nichts anderes
als die Stammfunktion von f (x). Daher lautet die allgemeine Lösung der Diﬀerentialgleichung
(10.18)
%
y(x) = f (x)dx + C,
(10.19)
wobei hier
&
f (x)dx das unbestimmte Integral ist, das von der Variablen x abhängt.
242
10 Diﬀerentialgleichungen
Abbildung 10.1: Eine Diﬀerentialgleichung der Form y = f (x, y) gibt an jedem Punkt (x, y) die
Steigung y vor. Die Lösungen der Diﬀerentialgleichung müssen tangential zu diesem Richtungsfeld
sein. Durch Angabe der Anfangsbedingungen (x0 , y0 ) wählt man aus der Schar der möglichen
Lösungen eine bestimmte Lösung aus.
Die Integrationskonstante C ist hier der freie Parameter, der erst durch die Wahl der Anfangsbedingung (oder Randbedingung) festgelegt wird. Betrachten wir zum Beispiel die Diﬀerentialgleichung
dy
= x.
dx
(10.20)
Die allgemeine Lösung dieser Gleichung ist y(x) = x2 /2 + C. Durch Ableitung von y(x) = x2 /2 + C
nach x können wir explizit überprüfen, dass diese Funktion die Diﬀerentialgleichung tatsächlich
erfüllt. Die Randbedingung y(0) = 1 legt die Konstante C fest:
02
+C =1
2
⇒
C = 1.
(10.21)
Eine gewöhnliche Diﬀerentialgleichung erster Ordnung hat auch im allgemeinen Fall eine Lösungsschar, die einen freien Parameter c besitzt: y = y(x, c). Um diesen freien Parameter c festzusetzen,
genügt für die Diﬀerentialgleichung erster Ordnung eine einzelne Anfangs- oder Randbedingung.
Im Folgenden werden wir einige Diﬀerentialgleichungen erster Ordnung behandeln, die einfach
genug sind, dass wir sie leicht analytisch lösen können.
10.2.1
Diﬀerentialgleichungen mit separierbaren Variablen
Wenn sich eine Diﬀerentialgleichung erster Ordnung in der Form
dy
= f (x)g(y)
dx
(10.22)
schreiben lässt, können wir sie auf einfache Weise lösen. Da die rechte Seite ein Produkt von zwei
Funktionen ist, deren eine nur von x und die andere nur von y abhängt, können wir die Gleichung
in der Form
dy
= f (x)dx
g(y)
(10.23)
schreiben. Dabei haben wir die ursprüngliche Gleichung so umgeformt, dass die rechte Seite nur von
y abhängt und die linke Seite nur von x. Wir haben die Variablen also separiert (d.h. getrennt).
10 Diﬀerentialgleichungen
243
Aus diesem Grund bezeichnet man Diﬀerentialgleichungen der Form y = f (x)g(y) als Diﬀerentialgleichung mit separierbaren Variablen. Aus dieser Gleichung für die beiden Diﬀerentiale folgt, dass
sich die zugehörigen unbestimmten Integrale nur um eine willkürliche Konstante C unterscheiden
können:
%
%
dy
= f (x)dx + C.
(10.24)
g(y)
Nach Integration beider Seiten und Auﬂösung der Gleichung nach y erhält man die allgemeine
Lösung der Diﬀerentialgleichung mit dem freien Parameter C in expliziter Form. Falls sich die
erhaltene Gleichung nicht nach y auﬂösen lässt, ist die Lösung in impliziter Form gegeben.
Mathematisch etwas exakter lassen sich Diﬀerentialgleichungen mit separierbaren Variablen wie
folgt behandeln. Zunächst bestimmen wir die Nullstellen y1 , y2 , . . . der Funktion g(y). Durch
Einsetzen in die Diﬀerentialgleichung erkennen wir, dass die konstanten Funktionen y(x) = y1 ,
y(x) = y2 , etc. Lösungen sind.
Als nächstes betrachten wir die Diﬀerentialgleichung in den nullstellenfreien Intervallen zwischen
den Nullstellen. Da in diesen Intervallen g(y) = 0, können wir die Diﬀerentialgleichung umformen
zu:
y
= f (x).
(10.25)
g(y)
Wir deﬁnieren nun die Funktion Φ(y) als die Stammfunktion von 1/g(y) und die Funktion F (x)
als die Stammfunktion von f (x). Da in den betrachteten Intervallen Φ (x) = 1/g(x) nullstellenfrei
ist, d. h. Φ streng monoton fallend oder wachsend ist, existiert hier die Umkehrfunktion Φ−1 von
Φ. Durch Einsetzen in die Diﬀerentialgleichung können wir veriﬁzieren, dass
y(x) = Φ−1 (F (x) + C)
(10.26)
die Diﬀerentialgleichung löst:
y (x)
=
=
(Φ−1 ) (F (x) + C)F (x)
f (x)
f (x)
= = f (x)g(y),
Φ (Φ−1 (F (x) + C))
Φ (y)
(10.27)
wobei wir die Diﬀerentiationsregel (3.26) für die Umkehrfunktion verwendet haben. C ist hier
wieder eine beliebige Integrationskonstante, die durch Wahl der Anfangsbedingungen festgelegt
wird.
Beispiel:
Gegeben sei die Diﬀerentialgleichung xy + y = 0. Wir können diese Gleichung umformen zu
dy
dx
=− .
y
x
(10.28)
ln y = − ln x + C.
(10.29)
Integration auf beiden Seiten ergibt:
Wir wenden nun auf beide Seiten der Gleichung die Exponentialfunktion an und erhalten
eln y = e− ln x+C = e− ln x · eC .
(10.30)
Somit gilt
y=
α
,
x
(10.31)
244
10 Diﬀerentialgleichungen
wobei wir die Konstante eC in α umbenannt haben. Die allgemeine Lösung ist also die einparametrige Kurvenschar y = α/x. Eine Anfangsbedingung (z. B. y(1) = α/1 = 2) setzt den freien
Parameter fest (hier auf α = 2).
Beispiel: Barometrische Höhenformel
Als weiteres Beispiel wollen wir die Abhängigkeit des Luftdrucks von der Höhe in einer isothermen
Atmosphäre betrachten. Dazu müssen wir zunächst eine geeignete Diﬀerentialgleichung aufstellen
und sie danach auch lösen. (In den meisten Fällen ist das Aufstellen einer Gleichung der einfachere
Schritt als die anschließende Lösung der Gleichung.)
Der Luftdruck an einem bestimmten Ort wird durch das Gewicht der Luftsäule bestimmt, die
sich über diesem Ort beﬁndet. Wenn wir uns nach oben bewegen, wird die Luftmenge, die auf
einer bestimmten Fläche lastet, immer kleiner. Daher nimmt der Luftdruck mit der Höhe ab. Um
herauszuﬁnden, auf welche Weise der Luftdruck von der Höhe abhängt, betrachten wir eine dünne
Luftschicht, die parallel zum Boden ist und sich in der Höhe z beﬁndet (siehe Abb. 10.2). (Wir
messen die Höhe z bezüglich des Bodens, den wir in die xy-Ebene legen.)
Abbildung 10.2: Der Druck an der Oberseite der Luftschicht mit der Dicke dz unterscheidet sich
vom Druck an der Unterseite um das Gewicht pro Flächeneinheit der Luftschicht selbst.
An der Unterseite dieser Schicht, also bei der Höhe z, herrscht der Druck p(z). Auf ihrer Oberseite
ist der Druck leicht verschieden: p(z + dz) = p(z) + dp. Wir stellen uns jetzt vor, dass wir aus dieser
Schicht einen dünnen Quader mit der Grundﬂäche A herausschneiden. Dieser Quader enthält die
Masse ρ(z)dV = ρ(z)Adz an Luft, wobei hier dV = Adz das Volumen des Quaders ist. Der
Druckunterschied zwischen der Höhe z und z + dz ist auf das Gewicht der Luftmassen in dieser
Schicht zurückzuführen. Das Gewicht gρ(z)Adz der Luft im Quader wirkt auf die Fläche A. Die
Druckdiﬀerenz dp ergibt sich aus dieser Kraft dividiert durch die Fläche A (Druck ist Kraft pro
Fläche):
dp = −
gρ(z)Adz
= −gρ(z)dz.
A
(10.32)
Das negative Vorzeichen ist notwendig, weil der Druck mit der Höhe abnimmt.
Wir benötigen jetzt noch einen Ausdruck für die Dichte ρ der Luft. Die Dichte eines Gases hängt
natürlich von den äußeren Bedingungen wie Temperatur und Druck ab. Wir nehmen hier an, dass
wir die Luft als ideales Gas behandeln können. Für ein ideales Gas wird der Zusammenhang
zwischen Druck p, Volumen V und Temperatur T durch die Zustandsgleichung
pV = N kB T
(10.33)
beschrieben. Dabei ist N die Anzahl der Gasmoleküle und kB ist die so genannte Boltzmannkonstante. Der Druck eines idealen Gases ist demnach gegeben durch:
p=
N kB T
.
V
(10.34)
10 Diﬀerentialgleichungen
245
Die rechte Seite dieser Gleichung hängt von der Teilchendichte N/V ab. Da wir jedoch an der
Abhängigkeit des Druckes von der Massendichte ρ = M/V interessiert sind (M ist hier die
Gesamtmasse des Gases im Volumen V ), multiplizieren wir Zähler und Nenner auf der rechten
Seite der obigen Gleichung mit der Masse m eines individuellen Gasteilchens:
p=
M kB T
kB T
N mkB T
=
=ρ
.
Vm
V m
m
(10.35)
Hier haben wir ausgenutzt, dass die Gesamtmasse M gleich der Masse m einzelner Teilchen multipliziert mit der Anzahl N der Teilchen ist. Wir können die Dichte ρ somit ausdrücken als
ρ=
pm
.
kB T
(10.36)
Diese Beziehung setzen wir nun in Gleichung (10.32) ein und erhalten
dp = −gρdz = −
gm
pdz.
kB T
(10.37)
Diese Gleichung haben wir mit Hilfe von physikalischen Überlegungen aufgestellt. Was nun folgt
ist die mathematische Lösung dieser Gleichung.
Wir können die Variablen p und z separieren:
dp
gm
=−
dz.
p
kB T
(10.38)
Integration ergibt (unter der Annahme einer isothermen Atmosphäre, das heißt unter der Annahme,
dass die Temperatur T nicht von der Höhe z abhängt und somit gm/kB T konstant ist):
ln p = −
gm
z+C
kB T
oder durch Anwendung der Exponentialfunktion auf beiden Seiten:
7
6
gm
z exp{C}.
p = exp −
kB T
(10.39)
(10.40)
Die Konstante K ≡ exp{C} ermitteln wir, indem wir verlangen, dass bei z = 0 der Druck einen
bestimmten p0 Wert annehmen muss:
7
6
gm
0 exp{C} = exp{C} = p0 .
(10.41)
p(0) = exp −
kB T
Somit erhalten wir schließlich die barometrische Höhenformel:
6
7
gm
p = p0 exp −
z .
kB T
(10.42)
Beispiel: Kompression eines idealen Gases
Stellen wir uns ein Rohr mit der Querschnittsﬂäche A vor, das auf einer Seite von einem beweglichen
Kolben und auf der anderen Seite von einer unbeweglichen Wand abgeschlossen wird (siehe Abb.
10.3).
Das eingeschlossene Volumen sei mit einem idealen Gas gefüllt, das der Zustandsgleichung
pV = N kB T
(10.43)
gehorcht. Da im Gas ein gewisser Druck p vorherrscht, wirkt auf den Kolben eine Kraft F = Ap,
die den Kolben nach außen drückt. Wenn wir das Gas nun komprimieren wollen, indem wir den
246
10 Diﬀerentialgleichungen
Abbildung 10.3: Ein beweglicher Kolben leistet Arbeit gegen den Druck eines Gases in einem
Zylinder.
Kolben in das Rohr schieben, verrichten wir gegen diese Kraft Arbeit. Wir wollen bestimmen,
welche Arbeit aufgebracht werden muss, um das Volumen von seinem ursprünglichen Wert V0 auf
ein kleineres Volumen zu verringern. Dazu betrachten wir zunächst die Arbeit dW , die geleistet
wird, wenn wir den Abstand x des Kolbens von der ﬁxen Wand um einen kleinen Betrag dx
verringern. Diese kleine Arbeit dW ergibt sich aus dem Produkt von Weg und Kraft
dW = −F dx = −pAdx.
(10.44)
Bei einer Kompression ist die Verschiebung dx negativ. Da die gegen die (positive) Kraft F geleistete Arbeit jedoch positiv sein soll, haben wir in der obigen Gleichung ein negatives Vorzeichen.
Durch die Verschiebung des Kolbens ändert sich das eingeschlossene Volumen um
dV = Adx.
(10.45)
Wir können daher in Gleichung (10.44) Adx durch dV ersetzen:
dW = −pdV.
(10.46)
Da sich durch die Kompression nicht nur das Volumen verändert sondern auch der Druck, müssen
wir nun den Druck p als Funktion des Volumens V ausdrücken. Aus der Zustandsgleichung des
idealen Gases folgt:
p=
N kB T
.
V
(10.47)
Einsetzen in Gleichung (10.46) ergibt:
N kB T
dV.
(10.48)
V
Wenn wir die Kompression isotherm durchführen, das heißt, wenn die Temperatur des Gases
durch Kontakt des Rohres mit einem Wärmebad konstant gehalten wird (dazu muss die Rohrwand natürlich wärmeleitend sein), ergibt die Integration:
dW = −
W = −N kB T ln V + C.
(10.49)
Dies ist die allgemeine Lösung der Diﬀerentialgleichung. Um eine passende Partikulärlösung zu
erhalten, bemerken wir, dass zu Beginn des Prozesses noch keine Arbeit geleistet wurde. Wir
verlangen also
W (V0 ) = −N kB T ln V0 + C = 0.
(10.50)
Somit erhalten wir für die Konstante C:
C = N kB T ln V0 .
Die geleistete Arbeit ist demnach gegeben durch:
W = N kB T ln V0 − N kB T ln V = N kB T ln
(10.51)
V0
V
.
(10.52)
10 Diﬀerentialgleichungen
10.2.2
247
Homogene lineare Diﬀerentialgleichung
Eine allgemeine Diﬀerentialgleichung n-ter Ordnung F (x, y, y , y , . . . , y (n) ) nennt man linear,
wenn die Funktion y und alle ihre n Ableitungen maximal in der 1. Potenz und nicht als Produkt
auftreten:
n
ai (x)y (i) = g(x),
(10.53)
i=0
wobei wir hier die Konvention benutzen, dass y (0) = y.
Beispiele für lineare Diﬀerentialgleichungen sind:
y + ay + by = 0,
y + sin x = 0,
(10.54)
(10.55)
y + xy − cos x = 0.
(10.56)
Hingegen sind die folgenden Diﬀerentialgleichungen nichtlinear:
y 2 + y = 0
xy y = 0
(zweite Potenz),
(Produkt).
(10.57)
(10.58)
Eine lineare Diﬀerentialgleichung 1. Ordnung hat die allgemeine Form
y + f (x)y = g(x).
(10.59)
Die Funktion g(x) wird als Störterm oder Störfunktion bezeichnet. Falls der Störterm fehlt,
haben wir es mit einer homogenen Diﬀerentialgleichung zu tun; falls ein Störterm existiert, nennt
man die Diﬀerentialgleichung inhomogen.
Die allgemeine homogene lineare Diﬀerentialgleichung 1. Ordnung hat die Form
y + f (x)y = 0.
(10.60)
Diese Gleichung können wir durch Trennung der Variablen lösen:
dy
= −f (x)dx.
y
(10.61)
Integration ergibt die allgemeine Lösung
%
ln y = −
f (x)dx + C
(10.62)
oder anders ausgedrückt
6 %
7
6 %
7
y = exp − f (x)dx exp{C} = K exp − f (x)dx ,
(10.63)
wobei wir die Konstante exp{C} in K umbenannt haben.
Beispiel: Radioaktiver Zerfall
Durch radioaktiven Zerfall können sich Atomkerne in andere Typen verwandeln. Wir wollen nun
untersuchen, wie sich durch radioaktiven Zerfall die Anzahl der Atome der Ausgangssubstanz in
einer radioaktiven Substanz mit der Zeit ändert. Da der Zerfall eines Atoms unabhängig von den
Zerfällen der anderen Atome ist, zerfallen in einer doppelt so großen Menge von Atomen auch
248
10 Diﬀerentialgleichungen
doppelt so viele Atome. Die Zahl dN der in einem kurzen Zeitintervall dt in einer radioaktiven
Substanz zerfallenden Atome ist somit proportional zur Gesamtzahl N der vorhandenen Atome:
dN = −λN dt.
(10.64)
Wir wählen hier ein negatives Vorzeichen, weil durch jeden Zerfall die Anzahl N der noch nicht zerfallenen Atome abnimmt. Die Proportionalitätskonstate λ, die Zerfallskonstante genannt wird,
hängt vom Atomtyp ab. λ besitzt die Dimension 1/Zeit. Durch Separation der Variablen erhalten
wir
dN
= −λdt.
(10.65)
N
Integration liefert
ln N = −λt + C
(10.66)
N (t) = e−λt+C = Ke−λt .
(10.67)
oder
Die Randbedingung N (0) = N0 (Atomanzahl zum Zeitpunkt t = 0) setzt die Konstante K fest:
N (0) = Ke−λ0 = K = N0 .
(10.68)
Das Zerfallsgesetz lautet also
N (t) = N0 e−λt .
(10.69)
Die Anzahl der noch nicht zerfallenen Atome nimmt demnach exponentiell mit der Zeit ab (siehe
Abb. 10.4). Nach der Zeit τ1/2 = ln 2/λ ist noch die Hälfte der ursprünglich vorhandenen Atome
übrig. Man nennt diese Zeit die Halbwertszeit.
Abbildung 10.4: Die Anzahl der noch nicht zerfallenen Atome einer radioaktiven Substanz nimmt
mit der Zeit exponentiell ab. Nach der Halbwertszeit τ1/2 sind nur noch die Hälfte der Atome übrig.
Beispiel: Exponentielles Wachstum
Betrachten wir eine Population von Individuen, die sich vermehren können (z.B Bakterien in einer Nährlösung). Falls die Ressourcen nicht knapp sind, ist die Zunahme der Individuenanzahl
proportional zur Individuenanzahl selbst:
dN = λN dt.
(10.70)
Die Proportionalitätskonstante λ ist die Vermehrungsrate. Die Diﬀerentialgleichung (10.70) unterscheidet sich nur im Vorzeichen vor der Proportionalitätskonstanten von der Diﬀerentialgleichung (10.64) im vorherigen Beispiel. Derselbe Lösungsweg führt uns in diesem Fall zu
N (t) = N0 eλt .
(10.71)
10 Diﬀerentialgleichungen
249
Die Populationsgröße nimmt exponentiell (also explosionsartig) zu. Für biologische Systeme kann
ein solches Wachstum natürlich nur weitergehen, bis die Ressourcen sich verknappen. Dann wird
λ schrumpfen und das Wachstum verlangsamen.
Beispiel: Bewegung mit Reibung
Wir betrachten einen Körper der Masse m, der sich unter dem Einﬂuss einer Reibungskraft entlang
einer Geraden bewegt. Die Bewegung des Körpers wird durch die Newtonsche Bewegungsgleichung
F = mv̇
(10.72)
beschrieben, wobei F die Kraft auf den Körper und v seine Geschwindigkeit ist. Die Kraft setzen
wir als proportional zur Geschwindigkeit und als der Bewegungsrichtung entgegengesetzt an:
F = −γv.
(10.73)
(Für einen kugelförmigen Körper mit Radius R in einer Flüssigkeit mit der Zähigkeit η gilt etwa für
niedrige Geschwindigkeiten das Stokessche Reibungsgesetz: F = −6πηRv.) In der obigen Gleichung
ist γ die so genannte Reibungskonstante. Einsetzen dieses Ausdrucks in die Bewegungsgleichung
ergibt:
v̇ =
γ
dv
= − v.
dt
m
(10.74)
Separation der Variablen und anschließende Integration liefert:
γ
v = v0 e− m t .
(10.75)
Dabei ist v0 die Geschwindigkeit zum Zeitpunkt t = 0. Das heißt, das Teilchen bleibt asymptotisch
stehen.
Um die Zeitabhängigkeit des Ortes x zu bestimmen, können wir wieder die Variablen separieren:
γ
dx = v0 e− m t dt.
(10.76)
Integration liefert:
x=−
v0 m − γ t
e m + C.
γ
(10.77)
Die Anfangsbedingung x(t = 0) = x0 setzt die Konstante C fest:
C = x0 +
Somit erhalten wir
x(t) = x0 +
v0 m
.
γ
γ
v0 m 1 − e− m t .
γ
(10.78)
(10.79)
Das heißt, der Körper erreicht für t → ∞ die asymptotische Position (siehe Abb. 10.5)
x∞ = x0 +
10.2.3
v0 m
.
γ
(10.80)
Inhomogene lineare Diﬀerentialgleichung
Die allgemeine Form einer inhomogenen linearen Diﬀerentialgleichung 1. Ordnung ist
y + f (x)y = g(x).
(10.81)
250
10 Diﬀerentialgleichungen
Abbildung 10.5: In einer zähen Flüssigkeit nähert sich ein Körper, auf den keine äußere Kraft wirkt,
exponentiell seiner asymptotischen Position x∞ . Die insgesamt zurückgelegte Distanz ist v0 m/γ.
Im Gegensatz zur homogenen linearen Diﬀerentialgleichung verschwindet für die inhomogene Gleichung der Störterm g(x) nicht. Um die allgemeine Lösung dieser Diﬀerentialgleichung zu ﬁnden,
genügt es, eine beliebige Partikulärlösung yp zu bestimmen, die dann einfach zur allgemeinen
Lösung der homogenen Gleichung yh addiert wird:
y = yh + yp .
(10.82)
yh + f (x)yh = 0,
(10.83)
Da yh die homogene Gleichung erfüllt,
und yp eine Partikulärlösung der inhomogenen Gleichung ist,
yp + f (x)yp = g(x),
(10.84)
erfüllt auch (yp + yh ) die inhomogene Gleichung :
(yp + yh ) + f (x)(yp + yh ) = yp + f (x)yp + yh + f (x)yh = g(x).
=g(x)
(10.85)
=0
Da wir aus dem letzten Abschnitt schon wissen, wie wir durch Variablenseparation die allgemeine
Lösung der homogenen Gleichung ermitteln können, müssen wir uns nur noch um die Bestimmung
einer beliebigen Partikulärlösung der inhomogenen Gleichung kümmern. In manchen Fällen können
wir eine geeignete Partikulärlösung erraten oder durch einen einfachen Ansatz bestimmen.
Beispiel:
Betrachten wir zum Beispiel die Diﬀerentialgleichung
xy − y = x2 .
(10.86)
Zunächst lösen wir die homogene Diﬀerentialgleichung xy − y = 0 durch Variablenseparation:
dy
dx
=
.
y
x
(10.87)
ln y = ln x + C,
(10.88)
Integration ergibt
woraus folgt
yh = kx,
(10.89)
10 Diﬀerentialgleichungen
251
wobei wir k = eC gesetzt haben. Durch Probieren ﬁnden wir, dass yp = x2 die inhomogene
Gleichung löst,
xy − y = x2x − x2 = 2x2 − x2 = x2 .
(10.90)
Die allgemeine, einparametrige Lösungsschar der Diﬀerentialgleichung xy −y = x2 ist also gegeben
durch:
y = yp + yh = x2 + kx.
(10.91)
Durch Einsetzen können wir uns davon überzeugen, dass diese Funktion tatsächlich eine Lösung
der inhomogenen Diﬀerentialgleichung ist.
Eine etwas systematischere Methode zum Auﬃnden einer Partikulärlösung einer inhomogenen Differentialgleichung ist die so genannte Variation der Konstanten. Bei diesem Verfahren fasst man
die Konstante k in der allgemeinen Lösung yh der homogenen Gleichung als eine Funktion von x
auf, k = k(x). Diesen Ansatz setzt man dann in die inhomogene Diﬀerentialgleichung und erhält
dadurch eine Diﬀerentialgleichung für k(x), die man durch Separation der Variablen lösen kann.
Beispiel:
Wir lösen die Diﬀerentialgleichung aus dem vorangehenden Beispiel nun auch durch Variation der
Konstanten. Dazu betrachten wir die Konstante k in der Lösung yh = kx als Funktion von x:
y = k(x) · x.
(10.92)
Diesen Ausdruck setzen wir nun in die inhomogene Diﬀerentialgleichung ein und erhalten nach
Anwendung der Produktregel für die Diﬀerentiation von k(x) · x die Gleichung:
xy − y
= x(k(x) · x) − k(x) · x
= x(k (x) · x + k(x)) − k(x)x
−xk(x)
= k (x)x2
+xk(x)
= k (x)x2 = x2 .
(10.93)
Die Diﬀerentialgleichung für k(x) lautet also
k (x) =
dk
= 1.
dx
(10.94)
Integration durch Variablentrennung liefert k(x) = x. (Eine Konstante C benötigen wir hier nicht,
da wir nur an einer Partikulärlösung der inhomogenen Diﬀerentialgleichung interessiert sind.) Die
gesuchte Partikulärlösung für die inhomogene Gleichung ist also
yp = k(x)x = x2 .
(10.95)
Für die allgemeine Lösung der inhomogenen Gleichung erhalten wir somit wie oben
y = yp + yh = x2 + kx.
(10.96)
Diesen Lösungsweg durch Variation der Konstanten können wir auch auf die allgemeine Form
y + f (x)y = g(x)
(10.97)
der inhomogenen Diﬀerentialgleichung anwenden. (Falls die Gleichung nicht diese Form hat sondern
h(x)y + f (x)y = g(x), dividieren wir durch h(x).) Wir lösen zuerst die homogene Gleichung durch
Separation der Variablen:
dy
= −f (x)dx.
y
(10.98)
252
10 Diﬀerentialgleichungen
Wir integrieren und erhalten als allgemeine Lösung
%
ln y = − f (x)dx + C
(10.99)
oder, durch Anwendung der Exponentialfunktion auf beide Seiten,
6 %
7
y = k exp − f (x)dx ,
(10.100)
wobei wir wieder k für eC geschrieben haben. Wir machen jetzt den Ansatz
6 %
7
y = k(x) exp − f (x)dx
(10.101)
und setzen ihn in die inhomogene Gleichung ein:
#
6 %
7$
6 %
7
d
k(x) exp − f (x)dx
+ k(x) exp − f (x)dx f (x) = g(x).
dx
(10.102)
Zur Auswertung des ersten Terms in der obigen Gleichung verwenden wir die Produktregel
#
6 %
7$
d
k(x) exp − f (x)dx
=
dx
6 %
7
6 %
7
# %
$
d
dk
exp − f (x)dx + k(x) exp − f (x)dx
− f (x)dx . (10.103)
dx
dx
=−f (x)
Somit erhalten wir
6 %
7
6 %
7
k (x) exp − f (x)dx − k(x) exp − f (x)dx f (x)
6 %
7
+ k(x) exp − f (x)dx f (x) = g(x).
Der zweite und dritte Term heben einander auf und somit erhalten wir:
6 %
7
k (x) exp − f (x)dx = g(x).
(10.104)
(10.105)
Wir formen diese Gleichung um zu
6%
dk = g(x) exp
7
f (x)dx dx,
integrieren sie dann und erhalten
6%
7
%
k = g(x) exp
f (x)dx dx + C.
(10.106)
(10.107)
Einsetzen dieses Ausdrucks in Gleichung (10.101) liefert schließlich die Partikulärlösung
#% 6%
7
$
6 %
7
g(x) exp
f (x)dx
dx + C exp − f (x)dx .
(10.108)
yp (x) =
Zweckmäßiger, als sich diese Formel zu merken, ist es, sich den allgemeinen Lösungsweg anzueignen,
um ihn bei Bedarf direkt auf die gegebene Diﬀerentialgleichung anzuwenden. Zusammenfassend
halten wir fest, dass wir die lineare inhomogene Diﬀerentialgleichung lösen können, indem wir
1. die allgemeine Lösung yh der homogenen Diﬀerentialgleichung bestimmen,
10 Diﬀerentialgleichungen
253
2. dann durch Variation der Konstanten eine Partikulärlösung yp der inhomogenen Gleichung
ermitteln, und schließlich
3. yh und yp addieren, um die allgemeine Lösung der inhomogenen Diﬀerentialgleichung zu
erhalten:
y(x) = yh (x) + yp (x).
(10.109)
Beispiel: Radioaktiver Zerfall mit Erzeugung der radioaktiven Substanz
Wir betrachten wieder den Zerfall einer radioaktiven Substanz, jetzt aber in einer Situation, in der
zum Beispiel in einem Reaktor die radioaktive Substanz ständig nachgeliefert wird. Pro Zeiteinheit
werden vom Reaktor r Atome erzeugt. Das heißt, dass rdt Atome im Zeitintervall dt dazukommen.
Diese dazukommenden Atome müssen auch in der Diﬀerentialgleichung für N , die Anzahl der
Atome, berücksichtigt werden:
dN = −λN dt + rdt
(10.110)
dN
= −λN + r,
dt
(10.111)
oder, äquivalent dazu,
wobei r eine Konstante ist. Dies ist eine inhomogene lineare Diﬀerentialgleichung. Die Lösung
der homogenen Gleichung kennen wir bereits:
Nh = Ke−λt .
(10.112)
Durch Variation der Konstanten ermitteln wir jetzt noch eine Partikulärlösung für die inhomogene
Gleichung. Wir setzen an
Np = K(t)e−λt
(10.113)
dNp
dK(t) −λt
=
e
+ K(t)(−λ)e−λt .
dt
dt
(10.114)
und erhalten dadurch
Einsetzen in die Diﬀerentialgleichung ergibt
dK −λt
−λt
−λt
e
−
λKe
= −
λKe
+ r,
dt
(10.115)
woraus folgt
dK −λt
e
=r
dt
oder
dK
= eλt r.
dt
(10.116)
Integration liefert
1
K = r eλt
λ
(10.117)
r λt −λt
r
e ·e
= .
λ
λ
(10.118)
und somit
Np =
Die allgemeine Lösung der Diﬀerentialgleichung ist also
N (t) = Nh (t) + Np (t) = Ke−λt +
r
.
λ
(10.119)
254
10 Diﬀerentialgleichungen
Für t → ∞ ist e−λt → 0 und N strebt dem Gleichgewichtswert r/λ zu. Wir müssen nun noch die
Konstante K aus den Anfangsbedingungen bestimmen. Wurde der Reaktor etwa zum Zeitpunkt
t = 0 in Betrieb genommen, sodass N (0) = 0, folgt
0=K+
r
λ
(10.120)
und infolgedessen:
N (t) =
r
1 − e−λt .
λ
(10.121)
Für t → ∞ ist e−λt → 0 und N strebt dem Gleichgewichtswert r/λ zu.
Konstanter Störterm und konstante Koeﬃzienten
Falls die Koeﬃzienten der Diﬀerentialgleichung 1. Ordnung konstant sind, können wir die Diﬀerentialgleichung
y + ay = b
(10.122)
mit einem konstanten Störterm b auch durch Variablenseparation lösen. Wir formen die obige
Gleichung um zu:
dy
= b − ay.
dx
(10.123)
dy
= dx.
b − ay
(10.124)
Daraus folgt:
Wir führen nun die neue Variable u = b − ay ein und führen eine Variablentransformation von y
nach u durch. Da du = −ady ist, gilt
du
= dx
−au
oder
du
= −adx.
u
(10.125)
Integration ergibt
ln u = −ax + C
(10.126)
oder, nach Anwendung der Exponentialfunktion auf beiden Seiten der Gleichung,
u = e−ax eC = ke−ax .
(10.127)
Rücktransformation nach y liefert schließlich:
y=
b
k
− e−ax .
a a
(10.128)
Beispiel: Radioaktiver Zerfall mit Erzeugung der radioaktiven Substanz
Wir behandeln das letzte Beispiel noch einmal mit dem oben beschriebenen Ansatz und formen
zunächst die Diﬀerentialgleichung
dN
dt
=
−λN + r
(10.129)
= dt.
(10.130)
um zu
dN
−λN + r
10 Diﬀerentialgleichungen
255
Abbildung 10.6: Die Anzahl von Atomen einer radioaktiven Substanz nähert sich exponentiell einer
Gleichgewichtsanzahl, die sowohl von der Zerfallskonstanten λ als auch von der Erzeugungsrate r
abhängt.
Integration liefert
−
1
ln(−λN + r) = t + C,
λ
(10.131)
woraus folgt:
N (t)
=
1
(r − k exp {−λt}),
λ
(10.132)
wobei wir k = exp(−λC) gesetzt haben. Die Anfangsbedingung N (t = 0) = N0 liefert
N0 =
k
r
−
λ λ
⇒
k = r − λN0
(10.133)
und wir erhalten schließlich (siehe Abb. 10.6)
N (t) =
r r −λt
+ N0 −
e .
λ
λ
(10.134)
Dies stimmt mit der bereits erhaltenen Lösung überein.
Beispiel: Bewegung mit Reibung im Gravitationsfeld
Wir betrachten nun ein Teilchen mit Masse m, das in einer viskosen Flüssigkeit im Gravitationsfeld
der Erde nach unten fällt (siehe Abb. 10.7).
Abbildung 10.7: Eine Kugel der Masse m sinkt unter der Wirkung der Gravitationskraft in einer
viskosen Flüssigkeit.
256
10 Diﬀerentialgleichungen
Wir lassen den Körper zur Zeit t = 0 an der Stelle x0 los und geben ihm eine Anfangsgeschwindigkeit v0 . Gesucht sind Position x und Geschwindigkeit v des Teilchens als Funktion der Zeit t.
Die x-Achse ist hier nach unten orientiert. Die Bewegungsgleichung für das Teilchen ist
F = ma
F
dv
= .
dt
m
oder
(10.135)
Die Kraft, die auf das Teilchen wirkt, besteht einerseits aus der Gravitationskraft Fg = gm und
andererseits aus der Reibungskraft Fr = −γv, welche der Bewegungsrichtung entgegengesetzt ist:
F = gm − γv.
(10.136)
γ
dv
= g − v.
dt
m
(10.137)
Einsetzen ergibt:
Diese Diﬀerentialgleichung unterscheidet sich nur durch den konstanten Term g von der Bewegungsgleichung (10.74). Aus Gleichung (10.137) folgt
dv
= dt
g − γv
m
(10.138)
und nach Transformation zur neuen Variablen u = g −
γv
m
γ
wegen du = − m
dv
du
γ
= − dt.
u
m
(10.139)
Durch Integration ﬁnden wir
ln u = −
γ
t + C,
m
(10.140)
was bedeutet
γ
γ
u = e− m t eC = ke− m t .
(10.141)
Durch Rücksubstitution ﬁnden wir
g−
und somit
v=
γ
γv
= ke− m t
m
γ
m
g − ke− m t .
γ
(10.142)
(10.143)
Aus der Anfangsbedingung v(0) = v0 erhalten wir
k=g−
v0 γ
m
(10.144)
und infolgedessen
v=
oder
v=
mg
−
γ
γ
mg
− v0 e− m t
γ
γ
γ
mg 1 − e− m t + v0 e− m t .
γ
(10.145)
(10.146)
Das heißt, dass sich die Geschwindigkeit v von der Anfangsgeschwindigkeit v0 ausgehend der asymptotischen Geschwindigkeit von mg/γ exponentiell nähert (siehe Abb. 10.8). Sobald diese Geschwindigkeit erreicht ist, halten sich mg und −γv genau
die Waage. Falls das Teilchen zum Zeitpunkt
t = 0 in Ruhe ist, gilt v = (mg/γ) 1 − e−(γ/m)t .
10 Diﬀerentialgleichungen
257
Abbildung 10.8: Die Geschwindigkeit v nähert sich exponentiell der Endgeschwindigkeit mg/γ, bei
der sich Reibungskraft und Gravitationskraft genau die Waage halten.
Die Konstante γ/m gibt uns ein Maß dafür, wie lange es dauert, bis das Teilchen seine Endgeschwindigkeit erreicht hat. Nach t = m/γ ist die ursprüngliche Diﬀerenz der Geschwindigkeit zur
Endgeschwindigkeit auf den Bruchteil 1/e abgefallen. Falls etwa v0 = 0, unterscheidet sich die Geschwindigkeit nach t = 5m/γ nur mehr um 0.7 % von der Endgeschwindigkeit und nach t = 15m/γ
beträgt der Unterscheid nur mehr 3.1 × 10−5 %. Nach einer Zeit t m/γ fällt das Teilchen also
im Wesentlichen mit konstanter Geschwindigkeit durch die viskose Flüssigkeit.
Um den Ort x als Funktion der Zeit zu bestimmen, gehen wir aus von der Diﬀerentialgleichung
γ
mg
dx
mg
v=
=
−
− v0 e− m t ,
(10.147)
dt
γ
γ
die wir einfach durch Variablenseparation integrieren können:
γ
mg
m
mg
x =
t−
− v0 e− m t · −
+C
γ
γ
γ
γ
m mg
mg
t+
− v0 e− m t + C.
=
γ
γ
γ
Die Konstante C bestimmen wir aus der Anfangsbedingung x(0) = x0 :
m mg
− v0 + C.
x0 =
γ
γ
(10.148)
(10.149)
Folglich gilt
C = x0 −
m
γ
mg
− v0
γ
(10.150)
und wir erhalten damit
x =
=
γ
m mg
m mg
mg
− v0 +
t+
− v0 e− m t
x0 −
γ
γ
γ
γ
γ
γ
m mg
mg
1 − e− m t .
t−
− v0
x0 +
γ
γ
γ
(10.151)
Da der Term e−(γ/m)t schnell gegen 0 geht, dominiert für Zeiten, die lang sind im Vergleich zu
m/γ, der lineare Term (das Teilchen fällt dann mit konstanter Geschwindigkeit). Für lange Zeiten
t m/γ gilt dann
m mg
mg
t−
− v0 .
x(t) ≈ x0 +
(10.152)
γ
γ
γ
258
10.3
10 Diﬀerentialgleichungen
Diﬀerentialgleichungen zweiter Ordnung
Diﬀerentialgleichungen zweiter Ordnung sind bei weitem komplexer (und deswegen auch interessanter) als Diﬀerentialgleichungen erster Ordnung. Zu den wichtigen Diﬀerentialgleichungen zweiter
Ordnung, die einem in der Physik gleich in den ersten Semestern begegnen, gehören die Newtonsche
Bewegungsgleichung und insbesondere die Schwingungsgleichung, mit der wir uns im Folgenden
vor allem beschäftigen werden.
Die allgemeine Form einer Diﬀerentialgleichung zweiter Ordnung ist
F (x, y, y , y ) = 0.
(10.153)
Wir konzentrieren uns hier auf die lineare Diﬀerentialgleichung zweiter Ordnung, die die Form
y (x) + p(x)y (x) + q(x)y(x) = g(x)
(10.154)
besitzt. Falls der Störterm g(x) verschwindet, spricht man auch hier von einer homogenen Diﬀerentialgleichung, anderenfalls von einer inhomogenen Diﬀerentialgleichung.
Besonders einfach (und trotzdem sehr wichtig) sind Diﬀerentialgleichungen 2. Ordnung, bei denen
die Koeﬃzienten p(x) und q(x) konstant sind. Für diese besondere Form betrachten wir zunächst
den homogenen Fall.
10.3.1
Homogene Diﬀerentialgleichung mit konstanten Koeﬃzienten
Die homogene lineare Diﬀerentialgleichung 2. Ordnung mit konstanten Koeﬃzienten hat die allgemeine Form:
y + ay + by = 0.
(10.155)
Für eine lineare Diﬀerentialgleichung gilt, dass, wenn y(x) eine Lösung ist, auch das Produkt cy(x)
dieser Funktion mit einer Konstanten eine Lösung ist. Dies gilt, da (cy) = cy und (cy) = cy .
Weiters ist die Summe zweier Lösungen y1 und y2 auch eine Lösung der Diﬀerentialgleichung, da
gilt (y1 + y2 ) = y1 + y2 und (y1 + y2 ) = y1 + y2 (die Diﬀerentiation ist ein linearer Operator).
Allgemeiner: jede Linearkombination
y = c1 y 1 + c2 y 2
(10.156)
von zwei Lösungen y1 , y2 ist ebenfalls eine Lösung der Diﬀerentialgleichung. Man nennt diesen
Sachverhalt das Superpositionsprinzip. Die Konstanten c1 und c2 können hier reelle aber auch
komplexe Zahlen sein. Um die zwei freien Parameter einer Diﬀerentialgleichung 2. Ordnung zu
bestimmen, brauchen wir zwei Anfangs- oder Randbedingungen.
Für eine homogene lineare Diﬀerentialgleichung mit konstanten Koeﬃzienten können wir mit
Hilfe des exponentiellen Ansatzes y = Aeλx immer Lösungen ﬁnden, da durch Diﬀerentiation von
eλx nach x nur ein zusätzlicher Faktor λ entsteht. Dadurch sind alle Ableitungen von y nach x
proportional zueinander. Einsetzen des Ansatzes y = Aeλx in die Diﬀerentialgleichung (10.155)
liefert:
Aλ2 eλx + aAλeλx + bAeλx = 0.
(10.157)
Da eλx > 0 und da A = 0 nur der trivialen Lösung y = 0 entspricht, können wir beide Seiten dieser
Gleichung durch Aeλx dividieren und erhalten
λ2 + aλ + b = 0.
(10.158)
Dies ist eine quadratische Gleichung für λ, die so genannte charakteristische Gleichung, mit
den Lösungen:
√
−a ± a2 − 4b
.
(10.159)
λ1,2 =
2
10 Diﬀerentialgleichungen
259
Nur für diese bestimmten Werte von λ löst der exponentielle Ansatz y = A exp(λx) die Diﬀerentialgleichung.
Der exponentielle Ansatz kann natürlich auch für homogene lineare Diﬀerentialgleichungen höherer
Ordnung mit konstanten Koeﬃzienten verwendet werden. In diesem Fall hat die Diﬀerentialgleichung die allgemeine Form
an y (n) + an−1 y (n−1) + · · · + a1 y + a0 y = 0
(10.160)
oder
n
ai y (i) (x) = 0,
(10.161)
i=0
wobei die ai konstante Koeﬃzienten sind und wir festlegen, dass y (0) = y. Einsetzen des exponentiellen Ansatzes y = Aeλx und anschließende Division ergibt:
n
ai λi = 0 = a0 + a1 λ + a2 λ2 + · · · + an λn .
(10.162)
i=0
Diese algebraische Gleichung n-ten Grades hat genau n möglicherweise komplexe Lösungen λ1 , λ2 ,
. . . , λn , mit denen man allgemeine Lösungen der Diﬀerentialgleichung (10.160) konstruieren kann.
Kehren wir nun nach diesem kurzen Exkurs über Diﬀerentialgleichungen höherer Ordnung wieder
zu den Diﬀerentialgleichungen zweiter Ordnung zurück. Nach Gleichung (10.159) erfüllt der Ansatz
y = Aeλx genau für die Werte λ1,2 = −a/2 ± a2 /4 − b die ursprüngliche Diﬀerentialgleichung.
Diese beiden speziellen Werte werden Eigenwerte der Diﬀerentialgleichung genannt. Falls a2 /4 −
b ≥ 0, sind die beiden Eigenwerte reell. Anderenfalls sind sie beide komplex und zueinander komplex
konjugiert. Wie wir später noch genauer sehen werden, lassen sich aus Lösungen mit komplex
konjugierten Eigenwerten λ1 und λ2 durch Superposition immer reelle Lösungen konstruieren.
Wenn wir die Eigenwerte λ1 = α + iβ und λ2 = α − iβ haben (α und β reell) mit zugehörigen
Lösungen y1 = eλ1 x und y2 = eλ2 x , können wir die reellen Lösungen
λ1 x
iβx
eλ2 x
e
e + e−iβx
αx
+
y1 =
(10.163)
=e
= eαx cos βx
2
2
2
und
y2 =
eλ1 x
eλ2 x
−
2i
2i
=e
αx
eiβx − e−iβx
2i
= eαx sin βx
(10.164)
konstruieren. Durch Superposition der Lösungen, die zu den Eigenwerten λ1 und λ2 gehören,
erhalten wir die allgemeine Lösung der Diﬀerentialgleichung, die zwei freie Parameter A1 und A2
enthält:
y = A1 eλ1 x + A2 eλ2 x
(10.165)
oder, falls die Eigenwerte komplex sind und wir eine reelle Lösung wollen,
y = A1 eαx cos βx + A2 eαx sin βx.
(10.166)
Die freien Parameter A1 und A2 müssen durch Anfangs- oder Randbedingungen festgelegt werden.
Beispiel:
Wir betrachten ein ideal biegsames Seil der Länge l, das reibungslos über die Kante eines Tisches
gleitet (siehe Abb. 10.9). Wir wollen nun die genaue Lage des Seils sowie seine Geschwindigkeit als Funktion der Zeit bestimmen. Dazu legen wir fest, dass die Koordinate x die Länge des
überhängenden Teils des Seils bezeichnet. Die Newtonsche Bewegungsgleichung für das Seil lautet
m
d2 x
= F,
dt2
(10.167)
260
10 Diﬀerentialgleichungen
Abbildung 10.9: Ein biegsames Seil wird von der Gravitationskraft von einem Tisch gezogen.
wobei m die Gesamtmasse des Seils ist. Die auf das Seil wirkende Kraft F ist gleich dem Gewicht
des herabhängenden Teils. Da die Masse dieses Teils gleich mx/l ist, ergibt sich für die Kraft
F = gmx/l und somit
gmx
d2 x
=
2
dt
l
(10.168)
d2 x gx
= 0.
−
dt2
l
(10.169)
x(t) = Aeλt
(10.170)
m
oder, nach Division durch m:
Wir setzen nun als Lösung
an. Einsetzen in die Diﬀerentialgleichung ergibt:
d2 λt g λt Ae
Ae
−
=0
dt2
l
(10.171)
g
Aλ2 eλt − Aeλt = 0.
l
(10.172)
und somit
Nach Division durch Aeλt erhalten wir die charakteristische Gleichung
g
λ2 − = 0,
l
woraus folgt:
"
g
.
λ1,2 = ±
l
Beide Eigenwerte sind also reell. Die allgemeine Lösung der Diﬀerentialgleichung ist:
√g
√g
x(t) = A1 e+ l t + A2 e− l t .
(10.173)
(10.174)
(10.175)
Wenn wir uns vorstellen, dass das Seil anfänglich ruht und ein Stück der Länge x0 überhängt,
v(0) = 0
und
x(0) = x0 ,
(10.176)
können wir aus diesen Bedingungen die Konstanten A1 und A2 bestimmen:
x(0) = A1 + A2 = x0
und
"
v(0) = A1
g
− A2
l
"
g
= 0.
l
(10.177)
(10.178)
Aus der zweiten Bedingung folgt A1 = A2 , was, eingesetzt in die erste Bedingung, A1 = A2 = x0 /2
ergibt. Somit ist die Lösung für diesen speziellen Fall gegeben durch (siehe Abb. 10.10):
" √g x0 +√ g t
g
−
t
l
l
x(t) =
t .
(10.179)
+e
= x0 cosh
e
2
l
10 Diﬀerentialgleichungen
261
Abbildung 10.10: Der überhängende Anteil x des Seiles ist eine rasch anwachsende Funktion der
Zeit: x = x0 cosh( g/lt).
10.3.2
Der harmonische Oszillator
Schwingungen mit kleinen Amplituden führen uns immer zur so genannten Schwingungsgleichung,
die sich von Fall zu Fall nur durch den Wert und die Bedeutung der Koeﬃzienten sowie die Bedeutung der Variablen unterscheidet. Betrachten wir zum Beispiel einen Massenpunkt der Masse m,
der an einer gewichtslosen und undehnbaren Schnur der Länge l aufgehängt ist und im Erdschwerefeld hin und her pendeln kann (siehe Abb. 10.11). Den Zustand eines solchen Pendels beschreiben
wir durch den Winkel x, den der Faden mit dem Lot bildet.
Abbildung 10.11: Ein Massenpunkt der Masse m hängt an einer Schnur der Länge l. Die rückstellende Kraft Ft ist die Komponente der Gravitationskraft F , die tangential zur Kreisbahn des
Massenpunkts steht. s ist die Entfernung entlang des Kreisbogens des Massenpunktes von seiner
Ruhelage.
Auf den Massenpunkt wirkt die Gravitationskraft F = mg senkrecht nach unten. Wenn das Pendel
um einen Winkel x aus der Ruhelage ausgelenkt ist, wirkt die Komponente Fr = mg cos x in
Richtung der Schnur und hat daher keine Wirkung. Die Komponente Ft = mg sin x hingegen wirkt
normal zur Schnur und in Richtung zurück zur Ruhelage. Die Bewegungsgleichung für das Pendel
262
10 Diﬀerentialgleichungen
ist
ma = m
d2 s
= −Ft ,
dt2
(10.180)
wobei s = xl die Entfernung des Massenpunktes von seiner Ruhelage längs des Kreisbogens ist. Das
Minuszeichen in der Gleichung (10.180) ist notwendig, da die Richtung der Kraft der Auslenkung
x entgegengesetzt ist. (Die Kraft −Ft nennt man übrigens die Rückstellkraft.) Ft ist die Kraft,
die normal zur Schnur, also in Richtung der Bahnkurve wirkt. Einsetzen von s und Ft in Gleichung
(10.180) ergibt:
d2 lx
= −mg sin x
dt2
(10.181)
g d2 x
sin x.
=
−
dt2
l
(10.182)
m
oder, da l konstant ist,
Für kleine Auslenkungen gilt sin x ≈ x und wir erhalten in dieser Näherung die Schwingungsgleichung:
g d2 x
x.
(10.183)
=
−
dt2
l
Da es sich später als günstig herausstellen wird, setzen wir (g/l) = ω02 . Die Gleichung (10.183) wird
damit zu
d2 x
= −ω02 x.
dt2
(10.184)
Dies ist die allgemeine Gleichung des (eindimensionalen) harmonischen Oszillators, bei dem
die Rückstellkraft proportional zur Auslenkung ist. Das heißt, F = −kx. Die Konstante k
wird übrigens die Federkonstante oder auch die Kraftkonstante genannt. Für eine solche Kraft
ergibt sich die Bewegungsgleichung
m
d2 x
= −kx
dt2
oder wieder
d2 x
= −ω02 x,
dt2
(10.185)
wobei wir ω02 = k/m gesetzt haben. Das ist die Bewegungsgleichung für ein eindimensionales Teilchen der Masse m mit einer parabolischen potentiellen Energie V (x) = kx2 /2 (siehe
Abb. 10.12). Die Kraft ergibt sich aus diesem Potential durch Bildung der ersten Ableitung,
F = −dV /dx = −kx.
Abbildung 10.12: In einem parabolischen Potential V (x)
= kx2 /2 führt ein Massenpunkt der Masse
m eine harmonische Bewegung mit der Periode T = 2π m/k aus.
Wir wollen nun die Gleichung des harmonischen Oszillators lösen. Der Ansatz x = Aeλt liefert die
charakteristische Gleichung
λ2 + ω02 = 0.
(10.186)
10 Diﬀerentialgleichungen
263
Die Eigenwerte dieser Gleichung sind rein imaginär:
λ1,2 = ± −ω02 = ±iω0 .
(10.187)
Aus den beiden komplexen Lösungen
x1 = eiω0 t
und
x2 = e−iω0 t
(10.188)
konstruieren wir die reellen Lösungen
1 iω0 t
e
+ e−iω0 t = cos ω0 t,
2
1 iω0 t
e
x2 =
− e−iω0 t = sin ω0 t.
2i
x1 =
(10.189)
(10.190)
Die allgemeine Lösung der Diﬀerentialgleichung für den harmonischen Oszillator ist also
x = A cos ω0 t + B sin ω0 t.
(10.191)
Diese Lösung lässt sich auch schreiben als
x = C sin(ω0 t + ϕ),
(10.192)
wobei C die Amplitude der Schwingung und ϕ die so genannte Phasenverschiebung ist. Der
Zusammenhang dieser beiden Lösungen lässt sich mit Hilfe des Additionstheorems für die Sinusfunktion herstellen:
C sin(ω0 t + ϕ)
x =
=
=
C(sin ω0 t cos ϕ + sin ϕ cos ω0 t)
(C cos ϕ) sin ω0 t + (C sin ϕ) cos ω0 t.
(10.193)
Daraus folgt
A = C sin ϕ
und
B = C cos ϕ
(10.194)
oder umgekehrt
ϕ = arctan
A
B
und
C=
A2 + B 2 .
(10.195)
Gemäß Gleichung (10.191) oder Gleichung (10.192) führt der harmonische Oszillator eine periodische Schwingung mit Kreisfrequenz ω0 aus. Die freien Parameter A und B, beziehungsweise
C und ϕ, können durch die Anfangsbedingungen zum Zeitpunkt t = 0 bestimmt werden. Für
x(0) = x0 und dx(t = 0)/dt = v0 ergibt sich:
A cos 0 + B sin 0 =
−ω0 A sin 0 + ω0 B cos 0 =
A = x0 ,
(10.196)
ω0 B = v0 .
(10.197)
v0
.
ω0
(10.198)
Daraus folgt
A = x0
und
B=
Die Phase ϕ und die Amplitude C sind
ϕ = arctan
ω0 x0
v0
)
und
C=
x20 +
v0
ω0
2
.
(10.199)
Die Lösung für die Anfangsbedingungen x(0) = x0 und v(0) = v0 ist also
x = x0 cos ω0 t +
v0
sin ω0 t
ω0
(10.200)
264
10 Diﬀerentialgleichungen
Abbildung 10.13: Die Lösung der Diﬀerentialgleichung des eindimensionalen harmonischen Oszillators ist eine Sinusfunktion, deren Amplitude und Phase von den Anfangsbedingungen x0 und v0
abhängen. Die Steigung der Kurve zum Zeitpunkt t = 0 ist v0 .
oder, etwas anders geschrieben,
)
x=
x20
+
v0
ω0
#
2
sin ω0 t + arctan
ω0 x0
v0
$
.
(10.201)
Die trigonometrischen Funktionen sind periodisch mitPeriode 2π. Das bedeutet, dass der harmonische Oszillatoreine Periode von T = 2π/ω0 = 2π m/k und eine Frequenz von f = 1/T =
ω0 /2π = (1/2π) k/m hat. Man bezeichnet ω0 auch als die Kreisfrequenz.
10.3.3
Die gedämpfte Schwingung
Bis jetzt haben wir angenommen, dass der Oszillator reibungsfrei schwingen kann. Falls jedoch Reibungskräfte wirksam sind, müssen diese auch in der Diﬀerentialgleichung berücksichtigt werden.
Mit einer zur Geschwindigkeit proportionalen Reibungskraft F = −γdx/dt wird die Bewegungsgleichung zu
m
dx
d2 x
= −kx − γ .
dt2
dt
(10.202)
Hier hat die Reibungskraft ein negatives
Vorzeichen, da sie der Bewegung entgegengerichtet ist.
Wir dividieren durch m, setzen ω0 = k/m und 2β = γ/m und erhalten
dx
d2 x
+ ω02 x = 0.
+ 2β
dt2
dt
(10.203)
Der Ansatz x = Aeλt liefert die charakteristische Gleichung:
λ2 + 2βλ + ω02 = 0.
(10.204)
Diese quadratische Gleichung hat die Lösungen
λ1,2 = −β ±
β 2 − ω02 .
(10.205)
Abhängig von den Werten von β und ω0 sind die Eigenwerte entweder komplex oder rein reell.
Wir unterscheiden drei verschiedene Fälle:
10 Diﬀerentialgleichungen
ω0 < β
ω0 = β
ω0 > β
λ1,2
λ1 = λ2
λ1,2
265
reell:
reell:
komplex:
Kriechfall
aperiodischer Grenzfall
Schwingfall
Kriechfall:
Wenn ω0 < β, sind beide Eigenwerte reell aber negativ. Die allgemeine Lösung der Bewegungsgleichung ist also (siehe Abb. 10.14)
x(t) = Aeλ1 t + Beλ2 t
mit den Koeﬃzienten
λ1 = −β +
β 2 − ω02 ;
λ2 = −β −
(10.206)
β 2 − ω02 .
(10.207)
Da sowohl λ1 als auch λ2 negativ sind, nähert sich x exponentiell seiner Ruhelage. Die Dämpfung
durch Reibungsverluste ist in diesem Fall zu stark, um eine Schwingung zuzulassen. So ein Fall
würde sich z.B. für ein Pendel in einer viskosen Flüssigkeit ergeben.
Abbildung 10.14: Im Kriechfall nähert sich der Oszillator seiner Ruhelage exponentiell.
Wir wollen nun die Bewegung des Oszillators für den Fall betrachten, dass er anfänglich in Ruhe
ist (ẋ(0) = 0) und die Auslenkung x(0) = x0 hat. Aus x(0) = x0 ergibt sich
A + B = x0 .
(10.208)
Die zeitliche Ableitung der Auslenkung ist
ẋ(t) = λ1 Aeλ1 t + λ2 Beλ2 t
(10.209)
λ1 A + λ2 B = 0.
(10.210)
und somit folgt aus ẋ(0) = 0
Aus diesen beiden Bedingungen können wir A und B bestimmen:
A
B
x0 λ2
,
λ2 − λ1
λ1 x0
.
= −
λ2 − λ1
=
(10.211)
(10.212)
Wegen
λ2 − λ1 = −β −
β 2 − ω02 + β − β 2 − ω02 = −2 β 2 − ω02
(10.213)
erhalten wir schließlich
x(t) =
λ1 t
x0
λ2 t
e
−
λ
e
λ
.
2
1
−2 β 2 − ω02
(10.214)
266
10 Diﬀerentialgleichungen
Anders ausgedrückt haben wir:
x(t) =
x
0
−2 β 2 − ω02
#
−β −
$
√ 2 2
β 2 − ω02 e(−β+ β −ω0 )t
#
$
√ 2 2 − −β + β 2 − ω02 e(−β− β −ω0 )t . (10.215)
Aperiodischer Grenzfall:
Verringern wir den Reibungskoeﬃzienten so weit, dass ω0 = β, sind beide Eigenwerte gleich und
negativ: λ1 = λ2 = −β. Man nennt solche Eigenwerte entartet. Die Lösung der Diﬀerentialgleichung
wird in diesem Fall zu
x = Ae−βt .
(10.216)
Hier haben wir jedoch nur mehr einen freien Parameter statt zwei, wie wir es von der allgemeinen
Lösung einer Diﬀerentialgleichung zweiter Ordnung eigentlich verlangen müssen. Wir brauchen also
eine zweite vom Ansatz Aeλt verschiedene Lösung, um den zweiten Parameter unterzubringen. Wir
versuchen es mit dem Ansatz
x = Bte−βt
(10.217)
mit den Ableitungen
ẋ =
dx
= −Bβte−βt + Be−βt = Be−βt (1 − βt)
dt
(10.218)
und
ẍ
d2 x
= −βBe−βt (1 − βt) + Be−βt (−β)
dt2 *
+
= Be−βt −β + β 2 t − β
+
*
= Be−βt β 2 t − 2β .
=
Einsetzen dieses Ansatzes in die Diﬀerentialgleichung (10.203) ergibt:
*
+
Be−βt β 2 t − 2β + 2βBe−βt (1 − βt) + ω02 Bte−βt = 0
(10.219)
(10.220)
und somit
β2t − 2β
2β
+
− 2β 2 t + ω02 t
= −β 2 t + ω02 t
= (−β 2 + ω02 )t = 0.
(10.221)
Da nach Voraussetzung β = ω0 , verschwindet die linke Seite der obigen Gleichung und wir sehen,
dass der Ansatz x = Bte−βt die Diﬀerentialgleichung erfüllt. Die allgemeine Lösung ist in diesem
Fall also
x(t) = Ae−βt + Bte−βt .
(10.222)
Da die lineare Funktion t viel langsamer wächst als die Exponentialfunktion e−βt abfällt, kehrt
der Oszillator im aperiodischen Grenzfall auf monotone Weise von einer Auslenkung x in seine
Ruhelage x = 0 zurück.
Wenn der Oszillator bei t = 0 eine Auslenkung von x0 hat und seine Anfangsgeschwindigkeit
verschwindet, haben wir für die freien Parameter A und B:
A = x0
und
B = βx0
(10.223)
10 Diﬀerentialgleichungen
267
und erhalten als spezielle Lösung
x(t) = x0 e−βt + βx0 te−βt = x0 e−βt (1 + βt).
(10.224)
Da für β = ω0 also keine Schwingung auftritt und für ein etwas kleineres β der Oszillator erstmals
seine Ruhelage mit endlicher Geschwindigkeit durchqueren und nicht nur asymptotisch erreichen
kann, spricht man vom aperiodischen Grenzfall: Wenn wir β um einen nur kleinen Betrag verringern, kann das System erstmals schwingen. Beim aperiodischen Grenzfall kehrt der Oszillator am
schnellsten in seine Ruhelage zurück.
Schwingfall:
Falls ω0 > β, ist das Argument der Wurzel in Gleichung (10.205) negativ und die beiden Eigenwerte
λ1 und λ2 sind komplex. Mit −ω 2 ≡ β 2 − ω02 (damit klar ist, dass β 2 − ω02 eine negative Zahl ist),
sind die Eigenwerte gegeben durch
λ1 = −β + iω
und
λ1 = −β − iω.
(10.225)
Sie sind also komplex konjugiert zueinander.
Wie wir bereits wissen (siehe Gleichung (10.166)) können wir in diesem Fall aus den Lösungen x1 =
e−(β+iω)t und x2 = e−(β−iω)t durch eine passende Linearkombination reelle Lösungen konstruieren
−(β+iω)t
e
e−(β−iω)t
+
x1 =
(10.226)
= e−βt cos ωt,
2
2
−(β+iω)t
e
e−(β−iω)t
−
x2 = −
(10.227)
= e−βt sin ωt.
2i
2i
Die allgemeine Lösung ist also
x(t) = Ae−βt cos ωt + Be−βt sin ωt = e−βt (A cos ωt + B sin ωt)
(10.228)
x(t) = Ce−βt sin(ωt + ϕ).
(10.229)
oder
Das ist eine Schwingung, deren Amplitude durch die Dämpfung exponentiell mit der Zeit abnimmt.
Die Kreisfrequenz
ω = ω02 − β 2
(10.230)
ist für den gedämpften Oszillator geringer als für den ungedämpften.
Um die freien Parameter A und B (bzw. C und ϕ) für die speziellen Anfangsbedingungen x(0) = x0
und ẋ(0) = 0 zu bestimmen, benötigen wir die erste Ableitung:
dx
dt
=
(−β)e−βt (A cos ωt + B sin ωt) + ωe−βt (−A sin ωt + B cos ωt)
=
e−βt [(ωB − βA) cos ωt − (ωA + βB) sin ωt] .
(10.231)
Somit folgt aus den Anfangsbedingungen
A = x0
(10.232)
βx0
βA
=
.
ω
ω
(10.233)
und
B=
268
10 Diﬀerentialgleichungen
Die Lösung der Diﬀerentialgleichung ist dann
β
x(t) = x0 e−βt cos ωt + sin ωt
ω
(10.234)
oder anders ausgedrückt
β
sin( ω02 − β 2 t) .
cos( ω02 − β 2 t) + 2
ω0 − β 2
x(t) = x0 e−βt
(10.235)
Für β → ω0 oder ω → 0 erhalten wir x(t) = x0 e−βt (1 + βt). Das ist genau der aperiodische
Grenzfall aus Gleichung (10.224).
Abbildung 10.15: Schwingfall (ω0 > β), Kriechfall (ω0 < β) und aperiodischer Grenzfall (ω0 = β)
eines gedämpften harmonischen Oszillators (hier haben wir ω0 = 1 gesetzt).
10.3.4
Die inhomogene lineare Diﬀerentialgleichung 2. Ordnung mit konstanten Koeﬃzienten: die erzwungene Schwingung
Wir betrachten nun einen harmonischen Oszillator, der zusätzlich durch eine äußere, zeitabhängige
Kraft angeregt wird. Beispiele wären etwa ein Pendel, dessen Aufhängepunkt periodisch hin und
her bewegt wird oder ein elektrischer Schwingkreis, der an eine Wechselspannung angeschlossen
wird. Diese zusätzliche äußere Kraft muss natürlich in der Bewegungsgleichung des Oszillators
berücksichtigt werden. Für eine harmonische periodische Kraft F/m = A cos Ωt mit Kreisfrequenz
Ω und Amplitude A wird die Bewegungsgleichung zu
dx
d2 x
+ ω02 x = A cos Ωt.
+ 2β
dt2
dt
(10.236)
Der Störterm A cos Ωt macht die ursprüngliche homogene Gleichung zu einer inhomogenen
Gleichung mit konstanten Koeﬃzienten.
Auch für eine solche Diﬀerentialgleichung gilt, dass die allgemeine Lösung der inhomogenen Gleichung als Summe der allgemeinen Lösung der homogenen Gleichung und einer Partikulärlösung
der inhomogenen Gleichung geschrieben werden kann:
x(t) = xh (t) + xp (t).
(10.237)
10 Diﬀerentialgleichungen
269
Dass diese Funktion eine Lösung der inhomogenen Diﬀerentialgleichung ist, kann durch Einsetzen
leicht überprüft werden. Die allgemeine Lösung xh (t) der homogenen Gleichung kennen wir bereits;
wir müssen also jetzt noch nach einer Partikulärlösung xp (t) der inhomogenen Gleichung suchen.
Wir könnten das durch Variation der Konstanten versuchen; es ist jedoch einfacher, einen Lösungsansatz zu machen. Mit einer Winkelfunktion als Störfunktion kann auch die Lösung nur eine Winkelfunktion sein, da durch Diﬀerenzieren nur aus Winkelfunktionen wieder solche entstehen können.
Wir machen also einen Ansatz, der der Störung ähnlich ist
x = K cos(Ωt − ϕ).
(10.238)
ẋ = −KΩ sin(Ωt − ϕ)
(10.239)
ẍ = −KΩ2 cos(Ωt − ϕ).
(10.240)
Die zugehörigen Ableitungen sind:
und
Einsetzen in die Diﬀerentialgleichung ergibt:
− KΩ2 cos(Ωt − ϕ) − 2βKΩ sin(Ωt − ϕ) + ω02 K cos(Ωt − ϕ) = A cos Ωt.
(10.241)
Um die linke und die rechte Seite der Gleichung auf eine ähnliche Form zu bringen, formen wir die
rechte Seite der Gleichung durch Verwendung des Additionstheorems für den Kosinus folgendermaßen um:
A cos Ωt = A cos(Ωt − ϕ + ϕ) = A cos(Ωt − ϕ) cos ϕ − A sin(Ωt − ϕ) sin ϕ.
(10.242)
Einsetzen ergibt
(−KΩ2 + Kω02 ) cos(Ωt − ϕ) − 2βKΩ sin(Ωt − ϕ)
= A cos(Ωt − ϕ) cos ϕ − A sin(Ωt − ϕ) sin ϕ. (10.243)
Diese Gleichung können wir für alle Zeiten t erfüllen, indem wir die Koeﬃzienten vor dem Kosinus
cos(Ωt − ϕ) bzw. vor dem Sinus sin(Ωt − ϕ) auf beiden Seiten gleichsetzen:
− KΩ2 + Kω02 = A cos ϕ,
(10.244)
2βKΩ = A sin ϕ.
(10.245)
Durch Addition der Quadrate beider Gleichungen ﬁnden wir
(−KΩ2 + Kω02 )2 + 4β 2 K 2 Ω2 = A2 cos2 ϕ + A2 sin2 ϕ = A2
(10.246)
oder
K2 =
A2
(ω02
−
Ω2 )2
+ 4β 2 Ω2
.
(10.247)
Division der beiden Gleichungen (10.244) und (10.245) hingegen ergibt
tan ϕ =
2βΩ
2βKΩ
= 2
2
2
K(ω0 − Ω )
(ω0 − Ω2 )
oder
ϕ = arctan
2βΩ
ω02 − Ω2
(10.248)
.
(10.249)
Dadurch erhalten wir als Partikulärlösung der inhomogenen Gleichung mit Störterm A cos(Ωt − ϕ)
A
cos(Ωt − ϕ).
xp (t) = 2
(ω0 − Ω2 )2 + 4β 2 Ω2
(10.250)
270
10 Diﬀerentialgleichungen
Dies ist eine Schwingung mit der gleichen Frequenz wie die Störung, deren Amplitude und Phasenverschiebung von der Eigenfrequenz ω0 des Oszillators, der Erregerfrequenz Ω und dem Reibungskoeﬃzienten β abhängen.
Die allgemeine Lösung der Diﬀerentialgleichung ist die Summe der allgemeinen Lösung der homogenen Gleichung und der gerade gefundenen Partikulärlösung. Da jedoch für einen nichtverschwindenden Reibungskoeﬃzienten die Lösung der homogenen Gleichung in allen Fällen durch
die Dämpfung schnell gegen Null konvergiert, bleibt für lange Zeiten nur die Partikulärlösung übrig.
Nach Beendigung transienter Einschwingvorgänge mit Frequenz ω = ω02 − β 2 oszilliert das
getriebene System infolgedessen mit der Erregerfrequenz Ω.
Wir schauen uns nun die Partikulärlösung der inhomogenen Gleichung etwas genauer an. Die
Amplitude AF der erzwungenen Schwingung ist (siehe Abb. 10.16)
A
AF (Ω) = 2
.
(ω0 − Ω2 )2 + 4β 2 Ω2
(10.251)
Für Erregerfrequenzen Ω, die viel kleiner sind als die Eigenfrequenz ω0 des Oszillators (Ω ω0 ),
ist wegen des Terms (ω02 −Ω2 )2 das Argument der Wurzel im Nenner groß und daher die Amplitude
klein. Die Amplitude ist in diesem Fall AF = A/ω02 (von der Reibung unabhängig). Wenn sich Ω
nun der Eigenfrequenz ω0 nähert, wird der Term (ω02 − Ω2 )2 immer kleiner. Das Argument der
Wurzel erreicht dann ein Minimum und wächst danach wieder an. An der Stelle des Minimums des
Wurzelarguments im Nenner wird die Amplitude maximal. Um diese Stelle zu ﬁnden, setzen wir
die Ableitung des Wurzelarguments gleich Null:
+
∂ * 2
(ω0 − Ω2 )2 + 4β 2 Ω2 = 0.
(10.252)
∂Ω
Das heißt,
2(ω02 − Ω2 )(−2Ω) + 4β 2 2Ω = 0,
(10.253)
Ω(−ω02 + Ω2 ) + 2β 2 Ω = 0.
(10.254)
woraus folgt
Diese Gleichung hat die Lösung Ω = 0 sowie die Lösungen
Ω1,2 = ± ω02 − 2β 2 .
(10.255)
Da Ω eine Frequenz ist, sind wir nur an einer positiven Lösung interessiert:
ΩR = ω02 − 2β 2 .
(10.256)
Für ω02 > 2β 2 ist diese Frequenz ΩR reell. Bei solchen Frequenzen besitzt die Amplitude der
erzwungenen Schwingung als Funktion der Erregerfrequenz Ω irgendwo ein Maximum. Ist hingegen
ω02 < 2β 2 , hat die Amplitude der erzwungenen Schwingung als Funktion von Ω kein Maximum und
die Amplitude nimmt mit wachsendem Ω monoton ab.
Dieses Anwachsen der Amplitude in der Nähe der Eigenfrequenz ω0 nennt man Resonanz und die
zugehörige Frequenz ΩR Resonanzfrequenz. Wie man aus Gleichung (10.256) sieht, ist die Resonanzfrequenz
ΩR verschieden von der Eigenfrequenz ω0 des Oszillators und auch verschieden von
ω02 − β 2 , der Frequenz der ungestörten aber gedämpften Schwingung. Nur für den reibungsfreien
Fall stimmt die Resonanzfrequenz mit der Eigenfrequenz überein.
Die Amplitude bei der Resonanzfrequenz ΩR ist:
AF (ΩR ) =
=
=
A
2
2
2
(ω0 − (ω0 − 2β ))2 + 4β 2 (ω02 − 2β 2 )
A
2
2
(2β ) + 4β 2 (ω02 − 2β 2 )
A
A
.
=
4β 2 (ω02 − β 2 )
2β ω02 − β 2
(10.257)
10 Diﬀerentialgleichungen
271
Abbildung 10.16: Amplitude AF der erzwungenen Schwingung als Funktion der Erregerfrequenz
Ω für verschiedene Reibungskoeﬃzienten β. Je kleiner der Reibungskoeﬃzient β ist, umso größer
ist die Resonanzamplitude. Der Locus der Maxima der Amplitude AF ist als unterbrochene Linie
dargestellt.
Die Resonanzamplitude
wächst also mit abnehmender Reibung und divergiert im reibungsfreien
Fall. (Der Faktor ω02 − β 2 im Nenner kann nicht verschwinden, da die Funktion AF (Ω) nur für
ω02 > 2β 2 ein Maximum bei einer von Null verschiedenen Frequenz Ω besitzt.) Die Amplitude der
erzwungenen Schwingung als Funktion der Erregerfrequenz ist für verschiedene Reibungskoeﬃzienten β in Abb. 10.16 dargestellt.
Die erzwungene Schwingung hat zwar dieselbe Frequenz wie die Erregerschwingung, ist jedoch mit
dieser nicht in Phase. Die Phasenverschiebung gegenüber der Erregerschwingung ist:
2βΩ
ϕ = arctan
.
(10.258)
ω02 − Ω2
Diese Phasenverschiebung ist in Abb. 10.17 für verschiedene Werte von β als Funktion der
Erregerfrequenz dargestellt. Für kleine Ω ist ϕ sehr klein (ϕ → 0 für Ω = 0). Wenn sich Ω
der Eigenfrequenz ω0 nähert, divergiert (2βΩ)/(ω02 − Ω2 ) und die Phasenverschiebung strebt zu
ϕ = π/2. Wenn Ω weiter wächst, wächst auch ϕ weiter und erreicht für Ω → ∞ den Wert ϕ = π.
Abbildung 10.17: Phasenverschiebung ϕ der erzwungenen Schwingung als Funktion der Erregerfrequenz Ω für verschiedene Reibungskoeﬃzienten β.

Zugehörige Unterlagen

UE 7

Blatt 7 - Fachbereich Mathematik

Skriptum - Fakultät für Physik

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können