Einführung in die Theoretische Physik

Skript zur Vorlesung
Einführung in die
Theoretische Physik
von Volker Meden
gehalten im Wintersemester 2015/2016
an der RWTH Aachen
26. Januar 2016
2
Inhaltsverzeichnis
1 Eine kurze Einführung
5
2 Mathematische Methoden
2.1 Einleitung . . . . . . . . . . . . . . . . . . . . .
2.2 Differentialrechnung einer Veränderlichen . . . .
2.3 Integralrechnung einer Veränderlichen . . . . . .
2.4 Logarithmus- und Exponentialfunktion . . . . .
2.5 Potenzreihen und Taylorentwicklung . . . . . .
2.6 Hyperbolische und trigonometrische Funktionen
2.7 Gewöhnliche Differentialgleichungen . . . . . . .
2.8 Komplexe Zahlen . . . . . . . . . . . . . . . . .
2.9 Vektorrechnung . . . . . . . . . . . . . . . . . .
2.10 Fourierreihen . . . . . . . . . . . . . . . . . . .
2.11 Vektorwertige Funktionen . . . . . . . . . . . .
2.12 Funktionen mehrerer Veränderlicher . . . . . . .
2.13 Matrizen . . . . . . . . . . . . . . . . . . . . . .
2.14 Das Eigenwertproblem . . . . . . . . . . . . . .
2.15 Systeme linearer Differentialgleichungen . . . . .
2.16 Die Integration im Rn . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
8
25
34
38
44
49
54
60
69
75
77
89
94
101
108
3 Newtonsche Mechanik Teil I
3.1 Einleitung . . . . . . . . . . . . . . . . . .
3.2 Grundlagen: Raum, Zeit, Masse und Kraft
3.3 Bewegungsgleichung und Erhaltungsgrößen
3.4 Ein Teilchen in einer Dimension . . . . . .
3.5 Krummlinige Koordinaten . . . . . . . . .
3.6 Zweidimensionale Zentralfelder . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
121
121
122
127
134
163
169
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
INHALTSVERZEICHNIS
Kapitel 1
Eine kurze Einführung
Diese Vorlesung verfolgt zwei Ziele. Einerseits geht es darum ihnen relativ schnell
die mathematische Werkzeuge bereitzustellen, die sie in den ersten Semestern
ihres Physikstudiums benötigen werden. Dabei ersetzt die Vorlesung keinesfalls
den Kurs in Höherer Mathematik, der ihnen einen sehr viel systematischeren
Zugang zur Mathematik eröffnen wird.
In einem zweiten kürzeren Teil werden wir uns mit den Grundzügen der klassischen Mechanik beschäftigen, d.h. der Theorie der Bewegung von “klassischen”
Teilchen (wie z.B. Planeten und Fußbällen). Wir wollen den Begriff “klassisch”
hier so verstehen, daß er sich auf hinreichend große (makroskopische) Teilchen
bezieht, deren Geschwindigkeit sehr viel kleiner als die Vakuumgeschwindigkeit
der Lichts c ist. Geht man über diese Grenzen hinaus, so benötigt man statt der
klassischen Mechanik die Quantenmechanik oder relativistische Mechanik, Theorien die in den ersten drei Jahrzehnten des zwanzigsten Jahrhunderts entwickelt
wurden. Beide Konzepte werden sie in späteren Vorlesungen kennenlernen. Diese
Beschränkungen machen sofort klar, daß es sich bei der klassischen Mechanik
um eine Theorie mit eingeschränktem Gültigkeitsbereich handelt. Trotz dieser
Beobachtung bildet sie eine spannendes Gebiet, welches für das Verständnis der
weitaus meisten “mechanischen” Phänomene des Alltags ausreicht. Speziell die
Entwicklung der “Chaos-Theorie” in den letzten Jahrzehnten hat zu einer Wiederbelebung der Forschung im Bereich der klassischen Mechanik geführt. Weiterhin
bildet ein Verständnis der klassischen Mechanik die Grundlage für den Zugang zur
Quantenmechanik und relativistischen Mechanik. Darüberhinaus biete sie einen
vergleichsweise einfachen Einstieg in die Methoden und Konzepte der Theoretischen Physik.
Die Entwicklung der klassischen Mechanik wie wir sie heute kennen geht auf
die Ideen von Galileo (1564-1642) und Newton (1642-1727) zurück. Zwei alternative, zur Newtonschen Mechanik äquivalente Formulierungen der klassischen
Mechanik stammen von Lagrange (1736-1813) und Hamilton (1805-1865). Die
Lagrangesche und Hamiltonsche Mechanik haben den Vorteil, daß mit ihrer Hilfe
oft Lösungen komplexer Probleme einfacher gefunden werden können. Sie wer5
6
KAPITEL 1. EINE KURZE EINFÜHRUNG
den sie in ihrem zweiten Studiensemster in der Vorlesung Theoretische Physik I
kennen lernen.
Bereits im ersten mathematischen Teil dieser Vorlesung werden wir als Motivation der Einführung neuer Konzepte und in Beispielrechnungen (in der Vorlesung
und den zugehörigen Übungen) Probleme aus der Mechanik heranziehen. Dabei
werden wir davon ausgehen, daß sie einfache Konzepte der Newtonschen Mechanik aus der Schule oder (zum benötigten Zeitpunkt bereits) aus der Vorlesung
Experimentalphysik I kennen.
Kapitel 2
Mathematische Methoden
2.1
Einleitung
Im Laufe ihres Studiums werden ihnen verschiedene Arten des Umgangs mit Mathematik begegnen, von ziemlich abstrakt bis sehr anschaulich. Der Schwerpunkt
der Einführung in die Theoretische Physik liegt dabei weniger auf formaler Strenge in den Herleitungen, sondern auf einer relativ anschaulichen Darstellung und
der Anwendung des Gelernten in physikalischen Fragestellungen. Dabei werden
wir was die Vorbedingungen angeht nicht “bei Null anfangen”, sondern setzen ein
gewisses (anschauliches) Vorwissen voraus. Zum Beispiel werden wir nicht sehr
ausführlich auf den Stetigkeitsbegriff eingehen, sondern gehen davon aus, daß sie
ein intuitives Verständnis davon haben, was es heißt, daß eine Kurve stetig ist
(ohne Sprünge). Auf saubere Beweise von “Sätzen” - also Zusammenhängen - die
ihnen zum Teil sicherlich bereits aus der Schule bekannt sind, und eine abstrakte
Formulierung der Konzepte, wie sie sie im Kurs Höhere Mathematik (bzw. den
Grundvorlesungen der Mathematik) kennenlernen werden, verzichten wir hier bewußt. Die Konzepte sollen vielmehr anhand einfacher Beispiele erklärt und geübt
werden. Es stellt meist eine große Herausforderung für Physikstudierende dar,
sich in beiden Herangehensweise an Mathematik - formal und pragmatisch - “zu
hause zu fühlen”. Dieses Ziel zu erreichen ist sehr erstrebenswert, da es für einen
Physiker einerseits wichtig ist Integrale berechnen und Differentialgleichungen
explizit lösen zu können und andererseits essentiell ist die logische Struktur der
Mathematik verinnerlicht zu haben.
Aus ihrer “Schulphysik” ist ihnen sicherlich bekannt, daß man zur Beschreibung der Dynamik eines klassischen Teilchens in einem Kraftfeld Analysis (Differential- und Integralrechnung) und lineare Algebra (Vektorrechnung) benötigt.
Hier einige Beispiele aus der Mechanik, in denen die unter diesen Oberbegriffen
zusammengefaßten mathematischen Methoden eine wichtige Rolle spielen:
• Bahnkurve - Vektor, Vektoraddition, Funktion: ~x(t) = x1 (t)~e1 + x2 (t)~e2 +
x3 (t)~e3
7
8
KAPITEL 2. MATHEMATISCHE METHODEN
• Geschwindigkeit - Differentiation (eindimensional) v(t) =
dx(t)
dt
• Geschwindigkeitsvektor - Differentiation eines Vektors: ~v (t) =
= ẋ(t)
d~
x(t)
dt
= ~x˙ (t)
• Newtonsche Gleichung - zweite Ableitung, Differentialgleichung, vektorwertige Funktion eines Vektor, zusammengesetzte Funktion: m~x¨(t) = F~ (~x(t))
z.B. mẍ(t) = −Kx(t) (Hookesches Gesetz)
Rx
• Arbeit - Integration: W (x1 → x2 ) = x12 F (x)dx
• Leistung - Skalarprodukt: P = F~ · ~v
• Drehimpuls - Vektorprodukt: ~l = ~x × p~
• Potential - partielle Ableitung, Gradient (Differentialrechnung mehrerer
~ (~x)
Veränderlicher): F~ (~x) = −∇V
• Rotationsenergie P
- Summenzeichen, Matrix (Tensor), Hauptachsentransfor1
mation: Erot = 2 3i,j=1 Ωi Ii,j Ωj
Am Ende des mathemtaischen Teils dieser Vorlesung sollten sie an den Umgang
mit einer Vielzahl dieser Begriffe und Rechenprozeduren gewöhnt sein. Wir werden weiterhin wichtige Eigenschaften spezieller Funktionen, z.B. der
• Exponentialfunktion: exp(x) = ex ; exp(x + y) = exp(x) exp(y)
• Logarithmusfunktion: ln(x); ln(xy) = ln(x) + ln(y)
diskutieren, Reihendarstellungen von Funktionen kennenlernen
P
n
• Exponentialfunktion: exp(x) = ∞
n=0 x /n!
und komplexe Zahlen einführen
√
• i = −1; eix = cos x + i sin x.
Zusätzlich werden wir zwei Methode zur approximativen Beschreibung von Funktionen in Form der Taylor- und der Fourierreihe kennen lernen.
2.2
Differentialrechnung einer Veränderlichen
Eine Funktion y = f (x) mit x ∈ D und y ∈ W ist eine spezielle Abbildung,
bei der den Elementen des Definitionsbereichs D - der z.B. eine Teilmenge der
reellen Zahlen R ist (ein oder mehrere Intervalle) - eindeutig ein Element des
Wertebereichs W - der eine ebensolche Teilmenge darstellt - zugeordnet wird.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
D
9
W
f
Um Intervalle als Teilmengen von R zu bezeichnen, verwendet man die Notation
• (a, b) : {x ∈ R|a < x < b}
• [a, b] : {x ∈ R|a ≤ x ≤ b}
• (a, b] : {x ∈ R|a < x ≤ b}
• [a, b) : {x ∈ R|a ≤ x < b}
Häufig zeichnet man den Graphen der Funktion f (x), welcher durch alle Punktepaare x, f (x) mit x ∈ D gebildet wird. In der Physik ist es üblich, y = f (x) zu
schreiben. Betrachten wir zwei einfache Beispiele
y=
√
x : D = [0, ∞) , W = [0, ∞)
4
y
3
2
1
0
−2
0
2
4
x
6
8
10
y = cos x : D = R = (−∞, ∞) , W = [−1, 1]
10
KAPITEL 2. MATHEMATISCHE METHODEN
1
y
0.5
0
−0.5
−1
−10
−5
0
x
5
10
wobei wir immer den größtmöglichen - also den “natürlichen” - Definitionsbereich
gewählt haben.
Es gibt verschiedene analytische Darstellungen von Funktionen (Graphen)
• explizit: y = f (x),
• implizit: F (x, y) = 0,
• Parameterdarstellung: x = g(s), y = h(s) mit zwei Funktionen g, h und
dem (reellen) Parameter s (aus einem gemeinsamen Definitionsbereich von
g und h).
Als Beispiel dazu betrachten wir die obere Hälfte des Kreises mir Radius 1 (Einheitskreis), welche auf die drei Arten
√
• explizit: y = 1 − x2 , x ∈ [−1, 1],
• implizit: F (x, y) = x2 + y 2 − 1 = 0, x ∈ [−1, 1], y ≥ 0,
• Parameterdarstellung: x = cos φ, y = sin φ, φ ∈ [0, π] (Winkel nicht in
Grad, sondern Radiant: 360o entspricht 2π)
gegeben ist.
Eine Funktion heißt monoton wachsend falls aus x1 < x2 , f (x1 ) ≤ f (x2 ) folgt.
Sie heißt streng monoton wachsend falls das ≤ in der zweiten Relation durch ein <
ersetzt werden kann. Völlig analoge Definitionen gibt es für die Begriffe monoton
fallend und streng monoton fallend. Man bezeichnet eine Funktion als nach oben
beschränkt falls es ein M < ∞ gibt mit f (x) ≤ M für alle x ∈ D. Die reelle
Zahl M ist dann eine obere Schranke. Die kleinste obere Schranke ist eindeutig
bestimmt und wird als Supremum bezeichnet. Erneut gibt es analoge Definitionen
für die Begriffe nach unten beschränkt, untere Schranke und Infimum.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
11
Eine Funktion heißt gerade falls f (−x) = f (x) für alle x ∈ D bzw. ungerade
falls f (−x) = −f (x) für alle x ∈ D. Man bezeichnet sie als periodisch mit Periode
P > 0 falls f (x + P ) = f (x) für alle x ∈ D = R.
Man kann nun Summen, Differenzen, Produkte und Quotienten von Funktionen f (x), g(x), h(x), . . . bilden, wobei man sich in jedem speziellen Fall Gedanken
über den Definitions- und Wertebereich der sich jeweils ergebenden Funktionen
machen muß. Eine wichtige Rolle spielen auch zusammengesetzte Funktionen
(f ◦ g) (x) = f (g(x))
f g
f
g
Der Definitionsbereich von f ◦ g ergibt sich aus den x ∈ Dg , für die g(x) ∈ Df
ist. Als Beispiele betrachten wir
f (x) =
√
x ; g(x) = x + 1 ⇒ (f ◦ g)(x) = f (g(x)) =
√
x + 1 ; Df ◦g = [−1, ∞)
4
y
3
2
1
0
f (x) = cos x ; g(x) =
−2
0
2
4
x
6
8
10
1
⇒ (f ◦ g)(x) = f (g(x)) = cos (1/x) ; Df ◦g = R \ {0}
x
12
KAPITEL 2. MATHEMATISCHE METHODEN
1
y
0.5
0
−0.5
−1
−1
−0.5
0
x
0.5
1
Die zusammengesetzte Funktion im zweiten Beispiel ist eine “relativ verrückte”
Funktion, da der Graph für |x| → 0 immer schneller zwischen −1 und 1 hin und
her “zappelt”.
Man bezeichnet eine Funktion f als stetig im Punkt x0 ∈ D, wenn der zugehörige Graph bei x0 keine Sprünge hat (limh→0 f (x0 +h) = f (x0 )) und der Funktionswert bei Annäherung an x0 kleiner Unendlich ist (limh→0 f (x0 + h) < ∞),
d.h. f bei x0 nicht divergiert. Formaler ist die Stetigkeit im Punkt x0 wie folgt
definiert: Für alle ε > 0 gibt es ein δ > 0, so daß für alle x mit |x − x0 | < δ,
|f (x) − f (x0 )| < ε gilt. Eine Funktion heißt stetig in einem Intervall I, falls f
für alle x ∈ I stetig ist. Es gibt verschiedene Typen von Unstetigkeiten. Hebbare
Unstetigkeiten wie die Stelle x = 0 in f (x) = x2 /x, Sprünge wie in
0 x<0
f (x) =
1 x≥0
für x → 0, x < 0, Pole wie in f (x) = (x − a)−2 und wesentliche Singularitäten
wie in f (x) = exp (1/x) bei x = 0. Weitere formale Überlegungen zum Begriff
der Stetigkeit und des oben stillschweigend benutzen Grenzwertes überlassen wir
der HöMaI Vorlesung.
Man teilt Funktionen einer (reellen) Veränderlichen in zwei Klassen ein. Die
elementaren Funktionen und die speziellen Funktionen. Beispiele für die Letzteren
sind z.B. die in der Physik häufiger auftretenden Besselfunktionen, Gammafunktionen und das Exponential-Integral. Elementare Funktionen kann man durch
einen geschlossenen analytischen Ausdruck angeben. Die elementaren Funktionen unterteilt man weiter in algebraische Funktionen, die einer impliziten algebraischen Gleichung der Form
p0 (x) + p1 (x)y + p2 (x)y 2 + . . . + pn (x)y n = 0 ,
mit Polynomen pj (x) (Definition siehe gleich), genügen und transzendente Funktionen (die sich nicht auf diese Art schreiben lassen). Beispiele für die letztere
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
13
Funktionenklasse sind die Exponentialfunktion, der Logartihmus, die hyperbolischen Funktionen und trigonometrischen Funktionen. In einem weiteren Schritt
unterteilt man die algebraischen Funktionen in drei Untergruppen. (i) Polynome
(ganz rationale Funktionen) der Form
f (x) = a0 + a1 x + a2 x2 + . . . + an xn
mit Koeffizienten aj ∈ R, j = 0, 1, . . . , n, wobei an 6= 0 gilt. Für große |x| geht das
Polynom wie an xn und ist somit (falls D = R gilt) nicht nach oben beschränkt.
Mit dem Bestimmen von Nullstellen von Polynomen sollten sie sich bereits in
der Schule auseinander gesetzt haben. Es gilt der Zerlegungssatz, daß sich jedes
Polynom mit reellen Koeffizienten als ein Produkt von linearen und quadratischen
Termen mit reellen Koeffizienten schreiben läßt, wobei die quadratischen Faktoren
keine reellen Nullstellen haben sollten. In dieser Darstellung lassen sich dann die
(reellen) Nullstellen direkt ablesen. Ein Polynom ist überall stetig und hat bis zu
n (reelle) Nullstellen. (ii) Gebrochen rationale Funktionen die sich als Quotient
zweier Polynome in der Form
f (x) =
p(x)
a0 + a1 x + a2 x 2 + . . . + an x n
=
,
b0 + b1 x + b2 x 2 + . . . + bm x m
q(x)
mit aj , bj ∈ R schreiben lassen. An den Nullstellen q(x0 ) = 0 des Nenners ist
die Funktion nicht definiert. Sollte gleichzeitig p(x0 ) = 0 gelten liegt womöglich
eine hebbare Lücke vor (wenn die Nullstelle des Zählers von gleicher oder höherer Ordnung ist wie die des Nenners), sonst ein Pol. Eine Funktion dieser Form
heißt echt gebrochen falls n < m. Ein wichtiges Konzept für gebrochen rationale
Funktionen ist die Partialbruchzerlegung.1 Jede echt gebrochene rationale Funktion läßt sich als Summe von Partialbrüchen der Form a1 /(x − x1 ), a2 /(x − x2 )2 ,
. . . und (b1 x + c1 )/(x2 + r1 x + s1 ), (b2 x + c2 )/(x2 + r2 x + s2 )2 ,. . . schreiben, wobei die Koeffizienten aj , bj , cj , rj und sj aus den reellen Zahlen sind. Die in der
Partialbruchzerlegung auftretenden Nenner sind Teiler von q(x).Wir betrachten
dazu ein Beispiel. Gegeben sei die Funktion
2x3 + 5x2 + 2x + 3
.
x3 + 2x2 + x + 2
Daraus extrahieren wir zunächst die echt gebrochene Funktion g(x)
f (x) =
f (x) = 2 +
x2 − 1
= 2 + g(x) .
x3 + 2x2 + x + 2
Den Nenner zerlegen wir nun in x3 + 2x2 + x + 2 = (x + 2)(x2 + 1). Der Ansatz
für die Partialbruchzerlegung von g(x) lautet dann
g(x) =
1
x2 − 1
a
bx + c
=
+
,
x3 + 2x2 + x + 2
x + 2 x2 + 1
Die Partialbruchzerlegung wird ein wichtiges Hilfsmittel beim Finden der Stammfunktion
für eine gebrochen rationale Funktion sein.
14
KAPITEL 2. MATHEMATISCHE METHODEN
wobei es gilt a, b und c zu bestimmen. Dies geschieht wie folgt. Wir multiplizieren
beide Seiten der Gleichung mit dem Nenner und erhalten
x2 − 1 = a(x2 + 1) + (bx + c)(x + 2) = (a + b)x2 + (2b + c)x + (a + 2c) .
Für beliebige x kann diese Gleichung nur erfüllt werden, wenn die Koeffizienten
vor den Potenzen von x auf beiden Seiten der Gleichung identisch sind. Man
nennt diese Vorgehensweise Koeffizientenvergleich. Aus dieser Forderung ergeben
sich die drei Gleichungen
a+b = 1
2b + c = 0
a + 2c = −1
mit der Lösung a = 3/5, b = 2/5 und c = −4/5. Das Ergebins der Partialbruchzerlegung ist somit
x2 − 1
1
3
2x − 4
f (x) = 2 + 3
=2+
+
.
x + 2x2 + x + 2
5 x + 2 x2 + 1
Die dritte Unterklasse der algebraischen Funktionen sind die (iii) irrationalen
Funktionen. Dabei handelt es sich um alle algebraischen Funktionen, die nicht in
die Klasse (i) oder (ii) fallen.
z.B. die Wurzelfunktion. Ein Beispiel
pSie enthalten
√
2
bildet die Funktion f (x) = (x + 1) x.
Nach dieser kurzen Einführung zu den Eigenschaften von Funktionen gehen
wir zum Begriff der Ableitung über. Dazu nehmen wir an, daß die Funktion f
in einer Umgebung (einem Intervall) um x0 stetig ist. In der Schule wird die
Ableitung meist mit Hilfe der Sekante durch zwei Punktepaare x1 , f (x1 ) und
x2 , f (x2 ) mit x1 < x0 < x2 definiert, die im Limes x1 → x0 und x2 → x0 in die
Tangente am Punktepaar x0 , f (x0 ) übergeht.
4
f(x)
3
2
1
0
0
2
4
6
x
8
10
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
15
Etwas formaler gilt
f (x0 + h) − f (x0 )
,
h→0
h
f 0 (x0 ) = lim
vorausgesetzt, daß dieser Grenzwert existiert.2 Anschaulich ist f 0 (x0 ) die Steigung
der Tangente im Punkt x0 . Falls f 0 (x0 ) existiert, so ist die Funktion im Punkt x0
durch die Tangente linear approximierbar, d.h. näherungsweise durch eine lineare
Funktion der Form g(x) = a + bx beschreibbar (in der obigen Abbildung z.B.
a = 1 und b = 1/4), und f ist in x0 differenzierbar. Eine Funktion ist in x0 z.B.
dann nicht differenzierbar, wenn sie in diesem Punkt einen Knick hat. Wie wir
später noch genauer diskutieren werden, spielt eine näherungsweise Beschreibung
komplizierter Funktionen in der Physik eine sehr wichtige Rolle.
Betrachten wir nun einige Beispiele, wie der Grenzprozeß h →√0 ausgeführt
werden kann und welche Ableitungen f 0 sich ergeben. Für f (x) = x mit x > 0
und x + h > 0 gilt
√
√
x+h− x
√ h
√ √
√ x+h− x
x+h+ x
√
=
√ h x+h+ x
h
√
=
√ h x+h+ x
1
= √
√ .
x+h+ x
f (x + h) − f (x)
=
h
Jetzt kann der Limes h → 0 einfach durch Nullsetzen von h ausgeführt werden,
und man erhält
√
1
x 0 = √ oder
2 x
x1/2
0
1
= x−1/2 .
2
√
An der Rechnung erkennen wir auch, daß x bei x = 0 nicht differenzierbar
ist, denn die Steigung der Tangente wird für x → 0 immer größer und divergiert im Punkt x = 0. Als nächstes betrachten wir f (x) = sin x. Um f 0 zu bestimmen, benötigen wir die Additionstheoreme der trigonometrischen Funktionen
(siehe Übungen):
sin (x ± y) = sin x cos y ± cos x sin y
cos (x ± y) = cos x cos y ∓ sin x sin y
2
(2.1)
(2.2)
Wir betonen noch einmal, daß wir das Konzept der Grenzwertbildung nicht wirklich sauber
definiert haben!
16
KAPITEL 2. MATHEMATISCHE METHODEN
Mit Hilfe von Gl. (2.1) folgt:
sin (x + h) − sin x
h→0
h
sin x cos h + cos x sin h − sin x
= lim
h→0
h
cos h − 1
sin h
= lim sin x
+ cos x
h→0
h
h
(sin x)0 = lim
Wir haben nun noch die beiden Grenzwerte limh→0
untersuchen. Das wollen wir hier graphisch tun3
cos h−1
h
und limh→0
sin h
h
zu
1
(cos(h)−1)/h
sin(h)/h
0.5
0
−0.5
0
0.2
0.4
0.6
0.8
1
h
Also liefert der erste Grenzwert 0 und der zweite 1. Damit ergibt sich
(sin x)0 = cos x.
Analog zeigt man (siehe Übungen):
(cos x)0 = − sin x.
Wichtig - und ihnen sicherlich aus der Schule bereits bekannt - ist auch die
Ableitung der Funktion fn (x) = xn mit n ∈ N0 .4 Sie bestimmt sich aus
(x + h)n − xn
.
h→0
h
fn0 (x) = lim
Um den Limes h → 0 ausführen zu können, müssen wir den Ausdruck (x + h)n
3
Mit Hilfe der Reihendarstellung der sin und cos Funktionen werden wir diese Grenzwerte
später auch analytisch recht einfach bestimmen können (siehe Übungen).
4
N bezeichnet die natürlichen Zahlen 1, 2, 3, . . . und N0 = N ∪ {0}.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
17
ausmultiplizieren. Wir benötigen also
(x + h)n = (x + h)(x + h) . . . (x + h)
|
{z
}
n−mal
n
n(n − 1) n−2 2 n(n − 1)(n − 2) n−3 3
= xn + xn−1 h +
x h +
x h + . . . + hn .
1
2·1
3·2·1
Das kombinatorische Problem, den Vorfaktor des Terms xn−m hm mit m ≤ n zu
bestimmen, führt uns auf die Begriffe Fakultät und Binomialkoeffizient.
Die Fakultät ist definiert als
n! = n(n − 1)(n − 2)(n − 3) · . . . · 1
wobei n ∈ N gilt. Ergänzt wird diese Definition durch 0! = 1. Die Zahl der
Möglichkeiten, n verschiedene Objekte anzuordnen, ist durch n! gegeben. Zum
Beispiel gibt es 4! = 24 Möglichkeiten, die vier Buchstaben A, B, C, D anzuordnen: 4 Möglichkeiten für den ersten Buchstaben ∗ 3 Möglichkeiten für den
zweiten ∗ 2 Möglichkeiten für den dritten ∗ 1 Möglichkeit für den vierten. Abstrakter formuliert heißt das: Die Zahl der Permutationen von n verschiedenen
Objekten ist durch n! gegeben. Um das obige kombinatorische Problem “Wieviele Möglichkeiten gibt es in den n-Faktoren (x + h), (n − m) x’e und m h’s zu
finden” zu lösen, müssen wir einen Schritt weitergehen. Die m h’s kann man auf
n(n−1)(n−2)...(n−m+1)
Arten erhalten:
m!
• n Möglichkeiten für das erste h
• n − 1 Möglichkeiten für das zweite h
• ...
• ...
• n − m + 1 Möglichkeiten für das m-te h
Dabei hat man jetzt jedoch die m! Vertauschungen der Reihenfolge der Wahl
als eigenständig gezählt, so daß man noch durch m! dividieren muß. Den sich
ergebenen Faktor bezeichnet man als Binomialkoeffizienten
n
n(n − 1)(n − 2) . . . (n − m + 1)
n!
=
=
.
m
m!
(n − m)! m!
Der Binomialkoeffizient
gibt z.B. auch die Zahl der Kombinationen im Lotto “6
aus 49”: 49
=
13983816.
Damit ergibt sich für (x + h)n :
6
n n
n n−1
n n−2 2
n n
n
(x + h) =
x +
x h+
x h + ... +
h
0
1
2
n
n X
n n−m m
=
x
h .
m
m=0
18
KAPITEL 2. MATHEMATISCHE METHODEN
Wir haben in diesem Ausdruck das Summenzeichen
n
X
= Summe über m von 0 bis n
m=0
eingeführt.
Nach diesem Einschub kommen wir auf das Problem (xn )0 = . . . zurück. Es
ergibt sich
(x + h)n − xn
h→0
h
n n−1
n
x + 1 x h + n(n−1)
xn−2 h2 +
2·1
(xn )0 = lim
= lim
h→0
n−1
= nx
n(n−1)(n−2) n−3 3
x h
3·2·1
+ . . . + hn − xn
h
,
(2.3)
wobei der Limes h → 0 jetzt durch Nullsetzen von h ausgeführt werden kann.
Über einige Umwege haben wir so das ihnen bekannte Ergebnis erhalten.
Es gibt mehrere wichtige Rechenregeln, die einem helfen, Ableitungen von
Funktionen zu bestimmen.5 Seien f und g differenzierbare Funktionen, so gilt
• (f ± g)0 = f 0 ± g 0
• Produktregel: (f · g)0 = f 0 · g + f · g 0
0
0
g0
• Quotientenregel: fg = f g−f
g2
Den Beweis dieser Regeln verschieben wir auf die Übungen. Mit Hilfe der Quotientenregel läßt sich das Ergebnis Gl. (2.3) auf negative ganze Zahlen n = −|m| erweitern (siehe Übungen), so daß jetzt für alle ganzen Zahlen n ∈ Z, (xn )0 = nxn−1
gilt. Genauer wollen wir hier die Kettenregel betrachten, die angibt, wie man zusammengesetzte Funktionen differenziert. Für die differenzierbaren Funktionen f
und g müssen wir den Limes
f (g(x + h)) − f (g(x)) g(x + h) − g(x)
f (g(x + h)) − f (g(x))
= lim
h→0
h→0
h
g(x + h) − g(x)
h
lim
ausführen, wobei wir angenommen haben, daß g(x + h) 6= g(x) gilt, g(x) also
keine konstante Funktion ist - in welchem Fall f (g(x + h)) − f (g(x)) = 0 wäre
und damit (f ◦ g)0 = 0 gelten würde. Mit der Abkürzung h̃ = g(x + h) − g(x) gilt
f (g(x + h)) − f (g(x))
f (g(x) + h̃) − f (g(x)) g(x + h) − g(x)
= lim
.
h→0
h→0
h
h
h̃
lim
5
Zum Beispiel läßt sich die Ableitung der Tangensfunktion tan x =
Quotientenregel bestimmen (siehe später).
sin x
cos x
leicht mit Hilfe der
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
19
Wegen der Stetigkeit von g geht mit h auch h̃ gegen 0, so daß
(f (g(x)))0 = f 0 (g(x)) g 0 (x)
folgt. Eine “saubere” Ausformulierung des Beweises werden sie in der Vorlesung
HöMa I kennenlernen.
Als nächstes werden wir das Konzept der impliziten Funktion genauer diskutieren, das für sich genommen wichtig ist und oft auch bei der Bestimmung von
Ableitungen hilfreich sein kann. Durch eine Gleichung der Form F (x, y) = 0 wird
im Allgemeinen eine Kurve in der x-y-Ebene festgelegt. Zum Beispiel beschreibt
F (x, y) = x2 + y 2 − 1 = 0 einen Kreis mit Radius 1, den man als Einheitskreis
2
2
bezeichnet. Löst man die
√ Gleichung x + y − 1 = 0 nach y auf, so ergeben sich
2
zwei Funktionen y = ± 1 − x , wobei x ∈ [−1, 1] = D zu wählen ist.
1
0.5
2 1/2
y1=(1−x )
2 1/2
y2=−(1−x )
y
0
−0.5
−1
−1
−0.5
0
x
0.5
1
2
Als weiteres Beispiel betrachten wir die Gleichung G(x,
√ z) = z −x = 0. Aufgelöst
nach z ergeben sich wieder zwei Funktionen z = ± x mit D = [0, ∞).
4
1/2
z1=x
1/2
z2=−x
z
2
0
−2
−4
0
2
4
6
8
10
x
1
Die Ableitung des oberen Parabelastes kennen wir bereits:6 dz
= 2√1 x . Man kann
dx
die Ableitung aber auch ohne Auflösen nach z erhalten, wenn man die Methode
6
Wir schreiben hier zum ersten mal statt z10 für die Ableitung der Funktion z1 nach der
20
KAPITEL 2. MATHEMATISCHE METHODEN
der impliziten Differentiation verwendet:
z
2
= x
d
dx
dz
= 1
dx
dz
1
=
.
dx
2z
Mit Hilfe dieses Ausdrucks erhalten wir auch gleich die Ableitungen für die beiden
Funktionen:
dz1
1
dz2
1
= √ ;
=− √ .
dx
dx
2 x
2 x
Besonders hilfreich ist die Differentiation impliziter Funktionen, wenn es nicht
möglich ist, die Gleichung F (x, y) = 0 nach y aufzulösen. Zum Beispiel F (x, y) =
x3 + y 3 − 9xy :
d
x3 + y 3 − 9xy = 0 dx
dy
2
2 dy
− 9y − 9x
= 0
3x + 3y
dx
dx
3y 2 − 9x y 0 = 9y − 3x2
9y − 3x2
.
y0 =
3y 2 − 9x
2z
Wir können die implizite Differentiation auch verwenden, um die Regel ( xn )0 =
nxn−1 (siehe Gl. (2.3)) auf rationale α = m/n mit m, n ∈ Z zu verallgemeinern.
Die Menge der rationalen Zahlen wird oft mit Q bezeichnet. Für x > 0 betrachten
wir y = xm/n , also y n = xm . Damit ergibt sich
d
y n = xm dx
dy
ny n−1
= mxm−1
dx
m xm−1
y0 =
n y n−1
m xm−1
y0 =
n (xm/n )n−1
y
0
y0
m xm−1
=
n xm−m/n
m m/n−1
=
x
,
n
1
Variablen x, dz
dx . Wir werden diese Bezeichnung für die Ableitung im folgenden häufiger ver1
wenden. Es gilt zu beachten, daß dz
dx kein “Bruch” im eigentlichen Sinne ist. Man darf also in
dz1
1
der Gleichung dx = 2√x nicht beide Seiten mit dx multiplizieren, da dx für sich genommen
erst dann einen Sinn macht, wenn man den Umgang mit Differentialformen gelernt hat.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
21
also für rationale α: ( xα )0 = αxα−1 .
Aus der Schule kennen sie sicherlich das Konzept der Umkehrfunktion. Um
diese einzuführen, müssen wir zunächst einen weiteren Begriff definieren: Eine
Funktion f (allgemeiner eine Abbildung) heißt injektiv oder eineindeutig, falls
für alle beliebigen Paare x1 6= x2 aus D auch f (x1 ) 6= f (x2 ). Nur wenn diese
Eigenschaft erfüllt ist, kann man eine Funktion umkehren.
W
D
f
Dazu zwei Beispiele:
nicht injektiv
injektiv
1000
f(x)=x
100
3
f(x)=x
2
80
500
f(x)
60
0
40
−500
−1000
−10
20
−5
0
x
5
10
0
−10
−5
0
x
5
10
Für eine injektive Funktion kann man die Umkehrfunktion f −1 definieren.
f -1
D
W
Für diese gilt dann für alle x ∈ Df
f
f −1 (f (x)) = x,
(2.4)
und für alle x ∈ Wf = Df −1
f (f −1 (x)) = x.
Wir betrachten zunächst einige einfache Beispiele zur Konstruktion von f −1 und
−1
0
0
zur Berechnung von dfdx = (f −1 ) = f −1 bei gegebenem f .
22
KAPITEL 2. MATHEMATISCHE METHODEN
1/3
• f (x) = x3 : Da für x ≥ 0, (x3 ) = x gilt erhält man f −1 (x) = x1/3 , und
1/3
für x < 0 gilt − (−(x3 )) = x, also f −1 (x) = −(−x)1/3 .
2
f(x)
−1
f (x)
g(x)
1
0
−1
−2
−2
−1
0
x
1
2
0
Die Ableitung von f −1 für x > 0 ergibt sich zu f −1 (x) = 13 x−2/3 . Für x < 0
0
folgt mit Hilfe der Kettenregel f −1 (x) = 31 (−x)−2/3 . Damit ist, wie man
auch der Abbildung entnimmt, der Wert der Ableitung von f −1 bei x gleich
dem bei −x.
• f (x) = ax + b, mit a = 2 und b = 1. Zur Bestimmung von f −1 lösen wir
die Gleichung y = ax + b nach x auf x = a1 (y − b) und erhalten f −1 durch
Vertauschen von x und y: f −1 (x) = a1 (x − b).
2
f(x)
−1
f (x)
g(x)
1
0
−1
−2
0
−2
−1
0
x
1
2
Es gilt f −1 (x) = a1 . Da f 0 (x) = a, finden wir, daß die Steigung der Inversen
der linearen Funktion durch das Inverse der Steigung der linearen Funktion
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
23
selbst gegeben ist. Dieses ist die zentrale Beobachtung, mit deren Hilfe wir
0
f −1 (x) allgemein bestimmen können.
Aus den obigen Abbildungen erkennt man eine allgemeingültige graphische Konstruktionsvorschrift, wie sich f −1 aus f bestimmen läßt: Durch Spiegelung an
der Winkelhalbierenden g(x) = x. Aus dem zweiten Beispiel ergibt sich sofort
0
auch ein Konstruktionsprinzip für f −1 : Wenn die Tangente an f durch x0 , f (x0 )
die Steigung f 0 (x0 ) hat, so hat die Tangente an f −1 durch f (x0 ), f −1 (f (x0 )) die
Steigung 1/f 0 (x0 ), so daß allgemein
0
f −1 (f (x0 )) =
1
f 0 (x
0)
(2.5)
gilt. Weniger “konstruktiv” läßt sich Gl. (2.5) mit Hilfe der Definitionsgleichung
Gl. (2.4) und der impliziten Differentiation herleiten (siehe Übungen). Mit Hilfe
der Gl. (2.5) läßt sich z.B. die Ableitung der arctan-Funktion leicht bestimmen.
sin x
Mit f (x) = tan x = cos
folgt nach der Quotientenregel
x
f 0 (x) =
1
cos2 x + sin2 x
=
.
2
cos x
cos2 x
Damit gilt also
cos2 x0
1
1
2
=
cos
x
=
,
=
0
2
0
2
f (x0 )
1 + tan2 x0
sin x0 + cos x0
so daß sich nach Gl. (2.5)
arctan0 (tan x0 ) =
1
1 + tan2 x0
und damit
(arctan x)0 =
1
1 + x2
ergibt.
Wie wir bereits in der Einleitung gesehen haben, benötigt man in der Mechanik auch höhere Ableitungen f (n) (x) einer Funktion f . Diese sind für n = 2, 3, 4, . . .
rekursiv definiert
dn f (x)
d dn−1 f (x)
=
.
dxn
dx
dxn−1
Für “kleine” n verwendet man auch die “n-Striche” (bzw. “n-Punkte”) Notation
f 00 , f 000 , . . . .
24
KAPITEL 2. MATHEMATISCHE METHODEN
Die trigonometrischen Funktionen haben dabei die interessante Eigenschaft
(sin x)00 = (cos x)0 = − sin x ,
(cos x)00 = (− sin x)0 = − cos x .
Damit gilt für die Funktion y(x) = a sin x+b cos x, y 00 (x) = − (a sin x + b cos x) =
−y(x). Umgeformt folgt
y 00 (x) + y(x) = 0.
(2.6)
Diese Gleichung führt uns auf ein sehr wichtiges weiteres Konzept: Die Differentialgleichung. Eine Differentialgleichung ist eine Gleichung, in der die Funktion
y(x), ihre Ableitungen y 0 (x), y 00 (x), . . . , y (n) (x) und x selbst auftreten. Ist die n-te
Ableitung die höchste vorkommende, so spricht man von einer Differentialgleichung n-ter Ordnung. Gl. (2.6) ist also eine Differentialgleichung zweiter Ordnung. Im Allgemeinen ist es sehr kompliziert und oft unmöglich, die Lösung einer
Differentialgleichung geschlossen (analytisch) anzugeben. Differentialgleichungen
spielen in der Physik eine sehr wichtige Rolle. Zum Beispiel bildet die (eindimensionale) Newtonsche Gleichung mẍ(t) = F (x(t)) eine Differentialgleichung
zweiter Ordnung. Ist nun die Kraft F proportional der Auslenkung x einer Masse m - was einer näherungsweisen Beschreibung der Rückstellkraft einer Feder
entspricht - so ergibt sich das Hookesche Gesetz mẍ(t) = −Kx(t) (K heißt die
Rückstellkonstante), oder
ẍ(t) +
K
x(t) = 0 ,
m
(2.7)
was bis auf einen Faktor der Gleichung (2.6) entspricht. Um eine Lösung für Gl.
(2.7) zu finden, müssen wir die Lösung von Gl. (2.6) noch leicht modifizieren. Dazu
berechnen wir zunächst die ersten und zweiten Ableitungen von f (t) = sin (ωt)
und g(t) = cos (ωt) mit Hilfe der Kettenregel
f˙(t) = ω cos (ωt) ; f¨(t) = −ω 2 sin (ωt) = −ω 2 f (t)
ġ(t) = −ω sin (ωt) ; g̈(t) = −ω 2 cos (ωt) = −ω 2 g(t).
Bilden wir jetzt wieder die Linearkombination x(t)
q = af (t) + bg(t), so ist diese
Funktion x(t) eine Lösung von Gl. (2.7), falls ω = K
. Im Problem der Bewegung
m
eines Teilchens der Masse m, welches mit einer Feder mit der Federkonstanten
K verbunden ist, muß die Lösung x(t) jetzt noch zwei Anfangsbedingungen (oder
Randbedingungen) erfüllen. Zur Zeit t = 0 soll das Teilchen am festgelegten Ort
x0 sein, so daß b = x0 zu gelten
p mhat, und es soll die Anfangsgeschwindigkeit v0
haben, woraus a = v0 /ω = v0 K folgt. Die Lösung der Newtonschen Gleichung
lautet für diesen Fall somit
r
v0
K
x(t) = x0 cos (ωt) + sin (ωt) mit ω =
.
(2.8)
ω
m
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
25
Eine genauere Diskussion der sich ergebenen oszillierenden Bewegung verschieben
wir auf später (und die Experimentalphysik I Vorlesung). Wir werden in späteren Kapiteln mehrfach auf das Konzept der Differentialgleichung zurückkommen
bevor wir uns mit diesem in einem eigenen Kapitel genauer vertraut machen.
Zum Abschluß dieses Kapitels zwei wichtige Hinweise: Die vielen oben diskutierten Rechentricks sind bei der Bestimmung der Ableitung einer Funktion sehr
hilfreich. Gerade für Physiker ist es jedoch auch legitim, sich durch graphische
Darstellung der zu differenzierenden Funktion f (x) ein anschauliches Bild von
der Ableitung f 0 (x) als Steigung von f (x) im Punkt x zu verschaffen - und sei
es nur als Konsistenzcheck des formal gewonnenen Ergebnisses. Dazu untersucht
man für die Funktion f am besten Fragen der Art: Wo ist die Steigung groß,
wo klein? Ist sie positiv oder negativ? Wo findet ein Vorzeichenwechsel der Steigung statt? In der Physik kennt man die zu differenzierende Funktion oft nicht
analytisch - z.B. wenn man eine (eindimensionale) Bahnkurve eines Teilchens
x(t) experimentell bestimmt hat und an der Geschwindigkeit des Teilchens v(t)
interessiert ist. In diesem Fall muß die Differentiation numerisch ausgeführt werden. Leider ist die numerische Differentiation kein sehr “stabiles” Verfahren, was
heißt, daß sich kleine Meßfehler bei der numerischen Differentiation verstärken
können (siehe spätere Mathematikvorlesungen). Die einfachste Form der numerischen Differentiation kennen sie sicherlich bereits aus der “Schulphysik”. Nehmen
wir z.B. an, der Ort x eines Teilchens wurde zu den Zeiten tn = t0 + nh, mit
n ∈ N0 und festem h, bestimmt. In diesem Fall können wir die Geschwindigkeit
zur Zeit tn , v(tn ), näherungsweise zu v(tn ) = x(tn+1h)−x(tn ) (Vorwärtsdifferenzenn−1 )
quotient) bestimmen. Genauso legitim wäre eine Zuordnung v(tn ) = x(tn )−x(t
h
(Rückwärtsdifferenzenquotient). Eine glattere Kurve für die Geschwindigkeit lien−1 )
fert allerdings oft die Zuordnung v(tn ) = x(tn+1 )−x(t
(zentrierter Differenzen2h
quotient), bei der die Steigung im Punktepaar tn , x(tn ) gleich der Steigung der
Sekante durch tn−1 , x(tn−1 ) und tn+1 , x(tn+1 ) gesetzt wird.
2.3
Integralrechnung einer Veränderlichen
Bereits gegen Ende des letzten Kapitels haben wir Differentialgleichungen betrachtet. Wir wollen nun die einfachste Differentialgleichung erster Ordnung
y 0 (x) = f (x)
untersuchen. Wir suchen also zu einer gegebenen Ableitung y 0 (x) = f (x) eine
zugehörige Funktion y(x) = F (x), so daß F 0 (x) = f (x) gilt. Man nennt eine
Lösung der Differentialgleichung, also die Funktion F (x), eine Stammfunktion
von f (x). Das sich stellende Problem ist die Umkehrung der Ableitung. Bereits
im letzten Kapitel haben wir darauf hingewiesen, daß es im Allgemeinen kein
“Rezept” gibt, die Lösung einer Differentialgleichung zu bestimmen. Gleiches gilt
für das Finden einer Stammfunktion. Einfache Klassen von Stammfunktionen
26
KAPITEL 2. MATHEMATISCHE METHODEN
0
erhält man durch das Umdrehen der Ableitungsrelationen, z.B. (xn+1 ) = (n +
1
1)xn , so daß Fc (x) = n+1
xn+1 + c, mit der beliebigen reellen Konstanten c, für
n + 1 6= 0 eine Stammfunktion von f (x) = xn ist. Hier eine kleine Tabelle von
Stammfunktionen
Funktion f
Stammfunktion F
1
n
x ; n 6= −1
xn+1 + c
n+1
sin (ax) ; a 6= 0
− a1 cos (ax) + c
1
cos (ax) ; a 6= 0
sin (ax) + c
a
1
arctan
x+c
1+x2
Aus der Definition der Stammfunktion ergibt sich eine offensichtliche Rechenregel: Ist F Stammfunktion von f und G Stammfunktion von g, so ist
aF (x) + bG(x) Stammfunktion von af (x) + bg(x). Zum Beispiel können wir mit
Hilfe dieser Regel eine Stammfunktion von f (x) = sin2 x bestimmen
f (x) = sin2 x =
⇒ F (x) =
1 1
− cos (2x)
2 2
1
1
x − sin (2x) + c.
2
4
Zunächst einmal wollen wir noch die ihnen wahrscheinlich bekannte übliche Schreibweise (unbestimmtes Integral)
Z
F (x) = f (x) dx
(2.9)
für eine Stammfunktion F zur Funktion f vermeiden. Sie wäre an dieser Stelle
eher verwirrend, denn speziell ist nicht klar, was der Ausdruck dx hier zu bedeuten
hat. Stattdessen schreiben wir
F (x) = SF [f (x)] .
Als physikalisches Beispiel betrachten wir den freien, senkrechten Fall eines
Steins. Die Newtonsche Gleichung für die zeitabhängige Geschwindigkeit v(t)
(nach unten) lautet in diesem Fall
dv(t)
=g ;
dt
mit der Erdbeschleunigung g ≈ 9, 81m/s2 .
Sie stellt damit eine Differentialgleichung von dem soeben diskutierten Typ dar,
wobei die Funktion f (t) durch die konstante Funktion f (t) = g gegeben ist. Eine
Stammfunktion zu f (t) = g wird durch v(t) = gt + c gegeben. Setzt man nun
t = 0, so folgt v(0) = c, mit der Anfangsgeschwindigkeit v(0), so daß wir bei
vorgegebener Anfangsgeschwindigkeit auch v(t) = v(0) + gt schreiben können.
Aus den Umkehrungen der Produkt- und der Kettenregel für die Differentiation ergeben sich zwei wichtige Tricks zur Bestimmung der Stammfunktion.
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
27
• Die Produktregel lautet
(f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x)
woraus sich
SF [f 0 (x)g(x) + f (x)g 0 (x)] = f (x)g(x)
oder
SF [f 0 (x)g(x)] = f (x)g(x) − SF [f (x)g 0 (x)]
(2.10)
ergibt. Kennt man also eine Stammfunktion von f (x)g 0 (x) (oder f 0 (x)g(x)),
so folgt eine von f 0 (x)g(x) (oder f (x)g 0 (x)) mit Hilfe von Gl. (2.10). Man
nennt diesen Rechentrick partielle Integration - eine Bezeichnung, deren
Ursprung erst später klar werden wird. Als Beispiel betrachten wir
f (x) = sin x ; g(x) = x ⇒ f 0 (x) = cos x ; g 0 (x) = 1
⇒ SF [x cos x] = x sin x − SF [sin x] = x sin x + cos x + c
• Sei F (x) eine Stammfunktion von f (x) und g(x) eine differenzierbare Funktion, so lautet die Kettenregel
d
F (g(x)) = F 0 (g(x))g 0 (x) = f (g(x))g 0 (x).
dx
Damit gilt die Substitutionsregel
SF [f (g(x))g 0 (x)] = F (g(x)).
(2.11)
Zum Beispiel
f (x) = sin x ; g(x) = x2
⇒
F (x) = − cos x ; g 0 (x) = 2x
⇒ SF 2x sin x2
= − cos x2 + c
Die beiden Beispiele zeigen, wie man die Liste der Stammfunktionen mit Hilfe
dieser Tricks beliebig verlängern kann. In der Praxis ergibt sich jedoch eine andere
Situation. Eine Funktion ist gegeben, und man muß sehen, ob die obigen Rechenregeln bei der Suche nach einer Stammfunktion weiterhelfen. Betrachten
√ wir dazu
ein Beispiel: Wir wollen eine Stammfunktion zur Funktion h(x) = x 1 − x bestimmen. Es ist klar, daß der√Faktor x durch Differenzieren einfacher wird. Eine
Stammfunktion des Faktors 1 − x läßt sich leicht mit Hilfe der Substitutionsregel bestimmen:
f (x) = −x1/2
⇒
g(x) = 1 − x
⇒
⇒
2
F (x) = − x3/2
3
0
f (g(x))g (x) = −(1 − x)1/2 (−1) = (1 − x)1/2
√
2
SF 1 − x = − (1 − x)3/2 + c
3
28
KAPITEL 2. MATHEMATISCHE METHODEN
Um gleich die partielle Integration anwenden zu können, benötigen wir auch eine
Stammfunktion von − 32 (1 − x)3/2
2
f (x) = x3/2
3
⇒
F (x) =
2 2 5/2
x
35
2
2
f (g(x))g 0 (x) = (1 − x)3/2 (−1) = − (1 − x)3/2
3
3
22
2
⇒
SF − (1 − x)3/2 =
(1 − x)5/2 + c
3
35
√
Damit können wir jetzt SF[x 1 − x] mit partieller Integration berechnen:
√
f 0 (x) = 1 − x ; g(x) = x
√
2
22
⇒ SF x 1 − x = − x(1 − x)3/2 −
(1 − x)5/2 + c
3
35
Von der Richtigkeit des Ergebnisses überzeugt man sich am besten immer durch
Differenzieren.
Ein sehr hilfreiches Konzept bei der Bestimmung einer Stammfunktion einer gebrochen rationalen Funktion f (x) = p(x)/q(x), mit Polynomen p(x) und
q(x) ist die Partialbruchzerlegung. Wie oben diskutiert läßt sich jede echt gebrochene rationale Funktion als Summe von Partialbrüchen der Form a1 /(x − x0 ),
a2 /(x−x0 )2 , . . . und (b1 x+c1 )/(x2 +rx+s), (b2 x+c2 )/(x2 +rx+s)2 ,. . . schreiben.
Bis auf den Term der Form a1 /(x − x0 ) können für diese Summanden mit dem
was wir bereits gelernt haben getrennt Stammfunktionen angegeben werden. Eine
Stammfunktion von f (x) ergibt sich dann durch Aufsummation der Stammfunktionen der einzelnen Summanden. Mit Hilfe der Substitution und dem ersten
Eintrag in unserer kleinen Liste von Stammfunktionen sieht man leicht, daß
1
1
+ c , k = 2, 3, . . . .
SF (x − x0 )−k = −
k − 1 (x − x0 )k−1
g(x) = 1 − x
⇒
Für den Fall k = 1 werden wir im nächsten Kapitel zeigen, daß
SF (x − x0 )−1 = ln |x − x0 | + c ,
(2.12)
mit der ihnen sicherlich aus der Schule bekannten natürlichen Logarithmusfunktion ln (x). Wir wollen Vorgreifen und dieses Ergebnis bereits hier verwenden. Zur
Bestimmung einer Stammfunktion der Summanden der Form (b1 x + c1 )/(x2 +
rx + s) gehen wir wie folgt vor. Es gilt
bx + c
b
2x + r − r + 2c/b
SF 2
= SF
x + rx + s
2
x2 + rx + s
b
2x + r
rb
1
= SF 2
+ c−
SF
2
x + rx + s
2
(x + r/2)2 + s − r2 /4
b
2x + r
c − rb/2
1
+
SF
.
= SF 2
2
x + rx + s
s − r2 /4
(x + r/2)2 /(s − r2 /4) + 1
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
29
Anwenden der Substitutionsregel zusammen mit Gl. (2.12) (erster Summand)
und dem letzten Eintrag unserer Liste von Stammfunktionen (zweiter Summand)
liefert das Ergebnis
b
c − rb/2
x + r/2
bx + c
= ln x2 + rx + s + p
arctan p
+ c(2.13)
.
SF 2
x + rx + s
2
s − r2 /4
s − r2 /4
Für höhere Potenzen (bx + c)(x2 + rx + s)l , mit l = 2, 3, 4, . . . gilt
bx + c
1 d
bx + c
SF
=−
SF
.
(x2 + rx + s)l
l − 1 ds
(x2 + rx + s)l−1
Durch wiederholtes Anwenden dieser Beziehung können die bei der Stammfunktionsbildung einer echt gebrochen rationalen Funktion auftretenden Terme dieser Form (also nach einer Partialbruchzerlegung der Funktion) auf das Ergebnis
Gl. (2.13) und mehrfache Differentiation zurückgeführt werden.
Auch wenn dieses Kapitel mit “Integralrechnung” überschrieben ist, haben
wir bis hierher nur von der Umkehrung der Differentiation und nicht von der
Integration geredet. Wir wollen nun die Integralrechnung über den Zusammenhang zwischen der Stammfunktion und der Flächenberechnung einführen. Für
eine stetige Funktion f (x) wollen wir die dunkel dargestellte Fläche für festes c
als Funktion von x0 betrachten und bezeichnen sie mit F̃ (x0 ):
F̃ (x0 ) = Fläche zwischen f (x) und der x-Achse von c bis x0
14
12
f(x)
10
8
6
4
2
0
0
1
2
3
4
x
c
5
x0
Wir untersuchen nun die Ableitung dieser Funktion F̃ (x0 )
F̃ (x0 + h) − F̃ (x0 )
.
h→0
h
F̃ 0 (x0 ) = lim
Aufgrund der Definition von F̃ (x0 ), ist F̃ (x0 + h) − F̃ (x0 ) die Fläche zwischen
f (x) und der x-Achse von x0 bis x0 + h.
30
KAPITEL 2. MATHEMATISCHE METHODEN
14
12
f(x)
10
8
6
4
x0
x0 +h
2
0
0
1
2
3
4
5
x
Vergrößert ergibt sich folgende Situation
f(x0)
f(x0+h)
x0
x 0 +h
x0 +α h
Wie man in der Skizze erkennt, gibt es ein α ∈ R mit 0 < α ≤ 1, so daß die Fläche
F̃ (x0 + h) − F̃ (x0 ) gleich der Fläche hf (x0 + αh) eines Rechtecks ist (man nennt
dieses den Mittelwertsatz, den sie in der HöMa Vorlesung “korrekt” beweisen
werden). Dabei kennen wir α nicht, was aber im folgenden keine Rolle spielen
wird. Wir haben damit
F̃ (x0 + h) − F̃ (x0 )
h→0
h
hf (x0 + αh)
= lim
h→0
h
= f (x0 ).
F̃ 0 (x0 ) = lim
Es ergibt sich also F̃ 0 (x0 ) = f (x0 ), was bedeutet, daß F̃ eine Stammfunktion von
f ist. Wir schreiben damit statt F̃ jetzt F . Als nächstes betrachten wir die Fläche
zwischen f (x) und der x-Achse von einem festen a bis zu einem festen b.
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
31
14
12
f(x)
10
8
6
4
2
0
0
1
a
2
3
x
4
5
b
Die übliche Bezeichnung für diese Fläche ist
Z
b
f (x) dx = Fläche zwischen f (x) und der x-Achse von a bis b,
a
so daß wir
Z
b
f (x) dx = F (b) − F (a)
(2.14)
a
schreiben können. Die beliebige Konstante, die wir bei der Bestimmung einer
Stammfunktion F immer hinzuaddieren mußten, fällt auf der rechten Seite dieser
Gleichung dabei heraus. Man bezeichnet den Zusammenhang in Gl. (2.14) als
Hauptsatz der Differential- und Integralrechnung. Er stellt einen Zusammenhang
zwischen dem Problem der Bestimmung einer Stammfunktion und dem Problem
der Flächenberechnung her. Man bezeichnet die linke Seite von Gl. (2.14) auch
als bestimmtes Integral.
Bei den obigen Überlegungen haben wir uns keine Gedanken darüber gemacht, wie Flächen mit krummlinigen Begrenzungen (durch die Funktion f (x))
überhaupt sauber definiert sind. Als Grenzprozedur läßt sich das z.B. mit Hilfe
der Riemann-Summe erreichen
32
KAPITEL 2. MATHEMATISCHE METHODEN
14
12
f(x)
10
8
6
4
2
0
0
1
a
Z
b
f (x) dx = lim
N →∞
a
2
∆x
N
X
3
x
f (a + i∆x) ∆x ;
i=1
4
5
b
∆x =
b−a
N
Diese Formel gibt auch eine Möglichkeit ein bestimmtes Integral numerisch zu
berechnen. Es gibt aber weit geschicktere numerische Berechnungsmöglichkeiten
als die obige Rechteckregel, wie z.B. die Trapezregel oder noch besser die SimpsonRegel.
Als ein Beispiel der Flächenmessung (bestimmte Integration) betrachten wir
f (x) = sin x
1
f(x)=sin(x)
0.8
f(x)
0.6
0.4
0.2
0
Z
0
0
π/2
x
π
π
sin x dx = − cos π − (− cos 0) = − cos x|π0 = 2
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
33
Es soll hier noch angemerkt werden, daß die Bezeichnung der Integrationsvariablen willkürlich ist, also
Z
b
Z
b
f (u) du
f (x) dx =
a
a
gilt.
Jetzt wollen wir die Regeln zur Bestimmung der Stammfunktion so umformulieren, daß wir mit ihrer Hilfe bestimmte Integrale berechnen können. Betrachten
wir zunächst die Substitutionsregel. Aus SF [f (g(x))g 0 (x)] = F (g(x)) folgt
b
Z
f (g(x))g 0 (x) dx = F (g(b)) − F (g(a))
Z g(b)
f (u) du ,
=
a
(2.15)
g(a)
indem wir zweimal den Hauptsatz anwenden. Um den Anschluß an Lehrbücher
zu finden, diskutieren wir diese Regel auch in der üblicheren Formulierung, die
sich gut als Merkregel eignet. Dabei führt man die “Substitution”
du
= g 0 (x)
dx
du
⇒ f (g(x))g 0 (x) dx = f (u) dx“ = ”f (u) du
dx
u = g(x)
⇒
aus. Das letzte Gleichheitszeichen steht dabei in Anführungszeichen, damit man
nicht vergißt, daß auch die Integrationsgrenzen verändert werden müssen (siehe Gl. (2.15)). In unserer ursprünglichen Herleitung mußten wir jedoch keine
infinitesimalen Größen kürzen, was ein klarer Vorteil ist. Der Umgang mit diesen Größen kann formalisiert werden, wenn man den Begriff der Differentialform
einführt, wozu wir jedoch hier keine Zeit haben. Dieser Begriff wird speziell in
der Thermodynamik gebraucht.
Die Produktregel übersetzt sich wie folgt auf bestimmte Integrale: Wegen
Z
a
b
dG(x)
dx = G(b) − G(a) = G(x)|ba
dx
folgt durch Integration von (f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x)
Z
b
0
f (x)g(x) dx =
a
f (x)g(x)|ba
Z
−
b
f (x)g 0 (x) dx ,
(2.16)
a
was die Bezeichnung partielle Integration erklärt. Beispiele werden sie in den
Übungen rechnen.
34
2.4
KAPITEL 2. MATHEMATISCHE METHODEN
Logarithmus- und Exponentialfunktion
Wir wollen als nächstes eine über ein Integral definierte Funktion
x
Z
L(x) =
1
1
du ,
u
x>0
(2.17)
betrachten.
4
f(u)=1/u
f(u)
3
2
x
1
0
0
1
2
u
3
4
Nach der Definition gilt L(1) = 0 und L(x) > 0 für x > 1. Für den Fall 0 < x < 1
ist das Integral in Gl. (2.17) genauso wie in Gl. (2.14) definiert, was, da hier
f (u) > 0 für alle u > 0 gilt, dazu führt, daß die Fläche zwischen f (u) und der
u-Achse von 1 bis x, also L(x), negativ ist. Es gilt also L(x) < 0 für 0 < x < 1.
L(x) ist weiterhin monoton wachsend. Für a > 0 betrachten wir
Z
ax
1
du
u
Z1 a
Z ax
1
1
=
du +
du
u
1 u
a
Z ax
1
= L(a) +
du.
u
a
L(ax) =
Im verbleibenden Integral verwenden wir die Substitution
Z
a
ax
1
du =
u
Z
ax
Za ax
=
a
a 1
du
ua
f (g(u))g 0 (u) du
2.4. LOGARITHMUS- UND EXPONENTIALFUNKTION
35
mit f (v) = 1/v und g(v) = v/a. Nach Gl. (2.15) gilt damit
Z
x
1
dt
1 t
= L(a) + L(x),
L(ax) = L(a) +
(2.18)
also z.B. für n ∈ N, L(xn ) = nL(x). Gl. (2.18) ist die bekannte Funktionalrelation
für die Logarithmusfunktionen. Die durch Gl. (2.17) definierte Funktion wird als
natürlicher Logarithmus bezeichnet, und wir schreiben ab jetzt ln(x) statt L(x)
Z
ln (x) =
1
x
1
dt ,
t
x > 0.
Man definiert eine wichtige Zahl e - die Eulersche Zahl - über die Gleichung
ln (e) = 1.
2
f(x)=ln(x)
f(x)
1
0
e=2.718282...
−1
−2
0
1
2
3
4
5
x
Aus der Skizze sieht man, daß e in der Nähe von 2.7 liegt. Genauer gilt e =
2.718282 . . .. Nach dem Hauptsatz folgt (ln (x))0 = 1/x. Für x → ∞ strebt auch
ln (x) gegen ∞, was man z.B. wie folgt sehen kann: Sei n ∈ N; dann gilt
ln (en x) = ln (en ) + ln (x) = n ln (e) + ln (x) = n + ln (x).
Für n → ∞ streben das Argument en x und der Funktionswert gegen ∞.
Die Umkehrfunktion ln−1 (x) des natürlichen Logarithmus - die Logarithmusfunktion ist injektiv - bezeichnet man als Exponentialfunktion und kürzt sie
exp (x) ab. Sie hat den Definitionsbereich Dexp = R.
36
KAPITEL 2. MATHEMATISCHE METHODEN
4
f(x)=ln(x)
f(x)=exp(x)
f(x)=x
f(x)
2
0
−2
−4
−4
−2
0
x
2
4
Es gilt also
exp (ln (x)) = x für x ∈ {x ∈ R|x > 0} = Dln = Wexp
ln (exp (x)) = x für x ∈ R = Dexp = Wln .
Aus der Funktionalgleichung des Logarithmus wollen wir jetzt eine entsprechende
Gleichung für exp (x) herleiten. Für a, b > 0 folgt mit a = exp (ln (a)) und b =
exp (ln (b))
exp (ln (ab)) = ab = exp (ln (a)) exp (ln (b)).
Die linke Seite dieser Gleichung kann nach Gl. (2.18) zu
exp (ln (ab)) = exp (ln (a) + ln (b))
umgeformt werden. Damit gilt dann
exp (ln (a) + ln (b)) = exp (ln (a)) exp (ln (b))
oder, da a, b > 0 beliebig waren,
exp (x + y) = exp (x) exp (y).
(2.19)
Diese Funktionalrelation sollte ihnen von den Potenzgesetzen bekannt vorkommen: xn xm = xn+m . In dieser Vorlesung haben wir sie bereits mehrfach benutzt.
Aus Gl. (2.19) folgt für x = y = 0, daß exp (0) = 1 gilt (was natürlich auch aus
der Definition von exp (x) als Umkehrfunktion von ln (x) und ln (1) = 0 folgt),
und für y = −x ergibt sich damit
exp (−x) =
1
.
exp (x)
(2.20)
2.4. LOGARITHMUS- UND EXPONENTIALFUNKTION
37
Eine wiederholte Anwendung von Gl. (2.19) liefert
exp (x1 + x2 + . . . + xn ) = exp (x1 ) exp (x2 ) . . . exp (xn ).
(2.21)
Aus e = exp (ln (e)) und ln (e) = 1 folgt exp (1) = e, sowie aus Gl. (2.21) mit
xi = 1 für alle i = 1, 2, . . . , n
exp (n) = en .
Mit Gl. (2.20) gilt dann auch
exp (−n) =
1
= e−n ,
en
d.h. für alle n ∈ Z ist die Exponentialfunktion die Potenzfunktion zur Basis e.
Diese Aussage gilt auch für rationale α ∈ Q mit α = n/m
n
n
n
n m
· exp
· . . . · exp
= exp
exp
m
m
m
m}
{z
|
m−mal
n
n
n
= exp
+
+ ... +
m m
m
= exp (n) = en ,
wobei wir Gl. (2.21) verwendet haben. Ziehen wir jetzt die m-te Wurzel, so folgt
n
exp
= en/m .
m
Da man jeder Zahl aus R mit einem α ∈ Q beliebig nahe kommen kann (siehe
die HöMa Vorlesung), gilt für alle x ∈ R
exp (x) = ex .
Aus der Schule sind sie es wahrscheinlich gewohnt, daß beide Ausdrücke (Exponentialfunktion und Potenz zur Basis e) von Anfang an synonym verwendet
werden, was wir im folgenden ebenfalls tun werden.
Die Ableitung der Exponentialfunktion können wir mit Hilfe von Gl. (2.5),
0
also f −1 (f (x)) = f 01(x) , für f (x) = ln (x), d.h. f 0 (x) = 1/x bestimmen:
exp0 (ln x) = x
⇒
exp0 (z) = exp (z)
Damit erfüllt die Exponentialfunktion y(x) = exp (x) die in der Physik sehr
wichtige Differentialgleichung
y 0 (x) = y(x),
die man als Wachstumsgleichung bezeichnen kann.
(2.22)
38
2.5
KAPITEL 2. MATHEMATISCHE METHODEN
Potenzreihen und Taylorentwicklung
Nach einem kleinen Einschub, werden wir auf Gl. (2.22) zurückkommen und mit
ihrer Hilfe die Reihendarstellung der Exponentialfunktion herleiten. Zunächst soll
aber erklärt werden, was eine Potenzreihe ist. Dazu betrachten wir die Funktionen
(N ∈ N0 , x ∈ R)
2
3
N
SN (x) = 1 + x + x + x + . . . + x =
N
X
xn .
n=0
Indem wir diese Gleichung mit x multiplizieren und mit +1−1 erweitern, erhalten
wir einen geschlossenen Ausdruck für SN (x)
xSN (x) = 1 + x + x2 + . . . + xN + xN +1 − 1
= SN (x) + xN +1 − 1
⇒ (1 − x)SN (x) = 1 − xN +1
1 − xN +1
.
⇒ SN (x) =
1−x
Für |x| < 1 geht der Term xN +1 im Zähler für N → ∞ gegen Null, d.h.
lim SN (x) =
N →∞
1
für |x| < 1.
1−x
Man kann die Funktion 1/(1 − x) für |x| < 1 also auch als unendliche Reihe (auch
Potenzreihe genannt)
∞
X
1
xn für |x| < 1
=
1 − x n=0
schreiben. Eine allgemeine Potenzreihe hat die Form
f (x) =
∞
X
an x n
n=0
mit an ∈ R. Für die gerade diskutierte spezielle so genannte geometrische Reihe
gilt an = 1 für alle n ∈ N0 . Die Frage für welche x eine unendliche Reihe (die durch
die Angabe aller an charakterisiert ist) überhaupt auf einen endlichen Wert führt,
d.h. konvergiert, werden wir hier nur am Rande betrachten. Sehr genau werden
sie diese Frage in der HöMa I Vorlesung untersuchen.
Fast alle (in der Physik) wichtigen Funktionen lassen sich durch Potenzreihen
darstellen, so z.B. auch die Exponentialfunktion. Um für diesen Fall die Entwicklungskoeffizienten an zu bestimmen betrachten wir die Differentialgleichung
2.5. POTENZREIHEN UND TAYLORENTWICKLUNG
39
(2.22) y(x) = y 0 (x), von der wir bereits wissen, daß sie von der Exponentialfunktion gelöst wird. Wir machen den Ansatz7
y(x) =
∞
X
an x
n
⇒
0
y (x) =
n=0
∞
X
an nxn−1 .
n=1
Dabei haben wir die unendliche Reihe summandenweise differenziert, was nur
dann erlaubt ist, wenn die Reihe bestimmte Konvergenzeigenschaften hat (siehe
die HöMa I Vorlesung). Umbenennen der Summationsvariablen n = ñ+1 in y 0 (x)
liefert
y 0 (x) =
∞
X
añ+1 (ñ + 1)xñ =
∞
X
an+1 (n + 1)xn .
n=0
ñ=0
Bildet man jetzt y 0 (x) − y(x), was nach der Differentialgleichung gleich Null ist,
so folgt8
∞
X
((n + 1)an+1 − an ) xn = 0
n=0
eine Gleichung, die sicherlich dann erfüllt ist, wenn
(n + 1)an+1 − an = 0 für alle n ∈ N0
(2.23)
gilt. Daß dieses Kriterium nicht nur hinreichend, sondern auch notwendig ist,
werden sie in der HöMa I Vorlesung beweisen (Identitätssatz für Potenzreihen).
Gl. (2.23) kann nun wie folgt umgeformt werden
an+1 =
=
=
=
=
1
an
n+1
1 1
an−1
n+1 n
1 1 1
an−2
n+1 n n−1
...
1
a0 .
(n + 1)!
Die Lösung von y 0 (x) = y(x) lautet damit
∞
X
1 n
y(x) = a0
x ,
n!
n=0
7
Das Lösen von Differentialgleichungen durch einen Potenztreihenansatz ist ein häufig verwendetes Verfahren.
8
Wir haben hier die beiden Summen unter ein Summenzeichen geschrieben. Auch diese
Operation ist nur dann zulässig, wenn die unendliche Reihe bestimmte Konvergenzeigenschaften
erfüllt, die sie in der HöMa I Vorlesung kennenlernen werden.
40
KAPITEL 2. MATHEMATISCHE METHODEN
mit der zunächst noch freien Konstanten a0 ∈ R, woraus y(0) = a0 folgt.9 Von
der Exponentialfunktion wissen wir jedoch bereits, daß exp (0) = 1 gilt. Damit
hat dann also die Exponentialfunktion die Potenzreihenentwicklung
exp (x) = ex =
∞
X
xn
n=0
n!
.
(2.24)
Diese Reihe konvergiert für alle x ∈ R (im Gegensatz zur geometrischen Reihe,
die nur für |x| < 1 konvergiert), was sie in HöMa I beweisen werden.
Wenn man eine Reihendarstellung für eine Funktion kennt, dann ist es interessant zu untersuchen, ob man die “komplizierte” Funktion (also z.B. die Exponentialfunktion), nicht bereits durch ein paar wenige “einfache” Summanden
der Potenzreihe gut approximieren (nähern) kann. Die folgende Abbildung zeigt
dazu ein Beispiel.
8
exp(x)
1
1+x
2
1+x+x /2!
2
3
1+x+x /2!+x /3!
2
3
4
1+x+x /2!+x /3!+x /4!
6
4
2
0
-2
-1
0
x
1
2
Man erkennt, daß für −1 ≤ x ≤ 1 bereits die ersten fünf Summanden eine sehr
gute Näherung für die Exponentialfunktion liefern. In dem betrachteten Beispiel
ist es tatsächlich so daß die Polynome
gN (x) =
N
X
xn
n=0
n!
für wachsendes N eine systematische Verbesserung der Approximation liefern speziell in der Nähe von x = 0.
Schaut man nur lange genug auf diese Abbildung, so fällt einem auf, daß die
Übereinstimmung der Funktionen in der Nähe von Null etwas mit der Gleichheit
von Ableitungen von exp (x) und den gN (x) bei x = 0 zu tun hat. Für die
Exponentialfunktion f (x) = exp (x) gilt
f (k) (0) = 1 da f (k) (x) = exp (x).
9
Dies ergibt sich da 00 = 1 gilt.
2.5. POTENZREIHEN UND TAYLORENTWICKLUNG
41
Für die Polynome gN (x) ergibt sich
(k)
gN (0)
=
1 für k ≤ N
0 für k > N,
so, daß für gN (x) die ersten N Ableitungen bei x = 0 mit denen der Exponentialfunktion übereinstimmen.
Diese Beobachtung können wir nun zu einem Konstruktionsprinzip zur Bestimmung einer polynomialen Näherung von Funktionen um einen gegebenen
Punkt herum (lokale Näherung) machen. Bei der Diskussion der Ableitung als
lineare Approximierbarkeit haben wir es in gewissem Sinne bereits kennengelernt:
Die Gleichung für die Tangente an eine Funktion ist das Polynom ersten Grades
g1 (x) und liefert eine Näherung für die Funktion. Man nennt ein Polynom vom
Grad n, wenn der Summand mit der höchsten auftretenden Potenz von x derjenige proportional zu xn ist. Betrachten wir also die allgemeine Funktion f (x).
Wir wollen nun die Koeffizienten an des Polynoms
gN (x) = a0 + a1 x + a2 x2 + . . . + aN xN
so bestimmen, daß die ersten N Ableitungen von gN (x) mit denen der Funktion
f (x) bei x = 0 übereinstimmen. Betrachten wir ein m ≤ N , so gilt
(m)
gN (0) = am m!
.
Damit ist klar, daß wir, um die Forderung zu erfüllen,
an =
1 (n)
f (0)
n!
(2.25)
wählen müssen. Es ergibt sich somit
gN (x) = f (0) +
1 0
1
1 (N )
f (0)x + f 00 (0)x2 + . . . +
f (0)xN .
1!
2!
N!
(2.26)
Man nennt diese Näherung von f (x) durch gN (x) die Taylorentwicklung um den
Punkt x = 0. In den Übungen haben sie sie bereits kennengelernt und g3 (x) für
zwei Beispielfunktionen berechnet.
• f (x) =
1
1−x
: g3 (x) = 1 + x + x2 + x3
42
KAPITEL 2. MATHEMATISCHE METHODEN
8
1/(1−x)
1
1+x
2
1+x+x
2
3
1+x+x +x
2
3
4
1+x+x +x +x
6
4
2
0
−1
0
x
1
Die sich ergebenden Terme sind aber gerade die ersten Summanden der geometrischen Reihe, so daß wir wissen, daß die Taylorentwicklung für immer
größere N und |x| < 1 eine immer bessere Näherung liefert. Für N → ∞
spricht man dann auch von der Taylorreihe. Für dieses Beispiel konvergiert
die über die Ableitungen von f definierte Taylorreihe (für |x| < 1) gegen die
Funktion f , was jedoch nicht immer der Fall sein muß (wie sie in späteren
Vorlesungen genauer untersuchen werden).
√
• f (x) = 1 + x : g3 (x) = 1 + 21 x − 12 41 x2 + 12 14 36 x3
Als weiteres Beispiel wollen wir hier die Funktion f (x) = ln (x + 1) um x = 0
Taylor-entwickeln.10 Nach Gl. (2.26) benötigen wir die Ableitungen von f (x) bei
x = 0:
f (x) = ln (x + 1) ⇒ f (0) = ln (1) = 0
1
f 0 (x) =
⇒ f 0 (0) = 1 = (−1)0 0!
x+1
1
f 00 (x) = (−1)
⇒ f 00 (0) = −1 = (−1)1 1!
(x + 1)2
1
f 000 (x) = (−1)(−2)
⇒ f 000 (0) = 2 = (−1)2 2!
3
(x + 1)
1
⇒ f (4) (0) = −6 = (−1)3 3!
f (4) (x) = (−1)(−2)(−3)
(x + 1)4
... = ...
1
f (N ) (x) = (−1)N −1 (N − 1)!
⇒ f (N ) (0) = (−1)N −1 (N − 1)!
(x + 1)N
10
Da ln (x) bei x = 0 divergiert - gegen −∞ geht - untersuchen wir die Funktion ln (x + 1).
2.5. POTENZREIHEN UND TAYLORENTWICKLUNG
43
Die Koeffizienten der Taylorentwicklung ergeben sich dann nach Gl. (2.25) zu
an =
1
1 (n)
1
f (0) = (−1)n−1 (n − 1)! = (−1)n−1 ,
n!
n!
n
also gilt
N
X
1
gN (x) =
(−1)n−1 xn .
n
n=1
1
0
−1
ln(1+x)
0
0+x
2
0+x−x /2
2
3
0+x−x /2+x /3
2
3
4
0+x−x /2+x /3−x /4
−2
−3
−1
−0.5
0
x
0.5
1
Bisher haben wir die Funktion f immer um den Punkt x = 0 entwickelt,
d.h. die ersten N Ableitungen von gN und f stimmen im Punkt x = 0 überein.
Möchte man jedoch die Funktion f in der Umgebung eines beliebigen Punktes x0
näherungsweise durch ein Polynom gN beschreiben, so bietet es sich an die an so
zu bestimmen, daß die Ableitungen bei x0 übereinstimmen
gN (x) = f (x0 ) +
+
1
1 0
f (x0 )(x − x0 ) + f 00 (x0 )(x − x0 )2 + . . .
1!
2!
1 (N )
f (x0 )(x − x0 )N .
N!
Als Beispiel betrachten wir wieder die Exponentialfunktion f (x) = exp (x) jetzt
aber bei x0 = 1. Es gilt
f (k) (1) = e da f (k) (x) = exp (x),
so daß sich
1
1
1
(x − 1)N
gN (x) = e 1 + (x − 1) + (x − 1)2 + . . . +
1!
2!
N!
44
KAPITEL 2. MATHEMATISCHE METHODEN
ergibt. Die Abbildung macht deutlich, daß g4 (x) mit den Koeffizienten der Entwicklung um den Punkt x = 1 in der Nähe von x = 1 eine wesentlich bessere
Näherung an die Exponentialfunktion liefert als das g4 (x) mit den aus der Entwicklung um x = 0 bestimmten an .
8
exp(x)
2
3
4
1+x+x /2!+x /3!+x /4!
2
3
4
e[1+(x−1)+(x−1) /2!+(x−1) /3!+(x−1) /4!]
6
4
2
0
−2
−1
0
x
1
2
Wie in diesem Beispiel lassen sich auch andere Funktionen um Punkte x0 Taylorentwickeln.
2.6
Hyperbolische und trigonometrische Funktionen als Potenzreihen: die imaginäre Einheit i
Die so genannten Hyperbelfunktionen Sinushyperbolikus sinh x und Kosinushyperbolikus cosh x sind über die Exponentialfunktion definiert
ex − e−x
sinh x =
;
2
ex + e−x
cosh x =
.
2
(2.27)
2.6. HYPERBOLISCHE UND TRIGONOMETRISCHE FUNKTIONEN
45
Drücken wir die Exponentialfunktion nun durch ihre Potenzreihendarstellung Gl.
(2.24) aus, so ergibt sich
ex + e−x
2
!
∞
∞
1 X xn X (−x)n
=
+
2 n=0 n! n=0 n!
cosh x =
∞
1X
xn
=
(1 + (−1)n )
2 n=0
n!
∞
X
x2n
=
,
(2n)!
n=0
(2.28)
da
1 + (−1)n
=
2
1 für n gerade
0 für n ungerade.
Analog folgt
ex − e−x
2
!
∞
∞
1 X xn X (−x)n
=
−
2 n=0 n! n=0 n!
sinh x =
∞
xn
1X
(1 − (−1)n )
=
2 n=0
n!
=
∞
X
n=0
x2n+1
.
(2n + 1)!
(2.29)
Die Ableitungen von sinh x und cosh x bestimmt man mit Hilfe der Definitionsgleichung (2.27) oder durch gliedweises Differenzieren der Reihendarstellungen:
x
0
e − e−x
ex + e−x
0
sinh x =
=
= cosh x
2
2
oder
0
sinh x =
∞
X
n=0
x2n+1
(2n + 1)!
!0
∞
X
(2n + 1) x2n
=
= cosh x.
(2n + 1) (2n)!
n=0
Analog folgt
cosh0 x = sinh x.
46
KAPITEL 2. MATHEMATISCHE METHODEN
Wie bei den trigonometrischen Funktionen definiert man auch noch den Tangenshyperbolikus
tanh x =
sinh x
cosh x
und den Kotangenshyperbolikus
coth x =
cosh x
.
sinh x
In der folgenden Abbildung sind die vier hyperbolischen Funktionen dargestellt.
4
2
0
sinh(x)
cosh(x)
tanh(x)
coth(x)
−2
−4
−4
−2
0
x
2
4
Um jetzt auch die trigonometrischen Funktionen als Potenzreihen darzustellen, betrachten wir zunächst einmal die Differentialgleichung zweiter Ordnung,
die y(x) = eax = exp (ax) erfüllt. Es gilt
(eax )0 = aeax
⇒
(eax )00 = a2 eax ,
so daß
y 00 (x) − a2 y(x) = 0
folgt. Im Anschluß an Gl. (2.6) (siehe auch Gl. (2.7)) hatten wir gezeigt, daß
y(x) = b sin (ax) + c cos (ax), mit a, b, c ∈ R die Differentialgleichung
y 00 (x) + a2 y(x) = 0
erfüllt. Erweitern wir jetzt die reellen Zahlen um die imaginäre Einheit i mit der
Eigenschaft
i2 = −1
2.6. HYPERBOLISCHE UND TRIGONOMETRISCHE FUNKTIONEN
47
so erfüllt
eiax =
∞
X
(iax)n
n=0
n!
(2.30)
die Differentialgleichung
y 00 (x) − (ia)2 y(x) = y 00 (x) − i2 a2 y(x) = y 00 (x) + a2 y(x) = 0
deren Lösung wir bisher als y(x) = b sin (ax)+c cos (ax) geschrieben hatten. Dabei
haben wir i bezüglich der Rechenregeln wie eine gewöhnliche Zahl behandelt, also
z.B. (ia)2 = i2 a2 , dann aber verwendet, daß i2 = −1 gilt. Betrachten wir nun
den Spezialfall a = 1. Für die Lösung der Differentialgleichung y 00 (x) + y(x) =
0 in der bisherigen Form können wir dann y(x) = c cos x + b sin x schreiben,
wobei die Randbedingungen (bzw. Anfangsbedingungen) durch y(0) = c und
y 0 (0) = b gegeben sind. Für die Lösung in der neuen Form eix ergeben sich die
Randbedingungen
0
eix |x=0 = ei0 = e0 = 1 und eix |x=0 = ieix |x=0 = i.
Sollen beide Lösungen die gleiche Funktion darstellen, so müssen nicht nur die
Differentialgleichungen identisch sein, sondern auch die Randbedingungen. Setzen
wir also c = 1 und b = i, so folgt
eix = cos x + i sin x.
(2.31)
Eine Größe der Form z = a + ib mit a, b ∈ R und der imaginären Einheit i nennt
man komplexe Zahl. Man bezeichnet die Menge der komplexen Zahlen mit C. Im
übernächsten Kapitel werden wir tiefer in das Konzept der komplexen Zahlen
eindringen.
Aus Gl. (2.31) wollen wir die Potenzreihendarstellungen von cos x und sin x
extrahieren. Dazu betrachten wir Potenzen von i:
i0 = 1; i1 = i; i2 = −1; i3 = i2 i = (−1)i = −i; i4 = i2 i2 = (−1)(−1) = 1
Für n ∈ N0 haben wir somit
i2n = (i2 )n = (−1)n ; i2n+1 = i2n i = (−1)n i.
Diese Eigenschaften nutzen wir nun aus, um Gl. (2.30) für den Spezialfall a = 1
umzuschreiben
∞
X
(ix)n
ix
e
=
n!
n=0
=
∞
X
(ix)2n
n=0
∞
X
(2n)!
+
∞
X
(ix)2n+1
(2n + 1)!
n=0
∞
X
x2n
x2n+1
=
(−1)
+i
.
(−1)n
(2n)!
(2n + 1)!
n=0
n=0
n
48
KAPITEL 2. MATHEMATISCHE METHODEN
Ein Vergleich mit Gl. (2.31) liefert dann
cos x =
∞
X
(−1)n
n=0
∞
X
x2n
,
(2n)!
(2.32)
x2n+1
sin x =
(−1)
.
(2n + 1)!
n=0
n
(2.33)
Die Namensgebung der hyperbolischen Funktionen wird nun durch einen Vergleich der Gln. (2.32) und (2.33) mit den Gln. (2.28) und (2.29) klar. Daß es
sich bei den durch die Gln. (2.32) und (2.33) gegebenen Funktionen um die in
der Schule mit Hilfe rechtwinkliger Dreiecke definierten Funktionen handelt, ist
jedoch nicht vollständig offensichtlich. Was aber klar ist:
• Da nur gerade bzw. ungerade Potenzen von x in cos x bzw. sin x auftreten,
ist cos x eine gerade Funktion und sin x eine ungerade.
• sin 0 = 0 und cos 0 = 1.
• Gliedweise Differentiation liefert
∞
X
x2n+1
(−1)n
(2n + 1)!
n=0
sin0 x =
=
∞
X
(−1)n
n=0
!0
(2n + 1) x2n
(2n + 1) (2n)!
= cos x
und analog cos0 x = − sin x.
Alle diese Eigenschaften gelten analog für die ihnen bekannten trigonometrischen
Funktionen, und sie machen daher plausibel, daß es sich tatsächlich um diese
Funktionen handelt.
Für das Beispiel der Sinusfunktion wollen wir jetzt noch kurz untersuchen,
wie gut sich sin x durch einige wenige Terme der Potenzreihe11
gN (x) =
N
X
n=0
(−1)n
x2n+1
(2n + 1)!
approximieren läßt.
11
Die Potenzreihen des sin und cos entsprechen, wie in den Beispielen im letzten Kapitel,
wieder der Taylorreihe für eine Entwicklung der Funktion um den Punkt x = 0.
2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
49
1
0.5
0
sin(x)
g1(x)
g2(x)
g3(x)
−0.5
−1
−4
−2
0
x
2
4
Aus der Abbildung wird klar, daß für hinreichend kleine |x| bereits die ersten paar
Terme eine sehr gute Näherung liefern.12 Die Entwicklung der trigonometrischen
Funktionen in niedrigen Ordnungen spielt in der Physik eine große Rolle und wird
ihnen im Mechanik Teil dieser Vorlesung und der Vorlesung Experimentalphysik
I spätestens bei der Diskussion der Schwingungen (mit kleiner Amplitude) eines
Fadenpendels begegnen.
2.7
Gewöhnliche Differentialgleichungen
Differentialgleichungen sind uns im Laufe dieser Vorlesung bereits mehrfach begegnet, speziell auch in physikalischen Beispielen, was ihre Wichtigkeit innerhalb
der Physik verdeutlicht. Dabei dient der Begriff gewöhnliche Differentialgleichung
die von uns bisher betrachteten Situationen mit einer Veränderlichen von partiellen Differentialgleichungen zu unterscheiden, bei denen Ableitungen nach mehreren Variablen auftreten. Wie die Kapitelüberschrift ausdrückt, werden wir uns
hier auf den ersten Fall konzentrieren. Die Theorie der partiellen Differentialgleichungen ist noch weitaus komplexer als die bereits recht komplizierte Theorie der
gewöhnlichen Differentialgleichungen.
Als Beispiel zur Motivation wollen wir erneut die (eindimensionale) Newtonsche Gleichung mẍ(t) = F (x(t), ẋ(t); t) heranziehen, die wir hier in der Form
erweitert haben, daß die Kraft nicht nur vom Ort, sondern auch von der Geschwindigkeit, sowie der Zeit selbst abhängen kann. Sätze zur Existenz und zur
Eindeutigkeit von Lösungen von Differentialgleichungen13 werden sie in den HöMa
Vorlesungen kennen lernen. Hier sind wir daran interssiert Lösungsverfahren vorzustellen. In Form des Potenzreihenansatzes haben sie bereits eine recht allgemei12
Die Abbildung verdeutlicht auch noch einmal, daß es sich bei der durch die Potenzreihe
definierten Funktion tatsächlich um die geometrisch definierte Sinusfunktion handelt.
13
Von jetzt an unterdrücken wir wieder das Adjektiv “gewöhnlich”.
50
KAPITEL 2. MATHEMATISCHE METHODEN
ne (aber natürlich nicht immer erfolgreiche) Strategie zur Lösung von Differentialgleichungen kennen gelernt. Wie bereits oben angedeutet ist es im Allgemeinen
sehr schwierig analytische Lösungen von Differentialgleichungen zu finden. Es gibt
bestimmte Typen von Gleichungen für die es Verfahren gibt, die einen Erfolg garantieren. Um uns dieser Frage zu nähern, müssen wir die Differentialgleichungen
genauer klassifizieren.
Eine Differentialgleichung ist allgemein in impliziter Form durch
F (x, y(x), y 0 (x), y 00 (x), . . . , y (n) (x)) = 0
gegeben. Wie wir es aus unseren obigen Beispielen kennen, gehört zu der Gleichung ein Satz von Anfangsbedingungen für die gesuchte Funktion und ihre Ableitungen. Den Begriff der Ordnung einer Differentialgleichung als die höchste
auftretende Ableitung haben wir bereits kennengelernt. Eine Differentialgleichung
heißt linear, falls sie in der Form
a0 (x)y(x) + a1 (x)y 0 (x) + a2 (x)y 00 (x) + . . . + an (x)y (n) (x) = f (x)
geschrieben werden kann, d.h. die gesuchte Funktion y(x) und alle ihre Ableitungen nur linear auftreten. Die Funktion f (x) bezeichnet man in diesem Kontext
als die Inhomogenität.
Wir betrachten zunächst Gleichungen erster Ordnung der Form
y 0 (x) = F (x, y(x)) .
Man bezeichnet die Gleichung als separabel falls F (x, y(x)) = f (x)g(y(x)) mit
zwei Funktionen f und g gilt. In diesem Fall läßt sich die Differentialgleichung
“einfach” durch Separation der Variablen lösen. Dazu teilen wir auf beiden Seiten
der Gleichung
dy
= f (x)g(y(x))
dx
durch g und multiplizieren formal mit “dx”. Das liefert die Beziehung
dy
= f (x)dx .
g(y)
Durch Integration auf beiden Seiten erhalten wir
Z x
Z y
1
0
dy =
f (x0 ) dx0 ,
0
y0 g(y )
x0
wobei wir die Anfangsbedingung y(x0 ) = y0 verwendet haben. Wir müssen also
noch die Stammfunktionen G̃ (linke Seite) und F (rechte Seite) der Ausdrücke
2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
51
auf beiden Seiten der Gleichung bestimmen. Dies liefert uns die gesuchte Lösung
y(x) in impliziter Form
G̃(y(x)) − G̃(y0 ) = F (x) − F (x0 ) .
Nach bilden der Umkehrfunktion G̃−1 von G̃ (was natürlich nicht immer möglich
sein wird) folgt somit als für Lösung der Differentialgleichung
−1
F (x) − F (x0 ) + G̃(y0 ) .
y(x) = G̃
Durch Differenzieren überzeugt man sich leicht davon, daß diese Gleichung die
Differentialgleichung löst und durch einsetzen von x = x0 , daß auch die geforderte
Anfangsbedingung gilt. Anhand dieses Beispiels sehen wir (erneut; siehe die bisher diskutierten konkreten Beispiele von Differentialgleichungen erster Ordnung),
daß es uns bei der Gleichung erster Ordnung möglich ist, eine Anfangsbedingung
zu erfüllen. Für das Beispiel der Bewegung einer Masse mit Hookscher Feder, die
durch eine Gleichung zweiter Ordnung gegeben ist, war es möglich zwei Anfangsbedingungen (für Ort und Geschwindigkeit zur Zeit t = 0) zu erfüllen.
Es ist nur für den konkreten Fall beantwortbar, ob sich die beiden notwendigen Stammfunktionen geschlossen analytisch angeben lassen und ob es möglich
ist die Umkehrfunktion G̃−1 zu bestimmen. Wir betonen, daß es mit diesem Verfahren möglich ist Lösungen auch für nicht-lineare Gleichungen erster Ordnung
zu bestimmen (solange die Differentialgleichung separable ist).
Wir wollen für dieses Lösungsverfahren ein Beispiel aus der klassischen Mechanik betrachten. Die durch den Luftwiderstand verursachte Kraft auf ein sich
bewegendes, hinreichend großes Teilchen (Tennisball, Fußball,. . . ) hat in guter
Näherung den Betrag cv 2 , mit einer positiven Konstanten c und zeigt in Richtung −~v /|~v |.14 Wir betrachten nun ein Teilchen der Masse m welches sich mit
Geschwindigkeit ~v (t) bewegt und ausschließlich der Kraft die durch den Luftwiderstand hervorgerufen wird ausgesetzt ist. In dem wir das Koordinatensystem15
so legen, daß die x-Achse in die Richtung von ~v zeigt, reduziert sich die aus der
Newtongleichung folgende Bewegungsgleichung auf eine eindimensionale
m
dv
= −cv 2 ,
dt
mit der Anfangsbedingung v(t = 0) = v0 (Anfangsgeschwindigkeit v0 , willkürliche
Wahl des Zeitnullpunktes). Diese nicht-lineare Gleichung können wir mit dem
oben beschriebenen Verfahren lösen. Es ergibt sich
Z v
Z t
0−2
0
m
v dv = −c
dt0
v0
14
0
Ich gehe davon aus, daß sie aus der Schule mit dem Vektorbegriff vertraut sind. Mehr dazu
später.
15
Ich gehe erneut davon aus, daß ihnen dieser Begriff geläufig ist.
52
KAPITEL 2. MATHEMATISCHE METHODEN
und damit
−m(v −1 − v0−1 ) = −ct ,
bzw. aufgelöst nach v(t)
v(t) =
v0
,
1 + t/τ
mit der charakteristischen Zeit τ = m/(cv0 ). Für Zeiten t τ geht die Geschwindigkeit (in x-Richtung) somit wie v(t)/v0 ≈ (t/τ )−1 gegen Null.
Als nächste Klasse betrachten wir lineare Differentialgleichungen erster Ordnung der Form
dy
= a(x)y(x) + f (x) .
dx
(2.34)
Um die Lösung zu bestimmen gehen wir zunächst zur homogenen Gleichung
dy
= a(x)y(x)
dx
über. Wie oben ergibt sich als Lösung dieser
Z x
ln y(x) − ln(y0 ) =
a(x0 ) dx0 ,
x0
oder nach y(x) aufgelöst
Z
x
0
y(x) = y0 exp
a(x ) dx
0
.
x0
Eine sogenannte partikuläre Lösung yp (x) der inhomogenen Gleichung bestimmen
wir nun durch Variation der Konstanten, d.h. wir lassen die Konstante y0 von x
abhängen. Der Ansatz zur Lösung von Gl. (2.34) lautet somit
Z x
0
0
a(x ) dx ,
yp (x) = g(x) exp
x0
mit der noch zu bestimmenden Funktion g(x). Differenzieren liefert
Z x
Z x
dyp (x)
dg(x)
0
0
0
0
=
exp
a(x ) dx + g(x) a(x) exp
a(x ) dx
dx
dx
x0
x0
Z x
dg(x)
0
0
=
exp
a(x ) dx + a(x)yp (x) .
dx
x0
Die rechte Seite muß nun gleich a(x)yp (x) + f (x) sein, woraus sich eine Differentialgleichung für g ergibt
Z x
dg(x)
0
0
= f (x) exp −
a(x ) dx .
dx
x0
2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
53
Die Lösung dieser Gleichung ist
Z
x
g(x) =
f (x0 ) exp −
x0
Z
!
x0
a(x00 ) dx00 dx0 .
x0
Damit ergibt sich für die partikuläre Lösung
Z x
Z x
0
00
00
f (x ) exp
a(x ) dx dx0 .
yp (x) =
x0
x0
Die allgemeine Lösung der inhomogenen Gleichung ergibt sich als Summe der
allgemeinen Lösung der homogenen Gleichung und der partikulären Lösung zu
Z x
Z x
Z x
00
00
0
0
0
a(x ) dx dx0 ,
y(x) = y0 exp
a(x ) dx +
f (x ) exp
x0
x0
x0
wobei wir bereits die Anfangsbedingung y(x0 ) = y0 berücksichtigt haben.
Auch für dieses bereits etwas aufwendigere Lösungsverfahren wollen wir ein
Beispiel aus der klassischen Mechanik betrachten. Betrachten wir dazu erneut den
Luftwiderstand, diesmal jedoch für ein sehr kleines Teilchen, z.B. den Öltropfen
im Millikan Experiment zur Bestimmung der Ladung des Elektrons.16 In diesem
Fall ist die resultierende Kraft in guter Näherung durch F~ = −b~v , mit der positiven konstanten b, gegeben. Wir betrachten nun ein Teilchen der Masse m,
welches sich unter dem Einfluß der Gravitation und dem Luftwiderstand vertikal nach unten bewegt (fallendes kleines Teilchen mit Luftwiderstand). Durch
geschickte Wahl des Koordinatensystems ergibt sich die eindimensionale Bewegungsgleichung
m
dv
= mg − bv ,
dt
mit der Erdbeschleunigung g und der Anfangsbedingung v(t = 0) = v0 . Diese
lineare Differentialgleichung mit Inhomogenität mg läßt sich durch Variation der
Konstanten lösen. Die Lösung der homogenen Gleichung ist
v(t) = v0 exp (−t/τ ) ,
mit der charakteristischen Zeit τ = m/b. In Abwesenheit der Gravitation nimmt
somit die Geschwindigkeit ausgehend von der Anfangsgeschwindigkeit exponentiell ab. Für die Lösung der inhomogenen Gleichung erhalten wir
Z t
Z t
−1
00
v(t) = v0 exp (−t/τ ) + g
exp −
τ dt dt0
0
t0
= v0 exp (−t/τ ) + vfinal (1 − exp (−t/τ )) ,
16
Ich hoffe, daß sie von diesem Experiment in der Schule gehört haben.
54
KAPITEL 2. MATHEMATISCHE METHODEN
mit der Endgeschwindigkeit zur Zeit t → ∞, vfinal = gτ = mg/b. Betrachten
wir hier nur den Fall verschwindender Anfangsgeschwindigkeit v0 = 0, so sehen wir, am zweiten Term der Summe, daß die Geschwindigkeit ausgehend von
Null zunimmt und sich exponentiell dem konstanten asymptotischen Wert vfinal
annähert. Kleine Teilchen unter Einfluß der Graviation und des Luftwiderstandes
fallen also nach hinreichend langer Zeit (also wenn sie zuvor nicht auf den Boden
auftreffen) mit konstanter Geschwindigkeit.
Nicht-lineare Differentialgleichungen lassen sich nur in Ausnahmefällen analytisch lösen, z.B. wenn sie erster Ordnung und separabel sind. Manchmal führt ein
Potenzreihenansatz zum Erfolg. Ein lösbares Beispiel für die diese Bedingungen
nicht gelten ist die Bernoulli Gleichung der Form
y 0 (x) = a(x)y(x) + b(x)y α (x) ,
mit α 6= 0, 1. Sie läßt sich durch Substitution in eine lineare Gleichung überführen
y −α (x) y 0 (x) = a(x)y 1−α (x) + b(x)
1
u0 (x) = a(x)u(x) + b(x) ,
⇒
1−α
mit
u(x) = y 1−α (x) ,
u0 (x) = (1 − α)y −α (x) y 0 (x) .
Die lineare Gleichung läßt sich dann lösen.
Neben der Suche nach einer analytischen Lösung ist es für den Physiker
natürlich auch zulässig Differentialgleichungen numerisch zu lösen. Dazu gibt es
gut funktionierende und etablierte Verfahren, auf die wir aus Zeitgründen hier
jedoch nicht eingehen können.
Weil sie in der Physik eine wichtige Rolle spielen und zusätzlich ein Hilfsmittel
zur Lösung von Gleichungen höherer Ordnung darstellen (wir werden sehen wie)
wollen wir noch auf gekoppelte Systeme linearer Differentialgleichungen eingehen.
Dazu benötigen wir aber die Begriffe Matrix, Diagonalisierung, Eigenwert und
Eigenvektor die wir erst später kennen lernen werden. Daher müssen wir diesen
Aspekt auf das Ende des mathematischen Teils dieser Vorlesung verschieben.
2.8
Komplexe Zahlen
Anlaß zur Erweiterung der Menge der reellen Zahlen R war die Beobachtung,
daß viele quadratische, kubische und quartische Gleichungen, z.B. die einfache
quadratische Gleichung x2 + 2 = 0, keine reellen Lösungen besitzen. Veröffentlicht wurde eine solche Erweiterung erstmalig 1545 durch Gerolamo Cardano. Seit
1539 wurde die den komplexen Zahlen zugrundeliegende Idee zur Lösung kubischer Gleichungen jedoch in speziellen Fällen bereits von einem gewissen Tartaglia “kommerziell” genutzt - der seinen “Trick” zur Lösung jedoch geheimgehalten
2.8. KOMPLEXE ZAHLEN
55
hatte. Nachdem er Cardano einen “Geheimhaltungsschwur” hatte schwören lassen, verriet Tartaglia selbigem seine Methode. Dieser erweiterte sie und veröffentlichte seine Ergebnisse dennoch.
Die fundamentale Beobachtung ist, daß man mit √
der scheinbar sinnlosen
Lösung der obigen quadratischen Gleichung x1/2 = ± −2 so weiter rechnen
kann, als wenn es sich um eine reelle Zahl handeln würde. Zum Beispiel gilt
x1 + x2 = 0 und
√ x1 x2 = 2. Bereits im letzten Kapitel hatten wir die übliche
Abkürzung i = −1 eingeführt. Für zwei gegebene reelle Zahlen a, b ∈ R nennt
man das zunächst formale Konstrukt z = a + ib eine komplexe Zahl. Dem reellen
Paar (a, b) wird eine komplexe Zahl zugeordnet
(a, b) → a + ib .
Es gilt also z.B. (0, 1) → i oder (2, +1/2) → 2 + i 0.5. Wie bereits erwähnt
bezeichnet man die Menge der komplexen Zahlen, also die Paare (a, b) mit C. Oft
werden die komplexen Zahlen in der sogenannten komplexen (oder Gaußschen)
Zahlenebene graphisch dargestellt. Die erste Komponente der komplexen Zahl
nennt man Realteil (a = Re[z]) und die zweite Imaginärteil (b = Im[z]).
1+2i=(1,2)
1
1
−2−0.5i=(−2,−0.5)
Für diese Zahlenpaare definiert man nun Verknüpfungen, so daß man mit ihnen
rechnen kann wie mit reellen Zahlen.
• Addition: z1 + z2 = (a + ib) + (c + id) = a + c + ib + id = a + c + i(b + d). Für
die Paare (a, b) und (c, d) also (a, b) + (c, d) = (a + c, b + d). Dargestellt in
der Gaußschen Zahlenebene entspricht die komplexe Addition der üblichen
Vektoraddition (siehe später).
56
KAPITEL 2. MATHEMATISCHE METHODEN
z1+z2
z1
b
d
z2
a c
• Multiplikation: z1 z2 = (a + ib)(c + id) = ac + ibc + iad + i2 bd = ac − bd +
i(bc + ad). Für die Paare (a, b) und (c, d) also (a, b)(c, d) = (ac − bd, bc + ad).
Es gilt damit
Re [(a + ib)(c + id)] = ac − bd
Im [(a + ib)(c + id)] = bc + ad .
Um diese Rechenregel in der komplexen Zahlenebene darzustellen, ist es
nützlich, die Punkte in Polarkoordinaten anzugeben.
b
ρ
ϕ
a
Die Länge des Vektors vom Ursprung (0, 0) zum Punkt (a, b) nennt man
den Absolutbetrag |z| der komplexen Zahl z. Man schreibt
√
ρ = |z| = |a + ib| = a2 + b2 .
Den Winkel ϕ, der nur bis auf ganzzahlige Vielfache von 2π definiert ist,
bezeichnet man oft als Arcus und schreibt
ϕ = arc(z) = arc(a + ib) .
Aus der Skizze ist klar, daß a = ρ cos ϕ und b = ρ sin ϕ, und
b
.
ϕ = arctan
a
(2.35)
2.8. KOMPLEXE ZAHLEN
57
Damit können wir z zu
z = a + ib = ρ cos ϕ + iρ sin ϕ = ρeiϕ
umschreiben, wobei wir Gl. (2.31) verwendet haben. Die Gl. (2.35) gilt
zunächt nur für a > 0 und b > 0 wie in der Skizze. Allgemeiner gilt (in den
vier Quadranten der komplexen Ebene)

0 für a > 0, b > 0



b
π für a < 0, b > 0
+
ϕ = arctan
π für a < 0, b < 0

a


2π für a > 0, b < 0 ,
wobei noch einmal zu betonen ist, daß ϕ nur bis auf Vielfache von 2π eindeutig definiert ist. Für a = b = 0 ist der Winkel nicht definiert.
√
√ Betrachten
4
+
4
=
2
2
wir als Beispiel diekomplexe Zahl z = 2 + i2. Dann gilt
ρ
=
√ iπ/4
2
und ϕ = arctan 2 = arctan 1 = π/4. Also 2 + i2 = 2 2e .
Mit Hilfe dieser Einsichten können wir die Multiplikation zweier komplexer
Zahlen in der Polardarstellung ausführen
z1 z2 = ρ1 eiϕ1 ρ2 eiϕ2 = ρ1 ρ2 ei(ϕ1 +ϕ2 )
und geometrisch interpretieren: Die Absolutbeträge werden multipliziert
und die Polarwinkel addiert. Als Beispiel betrachten wir die Multiplikation
von z1 = 2 + i2 mit z2 = −1 + i0 = −1, d.h. der rein reellen Zahl −1
- wir nehmen also das negative von z1 : Wir haben c = −1 und d = 0.
Damit folgt nach oben z1 z2 =
− bd + i(bc + ad) = −a − ib = −2√
− i2. In
√ aciπ/4
iπ
Polardarstellung gilt z1 = 2 2e , z2 = e und damit z1 z2 = 2 2eiπ5/4
oder graphisch:
2
-1
2+i2
2
-2-i2
Die Subtraktion zweier komplexer Zahlen ergibt sich dann aus der Zusammensetzung der Regeln für die Multiplikation mit −1 und der Addition.
58
KAPITEL 2. MATHEMATISCHE METHODEN
• Division: Bevor wir die Division zweier komplexer Zahlen definieren wollen, ist es sinnvoll, den Begriff der zu z konjugiert komplexen Zahl z ∗ (oft
auch z̄) einzuführen. Sie ist wie folgt gegeben
⇒
z = a + ib
z ∗ = a − ib ,
d.h. der Imaginärteil von z geht in −Im[z] über. Damit läßt sich der Absolutbetrag von z, |z|, leicht durch z und z ∗ ausdrücken. Aus zz ∗ = (a +
ib)(a − ib) = a2 + b2 folgt
|z| = (zz ∗ )1/2 .
Nun zur Definition der Division. Sei dazu z2 = c + id 6= 0 + i0. Dann
betrachten wir17
a + ib
(a + ib)(c − id)
ac + bd + i(bc − ad)
z1
=
=
=
,
z2
c + id
(c + id)(c − id)
c2 + d 2
d.h. wir haben
a + ib
ac + bd
;
Re
= 2
c + id
c + d2
a + ib
bc − ad
Im
,
= 2
c + id
c + d2
und der “Trick” zur Berechnung war, mit dem konjugiert komplexen des
Nenners zu erweitern. In Polarkoordinaten gilt
z1
ρ1 eiϕ1
ρ1 i(ϕ1 −ϕ2 )
=
=
e
,
iϕ
2
z2
ρ2 e
ρ2
da e1ix = e−ix . Als Spezialfall betrachten wir
koordinaten z1 = ρ1 e−iϕ und graphisch
2
1
z
=
z∗
zz ∗
=
z∗
,
|z|2
oder in Polar-
z=2+i2
ϕ
−ϕ 2
1/z
17
Es kann aber durchaus c = 0 sein, wenn gleichzeitig d 6= 0 gilt, bzw. d = 0, wenn gleichzeitig
c 6= 0.
2.8. KOMPLEXE ZAHLEN
59
Wie für reelle Zahlen kann man nun Funktionen von komplexen Zahlen bilden
- deren Funktionswert dann im Allgemeinen wieder eine komplexe Zahl ist. Bereits
mehrfach ist uns das Beispiel exp (ix), mit x ∈ R, also die Exponentialfunktion
mit rein imaginärem Argument begegnet. Man kann aber auch allgemeiner
f (z) = exp z =
∞
X
zn
n=0
n!
= exp (a + ib) = exp (a) exp (ib)
definieren, oder z.B. sin z und cos z. Solche Funktionen und ihre komplexe Differentiation (nach z) und Integration werden im Rahmen der Funktionentheorie
untersucht. Ein Besuch der Mathematikvorlesung über Funktionentheorie empfiehlt sich für jeden Physikstudenten.
Manchmal dienen die komplexen Zahlen nur als Rechentrick - z.B. beim Integrieren; sie werden die entsprechenden Methoden in späteren Vorlesungen kennen lernen - jedoch vereinfachen sich im Rahmen der komplexen Zahlen auch
viele mathematische Aussagen, so daß sie ebenfalls von struktureller Bedeutung
sind. Zum Beispiel gilt der hier nicht bewiesene Fundamentalsatz der Algebra:
Sei PN (z) = a0 + a1 z + a2 z 2 + . . . + aN z N ein Polynom N -ten Grades, so hat
es in der komplexen Ebene N Nullstellen zi (mit PN (zi ) = 0), wobei n-fache
Nullstellen n-fach gezählt werden. Wir betrachten dazu ein Beispiel: Die reelle
Gleichung x6 − 1 = 0 hat die beiden reellen Nullstellen x1/2 = ±1. Die komplexe
Gleichung z 6 − 1 = 0 hat dagegen vier weitere komplexe Nullstellen. Diese wollen
wir jetzt finden. Mit z 6 = 1 gilt auch (z ∗ )6 = 1, oder nach Multiplikation beider
Gleichungen (zz ∗ )6 = 1, d.h. ρ12 = 1. Da ρ ≥ 0 reell ist, folgt ρ = 1. Damit haben
die zu bestimmenden Nullstellen die Form zn = eiϕn mit ϕn ∈ R. Wir betrachten
6
dann zn6 = (eiϕn ) = ei6ϕn = 1. Da ei2πm = 1 mit m ∈ Z gilt (siehe komplemit
xe Zahlenebene), folgt durch Gleichsetzen 6ϕn = 2πn und damit ϕn = n 2π
6
n = 0, 1, 2, 3, 4, 5.18 Die zugehörigen zn bezeichnet man als 6-te Einheitswurzeln.
n=2 1
n=1
n=3
n=0
1
n=4
18
n=5
Für n = 6 ergibt sich dieselbe Lösung wie für n = 0, für n = 7 dieselbe wie für n = 1, usw..
60
KAPITEL 2. MATHEMATISCHE METHODEN
2.9
Vektorrechnung
Wir werden den Vektorbegriff anschaulich einführen und beschränken uns zunächst
auf den zweidimensionalen euklidischen Raum. Die Elemente dieses Raumes sind
Punkte P , Q, R, S,. . . . Geordnete Paare (P, Q) von Punkten werden mit einer
Linie mit Pfeil verbunden, der vom Angriffspunkt P zum Zielpunkt Q zeigt: P~Q.
Zwei solcher Pfeile sind äquivalent, wenn sie gleichsinnig parallel sind und gleiche
Länge haben. Ein einzelner Pfeil einer Klasse äquivalenter Pfeile heißt Repräsentant des Vektors bzw. kurz Vektor. Vektoren im euklidischen Raum werden wir
mit lateinischen Buchstaben mit einem Pfeil ~a, ~b,. . . bezeichnen.
Q
S
R
P
Diese Vektoren wollen wir nun z.B. durch Addition miteinander verknüpfen
und durch die Multiplikation eines Vektors mit einer reellen (oder komplexen)
Zahl - einem Skalar - einen Vektor auf einen anderen abbilden. Die Addition
zweier Vektoren ~a +~b ist wie folgt definiert: Man wählt aus der Klasse ~a einen beliebigen Pfeil (P, Q) und aus der Klasse ~b den Pfeil (Q, R) mit dem Angriffspunkt
Q und definiert
~ = P~R
~a + ~b = P~Q + QR
R
b
a+b
a
P
Offensichtlich ist die Addition von Vektoren
• kommutativ: ~a + ~b = ~b + ~a
~
~
• assoziativ: ~a + b + ~c = ~a + b + ~c
Q
2.9. VEKTORRECHNUNG
61
• und hat ein neutrales Element, den Nullvektor ~0, d.h. die Klasse von Pfeilen
bei denen Angriffs- und Zielpunkt zusammenfallen und für den ~a + ~0 = ~a
gilt.
• Es ist anschaulich klar, daß es zu jedem Vektor ~a einen Vektor ~b gibt, so
daß ~a + ~b = ~0. Wir bezeichnen den Vektor ~b auch mit −~a.
Allgemein nennt man die algebraische Struktur bestehend aus einer Menge G
(hier die anschaulich über Pfeile im zweidimensionalen euklidischen Raum definierten Vektoren) und einer Verknüpfungsvorschrift der Elemente von G (hier die
ebenfalls anschaulich definierte und mit + bezeichnete Addition zweier Vektoren)
welche den obigen vier Eigenschaften genügt, eine abelsche Gruppe. Neben den
obigen “Pfeilen” bilden z.B. die ganzen Zahlen mit der gewöhnlichen Addition
als Verknüpfungsvorschrift eine abelsche Gruppe.
Kehren wir von dieser abstrakten Sichtweise zu den anschaulich definierten
Vektoren in der zweidimensionale Ebene zurück. Die Multiplikation eines Vektors
mit einer reellen Zahl soll wie folgt definiert sein: Die Pfeile λ~a sind für λ > 0
gleichsinnig parallel und für λ < 0 gegensinnig parallel zu den Pfeilen der Klasse
~a. Sie haben die Länge |λ| · Länge von ~a. Für λ = 0 gilt λ~a = ~0. Aus dieser
Definition ergeben sich sofort die folgenden Eigenschaften für die Multiplikation
von Vektoren mit Skalaren (λ, µ ∈ R):
• 1~a = ~a
• λ(µ~a) = (λµ)~a
• λ(~a + ~b) = λ~a + λ~b
• (λ + µ)~a = λ~a + µ~a
Wiederum abstrakt betrachtet nennt man eine abelsche Gruppe für die man eine
Multiplikation mit einer reellen Zahl definieren kann19 welche die gerade diskutierten Eigenschaften hat einen reellen Vektorraum.20 Den reellen Vektorraum
der oben anschaulich definierten Pfeile in zwei Raumdimensionen (zweidimensionale Ebene) bezeichnet man mit R2 . Analog kann man den Vektorraum von
“äquivalenten Pfeilen” in d Dimensionen (im d dimensionalen euklidischen Raum)
definieren. Er wird allgemein mit Rd bezeichnet.21
Um die Allgemeingültigkeit der Konzepte und Begriffe anzudeuten sind wir
mehrfach vom exemplarischen Beispiel der Vektoren in der zweidimensionalen
19
Das Ergebnis der Multiplikation eines Elementes der abelschen Gruppe mit der reellen Zahl
muß, wie im obigen Beispiel, wieder ein Gruppenelement sein.
20
Analog gibt es auch komplexe Vektorräume. In diesem Fall ist das Skalar eine komplexe
Zahl aus C.
21
Ist die Multiplikation mit einem Skalar bezüglich der komplexen Zahlen definiert, so bezeichnet man den Vektorraum mit Cd .
62
KAPITEL 2. MATHEMATISCHE METHODEN
Ebene zu der abstrakten Sichtweise übergegangen. Auch in der Physik - nicht
nur der Mathematik - spielen neben dem Vektorraum Rd (bzw. Cd ) andere Vektorräume eine große Rolle. Im Kapitel über Fourierreihen werden wir z.B. kurz
ansprechen, daß es Vektorräume gibt, deren Elemente Funktionen sind. Zum
Verständnis der Mechanik benötigen sie primär Kenntnisse des Rd , so daß wir
unsere weiteren Überlegungen zunächst erneut auf diesen beschränken werden.
Eine Anzahl von m Vektoren ~g1 , ~g2 , . . . , ~gm aus dem Rd heißt linear unabhängig, wenn
λ1~g1 + λ2~g2 + . . . + λm~gm = ~0
nur dann gilt, wenn alle Koeffizienten λi gleich Null sind. Anderenfalls nennt
man sie linear abhängig. Im Rd gibt es (maximal) d linear unabhängige Vektoren,
nimmt man jedoch einen weiteren Vektor hinzu, so sind die dann gegebenen d + 1
Vektoren linear abhängig. Zum Beispiel in d = 2 gilt:
g2
g1
~g1 und ~g2 sind linear unabhängig, aber jeder beliebige dritte Vektor ~g3 läßt sich
als Linearkombination von ~g1 und ~g2 schreiben
~g3 = λ1~g1 + λ2~g2
mit zu bestimmenden Skalaren λ1 , λ2 ∈ R. Man bezeichnet einen Satz ~g1 , ~g2 , . . . ,
~gd von d linear unabhängigen Vektoren im Rd als Basis.
Der Einfachheit halber werden wir hier zunächst mit Orthogonalbasen im Rd
(hier speziell im R2 ) arbeiten,22 genauer mit Orthonormalbasen: Die Basisvektoren ~e1 und ~e2 haben die Länge 123 und stehen senkrecht aufeinander. Jeder Vektor
~a hat dann die Zerlegung
~a = a1~e1 + a2~e2 .
Die ai nennt man Vektorkomponenten zur vorgegebenen Basis ~ei .
22
23
Man kann auch allgemeiner mit nicht-orthogonalen Basisvektoren arbeiten.
Zur genauen Definition des Begriffs “Länge” siehe unten.
2.9. VEKTORRECHNUNG
63
a2
a
e2
0
a1
e1
Wir haben bei der obigen Konstruktion einen festen Punkt 0 als Anfangspunkt
oder Ursprung ausgezeichnet. Damit ist dann jeder Punkt P durch den Vektor
~ bestimmt. Man nennt diesen Vektor ~x den Ortsvektor von P bezüglich
~x = 0P
des Anfangspunktes 0. In Komponenten kann dieser Vektor als ~x = x1~e1 + x2~e2
geschrieben werden, und jeder Punkt P ist damit umkehrbar eindeutig durch die
Zahlen (x1 , x2 ) festgelegt. Sie heißen die Koordinaten des Punktes P bezüglich
des Koordinatensystems [0; ~e1 , ~e2 ]. Arbeitet man immer mit demselben Koordinatensystem, so bietet sich die Notation
~x =
x1
x2
an. Diese kennen sie sicherlich auch aus der Schule. Wir werden diese Notation
hier nicht verwenden, da in der Physik häufig ein Basiswechsel notwendig ist, um
die physikalischen Phänomene besser zu verstehen (z.B. den Basiswechsel in ein
beschleunigtes Koordinaten- bzw. Bezugssytem). Wir schreiben manchmal bei
vorgegebenem Koordinatensystem
.
~x =
[0; ~e1 , ~e2 ] :
x1
x2
,
.
wobei = als “wird dargestellt durch” zu lesen ist. Zum Beispiel schreiben wir
statt
~a + ~b = a1~e1 + a2~e2 + b1~e1 + b2~e2 = (a1 + b1 )~e1 + (a2 + b2 )~e2
einfach
.
~a + ~b =
a1 + b 1
a2 + b 2
.
Die Länge |~a| eines Vektors ergibt sich nach obiger Skizze und dem Satz von
Pythagoras zu
q
|~a| = a21 + a22 = a .
64
KAPITEL 2. MATHEMATISCHE METHODEN
Die Länge hat aber auch eine geometrische Bedeutung, die unabhängig von der
Wahl des Koordinatensystems ist. Unabhängig von der Wahl des Koordinatensystems definieren wir das Skalarprodukt zweier Vektoren
~a · ~b = |~a||~b| cos ϕ ~a, ~b ,
wobei ϕ ~a, ~b der von ~a und ~b eingeschlossene Winkel ist, wenn ~a und ~b denselben
Angriffspunkt haben. Da die Kosinusfunktion gerade ist, gilt offensichtlich das
Kommutativgesetz ~a · ~b = ~b · ~a. Um zu zeigen, daß das Distributivgesetz gilt,
berechnen wir das Skalarprodukt in einer festen Orthonormalbasis:
~a = a1~e1 + a2~e2
⇒
a1 = |~a| cos ϕa ,
a2 = |~a| sin ϕa ,
wobei ϕa der Winkel zwischen der ~e1 -Richtung und ~a ist. Analog gilt
~b = b1~e1 + b2~e2
⇒
b1 = |~b| cos ϕb ,
b2 = |~b| sin ϕb ,
und damit
~a · ~b = |~a||~b| cos (ϕb − ϕa )
= |~a||~b| [cos ϕb cos ϕa + sin ϕb sin ϕa ]
= a1 b 1 + a2 b 2 ,
~ so folgt
wie sie es wahrscheinlich aus der Schule kennen. Ist dann aber ~b = ~c + d,
~a · ~c + d~ = a1 (c1 + d1 ) + a2 (c2 + d2 )
= a1 c 1 + a2 c 2 + a1 d 1 + a2 d 2
= ~a · ~c + ~a · d~ ,
d.h. das Distributivgesetz. Mit Hilfe dieses Gesetzes kann man ~a · ~b = a1 b1 + a2 b2
auch anders verstehen: Wegen ~e1 ·~e1 = 1 = ~e2 ·~e2 und ~e1 ·~e2 = 0 - da ϕ (~e1 , ~e2 ) = π/2
und cos (π/2) = 0 - d.h.
1 für i = j
~ei · ~ej = δi,j =
(2.36)
0 für i 6= j
folgt
~a · ~b = (a1~e1 + a2~e2 ) · (b1~e1 + b2~e2 ) = a1 b1 + a2 b2 .
Das soeben eingeführte und definierte δi,j bezeichnet man als Kronecker-Symbol
bzw. Kronecker-Delta. Mit Hilfe von Gl. (2.36) und der Distributivität des Skalarprodukts lassen sich die Vektorkomponenten bezüglich der orthonormalen Basis
{~ei } gemäß
ai = ~ei · ~a = ~ei · (a1~e1 + a2~e2 )
(2.37)
2.9. VEKTORRECHNUNG
65
berechnen. Über das Skalarprodukt läßt sich die Länge |~a| eines Vektors auch zu
q
√
|~a| = ~a · ~a = a21 + a22
schreiben.
Auch für allgemeine Vektorräume läßt sich oft ein Skalarprodukt definieren.
Um dieses genauer zu verstehen, nehmen wir wieder einen abstrakten Standpunkt
ein. Beim Bilden des Skalarprodukts wird jedem Paar von Elementen des Vektorraums eine reelle (bzw. komplexe; wenn bei der Multiplikation des Vektors mit
einem Skalar diese zugelassen sind) Zahl zugeordnet. Die Eigenschaften dieser
Abblidung lassen sich wie folgt zusammenfassen
• ~a · ~a ≥ 0; Gleichheit, wenn ~a = ~0
• ~a · ~b = ~b · ~a (bzw. ~a · ~b = (~b · ~a)∗ im komplexen Fall)
• sei ~b = λ~b1 + µ~b2 mit λ, µ ∈ R (λ, µ ∈ C im komplexen Fall) dann folgt
~a · ~b = λ~a · ~b1 + µ~a · ~b2 (Linearität im zweiten Argument)
Machen sie sich klar, daß das oben definierte Skalarprodukt für Vektoren aus dem
R2 diese Eigenschaften hat. Jede Zuodnung mit den obigen Eigenschaften nennt
man dann ein Skalarprodukt auf dem zugrundeliegenden (abstrakten) Vektorraum. Einen Vektorraum mit Skalarprodukt bezeichnet man als unitären Raum
(auch Prähilbertraum). Über ein gegebenes Skalarprodukt läßt sich die Länge
(Norm) |~a| eines Vektors auch abstrakt zu
√
|~a| = ~a · ~a
definieren. Es ist nun ebenfalls möglich den Begriff der Orthogonalität zweier
Vektoren ungleich dem Nullvektor gemäß ~a·~b = 0 allgemein zu definieren. Gleiches
gilt für das Konzept der orthonormalen Basis.
Wir kehren nun zum Vektorraum R2 zurück. Mit Hilfe des Distributivgesetzes
beweist man sehr leicht den aus der Schule bekannten Kosinussatz
~c · ~c = (~b − ~a) · (~b − ~a)
= ~a · ~a + ~b · ~b − 2~a · ~b ,
also
|~c|2 = |~a|2 + |~b|2 − 2|~a||~b| cos ϕ ~a, ~b .
Wir können jetzt auch andersherum vorgehen, den Kosinussatz (weil aus der
Schule bekannt) voraussetzen und einen Ausdruck für das Skalarprodukt herleiten:
|~a|2 + |~b|2 − |~c|2
~
~
|~a||b| cos ϕ ~a, b =
2
a21 + a22 + b21 + b22 − [(b1 − a1 )2 + (b2 − a2 )2 ]
=
2
= a1 b 1 + a2 b 2 .
66
KAPITEL 2. MATHEMATISCHE METHODEN
Wir erhalten so also wieder das bereits bekannte Ergebnis.
Bisher haben wir meistens im zweidimensionalen Raum (der Ebene) argumentiert. Wir werden jetzt das Skalarprodukt auf den dreidimensionalen Fall - der
in der Physik eine zentrale Rolle spielt- erweitern. Dazu betrachten wir zunächst
eine Orthonormalbasis in d = 3.
e3
0
e2
e1
Das durch die gezeigten Basisvektoren aufgespannte Koordinatensystem bezeichnet man als Rechtssystem, was man sich wie folgt erklären und merken kann:
Zeigt der Daumen der rechten Hand in Richtung ~e1 , der Zeigfinger der rechten
Hand in Richtung ~e2 und der Mittelfinger der rechten Hand in Richtung ~e3 , so
handelt es sich um ein Rechtssystem. Macht man dasselbe mit der linken Hand,
handelt es sich um ein Linkssystem. Ein Vektor ~a wird in dieser Basis dann durch
die Komponenten


a1
.
~a =  a2 
a3
dargestellt, und durch zweimaliges Anwenden des Satzes von Pythagoras sieht
man leicht, daß
q
|~a| = a21 + a22 + a23
gilt. Wir definieren dann das Skalarprodukt in d = 3 zu
~a · ~b = |~a||~b| cos ϕ ~a, ~b .
Um eine Komponentenschreibweise zu finden, kann man wieder den Kosinussatz
verwenden, da ~a, ~b und ~c = ~b − ~a in einer Ebene des dreidimensionalen Raumes
2.9. VEKTORRECHNUNG
67
liegen
~a · ~b = |~a||~b| cos ϕ ~a, ~b
|~a|2 + |~b|2 − |~c|2
2
a21 + a22 + a23 + b21 + b22 + b23 − [(b1 − a1 )2 + (b2 − a2 )2 + (b3 − a3 )2 ]
=
2
= a1 b1 + a2 b2 + a3 b3 ,
=
was für jede beliebige Orthonormalbasis gilt. Völlig analog gilt in d-Dimensionen
~a · ~b = a1 b1 + a2 b2 + . . . + ad bd .
Wie in d = 2 ergibt sich damit sofort wieder das Distributivgesetz
~a · ~b + ~c = ~a · ~b + ~a · ~c .
Aus der Definition des Skalarprodukts läßt sich der Winkel, den zwei beliebige
Vektoren (in d = 3) einschließen, bestimmen:
a1 b 1 + a2 b 2 + a3 b 3
p
cos ϕ ~a, ~b = p 2
.
a1 + a22 + a23 b21 + b22 + b23
Zwei Vektoren stehen also senkrecht aufeinander (sind orthogonal zueinander),
wenn ~a · ~b = 0 gilt.
Für zwei Vektoren aus dem R3 (und nur diesem!!) definieren wir nun das
Vektorprodukt (oft auch Kreuzprodukt oder äußeres Produkt genannt) wie folgt
~a × ~b = ~n|~a||~b| sin ϕ̃ ~a, ~b ,
wobei ~n ein Vektor der Länge 1 ist und auf ~a und ~b senkrecht steht.
Die
Richtung
von ~n ist so zu wählen, daß ~a, ~b und ~n ein Rechtssystem bilden. ϕ̃ ~a, ~b bezeichnet
~
dabei
den
Betrag des kleineren
der beiden Winkel zwischen ~a und b, so daß 0 ≤
ϕ̃ ~a, ~b < π und damit sin ϕ̃ ~a, ~b > 0 gilt. Die Richtung von ~n läßt sich auch
wie folgt bestimmen: Zeigen alle Finger der rechten Hand mit Ausnahme des
Daumen in die Richtung der Drehung von ~a auf ~b mit dem kleineren der beiden
Winkel, so zeigt der abgespreizte Daumen in die Richtung von ~n (“Daumen-Regel
der rechten Hand”).
n
b
0
a
68
KAPITEL 2. MATHEMATISCHE METHODEN
Nach der Definition erfüllt das Vektorprodukt die folgenden Relationen
~a × ~b = −~b × ~a
(λ~a) × (µ~b) = (λµ)(~a × ~b) ,
(2.38)
λ, µ ∈ R .
Aus der Definition ergibt sich ebenfalls
~a × ~a = ~0 .
(2.39)
Das Vektorprodukt ist distributiv
~a × ~b + ~c = ~a × ~b + ~a × ~c ,
was wir hier jedoch aus Zeitgründen nicht beweisen wollen.24 Um die Komponenten von ~a × ~b bezüglich einer Orthonormalbasis angeben zu können, wollen wir
zunächst betrachten, was sich nach der Definition des Vektorproduktes für ~ei ×~ej
mit i, j = 1, 2, 3 ergibt:
~e1 × ~e2 = ~e3
~e2 × ~e3 = ~e1
~e1 × ~e3 = −~e2 .
Die übrigen Terme ergeben sich mit Hilfe der Gln. (2.38) und (2.39). Man kann
diese Gleichungen zu
~ei × ~ej = ~ek
zusammenfassen, wobei (i, j, k) eine zyklische Vertauschung von (1, 2, 3) sein muß
- also (1, 2, 3), (2, 3, 1) oder (3, 1, 2). Für die Komponenten bezüglich der Basis
[~e1 , ~e2 , ~e3 ] folgt damit
~a × ~b = (a1~e1 + a2~e2 + a3~e3 ) × (b1~e1 + b2~e2 + b3~e3 )
= (a1 b2 − a2 b1 ) (~e1 × ~e2 ) + (a1 b3 − a3 b1 ) (~e1 × ~e3 ) + (a2 b3 − a3 b2 ) (~e2 × ~e3 )
= (a2 b3 − a3 b2 ) ~e1 + (a3 b1 − a1 b3 ) ~e2 + (a1 b2 − a2 b1 ) ~e3 ,
eine Regel, die sie sicherlich aus der Schule kennen. In der Mechanik wird das
Kreuzprodukt z.B. in der Definition der Begriffe Drehimpuls und Drehmoment
benötigt.
Als mathematisches Beispiel für die Anwendung des Vektorproduktes wollen
wir hier die Berechnung des Volumens eines durch drei nicht koplanare Vektoren
~a, ~b und ~c aufgespannten Körpers betrachten.
24
Für einen Beweis siehe z.B. S. Großmann, “Mathematischer Einführungskurs für die Physik”, Teubner Verlag, Stuttgart 1984, Seite 70.
2.10. FOURIERREIHEN
69
c
b
0
a
Betrachten wir dazu zunächst die durch ~a und ~b aufgespannte Fläche. Sie ist
durch Grundlinie ∗ Höhe gegeben.
b
h=|b|sin(ϕ)
ϕ
0
a
Das ist aber gerade der Betrag von ~a × ~b. Die Richtung ~n von ~a × ~b ist in der
folgenden Skizze eingezeichnet. Das Volumen in der obigen Skizze ergibt sich
dann zu Grundfläche ∗ Höhe.
c
h
b
n
0
a
Die Höhe h ist aber gerade durch ~n · ~c gegeben, so daß insgesamt
V (~a, ~b, ~c) = (~a × ~b) · ~c
folgt. Man nennt V (~a, ~b, ~c) auch das Spatprodukt.
2.10
Fourierreihen
Bevor wir dazu kommen Analysis (Differential- und Integralrechnung) und Vektorrechnung im euklidischen Raum in Form von vektorwertigen Funktionen und
Funktionen mehrer Veränderlicher zu kombinieren, wollen wir eine Technik einführen, die den Begriff der Funktion und einen Vektorraum von Funktionen benötigt.
Im Kapitel über die Taylorentwicklung haben wir eine Methode kennengelernt,
die es ermöglicht hinreichend harmlose Funktionen um einen Punkt herum lokal
zu approximieren. Dazu haben wir geeignet gewählte Polynome verwendet. Wir
wollen nun versuchen Funktionen global anzunähern. Dabei beschränken wir uns
70
KAPITEL 2. MATHEMATISCHE METHODEN
auf (reelle) periodische Funktionen mit der Eigenschaft
f (t + nT ) = f (t) ; n ∈ Z .
Um den Kontakt zur Physik herzustellen, nennen wir die Variable t (die Zeit). Die
Periodendauer ist durch T = 2π/ω, mit der Kreisfrequenz ω, gegeben. Einfache
periodische Funktion sind uns bereits im Kapitel 2.2 in Form der trigonometrischen Funktionen sin(ωt) und cos(ωt), bzw. physikalisch in Form der Lösung
der Newtonschen Gleichung für die Hooksche Feder Gl. (2.8) begegnet. Auch die
Funktionen sin(kωt) und cos(kωt) mit k ∈ N sind offensichtlich periodisch mit
Periode T = 2π/ω. Damit gilt gleiches für das trigonometrische Polynom oder
Fourierpolynom
N
gN (t) =
a0 X
[ak cos(kωt) + bk sin(kωt)] .
+
2
k=1
Diese Überlegungen legen die Frage nahe, ob wir jede (hinreichend harmlose)
periodische Funktion mit Periode T durch ein gN (t) bei geschickter Wahl der ak
und bk global approximieren können und ob die Näherung in irgendeinem Sinn
besser wird, wenn man N erhöht. Eine nachfolgende Frage ist, ob die ak und bk
eindeutig sind. Bevor wir uns diesen Fragen weiter nähern, wollen wir festhalten,
daß wir uns durch Einführen der Variablen t̃ = ωt auf Funktionen mit Periode 2π
beschränken können. Dies sieht man wie folgt. Sei f (t) eine Funktion mit Periode
T , so hat f (t̃/ω) die Periode 2π.
Betrachten wir nun zwei Beispiele. Die erste Funktion sei
f1 (t) = t2 für − π < t ≤ π und periodisch fortgesetzt.
Sie ist in der folgenden Abbildung dargestellt und offensichtlich keine einfach harmonische Funktion der Form sin(kt) bzw. cos(kt). Die Ableitung dieser Funktion
hat Sprungstellen bei ungeraden Vielfachen von π.
10
8
f1
6
4
2
0
-15
-10
-5
0
t
5
10
15
2.10. FOURIERREIHEN
71
Das zweite Beispiel ist die ebenfalls nicht einfach harmonische sogenannte Sägezahnkurve
f2 (t) = t für − π < t ≤ π und periodisch fortgesetzt,
mit Sprungstellen bei ungeraden Vielfachen von π.
3
2
f2
1
0
-1
-2
-3
-10
0
t
10
Das Ziel unser Überlegungen wollen wir anhand der folgende Abbildung klar
machen. Sie zeigt f2 (t) und die Fourierpolynome g6 (t) (rot) sowie g12 (t) (blau)
jeweils mit ak = 0 für k ∈ N0 und bk = 2 (−1)k+1 /k für k ∈ N.
3
2
f2
1
0
-1
-2
-3
-10
0
t
10
Offensichtlich liefern die dargestellten gN (t) in gewissem Sinn (“bis auf kleine
Oszillationen”) eine Näherung an f2 (t).
Wir wollen nun die Menge aller 2π-periodischen Funktionen f die in (−π, π]
nur endlich viele Spungstellen hat mit V bezeichnen. Genauer betrachen wir
wieder Klassen äquivalenter Funktionen, wobei zwei periodische Funktionen als
äquivalent bezeichnet werden, wenn sich ihr Funktionswert nur an “einzelnen
Punkten” unterscheidet (genaueres dazu in den Vorlesungen der Mathematik).
Wie man sich leicht überzeugt hat die Addidtion zweier Funktionen dann alle
72
KAPITEL 2. MATHEMATISCHE METHODEN
Eigenschaften, die V zu einer abelschen Gruppe machen. Das neutrale Argument
(die Klasse neutraler Elemente) wird dabei durch die Funktion h(t) = 0 für alle t
“repräsentiert”. Durch die skalare Multiplikation einer Funktion mit einer reellen
Zahl wird V zu einem rellen Vektorraum. Die Linearität des Integrals stellt dann
sicher, daß durch
Z
1 π
f (t) g(t) dt
(f, g) =
π −π
ein Skalarprodukt auf V definierbar ist. Es erfüllt die in Kapitel 2.9 aufgeführten
Eigenschaften des Skalarprodukts, wenn man bedenkt, daß wir es mit Repräsentanten von Funktionen (wie oben definiert) zu tun haben. Wir haben dabei in
Form von (. . . , . . .) eine neue Notation für das Skalarprodukt eingeführt. Nebenbei bemerken wir, daß es für die Elemente von V auch nicht mehr sinnvoll
erscheint die Notation mit dem Vektorpfeil zu verwenden, die wir für Vektoren im
d-dimensionalen euklidischen Raum reservieren möchten. Daher haben wir diese Notation hier garnicht erst eingeführt. Mit der Definition des Skalarprodukts
haben wir auch eine Länge (Norm) in der Form
||f || = (f, f )1/2
für Elemente aus V eingeführt. Wir haben auch für die Länge (Norm) eine neue
Notation verwendet. Um den Begriff der “äquivalenten Funktionen” zu verinnerlichen, sollten sie sich klar machen, daß jeder Repräsentant einer Klasse äquivalenter Funktionen aufgrund der Definition des Skalarprodukts über ein Integral
die gleiche Länge (Norm) hat.
Der Vektorraum V der Äquivalenzklassen von 2π-periodischen Funktionen
mit nur endlich vielen Spungstellen in (−π, π] wird so zu einem unitären Raum.
Wir wollen nun die Funktionen
1
φ0 (t) = √ ,
2
φk (t) = cos(kt) ,
φ−k (t) = sin(kt) ,
mit k ∈ N, aus V betrachten. Wie sie in einer Übungsaufgabe gezeigt haben gilt
für k, l 6= 0
(φk , φl ) = δk,l .
Wegen
1
(φ0 , φ0 ) =
π
Z
π
−π
1
dt = 1
2
2.10. FOURIERREIHEN
73
und für k > 0
1
(φ0 , φk ) =
π
π
Z
−π
1
√ cos(kt) dt = 0
2
bzw.
1
(φ0 , φ−k ) =
π
Z
π
−π
1
√ sin(kt) dt = 0
2
bilden die φk mit k ∈ Z ein orthonormales System in V . Diese abzählbar unendliche Zahl von Vektoren sind somit auch linear unabhängig. Da man über die Zahl
der linear unabhängigen Vektoren die Dimension eines Vektrorraum definiern
kann, sehen wir, daß V im Gegensatz zum Rd unendlichdimensional ist. Solche
Vektorräume mögen ihnen komisch und unanschaulich erscheinen, sie werden jedoch lernen damit umzugehen da sie in der Physik eine wichtige Rolle spielen
(spätestens in der Quantenmechanik).
Ohne Beweis (siehe Vorlesungen zur Mathematik) geben wir an, daß die {φk }
eine orthonormale Basis in V bilden. Damit können wir jedes Element f aus V
gemäß
f (t) =
∞
X
∞
ck φk (t) =
k=−∞
a0 X
+
[ak cos(kt) + bk sin(kt)]
2
k=1
mit reellen Entwicklungskoeffizienten (Vektorkomponenten) ck , ak , bk schreiben,
d.h. durch eine Fourierreihe ausdrücken. Die Entwicklungskoeffizienten ergeben
sich nach Gl. (2.37) eindeutig zu (k ∈ Z)
Z
1 π
φk (t) f (t) dt
ck = (φk , f ) =
π −π
bzw. (k ∈ N)
a0
ak
bk
√
Z
1 π
=
2(φ0 , f ) =
f (t) dt ,
π −π
Z
1 π
= (φk , f ) =
cos(kt) f (t) dt ,
π −π
Z
1 π
= (φ−k , f ) =
sin(kt) f (t) dt .
π −π
(2.40)
Wir wollen die Koeffizienten für unsere Bespielfunktionen fj , j = 1, 2, nun
explizit berechnen. Die Funktion f2 ist ungerade im Periodizitätsintervall. Daher
verschwinden alle Integrale über Produkte von f2 mit einer geraden Funktion.
Da cos(kt), k ∈ N0 gerade ist, folgt so ak = 0. Um bk zu berechnen, müssen wir
noch Integrale vom Typ
Z
1 π
bk =
t sin(kt) dt
π −π
74
KAPITEL 2. MATHEMATISCHE METHODEN
bestimmen. Diese berechnen wir wie folgt
Z
1 π
t sin(kt) dt
bk =
π −π
Z
2 π d
= −
cos(kt) dt
π 0 dk
Z
d 2 π
= −
cos(kt) dt
dk π 0
π
d 2 1
= −
sin(kt)
dk π k
0
π
2
1
t
= − − 2 sin(kt) + cos(kt)
π
k
k
0
2 π
cos(kπ)
= −
π k
2
= − (−1)k
k
= 2 (−1)k+1 /k ,
also die in der obigen Abbildung verwendeten bk . Damit ist für das vorliegende
Beispiel klar, daß bereits die endliche Fouriersumme (Fourierpolynom), bei der
die Summe in der Fourierreihe nur bis k = N läuft, eine globale näherungsweise
Beschreibung der Funktion liefert. Gleiches gilt für unsere zweite Beispielfunktion
f1 mit den Fourierkoeffizienten (k ∈ N)
a0 =
2 π2
,
3
4
,
k2
= 0 (da f1 (t) gerade) .
ak = (−1)k
bk
Die Berechnung der Koeffizienten erfolgt analog zu der von f2 . Die Näherungen
g6 (t) (rot) und g12 (t) (blau) sind in der folgenden Abbildung zusammen mit f1 (t)
dargestellt.
10
8
f1
6
4
2
0
-15
-10
-5
0
t
5
10
15
2.11. VEKTORWERTIGE FUNKTIONEN
75
Die beiden Beispiele verallgemeinernd halten wir fest, daß wir für jede periodische
Funktion f (mit höchstens endlich vielen Sprungstellen) eine mehr oder weniger
gute globale Näherung durch gN mit den gemäß Gl. (2.40) berechneten Fourierkoeffizienten erhalten können. Vergleichen wir die Näherungen für f1 und f2 so
wird klar, daß man für die stetige Funktion f1 bei fester Ordnung N (also durch
gN (t)) eine bessere Beschreibung erreicht als für die Funktion f2 (die Sprungstellen hat). Dies ist auch plausibel, wenn man bedenkt, daß die Fourierkoeffizienten
von f1 wie 1/k 2 abfallen, die für f2 jedoch nur wie 1/k. Höhere Terme in der Fourierentwicklung von f1 werden somit schneller klein, als die der Entwicklung von
f2 . Grundsätzlich kann man festhalten, daß die Fourierkoeffizienten je schneller
abfallen, je “glatter” (“harmloser”) die zu nähernde periodische Funktion ist.
Um zu verstehen, in welchem Sinne gN für große N gegen f konvergiert,
müssen wir uns erinnern, daß wir in der durch das Skalarprodukt gegebenen Norm
für den Abstand zweier periodischer Funktionen, die sich an einigen Stellen im
Funktionswert unterscheiden Null bekommen (definition des Skalarprodukts über
ein Integral). Das macht plausibel, daß es den Abbildungen gemäß offensichtlich
Punkte tj gibt, an denen die Konvergenz “sehr viel langsamer” ist, als an anderen Stellen. Im Beispiel der Funktion f2 gilt gN (t = nπ) = 0 für alle N ∈ N und
n ∈ Z, so daß bei den ungeraden Vielfachen von π, gN (t) nicht gegen f2 (t) konvergiert. Dies ist im Sinne der Norm verständlich, da sich f2 und die Grenzfunktion
limN →∞ gN nur an abzählbar vielen Punkten unterscheiden. Man spricht daher
im vorliegenden Fall auch von Konvergenz im Mittel.
In der Physik spielen Fourierentwicklungen einerseits als technisches Hilfsmittel bei der Näherung komplexer periodischer Funktionen durch einfache Summen
von trigonometrischen Funktionen, also Fourierpolynomen, eine wichtige Rolle.
Andererseits lernt man bei der Fourierentwicklung eines periodischen “Signals”
der Kreisfrequenz ω, welche höhere harmonische mit Kreisfrequenzen kω dem Signal mit welcher Amplitude ak bzw. bk beigemischt sind. Man lernt also etwas
über das Spektrum eines periodischen Signals. Man spricht daher auch von der
Spektralanalyse. Durch diese gewinnt man letztendlich physikalische Einsichten
über das “Signal”.
2.11
Vektorwertige Funktionen
Wie in der Einleitung diskutiert benötigt man in der Mechanik vektorwertige
Funktionen, d.h. Abbildungen, bei denen einem Element aus R eindeutig ein
(meist dreidimensionaler) Vektor zugeordnet wird. Die Bahnkurve ~x(t) eines Teilchens, d.h. der zeitliche Verlauf des Ortes des Teilchens im dreidimensionalen
Raum, ist ein Beispiel für solch eine Funktion. Legen wir eine Basis [~e1 , ~e2 , ~e3 ]
fest (hier wieder eine Orthonormalbasis), so können wir jede vektorwertige Funk-
76
KAPITEL 2. MATHEMATISCHE METHODEN
tion f~(x) als
f~(x) = f1 (x)~e1 + f2 (x)~e2 + f3 (x)~e3
schreiben. Wir definieren zunächst die Stetigkeit einer vektorwertigen Funktion,
indem wir die Stetigkeit aller ihrer Komponenten fi (x) fordern. Die Ableitung
einer vektorwertigen Funktion liefert wieder eine solche und ist definiert als
f~(x + h) − f~(x)
f~0 (x) = lim
.
h→0
h
Drücken wir f~ erneut durch die Komponenten aus, so folgt
f2 (x + h) − f2 (x)
f1 (x + h) − f1 (x)
0
~
~e1 +
~e2
f (x) = lim
h→0
h
h
f3 (x + h) − f3 (x)
+
~e3
h
= f10 (x)~e1 + f20 (x)~e2 + f30 (x)~e3 ,
d.h. f~0 ergibt sich durch komponentenweise Differentiation. Aus dieser Einsicht
und den Differentiationsregeln für gewöhnliche Funktionen ergeben sich die folgenden Gesetze für vektorwertige Funktionen ~a(x), ~b(x) und die skalare Funktion
g(x):
0
• ~a(x) + ~b(x) = ~a0 (x) + ~b0 (x)
0
~
• ~a(x) · b(x) = ~a0 (x) · ~b(x) + ~a(x) · ~b0 (x)
•
(Produktregel)
0
~a(x) × ~b(x) = ~a0 (x) × ~b(x) + ~a(x) × ~b0 (x)
• (g(x)~a(x))0 = g 0 (x)~a(x) + g(x)~a0 (x)
• (~a(g(x)))0 = ~a0 (g(x)) g 0 (x)
(Produktregel)
(Produktregel)
(Kettenregel)
Wie für gewöhnliche Funktionen lassen sich höhere Ableitungen vektorwertiger
Funktionen rekursiv definieren
!
d dn−1 f~(x)
dn f~(x)
=
.
dxn
dx
dxn−1
Eine weitere Diskussion vektorwertiger Funktionen verschieben wir auf die Übungen.
Das Ableiten einer vektorwertigen Funktion darf nicht mit dem Ableiten einer Funktion, die von einem Vektor abhängt - und selbst wieder vektorwertig
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
77
sein kann (Felder) - nach eben diesem Vektor, also dem Bilden des Gradienten,
der Divergenz oder der Rotation, verwechselt werden. Auf diese werden wir im
folgenden eingehen.
Zuvor wollen wir aber noch anmerken, daß die Integration
Z
b
f~(x) dx
a
einer vektorwertigen Funktion von einer Variablen, als Integration der einzelnen
Komponenten von f~(x) zu verstehen ist. Wie im Fall der Ableitung gibt es bei
der Integration von Funktionen (seien sie vektorwertig oder skalar) die von einem
Vektor abhängen neue Aspekte, die wir uns im übernächsten Kapitel anschauen
werden.
2.12
Funktionen mehrerer Veränderlicher
Auch wenn es in der Mechanik oft gelingt, durch geschickte Wahl der Koordinaten (Basisvektoren) Probleme so zu vereinfachen, daß sie von nur einer Orts(oder auch Winkel-) Koordinate abhängen (wir haben schon mehrere Beispiele
dazu kennen gelernt), so ist es zum allgemeinen Verständnis doch unvermeidbar,
Funktionen mehrerer Veränderlicher - also z.B. der drei Koordinaten x1 , x2 , x3
bezüglich einer fest gewählten Orthonormalbasis - einzuführen. Im Allgemeinen
kann die Kraft F~ (~x), die auf ein Teilchen am Punkt ~x wirkt, von diesen drei
Koordinaten abhängen. Weiterhin ist F~ selbst ein Vektor. Die Kraft ist also eine
vektorwertige Funktion eines Vektors. Betrachten wir als Beispiel die ihnen sicherlich aus der Schule bekannte Gravitationskraft zwischen zwei Punkt-Teilchen
der Massen M und m. Wir wählen ein Koordinatensystem mit einer orthonormalen Basis und dem Ursprung in der Masse M . Die Kraft auf das sich am Ort
~x befindliche Teilchen der Masse m ist dann
F~ (~x) = −γ
x21
~x
Mm
p
,
2
2
2
+ x2 + x3 x1 + x22 + x23
mit der Gravitationskonstanten γ. Den Vektor ~x/|~x| bezeichnet man auch als
Richtungsvektor. Er hat die Länge 1. Die Kraft auf die Masse m an der Position
~x zeigt damit immer ins Zentrum des Koordinatensystems - also auf die Masse
M - und ihr Betrag fällt wie 1/|~x|2 mit dem Abstand vom Ursprung ab. Die
Funktion F~ bildet damit das Zahlentripel x1 , x2 , x3 aus dem Raum R × R × R =
R3 auf ein Element F1 , F1 , F3 aus eben diesem Raum ab. Bei dieser abstrakten
Betrachtung haben wir die Dimensionen der physikalischen Meßgrößen Ort und
Kraft vernachlässigt. Allgemein definiert man die Räume Rn gemäß
Rn = {(x1 , x2 , . . . , xn )|xi ∈ R für i = 1, 2, . . . , n} .
78
KAPITEL 2. MATHEMATISCHE METHODEN
Als einfacheres Beispiel betrachten wir eine sehr dünne, “zweidimensionale”
Metallplatte, die an verschiedenen Stellen beheizt wird. Damit ergibt sich zu
jedem festen Zeitpunkt t eine mit der Position25
.
~x =
x1
x2
auf der Platte variierende Temperatur T (~x). Im Gegensatz zum Beispiel der Gravitationskraft ist die Funktion selbst in diesem Fall ein Skalar. Abstrakt betrachtet und für eine unendlich ausgedehnte Platte ist die Funktion T eine Abbildung
vom R2 auf eine Teilmenge W - den Wertebereich - der reellen Zahlen R. Dabei
haben wir erneut die Dimensionen des Ortes und der Temperatur vernachlässigt.
Da es (in der Kelvin-Skala) keine negativen Temperaturen gibt, kommt als Wertebereich nur eine Teilmenge der positiven reellen Zahlen in Frage. Ist die Platte
endlich, müssen wir auch einen Definitionsbereich D der Funktion festlegen, bei
dem es sich um eine Teilmenge von Zahlenpaaren aus den reellen Zahlen handelt. Für eine quadratische Platte der Kantenlänge 2a und dem Nullpunkt des
Koordinatensystems im Zentrum gilt dann z.B.
D = {(x1 , x2 ) ∈ R2 | − a ≤ x1 ≤ a und − a ≤ x2 ≤ a} .
Mißt man die lokale Temperatur der Platte nicht nur zu einer festen Zeit, sondern zu verschiedenen Zeiten t, so stellt die Temperatur eine Funktion von drei
Veränderlichen dar. Dabei haben nur die beiden Ortskoordinaten x1 , x2 die Dimension Länge, die dritte Variable jedoch die Dimension Zeit.
Ob es sich bei der Funktion um einen Vektor oder ein Skalar handelt, macht
bei denen uns im folgenden interessierenden mathematischen Fragestellungen keinen Unterschied, und wir werden uns daher auf skalare Funktionen beschränken.
Die gewonnenen Ergebnisse gelten im Fall von vektorwertigen Funktionen für jede ihrer Komponenten. Da sich weiterhin Funktionen zweier Veränderlicher gut
graphisch darstellen lassen, werden wir zusätzlich meist solche Funktionen betrachten.
Nach dieser physikalischen Motivation betrachten wir zunächst einmal die
Graphen dreier Beispielfunktionen.26
f (x, y) = exp (−x2 − y 2 ) : D = R2 , W = (0, 1]
25
Wir verwenden wieder die “wird dargestellt durch” Notation, d.h. wir haben ein Koordinatensystem vorgegeben.
26
Bisher haben wir immer f (~x) geschrieben. Alternativ kann man auch die Komponenten als
Argumente explizit angeben: f (x1 , x2 , . . . , xn ). Im folgenden sind x und y die Komponenten.
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
79
1
0.8
0.6
f
0.4
0.2
0
–2
–2
–1
–1
0x
y0
1
1
2
2
f (x, y) = x2 + y 2 : D = R2 , W = [0, ∞)
200
180
160
140
120
f100
80
60
40
20
0
–10
0
y
10 8
6
4
2
–10
0 –2 –4 –6 –8
x
f (x, y) = x2 − y 2 : D = R2 , W = R
80
KAPITEL 2. MATHEMATISCHE METHODEN
100
80
60
40
20
f0
–20
–40
–60
–80
–100
–10
0
y
10 8
6
4
2
–10
0 –2 –4 –6 –8
x
Die drei Beispielfunktionen haben unterschiedliche Eigenschaften. So fällt die
erste, wenn man im Ursprung der x-y-Ebene startet, in alle Richtungen hin ab,
die zweite steigt an, und bei der dritten hängt es davon ab, in welche Richtung
man fortschreitet, ob die Funktion ansteigt oder abfällt. Auch sind die ersten beiden Funktionen symmetrisch bei einer Rotation mit beliebigem Winkel um die
f -Achse, d.h., bei einer Rotation (mit beliebigem Winkel) um diese Achse geht
der Graph der Funktion in sich selbst über. Bei der dritten Funktion ist das nicht
der Fall. Dies liegt daran, daß die ersten beiden Funktionen nur von x2 + y 2 , d.h.
dem Abstand (zum Quadrat) vom Ursprung der x-y-Ebene abhängen. Dies gilt
so auch für die oben betrachteten Komponenten der Gravitationskraft. Die dritte
Beispielfunktion erinnert an einen Sattel. Man nennt den Punkt x = 0, y = 0
daher auch einen Sattelpunkt. Wie wir für Funktionen einer Variablen gelernt haben, gibt uns die Ableitung einer Funktion an, wie sich der Funktionswert ändert,
wenn wir von einer Stelle x nach x + h, für h → 0, weitergehen. Wie wir gerade
gelernt haben, kann die Änderung im Fall einer Funktion mehrerer Veränderlicher davon abhängen, in welche Richtung man weitergeht. Zur Beschreibung
der Änderung benötigen wir somit eine vektorielle Größe. Diese wollen wir im
folgenden wenig formal “herleiten”.
Betrachten wir eine Funktion f (x, y), so können wir uns fragen, wie sich der
Funktionswert ändert, wenn wir ausgehend von x, y in die x-Richtung fortschreiten. Die Steigung an der Stelle x, y in diese Richtung wird uns durch die Ableitung von f nach x bei festem y gegeben, wenn wir als Argumente der abgeleiteten
Funktion wieder x, y einsetzen. Man nennt diese Ableitung die partielle Ableitung
nach x und schreibt
f (x + h, y) − f (x, y)
∂f (x, y)
= lim
.
h→0
∂x
h
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
81
Als Beispiel bilden wir die partielle Ableitung unserer ersten Beispielfunktion
nach x
∂f (x, y)
= −2x exp (−x2 − y 2 )
∂x
(2.41)
und auch gleich die nach y
∂f (x, y)
= −2y exp (−x2 − y 2 ) .
∂y
(2.42)
Dabei haben wir stillschweigend angenommen, daß die Funktion f hinreichend
harmlos ist, so daß die entsprechenden Ableitungen existieren - wie es in unserem
Beispiel natürlich der Fall ist. Betrachten wir ein weiteres Beispiel
∂
x21 + 2x1 x32 + 5 = 2x1 + 2x32 ,
∂x1
in dem die beiden Variablen mal nicht mit x und y bezeichnet sind. Die Ableitungsregeln für Funktionen einer Veränderlichen (Produktregel, Quotientenregel
und Kettenregel) gelten auch für die partielle Ableitung, da es sich ja bei ihr
um eine gewöhnliche Ableitung nach einer Variablen bei festgehaltenen anderen
handelt.
Für die folgende Überlegung nehmen wir an, daß wir eine hinreichend glatte
Funktion f haben - so daß alle Ableitungen, die wir bilden wollen, auch existieren - die von den n Variablen x1 , x2 , . . . , xn abhängt. Wie für Funktionen einer
Veränderlichen kann man partielle Ableitungen höherer Ordnung definieren. Bei
partiellen Ableitungen gibt es aber nun die zusätzliche Option nicht nur zweimal
nach xi zu differenzieren, sondern erst nach xi und dann nach xj mit j 6= i
∂ 2 f (x1 , x2 , . . . xn )
∂ ∂
f (x1 , x2 , . . . xn ) =
.
∂xj ∂xi
∂xj ∂xi
Diese Idee läßt sich beliebig in höhere Ordnungen fortsetzen.
Kommen wir nun zurück zu der Frage, einen Vektor zu konstruieren, der die
Information über die Steigung einer Funktion mehrerer Veränderlicher enthält.
Betrachten wir zunächst unsere erste Beispielfunktion f (x, y) = exp (−x2 − y 2 ).
Mit den Gln. (2.41) und (2.42) wissen wir bereits, wie sich die Funktion ändert,
wenn wir in x- bzw. y-Richtung fortschreiten. Das legt nahe, daß der Vektor
! ∂f (x,y)
2
2
−2x
exp
(−x
−
y
)
.
∂x
~ (x, y) =
grad f (x, y) = ∇f
=
∂f (x,y)
−2y exp (−x2 − y 2 )
∂y
der von uns gesuchte “Steigungsvektor” ist. Das Symbol grad steht für Gradient.
~ sind beide gebräuchlich. Wir werden hier im
Die Notationen grad f und ∇f
82
KAPITEL 2. MATHEMATISCHE METHODEN
~ verwenden. Die Verallgemeinerung auf eine Funktion
folgenden die Notation ∇f
von n Veränderlichen ist offensichtlich


∂f
∂x1
∂f
∂x2


. 
~ =
∇f
 ...

 ...
∂f
∂xn



 .


~ auch ein Gradientenfeld. Schauen wir
Man nennt die Menge der Vektoren ∇f
uns nun die Gradientenfelder für unsere drei Beispielfunktionen an. Für die er~ soeben berechnet. Wir können das Vektorfeld nun graphisch
ste haben wir ∇f
darstellen, indem wir uns in der x-y-Ebene ein diskretes Gitter von Punkten vorgeben und an jedem Gitterpunkt einen Pfeil einzeichnen, wobei der Mittelpunkt
des Pfeils auf dem Gitterpunkt liegt. Die Richtung des Pfeils gibt die Richtung
~ an der Stelle ~x an, und die Länge ist ein Maß für den Betrag von ∇f
~
von ∇f
an dieser Stelle. Im Beispiel haben wir das oben gezeigte Gebiet −2 ≤ x ≤ 2,
−2 ≤ y ≤ 2 in ein 21×21 Gitter eingeteilt, d.h. die Mittelpunkte der Pfeile liegen
bei xn = n/5 und yn = n/5 mit n = −10, −9, . . . , 9, 10.
.
~ (x, y) =
∇f
∂f (x,y)
∂x
∂f (x,y)
∂y
!
=
−2x exp (−x2 − y 2 )
−2y exp (−x2 − y 2 )
2
y1
–2
–1
1
x
2
–1
–2
Das Gradientendfeld der zweiten Beispielfunktion f (x, y) = x2 + y 2 ist
! ∂f (x,y)
2x
.
∂x
~
=
∇f (x, y) =
∂f (x,y)
2y
∂y
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
83
10
8
y6
4
2
–10 –8
–6 –4
–2
–2
4
2
6
x
8
10
–4
–6
–8
–10
und das der dritten f (x, y) = x2 − y 2
.
~ (x, y) =
∇f
∂f (x,y)
∂x
∂f (x,y)
∂y
!
=
2x
−2y
.
10
8
y6
4
2
–10 –8
–6 –4
–2
–2
2
4
6
x
8
10
–4
–6
–8
–10
Die oben diskutierten Eigenschaften der Beispielfunktionen lassen sich auch in
den zugehörigen Gradientenfeldern leicht erkennen.
Sind wir daran interessiert, wie groß die Steigung an einem Punkt x, y in
eine durch einen Vektor ~n der Länge 1 gegebene Richtung ist, so müssen wir das
84
KAPITEL 2. MATHEMATISCHE METHODEN
Skalarprodukt
~ (x, y)
~n · ∇f
bilden. Für eine Funktion von n Veränderlichen ist die Steigung im Punkt ~x bei
Fortschreiten in Richtung des Vektors ~n, mit |~n| = 1, durch
~ (x1 , x2 , . . . , xn )
~n · ∇f
gegeben.
Ein in diesem Kontext wichtiger Begriff ist der der Äquipotentiallinie:27 Das
sind Kurven in der x, y-Ebene entlang derer sich f (x, y) nicht ändert. Ist so eine
Äquipotentiallinie durch einen vom Ort x, y abhängigen Tangentialvektor an der
~ (x, y) = 0. Für
Kurve ~n(x, y) der Länge 1 gegeben, so gilt damit ~n(x, y) · ∇f
die ersten beiden Beispielfunktionen sind die Äquipotentiallinien Kreise um den
Ursprung, die durch x2 +y 2 = const. gegeben sind, für die dritte sind es Hyperbeln
mit x2 − y 2 = const..
In allen unseren Beispielfunktionen spielt der Ursprung x = 0 = y eine ausgezeichnete Rolle. Im ersten Beispiel nimmt die Funktion im Ursprung ihren
maximalen Wert an, im zweiten den minimalen und im dritten Beispiel liegt ein
Sattelpunkt vor. Für die drei Beispiele verschwinden die beiden ersten partiellen
Ableitungen im Ursprung. Verallgemeinernd bezeichnet man die Punkte ~x0 an
denen alle ersten partiellen Ableitungen verschwinden, d.h.
∂f
(~x0 ) = 0 ,
∂xj
für alle j = 1, 2, . . . , n als stationäre Punkte.28
Da sich Gradientenfelder im physikalisch relevanteren dreidimensionalen Raum
nicht so schön graphisch darstellen lassen, wollen wir hier nicht weiter auf diesen
Fall eingehen. Wir wollen nur anmerken, daß das Konzept des Gradienten in der
Physik z.B. bei der Bestimmung eines Kraftfeldes aus einem Potential V (~x) (bzw.
aus der potentiellen Energie)
~ (~x)
F~ (~x) = −∇V
eine zentrale Rolle spielt. So läßt sich die am Anfang dieses Kapitels diskutierte
Gravitationskraft durch Bilden des negativen des Gradienten aus dem Potential
V (~x) = −γ
Mm
|~x|
bestimmen.
27
28
Wir beschränken uns hier auf das Beispiel der Funktionen von zwei Veränderlichen.
Ein stationärer Punkt ist also entweder ein Extremum oder ein Sattelpunkt.
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
85
Unsere Überlegungen sollten den Begriff des Gradienten einer skalaren Funktion mehrerer Veränderlicher hinreichend anschaulich verdeutlicht haben und auch
die Bedeutung in der Physik (speziell der Mechanik) sollte klar geworden sein.
Wir haben bereits die Taylorentwicklung um einen Punkt x0 für Funktionen
einer veränderlichen kennen gelernt. Diese läßt sich leicht auf den Fall einer skalaren Funktion (bzw. den einzelnen Komponenten vektorwertiger Funktionen) von
n Veränderlichen verallgemeinern. Betrachten wir dazu zunächst den Fall n = 2.
Die Funktion f (x, y) soll um den Punkt (x0 , y0 ) Taylor-entwickelt werden. Halten
wir zunächst y fest, so ergibt sich nach dem oben gelernten die Taylorreihe29
∞
X
1 ∂kf
f (x, y) =
(x0 , y) (x − x0 )k .
k
k! ∂x
k=0
Die auftretenden Ableitungen von f nach x werden an der Stelle x0 genommen
und sind daher nur noch von der Variablen y abhängig. Wir können diese also
nach y um den Punkt y0 Taylor-entwickeln30 und erhalten
"∞
#
∞
X
1 X 1 ∂l ∂kf
(x0 , y0 ) (y − y0 )l (x − x0 )k
f (x, y) =
l ∂xk
k!
l!
∂y
l=0
k=0
∞ X
∞
X
1 ∂ k+l f
=
(x0 , y0 ) (x − x0 )k (y − y0 )l .
k ∂y l
k!
l!
∂x
k=0 l=0
Um von der ersten zur zweiten Zeile zu gelangen haben wir angenommen, daß die
Reihenfolge der Ableitungen nach x und y keine Rolle spielt - was eine weitere
Forderung an die Eigenschaften von f darstellt - und wir die Summanden in
beliebiger Reihenfolge aufsummieren können. Wie sich aus diesen Überlegungen
die Taylorentwicklung für den Fall von n Veränderlichen
∞
∞
∞ X
X
X
1
∂ k1 +...+kn f
...
(~x0 ) (x1 − x0,1 )k1 . . . (xn − x0,n )kn
f (~x) =
k1
k
n
k
!
.
.
.
k
!
1
n ∂x1 . . . ∂xn
k1 =0 k2 =0
kn =0
ergibt sollte evident sein.
In praktischen Anwendungen benötigt man die Terme niedrigster Ordnung.
Für den Fall n = 2 sehen diese bis zur quadratischen Ordnung wie folgt aus
∂f
∂f
f (x, y) = f (x0 , y0 ) +
(x0 , y0 ) (x − x0 ) +
(x0 , y0 ) (y − y0 )
∂x
∂y
1 ∂ 2f
∂ 2f
2
+
(x
,
y
)
(x
−
x
)
+
(x0 , y0 ) (x − x0 )(y − y0 )
0 0
0
2 ∂x2
∂x∂y
1 ∂ 2f
+
(x0 , y0 ) (y − y0 )2 + . . . ,
2 ∂y 2
29
Wir gehen natürlich “Physiker-mäßig” wieder davon aus, daß f hinreichend harmlos ist, so
daß alle Ableitungen die wir bilden auch existieren.
30
Somit müssen auch die Ableitungen von f nach x hinreichend harmlose Funktionen von y
sein.
86
KAPITEL 2. MATHEMATISCHE METHODEN
wobei die Punkte für Terme stehen, die mindestens drei Faktoren der “kleinen”
Größen x − x0 und y − y0 enthalten. Entwickelt man um einen stationären Punkt,
so fallen die beiden linearen Terme (nach Definition des Begriffs stationärer
Punkt) weg. Diese Einsicht läßt sich direkt auch auf den höherdimensionalen
Fall (also z.B. den dreidimensionalen) übertragen.
Betrachten wir ein Teilchen, welches sich in der Nähe eines (lokalen) Potentialminimums bei ~x0 aufhält, d.h. die kinetische Energie31 sei hinreichend klein. In
diesem Fall scheint es plausibel, das Potential in einer Taylorreihe zu entwickeln.
Da es sich bei dem Minimum um einen stationären Punkt handelt, treten in der
Entwicklung bis zur zweiten Ordnung nur der konstante Term und die quadratischen Terme auf. Die auf das Teilchen wirkende Kraft (d.h. der Gradient des
Potentials) hat dann nur Terme die linear in der Auslenkung aus dem Minimum
sind. Das resultierende mechanische Problem ist also analog zu dem einer Masse
mit Hookscher Feder. Diese Überlegung macht es plausibel, daß das Problem mit
linearer Rückstellkraft eine sehr zentrale Rolle in der Mechanik spielt.
Neben dem Gradienten spielen in der Physik die “Differentiellen”-Konzepte
der Divergenz und der Rotation eine zentrale Rolle (speziell in “Feldtheorien” wie
z.B. der Elektrodynamik).
~
Im Fall der Divergenz wendet man den vektorwertigen Differentialoperator ∇
auf eine vektorwertige Funktion von n Veränderlichen an
~ · f~(~x) = ∂f1 + ∂f2 + . . . + ∂fn .
div f~(~x) = ∇
∂x1 ∂x2
∂xn
~ so verstehen, daß er in der {~ej }-Basis durch den
Dabei muß man den Vektor ∇
Spaltenvektor
 ∂ 
∂x1
 ∂
 ∂x2
.
~ =  ...
∇

 ...





∂
∂xn
dargestellt wird. Durch Bilden der Divergenz ergibt sich eine skalare Funktion
von n Veränderlichen.
Wir wollen die Bedeutung der Divergenz anschaulich verstehen. Dazu betrachten wir die Strömung einer kompressiblen Flüssigkeit in drei Dimensionen. Das
Geschwindigkeitsfeld ~v (~x) gibt die Geschwindigkeit (Richtung und Betrag) eines
Teilchens an, welches sich am Ort ~x befindet. Als weitere Größe zur Charakterisierung benötigen wir die lokale Dichte ρ(~x) der Flüssigkeit. Wir betrachten
dann einen kleinen Quader mit Volumen ∆x1 ∆x2 ∆x3 und einem Eckpunkt am
Koordinatenursprung. Dieser ist in der folgenden Skizze dargestellt.
31
Ich gehe davon aus, daß sie diesen Begriff in der Schule kenne gelernt haben und mit Leben
füllen können.
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
G
D
e3
C
e2 E
A e
1
87
H
F
B
Die Flüssigkeitsmenge, die pro Zeit durch Fläche (A, E, G, D) in dieses Volumen fließt ist durch ρv1 |~x=~0 ∆x2 ∆x3 gegeben. Die Komponenten des Flusses
ρv2 und ρv3 die tangential zur Fläche sind tragen nichts zum Fluß durch diese Fläche bei. Die Flüssigkeitsmenge, die pro Zeit durch die Fläche (B, F, H, C)
austritt ist durch ρv1 |x1 =∆x1 ,x2 =x3 =0 ∆x2 ∆x3 bestimmt. Bei diesen Überlegungen
sind wir davon ausgegangen, daß die Funktion ρ(~x)v1 (~x) auf den beiden betrachteten Flächen einen von x2 und x3 unabhängigen Wert hat. Für hinreichend kleine
Quader und hinreichend harmlose Funktionen ρ(~x)v1 (~x) ist dies immer erreichbar. Wir entwickeln dann die austretende Flüssigkeitsmenge in einer Taylorreihe
bezüglich x1 und erhalten
∂ρv1 ∆x1 ∆x2 ∆x3 .
ρv1 |x1 =∆x1 ,x2 =x3 =0 ∆x2 ∆x3 ≈ ρv1 |~x=~0 ∆x2 ∆x3 +
∂x1 ~x=~0
Der Gesamtfluß aus dem Volumen in die x1 -Richtung ergibt sich als Differenz der
beiden gerade berechneten Flüsse und wir erhalten für diesen
∂ρv1 ∆x1 ∆x2 ∆x3 .
∂x1 ~x=~0
Analoge Überlegungen gelten für die Flüsse durch die anderen Flächen des Quaders. Der Gesamtfluß pro Zeit aus dem Quader ist dann die Summe dieser Ausdrücke und durch
∂ρv1 ∂ρv2 ∂ρv3 ~ · (ρ~v )
+
+
∆x
∆x
∆x
=
∇
∆x1 ∆x2 ∆x3
1
2
3
∂x1
∂x2
∂x3 ~x=~0
~
x=~0
~ · (ρ~v ), ist also durch
gegeben. Der Fluß pro Zeit und Volumen ergibt sich so zu ∇
die Divergenz gegeben. Diese hat damit die Bedeutung einer lokalen Quellstärke
des Vektorfeldes ρ~v . Wir sind dabei davon ausgegangen, daß das obige Ergebnis
für kleine Volumina unabhängig von der Form des Volumens (hier “infinitessimaler” Quader) ist und das die Überlegungen nicht auf den Ursprung ~x = 0
beschränkt sind.
88
KAPITEL 2. MATHEMATISCHE METHODEN
Mit der Interpretation der Divergenz eines Vektorfeldes als lokaler Quellstärke,
läßt sich auch eine der Grundgleichungen der Elektrostatik
~ · E(~
~ x) ∝ ρ(~x) ,
∇
~ und der Ladungsdichte ρ, verstehen. Die Quellen eimit dem elektrischen Feld E
nes elektrischen Feldes sind Ladungen. Magnetfelder dagegen haben keine Quellen
(es gibt keine magnetischen Monopole), so daß
~ · B(~
~ x) = 0 ,
∇
~
mit dem Magnetfeld B.
Die Rotation ist in drei Dimensionen (d.h. f~ ∈ R3 und ~x ∈ R3 ) definiert durch
∂f
∂f
∂f
∂f
∂f
∂f
2
1
3
2
1
3
~
~
~ × f (~x) =
−
~e1 +
−
~e2 +
−
~e3 .
rot f (~x) = ∇
∂x2 ∂x3
∂x3 ∂x1
∂x1 ∂x2
~ und f~ gebildet wird, handelt es sich bei
Da hier das Vektorprodukt zwischen ∇
dem Resultat dieser Operation um eine vektorwertige Funktion (eines Vektors).
Die anschauliche Bedeutung der Rotation können wir uns ebenfalls anhand
von Strömungen einer Flüssigkeit klar machen. Dazu betrachten wir einen Wirbel.
Das Geschwindigkeitsfeld ~v (~x) = ω
~ × ~x beschreibt einen speziellen, homogenen
Wirbel mit Richtung ω
~ /|~ω | und Betrag der Wirbelstärke |~ω |. Für die erste Komponente der Rotation von ~v (~x) gilt
∂v2
∂v3
~
−
∇ × ~v
=
∂x2 ∂x3
1
∂(ω1 x2 − ω2 x1 ) ∂(ω3 x1 − ω1 x3 )
=
−
∂x2
∂x3
= 2ω1 .
Analoge Überlegungen für die anderen Komponenten liefern
~ × ~v = 2~ω .
∇
Damit ist klar, daß die Rotation ein Maß für den Betrag und die Richtung der
Wirbelstärke liefert.
Nach der Illustration der Begriffe Divergenz und Rotation sollte ihnen anschaulich klar sein, daß Wirbelfelder stets quellenfrei sind, oder mathematisch
~ · (∇
~ × f~) = 0 ,
∇
falls f~ zweimal stetig differenzierbar ist. In einer Übungsaufgabe werden sie dieses auch mathemtisch zeigen. Wie sie ebenfalls in einer Übungsaufgabe zeigen
werden, gilt
~ × [∇φ(~
~ x)] = 0 ,
∇
2.13. MATRIZEN
89
d.h. die Rotation eines Gradientenfeldes verschwindet, wobei wir natürlich davon
ausgehen, daß φ(~x) zweimal stetig differenzierbar ist.
Verglichen mit der Bedeutung des Gradienten in der klassischen Mechanik
spielen die beiden Begriffe Divergenz und Rotation in dieser eher untergeordnete
Rollen.32
2.13
Matrizen
Wir wollen den Begriff der Matrix hier anhand einer speziellen Klasse von Matrizen - denjenigen die Drehungen beschreiben - einführen. Diese spielen in der
Mechanik eine zentrale Rolle. Wir betrachten dazu die Situation, daß wir ei0
0
0
ne orthonormale Basis B = [~e1 , ~e2 , ~e3 ] auf eine andere B 0 = [~e1 , ~e2 , ~e3 ] rotieren
möchten.
e’3
e3
e’2
e2
e’1
e1
Einen beliebigen Vektor ~x können wir dann in beiden Basen ausdrücken
0
0
0
~x = x1~e1 + x2~e2 + x3~e3 = x01~e1 + x02~e2 + x03~e3 .
(2.43)
Um die x0i , mit i = 1, 2, 3 aus den xj , mit j = 1, 2, 3 zu berechnen, drücken wir
0
zunächst die neuen Basisvektoren ~ei durch die alten ~ej aus
0
~ei = ai,1~e1 + ai,2~e2 + ai,3~e3 .
(2.44)
Die sich ergebenden 3 ∗ 3 Zahlen ai,j ordnen wir in ein 3 × 3 Schema, in dem der
erste Index die Zeile angibt und der zweite die Spalte


a1,1 a1,2 a1,3
A =  a2,1 a2,2 a2,3  ,
a3,1 a3,2 a3,3
welches wir mit A bezeichnen und Matrix nennen. Die ai,j nennen wir Matrixelemente. Die Bedeutung der ai,j erkennen wir, indem wir Gl. (2.44) mit ~ej multiplizieren und Gl. (2.36) verwenden
0
ai,j = ~ei · ~ej .
32
Die Rotation spielt eine Rolle in der Mechanik als “Werkzeug” um zu untersuchen, ob ein
Vektorfeld als Gradient einer skalaren Funktion, d.h. als Gradient eines Potentials, zu schreiben
ist. Wir werden darauf weiter unter zurückkommen.
90
KAPITEL 2. MATHEMATISCHE METHODEN
0
Da die Länge von ~ei und ~ej Eins ist, ergibt sich nach der Definition des Skalarprodukts
0 ai,j = cos ϕ ~ei , ~ej .
Die Matrix A beschreibt also alle Winkel der neuen Basis B 0 in Bezug auf B. Da
0
|~ei | = 1 gilt, folgt aus Gl. (2.44)
0
0
~ei · ~ei = 1 =
3
X
a2i,j
(2.45)
j=1
0
für i = 1, 2, 3. Weiterhin sind die ~ei paarweise senkrecht zueinander (i 6= j)
0
0
~ei · ~ej = 0 =
3
X
ai,k aj,k .
(2.46)
k=1
Die Eigenschaften der Gln. (2.45) und (2.46) sind speziell für die eine Rotation
darstellende Matrix. Für allgemeine Matrizen sind die Matrixelemente ai,j beliebige reelle (oder komplexe) Zahlen. Die Gln. (2.45) und (2.46) kann man zu
3
X
ai,k aj,k = δi,j
(2.47)
k=1
zusammenfassen. Oft schreibt man diese Gleichung einfach als ai,k aj,k = δi,j und
verwendet die Einsteinsche Summationskonvention, die vorschreibt, daß über alle
auf einer Seite der Gleichung doppelt auftretenden Indizes summiert wird. Um zu
sehen, wie man mit Hilfe der Matrix A die x0i in Gl. (2.43) aus den xj berechnen
0
kann, bilden wir auf beiden Seiten der Gleichung das Skalarprodukt mit ~e1 . So
ergibt sich
x01
0
0
0
= x1~e1 · ~e1 + x2~e1 · ~e2 + x3~e1 · ~e3 =
3
X
a1,j xj .
j=1
Völlig analog kann man x02 und x03 bestimmen. Insgesamt gilt
x0i
=
3
X
ai,j xj .
j=1
Mit Hilfe der Matrix können wir also die neuen Vektorkomponenten aus den
alten berechnen. Eine Matrix beschreibt allgemein eine Abbildung eines Vektors
auf einen anderen. Die Klasse von Matrizen mit der Eigenschaft der Gl. (2.47)
bezeichnet man als orthogonale Matrizen. Sie repräsentieren Drehungen.
2.13. MATRIZEN
91
Will man zwei Rotationen - gegeben durch die Matrizen A und B - (allgemeiner zwei Abbildungen) hintereinander ausführen, so kann man die Matrix C,
die beide Transformationen in einem Schritt vermittelt, wie folgt bestimmen
x00i
=
3
X
bi,j x0j
=
3
X
j=1
bi,j
j=1
3
X
aj,k xk =
k=1
3
X
ci,k xk ,
k=1
mit
ci,k =
3
X
bi,j aj,k .
j=1
Kurz schreibt man C = BA. Man multipliziert die Matrizen B und A miteinander.
Will man von den neuen Koordinaten zurück auf die alten transformieren, so
muß gelten
ci,k =
3
X
bi,j aj,k = δi,k ,
j=1
damit x00i = xi folgt. Man bezeichnet B in diesem Fall als das Inverse von A und
schreibt B = A−1 . Mit Hilfe der Gl. (2.47) sieht man, daß sich für orthogonale
Matrizen die Matrixelmente ãi,j der inversen Matrix A−1 aus den ai,j durch Vertauschen der Zeilen- und Spaltenindizes ergeben ãi,j = aj,i . Allgemein nennt man
die sich aus A durch Vertauschen der Zeilen- und Spaltenindizes ergebenden Matrix die zu A transponierte Matrix und bezeichnet sie mit AT . Für orthogonale
Matrizen gilt also AT = A−1 .
Nach dieser Einführung des Matrix-Begriffs anhand eines in der Physik wichtigen Beispiels, wollen wir noch kurz auf ein paar allgemeine Gesichtspunkte
eingehen. Allgemein nennen wir ein Schema mit n Zeilen und m Spalten


a1,1 a1,2 . . . a1,m
 a2,1 a2,2 . . . a2,m 


 ... ... ... ... 


 ·

·
·
·

A=
 ·
·
·
· 


 ·

·
·
·


 ... ... ... ... 
an,1 an,2 . . . an,m
mit ai,j ∈ R (bzw. ∈ C) eine n×m-Matrix. Der erste Index ist der Zeilenindex, der
zweite der Spaltenindex. Bei der Multiplikation einer Matrix mit einer reellen bzw.
komplexen Zahl λ werden einfach alle Matrixelemente ai,j mit λ multipliziert. Für
B = λA gilt also,
bi,j = λai,j für i = 1, 2, . . . , n und j = 1, 2, . . . , m .
92
KAPITEL 2. MATHEMATISCHE METHODEN
Nur für den Fall, daß zwei Matrizen die gleiche Anzahl von Spalten und Zeilen
haben kann die Addition zweier Matrizen A und B sinnvoll definiert werden. Sie
ist komponentenweise definiert, d.h. es gilt für C = A + B
ci,j = ai,j + bi,j für i = 1, 2, . . . , n und j = 1, 2, . . . , m .
Eine Allgemeine n × m-Matrix beschreibt eine lineare Abbildung vom Rm in
den Rn (bzw. vom Cm in den Cn ).33 Eine Abbildung A vom Rm in den Rn heißt
linear, wenn sie die folgenden Eigenschaften für alle ~x, ~y ∈ Rm und λ ∈ R erfüllt:
A(~x + ~y ) = A(~x) + A(~y )
A(λ~x) = λA(~x) .
Um das Bild A(~x) eines Vektors ~x ∈ Rm zu bestimmen, kann man die Matrix A
auf den Vektor ~x anwenden
~y = A~x ,
(2.48)
mit ~y ∈ Rn . Komponentenweise schreibt man diese Gleichung wie folgt:
yi =
m
X
ai,j xj für i = 1, 2, . . . , n .
j=1
Eine Gleichung dieser Form haben sie wahrscheinlich in der Schule im Zusammenhang mit dem Problem von “n linearen Gleichungen zur Bestimmung von
m Unbekannten xj , mit j = 1, 2, . . . , m” kennengelernt. In diesem Kontext ergibt sich das zur Abbildungsidee umgekehrte Problem: Die linken Seiten yi sind
vorgegeben und man möchte die xj bestimmen, die den Satz von Gleichungen
erfüllt. Diese Überlegung führt uns erneut auf das Konzept der Inversen A−1
einer Matrix A. Bevor wir dieses Konzept allgemein genauer beleuchten, müssen
wir die Multiplikation zweier Matrixen definieren. Da es sich bei n × m-Matrizen
um lineare Abbildungen vom Rm in den Rn handelt soll die Matrix C = BA der
Abbildung C entsprechen, die sich beim Hintereinanderausführen von A (zuerst)
und B (als zweites) ergibt. Damit ist unter anderem klar, daß die Multiplikation
nur für zwei Matrizen sinnvoll definiert werden kann, für die die Zahl der Zeilen
der zuerst anzuwendenden Matrix A gleich der Zahl der Spalten der als zweites
anzuwendenden Matrix B ist. Die Matrix A beschreibt damit eine lineare Abbildung vom Rm in den Rn , die Matrix B eine vom Rn in den Rl , so daß C eine
lineare Abbildung vom Rm in den Rl beschreibt. Völlig analog zu den Überlegungen im obigen Beispiel der 3 × 3-Matrix ergibt sich unter Zuhilfenahme von Gl.
(2.48) für die Matrixelemente von C
ci,k =
n
X
bi,j aj,k für i = 1, 2, . . . , l und k = 1, 2, . . . , m .
j=1
33
Von jetzt an, werden wir uns auf reelle Matrizen beschränken. Das folgende läßt sich aber
leicht auf den Fall komplexer Matrizen verallgemeinern.
2.13. MATRIZEN
93
Im Gegensatz zur Multiplikation von reellen Zahlen ist damit klar, daß im Allgemeinen BA nicht gleich34 AB ist, da letzteres nur für l = m überhaupt definiert ist. Aber selbst, wenn beide Produkte definiert sind (z.B. im physikalisch
wichtigen Fall zweier n × n-Matrizen), gilt im Allgemeinen BA 6= AB! Die Matrixmultiplikation ist im Allgemeinen also nicht kommutativ. Ein Beispiel dazu
werden sie in den Übungen rechnen. Im Gegensatz dazu gelten für die Matrixmultiplikation das Assoziativgesetz (AB) C = A (BC) und das Distributivgesetz
(A + B) C = AC + BC.
Betrachten wir im folgenden nur noch den Fall von n×n-Matrizen. Das Inverse
−1
A der Matrix A ist definiert durch
A−1 A = AA−1 = 1 .
Die Einheitsmatrix 1 hat die Matrixelemente δi,j . Diese Gleichung erlaubt es A−1
eindeutig zu berechnen, sofern es A−1 überhaupt gibt. Ein einfaches Kriterium
um festzustellen, ob A−1 existiert, werden sie in der Vorlesung HöMa I beweisen.35 Dort werden sie im Fall der Existenz auch ein systematisches Verfahren
zum Bestimmen von A−1 kennenlernen. Wie man leicht nachrechnet hat die Einheitsmatrix 1 die Eigenschaft A1 = A. Die Nullmatrix 0 ist dadurch definiert,
daß alle Matrixelemente Null sind.36 Damit gilt A0 = 0 für alle Matrizen A.
Nehmen wir an, daß das Inverse von A im oben angesprochenen Beispiel des
Problems “Bestimmung von n Unbekannten xi aus n linearen Gleichungen” (die
yi sind bekannt)
yi =
n
X
ai,j xj für i = 1, 2, . . . , n .
j=1
existiert. In diesem Fall ergeben sich die Unbekannten xi eindeutig aus
xi =
n
X
ãi,j yj für i = 1, 2, . . . , n ,
j=1
wobei die ãi,j die Matrixelemente von A−1 bezeichnen. Für das Bilden der inversen
Matrix gilt37
(AB)−1 = B−1 A−1 ,
wie sich aus X (AB) = 1 durch Multiplikation zuerst mit B−1 und anschließender
Multiplikation mit A−1 jeweils von rechts auf beiden Seiten der Gleichung ergibt.
Im nächsten Kapitel werden wir das so genannte Eigenwertproblem einer speziellen Klasse von Matrizen untersuchen.
34
Zwei Matrizen sind gleich, wenn alle ihre Matrixelemente gleich sind.
Wir werden später kurz auf diesen Aspekt zurückkommen.
36
Durch diese Definition ist auch im allgemeinen Fall der n × m-Matrix eine Nullmatrix
festgelegt.
37
Wir nehmen an, daß alle auftretenden inversen Matrizen auch existieren.
35
94
2.14
KAPITEL 2. MATHEMATISCHE METHODEN
Das Eigenwertproblem und die Hauptachsentransformation
In der Mechanik starrer Körper spielen das Eigenwertproblem und die Hauptachsentransformation eine große Rolle. Eine weitere für uns wichtige Rolle spielen
diese Begriffe bei der Lösung von Systemen gekoppelter linearer Differentialgleichungen. Solche ergeben sich wenn man die Newtonsche Gleichung für eine wichtige Klasse von mechanischen Problemen aufstellt.
Wir werden das Eigenwertproblem anhand eines einfachen Beispiels einführen
und uns hier auf reelle Matrizen, also den Rn , beschränken. Wir betrachten die
(diagonale) 3 × 3-Matrix


1 0 0
A= 0 4 0  .
0 0 −2
Sie hat die Eigenschaft, daß
  
 
 
1
1 0 0
1
1







0 4 0
0
0  ,
A 0
=
=1
0
0 0 −2
0
0
  
 
 
0
1 0 0
0
0







1
0
4
0
1
1  ,
A
=
=4
0
0 0 −2
0
0
  
 
 
0
1 0 0
0
0
A  0  =  0 4 0   0  = −2  0  ,
1
0 0 −2
1
1
d.h. die Basisvektoren ~ej reproduzieren sich bis auf einen Faktor, wenn man A
auf sie anwendet. Allgemein bezeichnet man einen Vektor ~v 6= ~0 der sich bei
Anwenden einer Matrix A bis auf einen Faktor λ ∈ R reproduziert, d.h. für den
A~v = λ~v
gilt, als einen Eigenvektor von A zum Eigenwert λ. Also sind die Basisvektoren
~ej Eigenvektoren der obigen (diagonalen) Matrix A zu den Eigenwerten 1, 4 und
−2. Es stellen sich dann zwei Fragen: 1) Warum ist es interessant Eigenwerte
und Eigenvektoren eine Matrix zu kennen? 2) Wie bestimmt man λ und ~v ? Diese
werden wir in diesem Kapitel der Vorlesung beantworten, wobei wir uns primär
auf Matrizen auf dem R2 und dem R3 beschränken werden.
Bevor wir dazu kommen, wollen wir jedoch ein weitere Eigenschaften von
Eigenvektoren kennenlernen, eine alternative Notation für das Skalarprodukt
einführen und eine Klasse von Matrizen charakterisieren auf deren Eigenwertproblem wir uns dann im folgenden beschränken werden
2.14. DAS EIGENWERTPROBLEM
95
Nehmen wir an, daß wir einen Eigenvektor ~v von A zum Eigenwert λ kennen.
Dann ist auch c~v , mit c ∈ R \ {0} ein Eigenvektor zum Eigenwert λ.38 Das sieht
man sehr leicht
A(c~v ) = cA~v = cλ~v = λ(c~v ) .
Somit ist ein Eigenvektor nur bis auf einen Faktor eindeutig definiert. Daher ist es
sinnvoll einen auf 1 normierten Eigenvektor zum Eigenwert λ einzuführen: |~v | = 1.
Von jetzt an gehen wir davon aus, daß die Eigenvektoren die wir betrachten auf
1 normiert sind.
Weiter oben haben wir den Begriff der transponierten Matrix eingeführt




a1,1 a1,2 . . . a1,m
a1,1 a2,1 . . . an,1
 a2,1 a2,2 . . . a2,m 
 a1,2 a2,2 . . . an,2 




 ... ... ... ... 
 ... ... ... ... 




 ·
 ·
·
·
· 
·
·
· 
T



 .
A=
⇒A = ·

·
·
·
·
·
·
·




 ·


·
·
· 
·
·
· 

 ·

 ... ... ... ... 
 ... ... ... ... 
an,1 an,2 . . . an,m
a1,m a2,m . . . an,m
Wir werden die wichtige Relation
C = AB ⇒ CT = BT AT
benötigen, die sich wie folgt ergibt:
ci,j =
m
X
ai,k bk,j
k=1
⇒
c̃i,j = cj,i =
m
X
k=1
aj,k bk,i =
m
X
k=1
bk,i aj,k =
m
X
b̃i,k ãk,j ,
k=1
wobei die mit einer Schlange bezeichneten Matrixelemente, diejenigen der transponierten Matrix sind.
Eine Matrix mit der Eigenschaft A = AT bezeichnet man als symmetrische
Matrix. Beispiele sind die Matrizen


1 3 −1
A =  3 71 π 
−1 π 0
38
Zwar kann 0 ein Eigenwert einer Matrix sein, jedoch niemals der Nullvektor ein Eigenvektor.
Formal hat der Nullvektor immer die obige definierende Eigenschaft eines Eigenvektors, jedoch
wäre der Eigenwert völlig unspezifisch da jede reelle Zahl µ, die Relation A~0 = µ~0 erfüllt.
96
KAPITEL 2. MATHEMATISCHE METHODEN
und
B=
cos (ϕ) sin (θ)
sin (θ) sin (ϕ)
.
Wir werden hier nur das Eigenwertproblem symmetrischer Matrizen betrachten.
Der Trägheitstensor eines starren Körpers im dreidimensionalen Raum ist eine
solche symmetrische 3 × 3-Matrix. Es ist wichtig zu erkennen, daß nur quadratische n × n-Matrizen symmetrisch sein können.
Um später einfacher vorgehen zu können, wollen wir eine alternative Notation
einführen und das Skalarprodunkt zweier Vektoren als Matrixmultiplikation eines
transponierten Vektors und eines Vektors schreiben. Mit


x1
.
.
~x =  x2  ⇒ ~xT = (x1 , x2 , x3 ) .
x3
Damit können wir schreiben

y1
.
.
~x · ~y = x1 y1 + . . . x3 y3 = (x1 , x2 , x3 )  y2  = ~xT ~y .
y3

Es gilt ebenfalls
~y = A~x
.
⇒ ~y T = (A~x)T = (a1,1 x1 + a1,2 x2 + a1,3 x3 , . . . , a3,1 x1 + a3,2 x2 + a3,3 x3 )


a1,1 a2,1 a3,1
.
= (x1 , x2 , x3 )  a1,2 a2,2 a3,2  = ~xT AT .
a1,3 a2,3 a3,3
Wir betrachten nun das Eigenwertproblem einer symmetrischen Matrix AT =
A. Seien ~vi 6= ±~vj zwei normierte Eigenvektoren zu den Eigenwerten λi und λj
(wir nehmen an, daß es zwei gibt). Damit gilt
~viT A~vj = ~viT λj ~vj = λj (~vi · ~vj ) .
Die linke Seite dieser Gleichung ist aber auch gleich
~viT A~vj = (A~vi )T ~vj = (λi~vi )T ~vj = λi (~vi · ~vj ) .
Aus diesen beiden Gleichungen folgt
(λj − λi )(~vi · ~vj ) = 0 .
Damit gibt es zwei Möglichkeiten:
1. Für λj 6= λi folgt daß ~vj und ~vi senkrecht aufeinander stehen.
2.14. DAS EIGENWERTPROBLEM
97
2. Für λj = λi = λ spannen ~vi und ~vj eine zweidimensionale Ebene E auf.
Jeder Vektor ~x ∈ E läßt sich als
~x = a~vi + b~vj ; a, b ∈ R
schreiben. Daraus ergibt sich sofort, daß auch ~x Eigenvektor zum Eigenwert
λ ist, da
A~x = A(a~vi + b~vj ) = aA~vi + bA~vj = λ(a~vi + b~vj ) = λ~x .
Somit sind alle Vektoren in E Eigenvektoren und wir können zwei Vektoren
auswählen, die senkrecht aufeinander stehen.
Es bleibt noch die wichtige Frage zu beantworten, ob es überhaupt zu einer
reellen, symmetrischen Matrix einen oder mehrere Eigenvektoren (und die dazugehörigen reellen Eigenwerte) gibt. Da wir in dieser Vorlesung bisher recht
konsequent auf Existenzbeweise verzichtet haben (aus Zeitgründen und weil diese in der HöMa geliefert werden), wollen wir dieses auch in diesem Fall tun. Sie
werden in den hier betrachteten Beispielen “konstruktiv” sehen, daß es immer n
Eigenvektoren gibt. In der HöMa Vorlesung wird bewiesen, daß es zu einer reellen
symmetrischen n × n-Matrix n Eigenvektoren (und dazugehörige reelle Eigenwerte) gibt. Für allgemeine (nicht-symmetrische Matrizen ist das nicht unbedingt
der Fall.
Aus 1. und 2. ergibt sich, daß die auf 1 normierten Eigenvektoren paarweise
senkrecht aufeinander stehen. Also für i = 1, 2, . . . , n: |~vi | = 1; ~vi ⊥ ~vj für i 6= j.
Damit ist {~v1 , ~v2 , . . . , ~vn } eine orthonormale Basis (Rechtssystem). Bei festgehaltenem Ursprung geht {~v1 , ~v2 , . . . , ~vn } durch eine Rotation aus {~e1 , ~e2 , . . . , ~en }
hervor. Betrachten wir wieder den Spezialfall einer symmetrischen 3 × 3-Matrix
A und die dazugehörige Matrix

  T 
v1,1 v1,2 v1,3
~v1
S =  v2,1 v2,2 v2,3  =  ~v2T 
v3,1 v3,2 v3,3
~v3T
die aus den zueinander senkrechten, normierten Eigenvektoren von A gebildet
ist. Es gilt


v1,1 v2,1 v3,1
ST =  v1,2 v2,2 v3,2  = (~v1 , ~v2 , ~v3 ) .
v1,3 v2,3 v3,3
Nach unseren obigen Überlegungen und denen des letzten Kapitels beschreibt S
eine Rotation und ist somit eine orthogonale Matrix mit ST = S−1 . Wir betrach-
98
KAPITEL 2. MATHEMATISCHE METHODEN
ten nun39

 T 
~v1
~v1T
=  ~v2T  A(~v1 , ~v2 , ~v3 ) =  ~v2T  (λ1~v1 , λ2~v2 , λ3~v3 )
~v3T
~v3T


λ1 ~v1 · ~v1 λ2 ~v1 · ~v2 λ3 ~v1 · ~v3
=  λ1 ~v2 · ~v1 λ2 ~v2 · ~v2 λ3 ~v2 · ~v3 
λ1 ~v3 · ~v1 λ2 ~v3 · ~v2 λ3 ~v3 · ~v3


λ1 0 0
=  0 λ2 0  .
0 0 λ3

SAST
Durch das Anwenden von S von links und ST von rechts, haben wir die Matrix
A somit auf Diagonalform gebracht. Die Einträge auf der Diagonalen sind die Eigenwerte. Dies ist die Hauptachsentransformation. Wie sie in der Mechanik lernen
werden ist es sehr vorteilhaft, z.B. den Trägheitstensor eines starren Körpers mit
Hilfe der Hauptachsentransformation auf Diagonalform zu bringen. Dazu benötigen wir natürlich die Matrix S, d.h. die Eigenvektoren der symmetrischen Matrix
A. Wir wollen daher als nächstes beschreiben, wie man die ~vi und λi bestimmt.
Um einen Weg zur Bestimmung von ~vi und λi zu finden betrachten wir die
Definitionsgleichung.
⇒
A~vi = λi~vi = λi 1~vi
(A − λi 1)~vi = 0 .
Die Frage die sich somit zur Bestimmung von λi stellt ist: Für welche λi gibt
es eine nicht-triviale Lösung ~vi 6= 0 der Gleichung in der letzten Zeile?40 Wir
haben also das Problem vorliegen: B~x = 0; unter welcher Bedingung an B gibt
es Lösung mit ~x 6= 0. Wir führen Vektoren ~bi ein, so daß


~bT
 1 
B =  ~bT2  ,
~bT
3
woraus sich für die uns interessierende Gleichung

  
~b1 · ~x
0
~
  
0
B~x =  b2 · ~x  =
~b3 · ~x
0
ergibt. Die Frage ist also, ob es einen Vektor ~x 6= 0 gibt, der senkrecht auf allen
drei Vektoren ~b1 , ~b2 und ~b3 steht. Es gibt im R3 solch einen Vektor falls die ~b1 , ~b2
39
40
Vergewissern sie sich, daß sie die hier verwendete Notation wirklich verstehen!
Zur Erinnerung: Der Nullvektor kann nicht Eigenvektor sein.
2.14. DAS EIGENWERTPROBLEM
99
und ~b3 in einer Ebene liegen (d.h. koplanar sind). Also gibt es eine nicht-triviale
Lösung wenn das durch die drei Vektoren ~bi aufgespannte dreidimensionale Volumen, d.h. das Spatprodukt der drei Vektoren ~bi , verschwindet:41
V (~b1 , ~b2 , ~b3 ) = (~b1 × ~b2 ) · ~b3 = 0 .
In diesem Kontext nennt man V (~b1 , ~b2 , ~b3 ) die Determinante der 3 × 3-Matrix B,
die man mit det B bezeichnet.
Die Determinante berechnet sich dann wie folgt:

 

b1,2 b2,3 − b1,3 b2,2
b3,1
det B = (~b1 × ~b2 ) · ~b3 =  b1,3 b2,1 − b1,1 b2,3  ·  b3,2 
b1,1 b2,2 − b1,2 b2,1
b3,3
= b1,2 b2,3 b3,1 − b1,3 b2,2 b3,1 + b1,3 b2,1 b3,2
−b1,1 b2,3 b3,2 + b1,1 b2,2 b3,3 − b1,2 b2,1 b3,3 .
Es gibt für diesen etwas unübersichtlichen Ausdruck eine einfache Merkregel, die
in der Vorlesung angegeben wird.
Eine völlig analoge Argumentation kann für 2 × 2-Matrizen geführt werden.
Die Determinante einer 2 × 2-Matrix ist das durch die Vektoren ~b1 und ~b2 aufgespannte zweidimensionale Volumen (also die Fläche), die sich gemäß
V (~b1 , ~b2 ) = |~b1 ||~b2 | sin (ϕ) ,
mit dem von ~b1 und ~b2 eingeschlossenen Winkel ϕ, berechnet. Mit Hilfe der folgenden Skizze können wir diesen Ausdruck umformulieren, so daß sich die Determinante aus den Matrixelementen ergibt.
e2
b2
θ
ϕ
b1
ψ
e1
Es gilt
det B = V (~b1 , ~b2 ) = |~b1 ||~b2 | sin (θ − ψ) = |~b1 ||~b2 | [sin (θ) cos (ψ) − cos (θ) sin (ψ)]
= b1,1 b2,2 − b1,2 b2,1 .
41
Eine zweidimensionale Ebene im dreidimensionalen Raum hat Volumen 0.
100
KAPITEL 2. MATHEMATISCHE METHODEN
Wie man die Determinante für eine allgemeine n × n-Matrix definiert werden sie
in der Vorlesung HöMa I kennen lernen.
Bezüglich der Bestimmung der Eigenwerte zu einer gegebenen Matrix A stellt
sich also die Frage, für welche λ
det (A − λ1) = 0
gilt. Nach den obigen Regeln zur Bestimmung der Determinanten von 2 × 2und 3 × 3-Matrizen ist klar, daß es sich bei der linke Seite dieser Gleichung
um ein Polynom zweiten bzw. dritten Grades in λ handelt. Man nennt es auch
das charakteristische Polynom. Die Eigenwerte sind somit die Nullstellen des
charakteristischen Polynoms.
Betrachten wir nun abschließend ein Beispiel was auch zeigt, wie man bei
bekanntem Eigenwert einen Eigenvektor bestimmt. Weitere Beispiele werden sie
in den Übungen rechnen. Wir betrachten die symmetrische 2 × 2-Matrix
1 −1
A=
.
−1 3
Das charakteristische Polynom ergibt sich zu
1 − λ −1
det (A − λ1) = det
= (1 − λ)(3 − λ) − 1 = λ2 − 4λ + 2 ,
−1 3 − λ
mit den Nullstellen
λ1/2 = 2 ±
√
2.
Die Matrix A hat somit die Eigenwerte λ1/2 = 2 ±
ergibt sich als der Vektor, der die Gleichung
√
2. Der Eigenvektor ~v1 zu λ1
(A − λ1 1) ~v1 = 0
⇒
1−2−
−1
√
2
−1 √
3−2− 2
v1,1
v1,2
=
0
0
erfüllt. Die erste Komponente dieser Gleichung liefert
√
(−1 − 2)v1,1 − v1,2 = 0
√
⇒
v1,2 = −(1 + 2)v1,1 .
Die sich aus der zweiten Komponente ergebende Gleichung liefert die gleiche
Bedingung, was man daran sieht, daß sie mit der ersten Gleichung konsistent ist
√
√
√
−v1,1 + (1 − 2)v1,2 = −v1,1 − (1 − 2)(1 + 2)v1,1 = −v1,1 + v1,1 = 0 .
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
101
Also folgt für den Eigenvektor zum Eigenwert λ1 , daß er die Form
~v1 =
x√
−(1 + 2)x
,
mit x ∈ R hat. Das x bestimmen wir nun so, daß ~v1 auf 1 normiert ist
q
q
√
√
|~v1 | = x2 + (1 + 2)2 x2 = |x| 4 + 2 2
und damit
1
x= p
√ ,
4+2 2
wobei wir uns für das positive x entschieden haben. In den Übungen werden sie
dieses Beispiel vervollständigen, d.h. ~v2 berechnen und explizit zeigen, daß die
bestimmten λi und ~vi , mit i = 1, 2, die Definitionsgleichung für Eigenwerte und
Eigenvektoren erfüllen.
2.15
Systeme linearer Differentialgleichungen
Wir werden jetzt noch einmal auf Differentialgleichungen zurückkommen. Genauer wollen wir Systeme linearer, gekoppelter Differentialgleichungen betrachten, die
in der Mechanik eine wichtige Rolle spielen und zusätzlich ein wichtiges Hilfsmittel zur Lösung von Gleichungen höherer Ordnung darstellen.
Als erstes Beispiel betrachten wir das in der folgenden Abbildung dargestellte
mechanische Problem.
m
m
x1
x2
Zwei Körper gleicher Masse m sind über Hooksche Federn gleicher Federkonstante k ≥ 0 mit den Wänden verbunden und eine weitere Hooksche Feder mit
Konstanten K ≥ 0 miteinander gekoppelt. Wir nehmen an, daß sich die Massen reibungsfrei auf einem Tisch (dieser “liefert” die Gegenkraft zur Gravitationskraft) bewegen können. Die Auslenkung aus der Ruhelage ist durch x1 und
x2 bezeichnet und sei hinreichend klein, so daß die Massen während der Bewegung nicht direkt aneinander stoßen. Die Gravitationskraft zwischen den beiden
Massen (und mit den Wänden) kann man verglichen mit den über die Federn
102
KAPITEL 2. MATHEMATISCHE METHODEN
vermittelten Kräfte vernachlässigen Die Newtonschen Bewegungsgleichungen für
die xj ergeben sich dann zu
d2
K
k+K
x1 (t) + x2 (t)
x1 (t) = −
2
dt
m
m
d2
k+K
K
x1 (t) −
x2 (t)
x2 (t) =
dt2
m
m
bzw. in Matrixschreibweise
k+K
K
d2
x1 (t)
− m
x
(t)
1
m
=
K
k+K
x2 (t)
−
dt2 x2 (t)
m
m
und bilden ein System linearer, gekoppelter Differentialgleichungen zweiter Ordnung. Die Matrix auf der rechten Seite ist symmetrisch. Die Anfangsbedingungen
sind durch x1 (t = 0) = x01 , ẋ1 (t = 0) = v10 , x2 (t = 0) = x02 , und ẋ2 (t = 0) = v20
gegeben. Es ist physikalisch plausibel, daß es diese vier Anfangsbedingungen gibt.
Das gekoppelte Differentialgleichungssystem ist linear und hat konstante Koeffizienten, d.h. die Einträge der Matrix hängen nicht von der Zeit t ab. Für den Fall
K = 0 wird die obige Matrix diagonal und das System zerfällt in zwei identische
ungekoppelte Gleichungen (j = 1, 2)
k
d2
xj (t) = − xj (t)
2
dt
m
mit der formalen Lösung (aj = Aj exp (−iδj ) sind komplexe Konstanten, wobei
Aj , δj ∈ R)
p
xj (t) = aj eiωt , ω = k/m ,
wobei wir komplexe Zahlen verwendet haben und die Anfangsbedingungen noch
nicht eingebaut sind. Die physikalische Lösung bestimmen wir später durch Bilden
des Realteils. Als Ansatz zur Lösung der gekoppelten Gleichungen wählen wir nun
xj (t) = x̄j exp (iλt). Einsetzten dieses Ansatz in die obige Matrixgleichung und
Kürzen des Exponentialfaktors liefert die Eigenwertgleichung
k+K
K
x̄1
− m
x̄
1
2
m
−λ
=
.
K
x̄2
x̄2
− k+K
m
m
Die Nullstellen des charakteristischen Polynoms (in λ2 )
2 2
k+K
K
2
2
P (λ ) = λ −
−
m
m
sind
λ21 =
k
,
m
λ22 =
k + 2K
m
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
und die normierten Eigenvektoren
!
(1)
1
x̄1
1
=√
,
(1)
x̄2
2 1
(2)
x̄1
(2)
x̄2
!
1
=√
2
1
−1
103
.
Man nennt die positive Wurzel der beiden Eigenwerte λ2j , also
r
r
k
k + 2K
, λ2 =
λ1 =
m
m
die Normalfrequenzen der gekoppelten Bewegung. Die Eigenvektoren legen die
zugehörigen Eigenmoden fest. Betrachten wir zunächst λ1 . In diesem Fall löst
x1 (t)
1
= A cos (λ1 t − δ)
x2 (t)
1
die Bewegungsgleichung. Beide Massen oszillieren in dieser Eigenmode in Phase
und haben die selbe maximale Auslenkung. Die mittlere Feder mit Federkonstanter K wird nie komprimiert oder gedehnt,
was erklärt, daß K in der Frequenz der
p
Bewegung keine Rolle spielt (λ1 = k/m wie für eine einzelne Masse). Um eine
Bewegung in dieser Eigenmode anzuregen, muß man selbstverständlich Anfangsbedingungen wählen, die mit ihr kompatibel sind. Die Bewegung in der zweiten
Eigenmode ist durch
x1 (t)
1
A cos (λ2 t − δ)
= A cos (λ2 t − δ)
=
x2 (t)
−1
A cos (λ2 t − δ + π)
beschrieben. In diesem Fall bewegen sich die Massen mit einer relativen Phasenverschiebung um π. Um das System in dieser Mode anzuregen, müssen die
Anfangsbedingungen erneut kompatibel mit ihr sein. Wir sehen also, daß die Bewegung beider gekoppelter Massen in den Eigenmoden rein sinusförmig mit Frequenz λj ist. Dies zeichnet die Eigenmoden gegenüber der allgemeinen Lösung
aus, die durch eine Überlagerung der beiden Normalfrequenzen charakterisiert
ist. Sie ist durch
1
x1 (t)
1
= A1 cos (λ1 t − δ1 )
+ A2 cos (λ2 t − δ2 )
x2 (t)
1
−1
gegeben. Die vier reellen Konstanten Aj und δj müssen dann noch so angepasst
werden, daß die vier Anfangsbedingungen erfüllt werden. Die resultierende Bewegung ist recht kompliziert und im Allgemeinen nicht einmal periodisch. Den
Fall schwacher Kopplung der beiden Massen, also K k werden sie in einer
Übungsaufgabe diskutieren.
Die obigen Konzepte (Ansatz, Eigenwertproblem, Eigenmoden) spielen auch
in komplizierteren Situationen innerhalb der Mechanik eine wichtige Rolle, so daß
das Beispiel uns bereits wichtige Informationen für komplexere Probleme liefert.
104
KAPITEL 2. MATHEMATISCHE METHODEN
In unserem zweiten Beispiel tritt ein System gekoppelter Differentialgleichungen erster Ordnung als Rechentrick bei der Lösung einer Gleichung höherer Ordnung auf. Wir betrachten das obige mechanische Beispiel (Masse auf Tisch, welcher die Gravitationskraft kompensiert), diesmal jedoch mit nur einer Masse m
und einer Feder mit Federkonstanten k. Zusätzlich berücksichigten wir jetzt die
Reibungskraft. Wir nehmen dabei an, daß diese die Form Freib = −bẋ, mit b ≥ 0
hat, also proportional zur Geschwindigkeit ist, aber in die der Geschwindigkeit
entgegen gesetzte Richtung zeigt. Für das konkret vorliegende Problem mag das
eine mehr oder weniger gut gerechtfertigte Annahme sein, die uns jedoch eine
gute Einstiegsmöglichkeit zum Verständnis der möglichen Typen (je nach Wahl
der Parameter) von Bewegung ermöglicht. Die Newtonsche Gleichung ist dann
mẍ(t) = −kx(t) − bẋ(t)
b
k
⇒ ẍ(t) + x(t) + ẋ(t) = 0 .
m
m
In dem wir v(t) = ẋ(t) verwenden, schreiben wir diese Gleichung in zwei um
x(t)
ẋ(t)
0
1
,
=
v(t)
v̇(t)
−ω02 −2γ
wobei wir ω02 = k/m (Frequenz der Bewegung für b = 0) und 2γ = b/m eingeführt haben. Die Anfangswerte sind x(t = 0) = x0 und v(t = 0) = v0 . Aus
einer Gleichung zweiter Ordnung haben wir somit ein System von gekoppelten
Gleichungen erster Ordnung gemacht. Dieses lösen wir nun ähnlich zum obigen
Beispiel. Wir setzten an (λ kann dabei eine komplexe Zahl sein)
x(t)
x̄
λt
=e
.
v(t)
v̄
Eingesetzt liefert das
λ
x̄
v̄
=
0
1
2
−ω0 −2γ
x̄
v̄
,
also erneut eine Eigenwertgleichung, aber diesmal für eine nicht-symmetrische
Matrix. Die Eigenwerte des charakteristischen Polynoms sind (da die reelle Matrix
nicht symmetrisch ist, ist nicht garantiert, daß die Eigenwerte reell sind)
q
λ± = −γ ± i ω02 − γ 2 .
Die Lösungen mit den beiden Eigenwerten sind unabhängig und für die allgemeine
Lösung müssen wir
x(t) = a+ eλ+ t + a− eλ− t
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
105
ansetzten. Die a± sind so zu bestimmen, daß die Anfangsbedingungen gelten.
Die physikalische Lösung muß natürlich wieder reell sein. Wir wollen nun vier
Spezialfälle der allgemeinen Lösung diskutieren.
(i) Die ungedämfte Bewegung mit γ = 0. Dieser sind wir natürlich bereits
mehrfach begegnet. Für γ = 0 gilt λ± = ±iω0 und damit
x(t) = x0 cos (ω0 t) +
v0
sin (ω0 t) .
ω0
Die Bewegung ist also rein oszillatorisch mit Frequenz ω0 .
γ/ω0=0
x/x0
1
0
-1
0
5
10
ω0t
15
20
(ii) Die schwach gedämpfte Bewegung mit 0 < γ ω0 . Dann ergibt sich
s
q
γ2
λ± = −γ ± i ω02 − γ 2 = −γ ± iω0 1 − 2
(2.49)
ω0
4 γ2
γ
= −γ ± iω0 1 − 2 + O
,
2ω0
ω04
wobei wir die Taylorentwicklung verwendet haben. In niedrigster Ordnung in der
kleinen Größe γ/ω0 gilt also λ± ≈ ±iω0 − γ. Damit ergibt sich für die Bewegung
unter Berücksichtigung der Anfangsbedingungen
x(t) = x0 e−γt cos (ω0 t) +
v0 + γx0 −γt
e
sin (ω0 t) .
ω0
Wir finden somit eine exponentiell gedämpfte, oszillatorische (mit Frequenz ω0 )
Bewegung.
106
KAPITEL 2. MATHEMATISCHE METHODEN
γ/ω0=0.1
x/x0
1
0
-1
0
5
10
ω0t
15
20
(iii) Kritischer Grenzfall mit γ = ω0 . Dann ergibt sich
λ± = −γ ,
d.h. der Eigenwert ist zweifach entartet und man findet zunächst nur eine Lösung
der Differentialgleichung. Eine zweite ist durch t exp (−γt) gegeben, so daß die
Lösung unter Berücksichtigung der Anfangsbedingungen
x(t) = x0 e−γt + (v0 + γx0 ) t e−γt
lautet. Die Bewegung ist somit exponentiell gedämpft.
γ/ω0=1
1
x/x0
0.8
0.6
0.4
0.2
0
0
5
ω0t
10
(iv) Stark gedämpfter Fall mit γ ω0 . Die Talorentwicklung der Eigenwerte
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
107
gibt in diesem Fall
λ±
q
= −γ ± i ω02 − γ 2 = −γ ± γ
s
1−
ω02
γ2
4 ω02
ω0
= −γ ± γ 1 − 2 + O
2γ
γ4
und damit in führender Ordnung
λ+ ≈ −
ω02
,
2γ
λ− ≈ −2γ .
Aufgrund der obigen Annahme gilt λ+ /λ− 1. Die Lösung der Differentialgleichung unter Berücksichtigung der Anfangsbedingungen ist in diesem Limes
x(t) =
v0
x0 +
2γ
ω2
e
− 2γ0 t
−
v0 −2γt
e
.
2γ
Der erste exponentiell abfallende Term bestimmt dabei das Langzeitverhalten,
während der zweite für das Kurzeitverhalten verantwortlich ist.
γ/ω0=5
x/x0
1
0.5
0
0
50
100
γt
Ein sehr interessantes mechanisches System in dem das obige Konzept der Abbildung einer Differentialgleichung höherer Ordnung auf ein System erster Ordnung und die gerade gewonnenen Ergebnisse eine wichtige Rolle spielen ist die
getriebene, gedämpfte Oszillation. Diese werden sie in einer Übungsaufgabe diskutieren. Hier wollen wir es bei den beiden hoffentlich instruktiven Beispielen zu
Systemen gekoppelter Differentialgleichungen belassen.
108
2.16
KAPITEL 2. MATHEMATISCHE METHODEN
Die Integration im Rn
Wir hatten bereits diskutiert, daß die Integration
Z b
f~(x) dx
a
einer vektorwertigen Funktion von einer Variablen, als Integration der einzelnen
Komponenten von f~(x) zu verstehen ist und somit kein neues Konzept darstellt.
Anders ist es, wenn man eine skalare oder vektorwertige Funktion von n Variablen integriert. Für diesen Fall gibt es verschiedene physikalisch interessante
Integraltypen.
Als physikalische Motivation des ersten Integraltyps, des Kurvenintegrals, betrachten wir die Arbeit die verrichtet wird, wenn man eine Masse entlang eines
Pfades ~r(t) in einem Kraftfeld F~ (~r) bewegt. Aus der Schule kennen sie sicherlich
die Definition
Arbeit = Kraft · Weg ,
also
W = F~ · ~r .
Diese ist jedoch nur dann richtig, wenn die Kraft entlang des Weges konstant
ist, was im Allgemeinen sicherlich nicht der Fall ist. Der Ausdruck ist daher
allgemeiner zu ersetzen durch
Z
W = F~ (~r) · d~r ,
C
wobei wir nun genauer erklären müssen, was wir mit den auftretende Symbolen
meinen. Zunächst bezeichnet C die Bahnkurve, also die durch die Vektoren ~r(t)
beschriebenen Punkte im R3 mit dem Parameter (der Zeit) t zwischen einem(r)
Anfangs- und Endwert(zeit), entlang derer die Masse bewegt wird. Das Integralsymbol definieren wir (wie im “gewöhnlichen” Fall) als Limes von RiemannSummen. Dazu unterteilen wir die Kurve in N +1 Punkte ~ra = ~r0 , ~r1 . . . . , ~rN = ~re ,
mit den Anfangs- und Endpunkten ~ra und ~re . Liefert dann der Ausdruck
N
X
F~ (~rj ) · ∆~rj , ∆~rj = ~rj − ~rj−1
j=1
für jede beliebige Zerlegung mit ∆~r → 0 für N → ∞ das gleiche Ergebnis, so
definiert dieser Limes das Kurvenintegral
lim
N →∞
N
X
j=1
F~ (~rj ) · ∆~rj =
Z
C
F~ (~r) · d~r .
2.16. DIE INTEGRATION IM RN
109
Aus der Definition über eine Riemann-Summe wird klar, daß es sich beim Kurvenintegral um ein Skalar handelt. Die Definition kann in beliebigen Raumdimensionen n = 2, 3, . . . verwendet werden.
Ein besonderes Symbol führt man für den auch in der Physik wichtigen Fall
ein, daß die Anfangs- und Endpunkte der Kurve aufeinander fallen, also ~ra = ~re
gilt. In diesem Fall schreibt man
I
F~ (~r) · d~r .
C
Aus der Definition des Kurvenintegrals folgt sofort die Eigenschaft
Z
Z
~
F (~r) · d~r = −
F~ (~r) · d~r ,
C
(2.50)
−C
wobei −C die in umgekehrter Richtung durchlaufene Kurve bezeichnet.
Um das Kurvenintegral explizit zu berechnen führen wir es auf ein gewöhnliches Riemann-Integral zurück. Ist die Parametrisierung der Kurve ~r(t) explizit
bekannt, so gehört zu jedem ~rj eine “Zeit” tj mit ~r(tj ) = ~rj und wir können jeden
Summanden der Riemann-Summe wie folgt umschreiben
~r(tj ) − ~r(tj−1 )
(tj − tj−1 ) .
F~ (~r(tj )) · ∆~r(tj ) = F~ (~r(tj )) ·
tj − tj−1
Im Limes N → ∞ erhalten wird dann42
Z
Z te h
i
˙
~
F~ (~r(t)) ·~r(t)
dt .
F (~r) · d~r =
C
ta
Die rechte Seite dieser Gleichung ist ein “gewöhnliches” Integral über t von der
Anfangszeit ta mit ~ra = ~r(ta ) bis zur Endzeit te mit ~re = ~r(te ). Der Integrand ist
˙
das t-abhängige Skalar F~ (~r(t)) ·~r(t).
Ist keine Parameterdarstellung der Kurve bekannt, so kann man wie folgt
vorgehen.43 Wir schreiben ∆~rj = ∆x1,j ~e1 + ∆x2,j ~e2 + ∆x3,j ~e3 und erhalten in der
Riemann-Summe
N
X
[F1 (~rj )∆x1,j + F2 (~rj )∆x2,j + F3 (~rj )∆x3,j ] .
j=1
Zu einem festen x1 gehört (lokal) entlang von C ein bestimmtes x2 und x3 , so daß
wir x2 und x3 als Funktion von x1 auffassen können. Damit reduziert sich der
˙
Wir gehen stillschweigend davon aus, daß~r(t)
existiert, was in physikalischen Situationen
sicherlich sehr plausibel ist.
43
Wir konzentrieren uns hier auf den Fall dreier Raumdimensionen. Die Erweiterung auf
andere n ist offensichtlich.
42
110
KAPITEL 2. MATHEMATISCHE METHODEN
erste Summand der Riemann-Summe im Limes N → ∞ auf ein “gewöhnliches”
Integral
lim
N →∞
N
X
Z
x1,e
F1 (x1 , x2 (x1 ), x3 (x1 )) dx1 .
F1 (~rj )∆x1,j =
x1,a
j=1
Analog kann man mit den anderen Summanden verfahren und erhält den Ausdruck
Z x1,e
Z
~
F1 (x1 , x2 (x1 ), x3 (x1 )) dx1
F (~r) · d~r =
x1,a
C
Z x2,e
F2 (x1 (x2 ), x2 , x3 (x2 )) dx2
+
x2,a
Z x3,e
+
F3 (x1 (x3 ), x2 (x3 ), x3 ) dx3 .
(2.51)
x3,a
Als Beispiel der Integration eines Feldes entlang einer Kurve betrachten wir
das Vektorfeld
F~ (~r) = (3x21 + 2x2 )~e1 − 9x2 x3~e2 + 8x1 x23~e3 .
Der Anfangspunkt der betrachteten Wege soll im Koordinatenusrprung liegen
und der Endpunkt bei x1 = x2 = x3 = 1. Wir betrachten die zwei Wege C1 mit
Parameterdarstellung ~r(t) = t~e1 + t~e2 + t~e3 , 0 ≤ t ≤ 1, also eine Gerade, sowie C2
mit Parameterdarstellung ~r(t) = t~e1 + t2~e2 + t4~e3 , 0 ≤ t ≤ 1. Dieser Weg stellt auf
die x1 -x2 - sowie x2 -x3 -Ebene projeziert eine Parabel dar und ist projeziert auf die
4
x
R 1 -x3 -Ebene eine “Parabel vierter Ordnung” x3 = x1 . Wir bestimmen zunächst
F~ (~r) · d~r mit Hilfe der Parameterdarstellung. Es gilt
C1
d~r
F~ (~r) ·
= (3t2 + 2t)1 + (−9tt)1 + (8tt2 )1 = 8t3 − 6t2 + 2t .
dt
Damit folgt
Z
Z 1
1
~
F (~r) · d~r =
(8t3 − 6t2 + 2t)dt = 2t4 − 2t3 + t2 0 = 1 .
C2
0
Dasselbe Integral wollen wir nun berechnen indem wir so tun, als wenn wir keine
Parametrisierung des Weges kennen würden. Wir können dann Gl. (2.51) verwenden
Z 1
Z
Z 1
2
F~ (~r) · d~r =
3x1 + 2x2 (x1 ) dx1 − 9
x2 x3 (x2 ) dx2
C1
0
0
Z 1
+8
x1 (x3 )x23 dx3 .
0
2.16. DIE INTEGRATION IM RN
111
Auf C1 gilt x2 (x1 ) = x1 , x3 (x2 ) = x2 und x1 (x3 ) = x3 , so daß sich dieser Ausdruck
zu
Z
Z 1
Z 1
Z 1
2
2
~
F (~r) · d~r =
3x1 + 2x1 dx1 − 9
x2 dx2 + 8
x33 dx3
C1
0
0
0
vereinfacht, woraus sich erneut
Z
F~ (~r) · d~r = 2 − 3 + 2 = 1
C1
ergibt. Wir betrachten nun das Integral
terdarstellung von C2 . Mit dieser gilt
R
C2
F~ (~r) · d~r und verwenden die Parame-
d~r
= (3t2 + 2t2 )~e1 − 9t2 t4~e2 + 8tt8~e3 · ~e1 + 2t~e2 + 4t3~e3
F~ (~r) ·
dt
= 5t2 − 18t7 + 32t12 .
Damit folgt
Z
F~ (~r) · d~r =
Z
C1
1
(5t2 − 18t7 + 32t12 )dt
0
5 18 32
293
=
−
+
=
.
3
8
13
156
Wie wir im Beispiel gesehen haben hängen Kurvenintegrale über Vektorfelder im Allgemeinen sowohl vom Vektorfeld wie auch von den Details des Weges
C ab. Es gibt jedoch auch die physikalisch wichtigen Situationen, in denen das
Integral nicht von dem kompletten Weg, sondern nur vom Anfangs- und Endpunkt abhängt. Das obige Beispiel der Arbeit liefert diverse “Alltags”-Beispiele
dafür, daß Kurvenintegrale in der Tat nur vom Anfangs- und Endpunkt abhängen
können und nicht davon, wie man von ~ra nach ~re gekommen ist. Diese Eigenschaft
des Integrals ist auf eine Eigenschaft des im Integranden auftretenden Feldes
zurück zu führen. Nehmen wir an, daß solch ein Fall vorliegt und betrachten die
Funktion
Z ~r
φ(~r) =
F~ (~r0 ) · d~r0 ,
(2.52)
~
ra
wobei wir an das Integral jetzt nur noch die Grenzen zu schreiben brauchen und
nicht mehr den ganzen Weg spezifizieren müssen. Bilden wir nun φ(~r +∆~r)−φ(~r),
so gilt
Z
φ(~r + ∆~r) − φ(~r) =
~
r
~
r+∆~
r
F~ (~r0 ) · d~r0 .
112
KAPITEL 2. MATHEMATISCHE METHODEN
Dabei haben wir ausgenutzt, daß sollte ~r nicht bereits auf dem Weg C2 von ~ra
nach ~r + ∆~r liegen, wir diesen Weg so deformieren können (ohne das Ergebnis
der Integration zu verändern), daß dieses der Fall ist. Da das Vektorfeld F~ (~r)
beliebig “harmlos” angenommen werden kann, gibt es nach dem oben anschaulich
“bewiesenen” Mittelwertsatz ein ~r00 mit der Eigenschaft
φ(~r + ∆~r) − φ(~r) = F~ (~r00 ) · ∆~r .
Im Limes |∆~r| → 0 (∆~r kann in beliebige Richtung gegen den Nullvektor gehen)
folgt so das wichtige Ergebnis
~ r) = F~ (~r) ,
grad φ(~r) = ∇φ(~
d.h. ein Vektorfeld F~ mit der Eigenschaft, daß Kurvenintegrale über F~ nur vom
Anfangs- und Endpunkt abhängen, kann (wenn alle beteiligten Funktionen beliebig “harmlos” angenommen werden) als der Gradient einer skalaren Funktion
geschrieben werden. Diese ist über Gl. (2.52) bis auf eine additive Konstante
eindeutig durch F~ festgelegt. Die Wahl der Konstanten entspricht der Wahl des
Anfangspunktes ~ra in dieser Gleichung. Für den Fall des Kraftfeldes heißt das,
daß die Kraft (unter der obigen Bedingung an die Arbeit) als Gradient eines Potentials geschrieben werden kann. Die Darstellbarkeit von F~ als Gradientenfeld
ist also notwendig, wenn das Kurvenintegral nur von ~ra und ~re und nicht den
Details des Weges abhängt. Um zu zeigen, daß diese Bedingung auch hinreichend
~ Dann gilt
ist, nehmen wir an, daß F~ ein Gradientenfeld ist F~ = ∇φ.
Z
Z
~ r) · d~r
F~ (~r) · d~r =
∇φ(~
C
C
Z te d~
r
(t)
~ r(t)) ·
dt
∇φ(~
=
dt
ta
Z te
dφ(~r(t))
=
dt
dt
ta
= φ(~r(te )) − φ(~r(ta ))
und das Integral hängt nur von ta und te nicht aber den Details des Wegs ab.
Dabei haben wir von der zweiten in die dritte Zeile die Kettenregel angewandt
∂φ dx1
∂φ dx2
∂φ dx3
dφ(~r(t))
=
+
+
dt
∂x1 dt
∂x2 dt
∂x3 dt
und im Schritt zur letzten Zeile den Hauptsatz der Differential- und Integralrechnung. Zusammengefasst gilt somit, daß ein Kurvenintegral über das Vektorfeld
F~ (~r) dann und nur dann nur vom Anfangs- und Endpunkt abhängt, wenn es als
Gradient einer skalaren Funktion φ(~r) (eines Potentials) zu schreiben ist.
2.16. DIE INTEGRATION IM RN
113
Als Konzequenz folgt sofort, daß falls F~ als Gradientenfeld zu schreiben ist
I
F~ (~r) · d~r = 0 .
(2.53)
C
Dies sieht man leicht, wenn man das Integral über C in zwei Kurvenintegrale C1
und C2 von ~ra zu einem willkürlichen Zwischenpunkt ~rz auf C und von ~rz zurück
zu ~ra aufteilt. Ohne das Ergebnis des zweiten Integrals zu ändern, kann man
C2 dann so deformieren, daß der neue Weg gleich −C1 ist, also gleich C1 aber
in entgegengesetzter Richtung durchlaufen. Mit Gl. (2.50) folgt dann das obige
Ergebnis Gl. (2.53).44
Man kann nun ein leicht zu überprüfendes Kriterium angeben, wann sich
ein Vektorfeld F~ (~r) als Gradientenfeld schreiben läßt und damit Kurvenintegrale
über F~ nur von ~ra und ~re abhängen. Wie sie in einer Übungsaufgabe zeigen
werden (siehe auch Kapitel 2.12), gilt
~ × [∇φ(~
~ r)] = 0 ,
rot [grad φ(~r)] = ∇
d.h. die Rotation eines Gradientenfeldes verschwindet, wobei wir natürlich davon
ausgehen, daß φ(~r) zweimal stetig differenzierbar ist. Hat also eine Vektorfeld F~
~ schreibbar
Kurvenintegrale, die nur von ~ra und ~re abhängen, ist es als F~ = ∇φ
~ × F~ = 0. Diese Beobachtung ist nun bis auf eine (wichtige) Feinheit
und es gilt ∇
fast hinreichend, was bedeutet, daß (bis auf die noch zu betrachtende Feinheit)
Kurvenintegrale über F~ genau dann nur von ~ra und ~re abhängen (und nicht vom
~ × F~ = 0 gilt. Um das plausibel zu machen, versuchen
ganzen Weg C), wenn ∇
~ × F~ = 0 ein “Potential” φ zu konstruieren mit
wir unter der Voraussetzung ∇
~ = F~ was dann die “Unabhängigkeit vom Weg” garantiert. Wir betrachten
∇φ
den Ausdruck,
Z
~
r
φ(~r) =
F~ (~r0 ) · d~r0 ,
~
ra ,C0
wobei wir entlang des speziellen Weges

C0 :







x1,a
x1
x1
x1
~ra =  x2,a  →  x2,a  →  x2  →  x2  = ~r
x3,a
x3,a
x3,a
x3
fortschreiten. Da für den Weg selbst keine Präferenz bestehen sollte, können wir
44
Gl. (2.53) liefert in der Tat eine äquivalente Formulierung des “Satzes” über die Darstellbarkeit als Gradientenfeld.
114
KAPITEL 2. MATHEMATISCHE METHODEN
diesen “bequemen” Weg wählen. Damit gilt
Z ~r
F~ (~r0 ) · d~r0
φ(~r) =
Z x2
Z~rax,C1 0
0
0
F2 (x1 , x02 , x3,a ) dx02
F1 (x1 , x2,a , x3,a ) dx1 +
=
x2,a
x1,a
Z x3
F3 (x1 , x2 , x03 ) dx03 .
+
x3,a
~ = F~ gilt. Wir betrachten
Wir müssen nun durch Ableiten überprüfen, ob ∇φ
zunächst
∂φ(x1 , x2 , x3 )
= F3 (x1 , x2 , x3 ) ,
∂x3
was nach dem Hauptsatz der Differential- und Integralrechnung folgt. Als nächstes
differenzieren wir nach x2
Z x3
∂F3 (x1 , x2 , x03 ) 0
∂φ(x1 , x2 , x3 )
= F2 (x1 , x2 , x3,a ) +
dx3 ,
∂x2
∂x2
x3,a
wobei wir die Reihenfolge der mit der Differenziation und der Integration zusammenhängenden Grenzprozesse wieder ohne weitere Analyse vertauschen. Jetzt
~ × F~ = 0 nach der
nutzen wir die Voraussetzung ∇
∂F3 (x1 , x2 , x03 )
∂F2 (x1 , x2 , x03 )
.
=
∂x2
∂x03
Eingesetzt liefert das
Z x3
∂φ(x1 , x2 , x3 )
∂F2 (x1 , x2 , x03 ) 0
= F2 (x1 , x2 , x3,a ) +
dx3
∂x2
∂x03
x3,a
= F2 (x1 , x2 , x3,a ) + F2 (x1 , x2 , x3 ) − F2 (x1 , x2 , x3,a )
= F2 (x1 , x2 , x3 ) .
Analog berechnet man
∂φ(x1 , x2 , x3 )
= F1 (x1 , x2 , x3 )
∂x1
und damit
~ r) = F~ (~r) .
∇φ(~
~ × F~ = 0 als hinreichende Bedingung für die DarDamit scheint alles klar und ∇
~
stellbarkeit von F als Gradientenfeld etabliert. Dies ist aber nicht vollständig
2.16. DIE INTEGRATION IM RN
115
richtig! Wir haben bei den obigen Überlegungen nicht berücksichtigt, daß der
Definitionsbereich des Vektorfeld F~ , der eine Teilmenge (ein “Teilgebiet”) G des
R3 ist, “ungewöhnliche” Eigenschaften haben könnte. Nur in dem Fall, daß G einfach zusammenhängend ist, d.h. das sich jede geschlossene Kurve in G auf einen
Punkt (in G) zusammenziehen läßt, ist die obige Konstruktion eindeutig. Mehr
zu diesem Aspekt werden sie in der HöMa Vorlesung lernen. Der “Satz” lautet
zusammengefasst: Wenn für ein Vektorfeld F~ in einem einfach zusammenhängen~ × F~ = 0 gilt, so gibt es ein φ mit F~ = ∇φ.
~ Damit sind dann
den Gebiet G, ∇
die Kurvenintegrale über F~ vom “Weg unabhängig”. Umgekehrt gilt bei “Wegu~ × F~ = 0, was unabhängig von
nabhängigkeit” des Kurvenintegrals über F~ , daß ∇
den “Zusammenhangsverhältnissen” von G ist.
Nach diesen Überlegungen zum Kurvenintegral, wollen wir uns mit der Integration über mehrdimensionale Gebiete beschäftigen. Diese ist z.B. wichtig bei
der Berechnung von Flächeninhalten und Volumina. Wir werden dabei die Variablensubstitution (Variablentransformation) im Höherdimensionalen kennenlernen
(Polarkoordinaten, Kugelkoordinaten usw.). Wir betrachten als Beispiel die Funktion f (x, y) von zwei Variablen. Diese soll über das Gebiet G ⊂ R2 (x-y-Ebene)
integriert werden
ZZ
f (x, y) dx dy .
G
Unter Voraussetzung dessen, was wir über das Integral von einer Veränderlichen
gelernt haben, besteht die Schwierigkeit darin, daß die Integrationsgrenzen Funktionen in der x-y-Ebene sind. Sei G von der in der folgenden Skizze angenommenen
Form und f (x, y) beliebig “harmlos”.
y
y=g2(x)
y=g1(x)
a
b
x
Die zweidimensionale Integration definieren wir nun so, daß wir sie in zwei eindimensionale (die wir bereits kennen) zerlegen. Wir integrieren f (x, y) zunächst
über y, wobei die Integrationsgrenzen Funktionen von x sind
Z g2 (x)
˜
f (x) =
f (x, y) dy .
g1 (x)
Anschaulich gesprochen integrieren wir f (x, y) entlang der in der Skizze gestrichelt gezeichneten Linien. Das Resultat dieser eindimensionalen Integration, wel-
116
KAPITEL 2. MATHEMATISCHE METHODEN
che vom “Parameter” x abhängt, integrieren wir dann über x
Z
a
f˜(x) dx =
b
a
Z
Z
g2 (x)
ZZ
f (x, y) dy dx =
b
f (x, y) dx dy .
G
g1 (x)
Alternativ hätten wir zunächst über x und dann über y integrieren können
Z
d
Z
h2 (y)
ZZ
f (x, y) dx dy =
c
f (x, y) dx dy ,
G
h1 (y)
was in der folgenden Skizze veranschaulicht ist.
y
d
x=h1(y)
x=h2(y)
c
x
Es ist dabei wichtig, daß g1 (x) und g2 (x) bzw. h1 (y) und h2 (y) Funktionen
sind. Das bedeutet, daß man für Gebiete wie in der folgenden Skizze, eine feinere
Unterteilung des Randes vornehmen muß, wenn man zunächst über y integrieren
möchte.
g1(x)
y
g (x)
2
a bc
g4(x)
d
x
g3(x)
Wir werden nun ein Beispiel betrachten. Die Funktion f (x, y) = x2 y soll dabei
über das schraffierte Dreieck integriert werden.
2.16. DIE INTEGRATION IM RN
117
y
1
1111111111111111111
0000000000000000000
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
1
x
Es gilt
ZZ
I =
f (x, y) dx dy
Z
=
=
=
=
=
G
1 Z 1−x
x2 y dy dx
0
0
Z 1
2 1−x
2 y x
dx
2 0
0
Z 1
(1 − x)2
x2
dx
2
0
Z
1 1 2
(x − 2x3 + x4 ) dx
2 0
1
60
oder alternativ
ZZ
f (x, y) dx dy
I =
Z
G
1 Z 1−y
=
Z0 1
=
x2 y dx dy
0
(1 − y)3
y dy
3
0
Z
1 1
=
(y − 3y 2 + 3y 3 − y 4 ) dy
3 0
1
=
.
60
Es sollte klar sein, wie sich das obige Vorgehen auf den Fall der Integration
über Teilgebiete des R3 verallgemeinern läßt. Sie werden Beispiele zur Integration
über Teilgebiete des R3 in den Übungen kennenlernen.
Eine altenative Herangehensweise an höherdimensionale Integrale ist es eine
Riemann-Summe zu verwenden. Für den zweidimensionalen Fall überzieht man
118
KAPITEL 2. MATHEMATISCHE METHODEN
dazu das Gebiet G mit einem Netzt (Gitter) aus Quadraten45 der Größe ∆xi ∆yi .
Das Integral ergibt sich dann im Limes, daß die Gitterpunkte immer dichter
werden
ZZ
X
f (xi , yj )∆xi ∆yj .
f (x, y) dx dy = lim
∆x,∆y→0
G
i,j
Wir wollen zum Abschluss dieses Kapitels noch die Parametertransformation
und die damit zusammenhängende Variablensubstitution betrachten. Als Beispiel
starten wir mit dem Übergang von zweidimensionalen kartesischen Koordinaten
zu Polarkoordinaten, was uns bereits von der Einführung der komplexen Zahlen
bekannt ist. Es gilt
x = r cos φ
y = r sin φ
oder umgekehrt
p
x2 + y 2
r =
φ = arctan (y/x) ,
wobei φ auf den Bereich [0, 2π] beschränkt ist. Es handelt sich dabei somit um
eine (lokal) umkehrbar-eindeutige Beziehung zwischen den beiden Variablenpaaren. Die Frage ob eine (lokal) umkehrbar-eindeutige Beziehnug zwischen zwei
allgemeinen Variabenpaaren {x, y} und {u, v} = {u(x, y)v(x, y)} vorliegt, läßt
sich mit Hilfe der sogenannten Funktionaldeterminanten beantworten. Wir nehmen an, daß u und v als Funktionen von x und y gegeben sind und betrachten
die Größen
∆u = u(x + ∆x, y + ∆y) − u(x, y)
∆v = v(x + ∆x, y + ∆y) − v(x, y) .
Taylorentwicklung liefert
∂u(x, y)
∂u(x, y)
∆x +
∆y + O(∆2 )
∂x
∂y
∂v(x, y)
∂v(x, y)
∆v =
∆x +
∆y + O(∆2 ) ,
∂x
∂y
∆u =
wobei O(∆2 ) für Terme steht, die mindestens quadratisch in den kleinen Größen
∆x und ∆y sind. Nach Voraussetzung ist klar, daß man zu jedem Paar {∆x, ∆y}
45
Im dreidimensionalen entsprechend einem Netz aus Würfeln.
2.16. DIE INTEGRATION IM RN
119
ein eindeutiges Paar {∆u, ∆v} berechnen kann. Damit dieses auch umgekehrt
möglich ist, muß die Matrix in
!
∂u(x,y)
∂u(x,y)
∆x
∆u
∂x
∂y
=
∂v(x,y)
∂v(x,y)
∆y
∆v
∂x
∂y
invertierbar sein. Wie sie in der HöMa Vorlesung zeigen werden, ist dies genau
dann der Fall, wenn die Determinante der Matrix ungleich Null ist. Man bezeichnet die Determinante
!
∂u(x,y)
∂u(x,y)
∂(u, v)
∂x
∂y
det ∂v(x,y)
=
∂v(x,y)
∂(x, y)
∂x
∂y
als die Funktionaldeterminante. Wegen der Gleichberechtigung der Parameterpaare, ist damit zu rechnen, daß auch die “umgekehrte” Fuktionaldeterminante
∂(x,y)
ungleich Null ist. In unserem Beispiel der zweidimensionalen Polarkoordi∂(u,v)
naten gilt
∂(x, y)
cos φ −r sin φ
= det
=r
sin φ r cos φ
∂(r, φ)
woraus man abliest, daß es nur am Ursprung (nicht weiter relevante) Probleme
mit der umkehrbaren Eindeutigkeit gibt.
Die Funktionaldeterminante spielt ebenfalls eine entscheidene Rolle, wenn
es darum geht in einem höherdimensionalen Integral eine Variablensubstitution auszuführen. Beim Übergang von den {∆x, ∆y} nach {∆u, ∆v} muß man in
der Riemann-Summen-Schreibweise des Integrals berücksichtigen, daß sich das
Flächenelement ändert. Wie sie in einer Übungsaufgabe und in der HöMa Vorlesung zeigen werden, tritt dabei der Betrag der Funktionaldeterminanten auf und
es gilt
ZZ
ZZ
∂(x, y) du dv ,
f (x, y) dx dy =
f (x(u, v), y(u, v)) ∂(u, v) wobei man beachten muß, daß man links und rechts über dasselbe Gebiet integriert. Es sollte klar sein, wie man diese Überlegungen auf höhere Dimensionen
(z.B. den dreidimensionalen Fall) übertragen kann.
Wir betrachten zwei Beispiele. Im ersten geht es darum die Fläche einer Ellipse
zu berechen. Der Rand der Ellipse ist durch die Gleichung
x2 y 2
+ 2 =1
a2
b
definiert. Zur Flächenbestimmung müssen wir die Funktion f (x, y) = 1 über
das Gebiet G = {(x, y) ∈ R2 |x2 /a2 + y 2 /b2 ≤ 1} integrieren. Diese Integration
120
KAPITEL 2. MATHEMATISCHE METHODEN
vereinfacht sich erheblich, wenn wir die Koordinaten
x = ar cos φ
y = br sin φ
einführen, wobei für die Fläche der Ellipse 0 ≤ φ < 2π und 0 ≤ r ≤ 1 gilt, nach
der Variablentransformation also über G̃ = {(r, φ) ∈ R2 |0 ≤ φ < 2π, 0 ≤ r ≤ 1}
zu integrieren ist. Die Funktionaldeterminante ist durch
∂(x, y)
a cos φ −ar sin φ
= det
= abr
b sin φ br cos φ
∂(r, φ)
geben. Damit folgt für die Fläche F der Ellipse in Polarkoordinaten
Z 1 Z 2π
Z 1
abr dφ dr = ab2π
r dr = abπ .
F =
0
0
0
Im zweiten Beispiel wollen wir das eindimensionale Gaußintegral
Z ∞
2
I=
e−x dx
−∞
berechnen. Wir schreiben dieses um zu
Z ∞
Z ∞
ZZ
−x2
−y 2
2
e
e dy =
I =
dx
−∞
e−(x
2 +y 2 )
dx dy ,
R2
−∞
also einem zweidimensionalen Integral. In diesem transformieren wir nun auf Polarkoordinaten
x = r cos φ
y = r sin φ ,
wobei über G̃ = {(r, φ) ∈ R2 |0 ≤ φ < 2π, r ≥ 0} zu integrieren ist. Die Funktionaldeterminante haben wir bereits weiter oben berechnet. Wir schreiben I 2 um
zu
ZZ
2
2
2
I =
e−(x +y ) dx dy
2
Z ∞R Z 2π
2
=
re−r dφ dr
0
Z ∞0
d
1 −r2
= 2π
− e
dr
2
0
∞
2
= − πe−r 0
= π
und erhalten damit
Z
∞
I=
−∞
2
e−x dx =
√
π.
Kapitel 3
Newtonsche Mechanik Teil I
3.1
Einleitung
Unter Berücksichtigung dessen, was sie bis zum jetzigen Zeitpunkt in der Vorlesung Experimentalphysik I gelernt haben und der im Rahmen dieser Vorlesung
bereitgestellten mathematischen Methoden werden wir uns nun der klassischen
Mechanik aus der Sichtweise eines theoretischen Physikers nähern. Die klassische Mechanik ist die Theorie der Bewegung von “klassischen” Körpern (siehe
Kapitel 1) im Raum. Eine “saubere” mathematische Formulierung dieser gelang
erstmalig Newton. Seine Überlegungen stützen sich auf “vorwissenschaftliche Erfahrungen” über Raum, Zeit, Masse, die Existenz von starren Körpern usw.. In
einem ersten Schritt wird von der Ausdehnung der Körper abgesehen und diese
werden als “Punktteilchen” idealisiert. “Sinnvolle” Idealisierungen spielen eine
zentrale Rolle bei der Entwicklung theoretischer Konzepte.
Wir werden hier zunächst die fundamentalen experimentellen Beobachtungen
zusammenstellen und die zentralen Begriffe der Mechanik einführen. Eine “zirkelschlußfreie” Definition der Begriffe Masse und Kraft stellt sich als erstaunlich
kompliziert heraus und man muß sehr vorsichtig dabei vorgehen. Eine saubere
Definition dieser Konzepte ist daher Gegenstand einer Vielzahl von wissenschaftsphilosophischen Arbeiten. Eine Diskussion dazu finden sie in dem Artikel von L.
Eisenbud (siehe L2 P). Wir werden hier nicht genauer auf diese Probleme eingehen
und nehmen einen pragmatischen Standpunkt ein, indem wir auf ihre bereits gewonnenen Erfahrungen von dem was Masse und Kraft sind aufbauen. Wir folgen
in unserem Vorgehen auch nicht dem historischen Vorbild, der Principia Mathematica von Newton.
Wie wir heute wissen, sind die experimentellen Grundlagen auf der die klassische Mechanik beruht nur näherungsweise gültig (Quantenmechanik und relativistische Mechanik; siehe Kapitel 1). Folgerichtig ist die klassiche Mechanik eine
Theorie mit eingeschränktem Gültigkeitsbereich. Wir werden im Folgenden nicht
immer wieder auf die Grenzen der klassischen Mechanik hinweisen, sondern meist
121
122
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
so tun, als wenn sie die physikalischen Phänomene exakt beschreibt.
3.2
Grundlagen: Raum, Zeit, Masse und Kraft
Raum: Die Bewegung der Punktteilchen findet im dreidimensionalen und euklidischen Raum statt in dem jeder Punkt durch die Angabe seiner drei Koordinaten
bezüglich eines fest gewählten orthogonalen Bezugssystem (Koordinatensystem)
eindeutig festgelegt ist. Das Bezugssystem ist durch die Angabe des Ursprungs
und der drei auf Eins normierten Basisvektoren [0; ~e1 , ~e2 , ~e3 ] charakterisiert und
Punkte werden durch den Ortsvektor ~r = x1~e1 + x2~e2 + x3~e3 beschrieben. Die
Regeln und Konzepte zum Umgang mit Vekoren haben wir im ersten Teil dieser
Vorlesung kennen gelernt. Um möglichst einfach zur Lösung eines mechanischen
Problems vorzustoßen, bietet es sich oft an, eine spezielle Wahl des Bezugssystems
zu treffen. Durch vorheriges Nachdenken läßt sich somit oft der Rechenaufwand
minimieren.
Zeit: Die “eindimensionale” Zeit ist in der klassischen Mechanik “absolut”, d.h. es
ist im Prinzip möglich jeden Punkt des Raums mit einer Uhr zu versehen und
diese Uhren zu synchronisieren (Festlegen des Zeitnullpunktes und der “Zeitschritte”), in dem man die Information über die aktuelle Zeit mit Hilfe unendlich
schneller Signalausbreitung oder absolut starrer Körper überträgt. Die absolute Zeit ist unabhängig vom Bewegungszustand des Beobachters, d.h. nach der
Synchronisation geben alle Beobachter für die Zeit eines bestimmten Ereignisses
die gleiche Zahl an. Den elementaren Zeitschritt kann man mit Hilfe periodischer
Bewegungen (Schwingungen) definieren.
In der relativistischen Mechanik müssen die obigen Konzepte von Raum und
Zeit aufgegeben und durch allgemeinere ersetzt werden. Speziell gibt es keine
absolute Zeit mehr, d.h. der Bewegungszustand kann einen Einfluß auf die Zeit
haben. Raum und Zeit sind in der speziellen Relativitätstheorie nicht mehr unabhängig von einander.
Dadurch, daß jetzt Raum und Zeit festgelegt sind, können wir die Begriffe
Geschwindigkeit und Beschleunigung einführen. Die Geschwindigkeit ergibt sich
aus dem Differenzenquotienten für den Ortsvektor nach der Zeit im Limes kleiner
Zeitschritte ∆t und die Beschleunigung analog aus dem Geschwindigkeitsvektor.
Inertialsysteme: Es gibt Bezugssysteme (Koordinatensysteme), die Inertialsysteme, die spezielle Eigenschaften haben:
1. Alle Naturgesetze sind in allen Inertialsystemen zu allen Zeiten gleich.
2. Alle Koordinatensysteme, die sich geradlinig und gleichförmig gegenüber
einem Inertialsystem bewegen, sind selbst auch Inertialsysteme.
3.2. GRUNDLAGEN: RAUM, ZEIT, MASSE UND KRAFT
123
Dabei bauen wir darauf, daß ihnen “anschaulich” klar ist, was “geradlinig” (entlang einer Geraden) und “gleichförmig” (mit konstanter Geschwindigkeit) bedeutet. Es stellt sich die Frage, welche naheliegenden Bezugssysteme Inertialsysteme
sind. Ein erdfestes Bezugssystem (fest in Bezug auf Erdoberfläche) kann nur näherungsweise als inertial angesehen werden, da sich die Erde um sich selbst dreht,
sich um die Sonne dreht, diese sich um das Zentrum der Milchstraße (Galaxie)
dreht usw.. Koordinatensysteme die fest mit der Sonne, der Milchstraße usw.
verbunden sind kommen dem theoretischen Konzept des Inertialsystems immer
näher. Unter der Annahme, daß das mit der Oberfläche der Erde fest verbundene
Koordinatensystem (im Rahmen der Meßgenauigkeit) inertial ist, bedeutet das
obige “Galileische Relativitätsprinzip”, daß ein Experimentator der sich in einem
fensterlosen Zug befindet, welcher geradlinig und mit konstanter Geschwindigkeit
über die Erdoberfläche fährt (also selbst ein Inertialsystem darstellt) durch kein
Experiment feststellen kann, daß er sich in ebend diesem Zug befindet (Gleichheit
der Naturgesetze in Inertialsystemen).
Prinzip der “Bestimmtheit”: Wir betrachten ein System von Punktteilchen
aus einem Inertialsystem. Mit dem Anfangspunkt des Systems bezeichnen wir die
Werte aller Orte und Geschwindigkeiten der Punktteilchen zu einem bestimmten
(beliebigen) Zeitpunkt t. Das auf Newton zurückgehende und auf Erfahrung basierende Prinzip der “Bestimmtheit” lautet dann: Der Anfangspunkt eines mechanischen Systems bestimmt die Bewegung eindeutig. Insbesondere ist die Bewegung somit unabhängig von der Beschleunigung zu dem fest gewählten Zeitpunkt
und der Vorgeschichte des Systems. Bezeichnen wir mit ~ri (t) den Ort des i-ten
Punktteilchens zur Zeit t, so gilt für die Geschwindigkeit des i-ten Teilchens
d~ri (t)
~vi (t) = ~r˙i (t) =
dt
und für die Beschleuningung
d2~ri (t)
~ai (t) = ~r¨i (t) =
.
dt2
Für ein System von N Punktteilchen folgt dann aus dem Newtonschen Prinzip
der Bestimmtheit die Newtonsche Gleichung. Da der Anfangspunkt die Bewegung
eindeutig festlegt, ist speziell die Beschleunigung zur Zeit t durch
~r¨i (t) = f~i (~r1 (t), ~r2 (t), . . . , ~rN (t); ~r˙1 (t), ~r˙2 (t), . . . , ~r˙N (t); t)
bestimmt. Dabei müssen die N vektorwertigen Funktionen f~i von 6N + 1 Variablen für jedes spezifische System experimentell bestimmt werden. Diese Gleichung
gilt in allen Inertialsystemen. Vom mathematischen Standpunkt aus betrachtet
definiert ein Satz von “hinreichned harmlosen” Funktionen f~i ein mechanisches
System. Mit Hilfe der Existenz- und Eindeutigkeitssätze der Theorie gewöhnlicher
124
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Differentialgleichungen bestimmen die f~i zusammen mit den Anfangsbedingungen
~ri (t0 ) und ~vi (t0 ), i = 1, 2, . . . , N , die Bewegung eindeutig. Natürlich wird es sich
bei den f~i um die durch die Masse des i-ten Punktteilchens geteilte Kraft auf
dieses handeln. Wir betonen aber, daß es für die bisherigen Überlegungen nicht
nötig war, die Konzepte “Masse” und “Kraft” einzuführen.
In der Vorlesung Experimentalphysik I und im Mathematikteil dieser Vorlesung haben sie bereits verschiedene Beispiele für Funktionen f~i kennen gelernt.
Betrachten wir zunächst den einfachsten Fall eines Punktteilchens. Um den freien
Fall eines Steins zu beschreiben, vernachlässigen wir zunächst seine Ausdehnung.
Den Ursprung des Koordinatensystems legen wir auf die Erdoberfläche, die wir als
krümmungsfrei idealisieren. Die Erdoberfläche legt die ~e2 , ~e3 -Ebene des Koordinatensystems fest. Damit ist die Bedeutung des Ortsvektors ~r klar. Experimente
zeigen dann, daß für den Fall aus nicht zu großer Höhe bis zum Aufprall
~r¨(t) = ~g , ~g = −g~e1 ,
g ≈ 9.81 m/s2
gilt. Mit der Funktion (“dem Potential”) Ṽ (~r) = −~g · ~r kann man auch schreiben
~ Ṽ (~r) .
~r¨(t) = −∇
Dabei haben wir die Zeitabhängigkeit des Ortes auf der rechten Seite der Gleichung nicht explizit mitgeschrieben. Es ist offensichtlich, daß man das Problem
durch geschickte Wahl des Koordinatensystems zu einem eindimensionalen machen kann.
Läßt man den Stein nun aus größerer Höhe fallen, so muß man zur Beschreibung der Bewegung eine andere Funktion f~ ansetzen. Es gilt dann bis zum Aufprall auf der Erdoberfläche (näherungsweise wegen der Reibung durch die Luft)
das von Newton entdeckte 1/r2 Gesetz
r2 ~r
~r¨(t) = −g 02 ; r = |~r| ,
r r
wobei ~r den vom Erdmittelpunkt ausgehenden Ortsvektor bezeichnet und r0 der
Erdradius ist. Mit dem “Potential”
Ṽ (~r) = −
k
,
r
k = gr02
folgt
~ Ṽ (~r) .
~r¨(t) = −∇
Als weiteres Beispiel betrachten wir die Bewegung eines Punktteilchens, das
an einer Feder befestigt ist, die wiederum in einer Wand verankert ist. Das Teilchen liege auf einem Tisch auf, der mit einem Schmiermittel bestrichen sei. Durch
3.2. GRUNDLAGEN: RAUM, ZEIT, MASSE UND KRAFT
125
geschickte Wahl des Koordinatensystems ist die Bewegung durch eine Ortskoordinate zu beschreiben und Experimente zeigen, daß
ẍ(t) = −α2 x = −
1
dṼ (x)
, Ṽ (x) = α2 x2
dx
2
gilt, solange das Teilchen nicht zu weit aus der Ruhelage ausgelenkt wird und die
seit der Auslenkung verstrichene Zeit nicht zu groß ist (wegen der Reibung). Man
nennt diesen Zusammenhang das Hooksche Gesetz.
Ersetzt man das eine an der Feder befestigte Punktteilchen durch zwei der
exakt gleichen Art, so stellt sich experimentell heraus, das die Beschleunigung
bei gleicher Auslenkung (wie im Fall eines Teilchens) nur noch halb so groß ist.
Allgemeiner findet man, daß für zwei Punktteilchen 1 und 2 das Verhältnis der
Beschleunigung bei gleicher (kleiner) Auslenkung einen festen Wert hat, welcher
weder von der Auslenkung selbst, der aktuellen Zeit, noch von der Bauart der
Feder abhängt. Man bezeichnet
ẍ(1) (t)
m2
=
ẍ(2) (t)
m1
als das Massenverhältnis. Durch Wahl einer festen Bezugsmasse (“Einheitskilogramm”) ist damit der Begriff der Masse über die Trägheit eingeführt. Aus
Erfahrung weiß man, daß alle Massen positiv sind. Im Beispiel der Feder sieht
man nun, daß die Größe mẍ nicht vom Teilchen, sondern nur noch den Eigenschaften der Feder abhängt und man nennt diese Größe die Kraft die durch die
Feder auf das Teilchen wirkt. Diese Logik zeigt, wie eng die Begriffe Masse und
Kraft zusammenhängen. Die Bewegungsgleichung lautet dann
mẍ(t) = F (x) = −Kx ,
K = mα2 .
Nachdem der Massebegriff nun eingeführt ist, lassen sich die Newtonschen
Gleichungen in der bekannten Form
mi ~r¨i (t) = F~i (~r1 (t), ~r2 (t), . . . , ~rN (t); ~r˙1 (t), ~r˙2 (t), . . . , ~r˙N (t); t) ,
mit der experimentell festgelegten Kraft F~i die auf das i-te Teilchen wirkt, schreiben. Wir definieren nun den Teilchenimpuls
p~i (t) = mi~vi (t) = mi~r˙i (t)
und erhalten eine Form des zweiten Newtonschen Gesetzes
p~˙i = F~i ,
wobei wir die Abhängigkeiten von den Variablen nicht mitgeschrieben haben.
Wir haben dabei die obige Version des zweiten Newtonschen Gesetzes gewählt,
126
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
da man in dieser auch den “phänomenologischen” Fall von zeitabhängigen Massen
behandeln kann.
Beschreibt man die Bewegung der Teilchen in einem Inertialsystem, so findet
man häufig den Fall, daß die (Gesamt-)Kraft auf das i-te Teilchen als Summe von
Paarkräften geschrieben werden kann
F~i =
N
X
F~i,j
j=1
j6=i
und für die F~i,j
F~i,j = −F~j,i
gilt. Die Paarkräfte wirken entlang der Verbindungslinie der Massepunkte i und j.
Man bezeichnet dieses als das Prinzip von actio = reactio (Kraft = Gegenkraft).
Der Betrag der Kräfte ist eine Funktion des Abstandes |~ri − ~rj |. Diese Beobachtungen bilden das dritte Newtonsche Gesetz. Ein Beispiel für Kräfte dieser Art
sind die Gravitationskräfte zwischen Massen. Sind alle Kräfte die auf Teilchen eines Systems wirken von dieser Form, so bezeichnet man das betrachtete System
auch als abgeschlossen.
Ist das betrachtete System nicht abgeschlossen, so kann man die Kraft auf
das i-te Teilchen häufig als
F~i =
N
X
F~i,j + F~iext
j=1
j6=i
schreiben, wobei F~iext die externen Kräfte auf das i-Teilchen bezeichnet. Solch eine Situation ergibt sich z.B. wenn man ein abgeschlossenes System in zwei Teile
zerlegt und nur einen Teil explizit betrachtet. Ein einfaches Beispiel ist das von
uns diskutierte Problem des Falls eines Steins (auf die Erde) aus geringer Höhe.
In diesem Beispiel kann die Rückwirkung der Bewegung des Steins auf die Erde
vernachlässigt werden (da mStein /mErde 1) und wir haben die Paarkraft Gravitation gleich durch eine externe Kraft nur auf den Stein beschrieben. Vollständiger
müßten wir das Zweiteilchensystem Stein-Erde beschreiben, oder noch besser, das
Vielteilchensystem von Atomen des Steins und Atomen der Erde (wobei wir dann
natürlich eigentlich Quantenmechanik betreiben müßten). Auch dann hätten wir
noch den Einfluß aller anderer Himmelskörper auf die Bewegung vernachlässigt.
Dies ist oft legitim, da die Paarkräfte meist mit dem Abstand der Teilchen abnehmen (Ausnahme: Federkraft), so daß F~iext , welches von nicht berücksichtigten
Paarkräften stammt, verglichen mit den explizit betrachteten Paarkräften innerhalb des Systems vernachlässigt werden kann. Erst aufgrund dieser Tatsache wird
die klassische Mechanik überhaupt möglich. Würde das nicht gelten, so müßte
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
127
man ja bei der Untersuchung jedes mechanischen Problems immer das Universum als Ganzes behandeln. Aufgrund des Abfalls der Kräfte mit dem Abstand der
Massenpunkte, können auch Teilsysteme oft in guter Näherung als abgeschlossen
angesehen werden. Auch zur Beschreibung des Aufpralls des Steins, müßten wir
das aus den Atomen des Steins (und der Erde) bestehende Vielteilchensystem
beschreiben, was man jedoch häufig durch Verwendung effektiver Zwangskräfte
zu vermeiden versucht.
Auch ein weiteres vereinfachendes Konzept läßt sich anhand des Falles eines
Steins verdeutlichen. In der bisherigen Beschreibung sind wir davon ausgegangen, daß der Stein während des Falls mit keinen anderen Teilchen als der Erde
wechselwirkt, also speziell nicht mit den Molekülen der Luft. Der Fall fand also
im Vakuum statt. Um bei der Beschreibung des Falls in Luft nicht die Bewegung
aller Moleküle (alle Orte und Geschwindigkeiten) der Luft explizit mitbehandeln
zu müssen (was ja auch wieder Quantenmechanik erfordern würde) führt man als
(oft sehr gute) Näherung eine effektive Reibungskraft ein, die von der Geschwindigkeit des Steins abhängt (verschwindende Reibungskraft, wenn die Geschwindigkeit des Steins Null ist). Im Kapitel über gewöhnliche Differentialgleichungen
haben wir bereits zwei Beispiele für Reibungskräfte (∝ −v 2 bzw. ∝ −v) kennen
gelernt. Eine reichhaltigere Bewegung erhält man z.B. aus der Gleichung des van
der Pol-Oszillators
mẍ + mη(x2 − a2 )ẋ + mω02 x = 0
(3.1)
in dem das Vorzeichen (und die Amplitude) der zur Geschwindigkeit proportionalen Reibungskraft von der Amplitude x der Auslenkung abhängt. Systeme in
denen durch eine effektive Beschreibung der Wirkung weggelassener Freiheitsgrade Reibungskräfte auftreten bezeichnet man als dissipative Systeme. Diese stehen
im Gegesatz zu sogenannten konservativen Systemen (siehe unten).
Die obigen Überlegungen zum Abfall der Paarkräfte führt uns auf das erste
Newtonsche Gesetz. Ist ein einziges Punktteilchen i hinreichend weit von allen anderen Teilchen entfernt, so gilt F~iext ≈ 0 und die Bewegung kann näherungsweise
durch
mi~r¨i (t) = 0 ⇒ ~ri (t) = ~r0 + ~v0 t
beschrieben werden, wobei ~r0 den Anfangsort und ~v0 die Anfangsgeschwindigkeit des Teilchens bezeichnen. In Worten lautet das erste Newtonsche Gesetz:
Jeder Körper beharrt in seinem Zustand der Ruhe oder geradlinig gleichförmigen Bewegung, wenn er nicht durch einwirkende Kräfte gezwungen wird, seinen
Bewegungszustand zu ändern.
3.3
Bewegungsgleichung und Erhaltungsgrößen
Wir betrachten ein System von N Massepunkten m1 , m2 , . . . , mN , wobei die Massen zeitlich konstant sein sollen. Die Newtonschen Gleichungen haben dann die
128
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Form (i = 1, 2, . . . , N )
mi ~r¨i (t) =
N
X
F~i,j + F~iext .
(3.2)
j=1
j6=i
Schwerpunkt und Gesamtimpuls: Wir definieren den Schwerpunkt des Systems. Sein Ortsvektor ist durch
N
1 X
~
R=
mi~ri ,
M i=1
M=
N
X
mi
i=1
gegeben, wobei M die Gesamtmasse des Systems bezeichnet. Durch Addition der
Newtonschen Gleichungen für die einzelnen Teilchen folgt
N
N X
N
N
X
X
X
¨
¨
~
~
M R(t) =
mi ~ri (t) =
Fi,j +
F~iext .
i=1
i=1
j=1
j6=i
i=1
Da F~i,j = −F~j,i verschwindet die Doppelsumme und es gilt
N
X
~¨ =
M R(t)
F~iext = F~ ext ,
i=1
was die externe Gesamtkraft F~ ext definiert.
Als einfaches Beispiel betrachten wir den Fall des Steins aus kleiner Höhe.
Wir stellen uns den Stein nun als aus N Massepunkten (“Atomen”) zusammgesetzt vor. Zuvor hatten wir den Stein als einen Massepunkt idealisiert. Auf alle
“Atome” wirke die Schwerkraft F~iext = mi~g . Das liefert die externe Gesamtkraft
P
F~ ext = i mi~g = M~g , d.h. die Bewegungsgleichung für den Schwerpunkt lautet
~¨ = ~g . Wir sehen somit, daß unter Berücksichtigung des dritten Newtonschen
R
Gesetzes die Bewegungsgleichung des “ausdehnungslosen” Steins (Punktteilchen;
siehe oben) zu der für den Schwerpunkt des ausgedehnten Steins wird. Sollten
die externen Kräfte vom Ort abhängen F~iext = F~iext (~ri ) (was in unserem einfachen Beispiel nicht der Fall ist), dann erhält man nur dann eine geschlossene
Gleichung für die Bewegung des Schwerpunktes, wenn die Variation der externen
Kräfte über die Ausdehnung des Objektes vernachlässigbar ist. Ist dies der Fall,
so gilt in guter Näherung
~¨ = F~ ext (R)
~
M R(t)
für den Vektor des Schwerpunktes.
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
129
Ist das betrachtete System abgeschlossen, d.h. für alle Zeiten gilt F~iext = 0, so
folgt
~¨ = 0
M R(t)
~
~ 0 + V~0 t.
und der Schwerpunkt bewegt sich geradlinig und gleichförmig: R(t)
=R
Definiert man den Gesamtimpuls des Systems als
P~ =
N
X
p~i =
i=1
N
X
mi~r˙i
i=1
so folgt für diesen
˙
P~ = F~ ext
und für ein abgeschlossenes System ist der Gesamtimpuls eine Erhaltungsgröße
(hängt nicht von der Zeit ab)
~˙ = M V~0 .
P~ = M R
Gesamtdrehimpuls: Neben dem Impuls spielt der Drehimpuls eine zentrale
Rolle in der Mechanik. Der Drehimpuls ~li des i-ten Teilchens ist definiert als
(i = 1, 2, . . . , N )
~li = mi~ri × ~vi = ~ri × p~i .
Im Gegensatz zum (linearen) Impuls, hängt der Drehimpuls von der Wahl des
Ursprungs ab und man sollte damit genauer vom Drehimpuls im Bezug auf ein
spezifisches Koordinatensystem [0; ~e1 , ~e2 , ~e3 ] sprechen. Als Gesamtdrehimpuls definiert man
~ =
L
N
X
i=1
~li =
N
X
~ri × p~i .
i=1
Die Ableitung nach der Zeit ergibt (Produktregel)
N h
i
˙ X ˙
˙
~
L=
~ri × p~i + ~ri × p~i .
i=1
Der erste Term verschwindet, da ~r˙i = ~vi und p~i parallele Vektoren sind. Durch
Einsetzen der Newtonschen Gleichung in den zweiten Term folgt


N
N
X
X ~

~˙ =
L
~ri × 
Fi,j + F~iext  .
i=1
j=1
j6=i
130
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Den ersten Summanden kann man weiter umformen. Man verwendet dabei die
folgenden Punkte: (i) Umbennen von Summationindizes, (ii) drittes Newtonsches
Gesetz und (iii) ~ri − ~rj ist parallel zu F~i,j :
N
X
i=1
~ri ×
N
X
F~i,j =
j=1
j6=i
N
X
~ri × F~i,j
i,j=1
j6=i
N
1 X
=
~ri × F~i,j + ~rj × F~j,i
2 i,j=1
j6=i
N
1 X
=
(~ri − ~rj ) × F~i,j
2 i,j=1
j6=i
= 0.
Die Bewegungsgleichung für den Gesamtdrehimpuls ergibt sich somit zu
N
N
X
X
~˙ =
~ ,
L
~ri × F~iext =
~next
=N
i
i=1
(3.3)
i=1
=
wobei wir dabei das durch die äußere Kraft hervorgerufene Drehmoment ~next
i
ext
~
~
~ri × Fi auf das i-te Teilchen und das Gesamtdrehmonent N definiert haben. Für
den Fall des Steins mit f~iext = mi~g liefert das
~˙ = M R(t)
~ × ~g .
L
~
Nachdem R(t)
berechnet wurde, folgt der Drehimpuls somit durch Integration
über die Zeit.
Gleichung (3.3) liefert die zentrale Beobachtung, daß der Gesamtdrehimpuls
eines abgeschlossenen Systems mit verschwindenden äußeren Kräften eine Erhaltungsgröße ist
~˙ = 0 ⇒ L(t)
~
~0 ,
L
=L
~ 0.
mit dem Anfangsgesamtdrehimpuls L
Arbeit, Gesamtenergie und konservative Kräfte: Zur Definition der an einem Teilchen geleisteten Arbeit untersuchen wir zunächst die Verschiebung eines
Teilchens in einem statischen (zeitunabhängigen) Kraftfeld F~ (~r), welches nur vom
Ort des Teilchens abhängt. Dabei wird die Bewegung unabhängig vom wirklichen
(“dynamischen”) Durchlaufen der durch die Bewegungsgleichung und Anfangsbedingung gegebenen Bahnkurve betrachtet. Das Kraftfeld sei in einem einfach
zusammenhängende Gebiet definiert (siehe das Kapitel über Integration im Rn ).
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
131
Die Verschiebung erfolge längs einer (hinreichend glatten) Kurve C von ~ra nach
~re . In Verallgemeinerung der in einem homogenen (ortsunabhängigen) Kraftfeld
geleisteten Arbeit (“Arbeit = Kraft · Weg”) definieren wir
Z
AC = F~ · d~r
C
als Kurvenintegral. Eine wichtige Roll in der Mechanik spielen konservative Kraftfelder, die sich als Gradient einer skalaren Funktion −V (~r), mit dem Potential
oder der potentiellen Energie V (~r), schreiben lassen
~ (~r) .
F~ (~r) = −∇V
Nach dem was wir im letzten Kapitel des mathematischen Teils dieser Vorlesung
gelernt haben, ist das Kraftfeld F~ (~r) dann und nur dann konservativ, wenn die
längs beliebiger Kurven geleistete Arbeit nur vom Anfangs- und Endpunkt der
Kurve, nicht jedoch von der Form dieser abhängt. Weiterhin haben sie im Mathematikteil gelernt, daß die Rotation eines konservativen Kraftfeldes verschwindet
~ × F~ (~r) = 0 ,
∇
was bei gegebenem Kraftfeld ein leicht zu überprüfendes Kriterium für Konservativität darstellt.
Als Beispiel für konservative Kraftfelder betrachten wir alle Zentralfelder der
Form F~ (~r) = F (r)~r/|~r|. Den einfachen Beweis der Konservativität über das Bilden der Rotation verschieben wir auf eine Übungsaufgabe. Stattdessen wollen wir
hier konstruktiv zeigen, daß Zentralfelder konservativ sind. Wir betrachten
Z
Z
~r
AC = F~ (~r) · d~r = F (r) · d~r .
|~r|
C
C
dr
r
dr
Der Skizze folgend gilt “~r/|~r| · d~r = dr” und damit
Z re
AC =
F (r)dr
ra
132
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
unabhängig vom Weg. Die Funktion
Z
r
F (r0 )dr0
V (~r) = −
ra
ist dann das Potential,1 was man leicht explizit verifiziert
Z r
~ = F (r) ~r = F~ (~r) .
~
~
F (r0 )dr0 = F (r)∇r
−∇V (~r) = ∇
|~r|
ra
Wir kehren nun zum allgemeinen Fall eines statischen Kraftfeldes zurück und
nehmen an, daß wir die wirkliche, dynamische Trajektorie der Bewegung C =
{~r(t) ∈ R3 | t ∈ [ta , te ]} bestimmt haben. Diese wird durch die Zeit parametrisiert
und für die Bewegung entlang dieser Trajektorie gilt
Z
AC =
F~ (~r) · d~r
ZC te h
i
F~ (~r(t)) · ~r˙ (t) dt
=
ta
Z te h
i
˙
~v (t) · ~v (t) dt
= m
ta
Z
m te dv 2 (t)
=
dt
2 ta
dt
m 2
m
=
v (te ) − v 2 (ta )
2
2
= Te − Ta ,
wobei wir von der zweiten zur dritten Zeile die Newtonsche Gleichung verwendet
haben und im letzten Schritt die kinetische Energie
T (~v ) =
m 2
v
2
definiert haben. Ist das Kraftfeld nun konservativ so gilt auch
Z
Z
~ (~r) · d~r = −(Ve − Va )
AC = F~ (~r) · d~r = − ∇V
C
C
und die Kombination dieser beiden Resultate liefert die Energieerhaltung
Ta + Va = Te + Ve = E = const.
für die Bewegung eines Teilchens in einem konservativen Kraftfeld.
1
Da ~ra frei gewählt werden kann, ist das Potential (die potentielle Energie) nur bis auf eine
Konstante eindeutig festgelegt.
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
133
Für den Beweis der Energieerhaltung im Fall des N -Teilchensystems mit Paarkräften und konservativen äußeren Kräften (statisch und F~iext hängt nur von ~ri
ab) gehen wir etwas anders vor. Wir bilden das Skalarprodukt der Bewegungsgleichung (3.2) mit ~r˙i
mi ~r˙i · ~r¨i =
N
X
j=1
j6=i
mi dvi2
~r˙i · F~i,j + ~r˙i · F~iext =
.
2 dt
Die Summation über alle Teilchen liefert
N
N
N
X
X
d X mi 2
˙
~
v =
~ri · Fi,j +
~r˙i · F~iext
dt i=1 2 i
i,j=1
i=1
j6=i
N
N
X
1 X ˙
˙
~
=
(~ri − ~rj ) · Fi,j +
~r˙i · F~iext .
2 i,j=1
i=1
(3.4)
j6=i
Es gilt nun (Kraft hängt nur vom Betrag der Abstände ab und zeigt entlang der
Verbindungslinie; siehe oben)
~ri − ~rj
F~i,j = Fi,j (|~ri − ~rj |)
.
|~ri − ~rj |
Damit ist F~i,j analog zur Zentralkraft aus einem “Zweiteilchenpotential” vi,j ableitbar. Mit der Definition ~ri,j = ~ri − ~rj folgt
~ ~r vi,j (ri,j ) = −∇
~ ~r vi,j (ri,j )
F~i,j (~ri,j ) = −∇
i,j
i
mit
Z
ri,j
vi,j (ri,j ) = −
Fi,j (r0 ) dr0 .
r0
Dabei gibt der Index am ∇ an, nach welcher Variablen differenziert wird. Sind
weiterhin die äußeren Kräfte konservativ, d.h.
~ ext (~ri )
F~iext (~ri ) = −∇V
i
wobei Viext nicht explizit von der Zeit abhängt, so vereinfacht sich Gl. (3.4) zu
(Kettenregel!)


N
N
N
X
d X mi 2
d 1 X

vi = − 
vi,j (ri,j ) +
Viext (~ri ) .
dt i=1 2
dt 2 i,j=1
i=1
j6=i
134
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Damit ergibt sich die Energieerhaltung für ein konservatives N -Teilchensystem
N
X
mi
i=1
2
vi2
N
N
X
1 X
+
vi,j (ri,j ) +
Viext (~ri ) = E = const. .
2 i,j=1
i=1
(3.5)
j6=i
Häufig spricht man auch unter allgemeineren Bedingungen an die äußeren
Kräfte von einem konservativen N -Teilchensystem. In Gl. (3.4) können wir zu
dem aus einem Potential ableitbaren F~iext (~ri ) eine (externe) Kraft hinzuaddieren, die entlang der physikalischen Lösung senkrecht zu ~r˙i (t) steht ohne, dass
die folgenden Schritte zur Herleitung der Energieerhaltung – wobei die Gesamtenergie wie in Gl. (3.5) definiert ist – nicht mehr funktionieren würden. Diese
Zusatzkraft kann dabei von allen Orten, Geschwindigkeiten und auch explizit
von der Zeit abhängen. Ein allgemeines N -Teilchensystem heißt dann konserva~ ext (~ri ) +
tiv (und die Energie gemäß Gl. (3.5) ist erhalten) wenn F~iext = −∇V
i
˙
˙
˙
˙
~
~
fi (~r1 , ~r2 , . . . , ~rN ; ~r1 , ~r2 , . . . , ~rN ; t) mit ~ri · fi = 0 entlang der physikalischen Lösung
(Lösung der Bewegungsgleichung) ~ri (t) für alle i = 1, 2, . . . , N . Die externen
Kräfte würde man in diesem Fall ebenfalls als konservativ bezeichnen. Wir weisen darauf hin, dass man im Fall einer explizit zeitabhängigen Potentialfunktion,
deren negativer Gradient die explizit zeitabhängige Kraft liefert, nicht von einem
konservativen System bzw. einer konservativen Kraft spricht, da die Energieerhaltung (mit der Energie gemäß Gl. (3.5), wobei Viext (~ri ) → Viext (~ri ; t)) nicht mehr
gilt. Man kann solche Kräfte Potentialkräfte nennen.
Die in diesem Kapitel diskutierten Erhaltungssätze spielen bei der Lösung
vieler mechanischer Probleme eine zentrale Rolle. Um das näher zu erläutern betrachten wir zunächst Bewegungen eines Massepunktes in einem konservativen
Kraftfeld, die sich in Gegenwart von speziellen Anfangsbedingungen und/oder
Zwangskräften durch geschickte Wahl des Koordinatensystems durch eine Ortsvariable beschreiben lassen (eindimensionale Bewegungen). Wir haben im Laufe
dieser Vorlesung bereits einige Beispiele dazu kennen gelernt (freier Fall, Masse
mit Hookscher Feder) und analytisch gelöst (ohne auf Erhaltungsgrößen Bezug zu
nehmen). Wir werden im Folgenden zunächst einige allgemeine Überlegungen anstellen. Bereits am Beispiel dieser Klasse von Bewegungen wird klar werden, wie
klein die Zahl der geschlossen analytisch lösbaren (integrierbaren; siehe später)
Probleme ist.
3.4
Ein Teilchen in einer Dimension
Spezielle Anfangsbedingungen und/oder Zwangskräfte (z.B. “Perle auf Draht”)
können dazu führen, daß sich die Bewegung eines Teilchens als effektiv eindimensional beschreiben läßt. Daher ist es sinnvoll eindimensionale mechanische
Systeme zu betrachten.
3.4. EIN TEILCHEN IN EINER DIMENSION
135
Zeitunabhängige Kräfte: Die Newtonsche Gleichung in einem statischen Kraftfeld welches nur vom Ort des Teilchens abhängt lautet
mẍ = F (x) .
Als besondere Eigenschaft des eindimensionalen Falls, läßt sich jede integrierbare,
nur vom Ort abhängige Kraft F (x) durch ein Potential V (x) ausdrücken
Z x
F (x0 ) dx0 ,
V (x) = −
x0
welches bis auf eine willkürliche Konstante (Nullpunkt der Energie; siehe auch
oben) eindeutig festgelegt ist. Die Energieerhaltung liefert
m 2
ẋ = E − V (x) .
2
(3.6)
Somit ist der Betrag der Geschwindigkeit des Teilchens bei fester Gesamtenergie
E durch den Ort des Teilchens eindeutig festgelegt. In der Skizze ist eine typische
Situation dargestellt.
V(x)
E
x1
x2 xM x3
x
Die kinetische Energie ist größer oder gleich Null, so daß die Bewegung nur in
Bereichen mit V (x) ≤ E verlaufen kann. Für die gestrichelt dargestellte Gesamtenergie E im obigen Beispiel sind das die x-Bereiche zwischen x1 und x2 sowie
rechts von x3 . Die Punkte xi , i = 1, 2, 3, an denen die potentielle Energie gleich
der Gesamtenergie ist, also V (xi ) = E gilt, sind die Umkehrpunkte der Bewegung,
an denen die Geschwindigkeit der Teilchens einen Nulldurchgang hat, d.h. ihre
Richtung umkehrt. Sollte das für die Bewegung erlaubte Gebiet auf beiden Seiten
durch einen Umkehrpunkt begrenzt sein, verläuft sie in einem endlichen Raumbereich und man nennt sie finit. Liegt im obigen Beispiel der Anfangsort (bei festem
E) zwischen x1 und x2 , so ist die Bewegung auf diesen Raumbereich beschränkt.
136
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Ist der erlaubte Raumbereich nicht oder nur auf einer Seite beschränkt (liegt der
Anfangsort in der Skizze bei festem E rechts von x3 ), so nennt man die Bewegung
infinit und das Teilchen läuft nach ±∞. Aus Gl. (3.6) ergibt sich
r
2
[E − V (x)]
(3.7)
ẋ = ±
m
und man kann die Geschwindigkeit bei gegebenem x direkt ablesen. Um sich einen
Eindruck von der Bewegung zu verschaffen stellt man sie im sogenannten Phasenraum dar. Dabei trägt man den Ort entlang der x-Achse und die Geschwindigkeit
entlang der y-Achse auf. Für unser Beispiel und zwei Energien E1 und E2 haben
wir das in der folgenden Skizze getan.2
V(x)
E2
E1
x0 x1
x2
x3
x
x
E2
E1
E1
x
Die Bahnen (je nach Anfangsort und Gesamtenergie) werden in Richtung der
Pfeile durchlaufen. Zur analytischen Bestimmung des Verlaufs der Bewegung,
integrieren wir die Differentialgleichung (3.7) erster Ordnung durch Separation
der Variablen
r Z x(t)
Z t
m
1
0
p
dt = ±
dx0
0
2
E − V (x )
t0
x0
2
Die auf der x-Achse auftretenden Knicke sind ein Artefakt des Programms mit dem die
Skizze erstellt wurde. Eigentlich gehen die Kurven mit divergierender Steigung durch die xAchse.
3.4. EIN TEILCHEN IN EINER DIMENSION
137
und damit
r
t − t0 = ±
m
2
Z
x(t)
x0
1
p
E − V (x0 )
dx0 .
(3.8)
Dabei müssen x0 = x(t0 ) und x(t) mit der fest vorgegebenen Gesamtenergie E
verträgliche Orte (im Sinne der obigen Diskussion) sein, d.h. bezugnehmend auf
die obige (erste) Skizze muß x0 , x(t) ∈ [x1 , x2 ] oder x0 , x(t) ∈ [x3 , ∞) gelten.
Für beliebige Potentiale wird die Integration auf der rechten Seite von Gl. (3.8)
im Allgemeinen nicht analytisch ausführbar sein und man kann die Gleichung
nicht nach x(t) (woran wir natürlich interessiert sind) auflösen. Man kann die
Bahnkurve in der (t, x)-Ebene dann durch numerische Integration und Auftragen
von t als Funktion von x erhalten.
Für ein quadratisches (harmonisches) Potential V (x) = V0 + c(x − b)2 /2 (also
eine Hooksche Kraft) mit c > 0, läßt sich die Integration ausführen und das
Ergebnis dieser nach x(t) auflösen. Um die Rechnung zu vereinfachen, wählen
wir o.B.d.A. V0 = 0 = b. Wir definieren den zur gegebenen Gesamtenergie E
gehörenden Umkehrpunkt a gemäß E = V (a) und erhalten so
Z x(t)
1
1
√
dx0
t − t0 = ±
ω0 x0
a2 − x 0 2
⇒ ω0 (t − t0 ) = ±{arcsin [x(t)/a] − arcsin [x0 /a]}
oder aufgelöst nach x(t)
x(t) = ±a sin (ω0 t + φ± ) ,
φ± = −ω0 t0 ± arcsin [x0 /a] .
p
Dabei haben wir die Kreisfrequenz ω0 = c/m eingeführt. Dieses Ergebnis ist
uns natürlich bereits aus dem Kapitel über Integralrechnung einer Veränderlichen
bekannt.
Periodische Bewegungen: Die eindimensionale finite Bewegung ist im Allgemeinen eine Schwingung. Eine Ausnahme bildet die Situation, daß in unserer
ersten Skizze des Potentials gerade E = V (xM ) gewählt wird. In allen anderen
Fällen führt das Teilchen eine periodische Bewegung zwischen den Umkehrpunkten x1 und x2 aus. Für die Schwingungsdauer TE (bei festem E) der Bewegung
von x1 nach x2 und zurück erhält man
Z x2
√
1
p
TE = 2m
dx0 .
(3.9)
0
E − V (x )
x1
Wie man leicht nachrechnet gilt im Fall des harmonischen Potentials unabhängig
von der Gesamtenergie E, bzw. dem Umkehrpunkt a (aus V (a) = E), TE =
138
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
2π/ω0 . Wir betrachten nun den Fall eines symmetrischen Potentials V (x) mit
einem harmonische Teil und einer “kleinen” Anharmonizität
V (x) =
c 2
x + V1 (x) , 0 ≤ 1 .
2
Wir definieren wieder den Umkehrpunkt a (symmetrisches Potential!) bei festem
E gemäß V (a) = E. Unter der Voraussetzung, daß |V1 (a)| ca2 /2, p
was für hinreichend kleines sicherlich erreicht werden kann, entwickeln wir 1/ E − V (x)
nach Potenzen von r
2
1
1
1
p
√
q
=
c a2 − x2 1 + 2 [V (a) − V (x)]/(a2 − x2 )
V (a) − V (x)
1
1
c
r
2
1
V1 (a) − V1 (x)
√
=
1−
+ O(2 ) .
c a2 − x 2
c
a2 − x 2
Setzt man dieses Ergebnis in die Gleichung für die Periodendauer (3.9) ein, so
kann das Integral des ersten Summanden ausgeführtpwerden (Integrand wie beim
harmonischen Potential) und man erhält mit ω0 = c/m
Z a
2π
1
V1 (a) − V1 (x)
2
√
TE = T (a) =
1−
dx + O( ) .
ω0
cπ −a a2 − x2
a2 − x 2
Dabei tritt in nullter Ordnung in die bekannte Schwingungsdauer des harmonischen Oszillators auf. Der Term erster Ordnung in hängt von a und damit E
ab, so daß die Schwingungsdauer für eine allgemeine periodische Bewegung von
der Gesamtenergie bzw. dem Umkehrpunkt (der Auslenkung) abhängt.
Die Abhängigkeit der Periodendauer von der Auslenkung läßt sich explizit
für den Fall der quartischen Anharmonizität mit V1 (x) = χx4 zeigen, wobei χ
positive oder negative Werte annehmen kann. In diesem Fall gilt
V1 (a) − V1 (x)
= χ(a2 + x2 )
a2 − x 2
und das Integral im Term erster Ordnung läßt sich ebenfalls geschlossen angeben.
Nach der Substitution u = x/a folgt für das relevante Integral
Z
1
−1
1 + u2
√
du = −
1 − u2
Z
1
−1
√
2
1 − u2 − √
1 − u2
du = −
Zusammengefaßt gilt dann
3χ 2
2π
2
1−
a + O( ) ,
T (a) =
ω0
2c
π
3π
+ 2π =
.
2
2
3.4. EIN TEILCHEN IN EINER DIMENSION
139
bzw. für die Kreisfrequenz der periodischen Bewegung
3χ 2
2
ω(a) = ω0 1 +
a + O( ) .
2c
(3.10)
Je nach Vorzeichen von χ wird die Frequenz verglichen mit der des harmonischen
Oszillators erhöht oder erniedrigt.
Fadenpendel und Polarkoordinaten: Ein typisches Beispiel eines anharmonischen Oszillators ist ein (reibungsfreies) Fadenpendel (Masse m am Ende eines
masselosen Fadens) bei größerer Auslenkung.
0
φ
N
G
Die Bewegung ist effektiv eindimensional da sie in einer Ebene (per Wahl des
Koordinatensystems die x1 -x2 -Ebene) statt findet und die Masse durch die ent~ auf eine Kreisbahn gezwungen wird.
lang des Fadens wirkende Normalkraft N
Damit ist der Abstand vom Ursprung durch die Länge R des Fadens festgelegt.
Die Position der Masse ist durch die Angabe des Winkels φ eindeutig festgelegt.
Es biete sich an, das Problem in ebenen Polarkoordinaten (siehe Mathematik Teil
dieser Vorlesung) zu formulieren. Es gilt
x1 = r cos φ ,
x2 = r sin φ .
Für einen festen Ortsvektor ~r führen wir zwei neue (verglichen mit den alten ~e1
und ~e2 ) orthogonale Einheitsvektoren ein. Als den ersten wählen wir ~rˆ = ~r/r
~ˆ der zusammen mit ~rˆ ein
und als den zweiten den dazu senkrechten Vektor φ
Rechtssystem (siehe den mathematischen Teil dieser Vorlesung) bildet. Dies ist
in der folgenden Skizze dargestellt.
140
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
φ
r
r
e2
e1
Fassen wir nun ~r als den (ebenen) Ortvektor auf, der die Bewegung der Masse beschreibt, also ~r = ~r(t), so ändern sich die orthogonalen Einheitsvektoren
~ˆ (im Gegensatz zu ~e1 und ~e2 ) im Laufe der Zeit. Dessen ungeachtet,
~rˆ und φ
läßt sich ein Vektor, z.B. die Gesamtkraft F~ als Linearkombination von ~rˆ und
~ˆ schreiben F~ = Fr~rˆ + Fφ φ.
~ˆ Wir streben es an, die Newtonsche Gleichung für
φ
~ˆ zu schreiben, müssen also die
die Entwicklungskomponenten von ~r nach ~rˆ und φ
Entwicklungskoeffizienten von ~r¨ unter Berücksichtigung der Zeitabhängigkeit von
~ˆ bestimmen. Der Ortsvektor selbst ist durch ~r = x1~e1 + x2~e2 = r~rˆ gege~rˆ und φ
ben. In der folgenden Skizze ist die Position des Teilchens zu zwei verschiedenen
Zeiten t1 und t2 = t1 + ∆t dargestellt.
∆r
r(t2)
∆φ
r(t2)
r(t1)
r(t1)
Für kleine ∆t gilt
~ˆ ≈ φ̇∆t φ
~ˆ
∆~rˆ ≈ ∆φ φ
~ˆ steht. Für ∆t → 0 folgt so
da ∆~rˆ senkrecht auf ~rˆ, also in Richtung von φ
d~rˆ
~ˆ .
= φ̇ φ
dt
Damit ergibt sich
d~rˆ
~ˆ .
~v = ~r˙ = ṙ ~rˆ + r
= ṙ ~rˆ + rφ̇ φ
dt
3.4. EIN TEILCHEN IN EINER DIMENSION
141
Die Koeffizienten der Geschwindigkeit in Polakoordinaten sind also vr = ṙ und
vφ = rφ̇ = rω mit der Winkelgeschwindigkeit ω. Die Ausdrücke für die Koeffizienten sind im Allgemeinen sicherlich komplizierter, als die für die Koeffizienten
in kartesischen Koordinaten ẋ1 und ẋ2 . In speziellen Situation z.B. wenn eine
Zwangskraft dafür sorgt, daß ṙ = 0 (siehe das Beispiel des Fadenpendels mit dem
wir gestartet sind), kann die Wahl von Polarkoordinaten trotzdem von Vorteil bei
der Lösung des mechanischen Problems sein. Um unser Ziel zu erreichen müssen
wir erneut nach t differenzieren
i
d h ˆ
d~v
ˆ
¨
~
=
ṙ ~r + rφ̇ φ .
~r =
dt
dt
~ˆ nach der Zeit. Die Konstruktion dieser
Wir benötigen also die Ableitung von φ
ist in der folgenden Skizze dargestellt.
∆φ
φ(t2)
φ(t1)
φ(t1)
∆φ
φ(t2)
Analog zu den obigen Überlegungen folgt
~ˆ
dφ
= −φ̇ ~rˆ .
dt
Zusammengenommen erhalten wir somit
i
d h ˆ
~ˆ
ṙ ~r + rφ̇ φ
~r¨ =
dt
~ˆ
d~rˆ
dφ
ˆ
ˆ
ˆ
~
~
= r̈ ~r + ṙ
+ ṙφ̇ φ + rφ̈ φ + rφ̇
dt
dt
ˆ
2 ˆ
~.
= (r̈ − rφ̇ ) ~r + (rφ̈ + 2ṙφ̇) φ
Die Newtonsche Gleichung übersetzt sich dann zu
Fr = m(r̈ − rφ̇2 ) ,
Fφ = m(rφ̈ + 2ṙφ̇) .
Erneut ist dieser Ausdruck im Allgemeinen sicherlich sehr viel komplizierter als
sein Analogon in kartesischen Koordinaten. In dem wir jetzt zu unserem Bespiel
zurückkehren, werden wir jedoch sehen, daß die Formulierung in Polarkoordinaten
in speziellen Situationen von großem Vorteil sein kann.
142
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Im obigen Beispiel des Fadenpendels sind die auf die Masse wirkenden äußeren
~ = m~g und die Normalkraft N
~ . In Polarkoordinaten
Kräfte die Gewichtskraft G
geschrieben ist die Gesamtkraft
Fr = mg cos φ − N ,
Fφ = −mg sin φ .
Da aufgrund des Fadens ṙ = 0 gilt, vereinfacht sich die Newtonsche Gleichung zu
Fr = mg cos φ − N = −mRφ̇2 ,
Fφ = −mg sin φ = mRφ̈ .
Der Betrag der Normalkraft (Zwangskraft) N ist zum Verständnis der Bewegung
irrelevant. Zum Glück erhalten wir mit der zweiten Gleichung eine, in der N nicht
vorkommt. Wir können also wie folgt vorgehen: Wir bestimmen φ(t) mit Hilfe
der zweiten Gleichung. Bei Interesse können wir dann N durch Einsetzen von
φ(t) in die erste Gleichung und Auflösen nach N berechnen. Die für uns zunächst
relevante eindimensionale Bewegungsgleichung ist
g
φ̈ = − sin φ .
R
Für kleine Auslenkwinkel φ, können wir den Sinus in einer Taylorreihe um φ = 0
entwickeln (siehe Mathematikteil dieser Vorlesung) sin(φ) = φ + O(φ3 ) und bekommen das uns inzwischen wohlbekannte Problem des harmonischen Oszillators (lineare Kraft, quadratisches Potential). Gehen wir eine Ordnung weiter,
so bekommen wir das oben diskutierte Problem des Oszillators mit quartischer
Anharmonizität, da die Kraft die Form
1
Fφ ∼ −φ + φ3 + O(φ5 )
6
hat und damit das Potential einen quadratischen und einen quartischen Term
hat. Die obigen Ergebnisse können somit direkt auf den Fall des Fadenpendels
angewandt werden.
Dissipative Systeme: Das wesentliche Hilfsmittel zur Untersuchung der Bewegung in einem statischen Kraftfeld, welches nur vom Ort abhängt, war der Satz
von der Erhaltung der Energie. Für ein durch
mẍ + γ(x, ẋ)ẋ = F (x)
(3.11)
gegebenes dissipatives System gilt keine Energieerhaltung da (V bezeichnet das
zur konservativen Kraft F gehörige Potential),
dT
dV
dE
=
+
dt
dt
dt
= [mẍ − F (x)]ẋ
= −γ(x, ẋ)ẋ2
6
=
0,
3.4. EIN TEILCHEN IN EINER DIMENSION
143
wobei wir die Bewegungsgleichung verwendet haben. Integration liefert dann
Z t
γ(x(t0 ), ẋ(t0 )) [ẋ(t0 )]2 dt0 .
E(t) − E(t0 ) = −
t0
Periodische Lösungen kann es nur geben, wenn es Zeiten T gibt zu denen E(t0 +
T ) = E(t0 ) gilt. Um solch eine Situation zu erreichen, muß γ(x, ẋ) notwendigerweise Bereiche mit verschiedenen Vorzeichen haben, wie es z.B. im van der PolOszillator Gl. (3.1) der Fall ist. Die Bewegungsgleichung (3.11) ist im Allgemeinen
nicht mehr auf ein Integral zu reduzieren wie es bei konservativen Systemen der
Fall ist (siehe oben). Es wird sich als nützlich herausstellen, die Gleichung zweiter
Ordnung in ein System von Gleichungen erster Ordnung umzuschreiben, in dem
wir die Variable v = ẋ einführen
ẋ = v ,
v̇ = F̃ (x, v) ,
mit F̃ (x, v) = [F (x) − γ(x, v)v]/m. Dies ist ein System nicht-linearer (für allgemeine γ(x, v)) Differentialgleichungen erste Ordnung. Die Bahnkurven im Phasenraum lassen sich daher nur in Ausnahmefällen analytisch angeben. Man kann
sie jedoch geometrisch konstruieren.
Um diese Konstruktion zu verstehen betrachten wir zunächst ein allgemeines
System von Differentialgleichungen erster Ordnung für die Variablen x1 (t), x2 (t),
. . . , xn (t)
ẋi = fi (x1 (t), . . . , xn (t)) ,
i = 1, 2, . . . , n
mit hinreichend “harmlosen” Funktionen fi . Taylorentwicklung liefert
xi (t + ∆t) = xi (t) + ∆t ẋi (t) + O([∆t]2 )
= xi (t) + ∆t fi (x1 (t), . . . , xn (t)) + O([∆t]2 ) .
Das “Geschwindigkeitsfeld” f~(~x) zeigt somit an, wie die zeitlich Entwicklung in
einem infinitessimalen Zeitschritt weitergeht. Im obigen Fall von zwei gekoppelten Differentialgleichungen erster Ordnung kann man das “Geschwindigkeitsfeld”
(Vektorfeld) für die Variablen x und v
v
.
f~(x, v) =
F̃ (x, v)
leicht graphisch darstellen, wie wir es im Kapitel über Funktionen mehrerer
Veränderlicher kennen gelernt haben. Man kann das Verhalten der Phasenraumtrajektorie dann direkt ablesen, da diese in einem Punkt (x, v)T tagential zu
f~(x, v) ist. Ein Beipiel dazu ist in der folgenden Abbildung dargestellt.
144
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
2
v
–2
–1
1
0
1
x
2
–1
–2
Es zeigt das “Geschwindigkeitsfeld” der Phasenraumtrajektorie für das einfache
(konservative γ(x, v) = 0) Problem des harmonischen Oszillators (mit F (x) =
−mω02 x bzw. V (x) = mω02 x2 /2)
v
ẋ
=
v̇
−ω02 x
mit ω0 = 1.3 Es ist leicht zu erkennen, daß die Phasenraumtrajektorien in diesem
Fall Kreise (allgemeiner Ellipsen) sind.
Kehren wir noch einmal zum allgemeinen “Geschwindigkeitsfeld” f~(~x) zurück.
Oft gibt es ausgezeichnete Punkte ~x∗ für die
f~(~x∗ ) = 0
gilt, d.h. keine Bewegung im Phasenraum mehr auftritt. Man nennt diese Punkte
daher stationäre Punkte oder Fixpunkte. Wir werden später auf die Bewegung in
der Nähe solcher Punkte zurückkommen.
Zur allgemeinen Konstruktion der Phasenraumtrajektorien können wir auch
den Parameter Zeit eleminieren und v als Funktion von x betrachten. Die Funktion v(x) erfüllt die Differentialgleichung4
dv
F̃ (x, v)
=
,
dx
v
d.h. die “Steigung” der Phasenraumtrajektorie ist durch F̃ (x, v)/v gegeben. Man
betrachtet dann alle Punkte im Phasenraum mit der selben Steigung α
F̃ (x, v)
=α.
v
3
4
Wir vernachlässigen die physikalischen Einheiten.
Vorsicht falls v = 0 gilt!
3.4. EIN TEILCHEN IN EINER DIMENSION
145
Die entsprechenden Kurven bezeichnet man als Isoklinen. Betrachten wir dazu
das Beispiel des gedämpften harmonischen Oszillators mit der Bewegungsgleichung
mẍ = F (x, v) = −mω02 x − m2γv ,
d.h. γ(x, v) = m2γ ≥ 0, die wir bereits im Kapitel über Systeme linearer Differentialgleichungen untersucht haben. In diesem Fall ist
F̃ (x, v) = [F (x) − γ(x, v)v]/m = −ω02 x − 2γv
und die Isoklinen mit
ω 2 x + 2γv
F̃ (x, v)
=− 0
=α
v
v
sind eine Geradenschar
v=−
ω02
x.
α + 2γ
Die folgenden Abbildung zeigt das “Geschwindigkeitsfeld”
ẋ
v
=
v̇
−ω02 x − 2γv
für die Phasenraumtrajektorie für den Fall der schwach gedämpften Bewegung
mit5 γ/ω0 = 0.2 und ω0 = 1.
2
v
–2
1
–1
1
x
–1
–2
5
Wir vernachlässigen erneut die physikalischen Einheiten!
2
146
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Zusätzlich sind folgend die Isoklinen (für andere Parameter) sowie eine typische
Trajektorie dargestellt
α=−0.5
α=0
α=0.5
v
α=−1.5
α=−οο
x
Auf den Isoklinen ist die Steigung α als kleiner Strich angezeigt. Die Trajektorien
der schwach gedämpften Bewegung sind sogenannte logarithmische Spiralen die
spiralförmig in den Ursprung laufen.
Als komplexeres Beispiel diskutieren wir kurz die Phasenraumtrajektorien des
Van der Pol-Oszillators Gl. (3.1). Nach entsprechender Wahl der Konstanten m,
ω0 und a ist die Bewegungsgleichung von der Form
ẍ + (x2 − 1)ẋ + x = 0 .
Wir betrachten den Fall > 0 (für = 0 geht das System in den harmonischen
Oszillator über). Das “Geschwindigkeitsfeld” der Phasenraumtrajektorie ist für
ein festes > 0 in der folgenden Skizze dargestellt (wobei hier x1 = x und
x01 = ẋ).6
6
Die Abbildung ist mit dem Programmpaket zur nicht-linearen Dynamik erstellt, welches
Herr Maximilian Lohöfer im Rahmen seiner Bachelorarbeit geschrieben hat und welches sie im
L2 P herunterladen können.
3.4. EIN TEILCHEN IN EINER DIMENSION
147
Die Phasenraumkurve, der sich die Trajektorie offensichtlich schon nach kurzer Zeit annähert und entlang der sich das System dann weiter bewegt nennt
man einen Grenzzyklus (oder Attraktor). Nach Aussterben der vom Anfangspunkt
abhängigen Transienten, geht der van der Pol-Oszillator für große Zeiten in eine
periodische Bewegung über. Die dämpfende und verstärkende Wirkung der “Reibung” halten sich die Waage. Auf dem Grenzzyklus ist die Energie des Systems im
Mittel erhalten, bzw. periodisch (siehe Seite 142). Für den van der Pool-Oszillator
hängt die Form des Grenzzyklus im Phasenraum vom Parameter ab nicht jedoch von den Anfangswerten. Für kleine hat der Grenzzyklus “fast” die Form
wie die Trajektorien des harmonischen Oszillators (in der obigen Abbildung ist
= 5 gewählt, also ist dort nicht klein). In diesem Limes lassen sich analytische Resultate für die Bewegung gewinnen. Alle diese Aspekte der Dynamik kann
man den folgenden Abblidungen für = 0.5 bzw. 5 entnehmen. Zusätztlich sind
Phasenraumtrajektorien und die Funktionen x(t), ẋ(t) für verschiedene Anfangspunkte und dargestellt. Kurven unterschiedlicher Farbe entsprechen Situationen
148
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
mit unterschiedlichen Anfangsbedingungen (diese können aus dem Phasenraumdiagramm direkt abgelesen werden). An x(t) und ẋ(t) erkennt man sehr deutlich,
daß die im Limes großer Zeiten periodische Bewegung (Grenzzyklus!) für “große”
hochgeradig nicht-harmonisch ist (keine Sinusschwingung!). Um die Bewegung
genauer zu analysieren könnte man das für hinreichend große t periodische x(t)
(numerisch) in einer Fourierreihe entwickeln (Spektralanalyse).
• = 0.5
3.4. EIN TEILCHEN IN EINER DIMENSION
149
• =5
Bisher haben wir Bewegungsgleichungen vom Typ mẍ = F (x, ẋ) untersucht,
die als System von Differentialgleichungen erster Ordnung mit zeitunabhängigem
“Geschwindigkeitsfeld” geschrieben werden können. Man bezeichnet solche als
autonome Differentialgleichungssysteme (und die diesen Gleichungen zugrundeliegenden mechanischen Systeme als autonome Systeme). Im Folgenden werden
wir Systeme untersuchen, in denen die Kraft von der Zeit abhängt und somit
F (x, ẋ) → F (x, ẋ, t).
Zeitabhängige Kräfte: Ein typisches interessantes Beispiel für ein System mit
zeitabhängiger Kraft–ein getriebenes System–ist das gedämpfte (γ > 0), getrie-
150
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
bene Fadenpendel mit der Bewegungsgleichung für den Auslenkwinkel φ
φ̈ + 2γ φ̇ +
g
sin φ = h0 cos (ωt) ,
R
d.h. F (φ, φ̇, t)/m = −2γ φ̇ − (g/R) sin φ + h0 cos (ωt).
Wie wir sehen werden führt die Erweiterung auf zeitabhängige Kräfte zu völlig
neue Phänomene. So kann in Situationen, in dem das “Geschwindigkeitsfeld” der
Trajektorien nicht-linear von den Variablen abhängt sogenanntes chaotisches Verhalten der Lösung auftreten. Bevor wir dazu kommen, wollen wir uns jedoch mit
der einfacheren Situation des gedämpften, getriebenen harmonischen Oszillators
(lineare Abhängigkeit von den Variablen) beschäftigen, dessen Dynamik für eine
cosinusförmige treibende Kraft sie bereits in einer Übungsaufgabe untersucht haben.
Der gedämpfte, getriebene, harmonische Oszillator: Auf einen gedämpften, harmonischen Oszillator wirke eine zeitabhängige äußere Kraft h(x, ẋ, t). Die
Bewegungsgleichung ist durch (γ ≥ 0)
ẍ + 2γ ẋ + ω02 x = h(x, ẋ, t)
gegeben. Anhand einiger Spezialfälle wollen wir eine Reihe physikalischer Phänomene diskutieren.
Dazu betrachten wir den häufig untersuchten Fall einer cosinusförmigen treibenden Kraft h(x, ẋ, t) = h0 cos (ωt + ϕ0 ), mit den Konstanten ω > 0 und ϕ0 .
Für den reibungsfreien Fall γ = 0 gilt dann (ω0 > 0)
ẍ + ω02 x = h0 cos (ωt + ϕ0 ) .
Dies ist eine lineare, inhomogene Differentialgleichung zweiter Ordnung. Die allgemeine Lösung dieser Gleichung läßt sich als Summe der allgemeinen Lösung
der homogenen Gleichung und einer speziellen (partikulären) Lösung der inhomogenen Gleichung schreiben. Die allgemeine Lösung der homogenen Gleichung
ist (zwei freie Konstanten für die zwei Anfangsbedingungen)
xh (t) = c1 cos (ω0 t) + c2 sin (ω0 t) .
Für ω 6= ω0 liefert xp (t) = x0 cos (ωt + ϕ0 ) eine Lösung der inhomogenen Differentialgleichung, wobei x0 = h0 /(ω02 − ω 2 ) gelten muß. Die allgemeine Lösung der
inhomogenen Gleichung lautet somit für ω 6= ω0 (zwei freie Konstanten für die
zwei Anfangsbedingungen)
x(t) = c1 cos (ω0 t) + c2 sin (ω0 t) +
ω02
h0
cos (ωt + ϕ0 ) ,
− ω2
3.4. EIN TEILCHEN IN EINER DIMENSION
151
und stellt eine Überlagerung zweier periodischer Bewegungen mit verschiedenen
Frequenzen dar. Für ω dicht bei der Kreisfrequenz ω0 der freien (h0 = 0) Schwingung wird die Amplitude des dritten Summanden groß. Die folgenden Abbildungen zeigen typische Kurven x(t) mit7 c1 = 1, c2 = 0 = ϕ0 , h0 = 0.1 (durchgezogen) und h0 = 0.5 (gestrichelt) für zwei verschiedene treibende Frequenzen
ω = 1/2 (kommensurabel zu ω0 = 1) und ω = 1/π (inkommensurabel).
ω=1/2
2
ω=1/π
2
1
x
x
1
0
0
-1
-1
0
50
100
t
150
200
-2
0
50
100
t
150
200
Der Fall, daß die treibende periodische Bewegung resonant zur freien Oszillation ist, also ω = ω0 gilt, muß getrennt behandelt werden. Für diesen liefert der
Ansatz xp (t) = x0 t sin (ω0 t + ϕ0 ) eine Lösung der inhomogenen Differentialgleichung, falls x0 = h0 /(2ω0 ) gewählt wird. Die getriebene harmonische Schwingung
ist somit im Resonanzfall durch (zwei freie Konstanten für die zwei Anfangsbedingungen)
x(t) = c1 cos (ω0 t) + c2 sin (ω0 t) +
h0
t sin (ω0 t + ϕ0 ) ,
2ω0
gegeben und die Auslenkung wächst linear mit der Zeit an.8 Liegt, wie hier betrachtet, keinen Dämpfung (Reibung) vor kann es so zur so genannten Resonanzkatastrophe kommen.
In einer Übungsaufgabe haben sie die Bewegungsgleichung für den gedämpften, getriebenen, harmonischen Oszillator mit der cosinusförmigen äußeren Kraft
h0 cos (ωt)
ẍ + 2γ ẋ + ω02 x = h0 cos (ωt)
untersucht. Für den Fall schwacher Dämpfung 0 < γ ω0 haben sie die allge7
Wir vernachlässigen die physikalischen Einheiten.
Mit Hilfe der l’Hospitalschen Regel läßt sich der Resonanzfall auch direkt aus der Lösung für
|ω| =
6 |ω0 | extrahieren. Diese Vorgehensweise geht jedoch über die hier zur Verfügung gestellten
mathematischen Methoden hinaus.
8
152
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
meine Lösung
h0
cos (ωt − δ)(3.12)
x(t) = e−γt [c1 cos (ω0 t) + c2 sin (ω0 t)] + p 2
(ω0 − ω 2 )2 + 4γ 2 ω 2
mit
δ = arctan
2γω
− ω2
ω02
bestimmt. In der gegebenen Form enthält die Lösung noch eine kleine Inkonsistenz, da wir in der Lösung der homogenen Gleichung konsequent Terme der
Ordnung (γ/ω0 )2 vernachlässigt haben (Grenzfall schwacher Dämpfung), nicht
jedoch in der Lösung der inhomogenen Gleichung. Diese läßt sich leicht korrigieren, in dem man in der Gleichung für die Eigenwerte (2.49) nicht
pnach γ/ω0
entwickelt. Man erhält dann erneut Gl. (3.12) jedoch mit ω0 → ω̃0 = ω02 − γ 2 in
den Argumenten der Cosinus- und Sinusfunktion der ersten beiden Summanden.
Durch die Dämpfung wird die Eigenfrequenz der freien Oszillation reduziert (die
Periodendauer wird verlängert). Das war intuitiv zu erwarten, da die Reibung die
Bewegung hemmt.
Die Dämpfung führt dazu, daß die Resonanz “ausgeschmiert” wird und die
Amplitude des letzten Terms auch für ω0 = ω nicht mehr unbeschränkt mit der
Zeit anwächst. Als Funktion der Kreisfrequenz der treibenden Kraft ω ist diese Amplitude eine “scharf” um ω0 herum zentrierte Funktion. Für ω/ω0 1
fällt sie wie ω −2 ab. Für Zeiten t γ −1 können die ersten beiden Terme vernachlässigt werden und die Masse schwingt mit der Kreisfrequenz der treibenden Kraft. Im Phasenraum gehen die Trajektorien für große t gegen einen ellipsenförmigen Grenzzyklus. Für kleinere Zeiten findet man transientes Verhalten
in Form eines Einschwingvorgangs.
Zur Vorbereitung auf spätere Überlegungen wollen wir die Amplitude der
Oszillation des schwach gedämpften (0 < γ ω0 ), getriebenen harmonischen
Oszillators nach Abklingen des Einschwingvorgangs
h0
A= p 2
(ω0 − ω 2 )2 + 4γ 2 ω 2
genauer betrachten. Dazu beschränken wir uns auf den Bereich in der Nähe der
Resonanz mit ω ≈ ω0 . In diesem Fall gilt für das Amplitudenquadrat
h20
[(ω0 − ω)(ω0 + ω)]2 + 4γ 2 ω 2
h20
≈
[(ω0 − ω)2ω0 ]2 + 4γ 2 ω02
(h0 /[2ω0 ])2
=
,
(ω0 − ω)2 + γ 2
A2 =
(3.13)
3.4. EIN TEILCHEN IN EINER DIMENSION
153
was als Funktion von ω eine Lorentzkurve um ω0 darstellt.
Die folgende Abbildung zeigt den typischen zeitlichen Verlauf von x(t) des
schwach gedämpften, getriebenen harmonischen Oszillators für9 ω0 = 1, γ = 0.1,
c1 = 1, c2 = 0, h0 = 0.2 und ω = 1/π (weg von der Resonanz!).
ω=1/π
1
x
0.5
0
-0.5
0
20
40
60
80
100
t
Noch einmal anharmonische Schwingungen: In unseren bisherigen Überlegungen zu anharmonischen Schwingungen, sind wir auf die Details der Bewegung
(volle Zeitabhängigkeit) noch nicht eingegangen. Bevor wir daher zu getriebenen,
anharmonischen Schwingungen kommen, wollen wir dies teilweise nachholen. Der
Grund dafür, daß wir die Diskussion bis zu diesem Punkt verschoben haben,
liegt darin, daß uns in der Analyse Differentialgleichungen begegnen werden, die
mit dem, was wir im Abschnitt über den gedämpften, getriebenen, harmonischen
Oszillator kennen gelernt haben, sehr einfach zu lösen sind. Wir betrachten also den Fall, daß die “Zusatzkraft” h(x, ẋ, t) zeitunabhängig ist und die Form
h(x) = f (x)/m hat, d.h. die Differentialgleichung ẍ + ω0 x = f (x)/m. Weiterhin sei die Zusatzkraft “klein”, d.h. es gelte 0 < 1. Wir untersuchen somit
erneut die ungedämpfte Bewegung eines Teilchens in einem Potential, das im Bereich kleiner |x| nur schwach vom harmonischen Potential abweicht und dessen
Gesamtenergie (konservatives System, die Gesamtenergie ist erhalten!) nur leicht
oberhalb des Minimums des Potentials bei x = 0 liegt. Aus unseren obigen Überlegungen ist klar, daß das Teilchen eine periodische Bewegung ausführen wird,
diese im Allgemeinen jedoch nur durch numerische Integration zu gewinnen ist.
Hier werden wir anders vorgehen und versuchen eine Lösung als Potenzreihe in 9
Die physikalischen Einheiten werden vernachlässigt.
154
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
zu konstruieren (0 < 1)
x(t) = x0 (t) + x1 (t) + 2 x2 (t) + . . . ,
mit zu bestimmennden Funktionen xi (t), i = 0, 1, 2, . . .. Dieses Vorgehen bezeichnet man als Störungstheorie. Verfahren dieser Art spielen in allen Teilbereichen
der Physik eine extrem wichtige Rolle. Wir wollen die Prozedur anhand des konkreten Beispiels mit quartischem Zusatzterm zum Potential bx4 /4 (bzw. kubischer Zusatzkraft −bx3 ) einführen. Dabei kann b positive oder negative Werte
annehmen, wobei letzteres der Fall ist, wenn das Fadenpendel bei kleinen Auslekungen betrachtet wird. Einsetzen der Potenzreihenentwicklung in die Bewegungsgleichung ẍ + ω02 x = −bx3 /m liefert
(ẍ0 + ω02 x0 ) + (ẍ1 + ω02 x1 ) + . . . = −
b 3
x + ... ,
m 0
wobei die Punkte für Terme stehen, die mindestens von der Größenordnung 2
sind. Man kann jetzt die Terme zu gleichen Potenzen in gleich setzen (Koeffizientenvergleich; siehe Mathematikteil) und erhält bis zur Ordnung ẍ0 + ω02 x0 = 0
ẍ1 + ω02 x1 = −
b 3
x .
m 0
Um beispielsweise das Anfangswertproblem mit x(0) = A, ẋ(0) = 0 zu lösen,
berechnet man zunächst x0 (t) aus der ersten Gleichung und dann x1 (t) mit Hilfe
der zweiten. Für die vorgegebenen speziellen Anfangsbedingungen gilt
x0 (t) = A cos (ω0 t) .
Wegen cos3 y = [cos (3y) + 3 cos y]/4 folgt als Gleichung für x1 (t)
ẍ1 + ω02 x1 = −
A3 b
[cos (3ω0 t) + 3 cos (ω0 t)] .
4m
Sie ist von dem Typ, der bei der Lösung der getriebenen harmonischen Bewegung
auftritt, hier jedoch mit zwei cosinusförmigen Inhomogenitäten. Mit der oben
diskutierten allgemeinen Lösung und den Anfangsbedingungen x1 (0) = 0, ẋ1 (0) =
0 (“echte” Anfangsbedingungen sind schon durch x0 (0) und ẋ0 (0) realisiert) folgt
x1 (t) =
3A3 b
A3 b
[cos
(3ω
t)
−
cos
(ω
t)]
−
t sin (ω0 t) .
0
0
32mω02
8mω0
Durch die “resonante” Inhomogenität ∼ cos (ω0 t) ist dabei der mit der Zeit linear anwachsende Term (sogenannter säkularer, d.h. nicht-periodischer Term)
entstanden. Das Auftreten dieses Terms steht im Widerspruch zu dem Ergebnis, daß die durch x(t) = x0 (t) + x1 (t) + . . . beschriebene Bewegung periodisch
3.4. EIN TEILCHEN IN EINER DIMENSION
155
sein muß. Historisch trat ein ähnliches Problem in der Himmelsmechanik auf, als
man versuchte kleine Korrekturen zu den Planetenbahnen zu berechnen. Man
könnte damit geneigt sein, das vorgeschlagene Vorgehen (Störungstheorie) als
unbrauchbar zu verwerfen. Es ist jedoch leicht zu verstehen, wie es zu dem in t
linearen Term kommt und es gibt eine etablierte Prozedur sein Auftreten zu verhindern. Der Grund für das Auftreten des säkularen Terms ist die Verschiebung
der Kreisfrequenz der periodischen Bewegung Gl. (3.10) durch die Zusatzkraft,
die ebenfalls von der Ordnung ist. Man kann sein Auftreten verhindern, in dem
man vor der Analyse eine Skalentransformation ausführt, d.h. von der Variablen
t zu u = νt, mit der noch zu bestimmenden Kreisfrequenz ν übergeht. Diese wird
die Bedeutung der exakten Schwingungsfrequenz annehmen. Wir betrachten also
die Funktion
g(u) = g(νt) = x(t) ,
die wegen (Kettenregel; Strich bedeutet Ableitung nach u)
ẋ(t) = g 0 (u)
du
= ν g 0 (u) , ẍ(t) = ν 2 g 00 (u)
dt
der Differentialgleichung (mit allgemeiner Zusatzkraft f )
ν 2 g 00 (u) + ω02 g(u) = f (g(u))/m
genügt. Wie zuvor entwickelt man g(u) in einer Potenzreihe in g(u) = g0 (u) + g1 (u) + 2 g2 (u) + . . .
und zusätzlich auch ν
ν = ω0 + ν1 + 2 ν2 + . . . ,
wobei wir bereits ausgenutzt haben, daß zu nullter Ordnung in , ν = ω0 gilt.
Entwickelt man g und ν bis zur Ordnung erhält man nach Einsetzen der Entwicklungen in die Bewegungsgleichung für g(u)
(ω02 + 2ω0 ν1 )(g000 + g100 ) + ω02 (g0 + g1 ) = f (g0 )/m .
Koeffizientenvergleich liefert dann für unser konkretes Beispiel der kubischen Zusatzkraft
ω02 (g000 + g0 ) = 0
ω02 (g100 + g1 ) + 2ω0 ν1 g000 = −
b 3
g .
m 0
Unter Berücksichtigung der obigen Anfangsbedingungen folgt für g0 (u) die Lösung
g0 (u) = A cos u .
156
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Eingesetz in die zweite Gleichung ergibt sich
3A3 b
A3 b
2 00
ω0 (g1 + g1 ) = 2ω0 ν1 A −
cos u −
cos (3u) .
4m
4m
Der “resonannte” Summand ∼ cos u würde nun erneut zu einem säkularen Term
führen, den wir jedoch durch die geeignete Wahl von ν1 unterdrücken können.
Wir wählen daher
2ω0 ν1 A −
3A2 b
3A3 b
= 0 ⇒ ν1 =
.
4m
8mω0
Die verbleibenden Gleichung lösen wir wie zuvor und erhalten
g1 (u) =
A3 b
[cos (3u) − cos u] .
32mω02
Zusammengenommen erhalten wir ausgedrückt durch die Variable t bis zur Ordnung A3 b
3A2 b
A2 b
cos (νt) + cos (3νt) ; ν = ω0 1 + .
x(t) = A 1 − 32mω02
32mω02
8mω02
Die Bewegung ist jetzt periodisch, wie es zu fordern war. Dabei tritt die Grundfrequenz ν aber auch die höhere Harmonische 3ν auf. Die Verschiebung der Kreisfrequenz zur Ordnung ist identisch zu der in Gl. (3.10) bestimmten wenn man die
lineare Kraft über die Wahl c = mω02 gleich wählt und für die kubische Kraft über
b = 4χ. Die Abschätzung des Fehlers, den man bei der obigen Prozedur macht
stellt sich als erstaunlich komplex heraus und wir wollen diese Frage hier nicht
weiter untersuchen. Wir nehmen den pragmatischen Standpunkt ein, daß der
Vergleich der numerische Lösung der vollen Bewegungsgleichung mit kubischer
Zusatzkraft mit der obigen Näherung sich für kleine als sehr gut herausstellt
und wir mit der Näherung daher eine gute analytische Approximation gefunden
haben.
Wir gehen nun zur Bewegung mit nicht-linearer “Rückstellkraft”, Dämpfung
und cosinusförmigen treibenen Kraft über.
Resonanz in gedämpften, getriebenen, nicht-linearen Systemen: Die
Physik der gedämpftem, getriebenen, nicht-linearen mechanischen Systeme ist
sehr reichhaltig. Wir werden zunächst von einer allgemeinen Perspektive aus das
Phänomen der Resonanz in nicht-linearen Systemen betrachten. Wir hatten gesehen, daß das Amplitudenquadrat der schwach gedämpften, cosinusförmig getriebenen harmonischen Oszillation nach dem Einschwingvorgang und für ω ≈ ω0
näherungsweise durch (siehe Gl. (3.13); f = h0 /[2ω0 ])
A2 ≈
f2
(ω − ω0 )2 + γ 2
3.4. EIN TEILCHEN IN EINER DIMENSION
157
gegeben ist. Weiterhin haben wir uns davon überzeugt, daß bei Vorliegen einer
Anharmonizität die Frequenz der Bewegung von der Amplitude der Auslenkung
abängt und sich im Spezialfall einer “kleinen” (führende Ordnung) kubischen
“Zusatzkraft” gemäß (siehe Gl. (3.10))
ω0 → ω0 + κA2
verschiebt, wobei κ positive und negative Werte annehmen kann. Um ein Verständnis von Resonanz bei nicht-linearen Systemen zu erhalten machen wir die intuitive
Näherung
A2 =
f2
,
(ω − ω0 − κA2 )2 + γ 2
in dem wir ω0 durch die neue amplitudenabhängige Resonanzfrequenz ersetzen.
Aus dieser impliziten Gleichung muß nun A2 (ω) bestimmt werden. Am Einfachsten geht das, in dem wir zunächst nach ω − ω0 aufösen
p
ω − ω0 = κA2 ± (f /A)2 − γ 2 .
Um reelle ω − ω0 zu erhalten muß A2 ≤ (f /γ)2 gelten, was bei hinreichend
schwacher Dämpfung (kleine γ) sicherlich erreicht werden kann. Man kann nun
ω−ω0 als Funktion von A2 zeichnen. Dazu führen wir die dimensionslosen Größen
x = (ω−ω0 )/γ, y = (Aγ/f )2 und η = f 2 κ/γ 3 ein, wodurch sich die darzustellende
Gleichung zu
p
x = ηy ± 1/y − 1
vereinfacht. Dabei ist η (über κ) ein Maß für die Nichtlinearität der Schwingung.
Die Gleichung ist in der folgenden Abbildung für drei Werte von η ≥ 0, η = 0 (gepunktet; harmonischer Oszillator), η = 1 (gestrichelt) und η = 4 (durchgezogen)
dargestellt.
158
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
C
1
B
0.8
y
0.6
0.4
D
0.2
A
0
-4
E
-2
0
x
2
4
Für eine hinreichend große Nichtlinearität gibt es einen Bereich mit drei Lösungen
für A(ω)2 (Bereich zwischen den vertikalen Linien). Anders ausgedrückt, gibt
es für treibende Frequenzen in diesem Bereich drei Grenzzyklen (Attraktoren).
Welcher erreicht wird, hängt von den Anfangswerten ab. Der Kurvenabschnitt
CD entspricht dabei einem instabilen Attraktor. Man kann das Auftreten zweier
stabiler Werte für die Amplitude auch als Abhängigkeit von der Vorgeschichte des
Systems verstehen. Wir betrachten dazu ein “Experiment” in dem die Frequenz
ω (d.h. x) der treibenden Kraft zeitlich langsam erhöht wird. Beginnt man beim
Punkt A, so wandert man über B zum Punkt C. Bei weiterer Erhöhung ändert
sich die Amplitude der Bewegung schlagartig und “fällt” auf den Punkt E. Von
dort an geht es auf der unteren Kurve weiter. In umgekehrte Richtung bleibt die
Amplitude bis zum Punkt D auf der unteren Kurve, springt dann zu B und nimmt
anschließend entlang der Kurve von B nach A ab. In der Vorlesung wird eine
Simulation gezeigt,10 die das Beschriebene für den ersten Pfad (beginnend bei A)
verdeutlicht. Verglichen zu dem Verhalten im Fall der nicht-linearen Schwingung
ist das ebenfalls dargestellte Verhalten im cosinusförmig getriebenen, gedämpften,
harmonischen Oszillator recht langweilig. Ein in der Simulation (Programmpaket
von Herr Lohöfer; siehe L2 P) “gemessenes” Diagramm der Amplitude gegenüber
der Frequenz der treibenden Kraft ist folgend dargestellt. Es zeigt das aus unserer
analytischen Rechnung extrahierte Verhalten.
10
Zu finden ist diese unter
http://www.physik.uni-oldenburg.de/ftheorie/polley/VL/Animationen/Duffing.html.
Eine weitere Simulation dazu findet sich im Programmpaket von Herrn Lohöfer (siehe L2 P).
3.4. EIN TEILCHEN IN EINER DIMENSION
159
Es sei hier noch erwähnt, daß man den cosinusförmig getriebenen, gedämpften
Oszialltor mit kubischer “Zusatzkraft” (quartischer Anharmonizität im Potential)
als Duffing-Oszillator bezeichnet.
Hin zum Chaos: Um einen Eindruck von der Reichhaltigkeit nicht-linearer getriebener Systeme zu bekommen, betrachten wir abschließend das gedämpfte,
cosinusförmig getriebene Fadenpendel, dessen Auslenkwinkel der Bewegungsgleichung (siehe oben)
φ̈ + 2γ φ̇ +
g
sin φ = h0 cos (ωt) ,
R
folgt. Zunächst führen wir erneut eine Skalentransformation aus
θ(u) = θ(τ t) = φ(t) ,
woraus sich die Gleichung (Strich entspricht Ableitung nach u)
τ 2 θ00 + 2γτ θ0 +
g
sin θ = h0 cos (ωu/τ ) ,
R
ergibt. Durch die Wahl τ 2 = g/R folgt
θ00 + θ0 /q + sin θ = g̃ cos (ωD u) ,
wodurch wir einen der Parameter eleminiert haben. Dabei ist q = τ /(2γ) ein Maß
für die Reibung, wobei diese Abnimmt, wenn q zunimmt, g̃ = h0 /τ 2 ein Maß für
die Amplitude der treibenden Kraft und ωD = ω/τ ein Maß für deren Frequenz.
160
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Im Folgenden bezeichnen wir die skalierte Zeit wieder mit t und die dimensionlose
Amplitude der treibenden Kraft mit g (statt g̃).
Für allgemeinen Parameter kann man die Bahnkurve θ(u) und die Phasenraumtrajektorie nur noch durch numerische Integration bestimmen. Geschrieben
als ein System zweier Differentialgleichungen erster Ordnung gilt mit Ω = θ0
θ0 = Ω ,
Ω0 = −Ω/q − sin θ + g cos (ωD u) .
Im Folgenden beschränken wir uns auf die Situation mit ωD = 2/3 und q = 2.
Die Amplitude der treibenden Kraft g wird im Bereich um g = 1 herum gewählt.
Selbst unter diesen Einschränkungen zeigt sich bereits die Reichhaltigkeit der
Bewegungsformen der nicht-linearen, getriebenen Schwingungen. Für g / 1 wird
die Bewegung nach dem Einschwingvorgang periodisch mit einer durch ωD gegebenen Frequenz. Im Phasenraum laufen alle Trajektorien auf einen geschlossenen
Grenzzyklus. In den folgenden Abbildungen (g = 0.9) ist einerseits der Winkel θ
als Funktion der Zeit t und andererseits eine Phasenraumtrajektorie dargestellt.
Bei beiden Graphen ist die Anfangszeit ta bei der die Darstellung beginnt so
gewählt, daß alle Einschwingvorgänge bereits abgeschlossen sind, d.h. eine periodische Bewegung (Grenzzyklus im Phasenraum) erreicht ist. Die Lösung der
Differentialgleichung beginnt bei t = 0 mit den Anfangsbedingungen θ = 0 = θ0 .
Für etwas größere g ist die Bewegung nach Aussterben der Transienten weiterhin
periodisch, jedoch mit einer Periode, die doppelt so groß ist wie die der treibenden
Kraft. Diese Situation ist in den folgenden Abbildung (g = 1.07) dargestellt
(Winkel als Funktion der Zeit und Phasenraumtrajektorien nach Abklingen der
Transienten; Anfangsbedingungen wie oben).
3.4. EIN TEILCHEN IN EINER DIMENSION
161
Die Periodenverdopplung ist in der Amplitude der Auslenkung (abwechselnde maximale Auslenkung) zu erkennen. Um diese besser herauszuarbeiten, führen wir
eine neue Darstellungsform der Bewegung ein, den Poincaré-Schnitt. Bei diesem
erstellt man ein stroboskopisches Bild der Phasenraumtrajektorie. Sinnvollerweise
wählt man in unserem Beispiel T = 2π/ωD als Zeitabstand zwischen zwei Bildern.
Im ersten Fall der periodischen Bewegung mit Frequenz ωD (nach Abklingen der
Transienten) fallen alle Bilder aufeinander und der Poincaré-Schnitt besteht aus
einem Punkt. Nach der Periodenverdopplung besteht er aus zwei Punkten. Dies
ist in den folgenden Abbildungen für die obigen g gegenüber gestellt. Im Winkel
wurde dabei modulo 2π gerechnet, d.h. alles auf Intervall (−π, π] zurückgefaltet.
Vergrößert man g weiter (genauer 1.085 < g < 1.11), so geht die Bewegung
in ein Regime über, welches man als chaotisch bezeichnet. Die Zeitabhängigkeit
162
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
des Winkels sieht in diesem Fall erratisch aus, die Phasenraumtrajektorien (auf
(−π, π] zurückgefaltet) sind komplex und der Poincaré-Schnitt besteht aus unendlich vielen Punkten und ist selbstähnlich. Letzteres bedeutet, daß ein vergrößerter
Teilausschnitt der Struktur, der ursprünglichen ähnlich sieht. Die Punktmenge
nennt man ein Fraktal. Die folgenden Abbildungen zeigen die diskutierten Punkte für g = 1.15 (wo das System ebenfalls chaotisch ist).
Wenn man g weiter erhöht, treten abwechselnd periodische und chaotische Bereiche auf. In den periodischen Bereichen gibt es neben den Periodenverdoppelungen auch Periodenvervierfachungen. Der Poincaré-Schnitt für solch eine Situation
(g = 1.47) ist in der folgenden Abblidung dargestellt.
3.5. KRUMMLINIGE KOORDINATEN
163
Für g > 1.497 gibt es nur noch chaotische Bewegungen. Alle obigen Abbildungen
wurden mit dem Programmpaket von Herrn Lohöfer (siehe L2 P) erstellt.
In der Vorlesung wird das gerade diskutierte zusätzlich anhand von Simulationen zur Bewegung des gedämpften, getriebenen Fadenpendels veranschaulicht.
Diese kann man ebenfalls mit dem Programmpaket von Herrn Lohöfer erstellen.
Es bietet sich an, mit diesem “herumzuspielen”, um die Reichhaltigkeit der Dynamik der hier besprochenen nicht-linearen Systeme besser zu verinnerlichen.
Nach diesem Ausflug in moderne Aspekte der klassischen Mechanik (nichtlineare Systeme, Chaos-Theorie) wollen wir zu konventionellerem Stoff einer Mechanikvorlesung zurückkehren und gehen zu zweidimensionalen Bewegungen eines
Teilchens über.
3.5
Krummlinige Koordinaten
Schon anhand des (scheinbar) einfachen Falls der eindimensionalen Bewegung
eines Teilchens in einem konservativen Kraftfeld haben wir gesehen, daß sich
die Newtonsche Gleichung meist nur numerische lösen läßt. Betrachtet man die
Bewegung eines Teilchens welches einer konservativen Kraft ausgesetzt ist in zwei
Dimensionen, so verschärft sich diese Problematik weiter. Die zwei gekoppelten
Differentialgleichungen zweiter Ordnung, bzw. das äquivalente System von vier
Gleichungen erster Ordnung, lassen sich für ein allgemeines Potential V (x1 , x2 )
nur numerisch lösen. Eine geschlossene analytische Lösung gelingt in dem Fall,
daß V eine quadratische Form
V (x1 , x2 ) =
2
1 X
xi ai,j xj
2 i,j=1
164
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
ist, eine Situation, die uns an den harmonischen Oszillator in einer Dimension
erinnert. Wir werden darauf später zurück kommen.
Ein weitere Klasse von Kräften, für die die Bewegungsgleichungen auf einfache Integrale reduziert werden kann (d.h. die geschlossen
integrierbar sind),
p
2
2
sind Zentralfelder, in denen V nur von r = |~r| = x1 + x2 abhängt. In diesem
Fall ist die Verwendung kartesischer Koodinaten umständlich. Es ist besser ebene
Polarkoordinaten
x1 = r cos φ ,
x2 = r sin φ
zu verwenden, die uns bereits im Beispiel des Fadenpendels begegnet sind. Weiterhin haben sie in einer Übungsaufgabe dreidimensionale Kugelkoordinaten kennen gelernt. Aufbauend darauf wollen wir hier gleich etwas allgemeiner vorgehen
und führen sogenannte krummlinige Koordinaten für zwei- oder dreidimensionale
Räume ein. Diese werden sich häufig als sehr nützlich bei der Lösung mechanischer Probleme erweisen und ermöglichen es uns einen ersten Kontakt zum
Lagrange Formalismus herzustellen.
Ausgangspunkt ist unser kartesisches Koordinatensystem [0; ~e1 , . . . , ~ed ] mit
(d = 2, 3)
~r =
d
X
xi~ei .
i=1
Die eindimensionalen geometrischen Objekte die entstehen, wenn man eine der
Koordinaten xi variiert, während die anderen festgehalten werden sind Geraden
(“xi -Kurven”). Zeichnet man solche Geraden in einem festen Abstand ∆xi so
entsteht ein Koordinatennetz. Dies ist für d = 2 in der folgenden Abbildung
dargestellt.
x2
e2
e1
x1
Alternativ können wir den Raum mit einem Netz krummliniger Koordinaten
überziehen, die wir allgemein mit qi (i = 1, 2 bzw. i = 1, 2, 3) bezeichnen. Die
3.5. KRUMMLINIGE KOORDINATEN
165
“geraden xi -Kurven” werden dann durch qi -Kurven ersetzt. Für den Fall der ebenen Polarkoordinaten (q1 = r, q2 = φ) ist dies in der folgenden Skizze dargestellt.
x2
x1
Die r-Kurven (entlang derer φ konstant ist) sind Geraden die durch den Ursprung
gehen und die φ-Kurven (entlang derer r konstant ist) konzentrische Kreise um
den Ursprung.
Das krummlinige Koordinatensystem ist durch die Vorgabe der Funktionen
(hier d = 3)
xi = xi (q1 , q2 , q3 ) ,
i = 1, 2, 3
bzw. der Umkehrfunktionen
qi = qi (x1 , x2 , x3 ) ,
i = 1, 2, 3
1 ,x2 ,x3 )
höchstens
gegeben, wobei wir annehmen, daß die Funktionaldeterminante ∂(x
∂(q1 ,q2 .q3 )
in speziellen Punkten Null werden kann (bei Polar- und Kugelkoordinaten z.B. im
Ursprung). Damit ist die (lokale) Umkehrbarkeit bis auf diese Punkte gesichert
(siehe Mathematikteil).
In einem gegebenen Punkt P (durch (x1 , x2 , x3 ) oder (q1 , q2 , q3 ) festgelegt)
definieren wir nun Basisvektoren ~gi (P ) mittels
~gi (P ) =
∂~r
,
∂qi
(3.14)
die die qi -Kurven im Punkt P tangieren. Zu jedem Punkt P (q1 , q2 , q3 ) gehört
somit ein “Vektordreibein” ~gi (q1 , q2 , q3 ), welches die qi -Koordinatenkurven tangiert. Die so definierten ortsabhängigen Basissysteme sind im Allgemeinen nicht
orthonormiert!
166
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Wir wollen uns diese Konstruktion anhand des Beispiels der ebenen Polarkoordinaten verdeutlichen. Es gilt
∂
∂~r
=
(r cos φ ~e1 + r sin φ~e2 )
∂r
∂r
= cos φ ~e1 + sin φ ~e2 = ~r/r
= ~rˆ ,
∂~r
∂
=
=
(r cos φ ~e1 + r sin φ ~e2 )
∂φ
∂φ
= −r sin φ ~e1 + r cos φ ~e2 = r [cos (φ + π/2) ~e1 + sin (φ + π/2) ~e2 ]
~ˆ ,
= rφ
~g1 =
~g2
~ˆ (siehe Abschnitt
wobei wir die beiden orthonormierten Einheitsvektoren ~rˆ und φ
über das Fadenpendel) eingesetzt haben und ausgenutzt haben, daß
~ˆ = cos (φ + π/2) ~e1 + sin (φ + π/2) ~e2 .
φ
Wie man nun sieht, sind ~g1 und ~g2 im vorliegenden Beispiel zwar noch orthogonal,
~ˆ nicht auf Eins normiert.
aber g2 ist im Gegensatz zu φ
Als nächstes wollen wir die Frage beantworten, ob es sich bei den ~gi allgemein
um linear unabhängige Vektoren handelt und sie damit überhaupt eine Basis
bilden. Für den Fall der ebenen Polarkoordinaten haben wir uns bereits davon
überzeugt (die ~gi stehen in diesem Beispiel senkrecht aufeinander). Allgemein
betrachten wir dazu
d
d
X
∂~r
∂ X
∂xj
~gi =
=
xj ~ej =
~ej
∂qi
∂qi j=1
∂qi
j=1
und können schließen, daß die Basisvekoren genau dann linear unabhängig sind,
wenn die Funktionaldeterminante von Null verschieden ist, was wir (bis auf spezielle Punkte) angenommen haben. Um die Umkehrrelation (Entwicklung von ~ei
nach den ~gj ) zu bestimmen betrachten wir
d
d
X ∂~r ∂qj
X ∂qj
∂~r
=
=
~gj .
~ei =
∂xi
∂qj ∂xi
∂xi
j=1
j=1
In ihr tritt somit die Inverse der Matrix mit den Matrixelementen ∂qj /∂xi auf.
Wie man leicht nachrechnet, ergeben sich für Kugelkoordinaten mit
x1 = r sin θ cos φ ,
x2 = r sin θ sin φ ,
x3 = r cos θ
3.5. KRUMMLINIGE KOORDINATEN
167
die zwar paarweise senkrechten aber nicht auf Eins normierten Basisvektoren
~g1 = ~gr = sin θ cos φ ~e1 + sin θ sin φ ~e2 + cos θ ~e3 = ~er ,
~g2 = ~gθ = r cos θ cos φ ~e1 + r cos θ sin φ ~e2 − r sin θ ~e3 = r~eθ ,
~g3 = ~gφ = −r sin θ sin φ ~e1 + r sin θ cos φ ~e2 = r sin θ ~eφ ,
wobei wir die orthonormierten Vektoren ~er , ~eθ , ~eφ eingeführt haben, die sie in
einer Übungsaufgabe kennen gelernt haben (selbe Notation). Um die Länge der
Basisvekoren und deren paarweise Winkel zu bestimmen betrachten wir die Skalarprodukte
gi,j
d
d
X
X
∂xl
∂xk ∂xk
∂xk
~ek ·
~el =
.
= ~gi · ~gj =
∂q
∂q
∂q
i
j
i ∂qj
k=1
k,l=1
Man nennt die Matrix G mit den Matrixelementen gi,j den Metriktensor. Dieser
wird in späteren Überlegungen eine wichtige Rolle spielen.
Unsere Überlegungen zu krummlinigen Koordinaten wollen wir dazu benutzen eine alternative Formulierung der Newtonschen Gleichung zu finden. Wir
wollen dazu zunächst den Geschwindigkeitsvektor ~v (t) = ~r˙ (t) durch die q̇i und ~gi
ausdrücken. Dazu betrachten wir
d
d
X
X
∂~r
q̇i =
q̇i ~gi .
~v (t) =
∂qi
i=1
i=1
Betrachtet man ~v nun als Funktion der qi und q̇i so folgt
∂~v
= ~gi ,
∂ q̇i
(3.15)
ein Ergebnis, welches wir gleich benutzen werden. Wir betrachten die Newtonsche Gleichung für ein Teilchen p~˙ = F~ . Um aus dieser die Gleichungen für die
kartesischen Koordinaten x1 , x2 , x3 zu erhalten, können wir sie mit ~ei skalar multiplizieren. Um die Newtonschen Gleichungen für die krummlinigen Koordinaten
zu erhalten, gehen wir analog vor, müssen aber beachten, daß die Basisvektoren
~gi zeitabhängig sind. Es gilt
m~gi ·
d~v
= ~gi · F~ .
dt
Wir addieren auf beiden Seiten den Term m~g˙ i · ~v und erhalten so
m
d
(~gi · ~v ) = ~gi · F~ + m~v · ~g˙ i .
dt
168
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Auf der linke Seite dieser Gleichung verwenden wir Gl. (3.15) und auf der rechten
Gl. (3.14) was auf
d ∂~v
d ∂~r
m
· ~v = ~gi · F~ + m~v ·
dt ∂ q̇i
dt ∂qi
führt. Im zweiten Summanden auf der rechten Seite können wir die Reihenfolge
der Ableitung nach t und der partiellen Ableitung nach qi vertauschen, da
d
d
X ∂ 2~r
X ∂
∂ ˙
d ∂~r
=
q̇j =
(~gj q̇j ) =
~r .
dt ∂qi
∂qj ∂qi
∂qi
∂qi
j=1
j=1
Damit ergibt sich für die obige Gleichung
d ∂~v
∂~v
· ~v = ~gi · F~ + m~v ·
.
m
dt ∂ q̇i
∂qi
Die Terme, die die Geschwindigkeit enthalten, können wir als partielle Ableitungen der kinetischen Energie T = mv 2 /2 schreiben
∂T
d ∂T
= ~gi · F~ +
.
(3.16)
dt ∂ q̇i
∂qi
Dies ist eine sehr bequeme Schreibweise der Newtonschen Gleichung in krummlinigen Koordinaten. Betrachten wir den Fall, daß die qi die kartesischen xi sind,
also qi = xi , so ergeben sich aus dieser Gleichung die gewöhnlichen Bewegungsgleichungen der kartesischen Koordinaten, da
∂T
∂T
=
= mvi
∂ q̇i
∂vi
und
∂T
∂T
=
=0.
∂qi
∂xi
In allgemeinen krummlinigen Koordinaten gilt
d
d
m 2 m X
m X
(q̇i~gi ) · (q̇j ~gj ) =
gi,j q̇i q̇j ,
T =
v =
2
2 i,j=1
2 i,j=1
d
X
∂T
= m
gi,j q̇j .
∂ q̇i
j=1
mit den Komponenten gi,j des Metriktensors.
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
169
Für den Fall eines konservativen Kraftfeldes kann der Term in Gl. (3.16) der
die Kraft enthält umgeschrieben werden
~ ~r V ·
~gi · F~ = −∇
∂V
∂~r
=−
,
∂qi
∂qi
und somit
d
dt
∂T
∂ q̇i
=
∂(T − V )
.
∂qi
Da das Potential nicht von den q̇i abhängt können wir
∂L
d ∂L
, L=T −V
=
dt ∂ q̇i
∂qi
(3.17)
schreiben. Dies ist die Lagrange-Form der Bewegungsgleichung, die wir später
ausführlich diskutieren werden. Man bezeichnet L = T − V als die Lagrangefunktion. Die Größe pi = ∂L/∂ q̇i heißt der kanonische Impuls. Für kartesische
Koordinaten wird der kanonische Impuls gleich dem gewöhnlichen Impuls.
3.6
Zweidimensionale Zentralfelder
Wir wollen nun das Problem der zweidimensionalen Bewegung
p eines Teilchens in
einem konservativem Zentralfeld mit Potential V (r), r = x21 + x22 untersuchen.
Dazu verwenden wir als krummlinige Koordinaten die ebenen Polarkoordinaten,
folgen aber im Gegensatz zu dem Abschnitt über des Fadenpendel dem allgemeinen Formalismus den wir gerade entwickelt haben. Die Basisvektoren sind nach
den obigen Überlegungen
~g1 = ~gr = cos φ ~e1 + sin φ ~e2 ,
~g2 = ~gφ = −r sin φ ~e1 + r cos φ ~e2
und für die Komponenten des Metriktensors ergibt sich
g1,1 = 1 , g2,2 = r2 , g1,2 = g2,1 = 0 .
Die Außerdiagonalelemente verschwinden, da die Basisvektoren in diesem Fall
senkrecht aufeinander stehen (siehe oben). Damit folgt für die kinetische Energie
in Polarkoordinaten
T =
d
m
m X
q̇i q̇j gi,j = (ṙ2 + r2 φ̇2 ) .
2 i,j=1
2
170
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Um die Bewegungsgleichungen in der Lagrange-Form zu bekommen, benötigen
wir die folgenden partiellen Ableitungen
∂T
∂T
∂T
∂T
= mr2 φ̇ ,
= mṙ ,
= mrφ̇2 ,
=0.
∂ ṙ
∂r
∂φ
∂ φ̇
Mit diesen ergeben sich die zwei Bewegungsgleichungen
∂V
d
(mṙ) = mr̈ = mrφ̇2 −
dt
∂r
d
∂V
(mr2 φ̇) = −
.
dt
∂φ
Der erste Term auf der rechten Seite der Gleichung für r̈ ist die Zentrifugalkraft
die wir im nächsten Semester in dem Kapitel über beschleunigte Bezugssysteme
ausführlich diskutieren werden.
Für Zentralfelder gilt ∂V /∂φ = 0 und die zweite Gleichung liefert die Erhaltungsgröße11
mr2 φ̇ = const. = l .
Die Größe r2 φ̇ hat (für l 6= 0) eine geometrische Bedeutung, die wir uns veranschaulichen wollen. Die im Zeitintervall [t0 , t] vom Ortsvektor ~r(t) überstrichene
Fläche bezeichnen wir mit S(t). Die überstrichene Fläche für ein Zeitintervall der
Größe ∆t ist ∆S = S(t + ∆t) − S(t). Diese ist in der folgenden Skizze dargestellt.
r(t)∆φ
r(t+∆ t)
∆φ
r(t)
In führender Ordnung in ∆t gilt
1
1
∆S = r rφ̇∆t + O([∆t]2 ) = r2 φ̇∆t + O([∆t]2 )
2
2
Mit dem obigen Erhaltungssatz ergibt sich, daß die Flächengeschwindigkeit dS/dt
zeitlich konstant ist
dS
1
l
= r2 φ̇ = const. =
.
dt
2
2m
11
Diese wird sich als die ~e3 -Komponente des Drehimpuls herausstellen, weshalb wir sie bereits
hier mit l bezeichnen.
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
171
Somit werden in gleichen Zeiten gleiche Flächen überstrichen. Dies ist das zweite
Keplersche Gesetz. Es handelt sich dabei um eine Manifestation der Drehimpulserhaltung, was wir folgend genauer analysieren wollen.
Wir betrachten ein dreidimensionales Zentralpotential V (r). Das zugehörige
˙
Kraftfeld hat dann die Richtung ~r und es gilt ~l = ~r × F~ = 0, d.h. der Drehimpuls
ist erhalten ~l(t) = ~l0 . Die Gleichung ~l · ~r = (~r × p~) · ~r = 0 ist für ~l(t) = ~l0 die
Bestimmungsgleichung für die Ebene durch den Ursprung, die die Bahn des Teilchens {~r(t)} enthält. Wählt man also ~e3 ∼ ~l0 so findet die Bewegung in einem
dreidimensionalen Zentralpotential in der x1 -x2 -Ebene statt. Somit wird die Beschreibung der Bewegung in einem dreidimensionalen Zentralpotential äquivalent
zu der Beschreibung in zwei Dimensionen. In der x1 -x2 -Ebene gilt
~r = r~gr , ~r˙ = ṙ~gr + φ̇~gφ
und damit für den Drehimpuls
~l = m~r × ~r˙ = mrφ̇ ~gr × ~gφ = mr2 φ̇ ~e3 .
Die Konstante l hat somit die Bedeutung von
l3 = mr2 φ̇ = l
und der Zusammenhang zwischen Drehimpulserhaltung und “Flächensatz” ist
hergestellt.
Bei l = 0 gilt für die Bewegung in der zweidimensionalen Ebene
r2 φ̇ = 0
woraus für r 6= 0,
φ = const.
folgt, d.h. die Bewegung entlang einer Geraden durch den Ursprung erfolgt. Dabei
gilt es zu beachten, daß beim Durchgang durch den Ursprung φ nach φ + π
übergeht.
Wir betrachten nun den Fall der zweidimensionalen Bewegung mit l 6= 0 und
verwenden neben der Erhaltung des Drehimpulses die Energieerhaltung. In der
Gesamtenergie E = T +V läßt sich der Term ∼ φ̇2 durch die Drehimpulserhaltung
l = mr2 φ̇ eleminieren
m 2
ṙ + r2 φ̇2 + V (r)
(3.18)
E =
2
m 2
l2
=
ṙ +
+ V (r) .
(3.19)
2
2mr2
172
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Man erhält somit dieselbe Form für die Energie wie für eine eindimensionale
Bewegung jedoch mit dem l-abhängigen effektiven Potential
Veff (r) = V (r) +
l2
.
2mr2
Im Unterschied zur echten eindimensionalen Bewegung kann r nur positive Werte
und die Null annehmen: r ≥ 0. Im obigen Ausdruck bezeichnet man die Größe
l2 /(2mr2 ) als die Zentrifugalenergie oder die Drehimpulsbarriere.
Um die Bewegung in zwei Dimensionen weiter zu charakterisieren, müssen wir
nun ein spezifisches Potential wählen. Folgend werden wir zwei Potentialtypen
untersuchen
V (r) = V0 (r/a)kV ,
V0 kV > 0 ,
kV > −2
und ein ideal reflektierendes (kreisrundes) Billard (R > 0)
0,
r≤R
V (r) =
∞,
r>R.
Beispiele für das effektive Potential, sowie seine Konstituenten, die in die erste
Klasse von Potentialen fallen, sind in den folgenden Skizzen dargestellt (A0 =
2ma2 V0 /l2 ).
Man erkennt, daß für kV > 0 für jeden möglichen Wert der Gesamtenergie E >
Emin eine finite Bewegung auftritt, während diese für −2 < kV < 0 für E < 0
finit, für E > 0 jedoch infinit ist. Ein Beispiel für die zweite Potentialklasse ist
folgend skizziert (A0 = 2mR2 V0 /l2 = 1).
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
173
In diesem Fall ist die Bewegung immer finit mit r(t) ≤ R. Wir werden die Beispiele später verwenden, um das jetzt diskutierte allgemeine Lösungsverfahren
zu veranschaulichen. Die Energieerhaltung Gl. (3.18) führt analog zum Fall der
eindimensionalen Bewegung in einem konservativen Kraftfeld auf die Beziehung
r
2
dr
=±
[E − Veff (r)] .
(3.20)
dt
m
Durch (im Allgemeinen numerische) Integration folgt daraus die Funktion t(r)
und durch (im Allgemeinen numerisches) Auflösen die gesuchte Funktion r(t).
Von den vier Anfangsbedingungen r(t0 ), φ(t0 ), ṙ(t0 ) und φ̇(t0 ) bestimmen r(t0 ),
ṙ(t0 ) und φ̇(t0 ) die Konstanten der Bewegung l und E, die in die obige Differentialgleichung (3.20) für r(t) eingehen. Somit hängt r(t) parametrisch von l, E und
r(t0 ) ab. Zur vollständigen Bestimmung der Bewegung benötigen wir noch die
Funktion φ(t). Diese folgt aus der Drehimpulserhaltung mr2 (t)φ̇(t) = l. Auflösen
und Integration liefert
Z t
l
r−2 (t0 ) dt0 .
(3.21)
φ(t) − φ(t0 ) =
m t0
Die beiden Schritte zur Berechung von r(t) und daraus φ(t) seien nun in einfachen
Grenzfällen und Beispielen näher erläutert.
Kreistrajektorie: In der ersten Klasse von Beispielpotentialen hat das effektive
Potential Veff ein Minimum bei r = r0 . Wählt man nun E = Veff (r0 ) so erfüllt
r(t) = r0 = const. die Energieerhaltung und die Bahnkurve ist ein Kreis um den
0
Ursprung. In diesem Fall gilt Veff
(r0 ) = 0, was bedeutet, daß sich die anziehende
Zentralkraft (Zentripetalkraft) und die Zentrifugalkraft gerade kompensieren
V 0 (r0 ) =
l2
= mr0 φ̇2 .
mr03
174
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Mit r(t) = r0 läßt sich das Integral in Gl. (3.21) trivial ausführen
φ(t) = φ(t0 ) +
l
(t − t0 ) = φ(t0 ) + φ̇(t0 ) (t − t0 )
mr02
und die Kreisbahn wird mit konstanter Winkelgeschwindigkeit φ̇(t0 ) = ωφ =
l/(mr02 ) durchlaufen.
Harmonische Näherung für r(t): Wählt man die Gesamtenergie nur ein wenig größer als Veff (r0 ), so ist die Bewegung in “r-Richtung” (für alle kV > −2,
kV 6= 0) finit. Weiterhin kann man Veff durch eine Parabel approximieren (Taylorentwicklung)
Veff (r) ≈ Veff (r0 ) +
1 00
V (r0 ) (r − r0 )2 .
2 eff
Damit ist das durch Gl. (3.20) gegebene Problem der Berechnung von r(t) analog zum eindimensionalen harmonischen Oszillator mit der allgemeinen Lösung
(r(t) ≥ 0)
r
00
Veff
(r0 )
r(t) = r0 + r0 cos (ωr t + δ) , ωr =
m
Der Abstand des Teilchens vom Ursprung r(t) ist eine periodische Funktion der
Zeit mit der Schwingungsdauer Tr = 2π/ωr . O.B.d.A. haben wir t0 = 0 gewählt.
Um φ(t) zu berechnen, verwenden wir, daß die Energie nur wenig vom Minimum
des effektiven Potentials abweicht, was bedeutet, daß 0 < 1 gilt. Damit
können wir r−2 (t) im Integranden von Gl. (3.21) linear in entwickeln. und
erhalten
Z t
l
(1 − 2 cos [ωr t0 + δ]) dt0 + O(2 )
φ(t) − φ(0) =
mr02 0
l
2
=
t−
[sin (ωr t + δ) − sin (δ)] + O(2 ) .
mr02
ωr
Die Bahnkurve liegt in einem Kreisring zwischen r0 (1 − ) und r0 (1 + ). Im
Allgemeinen werden die Bahnkurven nicht geschlossen sein. Um dies zu sehen,
betrachten wir den Winkel (∆φ)Tr der für eine Periode der Radialbewegung überstrichen wird. Für t = Tr ergibt sich
(∆φ)Tr =
ωφ
l
T = 2π
.
2 r
mr0
ωr
Nur falls (∆φ)Tr = 2πk/n, mit k, n ∈ N ist, d.h. die Frequenzen ωφ und ωr kommensurabel (rationales Verhältnis) sind, erhält man eine geschlossene Bahn. Für
irrationale Werte von ωφ /ωr sind die Bahnen offen. In den folgenden Abbildungen
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
175
sind Bahnkurven in der x1 -x2 -Ebene für r0 = 1 (d.h. x1 und x2 sind in Einheiten
von r0 angegeben), = 0.2 und verschiedene Verhältnisse ωφ /ωr skizziert.
ωφ/ωr=1+sqrt(2)/10
ωφ/ωr=1
1
x2
x2
1
0
0
-1
-1
-1
0
x1
-1
1
ωφ/ωr=1/5
1
ωφ/ωr=1/5+sqrt(2)/50
1
x2
1
x2
0
x1
0
-1
0
-1
-1
0
x1
1
-1
0
x1
1
Kreisbillard: In diesem Beispiel bewegt sich das Teilchen zwischen den Reflektionen an der
p harten Wand entlang von Geradenabschnitten (kräftefreie Bewegung
für r = x21 + x22 < R). Da die r-Bewegung in diesem Fall immer finit ist (siehe
oben), ergibt sich eine in “r-Richtung” periodische Bewegung. Die Periodendauer
in diese Richtung sei wieder mit Tr bezeichnet. Die Funktionen r(t) und φ(t) lassen sich über eine Periode der r-Bewegung auch ohne Integration angeben. Dazu
176
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
betrachten wir den Geradenabschnitt
x2 = v0 t , 0 ≤ |t| ≤ Tr /2
x1 = a < R ,
mit
Tr /2 =
√
R2 − a2 /v0 .
Damit folgt für das obige Zeitintervall
p
r(t) = a2 + (v0 t)2 , φ(t) = arctan (v0 t/a)
und man erhält für den in einer Periode der r-Bewegung überstrichenen Winkel
√
(∆φ)Tr = 2 arctan
R2 − a2 /a .
Ist (∆φ)Tr ein rationales Vielfaches von 2π so ist die Bahn geschlossen, andernfalls
nicht. In den folgenden Skizzen ist der Fall zweier geschlossener Bahnen (für
R = 1) skizziert.
(∆φ)T =2π/6
r
1
x2
1
x2
(∆φ)T =2π(3/5)
r
0
-1
0
-1
-1
0
x1
1
-1
0
x1
1
Allgemeines Zentralpotential: Wir kehren nun noch einmal zum allgemeinen
Fall des Zentralpotentials zurück. Ist man daran interessiert, die Bahnkurve ohne
ihren zeitlichen Durchlauf zu bestimmen, so kann man mit Hilfe von mr2 dφ/dt = l
die Zeit aus der Gl. (3.20) eleminieren
dφ
l
1
p
=±
.
2
dr
mr
2[E − Veff (r)]/m
Integration liefert
Z
r
φ − φmin = ±
rmin
l
p
dr0 .
02
0
r
2m[E − Veff (r )]
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
177
Wir werden bei der Behandlung des Keplerproblems mit V (r) = −α/r auf diese Beziehung zurück kommen. Der überstrichene Winkel während einer Schwingungsperiode von r(t) (falls die Bewegung in r-Richtung periodisch ist) ergibt
sich zu
Z rmax
l
p
dr0 .
(∆φ)Tr = 2
02
0
r
2m[E − Veff (r )]
rmin
Damit schließen wir unsere allgemeinen Überlegungen zur zweidimensionalen Bewegung in einem Zentralpotential–und dieses Semester–ab. Das kommende
Semster werden wir damit beginnen, daß gerade gelernte auf das “klassische”
Zweikörperproblem “Erde-Sonne” anzuwenden.

Zugehörige Unterlagen

UE 7

Einführung in die Theoretische Physik

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können