Einführung in die Theoretische Physik

Werbung
Skript zur Vorlesung
Einführung in die
Theoretische Physik
von Volker Meden
gehalten im Wintersemester 2015/2016
an der RWTH Aachen
26. Januar 2016
2
Inhaltsverzeichnis
1 Eine kurze Einführung
5
2 Mathematische Methoden
2.1 Einleitung . . . . . . . . . . . . . . . . . . . . .
2.2 Differentialrechnung einer Veränderlichen . . . .
2.3 Integralrechnung einer Veränderlichen . . . . . .
2.4 Logarithmus- und Exponentialfunktion . . . . .
2.5 Potenzreihen und Taylorentwicklung . . . . . .
2.6 Hyperbolische und trigonometrische Funktionen
2.7 Gewöhnliche Differentialgleichungen . . . . . . .
2.8 Komplexe Zahlen . . . . . . . . . . . . . . . . .
2.9 Vektorrechnung . . . . . . . . . . . . . . . . . .
2.10 Fourierreihen . . . . . . . . . . . . . . . . . . .
2.11 Vektorwertige Funktionen . . . . . . . . . . . .
2.12 Funktionen mehrerer Veränderlicher . . . . . . .
2.13 Matrizen . . . . . . . . . . . . . . . . . . . . . .
2.14 Das Eigenwertproblem . . . . . . . . . . . . . .
2.15 Systeme linearer Differentialgleichungen . . . . .
2.16 Die Integration im Rn . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
8
25
34
38
44
49
54
60
69
75
77
89
94
101
108
3 Newtonsche Mechanik Teil I
3.1 Einleitung . . . . . . . . . . . . . . . . . .
3.2 Grundlagen: Raum, Zeit, Masse und Kraft
3.3 Bewegungsgleichung und Erhaltungsgrößen
3.4 Ein Teilchen in einer Dimension . . . . . .
3.5 Krummlinige Koordinaten . . . . . . . . .
3.6 Zweidimensionale Zentralfelder . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
121
121
122
127
134
163
169
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
INHALTSVERZEICHNIS
Kapitel 1
Eine kurze Einführung
Diese Vorlesung verfolgt zwei Ziele. Einerseits geht es darum ihnen relativ schnell
die mathematische Werkzeuge bereitzustellen, die sie in den ersten Semestern
ihres Physikstudiums benötigen werden. Dabei ersetzt die Vorlesung keinesfalls
den Kurs in Höherer Mathematik, der ihnen einen sehr viel systematischeren
Zugang zur Mathematik eröffnen wird.
In einem zweiten kürzeren Teil werden wir uns mit den Grundzügen der klassischen Mechanik beschäftigen, d.h. der Theorie der Bewegung von “klassischen”
Teilchen (wie z.B. Planeten und Fußbällen). Wir wollen den Begriff “klassisch”
hier so verstehen, daß er sich auf hinreichend große (makroskopische) Teilchen
bezieht, deren Geschwindigkeit sehr viel kleiner als die Vakuumgeschwindigkeit
der Lichts c ist. Geht man über diese Grenzen hinaus, so benötigt man statt der
klassischen Mechanik die Quantenmechanik oder relativistische Mechanik, Theorien die in den ersten drei Jahrzehnten des zwanzigsten Jahrhunderts entwickelt
wurden. Beide Konzepte werden sie in späteren Vorlesungen kennenlernen. Diese
Beschränkungen machen sofort klar, daß es sich bei der klassischen Mechanik
um eine Theorie mit eingeschränktem Gültigkeitsbereich handelt. Trotz dieser
Beobachtung bildet sie eine spannendes Gebiet, welches für das Verständnis der
weitaus meisten “mechanischen” Phänomene des Alltags ausreicht. Speziell die
Entwicklung der “Chaos-Theorie” in den letzten Jahrzehnten hat zu einer Wiederbelebung der Forschung im Bereich der klassischen Mechanik geführt. Weiterhin
bildet ein Verständnis der klassischen Mechanik die Grundlage für den Zugang zur
Quantenmechanik und relativistischen Mechanik. Darüberhinaus biete sie einen
vergleichsweise einfachen Einstieg in die Methoden und Konzepte der Theoretischen Physik.
Die Entwicklung der klassischen Mechanik wie wir sie heute kennen geht auf
die Ideen von Galileo (1564-1642) und Newton (1642-1727) zurück. Zwei alternative, zur Newtonschen Mechanik äquivalente Formulierungen der klassischen
Mechanik stammen von Lagrange (1736-1813) und Hamilton (1805-1865). Die
Lagrangesche und Hamiltonsche Mechanik haben den Vorteil, daß mit ihrer Hilfe
oft Lösungen komplexer Probleme einfacher gefunden werden können. Sie wer5
6
KAPITEL 1. EINE KURZE EINFÜHRUNG
den sie in ihrem zweiten Studiensemster in der Vorlesung Theoretische Physik I
kennen lernen.
Bereits im ersten mathematischen Teil dieser Vorlesung werden wir als Motivation der Einführung neuer Konzepte und in Beispielrechnungen (in der Vorlesung
und den zugehörigen Übungen) Probleme aus der Mechanik heranziehen. Dabei
werden wir davon ausgehen, daß sie einfache Konzepte der Newtonschen Mechanik aus der Schule oder (zum benötigten Zeitpunkt bereits) aus der Vorlesung
Experimentalphysik I kennen.
Kapitel 2
Mathematische Methoden
2.1
Einleitung
Im Laufe ihres Studiums werden ihnen verschiedene Arten des Umgangs mit Mathematik begegnen, von ziemlich abstrakt bis sehr anschaulich. Der Schwerpunkt
der Einführung in die Theoretische Physik liegt dabei weniger auf formaler Strenge in den Herleitungen, sondern auf einer relativ anschaulichen Darstellung und
der Anwendung des Gelernten in physikalischen Fragestellungen. Dabei werden
wir was die Vorbedingungen angeht nicht “bei Null anfangen”, sondern setzen ein
gewisses (anschauliches) Vorwissen voraus. Zum Beispiel werden wir nicht sehr
ausführlich auf den Stetigkeitsbegriff eingehen, sondern gehen davon aus, daß sie
ein intuitives Verständnis davon haben, was es heißt, daß eine Kurve stetig ist
(ohne Sprünge). Auf saubere Beweise von “Sätzen” - also Zusammenhängen - die
ihnen zum Teil sicherlich bereits aus der Schule bekannt sind, und eine abstrakte
Formulierung der Konzepte, wie sie sie im Kurs Höhere Mathematik (bzw. den
Grundvorlesungen der Mathematik) kennenlernen werden, verzichten wir hier bewußt. Die Konzepte sollen vielmehr anhand einfacher Beispiele erklärt und geübt
werden. Es stellt meist eine große Herausforderung für Physikstudierende dar,
sich in beiden Herangehensweise an Mathematik - formal und pragmatisch - “zu
hause zu fühlen”. Dieses Ziel zu erreichen ist sehr erstrebenswert, da es für einen
Physiker einerseits wichtig ist Integrale berechnen und Differentialgleichungen
explizit lösen zu können und andererseits essentiell ist die logische Struktur der
Mathematik verinnerlicht zu haben.
Aus ihrer “Schulphysik” ist ihnen sicherlich bekannt, daß man zur Beschreibung der Dynamik eines klassischen Teilchens in einem Kraftfeld Analysis (Differential- und Integralrechnung) und lineare Algebra (Vektorrechnung) benötigt.
Hier einige Beispiele aus der Mechanik, in denen die unter diesen Oberbegriffen
zusammengefaßten mathematischen Methoden eine wichtige Rolle spielen:
• Bahnkurve - Vektor, Vektoraddition, Funktion: ~x(t) = x1 (t)~e1 + x2 (t)~e2 +
x3 (t)~e3
7
8
KAPITEL 2. MATHEMATISCHE METHODEN
• Geschwindigkeit - Differentiation (eindimensional) v(t) =
dx(t)
dt
• Geschwindigkeitsvektor - Differentiation eines Vektors: ~v (t) =
= ẋ(t)
d~
x(t)
dt
= ~x˙ (t)
• Newtonsche Gleichung - zweite Ableitung, Differentialgleichung, vektorwertige Funktion eines Vektor, zusammengesetzte Funktion: m~x¨(t) = F~ (~x(t))
z.B. mẍ(t) = −Kx(t) (Hookesches Gesetz)
Rx
• Arbeit - Integration: W (x1 → x2 ) = x12 F (x)dx
• Leistung - Skalarprodukt: P = F~ · ~v
• Drehimpuls - Vektorprodukt: ~l = ~x × p~
• Potential - partielle Ableitung, Gradient (Differentialrechnung mehrerer
~ (~x)
Veränderlicher): F~ (~x) = −∇V
• Rotationsenergie P
- Summenzeichen, Matrix (Tensor), Hauptachsentransfor1
mation: Erot = 2 3i,j=1 Ωi Ii,j Ωj
Am Ende des mathemtaischen Teils dieser Vorlesung sollten sie an den Umgang
mit einer Vielzahl dieser Begriffe und Rechenprozeduren gewöhnt sein. Wir werden weiterhin wichtige Eigenschaften spezieller Funktionen, z.B. der
• Exponentialfunktion: exp(x) = ex ; exp(x + y) = exp(x) exp(y)
• Logarithmusfunktion: ln(x); ln(xy) = ln(x) + ln(y)
diskutieren, Reihendarstellungen von Funktionen kennenlernen
P
n
• Exponentialfunktion: exp(x) = ∞
n=0 x /n!
und komplexe Zahlen einführen
√
• i = −1; eix = cos x + i sin x.
Zusätzlich werden wir zwei Methode zur approximativen Beschreibung von Funktionen in Form der Taylor- und der Fourierreihe kennen lernen.
2.2
Differentialrechnung einer Veränderlichen
Eine Funktion y = f (x) mit x ∈ D und y ∈ W ist eine spezielle Abbildung,
bei der den Elementen des Definitionsbereichs D - der z.B. eine Teilmenge der
reellen Zahlen R ist (ein oder mehrere Intervalle) - eindeutig ein Element des
Wertebereichs W - der eine ebensolche Teilmenge darstellt - zugeordnet wird.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
D
9
W
f
Um Intervalle als Teilmengen von R zu bezeichnen, verwendet man die Notation
• (a, b) : {x ∈ R|a < x < b}
• [a, b] : {x ∈ R|a ≤ x ≤ b}
• (a, b] : {x ∈ R|a < x ≤ b}
• [a, b) : {x ∈ R|a ≤ x < b}
Häufig zeichnet man den Graphen der Funktion f (x), welcher durch alle Punktepaare x, f (x) mit x ∈ D gebildet wird. In der Physik ist es üblich, y = f (x) zu
schreiben. Betrachten wir zwei einfache Beispiele
y=
√
x : D = [0, ∞) , W = [0, ∞)
4
y
3
2
1
0
−2
0
2
4
x
6
8
10
y = cos x : D = R = (−∞, ∞) , W = [−1, 1]
10
KAPITEL 2. MATHEMATISCHE METHODEN
1
y
0.5
0
−0.5
−1
−10
−5
0
x
5
10
wobei wir immer den größtmöglichen - also den “natürlichen” - Definitionsbereich
gewählt haben.
Es gibt verschiedene analytische Darstellungen von Funktionen (Graphen)
• explizit: y = f (x),
• implizit: F (x, y) = 0,
• Parameterdarstellung: x = g(s), y = h(s) mit zwei Funktionen g, h und
dem (reellen) Parameter s (aus einem gemeinsamen Definitionsbereich von
g und h).
Als Beispiel dazu betrachten wir die obere Hälfte des Kreises mir Radius 1 (Einheitskreis), welche auf die drei Arten
√
• explizit: y = 1 − x2 , x ∈ [−1, 1],
• implizit: F (x, y) = x2 + y 2 − 1 = 0, x ∈ [−1, 1], y ≥ 0,
• Parameterdarstellung: x = cos φ, y = sin φ, φ ∈ [0, π] (Winkel nicht in
Grad, sondern Radiant: 360o entspricht 2π)
gegeben ist.
Eine Funktion heißt monoton wachsend falls aus x1 < x2 , f (x1 ) ≤ f (x2 ) folgt.
Sie heißt streng monoton wachsend falls das ≤ in der zweiten Relation durch ein <
ersetzt werden kann. Völlig analoge Definitionen gibt es für die Begriffe monoton
fallend und streng monoton fallend. Man bezeichnet eine Funktion als nach oben
beschränkt falls es ein M < ∞ gibt mit f (x) ≤ M für alle x ∈ D. Die reelle
Zahl M ist dann eine obere Schranke. Die kleinste obere Schranke ist eindeutig
bestimmt und wird als Supremum bezeichnet. Erneut gibt es analoge Definitionen
für die Begriffe nach unten beschränkt, untere Schranke und Infimum.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
11
Eine Funktion heißt gerade falls f (−x) = f (x) für alle x ∈ D bzw. ungerade
falls f (−x) = −f (x) für alle x ∈ D. Man bezeichnet sie als periodisch mit Periode
P > 0 falls f (x + P ) = f (x) für alle x ∈ D = R.
Man kann nun Summen, Differenzen, Produkte und Quotienten von Funktionen f (x), g(x), h(x), . . . bilden, wobei man sich in jedem speziellen Fall Gedanken
über den Definitions- und Wertebereich der sich jeweils ergebenden Funktionen
machen muß. Eine wichtige Rolle spielen auch zusammengesetzte Funktionen
(f ◦ g) (x) = f (g(x))
f g
f
g
Der Definitionsbereich von f ◦ g ergibt sich aus den x ∈ Dg , für die g(x) ∈ Df
ist. Als Beispiele betrachten wir
f (x) =
√
x ; g(x) = x + 1 ⇒ (f ◦ g)(x) = f (g(x)) =
√
x + 1 ; Df ◦g = [−1, ∞)
4
y
3
2
1
0
f (x) = cos x ; g(x) =
−2
0
2
4
x
6
8
10
1
⇒ (f ◦ g)(x) = f (g(x)) = cos (1/x) ; Df ◦g = R \ {0}
x
12
KAPITEL 2. MATHEMATISCHE METHODEN
1
y
0.5
0
−0.5
−1
−1
−0.5
0
x
0.5
1
Die zusammengesetzte Funktion im zweiten Beispiel ist eine “relativ verrückte”
Funktion, da der Graph für |x| → 0 immer schneller zwischen −1 und 1 hin und
her “zappelt”.
Man bezeichnet eine Funktion f als stetig im Punkt x0 ∈ D, wenn der zugehörige Graph bei x0 keine Sprünge hat (limh→0 f (x0 +h) = f (x0 )) und der Funktionswert bei Annäherung an x0 kleiner Unendlich ist (limh→0 f (x0 + h) < ∞),
d.h. f bei x0 nicht divergiert. Formaler ist die Stetigkeit im Punkt x0 wie folgt
definiert: Für alle ε > 0 gibt es ein δ > 0, so daß für alle x mit |x − x0 | < δ,
|f (x) − f (x0 )| < ε gilt. Eine Funktion heißt stetig in einem Intervall I, falls f
für alle x ∈ I stetig ist. Es gibt verschiedene Typen von Unstetigkeiten. Hebbare
Unstetigkeiten wie die Stelle x = 0 in f (x) = x2 /x, Sprünge wie in
0 x<0
f (x) =
1 x≥0
für x → 0, x < 0, Pole wie in f (x) = (x − a)−2 und wesentliche Singularitäten
wie in f (x) = exp (1/x) bei x = 0. Weitere formale Überlegungen zum Begriff
der Stetigkeit und des oben stillschweigend benutzen Grenzwertes überlassen wir
der HöMaI Vorlesung.
Man teilt Funktionen einer (reellen) Veränderlichen in zwei Klassen ein. Die
elementaren Funktionen und die speziellen Funktionen. Beispiele für die Letzteren
sind z.B. die in der Physik häufiger auftretenden Besselfunktionen, Gammafunktionen und das Exponential-Integral. Elementare Funktionen kann man durch
einen geschlossenen analytischen Ausdruck angeben. Die elementaren Funktionen unterteilt man weiter in algebraische Funktionen, die einer impliziten algebraischen Gleichung der Form
p0 (x) + p1 (x)y + p2 (x)y 2 + . . . + pn (x)y n = 0 ,
mit Polynomen pj (x) (Definition siehe gleich), genügen und transzendente Funktionen (die sich nicht auf diese Art schreiben lassen). Beispiele für die letztere
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
13
Funktionenklasse sind die Exponentialfunktion, der Logartihmus, die hyperbolischen Funktionen und trigonometrischen Funktionen. In einem weiteren Schritt
unterteilt man die algebraischen Funktionen in drei Untergruppen. (i) Polynome
(ganz rationale Funktionen) der Form
f (x) = a0 + a1 x + a2 x2 + . . . + an xn
mit Koeffizienten aj ∈ R, j = 0, 1, . . . , n, wobei an 6= 0 gilt. Für große |x| geht das
Polynom wie an xn und ist somit (falls D = R gilt) nicht nach oben beschränkt.
Mit dem Bestimmen von Nullstellen von Polynomen sollten sie sich bereits in
der Schule auseinander gesetzt haben. Es gilt der Zerlegungssatz, daß sich jedes
Polynom mit reellen Koeffizienten als ein Produkt von linearen und quadratischen
Termen mit reellen Koeffizienten schreiben läßt, wobei die quadratischen Faktoren
keine reellen Nullstellen haben sollten. In dieser Darstellung lassen sich dann die
(reellen) Nullstellen direkt ablesen. Ein Polynom ist überall stetig und hat bis zu
n (reelle) Nullstellen. (ii) Gebrochen rationale Funktionen die sich als Quotient
zweier Polynome in der Form
f (x) =
p(x)
a0 + a1 x + a2 x 2 + . . . + an x n
=
,
b0 + b1 x + b2 x 2 + . . . + bm x m
q(x)
mit aj , bj ∈ R schreiben lassen. An den Nullstellen q(x0 ) = 0 des Nenners ist
die Funktion nicht definiert. Sollte gleichzeitig p(x0 ) = 0 gelten liegt womöglich
eine hebbare Lücke vor (wenn die Nullstelle des Zählers von gleicher oder höherer Ordnung ist wie die des Nenners), sonst ein Pol. Eine Funktion dieser Form
heißt echt gebrochen falls n < m. Ein wichtiges Konzept für gebrochen rationale
Funktionen ist die Partialbruchzerlegung.1 Jede echt gebrochene rationale Funktion läßt sich als Summe von Partialbrüchen der Form a1 /(x − x1 ), a2 /(x − x2 )2 ,
. . . und (b1 x + c1 )/(x2 + r1 x + s1 ), (b2 x + c2 )/(x2 + r2 x + s2 )2 ,. . . schreiben, wobei die Koeffizienten aj , bj , cj , rj und sj aus den reellen Zahlen sind. Die in der
Partialbruchzerlegung auftretenden Nenner sind Teiler von q(x).Wir betrachten
dazu ein Beispiel. Gegeben sei die Funktion
2x3 + 5x2 + 2x + 3
.
x3 + 2x2 + x + 2
Daraus extrahieren wir zunächst die echt gebrochene Funktion g(x)
f (x) =
f (x) = 2 +
x2 − 1
= 2 + g(x) .
x3 + 2x2 + x + 2
Den Nenner zerlegen wir nun in x3 + 2x2 + x + 2 = (x + 2)(x2 + 1). Der Ansatz
für die Partialbruchzerlegung von g(x) lautet dann
g(x) =
1
x2 − 1
a
bx + c
=
+
,
x3 + 2x2 + x + 2
x + 2 x2 + 1
Die Partialbruchzerlegung wird ein wichtiges Hilfsmittel beim Finden der Stammfunktion
für eine gebrochen rationale Funktion sein.
14
KAPITEL 2. MATHEMATISCHE METHODEN
wobei es gilt a, b und c zu bestimmen. Dies geschieht wie folgt. Wir multiplizieren
beide Seiten der Gleichung mit dem Nenner und erhalten
x2 − 1 = a(x2 + 1) + (bx + c)(x + 2) = (a + b)x2 + (2b + c)x + (a + 2c) .
Für beliebige x kann diese Gleichung nur erfüllt werden, wenn die Koeffizienten
vor den Potenzen von x auf beiden Seiten der Gleichung identisch sind. Man
nennt diese Vorgehensweise Koeffizientenvergleich. Aus dieser Forderung ergeben
sich die drei Gleichungen
a+b = 1
2b + c = 0
a + 2c = −1
mit der Lösung a = 3/5, b = 2/5 und c = −4/5. Das Ergebins der Partialbruchzerlegung ist somit
x2 − 1
1
3
2x − 4
f (x) = 2 + 3
=2+
+
.
x + 2x2 + x + 2
5 x + 2 x2 + 1
Die dritte Unterklasse der algebraischen Funktionen sind die (iii) irrationalen
Funktionen. Dabei handelt es sich um alle algebraischen Funktionen, die nicht in
die Klasse (i) oder (ii) fallen.
z.B. die Wurzelfunktion. Ein Beispiel
pSie enthalten
√
2
bildet die Funktion f (x) = (x + 1) x.
Nach dieser kurzen Einführung zu den Eigenschaften von Funktionen gehen
wir zum Begriff der Ableitung über. Dazu nehmen wir an, daß die Funktion f
in einer Umgebung (einem Intervall) um x0 stetig ist. In der Schule wird die
Ableitung meist mit Hilfe der Sekante durch zwei Punktepaare x1 , f (x1 ) und
x2 , f (x2 ) mit x1 < x0 < x2 definiert, die im Limes x1 → x0 und x2 → x0 in die
Tangente am Punktepaar x0 , f (x0 ) übergeht.
4
f(x)
3
2
1
0
0
2
4
6
x
8
10
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
15
Etwas formaler gilt
f (x0 + h) − f (x0 )
,
h→0
h
f 0 (x0 ) = lim
vorausgesetzt, daß dieser Grenzwert existiert.2 Anschaulich ist f 0 (x0 ) die Steigung
der Tangente im Punkt x0 . Falls f 0 (x0 ) existiert, so ist die Funktion im Punkt x0
durch die Tangente linear approximierbar, d.h. näherungsweise durch eine lineare
Funktion der Form g(x) = a + bx beschreibbar (in der obigen Abbildung z.B.
a = 1 und b = 1/4), und f ist in x0 differenzierbar. Eine Funktion ist in x0 z.B.
dann nicht differenzierbar, wenn sie in diesem Punkt einen Knick hat. Wie wir
später noch genauer diskutieren werden, spielt eine näherungsweise Beschreibung
komplizierter Funktionen in der Physik eine sehr wichtige Rolle.
Betrachten wir nun einige Beispiele, wie der Grenzprozeß h →√0 ausgeführt
werden kann und welche Ableitungen f 0 sich ergeben. Für f (x) = x mit x > 0
und x + h > 0 gilt
√
√
x+h− x
√ h
√ √
√ x+h− x
x+h+ x
√
=
√ h x+h+ x
h
√
=
√ h x+h+ x
1
= √
√ .
x+h+ x
f (x + h) − f (x)
=
h
Jetzt kann der Limes h → 0 einfach durch Nullsetzen von h ausgeführt werden,
und man erhält
√
1
x 0 = √ oder
2 x
x1/2
0
1
= x−1/2 .
2
√
An der Rechnung erkennen wir auch, daß x bei x = 0 nicht differenzierbar
ist, denn die Steigung der Tangente wird für x → 0 immer größer und divergiert im Punkt x = 0. Als nächstes betrachten wir f (x) = sin x. Um f 0 zu bestimmen, benötigen wir die Additionstheoreme der trigonometrischen Funktionen
(siehe Übungen):
sin (x ± y) = sin x cos y ± cos x sin y
cos (x ± y) = cos x cos y ∓ sin x sin y
2
(2.1)
(2.2)
Wir betonen noch einmal, daß wir das Konzept der Grenzwertbildung nicht wirklich sauber
definiert haben!
16
KAPITEL 2. MATHEMATISCHE METHODEN
Mit Hilfe von Gl. (2.1) folgt:
sin (x + h) − sin x
h→0
h
sin x cos h + cos x sin h − sin x
= lim
h→0
h
cos h − 1
sin h
= lim sin x
+ cos x
h→0
h
h
(sin x)0 = lim
Wir haben nun noch die beiden Grenzwerte limh→0
untersuchen. Das wollen wir hier graphisch tun3
cos h−1
h
und limh→0
sin h
h
zu
1
(cos(h)−1)/h
sin(h)/h
0.5
0
−0.5
0
0.2
0.4
0.6
0.8
1
h
Also liefert der erste Grenzwert 0 und der zweite 1. Damit ergibt sich
(sin x)0 = cos x.
Analog zeigt man (siehe Übungen):
(cos x)0 = − sin x.
Wichtig - und ihnen sicherlich aus der Schule bereits bekannt - ist auch die
Ableitung der Funktion fn (x) = xn mit n ∈ N0 .4 Sie bestimmt sich aus
(x + h)n − xn
.
h→0
h
fn0 (x) = lim
Um den Limes h → 0 ausführen zu können, müssen wir den Ausdruck (x + h)n
3
Mit Hilfe der Reihendarstellung der sin und cos Funktionen werden wir diese Grenzwerte
später auch analytisch recht einfach bestimmen können (siehe Übungen).
4
N bezeichnet die natürlichen Zahlen 1, 2, 3, . . . und N0 = N ∪ {0}.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
17
ausmultiplizieren. Wir benötigen also
(x + h)n = (x + h)(x + h) . . . (x + h)
|
{z
}
n−mal
n
n(n − 1) n−2 2 n(n − 1)(n − 2) n−3 3
= xn + xn−1 h +
x h +
x h + . . . + hn .
1
2·1
3·2·1
Das kombinatorische Problem, den Vorfaktor des Terms xn−m hm mit m ≤ n zu
bestimmen, führt uns auf die Begriffe Fakultät und Binomialkoeffizient.
Die Fakultät ist definiert als
n! = n(n − 1)(n − 2)(n − 3) · . . . · 1
wobei n ∈ N gilt. Ergänzt wird diese Definition durch 0! = 1. Die Zahl der
Möglichkeiten, n verschiedene Objekte anzuordnen, ist durch n! gegeben. Zum
Beispiel gibt es 4! = 24 Möglichkeiten, die vier Buchstaben A, B, C, D anzuordnen: 4 Möglichkeiten für den ersten Buchstaben ∗ 3 Möglichkeiten für den
zweiten ∗ 2 Möglichkeiten für den dritten ∗ 1 Möglichkeit für den vierten. Abstrakter formuliert heißt das: Die Zahl der Permutationen von n verschiedenen
Objekten ist durch n! gegeben. Um das obige kombinatorische Problem “Wieviele Möglichkeiten gibt es in den n-Faktoren (x + h), (n − m) x’e und m h’s zu
finden” zu lösen, müssen wir einen Schritt weitergehen. Die m h’s kann man auf
n(n−1)(n−2)...(n−m+1)
Arten erhalten:
m!
• n Möglichkeiten für das erste h
• n − 1 Möglichkeiten für das zweite h
• ...
• ...
• n − m + 1 Möglichkeiten für das m-te h
Dabei hat man jetzt jedoch die m! Vertauschungen der Reihenfolge der Wahl
als eigenständig gezählt, so daß man noch durch m! dividieren muß. Den sich
ergebenen Faktor bezeichnet man als Binomialkoeffizienten
n
n(n − 1)(n − 2) . . . (n − m + 1)
n!
=
=
.
m
m!
(n − m)! m!
Der Binomialkoeffizient
gibt z.B. auch die Zahl der Kombinationen im Lotto “6
aus 49”: 49
=
13983816.
Damit ergibt sich für (x + h)n :
6
n n
n n−1
n n−2 2
n n
n
(x + h) =
x +
x h+
x h + ... +
h
0
1
2
n
n X
n n−m m
=
x
h .
m
m=0
18
KAPITEL 2. MATHEMATISCHE METHODEN
Wir haben in diesem Ausdruck das Summenzeichen
n
X
= Summe über m von 0 bis n
m=0
eingeführt.
Nach diesem Einschub kommen wir auf das Problem (xn )0 = . . . zurück. Es
ergibt sich
(x + h)n − xn
h→0
h
n n−1
n
x + 1 x h + n(n−1)
xn−2 h2 +
2·1
(xn )0 = lim
= lim
h→0
n−1
= nx
n(n−1)(n−2) n−3 3
x h
3·2·1
+ . . . + hn − xn
h
,
(2.3)
wobei der Limes h → 0 jetzt durch Nullsetzen von h ausgeführt werden kann.
Über einige Umwege haben wir so das ihnen bekannte Ergebnis erhalten.
Es gibt mehrere wichtige Rechenregeln, die einem helfen, Ableitungen von
Funktionen zu bestimmen.5 Seien f und g differenzierbare Funktionen, so gilt
• (f ± g)0 = f 0 ± g 0
• Produktregel: (f · g)0 = f 0 · g + f · g 0
0
0
g0
• Quotientenregel: fg = f g−f
g2
Den Beweis dieser Regeln verschieben wir auf die Übungen. Mit Hilfe der Quotientenregel läßt sich das Ergebnis Gl. (2.3) auf negative ganze Zahlen n = −|m| erweitern (siehe Übungen), so daß jetzt für alle ganzen Zahlen n ∈ Z, (xn )0 = nxn−1
gilt. Genauer wollen wir hier die Kettenregel betrachten, die angibt, wie man zusammengesetzte Funktionen differenziert. Für die differenzierbaren Funktionen f
und g müssen wir den Limes
f (g(x + h)) − f (g(x)) g(x + h) − g(x)
f (g(x + h)) − f (g(x))
= lim
h→0
h→0
h
g(x + h) − g(x)
h
lim
ausführen, wobei wir angenommen haben, daß g(x + h) 6= g(x) gilt, g(x) also
keine konstante Funktion ist - in welchem Fall f (g(x + h)) − f (g(x)) = 0 wäre
und damit (f ◦ g)0 = 0 gelten würde. Mit der Abkürzung h̃ = g(x + h) − g(x) gilt
f (g(x + h)) − f (g(x))
f (g(x) + h̃) − f (g(x)) g(x + h) − g(x)
= lim
.
h→0
h→0
h
h
h̃
lim
5
Zum Beispiel läßt sich die Ableitung der Tangensfunktion tan x =
Quotientenregel bestimmen (siehe später).
sin x
cos x
leicht mit Hilfe der
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
19
Wegen der Stetigkeit von g geht mit h auch h̃ gegen 0, so daß
(f (g(x)))0 = f 0 (g(x)) g 0 (x)
folgt. Eine “saubere” Ausformulierung des Beweises werden sie in der Vorlesung
HöMa I kennenlernen.
Als nächstes werden wir das Konzept der impliziten Funktion genauer diskutieren, das für sich genommen wichtig ist und oft auch bei der Bestimmung von
Ableitungen hilfreich sein kann. Durch eine Gleichung der Form F (x, y) = 0 wird
im Allgemeinen eine Kurve in der x-y-Ebene festgelegt. Zum Beispiel beschreibt
F (x, y) = x2 + y 2 − 1 = 0 einen Kreis mit Radius 1, den man als Einheitskreis
2
2
bezeichnet. Löst man die
√ Gleichung x + y − 1 = 0 nach y auf, so ergeben sich
2
zwei Funktionen y = ± 1 − x , wobei x ∈ [−1, 1] = D zu wählen ist.
1
0.5
2 1/2
y1=(1−x )
2 1/2
y2=−(1−x )
y
0
−0.5
−1
−1
−0.5
0
x
0.5
1
2
Als weiteres Beispiel betrachten wir die Gleichung G(x,
√ z) = z −x = 0. Aufgelöst
nach z ergeben sich wieder zwei Funktionen z = ± x mit D = [0, ∞).
4
1/2
z1=x
1/2
z2=−x
z
2
0
−2
−4
0
2
4
6
8
10
x
1
Die Ableitung des oberen Parabelastes kennen wir bereits:6 dz
= 2√1 x . Man kann
dx
die Ableitung aber auch ohne Auflösen nach z erhalten, wenn man die Methode
6
Wir schreiben hier zum ersten mal statt z10 für die Ableitung der Funktion z1 nach der
20
KAPITEL 2. MATHEMATISCHE METHODEN
der impliziten Differentiation verwendet:
z
2
= x
d
dx
dz
= 1
dx
dz
1
=
.
dx
2z
Mit Hilfe dieses Ausdrucks erhalten wir auch gleich die Ableitungen für die beiden
Funktionen:
dz1
1
dz2
1
= √ ;
=− √ .
dx
dx
2 x
2 x
Besonders hilfreich ist die Differentiation impliziter Funktionen, wenn es nicht
möglich ist, die Gleichung F (x, y) = 0 nach y aufzulösen. Zum Beispiel F (x, y) =
x3 + y 3 − 9xy :
d
x3 + y 3 − 9xy = 0 dx
dy
2
2 dy
− 9y − 9x
= 0
3x + 3y
dx
dx
3y 2 − 9x y 0 = 9y − 3x2
9y − 3x2
.
y0 =
3y 2 − 9x
2z
Wir können die implizite Differentiation auch verwenden, um die Regel ( xn )0 =
nxn−1 (siehe Gl. (2.3)) auf rationale α = m/n mit m, n ∈ Z zu verallgemeinern.
Die Menge der rationalen Zahlen wird oft mit Q bezeichnet. Für x > 0 betrachten
wir y = xm/n , also y n = xm . Damit ergibt sich
d
y n = xm dx
dy
ny n−1
= mxm−1
dx
m xm−1
y0 =
n y n−1
m xm−1
y0 =
n (xm/n )n−1
y
0
y0
m xm−1
=
n xm−m/n
m m/n−1
=
x
,
n
1
Variablen x, dz
dx . Wir werden diese Bezeichnung für die Ableitung im folgenden häufiger ver1
wenden. Es gilt zu beachten, daß dz
dx kein “Bruch” im eigentlichen Sinne ist. Man darf also in
dz1
1
der Gleichung dx = 2√x nicht beide Seiten mit dx multiplizieren, da dx für sich genommen
erst dann einen Sinn macht, wenn man den Umgang mit Differentialformen gelernt hat.
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
21
also für rationale α: ( xα )0 = αxα−1 .
Aus der Schule kennen sie sicherlich das Konzept der Umkehrfunktion. Um
diese einzuführen, müssen wir zunächst einen weiteren Begriff definieren: Eine
Funktion f (allgemeiner eine Abbildung) heißt injektiv oder eineindeutig, falls
für alle beliebigen Paare x1 6= x2 aus D auch f (x1 ) 6= f (x2 ). Nur wenn diese
Eigenschaft erfüllt ist, kann man eine Funktion umkehren.
W
D
f
Dazu zwei Beispiele:
nicht injektiv
injektiv
1000
f(x)=x
100
3
f(x)=x
2
80
500
f(x)
60
0
40
−500
−1000
−10
20
−5
0
x
5
10
0
−10
−5
0
x
5
10
Für eine injektive Funktion kann man die Umkehrfunktion f −1 definieren.
f -1
D
W
Für diese gilt dann für alle x ∈ Df
f
f −1 (f (x)) = x,
(2.4)
und für alle x ∈ Wf = Df −1
f (f −1 (x)) = x.
Wir betrachten zunächst einige einfache Beispiele zur Konstruktion von f −1 und
−1
0
0
zur Berechnung von dfdx = (f −1 ) = f −1 bei gegebenem f .
22
KAPITEL 2. MATHEMATISCHE METHODEN
1/3
• f (x) = x3 : Da für x ≥ 0, (x3 ) = x gilt erhält man f −1 (x) = x1/3 , und
1/3
für x < 0 gilt − (−(x3 )) = x, also f −1 (x) = −(−x)1/3 .
2
f(x)
−1
f (x)
g(x)
1
0
−1
−2
−2
−1
0
x
1
2
0
Die Ableitung von f −1 für x > 0 ergibt sich zu f −1 (x) = 13 x−2/3 . Für x < 0
0
folgt mit Hilfe der Kettenregel f −1 (x) = 31 (−x)−2/3 . Damit ist, wie man
auch der Abbildung entnimmt, der Wert der Ableitung von f −1 bei x gleich
dem bei −x.
• f (x) = ax + b, mit a = 2 und b = 1. Zur Bestimmung von f −1 lösen wir
die Gleichung y = ax + b nach x auf x = a1 (y − b) und erhalten f −1 durch
Vertauschen von x und y: f −1 (x) = a1 (x − b).
2
f(x)
−1
f (x)
g(x)
1
0
−1
−2
0
−2
−1
0
x
1
2
Es gilt f −1 (x) = a1 . Da f 0 (x) = a, finden wir, daß die Steigung der Inversen
der linearen Funktion durch das Inverse der Steigung der linearen Funktion
2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN
23
selbst gegeben ist. Dieses ist die zentrale Beobachtung, mit deren Hilfe wir
0
f −1 (x) allgemein bestimmen können.
Aus den obigen Abbildungen erkennt man eine allgemeingültige graphische Konstruktionsvorschrift, wie sich f −1 aus f bestimmen läßt: Durch Spiegelung an
der Winkelhalbierenden g(x) = x. Aus dem zweiten Beispiel ergibt sich sofort
0
auch ein Konstruktionsprinzip für f −1 : Wenn die Tangente an f durch x0 , f (x0 )
die Steigung f 0 (x0 ) hat, so hat die Tangente an f −1 durch f (x0 ), f −1 (f (x0 )) die
Steigung 1/f 0 (x0 ), so daß allgemein
0
f −1 (f (x0 )) =
1
f 0 (x
0)
(2.5)
gilt. Weniger “konstruktiv” läßt sich Gl. (2.5) mit Hilfe der Definitionsgleichung
Gl. (2.4) und der impliziten Differentiation herleiten (siehe Übungen). Mit Hilfe
der Gl. (2.5) läßt sich z.B. die Ableitung der arctan-Funktion leicht bestimmen.
sin x
Mit f (x) = tan x = cos
folgt nach der Quotientenregel
x
f 0 (x) =
1
cos2 x + sin2 x
=
.
2
cos x
cos2 x
Damit gilt also
cos2 x0
1
1
2
=
cos
x
=
,
=
0
2
0
2
f (x0 )
1 + tan2 x0
sin x0 + cos x0
so daß sich nach Gl. (2.5)
arctan0 (tan x0 ) =
1
1 + tan2 x0
und damit
(arctan x)0 =
1
1 + x2
ergibt.
Wie wir bereits in der Einleitung gesehen haben, benötigt man in der Mechanik auch höhere Ableitungen f (n) (x) einer Funktion f . Diese sind für n = 2, 3, 4, . . .
rekursiv definiert
dn f (x)
d dn−1 f (x)
=
.
dxn
dx
dxn−1
Für “kleine” n verwendet man auch die “n-Striche” (bzw. “n-Punkte”) Notation
f 00 , f 000 , . . . .
24
KAPITEL 2. MATHEMATISCHE METHODEN
Die trigonometrischen Funktionen haben dabei die interessante Eigenschaft
(sin x)00 = (cos x)0 = − sin x ,
(cos x)00 = (− sin x)0 = − cos x .
Damit gilt für die Funktion y(x) = a sin x+b cos x, y 00 (x) = − (a sin x + b cos x) =
−y(x). Umgeformt folgt
y 00 (x) + y(x) = 0.
(2.6)
Diese Gleichung führt uns auf ein sehr wichtiges weiteres Konzept: Die Differentialgleichung. Eine Differentialgleichung ist eine Gleichung, in der die Funktion
y(x), ihre Ableitungen y 0 (x), y 00 (x), . . . , y (n) (x) und x selbst auftreten. Ist die n-te
Ableitung die höchste vorkommende, so spricht man von einer Differentialgleichung n-ter Ordnung. Gl. (2.6) ist also eine Differentialgleichung zweiter Ordnung. Im Allgemeinen ist es sehr kompliziert und oft unmöglich, die Lösung einer
Differentialgleichung geschlossen (analytisch) anzugeben. Differentialgleichungen
spielen in der Physik eine sehr wichtige Rolle. Zum Beispiel bildet die (eindimensionale) Newtonsche Gleichung mẍ(t) = F (x(t)) eine Differentialgleichung
zweiter Ordnung. Ist nun die Kraft F proportional der Auslenkung x einer Masse m - was einer näherungsweisen Beschreibung der Rückstellkraft einer Feder
entspricht - so ergibt sich das Hookesche Gesetz mẍ(t) = −Kx(t) (K heißt die
Rückstellkonstante), oder
ẍ(t) +
K
x(t) = 0 ,
m
(2.7)
was bis auf einen Faktor der Gleichung (2.6) entspricht. Um eine Lösung für Gl.
(2.7) zu finden, müssen wir die Lösung von Gl. (2.6) noch leicht modifizieren. Dazu
berechnen wir zunächst die ersten und zweiten Ableitungen von f (t) = sin (ωt)
und g(t) = cos (ωt) mit Hilfe der Kettenregel
f˙(t) = ω cos (ωt) ; f¨(t) = −ω 2 sin (ωt) = −ω 2 f (t)
ġ(t) = −ω sin (ωt) ; g̈(t) = −ω 2 cos (ωt) = −ω 2 g(t).
Bilden wir jetzt wieder die Linearkombination x(t)
q = af (t) + bg(t), so ist diese
Funktion x(t) eine Lösung von Gl. (2.7), falls ω = K
. Im Problem der Bewegung
m
eines Teilchens der Masse m, welches mit einer Feder mit der Federkonstanten
K verbunden ist, muß die Lösung x(t) jetzt noch zwei Anfangsbedingungen (oder
Randbedingungen) erfüllen. Zur Zeit t = 0 soll das Teilchen am festgelegten Ort
x0 sein, so daß b = x0 zu gelten
p mhat, und es soll die Anfangsgeschwindigkeit v0
haben, woraus a = v0 /ω = v0 K folgt. Die Lösung der Newtonschen Gleichung
lautet für diesen Fall somit
r
v0
K
x(t) = x0 cos (ωt) + sin (ωt) mit ω =
.
(2.8)
ω
m
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
25
Eine genauere Diskussion der sich ergebenen oszillierenden Bewegung verschieben
wir auf später (und die Experimentalphysik I Vorlesung). Wir werden in späteren Kapiteln mehrfach auf das Konzept der Differentialgleichung zurückkommen
bevor wir uns mit diesem in einem eigenen Kapitel genauer vertraut machen.
Zum Abschluß dieses Kapitels zwei wichtige Hinweise: Die vielen oben diskutierten Rechentricks sind bei der Bestimmung der Ableitung einer Funktion sehr
hilfreich. Gerade für Physiker ist es jedoch auch legitim, sich durch graphische
Darstellung der zu differenzierenden Funktion f (x) ein anschauliches Bild von
der Ableitung f 0 (x) als Steigung von f (x) im Punkt x zu verschaffen - und sei
es nur als Konsistenzcheck des formal gewonnenen Ergebnisses. Dazu untersucht
man für die Funktion f am besten Fragen der Art: Wo ist die Steigung groß,
wo klein? Ist sie positiv oder negativ? Wo findet ein Vorzeichenwechsel der Steigung statt? In der Physik kennt man die zu differenzierende Funktion oft nicht
analytisch - z.B. wenn man eine (eindimensionale) Bahnkurve eines Teilchens
x(t) experimentell bestimmt hat und an der Geschwindigkeit des Teilchens v(t)
interessiert ist. In diesem Fall muß die Differentiation numerisch ausgeführt werden. Leider ist die numerische Differentiation kein sehr “stabiles” Verfahren, was
heißt, daß sich kleine Meßfehler bei der numerischen Differentiation verstärken
können (siehe spätere Mathematikvorlesungen). Die einfachste Form der numerischen Differentiation kennen sie sicherlich bereits aus der “Schulphysik”. Nehmen
wir z.B. an, der Ort x eines Teilchens wurde zu den Zeiten tn = t0 + nh, mit
n ∈ N0 und festem h, bestimmt. In diesem Fall können wir die Geschwindigkeit
zur Zeit tn , v(tn ), näherungsweise zu v(tn ) = x(tn+1h)−x(tn ) (Vorwärtsdifferenzenn−1 )
quotient) bestimmen. Genauso legitim wäre eine Zuordnung v(tn ) = x(tn )−x(t
h
(Rückwärtsdifferenzenquotient). Eine glattere Kurve für die Geschwindigkeit lien−1 )
fert allerdings oft die Zuordnung v(tn ) = x(tn+1 )−x(t
(zentrierter Differenzen2h
quotient), bei der die Steigung im Punktepaar tn , x(tn ) gleich der Steigung der
Sekante durch tn−1 , x(tn−1 ) und tn+1 , x(tn+1 ) gesetzt wird.
2.3
Integralrechnung einer Veränderlichen
Bereits gegen Ende des letzten Kapitels haben wir Differentialgleichungen betrachtet. Wir wollen nun die einfachste Differentialgleichung erster Ordnung
y 0 (x) = f (x)
untersuchen. Wir suchen also zu einer gegebenen Ableitung y 0 (x) = f (x) eine
zugehörige Funktion y(x) = F (x), so daß F 0 (x) = f (x) gilt. Man nennt eine
Lösung der Differentialgleichung, also die Funktion F (x), eine Stammfunktion
von f (x). Das sich stellende Problem ist die Umkehrung der Ableitung. Bereits
im letzten Kapitel haben wir darauf hingewiesen, daß es im Allgemeinen kein
“Rezept” gibt, die Lösung einer Differentialgleichung zu bestimmen. Gleiches gilt
für das Finden einer Stammfunktion. Einfache Klassen von Stammfunktionen
26
KAPITEL 2. MATHEMATISCHE METHODEN
0
erhält man durch das Umdrehen der Ableitungsrelationen, z.B. (xn+1 ) = (n +
1
1)xn , so daß Fc (x) = n+1
xn+1 + c, mit der beliebigen reellen Konstanten c, für
n + 1 6= 0 eine Stammfunktion von f (x) = xn ist. Hier eine kleine Tabelle von
Stammfunktionen
Funktion f
Stammfunktion F
1
n
x ; n 6= −1
xn+1 + c
n+1
sin (ax) ; a 6= 0
− a1 cos (ax) + c
1
cos (ax) ; a 6= 0
sin (ax) + c
a
1
arctan
x+c
1+x2
Aus der Definition der Stammfunktion ergibt sich eine offensichtliche Rechenregel: Ist F Stammfunktion von f und G Stammfunktion von g, so ist
aF (x) + bG(x) Stammfunktion von af (x) + bg(x). Zum Beispiel können wir mit
Hilfe dieser Regel eine Stammfunktion von f (x) = sin2 x bestimmen
f (x) = sin2 x =
⇒ F (x) =
1 1
− cos (2x)
2 2
1
1
x − sin (2x) + c.
2
4
Zunächst einmal wollen wir noch die ihnen wahrscheinlich bekannte übliche Schreibweise (unbestimmtes Integral)
Z
F (x) = f (x) dx
(2.9)
für eine Stammfunktion F zur Funktion f vermeiden. Sie wäre an dieser Stelle
eher verwirrend, denn speziell ist nicht klar, was der Ausdruck dx hier zu bedeuten
hat. Stattdessen schreiben wir
F (x) = SF [f (x)] .
Als physikalisches Beispiel betrachten wir den freien, senkrechten Fall eines
Steins. Die Newtonsche Gleichung für die zeitabhängige Geschwindigkeit v(t)
(nach unten) lautet in diesem Fall
dv(t)
=g ;
dt
mit der Erdbeschleunigung g ≈ 9, 81m/s2 .
Sie stellt damit eine Differentialgleichung von dem soeben diskutierten Typ dar,
wobei die Funktion f (t) durch die konstante Funktion f (t) = g gegeben ist. Eine
Stammfunktion zu f (t) = g wird durch v(t) = gt + c gegeben. Setzt man nun
t = 0, so folgt v(0) = c, mit der Anfangsgeschwindigkeit v(0), so daß wir bei
vorgegebener Anfangsgeschwindigkeit auch v(t) = v(0) + gt schreiben können.
Aus den Umkehrungen der Produkt- und der Kettenregel für die Differentiation ergeben sich zwei wichtige Tricks zur Bestimmung der Stammfunktion.
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
27
• Die Produktregel lautet
(f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x)
woraus sich
SF [f 0 (x)g(x) + f (x)g 0 (x)] = f (x)g(x)
oder
SF [f 0 (x)g(x)] = f (x)g(x) − SF [f (x)g 0 (x)]
(2.10)
ergibt. Kennt man also eine Stammfunktion von f (x)g 0 (x) (oder f 0 (x)g(x)),
so folgt eine von f 0 (x)g(x) (oder f (x)g 0 (x)) mit Hilfe von Gl. (2.10). Man
nennt diesen Rechentrick partielle Integration - eine Bezeichnung, deren
Ursprung erst später klar werden wird. Als Beispiel betrachten wir
f (x) = sin x ; g(x) = x ⇒ f 0 (x) = cos x ; g 0 (x) = 1
⇒ SF [x cos x] = x sin x − SF [sin x] = x sin x + cos x + c
• Sei F (x) eine Stammfunktion von f (x) und g(x) eine differenzierbare Funktion, so lautet die Kettenregel
d
F (g(x)) = F 0 (g(x))g 0 (x) = f (g(x))g 0 (x).
dx
Damit gilt die Substitutionsregel
SF [f (g(x))g 0 (x)] = F (g(x)).
(2.11)
Zum Beispiel
f (x) = sin x ; g(x) = x2
⇒
F (x) = − cos x ; g 0 (x) = 2x
⇒ SF 2x sin x2
= − cos x2 + c
Die beiden Beispiele zeigen, wie man die Liste der Stammfunktionen mit Hilfe
dieser Tricks beliebig verlängern kann. In der Praxis ergibt sich jedoch eine andere
Situation. Eine Funktion ist gegeben, und man muß sehen, ob die obigen Rechenregeln bei der Suche nach einer Stammfunktion weiterhelfen. Betrachten
√ wir dazu
ein Beispiel: Wir wollen eine Stammfunktion zur Funktion h(x) = x 1 − x bestimmen. Es ist klar, daß der√Faktor x durch Differenzieren einfacher wird. Eine
Stammfunktion des Faktors 1 − x läßt sich leicht mit Hilfe der Substitutionsregel bestimmen:
f (x) = −x1/2
⇒
g(x) = 1 − x
⇒
⇒
2
F (x) = − x3/2
3
0
f (g(x))g (x) = −(1 − x)1/2 (−1) = (1 − x)1/2
√
2
SF 1 − x = − (1 − x)3/2 + c
3
28
KAPITEL 2. MATHEMATISCHE METHODEN
Um gleich die partielle Integration anwenden zu können, benötigen wir auch eine
Stammfunktion von − 32 (1 − x)3/2
2
f (x) = x3/2
3
⇒
F (x) =
2 2 5/2
x
35
2
2
f (g(x))g 0 (x) = (1 − x)3/2 (−1) = − (1 − x)3/2
3
3
22
2
⇒
SF − (1 − x)3/2 =
(1 − x)5/2 + c
3
35
√
Damit können wir jetzt SF[x 1 − x] mit partieller Integration berechnen:
√
f 0 (x) = 1 − x ; g(x) = x
√
2
22
⇒ SF x 1 − x = − x(1 − x)3/2 −
(1 − x)5/2 + c
3
35
Von der Richtigkeit des Ergebnisses überzeugt man sich am besten immer durch
Differenzieren.
Ein sehr hilfreiches Konzept bei der Bestimmung einer Stammfunktion einer gebrochen rationalen Funktion f (x) = p(x)/q(x), mit Polynomen p(x) und
q(x) ist die Partialbruchzerlegung. Wie oben diskutiert läßt sich jede echt gebrochene rationale Funktion als Summe von Partialbrüchen der Form a1 /(x − x0 ),
a2 /(x−x0 )2 , . . . und (b1 x+c1 )/(x2 +rx+s), (b2 x+c2 )/(x2 +rx+s)2 ,. . . schreiben.
Bis auf den Term der Form a1 /(x − x0 ) können für diese Summanden mit dem
was wir bereits gelernt haben getrennt Stammfunktionen angegeben werden. Eine
Stammfunktion von f (x) ergibt sich dann durch Aufsummation der Stammfunktionen der einzelnen Summanden. Mit Hilfe der Substitution und dem ersten
Eintrag in unserer kleinen Liste von Stammfunktionen sieht man leicht, daß
1
1
+ c , k = 2, 3, . . . .
SF (x − x0 )−k = −
k − 1 (x − x0 )k−1
g(x) = 1 − x
⇒
Für den Fall k = 1 werden wir im nächsten Kapitel zeigen, daß
SF (x − x0 )−1 = ln |x − x0 | + c ,
(2.12)
mit der ihnen sicherlich aus der Schule bekannten natürlichen Logarithmusfunktion ln (x). Wir wollen Vorgreifen und dieses Ergebnis bereits hier verwenden. Zur
Bestimmung einer Stammfunktion der Summanden der Form (b1 x + c1 )/(x2 +
rx + s) gehen wir wie folgt vor. Es gilt
bx + c
b
2x + r − r + 2c/b
SF 2
= SF
x + rx + s
2
x2 + rx + s
b
2x + r
rb
1
= SF 2
+ c−
SF
2
x + rx + s
2
(x + r/2)2 + s − r2 /4
b
2x + r
c − rb/2
1
+
SF
.
= SF 2
2
x + rx + s
s − r2 /4
(x + r/2)2 /(s − r2 /4) + 1
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
29
Anwenden der Substitutionsregel zusammen mit Gl. (2.12) (erster Summand)
und dem letzten Eintrag unserer Liste von Stammfunktionen (zweiter Summand)
liefert das Ergebnis
b
c − rb/2
x + r/2
bx + c
= ln x2 + rx + s + p
arctan p
+ c(2.13)
.
SF 2
x + rx + s
2
s − r2 /4
s − r2 /4
Für höhere Potenzen (bx + c)(x2 + rx + s)l , mit l = 2, 3, 4, . . . gilt
bx + c
1 d
bx + c
SF
=−
SF
.
(x2 + rx + s)l
l − 1 ds
(x2 + rx + s)l−1
Durch wiederholtes Anwenden dieser Beziehung können die bei der Stammfunktionsbildung einer echt gebrochen rationalen Funktion auftretenden Terme dieser Form (also nach einer Partialbruchzerlegung der Funktion) auf das Ergebnis
Gl. (2.13) und mehrfache Differentiation zurückgeführt werden.
Auch wenn dieses Kapitel mit “Integralrechnung” überschrieben ist, haben
wir bis hierher nur von der Umkehrung der Differentiation und nicht von der
Integration geredet. Wir wollen nun die Integralrechnung über den Zusammenhang zwischen der Stammfunktion und der Flächenberechnung einführen. Für
eine stetige Funktion f (x) wollen wir die dunkel dargestellte Fläche für festes c
als Funktion von x0 betrachten und bezeichnen sie mit F̃ (x0 ):
F̃ (x0 ) = Fläche zwischen f (x) und der x-Achse von c bis x0
14
12
f(x)
10
8
6
4
2
0
0
1
2
3
4
x
c
5
x0
Wir untersuchen nun die Ableitung dieser Funktion F̃ (x0 )
F̃ (x0 + h) − F̃ (x0 )
.
h→0
h
F̃ 0 (x0 ) = lim
Aufgrund der Definition von F̃ (x0 ), ist F̃ (x0 + h) − F̃ (x0 ) die Fläche zwischen
f (x) und der x-Achse von x0 bis x0 + h.
30
KAPITEL 2. MATHEMATISCHE METHODEN
14
12
f(x)
10
8
6
4
x0
x0 +h
2
0
0
1
2
3
4
5
x
Vergrößert ergibt sich folgende Situation
f(x0)
f(x0+h)
x0
x 0 +h
x0 +α h
Wie man in der Skizze erkennt, gibt es ein α ∈ R mit 0 < α ≤ 1, so daß die Fläche
F̃ (x0 + h) − F̃ (x0 ) gleich der Fläche hf (x0 + αh) eines Rechtecks ist (man nennt
dieses den Mittelwertsatz, den sie in der HöMa Vorlesung “korrekt” beweisen
werden). Dabei kennen wir α nicht, was aber im folgenden keine Rolle spielen
wird. Wir haben damit
F̃ (x0 + h) − F̃ (x0 )
h→0
h
hf (x0 + αh)
= lim
h→0
h
= f (x0 ).
F̃ 0 (x0 ) = lim
Es ergibt sich also F̃ 0 (x0 ) = f (x0 ), was bedeutet, daß F̃ eine Stammfunktion von
f ist. Wir schreiben damit statt F̃ jetzt F . Als nächstes betrachten wir die Fläche
zwischen f (x) und der x-Achse von einem festen a bis zu einem festen b.
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
31
14
12
f(x)
10
8
6
4
2
0
0
1
a
2
3
x
4
5
b
Die übliche Bezeichnung für diese Fläche ist
Z
b
f (x) dx = Fläche zwischen f (x) und der x-Achse von a bis b,
a
so daß wir
Z
b
f (x) dx = F (b) − F (a)
(2.14)
a
schreiben können. Die beliebige Konstante, die wir bei der Bestimmung einer
Stammfunktion F immer hinzuaddieren mußten, fällt auf der rechten Seite dieser
Gleichung dabei heraus. Man bezeichnet den Zusammenhang in Gl. (2.14) als
Hauptsatz der Differential- und Integralrechnung. Er stellt einen Zusammenhang
zwischen dem Problem der Bestimmung einer Stammfunktion und dem Problem
der Flächenberechnung her. Man bezeichnet die linke Seite von Gl. (2.14) auch
als bestimmtes Integral.
Bei den obigen Überlegungen haben wir uns keine Gedanken darüber gemacht, wie Flächen mit krummlinigen Begrenzungen (durch die Funktion f (x))
überhaupt sauber definiert sind. Als Grenzprozedur läßt sich das z.B. mit Hilfe
der Riemann-Summe erreichen
32
KAPITEL 2. MATHEMATISCHE METHODEN
14
12
f(x)
10
8
6
4
2
0
0
1
a
Z
b
f (x) dx = lim
N →∞
a
2
∆x
N
X
3
x
f (a + i∆x) ∆x ;
i=1
4
5
b
∆x =
b−a
N
Diese Formel gibt auch eine Möglichkeit ein bestimmtes Integral numerisch zu
berechnen. Es gibt aber weit geschicktere numerische Berechnungsmöglichkeiten
als die obige Rechteckregel, wie z.B. die Trapezregel oder noch besser die SimpsonRegel.
Als ein Beispiel der Flächenmessung (bestimmte Integration) betrachten wir
f (x) = sin x
1
f(x)=sin(x)
0.8
f(x)
0.6
0.4
0.2
0
Z
0
0
π/2
x
π
π
sin x dx = − cos π − (− cos 0) = − cos x|π0 = 2
2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN
33
Es soll hier noch angemerkt werden, daß die Bezeichnung der Integrationsvariablen willkürlich ist, also
Z
b
Z
b
f (u) du
f (x) dx =
a
a
gilt.
Jetzt wollen wir die Regeln zur Bestimmung der Stammfunktion so umformulieren, daß wir mit ihrer Hilfe bestimmte Integrale berechnen können. Betrachten
wir zunächst die Substitutionsregel. Aus SF [f (g(x))g 0 (x)] = F (g(x)) folgt
b
Z
f (g(x))g 0 (x) dx = F (g(b)) − F (g(a))
Z g(b)
f (u) du ,
=
a
(2.15)
g(a)
indem wir zweimal den Hauptsatz anwenden. Um den Anschluß an Lehrbücher
zu finden, diskutieren wir diese Regel auch in der üblicheren Formulierung, die
sich gut als Merkregel eignet. Dabei führt man die “Substitution”
du
= g 0 (x)
dx
du
⇒ f (g(x))g 0 (x) dx = f (u) dx“ = ”f (u) du
dx
u = g(x)
⇒
aus. Das letzte Gleichheitszeichen steht dabei in Anführungszeichen, damit man
nicht vergißt, daß auch die Integrationsgrenzen verändert werden müssen (siehe Gl. (2.15)). In unserer ursprünglichen Herleitung mußten wir jedoch keine
infinitesimalen Größen kürzen, was ein klarer Vorteil ist. Der Umgang mit diesen Größen kann formalisiert werden, wenn man den Begriff der Differentialform
einführt, wozu wir jedoch hier keine Zeit haben. Dieser Begriff wird speziell in
der Thermodynamik gebraucht.
Die Produktregel übersetzt sich wie folgt auf bestimmte Integrale: Wegen
Z
a
b
dG(x)
dx = G(b) − G(a) = G(x)|ba
dx
folgt durch Integration von (f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x)
Z
b
0
f (x)g(x) dx =
a
f (x)g(x)|ba
Z
−
b
f (x)g 0 (x) dx ,
(2.16)
a
was die Bezeichnung partielle Integration erklärt. Beispiele werden sie in den
Übungen rechnen.
34
2.4
KAPITEL 2. MATHEMATISCHE METHODEN
Logarithmus- und Exponentialfunktion
Wir wollen als nächstes eine über ein Integral definierte Funktion
x
Z
L(x) =
1
1
du ,
u
x>0
(2.17)
betrachten.
4
f(u)=1/u
f(u)
3
2
x
1
0
0
1
2
u
3
4
Nach der Definition gilt L(1) = 0 und L(x) > 0 für x > 1. Für den Fall 0 < x < 1
ist das Integral in Gl. (2.17) genauso wie in Gl. (2.14) definiert, was, da hier
f (u) > 0 für alle u > 0 gilt, dazu führt, daß die Fläche zwischen f (u) und der
u-Achse von 1 bis x, also L(x), negativ ist. Es gilt also L(x) < 0 für 0 < x < 1.
L(x) ist weiterhin monoton wachsend. Für a > 0 betrachten wir
Z
ax
1
du
u
Z1 a
Z ax
1
1
=
du +
du
u
1 u
a
Z ax
1
= L(a) +
du.
u
a
L(ax) =
Im verbleibenden Integral verwenden wir die Substitution
Z
a
ax
1
du =
u
Z
ax
Za ax
=
a
a 1
du
ua
f (g(u))g 0 (u) du
2.4. LOGARITHMUS- UND EXPONENTIALFUNKTION
35
mit f (v) = 1/v und g(v) = v/a. Nach Gl. (2.15) gilt damit
Z
x
1
dt
1 t
= L(a) + L(x),
L(ax) = L(a) +
(2.18)
also z.B. für n ∈ N, L(xn ) = nL(x). Gl. (2.18) ist die bekannte Funktionalrelation
für die Logarithmusfunktionen. Die durch Gl. (2.17) definierte Funktion wird als
natürlicher Logarithmus bezeichnet, und wir schreiben ab jetzt ln(x) statt L(x)
Z
ln (x) =
1
x
1
dt ,
t
x > 0.
Man definiert eine wichtige Zahl e - die Eulersche Zahl - über die Gleichung
ln (e) = 1.
2
f(x)=ln(x)
f(x)
1
0
e=2.718282...
−1
−2
0
1
2
3
4
5
x
Aus der Skizze sieht man, daß e in der Nähe von 2.7 liegt. Genauer gilt e =
2.718282 . . .. Nach dem Hauptsatz folgt (ln (x))0 = 1/x. Für x → ∞ strebt auch
ln (x) gegen ∞, was man z.B. wie folgt sehen kann: Sei n ∈ N; dann gilt
ln (en x) = ln (en ) + ln (x) = n ln (e) + ln (x) = n + ln (x).
Für n → ∞ streben das Argument en x und der Funktionswert gegen ∞.
Die Umkehrfunktion ln−1 (x) des natürlichen Logarithmus - die Logarithmusfunktion ist injektiv - bezeichnet man als Exponentialfunktion und kürzt sie
exp (x) ab. Sie hat den Definitionsbereich Dexp = R.
36
KAPITEL 2. MATHEMATISCHE METHODEN
4
f(x)=ln(x)
f(x)=exp(x)
f(x)=x
f(x)
2
0
−2
−4
−4
−2
0
x
2
4
Es gilt also
exp (ln (x)) = x für x ∈ {x ∈ R|x > 0} = Dln = Wexp
ln (exp (x)) = x für x ∈ R = Dexp = Wln .
Aus der Funktionalgleichung des Logarithmus wollen wir jetzt eine entsprechende
Gleichung für exp (x) herleiten. Für a, b > 0 folgt mit a = exp (ln (a)) und b =
exp (ln (b))
exp (ln (ab)) = ab = exp (ln (a)) exp (ln (b)).
Die linke Seite dieser Gleichung kann nach Gl. (2.18) zu
exp (ln (ab)) = exp (ln (a) + ln (b))
umgeformt werden. Damit gilt dann
exp (ln (a) + ln (b)) = exp (ln (a)) exp (ln (b))
oder, da a, b > 0 beliebig waren,
exp (x + y) = exp (x) exp (y).
(2.19)
Diese Funktionalrelation sollte ihnen von den Potenzgesetzen bekannt vorkommen: xn xm = xn+m . In dieser Vorlesung haben wir sie bereits mehrfach benutzt.
Aus Gl. (2.19) folgt für x = y = 0, daß exp (0) = 1 gilt (was natürlich auch aus
der Definition von exp (x) als Umkehrfunktion von ln (x) und ln (1) = 0 folgt),
und für y = −x ergibt sich damit
exp (−x) =
1
.
exp (x)
(2.20)
2.4. LOGARITHMUS- UND EXPONENTIALFUNKTION
37
Eine wiederholte Anwendung von Gl. (2.19) liefert
exp (x1 + x2 + . . . + xn ) = exp (x1 ) exp (x2 ) . . . exp (xn ).
(2.21)
Aus e = exp (ln (e)) und ln (e) = 1 folgt exp (1) = e, sowie aus Gl. (2.21) mit
xi = 1 für alle i = 1, 2, . . . , n
exp (n) = en .
Mit Gl. (2.20) gilt dann auch
exp (−n) =
1
= e−n ,
en
d.h. für alle n ∈ Z ist die Exponentialfunktion die Potenzfunktion zur Basis e.
Diese Aussage gilt auch für rationale α ∈ Q mit α = n/m
n
n
n
n m
· exp
· . . . · exp
= exp
exp
m
m
m
m}
{z
|
m−mal
n
n
n
= exp
+
+ ... +
m m
m
= exp (n) = en ,
wobei wir Gl. (2.21) verwendet haben. Ziehen wir jetzt die m-te Wurzel, so folgt
n
exp
= en/m .
m
Da man jeder Zahl aus R mit einem α ∈ Q beliebig nahe kommen kann (siehe
die HöMa Vorlesung), gilt für alle x ∈ R
exp (x) = ex .
Aus der Schule sind sie es wahrscheinlich gewohnt, daß beide Ausdrücke (Exponentialfunktion und Potenz zur Basis e) von Anfang an synonym verwendet
werden, was wir im folgenden ebenfalls tun werden.
Die Ableitung der Exponentialfunktion können wir mit Hilfe von Gl. (2.5),
0
also f −1 (f (x)) = f 01(x) , für f (x) = ln (x), d.h. f 0 (x) = 1/x bestimmen:
exp0 (ln x) = x
⇒
exp0 (z) = exp (z)
Damit erfüllt die Exponentialfunktion y(x) = exp (x) die in der Physik sehr
wichtige Differentialgleichung
y 0 (x) = y(x),
die man als Wachstumsgleichung bezeichnen kann.
(2.22)
38
2.5
KAPITEL 2. MATHEMATISCHE METHODEN
Potenzreihen und Taylorentwicklung
Nach einem kleinen Einschub, werden wir auf Gl. (2.22) zurückkommen und mit
ihrer Hilfe die Reihendarstellung der Exponentialfunktion herleiten. Zunächst soll
aber erklärt werden, was eine Potenzreihe ist. Dazu betrachten wir die Funktionen
(N ∈ N0 , x ∈ R)
2
3
N
SN (x) = 1 + x + x + x + . . . + x =
N
X
xn .
n=0
Indem wir diese Gleichung mit x multiplizieren und mit +1−1 erweitern, erhalten
wir einen geschlossenen Ausdruck für SN (x)
xSN (x) = 1 + x + x2 + . . . + xN + xN +1 − 1
= SN (x) + xN +1 − 1
⇒ (1 − x)SN (x) = 1 − xN +1
1 − xN +1
.
⇒ SN (x) =
1−x
Für |x| < 1 geht der Term xN +1 im Zähler für N → ∞ gegen Null, d.h.
lim SN (x) =
N →∞
1
für |x| < 1.
1−x
Man kann die Funktion 1/(1 − x) für |x| < 1 also auch als unendliche Reihe (auch
Potenzreihe genannt)
∞
X
1
xn für |x| < 1
=
1 − x n=0
schreiben. Eine allgemeine Potenzreihe hat die Form
f (x) =
∞
X
an x n
n=0
mit an ∈ R. Für die gerade diskutierte spezielle so genannte geometrische Reihe
gilt an = 1 für alle n ∈ N0 . Die Frage für welche x eine unendliche Reihe (die durch
die Angabe aller an charakterisiert ist) überhaupt auf einen endlichen Wert führt,
d.h. konvergiert, werden wir hier nur am Rande betrachten. Sehr genau werden
sie diese Frage in der HöMa I Vorlesung untersuchen.
Fast alle (in der Physik) wichtigen Funktionen lassen sich durch Potenzreihen
darstellen, so z.B. auch die Exponentialfunktion. Um für diesen Fall die Entwicklungskoeffizienten an zu bestimmen betrachten wir die Differentialgleichung
2.5. POTENZREIHEN UND TAYLORENTWICKLUNG
39
(2.22) y(x) = y 0 (x), von der wir bereits wissen, daß sie von der Exponentialfunktion gelöst wird. Wir machen den Ansatz7
y(x) =
∞
X
an x
n
⇒
0
y (x) =
n=0
∞
X
an nxn−1 .
n=1
Dabei haben wir die unendliche Reihe summandenweise differenziert, was nur
dann erlaubt ist, wenn die Reihe bestimmte Konvergenzeigenschaften hat (siehe
die HöMa I Vorlesung). Umbenennen der Summationsvariablen n = ñ+1 in y 0 (x)
liefert
y 0 (x) =
∞
X
añ+1 (ñ + 1)xñ =
∞
X
an+1 (n + 1)xn .
n=0
ñ=0
Bildet man jetzt y 0 (x) − y(x), was nach der Differentialgleichung gleich Null ist,
so folgt8
∞
X
((n + 1)an+1 − an ) xn = 0
n=0
eine Gleichung, die sicherlich dann erfüllt ist, wenn
(n + 1)an+1 − an = 0 für alle n ∈ N0
(2.23)
gilt. Daß dieses Kriterium nicht nur hinreichend, sondern auch notwendig ist,
werden sie in der HöMa I Vorlesung beweisen (Identitätssatz für Potenzreihen).
Gl. (2.23) kann nun wie folgt umgeformt werden
an+1 =
=
=
=
=
1
an
n+1
1 1
an−1
n+1 n
1 1 1
an−2
n+1 n n−1
...
1
a0 .
(n + 1)!
Die Lösung von y 0 (x) = y(x) lautet damit
∞
X
1 n
y(x) = a0
x ,
n!
n=0
7
Das Lösen von Differentialgleichungen durch einen Potenztreihenansatz ist ein häufig verwendetes Verfahren.
8
Wir haben hier die beiden Summen unter ein Summenzeichen geschrieben. Auch diese
Operation ist nur dann zulässig, wenn die unendliche Reihe bestimmte Konvergenzeigenschaften
erfüllt, die sie in der HöMa I Vorlesung kennenlernen werden.
40
KAPITEL 2. MATHEMATISCHE METHODEN
mit der zunächst noch freien Konstanten a0 ∈ R, woraus y(0) = a0 folgt.9 Von
der Exponentialfunktion wissen wir jedoch bereits, daß exp (0) = 1 gilt. Damit
hat dann also die Exponentialfunktion die Potenzreihenentwicklung
exp (x) = ex =
∞
X
xn
n=0
n!
.
(2.24)
Diese Reihe konvergiert für alle x ∈ R (im Gegensatz zur geometrischen Reihe,
die nur für |x| < 1 konvergiert), was sie in HöMa I beweisen werden.
Wenn man eine Reihendarstellung für eine Funktion kennt, dann ist es interessant zu untersuchen, ob man die “komplizierte” Funktion (also z.B. die Exponentialfunktion), nicht bereits durch ein paar wenige “einfache” Summanden
der Potenzreihe gut approximieren (nähern) kann. Die folgende Abbildung zeigt
dazu ein Beispiel.
8
exp(x)
1
1+x
2
1+x+x /2!
2
3
1+x+x /2!+x /3!
2
3
4
1+x+x /2!+x /3!+x /4!
6
4
2
0
-2
-1
0
x
1
2
Man erkennt, daß für −1 ≤ x ≤ 1 bereits die ersten fünf Summanden eine sehr
gute Näherung für die Exponentialfunktion liefern. In dem betrachteten Beispiel
ist es tatsächlich so daß die Polynome
gN (x) =
N
X
xn
n=0
n!
für wachsendes N eine systematische Verbesserung der Approximation liefern speziell in der Nähe von x = 0.
Schaut man nur lange genug auf diese Abbildung, so fällt einem auf, daß die
Übereinstimmung der Funktionen in der Nähe von Null etwas mit der Gleichheit
von Ableitungen von exp (x) und den gN (x) bei x = 0 zu tun hat. Für die
Exponentialfunktion f (x) = exp (x) gilt
f (k) (0) = 1 da f (k) (x) = exp (x).
9
Dies ergibt sich da 00 = 1 gilt.
2.5. POTENZREIHEN UND TAYLORENTWICKLUNG
41
Für die Polynome gN (x) ergibt sich
(k)
gN (0)
=
1 für k ≤ N
0 für k > N,
so, daß für gN (x) die ersten N Ableitungen bei x = 0 mit denen der Exponentialfunktion übereinstimmen.
Diese Beobachtung können wir nun zu einem Konstruktionsprinzip zur Bestimmung einer polynomialen Näherung von Funktionen um einen gegebenen
Punkt herum (lokale Näherung) machen. Bei der Diskussion der Ableitung als
lineare Approximierbarkeit haben wir es in gewissem Sinne bereits kennengelernt:
Die Gleichung für die Tangente an eine Funktion ist das Polynom ersten Grades
g1 (x) und liefert eine Näherung für die Funktion. Man nennt ein Polynom vom
Grad n, wenn der Summand mit der höchsten auftretenden Potenz von x derjenige proportional zu xn ist. Betrachten wir also die allgemeine Funktion f (x).
Wir wollen nun die Koeffizienten an des Polynoms
gN (x) = a0 + a1 x + a2 x2 + . . . + aN xN
so bestimmen, daß die ersten N Ableitungen von gN (x) mit denen der Funktion
f (x) bei x = 0 übereinstimmen. Betrachten wir ein m ≤ N , so gilt
(m)
gN (0) = am m!
.
Damit ist klar, daß wir, um die Forderung zu erfüllen,
an =
1 (n)
f (0)
n!
(2.25)
wählen müssen. Es ergibt sich somit
gN (x) = f (0) +
1 0
1
1 (N )
f (0)x + f 00 (0)x2 + . . . +
f (0)xN .
1!
2!
N!
(2.26)
Man nennt diese Näherung von f (x) durch gN (x) die Taylorentwicklung um den
Punkt x = 0. In den Übungen haben sie sie bereits kennengelernt und g3 (x) für
zwei Beispielfunktionen berechnet.
• f (x) =
1
1−x
: g3 (x) = 1 + x + x2 + x3
42
KAPITEL 2. MATHEMATISCHE METHODEN
8
1/(1−x)
1
1+x
2
1+x+x
2
3
1+x+x +x
2
3
4
1+x+x +x +x
6
4
2
0
−1
0
x
1
Die sich ergebenden Terme sind aber gerade die ersten Summanden der geometrischen Reihe, so daß wir wissen, daß die Taylorentwicklung für immer
größere N und |x| < 1 eine immer bessere Näherung liefert. Für N → ∞
spricht man dann auch von der Taylorreihe. Für dieses Beispiel konvergiert
die über die Ableitungen von f definierte Taylorreihe (für |x| < 1) gegen die
Funktion f , was jedoch nicht immer der Fall sein muß (wie sie in späteren
Vorlesungen genauer untersuchen werden).
√
• f (x) = 1 + x : g3 (x) = 1 + 21 x − 12 41 x2 + 12 14 36 x3
Als weiteres Beispiel wollen wir hier die Funktion f (x) = ln (x + 1) um x = 0
Taylor-entwickeln.10 Nach Gl. (2.26) benötigen wir die Ableitungen von f (x) bei
x = 0:
f (x) = ln (x + 1) ⇒ f (0) = ln (1) = 0
1
f 0 (x) =
⇒ f 0 (0) = 1 = (−1)0 0!
x+1
1
f 00 (x) = (−1)
⇒ f 00 (0) = −1 = (−1)1 1!
(x + 1)2
1
f 000 (x) = (−1)(−2)
⇒ f 000 (0) = 2 = (−1)2 2!
3
(x + 1)
1
⇒ f (4) (0) = −6 = (−1)3 3!
f (4) (x) = (−1)(−2)(−3)
(x + 1)4
... = ...
1
f (N ) (x) = (−1)N −1 (N − 1)!
⇒ f (N ) (0) = (−1)N −1 (N − 1)!
(x + 1)N
10
Da ln (x) bei x = 0 divergiert - gegen −∞ geht - untersuchen wir die Funktion ln (x + 1).
2.5. POTENZREIHEN UND TAYLORENTWICKLUNG
43
Die Koeffizienten der Taylorentwicklung ergeben sich dann nach Gl. (2.25) zu
an =
1
1 (n)
1
f (0) = (−1)n−1 (n − 1)! = (−1)n−1 ,
n!
n!
n
also gilt
N
X
1
gN (x) =
(−1)n−1 xn .
n
n=1
1
0
−1
ln(1+x)
0
0+x
2
0+x−x /2
2
3
0+x−x /2+x /3
2
3
4
0+x−x /2+x /3−x /4
−2
−3
−1
−0.5
0
x
0.5
1
Bisher haben wir die Funktion f immer um den Punkt x = 0 entwickelt,
d.h. die ersten N Ableitungen von gN und f stimmen im Punkt x = 0 überein.
Möchte man jedoch die Funktion f in der Umgebung eines beliebigen Punktes x0
näherungsweise durch ein Polynom gN beschreiben, so bietet es sich an die an so
zu bestimmen, daß die Ableitungen bei x0 übereinstimmen
gN (x) = f (x0 ) +
+
1
1 0
f (x0 )(x − x0 ) + f 00 (x0 )(x − x0 )2 + . . .
1!
2!
1 (N )
f (x0 )(x − x0 )N .
N!
Als Beispiel betrachten wir wieder die Exponentialfunktion f (x) = exp (x) jetzt
aber bei x0 = 1. Es gilt
f (k) (1) = e da f (k) (x) = exp (x),
so daß sich
1
1
1
(x − 1)N
gN (x) = e 1 + (x − 1) + (x − 1)2 + . . . +
1!
2!
N!
44
KAPITEL 2. MATHEMATISCHE METHODEN
ergibt. Die Abbildung macht deutlich, daß g4 (x) mit den Koeffizienten der Entwicklung um den Punkt x = 1 in der Nähe von x = 1 eine wesentlich bessere
Näherung an die Exponentialfunktion liefert als das g4 (x) mit den aus der Entwicklung um x = 0 bestimmten an .
8
exp(x)
2
3
4
1+x+x /2!+x /3!+x /4!
2
3
4
e[1+(x−1)+(x−1) /2!+(x−1) /3!+(x−1) /4!]
6
4
2
0
−2
−1
0
x
1
2
Wie in diesem Beispiel lassen sich auch andere Funktionen um Punkte x0 Taylorentwickeln.
2.6
Hyperbolische und trigonometrische Funktionen als Potenzreihen: die imaginäre Einheit i
Die so genannten Hyperbelfunktionen Sinushyperbolikus sinh x und Kosinushyperbolikus cosh x sind über die Exponentialfunktion definiert
ex − e−x
sinh x =
;
2
ex + e−x
cosh x =
.
2
(2.27)
2.6. HYPERBOLISCHE UND TRIGONOMETRISCHE FUNKTIONEN
45
Drücken wir die Exponentialfunktion nun durch ihre Potenzreihendarstellung Gl.
(2.24) aus, so ergibt sich
ex + e−x
2
!
∞
∞
1 X xn X (−x)n
=
+
2 n=0 n! n=0 n!
cosh x =
∞
1X
xn
=
(1 + (−1)n )
2 n=0
n!
∞
X
x2n
=
,
(2n)!
n=0
(2.28)
da
1 + (−1)n
=
2
1 für n gerade
0 für n ungerade.
Analog folgt
ex − e−x
2
!
∞
∞
1 X xn X (−x)n
=
−
2 n=0 n! n=0 n!
sinh x =
∞
xn
1X
(1 − (−1)n )
=
2 n=0
n!
=
∞
X
n=0
x2n+1
.
(2n + 1)!
(2.29)
Die Ableitungen von sinh x und cosh x bestimmt man mit Hilfe der Definitionsgleichung (2.27) oder durch gliedweises Differenzieren der Reihendarstellungen:
x
0
e − e−x
ex + e−x
0
sinh x =
=
= cosh x
2
2
oder
0
sinh x =
∞
X
n=0
x2n+1
(2n + 1)!
!0
∞
X
(2n + 1) x2n
=
= cosh x.
(2n + 1) (2n)!
n=0
Analog folgt
cosh0 x = sinh x.
46
KAPITEL 2. MATHEMATISCHE METHODEN
Wie bei den trigonometrischen Funktionen definiert man auch noch den Tangenshyperbolikus
tanh x =
sinh x
cosh x
und den Kotangenshyperbolikus
coth x =
cosh x
.
sinh x
In der folgenden Abbildung sind die vier hyperbolischen Funktionen dargestellt.
4
2
0
sinh(x)
cosh(x)
tanh(x)
coth(x)
−2
−4
−4
−2
0
x
2
4
Um jetzt auch die trigonometrischen Funktionen als Potenzreihen darzustellen, betrachten wir zunächst einmal die Differentialgleichung zweiter Ordnung,
die y(x) = eax = exp (ax) erfüllt. Es gilt
(eax )0 = aeax
⇒
(eax )00 = a2 eax ,
so daß
y 00 (x) − a2 y(x) = 0
folgt. Im Anschluß an Gl. (2.6) (siehe auch Gl. (2.7)) hatten wir gezeigt, daß
y(x) = b sin (ax) + c cos (ax), mit a, b, c ∈ R die Differentialgleichung
y 00 (x) + a2 y(x) = 0
erfüllt. Erweitern wir jetzt die reellen Zahlen um die imaginäre Einheit i mit der
Eigenschaft
i2 = −1
2.6. HYPERBOLISCHE UND TRIGONOMETRISCHE FUNKTIONEN
47
so erfüllt
eiax =
∞
X
(iax)n
n=0
n!
(2.30)
die Differentialgleichung
y 00 (x) − (ia)2 y(x) = y 00 (x) − i2 a2 y(x) = y 00 (x) + a2 y(x) = 0
deren Lösung wir bisher als y(x) = b sin (ax)+c cos (ax) geschrieben hatten. Dabei
haben wir i bezüglich der Rechenregeln wie eine gewöhnliche Zahl behandelt, also
z.B. (ia)2 = i2 a2 , dann aber verwendet, daß i2 = −1 gilt. Betrachten wir nun
den Spezialfall a = 1. Für die Lösung der Differentialgleichung y 00 (x) + y(x) =
0 in der bisherigen Form können wir dann y(x) = c cos x + b sin x schreiben,
wobei die Randbedingungen (bzw. Anfangsbedingungen) durch y(0) = c und
y 0 (0) = b gegeben sind. Für die Lösung in der neuen Form eix ergeben sich die
Randbedingungen
0
eix |x=0 = ei0 = e0 = 1 und eix |x=0 = ieix |x=0 = i.
Sollen beide Lösungen die gleiche Funktion darstellen, so müssen nicht nur die
Differentialgleichungen identisch sein, sondern auch die Randbedingungen. Setzen
wir also c = 1 und b = i, so folgt
eix = cos x + i sin x.
(2.31)
Eine Größe der Form z = a + ib mit a, b ∈ R und der imaginären Einheit i nennt
man komplexe Zahl. Man bezeichnet die Menge der komplexen Zahlen mit C. Im
übernächsten Kapitel werden wir tiefer in das Konzept der komplexen Zahlen
eindringen.
Aus Gl. (2.31) wollen wir die Potenzreihendarstellungen von cos x und sin x
extrahieren. Dazu betrachten wir Potenzen von i:
i0 = 1; i1 = i; i2 = −1; i3 = i2 i = (−1)i = −i; i4 = i2 i2 = (−1)(−1) = 1
Für n ∈ N0 haben wir somit
i2n = (i2 )n = (−1)n ; i2n+1 = i2n i = (−1)n i.
Diese Eigenschaften nutzen wir nun aus, um Gl. (2.30) für den Spezialfall a = 1
umzuschreiben
∞
X
(ix)n
ix
e
=
n!
n=0
=
∞
X
(ix)2n
n=0
∞
X
(2n)!
+
∞
X
(ix)2n+1
(2n + 1)!
n=0
∞
X
x2n
x2n+1
=
(−1)
+i
.
(−1)n
(2n)!
(2n + 1)!
n=0
n=0
n
48
KAPITEL 2. MATHEMATISCHE METHODEN
Ein Vergleich mit Gl. (2.31) liefert dann
cos x =
∞
X
(−1)n
n=0
∞
X
x2n
,
(2n)!
(2.32)
x2n+1
sin x =
(−1)
.
(2n + 1)!
n=0
n
(2.33)
Die Namensgebung der hyperbolischen Funktionen wird nun durch einen Vergleich der Gln. (2.32) und (2.33) mit den Gln. (2.28) und (2.29) klar. Daß es
sich bei den durch die Gln. (2.32) und (2.33) gegebenen Funktionen um die in
der Schule mit Hilfe rechtwinkliger Dreiecke definierten Funktionen handelt, ist
jedoch nicht vollständig offensichtlich. Was aber klar ist:
• Da nur gerade bzw. ungerade Potenzen von x in cos x bzw. sin x auftreten,
ist cos x eine gerade Funktion und sin x eine ungerade.
• sin 0 = 0 und cos 0 = 1.
• Gliedweise Differentiation liefert
∞
X
x2n+1
(−1)n
(2n + 1)!
n=0
sin0 x =
=
∞
X
(−1)n
n=0
!0
(2n + 1) x2n
(2n + 1) (2n)!
= cos x
und analog cos0 x = − sin x.
Alle diese Eigenschaften gelten analog für die ihnen bekannten trigonometrischen
Funktionen, und sie machen daher plausibel, daß es sich tatsächlich um diese
Funktionen handelt.
Für das Beispiel der Sinusfunktion wollen wir jetzt noch kurz untersuchen,
wie gut sich sin x durch einige wenige Terme der Potenzreihe11
gN (x) =
N
X
n=0
(−1)n
x2n+1
(2n + 1)!
approximieren läßt.
11
Die Potenzreihen des sin und cos entsprechen, wie in den Beispielen im letzten Kapitel,
wieder der Taylorreihe für eine Entwicklung der Funktion um den Punkt x = 0.
2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
49
1
0.5
0
sin(x)
g1(x)
g2(x)
g3(x)
−0.5
−1
−4
−2
0
x
2
4
Aus der Abbildung wird klar, daß für hinreichend kleine |x| bereits die ersten paar
Terme eine sehr gute Näherung liefern.12 Die Entwicklung der trigonometrischen
Funktionen in niedrigen Ordnungen spielt in der Physik eine große Rolle und wird
ihnen im Mechanik Teil dieser Vorlesung und der Vorlesung Experimentalphysik
I spätestens bei der Diskussion der Schwingungen (mit kleiner Amplitude) eines
Fadenpendels begegnen.
2.7
Gewöhnliche Differentialgleichungen
Differentialgleichungen sind uns im Laufe dieser Vorlesung bereits mehrfach begegnet, speziell auch in physikalischen Beispielen, was ihre Wichtigkeit innerhalb
der Physik verdeutlicht. Dabei dient der Begriff gewöhnliche Differentialgleichung
die von uns bisher betrachteten Situationen mit einer Veränderlichen von partiellen Differentialgleichungen zu unterscheiden, bei denen Ableitungen nach mehreren Variablen auftreten. Wie die Kapitelüberschrift ausdrückt, werden wir uns
hier auf den ersten Fall konzentrieren. Die Theorie der partiellen Differentialgleichungen ist noch weitaus komplexer als die bereits recht komplizierte Theorie der
gewöhnlichen Differentialgleichungen.
Als Beispiel zur Motivation wollen wir erneut die (eindimensionale) Newtonsche Gleichung mẍ(t) = F (x(t), ẋ(t); t) heranziehen, die wir hier in der Form
erweitert haben, daß die Kraft nicht nur vom Ort, sondern auch von der Geschwindigkeit, sowie der Zeit selbst abhängen kann. Sätze zur Existenz und zur
Eindeutigkeit von Lösungen von Differentialgleichungen13 werden sie in den HöMa
Vorlesungen kennen lernen. Hier sind wir daran interssiert Lösungsverfahren vorzustellen. In Form des Potenzreihenansatzes haben sie bereits eine recht allgemei12
Die Abbildung verdeutlicht auch noch einmal, daß es sich bei der durch die Potenzreihe
definierten Funktion tatsächlich um die geometrisch definierte Sinusfunktion handelt.
13
Von jetzt an unterdrücken wir wieder das Adjektiv “gewöhnlich”.
50
KAPITEL 2. MATHEMATISCHE METHODEN
ne (aber natürlich nicht immer erfolgreiche) Strategie zur Lösung von Differentialgleichungen kennen gelernt. Wie bereits oben angedeutet ist es im Allgemeinen
sehr schwierig analytische Lösungen von Differentialgleichungen zu finden. Es gibt
bestimmte Typen von Gleichungen für die es Verfahren gibt, die einen Erfolg garantieren. Um uns dieser Frage zu nähern, müssen wir die Differentialgleichungen
genauer klassifizieren.
Eine Differentialgleichung ist allgemein in impliziter Form durch
F (x, y(x), y 0 (x), y 00 (x), . . . , y (n) (x)) = 0
gegeben. Wie wir es aus unseren obigen Beispielen kennen, gehört zu der Gleichung ein Satz von Anfangsbedingungen für die gesuchte Funktion und ihre Ableitungen. Den Begriff der Ordnung einer Differentialgleichung als die höchste
auftretende Ableitung haben wir bereits kennengelernt. Eine Differentialgleichung
heißt linear, falls sie in der Form
a0 (x)y(x) + a1 (x)y 0 (x) + a2 (x)y 00 (x) + . . . + an (x)y (n) (x) = f (x)
geschrieben werden kann, d.h. die gesuchte Funktion y(x) und alle ihre Ableitungen nur linear auftreten. Die Funktion f (x) bezeichnet man in diesem Kontext
als die Inhomogenität.
Wir betrachten zunächst Gleichungen erster Ordnung der Form
y 0 (x) = F (x, y(x)) .
Man bezeichnet die Gleichung als separabel falls F (x, y(x)) = f (x)g(y(x)) mit
zwei Funktionen f und g gilt. In diesem Fall läßt sich die Differentialgleichung
“einfach” durch Separation der Variablen lösen. Dazu teilen wir auf beiden Seiten
der Gleichung
dy
= f (x)g(y(x))
dx
durch g und multiplizieren formal mit “dx”. Das liefert die Beziehung
dy
= f (x)dx .
g(y)
Durch Integration auf beiden Seiten erhalten wir
Z x
Z y
1
0
dy =
f (x0 ) dx0 ,
0
y0 g(y )
x0
wobei wir die Anfangsbedingung y(x0 ) = y0 verwendet haben. Wir müssen also
noch die Stammfunktionen G̃ (linke Seite) und F (rechte Seite) der Ausdrücke
2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
51
auf beiden Seiten der Gleichung bestimmen. Dies liefert uns die gesuchte Lösung
y(x) in impliziter Form
G̃(y(x)) − G̃(y0 ) = F (x) − F (x0 ) .
Nach bilden der Umkehrfunktion G̃−1 von G̃ (was natürlich nicht immer möglich
sein wird) folgt somit als für Lösung der Differentialgleichung
−1
F (x) − F (x0 ) + G̃(y0 ) .
y(x) = G̃
Durch Differenzieren überzeugt man sich leicht davon, daß diese Gleichung die
Differentialgleichung löst und durch einsetzen von x = x0 , daß auch die geforderte
Anfangsbedingung gilt. Anhand dieses Beispiels sehen wir (erneut; siehe die bisher diskutierten konkreten Beispiele von Differentialgleichungen erster Ordnung),
daß es uns bei der Gleichung erster Ordnung möglich ist, eine Anfangsbedingung
zu erfüllen. Für das Beispiel der Bewegung einer Masse mit Hookscher Feder, die
durch eine Gleichung zweiter Ordnung gegeben ist, war es möglich zwei Anfangsbedingungen (für Ort und Geschwindigkeit zur Zeit t = 0) zu erfüllen.
Es ist nur für den konkreten Fall beantwortbar, ob sich die beiden notwendigen Stammfunktionen geschlossen analytisch angeben lassen und ob es möglich
ist die Umkehrfunktion G̃−1 zu bestimmen. Wir betonen, daß es mit diesem Verfahren möglich ist Lösungen auch für nicht-lineare Gleichungen erster Ordnung
zu bestimmen (solange die Differentialgleichung separable ist).
Wir wollen für dieses Lösungsverfahren ein Beispiel aus der klassischen Mechanik betrachten. Die durch den Luftwiderstand verursachte Kraft auf ein sich
bewegendes, hinreichend großes Teilchen (Tennisball, Fußball,. . . ) hat in guter
Näherung den Betrag cv 2 , mit einer positiven Konstanten c und zeigt in Richtung −~v /|~v |.14 Wir betrachten nun ein Teilchen der Masse m welches sich mit
Geschwindigkeit ~v (t) bewegt und ausschließlich der Kraft die durch den Luftwiderstand hervorgerufen wird ausgesetzt ist. In dem wir das Koordinatensystem15
so legen, daß die x-Achse in die Richtung von ~v zeigt, reduziert sich die aus der
Newtongleichung folgende Bewegungsgleichung auf eine eindimensionale
m
dv
= −cv 2 ,
dt
mit der Anfangsbedingung v(t = 0) = v0 (Anfangsgeschwindigkeit v0 , willkürliche
Wahl des Zeitnullpunktes). Diese nicht-lineare Gleichung können wir mit dem
oben beschriebenen Verfahren lösen. Es ergibt sich
Z v
Z t
0−2
0
m
v dv = −c
dt0
v0
14
0
Ich gehe davon aus, daß sie aus der Schule mit dem Vektorbegriff vertraut sind. Mehr dazu
später.
15
Ich gehe erneut davon aus, daß ihnen dieser Begriff geläufig ist.
52
KAPITEL 2. MATHEMATISCHE METHODEN
und damit
−m(v −1 − v0−1 ) = −ct ,
bzw. aufgelöst nach v(t)
v(t) =
v0
,
1 + t/τ
mit der charakteristischen Zeit τ = m/(cv0 ). Für Zeiten t τ geht die Geschwindigkeit (in x-Richtung) somit wie v(t)/v0 ≈ (t/τ )−1 gegen Null.
Als nächste Klasse betrachten wir lineare Differentialgleichungen erster Ordnung der Form
dy
= a(x)y(x) + f (x) .
dx
(2.34)
Um die Lösung zu bestimmen gehen wir zunächst zur homogenen Gleichung
dy
= a(x)y(x)
dx
über. Wie oben ergibt sich als Lösung dieser
Z x
ln y(x) − ln(y0 ) =
a(x0 ) dx0 ,
x0
oder nach y(x) aufgelöst
Z
x
0
y(x) = y0 exp
a(x ) dx
0
.
x0
Eine sogenannte partikuläre Lösung yp (x) der inhomogenen Gleichung bestimmen
wir nun durch Variation der Konstanten, d.h. wir lassen die Konstante y0 von x
abhängen. Der Ansatz zur Lösung von Gl. (2.34) lautet somit
Z x
0
0
a(x ) dx ,
yp (x) = g(x) exp
x0
mit der noch zu bestimmenden Funktion g(x). Differenzieren liefert
Z x
Z x
dyp (x)
dg(x)
0
0
0
0
=
exp
a(x ) dx + g(x) a(x) exp
a(x ) dx
dx
dx
x0
x0
Z x
dg(x)
0
0
=
exp
a(x ) dx + a(x)yp (x) .
dx
x0
Die rechte Seite muß nun gleich a(x)yp (x) + f (x) sein, woraus sich eine Differentialgleichung für g ergibt
Z x
dg(x)
0
0
= f (x) exp −
a(x ) dx .
dx
x0
2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
53
Die Lösung dieser Gleichung ist
Z
x
g(x) =
f (x0 ) exp −
x0
Z
!
x0
a(x00 ) dx00 dx0 .
x0
Damit ergibt sich für die partikuläre Lösung
Z x
Z x
0
00
00
f (x ) exp
a(x ) dx dx0 .
yp (x) =
x0
x0
Die allgemeine Lösung der inhomogenen Gleichung ergibt sich als Summe der
allgemeinen Lösung der homogenen Gleichung und der partikulären Lösung zu
Z x
Z x
Z x
00
00
0
0
0
a(x ) dx dx0 ,
y(x) = y0 exp
a(x ) dx +
f (x ) exp
x0
x0
x0
wobei wir bereits die Anfangsbedingung y(x0 ) = y0 berücksichtigt haben.
Auch für dieses bereits etwas aufwendigere Lösungsverfahren wollen wir ein
Beispiel aus der klassischen Mechanik betrachten. Betrachten wir dazu erneut den
Luftwiderstand, diesmal jedoch für ein sehr kleines Teilchen, z.B. den Öltropfen
im Millikan Experiment zur Bestimmung der Ladung des Elektrons.16 In diesem
Fall ist die resultierende Kraft in guter Näherung durch F~ = −b~v , mit der positiven konstanten b, gegeben. Wir betrachten nun ein Teilchen der Masse m,
welches sich unter dem Einfluß der Gravitation und dem Luftwiderstand vertikal nach unten bewegt (fallendes kleines Teilchen mit Luftwiderstand). Durch
geschickte Wahl des Koordinatensystems ergibt sich die eindimensionale Bewegungsgleichung
m
dv
= mg − bv ,
dt
mit der Erdbeschleunigung g und der Anfangsbedingung v(t = 0) = v0 . Diese
lineare Differentialgleichung mit Inhomogenität mg läßt sich durch Variation der
Konstanten lösen. Die Lösung der homogenen Gleichung ist
v(t) = v0 exp (−t/τ ) ,
mit der charakteristischen Zeit τ = m/b. In Abwesenheit der Gravitation nimmt
somit die Geschwindigkeit ausgehend von der Anfangsgeschwindigkeit exponentiell ab. Für die Lösung der inhomogenen Gleichung erhalten wir
Z t
Z t
−1
00
v(t) = v0 exp (−t/τ ) + g
exp −
τ dt dt0
0
t0
= v0 exp (−t/τ ) + vfinal (1 − exp (−t/τ )) ,
16
Ich hoffe, daß sie von diesem Experiment in der Schule gehört haben.
54
KAPITEL 2. MATHEMATISCHE METHODEN
mit der Endgeschwindigkeit zur Zeit t → ∞, vfinal = gτ = mg/b. Betrachten
wir hier nur den Fall verschwindender Anfangsgeschwindigkeit v0 = 0, so sehen wir, am zweiten Term der Summe, daß die Geschwindigkeit ausgehend von
Null zunimmt und sich exponentiell dem konstanten asymptotischen Wert vfinal
annähert. Kleine Teilchen unter Einfluß der Graviation und des Luftwiderstandes
fallen also nach hinreichend langer Zeit (also wenn sie zuvor nicht auf den Boden
auftreffen) mit konstanter Geschwindigkeit.
Nicht-lineare Differentialgleichungen lassen sich nur in Ausnahmefällen analytisch lösen, z.B. wenn sie erster Ordnung und separabel sind. Manchmal führt ein
Potenzreihenansatz zum Erfolg. Ein lösbares Beispiel für die diese Bedingungen
nicht gelten ist die Bernoulli Gleichung der Form
y 0 (x) = a(x)y(x) + b(x)y α (x) ,
mit α 6= 0, 1. Sie läßt sich durch Substitution in eine lineare Gleichung überführen
y −α (x) y 0 (x) = a(x)y 1−α (x) + b(x)
1
u0 (x) = a(x)u(x) + b(x) ,
⇒
1−α
mit
u(x) = y 1−α (x) ,
u0 (x) = (1 − α)y −α (x) y 0 (x) .
Die lineare Gleichung läßt sich dann lösen.
Neben der Suche nach einer analytischen Lösung ist es für den Physiker
natürlich auch zulässig Differentialgleichungen numerisch zu lösen. Dazu gibt es
gut funktionierende und etablierte Verfahren, auf die wir aus Zeitgründen hier
jedoch nicht eingehen können.
Weil sie in der Physik eine wichtige Rolle spielen und zusätzlich ein Hilfsmittel
zur Lösung von Gleichungen höherer Ordnung darstellen (wir werden sehen wie)
wollen wir noch auf gekoppelte Systeme linearer Differentialgleichungen eingehen.
Dazu benötigen wir aber die Begriffe Matrix, Diagonalisierung, Eigenwert und
Eigenvektor die wir erst später kennen lernen werden. Daher müssen wir diesen
Aspekt auf das Ende des mathematischen Teils dieser Vorlesung verschieben.
2.8
Komplexe Zahlen
Anlaß zur Erweiterung der Menge der reellen Zahlen R war die Beobachtung,
daß viele quadratische, kubische und quartische Gleichungen, z.B. die einfache
quadratische Gleichung x2 + 2 = 0, keine reellen Lösungen besitzen. Veröffentlicht wurde eine solche Erweiterung erstmalig 1545 durch Gerolamo Cardano. Seit
1539 wurde die den komplexen Zahlen zugrundeliegende Idee zur Lösung kubischer Gleichungen jedoch in speziellen Fällen bereits von einem gewissen Tartaglia “kommerziell” genutzt - der seinen “Trick” zur Lösung jedoch geheimgehalten
2.8. KOMPLEXE ZAHLEN
55
hatte. Nachdem er Cardano einen “Geheimhaltungsschwur” hatte schwören lassen, verriet Tartaglia selbigem seine Methode. Dieser erweiterte sie und veröffentlichte seine Ergebnisse dennoch.
Die fundamentale Beobachtung ist, daß man mit √
der scheinbar sinnlosen
Lösung der obigen quadratischen Gleichung x1/2 = ± −2 so weiter rechnen
kann, als wenn es sich um eine reelle Zahl handeln würde. Zum Beispiel gilt
x1 + x2 = 0 und
√ x1 x2 = 2. Bereits im letzten Kapitel hatten wir die übliche
Abkürzung i = −1 eingeführt. Für zwei gegebene reelle Zahlen a, b ∈ R nennt
man das zunächst formale Konstrukt z = a + ib eine komplexe Zahl. Dem reellen
Paar (a, b) wird eine komplexe Zahl zugeordnet
(a, b) → a + ib .
Es gilt also z.B. (0, 1) → i oder (2, +1/2) → 2 + i 0.5. Wie bereits erwähnt
bezeichnet man die Menge der komplexen Zahlen, also die Paare (a, b) mit C. Oft
werden die komplexen Zahlen in der sogenannten komplexen (oder Gaußschen)
Zahlenebene graphisch dargestellt. Die erste Komponente der komplexen Zahl
nennt man Realteil (a = Re[z]) und die zweite Imaginärteil (b = Im[z]).
1+2i=(1,2)
1
1
−2−0.5i=(−2,−0.5)
Für diese Zahlenpaare definiert man nun Verknüpfungen, so daß man mit ihnen
rechnen kann wie mit reellen Zahlen.
• Addition: z1 + z2 = (a + ib) + (c + id) = a + c + ib + id = a + c + i(b + d). Für
die Paare (a, b) und (c, d) also (a, b) + (c, d) = (a + c, b + d). Dargestellt in
der Gaußschen Zahlenebene entspricht die komplexe Addition der üblichen
Vektoraddition (siehe später).
56
KAPITEL 2. MATHEMATISCHE METHODEN
z1+z2
z1
b
d
z2
a c
• Multiplikation: z1 z2 = (a + ib)(c + id) = ac + ibc + iad + i2 bd = ac − bd +
i(bc + ad). Für die Paare (a, b) und (c, d) also (a, b)(c, d) = (ac − bd, bc + ad).
Es gilt damit
Re [(a + ib)(c + id)] = ac − bd
Im [(a + ib)(c + id)] = bc + ad .
Um diese Rechenregel in der komplexen Zahlenebene darzustellen, ist es
nützlich, die Punkte in Polarkoordinaten anzugeben.
b
ρ
ϕ
a
Die Länge des Vektors vom Ursprung (0, 0) zum Punkt (a, b) nennt man
den Absolutbetrag |z| der komplexen Zahl z. Man schreibt
√
ρ = |z| = |a + ib| = a2 + b2 .
Den Winkel ϕ, der nur bis auf ganzzahlige Vielfache von 2π definiert ist,
bezeichnet man oft als Arcus und schreibt
ϕ = arc(z) = arc(a + ib) .
Aus der Skizze ist klar, daß a = ρ cos ϕ und b = ρ sin ϕ, und
b
.
ϕ = arctan
a
(2.35)
2.8. KOMPLEXE ZAHLEN
57
Damit können wir z zu
z = a + ib = ρ cos ϕ + iρ sin ϕ = ρeiϕ
umschreiben, wobei wir Gl. (2.31) verwendet haben. Die Gl. (2.35) gilt
zunächt nur für a > 0 und b > 0 wie in der Skizze. Allgemeiner gilt (in den
vier Quadranten der komplexen Ebene)

0 für a > 0, b > 0



b
π für a < 0, b > 0
+
ϕ = arctan
π für a < 0, b < 0

a


2π für a > 0, b < 0 ,
wobei noch einmal zu betonen ist, daß ϕ nur bis auf Vielfache von 2π eindeutig definiert ist. Für a = b = 0 ist der Winkel nicht definiert.
√
√ Betrachten
4
+
4
=
2
2
wir als Beispiel diekomplexe Zahl z = 2 + i2. Dann gilt
ρ
=
√ iπ/4
2
und ϕ = arctan 2 = arctan 1 = π/4. Also 2 + i2 = 2 2e .
Mit Hilfe dieser Einsichten können wir die Multiplikation zweier komplexer
Zahlen in der Polardarstellung ausführen
z1 z2 = ρ1 eiϕ1 ρ2 eiϕ2 = ρ1 ρ2 ei(ϕ1 +ϕ2 )
und geometrisch interpretieren: Die Absolutbeträge werden multipliziert
und die Polarwinkel addiert. Als Beispiel betrachten wir die Multiplikation
von z1 = 2 + i2 mit z2 = −1 + i0 = −1, d.h. der rein reellen Zahl −1
- wir nehmen also das negative von z1 : Wir haben c = −1 und d = 0.
Damit folgt nach oben z1 z2 =
− bd + i(bc + ad) = −a − ib = −2√
− i2. In
√ aciπ/4
iπ
Polardarstellung gilt z1 = 2 2e , z2 = e und damit z1 z2 = 2 2eiπ5/4
oder graphisch:
2
-1
2+i2
2
-2-i2
Die Subtraktion zweier komplexer Zahlen ergibt sich dann aus der Zusammensetzung der Regeln für die Multiplikation mit −1 und der Addition.
58
KAPITEL 2. MATHEMATISCHE METHODEN
• Division: Bevor wir die Division zweier komplexer Zahlen definieren wollen, ist es sinnvoll, den Begriff der zu z konjugiert komplexen Zahl z ∗ (oft
auch z̄) einzuführen. Sie ist wie folgt gegeben
⇒
z = a + ib
z ∗ = a − ib ,
d.h. der Imaginärteil von z geht in −Im[z] über. Damit läßt sich der Absolutbetrag von z, |z|, leicht durch z und z ∗ ausdrücken. Aus zz ∗ = (a +
ib)(a − ib) = a2 + b2 folgt
|z| = (zz ∗ )1/2 .
Nun zur Definition der Division. Sei dazu z2 = c + id 6= 0 + i0. Dann
betrachten wir17
a + ib
(a + ib)(c − id)
ac + bd + i(bc − ad)
z1
=
=
=
,
z2
c + id
(c + id)(c − id)
c2 + d 2
d.h. wir haben
a + ib
ac + bd
;
Re
= 2
c + id
c + d2
a + ib
bc − ad
Im
,
= 2
c + id
c + d2
und der “Trick” zur Berechnung war, mit dem konjugiert komplexen des
Nenners zu erweitern. In Polarkoordinaten gilt
z1
ρ1 eiϕ1
ρ1 i(ϕ1 −ϕ2 )
=
=
e
,
iϕ
2
z2
ρ2 e
ρ2
da e1ix = e−ix . Als Spezialfall betrachten wir
koordinaten z1 = ρ1 e−iϕ und graphisch
2
1
z
=
z∗
zz ∗
=
z∗
,
|z|2
oder in Polar-
z=2+i2
ϕ
−ϕ 2
1/z
17
Es kann aber durchaus c = 0 sein, wenn gleichzeitig d 6= 0 gilt, bzw. d = 0, wenn gleichzeitig
c 6= 0.
2.8. KOMPLEXE ZAHLEN
59
Wie für reelle Zahlen kann man nun Funktionen von komplexen Zahlen bilden
- deren Funktionswert dann im Allgemeinen wieder eine komplexe Zahl ist. Bereits
mehrfach ist uns das Beispiel exp (ix), mit x ∈ R, also die Exponentialfunktion
mit rein imaginärem Argument begegnet. Man kann aber auch allgemeiner
f (z) = exp z =
∞
X
zn
n=0
n!
= exp (a + ib) = exp (a) exp (ib)
definieren, oder z.B. sin z und cos z. Solche Funktionen und ihre komplexe Differentiation (nach z) und Integration werden im Rahmen der Funktionentheorie
untersucht. Ein Besuch der Mathematikvorlesung über Funktionentheorie empfiehlt sich für jeden Physikstudenten.
Manchmal dienen die komplexen Zahlen nur als Rechentrick - z.B. beim Integrieren; sie werden die entsprechenden Methoden in späteren Vorlesungen kennen lernen - jedoch vereinfachen sich im Rahmen der komplexen Zahlen auch
viele mathematische Aussagen, so daß sie ebenfalls von struktureller Bedeutung
sind. Zum Beispiel gilt der hier nicht bewiesene Fundamentalsatz der Algebra:
Sei PN (z) = a0 + a1 z + a2 z 2 + . . . + aN z N ein Polynom N -ten Grades, so hat
es in der komplexen Ebene N Nullstellen zi (mit PN (zi ) = 0), wobei n-fache
Nullstellen n-fach gezählt werden. Wir betrachten dazu ein Beispiel: Die reelle
Gleichung x6 − 1 = 0 hat die beiden reellen Nullstellen x1/2 = ±1. Die komplexe
Gleichung z 6 − 1 = 0 hat dagegen vier weitere komplexe Nullstellen. Diese wollen
wir jetzt finden. Mit z 6 = 1 gilt auch (z ∗ )6 = 1, oder nach Multiplikation beider
Gleichungen (zz ∗ )6 = 1, d.h. ρ12 = 1. Da ρ ≥ 0 reell ist, folgt ρ = 1. Damit haben
die zu bestimmenden Nullstellen die Form zn = eiϕn mit ϕn ∈ R. Wir betrachten
6
dann zn6 = (eiϕn ) = ei6ϕn = 1. Da ei2πm = 1 mit m ∈ Z gilt (siehe komplemit
xe Zahlenebene), folgt durch Gleichsetzen 6ϕn = 2πn und damit ϕn = n 2π
6
n = 0, 1, 2, 3, 4, 5.18 Die zugehörigen zn bezeichnet man als 6-te Einheitswurzeln.
n=2 1
n=1
n=3
n=0
1
n=4
18
n=5
Für n = 6 ergibt sich dieselbe Lösung wie für n = 0, für n = 7 dieselbe wie für n = 1, usw..
60
KAPITEL 2. MATHEMATISCHE METHODEN
2.9
Vektorrechnung
Wir werden den Vektorbegriff anschaulich einführen und beschränken uns zunächst
auf den zweidimensionalen euklidischen Raum. Die Elemente dieses Raumes sind
Punkte P , Q, R, S,. . . . Geordnete Paare (P, Q) von Punkten werden mit einer
Linie mit Pfeil verbunden, der vom Angriffspunkt P zum Zielpunkt Q zeigt: P~Q.
Zwei solcher Pfeile sind äquivalent, wenn sie gleichsinnig parallel sind und gleiche
Länge haben. Ein einzelner Pfeil einer Klasse äquivalenter Pfeile heißt Repräsentant des Vektors bzw. kurz Vektor. Vektoren im euklidischen Raum werden wir
mit lateinischen Buchstaben mit einem Pfeil ~a, ~b,. . . bezeichnen.
Q
S
R
P
Diese Vektoren wollen wir nun z.B. durch Addition miteinander verknüpfen
und durch die Multiplikation eines Vektors mit einer reellen (oder komplexen)
Zahl - einem Skalar - einen Vektor auf einen anderen abbilden. Die Addition
zweier Vektoren ~a +~b ist wie folgt definiert: Man wählt aus der Klasse ~a einen beliebigen Pfeil (P, Q) und aus der Klasse ~b den Pfeil (Q, R) mit dem Angriffspunkt
Q und definiert
~ = P~R
~a + ~b = P~Q + QR
R
b
a+b
a
P
Offensichtlich ist die Addition von Vektoren
• kommutativ: ~a + ~b = ~b + ~a
~
~
• assoziativ: ~a + b + ~c = ~a + b + ~c
Q
2.9. VEKTORRECHNUNG
61
• und hat ein neutrales Element, den Nullvektor ~0, d.h. die Klasse von Pfeilen
bei denen Angriffs- und Zielpunkt zusammenfallen und für den ~a + ~0 = ~a
gilt.
• Es ist anschaulich klar, daß es zu jedem Vektor ~a einen Vektor ~b gibt, so
daß ~a + ~b = ~0. Wir bezeichnen den Vektor ~b auch mit −~a.
Allgemein nennt man die algebraische Struktur bestehend aus einer Menge G
(hier die anschaulich über Pfeile im zweidimensionalen euklidischen Raum definierten Vektoren) und einer Verknüpfungsvorschrift der Elemente von G (hier die
ebenfalls anschaulich definierte und mit + bezeichnete Addition zweier Vektoren)
welche den obigen vier Eigenschaften genügt, eine abelsche Gruppe. Neben den
obigen “Pfeilen” bilden z.B. die ganzen Zahlen mit der gewöhnlichen Addition
als Verknüpfungsvorschrift eine abelsche Gruppe.
Kehren wir von dieser abstrakten Sichtweise zu den anschaulich definierten
Vektoren in der zweidimensionale Ebene zurück. Die Multiplikation eines Vektors
mit einer reellen Zahl soll wie folgt definiert sein: Die Pfeile λ~a sind für λ > 0
gleichsinnig parallel und für λ < 0 gegensinnig parallel zu den Pfeilen der Klasse
~a. Sie haben die Länge |λ| · Länge von ~a. Für λ = 0 gilt λ~a = ~0. Aus dieser
Definition ergeben sich sofort die folgenden Eigenschaften für die Multiplikation
von Vektoren mit Skalaren (λ, µ ∈ R):
• 1~a = ~a
• λ(µ~a) = (λµ)~a
• λ(~a + ~b) = λ~a + λ~b
• (λ + µ)~a = λ~a + µ~a
Wiederum abstrakt betrachtet nennt man eine abelsche Gruppe für die man eine
Multiplikation mit einer reellen Zahl definieren kann19 welche die gerade diskutierten Eigenschaften hat einen reellen Vektorraum.20 Den reellen Vektorraum
der oben anschaulich definierten Pfeile in zwei Raumdimensionen (zweidimensionale Ebene) bezeichnet man mit R2 . Analog kann man den Vektorraum von
“äquivalenten Pfeilen” in d Dimensionen (im d dimensionalen euklidischen Raum)
definieren. Er wird allgemein mit Rd bezeichnet.21
Um die Allgemeingültigkeit der Konzepte und Begriffe anzudeuten sind wir
mehrfach vom exemplarischen Beispiel der Vektoren in der zweidimensionalen
19
Das Ergebnis der Multiplikation eines Elementes der abelschen Gruppe mit der reellen Zahl
muß, wie im obigen Beispiel, wieder ein Gruppenelement sein.
20
Analog gibt es auch komplexe Vektorräume. In diesem Fall ist das Skalar eine komplexe
Zahl aus C.
21
Ist die Multiplikation mit einem Skalar bezüglich der komplexen Zahlen definiert, so bezeichnet man den Vektorraum mit Cd .
62
KAPITEL 2. MATHEMATISCHE METHODEN
Ebene zu der abstrakten Sichtweise übergegangen. Auch in der Physik - nicht
nur der Mathematik - spielen neben dem Vektorraum Rd (bzw. Cd ) andere Vektorräume eine große Rolle. Im Kapitel über Fourierreihen werden wir z.B. kurz
ansprechen, daß es Vektorräume gibt, deren Elemente Funktionen sind. Zum
Verständnis der Mechanik benötigen sie primär Kenntnisse des Rd , so daß wir
unsere weiteren Überlegungen zunächst erneut auf diesen beschränken werden.
Eine Anzahl von m Vektoren ~g1 , ~g2 , . . . , ~gm aus dem Rd heißt linear unabhängig, wenn
λ1~g1 + λ2~g2 + . . . + λm~gm = ~0
nur dann gilt, wenn alle Koeffizienten λi gleich Null sind. Anderenfalls nennt
man sie linear abhängig. Im Rd gibt es (maximal) d linear unabhängige Vektoren,
nimmt man jedoch einen weiteren Vektor hinzu, so sind die dann gegebenen d + 1
Vektoren linear abhängig. Zum Beispiel in d = 2 gilt:
g2
g1
~g1 und ~g2 sind linear unabhängig, aber jeder beliebige dritte Vektor ~g3 läßt sich
als Linearkombination von ~g1 und ~g2 schreiben
~g3 = λ1~g1 + λ2~g2
mit zu bestimmenden Skalaren λ1 , λ2 ∈ R. Man bezeichnet einen Satz ~g1 , ~g2 , . . . ,
~gd von d linear unabhängigen Vektoren im Rd als Basis.
Der Einfachheit halber werden wir hier zunächst mit Orthogonalbasen im Rd
(hier speziell im R2 ) arbeiten,22 genauer mit Orthonormalbasen: Die Basisvektoren ~e1 und ~e2 haben die Länge 123 und stehen senkrecht aufeinander. Jeder Vektor
~a hat dann die Zerlegung
~a = a1~e1 + a2~e2 .
Die ai nennt man Vektorkomponenten zur vorgegebenen Basis ~ei .
22
23
Man kann auch allgemeiner mit nicht-orthogonalen Basisvektoren arbeiten.
Zur genauen Definition des Begriffs “Länge” siehe unten.
2.9. VEKTORRECHNUNG
63
a2
a
e2
0
a1
e1
Wir haben bei der obigen Konstruktion einen festen Punkt 0 als Anfangspunkt
oder Ursprung ausgezeichnet. Damit ist dann jeder Punkt P durch den Vektor
~ bestimmt. Man nennt diesen Vektor ~x den Ortsvektor von P bezüglich
~x = 0P
des Anfangspunktes 0. In Komponenten kann dieser Vektor als ~x = x1~e1 + x2~e2
geschrieben werden, und jeder Punkt P ist damit umkehrbar eindeutig durch die
Zahlen (x1 , x2 ) festgelegt. Sie heißen die Koordinaten des Punktes P bezüglich
des Koordinatensystems [0; ~e1 , ~e2 ]. Arbeitet man immer mit demselben Koordinatensystem, so bietet sich die Notation
~x =
x1
x2
an. Diese kennen sie sicherlich auch aus der Schule. Wir werden diese Notation
hier nicht verwenden, da in der Physik häufig ein Basiswechsel notwendig ist, um
die physikalischen Phänomene besser zu verstehen (z.B. den Basiswechsel in ein
beschleunigtes Koordinaten- bzw. Bezugssytem). Wir schreiben manchmal bei
vorgegebenem Koordinatensystem
.
~x =
[0; ~e1 , ~e2 ] :
x1
x2
,
.
wobei = als “wird dargestellt durch” zu lesen ist. Zum Beispiel schreiben wir
statt
~a + ~b = a1~e1 + a2~e2 + b1~e1 + b2~e2 = (a1 + b1 )~e1 + (a2 + b2 )~e2
einfach
.
~a + ~b =
a1 + b 1
a2 + b 2
.
Die Länge |~a| eines Vektors ergibt sich nach obiger Skizze und dem Satz von
Pythagoras zu
q
|~a| = a21 + a22 = a .
64
KAPITEL 2. MATHEMATISCHE METHODEN
Die Länge hat aber auch eine geometrische Bedeutung, die unabhängig von der
Wahl des Koordinatensystems ist. Unabhängig von der Wahl des Koordinatensystems definieren wir das Skalarprodukt zweier Vektoren
~a · ~b = |~a||~b| cos ϕ ~a, ~b ,
wobei ϕ ~a, ~b der von ~a und ~b eingeschlossene Winkel ist, wenn ~a und ~b denselben
Angriffspunkt haben. Da die Kosinusfunktion gerade ist, gilt offensichtlich das
Kommutativgesetz ~a · ~b = ~b · ~a. Um zu zeigen, daß das Distributivgesetz gilt,
berechnen wir das Skalarprodukt in einer festen Orthonormalbasis:
~a = a1~e1 + a2~e2
⇒
a1 = |~a| cos ϕa ,
a2 = |~a| sin ϕa ,
wobei ϕa der Winkel zwischen der ~e1 -Richtung und ~a ist. Analog gilt
~b = b1~e1 + b2~e2
⇒
b1 = |~b| cos ϕb ,
b2 = |~b| sin ϕb ,
und damit
~a · ~b = |~a||~b| cos (ϕb − ϕa )
= |~a||~b| [cos ϕb cos ϕa + sin ϕb sin ϕa ]
= a1 b 1 + a2 b 2 ,
~ so folgt
wie sie es wahrscheinlich aus der Schule kennen. Ist dann aber ~b = ~c + d,
~a · ~c + d~ = a1 (c1 + d1 ) + a2 (c2 + d2 )
= a1 c 1 + a2 c 2 + a1 d 1 + a2 d 2
= ~a · ~c + ~a · d~ ,
d.h. das Distributivgesetz. Mit Hilfe dieses Gesetzes kann man ~a · ~b = a1 b1 + a2 b2
auch anders verstehen: Wegen ~e1 ·~e1 = 1 = ~e2 ·~e2 und ~e1 ·~e2 = 0 - da ϕ (~e1 , ~e2 ) = π/2
und cos (π/2) = 0 - d.h.
1 für i = j
~ei · ~ej = δi,j =
(2.36)
0 für i 6= j
folgt
~a · ~b = (a1~e1 + a2~e2 ) · (b1~e1 + b2~e2 ) = a1 b1 + a2 b2 .
Das soeben eingeführte und definierte δi,j bezeichnet man als Kronecker-Symbol
bzw. Kronecker-Delta. Mit Hilfe von Gl. (2.36) und der Distributivität des Skalarprodukts lassen sich die Vektorkomponenten bezüglich der orthonormalen Basis
{~ei } gemäß
ai = ~ei · ~a = ~ei · (a1~e1 + a2~e2 )
(2.37)
2.9. VEKTORRECHNUNG
65
berechnen. Über das Skalarprodukt läßt sich die Länge |~a| eines Vektors auch zu
q
√
|~a| = ~a · ~a = a21 + a22
schreiben.
Auch für allgemeine Vektorräume läßt sich oft ein Skalarprodukt definieren.
Um dieses genauer zu verstehen, nehmen wir wieder einen abstrakten Standpunkt
ein. Beim Bilden des Skalarprodukts wird jedem Paar von Elementen des Vektorraums eine reelle (bzw. komplexe; wenn bei der Multiplikation des Vektors mit
einem Skalar diese zugelassen sind) Zahl zugeordnet. Die Eigenschaften dieser
Abblidung lassen sich wie folgt zusammenfassen
• ~a · ~a ≥ 0; Gleichheit, wenn ~a = ~0
• ~a · ~b = ~b · ~a (bzw. ~a · ~b = (~b · ~a)∗ im komplexen Fall)
• sei ~b = λ~b1 + µ~b2 mit λ, µ ∈ R (λ, µ ∈ C im komplexen Fall) dann folgt
~a · ~b = λ~a · ~b1 + µ~a · ~b2 (Linearität im zweiten Argument)
Machen sie sich klar, daß das oben definierte Skalarprodukt für Vektoren aus dem
R2 diese Eigenschaften hat. Jede Zuodnung mit den obigen Eigenschaften nennt
man dann ein Skalarprodukt auf dem zugrundeliegenden (abstrakten) Vektorraum. Einen Vektorraum mit Skalarprodukt bezeichnet man als unitären Raum
(auch Prähilbertraum). Über ein gegebenes Skalarprodukt läßt sich die Länge
(Norm) |~a| eines Vektors auch abstrakt zu
√
|~a| = ~a · ~a
definieren. Es ist nun ebenfalls möglich den Begriff der Orthogonalität zweier
Vektoren ungleich dem Nullvektor gemäß ~a·~b = 0 allgemein zu definieren. Gleiches
gilt für das Konzept der orthonormalen Basis.
Wir kehren nun zum Vektorraum R2 zurück. Mit Hilfe des Distributivgesetzes
beweist man sehr leicht den aus der Schule bekannten Kosinussatz
~c · ~c = (~b − ~a) · (~b − ~a)
= ~a · ~a + ~b · ~b − 2~a · ~b ,
also
|~c|2 = |~a|2 + |~b|2 − 2|~a||~b| cos ϕ ~a, ~b .
Wir können jetzt auch andersherum vorgehen, den Kosinussatz (weil aus der
Schule bekannt) voraussetzen und einen Ausdruck für das Skalarprodukt herleiten:
|~a|2 + |~b|2 − |~c|2
~
~
|~a||b| cos ϕ ~a, b =
2
a21 + a22 + b21 + b22 − [(b1 − a1 )2 + (b2 − a2 )2 ]
=
2
= a1 b 1 + a2 b 2 .
66
KAPITEL 2. MATHEMATISCHE METHODEN
Wir erhalten so also wieder das bereits bekannte Ergebnis.
Bisher haben wir meistens im zweidimensionalen Raum (der Ebene) argumentiert. Wir werden jetzt das Skalarprodukt auf den dreidimensionalen Fall - der
in der Physik eine zentrale Rolle spielt- erweitern. Dazu betrachten wir zunächst
eine Orthonormalbasis in d = 3.
e3
0
e2
e1
Das durch die gezeigten Basisvektoren aufgespannte Koordinatensystem bezeichnet man als Rechtssystem, was man sich wie folgt erklären und merken kann:
Zeigt der Daumen der rechten Hand in Richtung ~e1 , der Zeigfinger der rechten
Hand in Richtung ~e2 und der Mittelfinger der rechten Hand in Richtung ~e3 , so
handelt es sich um ein Rechtssystem. Macht man dasselbe mit der linken Hand,
handelt es sich um ein Linkssystem. Ein Vektor ~a wird in dieser Basis dann durch
die Komponenten


a1
.
~a =  a2 
a3
dargestellt, und durch zweimaliges Anwenden des Satzes von Pythagoras sieht
man leicht, daß
q
|~a| = a21 + a22 + a23
gilt. Wir definieren dann das Skalarprodukt in d = 3 zu
~a · ~b = |~a||~b| cos ϕ ~a, ~b .
Um eine Komponentenschreibweise zu finden, kann man wieder den Kosinussatz
verwenden, da ~a, ~b und ~c = ~b − ~a in einer Ebene des dreidimensionalen Raumes
2.9. VEKTORRECHNUNG
67
liegen
~a · ~b = |~a||~b| cos ϕ ~a, ~b
|~a|2 + |~b|2 − |~c|2
2
a21 + a22 + a23 + b21 + b22 + b23 − [(b1 − a1 )2 + (b2 − a2 )2 + (b3 − a3 )2 ]
=
2
= a1 b1 + a2 b2 + a3 b3 ,
=
was für jede beliebige Orthonormalbasis gilt. Völlig analog gilt in d-Dimensionen
~a · ~b = a1 b1 + a2 b2 + . . . + ad bd .
Wie in d = 2 ergibt sich damit sofort wieder das Distributivgesetz
~a · ~b + ~c = ~a · ~b + ~a · ~c .
Aus der Definition des Skalarprodukts läßt sich der Winkel, den zwei beliebige
Vektoren (in d = 3) einschließen, bestimmen:
a1 b 1 + a2 b 2 + a3 b 3
p
cos ϕ ~a, ~b = p 2
.
a1 + a22 + a23 b21 + b22 + b23
Zwei Vektoren stehen also senkrecht aufeinander (sind orthogonal zueinander),
wenn ~a · ~b = 0 gilt.
Für zwei Vektoren aus dem R3 (und nur diesem!!) definieren wir nun das
Vektorprodukt (oft auch Kreuzprodukt oder äußeres Produkt genannt) wie folgt
~a × ~b = ~n|~a||~b| sin ϕ̃ ~a, ~b ,
wobei ~n ein Vektor der Länge 1 ist und auf ~a und ~b senkrecht steht.
Die
Richtung
von ~n ist so zu wählen, daß ~a, ~b und ~n ein Rechtssystem bilden. ϕ̃ ~a, ~b bezeichnet
~
dabei
den
Betrag des kleineren
der beiden Winkel zwischen ~a und b, so daß 0 ≤
ϕ̃ ~a, ~b < π und damit sin ϕ̃ ~a, ~b > 0 gilt. Die Richtung von ~n läßt sich auch
wie folgt bestimmen: Zeigen alle Finger der rechten Hand mit Ausnahme des
Daumen in die Richtung der Drehung von ~a auf ~b mit dem kleineren der beiden
Winkel, so zeigt der abgespreizte Daumen in die Richtung von ~n (“Daumen-Regel
der rechten Hand”).
n
b
0
a
68
KAPITEL 2. MATHEMATISCHE METHODEN
Nach der Definition erfüllt das Vektorprodukt die folgenden Relationen
~a × ~b = −~b × ~a
(λ~a) × (µ~b) = (λµ)(~a × ~b) ,
(2.38)
λ, µ ∈ R .
Aus der Definition ergibt sich ebenfalls
~a × ~a = ~0 .
(2.39)
Das Vektorprodukt ist distributiv
~a × ~b + ~c = ~a × ~b + ~a × ~c ,
was wir hier jedoch aus Zeitgründen nicht beweisen wollen.24 Um die Komponenten von ~a × ~b bezüglich einer Orthonormalbasis angeben zu können, wollen wir
zunächst betrachten, was sich nach der Definition des Vektorproduktes für ~ei ×~ej
mit i, j = 1, 2, 3 ergibt:
~e1 × ~e2 = ~e3
~e2 × ~e3 = ~e1
~e1 × ~e3 = −~e2 .
Die übrigen Terme ergeben sich mit Hilfe der Gln. (2.38) und (2.39). Man kann
diese Gleichungen zu
~ei × ~ej = ~ek
zusammenfassen, wobei (i, j, k) eine zyklische Vertauschung von (1, 2, 3) sein muß
- also (1, 2, 3), (2, 3, 1) oder (3, 1, 2). Für die Komponenten bezüglich der Basis
[~e1 , ~e2 , ~e3 ] folgt damit
~a × ~b = (a1~e1 + a2~e2 + a3~e3 ) × (b1~e1 + b2~e2 + b3~e3 )
= (a1 b2 − a2 b1 ) (~e1 × ~e2 ) + (a1 b3 − a3 b1 ) (~e1 × ~e3 ) + (a2 b3 − a3 b2 ) (~e2 × ~e3 )
= (a2 b3 − a3 b2 ) ~e1 + (a3 b1 − a1 b3 ) ~e2 + (a1 b2 − a2 b1 ) ~e3 ,
eine Regel, die sie sicherlich aus der Schule kennen. In der Mechanik wird das
Kreuzprodukt z.B. in der Definition der Begriffe Drehimpuls und Drehmoment
benötigt.
Als mathematisches Beispiel für die Anwendung des Vektorproduktes wollen
wir hier die Berechnung des Volumens eines durch drei nicht koplanare Vektoren
~a, ~b und ~c aufgespannten Körpers betrachten.
24
Für einen Beweis siehe z.B. S. Großmann, “Mathematischer Einführungskurs für die Physik”, Teubner Verlag, Stuttgart 1984, Seite 70.
2.10. FOURIERREIHEN
69
c
b
0
a
Betrachten wir dazu zunächst die durch ~a und ~b aufgespannte Fläche. Sie ist
durch Grundlinie ∗ Höhe gegeben.
b
h=|b|sin(ϕ)
ϕ
0
a
Das ist aber gerade der Betrag von ~a × ~b. Die Richtung ~n von ~a × ~b ist in der
folgenden Skizze eingezeichnet. Das Volumen in der obigen Skizze ergibt sich
dann zu Grundfläche ∗ Höhe.
c
h
b
n
0
a
Die Höhe h ist aber gerade durch ~n · ~c gegeben, so daß insgesamt
V (~a, ~b, ~c) = (~a × ~b) · ~c
folgt. Man nennt V (~a, ~b, ~c) auch das Spatprodukt.
2.10
Fourierreihen
Bevor wir dazu kommen Analysis (Differential- und Integralrechnung) und Vektorrechnung im euklidischen Raum in Form von vektorwertigen Funktionen und
Funktionen mehrer Veränderlicher zu kombinieren, wollen wir eine Technik einführen, die den Begriff der Funktion und einen Vektorraum von Funktionen benötigt.
Im Kapitel über die Taylorentwicklung haben wir eine Methode kennengelernt,
die es ermöglicht hinreichend harmlose Funktionen um einen Punkt herum lokal
zu approximieren. Dazu haben wir geeignet gewählte Polynome verwendet. Wir
wollen nun versuchen Funktionen global anzunähern. Dabei beschränken wir uns
70
KAPITEL 2. MATHEMATISCHE METHODEN
auf (reelle) periodische Funktionen mit der Eigenschaft
f (t + nT ) = f (t) ; n ∈ Z .
Um den Kontakt zur Physik herzustellen, nennen wir die Variable t (die Zeit). Die
Periodendauer ist durch T = 2π/ω, mit der Kreisfrequenz ω, gegeben. Einfache
periodische Funktion sind uns bereits im Kapitel 2.2 in Form der trigonometrischen Funktionen sin(ωt) und cos(ωt), bzw. physikalisch in Form der Lösung
der Newtonschen Gleichung für die Hooksche Feder Gl. (2.8) begegnet. Auch die
Funktionen sin(kωt) und cos(kωt) mit k ∈ N sind offensichtlich periodisch mit
Periode T = 2π/ω. Damit gilt gleiches für das trigonometrische Polynom oder
Fourierpolynom
N
gN (t) =
a0 X
[ak cos(kωt) + bk sin(kωt)] .
+
2
k=1
Diese Überlegungen legen die Frage nahe, ob wir jede (hinreichend harmlose)
periodische Funktion mit Periode T durch ein gN (t) bei geschickter Wahl der ak
und bk global approximieren können und ob die Näherung in irgendeinem Sinn
besser wird, wenn man N erhöht. Eine nachfolgende Frage ist, ob die ak und bk
eindeutig sind. Bevor wir uns diesen Fragen weiter nähern, wollen wir festhalten,
daß wir uns durch Einführen der Variablen t̃ = ωt auf Funktionen mit Periode 2π
beschränken können. Dies sieht man wie folgt. Sei f (t) eine Funktion mit Periode
T , so hat f (t̃/ω) die Periode 2π.
Betrachten wir nun zwei Beispiele. Die erste Funktion sei
f1 (t) = t2 für − π < t ≤ π und periodisch fortgesetzt.
Sie ist in der folgenden Abbildung dargestellt und offensichtlich keine einfach harmonische Funktion der Form sin(kt) bzw. cos(kt). Die Ableitung dieser Funktion
hat Sprungstellen bei ungeraden Vielfachen von π.
10
8
f1
6
4
2
0
-15
-10
-5
0
t
5
10
15
2.10. FOURIERREIHEN
71
Das zweite Beispiel ist die ebenfalls nicht einfach harmonische sogenannte Sägezahnkurve
f2 (t) = t für − π < t ≤ π und periodisch fortgesetzt,
mit Sprungstellen bei ungeraden Vielfachen von π.
3
2
f2
1
0
-1
-2
-3
-10
0
t
10
Das Ziel unser Überlegungen wollen wir anhand der folgende Abbildung klar
machen. Sie zeigt f2 (t) und die Fourierpolynome g6 (t) (rot) sowie g12 (t) (blau)
jeweils mit ak = 0 für k ∈ N0 und bk = 2 (−1)k+1 /k für k ∈ N.
3
2
f2
1
0
-1
-2
-3
-10
0
t
10
Offensichtlich liefern die dargestellten gN (t) in gewissem Sinn (“bis auf kleine
Oszillationen”) eine Näherung an f2 (t).
Wir wollen nun die Menge aller 2π-periodischen Funktionen f die in (−π, π]
nur endlich viele Spungstellen hat mit V bezeichnen. Genauer betrachen wir
wieder Klassen äquivalenter Funktionen, wobei zwei periodische Funktionen als
äquivalent bezeichnet werden, wenn sich ihr Funktionswert nur an “einzelnen
Punkten” unterscheidet (genaueres dazu in den Vorlesungen der Mathematik).
Wie man sich leicht überzeugt hat die Addidtion zweier Funktionen dann alle
72
KAPITEL 2. MATHEMATISCHE METHODEN
Eigenschaften, die V zu einer abelschen Gruppe machen. Das neutrale Argument
(die Klasse neutraler Elemente) wird dabei durch die Funktion h(t) = 0 für alle t
“repräsentiert”. Durch die skalare Multiplikation einer Funktion mit einer reellen
Zahl wird V zu einem rellen Vektorraum. Die Linearität des Integrals stellt dann
sicher, daß durch
Z
1 π
f (t) g(t) dt
(f, g) =
π −π
ein Skalarprodukt auf V definierbar ist. Es erfüllt die in Kapitel 2.9 aufgeführten
Eigenschaften des Skalarprodukts, wenn man bedenkt, daß wir es mit Repräsentanten von Funktionen (wie oben definiert) zu tun haben. Wir haben dabei in
Form von (. . . , . . .) eine neue Notation für das Skalarprodukt eingeführt. Nebenbei bemerken wir, daß es für die Elemente von V auch nicht mehr sinnvoll
erscheint die Notation mit dem Vektorpfeil zu verwenden, die wir für Vektoren im
d-dimensionalen euklidischen Raum reservieren möchten. Daher haben wir diese Notation hier garnicht erst eingeführt. Mit der Definition des Skalarprodukts
haben wir auch eine Länge (Norm) in der Form
||f || = (f, f )1/2
für Elemente aus V eingeführt. Wir haben auch für die Länge (Norm) eine neue
Notation verwendet. Um den Begriff der “äquivalenten Funktionen” zu verinnerlichen, sollten sie sich klar machen, daß jeder Repräsentant einer Klasse äquivalenter Funktionen aufgrund der Definition des Skalarprodukts über ein Integral
die gleiche Länge (Norm) hat.
Der Vektorraum V der Äquivalenzklassen von 2π-periodischen Funktionen
mit nur endlich vielen Spungstellen in (−π, π] wird so zu einem unitären Raum.
Wir wollen nun die Funktionen
1
φ0 (t) = √ ,
2
φk (t) = cos(kt) ,
φ−k (t) = sin(kt) ,
mit k ∈ N, aus V betrachten. Wie sie in einer Übungsaufgabe gezeigt haben gilt
für k, l 6= 0
(φk , φl ) = δk,l .
Wegen
1
(φ0 , φ0 ) =
π
Z
π
−π
1
dt = 1
2
2.10. FOURIERREIHEN
73
und für k > 0
1
(φ0 , φk ) =
π
π
Z
−π
1
√ cos(kt) dt = 0
2
bzw.
1
(φ0 , φ−k ) =
π
Z
π
−π
1
√ sin(kt) dt = 0
2
bilden die φk mit k ∈ Z ein orthonormales System in V . Diese abzählbar unendliche Zahl von Vektoren sind somit auch linear unabhängig. Da man über die Zahl
der linear unabhängigen Vektoren die Dimension eines Vektrorraum definiern
kann, sehen wir, daß V im Gegensatz zum Rd unendlichdimensional ist. Solche
Vektorräume mögen ihnen komisch und unanschaulich erscheinen, sie werden jedoch lernen damit umzugehen da sie in der Physik eine wichtige Rolle spielen
(spätestens in der Quantenmechanik).
Ohne Beweis (siehe Vorlesungen zur Mathematik) geben wir an, daß die {φk }
eine orthonormale Basis in V bilden. Damit können wir jedes Element f aus V
gemäß
f (t) =
∞
X
∞
ck φk (t) =
k=−∞
a0 X
+
[ak cos(kt) + bk sin(kt)]
2
k=1
mit reellen Entwicklungskoeffizienten (Vektorkomponenten) ck , ak , bk schreiben,
d.h. durch eine Fourierreihe ausdrücken. Die Entwicklungskoeffizienten ergeben
sich nach Gl. (2.37) eindeutig zu (k ∈ Z)
Z
1 π
φk (t) f (t) dt
ck = (φk , f ) =
π −π
bzw. (k ∈ N)
a0
ak
bk
√
Z
1 π
=
2(φ0 , f ) =
f (t) dt ,
π −π
Z
1 π
= (φk , f ) =
cos(kt) f (t) dt ,
π −π
Z
1 π
= (φ−k , f ) =
sin(kt) f (t) dt .
π −π
(2.40)
Wir wollen die Koeffizienten für unsere Bespielfunktionen fj , j = 1, 2, nun
explizit berechnen. Die Funktion f2 ist ungerade im Periodizitätsintervall. Daher
verschwinden alle Integrale über Produkte von f2 mit einer geraden Funktion.
Da cos(kt), k ∈ N0 gerade ist, folgt so ak = 0. Um bk zu berechnen, müssen wir
noch Integrale vom Typ
Z
1 π
bk =
t sin(kt) dt
π −π
74
KAPITEL 2. MATHEMATISCHE METHODEN
bestimmen. Diese berechnen wir wie folgt
Z
1 π
t sin(kt) dt
bk =
π −π
Z
2 π d
= −
cos(kt) dt
π 0 dk
Z
d 2 π
= −
cos(kt) dt
dk π 0
π
d 2 1
= −
sin(kt)
dk π k
0
π
2
1
t
= − − 2 sin(kt) + cos(kt)
π
k
k
0
2 π
cos(kπ)
= −
π k
2
= − (−1)k
k
= 2 (−1)k+1 /k ,
also die in der obigen Abbildung verwendeten bk . Damit ist für das vorliegende
Beispiel klar, daß bereits die endliche Fouriersumme (Fourierpolynom), bei der
die Summe in der Fourierreihe nur bis k = N läuft, eine globale näherungsweise
Beschreibung der Funktion liefert. Gleiches gilt für unsere zweite Beispielfunktion
f1 mit den Fourierkoeffizienten (k ∈ N)
a0 =
2 π2
,
3
4
,
k2
= 0 (da f1 (t) gerade) .
ak = (−1)k
bk
Die Berechnung der Koeffizienten erfolgt analog zu der von f2 . Die Näherungen
g6 (t) (rot) und g12 (t) (blau) sind in der folgenden Abbildung zusammen mit f1 (t)
dargestellt.
10
8
f1
6
4
2
0
-15
-10
-5
0
t
5
10
15
2.11. VEKTORWERTIGE FUNKTIONEN
75
Die beiden Beispiele verallgemeinernd halten wir fest, daß wir für jede periodische
Funktion f (mit höchstens endlich vielen Sprungstellen) eine mehr oder weniger
gute globale Näherung durch gN mit den gemäß Gl. (2.40) berechneten Fourierkoeffizienten erhalten können. Vergleichen wir die Näherungen für f1 und f2 so
wird klar, daß man für die stetige Funktion f1 bei fester Ordnung N (also durch
gN (t)) eine bessere Beschreibung erreicht als für die Funktion f2 (die Sprungstellen hat). Dies ist auch plausibel, wenn man bedenkt, daß die Fourierkoeffizienten
von f1 wie 1/k 2 abfallen, die für f2 jedoch nur wie 1/k. Höhere Terme in der Fourierentwicklung von f1 werden somit schneller klein, als die der Entwicklung von
f2 . Grundsätzlich kann man festhalten, daß die Fourierkoeffizienten je schneller
abfallen, je “glatter” (“harmloser”) die zu nähernde periodische Funktion ist.
Um zu verstehen, in welchem Sinne gN für große N gegen f konvergiert,
müssen wir uns erinnern, daß wir in der durch das Skalarprodukt gegebenen Norm
für den Abstand zweier periodischer Funktionen, die sich an einigen Stellen im
Funktionswert unterscheiden Null bekommen (definition des Skalarprodukts über
ein Integral). Das macht plausibel, daß es den Abbildungen gemäß offensichtlich
Punkte tj gibt, an denen die Konvergenz “sehr viel langsamer” ist, als an anderen Stellen. Im Beispiel der Funktion f2 gilt gN (t = nπ) = 0 für alle N ∈ N und
n ∈ Z, so daß bei den ungeraden Vielfachen von π, gN (t) nicht gegen f2 (t) konvergiert. Dies ist im Sinne der Norm verständlich, da sich f2 und die Grenzfunktion
limN →∞ gN nur an abzählbar vielen Punkten unterscheiden. Man spricht daher
im vorliegenden Fall auch von Konvergenz im Mittel.
In der Physik spielen Fourierentwicklungen einerseits als technisches Hilfsmittel bei der Näherung komplexer periodischer Funktionen durch einfache Summen
von trigonometrischen Funktionen, also Fourierpolynomen, eine wichtige Rolle.
Andererseits lernt man bei der Fourierentwicklung eines periodischen “Signals”
der Kreisfrequenz ω, welche höhere harmonische mit Kreisfrequenzen kω dem Signal mit welcher Amplitude ak bzw. bk beigemischt sind. Man lernt also etwas
über das Spektrum eines periodischen Signals. Man spricht daher auch von der
Spektralanalyse. Durch diese gewinnt man letztendlich physikalische Einsichten
über das “Signal”.
2.11
Vektorwertige Funktionen
Wie in der Einleitung diskutiert benötigt man in der Mechanik vektorwertige
Funktionen, d.h. Abbildungen, bei denen einem Element aus R eindeutig ein
(meist dreidimensionaler) Vektor zugeordnet wird. Die Bahnkurve ~x(t) eines Teilchens, d.h. der zeitliche Verlauf des Ortes des Teilchens im dreidimensionalen
Raum, ist ein Beispiel für solch eine Funktion. Legen wir eine Basis [~e1 , ~e2 , ~e3 ]
fest (hier wieder eine Orthonormalbasis), so können wir jede vektorwertige Funk-
76
KAPITEL 2. MATHEMATISCHE METHODEN
tion f~(x) als
f~(x) = f1 (x)~e1 + f2 (x)~e2 + f3 (x)~e3
schreiben. Wir definieren zunächst die Stetigkeit einer vektorwertigen Funktion,
indem wir die Stetigkeit aller ihrer Komponenten fi (x) fordern. Die Ableitung
einer vektorwertigen Funktion liefert wieder eine solche und ist definiert als
f~(x + h) − f~(x)
f~0 (x) = lim
.
h→0
h
Drücken wir f~ erneut durch die Komponenten aus, so folgt
f2 (x + h) − f2 (x)
f1 (x + h) − f1 (x)
0
~
~e1 +
~e2
f (x) = lim
h→0
h
h
f3 (x + h) − f3 (x)
+
~e3
h
= f10 (x)~e1 + f20 (x)~e2 + f30 (x)~e3 ,
d.h. f~0 ergibt sich durch komponentenweise Differentiation. Aus dieser Einsicht
und den Differentiationsregeln für gewöhnliche Funktionen ergeben sich die folgenden Gesetze für vektorwertige Funktionen ~a(x), ~b(x) und die skalare Funktion
g(x):
0
• ~a(x) + ~b(x) = ~a0 (x) + ~b0 (x)
0
~
• ~a(x) · b(x) = ~a0 (x) · ~b(x) + ~a(x) · ~b0 (x)
•
(Produktregel)
0
~a(x) × ~b(x) = ~a0 (x) × ~b(x) + ~a(x) × ~b0 (x)
• (g(x)~a(x))0 = g 0 (x)~a(x) + g(x)~a0 (x)
• (~a(g(x)))0 = ~a0 (g(x)) g 0 (x)
(Produktregel)
(Produktregel)
(Kettenregel)
Wie für gewöhnliche Funktionen lassen sich höhere Ableitungen vektorwertiger
Funktionen rekursiv definieren
!
d dn−1 f~(x)
dn f~(x)
=
.
dxn
dx
dxn−1
Eine weitere Diskussion vektorwertiger Funktionen verschieben wir auf die Übungen.
Das Ableiten einer vektorwertigen Funktion darf nicht mit dem Ableiten einer Funktion, die von einem Vektor abhängt - und selbst wieder vektorwertig
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
77
sein kann (Felder) - nach eben diesem Vektor, also dem Bilden des Gradienten,
der Divergenz oder der Rotation, verwechselt werden. Auf diese werden wir im
folgenden eingehen.
Zuvor wollen wir aber noch anmerken, daß die Integration
Z
b
f~(x) dx
a
einer vektorwertigen Funktion von einer Variablen, als Integration der einzelnen
Komponenten von f~(x) zu verstehen ist. Wie im Fall der Ableitung gibt es bei
der Integration von Funktionen (seien sie vektorwertig oder skalar) die von einem
Vektor abhängen neue Aspekte, die wir uns im übernächsten Kapitel anschauen
werden.
2.12
Funktionen mehrerer Veränderlicher
Auch wenn es in der Mechanik oft gelingt, durch geschickte Wahl der Koordinaten (Basisvektoren) Probleme so zu vereinfachen, daß sie von nur einer Orts(oder auch Winkel-) Koordinate abhängen (wir haben schon mehrere Beispiele
dazu kennen gelernt), so ist es zum allgemeinen Verständnis doch unvermeidbar,
Funktionen mehrerer Veränderlicher - also z.B. der drei Koordinaten x1 , x2 , x3
bezüglich einer fest gewählten Orthonormalbasis - einzuführen. Im Allgemeinen
kann die Kraft F~ (~x), die auf ein Teilchen am Punkt ~x wirkt, von diesen drei
Koordinaten abhängen. Weiterhin ist F~ selbst ein Vektor. Die Kraft ist also eine
vektorwertige Funktion eines Vektors. Betrachten wir als Beispiel die ihnen sicherlich aus der Schule bekannte Gravitationskraft zwischen zwei Punkt-Teilchen
der Massen M und m. Wir wählen ein Koordinatensystem mit einer orthonormalen Basis und dem Ursprung in der Masse M . Die Kraft auf das sich am Ort
~x befindliche Teilchen der Masse m ist dann
F~ (~x) = −γ
x21
~x
Mm
p
,
2
2
2
+ x2 + x3 x1 + x22 + x23
mit der Gravitationskonstanten γ. Den Vektor ~x/|~x| bezeichnet man auch als
Richtungsvektor. Er hat die Länge 1. Die Kraft auf die Masse m an der Position
~x zeigt damit immer ins Zentrum des Koordinatensystems - also auf die Masse
M - und ihr Betrag fällt wie 1/|~x|2 mit dem Abstand vom Ursprung ab. Die
Funktion F~ bildet damit das Zahlentripel x1 , x2 , x3 aus dem Raum R × R × R =
R3 auf ein Element F1 , F1 , F3 aus eben diesem Raum ab. Bei dieser abstrakten
Betrachtung haben wir die Dimensionen der physikalischen Meßgrößen Ort und
Kraft vernachlässigt. Allgemein definiert man die Räume Rn gemäß
Rn = {(x1 , x2 , . . . , xn )|xi ∈ R für i = 1, 2, . . . , n} .
78
KAPITEL 2. MATHEMATISCHE METHODEN
Als einfacheres Beispiel betrachten wir eine sehr dünne, “zweidimensionale”
Metallplatte, die an verschiedenen Stellen beheizt wird. Damit ergibt sich zu
jedem festen Zeitpunkt t eine mit der Position25
.
~x =
x1
x2
auf der Platte variierende Temperatur T (~x). Im Gegensatz zum Beispiel der Gravitationskraft ist die Funktion selbst in diesem Fall ein Skalar. Abstrakt betrachtet und für eine unendlich ausgedehnte Platte ist die Funktion T eine Abbildung
vom R2 auf eine Teilmenge W - den Wertebereich - der reellen Zahlen R. Dabei
haben wir erneut die Dimensionen des Ortes und der Temperatur vernachlässigt.
Da es (in der Kelvin-Skala) keine negativen Temperaturen gibt, kommt als Wertebereich nur eine Teilmenge der positiven reellen Zahlen in Frage. Ist die Platte
endlich, müssen wir auch einen Definitionsbereich D der Funktion festlegen, bei
dem es sich um eine Teilmenge von Zahlenpaaren aus den reellen Zahlen handelt. Für eine quadratische Platte der Kantenlänge 2a und dem Nullpunkt des
Koordinatensystems im Zentrum gilt dann z.B.
D = {(x1 , x2 ) ∈ R2 | − a ≤ x1 ≤ a und − a ≤ x2 ≤ a} .
Mißt man die lokale Temperatur der Platte nicht nur zu einer festen Zeit, sondern zu verschiedenen Zeiten t, so stellt die Temperatur eine Funktion von drei
Veränderlichen dar. Dabei haben nur die beiden Ortskoordinaten x1 , x2 die Dimension Länge, die dritte Variable jedoch die Dimension Zeit.
Ob es sich bei der Funktion um einen Vektor oder ein Skalar handelt, macht
bei denen uns im folgenden interessierenden mathematischen Fragestellungen keinen Unterschied, und wir werden uns daher auf skalare Funktionen beschränken.
Die gewonnenen Ergebnisse gelten im Fall von vektorwertigen Funktionen für jede ihrer Komponenten. Da sich weiterhin Funktionen zweier Veränderlicher gut
graphisch darstellen lassen, werden wir zusätzlich meist solche Funktionen betrachten.
Nach dieser physikalischen Motivation betrachten wir zunächst einmal die
Graphen dreier Beispielfunktionen.26
f (x, y) = exp (−x2 − y 2 ) : D = R2 , W = (0, 1]
25
Wir verwenden wieder die “wird dargestellt durch” Notation, d.h. wir haben ein Koordinatensystem vorgegeben.
26
Bisher haben wir immer f (~x) geschrieben. Alternativ kann man auch die Komponenten als
Argumente explizit angeben: f (x1 , x2 , . . . , xn ). Im folgenden sind x und y die Komponenten.
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
79
1
0.8
0.6
f
0.4
0.2
0
–2
–2
–1
–1
0x
y0
1
1
2
2
f (x, y) = x2 + y 2 : D = R2 , W = [0, ∞)
200
180
160
140
120
f100
80
60
40
20
0
–10
0
y
10 8
6
4
2
–10
0 –2 –4 –6 –8
x
f (x, y) = x2 − y 2 : D = R2 , W = R
80
KAPITEL 2. MATHEMATISCHE METHODEN
100
80
60
40
20
f0
–20
–40
–60
–80
–100
–10
0
y
10 8
6
4
2
–10
0 –2 –4 –6 –8
x
Die drei Beispielfunktionen haben unterschiedliche Eigenschaften. So fällt die
erste, wenn man im Ursprung der x-y-Ebene startet, in alle Richtungen hin ab,
die zweite steigt an, und bei der dritten hängt es davon ab, in welche Richtung
man fortschreitet, ob die Funktion ansteigt oder abfällt. Auch sind die ersten beiden Funktionen symmetrisch bei einer Rotation mit beliebigem Winkel um die
f -Achse, d.h., bei einer Rotation (mit beliebigem Winkel) um diese Achse geht
der Graph der Funktion in sich selbst über. Bei der dritten Funktion ist das nicht
der Fall. Dies liegt daran, daß die ersten beiden Funktionen nur von x2 + y 2 , d.h.
dem Abstand (zum Quadrat) vom Ursprung der x-y-Ebene abhängen. Dies gilt
so auch für die oben betrachteten Komponenten der Gravitationskraft. Die dritte
Beispielfunktion erinnert an einen Sattel. Man nennt den Punkt x = 0, y = 0
daher auch einen Sattelpunkt. Wie wir für Funktionen einer Variablen gelernt haben, gibt uns die Ableitung einer Funktion an, wie sich der Funktionswert ändert,
wenn wir von einer Stelle x nach x + h, für h → 0, weitergehen. Wie wir gerade
gelernt haben, kann die Änderung im Fall einer Funktion mehrerer Veränderlicher davon abhängen, in welche Richtung man weitergeht. Zur Beschreibung
der Änderung benötigen wir somit eine vektorielle Größe. Diese wollen wir im
folgenden wenig formal “herleiten”.
Betrachten wir eine Funktion f (x, y), so können wir uns fragen, wie sich der
Funktionswert ändert, wenn wir ausgehend von x, y in die x-Richtung fortschreiten. Die Steigung an der Stelle x, y in diese Richtung wird uns durch die Ableitung von f nach x bei festem y gegeben, wenn wir als Argumente der abgeleiteten
Funktion wieder x, y einsetzen. Man nennt diese Ableitung die partielle Ableitung
nach x und schreibt
f (x + h, y) − f (x, y)
∂f (x, y)
= lim
.
h→0
∂x
h
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
81
Als Beispiel bilden wir die partielle Ableitung unserer ersten Beispielfunktion
nach x
∂f (x, y)
= −2x exp (−x2 − y 2 )
∂x
(2.41)
und auch gleich die nach y
∂f (x, y)
= −2y exp (−x2 − y 2 ) .
∂y
(2.42)
Dabei haben wir stillschweigend angenommen, daß die Funktion f hinreichend
harmlos ist, so daß die entsprechenden Ableitungen existieren - wie es in unserem
Beispiel natürlich der Fall ist. Betrachten wir ein weiteres Beispiel
∂
x21 + 2x1 x32 + 5 = 2x1 + 2x32 ,
∂x1
in dem die beiden Variablen mal nicht mit x und y bezeichnet sind. Die Ableitungsregeln für Funktionen einer Veränderlichen (Produktregel, Quotientenregel
und Kettenregel) gelten auch für die partielle Ableitung, da es sich ja bei ihr
um eine gewöhnliche Ableitung nach einer Variablen bei festgehaltenen anderen
handelt.
Für die folgende Überlegung nehmen wir an, daß wir eine hinreichend glatte
Funktion f haben - so daß alle Ableitungen, die wir bilden wollen, auch existieren - die von den n Variablen x1 , x2 , . . . , xn abhängt. Wie für Funktionen einer
Veränderlichen kann man partielle Ableitungen höherer Ordnung definieren. Bei
partiellen Ableitungen gibt es aber nun die zusätzliche Option nicht nur zweimal
nach xi zu differenzieren, sondern erst nach xi und dann nach xj mit j 6= i
∂ 2 f (x1 , x2 , . . . xn )
∂ ∂
f (x1 , x2 , . . . xn ) =
.
∂xj ∂xi
∂xj ∂xi
Diese Idee läßt sich beliebig in höhere Ordnungen fortsetzen.
Kommen wir nun zurück zu der Frage, einen Vektor zu konstruieren, der die
Information über die Steigung einer Funktion mehrerer Veränderlicher enthält.
Betrachten wir zunächst unsere erste Beispielfunktion f (x, y) = exp (−x2 − y 2 ).
Mit den Gln. (2.41) und (2.42) wissen wir bereits, wie sich die Funktion ändert,
wenn wir in x- bzw. y-Richtung fortschreiten. Das legt nahe, daß der Vektor
! ∂f (x,y)
2
2
−2x
exp
(−x
−
y
)
.
∂x
~ (x, y) =
grad f (x, y) = ∇f
=
∂f (x,y)
−2y exp (−x2 − y 2 )
∂y
der von uns gesuchte “Steigungsvektor” ist. Das Symbol grad steht für Gradient.
~ sind beide gebräuchlich. Wir werden hier im
Die Notationen grad f und ∇f
82
KAPITEL 2. MATHEMATISCHE METHODEN
~ verwenden. Die Verallgemeinerung auf eine Funktion
folgenden die Notation ∇f
von n Veränderlichen ist offensichtlich


∂f
∂x1
∂f
∂x2


. 
~ =
∇f
 ...

 ...
∂f
∂xn



 .


~ auch ein Gradientenfeld. Schauen wir
Man nennt die Menge der Vektoren ∇f
uns nun die Gradientenfelder für unsere drei Beispielfunktionen an. Für die er~ soeben berechnet. Wir können das Vektorfeld nun graphisch
ste haben wir ∇f
darstellen, indem wir uns in der x-y-Ebene ein diskretes Gitter von Punkten vorgeben und an jedem Gitterpunkt einen Pfeil einzeichnen, wobei der Mittelpunkt
des Pfeils auf dem Gitterpunkt liegt. Die Richtung des Pfeils gibt die Richtung
~ an der Stelle ~x an, und die Länge ist ein Maß für den Betrag von ∇f
~
von ∇f
an dieser Stelle. Im Beispiel haben wir das oben gezeigte Gebiet −2 ≤ x ≤ 2,
−2 ≤ y ≤ 2 in ein 21×21 Gitter eingeteilt, d.h. die Mittelpunkte der Pfeile liegen
bei xn = n/5 und yn = n/5 mit n = −10, −9, . . . , 9, 10.
.
~ (x, y) =
∇f
∂f (x,y)
∂x
∂f (x,y)
∂y
!
=
−2x exp (−x2 − y 2 )
−2y exp (−x2 − y 2 )
2
y1
–2
–1
1
x
2
–1
–2
Das Gradientendfeld der zweiten Beispielfunktion f (x, y) = x2 + y 2 ist
! ∂f (x,y)
2x
.
∂x
~
=
∇f (x, y) =
∂f (x,y)
2y
∂y
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
83
10
8
y6
4
2
–10 –8
–6 –4
–2
–2
4
2
6
x
8
10
–4
–6
–8
–10
und das der dritten f (x, y) = x2 − y 2
.
~ (x, y) =
∇f
∂f (x,y)
∂x
∂f (x,y)
∂y
!
=
2x
−2y
.
10
8
y6
4
2
–10 –8
–6 –4
–2
–2
2
4
6
x
8
10
–4
–6
–8
–10
Die oben diskutierten Eigenschaften der Beispielfunktionen lassen sich auch in
den zugehörigen Gradientenfeldern leicht erkennen.
Sind wir daran interessiert, wie groß die Steigung an einem Punkt x, y in
eine durch einen Vektor ~n der Länge 1 gegebene Richtung ist, so müssen wir das
84
KAPITEL 2. MATHEMATISCHE METHODEN
Skalarprodukt
~ (x, y)
~n · ∇f
bilden. Für eine Funktion von n Veränderlichen ist die Steigung im Punkt ~x bei
Fortschreiten in Richtung des Vektors ~n, mit |~n| = 1, durch
~ (x1 , x2 , . . . , xn )
~n · ∇f
gegeben.
Ein in diesem Kontext wichtiger Begriff ist der der Äquipotentiallinie:27 Das
sind Kurven in der x, y-Ebene entlang derer sich f (x, y) nicht ändert. Ist so eine
Äquipotentiallinie durch einen vom Ort x, y abhängigen Tangentialvektor an der
~ (x, y) = 0. Für
Kurve ~n(x, y) der Länge 1 gegeben, so gilt damit ~n(x, y) · ∇f
die ersten beiden Beispielfunktionen sind die Äquipotentiallinien Kreise um den
Ursprung, die durch x2 +y 2 = const. gegeben sind, für die dritte sind es Hyperbeln
mit x2 − y 2 = const..
In allen unseren Beispielfunktionen spielt der Ursprung x = 0 = y eine ausgezeichnete Rolle. Im ersten Beispiel nimmt die Funktion im Ursprung ihren
maximalen Wert an, im zweiten den minimalen und im dritten Beispiel liegt ein
Sattelpunkt vor. Für die drei Beispiele verschwinden die beiden ersten partiellen
Ableitungen im Ursprung. Verallgemeinernd bezeichnet man die Punkte ~x0 an
denen alle ersten partiellen Ableitungen verschwinden, d.h.
∂f
(~x0 ) = 0 ,
∂xj
für alle j = 1, 2, . . . , n als stationäre Punkte.28
Da sich Gradientenfelder im physikalisch relevanteren dreidimensionalen Raum
nicht so schön graphisch darstellen lassen, wollen wir hier nicht weiter auf diesen
Fall eingehen. Wir wollen nur anmerken, daß das Konzept des Gradienten in der
Physik z.B. bei der Bestimmung eines Kraftfeldes aus einem Potential V (~x) (bzw.
aus der potentiellen Energie)
~ (~x)
F~ (~x) = −∇V
eine zentrale Rolle spielt. So läßt sich die am Anfang dieses Kapitels diskutierte
Gravitationskraft durch Bilden des negativen des Gradienten aus dem Potential
V (~x) = −γ
Mm
|~x|
bestimmen.
27
28
Wir beschränken uns hier auf das Beispiel der Funktionen von zwei Veränderlichen.
Ein stationärer Punkt ist also entweder ein Extremum oder ein Sattelpunkt.
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
85
Unsere Überlegungen sollten den Begriff des Gradienten einer skalaren Funktion mehrerer Veränderlicher hinreichend anschaulich verdeutlicht haben und auch
die Bedeutung in der Physik (speziell der Mechanik) sollte klar geworden sein.
Wir haben bereits die Taylorentwicklung um einen Punkt x0 für Funktionen
einer veränderlichen kennen gelernt. Diese läßt sich leicht auf den Fall einer skalaren Funktion (bzw. den einzelnen Komponenten vektorwertiger Funktionen) von
n Veränderlichen verallgemeinern. Betrachten wir dazu zunächst den Fall n = 2.
Die Funktion f (x, y) soll um den Punkt (x0 , y0 ) Taylor-entwickelt werden. Halten
wir zunächst y fest, so ergibt sich nach dem oben gelernten die Taylorreihe29
∞
X
1 ∂kf
f (x, y) =
(x0 , y) (x − x0 )k .
k
k! ∂x
k=0
Die auftretenden Ableitungen von f nach x werden an der Stelle x0 genommen
und sind daher nur noch von der Variablen y abhängig. Wir können diese also
nach y um den Punkt y0 Taylor-entwickeln30 und erhalten
"∞
#
∞
X
1 X 1 ∂l ∂kf
(x0 , y0 ) (y − y0 )l (x − x0 )k
f (x, y) =
l ∂xk
k!
l!
∂y
l=0
k=0
∞ X
∞
X
1 ∂ k+l f
=
(x0 , y0 ) (x − x0 )k (y − y0 )l .
k ∂y l
k!
l!
∂x
k=0 l=0
Um von der ersten zur zweiten Zeile zu gelangen haben wir angenommen, daß die
Reihenfolge der Ableitungen nach x und y keine Rolle spielt - was eine weitere
Forderung an die Eigenschaften von f darstellt - und wir die Summanden in
beliebiger Reihenfolge aufsummieren können. Wie sich aus diesen Überlegungen
die Taylorentwicklung für den Fall von n Veränderlichen
∞
∞
∞ X
X
X
1
∂ k1 +...+kn f
...
(~x0 ) (x1 − x0,1 )k1 . . . (xn − x0,n )kn
f (~x) =
k1
k
n
k
!
.
.
.
k
!
1
n ∂x1 . . . ∂xn
k1 =0 k2 =0
kn =0
ergibt sollte evident sein.
In praktischen Anwendungen benötigt man die Terme niedrigster Ordnung.
Für den Fall n = 2 sehen diese bis zur quadratischen Ordnung wie folgt aus
∂f
∂f
f (x, y) = f (x0 , y0 ) +
(x0 , y0 ) (x − x0 ) +
(x0 , y0 ) (y − y0 )
∂x
∂y
1 ∂ 2f
∂ 2f
2
+
(x
,
y
)
(x
−
x
)
+
(x0 , y0 ) (x − x0 )(y − y0 )
0 0
0
2 ∂x2
∂x∂y
1 ∂ 2f
+
(x0 , y0 ) (y − y0 )2 + . . . ,
2 ∂y 2
29
Wir gehen natürlich “Physiker-mäßig” wieder davon aus, daß f hinreichend harmlos ist, so
daß alle Ableitungen die wir bilden auch existieren.
30
Somit müssen auch die Ableitungen von f nach x hinreichend harmlose Funktionen von y
sein.
86
KAPITEL 2. MATHEMATISCHE METHODEN
wobei die Punkte für Terme stehen, die mindestens drei Faktoren der “kleinen”
Größen x − x0 und y − y0 enthalten. Entwickelt man um einen stationären Punkt,
so fallen die beiden linearen Terme (nach Definition des Begriffs stationärer
Punkt) weg. Diese Einsicht läßt sich direkt auch auf den höherdimensionalen
Fall (also z.B. den dreidimensionalen) übertragen.
Betrachten wir ein Teilchen, welches sich in der Nähe eines (lokalen) Potentialminimums bei ~x0 aufhält, d.h. die kinetische Energie31 sei hinreichend klein. In
diesem Fall scheint es plausibel, das Potential in einer Taylorreihe zu entwickeln.
Da es sich bei dem Minimum um einen stationären Punkt handelt, treten in der
Entwicklung bis zur zweiten Ordnung nur der konstante Term und die quadratischen Terme auf. Die auf das Teilchen wirkende Kraft (d.h. der Gradient des
Potentials) hat dann nur Terme die linear in der Auslenkung aus dem Minimum
sind. Das resultierende mechanische Problem ist also analog zu dem einer Masse
mit Hookscher Feder. Diese Überlegung macht es plausibel, daß das Problem mit
linearer Rückstellkraft eine sehr zentrale Rolle in der Mechanik spielt.
Neben dem Gradienten spielen in der Physik die “Differentiellen”-Konzepte
der Divergenz und der Rotation eine zentrale Rolle (speziell in “Feldtheorien” wie
z.B. der Elektrodynamik).
~
Im Fall der Divergenz wendet man den vektorwertigen Differentialoperator ∇
auf eine vektorwertige Funktion von n Veränderlichen an
~ · f~(~x) = ∂f1 + ∂f2 + . . . + ∂fn .
div f~(~x) = ∇
∂x1 ∂x2
∂xn
~ so verstehen, daß er in der {~ej }-Basis durch den
Dabei muß man den Vektor ∇
Spaltenvektor
 ∂ 
∂x1
 ∂
 ∂x2
.
~ =  ...
∇

 ...





∂
∂xn
dargestellt wird. Durch Bilden der Divergenz ergibt sich eine skalare Funktion
von n Veränderlichen.
Wir wollen die Bedeutung der Divergenz anschaulich verstehen. Dazu betrachten wir die Strömung einer kompressiblen Flüssigkeit in drei Dimensionen. Das
Geschwindigkeitsfeld ~v (~x) gibt die Geschwindigkeit (Richtung und Betrag) eines
Teilchens an, welches sich am Ort ~x befindet. Als weitere Größe zur Charakterisierung benötigen wir die lokale Dichte ρ(~x) der Flüssigkeit. Wir betrachten
dann einen kleinen Quader mit Volumen ∆x1 ∆x2 ∆x3 und einem Eckpunkt am
Koordinatenursprung. Dieser ist in der folgenden Skizze dargestellt.
31
Ich gehe davon aus, daß sie diesen Begriff in der Schule kenne gelernt haben und mit Leben
füllen können.
2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER
G
D
e3
C
e2 E
A e
1
87
H
F
B
Die Flüssigkeitsmenge, die pro Zeit durch Fläche (A, E, G, D) in dieses Volumen fließt ist durch ρv1 |~x=~0 ∆x2 ∆x3 gegeben. Die Komponenten des Flusses
ρv2 und ρv3 die tangential zur Fläche sind tragen nichts zum Fluß durch diese Fläche bei. Die Flüssigkeitsmenge, die pro Zeit durch die Fläche (B, F, H, C)
austritt ist durch ρv1 |x1 =∆x1 ,x2 =x3 =0 ∆x2 ∆x3 bestimmt. Bei diesen Überlegungen
sind wir davon ausgegangen, daß die Funktion ρ(~x)v1 (~x) auf den beiden betrachteten Flächen einen von x2 und x3 unabhängigen Wert hat. Für hinreichend kleine
Quader und hinreichend harmlose Funktionen ρ(~x)v1 (~x) ist dies immer erreichbar. Wir entwickeln dann die austretende Flüssigkeitsmenge in einer Taylorreihe
bezüglich x1 und erhalten
∂ρv1 ∆x1 ∆x2 ∆x3 .
ρv1 |x1 =∆x1 ,x2 =x3 =0 ∆x2 ∆x3 ≈ ρv1 |~x=~0 ∆x2 ∆x3 +
∂x1 ~x=~0
Der Gesamtfluß aus dem Volumen in die x1 -Richtung ergibt sich als Differenz der
beiden gerade berechneten Flüsse und wir erhalten für diesen
∂ρv1 ∆x1 ∆x2 ∆x3 .
∂x1 ~x=~0
Analoge Überlegungen gelten für die Flüsse durch die anderen Flächen des Quaders. Der Gesamtfluß pro Zeit aus dem Quader ist dann die Summe dieser Ausdrücke und durch
∂ρv1 ∂ρv2 ∂ρv3 ~ · (ρ~v )
+
+
∆x
∆x
∆x
=
∇
∆x1 ∆x2 ∆x3
1
2
3
∂x1
∂x2
∂x3 ~x=~0
~
x=~0
~ · (ρ~v ), ist also durch
gegeben. Der Fluß pro Zeit und Volumen ergibt sich so zu ∇
die Divergenz gegeben. Diese hat damit die Bedeutung einer lokalen Quellstärke
des Vektorfeldes ρ~v . Wir sind dabei davon ausgegangen, daß das obige Ergebnis
für kleine Volumina unabhängig von der Form des Volumens (hier “infinitessimaler” Quader) ist und das die Überlegungen nicht auf den Ursprung ~x = 0
beschränkt sind.
88
KAPITEL 2. MATHEMATISCHE METHODEN
Mit der Interpretation der Divergenz eines Vektorfeldes als lokaler Quellstärke,
läßt sich auch eine der Grundgleichungen der Elektrostatik
~ · E(~
~ x) ∝ ρ(~x) ,
∇
~ und der Ladungsdichte ρ, verstehen. Die Quellen eimit dem elektrischen Feld E
nes elektrischen Feldes sind Ladungen. Magnetfelder dagegen haben keine Quellen
(es gibt keine magnetischen Monopole), so daß
~ · B(~
~ x) = 0 ,
∇
~
mit dem Magnetfeld B.
Die Rotation ist in drei Dimensionen (d.h. f~ ∈ R3 und ~x ∈ R3 ) definiert durch
∂f
∂f
∂f
∂f
∂f
∂f
2
1
3
2
1
3
~
~
~ × f (~x) =
−
~e1 +
−
~e2 +
−
~e3 .
rot f (~x) = ∇
∂x2 ∂x3
∂x3 ∂x1
∂x1 ∂x2
~ und f~ gebildet wird, handelt es sich bei
Da hier das Vektorprodukt zwischen ∇
dem Resultat dieser Operation um eine vektorwertige Funktion (eines Vektors).
Die anschauliche Bedeutung der Rotation können wir uns ebenfalls anhand
von Strömungen einer Flüssigkeit klar machen. Dazu betrachten wir einen Wirbel.
Das Geschwindigkeitsfeld ~v (~x) = ω
~ × ~x beschreibt einen speziellen, homogenen
Wirbel mit Richtung ω
~ /|~ω | und Betrag der Wirbelstärke |~ω |. Für die erste Komponente der Rotation von ~v (~x) gilt
∂v2
∂v3
~
−
∇ × ~v
=
∂x2 ∂x3
1
∂(ω1 x2 − ω2 x1 ) ∂(ω3 x1 − ω1 x3 )
=
−
∂x2
∂x3
= 2ω1 .
Analoge Überlegungen für die anderen Komponenten liefern
~ × ~v = 2~ω .
∇
Damit ist klar, daß die Rotation ein Maß für den Betrag und die Richtung der
Wirbelstärke liefert.
Nach der Illustration der Begriffe Divergenz und Rotation sollte ihnen anschaulich klar sein, daß Wirbelfelder stets quellenfrei sind, oder mathematisch
~ · (∇
~ × f~) = 0 ,
∇
falls f~ zweimal stetig differenzierbar ist. In einer Übungsaufgabe werden sie dieses auch mathemtisch zeigen. Wie sie ebenfalls in einer Übungsaufgabe zeigen
werden, gilt
~ × [∇φ(~
~ x)] = 0 ,
∇
2.13. MATRIZEN
89
d.h. die Rotation eines Gradientenfeldes verschwindet, wobei wir natürlich davon
ausgehen, daß φ(~x) zweimal stetig differenzierbar ist.
Verglichen mit der Bedeutung des Gradienten in der klassischen Mechanik
spielen die beiden Begriffe Divergenz und Rotation in dieser eher untergeordnete
Rollen.32
2.13
Matrizen
Wir wollen den Begriff der Matrix hier anhand einer speziellen Klasse von Matrizen - denjenigen die Drehungen beschreiben - einführen. Diese spielen in der
Mechanik eine zentrale Rolle. Wir betrachten dazu die Situation, daß wir ei0
0
0
ne orthonormale Basis B = [~e1 , ~e2 , ~e3 ] auf eine andere B 0 = [~e1 , ~e2 , ~e3 ] rotieren
möchten.
e’3
e3
e’2
e2
e’1
e1
Einen beliebigen Vektor ~x können wir dann in beiden Basen ausdrücken
0
0
0
~x = x1~e1 + x2~e2 + x3~e3 = x01~e1 + x02~e2 + x03~e3 .
(2.43)
Um die x0i , mit i = 1, 2, 3 aus den xj , mit j = 1, 2, 3 zu berechnen, drücken wir
0
zunächst die neuen Basisvektoren ~ei durch die alten ~ej aus
0
~ei = ai,1~e1 + ai,2~e2 + ai,3~e3 .
(2.44)
Die sich ergebenden 3 ∗ 3 Zahlen ai,j ordnen wir in ein 3 × 3 Schema, in dem der
erste Index die Zeile angibt und der zweite die Spalte


a1,1 a1,2 a1,3
A =  a2,1 a2,2 a2,3  ,
a3,1 a3,2 a3,3
welches wir mit A bezeichnen und Matrix nennen. Die ai,j nennen wir Matrixelemente. Die Bedeutung der ai,j erkennen wir, indem wir Gl. (2.44) mit ~ej multiplizieren und Gl. (2.36) verwenden
0
ai,j = ~ei · ~ej .
32
Die Rotation spielt eine Rolle in der Mechanik als “Werkzeug” um zu untersuchen, ob ein
Vektorfeld als Gradient einer skalaren Funktion, d.h. als Gradient eines Potentials, zu schreiben
ist. Wir werden darauf weiter unter zurückkommen.
90
KAPITEL 2. MATHEMATISCHE METHODEN
0
Da die Länge von ~ei und ~ej Eins ist, ergibt sich nach der Definition des Skalarprodukts
0 ai,j = cos ϕ ~ei , ~ej .
Die Matrix A beschreibt also alle Winkel der neuen Basis B 0 in Bezug auf B. Da
0
|~ei | = 1 gilt, folgt aus Gl. (2.44)
0
0
~ei · ~ei = 1 =
3
X
a2i,j
(2.45)
j=1
0
für i = 1, 2, 3. Weiterhin sind die ~ei paarweise senkrecht zueinander (i 6= j)
0
0
~ei · ~ej = 0 =
3
X
ai,k aj,k .
(2.46)
k=1
Die Eigenschaften der Gln. (2.45) und (2.46) sind speziell für die eine Rotation
darstellende Matrix. Für allgemeine Matrizen sind die Matrixelemente ai,j beliebige reelle (oder komplexe) Zahlen. Die Gln. (2.45) und (2.46) kann man zu
3
X
ai,k aj,k = δi,j
(2.47)
k=1
zusammenfassen. Oft schreibt man diese Gleichung einfach als ai,k aj,k = δi,j und
verwendet die Einsteinsche Summationskonvention, die vorschreibt, daß über alle
auf einer Seite der Gleichung doppelt auftretenden Indizes summiert wird. Um zu
sehen, wie man mit Hilfe der Matrix A die x0i in Gl. (2.43) aus den xj berechnen
0
kann, bilden wir auf beiden Seiten der Gleichung das Skalarprodukt mit ~e1 . So
ergibt sich
x01
0
0
0
= x1~e1 · ~e1 + x2~e1 · ~e2 + x3~e1 · ~e3 =
3
X
a1,j xj .
j=1
Völlig analog kann man x02 und x03 bestimmen. Insgesamt gilt
x0i
=
3
X
ai,j xj .
j=1
Mit Hilfe der Matrix können wir also die neuen Vektorkomponenten aus den
alten berechnen. Eine Matrix beschreibt allgemein eine Abbildung eines Vektors
auf einen anderen. Die Klasse von Matrizen mit der Eigenschaft der Gl. (2.47)
bezeichnet man als orthogonale Matrizen. Sie repräsentieren Drehungen.
2.13. MATRIZEN
91
Will man zwei Rotationen - gegeben durch die Matrizen A und B - (allgemeiner zwei Abbildungen) hintereinander ausführen, so kann man die Matrix C,
die beide Transformationen in einem Schritt vermittelt, wie folgt bestimmen
x00i
=
3
X
bi,j x0j
=
3
X
j=1
bi,j
j=1
3
X
aj,k xk =
k=1
3
X
ci,k xk ,
k=1
mit
ci,k =
3
X
bi,j aj,k .
j=1
Kurz schreibt man C = BA. Man multipliziert die Matrizen B und A miteinander.
Will man von den neuen Koordinaten zurück auf die alten transformieren, so
muß gelten
ci,k =
3
X
bi,j aj,k = δi,k ,
j=1
damit x00i = xi folgt. Man bezeichnet B in diesem Fall als das Inverse von A und
schreibt B = A−1 . Mit Hilfe der Gl. (2.47) sieht man, daß sich für orthogonale
Matrizen die Matrixelmente ãi,j der inversen Matrix A−1 aus den ai,j durch Vertauschen der Zeilen- und Spaltenindizes ergeben ãi,j = aj,i . Allgemein nennt man
die sich aus A durch Vertauschen der Zeilen- und Spaltenindizes ergebenden Matrix die zu A transponierte Matrix und bezeichnet sie mit AT . Für orthogonale
Matrizen gilt also AT = A−1 .
Nach dieser Einführung des Matrix-Begriffs anhand eines in der Physik wichtigen Beispiels, wollen wir noch kurz auf ein paar allgemeine Gesichtspunkte
eingehen. Allgemein nennen wir ein Schema mit n Zeilen und m Spalten


a1,1 a1,2 . . . a1,m
 a2,1 a2,2 . . . a2,m 


 ... ... ... ... 


 ·

·
·
·

A=
 ·
·
·
· 


 ·

·
·
·


 ... ... ... ... 
an,1 an,2 . . . an,m
mit ai,j ∈ R (bzw. ∈ C) eine n×m-Matrix. Der erste Index ist der Zeilenindex, der
zweite der Spaltenindex. Bei der Multiplikation einer Matrix mit einer reellen bzw.
komplexen Zahl λ werden einfach alle Matrixelemente ai,j mit λ multipliziert. Für
B = λA gilt also,
bi,j = λai,j für i = 1, 2, . . . , n und j = 1, 2, . . . , m .
92
KAPITEL 2. MATHEMATISCHE METHODEN
Nur für den Fall, daß zwei Matrizen die gleiche Anzahl von Spalten und Zeilen
haben kann die Addition zweier Matrizen A und B sinnvoll definiert werden. Sie
ist komponentenweise definiert, d.h. es gilt für C = A + B
ci,j = ai,j + bi,j für i = 1, 2, . . . , n und j = 1, 2, . . . , m .
Eine Allgemeine n × m-Matrix beschreibt eine lineare Abbildung vom Rm in
den Rn (bzw. vom Cm in den Cn ).33 Eine Abbildung A vom Rm in den Rn heißt
linear, wenn sie die folgenden Eigenschaften für alle ~x, ~y ∈ Rm und λ ∈ R erfüllt:
A(~x + ~y ) = A(~x) + A(~y )
A(λ~x) = λA(~x) .
Um das Bild A(~x) eines Vektors ~x ∈ Rm zu bestimmen, kann man die Matrix A
auf den Vektor ~x anwenden
~y = A~x ,
(2.48)
mit ~y ∈ Rn . Komponentenweise schreibt man diese Gleichung wie folgt:
yi =
m
X
ai,j xj für i = 1, 2, . . . , n .
j=1
Eine Gleichung dieser Form haben sie wahrscheinlich in der Schule im Zusammenhang mit dem Problem von “n linearen Gleichungen zur Bestimmung von
m Unbekannten xj , mit j = 1, 2, . . . , m” kennengelernt. In diesem Kontext ergibt sich das zur Abbildungsidee umgekehrte Problem: Die linken Seiten yi sind
vorgegeben und man möchte die xj bestimmen, die den Satz von Gleichungen
erfüllt. Diese Überlegung führt uns erneut auf das Konzept der Inversen A−1
einer Matrix A. Bevor wir dieses Konzept allgemein genauer beleuchten, müssen
wir die Multiplikation zweier Matrixen definieren. Da es sich bei n × m-Matrizen
um lineare Abbildungen vom Rm in den Rn handelt soll die Matrix C = BA der
Abbildung C entsprechen, die sich beim Hintereinanderausführen von A (zuerst)
und B (als zweites) ergibt. Damit ist unter anderem klar, daß die Multiplikation
nur für zwei Matrizen sinnvoll definiert werden kann, für die die Zahl der Zeilen
der zuerst anzuwendenden Matrix A gleich der Zahl der Spalten der als zweites
anzuwendenden Matrix B ist. Die Matrix A beschreibt damit eine lineare Abbildung vom Rm in den Rn , die Matrix B eine vom Rn in den Rl , so daß C eine
lineare Abbildung vom Rm in den Rl beschreibt. Völlig analog zu den Überlegungen im obigen Beispiel der 3 × 3-Matrix ergibt sich unter Zuhilfenahme von Gl.
(2.48) für die Matrixelemente von C
ci,k =
n
X
bi,j aj,k für i = 1, 2, . . . , l und k = 1, 2, . . . , m .
j=1
33
Von jetzt an, werden wir uns auf reelle Matrizen beschränken. Das folgende läßt sich aber
leicht auf den Fall komplexer Matrizen verallgemeinern.
2.13. MATRIZEN
93
Im Gegensatz zur Multiplikation von reellen Zahlen ist damit klar, daß im Allgemeinen BA nicht gleich34 AB ist, da letzteres nur für l = m überhaupt definiert ist. Aber selbst, wenn beide Produkte definiert sind (z.B. im physikalisch
wichtigen Fall zweier n × n-Matrizen), gilt im Allgemeinen BA 6= AB! Die Matrixmultiplikation ist im Allgemeinen also nicht kommutativ. Ein Beispiel dazu
werden sie in den Übungen rechnen. Im Gegensatz dazu gelten für die Matrixmultiplikation das Assoziativgesetz (AB) C = A (BC) und das Distributivgesetz
(A + B) C = AC + BC.
Betrachten wir im folgenden nur noch den Fall von n×n-Matrizen. Das Inverse
−1
A der Matrix A ist definiert durch
A−1 A = AA−1 = 1 .
Die Einheitsmatrix 1 hat die Matrixelemente δi,j . Diese Gleichung erlaubt es A−1
eindeutig zu berechnen, sofern es A−1 überhaupt gibt. Ein einfaches Kriterium
um festzustellen, ob A−1 existiert, werden sie in der Vorlesung HöMa I beweisen.35 Dort werden sie im Fall der Existenz auch ein systematisches Verfahren
zum Bestimmen von A−1 kennenlernen. Wie man leicht nachrechnet hat die Einheitsmatrix 1 die Eigenschaft A1 = A. Die Nullmatrix 0 ist dadurch definiert,
daß alle Matrixelemente Null sind.36 Damit gilt A0 = 0 für alle Matrizen A.
Nehmen wir an, daß das Inverse von A im oben angesprochenen Beispiel des
Problems “Bestimmung von n Unbekannten xi aus n linearen Gleichungen” (die
yi sind bekannt)
yi =
n
X
ai,j xj für i = 1, 2, . . . , n .
j=1
existiert. In diesem Fall ergeben sich die Unbekannten xi eindeutig aus
xi =
n
X
ãi,j yj für i = 1, 2, . . . , n ,
j=1
wobei die ãi,j die Matrixelemente von A−1 bezeichnen. Für das Bilden der inversen
Matrix gilt37
(AB)−1 = B−1 A−1 ,
wie sich aus X (AB) = 1 durch Multiplikation zuerst mit B−1 und anschließender
Multiplikation mit A−1 jeweils von rechts auf beiden Seiten der Gleichung ergibt.
Im nächsten Kapitel werden wir das so genannte Eigenwertproblem einer speziellen Klasse von Matrizen untersuchen.
34
Zwei Matrizen sind gleich, wenn alle ihre Matrixelemente gleich sind.
Wir werden später kurz auf diesen Aspekt zurückkommen.
36
Durch diese Definition ist auch im allgemeinen Fall der n × m-Matrix eine Nullmatrix
festgelegt.
37
Wir nehmen an, daß alle auftretenden inversen Matrizen auch existieren.
35
94
2.14
KAPITEL 2. MATHEMATISCHE METHODEN
Das Eigenwertproblem und die Hauptachsentransformation
In der Mechanik starrer Körper spielen das Eigenwertproblem und die Hauptachsentransformation eine große Rolle. Eine weitere für uns wichtige Rolle spielen
diese Begriffe bei der Lösung von Systemen gekoppelter linearer Differentialgleichungen. Solche ergeben sich wenn man die Newtonsche Gleichung für eine wichtige Klasse von mechanischen Problemen aufstellt.
Wir werden das Eigenwertproblem anhand eines einfachen Beispiels einführen
und uns hier auf reelle Matrizen, also den Rn , beschränken. Wir betrachten die
(diagonale) 3 × 3-Matrix


1 0 0
A= 0 4 0  .
0 0 −2
Sie hat die Eigenschaft, daß
  
 
 
1
1 0 0
1
1







0 4 0
0
0  ,
A 0
=
=1
0
0 0 −2
0
0
  
 
 
0
1 0 0
0
0







1
0
4
0
1
1  ,
A
=
=4
0
0 0 −2
0
0
  
 
 
0
1 0 0
0
0
A  0  =  0 4 0   0  = −2  0  ,
1
0 0 −2
1
1
d.h. die Basisvektoren ~ej reproduzieren sich bis auf einen Faktor, wenn man A
auf sie anwendet. Allgemein bezeichnet man einen Vektor ~v 6= ~0 der sich bei
Anwenden einer Matrix A bis auf einen Faktor λ ∈ R reproduziert, d.h. für den
A~v = λ~v
gilt, als einen Eigenvektor von A zum Eigenwert λ. Also sind die Basisvektoren
~ej Eigenvektoren der obigen (diagonalen) Matrix A zu den Eigenwerten 1, 4 und
−2. Es stellen sich dann zwei Fragen: 1) Warum ist es interessant Eigenwerte
und Eigenvektoren eine Matrix zu kennen? 2) Wie bestimmt man λ und ~v ? Diese
werden wir in diesem Kapitel der Vorlesung beantworten, wobei wir uns primär
auf Matrizen auf dem R2 und dem R3 beschränken werden.
Bevor wir dazu kommen, wollen wir jedoch ein weitere Eigenschaften von
Eigenvektoren kennenlernen, eine alternative Notation für das Skalarprodukt
einführen und eine Klasse von Matrizen charakterisieren auf deren Eigenwertproblem wir uns dann im folgenden beschränken werden
2.14. DAS EIGENWERTPROBLEM
95
Nehmen wir an, daß wir einen Eigenvektor ~v von A zum Eigenwert λ kennen.
Dann ist auch c~v , mit c ∈ R \ {0} ein Eigenvektor zum Eigenwert λ.38 Das sieht
man sehr leicht
A(c~v ) = cA~v = cλ~v = λ(c~v ) .
Somit ist ein Eigenvektor nur bis auf einen Faktor eindeutig definiert. Daher ist es
sinnvoll einen auf 1 normierten Eigenvektor zum Eigenwert λ einzuführen: |~v | = 1.
Von jetzt an gehen wir davon aus, daß die Eigenvektoren die wir betrachten auf
1 normiert sind.
Weiter oben haben wir den Begriff der transponierten Matrix eingeführt




a1,1 a1,2 . . . a1,m
a1,1 a2,1 . . . an,1
 a2,1 a2,2 . . . a2,m 
 a1,2 a2,2 . . . an,2 




 ... ... ... ... 
 ... ... ... ... 




 ·
 ·
·
·
· 
·
·
· 
T



 .
A=
⇒A = ·

·
·
·
·
·
·
·




 ·


·
·
· 
·
·
· 

 ·

 ... ... ... ... 
 ... ... ... ... 
an,1 an,2 . . . an,m
a1,m a2,m . . . an,m
Wir werden die wichtige Relation
C = AB ⇒ CT = BT AT
benötigen, die sich wie folgt ergibt:
ci,j =
m
X
ai,k bk,j
k=1
⇒
c̃i,j = cj,i =
m
X
k=1
aj,k bk,i =
m
X
k=1
bk,i aj,k =
m
X
b̃i,k ãk,j ,
k=1
wobei die mit einer Schlange bezeichneten Matrixelemente, diejenigen der transponierten Matrix sind.
Eine Matrix mit der Eigenschaft A = AT bezeichnet man als symmetrische
Matrix. Beispiele sind die Matrizen


1 3 −1
A =  3 71 π 
−1 π 0
38
Zwar kann 0 ein Eigenwert einer Matrix sein, jedoch niemals der Nullvektor ein Eigenvektor.
Formal hat der Nullvektor immer die obige definierende Eigenschaft eines Eigenvektors, jedoch
wäre der Eigenwert völlig unspezifisch da jede reelle Zahl µ, die Relation A~0 = µ~0 erfüllt.
96
KAPITEL 2. MATHEMATISCHE METHODEN
und
B=
cos (ϕ) sin (θ)
sin (θ) sin (ϕ)
.
Wir werden hier nur das Eigenwertproblem symmetrischer Matrizen betrachten.
Der Trägheitstensor eines starren Körpers im dreidimensionalen Raum ist eine
solche symmetrische 3 × 3-Matrix. Es ist wichtig zu erkennen, daß nur quadratische n × n-Matrizen symmetrisch sein können.
Um später einfacher vorgehen zu können, wollen wir eine alternative Notation
einführen und das Skalarprodunkt zweier Vektoren als Matrixmultiplikation eines
transponierten Vektors und eines Vektors schreiben. Mit


x1
.
.
~x =  x2  ⇒ ~xT = (x1 , x2 , x3 ) .
x3
Damit können wir schreiben

y1
.
.
~x · ~y = x1 y1 + . . . x3 y3 = (x1 , x2 , x3 )  y2  = ~xT ~y .
y3

Es gilt ebenfalls
~y = A~x
.
⇒ ~y T = (A~x)T = (a1,1 x1 + a1,2 x2 + a1,3 x3 , . . . , a3,1 x1 + a3,2 x2 + a3,3 x3 )


a1,1 a2,1 a3,1
.
= (x1 , x2 , x3 )  a1,2 a2,2 a3,2  = ~xT AT .
a1,3 a2,3 a3,3
Wir betrachten nun das Eigenwertproblem einer symmetrischen Matrix AT =
A. Seien ~vi 6= ±~vj zwei normierte Eigenvektoren zu den Eigenwerten λi und λj
(wir nehmen an, daß es zwei gibt). Damit gilt
~viT A~vj = ~viT λj ~vj = λj (~vi · ~vj ) .
Die linke Seite dieser Gleichung ist aber auch gleich
~viT A~vj = (A~vi )T ~vj = (λi~vi )T ~vj = λi (~vi · ~vj ) .
Aus diesen beiden Gleichungen folgt
(λj − λi )(~vi · ~vj ) = 0 .
Damit gibt es zwei Möglichkeiten:
1. Für λj 6= λi folgt daß ~vj und ~vi senkrecht aufeinander stehen.
2.14. DAS EIGENWERTPROBLEM
97
2. Für λj = λi = λ spannen ~vi und ~vj eine zweidimensionale Ebene E auf.
Jeder Vektor ~x ∈ E läßt sich als
~x = a~vi + b~vj ; a, b ∈ R
schreiben. Daraus ergibt sich sofort, daß auch ~x Eigenvektor zum Eigenwert
λ ist, da
A~x = A(a~vi + b~vj ) = aA~vi + bA~vj = λ(a~vi + b~vj ) = λ~x .
Somit sind alle Vektoren in E Eigenvektoren und wir können zwei Vektoren
auswählen, die senkrecht aufeinander stehen.
Es bleibt noch die wichtige Frage zu beantworten, ob es überhaupt zu einer
reellen, symmetrischen Matrix einen oder mehrere Eigenvektoren (und die dazugehörigen reellen Eigenwerte) gibt. Da wir in dieser Vorlesung bisher recht
konsequent auf Existenzbeweise verzichtet haben (aus Zeitgründen und weil diese in der HöMa geliefert werden), wollen wir dieses auch in diesem Fall tun. Sie
werden in den hier betrachteten Beispielen “konstruktiv” sehen, daß es immer n
Eigenvektoren gibt. In der HöMa Vorlesung wird bewiesen, daß es zu einer reellen
symmetrischen n × n-Matrix n Eigenvektoren (und dazugehörige reelle Eigenwerte) gibt. Für allgemeine (nicht-symmetrische Matrizen ist das nicht unbedingt
der Fall.
Aus 1. und 2. ergibt sich, daß die auf 1 normierten Eigenvektoren paarweise
senkrecht aufeinander stehen. Also für i = 1, 2, . . . , n: |~vi | = 1; ~vi ⊥ ~vj für i 6= j.
Damit ist {~v1 , ~v2 , . . . , ~vn } eine orthonormale Basis (Rechtssystem). Bei festgehaltenem Ursprung geht {~v1 , ~v2 , . . . , ~vn } durch eine Rotation aus {~e1 , ~e2 , . . . , ~en }
hervor. Betrachten wir wieder den Spezialfall einer symmetrischen 3 × 3-Matrix
A und die dazugehörige Matrix

  T 
v1,1 v1,2 v1,3
~v1
S =  v2,1 v2,2 v2,3  =  ~v2T 
v3,1 v3,2 v3,3
~v3T
die aus den zueinander senkrechten, normierten Eigenvektoren von A gebildet
ist. Es gilt


v1,1 v2,1 v3,1
ST =  v1,2 v2,2 v3,2  = (~v1 , ~v2 , ~v3 ) .
v1,3 v2,3 v3,3
Nach unseren obigen Überlegungen und denen des letzten Kapitels beschreibt S
eine Rotation und ist somit eine orthogonale Matrix mit ST = S−1 . Wir betrach-
98
KAPITEL 2. MATHEMATISCHE METHODEN
ten nun39

 T 
~v1
~v1T
=  ~v2T  A(~v1 , ~v2 , ~v3 ) =  ~v2T  (λ1~v1 , λ2~v2 , λ3~v3 )
~v3T
~v3T


λ1 ~v1 · ~v1 λ2 ~v1 · ~v2 λ3 ~v1 · ~v3
=  λ1 ~v2 · ~v1 λ2 ~v2 · ~v2 λ3 ~v2 · ~v3 
λ1 ~v3 · ~v1 λ2 ~v3 · ~v2 λ3 ~v3 · ~v3


λ1 0 0
=  0 λ2 0  .
0 0 λ3

SAST
Durch das Anwenden von S von links und ST von rechts, haben wir die Matrix
A somit auf Diagonalform gebracht. Die Einträge auf der Diagonalen sind die Eigenwerte. Dies ist die Hauptachsentransformation. Wie sie in der Mechanik lernen
werden ist es sehr vorteilhaft, z.B. den Trägheitstensor eines starren Körpers mit
Hilfe der Hauptachsentransformation auf Diagonalform zu bringen. Dazu benötigen wir natürlich die Matrix S, d.h. die Eigenvektoren der symmetrischen Matrix
A. Wir wollen daher als nächstes beschreiben, wie man die ~vi und λi bestimmt.
Um einen Weg zur Bestimmung von ~vi und λi zu finden betrachten wir die
Definitionsgleichung.
⇒
A~vi = λi~vi = λi 1~vi
(A − λi 1)~vi = 0 .
Die Frage die sich somit zur Bestimmung von λi stellt ist: Für welche λi gibt
es eine nicht-triviale Lösung ~vi 6= 0 der Gleichung in der letzten Zeile?40 Wir
haben also das Problem vorliegen: B~x = 0; unter welcher Bedingung an B gibt
es Lösung mit ~x 6= 0. Wir führen Vektoren ~bi ein, so daß


~bT
 1 
B =  ~bT2  ,
~bT
3
woraus sich für die uns interessierende Gleichung

  
~b1 · ~x
0
~
  
0
B~x =  b2 · ~x  =
~b3 · ~x
0
ergibt. Die Frage ist also, ob es einen Vektor ~x 6= 0 gibt, der senkrecht auf allen
drei Vektoren ~b1 , ~b2 und ~b3 steht. Es gibt im R3 solch einen Vektor falls die ~b1 , ~b2
39
40
Vergewissern sie sich, daß sie die hier verwendete Notation wirklich verstehen!
Zur Erinnerung: Der Nullvektor kann nicht Eigenvektor sein.
2.14. DAS EIGENWERTPROBLEM
99
und ~b3 in einer Ebene liegen (d.h. koplanar sind). Also gibt es eine nicht-triviale
Lösung wenn das durch die drei Vektoren ~bi aufgespannte dreidimensionale Volumen, d.h. das Spatprodukt der drei Vektoren ~bi , verschwindet:41
V (~b1 , ~b2 , ~b3 ) = (~b1 × ~b2 ) · ~b3 = 0 .
In diesem Kontext nennt man V (~b1 , ~b2 , ~b3 ) die Determinante der 3 × 3-Matrix B,
die man mit det B bezeichnet.
Die Determinante berechnet sich dann wie folgt:

 

b1,2 b2,3 − b1,3 b2,2
b3,1
det B = (~b1 × ~b2 ) · ~b3 =  b1,3 b2,1 − b1,1 b2,3  ·  b3,2 
b1,1 b2,2 − b1,2 b2,1
b3,3
= b1,2 b2,3 b3,1 − b1,3 b2,2 b3,1 + b1,3 b2,1 b3,2
−b1,1 b2,3 b3,2 + b1,1 b2,2 b3,3 − b1,2 b2,1 b3,3 .
Es gibt für diesen etwas unübersichtlichen Ausdruck eine einfache Merkregel, die
in der Vorlesung angegeben wird.
Eine völlig analoge Argumentation kann für 2 × 2-Matrizen geführt werden.
Die Determinante einer 2 × 2-Matrix ist das durch die Vektoren ~b1 und ~b2 aufgespannte zweidimensionale Volumen (also die Fläche), die sich gemäß
V (~b1 , ~b2 ) = |~b1 ||~b2 | sin (ϕ) ,
mit dem von ~b1 und ~b2 eingeschlossenen Winkel ϕ, berechnet. Mit Hilfe der folgenden Skizze können wir diesen Ausdruck umformulieren, so daß sich die Determinante aus den Matrixelementen ergibt.
e2
b2
θ
ϕ
b1
ψ
e1
Es gilt
det B = V (~b1 , ~b2 ) = |~b1 ||~b2 | sin (θ − ψ) = |~b1 ||~b2 | [sin (θ) cos (ψ) − cos (θ) sin (ψ)]
= b1,1 b2,2 − b1,2 b2,1 .
41
Eine zweidimensionale Ebene im dreidimensionalen Raum hat Volumen 0.
100
KAPITEL 2. MATHEMATISCHE METHODEN
Wie man die Determinante für eine allgemeine n × n-Matrix definiert werden sie
in der Vorlesung HöMa I kennen lernen.
Bezüglich der Bestimmung der Eigenwerte zu einer gegebenen Matrix A stellt
sich also die Frage, für welche λ
det (A − λ1) = 0
gilt. Nach den obigen Regeln zur Bestimmung der Determinanten von 2 × 2und 3 × 3-Matrizen ist klar, daß es sich bei der linke Seite dieser Gleichung
um ein Polynom zweiten bzw. dritten Grades in λ handelt. Man nennt es auch
das charakteristische Polynom. Die Eigenwerte sind somit die Nullstellen des
charakteristischen Polynoms.
Betrachten wir nun abschließend ein Beispiel was auch zeigt, wie man bei
bekanntem Eigenwert einen Eigenvektor bestimmt. Weitere Beispiele werden sie
in den Übungen rechnen. Wir betrachten die symmetrische 2 × 2-Matrix
1 −1
A=
.
−1 3
Das charakteristische Polynom ergibt sich zu
1 − λ −1
det (A − λ1) = det
= (1 − λ)(3 − λ) − 1 = λ2 − 4λ + 2 ,
−1 3 − λ
mit den Nullstellen
λ1/2 = 2 ±
√
2.
Die Matrix A hat somit die Eigenwerte λ1/2 = 2 ±
ergibt sich als der Vektor, der die Gleichung
√
2. Der Eigenvektor ~v1 zu λ1
(A − λ1 1) ~v1 = 0
⇒
1−2−
−1
√
2
−1 √
3−2− 2
v1,1
v1,2
=
0
0
erfüllt. Die erste Komponente dieser Gleichung liefert
√
(−1 − 2)v1,1 − v1,2 = 0
√
⇒
v1,2 = −(1 + 2)v1,1 .
Die sich aus der zweiten Komponente ergebende Gleichung liefert die gleiche
Bedingung, was man daran sieht, daß sie mit der ersten Gleichung konsistent ist
√
√
√
−v1,1 + (1 − 2)v1,2 = −v1,1 − (1 − 2)(1 + 2)v1,1 = −v1,1 + v1,1 = 0 .
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
101
Also folgt für den Eigenvektor zum Eigenwert λ1 , daß er die Form
~v1 =
x√
−(1 + 2)x
,
mit x ∈ R hat. Das x bestimmen wir nun so, daß ~v1 auf 1 normiert ist
q
q
√
√
|~v1 | = x2 + (1 + 2)2 x2 = |x| 4 + 2 2
und damit
1
x= p
√ ,
4+2 2
wobei wir uns für das positive x entschieden haben. In den Übungen werden sie
dieses Beispiel vervollständigen, d.h. ~v2 berechnen und explizit zeigen, daß die
bestimmten λi und ~vi , mit i = 1, 2, die Definitionsgleichung für Eigenwerte und
Eigenvektoren erfüllen.
2.15
Systeme linearer Differentialgleichungen
Wir werden jetzt noch einmal auf Differentialgleichungen zurückkommen. Genauer wollen wir Systeme linearer, gekoppelter Differentialgleichungen betrachten, die
in der Mechanik eine wichtige Rolle spielen und zusätzlich ein wichtiges Hilfsmittel zur Lösung von Gleichungen höherer Ordnung darstellen.
Als erstes Beispiel betrachten wir das in der folgenden Abbildung dargestellte
mechanische Problem.
m
m
x1
x2
Zwei Körper gleicher Masse m sind über Hooksche Federn gleicher Federkonstante k ≥ 0 mit den Wänden verbunden und eine weitere Hooksche Feder mit
Konstanten K ≥ 0 miteinander gekoppelt. Wir nehmen an, daß sich die Massen reibungsfrei auf einem Tisch (dieser “liefert” die Gegenkraft zur Gravitationskraft) bewegen können. Die Auslenkung aus der Ruhelage ist durch x1 und
x2 bezeichnet und sei hinreichend klein, so daß die Massen während der Bewegung nicht direkt aneinander stoßen. Die Gravitationskraft zwischen den beiden
Massen (und mit den Wänden) kann man verglichen mit den über die Federn
102
KAPITEL 2. MATHEMATISCHE METHODEN
vermittelten Kräfte vernachlässigen Die Newtonschen Bewegungsgleichungen für
die xj ergeben sich dann zu
d2
K
k+K
x1 (t) + x2 (t)
x1 (t) = −
2
dt
m
m
d2
k+K
K
x1 (t) −
x2 (t)
x2 (t) =
dt2
m
m
bzw. in Matrixschreibweise
k+K
K
d2
x1 (t)
− m
x
(t)
1
m
=
K
k+K
x2 (t)
−
dt2 x2 (t)
m
m
und bilden ein System linearer, gekoppelter Differentialgleichungen zweiter Ordnung. Die Matrix auf der rechten Seite ist symmetrisch. Die Anfangsbedingungen
sind durch x1 (t = 0) = x01 , ẋ1 (t = 0) = v10 , x2 (t = 0) = x02 , und ẋ2 (t = 0) = v20
gegeben. Es ist physikalisch plausibel, daß es diese vier Anfangsbedingungen gibt.
Das gekoppelte Differentialgleichungssystem ist linear und hat konstante Koeffizienten, d.h. die Einträge der Matrix hängen nicht von der Zeit t ab. Für den Fall
K = 0 wird die obige Matrix diagonal und das System zerfällt in zwei identische
ungekoppelte Gleichungen (j = 1, 2)
k
d2
xj (t) = − xj (t)
2
dt
m
mit der formalen Lösung (aj = Aj exp (−iδj ) sind komplexe Konstanten, wobei
Aj , δj ∈ R)
p
xj (t) = aj eiωt , ω = k/m ,
wobei wir komplexe Zahlen verwendet haben und die Anfangsbedingungen noch
nicht eingebaut sind. Die physikalische Lösung bestimmen wir später durch Bilden
des Realteils. Als Ansatz zur Lösung der gekoppelten Gleichungen wählen wir nun
xj (t) = x̄j exp (iλt). Einsetzten dieses Ansatz in die obige Matrixgleichung und
Kürzen des Exponentialfaktors liefert die Eigenwertgleichung
k+K
K
x̄1
− m
x̄
1
2
m
−λ
=
.
K
x̄2
x̄2
− k+K
m
m
Die Nullstellen des charakteristischen Polynoms (in λ2 )
2 2
k+K
K
2
2
P (λ ) = λ −
−
m
m
sind
λ21 =
k
,
m
λ22 =
k + 2K
m
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
und die normierten Eigenvektoren
!
(1)
1
x̄1
1
=√
,
(1)
x̄2
2 1
(2)
x̄1
(2)
x̄2
!
1
=√
2
1
−1
103
.
Man nennt die positive Wurzel der beiden Eigenwerte λ2j , also
r
r
k
k + 2K
, λ2 =
λ1 =
m
m
die Normalfrequenzen der gekoppelten Bewegung. Die Eigenvektoren legen die
zugehörigen Eigenmoden fest. Betrachten wir zunächst λ1 . In diesem Fall löst
x1 (t)
1
= A cos (λ1 t − δ)
x2 (t)
1
die Bewegungsgleichung. Beide Massen oszillieren in dieser Eigenmode in Phase
und haben die selbe maximale Auslenkung. Die mittlere Feder mit Federkonstanter K wird nie komprimiert oder gedehnt,
was erklärt, daß K in der Frequenz der
p
Bewegung keine Rolle spielt (λ1 = k/m wie für eine einzelne Masse). Um eine
Bewegung in dieser Eigenmode anzuregen, muß man selbstverständlich Anfangsbedingungen wählen, die mit ihr kompatibel sind. Die Bewegung in der zweiten
Eigenmode ist durch
x1 (t)
1
A cos (λ2 t − δ)
= A cos (λ2 t − δ)
=
x2 (t)
−1
A cos (λ2 t − δ + π)
beschrieben. In diesem Fall bewegen sich die Massen mit einer relativen Phasenverschiebung um π. Um das System in dieser Mode anzuregen, müssen die
Anfangsbedingungen erneut kompatibel mit ihr sein. Wir sehen also, daß die Bewegung beider gekoppelter Massen in den Eigenmoden rein sinusförmig mit Frequenz λj ist. Dies zeichnet die Eigenmoden gegenüber der allgemeinen Lösung
aus, die durch eine Überlagerung der beiden Normalfrequenzen charakterisiert
ist. Sie ist durch
1
x1 (t)
1
= A1 cos (λ1 t − δ1 )
+ A2 cos (λ2 t − δ2 )
x2 (t)
1
−1
gegeben. Die vier reellen Konstanten Aj und δj müssen dann noch so angepasst
werden, daß die vier Anfangsbedingungen erfüllt werden. Die resultierende Bewegung ist recht kompliziert und im Allgemeinen nicht einmal periodisch. Den
Fall schwacher Kopplung der beiden Massen, also K k werden sie in einer
Übungsaufgabe diskutieren.
Die obigen Konzepte (Ansatz, Eigenwertproblem, Eigenmoden) spielen auch
in komplizierteren Situationen innerhalb der Mechanik eine wichtige Rolle, so daß
das Beispiel uns bereits wichtige Informationen für komplexere Probleme liefert.
104
KAPITEL 2. MATHEMATISCHE METHODEN
In unserem zweiten Beispiel tritt ein System gekoppelter Differentialgleichungen erster Ordnung als Rechentrick bei der Lösung einer Gleichung höherer Ordnung auf. Wir betrachten das obige mechanische Beispiel (Masse auf Tisch, welcher die Gravitationskraft kompensiert), diesmal jedoch mit nur einer Masse m
und einer Feder mit Federkonstanten k. Zusätzlich berücksichigten wir jetzt die
Reibungskraft. Wir nehmen dabei an, daß diese die Form Freib = −bẋ, mit b ≥ 0
hat, also proportional zur Geschwindigkeit ist, aber in die der Geschwindigkeit
entgegen gesetzte Richtung zeigt. Für das konkret vorliegende Problem mag das
eine mehr oder weniger gut gerechtfertigte Annahme sein, die uns jedoch eine
gute Einstiegsmöglichkeit zum Verständnis der möglichen Typen (je nach Wahl
der Parameter) von Bewegung ermöglicht. Die Newtonsche Gleichung ist dann
mẍ(t) = −kx(t) − bẋ(t)
b
k
⇒ ẍ(t) + x(t) + ẋ(t) = 0 .
m
m
In dem wir v(t) = ẋ(t) verwenden, schreiben wir diese Gleichung in zwei um
x(t)
ẋ(t)
0
1
,
=
v(t)
v̇(t)
−ω02 −2γ
wobei wir ω02 = k/m (Frequenz der Bewegung für b = 0) und 2γ = b/m eingeführt haben. Die Anfangswerte sind x(t = 0) = x0 und v(t = 0) = v0 . Aus
einer Gleichung zweiter Ordnung haben wir somit ein System von gekoppelten
Gleichungen erster Ordnung gemacht. Dieses lösen wir nun ähnlich zum obigen
Beispiel. Wir setzten an (λ kann dabei eine komplexe Zahl sein)
x(t)
x̄
λt
=e
.
v(t)
v̄
Eingesetzt liefert das
λ
x̄
v̄
=
0
1
2
−ω0 −2γ
x̄
v̄
,
also erneut eine Eigenwertgleichung, aber diesmal für eine nicht-symmetrische
Matrix. Die Eigenwerte des charakteristischen Polynoms sind (da die reelle Matrix
nicht symmetrisch ist, ist nicht garantiert, daß die Eigenwerte reell sind)
q
λ± = −γ ± i ω02 − γ 2 .
Die Lösungen mit den beiden Eigenwerten sind unabhängig und für die allgemeine
Lösung müssen wir
x(t) = a+ eλ+ t + a− eλ− t
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
105
ansetzten. Die a± sind so zu bestimmen, daß die Anfangsbedingungen gelten.
Die physikalische Lösung muß natürlich wieder reell sein. Wir wollen nun vier
Spezialfälle der allgemeinen Lösung diskutieren.
(i) Die ungedämfte Bewegung mit γ = 0. Dieser sind wir natürlich bereits
mehrfach begegnet. Für γ = 0 gilt λ± = ±iω0 und damit
x(t) = x0 cos (ω0 t) +
v0
sin (ω0 t) .
ω0
Die Bewegung ist also rein oszillatorisch mit Frequenz ω0 .
γ/ω0=0
x/x0
1
0
-1
0
5
10
ω0t
15
20
(ii) Die schwach gedämpfte Bewegung mit 0 < γ ω0 . Dann ergibt sich
s
q
γ2
λ± = −γ ± i ω02 − γ 2 = −γ ± iω0 1 − 2
(2.49)
ω0
4 γ2
γ
= −γ ± iω0 1 − 2 + O
,
2ω0
ω04
wobei wir die Taylorentwicklung verwendet haben. In niedrigster Ordnung in der
kleinen Größe γ/ω0 gilt also λ± ≈ ±iω0 − γ. Damit ergibt sich für die Bewegung
unter Berücksichtigung der Anfangsbedingungen
x(t) = x0 e−γt cos (ω0 t) +
v0 + γx0 −γt
e
sin (ω0 t) .
ω0
Wir finden somit eine exponentiell gedämpfte, oszillatorische (mit Frequenz ω0 )
Bewegung.
106
KAPITEL 2. MATHEMATISCHE METHODEN
γ/ω0=0.1
x/x0
1
0
-1
0
5
10
ω0t
15
20
(iii) Kritischer Grenzfall mit γ = ω0 . Dann ergibt sich
λ± = −γ ,
d.h. der Eigenwert ist zweifach entartet und man findet zunächst nur eine Lösung
der Differentialgleichung. Eine zweite ist durch t exp (−γt) gegeben, so daß die
Lösung unter Berücksichtigung der Anfangsbedingungen
x(t) = x0 e−γt + (v0 + γx0 ) t e−γt
lautet. Die Bewegung ist somit exponentiell gedämpft.
γ/ω0=1
1
x/x0
0.8
0.6
0.4
0.2
0
0
5
ω0t
10
(iv) Stark gedämpfter Fall mit γ ω0 . Die Talorentwicklung der Eigenwerte
2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN
107
gibt in diesem Fall
λ±
q
= −γ ± i ω02 − γ 2 = −γ ± γ
s
1−
ω02
γ2
4 ω02
ω0
= −γ ± γ 1 − 2 + O
2γ
γ4
und damit in führender Ordnung
λ+ ≈ −
ω02
,
2γ
λ− ≈ −2γ .
Aufgrund der obigen Annahme gilt λ+ /λ− 1. Die Lösung der Differentialgleichung unter Berücksichtigung der Anfangsbedingungen ist in diesem Limes
x(t) =
v0
x0 +
2γ
ω2
e
− 2γ0 t
−
v0 −2γt
e
.
2γ
Der erste exponentiell abfallende Term bestimmt dabei das Langzeitverhalten,
während der zweite für das Kurzeitverhalten verantwortlich ist.
γ/ω0=5
x/x0
1
0.5
0
0
50
100
γt
Ein sehr interessantes mechanisches System in dem das obige Konzept der Abbildung einer Differentialgleichung höherer Ordnung auf ein System erster Ordnung und die gerade gewonnenen Ergebnisse eine wichtige Rolle spielen ist die
getriebene, gedämpfte Oszillation. Diese werden sie in einer Übungsaufgabe diskutieren. Hier wollen wir es bei den beiden hoffentlich instruktiven Beispielen zu
Systemen gekoppelter Differentialgleichungen belassen.
108
2.16
KAPITEL 2. MATHEMATISCHE METHODEN
Die Integration im Rn
Wir hatten bereits diskutiert, daß die Integration
Z b
f~(x) dx
a
einer vektorwertigen Funktion von einer Variablen, als Integration der einzelnen
Komponenten von f~(x) zu verstehen ist und somit kein neues Konzept darstellt.
Anders ist es, wenn man eine skalare oder vektorwertige Funktion von n Variablen integriert. Für diesen Fall gibt es verschiedene physikalisch interessante
Integraltypen.
Als physikalische Motivation des ersten Integraltyps, des Kurvenintegrals, betrachten wir die Arbeit die verrichtet wird, wenn man eine Masse entlang eines
Pfades ~r(t) in einem Kraftfeld F~ (~r) bewegt. Aus der Schule kennen sie sicherlich
die Definition
Arbeit = Kraft · Weg ,
also
W = F~ · ~r .
Diese ist jedoch nur dann richtig, wenn die Kraft entlang des Weges konstant
ist, was im Allgemeinen sicherlich nicht der Fall ist. Der Ausdruck ist daher
allgemeiner zu ersetzen durch
Z
W = F~ (~r) · d~r ,
C
wobei wir nun genauer erklären müssen, was wir mit den auftretende Symbolen
meinen. Zunächst bezeichnet C die Bahnkurve, also die durch die Vektoren ~r(t)
beschriebenen Punkte im R3 mit dem Parameter (der Zeit) t zwischen einem(r)
Anfangs- und Endwert(zeit), entlang derer die Masse bewegt wird. Das Integralsymbol definieren wir (wie im “gewöhnlichen” Fall) als Limes von RiemannSummen. Dazu unterteilen wir die Kurve in N +1 Punkte ~ra = ~r0 , ~r1 . . . . , ~rN = ~re ,
mit den Anfangs- und Endpunkten ~ra und ~re . Liefert dann der Ausdruck
N
X
F~ (~rj ) · ∆~rj , ∆~rj = ~rj − ~rj−1
j=1
für jede beliebige Zerlegung mit ∆~r → 0 für N → ∞ das gleiche Ergebnis, so
definiert dieser Limes das Kurvenintegral
lim
N →∞
N
X
j=1
F~ (~rj ) · ∆~rj =
Z
C
F~ (~r) · d~r .
2.16. DIE INTEGRATION IM RN
109
Aus der Definition über eine Riemann-Summe wird klar, daß es sich beim Kurvenintegral um ein Skalar handelt. Die Definition kann in beliebigen Raumdimensionen n = 2, 3, . . . verwendet werden.
Ein besonderes Symbol führt man für den auch in der Physik wichtigen Fall
ein, daß die Anfangs- und Endpunkte der Kurve aufeinander fallen, also ~ra = ~re
gilt. In diesem Fall schreibt man
I
F~ (~r) · d~r .
C
Aus der Definition des Kurvenintegrals folgt sofort die Eigenschaft
Z
Z
~
F (~r) · d~r = −
F~ (~r) · d~r ,
C
(2.50)
−C
wobei −C die in umgekehrter Richtung durchlaufene Kurve bezeichnet.
Um das Kurvenintegral explizit zu berechnen führen wir es auf ein gewöhnliches Riemann-Integral zurück. Ist die Parametrisierung der Kurve ~r(t) explizit
bekannt, so gehört zu jedem ~rj eine “Zeit” tj mit ~r(tj ) = ~rj und wir können jeden
Summanden der Riemann-Summe wie folgt umschreiben
~r(tj ) − ~r(tj−1 )
(tj − tj−1 ) .
F~ (~r(tj )) · ∆~r(tj ) = F~ (~r(tj )) ·
tj − tj−1
Im Limes N → ∞ erhalten wird dann42
Z
Z te h
i
˙
~
F~ (~r(t)) ·~r(t)
dt .
F (~r) · d~r =
C
ta
Die rechte Seite dieser Gleichung ist ein “gewöhnliches” Integral über t von der
Anfangszeit ta mit ~ra = ~r(ta ) bis zur Endzeit te mit ~re = ~r(te ). Der Integrand ist
˙
das t-abhängige Skalar F~ (~r(t)) ·~r(t).
Ist keine Parameterdarstellung der Kurve bekannt, so kann man wie folgt
vorgehen.43 Wir schreiben ∆~rj = ∆x1,j ~e1 + ∆x2,j ~e2 + ∆x3,j ~e3 und erhalten in der
Riemann-Summe
N
X
[F1 (~rj )∆x1,j + F2 (~rj )∆x2,j + F3 (~rj )∆x3,j ] .
j=1
Zu einem festen x1 gehört (lokal) entlang von C ein bestimmtes x2 und x3 , so daß
wir x2 und x3 als Funktion von x1 auffassen können. Damit reduziert sich der
˙
Wir gehen stillschweigend davon aus, daß~r(t)
existiert, was in physikalischen Situationen
sicherlich sehr plausibel ist.
43
Wir konzentrieren uns hier auf den Fall dreier Raumdimensionen. Die Erweiterung auf
andere n ist offensichtlich.
42
110
KAPITEL 2. MATHEMATISCHE METHODEN
erste Summand der Riemann-Summe im Limes N → ∞ auf ein “gewöhnliches”
Integral
lim
N →∞
N
X
Z
x1,e
F1 (x1 , x2 (x1 ), x3 (x1 )) dx1 .
F1 (~rj )∆x1,j =
x1,a
j=1
Analog kann man mit den anderen Summanden verfahren und erhält den Ausdruck
Z x1,e
Z
~
F1 (x1 , x2 (x1 ), x3 (x1 )) dx1
F (~r) · d~r =
x1,a
C
Z x2,e
F2 (x1 (x2 ), x2 , x3 (x2 )) dx2
+
x2,a
Z x3,e
+
F3 (x1 (x3 ), x2 (x3 ), x3 ) dx3 .
(2.51)
x3,a
Als Beispiel der Integration eines Feldes entlang einer Kurve betrachten wir
das Vektorfeld
F~ (~r) = (3x21 + 2x2 )~e1 − 9x2 x3~e2 + 8x1 x23~e3 .
Der Anfangspunkt der betrachteten Wege soll im Koordinatenusrprung liegen
und der Endpunkt bei x1 = x2 = x3 = 1. Wir betrachten die zwei Wege C1 mit
Parameterdarstellung ~r(t) = t~e1 + t~e2 + t~e3 , 0 ≤ t ≤ 1, also eine Gerade, sowie C2
mit Parameterdarstellung ~r(t) = t~e1 + t2~e2 + t4~e3 , 0 ≤ t ≤ 1. Dieser Weg stellt auf
die x1 -x2 - sowie x2 -x3 -Ebene projeziert eine Parabel dar und ist projeziert auf die
4
x
R 1 -x3 -Ebene eine “Parabel vierter Ordnung” x3 = x1 . Wir bestimmen zunächst
F~ (~r) · d~r mit Hilfe der Parameterdarstellung. Es gilt
C1
d~r
F~ (~r) ·
= (3t2 + 2t)1 + (−9tt)1 + (8tt2 )1 = 8t3 − 6t2 + 2t .
dt
Damit folgt
Z
Z 1
1
~
F (~r) · d~r =
(8t3 − 6t2 + 2t)dt = 2t4 − 2t3 + t2 0 = 1 .
C2
0
Dasselbe Integral wollen wir nun berechnen indem wir so tun, als wenn wir keine
Parametrisierung des Weges kennen würden. Wir können dann Gl. (2.51) verwenden
Z 1
Z
Z 1
2
F~ (~r) · d~r =
3x1 + 2x2 (x1 ) dx1 − 9
x2 x3 (x2 ) dx2
C1
0
0
Z 1
+8
x1 (x3 )x23 dx3 .
0
2.16. DIE INTEGRATION IM RN
111
Auf C1 gilt x2 (x1 ) = x1 , x3 (x2 ) = x2 und x1 (x3 ) = x3 , so daß sich dieser Ausdruck
zu
Z
Z 1
Z 1
Z 1
2
2
~
F (~r) · d~r =
3x1 + 2x1 dx1 − 9
x2 dx2 + 8
x33 dx3
C1
0
0
0
vereinfacht, woraus sich erneut
Z
F~ (~r) · d~r = 2 − 3 + 2 = 1
C1
ergibt. Wir betrachten nun das Integral
terdarstellung von C2 . Mit dieser gilt
R
C2
F~ (~r) · d~r und verwenden die Parame-
d~r
= (3t2 + 2t2 )~e1 − 9t2 t4~e2 + 8tt8~e3 · ~e1 + 2t~e2 + 4t3~e3
F~ (~r) ·
dt
= 5t2 − 18t7 + 32t12 .
Damit folgt
Z
F~ (~r) · d~r =
Z
C1
1
(5t2 − 18t7 + 32t12 )dt
0
5 18 32
293
=
−
+
=
.
3
8
13
156
Wie wir im Beispiel gesehen haben hängen Kurvenintegrale über Vektorfelder im Allgemeinen sowohl vom Vektorfeld wie auch von den Details des Weges
C ab. Es gibt jedoch auch die physikalisch wichtigen Situationen, in denen das
Integral nicht von dem kompletten Weg, sondern nur vom Anfangs- und Endpunkt abhängt. Das obige Beispiel der Arbeit liefert diverse “Alltags”-Beispiele
dafür, daß Kurvenintegrale in der Tat nur vom Anfangs- und Endpunkt abhängen
können und nicht davon, wie man von ~ra nach ~re gekommen ist. Diese Eigenschaft
des Integrals ist auf eine Eigenschaft des im Integranden auftretenden Feldes
zurück zu führen. Nehmen wir an, daß solch ein Fall vorliegt und betrachten die
Funktion
Z ~r
φ(~r) =
F~ (~r0 ) · d~r0 ,
(2.52)
~
ra
wobei wir an das Integral jetzt nur noch die Grenzen zu schreiben brauchen und
nicht mehr den ganzen Weg spezifizieren müssen. Bilden wir nun φ(~r +∆~r)−φ(~r),
so gilt
Z
φ(~r + ∆~r) − φ(~r) =
~
r
~
r+∆~
r
F~ (~r0 ) · d~r0 .
112
KAPITEL 2. MATHEMATISCHE METHODEN
Dabei haben wir ausgenutzt, daß sollte ~r nicht bereits auf dem Weg C2 von ~ra
nach ~r + ∆~r liegen, wir diesen Weg so deformieren können (ohne das Ergebnis
der Integration zu verändern), daß dieses der Fall ist. Da das Vektorfeld F~ (~r)
beliebig “harmlos” angenommen werden kann, gibt es nach dem oben anschaulich
“bewiesenen” Mittelwertsatz ein ~r00 mit der Eigenschaft
φ(~r + ∆~r) − φ(~r) = F~ (~r00 ) · ∆~r .
Im Limes |∆~r| → 0 (∆~r kann in beliebige Richtung gegen den Nullvektor gehen)
folgt so das wichtige Ergebnis
~ r) = F~ (~r) ,
grad φ(~r) = ∇φ(~
d.h. ein Vektorfeld F~ mit der Eigenschaft, daß Kurvenintegrale über F~ nur vom
Anfangs- und Endpunkt abhängen, kann (wenn alle beteiligten Funktionen beliebig “harmlos” angenommen werden) als der Gradient einer skalaren Funktion
geschrieben werden. Diese ist über Gl. (2.52) bis auf eine additive Konstante
eindeutig durch F~ festgelegt. Die Wahl der Konstanten entspricht der Wahl des
Anfangspunktes ~ra in dieser Gleichung. Für den Fall des Kraftfeldes heißt das,
daß die Kraft (unter der obigen Bedingung an die Arbeit) als Gradient eines Potentials geschrieben werden kann. Die Darstellbarkeit von F~ als Gradientenfeld
ist also notwendig, wenn das Kurvenintegral nur von ~ra und ~re und nicht den
Details des Weges abhängt. Um zu zeigen, daß diese Bedingung auch hinreichend
~ Dann gilt
ist, nehmen wir an, daß F~ ein Gradientenfeld ist F~ = ∇φ.
Z
Z
~ r) · d~r
F~ (~r) · d~r =
∇φ(~
C
C
Z te d~
r
(t)
~ r(t)) ·
dt
∇φ(~
=
dt
ta
Z te
dφ(~r(t))
=
dt
dt
ta
= φ(~r(te )) − φ(~r(ta ))
und das Integral hängt nur von ta und te nicht aber den Details des Wegs ab.
Dabei haben wir von der zweiten in die dritte Zeile die Kettenregel angewandt
∂φ dx1
∂φ dx2
∂φ dx3
dφ(~r(t))
=
+
+
dt
∂x1 dt
∂x2 dt
∂x3 dt
und im Schritt zur letzten Zeile den Hauptsatz der Differential- und Integralrechnung. Zusammengefasst gilt somit, daß ein Kurvenintegral über das Vektorfeld
F~ (~r) dann und nur dann nur vom Anfangs- und Endpunkt abhängt, wenn es als
Gradient einer skalaren Funktion φ(~r) (eines Potentials) zu schreiben ist.
2.16. DIE INTEGRATION IM RN
113
Als Konzequenz folgt sofort, daß falls F~ als Gradientenfeld zu schreiben ist
I
F~ (~r) · d~r = 0 .
(2.53)
C
Dies sieht man leicht, wenn man das Integral über C in zwei Kurvenintegrale C1
und C2 von ~ra zu einem willkürlichen Zwischenpunkt ~rz auf C und von ~rz zurück
zu ~ra aufteilt. Ohne das Ergebnis des zweiten Integrals zu ändern, kann man
C2 dann so deformieren, daß der neue Weg gleich −C1 ist, also gleich C1 aber
in entgegengesetzter Richtung durchlaufen. Mit Gl. (2.50) folgt dann das obige
Ergebnis Gl. (2.53).44
Man kann nun ein leicht zu überprüfendes Kriterium angeben, wann sich
ein Vektorfeld F~ (~r) als Gradientenfeld schreiben läßt und damit Kurvenintegrale
über F~ nur von ~ra und ~re abhängen. Wie sie in einer Übungsaufgabe zeigen
werden (siehe auch Kapitel 2.12), gilt
~ × [∇φ(~
~ r)] = 0 ,
rot [grad φ(~r)] = ∇
d.h. die Rotation eines Gradientenfeldes verschwindet, wobei wir natürlich davon
ausgehen, daß φ(~r) zweimal stetig differenzierbar ist. Hat also eine Vektorfeld F~
~ schreibbar
Kurvenintegrale, die nur von ~ra und ~re abhängen, ist es als F~ = ∇φ
~ × F~ = 0. Diese Beobachtung ist nun bis auf eine (wichtige) Feinheit
und es gilt ∇
fast hinreichend, was bedeutet, daß (bis auf die noch zu betrachtende Feinheit)
Kurvenintegrale über F~ genau dann nur von ~ra und ~re abhängen (und nicht vom
~ × F~ = 0 gilt. Um das plausibel zu machen, versuchen
ganzen Weg C), wenn ∇
~ × F~ = 0 ein “Potential” φ zu konstruieren mit
wir unter der Voraussetzung ∇
~ = F~ was dann die “Unabhängigkeit vom Weg” garantiert. Wir betrachten
∇φ
den Ausdruck,
Z
~
r
φ(~r) =
F~ (~r0 ) · d~r0 ,
~
ra ,C0
wobei wir entlang des speziellen Weges

C0 :







x1,a
x1
x1
x1
~ra =  x2,a  →  x2,a  →  x2  →  x2  = ~r
x3,a
x3,a
x3,a
x3
fortschreiten. Da für den Weg selbst keine Präferenz bestehen sollte, können wir
44
Gl. (2.53) liefert in der Tat eine äquivalente Formulierung des “Satzes” über die Darstellbarkeit als Gradientenfeld.
114
KAPITEL 2. MATHEMATISCHE METHODEN
diesen “bequemen” Weg wählen. Damit gilt
Z ~r
F~ (~r0 ) · d~r0
φ(~r) =
Z x2
Z~rax,C1 0
0
0
F2 (x1 , x02 , x3,a ) dx02
F1 (x1 , x2,a , x3,a ) dx1 +
=
x2,a
x1,a
Z x3
F3 (x1 , x2 , x03 ) dx03 .
+
x3,a
~ = F~ gilt. Wir betrachten
Wir müssen nun durch Ableiten überprüfen, ob ∇φ
zunächst
∂φ(x1 , x2 , x3 )
= F3 (x1 , x2 , x3 ) ,
∂x3
was nach dem Hauptsatz der Differential- und Integralrechnung folgt. Als nächstes
differenzieren wir nach x2
Z x3
∂F3 (x1 , x2 , x03 ) 0
∂φ(x1 , x2 , x3 )
= F2 (x1 , x2 , x3,a ) +
dx3 ,
∂x2
∂x2
x3,a
wobei wir die Reihenfolge der mit der Differenziation und der Integration zusammenhängenden Grenzprozesse wieder ohne weitere Analyse vertauschen. Jetzt
~ × F~ = 0 nach der
nutzen wir die Voraussetzung ∇
∂F3 (x1 , x2 , x03 )
∂F2 (x1 , x2 , x03 )
.
=
∂x2
∂x03
Eingesetzt liefert das
Z x3
∂φ(x1 , x2 , x3 )
∂F2 (x1 , x2 , x03 ) 0
= F2 (x1 , x2 , x3,a ) +
dx3
∂x2
∂x03
x3,a
= F2 (x1 , x2 , x3,a ) + F2 (x1 , x2 , x3 ) − F2 (x1 , x2 , x3,a )
= F2 (x1 , x2 , x3 ) .
Analog berechnet man
∂φ(x1 , x2 , x3 )
= F1 (x1 , x2 , x3 )
∂x1
und damit
~ r) = F~ (~r) .
∇φ(~
~ × F~ = 0 als hinreichende Bedingung für die DarDamit scheint alles klar und ∇
~
stellbarkeit von F als Gradientenfeld etabliert. Dies ist aber nicht vollständig
2.16. DIE INTEGRATION IM RN
115
richtig! Wir haben bei den obigen Überlegungen nicht berücksichtigt, daß der
Definitionsbereich des Vektorfeld F~ , der eine Teilmenge (ein “Teilgebiet”) G des
R3 ist, “ungewöhnliche” Eigenschaften haben könnte. Nur in dem Fall, daß G einfach zusammenhängend ist, d.h. das sich jede geschlossene Kurve in G auf einen
Punkt (in G) zusammenziehen läßt, ist die obige Konstruktion eindeutig. Mehr
zu diesem Aspekt werden sie in der HöMa Vorlesung lernen. Der “Satz” lautet
zusammengefasst: Wenn für ein Vektorfeld F~ in einem einfach zusammenhängen~ × F~ = 0 gilt, so gibt es ein φ mit F~ = ∇φ.
~ Damit sind dann
den Gebiet G, ∇
die Kurvenintegrale über F~ vom “Weg unabhängig”. Umgekehrt gilt bei “Wegu~ × F~ = 0, was unabhängig von
nabhängigkeit” des Kurvenintegrals über F~ , daß ∇
den “Zusammenhangsverhältnissen” von G ist.
Nach diesen Überlegungen zum Kurvenintegral, wollen wir uns mit der Integration über mehrdimensionale Gebiete beschäftigen. Diese ist z.B. wichtig bei
der Berechnung von Flächeninhalten und Volumina. Wir werden dabei die Variablensubstitution (Variablentransformation) im Höherdimensionalen kennenlernen
(Polarkoordinaten, Kugelkoordinaten usw.). Wir betrachten als Beispiel die Funktion f (x, y) von zwei Variablen. Diese soll über das Gebiet G ⊂ R2 (x-y-Ebene)
integriert werden
ZZ
f (x, y) dx dy .
G
Unter Voraussetzung dessen, was wir über das Integral von einer Veränderlichen
gelernt haben, besteht die Schwierigkeit darin, daß die Integrationsgrenzen Funktionen in der x-y-Ebene sind. Sei G von der in der folgenden Skizze angenommenen
Form und f (x, y) beliebig “harmlos”.
y
y=g2(x)
y=g1(x)
a
b
x
Die zweidimensionale Integration definieren wir nun so, daß wir sie in zwei eindimensionale (die wir bereits kennen) zerlegen. Wir integrieren f (x, y) zunächst
über y, wobei die Integrationsgrenzen Funktionen von x sind
Z g2 (x)
˜
f (x) =
f (x, y) dy .
g1 (x)
Anschaulich gesprochen integrieren wir f (x, y) entlang der in der Skizze gestrichelt gezeichneten Linien. Das Resultat dieser eindimensionalen Integration, wel-
116
KAPITEL 2. MATHEMATISCHE METHODEN
che vom “Parameter” x abhängt, integrieren wir dann über x
Z
a
f˜(x) dx =
b
a
Z
Z
g2 (x)
ZZ
f (x, y) dy dx =
b
f (x, y) dx dy .
G
g1 (x)
Alternativ hätten wir zunächst über x und dann über y integrieren können
Z
d
Z
h2 (y)
ZZ
f (x, y) dx dy =
c
f (x, y) dx dy ,
G
h1 (y)
was in der folgenden Skizze veranschaulicht ist.
y
d
x=h1(y)
x=h2(y)
c
x
Es ist dabei wichtig, daß g1 (x) und g2 (x) bzw. h1 (y) und h2 (y) Funktionen
sind. Das bedeutet, daß man für Gebiete wie in der folgenden Skizze, eine feinere
Unterteilung des Randes vornehmen muß, wenn man zunächst über y integrieren
möchte.
g1(x)
y
g (x)
2
a bc
g4(x)
d
x
g3(x)
Wir werden nun ein Beispiel betrachten. Die Funktion f (x, y) = x2 y soll dabei
über das schraffierte Dreieck integriert werden.
2.16. DIE INTEGRATION IM RN
117
y
1
1111111111111111111
0000000000000000000
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
1
x
Es gilt
ZZ
I =
f (x, y) dx dy
Z
=
=
=
=
=
G
1 Z 1−x
x2 y dy dx
0
0
Z 1
2 1−x
2 y x
dx
2 0
0
Z 1
(1 − x)2
x2
dx
2
0
Z
1 1 2
(x − 2x3 + x4 ) dx
2 0
1
60
oder alternativ
ZZ
f (x, y) dx dy
I =
Z
G
1 Z 1−y
=
Z0 1
=
x2 y dx dy
0
(1 − y)3
y dy
3
0
Z
1 1
=
(y − 3y 2 + 3y 3 − y 4 ) dy
3 0
1
=
.
60
Es sollte klar sein, wie sich das obige Vorgehen auf den Fall der Integration
über Teilgebiete des R3 verallgemeinern läßt. Sie werden Beispiele zur Integration
über Teilgebiete des R3 in den Übungen kennenlernen.
Eine altenative Herangehensweise an höherdimensionale Integrale ist es eine
Riemann-Summe zu verwenden. Für den zweidimensionalen Fall überzieht man
118
KAPITEL 2. MATHEMATISCHE METHODEN
dazu das Gebiet G mit einem Netzt (Gitter) aus Quadraten45 der Größe ∆xi ∆yi .
Das Integral ergibt sich dann im Limes, daß die Gitterpunkte immer dichter
werden
ZZ
X
f (xi , yj )∆xi ∆yj .
f (x, y) dx dy = lim
∆x,∆y→0
G
i,j
Wir wollen zum Abschluss dieses Kapitels noch die Parametertransformation
und die damit zusammenhängende Variablensubstitution betrachten. Als Beispiel
starten wir mit dem Übergang von zweidimensionalen kartesischen Koordinaten
zu Polarkoordinaten, was uns bereits von der Einführung der komplexen Zahlen
bekannt ist. Es gilt
x = r cos φ
y = r sin φ
oder umgekehrt
p
x2 + y 2
r =
φ = arctan (y/x) ,
wobei φ auf den Bereich [0, 2π] beschränkt ist. Es handelt sich dabei somit um
eine (lokal) umkehrbar-eindeutige Beziehung zwischen den beiden Variablenpaaren. Die Frage ob eine (lokal) umkehrbar-eindeutige Beziehnug zwischen zwei
allgemeinen Variabenpaaren {x, y} und {u, v} = {u(x, y)v(x, y)} vorliegt, läßt
sich mit Hilfe der sogenannten Funktionaldeterminanten beantworten. Wir nehmen an, daß u und v als Funktionen von x und y gegeben sind und betrachten
die Größen
∆u = u(x + ∆x, y + ∆y) − u(x, y)
∆v = v(x + ∆x, y + ∆y) − v(x, y) .
Taylorentwicklung liefert
∂u(x, y)
∂u(x, y)
∆x +
∆y + O(∆2 )
∂x
∂y
∂v(x, y)
∂v(x, y)
∆v =
∆x +
∆y + O(∆2 ) ,
∂x
∂y
∆u =
wobei O(∆2 ) für Terme steht, die mindestens quadratisch in den kleinen Größen
∆x und ∆y sind. Nach Voraussetzung ist klar, daß man zu jedem Paar {∆x, ∆y}
45
Im dreidimensionalen entsprechend einem Netz aus Würfeln.
2.16. DIE INTEGRATION IM RN
119
ein eindeutiges Paar {∆u, ∆v} berechnen kann. Damit dieses auch umgekehrt
möglich ist, muß die Matrix in
!
∂u(x,y)
∂u(x,y)
∆x
∆u
∂x
∂y
=
∂v(x,y)
∂v(x,y)
∆y
∆v
∂x
∂y
invertierbar sein. Wie sie in der HöMa Vorlesung zeigen werden, ist dies genau
dann der Fall, wenn die Determinante der Matrix ungleich Null ist. Man bezeichnet die Determinante
!
∂u(x,y)
∂u(x,y)
∂(u, v)
∂x
∂y
det ∂v(x,y)
=
∂v(x,y)
∂(x, y)
∂x
∂y
als die Funktionaldeterminante. Wegen der Gleichberechtigung der Parameterpaare, ist damit zu rechnen, daß auch die “umgekehrte” Fuktionaldeterminante
∂(x,y)
ungleich Null ist. In unserem Beispiel der zweidimensionalen Polarkoordi∂(u,v)
naten gilt
∂(x, y)
cos φ −r sin φ
= det
=r
sin φ r cos φ
∂(r, φ)
woraus man abliest, daß es nur am Ursprung (nicht weiter relevante) Probleme
mit der umkehrbaren Eindeutigkeit gibt.
Die Funktionaldeterminante spielt ebenfalls eine entscheidene Rolle, wenn
es darum geht in einem höherdimensionalen Integral eine Variablensubstitution auszuführen. Beim Übergang von den {∆x, ∆y} nach {∆u, ∆v} muß man in
der Riemann-Summen-Schreibweise des Integrals berücksichtigen, daß sich das
Flächenelement ändert. Wie sie in einer Übungsaufgabe und in der HöMa Vorlesung zeigen werden, tritt dabei der Betrag der Funktionaldeterminanten auf und
es gilt
ZZ
ZZ
∂(x, y) du dv ,
f (x, y) dx dy =
f (x(u, v), y(u, v)) ∂(u, v) wobei man beachten muß, daß man links und rechts über dasselbe Gebiet integriert. Es sollte klar sein, wie man diese Überlegungen auf höhere Dimensionen
(z.B. den dreidimensionalen Fall) übertragen kann.
Wir betrachten zwei Beispiele. Im ersten geht es darum die Fläche einer Ellipse
zu berechen. Der Rand der Ellipse ist durch die Gleichung
x2 y 2
+ 2 =1
a2
b
definiert. Zur Flächenbestimmung müssen wir die Funktion f (x, y) = 1 über
das Gebiet G = {(x, y) ∈ R2 |x2 /a2 + y 2 /b2 ≤ 1} integrieren. Diese Integration
120
KAPITEL 2. MATHEMATISCHE METHODEN
vereinfacht sich erheblich, wenn wir die Koordinaten
x = ar cos φ
y = br sin φ
einführen, wobei für die Fläche der Ellipse 0 ≤ φ < 2π und 0 ≤ r ≤ 1 gilt, nach
der Variablentransformation also über G̃ = {(r, φ) ∈ R2 |0 ≤ φ < 2π, 0 ≤ r ≤ 1}
zu integrieren ist. Die Funktionaldeterminante ist durch
∂(x, y)
a cos φ −ar sin φ
= det
= abr
b sin φ br cos φ
∂(r, φ)
geben. Damit folgt für die Fläche F der Ellipse in Polarkoordinaten
Z 1 Z 2π
Z 1
abr dφ dr = ab2π
r dr = abπ .
F =
0
0
0
Im zweiten Beispiel wollen wir das eindimensionale Gaußintegral
Z ∞
2
I=
e−x dx
−∞
berechnen. Wir schreiben dieses um zu
Z ∞
Z ∞
ZZ
−x2
−y 2
2
e
e dy =
I =
dx
−∞
e−(x
2 +y 2 )
dx dy ,
R2
−∞
also einem zweidimensionalen Integral. In diesem transformieren wir nun auf Polarkoordinaten
x = r cos φ
y = r sin φ ,
wobei über G̃ = {(r, φ) ∈ R2 |0 ≤ φ < 2π, r ≥ 0} zu integrieren ist. Die Funktionaldeterminante haben wir bereits weiter oben berechnet. Wir schreiben I 2 um
zu
ZZ
2
2
2
I =
e−(x +y ) dx dy
2
Z ∞R Z 2π
2
=
re−r dφ dr
0
Z ∞0
d
1 −r2
= 2π
− e
dr
2
0
∞
2
= − πe−r 0
= π
und erhalten damit
Z
∞
I=
−∞
2
e−x dx =
√
π.
Kapitel 3
Newtonsche Mechanik Teil I
3.1
Einleitung
Unter Berücksichtigung dessen, was sie bis zum jetzigen Zeitpunkt in der Vorlesung Experimentalphysik I gelernt haben und der im Rahmen dieser Vorlesung
bereitgestellten mathematischen Methoden werden wir uns nun der klassischen
Mechanik aus der Sichtweise eines theoretischen Physikers nähern. Die klassische Mechanik ist die Theorie der Bewegung von “klassischen” Körpern (siehe
Kapitel 1) im Raum. Eine “saubere” mathematische Formulierung dieser gelang
erstmalig Newton. Seine Überlegungen stützen sich auf “vorwissenschaftliche Erfahrungen” über Raum, Zeit, Masse, die Existenz von starren Körpern usw.. In
einem ersten Schritt wird von der Ausdehnung der Körper abgesehen und diese
werden als “Punktteilchen” idealisiert. “Sinnvolle” Idealisierungen spielen eine
zentrale Rolle bei der Entwicklung theoretischer Konzepte.
Wir werden hier zunächst die fundamentalen experimentellen Beobachtungen
zusammenstellen und die zentralen Begriffe der Mechanik einführen. Eine “zirkelschlußfreie” Definition der Begriffe Masse und Kraft stellt sich als erstaunlich
kompliziert heraus und man muß sehr vorsichtig dabei vorgehen. Eine saubere
Definition dieser Konzepte ist daher Gegenstand einer Vielzahl von wissenschaftsphilosophischen Arbeiten. Eine Diskussion dazu finden sie in dem Artikel von L.
Eisenbud (siehe L2 P). Wir werden hier nicht genauer auf diese Probleme eingehen
und nehmen einen pragmatischen Standpunkt ein, indem wir auf ihre bereits gewonnenen Erfahrungen von dem was Masse und Kraft sind aufbauen. Wir folgen
in unserem Vorgehen auch nicht dem historischen Vorbild, der Principia Mathematica von Newton.
Wie wir heute wissen, sind die experimentellen Grundlagen auf der die klassische Mechanik beruht nur näherungsweise gültig (Quantenmechanik und relativistische Mechanik; siehe Kapitel 1). Folgerichtig ist die klassiche Mechanik eine
Theorie mit eingeschränktem Gültigkeitsbereich. Wir werden im Folgenden nicht
immer wieder auf die Grenzen der klassischen Mechanik hinweisen, sondern meist
121
122
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
so tun, als wenn sie die physikalischen Phänomene exakt beschreibt.
3.2
Grundlagen: Raum, Zeit, Masse und Kraft
Raum: Die Bewegung der Punktteilchen findet im dreidimensionalen und euklidischen Raum statt in dem jeder Punkt durch die Angabe seiner drei Koordinaten
bezüglich eines fest gewählten orthogonalen Bezugssystem (Koordinatensystem)
eindeutig festgelegt ist. Das Bezugssystem ist durch die Angabe des Ursprungs
und der drei auf Eins normierten Basisvektoren [0; ~e1 , ~e2 , ~e3 ] charakterisiert und
Punkte werden durch den Ortsvektor ~r = x1~e1 + x2~e2 + x3~e3 beschrieben. Die
Regeln und Konzepte zum Umgang mit Vekoren haben wir im ersten Teil dieser
Vorlesung kennen gelernt. Um möglichst einfach zur Lösung eines mechanischen
Problems vorzustoßen, bietet es sich oft an, eine spezielle Wahl des Bezugssystems
zu treffen. Durch vorheriges Nachdenken läßt sich somit oft der Rechenaufwand
minimieren.
Zeit: Die “eindimensionale” Zeit ist in der klassischen Mechanik “absolut”, d.h. es
ist im Prinzip möglich jeden Punkt des Raums mit einer Uhr zu versehen und
diese Uhren zu synchronisieren (Festlegen des Zeitnullpunktes und der “Zeitschritte”), in dem man die Information über die aktuelle Zeit mit Hilfe unendlich
schneller Signalausbreitung oder absolut starrer Körper überträgt. Die absolute Zeit ist unabhängig vom Bewegungszustand des Beobachters, d.h. nach der
Synchronisation geben alle Beobachter für die Zeit eines bestimmten Ereignisses
die gleiche Zahl an. Den elementaren Zeitschritt kann man mit Hilfe periodischer
Bewegungen (Schwingungen) definieren.
In der relativistischen Mechanik müssen die obigen Konzepte von Raum und
Zeit aufgegeben und durch allgemeinere ersetzt werden. Speziell gibt es keine
absolute Zeit mehr, d.h. der Bewegungszustand kann einen Einfluß auf die Zeit
haben. Raum und Zeit sind in der speziellen Relativitätstheorie nicht mehr unabhängig von einander.
Dadurch, daß jetzt Raum und Zeit festgelegt sind, können wir die Begriffe
Geschwindigkeit und Beschleunigung einführen. Die Geschwindigkeit ergibt sich
aus dem Differenzenquotienten für den Ortsvektor nach der Zeit im Limes kleiner
Zeitschritte ∆t und die Beschleunigung analog aus dem Geschwindigkeitsvektor.
Inertialsysteme: Es gibt Bezugssysteme (Koordinatensysteme), die Inertialsysteme, die spezielle Eigenschaften haben:
1. Alle Naturgesetze sind in allen Inertialsystemen zu allen Zeiten gleich.
2. Alle Koordinatensysteme, die sich geradlinig und gleichförmig gegenüber
einem Inertialsystem bewegen, sind selbst auch Inertialsysteme.
3.2. GRUNDLAGEN: RAUM, ZEIT, MASSE UND KRAFT
123
Dabei bauen wir darauf, daß ihnen “anschaulich” klar ist, was “geradlinig” (entlang einer Geraden) und “gleichförmig” (mit konstanter Geschwindigkeit) bedeutet. Es stellt sich die Frage, welche naheliegenden Bezugssysteme Inertialsysteme
sind. Ein erdfestes Bezugssystem (fest in Bezug auf Erdoberfläche) kann nur näherungsweise als inertial angesehen werden, da sich die Erde um sich selbst dreht,
sich um die Sonne dreht, diese sich um das Zentrum der Milchstraße (Galaxie)
dreht usw.. Koordinatensysteme die fest mit der Sonne, der Milchstraße usw.
verbunden sind kommen dem theoretischen Konzept des Inertialsystems immer
näher. Unter der Annahme, daß das mit der Oberfläche der Erde fest verbundene
Koordinatensystem (im Rahmen der Meßgenauigkeit) inertial ist, bedeutet das
obige “Galileische Relativitätsprinzip”, daß ein Experimentator der sich in einem
fensterlosen Zug befindet, welcher geradlinig und mit konstanter Geschwindigkeit
über die Erdoberfläche fährt (also selbst ein Inertialsystem darstellt) durch kein
Experiment feststellen kann, daß er sich in ebend diesem Zug befindet (Gleichheit
der Naturgesetze in Inertialsystemen).
Prinzip der “Bestimmtheit”: Wir betrachten ein System von Punktteilchen
aus einem Inertialsystem. Mit dem Anfangspunkt des Systems bezeichnen wir die
Werte aller Orte und Geschwindigkeiten der Punktteilchen zu einem bestimmten
(beliebigen) Zeitpunkt t. Das auf Newton zurückgehende und auf Erfahrung basierende Prinzip der “Bestimmtheit” lautet dann: Der Anfangspunkt eines mechanischen Systems bestimmt die Bewegung eindeutig. Insbesondere ist die Bewegung somit unabhängig von der Beschleunigung zu dem fest gewählten Zeitpunkt
und der Vorgeschichte des Systems. Bezeichnen wir mit ~ri (t) den Ort des i-ten
Punktteilchens zur Zeit t, so gilt für die Geschwindigkeit des i-ten Teilchens
d~ri (t)
~vi (t) = ~r˙i (t) =
dt
und für die Beschleuningung
d2~ri (t)
~ai (t) = ~r¨i (t) =
.
dt2
Für ein System von N Punktteilchen folgt dann aus dem Newtonschen Prinzip
der Bestimmtheit die Newtonsche Gleichung. Da der Anfangspunkt die Bewegung
eindeutig festlegt, ist speziell die Beschleunigung zur Zeit t durch
~r¨i (t) = f~i (~r1 (t), ~r2 (t), . . . , ~rN (t); ~r˙1 (t), ~r˙2 (t), . . . , ~r˙N (t); t)
bestimmt. Dabei müssen die N vektorwertigen Funktionen f~i von 6N + 1 Variablen für jedes spezifische System experimentell bestimmt werden. Diese Gleichung
gilt in allen Inertialsystemen. Vom mathematischen Standpunkt aus betrachtet
definiert ein Satz von “hinreichned harmlosen” Funktionen f~i ein mechanisches
System. Mit Hilfe der Existenz- und Eindeutigkeitssätze der Theorie gewöhnlicher
124
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Differentialgleichungen bestimmen die f~i zusammen mit den Anfangsbedingungen
~ri (t0 ) und ~vi (t0 ), i = 1, 2, . . . , N , die Bewegung eindeutig. Natürlich wird es sich
bei den f~i um die durch die Masse des i-ten Punktteilchens geteilte Kraft auf
dieses handeln. Wir betonen aber, daß es für die bisherigen Überlegungen nicht
nötig war, die Konzepte “Masse” und “Kraft” einzuführen.
In der Vorlesung Experimentalphysik I und im Mathematikteil dieser Vorlesung haben sie bereits verschiedene Beispiele für Funktionen f~i kennen gelernt.
Betrachten wir zunächst den einfachsten Fall eines Punktteilchens. Um den freien
Fall eines Steins zu beschreiben, vernachlässigen wir zunächst seine Ausdehnung.
Den Ursprung des Koordinatensystems legen wir auf die Erdoberfläche, die wir als
krümmungsfrei idealisieren. Die Erdoberfläche legt die ~e2 , ~e3 -Ebene des Koordinatensystems fest. Damit ist die Bedeutung des Ortsvektors ~r klar. Experimente
zeigen dann, daß für den Fall aus nicht zu großer Höhe bis zum Aufprall
~r¨(t) = ~g , ~g = −g~e1 ,
g ≈ 9.81 m/s2
gilt. Mit der Funktion (“dem Potential”) Ṽ (~r) = −~g · ~r kann man auch schreiben
~ Ṽ (~r) .
~r¨(t) = −∇
Dabei haben wir die Zeitabhängigkeit des Ortes auf der rechten Seite der Gleichung nicht explizit mitgeschrieben. Es ist offensichtlich, daß man das Problem
durch geschickte Wahl des Koordinatensystems zu einem eindimensionalen machen kann.
Läßt man den Stein nun aus größerer Höhe fallen, so muß man zur Beschreibung der Bewegung eine andere Funktion f~ ansetzen. Es gilt dann bis zum Aufprall auf der Erdoberfläche (näherungsweise wegen der Reibung durch die Luft)
das von Newton entdeckte 1/r2 Gesetz
r2 ~r
~r¨(t) = −g 02 ; r = |~r| ,
r r
wobei ~r den vom Erdmittelpunkt ausgehenden Ortsvektor bezeichnet und r0 der
Erdradius ist. Mit dem “Potential”
Ṽ (~r) = −
k
,
r
k = gr02
folgt
~ Ṽ (~r) .
~r¨(t) = −∇
Als weiteres Beispiel betrachten wir die Bewegung eines Punktteilchens, das
an einer Feder befestigt ist, die wiederum in einer Wand verankert ist. Das Teilchen liege auf einem Tisch auf, der mit einem Schmiermittel bestrichen sei. Durch
3.2. GRUNDLAGEN: RAUM, ZEIT, MASSE UND KRAFT
125
geschickte Wahl des Koordinatensystems ist die Bewegung durch eine Ortskoordinate zu beschreiben und Experimente zeigen, daß
ẍ(t) = −α2 x = −
1
dṼ (x)
, Ṽ (x) = α2 x2
dx
2
gilt, solange das Teilchen nicht zu weit aus der Ruhelage ausgelenkt wird und die
seit der Auslenkung verstrichene Zeit nicht zu groß ist (wegen der Reibung). Man
nennt diesen Zusammenhang das Hooksche Gesetz.
Ersetzt man das eine an der Feder befestigte Punktteilchen durch zwei der
exakt gleichen Art, so stellt sich experimentell heraus, das die Beschleunigung
bei gleicher Auslenkung (wie im Fall eines Teilchens) nur noch halb so groß ist.
Allgemeiner findet man, daß für zwei Punktteilchen 1 und 2 das Verhältnis der
Beschleunigung bei gleicher (kleiner) Auslenkung einen festen Wert hat, welcher
weder von der Auslenkung selbst, der aktuellen Zeit, noch von der Bauart der
Feder abhängt. Man bezeichnet
ẍ(1) (t)
m2
=
ẍ(2) (t)
m1
als das Massenverhältnis. Durch Wahl einer festen Bezugsmasse (“Einheitskilogramm”) ist damit der Begriff der Masse über die Trägheit eingeführt. Aus
Erfahrung weiß man, daß alle Massen positiv sind. Im Beispiel der Feder sieht
man nun, daß die Größe mẍ nicht vom Teilchen, sondern nur noch den Eigenschaften der Feder abhängt und man nennt diese Größe die Kraft die durch die
Feder auf das Teilchen wirkt. Diese Logik zeigt, wie eng die Begriffe Masse und
Kraft zusammenhängen. Die Bewegungsgleichung lautet dann
mẍ(t) = F (x) = −Kx ,
K = mα2 .
Nachdem der Massebegriff nun eingeführt ist, lassen sich die Newtonschen
Gleichungen in der bekannten Form
mi ~r¨i (t) = F~i (~r1 (t), ~r2 (t), . . . , ~rN (t); ~r˙1 (t), ~r˙2 (t), . . . , ~r˙N (t); t) ,
mit der experimentell festgelegten Kraft F~i die auf das i-te Teilchen wirkt, schreiben. Wir definieren nun den Teilchenimpuls
p~i (t) = mi~vi (t) = mi~r˙i (t)
und erhalten eine Form des zweiten Newtonschen Gesetzes
p~˙i = F~i ,
wobei wir die Abhängigkeiten von den Variablen nicht mitgeschrieben haben.
Wir haben dabei die obige Version des zweiten Newtonschen Gesetzes gewählt,
126
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
da man in dieser auch den “phänomenologischen” Fall von zeitabhängigen Massen
behandeln kann.
Beschreibt man die Bewegung der Teilchen in einem Inertialsystem, so findet
man häufig den Fall, daß die (Gesamt-)Kraft auf das i-te Teilchen als Summe von
Paarkräften geschrieben werden kann
F~i =
N
X
F~i,j
j=1
j6=i
und für die F~i,j
F~i,j = −F~j,i
gilt. Die Paarkräfte wirken entlang der Verbindungslinie der Massepunkte i und j.
Man bezeichnet dieses als das Prinzip von actio = reactio (Kraft = Gegenkraft).
Der Betrag der Kräfte ist eine Funktion des Abstandes |~ri − ~rj |. Diese Beobachtungen bilden das dritte Newtonsche Gesetz. Ein Beispiel für Kräfte dieser Art
sind die Gravitationskräfte zwischen Massen. Sind alle Kräfte die auf Teilchen eines Systems wirken von dieser Form, so bezeichnet man das betrachtete System
auch als abgeschlossen.
Ist das betrachtete System nicht abgeschlossen, so kann man die Kraft auf
das i-te Teilchen häufig als
F~i =
N
X
F~i,j + F~iext
j=1
j6=i
schreiben, wobei F~iext die externen Kräfte auf das i-Teilchen bezeichnet. Solch eine Situation ergibt sich z.B. wenn man ein abgeschlossenes System in zwei Teile
zerlegt und nur einen Teil explizit betrachtet. Ein einfaches Beispiel ist das von
uns diskutierte Problem des Falls eines Steins (auf die Erde) aus geringer Höhe.
In diesem Beispiel kann die Rückwirkung der Bewegung des Steins auf die Erde
vernachlässigt werden (da mStein /mErde 1) und wir haben die Paarkraft Gravitation gleich durch eine externe Kraft nur auf den Stein beschrieben. Vollständiger
müßten wir das Zweiteilchensystem Stein-Erde beschreiben, oder noch besser, das
Vielteilchensystem von Atomen des Steins und Atomen der Erde (wobei wir dann
natürlich eigentlich Quantenmechanik betreiben müßten). Auch dann hätten wir
noch den Einfluß aller anderer Himmelskörper auf die Bewegung vernachlässigt.
Dies ist oft legitim, da die Paarkräfte meist mit dem Abstand der Teilchen abnehmen (Ausnahme: Federkraft), so daß F~iext , welches von nicht berücksichtigten
Paarkräften stammt, verglichen mit den explizit betrachteten Paarkräften innerhalb des Systems vernachlässigt werden kann. Erst aufgrund dieser Tatsache wird
die klassische Mechanik überhaupt möglich. Würde das nicht gelten, so müßte
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
127
man ja bei der Untersuchung jedes mechanischen Problems immer das Universum als Ganzes behandeln. Aufgrund des Abfalls der Kräfte mit dem Abstand der
Massenpunkte, können auch Teilsysteme oft in guter Näherung als abgeschlossen
angesehen werden. Auch zur Beschreibung des Aufpralls des Steins, müßten wir
das aus den Atomen des Steins (und der Erde) bestehende Vielteilchensystem
beschreiben, was man jedoch häufig durch Verwendung effektiver Zwangskräfte
zu vermeiden versucht.
Auch ein weiteres vereinfachendes Konzept läßt sich anhand des Falles eines
Steins verdeutlichen. In der bisherigen Beschreibung sind wir davon ausgegangen, daß der Stein während des Falls mit keinen anderen Teilchen als der Erde
wechselwirkt, also speziell nicht mit den Molekülen der Luft. Der Fall fand also
im Vakuum statt. Um bei der Beschreibung des Falls in Luft nicht die Bewegung
aller Moleküle (alle Orte und Geschwindigkeiten) der Luft explizit mitbehandeln
zu müssen (was ja auch wieder Quantenmechanik erfordern würde) führt man als
(oft sehr gute) Näherung eine effektive Reibungskraft ein, die von der Geschwindigkeit des Steins abhängt (verschwindende Reibungskraft, wenn die Geschwindigkeit des Steins Null ist). Im Kapitel über gewöhnliche Differentialgleichungen
haben wir bereits zwei Beispiele für Reibungskräfte (∝ −v 2 bzw. ∝ −v) kennen
gelernt. Eine reichhaltigere Bewegung erhält man z.B. aus der Gleichung des van
der Pol-Oszillators
mẍ + mη(x2 − a2 )ẋ + mω02 x = 0
(3.1)
in dem das Vorzeichen (und die Amplitude) der zur Geschwindigkeit proportionalen Reibungskraft von der Amplitude x der Auslenkung abhängt. Systeme in
denen durch eine effektive Beschreibung der Wirkung weggelassener Freiheitsgrade Reibungskräfte auftreten bezeichnet man als dissipative Systeme. Diese stehen
im Gegesatz zu sogenannten konservativen Systemen (siehe unten).
Die obigen Überlegungen zum Abfall der Paarkräfte führt uns auf das erste
Newtonsche Gesetz. Ist ein einziges Punktteilchen i hinreichend weit von allen anderen Teilchen entfernt, so gilt F~iext ≈ 0 und die Bewegung kann näherungsweise
durch
mi~r¨i (t) = 0 ⇒ ~ri (t) = ~r0 + ~v0 t
beschrieben werden, wobei ~r0 den Anfangsort und ~v0 die Anfangsgeschwindigkeit des Teilchens bezeichnen. In Worten lautet das erste Newtonsche Gesetz:
Jeder Körper beharrt in seinem Zustand der Ruhe oder geradlinig gleichförmigen Bewegung, wenn er nicht durch einwirkende Kräfte gezwungen wird, seinen
Bewegungszustand zu ändern.
3.3
Bewegungsgleichung und Erhaltungsgrößen
Wir betrachten ein System von N Massepunkten m1 , m2 , . . . , mN , wobei die Massen zeitlich konstant sein sollen. Die Newtonschen Gleichungen haben dann die
128
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Form (i = 1, 2, . . . , N )
mi ~r¨i (t) =
N
X
F~i,j + F~iext .
(3.2)
j=1
j6=i
Schwerpunkt und Gesamtimpuls: Wir definieren den Schwerpunkt des Systems. Sein Ortsvektor ist durch
N
1 X
~
R=
mi~ri ,
M i=1
M=
N
X
mi
i=1
gegeben, wobei M die Gesamtmasse des Systems bezeichnet. Durch Addition der
Newtonschen Gleichungen für die einzelnen Teilchen folgt
N
N X
N
N
X
X
X
¨
¨
~
~
M R(t) =
mi ~ri (t) =
Fi,j +
F~iext .
i=1
i=1
j=1
j6=i
i=1
Da F~i,j = −F~j,i verschwindet die Doppelsumme und es gilt
N
X
~¨ =
M R(t)
F~iext = F~ ext ,
i=1
was die externe Gesamtkraft F~ ext definiert.
Als einfaches Beispiel betrachten wir den Fall des Steins aus kleiner Höhe.
Wir stellen uns den Stein nun als aus N Massepunkten (“Atomen”) zusammgesetzt vor. Zuvor hatten wir den Stein als einen Massepunkt idealisiert. Auf alle
“Atome” wirke die Schwerkraft F~iext = mi~g . Das liefert die externe Gesamtkraft
P
F~ ext = i mi~g = M~g , d.h. die Bewegungsgleichung für den Schwerpunkt lautet
~¨ = ~g . Wir sehen somit, daß unter Berücksichtigung des dritten Newtonschen
R
Gesetzes die Bewegungsgleichung des “ausdehnungslosen” Steins (Punktteilchen;
siehe oben) zu der für den Schwerpunkt des ausgedehnten Steins wird. Sollten
die externen Kräfte vom Ort abhängen F~iext = F~iext (~ri ) (was in unserem einfachen Beispiel nicht der Fall ist), dann erhält man nur dann eine geschlossene
Gleichung für die Bewegung des Schwerpunktes, wenn die Variation der externen
Kräfte über die Ausdehnung des Objektes vernachlässigbar ist. Ist dies der Fall,
so gilt in guter Näherung
~¨ = F~ ext (R)
~
M R(t)
für den Vektor des Schwerpunktes.
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
129
Ist das betrachtete System abgeschlossen, d.h. für alle Zeiten gilt F~iext = 0, so
folgt
~¨ = 0
M R(t)
~
~ 0 + V~0 t.
und der Schwerpunkt bewegt sich geradlinig und gleichförmig: R(t)
=R
Definiert man den Gesamtimpuls des Systems als
P~ =
N
X
p~i =
i=1
N
X
mi~r˙i
i=1
so folgt für diesen
˙
P~ = F~ ext
und für ein abgeschlossenes System ist der Gesamtimpuls eine Erhaltungsgröße
(hängt nicht von der Zeit ab)
~˙ = M V~0 .
P~ = M R
Gesamtdrehimpuls: Neben dem Impuls spielt der Drehimpuls eine zentrale
Rolle in der Mechanik. Der Drehimpuls ~li des i-ten Teilchens ist definiert als
(i = 1, 2, . . . , N )
~li = mi~ri × ~vi = ~ri × p~i .
Im Gegensatz zum (linearen) Impuls, hängt der Drehimpuls von der Wahl des
Ursprungs ab und man sollte damit genauer vom Drehimpuls im Bezug auf ein
spezifisches Koordinatensystem [0; ~e1 , ~e2 , ~e3 ] sprechen. Als Gesamtdrehimpuls definiert man
~ =
L
N
X
i=1
~li =
N
X
~ri × p~i .
i=1
Die Ableitung nach der Zeit ergibt (Produktregel)
N h
i
˙ X ˙
˙
~
L=
~ri × p~i + ~ri × p~i .
i=1
Der erste Term verschwindet, da ~r˙i = ~vi und p~i parallele Vektoren sind. Durch
Einsetzen der Newtonschen Gleichung in den zweiten Term folgt


N
N
X
X ~

~˙ =
L
~ri × 
Fi,j + F~iext  .
i=1
j=1
j6=i
130
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Den ersten Summanden kann man weiter umformen. Man verwendet dabei die
folgenden Punkte: (i) Umbennen von Summationindizes, (ii) drittes Newtonsches
Gesetz und (iii) ~ri − ~rj ist parallel zu F~i,j :
N
X
i=1
~ri ×
N
X
F~i,j =
j=1
j6=i
N
X
~ri × F~i,j
i,j=1
j6=i
N
1 X
=
~ri × F~i,j + ~rj × F~j,i
2 i,j=1
j6=i
N
1 X
=
(~ri − ~rj ) × F~i,j
2 i,j=1
j6=i
= 0.
Die Bewegungsgleichung für den Gesamtdrehimpuls ergibt sich somit zu
N
N
X
X
~˙ =
~ ,
L
~ri × F~iext =
~next
=N
i
i=1
(3.3)
i=1
=
wobei wir dabei das durch die äußere Kraft hervorgerufene Drehmoment ~next
i
ext
~
~
~ri × Fi auf das i-te Teilchen und das Gesamtdrehmonent N definiert haben. Für
den Fall des Steins mit f~iext = mi~g liefert das
~˙ = M R(t)
~ × ~g .
L
~
Nachdem R(t)
berechnet wurde, folgt der Drehimpuls somit durch Integration
über die Zeit.
Gleichung (3.3) liefert die zentrale Beobachtung, daß der Gesamtdrehimpuls
eines abgeschlossenen Systems mit verschwindenden äußeren Kräften eine Erhaltungsgröße ist
~˙ = 0 ⇒ L(t)
~
~0 ,
L
=L
~ 0.
mit dem Anfangsgesamtdrehimpuls L
Arbeit, Gesamtenergie und konservative Kräfte: Zur Definition der an einem Teilchen geleisteten Arbeit untersuchen wir zunächst die Verschiebung eines
Teilchens in einem statischen (zeitunabhängigen) Kraftfeld F~ (~r), welches nur vom
Ort des Teilchens abhängt. Dabei wird die Bewegung unabhängig vom wirklichen
(“dynamischen”) Durchlaufen der durch die Bewegungsgleichung und Anfangsbedingung gegebenen Bahnkurve betrachtet. Das Kraftfeld sei in einem einfach
zusammenhängende Gebiet definiert (siehe das Kapitel über Integration im Rn ).
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
131
Die Verschiebung erfolge längs einer (hinreichend glatten) Kurve C von ~ra nach
~re . In Verallgemeinerung der in einem homogenen (ortsunabhängigen) Kraftfeld
geleisteten Arbeit (“Arbeit = Kraft · Weg”) definieren wir
Z
AC = F~ · d~r
C
als Kurvenintegral. Eine wichtige Roll in der Mechanik spielen konservative Kraftfelder, die sich als Gradient einer skalaren Funktion −V (~r), mit dem Potential
oder der potentiellen Energie V (~r), schreiben lassen
~ (~r) .
F~ (~r) = −∇V
Nach dem was wir im letzten Kapitel des mathematischen Teils dieser Vorlesung
gelernt haben, ist das Kraftfeld F~ (~r) dann und nur dann konservativ, wenn die
längs beliebiger Kurven geleistete Arbeit nur vom Anfangs- und Endpunkt der
Kurve, nicht jedoch von der Form dieser abhängt. Weiterhin haben sie im Mathematikteil gelernt, daß die Rotation eines konservativen Kraftfeldes verschwindet
~ × F~ (~r) = 0 ,
∇
was bei gegebenem Kraftfeld ein leicht zu überprüfendes Kriterium für Konservativität darstellt.
Als Beispiel für konservative Kraftfelder betrachten wir alle Zentralfelder der
Form F~ (~r) = F (r)~r/|~r|. Den einfachen Beweis der Konservativität über das Bilden der Rotation verschieben wir auf eine Übungsaufgabe. Stattdessen wollen wir
hier konstruktiv zeigen, daß Zentralfelder konservativ sind. Wir betrachten
Z
Z
~r
AC = F~ (~r) · d~r = F (r) · d~r .
|~r|
C
C
dr
r
dr
Der Skizze folgend gilt “~r/|~r| · d~r = dr” und damit
Z re
AC =
F (r)dr
ra
132
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
unabhängig vom Weg. Die Funktion
Z
r
F (r0 )dr0
V (~r) = −
ra
ist dann das Potential,1 was man leicht explizit verifiziert
Z r
~ = F (r) ~r = F~ (~r) .
~
~
F (r0 )dr0 = F (r)∇r
−∇V (~r) = ∇
|~r|
ra
Wir kehren nun zum allgemeinen Fall eines statischen Kraftfeldes zurück und
nehmen an, daß wir die wirkliche, dynamische Trajektorie der Bewegung C =
{~r(t) ∈ R3 | t ∈ [ta , te ]} bestimmt haben. Diese wird durch die Zeit parametrisiert
und für die Bewegung entlang dieser Trajektorie gilt
Z
AC =
F~ (~r) · d~r
ZC te h
i
F~ (~r(t)) · ~r˙ (t) dt
=
ta
Z te h
i
˙
~v (t) · ~v (t) dt
= m
ta
Z
m te dv 2 (t)
=
dt
2 ta
dt
m 2
m
=
v (te ) − v 2 (ta )
2
2
= Te − Ta ,
wobei wir von der zweiten zur dritten Zeile die Newtonsche Gleichung verwendet
haben und im letzten Schritt die kinetische Energie
T (~v ) =
m 2
v
2
definiert haben. Ist das Kraftfeld nun konservativ so gilt auch
Z
Z
~ (~r) · d~r = −(Ve − Va )
AC = F~ (~r) · d~r = − ∇V
C
C
und die Kombination dieser beiden Resultate liefert die Energieerhaltung
Ta + Va = Te + Ve = E = const.
für die Bewegung eines Teilchens in einem konservativen Kraftfeld.
1
Da ~ra frei gewählt werden kann, ist das Potential (die potentielle Energie) nur bis auf eine
Konstante eindeutig festgelegt.
3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN
133
Für den Beweis der Energieerhaltung im Fall des N -Teilchensystems mit Paarkräften und konservativen äußeren Kräften (statisch und F~iext hängt nur von ~ri
ab) gehen wir etwas anders vor. Wir bilden das Skalarprodukt der Bewegungsgleichung (3.2) mit ~r˙i
mi ~r˙i · ~r¨i =
N
X
j=1
j6=i
mi dvi2
~r˙i · F~i,j + ~r˙i · F~iext =
.
2 dt
Die Summation über alle Teilchen liefert
N
N
N
X
X
d X mi 2
˙
~
v =
~ri · Fi,j +
~r˙i · F~iext
dt i=1 2 i
i,j=1
i=1
j6=i
N
N
X
1 X ˙
˙
~
=
(~ri − ~rj ) · Fi,j +
~r˙i · F~iext .
2 i,j=1
i=1
(3.4)
j6=i
Es gilt nun (Kraft hängt nur vom Betrag der Abstände ab und zeigt entlang der
Verbindungslinie; siehe oben)
~ri − ~rj
F~i,j = Fi,j (|~ri − ~rj |)
.
|~ri − ~rj |
Damit ist F~i,j analog zur Zentralkraft aus einem “Zweiteilchenpotential” vi,j ableitbar. Mit der Definition ~ri,j = ~ri − ~rj folgt
~ ~r vi,j (ri,j ) = −∇
~ ~r vi,j (ri,j )
F~i,j (~ri,j ) = −∇
i,j
i
mit
Z
ri,j
vi,j (ri,j ) = −
Fi,j (r0 ) dr0 .
r0
Dabei gibt der Index am ∇ an, nach welcher Variablen differenziert wird. Sind
weiterhin die äußeren Kräfte konservativ, d.h.
~ ext (~ri )
F~iext (~ri ) = −∇V
i
wobei Viext nicht explizit von der Zeit abhängt, so vereinfacht sich Gl. (3.4) zu
(Kettenregel!)


N
N
N
X
d X mi 2
d 1 X

vi = − 
vi,j (ri,j ) +
Viext (~ri ) .
dt i=1 2
dt 2 i,j=1
i=1
j6=i
134
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Damit ergibt sich die Energieerhaltung für ein konservatives N -Teilchensystem
N
X
mi
i=1
2
vi2
N
N
X
1 X
+
vi,j (ri,j ) +
Viext (~ri ) = E = const. .
2 i,j=1
i=1
(3.5)
j6=i
Häufig spricht man auch unter allgemeineren Bedingungen an die äußeren
Kräfte von einem konservativen N -Teilchensystem. In Gl. (3.4) können wir zu
dem aus einem Potential ableitbaren F~iext (~ri ) eine (externe) Kraft hinzuaddieren, die entlang der physikalischen Lösung senkrecht zu ~r˙i (t) steht ohne, dass
die folgenden Schritte zur Herleitung der Energieerhaltung – wobei die Gesamtenergie wie in Gl. (3.5) definiert ist – nicht mehr funktionieren würden. Diese
Zusatzkraft kann dabei von allen Orten, Geschwindigkeiten und auch explizit
von der Zeit abhängen. Ein allgemeines N -Teilchensystem heißt dann konserva~ ext (~ri ) +
tiv (und die Energie gemäß Gl. (3.5) ist erhalten) wenn F~iext = −∇V
i
˙
˙
˙
˙
~
~
fi (~r1 , ~r2 , . . . , ~rN ; ~r1 , ~r2 , . . . , ~rN ; t) mit ~ri · fi = 0 entlang der physikalischen Lösung
(Lösung der Bewegungsgleichung) ~ri (t) für alle i = 1, 2, . . . , N . Die externen
Kräfte würde man in diesem Fall ebenfalls als konservativ bezeichnen. Wir weisen darauf hin, dass man im Fall einer explizit zeitabhängigen Potentialfunktion,
deren negativer Gradient die explizit zeitabhängige Kraft liefert, nicht von einem
konservativen System bzw. einer konservativen Kraft spricht, da die Energieerhaltung (mit der Energie gemäß Gl. (3.5), wobei Viext (~ri ) → Viext (~ri ; t)) nicht mehr
gilt. Man kann solche Kräfte Potentialkräfte nennen.
Die in diesem Kapitel diskutierten Erhaltungssätze spielen bei der Lösung
vieler mechanischer Probleme eine zentrale Rolle. Um das näher zu erläutern betrachten wir zunächst Bewegungen eines Massepunktes in einem konservativen
Kraftfeld, die sich in Gegenwart von speziellen Anfangsbedingungen und/oder
Zwangskräften durch geschickte Wahl des Koordinatensystems durch eine Ortsvariable beschreiben lassen (eindimensionale Bewegungen). Wir haben im Laufe
dieser Vorlesung bereits einige Beispiele dazu kennen gelernt (freier Fall, Masse
mit Hookscher Feder) und analytisch gelöst (ohne auf Erhaltungsgrößen Bezug zu
nehmen). Wir werden im Folgenden zunächst einige allgemeine Überlegungen anstellen. Bereits am Beispiel dieser Klasse von Bewegungen wird klar werden, wie
klein die Zahl der geschlossen analytisch lösbaren (integrierbaren; siehe später)
Probleme ist.
3.4
Ein Teilchen in einer Dimension
Spezielle Anfangsbedingungen und/oder Zwangskräfte (z.B. “Perle auf Draht”)
können dazu führen, daß sich die Bewegung eines Teilchens als effektiv eindimensional beschreiben läßt. Daher ist es sinnvoll eindimensionale mechanische
Systeme zu betrachten.
3.4. EIN TEILCHEN IN EINER DIMENSION
135
Zeitunabhängige Kräfte: Die Newtonsche Gleichung in einem statischen Kraftfeld welches nur vom Ort des Teilchens abhängt lautet
mẍ = F (x) .
Als besondere Eigenschaft des eindimensionalen Falls, läßt sich jede integrierbare,
nur vom Ort abhängige Kraft F (x) durch ein Potential V (x) ausdrücken
Z x
F (x0 ) dx0 ,
V (x) = −
x0
welches bis auf eine willkürliche Konstante (Nullpunkt der Energie; siehe auch
oben) eindeutig festgelegt ist. Die Energieerhaltung liefert
m 2
ẋ = E − V (x) .
2
(3.6)
Somit ist der Betrag der Geschwindigkeit des Teilchens bei fester Gesamtenergie
E durch den Ort des Teilchens eindeutig festgelegt. In der Skizze ist eine typische
Situation dargestellt.
V(x)
E
x1
x2 xM x3
x
Die kinetische Energie ist größer oder gleich Null, so daß die Bewegung nur in
Bereichen mit V (x) ≤ E verlaufen kann. Für die gestrichelt dargestellte Gesamtenergie E im obigen Beispiel sind das die x-Bereiche zwischen x1 und x2 sowie
rechts von x3 . Die Punkte xi , i = 1, 2, 3, an denen die potentielle Energie gleich
der Gesamtenergie ist, also V (xi ) = E gilt, sind die Umkehrpunkte der Bewegung,
an denen die Geschwindigkeit der Teilchens einen Nulldurchgang hat, d.h. ihre
Richtung umkehrt. Sollte das für die Bewegung erlaubte Gebiet auf beiden Seiten
durch einen Umkehrpunkt begrenzt sein, verläuft sie in einem endlichen Raumbereich und man nennt sie finit. Liegt im obigen Beispiel der Anfangsort (bei festem
E) zwischen x1 und x2 , so ist die Bewegung auf diesen Raumbereich beschränkt.
136
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Ist der erlaubte Raumbereich nicht oder nur auf einer Seite beschränkt (liegt der
Anfangsort in der Skizze bei festem E rechts von x3 ), so nennt man die Bewegung
infinit und das Teilchen läuft nach ±∞. Aus Gl. (3.6) ergibt sich
r
2
[E − V (x)]
(3.7)
ẋ = ±
m
und man kann die Geschwindigkeit bei gegebenem x direkt ablesen. Um sich einen
Eindruck von der Bewegung zu verschaffen stellt man sie im sogenannten Phasenraum dar. Dabei trägt man den Ort entlang der x-Achse und die Geschwindigkeit
entlang der y-Achse auf. Für unser Beispiel und zwei Energien E1 und E2 haben
wir das in der folgenden Skizze getan.2
V(x)
E2
E1
x0 x1
x2
x3
x
x
E2
E1
E1
x
Die Bahnen (je nach Anfangsort und Gesamtenergie) werden in Richtung der
Pfeile durchlaufen. Zur analytischen Bestimmung des Verlaufs der Bewegung,
integrieren wir die Differentialgleichung (3.7) erster Ordnung durch Separation
der Variablen
r Z x(t)
Z t
m
1
0
p
dt = ±
dx0
0
2
E − V (x )
t0
x0
2
Die auf der x-Achse auftretenden Knicke sind ein Artefakt des Programms mit dem die
Skizze erstellt wurde. Eigentlich gehen die Kurven mit divergierender Steigung durch die xAchse.
3.4. EIN TEILCHEN IN EINER DIMENSION
137
und damit
r
t − t0 = ±
m
2
Z
x(t)
x0
1
p
E − V (x0 )
dx0 .
(3.8)
Dabei müssen x0 = x(t0 ) und x(t) mit der fest vorgegebenen Gesamtenergie E
verträgliche Orte (im Sinne der obigen Diskussion) sein, d.h. bezugnehmend auf
die obige (erste) Skizze muß x0 , x(t) ∈ [x1 , x2 ] oder x0 , x(t) ∈ [x3 , ∞) gelten.
Für beliebige Potentiale wird die Integration auf der rechten Seite von Gl. (3.8)
im Allgemeinen nicht analytisch ausführbar sein und man kann die Gleichung
nicht nach x(t) (woran wir natürlich interessiert sind) auflösen. Man kann die
Bahnkurve in der (t, x)-Ebene dann durch numerische Integration und Auftragen
von t als Funktion von x erhalten.
Für ein quadratisches (harmonisches) Potential V (x) = V0 + c(x − b)2 /2 (also
eine Hooksche Kraft) mit c > 0, läßt sich die Integration ausführen und das
Ergebnis dieser nach x(t) auflösen. Um die Rechnung zu vereinfachen, wählen
wir o.B.d.A. V0 = 0 = b. Wir definieren den zur gegebenen Gesamtenergie E
gehörenden Umkehrpunkt a gemäß E = V (a) und erhalten so
Z x(t)
1
1
√
dx0
t − t0 = ±
ω0 x0
a2 − x 0 2
⇒ ω0 (t − t0 ) = ±{arcsin [x(t)/a] − arcsin [x0 /a]}
oder aufgelöst nach x(t)
x(t) = ±a sin (ω0 t + φ± ) ,
φ± = −ω0 t0 ± arcsin [x0 /a] .
p
Dabei haben wir die Kreisfrequenz ω0 = c/m eingeführt. Dieses Ergebnis ist
uns natürlich bereits aus dem Kapitel über Integralrechnung einer Veränderlichen
bekannt.
Periodische Bewegungen: Die eindimensionale finite Bewegung ist im Allgemeinen eine Schwingung. Eine Ausnahme bildet die Situation, daß in unserer
ersten Skizze des Potentials gerade E = V (xM ) gewählt wird. In allen anderen
Fällen führt das Teilchen eine periodische Bewegung zwischen den Umkehrpunkten x1 und x2 aus. Für die Schwingungsdauer TE (bei festem E) der Bewegung
von x1 nach x2 und zurück erhält man
Z x2
√
1
p
TE = 2m
dx0 .
(3.9)
0
E − V (x )
x1
Wie man leicht nachrechnet gilt im Fall des harmonischen Potentials unabhängig
von der Gesamtenergie E, bzw. dem Umkehrpunkt a (aus V (a) = E), TE =
138
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
2π/ω0 . Wir betrachten nun den Fall eines symmetrischen Potentials V (x) mit
einem harmonische Teil und einer “kleinen” Anharmonizität
V (x) =
c 2
x + V1 (x) , 0 ≤ 1 .
2
Wir definieren wieder den Umkehrpunkt a (symmetrisches Potential!) bei festem
E gemäß V (a) = E. Unter der Voraussetzung, daß |V1 (a)| ca2 /2, p
was für hinreichend kleines sicherlich erreicht werden kann, entwickeln wir 1/ E − V (x)
nach Potenzen von r
2
1
1
1
p
√
q
=
c a2 − x2 1 + 2 [V (a) − V (x)]/(a2 − x2 )
V (a) − V (x)
1
1
c
r
2
1
V1 (a) − V1 (x)
√
=
1−
+ O(2 ) .
c a2 − x 2
c
a2 − x 2
Setzt man dieses Ergebnis in die Gleichung für die Periodendauer (3.9) ein, so
kann das Integral des ersten Summanden ausgeführtpwerden (Integrand wie beim
harmonischen Potential) und man erhält mit ω0 = c/m
Z a
2π
1
V1 (a) − V1 (x)
2
√
TE = T (a) =
1−
dx + O( ) .
ω0
cπ −a a2 − x2
a2 − x 2
Dabei tritt in nullter Ordnung in die bekannte Schwingungsdauer des harmonischen Oszillators auf. Der Term erster Ordnung in hängt von a und damit E
ab, so daß die Schwingungsdauer für eine allgemeine periodische Bewegung von
der Gesamtenergie bzw. dem Umkehrpunkt (der Auslenkung) abhängt.
Die Abhängigkeit der Periodendauer von der Auslenkung läßt sich explizit
für den Fall der quartischen Anharmonizität mit V1 (x) = χx4 zeigen, wobei χ
positive oder negative Werte annehmen kann. In diesem Fall gilt
V1 (a) − V1 (x)
= χ(a2 + x2 )
a2 − x 2
und das Integral im Term erster Ordnung läßt sich ebenfalls geschlossen angeben.
Nach der Substitution u = x/a folgt für das relevante Integral
Z
1
−1
1 + u2
√
du = −
1 − u2
Z
1
−1
√
2
1 − u2 − √
1 − u2
du = −
Zusammengefaßt gilt dann
3χ 2
2π
2
1−
a + O( ) ,
T (a) =
ω0
2c
π
3π
+ 2π =
.
2
2
3.4. EIN TEILCHEN IN EINER DIMENSION
139
bzw. für die Kreisfrequenz der periodischen Bewegung
3χ 2
2
ω(a) = ω0 1 +
a + O( ) .
2c
(3.10)
Je nach Vorzeichen von χ wird die Frequenz verglichen mit der des harmonischen
Oszillators erhöht oder erniedrigt.
Fadenpendel und Polarkoordinaten: Ein typisches Beispiel eines anharmonischen Oszillators ist ein (reibungsfreies) Fadenpendel (Masse m am Ende eines
masselosen Fadens) bei größerer Auslenkung.
0
φ
N
G
Die Bewegung ist effektiv eindimensional da sie in einer Ebene (per Wahl des
Koordinatensystems die x1 -x2 -Ebene) statt findet und die Masse durch die ent~ auf eine Kreisbahn gezwungen wird.
lang des Fadens wirkende Normalkraft N
Damit ist der Abstand vom Ursprung durch die Länge R des Fadens festgelegt.
Die Position der Masse ist durch die Angabe des Winkels φ eindeutig festgelegt.
Es biete sich an, das Problem in ebenen Polarkoordinaten (siehe Mathematik Teil
dieser Vorlesung) zu formulieren. Es gilt
x1 = r cos φ ,
x2 = r sin φ .
Für einen festen Ortsvektor ~r führen wir zwei neue (verglichen mit den alten ~e1
und ~e2 ) orthogonale Einheitsvektoren ein. Als den ersten wählen wir ~rˆ = ~r/r
~ˆ der zusammen mit ~rˆ ein
und als den zweiten den dazu senkrechten Vektor φ
Rechtssystem (siehe den mathematischen Teil dieser Vorlesung) bildet. Dies ist
in der folgenden Skizze dargestellt.
140
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
φ
r
r
e2
e1
Fassen wir nun ~r als den (ebenen) Ortvektor auf, der die Bewegung der Masse beschreibt, also ~r = ~r(t), so ändern sich die orthogonalen Einheitsvektoren
~ˆ (im Gegensatz zu ~e1 und ~e2 ) im Laufe der Zeit. Dessen ungeachtet,
~rˆ und φ
läßt sich ein Vektor, z.B. die Gesamtkraft F~ als Linearkombination von ~rˆ und
~ˆ schreiben F~ = Fr~rˆ + Fφ φ.
~ˆ Wir streben es an, die Newtonsche Gleichung für
φ
~ˆ zu schreiben, müssen also die
die Entwicklungskomponenten von ~r nach ~rˆ und φ
Entwicklungskoeffizienten von ~r¨ unter Berücksichtigung der Zeitabhängigkeit von
~ˆ bestimmen. Der Ortsvektor selbst ist durch ~r = x1~e1 + x2~e2 = r~rˆ gege~rˆ und φ
ben. In der folgenden Skizze ist die Position des Teilchens zu zwei verschiedenen
Zeiten t1 und t2 = t1 + ∆t dargestellt.
∆r
r(t2)
∆φ
r(t2)
r(t1)
r(t1)
Für kleine ∆t gilt
~ˆ ≈ φ̇∆t φ
~ˆ
∆~rˆ ≈ ∆φ φ
~ˆ steht. Für ∆t → 0 folgt so
da ∆~rˆ senkrecht auf ~rˆ, also in Richtung von φ
d~rˆ
~ˆ .
= φ̇ φ
dt
Damit ergibt sich
d~rˆ
~ˆ .
~v = ~r˙ = ṙ ~rˆ + r
= ṙ ~rˆ + rφ̇ φ
dt
3.4. EIN TEILCHEN IN EINER DIMENSION
141
Die Koeffizienten der Geschwindigkeit in Polakoordinaten sind also vr = ṙ und
vφ = rφ̇ = rω mit der Winkelgeschwindigkeit ω. Die Ausdrücke für die Koeffizienten sind im Allgemeinen sicherlich komplizierter, als die für die Koeffizienten
in kartesischen Koordinaten ẋ1 und ẋ2 . In speziellen Situation z.B. wenn eine
Zwangskraft dafür sorgt, daß ṙ = 0 (siehe das Beispiel des Fadenpendels mit dem
wir gestartet sind), kann die Wahl von Polarkoordinaten trotzdem von Vorteil bei
der Lösung des mechanischen Problems sein. Um unser Ziel zu erreichen müssen
wir erneut nach t differenzieren
i
d h ˆ
d~v
ˆ
¨
~
=
ṙ ~r + rφ̇ φ .
~r =
dt
dt
~ˆ nach der Zeit. Die Konstruktion dieser
Wir benötigen also die Ableitung von φ
ist in der folgenden Skizze dargestellt.
∆φ
φ(t2)
φ(t1)
φ(t1)
∆φ
φ(t2)
Analog zu den obigen Überlegungen folgt
~ˆ
dφ
= −φ̇ ~rˆ .
dt
Zusammengenommen erhalten wir somit
i
d h ˆ
~ˆ
ṙ ~r + rφ̇ φ
~r¨ =
dt
~ˆ
d~rˆ
dφ
ˆ
ˆ
ˆ
~
~
= r̈ ~r + ṙ
+ ṙφ̇ φ + rφ̈ φ + rφ̇
dt
dt
ˆ
2 ˆ
~.
= (r̈ − rφ̇ ) ~r + (rφ̈ + 2ṙφ̇) φ
Die Newtonsche Gleichung übersetzt sich dann zu
Fr = m(r̈ − rφ̇2 ) ,
Fφ = m(rφ̈ + 2ṙφ̇) .
Erneut ist dieser Ausdruck im Allgemeinen sicherlich sehr viel komplizierter als
sein Analogon in kartesischen Koordinaten. In dem wir jetzt zu unserem Bespiel
zurückkehren, werden wir jedoch sehen, daß die Formulierung in Polarkoordinaten
in speziellen Situationen von großem Vorteil sein kann.
142
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Im obigen Beispiel des Fadenpendels sind die auf die Masse wirkenden äußeren
~ = m~g und die Normalkraft N
~ . In Polarkoordinaten
Kräfte die Gewichtskraft G
geschrieben ist die Gesamtkraft
Fr = mg cos φ − N ,
Fφ = −mg sin φ .
Da aufgrund des Fadens ṙ = 0 gilt, vereinfacht sich die Newtonsche Gleichung zu
Fr = mg cos φ − N = −mRφ̇2 ,
Fφ = −mg sin φ = mRφ̈ .
Der Betrag der Normalkraft (Zwangskraft) N ist zum Verständnis der Bewegung
irrelevant. Zum Glück erhalten wir mit der zweiten Gleichung eine, in der N nicht
vorkommt. Wir können also wie folgt vorgehen: Wir bestimmen φ(t) mit Hilfe
der zweiten Gleichung. Bei Interesse können wir dann N durch Einsetzen von
φ(t) in die erste Gleichung und Auflösen nach N berechnen. Die für uns zunächst
relevante eindimensionale Bewegungsgleichung ist
g
φ̈ = − sin φ .
R
Für kleine Auslenkwinkel φ, können wir den Sinus in einer Taylorreihe um φ = 0
entwickeln (siehe Mathematikteil dieser Vorlesung) sin(φ) = φ + O(φ3 ) und bekommen das uns inzwischen wohlbekannte Problem des harmonischen Oszillators (lineare Kraft, quadratisches Potential). Gehen wir eine Ordnung weiter,
so bekommen wir das oben diskutierte Problem des Oszillators mit quartischer
Anharmonizität, da die Kraft die Form
1
Fφ ∼ −φ + φ3 + O(φ5 )
6
hat und damit das Potential einen quadratischen und einen quartischen Term
hat. Die obigen Ergebnisse können somit direkt auf den Fall des Fadenpendels
angewandt werden.
Dissipative Systeme: Das wesentliche Hilfsmittel zur Untersuchung der Bewegung in einem statischen Kraftfeld, welches nur vom Ort abhängt, war der Satz
von der Erhaltung der Energie. Für ein durch
mẍ + γ(x, ẋ)ẋ = F (x)
(3.11)
gegebenes dissipatives System gilt keine Energieerhaltung da (V bezeichnet das
zur konservativen Kraft F gehörige Potential),
dT
dV
dE
=
+
dt
dt
dt
= [mẍ − F (x)]ẋ
= −γ(x, ẋ)ẋ2
6
=
0,
3.4. EIN TEILCHEN IN EINER DIMENSION
143
wobei wir die Bewegungsgleichung verwendet haben. Integration liefert dann
Z t
γ(x(t0 ), ẋ(t0 )) [ẋ(t0 )]2 dt0 .
E(t) − E(t0 ) = −
t0
Periodische Lösungen kann es nur geben, wenn es Zeiten T gibt zu denen E(t0 +
T ) = E(t0 ) gilt. Um solch eine Situation zu erreichen, muß γ(x, ẋ) notwendigerweise Bereiche mit verschiedenen Vorzeichen haben, wie es z.B. im van der PolOszillator Gl. (3.1) der Fall ist. Die Bewegungsgleichung (3.11) ist im Allgemeinen
nicht mehr auf ein Integral zu reduzieren wie es bei konservativen Systemen der
Fall ist (siehe oben). Es wird sich als nützlich herausstellen, die Gleichung zweiter
Ordnung in ein System von Gleichungen erster Ordnung umzuschreiben, in dem
wir die Variable v = ẋ einführen
ẋ = v ,
v̇ = F̃ (x, v) ,
mit F̃ (x, v) = [F (x) − γ(x, v)v]/m. Dies ist ein System nicht-linearer (für allgemeine γ(x, v)) Differentialgleichungen erste Ordnung. Die Bahnkurven im Phasenraum lassen sich daher nur in Ausnahmefällen analytisch angeben. Man kann
sie jedoch geometrisch konstruieren.
Um diese Konstruktion zu verstehen betrachten wir zunächst ein allgemeines
System von Differentialgleichungen erster Ordnung für die Variablen x1 (t), x2 (t),
. . . , xn (t)
ẋi = fi (x1 (t), . . . , xn (t)) ,
i = 1, 2, . . . , n
mit hinreichend “harmlosen” Funktionen fi . Taylorentwicklung liefert
xi (t + ∆t) = xi (t) + ∆t ẋi (t) + O([∆t]2 )
= xi (t) + ∆t fi (x1 (t), . . . , xn (t)) + O([∆t]2 ) .
Das “Geschwindigkeitsfeld” f~(~x) zeigt somit an, wie die zeitlich Entwicklung in
einem infinitessimalen Zeitschritt weitergeht. Im obigen Fall von zwei gekoppelten Differentialgleichungen erster Ordnung kann man das “Geschwindigkeitsfeld”
(Vektorfeld) für die Variablen x und v
v
.
f~(x, v) =
F̃ (x, v)
leicht graphisch darstellen, wie wir es im Kapitel über Funktionen mehrerer
Veränderlicher kennen gelernt haben. Man kann das Verhalten der Phasenraumtrajektorie dann direkt ablesen, da diese in einem Punkt (x, v)T tagential zu
f~(x, v) ist. Ein Beipiel dazu ist in der folgenden Abbildung dargestellt.
144
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
2
v
–2
–1
1
0
1
x
2
–1
–2
Es zeigt das “Geschwindigkeitsfeld” der Phasenraumtrajektorie für das einfache
(konservative γ(x, v) = 0) Problem des harmonischen Oszillators (mit F (x) =
−mω02 x bzw. V (x) = mω02 x2 /2)
v
ẋ
=
v̇
−ω02 x
mit ω0 = 1.3 Es ist leicht zu erkennen, daß die Phasenraumtrajektorien in diesem
Fall Kreise (allgemeiner Ellipsen) sind.
Kehren wir noch einmal zum allgemeinen “Geschwindigkeitsfeld” f~(~x) zurück.
Oft gibt es ausgezeichnete Punkte ~x∗ für die
f~(~x∗ ) = 0
gilt, d.h. keine Bewegung im Phasenraum mehr auftritt. Man nennt diese Punkte
daher stationäre Punkte oder Fixpunkte. Wir werden später auf die Bewegung in
der Nähe solcher Punkte zurückkommen.
Zur allgemeinen Konstruktion der Phasenraumtrajektorien können wir auch
den Parameter Zeit eleminieren und v als Funktion von x betrachten. Die Funktion v(x) erfüllt die Differentialgleichung4
dv
F̃ (x, v)
=
,
dx
v
d.h. die “Steigung” der Phasenraumtrajektorie ist durch F̃ (x, v)/v gegeben. Man
betrachtet dann alle Punkte im Phasenraum mit der selben Steigung α
F̃ (x, v)
=α.
v
3
4
Wir vernachlässigen die physikalischen Einheiten.
Vorsicht falls v = 0 gilt!
3.4. EIN TEILCHEN IN EINER DIMENSION
145
Die entsprechenden Kurven bezeichnet man als Isoklinen. Betrachten wir dazu
das Beispiel des gedämpften harmonischen Oszillators mit der Bewegungsgleichung
mẍ = F (x, v) = −mω02 x − m2γv ,
d.h. γ(x, v) = m2γ ≥ 0, die wir bereits im Kapitel über Systeme linearer Differentialgleichungen untersucht haben. In diesem Fall ist
F̃ (x, v) = [F (x) − γ(x, v)v]/m = −ω02 x − 2γv
und die Isoklinen mit
ω 2 x + 2γv
F̃ (x, v)
=− 0
=α
v
v
sind eine Geradenschar
v=−
ω02
x.
α + 2γ
Die folgenden Abbildung zeigt das “Geschwindigkeitsfeld”
ẋ
v
=
v̇
−ω02 x − 2γv
für die Phasenraumtrajektorie für den Fall der schwach gedämpften Bewegung
mit5 γ/ω0 = 0.2 und ω0 = 1.
2
v
–2
1
–1
1
x
–1
–2
5
Wir vernachlässigen erneut die physikalischen Einheiten!
2
146
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Zusätzlich sind folgend die Isoklinen (für andere Parameter) sowie eine typische
Trajektorie dargestellt
α=−0.5
α=0
α=0.5
v
α=−1.5
α=−οο
x
Auf den Isoklinen ist die Steigung α als kleiner Strich angezeigt. Die Trajektorien
der schwach gedämpften Bewegung sind sogenannte logarithmische Spiralen die
spiralförmig in den Ursprung laufen.
Als komplexeres Beispiel diskutieren wir kurz die Phasenraumtrajektorien des
Van der Pol-Oszillators Gl. (3.1). Nach entsprechender Wahl der Konstanten m,
ω0 und a ist die Bewegungsgleichung von der Form
ẍ + (x2 − 1)ẋ + x = 0 .
Wir betrachten den Fall > 0 (für = 0 geht das System in den harmonischen
Oszillator über). Das “Geschwindigkeitsfeld” der Phasenraumtrajektorie ist für
ein festes > 0 in der folgenden Skizze dargestellt (wobei hier x1 = x und
x01 = ẋ).6
6
Die Abbildung ist mit dem Programmpaket zur nicht-linearen Dynamik erstellt, welches
Herr Maximilian Lohöfer im Rahmen seiner Bachelorarbeit geschrieben hat und welches sie im
L2 P herunterladen können.
3.4. EIN TEILCHEN IN EINER DIMENSION
147
Die Phasenraumkurve, der sich die Trajektorie offensichtlich schon nach kurzer Zeit annähert und entlang der sich das System dann weiter bewegt nennt
man einen Grenzzyklus (oder Attraktor). Nach Aussterben der vom Anfangspunkt
abhängigen Transienten, geht der van der Pol-Oszillator für große Zeiten in eine
periodische Bewegung über. Die dämpfende und verstärkende Wirkung der “Reibung” halten sich die Waage. Auf dem Grenzzyklus ist die Energie des Systems im
Mittel erhalten, bzw. periodisch (siehe Seite 142). Für den van der Pool-Oszillator
hängt die Form des Grenzzyklus im Phasenraum vom Parameter ab nicht jedoch von den Anfangswerten. Für kleine hat der Grenzzyklus “fast” die Form
wie die Trajektorien des harmonischen Oszillators (in der obigen Abbildung ist
= 5 gewählt, also ist dort nicht klein). In diesem Limes lassen sich analytische Resultate für die Bewegung gewinnen. Alle diese Aspekte der Dynamik kann
man den folgenden Abblidungen für = 0.5 bzw. 5 entnehmen. Zusätztlich sind
Phasenraumtrajektorien und die Funktionen x(t), ẋ(t) für verschiedene Anfangspunkte und dargestellt. Kurven unterschiedlicher Farbe entsprechen Situationen
148
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
mit unterschiedlichen Anfangsbedingungen (diese können aus dem Phasenraumdiagramm direkt abgelesen werden). An x(t) und ẋ(t) erkennt man sehr deutlich,
daß die im Limes großer Zeiten periodische Bewegung (Grenzzyklus!) für “große”
hochgeradig nicht-harmonisch ist (keine Sinusschwingung!). Um die Bewegung
genauer zu analysieren könnte man das für hinreichend große t periodische x(t)
(numerisch) in einer Fourierreihe entwickeln (Spektralanalyse).
• = 0.5
3.4. EIN TEILCHEN IN EINER DIMENSION
149
• =5
Bisher haben wir Bewegungsgleichungen vom Typ mẍ = F (x, ẋ) untersucht,
die als System von Differentialgleichungen erster Ordnung mit zeitunabhängigem
“Geschwindigkeitsfeld” geschrieben werden können. Man bezeichnet solche als
autonome Differentialgleichungssysteme (und die diesen Gleichungen zugrundeliegenden mechanischen Systeme als autonome Systeme). Im Folgenden werden
wir Systeme untersuchen, in denen die Kraft von der Zeit abhängt und somit
F (x, ẋ) → F (x, ẋ, t).
Zeitabhängige Kräfte: Ein typisches interessantes Beispiel für ein System mit
zeitabhängiger Kraft–ein getriebenes System–ist das gedämpfte (γ > 0), getrie-
150
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
bene Fadenpendel mit der Bewegungsgleichung für den Auslenkwinkel φ
φ̈ + 2γ φ̇ +
g
sin φ = h0 cos (ωt) ,
R
d.h. F (φ, φ̇, t)/m = −2γ φ̇ − (g/R) sin φ + h0 cos (ωt).
Wie wir sehen werden führt die Erweiterung auf zeitabhängige Kräfte zu völlig
neue Phänomene. So kann in Situationen, in dem das “Geschwindigkeitsfeld” der
Trajektorien nicht-linear von den Variablen abhängt sogenanntes chaotisches Verhalten der Lösung auftreten. Bevor wir dazu kommen, wollen wir uns jedoch mit
der einfacheren Situation des gedämpften, getriebenen harmonischen Oszillators
(lineare Abhängigkeit von den Variablen) beschäftigen, dessen Dynamik für eine
cosinusförmige treibende Kraft sie bereits in einer Übungsaufgabe untersucht haben.
Der gedämpfte, getriebene, harmonische Oszillator: Auf einen gedämpften, harmonischen Oszillator wirke eine zeitabhängige äußere Kraft h(x, ẋ, t). Die
Bewegungsgleichung ist durch (γ ≥ 0)
ẍ + 2γ ẋ + ω02 x = h(x, ẋ, t)
gegeben. Anhand einiger Spezialfälle wollen wir eine Reihe physikalischer Phänomene diskutieren.
Dazu betrachten wir den häufig untersuchten Fall einer cosinusförmigen treibenden Kraft h(x, ẋ, t) = h0 cos (ωt + ϕ0 ), mit den Konstanten ω > 0 und ϕ0 .
Für den reibungsfreien Fall γ = 0 gilt dann (ω0 > 0)
ẍ + ω02 x = h0 cos (ωt + ϕ0 ) .
Dies ist eine lineare, inhomogene Differentialgleichung zweiter Ordnung. Die allgemeine Lösung dieser Gleichung läßt sich als Summe der allgemeinen Lösung
der homogenen Gleichung und einer speziellen (partikulären) Lösung der inhomogenen Gleichung schreiben. Die allgemeine Lösung der homogenen Gleichung
ist (zwei freie Konstanten für die zwei Anfangsbedingungen)
xh (t) = c1 cos (ω0 t) + c2 sin (ω0 t) .
Für ω 6= ω0 liefert xp (t) = x0 cos (ωt + ϕ0 ) eine Lösung der inhomogenen Differentialgleichung, wobei x0 = h0 /(ω02 − ω 2 ) gelten muß. Die allgemeine Lösung der
inhomogenen Gleichung lautet somit für ω 6= ω0 (zwei freie Konstanten für die
zwei Anfangsbedingungen)
x(t) = c1 cos (ω0 t) + c2 sin (ω0 t) +
ω02
h0
cos (ωt + ϕ0 ) ,
− ω2
3.4. EIN TEILCHEN IN EINER DIMENSION
151
und stellt eine Überlagerung zweier periodischer Bewegungen mit verschiedenen
Frequenzen dar. Für ω dicht bei der Kreisfrequenz ω0 der freien (h0 = 0) Schwingung wird die Amplitude des dritten Summanden groß. Die folgenden Abbildungen zeigen typische Kurven x(t) mit7 c1 = 1, c2 = 0 = ϕ0 , h0 = 0.1 (durchgezogen) und h0 = 0.5 (gestrichelt) für zwei verschiedene treibende Frequenzen
ω = 1/2 (kommensurabel zu ω0 = 1) und ω = 1/π (inkommensurabel).
ω=1/2
2
ω=1/π
2
1
x
x
1
0
0
-1
-1
0
50
100
t
150
200
-2
0
50
100
t
150
200
Der Fall, daß die treibende periodische Bewegung resonant zur freien Oszillation ist, also ω = ω0 gilt, muß getrennt behandelt werden. Für diesen liefert der
Ansatz xp (t) = x0 t sin (ω0 t + ϕ0 ) eine Lösung der inhomogenen Differentialgleichung, falls x0 = h0 /(2ω0 ) gewählt wird. Die getriebene harmonische Schwingung
ist somit im Resonanzfall durch (zwei freie Konstanten für die zwei Anfangsbedingungen)
x(t) = c1 cos (ω0 t) + c2 sin (ω0 t) +
h0
t sin (ω0 t + ϕ0 ) ,
2ω0
gegeben und die Auslenkung wächst linear mit der Zeit an.8 Liegt, wie hier betrachtet, keinen Dämpfung (Reibung) vor kann es so zur so genannten Resonanzkatastrophe kommen.
In einer Übungsaufgabe haben sie die Bewegungsgleichung für den gedämpften, getriebenen, harmonischen Oszillator mit der cosinusförmigen äußeren Kraft
h0 cos (ωt)
ẍ + 2γ ẋ + ω02 x = h0 cos (ωt)
untersucht. Für den Fall schwacher Dämpfung 0 < γ ω0 haben sie die allge7
Wir vernachlässigen die physikalischen Einheiten.
Mit Hilfe der l’Hospitalschen Regel läßt sich der Resonanzfall auch direkt aus der Lösung für
|ω| =
6 |ω0 | extrahieren. Diese Vorgehensweise geht jedoch über die hier zur Verfügung gestellten
mathematischen Methoden hinaus.
8
152
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
meine Lösung
h0
cos (ωt − δ)(3.12)
x(t) = e−γt [c1 cos (ω0 t) + c2 sin (ω0 t)] + p 2
(ω0 − ω 2 )2 + 4γ 2 ω 2
mit
δ = arctan
2γω
− ω2
ω02
bestimmt. In der gegebenen Form enthält die Lösung noch eine kleine Inkonsistenz, da wir in der Lösung der homogenen Gleichung konsequent Terme der
Ordnung (γ/ω0 )2 vernachlässigt haben (Grenzfall schwacher Dämpfung), nicht
jedoch in der Lösung der inhomogenen Gleichung. Diese läßt sich leicht korrigieren, in dem man in der Gleichung für die Eigenwerte (2.49) nicht
pnach γ/ω0
entwickelt. Man erhält dann erneut Gl. (3.12) jedoch mit ω0 → ω̃0 = ω02 − γ 2 in
den Argumenten der Cosinus- und Sinusfunktion der ersten beiden Summanden.
Durch die Dämpfung wird die Eigenfrequenz der freien Oszillation reduziert (die
Periodendauer wird verlängert). Das war intuitiv zu erwarten, da die Reibung die
Bewegung hemmt.
Die Dämpfung führt dazu, daß die Resonanz “ausgeschmiert” wird und die
Amplitude des letzten Terms auch für ω0 = ω nicht mehr unbeschränkt mit der
Zeit anwächst. Als Funktion der Kreisfrequenz der treibenden Kraft ω ist diese Amplitude eine “scharf” um ω0 herum zentrierte Funktion. Für ω/ω0 1
fällt sie wie ω −2 ab. Für Zeiten t γ −1 können die ersten beiden Terme vernachlässigt werden und die Masse schwingt mit der Kreisfrequenz der treibenden Kraft. Im Phasenraum gehen die Trajektorien für große t gegen einen ellipsenförmigen Grenzzyklus. Für kleinere Zeiten findet man transientes Verhalten
in Form eines Einschwingvorgangs.
Zur Vorbereitung auf spätere Überlegungen wollen wir die Amplitude der
Oszillation des schwach gedämpften (0 < γ ω0 ), getriebenen harmonischen
Oszillators nach Abklingen des Einschwingvorgangs
h0
A= p 2
(ω0 − ω 2 )2 + 4γ 2 ω 2
genauer betrachten. Dazu beschränken wir uns auf den Bereich in der Nähe der
Resonanz mit ω ≈ ω0 . In diesem Fall gilt für das Amplitudenquadrat
h20
[(ω0 − ω)(ω0 + ω)]2 + 4γ 2 ω 2
h20
≈
[(ω0 − ω)2ω0 ]2 + 4γ 2 ω02
(h0 /[2ω0 ])2
=
,
(ω0 − ω)2 + γ 2
A2 =
(3.13)
3.4. EIN TEILCHEN IN EINER DIMENSION
153
was als Funktion von ω eine Lorentzkurve um ω0 darstellt.
Die folgende Abbildung zeigt den typischen zeitlichen Verlauf von x(t) des
schwach gedämpften, getriebenen harmonischen Oszillators für9 ω0 = 1, γ = 0.1,
c1 = 1, c2 = 0, h0 = 0.2 und ω = 1/π (weg von der Resonanz!).
ω=1/π
1
x
0.5
0
-0.5
0
20
40
60
80
100
t
Noch einmal anharmonische Schwingungen: In unseren bisherigen Überlegungen zu anharmonischen Schwingungen, sind wir auf die Details der Bewegung
(volle Zeitabhängigkeit) noch nicht eingegangen. Bevor wir daher zu getriebenen,
anharmonischen Schwingungen kommen, wollen wir dies teilweise nachholen. Der
Grund dafür, daß wir die Diskussion bis zu diesem Punkt verschoben haben,
liegt darin, daß uns in der Analyse Differentialgleichungen begegnen werden, die
mit dem, was wir im Abschnitt über den gedämpften, getriebenen, harmonischen
Oszillator kennen gelernt haben, sehr einfach zu lösen sind. Wir betrachten also den Fall, daß die “Zusatzkraft” h(x, ẋ, t) zeitunabhängig ist und die Form
h(x) = f (x)/m hat, d.h. die Differentialgleichung ẍ + ω0 x = f (x)/m. Weiterhin sei die Zusatzkraft “klein”, d.h. es gelte 0 < 1. Wir untersuchen somit
erneut die ungedämpfte Bewegung eines Teilchens in einem Potential, das im Bereich kleiner |x| nur schwach vom harmonischen Potential abweicht und dessen
Gesamtenergie (konservatives System, die Gesamtenergie ist erhalten!) nur leicht
oberhalb des Minimums des Potentials bei x = 0 liegt. Aus unseren obigen Überlegungen ist klar, daß das Teilchen eine periodische Bewegung ausführen wird,
diese im Allgemeinen jedoch nur durch numerische Integration zu gewinnen ist.
Hier werden wir anders vorgehen und versuchen eine Lösung als Potenzreihe in 9
Die physikalischen Einheiten werden vernachlässigt.
154
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
zu konstruieren (0 < 1)
x(t) = x0 (t) + x1 (t) + 2 x2 (t) + . . . ,
mit zu bestimmennden Funktionen xi (t), i = 0, 1, 2, . . .. Dieses Vorgehen bezeichnet man als Störungstheorie. Verfahren dieser Art spielen in allen Teilbereichen
der Physik eine extrem wichtige Rolle. Wir wollen die Prozedur anhand des konkreten Beispiels mit quartischem Zusatzterm zum Potential bx4 /4 (bzw. kubischer Zusatzkraft −bx3 ) einführen. Dabei kann b positive oder negative Werte
annehmen, wobei letzteres der Fall ist, wenn das Fadenpendel bei kleinen Auslekungen betrachtet wird. Einsetzen der Potenzreihenentwicklung in die Bewegungsgleichung ẍ + ω02 x = −bx3 /m liefert
(ẍ0 + ω02 x0 ) + (ẍ1 + ω02 x1 ) + . . . = −
b 3
x + ... ,
m 0
wobei die Punkte für Terme stehen, die mindestens von der Größenordnung 2
sind. Man kann jetzt die Terme zu gleichen Potenzen in gleich setzen (Koeffizientenvergleich; siehe Mathematikteil) und erhält bis zur Ordnung ẍ0 + ω02 x0 = 0
ẍ1 + ω02 x1 = −
b 3
x .
m 0
Um beispielsweise das Anfangswertproblem mit x(0) = A, ẋ(0) = 0 zu lösen,
berechnet man zunächst x0 (t) aus der ersten Gleichung und dann x1 (t) mit Hilfe
der zweiten. Für die vorgegebenen speziellen Anfangsbedingungen gilt
x0 (t) = A cos (ω0 t) .
Wegen cos3 y = [cos (3y) + 3 cos y]/4 folgt als Gleichung für x1 (t)
ẍ1 + ω02 x1 = −
A3 b
[cos (3ω0 t) + 3 cos (ω0 t)] .
4m
Sie ist von dem Typ, der bei der Lösung der getriebenen harmonischen Bewegung
auftritt, hier jedoch mit zwei cosinusförmigen Inhomogenitäten. Mit der oben
diskutierten allgemeinen Lösung und den Anfangsbedingungen x1 (0) = 0, ẋ1 (0) =
0 (“echte” Anfangsbedingungen sind schon durch x0 (0) und ẋ0 (0) realisiert) folgt
x1 (t) =
3A3 b
A3 b
[cos
(3ω
t)
−
cos
(ω
t)]
−
t sin (ω0 t) .
0
0
32mω02
8mω0
Durch die “resonante” Inhomogenität ∼ cos (ω0 t) ist dabei der mit der Zeit linear anwachsende Term (sogenannter säkularer, d.h. nicht-periodischer Term)
entstanden. Das Auftreten dieses Terms steht im Widerspruch zu dem Ergebnis, daß die durch x(t) = x0 (t) + x1 (t) + . . . beschriebene Bewegung periodisch
3.4. EIN TEILCHEN IN EINER DIMENSION
155
sein muß. Historisch trat ein ähnliches Problem in der Himmelsmechanik auf, als
man versuchte kleine Korrekturen zu den Planetenbahnen zu berechnen. Man
könnte damit geneigt sein, das vorgeschlagene Vorgehen (Störungstheorie) als
unbrauchbar zu verwerfen. Es ist jedoch leicht zu verstehen, wie es zu dem in t
linearen Term kommt und es gibt eine etablierte Prozedur sein Auftreten zu verhindern. Der Grund für das Auftreten des säkularen Terms ist die Verschiebung
der Kreisfrequenz der periodischen Bewegung Gl. (3.10) durch die Zusatzkraft,
die ebenfalls von der Ordnung ist. Man kann sein Auftreten verhindern, in dem
man vor der Analyse eine Skalentransformation ausführt, d.h. von der Variablen
t zu u = νt, mit der noch zu bestimmenden Kreisfrequenz ν übergeht. Diese wird
die Bedeutung der exakten Schwingungsfrequenz annehmen. Wir betrachten also
die Funktion
g(u) = g(νt) = x(t) ,
die wegen (Kettenregel; Strich bedeutet Ableitung nach u)
ẋ(t) = g 0 (u)
du
= ν g 0 (u) , ẍ(t) = ν 2 g 00 (u)
dt
der Differentialgleichung (mit allgemeiner Zusatzkraft f )
ν 2 g 00 (u) + ω02 g(u) = f (g(u))/m
genügt. Wie zuvor entwickelt man g(u) in einer Potenzreihe in g(u) = g0 (u) + g1 (u) + 2 g2 (u) + . . .
und zusätzlich auch ν
ν = ω0 + ν1 + 2 ν2 + . . . ,
wobei wir bereits ausgenutzt haben, daß zu nullter Ordnung in , ν = ω0 gilt.
Entwickelt man g und ν bis zur Ordnung erhält man nach Einsetzen der Entwicklungen in die Bewegungsgleichung für g(u)
(ω02 + 2ω0 ν1 )(g000 + g100 ) + ω02 (g0 + g1 ) = f (g0 )/m .
Koeffizientenvergleich liefert dann für unser konkretes Beispiel der kubischen Zusatzkraft
ω02 (g000 + g0 ) = 0
ω02 (g100 + g1 ) + 2ω0 ν1 g000 = −
b 3
g .
m 0
Unter Berücksichtigung der obigen Anfangsbedingungen folgt für g0 (u) die Lösung
g0 (u) = A cos u .
156
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Eingesetz in die zweite Gleichung ergibt sich
3A3 b
A3 b
2 00
ω0 (g1 + g1 ) = 2ω0 ν1 A −
cos u −
cos (3u) .
4m
4m
Der “resonannte” Summand ∼ cos u würde nun erneut zu einem säkularen Term
führen, den wir jedoch durch die geeignete Wahl von ν1 unterdrücken können.
Wir wählen daher
2ω0 ν1 A −
3A2 b
3A3 b
= 0 ⇒ ν1 =
.
4m
8mω0
Die verbleibenden Gleichung lösen wir wie zuvor und erhalten
g1 (u) =
A3 b
[cos (3u) − cos u] .
32mω02
Zusammengenommen erhalten wir ausgedrückt durch die Variable t bis zur Ordnung A3 b
3A2 b
A2 b
cos (νt) + cos (3νt) ; ν = ω0 1 + .
x(t) = A 1 − 32mω02
32mω02
8mω02
Die Bewegung ist jetzt periodisch, wie es zu fordern war. Dabei tritt die Grundfrequenz ν aber auch die höhere Harmonische 3ν auf. Die Verschiebung der Kreisfrequenz zur Ordnung ist identisch zu der in Gl. (3.10) bestimmten wenn man die
lineare Kraft über die Wahl c = mω02 gleich wählt und für die kubische Kraft über
b = 4χ. Die Abschätzung des Fehlers, den man bei der obigen Prozedur macht
stellt sich als erstaunlich komplex heraus und wir wollen diese Frage hier nicht
weiter untersuchen. Wir nehmen den pragmatischen Standpunkt ein, daß der
Vergleich der numerische Lösung der vollen Bewegungsgleichung mit kubischer
Zusatzkraft mit der obigen Näherung sich für kleine als sehr gut herausstellt
und wir mit der Näherung daher eine gute analytische Approximation gefunden
haben.
Wir gehen nun zur Bewegung mit nicht-linearer “Rückstellkraft”, Dämpfung
und cosinusförmigen treibenen Kraft über.
Resonanz in gedämpften, getriebenen, nicht-linearen Systemen: Die
Physik der gedämpftem, getriebenen, nicht-linearen mechanischen Systeme ist
sehr reichhaltig. Wir werden zunächst von einer allgemeinen Perspektive aus das
Phänomen der Resonanz in nicht-linearen Systemen betrachten. Wir hatten gesehen, daß das Amplitudenquadrat der schwach gedämpften, cosinusförmig getriebenen harmonischen Oszillation nach dem Einschwingvorgang und für ω ≈ ω0
näherungsweise durch (siehe Gl. (3.13); f = h0 /[2ω0 ])
A2 ≈
f2
(ω − ω0 )2 + γ 2
3.4. EIN TEILCHEN IN EINER DIMENSION
157
gegeben ist. Weiterhin haben wir uns davon überzeugt, daß bei Vorliegen einer
Anharmonizität die Frequenz der Bewegung von der Amplitude der Auslenkung
abängt und sich im Spezialfall einer “kleinen” (führende Ordnung) kubischen
“Zusatzkraft” gemäß (siehe Gl. (3.10))
ω0 → ω0 + κA2
verschiebt, wobei κ positive und negative Werte annehmen kann. Um ein Verständnis von Resonanz bei nicht-linearen Systemen zu erhalten machen wir die intuitive
Näherung
A2 =
f2
,
(ω − ω0 − κA2 )2 + γ 2
in dem wir ω0 durch die neue amplitudenabhängige Resonanzfrequenz ersetzen.
Aus dieser impliziten Gleichung muß nun A2 (ω) bestimmt werden. Am Einfachsten geht das, in dem wir zunächst nach ω − ω0 aufösen
p
ω − ω0 = κA2 ± (f /A)2 − γ 2 .
Um reelle ω − ω0 zu erhalten muß A2 ≤ (f /γ)2 gelten, was bei hinreichend
schwacher Dämpfung (kleine γ) sicherlich erreicht werden kann. Man kann nun
ω−ω0 als Funktion von A2 zeichnen. Dazu führen wir die dimensionslosen Größen
x = (ω−ω0 )/γ, y = (Aγ/f )2 und η = f 2 κ/γ 3 ein, wodurch sich die darzustellende
Gleichung zu
p
x = ηy ± 1/y − 1
vereinfacht. Dabei ist η (über κ) ein Maß für die Nichtlinearität der Schwingung.
Die Gleichung ist in der folgenden Abbildung für drei Werte von η ≥ 0, η = 0 (gepunktet; harmonischer Oszillator), η = 1 (gestrichelt) und η = 4 (durchgezogen)
dargestellt.
158
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
C
1
B
0.8
y
0.6
0.4
D
0.2
A
0
-4
E
-2
0
x
2
4
Für eine hinreichend große Nichtlinearität gibt es einen Bereich mit drei Lösungen
für A(ω)2 (Bereich zwischen den vertikalen Linien). Anders ausgedrückt, gibt
es für treibende Frequenzen in diesem Bereich drei Grenzzyklen (Attraktoren).
Welcher erreicht wird, hängt von den Anfangswerten ab. Der Kurvenabschnitt
CD entspricht dabei einem instabilen Attraktor. Man kann das Auftreten zweier
stabiler Werte für die Amplitude auch als Abhängigkeit von der Vorgeschichte des
Systems verstehen. Wir betrachten dazu ein “Experiment” in dem die Frequenz
ω (d.h. x) der treibenden Kraft zeitlich langsam erhöht wird. Beginnt man beim
Punkt A, so wandert man über B zum Punkt C. Bei weiterer Erhöhung ändert
sich die Amplitude der Bewegung schlagartig und “fällt” auf den Punkt E. Von
dort an geht es auf der unteren Kurve weiter. In umgekehrte Richtung bleibt die
Amplitude bis zum Punkt D auf der unteren Kurve, springt dann zu B und nimmt
anschließend entlang der Kurve von B nach A ab. In der Vorlesung wird eine
Simulation gezeigt,10 die das Beschriebene für den ersten Pfad (beginnend bei A)
verdeutlicht. Verglichen zu dem Verhalten im Fall der nicht-linearen Schwingung
ist das ebenfalls dargestellte Verhalten im cosinusförmig getriebenen, gedämpften,
harmonischen Oszillator recht langweilig. Ein in der Simulation (Programmpaket
von Herr Lohöfer; siehe L2 P) “gemessenes” Diagramm der Amplitude gegenüber
der Frequenz der treibenden Kraft ist folgend dargestellt. Es zeigt das aus unserer
analytischen Rechnung extrahierte Verhalten.
10
Zu finden ist diese unter
http://www.physik.uni-oldenburg.de/ftheorie/polley/VL/Animationen/Duffing.html.
Eine weitere Simulation dazu findet sich im Programmpaket von Herrn Lohöfer (siehe L2 P).
3.4. EIN TEILCHEN IN EINER DIMENSION
159
Es sei hier noch erwähnt, daß man den cosinusförmig getriebenen, gedämpften
Oszialltor mit kubischer “Zusatzkraft” (quartischer Anharmonizität im Potential)
als Duffing-Oszillator bezeichnet.
Hin zum Chaos: Um einen Eindruck von der Reichhaltigkeit nicht-linearer getriebener Systeme zu bekommen, betrachten wir abschließend das gedämpfte,
cosinusförmig getriebene Fadenpendel, dessen Auslenkwinkel der Bewegungsgleichung (siehe oben)
φ̈ + 2γ φ̇ +
g
sin φ = h0 cos (ωt) ,
R
folgt. Zunächst führen wir erneut eine Skalentransformation aus
θ(u) = θ(τ t) = φ(t) ,
woraus sich die Gleichung (Strich entspricht Ableitung nach u)
τ 2 θ00 + 2γτ θ0 +
g
sin θ = h0 cos (ωu/τ ) ,
R
ergibt. Durch die Wahl τ 2 = g/R folgt
θ00 + θ0 /q + sin θ = g̃ cos (ωD u) ,
wodurch wir einen der Parameter eleminiert haben. Dabei ist q = τ /(2γ) ein Maß
für die Reibung, wobei diese Abnimmt, wenn q zunimmt, g̃ = h0 /τ 2 ein Maß für
die Amplitude der treibenden Kraft und ωD = ω/τ ein Maß für deren Frequenz.
160
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Im Folgenden bezeichnen wir die skalierte Zeit wieder mit t und die dimensionlose
Amplitude der treibenden Kraft mit g (statt g̃).
Für allgemeinen Parameter kann man die Bahnkurve θ(u) und die Phasenraumtrajektorie nur noch durch numerische Integration bestimmen. Geschrieben
als ein System zweier Differentialgleichungen erster Ordnung gilt mit Ω = θ0
θ0 = Ω ,
Ω0 = −Ω/q − sin θ + g cos (ωD u) .
Im Folgenden beschränken wir uns auf die Situation mit ωD = 2/3 und q = 2.
Die Amplitude der treibenden Kraft g wird im Bereich um g = 1 herum gewählt.
Selbst unter diesen Einschränkungen zeigt sich bereits die Reichhaltigkeit der
Bewegungsformen der nicht-linearen, getriebenen Schwingungen. Für g / 1 wird
die Bewegung nach dem Einschwingvorgang periodisch mit einer durch ωD gegebenen Frequenz. Im Phasenraum laufen alle Trajektorien auf einen geschlossenen
Grenzzyklus. In den folgenden Abbildungen (g = 0.9) ist einerseits der Winkel θ
als Funktion der Zeit t und andererseits eine Phasenraumtrajektorie dargestellt.
Bei beiden Graphen ist die Anfangszeit ta bei der die Darstellung beginnt so
gewählt, daß alle Einschwingvorgänge bereits abgeschlossen sind, d.h. eine periodische Bewegung (Grenzzyklus im Phasenraum) erreicht ist. Die Lösung der
Differentialgleichung beginnt bei t = 0 mit den Anfangsbedingungen θ = 0 = θ0 .
Für etwas größere g ist die Bewegung nach Aussterben der Transienten weiterhin
periodisch, jedoch mit einer Periode, die doppelt so groß ist wie die der treibenden
Kraft. Diese Situation ist in den folgenden Abbildung (g = 1.07) dargestellt
(Winkel als Funktion der Zeit und Phasenraumtrajektorien nach Abklingen der
Transienten; Anfangsbedingungen wie oben).
3.4. EIN TEILCHEN IN EINER DIMENSION
161
Die Periodenverdopplung ist in der Amplitude der Auslenkung (abwechselnde maximale Auslenkung) zu erkennen. Um diese besser herauszuarbeiten, führen wir
eine neue Darstellungsform der Bewegung ein, den Poincaré-Schnitt. Bei diesem
erstellt man ein stroboskopisches Bild der Phasenraumtrajektorie. Sinnvollerweise
wählt man in unserem Beispiel T = 2π/ωD als Zeitabstand zwischen zwei Bildern.
Im ersten Fall der periodischen Bewegung mit Frequenz ωD (nach Abklingen der
Transienten) fallen alle Bilder aufeinander und der Poincaré-Schnitt besteht aus
einem Punkt. Nach der Periodenverdopplung besteht er aus zwei Punkten. Dies
ist in den folgenden Abbildungen für die obigen g gegenüber gestellt. Im Winkel
wurde dabei modulo 2π gerechnet, d.h. alles auf Intervall (−π, π] zurückgefaltet.
Vergrößert man g weiter (genauer 1.085 < g < 1.11), so geht die Bewegung
in ein Regime über, welches man als chaotisch bezeichnet. Die Zeitabhängigkeit
162
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
des Winkels sieht in diesem Fall erratisch aus, die Phasenraumtrajektorien (auf
(−π, π] zurückgefaltet) sind komplex und der Poincaré-Schnitt besteht aus unendlich vielen Punkten und ist selbstähnlich. Letzteres bedeutet, daß ein vergrößerter
Teilausschnitt der Struktur, der ursprünglichen ähnlich sieht. Die Punktmenge
nennt man ein Fraktal. Die folgenden Abbildungen zeigen die diskutierten Punkte für g = 1.15 (wo das System ebenfalls chaotisch ist).
Wenn man g weiter erhöht, treten abwechselnd periodische und chaotische Bereiche auf. In den periodischen Bereichen gibt es neben den Periodenverdoppelungen auch Periodenvervierfachungen. Der Poincaré-Schnitt für solch eine Situation
(g = 1.47) ist in der folgenden Abblidung dargestellt.
3.5. KRUMMLINIGE KOORDINATEN
163
Für g > 1.497 gibt es nur noch chaotische Bewegungen. Alle obigen Abbildungen
wurden mit dem Programmpaket von Herrn Lohöfer (siehe L2 P) erstellt.
In der Vorlesung wird das gerade diskutierte zusätzlich anhand von Simulationen zur Bewegung des gedämpften, getriebenen Fadenpendels veranschaulicht.
Diese kann man ebenfalls mit dem Programmpaket von Herrn Lohöfer erstellen.
Es bietet sich an, mit diesem “herumzuspielen”, um die Reichhaltigkeit der Dynamik der hier besprochenen nicht-linearen Systeme besser zu verinnerlichen.
Nach diesem Ausflug in moderne Aspekte der klassischen Mechanik (nichtlineare Systeme, Chaos-Theorie) wollen wir zu konventionellerem Stoff einer Mechanikvorlesung zurückkehren und gehen zu zweidimensionalen Bewegungen eines
Teilchens über.
3.5
Krummlinige Koordinaten
Schon anhand des (scheinbar) einfachen Falls der eindimensionalen Bewegung
eines Teilchens in einem konservativen Kraftfeld haben wir gesehen, daß sich
die Newtonsche Gleichung meist nur numerische lösen läßt. Betrachtet man die
Bewegung eines Teilchens welches einer konservativen Kraft ausgesetzt ist in zwei
Dimensionen, so verschärft sich diese Problematik weiter. Die zwei gekoppelten
Differentialgleichungen zweiter Ordnung, bzw. das äquivalente System von vier
Gleichungen erster Ordnung, lassen sich für ein allgemeines Potential V (x1 , x2 )
nur numerisch lösen. Eine geschlossene analytische Lösung gelingt in dem Fall,
daß V eine quadratische Form
V (x1 , x2 ) =
2
1 X
xi ai,j xj
2 i,j=1
164
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
ist, eine Situation, die uns an den harmonischen Oszillator in einer Dimension
erinnert. Wir werden darauf später zurück kommen.
Ein weitere Klasse von Kräften, für die die Bewegungsgleichungen auf einfache Integrale reduziert werden kann (d.h. die geschlossen
integrierbar sind),
p
2
2
sind Zentralfelder, in denen V nur von r = |~r| = x1 + x2 abhängt. In diesem
Fall ist die Verwendung kartesischer Koodinaten umständlich. Es ist besser ebene
Polarkoordinaten
x1 = r cos φ ,
x2 = r sin φ
zu verwenden, die uns bereits im Beispiel des Fadenpendels begegnet sind. Weiterhin haben sie in einer Übungsaufgabe dreidimensionale Kugelkoordinaten kennen gelernt. Aufbauend darauf wollen wir hier gleich etwas allgemeiner vorgehen
und führen sogenannte krummlinige Koordinaten für zwei- oder dreidimensionale
Räume ein. Diese werden sich häufig als sehr nützlich bei der Lösung mechanischer Probleme erweisen und ermöglichen es uns einen ersten Kontakt zum
Lagrange Formalismus herzustellen.
Ausgangspunkt ist unser kartesisches Koordinatensystem [0; ~e1 , . . . , ~ed ] mit
(d = 2, 3)
~r =
d
X
xi~ei .
i=1
Die eindimensionalen geometrischen Objekte die entstehen, wenn man eine der
Koordinaten xi variiert, während die anderen festgehalten werden sind Geraden
(“xi -Kurven”). Zeichnet man solche Geraden in einem festen Abstand ∆xi so
entsteht ein Koordinatennetz. Dies ist für d = 2 in der folgenden Abbildung
dargestellt.
x2
e2
e1
x1
Alternativ können wir den Raum mit einem Netz krummliniger Koordinaten
überziehen, die wir allgemein mit qi (i = 1, 2 bzw. i = 1, 2, 3) bezeichnen. Die
3.5. KRUMMLINIGE KOORDINATEN
165
“geraden xi -Kurven” werden dann durch qi -Kurven ersetzt. Für den Fall der ebenen Polarkoordinaten (q1 = r, q2 = φ) ist dies in der folgenden Skizze dargestellt.
x2
x1
Die r-Kurven (entlang derer φ konstant ist) sind Geraden die durch den Ursprung
gehen und die φ-Kurven (entlang derer r konstant ist) konzentrische Kreise um
den Ursprung.
Das krummlinige Koordinatensystem ist durch die Vorgabe der Funktionen
(hier d = 3)
xi = xi (q1 , q2 , q3 ) ,
i = 1, 2, 3
bzw. der Umkehrfunktionen
qi = qi (x1 , x2 , x3 ) ,
i = 1, 2, 3
1 ,x2 ,x3 )
höchstens
gegeben, wobei wir annehmen, daß die Funktionaldeterminante ∂(x
∂(q1 ,q2 .q3 )
in speziellen Punkten Null werden kann (bei Polar- und Kugelkoordinaten z.B. im
Ursprung). Damit ist die (lokale) Umkehrbarkeit bis auf diese Punkte gesichert
(siehe Mathematikteil).
In einem gegebenen Punkt P (durch (x1 , x2 , x3 ) oder (q1 , q2 , q3 ) festgelegt)
definieren wir nun Basisvektoren ~gi (P ) mittels
~gi (P ) =
∂~r
,
∂qi
(3.14)
die die qi -Kurven im Punkt P tangieren. Zu jedem Punkt P (q1 , q2 , q3 ) gehört
somit ein “Vektordreibein” ~gi (q1 , q2 , q3 ), welches die qi -Koordinatenkurven tangiert. Die so definierten ortsabhängigen Basissysteme sind im Allgemeinen nicht
orthonormiert!
166
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Wir wollen uns diese Konstruktion anhand des Beispiels der ebenen Polarkoordinaten verdeutlichen. Es gilt
∂
∂~r
=
(r cos φ ~e1 + r sin φ~e2 )
∂r
∂r
= cos φ ~e1 + sin φ ~e2 = ~r/r
= ~rˆ ,
∂~r
∂
=
=
(r cos φ ~e1 + r sin φ ~e2 )
∂φ
∂φ
= −r sin φ ~e1 + r cos φ ~e2 = r [cos (φ + π/2) ~e1 + sin (φ + π/2) ~e2 ]
~ˆ ,
= rφ
~g1 =
~g2
~ˆ (siehe Abschnitt
wobei wir die beiden orthonormierten Einheitsvektoren ~rˆ und φ
über das Fadenpendel) eingesetzt haben und ausgenutzt haben, daß
~ˆ = cos (φ + π/2) ~e1 + sin (φ + π/2) ~e2 .
φ
Wie man nun sieht, sind ~g1 und ~g2 im vorliegenden Beispiel zwar noch orthogonal,
~ˆ nicht auf Eins normiert.
aber g2 ist im Gegensatz zu φ
Als nächstes wollen wir die Frage beantworten, ob es sich bei den ~gi allgemein
um linear unabhängige Vektoren handelt und sie damit überhaupt eine Basis
bilden. Für den Fall der ebenen Polarkoordinaten haben wir uns bereits davon
überzeugt (die ~gi stehen in diesem Beispiel senkrecht aufeinander). Allgemein
betrachten wir dazu
d
d
X
∂~r
∂ X
∂xj
~gi =
=
xj ~ej =
~ej
∂qi
∂qi j=1
∂qi
j=1
und können schließen, daß die Basisvekoren genau dann linear unabhängig sind,
wenn die Funktionaldeterminante von Null verschieden ist, was wir (bis auf spezielle Punkte) angenommen haben. Um die Umkehrrelation (Entwicklung von ~ei
nach den ~gj ) zu bestimmen betrachten wir
d
d
X ∂~r ∂qj
X ∂qj
∂~r
=
=
~gj .
~ei =
∂xi
∂qj ∂xi
∂xi
j=1
j=1
In ihr tritt somit die Inverse der Matrix mit den Matrixelementen ∂qj /∂xi auf.
Wie man leicht nachrechnet, ergeben sich für Kugelkoordinaten mit
x1 = r sin θ cos φ ,
x2 = r sin θ sin φ ,
x3 = r cos θ
3.5. KRUMMLINIGE KOORDINATEN
167
die zwar paarweise senkrechten aber nicht auf Eins normierten Basisvektoren
~g1 = ~gr = sin θ cos φ ~e1 + sin θ sin φ ~e2 + cos θ ~e3 = ~er ,
~g2 = ~gθ = r cos θ cos φ ~e1 + r cos θ sin φ ~e2 − r sin θ ~e3 = r~eθ ,
~g3 = ~gφ = −r sin θ sin φ ~e1 + r sin θ cos φ ~e2 = r sin θ ~eφ ,
wobei wir die orthonormierten Vektoren ~er , ~eθ , ~eφ eingeführt haben, die sie in
einer Übungsaufgabe kennen gelernt haben (selbe Notation). Um die Länge der
Basisvekoren und deren paarweise Winkel zu bestimmen betrachten wir die Skalarprodukte
gi,j
d
d
X
X
∂xl
∂xk ∂xk
∂xk
~ek ·
~el =
.
= ~gi · ~gj =
∂q
∂q
∂q
i
j
i ∂qj
k=1
k,l=1
Man nennt die Matrix G mit den Matrixelementen gi,j den Metriktensor. Dieser
wird in späteren Überlegungen eine wichtige Rolle spielen.
Unsere Überlegungen zu krummlinigen Koordinaten wollen wir dazu benutzen eine alternative Formulierung der Newtonschen Gleichung zu finden. Wir
wollen dazu zunächst den Geschwindigkeitsvektor ~v (t) = ~r˙ (t) durch die q̇i und ~gi
ausdrücken. Dazu betrachten wir
d
d
X
X
∂~r
q̇i =
q̇i ~gi .
~v (t) =
∂qi
i=1
i=1
Betrachtet man ~v nun als Funktion der qi und q̇i so folgt
∂~v
= ~gi ,
∂ q̇i
(3.15)
ein Ergebnis, welches wir gleich benutzen werden. Wir betrachten die Newtonsche Gleichung für ein Teilchen p~˙ = F~ . Um aus dieser die Gleichungen für die
kartesischen Koordinaten x1 , x2 , x3 zu erhalten, können wir sie mit ~ei skalar multiplizieren. Um die Newtonschen Gleichungen für die krummlinigen Koordinaten
zu erhalten, gehen wir analog vor, müssen aber beachten, daß die Basisvektoren
~gi zeitabhängig sind. Es gilt
m~gi ·
d~v
= ~gi · F~ .
dt
Wir addieren auf beiden Seiten den Term m~g˙ i · ~v und erhalten so
m
d
(~gi · ~v ) = ~gi · F~ + m~v · ~g˙ i .
dt
168
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Auf der linke Seite dieser Gleichung verwenden wir Gl. (3.15) und auf der rechten
Gl. (3.14) was auf
d ∂~v
d ∂~r
m
· ~v = ~gi · F~ + m~v ·
dt ∂ q̇i
dt ∂qi
führt. Im zweiten Summanden auf der rechten Seite können wir die Reihenfolge
der Ableitung nach t und der partiellen Ableitung nach qi vertauschen, da
d
d
X ∂ 2~r
X ∂
∂ ˙
d ∂~r
=
q̇j =
(~gj q̇j ) =
~r .
dt ∂qi
∂qj ∂qi
∂qi
∂qi
j=1
j=1
Damit ergibt sich für die obige Gleichung
d ∂~v
∂~v
· ~v = ~gi · F~ + m~v ·
.
m
dt ∂ q̇i
∂qi
Die Terme, die die Geschwindigkeit enthalten, können wir als partielle Ableitungen der kinetischen Energie T = mv 2 /2 schreiben
∂T
d ∂T
= ~gi · F~ +
.
(3.16)
dt ∂ q̇i
∂qi
Dies ist eine sehr bequeme Schreibweise der Newtonschen Gleichung in krummlinigen Koordinaten. Betrachten wir den Fall, daß die qi die kartesischen xi sind,
also qi = xi , so ergeben sich aus dieser Gleichung die gewöhnlichen Bewegungsgleichungen der kartesischen Koordinaten, da
∂T
∂T
=
= mvi
∂ q̇i
∂vi
und
∂T
∂T
=
=0.
∂qi
∂xi
In allgemeinen krummlinigen Koordinaten gilt
d
d
m 2 m X
m X
(q̇i~gi ) · (q̇j ~gj ) =
gi,j q̇i q̇j ,
T =
v =
2
2 i,j=1
2 i,j=1
d
X
∂T
= m
gi,j q̇j .
∂ q̇i
j=1
mit den Komponenten gi,j des Metriktensors.
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
169
Für den Fall eines konservativen Kraftfeldes kann der Term in Gl. (3.16) der
die Kraft enthält umgeschrieben werden
~ ~r V ·
~gi · F~ = −∇
∂V
∂~r
=−
,
∂qi
∂qi
und somit
d
dt
∂T
∂ q̇i
=
∂(T − V )
.
∂qi
Da das Potential nicht von den q̇i abhängt können wir
∂L
d ∂L
, L=T −V
=
dt ∂ q̇i
∂qi
(3.17)
schreiben. Dies ist die Lagrange-Form der Bewegungsgleichung, die wir später
ausführlich diskutieren werden. Man bezeichnet L = T − V als die Lagrangefunktion. Die Größe pi = ∂L/∂ q̇i heißt der kanonische Impuls. Für kartesische
Koordinaten wird der kanonische Impuls gleich dem gewöhnlichen Impuls.
3.6
Zweidimensionale Zentralfelder
Wir wollen nun das Problem der zweidimensionalen Bewegung
p eines Teilchens in
einem konservativem Zentralfeld mit Potential V (r), r = x21 + x22 untersuchen.
Dazu verwenden wir als krummlinige Koordinaten die ebenen Polarkoordinaten,
folgen aber im Gegensatz zu dem Abschnitt über des Fadenpendel dem allgemeinen Formalismus den wir gerade entwickelt haben. Die Basisvektoren sind nach
den obigen Überlegungen
~g1 = ~gr = cos φ ~e1 + sin φ ~e2 ,
~g2 = ~gφ = −r sin φ ~e1 + r cos φ ~e2
und für die Komponenten des Metriktensors ergibt sich
g1,1 = 1 , g2,2 = r2 , g1,2 = g2,1 = 0 .
Die Außerdiagonalelemente verschwinden, da die Basisvektoren in diesem Fall
senkrecht aufeinander stehen (siehe oben). Damit folgt für die kinetische Energie
in Polarkoordinaten
T =
d
m
m X
q̇i q̇j gi,j = (ṙ2 + r2 φ̇2 ) .
2 i,j=1
2
170
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Um die Bewegungsgleichungen in der Lagrange-Form zu bekommen, benötigen
wir die folgenden partiellen Ableitungen
∂T
∂T
∂T
∂T
= mr2 φ̇ ,
= mṙ ,
= mrφ̇2 ,
=0.
∂ ṙ
∂r
∂φ
∂ φ̇
Mit diesen ergeben sich die zwei Bewegungsgleichungen
∂V
d
(mṙ) = mr̈ = mrφ̇2 −
dt
∂r
d
∂V
(mr2 φ̇) = −
.
dt
∂φ
Der erste Term auf der rechten Seite der Gleichung für r̈ ist die Zentrifugalkraft
die wir im nächsten Semester in dem Kapitel über beschleunigte Bezugssysteme
ausführlich diskutieren werden.
Für Zentralfelder gilt ∂V /∂φ = 0 und die zweite Gleichung liefert die Erhaltungsgröße11
mr2 φ̇ = const. = l .
Die Größe r2 φ̇ hat (für l 6= 0) eine geometrische Bedeutung, die wir uns veranschaulichen wollen. Die im Zeitintervall [t0 , t] vom Ortsvektor ~r(t) überstrichene
Fläche bezeichnen wir mit S(t). Die überstrichene Fläche für ein Zeitintervall der
Größe ∆t ist ∆S = S(t + ∆t) − S(t). Diese ist in der folgenden Skizze dargestellt.
r(t)∆φ
r(t+∆ t)
∆φ
r(t)
In führender Ordnung in ∆t gilt
1
1
∆S = r rφ̇∆t + O([∆t]2 ) = r2 φ̇∆t + O([∆t]2 )
2
2
Mit dem obigen Erhaltungssatz ergibt sich, daß die Flächengeschwindigkeit dS/dt
zeitlich konstant ist
dS
1
l
= r2 φ̇ = const. =
.
dt
2
2m
11
Diese wird sich als die ~e3 -Komponente des Drehimpuls herausstellen, weshalb wir sie bereits
hier mit l bezeichnen.
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
171
Somit werden in gleichen Zeiten gleiche Flächen überstrichen. Dies ist das zweite
Keplersche Gesetz. Es handelt sich dabei um eine Manifestation der Drehimpulserhaltung, was wir folgend genauer analysieren wollen.
Wir betrachten ein dreidimensionales Zentralpotential V (r). Das zugehörige
˙
Kraftfeld hat dann die Richtung ~r und es gilt ~l = ~r × F~ = 0, d.h. der Drehimpuls
ist erhalten ~l(t) = ~l0 . Die Gleichung ~l · ~r = (~r × p~) · ~r = 0 ist für ~l(t) = ~l0 die
Bestimmungsgleichung für die Ebene durch den Ursprung, die die Bahn des Teilchens {~r(t)} enthält. Wählt man also ~e3 ∼ ~l0 so findet die Bewegung in einem
dreidimensionalen Zentralpotential in der x1 -x2 -Ebene statt. Somit wird die Beschreibung der Bewegung in einem dreidimensionalen Zentralpotential äquivalent
zu der Beschreibung in zwei Dimensionen. In der x1 -x2 -Ebene gilt
~r = r~gr , ~r˙ = ṙ~gr + φ̇~gφ
und damit für den Drehimpuls
~l = m~r × ~r˙ = mrφ̇ ~gr × ~gφ = mr2 φ̇ ~e3 .
Die Konstante l hat somit die Bedeutung von
l3 = mr2 φ̇ = l
und der Zusammenhang zwischen Drehimpulserhaltung und “Flächensatz” ist
hergestellt.
Bei l = 0 gilt für die Bewegung in der zweidimensionalen Ebene
r2 φ̇ = 0
woraus für r 6= 0,
φ = const.
folgt, d.h. die Bewegung entlang einer Geraden durch den Ursprung erfolgt. Dabei
gilt es zu beachten, daß beim Durchgang durch den Ursprung φ nach φ + π
übergeht.
Wir betrachten nun den Fall der zweidimensionalen Bewegung mit l 6= 0 und
verwenden neben der Erhaltung des Drehimpulses die Energieerhaltung. In der
Gesamtenergie E = T +V läßt sich der Term ∼ φ̇2 durch die Drehimpulserhaltung
l = mr2 φ̇ eleminieren
m 2
ṙ + r2 φ̇2 + V (r)
(3.18)
E =
2
m 2
l2
=
ṙ +
+ V (r) .
(3.19)
2
2mr2
172
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Man erhält somit dieselbe Form für die Energie wie für eine eindimensionale
Bewegung jedoch mit dem l-abhängigen effektiven Potential
Veff (r) = V (r) +
l2
.
2mr2
Im Unterschied zur echten eindimensionalen Bewegung kann r nur positive Werte
und die Null annehmen: r ≥ 0. Im obigen Ausdruck bezeichnet man die Größe
l2 /(2mr2 ) als die Zentrifugalenergie oder die Drehimpulsbarriere.
Um die Bewegung in zwei Dimensionen weiter zu charakterisieren, müssen wir
nun ein spezifisches Potential wählen. Folgend werden wir zwei Potentialtypen
untersuchen
V (r) = V0 (r/a)kV ,
V0 kV > 0 ,
kV > −2
und ein ideal reflektierendes (kreisrundes) Billard (R > 0)
0,
r≤R
V (r) =
∞,
r>R.
Beispiele für das effektive Potential, sowie seine Konstituenten, die in die erste
Klasse von Potentialen fallen, sind in den folgenden Skizzen dargestellt (A0 =
2ma2 V0 /l2 ).
Man erkennt, daß für kV > 0 für jeden möglichen Wert der Gesamtenergie E >
Emin eine finite Bewegung auftritt, während diese für −2 < kV < 0 für E < 0
finit, für E > 0 jedoch infinit ist. Ein Beispiel für die zweite Potentialklasse ist
folgend skizziert (A0 = 2mR2 V0 /l2 = 1).
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
173
In diesem Fall ist die Bewegung immer finit mit r(t) ≤ R. Wir werden die Beispiele später verwenden, um das jetzt diskutierte allgemeine Lösungsverfahren
zu veranschaulichen. Die Energieerhaltung Gl. (3.18) führt analog zum Fall der
eindimensionalen Bewegung in einem konservativen Kraftfeld auf die Beziehung
r
2
dr
=±
[E − Veff (r)] .
(3.20)
dt
m
Durch (im Allgemeinen numerische) Integration folgt daraus die Funktion t(r)
und durch (im Allgemeinen numerisches) Auflösen die gesuchte Funktion r(t).
Von den vier Anfangsbedingungen r(t0 ), φ(t0 ), ṙ(t0 ) und φ̇(t0 ) bestimmen r(t0 ),
ṙ(t0 ) und φ̇(t0 ) die Konstanten der Bewegung l und E, die in die obige Differentialgleichung (3.20) für r(t) eingehen. Somit hängt r(t) parametrisch von l, E und
r(t0 ) ab. Zur vollständigen Bestimmung der Bewegung benötigen wir noch die
Funktion φ(t). Diese folgt aus der Drehimpulserhaltung mr2 (t)φ̇(t) = l. Auflösen
und Integration liefert
Z t
l
r−2 (t0 ) dt0 .
(3.21)
φ(t) − φ(t0 ) =
m t0
Die beiden Schritte zur Berechung von r(t) und daraus φ(t) seien nun in einfachen
Grenzfällen und Beispielen näher erläutert.
Kreistrajektorie: In der ersten Klasse von Beispielpotentialen hat das effektive
Potential Veff ein Minimum bei r = r0 . Wählt man nun E = Veff (r0 ) so erfüllt
r(t) = r0 = const. die Energieerhaltung und die Bahnkurve ist ein Kreis um den
0
Ursprung. In diesem Fall gilt Veff
(r0 ) = 0, was bedeutet, daß sich die anziehende
Zentralkraft (Zentripetalkraft) und die Zentrifugalkraft gerade kompensieren
V 0 (r0 ) =
l2
= mr0 φ̇2 .
mr03
174
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
Mit r(t) = r0 läßt sich das Integral in Gl. (3.21) trivial ausführen
φ(t) = φ(t0 ) +
l
(t − t0 ) = φ(t0 ) + φ̇(t0 ) (t − t0 )
mr02
und die Kreisbahn wird mit konstanter Winkelgeschwindigkeit φ̇(t0 ) = ωφ =
l/(mr02 ) durchlaufen.
Harmonische Näherung für r(t): Wählt man die Gesamtenergie nur ein wenig größer als Veff (r0 ), so ist die Bewegung in “r-Richtung” (für alle kV > −2,
kV 6= 0) finit. Weiterhin kann man Veff durch eine Parabel approximieren (Taylorentwicklung)
Veff (r) ≈ Veff (r0 ) +
1 00
V (r0 ) (r − r0 )2 .
2 eff
Damit ist das durch Gl. (3.20) gegebene Problem der Berechnung von r(t) analog zum eindimensionalen harmonischen Oszillator mit der allgemeinen Lösung
(r(t) ≥ 0)
r
00
Veff
(r0 )
r(t) = r0 + r0 cos (ωr t + δ) , ωr =
m
Der Abstand des Teilchens vom Ursprung r(t) ist eine periodische Funktion der
Zeit mit der Schwingungsdauer Tr = 2π/ωr . O.B.d.A. haben wir t0 = 0 gewählt.
Um φ(t) zu berechnen, verwenden wir, daß die Energie nur wenig vom Minimum
des effektiven Potentials abweicht, was bedeutet, daß 0 < 1 gilt. Damit
können wir r−2 (t) im Integranden von Gl. (3.21) linear in entwickeln. und
erhalten
Z t
l
(1 − 2 cos [ωr t0 + δ]) dt0 + O(2 )
φ(t) − φ(0) =
mr02 0
l
2
=
t−
[sin (ωr t + δ) − sin (δ)] + O(2 ) .
mr02
ωr
Die Bahnkurve liegt in einem Kreisring zwischen r0 (1 − ) und r0 (1 + ). Im
Allgemeinen werden die Bahnkurven nicht geschlossen sein. Um dies zu sehen,
betrachten wir den Winkel (∆φ)Tr der für eine Periode der Radialbewegung überstrichen wird. Für t = Tr ergibt sich
(∆φ)Tr =
ωφ
l
T = 2π
.
2 r
mr0
ωr
Nur falls (∆φ)Tr = 2πk/n, mit k, n ∈ N ist, d.h. die Frequenzen ωφ und ωr kommensurabel (rationales Verhältnis) sind, erhält man eine geschlossene Bahn. Für
irrationale Werte von ωφ /ωr sind die Bahnen offen. In den folgenden Abbildungen
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
175
sind Bahnkurven in der x1 -x2 -Ebene für r0 = 1 (d.h. x1 und x2 sind in Einheiten
von r0 angegeben), = 0.2 und verschiedene Verhältnisse ωφ /ωr skizziert.
ωφ/ωr=1+sqrt(2)/10
ωφ/ωr=1
1
x2
x2
1
0
0
-1
-1
-1
0
x1
-1
1
ωφ/ωr=1/5
1
ωφ/ωr=1/5+sqrt(2)/50
1
x2
1
x2
0
x1
0
-1
0
-1
-1
0
x1
1
-1
0
x1
1
Kreisbillard: In diesem Beispiel bewegt sich das Teilchen zwischen den Reflektionen an der
p harten Wand entlang von Geradenabschnitten (kräftefreie Bewegung
für r = x21 + x22 < R). Da die r-Bewegung in diesem Fall immer finit ist (siehe
oben), ergibt sich eine in “r-Richtung” periodische Bewegung. Die Periodendauer
in diese Richtung sei wieder mit Tr bezeichnet. Die Funktionen r(t) und φ(t) lassen sich über eine Periode der r-Bewegung auch ohne Integration angeben. Dazu
176
KAPITEL 3. NEWTONSCHE MECHANIK TEIL I
betrachten wir den Geradenabschnitt
x2 = v0 t , 0 ≤ |t| ≤ Tr /2
x1 = a < R ,
mit
Tr /2 =
√
R2 − a2 /v0 .
Damit folgt für das obige Zeitintervall
p
r(t) = a2 + (v0 t)2 , φ(t) = arctan (v0 t/a)
und man erhält für den in einer Periode der r-Bewegung überstrichenen Winkel
√
(∆φ)Tr = 2 arctan
R2 − a2 /a .
Ist (∆φ)Tr ein rationales Vielfaches von 2π so ist die Bahn geschlossen, andernfalls
nicht. In den folgenden Skizzen ist der Fall zweier geschlossener Bahnen (für
R = 1) skizziert.
(∆φ)T =2π/6
r
1
x2
1
x2
(∆φ)T =2π(3/5)
r
0
-1
0
-1
-1
0
x1
1
-1
0
x1
1
Allgemeines Zentralpotential: Wir kehren nun noch einmal zum allgemeinen
Fall des Zentralpotentials zurück. Ist man daran interessiert, die Bahnkurve ohne
ihren zeitlichen Durchlauf zu bestimmen, so kann man mit Hilfe von mr2 dφ/dt = l
die Zeit aus der Gl. (3.20) eleminieren
dφ
l
1
p
=±
.
2
dr
mr
2[E − Veff (r)]/m
Integration liefert
Z
r
φ − φmin = ±
rmin
l
p
dr0 .
02
0
r
2m[E − Veff (r )]
3.6. ZWEIDIMENSIONALE ZENTRALFELDER
177
Wir werden bei der Behandlung des Keplerproblems mit V (r) = −α/r auf diese Beziehung zurück kommen. Der überstrichene Winkel während einer Schwingungsperiode von r(t) (falls die Bewegung in r-Richtung periodisch ist) ergibt
sich zu
Z rmax
l
p
dr0 .
(∆φ)Tr = 2
02
0
r
2m[E − Veff (r )]
rmin
Damit schließen wir unsere allgemeinen Überlegungen zur zweidimensionalen Bewegung in einem Zentralpotential–und dieses Semester–ab. Das kommende
Semster werden wir damit beginnen, daß gerade gelernte auf das “klassische”
Zweikörperproblem “Erde-Sonne” anzuwenden.
Zugehörige Unterlagen
Herunterladen