Skript zur Vorlesung Einführung in die Theoretische Physik von Volker Meden gehalten im Wintersemester 2011/2012 an der RWTH Aachen 2. Februar 2012 2 Inhaltsverzeichnis 1 Eine kurze Einführung 5 2 Mathematische Methoden 2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . 2.2 Differentialrechnung einer Veränderlichen . . . . 2.3 Integralrechnung einer Veränderlichen . . . . . . 2.4 Logarithmus- und Exponentialfunktion . . . . . 2.5 Potenzreihen und Taylorentwicklung . . . . . . 2.6 Hyperbolische und trigonometrische Funktionen 2.7 Gewöhnliche Differentialgleichungen . . . . . . . 2.8 Komplexe Zahlen . . . . . . . . . . . . . . . . . 2.9 Vektorrechnung . . . . . . . . . . . . . . . . . . 2.10 Fourierreihen . . . . . . . . . . . . . . . . . . . 2.11 Vektorwertige Funktionen . . . . . . . . . . . . 2.12 Funktionen mehrerer Veränderlicher . . . . . . . 2.13 Matrizen . . . . . . . . . . . . . . . . . . . . . . 2.14 Das Eigenwertproblem . . . . . . . . . . . . . . 2.15 Systeme linearer Differentialgleichungen . . . . . 2.16 Die Integration im Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 25 34 38 44 49 54 60 69 75 77 89 94 101 108 3 Newtonsche Mechanik Teil I 3.1 Einleitung . . . . . . . . . . . . . . . . . . 3.2 Grundlagen: Raum, Zeit, Masse und Kraft 3.3 Bewegungsgleichung und Erhaltungsgrößen 3.4 Ein Teilchen in einer Dimension . . . . . . 3.5 Krummlinige Koordinaten . . . . . . . . . 3.6 Zweidimensionale Zentralfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 121 122 127 134 163 169 3 . . . . . . . . . . . . . . . . . . 4 INHALTSVERZEICHNIS Kapitel 1 Eine kurze Einführung Diese Vorlesung verfolgt zwei Ziele. Einerseits geht es darum ihnen relativ schnell die mathematische Werkzeuge bereitzustellen, die sie in den ersten Semestern ihres Physikstudiums benötigen werden. Dabei ersetzt die Vorlesung keinesfalls den Kurs in Höherer Mathematik, der ihnen einen sehr viel systematischeren Zugang zur Mathematik eröffnen wird. In einem zweiten kürzeren Teil werden wir uns mit den Grundzügen der klassischen Mechanik beschäftigen, d.h. der Theorie der Bewegung von “klassischen” Teilchen (wie z.B. Planeten und Fußbällen). Wir wollen den Begriff “klassisch” hier so verstehen, daß er sich auf hinreichend große (makroskopische) Teilchen bezieht, deren Geschwindigkeit sehr viel kleiner als die Vakuumgeschwindigkeit der Lichts c ist. Geht man über diese Grenzen hinaus, so benötigt man statt der klassischen Mechanik die Quantenmechanik oder relativistische Mechanik, Theorien die in den ersten drei Jahrzehnten des zwanzigsten Jahrhunderts entwickelt wurden. Beide Konzepte werden sie in späteren Vorlesungen kennenlernen. Diese Beschränkungen machen sofort klar, daß es sich bei der klassischen Mechanik um eine Theorie mit eingeschränktem Gültigkeitsbereich handelt. Trotz dieser Beobachtung bildet sie eine spannendes Gebiet, welches für das Verständnis der weitaus meisten “mechanischen” Phänomene des Alltags ausreicht. Speziell die Entwicklung der “Chaos-Theorie” in den letzten Jahrzehnten hat zu einer Wiederbelebung der Forschung im Bereich der klassischen Mechanik geführt. Weiterhin bildet ein Verständnis der klassischen Mechanik die Grundlage für den Zugang zur Quantenmechanik und relativistischen Mechanik. Darüberhinaus biete sie einen vergleichsweise einfachen Einstieg in die Methoden und Konzepte der Theoretischen Physik. Die Entwicklung der klassischen Mechanik wie wir sie heute kennen geht auf die Ideen von Galileo (1564-1642) und Newton (1642-1727) zurück. Zwei alternative, zur Newtonschen Mechanik äquivalente Formulierungen der klassischen Mechanik stammen von Lagrange (1736-1813) und Hamilton (1805-1865). Die Lagrangesche und Hamiltonsche Mechanik haben den Vorteil, daß mit ihrer Hilfe oft Lösungen komplexer Probleme einfacher gefunden werden können. Sie wer5 6 KAPITEL 1. EINE KURZE EINFÜHRUNG den sie in ihrem zweiten Studiensemster in der Vorlesung Theoretische Physik I kennen lernen. Bereits im ersten mathematischen Teil dieser Vorlesung werden wir als Motivation der Einführung neuer Konzepte und in Beispielrechnungen (in der Vorlesung und den zugehörigen Übungen) Probleme aus der Mechanik heranziehen. Dabei werden wir davon ausgehen, daß sie einfache Konzepte der Newtonschen Mechanik aus der Schule oder (zum benötigten Zeitpunkt bereits) aus der Vorlesung Experimentalphysik I kennen. Kapitel 2 Mathematische Methoden 2.1 Einleitung Im Laufe ihres Studiums werden ihnen verschiedene Arten des Umgangs mit Mathematik begegnen, von ziemlich abstrakt bis sehr anschaulich. Der Schwerpunkt der Einführung in die Theoretische Physik liegt dabei weniger auf formaler Strenge in den Herleitungen, sondern auf einer relativ anschaulichen Darstellung und der Anwendung des Gelernten in physikalischen Fragestellungen. Dabei werden wir was die Vorbedingungen angeht nicht “bei Null anfangen”, sondern setzen ein gewisses (anschauliches) Vorwissen voraus. Zum Beispiel werden wir nicht sehr ausführlich auf den Stetigkeitsbegriff eingehen, sondern gehen davon aus, daß sie ein intuitives Verständnis davon haben, was es heißt, daß eine Kurve stetig ist (ohne Sprünge). Auf saubere Beweise von “Sätzen” - also Zusammenhängen - die ihnen zum Teil sicherlich bereits aus der Schule bekannt sind, und eine abstrakte Formulierung der Konzepte, wie sie sie im Kurs Höhere Mathematik (bzw. den Grundvorlesungen der Mathematik) kennenlernen werden, verzichten wir hier bewußt. Die Konzepte sollen vielmehr anhand einfacher Beispiele erklärt und geübt werden. Es stellt meist eine große Herausforderung für Physikstudierende dar, sich in beiden Herangehensweise an Mathematik - formal und pragmatisch - “zu hause zu fühlen”. Dieses Ziel zu erreichen ist sehr erstrebenswert, da es für einen Physiker einerseits wichtig ist Integrale berechnen und Differentialgleichungen explizit lösen zu können und andererseits essentiell ist die logische Struktur der Mathematik verinnerlicht zu haben. Aus ihrer “Schulphysik” ist ihnen sicherlich bekannt, daß man zur Beschreibung der Dynamik eines klassischen Teilchens in einem Kraftfeld Analysis (Differential- und Integralrechnung) und lineare Algebra (Vektorrechnung) benötigt. Hier einige Beispiele aus der Mechanik, in denen die unter diesen Oberbegriffen zusammengefaßten mathematischen Methoden eine wichtige Rolle spielen: • Bahnkurve - Vektor, Vektoraddition, Funktion: ~x(t) = x1 (t)~e1 + x2 (t)~e2 + x3 (t)~e3 7 8 KAPITEL 2. MATHEMATISCHE METHODEN • Geschwindigkeit - Differentiation (eindimensional) v(t) = dx(t) dt • Geschwindigkeitsvektor - Differentiation eines Vektors: ~v (t) = = ẋ(t) d~ x(t) dt = ~x˙ (t) • Newtonsche Gleichung - zweite Ableitung, Differentialgleichung, vektorwertige Funktion eines Vektor, zusammengesetzte Funktion: m~x¨(t) = F~ (~x(t)) z.B. mẍ(t) = −Kx(t) (Hookesches Gesetz) Rx • Arbeit - Integration: W (x1 → x2 ) = x12 F (x)dx • Leistung - Skalarprodukt: P = F~ · ~v • Drehimpuls - Vektorprodukt: ~l = ~x × p~ • Potential - partielle Ableitung, Gradient (Differentialrechnung mehrerer ~ (~x) Veränderlicher): F~ (~x) = −∇V • Rotationsenergie P - Summenzeichen, Matrix (Tensor), Hauptachsentransfor1 mation: Erot = 2 3i,j=1 Ωi Ii,j Ωj Am Ende des mathemtaischen Teils dieser Vorlesung sollten sie an den Umgang mit einer Vielzahl dieser Begriffe und Rechenprozeduren gewöhnt sein. Wir werden weiterhin wichtige Eigenschaften spezieller Funktionen, z.B. der • Exponentialfunktion: exp(x) = ex ; exp(x + y) = exp(x) exp(y) • Logarithmusfunktion: ln(x); ln(xy) = ln(x) + ln(y) diskutieren, Reihendarstellungen von Funktionen kennenlernen P n • Exponentialfunktion: exp(x) = ∞ n=0 x /n! und komplexe Zahlen einführen √ • i = −1; eix = cos x + i sin x. Zusätzlich werden wir zwei Methode zur approximativen Beschreibung von Funktionen in Form der Taylor- und der Fourierreihe kennen lernen. 2.2 Differentialrechnung einer Veränderlichen Eine Funktion y = f (x) mit x ∈ D und y ∈ W ist eine spezielle Abbildung, bei der den Elementen des Definitionsbereichs D - der z.B. eine Teilmenge der reellen Zahlen R ist (ein oder mehrere Intervalle) - eindeutig ein Element des Wertebereichs W - der eine ebensolche Teilmenge darstellt - zugeordnet wird. 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN 9 W D f Um Intervalle als Teilmengen von R zu bezeichnen, verwendet man die Notation • (a, b) : {x ∈ R|a < x < b} • [a, b] : {x ∈ R|a ≤ x ≤ b} • (a, b] : {x ∈ R|a < x ≤ b} • [a, b) : {x ∈ R|a ≤ x < b} Häufig zeichnet man den Graphen der Funktion f (x), welcher durch alle Punktepaare x, f (x) mit x ∈ D gebildet wird. In der Physik ist es üblich, y = f (x) zu schreiben. Betrachten wir zwei einfache Beispiele y= √ x : D = [0, ∞) , W = [0, ∞) 4 y 3 2 1 0 −2 0 2 4 x 6 8 10 y = cos x : D = R = (−∞, ∞) , W = [−1, 1] 10 KAPITEL 2. MATHEMATISCHE METHODEN 1 y 0.5 0 −0.5 −1 −10 −5 0 x 5 10 wobei wir immer den größtmöglichen - also den “natürlichen” - Definitionsbereich gewählt haben. Es gibt verschiedene analytische Darstellungen von Funktionen (Graphen) • explizit: y = f (x), • implizit: F (x, y) = 0, • Parameterdarstellung: x = g(s), y = h(s) mit zwei Funktionen g, h und dem (reellen) Parameter s (aus einem gemeinsamen Definitionsbereich von g und h). Als Beispiel dazu betrachten wir die obere Hälfte des Kreises mir Radius 1 (Einheitskreis), welche auf die drei Arten √ • explizit: y = 1 − x2 , x ∈ [−1, 1], • implizit: F (x, y) = x2 + y 2 − 1 = 0, x ∈ [−1, 1], y ≥ 0, • Parameterdarstellung: x = cos φ, y = sin φ, φ ∈ [0, π] (Winkel nicht in Grad, sondern Radiant: 360o entspricht 2π) gegeben ist. Eine Funktion heißt monoton wachsend falls aus x1 < x2 , f (x1 ) ≤ f (x2 ) folgt. Sie heißt streng monoton wachsend falls das ≤ in der zweiten Relation durch ein < ersetzt werden kann. Völlig analoge Definitionen gibt es für die Begriffe monoton fallend und streng monoton fallend. Man bezeichnet eine Funktion als nach oben beschränkt falls es ein M < ∞ gibt mit f (x) ≤ M für alle x ∈ D. Die reelle Zahl M ist dann eine obere Schranke. Die kleinste obere Schranke ist eindeutig bestimmt und wird als Supremum bezeichnet. Erneut gibt es analoge Definitionen für die Begriffe nach unten beschränkt, untere Schranke und Infimum. 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN 11 Eine Funktion heißt gerade falls f (−x) = f (x) für alle x ∈ D bzw. ungerade falls f (−x) = −f (x) für alle x ∈ D. Man bezeichnet sie als periodisch mit Periode P > 0 falls f (x + P ) = f (x) für alle x ∈ D = R. Man kann nun Summen, Differenzen, Produkte und Quotienten von Funktionen f (x), g(x), h(x), . . . bilden, wobei man sich in jedem speziellen Fall Gedanken über den Definitions- und Wertebereich der sich jeweils ergebenden Funktionen machen muß. Eine wichtige Rolle spielen auch zusammengesetzte Funktionen (f ◦ g) (x) = f (g(x)) f g f g Der Definitionsbereich von f ◦ g ergibt sich aus den x ∈ Dg , für die g(x) ∈ Df ist. Als Beispiele betrachten wir f (x) = √ x ; g(x) = x + 1 ⇒ (f ◦ g)(x) = f (g(x)) = √ x + 1 ; Df ◦g = [−1, ∞) 4 y 3 2 1 0 f (x) = cos x ; g(x) = −2 0 2 4 x 6 8 10 1 ⇒ (f ◦ g)(x) = f (g(x)) = cos (1/x) ; Df ◦g = R \ {0} x 12 KAPITEL 2. MATHEMATISCHE METHODEN 1 y 0.5 0 −0.5 −1 −1 −0.5 0 x 0.5 1 Die zusammengesetzte Funktion im zweiten Beispiel ist eine “relativ verrückte” Funktion, da der Graph für |x| → 0 immer schneller zwischen −1 und 1 hin und her “zappelt”. Man bezeichnet eine Funktion f als stetig im Punkt x0 ∈ D, wenn der zugehörige Graph bei x0 keine Sprünge hat (limh→0 f (x0 +h) = f (x0 )) und der Funktionswert bei Annäherung an x0 kleiner Unendlich ist (limh→0 f (x0 + h) < ∞), d.h. f bei x0 nicht divergiert. Formaler ist die Stetigkeit im Punkt x0 wie folgt definiert: Für alle ε > 0 gibt es ein δ > 0, so daß für alle x mit |x − x0 | < δ, |f (x) − f (x0 )| < ε gilt. Eine Funktion heißt stetig in einem Intervall I, falls f für alle x ∈ I stetig ist. Es gibt verschiedene Typen von Unstetigkeiten. Hebbare Unstetigkeiten wie die Stelle x = 0 in f (x) = x2 /x, Sprünge wie in 0 x<0 f (x) = 1 x≥0 für x → 0, x < 0, Pole wie in f (x) = (x − a)−2 und wesentliche Singularitäten wie in f (x) = exp (1/x) bei x = 0. Weitere formale Überlegungen zum Begriff der Stetigkeit und des oben stillschweigend benutzen Grenzwertes überlassen wir der HöMaI Vorlesung. Man teilt Funktionen einer (reellen) Veränderlichen in zwei Klassen ein. Die elementaren Funktionen und die speziellen Funktionen. Beispiele für die Letzteren sind z.B. die in der Physik häufiger auftretenden Besselfunktionen, Gammafunktionen und das Exponential-Integral. Elementare Funktionen kann man durch einen geschlossenen analytischen Ausdruck angeben. Die elementaren Funktionen unterteilt man weiter in algebraische Funktionen, die einer impliziten algebraischen Gleichung der Form p0 (x) + p1 (x)y + p2 (x)y 2 + . . . + pn (x)y n = 0 , mit Polynomen pj (x) (Definition siehe gleich), genügen und transzendente Funktionen (die sich nicht auf diese Art schreiben lassen). Beispiele für die letztere 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN 13 Funktionenklasse sind die Exponentialfunktion, der Logartihmus, die hyperbolischen Funktionen und trigonometrischen Funktionen. In einem weiteren Schritt unterteilt man die algebraischen Funktionen in drei Untergruppen. (i) Polynome (ganz rationale Funktionen) der Form f (x) = a0 + a1 x + a2 x2 + . . . + an xn mit Koeffizienten aj ∈ R, j = 0, 1, . . . , n, wobei an 6= 0 gilt. Für große |x| geht das Polynom wie an xn und ist somit (falls D = R gilt) nicht nach oben beschränkt. Mit dem Bestimmen von Nullstellen von Polynomen sollten sie sich bereits in der Schule auseinander gesetzt haben. Es gilt der Zerlegungssatz, daß sich jedes Polynom mit reellen Koeffizienten als ein Produkt von linearen und quadratischen Termen mit reellen Koeffizienten schreiben läßt, wobei die quadratischen Faktoren keine reellen Nullstellen haben sollten. In dieser Darstellung lassen sich dann die (reellen) Nullstellen direkt ablesen. Ein Polynom ist überall stetig und hat bis zu n (reelle) Nullstellen. (ii) Gebrochen rationale Funktionen die sich als Quotient zweier Polynome in der Form f (x) = a0 + a1 x + a2 x2 + . . . + an xn p(x) = , b0 + b1 x + b2 x2 + . . . + bm xm q(x) mit aj , bj ∈ R schreiben lassen. An den Nullstellen q(x0 ) = 0 des Nenners ist die Funktion nicht definiert. Sollte gleichzeitig p(x0 ) = 0 gelten liegt womöglich eine hebbare Lücke vor (wenn die Nullstelle des Zählers von gleicher oder höherer Ordnung ist wie die des Nenners), sonst ein Pol. Eine Funktion dieser Form heißt echt gebrochen falls n < m. Ein wichtiges Konzept für gebrochen rationale Funktionen ist die Partialbruchzerlegung.1 Jede echt gebrochene rationale Funktion läßt sich als Summe von Partialbrüchen der Form a1 /(x − x0 ), a2 /(x − x0 )2 , . . . und (b1 x + c1 )/(x2 + rx + s), (b2 x + c2 )/(x2 + rx + s)2 ,. . . schreiben, wobei die Koeffizienten aj , bj , cj , r und s aus den reellen Zahlen sind. Die in der Partialbruchzerlegung auftretenden Nenner sind Teiler von q(x).Wir betrachten dazu ein Beispiel. Gegeben sei die Funktion 2x3 + 5x2 + 2x + 3 . x3 + 2x2 + x + 2 Daraus extrahieren wir zunächst die echt gebrochene Funktion g(x) f (x) = f (x) = 2 + x2 − 1 = 2 + g(x) . x3 + 2x2 + x + 2 Den Nenner zerlegen wir nun in x3 + 2x2 + x + 2 = (x + 2)(x2 + 1). Der Ansatz für die Partialbruchzerlegung von g(x) lautet dann g(x) = 1 a bx + c x2 − 1 = + , x3 + 2x2 + x + 2 x + 2 x2 + 1 Die Partialbruchzerlegung wird ein wichtiges Hilfsmittel beim Finden der Stammfunktion für eine gebrochen rationale Funktion sein. 14 KAPITEL 2. MATHEMATISCHE METHODEN wobei es gilt a, b und c zu bestimmen. Dies geschieht wie folgt. Wir multiplizieren beide Seiten der Gleichung mit dem Nenner und erhalten x2 − 1 = a(x2 + 1) + (bx + c)(x + 2) = (a + b)x2 + (2b + c)x + (a + 2c) . Für beliebige x kann diese Gleichung nur erfüllt werden, wenn die Koeffizienten vor den Potenzen von x auf beiden Seiten der Gleichung identisch sind. Man nennt diese Vorgehensweise Koeffizientenvergleich. Aus dieser Forderung ergeben sich die drei Gleichungen a+b = 1 2b + c = 0 a + 2c = −1 mit der Lösung a = 3/5, b = 2/5 und c = −4/5. Das Ergebins der Partialbruchzerlegung ist somit x2 − 1 3 1 2x − 4 f (x) = 2 + 3 . = 2+ + x + 2x2 + x + 2 5 x + 2 x2 + 1 Die dritte Unterklasse der algebraischen Funktionen sind die (iii) irrationalen Funktionen. Dabei handelt es sich um alle algebraischen Funktionen, die nicht in die Klasse (i) oder (ii) fallen. z.B. die Wurzelfunktion. Ein Beispiel pSie enthalten √ 2 bildet die Funktion f (x) = (x + 1) x. Nach dieser kurzen Einführung zu den Eigenschaften von Funktionen gehen wir zum Begriff der Ableitung über. Dazu nehmen wir an, daß die Funktion f in einer Umgebung (einem Intervall) um x0 stetig ist. In der Schule wird die Ableitung meist mit Hilfe der Sekante durch zwei Punktepaare x1 , f (x1 ) und x2 , f (x2 ) mit x1 < x0 < x2 definiert, die im Limes x1 → x0 und x2 → x0 in die Tangente am Punktepaar x0 , f (x0 ) übergeht. 4 f(x) 3 2 1 0 0 2 4 6 x 8 10 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN 15 Etwas formaler gilt f (x0 + h) − f (x0 ) , h→0 h f 0 (x0 ) = lim vorausgesetzt, daß dieser Grenzwert existiert.2 Anschaulich ist f 0 (x0 ) die Steigung der Tangente im Punkt x0 . Falls f 0 (x0 ) existiert, so ist die Funktion im Punkt x0 durch die Tangente linear approximierbar, d.h. näherungsweise durch eine lineare Funktion der Form g(x) = a + bx beschreibbar (in der obigen Abbildung z.B. a = 1 und b = 1/4), und f ist in x0 differenzierbar. Eine Funktion ist in x0 z.B. dann nicht differenzierbar, wenn sie in diesem Punkt einen Knick hat. Wie wir später noch genauer diskutieren werden, spielt eine näherungsweise Beschreibung komplizierter Funktionen in der Physik eine sehr wichtige Rolle. Betrachten wir nun einige Beispiele, wie der Grenzprozeß h →√0 ausgeführt werden kann und welche Ableitungen f 0 sich ergeben. Für f (x) = x mit x > 0 und x + h > 0 gilt √ √ x+h− x √ h √ √ √ x+h− x x+h+ x √ = √ h x+h+ x h √ = √ h x+h+ x 1 = √ √ . x+h+ x f (x + h) − f (x) = h Jetzt kann der Limes h → 0 einfach durch Nullsetzen von h ausgeführt werden, und man erhält √ 1 x 0 = √ oder 2 x x1/2 0 1 = x−1/2 . 2 √ An der Rechnung erkennen wir auch, daß x bei x = 0 nicht differenzierbar ist, denn die Steigung der Tangente wird für x → 0 immer größer und divergiert im Punkt x = 0. Als nächstes betrachten wir f (x) = sin x. Um f 0 zu bestimmen, benötigen wir die Additionstheoreme der trigonometrischen Funktionen (siehe Übungen): sin (x ± y) = sin x cos y ± cos x sin y cos (x ± y) = cos x cos y ∓ sin x sin y 2 (2.1) (2.2) Wir betonen noch einmal, daß wir das Konzept der Grenzwertbildung nicht wirklich sauber definiert haben! 16 KAPITEL 2. MATHEMATISCHE METHODEN Mit Hilfe von Gl. (2.1) folgt: sin (x + h) − sin x h→0 h sin x cos h + cos x sin h − sin x = lim h→0 h cos h − 1 sin h = lim sin x + cos x h→0 h h (sin x)0 = lim Wir haben nun noch die beiden Grenzwerte limh→0 cos hh−1 und limh→0 sinh h zu untersuchen. Das wollen wir hier graphisch tun3 1 (cos(h)−1)/h sin(h)/h 0.5 0 −0.5 0 0.2 0.4 0.6 0.8 1 h Also liefert der erste Grenzwert 0 und der zweite 1. Damit ergibt sich (sin x)0 = cos x. Analog zeigt man (siehe Übungen): (cos x)0 = − sin x. Wichtig - und ihnen sicherlich aus der Schule bereits bekannt - ist auch die Ableitung der Funktion fn (x) = xn mit n ∈ N0 .4 Sie bestimmt sich aus (x + h)n − xn . h→0 h fn0 (x) = lim Um den Limes h → 0 ausführen zu können, müssen wir den Ausdruck (x + h)n 3 Mit Hilfe der Reihendarstellung der sin und cos Funktionen werden wir diese Grenzwerte später auch analytisch recht einfach bestimmen können (siehe Übungen). 4 N bezeichnet die natürlichen Zahlen 1, 2, 3, . . . und N0 = N ∪ {0}. 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN 17 ausmultiplizieren. Wir benötigen also (x + h)n = (x + h)(x + h) . . . (x + h) | {z } n−mal n(n − 1) n−2 2 n(n − 1)(n − 2) n−3 3 n x h + x h + . . . + hn . = xn + xn−1 h + 1 2·1 3·2·1 Das kombinatorische Problem, den Vorfaktor des Terms xn−m hm mit m ≤ n zu bestimmen, führt uns auf die Begriffe Fakultät und Binomialkoeffizient. Die Fakultät ist definiert als n! = n(n − 1)(n − 2)(n − 3) · . . . · 1 wobei n ∈ N gilt. Ergänzt wird diese Definition durch 0! = 1. Die Zahl der Möglichkeiten, n verschiedene Objekte anzuordnen, ist durch n! gegeben. Zum Beispiel gibt es 4! = 24 Möglichkeiten, die vier Buchstaben A, B, C, D anzuordnen: 4 Möglichkeiten für den ersten Buchstaben ∗ 3 Möglichkeiten für den zweiten ∗ 2 Möglichkeiten für den dritten ∗ 1 Möglichkeit für den vierten. Abstrakter formuliert heißt das: Die Zahl der Permutationen von n verschiedenen Objekten ist durch n! gegeben. Um das obige kombinatorische Problem “Wieviele Möglichkeiten gibt es in den n-Faktoren (x + h), (n − m) x’e und m h’s zu finden” zu lösen, müssen wir einen Schritt weitergehen. Die m h’s kann man auf n(n−1)(n−2)...(n−m+1) Arten erhalten: m! • n Möglichkeiten für das erste h • n − 1 Möglichkeiten für das zweite h • ... • ... • n − m + 1 Möglichkeiten für das m-te h Dabei hat man jetzt jedoch die m! Vertauschungen der Reihenfolge der Wahl als eigenständig gezählt, so daß man noch durch m! dividieren muß. Den sich ergebenen Faktor bezeichnet man als Binomialkoeffizienten n(n − 1)(n − 2) . . . (n − m + 1) n n! = = . m m! (n − m)! m! Der Binomialkoeffizient gibt z.B. auch die Zahl der Kombinationen im Lotto “6 aus 49”: 49 = 13983816. Damit ergibt sich für (x + h)n : 6 n n n n−2 2 n n−1 n n n h x h + ...+ x h+ x + (x + h) = n 2 1 0 n X n n−m m x h . = m m=0 18 KAPITEL 2. MATHEMATISCHE METHODEN Wir haben in diesem Ausdruck das Summenzeichen n X = Summe über m von 0 bis n m=0 eingeführt. Nach diesem Einschub kommen wir auf das Problem (xn )0 = . . . zurück. Es ergibt sich (x + h)n − xn h→0 h n n−1 n x + 1 x h + n(n−1) xn−2 h2 + 2·1 (xn )0 = lim = lim h→0 n−1 = nx n(n−1)(n−2) n−3 3 x h 3·2·1 h + . . . + hn − xn , (2.3) wobei der Limes h → 0 jetzt durch Nullsetzen von h ausgeführt werden kann. Über einige Umwege haben wir so das ihnen bekannte Ergebnis erhalten. Es gibt mehrere wichtige Rechenregeln, die einem helfen, Ableitungen von Funktionen zu bestimmen.5 Seien f und g differenzierbare Funktionen, so gilt • (f ± g)0 = f 0 ± g 0 • Produktregel: (f · g)0 = f 0 · g + f · g 0 0 0 g0 • Quotientenregel: fg = f g−f g2 Den Beweis dieser Regeln verschieben wir auf die Übungen. Mit Hilfe der Quotientenregel läßt sich das Ergebnis Gl. (2.3) auf negative ganze Zahlen n = −|m| erweitern (siehe Übungen), so daß jetzt für alle ganzen Zahlen n ∈ Z, (xn )0 = nxn−1 gilt. Genauer wollen wir hier die Kettenregel betrachten, die angibt, wie man zusammengesetzte Funktionen differenziert. Für die differenzierbaren Funktionen f und g müssen wir den Limes f (g(x + h)) − f (g(x)) f (g(x + h)) − f (g(x)) g(x + h) − g(x) = lim h→0 h→0 h g(x + h) − g(x) h lim ausführen, wobei wir angenommen haben, daß g(x + h) 6= g(x) gilt, g(x) also keine konstante Funktion ist - in welchem Fall f (g(x + h)) − f (g(x)) = 0 wäre und damit (f ◦ g)0 = 0 gelten würde. Mit der Abkürzung h̃ = g(x + h) − g(x) gilt f (g(x + h)) − f (g(x)) f (g(x) + h̃) − f (g(x)) g(x + h) − g(x) = lim . h→0 h→0 h h h̃ lim 5 Zum Beispiel läßt sich die Ableitung der Tangensfunktion tan x = Quotientenregel bestimmen (siehe später). sin x cos x leicht mit Hilfe der 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN 19 Wegen der Stetigkeit von g geht mit h auch h̃ gegen 0, so daß (f (g(x)))0 = f 0 (g(x)) g 0(x) folgt. Eine “saubere” Ausformulierung des Beweises werden sie in der Vorlesung HöMa I kennenlernen. Als nächstes werden wir das Konzept der impliziten Funktion genauer diskutieren, das für sich genommen wichtig ist und oft auch bei der Bestimmung von Ableitungen hilfreich sein kann. Durch eine Gleichung der Form F (x, y) = 0 wird im Allgemeinen eine Kurve in der x-y-Ebene festgelegt. Zum Beispiel beschreibt F (x, y) = x2 + y 2 − 1 = 0 einen Kreis mit Radius 1, den man als Einheitskreis 2 2 bezeichnet. Löst man die √ Gleichung x + y − 1 = 0 nach y auf, so ergeben sich 2 zwei Funktionen y = ± 1 − x , wobei x ∈ [−1, 1] = D zu wählen ist. 1 0.5 2 1/2 y1=(1−x ) 2 1/2 y2=−(1−x ) y 0 −0.5 −1 −1 −0.5 0 x 0.5 1 2 Als weiteres Beispiel betrachten wir die Gleichung G(x, √ z) = z −x = 0. Aufgelöst nach z ergeben sich wieder zwei Funktionen z = ± x mit D = [0, ∞). 4 1/2 z1=x 1/2 z2=−x z 2 0 −2 −4 0 2 4 6 8 10 x 1 = 2√1 x . Man kann Die Ableitung des oberen Parabelastes kennen wir bereits:6 dz dx die Ableitung aber auch ohne Auflösen nach z erhalten, wenn man die Methode 6 Wir schreiben hier zum ersten mal statt z10 für die Ableitung der Funktion z1 nach der 20 KAPITEL 2. MATHEMATISCHE METHODEN der impliziten Differentiation verwendet: z 2 = x d dx dz = 1 dx 1 dz = . dx 2z Mit Hilfe dieses Ausdrucks erhalten wir auch gleich die Ableitungen für die beiden Funktionen: 1 dz2 1 dz1 = √ ; =− √ . dx 2 x dx 2 x Besonders hilfreich ist die Differentiation impliziter Funktionen, wenn es nicht möglich ist, die Gleichung F (x, y) = 0 nach y aufzulösen. Zum Beispiel F (x, y) = x3 + y 3 − 9xy : d x3 + y 3 − 9xy = 0 dx dy 2 2 dy − 9y − 9x = 0 3x + 3y dx dx 3y 2 − 9x y 0 = 9y − 3x2 9y − 3x2 y0 = . 3y 2 − 9x 2z Wir können die implizite Differentiation auch verwenden, um die Regel ( xn )0 = nxn−1 (siehe Gl. (2.3)) auf rationale α = m/n mit m, n ∈ Z zu verallgemeinern. Die Menge der rationalen Zahlen wird oft mit Q bezeichnet. Für x > 0 betrachten wir y = xm/n , also y n = xm . Damit ergibt sich d y n = xm dx dy = mxm−1 ny n−1 dx m xm−1 y0 = n y n−1 m xm−1 y0 = n (xm/n )n−1 m xm−1 n xm−m/n m m/n−1 x , = n y0 = y0 1 Variablen x, dz dx . Wir werden diese Bezeichnung für die Ableitung im folgenden häufiger ver1 wenden. Es gilt zu beachten, daß dz dx kein “Bruch” im eigentlichen Sinne ist. Man darf also in dz1 1 der Gleichung dx = 2√x nicht beide Seiten mit dx multiplizieren, da dx für sich genommen erst dann einen Sinn macht, wenn man den Umgang mit Differentialformen gelernt hat. 21 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN also für rationale α: ( xα )0 = αxα−1 . Aus der Schule kennen sie sicherlich das Konzept der Umkehrfunktion. Um diese einzuführen, müssen wir zunächst einen weiteren Begriff definieren: Eine Funktion f (allgemeiner eine Abbildung) heißt injektiv oder eineindeutig, falls für alle beliebigen Paare x1 6= x2 aus D auch f (x1 ) 6= f (x2 ). Nur wenn diese Eigenschaft erfüllt ist, kann man eine Funktion umkehren. D W f Dazu zwei Beispiele: nicht injektiv injektiv 1000 f(x)=x 100 3 f(x)=x 2 80 500 f(x) f(x) 60 0 40 −500 −1000 −10 20 −5 0 x 5 10 0 −10 −5 0 x 5 10 Für eine injektive Funktion kann man die Umkehrfunktion f −1 definieren. f -1 D W Für diese gilt dann für alle x ∈ Df f f −1 (f (x)) = x, und für alle x ∈ Wf = Df −1 (2.4) f (f −1(x)) = x. Wir betrachten zunächst einige einfache Beispiele zur Konstruktion von f −1 und −1 0 0 zur Berechnung von dfdx = (f −1 ) = f −1 bei gegebenem f . 22 KAPITEL 2. MATHEMATISCHE METHODEN 1/3 • f (x) = x3 : Da für x ≥ 0, (x3 ) = x gilt erhält man f −1 (x) = x1/3 , und 1/3 für x < 0 gilt − (−(x3 )) = x, also f −1 (x) = −(−x)1/3 . 2 f(x) −1 f (x) g(x) 1 0 −1 −2 −2 −1 0 x 1 2 0 Die Ableitung von f −1 für x > 0 ergibt sich zu f −1 (x) = 13 x−2/3 . Für x < 0 0 folgt mit Hilfe der Kettenregel f −1 (x) = 31 (−x)−2/3 . Damit ist, wie man auch der Abbildung entnimmt, der Wert der Ableitung von f −1 bei x gleich dem bei −x. • f (x) = ax + b, mit a = 2 und b = 1. Zur Bestimmung von f −1 lösen wir die Gleichung y = ax + b nach x auf x = a1 (y − b) und erhalten f −1 durch Vertauschen von x und y: f −1 (x) = a1 (x − b). 2 f(x) −1 f (x) g(x) 1 0 −1 −2 0 −2 −1 0 x 1 2 Es gilt f −1 (x) = a1 . Da f 0 (x) = a, finden wir, daß die Steigung der Inversen der linearen Funktion durch das Inverse der Steigung der linearen Funktion 2.2. DIFFERENTIALRECHNUNG EINER VERÄNDERLICHEN 23 selbst gegeben ist. Dieses ist die zentrale Beobachtung, mit deren Hilfe wir 0 f −1 (x) allgemein bestimmen können. Aus den obigen Abbildungen erkennt man eine allgemeingültige graphische Konstruktionsvorschrift, wie sich f −1 aus f bestimmen läßt: Durch Spiegelung an der Winkelhalbierenden g(x) = x. Aus dem zweiten Beispiel ergibt sich sofort 0 auch ein Konstruktionsprinzip für f −1 : Wenn die Tangente an f durch x0 , f (x0 ) die Steigung f 0 (x0 ) hat, so hat die Tangente an f −1 durch f (x0 ), f −1 (f (x0 )) die Steigung 1/f 0 (x0 ), so daß allgemein 0 f −1 (f (x0 )) = 1 f 0 (x0 ) (2.5) gilt. Weniger “konstruktiv” läßt sich Gl. (2.5) mit Hilfe der Definitionsgleichung Gl. (2.4) und der impliziten Differentiation herleiten (siehe Übungen). Mit Hilfe der Gl. (2.5) läßt sich z.B. die Ableitung der arctan-Funktion leicht bestimmen. sin x Mit f (x) = tan x = cos folgt nach der Quotientenregel x f 0 (x) = 1 cos2 x + sin2 x = . 2 cos x cos2 x Damit gilt also cos2 x0 1 1 2 = cos x = , = 0 2 0 2 f (x0 ) 1 + tan2 x0 sin x0 + cos x0 so daß sich nach Gl. (2.5) arctan0 (tan x0 ) = 1 1 + tan2 x0 und damit (arctan x)0 = 1 1 + x2 ergibt. Wie wir bereits in der Einleitung gesehen haben, benötigt man in der Mechanik auch höhere Ableitungen f (n) (x) einer Funktion f . Diese sind für n = 2, 3, 4, . . . rekursiv definiert dn f (x) d dn−1 f (x) . = dxn dx dxn−1 Für “kleine” n verwendet man auch die “n-Striche” (bzw. “n-Punkte”) Notation f 00 , f 000 , . . . . 24 KAPITEL 2. MATHEMATISCHE METHODEN Die trigonometrischen Funktionen haben dabei die interessante Eigenschaft (sin x)00 = (cos x)0 = − sin x , (cos x)00 = (− sin x)0 = − cos x . Damit gilt für die Funktion y(x) = a sin x+b cos x, y 00(x) = − (a sin x + b cos x) = −y(x). Umgeformt folgt y 00(x) + y(x) = 0. (2.6) Diese Gleichung führt uns auf ein sehr wichtiges weiteres Konzept: Die Differentialgleichung. Eine Differentialgleichung ist eine Gleichung, in der die Funktion y(x), ihre Ableitungen y 0 (x), y 00(x), . . . , y (n)(x) und x selbst auftreten. Ist die n-te Ableitung die höchste vorkommende, so spricht man von einer Differentialgleichung n-ter Ordnung. Gl. (2.6) ist also eine Differentialgleichung zweiter Ordnung. Im Allgemeinen ist es sehr kompliziert und oft unmöglich, die Lösung einer Differentialgleichung geschlossen (analytisch) anzugeben. Differentialgleichungen spielen in der Physik eine sehr wichtige Rolle. Zum Beispiel bildet die (eindimensionale) Newtonsche Gleichung mẍ(t) = F (x(t)) eine Differentialgleichung zweiter Ordnung. Ist nun die Kraft F proportional der Auslenkung x einer Masse m - was einer näherungsweisen Beschreibung der Rückstellkraft einer Feder entspricht - so ergibt sich das Hookesche Gesetz mẍ(t) = −Kx(t) (K heißt die Rückstellkonstante), oder ẍ(t) + K x(t) = 0 , m (2.7) was bis auf einen Faktor der Gleichung (2.6) entspricht. Um eine Lösung für Gl. (2.7) zu finden, müssen wir die Lösung von Gl. (2.6) noch leicht modifizieren. Dazu berechnen wir zunächst die ersten und zweiten Ableitungen von f (t) = sin (ωt) und g(t) = cos (ωt) mit Hilfe der Kettenregel f˙(t) = ω cos (ωt) ; f¨(t) = −ω 2 sin (ωt) = −ω 2 f (t) ġ(t) = −ω sin (ωt) ; g̈(t) = −ω 2 cos (ωt) = −ω 2 g(t). Bilden wir jetzt wieder die Linearkombination x(t) q = af (t) + bg(t), so ist diese Funktion x(t) eine Lösung von Gl. (2.7), falls ω = K . Im Problem der Bewegung m eines Teilchens der Masse m, welches mit einer Feder mit der Federkonstanten K verbunden ist, muß die Lösung x(t) jetzt noch zwei Anfangsbedingungen (oder Randbedingungen) erfüllen. Zur Zeit t = 0 soll das Teilchen am festgelegten Ort x0 sein, so daß b = x0 zu gelten p mhat, und es soll die Anfangsgeschwindigkeit v0 haben, woraus a = v0 /ω = v0 K folgt. Die Lösung der Newtonschen Gleichung lautet für diesen Fall somit r v0 K x(t) = x0 cos (ωt) + sin (ωt) mit ω = . (2.8) ω m 2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN 25 Eine genauere Diskussion der sich ergebenen oszillierenden Bewegung verschieben wir auf später (und die Experimentalphysik I Vorlesung). Wir werden in späteren Kapiteln mehrfach auf das Konzept der Differentialgleichung zurückkommen bevor wir uns mit diesem in einem eigenen Kapitel genauer vertraut machen. Zum Abschluß dieses Kapitels zwei wichtige Hinweise: Die vielen oben diskutierten Rechentricks sind bei der Bestimmung der Ableitung einer Funktion sehr hilfreich. Gerade für Physiker ist es jedoch auch legitim, sich durch graphische Darstellung der zu differenzierenden Funktion f (x) ein anschauliches Bild von der Ableitung f 0 (x) als Steigung von f (x) im Punkt x zu verschaffen - und sei es nur als Konsistenzcheck des formal gewonnenen Ergebnisses. Dazu untersucht man für die Funktion f am besten Fragen der Art: Wo ist die Steigung groß, wo klein? Ist sie positiv oder negativ? Wo findet ein Vorzeichenwechsel der Steigung statt? In der Physik kennt man die zu differenzierende Funktion oft nicht analytisch - z.B. wenn man eine (eindimensionale) Bahnkurve eines Teilchens x(t) experimentell bestimmt hat und an der Geschwindigkeit des Teilchens v(t) interessiert ist. In diesem Fall muß die Differentiation numerisch ausgeführt werden. Leider ist die numerische Differentiation kein sehr “stabiles” Verfahren, was heißt, daß sich kleine Meßfehler bei der numerischen Differentiation verstärken können (siehe spätere Mathematikvorlesungen). Die einfachste Form der numerischen Differentiation kennen sie sicherlich bereits aus der “Schulphysik”. Nehmen wir z.B. an, der Ort x eines Teilchens wurde zu den Zeiten tn = t0 + nh, mit n ∈ N0 und festem h, bestimmt. In diesem Fall können wir die Geschwindigkeit zur Zeit tn , v(tn ), näherungsweise zu v(tn ) = x(tn+1h)−x(tn ) (Vorwärtsdifferenzenn−1 ) quotient) bestimmen. Genauso legitim wäre eine Zuordnung v(tn ) = x(tn )−x(t h (Rückwärtsdifferenzenquotient). Eine glattere Kurve für die Geschwindigkeit lien−1 ) fert allerdings oft die Zuordnung v(tn ) = x(tn+1 )−x(t (zentrierter Differenzen2h quotient), bei der die Steigung im Punktepaar tn , x(tn ) gleich der Steigung der Sekante durch tn−1 , x(tn−1 ) und tn+1 , x(tn+1 ) gesetzt wird. 2.3 Integralrechnung einer Veränderlichen Bereits gegen Ende des letzten Kapitels haben wir Differentialgleichungen betrachtet. Wir wollen nun die einfachste Differentialgleichung erster Ordnung y 0 (x) = f (x) untersuchen. Wir suchen also zu einer gegebenen Ableitung y 0 (x) = f (x) eine zugehörige Funktion y(x) = F (x), so daß F 0 (x) = f (x) gilt. Man nennt eine Lösung der Differentialgleichung, also die Funktion F (x), eine Stammfunktion von f (x). Das sich stellende Problem ist die Umkehrung der Ableitung. Bereits im letzten Kapitel haben wir darauf hingewiesen, daß es im Allgemeinen kein “Rezept” gibt, die Lösung einer Differentialgleichung zu bestimmen. Gleiches gilt für das Finden einer Stammfunktion. Einfache Klassen von Stammfunktionen 26 KAPITEL 2. MATHEMATISCHE METHODEN 0 erhält man durch das Umdrehen der Ableitungsrelationen, z.B. (xn+1 ) = (n + 1 xn+1 + c, mit der beliebigen reellen Konstanten c, für 1)xn , so daß Fc (x) = n+1 n + 1 6= 0 eine Stammfunktion von f (x) = xn ist. Hier eine kleine Tabelle von Stammfunktionen Funktion f Stammfunktion F 1 n xn+1 + c x ; n 6= −1 n+1 sin (ax) ; a 6= 0 − a1 cos (ax) + c 1 cos (ax) ; a 6= 0 sin (ax) + c a 1 arctan x+c 1+x2 Aus der Definition der Stammfunktion ergibt sich eine offensichtliche Rechenregel: Ist F Stammfunktion von f und G Stammfunktion von g, so ist aF (x) + bG(x) Stammfunktion von af (x) + bg(x). Zum Beispiel können wir mit Hilfe dieser Regel eine Stammfunktion von f (x) = sin2 x bestimmen f (x) = sin2 x = ⇒ F (x) = 1 1 − cos (2x) 2 2 1 1 x − sin (2x) + c. 2 4 Zunächst einmal wollen wir noch die ihnen wahrscheinlich bekannte übliche Schreibweise (unbestimmtes Integral) Z F (x) = f (x) dx (2.9) für eine Stammfunktion F zur Funktion f vermeiden. Sie wäre an dieser Stelle eher verwirrend, denn speziell ist nicht klar, was der Ausdruck dx hier zu bedeuten hat. Stattdessen schreiben wir F (x) = SF [f (x)] . Als physikalisches Beispiel betrachten wir den freien, senkrechten Fall eines Steins. Die Newtonsche Gleichung für die zeitabhängige Geschwindigkeit v(t) (nach unten) lautet in diesem Fall dv(t) = g ; mit der Erdbeschleunigung g ≈ 9, 81m/s2. dt Sie stellt damit eine Differentialgleichung von dem soeben diskutierten Typ dar, wobei die Funktion f (t) durch die konstante Funktion f (t) = g gegeben ist. Eine Stammfunktion zu f (t) = g wird durch v(t) = gt + c gegeben. Setzt man nun t = 0, so folgt v(0) = c, mit der Anfangsgeschwindigkeit v(0), so daß wir bei vorgegebener Anfangsgeschwindigkeit auch v(t) = v(0) + gt schreiben können. Aus den Umkehrungen der Produkt- und der Kettenregel für die Differentiation ergeben sich zwei wichtige Tricks zur Bestimmung der Stammfunktion. 27 2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN • Die Produktregel lautet (f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x) woraus sich SF [f 0 (x)g(x) + f (x)g 0(x)] = f (x)g(x) oder SF [f 0 (x)g(x)] = f (x)g(x) − SF [f (x)g 0(x)] (2.10) ergibt. Kennt man also eine Stammfunktion von f (x)g 0 (x) (oder f 0 (x)g(x)), so folgt eine von f 0 (x)g(x) (oder f (x)g 0 (x)) mit Hilfe von Gl. (2.10). Man nennt diesen Rechentrick partielle Integration - eine Bezeichnung, deren Ursprung erst später klar werden wird. Als Beispiel betrachten wir f (x) = sin x ; g(x) = x ⇒ f 0 (x) = cos x ; g 0 (x) = 1 ⇒ SF [x cos x] = x sin x − SF [sin x] = x sin x + cos x + c • Sei F (x) eine Stammfunktion von f (x) und g(x) eine differenzierbare Funktion, so lautet die Kettenregel d F (g(x)) = F 0 (g(x))g 0(x) = f (g(x))g 0(x). dx Damit gilt die Substitutionsregel SF [f (g(x))g 0(x)] = F (g(x)). (2.11) Zum Beispiel f (x) = sin x ; g(x) = x2 ⇒ F (x) = − cos x ; 2 ⇒ SF 2x sin x = − cos x2 + c g 0(x) = 2x Die beiden Beispiele zeigen, wie man die Liste der Stammfunktionen mit Hilfe dieser Tricks beliebig verlängern kann. In der Praxis ergibt sich jedoch eine andere Situation. Eine Funktion ist gegeben, und man muß sehen, ob die obigen Rechenregeln bei der Suche nach einer Stammfunktion weiterhelfen. Betrachten √ wir dazu ein Beispiel: Wir wollen eine Stammfunktion zur Funktion h(x) = x 1 − x bestimmen. Es ist klar, daß der√Faktor x durch Differenzieren einfacher wird. Eine Stammfunktion des Faktors 1 − x läßt sich leicht mit Hilfe der Substitutionsregel bestimmen: f (x) = −x1/2 ⇒ g(x) = 1 − x ⇒ ⇒ 2 F (x) = − x3/2 3 0 f (g(x))g (x) = −(1 − x)1/2 (−1) = (1 − x)1/2 √ 2 SF 1 − x = − (1 − x)3/2 + c 3 28 KAPITEL 2. MATHEMATISCHE METHODEN Um gleich die partielle Integration anwenden zu können, benötigen wir auch eine Stammfunktion von − 23 (1 − x)3/2 2 f (x) = x3/2 3 ⇒ g(x) = 1 − x ⇒ F (x) = 2 2 5/2 x 35 2 2 f (g(x))g 0(x) = (1 − x)3/2 (−1) = − (1 − x)3/2 3 3 2 22 ⇒ SF − (1 − x)3/2 = (1 − x)5/2 + c 3 35 √ Damit können wir jetzt SF[x 1 − x] mit partieller Integration berechnen: √ f 0 (x) = 1 − x ; g(x) = x √ 22 2 ⇒ SF x 1 − x = − x(1 − x)3/2 − (1 − x)5/2 + c 3 35 Von der Richtigkeit des Ergebnisses überzeugt man sich am besten immer durch Differenzieren. Ein sehr hilfreiches Konzept bei der Bestimmung einer Stammfunktion einer gebrochen rationalen Funktion f (x) = p(x)/q(x), mit Polynomen p(x) und q(x) ist die Partialbruchzerlegung. Wie oben diskutiert läßt sich jede echt gebrochene rationale Funktion als Summe von Partialbrüchen der Form a1 /(x − x0 ), a2 /(x−x0 )2 , . . . und (b1 x+c1 )/(x2 +rx+s), (b2 x+c2 )/(x2 +rx+s)2 ,. . . schreiben. Bis auf den Term der Form a1 /(x − x0 ) können für diese Summanden mit dem was wir bereits gelernt haben getrennt Stammfunktionen angegeben werden. Eine Stammfunktion von f (x) ergibt sich dann durch Aufsummation der Stammfunktionen der einzelnen Summanden. Mit Hilfe der Substitution und dem ersten Eintrag in unserer kleinen Liste von Stammfunktionen sieht man leicht, daß 1 1 SF (x − x0 )−k = − + c , k = 2, 3, . . . . k − 1 (x − x0 )k−1 Für den Fall k = 1 werden wir im nächsten Kapitel zeigen, daß SF (x − x0 )−1 = ln |x − x0 | + c , (2.12) mit der ihnen sicherlich aus der Schule bekannten natürlichen Logarithmusfunktion ln (x). Wir wollen Vorgreifen und dieses Ergebnis bereits hier verwenden. Zur Bestimmung einer Stammfunktion der Summanden der Form (b1 x + c1 )/(x2 + rx + s) gehen wir wie folgt vor. Es gilt b 2x + r − r + 2c/b bx + c = SF SF 2 x + rx + s 2 x2 + rx + s b rb 1 2x + r = SF 2 + c− SF 2 x + rx + s 2 (x + r/2)2 + s − r 2 /4 c − rb/2 2x + r 1 b + . SF = SF 2 2 x + rx + s s − r 2 /4 (x + r/2)2 /(s − r 2 /4) + 1 2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN 29 Anwenden der Substitutionsregel zusammen mit Gl. (2.12) (erster Summand) und dem letzten Eintrag unserer Liste von Stammfunktionen (zweiter Summand) liefert das Ergebnis bx + c x + r/2 b c − rb/2 SF 2 arctan p + c(2.13) . = ln x2 + rx + s + p x + rx + s 2 s − r 2 /4 s − r 2 /4 Für höhere Potenzen (bx + c)(x2 + rx + s)l , mit l = 2, 3, 4, . . . gilt bx + c 1 d bx + c SF =− . SF (x2 + rx + s)l l − 1 ds (x2 + rx + s)l−1 Durch wiederholtes Anwenden dieser Beziehung können die bei der Stammfunktionsbildung einer echt gebrochen rationalen Funktion auftretenden Terme dieser Form (also nach einer Partialbruchzerlegung der Funktion) auf das Ergebnis Gl. (2.13) und mehrfache Differentiation zurückgeführt werden. Auch wenn dieses Kapitel mit “Integralrechnung” überschrieben ist, haben wir bis hierher nur von der Umkehrung der Differentiation und nicht von der Integration geredet. Wir wollen nun die Integralrechnung über den Zusammenhang zwischen der Stammfunktion und der Flächenberechnung einführen. Für eine stetige Funktion f (x) wollen wir die dunkel dargestellte Fläche für festes c als Funktion von x0 betrachten und bezeichnen sie mit F̃ (x0 ): F̃ (x0 ) = Fläche zwischen f (x) und der x-Achse von c bis x0 14 12 f(x) 10 8 6 4 2 0 0 1 2 3 4 x c 5 x0 Wir untersuchen nun die Ableitung dieser Funktion F̃ (x0 ) F̃ (x0 + h) − F̃ (x0 ) . h→0 h F̃ 0 (x0 ) = lim Aufgrund der Definition von F̃ (x0 ), ist F̃ (x0 + h) − F̃ (x0 ) die Fläche zwischen f (x) und der x-Achse von x0 bis x0 + h. 30 KAPITEL 2. MATHEMATISCHE METHODEN 14 12 f(x) 10 8 6 4 x0 x0 +h 2 0 0 1 2 3 4 5 x Vergrößert ergibt sich folgende Situation f(x0) f(x0+h) x0 x 0 +h x0 +α h Wie man in der Skizze erkennt, gibt es ein α ∈ R mit 0 < α ≤ 1, so daß die Fläche F̃ (x0 + h) − F̃ (x0 ) gleich der Fläche hf (x0 + αh) eines Rechtecks ist (man nennt dieses den Mittelwertsatz, den sie in der HöMa Vorlesung “korrekt” beweisen werden). Dabei kennen wir α nicht, was aber im folgenden keine Rolle spielen wird. Wir haben damit F̃ (x0 + h) − F̃ (x0 ) h→0 h hf (x0 + αh) = lim h→0 h = f (x0 ). F̃ 0 (x0 ) = lim Es ergibt sich also F̃ 0 (x0 ) = f (x0 ), was bedeutet, daß F̃ eine Stammfunktion von f ist. Wir schreiben damit statt F̃ jetzt F . Als nächstes betrachten wir die Fläche zwischen f (x) und der x-Achse von einem festen a bis zu einem festen b. 2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN 31 14 12 f(x) 10 8 6 4 2 0 0 1 a 2 3 x 4 5 b Die übliche Bezeichnung für diese Fläche ist Z b f (x) dx = Fläche zwischen f (x) und der x-Achse von a bis b, a so daß wir Z a b f (x) dx = F (b) − F (a) (2.14) schreiben können. Die beliebige Konstante, die wir bei der Bestimmung einer Stammfunktion F immer hinzuaddieren mußten, fällt auf der rechten Seite dieser Gleichung dabei heraus. Man bezeichnet den Zusammenhang in Gl. (2.14) als Hauptsatz der Differential- und Integralrechnung. Er stellt einen Zusammenhang zwischen dem Problem der Bestimmung einer Stammfunktion und dem Problem der Flächenberechnung her. Man bezeichnet die linke Seite von Gl. (2.14) auch als bestimmtes Integral. Bei den obigen Überlegungen haben wir uns keine Gedanken darüber gemacht, wie Flächen mit krummlinigen Begrenzungen (durch die Funktion f (x)) überhaupt sauber definiert sind. Als Grenzprozedur läßt sich das z.B. mit Hilfe der Riemann-Summe erreichen 32 KAPITEL 2. MATHEMATISCHE METHODEN 14 12 f(x) 10 8 6 4 2 0 0 1 a Z b f (x) dx = lim N →∞ a 2 ∆x N X 3 x f (a + i∆x) ∆x ; i=1 4 5 b ∆x = b−a N Diese Formel gibt auch eine Möglichkeit ein bestimmtes Integral numerisch zu berechnen. Es gibt aber weit geschicktere numerische Berechnungsmöglichkeiten als die obige Rechteckregel, wie z.B. die Trapezregel oder noch besser die SimpsonRegel. Als ein Beispiel der Flächenmessung (bestimmte Integration) betrachten wir f (x) = sin x 1 f(x)=sin(x) 0.8 f(x) 0.6 0.4 0.2 0 Z 0 π 0 π/2 x π sin x dx = − cos π − (− cos 0) = − cos x|π0 = 2 2.3. INTEGRALRECHNUNG EINER VERÄNDERLICHEN 33 Es soll hier noch angemerkt werden, daß die Bezeichnung der Integrationsvariablen willkürlich ist, also Z b f (x) dx = a Z b f (u) du a gilt. Jetzt wollen wir die Regeln zur Bestimmung der Stammfunktion so umformulieren, daß wir mit ihrer Hilfe bestimmte Integrale berechnen können. Betrachten wir zunächst die Substitutionsregel. Aus SF [f (g(x))g 0(x)] = F (g(x)) folgt Z b f (g(x))g 0(x) dx = F (g(b)) − F (g(a)) Z g(b) = f (u) du , a (2.15) g(a) indem wir zweimal den Hauptsatz anwenden. Um den Anschluß an Lehrbücher zu finden, diskutieren wir diese Regel auch in der üblicheren Formulierung, die sich gut als Merkregel eignet. Dabei führt man die “Substitution” du = g 0 (x) dx du ⇒ f (g(x))g 0(x) dx = f (u) dx“ = ”f (u) du dx u = g(x) ⇒ aus. Das letzte Gleichheitszeichen steht dabei in Anführungszeichen, damit man nicht vergißt, daß auch die Integrationsgrenzen verändert werden müssen (siehe Gl. (2.15)). In unserer ursprünglichen Herleitung mußten wir jedoch keine infinitesimalen Größen kürzen, was ein klarer Vorteil ist. Der Umgang mit diesen Größen kann formalisiert werden, wenn man den Begriff der Differentialform einführt, wozu wir jedoch hier keine Zeit haben. Dieser Begriff wird speziell in der Thermodynamik gebraucht. Die Produktregel übersetzt sich wie folgt auf bestimmte Integrale: Wegen Z a b dG(x) dx = G(b) − G(a) = G(x)|ba dx folgt durch Integration von (f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0(x) Z b 0 f (x)g(x) dx = a f (x)g(x)|ba − Z b f (x)g 0 (x) dx , (2.16) a was die Bezeichnung partielle Integration erklärt. Beispiele werden sie in den Übungen rechnen. 34 2.4 KAPITEL 2. MATHEMATISCHE METHODEN Logarithmus- und Exponentialfunktion Wir wollen als nächstes eine über ein Integral definierte Funktion L(x) = Z x 1 1 du , u x>0 (2.17) betrachten. 4 f(u)=1/u f(u) 3 2 x 1 0 0 1 2 u 3 4 Nach der Definition gilt L(1) = 0 und L(x) > 0 für x > 1. Für den Fall 0 < x < 1 ist das Integral in Gl. (2.17) genauso wie in Gl. (2.14) definiert, was, da hier f (u) > 0 für alle u > 0 gilt, dazu führt, daß die Fläche zwischen f (u) und der u-Achse von 1 bis x, also L(x), negativ ist. Es gilt also L(x) < 0 für 0 < x < 1. L(x) ist weiterhin monoton wachsend. Für a > 0 betrachten wir Z ax 1 du u Z1 a Z ax 1 1 = du + du u 1 u a Z ax 1 = L(a) + du. u a L(ax) = Im verbleibenden Integral verwenden wir die Substitution Z ax a 1 du = u = Z ax Za ax a a1 du ua f (g(u))g 0(u) du 35 2.4. LOGARITHMUS- UND EXPONENTIALFUNKTION mit f (v) = 1/v und g(v) = v/a. Nach Gl. (2.15) gilt damit Z x 1 dt 1 t = L(a) + L(x), L(ax) = L(a) + (2.18) also z.B. für n ∈ N, L(xn ) = nL(x). Gl. (2.18) ist die bekannte Funktionalrelation für die Logarithmusfunktionen. Die durch Gl. (2.17) definierte Funktion wird als natürlicher Logarithmus bezeichnet, und wir schreiben ab jetzt ln(x) statt L(x) ln (x) = Z x 1 1 dt , x > 0. t Man definiert eine wichtige Zahl e - die Eulersche Zahl - über die Gleichung ln (e) = 1. 2 f(x)=ln(x) f(x) 1 0 e=2.718282... −1 −2 0 1 2 3 4 5 x Aus der Skizze sieht man, daß e in der Nähe von 2.7 liegt. Genauer gilt e = 2.718282 . . .. Nach dem Hauptsatz folgt (ln (x))0 = 1/x. Für x → ∞ strebt auch ln (x) gegen ∞, was man z.B. wie folgt sehen kann: Sei n ∈ N; dann gilt ln (en x) = ln (en ) + ln (x) = n ln (e) + ln (x) = n + ln (x). Für n → ∞ streben das Argument en x und der Funktionswert gegen ∞. Die Umkehrfunktion ln−1 (x) des natürlichen Logarithmus - die Logarithmusfunktion ist injektiv - bezeichnet man als Exponentialfunktion und kürzt sie exp (x) ab. Sie hat den Definitionsbereich Dexp = R. 36 KAPITEL 2. MATHEMATISCHE METHODEN 4 f(x)=ln(x) f(x)=exp(x) f(x)=x f(x) 2 0 −2 −4 −4 −2 0 x 2 4 Es gilt also exp (ln (x)) = x für x ∈ {x ∈ R|x > 0} = Dln = Wexp ln (exp (x)) = x für x ∈ R = Dexp = Wln. Aus der Funktionalgleichung des Logarithmus wollen wir jetzt eine entsprechende Gleichung für exp (x) herleiten. Für a, b > 0 folgt mit a = exp (ln (a)) und b = exp (ln (b)) exp (ln (ab)) = ab = exp (ln (a)) exp (ln (b)). Die linke Seite dieser Gleichung kann nach Gl. (2.18) zu exp (ln (ab)) = exp (ln (a) + ln (b)) umgeformt werden. Damit gilt dann exp (ln (a) + ln (b)) = exp (ln (a)) exp (ln (b)) oder, da a, b > 0 beliebig waren, exp (x + y) = exp (x) exp (y). (2.19) Diese Funktionalrelation sollte ihnen von den Potenzgesetzen bekannt vorkommen: xn xm = xn+m . In dieser Vorlesung haben wir sie bereits mehrfach benutzt. Aus Gl. (2.19) folgt für x = y = 0, daß exp (0) = 1 gilt (was natürlich auch aus der Definition von exp (x) als Umkehrfunktion von ln (x) und ln (1) = 0 folgt), und für y = −x ergibt sich damit exp (−x) = 1 . exp (x) (2.20) 2.4. LOGARITHMUS- UND EXPONENTIALFUNKTION 37 Eine wiederholte Anwendung von Gl. (2.19) liefert exp (x1 + x2 + . . . + xn ) = exp (x1 ) exp (x2 ) . . . exp (xn ). (2.21) Aus e = exp (ln (e)) und ln (e) = 1 folgt exp (1) = e, sowie aus Gl. (2.21) mit xi = 1 für alle i = 1, 2, . . . , n exp (n) = en . Mit Gl. (2.20) gilt dann auch exp (−n) = 1 = e−n , en d.h. für alle n ∈ Z ist die Exponentialfunktion die Potenzfunktion zur Basis e. Diese Aussage gilt auch für rationale α ∈ Q mit α = n/m n n n m n · exp · . . . · exp exp = exp m m m m} | {z m−mal n n n = exp + + ...+ m m m = exp (n) = en , wobei wir Gl. (2.21) verwendet haben. Ziehen wir jetzt die m-te Wurzel, so folgt n = en/m . exp m Da man jeder Zahl aus R mit einem α ∈ Q beliebig nahe kommen kann (siehe die HöMa Vorlesung), gilt für alle x ∈ R exp (x) = ex . Aus der Schule sind sie es wahrscheinlich gewohnt, daß beide Ausdrücke (Exponentialfunktion und Potenz zur Basis e) von Anfang an synonym verwendet werden, was wir im folgenden ebenfalls tun werden. Die Ableitung der Exponentialfunktion können wir mit Hilfe von Gl. (2.5), 0 also f −1 (f (x)) = f 01(x) , für f (x) = ln (x), d.h. f 0 (x) = 1/x bestimmen: exp0 (ln x) = x ⇒ exp0 (z) = exp (z) Damit erfüllt die Exponentialfunktion y(x) = exp (x) die in der Physik sehr wichtige Differentialgleichung y 0(x) = y(x), die man als Wachstumsgleichung bezeichnen kann. (2.22) 38 2.5 KAPITEL 2. MATHEMATISCHE METHODEN Potenzreihen und Taylorentwicklung Nach einem kleinen Einschub, werden wir auf Gl. (2.22) zurückkommen und mit ihrer Hilfe die Reihendarstellung der Exponentialfunktion herleiten. Zunächst soll aber erklärt werden, was eine Potenzreihe ist. Dazu betrachten wir die Funktionen (N ∈ N0 , x ∈ R) 2 3 N SN (x) = 1 + x + x + x + . . . + x = N X xn . n=0 Indem wir diese Gleichung mit x multiplizieren und mit +1−1 erweitern, erhalten wir einen geschlossenen Ausdruck für SN (x) xSN (x) = 1 + x + x2 + . . . + xN + xN +1 − 1 = SN (x) + xN +1 − 1 ⇒ (1 − x)SN (x) = 1 − xN +1 1 − xN +1 ⇒ SN (x) = . 1−x Für |x| < 1 geht der Term xN +1 im Zähler für N → ∞ gegen Null, d.h. lim SN (x) = N →∞ 1 für |x| < 1. 1−x Man kann die Funktion 1/(1 − x) für |x| < 1 also auch als unendliche Reihe (auch Potenzreihe genannt) ∞ X 1 = xn für |x| < 1 1 − x n=0 schreiben. Eine allgemeine Potenzreihe hat die Form f (x) = ∞ X an xn n=0 mit an ∈ R. Für die gerade diskutierte spezielle so genannte geometrische Reihe gilt an = 1 für alle n ∈ N0 . Die Frage für welche x eine unendliche Reihe (die durch die Angabe aller an charakterisiert ist) überhaupt auf einen endlichen Wert führt, d.h. konvergiert, werden wir hier nur am Rande betrachten. Sehr genau werden sie diese Frage in der HöMa I Vorlesung untersuchen. Fast alle (in der Physik) wichtigen Funktionen lassen sich durch Potenzreihen darstellen, so z.B. auch die Exponentialfunktion. Um für diesen Fall die Entwicklungskoeffizienten an zu bestimmen betrachten wir die Differentialgleichung 2.5. POTENZREIHEN UND TAYLORENTWICKLUNG 39 (2.22) y(x) = y 0 (x), von der wir bereits wissen, daß sie von der Exponentialfunktion gelöst wird. Wir machen den Ansatz7 y(x) = ∞ X n an x ⇒ n=0 0 y (x) = ∞ X an nxn−1 . n=1 Dabei haben wir die unendliche Reihe summandenweise differenziert, was nur dann erlaubt ist, wenn die Reihe bestimmte Konvergenzeigenschaften hat (siehe die HöMa I Vorlesung). Umbenennen der Summationsvariablen n = ñ+1 in y 0 (x) liefert ∞ ∞ X X y 0(x) = añ+1 (ñ + 1)xñ = an+1 (n + 1)xn . n=0 ñ=0 Bildet man jetzt y 0(x) − y(x), was nach der Differentialgleichung gleich Null ist, so folgt8 ∞ X n=0 ((n + 1)an+1 − an ) xn = 0 eine Gleichung, die sicherlich dann erfüllt ist, wenn (n + 1)an+1 − an = 0 für alle n ∈ N0 (2.23) gilt. Daß dieses Kriterium nicht nur hinreichend, sondern auch notwendig ist, werden sie in der HöMa I Vorlesung beweisen (Identitätssatz für Potenzreihen). Gl. (2.23) kann nun wie folgt umgeformt werden an+1 = = = = = 1 an n+1 1 1 an−1 n+1 n 1 1 1 an−2 n+1 n n−1 ... 1 a0 . (n + 1)! Die Lösung von y 0(x) = y(x) lautet damit ∞ X 1 n x , y(x) = a0 n! n=0 7 Das Lösen von Differentialgleichungen durch einen Potenztreihenansatz ist ein häufig verwendetes Verfahren. 8 Wir haben hier die beiden Summen unter ein Summenzeichen geschrieben. Auch diese Operation ist nur dann zulässig, wenn die unendliche Reihe bestimmte Konvergenzeigenschaften erfüllt, die sie in der HöMa I Vorlesung kennenlernen werden. 40 KAPITEL 2. MATHEMATISCHE METHODEN mit der zunächst noch freien Konstanten a0 ∈ R, woraus y(0) = a0 folgt.9 Von der Exponentialfunktion wissen wir jedoch bereits, daß exp (0) = 1 gilt. Damit hat dann also die Exponentialfunktion die Potenzreihenentwicklung x exp (x) = e = ∞ X xn n=0 n! . (2.24) Diese Reihe konvergiert für alle x ∈ R (im Gegensatz zur geometrischen Reihe, die nur für |x| < 1 konvergiert), was sie in HöMa I beweisen werden. Wenn man eine Reihendarstellung für eine Funktion kennt, dann ist es interessant zu untersuchen, ob man die “komplizierte” Funktion (also z.B. die Exponentialfunktion), nicht bereits durch ein paar wenige “einfache” Summanden der Potenzreihe gut approximieren (nähern) kann. Die folgende Abbildung zeigt dazu ein Beispiel. 8 exp(x) 1 1+x 2 1+x+x /2! 2 3 1+x+x /2!+x /3! 2 3 4 1+x+x /2!+x /3!+x /4! 6 4 2 0 −2 −1 0 x 1 2 Man erkennt, daß für −1 ≤ x ≤ 1 bereits die ersten fünf Summanden eine sehr gute Näherung für die Exponentialfunktion liefern. In dem betrachteten Beispiel ist es tatsächlich so daß die Polynome gN (x) = N X xn n=0 n! für wachsendes N eine systematische Verbesserung der Approximation liefern speziell in der Nähe von x = 0. Schaut man nur lange genug auf diese Abbildung, so fällt einem auf, daß die Übereinstimmung der Funktionen in der Nähe von Null etwas mit der Gleichheit 9 Dies ergibt sich da 00 = 1 gilt. 2.5. POTENZREIHEN UND TAYLORENTWICKLUNG 41 von Ableitungen von exp (x) und den gN (x) bei x = 0 zu tun hat. Für die Exponentialfunktion f (x) = exp (x) gilt f (k) (0) = 1 da f (k) (x) = exp (x). Für die Polynome gN (x) ergibt sich (k) gN (0) = 1 für k ≤ N 0 für k > N, so, daß für gN (x) die ersten N Ableitungen bei x = 0 mit denen der Exponentialfunktion übereinstimmen. Diese Beobachtung können wir nun zu einem Konstruktionsprinzip zur Bestimmung einer polynomialen Näherung von Funktionen um einen gegebenen Punkt herum (lokale Näherung) machen. Bei der Diskussion der Ableitung als lineare Approximierbarkeit haben wir es in gewissem Sinne bereits kennengelernt: Die Gleichung für die Tangente an eine Funktion ist das Polynom ersten Grades g1 (x) und liefert eine Näherung für die Funktion. Man nennt ein Polynom vom Grad n, wenn der Summand mit der höchsten auftretenden Potenz von x derjenige proportional zu xn ist. Betrachten wir also die allgemeine Funktion f (x). Wir wollen nun die Koeffizienten an des Polynoms gN (x) = a0 + a1 x + a2 x2 + . . . + aN xN so bestimmen, daß die ersten N Ableitungen von gN (x) mit denen der Funktion f (x) bei x = 0 übereinstimmen. Betrachten wir ein m ≤ N, so gilt (m) gN (0) = am m! . Damit ist klar, daß wir, um die Forderung zu erfüllen, an = 1 (n) f (0) n! (2.25) wählen müssen. Es ergibt sich somit gN (x) = f (0) + 1 1 (N ) 1 0 f (0)x + f 00 (0)x2 + . . . + f (0)xN . 1! 2! N! (2.26) Man nennt diese Näherung von f (x) durch gN (x) die Taylorentwicklung um den Punkt x = 0. In den Übungen haben sie sie bereits kennengelernt und g3 (x) für zwei Beispielfunktionen berechnet. • f (x) = 1 1−x : g3 (x) = 1 + x + x2 + x3 42 KAPITEL 2. MATHEMATISCHE METHODEN 8 1/(1−x) 1 1+x 2 1+x+x 2 3 1+x+x +x 2 3 4 1+x+x +x +x 6 4 2 0 −1 0 x 1 Die sich ergebenden Terme sind aber gerade die ersten Summanden der geometrischen Reihe, so daß wir wissen, daß die Taylorentwicklung für immer größere N und |x| < 1 eine immer bessere Näherung liefert. Für N → ∞ spricht man dann auch von der Taylorreihe. Für dieses Beispiel konvergiert die über die Ableitungen von f definierte Taylorreihe (für |x| < 1) gegen die Funktion f , was jedoch nicht immer der Fall sein muß (wie sie in späteren Vorlesungen genauer untersuchen werden). √ • f (x) = 1 + x : g3 (x) = 1 + 21 x − 12 14 x2 + 21 14 36 x3 Als weiteres Beispiel wollen wir hier die Funktion f (x) = ln (x + 1) um x = 0 Taylor-entwickeln.10 Nach Gl. (2.26) benötigen wir die Ableitungen von f (x) bei x = 0: f (x) = ln (x + 1) ⇒ f (0) = ln (1) = 0 1 f 0 (x) = ⇒ f 0 (0) = 1 = (−1)0 0! x+1 1 f 00 (x) = (−1) ⇒ f 00 (0) = −1 = (−1)1 1! (x + 1)2 1 ⇒ f 000 (0) = 2 = (−1)2 2! f 000 (x) = (−1)(−2) 3 (x + 1) 1 ⇒ f (4) (0) = −6 = (−1)3 3! f (4) (x) = (−1)(−2)(−3) (x + 1)4 ... = ... 1 f (N ) (x) = (−1)N −1 (N − 1)! ⇒ f (N ) (0) = (−1)N −1 (N − 1)! (x + 1)N 10 Da ln (x) bei x = 0 divergiert - gegen −∞ geht - untersuchen wir die Funktion ln (x + 1). 43 2.5. POTENZREIHEN UND TAYLORENTWICKLUNG Die Koeffizienten der Taylorentwicklung ergeben sich dann nach Gl. (2.25) zu an = 1 1 1 (n) f (0) = (−1)n−1 (n − 1)! = (−1)n−1 , n! n! n also gilt gN (x) = N X 1 (−1)n−1 xn . n n=1 1 0 −1 ln(1+x) 0 0+x 2 0+x−x /2 2 3 0+x−x /2+x /3 2 3 4 0+x−x /2+x /3−x /4 −2 −3 −1 −0.5 0 x 0.5 1 Bisher haben wir die Funktion f immer um den Punkt x = 0 entwickelt, d.h. die ersten N Ableitungen von gN und f stimmen im Punkt x = 0 überein. Möchte man jedoch die Funktion f in der Umgebung eines beliebigen Punktes x0 näherungsweise durch ein Polynom gN beschreiben, so bietet es sich an die an so zu bestimmen, daß die Ableitungen bei x0 übereinstimmen gN (x) = f (x0 ) + + 1 0 1 f (x0 )(x − x0 ) + f 00 (x0 )(x − x0 )2 + . . . 1! 2! 1 (N ) f (x0 )(x − x0 )N . N! Als Beispiel betrachten wir wieder die Exponentialfunktion f (x) = exp (x) jetzt aber bei x0 = 1. Es gilt f (k) (1) = e da f (k) (x) = exp (x), so daß sich 1 1 1 (x − 1)N gN (x) = e 1 + (x − 1) + (x − 1)2 + . . . + 1! 2! N! 44 KAPITEL 2. MATHEMATISCHE METHODEN ergibt. Die Abbildung macht deutlich, daß g4 (x) mit den Koeffizienten der Entwicklung um den Punkt x = 1 in der Nähe von x = 1 eine wesentlich bessere Näherung an die Exponentialfunktion liefert als das g4 (x) mit den aus der Entwicklung um x = 0 bestimmten an . 8 exp(x) 2 3 4 1+x+x /2!+x /3!+x /4! 2 3 4 e[1+(x−1)+(x−1) /2!+(x−1) /3!+(x−1) /4!] 6 4 2 0 −2 −1 0 x 1 2 Wie in diesem Beispiel lassen sich auch andere Funktionen um Punkte x0 Taylorentwickeln. 2.6 Hyperbolische und trigonometrische Funktionen als Potenzreihen: die imaginäre Einheit i Die so genannten Hyperbelfunktionen Sinushyperbolikus sinh x und Kosinushyperbolikus cosh x sind über die Exponentialfunktion definiert ex − e−x ; sinh x = 2 ex + e−x cosh x = . 2 (2.27) 2.6. HYPERBOLISCHE UND TRIGONOMETRISCHE FUNKTIONEN 45 Drücken wir die Exponentialfunktion nun durch ihre Potenzreihendarstellung Gl. (2.24) aus, so ergibt sich ex + e−x 2 ! ∞ ∞ 1 X xn X (−x)n = + 2 n=0 n! n=0 n! cosh x = ∞ 1X xn = (1 + (−1)n ) 2 n=0 n! ∞ X x2n = , (2n)! n=0 (2.28) da 1 + (−1)n = 2 1 für n gerade 0 für n ungerade. Analog folgt ex − e−x 2 ! ∞ ∞ 1 X xn X (−x)n = − 2 n=0 n! n=0 n! sinh x = ∞ 1X xn = (1 − (−1)n ) 2 n=0 n! = ∞ X n=0 x2n+1 . (2n + 1)! (2.29) Die Ableitungen von sinh x und cosh x bestimmt man mit Hilfe der Definitionsgleichung (2.27) oder durch gliedweises Differenzieren der Reihendarstellungen: x 0 e − e−x ex + e−x 0 sinh x = = cosh x = 2 2 oder 0 sinh x = ∞ X n=0 x2n+1 (2n + 1)! !0 ∞ X (2n + 1) x2n = cosh x. = (2n + 1) (2n)! n=0 Analog folgt cosh0 x = sinh x. 46 KAPITEL 2. MATHEMATISCHE METHODEN Wie bei den trigonometrischen Funktionen definiert man auch noch den Tangenshyperbolikus tanh x = sinh x cosh x und den Kotangenshyperbolikus coth x = cosh x . sinh x In der folgenden Abbildung sind die vier hyperbolischen Funktionen dargestellt. 4 2 0 sinh(x) cosh(x) tanh(x) coth(x) −2 −4 −4 −2 0 x 2 4 Um jetzt auch die trigonometrischen Funktionen als Potenzreihen darzustellen, betrachten wir zunächst einmal die Differentialgleichung zweiter Ordnung, die y(x) = eax = exp (ax) erfüllt. Es gilt (eax )0 = aeax ⇒ (eax )00 = a2 eax , so daß y 00 (x) − a2 y(x) = 0 folgt. Im Anschluß an Gl. (2.6) (siehe auch Gl. (2.7)) hatten wir gezeigt, daß y(x) = b sin (ax) + c cos (ax), mit a, b, c ∈ R die Differentialgleichung y 00(x) + a2 y(x) = 0 erfüllt. Erweitern wir jetzt die reellen Zahlen um die imaginäre Einheit i mit der Eigenschaft i2 = −1 47 2.6. HYPERBOLISCHE UND TRIGONOMETRISCHE FUNKTIONEN so erfüllt iax e = ∞ X (iax)n n=0 die Differentialgleichung (2.30) n! y 00 (x) − (ia)2 y(x) = y 00 (x) − i2 a2 y(x) = y 00(x) + a2 y(x) = 0 deren Lösung wir bisher als y(x) = b sin (ax)+c cos (ax) geschrieben hatten. Dabei haben wir i bezüglich der Rechenregeln wie eine gewöhnliche Zahl behandelt, also z.B. (ia)2 = i2 a2 , dann aber verwendet, daß i2 = −1 gilt. Betrachten wir nun den Spezialfall a = 1. Für die Lösung der Differentialgleichung y 00 (x) + y(x) = 0 in der bisherigen Form können wir dann y(x) = c cos x + b sin x schreiben, wobei die Randbedingungen (bzw. Anfangsbedingungen) durch y(0) = c und y 0(0) = b gegeben sind. Für die Lösung in der neuen Form eix ergeben sich die Randbedingungen 0 eix |x=0 = ei0 = e0 = 1 und eix |x=0 = ieix |x=0 = i. Sollen beide Lösungen die gleiche Funktion darstellen, so müssen nicht nur die Differentialgleichungen identisch sein, sondern auch die Randbedingungen. Setzen wir also c = 1 und b = i, so folgt eix = cos x + i sin x. (2.31) Eine Größe der Form z = a + ib mit a, b ∈ R und der imaginären Einheit i nennt man komplexe Zahl. Man bezeichnet die Menge der komplexen Zahlen mit C. Im übernächsten Kapitel werden wir tiefer in das Konzept der komplexen Zahlen eindringen. Aus Gl. (2.31) wollen wir die Potenzreihendarstellungen von cos x und sin x extrahieren. Dazu betrachten wir Potenzen von i: i0 = 1; i1 = i; i2 = −1; i3 = i2 i = (−1)i = −i; Für n ∈ N0 haben wir somit i2n = (i2 )n = (−1)n ; i4 = i2 i2 = (−1)(−1) = 1 i2n+1 = i2n i = (−1)n i. Diese Eigenschaften nutzen wir nun aus, um Gl. (2.30) für den Spezialfall a = 1 umzuschreiben ∞ X (ix)n ix e = n! n=0 = ∞ X (ix)2n n=0 ∞ X (2n)! + ∞ X (ix)2n+1 (2n + 1)! n=0 ∞ X x2n+1 x2n +i (−1)n . = (−1) (2n)! (2n + 1)! n=0 n=0 n 48 KAPITEL 2. MATHEMATISCHE METHODEN Ein Vergleich mit Gl. (2.31) liefert dann cos x = sin x = ∞ X n=0 ∞ X (−1)n x2n , (2n)! (2.32) (−1)n x2n+1 . (2n + 1)! (2.33) n=0 Die Namensgebung der hyperbolischen Funktionen wird nun durch einen Vergleich der Gln. (2.32) und (2.33) mit den Gln. (2.28) und (2.29) klar. Daß es sich bei den durch die Gln. (2.32) und (2.33) gegebenen Funktionen um die in der Schule mit Hilfe rechtwinkliger Dreiecke definierten Funktionen handelt, ist jedoch nicht vollständig offensichtlich. Was aber klar ist: • Da nur gerade bzw. ungerade Potenzen von x in cos x bzw. sin x auftreten, ist cos x eine gerade Funktion und sin x eine ungerade. • sin 0 = 0 und cos 0 = 1. • Gliedweise Differentiation liefert ∞ X 2n+1 n x (−1) (2n + 1)! n=0 sin0 x = = ∞ X (−1)n n=0 !0 (2n + 1) x2n (2n + 1) (2n)! = cos x und analog cos0 x = − sin x. Alle diese Eigenschaften gelten analog für die ihnen bekannten trigonometrischen Funktionen, und sie machen daher plausibel, daß es sich tatsächlich um diese Funktionen handelt. Für das Beispiel der Sinusfunktion wollen wir jetzt noch kurz untersuchen, wie gut sich sin x durch einige wenige Terme der Potenzreihe11 gN (x) = N X n=0 (−1)n x2n+1 (2n + 1)! approximieren läßt. 11 Die Potenzreihen des sin und cos entsprechen, wie in den Beispielen im letzten Kapitel, wieder der Taylorreihe für eine Entwicklung der Funktion um den Punkt x = 0. 49 2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 1 0.5 0 sin(x) g1(x) g2(x) g3(x) −0.5 −1 −4 −2 0 x 2 4 Aus der Abbildung wird klar, daß für hinreichend kleine |x| bereits die ersten paar Terme eine sehr gute Näherung liefern.12 Die Entwicklung der trigonometrischen Funktionen in niedrigen Ordnungen spielt in der Physik eine große Rolle und wird ihnen im Mechanik Teil dieser Vorlesung und der Vorlesung Experimentalphysik I spätestens bei der Diskussion der Schwingungen (mit kleiner Amplitude) eines Fadenpendels begegnen. 2.7 Gewöhnliche Differentialgleichungen Differentialgleichungen sind uns im Laufe dieser Vorlesung bereits mehrfach begegnet, speziell auch in physikalischen Beispielen, was ihre Wichtigkeit innerhalb der Physik verdeutlicht. Dabei dient der Begriff gewöhnliche Differentialgleichung die von uns bisher betrachteten Situationen mit einer Veränderlichen von partiellen Differentialgleichungen zu unterscheiden, bei denen Ableitungen nach mehreren Variablen auftreten. Wie die Kapitelüberschrift ausdrückt, werden wir uns hier auf den ersten Fall konzentrieren. Die Theorie der partiellen Differentialgleichungen ist noch weitaus komplexer als die bereits recht komplizierte Theorie der gewöhlichen Differentialgleichungen. Als Beispiel zur Motivation wollen wir erneut die (eindimensionale) Newtonsche Gleichung mẍ(t) = F (x(t), ẋ(t); t) heranziehen, die wir hier in der Form erweitert haben, daß die Kraft nicht nur vom Ort, sondern auch von der Geschwindigkeit, sowie der Zeit selbst abhängen kann. Sätze zur Existenz und zur Eindeutigkeit von Lösungen von Differentialgleichungen13 werden sie in den HöMa Vorlesungen kennen lernen. Hier sind wir daran interssiert Lösungsverfahren vorzustellen. In Form des Potenzreihenansatzes haben sie bereits eine recht allgemei12 Die Abbildung verdeutlicht auch noch einmal, daß es sich bei der durch die Potenzreihe definierten Funktion tatsächlich um die geometrisch definierte Sinusfunktion handelt. 13 Von jetzt an unterdrücken wir wieder das Adjektiv “gewöhnlich”. 50 KAPITEL 2. MATHEMATISCHE METHODEN ne (aber natürlich nicht immer erfolgreiche) Strategie zur Lösung von Differentialgleichungen kennen gelernt. Wie bereits oben angedeutet ist es im Allgemeinen sehr schwierig analytische Lösungen von Differentialgleichungen zu finden. Es gibt bestimmte Typen von Gleichungen für die es Verfahren gibt, die einen Erfolg garantieren. Um uns dieser Frage zu nähern, müssen wir die Differentialgleichungen genauer klassifizieren. Eine Differentialgleichung ist allgemein in impliziter Form durch F (x, y(x), y 0(x), y 00(x), . . . , y (n)(x)) = 0 gegeben. Wie wir es aus unseren obigen Beispielen kennen, gehört zu der Gleichung ein Satz von Anfangsbedingungen für die gesuchte Funktion und ihre Ableitungen. Den Begriff der Ordnung einer Differentialgleichung als die höchste auftretende Ableitung haben wir bereits kennengelernt. Eine Differentialgleichung heißt linear, falls sie in der Form a0 (x)y(x) + a1 (x)y 0(x) + a2 (x)y 00 (x) + . . . + an (x)y (n) (x) = f (x) geschrieben werden kann, d.h. die gesuchte Funktion y(x) und alle ihre Ableitungen nur linear auftreten. Die Funktion f (x) bezeichnet man in diesem Kontext als die Inhomogenität. Wir betrachten zunächst Gleichungen erster Ordnung der Form y 0(x) = F (x, y(x)) . Man bezeichnet die Gleichung als separabel falls F (x, y(x)) = f (x)g(y(x)) mit zwei Funktionen f und g gilt. In diesem Fall läßt sich die Differentialgleichung “einfach” durch Separation der Variablen lösen. Dazu teilen wir auf beiden Seiten der Gleichung dy = f (x)g(y(x)) dx durch g und multiplizieren formal mit “dx”. Das liefert die Beziehung dy = f (x)dx . g(y) Durch Integration auf beiden Seiten erhalten wir Z y Z x 1 0 dy = f (x0 ) dx0 , 0 y0 g(y ) x0 wobei wir die Anfangsbedingung y(x0 ) = y0 verwendet haben. Wir müssen also noch die Stammfunktionen G̃ (linke Seite) und F (rechte Seite) der Ausdrücke 2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 51 auf beiden Seiten der Gleichung bestimmen. Dies liefert uns die gesuchte Lösung y(x) in impliziter Form G̃(y(x)) − G̃(y0 ) = F (x) − F (x0 ) . Nach bilden der Umkehrfunktion G̃−1 von G̃ (was natürlich nicht immer möglich sein wird) folgt somit als für Lösung der Differentialgleichung −1 F (x) − F (x0 ) + G̃(y0 ) . y(x) = G̃ Durch Differenzieren überzeugt man sich leicht davon, daß diese Gleichung die Differentialgleichung löst und durch einsetzen von x = x0 , daß auch die geforderte Anfangsbedingung gilt. Anhand dieses Beispiels sehen wir (erneut; siehe die bisher diskutierten konkreten Beispiele von Differentialgleichungen erster Ordnung), daß es uns bei der Gleichung erster Ordnung möglich ist, eine Anfangsbedingung zu erfüllen. Für das Beispiel der Bewegung einer Masse mit Hookscher Feder, die durch eine Gleichung zweiter Ordnung gegeben ist, war es möglich zwei Anfangsbedingungen (für Ort und Geschwindigkeit zur Zeit t = 0) zu erfüllen. Es ist nur für den konkreten Fall beantwortbar, ob sich die beiden notwendigen Stammfunktionen geschlossen analytisch angeben lassen und ob es möglich ist die Umkehrfunktion G̃−1 zu bestimmen. Wir betonen, daß es mit diesem Verfahren möglich ist Lösungen auch für nicht-lineare Gleichungen erster Ordnung zu bestimmen (solange die Differentialgleichung separable ist). Wir wollen für dieses Lösungsverfahren ein Beispiel aus der klassischen Mechanik betrachten. Die durch den Luftwiderstand verursachte Kraft auf ein sich bewegendes, hinreichend großes Teilchen (Tennisball, Fußball,. . . ) hat in guter Näherung den Betrag cv 2 , mit einer positiven Konstanten c und zeigt in Richtung −~v /|~v|.14 Wir betrachten nun ein Teilchen der Masse m welches sich mit Geschwindigkeit ~v (t) bewegt und ausschließlich der Kraft die durch den Luftwiderstand hervorgerufen wird ausgesetzt ist. In dem wir das Koordinatensystem15 so legen, daß die x-Achse in die Richtung von ~v zeigt, reduziert sich die aus der Newtongleichung folgende Bewegungsgleichung auf eine eindimensionale m dv = −cv 2 , dt mit der Anfangsbedingung v(t = 0) = v0 (Anfangsgeschwindigkeit v0 , willkürliche Wahl des Zeitnullpunktes). Diese nicht-lineare Gleichung können wir mit dem oben beschriebenen Verfahren lösen. Es ergibt sich Z v Z t 0−2 0 m v dv = −c dt0 v0 14 0 Ich gehe davon aus, daß sie aus der Schule mit dem Vektorbegriff vertraut sind. Mehr dazu später. 15 Ich gehe erneut davon aus, daß ihnen dieser Begriff geläufig ist. 52 KAPITEL 2. MATHEMATISCHE METHODEN und damit −m(v −1 − v0−1 ) = −ct , bzw. aufgelöst nach v(t) v(t) = v0 , 1 + t/τ mit der charakteristischen Zeit τ = m/(cv0 ). Für Zeiten t τ geht die Geschwindigkeit (in x-Richtung) somit wie v(t)/v0 ≈ (t/τ )−1 gegen Null. Als nächste Klasse betrachten wir lineare Differentialgleichungen erster Ordnung der Form dy = a(x)y(x) + f (x) . (2.34) dx Um die Lösung zu bestimmen gehen wir zunächst zur homogenen Gleichung dy = a(x)y(x) dx über. Wie oben ergibt sich als Lösung dieser Z x ln y(x) − ln(y0 ) = a(x0 ) dx0 , x0 oder nach y(x) aufgelöst y(x) = y0 exp Z x 0 0 a(x ) dx x0 . Eine sogenannte partikuläre Lösung yp (x) der inhomogenen Gleichung bestimmen wir nun durch Variation der Konstanten, d.h. wir lassen die Konstante y0 von x abhängen. Der Ansatz zur Lösung von Gl. (2.34) lautet somit Z x 0 0 yp (x) = g(x) exp a(x ) dx , x0 mit der noch zu bestimmenden Funktion g(x). Differenzieren liefert Z x Z x dyp (x) dg(x) 0 0 0 0 a(x ) dx a(x ) dx + g(x) a(x) exp = exp dx dx x0 x0 Z x dg(x) 0 0 exp a(x ) dx + a(x)yp (x) . = dx x0 Die rechte Seite muß nun gleich a(x)yp (x) + f (x) sein, woraus sich eine Differentialgleichung für g ergibt Z x dg(x) 0 0 = f (x) exp − a(x ) dx . dx x0 2.7. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 53 Die Lösung dieser Gleichung ist g(x) = Z x x0 f (x0 ) exp − Z x0 a(x00 ) dx00 x0 ! dx0 . Damit ergibt sich für die partikuläre Lösung Z x Z x 0 00 00 yp (x) = f (x ) exp a(x ) dx dx0 . x0 x0 Die allgemeine Lösung der inhomogenen Gleichung ergibt sich als Summe der allgemeinen Lösung der homogenen Gleichung und der partikulären Lösung zu Z x Z x Z x 0 0 0 00 00 a(x ) dx + f (x ) exp y(x) = y0 exp a(x ) dx dx0 , x0 x0 x0 wobei wir bereits die Anfangsbedingung y(x0 ) = y0 berücksichtigt haben. Auch für dieses bereits etwas aufwendigere Lösungsverfahren wollen wir ein Beispiel aus der klassischen Mechanik betrachten. Betrachten wir dazu erneut den Luftwiderstand, diesmal jedoch für ein sehr kleines Teilchen, z.B. den Öltropfen im Millikan Experiment zur Bestimmung der Ladung des Elektrons.16 In diesem Fall ist die resultierende Kraft in guter Näherung durch F~ = −b~v , mit der positiven konstanten b, gegeben. Wir betrachten nun ein Teilchen der Masse m, welches sich unter dem Einfluß der Gravitation und dem Luftwiderstand vertikal nach unten bewegt (fallendes kleines Teilchen mit Luftwiderstand). Durch geschickte Wahl des Koordinatensystems ergibt sich die eindimensionale Bewegungsgleichung m dv = mg − bv , dt mit der Erdbeschleunigung g und der Anfangsbedingung v(t = 0) = v0 . Diese lineare Differentialgleichung mit Inhomogenität mg läßt sich durch Variation der Konstanten lösen. Die Lösung der homogenen Gleichung ist v(t) = v0 exp (−t/τ ) , mit der charakteristischen Zeit τ = m/b. In Abwesenheit der Gravitation nimmt somit die Geschwindigkeit ausgehend von der Anfangsgeschwindigkeit exponentiell ab. Für die Lösung der inhomogenen Gleichung erhalten wir Z t Z t −1 00 v(t) = v0 exp (−t/τ ) + g exp − τ dt dt0 0 t0 = v0 exp (−t/τ ) + vfinal (1 − exp (−t/τ )) , 16 Ich hoffe, daß sie von diesem Experiment in der Schule gehört haben. 54 KAPITEL 2. MATHEMATISCHE METHODEN mit der Endgeschwindigkeit zur Zeit t → ∞, vfinal = gτ = mg/b. Betrachten wir hier nur den Fall verschwindender Anfangsgeschwindigkeit v0 = 0, so sehen wir, am zweiten Term der Summe, daß die Geschwindigkeit ausgehend von Null zunimmt und sich exponentiell dem konstanten asymptotischen Wert vfinal annähert. Kleine Teilchen unter Einfluß der Graviation und des Luftwiderstandes fallen also nach hinreichend langer Zeit (also wenn sie zuvor nicht auf den Boden auftreffen) mit konstanter Geschwindigkeit. Nicht-lineare Differentialgleichungen lassen sich nur in Ausnahmefällen analytisch lösen, z.B. wenn sie erster Ordnung und separabel sind. Manchmal führt ein Potenzreihenansatz zum Erfolg. Ein lösbares Beispiel für die diese Bedingungen nicht gelten ist die Bernoulli Gleichung der Form y 0 (x) = a(x)y(x) + b(x)y α (x) , mit α 6= 0, 1. Sie läßt sich durch Substitution in eine lineare Gleichung überführen mit y −α(x) y 0 (x) = a(x)y 1−α (x) + b(x) 1 u0(x) = a(x)u(x) + b(x) , ⇒ 1−α u(x) = y 1−α(x) , u0 (x) = (1 − α)y −α(x) y 0(x) . Die lineare Gleichung läßt sich dann lösen. Neben der Suche nach einer analytischen Lösung ist es für den Physiker natürlich auch zulässig Differentialgleichungen numerisch zu lösen. Dazu gibt es gut funktionierende und etablierte Verfahren, auf die wir aus Zeitgründen hier jedoch nicht eingehen können. Weil sie in der Physik eine wichtige Rolle spielen und zusätzlich ein Hilfsmittel zur Lösung von Gleichungen höherer Ordnung darstellen (wir werden sehen wie) wollen wir noch auf gekoppelte Systeme linearer Differentialgleichungen eingehen. Dazu benötigen wir aber die Begriffe Matrix, Diagonalisierung, Eigenwert und Eigenvektor die wir erst später kennen lernen werden. Daher müssen wir diesen Aspekt auf das Ende des mathematischen Teils dieser Vorlesung verschieben. 2.8 Komplexe Zahlen Anlaß zur Erweiterung der Menge der reellen Zahlen R war die Beobachtung, daß viele quadratische, kubische und quartische Gleichungen, z.B. die einfache quadratische Gleichung x2 + 2 = 0, keine reellen Lösungen besitzen. Veröffentlicht wurde eine solche Erweiterung erstmalig 1545 durch Gerolamo Cardano. Seit 1539 wurde die den komplexen Zahlen zugrundeliegende Idee zur Lösung kubischer Gleichungen jedoch in speziellen Fällen bereits von einem gewissen Tartaglia “kommerziell” genutzt - der seinen “Trick” zur Lösung jedoch geheimgehalten 55 2.8. KOMPLEXE ZAHLEN hatte. Nachdem er Cardano einen “Geheimhaltungsschwur” hatte schwören lassen, verriet Tartaglia selbigem seine Methode. Dieser erweiterte sie und veröffentlichte seine Ergebnisse dennoch. Die fundamentale Beobachtung ist, daß man mit √ der scheinbar sinnlosen Lösung der obigen quadratischen Gleichung x1/2 = ± −2 so weiter rechnen kann, als wenn es sich um eine reelle Zahl handeln würde. Zum Beispiel gilt x1 + x2 = 0 und √ x1 x2 = 2. Bereits im letzten Kapitel hatten wir die übliche Abkürzung i = −1 eingeführt. Für zwei gegebene reelle Zahlen a, b ∈ R nennt man das zunächst formale Konstrukt z = a + ib eine komplexe Zahl. Dem reellen Paar (a, b) wird eine komplexe Zahl zugeordnet (a, b) → a + ib . Es gilt also z.B. (0, 1) → i oder (2, +1/2) → 2 + i 0.5. Wie bereits erwähnt bezeichnet man die Menge der komplexen Zahlen, also die Paare (a, b) mit C. Oft werden die komplexen Zahlen in der sogenannten komplexen (oder Gaußschen) Zahlenebene graphisch dargestellt. Die erste Komponente der komplexen Zahl nennt man Realteil (a = Re[z]) und die zweite Imaginärteil (b = Im[z]). 1+2i=(1,2) 1 1 −2−0.5i=(−2,−0.5) Für diese Zahlenpaare definiert man nun Verknüpfungen, so daß man mit ihnen rechnen kann wie mit reellen Zahlen. • Addition: z1 + z2 = (a+ ib) + (c + id) = a+ c + ib+ id = a+ c + i(b+ d). Für die Paare (a, b) und (c, d) also (a, b) + (c, d) = (a + c, b + d). Dargestellt in der Gaußschen Zahlenebene entspricht die komplexe Addition der üblichen Vektoraddition (siehe später). 56 KAPITEL 2. MATHEMATISCHE METHODEN z1+z2 z1 b d z2 a c • Multiplikation: z1 z2 = (a + ib)(c + id) = ac + ibc + iad + i2 bd = ac − bd + i(bc + ad). Für die Paare (a, b) und (c, d) also (a, b)(c, d) = (ac − bd, bc + ad). Es gilt damit Re [(a + ib)(c + id)] = ac − bd Im [(a + ib)(c + id)] = bc + ad . Um diese Rechenregel in der komplexen Zahlenebene darzustellen, ist es nützlich, die Punkte in Polarkoordinaten anzugeben. b ρ ϕ a Die Länge des Vektors vom Ursprung (0, 0) zum Punkt (a, b) nennt man den Absolutbetrag |z| der komplexen Zahl z. Man schreibt √ ρ = |z| = |a + ib| = a2 + b2 . Den Winkel ϕ, der nur bis auf ganzzahlige Vielfache von 2π definiert ist, bezeichnet man oft als Arcus und schreibt ϕ = arc(z) = arc(a + ib) . Aus der Skizze ist klar, daß a = ρ cos ϕ und b = ρ sin ϕ, und b . ϕ = arctan a (2.35) 57 2.8. KOMPLEXE ZAHLEN Damit können wir z zu z = a + ib = ρ cos ϕ + iρ sin ϕ = ρeiϕ umschreiben, wobei wir Gl. (2.31) verwendet haben. Die Gl. (2.35) gilt zunächt nur für a > 0 und b > 0 wie in der Skizze. Allgemeiner gilt (in den vier Quadranten der komplexen Ebene) 0 für a > 0, b > 0 b π für a < 0, b > 0 ϕ = arctan + π für a < 0, b < 0 a 2π für a > 0, b < 0 , wobei noch einmal zu betonen ist, daß ϕ nur bis auf Vielfache von 2π eindeutig definiert ist. Für a = b = 0 ist der Winkel nicht definiert. √ √ Betrachten 4 + 4 = 2 2 wir als Beispiel diekomplexe Zahl z = 2 + i2. Dann gilt ρ = √ iπ/4 2 und ϕ = arctan 2 = arctan 1 = π/4. Also 2 + i2 = 2 2e . Mit Hilfe dieser Einsichten können wir die Multiplikation zweier komplexer Zahlen in der Polardarstellung ausführen z1 z2 = ρ1 eiϕ1 ρ2 eiϕ2 = ρ1 ρ2 ei(ϕ1 +ϕ2 ) und geometrisch interpretieren: Die Absolutbeträge werden multipliziert und die Polarwinkel addiert. Als Beispiel betrachten wir die Multiplikation von z1 = 2 + i2 mit z2 = −1 + i0 = −1, d.h. der rein reellen Zahl −1 - wir nehmen also das negative von z1 : Wir haben c = −1 und d = 0. Damit folgt nach oben z1 z2 = − bd + i(bc + ad) = −a − ib = −2√ − i2. In √ aciπ/4 iπ Polardarstellung gilt z1 = 2 2e , z2 = e und damit z1 z2 = 2 2eiπ5/4 oder graphisch: 2 -1 2+i2 2 -2-i2 Die Subtraktion zweier komplexer Zahlen ergibt sich dann aus der Zusammensetzung der Regeln für die Multiplikation mit −1 und der Addition. 58 KAPITEL 2. MATHEMATISCHE METHODEN • Division: Bevor wir die Division zweier komplexer Zahlen definieren wollen, ist es sinnvoll, den Begriff der zu z konjugiert komplexen Zahl z ∗ (oft auch z̄) einzuführen. Sie ist wie folgt gegeben z = a + ib ⇒ z ∗ = a − ib , d.h. der Imaginärteil von z geht in −Im[z] über. Damit läßt sich der Absolutbetrag von z, |z|, leicht durch z und z ∗ ausdrücken. Aus zz ∗ = (a + ib)(a − ib) = a2 + b2 folgt |z| = (zz ∗ )1/2 . Nun zur Definition der Division. Sei dazu z2 = c + id 6= 0 + i0. Dann betrachten wir17 z1 a + ib (a + ib)(c − id) ac + bd + i(bc − ad) = = = , z2 c + id (c + id)(c − id) c2 + d 2 d.h. wir haben ac + bd a + ib = 2 ; Re c + id c + d2 bc − ad a + ib = 2 Im , c + id c + d2 und der “Trick” zur Berechnung war, mit dem konjugiert komplexen des Nenners zu erweitern. In Polarkoordinaten gilt z1 ρ1 eiϕ1 ρ1 i(ϕ1 −ϕ2 ) = = e , iϕ 2 z2 ρ2 e ρ2 da e1ix = e−ix . Als Spezialfall betrachten wir koordinaten z1 = 1ρ e−iϕ und graphisch 2 1 z = z∗ zz ∗ = z∗ , |z|2 oder in Polar- z=2+i2 ϕ −ϕ 2 1/z 17 Es kann aber durchaus c = 0 sein, wenn gleichzeitig d 6= 0 gilt, bzw. d = 0, wenn gleichzeitig c 6= 0. 59 2.8. KOMPLEXE ZAHLEN Wie für reelle Zahlen kann man nun Funktionen von komplexen Zahlen bilden - deren Funktionswert dann im Allgemeinen wieder eine komplexe Zahl ist. Bereits mehrfach ist uns das Beispiel exp (ix), mit x ∈ R, also die Exponentialfunktion mit rein imaginärem Argument begegnet. Man kann aber auch allgemeiner f (z) = exp z = ∞ X zn n=0 n! = exp (a + ib) = exp (a) exp (ib) definieren, oder z.B. sin z und cos z. Solche Funktionen und ihre komplexe Differentiation (nach z) und Integration werden im Rahmen der Funktionentheorie untersucht. Ein Besuch der Mathematikvorlesung über Funktionentheorie empfiehlt sich für jeden Physikstudenten. Manchmal dienen die komplexen Zahlen nur als Rechentrick - z.B. beim Integrieren; sie werden die entsprechenden Methoden in späteren Vorlesungen kennen lernen - jedoch vereinfachen sich im Rahmen der komplexen Zahlen auch viele mathematische Aussagen, so daß sie ebenfalls von struktureller Bedeutung sind. Zum Beispiel gilt der hier nicht bewiesene Fundamentalsatz der Algebra: Sei PN (z) = a0 + a1 z + a2 z 2 + . . . + aN z N ein Polynom N-ten Grades, so hat es in der komplexen Ebene N Nullstellen zi (mit PN (zi ) = 0), wobei n-fache Nullstellen n-fach gezählt werden. Wir betrachten dazu ein Beispiel: Die reelle Gleichung x6 − 1 = 0 hat die beiden reellen Nullstellen x1/2 = ±1. Die komplexe Gleichung z 6 − 1 = 0 hat dagegen vier weitere komplexe Nullstellen. Diese wollen wir jetzt finden. Mit z 6 = 1 gilt auch (z ∗ )6 = 1, oder nach Multiplikation beider Gleichungen (zz ∗ )6 = 1, d.h. ρ12 = 1. Da ρ ≥ 0 reell ist, folgt ρ = 1. Damit haben die zu bestimmenden Nullstellen die Form zn = eiϕn mit ϕn ∈ R. Wir betrachten 6 dann zn6 = (eiϕn ) = ei6ϕn = 1. Da ei2πm = 1 mit m ∈ Z gilt (siehe komplexe Zahlenebene), folgt durch Gleichsetzen 6ϕn = 2πn und damit ϕn = n 2π mit 6 n = 0, 1, 2, 3, 4, 5.18 Die zugehörigen zn bezeichnet man als 6-te Einheitswurzeln. n=2 1 n=1 n=3 n=0 1 n=4 18 n=5 Für n = 6 ergibt sich dieselbe Lösung wie für n = 0, für n = 7 dieselbe wie für n = 1, usw.. 60 KAPITEL 2. MATHEMATISCHE METHODEN 2.9 Vektorrechnung Wir werden den Vektorbegriff anschaulich einführen und beschränken uns zunächst auf den zweidimensionalen euklidischen Raum. Die Elemente dieses Raumes sind Punkte P , Q, R, S,. . . . Geordnete Paare (P, Q) von Punkten werden mit einer Linie mit Pfeil verbunden, der vom Angriffspunkt P zum Zielpunkt Q zeigt: P~Q. Zwei solcher Pfeile sind äquivalent, wenn sie gleichsinnig parallel sind und gleiche Länge haben. Ein einzelner Pfeil einer Klasse äquivalenter Pfeile heißt Repräsentant des Vektors bzw. kurz Vektor. Vektoren im euklidischen Raum werden wir mit lateinischen Buchstaben mit einem Pfeil ~a, ~b,. . . bezeichnen. Q S R P Diese Vektoren wollen wir nun z.B. durch Addition miteinander verknüpfen und durch die Multiplikation eines Vektors mit einer reellen (oder komplexen) Zahl - einem Skalar - einen Vektor auf einen anderen abbilden. Die Addition zweier Vektoren ~a +~b ist wie folgt definiert: Man wählt aus der Klasse ~a einen beliebigen Pfeil (P, Q) und aus der Klasse ~b den Pfeil (Q, R) mit dem Angriffspunkt Q und definiert ~ = P~R ~a + ~b = P~Q + QR R b a+b a P Offensichtlich ist die Addition von Vektoren • kommutativ: ~a + ~b = ~b + ~a ~ ~ • assoziativ: ~a + b + ~c = ~a + b + ~c Q 2.9. VEKTORRECHNUNG 61 • und hat ein neutrales Element, den Nullvektor ~0, d.h. die Klasse von Pfeilen bei denen Angriffs- und Zielpunkt zusammenfallen und für den ~a + ~0 = ~a gilt. • Es ist anschaulich klar, daß es zu jedem Vektor ~a einen Vektor ~b gibt, so daß ~a + ~b = ~0. Wir bezeichnen den Vektor ~b auch mit −~a. Allgemein nennt man die algebraische Struktur bestehend aus einer Menge G (hier die anschaulich über Pfeile im zweidimensionalen euklidischen Raum definierten Vektoren) und einer Verknüpfungsvorschrift der Elemente von G (hier die ebenfalls anschaulich definierte und mit + bezeichnete Addition zweier Vektoren) welche den obigen vier Eigenschaften genügt, eine abelsche Gruppe. Neben den obigen “Pfeilen” bilden z.B. die ganzen Zahlen mit der gewöhnlichen Addition als Verknüpfungsvorschrift eine abelsche Gruppe. Kehren wir von dieser abstrakten Sichtweise zu den anschaulich definierten Vektoren in der zweidimensionale Ebene zurück. Die Multiplikation eines Vektors mit einer reellen Zahl soll wie folgt definiert sein: Die Pfeile λ~a sind für λ > 0 gleichsinnig parallel und für λ < 0 gegensinnig parallel zu den Pfeilen der Klasse ~a. Sie haben die Länge |λ| · Länge von ~a. Für λ = 0 gilt λ~a = ~0. Aus dieser Definition ergeben sich sofort die folgenden Eigenschaften für die Multiplikation von Vektoren mit Skalaren (λ, µ ∈ R): • 1~a = ~a • λ(µ~a) = (λµ)~a • λ(~a + ~b) = λ~a + λ~b • (λ + µ)~a = λ~a + µ~a Wiederum abstrakt betrachtet nennt man eine abelsche Gruppe für die man eine Multiplikation mit einer reellen Zahl definieren kann19 welche die gerade diskutierten Eigenschaften hat einen reellen Vektorraum.20 Den reellen Vektorraum der oben anschaulich definierten Pfeile in zwei Raumdimensionen (zweidimensionale Ebene) bezeichnet man mit R2 . Analog kann man den Vektorraum von “äquivalenten Pfeilen” in d Dimensionen (im d dimensionalen euklidischen Raum) definieren. Er wird allgemein mit Rd bezeichnet.21 Um die Allgemeingültigkeit der Konzepte und Begriffe anzudeuten sind wir mehrfach vom exemplarischen Beispiel der Vektoren in der zweidimensionalen 19 Das Ergebnis der Multiplikation eines Elementes der abelschen Gruppe mit der reellen Zahl muß, wie im obigen Beispiel, wieder ein Gruppenelement sein. 20 Analog gibt es auch komplexe Vektorräume. In diesem Fall ist das Skalar eine komplexe Zahl aus C. 21 Ist die Multiplikation mit einem Skalar bezüglich der komplexen Zahlen definiert, so bezeichnet man den Vektorraum mit Cd . 62 KAPITEL 2. MATHEMATISCHE METHODEN Ebene zu der abstrakten Sichtweise übergegangen. Auch in der Physik - nicht nur der Mathematik - spielen neben dem Vektorraum Rd (bzw. Cd ) andere Vektorräume eine große Rolle. Im Kapitel über Fourierreihen werden wir z.B. kurz ansprechen, daß es Vektorräume gibt, deren Elemente Funktionen sind. Zum Verständnis der Mechanik benötigen sie primär Kenntnisse des Rd , so daß wir unsere weiteren Überlegungen zunächst erneut auf diesen beschränken werden. Eine Anzahl von m Vektoren ~g1 , ~g2 , . . . , ~gm aus dem Rd heißt linear unabhängig, wenn λ1~g1 + λ2~g2 + . . . + λm~gm = ~0 nur dann gilt, wenn alle Koeffizienten λi gleich Null sind. Anderenfalls nennt man sie linear abhängig. Im Rd gibt es (maximal) d linear unabhängige Vektoren, nimmt man jedoch einen weiteren Vektor hinzu, so sind die dann gegebenen d + 1 Vektoren linear abhängig. Zum Beispiel in d = 2 gilt: g2 g1 ~g1 und ~g2 sind linear unabhängig, aber jeder beliebige dritte Vektor ~g3 läßt sich als Linearkombination von ~g1 und ~g2 schreiben ~g3 = λ1~g1 + λ2~g2 mit zu bestimmenden Skalaren λ1 , λ2 ∈ R. Man bezeichnet einen Satz ~g1 , ~g2 , . . . , ~gd von d linear unabhängigen Vektoren im Rd als Basis. Der Einfachheit halber werden wir hier zunächst mit Orthogonalbasen im Rd (hier speziell im R2 ) arbeiten,22 genauer mit Orthonormalbasen: Die Basisvektoren ~e1 und ~e2 haben die Länge 123 und stehen senkrecht aufeinander. Jeder Vektor ~a hat dann die Zerlegung ~a = a1~e1 + a2~e2 . Die ai nennt man Vektorkomponenten zur vorgegebenen Basis ~ei . 22 23 Man kann auch allgemeiner mit nicht-orthogonalen Basisvektoren arbeiten. Zur genauen Definition des Begriffs “Länge” siehe unten. 63 2.9. VEKTORRECHNUNG a2 a e2 0 a1 e1 Wir haben bei der obigen Konstruktion einen festen Punkt 0 als Anfangspunkt oder Ursprung ausgezeichnet. Damit ist dann jeder Punkt P durch den Vektor ~ bestimmt. Man nennt diesen Vektor ~x den Ortsvektor von P bezüglich ~x = 0P des Anfangspunktes 0. In Komponenten kann dieser Vektor als ~x = x1~e1 + x2~e2 geschrieben werden, und jeder Punkt P ist damit umkehrbar eindeutig durch die Zahlen (x1 , x2 ) festgelegt. Sie heißen die Koordinaten des Punktes P bezüglich des Koordinatensystems [0; ~e1 , ~e2 ]. Arbeitet man immer mit demselben Koordinatensystem, so bietet sich die Notation x1 ~x = x2 an. Diese kennen sie sicherlich auch aus der Schule. Wir werden diese Notation hier nicht verwenden, da in der Physik häufig ein Basiswechsel notwendig ist, um die physikalischen Phänomene besser zu verstehen (z.B. den Basiswechsel in ein beschleunigtes Koordinaten- bzw. Bezugssytem). Wir schreiben manchmal bei vorgegebenem Koordinatensystem x1 . [0; ~e1 , ~e2 ] : ~x = , x2 . wobei = als “wird dargestellt durch” zu lesen ist. Zum Beispiel schreiben wir statt ~a + ~b = a1~e1 + a2~e2 + b1~e1 + b2~e2 = (a1 + b1 )~e1 + (a2 + b2 )~e2 einfach . ~a + ~b = a1 + b1 a2 + b2 . Die Länge |~a| eines Vektors ergibt sich nach obiger Skizze und dem Satz von Pythagoras zu |~a| = q a21 + a22 = a . 64 KAPITEL 2. MATHEMATISCHE METHODEN Die Länge hat aber auch eine geometrische Bedeutung, die unabhängig von der Wahl des Koordinatensystems ist. Unabhängig von der Wahl des Koordinatensystems definieren wir das Skalarprodukt zweier Vektoren ~a · ~b = |~a||~b| cos ϕ ~a, ~b , wobei ϕ ~a, ~b der von ~a und ~b eingeschlossene Winkel ist, wenn ~a und ~b denselben Angriffspunkt haben. Da die Kosinusfunktion gerade ist, gilt offensichtlich das Kommutativgesetz ~a · ~b = ~b · ~a. Um zu zeigen, daß das Distributivgesetz gilt, berechnen wir das Skalarprodukt in einer festen Orthonormalbasis: ~a = a1~e1 + a2~e2 ⇒ a1 = |~a| cos ϕa , a2 = |~a| sin ϕa , wobei ϕa der Winkel zwischen der ~e1 -Richtung und ~a ist. Analog gilt ~b = b1~e1 + b2~e2 ⇒ b1 = |~b| cos ϕb , b2 = |~b| sin ϕb , und damit ~a · ~b = |~a||~b| cos (ϕb − ϕa ) = |~a||~b| [cos ϕb cos ϕa + sin ϕb sin ϕa ] = a1 b1 + a2 b2 , ~ so folgt wie sie es wahrscheinlich aus der Schule kennen. Ist dann aber ~b = ~c + d, ~a · ~c + d~ = a1 (c1 + d1 ) + a2 (c2 + d2 ) = a1 c1 + a2 c2 + a1 d1 + a2 d2 = ~a · ~c + ~a · d~ , d.h. das Distributivgesetz. Mit Hilfe dieses Gesetzes kann man ~a · ~b = a1 b1 + a2 b2 auch anders verstehen: Wegen ~e1 ·~e1 = 1 = ~e2 ·~e2 und ~e1 ·~e2 = 0 - da ϕ (~e1 , ~e2 ) = π/2 und cos (π/2) = 0 - d.h. 1 für i = j ~ei · ~ej = δi,j = (2.36) 0 für i 6= j folgt ~a · ~b = (a1~e1 + a2~e2 ) · (b1~e1 + b2~e2 ) = a1 b1 + a2 b2 . Das soeben eingeführte und definierte δi,j bezeichnet man als Kronecker-Symbol bzw. Kronecker-Delta. Mit Hilfe von Gl. (2.36) und der Distributivität des Skalarprodukts lassen sich die Vektorkomponenten bezüglich der orthonormalen Basis {~ei } gemäß ai = ~ei · ~a = ~ei · (a1~e1 + a2~e2 ) (2.37) 65 2.9. VEKTORRECHNUNG berechnen. Über das Skalarprodukt läßt sich die Länge |~a| eines Vektors auch zu q √ |~a| = ~a · ~a = a21 + a22 schreiben. Auch für allgemeine Vektorräume läßt sich oft ein Skalarprodukt definieren. Um dieses genauer zu verstehen, nehmen wir wieder einen abstrakten Standpunkt ein. Beim Bilden des Skalarprodukts wird jedem Paar von Elementen des Vektorraums eine reelle (bzw. komplexe; wenn bei der Multiplikation des Vektors mit einem Skalar diese zugelassen sind) Zahl zugeordnet. Die Eigenschaften dieser Abblidung lassen sich wie folgt zusammenfassen • ~a · ~a ≥ 0; Gleichheit, wenn ~a = ~0 • ~a · ~b = ~b · ~a (bzw. ~a · ~b = (~b · ~a)∗ im komplexen Fall) • sei ~b = λ~b1 + µ~b2 mit λ, µ ∈ R (λ, µ ∈ C im komplexen Fall) dann folgt ~a · ~b = λ~a · ~b1 + µ~a · ~b2 (Linearität im zweiten Argument) Machen sie sich klar, daß das oben definierte Skalarprodukt für Vektoren aus dem R2 diese Eigenschaften hat. Jede Zuodnung mit den obigen Eigenschaften nennt man dann ein Skalarprodukt auf dem zugrundeliegenden (abstrakten) Vektorraum. Einen Vektorraum mit Skalarprodukt bezeichnet man als unitären Raum (auch Prähilbertraum). Über ein gegebenes Skalarprodukt läßt sich die Länge (Norm) |~a| eines Vektors auch abstrakt zu √ |~a| = ~a · ~a definieren. Es ist nun ebenfalls möglich den Begriff der Orthogonalität zweier Vektoren ungleich dem Nullvektor gemäß ~a·~b = 0 allgemein zu definieren. Gleiches gilt für das Konzept der orthonormalen Basis. Wir kehren nun zum Vektorraum R2 zurück. Mit Hilfe des Distributivgesetzes beweist man sehr leicht den aus der Schule bekannten Kosinussatz ~c · ~c = (~b − ~a) · (~b − ~a) also = ~a · ~a + ~b · ~b − 2~a · ~b , |~c|2 = |~a|2 + |~b|2 − 2|~a||~b| cos ϕ ~a, ~b . Wir können jetzt auch andersherum vorgehen, den Kosinussatz (weil aus der Schule bekannt) voraussetzen und einen Ausdruck für das Skalarprodukt herleiten: |~a|2 + |~b|2 − |~c|2 ~ ~ |~a||b| cos ϕ ~a, b = 2 a21 + a22 + b21 + b22 − [(b1 − a1 )2 + (b2 − a2 )2 ] = 2 = a1 b1 + a2 b2 . 66 KAPITEL 2. MATHEMATISCHE METHODEN Wir erhalten so also wieder das bereits bekannte Ergebnis. Bisher haben wir meistens im zweidimensionalen Raum (der Ebene) argumentiert. Wir werden jetzt das Skalarprodukt auf den dreidimensionalen Fall - der in der Physik eine zentrale Rolle spielt- erweitern. Dazu betrachten wir zunächst eine Orthonormalbasis in d = 3. e3 e2 0 e1 Das durch die gezeigten Basisvektoren aufgespannte Koordinatensystem bezeichnet man als Rechtssystem, was man sich wie folgt erklären und merken kann: Zeigt der Daumen der rechten Hand in Richtung ~e1 , der Zeigfinger der rechten Hand in Richtung ~e2 und der Mittelfinger der rechten Hand in Richtung ~e3 , so handelt es sich um ein Rechtssystem. Macht man dasselbe mit der linken Hand, handelt es sich um ein Linkssystem. Ein Vektor ~a wird in dieser Basis dann durch die Komponenten a1 . ~a = a2 a3 dargestellt, und durch zweimaliges Anwenden des Satzes von Pythagoras sieht man leicht, daß |~a| = q a21 + a22 + a23 gilt. Wir definieren dann das Skalarprodukt in d = 3 zu ~a · ~b = |~a||~b| cos ϕ ~a, ~b . Um eine Komponentenschreibweise zu finden, kann man wieder den Kosinussatz verwenden, da ~a, ~b und ~c = ~b − ~a in einer Ebene des dreidimensionalen Raumes 67 2.9. VEKTORRECHNUNG liegen ~a · ~b = |~a||~b| cos ϕ ~a, ~b |~a|2 + |~b|2 − |~c|2 2 a21 + a22 + a23 + b21 + b22 + b23 − [(b1 − a1 )2 + (b2 − a2 )2 + (b3 − a3 )2 ] = 2 = a1 b1 + a2 b2 + a3 b3 , = was für jede beliebige Orthonormalbasis gilt. Völlig analog gilt in d-Dimensionen ~a · ~b = a1 b1 + a2 b2 + . . . + ad bd . Wie in d = 2 ergibt sich damit sofort wieder das Distributivgesetz ~a · ~b + ~c = ~a · ~b + ~a · ~c . Aus der Definition des Skalarprodukts läßt sich der Winkel, den zwei beliebige Vektoren (in d = 3) einschließen, bestimmen: a1 b1 + a2 b2 + a3 b3 p cos ϕ ~a, ~b = p 2 . a1 + a22 + a23 b21 + b22 + b23 Zwei Vektoren stehen also senkrecht aufeinander (sind orthogonal zueinander), wenn ~a · ~b = 0 gilt. Für zwei Vektoren aus dem R3 (und nur diesem!!) definieren wir nun das Vektorprodukt (oft auch Kreuzprodukt oder äußeres Produkt genannt) wie folgt ~a × ~b = ~n|~a||~b| sin ϕ̃ ~a, ~b , wobei ~n ein Vektor der Länge 1 ist und auf ~a und ~b senkrecht steht. Die Richtung von ~n ist so zu wählen, daß ~a, ~b und ~n ein Rechtssystem bilden. ϕ̃ ~a, ~b bezeichnet ~ dabei den Betrag des kleineren der beiden Winkel zwischen ~a und b, so daß 0 ≤ ϕ̃ ~a, ~b < π und damit sin ϕ̃ ~a, ~b > 0 gilt. Die Richtung von ~n läßt sich auch wie folgt bestimmen: Zeigen alle Finger der rechten Hand mit Ausnahme des Daumen in die Richtung der Drehung von ~a auf ~b mit dem kleineren der beiden Winkel, so zeigt der abgespreizte Daumen in die Richtung von ~n (“Daumen-Regel der rechten Hand”). n b 0 a 68 KAPITEL 2. MATHEMATISCHE METHODEN Nach der Definition erfüllt das Vektorprodukt die folgenden Relationen ~a × ~b = −~b × ~a (λ~a) × (µ~b) = (λµ)(~a × ~b) , (2.38) λ, µ ∈ R . Aus der Definition ergibt sich ebenfalls ~a × ~a = ~0 . (2.39) Das Vektorprodukt ist distributiv ~a × ~b + ~c = ~a × ~b + ~a × ~c , was wir hier jedoch aus Zeitgründen nicht beweisen wollen.24 Um die Komponenten von ~a × ~b bezüglich einer Orthonormalbasis angeben zu können, wollen wir zunächst betrachten, was sich nach der Definition des Vektorproduktes für ~ei ×~ej mit i, j = 1, 2, 3 ergibt: ~e1 × ~e2 = ~e3 ~e2 × ~e3 = ~e1 ~e1 × ~e3 = −~e2 . Die übrigen Terme ergeben sich mit Hilfe der Gln. (2.38) und (2.39). Man kann diese Gleichungen zu ~ei × ~ej = ~ek zusammenfassen, wobei (i, j, k) eine zyklische Vertauschung von (1, 2, 3) sein muß - also (1, 2, 3), (2, 3, 1) oder (3, 1, 2). Für die Komponenten bezüglich der Basis [~e1 , ~e2 , ~e3 ] folgt damit ~a × ~b = (a1~e1 + a2~e2 + a3~e3 ) × (b1~e1 + b2~e2 + b3~e3 ) = (a1 b2 − a2 b1 ) (~e1 × ~e2 ) + (a1 b3 − a3 b1 ) (~e1 × ~e3 ) + (a2 b3 − a3 b2 ) (~e2 × ~e3 ) = (a2 b3 − a3 b2 ) ~e1 + (a3 b1 − a1 b3 ) ~e2 + (a1 b2 − a2 b1 ) ~e3 , eine Regel, die sie sicherlich aus der Schule kennen. In der Mechanik wird das Kreuzprodukt z.B. in der Definition der Begriffe Drehimpuls und Drehmoment benötigt. Als mathematisches Beispiel für die Anwendung des Vektorproduktes wollen wir hier die Berechnung des Volumens eines durch drei nicht koplanare Vektoren ~a, ~b und ~c aufgespannten Körpers betrachten. 24 Für einen Beweis siehe z.B. S. Großmann, “Mathematischer Einführungskurs für die Physik”, Teubner Verlag, Stuttgart 1984, Seite 70. 69 2.10. FOURIERREIHEN c b 0 a Betrachten wir dazu zunächst die durch ~a und ~b aufgespannte Fläche. Sie ist durch Grundlinie ∗ Höhe gegeben. b h=|b|sin(ϕ) ϕ 0 a Das ist aber gerade der Betrag von ~a × ~b. Die Richtung ~n von ~a × ~b ist in der folgenden Skizze eingezeichnet. Das Volumen in der obigen Skizze ergibt sich dann zu Grundfläche ∗ Höhe. c h n 0 b a Die Höhe h ist aber gerade durch ~n · ~c gegeben, so daß insgesamt V (~a, ~b, ~c) = (~a × ~b) · ~c folgt. Man nennt V (~a, ~b, ~c) auch das Spatprodukt. 2.10 Fourierreihen Bevor wir dazu kommen Analysis (Differential- und Integralrechnung) und Vektorrechnung im euklidischen Raum in Form von vektorwertigen Funktionen und Funktionen mehrer Veränderlicher zu kombinieren, wollen wir eine Technik einführen, die den Begriff der Funktion und einen Vektorraum von Funktionen benötigt. Im Kapitel über die Taylorentwicklung haben wir eine Methode kennengelernt, die es ermöglicht hinreichend harmlose Funktionen um einen Punkt herum lokal zu approximieren. Dazu haben wir geeignet gewählte Polynome verwendet. Wir wollen nun versuchen Funktionen global anzunähern. Dabei beschränken wir uns 70 KAPITEL 2. MATHEMATISCHE METHODEN auf (reelle) periodische Funktionen mit der Eigenschaft f (t + nT ) = f (t) ; n∈Z. Um den Kontakt zur Physik herzustellen, nennen wir die Variable t (die Zeit). Die Periodendauer ist durch T = 2π/ω, mit der Kreisfrequenz ω, gegeben. Einfache periodische Funktion sind uns bereits im Kapitel 2.2 in Form der trigonometrischen Funktionen sin(ωt) und cos(ωt), bzw. physikalisch in Form der Lösung der Newtonschen Gleichung für die Hooksche Feder Gl. (2.8) begegnet. Auch die Funktionen sin(kωt) und cos(kωt) mit k ∈ N sind offensichtlich periodisch mit Periode T = 2π/ω. Damit gilt gleiches für das trigonometrische Polynom oder Fourierpolynom N a0 X [ak cos(kωt) + bk sin(kωt)] . gN (t) = + 2 k=1 Diese Überlegungen legen die Frage nahe, ob wir jede (hinreichend harmlose) periodische Funktion mit Periode T durch ein gN (t) bei geschickter Wahl der ak und bk global approximieren können und ob die Näherung in irgendeinem Sinn besser wird, wenn man N erhöht. Eine nachfolgende Frage ist, ob die ak und bk eindeutig sind. Bevor wir uns diesen Fragen weiter nähern, wollen wir festhalten, daß wir uns durch Einführen der Variablen t̃ = ωt auf Funktionen mit Periode 2π beschränken können. Dies sieht man wie folgt. Sei f (t) eine Funktion mit Periode T , so hat f (t̃/ω) die Periode 2π. Betrachten wir nun zwei Beispiele. Die erste Funktion sei f1 (t) = t2 für − π < t ≤ π und periodisch fortgesetzt. Sie ist in der folgenden Abbildung dargestellt und offensichtlich keine einfach harmonische Funktion der Form sin(kt) bzw. cos(kt). Die Ableitung dieser Funktion hat Sprungstellen bei ungeraden Vielfachen von π. 10 8 f1 6 4 2 0 -15 -10 -5 0 t 5 10 15 71 2.10. FOURIERREIHEN Das zweite Beispiel ist die ebenfalls nicht einfach harmonische sogenannte Sägezahnkurve f2 (t) = t für − π < t ≤ π und periodisch fortgesetzt, mit Sprungstellen bei ungeraden Vielfachen von π. 3 2 f2 1 0 -1 -2 -3 -10 0 t 10 Das Ziel unser Überlegungen wollen wir anhand der folgende Abbildung klar machen. Sie zeigt f2 (t) und die Fourierpolynome g6 (t) (rot) sowie g12 (t) (blau) jeweils mit ak = 0 für k ∈ N0 und bk = 2 (−1)k+1 /k für k ∈ N. 3 2 f2 1 0 -1 -2 -3 -10 0 t 10 Offensichtlich liefern die dargestellten gN (t) in gewissem Sinn (“bis auf kleine Oszillationen”) eine Näherung an f2 (t). Wir wollen nun die Menge aller 2π-periodischen Funktionen f die in (−π, π] nur endlich viele Spungstellen hat mit V bezeichnen. Genauer betrachen wir wieder Klassen äquivalenter Funktionen, wobei zwei periodische Funktionen als äquivalent bezeichnet werden, wenn sich ihr Funktionswert nur an “einzelnen Punkten” unterscheidet (genaueres dazu in den Vorlesungen der Mathematik). Wie man sich leicht überzeugt hat die Addidtion zweier Funktionen dann alle 72 KAPITEL 2. MATHEMATISCHE METHODEN Eigenschaften, die V zu einer abelschen Gruppe machen. Das neutrale Argument (die Klasse neutraler Elemente) wird dabei durch die Funktion h(t) = 0 für alle t “repräsentiert”. Durch die skalare Multiplikation einer Funktion mit einer reellen Zahl wird V zu einem rellen Vektorraum. Die Linearität des Integrals stellt dann sicher, daß durch Z 1 π (f, g) = f (t) g(t) dt π −π ein Skalarprodukt auf V definierbar ist. Es erfüllt die in Kapitel 2.9 aufgeführten Eigenschaften des Skalarprodukts, wenn man bedenkt, daß wir es mit Repräsentanten von Funktionen (wie oben definiert) zu tun haben. Wir haben dabei in Form von (. . . , . . .) eine neue Notation für das Skalarprodukt eingeführt. Nebenbei bemerken wir, daß es für die Elemente von V auch nicht mehr sinnvoll erscheint die Notation mit dem Vektorpfeil zu verwenden, die wir für Vektoren im d-dimensionalen euklidischen Raum reservieren möchten. Daher haben wir diese Notation hier garnicht erst eingeführt. Mit der Definition des Skalarprodukts haben wir auch eine Länge (Norm) in der Form ||f || = (f, f )1/2 für Elemente aus V eingeführt. Wir haben auch für die Länge (Norm) eine neue Notation verwendet. Um den Begriff der “äquivalenten Funktionen” zu verinnerlichen, sollten sie sich klar machen, daß jeder Repräsentant einer Klasse äquivalenter Funktionen aufgrund der Definition des Skalarprodukts über ein Integral die gleiche Länge (Norm) hat. Der Vektorraum V der Äquivalenzklassen von 2π-periodischen Funktionen mit nur endlich vielen Spungstellen in (−π, π] wird so zu einem unitären Raum. Wir wollen nun die Funktionen 1 φ0 (t) = √ , 2 φk (t) = cos(kt) , φ−k (t) = sin(kt) , mit k ∈ N, aus V betrachten. Wie sie in einer Übungsaufgabe gezeigt haben gilt für k, l 6= 0 (φk , φl ) = δk,l . Wegen 1 (φ0 , φ0 ) = π Z π −π 1 dt = 1 2 73 2.10. FOURIERREIHEN und für k > 0 1 (φ0 , φk ) = π Z π −π 1 √ cos(kt) dt = 0 2 bzw. 1 (φ0 , φ−k ) = π Z π −π 1 √ sin(kt) dt = 0 2 bilden die φk mit k ∈ Z ein orthonormales System in V . Diese abzählbar unendliche Zahl von Vektoren sind somit auch linear unabhängig. Da man über die Zahl der linear unabhängigen Vektoren die Dimension eines Vektrorraum definiern kann, sehen wir, daß V im Gegensatz zum Rd unendlichdimensional ist. Solche Vektorräume mögen ihnen komisch und unanschaulich erscheinen, sie werden jedoch lernen damit umzugehen da sie in der Physik eine wichtige Rolle spielen (spätestens in der Quantenmechanik). Ohne Beweis (siehe Vorlesungen zur Mathematik) geben wir an, daß die {φk } eine orthonormale Basis in V bilden. Damit können wir jedes Element f aus V gemäß f (t) = ∞ X ck φk (t) = k=−∞ ∞ a0 X [ak cos(kωt) + bk sin(kωt)] + 2 k=1 mit reellen Entwicklungskoeffizienten (Vektorkomponenten) ck , ak , bk schreiben, d.h. durch eine Fourierreihe ausdrücken. Die Entwicklungskoeffizienten ergeben sich nach Gl. (2.37) eindeutig zu (k ∈ Z) Z 1 π ck = (φk , f ) = φk (t) f (t) dt π −π bzw. (k ∈ N) a0 ak bk Z 1 π 2(φ0 , f ) = = f (t) dt , π −π Z 1 π cos(kt) f (t) dt , = (φk , f ) = π −π Z 1 π = (φ−k , f ) = sin(kt) f (t) dt . π −π √ (2.40) Wir wollen die Koeffizienten für unsere Bespielfunktionen fj , j = 1, 2, nun explizit berechnen. Die Funktion f2 ist ungerade im Periodizitätsintervall. Daher verschwinden alle Integrale über Produkte von f2 mit einer geraden Funktion. Da cos(kt), k ∈ N0 gerade ist, folgt so ak = 0. Um bk zu berechnen, müssen wir noch Integrale vom Typ Z 1 π t sin(kt) dt bk = π −π 74 KAPITEL 2. MATHEMATISCHE METHODEN bestimmen. Diese berechnen wir wie folgt Z 1 π t sin(kt) dt bk = π −π Z 2 π d = − cos(kt) dt π 0 dk Z d 2 π = − cos(kt) dt dk π 0 π d 2 1 = − sin(kt) dk π k 0 π 1 t 2 = − − 2 sin(kt) + cos(kt) π k k 0 2 π cos(kπ) = − π k 2 = − (−1)k k = 2 (−1)k+1/k , also die in der obigen Abbildung verwendeten bk . Damit ist für das vorliegende Beispiel klar, daß bereits die endliche Fouriersumme (Fourierpolynom), bei der die Summe in der Fourierreihe nur bis k = N läuft, eine globale näherungsweise Beschreibung der Funktion liefert. Gleiches gilt für unsere zweite Beispielfunktion f1 mit den Fourierkoeffizienten (k ∈ N) a0 = 2 π2 , 3 4 , k2 = 0 (da f1 (t) gerade) . ak = (−1)k bk Die Berechnung der Koeffizienten erfolgt analog zu der von f2 . Die Näherungen g6 (t) (rot) und g12 (t) (blau) sind in der folgenden Abbildung zusammen mit f1 (t) dargestellt. 10 8 f1 6 4 2 0 -15 -10 -5 0 t 5 10 15 2.11. VEKTORWERTIGE FUNKTIONEN 75 Die beiden Beispiele verallgemeinernd halten wir fest, daß wir für jede periodische Funktion f (mit höchstens endlich vielen Sprungstellen) eine mehr oder weniger gute globale Näherung durch gN mit den gemäß Gl. (2.40) berechneten Fourierkoeffizienten erhalten können. Vergleichen wir die Näherungen für f1 und f2 so wird klar, daß man für die stetige Funktion f1 bei fester Ordnung N (also durch gN (t)) eine bessere Beschreibung erreicht als für die Funktion f2 (die Sprungstellen hat). Dies ist auch plausibel, wenn man bedenkt, daß die Fourierkoeffizienten von f1 wie 1/k 2 abfallen, die für f2 jedoch nur wie 1/k. Höhere Terme in der Fourierentwicklung von f1 werden somit schneller klein, als die der Entwicklung von f2 . Grundsätzlich kann man festhalten, daß die Fourierkoeffizienten je schneller abfallen, je “glatter” (“harmloser”) die zu nähernde periodische Funktion ist. Um zu verstehen, in welchem Sinne gN für große N gegen f konvergiert, müssen wir uns erinnern, daß wir in der durch das Skalarprodukt gegebenen Norm für den Abstand zweier periodischer Funktionen, die sich an einigen Stellen im Funktionswert unterscheiden Null bekommen (definition des Skalarprodukts über ein Integral). Das macht plausibel, daß es den Abbildungen gemäß offensichtlich Punkte tj gibt, an denen die Konvergenz “sehr viel langsamer” ist, als an anderen Stellen. Im Beispiel der Funktion f2 gilt gN (t = nπ) = 0 für alle N ∈ N und n ∈ Z, so daß bei den ungeraden Vielfachen von π, gN (t) nicht gegen f2 (t) konvergiert. Dies ist im Sinne der Norm verständlich, da sich f2 und die Grenzfunktion limN →∞ gN nur an abzählbar vielen Punkten unterscheiden. Man spricht daher im vorliegenden Fall auch von Konvergenz im Mittel. In der Physik spielen Fourierentwicklungen einerseits als technisches Hilfsmittel bei der Näherung komplexer periodischer Funktionen durch einfache Summen von trigonometrischen Funktionen, also Fourierpolynomen, eine wichtige Rolle. Andererseits lernt man bei der Fourierentwicklung eines periodischen “Signals” der Kreisfrequenz ω, welche höhere harmonische mit Kreisfrequenzen kω dem Signal mit welcher Amplitude ak bzw. bk beigemischt sind. Man lernt also etwas über das Spektrum eines periodischen Signals. Man spricht daher auch von der Spektralanalyse. Durch diese gewinnt man letztendlich physikalische Einsichten über das “Signal”. 2.11 Vektorwertige Funktionen Wie in der Einleitung diskutiert benötigt man in der Mechanik vektorwertige Funktionen, d.h. Abbildungen, bei denen einem Element aus R eindeutig ein (meist dreidimensionaler) Vektor zugeordnet wird. Die Bahnkurve ~x(t) eines Teilchens, d.h. der zeitliche Verlauf des Ortes des Teilchens im dreidimensionalen Raum, ist ein Beispiel für solch eine Funktion. Legen wir eine Basis [~e1 , ~e2 , ~e3 ] fest (hier wieder eine Orthonormalbasis), so können wir jede vektorwertige Funk- 76 KAPITEL 2. MATHEMATISCHE METHODEN tion f~(x) als f~(x) = f1 (x)~e1 + f2 (x)~e2 + f3 (x)~e3 schreiben. Wir definieren zunächst die Stetigkeit einer vektorwertigen Funktion, indem wir die Stetigkeit aller ihrer Komponenten fi (x) fordern. Die Ableitung einer vektorwertigen Funktion liefert wieder eine solche und ist definiert als f~(x + h) − f~(x) . f~0 (x) = lim h→0 h Drücken wir f~ erneut durch die Komponenten aus, so folgt f1 (x + h) − f1 (x) f2 (x + h) − f2 (x) 0 f~ (x) = lim ~e1 + ~e2 h→0 h h f3 (x + h) − f3 (x) ~e3 + h = f10 (x)~e1 + f20 (x)~e2 + f30 (x)~e3 , d.h. f~0 ergibt sich durch komponentenweise Differentiation. Aus dieser Einsicht und den Differentiationsregeln für gewöhnliche Funktionen ergeben sich die folgenden Gesetze für vektorwertige Funktionen ~a(x), ~b(x) und die skalare Funktion g(x): 0 • ~a(x) + ~b(x) = ~a0 (x) + ~b0 (x) 0 ~ • ~a(x) · b(x) = ~a0 (x) · ~b(x) + ~a(x) · ~b0 (x) • (Produktregel) 0 ~a(x) × ~b(x) = ~a0 (x) × ~b(x) + ~a(x) × ~b0 (x) • (g(x)~a(x))0 = g 0 (x)~a(x) + g(x)~a0 (x) • (~a(g(x)))0 = ~a0 (g(x)) g 0(x) (Produktregel) (Produktregel) (Kettenregel) Wie für gewöhnliche Funktionen lassen sich höhere Ableitungen vektorwertiger Funktionen rekursiv definieren ! d dn−1f~(x) dn f~(x) . = dxn dx dxn−1 Eine weitere Diskussion vektorwertiger Funktionen verschieben wir auf die Übungen. Das Ableiten einer vektorwertigen Funktion darf nicht mit dem Ableiten einer Funktion, die von einem Vektor abhängt - und selbst wieder vektorwertig 2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER 77 sein kann (Felder) - nach eben diesem Vektor, also dem Bilden des Gradienten, der Divergenz oder der Rotation, verwechselt werden. Auf diese werden wir im folgenden eingehen. Zuvor wollen wir aber noch anmerken, daß die Integration Z b f~(x) dx a einer vektorwertigen Funktion von einer Variablen, als Integration der einzelnen Komponenten von f~(x) zu verstehen ist. Wie im Fall der Ableitung gibt es bei der Integration von Funktionen (seien sie vektorwertig oder skalar) die von einem Vektor abhängen neue Aspekte, die wir uns im übernächsten Kapitel anschauen werden. 2.12 Funktionen mehrerer Veränderlicher Auch wenn es in der Mechanik oft gelingt, durch geschickte Wahl der Koordinaten (Basisvektoren) Probleme so zu vereinfachen, daß sie von nur einer Orts(oder auch Winkel-) Koordinate abhängen (wir haben schon mehrere Beispiele dazu kennen gelernt), so ist es zum allgemeinen Verständnis doch unvermeidbar, Funktionen mehrerer Veränderlicher - also z.B. der drei Koordinaten x1 , x2 , x3 bezüglich einer fest gewählten Orthonormalbasis - einzuführen. Im Allgemeinen kann die Kraft F~ (~x), die auf ein Teilchen am Punkt ~x wirkt, von diesen drei Koordinaten abhängen. Weiterhin ist F~ selbst ein Vektor. Die Kraft ist also eine vektorwertige Funktion eines Vektors. Betrachten wir als Beispiel die ihnen sicherlich aus der Schule bekannte Gravitationskraft zwischen zwei Punkt-Teilchen der Massen M und m. Wir wählen ein Koordinatensystem mit einer orthonormalen Basis und dem Ursprung in der Masse M. Die Kraft auf das sich am Ort ~x befindliche Teilchen der Masse m ist dann F~ (~x) = −γ x21 Mm ~x p , 2 2 2 + x2 + x3 x1 + x22 + x23 mit der Gravitationskonstanten γ. Den Vektor ~x/|~x| bezeichnet man auch als Richtungsvektor. Er hat die Länge 1. Die Kraft auf die Masse m an der Position ~x zeigt damit immer ins Zentrum des Koordinatensystems - also auf die Masse M - und ihr Betrag fällt wie 1/|~x|2 mit dem Abstand vom Ursprung ab. Die Funktion F~ bildet damit das Zahlentripel x1 , x2 , x3 aus dem Raum R × R × R = R3 auf ein Element F1 , F1 , F3 aus eben diesem Raum ab. Bei dieser abstrakten Betrachtung haben wir die Dimensionen der physikalischen Meßgrößen Ort und Kraft vernachlässigt. Allgemein definiert man die Räume Rn gemäß Rn = {(x1 , x2 , . . . , xn )|xi ∈ R für i = 1, 2, . . . , n} . 78 KAPITEL 2. MATHEMATISCHE METHODEN Als einfacheres Beispiel betrachten wir eine sehr dünne, “zweidimensionale” Metallplatte, die an verschiedenen Stellen beheizt wird. Damit ergibt sich zu jedem festen Zeitpunkt t eine mit der Position25 . ~x = x1 x2 auf der Platte variierende Temperatur T (~x). Im Gegensatz zum Beispiel der Gravitationskraft ist die Funktion selbst in diesem Fall ein Skalar. Abstrakt betrachtet und für eine unendlich ausgedehnte Platte ist die Funktion T eine Abbildung vom R2 auf eine Teilmenge W - den Wertebereich - der reellen Zahlen R. Dabei haben wir erneut die Dimensionen des Ortes und der Temperatur vernachlässigt. Da es (in der Kelvin-Skala) keine negativen Temperaturen gibt, kommt als Wertebereich nur eine Teilmenge der positiven reellen Zahlen in Frage. Ist die Platte endlich, müssen wir auch einen Definitionsbereich D der Funktion festlegen, bei dem es sich um eine Teilmenge von Zahlenpaaren aus den reellen Zahlen handelt. Für eine quadratische Platte der Kantenlänge 2a und dem Nullpunkt des Koordinatensystems im Zentrum gilt dann z.B. D = {(x1 , x2 ) ∈ R2 | − a ≤ x1 ≤ a und − a ≤ x2 ≤ a} . Mißt man die lokale Temperatur der Platte nicht nur zu einer festen Zeit, sondern zu verschiedenen Zeiten t, so stellt die Temperatur eine Funktion von drei Veränderlichen dar. Dabei haben nur die beiden Ortskoordinaten x1 , x2 die Dimension Länge, die dritte Variable jedoch die Dimension Zeit. Ob es sich bei der Funktion um einen Vektor oder ein Skalar handelt, macht bei denen uns im folgenden interessierenden mathematischen Fragestellungen keinen Unterschied, und wir werden uns daher auf skalare Funktionen beschränken. Die gewonnenen Ergebnisse gelten im Fall von vektorwertigen Funktionen für jede ihrer Komponenten. Da sich weiterhin Funktionen zweier Veränderlicher gut graphisch darstellen lassen, werden wir zusätzlich meist solche Funktionen betrachten. Nach dieser physikalischen Motivation betrachten wir zunächst einmal die Graphen dreier Beispielfunktionen.26 f (x, y) = exp (−x2 − y 2 ) : D = R2 , W = (0, 1] 25 Wir verwenden wieder die “wird dargestellt durch” Notation, d.h. wir haben ein Koordinatensystem vorgegeben. 26 Bisher haben wir immer f (~x) geschrieben. Alternativ kann man auch die Komponenten als Argumente explizit angeben: f (x1 , x2 , . . . , xn ). Im folgenden sind x und y die Komponenten. 79 2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER 1 0.8 0.6 f 0.4 0.2 0 –2 –2 –1 –1 0x y0 1 1 2 2 f (x, y) = x2 + y 2 : D = R2 , W = [0, ∞) 200 180 160 140 120 f100 80 60 40 20 0 –10 0 y 10 8 6 4 2 –10 0 –2 –4 –6 –8 x f (x, y) = x2 − y 2 : D = R2 , W = R 80 KAPITEL 2. MATHEMATISCHE METHODEN 100 80 60 40 20 f0 –20 –40 –60 –80 –100 –10 0 y 10 8 6 4 2 –10 0 –2 –4 –6 –8 x Die drei Beispielfunktionen haben unterschiedliche Eigenschaften. So fällt die erste, wenn man im Ursprung der x-y-Ebene startet, in alle Richtungen hin ab, die zweite steigt an, und bei der dritten hängt es davon ab, in welche Richtung man fortschreitet, ob die Funktion ansteigt oder abfällt. Auch sind die ersten beiden Funktionen symmetrisch bei einer Rotation mit beliebigem Winkel um die f -Achse, d.h., bei einer Rotation (mit beliebigem Winkel) um diese Achse geht der Graph der Funktion in sich selbst über. Bei der dritten Funktion ist das nicht der Fall. Dies liegt daran, daß die ersten beiden Funktionen nur von x2 + y 2, d.h. dem Abstand (zum Quadrat) vom Ursprung der x-y-Ebene abhängen. Dies gilt so auch für die oben betrachteten Komponenten der Gravitationskraft. Die dritte Beispielfunktion erinnert an einen Sattel. Man nennt den Punkt x = 0, y = 0 daher auch einen Sattelpunkt. Wie wir für Funktionen einer Variablen gelernt haben, gibt uns die Ableitung einer Funktion an, wie sich der Funktionswert ändert, wenn wir von einer Stelle x nach x + h, für h → 0, weitergehen. Wie wir gerade gelernt haben, kann die Änderung im Fall einer Funktion mehrerer Veränderlicher davon abhängen, in welche Richtung man weitergeht. Zur Beschreibung der Änderung benötigen wir somit eine vektorielle Größe. Diese wollen wir im folgenden wenig formal “herleiten”. Betrachten wir eine Funktion f (x, y), so können wir uns fragen, wie sich der Funktionswert ändert, wenn wir ausgehend von x, y in die x-Richtung fortschreiten. Die Steigung an der Stelle x, y in diese Richtung wird uns durch die Ableitung von f nach x bei festem y gegeben, wenn wir als Argumente der abgeleiteten Funktion wieder x, y einsetzen. Man nennt diese Ableitung die partielle Ableitung nach x und schreibt ∂f (x, y) f (x + h, y) − f (x, y) = lim . h→0 ∂x h 2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER 81 Als Beispiel bilden wir die partielle Ableitung unserer ersten Beispielfunktion nach x ∂f (x, y) = −2x exp (−x2 − y 2 ) ∂x (2.41) und auch gleich die nach y ∂f (x, y) = −2y exp (−x2 − y 2) . ∂y (2.42) Dabei haben wir stillschweigend angenommen, daß die Funktion f hinreichend harmlos ist, so daß die entsprechenden Ableitungen existieren - wie es in unserem Beispiel natürlich der Fall ist. Betrachten wir ein weiteres Beispiel ∂ x21 + 2x1 x32 + 5 = 2x1 + 2x32 , ∂x1 in dem die beiden Variablen mal nicht mit x und y bezeichnet sind. Die Ableitungsregeln für Funktionen einer Veränderlichen (Produktregel, Quotientenregel und Kettenregel) gelten auch für die partielle Ableitung, da es sich ja bei ihr um eine gewöhnliche Ableitung nach einer Variablen bei festgehaltenen anderen handelt. Für die folgende Überlegung nehmen wir an, daß wir eine hinreichend glatte Funktion f haben - so daß alle Ableitungen, die wir bilden wollen, auch existieren - die von den n Variablen x1 , x2 , . . . , xn abhängt. Wie für Funktionen einer Veränderlichen kann man partielle Ableitungen höherer Ordnung definieren. Bei partiellen Ableitungen gibt es aber nun die zusätzliche Option nicht nur zweimal nach xi zu differenzieren, sondern erst nach xi und dann nach xj mit j 6= i ∂ ∂ ∂ 2 f (x1 , x2 , . . . xn ) f (x1 , x2 , . . . xn ) = . ∂xj ∂xi ∂xj ∂xi Diese Idee läßt sich beliebig in höhere Ordnungen fortsetzen. Kommen wir nun zurück zu der Frage, einen Vektor zu konstruieren, der die Information über die Steigung einer Funktion mehrerer Veränderlicher enthält. Betrachten wir zunächst unsere erste Beispielfunktion f (x, y) = exp (−x2 − y 2 ). Mit den Gln. (2.41) und (2.42) wissen wir bereits, wie sich die Funktion ändert, wenn wir in x- bzw. y-Richtung fortschreiten. Das legt nahe, daß der Vektor ! ∂f (x,y) 2 2 −2x exp (−x − y ) . ∂x ~ (x, y) = = grad f (x, y) = ∇f ∂f (x,y) −2y exp (−x2 − y 2 ) ∂y der von uns gesuchte “Steigungsvektor” ist. Das Symbol grad steht für Gradient. ~ sind beide gebräuchlich. Wir werden hier im Die Notationen grad f und ∇f 82 KAPITEL 2. MATHEMATISCHE METHODEN ~ verwenden. Die Verallgemeinerung auf eine Funktion folgenden die Notation ∇f von n Veränderlichen ist offensichtlich ∂f ∂x1 ∂f ∂x2 . ~ = ∇f ... ... ∂f ∂xn . ~ auch ein Gradientenfeld. Schauen wir Man nennt die Menge der Vektoren ∇f uns nun die Gradientenfelder für unsere drei Beispielfunktionen an. Für die er~ soeben berechnet. Wir können das Vektorfeld nun graphisch ste haben wir ∇f darstellen, indem wir uns in der x-y-Ebene ein diskretes Gitter von Punkten vorgeben und an jedem Gitterpunkt einen Pfeil einzeichnen, wobei der Mittelpunkt des Pfeils auf dem Gitterpunkt liegt. Die Richtung des Pfeils gibt die Richtung ~ an der Stelle ~x an, und die Länge ist ein Maß für den Betrag von ∇f ~ von ∇f an dieser Stelle. Im Beispiel haben wir das oben gezeigte Gebiet −2 ≤ x ≤ 2, −2 ≤ y ≤ 2 in ein 21 ×21 Gitter eingeteilt, d.h. die Mittelpunkte der Pfeile liegen bei xn = n/5 und yn = n/5 mit n = −10, −9, . . . , 9, 10. . ~ (x, y) = ∇f ∂f (x,y) ∂x ∂f (x,y) ∂y ! = −2x exp (−x2 − y 2 ) −2y exp (−x2 − y 2 ) 2 y1 –2 –1 1 x 2 –1 –2 Das Gradientendfeld der zweiten Beispielfunktion f (x, y) = x2 + y 2 ist ! ∂f (x,y) 2x . ∂x ~ = ∇f (x, y) = ∂f (x,y) 2y ∂y 2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER 83 10 8 y6 4 2 –10 –8 –6 –4 –2 –2 4 2 6 x 8 10 –4 –6 –8 –10 und das der dritten f (x, y) = x2 − y 2 . ~ (x, y) = ∇f ∂f (x,y) ∂x ∂f (x,y) ∂y ! = 2x −2y . 10 8 y6 4 2 –10 –8 –6 –4 –2 –2 2 4 6 x 8 10 –4 –6 –8 –10 Die oben diskutierten Eigenschaften der Beispielfunktionen lassen sich auch in den zugehörigen Gradientenfeldern leicht erkennen. Sind wir daran interessiert, wie groß die Steigung an einem Punkt x, y in eine durch einen Vektor ~n der Länge 1 gegebene Richtung ist, so müssen wir das 84 KAPITEL 2. MATHEMATISCHE METHODEN Skalarprodukt ~ (x, y) ~n · ∇f bilden. Für eine Funktion von n Veränderlichen ist die Steigung im Punkt ~x bei Fortschreiten in Richtung des Vektors ~n, mit |~n| = 1, durch ~ (x1 , x2 , . . . , xn ) ~n · ∇f gegeben. Ein in diesem Kontext wichtiger Begriff ist der der Äquipotentiallinie:27 Das sind Kurven in der x, y-Ebene entlang derer sich f (x, y) nicht ändert. Ist so eine Äquipotentiallinie durch einen vom Ort x, y abhängigen Tangentialvektor an der ~ (x, y) = 0. Für Kurve ~n(x, y) der Länge 1 gegeben, so gilt damit ~n(x, y) · ∇f die ersten beiden Beispielfunktionen sind die Äquipotentiallinien Kreise um den Ursprung, die durch x2 +y 2 = const. gegeben sind, für die dritte sind es Hyperbeln mit x2 − y 2 = const.. In allen unseren Beispielfunktionen spielt der Ursprung x = 0 = y eine ausgezeichnete Rolle. Im ersten Beispiel nimmt die Funktion im Ursprung ihren maximalen Wert an, im zweiten den minimalen und im dritten Beispiel liegt ein Sattelpunkt vor. Für die drei Beispiele verschwinden die beiden ersten partiellen Ableitungen im Ursprung. Verallgemeinernd bezeichnet man die Punkte ~x0 an denen alle ersten partiellen Ableitungen verschwinden, d.h. ∂f (~x0 ) = 0 , ∂xj für alle j = 1, 2, . . . , n als stationäre Punkte.28 Da sich Gradientenfelder im physikalisch relevanteren dreidimensionalen Raum nicht so schön graphisch darstellen lassen, wollen wir hier nicht weiter auf diesen Fall eingehen. Wir wollen nur anmerken, daß das Konzept des Gradienten in der Physik z.B. bei der Bestimmung eines Kraftfeldes aus einem Potential V (~x) (bzw. aus der potentiellen Energie) ~ (~x) F~ (~x) = −∇V eine zentrale Rolle spielt. So läßt sich die am Anfang dieses Kapitels diskutierte Gravitationskraft durch Bilden des negativen des Gradienten aus dem Potential V (~x) = −γ Mm |~x| bestimmen. 27 28 Wir beschränken uns hier auf das Beispiel der Funktionen von zwei Veränderlichen. Ein stationärer Punkt ist also entweder ein Extremum oder ein Sattelpunkt. 2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER 85 Unsere Überlegungen sollten den Begriff des Gradienten einer skalaren Funktion mehrerer Veränderlicher hinreichend anschaulich verdeutlicht haben und auch die Bedeutung in der Physik (speziell der Mechanik) sollte klar geworden sein. Wir haben bereits die Taylorentwicklung um einen Punkt x0 für Funktionen einer veränderlichen kennen gelernt. Diese läßt sich leicht auf den Fall einer skalaren Funktion (bzw. den einzelnen Komponenten vektorwertiger Funktionen) von n Veränderlichen verallgemeinern. Betrachten wir dazu zunächst den Fall n = 2. Die Funktion f (x, y) soll um den Punkt (x0 , y0 ) Taylor-entwickelt werden. Halten wir zunächst y fest, so ergibt sich nach dem oben gelernten die Taylorreihe29 ∞ X 1 ∂k f (x0 , y) (x − x0 )k . f (x, y) = k k! ∂x k=0 Die auftretenden Ableitungen von f nach x werden an der Stelle x0 genommen und sind daher nur noch von der Variablen y abhängig. Wir können diese also nach y um den Punkt y0 Taylor-entwickeln30 und erhalten "∞ # ∞ X 1 X 1 ∂l ∂k f f (x, y) = (x0 , y0 ) (y − y0 )l (x − x0 )k l ∂xk k! l! ∂y k=0 l=0 ∞ X ∞ X 1 ∂ k+l f (x0 , y0 ) (x − x0 )k (y − y0 )l . = k ∂y l k! l! ∂x k=0 l=0 Um von der ersten zur zweiten Zeile zu gelangen haben wir angenommen, daß die Reihenfolge der Ableitungen nach x und y keine Rolle spielt - was eine weitere Forderung an die Eigenschaften von f darstellt - und wir die Summanden in beliebiger Reihenfolge aufsummieren können. Wie sich aus diesen Überlegungen die Taylorentwicklung für den Fall von n Veränderlichen ∞ X ∞ ∞ X X 1 ∂ k1 +...+kn f f (~x) = ... (~x0 ) (x1 − x0,1 )k1 . . . (xn − x0,n )kn k1 ! . . . kn ! ∂xk11 . . . ∂xknn k1 =0 k2 =0 kn =0 ergibt sollte evident sein. In praktischen Anwendungen benötigt man die Terme niedrigster Ordnung. Für den Fall n = 2 sehen diese bis zur quadratischen Ordnung wie folgt aus ∂f ∂f (x0 , y0 ) (x − x0 ) + (x0 , y0 ) (y − y0 ) f (x, y) = f (x0 , y0 ) + ∂x ∂y ∂2f 1 ∂2f 2 (x , y ) (x − x ) + (x0 , y0 ) (x − x0 )(y − y0 ) + 0 0 0 2 ∂x2 ∂x∂y 1 ∂2f + (x0 , y0 ) (y − y0 )2 + . . . , 2 ∂y 2 29 Wir gehen natürlich “Physiker-mäßig” wieder davon aus, daß f hinreichend harmlos ist, so daß alle Ableitungen die wir bilden auch existieren. 30 Somit müssen auch die Ableitungen von f nach x hinreichend harmlose Funktionen von y sein. 86 KAPITEL 2. MATHEMATISCHE METHODEN wobei die Punkte für Terme stehen, die mindestens drei Faktoren der “kleinen” Größen x − x0 und y − y0 enthalten. Entwickelt man um einen stationären Punkt, so fallen die beiden linearen Terme (nach Definition des Begriffs stationärer Punkt) weg. Diese Einsicht läßt sich direkt auch auf den höherdimensionalen Fall (also z.B. den dreidimensionalen) übertragen. Betrachten wir ein Teilchen, welches sich in der Nähe eines (lokalen) Potentialminimums bei ~x0 aufhält, d.h. die kinetische Energie31 sei hinreichend klein. In diesem Fall scheint es plausibel, das Potential in einer Taylorreihe zu entwickeln. Da es sich bei dem Minimum um einen stationären Punkt handelt, treten in der Entwicklung bis zur zweiten Ordnung nur der konstante Term und die quadratischen Terme auf. Die auf das Teilchen wirkende Kraft (d.h. der Gradient des Potentials) hat dann nur Terme die linear in der Auslenkung aus dem Minimum sind. Das resultierende mechanische Problem ist also analog zu dem einer Masse mit Hookscher Feder. Diese Überlegung macht es plausibel, daß das Problem mit linearer Rückstellkraft eine sehr zentrale Rolle in der Mechanik spielt. Neben dem Gradienten spielen in der Physik die “Differentiellen”-Konzepte der Divergenz und der Rotation eine zentrale Rolle (speziell in “Feldtheorien” wie z.B. der Elektrodynamik). ~ Im Fall der Divergenz wendet man den vektorwertigen Differentialoperator ∇ auf eine vektorwertige Funktion von n Veränderlichen an ~ · f~(~x) = ∂f1 + ∂f2 + . . . + ∂fn . div f~(~x) = ∇ ∂x1 ∂x2 ∂xn ~ so verstehen, daß er in der {~ej }-Basis durch den Dabei muß man den Vektor ∇ Spaltenvektor ∂ ∂x1 ∂ ∂x2 . ~ = ... ∇ ... ∂ ∂xn dargestellt wird. Durch Bilden der Divergenz ergibt sich eine skalare Funktion von n Veränderlichen. Wir wollen die Bedeutung der Divergenz anschaulich verstehen. Dazu betrachten wir die Strömung einer kompressiblen Flüssigkeit in drei Dimensionen. Das Geschwindigkeitsfeld ~v (~x) gibt die Geschwindigkeit (Richtung und Betrag) eines Teilchens an, welches sich am Ort ~x befindet. Als weitere Größe zur Charakterisierung benötigen wir die lokale Dichte ρ(~x) der Flüssigkeit. Wir betrachten dann einen kleinen Quader mit Volumen ∆x1 ∆x2 ∆x3 und einem Eckpunkt am Koordinatenursprung. Dieser ist in der folgenden Skizze dargestellt. 31 Ich gehe davon aus, daß sie diesen Begriff in der Schule kenne gelernt haben und mit Leben füllen können. 2.12. FUNKTIONEN MEHRERER VERÄNDERLICHER G D e3 C e2 E A e 1 87 H F B Die Flüssigkeitsmenge, die pro Zeit durch Fläche (A, E, G, D) in dieses Volumen fließt ist durch ρv1 |~x=~0 ∆x2 ∆x3 gegeben. Die Komponenten des Flusses ρv2 und ρv3 die tangential zur Fläche sind tragen nichts zum Fluß durch diese Fläche bei. Die Flüssigkeitsmenge, die pro Zeit durch die Fläche (B, F, H, C) austritt ist durch ρv1 |x1 =∆x1 ,x2 =x3 =0 ∆x2 ∆x3 bestimmt. Bei diesen Überlegungen sind wir davon ausgegangen, daß die Funktion ρ(~x)v1 (~x) auf den beiden betrachteten Flächen einen von x2 und x3 unabhängigen Wert hat. Für hinreichend kleine Quader und hinreichend harmlose Funktionen ρ(~x)v1 (~x) ist dies immer erreichbar. Wir entwickeln dann die austretende Flüssigkeitsmenge in einer Taylorreihe bezüglich x1 und erhalten ∂ρv1 ρv1 |x1 =∆x1 ,x2 =x3 =0 ∆x2 ∆x3 ≈ ρv1 |~x=~0 ∆x2 ∆x3 + ∆x1 ∆x2 ∆x3 . ∂x1 ~x=~0 Der Gesamtfluß aus dem Volumen in die x1 -Richtung ergibt sich als Differenz der beiden gerade berechneten Flüsse und wir erhalten für diesen ∂ρv1 ∆x1 ∆x2 ∆x3 . ∂x1 ~x=~0 Analoge Überlegungen gelten für die Flüsse durch die anderen Flächen des Quaders. Der Gesamtfluß pro Zeit aus dem Quader ist dann die Summe dieser Ausdrücke und durch ∂ρv1 ∂ρv2 ∂ρv3 ~ · (ρ~v ) ∆x ∆x ∆x = ∇ ∆x1 ∆x2 ∆x3 + + 1 2 3 ∂x1 ∂x2 ∂x3 ~x=~0 ~ x=~0 ~ · (ρ~v ), ist also durch gegeben. Der Fluß pro Zeit und Volumen ergibt sich so zu ∇ die Divergenz gegeben. Diese hat damit die Bedeutung einer lokalen Quellstärke des Vektorfeldes ρ~v . Wir sind dabei davon ausgegangen, daß das obige Ergebnis für kleine Volumina unabhängig von der Form des Volumens (hier “infinitessimaler” Quader) ist und das die Überlegungen nicht auf den Ursprung ~x = 0 beschränkt sind. 88 KAPITEL 2. MATHEMATISCHE METHODEN Mit der Interpretation der Divergenz eines Vektorfeldes als lokaler Quellstärke, läßt sich auch eine der Grundgleichungen der Elektrostatik ~ · E(~ ~ x) ∝ ρ(~x) , ∇ ~ und der Ladungsdichte ρ, verstehen. Die Quellen eimit dem elektrischen Feld E nes elektrischen Feldes sind Ladungen. Magnetfelder dagegen haben keine Quellen (es gibt keine magnetischen Monopole), so daß ~ · B(~ ~ x) = 0 , ∇ ~ mit dem Magnetfeld B. Die Rotation ist in drei Dimensionen (d.h. f~ ∈ R3 und ~x ∈ R3 ) definiert durch ∂f ∂f ∂f ∂f ∂f ∂f 2 1 3 2 1 3 ~ ~ ~ × f (~x) = − ~e1 + − ~e2 + − ~e3 . rot f (~x) = ∇ ∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2 ~ und f~ gebildet wird, handelt es sich bei Da hier das Vektorprodukt zwischen ∇ dem Resultat dieser Operation um eine vektorwertige Funktion (eines Vektors). Die anschauliche Bedeutung der Rotation können wir uns ebenfalls anhand von Strömungen einer Flüssigkeit klar machen. Dazu betrachten wir einen Wirbel. Das Geschwindigkeitsfeld ~v(~x) = ~ω × ~x beschreibt einen speziellen, homogenen Wirbel mit Richtung ~ω /|~ω| und Betrag der Wirbelstärke |~ω |. Für die erste Komponente der Rotation von ~v(~x) gilt ∂v2 ∂v3 ~ − ∇ × ~v = ∂x2 ∂x3 1 ∂(ω1 x2 − ω2 x1 ) ∂(ω3 x1 − ω1 x3 ) − = ∂x2 ∂x3 = 2ω1 . Analoge Überlegungen für die anderen Komponenten liefern ~ × ~v = 2~ω . ∇ Damit ist klar, daß die Rotation ein Maß für den Betrag und die Richtung der Wirbelstärke liefert. Nach der Illustration der Begriffe Divergenz und Rotation sollte ihnen anschaulich klar sein, daß Wirbelfelder stets quellenfrei sind, oder mathematisch ~ · (∇ ~ × f~) = 0 , ∇ falls f~ zweimal stetig differenzierbar ist. In einer Übungsaufgabe werden sie dieses auch mathemtisch zeigen. Wie sie ebenfalls in einer Übungsaufgabe zeigen werden, gilt ~ × [∇φ(~ ~ x)] = 0 , ∇ 89 2.13. MATRIZEN d.h. die Rotation eines Gradientenfeldes verschwindet, wobei wir natürlich davon ausgehen, daß φ(~x) zweimal stetig differenzierbar ist. Verglichen mit der Bedeutung des Gradienten in der klassischen Mechanik spielen die beiden Begriffe Divergenz und Rotation in dieser eher untergeordnete Rollen.32 2.13 Matrizen Wir wollen den Begriff der Matrix hier anhand einer speziellen Klasse von Matrizen - denjenigen die Drehungen beschreiben - einführen. Diese spielen in der Mechanik eine zentrale Rolle. Wir betrachten dazu die Situation, daß wir ei0 0 0 ne orthonormale Basis B = [~e1 , ~e2 , ~e3 ] auf eine andere B 0 = [~e1 , ~e2 , ~e3 ] rotieren möchten. e’3 e3 e’2 e2 e’1 e1 Einen beliebigen Vektor ~x können wir dann in beiden Basen ausdrücken 0 0 0 ~x = x1~e1 + x2~e2 + x3~e3 = x01~e1 + x02~e2 + x03~e3 . (2.43) Um die x0i , mit i = 1, 2, 3 aus den xj , mit j = 1, 2, 3 zu berechnen, drücken wir 0 zunächst die neuen Basisvektoren ~ei durch die alten ~ej aus 0 ~ei = ai,1~e1 + ai,2~e2 + ai,3~e3 . (2.44) Die sich ergebenden 3 ∗ 3 Zahlen ai,j ordnen wir in ein 3 × 3 Schema, in dem der erste Index die Zeile angibt und der zweite die Spalte a1,1 a1,2 a1,3 A = a2,1 a2,2 a2,3 , a3,1 a3,2 a3,3 welches wir mit A bezeichnen und Matrix nennen. Die ai,j nennen wir Matrixelemente. Die Bedeutung der ai,j erkennen wir, indem wir Gl. (2.44) mit ~ej multiplizieren und Gl. (2.36) verwenden 0 ai,j = ~ei · ~ej . 32 Die Rotation spielt eine Rolle in der Mechanik als “Werkzeug” um zu untersuchen, ob ein Vektorfeld als Gradient einer skalaren Funktion, d.h. als Gradient eines Potentials, zu schreiben ist. Wir werden darauf weiter unter zurückkommen. 90 KAPITEL 2. MATHEMATISCHE METHODEN 0 Da die Länge von ~ei und ~ej Eins ist, ergibt sich nach der Definition des Skalarprodukts 0 ai,j = cos ϕ ~ei , ~ej . Die Matrix A beschreibt also alle Winkel der neuen Basis B 0 in Bezug auf B. Da 0 |~ei | = 1 gilt, folgt aus Gl. (2.44) 0 0 ~ei · ~ei = 1 = 3 X a2i,j (2.45) j=1 0 für i = 1, 2, 3. Weiterhin sind die ~ei paarweise senkrecht zueinander (i 6= j) 0 0 ~ei · ~ej = 0 = 3 X ai,k aj,k . (2.46) k=1 Die Eigenschaften der Gln. (2.45) und (2.46) sind speziell für die eine Rotation darstellende Matrix. Für allgemeine Matrizen sind die Matrixelemente ai,j beliebige reelle (oder komplexe) Zahlen. Die Gln. (2.45) und (2.46) kann man zu 3 X ai,k aj,k = δi,j (2.47) k=1 zusammenfassen. Oft schreibt man diese Gleichung einfach als ai,k aj,k = δi,j und verwendet die Einsteinsche Summationskonvention, die vorschreibt, daß über alle auf einer Seite der Gleichung doppelt auftretenden Indizes summiert wird. Um zu sehen, wie man mit Hilfe der Matrix A die x0i in Gl. (2.43) aus den xj berechnen 0 kann, bilden wir auf beiden Seiten der Gleichung das Skalarprodukt mit ~e1 . So ergibt sich x01 0 0 0 = x1~e1 · ~e1 + x2~e1 · ~e2 + x3~e1 · ~e3 = 3 X a1,j xj . j=1 Völlig analog kann man x02 und x03 bestimmen. Insgesamt gilt x0i = 3 X ai,j xj . j=1 Mit Hilfe der Matrix können wir also die neuen Vektorkomponenten aus den alten berechnen. Eine Matrix beschreibt allgemein eine Abbildung eines Vektors auf einen anderen. Die Klasse von Matrizen mit der Eigenschaft der Gl. (2.47) bezeichnet man als orthogonale Matrizen. Sie repräsentieren Drehungen. 91 2.13. MATRIZEN Will man zwei Rotationen - gegeben durch die Matrizen A und B - (allgemeiner zwei Abbildungen) hintereinander ausführen, so kann man die Matrix C, die beide Transformationen in einem Schritt vermittelt, wie folgt bestimmen x00i = 3 X j=1 bi,j x0j = 3 X bi,j j=1 3 X aj,k xk = k=1 3 X ci,k xk , k=1 mit ci,k = 3 X bi,j aj,k . j=1 Kurz schreibt man C = BA. Man multipliziert die Matrizen B und A miteinander. Will man von den neuen Koordinaten zurück auf die alten transformieren, so muß gelten ci,k = 3 X bi,j aj,k = δi,k , j=1 damit x00i = xi folgt. Man bezeichnet B in diesem Fall als das Inverse von A und schreibt B = A−1 . Mit Hilfe der Gl. (2.47) sieht man, daß sich für orthogonale Matrizen die Matrixelmente ãi,j der inversen Matrix A−1 aus den ai,j durch Vertauschen der Zeilen- und Spaltenindizes ergeben ãi,j = aj,i . Allgemein nennt man die sich aus A durch Vertauschen der Zeilen- und Spaltenindizes ergebenden Matrix die zu A transponierte Matrix und bezeichnet sie mit AT . Für orthogonale Matrizen gilt also AT = A−1. Nach dieser Einführung des Matrix-Begriffs anhand eines in der Physik wichtigen Beispiels, wollen wir noch kurz auf ein paar allgemeine Gesichtspunkte eingehen. Allgemein nennen wir ein Schema mit n Zeilen und m Spalten a1,1 a1,2 . . . a1,m a2,1 a2,2 . . . a2,m ... ... ... ... · · · · A= · · · · · · · · ... ... ... ... an,1 an,2 . . . an,m mit ai,j ∈ R (bzw. ∈ C) eine n×m-Matrix. Der erste Index ist der Zeilenindex, der zweite der Spaltenindex. Bei der Multiplikation einer Matrix mit einer reellen bzw. komplexen Zahl λ werden einfach alle Matrixelemente ai,j mit λ multipliziert. Für B = λA gilt also, bi,j = λai,j für i = 1, 2, . . . , n und j = 1, 2, . . . , m . 92 KAPITEL 2. MATHEMATISCHE METHODEN Nur für den Fall, daß zwei Matrizen die gleiche Anzahl von Spalten und Zeilen haben kann die Addition zweier Matrizen A und B sinnvoll definiert werden. Sie ist komponentenweise definiert, d.h. es gilt für C = A + B ci,j = ai,j + bi,j für i = 1, 2, . . . , n und j = 1, 2, . . . , m . Eine Allgemeine n × m-Matrix beschreibt eine lineare Abbildung vom Rm in den Rn (bzw. vom Cm in den Cn ).33 Eine Abbildung A vom Rm in den Rn heißt linear, wenn sie die folgenden Eigenschaften für alle ~x, ~y ∈ Rm und λ ∈ R erfüllt: A(~x + ~y ) = A(~x) + A(~y ) A(λ~x) = λA(~x) . Um das Bild A(~x) eines Vektors ~x ∈ Rm zu bestimmen, kann man die Matrix A auf den Vektor ~x anwenden ~y = A~x , (2.48) mit ~y ∈ Rn . Komponentenweise schreibt man diese Gleichung wie folgt: yi = m X ai,j xj für i = 1, 2, . . . , n . j=1 Eine Gleichung dieser Form haben sie wahrscheinlich in der Schule im Zusammenhang mit dem Problem von “n linearen Gleichungen zur Bestimmung von m Unbekannten xj , mit j = 1, 2, . . . , m” kennengelernt. In diesem Kontext ergibt sich das zur Abbildungsidee umgekehrte Problem: Die linken Seiten yi sind vorgegeben und man möchte die xj bestimmen, die den Satz von Gleichungen erfüllt. Diese Überlegung führt uns erneut auf das Konzept der Inversen A−1 einer Matrix A. Bevor wir dieses Konzept allgemein genauer beleuchten, müssen wir die Multiplikation zweier Matrixen definieren. Da es sich bei n × m-Matrizen um lineare Abbildungen vom Rm in den Rn handelt soll die Matrix C = BA der Abbildung C entsprechen, die sich beim Hintereinanderausführen von A (zuerst) und B (als zweites) ergibt. Damit ist unter anderem klar, daß die Multiplikation nur für zwei Matrizen sinnvoll definiert werden kann, für die die Zahl der Zeilen der zuerst anzuwendenden Matrix A gleich der Zahl der Spalten der als zweites anzuwendenden Matrix B ist. Die Matrix A beschreibt damit eine lineare Abbildung vom Rm in den Rn , die Matrix B eine vom Rn in den Rl , so daß C eine lineare Abbildung vom Rm in den Rl beschreibt. Völlig analog zu den Überlegungen im obigen Beispiel der 3 × 3-Matrix ergibt sich unter Zuhilfenahme von Gl. (2.48) für die Matrixelemente von C ci,k = n X bi,j aj,k für i = 1, 2, . . . , l und k = 1, 2, . . . , m . j=1 33 Von jetzt an, werden wir uns auf reelle Matrizen beschränken. Das folgende läßt sich aber leicht auf den Fall komplexer Matrizen verallgemeinern. 93 2.13. MATRIZEN Im Gegensatz zur Multiplikation von reellen Zahlen ist damit klar, daß im Allgemeinen BA nicht gleich34 AB ist, da letzteres nur für l = m überhaupt definiert ist. Aber selbst, wenn beide Produkte definiert sind (z.B. im physikalisch wichtigen Fall zweier n × n-Matrizen), gilt im Allgemeinen BA 6= AB! Die Matrixmultiplikation ist im Allgemeinen also nicht kommutativ. Ein Beispiel dazu werden sie in den Übungen rechnen. Im Gegensatz dazu gelten für die Matrixmultiplikation das Assoziativgesetz (AB) C = A (BC) und das Distributivgesetz (A + B) C = AC + BC. Betrachten wir im folgenden nur noch den Fall von n×n-Matrizen. Das Inverse −1 A der Matrix A ist definiert durch A−1 A = AA−1 = 1 . Die Einheitsmatrix 1 hat die Matrixelemente δi,j . Diese Gleichung erlaubt es A−1 eindeutig zu berechnen, sofern es A−1 überhaupt gibt. Ein einfaches Kriterium um festzustellen, ob A−1 existiert, werden sie in der Vorlesung HöMa I beweisen.35 Dort werden sie im Fall der Existenz auch ein systematisches Verfahren zum Bestimmen von A−1 kennenlernen. Wie man leicht nachrechnet hat die Einheitsmatrix 1 die Eigenschaft A1 = A. Die Nullmatrix 0 ist dadurch definiert, daß alle Matrixelemente Null sind.36 Damit gilt A0 = 0 für alle Matrizen A. Nehmen wir an, daß das Inverse von A im oben angesprochenen Beispiel des Problems “Bestimmung von n Unbekannten xi aus n linearen Gleichungen” (die yi sind bekannt) yi = n X ai,j xj für i = 1, 2, . . . , n . j=1 existiert. In diesem Fall ergeben sich die Unbekannten xi eindeutig aus xi = n X ãi,j yj für i = 1, 2, . . . , n , j=1 wobei die ãi,j die Matrixelemente von A−1 bezeichnen. Für das Bilden der inversen Matrix gilt37 (AB)−1 = B−1 A−1 , wie sich aus X (AB) = 1 durch Multiplikation zuerst mit B−1 und anschließender Multiplikation mit A−1 jeweils von rechts auf beiden Seiten der Gleichung ergibt. Im nächsten Kapitel werden wir das so genannte Eigenwertproblem einer speziellen Klasse von Matrizen untersuchen. 34 Zwei Matrizen sind gleich, wenn alle ihre Matrixelemente gleich sind. Wir werden später kurz auf diesen Aspekt zurückkommen. 36 Durch diese Definition ist auch im allgemeinen Fall der n × m-Matrix eine Nullmatrix festgelegt. 37 Wir nehmen an, daß alle auftretenden inversen Matrizen auch existieren. 35 94 2.14 KAPITEL 2. MATHEMATISCHE METHODEN Das Eigenwertproblem und die Hauptachsentransformation In der Mechanik starrer Körper spielen das Eigenwertproblem und die Hauptachsentransformation eine große Rolle. Eine weitere für uns wichtige Rolle spielen diese Begriffe bei der Lösung von Systemen gekoppelter linearer Differentialgleichungen. Solche ergeben sich wenn man die Newtonsche Gleichung für eine wichtige Klasse von mechanischen Problemen aufstellt. Wir werden das Eigenwertproblem anhand eines einfachen Beispiels einführen und uns hier auf reelle Matrizen, also den Rn , beschränken. Wir betrachten die (diagonale) 3 × 3-Matrix 1 0 0 A= 0 4 0 . 0 0 −2 Sie hat die Eigenschaft, daß 1 1 0 0 1 1 0 4 0 0 0 , A 0 = =1 0 0 0 −2 0 0 0 1 0 0 0 0 0 4 0 1 1 , A 1 = =4 0 0 0 −2 0 0 0 1 0 0 0 0 A 0 = 0 4 0 0 = −2 0 , 1 0 0 −2 1 1 d.h. die Basisvektoren ~ej reproduzieren sich bis auf einen Faktor, wenn man A auf sie anwendet. Allgemein bezeichnet man einen Vektor ~v 6= ~0 der sich bei Anwenden einer Matrix A bis auf einen Faktor λ ∈ R reproduziert, d.h. für den A~v = λ~v gilt, als einen Eigenvektor von A zum Eigenwert λ. Also sind die Basisvektoren ~ej Eigenvektoren der obigen (diagonalen) Matrix A zu den Eigenwerten 1, 4 und −2. Es stellen sich dann zwei Fragen: 1) Warum ist es interessant Eigenwerte und Eigenvektoren eine Matrix zu kennen? 2) Wie bestimmt man λ und ~v ? Diese werden wir in diesem Kapitel der Vorlesung beantworten, wobei wir uns primär auf Matrizen auf dem R2 und dem R3 beschränken werden. Bevor wir dazu kommen, wollen wir jedoch ein weitere Eigenschaften von Eigenvektoren kennenlernen, eine alternative Notation für das Skalarprodukt einführen und eine Klasse von Matrizen charakterisieren auf deren Eigenwertproblem wir uns dann im folgenden beschränken werden 95 2.14. DAS EIGENWERTPROBLEM Nehmen wir an, daß wir einen Eigenvektor ~v von A zum Eigenwert λ kennen. Dann ist auch c~v, mit c ∈ R \ {0} ein Eigenvektor zum Eigenwert λ.38 Das sieht man sehr leicht A(c~v) = cA~v = cλ~v = λ(c~v) . Somit ist ein Eigenvektor nur bis auf einen Faktor eindeutig definiert. Daher ist es sinnvoll einen auf 1 normierten Eigenvektor zum Eigenwert λ einzuführen: |~v| = 1. Von jetzt an gehen wir davon aus, daß die Eigenvektoren die wir betrachten auf 1 normiert sind. Weiter oben haben wir den Begriff der transponierten Matrix eingeführt a1,1 a2,1 . . . an,1 a1,1 a1,2 . . . a1,m a1,2 a2,2 . . . an,2 a2,1 a2,2 . . . a2,m ... ... ... ... ... ... ... ... · · · · · · · · T . A= ⇒A = · · · · · · · · · · · · · · · · ... ... ... ... ... ... ... ... a1,m a2,m . . . an,m an,1 an,2 . . . an,m Wir werden die wichtige Relation C = AB ⇒ CT = BT AT benötigen, die sich wie folgt ergibt: ci,j = m X ai,k bk,j k=1 ⇒ c̃i,j = cj,i = m X k=1 aj,k bk,i = m X k=1 bk,i aj,k = m X b̃i,k ãk,j , k=1 wobei die mit einer Schlange bezeichneten Matrixelemente, diejenigen der transponierten Matrix sind. Eine Matrix mit der Eigenschaft A = AT bezeichnet man als symmetrische Matrix. Beispiele sind die Matrizen 1 3 −1 A = 3 17 π −1 π 0 38 Zwar kann 0 ein Eigenwert einer Matrix sein, jedoch niemals der Nullvektor ein Eigenvektor. Formal hat der Nullvektor immer die obige definierende Eigenschaft eines Eigenvektors, jedoch wäre der Eigenwert völlig unspezifisch da jede reelle Zahl µ, die Relation A~0 = µ~0 erfüllt. 96 KAPITEL 2. MATHEMATISCHE METHODEN und B= cos (ϕ) sin (θ) sin (θ) sin (ϕ) . Wir werden hier nur das Eigenwertproblem symmetrischer Matrizen betrachten. Der Trägheitstensor eines starren Körpers im dreidimensionalen Raum ist eine solche symmetrische 3 × 3-Matrix. Es ist wichtig zu erkennen, daß nur quadratische n × n-Matrizen symmetrisch sein können. Um später einfacher vorgehen zu können, wollen wir eine alternative Notation einführen und das Skalarprodunkt zweier Vektoren als Matrixmultiplikation eines transponierten Vektors und eines Vektors schreiben. Mit x1 . . ~x = x2 ⇒ ~xT = (x1 , x2 , x3 ) . x3 Damit können wir schreiben y1 . . ~x · ~y = x1 y1 + . . . x3 y3 = (x1 , x2 , x3 ) y2 = ~xT ~y . y3 Es gilt ebenfalls ~y = A~x . ⇒ ~y T = (A~x)T = (a1,1 x1 + a1,2 x2 + a1,3 x3 , . . . , a3,1 x1 + a3,2 x2 + a3,3 x3 ) a1,1 a2,1 a3,1 . = (x1 , x2 , x3 ) a1,2 a2,2 a3,2 = ~xT AT . a1,3 a2,3 a3,3 Wir betrachten nun das Eigenwertproblem einer symmetrischen Matrix AT = A. Seien ~vi 6= ~vj zwei normierte Eigenvektoren zu den Eigenwerten λi und λj (wir nehmen an, daß es zwei gibt). Damit gilt ~viT A~vj = ~viT λj ~vj = λj (~vi · ~vj ) . Die linke Seite dieser Gleichung ist aber auch gleich ~viT A~vj = (A~vi )T ~vj = (λi~vi )T ~vj = λi (~vi · ~vj ) . Aus diesen beiden Gleichungen folgt (λj − λi )(~vi · ~vj ) = 0 . Damit gibt es zwei Möglichkeiten: 1. Für λj 6= λi folgt daß ~vj und ~vi senkrecht aufeinander stehen. 2.14. DAS EIGENWERTPROBLEM 97 2. Für λj = λi = λ spannen ~vi und ~vj eine zweidimensionale Ebene E auf. Jeder Vektor ~x ∈ E läßt sich als ~x = a~vi + b~vj ; a, b ∈ R schreiben. Daraus ergibt sich sofort, daß auch ~x Eigenvektor zum Eigenwert λ ist, da A~x = A(a~vi + b~vj ) = aA~vi + bA~vj = λ(a~vi + b~vj ) = λ~x . Somit sind alle Vektoren in E Eigenvektoren und wir können zwei Vektoren auswählen, die senkrecht aufeinander stehen. Es bleibt noch die wichtige Frage zu beantworten, ob es überhaupt zu einer reellen, symmetrischen Matrix einen oder mehrere Eigenvektoren (und die dazugehörigen reellen Eigenwerte) gibt. Da wir in dieser Vorlesung bisher recht konsequent auf Existenzbeweise verzichtet haben (aus Zeitgründen und weil diese in der HöMa geliefert werden), wollen wir dieses auch in diesem Fall tun. Sie werden in den hier betrachteten Beispielen “konstruktiv” sehen, daß es immer n Eigenvektoren gibt. In der HöMa Vorlesung wird bewiesen, daß es zu einer reellen symmetrischen n × n-Matrix n Eigenvektoren (und dazugehörige reelle Eigenwerte) gibt. Für allgemeine (nicht-symmetrische Matrizen ist das nicht unbedingt der Fall. Aus 1. und 2. ergibt sich, daß die auf 1 normierten Eigenvektoren paarweise senkrecht aufeinander stehen. Also für i = 1, 2, . . . , n: |~vi | = 1; ~vi ⊥ ~vj für i 6= j. Damit ist {~v1 , ~v2 , . . . , ~vn } eine orthonormale Basis. Bei festgehaltenem Ursprung geht {~v1 , ~v2 , . . . , ~vn } durch eine Rotation aus {~e1 , ~e2 , . . . , ~en } hervor. Betrachten wir wieder den Spezialfall einer symmetrischen 3 × 3-Matrix A und die dazugehörige Matrix T v1,1 v1,2 v1,3 ~v1 S = v2,1 v2,2 v2,3 = ~v2T v3,1 v3,2 v3,3 ~v3T die aus den zueinander senkrechten, normierten Eigenvektoren von A gebildet ist. Es gilt v1,1 v2,1 v3,1 ST = v1,2 v2,2 v3,2 = (~v1 , ~v2 , ~v3 ) . v1,3 v2,3 v3,3 Nach unseren obigen Überlegungen und denen des letzten Kapitels beschreibt S eine Rotation und ist somit eine orthogonale Matrix mit ST = S−1 . Wir betrach- 98 KAPITEL 2. MATHEMATISCHE METHODEN ten nun39 SAST T ~v1T ~v1 = ~v2T A(~v1 , ~v2 , ~v3 ) = ~v2T (λ1~v1 , λ2~v2 , λ3~v3 ) ~v3T ~v3T λ1 ~v1 · ~v1 λ2 ~v1 · ~v2 λ3 ~v1 · ~v3 = λ1 ~v2 · ~v1 λ2 ~v2 · ~v2 λ3 ~v2 · ~v3 λ1 ~v3 · ~v1 λ2 ~v3 · ~v2 λ3 ~v3 · ~v3 λ1 0 0 = 0 λ2 0 . 0 0 λ3 Durch das Anwenden von S von links und ST von rechts, haben wir die Matrix A somit auf Diagonalform gebracht. Die Einträge auf der Diagonalen sind die Eigenwerte. Dies ist die Hauptachsentransformation. Wie sie in der Mechanik lernen werden ist es sehr vorteilhaft, z.B. den Trägheitstensor eines starren Körpers mit Hilfe der Hauptachsentransformation auf Diagonalform zu bringen. Dazu benötigen wir natürlich die Matrix S, d.h. die Eigenvektoren der symmetrischen Matrix A. Wir wollen daher als nächstes beschreiben, wie man die ~vi und λi bestimmt. Um einen Weg zur Bestimmung von ~vi und λi zu finden betrachten wir die Definitionsgleichung. ⇒ A~vi = λi~vi = λi 1~vi (A − λi 1)~vi = 0 . Die Frage die sich somit zur Bestimmung von λi stellt ist: Für welche λi gibt es eine nicht-triviale Lösung ~vi 6= 0 der Gleichung in der letzten Zeile?40 Wir haben also das Problem vorliegen: B~x = 0; unter welcher Bedingung an B gibt es Lösung mit ~x 6= 0. Wir führen Vektoren ~bi ein, so daß ~bT 1 B = ~bT2 , ~bT 3 woraus sich für die uns interessierende Gleichung ~b1 · ~x 0 ~ 0 B~x = b2 · ~x = ~b3 · ~x 0 ergibt. Die Frage ist also, ob es einen Vektor ~x 6= 0 gibt, der senkrecht auf allen drei Vektoren ~b1 , ~b2 und ~b3 steht. Es gibt im R3 solch einen Vektor falls die ~b1 , ~b2 39 40 Vergewissern sie sich, daß sie die hier verwendete Notation wirklich verstehen! Zur Erinnerung: Der Nullvektor kann nicht Eigenvektor sein. 99 2.14. DAS EIGENWERTPROBLEM und ~b3 in einer Ebene liegen (d.h. koplanar sind). Also gibt es eine nicht-triviale Lösung wenn das durch die drei Vektoren ~bi aufgespannte dreidimensionale Volumen, d.h. das Spatprodukt der drei Vektoren ~bi , verschwindet:41 V (~b1 , ~b2 , ~b3 ) = (~b1 × ~b2 ) · ~b3 = 0 . In diesem Kontext nennt man V (~b1 , ~b2 , ~b3 ) die Determinante der 3 × 3-Matrix B, die man mit det B bezeichnet. Die Determinante berechnet sich dann wie folgt: b1,2 b2,3 − b1,3 b2,2 b3,1 det B = (~b1 × ~b2 ) · ~b3 = b1,3 b2,1 − b1,1 b2,3 · b3,2 b1,1 b2,2 − b1,2 b2,1 b3,3 = b1,2 b2,3 b3,1 − b1,3 b2,2 b3,1 + b1,3 b2,1 b3,2 −b1,1 b2,3 b3,2 + b1,1 b2,2 b3,3 − b1,2 b2,1 b3,3 . Es gibt für diesen etwas unübersichtlichen Ausdruck eine einfache Merkregel, die in der Vorlesung angegeben wird. Eine völlig analoge Argumentation kann für 2 × 2-Matrizen geführt werden. Die Determinante einer 2 × 2-Matrix ist das durch die Vektoren ~b1 und ~b2 aufgespannte zweidimensionale Volumen (also die Fläche), die sich gemäß V (~b1 , ~b2 ) = |~b1 ||~b2 | sin (ϕ) , mit dem von ~b1 und ~b2 eingeschlossenen Winkel ϕ, berechnet. Mit Hilfe der folgenden Skizze können wir diesen Ausdruck umformulieren, so daß sich die Determinante aus den Matrixelementen ergibt. e2 b2 ϕ θ b1 ψ e1 Es gilt det B = V (~b1 , ~b2 ) = |~b1 ||~b2 | sin (θ − ψ) = |~b1 ||~b2 | [sin (θ) cos (ψ) − cos (θ) sin (ψ)] = b1,1 b2,2 − b1,2 b2,1 . 41 Eine zweidimensionale Ebene im dreidimensionalen Raum hat Volumen 0. 100 KAPITEL 2. MATHEMATISCHE METHODEN Wie man die Determinante für eine allgemeine n × n-Matrix definiert werden sie in der Vorlesung HöMa I kennen lernen. Bezüglich der Bestimmung der Eigenwerte zu einer gegebenen Matrix A stellt sich also die Frage, für welche λ det (A − λ1) = 0 gilt. Nach den obigen Regeln zur Bestimmung der Determinanten von 2 × 2und 3 × 3-Matrizen ist klar, daß es sich bei der linke Seite dieser Gleichung um ein Polynom zweiten bzw. dritten Grades in λ handelt. Man nennt es auch das charakteristische Polynom. Die Eigenwerte sind somit die Nullstellen des charakteristischen Polynoms. Betrachten wir nun abschließend ein Beispiel was auch zeigt, wie man bei bekanntem Eigenwert einen Eigenvektor bestimmt. Weitere Beispiele werden sie in den Übungen rechnen. Wir betrachten die symmetrische 2 × 2-Matrix 1 −1 . A= −1 3 Das charakteristische Polynom ergibt sich zu 1 − λ −1 = (1 − λ)(3 − λ) − 1 = λ2 − 4λ + 2 , det (A − λ1) = det −1 3 − λ mit den Nullstellen λ1/2 = 2 ± √ 2. Die Matrix A hat somit die Eigenwerte λ1/2 = 2 ± ergibt sich als der Vektor, der die Gleichung √ 2. Der Eigenvektor ~v1 zu λ1 (A − λ1 1) ~v1 = 0 ⇒ 1−2− −1 √ 2 −1 √ 3−2− 2 v1,1 v1,2 = 0 0 erfüllt. Die erste Komponente dieser Gleichung liefert √ (−1 − 2)v1,1 − v1,2 = 0 √ ⇒ v1,2 = −(1 + 2)v1,1 . Die sich aus der zweiten Komponente ergebende Gleichung liefert die gleiche Bedingung, was man daran sieht, daß sie mit der ersten Gleichung konsistent ist √ √ √ −v1,1 + (1 − 2)v1,2 = −v1,1 − (1 − 2)(1 + 2)v1,1 = −v1,1 + v1,1 = 0 . 2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN 101 Also folgt für den Eigenvektor zum Eigenwert λ1 , daß er die Form ~v1 = x√ −(1 + 2)x , mit x ∈ R hat. Das x bestimmen wir nun so, daß ~v1 auf 1 normiert ist |~v1 | = und damit q x2 + (1 + √ x= p q √ 2)2 x2 = |x| 4 + 2 2 1 √ , 4+2 2 wobei wir uns für das positive x entschieden haben. In den Übungen werden sie dieses Beispiel vervollständigen, d.h. ~v2 berechnen und explizit zeigen, daß die bestimmten λi und ~vi , mit i = 1, 2, die Definitionsgleichung für Eigenwerte und Eigenvektoren erfüllen. 2.15 Systeme linearer Differentialgleichungen Wir werden jetzt noch einmal auf Differentialgleichungen zurückkommen. Genauer wollen wir Systeme linearer, gekoppelter Differentialgleichungen betrachten, die in der Mechanik eine wichtige Rolle spielen und zusätzlich ein wichtiges Hilfsmittel zur Lösung von Gleichungen höherer Ordnung darstellen. Als erstes Beispiel betrachten wir das in der folgenden Abbildung dargestellte mechanische Problem. m m x1 x2 Zwei Körper gleicher Masse m sind über Hooksche Federn gleicher Federkonstante k ≥ 0 mit den Wänden verbunden und eine weitere Hooksche Feder mit Konstanten K ≥ 0 miteinander gekoppelt. Wir nehmen an, daß sich die Massen reibungsfrei auf einem Tisch (dieser “liefert” die Gegenkraft zur Gravitationskraft) bewegen können. Die Auslenkung aus der Ruhelage ist durch x1 und x2 bezeichnet und sei hinreichend klein, so daß die Massen während der Bewegung nicht direkt aneinander stoßen. Die Gravitationskraft zwischen den beiden Massen (und mit den Wänden) kann man verglichen mit den über die Federn 102 KAPITEL 2. MATHEMATISCHE METHODEN vermittelten Kräfte vernachlässigen Die Newtonschen Bewegungsgleichungen für die xj ergeben sich dann zu d2 k+K K x1 (t) = − x1 (t) + x2 (t) 2 dt m m 2 K k+K d x2 (t) = x1 (t) − x2 (t) 2 dt m m bzw. in Matrixschreibweise k+K K d2 − m x1 (t) x (t) 1 m = K k+K x2 (t) − dt2 x2 (t) m m und bilden ein System linearer, gekoppelter Differentialgleichungen zweiter Ordnung. Die Matrix auf der rechten Seite ist symmetrisch. Die Anfangsbedingungen sind durch x1 (t = 0) = x01 , ẋ1 (t = 0) = v10 , x2 (t = 0) = x02 , und ẋ2 (t = 0) = v20 gegeben. Es ist physikalisch plausibel, daß es diese vier Anfangsbedingungen gibt. Das gekoppelte Differentialgleichungssystem ist linear und hat konstante Koeffizienten, d.h. die Einträge der Matrix hängen nicht von der Zeit t ab. Für den Fall K = 0 wird die obige Matrix diagonal und das System zerfällt in zwei identische ungekoppelte Gleichungen (j = 1, 2) k d2 xj (t) = − xj (t) 2 dt m mit der formalen Lösung (aj = Aj exp (−iδj ) sind komplexe Konstanten, wobei Aj , δj ∈ R) p xj (t) = aj eiωt , ω = k/m , wobei wir komplexe Zahlen verwendet haben und die Anfangsbedingungen noch nicht eingebaut sind. Die physikalische Lösung bestimmen wir später durch Bilden des Realteils. Als Ansatz zur Lösung der gekoppelten Gleichungen wählen wir nun xj (t) = x̄j exp (iλt). Einsetzten dieses Ansatz in die obige Matrixgleichung und Kürzen des Exponentialfaktors liefert die Eigenwertgleichung k+K K x̄ − m x̄1 1 2 m . = −λ K x̄2 x̄2 − k+K m m Die Nullstellen des charakteristischen Polynoms (in λ2 ) 2 2 k+K K 2 2 P (λ ) = λ − − m m sind λ21 = k + 2K k , λ22 = m m 2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN und die normierten Eigenvektoren ! (1) 1 1 x̄1 , =√ (1) x̄2 2 1 (2) x̄1 (2) x̄2 ! 1 =√ 2 1 −1 103 . Man nennt die positive Wurzel der beiden Eigenwerte λ2j , also r r k k + 2K λ1 = , λ2 = m m die Normalfrequenzen der gekoppelten Bewegung. Die Eigenvektoren legen die zugehörigen Eigenmoden fest. Betrachten wir zunächst λ1 . In diesem Fall löst x1 (t) 1 = A cos (λ1 t − δ) x2 (t) 1 die Bewegungsgleichung. Beide Massen oszillieren in dieser Eigenmode in Phase und haben die selbe maximale Auslenkung. Die mittlere Feder mit Federkonstanter K wird nie komprimiert oder gedehnt, was erklärt, daß K in der Frequenz der p Bewegung keine Rolle spielt (λ1 = k/m wie für eine einzelne Masse). Um eine Bewegung in dieser Eigenmode anzuregen, muß man selbstverständlich Anfangsbedingungen wählen, die mit ihr kompatibel sind. Die Bewegung in der zweiten Eigenmode ist durch x1 (t) 1 A cos (λ2 t − δ) = A cos (λ2 t − δ) = x2 (t) −1 A cos (λ2 t − δ + π) beschrieben. In diesem Fall bewegen sich die Massen mit einer relativen Phasenverschiebung um π. Um das System in dieser Mode anzuregen, müssen die Anfangsbedingungen erneut kompatibel mit ihr sein. Wir sehen also, daß die Bewegung beider gekoppelter Massen in den Eigenmoden rein sinusförmig mit Frequenz λj ist. Dies zeichnet die Eigenmoden gegenüber der allgemeinen Lösung aus, die durch eine Überlagerung der beiden Normalfrequenzen charakterisiert ist. Sie ist durch x1 (t) 1 1 = A1 cos (λ1 t − δ1 ) + A2 cos (λ2 t − δ2 ) x2 (t) 1 −1 gegeben. Die vier reellen Konstanten Aj und δj müssen dann noch so angepasst werden, daß die vier Anfangsbedingungen erfüllt werden. Die resultierende Bewegung ist recht kompliziert und im Allgemeinen nicht einmal periodisch. Den Fall schwacher Kopplung der beiden Massen, also K k werden sie in einer Übungsaufgabe diskutieren. Die obigen Konzepte (Ansatz, Eigenwertproblem, Eigenmoden) spielen auch in komplizierteren Situationen innerhalb der Mechanik eine wichtige Rolle, so daß das Beispiel uns bereits wichtige Informationen für komplexere Probleme liefert. 104 KAPITEL 2. MATHEMATISCHE METHODEN In unserem zweiten Beispiel tritt ein System gekoppelter Differentialgleichungen erster Ordnung als Rechentrick bei der Lösung einer Gleichung höherer Ordnung auf. Wir betrachten das obige mechanische Beispiel (Masse auf Tisch, welcher die Gravitationskraft kompensiert), diesmal jedoch mit nur einer Masse m und einer Feder mit Federkonstanten k. Zusätzlich berücksichigten wir jetzt die Reibungskraft. Wir nehmen dabei an, daß diese die Form Freib = −bẋ, mit b ≥ 0 hat, also proportional zur Geschwindigkeit ist, aber in die der Geschwindigkeit entgegen gesetzte Richtung zeigt. Für das konkret vorliegende Problem mag das eine mehr oder weniger gut gerechtfertigte Annahme sein, die uns jedoch eine gute Einstiegsmöglichkeit zum Verständnis der möglichen Typen (je nach Wahl der Parameter) von Bewegung ermöglicht. Die Newtonsche Gleichung ist dann mẍ(t) = −kx(t) − bẋ(t) b k ⇒ ẍ(t) + x(t) + ẋ(t) = 0 . m m In dem wir v(t) = ẋ(t) verwenden, schreiben wir diese Gleichung in zwei um ẋ(t) 0 1 x(t) = , v̇(t) −ω02 −2γ v(t) wobei wir ω02 = k/m (Frequenz der Bewegung für b = 0) und 2γ = b/m eingeführt haben. Die Anfangswerte sind x(t = 0) = x0 und v(t = 0) = v0 . Aus einer Gleichung zweiter Ordnung haben wir somit ein System von gekoppelten Gleichungen erster Ordnung gemacht. Dieses lösen wir nun ähnlich zum obigen Beispiel. Wir setzten an (λ kann dabei eine komplexe Zahl sein) x̄ x(t) λt . =e v̄ v(t) Eingesetzt liefert das λ x̄ v̄ = 0 1 2 −ω0 −2γ x̄ v̄ , also erneut eine Eigenwertgleichung, aber diesmal für eine nicht-symmetrische Matrix. Die Eigenwerte des charakteristischen Polynoms sind (da die reelle Matrix nicht symmetrisch ist, ist nicht garantiert, daß die Eigenwerte reell sind) q λ± = −γ ± i ω02 − γ 2 . Die Lösungen mit den beiden Eigenwerten sind unabhängig und für die allgemeine Lösung müssen wir x(t) = a+ eλ+ t + a− eλ− t 2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN 105 ansetzten. Die a± sind so zu bestimmen, daß die Anfangsbedingungen gelten. Die physikalische Lösung muß natürlich wieder reell sein. Wir wollen nun vier Spezialfälle der allgemeinen Lösung diskutieren. (i) Die ungedämfte Bewegung mit γ = 0. Dieser sind wir natürlich bereits mehrfach begegnet. Für γ = 0 gilt λ± = ±iω0 und damit x(t) = x0 cos (ω0 t) + v0 sin (ω0 t) . ω0 Die Bewegung ist also rein oszillatorisch mit Frequenz ω0 . γ/ω0=0 x/x0 1 0 -1 0 5 10 ω0t 15 20 (ii) Die schwach gedämpfte Bewegung mit 0 < γ ω0 . Dann ergibt sich s q γ2 λ± = −γ ± i ω02 − γ 2 = −γ ± iω0 1 − 2 (2.49) ω0 4 γ γ2 , = −γ ± iω0 1 − 2 + O 2ω0 ω04 wobei wir die Taylorentwicklung verwendet haben. In niedrigster Ordnung in der kleinen Größe γ/ω0 gilt also λ± ≈ ±iω0 − γ. Damit ergibt sich für die Bewegung unter Berücksichtigung der Anfangsbedingungen x(t) = x0 e−γt cos (ω0 t) + v0 + γx0 −γt e sin (ω0 t) . ω0 Wir finden somit eine exponentiell gedämpfte, oszillatorische (mit Frequenz ω0 ) Bewegung. 106 KAPITEL 2. MATHEMATISCHE METHODEN γ/ω0=0.1 x/x0 1 0 -1 0 5 10 ω0t 15 20 (iii) Kritischer Grenzfall mit γ = ω0 . Dann ergibt sich λ± = −γ , d.h. der Eigenwert ist zweifach entartet und man findet zunächst nur eine Lösung der Differentialgleichung. Eine zweite ist durch t exp (−γt) gegeben, so daß die Lösung unter Berücksichtigung der Anfangsbedingungen x(t) = x0 e−γt + (v0 + γx0 ) t e−γt lautet. Die Bewegung ist somit exponentiell gedämpft. γ/ω0=1 1 x/x0 0.8 0.6 0.4 0.2 0 0 5 ω0t 10 (iv) Stark gedämpfter Fall mit γ ω0 . Die Talorentwicklung der Eigenwerte 2.15. SYSTEME LINEARER DIFFERENTIALGLEICHUNGEN 107 gibt in diesem Fall λ± q = −γ ± i ω02 − γ 2 = −γ ± γ s 1− ω02 γ2 4 ω0 ω02 = −γ ± γ 1 − 2 + O 2γ γ4 und damit in führender Ordnung λ+ ≈ − ω02 , 2γ λ− ≈ −2γ . Aufgrund der obigen Annahme gilt λ+ /λ− 1. Die Lösung der Differentialgleichung unter Berücksichtigung der Anfangsbedingungen ist in diesem Limes ω2 v0 v0 −2γt − 2γ0 t e e . x(t) = x0 + − 2γ 2γ Der erste exponentiell abfallende Term bestimmt dabei das Langzeitverhalten, während der zweite für das Kurzeitverhalten verantwortlich ist. γ/ω0=5 x/x0 1 0.5 0 0 50 γt 100 Ein sehr interessantes mechanisches System in dem das obige Konzept der Abbildung einer Differentialgleichung höherer Ordnung auf ein System erster Ordnung und die gerade gewonnenen Ergebnisse eine wichtige Rolle spielen ist die getriebene, gedämpfte Oszillation. Diese werden sie in einer Übungsaufgabe diskutieren. Hier wollen wir es bei den beiden hoffentlich instruktiven Beispielen zu Systemen gekoppelter Differentialgleichungen belassen. 108 2.16 KAPITEL 2. MATHEMATISCHE METHODEN Die Integration im Rn Wir hatten bereits diskutiert, daß die Integration Z b f~(x) dx a einer vektorwertigen Funktion von einer Variablen, als Integration der einzelnen Komponenten von f~(x) zu verstehen ist und somit kein neues Konzept darstellt. Anders ist es, wenn man eine skalare oder vektorwertige Funktion von n Variablen integriert. Für diesen Fall gibt es verschiedene physikalisch interessante Integraltypen. Als physikalische Motivation des ersten Integraltyps, des Kurvenintegrals, betrachten wir die Arbeit die verrichtet wird, wenn man eine Masse entlang eines Pfades ~r(t) in einem Kraftfeld F~ (~r) bewegt. Aus der Schule kennen sie sicherlich die Definition Arbeit = Kraft · Weg , also W = F~ · ~r . Diese ist jedoch nur dann richtig, wenn die Kraft entlang des Weges konstant ist, was im Allgemeinen sicherlich nicht der Fall ist. Der Ausdruck ist daher allgemeiner zu ersetzen durch Z W = F~ (~r) · d~r , C wobei wir nun genauer erklären müssen, was wir mit den auftretende Symbolen meinen. Zunächst bezeichnet C die Bahnkurve, also die durch die Vektoren ~r(t) beschriebenen Punkte im R3 mit dem Parameter (der Zeit) t zwischen einem(r) Anfangs- und Endwert(zeit), entlang derer die Masse bewegt wird. Das Integralsymbol definieren wir (wie im “gewöhnlichen” Fall) als Limes von RiemannSummen. Dazu unterteilen wir die Kurve in N +1 Punkte ~ra = ~r0 , ~r1 . . . . , ~rN = ~re , mit den Anfangs- und Endpunkten ~ra und ~re . Liefert dann der Ausdruck N X j=1 F~ (~rj ) · ∆~rj , ∆~rj = ~rj − ~rj−1 für jede beliebige Zerlegung mit ∆~r → 0 für N → ∞ das gleiche Ergebnis, so definiert dieser Limes das Kurvenintegral lim N →∞ N X j=1 F~ (~rj ) · ∆~rj = Z C F~ (~r) · d~r . 2.16. DIE INTEGRATION IM RN 109 Aus der Definition über eine Riemann-Summe wird klar, daß es sich beim Kurvenintegral um ein Skalar handelt. Die Definition kann in beliebigen Raumdimensionen n = 2, 3, . . . verwendet werden. Ein besonderes Symbol führt man für den auch in der Physik wichtigen Fall ein, daß die Anfangs- und Endpunkte der Kurve aufeinander fallen, also ~ra = ~re gilt. In diesem Fall schreibt man I F~ (~r) · d~r . C Aus der Definition des Kurvenintegrals folgt sofort die Eigenschaft Z Z F~ (~r) · d~r = − F~ (~r) · d~r , C (2.50) −C wobei −C die in umgekehrter Richtung durchlaufene Kurve bezeichnet. Um das Kurvenintegral explizit zu berechnen führen wir es auf ein gewöhnliches Riemann-Integral zurück. Ist die Parametrisierung der Kurve ~r(t) explizit bekannt, so gehört zu jedem ~rj eine “Zeit” tj mit ~r(tj ) = ~rj und wir können jeden Summanden der Riemann-Summe wie folgt umschreiben ~r(tj ) − ~r(tj−1 ) F~ (~r(tj )) · ∆~r(tj ) = F~ (~r(tj )) · (tj − tj−1 ) . tj − tj−1 Im Limes N → ∞ erhalten wird dann42 Z Z te h i ˙ ~ F~ (~r(t)) ·~r(t) dt . F (~r) · d~r = C ta Die rechte Seite dieser Gleichung ist ein “gewöhnliches” Integral über t von der Anfangszeit ta mit ~ra = ~r(ta ) bis zur Endzeit te mit ~re = ~r(te ). Der Integrand ist ˙ das t-abhängige Skalar F~ (~r(t)) ·~r(t). Ist keine Parameterdarstellung der Kurve bekannt, so kann man wie folgt vorgehen.43 Wir schreiben ∆~rj = ∆x1,j ~e1 + ∆x2,j ~e2 + ∆x3,j ~e3 und erhalten in der Riemann-Summe N X [F1 (~rj )∆x1,j + F2 (~rj )∆x2,j + F3 (~rj )∆x3,j ] . j=1 Zu einem festen x1 gehört (lokal) entlang von C ein bestimmtes x2 und x3 , so daß wir x2 und x3 als Funktion von x1 auffassen können. Damit reduziert sich der ˙ Wir gehen stillschweigend davon aus, daß ~r(t) existiert, was in physikalischen Situationen sicherlich sehr plausibel ist. 43 Wir konzentrieren uns hier auf den Fall dreier Raumdimensionen. Die Erweiterung auf andere n ist offensichtlich. 42 110 KAPITEL 2. MATHEMATISCHE METHODEN erste Summand der Riemann-Summe im Limes N → ∞ auf ein “gewöhliches” Integral lim N →∞ N X F1 (~rj )∆x1,j = Z x1,e F1 (x1 , x2 (x1 ), x3 (x1 )) dx1 . x1,a j=1 Analog kann man mit den anderen Summanden verfahren und erhält den Ausdruck Z Z x1,e ~ F1 (x1 , x2 (x1 ), x3 (x1 )) dx1 F (~r) · d~r = C x1,a Z x2,e + F2 (x1 (x2 ), x2 , x3 (x2 )) dx2 x2,a Z x3,e + F3 (x1 (x3 ), x2 (x3 ), x3 ) dx3 . (2.51) x3,a Als Beispiel der Integration eines Feldes entlang einer Kurve betrachten wir das Vektorfeld F~ (~r) = (3x21 + 2x2 )~e1 − 9x2 x3~e2 + 8x1 x23~e3 . Der Anfangspunkt der betrachteten Wege soll im Koordinatenusrprung liegen und der Endpunkt bei x1 = x2 = x3 = 1. Wir betrachten die zwei Wege C1 mit Parameterdarstellung ~r(t) = t~e1 + t~e2 + t~e3 , 0 ≤ t ≤ 1, also eine Gerade, sowie C2 mit Parameterdarstellung ~r(t) = t~e1 + t2~e2 + t4~e3 , 0 ≤ t ≤ 1. Dieser Weg stellt auf die x1 -x2 - sowie x2 -x3 -Ebene projeziert eine Parabel da und ist projeziert auf die 4 x R 1 -x3 -Ebene eine “Parabel vierter Ordnung” x3 = x1 . Wir bestimmen zunächst F~ (~r) · d~r mit Hilfe der Parameterdarstellung. Es gilt C1 d~r F~ (~r) · = (3t2 + 2t)1 + (−9tt)1 + (8tt2 )1 = 8t3 − 6t2 + 2t . dt Damit folgt Z 1 Z 1 ~ F (~r) · d~r = (8t3 − 6t2 + 2t)dt = 2t4 − 2t3 + t2 0 = 1 . C1 0 Dasselbe Integral wollen wir nun berechnen indem wir so tun, als wenn wir keine Parametrisierung des Weges kennen würden. Wir können dann Gl. (2.51) verwenden Z Z 1 Z 1 2 F~ (~r) · d~r = 3x1 + 2x2 (x1 ) dx1 − 9 x2 x3 (x2 ) dx2 C1 0 0 Z 1 +8 x1 (x3 )x23 dx3 . 0 2.16. DIE INTEGRATION IM RN 111 Auf C1 gilt x2 (x1 ) = x1 , x3 (x2 ) = x2 und x1 (x3 ) = x3 , so daß sich dieser Ausdruck zu Z 1 Z Z 1 Z 1 2 2 ~ F (~r) · d~r = 3x1 + 2x1 dx1 − 9 x2 dx2 + 8 x33 dx3 0 C1 0 0 vereinfacht, woraus sich erneut Z F~ (~r) · d~r = 2 − 3 + 2 = 1 C1 ergibt. Wir betrachten nun das Integral terdarstellung von C2 . Mit dieser gilt R C2 F~ (~r) · d~r und verwenden die Parame- d~r F~ (~r) · = (3t2 + 2t2 )~e1 − 9t2 t4~e2 + 8tt8~e3 · ~e1 + 2t~e2 + 4t3~e3 dt = 5t2 − 18t7 + 32t12 . Damit folgt Z C1 F~ (~r) · d~r = Z 1 0 (5t2 − 18t7 + 32t12 )dt 5 18 32 293 = − + = . 3 8 13 156 Wie wir im Beispiel gesehen haben hängen Kurvenintegrale über Vektorfelder im Allgemeinen sowohl vom Vektorfeld wie auch von den Details des Weges C ab. Es gibt jedoch auch die physikalisch wichtigen Situationen, in denen das Integral nicht von dem kompletten Weg, sondern nur vom Anfangs- und Endpunkt abhängt. Das obige Beispiel der Arbeit liefert diverse “Alltags”-Beispiele dafür, daß Kurvenintegrale in der Tat nur vom Anfangs- und Endpunkt abhängen können und nicht davon, wie man von ~ra nach ~re gekommen ist. Diese Eigenschaft des Integrals ist auf eine Eigenschaft des im Integranden auftretenden Feldes zurück zu führen. Nehmen wir an, daß solch ein Fall vorliegt und betrachten die Funktion Z ~r F~ (~r0) · d~r0 , (2.52) φ(~r) = ~ ra wobei wir an das Integral jetzt nur noch die Grenzen zu schreiben brauchen und nicht mehr den ganzen Weg spezifizieren müssen. Bilden wir nun φ(~r +∆~r)−φ(~r), so gilt φ(~r + ∆~r) − φ(~r) = Z ~ r ~ r+∆~ r F~ (~r0 ) · d~r0 . 112 KAPITEL 2. MATHEMATISCHE METHODEN Dabei haben wir ausgenutzt, daß sollte ~r nicht bereits auf dem Weg C2 von ~ra nach ~r + ∆~r liegen, wir diesen Weg so deformieren können (ohne das Ergebnis der Integration zu verändern), daß dieses der Fall ist. Da das Vektorfeld F~ (~r) beliebig “harmlos” angenommen werden kann, gibt es nach dem oben anschaulich “bewiesenen” Mittelwertsatz ein ~r00 mit der Eigenschaft φ(~r + ∆~r) − φ(~r) = F~ (~r00 ) · ∆~r . Im Limes |∆~r| → 0 (∆~r kann in beliebige Richtung gegen den Nullvektor gehen) folgt so das wichtige Ergebnis ~ r) = F~ (~r) , grad φ(~r) = ∇φ(~ d.h. ein Vektorfeld F~ mit der Eigenschaft, daß Kurvenintegrale über F~ nur vom Anfangs- und Endpunkt abhängen, kann (wenn alle beteiligten Funktionen beliebig “harmlos” angenommen werden) als der Gradient einer skalaren Funktion geschrieben werden. Diese ist über Gl. (2.52) bis auf eine additive Konstante eindeutig durch F~ festgelegt. Die Wahl der Konstanten entspricht der Wahl des Anfangspunktes ~ra in dieser Gleichung. Für den Fall des Kraftfeldes heißt das, daß die Kraft (unter der obigen Bedingung an die Arbeit) als Gradient eines Potentials geschrieben werden kann. Die Darstellbarkeit von F~ als Gradientenfeld ist also notwendig, wenn das Kurvenintegral nur von ~ra und ~re und nicht den Details des Weges abhängt. Um zu zeigen, daß diese Bedingung auch hinreichend ~ Dann gilt ist, nehmen wir an, daß F~ ein Gradientenfeld ist F~ = ∇φ. Z Z ~ r) · d~r F~ (~r) · d~r = ∇φ(~ C C Z te d~ r (t) ~ r(t)) · dt ∇φ(~ = dt ta Z te dφ(~r(t)) = dt dt ta = φ(~r(te )) − φ(~r(ta )) und das Integral hängt nur von ta und te nicht aber den Details des Wegs ab. Dabei haben wir von der zweiten in die dritte Zeile die Kettenregel angewandt dφ(~r(t)) ∂φ dx1 ∂φ dx2 ∂φ dx3 = + + dt ∂x1 dt ∂x2 dt ∂x3 dt und im Schritt zur letzten Zeile den Hauptsatz der Differential- und Integralrechnung. Zusammengefasst gilt somit, daß ein Kurvenintegral über das Vektorfeld F~ (~r) dann und nur dann nur vom Anfangs- und Endpunkt abhängt, wenn es als Gradient einer skalaren Funktion φ(~r) (eines Potentials) zu schreiben ist. 2.16. DIE INTEGRATION IM RN 113 Als Konzequenz folgt sofort, daß falls F~ als Gradientenfeld zu schreiben ist I C F~ (~r) · d~r = 0 . (2.53) Dies sieht man leicht, wenn man das Integral über C in zwei Kurvenintegrale C1 und C2 von ~ra zu einem willkürlichen Zwischenpunkt ~rz auf C und von ~rz zurück zu ~ra aufteilt. Ohne das Ergebnis des zweiten Integrals zu ändern, kann man C2 dann so deformieren, daß der neue Weg gleich −C1 ist, also gleich C1 aber in entgegengesetzter Richtung durchlaufen. Mit Gl. (2.50) folgt dann das obige Ergebnis Gl. (2.53).44 Man kann nun ein leicht zu überprüfendes Kriterium angeben, wann sich ein Vektorfeld F~ (~r) als Gradientenfeld schreiben läßt und damit Kurvenintegrale über F~ nur von ~ra und ~re abhängen. Wie sie in einer Übungsaufgabe zeigen werden (siehe auch Kapitel 2.12), gilt ~ × [∇φ(~ ~ r)] = 0 , rot [grad φ(~r)] = ∇ d.h. die Rotation eines Gradientenfeldes verschwindet, wobei wir natürlich davon ausgehen, daß φ(~r) zweimal stetig differenzierbar ist. Hat also eine Vektorfeld F~ ~ schreibbar Kurvenintegrale, die nur von ~ra und ~re abhängen, ist es als F~ = ∇φ ~ × F~ = 0. Diese Beobachtung ist nun bis auf eine (wichtige) Feinheit und es gilt ∇ fast hinreichend, was bedeutet, daß (bis auf die noch zu betrachtende Feinheit) Kurvenintegrale über F~ genau dann nur von ~ra und ~re abhängen (und nicht vom ~ × F~ = 0 gilt. Um das plausibel zu machen, versuchen ganzen Weg C), wenn ∇ ~ × F~ = 0 ein “Potential” φ zu konstruieren mit wir unter der Voraussetzung ∇ ~ = F~ was dann die “Unabhängigkeit vom Weg” garantiert. Wir betrachten ∇φ den Ausdruck, φ(~r) = Z ~ r ~ ra ,C0 F~ (~r0 ) · d~r0 , wobei wir entlang des speziellen Weges C0 : x1,a x1 x1 x1 ~ra = x2,a → x2,a → x2 → x2 = ~r x3,a x3,a x3,a x3 fortschreiten. Da für den Weg selbst keine Präferenz bestehen sollte, können wir 44 Gl. (2.53) liefert in der Tat eine äquivalente Formulierung des “Satzes” über die Darstellbarkeit als Gradientenfeld. 114 KAPITEL 2. MATHEMATISCHE METHODEN diesen “bequemen” Weg wählen. Damit gilt Z ~r φ(~r) = F~ (~r0 ) · d~r0 Z~rax,C1 0 Z x2 0 0 = F1 (x1 , x2,a , x3,a ) dx1 + F2 (x1 , x02 , x3,a ) dx02 x1,a x2,a Z x3 + F3 (x1 , x2 , x03 ) dx03 . x3,a ~ = F~ gilt. Wir betrachten Wir müssen nun durch Ableiten überprüfen, ob ∇φ zunächst ∂φ(x1 , x2 , x3 ) = F3 (x1 , x2 , x3 ) , ∂x3 was nach dem Hauptsatz der Differential- und Integralrechnung folgt. Als nächstes differenzieren wir nach x2 Z x3 ∂φ(x1 , x2 , x3 ) ∂F3 (x1 , x2 , x03 ) 0 = F2 (x1 , x2 , x3,a ) + dx3 , ∂x2 ∂x2 x3,a wobei wir die Reihenfolge der mit der Differenziation und der Integration zusammenhängenden Grenzprozesse wieder ohne weitere Analyse vertauschen. Jetzt ~ × F~ = 0 nach der nutzen wir die Voraussetzung ∇ ∂F2 (x1 , x2 , x03 ) ∂F3 (x1 , x2 , x03 ) = . ∂x2 ∂x03 Eingesetzt liefert das Z x3 ∂F2 (x1 , x2 , x03 ) 0 ∂φ(x1 , x2 , x3 ) dx3 = F2 (x1 , x2 , x3,a ) + ∂x2 ∂x03 x3,a = F2 (x1 , x2 , x3,a ) + F2 (x1 , x2 , x3 ) − F2 (x1 , x2 , x3,a ) = F2 (x1 , x2 , x3 ) . Analog berechnet man ∂φ(x1 , x2 , x3 ) = F1 (x1 , x2 , x3 ) ∂x1 und damit ~ r) = F~ (~r) . ∇φ(~ ~ × F~ = 0 als hinreichende Bedingung für die DarDamit scheint alles klar und ∇ ~ stellbarkeit von F als Gradientenfeld etabliert. Dies ist aber nicht vollständig 2.16. DIE INTEGRATION IM RN 115 richtig! Wir haben bei den obigen Überlegungen nicht berücksichtigt, daß der Definitionsbereich des Vektorfeld F~ , der eine Teilmenge (ein “Teilgebiet”) G des R3 ist, “ungewöhnliche” Eigenschaften haben könnte. Nur in dem Fall, daß G einfach zusammenhängend ist, d.h. das sich jede geschlossene Kurve in G auf einen Punkt (in G) zusammenziehen läßt, ist die obige Konstruktion eindeutig. Mehr zu diesem Aspekt werden sie in der HöMa Vorlesung lernen. Der “Satz” lautet zusammengefasst: Wenn für ein Vektorfeld F~ in einem einfach zusammenhängen~ × F~ = 0 gilt, so gibt es ein φ mit F~ = ∇φ. ~ Damit sind dann den Gebiet G, ∇ die Kurvenintegrale über F~ vom “Weg unabhängig”. Umgekehrt gilt bei “Wegu~ × F~ = 0, was unabhängig von nabhängigkeit” des Kurvenintegrals über F~ , daß ∇ den “Zusammenhangsverhältnissen” von G ist. Nach diesen Überlegungen zum Kurvenintegral, wollen wir uns mit der Integration über mehrdimensionale Gebiete beschäftigen. Diese ist z.B. wichtig bei der Berechnung von Flächeninhalten und Volumina. Wir werden dabei die Variablensubstitution (Variablentransformation) im Höherdimensionalen kennenlernen (Polarkoordinaten, Kugelkoordinaten usw.). Wir betrachten als Beispiel die Funktion f (x, y) von zwei Variablen. Diese soll über das Gebiet G ⊂ R2 (x-y-Ebene) integriert werden ZZ f (x, y) dx dy . G Unter Voraussetzung dessen, was wir über das Integral von einer Veränderlichen gelernt haben, besteht die Schwierigkeit darin, daß die Integrationsgrenzen Funktionen in der x-y-Ebene sind. Sei G von der in der folgenden Skizze angenommenen Form und f (x, y) beliebig “harmlos”. y y=g2(x) y=g1(x) a b x Die zweidimensionale Integration definieren wir nun so, daß wir sie in zwei eindimensionale (die wir bereits kennen) zerlegen. Wir integrieren f (x, y) zunächst über y, wobei die Integrationsgrenzen Funktionen von x sind Z g2 (x) ˜ f (x) = f (x, y) dy . g1 (x) Anschaulich gesprochen integrieren wir f (x, y) entlang der in der Skizze gestrichelt gezeichneten Linien. Das Resultat dieser eindimensionalen Integration, wel- 116 KAPITEL 2. MATHEMATISCHE METHODEN che vom “Parameter” x abhängt, integrieren wir dann über x Z a f˜(x) dx = b Z a b Z g2 (x) f (x, y) dy dx = g1 (x) ZZ f (x, y) dx dy . G Alternativ hätten wir zunächst über x und dann über y integrieren können Z c d Z h2 (y) f (x, y) dx dy = h1 (y) ZZ f (x, y) dx dy , G was in der folgenden Skizze veranschaulicht ist. y d x=h1(y) x=h2(y) c x Es ist dabei wichtig, daß g1 (x) und g2 (x) bzw. h1 (y) und h2 (y) Funktionen sind. Das bedeutet, daß man für Gebiete wie in der folgenden Skizze, eine feinere Unterteilung des Randes vornehmen muß, wenn man zunächst über y integrieren möchte. g1(x) y g (x) 2 a bc g4(x) d x g3(x) Wir werden nun ein Beispiel betrachten. Die Funktion f (x, y) = x2 y soll dabei über das schraffierte Dreieck integriert werden. 2.16. DIE INTEGRATION IM RN 117 y 1 000000000000000000 111111111111111111 111111111111111111 000000000000000000 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 000000000000000000 111111111111111111 1 x Es gilt I = = = = = = ZZ Z f (x, y) dx dy G 1 Z 1−x x2 y dy dx 0 0 Z 1 2 1−x 2 y dx x 2 0 0 Z 1 (1 − x)2 dx x2 2 0 Z 1 1 2 (x − 2x3 + x4 ) dx 2 0 1 60 oder alternativ I = = = ZZ Z f (x, y) dx dy G 1 Z 1−y Z0 1 x2 y dx dy 0 (1 − y)3 y dy 3 0 Z 1 1 = (y − 3y 2 + 3y 3 − y 4 ) dy 3 0 1 = . 60 Es sollte klar sein, wie sich das obige Vorgehen auf den Fall der Integration über Teilgebiete des R3 verallgemeinern läßt. Sie werden Beispiele zur Integration über Teilgebiete des R3 in den Übungen kennenlernen. Eine altenative Herangehensweise an höherdimensionale Integrale ist es eine Riemann-Summe zu verwenden. Für den zweidimensionalen Fall überzieht man 118 KAPITEL 2. MATHEMATISCHE METHODEN dazu das Gebiet G mit einem Netzt (Gitter) aus Quadraten45 der Größe ∆xi ∆yi . Das Integral ergibt sich dann im Limes, daß die Gitterpunkte immer dichter werden ZZ X f (x, y) dx dy = lim f (xi , yj )∆xi ∆yj . ∆x,∆y→0 G i,j Wir wollen zum Abschluss dieses Kapitels noch die Parametertransformation und die damit zusammenhängende Variablensubstitution betrachten. Als Beispiel starten wir mit dem Übergang von zweidimensionalen kartesischen Koordinaten zu Polarkoordinaten, was uns bereits von der Einführung der komplexen Zahlen bekannt ist. Es gilt x = r cos φ y = r sin φ oder umgekehrt p r = x2 + y 2 φ = arctan (y/x) , wobei φ auf den Bereich [0, 2π] beschränkt ist. Es handelt sich dabei somit um eine (lokal) umkehrbar-eindeutige Beziehung zwischen den beiden Variablenpaaren. Die Frage ob eine (lokal) umkehrbar-eindeutige Beziehnug zwischen zwei allgemeinen Variabenpaaren {x, y} und {u, v} = {u(x, y)v(x, y)} vorliegt, läßt sich mit Hilfe der sogenannten Funktionaldeterminanten beantworten. Wir nehmen an, daß u und v als Funktionen von x und y gegeben sind und betrachten die Größen ∆u = u(x + ∆x, y + ∆y) − u(x, y) ∆v = v(x + ∆x, y + ∆y) − v(x, y) . Taylorentwicklung liefert ∂u(x, y) ∂u(x, y) ∆x + ∆y + O(∆2 ) ∂x ∂y ∂v(x, y) ∂v(x, y) ∆v = ∆x + ∆y + O(∆2 ) , ∂x ∂y ∆u = wobei O(∆2 ) für Terme steht, die mindestens quadratisch in den kleinen Größen ∆x und ∆y sind. Nach Voraussetzung ist klar, daß man zu jedem Paar {∆x, ∆y} 45 Im dreidimensionalen entsprechend einem Netz aus Würfeln. 2.16. DIE INTEGRATION IM RN 119 ein eindeutiges Paar {∆u, ∆v} berechnen kann. Damit dieses auch umgekehrt möglich ist, muß die Matrix in ! ∂u(x,y) ∂u(x,y) ∆x ∆u ∂x ∂y = ∂v(x,y) ∂v(x,y) ∆y ∆v ∂x ∂y invertierbar sein. Wie sie in der HöMa Vorlesung zeigen werden, ist dies genau dann der Fall, wenn die Determinante der Matrix ungleich Null ist. Man bezeichnet die Determinante ! ∂u(x,y) ∂u(x,y) ∂(u, v) ∂x ∂y det ∂v(x,y) = ∂v(x,y) ∂(x, y) ∂x ∂y als die Funktionaldeterminante. Wegen der Gleichberechtigung der Parameterpaare, ist damit zu rechnen, daß auch die “umgekehrte” Fuktionaldeterminante ∂(x,y) ungleich Null ist. In unserem Beispiel der zweidimensionalen Polarkoordi∂(u,v) naten gilt ∂(x, y) cos φ −r sin φ = det =r sin φ r cos φ ∂(r, φ) woraus man abliest, daß es nur am Ursprung (nicht weiter relevante) Probleme mit der umkehrbaren Eindeutigkeit gibt. Die Funktionaldeterminante spielt ebenfalls eine entscheidene Rolle, wenn es darum geht in einem höherdimensionalen Integral eine Variablensubstitution auszuführen. Beim Übergang von den {∆x, ∆y} nach {∆u, ∆v} muß man in der Riemann-Summen-Schreibweise des Integrals berücksichtigen, daß sich das Flächenelement ändert. Wie sie in einer Übungsaufgabe und in der HöMa Vorlesung zeigen werden, tritt dabei der Betrag der Funktionaldeterminanten auf und es gilt ZZ ZZ ∂(x, y) du dv , f (x, y) dx dy = f (x(u, v), y(u, v)) ∂(u, v) wobei man beachten muß, daß man links und rechts über dasselbe Gebiet integriert. Es sollte klar sein, wie man diese Überlegungen auf höhere Dimensionen (z.B. den dreidimensionalen Fall) übertragen kann. Wir betrachten zwei Beispiele. Im ersten geht es darum die Fläche einer Ellipse zu berechen. Der Rand der Ellipse ist durch die Gleichung x2 y 2 + 2 =1 a2 b definiert. Zur Flächenbestimmung müssen wir die Funktion f (x, y) = 1 über das Gebiet G = {(x, y) ∈ R2 |x2 /a2 + y 2 /b2 ≤ 1} integrieren. Diese Integration 120 KAPITEL 2. MATHEMATISCHE METHODEN vereinfacht sich erheblich, wenn wir die Koordinaten x = ar cos φ y = br sin φ einführen, wobei für die Fläche der Ellipse 0 ≤ φ < 2π und 0 ≤ r ≤ 1 gilt, nach der Variablentransformation also über G̃ = {(r, φ) ∈ R2 |0 ≤ φ < 2π, 0 ≤ r ≤ 1} zu integrieren ist. Die Funktionaldeterminante ist durch ∂(x, y) a cos φ −ar sin φ = abr = det b sin φ br cos φ ∂(r, φ) geben. Damit folgt für die Fläche F der Ellipse in Polarkoordinaten Z 1 Z 2π Z 1 F = abr dφ dr = ab2π r dr = abπ . 0 0 0 Im zweiten Beispiel wollen wir das eindimensionale Gaußintegral Z ∞ 2 I= e−x dx −∞ berechnen. Wir schreiben dieses um zu Z ∞ Z ∞ ZZ 2 −x2 −y 2 I = e dx e dy = −∞ e−(x 2 +y 2 ) dx dy , R2 −∞ also einem zweidimensionalen Integral. In diesem transformieren wir nun auf Polarkoordinaten x = r cos φ y = r sin φ , wobei über G̃ = {(r, φ) ∈ R2 |0 ≤ φ < 2π, r ≥ 0} zu integrieren ist. Die Funktionaldeterminante haben wir bereits weiter oben berechnet. Wir schreiben I 2 um zu ZZ 2 2 2 I = e−(x +y ) dx dy 2 Z ∞R Z 2π 2 = re−r dφ dr 0 Z ∞0 1 −r2 d − e = 2π dr 2 0 ∞ 2 = − πe−r 0 = π und erhalten damit I= Z ∞ −∞ 2 e−x dx = √ π. Kapitel 3 Newtonsche Mechanik Teil I 3.1 Einleitung Unter Berücksichtigung dessen, was sie bis zum jetzigen Zeitpunkt in der Vorlesung Experimentalphysik I gelernt haben und der im Rahmen dieser Vorlesung bereitgestellten mathematischen Methoden werden wir uns nun der klassischen Mechanik aus der Sichtweise eines theoretischen Physikers nähern. Die klassische Mechanik ist die Theorie der Bewegung von “klassischen” Körpern (siehe Kapitel 1) im Raum. Eine “saubere” mathematische Formulierung dieser gelang erstmalig Newton. Seine Überlegungen stützen sich auf “vorwissenschaftliche Erfahrungen” über Raum, Zeit, Masse, die Existenz von starren Körpern usw.. In einem ersten Schritt wird von der Ausdehnung der Körper abgesehen und diese werden als “Punktteilchen” idealisiert. “Sinnvolle” Idealisierungen spielen eine zentrale Rolle bei der Entwicklung theoretischer Konzepte. Wir werden hier zunächst die fundamentalen experimentellen Beobachtungen zusammenstellen und die zentralen Begriffe der Mechanik einführen. Eine “zirkelschlußfreie” Definition der Begriffe Masse und Kraft stellt sich als erstaunlich kompliziert heraus und man muß sehr vorsichtig dabei vorgehen. Eine saubere Definition dieser Konzepte ist daher Gegenstand einer Vielzahl von wissenschaftsphilosophischen Arbeiten. Eine Diskussion dazu finden sie in dem Artikel von L. Eisenbud (siehe L2 P). Wir werden hier nicht genauer auf diese Probleme eingehen und nehmen einen pragmatischen Standpunkt ein, indem wir auf ihre bereits gewonnenen Erfahrungen von dem was Masse und Kraft sind aufbauen. Wir folgen in unserem Vorgehen auch nicht dem historischen Vorbild, der Principia Mathematica von Newton. Wie wir heute wissen, sind die experimentellen Grundlagen auf der die klassische Mechanik beruht nur näherungsweise gültig (Quantenmechanik und relativistische Mechanik; siehe Kapitel 1). Folgerichtig ist die klassiche Mechanik eine Theorie mit eingeschränktem Gültigkeitsbereich. Wir werden im Folgenden nicht immer wieder auf die Grenzen der klassischen Mechanik hinweisen, sondern meist 121 122 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I so tun, als wenn sie die physikalischen Phänomene exakt beschreibt. 3.2 Grundlagen: Raum, Zeit, Masse und Kraft Raum: Die Bewegung der Punktteilchen findet im dreidimensionalen und euklidischen Raum statt in dem jeder Punkt durch die Angabe seiner drei Koordinaten bezüglich eines fest gewählten orthogonalen Bezugssystem (Koordinatensystem) eindeutig festgelegt ist. Das Bezugssystem ist durch die Angabe des Ursprungs und der drei auf Eins normierten Basisvektoren [0; ~e1 , ~e2 , ~e3 ] charakterisiert und Punkte werden durch den Ortsvektor ~r = x1~e1 + x2~e2 + x3~e3 beschrieben. Die Regeln und Konzepte zum Umgang mit Vekoren haben wir im ersten Teil dieser Vorlesung kennen gelernt. Um möglichst einfach zur Lösung eines mechanischen Problems vorzustoßen, bietet es sich oft an, eine spezielle Wahl des Bezugssystems zu treffen. Durch vorheriges Nachdenken läßt sich somit oft der Rechenaufwand minimieren. Zeit: Die “eindimensionale” Zeit ist in der klassischen Mechanik “absolut”, d.h. es ist im Prinzip möglich jeden Punkt des Raums mit einer Uhr zu versehen und diese Uhren zu synchronisieren (Festlegen des Zeitnullpunktes und der “Zeitschritte”), in dem man die Information über die aktuelle Zeit mit Hilfe unendlich schneller Signalausbreitung oder absolut starrer Körper überträgt. Die absolute Zeit ist unabhängig vom Bewegungszustand des Beobachters, d.h. nach der Synchronisation geben alle Beobachter für die Zeit eines bestimmten Ereignisses die gleiche Zahl an. Den elementaren Zeitschritt kann man mit Hilfe periodischer Bewegungen (Schwingungen) definieren. In der relativistischen Mechanik müssen die obigen Konzepte von Raum und Zeit aufgegeben und durch allgemeinere ersetzt werden. Speziell gibt es keine absolute Zeit mehr, d.h. der Bewegungszustand kann einen Einfluß auf die Zeit haben. Raum und Zeit sind in der speziellen Relativitätstheorie nicht mehr unabhängig von einander. Dadurch, daß jetzt Raum und Zeit festgelegt sind, können wir die Begriffe Geschwindigkeit und Beschleunigung einführen. Die Geschwindigkeit ergibt sich aus dem Differenzenquotienten für den Ortsvektor nach der Zeit im Limes kleiner Zeitschritte ∆t und die Beschleunigung analog aus dem Geschwindigkeitsvektor. Inertialsysteme: Es gibt Bezugssysteme (Koordinatensysteme), die Inertialsysteme, die spezielle Eigenschaften haben: 1. Alle Naturgesetze sind in allen Inertialsystemen zu allen Zeiten gleich. 2. Alle Koordinatensysteme, die sich geradlinig und gleichförmig gegenüber einem Inertialsystem bewegen, sind selbst auch Inertialsysteme. 3.2. GRUNDLAGEN: RAUM, ZEIT, MASSE UND KRAFT 123 Dabei bauen wir darauf, daß ihnen “anschaulich” klar ist, was “geradlinig” (entlang einer Geraden) und “gleichförmig” (mit konstanter Geschwindigkeit) bedeutet. Es stellt sich die Frage, welche naheliegenden Bezugssysteme Inertialsysteme sind. Ein erdfestes Bezugssystem (fest in Bezug auf Erdoberfläche) kann nur näherungsweise als inertial angesehen werden, da sich die Erde um sich selbst dreht, sich um die Sonne dreht, diese sich um das Zentrum der Milchstraße (Galaxie) dreht usw.. Koordinatensysteme die fest mit der Sonne, der Milchstraße usw. verbunden sind kommen dem theoretischen Konzept des Inertialsystems immer näher. Unter der Annahme, daß das mit der Oberfläche der Erde fest verbundene Koordinatensystem (im Rahmen der Meßgenauigkeit) inertial ist, bedeutet das obige “Galileische Relativitätsprinzip”, daß ein Experimentator der sich in einem fensterlosen Zug befindet, welcher geradlinig und mit konstanter Geschwindigkeit über die Erdoberfläche fährt (also selbst ein Inertialsystem darstellt) durch kein Experiment feststellen kann, daß er sich in ebend diesem Zug befindet (Gleichheit der Naturgesetze in Inertialsystemen). Prinzip der “Bestimmtheit”: Wir betrachten ein System von Punktteilchen aus einem Inertialsystem. Mit dem Anfangspunkt des Systems bezeichnen wir die Werte aller Orte und Geschwindigkeiten der Punktteilchen zu einem bestimmten (beliebigen) Zeitpunkt t. Das auf Newton zurückgehende und auf Erfahrung basierende Prinzip der “Bestimmtheit” lautet dann: Der Anfangspunkt eines mechanischen Systems bestimmt die Bewegung eindeutig. Insbesondere ist die Bewegung somit unabhängig von der Beschleunigung zu dem fest gewählten Zeitpunkt und der Vorgeschichte des Systems. Bezeichnen wir mit ~ri (t) den Ort des i-ten Punktteilchens zur Zeit t, so gilt für die Geschwindigkeit des i-ten Teilchens d~r(t) ~vi (t) = ~r˙i (t) = dt und für die Beschleuningung d2~r(t) ~ai (t) = ~r¨i (t) = . dt2 Für ein System von N Punktteilchen folgt dann aus dem Newtonschen Prinzip der Bestimmtheit die Newtonsche Gleichung. Da der Anfangspunkt die Bewegung eindeutig festlegt, ist speziell die Beschleunigung zur Zeit t durch ~r¨i (t) = f~i (~r1 (t), ~r2 (t), . . . , ~rN (t); ~r˙1 (t), ~r˙2 (t), . . . , ~r˙N (t); t) bestimmt. Dabei müssen die N vektorwertigen Funktionen f~i von 6N + 1 Variablen für jedes spezifische System experimentell bestimmt werden. Diese Gleichung gilt in allen Inertialsystemen. Vom mathematischen Standpunkt aus betrachtet definiert ein Satz von “hinreichned harmlosen” Funktionen f~i ein mechanisches System. Mit Hilfe der Existenz- und Eindeutigkeitssätze der Theorie gewöhnlicher 124 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Differentialgleichungen bestimmen die f~i zusammen mit den Anfangsbedingungen ~ri (t0 ) und ~vi (t0 ), i = 1, 2, . . . , N, die Bewegung eindeutig. Natürlich wird es sich bei den f~i um die durch die Masse des i-ten Punktteilchens geteilte Kraft auf dieses handeln. Wir betonen aber, daß es für die bisherigen Überlegungen nicht nötig war, die Konzepte “Masse” und “Kraft” einzuführen. In der Vorlesung Experimentalphysik I und im Mathematikteil dieser Vorlesung haben sie bereits verschiedene Beispiele für Funktionen f~i kennen gelernt. Betrachten wir zunächst den einfachsten Fall eines Punktteilchens. Um den freien Fall eines Steins zu beschreiben, vernachlässigen wir zunächst seine Ausdehnung. Den Ursprung des Koordinatensystems legen wir auf die Erdoberfläche, die wir als krümmungsfrei idealisieren. Die Erdoberfläche legt die ~e2 , ~e3 -Ebene des Koordinatensystems fest. Damit ist die Bedeutung des Ortsvektors ~r klar. Experimente zeigen dann, daß für den Fall aus nicht zu großer Höhe bis zum Aufprall ~r¨(t) = ~g , ~g = −g~e1 , g ≈ 9.81 m/s2 gilt. Mit der Funktion (“dem Potential”) Ṽ (~r) = −~g · ~r kann man auch schreiben ~ Ṽ (~r) . ~r¨(t) = −∇ Dabei haben wir die Zeitabhängigkeit des Ortes auf der rechten Seite der Gleichung nicht explizit mitgeschrieben. Es ist offensichtlich, daß man das Problem durch geschickte Wahl des Koordinatensystems zu einem eindimensionalen machen kann. Läßt man den Stein nun aus größerer Höhe fallen, so muß man zur Beschreibung der Bewegung eine andere Funktion f~ ansetzen. Es gilt dann bis zum Aufprall auf der Erdoberfläche (näherungsweise wegen der Reibung durch die Luft) das von Newton entdeckte 1/r 2 Gesetz r 2 ~r ~r¨(t) = −g 02 ; r r r = |~r| , wobei ~r den vom Erdmittelpunkt ausgehenden Ortsvektor bezeichnet und r0 der Erdradius ist. Mit dem “Potential” Ṽ (~r) = − k , k = gr02 r folgt ~ Ṽ (~r) . ~r¨(t) = −∇ Als weiteres Beispiel betrachten wir die Bewegung eines Punktteilchens, das an einer Feder befestigt ist, die wiederum in einer Wand verankert ist. Das Teilchen liege auf einem Tisch auf, der mit einem Schmiermittel bestrichen sei. Durch 3.2. GRUNDLAGEN: RAUM, ZEIT, MASSE UND KRAFT 125 geschickte Wahl des Koordinatensystems ist die Bewegung durch eine Ortskoordinate zu beschreiben und Experimente zeigen, daß ẍ(t) = −α2 x = − dṼ (x) 1 , Ṽ (x) = α2 x2 dx 2 gilt, solange das Teilchen nicht zu weit aus der Ruhelage ausgelenkt wird und die seit der Auslenkung verstrichene Zeit nicht zu groß ist (wegen der Reibung). Man nennt diesen Zusammenhang das Hooksche Gesetz. Ersetzt man das eine an der Feder befestigte Punktteilchen durch zwei der exakt gleichen Art, so stellt sich experimentell heraus, das die Beschleunigung bei gleicher Auslenkung (wie im Fall eines Teilchens) nur noch halb so groß ist. Allgemeiner findet man, daß für zwei Punktteilchen 1 und 2 das Verhältnis der Beschleunigung bei gleicher (kleiner) Auslenkung einen festen Wert hat, welcher weder von der Auslenkung selbst, der aktuellen Zeit, noch von der Bauart der Feder abhängt. Man bezeichnet ẍ(1) (t) m2 = ẍ(2) (t) m1 als das Massenverhältnis. Durch Wahl einer festen Bezugsmasse (“Einheitskilogramm”) ist damit der Begriff der Masse über die Trägheit eingeführt. Aus Erfahrung weiß man, daß alle Massen positiv sind. Im Beispiel der Feder sieht man nun, daß die Größe mẍ nicht vom Teilchen, sondern nur noch den Eigenschaften der Feder abhängt und man nennt diese Größe die Kraft die durch die Feder auf das Teilchen wirkt. Diese Logik zeigt, wie eng die Begriffe Masse und Kraft zusammenhängen. Die Bewegungsgleichung lautet dann mẍ(t) = F (x) = −Kx , K = mα2 . Nachdem der Massebegriff nun eingeführt ist, lassen sich die Newtonschen Gleichungen in der bekannten Form mi ~r¨i (t) = F~i (~r1 (t), ~r2 (t), . . . , ~rN (t); ~r˙1 (t), ~r˙2 (t), . . . , ~r˙N (t); t) , mit der experimentell festgelegten Kraft F~i die auf das i-te Teilchen wirkt, schreiben. Wir definieren nun den Teilchenimpuls p~i (t) = mi~vi (t) = mi~r˙i (t) und erhalten eine Form des zweiten Newtonschen Gesetzes p~˙ i = F~i , wobei wir die Abhängigkeiten von den Variablen nicht mitgeschrieben haben. Wir haben dabei die obige Version des zweiten Newtonschen Gesetzes gewählt, 126 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I da man in dieser auch den “phänomenologischen” Fall von zeitabhängigen Massen behandeln kann. Beschreibt man die Bewegung der Teilchen in einem Inertialsystem, so findet man häufig den Fall, daß die (Gesamt-)Kraft auf das i-te Teilchen als Summe von Paarkräften geschrieben werden kann F~i = N X F~i,j j=1 j6=i und für die F~i,j F~i,j = −F~j,i gilt. Die Paarkräfte wirken entlang der Verbindungslinie der Massepunkte i und j. Man bezeichnet dieses als das Prinzip von actio = reactio (Kraft = Gegenkraft). Der Betrag der Kräfte ist eine Funktion des Abstandes |~ri − ~rj |. Diese Beobachtungen bilden das dritte Newtonsche Gesetz. Ein Beispiel für Kräfte dieser Art sind die Gravitationskräfte zwischen Massen. Sind alle Kräfte die auf Teilchen eines Systems wirken von dieser Form, so bezeichnet man das betrachtete System auch als abgeschlossen. Ist das betrachtete System nicht abgeschlossen, so kann man die Kraft auf das i-te Teilchen häufig als F~i = N X F~i,j + F~iext j=1 j6=i schreiben, wobei F~iext die externen Kräfte auf das i-Teilchen bezeichnet. Solch eine Situation ergibt sich z.B. wenn man ein abgeschlossenes System in zwei Teile zerlegt und nur einen Teil explizit betrachtet. Ein einfaches Beispiel ist das von uns diskutierte Problem des Falls eines Steins (auf die Erde) aus geringer Höhe. In diesem Beispiel kann die Rückwirkung der Bewegung des Steins auf die Erde vernachlässigt werden (da mStein /mErde 1) und wir haben die Paarkraft Gravitation gleich durch eine externe Kraft nur auf den Stein beschrieben. Vollständiger müßten wir das Zweiteilchensystem Stein-Erde beschreiben, oder noch besser, das Vielteilchensystem von Atomen des Steins und Atomen der Erde (wobei wir dann natürlich eigentlich Quantenmechanik betreiben müßten). Auch dann hätten wir noch den Einfluß aller anderer Himmelskörper auf die Bewegung vernachlässigt. Dies ist oft legitim, da die Paarkräfte meist mit dem Abstand der Teilchen abnehmen (Ausnahme: Federkraft), so daß F~iext , welches von nicht berücksichtigten Paarkräften stammt, verglichen mit den explizit betrachteten Paarkräften innerhalb des Systems vernachlässigt werden kann. Erst aufgrund dieser Tatsache wird die klassische Mechanik überhaupt möglich. Würde das nicht gelten, so müßte 3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN 127 man ja bei der Untersuchung jedes mechanischen Problems immer das Universum als Ganzes behandeln. Aufgrund des Abfalls der Kräfte mit dem Abstand der Massenpunkte, können auch Teilsysteme oft in guter Näherung als abgeschlossen angesehen werden. Auch zur Beschreibung des Aufpralls des Steins, müßten wir das aus den Atomen des Steins (und der Erde) bestehende Vielteilchensystem beschreiben, was man jedoch häufig durch Verwendung effektiver Zwangskräfte zu vermeiden versucht. Auch ein weiteres vereinfachendes Konzept läßt sich anhand des Falles eines Steins verdeutlichen. In der bisherigen Beschreibung sind wir davon ausgegangen, daß der Stein während des Falls mit keinen anderen Teilchen als der Erde wechselwirkt, also speziell nicht mit den Molekülen der Luft. Der Fall fand also im Vakuum statt. Um bei der Beschreibung des Falls in Luft nicht die Bewegung aller Moleküle (alle Orte und Geschwindigkeiten) der Luft explizit mitbehandeln zu müssen (was ja auch wieder Quantenmechanik erfordern würde) führt man als (oft sehr gute) Näherung eine effektive Reibungskraft ein, die von der Geschwindigkeit des Steins abhängt (verschwindende Reibungskraft, wenn die Geschwindigkeit des Steins Null ist). Im Kapitel über gewöhnliche Differentialgleichungen haben wir bereits zwei Beispiele für Reibungskräfte (∝ −v 2 bzw. ∝ −v) kennen gelernt. Eine reichhaltigere Bewegung erhält man z.B. aus der Gleichung des van der Pol-Oszillators mẍ + mη(x2 − a2 )ẋ + mω02 x = 0 (3.1) in dem das Vorzeichen (und die Amplitude) der zur Geschwindigkeit proportionalen Reibungskraft von der Amplitude x der Auslenkung abhängt. Systeme in denen durch eine effektive Beschreibung der Wirkung weggelassener Freiheitsgrade Reibungskräfte auftreten bezeichnet man als dissipative Systeme. Diese stehen im Gegesatz zu sogenannten konservativen Systemen (siehe unten). Die obigen Überlegungen zum Abfall der Paarkräfte führt uns auf das erste Newtonsche Gesetz. Ist ein einziges Punktteilchen i hinreichend weit von allen anderen Teilchen entfernt, so gilt F~iext ≈ 0 und die Bewegung kann näherungsweise durch mi~r¨i (t) = 0 ⇒ ~ri (t) = ~r0 + ~v0 t beschrieben werden, wobei ~r0 den Anfangsort und ~v0 die Anfangsgeschwindigkeit des Teilchens bezeichnen. In Worten lautet das erste Newtonsche Gesetz: Jeder Körper beharrt in seinem Zustand der Ruhe oder geradlinig gleichförmigen Bewegung, wenn er nicht durch einwirkende Kräfte gezwungen wird, seinen Bewegungszustand zu ändern. 3.3 Bewegungsgleichung und Erhaltungsgrößen Wir betrachten ein System von N Massepunkten m1 , m2 , . . . , mN , wobei die Massen zeitlich konstant sein sollen. Die Newtonschen Gleichungen haben dann die 128 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Form (i = 1, 2, . . . , N) mi ~r¨i (t) = N X F~i,j + F~iext . (3.2) j=1 j6=i Schwerpunkt und Gesamtimpuls: Wir definieren den Schwerpunkt des Systems. Sein Ortsvektor ist durch N N X 1 X ~ R= mi~ri , M = mi M i=1 i=1 gegeben, wobei M die Gesamtmasse des Systems bezeichnet. Durch Addition der Newtonschen Gleichungen für die einzelnen Teilchen folgt N N X N N X X X ¨ ¨ ~ ~ M R(t) = mi ~ri (t) = Fi,j + F~iext . i=1 i=1 j=1 j6=i i=1 Da F~i,j = −F~j,i verschwindet die Doppelsumme und es gilt N X ~¨ = F~iext = F~ ext , M R(t) i=1 was die externe Gesamtkraft F~ ext definiert. Als einfaches Beispiel betrachten wir den Fall des Steins aus kleiner Höhe. Wir stellen uns den Stein nun als aus N Massepunkten (“Atomen”) zusammgesetzt vor. Zuvor hatten wir den Stein als einen Massepunkt idealisiert. Auf alle “Atome” wirke die Schwerkraft F~iext = mi~g . Das liefert die externe Gesamtkraft P F~ ext = i mi~g = M~g , d.h. die Bewegungsgleichung für den Schwerpunkt lautet ~¨ = ~g . Wir sehen somit, daß unter Berücksichtigung des dritten Newtonschen R Gesetzes die Bewegungsgleichung des “ausdehnungslosen” Steins (Punktteilchen; siehe oben) zu der für den Schwerpunkt des ausgedehnten Steins wird. Sollten die externen Kräfte vom Ort abhängen F~iext = F~iext (~ri ) (was in unserem einfachen Beispiel nicht der Fall ist), dann erhält man nur dann eine geschlossene Gleichung für die Bewegung des Schwerpunktes, wenn die Variation der externen Kräfte über die Ausdehnung des Objektes vernachlässigbar ist. Ist dies der Fall, so gilt in guter Näherung ~¨ = F~ ext (R) ~ M R(t) für den Vektor des Schwerpunktes. 3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN 129 Ist das betrachtete System abgeschlossen, d.h. für alle Zeiten gilt F~iext = 0, so folgt ~¨ = 0 M R(t) ~ ~ 0 + V~0 t. und der Schwerpunkt bewegt sich geradlinig und gleichförmig: R(t) =R Definiert man den Gesamtimpuls des Systems als P~ = N X ~pi = i=1 N X mi~r˙i i=1 so folgt für diesen ˙ P~ = F~ ext und für ein abgeschlossenes System ist der Gesamtimpuls eine Erhaltungsgröße (hängt nicht von der Zeit ab) ~˙ = M V~0 . P~ = M R Gesamtdrehimpuls: Neben dem Impuls spielt der Drehimpuls eine zentrale Rolle in der Mechanik. Der Drehimpuls ~li des i-ten Teilchens ist definiert als (i = 1, 2, . . . , N) ~li = mi~ri × ~vi = ~ri × p~i . Im Gegensatz zum (linearen) Impuls, hängt der Drehimpuls von der Wahl des Ursprungs ab und man sollte damit genauer vom Drehimpuls im Bezug auf ein spezifisches Koordinatensystem [0; ~e1 , ~e2 , ~e3 ] sprechen. Als Gesamtdrehimpuls definiert man ~ = L N X i=1 ~li = N X i=1 ~ri × ~pi . Die Ableitung nach der Zeit ergibt (Produktregel) N h i ˙ X ˙ ˙ ~ L= ~ri × p~i + ~ri × p~i . i=1 Der erste Term verschwindet, da ~r˙i = ~vi und ~pi parallele Vektoren sind. Durch Einsetzen der Newtonschen Gleichung in den zweiten Term folgt N N X X ~ ~˙ = L ~ri × Fi,j + F~iext . i=1 j=1 j6=i 130 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Den ersten Summanden kann man weiter umformen. Man verwendet dabei die folgenden Punkte: (i) Umbennen von Summationindizes, (ii) drittes Newtonsches Gesetz und (iii) ~ri − ~rj ist parallel zu F~i,j : N X i=1 ~ri × N X F~i,j = j=1 j6=i N X i,j=1 j6=i ~ri × F~i,j N 1 X ~ri × F~i,j + ~rj × F~j,i = 2 i,j=1 j6=i N 1 X = (~ri − ~rj ) × F~i,j 2 i,j=1 j6=i = 0. Die Bewegungsgleichung für den Gesamtdrehimpuls ergibt sich somit zu N N X X ~˙ = ~ , L ~ri × F~iext = ~next =N i i=1 (3.3) i=1 wobei wir dabei das durch die äußere Kraft hervorgerufene Drehmoment ~next = i ext ~ definiert haben. Für ~ri × F~i auf das i-te Teilchen und das Gesamtdrehmonent N ext ~ den Fall des Steins mit f = mi~g liefert das i ~˙ = M R(t) ~ × ~g . L ~ Nachdem R(t) berechnet wurde, folgt der Drehimpuls somit durch Integration über die Zeit. Gleichung (3.3) liefert die zentrale Beobachtung, daß der Gesamtdrehimpuls eines abgeschlossenen Systems mit verschwindenden äußeren Kräften eine Erhaltungsgröße ist ~˙ = 0 ⇒ L(t) ~ ~0 , L =L ~ 0. mit dem Anfangsgesamtdrehimpuls L Arbeit, Gesamtenergie und konservative Kräfte: Zur Definition der an einem Teilchen geleisteten Arbeit untersuchen wir zunächst die Verschiebung eines Teilchens in einem statischen (zeitunabhängigen) Kraftfeld F~ (~r), welches nur vom Ort des Teilchens abhängt. Dabei wird die Bewegung unabhängig vom wirklichen (“dynamischen”) Durchlaufen der durch die Bewegungsgleichung und Anfangsbedingung gegebenen Bahnkurve betrachtet. Das Kraftfeld sei in einem einfach zusammenhängende Gebiet definiert (siehe das Kapitel über Intergration im Rn ). 3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN 131 Die Verschiebung erfolge längs einer (hinreichend glatten) Kurve C von ~ra nach ~re . In Verallgemeinerung der in einem homogenen (ortsunabhängigen) Kraftfeld geleisteten Arbeit (“Arbeit = Kraft · Weg”) definieren wir Z AC = F~ · d~r C als Kurvenintegral. Eine wichtige Roll in der Mechanik spielen konservative Kraftfelder, die sich als Gradient einer skalaren Funktion −V (~r), mit dem Potential oder der potentiellen Energie V (~r), schreiben lassen ~ (~r) . F~ (~r) = −∇V Nach dem was wir im letzten Kapitel des mathematischen Teils dieser Vorlesung gelernt haben, ist das Kraftfeld F~ (~r) dann und nur dann konservativ, wenn die längs beliebiger Kurven geleistete Arbeit nur vom Anfangs- und Endpunkt der Kurve, nicht jedoch von der Form dieser abhängt. Weiterhin haben sie im Mathematikteil gelernt, daß die Rotation eines konservativen Kraftfeldes verschwindet ~ × F~ (~r) = 0 , ∇ was bei gegebenem Kraftfeld ein leicht zu überprüfendes Kriterium für Konservativität darstellt. Als Beispiel für konservative Kraftfelder betrachten wir alle Zentralfelder der Form F~ (~r) = F (r)~r/|~r|. Den einfachen Beweis der Konservativität über das Bilden der Rotation verschieben wir auf eine Übungsaufgabe. Stattdessen wollen wir hier konstruktiv zeigen, daß Zentralfelder konservativ sind. Wir betrachten Z Z ~r AC = F~ (~r) · d~r = F (r) · d~r . |~r| C C dr r dr Der Skizze folgend gilt “~r/|~r| · d~r = dr” und damit Z re F (r)dr AC = ra 132 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I unabhängig vom Weg. Die Funktion V (~r) = − Z r F (r 0)dr 0 ra ist dann das Potential,1 was man leicht explizit verifiziert Z r ~ = F (r) ~r = F~ (~r) . ~ ~ F (r 0)dr 0 = F (r)∇r −∇V (~r) = ∇ |~r| ra Wir kehren nun zum allgemeinen Fall eines statischen Kraftfeldes zurück und nehmen an, daß wir die wirkliche, dynamische Trajektorie der Bewegung C = {~r(t) ∈ R3 | t ∈ [ta , te ]} bestimmt haben. Diese wird durch die Zeit parametrisiert und für die Bewegung entlang dieser Trajektorie gilt Z AC = F~ (~r) · d~r ZC te h i F~ (~r(t)) · ~r˙ (t) dt = ta Z te h i ˙ ~v (t) · ~v (t) dt = m ta Z m te dv 2 (t) = dt 2 ta dt m 2 m = v (te ) − v 2 (ta ) 2 2 = Te − Ta , wobei wir von der zweiten zur dritten Zeile die Newtonsche Gleichung verwendet haben und im letzten Schritt die kinetische Energie T (~v) = m 2 v 2 definiert haben. Ist das Kraftfeld nun konservativ so gilt auch Z Z ~ (~r) · d~r = −(Ve − Va ) AC = F~ (~r) · d~r = − ∇V C C und die Kombination dieser beiden Resultate liefert die Energieerhaltung Ta + Va = Te + Ve = E = const. für die Bewegung eines Teilchens in einem konservativen Kraftfeld. 1 Da ~ra frei gewählt werden kann, ist das Potential (die potentielle Energie) nur bis auf eine Konstante eindeutig festgelegt. 3.3. BEWEGUNGSGLEICHUNG UND ERHALTUNGSGRÖSSEN 133 Für den Beweis der Energieerhaltung im Fall des N-Teilchensystems mit konservativen äußeren Kräften gehen wir etwas anders vor. Wir bilden das Skalarprodukt der Bewegungsgleichung (3.2) mit ~r˙i mi ~r˙i · ~r¨i = N X j=1 j6=i mi dvi2 ~r˙i · F~i,j + ~r˙i · F~iext = . 2 dt Die Summation über alle Teilchen liefert N N N X X d X mi 2 vi = ~r˙i · F~iext ~r˙i · F~i,j + dt i=1 2 i,j=1 i=1 j6=i = N N X 1 X ˙ ~r˙i · F~iext . (~ri − ~r˙j ) · F~i,j + 2 i,j=1 i=1 (3.4) j6=i Es gilt nun (Kraft hängt nur vom Betrag der Abstände ab und zeigt entlang der Verbindungslinie; siehe oben) ~ri − ~rj . F~i,j = Fi,j (|~ri − ~rj |) |~ri − ~rj | Damit ist F~i,j analog zur Zentralkraft aus einem “Zweiteilchenpotential” vi,j ableitbar. Mit der Definition ~ri,j = ~ri − ~rj folgt ~ ~r vi,j (ri,j ) = −∇ ~ ~r vi,j (ri,j ) F~i,j (~ri,j ) = −∇ i,j i mit vi,j (ri,j ) = − Z ri,j Fi,j (r 0 ) dr 0 . r0 Dabei gibt der Index am ∇ an, nach welcher Variablen differenziert wird. Sind weiterhin die äußeren Kräfte konservativ, d.h. ~ iext F~iext = −∇V wobei Viext nicht explizit von der Zeit abhängt, so vereinfacht sich Gl. (3.4) zu (Kettenregel!) N N N X d X mi 2 d 1 X vi = − vi,j (ri,j ) + Viext (~ri ) . dt i=1 2 dt 2 i,j=1 i=1 j6=i 134 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Damit ergibt sich die Energieerhaltung für ein konservatives N-Teilchensystem N X mi i=1 2 vi2 N N X 1 X vi,j (ri,j ) + Viext (~ri ) = E = const. . + 2 i,j=1 i=1 j6=i Die in diesem Kapitel diskutierten Erhaltungssätze spielen bei der Lösung vieler mechanischer Probleme eine zentrale Rolle. Um das näher zu erläutern betrachten wir zunächst Bewegungen eines Massepunktes in einem konservativen Kraftfeld, die sich in Gegenwart von speziellen Anfangsbedingungen und/oder Zwangskräften durch geschickte Wahl des Koordinatensystems durch eine Ortsvariable beschreiben lassen (eindimensionale Bewegungen). Wir haben im Laufe dieser Vorlesung bereits einige Beispiele dazu kennen gelernt (freier Fall, Masse mit Hookscher Feder) und analytisch gelöst (ohne auf Erhaltungsgrößen Bezug zu nehmen). Wir werden im Folgenden zunächst einige allgemeine Überlegungen anstellen. Bereits am Beispiel dieser Klasse von Bewegungen wird klar werden, wie klein die Zahl der geschlossen analytisch lösbaren (integrierbaren; siehe später) Probleme ist. 3.4 Ein Teilchen in einer Dimension Spezielle Anfangsbedingungen und/oder Zwangskräfte (z.B. “Perle auf Draht”) können dazu führen, daß sich die Bewegung eines Teilchens als effektiv eindimensional beschreiben läßt. Daher ist es sinnvoll eindimensionale mechanische Systeme zu betrachten. Zeitunabhängige Kräfte: Die Newtonsche Gleichung in einem statischen Kraftfeld welches nur vom Ort des Teilchens abhängt lautet mẍ = F (x) . Als besondere Eigenschaft des eindimensionalen Falls, läßt sich jede integrierbare, nur vom Ort abhängige Kraft F (x) durch ein Potential V (x) ausdrücken Z x V (x) = − F (x0 ) dx0 , x0 welches bis auf eine willkürliche Konstante (Nullpunkt der Energie; siehe auch oben) eindeutig festgelegt ist. Die Energieerhaltung liefert m 2 ẋ = E − V (x) . 2 (3.5) Somit ist der Betrag der Geschwindigkeit des Teilchens bei fester Gesamtenergie E durch den Ort des Teilchens eindeutig festgelegt. In der Skizze ist eine typische Situation dargestellt. 3.4. EIN TEILCHEN IN EINER DIMENSION 135 V(x) E x1 x2 xM x3 x Die kinetische Energie ist größer oder gleich Null, so daß die Bewegung nur in Bereichen mit V (x) ≤ E verlaufen kann. Für die gestrichelt dargestellte Gesamtenergie E im obigen Beispiel sind das die x-Bereiche zwischen x1 und x2 sowie rechts von x3 . Die Punkte xi , i = 1, 2, 3, an denen die potentielle Energie gleich der Gesamtenergie ist, also V (xi ) = E gilt, sind die Umkehrpunkte der Bewegung, an denen die Geschwindigkeit der Teilchens einen Nulldurchgang hat, d.h. ihre Richtung umkehrt. Sollte das für die Bewegung erlaubte Gebiet auf beiden Seiten durch einen Umkehrpunkt begrenzt sein, verläuft sie in einem endlichen Raumbereich und man nennt sie finit. Liegt im obigen Beispiel der Anfangsort (bei festem E) zwischen x1 und x2 , so ist die Bewegung auf diesen Raumbereich beschränkt. Ist der erlaubte Raumbereich nicht oder nur auf einer Seite beschränkt (liegt der Anfangsort in der Skizze bei festem E rechts von x3 ), so nennt man die Bewegung infinit und das Teilchen läuft nach ±∞. Aus Gl. (3.5) ergibt sich r ẋ = ± 2 [E − V (x)] m (3.6) und man kann die Geschwindigkeit bei gegebenem x direkt ablesen. Um sich einen Eindruck von der Bewegung zu verschaffen stellt man sie im sogenannten Phasenraum dar. Dabei trägt man den Ort entlang der x-Achse und die Geschwindigkeit entlang der y-Achse auf. Für unser Beispiel und zwei Energien E1 und E2 haben wir das in der folgenden Skizze getan.2 2 Die auf der x-Achse auftretenden Knicke sind ein Artefakt des Programms mit dem die Skizze erstellt wurde. Eigentlich gehen die Kurven mit divergierender Steigung durch die xAchse. 136 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I V(x) E2 E1 x0 x1 x2 x3 x x E2 E1 E1 x Die Bahnen (je nach Anfangsort und Gesamtenergie) werden in Richtung der Pfeile durchlaufen. Zur analytischen Bestimmung des Verlaufs der Bewegung, integrieren wir die Differentialgleichung (3.6) erster Ordnung durch Separation der Variablen r Z x(t) Z t m 1 0 p dt = ± dx0 0 2 E − V (x ) t0 x0 und damit r Z x(t) m 1 p t − t0 = ± dx0 . 0 2 x0 E − V (x ) (3.7) Dabei müssen x0 = x(t0 ) und x(t) mit der fest vorgegebenen Gesamtenergie E verträgliche Orte (im Sinne der obigen Diskussion) sein, d.h. bezugnehmend auf die obige (erste) Skizze muß x0 , x(t) ∈ [x1 , x2 ] oder x0 , x(t) ∈ [x3 , ∞) gelten. Für beliebige Potentiale wird die Integration auf der rechten Seite von Gl. (3.7) im Allgemeinen nicht analytisch ausführbar sein und man kann die Gleichung nicht nach x(t) (woran wir natürlich interessiert sind) auflösen. Man kann die Bahnkurve in der (t, x)-Ebene dann durch numerische Integration und Auftragen von t als Funktion von x erhalten. Für ein quadratisches (harmonisches) Potential V (x) = V0 + c(x − b)2 /2 (also eine Hooksche Kraft) mit c > 0, läßt sich die Integration ausführen und das 3.4. EIN TEILCHEN IN EINER DIMENSION 137 Ergebnis dieser nach x(t) auflösen. Um die Rechnung zu vereinfachen, wählen wir o.B.d.A. V0 = 0 = b. Wir definieren den zur gegebenen Gesamtenergie E gehörenden Umkehrpunkt a gemäß E = V (a) und erhalten so Z x(t) 1 1 √ t − t0 = ± dx0 ω0 x0 a2 − x0 2 ⇒ ω0 (t − t0 ) = ±{arcsin [x(t)/a] − arcsin [x0 /a]} oder aufgelöst nach x(t) x(t) = ±a sin (ω0 t + φ± ) , φ± = −ω0 t0 ± arcsin [x0 /a] . p Dabei haben wir die Kreisfrequenz ω0 = c/m eingeführt. Dieses Ergebnis ist uns natürlich bereits aus dem Kapitel über Integralrechnung einer Veränderlichen bekannt. Periodische Bewegungen: Die eindimensionale finite Bewegung ist im Allgemeinen eine Schwingung. Eine Ausnahme bildet die Situation, daß in unserer ersten Skizze des Potentials gerade E = V (xM ) gewählt wird. In allen anderen Fällen führt das Teilchen eine periodische Bewegung zwischen den Umkehrpunkten x1 und x2 aus. Für die Schwingungsdauer TE (bei festem E) der Bewegung von x1 nach x2 und zurück erhält man Z x2 √ 1 p TE = 2m dx0 . (3.8) 0 E − V (x ) x1 Wie man leicht nachrechnet gilt im Fall des harmonischen Potentials unabhängig von der Gesamtenergie E, bzw. dem Umkehrpunkt a (aus V (a) = E), TE = 2π/ω0 . Wir betrachten nun den Fall eines symmetrischen Potentials V (x) mit einem harmonische Teil und einer “kleinen” Anharmonizität V (x) = c 2 x + V1 (x) , 2 0≤1. Wir definieren wieder den Umkehrpunkt a (symmetrisches Potential!) bei festem E gemäß V (a) = E. Unter der Voraussetzung, daß |V1 (a)| ca2 /2, p was für hinreichend kleines sicherlich erreicht werden kann, entwickeln wir 1/ E − V (x) nach Potenzen von r 1 1 2 1 p √ q = 2 2 c a −x V (a) − V (x) 1 + 2c [V1 (a) − V1 (x)]/(a2 − x2 ) r 1 2 V1 (a) − V1 (x) √ + O(2 ) . = 1− c a2 − x2 c a2 − x2 138 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Setzt man dieses Ergebnis in die Gleichung für die Periodendauer (3.8) ein, so kann das Integral des ersten Summanden ausgeführtpwerden (Integrand wie beim harmonischen Potential) und man erhält mit ω0 = c/m Z a 1 V1 (a) − V1 (x) 2π 2 √ 1− + O( ) . TE = T (a) = ω0 cπ −a a2 − x2 a2 − x2 Dabei tritt in nullter Ordnung in die bekannte Schwingungsdauer des harmonischen Oszillators auf. Der Term erster Ordnung in hängt von a und damit E ab, so daß die Schwingungsdauer für eine allgemeine periodische Bewegung von der Gesamtenergie bzw. dem Umkehrpunkt (der Auslenkung) abhängt. Die Abhängigkeit der Periodendauer von der Auslenkung läßt sich explizit für den Fall der quartischen Anharmonizität mit V1 (x) = χx4 zeigen, wobei χ positive oder negative Werte annehmen kann. In diesem Fall gilt V1 (a) − V1 (x) = χ(a2 + x2 ) 2 2 a −x und das Integral im Term erster Ordnung läßt sich ebenfalls geschlossen angeben. Nach der Substitution u = x/a folgt für das relevante Integral Z 1 Z 1 √ 1 + u2 3π π 2 2 √ 1−u − √ . du = − du = − + 2π = 2 2 1 − u2 1 − u2 −1 −1 Zusammengefaßt gilt dann 3χ 2 2π 2 1− a + O( ) , T (a) = ω0 2c bzw. für die Kreisfrequenz der periodischen Bewegung 3χ 2 2 ω(a) = ω0 1 + a + O( ) . 2c (3.9) Je nach Vorzeichen von χ wird die Frequenz verglichen mit der des harmonischen Oszillators erhöht oder erniedrigt. Fadenpendel und Polarkoordinaten: Ein typisches Beispiel eines anharmonischen Oszillators ist ein (reibungsfreies) Fadenpendel (Masse m am Ende eines masselosen Fadens) bei größerer Auslenkung. 0 φ N G 3.4. EIN TEILCHEN IN EINER DIMENSION 139 Die Bewegung ist effektiv eindimensional da sie in einer Ebene (per Wahl des Koordinatensystems die x1 -x2 -Ebene) statt findet und die Masse durch die ent~ auf eine Kreisbahn gezwungen wird. lang des Fadens wirkende Normalkraft N Damit ist der Abstand vom Ursprung durch die Länge R des Fadens festgelegt. Die Position der Masse ist durch die Angabe des Winkels φ eindeutig festgelegt. Es biete sich an, das Problem in ebenen Polarkoordinaten (siehe Mathematik Teil dieser Vorlesung) zu formulieren. Es gilt x1 = r cos φ , x2 = r sin φ . Für einen festen Ortsvektor ~r führen wir zwei neue (verglichen mit den alten ~e1 und ~e2 ) orthogonale Einheitsvektoren ein. Als den ersten wählen wir ~rˆ = ~r/r ~ˆ der zusammen mit ~rˆ ein und als den zweiten den dazu senkrechten Vektor φ Rechtssystem (siehe den mathematischen Teil dieser Vorlesung) bildet. Dies ist in der folgenden Skizze dargestellt. φ r r e2 e1 Fassen wir nun ~r als den (ebenen) Ortvektor auf, der die Bewegung der Masse beschreibt, also ~r = ~r(t), so ändern sich die orthogonalen Einheitsvektoren ~ˆ (im Gegensatz zu ~e1 und ~e2 ) im Laufe der Zeit. Dessen ungeachtet, ~rˆ und φ läßt sich ein Vektor, z.B. die Gesamtkraft F~ als Linearkombination von ~rˆ und ~ˆ schreiben F~ = Fr ~rˆ + Fφ φ. ~ˆ Wir streben es an, die Newtonsche Gleichung für φ ~ˆ zu schreiben, müssen also die die Entwicklungskomponenten von ~r nach ~rˆ und φ Entwicklungskoeffizienten von ~r¨ unter Berücksichtigung der Zeitabhängigkeit von ~ˆ bestimmen. Der Ortsvektor selbst ist durch ~r = x1~e1 + x2~e2 = r~rˆ gege~rˆ und φ ben. In der folgenden Skizze ist die Position des Teilchens zu zwei verschiedenen Zeiten t1 und t2 = t1 + ∆t dargestellt. 140 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I ∆r r(t2) ∆φ r(t2) r(t1) r(t1) Für kleine ∆t gilt ~ˆ ≈ φ̇∆t φ ~ˆ ∆~rˆ ≈ ∆φ φ ~ˆ steht. Für ∆t → 0 folgt so da ∆~rˆ senkrecht auf ~rˆ, also in Richtung von φ d~rˆ ~ˆ . = φ̇ φ dt Damit ergibt sich d~rˆ ~ˆ . ~v = ~r˙ = ṙ ~rˆ + r = ṙ ~rˆ + r φ̇ φ dt Die Koeffizienten der Geschwindigkeit in Polakoordinaten sind also vr = ṙ und vφ = r φ̇ = rω mit der Winkelgeschwindigkeit ω. Die Ausdrücke für die Koeffizienten sind im Allgemeinen sicherlich komplizierter, als die für die Koeffizienten in kartesischen Koordinaten ẋ1 und ẋ2 . In speziellen Situation z.B. wenn eine Zwangskraft dafür sorgt, daß ṙ = 0 (siehe das Beispiel des Fadenpendels mit dem wir gestartet sind), kann die Wahl von Polarkoordinaten trotzdem von Vorteil bei der Lösung des mechanischen Problems sein. Um unser Ziel zu erreichen müssen wir erneut nach t differenzieren i d~v d h ˆ ~ˆ . ~r¨ = ṙ ~r + r φ̇ φ = dt dt ~ˆ nach der Zeit. Die Konstruktion dieser Wir benötigen also die Ableitung von φ ist in der folgenden Skizze dargestellt. ∆φ φ(t2) φ(t1) φ(t1) ∆φ φ(t2) 3.4. EIN TEILCHEN IN EINER DIMENSION 141 Analog zu den obigen Überlegungen folgt ~ˆ dφ = −φ̇ ~rˆ . dt Zusammengenommen erhalten wir somit i d h ˆ ˆ ~ ṙ ~r + r φ̇ φ dt ~ˆ d~rˆ ~ˆ + r φ̈ φ ~ˆ + r φ̇ dφ + ṙ φ̇ φ = r̈ ~rˆ + ṙ dt dt ˆ ~. = (r̈ − r φ̇2 ) ~rˆ + (r φ̈ + 2ṙ φ̇) φ ~r¨ = Die Newtonsche Gleichung übersetzt sich dann zu Fr = m(r̈ − r φ̇2 ) , Fφ = m(r φ̈ + 2ṙφ̇) . Erneut ist dieser Ausdruck im Allgemeinen sicherlich sehr viel komplizierter als sein Analogon in kartesischen Koordinaten. In dem wir jetzt zu unserem Bespiel zurückkehren, werden wir jedoch sehen, daß die Formulierung in Polarkoordinaten in speziellen Situationen von großem Vorteil sein kann. Im obigen Beispiel des Fadenpendels sind die auf die Masse wirkenden äußeren ~ = m~g und die Normalkraft N. ~ In Polarkoordinaten Kräfte die Gewichtskraft G geschrieben ist die Gesamtkraft Fr = mg cos φ − N , Fφ = −mg sin φ . Da aufgrund des Fadens ṙ = 0 gilt, vereinfacht sich die Newtonsche Gleichung zu Fr = mg cos φ − N = −mRφ̇2 , Fφ = −mg sin φ = mRφ̈ . Der Betrag der Normalkraft (Zwangskraft) N ist zum Verständnis der Bewegung irrelevant. Zum Glück erhalten wir mit der zweiten Gleichung eine, in der N nicht vorkommt. Wir können also wie folgt vorgehen: Wir bestimmen φ(t) mit Hilfe der zweiten Gleichung. Bei Interesse können wir dann N durch Einsetzen von φ(t) in die erste Gleichung und Auflösen nach N berechnen. Die für uns zunächst relevante eindimensionale Bewegungsgleichung ist φ̈ = − g sin φ . R 142 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Für kleine Auslenkwinkel φ, können wir den Sinus in einer Taylorreihe um φ = 0 entwickeln (siehe Mathematikteil dieser Vorlesung) sin(φ) = φ + O(φ3 ) und bekommen das uns inzwischen wohlbekannte Problem des harmonischen Oszillators (lineare Kraft, quadratisches Potential). Gehen wir eine Ordnung weiter, so bekommen wir das oben diskutierte Problem des Oszillators mit quartischer Anharmonizität, da die Kraft die Form 1 Fφ ∼ −φ + φ3 + O(φ5 ) 6 hat und damit das Potential einen quadratischen und einen quartischen Term hat. Die obigen Ergebnisse können somit direkt auf den Fall des Fadenpendels angewandt werden. Dissipative Systeme: Das wesentliche Hilfsmittel zur Untersuchung der Bewegung in einem statischen Kraftfeld, welches nur vom Ort abhängt, war der Satz von der Erhaltung der Energie. Für ein durch mẍ + γ(x, ẋ)ẋ = F (x) (3.10) gegebenes dissipatives System gilt keine Energieerhaltung da (V bezeichnet das zur konservativen Kraft F gehörige Potential), dT dV dE = + dt dt dt = [mẍ − F (x)]ẋ = −γ(x, ẋ)ẋ2 6 = 0, wobei wir die Bewegungsgleichung verwendet haben. Integration liefert dann E(t) − E(t0 ) = − Z t γ(x(t0 ), ẋ(t0 )) [ẋ(t0 )]2 dt0 . t0 Periodische Lösungen kann es nur geben, wenn es Zeiten T gibt zu denen E(t0 + T ) = E(t0 ) gilt. Um solch eine Situation zu erreichen, muß γ(x, ẋ) notwendigerweise Bereiche mit verschiedenen Vorzeichen haben, wie es z.B. im van der PolOszillator Gl. (3.1) der Fall ist. Die Bewegungsgleichung (3.10) ist im Allgemeinen nicht mehr auf ein Integral zu reduzieren wie es bei konservativen Systemen der Fall ist (siehe oben). Es wird sich als nützlich herausstellen, die Gleichung zweiter Ordnung in ein System von Gleichungen erster Ordnung umzuschreiben, in dem wir die Variable v = ẋ einführen ẋ = v , v̇ = F̃ (x, v) , 143 3.4. EIN TEILCHEN IN EINER DIMENSION mit F̃ (x, v) = [F (x) − γ(x, v)v]/m. Dies ist ein System nicht-linearer (für allgemeine γ(x, v)) Differentialgleichungen erste Ordnung. Die Bahnkurven im Phasenraum lassen sich daher nur in Ausnahmefällen analytisch angeben. Man kann sie jedoch geometrisch konstruieren. Um diese Konstruktion zu verstehen betrachten wir zunächst ein allgemeines System von Differentialgleichungen erster Ordnung für die Variablen x1 (t), x2 (t), . . . , xn (t) ẋi = fi (x1 (t), . . . , xn (t)) , i = 1, 2, . . . , n mit hinreichend “harmlosen” Funktionen fi . Taylorentwicklung liefert xi (t + ∆t) = xi (t) + ∆t ẋi (t) + O([∆t]2 ) = xi (t) + ∆t fi (x1 (t), . . . , xn (t)) + O([∆t]2 ) . Das “Geschwindigkeitsfeld” f~(~x) zeigt somit an, wie die zeitlich Entwicklung in einem infinitessimalen Zeitschritt weitergeht. Im obigen Fall von zwei gekoppelten Differentialgleichungen erster Ordnung kann man das “Geschwindigkeitsfeld” (Vektorfeld) für die Variablen x und v v . ~ f (x, v) = F̃ (x, v) leicht graphisch darstellen, wie wir es im Kapitel über Funktionen mehrerer Veränderlicher kennen gelernt haben. Man kann das Verhalten der Phasenraumtrajektorie dann direkt ablesen, da diese in einem Punkt (x, v)T tagential zu f~(x, v) ist. Ein Beipiel dazu ist in der folgenden Abbildung dargestellt. 2 v –2 –1 1 0 –1 –2 1 x 2 144 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Es zeigt das “Geschwindigkeitsfeld” der Phasenraumtrajektorie für das einfache (konservative γ(x, v) = 0) Problem des harmonischen Oszillators (mit F (x) = −mω02 x bzw. V (x) = mω02 x2 /2) ẋ v = v̇ −ω02 x mit ω0 = 1.3 Es ist leicht zu erkennen, daß die Phasenraumtrajektorien in diesem Fall Kreise (allgemeiner Ellipsen) sind. Kehren wir noch einmal zum allgemeinen “Geschwindigkeitsfeld” f~(~x) zurück. Oft gibt es ausgezeichnete Punkte ~x∗ für die f~(~x∗ ) = 0 gilt, d.h. keine Bewegung im Phasenraum mehr auftritt. Man nennt diese Punkte daher stationäre Punkte oder Fixpunkte. Wir werden später auf die Bewegung in der Nähe solcher Punkte zurückkommen. Zur allgemeinen Konstruktion der Phasenraumtrajektorien können wir auch den Parameter Zeit eleminieren und v als Funktion von x betrachten. Die Funktion v(x) erfüllt die Differentialgleichung4 dv F̃ (x, v) = , dx v d.h. die “Steigung” der Phasenraumtrajektorie ist durch F̃ (x, v)/v gegeben. Man betrachtet dann alle Punkte im Phasenraum mit der selben Steigung α F̃ (x, v) =α. v Die entsprechenden Kurven bezeichnet man als Isoklinen. Betrachten wir dazu das Beispiel des gedämpften harmonischen Oszillators mit der Bewegungsgleichung mẍ = F (x, v) = −mω02 x − m2γv , d.h. γ(x, v) = m2γ ≥ 0, die wir bereits im Kapitel über Systeme linearer Differentialgleichungen untersucht haben. In diesem Fall ist F̃ (x, v) = [F (x) − γ(x, v)v]/m = −ω02 x − 2γv und die Isoklinen mit F̃ (x, v) ω 2 x + 2γv =− 0 =α v v 3 4 Wir vernachlässigen die physikalischen Einheiten. Vorsicht falls v = 0 gilt! 145 3.4. EIN TEILCHEN IN EINER DIMENSION sind eine Geradenschar ω02 v=− x. α + 2γ Die folgenden Abbildung zeigt das “Geschwindigkeitsfeld” ẋ v̇ = v −ω02 x − 2γv für die Phasenraumtrajektorie für den Fall der schwach gedämpften Bewegung mit5 γ/ω0 = 0.2 und ω0 = 1. 2 v –2 1 –1 1 x 2 –1 –2 Zusätzlich sind folgend die Isoklinen (für andere Parameter) sowie eine typische Trajektorie dargestellt 5 Wir vernachlässigen erneut die physikalischen Einheiten! 146 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I α=−0.5 α=0.5 α=0 v α=−1.5 x α=−οο Auf den Isoklinen ist die Steigung α als kleiner Strich angezeigt. Die Trajektorien der schwach gedämpften Bewegung sind sogenannte logarithmische Spiralen die spiralförmig in den Ursprung laufen. Als komplexeres Beispiel diskutieren wir kurz die Phasenraumtrajektorien des Van der Pol-Oszillators Gl. (3.1). Nach entsprechender Wahl der Konstanten m, ω0 und a ist die Bewegungsgleichung von der Form ẍ + (x2 − 1)ẋ + x = 0 . Wir betrachten den Fall > 0 (für = 0 geht das System in den harmonischen Oszillator über). Das “Geschwindigkeitsfeld” der Phasenraumtrajektorie ist für ein festes > 0 in der folgenden Skizze dargestellt (wobei hier x1 = x und x01 = ẋ).6 6 Die Abbildung ist mit dem Programmpaket zur nicht-linearen Dynamik erstellt, welches Herr Maximilian Lohöfer im Rahmen seiner Bachelorarbeit geschrieben hat und welches sie im L2 P herunterladen können. 3.4. EIN TEILCHEN IN EINER DIMENSION 147 Die Phasenraumkurve, der sich die Trajektorie offensichtlich schon nach kurzer Zeit annähert und entlang der sich das System dann weiter bewegt nennt man einen Grenzzyklus (oder Attraktor). Nach Aussterben der vom Anfangspunkt abhängigen Transienten, geht der van der Pol-Oszillator für große Zeiten in eine periodische Bewegung über. Die dämpfende und verstärkende Wirkung der “Reibung” halten sich die Waage. Auf dem Grenzzyklus ist die Energie des Systems im Mittel erhalten, bzw. periodisch (siehe Seite 142). Für den van der Pool-Oszillator hängt die Form des Grenzzyklus im Phasenraum vom Parameter ab nicht jedoch von den Anfangswerten. Für kleine hat der Grenzzyklus “fast” die Form wie die Trajektorien des harmonischen Oszillators (in der obigen Abbildung ist = 5 gewählt, also ist dort nicht klein). In diesem Limes lassen sich analytische Resultate für die Bewegung gewinnen. Alle diese Aspekte der Dynamik kann man den folgenden Abblidungen für = 0.5 bzw. 5 entnehmen. Zusätztlich sind Phasenraumtrajektorien und die Funktionen x(t), ẋ(t) für verschiedene Anfangspunkte und dargestellt. Kurven unterschiedlicher Farbe entsprechen Situationen 148 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I mit unterschiedlichen Anfangsbedingungen (diese können aus dem Phasenraumdiagramm direkt abgelesen werden). An x(t) und ẋ(t) erkennt man sehr deutlich, daß die im Limes großer Zeiten periodische Bewegung (Grenzzyklus!) für “große” hochgeradig nicht-harmonisch ist (keine Sinusschwingung!). Um die Bewegung genauer zu analysieren könnte man das für hinreichend große t periodische x(t) (numerisch) in einer Fourierreihe entwickeln (Spektralanalyse). • = 0.5 3.4. EIN TEILCHEN IN EINER DIMENSION 149 • =5 Bisher haben wir Bewegungsgleichungen vom Typ mẍ = F (x, ẋ) untersucht, die als System von Differentialgleichungen erster Ordnung mit zeitunabhängigem “Geschwindigkeitsfeld” geschrieben werden können. Man bezeichnet solche als autonome Differentialgleichungssysteme (und die diesen Gleichungen zugrundeliegenden mechanischen Systeme als autonome Systeme). Im Folgenden werden wir Systeme untersuchen, in denen die Kraft von der Zeit abhängt und somit F (x, ẋ) → F (x, ẋ, t). Zeitabhängige Kräfte: Ein typisches interessantes Beispiel für ein System mit zeitabhängiger Kraft–ein getriebenes System–ist das gedämpfte (γ > 0), getrie- 150 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I bene Fadenpendel mit der Bewegungsgleichung für den Auslenkwinkel φ φ̈ + 2γ φ̇ + g sin φ = h0 cos (ωt) , R d.h. F (φ, φ̇, t)/m = −2γ φ̇ − (g/R) sin φ + h0 cos (ωt). Wie wir sehen werden führt die Erweiterung auf zeitabhängige Kräfte zu völlig neue Phänomene. So kann in Situationen, in dem das “Geschwindigkeitsfeld” der Trajektorien nicht-linear von den Variablen abhängt sogenanntes chaotisches Verhalten der Lösung auftreten. Bevor wir dazu kommen, wollen wir uns jedoch mit der einfacheren Situation des gedämpften, getriebenen harmonischen Oszillators (lineare Abhängigkeit von den Variablen) beschäftigen, dessen Dynamik für eine cosinusförmige treibende Kraft sie bereits in einer Übungsaufgabe untersucht haben. Der gedämpfte, getriebene, harmonische Oszillator: Auf einen gedämpften, harmonischen Oszillator wirke eine zeitabhängige äußere Kraft h(x, ẋ, t). Die Bewegungsgleichung ist durch (γ ≥ 0) ẍ + 2γ ẋ + ω02 x = h(x, ẋ, t) gegeben. Anhand einiger Spezialfälle wollen wir eine Reihe physikalischer Phänomene diskutieren. Dazu betrachten wir den häufig untersuchten Fall einer cosinusförmigen treibenden Kraft h(x, ẋ, t) = h0 cos (ωt + ϕ0 ), mit den Konstanten ω > 0 und ϕ0 . Für den reibungsfreien Fall γ = 0 gilt dann (ω0 > 0) ẍ + ω02 x = h0 cos (ωt + ϕ0 ) . Dies ist eine lineare, inhomogene Differentialgleichung zweiter Ordnung. Die allgemeine Lösung dieser Gleichung läßt sich als Summe der allgemeinen Lösung der homogenen Gleichung und einer speziellen (partikulären) Lösung der inhomogenen Gleichung schreiben. Die allgemeine Lösung der homogenen Gleichung ist (zwei freie Konstanten für die zwei Anfangsbedingungen) xh (t) = c1 cos (ω0 t) + c2 sin (ω0 t) . Für ω 6= ω0 liefert xp (t) = x0 cos (ωt + ϕ0 ) eine Lösung der inhomogenen Differentialgleichung, wobei x0 = h0 /(ω02 − ω 2 ) gelten muß. Die allgemeine Lösung der inhomogenen Gleichung lautet somit für ω 6= ω0 (zwei freie Konstanten für die zwei Anfangsbedingungen) x(t) = c1 cos (ω0 t) + c2 sin (ω0 t) + ω02 h0 cos (ωt + ϕ0 ) , − ω2 151 3.4. EIN TEILCHEN IN EINER DIMENSION und stellt eine Überlagerung zweier periodischer Bewegungen mit verschiedenen Frequenzen dar. Für ω dicht bei der Kreisfrequenz ω0 der freien (h0 = 0) Schwingung wird die Amplitude des dritten Summanden groß. Die folgenden Abbildungen zeigen typische Kurven x(t) mit7 c1 = 1, c2 = 0 = ϕ0 , h0 = 0.1 (durchgezogen) und h0 = 0.5 (gestrichelt) für zwei verschiedene treibende Frequenzen ω = 1/2 (kommensurabel zu ω0 = 1) und ω = 1/π (inkommensurabel). ω=1/2 2 ω=1/π 2 1 x x 1 0 0 -1 -1 0 50 100 t 150 200 -2 0 50 100 t 150 200 Der Fall, daß die treibende periodische Bewegung resonant zur freien Oszillation ist, also ω = ω0 gilt, muß getrennt behandelt werden. Für diesen liefert der Ansatz xp (t) = x0 t sin (ω0 t + ϕ0 ) eine Lösung der inhomogenen Differentialgleichung, falls x0 = h0 /(2ω0 ) gewählt wird. Die getriebene harmonische Schwingung ist somit im Resonanzfall durch (zwei freie Konstanten für die zwei Anfangsbedingungen) x(t) = c1 cos (ω0 t) + c2 sin (ω0 t) + h0 t sin (ω0 t + ϕ0 ) , 2ω0 gegeben und die Auslenkung wächst linear mit der Zeit an.8 Liegt, wie hier betrachtet, keinen Dämpfung (Reibung) vor kann es so zur so genannten Resonanzkatastrophe kommen. In einer Übungsaufgabe haben sie die Bewegungsgleichung für den gedämpften, getriebenen, harmonischen Oszillator mit der cosinusförmigen äußeren Kraft h0 cos (ωt) ẍ + 2γ ẋ + ω02 x = h0 cos (ωt) untersucht. Für den Fall schwacher Dämpfung 0 < γ ω0 haben sie die allge7 Wir vernachlässigen die physikalischen Einheiten. Mit Hilfe der l’Hospitalschen Regel läßt sich der Resonanzfall auch direkt aus der Lösung für |ω| 6= |ω0 | extrahieren. Diese Vorgehensweise geht jedoch über die hier zur Verfügung gestellten mathematischen Methoden hinaus. 8 152 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I meine Lösung x(t) = e−γt [c1 cos (ω0 t) + c2 sin (ω0 t)] + p h0 (ω02 − ω 2 )2 + 4γ 2 ω 2 cos (ωt − δ)(3.11) mit δ = arctan 2γω − ω2 ω02 bestimmt. In der gegebenen Form enthält die Lösung noch eine kleine Inkonsistenz, da wir in der Lösung der homogenen Gleichung konsequent Terme der Ordnung (γ/ω0 )2 vernachlässigt haben (Grenzfall schwacher Dämpfung), nicht jedoch in der Lösung der inhomogenen Gleichung. Diese läßt sich leicht korrigieren, in dem man in der Gleichung für die Eigenwerte (2.49) nicht pnach γ/ω0 entwickelt. Man erhält dann erneut Gl. (3.11) jedoch mit ω0 → ω̃0 = ω02 − γ 2 in den Argumenten der Cosinus- und Sinusfunktion der ersten beiden Summanden. Durch die Dämpfung wird die Eigenfrequenz der freien Oszillation reduziert (die Periodendauer wird verlängert). Das war intuitiv zu erwarten, da die Reibung die Bewegung hemmt. Die Dämpfung führt dazu, daß die Resonanz “ausgeschmiert” wird und die Amplitude des letzten Terms auch für ω0 = ω nicht mehr unbeschränkt mit der Zeit anwächst. Als Funktion der Kreisfrequenz der treibenden Kraft ω ist diese Amplitude eine “scharf” um ω0 herum zentrierte Funktion. Für ω/ω0 1 fällt sie wie ω −2 ab. Für Zeiten t γ −1 können die ersten beiden Terme vernachlässigt werden und die Masse schwingt mit der Kreisfrequenz der treibenden Kraft. Im Phasenraum gehen die Trajektorien für große t gegen einen ellipsenförmigen Grenzzyklus. Für kleinere Zeiten findet man transientes Verhalten in Form eines Einschwingvorgangs. Zur Vorbereitung auf spätere Überlegungen wollen wir die Amplitude der Oszillation des schwach gedämpften (0 < γ ω0 ), getriebenen harmonischen Oszillators nach Abklingen des Einschwingvorgangs A= p h0 (ω02 − ω 2 )2 + 4γ 2 ω 2 genauer betrachten. Dazu beschränken wir uns auf den Bereich in der Nähe der Resonanz mit ω ≈ ω0 . In diesem Fall gilt für das Amplitudenquadrat h20 [(ω0 − ω)(ω0 + ω)]2 + 4γ 2 ω 2 h20 ≈ [(ω0 − ω)2ω0]2 + 4γ 2 ω02 (h0 /[2ω0])2 , = (ω0 − ω)2 + γ 2 A2 = (3.12) 153 3.4. EIN TEILCHEN IN EINER DIMENSION was als Funktion von ω eine Lorentzkurve um ω0 darstellt. Die folgende Abbildung zeigt den typischen zeitlichen Verlauf von x(t) des schwach gedämpften, getriebenen harmonischen Oszillators für9 ω0 = 1, γ = 0.1, c1 = 1, c2 = 0, h0 = 0.2 und ω = 1/π (weg von der Resonanz!). ω=1/π 1 x 0.5 0 -0.5 0 20 40 t 60 80 100 Noch einmal anharmonische Schwingungen: In unseren bisherigen Überlegungen zu anharmonischen Schwingungen, sind wir auf die Details der Bewegung (volle Zeitabhängigkeit) noch nicht eingegangen. Bevor wir daher zu getriebenen, anharmonischen Schwingungen kommen, wollen wir dies teilweise nachholen. Der Grund dafür, daß wir die Diskussion bis zu diesem Punkt verschoben haben, liegt darin, daß uns in der Analyse Differentialgleichungen begegnen werden, die mit dem, was wir im Abschnitt über den gedämpften, getriebenen, harmonischen Oszillator kennen gelernt haben, sehr einfach zu lösen sind. Wir betrachten also den Fall, daß die “Zusatzkraft” h(x, ẋ, t) zeitunabhängig ist und die Form h(x) = f (x)/m hat, d.h. die Differentialgleichung ẍ + ω0 x = f (x)/m. Weiterhin sei die Zusatzkraft “klein”, d.h. es gelte 0 < 1. Wir untersuchen somit erneut die ungedämpfte Bewegung eines Teilchens in einem Potential, das im Bereich kleiner |x| nur schwach vom harmonischen Potential abweicht und dessen Gesamtenergie (konservatives System, die Gesamtenergie ist erhalten!) nur leicht oberhalb des Minimums des Potentials bei x = 0 liegt. Aus unseren obigen Überlegungen ist klar, daß das Teilchen eine periodische Bewegung ausführen wird, diese im Allgemeinen jedoch nur durch numerische Integration zu gewinnen ist. Hier werden wir anders vorgehen und versuchen eine Lösung als Potenzreihe in 9 Die physikalischen Einheiten werden vernachlässigt. 154 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I zu konstruieren (0 < 1) x(t) = x0 (t) + x1 (t) + 2 x2 (t) + . . . , mit zu bestimmennden Funktionen xi (t), i = 0, 1, 2, . . .. Dieses Vorgehen bezeichnet man als Störungstheorie. Verfahren dieser Art spielen in allen Teilbereichen der Physik eine extrem wichtige Rolle. Wir wollen die Prozedur anhand des konkreten Beispiels mit quartischem Zusatzterm zum Potential bx4 /4 (bzw. kubischer Zusatzkraft −bx3 ) einführen. Dabei kann b positive oder negative Werte annehmen, wobei letzteres der Fall ist, wenn das Fadenpendel bei kleinen Auslekungen betrachtet wird. Einsetzen der Potenzreihenentwicklung in die Bewegungsgleichung ẍ + ω02 x = −bx3 /m liefert (ẍ0 + ω02x0 ) + (ẍ1 + ω02x1 ) + . . . = − b 3 x + ... , m 0 wobei die Punkte für Terme stehen, die mindestens von der Größenordnung 2 sind. Man kann jetzt die Terme zu gleichen Potenzen in gleich setzen (Koeffizientenvergleich; siehe Mathematikteil) und erhält bis zur Ordnung ẍ0 + ω02x0 = 0 ẍ1 + ω02x1 = − b 3 x . m 0 Um beispielsweise das Anfangswertproblem mit x(0) = A, ẋ(0) = 0 zu lösen, berechnet man zunächst x0 (t) aus der ersten Gleichung und dann x1 (t) mit Hilfe der zweiten. Für die vorgegebenen speziellen Anfangsbedingungen gilt x0 (t) = A cos (ω0 t) . Wegen cos3 y = [cos (3y) + 3 cos y]/4 folgt als Gleichung für x1 (t) ẍ1 + ω02x1 = − A3 b [cos (3ω0 t) + 3 cos (ω0 t)] . 4m Sie ist von dem Typ, der bei der Lösung der getriebenen harmonischen Bewegung auftritt, hier jedoch mit zwei cosinusförmigen Inhomogenitäten. Mit der oben diskutierten allgemeinen Lösung und den Anfangsbedingungen x1 (0) = 0, ẋ1 (0) = 0 (“echte” Anfangsbedingungen sind schon durch x0 (0) und ẋ0 (0) realisiert) folgt x1 (t) = 3A3 b A3 b t sin (ω0 t) . [cos (3ω t) − cos (ω t)] − 0 0 32mω02 8mω0 Durch die “resonante” Inhomogenität ∼ cos (ω0 t) ist dabei der mit der Zeit linear anwachsende Term (sogenannter säkularer, d.h. nicht-periodischer Term) entstanden. Das Auftreten dieses Terms steht im Widerspruch zu dem Ergebnis, 155 3.4. EIN TEILCHEN IN EINER DIMENSION daß die durch x(t) = x0 (t) + x1 (t) + . . . beschriebene Bewegung periodisch sein muß. Historisch trat ein ähnliches Problem in der Himmelsmechanik auf, als man versuchte kleine Korrekturen zu den Planetenbahnen zu berechnen. Man könnte damit geneigt sein, das vorgeschlagene Vorgehen (Störungstheorie) als unbrauchbar zu verwerfen. Es ist jedoch leicht zu verstehen, wie es zu dem in t linearen Term kommt und es gibt eine etablierte Prozedur sein Auftreten zu verhindern. Der Grund für das Auftreten des säkularen Terms ist die Verschiebung der Kreisfrequenz der periodischen Bewegung Gl. (3.9) durch die Zusatzkraft, die ebenfalls von der Ordnung ist. Man kann sein Auftreten verhindern, in dem man vor der Analyse eine Skalentransformation ausführt, d.h. von der Variablen t zu u = νt, mit der noch zu bestimmenden Kreisfrequenz ν übergeht. Diese wird die Bedeutung der exakten Schwingungsfrequenz annehmen. Wir betrachten also die Funktion g(u) = g(νt) = x(t) , die wegen (Kettenregel; Strich bedeutet Ableitung nach u) ẋ(t) = g 0 (u) du = ν g 0(u) , dt ẍ(t) = ν 2 g 00 (u) der Differentialgleichung (mit allgemeiner Zusatzkraft f ) ν 2 g 00(u) + ω02 g(u) = f (g(u))/m genügt. Wie zuvor entwickelt man g(u) in einer Potenzreihe in g(u) = g0 (u) + g1 (u) + 2 g2 (u) + . . . und zusätzlich auch ν ν = ω0 + ν1 + 2 ν2 + . . . , wobei wir bereits ausgenutzt haben, daß zu nullter Ordnung in , ν = ω0 gilt. Entwickelt man g und ν bis zur Ordnung erhält man nach Einsetzen der Entwicklungen in die Bewegungsgleichung für g(u) (ω02 + 2ω0 ν1 )(g000 + g100 ) + ω02(g0 + g1 ) = f (g0 )/m . Koeffizientenvergleich liefert dann für unser konkretes Beispiel der kubischen Zusatzkraft ω02(g000 + g0 ) = 0 ω02 (g100 + g1 ) + 2ω0 ν1 g000 = − b 3 g . m 0 156 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Unter Berücksichtigung der obigen Anfangsbedingungen folgt für g0 (u) die Lösung g0 (u) = A cos u . Eingesetz in die zweite Gleichung ergibt sich ω02(g100 3A3 b A3 b + g1 ) = 2ω0 ν1 A − cos u − cos (3u) . 4m 4m Der “resonannte” Summand ∼ cos u würde nun erneut zu einem säkularen Term führen, den wir jedoch durch die geeignete Wahl von ν1 unterdrücken können. Wir wählen daher 2ω0 ν1 A − 3A2 b 3A3 b = 0 ⇒ ν1 = . 4m 8mω0 Die verbleibenden Gleichung lösen wir wie zuvor und erhalten g1 (u) = A3 b [cos (3u) − cos u] . 32mω02 Zusammengenommen erhalten wir ausgedrückt durch die Variable t bis zur Ordnung A3 b 3A2 b A2 b cos (νt) + cos (3νt) ; ν = ω0 1 + . x(t) = A 1 − 32mω02 32mω02 8mω02 Die Bewegung ist jetzt periodisch, wie es zu fordern war. Dabei tritt die Grundfrequenz ν aber auch die höhere Harmonische 3ν auf. Die Verschiebung der Kreisfrequenz zur Ordnung ist identisch zu der in Gl. (3.9) bestimmten wenn man die lineare Kraft über die Wahl c = mω02 gleich wählt und für die kubische Kraft über b = 4χ. Die Abschätzung des Fehlers, den man bei der obigen Prozedur macht stellt sich als erstaunlich komplex heraus und wir wollen diese Frage hier nicht weiter untersuchen. Wir nehmen den pragmatischen Standpunkt ein, daß der Vergleich der numerische Lösung der vollen Bewegungsgleichung mit kubischer Zusatzkraft mit der obigen Näherung sich für kleine als sehr gut herausstellt und wir mit der Näherung daher eine gute analytische Approximation gefunden haben. Wir gehen nun zur Bewegung mit nicht-linearer “Rückstellkraft”, Dämpfung und cosinusförmigen treibenen Kraft über. Resonanz in gedämpften, getriebenen, nicht-linearen Systemen: Die Physik der gedämpftem, getriebenen, nicht-linearen mechanischen Systeme ist sehr reichhaltig. Wir werden zunächst von einer allgemeinen Perspektive aus das 3.4. EIN TEILCHEN IN EINER DIMENSION 157 Phänomen der Resonanz in nicht-linearen Systemen betrachten. Wir hatten gesehen, daß das Amplitudenquadrat der schwach gedämpften, cosinusförmig getriebenen harmonischen Oszillation nach dem Einschwingvorgang und für ω ≈ ω0 näherungsweise durch (siehe Gl. (3.12); f = h0 /[2ω0 ]) A2 ≈ f2 (ω − ω0 )2 + γ 2 gegeben ist. Weiterhin haben wir uns davon überzeugt, daß bei Vorliegen einer Anharmonizität die Frequenz der Bewegung von der Amplitude der Auslenkung abängt und sich im Spezialfall einer “kleinen” (führende Ordnung) kubischen “Zusatzkraft” gemäß (siehe Gl. (3.9)) ω0 → ω0 + κA2 verschiebt, wobei κ positive und negative Werte annehmen kann. Um ein Verständnis von Resonanz bei nicht-linearen Systemen zu erhalten machen wir die intuitive Näherung A2 = f2 , (ω − ω0 − κA2 )2 + γ 2 in dem wir ω0 durch die neue amplitudenabhängige Resonanzfrequenz ersetzen. Aus dieser impliziten Gleichung muß nun A2 (ω) bestimmt werden. Am Einfachsten geht das, in dem wir zunächst nach ω − ω0 aufösen p ω − ω0 = κA2 ± (f /A)2 − γ 2 . Um reelle ω − ω0 zu erhalten muß A2 ≤ (f /γ)2 gelten, was bei hinreichend schwacher Dämpfung (kleine γ) sicherlich erreicht werden kann. Man kann nun ω −ω0 als Funktion von A2 zeichnen. Dazu führen wir die dimensionslosen Größen x = (ω−ω0 )/γ, y = (Aγ/f )2 und η = f 2 κ/γ 3 ein, wodurch sich die darzustellende Gleichung zu p x = ηy ± 1/y − 1 vereinfacht. Dabei ist η (über κ) ein Maß für die Nichtlinearität der Schwingung. Die Gleichung ist in der folgenden Abbildung für drei Werte von η ≥ 0, η = 0 (gepunktet; harmonischer Oszillator), η = 1 (gestrichelt) und η = 4 (durchgezogen) dargestellt. 158 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I C 1 B 0.8 y 0.6 0.4 D 0.2 A 0 -4 E -2 0 x 2 4 Für eine hinreichend große Nichtlinearität gibt es einen Bereich mit drei Lösungen für A(ω)2 (Bereich zwischen den vertikalen Linien). Anders ausgedrückt, gibt es für treibende Frequenzen in diesem Bereich drei Grenzzyklen (Attraktoren). Welcher erreicht wird, hängt von den Anfangswerten ab. Der Kurvenabschnitt CD entspricht dabei einem instabilen Attraktor. Man kann das Auftreten zweier stabiler Werte für die Amplitude auch als Abhängigkeit von der Vorgeschichte des Systems verstehen. Wir betrachten dazu ein “Experiment” in dem die Frequenz ω (d.h. x) der treibenden Kraft zeitlich langsam erhöht wird. Beginnt man beim Punkt A, so wandert man über B zum Punkt C. Bei weiterer Erhöhung ändert sich die Amplitude der Bewegung schlagartig und “fällt” auf den Punkt E. Von dort an geht es auf der unteren Kurve weiter. In umgekehrte Richtung bleibt die Amplitude bis zum Punkt D auf der unteren Kurve, springt dann zu B und nimmt anschließend entlang der Kurve von B nach A ab. In der Vorlesung wird eine Simulation gezeigt,10 die das Beschriebene für den ersten Pfad (beginnend bei A) verdeutlicht. Verglichen zu dem Verhalten im Fall der nicht-linearen Schwingung ist das ebenfalls dargestellte Verhalten im cosinusförmig getriebenen, gedämpften, harmonischen Oszillator recht langweilig. Ein in der Simulation (Programmpaket von Herr Lohöfer; siehe L2 P) “gemessenes” Diagramm der Amplitude gegenüber der Frequenz der treibenden Kraft ist folgend dargestellt. Es zeigt das aus unserer analytischen Rechnung extrahierte Verhalten. 10 Zu finden ist diese unter http://www.physik.uni-oldenburg.de/ftheorie/polley/VL/Animationen/Duffing.html. Eine weitere Simulation dazu findet sich im Programmpaket von Herrn Lohöfer (siehe L2 P). 3.4. EIN TEILCHEN IN EINER DIMENSION 159 Es sei hier noch erwähnt, daß man den cosinusförmig getriebenen, gedämpften Oszialltor mit kubischer “Zusatzkraft” (quartischer Anharmonizität im Potential) als Duffing-Oszillator bezeichnet. Hin zum Chaos: Um einen Eindruck von der Reichhaltigkeit nicht-linearer getriebener Systeme zu bekommen, betrachten wir abschließend das gedämpfte, cosinusförmig getriebene Fadenpendel, dessen Auslenkwinkel der Bewegungsgleichung (siehe oben) φ̈ + 2γ φ̇ + g sin φ = h0 cos (ωt) , R folgt. Zunächst führen wir erneut eine Skalentransformation aus θ(u) = θ(τ t) = φ(t) , woraus sich die Gleichung (Strich entspricht Ableitung nach u) τ 2 θ00 + 2γτ θ0 + g sin θ = h0 cos (ωu/τ ) , R ergibt. Durch die Wahl τ 2 = g/R folgt θ00 + θ0 /q + sin θ = g̃ cos (ωD u) , wodurch wir einen der Parameter eleminiert haben. Dabei ist q = τ /(2γ) ein Maß für die Reibung, wobei diese Abnimmt, wenn q zunimmt, g̃ = h0 /τ 2 ein Maß für die Amplitude der treibenden Kraft und ωD = ω/τ ein Maß für deren Frequenz. 160 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Im Folgenden bezeichnen wir die skalierte Zeit wieder mit t und die dimensionlose Amplitude der treibenden Kraft mit g (statt g̃). Für allgemeinen Parameter kann man die Bahnkurve θ(u) und die Phasenraumtrajektorie nur noch durch numerische Integration bestimmen. Geschrieben als ein System zweier Differentialgleichungen erster Ordnung gilt mit Ω = θ0 θ0 = Ω , Ω0 = −Ω/q − sin θ + g cos (ωD u) . Im Folgenden beschränken wir uns auf die Situation mit ωD = 2/3 und q = 2. Die Amplitude der treibenden Kraft g wird im Bereich um g = 1 herum gewählt. Selbst unter diesen Einschränkungen zeigt sich bereits die Reichhaltigkeit der Bewegungsformen der nicht-linearen, getriebenen Schwingungen. Für g / 1 wird die Bewegung nach dem Einschwingvorgang periodisch mit einer durch ωD gegebenen Frequenz. Im Phasenraum laufen alle Trajektorien auf einen geschlossenen Grenzzyklus. In den folgenden Abbildungen (g = 0.9) ist einerseits der Winkel θ als Funktion der Zeit t und andererseits eine Phasenraumtrajektorie dargestellt. Bei beiden Graphen ist die Anfangszeit ta bei der die Darstellung beginnt so gewählt, daß alle Einschwingvorgänge bereits abgeschlossen sind, d.h. eine periodische Bewegung (Grenzzyklus im Phasenraum) erreicht ist. Die Lösung der Differentialgleichung beginnt bei t = 0 mit den Anfangsbedingungen θ = 0 = θ0 . Für etwas größere g ist die Bewegung nach Aussterben der Transienten weiterhin periodisch, jedoch mit einer Periode, die doppelt so groß ist wie die der treibenden Kraft. Diese Situation ist in den folgenden Abbildung (g = 1.07) dargestellt (Winkel als Funktion der Zeit und Phasenraumtrajektorien nach Abklingen der Transienten; Anfangsbedingungen wie oben). 3.4. EIN TEILCHEN IN EINER DIMENSION 161 Die Periodenverdopplung ist in der Amplitude der Auslenkung (abwechselnde maximale Auslenkung) zu erkennen. Um diese besser herauszuarbeiten, führen wir eine neue Darstellungsform der Bewegung ein, den Poincaré-Schnitt. Bei diesem erstellt man ein stroboskopisches Bild der Phasenraumtrajektorie. Sinnvollerweise wählt man in unserem Beispiel T = 2π/ωD als Zeitabstand zwischen zwei Bildern. Im ersten Fall der periodischen Bewegung mit Frequenz ωD (nach Abklingen der Transienten) fallen alle Bilder aufeinander und der Poincaré-Schnitt besteht aus einem Punkt. Nach der Periodenverdopplung besteht er aus zwei Punkten. Dies ist in den folgenden Abbildungen für die obigen g gegenüber gestellt. Im Winkel wurde dabei modulo 2π gerechnet, d.h. alles auf Intervall (−π, π] zurückgefaltet. Vergrößert man g weiter (genauer 1.085 < g < 1.11), so geht die Bewegung in ein Regime über, welches man als chaotisch bezeichnet. Die Zeitabhängigkeit 162 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I des Winkels sieht in diesem Fall erratisch aus, die Phasenraumtrajektorien (auf (−π, π] zurückgefaltet) sind komplex und der Poincaré-Schnitt besteht aus unendlich vielen Punkten und ist selbstähnlich. Letzteres bedeutet, daß ein vergrößerter Teilausschnitt der Struktur, der ursprünglichen ähnlich sieht. Die Punktmenge nennt man ein Fraktal. Die folgenden Abbildungen zeigen die diskutierten Punkte für g = 1.15 (wo das System ebenfalls chaotisch ist). Wenn man g weiter erhöht, treten abwechselnd periodische und chaotische Bereiche auf. In den periodischen Bereichen gibt es neben den Periodenverdoppelungen auch Periodenvervierfachungen. Der Poincaré-Schnitt für solch eine Situation (g = 1.47) ist in der folgenden Abblidung dargestellt. 3.5. KRUMMLINIGE KOORDINATEN 163 Für g > 1.497 gibt es nur noch chaotische Bewegungen. Alle obigen Abbildungen wurden mit dem Programmpaket von Herrn Lohöfer (siehe L2 P) erstellt. In der Vorlesung wird das gerade diskutierte zusätzlich anhand von Simulationen zur Bewegung des gedämpften, getriebenen Fadenpendels veranschaulicht. Diese kann man ebenfalls mit dem Programmpaket von Herrn Lohöfer erstellen. Es bietet sich an, mit diesem “herumzuspielen”, um die Reichhaltigkeit der Dynamik der hier besprochenen nicht-linearen Systeme besser zu verinnerlichen. Nach diesem Ausflug in moderne Aspekte der klassischen Mechanik (nichtlineare Systeme, Chaos-Theorie) wollen wir zu konventionellerem Stoff einer Mechanikvorlesung zurückkehren und gehen zu zweidimensionalen Bewegungen eines Teilchens über. 3.5 Krummlinige Koordinaten Schon anhand des (scheinbar) einfachen Falls der eindimensionalen Bewegung eines Teilchens in einem konservativen Kraftfeld haben wir gesehen, daß sich die Newtonsche Gleichung meist nur numerische lösen läßt. Betrachtet man die Bewegung eines Teilchens welches einer konservativen Kraft ausgesetzt ist in zwei Dimensionen, so verschärft sich diese Problematik weiter. Die zwei gekoppelten Differentialgleichungen zweiter Ordnung, bzw. das äquivalente System von vier Gleichungen erster Ordnung, lassen sich für ein allgemeines Potential V (x1 , x2 ) nur numerisch lösen. Eine geschlossene analytische Lösung gelingt in dem Fall, daß V eine quadratische Form V (x1 , x2 ) = 2 1 X xi ai,j xj 2 i,j=1 164 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I ist, eine Situation, die uns an den harmonischen Oszillator in einer Dimension erinnert. Wir werden darauf später zurück kommen. Ein weitere Klasse von Kräften, für die die Bewegungsgleichungen auf einfache Integrale reduziert werden kann (d.h. die geschlossen integrierbar sind), p 2 2 sind Zentralfelder, in denen V nur von r = |~r| = x1 + x2 abhängt. In diesem Fall ist die Verwendung kartesischer Koodinaten umständlich. Es ist besser ebene Polarkoordinaten x1 = r cos φ , x2 = r sin φ zu verwenden, die uns bereits im Beispiel des Fadenpendels begegnet sind. Weiterhin haben sie in einer Übungsaufgabe dreidimensionale Kugelkoordinaten kennen gelernt. Aufbauend darauf wollen wir hier gleich etwas allgemeiner vorgehen und führen sogenannte krummlinige Koordinaten für zwei- oder dreidimensionale Räume ein. Diese werden sich häufig als sehr nützlich bei der Lösung mechanischer Probleme erweisen und ermöglichen es uns einen ersten Kontakt zum Lagrange Formalismus herzustellen. Ausgangspunkt ist unser kartesisches Koordinatensystem [0; ~e1 , . . . , ~ed ] mit (d = 2, 3) ~r = d X xi~ei . i=1 Die eindimensionalen geometrischen Objekte die entstehen, wenn man eine der Koordinaten xi variiert, während die anderen festgehalten werden sind Geraden (“xi -Kurven”). Zeichnet man solche Geraden in einem festen Abstand ∆xi so entsteht ein Koordinatennetz. Dies ist für d = 2 in der folgenden Abbildung dargestellt. x2 e2 e1 x1 Alternativ können wir den Raum mit einem Netz krummliniger Koordinaten überziehen, die wir allgemein mit qi (i = 1, 2 bzw. i = 1, 2, 3) bezeichnen. Die 165 3.5. KRUMMLINIGE KOORDINATEN “geraden xi -Kurven” werden dann durch qi -Kurven ersetzt. Für den Fall der ebenen Polarkoordinaten (q1 = r, q2 = φ) ist dies in der folgenden Skizze dargestellt. x2 x1 Die r-Kurven (entlang derer φ konstant ist) sind Geraden die durch den Ursprung gehen und die φ-Kurven (entlang derer r konstant ist) konzentrische Kreise um den Ursprung. Das krummlinige Koordinatensystem ist durch die Vorgabe der Funktionen (hier d = 3) xi = xi (q1 , q2 , q3 ) , i = 1, 2, 3 bzw. der Umkehrfunktionen qi = qi (x1 , x2 , x3 ) , i = 1, 2, 3 1 ,x2 ,x3 ) gegeben, wobei wir annehmen, daß die Funktionaldeterminante ∂(x höchstens ∂(q1 ,q2 .q3 ) in speziellen Punkten Null werden kann (bei Polar- und Kugelkoordinaten z.B. im Ursprung). Damit ist die (lokale) Umkehrbarkeit bis auf diese Punkte gesichert (siehe Mathematikteil). In einem gegebenen Punkt P (durch (x1 , x2 , x3 ) oder (q1 , q2 , q3 ) festgelegt) definieren wir nun Basisvektoren ~gi (P ) mittels ~gi (P ) = ∂~r , ∂qi (3.13) die die qi -Kurven im Punkt P tangieren. Zu jedem Punkt P (q1 , q2 , q3 ) gehört somit ein “Vektordreibein” ~gi (q1 , q2 , q3 ), welches die qi -Koordinatenkurven tangiert. Die so definierten ortsabhängigen Basissysteme sind im Allgemeinen nicht orthonormiert! 166 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Wir wollen uns diese Konstruktion anhand des Beispiels der ebenen Polarkoordinaten verdeutlichen. Es gilt ∂~r ∂ = (r cos φ ~e1 + r sin φ~e2 ) ∂r ∂r = cos φ ~e1 + sin φ ~e2 = ~r/r = ~rˆ , ∂ ∂~r = (r cos φ ~e1 + r sin φ ~e2 ) = ∂φ ∂φ = −r sin φ ~e1 + r cos φ ~e2 = r [cos (φ + π/2) ~e1 + sin (φ + π/2) ~e2 ] ~ˆ , = rφ ~g1 = ~g2 ~ˆ (siehe Abschnitt wobei wir die beiden orthonormierten Einheitsvektoren ~rˆ und φ über das Fadenpendel) eingesetzt haben und ausgenutzt haben, daß ~ˆ = cos (φ + π/2) ~e1 + sin (φ + π/2) ~e2 . φ Wie man nun sieht, sind ~g1 und ~g2 im vorliegenden Beispiel zwar noch orthogonal, ~ˆ nicht auf Eins normiert. aber g2 ist im Gegensatz zu φ Als nächstes wollen wir die Frage beantworten, ob es sich bei den ~gi allgemein um linear unabhängige Vektoren handelt und sie damit überhaupt eine Basis bilden. Für den Fall der ebenen Polarkoordinaten haben wir uns bereits davon überzeugt (die ~gi stehen in diesem Beispiel senkrecht aufeinander). Allgemein betrachten wir dazu d d X ∂~r ∂ X ∂xj ~gi = = ~ej xj ~ej = ∂qi ∂qi j=1 ∂qi j=1 und können schließen, daß die Basisvekoren genau dann linear unabhängig sind, wenn die Funktionaldeterminante von Null verschieden ist, was wir (bis auf spezielle Punkte) angenommen haben. Um die Umkehrrelation (Entwicklung von ~ei nach den ~gj ) zu bestimmen betrachten wir d d X ∂~r ∂qj X ∂qj ∂~r = = ~gj . ~ei = ∂xi ∂qj ∂xi ∂xi j=1 j=1 In ihr tritt somit die Inverse der Matrix mit den Matrixelementen ∂qj /∂xi auf. Wie man leicht nachrechnet, ergeben sich für Kugelkoordinaten mit x1 = r sin θ cos φ , x2 = r sin θ sin φ , x3 = r cos θ 3.5. KRUMMLINIGE KOORDINATEN 167 die zwar paarweise senkrechten aber nicht auf Eins normierten Basisvektoren ~g1 = ~gr = sin θ cos φ ~e1 + sin θ sin φ ~e2 + cos θ ~e3 = ~er , ~g2 = ~gθ = r cos θ cos φ ~e1 + r cos θ sin φ ~e2 − r sin θ ~e3 = r~eθ , ~g3 = ~gφ = −r sin θ sin φ ~e1 + r sin θ cos φ ~e2 = r sin θ ~eφ , wobei wir die orthonormierten Vektoren ~er , ~eθ , ~eφ eingeführt haben, die sie in einer Übungsaufgabe kennen gelernt haben (selbe Notation). Um die Länge der Basisvekoren und deren paarweise Winkel zu bestimmen betrachten wir die Skalarprodukte gi,j d d X X ∂xk ∂xk ∂xl ∂xk ~ek · ~el = . = ~gi · ~gj = ∂q ∂q ∂q i j i ∂qj k=1 k,l=1 Man nennt die Matrix G mit den Matrixelementen gi,j den Metriktensor. Dieser wird in späteren Überlegungen eine wichtige Rolle spielen. Unsere Überlegungen zu krummlinigen Koordinaten wollen wir dazu benutzen eine alternative Formulierung der Newtonschen Gleichung zu finden. Wir wollen dazu zunächst den Geschwindigkeitsvektor ~v (t) = ~r˙ (t) durch die q̇i und ~gi ausdrücken. Dazu betrachten wir d d X X ∂~r ~v (t) = q̇i = q̇i ~gi . ∂qi i=1 i=1 Betrachtet man ~v nun als Funktion der qi und q̇i so folgt ∂~v = ~gi , ∂ q̇i (3.14) ein Ergebnis, welches wir gleich benutzen werden. Wir betrachten die Newtonsche Gleichung für ein Teilchen p~˙ = F~ . Um aus dieser die Gleichungen für die kartesischen Koordinaten x1 , x2 , x3 zu erhalten, können wir sie mit ~ei skalar multiplizieren. Um die Newtonschen Gleichungen für die krummlinigen Koordinaten zu erhalten, gehen wir analog vor, müssen aber beachten, daß die Basisvektoren ~gi zeitabhängig sind. Es gilt m~gi · d~v = ~gi · F~ . dt Wir addieren auf beiden Seiten den Term m~g˙ i · ~v und erhalten so m d (~gi · ~v) = ~gi · F~ + m~v · ~g˙ i . dt 168 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Auf der linke Seite dieser Gleichung verwenden wir Gl. (3.14) und auf der rechten Gl. (3.13) was auf d ∂~r d ∂~v · ~v = ~gi · F~ + m~v · m dt ∂ q̇i dt ∂qi führt. Im zweiten Summanden auf der rechten Seite können wir die Reihenfolge der Ableitung nach t und der partiellen Ableitung nach qi vertauschen, da d d X ∂ 2~r X ∂ d ∂~r ∂ ˙ = q̇j = (~gj q̇j ) = ~r . dt ∂qi ∂qj ∂qi ∂qi ∂qi j=1 j=1 Damit ergibt sich für die obige Gleichung ∂~v d ∂~v · ~v = ~gi · F~ + m~v · . m dt ∂ q̇i ∂qi Die Terme, die die Geschwindigkeit enthalten, können wir als partielle Ableitungen der kinetischen Energie T = mv 2 /2 schreiben ∂T d ∂T = ~gi · F~ + . (3.15) dt ∂ q̇i ∂qi Dies ist eine sehr bequeme Schreibweise der Newtonschen Gleichung in krummlinigen Koordinaten. Betrachten wir den Fall, daß die qi die kartesischen xi sind, also qi = xi , so ergeben sich aus dieser Gleichung die gewöhnlichen Bewegungsgleichungen der kartesischen Koordinaten, da ∂T ∂T = = mvi ∂ q̇i ∂vi und ∂T ∂T = =0. ∂qi ∂xi In allgemeinen krummlinigen Koordinaten gilt d d m 2 m X m X T = (q̇i~gi ) · (q̇j ~gj ) = gi,j q̇i q̇j , v = 2 2 i,j=1 2 i,j=1 d X ∂T = m gi,j q̇j . ∂ q̇i j=1 mit den Komponenten gi,j des Metriktensors. 3.6. ZWEIDIMENSIONALE ZENTRALFELDER 169 Für den Fall eines konservativen Kraftfeldes kann der Term in Gl. (3.15) der die Kraft enthält umgeschrieben werden ~ ~r V · ~gi · F~ = −∇ ∂~r ∂V =− , ∂qi ∂qi und somit d dt ∂T ∂ q̇i = ∂(T − V ) . ∂qi Da das Potential nicht von den q̇i abhängt können wir d ∂L ∂L = , L= T −V dt ∂ q̇i ∂qi (3.16) schreiben. Dies ist die Lagrange-Form der Bewegungsgleichung, die wir später ausführlich diskutieren werden. Man bezeichnet L = T − V als die Lagrangefunktion. Die Größe pi = ∂L/∂ q̇i heißt der kanonische Impuls. Für kartesische Koordinaten wird der kanonische Impuls gleich dem gewöhnlichen Impuls. 3.6 Zweidimensionale Zentralfelder Wir wollen nun das Problem der zweidimensionalen Bewegung p eines Teilchens in einem konservativem Zentralfeld mit Potential V (r), r = x21 + x22 untersuchen. Dazu verwenden wir als krummlinige Koordinaten die ebenen Polarkoordinaten, folgen aber im Gegensatz zu dem Abschnitt über des Fadenpendel dem allgemeinen Formalismus den wir gerade entwickelt haben. Die Basisvektoren sind nach den obigen Überlegungen ~g1 = ~gr = cos φ ~e1 + sin φ ~e2 , ~g2 = ~gφ = −r sin φ ~e1 + r cos φ ~e2 und für die Komponenten des Metriktensors ergibt sich g1,1 = 1 , g2,2 = r 2 , g1,2 = g2,1 = 0 . Die Außerdiagonalelemente verschwinden, da die Basisvektoren in diesem Fall senkrecht aufeinander stehen (siehe oben). Damit folgt für die kinetische Energie in Polarkoordinaten T = d m m X q̇i q̇j gi,j = (ṙ 2 + r 2 φ̇2 ) . 2 i,j=1 2 170 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Um die Bewegungsgleichungen in der Lagrange-Form zu bekommen, benötigen wir die folgenden partiellen Ableitungen ∂T ∂T ∂T ∂T = mṙ , = mr φ̇2 , =0. = mr 2 φ̇ , ∂ ṙ ∂r ∂φ ∂ φ̇ Mit diesen ergeben sich die zwei Bewegungsgleichungen d ∂V (mṙ) = mr̈ = mr φ̇2 − dt ∂r ∂V d (mr 2 φ̇) = − . dt ∂φ Der erste Term auf der rechten Seite der Gleichung für r̈ ist die Zentrifugalkraft die wir im nächsten Semester in dem Kapitel über beschleunigte Bezugssysteme ausführlich diskutieren werden. Für Zentralfelder gilt ∂V /∂φ = 0 und die zweite Gleichung liefert die Erhaltungsgröße11 mr 2 φ̇ = const. = l . Die Größe r 2 φ̇ hat (für l 6= 0) eine geometrische Bedeutung, die wir uns veranschaulichen wollen. Die im Zeitintervall [t0 , t] vom Ortsvektor ~r(t) überstrichene Fläche bezeichnen wir mit S(t). Die überstrichene Fläche für ein Zeitintervall der Größe ∆t ist ∆S = S(t + ∆t) − S(t). Diese ist in der folgenden Skizze dargestellt. r(t)∆φ r(t+∆ t) ∆φ r(t) In führender Ordnung in ∆t gilt 1 1 ∆S = r r φ̇∆t + O([∆t]2 ) = r 2 φ̇∆t + O([∆t]2 ) 2 2 Mit dem obigen Erhaltungssatz ergibt sich, daß die Flächengeschwindigkeit dS/dt zeitlich konstant ist 1 l dS = r 2 φ̇ = const. = . dt 2 2m 11 Diese wird sich als die ~e3 -Komponente des Drehimpuls herausstellen, weshalb wir sie bereits hier mit l bezeichnen. 3.6. ZWEIDIMENSIONALE ZENTRALFELDER 171 Somit werden in gleichen Zeiten gleiche Flächen überstrichen. Dies ist das zweite Keplersche Gesetz. Es handelt sich dabei um eine Manifestation der Drehimpulserhaltung, was wir folgend genauer analysieren wollen. Wir betrachten ein dreidimensionales Zentralpotential V (r). Das zugehörige ˙ Kraftfeld hat dann die Richtung ~r und es gilt ~l = ~r × F~ = 0, d.h. der Drehimpuls ist erhalten ~l(t) = ~l0 . Die Gleichung ~l · ~r = (~r × ~p) · ~r = 0 ist für ~l(t) = ~l0 die Bestimmungsgleichung für die Ebene durch den Ursprung, die die Bahn des Teilchens {~r(t)} enthält. Wählt man also ~e3 ∼ ~l0 so findet die Bewegung in einem dreidimensionalen Zentralpotential in der x1 -x2 -Ebene statt. Somit wird die Beschreibung der Bewegung in einem dreidimensionalen Zentralpotential äquivalent zu der Beschreibung in zwei Dimensionen. In der x1 -x2 -Ebene gilt ~r = r~gr , ~r˙ = ṙ~gr + φ̇~gφ und damit für den Drehimpuls ~l = m~r × ~r˙ = mr φ̇ ~gr × ~gφ = mr 2 φ̇ ~e3 . Die Konstante l hat somit die Bedeutung von l3 = mr 2 φ̇ = l und der Zusammenhang zwischen Drehimpulserhaltung und “Flächensatz” ist hergestellt. Bei l = 0 gilt für die Bewegung in der zweidimensionalen Ebene r 2 φ̇ = 0 woraus für r 6= 0, φ = const. folgt, d.h. die Bewegung entlang einer Geraden durch den Ursprung erfolgt. Dabei gilt es zu beachten, daß beim Durchgang durch den Ursprung φ nach φ + π übergeht. Wir betrachten nun den Fall der zweidimensionalen Bewegung mit l 6= 0 und verwenden neben der Erhaltung des Drehimpulses die Energieerhaltung. In der Gesamtenergie E = T +V läßt sich der Term ∼ φ̇2 durch die Drehimpulserhaltung l = mr 2 φ̇ eleminieren m 2 E = (3.17) ṙ + r 2 φ̇2 + V (r) 2 l2 m 2 ṙ + + V (r) . (3.18) = 2 2mr 2 172 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Man erhält somit dieselbe Form für die Energie wie für eine eindimensionale Bewegung jedoch mit dem l-abhängigen effektiven Potential Veff (r) = V (r) + l2 . 2mr 2 Im Unterschied zur echten eindimensionalen Bewegung kann r nur positive Werte und die Null annehmen: r ≥ 0. Im obigen Ausdruck bezeichnet man die Größe l2 /(2mr 2 ) als die Zentrifugalenergie oder die Drehimpulsbarriere. Um die Bewegung in zwei Dimensionen weiter zu charakterisieren, müssen wir nun ein spezifisches Potential wählen. Folgend werden wir zwei Potentialtypen untersuchen V (r) = V0 (r/a)kV , V0 kV > 0 , kV > −2 und ein ideal reflektierendes (kreisrundes) Billard (R > 0) 0, r≤R V (r) = ∞, r>R. Beispiele für das effektive Potential, sowie seine Konstituenten, die in die erste Klasse von Potentialen fallen, sind in den folgenden Skizzen dargestellt (A0 = 2ma2 V0 /l2 ). Man erkennt, daß für kV > 0 für jeden möglichen Wert der Gesamtenergie E > Emin eine finite Bewegung auftritt, während diese für −2 < kV < 0 für E < 0 finit, für E > 0 jedoch infinit ist. Ein Beispiel für die zweite Potentialklasse ist folgend skizziert (A0 = 2mR2 V0 /l2 = 1). 3.6. ZWEIDIMENSIONALE ZENTRALFELDER 173 In diesem Fall ist die Bewegung immer finit mit r(t) ≤ R. Wir werden die Beispiele später verwenden, um das jetzt diskutierte allgemeine Lösungsverfahren zu veranschaulichen. Die Energieerhaltung Gl. (3.17) führt analog zum Fall der eindimensionalen Bewegung in einem konservativen Kraftfeld auf die Beziehung r 2 dr =± [E − Veff (r)] . (3.19) dt m Durch (im Allgemeinen numerische) Integration folgt daraus die Funktion t(r) und durch (im Allgemeinen numerisches) Auflösen die gesuchte Funktion r(t). Von den vier Anfangsbedingungen r(t0 ), φ(t0 ), ṙ(t0 ) und φ̇(t0 ) bestimmen r(t0 ), ṙ(t0 ) und φ̇(t0 ) die Konstanten der Bewegung l und E, die in die obige Differentialgleichung (3.19) für r(t) eingehen. Somit hängt r(t) parametrisch von l, E und r(t0 ) ab. Zur vollständigen Bestimmung der Bewegung benötigen wir noch die Funktion φ(t). Diese folgt aus der Drehimpulserhaltung mr 2 (t)φ̇(t) = l. Auflösen und Integration liefert Z t l r −2 (t0 ) dt0 . (3.20) φ(t) − φ(t0 ) = m t0 Die beiden Schritte zur Berechung von r(t) und daraus φ(t) seien nun in einfachen Grenzfällen und Beispielen näher erläutert. Kreistrajektorie: In der ersten Klasse von Beispielpotentialen hat das effektive Potential Veff ein Minimum bei r = r0 . Wählt man nun E = Veff (r0 ) so erfüllt r(t) = r0 = const. die Energieerhaltung und die Bahnkurve ist ein Kreis um den 0 Ursprung. In diesem Fall gilt Veff (r0 ) = 0, was bedeutet, daß sich die anziehende Zentralkraft (Zentripetalkraft) und die Zentrifugalkraft gerade kompensieren V 0 (r0 ) = l2 = mr0 φ̇2 . mr03 174 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I Mit r(t) = r0 läßt sich das Integral in Gl. (3.20) trivial ausführen φ(t) = φ(t0 ) + l (t − t0 ) = φ(t0 ) + φ̇(t0 ) (t − t0 ) mr02 und die Kreisbahn wird mit konstanter Winkelgeschwindigkeit φ̇(t0 ) = ωφ = l/(mr02 ) durchlaufen. Harmonische Näherung für r(t): Wählt man die Gesamtenergie nur ein wenig größer als Veff (r0 ), so ist die Bewegung in “r-Richtung” (für alle kV > −2, kV 6= 0) finit. Weiterhin kann man Veff durch eine Parabel approximieren (Taylorentwicklung) Veff (r) ≈ Veff (r0 ) + 1 00 V (r0 ) (r − r0 )2 . 2 eff Damit ist das durch Gl. (3.19) gegebene Problem der Berechnung von r(t) analog zum eindimensionalen harmonischen Oszillator mit der allgemeinen Lösung (r(t) ≥ 0) r 00 (r0 ) Veff r(t) = r0 + r0 cos (ωr t + δ) , ωr = m Der Abstand des Teilchens vom Ursprung r(t) ist eine periodische Funktion der Zeit mit der Schwingungsdauer Tr = 2π/ωr . O.B.d.A. haben wir t0 = 0 gewählt. Um φ(t) zu berechnen, verwenden wir, daß die Energie nur wenig vom Minimum des effektiven Potentials abweicht, was bedeutet, daß 0 < 1 gilt. Damit können wir r −2 (t) im Integranden von Gl. (3.20) linear in entwickeln. und erhalten Z t l φ(t) − φ(0) = (1 − 2 cos [ωr t0 + δ]) dt0 + O(2 ) mr02 0 l 2 = t− [sin (ωr t + δ) − sin (δ)] + O(2 ) . mr02 ωr Die Bahnkurve liegt in einem Kreisring zwischen r0 (1 − ) und r0 (1 + ). Im Allgemeinen werden die Bahnkurven nicht geschlossen sein. Um dies zu sehen, betrachten wir den Winkel (∆φ)Tr der für eine Periode der Radialbewegung überstrichen wird. Für t = Tr ergibt sich (∆φ)Tr = ωφ l T = 2π . 2 r mr0 ωr Nur falls (∆φ)Tr = 2πk/n, mit k, n ∈ N ist, d.h. die Frequenzen ωφ und ωr kommensurabel (rationales Verhältnis) sind, erhält man eine geschlossene Bahn. Für irrationale Werte von ωφ /ωr sind die Bahnen offen. In den folgenden Abbildungen 175 3.6. ZWEIDIMENSIONALE ZENTRALFELDER sind Bahnkurven in der x1 -x2 -Ebene für r0 = 1 (d.h. x1 und x2 sind in Einheiten von r0 angegeben), = 0.2 und verschiedene Verhältnisse ωφ /ωr skizziert. ωφ/ωr=1 ωφ/ωr=1+sqrt(2)/10 1 x2 x2 1 0 -1 0 -1 -1 0 x1 1 -1 ωφ/ωr=1/5 1 ωφ/ωr=1/5+sqrt(2)/50 1 x2 1 x2 0 x1 0 -1 0 -1 -1 0 x1 1 -1 0 x1 1 Kreisbillard: In diesem Beispiel bewegt sich das Teilchen zwischen den Reflektionen an der p harten Wand entlang von Geradenabschnitten (kräftefreie Bewegung für r = x21 + x22 < R). Da die r-Bewegung in diesem Fall immer finit ist (siehe oben), ergibt sich eine in “r-Richtung” periodische Bewegung. Die Periodendauer in diese Richtung sei wieder mit Tr bezeichnet. Die Funktionen r(t) und φ(t) lassen sich über eine Periode der r-Bewegung auch ohne Integration angeben. Dazu 176 KAPITEL 3. NEWTONSCHE MECHANIK TEIL I betrachten wir den Geradenabschnitt x1 = a < R , x2 = v0 t , mit Tr /2 = √ 0 ≤ |t| ≤ Tr /2 R2 − a2 /v0 . Damit folgt für das obige Zeitintervall p r(t) = a2 + (v0 t)2 , φ(t) = arctan (v0 t/a) und man erhält für den in einer Periode der r-Bewegung überstrichenen Winkel √ (∆φ)Tr = 2 arctan R2 − a2 /a . Ist (∆φ)Tr ein rationales Vielfaches von 2π so ist die Bahn geschlossen, andernfalls nicht. In den folgenden Skizzen ist der Fall zweier geschlossener Bahnen (für R = 1) skizziert. (∆φ)T =2π/6 r 1 x2 1 x2 (∆φ)T =2π(3/5) r 0 -1 0 -1 -1 0 x1 1 -1 0 x1 1 Allgemeines Zentralpotential: Wir kehren nun noch einmal zum allgemeinen Fall des Zentralpotentials zurück. Ist man daran interessiert, die Bahnkurve ohne ihren zeitlichen Durchlauf zu bestimmen, so kann man mit Hilfe von mr 2 dφ/dt = l die Zeit aus der Gl. (3.19) eleminieren Integration liefert l dφ 1 p . =± 2 dr mr 2[E − Veff (r)]/m φ − φmin = ± Z r rmin l r 02 p 2m[E − Veff (r 0 )] dr 0 . 3.6. ZWEIDIMENSIONALE ZENTRALFELDER 177 Wir werden bei der Behandlung des Keplerproblems mit V (r) = −α/r auf diese Beziehung zurück kommen. Der überstrichene Winkel während einer Schwingungsperiode von r(t) (falls die Bewegung in r-Richtung periodisch ist) ergibt sich zu Z rmax l p dr 0 . (∆φ)Tr = 2 02 0 r 2m[E − Veff (r )] rmin Damit schließen wir unsere allgemeinen Überlegungen zur zweidimensionalen Bewegung in einem Zentralpotential–und dieses Semester–ab. Das kommende Semster werden wir damit beginnen, daß gerade gelernte auf das “klassische” Zweikörperproblem “Erde-Sonne” anzuwenden.