Theoretische Physik fürs Lehramt: L1 Beatrix C. Hiesmayr Faculty of Physics, University Vienna [email protected] SS 2008 Inhaltsverzeichnis Vorwort: Warum soll sich eine angehende Lehrkraft mit Theoretischer Physik “quälen”? . . . . . . . . . . . . . . . . . . . . . . 1 Die Newtonsche Mechanik 1.1 Was versteht man unter einem Teilchen (Massenpunkt)? . . . 1.2 Wie sehen Newtons 3 Axiome aus? . . . . . . . . . . . . . . . 1.2.1 Zu Newtons Axiomen und ihren Zusätzen . . . . . . . 1.3 Die Newtonschen Gleichungen im Detail . . . . . . . . . . . . 1.3.1 Die Mathematik hinter den Newtongleichungen oder wie Theoretiker gerne analysieren . . . . . . . . . . . . 1.3.2 Und wenn der Theoretiker weiter in diesem Sinne analysiert: Newtonschen Gleichungen für N Teilchen . . . 1.4 Was versteht man unter einem Feld? . . . . . . . . . . . . . . 1.5 Ist die Masse träger als schwer oder schwerer als träg? . . . . . 1.6 Beispiele gegebener Kräfte à la Newton . . . . . . . . . . . . . 1.6.1 Ein Massenpunkt im homogenen Schwerefeld oder im homogenen elektrischen Feld . . . . . . . . . . . . . . . 1.6.2 Freie Schwingung oder Federkraft . . . . . . . . . . . . 1.6.3 Was kann für Kräfte, die nur vom Ort abhängen, ausgesagt werden? . . . . . . . . . . . . . . . . . . . . . . 1.7 Für welche Kräfte gilt die Energieerhaltung? . . . . . . . . . . 1.8 Warum macht es Sinn sich mit Potentialen “herumzuschlagen”? 1.9 Noch ein wichtiger Spezialfall: Zentralpotentiale und Kepler– Gesetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10 Weitere Erhaltungssätze . . . . . . . . . . . . . . . . . . . . . 1.11 Schwarze Löcher . . . . . . . . . . . . . . . . . . . . . . . . . . 1.12 Welches Raum-Zeit Konzept steckt hinter den Newtonschen Gleichungen? . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.13 Beschleunigte Bezugssysteme . . . . . . . . . . . . . . . . . . 1.13.1 Linear beschleunigtes Bezugssystem . . . . . . . . . . . 1.13.2 Rotierende Bezugssysteme . . . . . . . . . . . . . . . . 3 5 9 9 11 13 13 15 16 18 19 20 20 20 21 24 27 29 37 39 40 43 43 44 2 Lagrangesche Mechanik 2.1 Einleitung/Motivation . . . . . . . . . . . . . . . . . . . . 2.2 Generalisierte Koordinaten und deren Geschwindigkeiten . 2.3 Wie erfolgt eine Bewegung? . . . . . . . . . . . . . . . . . 2.4 Wie “errät” man die Lagrangefunktion? . . . . . . . . . . 2.5 Erhaltungssätze und Symmetrien . . . . . . . . . . . . . . 2.6 Welche Eigenschaften erleichtern das Erraten von L noch? 2.7 Der Lagrange– und Hamiltonformalismus . . . . . . . . . . . . . . . . . 3 Relativistische Mechanik 3.1 Die Lorentztransformation . . . . . . . . . . . . . . . . . . . 3.2 Wie schaut das Raum–Zeit Konzept der Lorentztransformationen aus? . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Auswirkungen des veränderten Raum–Zeit Konzepts: Lorentzkontraktion und Zeitdilatation . . . . . . . . . . . . . . . . . 3.4 Wie sehen Impuls– und Energiebegriff für ein relativistisches Teilchen aus? . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Äquivalenz von Masse und Energie . . . . . . . . . . . . . . 3.6 Wie behandelt man Teilchen mit Ruhemasse 0? . . . . . . . 3.7 Anwendungen: Teilchenphysik . . . . . . . . . . . . . . . . . 3.7.1 Der Zerfall von einem Teilchen . . . . . . . . . . . . . 3.7.2 Wie sieht die Kinematik der Teilchenerzeugung aus? . 3.8 Um den Kreis zu schließen: Wie sieht der relativistische Kraftbegriff aus? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47 49 50 54 59 65 66 69 . 71 . 72 . 77 . . . . . . 79 81 81 82 83 84 . 85 4 Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie 89 4.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 4.2 Die Lagrangefunktion der Elektrodynamik . . . . . . . . . . . 90 4.2.1 Wie sieht die Lagrangefunktion für ein freies relativistisches Teilchen aus? . . . . . . . . . . . . . . . . . . . 91 4.2.2 Wie sieht die Lagrangefunktion für geladene Teilchen aus? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 4.3 Die Lorentzkraft und ihr nichtrelativistischer Limes . . . . . . 97 4.4 Die Maxwell Gleichungen . . . . . . . . . . . . . . . . . . . . . 97 Vorwort: Warum soll sich eine angehende Lehrkraft mit Theoretischer Physik “quälen”? Womit beschäftigt sich die Theoretische Physik? Der “klassische” Zyklus, wie er auch an dieser Universität gelesen wird, umfasst die Mechanik, die Elektrodynamik, die Quantenmechanik und die Thermodynamik. In ihnen werden die Grundgedanken entwickelt, die die Unzahl an experimentellen Phänomenen, die wir aus Experimenten kennen, beinhaltet, und in ein auf wenigen Prinzipien fußenden Gedankengebäude zusammengefasst. Es bietet das Grundgerüst, für die Allgemeine Relativitätstheorie, die Teilchenphysik, die theoretische Festkörperphysik, die mathematische Physik, . . . die gegenwärtige Forschungsgebiete sind. Durch Abstraktion erhält man einen anderen Einblick in die Naturgesetze, über die Entstehung und Dynamik unseres Universums,. . . , aber natürlich erhöht ein besseres Verständnis immer die Aussicht auf neue Anwendungen und Fortschritt. Die Mechanik war das erste Teilgebiet der Physik, in dem ein mathematischer Zugang zu einem weitreichenden Verständnis der beobachteten Phänomene und Vorgänge geführt hat. Die im Verlauf der Entwicklung dieses Gebietes eingeführten Begriffe und Methoden haben sich von außerordentlich großer Tragweite erwiesen und werden heute in allen übrigen Gebieten der Physik verwendet, mehr noch sie öffnet das Tor, mit dem die moderne Physik erst verstanden werden kann. Zum Beispiel werden wir in dieser Vorlesung über den Lagrangeformalismus bzw. Hamiltonformalismus sprechen, der zunächst möglicherweise nicht sinnvoll erscheint, da er “nur” eine andere Betrachtungweise darstellt, aber ohne das Verständnis eines so genannten Hamilton’s kann die Schrödinger Gleichung, die das Verhalten von Quantenteilchen beschreibt, nicht verstanden werden und Erwin Schrödinger hätte sie wahrscheinlich nie “finden” können, hätte er sich nicht mit diesem Formalismus beschäftigt. Die klassische Mechanik wird manchmal auch als “das Paradies des Physikers 1 ” genannt, da hier Klarheit herrscht, da genau festgelegte Ursachen zu genau festgelegten Wirkungen führen (wir werden allerdings durchaus unsere liebe Mühe haben und des Öfteren ziemlich schwitzen :-)). Vor der Vertreibung aus dem Paradies haben William Thomson und Lord Kelvin ja noch gemeint, die Physik sei beinahe vollständig verstanden, nur zwei offene Dinge 1 Original Ton: Bernhard Baumgartner 5 gäbe es noch: der “Äther” des Lichtträgers und die Wärmestrahlung. Wie wir wissen haben genau diese Dinge sich zu der Notwendigkeit geführt, unser Weltbild, unser Gedankengebäude neu zu entwickeln, im Besonderen unsere Vorstellung von Ort und Zeit. Eines der ungelösten derzeitigen Probleme ist, wir haben keine Idee wie die zwei modernen Theorien, Relativitätstheorie und Quantentheorie, zusammenpassen sollen. Beide sind sehr gut experimentell bestätigt. Immerhin widersprechen sich beide Theorien nicht in ihren Aussagen! Die Mechanik ist bis heute die exemplarische Disziplin geblieben, an der man die Denkweisen der theoretischen Physik gut verstehen lernt. Die Mechanik befasst sich mit der Bewegung von Gegenständen (Körpern). Über eine Beschreibung der Bewegung gelangt man zu einer Analyse ihrer Ursachen. Das führt zu einer bedeutenden Verständnis- Ökonomie: eine Vielfalt möglicher Bewegungen kann auf wenige Ursachen zurückgeführt werden. Sind die Ursachen einer Bewegung bekannt, so kann diese im Prinzip aus Anfangsdaten und mechanischen Charakteristika des bewegten Körpers vorausberechnet werden. Je nach dem Aufbau der untersuchten Körper unterscheidet man zwischen der Mechanik von Teilchen bzw. aus solchen aufgebauten Systemen und der Mechanik von Kontinua. Diese Unterscheidung ist sehr alt, hat aber immer noch ihre Bedeutung. Zwar ist es heute angesichts des Aufbaus jeglicher Materie aus Atomen und deren Bestandteilen klar, dass jeder Körper streng genommen ein Teilchensystem und kein Kontinuum ist. In vielen Anwendungen ist es jedoch möglich und auch zweckmäßig, von der atomaren Struktur abzusehen und die Materie als kontinuierliche Verteilung von Masse zu beschreiben. Bewegung bedeutet eine Ortsveränderung im Laufe der Zeit. Die zu ihrer Untersuchung entwickelten Methoden erweisen sich als tragfähig genug, um viel allgemeinere zeitliche Veränderungen zu erfassen: die mechanische Dynamik wird zum Modellfall von Dynamik schlechthin (Lagrange– bzw. Hamiltonformalismus). Die Untersuchung eines zusammengesetzten Systems durch Analyse seiner Teile und ihrer Wechselwirkungen, das Aufsuchen der relevanten Freiheitsgrade sowie die Bedeutung von Erhaltungsgrößen sind weitere Züge, die über die Mechanik hinaus von Wichtigkeit sind und wir werden uns damit befassen. Auch die verwendeten mathematischen Methoden und Techniken sind im gesamten Bereich der theoretischen Physik (und weit über diese hinaus) von Nutzen. Will man die große Bedeutung der Theoretischen Physik und damit der Modernen Physik erfassen und diese Disziplin verstehen, so muss man zuerst die Mechanik gründlich studieren. Die vorliegende Vorlesungsausarbeitung gibt einen kurzen Einblick in diese und sollte einer Lehrkraft die Fähigkeit geben, 6 • den Schulstoff von einer abstrakteren Sicht zu verstehen, • mit den wichtigsten Begriffsbildungen und Methoden soweit vertraut gemacht werden, dass er/sie damit umgehen kann und den Überblick über das behält, worauf es für das Verständnis physikalischer Sachverhalte ankommt, • er oder sie soll in die Lage versetzt werden, sich über den Vorlesungsstoff hinausreichende Kenntnisse aus der Literatur selbst anzueignen und sich gegenwärtige und neue Entwicklungen in der Modernen Physik aneignen zu können. Damit wünsche ich viel Spass, weil auch das soll Physik sein! Beatrix C. Hiesmayr Wien, März 2008 7 8 Kapitel 1 Die Newtonsche Mechanik Hier werden wir uns mit der Welt, wie sie von Newton gesehen wurde, beschäftigen. Wir werden uns das Raum–Zeit Konzept, das dieser Welt unterliegt, erarbeiten und als Anwendung die Keplergesetze herleiten. 1.1 Was versteht man unter einem Teilchen (Massenpunkt)? Als Teilchen (Massenpunkt) bezeichnen wir ein Objekt, dessen Abmessungen man bei der Beschreibung der Bewegung vernachlässigen kann. Teilchen ist also ein Näherungskonzept, eine Idealisierung. Aus der hier gegebenen Definition ist ersichtlich, dass man dabei nicht nur an die Teilchen denken muss, aus denen die Materie zusammengesetzt ist. Zwar entsprechen z.B. Elektronen oder Protonen der Definition in fast allen Fällen, unter Umständen tun es auch Atome oder Moleküle oder auch größere Objekte wie ein Auto. Das Konzept ist also in einem viel größeren Bereich praktisch bzw. brauchbar. Zur Verdeutlichung betrachten wir die folgenden einfachen Beispiele: (1) Bewegung von Protonen (Protonradius ∼ 10−13 cm) in großen Kreisbeschleunigern (z.B. CERN-Beschleuniger bei Genf, dort gerade (2008) der LHC (Large Hadron Collider) in Betrieb). Bahnradius 102 − 103 m, Abweichungen von der Kreisbahn durch Schwingungen ∼ 1 cm. Im Vergleich dazu spielt der Radius des Protons keine Rolle. (2) Bewegung eines Satelliten (Abmessung einige m) um die Erde (Erdradius ∼ 6.000 km). Der Bahnradius betrage 3 Erdradien (∼ 18.000 km). Im Vergleich dazu spielt die Abmessung des Satelliten sicher keine Rolle. Über den Einfluss der Abmessung der Erde muss man hingegen nachdenken. 9 Kapitel 1. Die Newtonsche Mechanik (3) Bewegung der Erde (r ∼ 6 · 103 km) um die Sonne (r ∼ 6.9 · 105 km). Der mittlere Bahnradius beträgt ∼ 1.5 · 108 km; Unterschied größte kleinste Entfernung von der Sonne ∼ 6 · 106 km. Im Vergleich zu beiden Bahndaten spielt die Abmessung der Erde keine Rolle. Es kommt also auf die Abmessungen des Objektes im Vergleich zu charakteristischen Abmessungen für die Bewegung (Bahndaten) an. Die Modellvorstellung “Massenpunkt” ist also eine Idealisierung, die annimmt, dass die Bahnkurve ohne Berücksichtigung der anderen Freiheitsgrade behandelt werden kann. Die Anwendung des Modells ‘Massenpunkt” kann aber auch fehlerhaft sein! (Beispiel: Die Drehung einer Billardkugel kann einen wesentlichen Einfluss auf die Bahn haben! Der Reiz des Billardspiels!) Aber bereits bei der Bewegung eines Teilchens kann man zwischen zwei Auffassungen unterscheiden. Man kann sich zunächst dafür interessieren, wie die Bewegung zu beschreiben ist (Kinematik), ohne dass man fragt, warum sie so und nicht anders erfolgt. Die vom Teilchen beschriebene Bahn wird dann als vorgegebene Kurve im Raum aufgefasst, die zunächst rein geometrisch untersucht wird. Aus der Untersuchung, wie sie vom Teilchen durchlaufen wird (wo es sich in verschiedenen Zeitpunkten befindet), also aus der Bahnkurve x(t) ~r(t) = x(t) ~e1 + y(t) ~e2 + z(t) ~e3 = y(t) , (1.1) z(t) erhält man weitere mechanische Charakteristika der Bewegung, z.B. die Geschwindigkeit ẋ(t) d ~v (t) := ~r(t) = ~r˙ (t) = ẋ(t) ~e1 + ẏ(t) ~e2 + ż(t) ~e3 = ẏ(t) (1.2) dt ż(t) und die Beschleunigung ẍ(t) d ~a(t) := ~v (t) = ~r¨(t) = ẍ(t) ~e1 + ÿ(t) ~e2 + z̈(t) ~e3 = ÿ(t) . dt z̈(t) (1.3) Hier beschreiben ~e1/2/3 Einheitsvektoren im kartesisches Koordinatensystem. Hinweis: Um viel Schreibarbeit zu vermeiden und eine Verallgemeinerung in beliebige Dimensionen zu erleichtern, bedient sich der Theoretiker oft einer Kurzschreibweise. Z.B. für die Bahnkurve kann man schreiben ~r(t) = xi (t) ~ei , 10 (1.4) 1.2. Wie sehen Newtons 3 Axiome aus? wobei man bei gleichen Indizes immer eine Summe über alle Koordinaten P3 versteht, also xi (t) ~ei ≡ ei , und hier sind x1 (t) ≡ x(t), x2 (t) ≡ i=1 xi (t) ~ y(t), x3 (t) ≡ z(t). Anstatt sich die Kinematik anzuschauen kann man sich für die Dynamik interessieren, um die Ursachen zeitlicher Änderungen und damit der Bewegung überhaupt. Man fragt nach dem Warum und nimmt die Bahnkurve nicht einfach als vorgegeben hin: man trachtet, sie aus möglichst einfachen Ursachen zu berechnen. Es ist einleuchtend, dass die Kinematik eine Vorstufe zur Dynamik ist: man lernt aus ihr, auf welche Bestimmungstücke es ankommt. Auch historisch war die Kinematik eine wesentliche Vorstufe: Keplers Gesetze gaben eine rein kinematische Beschreibung der Planetenbewegung; erst mit Newtons Dynamik war es möglich, die Bewegung der Planeten (und anderer Himmelskörper) aus der Schwerkraft als universeller Ursache zu berechnen. Achtung: Die vertraute Beschreibung der Bahnkurve (1.1) ist in keiner Weise trivial! Sie setzt ganz wesentliche Dinge voraus, nämlich ein Längenmessung, eine Zeitmessung und eine physikalische Annahme über die Struktur unseres Raumes. Die Längen- und Zeitmessung erfolgt durch die Festlegung eines Verfahrens zur Messung. Ein kartesischen Koordinatensystems (KS) existiert nur im euklidischen oder ebenen Raum. Der Gegensatz dazu ist ein gekrümmter Raum, definiert dadurch, dass in ihm kein kartesisches Koordinatensystem möglich ist (Beispiel: zweidimensionaler Raum der Kugeloberfläche). Allerdings kann man im euklidischen Raum natürlich auch gekrümmte Koordinaten (wie Kugelkoordinaten oder Zylinderkoordinaten) verwenden, was wir natürlich immer dann machen, wenn die physikalische Situation dadurch einfacher zu beschreiben ist, z.B. Bewegung einer Masse auf einer Kreisbahn. 1.2 Wie sehen Newtons 3 Axiome aus? Jede physikalische Theorie muss von gewissen unbewiesenen, grundlegenden Gesetzen ausgehen, die man aus (endlich) vielen Beobachten gewinnt. Durch Vorhersagen kann das Gesetz verifiziert, aber nicht bewiesen werden. Durch eine einziges Experiment kann es falsifiziert werden. In der (klassischen) Mechanik können Newtons Axiome (mit einigen Ergänzungen) als Naturgesetze aufgefasst werden. 11 Kapitel 1. Die Newtonsche Mechanik 1. Axiom: Es existieren Bezugssysteme (BS), so genannte Inertialsysteme (IS), in denen die kräftefreie Bewegung durch ~r˙ (t) = ~v = const (daher: ~a = ~r¨ = 0) geschrieben werden kann. Es ist klar, dass die beobachteten Bewegungen vom spezifizierten BS abhängt: Ein Billardspieler wird ganz andere Beobachtungen machen, wenn sich der Tisch auf einem Karussell befindet. Achtung: Natürlich kann man auch mit nicht IS arbeiten und das ist auch oft der Fall (wir wohnen ja auf einem rotierenden Planeten), aber es treten dann noch zusätzliche Kräfte auf (siehe Abschnitt 1.13)! In einem IS sind die physikalischen Gesetze besonders einfach: die gleichförmige Bewegung oder Ruhe ist ein Zustand, in dem der Körper verharrt. Ohne Kräfte bewegen sich die Körper also gleichförmig, d.h. die Integration von ˙ ~r(t) = ~v = const ergibt: ~r(t) = ~v t + ~r(0) . (1.5) Falls Kräfte gelten, dann führt dies zu einer nicht gleichförmigen Bewegung, die zum 2. Axiom führt: 2. Axiom: d(m ~v ) dt = d~ p dt := F~ im IS Es beinhaltet die Definition der Masse und Kraft als Messgrößen und weiters die physikalische Aussage über die Bahnbewegung. Achtung: Für Geschwindigkeiten vergleichbar mit der Lichtgeschwindigkeit c gilt diese Axiom nicht, es ist falsifiziert (siehe Kapitel 3)! Aber da es für weite Bereiche korrekte Vorhersagen macht, arbeitet man weiterhin damit, es ist sozusagen nützlich und brauchbar. Das letzte Axiom lautet: 12 1.3. Die Newtonschen Gleichungen im Detail 3. Axiom: Der Kraft, mit der die Umgebung auf einem Massenpunkt wirkt, entspricht stets eine gleich große, entgegengesetzte Kraft, mit der der Massenpunkt auf seine Umgebung wirkt: F~actio = −F~reactio 1.2.1 Zu Newtons Axiomen und ihren Zusätzen Für Systeme aus Massenpunkten braucht man zusätzliche Annahmen über die auftretenden Kräfte: 1. Zusatz: Die Kräfte, die zwischen zwei Massenpunkten auftreten, wirken entlang der Verbindungslinie: (~r1 − ~r2 ) × F~12 = 0 2. Zusatz: Wirken mehrere Kräfte F~i auf einen Massenpunkt, so ist die Gesamtkraft F~ die Summe der Einzelkräfte: X F~i F~ = i Die Zusätze gelten beispielsweise für die Newtonschen Gravitationskräfte oder die Coulombkräfte, sie schränken aber die möglichen Kraftansätze ein. Magnetische Kräfte zwischen bewegten Ladungen verletzen Zusatz 1, nichtlineare elektromagnetische Feldeffekte in einem Medium verletzen Zusatz 2. 1.3 Die Newtonschen Gleichungen im Detail Ausgangspunkt für die Dynamik in der von Newton gegebenen Form ist das Trägheitsprinzip von Galilei: Ein Körper, der eine konstante Geschwindigkeit hat, ändert diese nicht, sofern er keinen äußeren Einwirkungen unterliegt (Axiom 1). Das wesentliche Neue an diesem Prinzip war, dass zur Aufrechterhaltung 13 Kapitel 1. Die Newtonsche Mechanik einer (geradlinigen und gleichförmigen) Bewegung keine Ursachen notwendig sind. Diese sind nur erforderlich, wenn die Geschwindigkeit (nach Betrag und/oder Richtung!!) geändert werden soll. Unserer Alltagserfahrung und der der Schüler entspricht das nicht gerade, da z.B. eine Kugel sehr schnell zur Ruhe kommt (natürlich meist auf Grund der Reibung). Aber mit der Modernität kennen wir mittlerweile solche Situationen: es ist bekannt, dass man den Raketenantrieb eines Raumschiffes nur zum Starten, Bremsen und Manövrieren braucht. Nach Brennschluss bewegt sich das Raumschiff mit der zuletzt erreichten Geschwindigkeit weiter, ohne dass dafür ein Antrieb nötig ist. Zu Galileis Zeiten war ein beträchtliches Maß an Abstraktion nötig, um diesen Zusammenhang zu erkennen: man kannte nur Bewegungen, die unter dem Einfluss von Reibungskräften verlaufen, wodurch die Geschwindigkeit verändert wird (wie meist in unserem Alltag); daher hatte man lange Zeit hindurch (zurecht) geglaubt, dass auch zur Aufrechterhaltung von Bewegung Kräfte nötig sind (wenn ein Wagen nicht vom Pferd gezogen wird, bleibt er stehen). Eine Dynamik wird daher so zu fassen sein, dass Kräfte als Ursache von Geschwindigkeitsänderungen anzusehen sind. Um zu einer quantitativen Beziehung zu kommen, braucht man ein Maß für die Trägheit des Körpers, dessen Geschwindigkeit sich ändern soll: es ist einleuchtend, dass dieselbe Kraft auf verschieden schwere Körper verschieden wirkt. Für ein Teilchen (das per definitionem keine innere Struktur hat) sollte eine einzige Zahl als mechanisches Charakteristikum ausreichen, um seine Trägheit zu beschreiben. Wir nennen sie die träge Masse m und nehmen zur Kenntnis, dass verschiedene Teilchen durch verschiedene Massen unterschieden werden können. Mit Newton benützen wir zur Formulierung der Dynamik anstelle der Geschwindigkeit des Teilchens den Impuls p~ = m~v . (1.6) Dass diese Größe zweckmäßiger ist, wird sich später zeigen (Seite 38). Newtons Bewegungsgleichungen zur Bestimmung der Bahn ~r(t) lauten dann (vergleiche Axiome) m ~r˙ (t) = p~ (t) p~˙ (t) = F~ (1.7) (1.8) Die auf das Teilchen wirkende Kraft F~ kann als Ursache der Bewegung angesehen wird. 14 1.3. Die Newtonschen Gleichungen im Detail Im Allgemeinen reicht es in der Mechanik anzunehmen, dass die Kraft F~ vom Ort ~r(t) und der Geschwindigkeit ~v (t) und manchmal auch explizit von t abhängt oder mathematisch hingeschrieben: F~ = F~ (~r(t), ~v (t), t) . (1.9) Man schließ damit zum Beispiel aus, dass die Kraft von der Beschleunigung oder von höheren Ableitungen oder der Bewegung des Teilchens zu früheren Zeiten abhängt. Geschwindigkeitsabhängige Kräfte sind zum Beispiel die Lorentzkraft, mit der wir uns noch beschäftigen werden, und die Reibungskraft. Soll die Bahnkurve durch Lösung der Newtonschen Gleichungen berechnet werden, so muss die Kraft als Funktion seiner Argumente bekannt sein. Die Bestimmung der Bewegung ist damit auf die Ermittlung der Kraft zurückgeführt. Man kann dabei phänomenologisch vorgehen: man macht einen Ansatz für die Kraft und untersucht, welche Bahnen damit aus den Newtongleichungen herauskommen; stimmen sie mit beobachteten Bahnen überein, so ist man zufrieden; andernfalls verändert man den Ansatz solange, bis Übereinstimmung erreicht wird. Damit erreicht man eine gewisse erkenntnistheoretische “Ökonomie”, da ein einziger Ansatz für F~ sehr viele verschiedene Bewegungen als Konsequenzen hat. Schon Newton hat erkannt, dass aus einem einzigen Ansatz für die Schwerkraft die Bahnen aller Himmelskörper des Sonnensystems folgen (wie praktisch)! Die Schwerkraft auf den durch ~r(t) beschriebenen Himmelskörper wird dabei durch alle übrigen Himmelskörper hervorgerufen. Die Sonne dominiert dabei so stark, dass es in sehr guter Näherung genügt, die von ihr ausgeübte Schwerkraft zu betrachten. Das werden wir noch genauer in Abschnitt 1.9 untersuchen. 1.3.1 Die Mathematik hinter den Newtongleichungen oder wie Theoretiker gerne analysieren Mathematisch sind die Newtongleichungen (1.7) und (1.8) ein System von Differentialgleichungen 1. Ordnung für 6 Funktionen (3 Komponenten von ~r (t), 3 von p~ (t)). Die Bahn ist dadurch in Termen von 6 Anfangswerten, ~r (t0 ) und p~ (t0 ), festgelegt. Im Allgemeinen sind diese Differentialgleichungen nichtlinear. Ein lineares System resultiert nur, wenn F~ eine Linearkombination von ~r und p~ ist, d.h. nur für einen sehr speziellen Kraftansatz (Fällt jemandem dazu eine physikalische Situation ein?). Für die Schwerkraft F~ ∼ r13 ~r (oder Coloumbkraft) ist das System bereits nichtlinear. 15 Kapitel 1. Die Newtonsche Mechanik Man kann natürlich die erste Gleichung (1.7) in die zweite (1.8) einsetzen und erhält ein System von drei Differentialgleichungen 2. Ordnung für ~r(t): F~ = m ~r¨(t) Dies ist natürlich die bekannte Formel für die Kraft “Kraft=Masse×Beschleunigung”! Eine Voraussetzung dafür ist, dass die Masse m konstant ist, sonst kann man die erste Gleichung nicht in die zweite einsetzen! Nur unter dieser Bedingung gilt diese Formel! 1.3.2 Und wenn der Theoretiker weiter in diesem Sinne analysiert: Newtonschen Gleichungen für N Teilchen Die Verallgemeinerung der Newtongleichungen für N Teilchen ist leicht anzugeben. Die Massen der Teilchen können voneinander verschieden sein, m(n) , ebenso kann auf jedes Teilchen n eine andere Kraft F~ (n) wirken. Damit haben wir die folgenden zwei Gleichungen für N Teilchen: m(n) ~r˙ (n) (t) = p~ (n) (t) p~˙ (n) (t) = F~ (n) (1.10) (1.11) wobei n = 1, 2, . . . , N das jeweilige Teilchen bezeichnet. Um die N Bahnkurven durch Lösung dieser Gleichungen bestimmen zu können, müssen alle Kräfte als Funktionen der Koordinaten und Geschwindigkeiten und unter Umständen auch explizit von der Zeit bekannt sein. Die Newtongleichungen sind dann (wie für ein Teilchen) ein (i.a. nichtlineares) System von Differentialgleichungen erster Ordnung für 6N Funktionen. Die Bahnen werden dadurch in Termen von 6N Anfangswerten festgelegt (3N Anfangsorte, 3N Anfangsimpulse). Sind alle Massen konstant, so kann man die zwei Gleichungen wieder in 3N Differentialgleichungen 2. Ordnung umschreiben m(n)~r¨ (n) (t) = F~ (n) . (1.12) Für numerische Lösungsverfahren sind Differentialgleichungen 1. Ordnung oft von Vorteil, sonst macht es natürlich keinen Unterschied. Jedoch sehr wichtig für die Struktur der Gleichungen ist, von welchen Variablen die Kräfte wirklich abhängen. Würde man annehmen, dass in F~ (n) nur Ort und Geschwindigkeit des n–ten Teilchens (und allenfalls die Zeit t) vorkommen, so wäre das unrealistisch. Man könnte dann das Teilsystem für 16 1.3. Die Newtonschen Gleichungen im Detail (~p (n) , ~r (n) ) für jeden einzelnen Wert von n lösen, also jedes Teilchen separat betrachten, ohne sich um die übrigen Werte N − 1 kümmern zu müssen. Die Teilchen würden voneinander nichts spüren, jedes würde sich auf einer Bahnkurve bewegen, die davon unabhängig ist, ob die übrigen Teilchen überhaupt vorhanden sind oder nicht. Statt eines Einteilchenproblems hätte man also N Einteilchenprobleme formuliert, d.h. man würde damit nur die Bewegung von Teilchen ohne Wechselwirkung erfassen, eine wirklich fade oder wie der Theoretiker so gerne sagt “triviale” Situation. In Wirklichkeit oder was uns mehr interessiert ist natürlich die Wechselwirkung der Teilchen untereinander: ein herausgegriffenes Teilchen (Nr. n) erfährt Kräfte von allen übrigen, d.h. F~ (n) = F~ (n) (~r (1) , ~r (2) , . . . , ~r (N ) ; p~ (1) , p~ (2) , . . . , p~ (N ) , t) . (1.13) Dadurch werden die Newtonschen Gleichungen zu einem gekoppelten System von Differentialgleichungen: in den Gleichungen für (~r (n) , p~ (n) ) kommen über F~ (n) alle übrigen Orts– und Geschwindigkeitsvektoren vor und umgekehrt; man muss das System als Ganzes betrachten. Die Kräfte sind in der Newtonschen Mechanik als die Ursachen aufzufassen, auf die die Bewegungen zurückgeführt werden kann. Wie bereits für ein Teilchen festgestellt wurde, können die Kräfte nicht “berechnet” werden, sondern man muss sie in Form eines Ansatzes für die funktionale Abhängigkeit von F~ (n) von seinen Variablen in die Bewegungsgleichungen “hineinstecken”. Der “richtige” Kraftansatz resultiert mitunter erst nach einem längeren Erkenntnisprozess, by trial and error. D.h. man untersucht die aus einem bestimmten Ansatz folgenden Bewegungen durch Lösung der Newtonschen Gleichungen, vergleicht das Resultat mit beobachteten Bewegungen und korrigiert den Ansatz so lange, bis Theorie und Experiment übereinstimmen. Dadurch lernt man etwas über die Ursachen der Bewegung, also über den Mechanismus, der einem Bewegungsphänomen zugrunde liegt. Das Ziel dieses Prozesses ist es, auf phänomenologischem Weg zu immer “tieferen” Ursachen vorzudringen. Ein Kraftansatz ist dabei als “besser”, “tiefer” anzusehen, wenn er in dem Sinn “allgemeiner” ist, dass aus weniger zugrunde liegenden Annahmen mehr Konsequenzen gezogen werden können, wenn also mehr Phänomene auf weniger Ursachen zurückgeführt werden. Albert Einstein formulierte das etwa so: “Eine Theorie ist umso eindrucksvoller, je größer die Einfachheit ihrer Prämissen ist, je verschiedenartigere Dinge sie verknüpft und je weiter ihr Anwendungsbereich ist.” Übungsaufgabe: Es gibt nur 4 fundamentale Kräfte oder Wechselwirkungen (nach derzeitigem Stand des Wissens), die die Moderne Physik kennt: die 17 Kapitel 1. Die Newtonsche Mechanik starke, die schwache, die elektomagnetische Wechselwirkung und die Gravitation (die schwache und elektromagnetische Wechselwirkung kann zur einer Theorie vereinheitlicht werden, die elektroschwache Wechselwirkung). Überlege wie die Herkunft der folgenden Kräfte erklärt werden kann: Muskelkraft, Zwangskräfte (z.B. Körper auf Tischplatte), Rückstellkräfte (z.B. Feder, Festkörper möchte nach Verformung in ursprünglichen Zustand zurück), Haftreibung, Gleitreibung, Scheinkräfte (siehe auch Kapitel 1.13), Druckkräfte (z.B. Auftrieb),. . . 1.4 Was versteht man unter einem Feld? Das Gravitationsgesetz ~r1 − ~r2 , F~12 = G m1 m2 |~r1 − ~r2 |3 (1.14) lässt sich auf zweierlei Art interpretieren: Einerseits kann man sich vorstellen, dass die auf m1 wirkende Kraft F12 den zwischen den Massenpunkten m1 und m2 befindlichen Raum einfach überspringt und direkt auf m1 wirkt (und natürlich umgekehrt). Die Frage nach einem Mechanismus der Kraftübertragung wird hier nicht gestellt. Die zur Newtons Zeit vertretene Auffassung hieß Fernwirkungstheorie. Eine moderne Auffassung der Kraftübertragung ist beim Studium der elektromagnetischen Phänomene entwickelt worden, die so genannte Nahwirkungstheorie und kann in gleicher Weise auch auf die Newton Theorie angewendet werden. Hier erzeugt die Masse m2 ein Feld, ein materiefreies Medium, im ganzen Raum. Es existiert auch falls m1 nicht vorhanden ist. Bringt man m1 aus dem Unendlichen in einen endlichen Abstand zu m2 , so wird durch das Feld auf die Masse m1 eine Kraft F~12 ausgeübt. Dabei gilt: Das von m2 erzeugte Feld existiert im ganzen unendlichen Raum, eine Kraftwirkung aber nur an Stellen im Raum, an denen sich Massen befinden. Siehe auch Seite 66. Noch eine sehr praktische Eigenschaft: Das Gravitationsfeld einer kugelförmigen Masse mit dem Radius R außerhalb des Körpers bleibt gleich, wenn man sich das Volumen des Körpers unverändert, die Gesamtmasse jedoch im Kugelmittelpunkt konzentriert vorstellt. (Beweis: siehe Literatur) 18 1.5. Ist die Masse träger als schwer oder schwerer als träg? 1.5 Ist die Masse träger als schwer oder schwerer als träg? Betrachten wir die fundamentalen Gleichungen der Mechanik, die Newtonsche Bewegungsgleichung (Index t für träge) F~ = mt ~r¨ (1.15) und das Gravitationsgesetz ~ 2 = G m2 ~r , G |~r|3 ~2 . F~12 = m1 G (1.16) (1.17) In allen 3 Gleichungen kommen Massen vor allerdings im Zusammenhang mit verschiedenen Eigenschaften. In (1.15) kommt zum Ausdruck, dass sich die Masse unter dem Einfluss einer Kraft bewegt, wobei diese Bewegung gewissermaßen “träge” erfolgt: Starke Änderungen von F~ übertragen sich direkt nur auf ~r¨, nicht jedoch auf die durch zweimalige Integration “geglättete” Bewegung ~r. Masse besitzt sozusagen Trägheit und mt ist die träge Masse. Das ist aber nur eine Seite der Medaille! Nach (1.16) ist die Masse auch “felderzeugend” (siehe Abschnitt 1.4). Darüber hinaus wird durch (1.17) auf einen Massenpunkt durch das Feld eine Kraft übertragen. Ein Körper im Gravitationsfeld der Erde drückt mit einem Gewicht m ~g (~g . . . Erdbeschleunigung) auf die Erdoberfläche. Diese Gewichtseigenschaft (“Schwere”) stellt demnach eine zur Trägheit unterschiedliche Eigenschaft dar. Die 3 Gleichungen beschreiben jeweils unterschiedliche Eigenschaft (Trägheit, Fähigkeit zur Felderzeugung, Schwere). Aufgrund des 3. Axioms, “actio=reactio”, können wir (1.16) und (1.17) als gleichartig auffassen und haben damit ~r1 − ~r2 F~12 = G m1 m2 , |~r1 − ~r2 |3 (1.18) wobei hier m1/2 die schwere Masse ist. Aber sind diese zwei Arten von Massen identisch? Experimente finden keinen messbaren Unterschied zwischen träger Masse und schwerer Masse! Daher kommen wir durch Angabe eines einzigen skalaren Wertes m aus, wie praktisch!! Im Rahmen der Newtonschen Mechanik und der Gravitationstheorie ist die Gleichheit der Massen ein Zufall. Dagegen nimmt sie die Allgemeine Relativitätstheorie zum zentralen Ausgangspunkt (Einsteinsches Äquivalenzprinzip)! 19 Kapitel 1. Die Newtonsche Mechanik 1.6 Beispiele gegebener Kräfte à la Newton Wir beschäftigen uns nun mit Problemen, die sich in einer Dimension darstellen lassen, und kommen so auf den sehr praktischen Begriff “Potential”. Dieser bildet die Grundlage der Diskussion sehr vieler verschiedener physikalischer Situationen auf eine einfache und einheitliche Weise ohne auf zu viele Details, die einer speziellen physikalischen Situation entsprechen, eingehen zu müssen.. . . 1.6.1 Ein Massenpunkt im homogenen Schwerefeld oder im homogenen elektrischen Feld Die Kraft ist in diesem Fall gegeben durch F = m z̈ = −m g , (1.19) wobei g die Erdbeschleunigung ist und in der Nähe der Erdoberfläche als konstant angesetzt werden kann. Die Kraft ist also weder von Ort, noch Geschwindigkeit, noch Zeit abhängig. Einmal integrieren ergibt (Warum kürzt sich die Masse heraus?) vz (t) := ż = −g t + vz (0) , wobei vz (0) die Integrationskonstante, bzw. die Geschwindigkeit zum Zeitpunkt t = 0 ist. Ein weiteres Mal integrieren ergibt g z(t) = − t2 + vz (0) t + z(0) , 2 wobei z(0) wieder die Integrationskonstante, bzw. der Ort des Massenpunktes zum Zeitpunkt t = 0. Ein analoger Kraftanzatz ist für die Beschreibung eines geladenen Teilchens in einem homogenen elektrischen Feld, wie gegeben zwischen den Platten eines geladenen Kondensators. Hier ist die Masse durch die Ladung zu ersetzen und g durch den Betrag der elektrischen Feldstärke. Im Gegensatz zur Masse kann die Ladung natürlich positive oder negativ sein, daher kann es sich nach oben oder unten bewegen. 1.6.2 Freie Schwingung oder Federkraft Stellen wir uns eine Feder mit einer Masse vor, die in der x–Richtung ausgelenkt wird. Hier ist die Kraft proportional zur Auslenkung x aus der Ruhelage m ẍ(t) = −k x(t) und k ist die Federkonstante, die im Experiment zu bestimmen ist. 20 (1.20) 1.6. Beispiele gegebener Kräfte à la Newton Die Bewegungsgleichung ist eine homogene lineare1 (gewöhnliche) Differentialgleichung (siehe Mathematik Vorlesung), deren allgemeine Lösung eine Linearkombination von zwei linear unabhängigen Lösungen ist, d.h. x(t) = A cos(ω t) + B sin(ω t) (1.21) q k mit ω = m . Das lässt sich sofort verifizieren, indem man diese Lösung zweimal nach t differenziert und in die obige Bewegungsgleichung einsetzt. Die Integrationskonstanten A und B erhält man durch einsetzen der Anfangsbedingungen x(0) = x0 und ẋ(0) = v0 , also lautet die Lösung v0 x(t) = x0 cos(ω t) + sin(ω t) . (1.22) ω Dass bei der Lösung der sin oder cos auftritt sollte uns nicht verwundern, eine Masse die sich auf einer rotierenden Scheibe befindet und von der Seite betrachtet wird, führt genau die Bewegung aus, die eine Masse an einer Feder ausführt. 1.6.3 Was kann für Kräfte, die nur vom Ort abhängen, ausgesagt werden? Der Theoretiker: Können wir allgemeiner Aussagen über Kräfte treffen, die nur vom Ort abhängen, wie die Federkraft? Wir suchen also die Lösung für die folgende Bewegungsgleichung m ẍ(t) = F (x(t)) . (1.23) Multiplizieren wir beide Seiten mit ẋ(t), so kann die obige Gleichung auch so geschrieben werden d md ẋ(t) = − U (x(t)) , (1.24) 2 dt dt wobei U eine Funktion nur vom Ort ist und gewöhnlich Potential oder potentielle Energie (ahha!) genannt wird und sich allgemein so schreiben lässt Z U (x) = − dx F (x) + const , (1.25) 1 Die Kraft hängt nur linear von x ab. 21 Kapitel 1. Die Newtonsche Mechanik wobei die Integrationskonstante ohne Bedeutung für die Bewegungsgleichung ist (fällt beim Differenzieren weg!). Umgekehrt errechnet man klarerweise bei gegebenen Potential die Kraft durch F (x) = − d U (x) dx (1.26) oder im 3–dimensionalen Fall ~ (~r) F~ (~r) = −gradU (~r) = ~ei ∇i U (~r) = ∇U ∂ U (~r) ∂x ∂ ∂ U (~r) = ∂y U (~r) , = ~ei ∂xi ∂ U (~r) ∂z (1.27) worauf wir später näher darauf eingehen. Integrieren wir nun die die Bewegungsgleichung (1.23) nach der Zeit, erhalten wir m ẋ(t)2 = −U (x(t)) + E. 2 (1.28) Die Integrationskonstante E ist hier nichts anderes als die Summe der potenziellen Energie und —richtig!!— der kinetischen Energie! Damit haben wir ganz allgemein gezeigt, dass für Kräfte die nur vom Ort abhängen und als Gradient eines Potentials geschrieben werden können, die Energieerhaltung gilt. Lösen wir die obige Gleichung nach ẋ auf, erhalten wir dt = q dx (1.29) 2(E−U (x)) m und integrieren Z x q t − t0 = x0 dx0 2(E−U (x0 )) m . (1.30) Mit den Anfangsbedingungen x(t0 ) und ẋ(t0 ) haben wir die Lösung t = t(x) gefunden und damit implizit x = x(t). Nur in sehr speziellen Fällen kann man das Integral analytisch lösen, wie für den harmonischen Oszillator U (x) = kx2 /2, bzw. der Federkraft d U (x) = −F (x) = kx) oder das Potential U (r) ∼ 1r . Der harmonische ( dx Oszillator ist übrigens das “Lieblingsobjekt” eines Theoretikers (warum?). 22 1.6. Beispiele gegebener Kräfte à la Newton Der harmonische Oszillator und der Potentialbegriff 2 Für das harmonische Potential U (x)√= kx /2 wollen wir jetzt das Integral R √ 2 (1.30) lösen ( 1/(1 − ax ) = arcsin ax/ a) und nach x auflösen mit x0 = 0, t0 = 0: r x(t) = 2E sin( k r k t) = ω −1 m r 2E sin(ωt) . m (1.31) Dies ist natürlich dieqgleiche Lösung wie (1.22) für die gegebenen Randbe, die Anfangsgeschwindigkeit bei t0 = 0. dingungen und v0 = 2E m Die Geschwindigkeit erhalten wir durch Differenzieren v(t) = ẋ(t) = v0 cos(ωt) (1.32) und damit lautet die Energieerhaltung für alle Zeiten t m v(t)2 k x(t)2 + = E = const . 2 } | {z 2 } | {z Ekin = p(t)2 2m (1.33) U (x) Dies legt eine andere Betrachtungsweise nahe, da die Gleichung allgemein als eine Funktion vom Ort und Impuls aufgefasst werden kann, d.h. H(x, p) = Ekin + U = p2 k x2 + . 2m 2 (1.34) Hier ist H die berühmte Hamilton-Funktion. Fassen wir Ort und Impuls als Koordinaten auf, ein solcher Raum wir dann Phasenraum genannt, dann beschreibt diese Formel für verschiedene Zeiten die Bahn im Phasenraum. Da die Funktion in unserem Falle konstant ist, ergibt die Bahn eine Ellipse oder einen Kreis, siehe Fig. 1.2 (mit geeigneter Skalierung kann man immer einen Kreis erreichen). Damit kann der harmonische Oszillator auch charakterisiert werden. Man erkennt sehr schön die formale Symmetrie, nämlich eine Drehsymmetrie im Phasenraum. Allgemein wird die Bewegung damit zur Geometrie von Phasentrajektorien und führt zum Verständnis struktueller Eigenschaften der zugrundeliegenden Theorie. Wir werden in den Übungen auch den gedämpften harmonischen Oszillator berechnen und später nochmals auf die Hamilton-Funktion zurückkommen, die auch der Ausgangspunkt für die Quantenmechanik ist. 23 Kapitel 1. Die Newtonsche Mechanik Abbildung 1.1: Die Lösungen des harmonischen x(t), ẋ(t), Ekin (ẋ(t)), U (x(t)), E in Abhängigkeit der Zeit t. Oszillators: Wie behandelt man ortsabhängige Kräfte? Ganz allgemein führt eine nur ortsabhängige Kraft zur Energieerhaltung und damit zu der Möglichkeit einer graphischen Diskussion der Lösung. Diese Vorgehensweise ist auch bei komplizierteren Problemen eine bewährte Methode, wie wir im Weiteren sehen werden. 1.7 Für welche Kräfte gilt die Energieerhaltung? Starten wir mit der Newtonschen Bewegungsgleichung und multiplizieren diese skalar mit ~r˙ , also m ~r¨ · ~r˙ = F~ · ~r˙ , (1.35) so können wir diese Gleichung auch in der Form d m~r˙ 2 = F~ · ~r˙ = P , dt 2 24 (1.36) 1.7. Für welche Kräfte gilt die Energieerhaltung? Abbildung 1.2: Der so genannte Phasenraum des harmonischen Oszillators: Äußerste Kurve für E, innere für E/2. Wie ändert sich die Bahn eines Oszillators, falls E geändert wird? 25 Kapitel 1. Die Newtonsche Mechanik Abbildung 1.3: Die eindimensionale Bewegung eines Teilchens, das nur einer ortsabhängigen Kraft ausgesetzt ist, kann mit Hilfe des Energiesatzes E = mẋ2 /2 + U (x) = const. graphisch diskutiert werden. Der vertikale Abstand zwischen U (x) und der Horizontalen E ergibt die kinetische Energie mẋ2 /2. Man kann weiters die Bewegungsrichtung wählen ẋ > 0 oder < 0 und so die Änderung von ẋ2 anhand des vertikalen Abstandes ablesen. Die Schnittpunkte von E mit U (x) werden Umkehrpunkte genannt. Warum? Verläuft die Bewegung zwischen zwei Umkehrpunkten kann dadurch die Schwingungsdauer einer Periode bestimmt werden. 26 1.8. Warum macht es Sinn sich mit Potentialen “herumzuschlagen”? wobei P klarer Weise eine skalare Größe ist und physikalisch nichts anderes als die an das System übertragene Leistung. Teilen wir jetzt die Kraft in einen so genannten konservativen und dissipativen Anteil auf (werden gleich verstehen warum) F~ = F~kons + F~diss , (1.37) wobei wir den konservativen Anteil definieren durch alle Anteile der Kraft, die sich auf die folgende Form bringen lassen: d U (~r) F~kons · ~r˙ = − . dt (1.38) Setzen wir diese Definition in die obigen Gleichungen ein, erhalten wir à ! d m~r˙ 2 + U (~r) = F~diss · ~r˙ . (1.39) dt 2 Daraus sieht man, haben wir keine dissipativen Kräfte, d.h. energieverlierenden Kräfte, nur konservative, energieerhaltende Kräfte ergibt sich der Energiesatz: Kräfte konservativ −→ m~r˙ 2 + U (~r) = E = konst. 2 (1.40) Dissipative Kräfte führen also zur Umwandlung von mechanischer Energie Ekin +U des betrachteten Teilchens in andere Energieformen, z.B. in Wärmeenergie. Noch allgemeiner ist das Potential einer konservativen Kraft gegeben durch ~ (~r) + ~r˙ × B(~ ~ r, t) , F~kons = −∇U (1.41) ~ ein beliebiges Vektorwie wir in Übungen nachprüfen werden. Hierbei ist B feld, z.B. das Magnetfeld für ein geladenes Teilchen mit Geschwindigkeit ~r˙ ( qc = 1 und damit die berühmte . . . . . . . . . -Kraft). 1.8 Warum macht es Sinn sich mit Potentialen “herumzuschlagen”? Zusammenfassend können wir also “nur” konservative Kräfte durch ein Potential beschreiben, warum macht es trotzdem Sinn? 27 Kapitel 1. Die Newtonsche Mechanik 1. Die wichtigsten physikalische Kräfte sind konservative Kräfte (welche?). Für diese Kräfte kann eigens eine andere Betrachtungsweise entwickelt werden, beruhend auf der Potentialidee, einerseits der Hamilton– und andererseits der Lagrange–Formalismus (siehe Kapitel 2). Wir werden sehen, dass der Formalismus aber viel allgemeiner ist, man kann nicht nur mechanische Systeme damit beschreiben, er ist die Grundlage, um die z.B. die 4 Grundkräfte zu beschreiben. 2. Wir müssen für eine physikalische Situation nicht mehr ein Kraftanzatz erraten (einen Vektor!!), sondern nur einen Ansatz für das skalare Potential U (~r), das eine skalare Größe ist und damit mathematisch einfachere Größe als der Kraftvektor. Deswegen sind qualitative Überlegungen für U leichter durchzuführen als für F~ . Kennt man U für ein System aus N Teilchen in der Umgebung einer bestimmten Stelle (~r (1) , . . . , ~r (N ) ), so lässt sich der Verlauf von F~ (n) sofort angeben: die Kraft zeigt in Richtung des steilsten Abfalls von U , mathematisch gerade gegeben durch Gradient (siehe auch Gl. (1.26))!! Natürlich ist ein Preis dafür zu bezahlen: durch die Physik ist U nur bis auf eine Konstante bestimmt (= Integrationskonstante). Ändert man U um eine Konstante U + C, so ändern sich die Bewegungsgleichungen nicht, weil in ihnen nur die Kräfte = Gradienten des Potentials vorkommen und C beim Differenzieren wegfällt. Die Änderung von U um eine Konstante bedeutet, das man die Energie von einem anderen Wert an zählt. Die Wahl des Energienullpunktes ist willkürlich. Sie hat keine Konsequenzen für die Newtonschen Bewegungsgleichungen, wie wir gesehen haben und daher äquivalent zu den Newtonschen Bewegungsgleichungen. 3. Das “echte” skalare Potential U (~r), das man vielleicht gar nicht kennt, kann man oft gut durch einen einfacheren funktionellen Zusammenhang (z.B. harmonisches Potential) ersetzen und kann dann qualitative oft erstaunlich gut die Physik des Problems beschreiben (z.B. graphische Diskussion in Fig. (1.3)). 4. Der harmonischer Oszilator gibt für viele Potentiale und Probleme eine erste, oft schon sehr gute Lösung. 5. In der Quantentheorie kann man ein Analogon zur Newtonkraft nicht konstruieren, da auf Grund der Heisenbergschen Unschärferelation, wir entweder den Ort genau bestimmen, dann ist aber der Impuls unscharf, sogar noch schlimmer: unbestimmt, also nicht einmal prinzipiell durch irgendeine Messung bestimmbar! Oder man bestimmt den Impuls genau, dann ist der Ort unbestimmt. Man muss also einen ganz anderen 28 1.9. Noch ein wichtiger Spezialfall: Zentralpotentiale und Kepler–Gesetze Ansatz verfolgen, um die Bewegungsgleichung für Quantenteilchen aufstellen zu können, die berühmte Schrödingergleichung: i~ d ψ = Hψ dt (1.42) wobei H die Hamiltonfunktion ist und meist durch H = p2 + U (x) 2m (1.43) gegeben ist, wobei U (x) das Potential ist. 6. Aber es kommt in Zuge der Quantentheorie noch schlimmer: Schickt man Elektronen durch einen Doppelspalt, deren Spalte so weit auseinander liegen, dass dahinter die beiden Elektronenwellen nicht überlappen können, also eine wellenfreie Region entsteht, und bringt man dort eine sehr lange, dicht gewickelte Spule an. Diese erzeugt im Inneren ein konstantes Magnetfeld, das Streufeld außerhalb kann verschwindend klein angenommen werden. Nach den Gesetzen der klassischen ~ das auf das elektronenfreie Gebiet Physik kann dieses Magnetfeld B, beschränkt ist, nicht die Bewegung der Elektronen beeinflussen. Quantenmechanisch beschreibt man das Magnetfeld durch das dazugehörige ~ dass außerhalb der Spule nicht Null ist, daher die Vektorpotential A, Bahn der Elektronen sehr wohl beeinflussen kann. 1959 schlugen Aharanov und Bohm dieses Experiment vor, das auch realisiert wurde. Das Experiment zeigte, dass die Interferenzstreifen sich verschieben falls das Magnetfeld einschaltet ist! Damit ist einerseits die quantenmechanische Beschreibung die Richtigere, aber mehr noch das Potential muss in der ~ angesehen werQuantenphysik als fundamentaler als das Kraftfeld B den! Es ist also nicht wie in der klassischen Physik und wie wir es hier verwenden nur eine Hilfsgröße! 1.9 Noch ein wichtiger Spezialfall: Zentralpotentiale und Kepler–Gesetze Allen sind die drei Kepler–Gesetze bekannt. Wir wollen sie hier als Folge der Gravitationsanziehung mit Hilfe der in den vorigen Abschnitten erarbeiteten Konzeptes des Potentials berechnen. Dabei werden wir bisweilen verallgemeinern, um erkennen zu können, welche spezielle Lösung von der Natur in unserem Sonnensystem vorherrscht. 29 Kapitel 1. Die Newtonsche Mechanik Das 1. Kepler–Gesetz lautet “Die Planeten bewegen sich auf Ellipsen mit der Sonne in einem Brennpunkt”. Wir haben es hier mit einem 2 Körperproblem (Sonne+Planet) zu tun. Wir wählen den Koordinatenurspursprung im Massenmittelpunkt von Erde und Sonne (das kann man immer tun, da die Schwerpunktbewegung und die Relativbewegung getrennt erhalten sind, was wir hier nicht beweisen). Somit müssen wir uns nur mit den relative Koordinaten beschäftigen und haben mM die reduzierte Masse µ = m+M einzusetzen, die aber bei Sonne und Planet mM im Wesentlichen m+M ≈ m ist, da m ¿ M . Erfolgt die Bewegung in 3 Dimensionen reicht im Allgemeinen der Energiesatz für die analytische Lösung der Newtonschen Gleichungen nicht aus. Die Integration gelingt allerdings, wenn auch der Drehimpuls ~ := ~r × p~ L (1.44) erhalten ist. Multiplizieren wir die Bewegungsgleichungen für die Bahnkurve ~r(t) vektoriell mit ~r(t): m ~r(t) × ~r¨(t) = ~r(t) × F~ (1.45) ~ durch und definieren, das auf das Teilchen wirkende Drehmoment D ~ = ~r × F~ D (1.46) ~ als auch D ~ ändern sich bei Verschiebung des Ursprungs, (Achtung: Sowohl L im Gegensatz zu F~ , p~) Da ~r˙ ×~r˙ immer Null ist, können wir die Gleichung (1.45) so schreiben: d~ ~ . L = D (1.47) dt Die zeitliche Änderung des Drehimpulses ist also gleich dem Drehmoment. Damit gilt, falls das Drehmoment verschwindet ist der Drehimpuls erhalten: d~ ~ ~ ~ = (const) ~ = ~0 −→ L = 0 =⇒ L . (1.48) D dt Für Kräfte F~ ungleich Null ist das Drehmoment nur Null, wenn die Kraft parallel oder antiparallel zu ~r ist, also muss die Kraft in Richtung zum Zentrum des Bezugssystems wirken (oder entgegengesetzt). Für ein Teilchen unter dem Einfluss einer so genannten Zentralkraft ist der Drehimpuls erhalten: F~ k ± ~r −→ ~ = ~0 D −→ ~ ~ = (const) L (1.49) Drehimpulserhaltung gilt daher für alle Potentiale die nur vom Betrag von ~r abhängen. 30 1.9. Noch ein wichtiger Spezialfall: Zentralpotentiale und Kepler–Gesetze Solche Potentiale, U = U (r), heißen Zentralpotentiale und ihre Kraft ist gegeben durch ~ (r) = − ~r dU (r) F~ = −∇U r dr (1.50) und zeigt daher zum Zentrum (das wir als Ursprung unseres Koordinatensystems gewählt haben). Falls der Drehimpuls erhalten ist, dann erfolgt die Bewegung immer in einer Ebene. Wir haben damit zwei Erhaltungsgrößen d E = 0 dt d~ L = 0. dt (1.51) Betrachten wir zuerst den Drehimpulssatz. Erfolgt die Bewegung in der x, y– Ebene x(t) px (t) ~r = y(t) p~ = py (t) , (1.52) 0 0 dann zeigt der Drehimpuls in die z–Richtung. Für unser Problem werden wir allgemein am besten die Zylinderkoordinaten bzw. Polarkoordinaten (zKoordinate ist ja Null) verwenden (sind dem Problem besser angepasst): x(t) = r(t) cos(φ(t)) y(t) = r(t) sin(φ(t)) z(t) = 0 (1.53) und damit sind die Geschwindigkeiten durch ẋ(t) = ṙ(t) cos(φ(t)) − r(t) φ̇(t) sin(φ(t)) ẏ(t) = ṙ(t) sin(φ(t)) + r(t) φ̇(t) cos(φ(t)) (1.54) gegeben. Dann ergibt sich der Betrag vom Drehimpuls zu (~r˙ 2 = ṙ2 + r2 φ̇2 ) ~ = µ r2 φ̇ L = |L| bzw. φ̇ = L , µ r2 (1.55) der so genannte Zentrifugalterm (warum?) und damit haben wir die folgende Energieerhaltung (der Relativbewegung) E= µ ṙ2 µ ~r˙ 2 + U (r) = + Uef f (r) 2 2 31 (1.56) Kapitel 1. Die Newtonsche Mechanik mit L2 + U (r) . 2µr2 Uef f (r) = (1.57) Das Gravitationspotential ist mit U (r) = − αr gegeben, wobei α = GM m, 1 q2 falls wir das Coulombpotential betrachten würden, dann wäre α = −q . 4πε0 Weiters ist es ein 1–dimensionales Problem (Bewegung erfolgt in einer Ebene), das heißt wir können es genauso behandeln, wie in Abschnitt 1.6. Wir erhalten also ganz analog zu Gleichung (1.29) die Lösungen der Newtonschen Bewegungsgleichungen durch Z r dr0 q t − t0 = , (1.58) 0 r0 =r(t0 ) 2(E−U (r )) µ welches als Inverses r(t) liefert und durch Integration von φ̇ = L dφ = µ Z t t0 dt0 , r(t0 )2 φ0 = φ(t0 ) , L , µr2 also (1.59) erhält man φ(t). Damit haben wir dann die Bahnkurve (1.53) durch r(t) und φ(t) bestimmt. Wir interessieren uns im Folgenden nicht für die Zeitabhängigkeit direkt, sondern mehr für die Form der Bahn (Kreis, Ellipse,. . . ), daher wählen wir eine andere Parameterdarstellung und zwar wollen wir r(φ) bestimmen und haben damit die Lösung in der Form (vergleiche mit (1.53)): x(φ) = r(φ) cos(φ) y(φ) = r(φ) sin(φ) . (1.60) Aus √ q 2µ 2 r E − Uef f (r) L Z r L dr0 p =⇒ φ − φ0 = √ , 2µ r0 r02 E − Uef f (r0 ) ṙ dr = = dφ φ̇ (1.61) geben. Die Newtonschen Bewegungsgleichungen lassen sich sogar analytisch Lösen, allerdings gibt es eine elegantere Methode and die Bahnformen heranzukommen, die auch einen tieferen Einblick in die Physik des Problems gibt, den wir daher hier wählen. 32 1.9. Noch ein wichtiger Spezialfall: Zentralpotentiale und Kepler–Gesetze Schauen wir uns eine endliche Bewegung an, d.h. eine, bei der sich das Teilchen in einem endlichen Raumgebiet bewegt. Damit eine solche Bewegung möglich ist, muss es (mindestens) einen oberen und einen unteren Umkehrpunkt geben, die wir r> bzw. r< nennen. Für den unteren Umkehrpunkt r< sorgt falls L 6= 0 im Allgemeinen das Zentrifugalpotential (warum?). Damit es einen oberen Umkehrpunkt gibt, muss das effektive Potential für r > r< (mindestens) ein Minimum haben. Eine endliche Bewegung wird auftreten, wenn E richtig liegt (und die weiteren Details ergeben sich durch die Besonderheiten des exakten Potentialverlaufs), siehe Fig. 1.4. Abbildung 1.4: Potential (hier U = V ) für radialsymmetrische Zentralpotentiale. Für radialsymmetrische Zentralpontentiale verläuft die Bahnkurve zwischen zwei Kreisen mit den Radien r< (für Planeten heißt dieser Kreis Perihel) bzw. r> (für Planeten heißt dieser Kreis Aphel) und hat entweder die Form einer Rosette oder einer Maanderkurve, vgl. Fig. 1.5. Abbildung 1.5: Eine Rosettenbahn oder eine Mäanderbahn. Wie man sieht ist eine Kreisbahn nur für sehr spezielle Werte von E und 33 Kapitel 1. Die Newtonsche Mechanik ~ möglich, nämlich dann wenn E = min Uef f entspricht, dann fallen die |L| zwei Umkehrpunkte r< und r> zusammen. Wie kommt man jetzt zu den Keplerbahnen. Wir wissen die Bahnen sind ~ geschlossen. Es muss noch eine weiter Erhaltungsgrößen geben (außer E, L), da wir wissen, dass die Bahn sich nicht dreht, d.h. wir suchen nach einer Größe, deren Zeitkonstanz eine Drehung der Rosette verhindert. Was kann das für ein Vektor sein? Er wir in der Bahnebene zu suchen sein (also in der x, y–Ebene). Als ~ d (~r × L) ~ zur Verfügung. Die “Kandidaten” haben wir nur ~r, p~, ~r × L, dt Zeitableitungen von Ort und Impuls kommen direkt in den Newtonschen Bewegungsgleichungen vor, haben wir also schon behandelt. Bleibt also nur der letzte Kandidat, seine Zeitableitung ergibt d ~ = −∇U ~ (r) × L ~ = − α ~r × L ~ p~ × L dt r3 α 1 = (~p − 2 ~r · (~r · p~)) . r r (1.62) Betrachten wir die Zeitableitung von µα · d ~r α 1 = (~p − 2 ~r · (~r · p~)) . dt r r r (1.63) Beide Ausdrücke sind gleich, d.h. die Differenz ist Null und damit ist der entsprechende Vektor ~ = p~ × L ~ − µα ~r A r (1.64) ~ = 0 und wird Lenz–Runge–Vektor genannt. zeitlich erhalten dtd A ~ ist es egal, an welchem Punkt der Bahn wir Für die Berechnung von A beginnen, wählen wir die x–Achse, dann folgt 34 1.9. Noch ein wichtiger Spezialfall: Zentralpotentiale und Kepler–Gesetze ~ · ~r = A r · cos φ A (1.65) ~ · ~r = L2 − µαr . A (1.66) und Durch Gleichsetzen beider Gleichung erhalten wir 2 A r · cos φ = L − µαr =⇒ r(φ) = 1+ L2 µα A cos φ µα (1.67) und damit die gesuchte Lösung für (1.60). Wenn wir die Parameterdarstellungen von Kegelschnitten (Brennpunkt im Ursprung), Fig. 1.6, betrachten, erkennen wir,—abhängig von den Werten von E, L— ergeben sich unterschiedliche Lösungen. Ein Vergleich ergibt den folgenden Halbparameter und die folgende Exzentrizität L2 µα A ε = µα p = (1.68) • Betrachten wir den Fall α > 0, also eine anziehende Wechselwirkung (Gravitation oder Coulombkraft mit q1 q2 < 0). Dann gilt p ≥ 0 und ε ≥ 0 und wir haben (vgl. Fig. 1.6) ε 0 ε ε = < = > 0 . . . Kreis ε < 1 . . . Ellipse 1 . . . Parabel 1 . . . Hyperbel • Betrachten wir den Fall α < 0, also eine abstoßende Wechselwirkung (Coulombkraft mit q1 q2 > 0), dann erhalten wir den folgenden Kegelschnitt (vgl. Fig. 1.6) r(φ) = |p| . −1 + |ε| cos φ (1.69) Natürlich muss der Radius positiv sein, daher −1 + |ε| cos φ > 0 und das ist nur für |ε| > 1 der Fall. Damit haben wir eine Hyperbel Lösung. 35 Kapitel 1. Die Newtonsche Mechanik Abbildung 1.6: Kegelschnitte 36 1.10. Weitere Erhaltungssätze Welche Lösung gilt für das System Erde–Sonne? Dazu müssen wir den Betrag vom Lenz–Runge Vektor bestimmen, dieser ergibt mit ~ 2 = p~ 2 L2 ; (~p × L) und ~r˙ 2 = ṙ2 + ~ = (~r × p~) · L ~ = L2 ~r · (~p × L) L2 µ2 r2 p µ2 α2 + 2µEL2 . (1.70) q 2 A Damit haben wir die Exzentrizität ε = µα = 1 + 2EL durch die Gesamtµα2 energie und den Drehimpuls ausgedrückt. Für eine gebundene Bewegung muss die Energie E negativ sein, der Ausdruck unter der Wurzel muss natürlich positiv sein ~ = A = |A| E≥ −µα2 = E min 2L2 (1.71) und damit gilt E min ≤ E < 0 ⇔ 0≤ε<1 (1.72) und unsere Lösung ist eine Ellipse falls die Gesamtenergie nicht gleich E min ist. Unter welchen Umständen wäre das der Fall? 1.10 Weitere Erhaltungssätze Wie bereits bemerkt sind die Newtonschen Gleichungen nur in Ausnahmefällen (Beispiele?) linear. Eine allgemeine analytische Lösung ist daher in der Regel nicht möglich. Unter Umständen, d.h. für bestimmte Kraftypen kann man eine Lösung erhalten, wenn es gelingt aus Ort und Impuls Größen zu konstruieren, die von der Zeit unabhängig sind (so genannte Erhaltungsgrößen), wie zum Beispiel der Drehimpuls, die Energie oder der Lenz–Runge– Vektor. Hier befassen wir uns damit, welche es noch gibt? Betrachten wir System von N Teilchen mit konstanten Massen. Für ein einzelnes Teilchen n ist der Impuls p~ n nur erhalten, wenn die entsprechende Kraft F~ (n) verschwindet. Nicht besonders interessant, aber wenn wir alle N Teilchen betrachten, erhalten wir die folgende zweite Newtonsche Gleichung N X n=1 p~˙ (n) = N N X d X (n) p~ = F~ dt n=1 n=1 37 (n) . (1.73) Kapitel 1. Die Newtonsche Mechanik Wir nennen die Summe der Impulse aller Teilchen den Gesamtimpuls P~ = N X p~ (n) = n=1 N X m (n) ~v (n) (1.74) n=1 und es gilt offenbar, falls die Kräfte einander insgesamt aufheben: N X F~ (n) = 0 =⇒ P~ = const. (1.75) n=1 Man sieht hier auch gleich, warum der Begriff des Impulses eines Teilchens ein besseres Konzept als die Geschwindigkeit ist: die Summe der Geschwindigkeiten aller Teilchen ist nur dann erhalten, falls alle Teilchen die gleiche Masse haben! Die Erhaltung des Gesamtimpulses entspricht dem 3. Axiom: teilen wir das System in zwei Teile, wobei das eine Teilsystem aus Teilchen Nr.1 bis Nr.k besteht und das zweite aus den restlichen N −k Teilchen besteht, so bedeutet das Verschwinden der Gesamtkraft, dass die Kraft auf das eine Teilsystem genau entgegengesetzt gleich derjenigen ist, die auf das andere Teilsystem wirkt. Der Erhaltungssatz für den Gesamtimpuls ist also gleichbedeutend mit dem Verschwinden der Gesamtkraft und bildet ein Kriterium dafür, dass das betrachtete System abgeschlossen, also als isoliert von der übrigen Welt betrachtet werden kann. Stellt man fest, dass für ein konkretes System der Erhaltungssatz nicht gilt, dann kann man in der Regel darauf schließen, dass das System nicht abgeschlossen ist. In der Teilchenphysik hat es dazu geführt, dass noch unbekannte Teilchen vorausgesagt wurden, die man später auch tatsächlich gefunden hat. Aus der Erhaltung des Gesamtimpulses kann ein weiter wichtiger Satz gefolgert werden. Definieren wir die Gesamtmasse unseres Systems durch M = N X m (n) , (1.76) n=1 dann kann man den Gesamtimpuls so schreiben P~ := M V~ , (1.77) wobei der Geschwindigkeitsvektor V~ konstant ist (Gesamtimpuls ist ja konstant) und durch V~ = N N 1 X (n) (n) d 1 X (n) (n) d ~ R m ~v = m ~r =: M n=1 dt M n=1 dt 38 (1.78) 1.11. Schwarze Löcher gegeben ist. Die auf der rechten Seite auftretende Größe ist der Ortsvektor des Schwerpunktes des Systems. V~ ist die Geschwindigkeit, mit der sich der Schwerpunkt bewegt. Da V~ konstant ist, können wir einfach integrieren und erhalten ~ = R ~ 0 + V~ t . R (1.79) Der Schwerpunkt bewegt sich daher geradlinig und gleichförmig, das ist der Schwerpunktsatz. 1.11 Schwarze Löcher Kann man Schwarze Löcher mit Hilfe von der Newtonschen Mechanik verstehen? Betrachten wir mal die Kenngrößen unserer Sonne, sie hat eine Masse M = 1.99 · 1030 kg und einen Radius von R = 6.96 · 108 m und ist damit viel viel größer als irgendein Planet, aber verglichen mit anderen Sonnen (Sternen) ist sie im guten Mittelfeld. Betrachten wir die Fluchtgeschwindigkeit eines Körpers von der Sonne (siehe auch Übungen), dann gilt r v = 2GM R und hängt damit nur von der Masse und Radius der Sonne ab. An der Oberfläche der Sonne beträgt v = 6.18 · 105 m/s oder 1/500 der Lichtgeschwindigkeit c. Halten wir jetzt die Masse fest und variieren den Radius, so folgt für Sonnen, die einen ≈ 500 kleineren Radius haben als unsere Sonne, dass die Fluchtgeschwindigkeit gleich c ist. Das hat 1783 Rev. John Mitchell erkannt. Damit wurde die Idee eines schwarzen Loches geboren oder eines Objektes, “das das gesamte Licht wieder einfangen würde”. Aus unseren Überlegungen folgt also, dass, wenn wir in der obigen Gleichung v = c setzen, erhalten wir , bei dem der Körper kein Licht mehr hergibt. Aber den Radius RS = 2GM c2 ist das korrekt? Die Allgemeine Relativitätstheorie ergibt den gleichen Schwarzschildradius, gefunden 1916 vom Herrn Karl Schwarzschild. Wie ist das möglich? Bei unserer Rechnung haben sich zwei Fehler kompensiert, einerseits ist die kinetische Energie von Licht nicht mc2 /2 (sondern?) und das Gravitationspotential in der Nähe eines schwarzen Loches ist nicht U (r) = − αr . 39 Kapitel 1. Die Newtonsche Mechanik 1.12 Welches Raum-Zeit Konzept steckt hinter den Newtonschen Gleichungen? Hier wollen wir uns damit befassen, welche Geometrie der “Newtonschen Welt” zu Grunde liegt, in der die Bewegungsgleichungen formuliert wurden. Zunächst haben wir mal ein vierdimensionale Welt vor uns, genauer eine vierdimensionale Mannigfaltigkeit (t, ~r) (manche moderne Theorien gehen durchaus davon aus, das es noch extra Dimensionen gibt, aber eindeutige Beweise dafür gibt es noch nicht). Eine n–dimensionale Mannigfaltigkeit ist ein Gebilde, das sich durch ein Koordinatensystem überdecken lässt, oder anders ausgedrückt, sich lokal, also im Kleinen, wie der Rn (R . . . reelle Zahlen) aussehen. Entspricht also unserem aus dem Alltag und der Schule geprägtem Bild unserer Welt. Der Punkt ist, dass im Großen die Gestalt jedoch beliebig kompliziert sein kann, z.B. eine Kugel (Sphäre), ein Torus, ein Möbiusband, eine Brezelfläche,. . . . Die Mannigfaltigkeit kann man sich also aus lauter Punkten aufgebaut denken, wobei in jedem Punkt ein (z.B. kartesisches) Koordinatensystem mit einer Uhr angebracht ist. Prinzipiell erhält man Auskunft über die Struktur von Raum und Zeit, indem man mit physikalischen Maßstäben und Uhren misst und aus den Messdaten ein Koordinatennetz errichtet. Ob die erhaltenen Mannigfaltigkeit euklidisch ist oder nicht, hängt von den physikalischen Gegebenheiten ab (Beispiel einer nichteuklidischen Welt: z.B. beheizte Platte). Solange man nur die Bewegung freier Teilchen betrachtet, sind die Galileitransformationen (siehe unten) nur Änderungen der mathematischen Beschreibung ohne Änderung der beschriebenen Physik (verschiedene Beobachter benützen nur unterschiedliche Koordinaten und beobachten das gleiche Phänomen). Aber die Annahme, dass diese Eigenschaft auch dann noch gelten soll, wenn wir wechselwirkende Teilchen betrachten, erscheint sehr plausibel und entspricht auch der Struktur der Newtonschen Gleichungen, sie ist aber eine nicht–triviale Hypothese und hat als Konsequenz, die Existenz eines absoluten Raumes und einer absoluten Zeit. Wie kommt man auf die Transformationen: Eine Lehrkraft führt einen Versuch durch, bei dem die Bahn eines Teilchens aufgezeichnet wird. Bob, der Eigenbrötler, besteht darauf sich ein anderes IS auszusuchen und außerdem ist er auch noch ein Besserwisser und behauptet, dass für beliebige IS das Relativitätsprinzip von Galilei gilt: “Alle IS sind gleichwertig”, also darf ich mir auch ein Eigenes aussuchen! “Na gut”, sagt Anna und nimmt die Herausforderung an. Beide beobachten die Bahn eines kräftefreien Teilchens, Anna in ihrem KS (x, y, z, t) und Bob in seinem KS’ (x0 , y 0 , z 0 , t0 ). Anna findet 40 1.12. Welches Raum-Zeit Konzept steckt hinter den Newtonschen Gleichungen? folgende Bewegungsgleichungen m ~r¨(t) = 0 , (1.80) m ~r¨ 0 (t0 ) = 0 , (1.81) und Bob diese Beide haben sich ein IS ausgesucht (woran erkennt man das?). Um beide Ergebnisse vergleichen zu können, muss man den Zusammenhang zwischen den ungestrichenen und gestrichenen Koordinaten bestimmen, das führt dann zu den berühmten Galileitransformationen. Seien die beiden Koordinatensysteme wie in der folgenden Graphik gewählt, also parallele Achsen und damit gleiche Basisvektoren und t0 = 0: Der Ortsvektor eines bestimmten Massenpunktes P sei ~r = xi ~ei in IS und 0 0 ~r = xi ~ei und der Zusammenhang ist 0 ~ . ~r(t) = ~r (t) + d(t) (1.82) Betrachten wir ein kräftefreies Teilchen in IS, dann erhalten wir: 0 ~¨ . m ~r¨(t) = 0 = m ~r¨ (t) + m d(t) (1.83) Das neue Bezugssystem ist genau dann ein IS falls m ~r¨ (t) = 0 und damit folgt 0 ~¨ = ~0 d(t) −→ ~ d(t) = ~v t + ~b , (1.84) wobei ~b ein konstanter Vektor ist. Das bedeutet, dass sich IS’ gegenüber IS mit konstanter Geschwindigkeit bewegt und um einen konstanten Vektor ~b 41 Kapitel 1. Die Newtonsche Mechanik verschoben sein kann. Damit haben wir die Galileitransformationen hergeleitet: 0 ~r = ~r − ~v t − ~b (1.85) t0 = t − t0 . (1.86) Bei Verwendung dieser Transformation bleiben Newtonsbewegungsgleichungen forminvariant oder kovariant, bzw. ändern ihre Form nicht. Galileis Relativitätsprinzip postuliert diese Kovarianz für alle grundlegenden Gesetze. Wir haben bei der Herleitung nur eine beliebige Bewegung des Ursprungs in Betracht gezogen, natürlich kann man auch zu einander konstant verdrehte Koordinatensysteme betrachten (zeitabhängige Rotationen würden zu Zusatztermen führen, siehe nächster Abschnitt 1.13). Die allgemeinen Galileitransformationen lautet damit: 0 ~r (t) = R ~r(t) − ~v t − ~b t0 = t − t0 . (1.87) (1.88) Sie setzt sich daher aus folgenden Transformationen zusammen: 1. Einer räumlichen Verschiebung um einen konstanten Vektor ~b, 2. einer räumlichen Verschiebung um ~v t, 3. einer Rotation, beschrieben durch die Rotationsmatrix R, R RT = 1, 4. und einer konstanten zeitlichen Verschiebung um t0 . Die Galileitransformationen hängt damit von 10 Parametern ab: Die Drehung wird zum Beispiel durch 3 Winkeln oder der Einheitsdrehachse plus einem Winkel 2 + 1 = 3 beschrieben; dazu kommen dann 3 Parameter von der Relativgeschwindigkeit ~v , 3 Parameter vom Verschiebungsvektor ~b und 1 Parameter von der Verschiebung der Zeit um t0 . Zwei hintereinander durchgeführte Galileitransformationen IS zu IS’ und IS’ zu IS” führen wieder zu einen IS”, sie definieren eine neue Galileitransformation von IS zu IS”. Natürlich gibt es auch die triviale Transformation von IS zu IS. Damit bilden die Galileitransformationen ein Gruppe, sie wir auch Galileigruppe genannt. Das interessante ist meist die Relativebewegung verschiedener IS und die kann man praktischer Weise auch nur in eine Koordinate legen, diese Transformationen, werden als spezielle Galileitransformation bezeichnet. 42 1.13. Beschleunigte Bezugssysteme Wann gelten die Galileitransformationen? Dieser Frage werden wir uns dann später nochmals widmen. 1.13 Beschleunigte Bezugssysteme Inertialsysteme (IS) haben wir dadurch definiert, dass in ihnen Newtons Axiome gelten. Nicht IS sind also Systeme, die relative zu einem IS beschleunigt sind, es treten Zusatzterme auf, so genannte Trägheits- oder Scheinkräfte. Achtung: Der Name Scheinkraft darf hier nicht missverstanden werden. In beschleunigten Bezugssystemen (BS) sind diese Kräfte wirklich vorhanden (also wirklich spürbar!). Sie unterscheiden sich von den “echten” Kräften aber dadurch, dass sie durch den Übergang zu einem IS wegtransformiert werden können. Nicht-IS sind aber nicht unnötig oder gar unbrauchbar, falls sich der Beobachter in einem beschleunigten BS befindet, möchte dieser seine Beobachtungen natürlich von diesem System aus verstehen können. Wir bestimmen hier die Zusatzterme, die auftreten falls wir zu eine IS linear beschleunigtes BS oder ein rotiertes BS betrachten. 1.13.1 Linear beschleunigtes Bezugssystem ~ Unsere BS sei ein zu IS konstant in Richtung d(t) = ~a2 t2 ; ~a = const. beschleunigtes System, d.h. ein Ortsvektor in IS hat den Zusammenhang mit dem BS durch: ~a 0 0 ~ ~r (t) = ~r (t) + d(t) = ~r (t) + t2 . 2 (1.89) Aus 1. Axiom folgt für die Bewegungsgleichung eines kräftefreien Teilchens m ~r¨(t) =; 0 im IS und damit 0 m ~r¨ (t) = 0 = m ~r¨ (t) + m ~a 0 =⇒ m ~r¨ (t) = −m ~a im BS’ . (1.90) Der Zusatzterm auf der rechten Seite bedeutet, dass Newtons 1. Axiom im BS’ (betrachten ja ein kräftefreies Teilchen) nicht gilt und entspricht einem konstanten Kraftfeld, wenn wir die Bewegungsgleichung im BS’ mit der Form des 2. Axioms vergleichen und werden daher Trägheitskräfte genannt. Ein Beispiel sind die Kräfte, die ein Passagier im Flugzeug spürt. Beispiel: “Beschleunigungsmesser” 43 Kapitel 1. Die Newtonsche Mechanik Moderne Theorie “Allgemeine Relativitätstheorie”: Wie erwähnt geht Einstein von der Äquivalenz von schwerer und träger Masse aus (siehe auch Abschnitt 1.5) und damit von der Äquivalenz von Trägheits– und Gravitationskräften aus. Die Grundidee ist in etwa so: In einem lokal frei– fallenden BS, also einem konstant beschleunigten BS (z.B. Satelliten–Labor) laufen alle Prozesse so ab, als gäbe es keine Gravitation. Ausgehend von den gewonnenen Gesetzen ohne Gravitation kann man durch Transformation zum betrachteten BS, z.B. einem Labor auf der Erde, die entsprechenden Gesetze mit Gravitation erhalten. Allerdings gibt es einen entscheidenden Unterschied zu dem hier betrachteten Beispiel, Beschleunigungen sind im realen Gravitationsfeld ortsabhängig und man muss natürlich die relativistischen Gesetze betrachten. 1.13.2 Rotierende Bezugssysteme Da unsere Erde ein solches BS ist, ist dieser Fall von besonderen Interesse. Betrachten wir ein gegenüber einem IS mit der Winkelgeschwindigkeit ω ~ rotiertes BS’. Betrachten wir zunächst einen Vektor V~ , der vom BS’ aus gesehen zeitunabhängig ist, er soll konstante Länge haben und bildet konstante Winkeln mit den Koordinatenachsen (oder Drehachsen). Aus der obigen Abbildung kann man sehen, dass für die Änderung dieses Vektors aufgrund der Rotation von BS’ gilt |dV~rot | = |V~ | |d~ ϕ| sin θ, dV~rot ⊥ ω ~ , dV~rot ⊥ V~ (1.91) und damit folgt dV~rot = d~ ϕ × V~ = (~ω dt) × V~ . (1.92) Nun lassen wir den Vektor V~ von der Zeit abhängen. Im BS’ ändert er sich während dt um dV~BS 0 und damit ist die Änderung von diesem Vektor aus IS betrachtet dV~IS = dV~BS 0 + dV~rot . 44 (1.93) 1.13. Beschleunigte Bezugssysteme Mit der obigen Beziehung erhalten wir also à dV~ dt ! à = IS dV~ dt ! +ω ~ × V~ . (1.94) BS 0 Jeder Ortsvektor eines Massenpunktes kann nach den Basisvektoren ~ei von IS entwickelt werden, aber natürlich auch in den Basisvektoren ~e 0i (t) des rotierten BS’ ~r (t) = 3 X xi (t) ~ei = i=1 3 X x0i (t) ~e 0i (t) . (1.95) i=1 Da wir voraussetzen, dass der Koordinatenursprung beider Systeme gleich ist und wir Ortsvektoren betrachten, gilt ~r = ~r 0 . Die Basisvektoren des rotierten BS’ hängen von der Zeit ab, die aus IS nicht. Berechnen wir nun die Geschwindigkeit, erhält man nach der Kettenregel 3 3 X X dx0i (t) 0 d~e 0i (t) 0 ˙~r = d~r = ~ei (t) + xi (t) dt dt dt i=1 i=1 = ~r˙ 0 + ω ~ × ~r 0 . (1.96) Wir wollen jetzt die Bewegungsgleichung eines kräftefreien Teilchens in BS’ betrachten und beschränken uns auf eine Rotation mit konstanter Winkelgeschwindigkeit ω ~ = const. Dazu wenden wir Gl. 1.94 auf den Geschwin˙ digkeitsvektor ~r an und erhalten schlussendlich à d~r˙ dt ! = r̈0 + 2 ω ~ × ~r˙ 0 + ω × (ω × ~r 0 ) . IS 45 (1.97) Kapitel 1. Die Newtonsche Mechanik Damit haben wir hergeleitet, dass für ein kräftefreies Teilchen im IS, also µ 2 ¶ d ~r ¨ m ~r = = 0, (1.98) dt2 IS im rotierten System mit konstanter Winkelgeschwindigkeit gilt m r̈ 0 = −2 m ω ~ × ~r˙ 0 − m ω × (ω × ~r 0 ) . (1.99) Der erste Term auf der rechten Seite wir als Corioliskraft, der zweite als Zentrifugalkraft bezeichnet. Die Corioliskraft steht senkrecht zur Bewegungsrichtung (es ist schwierig auf einem Karussell geradeaus zu gehen) und ist proportional zu ω. Die Zentrifugalkraft ist proportional zu ω 2 und zum Abstand zur Drehachse und zeigt von ihr weg (bei einem schnell rotierenden Karussell muss man sich gut festhalten). Die Coriolisbeschleunigung durch die Rotation der Erde ist zwar klein vom Betrag her, hat jedoch deutliche Auswirkungen auf die Bewegung von Luft– und Wassermassen (Passatwinde, stärkere Erosion des rechten Ufers auf Nordhalbkugel,. . . ). 46 Kapitel 2 Lagrangesche Mechanik Hier entwickeln wir eine elegante und einfache Betrachtungsweise der Newtontheorie, die eine Verallgemeinerung für quantenmechanische und relativistische Systeme ermöglicht. 2.1 Einleitung/Motivation Wir haben bis jetzt den Zugang zur Mechanik über die Newtontheorie gewählt. Im Wesentlichen erfasst man die Bewegung eines zusammengesetzten Systems durch die Bewegung seiner Bestandteile (meist “Teilchen”) und derer Wechselwirkung, also der Kräfte die zwischen ihnen wirken. Da wir wissen, dass die Materie atomistisch ist, erscheint dieser Zugang für eine große Anzahl an Phänomenen realistisch. Aber sehr oft sind die Ortskoordinaten und Impulse der Teilchen nicht wirklich zweckmäßig, um ein System zu analysieren, es gibt besser geeignete Koordinaten, um das System zu beschreiben. Betrachten wir zum Beispiel das ebene Pendel (siehe Fig. 2.1(a)), dann gibt es eine einzige Koordinate, die sich ändert, der Winkel. Es ist also eigentlich ein 1–dimensionales Problem, die Bewegung erfolgt zwar in 2 Dimensionen, ist aber auf einen Kreis gezwungen. Daher ist es sicher dem Problem besser angepasst, wenn man den Winkel als Koordinate auffasst. Bei dem Lagrange–Hamiltonschen Zugang zur Mechanik werden daher im Allgemeinen nicht die Teilchenkoordinaten als dynamische Variable verwendet, sondern so genannte “generalisierte” Koordinaten qα (t), wobei α = 1, 2, . . . , f die f verschiedenen Freiheitsgrade bezeichnet. Im obigen Beispiel “Pendel” wäre q = φ. Für ein Doppelpendel haben wir 2 Freiheitsgrade (siehe Fig. 2.1(b)), q1 = φ1 , q2 = φ2 . Man versucht also wirklich nur die relevanten und unabhängigen Variablen für die Beschreibung zu verwenden. Im Allgemeinen stellen wir uns vor, dass es prinzipiell möglich sein sollte, 47 Kapitel 2. Lagrangesche Mechanik (a) (b) Abbildung 2.1: (a) Zeigt die generalisierte Koordinate des Pendel und (b) die generalisierten Koordinaten eines Doppelpendels. die Teilchenkoordinaten aus den generalisierten Koordinaten und umgekehrt berechnen zu können qα = qα (~r (1) , ~r (2) , . . . , ~r (N ) , t) α = 1, 2, . . . , f (n) (n) ~r = ~r (q1 , q2 , . . . , qf , t) n = 1, 2, . . . , N (f ≤ 3N ) . (2.1) (2.2) Nun versucht man nicht die Bewegungsgleichungen der generalisierten Koordinaten durch Einsetzen der Transformationen der Teilchenkoordinaten zu gewinnen (das haben wir ja zum Beispiel beim Pendel gemacht φ̈ = − gl φ), damit würden wir nichts Neues gewinnen, sondern man wählt einen anderen Ausgangspunkt, das Hamiltonsche Wirkungsprinzip, das Prinzip der kleinsten Wirkung. Mathematisch ist es ein Variationsproblem. Die Bewegungsgleichungen sind die Euler–Langrangeschen Gleichungen dieses Variationsproblems. D.h. an die Stelle von Ansätzen für Kräfte tritt ein Ansatz für eine Funktion der generalisierten Koordinaten, d.h. wir müssen eine solche Funktion “erraten” und nicht mehr “Kräfte”. Wir werden sehen, dass dies oft viel einfacher ist. Aber es gibt noch viel mehr Vorteile durch diese Methode. Der Formalismus kann weit über die Mechanik hinaus verwendet werden, er gestattet eine allgemeine Formulierung von “Dynamik” eines Systems im Laufe der Zeit. D.h. so können z.B. quantenmechanische Systeme behandelt werden, aber auch Systeme mit kontinuierlich unendlich vielen Freiheitsgraden (Feldtheorien) und relativistische Systeme. Alle 4 fundamentalen Wechselwirkungen (schwache, starke, elektromagnetisch, gravitative) können mit diesem Formalismus behandelt werden! 48 2.2. Generalisierte Koordinaten und deren Geschwindigkeiten Auch die größere Einfachheit bei einer sehr großen Klasse von Problemen ist ein Vorteil. Weiters –wie wir sehen werden– erkennt man viel besser die Zusammenhänge zwischen Geometrie und Physik (Symmetrien und Erhaltungssätze,. . . ). Für manche Probleme ist aber dieser Zugang auch Newtonstheorie unterlegen. Reibungskräfte sind schwer zu behandeln. Historisch hat sich der Hamiltonsche–Lagrangesche Formalismus durch das Problem der Zwangskräfte ergeben. Bei einem Pendel übt der Faden die Zwangskraft auf die Masse aus, die im Gleichgewicht mit der entsprechenden Komponente der Gravitationskraft steht. Beim ebenen Pendel ist es noch nicht schwer diese zu beschreiben, aber denkt man an das Doppelpendel, dann ist es gar nicht mehr einfach, zu erkennen, wo welche Zwangskraft, die sich ja auch noch zeitlich ändert, angreift. Also schon das Doppelpendel ist à la Newton schwer zu lösen, mit Lagrange ist es ganz einfach (wie wir sehen werden). Mehr noch, es ist ganz klar, wie eine Verallgemeinerung zu einem Dreifach–, Vierfach–,. . . Pendel auszuschauen hat. Zwangskräfte treten sehr oft auf, man denke nur an mechanische Maschinen. Zusammenfassend ist der Hamiltonsche–Lagrangesche Zugang das Tor zur Modernen Physik und daher denke ich, sollte eine zukünftige Lehrkraft die Grundideen verstehen, obwohl man diesen Zugang in dieser Form in der Schule nicht unterrichten kann. Und wenn man sich in die Materie ein wenig “reingetigert” hat, wir man auch feststellen, dass es gar nicht so schwer ist und vielleicht auch ihre Schönheit bewundern. :-) 2.2 Generalisierte Koordinaten und deren Geschwindigkeiten Prinzipiell sollten generalisierte Koordinaten qα , die Lage eines Systems zum Zeitpunkt t festlegen, stetig und mindestens 2 mal nach der Zeit t ableitbar sein. Die erste Ableitung nach der Zeit q̇α nennt man generalisierte Geschwindigkeit. Wie wir von Newton wissen, braucht man zur Lösung seiner Differentialgleichungen die Anfangsbedingungen r(n) (t0 ) und ṙ(n) (t0 ). Genauso ist es für die generalisierte Koordinate, wir müssen qα (t0 ) und q̇α (t0 ) kennen. Die Angabe von 2f Zahlen qα (t0 ), q̇α (t0 ) soll damit ausreichen, das “Schicksal” des betrachteten Systems für alle t ≥ t0 vorauszusagen, d.h. auszurechnen. Das bedeutet, dass man die q̈α berechnen kann und die entsprechende Differentialgleichung 2. Ordnung werden wir die “Euler–Lagrangeschen” Bewegungsgleichungen nennen. Ihre Integration gibt dann die “Bahnkurven” des Systems, wobei hier Bahnkurve oft in einem sehr abstrakten Sinne zu ver49 Kapitel 2. Lagrangesche Mechanik Abbildung 2.2: Sphärisches Pendel stehen ist. Denken wir an das Pendel, erhalten wir eine Bahnkurve für einen Winkel. Der Lagrangeformalismus liefert Differentialgleichungen 2. Ordnung für die f Variablen qα (t). Der Hamiltonformalismus ist dazu eine Alternative, bei der man anstatt der generalisierten Geschwindigkeiten q̇α sich geeignete generalisierte Impuls pα definiert (haben normalerweise nichts mit dem kinetischen Impuls zu tun). Die entsprechenden Hamiltonschen Bewegungsgleichungen bilden ein System 1. Ordnung für die 2f (kein Vorteil ohne Nachteil) Variablen (qα , pα ) (graphisch können diese im Phasenraum veranschaulicht werden, den wir beim harmonischen Oszillator kennen gelernt haben). Beide Formalism beruhen auf dem gleichen Prinzip, sind also das Gleich nur unterschiedlich betrachtet. 2.3 Wie erfolgt eine Bewegung? Der Lagrange–Hamiltonsche Zugang basiert auf einem Extremalprinzip, konkret geht es um ein Minimum eines Integrals, das die Wirkung ist. Dieses Integral über eine gewisse Funktion L, die Lagrangefunktion heißt, ist der Ausgangspunkt, d.h. er ist nicht zu beweisen, und es gilt diese Funktion zu “erraten”. Analog muss auch ein Kraftansatz für die Newtonsche Mechanik erraten werden. Um eine Formulierung des Prinzips zu erhalten, gehen wir davon aus, dass das betrachtete System durch die folgende Lagrangefunktion gegeben ist L(qα (t), q̇α (t), t) = L(q1 (t), q2 (t), . . . , qf (t), q̇1 (t), q̇2 (t), . . . , q̇f (t), t) . (2.3) 50 2.3. Wie erfolgt eine Bewegung? Physiker neigen dazu sich das Leben so leicht wie möglich zu machen, daher werden wir in Zukunft nur noch q schreiben, aber qα (t) meinen, analog q̇; d.h. die obige Funktion schreiben wir auch so L(q, q̇, t) . (2.4) Wir werden auch sehen, dass das Grundkonzept unabhängig von der Anzahl der Freiheitsgrade f und damit Anzahl von den generalisierten Koordinaten ist. Das Wirkungsprinzip (Hamiltonsches Prinzip der kleinsten Wirkung) lautet dann: Die Bewegung eines Systems verläuft für Zeiten t0 ≤ t ≤ t1 so, dass das Integral, die Wirkung, Z t2 S= L(q, q̇, t) dt t1 ein Minimum annimmt. Schauen wir uns mal ein konkretes Beispiel an, den senktrechten Wurf. Wie wir wissen ist die Bewegungsgleichung à la Newton gegeben durch F = m z̈ = −m g (2.5) ż = −g t + v0 . (2.6) und einmal integrieren gibt Damit ist die Lösung der Bewegungsgleichung durch die Bahnkurve g (2.7) z(t) = − t2 + v0 t + z0 2 gegeben. Die generalisierte Koordinate ist hier also einfach die Höhe, q = z. Die graphische Bahn für die Bewegung sieht dann so aus: 51 Kapitel 2. Lagrangesche Mechanik Stellen wir uns folgendes vor, wir müssen die obige Bahn errechnen, kennen aber nur den Wert von z für t = t0 , also q(t0 ), und für t = t1 , also q(t1 ). Wir können man uns viele verschiedene Bahnen vorstellen, wie wir diese zwei Punkte verbinden können: Für jeden Weg berechnen wir jetzt das Integral, also den Zahlenwert S. Mathematisch ist es gar nicht so schwer, das Minimum zu finden, wie es vielleicht zunächst aussieht. Wir suchen ja nicht einen Punkt (bzw. eine Zahl), sondern eine Kurve, die Funktion q(t), also eine Differentialgleichung. Nennen wir die wirkliche Bahn q(t), jede andere, “falsche” Bahn, können wir durch qF (t) = q(t) + δq(t) (2.8) bezeichnen. Klarerweise muss die Funktion δq(t) für t0 und t1 verschwinden, also δq(t0 ) = δq(t1 ) = 0 , (2.9) da wir ja wollen, dass alle betrachteten Bahnen durch den betrachteten Anfangs- bzw. Endpunkt gehen sollen. Unser Ziel ist es also, dass δq(t) immer kleiner wird, hier ein Beispiel (die Werte von δq(t) sind in der unteren Kurve dargestellt): 52 2.3. Wie erfolgt eine Bewegung? und hier ein besseres Beispiel: Wenn man qF einigermaßen gut “erraten” hat, wird δq(t) im ganzen Intervall klein gegen q(t). Und wie sieht es mit der Ableitung aus: q̇F = q̇ + δ q̇ = d d q + δq . dt dt (2.10) Auch δ q̇ wird klein gegen q̇, falls qF nicht zu “eckig” ist. Betrachten wir jetzt den Unterschied der Wirkung Z t1 Z t1 δS = L(q + δq, q̇ + δ q̇, t) dt − L(q, q̇, t) dt (2.11) t0 t0 und machen eine Taylorentwicklung zur 1. Ordnung (Trick: ξ = q + δq): ¾ Z t1 ½ ∂L(q, q̇, t) ∂L(q, q̇, t) δS = L(q, q̇, t) + δq + δ q̇ + O(2) dt ∂q ∂ q̇ t0 Z t1 − L(q, q̇, t) dt t0 ¾ Z t1 ½ ∂L(q, q̇, t) dδq ∂L(q, q̇, t) = δq + + O(2) dt . (2.12) ∂q ∂ q̇ dt t0 Durch partielle Integration im letzten Term erhalten wir (O[2] wir ab jetzt weggelassen) ¶ µ µ ¶ ¾ Z t1 ½ d ∂L(q, q̇, t) d ∂L(q, q̇, t) ∂L(q, q̇, t) δq + δq − δS = δq dt ∂q dt ∂ q̇ dt ∂ q̇ t0 ¯t ¾ Z t1 ½ d ∂L(q, q̇, t) ∂L(q, q̇, t) ∂L(q, q̇, t) ¯¯ 1 δq − δq ¯ (2.13) = δq · dt + ∂q dt ∂ q̇ ∂ q̇ t0 t0 53 Kapitel 2. Lagrangesche Mechanik Der letzte Term verschwindet, da wir δq(t0 ) = δq(t1 ) vorausgesetzt haben. Wir verlangen jetzt laut Wirkungsprinzip δS = 0 (2.14) und da δq zwar klein, aber willkürlich ist, muss der Integrand verschwinden ∂L(q, q̇, t) d ∂L(q, q̇, t) − =0. ∂q dt ∂ q̇ (2.15) Das ist die Euler–Lagrange Bewegungsgleichung für unser Problem! Da wir alles ganz allgemein gehalten haben, gilt diese Differentialgleichung für q(t) für beliebige Probleme. Falls wir mehrere Freiheitsgrade f haben, gilt für jeden Freiheitsgrad einzeln die obige Herleitung und damit folgt ¾ f Z t1 ½ X ∂L(qα , q̇α , t) d ∂L(qα , q̇α , t) δS = − δqα · dt + O[2] . ∂q dt ∂ q̇ α α t 0 α=1 (2.16) und wir sehen, dass in jedem Summanden alle q außer qα als gegeben aufgefasst werden müssen (partielle Ableitung). Damit haben wir das Ziel erreicht: Für ein beliebiges Problem mit f Freiheitsgraden gilt die folgende Bewegungsgleichung für die verallgemeinerten Koordinaten: ∂L(qα , q̇α , t) d ∂L(qα , q̇α , t) − =0 ∂qα dt ∂ q̇α α = 1, 2, . . . , f . (2.17) Ihre Lösungen bestimmen damit die Dynamik, also die zeitliche Entwicklung des Systems. Aber wie “errät” man die Funktion L? 2.4 Wie “errät” man die Lagrangefunktion? Kommen wir zurück zu unserem Beispiel, dem senktrechten Wurf. Die Bewegungsgleichung lautet (siehe Gleichung 2.5) m q̈ = −m g . (2.18) Diese soll sich ergeben durch d ∂L(q, q̇, t) ∂L(q, q̇, t) = . dt ∂ q̇ ∂q 54 (2.19) 2.4. Wie “errät” man die Lagrangefunktion? Setzen wir mal die Lagrangefunktion durch L = c1 q + c2 q̇ an, dann ergibt die folgende Gleichung 0 = c1 . (2.20) Die rechte Seite wäre ja schon mal ok, falls wir die Konstant c1 = −mg setzen. Aber die linke Seite führt sicher zu keiner Bewegungsgleichung. Wir müssen also für L immer Potenzen in q̇ ansetzen, die mindestens größer 1 sind. Machen wir den folgenden Ansatz für L = −m g q + c2 q̇ k mit k ≥ 2 , (2.21) Dann ergibt die Euler–Lagrangesche Bewegungsgleichung k(k − 1) c2 q̇ k−2 q̈ = −m g . (2.22) Diese Gleichung stimmt mit Gleichung (2.18) überein, falls wir k = 2 (nur dann verschwindet q̇) und c2 = m/2. Damit haben wir die Euler–Lagrangesche Bewegungsgleichung für den senktrechten Wurf gefunden L(q, q̇, t) = m q̇ 2 − mg q . 2 (2.23) Das kommt uns aber sehr bekannt vor, zur Erinnerung q = z! Der erste Term ist nichts anderes als die kinetische Energie und der zweite Term ist die potentielle Energie!! Also die Lagrangefunktion ist die Differenz der kinetischen Energie und der Potentiellen Energie L = Ekin − U !! Gilt das Allgemein? Wir haben ja ein sehr spezielles Beispiel behandelt. Aber die Antwort ist ja, im Falle von konservativen Kräfte (und nicht relativistisch), ist die obige Aussage richtig. Für nicht konservative oder relativistische Kräfte kann man aber auch den Lagrangeformalismus verwenden, man muss das entsprechende U , das nicht (nur) die potentielle Energie ist, erraten. Man sieht hier gleich einen Vorteil dieses Formalismuses, man muss nicht die 3N Kraftkomponenten für N Teilchen erraten, sondern nur die Funktion U für die f Freiheitsgrade. Weiters ist der Formalismus so allgemein, dass man auch für quantenmechanische und relativistische Systeme das richtige Mittel zur Hand hat. Bevor wir weitere allgemeine Eigenschaften von L betrachten, diskutieren wir noch weitere Bespiele à la Lagrange. Das ebene Pendel: Wie bereits diskutiert, kann man als generalisierte Koordinate einfach den Winkel φ nehmen (siehe Abbildung 2.1 (a)). Die Bewegungsgleichung m l2 φ̈ = −m g l sin φ lautet (à la Newton Rückstellkraft 55 Kapitel 2. Lagrangesche Mechanik oder über Potential (Energieerhaltung)). Schauen wir mal, ob wir das mit der oben erworbenen Strategie hinbekommen. Die kinetische Energie ist gegeben durch m ẋ2 m ẏ 2 m ż 2 m l2 φ̇2 + + = , 2 2 2 2 Ekin = (2.24) wobei wir fürs letzte Gleichheitszeichen die Polarkoordinaten eingesetzt haben. Die potentielle Energie ist durch U (z) = m g l + m g z = m g l(1 − cos φ) (2.25) und damit haben wir die folgende Lagrangefunktion L = m l φ̇2 + m g l cos φ (2.26) und wir berechnen den zu φ kanonisch konjugierten Impuls zu pφ = ∂L = m l2 φ̇ , ∂ φ̇ (2.27) das ist natürlich der Drehimpuls! Mit ∂L = −mg l sin φ folgt die Bewegungsgleichung ∂φ d ∂L ∂L = dt ∂ φ̇ ∂φ −→ m l2 φ̈ = −m g l sin φ . (2.28) Das Doppelpendel: Diesen Fall haben wir noch nicht diskutiert und er wäre auch sehr schwer à la Newton. Aber mit dem Lagrangeformalismus ist es ein Kinderspiel! Zunächst ist klar, wir haben jetzt 2 Freiheitsgrade, also 2 generalisierte Koordinaten haben, φ1 , φ2 (siehe Abbildung 2.1 (b)). Die Polarkoordinaten für die zwei Massen m1 , m2 lauten x1 (t) y1 (t) z1 (t) x2 (t) y2 (t) z2 (t) = = = = = = l1 sin φ1 0 −l1 cos φ1 l1 sin φ1 + l2 sin φ2 0 −l1 cos φ1 − l2 cos φ2 . (2.29) Die kinetische Energie ist gegeben durch Ekin = m2 2 m1 2 (ẋ1 + ẏ12 + ż12 ) + (ẋ + ẏ22 + ż22 ) 2 2 2 56 (2.30) 2.4. Wie “errät” man die Lagrangefunktion? und die potentielle Energie durch U = m1 g z1 (t) + m2 g z2 (t) . (2.31) Und damit nach Einsetzen haben wir bereits die Lagrangefunktion m1 + m2 2 2 m2 2 2 L = l1 φ̇1 + l φ̇ + m2 l1 l2 φ̇1 φ̇2 cos(φ1 − φ2 ) 2 2 2 2 +(m1 + m2 ) g l1 cos φ1 + m2 g l2 cos φ2 . (2.32) Aus dieser folgt durch simples Differenzieren die Bewegungsgleichung (siehe Übungen). Nach dem gleichen Rezept folgt die Bewegungsgleichung für ein Dreifach–, Vierfach–,. . . Pendel. Sphärisches Pendel: Dieses kann durch 2 verallgemeinerte Koordinaten φ, θ beschrieben werden (siehe Abbildung 2.2) x = l sin θ cos φ y = l sin θ sin φ z = −l cos θ l = const. (2.33) Dann ergibt sich die Lagrangefunktion zu ml2 2 (θ̇ + sin2 θ φ̇2 ) − m g l(1 − cos θ) (2.34) 2 Für die Bewegungsgleichung brauchen wir die verallgemeinerten Impulse L = ∂L = m l2 θ̇ ∂ θ̇ ∂L = = m l2 sin2 θ φ̇ ∂ φ̇ pθ = pφ (2.35) und ∂L = ml2 sin θ cos θφ̇2 − m g l sin θ ∂θ ∂L = 0. ∂φ (2.36) Bei der letzen Gleichung haben wir 0 erhalten, da diese verallgemeinerte Koordinate nicht in L vorkommt, diese nennt man zyklisch und ist von physikalischer Bedeutung (siehe auch nächsten Abschnitt). Die zwei Bewegungsgleichungen lauten damit m l2 θ̈ = m l2 sin θ cos θ φ̇2 − m g l sin θ d (m l2 sin2 θ φ̇) = 0 −→ pφ = m l2 sin2 θ φ̇ = const. dt (2.37) 57 Kapitel 2. Lagrangesche Mechanik Das sphärische Pendel dreht sich immer im gleichen Sinn um die z–Achse, schneller für kleines θ. Der zu φ konjugierte Impuls ist also eine Erhaltungsgröße. Das tritt immer auf, wenn die dazugehörige verallgemeinerte Koordinate nicht explizit in der Lagrangefunktion vorkommt, also eine so genannte zyklische Koordinate ist. Wir werden sehen, dass allgemein gilt, dass aus einer Symmetrie eine Erhaltungsgröße folgt (hier haben wir es mit einer Rotationssymmetrie bezüglich z–Achse zu tun). Ein weiter Vorteil des Lagrange Formalismuses. Ein Massenpunkt im äußeren konservativen Kraftfeld: Hier sind die kartesischen Koordinaten die besten generalisierten Koordinaten. Die Lagrangefunktion ist L(x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 ) = m 2 (ẋ + ẋ22 + ẋ23 ) − U (x1 , x2 , x3 ) 2 1 (2.38) gegeben. Folglich haben wir 3 Euler–Langrange Bewegungsgleichungen d ∂L ∂L = dt ∂ ẋi ∂xi i = 1, 2, 3 . (2.39) Und die verallgemeinerte Impulse sind ∂L = m ẋi = pi ∂ ẋi (2.40) und die rechte Seite der Euler–Langrange Bewegungsgleichungen ist ∂L ∂U = − = Fi , ∂xi ∂xi (2.41) natürlich nichts anderes als die Kraft, damit haben wir die Newtonschen Bewegungsgleichungen wie wir sie kennen d (mẋi ) = Fi . dt (2.42) Perle entlang starrem Stab: Eine Perle (Kugel mit Loch) sei reibungsfrei an einem Stab gefädelt. Der Stab rotiert um eine Achse unter dem Winkel β. Um festzustellen wie viele Freiheitsgrade es gibt, betrachten wir die Zwangsbedingungen an die Perle. Der Winkel mit der Drehachse β ist konstant, daher: cos β = p z x2 + y 2 + z 2 p −→ z − x2 + y 2 + z 2 cos β = 0 . 58 (2.43) 2.5. Erhaltungssätze und Symmetrien Die Winkelgeschwindigkeit ist auch konstant, daher lautet die 2. Zwangsbedingung: tan(ωt) = y x −→ y − tan(ωt) = 0 . x (2.44) Wir brauchen 3 Koordinaten, um die Perle zu lokalisieren, und haben 2 Zwangsbedingungen, daher haben wir einen Freiheitsgrad. Als verallgemeinerte Koordinate bietet sich der Abstand vom Ursprung an, r(t), und wir wählen daher die folgenden Koordinaten für unser Problem x = r(t) sin β cos(ωt) y = r(t) sin β sin(ωt) z = r(t) cos β . (2.45) Diese Koordinaten erfüllen die zwei Zwangsbedingungen identisch (einfach einsetzen), daher haben wir die richtigen Koordinaten für das Problem gewählt. Damit errechnet sich die Lagrangefunktion zu L= m 2 (ṙ + r2 ω 2 sin2 β) − m g r cos β 2 (2.46) und damit die Euler–Lagrange Bewegungsgleichung zu r̈ = r ω 2 sin2 β − g cos β . (2.47) Diese Differentialgleichung ist vom Typ q̈ = q und uns bereits bekannt, die Lösung ist r(t) = Aeω sin βt + g cos β . ω 2 sin2 β (2.48) Wer glaubt, dass dieses Beispiel à la Newton leicht ist, soll es probieren. 2.5 Erhaltungssätze und Symmetrien Betrachten wir ein freies Teilchen in einem Inertialsystem, dessen Lagrangefunktion besteht nur aus dem kinetischen Anteil L = m ~r˙ 2 59 2 . (2.49) Kapitel 2. Lagrangesche Mechanik Wenn man nun ein Inertialsystem wählt, dass um einen konstanten Vektor ν ~n mit |~n| = 1, ν ∈ R verschoben ist (Translation) ~r 0 (t) = Tν ~r (t) = ~r (t) + ν ~n (2.50) dann lautet die Lagrangefunktion in dem neuen Koordinatensystem L0 = m ~r˙ 0 2 m ~r˙ = 2 2 2 = L. (2.51) Die Lagrangefunktionen L, L0 sind identisch, daher invariant unter der Transformation Tν und damit ändern sich natürlich auch nicht die Bewegungsgleichungen. Die Lagrangefunktion eines freien Teilchens ist auch rotationssymmetrisch, da diese nur vom Betrag der Geschwindigkeit abhängt; die Transformationsvorschrift ist in diesem Fall für kleine Winkeln ν, um die Drehachse ~n (ganz analog zu Abschnitt 1.13.2) ~r 0 = Tν ~r = ~r + ν ~n × ~r + O(ν 2 ) . (2.52) Ganz allgemein kann man einen Zusammenhang zwischen einer Invarianz der Lagrangefunktion unter einer Symmetrietransformation herstellen. Nehmen wir an wir haben eine solche Invarianzeigenschaft für die Lagrangefunktion L(q, q̇, t), also L(Tν q, d d (Tν q), t) = L(q, q, t) dt dt (2.53) unter einer kontinuierlichen Transformation q → Tν q; Tν=0 q = q. Nun diffe60 2.5. Erhaltungssätze und Symmetrien renzieren wir beide Seiten der obigen Gleichung nach ν, wir erhalten ¯ ¯ ∂ d L(Tν q, (Tν q), t)¯¯ = 0 ∂ν dt ν=0 ¯ ¯ ¯ ¯ ∂L ∂ ∂L ∂ d −→ (Tν q)¯¯ + (Tν q)¯¯ = 0 ∂q ∂ν ∂ q̇ ∂ν dt ν=0 ν=0 |{z} d ∂L dt ∂ q̇ =⇒ =⇒ ½ ¾¯ ¯ d ∂L ∂ = 0 (Tν q) ¯¯ dt ∂ q̇ ∂ν ν=0 ¯ ¯ ∂L ∂ = const (Tν q)¯¯ ∂ q̇ ∂ν ν=0 (2.54) Wenn wir mehrere verallgemeinerte Koordinaten haben, dann haben wir einfach die Summe über alle Freiheitsgrade zu nehmen. Kommen wir zu unserem ersten Beispiel, ein freies Teilchen unter räumlicher Translation, Gl. (2.50), zurück und wenden die obige Gleichung an (hier gilt ~q = ~r): ¯ ¯ ∂ (Tν ~q)¯¯ = ~n ∂ν ν=0 ∂L ni = m ~r˙ · ~n = m ~v · ~n = const . (2.55) =⇒ ∂ ẋi Da der Vektor ~n beliebig ist, folgt daraus, dass der Impuls m ~v zeitlich konstant ist. Damit haben wir aus der räumlichen Translationsinvarianz die Impulserhaltung (3 Parameter) hergeleitet! Somit haben wir das Noether–Theorem gefunden, das die Mathematikerin Amalie Emmy Noether (1882-1935) im Jahre 1918 (in allgemeinerer Form) gefunden hat: Aus der Invarianz von der Lagrangefunktion L unter einer kontinuierlichen Symmetrietransformation q → Tν q; Tν=0 q = q folgt =⇒ ¯ f X ¯ ∂L ∂ = const (Tν q)α ¯¯ ∂ q̇α ∂ν ν=0 α=1 (2.56) und damit aus L eine Erhaltungsgröße. Das tolle daran ist, dass dieses Theorem im Wesentlichen genauso in der Quantenmechanik, in der klassischen Feldtheorie und in der Quantenfeldtheorie (QFT) gilt (in der Quantentheorie gibt es zusätzlich noch diskrete Symmetrien). Dass eine Symmetrie mit einer Erhaltungsgröße verknüpft ist, ist eine grundlegende Erkenntnis der Theoretischen Physik! 61 Kapitel 2. Lagrangesche Mechanik Außerdem ist es ein wesentliches Hilfsmittel bei der Formulierung der Lagrangefunktion der fundamentalen Wechselwirkungen! Betrachten wir als weiteres Beispiel, dass L invariant unter räumlichen Drehungen, Gl. (2.52), ist: ¯ ¯ ∂ = ~n × ~r (Tν q)¯¯ ∂ν ν=0 ∂L ~ = const . =⇒ (~n × ~r)i = p~ · (~n × ~r) = ~n · (~r × p~) = ~n · L ∂ ẋi (2.57) ~ in ~n–Richtung. Wir erhalten damit die Komponente des Drehimpulses, ~n · L, Da wieder ~n beliebig ist, folgt, dass der Drehimpuls zeitlich konstant ist. Damit folgt aus der Rotationsinvarianz die Drehimpulserhaltung (3 Parameter). Beim sphärischen Pendel hatten wir gesehen, dass die Koordinate φ nicht in L vorkommt, also eine zyklische Koordinate ist. Aus ihr folgt pφ konstant ist. Das sieht man, auch mit Hilfe des Noether–Theorems. Wählen wir ~n in Richtung der z–Achse und variieren φ, erkennt man das L, Gl. (2.34), invariant bleibt und das Noether–Theorem ergibt Lz konstant. Betrachten wir eine zeitliche Translation Tν q(t) = q(t + ν) (2.58) und nehmen wir den Fall an, dass L nicht explizit von der Zeit t abhängt, d.h. ∂L =0, ∂t (2.59) dann gilt ¯ ¯ ¯ ¯ ∂ ∂ ¯ = = q̇(t) (Tν q(t))¯ q(t + ν)¯¯ ∂ν ∂ν ν=0 ν=0 ∂L q̇ = const ∂ q̇ (2.60) und weiters ¯ X ∂L ¯ d ∂L ∂ = L(q(t + ν), q(t + ν))¯¯ q̇α + q̈α ∂ν dt ∂q ∂ q̇ α α ν=0 α = 62 d L(q(t), q̇(t)) = 0 , dt (2.61) 2.5. Erhaltungssätze und Symmetrien das nichts anderes bedeutet, als dass L(q(t), q̇(t)) konstant sein muss. Damit kann man die folgende Konstante E definieren X ∂L E = q̇α − L(q(t), q̇(t)) (2.62) ∂ q̇α α Welche physikalische Größe ist E? Wir können zunächst mal ein Beispiel betrachten. Die Lagrangefunktion von einem Teilchen in einem Potential U ist gegeben durch L= m ~r˙ 2 − U (|~r|) . 2 (2.63) Damit ergibt sich E zu m~r˙ 2 m~r˙ 2 + U (|~r|) = + U (|~r|) (2.64) 2 2 und damit nichts anderes als die Energie! Das war natürlich ein spezielles Beispiel. Um es allgemein zeigen zu können, betrachten wir die Ableitung nach der Zeit und nach einer kurzen Rechnung sieht man (UE) E := m~r˙ 2 − d ∂L E = − . (2.65) dt ∂t Damit haben wir gezeigt, dass falls die Lagrangefunktion nicht explizit von der Zeit t abhängt, die Energieerhaltung gilt! Wir werden diese Fragestellung noch mal im Abschnitt 2.7 aufwerfen. Jetzt haben wir fast alle Möglichkeiten der 10 verschiedenen Galileitransformationen verwendet. Es fehlt noch der Galileiboost. Dazu müss das Noethertheorem ein wenig verallgemeinert werden. Wir haben dies bereits für die Zeitranslationssymmetrie gemacht. Erweitertes Nöther–Theorem: Falls die Lagrangefunktion unter der Transformation sich durch eine totale Funktion der Zeit ändert, also: ¯ ¯ d ∂ d = L(Tν q(t), (Tν q(t)), t)¯¯ f (q(t), q̇(t), t) ,(2.66) ∂ν dt dt ν=0 dann gibt es die folgende Erhaltungsgröße: ¯ f X ¯ ∂L ∂ − f (q, q̇, t) = const. (Tν q)α ¯¯ ∂ q̇ ∂ν α ν=0 α=1 63 (2.67) Kapitel 2. Lagrangesche Mechanik Genau dieses haben wir bei der Zeitranslationssymmetrie benützt bzw. hergeleitet. Betrachten wir die folgende spezielle Galileitransformation Tν ~r = ~r + ν ~n t , (2.68) wobei ~n ein beliebiger Einheitsvektor ist und damit ~n t := ~v die Geschwindigkeit, mit der sich ein anderes Inertialsystem bewegt. Betrachten wir weiters N Teilchen unter dem Einfluss einer Kraft, die nur vom Abstand der Teilchen untereinander abhängt. Es gilt für den Ortsvektor des n-ten Teilchens Tν ~r (n) = ~r (n) + ν ~n t . (2.69) Die Lagrangefunktion L ändert sich bei dieser Transformation ³ ´2 N m(n) ~ r˙ (n) + ν ~n X 1X U (|~r (n) − ~r (m) |) L(. . . , Tν ~r (n) , . . . ) = − 2 2 n=1 n6=m | {z } unabhängig von ν (2.70) nur um eine totale Zeitableitung (es gilt also das erweiterte Nöther–Theorem): ¯ ¯ N N X X ¯ ∂L ¯¯ (n) ˙ (n) ¯ ⇒ = m (~r + ν ~n) · ~n¯ = m(n) ~r˙ (n) · ~n ∂ν ¯ν=0 ν=0 n=1 n=1 N X d ~n · m(n) ~r (n) . = dt n=1 Nun brauchen wir nur noch ¯ ¯ ∂ (n) ¯ Tν ~r ¯ = ~n t ∂ν ν=0 für alle n = 1, . . . , N (2.71) (2.72) zu berechnen und erhalten −→ N X n=1 p~ (n) · ~n t − ~n · N X ~ m(n) ~r (n) = ~n · (P~ t − M R(t)) = const, (2.73) n=1 ~ wie zuvor definiert haben, wobei wir die Massenmittelpunktskoordinate R also durch ~ R(t) = N 1 X (n) (n) m ~r (t) . M n=1 64 (2.74) 2.6. Welche Eigenschaften erleichtern das Erraten von L noch? Da ~n beliebig war, folgt, dass aus der Geschwindigkeitstransformation die Erhaltung des Massenmittelpunktsbewegung (3 Parameter) ~ ~ 0 + 1 P~ t R(t) = R M (2.75) führt. Bemerkung: Da die räumliche Translationsinvarianz der potentiellen Energie die Galileiinvarianz der potentiellen Energie impliziert, ist es nicht verwunderlich, dass die Massenmittelpunktsbewegung aus der Impulserhaltung folgt. Zusammenfassend haben wir gezeigt, dass für die Galileigruppe mit 10 unabhängigen Parametern durch das Nöther–Theorem 10 Erhaltungsgrößen folgen: Invarianz Erhaltungsgröße zeitliche Translation Energieerhaltung (1 Parameter) räumliche Translation Impulserhaltung (3 Parameter) Drehungen Drehimpulserhaltung (3 Parameter) Geschwindigkeittransformation Massenmittelpunktsbewegung (3 Parameter) 2.6 Welche Eigenschaften erleichtern das Erraten von L noch? Hier eine Zusammenfassung: • Wir haben bereits erkannt, damit eine Bewegungsgleichung resultiert, q̇α in L mindestens quadratisch vorkommen muss. • Multipliziert man L mit einer Konstanten, so ändert sich die Bewegungsgleichung nicht. Das kann man zum Skalieren verwenden. • Addiert man zu L eine Konstante, dann ändert sich die Bewegungsgleichung nicht. • Addiert man zu L ein totale Zeitableitung, so ändert sich die Bewegungsgleichung nicht (siehe UE): L −→ L0 = L(q, q̇, t) + 65 d F (q, t) . dt (2.76) Kapitel 2. Lagrangesche Mechanik • Besteht ein System aus zwei Teilsystemen A und B, die jeweils abgeschlossen sind und damit in keiner Wechselwirkung stehen, dann setzt sich die Lagrangefunktion des Gesamtsystems additiv aus denen der Teilsystem zusammen: LA+B = LA + LB . • Hat man zwei Teilsystemen A und B, die miteinander wechselwirken, dann kann man folgenden Ansatz wählen: LA+B = LA (qA , q̇A , t) + LB (qB , q̇B , t) + LW (qA , qB , q̇A , q̇B , t) . (2.77) Damit muss man “nur” LW erraten. Oft kommt es vor, dass zwar System A von System B beeinflusst wird, dass aber die Rückwirkung von A auf B vernachlässigbar ist (Beispiel: Satellit/Erde). Aber Achtung, das bedeutet keinen Widerspruch zu actio = reactio; natürlich sind die entsprechenden Kräfte entgegengesetzt, aber die Massen der System können sich stark voneinander unterscheiden. Daher kann man als niedrigste Lösung die Bewegung in B durch Lösen von ∂LB ∂qB = d ∂LB dt ∂ q̇B (2.78) (0) erhalten und die Lösung qB = qB (t) in LA+B einsetzen. Zur Herleitung der Bewegungsgleichung von A kann man dann (0) (0) (0) LA+B = LA (qA , q̇A , t) + LW (qA , qB , q̇A , q̇B , t) , (2.79) da LB nicht mehr zur Bewegungsgleichung beiträgt. Das System A bewegt sich daher unter dem Einfluss der Kräfte, die B “von außen” (0) (d.h. bei vorgegebener Bewegung qB ) auf A ausübt. Man nennt diese Näherung eine “Bewegung im äußeren Feld”, wobei man hier schön erkennt, dass das Wort “Feld” sich auf das von B erzeugt Potential bzw. die zugehörigen Kräfte bezieht (siehe auch Abschnitt 1.4). • Wie wir im vorigen Abschnitt gesehen haben, ist natürlich jede Symmetrietransformation, bei der die Bewegungsgleichungen ihre Form behalten, eine Einschränkung an L und hilft beim “Erraten” der Funktion. 2.7 Der Lagrange– und Hamiltonformalismus Wie wir gesehen haben, sind die Lagrangegleichungen das Analogon zu den Newtongleichungen 2. Ordnung. Wir können uns also die Frage stellen, ob es auch ein Gegenstück zu den Newtonschen Gleichungen 1. Ordnung gibt? 66 2.7. Der Lagrange– und Hamiltonformalismus Dazu brauchen wir ein Gegenstück zu der generalisierten Koordinate qα , hier bietet sich der generalisierte Impuls an pα = ∂L . ∂ q̇α (2.80) Diese Größe nennt man auch kanonischen Impuls, die Variablen qα , pα heißen zueinander kanonisch konjugiert. Als nächsten Punkt beschäftigen wir uns nochmals mit der Frage, welcher Ausdruck im kanonischen Formalismus der Energie entspricht und unter welchen Umständen diese erhalten ist (vergleich auch mit Abschnitt 2.5). L selbst kommt als Energie sich nicht in Frage, für ein konservatives System ist sie ja L = Ekin − U und nicht L = Ekin + U , ist aber doch nahe an der Energie dran. Betrachten wir einmal die Zeitableitung von L µ ¶ dL ∂L X ∂L ∂L = + q̇α + q̈α dt ∂t ∂q ∂ q̇ α α α µ ¶ ∂L X ∂L + q̇α + pα q̈α = ∂t ∂q α α ∂L X + (ṗα q̇α + pα q̈α ) , (2.81) = ∂t α wobei wir bei letzten Gleichheitszeichen die Bewegungsgleichung genützt haben. Der P letzte Term ist nichts anderes als die Zeitableitung von α pα q̇α , d.h wir haben dL ∂L d X = + pα q̇α dt ∂t dt α =⇒ dH ∂L = − (2.82) dt ∂t X mit H(qα , pα , t) = pα q̇α − L(qα , q̇α , t) . α Die Größe H heißt Hamiltonian (wir haben sie bereits beim harmonischen Oszillator kennengelernt). Wir sehen hier auch sehr schön, dass Ergebnis aus Abschnitt 2.5, falls L nicht explizit von der Zeit abhängt, ist die rechte Seite gleich Null und damit H erhalten und natürlich umgekehrt, falls H zeitlich konstant ist, dann hängt L nicht explizit von der Zeit ab. 67 Kapitel 2. Lagrangesche Mechanik Nun können wir auch die Bewegungsgleichungen 1. Ordnung anschreiben, die Hamiltonschen Gleichungen: ∂H ∂pα ∂H = − ∂qα q̇α = (2.83) ṗα (2.84) Die Hamiltonschen Gleichungen erfüllen wie L auch das Wirkungsprinzip. Man erkennt sofort die Symmetrie von q und p (bis auf ein Vorzeichen) in den Bewegungsgleichungen. Sie kann formal (und das kann man auch in der Quantenmechanik) soweit getrieben werden, dass es letztlich willkürlich erscheint, was man “Impuls” oder was man “Koordinate” nennt. Wie wir schon beim harmonischen Oszillator gesehen haben, kann man q und p in einem 2f –dimensionale Raum zusammenfassen, der so genannte Phasenraum des betrachteten Systems. Er ist zum Beispiel in der statistischen Mechanik ein gutes Konzept, wo der Limes von einem mikroskopischen System, das den Quantengesetzen gehorcht, zu einem System mit vielen Teilchen vollzogen werden soll. 68 Kapitel 3 Relativistische Mechanik Ich habe hier eine eher formalere Zugangsweise gewählt, da die so genannten Paradoxa selbst in Schulbüchern sehr illustrativ und verständlich dargestellt werden. Mit diesem Rüstzeug sollte es keine großen Probleme bereiten, sich andere relativistische Effekte, Schlussfolgerungen,. . . erarbeiten zu können. Die Maxwellsche Theorie (1864) beschreibt die elektromagnetischen Vorgänge in zutreffender Weise, d.h. die experimentellen Beobachtungen stimmen mit der Theorie überein. Das Licht ist ein elektromagnetischer Wellenvorgang, der sich mit großer, aber endlicher Geschwindigkeit c ≈ 300000km/s ausbreitet. Als Medium wurde zunächst der so genannte Äther angenommen. Alle anderen bekannten Wellen, wie Wasserwellen, Schallwellen, bewegen sich ja auch in einem Medium, also war die Annahme eines Mediums absolut naheliegend. In einem raffinierten Experiment haben Michelson und Morley (1887) versucht, den Ätherwind nachzuweisen, der sich bei der Bewegung der Erde um die Sonne (v ≈ 30km/s) ergeben müsste. Obwohl die experimentelle Genauigkeit groß genug war (≈ 5km/s), ergab sich kein Unterschied in der Geschwindigkeit des Sonnenlichtes bei Bewegung auf die Sonne zu bzw. von dieser weg, zur Verwunderung der damaligen Physiker. Im Anschluss daran haben Fitzgerald und Lorentz (1892) erkannt, q dass 2 sich dann auch Längenmaßstäbe in Bewegungsrichtung um den Faktor 1 − vc2 ändern sollten. H. A. Lorentz hat 1904 (näherungsweise) die nach ihm benannten Transformationen für die Änderung von Längen- und Zeitmaßstäben bei Bewegung gefunden (W. Voigt kannte sie aber schon 1887, J. Larmor fand sie 1898). Schließlich hat Poincare (1905/06) das Relativitätsprinzip aufgestellt: die Physik muß invariant gegen Lorentztransformationen formuliert werden, wenn die Maxwelltheorie zutreffen soll. 69 Kapitel 3. Relativistische Mechanik Diese Untersuchungen waren aber alle ziemlich formal und enthielten keine physikalische Interpretation, vor allem keine solche der Transformation der Zeit. Der wesentliche Schritt zur Relativitätstheorie wurde von Einstein (1905) vollzogen. Es gelang ihm, die Lorentztransformation ohne Rückgriff auf die Elektrodynamik oder das Michelsonexperiment (und offenbar ohne Kenntnis von Lorentzs Arbeiten) aus einer Analyse des Gleichzeitigkeitsbegriffes herzuleiten und diesen physikalisch zu interpretieren: Gleichzeitigkeit ist nichts Absolutes, sondern relativ, d.h. vom Bezugsystem abhängig. Einstein formulierte das Relativitätsprinzip und zog daraus die Konsequenz: die Mechanik muß abgeändert werden, um dem neuen Relativitätsprinzip zu genügen. Die von Einstein vorgelegte relativistische Mechanik wurde 1907 von H. Minkowski in mathematisch besonders klarer Form dargestellt (die Arbeit wurde aber erst nach Minkowskis frühem Tod 1915 veröffentlicht). Minkowski hat in dieser Arbeit auch den entsprechend verallgemeinerten Vektorkalkül für die relativistische Raumzeitmannigfaltigkeit entwickelt. Einsteins berühmte Arbeit ist außerordentlich klar geschrieben. Trotzdem wurde sie von der Universität Bern als Habilitationsschrift wegen Unverständlichkeit abgelehnt. M. Planck erkannte hingegen ihre Bedeutung sofort und propagierte die Theorie, die sich danach relativ rasch durchsetzte. Plancks damaliger Assistent M. v. Laue veröffentlichte bereits 1911 das erste Lehrbuch zur Relativitätstheorie. Alle Aussagen der Relativitätstheorie (wie z.B. Abhängigkeit der Masse von der Geschwindigkeit, Zeitdilatation, Konstanz der Lichtgeschwindigkeit) sind experimentell mit hoher Genauigkeit bestätigt worden. Im Gegensatz zur Quantentheorie, bei der überraschenderweise kein genereller Limes von der “Quantenwelt” zur “klassischen” Welt gefunden werden kann, folgt die Newtonsche Mechanik bei Betrachtung von Geschwindigkeiten, die kleiner als die Lichtgeschwindigkeit sind, als gute Näherung. Daher bleibt die Newtonsche Mechanik in weiten Bereichen der Physik Wahl Nummer 1. Die Relativitätstheorie ist heute aus vielen Bereichen nicht mehr wegzudenken, die ohne die Kenntnis der relativistischen Mechanik unmöglich wären (Satelliten, GPS, Beschleuniger wie LHC, Myonen Zerfall,. . . ). In der geometrischen Struktur von Raum und Zeit unterscheidet sich die relativistische Physik wesentlich von der nichtrelativistischen. Diese Raumzeitstruktur bildet die Grundlage für alle Bereiche der Physik und ist somit weit über die Mechanik hinaus von Bedeutung. So hat die entsprechende relativistische Verallgemeinerung der Newtonschen Gravitationstheorie (die allgemeine Relativitätstheorie) zu einem neuen Verständnis unseres Universums und seiner Entwicklung geführt, aus neueren Entwicklungen in der relativistischen Teilchenphysik beginnt sich ein einheitliches Bild für die Grundlagen 70 3.1. Die Lorentztransformation der ganzen Physik abzuzeichnen. 3.1 Die Lorentztransformation Die Lorentztransformation tritt in der relativistischen Mechanik an die Stelle der Galileitransformation. Das Relativitätsprinzip nach Galilei können wir auch so zusammenfassen: A Alle Inertialsystem (IS) sind gleichwertig, d.h. alle grundlegenden physikalische Gesetze haben in allen IS die gleich Form. B Galilei: Newtons Axiome gelten in allen Inertialsystemen. (Warum wurde Punkt B von Galilei nicht so formuliert? (Tipp: Geburtsdaten)) Aus Punkt A und B folgen die in Abschnitt 1.12 besprochenen Galileitransformationen. Aus dem Michelsonexperiment wissen wir, dass die Lichtgeschwindigkeit c konstant ist. Diese Konstanz der Lichtgeschwindigkeit ist im Widerspruch zur Galileitransformation. Betrachten wir eine Zug der auf einem Zug der wieder auf einem Zug fährt, auf dem wir laufen. Nach Galilei addieren sich die Geschwindigkeiten einfach, d.h. wir könnten uns mit Überlichtgeschwindikeit bewegen. Also werden wir folgende Relativitätsprinzip nach Einstein fordern: A Alle Inertialsystem (IS) sind gleichwertig, d.h. alle grundlegenden physikalische Gesetze haben in allen IS die gleich Form. C Licht pflanzt sich in jedem Inertialsystem mit der Geschwindigkeit c fort. Die Transformationen, die Punkt A und C erfüllen, sind die Lorentztransformation, die auch die Maxwellgleichungen invariant lassen. Dies impliziert natürlich, dass wir die Newtonschen Axiome abändern müssen. Man kann verschiedenste Ansätze zur Herleitung der Lorentztransformation verfolgen, wir geben hier der Kürze wegen nur das Ergebnis an und diskutieren ihr Ergebnis: 71 Kapitel 3. Relativistische Mechanik Die Lorentztransformation zwischen einem Inertialsystem IS’ und einem Inertialsystem IS lautet: ~x 0 t0 (~v · ~x) ~v (γ − 1) − γ ~v t v2 ~v · ~x = γ (t − 2 ) c = ~x + (3.1) wobei c die Lichtgeschwindigkeit ist, v der Betrag von ~v und γ 1 γ ≡ γ(v) = p 1 − β 2 (v) mit β(v) = v . c (3.2) Man sieht sofort, wenn v ¿ c, dann ist γ(v) in guter Näherung 1 und wir erhalten die Galileitransformationen. Rotationen und räumliche und zeitliche Verschiebungen sind natürlich ebenso möglich, aber diese ändern zur die mathematische Beschreibung. Es kommt auf die Relativgeschwindigkeit an. 3.2 Wie schaut das Raum–Zeit Konzept der Lorentztransformationen aus? Bei Drehungen, räumlichen oder zeitlichen Verschiebungen ergeben sich keine Unterschiede zwischen Galilei– und Lorentztransformationen (LT). Das Relativitätsprinzip von Galilei und Einstein implizieren gleichermaßen die Isotropie und Homogenität des Raumes und die Homogenität der Zeit. Zum Beispiel die Gleichwertigkeit von Inertialsystemen mit verschieden orientierten Achsen. Der große Unterschied ergibt sich, wenn man Relativbewegungen zwischen zwei Inertialsystemen betrachtet. Das wollen wir uns nun genauer anschauen (vergleich mit Abschnitt 1.12). Wir konzentrieren uns wie im Abschnitt 1.12 auf eine räumliche Dimension. Für t = 0 sollen sich die System IS und IS’ decken und die Uhren der Systeme synchronisiert sein. Das Ereignis, das durch die Koinzidenz der Ursprünge gegeben ist, hat dann die Koordinaten (c t, x, y, z) = (0, 0, 0, 0) und (c t0 , x0 , y 0 , z 0 ) = (0, 0, 0, 0), wobei für alle Zeiten durch unsere Wahl der Koordinatensysteme gelten soll y = y 0 = z = z 0 = 0 . Wir sehen, dass wir es mit vierdimensionalen “Vektoren” zu tun haben, Minkowski hat diese in einen sehr praktischen Formalismus zusammengefasst, der neben der Kürze vor allem den Vorteil hat, falls man ein Größe in diesem Formalismus hinschreibt und einfache Regeln beachtet, dann ist diese Größe invariant unter LT, das dann nicht mehr explizit zu zeigen ist. 72 3.2. Wie schaut das Raum–Zeit Konzept der Lorentztransformationen aus? Im Allgemeinen wird ein Ereignis in der Raum–Zeit (ein Raum– Zeit Punkt) durch die Raum–Zeit–Koordinaten x = (xµ ) = (x0 , x1 , x2 , x3 ) = (c t, ~x) (3.3) bezeichnet. Die Komponenten von x werden mit xµ (µ = 0, 1, 2, 3) bezeichnet. Dabei gilt, verwendet man einen Griechischen Buchstaben, dann läuft der Index von 0 bis 3, verwendet man einen Lateinischen Buchstaben, dann läuft der Index “nur” von 1 bis 3 und bezeichnet den räumlichen Anteil. Die Menge der Ereignisse (Punkte) wird in der speziellen Relativitätstheorie auch als Minkowskiraum bezeichnet, benannt nach dem Mathematiker Hermann Minkowski (1864-1909). Das wir den Index µ oben gewählt haben ist zunächst Willkür. Die Koordinaten der Ereignisse in den zwei IS sind durch die LT verknüpft, Gl. (3.1). Betrachten wir ein Ereignis, das in IS’ im Ursprung ruht. Was gilt für dieses Ereignis im IS? Wir erhalten aus den Gl. (3.1) (x00 = c t0 , x01 = 0) LT ⇐⇒ (x0 = c t, x1 = v t) (3.4) wobei t0 und t noch zusammenhängen. Wir betrachten nun einen Massenpunkt in IS’, der sich in positiver x Richtung mit der Geschwindigkeit u0 = dx0 dt0 (3.5) bewegt. Mit welcher Geschwindigkeit bewegt er sich in IS? Für die Galileitransformationen hätten wir einfach u = u0 + v erhalten. Um diese zu finden, betrachten wir die Umkehrformel zur Lorentztransforamtion (die man durch Vertauschen von IS mit IS’ und Ersetzen von ~v durch −~v erhält) und schreiben diese differentiell v u0 v dx0 0 ) = γ dt (1 + ) c2 c2 dx = dx0 + dx0 (γ − 1) + γ v dt0 = γ dx0 + γ v dt0 . dt = γ (dt0 + (3.6) Durch Division erhalten wir die relativistische Geschwindigkeitsaddition u = dx u0 + v = 0 . dt 1 + vcu2 (3.7) Falls also u0 = c dann folgt, in Übereinstimmung mit Einstein, u = c. Man beachte auch, dass es keine Symmetrie zwischen u und v besteht! Der Lorentzboost ist also eine Folge unseres adaptierter Raum–Zeit Konzepts, das wir auf 73 Kapitel 3. Relativistische Mechanik Grund der Experimente ändern mussten! Es erscheint uns nicht intuitiv –kein Wunder haben wir es im Alltag ja nicht mit relativistischen Geschwindigkeiten zu tun– , aber man kann zeigen, dass es eine überraschen einfache geometrische Interpretation der Geschwindigkeitsaddition gibt (siehe Feynman, Band I oder homepage.univie.ac.at/Franz.Embacher/Rel/Geschwindigkeitsaddition). Die allgemeine relativistische Geschwindigkeitsaddition ist durch µ ¶ 0 ~v · ~u d~x 1 0 −1 −1 ~v + ~v (1 − γ ) + γ ~u (3.8) ~u = = 0 u dt v2 1 + ~v·~ 2 c gegeben (siehe auch ÜE). Vertiefen wir uns weiter in die Transformationen, die Einsteins Relativitätsprinzip genügen. Betrachten wir zwei Ereignisse mit den Koordinaten a = (aµ ) = (c t1 , x1 , y1 , z1 ) und (bµ ) = (c t2 , x2 , y2 , z2 ) in IS, dann wollen wir folgende Größe betrachten: s2ab := c2 (t2 − t1 )2 − (~x2 − ~x1 )2 = c2 (t2 − t1 )2 − (x2 − x1 )2 − (y2 − y1 )2 − (z2 − z1 )2 . (3.9) Es fällt zunächst auf, dass diese Größe negativ, positive oder Null sein kann. Nun betrachten wir diese Größe in einem IS’, also 0 0 s0ab2 := c2 (t02 − t01 )2 − (~x2 − ~x1 )2 = c2 (t02 − t01 )2 − (x02 − x01 )2 − (y20 − y10 )2 − (z20 − z10 )2 . (3.10) Experimentell findet man, dass s2ab = s0ab2 . (3.11) Das bestätigt sich auch wenn man die LT einsetzt (so kann sie auch gefunden werden). Physikalisch haben wir die Größe gefunden, die invariant ist unter LT, und die wir als “Quadrat des (vierdimensionalen) Abstandes” oder “Raum–Zeit–Abstand ” bezeichnen, in Anlehnung an die entsprechende Größe in einem kartesischen Koordinatensystem im Rn . Zur Vereinfachung der Schreibweise kann man zweifach indizierte Größe definieren 1 0 0 0 0 −1 0 0 g = (gµν ) = g µν ) = (3.12) 0 0 −1 0 0 0 0 −1 74 3.2. Wie schaut das Raum–Zeit Konzept der Lorentztransformationen aus? und es gilt gµν g µν = 1. Dann lässt sich der Viererabstand zweier Ereignisse a = (aµ ) = (c t1 , x1 , y1 , z1 ) und b = (bµ ) = (c t2 , x2 , y2 , z2 ) mit Hilfe des metrischen Tensors gµν kompakt als s2ab = gµν (aµ − bµ )(aν − bν ) Summenkonvention! (3.13) schreiben. Allgemein bezeichnet man einen Minkowskivektor mit einem oberen Index als kontravarianten Vektor und einen Minkowskivektor mit unteren Index als kovarianten Vektor, wobei die Umrechnung über den metrischen Tensor der flachen Raum–Zeit erfolgt: (xµ ) = (c t, x, y, z) kontravariant Vierervektor ct −x (xµ ) = −y kovarianter Vierervektor −z mit xµ = g µν xν , xµ = gµν xν (3.14) und damit lässt sich das Lorentzinvariante Abstandsquadrat kompakt durch s2ab = (aν − bν )(aν − bν ) (3.15) schreiben. Man kann das Abstandsquadrat s2 als eine Funktion der Koordinaten s2 = F (t, ~x) betrachten, aber auch als eine Funktion der Koordinaten in 0 einem anderen IS s2 = F (t0 , ~v ). Die Gleichung s2 = F (t, ~x) = (c t)2 − ~x 2 = 0 d~x −→ ( )2 = c2 dt (3.16) beschreibt dann eine Hyperfläche im vierdimensionalen Raumzeitkontinuum, die im Ursprung eine Spitze hat. Diese Hyperfläche heißt der Lichtkegel des Ereignisses P = (0, ~0) und ermöglicht eine geometrisches Verständnis der Lorentztransformationen und ist in Fig. 3.1 veranschaulicht. Es beschreibt ein Objekt, das sich mit Lichtgeschwindigkeit bewegt. Allgemein kann man folgende Klassifizierung vornehmen: 75 Kapitel 3. Relativistische Mechanik Abbildung 3.1: Der Lichtkegel. Für infinitesimal benachbarte Ereignisse mit Koordinaten x = (x0 , ~x) −→ x + dx = (x0 + dx0 , ~x + d~x) folgt dann, dass für den Vierabstand zwischen diesen beiden Ereignissen gilt: ds2 = c2 dt2 − d~x 2 = inv. (3.17) Der Abstand zweier Ereignisse kann in 3 Arten klassifiziert werden: 2 ds ½ = 0 lichtartig < 0 raumartig = c dt − d~x > 0 zeitartig 2 2 2 (3.18) und kann geometrisch durch den einen Kegel veranschaulicht werden, Fig. 3.1. Wir haben unser Raum–Zeit Konzept, also auch darin zu ändern, das es nicht nur eine unmittelbare punktuelle Gegenwart gibt, sondern einen ganzen Bereich, den wir als Gegenwart auffassen können. 76 3.3. Auswirkungen des veränderten Raum–Zeit Konzepts: Lorentzkontraktion und Zeitdilatation Abbildung 3.2: Lorentzkontraktion 3.3 Auswirkungen des veränderten Raum–Zeit Konzepts: Lorentzkontraktion und Zeitdilatation Auch die Abmessungen eines Objektes hängen vom Bewegungszustand ab. Der “graphische Fahrplan” für das ganze Objekt wird offenbar durch die Weltlinien aller Atome beschrieben, aus denen das Objekt besteht. Für einen ausgedehnten Gegenstand erhält man eine sogenannte “Weltröhre”. Betrachten wir wieder die Lorentztransformation in der x–Richtung und untersuchen einen Maßstab, der in IS’ ruht und die Länge l0 hat (vgl. Abb. 3.2). Anfangs- bzw. Endpunkt seien x01 bzw. x02 . Dann ist l0 = x02 − x01 (gemessen zur Zeit t0 = 0). Die Weltlinien des Anfangs- bzw. Endpunktes sind parallel zur c t0 –Achse. Der Maßstab erscheint im ursprünglichen IS kürzer. Setzen wir in der Transformationsformel t = 0, so erhalten wir l0 = x02 − x01 = γ(x2 − x1 ) p −→ l = l0 1 − β 2 (3.19) Die Lorentzkontraktion ist ein reziproker Effekt: Von IS’ aus sieht ein in IS ruhender Maßstab kürzer aus. Quer zur Bewegungsrichtung erfolgt keine Kontraktion. Wie sieht es mit Zeitmaßstäben aus? Da sich bei einem Lorentzboost auch die Zeitkoordinate ändert, gibt es kein “absolute” (d.h. vom Bezugssystem 77 Kapitel 3. Relativistische Mechanik unabhängige) Zeit. Betrachten wir die Weltlinie eines Teilchens, dass sich mit einer wechselnden Geschwindigkeit u in der Gegend von c bewegt, aber natürlich ist u immer kleiner c. Diese Kurve ist eine zeitartige Linie: sie verläuft so, dass in jedem ihrer Punkte die Tangente innerhalb des im Punkt errichteten Lichtkegels liegt. In einem (~x, t)–Diagramm muss diese Kurve also nach oben laufen und darf sich nirgends zu stark krümmen. Zur Bestimmung der Bogenlänge verwenden wir das invariante Differential 0 0 ds2 = c2 dt2 − d~x 2 = c2 (dt )2 − (d~x ) 2 . (3.20) Für jeden Punkt der Kurve kann man ein Koordinatensystem konstruieren, dass sich im entsprechenden Zeitpunkt mit dem Teilchen mitbewegt, i. Allg. in jedem Punkt ein anderes Koordinatensystem. Dieses System heißt mo0 0 mentanes Ruhesystem. In diesem System gilt d~x = 0 −→ ds = c dt , das Bogenelement misst damit in jedem Punkt das c–fache des Zeitintervalls, das eine von den Teilchen mitgeführte Uhr anzeigt. Man nennt diese daher Eigenzeit dτ := ds . c (3.21) Diese ist klarerweise wie ds invariant. Vergleicht man zwei Weltlinien, z.B, die für ein ruhendes Objekt 1 und ein ungleichförmig bewegtes Objekt 2, so entspricht der scheinbar längeren Weltlinie 2 die kürzere Bogenlänge Z B sAB = ds , (3.22) A 78 3.4. Wie sehen Impuls– und Energiebegriff für ein relativistisches Teilchen aus? da in ds2 = c2 dt2 − d~x 2 “mehr” abgezogen wird. Für das Eigenzeitintervall als Funktion der Geschwindigkeit ~u = man das Bogenelement r 1 u2 dτ = ds = dt 1 − 2 < dt Zeitdilatation . c c d~ x dt erhält (3.23) Die vonpeiner bewegten Uhr angezeigten Zeitintervalle sind daher um den Faktor 1 − β 2 kleiner als die ruhende Uhr. Daher gehen bewegte Uhren langsamer, wenn man das von einem ruhenden System aus beurteilt. Experimente: Myonen der kosmischen Strahlung, Flugzeugexperimente, Zwillinge,. . . 3.4 Wie sehen Impuls– und Energiebegriff für ein relativistisches Teilchen aus? Wir untersuchen hier die Mechanik eines relativistischen Teilchens und damit den Unterschied zu Newtons Welt. Dabei ist es praktisch gleich die Vierervektoren, also den Minkowskiraum einzuführen, da es dann einfacher ist, Lorentzinvariante Größen zu definieren. Als zweites Kriterium für eine vernünftige Größe wollen wir, dass im Limes v viel kleiner als c, die nichtrelativistische Mechanik folgt. Wir werden sehen, dass es nicht immer eine eindeutige relativistische Verallgemeinerung gibt. Die Bahn eines relativistischen Teilchens wird einerseits durch ~x(t), andererseits durch x0 = ct festgelegt. Damit können wir einen Vierervektor konstruieren xµ (t). Da sich t bei Lorentztransformationen ändert, verwenden wir lieber die Eigenzeit τ und erhalten die Weltlinie xµ (τ ). Die Tangente an die Weltlinie uµ : = dxµ dxµ = ds c dτ (3.24) ist die Vierergeschwindigkeit, sie ist dimensionslos. Jedoch definiert man ~v := d~x dt (3.25) µ als relativistische Geschwindigkeit, so wird mit uµ uµ = dx(ds)dx2µ = 1: s µ ¶2 p d~x ds = c2 (dt)2 − (d~x)2 = c dt 1 − cdt p = c dt 1 − β 2 . 79 (3.26) Kapitel 3. Relativistische Mechanik Damit haben wir dx0 dt = c = γ ds ds d~x d~x dt ~v ~u = = = γ, ds dt ds c u0 = (3.27) und damit ist die Bezeichnung von (uµ ) = γ(1, ~v /c) als Vierergeschwindigkeit sinnvoll. Wie sieht der nichtrelativistische Grenzfall v ¿ c aus? Dazu entwickeln wir γ für β ¿ 1 γ = 1+ β 2 3β 4 + + ... 2 8 (3.28) und sehen, dass die räumlichen Komponenten von der Vierergeschwindigkeit (uµ ) = γ(1, ~v /c) in ~u = ~v /c) übergehen, also in die nichtrelativistische Geschwindigkeit. Weiters analog zu Newtons Theorie definieren wir einen relativistischen Impuls durch pµ = m c uµ = m c (pµ ) = m γ (c, ~v ) . dxµ dxµ = m ds dτ (3.29) Die räumlichen Komponenten gehen für den nichtrelativistischen Grenzfall in den nichtrelativistischen Impuls über. Wie sieht es mit der zeitlichen Komponente aus? Der Ausdruck c p0 hat die Dimension einer Energie. Daher E (pµ ) = (p0 , p~) = ( , p~) c (3.30) und haben so die relativistische Energie E definiert. Da uµ ein Vierervektor ist, ist auch pµ ein Vierervektor, den wir Energie–Impulsvektor nennen, und er erfüllt die Lorentzinvarianz: pµ pµ = m2 c2 , (3.31) das wir in Worten so ausdrücken können; der Vektor pµ liegt auf der Massenschale (Englisch: on shell), damit ist das durch diese Gleichung und p0 > 0 charakterisierte Hyperboloid gemeint. In Termen von der relativistischen Energie und dem relativistischen Impuls p~ lautet die obige Gleichung: p E = c2 p~ 2 + (m c2 )2 . (3.32) 80 3.5. Äquivalenz von Masse und Energie Wie sieht die Energie–Impuls-Beziehung im nichtrelativistischen bzw. hochrelativistische Limes aus? Wir erhalten E = ½ p (m c2 )2 + c2 p~ 2 ∼ m c2 + c |~p| p ~2 2m ³ ´ 2 1 − ( 2p~ m )2 + . . . für |~p| ¿ m c für |~p| À m c Wir erkennen im nichtrelativistischen Limes, dass die relativistische Energie 2 die Ruheenergie m c2 , die kinetische Energie 2p~ m und relativistische Korrekturen enthält. Im hochrelativistischen Limes hängt die Energie nicht mehr quadratisch vom Impuls ab, sondern linear! 3.5 Äquivalenz von Masse und Energie Für Prozesse in abgeschlossenen Systemen gilt die Erhaltung der relativistischen Energie als Folge der Zeittranslationsinvarianz. Das hat für Systeme aus N Teilchen weitreichende Bedeutung. Insbesondere gilt E = N X n=1 En = N X Ekin,n + n=1 N X mn c2 = const, (3.33) n=1 wobei Ekin,n durch die Differenz der relativistischen Energie En minus der PN Ruheenergie mn c2 definiert ist. Die kinetische Energie n Ekin,n und die PN 2 Ruheenergie n mn c jeweils für sich sind im Allgemeinen nicht erhalten! Daher kann sich in einem Prozess Ruheenergie in kinetische Energie oder umgekehrt umwandeln. Beispiel: Der Anfangszustand sei durch N Neutronen und Z Protonen gegeben, der Endzustand sei dann ein Kern, dann ergibt die Energiebilanz: (N mn + Z mp )c2 = MKern c2 + ∆E 0 , (3.34) wobei ∆E 0 die kinetische Energie des Kerns und/oder die Energie, die abgestrahlt wird. 3.6 Wie behandelt man Teilchen mit Ruhemasse 0? Photonen besitzen bekanntlich keine Masse, sie bewegen sich mit Lichtgeschwindigkeit durch unsere Welt. Man kann die Vierergeschwindigkeit uµ 81 Kapitel 3. Relativistische Mechanik nicht mehr wie vorher definieren, γ(v = c) = ∞. Hingegen ist der Energie– Impulsvektor pµ ein “guter” Vektor, man erhält aus der Energieformel lediglich, das er ein lichtartiger Vektor ist pµ pµ = 0, m = 0: E = c |~p| . (3.35) Noch einmal zeigt sich der Vorteil des Impulsbegriffes gegenüber dem Begriff der Geschwindigkeit! Und er ist physikalisch dadurch zu rechtfertigen, dass man feststellt, dass Licht Impuls überträgt (“Lichtdruck”). Eigentlich haben wir damit die Quantentheorie betreten: erst diese sagt aus, dass Licht aus Photonen mit dem Impuls ω 2π (k µ ) = ( , ~k), mit |~k| = (3.36) c λ besteht. Für Teilchen mit Masse 0 ist also der Energie–Impulsvektor ein lichtartiger Vektor. Die Transformationseigenschaften von k µ bei Lorentztransformationen äußeren sich im Dopplereffekt und Aberration (Richtungsänderung) des Lichtes. pµ = ~ k µ , 3.7 Anwendungen: Teilchenphysik Nun sind wir gerüstet, um die Kinematik von Zerfälle von Teilchen, Streuungen oder Erzeugung von Teilchen zu berechnen. Ganz allgemein haben wir am Anfang Ni Teilchen und nach dem Prozess Nf Teilchen (i. . . initial, f . . . final). Wir wissen, dass die Energie–Impuls– Erhaltung gilt, also für die einlaufenden Teilchen mit dem Viererimpuls pa und für die auslaufenden Teilchen mit dem Viererimpuls qa gilt: Ni X a=1 pa = Nf X a=1 82 qa . (3.37) 3.7. Anwendungen: Teilchenphysik 3.7.1 Der Zerfall von einem Teilchen Wir haben also ein Teilchen im Anfangszustand und betrachten die einfachste Möglichkeit, zwei Teilchen im Endzustand (2–Teilchen-Zerfall). Zum Beispiel (−) π ± −→ µ± ν µ . Es gibt also P = p1 + p2 → (E/c, P~ ) = (E1 /c, p~1 ) + (E2 /c, p~2 ) (3.38) p p wobei E = c P~ 2 + M 2 c2 und Ei = c p~i 2 + m2i c2 mit i = 1, 2. Wir machen uns das Leben leicht und setzen uns ins Ruhesystem des zerfallenden Teilchens (≡ Massenmittelpunkt), hier gilt P~ = ~0: (M c, ~0) = ( q q 2 p~1 + m21 c2 , p~1 ) +( p~2 2 + m22 c2 , p~2 ) (3.39) bzw. q Mc = q 2 p~1 + m21 c2 + p~2 2 + m22 c2 ≥ m1 c + m2 c ~0 = p~1 + p~2 (3.40) Wir erkennen, dass der Zerfall nur möglich ist, falls M ≥ m1 + m2 , d.h. schwere Teilchen können in leichtere Zerfallen, aber nicht umgekehrt. Das bedeutet aber auch, dass es Teilchen gibt, die stabil sind und nicht mehr in leichtere zerfallen können, da es keine leichteren gibt. Aus der zweiten Gleichung sieht man, das der Betrag der Impulse der Zerfallsprodukte gleich sein muss und die Richtung entgegengesetzt. Umgekehrt ist falls man findet, das zwei Teilchen genau entgegengesetzten Impuls haben, dann ist sind sie durch einen Zerfall eines Teilchens entstanden. 83 Kapitel 3. Relativistische Mechanik Das obige Gleichungssystem kann man jetzt natürlich lösen, indem man p~2 = −~p1 in die erste Gleichung, der Energieerhaltung, einsetzt, daraus erhält man dann |~p1 |, E1 , E2 . Wir können die Lösung aber auch ohne Zerlegung der Vierervektoren in zeitliche und räumliche Komponenten erhalten (hier sehen wir auch den Vorteil der 4er Vektorschreibweise): P = p1 + p2 ⇒ P − p1 = p2 ⇒ (P − p1 )2 = p22 ⇒ M 2 c2 + m21 c2 − 2 P · p1 = m22 c2 . (3.41) Im Ruhesystem des zerfallenden Teilchens ist P · p1 = M E1 und damit haben wir schon die Lösung (M 2 + m21 − m22 ) c2 2M 2 (M + m22 − m21 ) c2 (3.42) E2 = 2M Ein weiteres Beispiel ist der Zerfall π 0 −→ γγ mit Mπ0 ' 135M eV /c2 . Hier gilt m1 = m2 = mγ = 0 und damit E1 = E2 = Mπ0 c2 /2 ' 67.5M eV . ⇒ E1 = 3.7.2 Wie sieht die Kinematik der Teilchenerzeugung aus? In Beschleunigerexperimenten werden in der Regel zwei Teilchen aufeinander geschossen. Wir haben also zwei Teilchen im Anfangszustand und einige Teilchen im Endzustand. Wir betrachten hier zwei Teilchen im Endzustand, zum Beispiel e− e+ −→ µ+ µ− : p1 + p2 = q1 + q2 bzw. ( p (3.43) p p~1 2 + m2e c2 , p~1 ) + ( p~2 2 + m2e c2 , p~2 ) = q q 2 2 2 ( ~q1 + mµ c , ~q1 ) + ( ~q2 2 + m2µ c2 , ~q2 ) . (3.44) 84 3.8. Um den Kreis zu schließen: Wie sieht der relativistische Kraftbegriff aus? Im Massenmittelpunktsystem gilt p~1 + p~2 = ~0 und daraus folgt für die Endprodukte q~1 + ~q2 = ~0 und damit q p Ee± = c p~i 2 + m2e c2 = c ~qi 2 + m2µ c2 ≥ mµ c2 . (3.45) Damit ist dieser Prozess nur möglich falls die Energie des Elektrons und des Positrons größer als die Ruheenergie der Myonen. Darum werden um neue oder andere Teilchen in einem Beschleuniger zu erzeugen, die Teilchen beschleunigt, d.h. ihre Energie erhöht. 3.8 Um den Kreis zu schließen: Wie sieht der relativistische Kraftbegriff aus? Wir werden hier untersuchen, wie das 2. Newtonsche Axiom relativistisch verallgemeinert werden kann. Wir werden sehen, dass das nicht ganz so klar ist. Das 2. Newtonsche Axiom lautet (falls m nicht explizit von t abhängt, was wir im weiteren annehmen) m d~v = F~N , dt (3.46) wobei wir den Index N eingeführt haben, um zu betonen, dass wir die nichtrelativistische Kraft, die Newton Kraft, meinen. Das Inertialsystem, in dem das Teilchen die Geschwindigkeit ~v (t) hat, bezeichnen wir durch IS. Das momentane Ruhesystem des Teilchens bezeichnen wir mit IS 0 . Bewegt sich zum Zeitpunkt t0 das IS’ relativ zu IS mit der konstanten Geschwindigkeit ~v (t0 ), dann ist die Geschwindigkeit für das kleine Zeitintervall (t0 −dt ≤ t ≤ t0 +dt) 85 Kapitel 3. Relativistische Mechanik im IS’ beliebig klein, es ruht in guter Näherung. Wir wissen, dass das 2. Axiom für nichtrelativistische Geschwindigkeiten gut bestätigt ist, daher gehen wir davon aus, dass das 2. Axiom im Ruhesystem IS’ exakt gilt: m d~v 0 = F~N dt relativistisch gültig in IS’ . (3.47) Achtung: Das Teilchen ruht zwar näherungsweise im IS’, aber die zeitliche Ableitung von der Geschwindigkeit muss nicht null sein. Wie wir bei den Axiomen besprochen haben, definiert das 2. Axiom die Masse m und die Kraft F~N als Messgrößen. Wir werden diese Definitionen übernehmen, aber sie nur auf das Ruhesystem, Gl.(3.47), beziehen! Als haben wir m = Masse in IS’ = Ruhemasse ~ FN = Kraft in IS’ . (3.48) Wir haben hier die Kraft und Masse nach wie vor im Newtonschen Sinne definiert, beziehen diese Definition jetzt aber auf das momentane Ruhesystem! Bei Newton waren diese zwei Größen unabhängig vom Inertialsystem, für nichtrelativistische Geschwindigkeiten sollten daher keine messbaren Unterschiede auftreten. Die Bewegungsgleichungen im IS folgen dann aufgrund Einsteins Relativitätsprinzips mittels der Lorentztransformation angewendet auf die gültigen Gleichungen im Ruhesystem IS’. Wir können aber, da wir uns schon mit der Viererschreibweise vertraut gemacht haben, anders vorgehen: Wir haben die Vierergeschwindigkeit uµ analog zu Newton definiert, verfahren wir genauso für die Viererbeschleunigung bµ := 2 µ d2 xµ duµ 2 d x = c = c dτ 2 ds2 dτ (3.49) und postulieren in Analogie zum 2. Newtonschen Axiom, die relativistische Bewegungsgleichung durch m bµ = duµ dpµ = mc := f µ , dτ dτ wobei f µ die Viererkraft oder Minkowskikraft ist. Den Vierervektor f µ werden wir jetzt so definieren, dass im momentanen Ruhesystem das 2. (nichtrelativistische) Axiom gilt, wie oben besprochen. Im momentanen Ruhesystem IS’ ist die Vierergeschwindigkeit zwar durch 86 3.8. Um den Kreis zu schließen: Wie sieht der relativistische Kraftbegriff aus? uµ = (c, ~v = ~0) gegeben, allerdings gilt nicht wir durch unsere Definition fest: 0 d~v dτ 0 = 0. Die Kraft im IS’ legen 0 du0µ d~v (m c ) = m (0, ) := (f 0µ ) = (0, F~N ) . dτ dτ (3.50) Durch die Lorentztransformation mit −~v , erhalten wir die Minkowiskikraft die im IS, in dem sich das Teilchen mit ~v bewegt gilt. Um die relativistische Bewegungsgleichung (3.50) zu erhalten, haben wir die Vierer-Größen jeweils mit dem Hinweis eingeführt, dass diese die jeweils “naheliegendste relativisitsche Verallgemeinerung” sei. Die Gültigkeit von Gl. (3.50) folgt unabhängig von diesen Plausibilitätsargumenten: 1. Gl. (3.50) ist eine vierer Vektorgleichung, d.h. sie ist Lorentzinvariant (Einteins Relativitätsprinzip). 2. Gl. (3.50) ist im momentanen Ruhesystem gültig (Forderung). Die hieraus gewonnene Bewegungsgleichung führt zu Vorhersagen, die signifikant von den Newtonschen Bewegungsgleichungen abweichen und experimentell überprüft werden können. Betrachten wir hier ein Beispiel, um den Zusammenhang zwischen der Netwonschenkraft und der Minkowskikraft zu illustrieren. Für eine spezielle Lorentztransformation (~v = v ~e1 ) erhalten wir v (f µ ) = (f 0 , f~) = (γ FN1 , γ FN1 , FN2 , FN3 ) . c (3.51) Teilen wir die Newtonsche Kraft in einen zur Geschwindigkeit ~v parallelen und senkrechten Anteil auf, F~N = F~N k + F~N ⊥ , dann haben wir v (f µ ) = (f 0 , f~) = (γ FN k , γ F~N k + F~N ⊥ ) . c (3.52) Somit haben wir den Zusammenhang zwischen der im Ruhesystem spezifizierten Newtonschenkraft und der Minkowskikraft berechnet. Aber ist der Zusammenhang auch eindeutig? Man findet in der Literatur allerdings auch einen anderen Zusammenhang: Falls man uµ uµ = 1 nach s µ differenziert, erhält man uµ uds = 0 und damit uµ f µ = 0. Daher ist die Minkowskikraft f µ orthogonal zu uµ bzw. pµ und damit ein raumartiger Vektor. Man kann f 0 durch die räumlichen Komponenten f~ ausdrücken und erhält (analog zu oben) f0 = 1 ~v · f~ . c (3.53) Definieren wir uns jetzt eine relativistische Kraft, die Einsteinkraft durch d~ p F~ = dτ 87 (3.54) Kapitel 3. Relativistische Mechanik haben wir (f µ ) = γ( ~v · F~ ~ ,F) . c (3.55) Allerdings im Gegensatz zu f µ transformiert sich die Einsteinkraft F~ bei Lorentztransformationen nicht sehr einfach. Die Einsteinkraft kann hier als γ F~N aufgefasst werden. Hier haben wir jetzt den Widerspruch zu oben für die räumlichen Komponenten: (γFN1 , FN2 , FN3 ) = 6 (γFN1 , γFN2 , γFN3 ) . (3.56) Im Rahmen der Newtonschen Theorie kann der “richtige” Zusammenhang nicht entschieden werden. 88 Kapitel 4 Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie Wir haben schon gesehen, dass die Coulombkraft bis auf die Möglichkeit der Abstoßung identisch ist zur Schwerkraft. Damit gelten einige der Aussagen aus den vorangegangen Kapiteln auch für Teilchen, die eine Ladung besitzen gilt. Wir setzen hier den Schwerpunkt, dass die Elektrodynamik ein Paradebeispiel einer relativistische Theorie ist. Hier können leider all die anderen interessanten Fragestellungen nicht einmal erwähnt werden. 4.1 Einleitung Die Elektrodynamik beschäftigt sich mit allen elektrischen und magnetischen Erscheinungen. Sie ist eine relativistische Theorie. Viel Phänomene wurden aber bereits lang vor der Entwicklung der relativistischen Mechanik im Rahmen der klassischen Physik beschrieben (Ampere, Faraday und Maxwell). Die Elektrodynamik ist eine Feldtheorie (Nahwirkungstheorie, siehe Ab~ x, t) und B(~ ~ x, t) schnitt 1.4), ihre Phänomene werden durch 6 Funktionen E(~ beschrieben, die nur von den Koordinaten im Raum und der Zeit abhängen ~ (eine lokale Theorie). Das E–Feld wir von ruhenden Ladungen erzeugt und ~ das B–Feld von bewegten Ladungen hervorgerufen. Da wir immer die Freiheit besitzen uns ein physikalischen Phänomen von einem beliebigen Bezugssystem anzuschauen, ist klar, das für einen Beobachter in einem Bezugssystem eine Ladung ruhen kann, für einen anderen Beobachter hingegen (der sich relativ dazu bewegt) die Ladung nicht ruht. Daher folgt, dass elektrische Felder sich bei so einem Übergang in ein anderes Bezugssystem in magnetische 89 Kapitel 4. Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie Felder übergehen oder umgekehrt. Die Aufspaltung in elektrische und magnetische Phänomene ist daher vom Bezugsystem (vom Bewegungszustand des Beobachters abhängig, der die Beschreibung vornimmt) abhängig und hat daher keine tiefere Bedeutung bzw. ist insofern willkürlich. Man kann daher nur von elektromagnetischen Phänomenen sprechen. Es macht aber trotzdem Sinn sich in solche besonderen Bezugssystem zu setzen, da hier die Gesetze einfach werden und man gut sehen kann wie der Hase läuft. Da die Felder überall im Raum vorhanden sein sollen, ist die Elektrodynamik eine Theorie eines Kontinuums. Ihre Bewegungsgleichungen, die Feldgleichungen (Maxwellschen Gleichungen) beschreiben die Änderungen ~ und B ~ im Raum und Zeit und ihre Wechselwirkung mit der Feldstärken E Ladungen und Strömen. Ebenso wie andere Naturgesetze oder Grundgleichungen der Physik sind die Maxwellgleichungen nicht ableitbar oder beweisbar. Sie können entweder als Postulat, Axiom, aufgestellt oder als Verallgemeinerung von Schlüsselexperimenten (etwa der Coloumbkraft) plausibel gemacht werden. Die Maxwellsche Theorie ist ein Standardbeispiel für eine vereinheitlichte Theorie. Darunter versteht man, dass zunächst getrennt behandelte Phänomene im Rahmen einer einzigen Theorie verstanden und beschrieben werden können. Heute spricht man auch von der elektroschwachen Theorie, der Vereinheitlichung von elektromagnetischen Wechselwirkung und der schwachen Wechselwirkung (Radioaktivität) von Weinberg, Salam und Glashow. Die drei Herren sagen die Existenz von Vektorbosonen (Z 0 und W ± ) voraus, die in den achtziger Jahren auch bei Beschleunigerexperimenten nachgewiesen wurden. Es ist ein Ziel der heutigen Physik, alle Wechselwirkungen, also insbesondere auch die starke Wechselwirkung und die Gravitationswechselwirkung, im Rahmen einer vereinheitlichten Theorie zu verstehen, gelungen ist dies allerdings noch nicht. 4.2 Die Lagrangefunktion der Elektrodynamik Wir können jetzt das erstmal den Lagrangeformalismus anwenden, um ein nicht klassisches Phänomen zu beschreiben. Wenn wir die Lagrangefunktion richtig erraten, dann sollten wir zu den Bewegungsgleichungen gelangen und damit zu der Lorentzkraft. Zunächst werden wir aber ein wenig allgemeiner diskutieren, wie eine Lagrangefunktion für ein relativistisches System aussieht. 90 4.2. Die Lagrangefunktion der Elektrodynamik 4.2.1 Wie sieht die Lagrangefunktion für ein freies relativistisches Teilchen aus? Die Bahnkurve eines freien relativistischen Massenpunktes kann durch xi (t) oder durch xα (τ ) beschrieben werden. Der jeweilige allgemeiner Ansatz für die Lagrangefunktion lautet L1 (~x, ~x˙ , t) oder L2 (x, u) . (4.1) Im Argument von L2 steht, wie wir es für die relativistische Mechanik erarbeitet haben, x für x0 , x1 , x2 , x3 und die Vierergeschwindigkeit u für u0 , u1 , u2 , u3 . Über x0 = c t kann die Lagrangefunktion L2 auch explizit von der Zeit abhängen. Eine explizite τ Abhängigkeit in L2 muss nicht angegeben werden, da τ eine Funktion der anderen Argumente ist. Wie wir bereits gesehen haben, führen unterschiedliche Lagrangefunktionen zu gleichen Bewegungsgleichungen. L1 und L2 müssen daher nicht gleich sein, die Lagrangefunktion ist ja keine physikalische Größe. Damit sie zu gleichen Bewegungsgleichungen führen, muss allerdings δS = 0 gleich sein. Wir werden uns weiter Einschränken und verlangen, dass auch die Wirkung S selbst gleich ist, also soll gelten Z t2 Z t2 ˙ S = L1 (~x, ~x, t)dt = L2 (x, u)dt . (4.2) t1 t1 Für ein freies nichtrelativistischen Teilchen haben wir die Lagrangefunktion erraten. Hier werden wir ähnliches machen und dabei von Nöthers Theorem zu Hilfe nehmen. Denn für ein freies Teilchen gelten die allgemeinen Raum–Zeit Symmetrien. Aus der Homogenität des Raumes wissen wir, dass L1 nicht vom Ort ~x abhängen darf. Wegen der Homogenität der Zeit darf L1 nicht von t abhängen und wegen der Isotropie des Raumes darf L1 nur von ~v 2 abhängen. Damit können wir den folgenden Ansatz machen L1 = f (~v 2 ) . (4.3) Der einfachste Ansatz L1 ∝ ~v 2 führt nicht zur richtigen nichtrelativistischen Lagrangefunktion, wenn man den Limes nimmt. Die Lagrangefunktion, die wir suchen, muss natürlich Einsteins Relativitätsprinzip berücksichtigen. Allerdings ist nicht klar wie wir das anstellen sollen, da ~v kein Lorenzvektor ist. Wir verfolgen daher einen anderen Weg: Wir kennen die relativistische Bewegungsgleichung für den Fall f µ = 0, also für ein freies Teilchen. Aus dem Vergleich d ∂L1 = 0 dt ∂vi ⇐⇒ 91 d m~v (t) q = 0 dt ~v 2 (t) 1 − c2 (4.4) Kapitel 4. Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie erkennen wir r L1 (~v ) = −const ~v 2 1 − 2 = −m c2 c r 1− ~v 2 . c2 (4.5) Nochmals zur Erinnerung, verschiedene Lagrangefunktionen führen zur selben Bewegungsgleichung. Wir haben hier die Konstanten so gewählt, dass sich im nichtrelativistischen Limes die nichtrelativistische Lagrangefunktion L1 = m~v 2 /2, also die kinetische Energie (bis auf eine additive Konstante) ergibt. Achtung: Die relativistische Lagrangefunktion L1 ist nicht einfach die relativistische kinetische Energie! Nur für nichtrelativistische mechanische Systeme mit nur konservativen Kräften ist die Lagrangefunktion, die kinetische Energie minus der potentiellen Energie. Nun wagen wir uns an die Lagrangefunktion, die von den Vierervektoren x und u abhängen soll, und deren Wirkung mit der von L1 übereinstimmt. Wieder müssen die Raum–Zeit Symmetrien gelten und wir erhalten dadurch Einschränkungen. Durch die Homogenität des Raums darf L2 nicht von xi abhängen und durch die Homogenität der Zeit nicht von x0 = ct abhängen. Die Isotropie des Raumes und die Relativität der Raum–Zeit verlangt, dass die Lagrangefunktion ein Lorentzskalar sein soll, also L2 soll nur von uµ uµ abhängen, d.h. L2 = f (uµ uµ ) . (4.6) Wie sieht in dieser Formulierung das Hamiltonsche Prinzip aus? Hierzu muss t durch die Eigenzeit τ ersetzt werden, also Z τ2 δ L2 dτ = 0 (4.7) τ1 und die Euler–Lagrangen Bewegungsgleichungen lauten d ∂L ∂L = . µ dτ ∂u ∂xµ (4.8) Setzen wir nun unsere Lagrangefunktion L2 ein, erhalten wir d (2 f 0 (uµ uµ ) uµ ) = 0 . dτ (4.9) Jetzt hängen die vier Funktionen von uµ (τ ) von einander ab, den nach gilt uµ uµ = 1. D.h. das es egal ist, welche Funktion f wir ansetzen, da ihre Variable eine Konstante ist. Wir erhalten damit die (vier)Bewegungsgleichung d µ u = 0 dτ (µ = 0, 1, 2, 3) . 92 (4.10) 4.2. Die Lagrangefunktion der Elektrodynamik Achtung: Die Bedingung uµ uµ = 1 darf nicht in L2 selbst eingesetzt werden, da bei der Variation δS auch Bahnen uµ + δuµ zugelassen sind, die diese Bedingung nicht erfüllen. Für alle tatsächlichen möglichen Bahnen ist diese Bedingung erfüllt! Daher können wir sie in jede physikalische Größe, wie die Bewegungsgleichung, einsetzen, jedoch nicht in die Lagrangefunktion! Wir wählen jetzt f so, dass die Wirkung von L1 und L2 gleich sind, also Gleichung (4.2) gilt: sµ ¶2 µ ¶2 Z Z Z r 2 ~v d(ct) d~x 2 1 − 2 dt = −mc − dτ L1 dt = −mc c dτ dτ Z Z p 2 µ = −mc u uµ dτ = L2 (u) dτ . (4.11) Damit haben wir jetzt die Lagrangefunktion für L2 für ein freies relativistisches Teilchen mit den Vierervektoren gefunden: p L2 = −m c2 uµ uµ . (4.12) Hierfür ist die Wirkung gleich dem Wegintegral für die Bahn des Teilchens: Z τ2 Z 2 p Z τ2 p 2 µ S = dxµ dxµ dτ L2 = −m c dτ u uµ = −m c τ1 1 τ1 Z 2 = −m c ds . (4.13) 1 Das ist der einfachst mögliche lorentzskalare Ausdruck für die Bahn eines Massenpunktes in der Raum–Zeit. Bemerkung: Wie wir schon öfters gesehen haben, ist die Wahl der Lagrangefunktion nicht eindeutig, verschiedene Lagrangefunktionen führen zur gleichen Bewegungsgleichung und beschreiben damit die gleiche Physik. Die Form (4.12) haben wir hier so gewählt, dass die Wirkungen von L1 und L2 gleich sind (das muss ja nicht sein!) und L1 haben wir so gewählt, dass im 2 nichtrelativistischen Grenzfall die vertraute kinetische Energie L1 −→ m~2v herauskommt. Diese Wahl für L2 hat jedoch einen Schönheitsfehler, der verallgemeinerte Impuls ∂L = −pµ = −mcuµ . ∂uµ (4.14) Also ergibt das “falsche” Vorzeichen. Man könnte dies vermeiden indem man L2 in −L2 übergehen lässt (ist ja erlaubt, führt zur gleichen Bewegungsglei2 chung), aber dann hat man L1 −→ −L1 = − m~2v , was man wieder nicht 93 Kapitel 4. Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie haben will. Möglich wäre auch zu fordern, dass die Wirkungen nicht gleich sind. Zusammenfassend erkennen wir, dass es keine eindeutige Wahl für die Lagrangefunktion gibt. Viele Lagrangefunktionen führen zu der selben Bewegungsgleichung und im Grenzfall müssen nicht die richtigen Konstanten herauskommen! 4.2.2 Wie sieht die Lagrangefunktion für geladene Teilchen aus? Nun sind wir bereit ein Teilchen im elektromagnetischen Feld relativistisch zu betrachten. Die Lagrangefunktion wir sich aus dem kinetischen Teil zusammensetzen und einer Funktion, die die Kräfte beschreibt. Den kinetischen Teil haben wir im vorigen Abschnitt hergeleitet. Um die Kräfte für die L2 , (4.12), Darstellung zu berücksichtigen, benötigen wir eine relativistische Theorie der zugrunde liegenden Kraftfelder. Wir wissen, dass die elektrischen und magnetische Kraft auf ein geladenes Teilchen eine konservative Kraft ist und so geschrieben werden kann (siehe Seite 27): ~ x, t) + q ~x˙ × B(~ ~ x, t) , F~kons = −∇Φ(~ c (4.15) wobei man das elektrische Feld durch ~ ~ x, t) = −∇Φ(~ ~ x, t) − 1 ∂ A(~x, t) E(~ c ∂t (4.16) geschrieben werden kann und das magnetische Feld auch durch das dreidi~ sich ergibt: mensionale Vektorpotential A ~ x, t) = ∇ ~ × A(~ ~ x, t) . B(~ (4.17) ~ können auch als ViererDas skalare Potential Φ und das Vektorpotential A vektor zusammengefasst werden: ~ x, t)) . Aµ (x) := (c Φ, Ax , Ay , Az ) = (c Φ(~x, t), A(~ (4.18) Wir wissen, dass wenn etwas unter den Lorentztransformationen invariant sein soll, das wir natürlich für die Lagrangefunktion fordern, dann muss es ein Lorentzskalar sein. Aµ alleine ist kein Lorentzskalar. Wenn man ein bisschen herumprobiert, dann kann man folgenden Zusatzterm zur freien Lagrangefunktion aufstellen: 94 4.2. Die Lagrangefunktion der Elektrodynamik Die Lagrangefunktion der Elektrodynamik lautet LElektrodynamik (x, u) = L2 = −mc2 p q uµ uµ − Aµ (x)uµ . c (4.19) Im Argument dieser Lagrangefunktion kommen die Potenziale nicht vor, da die Aµ (x) äußere gegebene Felder sind und keine Größen, die zu variieren sind. Jedoch entspricht nicht jedes beliebe Feld, einem wirklichen elektromagnetischen Feld, wie bereits erörtert. Wir können die Lagrangefunktion aus oben auch so hinschreiben: LElektrodynamik (~x, ~v , t) = L1 r ~v 2 q ~ x, t) . (4.20) = −mc2 1 − 2 − q Φ(~x, t) + ~v · A(~ c c Mit der Lagrangefunktion können wir uns nach dem üblichen Rezept die Bewegungsgleichungen ausrechnen. Beginnen wir mit L1 . Der kanonisch konjugierte Impuls (3 dimensional) ist durch ~ i = (~p)i = (Π) ∂L1 q q~ = γmvi + Ai = (~p + A) i ∂vi c c (4.21) L 1 definiert und mit ∂x = . . . und dtd ∂L erhalten wir (4.25). ∂vi i Das gleich können wir für L2 machen, dazu benötigen wir d ∂L2 d m c 2 uν q duν q ∂Aν dxµ ( ν) = (− p µ − Aν (x)) = −m c2 − dτ ∂u dτ c dτ c ∂xµ dτ u uµ | {z } 1 q ∂Aν µ duν = −m c2 − u , dτ c ∂xµ (4.22) wobei im 2. Schritt uµ uµ gleich c2 gesetzt werden durfte, da hier nicht mehr die Abhängigkeit eingeht, und die andere Seite der Euler-Lagrange-Gleichungen q ∂Aµ µ ∂L2 = − u . ν ∂x c ∂xν 95 (4.23) Kapitel 4. Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie Die zwei Ergebnisse können wir so zusammenfassen und erhalten, die Bewegungsgleichungen der Elektrodynamik (in manifest kovarianter Form): m duν dτ = q Fνµ uµ . c (4.24) Der Ausdruck Fµν ist der berühmte Feldstärketensor, der die ~ zusammenfasst: Ableitungen des 4–Potenzials A 0 Ex Ey Ez −Ex ∂Aν ∂Aµ 0 −Bz By . (Fµν ) = ( µ − ) = −Ey Bz 0 −Bx ∂x ∂xν −Ez −By Bx 0 Damit lauten die räumlichen Komponenten d~p ~ + ~v × B) ~ := F~L = q (E dt c (4.25) und zeigt das die Zeitableitung des relativistischen Impulses p~ = mγ~v nichts anderes ist als die Lorentzkraft! Die Lorentzinvarianz erkennt man auch gleich durch (F µν )(x0 ) = Lµα Fαβ (x)Lνβ bzw. in Matrixschreibweise F 0 = LF L−1 (L. . . beliebige Lorentztransformation). Damit hat man die manifest kovariante (= Gleichung, in der nur Vierervektoren und/oder Vierertensoren auftreten, haben in allen Inertialsystemen gleiche Form) Bewegungsgleichungen: c pν dτ = q F νµ uµ (4.26) gefunden. Der räumliche Anteil ist die Lorentzkraft (4.25) und der zeitliche Teil beschreibt die zeitliche Änderung der Energie ~v ~ Erel = q ·E . dt c 96 (4.27) 4.3. Die Lorentzkraft und ihr nichtrelativistischer Limes 4.3 Die Lorentzkraft und ihr nichtrelativistischer Limes Betrachten wir die Bewegungsgleichung der Elektrodynamik, Gl.(4.24), ihr räumlicher Anteil ergibt die Lorentzkraft d~p F~L = dt d m~v q = dt 1 − Im nichtrelativistischen Grenzfall m v c v2 c2 ~+ = q (E ~v ~ . × B) c (4.28) ¿ 1 erhalten wir 2 d~v ~ + ~v × B) ~ + O( v ) . = q (E dt c c2 (4.29) Damit ist die Lorentzkraft bis auf höhere Ordnungen im nichtrelativistischen Falle gleich, daher kann sie auch in der nichtrelativistischen Mechanik eingesetzt werden und jetzt ist klar, warum geschichtlich gesehen, nicht gleich erkannt wurde, warum die Galileitransformation, also das Konzept eines absoluten Raumes und einer absoluten Zeit, nicht stimmen kann. 4.4 Die Maxwell Gleichungen James Maxwell formulierte bereits im Jahr 1864 die nach ihm benannten Maxwell Gleichungen, übrigens ganz ohne Vektorrechnung! Es sind die Grundgleichungen für die Elektrodynamik und können damit (noch nicht) aus allgemeineren Prinzipien abgeleitet werden und damit können wir diese Gleichungen als Axiome betrachten. Sie fassen sehr viele zunächst unterschiedlich erscheinende experimentelle Erfahrungen zusammen, aber —und eine der bedeutendsten Leistungen der Theoretischen Physik— gehen aber weit darüber hinaus. Anhand dieser Gleichungen sagte Maxwell u.a. die elektromagnetischen Wellen voraus und leitete ihre Eigenschaften ab. Insbesondere zeigte er, dass sich diese “Verknüpfung” aus elektrischen und magnetischen Wellen mit einer endlichen Geschwindigkeit, der Lichtgeschwindigkeit, ausbreitet. Das stand im Gegensatz zur damaligen Ansicht, dass derartige Erscheinungen unendlich schnell sind. Das Potential ist eine Funktion von den Raumkoordinaten von u.a. sehr weit entfernten Teilchen, eine Änderung des Potential “erfahren” die Teilchen unendlich schnell. 97 Kapitel 4. Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie Heinrich Hertz (1887) fand dann die vorhergesagten elektromagnetischen Wellen und Hermann Minkowski dehnte die Maxwellschen Gleichungen bewegte Körper aus und machte sie damit allgemein gültig. Für sehr kleine Entfernungen, also im atomaren Bereich, sind die Maxwell Gleichungen nicht anwendbar. Dort gelten die Gesetze der Quantenelektrodynamik (QED). Wir haben die messbaren elektrischen und magnetischen Felder durch ihre ~ ausgedrückt. Damit haben wir sechs Felder zu vier Feldern Potentiale Φ, A reduzieren können und hatten den folgenden Zusammenhang gefunden ~ ~ = −∇Φ ~ − 1 ∂A E c ∂t ~ = ∇ ~ ×A ~. B (4.30) Wir wollen jetzt diese Gleichungen so umschreiben, dass nur noch elektrischen und magnetischen Felder vorkommen. Dazu betrachten wir (wer den Epsilon Tensor nicht kennt, muss es “ausixen”, dauert zwar lang, aber man sieht alles fällt weg): ~ := ∇ ~ ·B ~ = ∇ ~ · (∇ ~ × A) ~ = ∇i εijk ∇j Ak divB = εijk ∇i ∇j Ak = 0 . (4.31) Da der Epsilon Tensor antisymmetrisch die Ableitungen ∇ aber symmetrisch ist der obige Ausdruck null. Und wir betrachten die Größe ~ ~ := ∇ ~ ×E ~ = ∇ ~ × (−∇Φ ~ − ∂A ) rotE ∂t ~ ~ ∂ A ∂ ~ × ~ ×A ~ = − ∂B = −∇ = − ∇ ∂t ∂t ∂t (4.32) Und damit haben wir die erste Gruppe der Maxwellschen Gleichungen, die homogenen Maxwell Gleichungen, gefunden: ~ x, t) = 0 divB(~ ~ x, t) = − rotE(~ ~ x, t) 1 ∂ B(~ c ∂t (4.33) Die erste Gleichung sagt aus, dass es keine magnetischen Ladungen, keine magnetischen Ströme und insbesondere keine magnetischen Monopole gibt. Die zweite sagt aus, dass zeitliche Änderungen des Magnetfeldes ein elektrisches Feld induziert. 98 4.4. Die Maxwell Gleichungen Bemerkung: Man erkennt, dass elektrische und magnetische Phänomene nicht symmetrisch sind! Uns fehlen noch die so genannten inhomogenen Maxwell Gleichungen, sie sind gegeben durch 1 ρ(~x, t) ε0 ~ ~ = 1 ~j(~x, t) + ∂ E(~x, t) . c2 rotB ε0 ∂t ~ x, t) = divE(~ (4.34) Hier treten zwei neue Größen, die Quellterme ρ und ~j auf. Die Ladungsdichte ρ(~x, t) ist die Ladung bezogen auf ein bestimmtes Volumen und das Integral über ein beliebiges (dreidim.) Volumen ergibt die in diesem Volumen zur Zeitpunkt t enthaltene Ladung: Z dx3 ρ(~x, t) = QV (t) . (4.35) V Die Stromdichte ~j(~x, t) (Ladung pro Zeit und Fläche) integriert über eine beliebige Fläche ergibt den zum Zeitpunkt t fließenden Strom IF (Ladung pro Zeit): Z df~ · ~j(~x, t) = IF (t) . (4.36) F ~ nach der Zeit Leitet man die inhomogene Maxwell Gleichung mit div E ab und bilden die Divergenz der anderen inhomogenen Gleichung, ergibt die Kombination der beiden resultierenden Gleichungen die Kontinuitätsgleichung, also den Satz von der Erhaltung der elektrischen Ladung ∂ ρ(~x, t) + div f~(~x, t) = 0 . ∂t (4.37) Bis heute wurde in keinem Experiment eine Verletzung der Ladungszahl gemessen, es scheint also ein Grundprinzip unserer uns umgebenden Welt zu sein! Die Kontinuitätsgleichung können wir auch in der vierdimensionalen Form hinschreiben: ∂ µ j ∂xµ 99 (4.38) Kapitel 4. Elektrodynamik: Ein Paradebeispiel einer relativistischen Theorie mit (j µ ) = (c ρ, ~j). Beispiel: Ladungsverteilung in IS, ergibt Ladungsverteilung und Strom in IS’ Zum Abschluss können wir auch noch die Maxwell Gleichungen in der Viererschreibweise und damit in manifest kovarianter Form hinschreiben: ∂ µν 1 ν F = j (x) . ∂xµ c ε0 (4.39) Die zeitliche Komponente ergibt die inhomogene Maxwellgleichung mit dem Quellterm ρ, die räumlichen Komponenten ergeben die inhomogene Maxwellgleichung mit dem Quellterm ~j. Die homogenen Gleichungen erhält man mit dem dualen Feldstärketensor 0 B x By Bz −Bx 1 0 Ez Ey , (4.40) F̃ µν := εµνst F st · −By Ez 0 Ex 2 −Bz −Ey Ex 0 wobei εµνst ein total antisymmetrische Tensor ist und damit können die homogenen Gleichungen auch so angeschrieben werden ∂ F̃ µν = 0 . ∂xµ 100 (4.41) Literaturverzeichnis [1] Bernhard Baumgartner, Skriptum zur Theoretischen Physik fürs Lehramt, 2006. [2] Thorsten Fließbach, Mechanik, Spektrum, Heidelberg, 2003. [3] Walter Greiner, Theoretische Physik 1, Verlag Harri Deutsch, 2003. [4] Gerhard Ecker, Skriptum zur klassischen Mechanik, 2006. [5] Heinrich Mitter, Mechanik, Vorlesung http://physik.kfunigraz.ac.at/ hem über Physik 1, [6] Helmut Neufeld, Skriptum zur Theoretischen Physik fürs Lehramt, 2007. [7] Feynman, Leighton und Sands, Feynman Vorlesungen über Physik, Band I, Oldenbourg, 1987. [8] . . . 101