T HEORETISCHE P HYSIK Hans-Jürgen Matschull Institut für Physik, Universität Mainz 5.1.2003 T EIL I T EILCHEN , K R ÄFTE , F ELDER Was ist eine physikalische Theorie? Auf diese Frage gibt es sicher keine eindeutige, allgemein akzeptierte und präzise Antwort. Verschiedene Physiker haben oft sogar sehr unterschiedliche Vorstellungen davon, was sich hinter diesem Begriff verbirgt. Die Antworten reichen von sehr weit gefassten Umschreibungen wie “eine physikalische Theorie ist eine Beschreibung von Naturvorgängen”, vielleicht noch ergänzt durch den Zusatz “in der Sprache der Mathematik”, bis hin zu sehr konkreten Erklärungen wie “eine physikalische Theorie ist eine -Algebra von beschränkten Operatoren auf einem Hilbert-Raum”. Während die erste Definition viel zu vage ist, um damit konkret zu arbeiten, besticht die zweite an dieser Stelle wohl vor allem durch ihre Unverständlichkeit. Wir wollen versuchen, eine einerseits möglichst allgemeine, auf die gesamte Physik anwendbare, aber andererseits auch sehr konkrete Definition zu geben. Eine solche Definition des Begriffes physikalische Theorie zur Hand zu haben, wird sich an vielen Stellen als nützlich erweisen. Was wollen wir mit einer physikalischen Theorie eigentlich erreichen? Zunächst wollen wir die Phänomene beschreiben, die wir beobachten können. Darüber hinaus wollen wir Gesetzmäßigkeiten formulieren, die wir in diesen Phänomenen erkennen. In einem gewissen Sinne wollen wir die Phänomene auch verstehen, indem wir sie auf möglichst wenige, vielleicht unerklärbare Grundphänomene zurückführen. Und schließlich wollen wir mit Hilfe eine Theorie Vorhersagen machen über zukünftige Phänomene und Beobachtungen, was auch zu der Möglichkeit von praktischen Anwendungen führt. Als Werkzeug, und zwar sowohl als methodisches als auch als sprachliches Werkzeug, wollen wir dabei die Mathematik verwenden. Eine physikalische Theorie baut auf einer mathematischen Theorie auf. In einer mathematischen Theorie werden grundlegende Begriffe durch Axiome definiert. Axiome beschreiben die Objekte, aus denen eine mathematische Theorie aufgebaut wird, durch ihre Eigenschaften und ihre Beziehungen zueinander. Die Axiome einer mathematischen Theorie sagen allerdings nichts darüber aus, was diese Objekte sind. Sie sagen uns nur, wie sie sich zueinander verhalten. Genau das ist die Stärke der Mathematik. Sie lässt offen, was man sich unter den abstrakten Begriffe, die sie definiert, konkret vorstellen soll und kann. Und das ist auch genau die Schnittstelle, an der eine physikalische Theorie ansetzt. Eine physikalische Theorie wählt aus einer mathematischen Theorie einige abstrakte Begriffe aus, und identifiziert sie mit realen, beobachtbaren Objekten. Sie fügt zu den mathematischen Axiomen einer Theorie physikalische Axiome hinzu. Ein physikalisches Axiom beantwortet also die Frage, was ein zunächst abstraktes mathematische Objekt ist. Es ordnet ihm ein Objekt in der realen Welt zu. Typischerweise wird eine solche Zuordnung durch eine Messvorschrift hergestellt. Wie wir gleich im ersten Kapitel sehen werden, können wir zum Beispiel eine Methode angeben, mit der wir den Abstand zweier Orte im Raum messen können. Als eine andere Messgröße werden wir später die Zeit einführen. Sie wird, wie sollte es anders sein, mit einer Uhr gemessen. Eine physikalische Theorie identifiziert diese Messgrößen mit abstrakten Größen, die zuvor völlig kontextfrei in einer mathematischen Theorie definiert wurden. Sie stellt in diesem Sinne eine Beziehung zwischen Mathematik und Realität her. Eine physikalische Theorie ist eine Abbildung von realen Objekten auf abstrakte mathematische Strukturen. Ein physikalische Theorie ist also mehr als reine Mathematik, denn die reine Mathematik kennt eine solche Zuordnung nicht. Ihre Objekte existieren im luftleeren Raum der reinen Logik. Die Physik erweckt die mathematischen Strukturen gewissermaßen zum realen Leben. Eine physikalische Theorie ist aber andererseits auch mehr als eine reine Naturbeschreibung. Durch die Abbildung der realen Objekte auf mathematische Strukturen macht sie sich nämlich die sehr effektiven Möglichkeiten der Mathematik zu nutze, nahezu beliebig neue Objekte und Strukturen einführen zu 1 können. Die Stärke einer physikalischen Theorie liegt darin, mit diesen Objekten und Strukturen rechnen und arbeiten zu können, ohne sich darüber Gedanken machen zu müssen, welchen realen Objekten sie entsprechen. Um mit Hilfe einer Theorie eine Vorhersage über eine zukünftige Beobachtung zu machen, gehen wir in der Regel so vor, dass wir die bereits durchgeführten Messungen und Beobachtungen zunächst in die Sprache der Mathematik übersetzen. Dazu benötigen wir die Abbildung der Realität auf die Mathematik, die eine physikalische Theorie herstellt. Dann können wir, ganz ohne Bezug zur Realität, reine Mathematik betreiben, um aus unseren Beobachtungen logische Schlüsse zu ziehen. Erst dann tauchen wir wieder auf, indem wir die Ergebnisse wieder in eine physikalische Sprache zurück übersetzen und so zum Beispiel das Ergebnis einer Messung vorhersagen. Es ist dabei nicht nötig, mit allen in den Zwischenschritten verwendeten Begriffen und Zusammenhängen irgendwelche physikalischen, also realen Vorstellungen zu verbinden. Meistens geht das auch gar nicht, weil nur sehr wenige der in einer Theorie definierten mathematischen Objekte überhaupt einen direkten Bezug zur physikalischen Realität haben. Und in der Regel sind dies auch nicht die durch die mathematischen Axiome definierten Objekte, sondern daraus abgeleitete, also im mathematischen Sinne komplexere Objekte. Die im mathematischen Sinne “primitiven” Objekte einer Theorie, also die, die durch die mathematischen Axiome definiert werden, müssen nicht gleichzeitig die im physikalischen Sinne “primitiven” Objekte sein, also diejenigen, die unmittelbar der Beobachtung oder Messung zugänglich sind. In den klassischen Theorien, die wir hier zunächst einführen werden, liegen Mathematik und Realität noch sehr eng beieinander. Die meisten mathematischen Größen haben zumindest eine anschauliche Entsprechung in der Realität, auch wenn sie nicht einer unmittelbaren Messung zugänglich sind. Die meisten mathematischen Konstruktionen, die wir in diesen Theorien benötigen, können wir uns unmittelbar anschaulich vorstellen, was das Verständnis oft sehr erleichtert. Jedoch besteht dadurch auch ein wenig die Gefahr, die wahre Stärke eine physikalischen Theorie zu verkennen. Das ist die Fähigkeit, auch mit mathematischen Objekten arbeiten zu können, die keinen direkten Bezug zur Realität mehr haben, oder deren Bezug zur Realität wir nicht kennen. Spätestens, wenn wir uns mit der Quantenmechanik beschäftigen, werden wir mit dieser Tatsache ganz unmittelbar konfrontiert werden. Dort treten nämlich mathematische Strukturen auf, die wir für die Berechnungen benötigen, von denen wir aber nicht sagen können, welchen realen Strukturen sie eigentlich entsprechen. Das führt sogar zu allerlei metaphysikalischen, also philosophischen Fragen darüber, was man von so einer Theorie eigentlich halten soll. Aber entscheidend ist, dass sie sehr gut funktioniert, und zwar selbst dann, wenn wir nicht von allen mathematischen Begriffen, die wir benutzen, den Zusammenhang mit der Realität kennen. Viel tiefer wollen wir an dieser Stelle nicht in die Frage nach dem Wesen eine physikalischen Theorie einsteigen. Vieles verstehen wir ohnehin erst, wenn wir ein paar Beispiele für physikalische Theorien kennen und vor allem benutzen gelernt haben. Die grundlegende Eigenschaft einer physikalischen Theorie, also die Definition einer Abbildung der Realität auf die Mathematik, sollten wir jedoch stets im Auge behalten, wenn wir verstehen wollen, was eine physikalische Theorie leisten kann und vor allem was sie nicht leisten kann. 1 Die Struktur des Raumes Den physikalischen Raum stellen wir uns als eine Menge von Punkten vor. Einen Punkt oder Ort im Raum können wir durch einen Gegenstand markieren, etwa die Ecke eines Tisches oder den Mittelpunkt der Erde. Natürlich müssen wir an dieser Stelle ein wenig idealisieren, denn in der Praxis können wir einen Ort immer nur mit einer endlichen Genauigkeit bestimmen. Weder die Ecke eines Tisches noch der Mittel- 2 (d) (b) (a) (c) Abbildung 1.1: Vektoren werden durch Pfeile im Raum dargestellt. Zwei Pfeile repräsentieren denselben Vektor, wenn sie durch eine Verschiebung (a) aufeinander abgebildet werden. Die Addition (b) von Vektoren erfolgt durch Zusammensetzen, die skalare Multiplikation (c) durch Strecken der Pfeile. Der inverse Vektor ergibt sich durch Umkehren der Richtung. punkt der Erde definiert einen wirklich punktförmigen Ort im Raum. Wir können uns aber vorstellen, dass wir einen Ort beliebig genau festlegen können, wenn wir unsere Methoden nur immer weiter verfeinern. Jedenfalls beruht die klassische Physik auf der Annahme, dass das im Prinzip möglich ist. Aber der Raum besteht nicht nur einfach aus einer Menge von Punkten, sondern diese Menge hat auch einer Struktur. Die klassische Physik geht davon aus, dass der physikalische Raum die Struktur eines dreidimensionalen Euklidischen Raumes besitzt. In einem Euklidischen Raum sind die aus der Geometrie bekannten Größen wie Längen und Winkel definiert, es gibt Operationen wie Verschiebungen und Drehungen, und das Konzept der Vektorrechnung. Allen diesen mathematischen Strukturen entsprechen gewisse physikalische Strukturen des Raumes. Im Sinne der Einleitung ist dies bereits eine physikalische Theorie. Die Euklidische Geometrie macht Aussagen über bestimmte Größen, die wir im physikalischen Raum messen können, und über Beziehungen zwischen solchen Messgrößen, die wir experimentell nachprüfen können. Sie ist daher die älteste physikalische Theorie im modernen Sinne, obwohl die Erkenntnis, dass es eine solche ist, relativ neu ist. Alle üblicherweise als “klassisch” bezeichneten physikalischen Theorien, darunter die Newtonsche Mechanik und die Maxwellsche Elektrodynamik, bauen auf dieser Theorie über die Struktur des Raumes auf. Wir werden uns deshalb in diesem und dem nächsten Kapitel etwas ausführlicher mit der Euklidischen Geometrie beschäftigen und zeigen, in welchen Sinne sie als physikalische Theorie zu verstehen ist. Allerdings werden wir sie nicht auf den traditionellen Euklidischen Axiomen aufbauen, sondern eine für unsere Zwecke etwas besser geeignete Formulierung verwenden. Sie baut auf dem Konzept eines metrischen affinen Raumes auf. Was das ist, werden wir natürlich erst einmal erklären. Vektorräume Bevor wir den physikalischen Raum selbst als Punktmenge beschrieben, ist es nützlich, das Konzept eines Vektors einzuführen. Die wichtigsten Eigenschaften von Vektoren sind in Abbildung 1.1 dargestellt. Einen Vektor stellen wir uns als einen Pfeil im Raum vor. Ein Pfeil ist die gerichtete Verbindungslinie zweier Punkte. Ein Pfeil hat eine Länge und eine Richtung. Wir betrachten zwei Vektoren als gleich, wenn sie durch Pfeile gleicher Länge und Richtung dargestellt werden. Das ist genau dann der Fall, wenn die Pfeile durch eine Verschiebung ineinander übergehen. Schließlich können wir Vektoren addieren, indem wir die Pfeile aneinander ansetzen, und wir können sie mit reellen Zahlen multiplizieren, indem wir die Pfeile strecken bzw. stauchen. Aus dieser anschaulichen Vorstellung wird das mathematische Konzept eines Vektorraumes abgeleitet. Ein Vektorraum über dem Körper der reellen Zahlen besteht aus einer Menge von Vektoren. Wir 3 bezeichnen Vektoren durch ein Symbol mit Pfeil, das heißt wir schreiben für die Elemente von . Die Struktur des Vektorraums wird durch zwei Abbildungen festgelegt, nämlich die Addition von Vektoren, Vektoraddition (1.1) und die skalare Multiplikation von Vektoren mit reellen Zahlen, skalare Multiplikation (1.2) Bezüglich der Addition bildet der Vektorraum eine abelsche Gruppe, das heißt die Addition ist kommutativ und assoziativ. Für alle gilt Außerdem gibt es einen Nullvektor ! dass (1.3) , sowie zu jedem Vektor einen inversen Vektor "# , so ! $ %"# & ! (1.4) Die skalare Multiplikation ist distributiv bezüglich der Additionen in und in , und mit der Multiplikation in verträglich. Für alle ' und alle )( gilt *% #+ , -( #+.( ( / ( 0 (1.5) Wegen der Assoziativität der Addition (1.3) können wir statt * 1 oder * auch einfach schreiben. Das gleiche gilt für die skalare Multiplikation. Wegen der dritten Eigenschaft in (1.5), also der Verträglichkeit mit der Multiplikation in , schreiben wir statt , ( oder * ( einfach ( . Und schließlich benutzen wir für 2" 3 die Abkürzung " . Aufgabe 1.1 Man zeige, dass es zu je zwei Vektoren stets genau einen Vektor 4 gibt mit 4 , und dass es demnach auch nur genau einen Nullvektor ! , und zu jedem Vektor nur genau einen inversen Vektor "# gibt. Aufgabe 1.2 Man beweise, dass für alle "*%"5 & folgende Identitäten gelten: 6 ! %" 0 "#$ 7 (1.6) Das Skalarprodukt Um den Betrag und die Richtung eines Vektors zu definieren, benötigen wir als zusätzliche Struktur auf dem Vektorraum ein Skalarprodukt oder eine Metrik. Die beiden Begriffe werden oft synonym verwendet. Ein Skalarprodukt ist eine Abbildung, die jedem Paar von Vektoren eine reelle Zahl zuordnet, Skalarprodukt 1& 8 9 ;: Es hat die folgenden Eigenschaften. Es ist symmetrisch, das heißt für alle <: = : (1.7) gilt (1.8) Außerdem es linear, das heißt es verhält sich distributiv gegenüber der Addition, und es ist mit der skalaren Multiplikation verträglich. Für alle ' + und alle > gilt + 1 : 5: : 4 ,# : ? /<: 1 (1.9) Aus der Symmetrie (1.8) folgen dann natürlich auch die entsprechenden Eigenschaften bezüglich des zweiten Argumentes, ;: & 5: 5: <: , & /5: (1.10) Schließlich ist das Skalarprodukt eines Vektors mit sich selbst stets positiv und nur dann gleich Null, wenn der Vektor der Nullvektor ist. Es gilt also für alle ;: 86 ;: 6 ! (1.11) Auch hier können wir wieder die Eigenschaften des Skalarproduktes verwenden, um die Schreibweise zu vereinfachen. Statt / : oder 5 : schreiben wir einfach # : . Wir müssen bei solchen vereinfachten Schreibweisen nur darauf achten, dass auf beiden Seiten des Punktes stets ein Vektor steht. Wir verwenden außerdem die Abkürzung ;: . Ein Vektorraum, auf dem ein Skalarprodukt definiert ist, heißt metrischer Vektorraum. In einem metrischen Vektorraum hat jeder Vektor einen Betrag, der durch das Skalarprodukt des Vektors mit sich selbst definiert ist, Betrag ;: (1.12) Der Betrag eines Vektors ist stets positiv, nur der Nullvektor hat den Betrag Null. Oft spricht man statt vom Betrag auch von der Länge eines Vektors. Wir wollen das Wort “Länge” aber für einen anderen Begriff reservieren, auf den wir am Ende dieses Kapitels näher eingehen werden. Der Begriff des Betrages ist ein wenig allgemeiner, wie wir dort sehen werden. 0 hat, dessen Betrag also gleich Eins ist, nennen wir Einen Vektor , der die Eigenschaft Einheitsvektor. Ein Einheitsvektor definiert quasi nur eine Richtung. Zu jedem Vektor ! gibt es einen Einheitsvektor , der in dieselbe Richtung zeigt wie , nämlich . Mit Ausnahme des Nullvektors lässt sich jeder Vektor auf diese Weise eindeutig in Betrag und Richtung zerlegen, (1.13) Um auszudrücken, dass der Vektor in die Richtung von zeigt, schreiben wir , das heißt ist zu proportional. Das ist genau dann der Fall, wenn es ein > gibt mit / . Wenn das Skalarprodukt von zwei Vektoren verschwindet, also : ? 6 ist, so nennen wir die Vektoren orthogonal und schreiben . Der Nullvektor ist in diesem Sinne zu allen Vektoren, auch zu sich selbst, mit orthogonal. Dass diese Sprechweise tatsächlich etwas mit rechten Winkeln zu tun hat, wird in Aufgabe 1.20 gezeigt. Aufgabe 1.3 Man beweise die binomischen Formeln 1 1 : " 1& % " 7 #: " " 7 <: (1.14) Aufgabe 1.4 Man beweise die folgenden Eigenschaften des Skalarproduktes. Bei Multiplikation eines Vektors mit einer reellen Zahl wird dieser um den Faktor gestreckt, das heißt f ür alle und alle gilt # (1.15) Aus der Kenntnis der Beträge aller Vektoren kann man das Skalarprodukt rekonstruieren. Es gilt n ämlich für alle $ 5: ? " " (1.16) 5 replacements (c) (d) (b) (a) Abbildung 1.2: Ein Vektor lässt sich eindeutig in einen Anteil proportional und einen Anteil senkrecht zu einem Einheitsvektor zerlegen (a). Das Skalarprodukt repräsentiert die orthogonale Projektion von auf die Richtung von (b). . Außerdem gilt für alle Vektoren die Schwarzsche Ungleichung 5: (1.17) Wann gilt hier das Gleichheitszeichen? Aufgabe 1.5 Eine weitere nützliche Eigenschaft des Skalarproduktes ist in Abbildung 1.2(a) dargestellt. Es sei irgendein Vektor und ein Einheitsvektor. Dann kann man in zwei Vektoren und zerlegen, und zwar so, dass zu proportional ist, und zu senkrecht steht, also (1.18) Man zeige, dass eine solche orthogonale Zerlegung immer existiert, dass sie sogar eindeutig ist, und dass sich die Vektoren und wie folgt darstellen lassen, % ;: "8%<: (1.19) Aufgabe 1.6 In Abbildung 1.2(b) wird gezeigt, dass das Skalarprodukt : die orthogonale Projektion eines Vektors auf einen Einheitsvektor definiert. Wie ist das zu verstehen? Warum kann die orthogonale Projektion von auf nur Werte zwischen " und annehmen? Basis und Dimension Um in einem Vektorraum konkrete, also numerische Rechnungen durchzuführen, müssen wir eine Basis einführen. Eine Basis ermöglicht es, das formale Rechnen mit Vektoren auf das Rechnen mit Zahlen zurückzuführen. Das benötigen wir, um später zum Beispiel ganz konkret die Bahn eines Körpers im Raum zu berechnen, was ja eine typische Aufgabe der Mechanik ist. Wir betrachten einen Vektorraum , sowie einen Satz von beliebig ausgewählten Vektoren , wobei eine positive ganze Zahl ist. Der Index , mit dem wir die einzelnen Vektoren durchnummerieren, soll im folgenden immer von 0 bis laufen, also Werte aus der Indexmenge 0 annehmen. Den kompletten Satz von Vektoren bezeichnen wir mit . Wir können ihm gewisse Begriffe und Eigenschaften zuordnen. 6 Eine Linearkombination der Vektoren ist ein Ausdruck der Form mit (1.20) Wir multiplizieren jeden Vektor mit einer reellen Zahl und addieren die Ergebnisse zu einem neuen Vektor. Die Zahlen > , die wir ebenfalls zu einem Satz zusammenfassen können, sind die Koeffizienten der Linearkombination. Ein Satz von Vektoren heißt vollständig, wenn jeder Vektor als Linearkombination der gegebenen Vektoren dargestellt werden kann. Es existiert also für jeden Vektor ein Satz von reellen Zahlen mit (1.21) ' Wir sagen in diesem Fall auch, dass der Vektorraum von den Vektoren aufgespannt wird. Ein Satz von Vektoren heißt linear unabhängig, wenn das Gleichungssystem 4 ! (1.22) für die Variablen 4 nur genau dann erfüllt ist, wenn alle 4 6 sind. Es gibt also nur genau eine Linearkombination der Vektoren , die als Ergebnis den Nullvektor liefert. Das ist die, bei der alle Koeffizienten gleich Null sind. Eine Basis von ist ein Satz von Vektoren , der sowohl linear unabhängig als auch vollständig ist. Wenn eine Basis von ist, dann lässt sich jeder Vektor auf genau eine Art und Weise als Linearkombination der Basisvektoren schreiben. Es gibt also zu jedem Vektor genau einen Satz von Komponenten , so dass (1.23) Dass es mindestens einen solchen Satz gibt, ergibt sich aus der Vollständigkeit der Basisvektoren. Dass es für jeden Vektor nur genau einen Satz von Komponenten gibt, folgt aus der linearen Unabhängigkeit der Basisvektoren. Sei nämlich ein zweiter Satz von Komponenten mit der Eigenschaft (1.23). Dann ist $ " '" " ! (1.24) Das ist ein Gleichungssystem der Form (1.22) für die Variablen 4 &" . Somit folgt wegen der linearen Unabhängigkeit der Basisvektoren, dass alle 4 gleich Null sind, also . Wenn es eine Basis von gibt, die aus Vektoren besteht, dann besteht jede andere Basis von auch aus Vektoren. Das ergibt sich aus dem folgenden, sogar noch etwas allgemeineren Satz. Aufgabe 1.7 Es sei , mit 0 33 ein linear unabhängiger Satz von Vektoren, und mit 0 31 ein vollständiger Satz von Vektoren. Man zeige, dass ist. Da jede Basis sowohl vollständig als auch linear unabhängig ist, folgt daraus, dass jede Basis aus gleich vielen Vektoren bestehen muss. Die Zahl der Basisvektoren ist eine Eigenschaft des Vektorraumes . Sie wird als Dimension bezeichnet und mit bezeichnet. Wir betrachten hier nur endlichdimensionale Vektorräume, also solche, die eine Basis aus endlich vielen Vektoren besitzen. Mit Hilfe einer Basis lässt sich das Rechnen mit Vektoren auf das Rechnen mit reellen Zahlen zurückführen. Um eine Vektoraddition oder eine skalare Multiplikation durchzuführen, müssen wir nur die entsprechende Operation auf die Komponenten der Vektoren bezüglich irgendeiner Basis anwenden. 7 Aufgabe 1.8 Man zeige, dass für alle ' und für alle die folgenden Rechenregeln gelten, # , (1.25) Der Raum aller -Tupel von reellen Zahlen ist natürlich selbst ein Vektorraum, wobei die Addition und die skalare Multiplikation eintragsweise erklärt sind, also ; bzw. * ; . Das entspricht genau den entsprechenden Operationen in (1.25), so dass durch die Zuordnung eines Vektors zu seinen Komponenten eine lineare Abbildung definiert wird. Eine Abbildung zwischen zwei Vektorräumen heißt linear, wenn sie mit der Vektoraddition und der skalaren Multiplikation verträglich ist. Die Summe von zwei Vektoren wird auf die Summe der Bilder der beiden Vektoren abgebildet, und das skalare Vielfache eines Vektors auf des entsprechende Vielfache des Bildes. Genau das ist die Aussage von (1.25). Ist die Abbildung zudem bijektiv, so werden die beiden Vektorräume vollständig miteinander identifiziert. Wir können die Eigenschaften einer Basis daher wir folgt zusammenfassen: Eine Basis ist eine bijektive lineare Abbildung Dabei ist . natürlich die Dimension von . Explizit ist die Abbildung wie folgt gegeben, Basis Aufgabe 1.9 Es sei mit " " " (1.27) Sind die Vektoren bzw. vollständig? Sind sie linear unabhängig? (1.26) eine Basis eines dreidimensionalen Vektorraumes . Ferner sei Aufgabe 1.10 Es sei ein -dimensionaler Vektorraum. Warum ist jeder vollst ändige Satz von genau Vektoren eine Basis von ? Warum ist jeder linear unabhängige Satz von genau Vektoren eine Basis von ? Aufgabe 1.11 Nicht jeder Vektorraum ist endlich-dimensional. Der Raum aller (stetigen, differenzierbaren, integrierbaren, ...) Funktionen wird zu einem Vektorraum, wenn wir die Addition zweier Funktionen und die skalare Multiplikation einer Funktion mit einer reellen Zahl durch 4 & 4 4 bzw. 4 & 4 (1.28) erklären. Man zeige, dass die Vektorraumaxiome erfüllt sind, dass dieser Vektorraum aber keine Basis aus endlich vielen Vektoren, also Funktionen besitzt. Orthonormalbasis und Kronecker-Symbol Um auch das Skalarprodukt und damit den Betrag eines Vektors durch eine einfache Funktion seiner Komponenten auszudrücken, müssen wir eine spezielle Art von Basis wählen. Es sei zunächst , mit 0 33 , irgendeine Basis eines -dimensionalen metrischen Vektorraumes . Dann gilt für das Skalarprodukt von zwei Vektoren ' ;: ? 8 : (1.29) Um diesen Ausdruck weiter umzuformen, müssen wir einen der Indizes umbenennen. Dann können wir die Summen aus dem Skalarprodukt herausziehen, indem die Eigenschaft (1.9) verwenden, : : : (1.30) Aufgabe 1.12 Man mache sich die einzelnen Schritte dieser Umformung durch explizites Ausschreiben der Summen klar. Warum ist es unbedingt nötig, den Indizes, über die jeweils summiert wird, verschiedene Namen zu geben? Nehmen wir nun an, die Basis Basisvektoren gilt hätte die folgende spezielle Eigenschaft. Für die Skalarprodukte der : Orthonormalbasis 6 0 für für (1.31) Eine solche Basis heißt Orthonormalbasis. Die spezielle Eigenschaft einer Orthonormalbasis ist, dass alle Basisvektoren Einheitsvektoren sind, und dass sie paarweise zueinander senkrecht stehen. Genau das wird durch die Forderung (1.31) ausgedrückt. Eine Orthonormalbasis besteht aus zueinander orthogonalen Einheitsvektoren. Es ist nützlich, für die Eigenschaft (1.31) der Basisvektoren ein spezielles Symbol einzuführen. Es heißt Kronecker-Symbol und wird wie folgt definiert, KroneckerSymbol 6 0 für für (1.32) Die Eigenschaft (1.31) einer Orthonormalbasis lässt sich dann sehr einfach durch die Gleichung : (1.33) (1.34) ausdrücken. Ferner lassen sich Summen, in denen das Kronecker-Symbol auftritt, sehr leicht vereinfachen. So gilt zum Beispiel für einen beliebigen Satz von reellen Zahlen die Regel Wenn unter einer Summe ein Kronecker-Symbol steht, wobei über einen der beiden Indizes summiert wird, so bleibt von der Summe nur ein Term übrig, nämlich der, für den die beiden Indizes gleich sind. Das Kronecker-Symbol greift gewissermaßen einen der Summanden aus der Summe heraus und vernichtet alle anderen. Natürlich gilt das nur, wenn alle beteiligten Indizes, hier also und , denselben Wertebereich haben. Da hier alle Summen von 0 bis laufen, und auch alle Indizes, über die nicht summiert wird, Werte von 0 bis annehmen, ist das stets gewährleistet. Wenn wir die Eigenschaft (1.33) der Basisvektoren in (1.30) einsetzen und anschließend diese Regel auf die Summe über den Index anwenden, so erhalten wir den folgenden einfachen Ausdruck für das Skalarprodukt von zwei Vektoren, 5: : (1.35) Das Skalarprodukt zweier Vektoren ist durch die Summe der Produkte ihrer Komponenten bezüglich einer Orthonormalbasis gegeben. Für den Betrag eines Vektors gilt dann die einfache Formel (1.36) das heißt das Quadrat des Betrages eines Vektors ist durch die Summe der Quadrate seiner Komponenten gegeben. 9 Aufgabe 1.13 Im folgenden laufen alle Indizes von 0 bis , und es sei ein beliebiger Satz von Vektoren. Man beweise die folgenden allgemeinen Rechenregeln f ür das Kronecker-Symbol, Man berechne anschließend (1.37) (1.38) Der Einfachheit halber fasst man Summen über mehrere Indizes zu einem Summenzeichen zusammen. Man mache sich klar, dass die Reihenfolge, in der die einzelnen Summationen ausgef ührt werden, unerheblich ist. Aufgabe 1.14 Man zeige mit Hilfe des Kronecker-Symbols, dass die Komponenten eines Vektors bezüglich einer Orthonormalbasis durch die orthogonalen Projektionen des Vektors auf die Basisvektoren gegeben sind, also <: (1.39) Aufgabe 1.15 Man beweise, dass jeder endlich-dimensionale metrische Vektorraum eine Orthonormalbasis besitzt. Affine Räume Wir wollen nun die anschauliche Vorstellung von einem Vektor als Pfeil, das heißt als gerichtete Verbindungslinie zweier Punkte im Raum, mathematisch präzise formulieren. Wir benötigen dazu das Konzept eines affinen Raumes. Ein affiner Raum besteht aus einem Punktraum und einem zugeordneten Vektorraum . Die Elemente von , die wir mit großen Buchstaben bezeichnen, repräsentieren die Punkte oder die Orte im Raum. Die Elemente von , die wir wieder 3 nennen, repräsentieren die Vektoren, die durch Pfeile im Raum dargestellt werden. Die Beziehung zwischen dem Punktraum und dem Vektorraum ist durch eine Abbildung festgelegt, die je zwei Punkten einen Abstandsvektor zuordnet, Abstandsvektor & Der Abstandsvektor wird anschaulich durch einen Pfeil dargestellt, der vom Punkt zeigt. Er soll folgende Eigenschaften haben. Für alle gilt 8 (1.40) zum Punkt (1.41) Das ist die formale Schreibweise für die in Abbildung 1.3(a) dargestellte Vorschrift, nach der Vektoren durch das Zusammensetzen der entsprechenden Pfeile addiert werden. Zeigt ein Pfeil von nach und ein zweiter Pfeil von nach , so wird die Summe der beiden durch einen Pfeil von nach dargestellt. Zusätzlich müssen wir noch verlangen, dass die Abbildung (1.40) im folgenden Sinne umkehrbar ist. Zu jedem Punkt und jedem Vektor ( gibt es genau einen Punkt , so dass ( ist. Um ( einen Vektor als Pfeil darzustellen, können wir einen beliebigen Anfangspunkt wählen. Der Vektor zeigt dann von dort zu einem eindeutig definierten Punkt . Dadurch ist unter anderem garantiert, dass wir 10 (b) (a) (c) Abbildung 1.3: Vektoren werden in einem affinen Raum durch Pfeile dargestellt, die jeweils zwei Punkte miteinander verbinden. Zeigt ein Pfeil von nach und ein anderer von nach , so wird die Summe der beiden Vektoren durch einen Pfeil von nach dargestellt (a). Verschiebt man sowohl den Anfangs , so bleibt der Abstandsals auch den Endpunkt eines Pfeiles jeweils um einen Vektor der beiden Punkte unverändert (b). Der Abstand zweier Punkte ist durch vektor gegeben (c). den Betrag des Abstandsvektors immer die Vorschrift (1.41) anwenden können, um zwei Pfeile zu addieren. Wir können den Anfangspunkt des zweiten Pfeiles stets so wählen, dass er mit dem Endpunkt des ersten Pfeiles übereinstimmt. Wir können diese Eigenschaft eines affinen Raumes auch anders interpretieren. Wir betrachten einen gibt es dann genau einen Punkt , so Vektor und halten diesen fest. Zu jedem Punkt dass ist. Folglich definiert der Vektor eine Abbildung des Punktraumes auf sich selbst, Verschiebung mit (1.42) Diese Abbildung ist eine Verschiebung um den Vektor . Jeder Punkt wird durch den Vektor auf einen Punkt verschoben. Eine Verschiebung hat genau die Eigenschaft, die wir am Anfang postuliert haben. Betrachten wir nämlich den Abstandsvektor zweier beliebiger Punkte, und verschieben beide, wie in Abbil dung 1.3(b) gezeigt, um einen Vektor , so gilt gemäß der Definition einer Verschiebung für die Bildpunkte und . Daraus folgt (1.43) Der Abstandsvektor wird durch die Verschiebung nicht verändert. Das ist genau die anschauliche Eigenschaft eines Vektors, von der wir ausgegangen sind. Ein Vektor verändert sich nicht, wenn wir ihn im Raum verschieben. Wir können das wie folgt zusammenfassen: Ein affiner Raum besteht aus einem Punktraum und einem Vektorraum. Ein Vektor wird durch einen Pfeil dargestellt und erzeugt eine Verschiebung im Punktraum. Tatsächlich ist das der Ursprung des Wortes “Vektor”. Es leitet sich aus dem lateinischen vehere (etwas fahren, transportieren) ab. Ein Vektor transportiert etwas von einem Ort zum anderen. Statt als Pfeil im Punktraum können wir uns einen Vektor auch als Verschiebung, das heißt als eine Operation auf dem Punktraum vorstellen. Entscheidend ist dabei, dass ein Vektor eine gerichtete Größe ist. Ein Pfeil zeigt in eine bestimmte Richtung, genau wie eine Verschiebung. Eine Größe, die in irgendeiner Weise mit einer Richtung im Raum verknüpft ist, wird stets durch einen Vektor dargestellt. Im Gegensatz dazu bezeichnet man eine Größe, die nicht gerichtet ist, als Skalar. Daher kommt auch die Bezeichnung “Skalarprodukt” und “skalare Multiplikation”. Eine reelle Zahl ist ein 11 Skalar. Die Bezeichnung leitet sich aus dem Wort Skala ab, da man den Wert eines Skalars an einer Skala ablesen kann, den Wert eines Vektors jedoch nicht, da es eine gerichtete Größe ist. Ein gutes Beispiel, um diesen Unterschied deutlich zu machen, ist die Definition des Abstands zweier Punkte in einem affinen Raum, die in Abbildung 1.3(c) dargestellt ist. Ist der zugeordnete Vektorraum ein metrischer Vektorraum, so ist der Abstand zweier Punkte und im Punktraum durch den Betrag des Abstandsvektors definiert, Abstand (1.44) Auf diese Weise wird dem Vektor, also der gerichteten Größe , ein Skalar, also eine ungerichtete Größe zugeordnet. Wenn zum Beispiel zwei verschiedene Punkte und gleich weit von einem Punkt entfernt sind, so gilt , das heißt die ungerichteten Abstände sind gleich. Die Vektoren und , also die gerichteten Größen, die neben der Information über den Abstand auch noch die Richtungsinformation tragen, sind jedoch nicht gleich. Ein affiner Raum, auf dem auf diese Weise der Abstand zweier Punkte definiert ist, heißt metrischer affiner Raum, oder auch Euklidischer Raum. Um die Struktur des physikalischen Raumes zu beschreiben, müssen wir nur noch sagen, was die Dimension eines affinen Raumes ist. Sie ist einfach durch die . Dimension des zugeordneten Vektorraumes definiert. Es gilt also Aufgabe 1.16 Man zeige, dass sich der Nullvektor und der inverse Vektor wie folgt als Pfeile darstellen lassen, ! ( (1.45) "( und dass der Abstand zweier Punkte und genau dann gleich Null ist, wenn ist. Aufgabe 1.17 Verschiebungen lassen sich wie alle Abbildungen durch Verkettung verkn üpfen. Man zeige, dass die Verknüpfung zweier Verschiebungen wieder eine Verschiebung ist, und dass die Menge aller Verschiebungen eines affinen Raumes dadurch zu einer abelschen Gruppe wird. Welcher Eigenschaft des zugeordneten Vektorraumes entspricht das? Aufgabe 1.18 Man beweise, dass es zu jedem Punkt gibt mit ( . und zu jedem Vektor ( Aufgabe 1.19 Man beweise die Dreiecksungleichung. Für je drei Punkte affinen Raum gilt genau einen Punkt in einem metrischen (1.46) Wann gilt das Gleichheitszeichen? Aufgabe 1.20 Aus der Euklidischen Geometrie kennen wir den Satz des Pythagoras, wonach ein Dreieck genau dann im Punkt rechtwinklig ist, wenn für die Seitenlängen die Beziehung mit (1.47) gilt. Man zeige, dass dieser Satz auch in einem metrischen affinen Raum gilt, wobei rechte Winkel und Längen über das Skalarprodukt der entsprechenden Abstandsvektoren definiert sind. 12 Der physikalische Raum Da wir jetzt wissen, was ein metrischer affiner Raum, also ein Euklidischer Raum ist, und was die Dimension eines affinen Raumes ist, können wir an dieser Stelle unsere erste physikalische Theorie explizit formulieren. Die Kurzfassung lautet: Der physikalische Raum hat die Struktur eines dreidimensionalen Euklidischen Raumes. Wir identifizieren die Orte im physikalischen Raum mit den Punkten eines dreidimensionalen Euklidischen Raumes, den wir mit bezeichnen. Jedem Punkt entspricht ein Ort im Raum, den wir ebenfalls mit bezeichnen. Wir können diese Zurordnung einer physikalischen Struktur zu einer mathematischen Struktur auch als Messvorschrift verstehen. Wir messen einen Ort, also einen Punkt , indem wir ihn mit einem Gegenstand markieren. Damit allein können wir allerdings noch nicht viel anfangen. Wir können jetzt zwar verschiedene Orte messen, indem wir sie markieren, aber wir können daraus noch keine Aussagen über die Struktur des Raumes ableiten, die wir experimentell testen können, oder mit deren Hilfe wir Voraussagen über noch nicht durchgeführte Messungen machen können. Eine Messvorschrift allein für einzelne Punkte reicht noch nicht aus, um mit der Theorie sinnvolle Aussagen machen zu können. Wie benötigen noch andere Messvorschriften. Eine Messgröße, die sich dazu anbietet, ist der Abstand zweier Orte. Mit einem geeigneten Messinstrument, zum Beispiel einem Maßband, auf dem wir eine Skala angebracht haben, können wir den Abstand zweier Orte und messen. Wir legen das Maßband zwischen den zuvor markierten Orten an, spannen es, und lesen die Skala an der Stelle und an der Stelle ab. Dann bilden wir den Betrag der Differenz der beiden Skalenwerte, und nennen das Ergebnis den Abstand von und . Das klingt zunächst sehr primitiv, und es ist wohl kaum möglich, auf diese Weise etwa den Abstand von hier zum Mond zu messen, oder den Durchmesser eines Atoms. Darauf kommt es aber im Moment nicht an. Entscheidend ist nur, dass wir eine Messvorschrift definiert haben, die zumindest auf bestimmte Paare von Orten und anwendbar ist, und die im Rahmen einer gewissen Messgenauigkeit ein reproduzierbares Ergebnis liefert. Damit das Ergebnis reproduzierbar ist, also eine zweite Messung dasselbe Ergebnis liefert, muss die Skala auf dem Maßband regelmäßig sein. Regelmäßig heißt, dass die Skalenstriche immer den gleichen Abstand haben. Diese Forderung hört sich zunächst etwas merkwürdig an, weil ja durch das Maßband die Größe Abstand überhaupt erst definiert wird. Sie ist aber durchaus sinnvoll und lässt sich auch überprüfen, nämlich indem man dieselbe Abstandsmessung mehrmals wiederholt und dabei unterschiedliche Abschnitte des Maßbandes verwenden. Eine gutes Maßband erkennen wir daran, dass es reproduzierbare Ergebnisse liefert. Die so definierte Messgröße bilden wir nun auf eine mathematische Größe ab, die wir in der Theorie bereits eingeführt haben. Das ist natürlich die Größe mit dem gleichen Namen, also der Abstand , der über den Abstandsvektor und dessen Betrag, also das Skalarprodukt definiert ist. Sobald wir diese Zuordnung einer physikalischen Messgröße zu einer mathematischen Größe vorgenommen haben, wird unsere Theorie zu einer experimentell überprüfbaren Theorie über die Struktur des Raumes. Sie macht jetzt nämlich Aussagen über Beziehungen zwischen Messgrößen, die wir durch nachmessen überprüfen können. Es ist nicht ganz leicht, solche Aussagen zu finden, die nicht ganz trivial sind und allein auf der Messung von Längen beruhen. Da es aber sehr wichtig ist, zu verstehen, warum genau in diesem Moment der Übergang von der reinen Mathematik zur Physik stattgefunden hat, wollen wir ein Beispiel für eine solche Vorhersage ganz explizit vorführen. Das Experiment sieht wie folgt aus. Wir markieren im Raum fünf verschiedene Orte . Dann messen wir ein paar Abstände zwischen ihnen und finden zufällig, dass neun davon den gleichen Wert haben, 13 (1.48) Das ist natürlich nur eine Annahme, die wir machen, um die Rechnung etwas zu vereinfachen. Im Prinzip könnten wir auch von neun verschiedene Werten ausgehen. Dann würde die folgende Rechnung jedoch nur unnötig kompliziert werden. Den einzigen Abstand, den wir noch nicht gemessen haben, ist . Wir wollen zeigen, dass dieser durch die Theorie vorhergesagt wird. Wir benötigen dazu nichts weiter als die Definition des Abstandes über des Skalarprodukt von Vektoren und die Behauptung der Theorie, dass der Raum dreidimensional ist. Die Herleitung dieser Vorhersage ist ein wenig länger, aber sie ist eine gute Übung für den Umgang mit Vektoren und Skalarprodukten. Wir definieren zunächst die Vektoren Wir wissen, dass alle diese Vektoren den Betrag Außerdem ist " und somit % " 3 (1.49) haben, " 7 5: (1.50) <: 7 0 (1.51) Die gleiche Überlegung für jeweils zwei andere Vektoren ergibt ;: ?= : : : = : : Gesucht ist die Länge des Vektors 7 0 (1.52) + (1.53) Benutzen wir diese Gleichungen, um die “gestrichenen” Vektoren durch die “ungestrichenen” auszudrücken, so lauten die letzten drei Gleichungen von (1.52) " : " " : " & " : " 7 0 (1.54) Wenn wir die Klammern ausmultiplizieren und die ersten drei Gleichungen von (1.52) verwenden, so ergibt sich daraus : %+ 1 : & : (1.55) Die Gleichheit der letzten drei Ausdrücke impliziert, : : : (1.56) und zusätzlich bekommen wir folgende Gleichung, wenn wie die drei letzten drei Ausdrücke in (1.55) addieren, 7 : % (1.57) Jetzt benutzen wir, dass der Raum dreidimensional ist, und dass die Vektoren eine Basis bilden. Das ist leicht zu beweisen. Da es sich um drei Vektoren handelt, müssen wir nur zeigen, dass die Vektoren linear unabhängig sind. Die Gleichung ! #+.( (1.58) 6 besitzt. Bilden wir auf beiden Seiten nacheinander das Skalardarf also nur die Lösung ( 7 produkt mit , und und teilen das Ergebnis jeweils durch , so ergeben sich die Gleichungen 7 .( 7 (+ -(7 14 6 ( 6 (1.59) eine Basis, und somit können wir den Vektor Also ist #-( also Linearkombination schreiben, (1.60) Jetzt benutzen wir die Gleichung (1.56). Setzen wir (1.60) dort ein und teilen das ganze wieder durch so ergibt noch einmal ein ähnliches Gleichungssystem, nämlich 7 .( 7 (+ -(7 ( ; 7, (1.61) Die Koeffizienten der Linearkombination (1.60) müssen alle gleich sein, also /+ (1.62) Um die Zahl zu bestimmen, benutzen wir die Gleichung (1.57). Sie lautet nun also 6 oder 7 somit . Also ist % + 7 *% . Den ersten Fall können wir ausschließen, denn dann wäre 7 (1.63) ! und (1.64) Um die Länge dieses Vektors zu berechnen, benötigen wir nur noch das Skalarprodukt + 7 <: 7 : 7 : (1.65) 7 7 Offenbar behauptet die Theorie, der Abstand sei genau um den Faktor Wir finden also (1.66) größer als die Abstände (1.48). Die Theorie macht also eine Vorhersage über eine Messung, die wir noch nicht durchgeführt haben. Wenn wir das vorhergesagte Messergebnis tatsächlich in der Realität finden, dann bestätigt das die Richtigkeit der Theorie. Wie wir bereits aus unserer alltäglichen Erfahrung wissen, ist das der Fall. Alle Experimente dieser Art bestätigen die Euklidische Geometrie. Sonst würden wir sie hier nicht als Theorie über die Struktur des Raumes einführen. Auf ihr beruhen alle Landkarten, Baukonstruktionen, mechanischen Geräte und letztlich überhaupt alle Anwendungen der klassischen Physik. Die Euklidische Geometrie beschreibt die Verhältnisse im physikalischen Raum richtig, jedenfalls im Rahmen einer gewissen Messgenauigkeit. Es könnte aber auch sein, dass wir ein ganz anderes Messergebnis finden. Um das Konzept einer physikalischen Theorie zu verstehen, sollte man sich deshalb klar machen, dass es keinerlei “vernünftigen”, also rein logischen oder mathematischen Grund gibt, warum die Messung des Abstandes den Wert liefern soll. Es handelt sich um eine Messung, die von den anderen neun durchgeführten Abstandsmessungen völlig unabhängig ist. Und tatsächlich, wenn man genau genug misst, stellt man fest, dass der Faktor gar nicht genau ist. Allerdings muss man schon sehr genau hinschauen. Die Abweichung von der Euklidischen Geometrie, die man bei Abstandsmessungen dieser Art im irdischen Bereich findet, beträgt etwa ein milliardstel. Das heißt für unser Experiment, dass eine Messung der Strecke erst dann eine Abweichung von ergeben würde, wenn wir alle Abstände bis auf mindestens zehn Stellen genau messen würden. Man stellt also bei genauerem Hinsehen fast, dass die Euklidische Geometrie doch nicht die richtige Beschreibung der Struktur des Raumes ist. Sie liefert eine sehr gute Näherung, aber keine exakte Beschreibung. Für unsere Zwecke ist diese Näherung aber gut genug. Solange wir keine wirklich fundamentale 15 physikalische Theorie gefunden haben, was vielleicht nie der Fall sein wird, können wir von einer physikalischen Theorie ohnehin nur erwarten, dass die sie Natur innerhalb einer gewissen Näherung möglichst gut beschreibt. Die klassischen physikalischen Theorien haben also schon allein deshalb einen beschränkten Gültigkeitsbereich, weil sie auf der Euklidischen Geometrie des Raumes aufbauen. Will man zu einer genaueren Beschreibung übergehen, so muss man zur Beschreibung der Struktur des Raumes die allgemeine Relativitätstheorie heranziehen, die die Euklidische Geometrie durch eine Verallgemeinerung, die Riemannsche Geometrie ersetzt. Aber darauf können wir hier aus verständlichen Gründen nicht näher eingehen können. Das würde weit über das eigentliche Thema hinaus führen. Es sei nur noch angemerkt, dass zwar so gut wie alle “alltäglichen” physikalischen Anwendungen mit der Euklidischen Geometrie als Beschreibung des Raumes auskommen, dass es jedoch inzwischen eine bekannte und sehr nützliche Anwendung gibt, die in unser tägliches Leben vorgedrungen ist, und die nicht mehr mit dieser Beschreibung des Raumes auskommt. Das ist das Global Positioning System “GPS”. Ein GPS-Gerät bestimmt seinen Ort durch Abstandsmessungen zu anderen, bekannten Orten, nämlich denen von Satelliten, die ihre Umwelt ununterbrochen darüber informieren, wo sie sich gerade befinden. Um seinen Standort zu bestimmen, muss ein solches Gerät Rechnungen ausführen, die im wesentlichen genau von der Art sind, wie wir sie gerade durchgeführt haben. Würde man diesen Rechnungen jedoch die Euklidische Geometrie zugrunde legen, so würde man feststellen, dass immer wieder Fehler auftreten, die sich nur dadurch erklären lassen, dass die Euklidische Theorie die Struktur des Raumes nicht richtig beschreibt. Erst eine Berechnung mit Hilfe der allgemeinen Relativitätstheorie und der Riemannschen Geometrie liefert ein Ergebnis mit ausreichender Genauigkeit. Aufgabe 1.21 Bei einem anderen Experiment der gleichen Art wie oben findet man die folgenden Abstände von fünf paarweise verschiedenen Punkten , 7 (1.67) Man bestimme . Warum sind mindestens fünf Punkte nötig, um eine solche Vorhersage für eine Abstandsmessung zu machen? Wieviele Punkte wären nötig, wenn der Raum vierdimensional wäre? Aufgabe 1.22 Wie kann man allein durch Abstandsmessungen feststellen, ob drei Punkte angeordnet sind, dass gilt. Was bedeutet das anschaulich? so Koordinatensysteme Im Prinzip reicht eine Messvorschrift für Abstände zwischen Punkten vollkommen aus, um sämtliche Aussagen der Euklidischen Geometrie experimentell zu überprüfen und darauf andere Theorien wie die klassische Mechanik aufzubauen. Wie wir gerade an einem relativ einfachen Beispiel gesehen haben, erfordert das aber recht komplizierte Rechnungen, wenn wir konkrete Beobachtungen und Experimente beschreiben wollen. Um das Rechnen mit Punkten und ihren Abständen zu erleichtern, führen wir ein Koordinatensystem ein. Ein Koordinatensystem in einem affinen Raum ist das Analogon zu einer Basis in einem Vektorraum. Es ermöglicht, das formale Rechnen mit Punkten und Vektoren auf das konkrete Rechnen mit Zahlen zurückzuführen, und zwar in einer sehr viel einfacheren Weise als wir dies gerade getan haben. Wir werden ein Koordinatensystem zuerst als mathematisches Konzept einführen, und anschließend zeigen, und wie man es durch eine Messvorschrift im physikalischen Raum realisieren kann. Die Konstruktion eines Koordinatensystems ist in Abbildung 1.4(a) dargestellt. Der erste Schritt besteht als Bezugspunkt oder Ursprung des Koordinatensystems festzulegen. Durch die darin, einen Ort 16 (b) (a) Abbildung 1.4: Ein kartesisches Koordinatensystem im dreidimensionalen Raum wird durch einen Ur sprung und eine Orthonormalbasis festgelegt (a). Die Koordinaten eines Punktes orthogonal auf die Koordinatenachsen projiziert. Der findet man, indem man den Ortsvektor Abstand zweier Punkte und ergibt sich aus der Summe der Quadrate der Seitenlängen des von und aufgespannten Koordinatenquaders (b). Auswahl des Bezugspunktes wird jedem Ort ein Ortsvektor zugeordnet. Umgekehrt bestimmt jeder Ortsvektor genau einen Ort mit . Die Zuordnung eines Ortes zu seinem Ortsvektor ist also bijektiv. Der Ortsvektor gibt an, wie weit und in welche Richtung wir den Ursprung verschieben müssen, um zum Ort zu gelangen. Im zweiten Schritt führen wir eine Orthonormalbasis im Vektorraum ein. Es ist üblich, die Basisvektoren im physikalischen Raum mit zu bezeichnen. Der Index , der die Basisvektoren durchnummeriert, läuft also von nun an über die Indexmenge 4 $ . An den formalen Beziehungen zwischen den Basisvektoren und den Komponenten von Vektoren ändert das nichts, weil wir die Indexmenge ohnehin nie explizit ausgeschrieben haben. Nur die Dimension des Vektorraumes ist jetzt immer gleich . Der Ortsvektor eines Punktes kann nun in seine Komponenten zerlegt werden, Ortsvektor (1.68) Auf diese Weise wird jedem Punkt ein Satz von Koordinaten zugeordnet. Umgekehrt wird jeder Punkt wird eindeutig durch seine Koordinaten identifiziert. Wie in Abbildung 1.4(a) gezeigt, finden wir den Punkt mit den Koordinaten , indem wir den Ursprung zuerst um in Richtung des Vektors , dann um in Richtung des Vektors , und schließlich um in Richtung des Vektors verschieben. Die Strecken, die wir dabei zurücklegen, bilden die Kanten eines Koordinatenquaders. Je nachdem, in welcher Reihenfolge wir dieser Verschiebungen durchführen, durchlaufen wir verschiedene Kanten dieses Quaders. Die so definierte bijektive Abbildung kartesische Koordinaten 17 mit (1.69) die jedem Punkt umkehrbar eindeutig seine Koordinaten zuordnet, heißt kartesisches Koordinatensystem. Ein kartesisches Koordinatensystem wird durch einen Ursprung und eine Orthonor malbasis von definiert. Es ordnet jedem Punkt umkehrbar eindeutig einen Satz von Koordinaten zu. Ein kartesisches Koordinatensystem hat die folgenden nützlichen Eigenschaften. Um den Abstandsvektor zweier Punkte zu bestimmen, müssen wir nur die Differenzen ihrer Koordinaten bilden. Seien nämlich zwei beliebige Punkte, und ihre Ortsvektoren und bzw. deren Komponenten, also die Koordinaten von und , so gilt für den Abstandsvektor " " $ " (1.70) Außerdem können wir sehr leicht den Abstand zweier Punkte berechnen. Aus (1.70) und (1.36) folgt nämlich " " " " (1.71) Das ist die dreidimensionale Verallgemeinerung des Satzes des Pythagoras. Um den Abstand zweier Punkte zu ermitteln, betrachten wir den in Abbildung 1.4(b) dargestellten Koordinatenquader, dessen gegenüber liegende Eckpunkte die Punkte und sind, und dessen Kanten in die Richtungen der Koordinatenachsen zeigen. Das Quadrat der Länge der Diagonalen ist dann durch die Summe der Quadrate der Kantenlängen gegeben. Da die Bestimmung des Abstandsvektors und das Abstandes die einzigen “Rechenoperationen” sind, die wir mit Punkten durchführen können, haben wir haben damit auch das formale Rechnen mit Punkten in einem affinen Raum auf des konkrete Rechnen mit Zahlen, also mit Koordinaten und Komponenten zurückgeführt. Allerdings müssen wir beachten, dass die Wahl eines kartesischen Koordinatensystems stets willkürlich ist. Wenn wir mit Koordinaten von Punkten und Komponenten von Vektoren rechnen, müssen wir stets mit angeben, bezügliche welchen Koordinatensystems diese definiert sind. Der Grund dafür ist, dass der physikalische Raum symmetrisch ist. Es gibt in ihm keinen irgendwie ausgezeichneten Punkt, also auch keine bevorzugte Wahl eines Ursprungs für ein Koordinatensystem. homogen ist. Das bedeutet, dass alle Punkte in ihm gleichberechtigt Wir sagen auch, dass der Raum sind. Der Raum sieht überall gleich aus, ist also symmetrisch unter Verschiebungen. Dasselbe gilt für die Orthonormalbasen. Es gibt keine besonders ausgezeichnete Basis des Vektorraumes . Der Raum ist auch isotrop, das heißt er sieht in alle Richtungen gleich aus. Wir können eine Orthonormalbasis beliebig drehen. Solange die Basisvektoren zueinander senkrecht stehen und Einheitsvektoren sind, können wir eine Orthonormalbasis prinzipiell nicht von einer anderen unterscheiden. Das hat gewisse Vor- und Nachteile. Ein großer Vorteil dieser Freiheit der Wahl des Koordinatensystems besteht darin, dass wir, vor ein ganz spezielles physikalisches Problem gestellt, das Koordinatensystem dem Problem anpassen können. Wir können den Ursprung und die Basis so wählen, dass das Problem möglichst einfach formuliert und möglicherweise gelöst werden kann. Davon werden wir später sehr häufig Gebrauch machen. Ein Nachteil ist allerdings, dass wir, wenn wir allgemeine Gesetzmäßigkeiten finden und formulieren wollen, stets darauf achten müssen, dass diese Gesetzmäßigkeiten nicht davon abhängen, welches Koordinatensystem wir wählen, um sie zu beschreiben. Das ist auch der Grund, warum wir in der Physik benötigen. Durch ein Koordinatenüberhaupt das abstrakte Konzept eines metrischen affinen Raumes system wird dieser, wie wir gesehen haben, mit dem Raum identifiziert. Also könnten wir doch gleich sagen, dass der physikalische Raum die Struktur des hat, statt den Umweg über einen affinen Raum zu machen. Das käme der Auswahl eines festen, ein für alle Mal fixierten Koordinatensystems gleich. 18 (a) (b) Abbildung 1.5: Der Übergang von einem kartesischen Koordinatensystem (a) zu einem anderen Koordinatensystem (b) setzt sich aus einer Verschiebung des Ursprungs und einer Drehung der Basisvektoren zusammen. Mit einer solchen Festlegung würden wir jedoch die Symmetrien des Raumes nicht mehr in seiner Beschreibung wiederfinden. Denn es gäbe dann einen ausgezeichneten Punkt im Raum, nämlich den Ursprung dieses Koordinatensystems, und es gäbe auch ausgezeichnete Richtungen, nämlich die der ausgewählten Basisvektoren. In einer solchen Beschreibung würden wir wichtige Eigenschaften einer physikalischen Theorie, nämlich ihre Symmetrien, nicht mehr oder jedenfalls nur noch schwer erkennen. Symmetrien, und dazu gehören unter anderem die Symmetrien des Raumes unter Drehungen und Verschiebungen, sind jedoch ein ganz entscheidendes Kriterium, um physikalische Theorien zu klassifizieren und um deren Konsistenz zu prüfen. Tatsächlich bauen fast alle modernen physikalischen Theorien auf sehr fundamentalen solchen Symmetrieprinzipien auf. Wir werden uns daher später sehr ausführlich mit der Frage beschäftigen, was genau passiert, wenn wir von einem Koordinatensystem zu einem anderen übergehen, und wie sich physikalische Gesetzmäßigkeiten dabei verhalten. Für den Anfang genügt es jedoch, immer nur ein, zwar willkürlich gewähltes, aber festes kartesisches Koordinatensystem zu verwenden, um den physikalischen Raum damit zu erfassen. Die einzige zusätzliche Forderung, die wir noch an das Koordinatensystem stellen können, ist, dass es eine positive Orientierung hat. Das bedeutet folgendes. Wenn wir die Basisvektoren , und betrachten, so zeigen diese Vektoren in der gegebenen Reihenfolge in die Richtungen des ausgestreckten Daumens, des ausgestreckten Zeigefingers und des angewinkelten Mittelfingers der rechten Hand. Allgemein bezeichnen wir einen Satz von drei linear unabhängigen Vektoren, die diese Rechte-Hand-Regel erfüllen, als Rechtsystem. Wir haben dann immer noch die Freiheit, die Basisvektoren beliebig im Raum zu drehen, aber wir können sie nicht mehr spiegeln. Würden wir zum Beispiel den Vektor durch "+ ersetzen, das Koordinatensystem also an der 4 - -Ebene spiegeln, so würden die drei Basisvektoren hinterher ein Linkssystem bilden. Das gespiegelte Koordinatensystem hätte eine negative Orientierung. Das wollen wir im folgenden ausschließen. Die Beschränkung auf positive orientierte Koordinatensysteme ist nützlich, da sie an vielen Stellen eine Fallunterscheidung unnötig macht. Wo genau, werden wir im nächsten Kapitel sehen. Aufgabe 1.23 Es sei ein Punkt und der um den Vektor 19 verschobene Punkt. Wie hängen die Koordinaten von mit den Koordinaten Aufgabe 1.24 Es seien drei Punkte Koordinatensystem gilt von zusammen? gegeben, so dass für deren Ortsvektoren in einem kartesischen 4 Welche Bedingung ist an die Zahlen 4 (1.72) zu stellen, damit das Dreieck gleichseitig ist? Wann ist es rechtwinklig? Aufgabe 1.25 In Abbildung 1.5 sind zwei kartesische Koordinatensysteme dargestellt. Das “ungestrichene” Koordinatensystem wird durch einen Ursprung und eine Basis festgelegt, das “gestrichene” Koordinatensystem durch einen Ursprung und eine Basis . Der Ursprung ergibt sich aus durch Verschiebung um einen Vektor . Die Basis ergibt sich aus der Basis durch eine Drehung, die durch eine Übergangsmatrix beschrieben wird. Es gilt (1.73) Alle Indizes nehmen jeweils die Werte 4 an. Warum existiert eine solche Übergangsmatrix immer? Welche Bedingung muss die Übergangsmatrix erfüllen, wenn mit auch eine Or thonormalbasis sein soll? Wie hängen die Koordinaten eines Punktes im gestrichenen Koordinatensystem mit den Koordinaten desselben Punktes im ungestrichenen Koordinatensystem zusammen? Koordinaten als Messgrößen Jetzt müssen wir nur noch eine Messvorschrift angeben, mit deren Hilfe wir die Koordinaten eines Punktes ermitteln, oder umgekehrt zu einem gegebenen Satz von Koordinaten den entsprechenden Punkt finden können. Dann können wir sämtliche Experimente und Beobachtungen, die wir im physikalischen Raum machen, mit Hilfe eines Koordinatensystems beschreiben und entsprechende Berechnungen durchführen. Da fast alle folgenden Überlegungen auf dieser Konstruktion von kartesischen Koordinaten beruhen, werden wir noch einmal sehr sorgfältig vorgehen und zeigen, dass sich alle Messvorschriften, die wir dazu benötigen, letztlich auf Längenmessungen zurückführen lassen. Wir beginnen damit, ein Koordinatensystem im physikalischen Raum überhaupt zu definieren. Dazu müssen wir zuerst einen Ursprung festlegen. Das tun wir wie üblich, indem wie den Ort mit einem Gegenstand markieren. Anschließend müssen wir die Basisvektoren einführen. Da es sich dabei um Einheitsvektoren handelt, genügt es, deren Richtungen festzulegen. Wir tun dies, indem wir drei voneinander und von verschiedene Punkte , und markieren, die auf den Koordinatenachsen liegen sollen, also von aus in den Richtungen der Basisvektoren. Für diese gilt dann (1.74) das heißt sie sind durch die Punkte , , und eindeutig bestimmt. Wir können die Punkte , und aber nicht beliebig wählen, sondern müssen dafür sorgen, dass die Basisvektoren zueinander senkrecht stehen. Eine Messvorschrift für rechte Winkel ergibt sich aus dem Satz des Pythagoras, den wir in Aufgabe 1.20 bewiesen haben. Die drei Vektoren (1.74) sind genau dann zueinander senkrecht, wenn die Dreiecke , und jeweils im Punkt rechtwinklig sind. Das wiederum ist genau dann der Fall, wenn für die Seitenlängen dieser Dreiecke die Beziehungen 20 (1.75) gelten. Wir können also allein durch Abstandsmessungen feststellen, ob drei Vektoren , und , und damit auch die Basisvektoren (1.74) zueinander senkrecht stehen. Damit haben wir das Koordinatensystem definiert, indem wir vier verschiedene Punkte , , und markiert haben, die die Eigenschaften (1.75) haben. Aber wie finden wir jetzt zu einem gegebenen Punkt die Koordinaten , oder umgekehrt zu einem Satz von Koordinaten den entsprechenden Punkt? Auch das können wir auf Abstandsmessungen zurückführen. Es sei irgendein markierter Ort. Wir messen zunächst die Abstände der Punkte , und von . Das mussten wir ja bereits tun, um die Orthogonalität der Basisvektoren zu prüfen. Wir bezeichnen diese Abstände mit 4 , und . Es gilt dann für die Ortsvektoren der Punkte , und 4 (1.76) was sich auch unmittelbar aus (1.74) ergibt. Nun sei irgendein Punkt, dessen Koordinaten wir messen wollen. Was wir unmittelbar messen können, sind die Abstände , also die Länge des Ortsvektors und . Betrachten wir zunächst nur den Abstand . Für , sowie die Abstände , ihn gilt " 4 " 4 " 7 4 +: (1.77) Offenbar können wir aus den Messgrößen , und 4 das Skalarprodukt : bestimmen. Nun wissen wir aber aus (1.39), dass dies genau die gesuchte Komponenten des Ortsvektors ist, und damit die 4 -Koordinate des Punktes . Es gilt also : " 7 Die anderen Koordinaten können wir bestimmen, indem wir den Punkt ersetzen, " +: 7 und dann durch den Punkt , : " 7 (1.78) zuerst durch den Punkt (1.79) (1.80) Damit haben wir gezeigt, dass wir allein durch Abstandsmessungen die Koordinaten eines Punktes bezüglich eines vorher festgelegten Koordinatensystems ermitteln können. Das werden wir in Zukunft natürlich nicht mehr in dieser ausführlichen Art und Weise beschreiben. Wir gehen ab jetzt einfach davon aus, dass es möglich ist, die Koordinaten eines Ortes bezüglich eines gegebenen Koordinatensystems irgendwie zu ermitteln. In der Praxis wird man dazu oft ganz andere Methoden verwenden als die hier beschriebene. Das gilt insbesondere dann, wenn wir gar nicht mit Abstandsmessungen arbeiten können, etwa um die Koordinaten eines Planeten im Sonnensystem oder eines Sterns in der Milchstraße zu bestimmen. Die gezeigte Methode ist also weniger als eine praktische Anleitung zur Bestimmung von Koordinaten zu verstehen, sondern vielmehr als ein Beispiel dafür, wie man aus fundamentalen Messgrößen, die in einer Theorie definiert sind, Messvorschriften für andere Größen ableiten kann. Die fundamentale Messgröße war hier der Abstand von zwei Orten, den wir über das Maßband als Messgerät definiert haben, und die abgeleiteten Größen waren die Koordinaten eines Punktes bezüglich eines vorgegebenen Koordinatensystems. 21 Aufgabe 1.26 Wieviele Freiheiten haben wir bei der Wahl eines kartesischen Koordinatensystems? Mit anderen Worten, wieviele durch reelle Zahlen darstellbare Parameter m üssen wir unabhängig voneinander wählen, um ein kartesisches Koordinatensystem im dreidimensionalen Raum eindeutig festzulegen? Aufgabe 1.27 Wir betrachten noch einem das Experiment mit den f ünf Punkten ? im Raum, deren Abstände (1.48) gemessen wurden. Man wähle ein Koordinatensystem, das diesem Problem angepasst ist, bestimme aus den bekannten Abständen schrittweise die Koordinaten der einzelnen Punkte, und berechne schließlich aus den Koordinaten der Punkte und deren Abstand. Physikalische Dimensionen Einen wichtigen Aspekt einer physikalischen Theorie haben wir bis jetzt ignoriert. Als wir die Messgröße “Abstand” eingeführt haben, haben wir dies mit Hilfe eines Maßbandes getan, auf dem wir eine Skala angebracht haben. Die Wahl dieser Skala, also der Abstand der einzelnen Striche, ist natürlich willkürlich. Um Abstände zu messen, müssen wir eine Längeneinheit festlegen. Zum Beispiel können wir das Maßband in Meter und Zentimeter einteilen. Dann ist dies die Einheit, in der Abstände gemessen werden. Wir schreiben dafür 0 m (1.81) Die Einheit Meter war ursprünglich als der zehnmillionste Teil der Länge des durch Paris verlaufenden Meridians vom Nordpol zum Äquator definiert. Es ist daher kein Zufall, dass die Erdumfang ziemlich genau 6 6 6 6 km beträgt. Seit etwa 1890 gibt es das Urmeter, einen Platin-Iridium-Stab, der in einem Tresor in Paris aufbewahrt wird, und der seit dem die Längeeinheit Meter definiert hat. Heute ist man zu einer wesentlich genaueren und zudem überall reproduzierbaren Definition übergegangen. Das Meter ist ein bestimmtes Vielfaches der Wellenlänge einer Spektrallinie eines Krypton-Atoms festgelegt wird. Wie man auf diese Weise eine Längeneinheit definieren kann, werden wir allerdings erst im Rahmen der Quantenmechanik verstehen. Aber darauf kommt es uns hier gar nicht an. Die theoretische Physik interessiert sich gar nicht dafür, wie genau eine Maßeinheit definiert ist. Entscheidend ist nur, dass die Wahl einer Einheit grundsätzlich willkürlich ist. Wenn wir den Wert eine physikalischen Größe angeben wollen, müssen wir uns stets auf eine Einheit beziehen. Das hat zur Folge, dass es verschiedene Gr ößenarten gibt, die in verschiedenen Einheiten gemessen werden, und die wir folglich nicht miteinander vergleichen können. Der Abstand zweier Punkte definiert eine Größenart, die wir Länge nennen. Später werden wir andere Größenarten wir Zeit und Masse einführen, für die wir auch jeweils eine Einheit willkürlich festlegen müssen. Eine andere gebräuchlich Sprechweise ist zu sagen, dass der Abstand zweier Orte die physikalische Dimension einer Länge hat. Wir bringen damit zum Ausdruck, dass es sich um eine Größe handelt, die in einer willkürlich festgelegten Einheit für die Größenart Länge gemessen wird. Dieser Begriff der physikalischen Dimension hat natürlich nichts mit der Dimension eines Vektorraumes zu tun. Die Wortwahl ist daher vielleicht etwas ungeschickt. Aber sie ist so üblich, und wir werden sie daher auch verwenden. Es gibt also in einer physikalischen Theorie Größen verschiedener Dimensionen, oder verschiedene Größenarten. Was heißt das genau? Wie wir gesehen haben, macht eine Theorie Vorhersagen über Messergebnisse, wenn wir vorher andere Messungen durchgeführt haben. Ein Beispiel für eine solche Vorhersage, die die Euklidische Geometrie über Abstandsmessungen macht, haben wir weiter oben relativ ausführlich diskutiert. Wir haben gezeigt, dass wir aus der Messung von neun Abständen das Ergebnis einer zehnten Abstandsmessung vorhersagen konnten. Konkret sah das so aus, dass aus den neun Messergebnissen, von denen wir der Einfachheit angenommen hatten, dass alle den gleichen Wert ergaben, der Wert für das zehnte Messergebnis folgte. Betrachten wir die Euklidischen Geometrie als mathematische Theorie, so ist der Abstand zweier ist auch eine reelle Zahl, und folglich ist auch das Punkte ein Skalar, also eine reelle Zahl. Der Faktor 22 Produkt eine reelle Zahl. Wenn wir diese Größen aber tatsächlich messen, dann lesen wir an der Skala unseres Messgerätes gar keine reellen Zahlen ab, sondern jeweils eine Länge, also eine physikalische Größe, die ein Einheit trägt. Wir nennen eine solche Größe auch dimensionsbehaftet. Nehmen wir an, die neun gemessenen Abstände hätten einen Wert von, sagen wir, 0 m. Daraus würde folgen, dass die zehnte Messgröße den Wert 7 m hat. Was wäre, wenn die Theorie für die zehnte Messgröße den Wert 7 statt vorhergesagt hätte, also 6 m ? Das kann offenbar nicht sein. Diese vorhergesagte Größe wäre nicht von der richtigen Größenart, hätte also nicht die richtige physikalische Dimension. Es wäre keine Länge, sondern eine Fläche, also eine Länge zum Quadrat. Würde eine Theorie eine solche Vorhersage machen, wäre etwas an ihr falsch. Wir müssen an eine physikalische Theorie eine Konsistenzbedingung stellen, die über die reine mathematische Konsistenz hinaus geht. Es muss möglich sein, allen darin vorkommenden Größen physikalische Dimensionen zuzuordnen, also ihre Größenart zu bestimmen, so dass alle Messgrößen, also diejenigen Größen, die unmittelbar experimentell zugänglich sind, die richtigen Einheiten bekommen. Wenn eine Theorie etwas über eine Messgröße aussagt, die in Meter gemessen wird, dann muss der vorhergesagte Wert die Dimension einer Länge haben. Sonst ist die Theorie inkonsistent. Wie sieht das konkret aus? Zunächst müssen wir wissen, wie sich dimensionsbehaftete Größen, also solche mit Einheiten, überhaupt verhalten, wenn wir sie miteinander verknüpfen. Denn letztlich beruht eine Theorie ja darauf, verschiedene Größen irgendwie miteinander zu verknüpfen. Für das Rechnen mit physikalischen Einheiten gilt eine einfache Regel. Physikalische Einheiten verhalten sich formal wie skalare Faktoren. Mit anderen Worten, sie verhalten sich so, als wären es reelle Zahlen in einem Produkt. Daraus folgt, dass wir physikalische Größen nur nach ganz bestimmten Kombinationsregeln miteinander verknüpfen können. Wir können sie genau dann addieren oder miteinander vergleichen, wenn sie die gleiche Einheit tragen, also die gleiche physikalische Dimension haben. Außerdem können wir physikalische Größen beliebig miteinander multiplizieren, wobei sich die Einheiten ebenfalls multiplikativ verhalten. Und schließlich können wir, als eine Verallgemeinerung dieser Multiplikationsregel, eine physikalische Größe in eine beliebige Potenz erheben, die nicht unbedingt positiv und ganzzahlig sein muss. Aufgabe 1.28 Man mache sich klar, dass diese Kombinationsregeln auch auf Vektoren anwendbar sind. Insbesondere gilt die Multiplikationsregel auch für die skalare Multiplikation und das Skalarprodukt. Die Einteilung von physikalischen Größen in Größenarten ist unabhängig davon, ob es sich um Skalare oder Vektoren handelt. Der Abstand zweier Punkt ist ein Skalar, der die Dimension einer Länge hat. Welche physikalische Dimension hat der Abstandsvektor ? Er hängt über die Beziehung : (1.82) mit dem Abstand zusammen. Auf der linken Seite dieser Gleichung steht eine Größe der Dimension Länge zum Quadrat. Also muss auch auf der rechten Seite eine Größe dieser Art stehen. Da sich Einheiten wie skalare Faktoren verhalten, folgt daraus, dass auch der Abstandsvektor die Dimension einer Länge haben muss. Nur dann ergibt das Skalarprodukt dieses Vektors mit sich selbst eine Größe, die die Dimension einer Länge zum Quadrat hat. Etwas vereinfacht können wir sagen, dass auch der Vektor in Meter gemessen wird, 0 m (1.83) Allerdings ist dieser Formulierung ein wenig ungenau. Erstens können wir einen Vektor gar nicht messen, denn wir haben dafür gar keine Messvorschrift. Und zweitens können wir den Wert dieser Größe auch 23 nicht in der Form “ 0 m” oder so ähnlich angeben. Es handelt sich ja um einen gerichteten Vektor, und nicht um eine ungerichtete, skalare Größe. Trotzdem ist es sinnvoll, sich vorzustellen, dass der Vektor irgendwo versteckt die Einheit Meter trägt. So ist die Gleichung (1.83) zu verstehen. Der Vektor hat die Dimension einer Länge, weil es sich um einen Abstandsvektor zweier Punkte handelt. Unmittelbar messen können wir jedoch nur seinen Betrag, und der hat stets dieselbe physikalische Dimension wie der Vektor selbst. Die Einteilung von physikalischen Größen in verschiedene Größenarten hat also nichts damit zu tun, ob wir diese Größen unmittelbar messen können oder nicht. Sie ergibt sich aus den mathematischen Zusammenhängen zwischen den einzelnen Größen, sobald eine dieser Größen eine Messgröße ist. Deshalb verstehen wir unter dem “Betrag” eines Vektors auch etwas anderes als unter der “Länge”. Der Betrag ist ein mathematisches Konzept, das jedem Vektor eine skalare Größe zuordnet. Um eine Länge handelt es sich aber dabei nur, wenn der Vektor ein Abstandsvektor ist, also die Dimension einer Länge hat. Im nächsten Kapitel werden wir sehen, dass es auch Vektoren gibt, die die Dimension einer Fläche haben. Ihr Betrag ist dann eine Fläche und keine Länge. Ein anderes Beispiel für einen Vektor, der nicht die Dimension einer Länge hat, kennen wir bereits. Betrachten wir den Einheitsvektor, den wir bilden, indem wir einen Abstandsvektor durch seinen Betrag . Um welche Größenart handelt es sich dabei? Da wir eine Größe der Dimension teilen, also Länge durch eine andere Länge teilen, kürzen sich die Einheiten weg und wir bekommen eine dimensionslose Größe. Eine dimensionslose Größe ist eine, die quasi zufällig keine Einheit hat, weil sich alle Einheiten wegkürzen, 0 m 0 (1.84) 0 m Ein Einheitsvektor trägt also keine physikalische Einheit und ist daher dimensionslos. Das ergibt sich auch 0 ist, und nicht 0 m oder 0 m . aus der Definition, wonach Daraus folgt insbesondere, dass ein Einheitsvektor nicht als Abstandsvektor zweier Punkte dargestellt werden kann. Es gibt keine zwei Punkte im Raum, die den Abstand 0 haben, weil 0 eben keine Länge sondern eine dimensionslose Größe ist. Wenn wir uns einen Einheitsvektor anschaulich vorstellen wollen, sollten wir daher nicht das Bild eines Pfeiles im Auge haben, der zwei Punkte verbindet, sondern wir sollten uns vorstellen, dass durch einen solchen Vektor wirklich nur eine Richtung, aber keine Länge definiert wird. Wie sehen also, dass die Einführung einer einzigen Messvorschrift, die mit der willkürlichen Festlegung einer Einheit verbunden ist, allen in der Theorie vorkommenden Größen bestimmte physikalische Dimensionen zuordnet. Sie ergeben sich durch die mathematischen Beziehungen der Messgröße zu allen anderen Größen. Als ganzes ist eine physikalische Theorie nur dann konsistent, wenn diese Zuordnung von physikalischen Dimensionen zu den darin vorkommenden Größen mit den Kombinationsregeln für dimensionsbehaftete Größen verträglich ist. Aufgabe 1.29 Dass ein Einheitsvektor eine Richtung, aber keine L änge hat, kann man sich anhand der orthogonalen Zerlegung eines Vektors in Abbildung 1.2 klar machen. Nehmen wir an, der dort gezeigte Vektor hätte die Dimension einer Länge. Welche physikalischen Dimensionen haben dann die anderen dargestellten Größen , , ;: und ? Der Einheitsvektor wird in der Abbildung zwar durch einen Pfeil dargestellt, der eine bestimmte Länge hat. Man mache sich aber klar, dass die dargestellte Länge dieses Pfeiles keinerlei Auswirkungen auf die anderen Vektoren hat. Nur die Richtung des Pfeiles ist relevant. Aufgabe 1.30 Welche physikalischen Dimensionen haben die Basisvektoren , und die Koordinaten eines Punktes bezüglich eines kartesischen Koordinatensystems? Man überprüfe alle Beziehungen, in denen diese Komponenten vorkommen, auf ihre Konsistenz, also die Vertr äglichkeit mit 24 den Kombinationsregeln, insbesondere die Gleichungen (1.68) und (1.71) f ür den Ortsvektor und den Abstand im physikalischen Raum, sowie die Darstellungen (1.78–1.80) der Koordinaten als Messgr ößen. Aufgabe 1.31 Warum ist es nicht sinnvoll, den Punkten , also den Orten im Raum irgendeine physikalische Dimension zuzuordnen, obwohl wir doch auch f ür sei eine Messvorschrift angegeben haben? Aufgabe 1.32 Es seien 4 und zwei physikalische Größen, die über die Beziehung menhängen. Warum müssen beide Größen dimensionslos sein? zusam- 2 Euklidische Geometrie Bisher haben wir als einzige Messgröße den Abstand zwischen zwei Punkten im Raum definiert. Wir können aber noch andere geometrische Objekte einführen und Messgrößen mit ihren assoziieren. Das sind zum Beispiel Geraden, Ebenen, allgemeine Kurven und Flächen, sowie Kreise und Winkel. In der traditionellen Formulierung der Euklidischen Geometrie werden diese Objekte axiomatisch definiert. In diesem Kapitel wollen wir zeigen, wie sie sich aus der Vektorraumstruktur und insbesondere aus dem Skalarprodukt ableiten lassen. Unterräume Die einfachsten geometrischen Objekte, die wir in jedem affinen Raum einführen können, sind die affinen Unterräume. Sie repräsentieren Punkte, Geraden, Ebenen und entsprechende höherdimensionale Objekte. Diese werden im allgemeinen als Hyperebenen bezeichnet, kommen aber in einem dreidimensionen Raum nicht vor. eines Ein affiner Unterraum ist analog zu einem Untervektorraum definiert. Eine Teilmenge Vektorraumes ist genau dann ein Untervektorraum, wenn selbst wieder ein Vektorraum ist. Da die Vektorraumaxiome dann automatisch erfüllt sind, ist eine notwendige und hinreichende Bedingung dafür, ein Untervektorraum ist, dass mit $ und stets auch dass eine Teilmenge und # ist. Die Teilmenge muss unter der Vektoraddition und der skalaren Multiplikation abgeschlossen sein. eines affinen Raumes genau dann ein affiner Unterraum, wenn Entsprechend ist eine Teilmenge selbst wieder ein affiner Raum ist. Der zu zugeordnete Vektorraum ist dann ein Untervektorraum des zu zugeordneten Vektorraumes . Mit anderen Worten, wenn wir die Abstandsvektoren aller Paare bilden, so liegen diese in einem Untervektorraum . Und umgekehrt, wenn von Punkten in wir irgendeinen Punkt aus kennen, dann finden wir alle anderen, indem wir diesen Punkt um einen verschieben. Vektor aus Einen speziellen affinen Unterraum können wir festlegen, indem wir eine bestimmte Anzahl von Punk ten vorgeben, die der Unterraum enthalten soll. Sei zum Beispiel irgendein Punkt, so ist ein nulldimensionaler affiner Unterraum. Der zugeordnete Untervektorraum ist der nulldimensionale Vek torraum ! , denn der einzige Abstandsvektor, den wir in bilden können, ist der Nullvektor ! . Jeder einzelne Punkt eines affinen Raumes definiert auf diese Weise einen nulldimensionalen affinen Unterraum. Wenn wir zwei verschiedene Punkte vorgeben und von dem affinen Unterraum zumindest verlangen, dass ist, dann enthält der zugeordnete Untervektorraum den Vektor . Da es sich um einen Vektorraum handelt, enthält er dann aber auch alle Vielfache dieses Vektors. Und folglich enthält der affine Raum auch alle Punkte , die wir durch eine Verschiebung 25 des Punktes in Richtung des Vektors Gerade erreichen, > (2.1) Auf diese Weise wird in jedem affinen Raum durch zwei Punkte und eine Gerade festgelegt. Um eine Ebene zu definieren, müssen wir drei Punkte vorgeben, die in der Ebene liegen sollen. Die Vektoren und , von denen wir annehmen wollen, dass sie linear unabhängig sind, auf, und die Ebene spannen dann einen zweidimensionalen Untervektorraum besteht aus allen Punkten , deren Abstandsvektor von in diesem Untervektorraum liegt. Es gilt also Ebene -( )( (2.2) Das können wir leicht verallgemeinern. Wir nennen einen Satz von 0 Punkten 33 linear unabhängig, wenn die Vektoren 1 linear unabhängig sind. Wenn wir einen solchen Satz von Punkten vorgeben, dann spannen diese Vektoren einen -dimensionalen Untervektorraum auf. Der affine Unterraum (2.3) repräsentiert dann eine -dimensionale Hyperebene. Allgemein gilt der folgende Satz: Ein -dimensionaler affiner Unterraum wird durch deutig festgelegt. 0 linear unabhängige Punkte ein- Natürlich muss sein, wenn die Dimension des affinen Raumes ist. Wenn ist, dann sind die Vektoren 33 vollständig, das heißt in diesem Fall ist und somit . Die einzigen interessanten affinen Unterräume sind diejenigen, deren Dimension kleiner ist als die des gegeben affinen Raumes . Aufgabe 2.1 Bei der allgemeinen Definition (2.3) einer Hyperebene scheint der Punkt eine spezielle hängt nicht davon Rolle zu spielen. Man zeige jedoch, dass dem nicht so ist. Die Teilmenge ab, welchen der 80 Punkte wir mit bezeichnen. ein ebenfalls -dimensionaler affiner Aufgabe 2.2 Es sei ein -dimensionaler affiner Raum und Unterraum. Man zeige, dass ist, das heißt selbst ist der einzige affine Unterraum, der die maximale Dimension hat. , Aufgabe 2.3 Man beweise, dass die Schnittmenge von zwei affinen Unterräumen wenn sie nicht leer ist, wieder ein affiner Unterraum von ist. Warum kann die Schnittmenge von zwei leer sein, während die Schnittmenge von zwei Untervektorräumen affinen Unterräumen eines beliebigen Vektorraumes stets mindestens einen Vektor, nämlich den Nullvektor, enthält? Geraden und Ebenen Jetzt betrachten wir wieder den dreidimensionalen Euklidischen Raum. Die einzigen interessanten Unterräume sind dann die Geraden und Ebenen. Eine Gerade wird durch zwei verschiedene Punkte festgelegt, eine Ebene durch drei Punkte , die ein nicht entartetes Dreieck 26 bilden. Wir wollen uns überlegen, wie wir die Lage eines solchen Objektes im Raum am besten beschreiben können, und was es zum Beispiel bedeutet, dass zwei solche Objekte zueinander parallel liegen oder senkrecht stehen. Um die Richtung einer Geraden festzulegen, genügt es, den Richtungsvektor zu kennen. Er legt die Lage der Geraden im Raum eindeutig fest. Wir kennen die Gerade, wenn wir den Richtungsvektor und irgendeinen Punkt auf der Geraden kennen. Tatsächlich können wir die Definition (2.1) dann auch so schreiben, mit (2.4) Umgekehrt ist der Richtungsvektor durch die Gerade aber nur bis auf sein Vorzeichen bestimmt. Wir könnten in (2.4) statt auch "* schreiben. Das ist natürlich gleichbedeutend mit dem Vertauschen der Punkte und . Wir können das ändern, indem wir der Geraden eine Orientierung geben. Durch die Orientierung ist gewissermaßen eine Laufrichtung der Geraden festgelegt. Der Richtungsvektor zeigt dann die Laufrichtung an, also in diesem Fall von nach . Zu jeder orientierten Geraden gehört genau ein Richtungsvektor. Mit Hilfe des Richtungsvektors können dann auch erklären, wann zwei Geraden zueinander parallel liegen oder aufeinander senkrecht stehen. Zwei Geraden liegen natürlich parallel, wenn ihre Richtungsvektoren gleich sind. Wir nennen sie antiparallel, wenn ihre Richtungsvektoren entgegensetzt gleich sind, also wenn sie zwar im üblichen Sinne parallel sind, aber ihre Orientierungen verschieden sind. Und schließlich stehen zwei Geraden genau dann zueinander senkrecht, wenn das für ihre Richtungsvektoren gilt. Das ist unabhängig davon, ob sie sich schneiden oder nicht. Mit einer Ebene verhält es sich ganz ähnlich. Auch ihre Lage im Raum lässt sich durch einen Einheitsvektor beschreiben. Die Definition dieses Normalenvektors ist in Abbildung 2.1(a) dargestellt. Zu jeder Ebene gibt es genau zwei Einheitsvektoren, die zur Ebene senkrecht stehen. Sind die drei Punkte, die die Ebene aufspannen, so erfüllt der Normalenvektor die Gleichungen : 6 : 6 : 6 : 0 (2.5) Die ersten drei Gleichung sind nicht unabhängig, da aus den ersten beiden bereits folgt, dass auf allen Abstandsvektoren, die wir in der Ebene bilden können, senkrecht steht. Es handelt sich also um drei unabhängige Gleichungen für drei Unbekannte, nämlich die Komponenten von bezüglich irgendeines Koordinatensystems. Eine Gleichung davon ist quadratisch, so dass sich zwei Lösungen ergeben. Denn mit ist offenbar auch "* eine Lösung. Durch die Auswahl eines der beiden möglichen Normalenvektoren können wir die Orientierung der Ebene festlegen. Wir können ihr eine Oberseite und eine Unterseite zuordnen, und verlangen, dass der Normalenvektor von der Oberseite weg in den Raum zeigt. Die in Abbildung 2.1(a) sichtbare Seite der Ebene wäre in diesem Fall die Oberseite. Wir können die Orientierung einer Ebene auch durch die Reihenfolge der Punkte festlegen, die die Ebene aufspannen. Betrachtet man nämlich die Lage der drei Punkte auf der Ebene, so wird durch ihre Reihenfolge ein Drehsinn definiert. Er ist in Abbildung 2.1(a) durch einen rotierenden Pfeil dargestellt, der sich aus der Orientierung des Dreiecks ergibt. Um eine Beziehung zwischen den beiden Definitionen herzustellen, verwenden wir die folgende, leicht modifizierte Rechte-Hand-Regel. Zeigt der ausgestreckte Daumen in die Richtung des Normalenvektors, so zeigen die zur Faust zusammengerollten Finger den Drehsinn der Ebene an. In der Abbildung ist der Drehsinn und der Normalenvektor so gewählt, dass das der Fall ist. Der Normalenvektor einer Ebene legt auf diese Weise sowohl ihre Lage im Raum, als auch ihre Orientierung, also ihren Drehsinn fest. Zu jeder orientierten Ebene gehört genau ein Normalenvektor 27 (b) (a) Abbildung 2.1: Die affinen Unterräume des dreidimensionalen Euklidischen Raumes (a). Ein nulldimensionaler Unterraum besteht nur aus einem Punkt . Ein eindimensionaler Unterraum ist eine Gerade, die von zwei Punkten und aufgespannt wird. Eine zweidimensionale Ebene wird von drei Punkten , und aufgespannt. Der einzige dreidimensionale affine Unterraum ist der Raum selbst. Die Schnittmenge von zwei Ebenen ist eine Gerade (b). Analog zur Darstellung (2.4) einer Geraden können wir nun auch eine Ebene eindeutig durch einen einzigen Punkt und ihren Normalenvektor festlegen, (2.6) wobei durch die Gleichungen (2.5) und die Orientierung der Ebene festgelegt ist. Außerdem können wir parallele, antiparallele und senkrechte Ebenen definieren. Zwei Ebenen liegen genau dann parallel, wenn ihre Normalenvektoren gleich sind. Sie heißen antiparallel, wenn ihre Normalenvektoren entgegengesetzt gleich sind. Und sie stehen zueinander senkrecht, wenn ihre Normalenvektoren zueinander senkrecht stehen. Aufgabe 2.4 Es seien die Punkte mit folgenden Koordinaten bez üglich eines positiv orientierten kartesischen Koordinatensystems gegeben, 0 7 & 7 3 0 & 30 7 (2.7) Man bestimme den Normalenvektor der von diesen Punkten aufgespannten Ebene. Um das richtige Vorzeichen des Normalenvektors zu finden, kann man sich mit Hilfe der Rechten-Hand-Regel überlegen, auf welcher Seite der Ebene der Ursprung des Koordinatensystems liegt. Aufgabe 2.5 Die dreidimensionale Version des Parallelenaxioms besagt, dass es im Euklidischen Raum zu jeder Ebene und jedem Punkt genau eine Ebene gibt, mit und . Man beweise diese Aussage. Man zeige außerdem, dass zwei Ebenen genau dann parallel im Sinne der obigen Definition sind, wenn sie entweder gleich sind oder ihre Schnittmenge leer ist. Aufgabe 2.6 In Abbildung 2.1(b) sind zwei Ebenen und dargestellt, deren Schnittmenge eine Gerade ist. Durch welche Gleichungen ist der normierte Richtungsvektor der Geraden durch die beiden Normalenvektoren und der Ebenen bis auf sein Vorzeichen eindeutig bestimmt? Aufgabe 2.7 Wann schneidet eine Gerade eine Ebene senkrecht? 28 Das Kreuzprodukt Da eine Ebene einschließlich ihrer Orientierung eindeutig durch drei linear unabhängige Punkte bestimmt ist, muss es möglich sein, den Normalenvektor der Ebene irgendwie aus diesen Punkten zu berechnen. Es seien also drei Punkte gegeben. Wie können wir dann einen Vektor finden, der die Eigenschaften (2.5) hat? Am besten schreiben wir dazu die Gleichungen explizit aus, indem wir ein Koordinatensystem einführen. Ohne Beschränkung der Allgemeinheit können wir dabei annehmen, dass einer der drei Punkte der Ursprung ist, zum Beispiel . Wir machen also, um die Rechnung zu vereinfachen, von der Möglichkeit Gebrauch, ein speziellen Koordinatensystem zu wählen. Gesucht ist dann ein Einheitsvektor , der auf der Ebene, also insbesondere auf den Vektoren und senkrecht steht. Das sind die Ortsvektoren der Punkte und . Die Komponenten dieser Vektoren seien wie üblich mit bzw. bezeichnet. Es gilt also Ebenso können wir den Vektor - - (2.8) in seine Komponenten zerlegen, (2.9) Da wir das Skalarprodukt von zwei Vektoren gemäß (1.35) durch die Komponenten ausdrücken können, lautet die erste an zu stellende Bedingung 5: 6 : 6 (2.10) Das ist ein einfaches lineares Gleichungssystem für die unbekannten Komponenten , , des Vektors . Da es sich um zwei Gleichungen für drei Unbekannte handelt, und da die Vektoren und , und somit auch die beiden Gleichungen linear unabhängig sind, gibt es eine eindimensionale Lösungsmenge. Aufgabe 2.8 Man zeige, dass die allgemeine Lösung von (2.10) wie folgt gegeben ist, wobei big gewählt werden kann, # " # " # " belie- (2.11) Wir kennen damit alle Vektoren , die zu und und damit zu der von ihnen aufgespannten Ebene senkrecht stehen. Jetzt müssen wir nur noch die Zahl so bestimmen, dass sich ein Einheitsvektor ergibt, der in die der Orientierung der Ebene entsprechende Richtung zeigt. Bevor wir das tun, betrachten wir jedoch zunächst den Vektor, der sich aus (2.11) für 0 ergibt. Wir bezeichnen diesen Vektor mit " " " (2.12) Wie man sieht, wird durch diese Vorschrift eine Abbildung definiert, die zwei Vektoren wieder einen Vektor zuordnet, Kreuzprodukt (2.13) Diese Abbildung wird Kreuzprodukt genannt. Sie hat die typischen Eigenschaften eines Produktes. Das Kreuzprodukt ist linear, das heißt es verhält sich assoziativ gegenüber der Addition, % . 29 (2.14) und es ist mit der skalaren Multiplikation verträglich, ,# . *% 3 (2.15) Allerdings ist es nicht wie das Skalarprodukt symmetrisch, sondern antisymmetrisch, " $ (2.16) Und schließlich hat es noch genau die Eigenschaft, die wir gefordert haben. Das Kreuzprodukt steht senkrecht auf den Vektoren und , % : 6 : ? 6 (2.17) Auf der Suche nach einem Vektor, der zu zwei vorgegebenen Vektoren senkrecht steht, sind wir also auf ein spezielles Produkt von Vektoren gestoßen, das, anders als das Skalarprodukt, als Ergebnis keinen Skalar, sondern wieder einen Vektor liefert. Wie wir gleich sehen werden, spielt das Kreuzprodukt für die Berechnung von Flächen eine ähnliche Rolle wie das Skalarprodukt für die Berechnung von Längen. Aufgabe 2.9 Man leite die Eigenschaften (2.14-2.17) des Kreuzproduktes aus der Definition (2.12) her. Warum kann man ein Kreuzprodukt mit diesen Eigenschaften nur in einem dreidimensionalen Raum definieren? Aufgabe 2.10 Man berechne alle neun möglichen Kreuzprodukte der Basisvektoren , und , also , , 3 und so weiter. Aufgabe 2.11 Man berechne die zwölf möglichen Kreuzprodukte von jeweils zwei der folgenden Vektoren, 7 " " 7 " (2.18) Man zeige anhand dieser Beispiele und mit Hilfe der Rechten-Hand-Regel, dass die Vektoren 1 immer ein Rechtssystem bilden, wenn und linear unabhängig sind. Es sei dabei vorausgesetzt, dass das verwendete Koordinatensystem positiv orientiert ist. Aufgabe 2.12 Laut Aufgabe 2.11 kann die Richtung des Kreuzproduktes von zwei Vektoren durch die Rechte-Hand-Regel bestimmt werden. Warum folgt daraus zwingend, dass das Kreuzprodukt nicht symmetrisch sein kann, sondern nur antisymmetrisch? Das Levi-Civita-Symbol Bei der Definition des Kreuzproduktes haben wir explizit eine bestimmte Orthonormalbasis verwendet. Es stellt sich daher die Frage, ob diese Definition des Kreuzproduktes davon abhängt, welche Basis wir verwenden. Oder gibt es vielleicht auch eine anschauliche, “geometrische” Definition des Kreuzproduktes, die nicht auf der Zerlegung der Vektoren bezüglich eine Orthonormalbasis beruht? Um diese geometrische Definition des Kreuzproduktes zu finden, müssen wir zuerst ein paar Rechenregeln herleiten. Es ist nützlich, dafür ein neues Symbol einzuführen, das für das Kreuzprodukt eine ähnliche Rolle spielt wie das Kronecker-Symbol für das Skalarprodukt. Wir erinnern uns, dass das KroneckerSymbol durch die Eigenschaft definiert war, dass für in einer Orthonormalbasis : 30 (2.19) ist. Das Kronecker-Symbol repräsentiert also die Skalarprodukte der Basisvektoren. Wir hatten es benutzt, um das Skalarprodukt von zwei Vektoren durch deren Komponenten auszudrücken, ;: : : (2.20) Das Kreuzprodukt hat die gleichen Eigenschaften wie das Skalarprodukt bezüglich der Addition und skalaren Multiplikation von Vektoren. Folglich gilt ganz analog ? (2.21) Um das Kreuzprodukt von zwei beliebigen Vektoren zu berechnen, genügt die Kenntnis der Kreuzprodukte der Basisvektoren. Der einzige Unterschied zum Skalarprodukt ist, dass das Ergebnis jetzt wieder ein Vektor ist. Folglich müssen wir, um (2.21) weiter auszuwerten, die Vektoren wieder bezüglich der Basis entwickeln. Wir schreiben dafür (2.22) Die Koeffizienten sind die Komponenten des Vektors ; bezüglich der Basis . Es handelt sich um ein Schema von insgesamt 7 Zahlen, denn auf der linken Seite der Gleichung (2.22) steht einer von neun möglichen Vektoren, und jeder davon hat drei Komponenten. Wir werden diese 7 Koeffizienten gleich berechnen und sehen, dass sie sehr einfach aussehen. Zuerst wollen wir aber die Rechnung (2.21) fortsetzen. Wenn wir (2.22) dort einsetzen, dann ergibt sich (2.23) Im letzten Schritt haben wir die Summe über abgespalten, um zu zeigen, dass das Ergebnis jetzt wieder in der üblichen Art und Weise als Linearkombination der Basisvektoren dargestellt wird. Wir können daraus die folgende Vorschrift ableiten, nach der sich die Komponenten des Kreuzproduktes aus den Komponenten der beiden Vektoren berechnen lassen, (2.24) Wenn wir dies nun mit der ursprünglichen Definition (2.12) des Kreuzproduktes vergleichen, also mit " " so stellen wir fest, dass von den insgesamt 7 Einträgen des Zahlenschemas den. Es sind dies die Einträge 0 " (2.25) nur sechs nicht verschwin- " 0 (2.26) Aufgabe 2.13 Man verifiziere dieses Ergebnis durch Einsetzen von (2.26) in (2.24) und Ausschreiben der Summen. Betrachten wir die nicht verschwindenden Komponenten von etwas genauer, so stellen wir eine gewisse Regelmäßigkeit fest. Alle sechs haben die Eigenschaft, dass die drei Indizes die Werte 4 $ 31 annehmen, nur jeweils in einer anderen Reihenfolge. Es kommt niemals ein Index doppelt vor. Die sechs auftretenden Kombinationen sind genau die sechs möglichen Permutationen der Indexmenge 4 . Auch das Vorzeichen lässt sich leicht aus einer speziellen Eigenschaft der jeweiligen Permutation ableiten. Eine Permutation von drei Indizes heißt gerade, wenn sie sich durch zyklisches Vertauschen ergibt, also 4 , , 4 . Für die ersten drei Einträge in (2.26) ist das der Fall. Wir sagen auch, dies seien zyklische Permutationen der Indizes 4 . Wir erkennen eine zyklische Permutation daran, dass die Reihenfolge der Indizes, wenn wir sie periodisch fortsetzen, die “richtige” Reihenfolge ist, also 4 - - -4 - - - . Die anderen drei Indexkombinationen in (2.26) sind ungerade oder antizyklische Permutationen der Indexmenge 4 $ . Sie ergeben sich durch Vertauschen von jeweils zwei Indizes, also 4 , oder 4 . Wenn wir eine solche Permutation periodisch fortsetzen, erscheinen die Indizes in der “falschen” Reihenfolge - -4 - - -4 - 3 . Alle anderen Einträge von , also diejenigen, bei denen mindestens ein Index doppelt vorkommt und somit gar keine Permutation von 4 $ vorliegt, sind gleich Null. Das fassen wir wie folgt zusammen. Levi-CivitaSymbol *0 " 0 6 wenn eine gerade . . . . . . eine ungerade . . . . . . keine Permutation von 4 $ ist, (2.27) Das so definierte Zahlenschema wird Levi-Civita-Symbol genannt. Aus den Eigenschaften dieses Symbols lassen sich, nachdem wir den Umgang damit ein wenig geübt haben, sehr leicht alle Eigenschaften des Kreuzproduktes ableiten. Aufgabe 2.14 Man leite die folgenden Eigenschaften des Levi-Civita-Symbols aus der Definition her. Es ist antisymmetrisch bezüglich des Vertauschens zweier Indizes, " " " (2.28) Es behält dagegen sein Vorzeichen bei, wenn wir die drei Indizes zyklisch vertauschen, (2.29) Aufgabe 2.15 Wie wir wissen, lassen sich die Komponenten eines Vektors bez üglich einer Orthonormalbasis durch das Skalarprodukt mit den Basisvektoren bestimmen. Aus (2.22) folgt also ? , : Man benutze das Ergebnis von Aufgabe 2.10, um daraus alle 7 Eintr äge von Ergebnis (2.27) zu reproduzieren. Aufgabe 2.16 Es seien (2.30) zu berechnen und das drei beliebige Vektoren. Man beweise 1 : : + : (2.31) Aufgabe 2.17 Die folgenden Formeln stellen eine Beziehung her zwischen dem Levi-Civita-Symbol und dem Kronecker-Symbol. Man beweise sie, indem man sich zuerst überlege, für welche Indexkombinationen sich überhaupt auf beiden Seiten der Gleichung nicht verschwindenden Terme ergeben k önnen, und überprüfe anschließend diese Terme explizit auf Gleichheit. Die einfachste Formel lautet 7 32 (2.32) Etwas schwieriger ist die folgende Formel, die wir noch sehr häufig benötigen werden, " (2.33) Die allgemeinste Formel, mit der sich jedes Produkt von zwei Levi-Civita-Symbolen durch KroneckerSymbole ausdrücken lässt, ist " " " " (2.34) Diese Formel werden wir jedoch nie explizit benötigen. Aufgabe 2.18 Man beweise die Jacobi-Identität . . + % 3& ! (2.35) und mache sich außerdem klar, dass das Kreuzprodukt nicht assoziativ ist, die Klammern hier also nicht weggelassen werden können. Aufgabe 2.19 Man benutze die Formeln aus Aufgabe 2.17, um folgende Beziehung zwischen dem Kreuzprodukt und dem Skalarprodukt herzuleiten. % 3 : 5: : 5: : " 8 (2.36) Fläche und Volumen Jetzt haben wir immer noch nicht gezeigt, dass die Definition des Kreuzproduktes von der gewählten Orthonormalbasis unabhängig ist, und wir haben noch keine anschauliche geometrische Interpretation dafür gefunden. Wir wissen bisher nur, dass stets senkrecht auf und steht, und dass die Richtung dieses Vektors durch die Rechte-Hand-Regel gefunden werden kann. Wir werden jetzt zeigen, dass der Betrag des Kreuzproduktes etwas mit einem Flächeninhalt zu tun hat. und deren Kreuzprodukt . Aus Wir betrachten zunächst zwei zueinander senkrechte Vektoren (2.36) entnehmen wir, dass für den Betrag des Kreuzproduktes in diesem Fall gilt : % 1& "8<: (2.37) also . Das ist offenbar der Flächeninhalt des von den Vektoren und aufgespannten Rechtecks. Im allgemeinen spannen zwei Vektoren aber kein Rechteck, sondern ein Parallelogramm auf. Ein solches ist in Abbildung 2.2(a) dargestellt. Um seinen Flächeninhalt zu berechnen, gehen wir wie folgt vor. Wir halten die Seite, die dem Vektor entspricht, fest und scheren es so, dass sich ein Rechteck ergibt. Offenbar müssen wir dazu den Vektor in einen Anteil parallel zu und einen Anteil senkrecht zu zerlegen. Das Rechteck, das durch die Vektoren und aufgespannt wird, hat dann denselben Flächeninhalt wie das Parallelogramm. Die dazu notwendige orthogonale Zerlegung eines Vektors haben wir bereits in Aufgabe 1.5 durchgeführt. Zunächst bestimmen wir den zu gehörenden Einheitsvektor . Er ist durch gegeben. Dann zerlegen wir den Vektor gemäß (1.19), : 33 "= : (2.38) replacements (c) (d) (a) (b) Abbildung 2.2: Das Kreuzproduktes repräsentiert die Fläche des von und aufgespannten Paral lelogramms. Es steht auf diese Fläche senkrecht und für die drei Vektoren , und gilt die Rechte liefert das Volumen eines von den Vektoren , und Hand-Regel (a). Das Spatprodukt aufgespannten Spates (b). Und interessiert nur der Vektor . Die Fläche des Rechtecks und damit des Parallelogramms ist , also Hier haben wir benutzt, dass " : : " 7 : " 0 ist. Jetzt verwenden wir noch die Definition " 8 " %5: 3 : (2.39) . Das ergibt : (2.40) Das ist genau der vorletzte Ausdruck in (2.37), der auch dann gilt, wenn das Skalarprodukt von und nicht verschwindet. Damit haben wir gezeigt, dass der Betrag des Kreuzproduktes gleich dem Flächeninhalt des von und aufgespannten Parallelogramms ist, (2.41) Wir haben nun sowohl für die Richtung von , als auch für den Betrag dieses Vektors eine anschauliche geometrische Erklärung. Das Kreuzprodukt steht auf und senkrecht, wobei diese drei Vektoren ein Rechtssystem bilden. Sein Betrag ist die Fläche des von und aufgespannten Parallelogramms. Wir haben jetzt zwar keinen formalen Beweis geführt, aber wir haben eine anschauliche geometrische Beschreibung des Kreuzproduktes gefunden, und uns somit zumindest intuitiv klar gemacht, dass es nicht davon abhängt, welche Orthonormalbasis wir in (2.24) verwenden, um es Komponentenweise auszurechnen. Mit anderen Worten, die Formel + (2.42) für die Komponenten des Kreuzproduktes gilt in jeder Orthonormalbasis. Genauer gesagt, sie gilt in jeder positiv orientierten Orthonormalbasis, denn in einer negativ orientieren Basis würden wir einen Vorzeichenfehler machen, weil die Rechte-Hand-Regel für die Basisvektoren nicht mehr gilt. 34 Warum ist das so? Wie wir gesehen haben, genügt es, die Kreuzprodukte der Basisvektoren zu kennen, um beliebige Kreuzprodukte auszurechnen. Nun gilt aber in jeder positiv orientierten Orthonormalbasis, dass und ein Einheitsquadrat aufspannen, also ein Parallelogramm der Fläche 0 . Außerdem ist der Vektor, der darauf senkrecht steht und der mit und ein Rechtssystem bildet, immer der Basisvektor . So ist eine positiv orientierte Orthonormalbasis definiert. Also gilt für jede solche Basis , und entsprechend die Formel (2.22) für die anderen Kreuzprodukte der Basisvektoren. Diese Aussage ist analog zu der Aussage zu interpretieren, dass die Beziehung (2.19) für die Skalarprodukte in jeder Orthonormalbasis gilt. Wir können diese Aussagen sogar umkehren und sagen, dass eine positiv orientierte Orthonormalbasis durch die Eigenschaften : (2.43) definiert ist. Einen tieferen Grund für diesen Zusammenhang zwischen Orthonormalbasen und den Symbolen und werden wir später im Zusammenhang mit der Drehgruppe kennenlernen. Es ist deshalb nützlich, diese Definition einer positiv orientierten Orthonormalbasis im Gedächtnis zu behalten. Sie ist außerdem nützlich, weil sich alle Rechenregeln und Formeln für die Symbole und letztlich aus diesen Eigenschaften der Skalar- und Kreuzprodukte herleiten lassen. Das Kreuzprodukt ist also eng mit Flächen verknüpft, so wie das Skalarprodukt mit Längen zu tun hat. Wir wollen nun noch zeigen, dass ein Kombination von beiden das Volumen berechnet. Wir betrachten dazu drei Vektoren , und , die linear unabhängig sein sollen. Wie in Abbildung 2.2(b) dargestellt, spannen diese Vektoren einen Spat auf, also eine dreidimensionale Verallgemeinerung eines Parallelogramms. Wir wollen sein Volumen berechnen. Das Volumen eines Spates ist durch Grundfläche mal Höhe gegeben. Die Grundfläche sei das von und aufgespannte Parallelogramm. Es hat die Fläche . Die Höhe des Spates ist die orthogonale Projektion des Vektors auf die Richtung senkrecht zur Grundfläche, also auf die Richtung von . Die orthogonale Projektion ist, das wissen wir bereits, durch das Skalarprodukt von mit dem Einheitsvektor gegeben. Folglich ist : : 1 : (2.44) Diese Kombination von Kreuz- und Skalarprodukt wird Spatprodukt genannt, da es das Volumen eines von drei Vektoren aufgespannten Spates repräsentiert. Wir hatten bereits in Aufgabe 2.16 gezeigt, dass es zyklisch ist, also bei einer zyklischen Permutation der drei Vektoren seinen Wert nicht ändert. Das muss natürlich so sein, denn das Volumen eines Spates hängt natürlich nicht davon ab, in welcher Reihenfolge wir die drei Vektoren angeben. Aufgabe 2.20 Auch für das Volumen gilt eine Vorzeichenregel. Man zeige, dass das durch (2.44) definierte Volumen eines Spates genau dann positiv ist, wenn die Vektoren % , wie in Abbildung 2.2 der Fall, ein Rechtssystem bilden. Es ist dagegen negativ, wenn sie ein Linkssystem bilden, und Null, wenn sie linear abhängig sind. In diesem Fall ist der Spat entartet. Aufgabe 2.21 Wir kennen bereits die Spatprodukte der Basisvektoren einer Orthonormalbasis. Es ist : . Welche anschauliche geometrische Erklärung ergibt sich nun für diese Formel? Aufgabe 2.22 Die eigentliche Fragestellung, die uns zum Kreuzprodukt f ührte, war die Bestimmung des Normalenvektors einer Ebene, die von drei Punkten aufgespannt wird. Man zeige, dass dieser nun durch 35 (2.45) replacements (c) (d) (b) (a) Abbildung 2.3: Ein Spat (a) kann in sechs gleich große Tetraeder zerlegt werden. Die Kanten eines gleich seitigen Tetraeders (b) sind Vektoren gleicher Länge . gegeben ist. Man prüfe, ob die drei Ausdrücke gleich sind, ob die Forderungen (2.5) erfüllt sind, und ob der so definierte Vektor in die richtige, der Orientierung der Ebene entsprechende Richtung zeigt. Aufgabe 2.23 Die Seiten eines Dreiecks sind durch die Vektoren , / und gegeben. Die Seitenlängen seien wie üblich mit , und bezeichnet. Man zeige und dass für den Flächeninhalt des Dreiecks die Formeln " ;: 1 " : (2.46) "8 : (2.47) gelten. Man beweise die Heronsche Formel 0 ". " - " + (2.48) Aufgabe 2.24 Abbildung 2.3(a) zeigt die Zerlegung eines Spates in sechs Tetraeder, analog zur Zerlegung eines Parallelogramms in zwei Dreiecke. Die Tetraeder sind alle gleich groß, da jeweils zwei von ihnen eine gleich große Grundfläche und die gleiche Höhe haben. Das Volumen jedes einzelnen Tetraeders ist folglich ein sechstel des Volumen des Spates. Es soll das Volumen eines gleichseitigen Tetraeders der Kantenlänge berechnet werden. Wie in Abbildung 2.3(b) gezeigt, wird ein solcher Tetraeder durch drei Vektoren , , aufgespannt, mit " " % " Man leite daraus mit Hilfe der Rechenregeln für das Skalar- und Kreuzprodukt die Formel ab. (2.49) 7 Aufgabe 2.25 Man zeige, dass zwei Kanten eines gleichseitigen Tetraeders, die sich nicht an einer Ecke berühren, zueinander senkrecht stehen. In Abbildung 2.3 sind dies zum Beispiel die Kanten und " . 36 Aufgabe 2.26 Bei der Definition von Flächen und Volumen haben wir bis jetzt keine Rücksicht auf die physikalischen Dimensionen der beteiligten Vektoren genommen. Wenn sich die betrachteten Fl ächen und Körper im physikalischen Raum befinden, welche Dimensionen haben dann die Vektoren, die sie aufspannen? Ergeben sich daraus die richtigen Dimensionen für den Flächeninhalt und das Volumen, also Länge zum Quadrat bzw. Länge hoch drei? Kurven Wir können jetzt Längen, Flächen und Volumen berechnen, jedoch nur, wenn es sich dabei um ganz bestimmte Objekte handelt, zum Beispiel den Abstand zwischen zwei Punkten, die Fläche eines Parallelogramms oder Dreiecks, oder das Volumen eines Spates oder eines Tetraeders. Im Prinzip können wir jedes ein-, zwei-, bzw. dreidimensionales Objekt derart in Teile zerlegen, dass wir seine Länge, Fläche bzw. sein Volumen auf diese Weise berechnen können. Wir wollen das am Beispiel einer Kurve zeigen, deren Länge wir berechnen wollen. Eine Kurve im Raum können wir durch eine Funktion parametrisierte Kurve (2.50) darstellen. Jeder reellen Zahl wird ein Punkt zugeordnet. Die Gesamtheit aller dieser Punkte bildet die Kurve. Die Variable wird Kurvenparameter genannt. Handelt es sich nur um ein endliches Stück einer Kurve, so können wir den Definitionsbereich von entsprechend einschränken, zum Beispiel . auf ein Intervall Um konkrete Rechnungen durchzuführen, ist es sinnvoll, statt der Funktion die Ortsvektordarstellung oder die Koordinatendarstellung der Kurve zu benutzen. Wir fixieren einen Ursprung und eine Orthonormalbasis , und betrachten dann die Vektorfunktion & & (2.51) In einem kartesischen Koordinatensystem wird eine Kurve entweder durch eine vektorwertige Funkti on , oder durch einen Satz von drei reellen Funktionen beschrieben. In Abbil , und sie dung 2.4(a) ist eine solche Kurve dargestellt. Sie hat eine endliche Länge, es gilt verbindet die Punkte und 1 . Wenn die Funktion hinreichend stetig und differenzierbar ist, was wir im folgenden stets annehmen wollen, dann können wir die Ableitung bilden, Tangentenvektor & " (2.52) Die Definition der Ableitung als Grenzwert haben wir explizit aufgeschrieben, um zu zeigen, dass wir auch in einem Vektorraum in der üblichen Art und Weise Ableitungen bilden können. Im Zähler steht die Differenz zweier Vektoren, also wieder ein Vektor. Im Nennen steht eine reelle Zahl, das heißt wir multiplizieren den Vektor mit einer reellen Zahl und erhalten wieder einen Vektor. Dieser hängt von und ab, und wir bilden schließlich den Grenzwert 6 . Wir müssen nur noch erklären, wie wir in einem Vektorraum einen Grenzwert bilden. Der Grenzwert in einem Vektorraum ist so definiert, dass die elementaren Abbildungen, also die Vektoraddition, die skalare Multiplikation und das Skalarprodukt, stetig sind. Drücken wir die Vektoren in (2.52) durch ihre Komponenten aus, so ist % 37 " 2 (2.53) (b) (a) Abbildung 2.4: Eine Kurve im Raum wird durch eine Ortsvektorfunktion dargestellt (a). Die Ab leitung ist der Tangentenvektor der Kurve an der Stelle . Um die Länge der Kurve zu berechnen, zerlegt man sie in Linienelemente und integriert diese (b). Wegen der Stetigkeit der Addition und der skalaren Multiplikation können wie die Summe mit den Grenzwert vertauschen. Außerdem sind die Basisvektoren konstant. Also gilt & " % % (2.54) Um die Ableitung einer Vektorfunktion zu bilden, können wir einfach die Ableitungen der Komponenten bezüglich irgendeiner Basis bilden. Das sind gewöhnliche reelle Funktionen, das heißt hier hat die Ableitung ihre gewöhnliche Bedeutung. Für Ableitungen einer Funktion 4 schreiben wir wie üblich 4 , benutzen aber gelegentlich auch die Schreibweise 4 . Wie wir gleich sehen werden ist das sehr nützlich, denn mit Hilfe dieser etwas formalen Darstellung der Ableitung als Quotient lässt sich ganz einfach rechnen. Anschaulich stellen wir uns darunter das Verhältnis einer sehr kleinen Differenz 4 4 " 4 und der ebenfalls sehr kleinen Größe 4 vor. Die geometrische Bedeutung des Vektors ist in Abbildung 2.4(a) dargestellt. Es ist der Tangentenvektor der Kurve an der Stelle . Er zeigt dort in die Richtung, in die die Kurve verläuft. Wenn wir diesen Tangentenvektor entlang der Kurve integrieren, ergibt sich der Abstandsvektor, der vom Anfangspunkt der Kurve zu ihrem Endpunkt zeigt, " 1 (2.55) Für das Integral einer Vektorfunktion gilt das gleiche wie für die Ableitung. Wir können es komponenten- 38 weise ausrechnen, das heißt wir können (2.55) auch wie folgt schreiben, & % " % % % '" % " (2.56) Die Gleichung (2.55) ist nichts anderes als die Verallgemeinerung des Fundamentalsatzes der Analysis, angewandt auf eine Vektorfunktion. Durch Integration des Tangentenvektors einer Kurve bekommen wir den insgesamt von der Kurve zurückgelegten Weg, das heißt den Abstandsvektor zwischen dem Anfangs- und dem Endpunkt der Kurve. Aber eigentlich wollten wir ja die Länge der Kurve berechnen. Diese ist im allgemeinen größer als der Abstand zwischen Anfangs- und Endpunkt, da die Kurve ja einen Umweg machen könnte. Die Berechnung der Länge einer Kurve ist in Abbildung 2.4(b) dargestellt. Wir definieren zunächst eine Funktion . Sie soll die Länge der Kurve von ihrem Anfangspunkt, oder von irgendeinem anderen fest gewählten Punkt, bis zur Stelle repräsentieren. Dann fragen wir uns, wie von abhängt, also wie sich die Funktion ändert, wenn wir um eine kleines Stück erhöhen. " ist die Länge des Kurvenstückes zwischen und Die Differenz . Wenn sehr klein ist, können wir dieses Kurvenstück sehr gut durch eine gerade Strecke approximieren. Diese Strecke " dargestellt. Folglich gilt für ein kleines, aber positives wird durch den Vektor (2.57) " " Die Näherung ist umso besser, je kleiner ist. Jedoch können wir nicht einfach den Grenzwert 6 bilden, denn dann steht auf beiden Seiten der Gleichung Null. Wir können aber zuerst die Gleichung durch teilen und dann den Grenzwert bilden, " " (2.58) Auf der linken Seite steht nun offenbar die Ableitung . Die rechte Seite formen wir noch ein wenig um. Da wir 6 annehmen, können wir den Nenner unter den Betrag ziehen. Das gleiche gilt für den Grenzwert, denn der Betrag ist über das Skalarprodukt und die Quadratwurzelfunktion definiert und daher stetig. Daraus folgt " (2.59) Jetzt müssen wir diese Gleichung nur noch integrieren und bekommen den folgenden Ausdruck für die , Gesamtlänge einer Kurve für den Abschnitt Kurvenlänge " (2.60) Es spielt jetzt keine Rolle mehr, welchen Bezugspunkt wir verwenden, um die Funktion zu definieren. Es tritt bei der Integration nur noch die Differenz von zwei Funktionswerten auf, und dies ist die Gesamtlänge der Kurve zwischen den Orten und . Damit kennen wir auch die Bedeu tung des Betrages des Tangentenvektors . Er gibt an, wie sich die Länge der Kurve als Funktion des Kurvenparameters verändert. 39 Durch eine kleine “formale” Manipulation können wir die Formel (2.60) für die Länge einer Kurve auch sehr anschaulich darstellen. Wir schreiben noch einmal die Beziehung (2.59) in einer etwas anderen Form auf, & & , Diese Gleichung multiplizieren wir nun formal mit (2.61) (2.62) Wir nennen diesen Ausdruck für das Linienelement. Es hat folgende, in Abbildung 2.4(b) dargestellte anschauliche Bedeutung. Wir betrachten ein kleines Stück der Kurve. Die Länge dieses Stückes können wir berechnen, indem wir einen Koordinatenquader bilden, die Quadrate der Seitenlängen , und dieses Quaders addieren, und aus der Summe die Wurzel ziehen. Das besagt die Formel (2.62). Da wir dabei die Kurve durch eine gerade Strecke approximieren, gilt diese Formel natürlich nur im Grenzfall, also wenn die Länge des Kurvenstückes gegen Null geht. Um die Gesamtlänge der Kurve zu berechnen, müssen wir die Kurve in sehr viele sehr kleine Stücke unterteilen, die Längen dieser Stücke aufsummieren, und schließlich den Grenzwert bilden, in dem die Anzahl der Stücke gegen unendlich geht und deren Länge gegen Null. Das ist natürlich nichts anderes als die Definition eines Integrals. Es gilt also (2.63) Allerdings können wir mit diesem formalen Ausdruck noch nichts anfangen. Wir können ihn aber jetzt teilen, und vor die Summe wieder mit erweitern, indem wir den Ausdruck unter der Summe durch ein schreiben, (2.64) Jetzt ergibt das ganze wieder eine Sinn, und natürlich ist das genau die Formel (2.60), wenn wir dort die Kurve explizit durch ihre Koordinatenfunktionen % darstellen. Über den Trick mit dem Linienelement (2.62), das sich unmittelbar aus dem Satz von Pythagoras ergibt, lässt sich die Formel für die Länge einer beliebigen Kurve auf diese Weise leicht “herleiten”, oder jedenfalls reproduzieren. Aufgabe 2.27 Man berechne die Länge einer geraden Strecke zwischen zwei Punkten und dass sie mit dem Abstand übereinstimmt. und zeige, Aufgabe 2.28 Man beweise die verallgemeinerte Dreiecksungleichung: Die L änge einer Kurve ist stets größer oder gleich dem Abstand ihrer Endpunkte. Eine gerade Strecke ist demnach die k ürzeste Verbindung zweier Punkte. Aufgabe 2.29 Wie wir wissen, hat der Ortsvektor im physikalischen Raum die Dimension einer L änge. Der Kurvenparameter habe ebenfalls die Dimension einer Länge. Welche physikalische Dimension ergibt sich daraus für den Tangentenvektor? Welche Dimension hat das Längenelement, und welche ergibt sich für das Integral in (2.60), also für die Größe ' 1 ? für den Abschnitt . Aufgabe 2.30 Man berechne die Länge einer Parabel Wenn dies eine Kurve im physikalischen Raum darstellen soll, welche physikalischen Dimensionen haben dann die Konstante und der Kurvenparameter ? 40 Aufgabe 2.31 Es seien zwei Funktionen und gegeben. Ferner sei eine streng monoton steigende Funktion, und es gelte . Dann beschreiben beide Funktionen und dieselbe Kurve im Raum. Sie unterscheiden sich nur durch die Art und Weise, wie die Kurve parametrisiert wird. Warum ist das so? Man zeige, dass die Länge einer Kurve nicht davon abhängt, welche Parametrisierung man wählt, das heißt das Integral (2.60) liefert in beiden Fällen dasselbe Ergebnis. ( im Intervall . Aufgabe 2.32 Man berechne die Länge der Kurve Welche Beziehung besteht zu dem Ergebnis von Aufgabe 2.30? Wenn dies eine Kurve im physikalischen Raum darstellen soll, welche physikalischen Dimensionen haben dann die Konstanten und ( , sowie der Kurvenparameter ? Aufgabe 2.33 Es seien zwei vektorwertige Funktionen, die von einer reellen Variablen abhängen. Man zeige, dass die Produktregel für die Ableitung auch auf das Skalarprodukt und das Kreuzprodukt anwendbar ist. Es gilt (2.65) Eine Fläche kann durch eine Funktion beschrieben werden, das heißt man : : : Aufgabe 2.34 ordnet jedem Paar von reellen Zahlen , )( einen Punkt , )( zu, mit Ortsvektor ( , )( . Man leite mit einer ähnlichen Überlegung, wie wir sie gerade für eine Kurve durchgeführt haben, die folgende Formel für den Flächeninhalt her ( ( (2.66) Der Integrationsbereich von und ( ist dabei so zu wählen, dass er genau die Fläche abdeckt, deren ( sind die partiellen Ableitungen der OrtsvekInhalt berechnet werden soll. Die Vektoren und ) ( . Welche geometrische Bedeutung haben sie, und welche anschauliche Interpretation torfunktion hat ihr Kreuzprodukt? Winkelfunktionen Zum Abschluss dieses Kapitels wollen wir noch die wichtigsten Winkelfunktionen einführen. Bis jetzt wissen wir nur, was ein rechter Winkel ist. Über das Skalarprodukt kann man aber auch ganz allgemein der Winkel zwischen zwei beliebigen Vektoren definieren. Winkel lassen sich am besten am Kreis einführen. Ein Kreis ist eine Kurve, die in einer Ebene liegt, und die einen konstanten Abstand von einem Mittelpunkt hat. Sei also der Mittelpunkt des Kreises und gleichzeitig der Ursprung des Koordinatensystems. Die Ebene, in der der Kreis liegen soll, werde von 0 und zwei zueinander senkrechten Einheitsvektoren und aufgespannt. Es ist also 0 , : 6. Eine beliebige Kurve in dieser Ebene und ihr Tangentenvektor kann dann wie folgt dargestellt werden, der Kurvenparameter, und und & & (2.67) Hier ist sind zunächst zwei beliebige Funktionen, die nur hinreichend oft differenzierbar sein müssen. Ein Kreis hat die Eigenschaft, dass jeder Punkt auf der Kurve denselben 6 vom Mittelpunkt hat. Das ist genau dann der Fall, wenn Abstand 41 (2.68) replacements (c) (d) (b) (a) Abbildung 2.5: Ein Kreis mit Radius in einer durch zwei orthogonale Einheitsvektoren und aufgespannten Ebene wir durch die Ortsvektordarstellung (2.80) beschrieben (a). Der Kurvenparameter ist der durchlaufene Winkel, und die Umlaufrichtung entspricht der Orientierung der Ebene, wenn ihr Normalenvektor durch gegeben ist. Der Winkel zwischen zwei Vektoren hängt über (2.88) mit den Skalarprodukt, und über (2.91) mit dem Kreuzprodukt zusammen (b). ist. Zusätzlich wollen wir fordern, dass der Kurvenparameter der durchlaufene Winkel ist. Der Winkel eines Kreisbogens ist definiert als das Verhältnis der Bogenlänge zum Radius. Sei also wie oben die Kurvenlänge, gemessen von der Stelle 6 aus. Dann soll sein, und somit . Die Ableitung der Kurvenlänge hängt wiederum über (2.59) mit dem Betrag des Tangentenvektors zusammen. Also lautet die zweite Forderung (2.69) In Abbildung 2.5(a) sind diese Eigenschaften der Kurve noch einmal zusammengefasst. Der Kreis liegt in der von und aufgespannten Ebene, und der Kreisbogen, der zu einem Winkel gehört, hat die Länge . Die Gleichungen (2.68) und (2.69) lassen sich in eine Forderung an die Funktionen und un deren Ableitungen übersetzen. Es muss eins von zwei Paaren von Gleichungen erfüllt sein, und zwar entweder oder & " & (2.70) & & " (2.71) Aufgabe 2.35 Man zeige, dass die Forderungen (2.68) und (2.69) an die Kurve tats ächlich (2.70) oder (2.71) implizieren, wenn man die explizite Darstellung (2.67) einsetzt. Die beiden Alternativen (2.70) und (2.71) unterscheiden sich nur um das Vorzeichen einer der beiden gesuchten Funktionen. Das entspricht einer Umkehrung eines der Vektoren oder , und damit letztlich der Umlaufrichtung des Kreises. Wir können uns daher ohne Beschränkung der Allgemeinheit auf eine Möglichkeit festlegen. Ferner können wir noch eine Anfangsbedingung stellen. Wie in Abbildung 2.5 42 gezeigt, soll die Kreislinie bei 6 an der Stelle 6 folgenden an und zu stellenden Forderungen, & " & beginnen. Insgesamt erhalten wir dann die 6 & 6 6 (2.72) Für 0 sind dies die üblichen Definitionen der Winkelfunktionen Sinus und Kosinus. Sie sind durch die Eigenschaften 3! & " & 1! 3! 6 & 0 6 & 6 (2.73) festgelegt. Man kann sich leicht überlegen, dass die Funktionen und 1! durch diese Forderungen eindeutig bestimmt sind. Es handelt sich nämlich um ein System von Differenzialgleichungen erster Ordnung mit Anfangsbedingungen. Solche Gleichungssysteme sind in der Physik von großer Bedeutung. Wir werden im nächsten Kapitel näher darauf eingehen. Wir können aber hier schon kurz ein Argument dafür angeben, warum die Forderungen (2.73) die Funktionen und 3! eindeutig festlegen. Wir kennen die Funktionswerte an der Stelle 6 , und damit auch die Ableitungen der beiden Funktionen. Wir wissen also, wie sie sich verändern, wenn wir ein wenig erhöhen. Damit kennen wir auch die Funktionswerte “in der Nähe” von 6 . Somit kennen wir auch die Ableitungen dort und können daraus wieder schließen, wie sich die Funktionen verändern, und so weiter. Auf diese Weise können wir uns, anschaulich formuliert, zu immer größeren Werten von vortasten und so die Funktionswerte für jedes finden. Das ist, wie wir im nächsten Kapitel sehen werden, genau die Vorstellung, nach der auch die Bahn eines Körpers im Raum durch dessen Bewegungsgleichung bestimmt wird. Hier haben die Funktionen noch keine derartige unmittelbar physikalische Bedeutung, aber der mathematische Sachverhalt ist der gleiche. Ein System von Differenzialgleichungen mit Anfangsbedingungen legt einen Satz von Funktion eindeutig fest. Wir können aus (2.73) aber noch mehr schließen. Als Beispiel wollen wir zunächst zeigen, dass für alle 3! 0 (2.74) ist. Daraus folgt unter anderem, dass beide Funktionen nur Werte zwischen " 0 und 0 annehmen. Der Beweis nicht schwierig. Setzen wir ; 3! . Dann ergibt sich unmittelbar aus (2.73) 6 & 0 . Ferner gilt für die Ableitung 7 7 3! 1! 7 3! " 7 3! 9 6 und (2.75) 6 . Auch das ist wieder eine Die Funktion erfüllt also die Gleichungen 6 0 Differenzialgleichung mit Anfangsbedingung, deren eindeutige Lösung & 0 ist. Damit haben wir die Formel (2.74) bewiesen. Mit Hilfe eines ähnlichen Argumentes lässt sich sogar zeigen, dass die Funktionen 3! und periodisch sind. Wir nehmen dazu wir an, es gäbe irgendeine kleinste positive Zahl, nennen wir sie , mit 6 . Die Zahl ist also die erste positive Nullstelle der Sinusfunktion. Dann ist wegen (2.74) 1! 0 oder 1! ? " 0 . Aus der Definition (2.73) folgt aber, dass im Intervall 6 überall 6 ist. Denn es ist 6 * 1! 6 / 0 6 , und zwischen 6 und gibt es keine Nullstelle. , und somit muss 1! 3! 6 # 0 Daraus folgt wiederum 3! # " 6 für 6 3! 0 & " . sein. Also ist Wir wissen also, dass & 6 und 3! & " 0 ist. Nun definieren wir die Funktionen 3! & " 3! und & " (2.76) 43 Für sie gelten die gleichen Differenzialgleichungen wie für die Funktionen 3! und . Leiten wir nämlich jeweils beide Seiten dieser Gleichungen nach ab, so finden wir 1! & " 3! & & " & " & " 3! & 3! (2.77) Ferner gelten für die Funktionen 1! und die gleichen Anfangsbedingungen, 3! 6 & " 3! 0 6 & " & 6 (2.78) Also sind es die gleichen Funktionen. Es ist 1! & 1! und & . Und daraus wiederum folgt, dass sie die Winkelfunktionen periodisch sind, " 1! " 3! 3! 7 & 7 & 3! (2.79) Aufgabe 2.36 Man beweise, dass es eine solche Zahl tatsächlich gibt, indem man die Annahme, es sei 6 für alle 6 zu einem Widerspruch führt. Der Wert der Zahl lässt sich nur durch numerische Näherungsverfahren bestimmen. Man findet, wie wir 0 0 7 . Die Periode der Winkelfunktionen ist dann 7 , und natürlich wissen, einen Wert von das ist folglich auch der Winkel eines vollen Kreises. Denn die eindeutige Lösung von (2.72) lautet nun & 3! 3! 8 (2.80) Es ist üblich, bei den Winkelfunktionen die Klammern wegzulassen, wenn das Argument der Funktion nur aus einem Symbol besteht. Die Funkionen 1! und “wirken” immer nur auf das nächstfolgende Zeichen, hier also auf . Aufgabe 2.37 Man beweise 3! %" & 3! 2" " (2.81) und zeige anschließend 3! 0 7 %" Warum folgt daraus, dass ein rechter Winkel den Wert 7 6 7 für (2.82) hat? Aufgabe 2.38 Man leite aus der Definition (2.73) die folgenden Additionstheoreme f ür die Winkelfunktionen her, 3! 3! 1! " 1! = 3! (2.83) Der Beweis kann analog zum Beweis der Formel (2.74) geführt werden, die sich aus dem ersten Additions 6 ergibt. theorem für Aufgabe 2.39 Die Exponentialfunktion 4 Eigenschaft, dass sie mit ihrer Ableitung über 0 ist. Man benutze dies undhatdiedieDefinitionen einstimmt und (2.73) der Winkelfunktionen, um die Formel ; 1! (2.84) zu beweisen, wobei die imaginäre Einheit, also 44 " 0 ist. replacements (a) (b) (c) (d) Abbildung 2.6: Die Winkelfunktionen Sinus und Kosinus sind durch die Differenzialgleichungen mit und an, haben eine Anfangsbedingungen (2.73) eindeutig festgelegt. Sie nehmen Werte zwischen Periode von , kehren jeweils nach einer halben Periode ihr Vorzeichen um, und gehen bei Verschiebung um eine viertel Periode ineinander über. Aufgabe 2.40 Um die Funktionen und 1! numerisch zu berechnen, entwickelt man sie in eine Potenzreihe, 3! (2.85) Man zeige, dass sich aus den Forderungen (2.73) Rekursionsformeln f ür die Koeffizienten Reihen ergeben, und dass diese dadurch eindeutig bestimmt sind. Man bestimme sie. und dieser Aufgabe 2.41 In der Praxis werden Winkel in Grad angegeben. Daraus k önnte man schließen, dass der Winkel eine physikalische Größe mit Einheit ist, also eine dimensionsbehaftete Größe. Warum ist dieser Schluss falsch? Warum gibt es, laut unserer Definition, keine physikalische Gr ößenart “Winkel”? In welchem Sinne ist daher die “Einheit” Grad zu verstehen? Winkel und Skalarprodukt Schließlich können wir noch eine ganz allgemeine Beziehung zwischen dem Winkel zwischen zwei Vektoren und dem Skalarprodukt herleiten. Wir betrachten noch einem die durch (2.80) dargestellte Kreiskurve. Der Einfachheit halber setzen wir 0 . Dann handelt es sich um einen Einheitskreis, und die Vektoren sind Einheitsvektoren. Bilden wir das Skalarprodukt von den Vektoren und , so finden wir : 1! : 3! 3! 1! 3! " (2.86) Hier haben wir das Additionstheorem (2.83) sowie die Eigenschaft (2.81) des Sinus benutzt. Nun ist " gerade der Winkel zwischen den Vektoren und . Wir schließen daraus, dass das Skalarprodukt zweier Einheitsvektoren durch den Kosinus des von ihnen gebildeten Winkels gegeben ist. 45 Das ist deshalb der Fall, weil wir immer eine Ebene finden können, und in diese Ebene einen Einheitskreis legen können, so dass die beiden Vektoren auf diese Weise dargestellt werden können. Das können wir leicht verallgemeinern. Es seien und irgendwelche zwei Vektoren. Dann existiert immer eine Ebene, die die beiden Vektoren enthält. Wenn die Vektoren linear unabhängig sind, also in verschiedene Richtungen zeigen, dann ist die Lage dieser Ebene eindeutig bestimmt. Ansonsten sind die Vektoren zueinander proportional. Dann wählen wir einfach irgendeine Ebene aus, die von den beiden Vektoren aufgespannte Gerade enthält. In dieser, in Abbildung 2.5(b) dargestellten Ebene können wir den Winkel zwischen den beiden Vektoren messen, den wir mit < bezeichnen. Dieser Winkel hängt natürlich nicht von dem Betrag der Vektoren ab, sondern nur von deren Richtungen. Folglich können wir genauso gut den Winkel zwischen den Einheitsvektoren und bestimmen. Für diesen Winkel gilt, wie wir gerade gesehen haben, dass sein Kosinus durch das Skalarprodukt der beiden Vektoren gegeben ist. Folglich ist 3! 5 oder Winkel zwischen Vektoren ;: : 5: (2.87) 3! 5 (2.88) Damit haben wir eine allgemeine Beziehung zwischen dem Skalarprodukt und einem Winkel hergeleitet. Das Skalarprodukt von zwei Vektoren ist das Produkt ihrer Beträge mit den Kosinus des eingeschossenen Winkels. Bei der Winkelmessung tritt jedoch ein Problem auf. Wir können ihn in zwei Richtungen messen. Wenn wir wie in Abbildung 2.5(b) messen, bekommen wir einen Winkel 5% . Wenn wir dagegen in 7 die andere Richtung messen, ergibt sich der Wert " . Für die Beziehung (2.88) zwischen Winkel und & 1! . Skalarprodukt ist das unerheblich, denn es gilt 3! 7 " Um den Winkel 5% 1 zwischen zwei von Null verschiedenen Vektoren eindeutig festzulegen, können wir uns aber darauf einigen, ihn immer auf dem kürzesten Weg zu messen. Der Wertebereich des Winkels ist dann 6 5% (2.89) Das ist genau der maximale Bereich, auf dem die Kosinusfunktion in Abbildung 2.6 eindeutig umkehrbar ist. Durch die Beziehung (2.88) wird daher für jedes Paar von Vektoren ! eindeutig ein Winkel 5 definiert. Er ist genau dann gleich Null, wenn die Vektoren in die gleiche Richtung zeigen, er ist gleich , wenn sie in entgegengesetzte Richtungen zeigen, und nimmt sonst Werte dazwischen an. Aufgabe 2.42 Welche Rolle spielt die Schwarzsche Ungleichung (1.17) bei dieser Definition des Winkels 5 ? Schließlich können wir auch Winkel im Raum einführen. Sind drei paarweise verschiedene Punkte, so ist der Innenwinkel des Dreiecks im Punkt durch 5 5 gegeben, also durch den Winkel zwischen den beiden Vektoren, die von nach bzw. zeigen. Da der Innenwinkel in einem Dreieck ebenfalls nur Werte zwischen 6 und annehmen kann, ist er eindeutig durch die Gleichung Winkel 3! < : (2.90) im Raum festgelegt. Diese Definition ist noch einmal in Abbildung 2.7(a) dargestellt. 46 (a) (b) in einem Dreieck ist durch den Winkel zwischen den Vektoren Abbildung 2.7: Der Winkel die üblichen Bezeichnungen für die und definiert (a). Führt man in einem allgemeinen Dreieck Seitenlängen und Winkel ein, so gelten die bekannten Sätze der Euklidischen Geometrie (b). Aufgabe 2.43 Man zeige, dass der Betrag des Kreuzproduktes ebenfalls durch die Betr äge der Vektoren und den Winkel zwischen ihnen ausgedrückt werden kann, 5% (2.91) Das ist natürlich auch eine bekannte Formel für den Flächeninhalt eines Parallelogramms. Aufgabe 2.44 Es sei das in Abbildung 2.7(b) dargestellte Dreieck. Wir verwenden die üblichen Bezeichnungen für die Seitenlängen und die Winkel < Man beweise den Kosinussatz, 7& 3! den Sinussatz, sowie den Satz über die Winkelsumme, < 7 3! 5 (2.92) 7 3! (2.93) (2.94) (2.95) (2.96) Aufgabe 2.45 Der Winkel zwischen zwei sich schneidenden Ebenen ist durch den Winkel zwischen ihren Normalenvektoren gegeben. Man berechne der Winkel, unter dem sich je zwei Seitenfl ächen des gleichseitigen Tetraeders in Abbildung 2.3(b) schneiden. Messgrößen und Axiome Zum Schluss wollen wir noch einmal die Diskussion aufgreifen, die wir am Ende des letzten Kapitels über Messgrößen und Messvorschriften geführt haben. Durch eine Messvorschrift wird eine in der Theorie zunächst als abstraktes mathematisches Objekt eingeführte Größe mit der Skala eines Messgerätes identifiziert. Als eine solche Messgröße hatten wir bereits den Abstand zweier Orte definiert. Wir können 47 PSfrag replacements (a) (b) (c) (d) Abbildung 2.8: Ausschnitt aus dem Netz von Dreiecken, die von Gauß um 1820 vermessen wurden. Eine Abweichung der Winkelsumme von konnte auch bei sehr großen Dreiecken nicht gefunden werden. nun entsprechende Messvorschriften für die neuen Größen Fläche, Volumen, Kurvenlänge und Winkel einführen. Zur Messung der Kurvenlänge können wir dasselbe Maßband verwenden, das wir auch schon zur Definition der Messgröße Abstand benutzt haben. Wir müssen es nur, statt es zu spannen ,entlang der gegebene Kurve auslegen. Das ist deshalb möglich, weil beide Größen dieselbe physikalische Dimension haben, nämlich die einer Länge. Andere Größenarten können wir mit einem Maßband jedoch nicht messen. Um Flächen, Volumen und Winkel zu messen, müssen wir uns andere Messgeräte ausdenken. Winkel sind in diesem Zusammenhang von besonderem Interesse, denn eine der experimentell am einfachsten zu testenden Aussagen der Euklidischen Geometrie ist der Winkelsummensatz (2.96). Während alle anderen Sätze über Dreiecke immer auch auf deren Seitenlängen Bezug nehmen, genügt für die Überprüfung des Winkelsummensatzes allein die Messung von drei Winkeln. Das hat den Vorteil, dass man relativ einfach sehr große Dreiecke vermessen kann, wenn es gelingt, ein Messgerät für einen Winkel zu konstruieren, das “lokal” arbeitet, sich also ganz an einem der drei Ecken des Dreiecks befindet. Ein solches Messgerät ist ein Sextant. Ein Sextant besteht im wesentlichen aus zwei Spiegeln, mit deren Hilfe man zwei aus unterschiedlichen Richtungen einfallende Bilder übereinander projizieren kann. Aus der Stellung der Spiegel lässt sich der Winkel zwischen den Einfallsrichtungen ablesen. Stellt man den Sextanten an einem Ort auf und peilt zwei andere Orte und an, so misst man mit ihm den Winkel 5 . Von der Antike bis zu den ersten Satellitenbildern beruhte fast die gesamte Landvermessung auf der Vermessung von Dreiecken mit dieser Technik. Dass man solche Messungen auch als Test der Euklidischen Geometrie benutzen kann, als allerdings eine relative neue Erkenntnis. Das lag im wesentlichen daran, dass die Euklidische Geometrie, wie bereits erwähnt, lange Zeit als reine Mathematik betrachtet wurde. Die Erkenntnis, das die der Raum auch eine andere Struktur haben könnte, geht auf einige Mathematiker am Anfang des 19. Jahrhunderts zurück, darunter vor allem Gauß und Riemann, der die schon erwähnte Riemannsche Geometrie entwickelt hat. Gauß hat unter anderem auch ein Projekt zur Landvermessung in Norddeutschland geleitet. Er hat die Ergebnisse, gewissermaßen als Nebenprodukt, zum Test der Euklidischen Geometrie verwendet. Konkret handelt sich sich dabei um die Bestimmung der Winkelsumme einiger sehr großer Dreieck, darunter das mit Kantenlängen von 6 , 7 und 0 6 Kilometern bekannteste Gaußsche Dreieck, dessen Eckpunkte die Berge Brocken, Inselberg und Hoher Hagen bildeten. Natürlich hat er, im Rahmen der damals verfügbaren Messgenauigkeit, keine Abweichung vom Winkelsummensatz gefunden. Darauf kommt es uns aber im Moment nicht an. Wir wollen vielmehr eine andere Frage diskutieren. 48 Nehmen wir an, jemand hätte Gauß bei seinen Messungen gefragt, ob das, was er dort messe, denn über haupt der Winkel 5 in einem Dreieck sei. Mit anderen Worten, wenn er eine Abweichung vom Winkelsummensatz finden würde, würde das nicht vielmehr darauf hindeuten, dass es etwas ganz anderes gemessen hat als den Winkel? Ganz konkret könnte man einwenden, dass er ja nicht wirklich den Winkel in einem Dreieck gemessen hätte, sondern den Winkel zwischen zwei Lichtstrahlen in einer Ecke des Dreiecks. Müssten wir demzufolge nicht erst einmal die Ausbreitung von Licht im Raum verstehen, um überhaupt sagen zu können, was wir mit einem Sextanten messen? Ähnliches trifft auf die Längenmessung zu. Müssten wir nicht erst einmal verstehen, woraus ein Maßband besteht, und wie es ich verhält, wenn wir es entlang einer Kurve auslegen, ob es dadurch nicht vielleicht seine eigene Länge verändern kann, um sagen zu können, ob durch diese Messung wirklich die Länge der Kurve festgestellt wird? Das klingt alles sehr vernünftig, geht aber an der Sache, also an der Frage, was eine physikalische Theorie ist und wie man sie überprüfen kann, vorbei. Wir erinnern uns, dass die Angabe einer Messvorschrift ein Teil der Definition einer Theorie ist, genau wie die mathematischen Axiome einer Theorie, die die grundlegenden mathematischen Begriffe und Strukturen definieren. Die Messvorschriften sind gewissermaßen die physikalischen Axiome einer Theorie. Eine Axiom allein, also eine Definition, kann aber nicht falsch sein. Wir können es auch nicht testen, indem wir irgendwelche Experimente machen. ist. Wir können nicht feststellen, ob das, was wir am Sextanten ablesen, wirklich die Größe < Wir können nur drei solche Messungen in einem Dreieck machen und feststellen, ob die Summe der Messergebnisse beträgt oder nicht. Wenn das nicht der Fall ist, ist es völlig sinnlos zu fragen, woran das liegt. Liegt es daran, dass der Winkelsummensatz falsch ist, oder daran, dass das, was der Sextant misst, gar nicht der Winkel ist? Ersteres würde in logischer Konsequenz bedeuten, dass eines der mathematischen Axiome falsch wäre, letzteres dagegen, dass eines der physikalischen Axiome der Theorie falsch wäre. Beides ist für sich genommen aber unsinnig. Nur die Theorie als ganzes kann richtig oder falsch sein. Wenn etwas nicht stimmt, ist es nicht möglich, zu entscheiden, ob der Fehler auf einem “falschen” mathematischen oder einem “falschen” physikalischen Axiom beruht. Um eine physikalische Theorie zu verstehen, ist es deshalb ganz wichtig, sich klar zu machen, dass ein physikalischen Axiom, also eine Messvorschrift, innerhalb der Theorie die gleiche logische Stellung hat wie ein mathematisches Axiom. Es wäre sinnlos, dieses als einzelnes zu hinterfragen oder zu versuchen, es auf seine Richtigkeit zu prüfen. Ein berühmtes Zitat von Einstein bringt diesen Sachverhalt sehr gut auf den Punkt. Die Theorie bestimmt, was wir beobachten. Die Betonung liegt hier auf “was”. Es geht nicht nur darum, dass die Theorie, so wie wir dies bereits im letzten Kapitel gezeigt haben, Aussagen über konkrete Messergebnisse macht, also Aussagen darüber, was im Sinne von welches Messergebnis wir finden. Die Theorie ist es auch, die uns sagt, als was wir eine Größe, die wir messen, zu interpretieren haben, zum Beispiel als Winkel im Dreieck, als Abstand zwischen zwei Punkten, als Kurvenlänge oder was auch immer. Sie tut dies, indem sie als Teil ihrer Definition bestimmte mathematische Größen mit Messinstrumenten identifiziert. Es wäre sinnlos, im Rahmen einer Theorie verstehen wollen, warum dieses oder jenes Messgerät diese oder jene Größe misst. Im Rahmen der Euklidischen Geometrie, so wie wir sie hier eingeführt haben, wird die Messgröße Winkel durch das Messinstrument Sextant definiert. Wir können nicht verstehen, warum ein Sextant einen Winkel misst. Wir postulieren es einfach. Genauso wenig können wir verstehen, warum das Skalarprodukt symmetrisch ist. Es ist einfach ein Teil der Definition des Begriffes “Skalarprodukt”, so die der Sextant ein Teil der Definition des Begriffes “Winkel” ist. Dass wir letztlich doch irgendwie verstehen können, warum ein Sextant einen Winkel misst, liegt daran, dass es natürlich Theorien gibt, die über die reine Geometrie des Raumes hinaus gehen. Im Rahmen einer umfassenderen Theorie können wir dann sehr wohl verstehen, wie ein Sextant funktioniert. Bei der obigen 49 Erklärung der Funktionsweise eine Sextanten haben wir eine solche, umfassendere Theorie benutzt, ohne dies explizit zu sagen. Wir haben die elementaren Begriffe und Aussagen der Strahlenoptik benutzt. Die Strahlenoptik besagt im wesentlichen, dass sich Licht auf Geraden im Raum ausbreitet, wobei die Geraden genau die Objekte sind, die wir am Anfang dieses Kapitels eingeführt haben. Und sie besagt, dass sich Licht an Spiegeln so verhält, wie wir dies eben aus dem Alltag kennen, nach den bekannten Reflexionsgesetzen. Im Rahmen der Strahlenoptik verstehen wir die Funktionsweise eines Sextanten, und wir verstehen auch, warum sich zwei Lichtstrahlen, die von der Orten und kommen, am Ort unter dem Winkel 5 schneiden. Aber wird dadurch das Problem gelöst, dass es immer die Theorie ist, die bestimmt, was wir eigentlich beobachten? Nein, denn es wird nur verschoben. Wir verstehen zwar jetzt, wie ein Sextant funktioniert, aber wir verstehen immer noch nicht, wie ein Spiegel funktioniert. Ein Spiegel ist in der Strahlenoptik durch ein physikalisches Axiom definiert, genau wie ein Sextant in der Euklidischen Geometrie. Es wäre unsinnig, im Rahmen der Strahlenoptik verstehen zu wollen, warum sich Licht an einem Spiegel den Reflexionsgesetzen gemäß verhält. Das ist nämlich das Axiom, das einen Spiegel definiert. Verstehen können wir die Funktion eines Spiegels erst im Rahmen einer noch umfassenderen Theorie, nämlich der Wellenoptik oder der Elektrodynamik. Natürlich wollen wir hier nicht weiter auf diese Theorien eingehen, denn wir stehen ja erst ganz am Anfang des physikalischen Theoriengebäudes. Um alle diese Theorien zu verstehen, ist es aber wichtig, auch die Grenzen einer Theorie zu erkennen, und sich stets darüber im klaren zu sein, dass letztlich jede Theorie auf physikalischen Axiomen aufbaut, die wir nicht innerhalb der jeweiligen Theorie verstehen oder erklären können. Es war sogar gerade diese Einsicht, die die Entwicklung vieler moderner Theorien erst ermöglicht hat. Was Zeit wirklich ist, verstehen wir zum Beispiel erst, seit Einstein festgestellt hat, dass es sich dabei um eine physikalische Größe wie jede andere handelt, die mit einem Messinstrument assoziiert ist, das wir Uhr nennen, und zwar genau so wie Abstand eine Messgröße ist, die mit einem Maßband als Messinstrument assoziiert ist. Aber darauf werden wir im nächsten Kapitel gleich noch näher eingehen. Aufgabe 2.46 Wieviel ist ein Nachdruck der in Abbildung 2.8 gezeigten, von Gauß vermessenen Dreiecke zusammen mit anderen auf ihn zurückgehenden mathematischen Darstellungen heute in etwa wert? Aufgabe 2.47 Mit einem Maßband als Messgerät können wir, das hatten wir schon festgestellt, nicht den Abstand von hier zum Mond messen. Können wir diesen Abstand überhaupt irgendwie messen? Und wenn nicht, warum kennen wir ihn trotzdem? Kennen wir ihn eigentlich wirklich? Wie verh ält es sich mit dem Abstand von hier zum Sirius? Oder mit dem Abstand des Sirius vom Andromeda-Nebel? 3 Klassische Mechanik Die klassische Mechanik beschreibt die Bewegungen von Körpern im Raum. Sie wurde im wesentlichen von Newton formuliert und wird deswegen auch als Newtonsche Mechanik bezeichnet. Ihre Grundbegriffe wollen wir in diesem Kapitel einführen. Genau genommen handelt es sich bei der klassischen Mechanik gar nicht um eine physikalische Theorie im eigentlichen Sinne, sondern eher um ein Gerüst, oder ein allgemeines Schema zur Konstruktion einer Theorie. Zu einer physikalischen Theorie wird die klassische Mechanik erst, wenn man für ein spezielles mechanisches System zusätzliche Aussagen über die Art der beteiligten Körper und deren Beziehungen zueinander macht. Trotzdem bietet die klassische Mechanik ein sehr nützliches und vor allem sehr allgemeines Rezept zur Formulierung solcher Theorien, weil man letztlich nur sehr wenige Parameter an das jeweilige System anpassen muss, um eine fertige Theorie zu bekommen. 50 Zunächst werden wir uns nur mit sehr einfachen Systemen befassen und daran die Grundbegriffe der Mechanik erklären. Die einfachsten mechanischen Systeme bestehen aus Punktteilchen, also Körpern, die keine oder eine vernachlässigbar kleine räumliche Ausdehnung haben. Später werden wir zeigen, wie wir daraus Beschreibungen von komplexeren Systeme ableiten können, zum Beispiel von starren Körpern oder Flüssigkeiten, ohne die grundlegenden Konzepte neu überdenken zu müssen. Die klassische Mechanik mit den aus ihr abgeleiteten Theorien deckt, zusammen mit der klassischen Elektrodynamik, fast den gesamten “alltäglichen” Bereich der Physik ab. Das ist in etwa alles, was sich in uns unmittelbar zugänglichen, “irdischen” Größenordnungen abspielt. Ihre Grenzen findet die klassische Mechanik bei sehr kleinen Strukturen in atomaren Größenordnungen, wo nur noch die Quantenmechanik eine richtige Beschreibung liefert, und in Größenordnungen, bei denen die Beschreibung des Raumes durch die Euklidische Geometrie versagt. Letzteres hatten wir in den ersten beiden Kapitel bereits kurz angesprochen. Um die Struktur des Raumes, und übrigens auch die der Zeit, sehr genau und auf Größenordnungen, die über die Abmessungen unseres Sonnensystems hinaus gehen, richtig zu beschreiben, müssen wir die Relativitätstheorie verwenden. Der Gültigkeitsbereich der klassischen Mechanik ist also nach oben und unten begrenzt, umfasst aber ein sehr weites Gebiet, insbesondere fast den gesamten Bereich der technischen Anwendungen der Physik. Zeit und Uhr Bis jetzt haben wir nur den Raum selbst im Rahmen einer physikalischen Theorie beschrieben. Nun wollen wir Vorgänge beschreiben, die in diesem Raum stattfinden. Dazu müssen wir die Zeit als eine neue physikalische Größe einführen. Sie wird durch ein Messgerät definiert, das wir Uhr nennen. Eine Uhr ist ein Gerät, in dem ein periodischer Vorgang abläuft, zum Beispiel eine Pendelbewegung, das Schwingen eines Kristalls oder der Umlauf eines Planeten um einen Stern. Ein auf der Uhr angebrachtes Zählwerk zeigt an, wie viele dieser Vorgänge bereits abgelaufen sind. Die Messgröße, die auf dieser Skala angezeigt wird, nennen wir “Zeit”. Die Zeit ist das, was eine Uhr anzeigt. Auch hier gilt, was wir gerade über Messgrößen wie Längen und Winkel gesagt haben. Es ist an dieser Stelle nicht sinnvoll, danach zu fragen, was Zeit “wirklich” ist. Es handelt sich um eine Definition, gewissermaßen das erste physikalische Axiom der klassischen Mechanik. Es gilt in dieser Form sogar für alle modernen physikalischen Theorien, einschließlich der Relativitätstheorie und der Quantenphysik. Dass sich hinter dem Begriff “Zeit” nicht mehr verbirgt als die Anzeige einer Uhr, ist auf den ersten Blick vielleicht etwas befremdlich. Es entspricht auch gar nicht der ursprünglichen Vorstellung, die Newton von der Zeit hatte, als er die klassische Mechanik entwickelte. Die ursprüngliche Vorstellung von Raum und Zeit in der klassischen Physik war, dass beide Strukturen unabhängig von irgendwelchen Messinstrumenten existieren. Ein Ort im Raum wird nicht erst dadurch zu einem Ort, dass er mit einem Gegenstand markiert wird, und die Zeit läuft auch nicht deshalb ab, weil sie von einer Uhr gemessen wird. Raum und Zeit existierten in Newtons Vorstellung als absolute Strukturen unabhängig von unseren Beobachtungen und Experimenten. Dass diese Vorstellung falsch war, wissen wir seit Einstein die Relativitätstheorie formuliert hat und diese auch experimentell bestätigt wurde. Es erfordert daher ein völliges Umdenken, den Übergang von der klassischen zur modernen, relativistischen Physik zu vollziehen, wenn man zuvor die klassische Physik auf einem absoluten Raum- und Zeitbegriff aufgebaut hat. Das wollen wir vermeiden. Auch die klassische Mechanik lässt sich ohne den Begriff des absoluten Raumes und der absoluten Zeit formulieren. So, wie wir in den letzten beiden Kapiteln die Struktur des Raumes allein durch Messgrößen und ihre Zuordnung zu mathematischen Strukturen beschrieben haben, können wir nun auch die Zeit als eine Messgröße beschreiben. 51 Da eine Uhr die Zeit auf einer Skala anzeigt, ist die Zeit eine skalare, also ungerichtete Größe. Die klassischen Physik nimmt an, dass die Zeit eine kontinuierliche Größe ist, also durch eine reelle Zahl dargestellt wird. Sie wird in der Regel mit bezeichnet. Da sie nichts mit Längen, Flächen oder Winkeln zu tun hat, handelt es sich um eine neue Größenart. Wir müssen folglich auch eine neue Einheit einführen, um die Zeit zu messen. Die gebräuchliche Einheit heißt Sekunde (s), 0 s (3.1) Sie wird durch eine genau definierte Standard-Uhr festgelegt. Ursprünglich war diese Standarduhr die 6 6 ste Teil eines mittleren Sonnentages definiert, also rotierende Erde. Eine Sekunde wurde als der durch den periodischen Vorgang des Sonnenauf- und -untergangs. Die Erdrotation ist jedoch nicht ganz gleichmäßig. Die Gezeiten führen zum Beispiel dazu, dass die so definierte “Erduhr” innerhalb von tausend Jahren um einige Stunden nach geht. Heute definiert man die Sekunde, ähnlich wie das Meter, durch einen im Mikrokosmos ablaufenden periodischen Vorgang, nämlich die Schwingung eines Cäsium-Atoms. Wir können uns vorstellen, dass ein Atom spezielle Eigenschwingungen ausführt, und dass man diese Schwingungen mit einem geeigneten Messgerät zählen kann. Auf diese Weise arbeitet eine Atomuhr. Für die theoretische Physik ist das jedoch nicht weiter interessant. Entscheidend ist allein, dass durch die Zeit eine neue Größenart, also eine neue physikalische Dimension definiert wird. Aufgabe 3.1 Uhren, die über einen langen Zeitraum hinweg genau genug arbeiten, um damit die Abweichung der Erdrotation von einer exakt periodischen Bewegung zu messen, gibt es erst seit wenigen Jahrzehnten. Warum lässt sich trotzdem die Rotationsbewegung der Erde über die letzten etwa drei- bis viertausend Jahre hinweg mit einer sehr großen Genauigkeit rekonstruieren? Dynamische Systeme Mit Hilfe der Zeit als Messgröße lassen sich andere Vorgänge beschreiben. Das allgemeine Konzept, das einer solchen Beschreibung zu Grunde liegt, ist das eines dynamischen Systems. Ein dynamisches System besteht aus einer Menge von physikalischen Objekten, die verschiedene Zust ände annehmen können. Die Objekte können Gegenstände im Raum, Elektronen in einem Atom, Planeten im Sonnensystem, elektrische Schaltungen, Lichtstrahlen in einem Glasfaserkabel, oder was auch immer sein. Der Zustand eines dynamischen Systems beschreibt die momentane Konfiguration dieser Objekte. Wie genau diese Beschreibung aussieht, hängt natürlich von der Art des jeweiligen Systems ab. Das Konzept eines dynamischen Systems ist sehr allgemein und lässt sich auf fast alle Bereiche der Physik anwenden. Bei einem mechanischen Systems wird der Zustand, wie wir gleich sehen werden, durch die Orte und Geschwindigkeiten aller beteiligten Körper festgelegt. Einem dynamischen System können wir einen Zustandsraum zuordnen. Das ist die Menge aller möglichen Zustände, die das System annehmen kann. Jedem Zustand entspricht genau ein Element 9 des Zustandsraumes. Um festzustellen, in welchem Zustand sich das System gerade befindet, müssen wir eine oder mehrere Messungen an dem System vornehmen. Auf diese Weise können wir den Zustand bestimmen, oder zumindest gewisse Information über ihn erlangen, etwa dass er in einer bestimmten Teilmenge von liegt. Die wesentliche Eigenschaft eines dynamischen Systems ist, dass es seinen Zustand mit der Zeit verändert. Dieser Vorgang wird durch eine Funktion beschrieben, die zu jeder Zeit angibt, in welchem Zustand + sich das System gerade befindet. Indem wir zu verschiedenen Zeiten Messungen am System vornehmen und gleichzeitig eine Uhr ablesen, können wir einzelne Funktionswerte + + bestimmen, wobei 3 die an der Uhr abgelesenen Zeiten sind. Im Idealfall kann es sogar möglich sein, das System über einen gewissen Zeitraum hinweg quasi kontinuierlich zu beobachten, so dass man danach die Funktion + für ein bestimmtes Zeitintervall kennt. 52 Eine physikalische Theorie über ein dynamisches System besteht im wesentlichen aus zwei Teilen. Zunächst macht sie ein Aussage über die mathematische Struktur des Zustandsraumes. In den meisten, aber nicht in allen Beispielen, die wir in diesem und den folgenden Kapiteln diskutieren werden, wird dies ein affiner Raum oder sogar ein Vektorraum sein. So wird eine Abbildung der gegebenen physikalischen Struktur auf eine mathematische Struktur hergestellt. Darüber hinaus macht eine physikalische Theorie Aussagen darüber, wie sich der Zustand mit der Zeit entwickelt. Deshalb können wir mit Hilfe der Theorie Vorhersagen über das zukünftige Verhalten eines dynamischen Systems machen. Konkret sieht das so aus, dass eine Theorie eine Zeitentwicklungsgleichung oder Bewegungsgleichung postuliert. Eine Bewegungsgleichung ist eine Differenzialgleichung, die uns sagt, wie sich das System mit der Zeit verändert, wenn es sich zu einer Zeit in einem Zustand + befindet. Es ist üblich, die Ableitung einer Funktion nach der Zeit mit einem Punkt statt mit einem Strich zu bezeichnen. Die Bewegungsgleichung liefert also die Zeitableitung des Zustandes als Funktion des Zustandes + und eventuell der Zeit , Bewegungsgleichung (3.2) Wie diese Bewegungsgleichung explizit aussieht, hängt wieder vom jeweiligen System ab, und natürlich von der mathematischen Struktur des Zustandsraumes. Nehmen wir an, der Zustand eines Systems würde durch skalare Größen festgelegt. Das Symbol steht dann als Abkürzung für einen Satz von reellen Zahlen, sagen wir mit 0 3 . Entsprechend wird die Zeitentwicklung des Systems durch einen Satz von reellen Funktionen beschrieben, und die Bewegungsgleichung (3.2) hat die Form 33 (3.3) Das ist ein gekoppeltes System von Differenzialgleichungen erster Ordnung. Die Ableitungen der Funktionen hängen von den Funktionen selbst und der Variablen ab. Ein Beispiel für ein solches System von Differenzialgleichungen hatten wir in einem ganz anderen Zusammenhang schon einmal benutzt, um die Winkelfunktionen zu definieren. Wir wollen annehmen, dass die Funktionen , die jeweils von 0 Variablen abhängen, stetig und differenzierbar sind. Nach dem Satz von Cauchy, Picard und Lindel öf besitzt das System von Differenzialgleichungen (3.3) dann genau eine Lösung, wenn wir zusätzlich eine Anfangsbedingung vorgeben. Eine Anfangsbedingung legt den Zustand des Systems zu irgendeiner Zeit fest, also die Funktionswerte # . Mit anderen Worten, wenn wir den Zustand + < des Systems zu irgendeiner Zeit kennen, dann liefert die Bewegungsgleichung eine eindeutige Funktion + , das heißt wir können den Zustand zu jeder anderen Zeit berechnen. Die Zeitentwicklung eines dynamischen Systems ist eindeutig durch die Bewegungsgleichung und den Anfangszustand bestimmt. Der andere Zeitpunkt kann in der Zukunft oder in der Vergangenheit liegen. Wir können sowohl die zukünftige Entwicklung des Systems vorhersagen, als auch die vergangene Entwicklung rekonstruieren. Natürlich nur unter der Annahme, dass die Theorie richtig ist, dass also die Bewegungsgleichung das Verhalten des dynamischen Systems richtig beschreibt. Das müssen wir zuerst durch Experimente überprüfen. Um eine theoretische Beschreibung eines dynamischen Systems zu testen, müssen wir es über einen gewissen Zeitraum hinweg beobachten und feststellen, ob seine Zeitentwicklung tatsächlich durch die gegebene Bewegungsgleichung beschrieben wird. Ein dynamisches System mit der Eigenschaft, dass seine gesamte vergangene und zukünftige Entwicklung festliegt, sobald der Zustand zu irgendeinem gegebenen Zeitpunkt bekannt ist, nennt man auch ein ein deterministisches System. Die Vorstellung der klassischen Mechanik ist, dass die ganze Welt ein solches deterministisches System ist. Unsere Aufgabe wird im folgenden sein, kleine Teile aus dieser Welt 53 herauszugreifen, die sich in einer gewissen Näherung unabhängig von Rest der Welt beschreiben lassen, und deren Verhalten zu berechnen, also ihre Bewegungsgleichungen zu lösen. Aufgabe 3.2 Die Zeit werde durch eine Uhr definiert. Wir stellen neben diese Uhr eine zweite Uhr, und betrachten diese als dynamisches System. Der Zustand der zweiten Uhr werde durch eine Funktion * beschrieben, die angibt, welche Zeit die zweite Uhr anzeigt, wenn die erste Uhr die Zeit anzeigt. Wie lautet die Bewegungsgleichung für die Funktion ; ? Nehmen wir an, die zweite Uhr sei defekt und gehe innerhalb eines Tages um eine Stunde nach. Wie lautet dann die Bewegungsgleichung f ür die Funktion ; ? Das Punktteilchen Was ein dynamisches System ist und wie es konkret beschrieben werden kann, lässt sich am besten an einem einfachen Beispiel erläutern. Das einfachste dynamische System, das die klassische Mechanik kennt, ist das Punktteilchen. Ein Punktteilchen, oft auch einfach Teilchen genannt, ist die idealisierte Vorstellung von einem Körper, der so klein ist, dass wir seine Ausdehnung um Vergleich zu den Abmessungen des Raumes, in dem er sich bewegt, vernachlässigen können. Innerhalb einer gewissen Näherung können wir dann so tun, als befände sich der gesamte Körper in einem Punkt des Raumes. Was “klein” in diesem Zusammenhang bedeutet, hängt von der jeweiligen Fragestellung ab. Wenn wir die Bewegung eines Elektrons in einer Bildröhre beschreiben wollen, können wir das Elektron in diesem Sinne als klein ansehen. Falls es überhaupt eines Ausdehnung hat, so ist diese sehr klein im Vergleich zu den Abmessungen der Bildröhre. Vielleicht ist ein Elektron sogar wirklich punktförmig. Auf jedem Fall ist es so klein, dass die klassische Mechanik ohnehin versagt, wenn wir versuchen, seine innere Struktur und damit seine räumliche Ausdehnung zu beschreiben. Wir müssten statt dessen die Quantenmechanik verwenden. Es wäre daher völlig sinnlos, ein Elektron als ausgedehntes Objekt zu betrachten, wenn wir seine Bewegungen gleichzeitig mit Hilfe der klassischen Mechanik beschreiben würden. Denn die klassische Mechanik ist letztlich nur eine Näherung der Quantenmechanik. Sie gilt nur für Systeme von einer gewissen Größenordnung an aufwärts, etwa im Bereich von einigen Nano- oder Mikrometern oder darüber. Da das Elektron sicher sehr viel kleiner als ein Nanometer ist, kann es im Rahmen der klassischen Mechanik als punktförmiges Teilchen betrachtet werden. Das Beispiel soll klar machen, dass die Vorstellung von einem punktförmigen Körper zwar auf den ersten Blick etwas realitätsfern erscheint. Sie ist aber nicht mehr als eine N äherung, wie wir sie in jeder praktischen Anwendung einer Theorie ohnehin durchführen müssen. Ob wir jemals zu einer wirklich fundamentalen Theorie kommen werden, ist eine offene Frage. Solange wir eine solche Theorie nicht haben, ist jede Theorie nur eine Näherung einer genaueren, vielleicht umfassenderen Theorie. Es wäre deshalb sinnlos, auf eine Näherung innerhalb einer Theorie zu verzichten, wenn man zuvor schon allein durch die Anwendung dieser Theorie eine Näherung durchgeführt hat, die zu einem wesentlichen größeren Fehler führt. Der Fehler, den wir machen, wenn wir ein Elektron mit Hilfe der klassischen Mechanik anstelle der Quantenmechanik beschreiben, ist bereits viel größer als der, den wir machen, wenn wir eine mögliche räumliche Ausdehnung des Elektrons vernachlässigen. Ob dieser Fehler immer noch klein genug ist, um die Bewegung des Elektrons in der Bildröhre wenigstens annähernd richtig zu beschreiben, ist eine ganz andere Frage. Um sie zu beantworten, müssen wir die Bewegung erst einmal konkret berechnen und das Ergebnis dann mit der Realität vergleichen. Genau mit dieser Art von Aufgaben werden wir uns in den folgenden Kapiteln ausführlich beschäftigen. Ein anderes Beispiel für einen Körper, den wir als punktförmig ansehen können, ist ein Himmelsk örper, dessen Bahn wir beschreiben wollen. Fast alle Himmelskörper sind sehr klein im Vergleich zu den räumlichen Gebieten, in denen sie sich bewegen, und im Vergleich zu den Entfernungen zwischen ihnen. Die 54 Planeten und ihre Monde sind sehr klein im Vergleich zu den Abmessungen des Sonnensystems. Wenn es nur darum geht, die Bahnen der Planeten und Monde zu beschreiben, können wir sie als punktförmig betrachten. Die Erde ist in diesem Sinne ein Punktteilchen. Das gleiche gilt für die Sterne in einer Galaxie. Die Himmelsmechanik ist im wesentlichen eine Mechanik von Punktteilchen. Auch hier gilt, was wir zuvor über das Elektron gesagt haben. Es wäre sinnlos, einen Himmelskörper wie etwa die Erde im Sonnensystem als ausgedehntes Objekt zu betrachten, wenn wir gleichzeitig die klassische Mechanik verwenden, um ihre Umlaufbahn um die Sonne zu berechnen. Die Abweichung der berechneten von der tatsächlichen Bahn, die sich auf Grund der räumlichen Ausdehnung der Erde ergibt, ist nämlich wesentlich kleiner als der Fehler, den wir allein schon durch die Anwendung der Newtonschen Gravitationstheorie machen. Sie ist nämlich in diesem Fall nur eine Näherung der allgemeinen Relativitätstheorie. Erst wenn wir diese, wesentlich genauere Theorie verwenden, um die Bahnen der Planeten zu beschreiben, ist es überhaupt sinnvoll, sie als ausgedehnte Körper zu betrachten. Das Konzept eines Punktteilchens ist demnach eine für praktische Zwecke sehr nützliche Näherung, obwohl es auf den ersten Blick einen sehr idealisierten und wirklichkeitsfernen Anschein hat, die Ausdehnung eines Körpers zu vernachlässigen. Es gibt darüber hinaus sogar Situationen, in denen diese Näherung immer noch sehr gut ist, obwohl die Ausdehnung eines Körpers nicht mehr vernachlässigbar ist. Eine solche Situation liegt zum Beispiel dann vor, wenn ein Körper starr, also nicht verformbar ist, und, aus welchen Gründen auch immer, nicht rotiert. Wir werden das hier nicht beweisen können, weil wir dazu erst das Konzept eines starren Körpers erarbeiten müssen. Es ist aber sehr nützlich, diese Aussage zunächst einmal zu akzeptieren. Ein nicht rotierender, starrer Körper verhält sich genau wie ein Punktteilchen, das sich im Schwerpunkt des Körpers befindet. Viele der praktischen Beispiele, die wir in diesem und den nächsten Kapiteln studieren werden, sind von dieser Art. Sie können als Systeme von Punktteilchen aufgefasst werden, obwohl die Ausdehnungen der beteiligten Körper nicht vernachlässigbar klein sind. Den Beweis dafür, dass die Newtonsche Mechanik dies tatsächlich impliziert, werden wir später nachliefern. Die Bahn Wie beschreiben wir nun konkret die Bewegung eines Punktteilchens? Die wesentliche Eigenschaft eines Punktteilchen ist, sich zu jedem Zeitpunkt an genau einem Ort im Raum aufzuhalten. Die Bahn des Teilchens wird durch eine Funktion (3.4) beschrieben, die zu jeder Zeit angibt, wo im Ortsraum sich das Teilchen gerade befindet, nämlich am Punkt . Um konkrete Rechnungen durchzuführen, ist es nützlich, statt der Funktion eine vektorwertige Funktion zu betrachten. Wir legen dazu einen Ursprung fest, so dass jedem Ort eindeutig ein Ortsvektor zugeordnet ist. Die Bahn des Teilchens kann dann durch eine vektorwertige Funktion beschrieben werden, Bahn (3.5) Da es sich um einen Ortsvektor handelt, hat die Funktion natürlich die Dimension einer Länge, 0 m. Wenn wir diese Ortsvektordarstellung der Bahn verwenden, müssen wir jedoch beachten, dass die Funk , tion von der Wahl des Ursprungs abhängt. Wählen wir einen anderen Ursprung , mit so gilt für die Darstellung derselben Bahn bezüglich des neuen Ursprungs 55 " (3.6) replacements (c) (d) (b) (a) Abbildung 3.1: Die Bahn eines Teilchens wird durch eine Funktion beschrieben, die zu jedem Zeitpunkt den Ort des Teilchens im Raum angibt (a). Sie kann explizit durch die Koordinatenfunktionen bezüglich eines ausgewählten Koordinatensystems dargestellt werden. Die Geschwindigkeit und die Beschleunigung sind die ersten und zweiten Ableitungen des Ortsvektors . Der Vektor zeigt tangential zur Bahn, der Vektor in die Richtung, in die sich die Bahn krümmt (b). Unter einer Verschiebung des Ursprungs um den Vektor transformiert sich der Ortsvektor und damit die Darstellung der Bahn des Teilchens um einen konstanten Vektor " . Um die Bahn noch konkreter zu beschreiben, müssen wir eine Basis festlegen und dadurch ein Ko ordinatensystem einführen. Sei also eine Orthonormalbasis von . Dann wird die Bahnkurve des Teilchens durch drei reelle Koordinatenfunktionen beschrieben, 8 mit % (3.7) Die Summe läuft natürlich wieder über 4 . Um die Schreibweise noch ein wenig zu vereinfachen, führen wir die Summenkonvention ein. Wie schreiben die Summenzeichen gar nicht mehr explizit aus, sondern treffen die folgende Vereinbarung: Über doppelt auftretende Vektorindizes wird summiert. Mit anderen Worten, immer wenn in einem Produkt ein Index, der die Komponenten eines Vektors oder die Basisvektoren durchnummeriert, genau zweimal auftritt, so stellen wir uns vor diesem Term ein entsprechendes Summenzeichen vor. Zum Beispiel schreiben wir für den letzten Ausdruck in (3.7) (3.8) Dass diese Vorschrift einen Sinn hat, ist nicht unmittelbar einzusehen. Außerdem stellen sich ein paar Fragen. Wie sollen wir denn jetzt einen Ausdruck, bei dem über einen Index summiert wird, von einem gleich lautenden Ausdruck, bei dem nicht summiert wird, unterscheiden? Und warum gilt die Summenkonvention gerade dann, wenn ein Index in einem Produkt zweimal, aber nicht dreimal oder nur einmal vorkommt? Alle diese Fragen werden wir später beantworten können, wenn wir uns etwas genauer mit dem Verhalten von Vektorkomponenten unter Koordinatentransformationen beschäftigen. Es stellt sich nämlich 56 heraus, dass ein Ausdruck, in dem Vektorkomponenten vorkommen, nur dann sinnvoll ist, wenn jeder Index entweder genau einmal vorkommt, ohne das summiert wird, oder genau zweimal, wobei dann aber über den Index summiert werden muss. Dahinter verbirgt sich eine mathematische Struktur, auf die wir an dieser Stelle aber nicht näher eingehen können. Wir verwenden sie Summenkonvention erst einmal nur, um und Schreibarbeit zu ersparen, und ohne viel darüber nachzudenken. Dass sie funktioniert, nehmen wir einfach zur Kenntnis. Außerdem ist sie nur für Vektorindizes gültig, also für diejenigen Indizes, die die Komponenten von Vektoren und die Basisvektoren bezeichnen und die Werte 4 annehmen. Wir verwenden für diese Indizes immer die Buchstaben 3 . Aufgabe 3.3 Man führe folgenden “empirischen” Test der Summenkonvention durch. Man überprüfe in allen Gleichungen in den Kapiteln 1 und 2, in denen Vektorindizes vorkommen, ob tats ächlich genau dann über einen Index summiert wird, wenn dieser genau zweimal auftritt. Gibt es irgendeine Gleichung, in der ein Index mehr als zweimal auftritt? Geschwindigkeit und Beschleunigung Aus der Bahn eines Teilchens, die wir im folgenden stets durch den Ortsvektor als Funktion der Zeit beschreiben, lassen sich weitere Größen ableiten, wobei “ableiten” an dieser Stelle ganz wörtlich zu verstehen ist. Durch die Funktion wird eine Kurve im Raum beschrieben, wobei die Zeit als Kurvenparameter dient. Der Tangentenvektor dieser Kurve ist die Geschwindigkeit des Teilchens. Sie kann als Vektorfunktion ( oder durch ihre Komponenten ( % definiert werden, Geschwindigkeit ( & & ( % ( ( 2 (3.9) Wie bereits erwähnt, ist es üblich, Ableitungen nach der Zeit mit einem Punkt zu bezeichnen. Wir verwenden wahlweise diese Notation oder die Schreibweise . Die übliche Einheit der Geschwindigkeit 0 m s. Die Geschwindigkeit ist wieder eine neue ergibt sich als Meter pro Sekunde, ( Größenart, allerdings eine, für die wir keine neue Einheit einführen müssen. Es handelt sich um eine aus den fundamentalen Größenarten Länge und Zeit abgeleitete Größenart. Die physikalische Dimension der Geschwindigkeit ist Länge geteilt durch Zeit. Im allgemeinen ist auch die Geschwindigkeit eine Funktion der Zeit. Sie ist nur dann konstant, wenn sich das Teilchen geradlinig und gleichförmig bewegt, also mit konstanter Geschwindigkeit entlang einer Geraden. In diesem Fall ist & ( ( ( (3.10) wobei der Ortsvektor des Ortes ist, an dem sich das Teilchen zur Zeit 6 befindet, und ( seine konstante Geschwindigkeit. Um die Abweichung der Bewegung von einer geradlinigen und gleichförmigen Bewegung zu beschreiben, definieren wir die Beschleunigung als die Ableitung der Geschwindigkeit nach der Zeit, oder als die zweite Ableitung des Ortsvektors nach der Zeit. Auch diese Definition können wir wahlweise als Vektorgleichung oder komponentenweise aufschreiben, Beschleunigung ( 2 & ( % (3.11) ( 0 m s. Als Einheit für die Beschleunigung ergibt sich Höhere Ableitungen treten in den Gesetzen der klassischen Mechanik nicht auf. Meist ist die Beschleunigung noch nicht einmal eine stetige Funktion der Zeit. Es genügt also, dass die Bahn eine mindestens zweimal differenzierbare Funktion der Zeit ist. 57 Aufgabe 3.4 Es seien die folgenden Bahnen gegeben, 0 ( ( 7 1! + (3.12) Man berechne jeweils die Geschwindigkeit ( und die Beschleunigung , sowie deren Betr äge ( ( und . Welchen physikalischen Dimensionen haben die jeweils angegebenen Konstanten? Aufgabe 3.5 Warum hängt der Ortsvektor des Teilchens von der Wahl des Ursprungs des gew ählten Koordinatensystems ab, die Geschwindigkeit ( und die Beschleunigung aber nicht? Die Newtonschen Gesetze Die klassische Mechanik, wie sie von Newton formuliert wurde, sagt nun folgendes über die Bewegung eines Punktteilchens. Wenn auf ein Teilchen kein äußerer Einfluss einwirkt, dann bewegt es sich geradlinig und gleichförmig, also mit einer konstanten Geschwindigkeit. Wir sprechen in diesem Fall von einem freien Teilchen. Dies ist das erste Newtonsche Gesetz: Ein freies Teilchen bewegt sich geradlinig und gleichförmig. Wirkt auf das Teilchen ein äußerer Einfluss, so geschieht dies in Form eine Kraft. Eine Kraft ist eine gerichtete Größe, also ein Vektor, der eine Abweichung der Bahn des Teilchens von der geradlinigen und gleichförmigen Bewegung bewirkt. Wirken auf das Teilchen mehrere Einflüsse gleichzeitig ein, so sind die entsprechenden Kraftvektoren zu einer Gesamtkraft zu addieren. Die Gesamtkraft bewirkt eine zu diesem Vektor proportionale Beschleunigung das Teilchens. Der Proportionalitätsfaktor ist eine Eigenschaft des jeweiligen Teilchens. Er wird Masse genannt und mit bezeichnet. Es gilt also & Kraft (3.13) wenn die zur Zeit auf das Teilchen einwirkende Gesamtkraft ist. Dies ist das zweite Newtonsche Gesetz: Wirkt eine Kraft auf ein Teilchen, so bewirkt diese eine Beschleunigung. Je größer die Masse ist, desto träger ist das Teilchen, das heißt umso mehr versucht es, der Krafteinwirkung zu widerstehen und auf seiner geradlinigen und gleichförmigen Bewegung zu beharren. Die Masse ist ein Maß für die Trägheit eines Teilchens. Sie wird in einer willkürlich gewählten Einheit Kilogramm (kg) gemessen, definiert also eine neue physikalische Dimension. Wie ein Messgerät für die Masse eines Körpers aussieht, werden wir uns gleich noch überlegen. Durch die Wahl der Einheit für die Masse wird auch die Einheit und damit die physikalische Dimension der Kraft festgelegt, 0 kg 0 m s 0 kg m 0 N s (3.14) Als Abkürzung führt man für die Kraft auch die Einheit Newton (N) ein. Eigentlich ist das erste Newtonsche Gesetz nur ein Spezialfall des zweiten, der dann vorliegt, wenn auf ein Teilchen keine Kräfte einwirken. Und für sich genommen sind beide Gesetze auch noch nicht sehr 58 replacements (c) (d) (a) (b) Abbildung 3.2: Ist die Kraft explizit als Funktion der Zeit gegeben, so ergibt sich die Bahn aus der Bewegungsgleichung (3.15) (a). Ist die Kraft dagegen durch ein Kraftfeld als Funktion des Ortes gegeben, so gilt die Bewegungsgleichung (3.16) (b). Dargestellt ist jeweils eine spezielle Lösung der Bewegungsgleichung, die sich eindeutig durch die Wahl bestimmter Anfangsbedingungen ergibt. Die Punkte markieren gleich lange Zeitintervalle. aussagekräftig. Das ist der Grund, warum die klassische Mechanik eigentlich nur eine allgemeines Konzept zur Konstruktion einer physikalischen Theorie ist. Um konkrete Aussagen über die Bahn eines Teilchen abzuleiten, müssen wir zusätzlich wissen, welche Kräfte denn nun konkret auf ein Teilchen einwirken, wenn es sich in einer bestimmten Situation befindet. Erst durch die Angabe solcher Kraftgesetze werden die Newtonschen Gesetze zu einer physikalischen Theorie, die konkrete Aussagen über die Bahnen von Teilchen macht. Das einfachste mögliche Kraftgesetz gibt explizit die Kraft als Funktion der Zeit vor. Eine solche Situation liegt vor, wenn wir das Teilchen gewissermaßen “von außen” steuern. Zu jedem Zeitpunkt ist die Kraft durch einen bestimmten Vektor gegeben, der in der Abbildung 3.2(a) als Pfeil am jeweiligen Ort des Teilchens dargestellt ist. Während sich das Teilchen bewegt, ändert sich dieser Vektor in einer vorgegebenen Art und Weise, die unabhängig davon ist, wie sich das Teilchen gerade bewegt. Die Bewegungsgleichung sieht in diesem Fall sehr einfach aus. Es ist die Differenzialgleichung für die Funktion , die sich aus dem zweiten Newtonschen Gesetz ergibt, (3.15) Wie wir gleich sehen werden, können wir diese Gleichung sehr leicht nach auflösen, um so die Bahn des Teilchens aus der gegebenen Kraftfunktion berechnen. Typischerweise wird die Kraft aber nicht explizit als Funktion der Zeit gegeben sein, sondern zum Beispiel als Funktion des Ortes, an dem sich das Teilchen gerade befindet. Wir sprechen dann von einem Kraftfeld, wie es in Abbildung 3.2(b) dargestellt ist. Ein Kraftfeld ordnet jedem Punkt im Raum mit Ortsvektor einen Vektor zu. Dieser gibt an, welche Kraft auf das Teilchen einwirkt, wenn es sich am Ort befindet. Um die Bewegungsgleichung für ein Teilchen in einem Kraftfeld aufzustellen, müssen wir auf der rechten Seite der Gleichung (3.15) statt den Wert des Kraftfeldes an der Stelle einsetzen, an der sich das Teilchen gerade befindet, also (3.16) 59 Diese Differenzialgleichung ist schon ein wenig komplizierter als (3.15). Die unbekannte Funktion erscheint auf beiden Seiten. Es handelt sich um eine Differenzialgleichung zweiter Ordnung für die gesuchte Funktion , die wir im allgemeinen nicht mehr so einfach lösen können. In diesem und den nächsten Kapiteln werden wir uns vor allem mit den Methoden beschäftigen, solche Bewegungsgleichungen entweder explizit zu lösen oder zumindest qualitative Aussagen über deren Lösungen zu machen. Das ist aber noch nicht der allgemeinste Fall für ein Kraftgesetz. Zusätzlich kann das Kraftfeld noch explizit von der Zeit abhängen, oder auch von der Geschwindigkeit des Teilchens. Die allgemeinste Form für die Bewegungsgleichung eines Teilchens in einem Kraftfeld lautet & (3.17) Kraftgesetze, bei denen die Kraft auch noch von der Beschleunigung oder höheren Ableitungen abhängt, sind nicht bekannt. Die Existenz solcher Kraftgesetze würde das Konzept der Kraft an sich in Frage stellen. Denn das zweite Newtonsche Gesetz wäre sinnlos, wenn die Kraft selbst wiederum als Funktion der Beschleunigung gegeben wäre. Es gibt aber noch eine Verallgemeinerung des Kraftgesetzes (3.17), die für die Mechanik von Punktteilchen sehr wesentlich ist. Bisher haben wir nur ein einzelnes Teilchen betrachtet. Bei einem System von Teilchen beschreiben wir die Bahn jedes einzelnen Teilchens durch eine Ortsvektorfunktion , wobei der Index 0 31 die einzelnen Teilchen durchnummeriert. Um die Teilchenindizes nicht mit den Vektorindizes zu verwechseln, bezeichnen wir sie mit kleinen griechischen Buchstaben. Die Funktion repräsentiert den Ortsvektor des Teilchens mit der Nummer , und die Komponenten dieses Vektors, also die Koordinaten des Teilchens, sind durch die reellen Funktionen mit 4 $ gegeben. Da jedes Teilchen im allgemeinen eine andere Masse hat, bezeichnen wir die Mas , sen entsprechend mit . Es gilt dann für jedes Teilchen das zweite Newtonsche Gesetz wobei die auf dieses Teilchen wirkende Kraft ist. Für die Teilchenindizes gilt hier natürlich keine Summenkonvention. Nun kann diese Kraft vom Ort und von der Geschwindigkeit des jeweiligen Teilchens abhängen, sowie explizit von der Zeit. Bei einem System aus mehreren Teilchen kann sie aber auch von den Orten und den Geschwindigkeiten aller anderen Teilchen abhängen. Das allgemeinste Kraftgesetz für ein -Teilchen System lautet also , 33 3 3 (3.18) Wir müssen vektorwertige Funktion angeben, die jeweils von 0 reellen Variablen abhängen, nämlich von den Vektoren und mit ihren jeweils drei Komponenten und von der Zeit . Meistens nimmt ein solches Kraftgesetz eine sehr spezielle Form an. Es treten in der Regel nur Kräfte auf, die von den Orten und eventuell den Geschwindigkeiten von jeweils zwei Teilchen abhängen. Wir sagen dann, dass die Teilchen paarweise miteinander wechselwirken. Die Gesamtkraft , die auf das Teilchen wirkt, setzt sich aus Kräften zusammen, die durch die Wechselwirkung des Teilchens mit dem Teilchen verursacht werden. Zusätzlich kann noch eine äußere Kraft auf jedes Teilchen wirken, die nicht von einem anderen Teilchen verursacht ist, sondern von außen auf das System einwirkt. Betrachten wir der Einfachheit halber nur Kräfte, die von den Orten, aber nicht den Geschwindigkeiten der Teilchen oder explizit von der Zeit abhängen. Dann werden die Wechselwirkungen von Teilchen durch ein Kraftgesetz der Form , (3.19) beschrieben. Wir benutzen im folgenden die Konvention, dass diejenige Kraft ist, die vom Teilchen auf das Teilchen ausgeübt wird, das heißt die Kraft wird vom Teilchen verursacht und sie wirkt auf das Teilchen . Und für eine äußere Kraft, die auf das Teilchen wirkt, schreiben wir . 60 Meistens ist es zudem so, dass die Wechselwirkung des Teilchens mit dem Teilchen nur von der relativen Position der beiden Teilchen abhängt, also von dem Abstandsvektor " . Dann vereinfacht sich das Kraftgesetz noch ein wenig, da die Kräfte nur noch von jeweils einem Vektor abhängen, " (3.20) Wir müssen jetzt nur noch insgesamt Funktionen und angeben, die jeweils von drei reellen Variablen abhängen, nämlich von den Komponenten der Vektoren bzw. " . Natürlich ist auch das im allgemeinen ein sehr kompliziertes System von gekoppelten Differenzialgleichungen, das wir nur in sehr speziellen Fällen explizit lösen können. Einige dieser Fälle werden wir später ausführlich diskutieren. Schließlich gibt es noch das dritte Newtonsche Gesetz, das eine Aussage über die in der Natur tatsächlich vorkommenden Wechselwirkungen zwischen Teilchen macht. Es besagt, dass eine Wechselwirkung, wie auf ein der Name schon andeutet, stets auf Gegenseitigkeit beruht. Bewirkt ein Teilchen eine Kraft Teilchen , so bewirkt das Teilchen umgekehrt auf das Teilchen eine Kraft , die entgegengesetzt gleich ist, actio reactio " (3.21) Jede Kraft, die ein Teilchen auf ein anderes ausübt, wird durch eine entsprechende Gegenkraft gewissermaßen kompensiert. Oft wird das dritte Newtonsche Gesetz auch in der lateinischen Kurzform “actio reactio” zitiert. Jeder Kraft entspricht eine entgegengesetzte, gleich große Gegenkraft. Eine äußere Kraft , wie sie in (3.20) auftritt, widerspricht diesem Prinzip offenbar. Dass wir solche Kräfte trotzdem zulassen, liegt daran, dass es manchmal sinnvoll ist, bestimmte Objekte, mit denen die Teilchen wechselwirken, nicht in das dynamische System einzubeziehen. Ein typisches Beispiel ist die Anziehungskraft der Erde, die auf alle Teilchen in einem Labor gleichermaßen wirkt. Zwar üben die Teilchen auch eine gleich große Gegenkraft auf die Erde aus, aber die Wirkung dieser Kraft ist wegen der großen Masse und damit großen Trägheit der Erde vernachlässigbar. Wir betrachten daher das “Teilchen” Erde als außerhalb des dynamischen Systems, dessen Bewegungen wir beschreiben wollen. Wir müssen dessen Wirkung auf die anderen Teilchen dann aber in der Form (3.20) als äußere Kraft berücksichtigen. Genau genommen gilt das dritte Newtonsche Gesetz also nur für abgeschlossene Systeme, die nicht mit anderen Objekten wechselwirken. Aufgabe 3.6 Wir betrachten ein abgeschlossenes System aus Teilchen. Das Kraftgesetz sei von der Form (3.19). Zusätzlich sollen die Funktionen und , die die Wechselwirkungen und äußeren Kräfte beschreiben, die folgende Symmetrie haben. Sie sollen unabh ängig davon sein, welchen Punkt wir als Ursprung des Koordinatensystems wählen. Mit anderen Worten, das Kraftgesetz soll sich nicht ändern, wenn wir die Ortsvektoren gemäß (3.6) transformieren. Man zeige, dass das Kraftgesetz dann von der Form (3.20) sein muss. Die Wechselwirkungen dürfen nur von den relativen Positionen der Teilchen abhängen. Außerdem müssen die äußeren Kräfte konstant, also ortsunabhängig sein. Zeitabhängige Kräfte Als einfachstes Beispiel einer Bewegungsgleichung wollen wir nun etwas genauer den Fall einer Kraft untersuchen, die gemäß (3.15) explizit als Funktion der Zeit gegeben ist, 61 (3.22) In diesem Fall macht es keinen Unterschied, ob wir ein einzelnes Teilchen oder ein System von mehreren Teilchen betrachten. Für jedes Teilchen gilt unabhängig von den anderen Teilchen eine Bewegungsgleichung der Form (3.22). Da wir die Funktion kennen, können wir diese Gleichung durch zweimaliges Integrieren lösen. Wir berechnen zuerst die Geschwindigkeit als Funktion der Zeit, indem wir die Beschleunigung von einem willkürlich gewählten Zeitpunkt bis integrieren. Nach dem Hauptsatz der Integral- und Differenzialrechnung für vektorwertige Funktionen gilt " (3.23) Wir schreiben ( für die Geschwindigkeit des Teilchens zur Zeit . Dann können wir die Funktion explizit angeben, ( 0 ( (3.24) Die Geschwindigkeit des Teilchens zur Zeit ist eindeutig bestimmt durch den Anfangswert ( zur Zeit und die Kraftfunktion . Durch nochmaliges Integrieren finden wir die gesuchte Ortsfunktion . Es gilt und folglich, wenn wir " (3.25) setzen, 0 ( Wenn wir jetzt noch das äußere Integral aufspalten und dann die Integration über ( " ( 0 (3.26) ausführen, ergibt sich (3.27) Aus der Kenntnis der Kraftfunktion und den Anfangsbedingungen und & ( , also des Ortes und der Geschwindigkeit zu irgendeinem Zeitpunkt , können wir die Bahn des Teilchens eindeutig bestimmen. Wir müssen dazu nur die Funktion zweimal integrieren. Aufgabe 3.7 Man löse die Bewegungsgleichung (3.15) für die folgenden Kräfte und Anfangsbedingungen: 3! ( und 6 ! beliebige Konstanten. 62 ( ( & Hier sind & ! 6 & + (3.28) replacements (c) (d) (b) (a) Abbildung 3.3: Beim schrägen Wurf wird ein Teilchen aus der Höhe oberhalb des Erdbodens mit der Geschwindigkeit unter dem Winkel abgeworfen. Die Wurfweite ist der horizontale Abstand des Ortes, an dem das Teilchen auf dem Boden auftrifft, von dem Punkt direkt unterhalb der Abwurfstelle. Gezeigt ist die Flugbahn des Teilchens ohne (a) und mit (b) Luftreibung. Aufgabe 3.8 Im Gravitationsfeld der Erde in der Nähe der Oberfläche wirkt auf ein Teilchen der Masse eine konstante Kraft Erdanziehung " mit 0 m s (3.29) wenn das Koordinatensystem so gewählt ist, dass der Basisvektor vertikal nach oben zeigt. Bei dem in Abbildung 3.3(a) dargestellten schrägen Wurf befindet sich ein Teilchen der Masse in einer H öhe oberhalb des Bodens und wird dort mit einer Geschwindigkeit ( ( unter einem Winkel zur Horizontalen abgeworfen. Man berechne die Wurfweite als Funktion von , ( und . Um die Bewegungsgleichung zu lösen, sollte man von der Freiheit der Wahl des Koordinatensystems Gebrauch machen. Aufgabe 3.9 Beim schrägen Wurf aus Aufgabe 3.8 sei die Abwurfgeschwindigkeit ( und die H öhe fixiert, aber der Abwurfwinkel variabel. Man bestimme die maximal erreichbare Wurfweite als Funktion von und ( , sowie den optimalen Abwurfwinkel . Anfangsbedingung und Bewegungszustand Am Beispiel einer zeitabhängigen Kraft haben wir gesehen, dass wir zusätzlich zum Kraftgesetz den Ort und die Geschwindigkeit eines Teilchens zu einem bestimmten Zeitpunkt vorgeben müssen, um eine eindeutige Lösung der Bewegungsgleichung zu bekommen. Diese Schlussfolgerung können wir verallgemeinern. Es ist stets so, dass die Bewegung eines Teilchens eindeutig durch das Kraftgesetz und die Angabe des Ortes und der Geschwindigkeit zu einem beliebigen Zeitpunkt festgelegt ist. Im Sinne der einleitenden Bemerkungen über dynamische Systeme heißt das, dass der Zustand, oder genauer der Bewegungszustand eines Teilchens durch die Angabe seines Ortes und seiner Geschwindigkeit festgelegt wird. Um das zu erklären, werden wir die Bewegungsgleichung ein wenig umschreiben. Jedes System von Differenzialgleichungen zweiter oder höherer Ordnung lässt sich auf ein System von Differenzialgleichungen erster Ordnung reduzieren, indem man einen geeigneten Satz von Hilfsfunktionen einführt. Betrachten wir noch einmal die allgemeinste Bewegungsgleichung (3.17) für ein einzelnes Teilchen, & (3.30) Wenn wir den Ortsvektor und seine Ableitungen in ihre Komponenten bezüglich irgendeiner Basis zerlegen, dann repräsentiert diese Vektorgleichung ein System von drei reellen Differenzialgleichungen zweiter 63 Ordnung, die im allgemeinen miteinander gekoppelt sind. Um es in ein System von Differenzialgleichungen erster Ordnung zu überführen, führen wir drei reelle Hilfsfunktionen ein, oder einfach eine vektorwertige Hilfsfunktion. Es ist üblich, dafür die Funktion & Impuls (3.31) zu verwenden. Diese Größe nennt man Impuls. Sie hat die Dimension Masse mal Geschwindigkeit, also 0 kg m s. Zwar könnten wir den Faktor an dieser Stelle ebenso gut weglassen und die Geschwindigkeit ( als Hilfsfunktion verwenden. Aber wie wir gleich sehen werden, hat der Impuls ein paar nützliche Eigenschaften, die das Lösen von Bewegungsgleichungen in vielen Fällen vereinfachen. In jedem Fall ergibt sich jetzt ein System von Differenzialgleichungen erster Ordnung, das wir wie folgt schreiben können, 0 & (3.32) Die erste Gleichung ist nichts anderes als die Definition der Hilfsfunktion . Die zweite Gleichung besagt, dass die Kraft eine Änderung des Impulses bewirkt. Sie ergibt sich aus (3.30), wobei wir jedoch das Kraftgesetz als Funktion des Ortes und des Impuls anstelle des Ortes und der Geschwindigkeit angeben müssen. Die Umrechnung ist aber ganz einfach, denn wir müssen nur den Faktor an den entsprechenden Stellen einfügen, wenn wir explizit ein bestimmtes Kraftgesetz gegeben haben. Die Differenzialgleichungen (3.32) sind jetzt von der allgemeinen Form (3.2) der Bewegungsgleichung eines dynamisches System. Wenn wir den Bewegungszustand des Teilchens durch definieren, also durch seinen Ort und seinen Impuls, dann steht auf der linken Seite der Gleichung die Zeitableitung des Zustandes, und auf der rechten Seite eine vorgegebene Funktion des Zustandes und der Zeit . Das können wir unmittelbar verallgemeinern und den Bewegungszustand eines -Teilchen-Systems definieren. Führen wir analog zu (3.31) den Impuls des Teilchens ein, (3.33) so lassen sich die Bewegungsgleichungen (3.18) in der Form & 0 1 1 33 (3.34) schreiben. Der Zustand eines -Teilchen-Systems wird folglich durch die Angabe aller Orte und aller Impulse festgelegt. Auf der linken Seite des Gleichungssystem (3.34) steht die Zeitableitung dieses Zustandes, auf der rechten Seite eine Funktion des Zustandes und der Zeit . Der Bewegungszustand eines -Teilchen-Systems wird durch die Orte und Impulse aller Teilchen bestimmt. Aus den allgemeinen Überlegungen über dynamische System können wir jetzt folgenden Schluss ziehen. Wenn wir den Bewegungszustand eines Systems aus Teilchen, also alle Orte und Impulse zu einem bestimmten Zeitpunkt kennen, so können wir die Bewegungen der Teilchen für alle Zeiten berechnen. Sie sind durch die eindeutige Lösung der Differenzialgleichungen (3.34) gegeben, mit den Anfangsbedingungen (3.35) & die wir beliebig vorgeben können. Sie definieren den Anfangszustand & . Hierbei müssen wir natürlich voraussetzen, dass wir das Kraftgesetz kennen, dass es das Verhalten des -Teilchen-Systems richtig beschreibt, und dass es ausreichend regulär ist, also die Funktionen 64 in (3.34) stetig und differenzierbar sind. Wenn diese Voraussetzungen erfüllt sind, ist die Mechanik von Punktteilchen eine deterministische Theorie, das heißt aus der Kenntnis des Anfangszustandes lässt sich die Zeitentwicklung vorhersagen. Allerdings macht der Satz von Cauchy, Picard und Lindelöf noch eine Einschränkung, auf die wir an dieser Stelle hinweisen sollten. Unter den genannten Voraussetzungen garantiert der Satz die Existenz einer Lösung der Bewegungsgleichung nur für ein endliches Zeitintervall , das den Anfangszeitpunkt enthält. Es kann also vorkommen, dass die eindeutige Lösung der Bewegungsgleichungen gar nicht für alle Zeiten existiert, sondern nur für einen endlichen Zeitraum von bis , wobei der Zeitpunkt , zu dem wir die Anfangsbedingungen gestellt haben, natürlich innerhalb dieses Zeitraumes liegt. Vom physikalischen Standpunkt aus betrachtet würde das bedeuten, dass etwas nicht ganz stimmen kann. Der Zustand eines dynamischen Systems, also in diesem Fall die Bahnen und die Impulse der Teilchen müssen für alle Zeiten existieren. Falls ein solcher Fall eintritt, ist dies meist ein Hinweis darauf, dass wir bei der Beschreibung des physikalischen Systems eine unzulässige Vereinfachung oder Näherung gemacht haben. Die Theorie, die wir über ein spezielles dynamische System aufgestellt haben, zeigt auf diese Weise ihre eigenen Grenzen auf. Ein Beispiel dafür werden wir im nächsten Kapitel kennen lernen. Von solchen sehr speziellen Fällen abgesehen ist es aber stets so, dass die Anfangsbedingungen zusammen mit den Bewegungsgleichungen die Bahnen eindeutig für und alle Zeiten bestimmen. Mechanische Systeme verhalten sich stets deterministisch, und solange wir keine unzulässigen Vereinfachungen machen, existieren die Lösungen der Bewegungsgleichungen für alle Zeiten. Aufgabe 3.10 Man wiederhole die einzelnen Schritte (3.22–3.27) zur L ösung der Bewegungsgleichung für eine zeitabhänge Kraft, jedoch ausgehend von den Bewegungsgleichungen erster Ordnung (3.32). Man löse zuerst die Bewegungsgleichung für den Impuls, dann die für die Bahn. Reibungskräfte Wir wollen an einem einfachen Beispiel zeigen, dass das Umschreiben der Bewegungsgleichung in die Form (3.32) bzw. (3.34) eines Systems von Differenzialgleichungen erster Ordnung auch einen praktischen Nutzen hat. Manchmal lassen sich diese Gleichungen nämlich einfacher lösen als die ursprüngliche Bewegungsgleichung zweiter Ordnung. Wir betrachten einen Körper der Masse , der sich in einem Gas oder einer Flüssigkeit bewegt und dadurch eine Reibungskraft spürt. Der Körper soll die eingangs erwähnten Bedingungen erfüllen, also starr sein und nicht rotieren, so dass wir ihn als punktförmig betrachten können. Die Reibungskraft ist von der Geschwindigkeit abhängig und ihr entgegen gerichtet, da sie den Körper stets abbremst. Solange die Geschwindigkeit nicht zu groß wird, können wir annehmen, dass die Reibungskraft zur Geschwindigkeit proportional ist, Reibungskraft Die Größe ergibt sich " mit 6 (3.36) heißt Reibungskonstante. Schreiben wir die Bewegungsgleichung in der Form (3.32) auf, so 0 & (3.37) " " Die zweite Gleichung besagt, dass die Funktion proportional zu ihrer eigenen Ableitung ist. Das ist & die typische Eigenschaft der Exponentialfunktion. Wir machen daher den Ansatz & " (3.38) wobei und Konstanten sind. Diese müssen wir so wählen, dass die Bewegungsgleichungen und die Anfangsbedingungen für den Impuls erfüllt sind. Die Anfangsbedingung wählen wir so allgemein 65 wir möglich, 6 6 ( (3.39) Zur Zeit 6 soll sich der Körper am Ort befinden und einen Impuls bzw. eine Geschwindigkeit ( haben. Setzen wir den Ansatz für in diese Gleichung und in die Bewegungsgleichung ein, so finden und sein muss, also wir, dass (3.40) Der Impuls, und damit auch die Geschwindigkeit des Körpers nehmen exponentiell mit der Zeit ab. Die Funktion finden wir, indem wir die entsprechende Bewegungsgleichung von 6 bis integrieren, " 6 0 0 " 0 " 0 (3.41) Für die Bahn und den Impuls des Körpers finden wir demnach folgende Funktionen, parametrisiert durch den Anfangsort und den Anfangsimpuls , 0 " (3.42) Das war ein typisches Beispiel dafür, wie ein System von Differenzialgleichungen schrittweise gelöst werden kann, wenn die einzelnen Gleichungen entkoppeln. Wir konnten zuerst die Bewegungsgleichung für den Impuls lösen, und anschließend die für den Ort. Die Lösung für den Impuls konnten wir durch geschicktes Raten finden, die Lösung für den Ort anschließend durch eine gezielte Integration. Aufgabe 3.11 Welche physikalische Dimension hat die Reibungskonstante ? nur eine endliche Länge hat, Aufgabe 3.12 Man zeige, dass die Bahn (3.42) für das Intervall 6 der Körper also so stark abgebremst wird, dass er insgesamt nur eine endliche Strecke zur ücklegt. Aufgabe 3.13 Man bilde in (3.42) den Grenzwert / 6 und zeige, dass sich in diesem Fall eine geradlinige und gleichförmige Bewegung mit der Geschwindigkeit ( ergibt. Aufgabe 3.14 Um beim schrägen Wurf in Abbildung 3.3(b) die Luftreibung zu berücksichtigen, machen wir für die Kraft den Ansatz , wobei die Gravitationskraft durch (3.29), die Reibungskraft durch (3.36) gegeben ist. Man schreibe die Bewegungsgleichung zuerst in der Form (3.30) auf und bringe sie anschließend auf die Form (3.32). Man finde diejenige Lösung der Bewegungsgleichung, die zu den Anfangsbedingungen aus Aufgabe 3.8 gehört. Man zeige, dass die Wurfweite stets kleiner ist als die entsprechende Wurfweite ohne Reibung bei gleichen Anfangsbedingungen. Impuls und Schwerpunkt Die Bewegungsgleichungen für ein mechanisches System sind in der Regel gekoppelte Differenzialgleichungen. Um ein gekoppeltes System von Differenzialgleichungen zu lösen, ist es immer eine gute Strategie, zunächst zu versuchen, das Gleichungssystem zu entkoppeln. Das gelingt natürlich nicht immer so einfach wie in dem gerade vorgeführten Beispiel. Es gibt aber ein paar nützliche und sehr allgemeine Eigenschaften von mechanischen Systemen, die wir dazu benutzen können, die Bewegungsgleichungen in einer ganz ähnlichen Art und Weise zu entkoppeln und anschließend schrittweise zu lösen. 66 Die wichtigste solche Eigenschaft ist die Existenz von Erhaltungsgr ößen. Eine Erhaltungsgröße ist eine Funktion auf dem Zustandsraum eines dynamischen Systems, die zeitlich konstant ist. Wenn sich das System zu irgendeiner Zeit in einem Zustand befindet, für den die Erhaltungsgröße einen bestimmten Wert annimmt, so nimmt diese Größe zu jeder anderen Zeit denselben Wert an. Wir wissen also, ohne die Bewegungsgleichung gelöst zu haben, dass sich das dynamische System nur innerhalb einer durch die Erhaltungsgröße bestimmten Teilmenge des Zustandsraum bewegen kann. Je mehr Erhaltungsgrößen wir finden, umso stärker können wir die Bewegungen des Systems einschränken, und umso einfacher werden die verbleibenden Bewegungsgleichungen, die wir explizit lösen müssen. Bevor wir beginnen, explizit nach Lösungen der Bewegungsgleichung für ein dynamisches System zu suchen, sollten wir daher versuchen, so viele Erhaltungsgrößen wie möglich zu finden. Später werden wir sehen, dass es dafür eine spezielle Strategie gibt. Aber zunächst wollen wir das Konzept einer Erhaltungsgröße an einem einfachen Beispiel erklären. Wir betrachten ein System aus Punktteilchen mit Massen , Ortsvektoren und Impulsen . Die Teilchen sollen untereinander wechselwirken, aber es sollen keine äußeren Kräfte auf sie einwirken. Es gelten dann die Bewegungsgleichungen (3.34) erster Ordnung in der Form 0 (3.43) Die Zeitabhängigkeit schreiben wir ab jetzt nicht mehr explizit aus, wenn klar ist, welche Größen von der Zeit abhängen. Hier sind dies natürlich die Orte und Impulse der Teilchen. Es ist an dieser Stelle auch unerheblich, wovon die Wechselwirkungskräfte abhängen. Wir verwenden nur das dritte Newtonsche Gesetz, wonach ist. " Daraus können wir folgenden Schluss ziehen. Die Kraft bestimmt die Änderung des Impulses pro Zeit. Das Teilchen bewirkt durch die Kraft eine Impulsänderung des Teilchens , und umgekehrt bewirkt das Teilchen durch die Gegenkraft eine gleich große, aber entgegengesetzte Impulsänderung des Teilchen . Wir können auch sagen, dass bei einer Wechselwirkung von zwei Teilchen Impuls von einem Teilchen auf das andere übertragen wird. Das hat zur Folge, dass sich die Impulse der beiden wechselwirkenden Teilchen ändern, die Summe von beiden Impulse aber gleich bleibt. Das eine Teilchen “verliert” genau so viel Impuls, wie das andere “gewinnt”. Wechselwirken alle Teilchen eines -Teilchen-Systems miteinander, so wird Impuls von jedem Teilchen auf jedes andere übertragen, aber die Gesamtmenge an Impuls bleibt erhalten. Also ist der Gesamtimpuls eines -Teilchen-Systems eine Erhaltungsgröße. Der Gesamtimpuls ist einfach die Summe aller Impulse der Teilchen, Gesamtimpuls (3.44) Im allgemeinen ist dieser Vektor eine Funktion der Zeit. Gilt aber eine Bewegungsgleichung der Form (3.43) und das dritte Newtonsche Gesetz, so ist (3.45) Die Summe läuft über alle Paare mit . Zu jedem Term gibt es folglich einen Term der entgegensetzt gleich ist. Also ist die rechte Seite der Gleichung gleich Null, ! konst Das gilt für jedes abgeschlossene mechanische System, für das das dritte Newtonsche Gesetz gilt. 67 , (3.46) In jedem abgeschlossenen mechanischen System ist der Gesamtimpuls eine Erhaltungsgr öße. Darüber hinaus können wir auch noch eine Aussage über die Orte der Teilchen machen. Wir definieren den Schwerpunkt eines -Teilchen-Systems wie folgt. Es ist der Punkt mit dem Ortsvektor 0 mit (3.47) Wir mitteln über alle Ortsvektoren, wobei wir die Beiträge der einzelnen Teilchen jeweils mit ihren Massen gewichten. Aufgabe 3.15 Man zeige, dass durch den Ortsvektor unabhängig von der Wahl des Koordinatensystems ein Punkt im Raum definiert wird. Mit anderen Worten, wenn wir den Ursprung des Koordinatensystems verschieben, so ändern sich zwar die Ortsvektoren der Teilchen und auch der Vektor , aber nicht der Punkt, zu dem er zeigt. Leiten wir die Gleichung (3.47) nach der Zeit ab, so ergibt sich 0 Zusammen mit (3.46) ergibt sich 0 0 0 (3.48) ! / (3.49) Das sind die Bewegungsgleichungen für ein einzelnes freies Teilchen mit Masse , Ortsvektor und Impuls . Der Schwerpunkt eines abgeschlossenen -Teilchen-Systems verhält sich wie ein freies Teilchen, auf das keine Kraft wirkt. Wir können die Lösung der Bewegungsgleichungen (3.49) unmittelbar angeben. Befindet sich der Schwerpunkt zur Zeit an einem Ort und bewegt sich dieser mit einer Geschwindigkeit , so gilt " (3.50) Der Schwerpunkt eines abgeschlossenen mechanischen Systems aus beliebig vielen Punktteilchen bewegt sich stets geradlinig und gleichförmig. Dadurch reduziert sich die Anzahl der zu lösenden Differenzialgleichungen. Zerlegen wir die Orts- und Impulsvektoren aller Teilchen in ihre Komponenten, so bilden die ursprünglichen Bewegungsgleichungen ein System von insgesamt Differenzialgleichungen erster Ordnung für reelle Funktionen. Für sechs spezielle Kombinationen dieser Funktion kennen wir aber bereits die Lösung, nämlich für die jeweils drei Komponenten des Gesamtimpulses und des Ortsvektors des Schwerpunktes. Wir müssen also nur noch " 0 unabhängige Differenzialgleichungen lösen. Aufgabe 3.16 Abbildung 3.4(a) zeigt einen Stoßprozess von zwei Teilchen. Die Teilchen bewegen sich zunächst aufeinander zu, wechselwirken dann kurzzeitig miteinander, und entfernen sich schließlich wieder voneinander. Nur während eines kurzen Zeitraumes, wenn die Teilchen dicht beieinander sind, soll eine Kraft wirken, die dem dritten Newtonschen Gesetz genügt. Man zeige, dass man durch Messung der Geschwindigkeiten der Teilchen vor und nach dem Stoß das Massenverh ältnis bestimmen kann. Aufgabe 3.17 In Abbildung 3.4(b) ist ein Messgerät zur Bestimmung der Masse stellt. Wie funktioniert es? 68 eines Körpers darge- kg kg (a) (b) Abbildung 3.4: Bei einem Stoßprozess wird Impuls von einem Teilchen auf ein anderes übertragen (a). Unabhängig von der Art der Wechselwirkung ist die Summe der Impulse vor und nach dem Stoß dieselbe. Um die Masse eines Körpers zu messen, lässt man ihn unelastisch, also so, dass die Körper nach dem Stoß zusammenkleben, mit einem Körper bekannter Masse zusammenstoßen (b). Aus dem Verhältnis der Geschwindigkeiten und lässt sich die Masse bestimmen. Aufgabe 3.18 In Abbildung 3.5 ist die Funktionsweise eines Rückstoßtriebwerks dargestellt. Eine Rakete stößt in regelmäßigen Zeitabständen eine Treibstoffmenge mit der Geschwindigkeit nach hinten aus. Wenn man die pro Zeit ausgestoßene Treibstoffmenge festh ält, den Grenzwert 6 und 6 bildet, und außerdem beachtet, dass die Gesamtmasse der Rakete durch den Treibstoffausstoß abnimmt, so ergibt sich aus der Impulserhaltung für abgeschlossene mechanische System die Bewegungsgleichung für die Rakete. Die Rakete befindet sich zunächst in Ruhe und soll auf die Geschwindigkeit ( beschleunigt werden. Der Raketenkörper zusammen mit der Nutzlast hat die Masse . Gesucht ist die erforderliche Treibstoffmenge . Man zeige, dass diese durch die Formel " 0 (3.51) gegeben ist, also exponentiell mit der angestrebten Geschwindigkeit ansteigt. Das Zwei-Teilchen-System Wir wollen am Beispiel eines Systems von zwei Teilchen zeigen, wie wir mit Hilfe der Impulserhaltung und des Schwerpunktes ein gekoppeltes System von Bewegungsgleichungen lösen können. Der Einfachheit halber nehmen wir an, dass die Wechselwirkung der beiden Teilchen nur von der relativen Position der beiden Teilchen abhängt. Die Kräfte, die die beiden Teilchen aufeinander ausüben, sind dann durch eine Funktion " des Abstandsvektors '"> gegeben. Die Bewegungsgleichungen erster Ordnung lauten 0 0 " " " (3.52) Um dieses Gleichungssystem zu entkoppeln, führen wir als neue Variable zunächst den Ortsvektor des Schwerpunktes und den Gesamtimpuls ein, 69 (3.53) (d) Abbildung 3.5: Eine Rakete mit Rückstoßantrieb kann als System von vielen Teilchen beschrieben werden. Es besteht aus dem Raketenkörper und einer großen Zahl von Treibstoffteilchen. In regelmäßigen Zeitabständen wird ein Treibstoffteilchen nach hinten ausgestoßen. Aus der Impulserhaltung ergibt sich die Bewegungsgleichung für die Rakete. Wir wissen bereits, dass für diese Vektoren die Bewegungsgleichungen (3.49) gelten. Zusätzlich definieren wir noch den Abstandvektor oder die relative Position der beiden Teilchen, sowie den relativen Impuls, " ' " (3.54) Der relative Impuls hat zunächst keine besondere physikalische oder geometrische Bedeutung. Seine Zeitableitung ist jedoch durch den folgenden Ausdruck gegeben, " " Außerdem finden wir für die Zeitableitung der relativen Position " 0 " 0 " ' Beides zusammen lässt sich wie folgt schreiben, 0 mit (3.55) (3.56) (3.57) Das sind die Bewegungsgleichungen für ein einzelnes Teilchen mit Ortsvektor und Impuls , das sich in einem Kraftfeld , bewegt. Die Masse dieses “fiktiven” Teilchens wird reduzierte Masse genannt. Um die Bewegungen von zwei wechselwirkenden Teilchen zu beschreiben, können wir diese offenbar in eine Schwerpunktbewegung und eine Relativbewegung zerlegen. Der Schwerpunkt bewegt sich geradlinig und gleichförmig. Die Relativbewegung entspricht formal der Bewegung eines einzelnen Teilchens in einem Kraftfeld. Statt der gekoppelten Bewegungsgleichungen für ein Zwei-Teilchen-System müssen wir also nur noch die Bewegungsgleichungen für ein einzelnes Teilchen lösen, das zwar keine physikalische Existenz hat, das wir uns aber als ein fiktives Teilchen in einem Kraftfeld vorstellen können. Um anschließend aus den Bewegungen dieses fiktiven Teilchens wieder die Bewegungen der zwei realen Teilchen zu rekonstruieren, müssen wir nur noch die Relationen (3.53) und (3.54) umkehren. Man findet für die Ortsvektoren " (3.58) 70 (c) (d) (b) (a) Abbildung 3.6: Der Schwerpunkt (a) eines abgeschlossenen Zwei-Teilchen-Systems verhält sich wie ein freies Teilchen mit Masse , Ortsvektor und Impuls . Er bewegt sich geradlinig und gleichförmig, während die beiden Teilchen eine vom jeweiligen Kraftgesetz abhängige Bewegung ausführen. Im speziellen Fall einer linearen, anziehenden Kraft verläuft die Relativbewegung (b) in Form einer Ellipse mit Mittelpunkt im Ursprung. Der Drehimpuls steht auf dieser Ebene senkrecht. und für die Impulse "- (3.59) Aus den ersten beiden Gleichungen ergibt sich unter anderem, dass der Schwerpunkt eines Zwei-TeilchenSystems immer auf der Verbindungslinie der beiden Teilchen liegt. Die typische Situation ist in Abbildung 3.6(a) dargestellt. Während sich der Schwerpunkt wie ein Teilchen der Masse mit Ortsvektor geradlinig und gleichförmig bewegt, führen die beiden Teilchen eine vom jeweiligen und Impuls Kraftgesetz abhängige Relativbewegung aus. Im dort dargestellten Fall umkreisen sie einander. Aufgabe 3.19 Man zeige, dass eine Aufspaltung der Bewegungen eines Zwei-Teilchen-Systems in Schwerpunkt- und Relativbewegung auch dann möglich ist, wenn die Wechselwirkung nicht nur vom Abstandsvektor, sondern auch von der relativen Geschwindigkeit " der beiden Teilchen abhängt. Aufgabe 3.20 Eine Aufspaltung in Schwerpunkt- und Relativbewegung ist im Prinzip auch dann m öglich, wenn die Wechselwirkung der beiden Teilchen nicht nur von ihrer relativen Position, sondern explizit von beiden Orten abhängt. Das ist mit dem dritten Newtonschen Gesetz verträglich, so dass auch dann der Schwerpunkt eine geradlinige und gleichförmige Bewegung ausführt. In welcher Art von Kraftfeld bewegt sich in diesem Fall das fiktive Teilchen, das die Relativbewegung beschreibt? Wie w ürde man zur Lösung der Bewegungsgleichungen am besten vorgehen? Ein lineares Kraftgesetz Um das ganze an einem expliziten Beispiel etwas deutlicher zu machen, betrachten wir ein lineares Kraftgesetz. Die beiden Teilchen sollen sich gegenseitig anziehen, wobei der Betrag der Anziehungskraft pro71 portional zu ihrem Abstand ist. Wir können uns dazu vorstellen, dass die beiden Teilchen durch Gummiband miteinander verbunden sind, dessen Zugkraft proportional zu seiner Länge ist. Die Kraft, die das Teilchen 7 auf das Teilchen 0 ausübt, ist dann proportional zum Abstandsvektor " und zeigt in Richtung des Teilchens 7 . Für die Kraft, die das Teilchen 0 auf das Teilchen 7 ausübt, gilt dasselbe mit umgekehrtem Vorzeichen. Es ist also " # " " # " mit 6 (3.60) Die Konstante ist eine Eigenschaft das Gummibandes, das die Teilchen miteinander verbindet. Sie wird Federkonstante genannt und hat die Dimension Kraft geteilt durch Länge, also 0 N m 0 kg s Schreiben wir die Bewegungsgleichungen des Zwei-Teilchen-Systems noch einmal in der Form (3.52) auf, so lauten sie 0 0 " # " 5, " (3.61) Nun wissen wir bereits, wie wir sie am besten lösen können. Wir betrachten zunächst das fiktive EinTeilchen-System, das durch die Bewegungsgleichungen (3.57) beschrieben wird, also 0 " ? mit (3.62) Eine spezielle Eigenschaft dieses Systems ist, dass die Bewegungsgleichungen in den gesuchten Funktionen und linear sind. In Kapitel 6 werden wir uns sehr ausführlich mit solchen Systemen beschäftigen und dort auch zeigen, mit welcher speziellen Technik man solche Differenzialgleichungen ganz allgemein lösen kann. Hier wollen wir uns mit einem gut motivierten Ansatz begnügen und zeigen, dass dieser die gewünschte Lösung liefert. Wenn wir einmal von den Konstanten und absehen, und von der Tatsache, dass die gesuchten Funktionen und keine Skalare sondern Vektoren sind, so handelt es sich um ein Gleichungssystem, das fast so aussieht wie das Gleichungsystem (2.70) oder (2.71), das wir zur Definition der Winkelfunktionen benutzt haben. Es liegt daher nahe, für die gesuchten Funktionen und einen Ansatz zu machen, der die Winkelfunktionen und 3! enthält. Da wir noch nichts über die Anfangsbedingungen gesagt haben, machen wir einen möglichst allgemeinen Ansatz, bei dem wir sowohl als auch als Linearkombination einer Sinus- und einer KosinusFunktion darstellen. Außerdem müssen wir beachten, dass das Argument der Funktionen und 1! ein Winkel, also eine dimensionslose Größe ist. Die Zeit ist aber eine dimensionsbehaftete Größe. Wir müssen sie also zunächst mit eine Größe multiplizieren, die die Dimension einer inversen Zeit hat, 0 s. Wo wir eine solche Größe her bekommen, werden wir gleich sehen. Versuchen wir also, die Bewegungsgleichungen (3.62) mit dem folgenden Ansatz zu lösen, 3! 1! Für die Zeitableitungen dieser Funktionen finden wir & 3! " 1! " (3.63) (3.64) Jetzt müssen wir das nur noch in (3.62) einsetzen und jeweils die linken und rechten Seiten der Gleichungen miteinander vergleichen. Tatsächlich finden wir, dass es sich um eine Lösung der Bewegungsgleichungen handelt, falls die folgenden Bedingungen erfüllt sind, 0 ? " 0 " 72 ' + (3.65) Durch Kombination jeweils zwei dieser Gleichungen ergibt sich (3.66) Die Lösung mit dem anderen Vorzeichen können wir ausschließen, da wir ohne Beschränkung der Allge6 annehmen können. Sonst drehen wir in (3.63) einfach das Vorzeichen von und um. meinheit Wie man leicht sieht, ist tatsächlich eine Größe der Dimension inverse Zeit, denn hat die Dimension Masse geteilt durch Zeit zum Quadrat und ist eine Masse. Die Vektoren , , und lassen sich nun leicht aus den Anfangsbedingungen bestimmen. Befindet sich das Teilchen zur Zeit 6 am Ort mit einem Impuls , so ergibt sich aus (3.63) für 6 , und anschließend aus (3.65) 0 " (3.67) Folglich ergibt sich die Bahn des Teilchens zu & 3! Das Teilchen führt eine periodische Bewegung aus. Es gilt 7 7 & (3.68) , wobei die Periode durch (3.69) gegeben ist. Wie in Abbildung 3.6(b) gezeigt wird, bewegt sich das Teilchen mit der Masse in einer durch die Vektoren und aufgespannten Ebene und beschreibt dort eine Ellipse, die periodisch durchlaufen wird. Jetzt müssen wir nur noch mit Hilfe der Formeln (3.58) die Bewegung des fiktiven Teilchens zurück in die Bewegungen der beiden realen Teilchen übersetzen. Dazu benötigen wir noch die Anfangsbedingungen für die Schwerpunktbewegung. Es ist etwas einfacher, statt der Impulse die Geschwindigkeiten anzugeben. Dann können wir (3.50) mit 6 und (3.68) wie folgt schreiben, & & 1! 1! 3! ( (3.70) Aus (3.58) ergibt sich schließlich 1 & & " ( ( (3.71) Um das ursprünglich gestellte Problem zu lösen, nämlich die Bewegung der beiden Teilchen bei vorgegebenen Anfangsbedingungen zu beschreiben, müssen wir jetzt nur noch die Anfangsbedingungen für Relativ- und Schwerpunktbewegung, also die Größen , ( , und , durch die entsprechenden Anfangsbedingungen für die beiden Teilchen, also die Anfangsorte und die Anfangsgeschwindigkeiten 73 ( 6 ausdrücken. Das ist nicht sehr schwierig. Wir müssen dazu nur (3.71) und die Ableitung davon bei auswerten. Dann finden wir ( ( $ ( ( " "-( (3.72) Wir können jetzt zu beliebigen Anfangsbedingungen die eindeutige Lösung der Bewegungsgleichung des Zwei-Teilchen-Systems angeben. Die Bewegung verläuft stets so, dass die beiden Teilchen einander mit der Periode umlaufen, während sich das System als ganzes geradlinig und gleichförmig durch den Raum bewegt. Das ist bereits der erste Schritt zur Beschreibung eines zusammengesetzten Körpers, der aus mehreren Teilchen besteht und eine räumliche Ausdehnung besitzt. Aufgabe 3.21 Zur Lösung der Bewegungsgleichungen (3.62) haben wir den Ansatz (3.63) gemacht und gesehen, dass dieser tatsächlich die Differenzialgleichungen erfüllt, wenn die Parameter die Bedingungen (3.65) erfüllen. Warum können wir sicher sein, damit die allgemeinste Lösung der Bewegungsgleichungen gefunden zu haben? Aufgabe 3.22 Eine Ellipse mit Mittelpunkt im Ursprung wird normalerweise durch ihre beiden zueinander senkrecht stehenden Halbachsen beschrieben. Es seien und zwei zueinander senkrecht stehende Vektoren. Dann beschreibt die Kurve (3.73) & 1! eine Ellipse in der durch und aufgespannten Ebene, mit Halbachsen und . Die Vektoren und bestimmen also sowohl die Halbachsen als auch die Lage der Ellipse im Raum. Die Darstellung (3.68) ist nicht von dieser Form, da und beliebig sind und daher im allgemeinen nicht zueinander senkrecht stehen. Man zeige jedoch, dass die Bahn trotzdem eine Ellipse ist und bestimme die beiden Halbachsen als Funktion von und . Zentralkraft und Drehimpuls Bei der gerade berechneten Relativbewegung von zwei wechselwirkenden Teilchen haben wir festgestellt, dass diese in einer Ebene stattfindet. Wir wollen zeigen, dass dies kein Zufall ist, sondern dass es sich um eine allgemeine Eigenschaft einer bestimmten Klasse von Wechselwirkungen handelt. Statt eines Zwei-Teilchen-Systems betrachten wir zunächst ein einzelnes Teilchen mit Masse , Ortsvektor und Impuls in einem Kraftfeld . Das Kraftfeld soll die Eigenschaft haben, dass die Kraft stets zu einem bestimmten Punkt im Raum hin oder von diesem weg gerichtet ist. Mit anderen Worten, das Teilchen wird von einem festen Punkt im Raum, dem Kraftzentrum, angezogen oder abgestoßen. Der Betrag und das Vorzeichen der Kraft können jedoch beliebig vom Ort des Teilchens abhängen. Natürlich passen wir unser Koordinatensystem dem Kraftfeld an und wählen es so, dass das Kraftzentrum im Ursprung liegt. Die Kraft , ist dann proportional zum Ortsvektor , & (3.74) An die skalare Funktion , die das Vorzeichen und den Betrag der Kraft bestimmt, stellen wir keine weiteren Forderungen. Eine Kraft dieser Art heißt Zentralkraft. Wir wollen zeigen, dass in einem Zentralkraftfeld eine Erhaltungsgröße existiert. Wir definieren dazu den Drehimpuls des Teilchens als das Kreuzprodukt des Ortsvektors mit dem Impuls, Drehimpuls 74 (3.75) (b) (a) Abbildung 3.7: Der Drehimpulsvektor definiert die momentane Drehachse eines Teilchens, wenn wir seine Bewegung als Umlaufbewegung um den Koordinatenursprung auffassen. Sein Betrag gibt an, welche Fläche der Ortsvektor des Teilchens innerhalb eines Zeitintervalls überstreicht. Da sowohl die Drehachse als auch die überstrichene Fläche von der Wahl des Ursprungs abhängen, ist auch der Drehimpulsvektor von der Wahl des Ursprungs abhängig. Der Drehimpuls hat die Dimension Länge mal Impuls, also Masse mal Länge zum Quadrat geteilt durch Zeit, 0 kg m s. Um die Bezeichnung “Drehimpuls” zu verstehen, überlegen wir uns kurz, welche geometrisch anschauliche Bedeutung dieser Vektor hat. In Abbildung 3.7(a) ist die Bahn eines Teilchens im Raum dargestellt. Wir betrachten ein kurzes Stück dieser Bahn, zwischen und . Für kleine Zeiten können wir dieses Stück der Bahn näherungsweise durch eine gerade Strecke beschreiben, also annehmen, dass die Geschwindigkeit und damit auch der Impuls des Teilchens annähernd konstant ist. Das Teilchen bewegt sich dann in einer Ebene, die durch den Ursprung verläuft und die von den Vektoren und aufgespannt wird. Der Drehimpuls steht auf beiden senkrecht, definiert also den Normalenvektor dieser Ebene. Etwas vereinfacht können wir sagen, dass der Drehimpulsvektor durch seine Richtung diejenige Ebene durch den Ursprung festlegt, auf der sich das Teilchen zum Zeitpunkt gerade bewegt. Das Teilchen befindet sich in dieser Ebene, und seine Geschwindigkeit, also der Tangentenvektor der Bahn, liegt ebenfalls in dieser Ebene. Wir können auch die Orientierung dieser Ebene durch die Bewegung des Teilchens festlegen. Blicken wir vom Ursprung aus auf das Teilchen, so bewegt es sich in eine von zwei möglichen Richtungen, so als würde es um den Ursprung kreisen. Tatsächlich können wir das kleine Stücke der Bahn statt durch eine gerade Strecke auch durch einen Kreisbogen approximieren, dessen Mittelpunkt sich im Ursprung befindet. Die Bewegungsrichtung des Teilchens legt also einen Drehsinn der Ebene fest, in der es sich bewegt. Wie man sich leicht mit Hilfe der Rechten-Hand-Regel überzeugen kann, stimmt diese Orientierung mit derjenigen überein, die durch den Normalenvektor festgelegt wird, also durch die Richtung des Drehimpulses. Zeigt der Daumen der rechten Hand in Richtung des Drehimpulsvektors, so zeigen die zur Faust zusammengerollten Finger die Umlaufrichtung des Teilchens um den Ursprung an. In diesem Sinne beschreibt der Drehimpuls eine Rotationsbewegung. Seine Richtung definiert die momentane Drehachse, um die das Teilchen rotiert. Auch der Betrag des Drehimpulses hat eine geometrische Bedeutung. Wir betrachten dazu die in Abbil- 75 dung 3.7(a) dargestellte Fläche , die der Ortsvektor in dem Zeitintervall von bis überstreicht. Für sehr kleine Zeiten ist die Fläche die eines sehr lang gezogenen Dreiecks, welches durch die aufgespannt wird. Da die Dreiecksfläche die Hälfte der Fläche eines ParalleVektoren und logramms ist, gilt näherungsweise 7 0 Teilen wir diese Gleichung durch 7 0 7 0 " (3.76) 6 , so ergibt sich und bilden anschließend den Grenzwert & " 7 0 7 (3.77) Sehen wir von dem Faktor 7 einmal ab, so gibt der Betrag des Drehimpulses an, welche Fläche der Ortsvektor des Teilchens pro Zeit überstreicht. Das alles gilt natürlich immer nur für einen kurzen Moment der Bewegung. Im allgemeinen ändert sich sowohl der Betrag als auch die Richtung des Drehimpulses mit der Zeit. Die spezielle Eigenschaft einer Zentralkraft ist jedoch, dass der Drehimpuls unter ihrem Einfluss zeitlich konstant ist. Berechnen wir nämlich die Zeitableitung des Drehimpulses, so ergibt sich * 0 * (3.78) Hier haben wir die Bewegungsgleichungen (3.32) verwendet, und die Tatsache, dass das Kreuzprodukt eines Vektors mit sich selbst verschwindet. Die Zeitableitung des Drehimpulses ist folglich durch die Größe gegeben, die als Drehmoment bezeichnet wird. Für eine Zentralkraft ist das Drehmoment aber gleich Null, denn die Kraft ist proportional zum Ortsvektor, & ! (3.79) Also ist der Drehimpuls eine Erhaltungsgröße. Da der Vektor sowohl zu also auch zu senkrecht steht, folgt daraus unmittelbar, dass die gesamte Bewegung des Teilchens in einer Ebene stattfindet, und . Außerdem ergibt sich, dass der zwar in der zu senkrechten Ebene mit dem Normalenvektor Ortsvektor des Teilchens in gleichen Zeiten gleiche Flächen in dieser Ebene überstreicht. Beides sind übrigens auch Eigenschaften der Planetenbahnen im Sonnensystem, die Kepler durch Beobachtungen derselben gefunden hatte. Wir werden darauf in Kapitel 8 noch näher eingehen, wo wir die Bahnen von Himmelskörpern unter dem Einfluss der Gravitation berechnen werden. Auch dabei handelt es sich um Zentralkräfte. Der Drehimpuls als Erhaltungsgröße spielte also bereits in den allerersten astronomischen Beobachtungen, die zur Bestätigung die Newtonsche Mechanik herangezogen wurden, eine entscheidende Rolle. Aufgabe 3.23 Man zeige, dass der Drehimpuls eines freien Teilchens genau dann gleich Null ist, wenn das Teilchen entweder ruht, oder sich auf einer Geraden durch den Ursprung bewegt. In allen anderen F ällen gibt es genau eine Ebene, die sowohl den Ursprung als auch die komplette Bahn des Teilchens enth ält. Aufgabe 3.24 Von einem freien Teilchen sind der Impuls und der Drehimpuls bekannt. Lässt sich daraus die Bahn des Teilchens bestimmen? Wenn ja, wie? Wenn nicht, wie sehen alle m öglichen Bahnen aus, die zu den gegebenen Daten passen? Es sei 7 7 " (3.80) wobei zwei Konstanten der Dimension Impuls bzw. Drehimpuls sind. Man bestimme eine Bahn für ein freies Teilchen mit diesen Daten. 76 Aufgabe 3.25 Ein Teilchen bewegt sich in einem Zentralkraftfeld. Es bewegt sich auf das Kraftzentrum zu, erreicht zu einem Zeitpunkt einen minimalen Abstand, und entfernt sich wieder. Sonst ist über die Bewegung nichts bekannt. Der minimale Abstand, den das Teilchen erreicht, sei , und der Betrag des Impulses zu diesem Zeitpunkt sei . Man zeige, dass der Betrag des Drehimpulses, der in diesem Fall eine Erhaltungsgröße ist, durch gegeben ist. Gesamt-, Schwerpunkt- und innerer Drehimpuls Es war also kein Zufall, dass die Relativbewegung der beiden Teilchen in dem zuletzt diskutierten Beispiel in einer Ebene stattfand. Das Kraftgesetz " , von dem wir dort ausgegangen sind, war nämlich eine Zentralkraft (3.74), mit " . Allerdings hatten wir dort ursprünglich ein Zwei-TeilchenSystem betrachtet, das sich formal auf ein fiktives Ein-Teilchen-System reduzieren ließt, während wir hier von Anfang an nur ein einzelnes Teilchen in einem äußeren Kraftfeld untersucht haben. Wir wollen daher die Definition des Drehimpulses auf ein -Teilchen-System erweitern. Natürlich können wir für jedes einzelne Teilchen mit Ortsvektor und Impuls einen Drehimpuls einführen, (3.81) Nun nehmen wir an, dass sämtliche Wechselwirkungen zwischen den Teilchen durch Zentralkräfte gegeben sind. Das Kraftzentrum ist jetzt natürlich das jeweils andere Teilchen, das heißt die Teilchen ziehen sich gegenseitig an oder stoßen sich ab. Die Kräfte sind dann proportional zum jeweiligen Abstandsvektor, " " (3.82) , die die Vorzeichen und Beträge der Kräfte bestimmen, im einzelnen Wovon die skalare Größen abhängen, ist an dieser Stelle wieder nicht wichtig. Es soll aber das dritte Newtonsche Gesetz gelten, also " " " (3.83) Zusätzlich kann auf jedes Teilchen noch eine äußere Kraft wirken, von der wir aber ebenfalls annehmen, dass es sich um eine Zentralkraft handelt. In diesem Fall ist das Kraftzentrum wieder der Ursprung des Koordinatensystems, (3.84) $ Für die Ableitung des Drehimpulses des Teilchens nach der Zeit gilt dann " " . (3.85) Der erste Ausdruck in der zweiten Zeile ist Null, da eine äußere Zentralkraft auf ein einzelnes Teilchen kein Drehmoment ausübt. Es bleibt aber ein nicht verschwindender Term stehen, der von den Wechselwirkungen der Teilchen herrührt. Die einzelnen Drehimpulse der Teilchen sind keine Erhaltungsgrößen. Summieren wir jedoch über alle Teilchen und bilden den Gesamtdrehimpuls Gesamtdrehimpuls (3.86) so ist dies eine Erhaltungsgröße. Für die Zeitableitung gilt nämlich " 77 (3.87) Die Summe läuft wieder über alle Paare mit . Folglich gibt es zu jedem Paar ein entsprechendes Gegenpaar . Die Beiträge dieser beiden Paare haben sich auf. Es ist nämlich wegen , aber " . Also haben wir gezeigt, dass der Gesamtdrehimpuls eine (3.83) Erhaltungsgröße ist, ! konst (3.88) Das gilt für jedes System von Teilchen, die über Zentralkräfte miteinander wechselwirken, und unabhängig davon, wovon die Kräfte sonst noch abhängen. Außerdem können äußere Kräfte vorliegen, solange dies auch Zentralkräfte sind und das Kraftzentrum im Koordinatenursprung liegt. In Systemen mit Zentralkräften ist der Gesamtdrehimpuls eine Erhaltungsgröße. Offenbar scheint hier die Wahl des Koordinatenursprung eine spezielle Rolle zu spielen, während sie zum Beispiel beim Gesamtimpuls als Erhaltungsgröße völlig unerheblich ist. Das liegt daran, dass der Drehimpuls eines Teilchens, genau wie sein Ortsvektor, immer nur relativ zu einem ausgewählten Bezugspunkt definiert werden kann. Der Ortsvektor tritt in der Definition (3.75) explizit auf, und auch aus dem Ver gleich der Abbildungen 3.7(a) und (b) sollte klar werden, dass der Drehimpuls im Gegensatz zum Impuls eines Teilchens von der Wahl des Ursprungs abhängt. verschieben, und einen neuen DrehimWas passiert, wenn wir den Ursprung um einen Vektor puls bezüglich des neuen Ursprungs definieren? Wie wir aus (3.6) wissen, hängt der neue Ortsvektor und mit dem alten Ortsvektor des Teilchens über " zusammen, während der Impuls unter ei ner Verschiebung des Ursprungs invariant ist, . Definieren wir den Drehimpuls bezüglich des neuen Ursprungs, so finden wir " " . " (3.89) Bei einer Verschiebung des Ursprungs um den Vektor transformiert sich der Drehimpuls um einen Vek tor, der durch das Kreuzprodukt der Verschiebung mit dem Impuls gegeben ist. Daraus können wir verschiedene interessante Schlüsse ziehen. Zunächst stellen wir fest, dass wir zwar den Drehimpuls bezüglich jedes beliebigen Punktes im Raum definieren können, indem wir diesen Punkt als Ursprung des Koordinatensystems wählen. Aber diese Größen sind nicht voneinander unabhängig. Wenn wir den Drehimpuls eines Teilchens bezüglich irgendeines Punktes im Raum kennen, sowie seinen Impuls, so können wir den Drehimpuls bezüglich aller anderen Bezugspunkte ausrechnen. Außerdem gilt folgende Aussage über Erhaltungsgrößen. Wenn sowohl der Impuls als auch der Drehimpuls bezüglich eines bestimmten Bezugspunktes Erhaltungsgrößen sind, so gilt das auch für den Drehimpuls bezüglich irgendeines anderen Punktes im Raum. Für ein einzelnes Teilchen ist diese Aussage ziemlich uninteressant, da der Impuls nur dann eine Erhaltungsgröße ist, wenn das Teilchen frei ist und sich ohnehin nur geradlinig und gleichförmig bewegt. Aber für ein System von mehreren Teilchen ist sie interessant. Für den Gesamtdrehimpuls eines Systems von mehreren Teilchen gilt nämlich dasselbe Transformationsverhalten bei Verschiebung des Ursprungs. Aufgabe 3.26 Es sei der Gesamtdrehimpuls eines -Teilchen-Systems bezüglich des Ursprungs , und . Man zeige, der entsprechende Gesamtdrehimpuls bezüglich eines anderen Ursprungs , mit dass dann " (3.90) gilt, wobei der Gesamtimpuls des Systems ist. Liegt ein abgeschlossenes System von Teilchen vor, deren Wechselwirkungen durch Zentralkräfte beschrieben werden, so ist sowohl der Gesamtimpuls als auch der Gesamtdrehimpuls bezüglich jedes beliebigen Ursprungs eine Erhaltungsgröße. Allerdings gilt auch hier, dass nicht alle diese Größen unabhängig sind, denn sie hängen über die Beziehung (3.90) zusammen. 78 Schließlich können wir in diesem Fall noch eine weitere interessante Erhaltungsgröße angeben, die wir weiter oben sogar schon benutzt haben. Bilden wir nämlich aus dem Ortsvektor des Schwerpunktes und dem Gesamtimpuls eines abgeschlossenen Systems einen Drehimpulsvektor des Schwerpunktes, den wir mit bezeichnen, Schwerpunktdrehimpuls / (3.91) so ist zunächst auch dies eine Erhaltungsgröße. Denn der Schwerpunkt eines abgeschlossenen Systems bewegt sich wie ein freies Teilchen, also wirkt auf ihn insbesondere kein Drehmoment. Man könnte vermuten, dass dieser Schwerpunktdrehimpuls daselbe ist wie der Gesamtdrehimpuls . Schließlich ist der Schwerpunktimpuls ja auch gleich dem Gesamtimpuls des Systems. Man kann sich aber leicht davon überzeugen, dass dies nicht der Fall ist. Nur für ein einzelnes Teilchen ist . Für ein System aus mehreren Teilchen bezeichnet man die Differenz innerer Drehimpuls " (3.92) als inneren Drehimpuls. Auch dies ist natürlich eine Erhaltungsgröße, wenn das System abgeschlossen ist und alle Kräfte Zentralkräfte sind. Diese Größe ist deshalb interessant, weil sie nicht von der Wahl des Ursprungs abhängt. Aufgabe 3.27 Man beweise, dass bei einer Verschiebung des Ursprungs punktdrehimpuls das Transformationsgesetz (3.90) gilt, und dass folglich für den inneren Drehimpuls " / auch für den Schwer- (3.93) gilt. Für ein Zwei-Teilchen-Systems ist der innere Drehimpuls nichts anderes als der Drehimpuls der Relativbewegung. Wie wir im letzten Abschnitt gezeigt haben, lässt sich ein abgeschlossenes Zwei-Teilchen-System in eine Schwerpunkt- und eine Relativbewegung zerlegen, wobei die Relativbewegung formal als die Bewegung eines fiktiven, einzelnen Teilchens beschrieben werden kann. Ortsvektor und Impuls dieses Teilchens waren durch (3.54) gegeben. Bilden wir daraus den Drehimpulsvektor der Relativbewegung, der in Abbildung 3.6(b) dargestellt ist, so ergibt sich " ' " " " (3.94) (3.95) Für den Schwerpunktdrehimpuls gilt anderseits . Addieren wir die beiden Gleichungen, so bekommen wir 79 (3.96) . Der innere Drehimpuls " also den Gesamtdrehimpuls. Aus der Definition folgt also eines Zwei-Teilchen-Systems ist der Drehimpuls des fiktiven Teilchens, welches die Relativbewegung der beiden realen Teilchen beschreibt. In diesem Fall besteht übrigens kein Zweifel über den zu wählenden Bezugspunkt. Der Raum, in dem die Relativbewegung zweier Teilchen stattfindet, ist kein affiner Raum sondern ein Vektorraum. Es gibt einen ausgezeichnet Nullpunkt in diesem Raum. Das fiktive Teilchen befindet sich genau dann an diesem Nullpunkt, wenn sich die beiden realen Teilchen im physikalischen Raum an demselben Ort befinden. Das erklärt auch, warum der innere Drehimpuls eines -Teilchen-Systems unabhängig von irgendeinem Bezugspunkt definiert ist. Hier dient gewissermaßen der Schwerpunkt des Systems als “dynamischer” Bezugspunkt. Der innere Drehimpuls eines Systems aus vielen Teilchen ist der Gesamtdrehimpuls bezüglich des Schwerpunktes. Zusammenfassend können wir festhalten, dass in einem abgeschlossenen System mit Zentralkräften zunächst der Gesamtimpuls eine Erhaltungsgröße ist, und daher der Schwerpunkt eine geradlinige und gleichförmige Bewegung ausführt. Diese Schwerpunktbewegung kann von den Relativbewegungen der Teilchen entkoppelt werden. Zusätzlich existiert dann noch der innere Drehimpuls als Erhaltungsgröße, die verwendet werden kann, um die Bewegungsgleichungen für die Relativbewegung zu vereinfachen. Für ein Zwei-Teilchen-System entspricht die Relativbewegung der Bewegung eines fiktiven Teilchens in einem Zentralkraftfeld, und der innere Drehimpuls ist der gewöhnliche Drehimpuls dieses fiktiven Teilchens. Aufgabe 3.28 Man berechne für die explizit durch (3.71) gegebenen Bahnen von zwei Teilchen die Dre himpulse 3 , , den Gesamtdrehimpuls , den Schwerpunktdrehimpuls , und den inneren Drehimpuls . Aufgabe 3.29 Wir betrachten ein System von Teilchen, die über Zentralkräfte miteinander wechselwirken. Zusätzlich wirkt auf alle Teilchen dieselbe konstante äußere Kraft, zum Beispiel die Gravitationskraft (3.29). Da es sich weder um ein abgeschlossenes System handelt, noch alle Kr äfte Zentralkräfte sind, ist weder der Gesamtimpuls , noch der Gesamtdrehimpuls eine Erhaltungsgröße. Man zeige jedoch, dass der innere Drehimpuls eine Erhaltungsgröße ist. Aufgabe 3.30 Man löse die Bewegungsgleichungen für ein Zwei-Teilchen-System, wobei auf beide Teilchen die Gravitationskraft (3.29) wirkt, sowie eine lineare Wechselwirkung der Form (3.60) vorliegt. Als Anfangsbedingung sei vorgegeben, dass sich das Teilchen 0 zum Zeitpunkt 6 in einer H öhe senkrecht über dem Teilchen 7 befindet und dort ruht, während sich das Teilchen 7 mit der Geschwindigkeit in horizontale Richtung bewegt. Bei einer geeigneten Wahl des Koordinatensystems gilt dann ? ! ( ! ( (3.97) Man berechne die Zeit , die es dauert, bis beide Teilchen zum ersten Mal auf gleicher H öhe sind, also die gleiche -Koordinaten haben, und bestimme diese Höhe. 4 Die Gravitationskraft Wir haben bereits den freien Fall eines Teilchens im Schwerefeld der Erde in der Nähe ihrer Oberfläche berechnet. Dort konnten wir annehmen, dass die Erde eine konstante Anziehungskraft auf das Teilchen ausübt, die unabhängig von Ort und Zeit ist. Das gilt natürlich nicht mehr, wenn wir uns weiter von der Erdoberfläche entfernen, und wenn die beteiligten Körper selbst größere Himmelskörper sind. Um die Bewegungen vom Himmelskörpern zu beschreiben, die durch Gravitationskräfte miteinander wechselwirken, müssen wir dafür ein allgemeineres Kraftgesetz formulieren. Auch dieses Kraftgesetz 80 replacements (c) (d) (b) (a) Abbildung 4.1: Die Gravitationskräfte als Wechselwirkungen zwischen Paaren von Teilchen (a). Jedes Teilchen wird von allen anderen Teilchen angezogen, wobei der Betrag der Kraft von den Massen der beteiligten Teilchen und von deren Abstand abhängt. Als spezielle Lösung der Bewegungsgleichungen für ein Zwei-Teilchen ergibt sich eine kreisförmige Bewegung der beiden Teilchen um den gemeinsamen Schwerpunkt (b). geht auf Newton zurück, der als erster erkannte, dass die Wechselwirkungen zwischen Himmelskörpern letztlich die gleiche Ursache haben wie der freie Fall in der Nähe der Erdoberfläche. Auf dieser Erkenntnis, gestützt durch die Beobachtungen von Galilei und Kepler, beruhte der große Erfolg der klassischen Mechanik. Es war die erste physikalische Theorie, die in einheitlicher Weise sowohl irdische als auch kosmische Vorgänge beschreiben konnte. Das Newtonsche Gravitationsgesetz besagt, dass ein als punktförmig angenommener Körper der Masse am Ort auf einen ebenfalls punktförmigen Körper der Masse am Ort eine anziehende Kraft ausübt, deren Betrag proportional zu den beiden Massen und umgekehrt proportional zum Quadrat des Abstands der beiden Körper ist. In Formeln ausgedrückt, und mit der im letzten Kapitel eingeführten Notation gilt Gravitationskraft " " " (4.1) Es handelt sich um eine Zentralkraft der Form (3.82), deren Betrag nur vom Abstand der beiden Teilchen abhängt. Das negative Vorzeichen besagt, dass die Kraft stets anziehend ist. Die universelle Konstante , die in diesem Kraftgesetz auftritt, heißt Gravitationskonstante. Sie hat den Wert 6: 0 6 N m kg 6: 0 6 m kg s (4.2) Soweit dies im Rahmen der klassischen Physik möglich ist, beschreibt das Newtonsche Gravitationsgesetz praktisch die gesamte Himmelsmechanik, insbesondere die Bewegungen der Planeten im Sonnensystem. Trägheit und Gewicht Dass die Anziehungskraft zwischen zwei Teilchen proportional zu deren Massen ist, hat eine interessante Konsequenz. Betrachten wir nämlich die Bewegungsgleichung zweiter Ordnung für eines der beteiligten Teilchen, " 81 " " (4.3) so kürzt sich die Masse dieses Teilchens aus der Gleichung heraus, " " " (4.4) Die Beschleunigung, die das Teilchen durch die Anziehungskräfte der anderen Teilchen erfährt, hängt nur von deren Massen ab, sowie von den relativen Positionen der anderen Teilchen, aber nicht von der Masse des Teilchens selbst. Um zu verstehen, was das anschaulich bedeutet, betrachten wir ein System von mehreren Teilchen, die nur über Gravitationskräfte miteinander wechselwirken. Eines dieser Teilchen soll ein Testteilchen sein. Ein Testteilchen hat eine so kleine Masse, dass es zwar die Anziehungskräfte der anderen beteiligten Körper spürt, umgekehrt aber die Anziehungskraft, die es auf die anderen Körper ausübt, vernachlässigt werden kann. Ein typisches Beispiel wäre ein kleines Raumfahrzeug, das sich im Sonnensystem allein unter dem Einfluss der Gravitationskräfte der Sonne und der Planeten bewegt. die Masse des RaumFür dieses Raumfahrzeug gilt eine Bewegungsgleichung der Form (4.3), wobei fahrzeugs ist. Für die Planeten und die Sonne gilt eine entsprechende Bewegungsgleichung. Jedoch können wir dort den Beitrag des Raumfahrzeugs vernachlässigen, denn die Anziehungskraft des Raumfahrzeugs auf die Planeten und die Sonne ist sehr viel kleiner als die gegenseitigen Anziehungskräfte dieser Körper. Das Raumfahrzeug als Testteilchen beeinflusst die Bewegungen der Planeten nicht. Letztlich folgt aus dieser Überlegung, dass die Masse des Raumfahrzeugs in gar keiner Bewegungsgleichung mehr auftritt. Aus der für das Raumfahrzeug kürzt sie sich heraus, und in den Bewegungsgleichungen für die Sonne und die Planeten ist sie vernachlässigbar klein. Somit hängt die Bahn , die das Raumfahrzeug beschreibt, nur von den Anfangsbedingungen und für das Raumfahrzeug und von den Bahnen von der Sonne und den Planeten ab. Sie hängt aber nicht von der Masse oder irgendeiner anderen Eigenschaft des Raumfahrzeugs ab. Einen Körper, auf den nur Gravitationskräfte wirken, bezeichnet man als frei fallenden Körper. Die Bahn eines solchen frei fallenden Körpers hängt also, sofern seine Masse im Vergleich zu den Massen der anderen Körper vernachlässigbar ist, nicht von irgendwelchen Eigenschaften des Körpers ab, sondern nur von den Anfangsbedingungen. Das lässt sich auch wie folgt formulieren: Unter dem Einfluss von Gravitationskräften fallen alle Testteilchen gleich schnell. Das ist ein sehr merkwürdiges Phänomen, das wir zwar aus dem Alltag kennen, für das es aber im Rahmen der klassischen Mechanik keine Erklärung gibt. Es ist gewissermaßen ein “Zufall”, dass auf beiden Seiten der Bewegungsgleichung (4.3) dieselbe Größe auftritt, nämlich die Masse des jeweiligen Teilchens. Wir erinnern uns, dass wir die Masse als ein Maß für die Trägheit eines Körpers eingeführt hatten. Je größer die Masse ist, desto mehr widersetzt sich ein Körper gegen eine auf ihn einwirkende Kraft, die ihn beschleunigen will. Die Eigenschaft eines Körpers, Gravitationskräfte zu spüren, nennt man Gewicht. Je größer das Gewicht eines Körpers ist, desto größer ist die Anziehungskraft, die er in Anwesenheit anderer Körper verspürt, und umso größer ist auch, nach dem dritten Newtonschen Gesetz, die Anziehungskraft, die er auf andere Körper ausübt. Auf den ersten Blick haben diese beiden Eigenschaften von Körpern oder Punktteilchen gar nichts miteinander zu tun. Im Prinzip wäre es denkbar, dass ein Teilchen doppelt so träge ist wie ein anderes, aber nur halb so schwer. Es würde dann unter dem Einfluss von Anziehungskräften anderer Körper nur ein Viertel der Beschleunigung des anderen Teilchens erfahren. Das merkwürdige am Newtonsche Gravitationsgesetz ist, dass es die Existenz solcher unterschiedlich gearteter Teilchen ausschließt. Es ist dieselbe physikalische Größe, nämlich die Masse eines Teilchens, die zwei ganz verschiedene Eigenschaften des Teilchens bestimmt, nämlich seine Trägheit und sein Gewicht. Natürlich ist das eine Aussage der Theorie, die experimentell überprüft werden kann. Dass verschiedene Körper im Schwerefeld der Erde gleich schnell fallen, ist eine Erkenntnis, die auf Galilei zurück geht. Es 82 gilt zwar heute als fraglich, ob er tatsächlich die oft zitierten Fallexperimente am schiefen Turm von Pisa ausgeführt hat. Er selbst hat nämlich nie über solche Experimente berichtet. Aber unbestritten ist, dass er durch Experimente und theoretische Überlegungen zu dem Schluss gekommen ist, dass der Schlüsselbegriff zur Beschreibung des freien Falles die Beschleunigung ist. Er konnte damit erklären, dass alle Körper gleicher Art unabhängig von ihrer Größe gleich schnell fallen. Eine Eisenkugel von einem Kilogramm erfährt die gleiche Beschleunigung wie eine Eisenkugel von zehn Kilogramm. Die Begründung ist ganz einfach. Man kann eine Eisenkugel von zwei Kilogramm in zwei Teile zerlegen, die jeweils ein Kilogramm schwer sind. Lässt man diese nebeneinander fallen, so kann die Fallbeschleunigung nicht davon abhängen, ob man das ganze als ein fallendes Objekt oder als zwei fallende Objekte beschreibt. Also kann die Bahn eines fallenden Körpers nicht von dessen Größe abhängen, solange nicht andere, von der Größe abhängigen Kräfte wie etwa die Luftreibung auf ihn einwirken. Was jedoch Galilei mit diesem Argument nicht erklären konnte, war die Tatsache, dass auch Körper ganz verschiedener Art gleich schnell fallen. Es ist klar, oder zumindest verständlich, dass zwei Eisenkugeln zusammen sowohl das doppelte Gewicht als auch die doppelte Trägheit einer einzelnen Eisenkugel haben. Aber warum hat jeder Körper, der doppelt so träge ist wie ein anderer, auch das doppelte Gewicht? Mit anderen Worten, warum ist das Verhältnis aus Gewicht und Trägheit für eine Eisenkugel dasselbe wie für eine Stück Holz? Auf diese Frage gibt es, wie gesagt, im Rahmen der klassischen Mechanik keine Antwort. Ein geniale Erklärung dafür, warum derselbe Parameter sowohl die Trägheit als auch das Gewicht eines Körpers bestimmt, liefert erst die allgemeine Relativitätstheorie. Aus dieser Theorie ergibt sich nämlich, dass Gewicht und Trägheit eben doch nicht zwei völlig verschiedene Eigenschaften eines Körpers sind, sondern dass sie in einem gewissen Sinne zueinander äquivalent sind. Man findet im Rahmen dieser Theorie, dass es sogar so sein muss, dass beide durch denselben Parameter bestimmt werden. Ansonsten wäre die allgemeine Relativitätstheorie nämlich inkonsistent. Warum das so ist, können wir an dieser Stelle jedoch noch nicht verstehen. Es hängt mit der Art und Weise zusammen, die in der Relativitätstheorie die Struktur von Raum und Zeit mit der Beschreibung von Gravitationsfeldern zusammenhängt. An dieser Stelle bleibt uns daher nichts anderes übrig als die Tatsache zu akzeptieren, dass Trägheit und Gewicht eines Körpers durch ein und dieselbe Größe, nämlich die Masse des Körpers bestimmt werden und diese somit auf beiden Seiten der Bewegungsgleichung (4.3) erscheint. Trägheit und Gewicht eines Körpers sind äquivalente Eigenschaften und werden durch die Masse des Körpers bestimmt. Ganz nebenbei folgt aus diesem Äquivalenzprinzip nicht nur, dass alle Körper gleich schnell fallen, sondern auch, dass man Massen auch ganz anders messen kann als mit Hilfe der Apparatur in Abbildung 3.4(b). Man kann einen Körper auch wiegen, also sein Gewicht messen, um die Masse zu ermitteln. Das ist natürlich auch der Grund, warum Messgeräte wie das in Abbildung 3.4(b) nicht sehr weit verbreitet sind. Waagen, die direkt die auf einen Körper wirkende Anziehungskraft der Erde messen, sind einfach praktischer und einfacher zu handhaben. Aufgabe 4.1 Wie groß ist die Anziehungskraft zwischen zwei Bleikugeln von jeweils 06 kg, wenn der Abstand zwischen ihnen 0 m beträgt. Obwohl die Abmessungen der Kugeln dann im Vergleich zu ihrem Abstand nicht mehr vernachlässigbar sind, betrachten wir sie hier trotzdem als punktförmig. Wie wir später zeigen werden, ist das für kugelförmige Körper sogar gerechtfertigt. Umlaufbahnen Als Beispiel betrachten wir nun ein System aus zwei Teilchen, die über die Gravitationskraft miteinander wechselwirken. Mit den Methoden, die wir bis jetzt entwickelt haben, können wir die Bewegungsglei83 chungen für ein solches System zwar noch nicht vollständig lösen. Aber wir können sie zumindest schon etwas vereinfachen, und wir können ein paar Lösungen mit speziellen Eigenschaften angeben. Wir wollen versuchen, eine ganz bestimmte Frage zu beantworten. Ist es möglich, dass sich die beiden Körper umkreisen, also eine periodische Umlaufbewegung ausführen? Solche Bewegungen treten typischerweise bei Paaren von Himmelskörpern auf, die sich gegenseitig anziehen. Der Einfachheit halber werden wir uns zunächst auf kreisförmige Umlaufbahnen beschränken, das heißt der Abstand der beiden Körper soll während der Umlaufbewegung konstant bleiben, und die Umlaufbahn soll in einer Ebene liegen. Wir schreiben zunächst die Bewegungsgleichungen für das Zwei-Teilchen-System auf, so wie sie sich aus (4.1) ergeben, nachdem wir die Massen herausgekürzt haben, "" " " " " (4.5) Da das dritte Newtonsche Gesetz erfüllt ist, ist der Gesamtimpuls eine Erhaltunggröße. Wir können die Bewegung der Teilchen in eine Schwerpunkt- und eine Relativbewegung zerlegen. Wir müssen dazu gar nicht die Impulse als Hilfsfunktionen einführen, sondern können direkt die Bewegungsgleichungen zweiter Ordnung entsprechend umformen. Wir setzen " (4.6) und erhalten durch Addition bzw. Subtraktion der Bewegungsgleichungen (4.5) ! " mit (4.7) Die Bewegungsgleichung für den Schwerpunkt können wir unmittelbar lösen. Da es sich um ein abgeschlossenes mechanisches System handelt, bewegt sich der Schwerpunkt geradlinig und gleichförmig, (4.8) Mit dem Index 6 bezeichen wir wieder die Anfangswerte bei 6 , hier also den Ortsvektor des Schwerpunktes und seine konstante Geschwindigkeit . Interessant ist nur die Bewegungsgleichung für die Relativbewegung der beiden Teilchen, also die zweite Gleichung in (4.7). Da sich die Massen zum Teil aus den Bewegungsgleichungen herauskürzen, ist es hier gar nicht nötig, die reduzierte Masse einzuführen. Die Bewegungsgleichung für die Relativbewegung der beiden Massen. Auch das ist wieder eine Konsequenz enthält als einzigen Parameter die Summe der Äquivalenz von Trägheit und Gewicht. Gesucht ist nun eine spezielle Lösung für die Relativbewegung der beiden Teilchen. Die Bewegung soll in einer Ebene stattfinden, und der Abstandsvektor soll eine konstante Länge haben. Dass die Bewegung in einer Ebene stattfindet, ist keine besondere Einschränkung. Da es sich bei der Gravitationskraft um eine Zentralkraft handelt, ist der Drehimpuls der Relativbewegung, oder der innere Drehimpuls, eine Erhaltungsgröße. Also findet die Relativbewegung in einer Ebene senkrecht zu statt. ist, mit 6 . Der Abstandsvektor liegt Wir können das Koordinatensystem so wählen, dass dann in der 4 - -Ebene und läuft im positiven Sinn, also gegen der Uhrzeigersinn um. Um eine kreisförmige Umlaufbewegung mit dem konstanten Abstand und der Umlaufzeit zu beschreiben, machen wir den Ansatz 7 3! mit (4.9) 84 Die Konstante wird als Kreisfrequenz oder Winkelgeschwindigkeit bezeichnet. Der Winkel zwischen der 4 -Achse und dem Ortsvektor des Teilchens ist < , das heißt ist die Ableitung dieses Winkels nach der Zeit. Die entscheidende Frage ist nun, ob die Bahn (4.9) eine Lösung der Bewegungsgleichung ist. Wir berechnen zunächst die Ableitungen und finden & & " " 1! , 3! " " (4.10) Eingesetzt in (4.7) ergibt sich, mit (4.11) Offenbar ist diese Gleichung genau dann erfüllt, wenn zwischen dem Radius bzw. der Umlaufzeit die folgende Beziehung besteht, 3. Keplersches Gesetz und der Kreisfrequenz 7 (4.12) Es gibt also spezielle Lösungen der Bewegungsgleichungen, die kreisförmige Umlaufbahnen beschreiben. Um die eigentlichen Bewegungen der beiden Teilchen im Raum zu beschreiben, müssen wir die gefunden Lösungen für die Schwerpunkt- und Relativbewegung nur noch in die Formeln (3.58) einsetzen. Das ergibt 3 & & " 1! 3! " mit mit (4.13) Die Lösung ähnelt sehr der Bewegung (3.71) eines Systems von zwei Teilchen mit einem linearen Kraftgesetz. Die Teilchen umkreisen einander, während sich das System als ganzes geradlinig und gleichförmig durch den Raum bewegt. Allerdings müssen wir beachten, dass wir hier nur eine sehr spezielle Lösung angegeben haben. Wir haben nicht die Lösung der Bewegungsgleichungen zu einem beliebigen Satz von Anfangsbedingungen gefunden. Da die Schwerpunktbewegung völlig uninteressant ist, betrachten wir den speziellen Fall ! und ! , der in Abbildung 4.1(b) dargestellt ist, 3 & 1! " 3! " (4.14) Die Teilchen umkreisen in diesem Fall den gemeinsamen Schwerpunkt, der im Koordinatenursprung ruht. Die Radien der beiden Kreisbahnen verhalten zueinander wie die Massen . Ein besonders interessanter Fall ergibt sich, wenn wir zusätzlich noch annehmen, dass die Masse sehr viel größer ist als die Masse , eins der Teilchen also sehr schwer und das andere sehr leicht ist. Wenn wir in (4.14) den Grenzwert und 6 , uns somit 6 bilden, so finden wir 1 1! ! (4.15) Das schwere Teilchen ruht im Ursprung, während das leichte Teilchen auf einer Kreisbahn mit dem Radius umläuft. Zwischen der Umlaufzeit 7 und dem Bahnradius besteht natürlich immer noch die Beziehung (4.12). Allerdings können wir für die Gesamtmasse jetzt auch die Masse des schweren Teilchens einsetzen. 85 Eine andere Möglichkeit, zu diesem Ergebnis zu kommen, setzt bereits bei den Bewegungsgleichungen an. Wenn eines der Teilchen sehr schwer ist, können wir seine durch die Anziehungskraft des leichten Teilchens verursachte Beschleunigung wegen seiner großen Trägheit vernachlässigen. Wir können also annehmen, dass das schwere Teilchen im Koordinatenursprung ruht. Das leichte Teilchen bewegt sich dann in einem konstanten äußeren Kraftfeld, welches durch die Anziehungskraft des ruhenden Teilchens gegeben ist. Die Bewegungsgleichung in diesem Kraftfeld ist genau die für die Relativbewegung in (4.7), wobei für die Masse des schweren Teilchens einzusetzen ist. Daraus können wir folgenden Schluss ziehen. Wenn ein sehr leichtes Teilchen ein schweres umkreist, , also das Verhältnis der dritten Potenz des Bahnradius zum Quadrat der Umdann ist die Größe laufzeit eine Konstante, die nur von der Masse des schweren Teilchens abhängt. Das gilt auch dann noch, wenn mehrere leichte Teilchen das schwere Teilchen umkreisen. Wenn wir nämlich die Anziehungskraft des leichten Teilchens auf das schwere Teilchen vernachlässigen können, dann können wir auch die Wechselwirkungen der leichten Teilchen untereinander vernachlässigen. Jedes Teilchen läuft auf einer eigenen für jede Umlaufbahnen dasselbe ist. Bahn (4.15), wobei das Verhältnis Das ist genau die Situation, die im Sonnensystem vorliegt. Mehrere leichte Teilchen, die Planeten, umkreisen ein schweres Teilchen, die Sonne. Die Umlaufzeiten und Bahnradien der Planeten lassen sich konst für die Planeleicht durch Beobachtung bestimmen. Tatsächlich hatte Kepler die Relation tenbahnen bereits gefunden, und zwar etwa 06 6 Jahre bevor Newtons sein Gravitationsgesetz aufgestellt hatte. Die Bestätigung dieses Zusammenhangs, der auch als drittes Keplersches Gesetz bezeichnet wird, war deshalb eine der wichtigsten frühen Erfolge der Newtonschen Gravitationstheorie und damit auch der klassischen Mechanik. Es war die erste und zugleich wichtigste experimentelle Bestätigung der Newtonschen Theorie auf dem Gebiet der Himmelsmechanik. Tatsächlich war auch schon zu Keplers Zeiten bekannt, dass die Planetenbahnen nicht, wie wir hier angenommen haben, exakte Kreise sind. Derselbe Zusammenhang zwischen Umlaufzeit und Bahnradius gilt aber auch für nicht kreisförmige Bahnen, wie wir in Kapitel 8 zeigen werden. Allerdings müssen wir dazu zunächst die allgemeine Lösung der Bewegungsgleichungen finden, was wir an dieser Stelle noch nicht können. Und natürlich müssen wir den “Radius” durch eine andere Größe ersetzen, die die Abmessung der Bahn festlegt, wenn diese nicht kreisförmig ist. Das dritte Keplersche Gesetz ist also etwas allgemeiner als es hier dargestellt ist. Das ändert aber nichts an der Feststellung, dass bereits die relativ grobe Näherung, bei der sich die Planeten auf Kreisbahnen bewegen, das Newtonsche Gravitationsgesetz in dieser eindruckvollen Art und Weise bestätigt. Was daran auch bemerkenswert ist, ist die Tatsache, dass keinerlei Kenntnis der Sonnenmasse, der Gravitationskonstante oder gar der Massen der Planeten nötig ist, um das Gravitationsgesetz qualitativ zu bestätigen. Auch das ist eine Konsequenz der Äquivalenz von Trägheit und Gewicht. Würden die Umlaufzeiten nämlich auch von den Massen der Planeten abhängen, so wäre eine derart einfache experimentelle Bestätigung nicht möglich. Denn die Planetenmassen lassen sich nur schwer direkt messen. Aufgabe 4.2 Man verschaffe sich die Daten der Planetenbahnen aus einer geeigneten Quelle, best ätige das dritte Keplersche Gesetz und berechne daraus die Masse der Sonne. Aufgabe 4.3 Ein Teilchen der Masse wird von einem Kraftzentrum angezogen. Der Betrag der Kraft sei durch eine Funktion des Abstands gegeben. Das Teilchen bewegt sich also in einem Zentralkraftfeld & " (4.16) Man bestimme alle Lösungen der Bewegungsgleichung, bei denen das Teilchen auf einer Kreisbahn umläuft, 3! & (4.17) 86 Welche Beziehung besteht zwischen dem Radius und der Umlaufzeit Beschränkung der Allgemeinheit jede Kreisbahn so darstellen? 7 ? Warum l ässt sich ohne Aufgabe 4.4 Als Newton seine Gravitationstheorie formulierte, kannte er die “experimentellen” Arbeiten von Kepler und Galilei, die beide etwa hundert Jahre vor ihm lebten. Insbesondere wusste er, dass das Verhältnis aus Bahnradius hoch drei und Umlaufzeit hoch zwei für alle bekannten Planeten dasselbe war, und er wusste, dass kleine Testkörper unter dem Einfluss der Erdanziehung gleich schnell fallen. Welche Überlegungen führten ihn, ausgehend von diesen Beobachtungen und dem Ergebnis von Aufgabe 4.3 zu seinem Gravitationsgesetz (4.1)? Aufgabe 4.5 Man berechne den Impuls und den Drehimpuls des leichten Teilchens auf der Bahn 5 1 aus (4.15). Warum ist der Drehimpuls des Teilchens in diesem Fall eine Erhaltungsgröße? Welche Fläche überstreicht der Ortsvektor in einer Zeit ? Aufgabe 4.6 Welche Beziehung muss zwischen dem Anfangsort und der Anfangsgeschwindigkeit ( der Relativbewegung der beiden Teilchen gelten, damit sich als L ösung der Bewegungsgleichung eine Kreisbahn ergibt. Der senkrechte Fall Die Frage nach den kreisförmigen Umlaufbahnen ließ sich offenbar sehr einfach beantworten. Nun wollen wir eine etwas schwierigere Frage stellen, deren Sinn hauptsächlich darin liegt, eine typische Methode zur Lösung von Bewegungsgleichungen vorzustellen, die wir später noch etwas besser formalisieren und verallgemeinern werden. Der Ausgangspunkt ist diesmal eine ganz bestimmte Anfangsbedingung für das Zwei-Teilchen-System. Zum Zeitpunkt 6 sollen sich die beiden Teilchen relativ zueinander in Ruhe befinden und einen 6 haben. Da sich die Teilchen gegenseitig anziehen, werden sie sich aufeinander zu bewegen. Abstand Wie lange dauert es, bis sie zusammenstoßen? Mit anderen Worten, zu welcher Zeit wird der Abstand zwischen den Teilchen gleich Null sein? Die Schwerpunktbewegung der Teilchen ist für diese Frage irrelevant, so dass wir uns ganz auf die Berechnung Relativbewegung beschränken können. Vorgegeben sind die Anfangsbedingungen 6 und 6 < ! . Auch hier können wir wieder das Koordinatensystem an das gestellte Problem anpassen. Wir wählen es so, dass der Abstandsvektor zur Zeit 6 in die Richtung der 4 -Achse zeigt, also 6 & 6 & ! (4.18) Wir können dann davon ausgehen, dass die Relativbewegung nur in Richtung der 4 -Achse erfolgt. Die Gravitationskraft ist nämlich eine Zentralkraft. Sie kann die Teilchen also nur entlang der 4 -Achse beschleunigen, wenn sie sich in der Position (4.18) befinden, und das wiederum führt dazu, dass sie sich relativ zueinander auchnur in 4 -Richtung bewegen können. Wir machen daher zur Lösung der Bewegungsgleichung den Ansatz 4 4 " 4 (4.19) 6 annehmen, denn wir interessieren uns nur für den Abschnitt der Bahn Außerdem können wir 4 vom Zeitpunkt 6 bis zum Zeitpunkt , bei dem der Abstand zwischen den Teilchen zum ersten 4 6 6 4 6 die erste Nullstelle der Funktion 4 ist, folgt daraus Mal Null wird. Da ist und . natürlich 4 6 für 6 Setzen wir (4.19) in die Bewegungsgleichung (4.7) für die Relativbewegung ein, so ergibt sich 4 " 87 4 (4.20) Offenbar ist die Annahme, die Relativbewegung erfolge nur entlang der 4 -Achse, mit der Bewegungsgleichung verträglich. Es steht nämlich auf beiden Seiten der Gleichung ein Vektor, der zu proportional ist. Die Bewegungsgleichung ist genau dann erfüllt, wenn die Funktion 4 der folgende Differentialgleichung genügt, zu der wir noch die entsprechenden Anfangsbedingungen stellen müssen, 4 " 4 4 6 4 6 6 (4.21) Damit haben wir die physikalische Frage auf eine rein mathematische Frage zurückgeführt. Wir müssen jetzt nur noch die Differenzialgleichung (4.21) mit Anfangsbedingung lösen und die erste Nullstelle der Funktion 4 finden. Dazu benutzen wir eine spezielle Methode, die wir später noch häufiger verwenden werden. Auch sie beruht auf der Idee, zunächst die Ordnung der Differenzialgleichungen zu reduzieren und diese dann mit Hilfe von Erhaltungsgrößen zu vereinfachen. Um die Differenzialgleichung zweiter Ordnung (4.21) in eine Differenzialgleichung erster Ordnung zu transformieren, multiplizieren wir beide Seiten der Gleichung mit 4 und schreiben anschließend alle Terme auf eine Seite, 4 4 4 6 mit (4.22) 4 Wie man leicht sieht, lässt sich die linke Seite jetzt als Ableitung einer bestimmten Funktion von 4 nach der Zeit schreiben, nämlich 4 7 " 4 6 (4.23) Der Ausdruck in der Klammer hängt also nicht von der Zeit ab. Es ist eine Erhaltungsgröße. Es ist im wesentlichen die Energie, die in der Relativbewegung der beiden Teilchen steckt, aber das ist an dieser Stelle nicht wichtig. Wir werden uns in Kapitel 7 sehr ausführlich mit der Energie als Erhaltungsgröße beschäftigen und dort eine allgemeinere Version der hier verwendeten Methode zur Lösung von Bewegungsgleichungen herleiten. Hier genügt es, festzustellen, dass es sich bei dem Ausdruck in (4.23) um eine Erhaltungsgröße handelt, deren Wert wir aus den Anfangsbedingungen bestimmen können. Zur Zeit 6 ist 4 6 & und 4 6 & 6 , also gilt für alle Zeiten 4 7 4 6 7 " 4 " 4 6 " Lösen wir diese Gleichung nach 4 auf, so ergibt sich 4 & " 4 7 " 7 4 6 & (4.24) (4.25) Das Vorzeichen der Wurzel haben wir so gewählt, dass 4 6 ist. In dem relevanten Zeitintervall 6 nähern sich die Teilchen einander an, das heißt der Abstand 4 der Teilchens nimmt mit der Zeit ab. Es ist uns also gelungen, das Problem auf die Lösung einer Differenzialgleichung erster Ordnung zurückzuführen. Als Anfangsbedingung müssen wir jetzt nur noch den Abstand zur Zeit 6 vorgeben. Die zweite Anfangsbedingung, dass das Teilchen zur Zeit 6 ruhen soll, ist implizit in die Differenzialgleichung (4.25) eingegangen. An der Stelle 6 und mit 4 6 & liefert sie 4 6 & 6 . Eine Differenzialgleichung der Form (4.25) kann durch Separation der Variablen gelöst werden. Dazu schreiben wir die Differenzialgleichung zunächst wie folgt um, " 4 0 4 " 0 88 7 (4.26) Anschließend integrieren wir beide Seiten dieser Gleichung von 6 bis , 4 0 4 " 0 " 7 7 (4.27) Um den Ausdruck auf der linken Seite auszurechnen, führen wir eine Substitution durch. Als neue Integrationsvariable wählen wir 4 . Es ist dann 4 4 , und für die Integralgrenzen gilt 4 6 5 und 4 6 , also " 4 0 4 " 0 " 4 0 4 " 0 4 0 4 " 0 (4.28) Viele Differenzialgleichungen erster Ordnung lassen sich mit diesem Verfahren lösen. Gesucht ist eine Funktion 4 . Man schreibt die Differenzialgleichung so um, dass auf einer Seite der Gleichung eine bekannte Funktion von steht. Im (4.26) ist dies eine Konstante. Auf der anderen Seite der Gleichung steht ein Ausdruck, der nicht explizit von , sondern nur von der Funktion 4 abhängt und zur Ableitung 4 proportional ist. Bei der Integration beider Seiten über lässt sich dann auf einer Seite die Integration direkt ausführen, während auf der anderen Seite eine Substitution durchgeführt werden kann, wobei die Integrationsvariable durch 4 ersetzt wird. Diesen Schritt haben wir in (4.28) durchgeführt. Der Integrationsbereich ist dabei so zu wählen, wie es der jeweiligen Fragestellung entspricht. In unserem Fall haben wir von 6 bis integriert, da wir die Fallzeit ermitteln wollen. Wenn wir alles zusammensetzen, bekommen wir 0 7 4 0 7 0 0 4 " 4 4 0 " 4 (4.29) Damit haben wir das Problem fast schon gelöst. Wir müssen nur noch ein bestimmtes Integral auswerten. Um die Wurzel im Nenner zum beseitigen, führen wir nochmal eine Substitution durch. Wir setzen 4 + 0 " 0 " 4 " 7 4 0 " 4 (4.30) Die neue Integrationsvariable läuft von 0 bis 6 , wenn 4 von 6 bis läuft. Wenn wir dann noch die Grenzen des Integrals vertauschen und damit das Vorzeichen umdrehen, ergibt sich nach einer kurzen Rechnung 7 0 " (4.31) Dieses Integral können wir sofort angeben. Es berechnet den Flächeninhalt eines Viertelkreises, ist also gleich . Damit haben wir die gesuchte Fallzeit berechnet. Es ist (4.32) Aufgabe 4.7 Nehmen wir an, wir könnten die Erde auf ihre Bahn um die Sonne anhalten. Wie lange w ürde es dann dauern, bis sie in die Sonne stürzt? Die Frage lässt sich ohne besondere Kenntnis der Bahndaten der Erde sofort beantworten, wenn man die Zeit in Jahren (oder Monaten) angibt. Aufgabe 4.8 Zwei Massen von jeweils einem Kilogramm befinden sich ruhend im Abstand von einem Meter. Wir lange dauert es, bis sie aufgrund der Anziehung durch Gravitation zusammenstoßen? 89 Aufgabe 4.9 Wie groß ist die Relativgeschwindigkeit 4 der Teilchen im Moment des Zusammenstoßes? Was folgt daraus für die Funktion , wenn wir diese über den Zeitpunkt hinaus fortsetzen wollen? Ist diese Frage überhaupt physikalisch sinnvoll? Aufgabe 4.10 Man löse die folgenden Differenzialgleichung mit Anfangsbedingungen durch Separation der Variablen. Gesucht ist jeweils die Funktion 4 . 7 4 4 4 4 4 4 0 & 0 4 0 6 & 0 6 & 6 4 1! 4 6 & 7 (4.33) Gravitationsfelder Nun wollen wir noch kurz der Frage nachgehen, wie es kommt, dass wir die Gravitationskraft, die auf einen kleinen Körper der Masse in der Nähe der Erdoberfläche wirkt, in sehr guter Näherung durch eine konstante Kraft " beschreiben können, wenn wir das Koordinatensystem entsprechend wählen. Das muss sich irgendwie aus dem allgemeinen Gravitationsgesetz (4.1) ergeben. Schließlich bestand der große Erfolg der Newtonschen Theorie je gerade darin, die Himmelsphysik mit der irdischen zu vereinen. Wir betrachten dazu folgende Situation. Ein einzelnes Testteilchen mit Masse und Ortsvektor befindet sich in der Nähe einer großen Massenansammlung, die wir uns aus sehr vielen anderen Teilchen mit Massen und Ortsvektoren zusammengesetzt vorstellen. Diese anderen Teilchen bewegen sich unter dem Einfluss ihrer gegenseitigen Anziehungkräfte oder irgendwelcher anderen Kräfte, so dass die Orte im allgemeinen Funktionen der Zeit sind. Sie werden jedoch von dem sehr kleinen Testteilchen, dessen Bewegungsgleichung wir aufstellen wollen, nicht merklich beeinflusst. Wir können daher annehmen, dass wir die Massen und die Bahnen aller anderen Teilchen, also die Funktionen kennen, und dass diese nichts von der Anwesenheit des Testteilchens spüren. Die Gravitationskraft , die auf das Testteilchen wirkt, ergibt sich dann als Summe der Anziehungskräfte aller anderen Teilchen, also , , & " mit " " (4.34) Das Testteilchen bewegt sich in einem zeitabhängigen Kraftfeld , . Dieses Kraftfeld hängt von den Massen und Orten der anderen Teilchen ab, und es ist proportional zur Masse des Testteilchens. Es ist nützlich, diese Masse aus der Definition des Kraftfeldes heraus zu nehmen und statt dessen ein Feld , zu definieren, , " Gravitationsfeld " " (4.35) Das Gravitationsfeld , hängt jetzt nur noch von den Massen und Orten der Teilchen ab, die das Feld erzeugen, aber nicht mehr von der Masse des Testteilchens, mit dem wir das Feld gewissermaßen vermessen. Für das Testteilchen gilt die Bewegungsgleichung (4.36) Wir können das Gravitationsfeld als Träger der Gravitationskraft interpretieren. Jedes Teilchen, das eine Masse hat und einer Bahn folgt, erzeugt um sich herum ein Gravitationsfeld & " 90 " " (4.37) replacements (c) (d) (b) (a) Abbildung 4.2: Das Gravitationsfeld eines einzelnen Teilchens (b) und einer Ansammlung von vielen Teilchen (b). Ist die Ansammlung von Teilchen räumlich begrenzt, so sieht das Feld in großer Entfernung aus wie das eines einzelnen Teilchens, dessen Masse sich aus der Summe der Massen der einzelnen Teilchen ergibt. Es ist proportional zu seiner Masse, zeigt auf das Teilchen zu, und sein Betrag fällt mit den Quadrat des Abstandes nach außen hin ab. In Abbildung 4.2(a) ist ein solches Feld schematisch dargestellt. Das Feld erfüllt den ganzen Raum und gibt uns an jeder Stelle darüber Auskunft, wo sich das Teilchen befindet und wie weit es entfernt ist. Alle Teilchen zusammen erzeugen ein Gravitationsfeld , dass sich gemäß (4.35) durch Summation aus den Feldern der einzelnen Teilchen ergibt. Für Gravitationsfelder gilt das Superpositionsprinzip. Sie verhalten sich additiv, das heißt sie werden einfach überlagert oder superponiert, wenn mehrere Teilchen jeweils ein eigenes Feld erzeugen. Betrachten wir eine große Ansammlung von Teilchen wie in Abbildung 4.2(b), so ergibt sich das Gravitationsfeld aus der Überlagerung aller einzelnen Felder. Ein Testteilchen, das sich in einem von anderen Teilchen erzeugten Gravitationsfeld befindet, spürt eine Kraft, die proportional zum Gravitationsfeld und zur Masse dieses Teilchens ist. Die Massen der Teilchen, die das Feld erzeugen, bestimmten also zunächst die Stärke und Richtung des Gravitationsfeldes überall im Raum, und die Masse des Testteilchens, das sich darin bewegt, bestimmt anschließend, wie stark dieses Teilchen an das Feld ankoppelt, also welche Kraft es letztlich erfährt. Da die Masse des Testteilchens sowohl als Gewicht als auch als Trägheit in die Bewegungsgleichung (4.36) eingeht, ergibt sich daraus eine einfache Messvorschrift für das Gravitationsfeld. Um den Wert des Feldes an einem Ort und zu einer Zeit zu bestimmen, müssen wir nur ein Testteilchen an diese Stelle bringen und die Beschleunigung messen, die es dort erfährt. Tatsächlich hat das Gravitationsfeld , die physikalische Dimension einer Beschleunigung, das heißt der gefundene Wert der Beschleunigung des Testteilchens ist identisch mit dem Wert des Feldes . Diese Beschreibung der Gravitationkraft mit einem Feld als Träger der Kraft hat den Vorteil, dass wir, um die Bewegungen eines Testteilchens zu beschreiben, nur das Feld in dem Raumbereich kennen müssen, in dem sich das Testteilchen bewegt. Es ist nicht nötig, genau zu wissen, durch welche anderen Teilchen es erzeugt wird und wo sich diese Teilchen genau befinden. Genau das tun wir zum Beispiel dann, wenn wir die Bewegung eines kleinen Körpers im Gravitationsfeld der Erde beschreiben wollen. Die Erde kann als eine kugelförmige Ansammlung von sehr vielen Teilchen betrachtet werden, wie sie in Abbildung 4.3(a) dargestellt ist. Das Gravitationsfeld an irgendeinem Punkt im Raum ergibt sich aus (4.35) als Summe der Beiträge aller dieser Teilchen. Wenn wir die Erde als ruhend annehmen und den Ursprung des Koordinatensystems in den Mittelpunkt legen, so folgt aus der Symmetrie der Massenvertei91 replacements (c) (d) (b) (a) Abbildung 4.3: Das Gravitationsfeld eines ausgedehnten Körpers kann man bestimmen, indem man den Körper in sehr viele Teilchen zerlegt, diese als punktförmig betrachtet und ihre Gravitationsfelder überlagert (a). In einem im Vergleich zu den Abmessungen des Körpers kleinen Raumbereich kann das Gravitationsfeld als homogen angenommen werden, so dass auf ein dort befindliches Testteilchen eine konstante Kraft wirkt (b). lung in der Erde und daraus, dass diese zeitlich konstant ist, dass das Gravitationsfeld ein zeitunabhängiges Zentralkraftfeld ist. Das Gravitationsfeld der Erde zeigt, so wie das Gravitationsfeld eines einzelnen Punktteilchens, stets auf den Mittelpunkt der Erde zu. Außerdem ist sein Betrag nur vom Abstand vom Erdmittelpunkt abhängig. Auch das folgt aus der Symmetrie der Erdkugel. Auf einer Kugeloberfläche, die sich in einem bestimmten Abstand vom Erdmittelpunkt befindet, sei es innerhalb oder außerhalb der Erde, gibt es keinen irgendwie ausgezeichneten Punkt, also kann es auch keine Stelle geben, an der das Gravitationsfeld besonders stark oder schwach ist. Durch reine Symmetrieüberlegungen finden wir also, dass das Gravitationsfeld der Erde folgende Form annimmt, & " mit (4.38) Dabei ist der Ortsvektor, also der Abstandsvektor vom Erdmittelpunkt, ein Einheitsvektor, der in die Richtung des Ortsvektors zeigt, und eine noch unbekannte reelle Funktion, die den Betrag des Gravitationsfeldes in Abhängigkeit von der Entfernung vom Erdmittelpunkt festlegt. Ohne diese Funktion explizit zu kennen, können wir daraus bereits die Rechtfertigung für die Annahme ableiten, dass das Gravitationsfeld der Erde in der Nähe ihrer Oberfläche in guter Näherung durch ein konstantes Kraftfeld approximiert werden kann. Betrachten wir nämlich einen im Vergleich zur Größe der Erde sehr kleinen Raumbereich in der Nähe der Oberfläche, wie er in Abbildung 4.3(b) dargestellt ist, so ist in diesem Bereich sowohl die Richtung als auch der Betrag des Gravitationsfeldes annähernd konstant. Der Betrag ist annähernd konstant, weil der obere Rand des Raumbereiches nur unwesentlich weiter vom Erdmittelpunkt entfernt ist als der untere Rand. Die Richtung des Feldes ist annähernd konstant, weil der Winkel zwischen den Vektoren, die vom Erdmittelpunkt zu zwei verschiedenen Punkten in dem gekennzeichneten Raumbereich zeigen, verschwindend klein ist. Durch die Wahl eines geeigneten Koordinatensystem können wir also stets erreichen, dass in guter Näherung innerhalb eines begrenzten Raum" gilt. bereiches Genau das hatten wir im letzten Kapitel angenommen, um den freien Fall eines Körpers auf der Erdoberfläche zu beschreiben. Der tatsächlichen Wert der Erdbeschleunigung können wir direkt messen. 92 Der angegebene Wert von 0 m s ist ein Mittelwert. Da die Erde nicht exakt kugelförmig ist und die Massen nicht ganz gleichmäßig darin verteilt sind, weicht dieser Wert je nach Ort und Höhe um einige Promille vom Mittelwert ab. Auch die Richtung des Gravitationsfeldes zeigt nicht genau immer zum Erdmittelpunkt. Davon können wir aber absehen, wenn der Raumbereich, in dem sich das betreffende Teilchen bewegt, klein genug ist. Aufgabe 4.11 In einem Labor auf der Erdoberfläche befinden sich zwei Körper mit einer Masse von jeweils einem Kilogramm im Abstand von einem Meter auf gleicher Höhe. Auf beide wirkt die Erdanziehungskraft, jedoch in etwas unterschiedliche Richtungen. Man berechne die Differenz der beiden Anziehungskräfte und die relative Beschleunigung, die die Körper dadurch erfahren, wenn sie frei fallen. Man vergleiche diese relative Beschleunigung der Körper mit derjenigen, die sie durch ihre gegenseitige Anziehungskraft erfahren. Welche Massen müssten die Körper haben, wenn beide Effekte gleich groß sein sollen? Aufgabe 4.12 Wir werden später zeigen, dass das Gravitationsfeld eines ausgedehnten, kugelf örmigen Körpers außerhalb dieses Körpers dasselbe ist wie das eines Punktteilchens gleicher Masse. Man m s und dem Erdradius 6 km die Masse und die berechne aus der Erdbeschleunigung Dichte der Erde, also das Verhältnis aus Masse und Volumen. Ist das Ergebnis realistisch? 5 Zwangskräfte Die Gravitationskraft ist eine fundamentale Wechselwirkung. Sie wirkt auf alle Körper in der gleichen Art und Weise. Sie lässt sich daher auch nicht ausschalten oder abschirmen. Die elektromagnetische Wechselwirkung ist eine andere fundamentale Wechselwirkung. Letztlich leiten sich alle in der Natur auftretenden Kräfte aus solchen fundamentalen Wechselwirkungen her. In der Praxis ist es aber meist viel zu kompliziert, ein mechanisches System allein durch fundamentale Wechselwirkungen zwischen den beteiligten Teilchen zu beschreiben. Um die Bewegungsgleichungen für ein kompliziertes mechanisches System überhaupt aufstellen und lösen zu können, benötigt man eine effektive Beschreibung in Form eines Kraftgesetzes, das zwar im Prinzip auf fundamentale Kräfte zurückgeführt werden kann, das sich aber im konkreten Einzelfall sehr viel einfacher aus ein paar Grundregeln ableiten lässt, ohne dass man dafür die fundamentalen Wechselwirkungen überhaupt kennen muss. In der Technik spielt eine bestimmte Klasse solcher effektiven Kräfte eine besondere Rolle. In der technischen Anwendung der Mechanik geht es meist darum, Kräfte genau so einzusetzen, dass einzelne Körper bestimmte Bewegungen ausführen, also ganz bestimmte, vorgegebene Bahnen durchlaufen. Wir wollen hier weder komplizierte mechanische Geräte beschreiben noch danach fragen, wie solche mechanischen Kräfte entstehen. Anhand von ein paar einfachen Beispielen wollen wir aber das Prinzip solcher Kräfte erklären, die im allgemeinen als Zwangskräfte bezeichnet werden. Die Bezeichnung rührt daher, dass Zwangskräfte dafür sorgen, dass ein Körper nur ganz bestimmte Bewegungen ausführen kann, also einem Zwang unterliegt. Ein typisches Beispiel für einen solchen Körper ist ein Schienenfahrzeug. Es kann sich nur entlang einer vorgegebenen Kurve im Raum bewegen. Ein anderes typisches Beispiel wäre ein Körper, der sich in zwei Richtungen auf einer Fläche bewegen, diese aber nicht verlassen kann. Das Schienenfahrzeug Wir werden auch hier wieder die Annahme machen, dass ein Körper näherungsweise als punktförmiges Teilchen beschrieben werden kann, und diskutieren zunächst das Beispiel eines Schienenfahrzeugs. Das 93 replacements (c) (d) (b) (a) Abbildung 5.1: Typische mechanische Systeme mit Zwangskräften. Ein Schienenfahrzeug (a), das sich nur entlang einer vorgegebenen Kurve im Raum bewegen kann, besitzt nur einen Freiheitsgrad. Ein Körper, der auf einer Fläche (b) gleitet, besitzt zwei Freiheitsgrade. In beiden Fällen wirkt die Zwangskraft stets senkrecht zu den möglichen Bewegungsrichtungen des Körpers. Gleis, auf dem sich das Fahrzeug bewegt, kann durch eine Funktion beschrieben werden, wobei < irgendein frei wählbarer Kurvenparameter ist. Genauer gesagt soll diejenige Kurve im Raum sein, auf der sich der Schwerpunkt des Fahrzeugs bewegt, wenn dieses auf dem Gleis entlang fährt. Zum Beispiel können wir eine gerade, entlang der 4 -Achse verlaufende Strecke durch die Funkti on beschreiben, oder eine kreisförmige Strecke mit Radius durch die Funktion 3! . Im ersten Fall wäre der Kurvenparameter die Länge der Strecke, im zweiten Fall wäre der Kurvenparameter der zurückgelegte Winkel entlang der Strecke. Im Prinzip können wir diesen Parameter aber auch beliebig anders wählen. Die eigentliche Bewegung des Teilchens, also seine Bahn als Funktion der Zeit , lässt sich dann setzen. Wir sagen auch, dass durch eine einzige reelle Funktion beschreiben, indem wir ein solches mechanisches System nur einen Freiheitsgrad besitzt. Das Schienenfahrzeug verhält sich im Prinzip wie ein Teilchen in einem eindimensionalen Raum. Seine Bahn wird durch eine einzige Funktion beschrieben, nicht wie im Fall eines frei beweglichen Teilchens durch drei unabhängige Funktionen % . Gesucht ist nun eine Bewegungsgleichung für die Funktion , die wir irgendwie aus der allgemeinen Bewegungsgleichung herleiten müssen. Das Problem ist, dass wir gar nicht so genau wissen, was wir für die Kraft einsetzen müssen. Welche Kraft übt eine Schiene auf einen darauf fahrenden Körper aus? Müssen wir nicht, um diese Kraft zu bestimmen, das ganze das System in seine Einzelteile zerlegen, also das Fahrzeug in seine Räder, Achsen, Naben etc. aufteilen? Ist es überhaupt möglich, ein solch kompliziertes System im Rahmen einer einfachen Mechanik von Punktteilchen adäquat zu beschreiben? Überraschenderweise ist das möglich, und zwar mit Hilfe eines ganz einfachen Tricks. Wir müssen gewissermaßen Ursache und Wirkung vertauschen. Wir wissen zwar nicht, wie die Kraft in den Schienen genau entsteht, das heißt wir können sie nicht aus einem fundamentalen Kraftgesetz ähnlich dem Gravitationsgesetz herleiten. Aber wir kennen die Wirkung dieser Kraft. Sie bewirkt, dass das Fahrzeug auf den Schienen bleibt, also dem auferlegten Zwang gehorcht. Wir können die Kraft daher implizit aus ihrer bekannten Wirkung berechnen. Um zu sehen, wie das geht, schreiben wir zunächst die Bewegungsgleichung für ein Teilchen auf, dass sich auf einer vorgegebenen Kurve bewegt, wobei die gesuchte Funktion der Zeit ist. Es gilt dann 94 für die Geschwindigkeit und die Beschleunigung (5.1) Der Strich bezeichnet wieder die Ableitung der Funktion nach dem Kurvenparameter . Die Bewegungsgleichung lautet (5.2) wobei irgendeine äußere Kraft sein soll, zum Beispiel eine auf das Fahrzeug einwirkende Gravitationskraft oder eine Reibungskraft, die durch die Fahrt auf den Schienen oder den Luftwiderstand verursacht wird. Von dieser äußeren Kraft setzen wir voraus, dass sie als eine bekannte Funktion des Ortes, der Geschwindigkeit und möglicherweise der Zeit vorgegeben ist. Zusätzlich wirkt auf das Fahrzeug eine noch unbekannte Zwangskraft . Von dieser wissen wir bis jetzt nur, dass sie dafür sorgt, dass das Fahrzeug die Schiene nicht verlässt. Um sie zu bestimmen, schreiben wir die Bewegungsgleichung zunächst als Differenzialgleichung für die gesuchte Funktion . Eingesetzt in die Bewegungsgleichung von oben ergibt sich & (5.3) Die Zeitabhängigkeit von haben wir, wie üblich, nicht mehr explizit hingeschrieben. Außerdem haben wir für einfach geschrieben. Da sich der Körper nur entlang der vorgegeben Kurve bewegen kann, kann auch die äußere Kraft eine Funktion von und dargestellt werden. Die Bewegungsgleichung (5.3) ist eine Vektorgleichung, das heißt auf beiden Seiten steht ein Vektor mit drei Komponenten. Es handelt sich also um drei reelle Gleichungen, wenn wir alle Vektoren in Komponenten zerlegen. Jedoch kommen darin vier unbekannte Funktionen der Zeit vor, nämlich die drei Komponenten der noch unbekannten Zwangskraft , sowie die gesuchte Funktion , die die Bewegung des Körpers beschreibt. Wir benötigen also noch mindestens eine zusätzliche Gleichung, um die Bewegungsgleichung eindeutig lösen zu können. Betrachten wir dazu folgende Situation. Der Körper soll auf der Schiene ruhen, und auf ihn soll eine äußere Kraft senkrecht zur Schiene wirken. Das ist zum Beispiel für einen ruhenden Körper auf einer waagerechten Schiene in einem Gravitationsfeld der Fall. Dann soll der Körper natürlich nicht beschleunigt werden. Dasselbe gilt auch dann, wenn sich der Körper auf einer waagerechten Schiene bewegt. Wenn wir von Reibungskräften absehen, dann soll sich der Körper gleichmäßig, also mit konstanter Geschwindigkeit bewegen. Die Zwangskraft soll das Fahrzeug weder abbremsen noch beschleunigen. Daraus folgt, dass die Zwangskraft in diesem Fall genau die senkrecht zur Schiene wirkende Gravitationskraft kompensieren muss, aber sie darf nicht parallel zur Schiene wirken und das Fahrzeug beschleunigen. Das können wir als eine allgemeine Eigenschaft von Zwangskräften festhalten, die einen Körper in seiner Bewegungsfreiheit einschränken. Zwangskräfte wirken stets senkrecht zu den möglichen Bewegungsrichtungen eines Körpers. Hätte nämlich die Zwangskraft eine nicht verschwindende Komponente in Richtung einer möglichen Bewegungsrichtung des Körpers, so würde sie ihn in diese Richtung beschleunigen. Das ist aber nicht die Eigenschaft einer Zwangskraft, wie das anschauliche Beispiel eines Schienenfahrzeugs klar macht. Wir bekommen also die zusätzliche Bedingung, dass senkrecht zur allen möglichen Bewegungsrichtungen steht. In diesem Fall gibt es nur eine Bewegungsrichtung, nämlich entlang der Schiene. Die Richtung der Schiene im Raum ist durch den Tangentenvektor der Kurve gegeben, zu dem auch die Geschwindigkeit des Teilchens stets proportional ist. Also gilt : 95 6 (5.4) Das ist die vierte Gleichung, die wir benötigen, um die Bewegungsgleichung zu lösen. Im Prinzip können wir jetzt das Gleichungssystem (5.3) und (5.4) für die gesuchten Funktionen und lösen. Wir benötigen dazu nur noch einen Satz von Anfangsbedingungen für die Funktion , also den Ort und die Geschwindigkeit zu irgendeiner Zeit . Es geht aber sogar noch etwas einfacher. Die Zwangskraft lässt sich nämlich aus dem Gleichungsystem eliminieren. Wir bilden dazu das Skalarprodukt der Vektorgleichung (5.3) mit und bekommen : : : (5.5) Die Zwangskraft kommt in dieser Gleichung gar nicht mehr vor. Statt dessen bekommen wir eine gewöhnliche Differenzialgleichung zweiter Ordnung für die Funktion . Sie sieht ein wenig kompliziert aus, hat aber die übliche Form einer Bewegungsgleichung. Wir können sie in der üblichen Form schreiben, indem wir die nach auflösen und alle Terme, die von , und eventuell explizit von der Zeit abhängen, zu einer effektiven Kraft zusammenfassen, effektive Kraft : " : : mit (5.6) Das Schienenfahrzeug verhält sich wie ein Teilchen, das sich in einem eindimensionalen Raum mit der Ortskoordinate bewegt, wobei die Kraft, die auf das Teilchen einwirkt, durch eine Funktion vom und gegeben ist. Die einzige Bedingung, die wir stellen müssen, ist, dass der Tangentenvektor nirgendwo verschwindet. Das können wir aber stets durch eine geeignete Parametrisierung der Kurve erreichen, sofern diese hinreichend glatt, also stetig und differenzierbar ist. Die Bewegungsgleichung lässt sich sogar noch vereinfachen, wenn wir die Kurve in einer ganz speziellen Art und Weise parametrisieren. Wir wählen den Kurvenparameter so, dass er die Kurvenlänge soll durch die Differenz " gegeben sein. repräsentiert. Die Länge eines Kurvenstückes Es ist immer möglich, eine solche Parametrisierung einer Kurve zu finden. Wie man unmittelbar aus der Formel (2.60) für die Länge einer parametrisierten Kurve entnimmt, ist das genau dann der Fall, wenn der Tangentenvektor überall den Betrag Eins hat, also ein Einheitsvektor ist. Dann vereinfacht sich das effektive Kraftgesetz (5.6). Der Nenner wird gleich Eins und der zweite Term im Zähler fällt weg, denn es gilt : 0 Was bleibt ist : 7 : & 6 mit & : (5.7) (5.8) Da der Tangentenvektor ein Einheitsvektor ist, ist die effektive Kraft in diesem Fall nichts anderes als die orthogonale Projektion der äußeren Kraft auf die Bewegungsrichtung des Körpers. Die kompliziertere Bewegungsgleichung (5.5) benötigen wir nur dann, wenn die Parametrisierung der Kurve nicht so gewählt ist, dass mit der Kurvenlänge übereinstimmt. Dann treten auf der rechten Seite der Bewegungsgleichung zusätzliche Terme auf, die vom Ort und von der Geschwindigkeit abhängen. In jedem Fall aber bekommen wir eine Differenzialgleichung zweiter Ordnung für die gesuchte Funktion , also formal eine Bewegungsgleichung wie wir sie auch für eine Teilchen ohne Zwangsbedingungen kennen. Als Anfangsbedingungen müssen wir den Ort des Teilchens zu einem bestimmten Zeitpunkt und seine Geschwindigkeit vorgeben, also die Funktionswerte und . Dann wird die Funktion und somit die Bahn durch die Bewegungsgleichungen eindeutig bestimmt. Da es sich um ein System mit nur einem Freiheitsgrad handelt, ist seine Bewegungsgleichung im allgemeinen sogar 96 replacements (c) (d) (b) (a) Abbildung 5.2: Auf ein Schienenfahrzeug wirkt eine Zwangskraft, die stets senkrecht zur Bewegungsrichtung ausgerichtet ist. Sie lassen sich in eine Komponente senkrecht und eine Komponente parallel zum Gleisbett zerlegen, welches um einen Winkel zur Horizontalen geneigt ist (a). Die Kraft führt zu seitlichen Scherkräften in der Schiene und im Gleiskörper uns sollte daher so klein wie möglich sein. Bei einer Achterbahn in Form einer Spirale (b) muss der Neigungswinkel nach unter hin zunehmen, wenn keine seitlichen Kräfte auftreten sollen. einfacher als die für ein frei bewegliches Teilchen mit drei Freiheitsgraden. Es handelt sich nur um eine einzige Differenzialgleichung statt um drei gekoppelte Differenzialgleichungen. Systeme mit Zwangskräften sind also einfacher zu berechnen als es zunächst den Anschein hat. Offenbar müssen wir die Zwangskräfte selbst gar nicht kennen, um die Bewegungsgleichungen zu lösen. Wir können sie aber nachträglich berechnen, indem wir die gefundenen Lösungen in die Gleichung (5.5) einsetzen und diese dann nach auflösen. Das ist für technische Anwendungen natürlich besonders interessant. Die Zwangskräfte beeinflussen zwar nicht den Bewegungsablauf, aber sie sind ein Maß für die Belastung des mechanischen Systems. Für unser Beispiel eines Schienenfahrzeugs kann man aus der Zwangskraft auf die Belastung der Schienen schließen. Sie lässt sich sogar noch in zwei Komponenten zerlegen, die das Gleis in unterschiedlicher Weise belasten. In Abbildung 5.2(a) ist ein Querschnitt von Fahrzeug und Schiene senkrecht zur Bewegungsrichtung dargestellt. Die Zwangskraft wirkt ebenfalls senkrecht zur Bewegungsrichtung, liegt also in dieser Ebene. Sie lässt sich in eine Komponente parallel und eine Komponente senkrecht zum Gleisbett zerlegen. Da die Zwangskraft durch eine Wechselwirkung des Fahrzeugs mit den Schienen entsteht, treten in den Schienen natürlich gleich große Gegenkräfte auf. Ohne das im einzelnen zu analysieren kann man sich mit ein wenig Intuition überlegen, dass die Komponente " dieser Gegenkraft die Schienen sehr viel stärker belastet als die Komponente " . Erstere führt nämlich zu seitlichen Scherkräften in den Schienen und im Gleichbett, während letztere nur einen relativ harmlosen Druck nach unten ausübt. Eine typische Aufgabe der Gleisbautechnik ist daher, den Neigungswinkel des Gleisbettes so zu wählen, dass die seitliche Komponente der Zwangskraft möglichst klein wird. Aufgabe 5.1 Ein Zug mit einer Masse von 6 t pro Radsatz fährt mit einer Geschwindigkeit von 6 6 km h auf einer waagerechten Strecke durch eine Kurve mit einem Radius von 0 km. Welche Zwangskraft wirkt auf einen einzelnen Radsatz? Um wieviel Prozent ist der Betrag dieser Kraft gr ößer als die Zwangskraft, die bei gerader Fahrt wirkt? Wie ist der in Abbildung 5.2(a) definierte Neigungswinkel des Gleisbettes zu wählen, damit die seitliche Komponente der Zwangskraft verschwindet? 97 Aufgabe 5.2 In Abbildung 5.2(b) ist ein Teilstück einer Achterbahn schematisch dargestellt. Es hat die Form eine Spirale mit Radius und Steighöhe . Die Kurve lässt sich durch die Funktion 3! . " 7 * (5.9) beschreiben. Man stelle für die Funktion die Bewegungsgleichung auf, wobei als äußere Kraft die " wirken soll. Man löse die Bewegungsgleichung mit den AnfangsbedinGravitationskraft gungen 6 6 und 6 6 , das heißt das Fahrzeug läuft aus dem Stand los. Wie groß ist der Betrag der Geschwindigkeit des Fahrzeugs, wenn es sich in einer Höhe unterhalb des Startpunktes befindet? Man vergleiche diese Geschwindigkeit mit der Geschwindigkeit, die ein frei fallendes Teilchen nach dieser Fallstrecke hätte. Aufgabe 5.3 Man bestimme für die Bahn, die sich in Aufgabe 5.2 ergibt, explizit die Zwangskr äfte, die auf das Fahrzeug einwirken, und gebe diese als Funktion des Ortes an, an dem sich das Fahrzeug gerade befindet. Wie ist der Neigungswinkel des Gleises als Funktion von zu w ählen, wenn keine seitlichen Zwangskräfte auftreten sollen? Das mathematische Pendel Nun wollen wir ein System mit zwei Freiheitsgraden etwas näher untersuchen, also ein Teilchen, dessen Bewegungen nicht auf eine vorgegeben Kurve, sondern auf ein Fläche eingeschränkt sind. Auch ein solches System lässt sich sehr allgemein definieren und analysieren. Um das Prinzip zu verstehen, genügt es jedoch, ein einfaches Beispiel zu betrachten. Die Ergebnisse lassen sich anschließend leicht verallgemeinern. Das Beispiel, das wir uns näher anschauen wollen, ist das in Abbildung 5.3(a) dargestellte mathematische Pendel. Es besteht aus einem als punktförmig angenommenen Körper der Masse , der an einem Seil oder einer Stange der Länge aufgehängt ist. Die Stange kann sich um ihren Aufhängepunkt frei in alle Richtungen drehen, und ihre Masse soll im Vergleich zur Masse des Pendelkörpers vernachlässigbar klein sein. Die Bewegungsfreiheit des Körpers ist somit auf eine Kugelschale mit dem Radius um den Aufhängepunkt eingeschränkt. In diesem Fall ist es offensichtlich, dass die durch den Stab ausgeübte Zwangskraft senkrecht zu den möglichen Bewegungsrichtungen des Körpers ausgerichtet ist. Der Stab kann nur einen Druck oder einen Zug auf den Körper in radialer Richtung ausüben, also senkrecht zur Kugeloberfläche. Einer Bewegung des Körpers entlang der Kugeloberfläche gibt der Stab wegen seiner vernachlässigbaren Trägheit sofort nach. Wir wählen das Koordinatensystem so, dass der Ursprung genau dort liegt, wo das Pendel aufgehängt ist. Der Pendelkörper befindet sich dann an einem Ort mit , und die Zwangskraft zeigt in Richtung des Ortsvektor . Wir machen den Ansatz # (5.10) wobei eine noch unbekannte skalare Größe ist, die in irgendeiner Weise vom momentanen Bewegungszustand des Pendels abhängen wird. Außerdem soll auf den Körper noch eine äußere Kraft wirken, die wie üblich als Funktion von und und eventuell der Zeit vorgegeben ist. Daraus ergibt sich analog zu (5.2) die Bewegungsgleichung (5.11) Um die Größe und damit die Zwangskraft zu bestimmen, benutzen wir den gleichen Trick wie gerade eben für das Schienenfahrzeug. Wir wissen, was die Zwangskraft bewirkt. Sie stellt sich immer so ein, dass der Abstand des Teilchens zum Ursprung konstant bleibt. Durch zweimaliges Ableiten finden wir : : 6 98 : ? : 6 (5.12) replacements (c) (d) (b) (a) Abbildung 5.3: Das mathematische Pendel (a) besteht aus einem Teilchen der Masse , das an einem als masselos angenommenen Seil oder Stab der Länge in einem Gravitationsfeld aufgehängt ist. Eine Hantel (b) besteht aus zwei Teilchen, die durch einen ebenfalls als masselos angenommenen Stab der Länge verbunden sind. In beiden Fällen wirken die Zwangskräfte als Zug- oder Druckkräfte in Richtung des Stabes. Beim Pendel wirkt eine äußere Kraft auf ein Teilchen, bei der Hantel wechselwirken zwei Teilchen miteinander. Multiplizieren wir die letzte Gleichung mit sich Auflösen nach ergibt " und setzen die Bewegungsgleichung (5.11) ein, so ergibt : & : ? +: : : : : #: : " Wir können das noch ein wenig umschreiben, indem wir 6 : (5.13) (5.14) verwenden und einen Einheitsvektor (5.15) einführen, der in Richtung des Ortsvektors zeigt und die momentane Ausrichtung des Pendels bestimmt. Es gilt dann " ' " ( mit : ( (5.16) Die Größe ist die Projektion der äußeren Kraft auf die momentane Ausrichtung des Pendels, also die radiale Komponente der äußeren Kraft, und ( ist der Betrag der momentanen Geschwindigkeit des Pendelkörpers. Die zwei Anteile der Zwangskraft können wir folgendermaßen verstehen. Der erste Anteil kompensiert die äußere Kraft, die auf den Pendelkörper wirkt. Genauer gesagt, der Anteil der äußeren Kraft in Richtung von wird kompensiert, so dass keine Beschleunigung des Körpers in radiale Richtung auftreten kann. Versucht die äußere Kraft, den Körper nach innen oder außen zu bewegen, so wird dieser Kraft durch die Zwangskraft entgegengewirkt. Der zweite Anteil ist eine stets zum Ursprung hin gerichtete Kraft, die den Betrag ( hat. Das ist die Zentripetalkraft, die nötig ist, um einen Körper der Masse mit der Geschwindigkeit ( auf eine Kreisbahn 99 mit Radius zu zwingen. Die Zwangskraft gleicht also nicht nur den radialen Anteil der äußeren Kraft aus, sondern sie sorgt gleichzeitig auch noch für die nötige Zentripetalkraft, um den Körper auf einer Bahn mit konstantem Abstand zum Aufhängepunkt, also zum Koordinatenursprung zu halten. Aufgabe 5.4 Ein Pendel, auf das keine äußeren Kräfte wirken, nennen wir freies Pendel. Man zeige, dass die allgemeine Lösung der Bewegungsgleichung für ein freies Pendel wie folgt geschrieben werden kann, & 1! mit 0 : 6 (5.17) Die Parameter der Lösung sind ein Einheitsvektor , der die Lage des Pendels zur Zeit 6 angibt, sowie ein dazu senkrecht stehender Vektor , der die Rotationsachse, um die das Pendel rotiert, und die Winkelgeschwindigkeit festlegt. Wie hängen diese Parameter mit den Anfangsbedingungen 6 und 6 & ( zusammen? Können die Anfangsbedingungen beliebig gewählt werden? Aufgabe 5.5 Man berechne für die Bahn (5.17) den Drehimpuls des Pendels sich um eine Erhaltungsgröße handelt. Warum ist das so? und zeige, dass es Kugelkoordinaten Im Prinzip können wir jetzt die Zwangskraft (5.16) in die Bewegungsgleichung (5.11) einsetzen und versuchen, diese für eine vorgegebene äußere Kraft zu lösen. Geschickter ist es jedoch, auch hier die Zwangskraft zuerst aus der Bewegungsgleichung zu eliminieren, so wie wir dies für das Schienenfahrzeug getan haben. Dadurch reduziert sich die Anzahl der zu lösenden Differenzialgleichungen. Was wir dazu benötigen, ist eine Beschreibung der Kugeloberfläche als parametrisierte Fl äche, analog zur Darstellung der Schiene als parametrisierte Kurve. Erinnern wir uns kurz, wie wir dort vorgegangen sind. Die Kurve, auf der sich das Fahrzeug bewegen konnte, war durch eine Funktion parametrisierte Kurve 8 (5.18) vorgegeben. Ausgehend davon konnten wir oder die entsprechende Ortsvektordarstellung den Kurvenparameter als Ortskoordinate verwenden, das heißt wir konnten die Bahn des Teilchens . durch eine einzige reelle Funktion beschreiben, mit Die Situation ist ganz analog zur Darstellung des Bahn eines frei beweglichen Teilchens durch die Koordinatenfunktionen bezüglich eines kartesischen Koordinatensystems. In diesem Fall ist , das heißt der Ortsvektor lässt sich als Funktion der drei kartesischen Koordinaten darstellen. Im Falle eines Teilchens mit nur einem Freiheitsgrad übernimmt der Kurvenparameter die Rolle der kartesischen Koordinaten. Der Ortsvektor wird als Funktion der Koordinate dargestellt. Ganz ähnlich können wir vorgehen, wenn sich das Teilchen auf einer Fläche bewegt. Ein Fläche können wir durch eine Funktion von zwei reellen Variablen darstellen, parametrisierte Fläche 8 , )( , )( (5.19) oder durch eine entsprechende Ortsvektordarstellung , )( )( . Jeder Punkt auf der Fläche wird auf diese Weise eindeutig durch seine Koordinaten , )( identifiziert. Jedem Paar von reellen Zahlen )( entspricht genau ein Punkt auf der Fläche mit dem Ortsvektor )( . Wie bei einer parametrisierten Kurve nehmen wir stets an, dass die Funktion ( hinreichend oft stetig und differenzierbar ist. 100 replacements (c) (d) (a) (b) Abbildung 5.4: Auf der Erdoberfläche wird jeder Punkt durch die Angabe seiner geographischen Breite und Länge identifiziert (a). Die geographische Länge ist eine periodische Koordinate, das heißt und sind äquivalent. Der Breite nimmt Werte zwischen am Südpol und am Nordpol an. Die in der Mathematik und Physik üblichen Kugelkoordinaten und sind so definiert, dass am Nordpol und am Südpol gilt, und eine Periode von hat (b). Bewegt sich nun ein Teilchen auf einer solchen parametrisierten Fläche, so können wir seine Bahn durch zwei reelle Funktionen und ( beschreiben, so dass , )( ist. Die Koordinaten ( und übernehmen jetzt die Rolle der kartesischen Koordinaten eines frei beweglichen Teilchens. Da ein Teilchen auf einer Fläche zwei Freiheitsgrade hat, wird seine Bahn durch zwei Koordinatenfunktionen beschrieben. Um ganz konkret die Bewegungen eines Pendels zu beschreiben, müssen wir auf der Kugeloberfläche geeignete Koordinaten einführen. Das einfachste und dafür am besten geeignete Koordinatensystem ist in Abbildung 5.4(a) dargestellt. Es wird unter anderem als ein weltweit definiertes Koordinatensystem auf der Erdoberfläche verwendet. Jeder Punkt auf der Erdoberfläche wird eindeutig durch seinen L ängen- und Breitengrad identifiziert. Die Breite eines Punktes auf der Erdoberfläche ist durch den Winkelabstand vom Äquator festgelegt, 6 und Orte auf der Südhalbkugel eine negative wobei Orte auf der Nordhalbkugel eine positive Breite 6 , am Südpol " 6 . Der Wertbereich der Breite ist Breite 6 haben. Am Nordpol ist 6 , oder in dimensionslosen 7 . Die Breitendemnach " 6 Größen ausgedrückt " 7 kreise, also die Linien gleicher Breite konst sind Kreise, die parallel zum Äquator verlaufen und an den Polen zu Punkten entarten. Die Länge eines Punktes ist wie folgt festgelegt. Die Längenkreise oder Meridiane, also die Linien gleicher Länge konst sind Großkreise, die den Nordpol mit den Südpol verbinden. Einer dieser Längenkreise ist willkürlich als Nullmeridian ausgewählt. Dort ist 6 . Für die anderen Längenkreise ergibt sich die Koordinate als Winkelabstand vom Nullmeridian, gemessen entlang des Äquators in östlicher Richtung. Die Länge ist daher eine periodische Koordinate mit der Periode 6 oder 7 . Die Koordinaten und 7 bezeichnen denselben Punkt auf der Kugeloberfläche. In der Mathematik und der Physik ist es üblich, dieses in der Geographie benutzte Koordinatensystem ein wenig zu modifizieren. Einen speziellen Grund dafür gibt es allerdings nicht. Man ersetzt die Breite durch eine andere Koordinate ! , die den Winkelabstand zum Nordpol misst. Es gilt also ! 7 " , 101 und der Wertebereich ist 6 ! . Dieses modifizierte Koordinatensystem auf der Kugeloberfläche ist in Abbildung 5.4(b) dargestellt. Es unterscheidet sich nur unwesentlich von dem Koordinatensystem in Abbildung 5.4(a). Wir können jetzt den Ort, an dem sich das Pendel befindet, durch Angabe der Koordinaten ! und festlegen. Die Bahn des Pendels wird durch zwei Funktionen ! und beschrieben, so wie zuvor die Bahn eines Schienenfahrzeugs durch ein Funktion beschrieben wurde. Wir müssen uns nur noch überlegen, wie der Ortsvektor mit den Winkeln ! und zusammenhängt. Aufgabe 5.6 Wir orientieren die Kugel in Abbildung 5.4 so im Raum, dass der Nordpol auf der positiven -Achse liegt und der Äquator als Kreis mit Radius in der 4 - -Ebene liegt. Man zeige, dass dann der Ortsvektor eines Punktes mit den Koordinaten ! auf der Kugeloberfl äche durch ! ! 1! . ! 1! . ! (5.20) gegeben ist. Man berechne dazu den Winkelabstand zwischen dem Punkt ! und dem Nordpol und zeige, dass dieser gleich ! ist. Man zeige außerdem, dass die Koordinatenlinien konst Großkreise sind, also Kreise mit Radius , deren Abstand voneinander, auf den Äquator gemessen, durch die Differenz der -Koordinaten gegeben ist. Der Nullmeridian ist dabei derjenige L ängenkreis, der die positive 4 -Achse schneidet. Außerdem ist natürlich zu zeigen, dass ist. Damit haben wir die Kugeloberfläche als parametrisierte Fläche ! dargestellt. Wir können sogar noch einen Schritt weiter gehen und folgende Feststellung machen. Wir können nicht nur die Punkte auf einer bestimmten Kugeloberfläche mit diesen Koordinaten erfassen, sondern darüber hinaus jeden Punkt im Raum durch die Angabe seiner Kugelkoordinaten identifizieren. Wir müssen dazu nur zusätzlich zu den Koordinaten ! und , die auf jeder Kugeloberfläche eingeführt werden können, angeben, auf welcher Kugeloberfläche der Punkt liegt. Wir müssen also zusätzlich den Radius dieser Kugel angeben. Das ist natürlich der Betrag des Ortsvektors. Durch die Angabe von drei reellen Zahlen ! wird dann eindeutig ein Punkt im Raum festgelegt. Es ist der Punkt mit dem Ortsvektor ! ! 3! 3! ! ! (5.21) Das ist ein Beispiel für ein krummliniges Koordinatensystem. Wie in einem kartesischen Koordinatensystem (1.69) wird ein Punkt durch die Angabe von drei reellen Zahlen festgelegt. Durch (5.21) wird eine Abbildung definiert, Kugelkoordinaten ! mit ! (5.22) Sie ordnet jedem Tripel von reellen Zahlen ! einen Punkt zu. Jedoch unterscheidet sich die Abbildung (5.22) von einem kartesischen Koordinatensystem dadurch, dass sie erstens nicht linear, und zweitens nicht einmal bijektiv ist. Dass sie nicht linear ist äußert sich darin, dass wir den Abstandsvektor zweier Punkte nicht mehr aus den Differenzen der Koordinaten berechnen können. Folglich können wir den Abstand zwischen zwei Punkten auch nicht mehr mit Hilfe der Pythagoras-Formel (1.71) bestimmen. Außerdem sind die Koordinatenlinien, also die Kurven, auf denen jeweils zwei der drei Koordinaten konstant sind, keine zueinander senkrechte Geraden mehr. Dashalb nennt man ein solches Koordinatensystem krummlinig. Die Koordinatenlinien von ! und sind die in Abbildung 5.4 dargestellten Kreise, und die Koordinatenlinien von sind Geraden, die durch den Ursprung verlaufen. Ein weiterer Nachteil des so definierten Koordinatensystems ist, dass die Abbildung (5.22) nicht mehr bijektiv ist. Ein Punkt kann nämlich durch mehrere Sätze von Koordinaten dargestellt werden. Wie wir 102 bereits gesehen haben, ist die Koordinate periodisch, das heißt die Koordinaten ! und ! 7 bezeichnen denselben Punkt im Raum. Eine genauere Betrachtung der Definition (5.21) ergibt, dass zusätzlich noch die folgenden Identitäten gelten, ! ! 7 ! 7 & ! " 2" " ! (5.23) und natürlich weitere Identitäten, die sich durch Kombination dieser Gleichungen ergeben. Außerdem ergibt sich 6 & ! 6 & & (5.24) ! " das heißt für spezielle Werte von und ! sind einige der Koordinaten redundant. Der Punkt im Raum hängt von ihnen nicht mehr ab. Für 6 wird unabhängig von den Winkelkoordinaten ! und der Ursprung bezeichnet, und für ! 6 bzw. ! ergibt sich stets ein Punkt auf der -Achse, der von unabhängig ist. Das ist jeweils der Nord- bzw. Südpol der Kugel mit Radius . Dort ist der Breitenkreis zu einem Punkt entartet und folglich die Koordinaten redundant. Anschaulich können wir diese Eigenschaften der Kugelkoordinaten wie folgt verstehen. Betrachten wir die in (5.20) definierte Abbildung ! & ! als eine Abbildung des auf die Kugeloberfläche mit Radius , so wird der in einer speziellen Art und Weise um die Kugel herum gewickelt. Deshalb sind die Kugelkoordinaten nicht eindeutig. Wir können jedem Punkt auf der Kugeloberfläche mehrere Sätze von Koordinaten zuordnen. Um die Kugelkoordinaten dennoch so eindeutig wie möglich festzulegen, schränkt man üblicherweise den Wertebereich der Koordinaten ein, 6 ! 6 " (5.25) Innerhalb dieser Intervalle sind die Kugelkoordinaten dann eindeutig. Die an den Rändern der Intervalle auftretenden Redundanzen (5.24) lassen sich dadurch allerdings nicht vermeiden. Trotz dieser Mehrdeutigkeiten und der eingeschränkten Wertebereiche sind Kugelkoordinaten oft ein sehr nützliches Hilfsmittel, um Situationen zu beschreiben, die wie das mathematische Pendel eine Kugelsymmetrie besitzen. Wir werden dafür noch sehr viele Beispiele kennen lernen. Aufgabe 5.7 Es seien zwei Punkte Man berechne den Abstand . und gegeben mit Kugelkoordinaten ! ! . und , durch Kugelkoordinaten ! dargeAufgabe 5.8 Es sei eine Kurve , mit stellt. Man drücke den Tangentenvektor durch die Funktionen , ! , und ihre Ableitungen aus und zeige, dass die Länge der Kurve wie folgt gegeben ist, ! Es gilt also für das Linienelement (2.62) in Kugelkoordinaten ! ! ! (5.26) (5.27) Bewegungsgleichungen in Kugelkoordinaten Kommen wir nun zurück zum Pendel. Analog zum Schienenfahrzeug beschreiben wir seine Bewegungen jetzt durch zwei Funktionen ! und , und setzen ! 103 (5.28) wobei die Funktion ! durch (5.20) gegeben ist. Um das in die Bewegungsgleichung (5.11) einzusetzen, müssen wir die zweite Ableitung von berechnen. Das ist eine etwas komplizierte Rechnung, die wir schrittweise durchführen werden. Wir führen zunächst ein paar nützliche Abkürzungen ein. Den Ortsvektor eine Punktes fassen wir im folgenden stets als eine Funktion der Kugelkoordinaten ! auf, die explizit durch (5.21) gegeben ist. Wir definieren als erstes drei Einheitsvektoren , und , indem wir die partiellen Ableitungen dieser Funktion bilden und die Vektoren anschließend normieren, 0 Kugelbasis 0 ! ! 1! - ! 3! ! 1! - " 3! 1! ! ! 1! ! . " ! (5.29) Aufgabe 5.9 Man zeige, dass die Vektoren , für alle ! eine positiv orientierte Orthonor malbasis von bilden. Es handelt sich also um drei zueinander senkrecht stehende Einheitsvektoren, : : : 0 : : : 6 (5.30) Außerdem gilt für die Kreuzprodukte (5.31) Anschaulich können wir uns die Vektoren , als eine am Punkt mit den Kugelkoordinaten ! aufgestellte Basis vorstellen, wie sie in Abbildung 5.5(a) dargestellt ist. An jedem Punkt im Raum wird auf diese Weise ein andere Orthonormalbasis von definiert. Da die Vektoren nicht von abhängen, genügt es, eine bestimmte Kugeloberfläche zu betrachten. Der Vektor steht überall auf dieser Kugeloberfläche senkrecht, und die Vektoren und zeigen tangential zur Kugeloberfläche, in Richtung der Längen- und Breitenkreise. Der Vektor zeigt überall nach Süden, der Vektor nach Osten. Nur an der Polen, also entlang der -Achse ist die Basis nicht eindeutig festgelegt. Das liegt an der Redundanz (5.24) der Kugelkoordinaten an den Polen. Dieses Problem werden wir später noch einmal genauer untersuchen. Zunächst werden wir es einfach ignorieren. Wir können jetzt die Geschwindigkeit und die Beschleunigung des Pendels berechnen. Betrachten wir zunächst eine beliebige Bahn , die in Kugelkoordinaten dargestellt ist, ! . Aus (5.29) ergibt sich dann für die Geschwindigkeit ! ! ! ! - (5.32) Bewegt sich das Teilchen nur auf einer Kugeloberfläche mit Radius , so verschwindet natürlich der erste Term. Die Geschwindigkeit ist dann eine Linearkombination der Vektoren und . Da wir das Ergebnis später noch gebrauchen können, betrachten wir aber zunächst eine Bahn, die nicht auf eine Kugeloberfläche eingeschränkt ist. Um die Beschleunigung zu berechnen, müssen wir die Gleichung (5.32) noch einmal nach ableiten. Dabei müssen wir beachten, dass die Basisvektoren jetzt ebenfalls Funktionen der Zeit sind, denn sie hängen ja von ! und ab. Wenn sich das Teilchen bewegt, nimmt es quasi die Basis mit, bezüglich der die Komponenten (5.32) der Geschwindigkeit definiert sind. 104 replacements (c) (d) (b) (a) Abbildung 5.5: An jedem Punkt im Raum wird durch die Kugelkoordinaten eine Orthonormalbasis festgelegt (a). Die Basisvektoren zeigen in die Richtungen der jeweiligen Koordinatenlinien, radial nach außen, nach Süden, und nach Osten. Nur an den Polen ist die Basis nicht eindeutig, da die Koordinaten dort teilweise redundant sind. Bewegt sich ein Teilchen auf einer Kugeloberfläche (b), so führt es die Basis mit. Seine Geschwindigkeit ist an jeder Stelle der Bahn eine Linearkom bination der dort definierten Vektoren und . Aufgabe 5.10 Man berechne die Ableitungen der Basisvektoren ! und beweise ! ! ! " ! ! ! ! ! 1! ! " nach den Koordinaten ! " 1! ! (5.33) Für die Zeitableitungen der Basisvektoren ergibt sich daraus ! " ! " ! ! 3! ! . . " 1! ! . (5.34) Was durch diese Gleichungen ausgedrückt wird, ist genau das, was wir als “Mitnehmen” der Basis durch das sich bewegende Teilchen bezeichnet haben. Während sich das Teilchen durch den Raum bewegt, ändert sich der Ort, an dem es sich befindet, und entsprechend ändert sich auch die Basis , die an jedem Ort eine andere ist. Aufgabe 5.11 Man leite die Gleichung (5.32) noch einmal nach der Zeit ab und benutze (5.34), um zu 105 zeigen, dass für die Beschleunigung in Kugelkoordinaten gilt " ! " ! ! 7 ! ! 7 3! ! " ! ! 7 1! ! ! (5.35) Um die Bewegungsgleichung in Kugelkoordinaten darzustellen, müssen wir jetzt nur noch die Kraft , die auf das Teilchen wirkt, ebenfalls in ihre Komponenten bezüglich der Basis zerlegen, also ' (5.36) Da es sich dabei im eine Orthonormalbasis handelt, sind die Komponenten durch die Skalarprodukte gegeben, (5.37) : : : Die Bewegungsgleichung lässt sich dann komponentenweise wie folgt schreiben, ! ! 7 " 7 ! " ! ! " 7 ! ! 1! ! 3! ! ! (5.38) Wichtig ist an dieser Stelle, dass die Komponenten der Kraft immer bezüglich der Basis , an der Stelle definiert sind, an der sich das Teilchen gerade befindet. Wenn die Kraft als Funktion des Ortes und der Geschwindigkeit vorgegeben ist, so müssen wir diesen Vektor bezüglich der Basis an der Stelle ! in seine Komponenten zerlegen. Als Ergebnis erhalten wir dann die Komponenten , die wir als Funktionen von , ! , und deren Zeitableitungen darstellen können. Das Gleichungssystem (5.38) ist wieder ein gekoppeltes System von Differenzialgleichungen zweiter Ordnung für drei reelle Funktionen , ! und . Es besitzt eine eindeutige Lösung, wenn wir einen Satz von Anfangsbedingungen, also den Ort und die Geschwindigkeit des Teilchens zu irgendeiner Zeit vorgeben. Es sieht ein wenig kompliziert aus, ist aber letztlich nur eine andere Darstellung der gewöhnlichen Newtonschen Bewegungsgleichung in kartesischen Koordinaten. Aufgabe 5.12 Gegeben sei die folgende Bahn eines Teilchens, dargestellt in Kugelkoordinaten ! 3! (5.39) wobei ' > irgendwelche Konstanten sind. Man berechne die Geschwindigkeit und die Beschleunigung in Kugelkoordinaten. Was folgt aus dem Ergebnis? Um was f ür eine spezielle Bahn handelt es sich? Die Pendelgleichungen Nach diesen eher allgemeinen Ausführungen über Kugelkoordinaten kehren wir nun zur eigentlichen Fragen zurück. Es ging darum, für das mathematische Pendel einen Satz von Bewegungsgleichungen herzuleiten, aus dem die Zwangskraft eliminiert ist. Wir verwenden dazu die Bewegungsgleichungen in der Form (5.38). Für das Pendel gilt , und somit 6 und 6 . Außerdem hatten wir die Kraft in eine äußere Kraft und eine Zwangskraft zerlegt. 106 Betrachten wir zunächst die radial Komponente der Bewegungsgleichungen, also die erste Gleichung von (5.38). Sie lautet in diesem Fall " ! ! (5.40) wobei : und : die radialen Komponenten der Kräfte sind. Die Zwangskraft hatten wir bereits ausgerechnet. Sie war durch (5.16) gegeben. Der dort definierte Vektor ist genau der radiale Einheitsvektor, das heißt die Zwangskraft hat nur diese eine Komponente, ' mit ( " " (5.41) Offenbar hebt sich die radiale Komponente der äußeren Kraft gerade weg, und was von der radialen Komponente der Bewegungsgleichung übrig bleibt ist ! ! ( (5.42) Aufgabe 5.13 Man berechne den Betrag der Geschwindigkeit (5.32) f ür chung (5.42) automatisch erfüllt ist. und zeige, dass die Glei- Das muss auch so sein, denn wir haben die Zwangskraft ja genau so berechnet, dass das Teilchen keine Beschleunigung in radialer Richtung erfährt. Genau wie beim Schienenfahrzeug sind nur diejenigen Komponenten der Bewegungsgleichung relevant, die den möglichen Bewegungsrichtungen des Pendels entsprechen. In diesen Gleichungen treten keine Zwangskräfte mehr auf, da die Zwangskraft stets in radiale Richtung wirkt. Die Komponenten und verschwinden. Es bleiben also die letzten beiden Gleichungen von (5.38), in die wir die entsprechenden Komponenten der äußeren Kraft einsetzen müssen. Für ergibt sich ! " ! 3! ! 7 3! ! ! & ! & (5.43) Das sind die Bewegungsgleichungen für das Pendel bei beliebig vorgegebenen äußeren Kräften. Als spezielles Beispiel wollen wir im folgenden das Pendel im Schwerefeld der Erde betrachten, das heißt es soll " sein. Wenn wir diese äußere Kraft in ihre Komponenten bezüglich der Basis , zerlegen, so finden wir : " 1! ! : ! : 6 (5.44) Setzen wir das in (5.43) ein, so kürzt sich die Masse des Pendelkörpers heraus. Das ist natürlich wieder eine Konsequenz der Äquivalenz von Trägheit und Gewicht. Da die einzigen äußeren Kräfte, die auf den Pendelkörper wirken, Gravitationskräfte sind, ist seine Bewegung von der Masse unabhängig. Es ergeben sich schließlich folgende Bewegungsgleichungen für die Funktionen ! und , Pendelgleichungen ! " ! 1! ! ! ! 7 3! ! ! 6 (5.45) Aufgabe 5.14 Es gibt zwei spezielle Lösungen der Pendelgleichungen, die wir unmittelbar ablesen können. Die eine ist ! 6 und beliebig, die andere ist ! und ebenfalls beliebig. Welche Art von Bewegung führt das Pendel dabei aus? Wie kommt es, dass die Funktionen in beiden Fällen frei wählbar sind, obwohl doch die Bewegungen eines mechanischen Systems durch die Anfangsbedingungen eindeutig festgelegt sind? 107 Aufgabe 5.15 Man bestimme alle Lösungen der Pendelgleichung, bei denen das Pendel eine Kreisbewegung ausführt, also eine Bahn der Form ! (5.46) durchläuft. Welche anschauliche Bedeutung haben in diesem Fall die Konstanten , und ? Man bestimme den Zusammenhang zwischen und der Umlaufzeit für eine solche Kreisbahn. Welche Werte können und annehmen? Aufgabe 5.16 Eine andere spezielle Lösung der Pendelgleichungen, die sich exakt angeben lässt, ist ! 7 3! (5.47) Die Umkehrfunktion 1! des Kotangens nimmt dabei Werte zwischen 6 und an. Man zeige, dass dies für beliebige Konstanten eine Lösung der Pendelgleichungen ist und bestimme . Wie sieht diese spezielle Bewegung des Pendels aus? Aufgabe 5.17 Man zeige, dass der Drehimpuls des Pendelkörpers in Kugelkoordinaten durch ! #" ! gegeben ist. Man verifiziere anhand der Pendelgleichungen (5.43) f ür Erhaltungsgröße ist. (5.48) 6 , dass dies tatsächlich eine Aufgabe 5.18 Für das Pendel im Schwerefeld ist der Drehimpuls nicht erhalten, weil die Schwerkraft nicht als Zentralkraft wirkt. Man zeige jedoch, dass die -Komponente des Drehimpulses eine Erhaltungsgr öße ist, . : ! (5.49) Kleine Auslenkungen Die allgemeine Lösung der Pendelgleichungen (5.45) lässt sich nicht in geschlossener Form angeben. Wir können aber ein paar spezielle Lösungen beschreiben und dazu ein Näherungsverfahren verwenden. Das Pendel hat am Südpol, also bei ! , eine stabile Ruhelage. Es hängt dort einfach senkrecht nach unten, ohne sich zu bewegen. Lenken wir es ein wenig aus dieser Ruhelage aus, so wirkt eine Kraft, die es zum Südpol zurück zieht. Deshalb ist diese Ruhelage stabil. Am Nordpol befindet sich eine instabile Ruhelage. Dort kann das Pendel auch ruhen, jedoch führt jede kleine Auslenkung aus dieser Ruhelage dazu, dass eine abstoßende Kraft wirkt, die das Pendel noch weiter auslenkt. Wir wollen die Bewegungen des Pendels in der Nähe des Südpols, also der stabilen Ruhelage beschreiben. Wir führen dazu eine neue Koordinate > " ! ein, so dass die Ruhelage bei 6 liegt. Es gilt dann ! 3! ! " 3! (5.50) und in den Pendelgleichungen (5.45) ändert sich ein Vorzeichen, " 3! " 7 1! 6 (5.51) Nun nehmen wir an, dass der Auslenkwinkel sehr klein ist. Das Pendel soll nur sehr wenig aus seiner Ruhelage ausgelenkt werden. Wir führen dann eine lineare N äherung durch, bei der wir alle Terme, die 108 und 3! von der Ordnung oder höher sind, vernachlässigen. Wir setzen also Pendelgleichungen verschwinden dann alle Winkelfunktionen, und sie werden in linear, " linearisierte Pendelgleichungen " 0 . Aus den 7 6 (5.52) Diese Differenzialgleichungen können wir lösen. Wir ersetzen dazu die Variablen und durch zwei andere Variable 4 und , die wie folgt definiert sind, 3! 4 3! (5.53) Dies sind die 4 - und -Koordinaten des Ortes (5.20), an dem sich das Pendel befindet. Berechnen wir die Ableitungen von (5.53), so finden wir 4 3! " 3! 4 >" 3! " 7 >" 7 1! (5.54) In den Klammern stehen genau die Ausdrücke, die auch auf der rechten Seite der Bewegungsgleichung (5.52) stehen. Daher gelten für die neuen Variablen näherungsweise die Bewegungsgleichungen 4 " 4 " (5.55) Diese Differenzialgleichungen kennen wir schon. Es sind die Bewegungsgleichungen für ein lineares Kraftgesetz. Das Pendel verhält sich wie ein Teilchen in einer durch die Koordinaten 4 und definierten Ebene, auf das eine linear mit dem Abstand wachsende Zentralkraft wirkt, die es zum Ursprung zurück zieht. Diese Bewegungsgleichungen haben wir schon einmal gelöst. Wenn die zweite Ableitung einer Funktion proportional zur Funktion selbst ist, und der Proportionalitätsfaktor negativ ist, dann ist die Lösung eine Linearkombination der Winkelfunktionen. Wie man leicht zeigt, ist die allgemeine Lösung des Gleichungssystems (5.55) 4 4 3! ( & 3! Die Parameter dieser Lösung werden durch die Anfangsbedingungen 4 6 4 6 4 6 ( 6 mit (5.56) (5.57) eindeutig festgelegt. Die Lösungen sind Ellipsen in der 4 - -Ebene, deren Mittelpunkt im Koordinatenursprung liegt. Es sind periodische Bahnen, die mit der für das Pendel charakteristischen Periode charakterische Periode 7 7 (5.58) durchlaufen werden. Solange die Auslenkungen des Pendels klein sind, schwingt es mit dieser charakteristischen Periode. Für Kreisbahnen ergibt sich dieselbe Periode auch als Grenzwert der Umlaufzeit für kleine Auslenkungen aus Aufgabe 5.15. In Abbildung 5.6 sind ein paar typische Lösungen der Pendelgleichung dargestellt. Gezeigt ist die Bahn des Pendels als Projektion auf die 4 - -Ebene. Die Ringe sind Linien gleicher Auslenkung . Der Maßstab ist in den drei Abbildungen verschieden gewählt. Die durchgezogenen Ellipsen sind jeweils die Lösungen 109 (b) (c) replacements (d) (a) Abbildung 5.6: Die Lösungen der linearisierten Pendelgleichungen stimmen für kleine Auslenkungen (a) sehr gut mit den numerischen Lösungen der exakten Pendelgleichungen überein. Für mittlere Auslenkungen (b) ergeben sich kleine Abweichungen. Für große Auslenkungen (c) weicht die Bahn bereits nach einer halben Schwingung sehr stark von der Näherung ab. der linearisierten Pendelgleichung (5.52). Die gestrichelten Linien sind die entsprechenden Lösungen der exakten Pendelgleichung (5.51) bei gleichen Anfangsbedingungen. Diese wurden numerisch ermittelt. Die Striche markieren jeweils Zeitintervalle, die einer halben charakteristischen Periode (5.58) entsprechen. Man sieht in Abbildung 5.6(a), dass die linearisierten Bewegungsgleichungen bei kleinen Auslenkungen von einigen Grad eine sehr gute Näherung liefern. Innerhalb von ein paar wenigen Perioden weicht die genäherte Lösung kaum von der exakten ab. Bei mittleren Auslenkungen ergeben sich bereits kleine Abweichungen. Zum einen sind die Bahnen keine geschlossenen Ellipsen mehr. Die Orte, an deren die maximale Auslenkung erreicht wird, beginnen zu wandern. Außerdem wird der nächste Umkehrpunkt nicht mehr nach einer Zeit 7 erreicht, sondern etwas später. Die exakte Schwingungsperiode hängt von der Auslenkung ab. Für große Auslenkung, bei denen das Pendel bis fast zum Äquator schwingt, liefern die linearisierten Bewegungsgleichungen keine brauchbare Näherung mehr. In Abbildung 5.6(c) weicht die tatsächlich Bahn des Pendels bereits nach einer Schwingung stark von der genäherten ab. Das ist natürlich zu erwarten, denn ist. Das ist für 7 sicher nicht mehr der Fall. Ein Pendel wir haben ja angenommen, dass schwingt also nur dann mit seiner charakteristischen Periode , wenn die Auslenkung klein ist. Aufgabe 5.19 Wie sind die Anfangsbedingungen (5.57) zu w ählen, damit sich eine Kreisbahn ergibt? Man vergleiche diese Kreisbahnen mit denen aus Aufgabe 5.15. Liefert die lineare N äherung eine zu große oder eine zu kleine Umlaufzeit ? Aufgabe 5.20 Neben den Kreisbahnen gibt es noch eine andere Klasse von exakt periodischen Bahnen. Es sind diejenigen, bei denen & ist, das Pendel also in einer Ebene schwingt. Wie lautet in diesem Fall die exakte Bewegungsgleichung für , wie die linearisierte Bewegungsgleichung? Es sei die Periode, die sich aus der exakten Bewegungsgleichung ergibt, und die von der Auslenkung, also der Amplitude der Schwingung abhängt. Ist größer oder kleiner als die charakteristische Periode , die sich aus der linearisierten Bewegungsgleichung ergibt? Mehrteilchensysteme Zwangskräfte treten nicht nur als äußere Kräfte auf, die auf ein einzelnes Teilchen einwirken, sondern auch als Wechselwirkungen zwischen verschiedenen Teilchen. Ein einfaches Zwei-Teilchen-System, bei 110 dem die Wechselwirkung zwischen den Teilchen durch eine Zwangskraft erzeugt wird, ist die in Abbildung 5.3(b) dargestellte Hantel. Sie besteht aus zwei Teilchen mit Massen und , die sich an den Orten und befinden. Sie sind durch eine Stange verbunden, so dass der Abstand zwischen ihnen fixiert ist, (5.59) " Die Hantel ist dem Pendel sehr ähnlich. Der einzige Unterschied ist, dass beim Pendel das zweite Teilchen irgendwo befestigt ist, sich also nicht bewegen kann. Die Hantel ist als mechanisches System deshalb von besonderem Interesse, weil sie das einfachste Modell für einem starren Körper darstellt. Im Prinzip können wir uns einen starren Körper immer als ein System von vielen Teilchen vorstellen, deren relative Abstände durch Zwangskräfte konstant gehalten werden. Ein solcher Körper kann sich in alle Richtungen bewegen und drehen, aber er kann nicht verformt werden. Wir nehmen auch hier wieder an, dass die Stange im Vergleich zu den beiden an den Enden befestigten Körpern sehr leicht ist, so dass wir deren Masse vernachlässigen können. Die Bewegungsgleichungen können wir dann wie folgt schreiben, " (5.60) wobei und äußere Kräfte sind, die auf die beiden Teilchen einwirken, und die Zwangskraft ist, die durch die Stange aufgebracht wird. Da auch hier das Prinzip “actio reactio” gilt, müssen die Zwangskräfte, die auf die beiden Teilchen wirken, entgegengesetzt gleich sein. Außerdem wirken wie beim Pendel die Zwangskräfte nur in Richtung der Stange. Die Zwangskraft ist also immer proportional zum Abstandsvektor, / " (5.61) Was die äußeren Kräfte betrifft, so wollen wir zunächst nur den einfachen Fall betrachten, dass sie nicht vorhanden sind. Es ist dann nicht sehr schwierig, die Bewegungsgleichungen vollständig zu lösen. Zuerst zerlegen wir die Bewegung wie üblich in eine Schwerpunkt- und Relativbewegung. Wir setzen " (5.62) Da es sich um ein abgeschlossenen System handelt, ergibt sich natürlich eine geradlinige und gleichförmige Bewegung des Schwerpunktes, ! (5.63) Für die Relativbewegung bekommen wir die folgende Bewegungsgleichung, zu der wir noch die Zwangsbedingung (5.59) hinzunehmen müssen, (5.64) Hier ist wieder die reduzierte Masse. Diese Bewegungsgleichung einschließlich der Zwangsbedingung kennen wir schon. Es ist die Bewegungsgleichung (5.11) eines Pendels, auf das keine äußere Kraft wirkt. Die Hantel verhält sich also, was die Relativbewegung der beiden Körper betrifft, wie ein freies Pendel. Die Lösung dieser Bewegungsgleichungen hatten wir in bereits in (5.17) gefunden. Die Parameter der Lösung waren eine Winkelgeschwindigkeit und ein dazu senkrecht stehender Einheitsvektor , 3! mit 111 0 : 6 (5.65) (c) (d) (b) (a) Abbildung 5.7: Beispiele für Systeme von mehreren Teilchen mit Zwangsbedingungen. Für die Hantel haben diese Parameter die folgende Bedeutung. Der Vektor bezeichnet wie beim freien Pendel die Ausrichtung der Stange zur Zeit 6 . Der Vektor legt die Richtung der Rotationsachse fest, und sein Betrag bestimmt die Kreisfrequenz, mit der die Rotation erfolgt. Die Hantel rotiert in einer Ebene, die zu senkrecht liegt, während sie sich als ganzes gemäß (5.63) gleichförmig durch den Raum bewegt. Dies ist die typische Bewegung eines starren Körpers. Sofern auf ihn keine äußeren Kräfte wirken, bewegt sich sein Schwerpunkt geradlinig und gleichförmig, während der Körper mit einer konstanten Winkelgeschwindigkeit um eine feste Achse rotiert. Für die Hantel ist dieser Bewegungsablauf in Abbildung 5.3(b) angedeutet. Aufgabe 5.21 Man berechne für die durch (5.63) und (5.65) definierte Bahn der Hantel den Gesamtdrehimpuls , den Schwerpunktdrehimpuls und den inneren Drehimpuls . Aufgabe 5.22 Die Hantel befindet sich nun im Schwerefeld der Erde, das heißt es sollen auf die beiden Teilchen zusätzlich zu den Zwangskräften die äußeren Kräfte " und " wirken. Man bestimme für diesen Fall die allgemeine Lösung der Bewegungsgleichungen. Als Anfangsbedingung sei wieder der Ort und die Geschwindigkeit des Schwerpunktes, sowie die Winkelgeschwindigkeit und die Ausrichtung zur Zeit 6 gegeben. Aufgabe 5.23 Wieviele Freiheitsgrade hat die Hantel? Aufgabe 5.24 In Abbildung 5.7(a) ist ein System mit zwei Teilchen darstellt, das nur einen Freiheitgrad besitzt. Ein Körper der Masse gleitet auf einem Tisch. Er spürt dabei ein Reibungskraft, die linear mit der Geschwindigkeit anwächst. Die Reibungskonstante sei . Ein Seil verbindet diesen über eine Rolle mit einem anderen Körper der Masse . Dieser hängt senkrecht nach unten im Gravitationsfeld der Erde. Beide Körper können sich nur auf die Rolle zu oder von ihr weg bewegen. Die Lage der Körper im Raum wird durch eine einzige Variable festlegen, zum Beispiel die L änge 4 des nach unten hängenden Seiles. Man bestimme alle Kräfte, die auf die Körper wirken, und eliminiere die Zwangskräfte aus den Bewegungsgleichungen, so dass nur noch ein Bewegungsgleichung f ür 4 übrig bleibt. Man finde die eindeutige Lösung zu den Anfangsbedingung 4 6 4 und 4 6 & 6 . Aufgabe 5.25 Ein etwas komplizierteres Zwei-Teilchen-System mit Zwangskr äften ist in Abbildung 5.7(b) dargestellt. Zwei Pendelkörper mit gleichen Massen sind über zwei Rollen so miteinander verbunden, dass die Längen 4 und 4 der beiden Pendel zwar veränderlich sind, die Summe der beiden Längen aber stets konstant bleibt. Der Einfachheit halber sei außerdem angenommen, dass sich die Pendelk örper nur in einer Ebene bewegen können. Wieviel Freiheitsgrade besitzt dieses System? 112 Als Anfangsbedingung sei folgende Situation gegeben. Beide K örper befinden sich in Ruhe. Der erste Körper hängt senkrecht nach unten, das heißt der Auslenkwinkel sei gleich Null. Der Auslenkwinkel des zweiten Körpers sei ungleich Null. Überlässt man das System in dieser Situation sich selbst, so beginnt der zweite Körper natürlich zu pendeln. Was tut der erste Körper? 6 Schwingungen Das mathematische Pendel gehört zu einer speziellen Klasse von mechanischen Systemen, die eine bestimmte gemeinsame Eigenschaft haben. Sie besitzen eine Ruhelage, also einen Zustand, in dem sich alle beteiligten Körper in Ruhe befinden, und sie führen Schwingungen um diese Ruhelage aus, wenn sie aus der Ruhelage entfernt und sich selbst überlassen werden. Das einfachste System dieser Art ist der harmonische Oszillator. Er lässt sich nicht nur als mechanisches System realisieren, sondern auch als elektrodynamisches oder quantenmechanisches System. In der modernen Theorie der Elementarteilchen, der Quantenfeldtheorie, stellt man sich sogar die Teilchen selbst als harmonische Oszillatoren vor. Wir wollen deshalb dieses im Prinzip sehr einfache System etwas ausführlicher diskutieren. Es wird uns in fast allen Teilbereichen der Physik, in der Schwingungen eine Rolle spielen, als Standardbeispiel wieder begegnen. Der harmonische Oszillator ist außerdem eines der wenigen physikalischen Systeme, deren Bewegungsgleichungen sich exakt lösen lassen. Für andere schwingende Systeme, deren Bewegungsgleichungen sich nicht exakt lösen lassen, dient der harmonische Oszillator als Basis für verschiedene Näherungsverfahren. Am Beispiel des mathematischen Pendels haben wir das im letzten Kapitel bereits gesehen. Außerdem lassen sich aus dem Vergleich eines schwindenden Systems mit einem harmonischen Oszillator oft qualitative Aussagen über dessen mögliche Bewegungen ableiten. Der harmonische Oszillator Ein sehr einfaches schwingendes mechanisches System ist in Abbildung 6.1 dargestellt. An einem Körper, der sich aufgrund von Zwangsbedingungen nur entlang der 4 -Achse bewegen kann, ist eine Feder befestigt, deren anderes Ende an einem raumfesten Punkt fixiert ist. Die wesentliche Eigenschaft einer Feder ist, dass die Kraft, die sie auf ihre beiden Enden ausübt, proportional zu ihrer Auslenkung ist. Die Auslenkung ist die Differenz zwischen der tatsächlichen Länge der Feder und ihrer Ruhelänge, die sie im entspannten Zustand annimmt. Wir wählen das Koordinatensystem so, dass sich der Körper genau dann im Ursprung befindet, wenn die Feder entspannt ist. Für seinen Ortsvektor gilt also 4 , wobei 4 gleichzeitig die Auslenkung der Feder ist. Aus den allgemeinen Überlegungen über Zwangskräfte wissen wir, dass wir die Bewegungsgleichung für ein System mit nur einem Freiheitsgrad in der vereinfachten Form (5.8) schreiben können, wenn der dafür verwendete Kurvenparameter gleichzeitig die geometrische Länge der Kurve angibt, auf der sich der Körper bewegt. Das ist für die Ortskoordinate 4 natürlich der Fall. Sie ist ja gerade durch den Abstand eines Punktes auf der 4 -Achse vom Ursprung definiert. Die effektive Kraft , die wir einsetzen müssen, ist die 4 -Komponente der von außen auf den Körper einwirkenden Kraft. Das soll die Federkraft sein, die proportional zur Auslenkung und ihr entgegen gerichtet ist. Wir bekommen also die einfache Bewegungsgleichung wobei 4 4 4 " 4 (6.1) die Masse des schwingenden Körpers ist und die Federkonstante. Sie hat die Dimension 0 0 N m kg s . Die dreidimensionale Version dieses Kraftgesetzes kennen wir schon aus Kapitel 3, wo wir ein lineares Kraftgesetz als Beispiel für die Wechselwirkung von zwei frei beweglichen Teilchen untersucht haben. 4 113 replacements (a) (b) (c) (d) Abbildung 6.1: Der harmonische Oszillator als mechanisches System. Dargestellt ist ein typischer Bewegungsablauf, wobei die Zeit von links nach rechts läuft. Der Körper wird aus der Ruhelage ausgelenkt und anschließend sich selbst überlassen. Dort hatten wir auch schon die allgemeine Lösung einer solchen Bewegungsgleichung gefunden, die sich als Linearkombination von Sinus- und Kosinusfunktionen schreiben ließ. Wir wollen diese Lösung hier noch einmal reproduzieren, wobei wir ein wenig systematischer vorgehen, um das Ergebnis hinterher zu verallgemeinern. Wir schreiben die Bewegungsgleichung zunächst in der Standardform für eine lineare Differenzialgleichung, harmonischer Oszillator 4 4 6 (6.2) Ein dynamisches System, das einer solchen Bewegungsgleichung genügt, bezeichnet man allgemein als harmonischen Oszillator, unabhängig davon, ob es sich um ein mechanisches System oder um ein System anderer Art handelt. Entscheidend ist, dass die rücktreibende Kraft, also die zweite Ableitung des Zustands, proportional zur Auslenkung, also zur Abweichung es Zustands vom Ruhezustand des Systems ist. Ein harmonischer Oszillator ist ein schwingendes System, bei dem die rücktriebende Kraft eine lineare Funktion der Auslenkung ist. Aufgabe 6.1 Man zeige, dass sich dasselbe Kraftgesetz auch dann ergibt, wenn auf den K örper zusätzlich noch die Schwerkraft wirkt, und zwar unabhängig davon, ob sich der Körper im Schwerefeld in horizontaler, vertikaler oder in irgendeiner anderen Richtung bewegen kann. Man muss nur das Koordinatensystem entsprechend anpassen. Lineare Differenzialgleichungen Die Bewegungsgleichung (6.2) ist eine lineare Differenzialgleichung für die gesuchte Funktion 4 . Solche Differenzialgleichungen lassen sich mit einer einfachen und sehr allgemeinen Methode lösen, die wir kurz herleiten wollen. Jedoch müssen wir dazu einen kleinen Umweg machen und zunächst komplexe Funktionen von reellen Variablen betrachten. Eine allgemeine lineare Differenzialgleichung -ter Ordnung für eine komplexe Funktion einer reellen Variablen hat die Form lineare Differenzialgleichung & 6 114 (6.3) Wie üblich bezeichnet die -te Ableitung der Funktion . Die Koeffizienten sind beliebige komplexe Zahlen, wobei wir ohne Beschränkung der Allgemeinheit 0 annehmen können. Der Schlüssel zur Lösung einer linearen Differenzialgleichung liegt in einer speziellen Eigenschaft der Lösungsmenge. Unabhängig davon, ob die Koeffizienten reell oder komplex sind, bzw. ob die gesuchte Funktion reell oder komplex ist, bilden die Lösungen einen Vektorraum. Der Beweis ist ganz einfach. Mit jeder Funktion bzw. und jedem 8 bzw. 8 ist offenbar auch die Funktion eine Lösung der Differenzialgleichung. Und mit je zwei Funktionen und ist auch die Funktion eine Lösung. Damit sind skalare Multiplikation und Vektoraddition erklärt, und es ist auch mehr oder weniger offensichtlich, dass die Vektorraumaxiome erfüllt sind. Wir können sogar etwas über die Dimension des Lösungsraumes aussagen, und auch diese Aussage gilt wieder unabhängig davon, ob wir reelle oder komplexe Funktionen betrachten. Um die Lösung einer Differenzialgleichung -ter Ordnung eindeutig zu bestimmen, müssen wir Anfangsbedingun und die ersten " 0 Ableitungen gen festlegen. Zum Beispiel 1 können wir den Funktionswert an irgendeiner Stelle vorgeben. Die -te Ableitung der Funktion und damit ihr Verlauf ist dann durch die Differenzialgleichung festgelegt. Zu jeder möglichen Wahl dieser Anfangsbedingungen gehört also genau eine Lösung der Differenzialgleichung. Das sind reelle bzw. komplexe Zahlen, die wir unabhängig voneinander wählen können, also ist der Lösungsraum ein -dimensionaler komplexer Vektorraum. Der formale Beweis dieser Aussage, den wir hier nicht führen werden, beruht wieder auf dem Satz von Cauchy, Picard und Lindelöf. Die Aussage ist völlig analog zur Kernaussage über dynamische System, wonach die Zeiteintwicklung eines solchen Systems eindeutig durch die Anfangsbedingungen festgelegt ist. Um die allgemeine Lösung der Differenzialgleichung (6.3) zu bestimmen, genügt es, eine Basis des Lösungsraumes anzugeben. Beschränken wir uns zunächst auf komplexe Funktionen, so besteht eine solche Basis aus genau linear unabhängigen Funktionen 8 . Jede Lösung lässt sich dann eindeutig als Linearkombination der Basisfunktionen darstellen. Um eine solche Basis zu finden, müssen wir einen geeigneten Ansatz machen. Es bietet sich an, eine Exponentialfunktion zu wählen, & (6.4) 6 (6.5) Setzen wir diesen Ansatz in (6.3) ein, so ergibt sich charakteristisches Polynom 6 & Die Funktion wird charakteristisches Polynom der Differenzialgleichung (6.3) genannt. Es ist ein Polynom -ten Grades in , das sich über dem Körper stets vollständig faktorisieren lässt. Wir bezeichnen die Nullstellen mit , deren Anzahl mit , und ihre jeweiligen Vielfachheiten mit . Dann ist & " (6.6) Das ist der Grund, warum wir zunächst komplexe Funktionen betrachten müssen. Über dem Körper lassen sich Polynome nicht immer vollständig faktorisieren, da im allgemeinen nicht alle Nullstellen eines reellen Polynoms reell sein müssen. Ein beliebiges komplexes Polynom -ten Grades hat aber stets Nullstellen, wenn wir sie mit ihren jeweiligen Vielfachheiten zählen. Wenn alle Nullstellen einfach sind, also alle 0 sind, dann gibt es verschiedene Nullstellen. In diesem Fall haben wir linear unabhängige Funktionen + gefunden, die die Differenzialgleichung lösen. Sie bilden die gesuchte Basis des Lösungsraumes. Die allgemeine Lösung ist somit eine Linearkombination von Exponentialfunktionen. 115 Wenn es Nullstellen zweiter oder höherer Ordnung gibt, also nicht alle gleich eins sind, dann ist ihre Anzahl kleiner als der Grad des charakteristischen Polynoms. In diesem Fall bilden die Funktionen zwar noch immer einen linear unabhängigen Satz von Lösungen, aber keinen vollständigen Satz und damit keine Basis des -dimensionalen Lösungsraumes. Es muss also noch andere Lösungen geben. eine -fache Nullstelle des charakteristischen Polynoms. Man zeige, dass Aufgabe 6.2 Es sei dann die Funktionen + für 6 33 " 0 (6.7) linear unabhängige Lösungen der Differenzialgleichung (6.3) sind. Es gibt also zu jeder mehrfachen Nullstelle des charakteristischen Polynoms nicht nur eine, sondern so viele Lösungen + der Differenzialgleichung, wie es der Vielfachheit der Nullstelle entspricht. Insgesamt finden wir auf diese Weise immer linear unabhängige Lösungen. Diese bilden die gesuchte Basis des Lösungsraumes, und die allgemeine Lösung ist eine Linearkombination dieser Basisfunktionen, & Die Koeffizienten , von denen es genau jeweiligen Anfangsbedingungen anzupassen. (6.8) Stück gibt, können frei gewählt werden. Sie sind an die Die Lösungsmenge einer linearen Differenzialgleichung -ter Ordnung ist ein dimensionaler Vektorraum. Eine Basis dieses Raumes ist durch Exponentialfunktionen gegeben, die sich aus den Nullstellen des charakteristischen Polynoms bestimmen lassen. Jetzt gibt es nur noch ein Problem. Wir kennen jetzt die allgemeine Lösung einer komplexen Differenzialgleichung. Die Lösungsmenge ist ein -dimensionaler Vektorraum über , von dem wir eine Basis explizit angeben können. Aber eigentlich wollten wir eine reelle Differenzialgleichung lösen. Die Koeffizienten sind reell, und auch die gesuchte Funktion soll reell sein. Natürlich können wir jede reellwertige Funktion auch als eine komplexwertige Funktion . auffassen. Die reellen Lösungen sind daher als Teilmenge in den komplexen Lösungen (6.8) enthalten, und sie bilden einen -dimensionalen reellen Vektorraum. Andererseits wissen wir, dass wir eine reelle Lösung der Differenzialgleichung bekommen, wenn wir reelle Anfangsbedingungen vorgeben. Denn unabhängig davon, mit welcher Technik wir eine Differenzialgleichung lösen, gilt ja der Satz, dass die Lösung eindeutig durch die Anfangsbedingungen festgelegt ist. Um zu einem gegebenen Satz von Anfangsbedingungen die richtige Lösung zu finden, müssen wir also nur die Koeffizienten entsprechend bestimmen, und es sollte sich automatisch eine reelle Lösung ergeben, wenn die Anfangsbedingungen reell sind. Das lässt sich sogar leicht ganz allgemein beweisen. Aufgabe 6.3 Zusätzlich zur Differenzialgleichung (6.3) sei ein Satz von Anfangsbedingungen , , , vorgegeben. Man zeige, dass die Koeffizienten in (6.8) dadurch eindeutig festgelegt sind und somit genau eine Lösung der Differenzialgleichung existiert, die den gegebenen Anfangsbedingungen genügt. Aufgabe 6.4 Man zeige, dass die Funktion reell ist, wenn sowohl die Koeffizienten der Differenzi " 0 reell algleichung als auch die in Aufgabe 6.3 definierten Anfangsbedingungen für 6 31 sind. 116 Aufgabe 6.5 Die Lösungen der folgenden Differenzialgleichungen lassen sich leicht erraten. 4 6 4 6 4 4 4 4 (6.9) Man bestimme jeweils das charakteristische Polynom, seine Nullstellen, und überprüfe die allgemeine Formel (6.8). Aufgabe 6.6 Man bestimme die Lösungen fangsbedingungen: 4 4 7 4 4 4 6 der folgenden Differenzialgleichungen mit An- 6 & 6 6 & 0 0 & 6 & 6 0 & (6.10) Die Eigenfrequenz Nach dieser kurzen Einführung in die Methoden zur Lösung von linearen Differenzialgleichungen kehren wir zurück zum harmonischen Oszillator. Seine Bewegungsgleichung (6.2) ist ein sehr einfacher Spezialfall einer linear Differentialgleichung. Das charakteristische Polynom ist (6.11) . Die Konstante hat Es besitzt zwei einfache, zueinander komplexe konjugierte Nullstellen die Dimension einer inversen Zeit, also einer Frequenz, 0 s. & " " mit Aus der Formel (6.8) können wir unmittelbar die allgemeine Lösung der Bewegungsgleichung ablesen. Sie lautet 4 & -( ( 1! , " ( , . 8 3! (6.12) Als Parameter der Lösung haben wir hier zunächst zwei komplexe Zahlen ( eingeführt. Dann haben wir die Exponentialfunktionen durch Winkelfunktionen ausgedrückt und anschließend zwei neue Parameter ( und " ( eingeführt. Es treten dann keine expliziten Faktoren mehr auf, so dass wir unmittelbar ablesen können, für welche Werte der Parameter die Lösung reell ist. Das ist genau dann der Fall, wenn und reell sind. Damit kennen wir die allgemeine Lösung der Bewegungsgleichung. Und es ist auch nicht schwierig, die Koeffizienten und so zu bestimmen, dass bestimmte Anfangsbedingungen erfüllt sind. Geben wir zum Beispiel den Ort 4 und die Geschwindigkeit ( zur Zeit 6 vor, so finden wir 4 6 4 4 6 & ( 4 4 3! ( (6.13) Offenbar führt der schwingende Körper eine periodische Bewegung aus, deren Periode allein von den Parametern und , nicht jedoch von den Anfangsbedingungen abhängt. Ein paar typische Bewegungsabläufe sind in Abbildung 6.2 dargestellt. Es gilt stets 4 4 mit 7 (6.14) Die Zeit wird Eigenperiode, ihr Kehrwert 0 Eigenfrequenz des harmonischen Oszillators genannt. Die Größe 7 heißt Kreisfrequenz. Da die Frequenz fast immer im Argument von Sinus- 117 replacements (a) (b) (c) (d) Abbildung 6.2: Typische Lösungen der Bewegungsgleichung eines harmonischen Oszillators für . Es sind jeweils der Anfangsort durch einen Punkt und verschiedene Anfangsbedingungen bei die Anfangsgeschwindigkeit durch einen Pfeil markiert. Alle Bewegungen haben dieselbe Periode . und Kosinus-Funktionen auftritt, ist es meist einfacher, die Kreisfrequenz anzugeben, da dann keine expliziten Faktoren 7 auftreten. Oft wird auch einfach die Größe als Eigenfrequenz bezeichnet. Die wesentliche Eigenschaft eines harmonischen Oszillators ist demnach, dass seine Bewegung stets mit derselben Kreisfrequenz abläuft, die sich in diesem Fall aus den beiden Parametern und des mechanischen Systems bestimmt. Ein harmonischer Oszillator schwingt, unabhängig von den Anfangsbedingungen, stets mit derselben charakteristischen Kreisfrequenz . Aufgabe 6.7 Es seien als Anfangsbedingungen der Ort 4 und die Geschwindigkeit ( zu einem Zeitpunkt vorgegeben. Man zeige, dass sich die Lösung der Bewegungsgleichung dann wie folgt schreiben lässt, ( 4 & 4 4 ( 4 4 1! " " (6.15) Aufgabe 6.8 Die allgemeine Lösung (6.12) der Bewegungsgleichung des harmonischen Oszillators l ässt sich auch auf andere Weise parametrisieren. Statt der Parameter kann man zwei Parameter 6 und angeben, so dass 4 1! (6.16) Man zeige, dass zwischen und einerseits und und andererseits die Beziehungen 3! bzw. (6.17) gelten. Die Parameter und heißen Amplitude und Phase der Schwingung. Welche physikalische Dimension, und welche anschauliche Bedeutung haben diese Gr ößen? Aufgabe 6.9 Als ‘Anfangsbedingungen’ können statt des Ortes und der Geschwindigkeit zu einem festen Zeitpunkt auch andere Vorgaben gemacht werden, zum Beispiel die folgende. Zum Zeitpunkt befindet sich der Körper am Ort 4 4 , zum Zeitpunkt am Ort 4 ? 4 . Man bestimme daraus die 4 Funktion . Ist die Lösung immer eindeutig? Gibt es immer eine Lösung? 118 Der schwach gedämpfte Oszillator Bis jetzt sind wir von den Idealvorstellung ausgegangen, dass der Körper reibungsfrei schwingt, das heißt außer der rücktreibende Kraft der Feder wirkt keine weitere Kraft. Für ein mechanisches System ist das natürlich unrealistisch. Es wirkt auch eine Reibungskraft auf den Körper ein, sei es direkt, zum Beispiel durch den Luftwiderstand, oder indirekt durch die innere Reibung der Feder. Wie üblich machen wir für die Reibungskraft den Ansatz einer zur Geschwindigkeit proportionalen und ihr entgegengerichteten Kraft, wobei der Proportionalitätsfaktor die Reibungskonstante ist. Die Bewegungsgleichung (6.1) lautet dann 4 4 4 4 " " 4 (6.18) Die daraus resultierende Bewegungsgleichung ist noch immer linear in der gesuchten Funktion 4 , 4 gedämpfter Oszillator 4 4 6 (6.19) Ein dynamisches System dieser Art bezeichnet man als gedämpften harmonischen Oszillator. Mit den Abkürzungen (6.20) 4 4 6 (6.21) vereinfacht sich seine Bewegungsgleichung zu 4 7 7 Die Größe ist wieder die Kreisfrequenz des ungedämpften Oszillators, und ist ein Maß für die Stärke 0 s. der Dämpfung. Beide Größen haben die Dimension einer inversen Zeit, Um die Bewegungsgleichung mit der gerade entwickelten Methode zu lösen, betrachten wir wieder das charakteristische Polynom und dessen Nullstellen, & 7 >" >" " " (6.22) Offenbar müssen wir hier eine Fallunterscheidung machen. Je nach dem Vorzeichen des Ausdrucks unter der Wurzel hat das charakteristische Polynom entweder zwei konjugiert komplexe Nullstellen, eine doppelte reelle Nullstelle, oder zwei reelle Nullstellen. Wir betrachten zuerst den Fall kleiner Reibung, also 7 (6.23) In diesem Fall liegen zwei komplexe Nullstellen vor, nämlich " " mit (6.24) Beides sind einfache Nullstellen, so dass sich aus der Formel (6.8) die folgende allgemeine Lösung der Bewegungsgleichung ergibt, 4 & , -( -( 3! (6.25) Auch hier haben wir wieder die komplexen Exponentialfunktionen durch Winkelfunktionen ausgedrückt und anschließend -( und " ( gesetzt, um die Faktoren zu eliminieren. 119 replacements (a) (b) (c) (d) Abbildung 6.3: Typische Lösungen der Bewegungsgleichung eines schwach gedämpften harmonischen Oszillators. Die Anfangsbedingungen sind wie in Abbildung 6.2 gewählt, jedoch bewirkt die Reibung jetzt ein exponentielles Abklingen der Schwingung auf der charakteristischen Zeitskala und gleichzeitig eine Dehnung der Schwingungsperiode . Offenbar unterscheidet sich die Lösung (6.25) von der Lösung (6.12) des reibungsfreien Oszillators durch den Vorfaktor . Die Amplitude der Schwingung klingt exponentiell mit der Zeit ab, das heißt die Schwingung ist gedämpft. Außerdem ist die Kreisfrequenz der Schwingung kleiner als die Kreisfrequenz im reibungsfreien Fall. Der gedämpfte Oszillator schwingt langsamer als der ungedämpfte. Ein schwach gedämpfter harmonischer Oszillator schwingt mit einer kleineren Kreisfrequenz als der entsprechende ungedämpfte Oszillator, und seine Amplitude klingt exponentiell mit der Zeit ab. In Abbildung 6.3 sind die typischen Bewegungen eines gedämpften harmonischen Oszillators dargestellt. 7 Es treten dabei zwei charakteristische Zeitkonstanten auf, nämlich die Periode der Schwin0 gung, und die Abklingzeit . Das ist die Zeit, in der die Amplitude der Schwingung auf 0 der ursprünglichen Amplitude abgefallen ist. Für kleine Reibungskonstanten ist die Abklingzeit sehr groß und die Periode weicht nur wenig von der Periode des ungedämpften Oszillators ab. Mit zunehmender Reibung wird die Abklingzeit kleiner, das heißt die Amplitude fällt schneller ab, während gleichzeitig die Schwingungsperiode größer bzw. , dann geht die wird. Wenn wir uns der oberen Grenze in (6.23) nähern, also für Kreisfrequenz sogar gegen Null, das heißt die Schwingungsperiode geht gegen unendlich. Aufgabe 6.10 Man bestätige durch explizites Nachrechnen, dass die Funktionen (6.25) f ür beliebige Konstanten Lösungen der Bewegungsgleichung (6.21) sind. Aufgabe 6.11 Es seien wieder als Anfangsbedingungen der Ort 4 und die Geschwindigkeit ( zum Zeitpunkt vorgegeben. Man zeige, dass die Schwingung des gedämpften harmonischen Oszillators dann durch die folgende Funktion beschrieben wird, 4 4 4 ( 4 4 3! " 120 ( 4 " (6.26) replacements (a) (b) (c) (d) Abbildung 6.4: Typische Lösungen der Bewegungsgleichung eines stark gedämpften harmonischen Oszillators. Die Anfangsbedingungen sind wieder die gleichen wie in den Abbildungen 6.2 und 6.3. Der bestimmen sich Oszillator fällt jetzt, ohne zu schwingen, in die Ruhelage zurück. Die Abklingzeiten aus den Exponenten in (6.29). Der stark gedämpfte Oszillator Nun betrachten wir den Fall starker Dämpfung, das heißt die Reibungskonstante soll über dem kritischen Wert liegen, (6.27) 7 In diesem Fall besitzt das charakteristische Polynom (6.22) zwei negative reelle Nullstellen, nämlich " mit " (6.28) Die allgemeine Lösung der Bewegungsgleichung ist nun eine Linearkombination von zwei exponentiell fallenden Funktionen, 4 -( (6.29) Der Oszillator führt jetzt gar keine Schwingungen mehr aus, sondern fällt nur noch exponentiell in seine Ruhelage zurück. Es treten dabei zwei Zeitkonstanten 0 " und 0 & auf. Die größere der beiden, also , bestimmt das Verhalten der Funktion 4 für große Zeiten. Die charakteristische Abklingzeit, in der die Amplitude auf 0 der ursprünglichen Amplitude abgefallen ist, ist durch 0 " gegeben. Der typische Bewegungsablauf eines stark gedämpften Oszillators ist in Abbildung 6.4 dargestellt. Die Funktion 4 hat höchstens eine Nullstelle, das heißt der der Körper schwingt höchstens einmal durch die Ruhelage, und nähert sich dieser dann exponentiell abfallend an. Ein stark gedämpfter harmonischer Oszillator fällt innerhalb einer charakteristischen Abklingzeit exponentiell in die Ruhelage zurück, wobei er diese höchstens einmal durchläuft. Aufgabe 6.12 Durch einen Trick lässt sich die Lösung (6.29) auf eine ähnliche Form bringen wie (6.25). Benutzen wir die Definitionen 1! 7 und 121 " 7 (6.30) (c) (d) (a) (b) Abbildung 6.5: Das Verhalten eines harmonischen Oszillators bei verschiedenen Reibungskonstanten . Im Diagramm (a) sind die Kreisfrequenz und Dämpfungskonstanten bzw. dargestellt, die jeweils die Dimension einer inversen Zeit haben. Im Diagramm (b) sind die entsprechenden charakteristischen Zeitkonstanten dargestellt, also die Schwingungsperiode und die Abklingzeiten bzw. . -( und " ( , so ist (6.29) dasselbe wie der Hyperbelfunktionen, und setzen diesmal ? 4 3! (6.31) Das Ergebnis von Aufgabe 6.11 lässt sich dann unmittelbar auf den Fall starker Dämpfung übertragen. Man zeige, dass die üblichen Anfangsbedingungen für Ort und Geschwindigkeit zur Zeit jetzt auf die folgende eindeutig bestimmte Lösung führen, 4 4 4 ( 4 4 1! " ( 4 " (6.32) Der aperiodische Grenzfall Betrachten wir jetzt noch den Grenzfall, in dem die Reibungskonstante gerade den kritischen Wert hat, 7 Das charakteristische Polynom (6.22) hat in diesem Fall eine doppelte reelle Nullstelle bei der allgemeinen Formel (6.8) ergibt sich die sehr einfache Lösung 4 , -( (6.33) " . Aus (6.34) wobei und ( jetzt zwei reelle Parameter sind. Qualitativ ergibt sich ein ähnliches Bild wie beim stark gedämpften Oszillator in Abbildung 6.4. Es findet keine Schwingung statt, sondern der Oszillator fällt nur noch in die Ruhelage zurück, wobei er diese höchstens einmal durchläuft. Der einzige Unterschied ist, 0 gibt, die den exponentiellen Abfall beschreibt. dass es jetzt nur noch eine Zeitkonstante 0 Die Abklingzeit ist gerade die inverse Kreisfrequenz des ungedämpften Oszillators. 122 In Abbildung 6.5 ist noch einmal das Verhalten eines harmonischen Oszillators bei unterschiedlichen Werten der Parameter dargestellt. Die Masse und die Federkonstante , und somit auch die Kreisfrequenz des ungedämpften Oszillators sind fest gewählt. Die Reibungskonstante ist variabel und nimmt jeweils von links nach rechts zu. Ist kleiner als der kritische Wert 7 , so schwingt der Oszillator mit einer Kreisfrequenz , und seine Amplitude fällt mit dem Exponenten ab. Mit zunehmender Reibung wird die Kreisfrequenz kleiner und die Dämpfung größer. Dadurch wird die Periode 7 größer und die Abklingzeit 0 kleiner. Beim kritischen Wert geht die Kreisfrequenz gegen Null und die Schwingungsperiode gegen unendlich. Jenseits des kritischen Wertes, also bei starker Dämpfung, tritt keine Schwingung mehr auf. Statt dessen gibt es zwei Dämpfungskonstanten und , bzw. zwei Zeitkonstanten und . Sie bestimmen das Abklingverhalten der Auslenkung als Funktion der Zeit. Die größere der beiden Zeitkonstanten bestimmt das Verhalten des Oszillators für große Zeiten, das heißt sie bestimmt letztlich, wie schnell der Oszillator wieder in seine Ruhelage zurück fällt. Aufgabe 6.13 Aufgabe eines Stoßdämpfers ist es, die Reibungskonstante eines schwingenden Systems so einzustellen, dass sich das System bei einer plötzlich auftretenden Auslenkung so schnell wie möglich wieder in die Ruhelage begibt. Warum ist ein Stoßdämpfer genau dann optimal eingestellt, wenn der aperiodische Grenzfall vorliegt? Nehmen wir an, die Stoßdämpfer eines Autos seien optimal eingestellt. Nun wird das Auto zusätzlich beladen. Was wird beim nächsten Schlagloch passieren? Wird das Auto beginnen zu schwingen, oder wird es nur langsamer als im unbeladenen Zustand wieder seine Ruhelage erreichen? Aufgabe 6.14 Man zeige, dass sich die Lösung zu den üblichen Anfangsbedingungen im aperiodischen Grenzfall wie folgt schreiben lässt, 4 6 & 4 4 6 & ( 4 4 ( 4 " (6.35) Aufgabe 6.15 Man bilde in (6.26) bzw. (6.32) den Grenzwert und zeige, dass sich in beiden Fällen die Lösung (6.32) ergibt. Der aperiodische Grenzfall lässt sich also stetig von beiden Seiten durch Grenzwertbildung darstellen. Der angetriebene Oszillator Jetzt wollen wir noch den Fall betrachten, dass ein gedämpfter harmonischer Oszillator von außen angetrieben wird. Zusätzlich zur rücktreibenden Federkraft und zur Reibungskraft soll eine äußere Kraft auf den schwingenden Körper einwirken, 4 4 4 4 " " 4/ (6.36) Die Funktion , die wir beliebig vorgeben können, beschreibt die äußere Kraft als Funktion der Zeit. Die Bewegungsgleichung in Standardform lautet dann angetriebener Oszillator 4 4 4 0 (6.37) Leider ist diese Differenzialgleichung nicht mehr von der Form (6.3). Die linke Seite ist zwar linear in der gesuchten Funktion 4 , aber auf der rechten Seite steht nicht mehr Null, sondern eine vorgegebene Funktion von . Es handelt sich um eine inhomogene lineare Differenzialgleichung, während eine Gleichung von der Form (6.3) eine homogene Differenzialgleichung ist. 123 Wie können wir eine solche Differenzialgleichung lösen? Betrachten wir ganz allgemein eine inhomogene lineare Differenzialgleichung der Form inhomogene lineare Differenzialgleichung (6.38) wobei eine vorgegebene Funktion von ist. Ansonsten benutzen wir dieselbe Notation wie vorher. An dieser Stelle spielt es keine Rolle, ob die gesuchte Funktion reelle oder komplexe Werte annimmt. Wenn komplex ist, darf natürlich auch eine beliebige komplexe Funktion sein. Der Lösungsraum dieser Differenzialgleichung ist kein Vektorraum mehr. Wenn wir eine Lösung mit einer Konstanten multiplizieren oder zwei Lösungen addieren, dann erhalten wir keine neue Lösung. Trotzdem können wir die gerade entwickelte Technik auch hier wieder verwenden. Wir müssen sie nur ein wenig modifizieren. Betrachten wir zwei Lösungen und von (6.38). Dann gilt für die Funktion " " " & 6 (6.39) Offenbar ist die Funktion eine Lösung der homogenen Differenzialgleichung (6.3). Diese Funktionen kennen wir. Sie bilden einen -dimensionalen Vektorraum, und wir kennen sogar eine Basis dieses Vektorraumes. Jedem Paar von Lösungen der inhomogenen Gleichung (6.38) ist demnach eine Lösung der homogenen Gleichung (6.3) zugeordnet. Wie man sich leicht überlegt, erfüllt diese Zuordnung die Axiome der Abbildung (1.40) eines affinen Raumes auf den zugeordneten Vektorraum. Mit anderen Worten, die Lösungsmenge einer inhomogenen linearen Differenzialgleichung ist ein affiner Raum, dessen zugeordneter Vektorraum die Lösungsmenge der entsprechenden homogenen linearen Differenzialgleichung ist. Nehmen wir an, wir würden eine ganz bestimmte Lösung der inhomogenen Differenzialgleichung kennen, also einen “Punkt” in dem affinen Raum, der aus allen Lösungen der inhomogenen Gleichung besteht. Dann können wir diesen “Punkt” um einen “Vektor”, also um eine Lösung der homogenen Gleichung “verschieben”, um einen anderen “Punkt”, also eine andere Lösung der inhomogenen Gleichung zu finden. Wenn wir alle Lösungen der homogenen Gleichung kennen, erhalten wir auf diese Weise alle Lösungen der inhomogenen Gleichung. Nun hießt “verschieben” in diesem Fall einfach addieren. Wenn wir zu einer Lösung der inhomogenen Gleichung eine Lösung der homogenen Gleichung addieren, so erhalten wir wieder eine Lösung der inhomogenen Gleichung. Da wir alle Lösungen der inhomogenen Gleichung auf diese Weise darstellen können, genügt die Kenntnis einer einzigen Lösung der inhomogenen Gleichung und der vollständige Lösungsmenge der homogenen Gleichung, um die vollständige Lösungsmenge der inhomogenen Gleichung zu bestimmen. Die allgemeine Lösung einer inhomogenen linearen Differenzialgleichung ergibt sich aus der allgemeinen Lösung der zugehörigen homogenen Differenzialgleichung durch Addition einer speziellen Lösung der inhomogenen Differenzialgleichung. Um die Bewegungsgleichung (6.37) des angetriebenen Oszillators zu lösen, müssen wir also nur eine einzige spezielle Lösung finden, und zu dieser die zuvor ermittelte allgemeine Lösung der Bewegungsgleichung eines gedämpften Oszillators addieren. 124 replacements (a) (b) (c) (d) Abbildung 6.6: Der angetriebene harmonische Oszillator. Durch Bewegung des Aufhängepunktes wirkt eine zusätzliche, von außen vorgegebene Kraft auf den Körper. Der Oszillator führt eine erzwungene Schwingung aus, deren Frequenz durch die Frequenz der äußeren Kraft bestimmt wird. Periodischer Antrieb und Resonanz Da das Auffinden einer speziellen Lösung für eine nicht weiter spezifizierte Funktion nicht ganz einfach ist, wollen wir zunächst einen Spezialfall betrachten, nämlich eine periodische Antiebskraft (6.40) Das ist die Antriebskraft, die sich ergibt, wenn wir den Aufhängepunkt der Feder, wie in Abbildung 6.6 gezeigt, periodisch auf und ab bewegen, und zwar mit einer Amplitude und einer Kreisfrequenz . Eine Verschiebung des Aufhängepunktes um bewirkt nämlich eine Streckung bzw. Stauchung der Feder um und somit eine zusätzliche Kraft . Benutzen wir, dass ist, so lautet die zu lösende Bewegungsgleichung nun 4 7 4 4 (6.41) Um einen geeigneten Ansatz für die Funktion 4 zu finden, überlegen wir uns, welche Art von Bewegung zu erwarten ist. Wenn wir einen gedämpften Oszillator über einen längeren Zeitraum hinweg mit einer periodischen Kraft antreiben, so wird er sich, möglicherweise nach einer gewissen Einschwingzeit, diesem Antrieb unterwerfen und ebenfalls mit der Kreisfrequenz schwingen. Wir machen daher den Ansatz 4 3! -( 4 " -( 3! 4 " 1! " ( (6.42) wobei ( zwei noch zu bestimmende Konstanten sind. Setzen wir das in die Bewegungsgleichung (6.41) ein und fassen die Sinus- und Kosinus-Terme jeweils zusammen, so ergibt sich nach einer kurzen Rechnung " 7 ( " ( 7 3! " (- 6 (6.43) Da dies für alle gelten muss, müssen die Ausdrücke in den Klammern verschwinden. Ein wenig umgeformt ergibt sich " 7 ( 6 125 " ( " 7 (6.44) Das ist ein lineares Gleichungssystem für die Parameter und ( , die wir in den Ansatz hineingesteckt haben. Die eindeutige Lösung ist " 7 " 7 ( " " 7 (6.45) Damit haben wir eine spezielle Lösung der Bewegungsgleichung gefunden. Wenn wir diese Werte für und ( einsetzen, erfüllt die Funktion (6.42) die Differenzialgleichung (6.41). Der Ansatz war also gut gewählt. Allerdings haben wir auf diese Weise nur genau eine Lösung gefunden. Um die allgemeine Lösung der Bewegungsgleichung zu bekommen, müssen wir die allgemeine Lösung der zugehörigen homogenen Differenzialgleichung addieren. Dies ist die Bewegungsgleichung (6.21) des gedämpften Oszillators. Deren allgemeine Lösung kennen wir schon. Der Einfachheit halber betrachten wir nur den Fall kleiner Reibung. In diesem Fall ist die allgemeine Lösung der homogenen Gleichung durch (6.25) gegeben. Also lautet die allgemeine Lösung der Bewegungsgleichung (6.41) für einen angetriebenen Oszillator 4 3! -( 3! (6.46) Für und ( sind die Ausdrücke (6.45) einzusetzen, die durch die Amplitude und Frequenz der Antriebskraft eindeutig festgelegt sind. Die Parameter und sind dagegen frei wählbar. Sie werden durch die Anfangsbedingungen festgelegt. Wie sieht nun die Bewegung eines angetriebenen Oszillators qualitativ aus? Offenbar beschreibt (6.46) die Überlagerung von zwei Schwingungen. Da ist zunächst eine erzwungene Schwingung mit der Kreisfrequenz , die von der Antriebskraft herrührt. Ihre Amplitude und Phase ist vollständig durch die Antriebskraft festgelegt, denn die Konstanten und ( werden durch die Parameter des Oszillators sowie die Amplitude und Frequenz der Antriebskraft vollständig fixiert. Wir werden darauf gleich noch näher eingehen. Zusätzlich tritt eine Eigenschwingung des Oszillators mit der Kreisfrequenz auf. Sie ist von der Antriebskraft unabhängig. Ihre Amplitude und Phase hängt von den Anfangsbedingungen ab. Sie klingt allerdings exponentiell mit der Zeit ab, so dass für Zeiten, die sehr viel größer sind als die charakteristische Abklingzeit 0 , nur noch die erzwungene Schwingung übrig bleibt. Nach einer gewissen Einschwingzeit sehen wir also nur noch die durch die Antriebskraft verursachte erzwungene Schwingung. Ein durch eine periodische Kraft angetriebener harmonischer Oszillator führt nach einer Einschwingzeit eine erzwungene Schwingung aus, die vollständig durch die antreibende Kraft bestimmt ist. Wie wir aus (6.45) entnehmen, hängt das Verhalten eines angetriebenen Oszillators im wesentlichen von der Differenz der Antriebsfrequenz von der Eigenfrequenz des Oszillators ab. Für einen sehr langsamen Antrieb, also im Grenzfall 6 , finden wir 6 und ( , und für große Zeiten gilt 4 . Nach der Einschwingzeit folgt der Oszillator einfach der antreibenden Kraft, wie in Abbildung 6.7(a) zu sehen ist. Die Amplitude der Schwingung entspricht der Amplitude, mit der sich der Aufhängepunkt auf und ab bewegt. Um das Verhalten der erzwungenen Schwingung im allgemeinen zu diskutieren, ist es sinnvoll, die spezielle Lösung der Bewegungsgleichung in die Form 4 1! .( (6.47) umzuschreiben. Dann können wir unmittelbar die Amplitude und die Phase der Schwingung ablesen. Der Winkel ist in diesem Fall die Phasenverschiebung zwischen der Phase der antreibenden Kraft und der Antwort des Oszillators. 126 replacements (d) (a) (b) (c) Abbildung 6.7: Typische Schwingungen eines angetriebenen harmonischen Oszillators mit schwacher Dämpfung. Die gestrichelte Linie beschreibt die Auslenkung des Aufhängepunktes der Feder, also die antreibende Kraft. Die durchgezogene Linie beschreibt die Bewegung des Oszillators, wobei als An und gewählt wurden. Nach einer kurzen Einschwingzeit, fangsbedingungen jeweils die von der Größenordnung ist, begibt sich der Oszillator in eine erzwungene Schwingung, die nur von der Amplitude und Frequenz des Antriebs abhängt. Aufgabe 6.16 Die dazu nötige Umrechnung haben wir bereits in Aufgabe 6.8 durchgef ührt. Man zeige, dass sich im hier vorliegenden Fall für die Amplitude & " 7 ergibt, und für die Phasenverschiebung gilt " 3! & 7 (6.48) " (6.49) Die Funktion 1! ist als Umkehrfunktion des Kotangens so definiert, dass sie Werte zwischen und 6 annimmt, wenn das Argument von " bis läuft. Die Phasenverschiebung nimmt folglich Werte zwischen 6 und " an. Wir betrachten die Amplitude und die Phasenverschiebung nun als Funktion der Kreisfrequenz der Antriebskraft. Wir stellen uns dabei vor, dass wir die Antriebsfrequenz langsam verändern, den Oszillator immer wieder einschwingen lassen, und dabei seine Amplitude und Phase beobachten. Die Funktionen und , die sich so ergeben, sind in Abbildung 6.8 für verschiedene Werte der Dämpfungskonstanten aufgetragen. Betrachten wir zunächst den Fall sehr kleiner Dämpfung, also . In diesem Fall hat die Amplitude ein scharfes Maximum bei einer Kreisfrequenz , die sehr nahe an der Kreisfrequenz des ungedämpften Oszillators liegt. Dieses Phänomen wird Resonanz genannt. Aufgabe 6.17 Man bestimme das Maximum der Funktion und zeige, dass dieses bei " 7 mit & 127 7 " (6.50) replacements (d) (a) (b) (c) Abbildung 6.8: Amplitude und Phasenverschiebung einer erzwungenen Schwingung als Funktion der Kreisfrequenz der Antriebskraft. Bei schwacher Dämpfung (a) ergibt sich eine scharfe Resonanzkurve, bei mittlerer Dämpfung (b) ist die Resonanz weniger stark ausgeprägt, und bei starker Dämpfung (c) verschwindet sie ganz. liegt, Die Resonanz tritt demnach bei einer Antriebsfrequenz ein, die unterhalb der Kreisfrequenz des ungedämpften Oszillators liegt, und ebenfalls unterhalb der Kreisfrequenz (6.24) des gedämpften Oszillators. Außerdem ändert sich mit der Antriebsfrequenz auch die Phasenverschiebung zwischen der Antriebskraft und dem Oszillator. Für 6 geht das Argument des Arkus-Kotangens in (6.49) gegen " , der ArkusKotangens also gegen und somit geht die Phasenverschiebung gegen Null. Der Oszillator folgt in diesem Fall unmittelbar der antreibenden Kraft. Dies hatten wir schon in Abbildung 6.7(a) gesehen. Mit zunehmender Antriebsfrequenz tritt eine zunehmende negative Phasenverschiebung auf. Der Oszil ist das Argument des Arkus-Kotangens gleich Null, lator läuft der antreibenden Kraft hinterher. Für 7 das heißt die Phasenverschiebung beträgt genau " . Dieses Verhalten sehen wir in Abbildung 6.7(b). In der Nähe der Resonanz ist die Amplitude besonders hoch und die Phasenverschiebung beträgt genau eine viertel Periode. Erhöhen wir die Antriebsfrequenz noch weiter, so nimmt die Amplitude der erzwungenen Schwingung wieder ab und die Phasenverschiebung nimmt weiter zu. Für sehr große Antriebsfrequenzen nähert sie sich dem Grenzwert " , das heißt der Oszillator ist dann fast in Gegenphase zur Antriebskraft. Das sehen wir in Abbildung 6.7(c). Nach einer gewissen Einschwingzeit, die sich in diesem Fall über mehrere Perioden der Antriebskraft erstreckt, liegen die beiden Kurven um etwa eine halbe Periode phasenverschoben zueinander. Wenn wir die Reibung erhöhen, verschwindet das Phänomen der Resonanz allmählich. Wie wir in Abbildung 6.8(b) sehen, ist das Maximum der Amplitude weniger stark ausgeprägt, wenn die Dämpfungskonstante größer ist. Außerdem liegt die Resonanzfrequenz (6.50) hier bereits deutlich unterhalb der Eigenfrequenz des Oszillators. Oberhalb eines kritischen Wertes der Reibungskonstanten, der bei 7 128 7 (6.51) Abbildung 6.9: Die Kastenfunktionen (oben) und ihre Stammfunktionen (unten) für verschie dene Werte von . Für ergibt sich als Grenzwert der Kastenfunktionen die Deltafunktion , und als Grenzwert ihrer Stammfunktionen die Stufenfunktion . liegt, tritt keine Resonanz mehr auf. Man beachte, dass dies ein anderer kritischer Wert ist als derjenige, bei dem keine Eigenschwingung des Oszillators mehr möglich ist. Dieser war durch 7 gegeben, ist also um den Faktor 7 größer. Die Resonanz verschwindet bereits bevor die Eigenschwingungen in exponentiell fallendes Abklingen übergehen. Aufgabe 6.18 Wie sieht die Funktion für 6 aus, also bei verschwindender Reibung? Was passiert in diesem Fall beim Eintritt der Resonanz, also an der Stelle ? Die spezielle Lösung (6.42) existiert nicht. Warum nicht? Wie sieht statt dessen die Lösung der Bewegungsgleichung für 6 und aus, wenn als Anfangsbedingungen zum Beispiel 4 6 5 6 und 4 6 < 6 vorgegeben sind? Wie verh ält sich diese Lösung für große Zeiten? Delta-Funktion und Kraftstoß Eine andere spezielle Situation liegt vor, wenn die antreibende Kraft nicht periodisch ist, sondern der Oszillator nur einmal kurz angestoßen und dann wieder sich selbst überlassen wird. Dieser Fall ist vor allem deshalb interessant, weil sich aus der Lösung dieses Problems schließlich auch die “Antwort” des Oszillators auf eine beliebige antreibende Kraft herleiten lässt. Um eine Antriebskraft zu beschreiben, die nur für ein kurzes Zeitintervall wirkt, führen wir die in Abbildung 6.9 oben dargestellte Kastenfunktion ein, 0 6 77 für für (6.52) Die Kastenfunktion ist so definiert, dass sie nur in einem Intervall der Breite von Null verschieden ist, und ihr Funktionswert dort ist so gewählt, dass die Fläche unter dem Kasten immer gleich Eins ist. Ist irgendeine stetige, integrierbare Funktion, so ist " & 0 129 (6.53) 7 . Nach dem Mittelwertsatz der Das ist der Mittelwert von im Intervall #" 7 Integralrechnung gibt es eine Stelle innerhalb dieses Intervalls, so dass der Funktionswert genau dieser Mittelwert ist. Bilden wir den Grenzwert 6 , so konvergiert gegen und wir bekommen folglich den Funktionswert an der Stelle , " (6.54) Da die Funktion für 6 nicht definiert ist, dürfen wir die beiden Grenzwerte in (6.54), also 6 und das Bilden des Integrals, eigentlich nicht vertauschen. Es ist aber nützlich, es trotzdem zu tun und eine Deltafunktion einzuführen, die die folgende Eigenschaft haben soll, Deltafunktion " (6.55) Diese “formale” Definition ist wie folgt zu verstehen. Anschaulich formuliert ist eine Funktion, die überall gleich Null ist außer an der Stelle 6 , wo sie unendlich groß wird, und zwar so, dass ihr Integral über eine beliebig kleine Umgebung der Null gleich Eins ist, 6 6 6 für für & 0 für 6 (6.56) Eine solche Funktion existiert natürlich nicht wirklich. Steht sie jedoch unter einem Integral, so ist unter einem eigentlich unsinnigen Ausdruck der Form (6.55) der sinnvolle Grenzwert (6.54) zu verstehen. Mit anderen Worten, wenn unter einem Integral eine Deltafunktion steht, so “denken” wir uns einfach einen Grenzwert 6 vor dem Integral und die Funktion durch 3 ersetzt. Es handelt sich um eine abkürzende Schreibweise, die ähnlich zu verstehen ist wie die Summenkonvention für Vektorindizes. Sie ist sehr nützlich, weil man mit Hilfe der Deltafunktion formale Umformungen durchführen kann, wobei man sie wie eine gewöhnliche Funktion behandeln kann. Es gibt noch eine andere Möglichkeit, die Deltafunktion einzuführen und vielleicht ein wenig besser zu verstehen. Dazu betrachten wir ihre Stammfunktion. Die Stammfunktionen der Kastenfunktionen sind in Abbildung 6.9 unten dargestellt. Wir bezeichnen sie mit (6.57) Offenbar ist 6 für " 7 und 0 für 7 . Dazwischen steigt die Funktion linear mit der Steigung 0 an und es ist 6 0 7 . Im Grenzwert 6 gilt & Stufenfunktion 6 0 7 0 =6 für für für 6 6 (6.58) Das ist die Stufenfunktion. Sie ergibt sich in dem oben definierten formalen Sinn als Stammfunktion der Deltafunktion. Zwischen der Stufenfunktion und der Deltafunktion bestehen somit die formalen Beziehungen die wir auch als alternative Definition der Deltafunktion betrachten können. 130 (6.59) Abbildung 6.10: Die Deltafunktion kann auch als Grenzwert einer glatten Funktion dargestellt werden, hier der Gaußschen Normalverteilungsfunktion. Auch dann ergibt sich als Stamm funktion die Stufenfunktion . im Grenzwert Die Deltafunktion ist die Ableitung der Stufenfunktion. Aufgabe 6.19 Wie ist die folgende Gleichung zu verstehen und wie kann man sie beweisen? " & " (6.60) Aufgabe 6.20 Die Deltafunktion kann auch als Grenzwert einer glatten Funktion definiert werden. Man betrachte zum Beispiel die in Abbildung 6.10 oben für verschiedene dargestellten Funktionen 0 & (6.61) Man zeige, dass auch die so definierte Deltafunktion die oben aufgez ählten Eigenschaften hat. Insbesondere ergibt sich als Stammfunktion wieder die Stufenfunktion , jetzt dargestellt als Grenzwert der in Abbildung 6.10 unten gezeigten glatten Funktionen. Aufgabe 6.21 Definiert man die Deltafunktion wie in Aufgabe 6.20 als Grenzwert einer glatten Funk tion, so kann man auch ihre Ableitungen , etc. einführen. Sie sind in Abbildung 6.11 dargestellt. Man leite die folgenden Formeln aus der Eigenschaft (6.55) ab, " & " Wie lautet die entsprechende Formel für die -te Ableitung " " & 1 (6.62) ? Aufgabe 6.22 Welche physikalische Dimension hat die Deltafunktion " , wenn die Zeit ist? Welche physikalische Dimension hat allgemein eine Deltafunktion " , wenn irgendeine physikalische Größe ist? 131 replacements (a) (b) (c) (d) Abbildung 6.11: Die Ableitungen der Deltafunktion , wie sie sich aus der Darstellung (6.61) ergeben. Aufgabe 6.23 Es sei eine streng monotone steigende Funktion mit der einzigen Nullstelle 6 . Man beweise durch Substitution & (6.63) Aufgabe 6.24 Für ein frei bewegliches Teilchen im dreidimensionalen Raum gelten die folgenden Bewegungsgleichungen mit zeitabhängiger Kraft, 0 mit " (6.64) Der dadurch beschriebene Vorgang wird als Kraftstoß bezeichnet. Warum? Was bewirkt ein Kraftstoß? Welche physikalische Dimension und welche Bedeutung hat der Vektor ? Wie sieht die eindeutige L ösung der Bewegungsgleichungen aus, wenn als Anfangsbedingungen 6 und 6 & vorgegeben sind? 6 , 6 und 6 . Man unterscheide hierbei die Fälle 9 Der angestoßene Oszillator Wir betrachten nun wieder die Bewegungsgleichung (6.37) für den angetriebenen harmonischen Oszillator . Für die Antriebskraft setzen wir jetzt eine Deltafunktion mit schwacher Dämpfung, also mit ein, multipliziert mit einer Konstanten , damit die rechte Seite der Gleichung die richtige physikalische Dimension bekommt, 4 7 4 4 " (6.65) Der Oszillator erfährt also zur Zeit einen Kraftstoß der Stärke , ist aber ansonsten sich selbst überlassen. Gesucht ist nun irgendeine spezielle Lösung dieser Bewegungsgleichung. Die allgemeine Lösung finden wir dann wie üblich durch Addition der allgemeinen Lösung der homogenen Gleichung, die wir bereits 132 replacements (a) (b) (c) (d) . Für Abbildung 6.12: Antwort des gedämpften Oszillators auf einen Kraftstoß ergibt sich die Lösung des antriebsfreien Oszillators aus Abbildung 6.3 mit den Anfangsbedingungen und . kennen. Da sowohl für als auch für keine Antriebskraft vorliegt, gilt dort jeweils die Bewegungsgleichung für den antriebsfreien Oszillator. Wir machen daher den Ansatz 4 " 6 für für (6.66) wobei eine Lösung der Bewegungsgleichung (6.21) für den antriebsfreien Oszillator ist. Der Oszillator soll sich also vor dem Stoß in Ruhe befinden und danach eine gedämpfte Schwingung ausführen. Wir müssen nur noch herausfinden, welche Schwingung er genau ausführt. Dazu müssen wir den Ansatz in die Bewegungsgleichung einsetzen. Für die Geschwindigkeit finden wir 4 & " " " " (6.67) und nochmaliges Ableiten liefert die Beschleunigung " " " " (6.68) Setzen wir das in (6.65) ein, so heben sich alle Terme weg, die zu " proportional sind. Denn 4 & " " war ja eine Lösung der zugehörigen homogenen Differenzialgleichung. Was bleibt ist " " (6.69) Da diese Gleichung für alle erfüllt sein muss und " und +" zwei linear unabhängige Funktionen sind, ergibt sich daraus 6 und . Damit haben wir die gesuchte spezielle Lösung der Bewegungsgleichung (6.65) gefunden. Wir müssen für diejenige Lösung für den antriebsfreien Oszillator einsetzen, die sich aus den Anfangsbedingungen " " 7 133 6 und ergibt. Diese kennen wir bereits aus (6.26). Wir müssen dort nur 4 ( setzen. Das ergibt 4 " " mit " 6 und (6.70) Das ist die Antwort des Oszillators auf einen Kraftstoß zur Zeit , bei dem ein Impuls übertragen wird. Für festes und verschiedene Werte von sind diese Funktionen in (6.12) dargestellt. Für ist der Oszillator in Ruhe. Zum Zeitpunkt erfährt er einen Kraftstoß. Danach ist seine Geschwindigkeit nicht mehr Null sondern . Mit dieser neu gesetzten Anfangsbedingung beginnt er dann zu schwingen, wobei die Amplitude für wegen der Dämpfung wieder exponentiell abklingt. Aufgabe 6.25 Der Oszillator befinde sich für angestoßen. Es sei also " " in Ruhe und werde dann zweimal hintereinander mit . Man löse die Bewegungsgleichung. Aufgabe 6.26 Der Oszillator werde periodisch angestoßen, es gelte also " (6.71) Man finde eine spezielle Lösung der Bewegungsgleichung. Gibt es auch hier ein Resonanzph änomen, wenn man die Periode variiert? Lineare Antwort und Greensche Funktion Wir werden nun zeigen, dass wir auch die Bewegungsgleichung für eine beliebige Antriebskraft lösen können. Wir können also für jede vorgegebene Kraftfunktion die Antwort des Oszillators berechnen. Die Technik, die wir dazu verwenden, lässt sich später auf viele ähnliche physikalische Fragestellungen anwenden. Entscheidend ist dabei, dass der der Oszillator linear antwortet, das heißt seine Reaktion ist eine lineare Funktion der Antriebskraft. Wir betrachten zunächst die Differenzialgleichung, die sich ergibt, wenn wir auf der rechten Seite der Bewegungsgleichung einfach nur eine Deltafunktion " als Antriebskraft einsetzen. Außerdem er4 setzen wir sie Ortfunktion durch eine Funktion von zwei Variablen, 7 0 " (6.72) Dies ist eine Differenzialgleichung für die Funktion , wobei der Punkt immer die Ableitung nach dem ersten Argument bezeichnet. Das zweite Argument haben wir nur deshalb dazugeschrieben, weil es auch auf der rechten Seite der Gleichung auftritt, und weil folglich auch die Lösungen dieser Diffe renzialgleichung von abhängen. Eine spezielle Lösung können wir unmittelbar aus (6.70) ablesen. Sie lautet 0 " " (6.73) Aufgabe 6.27 Ist dies die einzige Lösung der Differenzialgleichung (6.72)? Wenn nicht, durch welche zusätzliche Forderung ist sie eindeutig festgelegt? Nun betrachten wir die Funktion 4 134 (6.74) wobei irgendeine integrierbare Funktion ist, so dass das Integral konvergiert. Da die Integration über erfolgt und nicht über , und wenn wir einmal voraussetzen, dass die Funktion genügend glatt ist, so dass wir die Integration über mit der Ableitung nach vertauschen können, so ergibt sich aus (6.74) und (6.72) 4 7 4 4 & 0 7 " 0 (6.75) Wir haben mit (6.74) also eine Lösung der Bewegungsgleichung für nahezu beliebige Antriebsfunktionen gefunden. Die einzige Einschränkung ist, dass das Integral (6.74) konvergieren muss. Das ist aber eine relativ geringfügige Einschränkung, denn die Funktion fällt für " exponentiell ab, und für ist sie wegen der Stufenfunktion ohnehin gleich Null. Das Integral kon vergiert also ganz sicher, wenn zum Beispiel für alle Zeiten beschränkt ist, was für einen realistischen Antrieb sicher der Fall ist. Gemäß der Formel (6.74) ergibt sich die Antwort 4 des Oszillators auf eine Antriebsfunktion also durch Faltung der Antriebsfunktion mit der Funktion . Als Faltung bezeichnet man allgemein ein Integral der Form (6.74). Eine Faltung bildet eine Funktion, hier , linear auf eine andere Funktion, hier 4 , ab, wobei als Faltungsfunktion oder Integralkern eine Funktion von zwei Variablen auftritt. Die Funktion wird auch als Greensche Funktion des Oszillators bezeichnet. Unter einer Greenschen Funktion versteht man im allgemeinen eine Funktion, mit deren Hilfe man durch Faltung eine inhomogene lineare Differenzialgleichung lösen kann. In unserem Fall hat die Greensche funktion noch eine spezielle Eigenschaft. Da für gleich Null ist, können wir statt (6.74) auch 4 (6.76) schreiben. Das ist physikalisch sehr sinnvoll. Um die Auslenkung 4 zu einem Zeitpunkt zu bestimmen, genügt es, die Antriebsfunktion für zu kennen, also für Zeiten , die vor dem Zeitpunkt liegen. Wie sich die Antriebskraft später, also für verhält, ist unerheblich. Es gilt das Ursache Wirkung-Prinzip, wonach die Ursache, die Antriebskraft , der Wirkung, also der Auslenkung 4 vorausgeht. Man nennt deshalb auch eine retardierte Greensche Funktion. Sie bestimmt die Bewegungen des Oszillators allein aus den Kräften, die in der Vergangenheit auf ihn einwirkten. Die Antwort des eines harmonischen Oszillators auf eine beliebige Antriebskraft ergibt sich durch Faltung der Antriebskraft mit seiner retardierten Greens-Funktion. Aufgabe 6.28 Es soll eine inhomogene lineare Differenzialgleichung die Funktion gelöst werden, Es sei eine Greensche Funktion mit der Eigenschaft " 135 -ter Ordnung der Form (6.38) f ür (6.77) (6.78) wobei die Ableitungen wieder nur auf das erste Argument wirken. Man zeige, dass dann eine spezielle Lösung der Differenzialgleichung (6.38) durch (6.79) gegeben ist. Wie findet man eine solche Greensche Funktion? Ist sie eindeutig bestimmt? Wenn nicht, durch welche zusätzliche Forderung wird sie eindeutig? Aufgabe 6.29 Man finde eine spezielle Lösung des angetriebenen Oszillators für 6 für für (6.80) Es wirkt also über ein gewisses Zeitintervall eine konstante Kraft . Aufgabe 6.30 Man setze < und reproduziere die bereits bekannte Lösung der Bewegungsgleichung für eine periodische Antriebskraft mit der Methode der Greenschen Funktion. Aufgabe 6.31 Man löse die folgende Differenzialgleichung zuerst mit Hilfe einer Greenschen Funktion und bestimme dann diejenige Lösung, die zu der gestellten Anfangsbedingung gehört, 4 4 4 4 6 & 0 (6.81) Der gekoppelte Oszillator Zum Abschluss dieses Kapitels wollen wir noch eine wichtige Verallgemeinerung des harmonischen Oszillators kennen lernen. Bis jetzt haben wir nur Systeme mit einem Freiheitsgrad betrachtet, deren Bewegungen durch eine einzige Funktion 4 beschrieben werden. Als Verallgemeinerung davon kennen wir bereits das mathematische Pendel in der linearen Näherung (5.55). Das war ein System mit zwei Freiheitsgraden. Dort waren die Bewegungsgleichungen für die Ortskoordinaten 4 und bereits entkoppelt. Beim mathematischen Pendel in der linearen Näherung handelt es sich daher um ein System von zwei voneinander schwingen. Die geunabhängigen Oszillatoren, die jeweils mit der gleichen Eigenfrequenz schlossenen Ellipsen in Abbildung 5.6 ergeben sich als Überlagerung zweier unabhängiger Schwingungen, die senkrecht zueinander mit der gleichen Frequenz erfolgen. Ein interessanterer Fall liegt von, wenn zwei Oszillatoren miteinander gekoppelt sind. Ein typisches mechanisches System dieser Art ist in Abbildung 6.13(a) dargestellt. Es besteht aus zwei Oszillatoren, die parallel zueinander in 4 -Richtung schwingen und durch eine zusätzliche Feder miteinander verbunden sind. Beide Oszillatoren sollen dieselbe Masse und dieselbe Federkonstante haben. Ihre Bewegungen werden durch zwei Funktionen 4 3 und 4 beschrieben. Der Einfachheit halber sollen weder Reibungskräfte vorliegen noch eine äußere Antriebskraft. Auf den ersten Körper wirkt dann eine rückstellende Kraft " 4 , die ihn in die Ruhelage zurück zieht. Auf den zweiten Körper wirkt entsprechend eine rückstellende Kraft " 4 . Von der dritten Feder wollen wir annehmen, dass für sie ebenfalls ein lineares Kraftgesetz gilt. Auf den ersten Körper wirkt dadurch eine zusätzliche Kraft " 4 " 4 , die ihn zum zweiten Körper hin zieht, während auf den zweiten Körper die gleich große Gegenkraft " 4 " 4 wirkt. Die Federkonstante der Wechselwirkung ist im allgemeinen von der Federkonstante der einzelnen Oszillatoren verschieden. Setzen wir das alles zusammen, so ergeben sich die Bewegungsgleichungen 4 4 ; 4 " 4 6 136 4 4 < 4 " 4 6 (6.82) replacements (d) (b) (a) (c) Abbildung 6.13: Zwei oder mehr Oszillatoren werden durch eine zusätzliche Feder miteinander gekoppelt. Diese Art der Wechselwirkung kennen wir bereits aus Kapitel 3. Dort hatten wir die Bewegungsgleichungen für ein Zwei-Teilchen-System mit linearem Kraftgesetz aufgestellt und gelöst. Der einzige Unterschied ist, dass hier die Bewegungen nur in eine Raumrichtung erfolgen, und dass zusätzlich die Rückstellkräfte auf die beiden Körper wirken. Es handelt sich bei (6.82) um ein System von zwei gekoppelten linearen Differenzialgleichungen. Um unsere oben entwickelte Methode zur Lösung von linearen Differentialgleichungen darauf anwenden zu können, müssen wir sie zuerst entkoppeln. Wir bilden dazu die Summe und die Differenz der beiden Gleichungen, 4 4 ; 4 4 6 4 " 4 7 4 " 4 6 (6.83) Offenbar können wir auch hier die Bewegung der beiden Körper in eine Schwerpunkt- und eine Relativbewegung zerlegen. Wenn wir als Hilfsfunktionen 4 3 .4 7 4 und 4 4 1 " 4 7 (6.84) einführen, so ergeben sich zwei voneinander unabhängige, lineare Differenzialgleichung für die Funktionen 4 und 4 , nämlich 4 4 6 4 7 4 6 (6.85) Beides sind die Bewegungsgleichungen für einen harmonischen Oszillator. Die Lösungen dieser Gleichungen können wir leicht angeben. Die charakteristischen Eigenfrequenzen der beiden Oszillatoren sind 7 (6.86) und die allgemeine Lösung der Bewegungsgleichungen (6.85) lautet 4 & 8 3! 4 1! (6.87) Es treten vier Integrationskonstanten auf, also vier Parameter und , die wir den gestellten Anfangsbedingungen anpassen müssen. Für beide Körper können wir jeweils den Ort und die Geschwindigkeit zu irgendeinem Zeitpunkt frei wählen. 137 replacements (a) (b) (c) (d) (lanAbbildung 6.14: Zwei gekoppelte Oszillatoren können im Gleichtakt mit einer Periode ge Striche), oder im Gegentakt mit einer kleineren Periode schwingen (kurze Striche). Im allgemeinen ergibt sich die Bewegung der Oszillatoren als Überlagerung von zwei solchen Eigenmoden (durchgezogene Kurve). Daraus können wir leicht die allgemeine Lösung der ursprünglichen Bewegungsgleichung ableiten. Wir müssen nur die Definition (6.84) der Hilfsfunktionen umkehren. Das ergibt 4 3 & 4 .4 8 1! 4 & 4 " 4 8 1! " 3! 1! " (6.88) Um die Bewegungen anschaulich darzustellen, betrachten wir zunächst zwei Spezialfälle, die als Eigenmoden des gekoppelten Oszillators bezeichnet werden. Es sei zunächst 6 . In diesem Fall ist 4 3 4 . Die beiden Körper schwingen synchron, also im Gleichtakt zueinander mit der Frequenz . Die mittlere Feder ist dabei stets entspannt, das heißt die Körper verhalten sich so, als wäre sie gar nicht vorhanden. Tatsächlich ist die Kreisfrequenz genau die Kreisfrequenz eines einzelnen Oszillators mit der Masse und der Federkonstante . Für 6 liegt ein anderer Spezialfall vor. In diesem Fall ist 4 1 " 4 . Die beiden Körper schwingen jetzt gegeneinander, und zwar mit einer Kreisfrequenz . Jetzt trägt die mittlere Feder sehr wohl zu den Kräften und damit zur Bewegungsgleichung bei, so dass sich eine höhere effektive Federkonstante 7 ergibt, und somit auch eine höhere Schwingungsfrequenz. Die beiden Eigenmoden sind in Abbildung 6.14 als gestrichelte Linien dargestellt. Die beiden Oszillatoren können miteinander mit der Periode 7 oder gegeneinander mit der Periode 7 schwingen, wobei für die Perioden stets gilt. Ein typische Lösung der Bewegungsgleichung ist eine Überlagerung dieser beiden Eigenmoden, die als durchgezogene Linie dargestellt ist. Wir können das wie folgt zusammenfassen: Die Schwingungen eines gekoppelten harmonischen Oszillators lassen sich in Eigenmoden zerlegen, die sich jeweils wie einzelne harmonische Oszillatoren verhalten und unabh ängig voneinander mit verschiedenen Eigenfrequenzen schwingen. 138 Ein besonders interessanter Fall liegt vor, wenn die Kopplung zwischen den beiden Körpern nur schwach ist, also sehr klein ist im Vergleich zu . Betrachten wir eine bestimmte Lösung der Bewegungsgleichung, indem wir als Anfangsbedingung 4 3 6 & 4 6 & 6 4 1 6 6 4 6 6 (6.89) vorgeben. Wir lenken also nur den ersten Körper aus der Ruhelage aus und überlassen das System dann sich selbst. Wie man leicht nachprüft, erfüllt der folgende Spezialfall der Lösung (6.88) diese Anfangsbedingungen, 4 3 1! 7 7 3! 4 1! 7 " 7 1! (6.90) Um das ein wenig umzuformen, benutzen wir die Additionstheoreme (2.83) für die Kosinus-Funktionen. Aus ihnen ergibt sich " 3! 3! 7 3! 1! 1! Setzen wir 7 7 " 3! 7 7 " 7 " 7 7 (6.91) (6.92) so lässt sich die Lösung (6.90) wie folgt schreiben, 4 3 1! 3! 4 " (6.93) Da die beiden Eigenfrequenzen und sehr nahe beieinander liegen, ist sehr klein, während ungefähr gleich der Kreisfrequenz eines einzelnen, ungekoppelten Oszillators ist. Die Funktionen mit den 7 Argumenten oszillieren sehr schnell, mit der Periode , während sich die Funktionen mit den Argumenten nur langsam verändern. Die Zeitspanne zwischen zwei Nullstellen dieser Funktionen beträgt . Die Funktion 4 3 beschreibt also eine Schwingung mit der Periode , deren Amplitude sich mit der Zeit langsam verändert und jeweils nach der Zeit einen Nulldurchgang hat. Sie ist in Abbildung 6.15 oben dargestellt. Ein solches Verhalten, das durch die Überlagerung zweier Schwingungen mit annähernd gleicher Frequenz entsteht, bezeichnet man als Schwebung. Durch den geringen Frequenzunterschied kommt es dazu, dass sich die beiden Schwingungen einmal gegenseitig verstärken und einige Zeit später gegenseitig auslöschen, weil sich ihre Phasen gegeneinander verschoben haben. Die Funktion 4 hat ein ähnliches Verhalten, nur dass sowohl die Phase der eigentlichen Schwingung, als auch das auf und ab der Amplitude gegenüber der Funktion 4 3 phasenverschoben ist. Insgesamt ergibt sich daher folgendes Bild. Durch die spezielle Anfangsbedingung wird zuerst nur der Oszillator 0 in Schwingungen mit der Amplitude versetzt. Nach einer gewissen Zeit überträgt sich diese Schwingung durch die Kopplung auf den Oszillator 7 . Zur Zeit 7 schwingt der erste Oszillator gar nicht mehr, der zweite jedoch mit der Amplitude . Dann wiederholt sich das Spiel in umgekehrter Richtung. Die Kopplung bewirkt also eine Übertragung der Schwingung von dem einen auf den anderen Oszillator. Wie wir andeutungsweise in den folgenden Aufgaben sehen werden, beruht auf diesem Prinzip die Ausbreitung von Wellen. Wir müssen uns dazu nur eine lange Kette von ganz vielen Oszillatoren vorstellen, so dass die Schwingung jeweils von einem Oszillator zu seinem Nachbarn übertragen wird. Und das ist auch letztlich der Grund, warum uns der harmonische Oszillator als ein sehr einfaches physikalisches System immer wieder begegnen wird. Viele, auch sehr komplizierte Systeme lassen sich nämlich als gekoppelte harmonische Oszillatoren verstehen. 139 replacements (a) (b) (c) (d) Abbildung 6.15: Die Überlagerung zweier Schwingungen mit annähernd gleicher Frequenz wird Schwebung genannt. Sie tritt beim gekoppelten harmonischen Oszillator auf, wenn die Kopplung sehr schwach ist. Die einzelnen Oszillatoren schwingen jeweils mit einer Periode , wobei die Amplitude dieser Schwingungen mit einer Periode zwischen den beiden Oszillatoren hin und her pendelt. Aufgabe 6.32 Auf die beiden schwingenden Körper wirke zusätzlich eine Reibungskraft mit der Reibungskonstanten , sowie auf einen der beiden Körper eine periodische äußere Kraft 3 . Man zeige, dass die Bewegungsgleichungen auch dann noch entkoppelt werden k önnen, und dass sich die beiden Eigenmoden in diesem Fall wie zwei einzelne harmonische Oszillatoren mit D ämpfung und Antrieb verhalten. Nach einer gewissen Einschwingzeit führt das System eine erzwungene Schwingung aus, deren Frequenz mit der die antreibenden Kraft übereinstimmt. Wie sieht diese Schwingung aus? Wie äußert sich das Phänomen der Resonanz? Aufgabe 6.33 Man diskutiere den Fall von zwei gekoppelten Oszillatoren, die nicht identisch sind, also verschiedene Massen und und verschiedene Federkonstanten und haben. Man zeige, dass auch dann eine Entkoppelung der Bewegungsgleichungen m öglich ist. Man bestimme die beiden Eigenmoden und die zugehörigen Eigenfrequenzen und . Aufgabe 6.34 In Abbildung 6.13(b) ist ein gekoppeltes System von drei identischen Oszillatoren 4 , 4 und 4 mit Massen und Federkonstanten dargestellt. Die Kopplung erfolgt durch zwei Federn mit Federkonstanten . Wie lauten die Bewegungsgleichungen? Um die Eigenmoden, also eine Basis des Lösungsraumes zu finden, macht man zunächst den Ansatz 4 3 & 1! 4 & 1! 4 1! (6.94) Alle drei Körper sollen mit derselben Kreisfrequenz schwingen, wobei aber m öglicherweise Phasenverschiebungen auftreten. Das Gleichungssystem, das sich für die Koeffizienten und für 0 7 ergibt, hat dann nur für bestimmte Werte von Lösungen. Wie viele solche Frequenzen gibt es, und wie sehen die zugehörigen Schwingungsmoden aus? Aufgabe 6.35 In Abbildung 6.13(c) ist ein gekoppeltes System von unendlich vielen identischen Oszillatoren 4 , , mit Massen und Federkonstanten dargestellt. Die Kopplung zwischen zwei be nachbarten Oszillatoren erfolgt jeweils durch eine Feder mit der Federkonstanten . Man zeige, dass die Bewegungsgleichungen wie folgt lauten, 4 7 4 " < 4 .4 6 140 (6.95) Um die Eigenmoden zu finden, wählt man den geschickten Ansatz 4 3! (6.96) wobei , , und irgendwelche reellen Zahlen sind. Man zeige, dass diese Funktionen genau dann eine Lösung der Bewegungsgleichungen liefern, wenn zwischen und die Beziehung 7 0 " 3! (6.97) besteht. Jede Lösung dieser Art beschreibt folglich eine Eigenmode des Systems mit der Eigenfrequenz . Welchen Wertebereich und welche physikalische Bedeutung haben , , und ? Wie sieht die allgemeine Lösung der Bewegungsgleichungen aus? Welche Daten können als Anfangsbedingungen vorgegeben werden? 7 Energie, Arbeit und Potenzial Im letzten Kapitel haben wir uns ausführlich mit linearen Differenzialgleichungen beschäftigt. Leider sind nur die wenigsten Bewegungsgleichungen von dieser Art, so dass sich die entsprechenden Methoden nur in ganz speziellen Fällen überhaupt anwenden lassen. Nichtlineare Differenzialgleichungen lassen sich im allgemeinen nicht explizit lösen, so dass wir über kompliziertere dynamische Systeme oft nur qualitative Aussagen machen, oder deren Lösungen näherungsweise ermitteln können, zum Beispiel mit numerischen Methoden oder durch eine geeignete Approximation an ein lineares System. Das Ziel dieses Kapitels ist es, Methoden zu entwickeln, mit deren Hilfe wir möglichst viele Aussagen über die Lösungen von bestimmten Bewegungsgleichungen machen können, ohne diese explizit zu kennen. Eine wichtige Rolle spielen dabei die Erhaltungsgrößen eines dynamischen Systems, von denen wir einige schon kennen gelernt haben. Hier werden wir die Energie als eine neue Erhaltungsgröße einführen und zeigen, dass sich die Bewegungsgleichungen vieler Systeme mit Hilfe dieser Erhaltungsgröße vereinfachen oder sogar lösen lassen. Eindimensionale Systeme Um das Konzept von Energie, Arbeit und Potenzial zu verstehen, ist es ganz nützlich, zunächst ein System mit nur einem Freiheitsgrad zu betrachten. Es ist dabei unerheblich, ob es sich um ein mechanisches System mit Zwangsbedingungen handelt oder ob sich ein Teilchen aufgrund eines vorgegebenen Kraftgesetzes und spezieller Anfangsbedingungen nur in eine Richtung bewegt. Die Bahn eines solchen Systems wir durch eine einzige reelle Funktion 4 beschrieben, und im allgemeinen gilt ein Kraftgesetz der Form 4 4 4 , das heißt die Kraft ist als Funktion des Ortes, der Geschwindigkeit und der Zeit gegeben. Wie wollen hier den speziellen Fall betrachten, dass die Kraft nur von Ort abhängt. Die Bewegungsgleichung lautet dann 4 4 (7.1) Wir wollen versuchen, aus den Eigenschaften der Funktion 4 möglichst viele Informationen über das Verhalten der Lösungen dieser Bewegungsgleichung abzuleiten. Der erste Schritt besteht darin, dass wir uns eine anschauliche Vorstellung von der Wirkung der Kraft auf das Teilchen machen. Dazu ist es nützlich, eine Funktion 4 einzuführen, die wir Potenzial nennen. Sie ist durch Potenzial 4 " 4 141 (7.2) replacements (d) (b) (a) (c) Abbildung 7.1: Der qualitative Verlauf der Bewegung eines Teilchens in einem Potenzial lässt sich aus der Form des Potenzials ablesen. Besitzt das Potential Extrema, so kann das Teilchen dort ruhen (a). Sonst wird das Teilchen zum fallenden Potenzial hin beschleunigt (b). In einer Potenzialmulde kann das Teilchen schwingen (c). definiert, also im wesentlichen die Stammfunktion des Kraftgesetzes. Das Potenzial ist bis auf eine additive Konstante bestimmt, die wir frei wählen können. Offenbar können wir statt der Funktion 4 dann auch die Funktion 4 vorgeben und die Bewegungsgleichung in der Form 4 " 4 (7.3) schreiben. Damit ist zwar noch nicht viel gewonnen. Aber mit Hilfe eines Potenzials können wir das Kraftgesetz sehr gut grafisch veranschaulichen. In Abbildung 7.1 sind verschiedene Potenziale 4 dargestellt. 4 Nehmen wir an, das Teilchen befindet sich an einer Stelle 4 . Dann wirkt eine Kraft " auf das Teilchen, die umso größer ist, je steiler der Graf der Funktion 4 an dieser Stelle ist. Sie wirkt stets in die Richtung, in die das Potenzial abfällt. Wir können uns sogar vorstellen, dass sich das Teilchen selbst auf der Potenzialkurve entlang bewegt, wobei diese aufrecht in einem Gravitationsfeld aufgestellt ist. Zumindest qualitativ ergibt sich dann dasselbe Kraftgesetz. Die Kraft ist umso größer, je steiler die Kurve ist, und sie wirkt stets nach unten. Die typischen Bewegungsabläufe können wir dann fast schon intuitiv erahnen. 4 6 Hat das Potenzial irgendwo ein Extremum, ist also , so kann das Teilchen an der Stelle 4 4 ruhen. Fällt das Potenzial in einem Bereich zu größeren 4 hin ab, so erfährt das Teilchen dort eine Beschleunigung in Richtung der 4 -Achse. Wenn wir es an irgendeiner Stelle aus der Ruhe startet lassen, dann bewegt es sich beschleunigt nach rechts. Und schließlich, wenn das Potenzial um ein Minimum herum eine Mulde bildet, so kann es dort eine Schwingung ausführen. Wir wollen das ein wenig systematischer untersuchen. Wir zeigen zuerst, dass das Potenzial nicht nur nützlich ist, um das Kraftgesetz anschaulich zu machen, sondern dass wir auch quantitative Aussagen daraus ableiten können. Wir benutzen dazu einen Trick, den wir bereits in Kapitel 3 verwendet haben, um die Bewegungsgleichung für den senkrechten Fall in einem Gravitationsfeld zu lösen. Wir multiplizieren die Bewegungsgleichung (7.3) auf beiden Seiten mit 4 und schreiben alles auf eine Seite, 4 4 4 4 6 (7.4) Dieser Ausdruck lässt sich mit Hilfe der Kettenregel auch wie folgt schreiben, 7 4 4 6 142 (7.5) Folglich ist die Größe in der Klammer zeitlich konstant, also eine Erhaltungsgr öße. Sie wird Energie genannt, Energie 7 4 4 (7.6) Die Energie hat die Dimension Masse mal Geschwindigkeit zum Quadrat, oder Kraft mal Länge, 0 kg m s 0 N m. Sie setzt sich zusammen aus einer kinetischen Energie, die von der Geschwindigkeit des Teilchens abhängt, und einer potenziellen Energie, die davon abhängt, wo sich das Teilchen gerade befindet und welchen Wert dort das Potenzial hat. Hinter dieser Aufspaltung verbirgt sich die anschauliche Vorstellung, dass sich bei der Bewegung des Teilchens fortwährend kinetische in potenzielle Energie verwandelt und umgekehrt, wobei die Summe aus beiden konstant bleibt. Läuft das Teilchen einen Potenzialberg hinab, so wird es schneller, das heißt es wird potenzielle in kinetische Energie verwandelt. Läuft es einen Potenzialberg hinauf, so wird die kinetische Energie wieder in potenzielle Energie verwandelt. Wir sagen auch, dass bei einem solchen Prozess Arbeit verrichtet wird. Unter Arbeit verstehen wir im allgemeinen einen Prozess, bei dem eine Energieform in eine andere verwandelt wird. Aufgabe 7.1 Ein Teilchen fällt senkrecht in in einem Gravitationsfeld, das heißt es gelte " . Man bestimme das Potential und zeige anhand der bekannten L ösungen der Bewegungsgleichung, dass die Energie tatsächlich zeitlich konstant ist. Aufgabe 7.2 Man bestimme das Potenzial 4 für einen ungedämpften harmonischen Oszillator und zeige, dass eine Potenzialmulde wie in Abbildung 7.1(c) vorliegt, in der das Teilchen schwingen kann. Man berechne für die bekannte Lösung (6.12) die Energie und zeige, dass sie nicht von abh ängt. Bewegungsformen Mit Hilfe einer Erhaltungsgröße können wir die Lösungen der Bewegungsgleichung klassifizieren. Wir können sie gewissermaßen nach dem Wert von sortieren. Dazu müssen wir zunächst feststellen, welche Werte überhaupt annehmen kann. Die kinetische Energie kann nicht negativ sein, da sie proportional zum Quadrat der Geschwindigkeit ist. Die Energie ist daher immer mindestens so groß wie das Potenzial an dem Ort, an dem sich das Teilchen gerade befindet, 4 (7.7) Insbesondere muss mindestens so groß sein wie das absolute Minimum der Funktion 4 , falls es ein solches gibt. Ansonsten ist nicht nach unten beschränkt. Wenn wir einen bestimmten Wert von vorgeben, dann wird durch die Forderung (7.7) eine Bedingung an 4 gestellt. In Abbildung 7.2 sind drei typische Fälle dargestellt, wobei der jeweils zulässige Bereich schattiert ist. Im Fall (a) ist die Bedingung 4 für alle 4 erfüllt. Die Energie ist größer als das 4 , also in einem absolute Maximum der Potenzialfunktion. Im Fall (b) gilt 4 nur für 4 nach oben unbeschränkten aber nach unten beschränkten Intervall. Natürlich ist auch der umgekehrte Fall 4 nur für 4 4 gilt. Im Fall (c) schließlich erfordert die Bedingung 4 , denkbar, dass 4 4 4 4 dass in einem nach oben und unten beschränkten Intervall liegt. Was bedeutet das konkret für die Lösungen der Bewegungsgleichung? Nehmen wir an, wir hätten eine 4 spezielle Lösung 4 gegeben und kennen den zugehörigen Wert von . Dann gilt natürlich 4 4 ist. Die für alle . Also ist der Wertebereich von auf den Bereich eingeschränkt, in dem Bewegung findet ganz innerhalb des jeweils erlaubten Bereichs statt. Das Teilchen kann diesem Bereich nicht entkommen, weil es, anschaulich formuliert, nicht genug Energie hat, um den Potenzialberg weiter hinauf zu steigen als bis zum Rand des jeweiligen Intervalls. 143 replacements (d) (a) (b) (c) Abbildung 7.2: Aus dem Potenzialverlauf lassen sich die möglichen Bewegungsformen ableiten. Ist für alle , so läuft das Teilchen über die ganze -Achse (a). Gilt nur für , so läuft das Teilchen zunächst von rechts kommend bis zum Umkehrpunkt und dann wieder zurück (b). Ist die Bedingung nur in einem beschränkten Intervall erfüllt, so pendelt das Teilchen in diesem Bereich. Wir können sogar noch mehr über diese Bewegung aussagen, ohne die Funktion 4 explizit zu kennen. Nehmen wir an, das Teilchen befindet sich gerade an einer Stelle 4 innerhalb des erlaubten Bereiches. Dann können wir seine Geschwindigkeit 4 berechnen, denn laut (7.6) gilt 4 7 " 4 (7.8) " 4 ist die Höhe des schattieren Bereichs in Abbildung 7.2 an der Stelle 4 . Sie Die Differenz bestimmt, welcher Teil der Energie auf die kinetische Energie entfällt, und damit die Geschwindigkeit bis auf ihr Vorzeichen. Wir wissen also, wie schnell das Teilchen ist. Es ist umso schneller, je tiefer das Potenzial an der Stelle ist, an der es sich gerade befindet. Allerdings wir wissen nicht, in welche Richtung es sich gerade bewegt. Aber wir wissen, dass die Geschwindigkeit eine stetige Funktion der Zeit ist. Also kann sie ihr Vorzeichen nur dann ändern, wenn sie den Wert Null durchläuft. Das wiederum ist nur an den Rändern des jeweils zulässigen Bereichs der Fall, an denen 4 * ist, also an der Stelle 4 4 in Abbildung 7.2(b), bzw. an den Stellen 4 4 oder 4 4 in Abbildung 7.2(c). Daraus können wir folgenden Schluss ziehen. Solange das Teilchen nicht den Rand des zulässigen Intervalls erreicht, bewegt es sich in eine Richtung. Seine Geschwindigkeit ist dabei durch die Gleichung (7.8) bestimmt, wobei das Vorzeichen durch die Bewegungsrichtung festgelegt ist. Erreicht es den Rand des zulässigen Bereichs, so wird es dort abgebremst und kehrt seine Bewegungsrichtung um. Anschließend bewegt es sich in die andere Richtung, bis es wieder den Rand des zulässigen Bereichs erreicht, oder für immer, wenn es keinen anderen Rand gibt. Insgesamt ergibt sich daraus der folgende Bewegungsablauf. Wenn die Energie , wie in Abbildung 7.2(a), größer als das absolute Maximum des Potenzial ist, dann läuft das Teilchen einmal von links nach rechts oder von rechts nach links durch, ohne jemals umzukehren. Seine Geschwindigkeit passt sich dabei dem Verlauf des Potenzials an, das heißt das Teilchen wird abwechseln schneller und langsamer, aber es hält nie an. Ist der erlaubte Bereich wie in Abbildung 7.2(b) nach unten beschränkt, so kehrt das Teilchen dort, von rechts kommend, um, und läuft wieder nach rechts weg. Ist der zulässige Bereich wie in Abbildung 7.2(c) ein endliches Intervall, so bleibt dem Teilchen schließlich nichts anderes übrig als 144 (d) (a) (b) (c) Abbildung 7.3: Verschiedene Spezialfälle, die bei der Diskussion der Bewegungsformen in einem Potenzial auftreten können. zwischen den beiden Umkehrpunkten zu pendeln. Je nach dem Wert von und dem Verlauf der Potenzialfunktion 4 unterscheiden wir also verschiedene Bewegungsformen. Das Teilchen kann immer in eine Richtung laufen, einmal umkehren, oder periodisch zwischen zwei Umkehrpunkten pendeln. Für verschiedene Werte von können sich dabei verschiedene Bewegungsformen ergeben. So ist zum Beispiel in Abbildung 7.2(b) auch eine Pendelbewegung möglich, wenn wir die Energie etwas niedriger ansetzen, und in Abbildung 7.2(c) ist auch eine von links einlaufendes und wieder nach links auslaufendes Teilchen möglich, wenn die Energie etwas höher ist. Aus dem Graf der Potenzialfunktion 4 können wir also unmittelbar das qualitative Verhalten des Teilchens ablesen, ohne die Bewegungsgleichung explizit lösen zu müssen. Wir müssen dazu nur seine Energie kennen, da sich abhängig von der Energie im allgemeinen verschiedene Bewegungsformen ergeben. Das Potenzial eines eindimensionalen Systems bestimmt die möglichen Bewegungsformen. Die drei wichtigsten Bewegungsformen sind die in Abbildung 7.2 dargestellten. Es gibt aber noch gewisse Grenz- und Sonderfälle, die in Abbildung 7.3 dargestellt sind und in den folgenden Aufgaben diskutiert werden sollen. Aufgabe 7.3 Es sei ein Potenzial 4 gegeben, das bei 4 4 ein Minimum hat, mit 4 , 4 6 4 # 6 . Dann lässt sich des Potenzial in der Nähe des Minimums durch eine und quadratische Funktion approximieren, 4 4 4 7 " (7.9) Man zeige, dass sich ein Teilchen, das in der Nähe dieser Potenzialmulde pendelt, näherungsweise wie ein harmonischer Oszillator verhält. Man bestimme die Eigenfrequenz dieses Oszillators. Aufgabe 7.4 Das Potential in Abbildung 7.3(a) hat ein lokales Maximum an der Stelle 4 4 . Es sei 4 . Es soll gezeigt werden, dass das Teilchen in diesem Fall keine Pendelbewegung ausführt, und auch nicht über den Punkt 4 hinaus läuft, was ja erlaubt wäre, sondern dass es sich für & der Stelle 4 asymptotisch nähert und dort für immer liegen bleibt. Man stelle dazu das Potenzial 4 näherungsweise durch eine quadratische Funktion dar, für 4 4 " 4 4 7 " 145 mit " 4 6 (7.10) und löse die Bewegungsgleichung (7.8) in der Nähe dieser Stelle für ein Teilchen, das sich von links nähert, 6 . Man zeige, dass die Geschwindigkeit des Teilchens exponentiell gegen Null also für 4 =4 und 4 geht und bestimme die Relaxationszeit, also diejenige Zeit, in der die Geschwindigkeit um den Faktor 0 noch möglich? abfällt. Welche Bewegungsformen sind für einem Grenzwert Aufgabe 7.5 In Abbildung 7.3(b) ist ein Potenzial dargestellt, das sich f ür 4 6 eine Konstante ist und von unten nähert. Für große 4 gelte 4 " 4 , wobei 4 6 der Exponent bestimmt, wie schnell sich das Potenzial dem Grenzwert n ähert. Welcher qualitative , bzw. zu erwarten? Wie sieht im Fall die Bewegungsablauf ist für aus? Funktion 4 für & 4 in zwei getrennten Aufgabe 7.6 In Abbildung 7.3(c) ist der Fall dargestellt, dass die Bedingung Intervallen erfüllt ist. Wie sieht in diesem Fall die Bewegung des Teilchen aus? Welche Bewegungsformen sind in dem dargestellten Potenzial noch möglich? Aufgabe 7.7 Für ein mathematisches Pendel der Länge im Schwerefeld hatten wir die Bewegungsgleichungen (5.45) hergeleitet. Wir betrachten den einfachen Fall, dass das Pendel nur in einer Ebene schwingt, also konst ist. Die Bewegungsgleichung lautet dann ! (7.11) ! 7 betrachtet werden kann. Die Gleichung ist so geschrieben, wobei ! als periodische Koordinate ! dass auf beiden Seite eine Größe der Dimension Kraft steht. Man bestimme das Potenzial ! , skizziere es und beschreibe die möglichen Bewegungsformen, einschließlich der Grenzfälle. Aufgabe 7.8 Das Potential 4 wurde durch das Kraftgesetz 4 nur bis auf eine additive Konstante festgelegt. Warum hängen die möglichen Bewegungsformen eines Teilchens nicht davon ab, wie wir diese Konstante wählen? Mit anderen Worten, warum unterscheiden sich die möglichen Bewegungsformen in 4 ? einem Potenzial 4 nicht von denen in einem Potenzial 4 Integration der Bewegungsgleichung Nachdem wir das qualitative Verhalten der Bewegung aus dem Verlauf der Potenzialfunktion abgelesen haben, können wir versuchen, die Bewegungsgleichung explizit zu lösen. Wir gehen dabei von der Differenzialgleichung (7.8) aus, 4 & 7 4 " (7.12) Da wir hier das Vorzeichen festlegen müssen, betrachten wir immer nur ein Teilstück der Bewegung, bei der das Teilchen sich in eine Richtung bewegt. Im Falle einer Pendelbewegung ist dies das Teilstück zwischen zwei Umkehrpunkten. Aus der allgemeinen Diskussion der möglichen Bewegungsformen wissen wir, wie wir den Bewegungsablauf in solche Teilstücke zerlegen können. Es genügt daher, die Bewegungsgleichung stückweise zu lösen und die Lösungen entsprechend zusammenzusetzen. Der Einfachheit halber betrachten wir hier zunächst eine Bewegung nach rechts, wählen also das positive Vorzeichen. Um die Differenzialgleichung (7.12) zu lösen, benutzen wir die Methode der Separation der Variablen, die wir bereits aus Kapitel 4 kennen. Wir schreiben die Bewegungsgleichung wie folgt um, 7 4 " 146 4 (7.13) und integrieren anschließend beide Seiten über ein Zeitintervall von 7 4 4 " bis , (7.14) Das Integral auf der linken Seite können wir sofort ausrechnen. Auf der rechten Seite führen wir eine Substitution durch, indem wir die Integrationsvariable durch 4 ersetzen, 7 " 4 " 4 (7.15) Hier haben wir 4 4 und 4 4 gesetzt. Das sind die Orte, an denen sich das Teilchen zu Beginn und am Ende des Zeitintervalls befindet, über das wir integriert haben. Das Integral (7.15) liefert die Zeit " , die das Teilchen benötigt, um von 4 nach 4 zu gelangen. Damit es wohldefiniert ist, muss offenbar 4 sein, und zwar im gesamten Integrationsintervall 4 4 4 . An den Rändern des Intervalls können wir 4 zulassen, solange das Integral dann noch konvergiert. Das ist genau die Bedingung, die sich aus der allgemeinen Diskussion der möglichen Bewegungsformen ergibt. Das Teilchen kann genau dann von 4 nach 4 gelangen, wenn beide Orte innerhalb des erlaubten Bereiches liegen, der in den Abbildungen 7.1 und (7.2) dargestellt sind. Im Prinzip haben wir damit die Bewegungsgleichung gelöst, jedenfalls für einen Bahnabschnitt, in dem sich das Teilchen von links nach rechts bewegt. Nehmen wir an, wir geben als Anfangsbedingung 4 4 und 4 ( 6 vor. Dann können wir daraus die Energie berechnen, die wir in (7.15) einsetzen müssen. Sie ist durch den Ausdruck (7.6) gegeben, ausgewertet für . Wenn wir dann noch in (7.15) 4 4 und setzen und für 4 und einfach 4 und schreiben, so ergibt sich eine Beziehung zwischen und 4 , nämlich 7 " & 4 " 4 (7.16) Wenn es uns gelingt, diese Gleichung nach 4 aufzulösen, dann haben wir die entsprechende Lösung 4 der Bewegungsgleichungen gefunden. Sie erfüllt die Anfangsbedingungen 4 & 4 und 4 6 ( . Auf diese Weise können wir für jeden einzelnen Bahnabschnitt jeweils eine Lösung der Bewegungsgleichung finden. Das ist weniger kompliziert, als es zunächst den Anschein hat. Bewegt sich das Teilchen im nächsten Bahnabschnitt von rechts nach links, so müssen wir nur das Vorzeichen der Wurzel umdrehen. Außerdem ist die Energie für jeden Bahnabschnitt dieselbe. Daher müssen wir letztlich nur einmal das Integral (7.15) ausrechnen. Wir müssen nur jeweils die Anfangsbedingungen anpassen, um die Bahnabschnitte anschließend richtig zusammenzusetzen. Wie das geht, werden wir gleich an ein paar einfachen Beispielen demonstrieren. Aufgabe 7.9 Das Potenzial 4 war durch das Kraftgesetz 4 nur bis auf eine additive Konstante festgelegt. Warum ist der durch (7.15) hergestellte Zusammenhang zwischen und 4 unabhängig von dieser Konstante? Zwei einfache Beispiele Wir wollen das Verfahren an zwei sehr einfachen Beispielen erläutern. Zuerst betrachten wir ein freies Teilchen. In diesem Fall lautet die Bewegungsgleichung 4 6 . Es ist also 4 6 und wir können 6 gelten. Der Fall 6 ist uninteressant, denn auch 4 6 setzen. Für die Energie muss dann 6 liegt der Fall aus Abbildung 7.2(a) vor, das dann ruht das Teilchen einfach an irgendeinem Ort. Für 147 heißt das Teilchen bewegt sich für alle Zeiten in eine Richtung. Dies sei der Einfachheit halber wieder die positive Richtung. Aus (7.15) ergibt sich in diesem Fall 7 & " 4 " 4 4 4 " 4 7 " (7.17) 6 seine konstante Geschwindigkeit ist. Die Tatsächlich gilt für ein freies Teilchen ( 7 , wenn ( Beziehung (7.17) lautet also, einfacher ausgedrückt, 4 " 4 ( " . Und das ist natürlich genau das erwartete Ergebnis. Bewegt sich das Teilchen nach links, so müssen wir in (7.17) nur das Vorzeichen 6 ist. umdrehen. Auch dann gilt wieder 4 " 4 ( " , wobei jetzt ( = Das freie Teilchen ist natürlich ein sehr einfaches Beispiel, da es nur ganz einfache Bewegungsformen gibt. Das Teilchen kann entweder für immer nach rechts oder für immer nach links laufen, oder für immer ruhen. Es gibt keine Umkehrpunkte, so dass wir die Bahn nicht stückweise berechnen müssen. Als weniger triviales Beispiel wollen wir die Bewegung in einem konstanten Kraftfeld betrachten, zum Beispiel im Schwerefeld der Erde. Es gilt dann " $ 7 mit (7.18) Eine konstante Kraft ist durch ein linear ansteigendes Potenzial gekennzeichnet. Da es nicht nach unten beschränkt ist, kann die Energie jeden beliebigen Wert annehmen. Jedoch ist der erlaubte Bereich der Ortskoordinate stets nach oben begrenzt. Ein Teilchen mit der Energie erreicht maximal eine Höhe Bewegungsform. Das Teilchen nähert sich von unten, erreicht . Es gibt nur eine mögliche zu einer Zeit eine maximale Höhe , und fällt anschließend wieder herab. 6 und Betrachten wir zuerst den Abschnitt , in dem das Teilchen nach oben steigt. Dann ist es gilt laut (7.15) 7 " " Das Integral, das wir berechnen müssen, ist " 0 7 Der Einfachheit halber setzen wir kehrpunkt. Außerdem schreiben wir für zu " " " 7 " (7.19) (7.20) und somit , das heißt wir integrieren bis zum Umund einfach und . Dann vereinfacht sich das Ergebnis 7 Aufgelöst nach ergibt sich daraus " " " 7 " (7.21) (7.22) also die übliche Darstellung einer gleichmäßig beschleunigten Bewegung. Sie gilt zunächst nur für , da wir nur für diesen Bahnabschnitt die Bewegungsgleichung gelöst haben. Für , also für den Bahnabschnitt nach6 dem Umkehrpunkt, ergibt sich in (7.21) das umgekehrte Vorzeichen der Wurzel. Denn nun ist , das heißt wir müssen beim Auflösen der Definition der Energie nach der Geschwindigkeit das umgekehrte Vorzeichen der Wurzel wählen. Es ergibt sich jedoch 148 dieselbe Funktion (7.22), da wir zum Auflösen der Gleichung nach diese quadrieren müssen. Außerdem müssen wir beim Zusammensetzen der beiden Bahnabschnitte dieselben Parameter und wählen. Diese Parameter übernehmen hier die Rolle der Anfangsbedingungen. Wir erinnern uns, dass wir stets zwei Anfangsbedingung stellen müssen, also zwei Integrationskonstanten festlegen müssen, um eine eindeutige Lösung der Bewegungsgleichung zu bekommen. Eine dieser Integrationskonstanten ist bei dem hier entwickelten Verfahren die Energie . In den gerade diskutierten speziellen Fall entspricht das dem Festlegen der maximalen Steighöhe , die zur Energie in einer einfachen Beziehung steht. Als zweite Integrationskonstante können wir stets eine Zeit wählen, zum Beispiel die Zeit, in der das Teilchen einen bestimmten Umkehrpunkt der Bahn erreicht, oder zu der es einen bestimmten Ort passiert. Das bietet sich deshalb an, weil wir dazu nur eine der beiden Integrationsgrenzen entsprechend festlegen müssen. Oft hängt es aber auch von der jeweilige Fragestellung ab, welche Integrationsgrenzen man am besten wählt und wie die Lösungen an die gestellten Anfangsbedingungen anzupassen sind. Aufgabe 7.10 Eine sehr typische Fragestellung ist die folgende. Es sei ein Potential 4 mit einer Mulde gegeben, in der das Teilchen schwingen kann. Man bestimme die Schwingungsperiode in Abh ängigkeit von der Energie . Man zeige, dass diese durch das Integral ; & 7 4 (7.23) 4 " gegeben ist, wobei für 4 und 4 die Umkehrpunkte einzusetzen sind, die sich aus ergeben. 4 4 Aufgabe 7.11 Vom harmonischen Oszillator wissen wir, dass seine Schwingungsperiode immer gleich, also insbesondere unabhängig von der Energie ist. Es soll gezeigt werden, dass der harmonische Oszil2" 4 , lator das einzige derartige System ist. Wir betrachten dazu ein symmetrisches Potenzial 4 4 6 4 6 4 6 4 6 das nach beiden Seiten hin monoton ansteigt, für und für . Man zeige, dass die in (7.23) definierte Funktion ; genau dann konstant ist, wenn 4 4 ist. Konservative Kraftfelder Mit der gerade entwickelten Methode ist es offenbar möglich, jede Bewegungsgleichung eines mechanischen Systems mit einem Freiheitsgrad zu lösen, sofern die Kraft allein vom Ort abhängt. Wir müssen dazu nur die Bahn in Teilstücke zerlegen, ein bestimmtes Integral berechnen und eine einfache reelle Gleichung lösen. Natürlich wird es im allgemeinen nicht wie in den gerade gezeigten einfachen Beispielen gelingen, die Lösung 4 durch elementare Funktionen auszudrücken. Aber das ist nicht entscheidend. Es spielt letztlich für eine konkrete physikalische Fragestellung keine Rolle, ob die Lösung einer Bewegungsgleichung explizit durch Funktionen wie , 1! , ! etc. ausgedrückt werden kann oder implizit durch ein bestimmtes Integral definiert wird. Letztlich sind ja auch die elementaren Funktionen implizit durch ihre mathematischen Eigenschaften definiert, und es ist eine willkürliche Entscheidung, welchen solchen Funktionen man einen speziellen Namen gibt und welchen nicht. Wir können daher das Problem, die Bewegungen eines eindimensionalen mechanischen Systems zu beschreiben, durch das Integral (7.15) als gelöst betrachten. Es stellt sich nun die Frage, ob eine ähnliche Methode auch auf mehrdimensionale Systeme anwendbar ist. Betrachten wir ein frei bewegliches Teilchen in einem Kraftfeld, das nur vom Ort abhängt, 149 (7.24) Unter gewissen Bedingungen gibt es auch für dieses System eine Erhaltungsgröße , nach der wir die Lösungen klassifizieren können. Um sie zu finden, wiederholen wir den entscheidenden Schritt aus dem ersten Abschnitt. Wir multiplizieren die Bewegungsgleichung mit der Geschwindigkeit. Da es sich nun um eine Vektorgleichung handelt, müssen wir jetzt das Skalarprodukt bilden, +: : (7.25) Definieren wir analog zu einem Teilchen mit nur einem Freiheitsgrad die kinetische Energie als halbe Masse mal Geschwindigkeit zum Quadrat, so ergibt sich 7 : , (7.26) Die Änderung der kinetischen Energie, also die pro Zeit vom Kraftfeld geleistete Arbeit, ist durch das Skalarprodukt von Kraft und Geschwindigkeit gegeben. Man bezeichnet diese Größe auch als die Leistung des Kraftfeldes. Im Falle eines Systems mit einem Freiheitsgrad konnten wir die Leistung durch die Zeitableitung eines Potenzials ausdrücken, und daraus ergab sich die Gesamtenergie als Erhaltungsgröße. Hier ist das nicht mehr ohne weiteres möglich. Wenn das Kraftfeld von einer speziellen Art ist, gibt es aber auch hier ein Potenzial und damit eine erhaltene Energie. Um herauszufinden, wann das der Fall ist, führen wir ein kartesisches Koordinatensystem ein und zerlegen sowohl den Ortsvektor und die Geschwindigkeit, (7.27) als auch das Kraftfeld in Komponenten, & Man beachte, dass jede Kraftkomponente stung lässt sich dann wie folgt schreiben, : (7.28) eine Funktion der dann ist " und somit ergibt sich aus (7.25) : 7 " & " 150 " 6 ist. Die Lei- (7.29) (7.30) Daraus können wir folgenden Schluss ziehen. Wenn sich die Komponenten des Kraftfeldes elle Ableitungen einer skalaren Funktion schreiben lassen, . Ist der Ortsvektor nach der Zeit jeweils eine Funktion von drei Koordinaten Nun betrachten wir eine skalare Funktion Zeit, so gilt für die Ableitung der Funktion als parti- (7.31) (7.32) (7.33) Lässt sich ein Kraftfeld in dieser Art und Weise durch ein Potenzial darstellen, so existiert eine Erhaltungsgröße, die Energie , die sich analog zu (7.6) aus einem kinetischen und einem potenziellen Anteil zusammensetzt, 7 (7.34) Ein Kraftfeld, für das ein solches Potenzial existiert, heißt konservatives Kraftfeld. Die Bezeichnung soll andeuten, dass in einem konservativen Kraftfeld die Energie erhalten, also “konserviert” ist. Wie im eindimensionalen Fall wird während der Bewegung des Teilchens Arbeit verrichtet, also fortwährend kinetische in potentielle Energie verwandelt und umgekehrt. In einem konservativen Kraftfeld ist die Energie eine Erhaltungsgröße Befindet sich das Teilchen an einem Ort und hat es eine Energie , so können wir aus der Differenz zwischen und den Betrag der Geschwindigkeit bestimmen. Allerdings wissen wir dadurch noch nichts über die Richtung, in die sich das Teilchen bewegt, und anders als im eindimensionalen Fall gibt es nicht nur zwei mögliche Bewegungsrichtungen. Daher führt die Energieerhaltung nicht wie im eindimensionalen Fall unmittelbar auf eine Lösung der Bewegungsgleichung. Viele der Schlussfolgerungen, die wir für eindimensionale System hergeleitet haben, lassen sich aber übertragen. So ergibt sich zum Beispiel aus der Tatsache, dass die kinetische Energie immer positiv ist, eine Einschränkung an die Bewegungsfreiheit eines Teilchens. Hat ein Teilchen die Energie , so kann es sich ist. Handelt es sich dabei zum Beispiel um eine beschränkte nur an Orten aufhalten, an denen , Teilmenge des Euklidischen Raumes, so können wir daraus schließen, dass das Teilchen gebunden ist, also nicht ins Unendliche entkommen kann. Oft lassen sich weitere Erhaltungsgrößen finden, etwa der Drehimpuls in einem Zentralkraftfeld, mit deren Hilfe sich die Bewegungengleichungen dann vollständig lösen lassen, so wie im gerade diskutieren eindimensionalen Systemen. Ein wichtiges Beispiel dafür werden wir im Kapitel 8 ausführlich diskutieren. Mit Hilfe der Energie- und Drehimpulserhaltung ist es nämlich möglich, die Bewegungsgleichung für ein Teilchen im Gravitationsfeld eines anderen Teilchens vollständig zu lösen. Wir können also alle möglichen Planetenbahnen im Kraftfeld der Sonne angeben. Zuvor werden wir jedoch noch ein paar grundsätzliche Eigenschaften von Kraftfeldern diskutieren. Aufgabe 7.12 Man zeige, dass für das lineare Kraftgesetz bestimme es. , ? " ein Potenzial , existiert und Aufgabe 7.13 Auch das Newtonsche Gravitationsgesetz ist konservativ. Wir betrachten das Kraftfeld, das von einem ortsfesten Teilchen der Masse erzeugt wird, und in dem sich ein Teilchen der Masse bewegt. Es gilt dann " (7.35) Man zeige, dass dieses Kraftgesetz aus dem Potenzial 0 " (7.36) abgeleitet werden kann. Gradient, Divergenz und Rotation Wir wollen der Frage nachgehen, wann ein gegebenes Kraftfeld konservativ ist und wann nicht. Mit anderen Worten, welche Eigenschaften muss ein Kraftfeld haben, damit es sich in der Form (7.31) als “Ableitung” eines Potenzials darstellen lässt? 151 Bevor wir uns konkret dieser sehr speziellen Frage zuwenden, führen wir ein paar allgemeine Begriffe ein, die mit Ableitungen von Feldern im Raum zu tun haben. Unter einem Feld verstehen wir eine Ab bildung, deren Definitionsbereich der Euklidische Raum ist. Ein skalares Feld ist eine Abbildung des Raumes in die reellen Zahlen, skalares Feld (7.37) Ein Vektorfeld ist entsprechend eine Abbildung des Euklidischen Raumes in den zugeordneten Vektor raum . Es ordnet jedem Punkt einen Vektor zu, den wir bezüglich einer beliebigen Orthonormalbasis , in seine Komponenten zerlegen können, Vektorfeld % (7.38) Benutzen wir dieselbe Orthonormalbasis verwenden, um auch den Ortsvektor in seine Komponenten zu zerlegen, so können wir jedes Feld als Funktion der drei Koordinaten darstellen, , & 2 (7.39) Dabei handelt es sich um gewöhnliche reelle Funktionen von jeweils drei Variablen. Wenn diese Funktionen differenzierbar sind, können wir ihre partiellen Ableitungen bilden. Wir schreiben dafür (7.40) das heißt das Symbol bezeichnet die partielle Ableitung einer Funktion nach der Koordinate . Betrachten wir nun speziell ein skalares Feld und seine partiellen Ableitungen . Diese lassen sich zu einem Vektorfeld zusammenfassen, das wir mit & Gradient , (7.41) bezeichnen. Dieses Vektorfeld heißt Gradient von und wird oft auch mit bezeichnet. Der Gradient ist in gewissem Sinne die räumliche Verallgemeinerung der gewöhnlichen Ableitung einer Funktion von einer reellen Variablen. Da es im Raum drei Koordinaten gibt, hängt eine reelle Funktion auf dem Raum von drei Variablen ab. Folglich hat sie drei partielle Ableitungen, das heißt ihre Ableitung hat drei Komponenten, die man zu einem Vektor zusammenfassen kann. Das Symbol , mit dem man diese Ableitung bezeichnet, heißt Nabla. Das Wort leitet sich von der hebräischen Bezeichnung für ein antikes Saiteninstrument ab, das in etwa die Form dieses Zeichens hatte. Manchmal wird fälschlicherweise behauptet, es handele sich um einen althebräischen Buchstaben. Das Zeichen als solches wurde aber erst in der modernen Mathematik “erfunden”. Es soll ein auf den Kopf gestelltes Delta darstellen. Es ist nützlich, sich das Symbol als einen Differenzialoperator vorzustellen. Wenn er auf eine skalare Funktion “wirkt”, erzeugt er den Gradienten dieser Funktion. Wir schreiben dafür auch formal Nabla (7.42) wobei wir uns vorstellen, dass die Ableitungen jeweils auf eine rechts von dem Operator stehende Funktion wirken, so wie in (7.41). Der Vektorpfeil über dem Symbol deutet an, dass sich dieser Differenzialoperator ansonsten wie ein Vektor verhält. In (7.41) wird dieser Vektor mit dem Skalar multipliziert, so dass das Ergebnis wieder 152 ein Vektor ist. Der Operator kann aber auch auf Vektorfelder wirken. Zum Beispiel können wir das Skalarprodukt von mit einem Vektorfeld bilden, : Divergenz & : , (7.43) Das Ergebnis ist ein skalares Feld, das durch Summation aus den partiellen Ableitungen (7.40) der Komponenten des Vektorfeldes gebildet wird. Es wird auch Divergenz des Vektorfeldes genannt und mit , bezeichnet. Wenn wir statt des Skalarproduktes das Kreuzprodukt des Operators mit einem Vektorfeld bilden, so ist das Ergebnis wieder ein Vektorfeld, Rotation & , & , (7.44) Dieses Vektorfeld wird auch als Rotation von bezeichnet, und man verwendet dafür die Schreibweise ! . Wir können also mit Hilfe des Operators auf drei verschiedene Arten räumliche Ableitungen von Skalar- bzw. Vektorfeldern bilden. Diese entsprechen formal den drei Möglichkeiten, Skalare bzw. Vektoren zu multiplizieren. Der Gradient entspricht der skalaren Multiplikation und bildet ein skalares Feld auf ein Vektorfeld ab. Die Divergenz entspricht dem Skalarprodukt und bildet ein Vektorfeld auf ein skalares Feld ab. Die Rotation ergibt sich aus dem Kreuzprodukt und bildet ein Vektorfeld wieder auf ein Vektorfeld ab. Aufgabe 7.14 Man bestimme den Gradienten den folgenden skalaren Felder, & 5: & Die Vektoren sind Konstanten, die Funktion che Bedingung muss im letzten Beispiel erfüllen, damit (7.45) ist stetig und differenzierbar. Welche zus ätzli an der Stelle ! wohldefiniert ist? Aufgabe 7.15 Man bestimme die Divergenz und die Rotation der folgenden Vektorfelder, , % <: (7.46) Die Vektoren sind Konstanten, die Funktion . ist stetig und differenzierbar. Welche zus ätz: an der Stelle ! wohldefiniert liche Bedingung muss im letzten Beispiel erfüllen, damit ist? Aufgabe 7.16 Es sei ein beliebiges skalares Feld. Dann ist ein Vektorfeld und folglich ! ebenfalls ein Vektorfeld. Man zeige, dass dieses Vektorfeld gleich Null ist. Aufgabe 7.17 Gibt es ein nicht verschwindendes Vektorfeld mit ! Konstante ist? , wobei eine vorgegebene Aufgabe 7.18 Für den Ableitungsoperator gelten verschiedene Produktregeln. Man drücke die folgenden Ableitungen jeweils durch die Ableitungen, also den Gradienten, die Rotation bzw. die Divergenz der einzelnen Felder aus, : : : 153 . . (7.47) Aufgabe 7.19 Wie führen einen weiteren Differentialoperator ein, der sowohl auf skalare als auch auf Vektorfelder wirken kann. Es ist ein skalarer Operator . Er bildet die zweiten Ableitungen nach den Koordinaten und summiert über diese, (7.48) und für ein Vektorfeld die folgenden Identitäten gelten, Man zeige, dass für ein skalares Feld : " ! ! (7.49) Richtungsableitung und Wegintegral Es stellt sich nun die Frage, ob es für diese Ableitungen von Feldern auch jeweils eine anschauliche geo metrische Interpretation gibt, etwa so wie die Ableitung 4 einer gewöhnlichen reellen Funktion 4 als Steigung interpretiert werden kann. Außerdem können wir uns fragen, ob sich die Ableitungsoperationen umkehren lassen. Mit anderen Worten, gibt es so etwas wie eine Stammfunktion eines Vektorfeldes bzw. eines skalaren Feldes? Tatsächlich ist der Gradient so etwas wie die Steigung eines skalaren Feldes. Jedoch hängt die Steigung eines Feldes davon an, in welche Richtung man sich im Raum bewegt. Es sei irgendein Ort und ein Vektor, der eine Richtung definiert. Das kann, muss aber kein Einheitsvektor sein. Dann können wir folgende Frage stellen. Wie stark steigt ein skalares Feld an, wenn wir uns an der Stelle in Richtung des Vektors bewegen? Die Antwort auf diese Frage gibt die Richtungsableitung des Feldes an der Stelle in Richtung des Vektors . Sie ist wie folgt definiert, ? ? " (7.50) Wie man leicht mit Hilfe der Kettenregel zeigt, kann man die Richtungsableitung durch den Gradienten von an der Stelle ausdrücken, : (7.51) Die Richtungsableitung eines skalaren Feldes in Richtung eines Vektors wird durch den Differenzialoperator : gebildet. Wenn ein Einheitsvektor ist, so ist die Richtungsableitung die orthogonale Projektion von , auf . Diese Projektion ist dann maximal, wenn in die gleiche Richtung zeigt wie , . Daraus ergibt sich die folgende geometrisch anschauliche Interpretation des Gradienten. Der Vektor zeigt in diejenige Richtung, in die das Feld an der Stelle am stärksten ansteigt. Der Betrag dieses Vektors gibt an, wie stark dieser Anstieg ist. Aufgabe 7.20 Die Niveauflächen eines skalaren Feldes sind die Flächen mit ; konst. Im allge, stets meinen liegt jeder Punkt auf genau einer solchen Niveaufläche. Man zeige, dass der Vektor senkrecht auf der durch verlaufenden Niveaufläche steht. die Steigung des skalaren Feldes ist, lässt sich dann das Feld , aus bis auf Wenn eine Konstante rekonstruieren, so wie man eine reelle Funktion 4 aus ihrer Ableitung 4 rekonstruieren kann? Mit anderen Worten, kann man ein Vektorfeld irgendwie integrieren, um wieder ein skalares Feld zu erhalten? In Abbildung 7.4(a) ist die Definition einer speziellen Art von Integration im Raum dargestellt. Wir wollen zeigen, dass diese Integration im wesentlichen die Umkehrung des Gradienten ist. Sie wird wie 154 replacements (c) (d) (b) (a) Abbildung 7.4: Um das Wegintegral eines Vektorfeldes zu berechnen, zerlegt man den Weg und infinitesimale Teilstücke, dargestellt durch Vektoren . Dann bildet man jeweils das Skalarprodukt dieser Vektoren mit dem Vektorfeld und summiert über alle Teilstücke (a). Integriert man den Gradienten eines skalaren Feldes entlang eines Weges, so erhält man die Differenz der Werte des Feldes am Anfangsund Endpunkt (b). folgt ausgeführt. Gegeben sei eine Kurve im Raum, die wir mit bezeichnen. Sie verbindet zwei Punkte . Ferner sei ein und , und sie wird durch eine Ortsvektordarstellung beschrieben, mit Vektorfeld gegeben. Wir definieren dann das Wegintegral des Feldes entlang der Kurve wie folgt. Zuerst zerlegen wir zerschneiden. Die die Kurve in Teilstücke, indem wir sie an den Stellen , , , , Ortsvektoren dieser Schnittstellen bezeichnen wir mit . Jedem Teilstück ordnen wir außerdem einen Vektor zu, " 6 33 " 0 (7.52) Anschließend bilden wir für jedes Teilstück das Skalarprodukt dieses Vektors mit dem Wert des Feldes am Anfang des Teilstückes. Das Ergebnis : (7.53) ist die in Abbildung 7.4(a) dargestellte orthogonale Projektion von auf das Kurvenstück , multipliziert mit dessen Länge. Schließlich summieren wir über die einzelnen Kurvenstücke und bilden den Grenzwert, in dem die Anzahl der Kurvenelemente gegen Unendlich und deren Länge gegen Null geht. Das Ergebnis nennen wir das Wegintegral des Vektorfeldes entlang der Kurve und schreiben dafür Wegintegral & : : (7.54) Diese Definition des Wegintegrals ist ganz analog zur üblichen Definition eines Integrals auf der reellen Achse zu verstehen. Um eine Funktion 4 über ein Intervall von bis zu integrieren, zerlegen wir das zerschneiden, und Intervall in Teilintervalle, indem wir es an der Stellen 4 , 4 , , 4 , 4 bilden den Grenzwert der Summe 4 4 4 4 155 mit 4 4 4 " (7.55) Wie man sich leicht überlegt, ist das Wegintegral unabhängig davon, wie man die Kurve in kleine Stücke zerlegt, sofern die Kurve und das Vektorfeld hinreichend glatt ist, genau wie das gewöhnliche reelle Integral unabhängig von der Art der Zerlegung ist. Insbesondere hängt das Wegintegral nicht davon ab, wie die Kurve als Funktion des Parameters dargestellt wird. Um das formal zu beweisen, ist es nützlich, eine etwas einfacher zu handhabende Darstellung des Wegintegrals anzugeben als die Summendarstellung. Man kann das Wegintegral auf ein gewöhnliches reelles Integral zurückführen. Für kleine Kurvenstücke gilt " " (7.56) und folglich & : & : : (7.57) Wir können das Wegintegral berechnen, indem wir den Tangentenvektor der Kurve mit dem Vektorfeld multiplizieren, und anschließend ein gewöhnliches reelles Integral ausführen. Aufgabe 7.21 Man beweise durch eine einfache Substitution, dass das so definierte Wegintegral un abhängig davon ist, wie man den Weg parametrisiert. Das Wegintegral h ängt also nur vom Weg und vom Vektorfeld ab, nicht jedoch von der speziellen Wahl der Funktion . Es ist jetzt nur noch ein kleiner Schritt, zu beweisen, dass das Bilden des Wegintegrals so etwas ist wie die , gegeben und ein beliebiger Weg , Umkehrung des Gradienten. Dazu sei ein Vektorfeld , der die Punkte und miteinander verbindet, so wie in Abbildung 7.4(b) dargestellt. Für das Wegintegral gilt dann & : : (7.58) Nun ist der Integrand aber nichts anderes als die Richtungsableitung des Feldes tenvektors, also entlang der Kurve, : & in Richtung des Tangen- (7.59) und folglich können wir das Integral (7.58) ausführen, : & " (7.60) oder mit den Bezeichnungen wie in Abbildung 7.4(b), Wegintegralsatz : " (7.61) Dies ist gewissermaßen die erste Version des Hauptsatzes der Integral- und Differenzialrechnung, angewandt auf Felder im Raum. Das Wegintegral eines Gradienten entlang eines Weges ist die Differenz der Funktionswerte des skalaren Feldes an den Enden des Weges. 156 Zwei andere Versionen davon werden wir gleich noch kennen lernen. Wir haben zwar damit die Frage, wann ein gegebenes Kraftfeld konservativ ist und wann nicht, noch nicht beantwortet. Aber wir sind schon einen kleinen Schritt weiter, denn wir wissen jetzt, wie wir konkret das Potential berechnen können, sobald wir wissen, dass ein Kraftfeld konservativ ist. Wir müssen dazu nur ein geeignetes Wegintegral ausführen, also das Kraftfeld entlang eines bestimmten Weges integrieren. Aufgabe 7.22 Es seien die folgenden Vektorfelder gegeben, 3 & 7 & " (7.62) Gesucht ist jeweils ein skalares Feld , mit und ! # 6 . Man bestimme durch Berechnung eines Wegintegrals entlang einer geraden Strecke von ! nach und zeige anschließend, dass gilt. für das so definierte Feld tatsächlich , & Aufgabe 7.23 Es soll gezeigt werden, dass das Vektorfeld , &= (7.63) wobei ein nicht verschwindender Vektor ist, nicht der Gradient eines skalaren Feldes ist. Man f ühre die gegenteilige Annahme zu einem Widerspruch. Man bestimme dazu wie in Aufgabe 7.22 ein Feld , und zeige anschließend, dass dieses Feld nicht die Eigenschaft & hat. Aufgabe 7.24 Wege lassen sich zusammensetzen und umkehren. Verbindet ein Weg die Punkte und , und ein Weg die Punkte und , so ist derjenige Weg, der von zuerst entlang nach und anschließend entlang nach führt. Der inverse Weg ist der in die umgekehrte Richtung durchlaufene Weg . Man beweise : & : : : & " : (7.64) Aufgabe 7.25 Ein geschlossener Weg ist ein Weg, dessen Anfangspunkt mit dem Endpunkt identisch ist. Man beweise, dass ein Vektorfeld genau dann der Gradient eines skalaren Feldes ist, wenn jedes Wegintegral des Vektorfeldes entlang jedes geschlossenen Weges gleich Null ist. Flächen- und Volumenintegrale Wegintegrale lassen sich zu Flächen- und Volumenintegralen verallgemeinern. Wie können ein Vektorfeld auch über eine Fläche integrieren, oder ein skalares Feld über ein Volumen. Anschließend werden wir zeigen, dass es sich dabei in einer gewissen Art und Weise um die Umkehrungen von Rotation und Divergenz handelt, wobei der Zusammenhang allerdings nicht mehr ganz so einfach ist wie der zwischen Wegintegral und Gradient. darstellen können. Ihre Betrachten wir zunächst eine Fläche, die wir als eine Abbildung Ortsvektordarstellung bezeichen wir wie üblich mit , )( , wobei und ( die Flächenkoordinaten sind. Durch die Wahl dieser Koordinaten wird auch eine Orientierung der Fläche festgelegt. Die Oberseite der Fläche ist diejenige Seite, zu der der Normalenvektor zeigt. Wir definieren ihn durch , )( & ( Aufgabe 7.26 Warum steht dieser Vektor auf der Fläche senkrecht? 157 (7.65) (c) (d) (b) (a) Abbildung 7.5: Zur Definition des Flächenintegrals eines Vektorfeldes zerlegt man die Fläche in einzelne Flächenelemente (a). Entsprechend kann man ein skalares Feld über ein Volumen integrieren, indem man dies in Volumenelemente zerlegt (b). Genau wie eine Kurve können wir eine Fläche in kleine Stücke zerlegen. In Abbildung 7.5(a) ist ein solches Flächenelement dargestellt. Die Ecken dieses Flächenelementes befindet sich an den Stellen , )( , )( , ( ( und )( ( . Sind die Abmessungen und ( hinreichend klein, so hat es die Form eines Parallelogramms, welches von den Vektoren und ( ( (7.66) aufgespannt wird. Wir können dem Flächenelement einen Vektor zuordnen, dessen Betrag den Flächeninhalt repräsentiert, und der in Richtung des Normalenvektors zeigt, ( ( ( , ) ( (7.67) Der Einfachheit halber stellen wir uns hier von Anfang an infinitesimal kleine Flächenelemente vor, über die wie später summieren, also integrieren werden. Die Fläche sei also in unendlich viele solche Flächenelemente zerlegt. Nun sei zusätzlich ein Vektorfeld gegeben. Werten wir das Vektorfeld auf den Fläche aus, so können wir es als Funktion )( 1 , )( darstellen. Ist das Vektorfeld hinreichend glatt, so können wir es innerhalb eines infinitesimalen Flächenelementes als konstant betrachten. Wie in Abbildung 7.5(a) zu sehen ist, spannt der Vektor , )( zusammen mit dem Flächenelement einen Spat auf. Das Volumen dieses Spates ist : )( & ( ( : ) ( (7.68) Dieses Volumen ist positiv, wenn der Vektor )( nach oben, also in Richtung des Normalenvektors der Fläche zeigt. Es ist negativ, wenn der Vektor )( nach unten zeigt. Das Flächenintegral des Vektorfeldes ist durch die Summation über alle diese infinitesimalen Spate definiert. Wir schreiben dafür Flächenintegral : ( 158 ( : , )( (7.69) Die Integrationsgrenzen für und ( sind dabei so zu wählen, dass die Fläche, über die zu integrieren ist, genau einmal abgedeckt wird. Man kann sich leicht überlegen, dass dieses Flächenintegral unabhängig davon ist, wie man die Fläche in Flächenelemente zerlegt. Insbesondere ist es dann auch unabhängig davon, wie man die Fläche durch eine Ortsvektordarstellung , )( parametrisiert. Eine formalen Beweis werden wir hier nicht durchführen. Er folgt aber wie beim Wegintegral durch eine einfache Substitution. Anschaulich ergibt sich die Unabhängigkeit des Flächenintegrals von der Parametrisierung der Fläche wie folgt aus der Darstellung in Abbildung 7.5(a). Wir stellen uns dazu vor, dass das Vektorfeld den Fluss irgendeines Mediums durch die Fläche hindurch beschreibt. Innerhalb eines kurzen Zeitintervalls wird dabei das dargestellte Flächenelement um ein Stück verschoben. Das in diesem Zeitintervall durch das Flächenelement hindurchgeströmte Volumen des Mediums ist gerade das Volumen so erzeugten Spates. Summieren wir über alle Flächenelemente, so ergibt sich das Volumen des insgesamt in einem kleinen Zeitintervall durch die Fläche hindurchgeströmten Mediums. Das ist natürlich unabhängig davon, wie wir die Fläche in kleine Flächenelemente zerlegen. Um sich eine anschauliche Vorstellung von einem Flächenintegral zu machen, sollte man sich daher das Vektorfeld am besten als das Strömungsfeld eines Mediums vorstellen. Wir werden darauf später noch näher eingehen, denn solche Strömungsfelder spielen zum Beispiel in der Elektrodynamik eine wichtige Rolle. Aufgabe 7.27 Als Fläche sei ein Kreis mit Radius durch kartesische Koordinaten + ) ( & .( in der 4 - -Ebene gegeben. Er kann wahlweise -( oder durch Polarkoordinaten & 3! - . 6 (7.70) " (7.71) dargestellt werden. Als Vektorfeld sei ? gegeben. Man berechne das Flächenintegral von über den Kreis mit beiden Parameterdarstellungen und zeige, dass das Ergebnis dasselbe ist. Schließlich wollen wir noch ein Volumenintegral definieren. Ein Volumen ist im Prinzip einfach eine Teilmenge des euklidischen Raumes mit bestimmten Eigenschaften. Wir können ein Volumen aber auch analog zu einer Kurve oder einem Weg durch eine Parameterdarstellung beschreiben, also durch eine , oder durch die entsprechende Ortsvektordarstellung , )(' , die einen Ort im Abbildung Volumen durch drei Koordinaten , )(' spezifiziert. Um ein Integral über ein solches Volumen zu definieren, zerlegen wir es wieder in unendlich viele infinitesimale Volumenelemente. In Abbildung 7.5(b) ist ein typisches solches Volumenelement dargestellt. Seine acht Ecken befinden sich in den Punkten mit den Koordinaten , )(' , )(' , , )( (' . Für hinreichend kleine , ( und hat es die Form eines Spates, aufgespannt von den Vektoren ( ( (7.72) Folglich ist der Inhalt dieses Volumenelementes ( : ( (7.73) Im Gegensatz zum Flächenelement ist dies kein Vektor, sondern eine skalare Größe. Um ein Integral über ein Volumen auszuführen, müssen wir daher als Integrand auch ein skalares Feld einsetzen. Wir definieren analog zu (7.69) Volumenintegral ( 159 : ( ($ (7.74) Auch hier sind wieder die Integrationsgrenzen für , ( und entsprechend anzupassen. Anschaulich ist ein Volumenintegral nichts anderes als das, was wir uns unter einer gewöhnlichen In tegration im Euklidischen Raum vorstellen. Wählen wir nämlich als Integrationsvariable kartesische 4 Koordinaten, setzen also , so ist das Spatprodukt in (7.73) gleich Eins, und es gilt 4 , )(' (7.75) Die allgemeinere Darstellung (7.74) hat jedoch den Vorteil, dass wir auch andere Darstellungen eines Volumens verwenden können, um ein solches Integral zu berechnen. Ein Beispiel dafür liefert die folgende Aufgabe. Aufgabe 7.28 Es soll das Volumen einer Kugel mit Radius berechnet werden. Wir setzen dazu & 0 und berechnen das Volumenintegral über eine Kugel mit Mittelpunkt im Ursprung. Als Parameterdarstellung wählen wir einmal die Darstellung durch kartesische Koordinaten 4 $ & 4 4 (7.76) und einmal die Darstellung in Kugelkoordinaten, ! & 3! - ! . 1! ! 6 ! " ! 6 (7.77) Man zeige, dass das Volumenintegral (7.74) in beiden Darstellungen dasselbe Ergebnis, n ämlich liefert. Der Satz von Stokes Was haben nun Flächen- und Volumenintegrale mit Rotation und Divergenz von Vektorfeldern zu tun? Tatsächlich gibt es hier ganz ähnliche Beziehungen wie zwischen Wegintegralen und dem Gradienten eines skalaren Feldes. Als erstes zeigen wir, dass es einen Zusammenhang zwischen Rotation und Flächenintegralen gibt. Dieser Zusammenhang ist in Abbildung 7.6 anschaulich dargestellt. Er wird uns auch etwas über die geometrische Interpretation der Rotation verraten. Wir betrachten ein Vektorfeld und dessen Rotation . Ferner sei eine Fläche, von der wir der Einfachheit halber annehmen, dass sie, wie in Abbildung 7.6 gezeigt, nur einen Rand hat, also von einer geschlossenen Linie begrenzt wird. Wir schreiben dafür auch , das heißt die Kurve ist der Rand der Fläche . Da eine Fläche stets eine Orientierung hat, erhält auch die Randkurve eine Orientierung. Wir verwenden dafür wieder die Rechte-Hand-Regel. Die Richtung der Randkurve zeigt gegen der Uhrzeigersinn, wenn wir von oben auf die Fläche schauen. Das entspricht der Definition des Drehsinns einer Ebene in Abbildung 2.1. Der Satz von Stokes macht nun folgende Aussage über das Flächenintegral einer Rotation, Satz von Stokes : 1 & & : Oder in Worten ausgedrückt: Das Flächenintegral der Rotation ! eines Vektorfeldes über eine Fläche tegral des Vektorfeldes entlang des Randes . 160 (7.78) ist das Wegin- replacements (c) (d) (b) (a) Abbildung 7.6: Der Satz von Stokes besagt, dass das Flächenintegral (a) über die Rotation eines Vektorfeldes als Linienintegral (b) des Vektorfeldes selbst über den Rand der Fläche dargestellt werden kann. Das Flächenintegral der Rotation eines Vektorfeldes lässt sich also auf ein Wegintegral des Vektorfeldes selbst zurückführen. Das ist insofern analog zum Wegintegralsatz (7.61), da dieser eine ganz ähnliche Aussage macht. Das Wegintegral des Gradienten eines skalaren Feldes lässt sich als “Integral” über den Rand des Weges schreiben. Allerdings ist dieses “Integral” dort einfach nur eine Summe, da der Rand eines Weges nur aus zwei Punkten besteht. Um den Satz von Stokes zu beweisen, stellen wir die Fläche in einer speziellen Art und Weise dar. Wir verwenden eine verallgemeinerte Version der Polarkoordinaten in einer Ebene, das heißt wir wählen irgendeinen Punkt in der Fläche aus und bezeichnen ihn als Ursprung. An diesem Punkt soll 6 sein, das heißt 6 soll nicht von abhängen. Außerdem soll die Koordinaten eine Periode von 7 haben, und für 0 soll sich die Randkurve 0 & ergeben. Für das Flächenintegral gilt dann : 1 & : 1 (7.79) Um das doppelte Kreuzprodukt auszurechnen, können wir die Formel (2.36) verwenden, oder wir benutzen das -Symbol. Der Integrand lässt sich dann wie folgt umformen, : 1 " 1 1 " % 1 2 " 1 " 21 & 161 (7.80) Dabei haben wir in den beiden letzten Schritten die Ketten- ud Produktregel so verwendet, dass wir den gesamten Ausdruck als Ableitung einer Funktion nach bzw. schreiben konnten. Wenn wir diese beiden Ausdrücke in das doppelte Integral (7.79) einsetzen, können wir jeweils eines der Integrale ausführen, und bekommen so insgesamt vier Randterme, : 1 & 1 " %1 (7.81) Nun fallen aber drei dieser vier Terme weg. Da die Funktion in periodisch ist, ergibt sich im hinteren Term an der Stelle " stets derselbe Wert wie an der Stelle . Also ist dieser Anteil gleich Null. Beim ersten Ausdruck ergibt sich für 6 stets Null, denn 6 hängt ja nicht von ab, gleich Null. Es bleibt also nur ein Term das heißt an der Stelle 6 ist die partielle Ableitung übrig, und das ist gerade das Wegintegral von entlang des Randes der Fläche, : 1 : 1 : (7.82) mit 0 . Damit haben wir den Satz von Stokes bewiesen, jedenfalls für eine Fläche, die sich auf diese spezielle Art parametrisieren lässt. Aufgabe 7.29 Man finde Beispiele für Flächen, die sich nicht auf die gezeigte Art und Weise parametrisieren lassen und formuliere eine entsprechende Verallgemeinerung des Satzes von Stokes. Mit Hilfe des Satzes von Stokes lässt sich nun unsere ursprüngliche Frage beantworten. Wann ist ein gegebenes Kraftfeld konservativ? In Aufgabe 7.25 wurde bereits gezeigt, dass dies genau dann der Fall ist, wenn das Wegintegral des Kraftfeldes entlang jedes geschlossenen Weges gleich Null ist. Im Euklidischen Raum ist andererseits jeder geschlossener Weg der Rand irgendeiner Fläche. Also ist das Wegintegral von entlang jedes geschlossenen Weges genau dann gleich Null, wenn das Flächenintegral von über jede Fläche gleich Null ist. Und das wiederum ist genau dann der Fall, wenn identisch verschwindet. Also gilt die folgende einfache Aussage: Ein Kraftfeld ist genau dann konservativ, wenn seine Rotation verschwindet. In Abbildung 7.7 ist noch einmal schematisch dargestellt, wie man für ein konservatives Kraftfeld das Potential bestimmen kann. Die Abbildung 7.7(a) zeigt ein konservatives Kraftfeld . Um das Potenzial zu bestimmen, wählt man willkürlich einen festen Punkt sowie der Wert / aus, und setzt dann & " & : (7.83) Wobei irgendein Weg von nach ist. Wegen der verschwindenden Rotation von ist dieses Integral unabhängig von der Wahl des Weges , das heißt das Ergebnis hängt nur von ab. Das Kraftfeld in Abbildung 7.7(b) ist nicht konservativ. Es hat eine nicht verschwindende Rotation, was man daran erkennen kann, dass es eine Art Wirbel bildet. Daher ist das Wegintegral (7.83) vom gewählten Weg abhängig, und deshalb lässt sich auf diese Weise kein Potenzial finden. Aufgabe 7.30 Man betrachte das Kraftfeld 162 (7.84) replacements (c) (d) (b) (a) Abbildung 7.7: Für ein Kraftfeld mit verschwindender Rotation (a) hängt das Wegintegral nur vom Anfangs- und Endpunkt des Weges ab, Daher lässt sich für ein solches Kraftfeld ein Potenzial auch Integration bestimmen. Ist die Rotation dagegen nicht Null (b), so hängt das Wegintegral auch vom Weg selbst ab. In diesem Fall lässt sich durch Integration kein Potenzial definieren. Eine naive Rechnung ergibt, dass die Rotation von verschwindet. Man berechne jedoch das Wegintegral entlang eines Kreises, der parallel zur 4 - -Ebene liegt und seinen Mittelpunkt irgendwo auf der -Achse hat. Man benutze das Ergebnis, um zu zeigen, dass die Rotation gar nicht überall verschwindet, sondern durch (7.85) 7 gegeben ist, wobei wie üblich ist. Die Rotation ist also überall Null, nur nicht auf der -Achse, wo sie Unendlich groß ist. Der Satz von Gauß Der Vollständigkeit halber wollen wir nun noch kurz die dritte Version des Fundamentalsatzes darstellen. Es ist der Satz von Gauß, der eine Beziehung zwischen der Divergenz eines Vektorfeldes und Volumenintegralen herstellt. Wir betrachten dazu irgendein Volumen , das von einer Fläche begrenzt wird, zum Beispiel die in Abbildung 7.8 dargestellte, etwas deformierte Kugel. Wir schreiben wieder für den Rand des Volumens. Die Fläche , die den Rand des Volumens definiert, ist so orientiert, dass ihr Normalenvektor nach außen, also aus dem Volumen heraus zeigt. Der Satz von Gauß stellt dann eine Beziehung her zwischen dem Volumenintegral der Divergenz eines Vektorfeldes und dem Flächenintegral über das Vektorfeld selbst, Satz von Stokes : : Oder in Worten ausgedrückt: 163 : 1 (7.86) replacements (c) (d) (b) (a) Abbildung 7.8: Der Satz von Gauß besagt, dass das Volumenintegral (a) der Divergenz eines Vektorfeldes, hier dargestellt als eine mehr oder weniger dichte Verteilung von Punkten im Raum, durch das Flächenintegral (b) des Vektorfeldes über den Rand des Volumens gegeben ist. Das Volumenintegral der Divergenz eines Vektorfeldes über ein Volumen Flächenintegral des Vektorfeldes über den Rand . ist das Auch hier ist es wieder nützlich, sich vorzustellen, dass das Vektorfeld den Fluss irgendeines Mediums durch den Raum beschreibt. Das Flächenintegral auf der rechten Seite gibt dann an, wieviel dieses Mediums durch die Fläche fließt, also aus dem Volumen heraus. Wenn das dasselbe ist wie das Volumenintegral über die Divergenz, dann beschreibt die Divergenz offenbar so etwas wie die Erzeugung des Mediums, welches dann entlang des Vektorfeldes fließt. Denn wenn aus dem Volumen mehr heraus als herein fließt, dann muss innerhalb des Volumens etwas entstehen. Ist die Divergenz eines Vektorfeldes an einem Ort positiv, so sagen wir auch, dass sich dort eine Quelle befindet. Es strömt mehr von dieser Quelle weg als zu ihr hin. Dort, wo die Divergenz negativ ist, liegt eine Senke vor. Divergenz und Rotation eines Vektorfeldes beschrieben also das, was wir uns anschaulich am besten anhand eines Strömungsfeldes vorstellen können. Ein Strömungsfeld hat im allgemeinen Quellen, Senken, und Wirbel. Bei der Diskussion von elektrischen und magnetischen Feldern wird sich diese anschauliche Vorstellung als sehr nützlich erweisen. Der Beweis des Satzes von Gauß kann ganz analog zum Satz von Stokes geführt werden. Wir werden dies hier nicht explizit tun, sondern als Übungsaufgabe stellen. Aufgabe 7.31 Zum Beweis des Satzes von Gauß ist folgende Formel n ützlich. Es sei irgendeine Vektor mit Komponenten . Man zeige " - " ? 6 (7.87) Aufgabe 7.32 Man beweise den Satz von Gauß für ein Volumen, das wie in Abbildung 7.8 die Form einer deformierten Kugel hat. Man kann dabei genau so vorgehen, wie im Falle des Satzes von Stokes. Man wählt einen Punkt innerhalb des Volumens aus und verwendet verallgemeinerte Kugelkoordinaten, das heißt man wählt eine Parameterdarstellung ! des Volumens so, dass 6 ! der ausgezeichnete Punkt ist, und ! 0 ! eine Parameterdarstellung der Randfläche. Eine Rechnung analog zu (7.79–7.82) führt dann zum gewünschten Ergebnis. 164 Aufgabe 7.33 Wie muss der Satz von Gauß verallgemeinert werden, damit er auch f ür Volumen gilt, die nicht die Form einer deformierten Kugel haben? Aufgabe 7.34 Man betrachte das Kraftfeld (7.88) Eine naive Rechnung ergibt, dass die Divergenz von verschwindet. Man berechne jedoch das Flächenintegral über eine Kugeloberfläche mit Mittelpunkt im Ursprung. Man benutze das Ergebnis, um zu zeigen, dass die Divergenz gar nicht überall verschwindet, sondern durch : , & 7 gegeben ist, wobei wie üblich im Ursprung, wo sie Unendlich groß ist. (7.89) ist. Die Divergenz ist also überall Null, nur nicht 8 Das Kepler-System In diesem Kapitel wollen wir die wohl bekannteste Anwendung der klassischen Mechanik vorstellen, nämlich die Berechnung der Planetenbahnen im Sonnensystem. Sie hatte eine sehr wichtige historische Bedeutung für die Newtonsche Mechanik. Die Bahnen der Planeten waren schon lange bekannt und wurden von Astronomen wie Brahe, Kepler und Galilei sehr genau vermessen. Es lagen also eine ganze Reihe von Messdaten vor, und die Tatsache, dass diese Daten durch die Newtonsche Theorie erklärt werden konnten, konnte als eine eindruckvolle Bestätigung derselben angesehen werden. Teilweise haben wir das Problem schon in Abbildung 4 diskutiert. Im einfachsten Fall umkreisen zwei Körper einander, die über die Gravitationskraft wechselwirken. Ist ein Körper sehr viel schwerer und damit auch träger als der andere, so können wir diesen als ortsfest betrachten. Der andere bewegt sich dann in einem Zentralkraftfeld. Dieses Problem werden wir zuerst diskutieren, und uns dann speziell der Gravitationskraft und damit den Bewegungen der Planeten im Sonnensystem zuwenden. Zentralkräfte und das effektive Potential Wir betrachten zuerst ein ganz allgemeines, kugelsymmetrisches Zentralkraftproblem. Kugelsymmetrisch heißt, dass die Kraft nicht nur radial nach innen oder außen zeigt, sondern dass der Betrag der Kraft auch nur vom Abstand vom Zentrum anhängt. Für ein Teilchen der Masse mit Ortsvektor gilt dann die Bewegungsgleichung (8.1) Hier bezeichnet wieder den in radiale Richtung zeigenden Einheitsvektor, also & . Ein solches Zentralkraftfeld ist immer konservativ. Man kann dies zeigen, indem man die Rotation von berechnet, oder indem man ein Potenzial angibt. Da der Betrag der Kraft nur vom Abstand vom Ursprung abhängt, machen wir den Ansatz, dass auch das Potenzial nur davon abhängt. Es gilt dann & # (8.2) gerade Hier haben wir das Resultat von Aufgabe 7.14 verwendet, wonach der Gradient der Funktion der in Richtung des Ortsvektors zeigende Einheitsvektor ist. 165 Für ein kugelsymmetrisches Zentralkraftfeld gilt also dasselbe wie für ein mechanisches System mit nur einem Freiheitsgrad. Es gibt immer ein Potenzial, und es ist im wesentlichen durch die Stammfunktion des Kraftgesetzes gegeben, (8.3) , " " Wir werden nun die Bewegungsgleichungen für dieses Teilchen durch geschicktes Ausnutzen von Erhaltungsgrößen und die Wahl eines speziellen Koordinatensystems so umformen, dass sie formal wie die Bewegungsgleichungen für ein System mit nur einem Freiheitsgrad aussehen. Die entscheidenden Erhaltungsgrößen kennen wir schon. Es sind der Drehimpuls und die Energie, 7 (8.4) Aus der Erhaltung des Drehimpulses folgt, dass die Bewegung des Teilchens in einer Ebene stattfindet. Wir wählen das Koordinatensystem so, dass dies die 4 - -Ebene ist. Dann ist natürlich , und als Erhal tungsgrößen bleiben noch zwei skalare Größen, nämlich und . Ohne Beschränkung der Allgemeinheit können wir außerdem 6 annehmen. Um die Bahn des Teilchens zu beschreiben, benutzen wir Kugelkoordinaten. Da die Bewegung auf die 4 - -Ebene beschränkt ist, können wir ! 7 setzen. Die Darstellung (5.21) des Ortsvektors lautet dann einfach 1! - (8.5) Die Koordinaten , die die Äquatorebene der Kugelkoordinaten parametrisieren, werden auch als Polarkoordinaten bezeichnet. Führen wir analog zu (5.29) die Einheitsvektoren 1! . . ' " 1! (8.6) so bilden diese für jedes zusammen mit eine Orthonormalbasis. Außerdem gilt für die Ableitungen nach , analog zu (5.33), ' und ' " . Daraus ergeben sich die folgenden Ausdrücke für den Ortsvektor, die Geschwindigkeit und die Beschleunigung, * ' 7 ' " (8.7) Setzen wir das in die Bewegungsgleichung ein, so finden wir durch Vergleich der Koeffizienten von und ' " " 7 & 6 (8.8) Dies sind zwei gekoppelte Differenzialgleichungen zweiter Ordnung für die Funktionen und . Wir können sie entkoppeln und anschließend lösen, indem wir die Erhaltungsgrößen verwenden. Aus der zweiten Gleichung folgt unmittelbar 7 Tatsächlich ist das die -Komponente des Drehimpulses, - ' 6 (8.9) (8.10) 6 ist. Das Teilchen soll sich also nicht im Kraftzentrum aufWir setzen im folgenden voraus, dass halten. Dann können wir die Winkelgeschwindigkeit durch den Drehimpuls ausdrücken, und dies in 166 die erste Bewegungsgleichung (8.8) einsetzen. Als Ergebnis bekommen wir eine Bewegungsgleichung erster Ordnung für , und eine Bewegungsgleichung zweiter Ordnung für , die nicht mehr von abhängt, " " (8.11) Damit haben wir die Bewegungsgleichungen entkoppelt. Wir können jetzt so vorgehen, dass wir zuerst die Bewegungsgleichung für lösen, und das Ergebnis anschließend in die Bewegungsgleichung für einsetzen und diese lösen. Die Bewegungsgleichung für sieht aus wie die für ein System mit einem Freiheitsgrad. Wir können sie noch ein wenig umschreiben, um die Ähnlichkeit deutlich zu machen, " " 7 & mit (8.12) Die Funktion wird effektives Potenzial genannt. Sie ist der Schlüssel zur allgemeinen Lösung des kugelsymmetrischen Zentralkraftproblems. In einem kugelsymmetrischen Potenzial verhält sich die radiale Komponente des Ortsvektors wie die Ortskoordinate eines fiktiven Teilchens mit einem Freiheitsgrad im effektiven Potenzial . Wie wir die radiale Bewegungsgleichung am besten lösen, hängt von der Art des effektiven Potentials ab. Zum Beispiel können wir Methode aus Kapitel 7 verwenden, indem wir die Erhaltung der Energie ausnutzen. Tatsächlich ist die Energie des fiktiven Teilchens, das sich im effektiven Potenzial bewegt, identisch mit der Energie des realen Teilchens im dreidimensionalen Raum. Es gilt nämlich 7 & 7 & 7 (8.13) Die Strategie zur Lösung des Zentralkraftproblems können wir nun wie folgt zusammenfassen. Falls be stimmte Anfangsbedingungen vorgegeben sind, bestimmen wir zuerst die Erhaltungsgrößen und , wo ist. Den entsprechenden Wert von setzen wir in bei wir das Koordinatensystem so wählen, dass (8.12) ein und lösen anschließend die Bewegungsgleichung für . Anschließend setzen wir die gefundene Lösung in die Bewegungsgleichung (8.11) für ein und bestimmen daraus die Funktion . Sind keine speziellen Anfangsbedingungen vorgegeben, so können wir die allgemeine Lösung der Be wegungsgleichungen finden, indem wir das Verfahren auf alle möglichen Werte von und anwenden. Da das effektive Potenzial explizit von abhängt, müssen wir eventuell verschiedene Fälle unterscheiden. Aber im Prinzip ist es immer möglich, die allgemeinste Lösung auf diesem Weg zu finden. Ob man sie in geschlossener Form durch elementare Funktionen darstellen kann, hängt natürlich vom jeweiligen Potenzial ab. Die Drehimpulsbarriere Um zu verstehen, welche anschauliche Bedeutung das effektive Potenzial hat, betrachten wir einen ganz einfachen Spezialfall. Für ein freies Teilchen setzen wir 6 . Natürlich ist dies eine etwas umständliche Methode, die Bewegungsgleichung für ein freies Teilchen zu lösen, deren allgemeine Lösung wir schon kennen. Aber wir werden auf diese Weise etwas besser verstehen, was es mit dem effektiven Potential auf sich hat. Aus (8.12) ergibt sich 7 167 (8.14) Wir unterscheiden die Fälle 6 und gilt die Bewegungsgleichung + dieser Bewegungsgleichungen ist 6 . Für 6 ist 6 , das heißt für die Radialkomponente 6 , und aus (8.11) ergibt sich + 6 . Die allgemeine Lösung & .( (8.15) mit beliebigen Konstanten )( . Setzt man das in (8.5) ein, so findet man offenbar eine Gerade durch den Ursprung, die mit konstanter Geschwindigkeit ( durchlaufen wird. Ein freies Teilchen ohne Drehimpuls bewegt sich wie erwartet geradlinig und gleichförmig. Für ( 6 ruht es am Ort mit den Koordinaten und 6 . Der Fall ist natürlich der interessantere. Das effektive Potenzial (8.14) ist in diesem Fall positiv, geht für 6 gegen Unendlich und fällt für gegen Null ab. Es ist ein abstoßendes Potenzial, das heißt die Kraft wirkt immer vom Ursprung weg, und der unendliche Anstieg verhindert, dass ein Teilchen den Ursprung erreichen kann, egal wie hoch seine Energie ist. Man bezeichnet dieses effektive Potenzial auch als Drehimpulsbarriere. Sie verhindert, dass ein Teilchen mit Drehimpuls den Ursprung erreichen kann. Es gibt in diesem Potenzial nur eine mögliche Bewegungsform. Die Energie ist immer positiv, da das Potenzial überall positiv ist. Das Teilchen kommt aus dem Unendlichen, das heißt für " geht 6 , und dann entfernt , es erreicht zu irgendeiner Zeit einen Umkehrpunkt bei es sich wieder, so dass für + wieder gilt. Da am Umkehrpunkt das Potenzial gleich der Energie ist, besteht zwischen der Energie , dem Drehimpuls und dem minimalen Abstand , den das Teilchen zum Ursprung erreicht, der Zusammenhang 7 (8.16) Statt können wir daher auch als Parameter verwenden, um die Lösungen zu klassifizieren. Außerdem ( 7 , und statt der Erhaltungsgrößen und ist es nützlich, ( zu setzen. Dann ist können wir die Parameter und ( verwenden, die ebenfalls beide positiv sind. Um die Lösungen der radialen Bewegungsgleichung zu finden, verwenden wir die Methode aus Kapitel 7. Ist gilt " 0 (8.17) 0 " " Als untere Integrationsgrenze haben wir hier den Umkehrpunkt zur Zeit gewählt. Das obere Vorzeichen gilt für , da dann die Geschwindigkeit positiv ist, das untere Vorzeichen entsprechend für . Die Integration lässt sich leicht ausführen, " 7 ( 0 " ( ( 0 " (8.18) Auflösen nach ergibt nun, unabhängig vom Vorzeichen, & -( " Tatsächlich hat diese Funktion das erwartete Verhalten. Für erreicht sie ihr Minimum bei & . 168 (8.19) gilt , und für Jetzt müssen wir nur noch die Bewegungsgleichung (8.11) für lösen. Auch das ist eine einfache Integration, .( ( " Die allgemeine Lösung wird also durch insgesamt vier Parameter ( , ,( " und (8.20) festgelegt. Aufgabe 8.1 Man setze das Ergebnis (8.19) und (8.20) in die Ortsvektordarstellung (8.5) ein und verwende die Eigenschaften der Winkelfunktionen, um zu zeigen, dass es sich bei der L ösung um eine geradlinige, gleichförmige Bewegung handelt, die wie folgt geschrieben werden kann, 1! " Aufgabe 8.2 Man diskutiere den Grenzfall 3! ( " ( (8.21) 6 in (8.19) und (8.20). Aufgabe 8.3 Man löse mit derselben Methode die Bewegungsgleichung für ein Teilchen der Masse 7 . einem Potenzial in Das Gravitationspotenzial Nun wollen wir uns dem eigentlichen Thema dieses Kapitels zuwenden. Wir wollen die Bahnen von Planeten im Sonnensystem berechnen. Wir nehmen dazu an, dass die Masse der Sonne sehr viel größer ist als die Masse des Planeten, so dass wir die Sonne als im Koordinatenursprung ruhend annehmen und die Wechselwirkung der Planeten untereinander vernachlässigen können. Es sei also die Masse der Sonne und die eines Planeten. Der Planet bewegt sich dann in einem Zentralkraftfeld " " (8.22) und wobei wir wieder gesetzt haben. Das zugehörige Potenzial ist & " " (8.23) Das Gravitationspotenzial ist negativ und steigt mit zunehmenden monoton an, da die Kraft stets anziehend ist. Für fällt sein Betrag mit 0 gegen Null ab. Um die daraus resultierenden Bewegungsgleichungen zu lösen, gehen wir genau so vor wie eben für das freie Teilchen. Wegen der Drehimpulserhaltung findet die Bewegung in der 4 - -Ebene statt, wenn wir gilt das Koordinatensystem entsprechend anpassen. Für die Erhaltungsgrößen und 7 & " mit 7 (8.24) Aus der allgemeinen Diskussion der Gravitationskraft wissen wir bereits, dass die Masse des Planeten für die Bewegung eigentlich keine Rolle spielt. Wir können sie eliminieren, indem wir eine spezifische Energie , einen spezifischen Drehimpuls und ein spezifisches effektives Potenzial einführen. Dann lassen sich die Definitionen (8.24) der Erhaltungsgrößen und des effektiven Potenzials wie folgt umschreiben, 7 0 mit 169 & " 7 (8.25) replacements (a) (c) (b) (d) Abbildung 8.1: Das effektive Potenzial für einen Körper im Gravitationsfeld der Sonne. Es sind vier verschiedene Bewegungsformen möglich. Die Fälle (a) und (b) entsprechen den Planetenbahnen. Der Körper führt eine periodische Umlaufbewegung aus. Die Fälle (c) und (d) entsprechen den Bahnen von Kometen, die nur aus dem Unendlichen kommend nur einmal am Stern vorbeiziehen und dann wieder verschwinden. Es verbleibt also nur noch die Masse der Sonne als Parameter in den Bewegungsgleichungen, und natürlich die Gravitationskonstante . Um die Bewegungsgleichung für die Radialkomponente zu lösen, müssen wir uns nun das effektive 6 . Die Bewegungsgleichungen Potenzial etwas genauer ansehen. Wir betrachten hier nur den Fall für verschwindenden Drehimpuls hatten wir bereits in Kapitel 4 gelöst, für den Fall von zwei Körpern, die senkrecht aufeinander zu fallen. Wir werden am Schluss noch einmal auf diesen Fall zurück kommen, den wir hier auch als Grenzfall 6 darstellen können. 6 ist in Abbildung 8.1 dargestellt. Es hat stets den gleichen quaDas effektive Potenzial für litativen Verlauf. Für kleine dominiert der Anteil, der mit 0 ansteigt, also die Drehimpulsbarriere. Sie verhindert, dass das fiktive Teilchen, welches die Radialbewegung des Himmelskörpers beschreibt, den Ursprung erreicht. Für große dominiert dagegen der Anteil, der für mit " 0 abfällt, also das Gravitationspotenzial. Für große ist das effektive Potenzial negativ und steigt monoton an, und für geht 6 . Aufgabe 8.4 Man zeige, dass die Funktion bei mit 0 " 7 (8.26) ein absolutes Minimum hat. Wie in Abbildung 8.1 dargestellt, können wir vier mögliche Bewegungsformen des fiktiven Teilchens unterschieden, das sich in diesem effektiven Potenzial bewegt. Für , dargestellt in Abbildung 8.1(a), ruht das fiktive Teilchen im Minimum bei . Das bedeutet allerdings nicht, dass sich der Himmelskörper wirklich in Ruhe befindet. Das effektive Potenzial bestimmt ja nur die radiale Bewegung des Planeten. Die Radialkoordinate ist zeitlich konstant. Aus (8.25) folgt aber, dass die Winkelkoordinate nicht konstant ist. Drücken wir den Drehimpuls gemäß 170 (8.26) durch aus, so ergibt sich daraus (8.27) Also ist zeitlich konstant, und wir bekommen als Lösung der Bewegungsgleichungen mit (8.28) Diese spezielle Klasse von Lösungen kennen wir bereits. Es sind die Kreisbahnen, für die das dritte Keplersche Gesetz gilt, wonach sich die dritten Potenzen der Radien der Kreisbahnen wie die Quadrate der Umlaufzeiten 7 verhalten. 6 ist in Abbildung 8.1(b) dargestellt. Das fiktive Teilchen pendelt jetzt in einer Der Fall Potentialmulde, das heißt es bewegt sich periodisch zwischen einem minimalen Abstand und einem maximalen Abstand hin und her. Dieser Fall liegt im allgemeinen vor, wenn ein Planet um einen Stern kreist. Der Planet läuft nicht exakt auf einer Kreisbahn, so dass sein Abstand vom Kraftzentrum zwischen einem minimalen Wert und einem maximalen Wert pendelt. Die Umkehrpunkte und sind durch die Bedingung bestimmt. An diesen Stellen ist das effektive Potenzial gleich der Gesamtenergie. Es gilt also & " 7 7 (8.29) Die Umkehrpunkte sind die Lösungen einer quadratischen Gleichung, in der und als Parameter auftreten. Statt diese Gleichung nach aufzulösen, gehen wir lieber den umgekehrten Weg und ersetzen die Erhaltungsgrößen und durch die Parameter und . Bekanntlich besteht zwischen den Koeffizienten einer quadratischen Gleichung und den Lösungen ein einfacher Zusammenhang, der in diesem Fall wie folgt lautet, oder " " 7 " 7 (8.30) (8.31) Wir können also die beiden die Umkehrpunkte und beliebig vorgeben, natürlich mit der Einschränkung 6 , und daraus die Größen und bestimmen. Die Planetenbahnen lassen sich folglich durch die Angabe des minimalen Abstands und des maximalen Abstands von der Sonne vollständig klassifizieren. Aufgabe 8.5 Man zeige, dass sich im Grenzfall wieder (8.26) ergibt, das heißt wir können die Kreisbewegung also Spezialfall der Pendelbewegung betrachten, wobei die beiden Umkehrpunkte zusammenfallen. Es gibt aber noch andere mögliche Bewegungsformen eines Himmelskörpers im Gravitationsfeld eines 6 ergeben sich die in Abbildung 8.1(c) und (d) dargestellten Bewegungen. anderen. Für 6 bzw. Das fiktive Teilchen nähert sich hier aus dem Unendlichen, kehrt an einer Stelle mit minimalem Anstand um, und verschwindet wieder im Unendlichen. Wir bezeichnen diese Bahnen als Kometenbahnen und werden sie später separat diskutieren. Aufgabe 8.6 Man zeige, dass sich der Fall 6 für 6 " . 6 aus (8.31) als Grenzfall 171 ergibt, und der Fall Planetenbahnen Nun wollen wir versuchen, die Bahn eines Planeten explizit zu beschreiben. Als Parameter geben wir dazu den minimalen Abstand und den maximalen Abstand vor. Die Bewegungsgleichung für die radiale Komponente können wir dann wie folgt aufschreiben. Wir lösen die Definition (8.25) der Energie nach auf und setzen für und die Ausdrücke (8.31) ein. Das ergibt 7 " 7 " & 7 0 0 " " 7 7 Tatsächlich ist, wie es sein muss, an den Umkehrpunkten ist die rechte Seite dieser Gleichung positiv. 0 " " 0 (8.32) 6 , und für die Geschwindigkeit Die entsprechende Gleichung für die Winkelkoordinate, die sich aus der Definition des Drehimpulses ergibt, lässt sich auf eine ähnliche Form bringen 7 (8.33) 6 annehmen, ist auch 6 , das heißt der Planet läuft im positiven Sinn um die Sonne herum. Da wir Im Prinzip können wir diese Gleichungen mit der üblichen Methode lösen. Es stellt sich allerdings heraus, dass sich die Lösungen nicht explizit durch elementare Funktionen darstellen lassen. Folglich können wir mit ihnen nur wenig anfangen. Wir wollen uns daher überlegen, was wir überhaupt über die Planetenbahnen wissen wollen, und ob wir dies vielleicht auf einem anderen Weg herausbekommen können. Die Angabe der Bahn durch die Koordinatenfunktionen und enthält im Prinzip zwei Arten von Informationen, die sich unabhängig voneinander durch Beobachtung verifizieren lassen. Zum einen enthalten sie Informationen über die Form der Bahn im Raum, also den Weg, den der Planet zurücklegt. Andererseits können wir auch etwas über den zeitlichen Verlauf der Bewegung daraus ablesen, also insbesondere über die Umlaufzeit des Planeten. Wir wollen versuchen, diese beiden Informationen unabhängig voneinander zu gewinnen. Es zeigt sich, dass dies explizit möglich ist. Wir wollen also zunächst versuchen, den Weg zu beschreiben, den der Planet auf seiner Bahn um die Sonne zurücklegt. Es genügt dazu, eine Funktion anzugeben, die uns sagt, wie weit der Planet von der Sonne entfernt ist, wenn er sich in der Richtung befindet. Da monoton mit der Zeit zunimmt, existiert eine solche Funktion immer. Hinterher können wir dann immer noch versuchen, die Funktion zu ermitteln, um eine Aussage über den zeitlichen Ablauf zu erhalten. Welche Differenzialgleichung müssen wir lösen, um die Funktion zu bestimmen? Es gilt (8.34) Nun kennen wir aus (8.32), und aus (8.33). Also gilt 0 " " 0 " " (8.35) Auf den ersten Blick sieht diese Differenzialgleichung auch nicht einfacher aus als (8.32). Aber es stellt sich heraus, dass wir sie explizit lösen können. Wir führen dazu eine Substitution durch, nämlich " 172 (8.36) Eingesetzt in (8.35) erhalten wir " " "7 " " & 7 (8.37) Die Lösung dieser Gleichung können wir beinahe raten. Sie lautet & 7 " 7 3! " (8.38) wobei eine frei wählbare Integrationskonstante ist. Dass dies eine Lösung ist, sehen wir sehr einfach wie folgt. Wenn wir ableiten, fällt der erste Term weg und aus dem Kosinus wird ein Sinus. Wenn wir den konstanten Term dagegen abziehen, wie im letzten Term in (8.37) verlangt, erhalten wir dasselbe Ergebnis, aber diesmal mit dem Kosinus. Addieren wir die Quadrate der beiden Terme, ergibt sich wegen 1! 0 gerade das Quadrat des Vorfaktors, also der erste Term auf der rechten Seite in (8.37). Aufgabe 8.7 Wenn man diese Lösung nicht errät, kann man sie sich durch Separation der Variablen aus (8.37) beschaffen. Man führe diese Rechnung aus, mit der aus Kapitel 7 bekannten Methode. Die Integrationskonstante können wir ohne Beschränkung der Allgemeinheit gleich Null setzen. Eine Konstante, die wir zu addieren, bewirkt nur die Drehung der gesamten Bahn oder äquivalent eine Drehung des Koordinatensystems. Machen wir schließlich noch die Substitution (8.36) rückgängig, so bekommen wir die folgende Darstellung für den Weg des Planeten, 7 (8.39) " 3! Tatsächlich pendelt diese Funktion zwischen und . Sie hat aber noch eine bemerkenswerte Eigen 7 & schaft. Offenbar ist die Funktion nicht nur periodisch in , sondern sie hat sogar die Periode . Das bedeutet, dass es sich um eine geschlossene Bahn handelt. Nach einer Umdrehung um das Kraftzentrum ist der Planet wieder genau da, wo er zuvor auch war. Das ist keineswegs selbstverständlich, sondern eine sehr spezielle Eigenschaft der Gravitationskraft. Wir werden das später sehen, wenn wir kleine Störungen dieser Wechselwirkung betrachten. In Abbildung 8.2(a) ist eine typische Planetenbahn dargestellt. Der minimale Abstand vom Kraftzentrum wird bei 7 erreicht, mit , also in Richtung der positiven 4 -Achse. Dieser Punkt mit dem Ortsvektor wird als Perihel bezeichnet, was soviel bedeutet wie “sonnennächster Punkt”. Der maximale Abstand wird bei 7 /=0 erreicht, also auf der negativen 4 -Achse. Der Punkt mit dem Ortsvektor " wird entsprechend als Aphel bezeichnet, was soviel bedeutet wie “sonnenfernster Punkt”. Die Keplerschen Gesetze Wir wollen nun zeigen, dass es sich bei der in Abbildung 8.2(a) dargestellten Kurve um eine Ellipse handelt, wobei einer der beiden Brennpunkte im Kraftzentrum liegt. Das ist die Aussage des ersten Keplerschen Gesetzes: Die Planetenbahnen sind Ellipsen, von denen jeweils ein Brennpunkt im Zentrum der Sonne liegt. Um das zu beweisen, erinnern wir und kurz an die geometrische Definition einer Ellipse. Es ist die Menge 7& von zwei Brennaller Punkte mit der Eigenschaft, dass die Summe der Abstände punkten und konstant ist. Die Größe wird als große Halbachse der Ellipse bezeichnet. Fallen die beiden Brennpunkte zusammen, so ist der Radius eines Kreises. 173 (b) (a) Abbildung 8.2: Die Planetenbahnen sind Ellipsen (a), die Kometenbahnen Hyperbeln (b). Es liegt jeweils ein Brennpunkt im Zentrum der Sonne. Mit Hilfe der in Abbildung 8.2(a) eingeführten Bezeichnungen können wir eine solche Ellipse wie folgt beschreiben. Der eine Brennpunkt sei der Koordinatenursprung, der andere Brennpunkt liege auf der negativen 4 -Achse, am Punkt mit dem Ortsvektor " 7 . Die große Halbachse ist dann der halbe Abstand der beiden Schnittpunkt der Ellipse mit der 4 -Achse. Diese Schnittpunkte liegen bei ". (8.40) Nun sei irgendein Punkt auf der Ellipse, mit den Polarkoordinaten und . Dann ist natürlich der Ortsvektor dieses Punktes und somit der Abstand des Punktes vom Brennpunkt . Den Abstand vom anderen Brennpunkt berechnen wir mit Hilfe des Kosinussatzes im Dreieck . Der Winkel ist " , also gilt (8.41) " 3! " & 3! Der Punkt liegt genau dann auf der Ellipse, wenn 7& " 7& " ist, oder (8.42) Ziehen wir die letzten beiden Gleichungen voneinander ab, so ergibt sich folgende Beziehung zwischen und , " " 1! (8.43) 3! Das ist das gleiche wie (8.39), wie man unmittelbar nach Einsetzen von (8.40) sehen kann. Damit haben wir gezeigt, dass die Bahnkurve des Planeten tatsächlich eine Ellipse ist. Ihre geometrischen Daten, die große Halbachse , den Abstand der Brennpunkte vom Mittelpunkt , und die kleine Halbachse lassen sich als Funktionen der Bahnparameter und angeben. Es gilt 7 174 " 7 (8.44) Aufgabe 8.8 Man beweise die angegebene Formel für die kleine Halbachse , die in Abbildung 8.2(a) als maximaler Abstand der Ellipse von der 4 -Achse definiert ist. Das zweite Keplersche Gesetz macht eine Aussage darüber, wie die Bahn zeitlich durchlaufen wird. Es handelt sich dabei allerdings nur im eine Umformulierung des Drehimpulserhaltungssatzes: Der Ortsvektor des Planeten überstreicht in gleichen Zeiten gleiche Flächen. Dass der Betrag des Drehimpulses angibt, welche Fläche der Ortsvektor eines Teilchens pro Zeit überstreicht, hatten wir bereits in Abbildung 3.7 gezeigt. Das zweite Keplersche Gesetz ist also letztlich nur eine geometrisch anschauliche Formulierung der zweiten Bewegungsgleichung in (8.25). Es gilt unabhängig vom Gravitationsgesetz für jedes Teilchen in einem Zentralkraftfeld. Interessanter ist das dritte Keplersche Gesetz, das wir bereits für einen Spezialfall formuliert hatten. Es sagt etwas über die Umlaufzeit der Planeten aus: Die Quadrate der Umlaufzeiten der Planeten verhalten sich zueinander wie die dritten Potenzen der großen Halbachsen der Bahnen. Um diesen Zusammenhang von den Kreisbahnen auf allgemeine Ellipsenbahnen zu verallgemeinern, müssen wir also nur den Radius der Kreisbahn durch die große Halbachse der Ellipsen ersetzen. Es gibt zwei Möglichkeiten, diese Aussage zu beweisen. Während eines Umlaufs des Planeten macht das fiktive Teilchen, dessen Ortskoordinaten die radiale Koordinate ist, gerade eine Schwingung in der Potenzialmulde in Abbildung 8.1(b). Für die Periode einer solchen Schwingung gilt die Formel (7.23), also 7 " (8.45) Wenn wir hier und durch und ausdrücken, können wir das Integral lösen und so die Periode berechnen. Es gibt aber eine einfachere und sehr viel anschaulichere, geometrische Methode, um die Umlaufzeit eines Planeten zu berechnen. Wie wir wissen, gilt für die vom Ortsvektor in der Zeit überstrichene Fläche 7 7 . Denn der Betrag des Drehimpulses bzw. des spezifischen Drehimpulses , oder ist konstant, so dass die überstriche Fläche proportional zur Zeit ist. Nach einem vollen Umlauf des Planeten um die Sonne hat der Ortsvektor gerade einmal die Ellipse in Abbildung 8.2(a) überstrichen. Die Fläche einer Ellipse mit den Halbachsen und ist . Also gilt 7 7 Nun müssen wir nur noch und durch die Parameter Halbachse ausdrücken. Laut (8.31) und (8.44) ist 7 und (8.46) und anschließend durch die große 7 (8.47) Damit haben wir das dritte Keplersche Gesetz bewiesen. Für eine Kreisbahn ergibt sich daraus wieder der bekannte Zusammenhang (4.12). Aufgabe 8.9 Man bestätige das dritte Keplersche Gesetz durch Ausrechnen das Integrals (8.45). 175 Aufgabe 8.10 Man diskutiere den Grenzfall 6 . Man halte dazu fest und bilde demn Grenzwert 6 . Wie sieht in diesem Fall die Bahn aus? Welche Umlaufzeit ergibt sich? Welche Beziehung besteht zwischen diesem Ergebnis und der in Kapitel 4 berechneten Fallzeit zweier K örper, die senkrecht aufeinander zu stürzen? Dort hatten wir gesehen, dass es sinnlos ist, die Bahnen nach dem Zusammenstoß fortzusetzen. Das gilt natürlich nur, wenn sie genau aufeinander stürzen. Was passiert, wenn wir ihnen einen ganz kleinen Drehimpuls geben, so dass sie sich gerade so verfehlen? Kometenbahnen Nun wollen wir noch kurz die Bahnen von Himmelskörpern beschreiben, die sich aus dem unendlichen Nähern, das Sonnensystem nur einmal besuchen, und dann wieder verschwinden. Wir nennen diese Lösungen der Bewegungsgleichung Kometenbahnen. 6 in Abbildung 8.1(d). Wie wir bereits in Aufgabe 8.6 gezeigt Wie betrachten zuerst den Fall haben, ergeben sich die Kometenbahnen aus den Planetenbahnen, indem wir einfach das Vorzeichen von ändern. Der Betrag von muss allerdings stets größer bleiben als der von . Dann ist die Energie in (8.31) positiv, und der Drehimpuls weiterhin wohldefiniert. Die Berechnung des Weges , den der Komet zurückliegt, ist völlig identisch mit den Rechnung (8.32–8.39) für die Planetenbahnen. Das heißt, wie bekommen auch hier die folgende Darstellung des Weges in Polarkoordinaten, & 7 " 3! (8.48) Allerdings ist diese Funktion nicht mehr für alle wohldefiniert. Damit positiv ist, muss der Nenner negativ sein, also 1! (8.49) " 1! " Da negativ und sein Betrag größer als ist, hat der Bruch auf der rechten Seite einen Wert zwischen 6 und " 0 , so dass sich für eine Einschränkung auf ein symmetrisches Intervall ergibt, " mit 3! " (8.50) An den Rändern dieses Intervalls, also für geht . Es handelt sich dabei um diejenigen Richtungen, aus denen der Komet kommt bzw. in die er wieder verschwindet. In Abbildung 8.2(b) ist eine typische solche Bahn dargestellt. Es handelt sich bei dieser Bahn um eine Hyperbel. Der eine Brennpunkt der Hyperbel liegt im Kraftzentrum , der zweite an einem Punkt mit dem Ortsvektor 7 " auf der positiven 4 -Achse. Die Geraden, denen sich die Hyperbel asymptotisch nähert, schneiden sich im Mittelpunkt der beiden Brennpunkte auf der 4 -Achse. Der Winkel, unter dem sie sich schneiden, wird wie in Abbildung 8.2(b) gezeigt durch den Winkel ! bestimmt. Aufgabe 8.11 Man zeige, dass es sich bei dieser Bahn tatsächlich um eine Hyperbel handelt. Für die Punkte auf einer Hyperbel gilt " 7& , wenn und die beiden Brennpunkte sind. Die Kometenbahnen werden auf Streubahnen genannt. Man stellt sich dazu vor, dass irgenwo in großer Entfernung zum Streuzentrum, also zur Sonne, jemand einen Körper abwirft. Weit draußen bewegt sich dieser Körper nahezu geradlinig und gleichförmig auf der Geraden, der sich die Hyperbel asymptotisch nähert. Kommt der Körper in die Nähe der Sonne, so wird er gestreut, das heißt er weicht von seiner geraden Bahn ab. Wenn er sich dann wieder entfernt, bewegt er sich wieder nahezu geradlinig. 176 Jedoch ist seine Bahn jetzt gegenüber der ursprünglichen Bahn um einen Winkel gedreht, der als Streuwinkel bezeichnet wird. Wie man leicht in Abbildung 8.2(b) ablesen kann, ist dieser Streuwinkel gerade 7 " (8.51) Für die Physik des Sonnensystems und die Gravitationstheorie sind diese Bahnen nicht von großer Bedeutung. Sie beschreiben zwar die Bewegungen von Kometen, die nur einmal in ihrem Leben das Sonnensystem besuchen, aber solche Ereignisse sind sehr selten. Allerdings spielen ähnliche Bahnen in der Mikrophysik eine große Rolle. Dort geht es oft darum, ein Kraftfeld, zum Beispiel das eine Atomkerns, zu vermessen, indem man Teilchen an diesem Kraftzentrum streut und deren Verhalten untersucht, also under anderem den Streuwinkel misst. Wir werden uns deshalb an andere Stelle etwas ausfühlicher mit den Streubahnen beschäftigen. Aufgabe 8.12 Man drücke den Streuwinkel durch die Energie und den Drehimpuls des gestreuten K örpers aus. Was gescheiht im Grenzfall 6 ? Wie groß ist dann der Streuwinkel, und wie sieht die Bahn aus? Die Periheldrehung Wenn man die Bahnen der Planeten im Sonnensystem sehr genau vermisst, stellt man fest, dass es sich nicht wirklich um geschlossene Ellipsen handelt. Es gibt dafür mehrere Ursachen. So haben wir bei unseren Rechnungen bisher die Wechselwirkungen der Planeten untereinander völlig vernachlässigt. Diese sind zwei klein, führen aber nach genügend vielen Umläufen der Planeten durchaus zu messbaren Abweichungen. Da die Bahnen der Planeten schon seit vielen Hundert Jahren sehr genau vermessen wurden, kann man diese Abweichungen leicht nachweisen. Jedoch erfordert eine Berechnung dieser Abweichungen für einen Planeten die Berücksichtigung aller anderen Planeten, und sie lässt sich nur bei genauer Kenntnis aller Daten der Planetenbahnen und deren Massen durchführen. Das wäre an dieser Stelle viel zu aufwendig. Wir werden diesen Aspekt daher im folgenden nicht weiter diskutieren. Es gibt aber noch eine andere mögliche Ursache für eine Abweichung der Planetenbahnen von den geschlossenen Keplerschen Ellipsen. Vielleicht stimmt das Newtonsche Gravitationsgesetz ja gar nicht exakt, sondern nur innerhalb einer gewissen Näherung. Es ist deshalb ganz sinnvoll, zu untersuchen, welche Abweichungen sich in den Keplerschen Gesetzen ergeben, wenn wir das Gravitationsgesetz etwas verändern. Sollte man diese Abweichung dann tatsächlich beobachten, oder eben nicht, so lassen sich daraus Schlüsse über die Gültigkeit des allgemeinen Gravitationsgesetzes ziehen. Wie könnte eine kleine Abweichung des Kraftgesetzes vom Newtonschen Gravitationsgesetz aussehen? Für große Abstände der beteiligten Körper stimmt es offenbar sehr gut, also sollten wir davon ausgehen, dass das “ 0 ”-Verhalten des Gravitationspotenzials für große richtig ist. Aber für sehr kleine Abstände könnte es eventuell eine Abweichung geben. Wir könnten also zum Gravitationspotenzial (8.23) eine Korrektur hinzufügen, die nur für kleine Abstände relevant ist. Machen wir dazu den Ansatz & " 0 (8.52) Die zusätzliche eingeführte Konstante hat die Dimension eine Länge. Für ist der zusätzliche Term sehr klein, so dass wir ihn vernachlässigen können. Die Konstante gibt also an, auf welcher Längenskala sich eine Abweichung vom Newtonschen Gravitationgesetzt bemerkbar macht. Ist zum Beispiel 0 mm, so wäre die Abweichung für die Planetenbahnen sehr klein, aber im Labor würde man eine Abweichung feststellen, wenn sich zwei schwere Körper sehr nahe kommen. Für ein positives wird die Anziehungskraft bei kleinen Abständen größer, für negatives wird sie kleiner und kehrt sich bei Abständen " 7 sogar in eine Abstoßung um, wie man durch Ableiten von (8.52) nach leicht bestätigen kann. 177 Tatsächlich ist das Newtonsche Gravitationsgesetz nur bis zu Größenordnungen von einigen Millimetern bei Massen von einigen Gramm experimentell bestätigt. Es ist nämlich sehr schwierig, große Massen sehr dicht aneinander zu bringen, ohne dass dabei andere, zum Beispiel elektromagnetische Kräfte auftreten, die die Gravitationskräfte dann um viele Größenordnungen übersteigen. Es ist also keineswegs ausgeschlossen, dass das Newtonsche Gravitationsgesetz bei kleinen Abständen gar nicht mehr gilt. Natürlich könnten wir uns auch beliebige andere Abweichungen vom “ 0 ”-Potenzial ausdenken. Der eigentliche Grund, warum wir gerade ein modifiziertes Potenzial der Form (8.52) betrachten, ist, dass wir für dieses Potenzial die Bewegungsgleichungen unmittelbar lösen können. Wir müssen dazu nur die bereits gefundenen Lösungen ein wenig modifizieren. Es soll hier also mehr darum gehen, mit möglichst einfachen Mitteln zu untersuchen, was prinzipiell geschieht, wenn wir das Kraftgesetz ein wenig abändern. Wir werden nicht die allgemeinste mögliche Veränderung diskutieren. Was müssen wir tun, um die Bewegungsgleichungen für das veränderte Potenzial (8.52) zu lösen? Es ist natürlich immer noch ein Zentralkraftpotenzial. Wir können wieder die Drehimpulserhaltung und die Methode des effektiven Potenzials verwenden. Wir definieren die Erhaltungsgrößen Energie und Drehimpuls wie in (8.25), nur für das effektive Potenzial müssen wir jetzt einen anderen Ausdruck einsetzen, 7 0 mit & " " 7 (8.53) Wie sieht dieses effektive Potenzial aus? Es besitzt wieder einen 0 - und einen 0 -Anteil. Für große dominiert der 0 -Anteil, das heißt dort ist alles beim alten. Für kleine dominiert der 0 -Anteil. Sein Vorzeichen hängt jetzt allerdings davon ab, ob größer oder kleiner als 7 ist. Nur, wenn größer also 7 ist, hat der 0 -Term ein positives Vorzeichen, und das effektive Potenzial sieht wie in Abbildung 8.1 aus. Andernfalls fällt es für 6 nach " ab. In diesem Fall gibt es keine Potenzialmulde, also auch keine Pendelbewegungen und somit keine Planetenbahnen. Da wir uns hier nur für Planetenbahnen interessieren, werden wir nur den Fall 7 96 (8.54) betrachten. Für negatives ist diese Ungleichung offenbar immer erfüllt, für positives macht sie jedoch eine Einschränkung an den Drehimpuls. In jedem Fall sich die Planetenbahnen wieder diejenigen Bahnen mit negativer Energie, denn sonst entweicht das fiktive Teilchen, das sich im effektiven Potenzial bewegt, ins Unendliche. Mit einem einfachen Trick können wir die Lösungen der Bewegungsgleichungen aus den bekannten 6 herleiten. Das das effektive Potenzial von der gleiche Form ist, können wir die Lösungen für Planetenbahnen auch jetzt wieder durch den minimalen Abstand und den maximalen Abstand von der Sonne klassifizieren. Die Umkehrpunkte sind auch hier wieder durch die Bedingung (8.29) festgelegt, nur dass wir ein anderes effektives Potenzial einsetzen müssen. Es gilt also " " 7 7 " 7 7 (8.55) Auch das ist wieder eine quadratische Gleichung, und wir können die Erhaltungsgrößen und durch die Parameter ausdrücken. Statt (8.31) gilt jetzt " 7 (8.56) Wenn positiv ist, ergibt sich hieraus automatisch die Bedingung (8.54) ab den Drehimpuls . Ist 6 sein muss, eine zusätzliche Bedingung an und . negativ, ergibt sich aus der Forderung, dass 178 Das liegt daran, dass die modifizierte Gravitationskraft für negatives bei kleinen Abständen abstoßend wirkt. Daher sind in diesem Bereich keine Umlaufbahnen mehr möglich. Wenn wir von diesen Einschränkungen einmal absehen, können wir jetzt genau so vorgehen wie vorher. Wenn wir die Bewegungsgleichung für , die sich aus der Energieerhaltung, also der ersten Gleichung in (8.55) ergibt, durch und ausdrücken, ergibt sich die Gleichung (8.32), 7 0 " " 0 (8.57) An der Radialbewegung des Planeten ändert sich also gar nichts. Er pendelt zwischen den Umkehrpunkten und hin und her, und zwar mit der gleichen Periode wie vorher. Wir können sie sofort angeben, denn sie ergibt sich aus dem dritten Keplerschen Gesetz zu 7 mit (8.58) Die entsprechende Bewegungsgleichung für wird jedoch leicht modifiziert. Statt (8.33) bekommen wir 7 (8.59) Um diese Differenzialgleichung wieder auf die Form (8.35) zu bringen, führen wir einen Korrekturfaktor ein, Wir setzen 0 7 (8.60) Die Bewegungsgleichungen (8.57) und (8.60) für und sind jetzt mit den ursprünglichen Bewegungsgleichungen (8.32) und (8.33) identisch, bis auf den Unterschied, dass hier statt die Funktion steht. Wir können daher die Lösungen der Bewegungsgleichungen unmittelbar übernehmen, wenn wir überall ersetzen. Das gilt insbesondere für die Beziehung (8.39) zwischen und . Der Weg des durch Planeten wird jetzt durch die Funktion & " 3! (8.61) beschrieben. Der Korrekturfaktor tritt also im Argument des Kosinus auf. Welche Konsequenzen hat das, und wie sehen diese Planetenbahnen aus? Offenbar ist die Periode der Funktion jetzt nicht mehr 7 , sondern 7 . Mit anderen Worten, der Winkelabstand zwischen zwei Minima der Funktion ist nicht 7 , sondern 7 . Die Bahn ist keine geschlossene Ellipse mehr, sondern eine Art Rosette, wie sie in Abbildung 8.3 dargestellt ist. Dass sich aus dem Newtonschen Gravitationsgesetz geschlossene, also periodisch durchlaufene Bahnen ergeben, ist also tatsächlich nur ein Zufall. Während der oben berechneten Periode pendelt der Planet einmal vom sonnennächsten Punkt zum sonnenfernsten Punkt und wieder zurück. Dabei macht er aber keine vollen Umlauf, sondern legt den Winkel 7 zurück. Je nach dem, ob größer oder kleiner als Eins ist, kann das mehr oder weniger als ein ganzer Umlauf sein. Das hängt offenbar vom Vorzeichen von ab. Ist positiv, so ist größer als eins, das heißt während einer Pendelbewegung macht der Planet mehr als einen Umlauf. Dieser Fall ist in Abbildung 8.3(a) dargestellt. Ist dagegen negativ, macht der Planet während einer Pendelbewegung weniger als einen Umlauf. In diesem Fall ergibt sich die Bahn in Abbildung 8.3(b). 179 replacements (c) (d) (b) (a) Abbildung 8.3: Eine Korrektur des Gravitationsgesetzes bewirkt, dass die Bahnen der Planeten nicht mehr in sich geschlossen sind. Es ergeben sich rosettenförmige Bahnen. Während einer Pendelbewegung verschiebt sich das Perihel, also der sonnennächste Punkt, um einen Winkel in Richtung des Umlaufs (a), oder gegen den Umlaufsinn (b). Um eine solche Rosettenbahn quantitativ zu beschreiben, führt man die Periheldrehung ein. Darunter versteht man den Winkel , um den zwei aufeinanderfolgende sonnennächste Punkte gegeneinander verschoben sind. In Abbildung 8.3(a) ist die Periheldrehung positiv, da der Planet mehr als eine Umdrehung gemacht hat, in Abbildung 8.3(b) ist sie negativ, da der Planet weniger als eine Umdrehung gemacht hat. Die Periheldrehung hängt natürlich von den Bahndaten des Planeten ab. Es ergibt sich 7 " 0 & 7 0 " 0 (8.62) Für kleine können wir diesen Ausdruck in eine Taylor-Reihe entwickeln. Klein heißt in diesem Fall, dass die Radien und groß sind im Vergleich zum Parameter , der ja die Dimension eine Länge hat. Für 4 0 ist 0 .4 0 .4 7 , also (8.63) Aufgabe 8.13 Wenn sich ein Planet auf einer Kreisbahn bewegt, kann man nat ürlich keine Periheldrehung beobachten. Trotzdem liefert die Formel (8.62) für einen bestimmten Wert. Welche physikalische Bedeutung hat dieser Wert? Aufgabe 8.14 Welche Beziehung besteht zwischen dem Radius und der Umlaufzeit eines Planeten auf einer Kreisbahn im modifizierten Gravitationspotenzial (8.52)? Was hat diese Aufgabe mit der Aufgabe 8.13 zu tun? Der Merkur und die Relativitätstheorie Eine Abweichung des Gravitationsgesetz von dem von Newton postulierten “ 0 ”-Potenzial führt also dazu, dass die Planetenbahnen nicht mehr in sich geschlossen sind. Wie eingangs bereits erwähnt, hat man eine solche Abweichung, also eine Periheldrehung der Planeten im Sonnensystem, tatsächlich beobachtet. 180 Der weitaus größte Teil dieses Effektes beruht aber auf der Wechselwirkung mit den anderen Planeten, die wir hier nicht einbezogen haben. Auf diese Weise wurden sogar die äußeren Planeten Neptun und Pluto “entdeckt”. Man fand in den Bahnen der bekannten Planeten Abweichungen von den Kepler-Ellipsen, die sich nur dadurch erklären ließen, dass es noch weitere Planeten geben muss. Unerklärt blieb jedoch bis ins Jahr 1916 die Periheldrehung, die man beim Merkur, also dem sonnennächsten Planeten beobachtet hatte. Zwar geht auch bei ihm der größte Teil der gemessenen Abweichung von der Keplerschen Ellipse auf die Anziehungskräfte der anderen Planeten zurück. Aber es stellte sich heraus, dass eine zwar sehr kleine, aber nicht erklärbare Abweichung übrig blieb. Diese Abweichung sollte in der Geschichte der Physik des letzten Jahrhunderts eine wichtige Rolle spielen. Wir wollen daher ein wenig näher auf sie eingehen. Was man fand war eine Periheldrehung des Winkelsekunden pro Erdjahrhundert. Mit anderen Worten, in hundert Erdjahren bewegte Merkur von sich das Perihel des Merkur um Winkelsekunden nach vorne. Umgerechnet ergibt sich daraus nach unserer Konvention eine Periheldrehung des Merkur von 7: 0 6 (8.64) Das ist natürlich unvorstellbar wenig. Trotzdem lässt sich dieser Wert leicht ermitteln, wenn man die Bahn des Merkur über einige Jahrhunderte hinweg genau verfolgt. Der Grund dafür ist unter anderem, dass die Merkurbahn stärker als die der anderen Planeten von einer Kreisbahn abweicht. Der jeweils sonnennächste Punkt lässt sich daher sehr leicht beobachten. Für die Bahndaten findet man 6: 0 6 m : 0 6 m (8.65) Nehmen wir nun an, diese Periheldrehung sei durch eine Abweichung des Gravitationsgesetzen von der Art verursacht, wie wir sie hier untersucht haben. Dann folgt aus (8.63) km (8.66) Mit anderen Worten, das Gravitationsfeld der Sonne würde bei Abständen von einigen Kilometern deutliche Abweichungen vom Newtonschen Gesetz zeigen. Das ist natürlich unrealistisch, denn auf diesen Skalen wäre es unsinnig die Sonne als Punktteilchen zu beschreiben, weil sie selbst ja viel größer ist. Wir können eine solche Abweichung nicht direkt messen, indem wir uns dem Kraftzentrum nähern, weil wir uns dann schon lange im Innern der Sonne befinden würden, wo das Kraftgesetz aus ganz anderen Gründen nicht mehr gilt. Trotzdem kann man sich fragen, ob es vielleicht irgendeinen Grund gibt, warum die Abweichung vom Newtonschen Gravitationsgesetz gerade bei dieser Größenordnung auftritt, wenn es denn ein verändertes Gravitationsgesetz ist, das diese Periheldrehung verursacht. Sicher spielt hier auch die Masse der Sonne eine Rolle, denn in irdischen Labors findet man, dass bei sehr viel kleineren beteiligten Massen das Newtonsche Gesetz auch bei Abständen von viel weniger als einem Kilometer noch gilt. Verblüffenderweise findet man, dass man durch geschicktes Kombinieren von Naturkonstanten und der Sonnenmasse auch eine Größe bilden kann, die die Dimension einer Länge hat. Aus der Relation (8.47), die Dimension Länge hoch drei geteilt durch also dem dritten Keplerschen Gesetz, lesen wir ab, dass Zeit zum Quadrat hat. Nun gibt es eine Naturkonstante, die die Dimension einer Geschwindigkeit hat. Sie spielt zwar in der klassischen Mechanik keine besondere Rolle, jedoch in der Elektrodynamik und der : 0 6 m s. Daraus können wir die Größe Relativitätstheorie. Es ist die Lichtgeschwindigkeit 0 km (8.67) bilden. Überraschenderweise hat die sie gleiche Größenordnung wie die auf eine sehr naive Weise ermittelte Konstante . Eine solche “zufällige” Übereinstimmung von Größenordnungen ist ein deutlicher Hinweis dafür, dass an der Vermutung eines veränderten Gravitationsgesetzes etwas dran ist. 181 Aber wie soll ein solchen verändertes Gravitationsgesetz aussehen? Darüber gibt die Messung der Periheldrehung keine Auskunft. Wir haben hier ja nur einen ganz speziellen Ansatz diskutiert. Es gibt viele andere Möglichkeiten, das Gravitationsgesetz zu modifizieren. Fast alle führen im Rahmen der hier durchgeführten Näherung, und mit entsprechend angepassten Parametern, zum selben Ergebnis. Es war deshalb sehr überraschend, dass eine aufgrund ganz anderer Überlegungen konstruierte Theorie der Gravitation, nämlich die allgemeine Relativitätstheorie, genau die richtige Abweichung lieferte, ohne dass man zusätzliche Annahmen machen musste. Damit war im Jahre 1916, also Einstein die endgültige Version der Theorie veröffentlichte, das Rätsel der Periheldrehung des Merkur gelöst. Wie genau diese Lösung aussieht, darauf können wir hier nicht näher eingehen, denn dazu müssten wir erst einmal die allgemeine Relativitätstheorie verstehen. Was das Beispiel aber klar machen soll, ist, dass es oft eine als zufällige erscheinende, unerklärbare Relation zwischen Messdaten und Naturkonstanten ist, die auf eine noch unverstandene oder unbekannte Theorie hindeutet. Die lange Zeit unerklärbare Beziehung zwischen den Bahndaten des Merkur und den Naturkonstanten und ist eine der berühmtesten Beziehungen dieser Art, denn sie gilt also eine der wichtigesten frühen experimentellen Bestätigungen der Relativitätstheorie. In der Geschichte der Physik gab es viele solche ‘’Schlüsselbeziehungen”, und es gibt sie natürlich auch heute noch. 182