Was ist eine physikalische Theorie?

T HEORETISCHE P HYSIK
Hans-Jürgen Matschull
Institut für Physik, Universität Mainz
5.1.2003
T EIL I
T EILCHEN , K R ÄFTE , F ELDER
Was ist eine physikalische Theorie?
Auf diese Frage gibt es sicher keine eindeutige, allgemein akzeptierte und präzise Antwort. Verschiedene
Physiker haben oft sogar sehr unterschiedliche Vorstellungen davon, was sich hinter diesem Begriff verbirgt. Die Antworten reichen von sehr weit gefassten Umschreibungen wie “eine physikalische Theorie
ist eine Beschreibung von Naturvorgängen”, vielleicht noch ergänzt durch den Zusatz “in der Sprache der
Mathematik”, bis hin zu sehr konkreten Erklärungen wie “eine physikalische Theorie ist eine -Algebra
von beschränkten Operatoren auf einem Hilbert-Raum”.
Während die erste Definition viel zu vage ist, um damit konkret zu arbeiten, besticht die zweite an
dieser Stelle wohl vor allem durch ihre Unverständlichkeit. Wir wollen versuchen, eine einerseits möglichst
allgemeine, auf die gesamte Physik anwendbare, aber andererseits auch sehr konkrete Definition zu geben.
Eine solche Definition des Begriffes physikalische Theorie zur Hand zu haben, wird sich an vielen Stellen
als nützlich erweisen.
Was wollen wir mit einer physikalischen Theorie eigentlich erreichen? Zunächst wollen wir die Phänomene beschreiben, die wir beobachten können. Darüber hinaus wollen wir Gesetzmäßigkeiten formulieren, die wir in diesen Phänomenen erkennen. In einem gewissen Sinne wollen wir die Phänomene auch
verstehen, indem wir sie auf möglichst wenige, vielleicht unerklärbare Grundphänomene zurückführen.
Und schließlich wollen wir mit Hilfe eine Theorie Vorhersagen machen über zukünftige Phänomene und
Beobachtungen, was auch zu der Möglichkeit von praktischen Anwendungen führt.
Als Werkzeug, und zwar sowohl als methodisches als auch als sprachliches Werkzeug, wollen wir dabei
die Mathematik verwenden. Eine physikalische Theorie baut auf einer mathematischen Theorie auf. In
einer mathematischen Theorie werden grundlegende Begriffe durch Axiome definiert. Axiome beschreiben
die Objekte, aus denen eine mathematische Theorie aufgebaut wird, durch ihre Eigenschaften und ihre
Beziehungen zueinander. Die Axiome einer mathematischen Theorie sagen allerdings nichts darüber aus,
was diese Objekte sind. Sie sagen uns nur, wie sie sich zueinander verhalten.
Genau das ist die Stärke der Mathematik. Sie lässt offen, was man sich unter den abstrakten Begriffe,
die sie definiert, konkret vorstellen soll und kann. Und das ist auch genau die Schnittstelle, an der eine
physikalische Theorie ansetzt. Eine physikalische Theorie wählt aus einer mathematischen Theorie einige
abstrakte Begriffe aus, und identifiziert sie mit realen, beobachtbaren Objekten. Sie fügt zu den mathematischen Axiomen einer Theorie physikalische Axiome hinzu.
Ein physikalisches Axiom beantwortet also die Frage, was ein zunächst abstraktes mathematische Objekt ist. Es ordnet ihm ein Objekt in der realen Welt zu. Typischerweise wird eine solche Zuordnung durch
eine Messvorschrift hergestellt. Wie wir gleich im ersten Kapitel sehen werden, können wir zum Beispiel
eine Methode angeben, mit der wir den Abstand zweier Orte im Raum messen können. Als eine andere Messgröße werden wir später die Zeit einführen. Sie wird, wie sollte es anders sein, mit einer Uhr
gemessen.
Eine physikalische Theorie identifiziert diese Messgrößen mit abstrakten Größen, die zuvor völlig kontextfrei in einer mathematischen Theorie definiert wurden. Sie stellt in diesem Sinne eine Beziehung zwischen Mathematik und Realität her.
Eine physikalische Theorie ist eine Abbildung von realen Objekten auf abstrakte mathematische Strukturen.
Ein physikalische Theorie ist also mehr als reine Mathematik, denn die reine Mathematik kennt eine
solche Zuordnung nicht. Ihre Objekte existieren im luftleeren Raum der reinen Logik. Die Physik erweckt
die mathematischen Strukturen gewissermaßen zum realen Leben.
Eine physikalische Theorie ist aber andererseits auch mehr als eine reine Naturbeschreibung. Durch
die Abbildung der realen Objekte auf mathematische Strukturen macht sie sich nämlich die sehr effektiven Möglichkeiten der Mathematik zu nutze, nahezu beliebig neue Objekte und Strukturen einführen zu
1
können. Die Stärke einer physikalischen Theorie liegt darin, mit diesen Objekten und Strukturen rechnen
und arbeiten zu können, ohne sich darüber Gedanken machen zu müssen, welchen realen Objekten sie
entsprechen.
Um mit Hilfe einer Theorie eine Vorhersage über eine zukünftige Beobachtung zu machen, gehen wir
in der Regel so vor, dass wir die bereits durchgeführten Messungen und Beobachtungen zunächst in die
Sprache der Mathematik übersetzen. Dazu benötigen wir die Abbildung der Realität auf die Mathematik,
die eine physikalische Theorie herstellt. Dann können wir, ganz ohne Bezug zur Realität, reine Mathematik
betreiben, um aus unseren Beobachtungen logische Schlüsse zu ziehen. Erst dann tauchen wir wieder auf,
indem wir die Ergebnisse wieder in eine physikalische Sprache zurück übersetzen und so zum Beispiel
das Ergebnis einer Messung vorhersagen.
Es ist dabei nicht nötig, mit allen in den Zwischenschritten verwendeten Begriffen und Zusammenhängen irgendwelche physikalischen, also realen Vorstellungen zu verbinden. Meistens geht das auch
gar nicht, weil nur sehr wenige der in einer Theorie definierten mathematischen Objekte überhaupt einen
direkten Bezug zur physikalischen Realität haben. Und in der Regel sind dies auch nicht die durch die
mathematischen Axiome definierten Objekte, sondern daraus abgeleitete, also im mathematischen Sinne komplexere Objekte. Die im mathematischen Sinne “primitiven” Objekte einer Theorie, also die, die
durch die mathematischen Axiome definiert werden, müssen nicht gleichzeitig die im physikalischen Sinne “primitiven” Objekte sein, also diejenigen, die unmittelbar der Beobachtung oder Messung zugänglich
sind.
In den klassischen Theorien, die wir hier zunächst einführen werden, liegen Mathematik und Realität
noch sehr eng beieinander. Die meisten mathematischen Größen haben zumindest eine anschauliche Entsprechung in der Realität, auch wenn sie nicht einer unmittelbaren Messung zugänglich sind. Die meisten
mathematischen Konstruktionen, die wir in diesen Theorien benötigen, können wir uns unmittelbar anschaulich vorstellen, was das Verständnis oft sehr erleichtert. Jedoch besteht dadurch auch ein wenig die
Gefahr, die wahre Stärke eine physikalischen Theorie zu verkennen. Das ist die Fähigkeit, auch mit mathematischen Objekten arbeiten zu können, die keinen direkten Bezug zur Realität mehr haben, oder deren
Bezug zur Realität wir nicht kennen.
Spätestens, wenn wir uns mit der Quantenmechanik beschäftigen, werden wir mit dieser Tatsache ganz
unmittelbar konfrontiert werden. Dort treten nämlich mathematische Strukturen auf, die wir für die Berechnungen benötigen, von denen wir aber nicht sagen können, welchen realen Strukturen sie eigentlich
entsprechen. Das führt sogar zu allerlei metaphysikalischen, also philosophischen Fragen darüber, was
man von so einer Theorie eigentlich halten soll. Aber entscheidend ist, dass sie sehr gut funktioniert, und
zwar selbst dann, wenn wir nicht von allen mathematischen Begriffen, die wir benutzen, den Zusammenhang mit der Realität kennen.
Viel tiefer wollen wir an dieser Stelle nicht in die Frage nach dem Wesen eine physikalischen Theorie
einsteigen. Vieles verstehen wir ohnehin erst, wenn wir ein paar Beispiele für physikalische Theorien
kennen und vor allem benutzen gelernt haben. Die grundlegende Eigenschaft einer physikalischen Theorie,
also die Definition einer Abbildung der Realität auf die Mathematik, sollten wir jedoch stets im Auge
behalten, wenn wir verstehen wollen, was eine physikalische Theorie leisten kann und vor allem was sie
nicht leisten kann.
1 Die Struktur des Raumes
Den physikalischen Raum stellen wir uns als eine Menge von Punkten vor. Einen Punkt oder Ort im Raum
können wir durch einen Gegenstand markieren, etwa die Ecke eines Tisches oder den Mittelpunkt der Erde. Natürlich müssen wir an dieser Stelle ein wenig idealisieren, denn in der Praxis können wir einen Ort
immer nur mit einer endlichen Genauigkeit bestimmen. Weder die Ecke eines Tisches noch der Mittel-
2
(d)
(b)
(a)
(c)
Abbildung 1.1: Vektoren werden durch Pfeile im Raum dargestellt. Zwei Pfeile repräsentieren denselben
Vektor, wenn sie durch eine Verschiebung (a) aufeinander abgebildet werden. Die Addition (b) von Vektoren erfolgt durch Zusammensetzen, die skalare Multiplikation (c) durch Strecken der Pfeile. Der inverse
Vektor ergibt sich durch Umkehren der Richtung.
punkt der Erde definiert einen wirklich punktförmigen Ort im Raum. Wir können uns aber vorstellen, dass
wir einen Ort beliebig genau festlegen können, wenn wir unsere Methoden nur immer weiter verfeinern.
Jedenfalls beruht die klassische Physik auf der Annahme, dass das im Prinzip möglich ist.
Aber der Raum besteht nicht nur einfach aus einer Menge von Punkten, sondern diese Menge hat auch
einer Struktur. Die klassische Physik geht davon aus, dass der physikalische Raum die Struktur eines
dreidimensionalen Euklidischen Raumes besitzt. In einem Euklidischen Raum sind die aus der Geometrie
bekannten Größen wie Längen und Winkel definiert, es gibt Operationen wie Verschiebungen und Drehungen, und das Konzept der Vektorrechnung. Allen diesen mathematischen Strukturen entsprechen gewisse
physikalische Strukturen des Raumes.
Im Sinne der Einleitung ist dies bereits eine physikalische Theorie. Die Euklidische Geometrie macht
Aussagen über bestimmte Größen, die wir im physikalischen Raum messen können, und über Beziehungen
zwischen solchen Messgrößen, die wir experimentell nachprüfen können. Sie ist daher die älteste physikalische Theorie im modernen Sinne, obwohl die Erkenntnis, dass es eine solche ist, relativ neu ist. Alle
üblicherweise als “klassisch” bezeichneten physikalischen Theorien, darunter die Newtonsche Mechanik
und die Maxwellsche Elektrodynamik, bauen auf dieser Theorie über die Struktur des Raumes auf.
Wir werden uns deshalb in diesem und dem nächsten Kapitel etwas ausführlicher mit der Euklidischen
Geometrie beschäftigen und zeigen, in welchen Sinne sie als physikalische Theorie zu verstehen ist. Allerdings werden wir sie nicht auf den traditionellen Euklidischen Axiomen aufbauen, sondern eine für unsere
Zwecke etwas besser geeignete Formulierung verwenden. Sie baut auf dem Konzept eines metrischen
affinen Raumes auf. Was das ist, werden wir natürlich erst einmal erklären.
Vektorräume
Bevor wir den physikalischen Raum selbst als Punktmenge beschrieben, ist es nützlich, das Konzept eines
Vektors einzuführen. Die wichtigsten Eigenschaften von Vektoren sind in Abbildung 1.1 dargestellt. Einen
Vektor stellen wir uns als einen Pfeil im Raum vor. Ein Pfeil ist die gerichtete Verbindungslinie zweier
Punkte. Ein Pfeil hat eine Länge und eine Richtung. Wir betrachten zwei Vektoren als gleich, wenn sie
durch Pfeile gleicher Länge und Richtung dargestellt werden. Das ist genau dann der Fall, wenn die Pfeile
durch eine Verschiebung ineinander übergehen. Schließlich können wir Vektoren addieren, indem wir die
Pfeile aneinander ansetzen, und wir können sie mit reellen Zahlen multiplizieren, indem wir die Pfeile
strecken bzw. stauchen.
Aus dieser anschaulichen Vorstellung wird das mathematische Konzept eines Vektorraumes abgeleitet.
Ein Vektorraum über dem Körper der reellen Zahlen besteht aus einer Menge von Vektoren. Wir
3
bezeichnen Vektoren durch ein Symbol mit Pfeil, das heißt wir schreiben für die Elemente
von . Die Struktur des Vektorraums wird durch zwei Abbildungen festgelegt, nämlich die Addition von
Vektoren,
Vektoraddition
(1.1)
und die skalare Multiplikation von Vektoren mit reellen Zahlen,
skalare Multiplikation
(1.2)
Bezüglich der Addition bildet der Vektorraum eine abelsche Gruppe, das heißt die Addition ist kommutativ
und assoziativ. Für alle gilt
Außerdem gibt es einen Nullvektor ! dass
(1.3)
, sowie zu jedem Vektor einen inversen Vektor "# , so
! $
%"# & ! (1.4)
Die skalare Multiplikation ist distributiv bezüglich der Additionen in und in , und mit der Multiplikation in verträglich. Für alle ' und alle )( gilt
*% #+ , -( #+.( ( / ( 0 (1.5)
Wegen der Assoziativität der Addition (1.3) können wir statt * 1 oder * auch einfach
schreiben. Das gleiche gilt für die skalare Multiplikation. Wegen der dritten Eigenschaft in (1.5),
also der Verträglichkeit mit der Multiplikation in , schreiben wir statt , ( oder * ( einfach ( .
Und schließlich benutzen wir für 2" 3 die Abkürzung " .
Aufgabe 1.1 Man zeige, dass es zu je zwei Vektoren stets genau einen Vektor 4 gibt mit
4 , und dass es demnach auch nur genau einen Nullvektor ! , und zu jedem Vektor nur
genau einen inversen Vektor "# gibt.
Aufgabe 1.2 Man beweise, dass für alle "*%"5 & folgende Identitäten gelten:
6 ! %" 0 "#$
7 (1.6)
Das Skalarprodukt
Um den Betrag und die Richtung eines Vektors zu definieren, benötigen wir als zusätzliche Struktur auf
dem Vektorraum ein Skalarprodukt oder eine Metrik. Die beiden Begriffe werden oft synonym verwendet. Ein Skalarprodukt ist eine Abbildung, die jedem Paar von Vektoren eine reelle Zahl zuordnet,
Skalarprodukt
1&
8 9
;: Es hat die folgenden Eigenschaften. Es ist symmetrisch, das heißt für alle <: = : (1.7)
gilt
(1.8)
Außerdem es linear, das heißt es verhält sich distributiv gegenüber der Addition, und es ist mit der skalaren
Multiplikation verträglich. Für alle ' + und alle > gilt
+ 1 : 5: : 4
,# : ? /<: 1 (1.9)
Aus der Symmetrie (1.8) folgen dann natürlich auch die entsprechenden Eigenschaften bezüglich des
zweiten Argumentes,
;: & 5: 5: <: , & /5: (1.10)
Schließlich ist das Skalarprodukt eines Vektors mit sich selbst stets positiv und nur dann gleich Null, wenn
der Vektor der Nullvektor ist. Es gilt also für alle ;: 86 ;: 6
! (1.11)
Auch hier können wir wieder die Eigenschaften des Skalarproduktes verwenden, um die Schreibweise zu
vereinfachen. Statt / : oder 5 : schreiben wir einfach # : . Wir müssen bei solchen vereinfachten
Schreibweisen nur darauf achten, dass auf beiden Seiten des Punktes stets ein Vektor steht. Wir verwenden
außerdem die Abkürzung ;: .
Ein Vektorraum, auf dem ein Skalarprodukt definiert ist, heißt metrischer Vektorraum. In einem metrischen Vektorraum hat jeder Vektor einen Betrag, der durch das Skalarprodukt des Vektors mit sich
selbst definiert ist,
Betrag
;: (1.12)
Der Betrag eines Vektors ist stets positiv, nur der Nullvektor hat den Betrag Null. Oft spricht man statt vom
Betrag auch von der Länge eines Vektors. Wir wollen das Wort “Länge” aber für einen anderen Begriff
reservieren, auf den wir am Ende dieses Kapitels näher eingehen werden. Der Begriff des Betrages ist ein
wenig allgemeiner, wie wir dort sehen werden.
0 hat, dessen Betrag also gleich Eins ist, nennen wir
Einen Vektor , der die Eigenschaft
Einheitsvektor. Ein Einheitsvektor definiert quasi nur eine Richtung. Zu jedem Vektor ! gibt es einen
Einheitsvektor , der in dieselbe Richtung zeigt wie , nämlich . Mit Ausnahme des Nullvektors
lässt sich jeder Vektor auf diese Weise eindeutig in Betrag und Richtung zerlegen,
(1.13)
Um auszudrücken, dass der Vektor in die Richtung von zeigt, schreiben wir , das heißt ist zu
proportional. Das ist genau dann der Fall, wenn es ein > gibt mit / .
Wenn das Skalarprodukt von zwei Vektoren verschwindet, also : ? 6 ist, so nennen wir die Vektoren
orthogonal und schreiben . Der Nullvektor ist in diesem Sinne zu allen Vektoren, auch zu sich selbst,
mit
orthogonal. Dass diese Sprechweise tatsächlich etwas mit rechten Winkeln zu tun hat, wird in Aufgabe 1.20
gezeigt.
Aufgabe 1.3 Man beweise die binomischen Formeln
1 1 : " 1& % " 7 #: " " 7 <: (1.14)
Aufgabe 1.4 Man beweise die folgenden Eigenschaften des Skalarproduktes. Bei Multiplikation eines Vektors mit einer reellen Zahl wird dieser um den Faktor gestreckt, das heißt f ür alle und alle
gilt
# (1.15)
Aus der Kenntnis der Beträge aller Vektoren kann man das Skalarprodukt rekonstruieren. Es gilt n ämlich
für alle $ 5: ? " " (1.16)
5
replacements
(c)
(d)
(b)
(a)
Abbildung 1.2: Ein Vektor lässt sich eindeutig in einen Anteil proportional und einen Anteil senkrecht zu einem Einheitsvektor zerlegen (a). Das Skalarprodukt repräsentiert die orthogonale
Projektion von auf die Richtung von (b).
.
Außerdem gilt für alle Vektoren die Schwarzsche Ungleichung
5: (1.17)
Wann gilt hier das Gleichheitszeichen?
Aufgabe 1.5 Eine weitere nützliche Eigenschaft des Skalarproduktes ist in Abbildung 1.2(a) dargestellt.
Es sei irgendein Vektor und ein Einheitsvektor. Dann kann man in zwei Vektoren und zerlegen,
und zwar so, dass zu proportional ist, und zu senkrecht steht, also
(1.18)
Man zeige, dass eine solche orthogonale Zerlegung immer existiert, dass sie sogar eindeutig ist, und dass
sich die Vektoren und wie folgt darstellen lassen,
% ;: "8%<: (1.19)
Aufgabe 1.6 In Abbildung 1.2(b) wird gezeigt, dass das Skalarprodukt : die orthogonale Projektion
eines Vektors auf einen Einheitsvektor definiert. Wie ist das zu verstehen? Warum kann die orthogonale
Projektion von auf nur Werte zwischen " und annehmen?
Basis und Dimension
Um in einem Vektorraum konkrete, also numerische Rechnungen durchzuführen, müssen wir eine Basis
einführen. Eine Basis ermöglicht es, das formale Rechnen mit Vektoren auf das Rechnen mit Zahlen
zurückzuführen. Das benötigen wir, um später zum Beispiel ganz konkret die Bahn eines Körpers im
Raum zu berechnen, was ja eine typische Aufgabe der Mechanik ist.
Wir betrachten einen Vektorraum , sowie einen Satz von beliebig ausgewählten Vektoren ,
wobei
eine positive ganze Zahl ist. Der Index , mit dem wir die einzelnen Vektoren durchnummerieren, soll im folgenden immer von 0 bis laufen, also Werte aus der Indexmenge 0 annehmen. Den kompletten Satz von Vektoren bezeichnen wir mit . Wir können ihm gewisse Begriffe
und Eigenschaften zuordnen.
6
Eine Linearkombination der Vektoren ist ein Ausdruck der Form
mit
(1.20)
Wir multiplizieren jeden Vektor mit einer reellen Zahl und addieren die Ergebnisse zu einem neuen
Vektor. Die Zahlen > , die wir ebenfalls zu einem Satz zusammenfassen können, sind die
Koeffizienten der Linearkombination.
Ein Satz von Vektoren heißt vollständig, wenn jeder Vektor als Linearkombination der
gegebenen Vektoren dargestellt werden kann. Es existiert also für jeden Vektor ein Satz von reellen
Zahlen mit
(1.21)
'
Wir sagen in diesem Fall auch, dass der Vektorraum von den Vektoren aufgespannt wird.
Ein Satz von Vektoren heißt linear unabhängig, wenn das Gleichungssystem
4
!
(1.22)
für die Variablen 4 nur genau dann erfüllt ist, wenn alle 4 6 sind. Es gibt also nur genau eine
Linearkombination der Vektoren , die als Ergebnis den Nullvektor liefert. Das ist die, bei der alle
Koeffizienten gleich Null sind.
Eine Basis von ist ein Satz von Vektoren , der sowohl linear unabhängig als auch vollständig
ist. Wenn eine Basis von ist, dann lässt sich jeder Vektor auf genau eine Art und Weise
als Linearkombination der Basisvektoren schreiben. Es gibt also zu jedem Vektor genau einen Satz von
Komponenten , so dass
(1.23)
Dass es mindestens einen solchen Satz gibt, ergibt sich aus der Vollständigkeit der Basisvektoren. Dass es
für jeden Vektor nur genau einen Satz von Komponenten gibt, folgt aus der linearen Unabhängigkeit der
Basisvektoren. Sei nämlich ein zweiter Satz von Komponenten mit der Eigenschaft (1.23). Dann ist
$
" '"
" ! (1.24)
Das ist ein Gleichungssystem der Form (1.22) für die Variablen 4 &" . Somit folgt wegen der
linearen Unabhängigkeit der Basisvektoren, dass alle 4 gleich Null sind, also .
Wenn es eine Basis von gibt, die aus Vektoren besteht, dann besteht jede andere Basis von auch
aus Vektoren. Das ergibt sich aus dem folgenden, sogar noch etwas allgemeineren Satz.
Aufgabe 1.7 Es sei , mit 0 33
ein linear unabhängiger Satz von Vektoren, und mit
0 31 ein vollständiger Satz von Vektoren. Man zeige, dass ist.
Da jede Basis sowohl vollständig als auch linear unabhängig ist, folgt daraus, dass jede Basis aus gleich
vielen Vektoren bestehen muss. Die Zahl der Basisvektoren ist eine Eigenschaft des Vektorraumes
. Sie wird als Dimension bezeichnet und mit bezeichnet. Wir betrachten hier nur endlichdimensionale Vektorräume, also solche, die eine Basis aus endlich vielen Vektoren besitzen.
Mit Hilfe einer Basis lässt sich das Rechnen mit Vektoren auf das Rechnen mit reellen Zahlen
zurückführen. Um eine Vektoraddition oder eine skalare Multiplikation durchzuführen, müssen wir nur
die entsprechende Operation auf die Komponenten der Vektoren bezüglich irgendeiner Basis anwenden.
7
Aufgabe 1.8 Man zeige, dass für alle ' und für alle die folgenden Rechenregeln gelten,
# , (1.25)
Der Raum aller -Tupel von reellen Zahlen ist natürlich selbst ein Vektorraum, wobei die Addition
und die skalare Multiplikation eintragsweise erklärt sind, also ; bzw. * ;
. Das entspricht genau den entsprechenden Operationen in (1.25), so dass durch die Zuordnung
eines Vektors zu seinen Komponenten eine lineare Abbildung definiert wird.
Eine Abbildung zwischen zwei Vektorräumen heißt linear, wenn sie mit der Vektoraddition und der
skalaren Multiplikation verträglich ist. Die Summe von zwei Vektoren wird auf die Summe der Bilder
der beiden Vektoren abgebildet, und das skalare Vielfache eines Vektors auf des entsprechende Vielfache
des Bildes. Genau das ist die Aussage von (1.25). Ist die Abbildung zudem bijektiv, so werden die beiden
Vektorräume vollständig miteinander identifiziert. Wir können die Eigenschaften einer Basis daher wir
folgt zusammenfassen:
Eine Basis ist eine bijektive lineare Abbildung Dabei ist
.
natürlich die Dimension von . Explizit ist die Abbildung wie folgt gegeben,
Basis
Aufgabe 1.9 Es sei mit
"
" " (1.27)
Sind die Vektoren bzw. vollständig? Sind sie linear unabhängig?
(1.26)
eine Basis eines dreidimensionalen Vektorraumes . Ferner sei
Aufgabe 1.10 Es sei ein -dimensionaler Vektorraum. Warum ist jeder vollst ändige Satz von genau
Vektoren eine Basis von ? Warum ist jeder linear unabhängige Satz von genau Vektoren eine Basis von
?
Aufgabe 1.11 Nicht jeder Vektorraum ist endlich-dimensional. Der Raum aller (stetigen, differenzierbaren, integrierbaren, ...) Funktionen wird zu einem Vektorraum, wenn wir die Addition zweier
Funktionen und die skalare Multiplikation einer Funktion mit einer reellen Zahl
durch
4 & 4 4 bzw. 4 & 4 (1.28)
erklären. Man zeige, dass die Vektorraumaxiome erfüllt sind, dass dieser Vektorraum aber keine Basis
aus endlich vielen Vektoren, also Funktionen besitzt.
Orthonormalbasis und Kronecker-Symbol
Um auch das Skalarprodukt und damit den Betrag eines Vektors durch eine einfache Funktion seiner
Komponenten auszudrücken, müssen wir eine spezielle Art von Basis wählen. Es sei zunächst , mit
0 33 , irgendeine Basis eines -dimensionalen metrischen Vektorraumes . Dann gilt für das
Skalarprodukt von zwei Vektoren ' ;: ? 8
: (1.29)
Um diesen Ausdruck weiter umzuformen, müssen wir einen der Indizes umbenennen. Dann können wir
die Summen aus dem Skalarprodukt herausziehen, indem die Eigenschaft (1.9) verwenden,
: : :
(1.30)
Aufgabe 1.12 Man mache sich die einzelnen Schritte dieser Umformung durch explizites Ausschreiben
der Summen klar. Warum ist es unbedingt nötig, den Indizes, über die jeweils summiert wird, verschiedene
Namen zu geben?
Nehmen wir nun an, die Basis Basisvektoren gilt
hätte die folgende spezielle Eigenschaft. Für die Skalarprodukte der
:
Orthonormalbasis
6
0
für
für
(1.31)
Eine solche Basis heißt Orthonormalbasis. Die spezielle Eigenschaft einer Orthonormalbasis ist, dass alle
Basisvektoren Einheitsvektoren sind, und dass sie paarweise zueinander senkrecht stehen. Genau das wird
durch die Forderung (1.31) ausgedrückt.
Eine Orthonormalbasis besteht aus zueinander orthogonalen Einheitsvektoren.
Es ist nützlich, für die Eigenschaft (1.31) der Basisvektoren ein spezielles Symbol einzuführen. Es heißt
Kronecker-Symbol und wird wie folgt definiert,
KroneckerSymbol
6
0
für
für
(1.32)
Die Eigenschaft (1.31) einer Orthonormalbasis lässt sich dann sehr einfach durch die Gleichung
:
(1.33)
(1.34)
ausdrücken. Ferner lassen sich Summen, in denen das Kronecker-Symbol auftritt, sehr leicht vereinfachen.
So gilt zum Beispiel für einen beliebigen Satz von reellen Zahlen die Regel
Wenn unter einer Summe ein Kronecker-Symbol steht, wobei über einen der beiden Indizes summiert
wird, so bleibt von der Summe nur ein Term übrig, nämlich der, für den die beiden Indizes gleich sind.
Das Kronecker-Symbol greift gewissermaßen einen der Summanden aus der Summe heraus und vernichtet
alle anderen. Natürlich gilt das nur, wenn alle beteiligten Indizes, hier also und , denselben Wertebereich
haben. Da hier alle Summen von 0 bis laufen, und auch alle Indizes, über die nicht summiert wird, Werte
von 0 bis annehmen, ist das stets gewährleistet.
Wenn wir die Eigenschaft (1.33) der Basisvektoren in (1.30) einsetzen und anschließend diese Regel
auf die Summe über den Index anwenden, so erhalten wir den folgenden einfachen Ausdruck für das
Skalarprodukt von zwei Vektoren,
5: :
(1.35)
Das Skalarprodukt zweier Vektoren ist durch die Summe der Produkte ihrer Komponenten bezüglich einer
Orthonormalbasis gegeben. Für den Betrag eines Vektors gilt dann die einfache Formel
(1.36)
das heißt das Quadrat des Betrages eines Vektors ist durch die Summe der Quadrate seiner Komponenten
gegeben.
9
Aufgabe 1.13 Im folgenden laufen alle Indizes von 0 bis , und es sei ein beliebiger Satz von
Vektoren. Man beweise die folgenden allgemeinen Rechenregeln f ür das Kronecker-Symbol,
Man berechne anschließend
(1.37)
(1.38)
Der Einfachheit halber fasst man Summen über mehrere Indizes zu einem Summenzeichen zusammen. Man
mache sich klar, dass die Reihenfolge, in der die einzelnen Summationen ausgef ührt werden, unerheblich
ist.
Aufgabe 1.14 Man zeige mit Hilfe des Kronecker-Symbols, dass die Komponenten eines Vektors
bezüglich einer Orthonormalbasis durch die orthogonalen Projektionen des Vektors auf die
Basisvektoren gegeben sind, also
<:
(1.39)
Aufgabe 1.15 Man beweise, dass jeder endlich-dimensionale metrische Vektorraum eine Orthonormalbasis besitzt.
Affine Räume
Wir wollen nun die anschauliche Vorstellung von einem Vektor als Pfeil, das heißt als gerichtete Verbindungslinie zweier Punkte im Raum, mathematisch präzise formulieren. Wir benötigen dazu das Konzept
eines affinen Raumes.
Ein affiner Raum besteht aus einem Punktraum und einem zugeordneten Vektorraum . Die Elemente
von , die wir mit großen Buchstaben bezeichnen, repräsentieren die Punkte oder die Orte
im Raum. Die Elemente von , die wir wieder 3 nennen, repräsentieren
die Vektoren, die durch
Pfeile im Raum dargestellt werden. Die Beziehung zwischen dem Punktraum und dem Vektorraum ist durch eine Abbildung festgelegt, die je zwei Punkten einen Abstandsvektor zuordnet,
Abstandsvektor
&
Der Abstandsvektor wird anschaulich durch einen Pfeil dargestellt,
der vom Punkt
zeigt. Er soll folgende Eigenschaften haben. Für alle gilt
8
(1.40)
zum Punkt
(1.41)
Das ist die formale Schreibweise für die in Abbildung 1.3(a) dargestellte Vorschrift, nach der Vektoren
durch das Zusammensetzen der entsprechenden Pfeile addiert werden. Zeigt ein Pfeil von nach und
ein zweiter Pfeil von nach , so wird die Summe der beiden durch einen Pfeil von nach dargestellt.
Zusätzlich müssen wir noch verlangen, dass die Abbildung (1.40) im folgenden Sinne umkehrbar ist. Zu
jedem Punkt und jedem Vektor ( gibt es genau einen Punkt , so dass ( ist. Um
(
einen Vektor als Pfeil darzustellen, können wir einen beliebigen Anfangspunkt wählen. Der Vektor
zeigt dann von dort zu einem eindeutig definierten Punkt . Dadurch ist unter anderem garantiert, dass wir
10
(b)
(a)
(c)
Abbildung 1.3: Vektoren werden in einem affinen Raum durch Pfeile dargestellt, die jeweils zwei Punkte
miteinander verbinden. Zeigt ein Pfeil von nach und ein anderer von nach , so wird die Summe
der beiden Vektoren durch einen Pfeil von nach dargestellt (a). Verschiebt man sowohl den Anfangs , so bleibt der Abstandsals auch den Endpunkt eines Pfeiles jeweils um einen Vektor
der beiden Punkte unverändert (b). Der Abstand zweier Punkte ist durch
vektor gegeben (c).
den Betrag des Abstandsvektors
immer die Vorschrift (1.41) anwenden können, um zwei Pfeile zu addieren. Wir können den Anfangspunkt
des zweiten Pfeiles stets so wählen, dass er mit dem Endpunkt des ersten Pfeiles übereinstimmt.
Wir können diese Eigenschaft eines affinen Raumes auch anders interpretieren. Wir betrachten einen
gibt es dann genau einen Punkt , so
Vektor und halten diesen fest. Zu jedem Punkt dass ist. Folglich definiert der Vektor eine Abbildung des Punktraumes auf sich selbst,
Verschiebung
mit
(1.42)
Diese Abbildung ist eine Verschiebung um den Vektor . Jeder Punkt wird durch den Vektor auf einen
Punkt verschoben.
Eine Verschiebung hat genau die Eigenschaft, die wir am Anfang postuliert haben. Betrachten wir
nämlich den Abstandsvektor zweier beliebiger Punkte, und verschieben beide, wie in Abbil
dung 1.3(b) gezeigt, um einen Vektor , so gilt gemäß der Definition einer Verschiebung für die Bildpunkte
und . Daraus folgt
(1.43)
Der Abstandsvektor wird durch die Verschiebung nicht verändert. Das ist genau die anschauliche Eigenschaft eines Vektors, von der wir ausgegangen sind. Ein Vektor verändert sich nicht, wenn wir ihn im
Raum verschieben. Wir können das wie folgt zusammenfassen:
Ein affiner Raum besteht aus einem Punktraum und einem Vektorraum. Ein Vektor wird
durch einen Pfeil dargestellt und erzeugt eine Verschiebung im Punktraum.
Tatsächlich ist das der Ursprung des Wortes “Vektor”. Es leitet sich aus dem lateinischen vehere (etwas
fahren, transportieren) ab. Ein Vektor transportiert etwas von einem Ort zum anderen. Statt als Pfeil im
Punktraum können wir uns einen Vektor auch als Verschiebung, das heißt als eine Operation auf dem
Punktraum vorstellen. Entscheidend ist dabei, dass ein Vektor eine gerichtete Größe ist. Ein Pfeil zeigt in
eine bestimmte Richtung, genau wie eine Verschiebung.
Eine Größe, die in irgendeiner Weise mit einer Richtung im Raum verknüpft ist, wird stets durch einen
Vektor dargestellt. Im Gegensatz dazu bezeichnet man eine Größe, die nicht gerichtet ist, als Skalar. Daher kommt auch die Bezeichnung “Skalarprodukt” und “skalare Multiplikation”. Eine reelle Zahl ist ein
11
Skalar. Die Bezeichnung leitet sich aus dem Wort Skala ab, da man den Wert eines Skalars an einer Skala
ablesen kann, den Wert eines Vektors jedoch nicht, da es eine gerichtete Größe ist.
Ein gutes Beispiel, um diesen Unterschied deutlich zu machen, ist die Definition des Abstands zweier
Punkte in einem affinen Raum, die in Abbildung 1.3(c) dargestellt ist. Ist der zugeordnete Vektorraum ein metrischer Vektorraum, so ist der Abstand zweier Punkte und im Punktraum durch den
Betrag des Abstandsvektors definiert,
Abstand
(1.44)
Auf diese Weise wird dem Vektor, also der gerichteten Größe , ein Skalar, also eine ungerichtete Größe
zugeordnet. Wenn zum Beispiel zwei verschiedene Punkte und gleich weit von einem Punkt
entfernt sind, so gilt , das heißt die ungerichteten Abstände sind gleich. Die Vektoren
und , also die gerichteten Größen, die neben der Information über den Abstand auch noch die
Richtungsinformation tragen, sind jedoch nicht gleich.
Ein affiner Raum, auf dem auf diese Weise der Abstand zweier Punkte definiert ist, heißt metrischer
affiner Raum, oder auch Euklidischer Raum. Um die Struktur des physikalischen Raumes zu beschreiben, müssen wir nur noch sagen, was die Dimension eines affinen Raumes ist. Sie ist einfach durch die
.
Dimension des zugeordneten Vektorraumes definiert. Es gilt also Aufgabe 1.16 Man zeige, dass sich der Nullvektor und der inverse Vektor wie folgt als Pfeile darstellen
lassen,
! ( (1.45)
"( und dass der Abstand zweier Punkte und genau dann gleich Null ist, wenn ist.
Aufgabe 1.17 Verschiebungen lassen sich wie alle Abbildungen durch Verkettung verkn üpfen. Man zeige, dass die Verknüpfung zweier Verschiebungen wieder eine Verschiebung ist, und dass die Menge aller
Verschiebungen eines affinen Raumes dadurch zu einer abelschen Gruppe wird. Welcher Eigenschaft des
zugeordneten Vektorraumes entspricht das?
Aufgabe 1.18 Man beweise, dass es zu jedem Punkt gibt mit ( .
und zu jedem Vektor ( Aufgabe 1.19 Man beweise die Dreiecksungleichung. Für je drei Punkte affinen Raum gilt
genau einen Punkt
in einem metrischen
(1.46)
Wann gilt das Gleichheitszeichen?
Aufgabe 1.20 Aus der Euklidischen Geometrie kennen wir den Satz des Pythagoras, wonach ein Dreieck
genau dann im Punkt rechtwinklig ist, wenn für die Seitenlängen die Beziehung
mit
(1.47)
gilt. Man zeige, dass dieser Satz auch in einem metrischen affinen Raum gilt, wobei rechte Winkel und
Längen über das Skalarprodukt der entsprechenden Abstandsvektoren definiert sind.
12
Der physikalische Raum
Da wir jetzt wissen, was ein metrischer affiner Raum, also ein Euklidischer Raum ist, und was die Dimension eines affinen Raumes ist, können wir an dieser Stelle unsere erste physikalische Theorie explizit
formulieren. Die Kurzfassung lautet:
Der physikalische Raum hat die Struktur eines dreidimensionalen Euklidischen Raumes.
Wir identifizieren die Orte im physikalischen Raum mit den Punkten eines dreidimensionalen Euklidischen
Raumes, den wir mit
bezeichnen. Jedem Punkt entspricht ein Ort im Raum, den wir ebenfalls
mit bezeichnen. Wir können diese Zurordnung einer physikalischen Struktur zu einer mathematischen
Struktur auch als Messvorschrift verstehen. Wir messen einen Ort, also einen Punkt , indem wir
ihn mit einem Gegenstand markieren.
Damit allein können wir allerdings noch nicht viel anfangen. Wir können jetzt zwar verschiedene Orte
messen, indem wir sie markieren, aber wir können daraus noch keine Aussagen über die Struktur des
Raumes ableiten, die wir experimentell testen können, oder mit deren Hilfe wir Voraussagen über noch
nicht durchgeführte Messungen machen können. Eine Messvorschrift allein für einzelne Punkte reicht
noch nicht aus, um mit der Theorie sinnvolle Aussagen machen zu können.
Wie benötigen noch andere Messvorschriften. Eine Messgröße, die sich dazu anbietet, ist der Abstand
zweier Orte. Mit einem geeigneten Messinstrument, zum Beispiel einem Maßband, auf dem wir eine
Skala angebracht haben, können wir den Abstand zweier Orte und messen. Wir legen das Maßband
zwischen den zuvor markierten Orten an, spannen es, und lesen die Skala an der Stelle und an der Stelle
ab. Dann bilden wir den Betrag der Differenz der beiden Skalenwerte, und nennen das Ergebnis den
Abstand von und .
Das klingt zunächst sehr primitiv, und es ist wohl kaum möglich, auf diese Weise etwa den Abstand von
hier zum Mond zu messen, oder den Durchmesser eines Atoms. Darauf kommt es aber im Moment nicht
an. Entscheidend ist nur, dass wir eine Messvorschrift definiert haben, die zumindest auf bestimmte Paare
von Orten und anwendbar ist, und die im Rahmen einer gewissen Messgenauigkeit ein reproduzierbares Ergebnis liefert.
Damit das Ergebnis reproduzierbar ist, also eine zweite Messung dasselbe Ergebnis liefert, muss die
Skala auf dem Maßband regelmäßig sein. Regelmäßig heißt, dass die Skalenstriche immer den gleichen
Abstand haben. Diese Forderung hört sich zunächst etwas merkwürdig an, weil ja durch das Maßband
die Größe Abstand überhaupt erst definiert wird. Sie ist aber durchaus sinnvoll und lässt sich auch überprüfen, nämlich indem man dieselbe Abstandsmessung mehrmals wiederholt und dabei unterschiedliche
Abschnitte des Maßbandes verwenden. Eine gutes Maßband erkennen wir daran, dass es reproduzierbare
Ergebnisse liefert.
Die so definierte Messgröße bilden wir nun auf eine mathematische Größe ab, die wir in der Theorie
bereits eingeführt haben. Das ist natürlich die Größe mit dem gleichen Namen, also der Abstand ,
der über den Abstandsvektor und dessen Betrag, also das Skalarprodukt definiert ist. Sobald wir diese
Zuordnung einer physikalischen Messgröße zu einer mathematischen Größe vorgenommen haben, wird
unsere Theorie zu einer experimentell überprüfbaren Theorie über die Struktur des Raumes.
Sie macht jetzt nämlich Aussagen über Beziehungen zwischen Messgrößen, die wir durch nachmessen
überprüfen können. Es ist nicht ganz leicht, solche Aussagen zu finden, die nicht ganz trivial sind und
allein auf der Messung von Längen beruhen. Da es aber sehr wichtig ist, zu verstehen, warum genau in
diesem Moment der Übergang von der reinen Mathematik zur Physik stattgefunden hat, wollen wir ein
Beispiel für eine solche Vorhersage ganz explizit vorführen.
Das Experiment sieht wie folgt aus. Wir markieren im Raum fünf verschiedene Orte .
Dann messen wir ein paar Abstände zwischen ihnen und finden zufällig, dass neun davon den gleichen
Wert haben,
13
(1.48)
Das ist natürlich nur eine Annahme, die wir machen, um die Rechnung etwas zu vereinfachen. Im Prinzip
könnten wir auch von neun verschiedene Werten ausgehen. Dann würde die folgende Rechnung jedoch
nur unnötig kompliziert werden.
Den einzigen Abstand, den wir noch nicht gemessen haben, ist . Wir wollen zeigen, dass dieser
durch die Theorie vorhergesagt wird. Wir benötigen dazu nichts weiter als die Definition des Abstandes
über des Skalarprodukt von Vektoren und die Behauptung der Theorie, dass der Raum dreidimensional ist.
Die Herleitung dieser Vorhersage ist ein wenig länger, aber sie ist eine gute Übung für den Umgang mit
Vektoren und Skalarprodukten. Wir definieren zunächst die Vektoren
Wir wissen, dass alle diese Vektoren den Betrag
Außerdem ist " und somit
% " 3 (1.49)
haben,
" 7 5: (1.50)
<: 7
0
(1.51)
Die gleiche Überlegung für jeweils zwei andere Vektoren ergibt
;: ?= : : : =
: : Gesucht ist die Länge des Vektors
7
0
(1.52)
+ (1.53)
Benutzen wir diese Gleichungen, um die “gestrichenen” Vektoren durch die “ungestrichenen” auszudrücken, so lauten die letzten drei Gleichungen von (1.52)
" : " " : " & " : " 7
0
(1.54)
Wenn wir die Klammern ausmultiplizieren und die ersten drei Gleichungen von (1.52) verwenden, so
ergibt sich daraus
: %+ 1
: &
: (1.55)
Die Gleichheit der letzten drei Ausdrücke impliziert,
: : : (1.56)
und zusätzlich bekommen wir folgende Gleichung, wenn wie die drei letzten drei Ausdrücke in (1.55)
addieren,
7 : % (1.57)
Jetzt benutzen wir, dass der Raum dreidimensional ist, und dass die Vektoren eine Basis bilden.
Das ist leicht zu beweisen. Da es sich um drei Vektoren handelt, müssen wir nur zeigen, dass die Vektoren
linear unabhängig sind. Die Gleichung
!
#+.( (1.58)
6 besitzt. Bilden wir auf beiden Seiten nacheinander das Skalardarf also nur die Lösung ( 7
produkt mit , und und teilen das Ergebnis jeweils durch
, so ergeben sich die Gleichungen
7 .(
7 (+
-(7
14
6
( 6 (1.59)
eine Basis, und somit können wir den Vektor
Also ist #-( also Linearkombination schreiben,
(1.60)
Jetzt benutzen wir die Gleichung (1.56). Setzen wir (1.60) dort ein und teilen das ganze wieder durch
so ergibt noch einmal ein ähnliches Gleichungssystem, nämlich
7 .(
7 (+
-(7
( ;
7,
(1.61)
Die Koeffizienten der Linearkombination (1.60) müssen alle gleich sein, also
/+ (1.62)
Um die Zahl zu bestimmen, benutzen wir die Gleichung (1.57). Sie lautet nun
also 6 oder 7
somit . Also ist
% + 7 *% . Den ersten Fall können wir ausschließen, denn dann wäre 7
(1.63)
! und
(1.64)
Um die Länge dieses Vektors zu berechnen, benötigen wir nur noch das Skalarprodukt
+ 7 <: 7 : 7 : (1.65)
7
7 Offenbar behauptet die Theorie, der Abstand sei genau um den Faktor Wir finden also
(1.66)
größer als die Abstände
(1.48). Die Theorie macht also eine Vorhersage über eine Messung, die wir noch nicht durchgeführt haben.
Wenn wir das vorhergesagte Messergebnis tatsächlich in der Realität finden, dann bestätigt das die
Richtigkeit der Theorie. Wie wir bereits aus unserer alltäglichen Erfahrung wissen, ist das der Fall. Alle
Experimente dieser Art bestätigen die Euklidische Geometrie. Sonst würden wir sie hier nicht als Theorie
über die Struktur des Raumes einführen. Auf ihr beruhen alle Landkarten, Baukonstruktionen, mechanischen Geräte und letztlich überhaupt alle Anwendungen der klassischen Physik. Die Euklidische Geometrie beschreibt die Verhältnisse im physikalischen Raum richtig, jedenfalls im Rahmen einer gewissen
Messgenauigkeit.
Es könnte aber auch sein, dass wir ein ganz anderes Messergebnis finden. Um das Konzept einer physikalischen Theorie zu verstehen, sollte man sich deshalb klar machen, dass es keinerlei “vernünftigen”,
also rein logischen oder mathematischen Grund gibt, warum die Messung des Abstandes den Wert
liefern soll. Es handelt sich um eine Messung, die von den anderen neun durchgeführten Abstandsmessungen völlig unabhängig ist.
Und tatsächlich, wenn man genau genug misst, stellt man fest, dass der Faktor gar nicht genau
ist. Allerdings muss man schon sehr genau hinschauen. Die Abweichung von der Euklidischen Geometrie,
die man bei Abstandsmessungen dieser Art im irdischen Bereich findet, beträgt etwa ein milliardstel. Das
heißt für unser Experiment, dass eine Messung der Strecke erst dann eine Abweichung von
ergeben würde, wenn wir alle Abstände bis auf mindestens zehn Stellen genau messen würden.
Man stellt also bei genauerem Hinsehen fast, dass die Euklidische Geometrie doch nicht die richtige Beschreibung der Struktur des Raumes ist. Sie liefert eine sehr gute Näherung, aber keine exakte Beschreibung. Für unsere Zwecke ist diese Näherung aber gut genug. Solange wir keine wirklich fundamentale
15
physikalische Theorie gefunden haben, was vielleicht nie der Fall sein wird, können wir von einer physikalischen Theorie ohnehin nur erwarten, dass die sie Natur innerhalb einer gewissen Näherung möglichst
gut beschreibt.
Die klassischen physikalischen Theorien haben also schon allein deshalb einen beschränkten Gültigkeitsbereich, weil sie auf der Euklidischen Geometrie des Raumes aufbauen. Will man zu einer genaueren
Beschreibung übergehen, so muss man zur Beschreibung der Struktur des Raumes die allgemeine Relativitätstheorie heranziehen, die die Euklidische Geometrie durch eine Verallgemeinerung, die Riemannsche
Geometrie ersetzt. Aber darauf können wir hier aus verständlichen Gründen nicht näher eingehen können.
Das würde weit über das eigentliche Thema hinaus führen.
Es sei nur noch angemerkt, dass zwar so gut wie alle “alltäglichen” physikalischen Anwendungen mit
der Euklidischen Geometrie als Beschreibung des Raumes auskommen, dass es jedoch inzwischen eine
bekannte und sehr nützliche Anwendung gibt, die in unser tägliches Leben vorgedrungen ist, und die nicht
mehr mit dieser Beschreibung des Raumes auskommt. Das ist das Global Positioning System “GPS”. Ein
GPS-Gerät bestimmt seinen Ort durch Abstandsmessungen zu anderen, bekannten Orten, nämlich denen
von Satelliten, die ihre Umwelt ununterbrochen darüber informieren, wo sie sich gerade befinden.
Um seinen Standort zu bestimmen, muss ein solches Gerät Rechnungen ausführen, die im wesentlichen
genau von der Art sind, wie wir sie gerade durchgeführt haben. Würde man diesen Rechnungen jedoch
die Euklidische Geometrie zugrunde legen, so würde man feststellen, dass immer wieder Fehler auftreten,
die sich nur dadurch erklären lassen, dass die Euklidische Theorie die Struktur des Raumes nicht richtig
beschreibt. Erst eine Berechnung mit Hilfe der allgemeinen Relativitätstheorie und der Riemannschen
Geometrie liefert ein Ergebnis mit ausreichender Genauigkeit.
Aufgabe 1.21 Bei einem anderen Experiment der gleichen Art wie oben findet man die folgenden
Abstände von fünf paarweise verschiedenen Punkten ,
7 (1.67)
Man bestimme . Warum sind mindestens fünf Punkte nötig, um eine solche Vorhersage für eine Abstandsmessung zu machen? Wieviele Punkte wären nötig, wenn der Raum vierdimensional wäre?
Aufgabe 1.22 Wie kann man allein durch Abstandsmessungen feststellen, ob drei Punkte angeordnet sind, dass gilt. Was bedeutet das anschaulich?
so
Koordinatensysteme
Im Prinzip reicht eine Messvorschrift für Abstände zwischen Punkten vollkommen aus, um sämtliche
Aussagen der Euklidischen Geometrie experimentell zu überprüfen und darauf andere Theorien wie die
klassische Mechanik aufzubauen. Wie wir gerade an einem relativ einfachen Beispiel gesehen haben,
erfordert das aber recht komplizierte Rechnungen, wenn wir konkrete Beobachtungen und Experimente
beschreiben wollen.
Um das Rechnen mit Punkten und ihren Abständen zu erleichtern, führen wir ein Koordinatensystem
ein. Ein Koordinatensystem in einem affinen Raum ist das Analogon zu einer Basis in einem Vektorraum.
Es ermöglicht, das formale Rechnen mit Punkten und Vektoren auf das konkrete Rechnen mit Zahlen
zurückzuführen, und zwar in einer sehr viel einfacheren Weise als wir dies gerade getan haben. Wir werden
ein Koordinatensystem zuerst als mathematisches Konzept einführen, und anschließend zeigen, und wie
man es durch eine Messvorschrift im physikalischen Raum realisieren kann.
Die Konstruktion eines Koordinatensystems ist in Abbildung 1.4(a) dargestellt. Der erste Schritt besteht
als Bezugspunkt oder Ursprung des Koordinatensystems festzulegen. Durch die
darin, einen Ort 16
(b)
(a)
Abbildung 1.4: Ein kartesisches Koordinatensystem im dreidimensionalen Raum wird durch einen Ur
sprung und eine Orthonormalbasis festgelegt (a). Die Koordinaten eines Punktes
orthogonal auf die Koordinatenachsen projiziert. Der
findet man, indem man den Ortsvektor Abstand zweier Punkte und ergibt sich aus der Summe der Quadrate der Seitenlängen des von und
aufgespannten Koordinatenquaders (b).
Auswahl des Bezugspunktes wird jedem Ort ein Ortsvektor zugeordnet. Umgekehrt
bestimmt jeder Ortsvektor genau einen Ort mit . Die Zuordnung eines Ortes
zu seinem Ortsvektor ist also bijektiv. Der Ortsvektor gibt an, wie weit und in welche
Richtung wir den Ursprung verschieben müssen, um zum Ort zu gelangen.
Im zweiten Schritt führen wir eine Orthonormalbasis im Vektorraum ein. Es ist üblich, die Basisvektoren im physikalischen Raum mit zu bezeichnen. Der Index , der die Basisvektoren durchnummeriert, läuft also von nun an über die Indexmenge 4 $ . An den formalen Beziehungen
zwischen den Basisvektoren und den Komponenten von Vektoren ändert das nichts, weil wir die Indexmenge ohnehin nie explizit ausgeschrieben haben. Nur die Dimension des Vektorraumes ist jetzt immer
gleich .
Der Ortsvektor eines Punktes kann nun in seine Komponenten zerlegt werden,
Ortsvektor
(1.68)
Auf diese Weise wird jedem Punkt ein Satz von Koordinaten zugeordnet. Umgekehrt wird
jeder Punkt wird eindeutig durch seine Koordinaten identifiziert.
Wie in Abbildung 1.4(a) gezeigt, finden wir den Punkt mit den Koordinaten , indem wir
den Ursprung zuerst um in Richtung des Vektors , dann um in Richtung des Vektors , und
schließlich um in Richtung des Vektors verschieben. Die Strecken, die wir dabei zurücklegen, bilden
die Kanten eines Koordinatenquaders. Je nachdem, in welcher Reihenfolge wir dieser Verschiebungen
durchführen, durchlaufen wir verschiedene Kanten dieses Quaders.
Die so definierte bijektive Abbildung
kartesische
Koordinaten
17
mit
(1.69)
die jedem Punkt umkehrbar eindeutig seine Koordinaten zuordnet, heißt kartesisches Koordinatensystem.
Ein kartesisches Koordinatensystem wird durch einen Ursprung und eine Orthonor
malbasis von definiert. Es ordnet jedem Punkt umkehrbar eindeutig einen
Satz von Koordinaten zu.
Ein kartesisches Koordinatensystem hat die folgenden nützlichen Eigenschaften. Um den Abstandsvektor
zweier Punkte zu bestimmen, müssen wir nur die Differenzen ihrer Koordinaten bilden. Seien nämlich
zwei beliebige Punkte, und ihre Ortsvektoren und bzw. deren
Komponenten, also die Koordinaten von und , so gilt für den Abstandsvektor
"
" $
" (1.70)
Außerdem können wir sehr leicht den Abstand zweier Punkte berechnen. Aus (1.70) und (1.36) folgt
nämlich
" " " " (1.71)
Das ist die dreidimensionale Verallgemeinerung des Satzes des Pythagoras. Um den Abstand zweier Punkte zu ermitteln, betrachten wir den in Abbildung 1.4(b) dargestellten Koordinatenquader, dessen gegenüber
liegende Eckpunkte die Punkte und sind, und dessen Kanten in die Richtungen der Koordinatenachsen
zeigen. Das Quadrat der Länge der Diagonalen ist dann durch die Summe der Quadrate der Kantenlängen
gegeben.
Da die Bestimmung des Abstandsvektors und das Abstandes die einzigen “Rechenoperationen” sind,
die wir mit Punkten durchführen können, haben wir haben damit auch das formale Rechnen mit Punkten
in einem affinen Raum auf des konkrete Rechnen mit Zahlen, also mit Koordinaten und Komponenten
zurückgeführt. Allerdings müssen wir beachten, dass die Wahl eines kartesischen Koordinatensystems
stets willkürlich ist. Wenn wir mit Koordinaten von Punkten und Komponenten von Vektoren rechnen,
müssen wir stets mit angeben, bezügliche welchen Koordinatensystems diese definiert sind.
Der Grund dafür ist, dass der physikalische Raum symmetrisch ist. Es gibt in ihm keinen irgendwie
ausgezeichneten Punkt, also auch
keine bevorzugte Wahl eines Ursprungs für ein Koordinatensystem.
homogen ist. Das bedeutet, dass alle Punkte in ihm gleichberechtigt
Wir sagen auch, dass der Raum
sind. Der Raum sieht überall gleich aus, ist also symmetrisch unter Verschiebungen. Dasselbe gilt für
die Orthonormalbasen. Es gibt keine besonders ausgezeichnete Basis des Vektorraumes . Der Raum ist
auch isotrop, das heißt er sieht in alle Richtungen gleich aus. Wir können eine Orthonormalbasis beliebig
drehen. Solange die Basisvektoren zueinander senkrecht stehen und Einheitsvektoren sind, können wir
eine Orthonormalbasis prinzipiell nicht von einer anderen unterscheiden.
Das hat gewisse Vor- und Nachteile. Ein großer Vorteil dieser Freiheit der Wahl des Koordinatensystems besteht darin, dass wir, vor ein ganz spezielles physikalisches Problem gestellt, das Koordinatensystem dem Problem anpassen können. Wir können den Ursprung und die Basis so wählen, dass das
Problem möglichst einfach formuliert und möglicherweise gelöst werden kann. Davon werden wir später
sehr häufig Gebrauch machen.
Ein Nachteil ist allerdings, dass wir, wenn wir allgemeine Gesetzmäßigkeiten finden und formulieren
wollen, stets darauf achten müssen, dass diese Gesetzmäßigkeiten nicht davon abhängen, welches Koordinatensystem wir wählen, um sie zu beschreiben. Das ist auch der Grund, warum wir in der Physik
benötigen. Durch ein Koordinatenüberhaupt das abstrakte Konzept eines metrischen affinen Raumes
system wird dieser, wie wir gesehen haben, mit dem Raum identifiziert. Also könnten wir doch gleich
sagen, dass der physikalische Raum die Struktur des hat, statt den Umweg über einen affinen Raum zu
machen. Das käme der Auswahl eines festen, ein für alle Mal fixierten Koordinatensystems gleich.
18
(a)
(b)
Abbildung 1.5: Der Übergang von einem kartesischen Koordinatensystem (a) zu einem anderen Koordinatensystem (b) setzt sich aus einer Verschiebung des Ursprungs und einer Drehung der Basisvektoren
zusammen.
Mit einer solchen Festlegung würden wir jedoch die Symmetrien des Raumes nicht mehr in seiner
Beschreibung wiederfinden. Denn es gäbe dann einen ausgezeichneten Punkt im Raum, nämlich den Ursprung dieses Koordinatensystems, und es gäbe auch ausgezeichnete Richtungen, nämlich die der ausgewählten Basisvektoren. In einer solchen Beschreibung würden wir wichtige Eigenschaften einer physikalischen Theorie, nämlich ihre Symmetrien, nicht mehr oder jedenfalls nur noch schwer erkennen.
Symmetrien, und dazu gehören unter anderem die Symmetrien des Raumes unter Drehungen und Verschiebungen, sind jedoch ein ganz entscheidendes Kriterium, um physikalische Theorien zu klassifizieren
und um deren Konsistenz zu prüfen.
Tatsächlich bauen fast alle modernen physikalischen Theorien auf sehr fundamentalen solchen Symmetrieprinzipien auf. Wir werden uns daher später sehr ausführlich mit der Frage beschäftigen, was genau
passiert, wenn wir von einem Koordinatensystem zu einem anderen übergehen, und wie sich physikalische
Gesetzmäßigkeiten dabei verhalten. Für den Anfang genügt es jedoch, immer nur ein, zwar willkürlich
gewähltes, aber festes kartesisches Koordinatensystem zu verwenden, um den physikalischen Raum damit
zu erfassen.
Die einzige zusätzliche Forderung, die wir noch an das Koordinatensystem stellen können, ist, dass es
eine positive Orientierung hat. Das bedeutet folgendes. Wenn wir die Basisvektoren , und betrachten, so zeigen diese Vektoren in der gegebenen Reihenfolge in die Richtungen des ausgestreckten
Daumens, des ausgestreckten Zeigefingers und des angewinkelten Mittelfingers der rechten Hand. Allgemein bezeichnen wir einen Satz von drei linear unabhängigen Vektoren, die diese Rechte-Hand-Regel
erfüllen, als Rechtsystem.
Wir haben dann immer noch die Freiheit, die Basisvektoren beliebig im Raum zu drehen, aber wir
können sie nicht mehr spiegeln. Würden wir zum Beispiel den Vektor durch "+ ersetzen, das Koordinatensystem also an der 4 - -Ebene spiegeln, so würden die drei Basisvektoren hinterher ein Linkssystem
bilden. Das gespiegelte Koordinatensystem hätte eine negative Orientierung. Das wollen wir im folgenden
ausschließen. Die Beschränkung auf positive orientierte Koordinatensysteme ist nützlich, da sie an vielen
Stellen eine Fallunterscheidung unnötig macht. Wo genau, werden wir im nächsten Kapitel sehen.
Aufgabe 1.23 Es sei
ein Punkt und
der um den Vektor
19
verschobene Punkt. Wie
hängen die Koordinaten von mit den Koordinaten Aufgabe 1.24 Es seien drei Punkte Koordinatensystem gilt
von zusammen?
gegeben, so dass für deren Ortsvektoren in einem kartesischen
4 Welche Bedingung ist an die Zahlen 4 (1.72)
zu stellen, damit das Dreieck gleichseitig ist? Wann
ist es rechtwinklig?
Aufgabe 1.25 In Abbildung 1.5 sind zwei kartesische Koordinatensysteme dargestellt. Das “ungestrichene” Koordinatensystem wird durch einen Ursprung und eine Basis festgelegt, das “gestrichene”
Koordinatensystem durch einen Ursprung
und eine Basis . Der Ursprung
ergibt sich aus
durch Verschiebung um einen Vektor
. Die Basis ergibt sich aus der Basis durch eine
Drehung, die durch eine Übergangsmatrix beschrieben wird. Es gilt
(1.73)
Alle Indizes nehmen jeweils die Werte 4 an. Warum existiert eine solche Übergangsmatrix immer? Welche Bedingung muss die Übergangsmatrix erfüllen, wenn mit auch eine Or thonormalbasis sein soll? Wie hängen die Koordinaten eines Punktes im gestrichenen Koordinatensystem mit den Koordinaten desselben Punktes im ungestrichenen Koordinatensystem zusammen?
Koordinaten als Messgrößen
Jetzt müssen wir nur noch eine Messvorschrift angeben, mit deren Hilfe wir die Koordinaten eines Punktes ermitteln, oder umgekehrt zu einem gegebenen Satz von Koordinaten den entsprechenden Punkt finden
können. Dann können wir sämtliche Experimente und Beobachtungen, die wir im physikalischen Raum
machen, mit Hilfe eines Koordinatensystems beschreiben und entsprechende Berechnungen durchführen.
Da fast alle folgenden Überlegungen auf dieser Konstruktion von kartesischen Koordinaten beruhen, werden wir noch einmal sehr sorgfältig vorgehen und zeigen, dass sich alle Messvorschriften, die wir dazu
benötigen, letztlich auf Längenmessungen zurückführen lassen.
Wir beginnen damit, ein Koordinatensystem im physikalischen Raum überhaupt zu definieren. Dazu
müssen wir zuerst einen Ursprung festlegen. Das tun wir wie üblich, indem wie den Ort mit einem
Gegenstand markieren. Anschließend müssen wir die Basisvektoren einführen. Da es sich dabei um Einheitsvektoren handelt, genügt es, deren Richtungen festzulegen. Wir tun dies, indem wir drei
voneinander und von verschiedene Punkte , und markieren, die auf den Koordinatenachsen liegen
sollen, also von aus in den Richtungen der Basisvektoren. Für diese gilt dann
(1.74)
das heißt sie sind durch die Punkte , , und eindeutig bestimmt.
Wir können die Punkte , und aber nicht beliebig wählen, sondern müssen dafür sorgen, dass
die Basisvektoren zueinander senkrecht stehen. Eine Messvorschrift für rechte Winkel ergibt sich aus dem
Satz des Pythagoras, den wir in Aufgabe 1.20 bewiesen haben. Die drei Vektoren (1.74) sind genau dann
zueinander senkrecht, wenn die Dreiecke , und jeweils im Punkt rechtwinklig sind.
Das wiederum ist genau dann der Fall, wenn für die Seitenlängen dieser Dreiecke die Beziehungen
20
(1.75)
gelten. Wir können also allein durch Abstandsmessungen feststellen, ob drei Vektoren , und ,
und damit auch die Basisvektoren (1.74) zueinander senkrecht stehen.
Damit haben wir das Koordinatensystem definiert, indem wir vier verschiedene Punkte , , und
markiert haben, die die Eigenschaften (1.75) haben. Aber wie finden wir jetzt zu einem gegebenen
Punkt die Koordinaten , oder umgekehrt zu einem Satz von Koordinaten den
entsprechenden Punkt?
Auch das können wir auf Abstandsmessungen zurückführen. Es sei irgendein markierter Ort. Wir
messen zunächst die Abstände der Punkte , und von . Das mussten wir ja bereits tun, um die
Orthogonalität der Basisvektoren zu prüfen. Wir bezeichnen diese Abstände mit 4 , und
. Es gilt dann für die Ortsvektoren der Punkte , und 4
(1.76)
was sich auch unmittelbar aus (1.74) ergibt. Nun sei irgendein Punkt, dessen Koordinaten wir messen
wollen. Was wir unmittelbar messen können, sind die Abstände , also die Länge des Ortsvektors
und . Betrachten wir zunächst nur den Abstand . Für
, sowie die Abstände , ihn gilt
" 4 " 4 " 7 4 +: (1.77)
Offenbar können wir aus den Messgrößen , und 4 das Skalarprodukt : bestimmen. Nun wissen wir aber aus (1.39), dass dies genau die gesuchte Komponenten des Ortsvektors
ist, und damit die 4 -Koordinate des Punktes . Es gilt also
:
" 7 Die anderen Koordinaten können wir bestimmen, indem wir den Punkt ersetzen,
" +: 7 und dann durch den Punkt ,
:
" 7 (1.78)
zuerst durch den Punkt (1.79)
(1.80)
Damit haben wir gezeigt, dass wir allein durch Abstandsmessungen die Koordinaten eines Punktes bezüglich eines vorher festgelegten Koordinatensystems ermitteln können.
Das werden wir in Zukunft natürlich nicht mehr in dieser ausführlichen Art und Weise beschreiben. Wir
gehen ab jetzt einfach davon aus, dass es möglich ist, die Koordinaten eines Ortes bezüglich eines gegebenen Koordinatensystems irgendwie zu ermitteln. In der Praxis wird man dazu oft ganz andere Methoden
verwenden als die hier beschriebene. Das gilt insbesondere dann, wenn wir gar nicht mit Abstandsmessungen arbeiten können, etwa um die Koordinaten eines Planeten im Sonnensystem oder eines Sterns in
der Milchstraße zu bestimmen.
Die gezeigte Methode ist also weniger als eine praktische Anleitung zur Bestimmung von Koordinaten
zu verstehen, sondern vielmehr als ein Beispiel dafür, wie man aus fundamentalen Messgrößen, die in
einer Theorie definiert sind, Messvorschriften für andere Größen ableiten kann. Die fundamentale Messgröße war hier der Abstand von zwei Orten, den wir über das Maßband als Messgerät definiert haben, und
die abgeleiteten Größen waren die Koordinaten eines Punktes bezüglich eines vorgegebenen Koordinatensystems.
21
Aufgabe 1.26 Wieviele Freiheiten haben wir bei der Wahl eines kartesischen Koordinatensystems? Mit
anderen Worten, wieviele durch reelle Zahlen darstellbare Parameter m üssen wir unabhängig voneinander
wählen, um ein kartesisches Koordinatensystem im dreidimensionalen Raum eindeutig festzulegen?
Aufgabe 1.27 Wir betrachten noch einem das Experiment mit den f ünf Punkten ? im Raum,
deren Abstände (1.48) gemessen wurden. Man wähle ein Koordinatensystem, das diesem Problem angepasst ist, bestimme aus den bekannten Abständen schrittweise die Koordinaten der einzelnen Punkte, und
berechne schließlich aus den Koordinaten der Punkte und deren Abstand.
Physikalische Dimensionen
Einen wichtigen Aspekt einer physikalischen Theorie haben wir bis jetzt ignoriert. Als wir die Messgröße
“Abstand” eingeführt haben, haben wir dies mit Hilfe eines Maßbandes getan, auf dem wir eine Skala
angebracht haben. Die Wahl dieser Skala, also der Abstand der einzelnen Striche, ist natürlich willkürlich.
Um Abstände zu messen, müssen wir eine Längeneinheit festlegen. Zum Beispiel können wir das Maßband in Meter und Zentimeter einteilen. Dann ist dies die Einheit, in der Abstände gemessen werden. Wir
schreiben dafür
0 m
(1.81)
Die Einheit Meter war ursprünglich als der zehnmillionste Teil der Länge des durch Paris verlaufenden
Meridians vom Nordpol zum Äquator definiert. Es ist daher kein Zufall, dass die Erdumfang ziemlich
genau 6 6 6 6 km beträgt. Seit etwa 1890 gibt es das Urmeter, einen Platin-Iridium-Stab, der in einem
Tresor in Paris aufbewahrt wird, und der seit dem die Längeeinheit Meter definiert hat. Heute ist man
zu einer wesentlich genaueren und zudem überall reproduzierbaren Definition übergegangen. Das Meter
ist ein bestimmtes Vielfaches der Wellenlänge einer Spektrallinie eines Krypton-Atoms festgelegt wird.
Wie man auf diese Weise eine Längeneinheit definieren kann, werden wir allerdings erst im Rahmen der
Quantenmechanik verstehen.
Aber darauf kommt es uns hier gar nicht an. Die theoretische Physik interessiert sich gar nicht dafür,
wie genau eine Maßeinheit definiert ist. Entscheidend ist nur, dass die Wahl einer Einheit grundsätzlich
willkürlich ist. Wenn wir den Wert eine physikalischen Größe angeben wollen, müssen wir uns stets auf
eine Einheit beziehen. Das hat zur Folge, dass es verschiedene Gr ößenarten gibt, die in verschiedenen
Einheiten gemessen werden, und die wir folglich nicht miteinander vergleichen können. Der Abstand
zweier Punkte definiert eine Größenart, die wir Länge nennen. Später werden wir andere Größenarten wir
Zeit und Masse einführen, für die wir auch jeweils eine Einheit willkürlich festlegen müssen.
Eine andere gebräuchlich Sprechweise ist zu sagen, dass der Abstand zweier Orte die physikalische
Dimension einer Länge hat. Wir bringen damit zum Ausdruck, dass es sich um eine Größe handelt, die in
einer willkürlich festgelegten Einheit für die Größenart Länge gemessen wird. Dieser Begriff der physikalischen Dimension hat natürlich nichts mit der Dimension eines Vektorraumes zu tun. Die Wortwahl ist
daher vielleicht etwas ungeschickt. Aber sie ist so üblich, und wir werden sie daher auch verwenden. Es
gibt also in einer physikalischen Theorie Größen verschiedener Dimensionen, oder verschiedene Größenarten.
Was heißt das genau? Wie wir gesehen haben, macht eine Theorie Vorhersagen über Messergebnisse,
wenn wir vorher andere Messungen durchgeführt haben. Ein Beispiel für eine solche Vorhersage, die
die Euklidische Geometrie über Abstandsmessungen macht, haben wir weiter oben relativ ausführlich
diskutiert. Wir haben gezeigt, dass wir aus der Messung von neun Abständen das Ergebnis einer zehnten
Abstandsmessung vorhersagen konnten. Konkret sah das so aus, dass aus den neun Messergebnissen, von
denen wir der Einfachheit angenommen hatten, dass alle den gleichen Wert ergaben, der Wert
für das zehnte Messergebnis folgte.
Betrachten wir die Euklidischen Geometrie als mathematische Theorie, so ist der Abstand zweier
ist auch eine reelle Zahl, und folglich ist auch das
Punkte ein Skalar, also eine reelle Zahl. Der Faktor
22
Produkt
eine reelle Zahl. Wenn wir diese Größen aber tatsächlich messen, dann lesen wir an der
Skala unseres Messgerätes gar keine reellen Zahlen ab, sondern jeweils eine Länge, also eine physikalische
Größe, die ein Einheit trägt. Wir nennen eine solche Größe auch dimensionsbehaftet.
Nehmen wir an, die neun gemessenen Abstände hätten einen Wert von, sagen wir, 0 m. Daraus
würde folgen, dass die zehnte Messgröße den Wert 7 m hat. Was wäre, wenn die Theorie für die zehnte
Messgröße den Wert 7
statt
vorhergesagt hätte, also 6 m ? Das kann offenbar nicht sein. Diese
vorhergesagte Größe wäre nicht von der richtigen Größenart, hätte also nicht die richtige physikalische
Dimension. Es wäre keine Länge, sondern eine Fläche, also eine Länge zum Quadrat. Würde eine Theorie
eine solche Vorhersage machen, wäre etwas an ihr falsch.
Wir müssen an eine physikalische Theorie eine Konsistenzbedingung stellen, die über die reine mathematische Konsistenz hinaus geht. Es muss möglich sein, allen darin vorkommenden Größen physikalische
Dimensionen zuzuordnen, also ihre Größenart zu bestimmen, so dass alle Messgrößen, also diejenigen
Größen, die unmittelbar experimentell zugänglich sind, die richtigen Einheiten bekommen. Wenn eine
Theorie etwas über eine Messgröße aussagt, die in Meter gemessen wird, dann muss der vorhergesagte
Wert die Dimension einer Länge haben. Sonst ist die Theorie inkonsistent.
Wie sieht das konkret aus? Zunächst müssen wir wissen, wie sich dimensionsbehaftete Größen, also
solche mit Einheiten, überhaupt verhalten, wenn wir sie miteinander verknüpfen. Denn letztlich beruht
eine Theorie ja darauf, verschiedene Größen irgendwie miteinander zu verknüpfen. Für das Rechnen mit
physikalischen Einheiten gilt eine einfache Regel.
Physikalische Einheiten verhalten sich formal wie skalare Faktoren.
Mit anderen Worten, sie verhalten sich so, als wären es reelle Zahlen in einem Produkt. Daraus folgt, dass
wir physikalische Größen nur nach ganz bestimmten Kombinationsregeln miteinander verknüpfen können.
Wir können sie genau dann addieren oder miteinander vergleichen, wenn sie die gleiche Einheit tragen,
also die gleiche physikalische Dimension haben. Außerdem können wir physikalische Größen beliebig
miteinander multiplizieren, wobei sich die Einheiten ebenfalls multiplikativ verhalten. Und schließlich
können wir, als eine Verallgemeinerung dieser Multiplikationsregel, eine physikalische Größe in eine beliebige Potenz erheben, die nicht unbedingt positiv und ganzzahlig sein muss.
Aufgabe 1.28 Man mache sich klar, dass diese Kombinationsregeln auch auf Vektoren anwendbar sind.
Insbesondere gilt die Multiplikationsregel auch für die skalare Multiplikation und das Skalarprodukt.
Die Einteilung von physikalischen Größen in Größenarten ist unabhängig davon, ob es sich um Skalare
oder Vektoren handelt. Der Abstand zweier Punkt ist ein Skalar, der die Dimension einer Länge hat.
Welche physikalische Dimension hat der Abstandsvektor ? Er hängt über die Beziehung
:
(1.82)
mit dem Abstand zusammen. Auf der linken Seite dieser Gleichung steht eine Größe der Dimension Länge
zum Quadrat. Also muss auch auf der rechten Seite eine Größe dieser Art stehen. Da sich Einheiten wie
skalare Faktoren verhalten, folgt daraus, dass auch der Abstandsvektor die Dimension einer Länge haben muss. Nur dann ergibt das Skalarprodukt dieses Vektors mit sich selbst eine Größe, die die Dimension
einer Länge zum Quadrat hat.
Etwas vereinfacht können wir sagen, dass auch der Vektor in Meter gemessen wird,
0 m
(1.83)
Allerdings ist dieser Formulierung ein wenig ungenau. Erstens können wir einen Vektor gar nicht messen,
denn wir haben dafür gar keine Messvorschrift. Und zweitens können wir den Wert dieser Größe auch
23
nicht in der Form “ 0 m” oder so ähnlich angeben. Es handelt sich ja um einen gerichteten Vektor, und
nicht um eine ungerichtete, skalare Größe.
Trotzdem ist es sinnvoll, sich vorzustellen, dass der Vektor irgendwo versteckt die Einheit Meter
trägt. So ist die Gleichung (1.83) zu verstehen. Der Vektor hat die Dimension einer Länge, weil es
sich um einen Abstandsvektor zweier Punkte handelt. Unmittelbar messen können wir jedoch nur seinen Betrag, und der hat stets dieselbe physikalische Dimension wie der Vektor selbst. Die Einteilung von
physikalischen Größen in verschiedene Größenarten hat also nichts damit zu tun, ob wir diese Größen unmittelbar messen können oder nicht. Sie ergibt sich aus den mathematischen Zusammenhängen zwischen
den einzelnen Größen, sobald eine dieser Größen eine Messgröße ist.
Deshalb verstehen wir unter dem “Betrag” eines Vektors auch etwas anderes als unter der “Länge”. Der
Betrag ist ein mathematisches Konzept, das jedem Vektor eine skalare Größe zuordnet. Um eine Länge
handelt es sich aber dabei nur, wenn der Vektor ein Abstandsvektor ist, also die Dimension einer Länge
hat. Im nächsten Kapitel werden wir sehen, dass es auch Vektoren gibt, die die Dimension einer Fläche
haben. Ihr Betrag ist dann eine Fläche und keine Länge.
Ein anderes Beispiel für einen Vektor, der nicht die Dimension einer Länge hat, kennen wir bereits.
Betrachten wir den Einheitsvektor, den wir bilden, indem wir einen Abstandsvektor durch seinen Betrag
. Um welche Größenart handelt es sich dabei? Da wir eine Größe der Dimension
teilen, also Länge durch eine andere Länge teilen, kürzen sich die Einheiten weg und wir bekommen eine dimensionslose Größe. Eine dimensionslose Größe ist eine, die quasi zufällig keine Einheit hat, weil sich alle
Einheiten wegkürzen,
0 m
0 (1.84)
0 m
Ein Einheitsvektor trägt also keine physikalische Einheit und ist daher dimensionslos. Das ergibt sich auch
0 ist, und nicht 0 m oder 0 m .
aus der Definition, wonach
Daraus folgt insbesondere, dass ein Einheitsvektor nicht als Abstandsvektor zweier Punkte dargestellt
werden kann. Es gibt keine zwei Punkte im Raum, die den Abstand 0 haben, weil 0 eben keine Länge
sondern eine dimensionslose Größe ist. Wenn wir uns einen Einheitsvektor anschaulich vorstellen wollen,
sollten wir daher nicht das Bild eines Pfeiles im Auge haben, der zwei Punkte verbindet, sondern wir
sollten uns vorstellen, dass durch einen solchen Vektor wirklich nur eine Richtung, aber keine Länge
definiert wird.
Wie sehen also, dass die Einführung einer einzigen Messvorschrift, die mit der willkürlichen Festlegung einer Einheit verbunden ist, allen in der Theorie vorkommenden Größen bestimmte physikalische
Dimensionen zuordnet. Sie ergeben sich durch die mathematischen Beziehungen der Messgröße zu allen
anderen Größen. Als ganzes ist eine physikalische Theorie nur dann konsistent, wenn diese Zuordnung
von physikalischen Dimensionen zu den darin vorkommenden Größen mit den Kombinationsregeln für
dimensionsbehaftete Größen verträglich ist.
Aufgabe 1.29 Dass ein Einheitsvektor eine Richtung, aber keine L änge hat, kann man sich anhand der
orthogonalen Zerlegung eines Vektors in Abbildung 1.2 klar machen. Nehmen wir an, der dort gezeigte
Vektor hätte die Dimension einer Länge. Welche physikalischen Dimensionen haben dann die anderen
dargestellten Größen , , ;: und ? Der Einheitsvektor wird in der Abbildung zwar durch einen
Pfeil dargestellt, der eine bestimmte Länge hat. Man mache sich aber klar, dass die dargestellte Länge
dieses Pfeiles keinerlei Auswirkungen auf die anderen Vektoren hat. Nur die Richtung des Pfeiles ist relevant.
Aufgabe 1.30 Welche physikalischen Dimensionen haben die Basisvektoren , und die Koordinaten eines Punktes bezüglich eines kartesischen Koordinatensystems? Man überprüfe alle
Beziehungen, in denen diese Komponenten vorkommen, auf ihre Konsistenz, also die Vertr äglichkeit mit
24
den Kombinationsregeln, insbesondere die Gleichungen (1.68) und (1.71) f ür den Ortsvektor und den Abstand im physikalischen Raum, sowie die Darstellungen (1.78–1.80) der Koordinaten als Messgr ößen.
Aufgabe 1.31 Warum ist es nicht sinnvoll, den Punkten , also den Orten im Raum irgendeine physikalische Dimension zuzuordnen, obwohl wir doch auch f ür sei eine Messvorschrift angegeben
haben?
Aufgabe 1.32 Es seien 4 und zwei physikalische Größen, die über die Beziehung menhängen. Warum müssen beide Größen dimensionslos sein?
zusam-
2 Euklidische Geometrie
Bisher haben wir als einzige Messgröße den Abstand zwischen zwei Punkten im Raum definiert. Wir
können aber noch andere geometrische Objekte einführen und Messgrößen mit ihren assoziieren. Das
sind zum Beispiel Geraden, Ebenen, allgemeine Kurven und Flächen, sowie Kreise und Winkel. In der
traditionellen Formulierung der Euklidischen Geometrie werden diese Objekte axiomatisch definiert. In
diesem Kapitel wollen wir zeigen, wie sie sich aus der Vektorraumstruktur und insbesondere aus dem
Skalarprodukt ableiten lassen.
Unterräume
Die einfachsten geometrischen Objekte, die wir in jedem affinen Raum einführen können, sind die affinen
Unterräume. Sie repräsentieren Punkte, Geraden, Ebenen und entsprechende höherdimensionale Objekte.
Diese werden im allgemeinen als Hyperebenen bezeichnet, kommen aber in einem dreidimensionen Raum
nicht vor.
eines
Ein affiner Unterraum ist analog zu einem Untervektorraum definiert. Eine Teilmenge
Vektorraumes ist genau dann ein Untervektorraum, wenn
selbst wieder ein Vektorraum ist. Da die
Vektorraumaxiome dann automatisch erfüllt sind, ist eine notwendige und hinreichende Bedingung dafür,
ein Untervektorraum ist, dass mit $ und stets auch dass eine Teilmenge
und # ist. Die Teilmenge muss unter der Vektoraddition und der skalaren Multiplikation
abgeschlossen sein.
eines affinen Raumes genau dann ein affiner Unterraum, wenn
Entsprechend ist eine Teilmenge selbst wieder ein affiner Raum ist. Der zu zugeordnete Vektorraum ist dann ein Untervektorraum
des zu zugeordneten Vektorraumes . Mit anderen Worten, wenn wir die Abstandsvektoren aller Paare
bilden, so liegen diese in einem Untervektorraum . Und umgekehrt, wenn
von Punkten in wir irgendeinen Punkt aus kennen, dann finden wir alle anderen, indem wir diesen Punkt um einen
verschieben.
Vektor aus
Einen speziellen affinen Unterraum können wir festlegen, indem wir eine bestimmte Anzahl von Punk
ten vorgeben, die der Unterraum enthalten soll. Sei zum Beispiel irgendein Punkt, so ist ein nulldimensionaler affiner Unterraum. Der zugeordnete Untervektorraum ist der nulldimensionale Vek
torraum ! , denn der einzige Abstandsvektor, den wir in bilden können, ist der Nullvektor
! . Jeder einzelne Punkt eines affinen Raumes definiert auf diese Weise einen nulldimensionalen
affinen Unterraum.
Wenn wir zwei verschiedene Punkte vorgeben und von dem affinen Unterraum zumindest
verlangen, dass ist, dann enthält der zugeordnete Untervektorraum den Vektor . Da es sich um einen Vektorraum handelt, enthält er dann aber auch alle Vielfache dieses
Vektors. Und folglich enthält der affine Raum auch alle Punkte , die wir durch eine Verschiebung
25
des Punktes in Richtung des Vektors Gerade
erreichen,
>
(2.1)
Auf diese Weise wird in jedem affinen Raum durch zwei Punkte und eine Gerade festgelegt.
Um eine Ebene zu definieren, müssen wir drei Punkte vorgeben, die in der Ebene liegen
sollen. Die Vektoren und , von denen wir annehmen wollen, dass sie linear unabhängig sind,
auf, und die Ebene spannen dann einen zweidimensionalen Untervektorraum besteht aus allen Punkten , deren Abstandsvektor von in diesem Untervektorraum liegt. Es gilt also
Ebene
-(
)( (2.2)
Das können wir leicht verallgemeinern. Wir nennen einen Satz von 0 Punkten 33 linear
unabhängig, wenn die Vektoren 1 linear unabhängig sind. Wenn wir einen solchen Satz von Punkten vorgeben, dann spannen diese Vektoren einen -dimensionalen Untervektorraum
auf. Der affine Unterraum
(2.3)
repräsentiert dann eine -dimensionale Hyperebene. Allgemein gilt der folgende Satz:
Ein -dimensionaler affiner Unterraum wird durch
deutig festgelegt.
0 linear unabhängige Punkte ein-
Natürlich muss sein, wenn die Dimension des affinen Raumes ist. Wenn ist, dann sind
die Vektoren 33 vollständig, das heißt in diesem Fall ist und somit
. Die einzigen interessanten
affinen Unterräume sind diejenigen, deren Dimension kleiner
ist als die des gegeben affinen Raumes .
Aufgabe 2.1 Bei der allgemeinen Definition (2.3) einer Hyperebene scheint der Punkt eine spezielle
hängt nicht davon
Rolle zu spielen. Man zeige jedoch, dass dem nicht so ist. Die Teilmenge ab, welchen der 80 Punkte wir mit bezeichnen.
ein ebenfalls -dimensionaler affiner
Aufgabe 2.2 Es sei ein -dimensionaler affiner Raum und Unterraum. Man zeige, dass ist, das heißt selbst ist der einzige affine Unterraum, der die
maximale Dimension hat.
,
Aufgabe 2.3 Man beweise, dass die Schnittmenge von zwei affinen Unterräumen wenn sie nicht leer ist, wieder ein affiner Unterraum von ist. Warum kann die Schnittmenge von zwei
leer sein, während die Schnittmenge von zwei Untervektorräumen
affinen Unterräumen eines beliebigen Vektorraumes stets mindestens einen Vektor, nämlich den Nullvektor,
enthält?
Geraden und Ebenen
Jetzt betrachten wir wieder den dreidimensionalen Euklidischen Raum. Die einzigen interessanten Unterräume sind dann die Geraden und Ebenen. Eine Gerade wird durch zwei verschiedene Punkte
festgelegt, eine Ebene durch drei Punkte , die ein nicht entartetes Dreieck
26
bilden. Wir wollen uns überlegen, wie wir die Lage eines solchen Objektes im Raum am besten beschreiben können, und was es zum Beispiel bedeutet, dass zwei solche Objekte zueinander parallel liegen oder
senkrecht stehen.
Um die Richtung einer Geraden festzulegen, genügt es, den Richtungsvektor zu
kennen. Er legt die Lage der Geraden im Raum eindeutig fest. Wir kennen die Gerade, wenn wir den Richtungsvektor und irgendeinen Punkt auf der Geraden kennen. Tatsächlich können wir die Definition
(2.1) dann auch so schreiben,
mit
(2.4)
Umgekehrt ist der Richtungsvektor durch die Gerade aber nur bis auf sein Vorzeichen bestimmt. Wir
könnten in (2.4) statt auch "* schreiben. Das ist natürlich gleichbedeutend mit dem Vertauschen der
Punkte und . Wir können das ändern, indem wir der Geraden eine Orientierung geben. Durch die
Orientierung ist gewissermaßen eine Laufrichtung der Geraden festgelegt. Der Richtungsvektor zeigt
dann die Laufrichtung an, also in diesem Fall von nach .
Zu jeder orientierten Geraden gehört genau ein Richtungsvektor.
Mit Hilfe des Richtungsvektors können dann auch erklären, wann zwei Geraden zueinander parallel liegen
oder aufeinander senkrecht stehen. Zwei Geraden liegen natürlich parallel, wenn ihre Richtungsvektoren
gleich sind. Wir nennen sie antiparallel, wenn ihre Richtungsvektoren entgegensetzt gleich sind, also
wenn sie zwar im üblichen Sinne parallel sind, aber ihre Orientierungen verschieden sind. Und schließlich
stehen zwei Geraden genau dann zueinander senkrecht, wenn das für ihre Richtungsvektoren gilt. Das ist
unabhängig davon, ob sie sich schneiden oder nicht.
Mit einer Ebene verhält es sich ganz ähnlich. Auch ihre Lage im Raum lässt sich durch einen Einheitsvektor beschreiben. Die Definition dieses Normalenvektors ist in Abbildung 2.1(a) dargestellt. Zu jeder
Ebene gibt es genau zwei Einheitsvektoren, die zur Ebene senkrecht stehen. Sind die drei
Punkte, die die Ebene aufspannen, so erfüllt der Normalenvektor die Gleichungen
:
6 :
6 :
6 :
0 (2.5)
Die ersten drei Gleichung sind nicht unabhängig, da aus den ersten beiden bereits folgt, dass auf allen
Abstandsvektoren, die wir in der Ebene bilden können, senkrecht steht. Es handelt sich also um drei
unabhängige Gleichungen für drei Unbekannte, nämlich die Komponenten von bezüglich irgendeines
Koordinatensystems. Eine Gleichung davon ist quadratisch, so dass sich zwei Lösungen ergeben. Denn
mit ist offenbar auch "* eine Lösung.
Durch die Auswahl eines der beiden möglichen Normalenvektoren können wir die Orientierung der
Ebene festlegen. Wir können ihr eine Oberseite und eine Unterseite zuordnen, und verlangen, dass der
Normalenvektor von der Oberseite weg in den Raum zeigt. Die in Abbildung 2.1(a) sichtbare Seite der
Ebene wäre in diesem Fall die Oberseite. Wir können die Orientierung einer Ebene auch durch die Reihenfolge der Punkte festlegen, die die Ebene aufspannen. Betrachtet man nämlich die Lage der
drei Punkte auf der Ebene, so wird durch ihre Reihenfolge ein Drehsinn definiert. Er ist in Abbildung 2.1(a)
durch einen rotierenden Pfeil dargestellt, der sich aus der Orientierung des Dreiecks ergibt.
Um eine Beziehung zwischen den beiden Definitionen herzustellen, verwenden wir die folgende, leicht
modifizierte Rechte-Hand-Regel. Zeigt der ausgestreckte Daumen in die Richtung des Normalenvektors,
so zeigen die zur Faust zusammengerollten Finger den Drehsinn der Ebene an. In der Abbildung ist der
Drehsinn und der Normalenvektor so gewählt, dass das der Fall ist. Der Normalenvektor einer Ebene legt
auf diese Weise sowohl ihre Lage im Raum, als auch ihre Orientierung, also ihren Drehsinn fest.
Zu jeder orientierten Ebene gehört genau ein Normalenvektor
27
(b)
(a)
Abbildung 2.1: Die affinen Unterräume des dreidimensionalen Euklidischen Raumes (a). Ein nulldimensionaler Unterraum
besteht nur aus einem Punkt . Ein eindimensionaler Unterraum ist eine
Gerade, die von zwei Punkten und aufgespannt wird. Eine zweidimensionale Ebene
wird von
drei Punkten
,
und
aufgespannt. Der einzige dreidimensionale affine Unterraum ist der Raum
selbst. Die Schnittmenge von zwei Ebenen ist eine Gerade (b).
Analog zur Darstellung (2.4) einer Geraden können wir nun auch eine Ebene eindeutig durch einen einzigen Punkt und ihren Normalenvektor festlegen,
(2.6)
wobei durch die Gleichungen (2.5) und die Orientierung der Ebene festgelegt ist.
Außerdem können wir parallele, antiparallele und senkrechte Ebenen definieren. Zwei Ebenen liegen
genau dann parallel, wenn ihre Normalenvektoren gleich sind. Sie heißen antiparallel, wenn ihre Normalenvektoren entgegengesetzt gleich sind. Und sie stehen zueinander senkrecht, wenn ihre Normalenvektoren zueinander senkrecht stehen.
Aufgabe 2.4 Es seien die Punkte mit folgenden Koordinaten bez üglich eines positiv orientierten
kartesischen Koordinatensystems gegeben,
0 7 &
7 3 0 &
30 7 (2.7)
Man bestimme den Normalenvektor der von diesen Punkten aufgespannten Ebene. Um das richtige Vorzeichen des Normalenvektors zu finden, kann man sich mit Hilfe der Rechten-Hand-Regel überlegen, auf
welcher Seite der Ebene der Ursprung des Koordinatensystems liegt.
Aufgabe 2.5 Die dreidimensionale Version des Parallelenaxioms besagt, dass es im Euklidischen Raum
zu jeder Ebene und jedem Punkt genau eine Ebene gibt, mit und . Man
beweise diese Aussage. Man zeige außerdem, dass zwei Ebenen genau dann parallel im Sinne der obigen
Definition sind, wenn sie entweder gleich sind oder ihre Schnittmenge leer ist.
Aufgabe 2.6 In Abbildung 2.1(b) sind zwei Ebenen und dargestellt, deren Schnittmenge eine Gerade ist. Durch welche Gleichungen ist der normierte Richtungsvektor der Geraden durch
die beiden Normalenvektoren und der Ebenen bis auf sein Vorzeichen eindeutig bestimmt?
Aufgabe 2.7 Wann schneidet eine Gerade eine Ebene senkrecht?
28
Das Kreuzprodukt
Da eine Ebene einschließlich ihrer Orientierung eindeutig durch drei linear unabhängige Punkte bestimmt
ist, muss es möglich sein, den Normalenvektor der Ebene irgendwie aus diesen Punkten zu berechnen. Es
seien also drei Punkte gegeben. Wie können wir dann einen Vektor finden, der die Eigenschaften
(2.5) hat?
Am besten schreiben wir dazu die Gleichungen explizit aus, indem wir ein Koordinatensystem
einführen. Ohne Beschränkung der Allgemeinheit können wir dabei annehmen, dass einer der drei Punkte
der Ursprung ist, zum Beispiel
. Wir machen also, um die Rechnung zu vereinfachen, von der
Möglichkeit Gebrauch, ein speziellen Koordinatensystem zu wählen. Gesucht ist dann ein Einheitsvektor
, der auf der Ebene, also insbesondere auf den Vektoren und senkrecht steht.
Das sind die Ortsvektoren der Punkte und . Die Komponenten dieser Vektoren seien wie üblich mit
bzw. bezeichnet. Es gilt also
Ebenso können wir den Vektor
-
-
(2.8)
in seine Komponenten zerlegen,
(2.9)
Da wir das Skalarprodukt von zwei Vektoren gemäß (1.35) durch die Komponenten ausdrücken können,
lautet die erste an zu stellende Bedingung
5:
6 :
6 (2.10)
Das ist ein einfaches lineares Gleichungssystem für die unbekannten Komponenten , , des Vektors
. Da es sich um zwei Gleichungen für drei Unbekannte handelt, und da die Vektoren und , und somit
auch die beiden Gleichungen linear unabhängig sind, gibt es eine eindimensionale Lösungsmenge.
Aufgabe 2.8 Man zeige, dass die allgemeine Lösung von (2.10) wie folgt gegeben ist, wobei big gewählt werden kann,
# " # " # " belie-
(2.11)
Wir kennen damit alle Vektoren , die zu und und damit zu der von ihnen aufgespannten Ebene
senkrecht stehen. Jetzt müssen wir nur noch die Zahl so bestimmen, dass sich ein Einheitsvektor ergibt,
der in die der Orientierung der Ebene entsprechende Richtung zeigt.
Bevor wir das tun, betrachten wir jedoch zunächst den Vektor, der sich aus (2.11) für 0 ergibt. Wir
bezeichnen diesen Vektor mit
" " " (2.12)
Wie man sieht, wird durch diese Vorschrift eine Abbildung definiert, die zwei Vektoren wieder einen
Vektor zuordnet,
Kreuzprodukt
(2.13)
Diese Abbildung wird Kreuzprodukt genannt. Sie hat die typischen Eigenschaften eines Produktes. Das
Kreuzprodukt ist linear, das heißt es verhält sich assoziativ gegenüber der Addition,
% . 29
(2.14)
und es ist mit der skalaren Multiplikation verträglich,
,# . *% 3 (2.15)
Allerdings ist es nicht wie das Skalarprodukt symmetrisch, sondern antisymmetrisch,
" $
(2.16)
Und schließlich hat es noch genau die Eigenschaft, die wir gefordert haben. Das Kreuzprodukt steht
senkrecht auf den Vektoren und ,
% : 6 : ? 6 (2.17)
Auf der Suche nach einem Vektor, der zu zwei vorgegebenen Vektoren senkrecht steht, sind wir also
auf ein spezielles Produkt von Vektoren gestoßen, das, anders als das Skalarprodukt, als Ergebnis keinen
Skalar, sondern wieder einen Vektor liefert. Wie wir gleich sehen werden, spielt das Kreuzprodukt für die
Berechnung von Flächen eine ähnliche Rolle wie das Skalarprodukt für die Berechnung von Längen.
Aufgabe 2.9 Man leite die Eigenschaften (2.14-2.17) des Kreuzproduktes aus der Definition (2.12) her.
Warum kann man ein Kreuzprodukt mit diesen Eigenschaften nur in einem dreidimensionalen Raum definieren?
Aufgabe 2.10 Man berechne alle neun möglichen Kreuzprodukte der Basisvektoren , und , also
, , 3 und so weiter.
Aufgabe 2.11 Man berechne die zwölf möglichen Kreuzprodukte von jeweils zwei der folgenden Vektoren,
7
"
"
7 "
(2.18)
Man zeige anhand dieser Beispiele und mit Hilfe der Rechten-Hand-Regel, dass die Vektoren 1
immer ein Rechtssystem bilden, wenn und linear unabhängig sind. Es sei dabei vorausgesetzt, dass das
verwendete Koordinatensystem positiv orientiert ist.
Aufgabe 2.12 Laut Aufgabe 2.11 kann die Richtung des Kreuzproduktes von zwei Vektoren durch die
Rechte-Hand-Regel bestimmt werden. Warum folgt daraus zwingend, dass das Kreuzprodukt nicht symmetrisch sein kann, sondern nur antisymmetrisch?
Das Levi-Civita-Symbol
Bei der Definition des Kreuzproduktes haben wir explizit eine bestimmte Orthonormalbasis verwendet.
Es stellt sich daher die Frage, ob diese Definition des Kreuzproduktes davon abhängt, welche Basis wir
verwenden. Oder gibt es vielleicht auch eine anschauliche, “geometrische” Definition des Kreuzproduktes,
die nicht auf der Zerlegung der Vektoren bezüglich eine Orthonormalbasis beruht?
Um diese geometrische Definition des Kreuzproduktes zu finden, müssen wir zuerst ein paar Rechenregeln herleiten. Es ist nützlich, dafür ein neues Symbol einzuführen, das für das Kreuzprodukt eine ähnliche
Rolle spielt wie das Kronecker-Symbol für das Skalarprodukt. Wir erinnern uns, dass das KroneckerSymbol durch die Eigenschaft definiert war, dass für in einer Orthonormalbasis
:
30
(2.19)
ist. Das Kronecker-Symbol repräsentiert also die Skalarprodukte der Basisvektoren. Wir hatten es benutzt,
um das Skalarprodukt von zwei Vektoren durch deren Komponenten auszudrücken,
;: : :
(2.20)
Das Kreuzprodukt hat die gleichen Eigenschaften wie das Skalarprodukt bezüglich der Addition und skalaren Multiplikation von Vektoren. Folglich gilt ganz analog
? (2.21)
Um das Kreuzprodukt von zwei beliebigen Vektoren zu berechnen, genügt die Kenntnis der Kreuzprodukte
der Basisvektoren. Der einzige Unterschied zum Skalarprodukt ist, dass das Ergebnis jetzt wieder ein
Vektor ist. Folglich müssen wir, um (2.21) weiter auszuwerten, die Vektoren wieder bezüglich der
Basis entwickeln. Wir schreiben dafür
(2.22)
Die Koeffizienten sind die Komponenten des Vektors ; bezüglich der Basis . Es handelt sich
um ein Schema von insgesamt 7 Zahlen, denn auf der linken Seite der Gleichung (2.22) steht einer von
neun möglichen Vektoren, und jeder davon hat drei Komponenten.
Wir werden diese 7 Koeffizienten gleich berechnen und sehen, dass sie sehr einfach aussehen. Zuerst
wollen wir aber die Rechnung (2.21) fortsetzen. Wenn wir (2.22) dort einsetzen, dann ergibt sich
(2.23)
Im letzten Schritt haben wir die Summe über abgespalten, um zu zeigen, dass das Ergebnis jetzt wieder in der üblichen Art und Weise als Linearkombination der Basisvektoren dargestellt wird. Wir können
daraus die folgende Vorschrift ableiten, nach der sich die Komponenten des Kreuzproduktes aus den Komponenten der beiden Vektoren berechnen lassen,
(2.24)
Wenn wir dies nun mit der ursprünglichen Definition (2.12) des Kreuzproduktes vergleichen, also mit
" " so stellen wir fest, dass von den insgesamt 7 Einträgen des Zahlenschemas
den. Es sind dies die Einträge
0 " (2.25)
nur sechs nicht verschwin-
" 0 (2.26)
Aufgabe 2.13 Man verifiziere dieses Ergebnis durch Einsetzen von (2.26) in (2.24) und Ausschreiben der
Summen.
Betrachten wir die nicht verschwindenden Komponenten von etwas genauer, so stellen wir eine gewisse Regelmäßigkeit fest. Alle sechs haben die Eigenschaft, dass die drei Indizes die Werte 4 $
31
annehmen, nur jeweils in einer anderen Reihenfolge. Es kommt niemals ein Index doppelt vor. Die sechs
auftretenden Kombinationen sind genau die sechs möglichen Permutationen der Indexmenge 4 .
Auch das Vorzeichen lässt sich leicht aus einer speziellen Eigenschaft der jeweiligen Permutation ableiten. Eine Permutation von drei Indizes heißt gerade, wenn sie sich durch zyklisches Vertauschen ergibt,
also 4 , , 4 . Für die ersten drei Einträge in (2.26) ist das der Fall. Wir sagen auch,
dies seien zyklische Permutationen der Indizes 4 . Wir erkennen eine zyklische Permutation daran,
dass die Reihenfolge der Indizes, wenn wir sie periodisch fortsetzen, die “richtige” Reihenfolge ist, also
4 - - -4 - - - .
Die anderen drei Indexkombinationen in (2.26) sind ungerade oder antizyklische Permutationen der Indexmenge 4 $ . Sie ergeben sich durch Vertauschen von jeweils zwei Indizes, also 4 , oder
4 . Wenn wir eine solche Permutation periodisch fortsetzen, erscheinen die Indizes in der “falschen”
Reihenfolge - -4 - - -4 - 3 . Alle anderen Einträge von , also diejenigen, bei denen mindestens ein
Index doppelt vorkommt und somit gar keine Permutation von 4 $ vorliegt, sind gleich Null. Das
fassen wir wie folgt zusammen.
Levi-CivitaSymbol
*0 " 0 6 wenn
eine gerade . . .
. . . eine ungerade . . .
. . . keine Permutation von 4 $ ist,
(2.27)
Das so definierte Zahlenschema wird Levi-Civita-Symbol genannt. Aus den Eigenschaften dieses Symbols lassen sich, nachdem wir den Umgang damit ein wenig geübt haben, sehr leicht alle Eigenschaften
des Kreuzproduktes ableiten.
Aufgabe 2.14 Man leite die folgenden Eigenschaften des Levi-Civita-Symbols aus der Definition her. Es
ist antisymmetrisch bezüglich des Vertauschens zweier Indizes,
"
"
"
(2.28)
Es behält dagegen sein Vorzeichen bei, wenn wir die drei Indizes zyklisch vertauschen,
(2.29)
Aufgabe 2.15 Wie wir wissen, lassen sich die Komponenten eines Vektors bez üglich einer Orthonormalbasis durch das Skalarprodukt mit den Basisvektoren bestimmen. Aus (2.22) folgt also
? , :
Man benutze das Ergebnis von Aufgabe 2.10, um daraus alle 7 Eintr äge von
Ergebnis (2.27) zu reproduzieren.
Aufgabe 2.16 Es seien (2.30)
zu berechnen und das
drei beliebige Vektoren. Man beweise
1 : : + : (2.31)
Aufgabe 2.17 Die folgenden Formeln stellen eine Beziehung her zwischen dem Levi-Civita-Symbol und
dem Kronecker-Symbol. Man beweise sie, indem man sich zuerst überlege, für welche Indexkombinationen sich überhaupt auf beiden Seiten der Gleichung nicht verschwindenden Terme ergeben k önnen, und
überprüfe anschließend diese Terme explizit auf Gleichheit. Die einfachste Formel lautet
7 32
(2.32)
Etwas schwieriger ist die folgende Formel, die wir noch sehr häufig benötigen werden,
" (2.33)
Die allgemeinste Formel, mit der sich jedes Produkt von zwei Levi-Civita-Symbolen durch KroneckerSymbole ausdrücken lässt, ist
"
" " " (2.34)
Diese Formel werden wir jedoch nie explizit benötigen.
Aufgabe 2.18 Man beweise die Jacobi-Identität
. .
+ % 3& !
(2.35)
und mache sich außerdem klar, dass das Kreuzprodukt nicht assoziativ ist, die Klammern hier also nicht
weggelassen werden können.
Aufgabe 2.19 Man benutze die Formeln aus Aufgabe 2.17, um folgende Beziehung zwischen dem Kreuzprodukt und dem Skalarprodukt herzuleiten.
% 3 : 5: : 5: : " 8
(2.36)
Fläche und Volumen
Jetzt haben wir immer noch nicht gezeigt, dass die Definition des Kreuzproduktes von der gewählten
Orthonormalbasis unabhängig ist, und wir haben noch keine anschauliche geometrische Interpretation
dafür gefunden. Wir wissen bisher nur, dass stets senkrecht auf und steht, und dass die Richtung
dieses Vektors durch die Rechte-Hand-Regel gefunden werden kann.
Wir werden jetzt zeigen, dass der Betrag des Kreuzproduktes etwas mit einem Flächeninhalt zu tun hat.
und deren Kreuzprodukt . Aus
Wir betrachten zunächst zwei zueinander senkrechte Vektoren (2.36) entnehmen wir, dass für den Betrag des Kreuzproduktes in diesem Fall gilt
: % 1& "8<: (2.37)
also . Das ist offenbar der Flächeninhalt des von den Vektoren und aufgespannten
Rechtecks.
Im allgemeinen spannen zwei Vektoren aber kein Rechteck, sondern ein Parallelogramm auf. Ein solches ist in Abbildung 2.2(a) dargestellt. Um seinen Flächeninhalt zu berechnen, gehen wir wie folgt vor.
Wir halten die Seite, die dem Vektor entspricht, fest und scheren es so, dass sich ein Rechteck ergibt.
Offenbar müssen wir dazu den Vektor in einen Anteil parallel zu und einen Anteil senkrecht
zu zerlegen. Das Rechteck, das durch die Vektoren und aufgespannt wird, hat dann denselben
Flächeninhalt wie das Parallelogramm.
Die dazu notwendige orthogonale Zerlegung eines Vektors haben wir bereits in Aufgabe 1.5 durchgeführt. Zunächst bestimmen wir den zu gehörenden Einheitsvektor . Er ist durch gegeben.
Dann zerlegen wir den Vektor gemäß (1.19),
: 33
"= : (2.38)
replacements
(c)
(d) (a)
(b)
Abbildung 2.2: Das Kreuzproduktes repräsentiert die Fläche des von und aufgespannten
Paral
lelogramms. Es steht auf diese Fläche senkrecht
und
für
die
drei
Vektoren
,
und
gilt
die
Rechte liefert das Volumen eines von den Vektoren , und
Hand-Regel (a). Das Spatprodukt aufgespannten Spates (b).
Und interessiert nur der Vektor . Die Fläche des Rechtecks und damit des Parallelogramms ist
, also
Hier haben wir benutzt, dass " : : " 7 : "
0 ist. Jetzt verwenden wir noch die Definition "
8
" %5: 3 : (2.39)
. Das ergibt
: (2.40)
Das ist genau der vorletzte Ausdruck in (2.37), der auch dann gilt, wenn das Skalarprodukt von und
nicht verschwindet. Damit haben wir gezeigt, dass der Betrag des Kreuzproduktes gleich dem
Flächeninhalt des von und aufgespannten Parallelogramms ist,
(2.41)
Wir haben nun sowohl für die Richtung von , als auch für den Betrag dieses Vektors eine anschauliche
geometrische Erklärung.
Das Kreuzprodukt steht auf und senkrecht, wobei diese drei Vektoren ein Rechtssystem bilden. Sein Betrag ist die Fläche des von und aufgespannten Parallelogramms.
Wir haben jetzt zwar keinen formalen Beweis geführt, aber wir haben eine anschauliche geometrische
Beschreibung des Kreuzproduktes gefunden, und uns somit zumindest intuitiv klar gemacht, dass es nicht
davon abhängt, welche Orthonormalbasis wir in (2.24) verwenden, um es Komponentenweise auszurechnen. Mit anderen Worten, die Formel
+
(2.42)
für die Komponenten des Kreuzproduktes gilt in jeder Orthonormalbasis. Genauer gesagt, sie gilt in jeder
positiv orientierten Orthonormalbasis, denn in einer negativ orientieren Basis würden wir einen Vorzeichenfehler machen, weil die Rechte-Hand-Regel für die Basisvektoren nicht mehr gilt.
34
Warum ist das so? Wie wir gesehen haben, genügt es, die Kreuzprodukte der Basisvektoren zu kennen,
um beliebige Kreuzprodukte auszurechnen. Nun gilt aber in jeder positiv orientierten Orthonormalbasis,
dass und ein Einheitsquadrat aufspannen, also ein Parallelogramm der Fläche 0 . Außerdem ist der
Vektor, der darauf senkrecht steht und der mit und ein Rechtssystem bildet, immer der Basisvektor
. So ist eine positiv orientierte Orthonormalbasis definiert. Also gilt für jede solche Basis ,
und entsprechend die Formel (2.22) für die anderen Kreuzprodukte der Basisvektoren.
Diese Aussage ist analog zu der Aussage zu interpretieren, dass die Beziehung (2.19) für die Skalarprodukte in jeder Orthonormalbasis gilt. Wir können diese Aussagen sogar umkehren und sagen, dass eine
positiv orientierte Orthonormalbasis durch die Eigenschaften
:
(2.43)
definiert ist. Einen tieferen Grund für diesen Zusammenhang zwischen Orthonormalbasen und den Symbolen und werden wir später im Zusammenhang mit der Drehgruppe kennenlernen. Es ist deshalb
nützlich, diese Definition einer positiv orientierten Orthonormalbasis im Gedächtnis zu behalten. Sie ist
außerdem nützlich, weil sich alle Rechenregeln und Formeln für die Symbole und letztlich aus
diesen Eigenschaften der Skalar- und Kreuzprodukte herleiten lassen.
Das Kreuzprodukt ist also eng mit Flächen verknüpft, so wie das Skalarprodukt mit Längen zu tun hat.
Wir wollen nun noch zeigen, dass ein Kombination von beiden das Volumen berechnet. Wir betrachten dazu drei Vektoren , und , die linear unabhängig sein sollen. Wie in Abbildung 2.2(b) dargestellt, spannen
diese Vektoren einen Spat auf, also eine dreidimensionale Verallgemeinerung eines Parallelogramms. Wir
wollen sein Volumen berechnen.
Das Volumen eines Spates ist durch Grundfläche mal Höhe gegeben. Die Grundfläche sei das von
und aufgespannte Parallelogramm. Es hat die Fläche . Die Höhe des Spates ist die
orthogonale Projektion des Vektors auf die Richtung senkrecht zur Grundfläche, also auf die Richtung
von . Die orthogonale Projektion ist, das wissen wir bereits, durch das Skalarprodukt von mit dem
Einheitsvektor gegeben. Folglich ist
:
:
1 : (2.44)
Diese Kombination von Kreuz- und Skalarprodukt wird Spatprodukt genannt, da es das Volumen eines
von drei Vektoren aufgespannten Spates repräsentiert. Wir hatten bereits in Aufgabe 2.16 gezeigt, dass es
zyklisch ist, also bei einer zyklischen Permutation der drei Vektoren seinen Wert nicht ändert. Das muss
natürlich so sein, denn das Volumen eines Spates hängt natürlich nicht davon ab, in welcher Reihenfolge
wir die drei Vektoren angeben.
Aufgabe 2.20 Auch für das Volumen gilt eine Vorzeichenregel. Man zeige, dass das durch (2.44) definierte
Volumen eines Spates genau dann positiv ist, wenn die Vektoren % , wie in Abbildung 2.2 der Fall, ein
Rechtssystem bilden. Es ist dagegen negativ, wenn sie ein Linkssystem bilden, und Null, wenn sie linear
abhängig sind. In diesem Fall ist der Spat entartet.
Aufgabe 2.21 Wir kennen bereits die Spatprodukte der Basisvektoren einer Orthonormalbasis. Es ist : . Welche anschauliche geometrische Erklärung ergibt sich nun für diese Formel?
Aufgabe 2.22 Die eigentliche Fragestellung, die uns zum Kreuzprodukt f ührte, war die Bestimmung des
Normalenvektors einer Ebene, die von drei Punkten aufgespannt wird. Man zeige, dass dieser nun
durch
35
(2.45)
replacements
(c)
(d)
(b)
(a)
Abbildung 2.3: Ein Spat (a) kann in sechs gleich große Tetraeder zerlegt werden. Die Kanten eines gleich
seitigen Tetraeders (b) sind Vektoren gleicher Länge .
gegeben ist. Man prüfe, ob die drei Ausdrücke gleich sind, ob die Forderungen (2.5) erfüllt sind, und ob
der so definierte Vektor in die richtige, der Orientierung der Ebene entsprechende Richtung zeigt.
Aufgabe 2.23 Die Seiten eines Dreiecks sind durch die Vektoren , /
und gegeben. Die Seitenlängen seien wie üblich mit , und bezeichnet. Man zeige
und dass für den Flächeninhalt des Dreiecks die Formeln
" ;: 1 " : (2.46)
"8 : (2.47)
gelten. Man beweise die Heronsche Formel
0
". " - " + (2.48)
Aufgabe 2.24 Abbildung 2.3(a) zeigt die Zerlegung eines Spates in sechs Tetraeder, analog zur Zerlegung
eines Parallelogramms in zwei Dreiecke. Die Tetraeder sind alle gleich groß, da jeweils zwei von ihnen
eine gleich große Grundfläche und die gleiche Höhe haben. Das Volumen jedes einzelnen Tetraeders ist
folglich ein sechstel des Volumen des Spates. Es soll das Volumen eines gleichseitigen Tetraeders der
Kantenlänge berechnet werden. Wie in Abbildung 2.3(b) gezeigt, wird ein solcher Tetraeder durch drei
Vektoren , , aufgespannt, mit
" " % " Man leite daraus mit Hilfe der Rechenregeln für das Skalar- und Kreuzprodukt die Formel
ab.
(2.49)
7
Aufgabe 2.25 Man zeige, dass zwei Kanten eines gleichseitigen Tetraeders, die sich nicht an einer Ecke
berühren, zueinander senkrecht stehen. In Abbildung 2.3 sind dies zum Beispiel die Kanten und " .
36
Aufgabe 2.26 Bei der Definition von Flächen und Volumen haben wir bis jetzt keine Rücksicht auf die
physikalischen Dimensionen der beteiligten Vektoren genommen. Wenn sich die betrachteten Fl ächen und
Körper im physikalischen Raum befinden, welche Dimensionen haben dann die Vektoren, die sie aufspannen? Ergeben sich daraus die richtigen Dimensionen für den Flächeninhalt und das Volumen, also Länge
zum Quadrat bzw. Länge hoch drei?
Kurven
Wir können jetzt Längen, Flächen und Volumen berechnen, jedoch nur, wenn es sich dabei um ganz bestimmte Objekte handelt, zum Beispiel den Abstand zwischen zwei Punkten, die Fläche eines Parallelogramms oder Dreiecks, oder das Volumen eines Spates oder eines Tetraeders. Im Prinzip können wir jedes
ein-, zwei-, bzw. dreidimensionales Objekt derart in Teile zerlegen, dass wir seine Länge, Fläche bzw. sein
Volumen auf diese Weise berechnen können. Wir wollen das am Beispiel einer Kurve zeigen, deren Länge
wir berechnen wollen.
Eine Kurve im Raum können wir durch eine Funktion
parametrisierte
Kurve
(2.50)
darstellen. Jeder reellen Zahl wird ein Punkt zugeordnet. Die Gesamtheit aller dieser Punkte
bildet die Kurve. Die Variable wird Kurvenparameter genannt. Handelt es sich nur um ein endliches
Stück einer Kurve, so können wir den Definitionsbereich von entsprechend einschränken, zum Beispiel
.
auf ein Intervall Um konkrete Rechnungen durchzuführen, ist es sinnvoll, statt der Funktion die Ortsvektordarstellung oder die Koordinatendarstellung der Kurve zu benutzen. Wir fixieren einen Ursprung und eine
Orthonormalbasis , und betrachten dann die Vektorfunktion
&
&
(2.51)
In einem kartesischen Koordinatensystem wird eine Kurve entweder durch eine vektorwertige Funkti
on , oder durch einen Satz von drei reellen Funktionen beschrieben. In Abbil
, und sie
dung 2.4(a) ist eine solche Kurve dargestellt. Sie hat eine endliche Länge, es gilt verbindet die Punkte und 1 .
Wenn die Funktion hinreichend stetig und differenzierbar ist, was wir im folgenden stets annehmen
wollen, dann können wir die Ableitung bilden,
Tangentenvektor
& "
(2.52)
Die Definition der Ableitung als Grenzwert haben wir explizit aufgeschrieben, um zu zeigen, dass wir
auch in einem Vektorraum in der üblichen Art und Weise Ableitungen bilden können. Im Zähler steht
die Differenz zweier Vektoren, also wieder ein Vektor. Im Nennen steht eine reelle Zahl, das heißt wir
multiplizieren den Vektor mit einer reellen Zahl und erhalten wieder einen Vektor. Dieser hängt von und
ab, und wir bilden schließlich den Grenzwert 6 .
Wir müssen nur noch erklären, wie wir in einem Vektorraum einen Grenzwert bilden. Der Grenzwert in
einem Vektorraum ist so definiert, dass die elementaren Abbildungen, also die Vektoraddition, die skalare
Multiplikation und das Skalarprodukt, stetig sind. Drücken wir die Vektoren in (2.52) durch ihre Komponenten aus, so ist
%
37
"
2 (2.53)
(b)
(a)
Abbildung 2.4: Eine Kurve im Raum wird durch eine Ortsvektorfunktion dargestellt (a). Die Ab
leitung ist der Tangentenvektor
der Kurve an der Stelle . Um die Länge der Kurve zu berechnen,
zerlegt man sie in Linienelemente
und integriert diese (b).
Wegen der Stetigkeit der Addition und der skalaren Multiplikation können wie die Summe mit den Grenzwert vertauschen. Außerdem sind die Basisvektoren konstant. Also gilt
& "
% % (2.54)
Um die Ableitung einer Vektorfunktion zu bilden, können wir einfach die Ableitungen der Komponenten bezüglich irgendeiner Basis bilden. Das sind gewöhnliche reelle Funktionen, das heißt hier hat die
Ableitung ihre gewöhnliche Bedeutung.
Für Ableitungen einer Funktion 4 schreiben wir wie üblich 4 , benutzen aber gelegentlich auch
die Schreibweise 4 . Wie wir gleich sehen werden ist das sehr nützlich, denn mit Hilfe dieser etwas
formalen Darstellung der Ableitung als Quotient lässt sich ganz einfach rechnen. Anschaulich stellen wir
uns darunter das Verhältnis einer sehr kleinen Differenz 4 4 " 4 und der ebenfalls sehr
kleinen Größe 4 vor.
Die geometrische Bedeutung des Vektors ist in Abbildung 2.4(a) dargestellt. Es ist der Tangentenvektor der Kurve an der Stelle . Er zeigt dort in die Richtung, in die die Kurve verläuft. Wenn wir diesen
Tangentenvektor entlang der Kurve integrieren, ergibt sich der Abstandsvektor, der vom Anfangspunkt der
Kurve zu ihrem Endpunkt zeigt,
"
1 (2.55)
Für das Integral einer Vektorfunktion gilt das gleiche wie für die Ableitung. Wir können es komponenten-
38
weise ausrechnen, das heißt wir können (2.55) auch wie folgt schreiben,
&
% "
% % % '"
% "
(2.56)
Die Gleichung (2.55) ist nichts anderes als die Verallgemeinerung des Fundamentalsatzes der Analysis,
angewandt auf eine Vektorfunktion.
Durch Integration des Tangentenvektors einer Kurve bekommen wir den insgesamt von der Kurve
zurückgelegten Weg, das heißt den Abstandsvektor zwischen dem Anfangs- und dem Endpunkt der Kurve. Aber eigentlich wollten wir ja die Länge der Kurve berechnen. Diese ist im allgemeinen größer als der
Abstand zwischen Anfangs- und Endpunkt, da die Kurve ja einen Umweg machen könnte.
Die Berechnung der Länge einer Kurve ist in Abbildung 2.4(b) dargestellt. Wir definieren zunächst eine
Funktion . Sie soll die Länge der Kurve von ihrem Anfangspunkt, oder von irgendeinem anderen fest
gewählten Punkt, bis zur Stelle repräsentieren. Dann fragen wir uns, wie von abhängt, also wie
sich die Funktion ändert, wenn wir um eine kleines Stück erhöhen.
" ist die Länge des Kurvenstückes zwischen und Die Differenz . Wenn sehr
klein ist, können wir dieses Kurvenstück sehr gut durch eine gerade Strecke approximieren. Diese Strecke
" dargestellt. Folglich gilt für ein kleines, aber positives
wird durch den Vektor (2.57)
" " Die Näherung ist umso besser, je kleiner ist. Jedoch können wir nicht einfach den Grenzwert 6
bilden, denn dann steht auf beiden Seiten der Gleichung Null. Wir können aber zuerst die Gleichung durch
teilen und dann den Grenzwert bilden,
" " (2.58)
Auf der linken Seite steht nun offenbar die Ableitung . Die rechte Seite formen wir noch ein wenig
um. Da wir 6 annehmen, können wir den Nenner unter den Betrag ziehen. Das gleiche gilt für den
Grenzwert, denn der Betrag ist über das Skalarprodukt und die Quadratwurzelfunktion definiert und daher
stetig. Daraus folgt
"
(2.59)
Jetzt müssen wir diese Gleichung nur noch integrieren und bekommen den folgenden Ausdruck für die
,
Gesamtlänge einer Kurve für den Abschnitt Kurvenlänge
"
(2.60)
Es spielt jetzt keine Rolle mehr, welchen Bezugspunkt wir verwenden, um die Funktion zu definieren. Es tritt bei der Integration nur noch die Differenz
von zwei
Funktionswerten auf, und dies ist die
Gesamtlänge der Kurve zwischen den Orten und . Damit kennen wir auch die Bedeu tung des Betrages des Tangentenvektors . Er gibt an, wie sich die Länge der Kurve als Funktion des
Kurvenparameters verändert.
39
Durch eine kleine “formale” Manipulation können wir die Formel (2.60) für die Länge einer Kurve auch
sehr anschaulich darstellen. Wir schreiben noch einmal die Beziehung (2.59) in einer etwas anderen Form
auf,
& &
,
Diese Gleichung multiplizieren wir nun formal mit (2.61)
(2.62)
Wir nennen diesen Ausdruck für das Linienelement. Es hat folgende, in Abbildung 2.4(b) dargestellte
anschauliche Bedeutung. Wir betrachten ein kleines Stück der Kurve. Die Länge dieses Stückes können
wir berechnen, indem wir einen Koordinatenquader bilden, die Quadrate der Seitenlängen , und
dieses Quaders addieren, und aus der Summe die Wurzel ziehen. Das besagt die Formel (2.62).
Da wir dabei die Kurve durch eine gerade Strecke approximieren, gilt diese Formel natürlich nur im
Grenzfall, also wenn die Länge des Kurvenstückes gegen Null geht. Um die Gesamtlänge der Kurve zu
berechnen, müssen wir die Kurve in sehr viele sehr kleine Stücke unterteilen, die Längen dieser Stücke
aufsummieren, und schließlich den Grenzwert bilden, in dem die Anzahl der Stücke gegen unendlich geht
und deren Länge gegen Null. Das ist natürlich nichts anderes als die Definition eines Integrals. Es gilt also
(2.63)
Allerdings können wir mit diesem formalen Ausdruck noch nichts anfangen. Wir können ihn aber jetzt
teilen, und vor die Summe
wieder mit erweitern, indem wir den Ausdruck unter der Summe durch ein schreiben,
(2.64)
Jetzt ergibt das ganze wieder eine Sinn, und natürlich ist das genau die Formel (2.60), wenn wir dort die
Kurve explizit durch ihre Koordinatenfunktionen % darstellen. Über den Trick mit dem Linienelement
(2.62), das sich unmittelbar aus dem Satz von Pythagoras ergibt, lässt sich die Formel für die Länge einer
beliebigen Kurve auf diese Weise leicht “herleiten”, oder jedenfalls reproduzieren.
Aufgabe 2.27 Man berechne die Länge einer geraden Strecke zwischen zwei Punkten und dass sie mit dem Abstand übereinstimmt.
und zeige,
Aufgabe 2.28 Man beweise die verallgemeinerte Dreiecksungleichung: Die L änge einer Kurve ist stets
größer oder gleich dem Abstand ihrer Endpunkte. Eine gerade Strecke ist demnach die k ürzeste Verbindung
zweier Punkte.
Aufgabe 2.29 Wie wir wissen, hat der Ortsvektor im physikalischen Raum die Dimension einer L änge.
Der Kurvenparameter habe ebenfalls die Dimension einer Länge. Welche physikalische Dimension ergibt
sich daraus für den Tangentenvektor? Welche Dimension hat das Längenelement, und welche ergibt sich
für das Integral in (2.60), also für die Größe ' 1 ?
für den Abschnitt .
Aufgabe 2.30 Man berechne die Länge einer Parabel Wenn dies eine Kurve im physikalischen Raum darstellen soll, welche physikalischen Dimensionen haben
dann die Konstante und der Kurvenparameter ?
40
Aufgabe 2.31 Es seien zwei Funktionen und gegeben. Ferner sei eine streng monoton steigende Funktion, und es gelte . Dann beschreiben beide Funktionen
und dieselbe Kurve im Raum. Sie unterscheiden sich nur durch die Art und Weise, wie die Kurve parametrisiert wird. Warum ist das so? Man zeige, dass die Länge einer Kurve nicht davon abhängt, welche
Parametrisierung man wählt, das heißt das Integral (2.60) liefert in beiden Fällen dasselbe Ergebnis.
( im Intervall .
Aufgabe 2.32 Man berechne die Länge der Kurve Welche Beziehung besteht zu dem Ergebnis von Aufgabe 2.30? Wenn dies eine Kurve im physikalischen
Raum darstellen soll, welche physikalischen Dimensionen haben dann die Konstanten und ( , sowie der
Kurvenparameter ?
Aufgabe 2.33 Es seien zwei vektorwertige Funktionen, die von einer reellen Variablen
abhängen. Man zeige, dass die Produktregel für die Ableitung auch auf das Skalarprodukt und das
Kreuzprodukt anwendbar ist. Es gilt
(2.65)
Eine Fläche kann durch eine Funktion beschrieben werden, das heißt man
: : : Aufgabe 2.34
ordnet jedem Paar von reellen Zahlen , )( einen Punkt , )( zu, mit Ortsvektor ( , )( .
Man leite mit einer ähnlichen Überlegung, wie wir sie gerade für eine Kurve durchgeführt haben, die
folgende Formel für den Flächeninhalt her
(
( (2.66)
Der Integrationsbereich von und ( ist dabei so zu wählen, dass er genau die Fläche abdeckt, deren
( sind die partiellen Ableitungen der OrtsvekInhalt berechnet werden soll. Die Vektoren
und
)
(
. Welche geometrische Bedeutung haben sie, und welche anschauliche Interpretation
torfunktion hat ihr Kreuzprodukt?
Winkelfunktionen
Zum Abschluss dieses Kapitels wollen wir noch die wichtigsten Winkelfunktionen einführen. Bis jetzt
wissen wir nur, was ein rechter Winkel ist. Über das Skalarprodukt kann man aber auch ganz allgemein
der Winkel zwischen zwei beliebigen Vektoren definieren.
Winkel lassen sich am besten am Kreis einführen. Ein Kreis ist eine Kurve, die in einer Ebene liegt,
und die einen konstanten Abstand von einem Mittelpunkt hat. Sei also der Mittelpunkt des Kreises und
gleichzeitig der Ursprung des Koordinatensystems. Die Ebene, in der der Kreis liegen soll, werde von
0 und
zwei zueinander senkrechten Einheitsvektoren und
aufgespannt. Es ist also 0 ,
: 6.
Eine beliebige Kurve in dieser Ebene und ihr Tangentenvektor kann dann wie folgt dargestellt werden,
der Kurvenparameter, und und & & (2.67)
Hier ist
sind zunächst zwei beliebige Funktionen, die nur hinreichend
oft differenzierbar sein müssen. Ein Kreis hat die Eigenschaft, dass jeder Punkt auf der Kurve denselben
6 vom Mittelpunkt hat. Das ist genau dann der Fall, wenn
Abstand
41
(2.68)
replacements
(c)
(d)
(b)
(a)
Abbildung 2.5: Ein Kreis mit Radius in einer durch zwei orthogonale Einheitsvektoren und
aufgespannten Ebene wir durch die Ortsvektordarstellung (2.80) beschrieben (a). Der Kurvenparameter
ist der durchlaufene Winkel, und die Umlaufrichtung entspricht der Orientierung der Ebene, wenn ihr
Normalenvektor durch
gegeben ist. Der Winkel zwischen zwei Vektoren hängt über (2.88)
mit den Skalarprodukt, und über (2.91) mit dem Kreuzprodukt zusammen (b).
ist. Zusätzlich wollen wir fordern, dass der Kurvenparameter der durchlaufene Winkel ist. Der Winkel
eines Kreisbogens ist definiert als das Verhältnis der Bogenlänge zum Radius. Sei also wie oben die
Kurvenlänge, gemessen von der Stelle 6 aus. Dann soll sein, und somit . Die
Ableitung der Kurvenlänge hängt wiederum über (2.59) mit dem Betrag des Tangentenvektors zusammen.
Also lautet die zweite Forderung
(2.69)
In Abbildung 2.5(a) sind diese Eigenschaften der Kurve noch einmal zusammengefasst. Der Kreis
liegt in der von und
aufgespannten Ebene, und der Kreisbogen, der zu einem Winkel gehört, hat
die Länge
.
Die Gleichungen (2.68) und (2.69) lassen sich in eine Forderung an die Funktionen und un deren
Ableitungen übersetzen. Es muss eins von zwei Paaren von Gleichungen erfüllt sein, und zwar entweder
oder
& " & (2.70)
& & " (2.71)
Aufgabe 2.35 Man zeige, dass die Forderungen (2.68) und (2.69) an die Kurve tats ächlich (2.70) oder
(2.71) implizieren, wenn man die explizite Darstellung (2.67) einsetzt.
Die beiden Alternativen (2.70) und (2.71) unterscheiden sich nur um das Vorzeichen einer der beiden
gesuchten Funktionen. Das entspricht einer Umkehrung eines der Vektoren oder , und damit letztlich
der Umlaufrichtung des Kreises. Wir können uns daher ohne Beschränkung der Allgemeinheit auf eine
Möglichkeit festlegen. Ferner können wir noch eine Anfangsbedingung stellen. Wie in Abbildung 2.5
42
gezeigt, soll die Kreislinie bei 6 an der Stelle 6 folgenden an und zu stellenden Forderungen,
& " & beginnen. Insgesamt erhalten wir dann die
6 &
6 6 (2.72)
Für 0 sind dies die üblichen Definitionen der Winkelfunktionen Sinus und Kosinus. Sie sind durch die
Eigenschaften
3! & " &
1! 3! 6 &
0 6 &
6
(2.73)
festgelegt. Man kann sich leicht überlegen, dass die Funktionen und 1! durch diese Forderungen
eindeutig bestimmt sind. Es handelt sich nämlich um ein System von Differenzialgleichungen erster Ordnung mit Anfangsbedingungen. Solche Gleichungssysteme sind in der Physik von großer Bedeutung. Wir
werden im nächsten Kapitel näher darauf eingehen.
Wir können aber hier schon kurz ein Argument dafür angeben, warum die Forderungen (2.73) die Funktionen und 3! eindeutig festlegen. Wir kennen die Funktionswerte an der Stelle 6 , und damit auch
die Ableitungen der beiden Funktionen. Wir wissen also, wie sie sich verändern, wenn wir ein wenig
erhöhen. Damit kennen wir auch die Funktionswerte “in der Nähe” von 6 . Somit kennen wir auch die
Ableitungen dort und können daraus wieder schließen, wie sich die Funktionen verändern, und so weiter.
Auf diese Weise können wir uns, anschaulich formuliert, zu immer größeren Werten von vortasten
und so die Funktionswerte für jedes finden. Das ist, wie wir im nächsten Kapitel sehen werden, genau
die Vorstellung, nach der auch die Bahn eines Körpers im Raum durch dessen Bewegungsgleichung bestimmt wird. Hier haben die Funktionen noch keine derartige unmittelbar physikalische Bedeutung, aber
der mathematische Sachverhalt ist der gleiche. Ein System von Differenzialgleichungen mit Anfangsbedingungen legt einen Satz von Funktion eindeutig fest.
Wir können aus (2.73) aber noch mehr schließen. Als Beispiel wollen wir zunächst zeigen, dass für alle
3! 0
(2.74)
ist. Daraus folgt unter anderem, dass beide Funktionen nur Werte zwischen " 0 und 0 annehmen. Der
Beweis nicht schwierig. Setzen wir ; 3! . Dann ergibt sich unmittelbar aus (2.73)
6 & 0 . Ferner gilt für die Ableitung
7 7 3! 1! 7 3! " 7 3! 9 6 und (2.75)
6 . Auch das ist wieder eine
Die Funktion erfüllt also die Gleichungen 6 0
Differenzialgleichung mit Anfangsbedingung, deren eindeutige Lösung & 0 ist. Damit haben wir die
Formel (2.74) bewiesen.
Mit Hilfe eines ähnlichen Argumentes lässt sich sogar zeigen, dass die Funktionen 3! und periodisch sind. Wir nehmen dazu wir an, es gäbe irgendeine kleinste positive Zahl, nennen wir sie , mit
6 . Die Zahl ist also die erste positive Nullstelle der Sinusfunktion. Dann ist wegen (2.74)
1! 0 oder 1! ? " 0 . Aus der Definition (2.73) folgt aber, dass im Intervall 6
überall
6 ist. Denn es ist 6 * 1! 6 / 0
6 , und zwischen 6 und gibt es keine Nullstelle.
, und somit muss 1! 3! 6 # 0
Daraus folgt wiederum 3! # " 6 für 6
3!
0
& " .
sein. Also ist
Wir wissen also, dass & 6 und 3! & " 0 ist. Nun definieren wir die Funktionen
3! & " 3! und & " (2.76)
43
Für sie gelten die gleichen Differenzialgleichungen wie für die Funktionen 3! und . Leiten wir nämlich
jeweils beide Seiten dieser Gleichungen nach ab, so finden wir
1! & " 3! &
& " & " & " 3! &
3! (2.77)
Ferner gelten für die Funktionen 1! und die gleichen Anfangsbedingungen,
3! 6 & " 3! 0 6 & " & 6 (2.78)
Also sind es die gleichen Funktionen. Es ist 1! & 1! und & . Und daraus wiederum
folgt, dass sie die Winkelfunktionen periodisch sind,
" 1! " 3! 3! 7 & 7 & 3! (2.79)
Aufgabe 2.36 Man beweise, dass es eine solche Zahl tatsächlich gibt, indem man die Annahme, es sei
6 für alle
6 zu einem Widerspruch führt.
Der Wert der Zahl lässt sich nur durch numerische Näherungsverfahren bestimmen. Man findet, wie wir
0 0 7
. Die Periode der Winkelfunktionen ist dann 7 , und
natürlich wissen, einen Wert von das ist folglich auch der Winkel eines vollen Kreises. Denn die eindeutige Lösung von (2.72) lautet nun
&
3!
3! 8 (2.80)
Es ist üblich, bei den Winkelfunktionen die Klammern wegzulassen, wenn das Argument der Funktion
nur aus einem Symbol besteht. Die Funkionen 1! und “wirken” immer nur auf das nächstfolgende
Zeichen, hier also auf .
Aufgabe 2.37 Man beweise
3! %"
& 3! 2"
" (2.81)
und zeige anschließend
3! 0 7 %" Warum folgt daraus, dass ein rechter Winkel den Wert 7
6 7 für
(2.82)
hat?
Aufgabe 2.38 Man leite aus der Definition (2.73) die folgenden Additionstheoreme f ür die Winkelfunktionen her,
3! 3! 1! " 1! = 3!
(2.83)
Der Beweis kann analog zum Beweis der Formel (2.74) geführt werden, die sich aus dem ersten Additions 6 ergibt.
theorem für Aufgabe 2.39 Die Exponentialfunktion 4 Eigenschaft, dass sie mit ihrer Ableitung über 0 ist. Man benutze dies undhatdiedieDefinitionen
einstimmt und
(2.73) der Winkelfunktionen, um die
Formel
; 1! (2.84)
zu beweisen, wobei die imaginäre Einheit, also 44
" 0 ist.
replacements
(a)
(b)
(c)
(d)
Abbildung 2.6: Die Winkelfunktionen Sinus und Kosinus sind durch die Differenzialgleichungen mit
und an, haben eine
Anfangsbedingungen (2.73) eindeutig festgelegt. Sie nehmen Werte zwischen Periode von , kehren jeweils nach einer halben Periode ihr Vorzeichen um, und gehen bei Verschiebung
um eine viertel Periode ineinander über.
Aufgabe 2.40 Um die Funktionen und 1! numerisch zu berechnen, entwickelt man sie in eine Potenzreihe,
3! (2.85)
Man zeige, dass sich aus den Forderungen (2.73) Rekursionsformeln f ür die Koeffizienten
Reihen ergeben, und dass diese dadurch eindeutig bestimmt sind. Man bestimme sie.
und dieser
Aufgabe 2.41 In der Praxis werden Winkel in Grad angegeben. Daraus k önnte man schließen, dass der
Winkel eine physikalische Größe mit Einheit ist, also eine dimensionsbehaftete Größe. Warum ist dieser Schluss falsch? Warum gibt es, laut unserer Definition, keine physikalische Gr ößenart “Winkel”? In
welchem Sinne ist daher die “Einheit” Grad zu verstehen?
Winkel und Skalarprodukt
Schließlich können wir noch eine ganz allgemeine Beziehung zwischen dem Winkel zwischen zwei Vektoren und dem Skalarprodukt herleiten. Wir betrachten noch einem die durch (2.80) dargestellte Kreiskurve.
Der Einfachheit halber setzen wir 0 . Dann handelt es sich um einen Einheitskreis, und die Vektoren
sind Einheitsvektoren.
Bilden wir das Skalarprodukt von den Vektoren und , so finden wir
: 1! : 3! 3! 1! 3! " (2.86)
Hier haben wir das Additionstheorem (2.83) sowie die Eigenschaft (2.81) des Sinus benutzt.
Nun ist "
gerade der Winkel zwischen den Vektoren und . Wir schließen daraus, dass das
Skalarprodukt zweier Einheitsvektoren durch den Kosinus des von ihnen gebildeten Winkels gegeben ist.
45
Das ist deshalb der Fall, weil wir immer eine Ebene finden können, und in diese Ebene einen Einheitskreis
legen können, so dass die beiden Vektoren auf diese Weise dargestellt werden können.
Das können wir leicht verallgemeinern. Es seien und irgendwelche zwei Vektoren. Dann existiert
immer eine Ebene, die die beiden Vektoren enthält. Wenn die Vektoren linear unabhängig sind, also in
verschiedene Richtungen zeigen, dann ist die Lage dieser Ebene eindeutig bestimmt. Ansonsten sind die
Vektoren zueinander proportional. Dann wählen wir einfach irgendeine Ebene aus, die von den beiden
Vektoren aufgespannte Gerade enthält. In dieser, in Abbildung 2.5(b) dargestellten Ebene können wir den
Winkel zwischen den beiden Vektoren messen, den wir mit < bezeichnen.
Dieser Winkel hängt natürlich nicht von dem Betrag der Vektoren ab, sondern nur von deren Richtungen.
Folglich können wir genauso gut den Winkel zwischen den Einheitsvektoren und bestimmen.
Für diesen Winkel gilt, wie wir gerade gesehen haben, dass sein Kosinus durch das Skalarprodukt der
beiden Vektoren gegeben ist. Folglich ist
3! 5 oder
Winkel zwischen
Vektoren
;: : 5: (2.87)
3! 5 (2.88)
Damit haben wir eine allgemeine Beziehung zwischen dem Skalarprodukt und einem Winkel hergeleitet.
Das Skalarprodukt von zwei Vektoren ist das Produkt ihrer Beträge mit den Kosinus des eingeschossenen Winkels.
Bei der Winkelmessung tritt jedoch ein Problem auf. Wir können ihn in zwei Richtungen messen. Wenn
wir wie in Abbildung 2.5(b) messen, bekommen wir einen Winkel 5% . Wenn wir dagegen in
7
die andere Richtung messen, ergibt sich der Wert "
. Für die Beziehung (2.88) zwischen Winkel und
& 1! .
Skalarprodukt ist das unerheblich, denn es gilt 3! 7 "
Um den Winkel 5% 1 zwischen zwei von Null verschiedenen Vektoren eindeutig festzulegen, können
wir uns aber darauf einigen, ihn immer auf dem kürzesten Weg zu messen. Der Wertebereich des Winkels
ist dann
6 5% (2.89)
Das ist genau der maximale Bereich, auf dem die Kosinusfunktion in Abbildung 2.6 eindeutig umkehrbar
ist. Durch die Beziehung (2.88) wird daher für jedes Paar von Vektoren ! eindeutig ein Winkel
5 definiert. Er ist genau dann gleich Null, wenn die Vektoren in die gleiche Richtung zeigen, er ist
gleich , wenn sie in entgegengesetzte Richtungen zeigen, und nimmt sonst Werte dazwischen an.
Aufgabe 2.42 Welche Rolle spielt die Schwarzsche Ungleichung (1.17) bei dieser Definition des Winkels
5 ?
Schließlich können wir auch Winkel im Raum einführen. Sind drei paarweise verschiedene
Punkte, so ist der Innenwinkel des Dreiecks im Punkt durch 5 5 gegeben,
also durch den Winkel zwischen den beiden Vektoren, die von nach bzw. zeigen. Da der Innenwinkel in einem Dreieck ebenfalls nur Werte zwischen 6 und annehmen kann, ist er eindeutig durch die
Gleichung
Winkel
3! < : (2.90)
im Raum
festgelegt. Diese Definition ist noch einmal in Abbildung 2.7(a) dargestellt.
46
(a)
(b)
in einem Dreieck ist durch den Winkel zwischen den Vektoren
Abbildung 2.7: Der Winkel die üblichen Bezeichnungen für die
und
definiert (a). Führt man in einem allgemeinen Dreieck
Seitenlängen und Winkel ein, so gelten die bekannten Sätze der Euklidischen Geometrie (b).
Aufgabe 2.43 Man zeige, dass der Betrag des Kreuzproduktes ebenfalls durch die Betr äge der Vektoren
und den Winkel zwischen ihnen ausgedrückt werden kann,
5% (2.91)
Das ist natürlich auch eine bekannte Formel für den Flächeninhalt eines Parallelogramms.
Aufgabe 2.44 Es sei das in Abbildung 2.7(b) dargestellte Dreieck. Wir verwenden die üblichen
Bezeichnungen für die Seitenlängen
und die Winkel
<
Man beweise den Kosinussatz,
7& 3!
den Sinussatz,
sowie den Satz über die Winkelsumme,
<
7 3!
5 (2.92)
7 3! (2.93)
(2.94)
(2.95)
(2.96)
Aufgabe 2.45 Der Winkel zwischen zwei sich schneidenden Ebenen ist durch den Winkel zwischen ihren
Normalenvektoren gegeben. Man berechne der Winkel, unter dem sich je zwei Seitenfl ächen des gleichseitigen Tetraeders in Abbildung 2.3(b) schneiden.
Messgrößen und Axiome
Zum Schluss wollen wir noch einmal die Diskussion aufgreifen, die wir am Ende des letzten Kapitels
über Messgrößen und Messvorschriften geführt haben. Durch eine Messvorschrift wird eine in der Theorie zunächst als abstraktes mathematisches Objekt eingeführte Größe mit der Skala eines Messgerätes
identifiziert. Als eine solche Messgröße hatten wir bereits den Abstand zweier Orte definiert. Wir können
47
PSfrag replacements
(a)
(b)
(c)
(d)
Abbildung 2.8: Ausschnitt aus dem Netz von Dreiecken, die von Gauß um 1820 vermessen wurden. Eine
Abweichung der Winkelsumme von konnte auch bei sehr großen Dreiecken nicht gefunden werden.
nun entsprechende Messvorschriften für die neuen Größen Fläche, Volumen, Kurvenlänge und Winkel
einführen.
Zur Messung der Kurvenlänge können wir dasselbe Maßband verwenden, das wir auch schon zur Definition der Messgröße Abstand benutzt haben. Wir müssen es nur, statt es zu spannen ,entlang der gegebene
Kurve auslegen. Das ist deshalb möglich, weil beide Größen dieselbe physikalische Dimension haben,
nämlich die einer Länge. Andere Größenarten können wir mit einem Maßband jedoch nicht messen.
Um Flächen, Volumen und Winkel zu messen, müssen wir uns andere Messgeräte ausdenken. Winkel
sind in diesem Zusammenhang von besonderem Interesse, denn eine der experimentell am einfachsten zu
testenden Aussagen der Euklidischen Geometrie ist der Winkelsummensatz (2.96). Während alle anderen
Sätze über Dreiecke immer auch auf deren Seitenlängen Bezug nehmen, genügt für die Überprüfung des
Winkelsummensatzes allein die Messung von drei Winkeln.
Das hat den Vorteil, dass man relativ einfach sehr große Dreiecke vermessen kann, wenn es gelingt, ein
Messgerät für einen Winkel zu konstruieren, das “lokal” arbeitet, sich also ganz an einem der drei Ecken
des Dreiecks befindet. Ein solches Messgerät ist ein Sextant. Ein Sextant besteht im wesentlichen aus zwei
Spiegeln, mit deren Hilfe man zwei aus unterschiedlichen Richtungen einfallende Bilder übereinander
projizieren kann. Aus der Stellung der Spiegel lässt sich der Winkel zwischen den Einfallsrichtungen
ablesen. Stellt man den Sextanten an einem Ort auf und peilt zwei andere Orte und an, so misst
man mit ihm den Winkel 5 .
Von der Antike bis zu den ersten Satellitenbildern beruhte fast die gesamte Landvermessung auf der Vermessung von Dreiecken mit dieser Technik. Dass man solche Messungen auch als Test der Euklidischen
Geometrie benutzen kann, als allerdings eine relative neue Erkenntnis. Das lag im wesentlichen daran,
dass die Euklidische Geometrie, wie bereits erwähnt, lange Zeit als reine Mathematik betrachtet wurde.
Die Erkenntnis, das die der Raum auch eine andere Struktur haben könnte, geht auf einige Mathematiker
am Anfang des 19. Jahrhunderts zurück, darunter vor allem Gauß und Riemann, der die schon erwähnte
Riemannsche Geometrie entwickelt hat.
Gauß hat unter anderem auch ein Projekt zur Landvermessung in Norddeutschland geleitet. Er hat die
Ergebnisse, gewissermaßen als Nebenprodukt, zum Test der Euklidischen Geometrie verwendet. Konkret
handelt sich sich dabei um die Bestimmung der Winkelsumme einiger sehr großer Dreieck, darunter das
mit Kantenlängen von 6 , 7 und 0 6 Kilometern bekannteste Gaußsche Dreieck, dessen Eckpunkte die
Berge Brocken, Inselberg und Hoher Hagen bildeten. Natürlich hat er, im Rahmen der damals verfügbaren
Messgenauigkeit, keine Abweichung vom Winkelsummensatz gefunden.
Darauf kommt es uns aber im Moment nicht an. Wir wollen vielmehr eine andere Frage diskutieren.
48
Nehmen wir an, jemand hätte Gauß bei seinen Messungen gefragt, ob das, was er dort messe, denn über haupt der Winkel 5 in einem Dreieck sei. Mit anderen Worten, wenn er eine Abweichung vom
Winkelsummensatz finden würde, würde das nicht vielmehr darauf hindeuten, dass es etwas ganz anderes
gemessen hat als den Winkel?
Ganz konkret könnte man einwenden, dass er ja nicht wirklich den Winkel in einem Dreieck gemessen
hätte, sondern den Winkel zwischen zwei Lichtstrahlen in einer Ecke des Dreiecks. Müssten wir demzufolge nicht erst einmal die Ausbreitung von Licht im Raum verstehen, um überhaupt sagen zu können,
was wir mit einem Sextanten messen? Ähnliches trifft auf die Längenmessung zu. Müssten wir nicht erst
einmal verstehen, woraus ein Maßband besteht, und wie es ich verhält, wenn wir es entlang einer Kurve
auslegen, ob es dadurch nicht vielleicht seine eigene Länge verändern kann, um sagen zu können, ob durch
diese Messung wirklich die Länge der Kurve festgestellt wird?
Das klingt alles sehr vernünftig, geht aber an der Sache, also an der Frage, was eine physikalische Theorie ist und wie man sie überprüfen kann, vorbei. Wir erinnern uns, dass die Angabe einer Messvorschrift
ein Teil der Definition einer Theorie ist, genau wie die mathematischen Axiome einer Theorie, die die
grundlegenden mathematischen Begriffe und Strukturen definieren. Die Messvorschriften sind gewissermaßen die physikalischen Axiome einer Theorie. Eine Axiom allein, also eine Definition, kann aber nicht
falsch sein. Wir können es auch nicht testen, indem wir irgendwelche Experimente machen.
ist.
Wir können nicht feststellen, ob das, was wir am Sextanten ablesen, wirklich die Größe <
Wir können nur drei solche Messungen in einem Dreieck machen und feststellen, ob die Summe der Messergebnisse beträgt oder nicht. Wenn das nicht der Fall ist, ist es völlig sinnlos zu fragen, woran das
liegt. Liegt es daran, dass der Winkelsummensatz falsch ist, oder daran, dass das, was der Sextant misst,
gar nicht der Winkel ist? Ersteres würde in logischer Konsequenz bedeuten, dass eines der mathematischen Axiome falsch wäre, letzteres dagegen, dass eines der physikalischen Axiome der Theorie falsch
wäre. Beides ist für sich genommen aber unsinnig. Nur die Theorie als ganzes kann richtig oder falsch
sein. Wenn etwas nicht stimmt, ist es nicht möglich, zu entscheiden, ob der Fehler auf einem “falschen”
mathematischen oder einem “falschen” physikalischen Axiom beruht.
Um eine physikalische Theorie zu verstehen, ist es deshalb ganz wichtig, sich klar zu machen, dass ein
physikalischen Axiom, also eine Messvorschrift, innerhalb der Theorie die gleiche logische Stellung hat
wie ein mathematisches Axiom. Es wäre sinnlos, dieses als einzelnes zu hinterfragen oder zu versuchen,
es auf seine Richtigkeit zu prüfen. Ein berühmtes Zitat von Einstein bringt diesen Sachverhalt sehr gut auf
den Punkt.
Die Theorie bestimmt, was wir beobachten.
Die Betonung liegt hier auf “was”. Es geht nicht nur darum, dass die Theorie, so wie wir dies bereits
im letzten Kapitel gezeigt haben, Aussagen über konkrete Messergebnisse macht, also Aussagen darüber,
was im Sinne von welches Messergebnis wir finden. Die Theorie ist es auch, die uns sagt, als was wir eine
Größe, die wir messen, zu interpretieren haben, zum Beispiel als Winkel im Dreieck, als Abstand zwischen
zwei Punkten, als Kurvenlänge oder was auch immer. Sie tut dies, indem sie als Teil ihrer Definition
bestimmte mathematische Größen mit Messinstrumenten identifiziert.
Es wäre sinnlos, im Rahmen einer Theorie verstehen wollen, warum dieses oder jenes Messgerät diese
oder jene Größe misst. Im Rahmen der Euklidischen Geometrie, so wie wir sie hier eingeführt haben, wird
die Messgröße Winkel durch das Messinstrument Sextant definiert. Wir können nicht verstehen, warum
ein Sextant einen Winkel misst. Wir postulieren es einfach. Genauso wenig können wir verstehen, warum
das Skalarprodukt symmetrisch ist. Es ist einfach ein Teil der Definition des Begriffes “Skalarprodukt”, so
die der Sextant ein Teil der Definition des Begriffes “Winkel” ist.
Dass wir letztlich doch irgendwie verstehen können, warum ein Sextant einen Winkel misst, liegt daran,
dass es natürlich Theorien gibt, die über die reine Geometrie des Raumes hinaus gehen. Im Rahmen einer
umfassenderen Theorie können wir dann sehr wohl verstehen, wie ein Sextant funktioniert. Bei der obigen
49
Erklärung der Funktionsweise eine Sextanten haben wir eine solche, umfassendere Theorie benutzt, ohne
dies explizit zu sagen. Wir haben die elementaren Begriffe und Aussagen der Strahlenoptik benutzt.
Die Strahlenoptik besagt im wesentlichen, dass sich Licht auf Geraden im Raum ausbreitet, wobei die
Geraden genau die Objekte sind, die wir am Anfang dieses Kapitels eingeführt haben. Und sie besagt,
dass sich Licht an Spiegeln so verhält, wie wir dies eben aus dem Alltag kennen, nach den bekannten
Reflexionsgesetzen. Im Rahmen der Strahlenoptik verstehen wir die Funktionsweise eines Sextanten, und
wir verstehen auch, warum sich zwei Lichtstrahlen, die von der Orten und kommen, am Ort unter
dem Winkel 5 schneiden.
Aber wird dadurch das Problem gelöst, dass es immer die Theorie ist, die bestimmt, was wir eigentlich
beobachten? Nein, denn es wird nur verschoben. Wir verstehen zwar jetzt, wie ein Sextant funktioniert,
aber wir verstehen immer noch nicht, wie ein Spiegel funktioniert. Ein Spiegel ist in der Strahlenoptik
durch ein physikalisches Axiom definiert, genau wie ein Sextant in der Euklidischen Geometrie. Es wäre
unsinnig, im Rahmen der Strahlenoptik verstehen zu wollen, warum sich Licht an einem Spiegel den
Reflexionsgesetzen gemäß verhält. Das ist nämlich das Axiom, das einen Spiegel definiert. Verstehen
können wir die Funktion eines Spiegels erst im Rahmen einer noch umfassenderen Theorie, nämlich der
Wellenoptik oder der Elektrodynamik.
Natürlich wollen wir hier nicht weiter auf diese Theorien eingehen, denn wir stehen ja erst ganz am
Anfang des physikalischen Theoriengebäudes. Um alle diese Theorien zu verstehen, ist es aber wichtig,
auch die Grenzen einer Theorie zu erkennen, und sich stets darüber im klaren zu sein, dass letztlich jede
Theorie auf physikalischen Axiomen aufbaut, die wir nicht innerhalb der jeweiligen Theorie verstehen
oder erklären können. Es war sogar gerade diese Einsicht, die die Entwicklung vieler moderner Theorien
erst ermöglicht hat.
Was Zeit wirklich ist, verstehen wir zum Beispiel erst, seit Einstein festgestellt hat, dass es sich dabei um
eine physikalische Größe wie jede andere handelt, die mit einem Messinstrument assoziiert ist, das wir Uhr
nennen, und zwar genau so wie Abstand eine Messgröße ist, die mit einem Maßband als Messinstrument
assoziiert ist. Aber darauf werden wir im nächsten Kapitel gleich noch näher eingehen.
Aufgabe 2.46 Wieviel ist ein Nachdruck der in Abbildung 2.8 gezeigten, von Gauß vermessenen Dreiecke
zusammen mit anderen auf ihn zurückgehenden mathematischen Darstellungen heute in etwa wert?
Aufgabe 2.47 Mit einem Maßband als Messgerät können wir, das hatten wir schon festgestellt, nicht den
Abstand von hier zum Mond messen. Können wir diesen Abstand überhaupt irgendwie messen? Und wenn
nicht, warum kennen wir ihn trotzdem? Kennen wir ihn eigentlich wirklich? Wie verh ält es sich mit dem
Abstand von hier zum Sirius? Oder mit dem Abstand des Sirius vom Andromeda-Nebel?
3 Klassische Mechanik
Die klassische Mechanik beschreibt die Bewegungen von Körpern im Raum. Sie wurde im wesentlichen
von Newton formuliert und wird deswegen auch als Newtonsche Mechanik bezeichnet. Ihre Grundbegriffe
wollen wir in diesem Kapitel einführen. Genau genommen handelt es sich bei der klassischen Mechanik
gar nicht um eine physikalische Theorie im eigentlichen Sinne, sondern eher um ein Gerüst, oder ein
allgemeines Schema zur Konstruktion einer Theorie.
Zu einer physikalischen Theorie wird die klassische Mechanik erst, wenn man für ein spezielles mechanisches System zusätzliche Aussagen über die Art der beteiligten Körper und deren Beziehungen zueinander macht. Trotzdem bietet die klassische Mechanik ein sehr nützliches und vor allem sehr allgemeines
Rezept zur Formulierung solcher Theorien, weil man letztlich nur sehr wenige Parameter an das jeweilige
System anpassen muss, um eine fertige Theorie zu bekommen.
50
Zunächst werden wir uns nur mit sehr einfachen Systemen befassen und daran die Grundbegriffe der
Mechanik erklären. Die einfachsten mechanischen Systeme bestehen aus Punktteilchen, also Körpern, die
keine oder eine vernachlässigbar kleine räumliche Ausdehnung haben. Später werden wir zeigen, wie wir
daraus Beschreibungen von komplexeren Systeme ableiten können, zum Beispiel von starren Körpern oder
Flüssigkeiten, ohne die grundlegenden Konzepte neu überdenken zu müssen.
Die klassische Mechanik mit den aus ihr abgeleiteten Theorien deckt, zusammen mit der klassischen
Elektrodynamik, fast den gesamten “alltäglichen” Bereich der Physik ab. Das ist in etwa alles, was sich in
uns unmittelbar zugänglichen, “irdischen” Größenordnungen abspielt. Ihre Grenzen findet die klassische
Mechanik bei sehr kleinen Strukturen in atomaren Größenordnungen, wo nur noch die Quantenmechanik
eine richtige Beschreibung liefert, und in Größenordnungen, bei denen die Beschreibung des Raumes
durch die Euklidische Geometrie versagt.
Letzteres hatten wir in den ersten beiden Kapitel bereits kurz angesprochen. Um die Struktur des Raumes, und übrigens auch die der Zeit, sehr genau und auf Größenordnungen, die über die Abmessungen
unseres Sonnensystems hinaus gehen, richtig zu beschreiben, müssen wir die Relativitätstheorie verwenden. Der Gültigkeitsbereich der klassischen Mechanik ist also nach oben und unten begrenzt, umfasst aber
ein sehr weites Gebiet, insbesondere fast den gesamten Bereich der technischen Anwendungen der Physik.
Zeit und Uhr
Bis jetzt haben wir nur den Raum selbst im Rahmen einer physikalischen Theorie beschrieben. Nun wollen wir Vorgänge beschreiben, die in diesem Raum stattfinden. Dazu müssen wir die Zeit als eine neue
physikalische Größe einführen. Sie wird durch ein Messgerät definiert, das wir Uhr nennen.
Eine Uhr ist ein Gerät, in dem ein periodischer Vorgang abläuft, zum Beispiel eine Pendelbewegung, das
Schwingen eines Kristalls oder der Umlauf eines Planeten um einen Stern. Ein auf der Uhr angebrachtes
Zählwerk zeigt an, wie viele dieser Vorgänge bereits abgelaufen sind. Die Messgröße, die auf dieser Skala
angezeigt wird, nennen wir “Zeit”.
Die Zeit ist das, was eine Uhr anzeigt.
Auch hier gilt, was wir gerade über Messgrößen wie Längen und Winkel gesagt haben. Es ist an dieser
Stelle nicht sinnvoll, danach zu fragen, was Zeit “wirklich” ist. Es handelt sich um eine Definition, gewissermaßen das erste physikalische Axiom der klassischen Mechanik. Es gilt in dieser Form sogar für alle
modernen physikalischen Theorien, einschließlich der Relativitätstheorie und der Quantenphysik.
Dass sich hinter dem Begriff “Zeit” nicht mehr verbirgt als die Anzeige einer Uhr, ist auf den ersten
Blick vielleicht etwas befremdlich. Es entspricht auch gar nicht der ursprünglichen Vorstellung, die Newton von der Zeit hatte, als er die klassische Mechanik entwickelte. Die ursprüngliche Vorstellung von Raum
und Zeit in der klassischen Physik war, dass beide Strukturen unabhängig von irgendwelchen Messinstrumenten existieren. Ein Ort im Raum wird nicht erst dadurch zu einem Ort, dass er mit einem Gegenstand
markiert wird, und die Zeit läuft auch nicht deshalb ab, weil sie von einer Uhr gemessen wird. Raum und
Zeit existierten in Newtons Vorstellung als absolute Strukturen unabhängig von unseren Beobachtungen
und Experimenten.
Dass diese Vorstellung falsch war, wissen wir seit Einstein die Relativitätstheorie formuliert hat und diese auch experimentell bestätigt wurde. Es erfordert daher ein völliges Umdenken, den Übergang von der
klassischen zur modernen, relativistischen Physik zu vollziehen, wenn man zuvor die klassische Physik
auf einem absoluten Raum- und Zeitbegriff aufgebaut hat. Das wollen wir vermeiden. Auch die klassische Mechanik lässt sich ohne den Begriff des absoluten Raumes und der absoluten Zeit formulieren. So,
wie wir in den letzten beiden Kapiteln die Struktur des Raumes allein durch Messgrößen und ihre Zuordnung zu mathematischen Strukturen beschrieben haben, können wir nun auch die Zeit als eine Messgröße
beschreiben.
51
Da eine Uhr die Zeit auf einer Skala anzeigt, ist die Zeit eine skalare, also ungerichtete Größe. Die
klassischen Physik nimmt an, dass die Zeit eine kontinuierliche Größe ist, also durch eine reelle Zahl
dargestellt wird. Sie wird in der Regel mit bezeichnet. Da sie nichts mit Längen, Flächen oder Winkeln
zu tun hat, handelt es sich um eine neue Größenart. Wir müssen folglich auch eine neue Einheit einführen,
um die Zeit zu messen. Die gebräuchliche Einheit heißt Sekunde (s),
0 s
(3.1)
Sie wird durch eine genau definierte Standard-Uhr festgelegt. Ursprünglich war diese Standarduhr die
6 6 ste Teil eines mittleren Sonnentages definiert, also
rotierende Erde. Eine Sekunde wurde als der
durch den periodischen Vorgang des Sonnenauf- und -untergangs. Die Erdrotation ist jedoch nicht ganz
gleichmäßig. Die Gezeiten führen zum Beispiel dazu, dass die so definierte “Erduhr” innerhalb von tausend
Jahren um einige Stunden nach geht.
Heute definiert man die Sekunde, ähnlich wie das Meter, durch einen im Mikrokosmos ablaufenden
periodischen Vorgang, nämlich die Schwingung eines Cäsium-Atoms. Wir können uns vorstellen, dass ein
Atom spezielle Eigenschwingungen ausführt, und dass man diese Schwingungen mit einem geeigneten
Messgerät zählen kann. Auf diese Weise arbeitet eine Atomuhr. Für die theoretische Physik ist das jedoch
nicht weiter interessant. Entscheidend ist allein, dass durch die Zeit eine neue Größenart, also eine neue
physikalische Dimension definiert wird.
Aufgabe 3.1 Uhren, die über einen langen Zeitraum hinweg genau genug arbeiten, um damit die Abweichung der Erdrotation von einer exakt periodischen Bewegung zu messen, gibt es erst seit wenigen
Jahrzehnten. Warum lässt sich trotzdem die Rotationsbewegung der Erde über die letzten etwa drei- bis
viertausend Jahre hinweg mit einer sehr großen Genauigkeit rekonstruieren?
Dynamische Systeme
Mit Hilfe der Zeit als Messgröße lassen sich andere Vorgänge beschreiben. Das allgemeine Konzept, das
einer solchen Beschreibung zu Grunde liegt, ist das eines dynamischen Systems. Ein dynamisches System
besteht aus einer Menge von physikalischen Objekten, die verschiedene Zust ände annehmen können. Die
Objekte können Gegenstände im Raum, Elektronen in einem Atom, Planeten im Sonnensystem, elektrische Schaltungen, Lichtstrahlen in einem Glasfaserkabel, oder was auch immer sein.
Der Zustand eines dynamischen Systems beschreibt die momentane Konfiguration dieser Objekte. Wie
genau diese Beschreibung aussieht, hängt natürlich von der Art des jeweiligen Systems ab. Das Konzept
eines dynamischen Systems ist sehr allgemein und lässt sich auf fast alle Bereiche der Physik anwenden.
Bei einem mechanischen Systems wird der Zustand, wie wir gleich sehen werden, durch die Orte und
Geschwindigkeiten aller beteiligten Körper festgelegt.
Einem dynamischen System können wir einen Zustandsraum
zuordnen. Das ist die Menge aller
möglichen Zustände, die das System annehmen kann. Jedem Zustand entspricht genau ein Element 9
des Zustandsraumes. Um festzustellen, in welchem Zustand sich das System gerade befindet, müssen
wir eine oder mehrere Messungen an dem System vornehmen. Auf diese Weise können wir den Zustand
bestimmen, oder zumindest gewisse Information über ihn erlangen, etwa dass er in einer bestimmten
Teilmenge von liegt.
Die wesentliche Eigenschaft eines dynamischen Systems ist, dass es seinen Zustand mit der Zeit
verändert. Dieser Vorgang wird durch eine Funktion beschrieben, die zu jeder Zeit angibt,
in welchem Zustand + sich das System gerade befindet. Indem wir zu verschiedenen Zeiten Messungen am System vornehmen und gleichzeitig eine Uhr ablesen, können wir einzelne Funktionswerte
+ + bestimmen, wobei 3 die an der Uhr abgelesenen Zeiten sind. Im Idealfall kann es
sogar möglich sein, das System über einen gewissen Zeitraum hinweg quasi kontinuierlich zu beobachten,
so dass man danach die Funktion + für ein bestimmtes Zeitintervall kennt.
52
Eine physikalische Theorie über ein dynamisches System besteht im wesentlichen aus zwei Teilen.
Zunächst macht sie ein Aussage über die mathematische Struktur des Zustandsraumes. In den meisten,
aber nicht in allen Beispielen, die wir in diesem und den folgenden Kapiteln diskutieren werden, wird dies
ein affiner Raum oder sogar ein Vektorraum sein. So wird eine Abbildung der gegebenen physikalischen
Struktur auf eine mathematische Struktur hergestellt. Darüber hinaus macht eine physikalische Theorie
Aussagen darüber, wie sich der Zustand mit der Zeit entwickelt. Deshalb können wir mit Hilfe der Theorie
Vorhersagen über das zukünftige Verhalten eines dynamischen Systems machen.
Konkret sieht das so aus, dass eine Theorie eine Zeitentwicklungsgleichung oder Bewegungsgleichung
postuliert. Eine Bewegungsgleichung ist eine Differenzialgleichung, die uns sagt, wie sich das System mit
der Zeit verändert, wenn es sich zu einer Zeit in einem Zustand + befindet. Es ist üblich, die Ableitung
einer Funktion nach der Zeit mit einem Punkt statt mit einem Strich zu bezeichnen. Die Bewegungsgleichung liefert also die Zeitableitung des Zustandes als Funktion des Zustandes + und eventuell der
Zeit ,
Bewegungsgleichung
(3.2)
Wie diese Bewegungsgleichung explizit aussieht, hängt wieder vom jeweiligen System ab, und natürlich
von der mathematischen Struktur des Zustandsraumes. Nehmen wir an, der Zustand eines Systems würde
durch skalare Größen festgelegt. Das Symbol steht dann als Abkürzung für einen Satz von reellen
Zahlen, sagen wir mit 0 3 . Entsprechend wird die Zeitentwicklung des Systems durch einen
Satz von reellen Funktionen beschrieben, und die Bewegungsgleichung (3.2) hat die Form
33 (3.3)
Das ist ein gekoppeltes System von Differenzialgleichungen erster Ordnung. Die Ableitungen der Funktionen hängen von den Funktionen selbst und der Variablen ab. Ein Beispiel für ein solches System
von Differenzialgleichungen hatten wir in einem ganz anderen Zusammenhang schon einmal benutzt, um
die Winkelfunktionen zu definieren.
Wir wollen annehmen, dass die Funktionen , die jeweils von 0 Variablen abhängen, stetig und
differenzierbar sind. Nach dem Satz von Cauchy, Picard und Lindel öf besitzt das System von Differenzialgleichungen (3.3) dann genau eine Lösung, wenn wir zusätzlich eine Anfangsbedingung vorgeben.
Eine Anfangsbedingung legt den Zustand des Systems zu irgendeiner Zeit fest, also die Funktionswerte
#
. Mit anderen Worten, wenn wir den Zustand + < des Systems zu irgendeiner Zeit
kennen, dann liefert die Bewegungsgleichung eine eindeutige Funktion + , das heißt wir können den
Zustand zu jeder anderen Zeit berechnen.
Die Zeitentwicklung eines dynamischen Systems ist eindeutig durch die Bewegungsgleichung
und den Anfangszustand bestimmt.
Der andere Zeitpunkt kann in der Zukunft oder in der Vergangenheit liegen. Wir können sowohl die
zukünftige Entwicklung des Systems vorhersagen, als auch die vergangene Entwicklung rekonstruieren.
Natürlich nur unter der Annahme, dass die Theorie richtig ist, dass also die Bewegungsgleichung das
Verhalten des dynamischen Systems richtig beschreibt. Das müssen wir zuerst durch Experimente überprüfen. Um eine theoretische Beschreibung eines dynamischen Systems zu testen, müssen wir es über
einen gewissen Zeitraum hinweg beobachten und feststellen, ob seine Zeitentwicklung tatsächlich durch
die gegebene Bewegungsgleichung beschrieben wird.
Ein dynamisches System mit der Eigenschaft, dass seine gesamte vergangene und zukünftige Entwicklung festliegt, sobald der Zustand zu irgendeinem gegebenen Zeitpunkt bekannt ist, nennt man auch ein
ein deterministisches System. Die Vorstellung der klassischen Mechanik ist, dass die ganze Welt ein solches deterministisches System ist. Unsere Aufgabe wird im folgenden sein, kleine Teile aus dieser Welt
53
herauszugreifen, die sich in einer gewissen Näherung unabhängig von Rest der Welt beschreiben lassen,
und deren Verhalten zu berechnen, also ihre Bewegungsgleichungen zu lösen.
Aufgabe 3.2 Die Zeit werde durch eine Uhr definiert. Wir stellen neben diese Uhr eine zweite Uhr, und
betrachten diese als dynamisches System. Der Zustand der zweiten Uhr werde durch eine Funktion * beschrieben, die angibt, welche Zeit die zweite Uhr anzeigt, wenn die erste Uhr die Zeit anzeigt. Wie
lautet die Bewegungsgleichung für die Funktion ; ? Nehmen wir an, die zweite Uhr sei defekt und gehe
innerhalb eines Tages um eine Stunde nach. Wie lautet dann die Bewegungsgleichung f ür die Funktion
; ?
Das Punktteilchen
Was ein dynamisches System ist und wie es konkret beschrieben werden kann, lässt sich am besten an einem einfachen Beispiel erläutern. Das einfachste dynamische System, das die klassische Mechanik kennt,
ist das Punktteilchen. Ein Punktteilchen, oft auch einfach Teilchen genannt, ist die idealisierte Vorstellung
von einem Körper, der so klein ist, dass wir seine Ausdehnung um Vergleich zu den Abmessungen des
Raumes, in dem er sich bewegt, vernachlässigen können. Innerhalb einer gewissen Näherung können wir
dann so tun, als befände sich der gesamte Körper in einem Punkt des Raumes.
Was “klein” in diesem Zusammenhang bedeutet, hängt von der jeweiligen Fragestellung ab. Wenn wir
die Bewegung eines Elektrons in einer Bildröhre beschreiben wollen, können wir das Elektron in diesem
Sinne als klein ansehen. Falls es überhaupt eines Ausdehnung hat, so ist diese sehr klein im Vergleich zu
den Abmessungen der Bildröhre. Vielleicht ist ein Elektron sogar wirklich punktförmig. Auf jedem Fall
ist es so klein, dass die klassische Mechanik ohnehin versagt, wenn wir versuchen, seine innere Struktur
und damit seine räumliche Ausdehnung zu beschreiben. Wir müssten statt dessen die Quantenmechanik
verwenden.
Es wäre daher völlig sinnlos, ein Elektron als ausgedehntes Objekt zu betrachten, wenn wir seine Bewegungen gleichzeitig mit Hilfe der klassischen Mechanik beschreiben würden. Denn die klassische Mechanik ist letztlich nur eine Näherung der Quantenmechanik. Sie gilt nur für Systeme von einer gewissen
Größenordnung an aufwärts, etwa im Bereich von einigen Nano- oder Mikrometern oder darüber. Da das
Elektron sicher sehr viel kleiner als ein Nanometer ist, kann es im Rahmen der klassischen Mechanik als
punktförmiges Teilchen betrachtet werden.
Das Beispiel soll klar machen, dass die Vorstellung von einem punktförmigen Körper zwar auf den
ersten Blick etwas realitätsfern erscheint. Sie ist aber nicht mehr als eine N äherung, wie wir sie in jeder
praktischen Anwendung einer Theorie ohnehin durchführen müssen. Ob wir jemals zu einer wirklich
fundamentalen Theorie kommen werden, ist eine offene Frage. Solange wir eine solche Theorie nicht
haben, ist jede Theorie nur eine Näherung einer genaueren, vielleicht umfassenderen Theorie. Es wäre
deshalb sinnlos, auf eine Näherung innerhalb einer Theorie zu verzichten, wenn man zuvor schon allein
durch die Anwendung dieser Theorie eine Näherung durchgeführt hat, die zu einem wesentlichen größeren
Fehler führt.
Der Fehler, den wir machen, wenn wir ein Elektron mit Hilfe der klassischen Mechanik anstelle der
Quantenmechanik beschreiben, ist bereits viel größer als der, den wir machen, wenn wir eine mögliche
räumliche Ausdehnung des Elektrons vernachlässigen. Ob dieser Fehler immer noch klein genug ist, um
die Bewegung des Elektrons in der Bildröhre wenigstens annähernd richtig zu beschreiben, ist eine ganz
andere Frage. Um sie zu beantworten, müssen wir die Bewegung erst einmal konkret berechnen und das
Ergebnis dann mit der Realität vergleichen. Genau mit dieser Art von Aufgaben werden wir uns in den
folgenden Kapiteln ausführlich beschäftigen.
Ein anderes Beispiel für einen Körper, den wir als punktförmig ansehen können, ist ein Himmelsk örper,
dessen Bahn wir beschreiben wollen. Fast alle Himmelskörper sind sehr klein im Vergleich zu den räumlichen Gebieten, in denen sie sich bewegen, und im Vergleich zu den Entfernungen zwischen ihnen. Die
54
Planeten und ihre Monde sind sehr klein im Vergleich zu den Abmessungen des Sonnensystems. Wenn
es nur darum geht, die Bahnen der Planeten und Monde zu beschreiben, können wir sie als punktförmig
betrachten. Die Erde ist in diesem Sinne ein Punktteilchen. Das gleiche gilt für die Sterne in einer Galaxie.
Die Himmelsmechanik ist im wesentlichen eine Mechanik von Punktteilchen.
Auch hier gilt, was wir zuvor über das Elektron gesagt haben. Es wäre sinnlos, einen Himmelskörper
wie etwa die Erde im Sonnensystem als ausgedehntes Objekt zu betrachten, wenn wir gleichzeitig die
klassische Mechanik verwenden, um ihre Umlaufbahn um die Sonne zu berechnen. Die Abweichung der
berechneten von der tatsächlichen Bahn, die sich auf Grund der räumlichen Ausdehnung der Erde ergibt,
ist nämlich wesentlich kleiner als der Fehler, den wir allein schon durch die Anwendung der Newtonschen
Gravitationstheorie machen. Sie ist nämlich in diesem Fall nur eine Näherung der allgemeinen Relativitätstheorie. Erst wenn wir diese, wesentlich genauere Theorie verwenden, um die Bahnen der Planeten
zu beschreiben, ist es überhaupt sinnvoll, sie als ausgedehnte Körper zu betrachten.
Das Konzept eines Punktteilchens ist demnach eine für praktische Zwecke sehr nützliche Näherung,
obwohl es auf den ersten Blick einen sehr idealisierten und wirklichkeitsfernen Anschein hat, die Ausdehnung eines Körpers zu vernachlässigen. Es gibt darüber hinaus sogar Situationen, in denen diese Näherung
immer noch sehr gut ist, obwohl die Ausdehnung eines Körpers nicht mehr vernachlässigbar ist. Eine solche Situation liegt zum Beispiel dann vor, wenn ein Körper starr, also nicht verformbar ist, und, aus
welchen Gründen auch immer, nicht rotiert.
Wir werden das hier nicht beweisen können, weil wir dazu erst das Konzept eines starren Körpers
erarbeiten müssen. Es ist aber sehr nützlich, diese Aussage zunächst einmal zu akzeptieren. Ein nicht rotierender, starrer Körper verhält sich genau wie ein Punktteilchen, das sich im Schwerpunkt des Körpers
befindet. Viele der praktischen Beispiele, die wir in diesem und den nächsten Kapiteln studieren werden,
sind von dieser Art. Sie können als Systeme von Punktteilchen aufgefasst werden, obwohl die Ausdehnungen der beteiligten Körper nicht vernachlässigbar klein sind. Den Beweis dafür, dass die Newtonsche
Mechanik dies tatsächlich impliziert, werden wir später nachliefern.
Die Bahn
Wie beschreiben wir nun konkret die Bewegung eines Punktteilchens? Die wesentliche Eigenschaft eines
Punktteilchen ist, sich zu jedem Zeitpunkt an genau einem Ort im Raum aufzuhalten. Die Bahn des
Teilchens wird durch eine Funktion
(3.4)
beschrieben, die zu jeder Zeit angibt, wo im Ortsraum
sich das Teilchen gerade befindet, nämlich am
Punkt .
Um konkrete Rechnungen durchzuführen, ist es nützlich, statt der Funktion eine vektorwertige
Funktion zu betrachten. Wir legen dazu einen Ursprung fest, so dass jedem Ort eindeutig
ein Ortsvektor
zugeordnet ist. Die Bahn des Teilchens kann dann durch eine vektorwertige
Funktion beschrieben werden,
Bahn
(3.5)
Da es sich um einen Ortsvektor handelt, hat die Funktion natürlich die Dimension einer Länge, 0 m.
Wenn wir diese Ortsvektordarstellung der Bahn verwenden, müssen wir jedoch beachten, dass die Funk
,
tion von der Wahl des Ursprungs abhängt. Wählen wir einen anderen Ursprung , mit
so gilt für die Darstellung derselben Bahn bezüglich des neuen Ursprungs
55
"
(3.6)
replacements
(c)
(d)
(b)
(a)
Abbildung 3.1: Die Bahn eines Teilchens wird durch eine Funktion beschrieben, die zu jedem Zeitpunkt den Ort des Teilchens im Raum angibt (a). Sie kann explizit durch die Koordinatenfunktionen bezüglich eines ausgewählten Koordinatensystems dargestellt werden. Die Geschwindigkeit und die
Beschleunigung sind die ersten und zweiten Ableitungen des Ortsvektors . Der Vektor zeigt
tangential zur Bahn, der Vektor in die Richtung, in die sich die Bahn krümmt (b).
Unter einer Verschiebung des Ursprungs um den Vektor transformiert sich der Ortsvektor und damit die
Darstellung der Bahn des Teilchens um einen konstanten Vektor " .
Um die Bahn noch konkreter zu beschreiben, müssen wir eine Basis festlegen und dadurch ein Ko
ordinatensystem einführen. Sei also eine Orthonormalbasis von . Dann wird die Bahnkurve des
Teilchens durch drei reelle Koordinatenfunktionen beschrieben,
8
mit
% (3.7)
Die Summe läuft natürlich wieder über 4 . Um die Schreibweise noch ein wenig zu vereinfachen, führen wir die Summenkonvention ein. Wie schreiben die Summenzeichen gar nicht mehr explizit
aus, sondern treffen die folgende Vereinbarung:
Über doppelt auftretende Vektorindizes wird summiert.
Mit anderen Worten, immer wenn in einem Produkt ein Index, der die Komponenten eines Vektors oder
die Basisvektoren durchnummeriert, genau zweimal auftritt, so stellen wir uns vor diesem Term ein entsprechendes Summenzeichen vor. Zum Beispiel schreiben wir für den letzten Ausdruck in (3.7)
(3.8)
Dass diese Vorschrift einen Sinn hat, ist nicht unmittelbar einzusehen. Außerdem stellen sich ein paar
Fragen. Wie sollen wir denn jetzt einen Ausdruck, bei dem über einen Index summiert wird, von einem
gleich lautenden Ausdruck, bei dem nicht summiert wird, unterscheiden? Und warum gilt die Summenkonvention gerade dann, wenn ein Index in einem Produkt zweimal, aber nicht dreimal oder nur einmal
vorkommt?
Alle diese Fragen werden wir später beantworten können, wenn wir uns etwas genauer mit dem Verhalten von Vektorkomponenten unter Koordinatentransformationen beschäftigen. Es stellt sich nämlich
56
heraus, dass ein Ausdruck, in dem Vektorkomponenten vorkommen, nur dann sinnvoll ist, wenn jeder Index entweder genau einmal vorkommt, ohne das summiert wird, oder genau zweimal, wobei dann aber
über den Index summiert werden muss. Dahinter verbirgt sich eine mathematische Struktur, auf die wir an
dieser Stelle aber nicht näher eingehen können.
Wir verwenden sie Summenkonvention erst einmal nur, um und Schreibarbeit zu ersparen, und ohne viel
darüber nachzudenken. Dass sie funktioniert, nehmen wir einfach zur Kenntnis. Außerdem ist sie nur für
Vektorindizes gültig, also für diejenigen Indizes, die die Komponenten von Vektoren und die Basisvektoren
bezeichnen und die Werte 4 annehmen. Wir verwenden für diese Indizes immer die Buchstaben
3 .
Aufgabe 3.3 Man führe folgenden “empirischen” Test der Summenkonvention durch. Man überprüfe in
allen Gleichungen in den Kapiteln 1 und 2, in denen Vektorindizes vorkommen, ob tats ächlich genau dann
über einen Index summiert wird, wenn dieser genau zweimal auftritt. Gibt es irgendeine Gleichung, in der
ein Index mehr als zweimal auftritt?
Geschwindigkeit und Beschleunigung
Aus der Bahn eines Teilchens, die wir im folgenden stets durch den Ortsvektor als Funktion der
Zeit beschreiben, lassen sich weitere Größen ableiten, wobei “ableiten” an dieser Stelle ganz wörtlich zu
verstehen ist.
Durch die Funktion wird eine Kurve im Raum beschrieben, wobei die Zeit als Kurvenparameter
dient. Der Tangentenvektor dieser Kurve ist die Geschwindigkeit des Teilchens. Sie kann als Vektorfunktion ( oder durch ihre Komponenten ( % definiert werden,
Geschwindigkeit
( &
&
( % ( ( 2 (3.9)
Wie bereits erwähnt, ist es üblich, Ableitungen nach der Zeit mit einem Punkt zu bezeichnen. Wir verwenden wahlweise diese Notation oder die Schreibweise . Die übliche Einheit der Geschwindigkeit
0 m s. Die Geschwindigkeit ist wieder eine neue
ergibt sich als Meter pro Sekunde, ( Größenart, allerdings eine, für die wir keine neue Einheit einführen müssen. Es handelt sich um eine aus
den fundamentalen Größenarten Länge und Zeit abgeleitete Größenart. Die physikalische Dimension der
Geschwindigkeit ist Länge geteilt durch Zeit.
Im allgemeinen ist auch die Geschwindigkeit eine Funktion der Zeit. Sie ist nur dann konstant, wenn
sich das Teilchen geradlinig und gleichförmig bewegt, also mit konstanter Geschwindigkeit entlang einer
Geraden. In diesem Fall ist
& (
( ( (3.10)
wobei der Ortsvektor des Ortes ist, an dem sich das Teilchen zur Zeit 6 befindet, und ( seine
konstante Geschwindigkeit.
Um die Abweichung der Bewegung von einer geradlinigen und gleichförmigen Bewegung zu beschreiben, definieren wir die Beschleunigung als die Ableitung der Geschwindigkeit nach der Zeit, oder als die
zweite Ableitung des Ortsvektors nach der Zeit. Auch diese Definition können wir wahlweise als Vektorgleichung oder komponentenweise aufschreiben,
Beschleunigung
( 2 & ( % (3.11)
( 0 m s.
Als Einheit für die Beschleunigung ergibt sich Höhere Ableitungen treten in den Gesetzen der klassischen Mechanik nicht auf. Meist ist die Beschleunigung noch nicht einmal eine stetige Funktion der Zeit. Es genügt also, dass die Bahn eine mindestens
zweimal differenzierbare Funktion der Zeit ist.
57
Aufgabe 3.4 Es seien die folgenden Bahnen gegeben,
0
( ( 7 1! + (3.12)
Man berechne jeweils die Geschwindigkeit ( und die Beschleunigung , sowie deren Betr äge ( ( und . Welchen physikalischen Dimensionen haben die jeweils angegebenen Konstanten?
Aufgabe 3.5 Warum hängt der Ortsvektor des Teilchens von der Wahl des Ursprungs des gew ählten
Koordinatensystems ab, die Geschwindigkeit ( und die Beschleunigung aber nicht?
Die Newtonschen Gesetze
Die klassische Mechanik, wie sie von Newton formuliert wurde, sagt nun folgendes über die Bewegung
eines Punktteilchens. Wenn auf ein Teilchen kein äußerer Einfluss einwirkt, dann bewegt es sich geradlinig
und gleichförmig, also mit einer konstanten Geschwindigkeit. Wir sprechen in diesem Fall von einem
freien Teilchen. Dies ist das erste Newtonsche Gesetz:
Ein freies Teilchen bewegt sich geradlinig und gleichförmig.
Wirkt auf das Teilchen ein äußerer Einfluss, so geschieht dies in Form eine Kraft. Eine Kraft ist eine
gerichtete Größe, also ein Vektor, der eine Abweichung der Bahn des Teilchens von der geradlinigen und
gleichförmigen Bewegung bewirkt. Wirken auf das Teilchen mehrere Einflüsse gleichzeitig ein, so sind
die entsprechenden Kraftvektoren zu einer Gesamtkraft zu addieren.
Die Gesamtkraft bewirkt eine zu diesem Vektor proportionale Beschleunigung das Teilchens. Der
Proportionalitätsfaktor ist eine Eigenschaft des jeweiligen Teilchens. Er wird Masse genannt und mit bezeichnet. Es gilt also
& Kraft
(3.13)
wenn die zur Zeit auf das Teilchen einwirkende Gesamtkraft ist. Dies ist das zweite Newtonsche
Gesetz:
Wirkt eine Kraft auf ein Teilchen, so bewirkt diese eine Beschleunigung.
Je größer die Masse ist, desto träger ist das Teilchen, das heißt umso mehr versucht es, der Krafteinwirkung zu widerstehen und auf seiner geradlinigen und gleichförmigen Bewegung zu beharren. Die Masse
ist ein Maß für die Trägheit eines Teilchens. Sie wird in einer willkürlich gewählten Einheit Kilogramm
(kg) gemessen, definiert also eine neue physikalische Dimension. Wie ein Messgerät für die Masse eines
Körpers aussieht, werden wir uns gleich noch überlegen.
Durch die Wahl der Einheit für die Masse wird auch die Einheit und damit die physikalische Dimension
der Kraft festgelegt,
0 kg 0 m
s
0 kg m 0 N s
(3.14)
Als Abkürzung führt man für die Kraft auch die Einheit Newton (N) ein.
Eigentlich ist das erste Newtonsche Gesetz nur ein Spezialfall des zweiten, der dann vorliegt, wenn
auf ein Teilchen keine Kräfte einwirken. Und für sich genommen sind beide Gesetze auch noch nicht sehr
58
replacements
(c)
(d)
(a)
(b)
Abbildung 3.2: Ist die Kraft explizit als Funktion der Zeit gegeben, so ergibt sich die Bahn aus der Bewegungsgleichung (3.15) (a). Ist die Kraft dagegen durch ein Kraftfeld als Funktion des
Ortes gegeben, so gilt die Bewegungsgleichung (3.16) (b). Dargestellt ist jeweils eine spezielle Lösung
der Bewegungsgleichung, die sich eindeutig durch die Wahl bestimmter Anfangsbedingungen ergibt. Die
Punkte markieren gleich lange Zeitintervalle.
aussagekräftig. Das ist der Grund, warum die klassische Mechanik eigentlich nur eine allgemeines Konzept
zur Konstruktion einer physikalischen Theorie ist. Um konkrete Aussagen über die Bahn eines Teilchen
abzuleiten, müssen wir zusätzlich wissen, welche Kräfte denn nun konkret auf ein Teilchen einwirken,
wenn es sich in einer bestimmten Situation befindet. Erst durch die Angabe solcher Kraftgesetze werden
die Newtonschen Gesetze zu einer physikalischen Theorie, die konkrete Aussagen über die Bahnen von
Teilchen macht.
Das einfachste mögliche Kraftgesetz gibt explizit die Kraft als Funktion der Zeit vor. Eine solche
Situation liegt vor, wenn wir das Teilchen gewissermaßen “von außen” steuern. Zu jedem Zeitpunkt ist
die Kraft durch einen bestimmten Vektor gegeben, der in der Abbildung 3.2(a) als Pfeil am jeweiligen
Ort des Teilchens dargestellt ist. Während sich das Teilchen bewegt, ändert sich dieser Vektor in einer
vorgegebenen Art und Weise, die unabhängig davon ist, wie sich das Teilchen gerade bewegt.
Die Bewegungsgleichung sieht in diesem Fall sehr einfach aus. Es ist die Differenzialgleichung für die
Funktion , die sich aus dem zweiten Newtonschen Gesetz ergibt,
(3.15)
Wie wir gleich sehen werden, können wir diese Gleichung sehr leicht nach auflösen, um so die Bahn
des Teilchens aus der gegebenen Kraftfunktion berechnen.
Typischerweise wird die Kraft aber nicht explizit als Funktion der Zeit gegeben sein, sondern zum Beispiel als Funktion des Ortes, an dem sich das Teilchen gerade befindet. Wir sprechen dann von einem
Kraftfeld, wie es in Abbildung 3.2(b) dargestellt ist. Ein Kraftfeld ordnet jedem Punkt im Raum mit Ortsvektor einen Vektor zu. Dieser gibt an, welche Kraft auf das Teilchen einwirkt, wenn es sich am
Ort befindet.
Um die Bewegungsgleichung für ein Teilchen in einem Kraftfeld aufzustellen, müssen wir auf der rechten Seite der Gleichung (3.15) statt den Wert des Kraftfeldes an der Stelle einsetzen, an der sich das
Teilchen gerade befindet, also
(3.16)
59
Diese Differenzialgleichung ist schon ein wenig komplizierter als (3.15). Die unbekannte Funktion erscheint auf beiden Seiten. Es handelt sich um eine Differenzialgleichung zweiter Ordnung für die gesuchte
Funktion , die wir im allgemeinen nicht mehr so einfach lösen können. In diesem und den nächsten Kapiteln werden wir uns vor allem mit den Methoden beschäftigen, solche Bewegungsgleichungen entweder
explizit zu lösen oder zumindest qualitative Aussagen über deren Lösungen zu machen.
Das ist aber noch nicht der allgemeinste Fall für ein Kraftgesetz. Zusätzlich kann das Kraftfeld noch
explizit von der Zeit abhängen, oder auch von der Geschwindigkeit des Teilchens. Die allgemeinste Form
für die Bewegungsgleichung eines Teilchens in einem Kraftfeld lautet
&
(3.17)
Kraftgesetze, bei denen die Kraft auch noch von der Beschleunigung oder höheren Ableitungen abhängt,
sind nicht bekannt. Die Existenz solcher Kraftgesetze würde das Konzept der Kraft an sich in Frage stellen. Denn das zweite Newtonsche Gesetz wäre sinnlos, wenn die Kraft selbst wiederum als Funktion der
Beschleunigung gegeben wäre.
Es gibt aber noch eine Verallgemeinerung des Kraftgesetzes (3.17), die für die Mechanik von Punktteilchen sehr wesentlich ist. Bisher haben wir nur ein einzelnes Teilchen betrachtet. Bei einem System von
Teilchen beschreiben wir die Bahn jedes einzelnen Teilchens durch eine Ortsvektorfunktion , wobei
der Index 0 31 die einzelnen Teilchen durchnummeriert. Um die Teilchenindizes nicht mit den
Vektorindizes zu verwechseln, bezeichnen wir sie mit kleinen griechischen Buchstaben.
Die Funktion repräsentiert den Ortsvektor des Teilchens mit der Nummer , und die Komponenten dieses Vektors, also die Koordinaten des Teilchens, sind durch die reellen Funktionen mit
4 $ gegeben. Da jedes Teilchen im allgemeinen eine andere Masse hat, bezeichnen wir die Mas ,
sen entsprechend mit . Es gilt dann für jedes Teilchen das zweite Newtonsche Gesetz wobei die auf dieses Teilchen wirkende Kraft ist. Für die Teilchenindizes gilt hier natürlich keine
Summenkonvention.
Nun kann diese Kraft vom Ort und von der Geschwindigkeit des jeweiligen Teilchens abhängen, sowie
explizit von der Zeit. Bei einem System aus mehreren Teilchen kann sie aber auch von den Orten und
den Geschwindigkeiten aller anderen Teilchen abhängen. Das allgemeinste Kraftgesetz für ein -Teilchen
System lautet also
, 33 3 3 (3.18)
Wir müssen vektorwertige Funktion angeben, die jeweils von 0 reellen Variablen abhängen,
nämlich von den Vektoren und mit ihren jeweils drei Komponenten und von der Zeit .
Meistens nimmt ein solches Kraftgesetz eine sehr spezielle Form an. Es treten in der Regel nur Kräfte
auf, die von den Orten und eventuell den Geschwindigkeiten von jeweils zwei Teilchen abhängen. Wir
sagen dann, dass die Teilchen paarweise miteinander wechselwirken. Die Gesamtkraft , die auf das
Teilchen wirkt, setzt sich aus Kräften zusammen, die durch die Wechselwirkung des Teilchens
mit dem Teilchen verursacht werden. Zusätzlich kann noch eine äußere Kraft auf jedes Teilchen
wirken, die nicht von einem anderen Teilchen verursacht ist, sondern von außen auf das System einwirkt.
Betrachten wir der Einfachheit halber nur Kräfte, die von den Orten, aber nicht den Geschwindigkeiten
der Teilchen oder explizit von der Zeit abhängen. Dann werden die Wechselwirkungen von Teilchen
durch ein Kraftgesetz der Form
, (3.19)
beschrieben. Wir benutzen im folgenden die Konvention, dass diejenige Kraft ist, die vom Teilchen
auf das Teilchen ausgeübt wird, das heißt die Kraft wird vom Teilchen verursacht und sie wirkt auf
das Teilchen . Und für eine äußere Kraft, die auf das Teilchen wirkt, schreiben wir .
60
Meistens ist es zudem so, dass die Wechselwirkung des Teilchens mit dem Teilchen nur von der
relativen Position der beiden Teilchen abhängt, also von dem Abstandsvektor " . Dann vereinfacht
sich das Kraftgesetz noch ein wenig, da die Kräfte nur noch von jeweils einem Vektor abhängen,
" (3.20)
Wir müssen jetzt nur noch insgesamt
Funktionen und angeben, die jeweils von drei reellen
Variablen abhängen, nämlich von den Komponenten der Vektoren bzw. " . Natürlich ist auch das
im allgemeinen ein sehr kompliziertes System von gekoppelten Differenzialgleichungen, das wir nur in
sehr speziellen Fällen explizit lösen können. Einige dieser Fälle werden wir später ausführlich diskutieren.
Schließlich gibt es noch das dritte Newtonsche Gesetz, das eine Aussage über die in der Natur tatsächlich
vorkommenden Wechselwirkungen zwischen Teilchen macht. Es besagt, dass eine Wechselwirkung, wie
auf ein
der Name schon andeutet, stets auf Gegenseitigkeit beruht. Bewirkt ein Teilchen eine Kraft Teilchen , so bewirkt das Teilchen umgekehrt auf das Teilchen eine Kraft , die entgegengesetzt
gleich ist,
actio
reactio
"
(3.21)
Jede Kraft, die ein Teilchen auf ein anderes ausübt, wird durch eine entsprechende Gegenkraft gewissermaßen kompensiert. Oft wird das dritte Newtonsche Gesetz auch in der lateinischen Kurzform “actio reactio” zitiert.
Jeder Kraft entspricht eine entgegengesetzte, gleich große Gegenkraft.
Eine äußere Kraft , wie sie in (3.20) auftritt, widerspricht diesem Prinzip offenbar. Dass wir solche
Kräfte trotzdem zulassen, liegt daran, dass es manchmal sinnvoll ist, bestimmte Objekte, mit denen die
Teilchen wechselwirken, nicht in das dynamische System einzubeziehen. Ein typisches Beispiel ist die
Anziehungskraft der Erde, die auf alle Teilchen in einem Labor gleichermaßen wirkt. Zwar üben die Teilchen auch eine gleich große Gegenkraft auf die Erde aus, aber die Wirkung dieser Kraft ist wegen der
großen Masse und damit großen Trägheit der Erde vernachlässigbar.
Wir betrachten daher das “Teilchen” Erde als außerhalb des dynamischen Systems, dessen Bewegungen
wir beschreiben wollen. Wir müssen dessen Wirkung auf die anderen Teilchen dann aber in der Form
(3.20) als äußere Kraft berücksichtigen. Genau genommen gilt das dritte Newtonsche Gesetz also nur für
abgeschlossene Systeme, die nicht mit anderen Objekten wechselwirken.
Aufgabe 3.6 Wir betrachten ein abgeschlossenes System aus Teilchen. Das Kraftgesetz sei von der Form
(3.19). Zusätzlich sollen die Funktionen und , die die Wechselwirkungen und äußeren
Kräfte beschreiben, die folgende Symmetrie haben. Sie sollen unabh ängig davon sein, welchen Punkt
wir als Ursprung des Koordinatensystems wählen. Mit anderen Worten, das Kraftgesetz soll sich nicht
ändern, wenn wir die Ortsvektoren gemäß (3.6) transformieren. Man zeige, dass das Kraftgesetz dann von
der Form (3.20) sein muss. Die Wechselwirkungen dürfen nur von den relativen Positionen der Teilchen
abhängen. Außerdem müssen die äußeren Kräfte konstant, also ortsunabhängig sein.
Zeitabhängige Kräfte
Als einfachstes Beispiel einer Bewegungsgleichung wollen wir nun etwas genauer den Fall einer Kraft
untersuchen, die gemäß (3.15) explizit als Funktion der Zeit gegeben ist,
61
(3.22)
In diesem Fall macht es keinen Unterschied, ob wir ein einzelnes Teilchen oder ein System von mehreren
Teilchen betrachten. Für jedes Teilchen gilt unabhängig von den anderen Teilchen eine Bewegungsgleichung der Form (3.22).
Da wir die Funktion kennen, können wir diese Gleichung durch zweimaliges Integrieren lösen.
Wir berechnen zuerst die Geschwindigkeit als Funktion der Zeit, indem wir die Beschleunigung von einem willkürlich gewählten Zeitpunkt bis integrieren. Nach dem Hauptsatz der Integral- und
Differenzialrechnung für vektorwertige Funktionen gilt
"
(3.23)
Wir schreiben ( für die Geschwindigkeit des Teilchens zur Zeit . Dann können wir die Funktion
explizit angeben,
(
0
( (3.24)
Die Geschwindigkeit des Teilchens zur Zeit ist eindeutig bestimmt durch den Anfangswert ( zur
Zeit und die Kraftfunktion . Durch nochmaliges Integrieren finden wir die gesuchte Ortsfunktion
. Es gilt
und folglich, wenn wir "
(3.25)
setzen,
0
( Wenn wir jetzt noch das äußere Integral aufspalten und dann die Integration über (
"
(
0
(3.26)
ausführen, ergibt sich
(3.27)
Aus der Kenntnis der Kraftfunktion und den Anfangsbedingungen und & ( , also des
Ortes und der Geschwindigkeit zu irgendeinem Zeitpunkt , können wir die Bahn des Teilchens eindeutig
bestimmen. Wir müssen dazu nur die Funktion zweimal integrieren.
Aufgabe 3.7 Man löse die Bewegungsgleichung (3.15) für die folgenden Kräfte und Anfangsbedingungen:
3! ( und 6 ! beliebige Konstanten.
62
( (
&
Hier sind & ! 6 & + (3.28)
replacements
(c)
(d)
(b)
(a)
Abbildung 3.3: Beim schrägen Wurf wird ein Teilchen aus der Höhe oberhalb des Erdbodens mit der
Geschwindigkeit unter dem Winkel abgeworfen. Die Wurfweite ist der horizontale Abstand des
Ortes, an dem das Teilchen auf dem Boden auftrifft, von dem Punkt direkt unterhalb der Abwurfstelle.
Gezeigt ist die Flugbahn des Teilchens ohne (a) und mit (b) Luftreibung.
Aufgabe 3.8 Im Gravitationsfeld der Erde in der Nähe der Oberfläche wirkt auf ein Teilchen der Masse
eine konstante Kraft
Erdanziehung
" mit
0 m s (3.29)
wenn das Koordinatensystem so gewählt ist, dass der Basisvektor vertikal nach oben zeigt. Bei dem in
Abbildung 3.3(a) dargestellten schrägen Wurf befindet sich ein Teilchen der Masse in einer H öhe oberhalb des Bodens und wird dort mit einer Geschwindigkeit ( ( unter einem Winkel zur Horizontalen
abgeworfen. Man berechne die Wurfweite als Funktion von , ( und . Um die Bewegungsgleichung zu
lösen, sollte man von der Freiheit der Wahl des Koordinatensystems Gebrauch machen.
Aufgabe 3.9 Beim schrägen Wurf aus Aufgabe 3.8 sei die Abwurfgeschwindigkeit ( und die H öhe fixiert,
aber der Abwurfwinkel variabel. Man bestimme die maximal erreichbare Wurfweite als Funktion von
und ( , sowie den optimalen Abwurfwinkel .
Anfangsbedingung und Bewegungszustand
Am Beispiel einer zeitabhängigen Kraft haben wir gesehen, dass wir zusätzlich zum Kraftgesetz den Ort
und die Geschwindigkeit eines Teilchens zu einem bestimmten Zeitpunkt vorgeben müssen, um eine eindeutige Lösung der Bewegungsgleichung zu bekommen. Diese Schlussfolgerung können wir verallgemeinern. Es ist stets so, dass die Bewegung eines Teilchens eindeutig durch das Kraftgesetz und die Angabe
des Ortes und der Geschwindigkeit zu einem beliebigen Zeitpunkt festgelegt ist. Im Sinne der einleitenden
Bemerkungen über dynamische Systeme heißt das, dass der Zustand, oder genauer der Bewegungszustand
eines Teilchens durch die Angabe seines Ortes und seiner Geschwindigkeit festgelegt wird.
Um das zu erklären, werden wir die Bewegungsgleichung ein wenig umschreiben. Jedes System von
Differenzialgleichungen zweiter oder höherer Ordnung lässt sich auf ein System von Differenzialgleichungen erster Ordnung reduzieren, indem man einen geeigneten Satz von Hilfsfunktionen einführt. Betrachten
wir noch einmal die allgemeinste Bewegungsgleichung (3.17) für ein einzelnes Teilchen,
&
(3.30)
Wenn wir den Ortsvektor und seine Ableitungen in ihre Komponenten bezüglich irgendeiner Basis zerlegen, dann repräsentiert diese Vektorgleichung ein System von drei reellen Differenzialgleichungen zweiter
63
Ordnung, die im allgemeinen miteinander gekoppelt sind. Um es in ein System von Differenzialgleichungen erster Ordnung zu überführen, führen wir drei reelle Hilfsfunktionen ein, oder einfach eine vektorwertige Hilfsfunktion. Es ist üblich, dafür die Funktion
&
Impuls
(3.31)
zu verwenden. Diese Größe nennt man Impuls. Sie hat die Dimension Masse mal Geschwindigkeit, also
0 kg m s.
Zwar könnten wir den Faktor an dieser Stelle ebenso gut weglassen und die Geschwindigkeit ( als Hilfsfunktion verwenden. Aber wie wir gleich sehen werden, hat der Impuls ein paar nützliche
Eigenschaften, die das Lösen von Bewegungsgleichungen in vielen Fällen vereinfachen.
In jedem Fall ergibt sich jetzt ein System von Differenzialgleichungen erster Ordnung, das wir wie folgt
schreiben können,
0
&
(3.32)
Die erste Gleichung ist nichts anderes als die Definition der Hilfsfunktion . Die zweite Gleichung
besagt, dass die Kraft eine Änderung des Impulses bewirkt. Sie ergibt sich aus (3.30), wobei wir jedoch
das Kraftgesetz als Funktion des Ortes und des Impuls anstelle des Ortes und der Geschwindigkeit angeben
müssen. Die Umrechnung ist aber ganz einfach, denn wir müssen nur den Faktor an den entsprechenden
Stellen einfügen, wenn wir explizit ein bestimmtes Kraftgesetz gegeben haben.
Die Differenzialgleichungen (3.32) sind jetzt von der allgemeinen Form (3.2) der Bewegungsgleichung
eines dynamisches System. Wenn wir den Bewegungszustand des Teilchens durch definieren,
also durch seinen Ort und seinen Impuls, dann steht auf der linken Seite der Gleichung die Zeitableitung
des Zustandes, und auf der rechten Seite eine vorgegebene Funktion des Zustandes und der Zeit .
Das können wir unmittelbar verallgemeinern und den Bewegungszustand eines -Teilchen-Systems definieren. Führen wir analog zu (3.31) den Impuls des Teilchens ein,
(3.33)
so lassen sich die Bewegungsgleichungen (3.18) in der Form
&
0
1 1 33 (3.34)
schreiben. Der Zustand eines -Teilchen-Systems wird folglich durch die Angabe aller Orte und
aller Impulse festgelegt. Auf der linken Seite des Gleichungssystem (3.34) steht die Zeitableitung
dieses Zustandes, auf der rechten Seite eine Funktion des Zustandes und der Zeit .
Der Bewegungszustand eines -Teilchen-Systems wird durch die Orte und Impulse aller Teilchen bestimmt.
Aus den allgemeinen Überlegungen über dynamische System können wir jetzt folgenden Schluss ziehen.
Wenn wir den Bewegungszustand eines Systems aus Teilchen, also alle Orte und Impulse zu einem bestimmten Zeitpunkt kennen, so können wir die Bewegungen der Teilchen für alle Zeiten berechnen.
Sie sind durch die eindeutige Lösung der Differenzialgleichungen (3.34) gegeben, mit den Anfangsbedingungen
(3.35)
& die wir beliebig vorgeben können. Sie definieren den Anfangszustand &
.
Hierbei müssen wir natürlich voraussetzen, dass wir das Kraftgesetz kennen, dass es das Verhalten
des -Teilchen-Systems richtig beschreibt, und dass es ausreichend regulär ist, also die Funktionen 64
in (3.34) stetig und differenzierbar sind. Wenn diese Voraussetzungen erfüllt sind, ist die Mechanik von
Punktteilchen eine deterministische Theorie, das heißt aus der Kenntnis des Anfangszustandes lässt sich
die Zeitentwicklung vorhersagen.
Allerdings macht der Satz von Cauchy, Picard und Lindelöf noch eine Einschränkung, auf die wir an
dieser Stelle hinweisen sollten. Unter den genannten Voraussetzungen garantiert der Satz die Existenz einer
Lösung der Bewegungsgleichung nur für ein endliches Zeitintervall , das den Anfangszeitpunkt
enthält. Es kann also vorkommen, dass die eindeutige Lösung der Bewegungsgleichungen gar nicht für
alle Zeiten existiert, sondern nur für einen endlichen Zeitraum von bis , wobei der Zeitpunkt , zu
dem wir die Anfangsbedingungen gestellt haben, natürlich innerhalb dieses Zeitraumes liegt.
Vom physikalischen Standpunkt aus betrachtet würde das bedeuten, dass etwas nicht ganz stimmen
kann. Der Zustand eines dynamischen Systems, also in diesem Fall die Bahnen und die Impulse der Teilchen müssen für alle Zeiten existieren. Falls ein solcher Fall eintritt, ist dies meist ein Hinweis
darauf, dass wir bei der Beschreibung des physikalischen Systems eine unzulässige Vereinfachung oder
Näherung gemacht haben. Die Theorie, die wir über ein spezielles dynamische System aufgestellt haben,
zeigt auf diese Weise ihre eigenen Grenzen auf.
Ein Beispiel dafür werden wir im nächsten Kapitel kennen lernen. Von solchen sehr speziellen Fällen
abgesehen ist es aber stets so, dass die Anfangsbedingungen zusammen mit den Bewegungsgleichungen
die Bahnen eindeutig für und alle Zeiten bestimmen. Mechanische Systeme verhalten sich stets deterministisch, und solange wir keine unzulässigen Vereinfachungen machen, existieren die Lösungen der
Bewegungsgleichungen für alle Zeiten.
Aufgabe 3.10 Man wiederhole die einzelnen Schritte (3.22–3.27) zur L ösung der Bewegungsgleichung
für eine zeitabhänge Kraft, jedoch ausgehend von den Bewegungsgleichungen erster Ordnung (3.32). Man
löse zuerst die Bewegungsgleichung für den Impuls, dann die für die Bahn.
Reibungskräfte
Wir wollen an einem einfachen Beispiel zeigen, dass das Umschreiben der Bewegungsgleichung in die
Form (3.32) bzw. (3.34) eines Systems von Differenzialgleichungen erster Ordnung auch einen praktischen Nutzen hat. Manchmal lassen sich diese Gleichungen nämlich einfacher lösen als die ursprüngliche
Bewegungsgleichung zweiter Ordnung.
Wir betrachten einen Körper der Masse , der sich in einem Gas oder einer Flüssigkeit bewegt und
dadurch eine Reibungskraft spürt. Der Körper soll die eingangs erwähnten Bedingungen erfüllen, also
starr sein und nicht rotieren, so dass wir ihn als punktförmig betrachten können. Die Reibungskraft ist von
der Geschwindigkeit abhängig und ihr entgegen gerichtet, da sie den Körper stets abbremst. Solange die
Geschwindigkeit nicht zu groß wird, können wir annehmen, dass die Reibungskraft zur Geschwindigkeit
proportional ist,
Reibungskraft
Die Größe
ergibt sich
"
mit
6 (3.36)
heißt Reibungskonstante. Schreiben wir die Bewegungsgleichung in der Form (3.32) auf, so
0
&
(3.37)
" "
Die zweite Gleichung besagt, dass die Funktion proportional zu ihrer eigenen Ableitung ist. Das ist
&
die typische Eigenschaft der Exponentialfunktion. Wir machen daher den Ansatz
& "
(3.38)
wobei und Konstanten sind. Diese müssen wir so wählen, dass die Bewegungsgleichungen
und die Anfangsbedingungen für den Impuls erfüllt sind. Die Anfangsbedingung wählen wir so allgemein
65
wir möglich,
6 6 (
(3.39)
Zur Zeit 6 soll sich der Körper am Ort befinden und einen Impuls bzw. eine Geschwindigkeit ( haben. Setzen wir den Ansatz für in diese Gleichung und in die Bewegungsgleichung ein, so finden
und sein muss, also
wir, dass (3.40)
Der Impuls, und damit auch die Geschwindigkeit des Körpers nehmen exponentiell mit der Zeit ab. Die
Funktion finden wir, indem wir die entsprechende Bewegungsgleichung von 6 bis integrieren,
"
6 0
0
"
0 "
0
(3.41)
Für die Bahn und den Impuls des Körpers finden wir demnach folgende Funktionen, parametrisiert durch
den Anfangsort und den Anfangsimpuls ,
0 "
(3.42)
Das war ein typisches Beispiel dafür, wie ein System von Differenzialgleichungen schrittweise gelöst
werden kann, wenn die einzelnen Gleichungen entkoppeln. Wir konnten zuerst die Bewegungsgleichung
für den Impuls lösen, und anschließend die für den Ort. Die Lösung für den Impuls konnten wir durch
geschicktes Raten finden, die Lösung für den Ort anschließend durch eine gezielte Integration.
Aufgabe 3.11 Welche physikalische Dimension hat die Reibungskonstante ?
nur eine endliche Länge hat,
Aufgabe 3.12 Man zeige, dass die Bahn (3.42) für das Intervall 6 der Körper also so stark abgebremst wird, dass er insgesamt nur eine endliche Strecke zur ücklegt.
Aufgabe 3.13 Man bilde in (3.42) den Grenzwert /
6 und zeige, dass sich in diesem Fall eine geradlinige und gleichförmige Bewegung mit der Geschwindigkeit ( ergibt.
Aufgabe 3.14 Um beim schrägen Wurf in Abbildung 3.3(b) die Luftreibung zu berücksichtigen, machen
wir für die Kraft den Ansatz , wobei die Gravitationskraft durch (3.29), die Reibungskraft
durch (3.36) gegeben ist. Man schreibe die Bewegungsgleichung zuerst in der Form (3.30) auf und bringe
sie anschließend auf die Form (3.32). Man finde diejenige Lösung der Bewegungsgleichung, die zu den
Anfangsbedingungen aus Aufgabe 3.8 gehört. Man zeige, dass die Wurfweite stets kleiner ist als die
entsprechende Wurfweite ohne Reibung bei gleichen Anfangsbedingungen.
Impuls und Schwerpunkt
Die Bewegungsgleichungen für ein mechanisches System sind in der Regel gekoppelte Differenzialgleichungen. Um ein gekoppeltes System von Differenzialgleichungen zu lösen, ist es immer eine gute Strategie, zunächst zu versuchen, das Gleichungssystem zu entkoppeln. Das gelingt natürlich nicht immer so
einfach wie in dem gerade vorgeführten Beispiel. Es gibt aber ein paar nützliche und sehr allgemeine Eigenschaften von mechanischen Systemen, die wir dazu benutzen können, die Bewegungsgleichungen in
einer ganz ähnlichen Art und Weise zu entkoppeln und anschließend schrittweise zu lösen.
66
Die wichtigste solche Eigenschaft ist die Existenz von Erhaltungsgr ößen. Eine Erhaltungsgröße ist eine
Funktion auf dem Zustandsraum eines dynamischen Systems, die zeitlich konstant ist. Wenn sich das
System zu irgendeiner Zeit in einem Zustand befindet, für den die Erhaltungsgröße einen bestimmten
Wert annimmt, so nimmt diese Größe zu jeder anderen Zeit denselben Wert an. Wir wissen also, ohne
die Bewegungsgleichung gelöst zu haben, dass sich das dynamische System nur innerhalb einer durch die
Erhaltungsgröße bestimmten Teilmenge des Zustandsraum bewegen kann.
Je mehr Erhaltungsgrößen wir finden, umso stärker können wir die Bewegungen des Systems einschränken, und umso einfacher werden die verbleibenden Bewegungsgleichungen, die wir explizit lösen
müssen. Bevor wir beginnen, explizit nach Lösungen der Bewegungsgleichung für ein dynamisches System zu suchen, sollten wir daher versuchen, so viele Erhaltungsgrößen wie möglich zu finden. Später
werden wir sehen, dass es dafür eine spezielle Strategie gibt. Aber zunächst wollen wir das Konzept einer
Erhaltungsgröße an einem einfachen Beispiel erklären.
Wir betrachten ein System aus Punktteilchen mit Massen , Ortsvektoren und Impulsen . Die
Teilchen sollen untereinander wechselwirken, aber es sollen keine äußeren Kräfte auf sie einwirken. Es
gelten dann die Bewegungsgleichungen (3.34) erster Ordnung in der Form
0
(3.43)
Die Zeitabhängigkeit schreiben wir ab jetzt nicht mehr explizit aus, wenn klar ist, welche Größen von der
Zeit abhängen. Hier sind dies natürlich die Orte und Impulse der Teilchen. Es ist an dieser Stelle auch
unerheblich, wovon die Wechselwirkungskräfte abhängen. Wir verwenden nur das dritte Newtonsche
Gesetz, wonach ist.
" Daraus können wir folgenden Schluss ziehen. Die Kraft bestimmt die Änderung des Impulses pro Zeit.
Das Teilchen bewirkt durch die Kraft eine Impulsänderung des Teilchens , und umgekehrt bewirkt
das Teilchen durch die Gegenkraft eine gleich große, aber entgegengesetzte Impulsänderung des
Teilchen . Wir können auch sagen, dass bei einer Wechselwirkung von zwei Teilchen Impuls von einem
Teilchen auf das andere übertragen wird.
Das hat zur Folge, dass sich die Impulse der beiden wechselwirkenden Teilchen ändern, die Summe
von beiden Impulse aber gleich bleibt. Das eine Teilchen “verliert” genau so viel Impuls, wie das andere
“gewinnt”. Wechselwirken alle Teilchen eines -Teilchen-Systems miteinander, so wird Impuls von jedem Teilchen auf jedes andere übertragen, aber die Gesamtmenge an Impuls bleibt erhalten. Also ist der
Gesamtimpuls eines -Teilchen-Systems eine Erhaltungsgröße. Der Gesamtimpuls ist einfach die Summe
aller Impulse der Teilchen,
Gesamtimpuls
(3.44)
Im allgemeinen ist dieser Vektor eine Funktion der Zeit. Gilt aber eine Bewegungsgleichung der Form
(3.43) und das dritte Newtonsche Gesetz, so ist
(3.45)
Die Summe läuft über alle Paare mit . Zu jedem Term gibt es folglich einen Term
der entgegensetzt gleich ist. Also ist die rechte Seite der Gleichung gleich Null,
!
konst Das gilt für jedes abgeschlossene mechanische System, für das das dritte Newtonsche Gesetz gilt.
67
,
(3.46)
In jedem abgeschlossenen mechanischen System ist der Gesamtimpuls eine Erhaltungsgr öße.
Darüber hinaus können wir auch noch eine Aussage über die Orte der Teilchen machen. Wir definieren
den Schwerpunkt eines -Teilchen-Systems wie folgt. Es ist der Punkt mit dem Ortsvektor
0 mit
(3.47)
Wir mitteln über alle Ortsvektoren, wobei wir die Beiträge der einzelnen Teilchen jeweils mit ihren Massen
gewichten.
Aufgabe 3.15 Man zeige, dass durch den Ortsvektor unabhängig von der Wahl des Koordinatensystems
ein Punkt im Raum definiert wird. Mit anderen Worten, wenn wir den Ursprung des Koordinatensystems
verschieben, so ändern sich zwar die Ortsvektoren der Teilchen und auch der Vektor , aber nicht der
Punkt, zu dem er zeigt.
Leiten wir die Gleichung (3.47) nach der Zeit ab, so ergibt sich
0 Zusammen mit (3.46) ergibt sich
0
0 0
(3.48)
! /
(3.49)
Das sind die Bewegungsgleichungen für ein einzelnes freies Teilchen mit Masse , Ortsvektor und
Impuls . Der Schwerpunkt eines abgeschlossenen -Teilchen-Systems verhält sich wie ein freies Teilchen, auf das keine Kraft wirkt. Wir können die Lösung der Bewegungsgleichungen (3.49) unmittelbar
angeben. Befindet sich der Schwerpunkt zur Zeit an einem Ort und bewegt sich dieser mit einer
Geschwindigkeit , so gilt
"
(3.50)
Der Schwerpunkt eines abgeschlossenen mechanischen Systems aus beliebig vielen Punktteilchen bewegt
sich stets geradlinig und gleichförmig.
Dadurch reduziert sich die Anzahl der zu lösenden Differenzialgleichungen. Zerlegen wir die Orts- und
Impulsvektoren aller Teilchen in ihre Komponenten, so bilden die ursprünglichen Bewegungsgleichungen ein System von insgesamt
Differenzialgleichungen erster Ordnung für
reelle Funktionen. Für
sechs spezielle Kombinationen dieser Funktion kennen wir aber bereits die Lösung, nämlich für die jeweils drei Komponenten des Gesamtimpulses und des Ortsvektors des Schwerpunktes. Wir müssen
also nur noch " 0 unabhängige Differenzialgleichungen lösen.
Aufgabe 3.16 Abbildung 3.4(a) zeigt einen Stoßprozess von zwei Teilchen. Die Teilchen bewegen sich
zunächst aufeinander zu, wechselwirken dann kurzzeitig miteinander, und entfernen sich schließlich wieder voneinander. Nur während eines kurzen Zeitraumes, wenn die Teilchen dicht beieinander sind, soll
eine Kraft wirken, die dem dritten Newtonschen Gesetz genügt. Man zeige, dass man durch Messung der
Geschwindigkeiten der Teilchen vor und nach dem Stoß das Massenverh ältnis bestimmen kann.
Aufgabe 3.17 In Abbildung 3.4(b) ist ein Messgerät zur Bestimmung der Masse stellt. Wie funktioniert es?
68
eines Körpers darge-
kg
kg
(a)
(b)
Abbildung 3.4: Bei einem Stoßprozess wird Impuls von einem Teilchen auf ein anderes übertragen (a).
Unabhängig von der Art der Wechselwirkung ist die Summe der Impulse vor und nach dem Stoß dieselbe.
Um die Masse eines Körpers zu messen, lässt man ihn unelastisch, also so, dass die Körper nach dem
Stoß zusammenkleben, mit einem Körper bekannter Masse zusammenstoßen (b). Aus dem Verhältnis der
Geschwindigkeiten und lässt sich die Masse bestimmen.
Aufgabe 3.18 In Abbildung 3.5 ist die Funktionsweise eines Rückstoßtriebwerks dargestellt. Eine Rakete
stößt in regelmäßigen Zeitabständen eine Treibstoffmenge mit der Geschwindigkeit nach hinten
aus. Wenn man die pro Zeit ausgestoßene Treibstoffmenge festh ält, den Grenzwert 6 und
6 bildet, und außerdem beachtet, dass die Gesamtmasse der Rakete durch den Treibstoffausstoß
abnimmt, so ergibt sich aus der Impulserhaltung für abgeschlossene mechanische System die Bewegungsgleichung für die Rakete.
Die Rakete befindet sich zunächst in Ruhe und soll auf die Geschwindigkeit ( beschleunigt werden. Der
Raketenkörper zusammen mit der Nutzlast hat die Masse . Gesucht ist die erforderliche Treibstoffmenge
. Man zeige, dass diese durch die Formel
" 0 (3.51)
gegeben ist, also exponentiell mit der angestrebten Geschwindigkeit ansteigt.
Das Zwei-Teilchen-System
Wir wollen am Beispiel eines Systems von zwei Teilchen zeigen, wie wir mit Hilfe der Impulserhaltung
und des Schwerpunktes ein gekoppeltes System von Bewegungsgleichungen lösen können. Der Einfachheit halber nehmen wir an, dass die Wechselwirkung der beiden Teilchen nur von der relativen Position
der beiden Teilchen abhängt. Die Kräfte, die die beiden Teilchen aufeinander ausüben, sind dann durch
eine Funktion " des Abstandsvektors '"> gegeben. Die Bewegungsgleichungen erster
Ordnung lauten
0
0
"
"
"
(3.52)
Um dieses Gleichungssystem zu entkoppeln, führen wir als neue Variable zunächst den Ortsvektor des
Schwerpunktes und den Gesamtimpuls ein,
69
(3.53)
(d)
Abbildung 3.5: Eine Rakete mit Rückstoßantrieb kann als System von vielen Teilchen beschrieben werden. Es besteht aus dem Raketenkörper und einer großen Zahl von Treibstoffteilchen. In regelmäßigen
Zeitabständen wird ein Treibstoffteilchen nach hinten ausgestoßen. Aus der Impulserhaltung ergibt sich
die Bewegungsgleichung für die Rakete.
Wir wissen bereits, dass für diese Vektoren die Bewegungsgleichungen (3.49) gelten. Zusätzlich definieren
wir noch den Abstandvektor oder die relative Position der beiden Teilchen, sowie den relativen Impuls,
"
' "
(3.54)
Der relative Impuls hat zunächst keine besondere physikalische oder geometrische Bedeutung. Seine Zeitableitung ist jedoch durch den folgenden Ausdruck gegeben,
"
"
Außerdem finden wir für die Zeitableitung der relativen Position
"
0
" 0
" ' Beides zusammen lässt sich wie folgt schreiben,
0
mit
(3.55)
(3.56)
(3.57)
Das sind die Bewegungsgleichungen für ein einzelnes Teilchen mit Ortsvektor und Impuls , das sich in
einem Kraftfeld , bewegt. Die Masse dieses “fiktiven” Teilchens wird reduzierte Masse genannt.
Um die Bewegungen von zwei wechselwirkenden Teilchen zu beschreiben, können wir diese offenbar in
eine Schwerpunktbewegung und eine Relativbewegung zerlegen. Der Schwerpunkt bewegt sich geradlinig
und gleichförmig. Die Relativbewegung entspricht formal der Bewegung eines einzelnen Teilchens in
einem Kraftfeld. Statt der gekoppelten Bewegungsgleichungen für ein Zwei-Teilchen-System müssen wir
also nur noch die Bewegungsgleichungen für ein einzelnes Teilchen lösen, das zwar keine physikalische
Existenz hat, das wir uns aber als ein fiktives Teilchen in einem Kraftfeld vorstellen können.
Um anschließend aus den Bewegungen dieses fiktiven Teilchens wieder die Bewegungen der zwei realen
Teilchen zu rekonstruieren, müssen wir nur noch die Relationen (3.53) und (3.54) umkehren. Man findet
für die Ortsvektoren
"
(3.58)
70
(c)
(d)
(b)
(a)
Abbildung 3.6: Der Schwerpunkt (a) eines abgeschlossenen Zwei-Teilchen-Systems verhält sich wie ein
freies Teilchen mit Masse
, Ortsvektor
und Impuls . Er bewegt sich geradlinig
und gleichförmig, während die beiden Teilchen eine vom jeweiligen Kraftgesetz abhängige Bewegung
ausführen. Im speziellen Fall einer linearen, anziehenden Kraft verläuft die Relativbewegung (b) in Form
einer Ellipse mit Mittelpunkt im Ursprung. Der Drehimpuls steht auf dieser Ebene senkrecht.
und für die Impulse
"- (3.59)
Aus den ersten beiden Gleichungen ergibt sich unter anderem, dass der Schwerpunkt eines Zwei-TeilchenSystems immer auf der Verbindungslinie der beiden Teilchen liegt. Die typische Situation ist in Abbildung 3.6(a) dargestellt. Während sich der Schwerpunkt wie ein Teilchen der Masse
mit Ortsvektor
geradlinig und gleichförmig bewegt, führen die beiden Teilchen eine vom jeweiligen
und Impuls
Kraftgesetz abhängige Relativbewegung aus. Im dort dargestellten Fall umkreisen sie einander.
Aufgabe 3.19 Man zeige, dass eine Aufspaltung der Bewegungen eines Zwei-Teilchen-Systems in
Schwerpunkt- und Relativbewegung auch dann möglich ist, wenn die Wechselwirkung nicht nur vom Abstandsvektor, sondern auch von der relativen Geschwindigkeit " der beiden Teilchen abhängt.
Aufgabe 3.20 Eine Aufspaltung in Schwerpunkt- und Relativbewegung ist im Prinzip auch dann m öglich,
wenn die Wechselwirkung der beiden Teilchen nicht nur von ihrer relativen Position, sondern explizit von
beiden Orten abhängt. Das ist mit dem dritten Newtonschen Gesetz verträglich, so dass auch dann der
Schwerpunkt eine geradlinige und gleichförmige Bewegung ausführt. In welcher Art von Kraftfeld bewegt
sich in diesem Fall das fiktive Teilchen, das die Relativbewegung beschreibt? Wie w ürde man zur Lösung
der Bewegungsgleichungen am besten vorgehen?
Ein lineares Kraftgesetz
Um das ganze an einem expliziten Beispiel etwas deutlicher zu machen, betrachten wir ein lineares Kraftgesetz. Die beiden Teilchen sollen sich gegenseitig anziehen, wobei der Betrag der Anziehungskraft pro71
portional zu ihrem Abstand ist. Wir können uns dazu vorstellen, dass die beiden Teilchen durch Gummiband miteinander verbunden sind, dessen Zugkraft proportional zu seiner Länge ist.
Die Kraft, die das Teilchen 7 auf das Teilchen 0 ausübt, ist dann proportional zum Abstandsvektor
" und zeigt in Richtung des Teilchens 7 . Für die Kraft, die das Teilchen 0 auf das Teilchen 7 ausübt,
gilt dasselbe mit umgekehrtem Vorzeichen. Es ist also
" # "
" # "
mit
6 (3.60)
Die Konstante ist eine Eigenschaft das Gummibandes, das die Teilchen miteinander verbindet. Sie wird
Federkonstante genannt und hat die Dimension Kraft geteilt durch Länge, also 0 N m 0 kg s
Schreiben wir die Bewegungsgleichungen des Zwei-Teilchen-Systems noch einmal in der Form (3.52)
auf, so lauten sie
0
0
" # "
5, "
(3.61)
Nun wissen wir bereits, wie wir sie am besten lösen können. Wir betrachten zunächst das fiktive EinTeilchen-System, das durch die Bewegungsgleichungen (3.57) beschrieben wird, also
0
" ? mit
(3.62)
Eine spezielle Eigenschaft dieses Systems ist, dass die Bewegungsgleichungen in den gesuchten Funktionen und linear sind. In Kapitel 6 werden wir uns sehr ausführlich mit solchen Systemen beschäftigen
und dort auch zeigen, mit welcher speziellen Technik man solche Differenzialgleichungen ganz allgemein
lösen kann. Hier wollen wir uns mit einem gut motivierten Ansatz begnügen und zeigen, dass dieser die
gewünschte Lösung liefert.
Wenn wir einmal von den Konstanten und absehen, und von der Tatsache, dass die gesuchten
Funktionen und keine Skalare sondern Vektoren sind, so handelt es sich um ein Gleichungssystem, das
fast so aussieht wie das Gleichungsystem (2.70) oder (2.71), das wir zur Definition der Winkelfunktionen
benutzt haben. Es liegt daher nahe, für die gesuchten Funktionen und einen Ansatz zu machen,
der die Winkelfunktionen und 3! enthält.
Da wir noch nichts über die Anfangsbedingungen gesagt haben, machen wir einen möglichst allgemeinen Ansatz, bei dem wir sowohl als auch als Linearkombination einer Sinus- und einer KosinusFunktion darstellen. Außerdem müssen wir beachten, dass das Argument der Funktionen und 1!
ein Winkel, also eine dimensionslose Größe ist. Die Zeit ist aber eine dimensionsbehaftete Größe. Wir
müssen sie also zunächst mit eine Größe multiplizieren, die die Dimension einer inversen Zeit hat,
0 s. Wo wir eine solche Größe her bekommen, werden wir gleich sehen.
Versuchen wir also, die Bewegungsgleichungen (3.62) mit dem folgenden Ansatz zu lösen,
3! 1!
Für die Zeitableitungen dieser Funktionen finden wir
&
3! "
1! "
(3.63)
(3.64)
Jetzt müssen wir das nur noch in (3.62) einsetzen und jeweils die linken und rechten Seiten der Gleichungen miteinander vergleichen. Tatsächlich finden wir, dass es sich um eine Lösung der Bewegungsgleichungen handelt, falls die folgenden Bedingungen erfüllt sind,
0
? "
0
" 72
'
+
(3.65)
Durch Kombination jeweils zwei dieser Gleichungen ergibt sich
(3.66)
Die Lösung mit dem anderen Vorzeichen können wir ausschließen, da wir ohne Beschränkung der Allge6 annehmen können. Sonst drehen wir in (3.63) einfach das Vorzeichen von und um.
meinheit
Wie man leicht sieht, ist tatsächlich eine Größe der Dimension inverse Zeit, denn hat die Dimension
Masse geteilt durch Zeit zum Quadrat und ist eine Masse.
Die Vektoren , , und lassen sich nun leicht aus den Anfangsbedingungen bestimmen. Befindet
sich das Teilchen zur Zeit 6 am Ort mit einem Impuls , so ergibt sich aus (3.63) für 6 , und
anschließend aus (3.65)
0
"
(3.67)
Folglich ergibt sich die Bahn des Teilchens zu
&
3! Das Teilchen führt eine periodische Bewegung aus. Es gilt 7 7 &
(3.68)
, wobei die Periode
durch
(3.69)
gegeben ist. Wie in Abbildung 3.6(b) gezeigt wird, bewegt sich das Teilchen mit der Masse in einer durch
die Vektoren und aufgespannten Ebene und beschreibt dort eine Ellipse, die periodisch durchlaufen
wird.
Jetzt müssen wir nur noch mit Hilfe der Formeln (3.58) die Bewegung des fiktiven Teilchens zurück in
die Bewegungen der beiden realen Teilchen übersetzen. Dazu benötigen wir noch die Anfangsbedingungen
für die Schwerpunktbewegung. Es ist etwas einfacher, statt der Impulse die Geschwindigkeiten anzugeben.
Dann können wir (3.50) mit 6 und (3.68) wie folgt schreiben,
&
&
1! 1! 3! (
(3.70)
Aus (3.58) ergibt sich schließlich
1 & &
"
(
(
(3.71)
Um das ursprünglich gestellte Problem zu lösen, nämlich die Bewegung der beiden Teilchen bei vorgegebenen Anfangsbedingungen zu beschreiben, müssen wir jetzt nur noch die Anfangsbedingungen für
Relativ- und Schwerpunktbewegung, also die Größen , ( , und , durch die entsprechenden Anfangsbedingungen für die beiden Teilchen, also die Anfangsorte und die Anfangsgeschwindigkeiten
73
(
6 ausdrücken. Das ist nicht sehr schwierig. Wir müssen dazu nur (3.71) und die Ableitung davon bei
auswerten. Dann finden wir
(
( $
( (
"
"-(
(3.72)
Wir können jetzt zu beliebigen Anfangsbedingungen die eindeutige Lösung der Bewegungsgleichung des
Zwei-Teilchen-Systems angeben. Die Bewegung verläuft stets so, dass die beiden Teilchen einander mit
der Periode umlaufen, während sich das System als ganzes geradlinig und gleichförmig durch den
Raum bewegt. Das ist bereits der erste Schritt zur Beschreibung eines zusammengesetzten Körpers, der
aus mehreren Teilchen besteht und eine räumliche Ausdehnung besitzt.
Aufgabe 3.21 Zur Lösung der Bewegungsgleichungen (3.62) haben wir den Ansatz (3.63) gemacht und
gesehen, dass dieser tatsächlich die Differenzialgleichungen erfüllt, wenn die Parameter die Bedingungen
(3.65) erfüllen. Warum können wir sicher sein, damit die allgemeinste Lösung der Bewegungsgleichungen
gefunden zu haben?
Aufgabe 3.22 Eine Ellipse mit Mittelpunkt im Ursprung wird normalerweise durch ihre beiden zueinander senkrecht stehenden Halbachsen beschrieben. Es seien und zwei zueinander senkrecht stehende
Vektoren. Dann beschreibt die Kurve
(3.73)
& 1! eine Ellipse in der durch und aufgespannten Ebene, mit Halbachsen und . Die Vektoren und bestimmen also sowohl die Halbachsen als auch die Lage der Ellipse im Raum. Die Darstellung (3.68) ist
nicht von dieser Form, da und beliebig sind und daher im allgemeinen nicht zueinander senkrecht
stehen. Man zeige jedoch, dass die Bahn trotzdem eine Ellipse ist und bestimme die beiden Halbachsen
als Funktion von und .
Zentralkraft und Drehimpuls
Bei der gerade berechneten Relativbewegung von zwei wechselwirkenden Teilchen haben wir festgestellt,
dass diese in einer Ebene stattfindet. Wir wollen zeigen, dass dies kein Zufall ist, sondern dass es sich um
eine allgemeine Eigenschaft einer bestimmten Klasse von Wechselwirkungen handelt.
Statt eines Zwei-Teilchen-Systems betrachten wir zunächst ein einzelnes Teilchen mit Masse , Ortsvektor und Impuls in einem Kraftfeld . Das Kraftfeld soll die Eigenschaft haben, dass die Kraft
stets zu einem bestimmten Punkt im Raum hin oder von diesem weg gerichtet ist. Mit anderen Worten,
das Teilchen wird von einem festen Punkt im Raum, dem Kraftzentrum, angezogen oder abgestoßen. Der
Betrag und das Vorzeichen der Kraft können jedoch beliebig vom Ort des Teilchens abhängen.
Natürlich passen wir unser Koordinatensystem dem Kraftfeld an und wählen es so, dass das Kraftzentrum im Ursprung liegt. Die Kraft , ist dann proportional zum Ortsvektor ,
& (3.74)
An die skalare Funktion , die das Vorzeichen und den Betrag der Kraft bestimmt, stellen wir keine
weiteren Forderungen. Eine Kraft dieser Art heißt Zentralkraft.
Wir wollen zeigen, dass in einem Zentralkraftfeld eine Erhaltungsgröße existiert. Wir definieren dazu
den Drehimpuls des Teilchens als das Kreuzprodukt des Ortsvektors mit dem Impuls,
Drehimpuls
74
(3.75)
(b)
(a)
Abbildung 3.7: Der Drehimpulsvektor definiert die momentane Drehachse eines Teilchens, wenn wir
seine Bewegung als Umlaufbewegung um den Koordinatenursprung auffassen. Sein Betrag gibt an, welche Fläche
der Ortsvektor des Teilchens innerhalb eines Zeitintervalls überstreicht. Da sowohl die
Drehachse als auch die überstrichene Fläche von der Wahl des Ursprungs abhängen, ist auch der Drehimpulsvektor von der Wahl des Ursprungs abhängig.
Der Drehimpuls hat die Dimension Länge mal Impuls, also Masse mal Länge zum Quadrat geteilt durch
Zeit, 0 kg m s.
Um die Bezeichnung “Drehimpuls” zu verstehen, überlegen wir uns kurz, welche geometrisch anschauliche Bedeutung dieser Vektor hat. In Abbildung 3.7(a) ist die Bahn eines Teilchens im Raum dargestellt. Wir betrachten ein kurzes Stück dieser Bahn, zwischen und . Für kleine Zeiten können wir
dieses Stück der Bahn näherungsweise durch eine gerade Strecke beschreiben, also annehmen, dass die
Geschwindigkeit und damit auch der Impuls des Teilchens annähernd konstant ist.
Das Teilchen bewegt sich dann in einer Ebene, die durch den Ursprung verläuft und die von den Vektoren
und aufgespannt wird. Der Drehimpuls steht auf beiden senkrecht, definiert also den Normalenvektor
dieser Ebene. Etwas vereinfacht können wir sagen, dass der Drehimpulsvektor durch seine
Richtung diejenige Ebene durch den Ursprung festlegt, auf der sich das Teilchen zum Zeitpunkt gerade
bewegt. Das Teilchen befindet sich in dieser Ebene, und seine Geschwindigkeit, also der Tangentenvektor
der Bahn, liegt ebenfalls in dieser Ebene.
Wir können auch die Orientierung dieser Ebene durch die Bewegung des Teilchens festlegen. Blicken
wir vom Ursprung aus auf das Teilchen, so bewegt es sich in eine von zwei möglichen Richtungen, so
als würde es um den Ursprung kreisen. Tatsächlich können wir das kleine Stücke der Bahn statt durch
eine gerade Strecke auch durch einen Kreisbogen approximieren, dessen Mittelpunkt sich im Ursprung
befindet. Die Bewegungsrichtung des Teilchens legt also einen Drehsinn der Ebene fest, in der es sich
bewegt.
Wie man sich leicht mit Hilfe der Rechten-Hand-Regel überzeugen kann, stimmt diese Orientierung mit
derjenigen überein, die durch den Normalenvektor festgelegt wird, also durch die Richtung des
Drehimpulses. Zeigt der Daumen der rechten Hand in Richtung des Drehimpulsvektors, so zeigen die zur
Faust zusammengerollten Finger die Umlaufrichtung des Teilchens um den Ursprung an. In diesem Sinne
beschreibt der Drehimpuls eine Rotationsbewegung. Seine Richtung definiert die momentane Drehachse,
um die das Teilchen rotiert.
Auch der Betrag des Drehimpulses hat eine geometrische Bedeutung. Wir betrachten dazu die in Abbil-
75
dung 3.7(a) dargestellte Fläche , die der Ortsvektor in dem Zeitintervall von bis überstreicht.
Für sehr kleine Zeiten ist die Fläche die eines sehr lang gezogenen Dreiecks, welches durch die
aufgespannt wird. Da die Dreiecksfläche die Hälfte der Fläche eines ParalleVektoren und logramms ist, gilt näherungsweise
7
0
Teilen wir diese Gleichung durch
7
0
7
0
"
(3.76)
6 , so ergibt sich
und bilden anschließend den Grenzwert &
"
7
0
7
(3.77)
Sehen wir von dem Faktor 7 einmal ab, so gibt der Betrag des Drehimpulses an, welche Fläche der
Ortsvektor des Teilchens pro Zeit überstreicht.
Das alles gilt natürlich immer nur für einen kurzen Moment der Bewegung. Im allgemeinen ändert
sich sowohl der Betrag als auch die Richtung des Drehimpulses mit der Zeit. Die spezielle Eigenschaft
einer Zentralkraft ist jedoch, dass der Drehimpuls unter ihrem Einfluss zeitlich konstant ist. Berechnen wir
nämlich die Zeitableitung des Drehimpulses, so ergibt sich
*
0
*
(3.78)
Hier haben wir die Bewegungsgleichungen (3.32) verwendet, und die Tatsache, dass das Kreuzprodukt
eines Vektors mit sich selbst verschwindet.
Die Zeitableitung des Drehimpulses ist folglich durch die Größe gegeben, die als Drehmoment
bezeichnet wird. Für eine Zentralkraft ist das Drehmoment aber gleich Null, denn die Kraft ist proportional
zum Ortsvektor,
& ! (3.79)
Also ist der Drehimpuls eine Erhaltungsgröße. Da der Vektor sowohl zu also auch zu senkrecht
steht, folgt daraus unmittelbar, dass die gesamte Bewegung des Teilchens in einer Ebene stattfindet, und
. Außerdem ergibt sich, dass der
zwar in der zu senkrechten Ebene mit dem Normalenvektor Ortsvektor des Teilchens in gleichen Zeiten gleiche Flächen in dieser Ebene überstreicht.
Beides sind übrigens auch Eigenschaften der Planetenbahnen im Sonnensystem, die Kepler durch Beobachtungen derselben gefunden hatte. Wir werden darauf in Kapitel 8 noch näher eingehen, wo wir die
Bahnen von Himmelskörpern unter dem Einfluss der Gravitation berechnen werden. Auch dabei handelt
es sich um Zentralkräfte. Der Drehimpuls als Erhaltungsgröße spielte also bereits in den allerersten astronomischen Beobachtungen, die zur Bestätigung die Newtonsche Mechanik herangezogen wurden, eine
entscheidende Rolle.
Aufgabe 3.23 Man zeige, dass der Drehimpuls eines freien Teilchens genau dann gleich Null ist, wenn das
Teilchen entweder ruht, oder sich auf einer Geraden durch den Ursprung bewegt. In allen anderen F ällen
gibt es genau eine Ebene, die sowohl den Ursprung als auch die komplette Bahn des Teilchens enth ält.
Aufgabe 3.24 Von einem freien Teilchen sind der Impuls und der Drehimpuls bekannt. Lässt sich
daraus die Bahn des Teilchens bestimmen? Wenn ja, wie? Wenn nicht, wie sehen alle m öglichen
Bahnen aus, die zu den gegebenen Daten passen? Es sei
7 7 "
(3.80)
wobei zwei Konstanten der Dimension Impuls bzw. Drehimpuls sind. Man bestimme eine Bahn
für ein freies Teilchen mit diesen Daten.
76
Aufgabe 3.25 Ein Teilchen bewegt sich in einem Zentralkraftfeld. Es bewegt sich auf das Kraftzentrum
zu, erreicht zu einem Zeitpunkt einen minimalen Abstand, und entfernt sich wieder. Sonst ist über
die Bewegung nichts bekannt. Der minimale Abstand, den das Teilchen erreicht, sei , und der
Betrag des Impulses zu diesem Zeitpunkt sei . Man zeige, dass der Betrag des Drehimpulses,
der in diesem Fall eine Erhaltungsgröße ist, durch gegeben ist.
Gesamt-, Schwerpunkt- und innerer Drehimpuls
Es war also kein Zufall, dass die Relativbewegung der beiden Teilchen in dem zuletzt diskutierten Beispiel
in einer Ebene stattfand. Das Kraftgesetz " , von dem wir dort ausgegangen sind, war nämlich
eine Zentralkraft (3.74), mit " . Allerdings hatten wir dort ursprünglich ein Zwei-TeilchenSystem betrachtet, das sich formal auf ein fiktives Ein-Teilchen-System reduzieren ließt, während wir
hier von Anfang an nur ein einzelnes Teilchen in einem äußeren Kraftfeld untersucht haben.
Wir wollen daher die Definition des Drehimpulses auf ein -Teilchen-System erweitern. Natürlich
können wir für jedes einzelne Teilchen mit Ortsvektor und Impuls einen Drehimpuls einführen,
(3.81)
Nun nehmen wir an, dass sämtliche Wechselwirkungen zwischen den Teilchen durch Zentralkräfte gegeben sind. Das Kraftzentrum ist jetzt natürlich das jeweils andere Teilchen, das heißt die Teilchen ziehen
sich gegenseitig an oder stoßen sich ab. Die Kräfte sind dann proportional zum jeweiligen Abstandsvektor,
"
" (3.82)
, die die Vorzeichen und Beträge der Kräfte bestimmen, im einzelnen
Wovon die skalare Größen abhängen, ist an dieser Stelle wieder nicht wichtig. Es soll aber das dritte Newtonsche Gesetz gelten, also
"
" " (3.83)
Zusätzlich kann auf jedes Teilchen noch eine äußere Kraft wirken, von der wir aber ebenfalls annehmen,
dass es sich um eine Zentralkraft handelt. In diesem Fall ist das Kraftzentrum wieder der Ursprung des
Koordinatensystems,
(3.84)
$ Für die Ableitung des Drehimpulses des Teilchens
nach der Zeit gilt dann
" "
. (3.85)
Der erste Ausdruck in der zweiten Zeile ist Null, da eine äußere Zentralkraft auf ein einzelnes Teilchen
kein Drehmoment ausübt. Es bleibt aber ein nicht verschwindender Term stehen, der von den Wechselwirkungen der Teilchen herrührt. Die einzelnen Drehimpulse der Teilchen sind keine Erhaltungsgrößen.
Summieren wir jedoch über alle Teilchen und bilden den Gesamtdrehimpuls
Gesamtdrehimpuls
(3.86)
so ist dies eine Erhaltungsgröße. Für die Zeitableitung gilt nämlich
"
77
(3.87)
Die Summe läuft wieder über alle Paare mit
. Folglich gibt es zu jedem Paar ein
entsprechendes Gegenpaar . Die Beiträge dieser beiden Paare haben sich auf. Es ist nämlich wegen
, aber " . Also haben wir gezeigt, dass der Gesamtdrehimpuls eine
(3.83) Erhaltungsgröße ist,
!
konst (3.88)
Das gilt für jedes System von Teilchen, die über Zentralkräfte miteinander wechselwirken, und unabhängig
davon, wovon die Kräfte sonst noch abhängen. Außerdem können äußere Kräfte vorliegen, solange dies
auch Zentralkräfte sind und das Kraftzentrum im Koordinatenursprung liegt.
In Systemen mit Zentralkräften ist der Gesamtdrehimpuls eine Erhaltungsgröße.
Offenbar scheint hier die Wahl des Koordinatenursprung eine spezielle Rolle zu spielen, während sie zum
Beispiel beim Gesamtimpuls als Erhaltungsgröße völlig unerheblich ist. Das liegt daran, dass der Drehimpuls eines Teilchens, genau wie sein Ortsvektor, immer nur relativ zu einem ausgewählten Bezugspunkt
definiert werden kann. Der Ortsvektor tritt in der Definition (3.75) explizit auf, und auch aus dem Ver
gleich der Abbildungen 3.7(a) und (b) sollte klar werden, dass der Drehimpuls im Gegensatz zum Impuls
eines Teilchens von der Wahl des Ursprungs abhängt.
verschieben, und einen neuen DrehimWas passiert, wenn wir den Ursprung um einen Vektor puls bezüglich des neuen Ursprungs
definieren? Wie wir aus (3.6) wissen, hängt der neue Ortsvektor
und mit dem alten Ortsvektor des Teilchens über "
zusammen, während der Impuls unter ei ner Verschiebung des Ursprungs invariant ist,
. Definieren wir den Drehimpuls bezüglich des neuen
Ursprungs, so finden wir
"
"
. "
(3.89)
Bei einer Verschiebung des Ursprungs um den Vektor transformiert sich der Drehimpuls um einen Vek
tor, der durch das Kreuzprodukt der Verschiebung mit dem Impuls gegeben ist.
Daraus können wir verschiedene interessante Schlüsse ziehen. Zunächst stellen wir fest, dass wir zwar
den Drehimpuls bezüglich jedes beliebigen Punktes im Raum definieren können, indem wir diesen Punkt
als Ursprung des Koordinatensystems wählen. Aber diese Größen sind nicht voneinander unabhängig.
Wenn wir den Drehimpuls eines Teilchens bezüglich irgendeines Punktes im Raum kennen, sowie seinen
Impuls, so können wir den Drehimpuls bezüglich aller anderen Bezugspunkte ausrechnen.
Außerdem gilt folgende Aussage über Erhaltungsgrößen. Wenn sowohl der Impuls als auch der Drehimpuls bezüglich eines bestimmten Bezugspunktes Erhaltungsgrößen sind, so gilt das auch für den Drehimpuls bezüglich irgendeines anderen Punktes im Raum. Für ein einzelnes Teilchen ist diese Aussage
ziemlich uninteressant, da der Impuls nur dann eine Erhaltungsgröße ist, wenn das Teilchen frei ist und
sich ohnehin nur geradlinig und gleichförmig bewegt.
Aber für ein System von mehreren Teilchen ist sie interessant. Für den Gesamtdrehimpuls eines Systems
von mehreren Teilchen gilt nämlich dasselbe Transformationsverhalten bei Verschiebung des Ursprungs.
Aufgabe 3.26 Es sei der Gesamtdrehimpuls eines -Teilchen-Systems bezüglich des Ursprungs , und
. Man zeige,
der entsprechende Gesamtdrehimpuls bezüglich eines anderen Ursprungs , mit
dass dann
"
(3.90)
gilt, wobei
der Gesamtimpuls des Systems ist.
Liegt ein abgeschlossenes System von Teilchen vor, deren Wechselwirkungen durch Zentralkräfte beschrieben werden, so ist sowohl der Gesamtimpuls als auch der Gesamtdrehimpuls bezüglich jedes beliebigen Ursprungs eine Erhaltungsgröße. Allerdings gilt auch hier, dass nicht alle diese Größen unabhängig
sind, denn sie hängen über die Beziehung (3.90) zusammen.
78
Schließlich können wir in diesem Fall noch eine weitere interessante Erhaltungsgröße angeben, die wir
weiter oben sogar schon benutzt haben. Bilden wir nämlich aus dem Ortsvektor des Schwerpunktes und
dem Gesamtimpuls eines abgeschlossenen Systems einen Drehimpulsvektor des Schwerpunktes, den
wir mit bezeichnen,
Schwerpunktdrehimpuls
/
(3.91)
so ist zunächst auch dies eine Erhaltungsgröße. Denn der Schwerpunkt eines abgeschlossenen Systems
bewegt sich wie ein freies Teilchen, also wirkt auf ihn insbesondere kein Drehmoment. Man könnte vermuten, dass dieser Schwerpunktdrehimpuls daselbe ist wie der Gesamtdrehimpuls . Schließlich ist
der Schwerpunktimpuls ja auch gleich dem Gesamtimpuls des Systems. Man kann sich aber leicht davon
überzeugen, dass dies nicht der Fall ist. Nur für ein einzelnes Teilchen ist .
Für ein System aus mehreren Teilchen bezeichnet man die Differenz
innerer
Drehimpuls
"
(3.92)
als inneren Drehimpuls. Auch dies ist natürlich eine Erhaltungsgröße, wenn das System abgeschlossen ist
und alle Kräfte Zentralkräfte sind. Diese Größe ist deshalb interessant, weil sie nicht von der Wahl des
Ursprungs abhängt.
Aufgabe 3.27 Man beweise, dass bei einer Verschiebung des Ursprungs
punktdrehimpuls das Transformationsgesetz (3.90) gilt,
und dass folglich für den inneren Drehimpuls
"
/
auch für den Schwer-
(3.93)
gilt.
Für ein Zwei-Teilchen-Systems ist der innere Drehimpuls nichts anderes als der Drehimpuls der Relativbewegung. Wie wir im letzten Abschnitt gezeigt haben, lässt sich ein abgeschlossenes Zwei-Teilchen-System
in eine Schwerpunkt- und eine Relativbewegung zerlegen, wobei die Relativbewegung formal als die Bewegung eines fiktiven, einzelnen Teilchens beschrieben werden kann.
Ortsvektor und Impuls dieses Teilchens waren durch (3.54) gegeben. Bilden wir daraus den Drehimpulsvektor der Relativbewegung, der in Abbildung 3.6(b) dargestellt ist, so ergibt sich
"
' "
" "
(3.94)
(3.95)
Für den Schwerpunktdrehimpuls gilt anderseits
. Addieren wir die beiden Gleichungen, so bekommen wir
79
(3.96)
. Der innere Drehimpuls
"
also den Gesamtdrehimpuls. Aus der Definition
folgt also
eines Zwei-Teilchen-Systems ist der Drehimpuls des fiktiven Teilchens, welches die Relativbewegung der
beiden realen Teilchen beschreibt.
In diesem Fall besteht übrigens kein Zweifel über den zu wählenden Bezugspunkt. Der Raum, in dem
die Relativbewegung zweier Teilchen stattfindet, ist kein affiner Raum sondern ein Vektorraum. Es gibt
einen ausgezeichnet Nullpunkt in diesem Raum. Das fiktive Teilchen befindet sich genau dann an diesem
Nullpunkt, wenn sich die beiden realen Teilchen im physikalischen Raum an demselben Ort befinden.
Das erklärt auch, warum der innere Drehimpuls eines -Teilchen-Systems unabhängig von irgendeinem
Bezugspunkt definiert ist. Hier dient gewissermaßen der Schwerpunkt des Systems als “dynamischer” Bezugspunkt. Der innere Drehimpuls eines Systems aus vielen Teilchen ist der Gesamtdrehimpuls bezüglich
des Schwerpunktes.
Zusammenfassend können wir festhalten, dass in einem abgeschlossenen System mit Zentralkräften
zunächst der Gesamtimpuls eine Erhaltungsgröße ist, und daher der Schwerpunkt eine geradlinige und
gleichförmige Bewegung ausführt. Diese Schwerpunktbewegung kann von den Relativbewegungen der
Teilchen entkoppelt werden. Zusätzlich existiert dann noch der innere Drehimpuls als Erhaltungsgröße,
die verwendet werden kann, um die Bewegungsgleichungen für die Relativbewegung zu vereinfachen.
Für ein Zwei-Teilchen-System entspricht die Relativbewegung der Bewegung eines fiktiven Teilchens in
einem Zentralkraftfeld, und der innere Drehimpuls ist der gewöhnliche Drehimpuls dieses fiktiven
Teilchens.
Aufgabe 3.28 Man berechne für die explizit durch (3.71) gegebenen Bahnen von zwei Teilchen die Dre
himpulse 3 , , den Gesamtdrehimpuls , den Schwerpunktdrehimpuls , und den inneren Drehimpuls .
Aufgabe 3.29 Wir betrachten ein System von Teilchen, die über Zentralkräfte miteinander wechselwirken. Zusätzlich wirkt auf alle Teilchen dieselbe konstante äußere Kraft, zum Beispiel die Gravitationskraft
(3.29). Da es sich weder um ein abgeschlossenes System handelt, noch alle Kr äfte Zentralkräfte sind, ist
weder der Gesamtimpuls , noch der Gesamtdrehimpuls eine Erhaltungsgröße. Man zeige jedoch, dass
der innere Drehimpuls eine Erhaltungsgröße ist.
Aufgabe 3.30 Man löse die Bewegungsgleichungen für ein Zwei-Teilchen-System, wobei auf beide Teilchen die Gravitationskraft (3.29) wirkt, sowie eine lineare Wechselwirkung der Form (3.60) vorliegt. Als
Anfangsbedingung sei vorgegeben, dass sich das Teilchen 0 zum Zeitpunkt 6 in einer H öhe senkrecht über dem Teilchen 7 befindet und dort ruht, während sich das Teilchen 7 mit der Geschwindigkeit in horizontale Richtung bewegt. Bei einer geeigneten Wahl des Koordinatensystems gilt dann
? ! ( ! (
(3.97)
Man berechne die Zeit , die es dauert, bis beide Teilchen zum ersten Mal auf gleicher H öhe sind, also die
gleiche -Koordinaten haben, und bestimme diese Höhe.
4 Die Gravitationskraft
Wir haben bereits den freien Fall eines Teilchens im Schwerefeld der Erde in der Nähe ihrer Oberfläche
berechnet. Dort konnten wir annehmen, dass die Erde eine konstante Anziehungskraft auf das Teilchen
ausübt, die unabhängig von Ort und Zeit ist. Das gilt natürlich nicht mehr, wenn wir uns weiter von der
Erdoberfläche entfernen, und wenn die beteiligten Körper selbst größere Himmelskörper sind.
Um die Bewegungen vom Himmelskörpern zu beschreiben, die durch Gravitationskräfte miteinander
wechselwirken, müssen wir dafür ein allgemeineres Kraftgesetz formulieren. Auch dieses Kraftgesetz
80
replacements
(c)
(d)
(b)
(a)
Abbildung 4.1: Die Gravitationskräfte als Wechselwirkungen zwischen Paaren von Teilchen (a). Jedes
Teilchen wird von allen anderen Teilchen angezogen, wobei der Betrag der Kraft von den Massen der
beteiligten Teilchen und von deren Abstand abhängt. Als spezielle Lösung der Bewegungsgleichungen
für ein Zwei-Teilchen ergibt sich eine kreisförmige Bewegung der beiden Teilchen um den gemeinsamen
Schwerpunkt (b).
geht auf Newton zurück, der als erster erkannte, dass die Wechselwirkungen zwischen Himmelskörpern
letztlich die gleiche Ursache haben wie der freie Fall in der Nähe der Erdoberfläche. Auf dieser Erkenntnis, gestützt durch die Beobachtungen von Galilei und Kepler, beruhte der große Erfolg der klassischen
Mechanik. Es war die erste physikalische Theorie, die in einheitlicher Weise sowohl irdische als auch
kosmische Vorgänge beschreiben konnte.
Das Newtonsche Gravitationsgesetz besagt, dass ein als punktförmig angenommener Körper der Masse
am Ort auf einen ebenfalls punktförmigen Körper der Masse am Ort eine anziehende Kraft
ausübt, deren Betrag proportional zu den beiden Massen und umgekehrt proportional zum Quadrat des
Abstands der beiden Körper ist. In Formeln ausgedrückt, und mit der im letzten Kapitel eingeführten
Notation gilt
Gravitationskraft
"
" " (4.1)
Es handelt sich um eine Zentralkraft der Form (3.82), deren Betrag nur vom Abstand der beiden Teilchen
abhängt. Das negative Vorzeichen besagt, dass die Kraft stets anziehend ist. Die universelle Konstante ,
die in diesem Kraftgesetz auftritt, heißt Gravitationskonstante. Sie hat den Wert
6: 0 6 N m kg
6: 0 6 m kg s
(4.2)
Soweit dies im Rahmen der klassischen Physik möglich ist, beschreibt das Newtonsche Gravitationsgesetz
praktisch die gesamte Himmelsmechanik, insbesondere die Bewegungen der Planeten im Sonnensystem.
Trägheit und Gewicht
Dass die Anziehungskraft zwischen zwei Teilchen proportional zu deren Massen ist, hat eine interessante
Konsequenz. Betrachten wir nämlich die Bewegungsgleichung zweiter Ordnung für eines der beteiligten
Teilchen,
"
81
" " (4.3)
so kürzt sich die Masse dieses Teilchens aus der Gleichung heraus,
"
" " (4.4)
Die Beschleunigung, die das Teilchen durch die Anziehungskräfte der anderen Teilchen erfährt, hängt nur
von deren Massen ab, sowie von den relativen Positionen der anderen Teilchen, aber nicht von der Masse
des Teilchens selbst.
Um zu verstehen, was das anschaulich bedeutet, betrachten wir ein System von mehreren Teilchen, die
nur über Gravitationskräfte miteinander wechselwirken. Eines dieser Teilchen soll ein Testteilchen sein.
Ein Testteilchen hat eine so kleine Masse, dass es zwar die Anziehungskräfte der anderen beteiligten
Körper spürt, umgekehrt aber die Anziehungskraft, die es auf die anderen Körper ausübt, vernachlässigt
werden kann. Ein typisches Beispiel wäre ein kleines Raumfahrzeug, das sich im Sonnensystem allein
unter dem Einfluss der Gravitationskräfte der Sonne und der Planeten bewegt.
die Masse des RaumFür dieses Raumfahrzeug gilt eine Bewegungsgleichung der Form (4.3), wobei fahrzeugs ist. Für die Planeten und die Sonne gilt eine entsprechende Bewegungsgleichung. Jedoch können
wir dort den Beitrag des Raumfahrzeugs vernachlässigen, denn die Anziehungskraft des Raumfahrzeugs
auf die Planeten und die Sonne ist sehr viel kleiner als die gegenseitigen Anziehungskräfte dieser Körper.
Das Raumfahrzeug als Testteilchen beeinflusst die Bewegungen der Planeten nicht.
Letztlich folgt aus dieser Überlegung, dass die Masse des Raumfahrzeugs in gar keiner Bewegungsgleichung mehr auftritt. Aus der für das Raumfahrzeug kürzt sie sich heraus, und in den Bewegungsgleichungen für die Sonne und die Planeten ist sie vernachlässigbar klein. Somit hängt die Bahn , die
das Raumfahrzeug beschreibt, nur von den Anfangsbedingungen und für das Raumfahrzeug
und von den Bahnen von der Sonne und den Planeten ab. Sie hängt aber nicht von der Masse oder
irgendeiner anderen Eigenschaft des Raumfahrzeugs ab.
Einen Körper, auf den nur Gravitationskräfte wirken, bezeichnet man als frei fallenden Körper. Die
Bahn eines solchen frei fallenden Körpers hängt also, sofern seine Masse im Vergleich zu den Massen der
anderen Körper vernachlässigbar ist, nicht von irgendwelchen Eigenschaften des Körpers ab, sondern nur
von den Anfangsbedingungen. Das lässt sich auch wie folgt formulieren:
Unter dem Einfluss von Gravitationskräften fallen alle Testteilchen gleich schnell.
Das ist ein sehr merkwürdiges Phänomen, das wir zwar aus dem Alltag kennen, für das es aber im Rahmen
der klassischen Mechanik keine Erklärung gibt. Es ist gewissermaßen ein “Zufall”, dass auf beiden Seiten
der Bewegungsgleichung (4.3) dieselbe Größe auftritt, nämlich die Masse des jeweiligen Teilchens.
Wir erinnern uns, dass wir die Masse als ein Maß für die Trägheit eines Körpers eingeführt hatten. Je
größer die Masse ist, desto mehr widersetzt sich ein Körper gegen eine auf ihn einwirkende Kraft, die ihn
beschleunigen will. Die Eigenschaft eines Körpers, Gravitationskräfte zu spüren, nennt man Gewicht. Je
größer das Gewicht eines Körpers ist, desto größer ist die Anziehungskraft, die er in Anwesenheit anderer
Körper verspürt, und umso größer ist auch, nach dem dritten Newtonschen Gesetz, die Anziehungskraft,
die er auf andere Körper ausübt.
Auf den ersten Blick haben diese beiden Eigenschaften von Körpern oder Punktteilchen gar nichts miteinander zu tun. Im Prinzip wäre es denkbar, dass ein Teilchen doppelt so träge ist wie ein anderes, aber
nur halb so schwer. Es würde dann unter dem Einfluss von Anziehungskräften anderer Körper nur ein
Viertel der Beschleunigung des anderen Teilchens erfahren. Das merkwürdige am Newtonsche Gravitationsgesetz ist, dass es die Existenz solcher unterschiedlich gearteter Teilchen ausschließt. Es ist dieselbe
physikalische Größe, nämlich die Masse eines Teilchens, die zwei ganz verschiedene Eigenschaften des
Teilchens bestimmt, nämlich seine Trägheit und sein Gewicht.
Natürlich ist das eine Aussage der Theorie, die experimentell überprüft werden kann. Dass verschiedene
Körper im Schwerefeld der Erde gleich schnell fallen, ist eine Erkenntnis, die auf Galilei zurück geht. Es
82
gilt zwar heute als fraglich, ob er tatsächlich die oft zitierten Fallexperimente am schiefen Turm von Pisa
ausgeführt hat. Er selbst hat nämlich nie über solche Experimente berichtet. Aber unbestritten ist, dass er
durch Experimente und theoretische Überlegungen zu dem Schluss gekommen ist, dass der Schlüsselbegriff zur Beschreibung des freien Falles die Beschleunigung ist. Er konnte damit erklären, dass alle Körper
gleicher Art unabhängig von ihrer Größe gleich schnell fallen. Eine Eisenkugel von einem Kilogramm
erfährt die gleiche Beschleunigung wie eine Eisenkugel von zehn Kilogramm.
Die Begründung ist ganz einfach. Man kann eine Eisenkugel von zwei Kilogramm in zwei Teile zerlegen, die jeweils ein Kilogramm schwer sind. Lässt man diese nebeneinander fallen, so kann die Fallbeschleunigung nicht davon abhängen, ob man das ganze als ein fallendes Objekt oder als zwei fallende
Objekte beschreibt. Also kann die Bahn eines fallenden Körpers nicht von dessen Größe abhängen, solange
nicht andere, von der Größe abhängigen Kräfte wie etwa die Luftreibung auf ihn einwirken.
Was jedoch Galilei mit diesem Argument nicht erklären konnte, war die Tatsache, dass auch Körper ganz
verschiedener Art gleich schnell fallen. Es ist klar, oder zumindest verständlich, dass zwei Eisenkugeln
zusammen sowohl das doppelte Gewicht als auch die doppelte Trägheit einer einzelnen Eisenkugel haben.
Aber warum hat jeder Körper, der doppelt so träge ist wie ein anderer, auch das doppelte Gewicht? Mit
anderen Worten, warum ist das Verhältnis aus Gewicht und Trägheit für eine Eisenkugel dasselbe wie
für eine Stück Holz? Auf diese Frage gibt es, wie gesagt, im Rahmen der klassischen Mechanik keine
Antwort.
Ein geniale Erklärung dafür, warum derselbe Parameter sowohl die Trägheit als auch das Gewicht eines
Körpers bestimmt, liefert erst die allgemeine Relativitätstheorie. Aus dieser Theorie ergibt sich nämlich,
dass Gewicht und Trägheit eben doch nicht zwei völlig verschiedene Eigenschaften eines Körpers sind,
sondern dass sie in einem gewissen Sinne zueinander äquivalent sind. Man findet im Rahmen dieser Theorie, dass es sogar so sein muss, dass beide durch denselben Parameter bestimmt werden. Ansonsten wäre
die allgemeine Relativitätstheorie nämlich inkonsistent.
Warum das so ist, können wir an dieser Stelle jedoch noch nicht verstehen. Es hängt mit der Art und
Weise zusammen, die in der Relativitätstheorie die Struktur von Raum und Zeit mit der Beschreibung
von Gravitationsfeldern zusammenhängt. An dieser Stelle bleibt uns daher nichts anderes übrig als die
Tatsache zu akzeptieren, dass Trägheit und Gewicht eines Körpers durch ein und dieselbe Größe, nämlich
die Masse des Körpers bestimmt werden und diese somit auf beiden Seiten der Bewegungsgleichung (4.3)
erscheint.
Trägheit und Gewicht eines Körpers sind äquivalente Eigenschaften und werden durch die
Masse des Körpers bestimmt.
Ganz nebenbei folgt aus diesem Äquivalenzprinzip nicht nur, dass alle Körper gleich schnell fallen,
sondern auch, dass man Massen auch ganz anders messen kann als mit Hilfe der Apparatur in Abbildung 3.4(b). Man kann einen Körper auch wiegen, also sein Gewicht messen, um die Masse zu ermitteln.
Das ist natürlich auch der Grund, warum Messgeräte wie das in Abbildung 3.4(b) nicht sehr weit verbreitet
sind. Waagen, die direkt die auf einen Körper wirkende Anziehungskraft der Erde messen, sind einfach
praktischer und einfacher zu handhaben.
Aufgabe 4.1 Wie groß ist die Anziehungskraft zwischen zwei Bleikugeln von jeweils 06 kg, wenn der Abstand zwischen ihnen 0 m beträgt. Obwohl die Abmessungen der Kugeln dann im Vergleich zu ihrem Abstand nicht mehr vernachlässigbar sind, betrachten wir sie hier trotzdem als punktförmig. Wie wir später
zeigen werden, ist das für kugelförmige Körper sogar gerechtfertigt.
Umlaufbahnen
Als Beispiel betrachten wir nun ein System aus zwei Teilchen, die über die Gravitationskraft miteinander
wechselwirken. Mit den Methoden, die wir bis jetzt entwickelt haben, können wir die Bewegungsglei83
chungen für ein solches System zwar noch nicht vollständig lösen. Aber wir können sie zumindest schon
etwas vereinfachen, und wir können ein paar Lösungen mit speziellen Eigenschaften angeben.
Wir wollen versuchen, eine ganz bestimmte Frage zu beantworten. Ist es möglich, dass sich die beiden
Körper umkreisen, also eine periodische Umlaufbewegung ausführen? Solche Bewegungen treten typischerweise bei Paaren von Himmelskörpern auf, die sich gegenseitig anziehen. Der Einfachheit halber
werden wir uns zunächst auf kreisförmige Umlaufbahnen beschränken, das heißt der Abstand der beiden Körper soll während der Umlaufbewegung konstant bleiben, und die Umlaufbahn soll in einer Ebene
liegen.
Wir schreiben zunächst die Bewegungsgleichungen für das Zwei-Teilchen-System auf, so wie sie sich
aus (4.1) ergeben, nachdem wir die Massen herausgekürzt haben,
"" "
"
"
"
(4.5)
Da das dritte Newtonsche Gesetz erfüllt ist, ist der Gesamtimpuls eine Erhaltunggröße. Wir können die
Bewegung der Teilchen in eine Schwerpunkt- und eine Relativbewegung zerlegen. Wir müssen dazu gar
nicht die Impulse als Hilfsfunktionen einführen, sondern können direkt die Bewegungsgleichungen zweiter
Ordnung entsprechend umformen. Wir setzen
"
(4.6)
und erhalten durch Addition bzw. Subtraktion der Bewegungsgleichungen (4.5)
! "
mit
(4.7)
Die Bewegungsgleichung für den Schwerpunkt können wir unmittelbar lösen. Da es sich um ein abgeschlossenes mechanisches System handelt, bewegt sich der Schwerpunkt geradlinig und gleichförmig,
(4.8)
Mit dem Index 6 bezeichen wir wieder die Anfangswerte bei 6 , hier also den Ortsvektor des
Schwerpunktes und seine konstante Geschwindigkeit .
Interessant ist nur die Bewegungsgleichung für die Relativbewegung der beiden Teilchen, also die zweite Gleichung in (4.7). Da sich die Massen zum Teil aus den Bewegungsgleichungen herauskürzen, ist es
hier gar nicht nötig, die reduzierte Masse einzuführen. Die Bewegungsgleichung für die Relativbewegung
der beiden Massen. Auch das ist wieder eine Konsequenz
enthält als einzigen Parameter die Summe
der Äquivalenz von Trägheit und Gewicht.
Gesucht ist nun eine spezielle Lösung für die Relativbewegung der beiden Teilchen. Die Bewegung soll
in einer Ebene stattfinden, und der Abstandsvektor soll eine konstante Länge haben. Dass die Bewegung
in einer Ebene stattfindet, ist keine besondere Einschränkung. Da es sich bei der Gravitationskraft um
eine Zentralkraft handelt, ist der Drehimpuls der Relativbewegung, oder der innere Drehimpuls, eine
Erhaltungsgröße. Also findet die Relativbewegung in einer Ebene senkrecht zu statt.
ist, mit 6 . Der Abstandsvektor liegt
Wir können das Koordinatensystem so wählen, dass dann in der 4 - -Ebene und läuft im positiven Sinn, also gegen der Uhrzeigersinn um. Um eine kreisförmige
Umlaufbewegung mit dem konstanten Abstand und der Umlaufzeit zu beschreiben, machen wir den
Ansatz
7 3!
mit
(4.9)
84
Die Konstante wird als Kreisfrequenz oder Winkelgeschwindigkeit bezeichnet. Der Winkel zwischen der
4 -Achse und dem Ortsvektor des Teilchens ist < , das heißt ist die Ableitung dieses Winkels
nach der Zeit.
Die entscheidende Frage ist nun, ob die Bahn (4.9) eine Lösung der Bewegungsgleichung ist. Wir berechnen zunächst die Ableitungen und finden
&
&
"
"
1! ,
3! "
"
(4.10)
Eingesetzt in (4.7) ergibt sich, mit (4.11)
Offenbar ist diese Gleichung genau dann erfüllt, wenn zwischen dem Radius
bzw. der Umlaufzeit die folgende Beziehung besteht,
3. Keplersches
Gesetz
und der Kreisfrequenz
7 (4.12)
Es gibt also spezielle Lösungen der Bewegungsgleichungen, die kreisförmige Umlaufbahnen beschreiben.
Um die eigentlichen Bewegungen der beiden Teilchen im Raum zu beschreiben, müssen wir die gefunden
Lösungen für die Schwerpunkt- und Relativbewegung nur noch in die Formeln (3.58) einsetzen. Das ergibt
3 & &
"
1! 3! "
mit
mit
(4.13)
Die Lösung ähnelt sehr der Bewegung (3.71) eines Systems von zwei Teilchen mit einem linearen Kraftgesetz. Die Teilchen umkreisen einander, während sich das System als ganzes geradlinig und gleichförmig
durch den Raum bewegt. Allerdings müssen wir beachten, dass wir hier nur eine sehr spezielle Lösung
angegeben haben. Wir haben nicht die Lösung der Bewegungsgleichungen zu einem beliebigen Satz von
Anfangsbedingungen gefunden.
Da die Schwerpunktbewegung völlig uninteressant ist, betrachten wir den speziellen Fall ! und
! , der in Abbildung 4.1(b) dargestellt ist,
3 &
1! "
3! "
(4.14)
Die Teilchen umkreisen in diesem Fall den gemeinsamen Schwerpunkt, der im Koordinatenursprung ruht.
Die Radien der beiden Kreisbahnen verhalten zueinander wie die Massen .
Ein besonders interessanter Fall ergibt sich, wenn wir zusätzlich noch annehmen, dass die Masse sehr viel größer ist als die Masse , eins der Teilchen also sehr schwer und das andere sehr leicht ist.
Wenn wir in (4.14) den Grenzwert und 6 , uns somit
6 bilden, so finden wir 1 1! ! (4.15)
Das schwere Teilchen ruht im Ursprung, während das leichte Teilchen auf einer Kreisbahn mit dem Radius
umläuft. Zwischen der Umlaufzeit 7 und dem Bahnradius besteht natürlich immer noch die
Beziehung (4.12). Allerdings können wir für die Gesamtmasse
jetzt auch die Masse des schweren
Teilchens einsetzen.
85
Eine andere Möglichkeit, zu diesem Ergebnis zu kommen, setzt bereits bei den Bewegungsgleichungen
an. Wenn eines der Teilchen sehr schwer ist, können wir seine durch die Anziehungskraft des leichten
Teilchens verursachte Beschleunigung wegen seiner großen Trägheit vernachlässigen. Wir können also
annehmen, dass das schwere Teilchen im Koordinatenursprung ruht. Das leichte Teilchen bewegt sich
dann in einem konstanten äußeren Kraftfeld, welches durch die Anziehungskraft des ruhenden Teilchens
gegeben ist. Die Bewegungsgleichung in diesem Kraftfeld ist genau die für die Relativbewegung in (4.7),
wobei für
die Masse des schweren Teilchens einzusetzen ist.
Daraus können wir folgenden Schluss ziehen. Wenn ein sehr leichtes Teilchen ein schweres umkreist,
, also das Verhältnis der dritten Potenz des Bahnradius zum Quadrat der Umdann ist die Größe
laufzeit eine Konstante, die nur von der Masse des schweren Teilchens abhängt. Das gilt auch dann noch,
wenn mehrere leichte Teilchen das schwere Teilchen umkreisen. Wenn wir nämlich die Anziehungskraft
des leichten Teilchens auf das schwere Teilchen vernachlässigen können, dann können wir auch die Wechselwirkungen der leichten Teilchen untereinander vernachlässigen. Jedes Teilchen läuft auf einer eigenen
für jede Umlaufbahnen dasselbe ist.
Bahn (4.15), wobei das Verhältnis
Das ist genau die Situation, die im Sonnensystem vorliegt. Mehrere leichte Teilchen, die Planeten, umkreisen ein schweres Teilchen, die Sonne. Die Umlaufzeiten und Bahnradien der Planeten lassen sich
konst für die Planeleicht durch Beobachtung bestimmen. Tatsächlich hatte Kepler die Relation
tenbahnen bereits gefunden, und zwar etwa 06 6 Jahre bevor Newtons sein Gravitationsgesetz aufgestellt
hatte. Die Bestätigung dieses Zusammenhangs, der auch als drittes Keplersches Gesetz bezeichnet wird,
war deshalb eine der wichtigsten frühen Erfolge der Newtonschen Gravitationstheorie und damit auch der
klassischen Mechanik. Es war die erste und zugleich wichtigste experimentelle Bestätigung der Newtonschen Theorie auf dem Gebiet der Himmelsmechanik.
Tatsächlich war auch schon zu Keplers Zeiten bekannt, dass die Planetenbahnen nicht, wie wir hier
angenommen haben, exakte Kreise sind. Derselbe Zusammenhang zwischen Umlaufzeit und Bahnradius
gilt aber auch für nicht kreisförmige Bahnen, wie wir in Kapitel 8 zeigen werden. Allerdings müssen
wir dazu zunächst die allgemeine Lösung der Bewegungsgleichungen finden, was wir an dieser Stelle
noch nicht können. Und natürlich müssen wir den “Radius” durch eine andere Größe ersetzen, die die
Abmessung der Bahn festlegt, wenn diese nicht kreisförmig ist. Das dritte Keplersche Gesetz ist also etwas
allgemeiner als es hier dargestellt ist.
Das ändert aber nichts an der Feststellung, dass bereits die relativ grobe Näherung, bei der sich die
Planeten auf Kreisbahnen bewegen, das Newtonsche Gravitationsgesetz in dieser eindruckvollen Art und
Weise bestätigt. Was daran auch bemerkenswert ist, ist die Tatsache, dass keinerlei Kenntnis der Sonnenmasse, der Gravitationskonstante oder gar der Massen der Planeten nötig ist, um das Gravitationsgesetz
qualitativ zu bestätigen. Auch das ist eine Konsequenz der Äquivalenz von Trägheit und Gewicht. Würden
die Umlaufzeiten nämlich auch von den Massen der Planeten abhängen, so wäre eine derart einfache experimentelle Bestätigung nicht möglich. Denn die Planetenmassen lassen sich nur schwer direkt messen.
Aufgabe 4.2 Man verschaffe sich die Daten der Planetenbahnen aus einer geeigneten Quelle, best ätige
das dritte Keplersche Gesetz und berechne daraus die Masse der Sonne.
Aufgabe 4.3 Ein Teilchen der Masse wird von einem Kraftzentrum angezogen. Der Betrag der Kraft sei
durch eine Funktion des Abstands gegeben. Das Teilchen bewegt sich also in einem Zentralkraftfeld
& " (4.16)
Man bestimme alle Lösungen der Bewegungsgleichung, bei denen das Teilchen auf einer Kreisbahn
umläuft,
3! &
(4.17)
86
Welche Beziehung besteht zwischen dem Radius und der Umlaufzeit
Beschränkung der Allgemeinheit jede Kreisbahn so darstellen?
7 ? Warum l ässt sich ohne
Aufgabe 4.4 Als Newton seine Gravitationstheorie formulierte, kannte er die “experimentellen” Arbeiten
von Kepler und Galilei, die beide etwa hundert Jahre vor ihm lebten. Insbesondere wusste er, dass das
Verhältnis aus Bahnradius hoch drei und Umlaufzeit hoch zwei für alle bekannten Planeten dasselbe war,
und er wusste, dass kleine Testkörper unter dem Einfluss der Erdanziehung gleich schnell fallen. Welche
Überlegungen führten ihn, ausgehend von diesen Beobachtungen und dem Ergebnis von Aufgabe 4.3 zu
seinem Gravitationsgesetz (4.1)?
Aufgabe 4.5 Man berechne den Impuls und den Drehimpuls des leichten Teilchens auf der Bahn
5 1 aus (4.15). Warum ist der Drehimpuls des Teilchens in diesem Fall eine Erhaltungsgröße?
Welche Fläche überstreicht der Ortsvektor in einer Zeit ?
Aufgabe 4.6 Welche Beziehung muss zwischen dem Anfangsort und der Anfangsgeschwindigkeit ( der Relativbewegung der beiden Teilchen gelten, damit sich als L ösung der Bewegungsgleichung eine
Kreisbahn ergibt.
Der senkrechte Fall
Die Frage nach den kreisförmigen Umlaufbahnen ließ sich offenbar sehr einfach beantworten. Nun wollen
wir eine etwas schwierigere Frage stellen, deren Sinn hauptsächlich darin liegt, eine typische Methode
zur Lösung von Bewegungsgleichungen vorzustellen, die wir später noch etwas besser formalisieren und
verallgemeinern werden.
Der Ausgangspunkt ist diesmal eine ganz bestimmte Anfangsbedingung für das Zwei-Teilchen-System.
Zum Zeitpunkt 6 sollen sich die beiden Teilchen relativ zueinander in Ruhe befinden und einen
6 haben. Da sich die Teilchen gegenseitig anziehen, werden sie sich aufeinander zu bewegen.
Abstand
Wie lange dauert es, bis sie zusammenstoßen? Mit anderen Worten, zu welcher Zeit wird der
Abstand zwischen den Teilchen gleich Null sein?
Die Schwerpunktbewegung der Teilchen ist für diese Frage irrelevant, so dass wir uns ganz auf die
Berechnung Relativbewegung beschränken können. Vorgegeben sind die Anfangsbedingungen 6 und 6 < ! . Auch hier können wir wieder das Koordinatensystem an das gestellte Problem anpassen.
Wir wählen es so, dass der Abstandsvektor zur Zeit 6 in die Richtung der 4 -Achse zeigt, also
6 & 6 & ! (4.18)
Wir können dann davon ausgehen, dass die Relativbewegung nur in Richtung der 4 -Achse erfolgt. Die
Gravitationskraft ist nämlich eine Zentralkraft. Sie kann die Teilchen also nur entlang der 4 -Achse beschleunigen, wenn sie sich in der Position (4.18) befinden, und das wiederum führt dazu, dass sie sich
relativ zueinander auchnur in 4 -Richtung bewegen können.
Wir machen daher zur Lösung der Bewegungsgleichung den Ansatz
4 4 "
4 (4.19)
6 annehmen, denn wir interessieren uns nur für den Abschnitt der Bahn
Außerdem können wir 4 vom Zeitpunkt 6 bis zum Zeitpunkt , bei dem der Abstand zwischen den Teilchen zum ersten
4
6
6
4
6 die erste Nullstelle der Funktion 4 ist, folgt daraus
Mal Null wird. Da ist und .
natürlich 4 6 für 6 Setzen wir (4.19) in die Bewegungsgleichung (4.7) für die Relativbewegung ein, so ergibt sich
4
"
87
4
(4.20)
Offenbar ist die Annahme, die Relativbewegung erfolge nur entlang der 4 -Achse, mit der Bewegungsgleichung verträglich. Es steht nämlich auf beiden Seiten der Gleichung ein Vektor, der zu proportional
ist. Die Bewegungsgleichung ist genau dann erfüllt, wenn die Funktion 4 der folgende Differentialgleichung genügt, zu der wir noch die entsprechenden Anfangsbedingungen stellen müssen,
4 "
4 4 6 4 6 6 (4.21)
Damit haben wir die physikalische Frage auf eine rein mathematische Frage zurückgeführt. Wir müssen
jetzt nur noch die Differenzialgleichung (4.21) mit Anfangsbedingung lösen und die erste Nullstelle der
Funktion 4 finden. Dazu benutzen wir eine spezielle Methode, die wir später noch häufiger verwenden
werden. Auch sie beruht auf der Idee, zunächst die Ordnung der Differenzialgleichungen zu reduzieren
und diese dann mit Hilfe von Erhaltungsgrößen zu vereinfachen.
Um die Differenzialgleichung zweiter Ordnung (4.21) in eine Differenzialgleichung erster Ordnung zu
transformieren, multiplizieren wir beide Seiten der Gleichung mit 4 und schreiben anschließend alle
Terme auf eine Seite,
4 4 4 6 mit
(4.22)
4 Wie man leicht sieht, lässt sich die linke Seite jetzt als Ableitung einer bestimmten Funktion von 4 nach
der Zeit schreiben, nämlich
4 7 " 4 6 (4.23)
Der Ausdruck in der Klammer hängt also nicht von der Zeit ab. Es ist eine Erhaltungsgröße. Es ist im
wesentlichen die Energie, die in der Relativbewegung der beiden Teilchen steckt, aber das ist an dieser
Stelle nicht wichtig. Wir werden uns in Kapitel 7 sehr ausführlich mit der Energie als Erhaltungsgröße
beschäftigen und dort eine allgemeinere Version der hier verwendeten Methode zur Lösung von Bewegungsgleichungen herleiten.
Hier genügt es, festzustellen, dass es sich bei dem Ausdruck in (4.23) um eine Erhaltungsgröße handelt,
deren Wert wir aus den Anfangsbedingungen bestimmen können. Zur Zeit 6 ist 4 6 &
und 4 6 & 6 ,
also gilt für alle Zeiten
4 7
4 6 7
" 4 " 4 6 "
Lösen wir diese Gleichung nach 4 auf, so ergibt sich
4 & "
4
7
"
7
4 6 &
(4.24)
(4.25)
Das Vorzeichen der Wurzel haben wir so gewählt, dass 4 6 ist. In dem relevanten Zeitintervall
6 nähern sich die Teilchen einander an, das heißt der Abstand 4 der Teilchens nimmt mit der Zeit
ab.
Es ist uns also gelungen, das Problem auf die Lösung einer Differenzialgleichung erster Ordnung
zurückzuführen. Als Anfangsbedingung müssen wir jetzt nur noch den Abstand zur Zeit 6 vorgeben.
Die zweite Anfangsbedingung, dass das Teilchen zur Zeit 6 ruhen soll, ist implizit in die Differenzialgleichung (4.25) eingegangen. An der Stelle 6 und mit 4 6 &
liefert sie 4 6 & 6 .
Eine Differenzialgleichung der Form (4.25) kann durch Separation der Variablen gelöst werden. Dazu
schreiben wir die Differenzialgleichung zunächst wie folgt um,
"
4 0 4 " 0 88
7 (4.26)
Anschließend integrieren wir beide Seiten dieser Gleichung von 6 bis ,
4 0 4 " 0
"
7 7
(4.27)
Um den Ausdruck auf der linken Seite auszurechnen, führen wir eine Substitution durch. Als neue Integrationsvariable wählen wir 4 . Es ist dann 4 4 , und für die Integralgrenzen gilt 4 6 5
und
4 6 , also
"
4 0 4 " 0
"
4
0 4 " 0
4
0 4 " 0
(4.28)
Viele Differenzialgleichungen erster Ordnung lassen sich mit diesem Verfahren lösen. Gesucht ist eine
Funktion 4 . Man schreibt die Differenzialgleichung so um, dass auf einer Seite der Gleichung eine
bekannte Funktion von steht. Im (4.26) ist dies eine Konstante. Auf der anderen Seite der Gleichung
steht ein Ausdruck, der nicht explizit von , sondern nur von der Funktion 4 abhängt und zur Ableitung
4 proportional ist.
Bei der Integration beider Seiten über lässt sich dann auf einer Seite die Integration direkt ausführen,
während auf der anderen Seite eine Substitution durchgeführt werden kann, wobei die Integrationsvariable
durch 4 ersetzt wird. Diesen Schritt haben wir in (4.28) durchgeführt. Der Integrationsbereich ist dabei
so zu wählen, wie es der jeweiligen Fragestellung entspricht. In unserem Fall haben wir von 6 bis
integriert, da wir die Fallzeit ermitteln wollen. Wenn wir alles zusammensetzen, bekommen wir
0
7 4
0
7 0 0 4 "
4 4
0 " 4
(4.29)
Damit haben wir das Problem fast schon gelöst. Wir müssen nur noch ein bestimmtes Integral auswerten.
Um die Wurzel im Nenner zum beseitigen, führen wir nochmal eine Substitution durch. Wir setzen
4 + 0 " 0 " 4
"
7
4
0 " 4
(4.30)
Die neue Integrationsvariable läuft von 0 bis 6 , wenn 4 von 6 bis läuft. Wenn wir dann noch die
Grenzen des Integrals vertauschen und damit das Vorzeichen umdrehen, ergibt sich nach einer kurzen
Rechnung
7
0 " (4.31)
Dieses Integral können wir sofort angeben. Es berechnet den Flächeninhalt eines Viertelkreises, ist also
gleich . Damit haben wir die gesuchte Fallzeit berechnet. Es ist
(4.32)
Aufgabe 4.7 Nehmen wir an, wir könnten die Erde auf ihre Bahn um die Sonne anhalten. Wie lange w ürde
es dann dauern, bis sie in die Sonne stürzt? Die Frage lässt sich ohne besondere Kenntnis der Bahndaten
der Erde sofort beantworten, wenn man die Zeit in Jahren (oder Monaten) angibt.
Aufgabe 4.8 Zwei Massen von jeweils einem Kilogramm befinden sich ruhend im Abstand von einem
Meter. Wir lange dauert es, bis sie aufgrund der Anziehung durch Gravitation zusammenstoßen?
89
Aufgabe 4.9 Wie groß ist die Relativgeschwindigkeit 4 der Teilchen im Moment des Zusammenstoßes?
Was folgt daraus für die Funktion , wenn wir diese über den Zeitpunkt hinaus fortsetzen wollen?
Ist diese Frage überhaupt physikalisch sinnvoll?
Aufgabe 4.10 Man löse die folgenden Differenzialgleichung mit Anfangsbedingungen durch Separation
der Variablen. Gesucht ist jeweils die Funktion 4 .
7
4 4 4 4 4 4 0 & 0
4 0
6 & 0
6 & 6
4 1! 4 6 & 7 (4.33)
Gravitationsfelder
Nun wollen wir noch kurz der Frage nachgehen, wie es kommt, dass wir die Gravitationskraft, die auf
einen kleinen Körper der Masse in der Nähe der Erdoberfläche wirkt, in sehr guter Näherung durch eine
konstante Kraft " beschreiben können, wenn wir das Koordinatensystem entsprechend wählen.
Das muss sich irgendwie aus dem allgemeinen Gravitationsgesetz (4.1) ergeben. Schließlich bestand der
große Erfolg der Newtonschen Theorie je gerade darin, die Himmelsphysik mit der irdischen zu vereinen.
Wir betrachten dazu folgende Situation. Ein einzelnes Testteilchen mit Masse und Ortsvektor befindet sich in der Nähe einer großen Massenansammlung, die wir uns aus sehr vielen anderen Teilchen mit
Massen und Ortsvektoren zusammengesetzt vorstellen. Diese anderen Teilchen bewegen sich unter
dem Einfluss ihrer gegenseitigen Anziehungkräfte oder irgendwelcher anderen Kräfte, so dass die Orte im allgemeinen Funktionen der Zeit sind. Sie werden jedoch von dem sehr kleinen Testteilchen, dessen
Bewegungsgleichung wir aufstellen wollen, nicht merklich beeinflusst.
Wir können daher annehmen, dass wir die Massen und die Bahnen aller anderen Teilchen, also
die Funktionen kennen, und dass diese nichts von der Anwesenheit des Testteilchens spüren. Die
Gravitationskraft , die auf das Testteilchen wirkt, ergibt sich dann als Summe der Anziehungskräfte aller
anderen Teilchen, also
, , & "
mit
" " (4.34)
Das Testteilchen bewegt sich in einem zeitabhängigen Kraftfeld , . Dieses Kraftfeld hängt von den
Massen und Orten der anderen Teilchen ab, und es ist proportional zur Masse des Testteilchens. Es ist
nützlich, diese Masse aus der Definition des Kraftfeldes heraus zu nehmen und statt dessen ein Feld , zu definieren,
, "
Gravitationsfeld
" " (4.35)
Das Gravitationsfeld , hängt jetzt nur noch von den Massen und Orten der Teilchen ab, die das
Feld erzeugen, aber nicht mehr von der Masse des Testteilchens, mit dem wir das Feld gewissermaßen
vermessen. Für das Testteilchen gilt die Bewegungsgleichung
(4.36)
Wir können das Gravitationsfeld als Träger der Gravitationskraft interpretieren. Jedes Teilchen, das
eine Masse hat und einer Bahn folgt, erzeugt um sich herum ein Gravitationsfeld
& "
90
" " (4.37)
replacements
(c)
(d)
(b)
(a)
Abbildung 4.2: Das Gravitationsfeld eines einzelnen Teilchens (b) und einer Ansammlung von vielen
Teilchen (b). Ist die Ansammlung von Teilchen räumlich begrenzt, so sieht das Feld in großer Entfernung
aus wie das eines einzelnen Teilchens, dessen Masse sich aus der Summe der Massen der einzelnen
Teilchen ergibt.
Es ist proportional zu seiner Masse, zeigt auf das Teilchen zu, und sein Betrag fällt mit den Quadrat des
Abstandes nach außen hin ab. In Abbildung 4.2(a) ist ein solches Feld schematisch dargestellt. Das Feld
erfüllt den ganzen Raum und gibt uns an jeder Stelle darüber Auskunft, wo sich das Teilchen befindet und
wie weit es entfernt ist.
Alle Teilchen zusammen erzeugen ein Gravitationsfeld , dass sich gemäß (4.35) durch Summation
aus den Feldern der einzelnen Teilchen ergibt. Für Gravitationsfelder gilt das Superpositionsprinzip. Sie
verhalten sich additiv, das heißt sie werden einfach überlagert oder superponiert, wenn mehrere Teilchen
jeweils ein eigenes Feld erzeugen. Betrachten wir eine große Ansammlung von Teilchen wie in Abbildung 4.2(b), so ergibt sich das Gravitationsfeld aus der Überlagerung aller einzelnen Felder.
Ein Testteilchen, das sich in einem von anderen Teilchen erzeugten Gravitationsfeld befindet, spürt eine
Kraft, die proportional zum Gravitationsfeld und zur Masse dieses Teilchens ist. Die Massen der Teilchen,
die das Feld erzeugen, bestimmten also zunächst die Stärke und Richtung des Gravitationsfeldes überall
im Raum, und die Masse des Testteilchens, das sich darin bewegt, bestimmt anschließend, wie stark dieses
Teilchen an das Feld ankoppelt, also welche Kraft es letztlich erfährt.
Da die Masse des Testteilchens sowohl als Gewicht als auch als Trägheit in die Bewegungsgleichung
(4.36) eingeht, ergibt sich daraus eine einfache Messvorschrift für das Gravitationsfeld. Um den Wert des
Feldes an einem Ort und zu einer Zeit zu bestimmen, müssen wir nur ein Testteilchen an diese
Stelle bringen und die Beschleunigung messen, die es dort erfährt. Tatsächlich hat das Gravitationsfeld
, die physikalische Dimension einer Beschleunigung, das heißt der gefundene Wert der Beschleunigung des Testteilchens ist identisch mit dem Wert des Feldes .
Diese Beschreibung der Gravitationkraft mit einem Feld als Träger der Kraft hat den Vorteil, dass wir,
um die Bewegungen eines Testteilchens zu beschreiben, nur das Feld in dem Raumbereich kennen
müssen, in dem sich das Testteilchen bewegt. Es ist nicht nötig, genau zu wissen, durch welche anderen
Teilchen es erzeugt wird und wo sich diese Teilchen genau befinden. Genau das tun wir zum Beispiel dann,
wenn wir die Bewegung eines kleinen Körpers im Gravitationsfeld der Erde beschreiben wollen.
Die Erde kann als eine kugelförmige Ansammlung von sehr vielen Teilchen betrachtet werden, wie sie
in Abbildung 4.3(a) dargestellt ist. Das Gravitationsfeld an irgendeinem Punkt im Raum ergibt sich
aus (4.35) als Summe der Beiträge aller dieser Teilchen. Wenn wir die Erde als ruhend annehmen und den
Ursprung des Koordinatensystems in den Mittelpunkt legen, so folgt aus der Symmetrie der Massenvertei91
replacements
(c)
(d)
(b)
(a)
Abbildung 4.3: Das Gravitationsfeld eines ausgedehnten Körpers kann man bestimmen, indem man
den Körper in sehr viele Teilchen zerlegt, diese als punktförmig betrachtet und ihre Gravitationsfelder
überlagert (a). In einem im Vergleich zu den Abmessungen des Körpers kleinen Raumbereich kann das
Gravitationsfeld als homogen angenommen werden, so dass auf ein dort befindliches Testteilchen eine
konstante Kraft wirkt (b).
lung in der Erde und daraus, dass diese zeitlich konstant ist, dass das Gravitationsfeld ein zeitunabhängiges
Zentralkraftfeld ist.
Das Gravitationsfeld der Erde zeigt, so wie das Gravitationsfeld eines einzelnen Punktteilchens, stets auf
den Mittelpunkt der Erde zu. Außerdem ist sein Betrag nur vom Abstand vom Erdmittelpunkt abhängig.
Auch das folgt aus der Symmetrie der Erdkugel. Auf einer Kugeloberfläche, die sich in einem bestimmten
Abstand vom Erdmittelpunkt befindet, sei es innerhalb oder außerhalb der Erde, gibt es keinen irgendwie
ausgezeichneten Punkt, also kann es auch keine Stelle geben, an der das Gravitationsfeld besonders stark
oder schwach ist.
Durch reine Symmetrieüberlegungen finden wir also, dass das Gravitationsfeld der Erde folgende Form
annimmt,
& " mit
(4.38)
Dabei ist der Ortsvektor, also der Abstandsvektor vom Erdmittelpunkt, ein Einheitsvektor, der in
die Richtung des Ortsvektors zeigt, und eine noch unbekannte reelle Funktion, die den Betrag des
Gravitationsfeldes in Abhängigkeit von der Entfernung vom Erdmittelpunkt festlegt.
Ohne diese Funktion explizit zu kennen, können wir daraus bereits die Rechtfertigung für die Annahme
ableiten, dass das Gravitationsfeld der Erde in der Nähe ihrer Oberfläche in guter Näherung durch ein
konstantes Kraftfeld approximiert werden kann. Betrachten wir nämlich einen im Vergleich zur Größe der
Erde sehr kleinen Raumbereich in der Nähe der Oberfläche, wie er in Abbildung 4.3(b) dargestellt ist, so
ist in diesem Bereich sowohl die Richtung als auch der Betrag des Gravitationsfeldes annähernd konstant.
Der Betrag ist annähernd konstant, weil der obere Rand des Raumbereiches nur unwesentlich weiter
vom Erdmittelpunkt entfernt ist als der untere Rand. Die Richtung des Feldes ist annähernd konstant,
weil der Winkel zwischen den Vektoren, die vom Erdmittelpunkt zu zwei verschiedenen Punkten in dem
gekennzeichneten Raumbereich zeigen, verschwindend klein ist. Durch die Wahl eines geeigneten Koordinatensystem können wir also stets erreichen, dass in guter Näherung innerhalb eines begrenzten Raum" gilt.
bereiches Genau das hatten wir im letzten Kapitel angenommen, um den freien Fall eines Körpers auf der Erdoberfläche zu beschreiben. Der tatsächlichen Wert der Erdbeschleunigung können wir direkt messen.
92
Der angegebene Wert von 0 m s ist ein Mittelwert. Da die Erde nicht exakt kugelförmig ist und die
Massen nicht ganz gleichmäßig darin verteilt sind, weicht dieser Wert je nach Ort und Höhe um einige
Promille vom Mittelwert ab. Auch die Richtung des Gravitationsfeldes zeigt nicht genau immer zum Erdmittelpunkt. Davon können wir aber absehen, wenn der Raumbereich, in dem sich das betreffende Teilchen
bewegt, klein genug ist.
Aufgabe 4.11 In einem Labor auf der Erdoberfläche befinden sich zwei Körper mit einer Masse von jeweils einem Kilogramm im Abstand von einem Meter auf gleicher Höhe. Auf beide wirkt die Erdanziehungskraft, jedoch in etwas unterschiedliche Richtungen. Man berechne die Differenz der beiden Anziehungskräfte und die relative Beschleunigung, die die Körper dadurch erfahren, wenn sie frei fallen. Man
vergleiche diese relative Beschleunigung der Körper mit derjenigen, die sie durch ihre gegenseitige Anziehungskraft erfahren. Welche Massen müssten die Körper haben, wenn beide Effekte gleich groß sein
sollen?
Aufgabe 4.12 Wir werden später zeigen, dass das Gravitationsfeld eines ausgedehnten, kugelf örmigen Körpers außerhalb dieses Körpers dasselbe ist wie das eines Punktteilchens gleicher Masse. Man
m s und dem Erdradius 6 km die Masse und die
berechne aus der Erdbeschleunigung Dichte der Erde, also das Verhältnis aus Masse und Volumen. Ist das Ergebnis realistisch?
5 Zwangskräfte
Die Gravitationskraft ist eine fundamentale Wechselwirkung. Sie wirkt auf alle Körper in der gleichen Art
und Weise. Sie lässt sich daher auch nicht ausschalten oder abschirmen. Die elektromagnetische Wechselwirkung ist eine andere fundamentale Wechselwirkung. Letztlich leiten sich alle in der Natur auftretenden
Kräfte aus solchen fundamentalen Wechselwirkungen her. In der Praxis ist es aber meist viel zu kompliziert, ein mechanisches System allein durch fundamentale Wechselwirkungen zwischen den beteiligten
Teilchen zu beschreiben.
Um die Bewegungsgleichungen für ein kompliziertes mechanisches System überhaupt aufstellen und
lösen zu können, benötigt man eine effektive Beschreibung in Form eines Kraftgesetzes, das zwar im Prinzip auf fundamentale Kräfte zurückgeführt werden kann, das sich aber im konkreten Einzelfall sehr viel
einfacher aus ein paar Grundregeln ableiten lässt, ohne dass man dafür die fundamentalen Wechselwirkungen überhaupt kennen muss.
In der Technik spielt eine bestimmte Klasse solcher effektiven Kräfte eine besondere Rolle. In der technischen Anwendung der Mechanik geht es meist darum, Kräfte genau so einzusetzen, dass einzelne Körper
bestimmte Bewegungen ausführen, also ganz bestimmte, vorgegebene Bahnen durchlaufen. Wir wollen
hier weder komplizierte mechanische Geräte beschreiben noch danach fragen, wie solche mechanischen
Kräfte entstehen. Anhand von ein paar einfachen Beispielen wollen wir aber das Prinzip solcher Kräfte
erklären, die im allgemeinen als Zwangskräfte bezeichnet werden.
Die Bezeichnung rührt daher, dass Zwangskräfte dafür sorgen, dass ein Körper nur ganz bestimmte Bewegungen ausführen kann, also einem Zwang unterliegt. Ein typisches Beispiel für einen solchen Körper
ist ein Schienenfahrzeug. Es kann sich nur entlang einer vorgegebenen Kurve im Raum bewegen. Ein anderes typisches Beispiel wäre ein Körper, der sich in zwei Richtungen auf einer Fläche bewegen, diese
aber nicht verlassen kann.
Das Schienenfahrzeug
Wir werden auch hier wieder die Annahme machen, dass ein Körper näherungsweise als punktförmiges
Teilchen beschrieben werden kann, und diskutieren zunächst das Beispiel eines Schienenfahrzeugs. Das
93
replacements
(c)
(d)
(b)
(a)
Abbildung 5.1: Typische mechanische Systeme mit Zwangskräften. Ein Schienenfahrzeug (a), das sich
nur entlang einer vorgegebenen Kurve im Raum bewegen kann, besitzt nur einen Freiheitsgrad. Ein
Körper, der auf einer Fläche (b) gleitet, besitzt zwei Freiheitsgrade. In beiden Fällen wirkt die Zwangskraft
stets senkrecht zu den möglichen Bewegungsrichtungen des Körpers.
Gleis, auf dem sich das Fahrzeug bewegt, kann durch eine Funktion beschrieben werden, wobei < irgendein frei wählbarer Kurvenparameter ist. Genauer gesagt soll diejenige Kurve im Raum sein, auf
der sich der Schwerpunkt des Fahrzeugs bewegt, wenn dieses auf dem Gleis entlang fährt.
Zum Beispiel können wir eine gerade, entlang der 4 -Achse verlaufende Strecke durch die Funkti
on beschreiben, oder eine kreisförmige Strecke mit Radius durch die Funktion 3! . Im ersten Fall wäre der Kurvenparameter die Länge der Strecke, im zweiten Fall
wäre der Kurvenparameter der zurückgelegte Winkel entlang der Strecke. Im Prinzip können wir diesen
Parameter aber auch beliebig anders wählen.
Die eigentliche Bewegung des Teilchens, also seine Bahn als Funktion der Zeit , lässt sich dann
setzen. Wir sagen auch, dass
durch eine einzige reelle Funktion beschreiben, indem wir ein solches mechanisches System nur einen Freiheitsgrad besitzt. Das Schienenfahrzeug verhält sich im
Prinzip wie ein Teilchen in einem eindimensionalen Raum. Seine Bahn wird durch eine einzige Funktion
beschrieben, nicht wie im Fall eines frei beweglichen Teilchens durch drei unabhängige Funktionen
% .
Gesucht ist nun eine Bewegungsgleichung für die Funktion , die wir irgendwie aus der allgemeinen
Bewegungsgleichung herleiten müssen. Das Problem ist, dass wir gar nicht so genau wissen, was
wir für die Kraft einsetzen müssen. Welche Kraft übt eine Schiene auf einen darauf fahrenden Körper
aus? Müssen wir nicht, um diese Kraft zu bestimmen, das ganze das System in seine Einzelteile zerlegen, also das Fahrzeug in seine Räder, Achsen, Naben etc. aufteilen? Ist es überhaupt möglich, ein solch
kompliziertes System im Rahmen einer einfachen Mechanik von Punktteilchen adäquat zu beschreiben?
Überraschenderweise ist das möglich, und zwar mit Hilfe eines ganz einfachen Tricks. Wir müssen gewissermaßen Ursache und Wirkung vertauschen. Wir wissen zwar nicht, wie die Kraft in den Schienen
genau entsteht, das heißt wir können sie nicht aus einem fundamentalen Kraftgesetz ähnlich dem Gravitationsgesetz herleiten. Aber wir kennen die Wirkung dieser Kraft. Sie bewirkt, dass das Fahrzeug auf
den Schienen bleibt, also dem auferlegten Zwang gehorcht. Wir können die Kraft daher implizit aus ihrer
bekannten Wirkung berechnen.
Um zu sehen, wie das geht, schreiben wir zunächst die Bewegungsgleichung für ein Teilchen auf, dass
sich auf einer vorgegebenen Kurve bewegt, wobei die gesuchte Funktion der Zeit ist. Es gilt dann
94
für die Geschwindigkeit und die Beschleunigung
(5.1)
Der Strich bezeichnet wieder die Ableitung der Funktion nach dem Kurvenparameter . Die Bewegungsgleichung lautet
(5.2)
wobei irgendeine äußere Kraft sein soll, zum Beispiel eine auf das Fahrzeug einwirkende Gravitationskraft oder eine Reibungskraft, die durch die Fahrt auf den Schienen oder den Luftwiderstand verursacht
wird. Von dieser äußeren Kraft setzen wir voraus, dass sie als eine bekannte Funktion des Ortes, der Geschwindigkeit und möglicherweise der Zeit vorgegeben ist.
Zusätzlich wirkt auf das Fahrzeug eine noch unbekannte Zwangskraft . Von dieser wissen wir bis jetzt
nur, dass sie dafür sorgt, dass das Fahrzeug die Schiene nicht verlässt. Um sie zu bestimmen, schreiben wir
die Bewegungsgleichung zunächst als Differenzialgleichung für die gesuchte Funktion . Eingesetzt in
die Bewegungsgleichung von oben ergibt sich
&
(5.3)
Die Zeitabhängigkeit von haben wir, wie üblich, nicht mehr explizit hingeschrieben. Außerdem haben
wir für einfach geschrieben. Da sich der Körper nur entlang der
vorgegeben Kurve bewegen kann, kann auch die äußere Kraft eine Funktion von und dargestellt werden.
Die Bewegungsgleichung (5.3) ist eine Vektorgleichung, das heißt auf beiden Seiten steht ein Vektor mit
drei Komponenten. Es handelt sich also um drei reelle Gleichungen, wenn wir alle Vektoren in Komponenten zerlegen. Jedoch kommen darin vier unbekannte Funktionen der Zeit vor, nämlich die drei Komponenten der noch unbekannten Zwangskraft , sowie die gesuchte Funktion , die die Bewegung des Körpers
beschreibt. Wir benötigen also noch mindestens eine zusätzliche Gleichung, um die Bewegungsgleichung
eindeutig lösen zu können.
Betrachten wir dazu folgende Situation. Der Körper soll auf der Schiene ruhen, und auf ihn soll eine
äußere Kraft senkrecht zur Schiene wirken. Das ist zum Beispiel für einen ruhenden Körper auf einer waagerechten Schiene in einem Gravitationsfeld der Fall. Dann soll der Körper natürlich nicht beschleunigt
werden. Dasselbe gilt auch dann, wenn sich der Körper auf einer waagerechten Schiene bewegt. Wenn wir
von Reibungskräften absehen, dann soll sich der Körper gleichmäßig, also mit konstanter Geschwindigkeit
bewegen. Die Zwangskraft soll das Fahrzeug weder abbremsen noch beschleunigen.
Daraus folgt, dass die Zwangskraft in diesem Fall genau die senkrecht zur Schiene wirkende Gravitationskraft kompensieren muss, aber sie darf nicht parallel zur Schiene wirken und das Fahrzeug beschleunigen. Das können wir als eine allgemeine Eigenschaft von Zwangskräften festhalten, die einen Körper in
seiner Bewegungsfreiheit einschränken.
Zwangskräfte wirken stets senkrecht zu den möglichen Bewegungsrichtungen eines Körpers.
Hätte nämlich die Zwangskraft eine nicht verschwindende Komponente in Richtung einer möglichen Bewegungsrichtung des Körpers, so würde sie ihn in diese Richtung beschleunigen. Das ist aber nicht die
Eigenschaft einer Zwangskraft, wie das anschauliche Beispiel eines Schienenfahrzeugs klar macht.
Wir bekommen also die zusätzliche Bedingung, dass senkrecht zur allen möglichen Bewegungsrichtungen steht. In diesem Fall gibt es nur eine Bewegungsrichtung, nämlich entlang der Schiene. Die
Richtung der Schiene im Raum ist durch den Tangentenvektor der Kurve gegeben, zu dem auch die
Geschwindigkeit des Teilchens stets proportional ist. Also gilt
:
95
6 (5.4)
Das ist die vierte Gleichung, die wir benötigen, um die Bewegungsgleichung zu lösen. Im Prinzip können
wir jetzt das Gleichungssystem (5.3) und (5.4) für die gesuchten Funktionen und lösen. Wir
benötigen dazu nur noch einen Satz von Anfangsbedingungen für die Funktion , also den Ort und die Geschwindigkeit zu irgendeiner Zeit .
Es geht aber sogar noch etwas einfacher. Die Zwangskraft lässt sich nämlich aus dem Gleichungsystem
eliminieren. Wir bilden dazu das Skalarprodukt der Vektorgleichung (5.3) mit und bekommen
: :
:
(5.5)
Die Zwangskraft kommt in dieser Gleichung gar nicht mehr vor. Statt dessen bekommen wir eine gewöhnliche Differenzialgleichung zweiter Ordnung für die Funktion . Sie sieht ein wenig kompliziert aus,
hat aber die übliche Form einer Bewegungsgleichung. Wir können sie in der üblichen Form schreiben,
indem wir die nach auflösen und alle Terme, die von , und eventuell explizit von der Zeit abhängen,
zu einer effektiven Kraft zusammenfassen,
effektive
Kraft
:
" : : mit (5.6)
Das Schienenfahrzeug verhält sich wie ein Teilchen, das sich in einem eindimensionalen Raum mit der
Ortskoordinate bewegt, wobei die Kraft, die auf das Teilchen einwirkt, durch eine Funktion vom
und gegeben ist. Die einzige Bedingung, die wir stellen müssen, ist, dass der Tangentenvektor nirgendwo verschwindet. Das können wir aber stets durch eine geeignete Parametrisierung der Kurve
erreichen, sofern diese hinreichend glatt, also stetig und differenzierbar ist.
Die Bewegungsgleichung lässt sich sogar noch vereinfachen, wenn wir die Kurve in einer ganz speziellen Art und Weise parametrisieren. Wir wählen den Kurvenparameter so, dass er die Kurvenlänge
soll durch die Differenz " gegeben sein.
repräsentiert. Die Länge eines Kurvenstückes Es ist immer möglich, eine solche Parametrisierung einer Kurve zu finden. Wie man unmittelbar aus der
Formel (2.60) für die Länge einer parametrisierten Kurve entnimmt, ist das genau dann der Fall, wenn der
Tangentenvektor überall den Betrag Eins hat, also ein Einheitsvektor ist.
Dann vereinfacht sich das effektive Kraftgesetz (5.6). Der Nenner wird gleich Eins und der zweite Term
im Zähler fällt weg, denn es gilt
: 0
Was bleibt ist
: 7 : & 6 mit
&
:
(5.7)
(5.8)
Da der Tangentenvektor ein Einheitsvektor ist, ist die effektive Kraft in diesem Fall nichts anderes
als die orthogonale Projektion der äußeren Kraft auf die Bewegungsrichtung des Körpers.
Die kompliziertere Bewegungsgleichung (5.5) benötigen wir nur dann, wenn die Parametrisierung der
Kurve nicht so gewählt ist, dass mit der Kurvenlänge übereinstimmt. Dann treten auf der rechten Seite der Bewegungsgleichung zusätzliche Terme auf, die vom Ort und von der Geschwindigkeit
abhängen. In jedem Fall aber bekommen wir eine Differenzialgleichung zweiter Ordnung für die gesuchte
Funktion , also formal eine Bewegungsgleichung wie wir sie auch für eine Teilchen ohne Zwangsbedingungen kennen.
Als Anfangsbedingungen müssen wir den Ort des Teilchens zu einem bestimmten Zeitpunkt und
seine Geschwindigkeit vorgeben, also die Funktionswerte und . Dann wird die Funktion und somit die Bahn durch die Bewegungsgleichungen eindeutig bestimmt. Da es sich
um ein System mit nur einem Freiheitsgrad handelt, ist seine Bewegungsgleichung im allgemeinen sogar
96
replacements
(c)
(d)
(b)
(a)
Abbildung 5.2: Auf ein Schienenfahrzeug wirkt eine Zwangskraft, die stets senkrecht zur Bewegungsrichtung ausgerichtet ist. Sie lassen sich in eine Komponente senkrecht und eine Komponente parallel
zum Gleisbett zerlegen, welches um einen Winkel zur Horizontalen geneigt ist (a). Die Kraft führt
zu seitlichen Scherkräften in der Schiene und im Gleiskörper uns sollte daher so klein wie möglich sein.
Bei einer Achterbahn in Form einer Spirale (b) muss der Neigungswinkel nach unter hin zunehmen,
wenn keine seitlichen Kräfte auftreten sollen.
einfacher als die für ein frei bewegliches Teilchen mit drei Freiheitsgraden. Es handelt sich nur um eine
einzige Differenzialgleichung statt um drei gekoppelte Differenzialgleichungen.
Systeme mit Zwangskräften sind also einfacher zu berechnen als es zunächst den Anschein hat. Offenbar
müssen wir die Zwangskräfte selbst gar nicht kennen, um die Bewegungsgleichungen zu lösen. Wir können
sie aber nachträglich berechnen, indem wir die gefundenen Lösungen in die Gleichung (5.5) einsetzen und
diese dann nach auflösen. Das ist für technische Anwendungen natürlich besonders interessant. Die
Zwangskräfte beeinflussen zwar nicht den Bewegungsablauf, aber sie sind ein Maß für die Belastung des
mechanischen Systems.
Für unser Beispiel eines Schienenfahrzeugs kann man aus der Zwangskraft auf die Belastung der Schienen schließen. Sie lässt sich sogar noch in zwei Komponenten zerlegen, die das Gleis in unterschiedlicher
Weise belasten. In Abbildung 5.2(a) ist ein Querschnitt von Fahrzeug und Schiene senkrecht zur Bewegungsrichtung dargestellt. Die Zwangskraft wirkt ebenfalls senkrecht zur Bewegungsrichtung, liegt
also in dieser Ebene. Sie lässt sich in eine Komponente parallel und eine Komponente senkrecht
zum Gleisbett zerlegen.
Da die Zwangskraft durch eine Wechselwirkung des Fahrzeugs mit den Schienen entsteht, treten in
den Schienen natürlich gleich große Gegenkräfte auf. Ohne das im einzelnen zu analysieren kann man
sich mit ein wenig Intuition überlegen, dass die Komponente " dieser Gegenkraft die Schienen sehr
viel stärker belastet als die Komponente " . Erstere führt nämlich zu seitlichen Scherkräften in den
Schienen und im Gleichbett, während letztere nur einen relativ harmlosen Druck nach unten ausübt. Eine
typische Aufgabe der Gleisbautechnik ist daher, den Neigungswinkel des Gleisbettes so zu wählen, dass
die seitliche Komponente der Zwangskraft möglichst klein wird.
Aufgabe 5.1 Ein Zug mit einer Masse von 6 t pro Radsatz fährt mit einer Geschwindigkeit von 6 6 km h
auf einer waagerechten Strecke durch eine Kurve mit einem Radius von 0 km. Welche Zwangskraft wirkt
auf einen einzelnen Radsatz? Um wieviel Prozent ist der Betrag dieser Kraft gr ößer als die Zwangskraft,
die bei gerader Fahrt wirkt? Wie ist der in Abbildung 5.2(a) definierte Neigungswinkel des Gleisbettes
zu wählen, damit die seitliche Komponente der Zwangskraft verschwindet?
97
Aufgabe 5.2 In Abbildung 5.2(b) ist ein Teilstück einer Achterbahn schematisch dargestellt. Es hat die
Form eine Spirale mit Radius und Steighöhe . Die Kurve lässt sich durch die Funktion
3! .
"
7 *
(5.9)
beschreiben. Man stelle für die Funktion die Bewegungsgleichung auf, wobei als äußere Kraft die
" wirken soll. Man löse die Bewegungsgleichung mit den AnfangsbedinGravitationskraft gungen 6 6 und 6 6 , das heißt das Fahrzeug läuft aus dem Stand los. Wie groß ist der Betrag
der Geschwindigkeit des Fahrzeugs, wenn es sich in einer Höhe unterhalb des Startpunktes befindet?
Man vergleiche diese Geschwindigkeit mit der Geschwindigkeit, die ein frei fallendes Teilchen nach dieser
Fallstrecke hätte.
Aufgabe 5.3 Man bestimme für die Bahn, die sich in Aufgabe 5.2 ergibt, explizit die Zwangskr äfte, die auf
das Fahrzeug einwirken, und gebe diese als Funktion des Ortes an, an dem sich das Fahrzeug gerade
befindet. Wie ist der Neigungswinkel des Gleises als Funktion von zu w ählen, wenn keine seitlichen
Zwangskräfte auftreten sollen?
Das mathematische Pendel
Nun wollen wir ein System mit zwei Freiheitsgraden etwas näher untersuchen, also ein Teilchen, dessen
Bewegungen nicht auf eine vorgegeben Kurve, sondern auf ein Fläche eingeschränkt sind. Auch ein solches System lässt sich sehr allgemein definieren und analysieren. Um das Prinzip zu verstehen, genügt es
jedoch, ein einfaches Beispiel zu betrachten. Die Ergebnisse lassen sich anschließend leicht verallgemeinern.
Das Beispiel, das wir uns näher anschauen wollen, ist das in Abbildung 5.3(a) dargestellte mathematische Pendel. Es besteht aus einem als punktförmig angenommenen Körper der Masse , der an einem
Seil oder einer Stange der Länge aufgehängt ist. Die Stange kann sich um ihren Aufhängepunkt frei in
alle Richtungen drehen, und ihre Masse soll im Vergleich zur Masse des Pendelkörpers vernachlässigbar
klein sein. Die Bewegungsfreiheit des Körpers ist somit auf eine Kugelschale mit dem Radius um den
Aufhängepunkt eingeschränkt.
In diesem Fall ist es offensichtlich, dass die durch den Stab ausgeübte Zwangskraft senkrecht zu den
möglichen Bewegungsrichtungen des Körpers ausgerichtet ist. Der Stab kann nur einen Druck oder einen
Zug auf den Körper in radialer Richtung ausüben, also senkrecht zur Kugeloberfläche. Einer Bewegung
des Körpers entlang der Kugeloberfläche gibt der Stab wegen seiner vernachlässigbaren Trägheit sofort
nach.
Wir wählen das Koordinatensystem so, dass der Ursprung genau dort liegt, wo das Pendel aufgehängt
ist. Der Pendelkörper befindet sich dann an einem Ort mit , und die Zwangskraft zeigt in Richtung
des Ortsvektor . Wir machen den Ansatz
# (5.10)
wobei eine noch unbekannte skalare Größe ist, die in irgendeiner Weise vom momentanen Bewegungszustand des Pendels abhängen wird. Außerdem soll auf den Körper noch eine äußere Kraft wirken, die
wie üblich als Funktion von und und eventuell der Zeit vorgegeben ist. Daraus ergibt sich analog zu
(5.2) die Bewegungsgleichung
(5.11)
Um die Größe und damit die Zwangskraft zu bestimmen, benutzen wir den gleichen Trick wie gerade
eben für das Schienenfahrzeug. Wir wissen, was die Zwangskraft bewirkt. Sie stellt sich immer so ein,
dass der Abstand des Teilchens zum Ursprung konstant bleibt. Durch zweimaliges Ableiten finden wir
: : 6
98
: ?
: 6 (5.12)
replacements
(c)
(d)
(b)
(a)
Abbildung 5.3: Das mathematische Pendel (a) besteht aus
einem Teilchen der Masse , das an einem
als masselos angenommenen Seil oder Stab der Länge in einem Gravitationsfeld aufgehängt ist. Eine
Hantel (b) besteht aus zwei Teilchen, die durch einen ebenfalls als masselos angenommenen Stab der
Länge verbunden sind. In beiden Fällen wirken die Zwangskräfte als Zug- oder Druckkräfte in Richtung
des Stabes. Beim Pendel wirkt eine äußere Kraft auf ein Teilchen, bei der Hantel wechselwirken zwei
Teilchen miteinander.
Multiplizieren wir die letzte Gleichung mit
sich
Auflösen nach ergibt
"
und setzen die Bewegungsgleichung (5.11) ein, so ergibt
: &
: ?
+:
:
: :
: #:
:
"
Wir können das noch ein wenig umschreiben, indem wir 6 : (5.13)
(5.14)
verwenden und einen Einheitsvektor
(5.15)
einführen, der in Richtung des Ortsvektors zeigt und die momentane Ausrichtung des Pendels bestimmt.
Es gilt dann
" ' "
(
mit
:
( (5.16)
Die Größe ist die Projektion der äußeren Kraft auf die momentane Ausrichtung des Pendels,
also die radiale Komponente der äußeren Kraft, und ( ist der Betrag der momentanen Geschwindigkeit
des Pendelkörpers.
Die zwei Anteile der Zwangskraft können wir folgendermaßen verstehen. Der erste Anteil kompensiert
die äußere Kraft, die auf den Pendelkörper wirkt. Genauer gesagt, der Anteil der äußeren Kraft in
Richtung von wird kompensiert, so dass keine Beschleunigung des Körpers in radiale Richtung auftreten
kann. Versucht die äußere Kraft, den Körper nach innen oder außen zu bewegen, so wird dieser Kraft durch
die Zwangskraft entgegengewirkt.
Der zweite Anteil ist eine stets zum Ursprung hin gerichtete Kraft, die den Betrag (
hat. Das ist die
Zentripetalkraft, die nötig ist, um einen Körper der Masse mit der Geschwindigkeit ( auf eine Kreisbahn
99
mit Radius zu zwingen. Die Zwangskraft gleicht also nicht nur den radialen Anteil der äußeren Kraft aus,
sondern sie sorgt gleichzeitig auch noch für die nötige Zentripetalkraft, um den Körper auf einer Bahn mit
konstantem Abstand zum Aufhängepunkt, also zum Koordinatenursprung zu halten.
Aufgabe 5.4 Ein Pendel, auf das keine äußeren Kräfte wirken, nennen wir freies Pendel. Man zeige,
dass die allgemeine Lösung der Bewegungsgleichung für ein freies Pendel wie folgt geschrieben werden
kann,
& 1! mit
0 :
6 (5.17)
Die Parameter der Lösung sind ein Einheitsvektor , der die Lage des Pendels zur Zeit 6 angibt,
sowie ein dazu senkrecht stehender Vektor , der die Rotationsachse, um die das Pendel rotiert, und die
Winkelgeschwindigkeit festlegt. Wie hängen diese Parameter mit den Anfangsbedingungen 6 und
6 & (
zusammen? Können die Anfangsbedingungen beliebig gewählt werden?
Aufgabe 5.5 Man berechne für die Bahn (5.17) den Drehimpuls des Pendels sich um eine Erhaltungsgröße handelt. Warum ist das so?
und zeige, dass es
Kugelkoordinaten
Im Prinzip können wir jetzt die Zwangskraft (5.16) in die Bewegungsgleichung (5.11) einsetzen und versuchen, diese für eine vorgegebene äußere Kraft zu lösen. Geschickter ist es jedoch, auch hier die
Zwangskraft zuerst aus der Bewegungsgleichung zu eliminieren, so wie wir dies für das Schienenfahrzeug
getan haben. Dadurch reduziert sich die Anzahl der zu lösenden Differenzialgleichungen.
Was wir dazu benötigen, ist eine Beschreibung der Kugeloberfläche als parametrisierte Fl äche, analog
zur Darstellung der Schiene als parametrisierte Kurve. Erinnern wir uns kurz, wie wir dort vorgegangen
sind. Die Kurve, auf der sich das Fahrzeug bewegen konnte, war durch eine Funktion
parametrisierte
Kurve
8
(5.18)
vorgegeben. Ausgehend davon konnten wir
oder die entsprechende Ortsvektordarstellung den Kurvenparameter als Ortskoordinate verwenden, das heißt wir konnten die Bahn des Teilchens
.
durch eine einzige reelle Funktion beschreiben, mit Die Situation ist ganz analog zur Darstellung des Bahn eines frei beweglichen Teilchens durch die
Koordinatenfunktionen bezüglich eines kartesischen Koordinatensystems. In diesem Fall ist ,
das heißt der Ortsvektor lässt sich als Funktion der drei kartesischen Koordinaten darstellen. Im Falle
eines Teilchens mit nur einem Freiheitsgrad übernimmt der Kurvenparameter die Rolle der kartesischen
Koordinaten. Der Ortsvektor wird als Funktion der Koordinate dargestellt.
Ganz ähnlich können wir vorgehen, wenn sich das Teilchen auf einer Fläche bewegt. Ein Fläche können
wir durch eine Funktion von zwei reellen Variablen darstellen,
parametrisierte
Fläche
8
, )( , )( (5.19)
oder durch eine entsprechende Ortsvektordarstellung , )( )( . Jeder Punkt auf der Fläche
wird auf diese Weise eindeutig durch seine Koordinaten , )( identifiziert. Jedem Paar von reellen Zahlen
)( entspricht genau ein Punkt auf der Fläche mit dem Ortsvektor )( . Wie bei einer parametrisierten
Kurve nehmen wir stets an, dass die Funktion ( hinreichend oft stetig und differenzierbar ist.
100
replacements
(c)
(d)
(a)
(b)
Abbildung 5.4: Auf der Erdoberfläche wird jeder Punkt durch die Angabe seiner geographischen Breite
und Länge identifiziert (a). Die geographische Länge ist eine periodische Koordinate, das heißt und
sind äquivalent. Der Breite nimmt Werte zwischen am Südpol und am Nordpol an.
Die in der Mathematik und Physik üblichen Kugelkoordinaten und sind so definiert, dass am Nordpol
und am Südpol gilt, und eine Periode von hat (b).
Bewegt sich nun ein Teilchen auf einer solchen parametrisierten Fläche, so können wir seine Bahn durch zwei reelle Funktionen und ( beschreiben, so dass , )( ist. Die Koordinaten
(
und übernehmen jetzt die Rolle der kartesischen Koordinaten eines frei beweglichen Teilchens. Da
ein Teilchen auf einer Fläche zwei Freiheitsgrade hat, wird seine Bahn durch zwei Koordinatenfunktionen
beschrieben.
Um ganz konkret die Bewegungen eines Pendels zu beschreiben, müssen wir auf der Kugeloberfläche
geeignete Koordinaten einführen. Das einfachste und dafür am besten geeignete Koordinatensystem ist in
Abbildung 5.4(a) dargestellt. Es wird unter anderem als ein weltweit definiertes Koordinatensystem auf
der Erdoberfläche verwendet. Jeder Punkt auf der Erdoberfläche wird eindeutig durch seinen L ängen- und
Breitengrad identifiziert.
Die Breite eines Punktes auf der Erdoberfläche ist durch den Winkelabstand vom Äquator festgelegt,
6 und Orte auf der Südhalbkugel eine negative
wobei Orte auf der Nordhalbkugel eine positive Breite
6 , am Südpol " 6 . Der Wertbereich der Breite ist
Breite 6 haben. Am Nordpol ist 6 , oder in dimensionslosen
7 . Die Breitendemnach " 6 Größen ausgedrückt " 7 kreise, also die Linien gleicher Breite konst sind Kreise, die parallel zum Äquator verlaufen und an
den Polen zu Punkten entarten.
Die Länge eines Punktes ist wie folgt festgelegt. Die Längenkreise oder Meridiane, also die Linien
gleicher Länge konst sind Großkreise, die den Nordpol mit den Südpol verbinden. Einer dieser
Längenkreise ist willkürlich als Nullmeridian ausgewählt. Dort ist 6 . Für die anderen Längenkreise
ergibt sich die Koordinate als Winkelabstand vom Nullmeridian, gemessen entlang des Äquators in
östlicher Richtung. Die Länge ist daher eine periodische Koordinate mit der Periode 6 oder 7 . Die
Koordinaten und 7 bezeichnen denselben Punkt auf der Kugeloberfläche.
In der Mathematik und der Physik ist es üblich, dieses in der Geographie benutzte Koordinatensystem
ein wenig zu modifizieren. Einen speziellen Grund dafür gibt es allerdings nicht. Man ersetzt die Breite
durch eine andere Koordinate ! , die den Winkelabstand zum Nordpol misst. Es gilt also ! 7 "
,
101
und der Wertebereich ist 6 ! . Dieses modifizierte Koordinatensystem auf der Kugeloberfläche ist
in Abbildung 5.4(b) dargestellt. Es unterscheidet sich nur unwesentlich von dem Koordinatensystem in
Abbildung 5.4(a).
Wir können jetzt den Ort, an dem sich das Pendel befindet, durch Angabe der Koordinaten ! und festlegen. Die Bahn des Pendels wird durch zwei Funktionen ! und beschrieben, so wie zuvor
die Bahn eines Schienenfahrzeugs durch ein Funktion beschrieben wurde. Wir müssen uns nur noch
überlegen, wie der Ortsvektor mit den Winkeln ! und zusammenhängt.
Aufgabe 5.6 Wir orientieren die Kugel in Abbildung 5.4 so im Raum, dass der Nordpol auf der positiven
-Achse liegt und der Äquator als Kreis mit Radius in der 4 - -Ebene liegt. Man zeige, dass dann der
Ortsvektor eines Punktes mit den Koordinaten ! auf der Kugeloberfl äche durch
!
!
1! .
!
1!
.
! (5.20)
gegeben ist. Man berechne dazu den Winkelabstand zwischen dem Punkt ! und dem Nordpol und
zeige, dass dieser gleich ! ist. Man zeige außerdem, dass die Koordinatenlinien konst Großkreise
sind, also Kreise mit Radius , deren Abstand voneinander, auf den Äquator gemessen, durch die Differenz
der -Koordinaten gegeben ist. Der Nullmeridian ist dabei derjenige L ängenkreis, der die positive 4 -Achse
schneidet. Außerdem ist natürlich zu zeigen, dass ist.
Damit haben wir die Kugeloberfläche als parametrisierte Fläche ! dargestellt. Wir können sogar
noch einen Schritt weiter gehen und folgende Feststellung machen. Wir können nicht nur die Punkte auf
einer bestimmten Kugeloberfläche mit diesen Koordinaten erfassen, sondern darüber hinaus jeden Punkt
im Raum durch die Angabe seiner Kugelkoordinaten identifizieren. Wir müssen dazu nur zusätzlich zu
den Koordinaten ! und , die auf jeder Kugeloberfläche eingeführt werden können, angeben, auf welcher
Kugeloberfläche der Punkt liegt.
Wir müssen also zusätzlich den Radius dieser Kugel angeben. Das ist natürlich der Betrag des
Ortsvektors. Durch die Angabe von drei reellen Zahlen ! wird dann eindeutig ein Punkt im Raum
festgelegt. Es ist der Punkt mit dem Ortsvektor
! !
3! 3!
!
! (5.21)
Das ist ein Beispiel für ein krummliniges Koordinatensystem. Wie in einem kartesischen Koordinatensystem (1.69) wird ein Punkt durch die Angabe von drei reellen Zahlen festgelegt. Durch (5.21) wird eine
Abbildung definiert,
Kugelkoordinaten
! mit
! (5.22)
Sie ordnet jedem Tripel von reellen Zahlen ! einen Punkt zu. Jedoch unterscheidet sich die
Abbildung (5.22) von einem kartesischen Koordinatensystem dadurch, dass sie erstens nicht linear, und
zweitens nicht einmal bijektiv ist.
Dass sie nicht linear ist äußert sich darin, dass wir den Abstandsvektor zweier Punkte nicht mehr aus den
Differenzen der Koordinaten berechnen können. Folglich können wir den Abstand zwischen zwei Punkten
auch nicht mehr mit Hilfe der Pythagoras-Formel (1.71) bestimmen. Außerdem sind die Koordinatenlinien,
also die Kurven, auf denen jeweils zwei der drei Koordinaten konstant sind, keine zueinander senkrechte
Geraden mehr. Dashalb nennt man ein solches Koordinatensystem krummlinig. Die Koordinatenlinien von
! und sind die in Abbildung 5.4 dargestellten Kreise, und die Koordinatenlinien von sind Geraden, die
durch den Ursprung verlaufen.
Ein weiterer Nachteil des so definierten Koordinatensystems ist, dass die Abbildung (5.22) nicht mehr
bijektiv ist. Ein Punkt kann nämlich durch mehrere Sätze von Koordinaten dargestellt werden. Wie wir
102
bereits gesehen haben, ist die Koordinate periodisch, das heißt die Koordinaten ! und ! 7 bezeichnen denselben Punkt im Raum. Eine genauere Betrachtung der Definition (5.21) ergibt, dass
zusätzlich noch die folgenden Identitäten gelten,
! ! 7 !
7 &
!
"
2"
"
!
(5.23)
und natürlich weitere Identitäten, die sich durch Kombination dieser Gleichungen ergeben. Außerdem
ergibt sich
6 & ! 6 & &
(5.24)
! " das heißt für spezielle Werte von und ! sind einige der Koordinaten redundant. Der Punkt im Raum hängt
von ihnen nicht mehr ab. Für 6 wird unabhängig von den Winkelkoordinaten ! und der Ursprung
bezeichnet, und für ! 6 bzw. ! ergibt sich stets ein Punkt auf der -Achse, der von unabhängig
ist. Das ist jeweils der Nord- bzw. Südpol der Kugel mit Radius . Dort ist der Breitenkreis zu einem Punkt
entartet und folglich die Koordinaten redundant.
Anschaulich können wir diese Eigenschaften der Kugelkoordinaten wie folgt verstehen. Betrachten wir
die in (5.20) definierte Abbildung ! &
! als eine Abbildung des auf die Kugeloberfläche mit
Radius , so wird der in einer speziellen Art und Weise um die Kugel herum gewickelt. Deshalb sind
die Kugelkoordinaten nicht eindeutig. Wir können jedem Punkt auf der Kugeloberfläche mehrere Sätze
von Koordinaten zuordnen.
Um die Kugelkoordinaten dennoch so eindeutig wie möglich festzulegen, schränkt man üblicherweise
den Wertebereich der Koordinaten ein,
6
! 6
" (5.25)
Innerhalb dieser Intervalle sind die Kugelkoordinaten dann eindeutig. Die an den Rändern der Intervalle
auftretenden Redundanzen (5.24) lassen sich dadurch allerdings nicht vermeiden.
Trotz dieser Mehrdeutigkeiten und der eingeschränkten Wertebereiche sind Kugelkoordinaten oft ein
sehr nützliches Hilfsmittel, um Situationen zu beschreiben, die wie das mathematische Pendel eine Kugelsymmetrie besitzen. Wir werden dafür noch sehr viele Beispiele kennen lernen.
Aufgabe 5.7 Es seien zwei Punkte Man berechne den Abstand .
und gegeben mit Kugelkoordinaten ! ! .
und , durch Kugelkoordinaten ! dargeAufgabe 5.8 Es sei eine Kurve , mit stellt. Man drücke den Tangentenvektor durch die Funktionen , ! , und ihre Ableitungen
aus und zeige, dass die Länge der Kurve wie folgt gegeben ist,
! Es gilt also für das Linienelement (2.62) in Kugelkoordinaten
!
!
!
(5.26)
(5.27)
Bewegungsgleichungen in Kugelkoordinaten
Kommen wir nun zurück zum Pendel. Analog zum Schienenfahrzeug beschreiben wir seine Bewegungen
jetzt durch zwei Funktionen ! und , und setzen
!
103
(5.28)
wobei die Funktion ! durch (5.20) gegeben ist. Um das in die Bewegungsgleichung (5.11) einzusetzen, müssen wir die zweite Ableitung von berechnen. Das ist eine etwas komplizierte Rechnung, die
wir schrittweise durchführen werden.
Wir führen zunächst ein paar nützliche Abkürzungen ein. Den Ortsvektor eine Punktes fassen wir im
folgenden stets als eine Funktion der Kugelkoordinaten ! auf, die explizit durch (5.21) gegeben ist.
Wir definieren als erstes drei Einheitsvektoren , und , indem wir die partiellen Ableitungen dieser
Funktion bilden und die Vektoren anschließend normieren,
0
Kugelbasis
0
! !
1! -
!
3!
!
1! -
" 3!
1! !
!
1!
! .
" ! (5.29)
Aufgabe 5.9 Man zeige, dass die Vektoren , für alle ! eine positiv orientierte Orthonor
malbasis von bilden. Es handelt sich also um drei zueinander senkrecht stehende Einheitsvektoren,
:
:
: 0 :
: : 6 (5.30)
Außerdem gilt für die Kreuzprodukte
(5.31)
Anschaulich können wir uns die Vektoren , als eine am Punkt mit den Kugelkoordinaten ! aufgestellte Basis vorstellen, wie sie in Abbildung 5.5(a) dargestellt ist. An jedem Punkt im Raum wird
auf diese Weise ein andere Orthonormalbasis von definiert. Da die Vektoren nicht von abhängen, genügt es, eine bestimmte Kugeloberfläche zu betrachten.
Der Vektor steht überall auf dieser Kugeloberfläche senkrecht, und die Vektoren und zeigen
tangential zur Kugeloberfläche, in Richtung der Längen- und Breitenkreise. Der Vektor zeigt überall
nach Süden, der Vektor nach Osten. Nur an der Polen, also entlang der -Achse ist die Basis nicht eindeutig festgelegt. Das liegt an der Redundanz (5.24) der Kugelkoordinaten an den Polen. Dieses Problem
werden wir später noch einmal genauer untersuchen. Zunächst werden wir es einfach ignorieren.
Wir können jetzt die Geschwindigkeit und die Beschleunigung des Pendels berechnen. Betrachten wir
zunächst eine beliebige Bahn , die in Kugelkoordinaten dargestellt ist, ! . Aus
(5.29) ergibt sich dann für die Geschwindigkeit
! !
! !
- (5.32)
Bewegt sich das Teilchen nur auf einer Kugeloberfläche mit Radius , so verschwindet natürlich
der erste Term. Die Geschwindigkeit ist dann eine Linearkombination der Vektoren und . Da wir
das Ergebnis später noch gebrauchen können, betrachten wir aber zunächst eine Bahn, die nicht auf eine
Kugeloberfläche eingeschränkt ist.
Um die Beschleunigung zu berechnen, müssen wir die Gleichung (5.32) noch einmal nach ableiten.
Dabei müssen wir beachten, dass die Basisvektoren jetzt ebenfalls Funktionen der Zeit sind,
denn sie hängen ja von ! und ab. Wenn sich das Teilchen bewegt, nimmt es quasi die Basis mit, bezüglich der die Komponenten (5.32) der Geschwindigkeit definiert sind.
104
replacements
(c)
(d)
(b)
(a)
Abbildung 5.5: An jedem Punkt im Raum wird durch die Kugelkoordinaten eine Orthonormalbasis
festgelegt (a). Die Basisvektoren zeigen in die Richtungen der jeweiligen Koordinatenlinien,
radial nach außen, nach Süden, und nach Osten. Nur an den Polen ist die Basis nicht eindeutig,
da die Koordinaten dort teilweise redundant sind. Bewegt sich ein Teilchen auf einer Kugeloberfläche (b),
so führt es die Basis mit. Seine Geschwindigkeit ist an jeder Stelle der Bahn eine Linearkom
bination der dort definierten Vektoren
und .
Aufgabe 5.10 Man berechne die Ableitungen der Basisvektoren ! und beweise
! ! ! " !
!
! !
! 1!
! " nach den Koordinaten
! "
1!
! (5.33)
Für die Zeitableitungen der Basisvektoren ergibt sich daraus
! " ! " !
!
3!
!
. . " 1!
!
. (5.34)
Was durch diese Gleichungen ausgedrückt wird, ist genau das, was wir als “Mitnehmen” der Basis durch
das sich bewegende Teilchen bezeichnet haben. Während sich das Teilchen durch den Raum bewegt, ändert
sich der Ort, an dem es sich befindet, und entsprechend ändert sich auch die Basis , die an jedem
Ort eine andere ist.
Aufgabe 5.11 Man leite die Gleichung (5.32) noch einmal nach der Zeit ab und benutze (5.34), um zu
105
zeigen, dass für die Beschleunigung in Kugelkoordinaten gilt
"
!
"
! !
7
!
!
7
3!
!
"
!
! 7
1!
! !
(5.35)
Um die Bewegungsgleichung in Kugelkoordinaten darzustellen, müssen wir jetzt nur noch die Kraft ,
die auf das Teilchen wirkt, ebenfalls in ihre Komponenten bezüglich der Basis zerlegen, also
' (5.36)
Da es sich dabei im eine Orthonormalbasis handelt, sind die Komponenten durch die Skalarprodukte gegeben,
(5.37)
:
: : Die Bewegungsgleichung lässt sich dann komponentenweise wie folgt schreiben,
!
!
7
"
7
!
"
!
!
"
7
! ! 1! ! 3!
! !
(5.38)
Wichtig ist an dieser Stelle, dass die Komponenten der Kraft immer bezüglich der Basis
, an der Stelle definiert sind, an der sich das Teilchen gerade befindet. Wenn die Kraft als
Funktion des Ortes und der Geschwindigkeit vorgegeben ist, so müssen wir diesen Vektor bezüglich
der Basis an der Stelle ! in seine Komponenten zerlegen. Als Ergebnis erhalten
wir dann die Komponenten , die wir als Funktionen von , ! , und deren Zeitableitungen
darstellen können.
Das Gleichungssystem (5.38) ist wieder ein gekoppeltes System von Differenzialgleichungen zweiter
Ordnung für drei reelle Funktionen , ! und . Es besitzt eine eindeutige Lösung, wenn wir einen
Satz von Anfangsbedingungen, also den Ort und die Geschwindigkeit des Teilchens zu irgendeiner Zeit
vorgeben. Es sieht ein wenig kompliziert aus, ist aber letztlich nur eine andere Darstellung der gewöhnlichen Newtonschen Bewegungsgleichung in kartesischen Koordinaten.
Aufgabe 5.12 Gegeben sei die folgende Bahn eines Teilchens, dargestellt in Kugelkoordinaten
!
3! (5.39)
wobei ' > irgendwelche Konstanten sind. Man berechne die Geschwindigkeit und die Beschleunigung in Kugelkoordinaten. Was folgt aus dem Ergebnis? Um was f ür eine spezielle Bahn handelt es
sich?
Die Pendelgleichungen
Nach diesen eher allgemeinen Ausführungen über Kugelkoordinaten kehren wir nun zur eigentlichen Fragen zurück. Es ging darum, für das mathematische Pendel einen Satz von Bewegungsgleichungen herzuleiten, aus dem die Zwangskraft eliminiert ist. Wir verwenden dazu die Bewegungsgleichungen in der
Form (5.38). Für das Pendel gilt , und somit 6 und 6 . Außerdem hatten wir die Kraft in
eine äußere Kraft und eine Zwangskraft zerlegt.
106
Betrachten wir zunächst die radial Komponente der Bewegungsgleichungen, also die erste Gleichung
von (5.38). Sie lautet in diesem Fall
" !
! (5.40)
wobei : und : die radialen Komponenten der Kräfte sind. Die Zwangskraft hatten
wir bereits ausgerechnet. Sie war durch (5.16) gegeben. Der dort definierte Vektor ist genau der radiale
Einheitsvektor, das heißt die Zwangskraft hat nur diese eine Komponente,
' mit
(
" "
(5.41)
Offenbar hebt sich die radiale Komponente der äußeren Kraft gerade weg, und was von der radialen Komponente der Bewegungsgleichung übrig bleibt ist
! ! ( (5.42)
Aufgabe 5.13 Man berechne den Betrag der Geschwindigkeit (5.32) f ür chung (5.42) automatisch erfüllt ist.
und zeige, dass die Glei-
Das muss auch so sein, denn wir haben die Zwangskraft ja genau so berechnet, dass das Teilchen keine
Beschleunigung in radialer Richtung erfährt.
Genau wie beim Schienenfahrzeug sind nur diejenigen Komponenten der Bewegungsgleichung relevant, die den möglichen Bewegungsrichtungen des Pendels entsprechen. In diesen Gleichungen treten
keine Zwangskräfte mehr auf, da die Zwangskraft stets in radiale Richtung wirkt. Die Komponenten und verschwinden. Es bleiben also die letzten beiden Gleichungen von (5.38), in die wir die entsprechenden Komponenten der äußeren Kraft einsetzen müssen. Für ergibt sich
! " ! 3!
! 7 3! !
! & ! & (5.43)
Das sind die Bewegungsgleichungen für das Pendel bei beliebig vorgegebenen äußeren Kräften. Als spezielles Beispiel wollen wir im folgenden das Pendel im Schwerefeld der Erde betrachten, das heißt es soll
" sein. Wenn wir diese äußere Kraft in ihre Komponenten bezüglich der Basis , zerlegen, so finden wir
:
" 1!
!
:
!
: 6 (5.44)
Setzen wir das in (5.43) ein, so kürzt sich die Masse des Pendelkörpers heraus. Das ist natürlich wieder
eine Konsequenz der Äquivalenz von Trägheit und Gewicht. Da die einzigen äußeren Kräfte, die auf den
Pendelkörper wirken, Gravitationskräfte sind, ist seine Bewegung von der Masse unabhängig. Es ergeben
sich schließlich folgende Bewegungsgleichungen für die Funktionen ! und ,
Pendelgleichungen
!
" !
1!
! !
!
7 3!
! !
6 (5.45)
Aufgabe 5.14 Es gibt zwei spezielle Lösungen der Pendelgleichungen, die wir unmittelbar ablesen
können. Die eine ist ! 6 und beliebig, die andere ist ! und ebenfalls beliebig.
Welche Art von Bewegung führt das Pendel dabei aus? Wie kommt es, dass die Funktionen in beiden
Fällen frei wählbar sind, obwohl doch die Bewegungen eines mechanischen Systems durch die Anfangsbedingungen eindeutig festgelegt sind?
107
Aufgabe 5.15 Man bestimme alle Lösungen der Pendelgleichung, bei denen das Pendel eine Kreisbewegung ausführt, also eine Bahn der Form
!
(5.46)
durchläuft. Welche anschauliche Bedeutung haben in diesem Fall die Konstanten , und ? Man bestimme den Zusammenhang zwischen und der Umlaufzeit für eine solche Kreisbahn. Welche Werte
können und annehmen?
Aufgabe 5.16 Eine andere spezielle Lösung der Pendelgleichungen, die sich exakt angeben lässt, ist
! 7 3! (5.47)
Die Umkehrfunktion 1! des Kotangens nimmt dabei Werte zwischen 6 und an. Man zeige, dass
dies für beliebige Konstanten eine Lösung der Pendelgleichungen ist und bestimme . Wie sieht diese
spezielle Bewegung des Pendels aus?
Aufgabe 5.17 Man zeige, dass der Drehimpuls des Pendelkörpers in Kugelkoordinaten durch
! #"
!
gegeben ist. Man verifiziere anhand der Pendelgleichungen (5.43) f ür
Erhaltungsgröße ist.
(5.48)
6 , dass dies tatsächlich eine
Aufgabe 5.18 Für das Pendel im Schwerefeld ist der Drehimpuls nicht erhalten, weil die Schwerkraft nicht
als Zentralkraft wirkt. Man zeige jedoch, dass die -Komponente des Drehimpulses eine Erhaltungsgr öße
ist,
. : ! (5.49)
Kleine Auslenkungen
Die allgemeine Lösung der Pendelgleichungen (5.45) lässt sich nicht in geschlossener Form angeben. Wir
können aber ein paar spezielle Lösungen beschreiben und dazu ein Näherungsverfahren verwenden.
Das Pendel hat am Südpol, also bei ! , eine stabile Ruhelage. Es hängt dort einfach senkrecht nach
unten, ohne sich zu bewegen. Lenken wir es ein wenig aus dieser Ruhelage aus, so wirkt eine Kraft, die
es zum Südpol zurück zieht. Deshalb ist diese Ruhelage stabil. Am Nordpol befindet sich eine instabile
Ruhelage. Dort kann das Pendel auch ruhen, jedoch führt jede kleine Auslenkung aus dieser Ruhelage
dazu, dass eine abstoßende Kraft wirkt, die das Pendel noch weiter auslenkt.
Wir wollen die Bewegungen des Pendels in der Nähe des Südpols, also der stabilen Ruhelage beschreiben. Wir führen dazu eine neue Koordinate >
" ! ein, so dass die Ruhelage bei 6 liegt. Es gilt
dann
! 3! ! " 3! (5.50)
und in den Pendelgleichungen (5.45) ändert sich ein Vorzeichen,
" 3! "
7 1! 6 (5.51)
Nun nehmen wir an, dass der Auslenkwinkel sehr klein ist. Das Pendel soll nur sehr wenig aus seiner
Ruhelage ausgelenkt werden. Wir führen dann eine lineare N äherung durch, bei der wir alle Terme, die
108
und 3! von der Ordnung oder höher sind, vernachlässigen. Wir setzen also Pendelgleichungen verschwinden dann alle Winkelfunktionen, und sie werden in linear,
" linearisierte
Pendelgleichungen
"
0 . Aus den
7 6 (5.52)
Diese Differenzialgleichungen können wir lösen. Wir ersetzen dazu die Variablen und durch zwei
andere Variable 4 und , die wie folgt definiert sind,
3!
4 3! (5.53)
Dies sind die 4 - und -Koordinaten des Ortes (5.20), an dem sich das Pendel befindet. Berechnen wir die
Ableitungen von (5.53), so finden wir
4
3! " 3! 4
>" 3! " 7 >" 7 1! (5.54)
In den Klammern stehen genau die Ausdrücke, die auch auf der rechten Seite der Bewegungsgleichung
(5.52) stehen. Daher gelten für die neuen Variablen näherungsweise die Bewegungsgleichungen
4
"
4 "
(5.55)
Diese Differenzialgleichungen kennen wir schon. Es sind die Bewegungsgleichungen für ein lineares
Kraftgesetz. Das Pendel verhält sich wie ein Teilchen in einer durch die Koordinaten 4 und definierten
Ebene, auf das eine linear mit dem Abstand wachsende Zentralkraft wirkt, die es zum Ursprung zurück
zieht.
Diese Bewegungsgleichungen haben wir schon einmal gelöst. Wenn die zweite Ableitung einer Funktion proportional zur Funktion selbst ist, und der Proportionalitätsfaktor negativ ist, dann ist die Lösung
eine Linearkombination der Winkelfunktionen. Wie man leicht zeigt, ist die allgemeine Lösung des Gleichungssystems (5.55)
4 4
3! (
&
3! Die Parameter dieser Lösung werden durch die Anfangsbedingungen
4 6 4 6 4 6 ( 6 mit
(5.56)
(5.57)
eindeutig festgelegt. Die Lösungen sind Ellipsen in der 4 - -Ebene, deren Mittelpunkt im Koordinatenursprung liegt. Es sind periodische Bahnen, die mit der für das Pendel charakteristischen Periode
charakterische
Periode
7 7 (5.58)
durchlaufen werden. Solange die Auslenkungen des Pendels klein sind, schwingt es mit dieser charakteristischen Periode. Für Kreisbahnen ergibt sich dieselbe Periode auch als Grenzwert der Umlaufzeit für
kleine Auslenkungen aus Aufgabe 5.15.
In Abbildung 5.6 sind ein paar typische Lösungen der Pendelgleichung dargestellt. Gezeigt ist die Bahn
des Pendels als Projektion auf die 4 - -Ebene. Die Ringe sind Linien gleicher Auslenkung . Der Maßstab
ist in den drei Abbildungen verschieden gewählt. Die durchgezogenen Ellipsen sind jeweils die Lösungen
109
(b)
(c)
replacements
(d)
(a)
Abbildung 5.6: Die Lösungen der linearisierten Pendelgleichungen stimmen für kleine Auslenkungen (a)
sehr gut mit den numerischen Lösungen der exakten Pendelgleichungen überein. Für mittlere Auslenkungen (b) ergeben sich kleine Abweichungen. Für große Auslenkungen (c) weicht die Bahn bereits nach
einer halben Schwingung sehr stark von der Näherung ab.
der linearisierten Pendelgleichung (5.52). Die gestrichelten Linien sind die entsprechenden Lösungen der
exakten Pendelgleichung (5.51) bei gleichen Anfangsbedingungen. Diese wurden numerisch ermittelt. Die
Striche markieren jeweils Zeitintervalle, die einer halben charakteristischen Periode (5.58) entsprechen.
Man sieht in Abbildung 5.6(a), dass die linearisierten Bewegungsgleichungen bei kleinen Auslenkungen von einigen Grad eine sehr gute Näherung liefern. Innerhalb von ein paar wenigen Perioden weicht
die genäherte Lösung kaum von der exakten ab. Bei mittleren Auslenkungen ergeben sich bereits kleine
Abweichungen. Zum einen sind die Bahnen keine geschlossenen Ellipsen mehr. Die Orte, an deren die maximale Auslenkung erreicht wird, beginnen zu wandern. Außerdem wird der nächste Umkehrpunkt nicht
mehr nach einer Zeit 7 erreicht, sondern etwas später. Die exakte Schwingungsperiode hängt von der
Auslenkung ab.
Für große Auslenkung, bei denen das Pendel bis fast zum Äquator schwingt, liefern die linearisierten
Bewegungsgleichungen keine brauchbare Näherung mehr. In Abbildung 5.6(c) weicht die tatsächlich Bahn
des Pendels bereits nach einer Schwingung stark von der genäherten ab. Das ist natürlich zu erwarten, denn
ist. Das ist für 7 sicher nicht mehr der Fall. Ein Pendel
wir haben ja angenommen, dass schwingt also nur dann mit seiner charakteristischen Periode , wenn die Auslenkung klein ist.
Aufgabe 5.19 Wie sind die Anfangsbedingungen (5.57) zu w ählen, damit sich eine Kreisbahn ergibt? Man
vergleiche diese Kreisbahnen mit denen aus Aufgabe 5.15. Liefert die lineare N äherung eine zu große oder
eine zu kleine Umlaufzeit ?
Aufgabe 5.20 Neben den Kreisbahnen gibt es noch eine andere Klasse von exakt periodischen Bahnen. Es
sind diejenigen, bei denen & ist, das Pendel also in einer Ebene schwingt. Wie lautet in diesem Fall
die exakte Bewegungsgleichung für , wie die linearisierte Bewegungsgleichung? Es sei die Periode,
die sich aus der exakten Bewegungsgleichung ergibt, und die von der Auslenkung, also der Amplitude
der Schwingung abhängt. Ist größer oder kleiner als die charakteristische Periode , die sich aus der
linearisierten Bewegungsgleichung ergibt?
Mehrteilchensysteme
Zwangskräfte treten nicht nur als äußere Kräfte auf, die auf ein einzelnes Teilchen einwirken, sondern
auch als Wechselwirkungen zwischen verschiedenen Teilchen. Ein einfaches Zwei-Teilchen-System, bei
110
dem die Wechselwirkung zwischen den Teilchen durch eine Zwangskraft erzeugt wird, ist die in Abbildung 5.3(b) dargestellte Hantel. Sie besteht aus zwei Teilchen mit Massen und , die sich an den
Orten und befinden. Sie sind durch eine Stange verbunden, so dass der Abstand zwischen ihnen
fixiert ist,
(5.59)
" Die Hantel ist dem Pendel sehr ähnlich. Der einzige Unterschied ist, dass beim Pendel das zweite Teilchen
irgendwo befestigt ist, sich also nicht bewegen kann.
Die Hantel ist als mechanisches System deshalb von besonderem Interesse, weil sie das einfachste
Modell für einem starren Körper darstellt. Im Prinzip können wir uns einen starren Körper immer als
ein System von vielen Teilchen vorstellen, deren relative Abstände durch Zwangskräfte konstant gehalten
werden. Ein solcher Körper kann sich in alle Richtungen bewegen und drehen, aber er kann nicht verformt
werden.
Wir nehmen auch hier wieder an, dass die Stange im Vergleich zu den beiden an den Enden befestigten
Körpern sehr leicht ist, so dass wir deren Masse vernachlässigen können. Die Bewegungsgleichungen
können wir dann wie folgt schreiben,
" (5.60)
wobei und äußere Kräfte sind, die auf die beiden Teilchen einwirken, und die Zwangskraft ist,
die durch die Stange aufgebracht wird.
Da auch hier das Prinzip “actio reactio” gilt, müssen die Zwangskräfte, die auf die beiden Teilchen
wirken, entgegengesetzt gleich sein. Außerdem wirken wie beim Pendel die Zwangskräfte nur in Richtung
der Stange. Die Zwangskraft ist also immer proportional zum Abstandsvektor,
/ "
(5.61)
Was die äußeren Kräfte betrifft, so wollen wir zunächst nur den einfachen Fall betrachten, dass sie nicht
vorhanden sind.
Es ist dann nicht sehr schwierig, die Bewegungsgleichungen vollständig zu lösen. Zuerst zerlegen wir
die Bewegung wie üblich in eine Schwerpunkt- und Relativbewegung. Wir setzen
"
(5.62)
Da es sich um ein abgeschlossenen System handelt, ergibt sich natürlich eine geradlinige und gleichförmige Bewegung des Schwerpunktes,
!
(5.63)
Für die Relativbewegung bekommen wir die folgende Bewegungsgleichung, zu der wir noch die Zwangsbedingung (5.59) hinzunehmen müssen,
(5.64)
Hier ist wieder die reduzierte Masse. Diese Bewegungsgleichung einschließlich der
Zwangsbedingung kennen wir schon. Es ist die Bewegungsgleichung (5.11) eines Pendels, auf das keine
äußere Kraft wirkt. Die Hantel verhält sich also, was die Relativbewegung der beiden Körper betrifft, wie
ein freies Pendel.
Die Lösung dieser Bewegungsgleichungen hatten wir in bereits in (5.17) gefunden. Die Parameter der
Lösung waren eine Winkelgeschwindigkeit und ein dazu senkrecht stehender Einheitsvektor ,
3! mit
111
0 :
6 (5.65)
(c)
(d)
(b)
(a)
Abbildung 5.7: Beispiele für Systeme von mehreren Teilchen mit Zwangsbedingungen.
Für die Hantel haben diese Parameter die folgende Bedeutung. Der Vektor bezeichnet wie beim freien
Pendel die Ausrichtung der Stange zur Zeit 6 . Der Vektor legt die Richtung der Rotationsachse
fest, und sein Betrag bestimmt die Kreisfrequenz, mit der die Rotation erfolgt. Die Hantel rotiert in einer
Ebene, die zu senkrecht liegt, während sie sich als ganzes gemäß (5.63) gleichförmig durch den Raum
bewegt.
Dies ist die typische Bewegung eines starren Körpers. Sofern auf ihn keine äußeren Kräfte wirken,
bewegt sich sein Schwerpunkt geradlinig und gleichförmig, während der Körper mit einer konstanten
Winkelgeschwindigkeit um eine feste Achse rotiert. Für die Hantel ist dieser Bewegungsablauf in Abbildung 5.3(b) angedeutet.
Aufgabe 5.21 Man berechne für die durch (5.63) und (5.65) definierte Bahn der Hantel den Gesamtdrehimpuls , den Schwerpunktdrehimpuls und den inneren Drehimpuls .
Aufgabe 5.22 Die Hantel befindet sich nun im Schwerefeld der Erde, das heißt es sollen auf die beiden
Teilchen zusätzlich zu den Zwangskräften die äußeren Kräfte " und " wirken. Man bestimme für diesen Fall die allgemeine Lösung der Bewegungsgleichungen. Als Anfangsbedingung sei wieder der Ort und die Geschwindigkeit des Schwerpunktes, sowie die Winkelgeschwindigkeit und die Ausrichtung zur Zeit 6 gegeben.
Aufgabe 5.23 Wieviele Freiheitsgrade hat die Hantel?
Aufgabe 5.24 In Abbildung 5.7(a) ist ein System mit zwei Teilchen darstellt, das nur einen Freiheitgrad
besitzt. Ein Körper der Masse gleitet auf einem Tisch. Er spürt dabei ein Reibungskraft, die linear mit
der Geschwindigkeit anwächst. Die Reibungskonstante sei . Ein Seil verbindet diesen über eine Rolle mit
einem anderen Körper der Masse . Dieser hängt senkrecht nach unten im Gravitationsfeld der Erde.
Beide Körper können sich nur auf die Rolle zu oder von ihr weg bewegen.
Die Lage der Körper im Raum wird durch eine einzige Variable festlegen, zum Beispiel die L änge 4 des
nach unten hängenden Seiles. Man bestimme alle Kräfte, die auf die Körper wirken, und eliminiere die
Zwangskräfte aus den Bewegungsgleichungen, so dass nur noch ein Bewegungsgleichung f ür 4 übrig
bleibt. Man finde die eindeutige Lösung zu den Anfangsbedingung 4 6 4 und 4 6 & 6 .
Aufgabe 5.25 Ein etwas komplizierteres Zwei-Teilchen-System mit Zwangskr äften ist in Abbildung 5.7(b)
dargestellt. Zwei Pendelkörper mit gleichen Massen sind über zwei Rollen so miteinander verbunden,
dass die Längen 4 und 4 der beiden Pendel zwar veränderlich sind, die Summe der beiden Längen aber
stets konstant bleibt. Der Einfachheit halber sei außerdem angenommen, dass sich die Pendelk örper nur
in einer Ebene bewegen können. Wieviel Freiheitsgrade besitzt dieses System?
112
Als Anfangsbedingung sei folgende Situation gegeben. Beide K örper befinden sich in Ruhe. Der erste
Körper hängt senkrecht nach unten, das heißt der Auslenkwinkel sei gleich Null. Der Auslenkwinkel des zweiten Körpers sei ungleich Null. Überlässt man das System in dieser Situation sich selbst, so beginnt
der zweite Körper natürlich zu pendeln. Was tut der erste Körper?
6 Schwingungen
Das mathematische Pendel gehört zu einer speziellen Klasse von mechanischen Systemen, die eine bestimmte gemeinsame Eigenschaft haben. Sie besitzen eine Ruhelage, also einen Zustand, in dem sich alle
beteiligten Körper in Ruhe befinden, und sie führen Schwingungen um diese Ruhelage aus, wenn sie aus
der Ruhelage entfernt und sich selbst überlassen werden.
Das einfachste System dieser Art ist der harmonische Oszillator. Er lässt sich nicht nur als mechanisches System realisieren, sondern auch als elektrodynamisches oder quantenmechanisches System. In
der modernen Theorie der Elementarteilchen, der Quantenfeldtheorie, stellt man sich sogar die Teilchen
selbst als harmonische Oszillatoren vor. Wir wollen deshalb dieses im Prinzip sehr einfache System etwas
ausführlicher diskutieren. Es wird uns in fast allen Teilbereichen der Physik, in der Schwingungen eine
Rolle spielen, als Standardbeispiel wieder begegnen.
Der harmonische Oszillator ist außerdem eines der wenigen physikalischen Systeme, deren Bewegungsgleichungen sich exakt lösen lassen. Für andere schwingende Systeme, deren Bewegungsgleichungen sich
nicht exakt lösen lassen, dient der harmonische Oszillator als Basis für verschiedene Näherungsverfahren.
Am Beispiel des mathematischen Pendels haben wir das im letzten Kapitel bereits gesehen. Außerdem lassen sich aus dem Vergleich eines schwindenden Systems mit einem harmonischen Oszillator oft qualitative
Aussagen über dessen mögliche Bewegungen ableiten.
Der harmonische Oszillator
Ein sehr einfaches schwingendes mechanisches System ist in Abbildung 6.1 dargestellt. An einem Körper,
der sich aufgrund von Zwangsbedingungen nur entlang der 4 -Achse bewegen kann, ist eine Feder befestigt,
deren anderes Ende an einem raumfesten Punkt fixiert ist. Die wesentliche Eigenschaft einer Feder ist, dass
die Kraft, die sie auf ihre beiden Enden ausübt, proportional zu ihrer Auslenkung ist. Die Auslenkung ist
die Differenz zwischen der tatsächlichen Länge der Feder und ihrer Ruhelänge, die sie im entspannten
Zustand annimmt.
Wir wählen das Koordinatensystem so, dass sich der Körper genau dann im Ursprung befindet, wenn
die Feder entspannt ist. Für seinen Ortsvektor gilt also 4 , wobei 4 gleichzeitig die Auslenkung der
Feder ist. Aus den allgemeinen Überlegungen über Zwangskräfte wissen wir, dass wir die Bewegungsgleichung für ein System mit nur einem Freiheitsgrad in der vereinfachten Form (5.8) schreiben können,
wenn der dafür verwendete Kurvenparameter gleichzeitig die geometrische Länge der Kurve angibt, auf
der sich der Körper bewegt. Das ist für die Ortskoordinate 4 natürlich der Fall. Sie ist ja gerade durch den
Abstand eines Punktes auf der 4 -Achse vom Ursprung definiert.
Die effektive Kraft , die wir einsetzen müssen, ist die 4 -Komponente der von außen auf den Körper
einwirkenden Kraft. Das soll die Federkraft sein, die proportional zur Auslenkung und ihr entgegen gerichtet ist. Wir bekommen also die einfache Bewegungsgleichung
wobei 4 4 4 "
4 (6.1)
die Masse des schwingenden Körpers ist und die Federkonstante. Sie hat die Dimension
0
0
N m
kg s . Die dreidimensionale Version dieses Kraftgesetzes kennen wir schon aus
Kapitel 3, wo wir ein lineares Kraftgesetz als Beispiel für die Wechselwirkung von zwei frei beweglichen
Teilchen untersucht haben.
4
113
replacements
(a)
(b)
(c)
(d)
Abbildung 6.1: Der harmonische Oszillator als mechanisches System. Dargestellt ist ein typischer Bewegungsablauf, wobei die Zeit von links nach rechts läuft. Der Körper wird aus der Ruhelage ausgelenkt
und anschließend sich selbst überlassen.
Dort hatten wir auch schon die allgemeine Lösung einer solchen Bewegungsgleichung gefunden, die
sich als Linearkombination von Sinus- und Kosinusfunktionen schreiben ließ. Wir wollen diese Lösung
hier noch einmal reproduzieren, wobei wir ein wenig systematischer vorgehen, um das Ergebnis hinterher
zu verallgemeinern. Wir schreiben die Bewegungsgleichung zunächst in der Standardform für eine lineare
Differenzialgleichung,
harmonischer
Oszillator
4 4 6 (6.2)
Ein dynamisches System, das einer solchen Bewegungsgleichung genügt, bezeichnet man allgemein als
harmonischen Oszillator, unabhängig davon, ob es sich um ein mechanisches System oder um ein System anderer Art handelt. Entscheidend ist, dass die rücktreibende Kraft, also die zweite Ableitung des
Zustands, proportional zur Auslenkung, also zur Abweichung es Zustands vom Ruhezustand des Systems
ist.
Ein harmonischer Oszillator ist ein schwingendes System, bei dem die rücktriebende Kraft
eine lineare Funktion der Auslenkung ist.
Aufgabe 6.1 Man zeige, dass sich dasselbe Kraftgesetz auch dann ergibt, wenn auf den K örper zusätzlich
noch die Schwerkraft wirkt, und zwar unabhängig davon, ob sich der Körper im Schwerefeld in horizontaler, vertikaler oder in irgendeiner anderen Richtung bewegen kann. Man muss nur das Koordinatensystem
entsprechend anpassen.
Lineare Differenzialgleichungen
Die Bewegungsgleichung (6.2) ist eine lineare Differenzialgleichung für die gesuchte Funktion 4 . Solche Differenzialgleichungen lassen sich mit einer einfachen und sehr allgemeinen Methode lösen, die wir
kurz herleiten wollen. Jedoch müssen wir dazu einen kleinen Umweg machen und zunächst komplexe
Funktionen von reellen Variablen betrachten.
Eine allgemeine lineare Differenzialgleichung -ter Ordnung für eine komplexe Funktion einer reellen Variablen hat die Form
lineare
Differenzialgleichung
& 6 114
(6.3)
Wie üblich bezeichnet die -te Ableitung der Funktion . Die Koeffizienten
sind beliebige komplexe Zahlen, wobei wir ohne Beschränkung der Allgemeinheit 0 annehmen
können.
Der Schlüssel zur Lösung einer linearen Differenzialgleichung liegt in einer speziellen Eigenschaft der
Lösungsmenge. Unabhängig davon, ob die Koeffizienten reell oder komplex sind, bzw. ob die gesuchte
Funktion reell oder komplex ist, bilden die Lösungen einen Vektorraum. Der Beweis ist ganz einfach.
Mit jeder Funktion bzw. und jedem 8 bzw. 8
ist offenbar auch die
Funktion eine Lösung der Differenzialgleichung. Und mit je zwei Funktionen und ist auch die
Funktion eine Lösung. Damit sind skalare Multiplikation und Vektoraddition erklärt, und es ist
auch mehr oder weniger offensichtlich, dass die Vektorraumaxiome erfüllt sind.
Wir können sogar etwas über die Dimension des Lösungsraumes aussagen, und auch diese Aussage gilt wieder unabhängig davon, ob wir reelle oder komplexe Funktionen betrachten. Um die Lösung
einer Differenzialgleichung -ter Ordnung eindeutig zu bestimmen, müssen wir
Anfangsbedingun
und die ersten " 0 Ableitungen
gen festlegen. Zum Beispiel
1 können wir den Funktionswert
an irgendeiner Stelle vorgeben. Die -te Ableitung der Funktion
und damit ihr Verlauf ist dann durch die Differenzialgleichung festgelegt. Zu jeder möglichen Wahl dieser
Anfangsbedingungen gehört also genau eine Lösung der Differenzialgleichung.
Das sind reelle bzw. komplexe Zahlen, die wir unabhängig voneinander wählen können, also ist
der Lösungsraum ein -dimensionaler komplexer Vektorraum. Der formale Beweis dieser Aussage, den
wir hier nicht führen werden, beruht wieder auf dem Satz von Cauchy, Picard und Lindelöf. Die Aussage
ist völlig analog zur Kernaussage über dynamische System, wonach die Zeiteintwicklung eines solchen
Systems eindeutig durch die Anfangsbedingungen festgelegt ist.
Um die allgemeine Lösung der Differenzialgleichung (6.3) zu bestimmen, genügt es, eine Basis des
Lösungsraumes anzugeben. Beschränken wir uns zunächst auf komplexe Funktionen, so besteht eine solche Basis aus genau linear unabhängigen Funktionen 8
. Jede Lösung lässt sich dann eindeutig
als Linearkombination der Basisfunktionen darstellen. Um eine solche Basis zu finden, müssen wir einen
geeigneten Ansatz machen. Es bietet sich an, eine Exponentialfunktion zu wählen,
&
(6.4)
6 (6.5)
Setzen wir diesen Ansatz in (6.3) ein, so ergibt sich
charakteristisches
Polynom
6
&
Die Funktion wird charakteristisches Polynom der Differenzialgleichung (6.3) genannt. Es ist ein
Polynom -ten Grades in , das sich über dem Körper stets vollständig faktorisieren lässt. Wir bezeichnen die Nullstellen mit , deren Anzahl mit , und ihre jeweiligen Vielfachheiten mit . Dann
ist
&
" (6.6)
Das ist der Grund, warum wir zunächst komplexe Funktionen betrachten müssen. Über dem Körper lassen sich Polynome nicht immer vollständig faktorisieren, da im allgemeinen nicht alle Nullstellen eines
reellen Polynoms reell sein müssen. Ein beliebiges komplexes Polynom -ten Grades hat aber stets
Nullstellen, wenn wir sie mit ihren jeweiligen Vielfachheiten zählen.
Wenn alle Nullstellen einfach sind, also alle 0 sind, dann gibt es verschiedene Nullstellen.
In diesem Fall haben wir linear unabhängige Funktionen +
gefunden, die die Differenzialgleichung lösen. Sie bilden die gesuchte Basis des Lösungsraumes. Die allgemeine Lösung ist somit eine
Linearkombination von Exponentialfunktionen.
115
Wenn es Nullstellen zweiter oder höherer Ordnung gibt, also nicht alle gleich eins sind, dann ist ihre
Anzahl kleiner als der Grad des charakteristischen Polynoms. In diesem Fall bilden die Funktionen
zwar noch immer einen linear unabhängigen Satz von Lösungen, aber keinen vollständigen
Satz und damit keine Basis des -dimensionalen Lösungsraumes. Es muss also noch andere Lösungen
geben.
eine -fache Nullstelle des charakteristischen Polynoms. Man zeige, dass
Aufgabe 6.2 Es sei dann die Funktionen
+ für
6 33
" 0 (6.7)
linear unabhängige Lösungen der Differenzialgleichung (6.3) sind.
Es gibt also zu jeder mehrfachen Nullstelle des charakteristischen Polynoms nicht nur eine, sondern
so viele Lösungen + der Differenzialgleichung, wie es der Vielfachheit der Nullstelle entspricht.
Insgesamt finden wir auf diese Weise immer linear unabhängige Lösungen. Diese bilden die gesuchte
Basis des Lösungsraumes, und die allgemeine Lösung ist eine Linearkombination dieser Basisfunktionen,
&
Die Koeffizienten , von denen es genau
jeweiligen Anfangsbedingungen anzupassen.
(6.8)
Stück gibt, können frei gewählt werden. Sie sind an die
Die Lösungsmenge einer linearen Differenzialgleichung
-ter Ordnung ist ein
dimensionaler Vektorraum. Eine Basis dieses Raumes ist durch Exponentialfunktionen gegeben, die sich aus den Nullstellen des charakteristischen Polynoms bestimmen lassen.
Jetzt gibt es nur noch ein Problem. Wir kennen jetzt die allgemeine Lösung einer komplexen Differenzialgleichung. Die Lösungsmenge ist ein -dimensionaler Vektorraum über , von dem wir eine Basis
explizit angeben können. Aber eigentlich wollten wir eine reelle Differenzialgleichung lösen. Die Koeffizienten sind reell, und auch die gesuchte Funktion soll reell sein.
Natürlich können wir jede reellwertige Funktion auch als eine komplexwertige Funktion
. auffassen. Die reellen Lösungen sind daher als Teilmenge in den komplexen Lösungen (6.8)
enthalten, und sie bilden einen -dimensionalen reellen Vektorraum. Andererseits wissen wir, dass wir
eine reelle Lösung der Differenzialgleichung bekommen, wenn wir reelle Anfangsbedingungen vorgeben.
Denn unabhängig davon, mit welcher Technik wir eine Differenzialgleichung lösen, gilt ja der Satz, dass
die Lösung eindeutig durch die Anfangsbedingungen festgelegt ist.
Um zu einem gegebenen Satz von Anfangsbedingungen die richtige Lösung zu finden, müssen wir also
nur die Koeffizienten entsprechend bestimmen, und es sollte sich automatisch eine reelle Lösung
ergeben, wenn die Anfangsbedingungen reell sind. Das lässt sich sogar leicht ganz allgemein beweisen.
Aufgabe 6.3 Zusätzlich zur Differenzialgleichung (6.3) sei ein Satz von Anfangsbedingungen , , , vorgegeben. Man zeige, dass die Koeffizienten in (6.8)
dadurch eindeutig festgelegt sind und somit genau eine Lösung der Differenzialgleichung existiert, die den
gegebenen Anfangsbedingungen genügt.
Aufgabe 6.4 Man zeige, dass die Funktion reell ist, wenn sowohl die Koeffizienten der Differenzi
" 0 reell
algleichung als auch die in Aufgabe 6.3 definierten Anfangsbedingungen für 6 31
sind.
116
Aufgabe 6.5 Die Lösungen der folgenden Differenzialgleichungen lassen sich leicht erraten.
4 6 4 6 4 4 4 4 (6.9)
Man bestimme jeweils das charakteristische Polynom, seine Nullstellen, und überprüfe die allgemeine
Formel (6.8).
Aufgabe 6.6 Man bestimme die Lösungen
fangsbedingungen:
4 4 7 4 4 4 6 der folgenden Differenzialgleichungen mit An-
6 & 6 6 & 0
0 & 6 & 6 0 & (6.10)
Die Eigenfrequenz
Nach dieser kurzen Einführung in die Methoden zur Lösung von linearen Differenzialgleichungen kehren
wir zurück zum harmonischen Oszillator. Seine Bewegungsgleichung (6.2) ist ein sehr einfacher Spezialfall einer linear Differentialgleichung. Das charakteristische Polynom ist
(6.11)
. Die Konstante hat
Es besitzt zwei einfache, zueinander komplexe konjugierte Nullstellen die Dimension einer inversen Zeit, also einer Frequenz, 0 s.
&
"
"
mit
Aus der Formel (6.8) können wir unmittelbar die allgemeine Lösung der Bewegungsgleichung ablesen.
Sie lautet
4 & -(
( 1! , " ( , .
8 3! (6.12)
Als Parameter der Lösung haben wir hier zunächst zwei komplexe Zahlen ( eingeführt. Dann
haben wir die Exponentialfunktionen durch Winkelfunktionen ausgedrückt und anschließend zwei neue
Parameter ( und " ( eingeführt. Es treten dann keine expliziten Faktoren mehr auf, so
dass wir unmittelbar ablesen können, für welche Werte der Parameter die Lösung reell ist. Das ist genau
dann der Fall, wenn und reell sind.
Damit kennen wir die allgemeine Lösung der Bewegungsgleichung. Und es ist auch nicht schwierig, die
Koeffizienten und so zu bestimmen, dass bestimmte Anfangsbedingungen erfüllt sind. Geben wir zum
Beispiel den Ort 4 und die Geschwindigkeit ( zur Zeit 6 vor, so finden wir
4 6 4 4 6 &
(
4 4
3! (
(6.13)
Offenbar führt der schwingende Körper eine periodische Bewegung aus, deren Periode allein von den
Parametern und , nicht jedoch von den Anfangsbedingungen abhängt. Ein paar typische Bewegungsabläufe sind in Abbildung 6.2 dargestellt. Es gilt stets
4 4 mit
7 (6.14)
Die Zeit wird Eigenperiode, ihr Kehrwert 0
Eigenfrequenz des harmonischen Oszillators genannt. Die Größe 7 heißt Kreisfrequenz. Da die Frequenz fast immer im Argument von Sinus-
117
replacements
(a)
(b)
(c)
(d)
Abbildung 6.2: Typische Lösungen der Bewegungsgleichung eines harmonischen Oszillators für
. Es sind jeweils der Anfangsort durch einen Punkt und
verschiedene Anfangsbedingungen bei
die Anfangsgeschwindigkeit durch einen Pfeil markiert. Alle Bewegungen haben dieselbe Periode .
und Kosinus-Funktionen auftritt, ist es meist einfacher, die Kreisfrequenz anzugeben, da dann keine expliziten Faktoren 7 auftreten. Oft wird auch einfach die Größe als Eigenfrequenz bezeichnet.
Die wesentliche Eigenschaft eines harmonischen Oszillators ist demnach, dass seine Bewegung stets
mit derselben Kreisfrequenz abläuft, die sich in diesem Fall aus den beiden Parametern und des
mechanischen Systems bestimmt.
Ein harmonischer Oszillator schwingt, unabhängig von den Anfangsbedingungen, stets mit
derselben charakteristischen Kreisfrequenz .
Aufgabe 6.7 Es seien als Anfangsbedingungen der Ort 4 und die Geschwindigkeit ( zu einem Zeitpunkt
vorgegeben. Man zeige, dass sich die Lösung der Bewegungsgleichung dann wie folgt schreiben
lässt,
(
4 & 4 4 ( 4 4 1! " " (6.15)
Aufgabe 6.8 Die allgemeine Lösung (6.12) der Bewegungsgleichung des harmonischen Oszillators l ässt
sich auch auf andere Weise parametrisieren. Statt der Parameter kann man zwei Parameter 6
und angeben, so dass
4 1! (6.16)
Man zeige, dass zwischen und einerseits und und andererseits die Beziehungen
3! bzw. (6.17)
gelten. Die Parameter und heißen Amplitude und Phase der Schwingung. Welche physikalische Dimension, und welche anschauliche Bedeutung haben diese Gr ößen?
Aufgabe 6.9 Als ‘Anfangsbedingungen’ können statt des Ortes und der Geschwindigkeit zu einem festen
Zeitpunkt auch andere Vorgaben gemacht werden, zum Beispiel die folgende. Zum Zeitpunkt befindet
sich der Körper am Ort 4 4 , zum Zeitpunkt am Ort 4 ? 4 . Man bestimme daraus die
4
Funktion . Ist die Lösung immer eindeutig? Gibt es immer eine Lösung?
118
Der schwach gedämpfte Oszillator
Bis jetzt sind wir von den Idealvorstellung ausgegangen, dass der Körper reibungsfrei schwingt, das heißt
außer der rücktreibende Kraft der Feder wirkt keine weitere Kraft. Für ein mechanisches System ist das
natürlich unrealistisch. Es wirkt auch eine Reibungskraft auf den Körper ein, sei es direkt, zum Beispiel
durch den Luftwiderstand, oder indirekt durch die innere Reibung der Feder.
Wie üblich machen wir für die Reibungskraft den Ansatz einer zur Geschwindigkeit proportionalen und
ihr entgegengerichteten Kraft, wobei der Proportionalitätsfaktor die Reibungskonstante ist. Die Bewegungsgleichung (6.1) lautet dann
4 4 4 4 "
"
4
(6.18)
Die daraus resultierende Bewegungsgleichung ist noch immer linear in der gesuchten Funktion 4 ,
4 gedämpfter
Oszillator
4 4 6 (6.19)
Ein dynamisches System dieser Art bezeichnet man als gedämpften harmonischen Oszillator. Mit den
Abkürzungen
(6.20)
4 4 6 (6.21)
vereinfacht sich seine Bewegungsgleichung zu
4 7
7
Die Größe ist wieder die Kreisfrequenz des ungedämpften Oszillators, und ist ein Maß für die Stärke
0 s.
der Dämpfung. Beide Größen haben die Dimension einer inversen Zeit, Um die Bewegungsgleichung mit der gerade entwickelten Methode zu lösen, betrachten wir wieder das
charakteristische Polynom und dessen Nullstellen,
&
7
>" >"
"
"
(6.22)
Offenbar müssen wir hier eine Fallunterscheidung machen. Je nach dem Vorzeichen des Ausdrucks unter der Wurzel hat das charakteristische Polynom entweder zwei konjugiert komplexe Nullstellen, eine
doppelte reelle Nullstelle, oder zwei reelle Nullstellen. Wir betrachten zuerst den Fall kleiner Reibung,
also
7
(6.23)
In diesem Fall liegen zwei komplexe Nullstellen vor, nämlich
"
" mit
(6.24)
Beides sind einfache Nullstellen, so dass sich aus der Formel (6.8) die folgende allgemeine Lösung der
Bewegungsgleichung ergibt,
4 & ,
-(
-(
3! (6.25)
Auch hier haben wir wieder die komplexen Exponentialfunktionen durch Winkelfunktionen ausgedrückt
und anschließend -( und " ( gesetzt, um die Faktoren zu eliminieren.
119
replacements
(a)
(b)
(c)
(d)
Abbildung 6.3: Typische Lösungen der Bewegungsgleichung eines schwach gedämpften harmonischen Oszillators. Die Anfangsbedingungen sind wie in Abbildung 6.2 gewählt, jedoch bewirkt die
Reibung jetzt ein exponentielles Abklingen der Schwingung auf der charakteristischen Zeitskala und
gleichzeitig eine Dehnung der Schwingungsperiode .
Offenbar unterscheidet sich die Lösung (6.25) von der Lösung (6.12) des reibungsfreien Oszillators
durch den Vorfaktor . Die Amplitude der Schwingung klingt exponentiell mit der Zeit ab, das heißt die
Schwingung ist gedämpft. Außerdem ist die Kreisfrequenz der Schwingung kleiner als die Kreisfrequenz
im reibungsfreien Fall. Der gedämpfte Oszillator schwingt langsamer als der ungedämpfte.
Ein schwach gedämpfter harmonischer Oszillator schwingt mit einer kleineren Kreisfrequenz
als der entsprechende ungedämpfte Oszillator, und seine Amplitude klingt exponentiell mit der
Zeit ab.
In Abbildung 6.3 sind die typischen Bewegungen eines gedämpften harmonischen Oszillators dargestellt.
7 Es treten dabei zwei charakteristische Zeitkonstanten auf, nämlich die Periode
der Schwin0
gung, und die Abklingzeit
. Das ist die Zeit, in der die Amplitude der Schwingung auf 0
der
ursprünglichen Amplitude abgefallen ist.
Für kleine Reibungskonstanten ist die Abklingzeit sehr groß und die Periode weicht nur wenig
von der Periode des ungedämpften Oszillators ab. Mit zunehmender Reibung wird die Abklingzeit
kleiner, das heißt die Amplitude fällt schneller ab, während gleichzeitig die Schwingungsperiode größer
bzw. , dann geht die
wird. Wenn wir uns der oberen Grenze in (6.23) nähern, also für Kreisfrequenz sogar gegen Null, das heißt die Schwingungsperiode geht gegen unendlich.
Aufgabe 6.10 Man bestätige durch explizites Nachrechnen, dass die Funktionen (6.25) f ür beliebige Konstanten Lösungen der Bewegungsgleichung (6.21) sind.
Aufgabe 6.11 Es seien wieder als Anfangsbedingungen der Ort 4 und die Geschwindigkeit ( zum Zeitpunkt vorgegeben. Man zeige, dass die Schwingung des gedämpften harmonischen Oszillators dann
durch die folgende Funktion beschrieben wird,
4 4 4 (
4 4 3! "
120
(
4
"
(6.26)
replacements
(a)
(b)
(c)
(d)
Abbildung 6.4: Typische Lösungen der Bewegungsgleichung eines stark gedämpften harmonischen
Oszillators. Die Anfangsbedingungen sind wieder die gleichen wie in den Abbildungen 6.2 und 6.3. Der
bestimmen sich
Oszillator fällt jetzt, ohne zu schwingen, in die Ruhelage zurück. Die Abklingzeiten
aus den Exponenten in (6.29).
Der stark gedämpfte Oszillator
Nun betrachten wir den Fall starker Dämpfung, das heißt die Reibungskonstante soll über dem kritischen
Wert liegen,
(6.27)
7
In diesem Fall besitzt das charakteristische Polynom (6.22) zwei negative reelle Nullstellen, nämlich
"
mit
"
(6.28)
Die allgemeine Lösung der Bewegungsgleichung ist nun eine Linearkombination von zwei exponentiell
fallenden Funktionen,
4 -( (6.29)
Der Oszillator führt jetzt gar keine Schwingungen mehr aus, sondern fällt nur noch exponentiell in seine
Ruhelage zurück. Es treten dabei zwei Zeitkonstanten 0 " und 0 & auf. Die größere
der beiden, also , bestimmt das Verhalten der Funktion 4 für große Zeiten. Die charakteristische
Abklingzeit, in der die Amplitude auf 0
der ursprünglichen Amplitude abgefallen ist, ist durch 0 " gegeben.
Der typische Bewegungsablauf eines stark gedämpften Oszillators ist in Abbildung 6.4 dargestellt. Die
Funktion 4 hat höchstens eine Nullstelle, das heißt der der Körper schwingt höchstens einmal durch die
Ruhelage, und nähert sich dieser dann exponentiell abfallend an.
Ein stark gedämpfter harmonischer Oszillator fällt innerhalb einer charakteristischen Abklingzeit exponentiell in die Ruhelage zurück, wobei er diese höchstens einmal durchläuft.
Aufgabe 6.12 Durch einen Trick lässt sich die Lösung (6.29) auf eine ähnliche Form bringen wie (6.25).
Benutzen wir die Definitionen
1!
7
und
121
"
7
(6.30)
(c)
(d)
(a)
(b)
Abbildung 6.5: Das Verhalten eines harmonischen Oszillators bei verschiedenen Reibungskonstanten .
Im Diagramm (a) sind die Kreisfrequenz und Dämpfungskonstanten bzw.
dargestellt, die jeweils
die Dimension einer inversen Zeit haben. Im Diagramm (b) sind die entsprechenden charakteristischen
Zeitkonstanten dargestellt, also die Schwingungsperiode und die Abklingzeiten bzw. .
-( und " ( , so ist (6.29) dasselbe wie
der Hyperbelfunktionen, und setzen diesmal ?
4 3! (6.31)
Das Ergebnis von Aufgabe 6.11 lässt sich dann unmittelbar auf den Fall starker Dämpfung übertragen.
Man zeige, dass die üblichen Anfangsbedingungen für Ort und Geschwindigkeit zur Zeit jetzt auf
die folgende eindeutig bestimmte Lösung führen,
4 4 4 (
4 4 1! "
(
4
"
(6.32)
Der aperiodische Grenzfall
Betrachten wir jetzt noch den Grenzfall, in dem die Reibungskonstante gerade den kritischen Wert hat,
7
Das charakteristische Polynom (6.22) hat in diesem Fall eine doppelte reelle Nullstelle bei
der allgemeinen Formel (6.8) ergibt sich die sehr einfache Lösung
4 , -( (6.33)
"
. Aus
(6.34)
wobei und ( jetzt zwei reelle Parameter sind. Qualitativ ergibt sich ein ähnliches Bild wie beim stark
gedämpften Oszillator in Abbildung 6.4. Es findet keine Schwingung statt, sondern der Oszillator fällt nur
noch in die Ruhelage zurück, wobei er diese höchstens einmal durchläuft. Der einzige Unterschied ist,
0 gibt, die den exponentiellen Abfall beschreibt.
dass es jetzt nur noch eine Zeitkonstante 0
Die Abklingzeit ist gerade die inverse Kreisfrequenz des ungedämpften Oszillators.
122
In Abbildung 6.5 ist noch einmal das Verhalten eines harmonischen Oszillators bei unterschiedlichen
Werten der Parameter dargestellt. Die Masse und die Federkonstante , und somit auch die Kreisfrequenz des ungedämpften Oszillators sind fest gewählt. Die Reibungskonstante ist variabel und nimmt
jeweils von links nach rechts zu. Ist kleiner als der kritische Wert 7 , so schwingt der
Oszillator mit einer Kreisfrequenz , und seine Amplitude fällt mit dem Exponenten
ab. Mit zunehmender Reibung wird die Kreisfrequenz kleiner und die Dämpfung größer. Dadurch wird die Periode
7 größer und die Abklingzeit 0
kleiner.
Beim kritischen Wert
geht die Kreisfrequenz
gegen Null und die Schwingungsperiode
gegen unendlich. Jenseits des kritischen Wertes, also bei starker Dämpfung, tritt keine Schwingung
mehr auf. Statt dessen gibt es zwei Dämpfungskonstanten und , bzw. zwei Zeitkonstanten und
. Sie bestimmen das Abklingverhalten der Auslenkung als Funktion der Zeit. Die größere der beiden
Zeitkonstanten bestimmt das Verhalten des Oszillators für große Zeiten, das heißt sie bestimmt letztlich,
wie schnell der Oszillator wieder in seine Ruhelage zurück fällt.
Aufgabe 6.13 Aufgabe eines Stoßdämpfers ist es, die Reibungskonstante eines schwingenden Systems so
einzustellen, dass sich das System bei einer plötzlich auftretenden Auslenkung so schnell wie möglich
wieder in die Ruhelage begibt. Warum ist ein Stoßdämpfer genau dann optimal eingestellt, wenn der
aperiodische Grenzfall vorliegt? Nehmen wir an, die Stoßdämpfer eines Autos seien optimal eingestellt.
Nun wird das Auto zusätzlich beladen. Was wird beim nächsten Schlagloch passieren? Wird das Auto
beginnen zu schwingen, oder wird es nur langsamer als im unbeladenen Zustand wieder seine Ruhelage
erreichen?
Aufgabe 6.14 Man zeige, dass sich die Lösung zu den üblichen Anfangsbedingungen im aperiodischen
Grenzfall wie folgt schreiben lässt,
4 6 &
4 4 6 &
(
4 4 (
4 "
(6.35)
Aufgabe 6.15 Man bilde in (6.26) bzw. (6.32) den Grenzwert und zeige, dass sich in beiden
Fällen die Lösung (6.32) ergibt. Der aperiodische Grenzfall lässt sich also stetig von beiden Seiten durch
Grenzwertbildung darstellen.
Der angetriebene Oszillator
Jetzt wollen wir noch den Fall betrachten, dass ein gedämpfter harmonischer Oszillator von außen angetrieben wird. Zusätzlich zur rücktreibenden Federkraft und zur Reibungskraft soll eine äußere Kraft auf
den schwingenden Körper einwirken,
4 4 4 4 "
"
4/ (6.36)
Die Funktion , die wir beliebig vorgeben können, beschreibt die äußere Kraft als Funktion der Zeit.
Die Bewegungsgleichung in Standardform lautet dann
angetriebener
Oszillator
4 4 4 0
(6.37)
Leider ist diese Differenzialgleichung nicht mehr von der Form (6.3). Die linke Seite ist zwar linear in der
gesuchten Funktion 4 , aber auf der rechten Seite steht nicht mehr Null, sondern eine vorgegebene Funktion von . Es handelt sich um eine inhomogene lineare Differenzialgleichung, während eine Gleichung
von der Form (6.3) eine homogene Differenzialgleichung ist.
123
Wie können wir eine solche Differenzialgleichung lösen? Betrachten wir ganz allgemein eine inhomogene lineare Differenzialgleichung der Form
inhomogene lineare
Differenzialgleichung
(6.38)
wobei eine vorgegebene Funktion von ist. Ansonsten benutzen wir dieselbe Notation wie vorher.
An dieser Stelle spielt es keine Rolle, ob die gesuchte Funktion reelle oder komplexe Werte annimmt.
Wenn komplex ist, darf natürlich auch eine beliebige komplexe Funktion sein.
Der Lösungsraum dieser Differenzialgleichung ist kein Vektorraum mehr. Wenn wir eine Lösung mit einer Konstanten multiplizieren oder zwei Lösungen addieren, dann erhalten wir keine neue Lösung. Trotzdem können wir die gerade entwickelte Technik auch hier wieder verwenden. Wir müssen sie nur ein
wenig modifizieren.
Betrachten wir zwei Lösungen und von (6.38). Dann gilt für die Funktion " "
" & 6 (6.39)
Offenbar ist die Funktion eine Lösung der homogenen Differenzialgleichung (6.3). Diese Funktionen
kennen wir. Sie bilden einen -dimensionalen Vektorraum, und wir kennen sogar eine Basis dieses Vektorraumes.
Jedem Paar von Lösungen der inhomogenen Gleichung (6.38) ist demnach eine Lösung der
homogenen Gleichung (6.3) zugeordnet. Wie man sich leicht überlegt, erfüllt diese Zuordnung die Axiome der Abbildung (1.40) eines affinen Raumes auf den zugeordneten Vektorraum. Mit anderen Worten,
die Lösungsmenge einer inhomogenen linearen Differenzialgleichung ist ein affiner Raum, dessen zugeordneter Vektorraum die Lösungsmenge der entsprechenden homogenen linearen Differenzialgleichung
ist.
Nehmen wir an, wir würden eine ganz bestimmte Lösung der inhomogenen Differenzialgleichung
kennen, also einen “Punkt” in dem affinen Raum, der aus allen Lösungen der inhomogenen Gleichung
besteht. Dann können wir diesen “Punkt” um einen “Vektor”, also um eine Lösung der homogenen Gleichung “verschieben”, um einen anderen “Punkt”, also eine andere Lösung der inhomogenen Gleichung
zu finden. Wenn wir alle Lösungen der homogenen Gleichung kennen, erhalten wir auf diese Weise alle
Lösungen der inhomogenen Gleichung.
Nun hießt “verschieben” in diesem Fall einfach addieren. Wenn wir zu einer Lösung der inhomogenen Gleichung eine Lösung der homogenen Gleichung addieren, so erhalten wir wieder eine Lösung
der inhomogenen Gleichung. Da wir alle Lösungen der inhomogenen Gleichung auf diese
Weise darstellen können, genügt die Kenntnis einer einzigen Lösung der inhomogenen Gleichung und der
vollständige Lösungsmenge der homogenen Gleichung, um die vollständige Lösungsmenge der inhomogenen Gleichung zu bestimmen.
Die allgemeine Lösung einer inhomogenen linearen Differenzialgleichung ergibt sich aus der
allgemeinen Lösung der zugehörigen homogenen Differenzialgleichung durch Addition einer
speziellen Lösung der inhomogenen Differenzialgleichung.
Um die Bewegungsgleichung (6.37) des angetriebenen Oszillators zu lösen, müssen wir also nur eine
einzige spezielle Lösung finden, und zu dieser die zuvor ermittelte allgemeine Lösung der Bewegungsgleichung eines gedämpften Oszillators addieren.
124
replacements
(a)
(b)
(c)
(d)
Abbildung 6.6: Der angetriebene harmonische Oszillator. Durch Bewegung des Aufhängepunktes wirkt
eine zusätzliche, von außen vorgegebene Kraft auf den Körper. Der Oszillator führt eine erzwungene
Schwingung aus, deren Frequenz durch die Frequenz der äußeren Kraft bestimmt wird.
Periodischer Antrieb und Resonanz
Da das Auffinden einer speziellen Lösung für eine nicht weiter spezifizierte Funktion nicht ganz
einfach ist, wollen wir zunächst einen Spezialfall betrachten, nämlich eine periodische Antiebskraft
(6.40)
Das ist die Antriebskraft, die sich ergibt, wenn wir den Aufhängepunkt der Feder, wie in Abbildung 6.6
gezeigt, periodisch auf und ab bewegen, und zwar mit einer Amplitude und einer Kreisfrequenz . Eine
Verschiebung des Aufhängepunktes um bewirkt nämlich eine Streckung bzw. Stauchung der Feder um
und somit eine zusätzliche Kraft .
Benutzen wir, dass ist, so lautet die zu lösende Bewegungsgleichung nun
4 7
4 4 (6.41)
Um einen geeigneten Ansatz für die Funktion 4 zu finden, überlegen wir uns, welche Art von Bewegung
zu erwarten ist. Wenn wir einen gedämpften Oszillator über einen längeren Zeitraum hinweg mit einer
periodischen Kraft antreiben, so wird er sich, möglicherweise nach einer gewissen Einschwingzeit, diesem
Antrieb unterwerfen und ebenfalls mit der Kreisfrequenz schwingen. Wir machen daher den Ansatz
4 3! -( 4 " -( 3! 4 " 1! " ( (6.42)
wobei ( zwei noch zu bestimmende Konstanten sind. Setzen wir das in die Bewegungsgleichung
(6.41) ein und fassen die Sinus- und Kosinus-Terme jeweils zusammen, so ergibt sich nach einer kurzen
Rechnung
" 7
( "
( 7
3! "
(-
6 (6.43)
Da dies für alle gelten muss, müssen die Ausdrücke in den Klammern verschwinden. Ein wenig umgeformt ergibt sich
" 7
( 6 125
" ( " 7
(6.44)
Das ist ein lineares Gleichungssystem für die Parameter und ( , die wir in den Ansatz hineingesteckt
haben. Die eindeutige Lösung ist
" 7
" 7
( " " 7
(6.45)
Damit haben wir eine spezielle Lösung der Bewegungsgleichung gefunden. Wenn wir diese Werte für
und ( einsetzen, erfüllt die Funktion (6.42) die Differenzialgleichung (6.41). Der Ansatz war also gut
gewählt. Allerdings haben wir auf diese Weise nur genau eine Lösung gefunden.
Um die allgemeine Lösung der Bewegungsgleichung zu bekommen, müssen wir die allgemeine Lösung
der zugehörigen homogenen Differenzialgleichung addieren. Dies ist die Bewegungsgleichung (6.21) des
gedämpften Oszillators. Deren allgemeine Lösung kennen wir schon. Der Einfachheit halber betrachten
wir nur den Fall kleiner Reibung. In diesem Fall ist die allgemeine Lösung der homogenen Gleichung
durch (6.25) gegeben.
Also lautet die allgemeine Lösung der Bewegungsgleichung (6.41) für einen angetriebenen Oszillator
4 3! -( 3! (6.46)
Für und ( sind die Ausdrücke (6.45) einzusetzen, die durch die Amplitude und Frequenz der Antriebskraft eindeutig festgelegt sind. Die Parameter und sind dagegen frei wählbar. Sie werden durch die
Anfangsbedingungen festgelegt.
Wie sieht nun die Bewegung eines angetriebenen Oszillators qualitativ aus? Offenbar beschreibt (6.46)
die Überlagerung von zwei Schwingungen. Da ist zunächst eine erzwungene Schwingung mit der Kreisfrequenz , die von der Antriebskraft herrührt. Ihre Amplitude und Phase ist vollständig durch die Antriebskraft festgelegt, denn die Konstanten und ( werden durch die Parameter des Oszillators sowie
die Amplitude und Frequenz der Antriebskraft vollständig fixiert. Wir werden darauf gleich noch näher
eingehen.
Zusätzlich tritt eine Eigenschwingung des Oszillators mit der Kreisfrequenz auf. Sie ist von der Antriebskraft unabhängig. Ihre Amplitude und Phase hängt von den Anfangsbedingungen ab. Sie klingt allerdings exponentiell mit der Zeit ab, so dass für Zeiten, die sehr viel größer sind als die charakteristische Abklingzeit 0 , nur noch die erzwungene Schwingung übrig bleibt. Nach einer gewissen
Einschwingzeit sehen wir also nur noch die durch die Antriebskraft verursachte erzwungene Schwingung.
Ein durch eine periodische Kraft angetriebener harmonischer Oszillator führt nach einer Einschwingzeit eine erzwungene Schwingung aus, die vollständig durch die antreibende Kraft
bestimmt ist.
Wie wir aus (6.45) entnehmen, hängt das Verhalten eines angetriebenen Oszillators im wesentlichen von
der Differenz der Antriebsfrequenz von der Eigenfrequenz des Oszillators ab. Für einen sehr langsamen Antrieb, also im Grenzfall 6 , finden wir 6 und ( , und für große Zeiten gilt
4 . Nach der Einschwingzeit folgt der Oszillator einfach der antreibenden Kraft, wie in
Abbildung 6.7(a) zu sehen ist. Die Amplitude der Schwingung entspricht der Amplitude, mit der sich
der Aufhängepunkt auf und ab bewegt.
Um das Verhalten der erzwungenen Schwingung im allgemeinen zu diskutieren, ist es sinnvoll, die
spezielle Lösung der Bewegungsgleichung in die Form
4 1! .( (6.47)
umzuschreiben. Dann können wir unmittelbar die Amplitude und die Phase der Schwingung ablesen.
Der Winkel ist in diesem Fall die Phasenverschiebung zwischen der Phase der antreibenden Kraft und
der Antwort des Oszillators.
126
replacements
(d)
(a)
(b)
(c)
Abbildung 6.7: Typische Schwingungen eines angetriebenen harmonischen Oszillators mit schwacher
Dämpfung. Die gestrichelte Linie beschreibt die Auslenkung des Aufhängepunktes der Feder, also die
antreibende Kraft. Die durchgezogene Linie beschreibt die Bewegung des Oszillators, wobei als An und gewählt wurden. Nach einer kurzen Einschwingzeit,
fangsbedingungen jeweils die von der Größenordnung ist, begibt sich der Oszillator in eine erzwungene Schwingung, die nur von
der Amplitude und Frequenz des Antriebs abhängt.
Aufgabe 6.16 Die dazu nötige Umrechnung haben wir bereits in Aufgabe 6.8 durchgef ührt. Man zeige,
dass sich im hier vorliegenden Fall für die Amplitude
& " 7
ergibt, und für die Phasenverschiebung gilt
"
3!
&
7 (6.48)
" (6.49)
Die Funktion 1! ist als Umkehrfunktion des Kotangens so definiert, dass sie Werte zwischen und 6
annimmt, wenn das Argument von " bis läuft. Die Phasenverschiebung nimmt folglich Werte zwischen 6 und " an.
Wir betrachten die Amplitude und die Phasenverschiebung nun als Funktion der Kreisfrequenz der
Antriebskraft. Wir stellen uns dabei vor, dass wir die Antriebsfrequenz langsam verändern, den Oszillator
immer wieder einschwingen lassen, und dabei seine Amplitude und Phase beobachten.
Die Funktionen und , die sich so ergeben, sind in Abbildung 6.8 für verschiedene Werte der
Dämpfungskonstanten aufgetragen. Betrachten wir zunächst den Fall sehr kleiner Dämpfung, also
. In diesem Fall hat die Amplitude ein scharfes Maximum bei einer Kreisfrequenz , die
sehr nahe an der Kreisfrequenz des ungedämpften Oszillators liegt. Dieses Phänomen wird Resonanz
genannt.
Aufgabe 6.17 Man bestimme das Maximum der Funktion und zeige, dass dieses bei
" 7
mit
& 127
7 "
(6.50)
replacements
(d)
(a)
(b)
(c)
Abbildung 6.8: Amplitude und Phasenverschiebung einer erzwungenen Schwingung als Funktion der Kreisfrequenz der Antriebskraft. Bei schwacher Dämpfung (a) ergibt sich eine scharfe Resonanzkurve, bei mittlerer Dämpfung (b) ist die Resonanz weniger stark ausgeprägt, und bei starker Dämpfung (c) verschwindet sie ganz.
liegt, Die Resonanz tritt demnach bei einer Antriebsfrequenz ein, die unterhalb der Kreisfrequenz
des ungedämpften Oszillators liegt, und ebenfalls unterhalb der Kreisfrequenz (6.24) des gedämpften
Oszillators.
Außerdem ändert sich mit der Antriebsfrequenz auch die Phasenverschiebung zwischen der Antriebskraft
und dem Oszillator. Für 6 geht das Argument des Arkus-Kotangens in (6.49) gegen " , der ArkusKotangens also gegen und somit geht die Phasenverschiebung gegen Null. Der Oszillator folgt in
diesem Fall unmittelbar der antreibenden Kraft. Dies hatten wir schon in Abbildung 6.7(a) gesehen.
Mit zunehmender Antriebsfrequenz tritt eine zunehmende negative Phasenverschiebung auf. Der Oszil ist das Argument des Arkus-Kotangens gleich Null,
lator läuft der antreibenden Kraft hinterher. Für 7
das heißt die Phasenverschiebung beträgt genau " . Dieses Verhalten sehen wir in Abbildung 6.7(b). In
der Nähe der Resonanz ist die Amplitude besonders hoch und die Phasenverschiebung beträgt genau eine
viertel Periode.
Erhöhen wir die Antriebsfrequenz noch weiter, so nimmt die Amplitude der erzwungenen Schwingung
wieder ab und die Phasenverschiebung nimmt weiter zu. Für sehr große Antriebsfrequenzen nähert sie
sich dem Grenzwert " , das heißt der Oszillator ist dann fast in Gegenphase zur Antriebskraft. Das sehen
wir in Abbildung 6.7(c). Nach einer gewissen Einschwingzeit, die sich in diesem Fall über mehrere Perioden der Antriebskraft erstreckt, liegen die beiden Kurven um etwa eine halbe Periode phasenverschoben
zueinander.
Wenn wir die Reibung erhöhen, verschwindet das Phänomen der Resonanz allmählich. Wie wir in Abbildung 6.8(b) sehen, ist das Maximum der Amplitude weniger stark ausgeprägt, wenn die Dämpfungskonstante größer ist. Außerdem liegt die Resonanzfrequenz (6.50) hier bereits deutlich unterhalb der
Eigenfrequenz des Oszillators. Oberhalb eines kritischen Wertes der Reibungskonstanten, der bei
7
128
7 (6.51)
Abbildung 6.9: Die Kastenfunktionen (oben) und ihre Stammfunktionen
(unten) für verschie
dene Werte von . Für
ergibt sich als Grenzwert der Kastenfunktionen die Deltafunktion , und
als Grenzwert ihrer Stammfunktionen die Stufenfunktion .
liegt, tritt keine Resonanz mehr auf. Man beachte, dass dies ein anderer kritischer Wert ist als derjenige, bei
dem keine Eigenschwingung des Oszillators mehr möglich ist. Dieser war durch 7 gegeben,
ist also um den Faktor 7 größer. Die Resonanz verschwindet bereits bevor die Eigenschwingungen in
exponentiell fallendes Abklingen übergehen.
Aufgabe 6.18 Wie sieht die Funktion für 6 aus, also bei verschwindender Reibung? Was passiert
in diesem Fall beim Eintritt der Resonanz, also an der Stelle ? Die spezielle Lösung (6.42) existiert
nicht. Warum nicht? Wie sieht statt dessen die Lösung der Bewegungsgleichung
für 6 und aus, wenn als Anfangsbedingungen zum Beispiel 4 6 5 6 und 4 6 < 6 vorgegeben sind? Wie verh ält
sich diese Lösung für große Zeiten?
Delta-Funktion und Kraftstoß
Eine andere spezielle Situation liegt vor, wenn die antreibende Kraft nicht periodisch ist, sondern der
Oszillator nur einmal kurz angestoßen und dann wieder sich selbst überlassen wird. Dieser Fall ist vor
allem deshalb interessant, weil sich aus der Lösung dieses Problems schließlich auch die “Antwort” des
Oszillators auf eine beliebige antreibende Kraft herleiten lässt.
Um eine Antriebskraft zu beschreiben, die nur für ein kurzes Zeitintervall wirkt, führen wir die in
Abbildung 6.9 oben dargestellte Kastenfunktion ein,
0
6
77
für
für
(6.52)
Die Kastenfunktion ist so definiert, dass sie nur in einem Intervall der Breite von Null verschieden ist,
und ihr Funktionswert dort ist so gewählt, dass die Fläche unter dem Kasten immer gleich Eins ist. Ist irgendeine stetige, integrierbare Funktion, so ist
"
&
0
129
(6.53)
7 . Nach dem Mittelwertsatz der
Das ist der Mittelwert von im Intervall #" 7 Integralrechnung gibt es eine Stelle innerhalb dieses Intervalls, so dass der Funktionswert genau
dieser Mittelwert ist. Bilden wir den Grenzwert 6 , so konvergiert gegen und wir bekommen
folglich den Funktionswert an der Stelle ,
"
(6.54)
Da die Funktion für 6 nicht definiert ist, dürfen wir die beiden Grenzwerte in (6.54), also 6
und das Bilden des Integrals, eigentlich nicht vertauschen. Es ist aber nützlich, es trotzdem zu tun und eine
Deltafunktion einzuführen, die die folgende Eigenschaft haben soll,
Deltafunktion
" (6.55)
Diese “formale” Definition ist wie folgt zu verstehen. Anschaulich formuliert ist eine Funktion, die
überall gleich Null ist außer an der Stelle 6 , wo sie unendlich
groß wird, und zwar so, dass ihr Integral
über eine beliebig kleine Umgebung der Null gleich Eins ist,
6
6 6 für
für
& 0
für
6 (6.56)
Eine solche Funktion existiert natürlich nicht wirklich. Steht sie jedoch unter einem Integral, so ist unter
einem eigentlich unsinnigen Ausdruck der Form (6.55) der sinnvolle Grenzwert (6.54) zu verstehen.
Mit anderen Worten, wenn unter einem Integral eine Deltafunktion steht, so “denken” wir uns einfach
einen Grenzwert 6 vor dem Integral und die Funktion durch 3 ersetzt. Es handelt sich um
eine abkürzende Schreibweise, die ähnlich zu verstehen ist wie die Summenkonvention für Vektorindizes.
Sie ist sehr nützlich, weil man mit Hilfe der Deltafunktion formale Umformungen durchführen kann,
wobei man sie wie eine gewöhnliche Funktion behandeln kann.
Es gibt noch eine andere Möglichkeit, die Deltafunktion einzuführen und vielleicht ein wenig besser
zu verstehen. Dazu betrachten wir ihre Stammfunktion. Die Stammfunktionen der Kastenfunktionen sind in Abbildung 6.9 unten dargestellt. Wir bezeichnen sie mit
(6.57)
Offenbar ist 6 für " 7 und 0 für 7 . Dazwischen steigt die Funktion linear mit der Steigung 0 an und es ist 6 0 7 . Im Grenzwert 6 gilt
&
Stufenfunktion
6
0 7
0
=6 für
für
für
6 6 (6.58)
Das ist die Stufenfunktion. Sie ergibt sich in dem oben definierten formalen Sinn als Stammfunktion der
Deltafunktion. Zwischen der Stufenfunktion und der Deltafunktion bestehen somit die formalen Beziehungen
die wir auch als alternative Definition der Deltafunktion betrachten können.
130
(6.59)
Abbildung 6.10: Die Deltafunktion kann auch als Grenzwert
einer glatten Funktion dargestellt werden, hier der Gaußschen Normalverteilungsfunktion. Auch dann ergibt sich als Stamm
funktion
die Stufenfunktion .
im Grenzwert
Die Deltafunktion ist die Ableitung der Stufenfunktion.
Aufgabe 6.19 Wie ist die folgende Gleichung zu verstehen und wie kann man sie beweisen?
" & " (6.60)
Aufgabe 6.20 Die Deltafunktion kann auch als Grenzwert einer glatten Funktion definiert werden. Man
betrachte zum Beispiel die in Abbildung 6.10 oben für verschiedene dargestellten Funktionen
0
&
(6.61)
Man zeige, dass auch die so definierte Deltafunktion die oben aufgez ählten Eigenschaften hat. Insbesondere ergibt sich als Stammfunktion wieder die Stufenfunktion , jetzt dargestellt als Grenzwert der in
Abbildung 6.10 unten gezeigten glatten Funktionen.
Aufgabe 6.21 Definiert man die Deltafunktion wie in Aufgabe 6.20 als Grenzwert einer glatten Funk
tion, so kann man auch ihre Ableitungen , etc. einführen. Sie sind in Abbildung 6.11 dargestellt.
Man leite die folgenden Formeln aus der Eigenschaft (6.55) ab,
" & " Wie lautet die entsprechende Formel für die -te Ableitung
"
"
& 1
(6.62)
?
Aufgabe 6.22 Welche physikalische Dimension hat die Deltafunktion " , wenn die Zeit ist? Welche
physikalische Dimension hat allgemein eine Deltafunktion " , wenn irgendeine physikalische
Größe ist?
131
replacements
(a)
(b)
(c)
(d)
Abbildung 6.11: Die Ableitungen der Deltafunktion
, wie sie sich aus der Darstellung (6.61) ergeben.
Aufgabe 6.23 Es sei eine streng monotone steigende Funktion mit der einzigen Nullstelle
6 . Man beweise durch Substitution
&
(6.63)
Aufgabe 6.24 Für ein frei bewegliches Teilchen im dreidimensionalen Raum gelten die folgenden Bewegungsgleichungen mit zeitabhängiger Kraft,
0
mit
"
(6.64)
Der dadurch beschriebene Vorgang wird als Kraftstoß bezeichnet. Warum? Was bewirkt ein Kraftstoß?
Welche physikalische Dimension und welche Bedeutung hat der Vektor ? Wie sieht die eindeutige L ösung
der Bewegungsgleichungen aus, wenn als Anfangsbedingungen 6 und 6 & vorgegeben sind?
6 , 6 und 6 .
Man unterscheide hierbei die Fälle 9
Der angestoßene Oszillator
Wir betrachten nun wieder die Bewegungsgleichung (6.37) für den angetriebenen harmonischen Oszillator
. Für die Antriebskraft setzen wir jetzt eine Deltafunktion
mit schwacher Dämpfung, also mit ein, multipliziert mit einer Konstanten , damit die rechte Seite der Gleichung die richtige physikalische
Dimension bekommt,
4 7 4 4 " (6.65)
Der Oszillator erfährt also zur Zeit einen Kraftstoß der Stärke , ist aber ansonsten sich selbst
überlassen.
Gesucht ist nun irgendeine spezielle Lösung dieser Bewegungsgleichung. Die allgemeine Lösung finden
wir dann wie üblich durch Addition der allgemeinen Lösung der homogenen Gleichung, die wir bereits
132
replacements
(a)
(b)
(c)
(d)
. Für
Abbildung 6.12: Antwort des gedämpften Oszillators auf einen Kraftstoß ergibt sich die Lösung des antriebsfreien Oszillators aus Abbildung 6.3 mit den Anfangsbedingungen
und .
kennen. Da sowohl für als auch für
keine Antriebskraft vorliegt, gilt dort jeweils die
Bewegungsgleichung für den antriebsfreien Oszillator. Wir machen daher den Ansatz
4 "
6
für
für
(6.66)
wobei eine Lösung der Bewegungsgleichung (6.21) für den antriebsfreien Oszillator ist. Der Oszillator
soll sich also vor dem Stoß in Ruhe befinden und danach eine gedämpfte Schwingung ausführen. Wir
müssen nur noch herausfinden, welche Schwingung er genau ausführt. Dazu müssen wir den Ansatz in die
Bewegungsgleichung einsetzen. Für die Geschwindigkeit finden wir
4 &
"
"
" "
(6.67)
und nochmaliges Ableiten liefert die Beschleunigung
" " " " (6.68)
Setzen wir das in (6.65) ein, so heben sich alle Terme weg, die zu " proportional sind. Denn 4 &
"
"
war ja eine Lösung der zugehörigen homogenen Differenzialgleichung. Was bleibt ist
" " (6.69)
Da diese Gleichung für alle erfüllt sein muss und " und +" zwei linear unabhängige
Funktionen sind, ergibt sich daraus 6 und .
Damit haben wir die gesuchte spezielle Lösung der Bewegungsgleichung (6.65) gefunden. Wir müssen
für diejenige Lösung für den antriebsfreien Oszillator einsetzen, die sich aus den Anfangsbedingungen
"
"
7
133
6 und ergibt. Diese kennen wir bereits aus (6.26). Wir müssen dort nur 4
( setzen. Das ergibt
4 "
"
mit
" 6 und
(6.70)
Das ist die Antwort des Oszillators auf einen Kraftstoß zur Zeit , bei dem ein Impuls übertragen wird.
Für festes und verschiedene Werte von sind diese Funktionen in (6.12) dargestellt. Für ist der
Oszillator in Ruhe. Zum Zeitpunkt erfährt er einen Kraftstoß. Danach ist seine Geschwindigkeit
nicht mehr Null sondern . Mit dieser neu gesetzten Anfangsbedingung beginnt er dann zu schwingen,
wobei die Amplitude für
wegen der Dämpfung wieder exponentiell abklingt.
Aufgabe 6.25 Der Oszillator befinde sich für
angestoßen. Es sei also " "
in Ruhe und werde dann zweimal hintereinander
mit
. Man löse die Bewegungsgleichung.
Aufgabe 6.26 Der Oszillator werde periodisch angestoßen, es gelte also
"
(6.71)
Man finde eine spezielle Lösung der Bewegungsgleichung. Gibt es auch hier ein Resonanzph änomen, wenn
man die Periode variiert?
Lineare Antwort und Greensche Funktion
Wir werden nun zeigen, dass wir auch die Bewegungsgleichung für eine beliebige Antriebskraft lösen
können. Wir können also für jede vorgegebene Kraftfunktion die Antwort des Oszillators berechnen.
Die Technik, die wir dazu verwenden, lässt sich später auf viele ähnliche physikalische Fragestellungen
anwenden. Entscheidend ist dabei, dass der der Oszillator linear antwortet, das heißt seine Reaktion ist
eine lineare Funktion der Antriebskraft.
Wir betrachten zunächst die Differenzialgleichung, die sich ergibt, wenn wir auf der rechten Seite der
Bewegungsgleichung einfach nur eine Deltafunktion "
als Antriebskraft einsetzen. Außerdem er4
setzen wir sie Ortfunktion durch eine Funktion von zwei Variablen,
7
0
"
(6.72)
Dies ist eine Differenzialgleichung für die Funktion , wobei der Punkt immer die Ableitung nach
dem ersten Argument bezeichnet. Das zweite Argument haben wir nur deshalb dazugeschrieben, weil
es auch auf der rechten Seite der Gleichung auftritt, und weil folglich auch die Lösungen dieser Diffe
renzialgleichung von abhängen. Eine spezielle Lösung können wir unmittelbar aus (6.70) ablesen. Sie
lautet
0
" "
(6.73)
Aufgabe 6.27 Ist dies die einzige Lösung der Differenzialgleichung (6.72)? Wenn nicht, durch welche
zusätzliche Forderung ist sie eindeutig festgelegt?
Nun betrachten wir die Funktion
4 134
(6.74)
wobei irgendeine integrierbare Funktion ist, so dass das Integral konvergiert. Da die Integration über
erfolgt und nicht über , und wenn wir einmal voraussetzen, dass die Funktion genügend glatt ist,
so dass wir die Integration über mit der Ableitung nach vertauschen können, so ergibt sich aus (6.74)
und (6.72)
4 7
4 4 &
0
7
"
0
(6.75)
Wir haben mit (6.74) also eine Lösung der Bewegungsgleichung für nahezu beliebige Antriebsfunktionen
gefunden. Die einzige Einschränkung ist, dass das Integral (6.74) konvergieren muss.
Das ist aber eine relativ geringfügige Einschränkung, denn die Funktion fällt für " exponentiell ab, und für ist sie wegen der Stufenfunktion ohnehin gleich Null. Das Integral kon
vergiert also ganz sicher, wenn zum Beispiel für alle Zeiten beschränkt ist, was für einen realistischen
Antrieb sicher der Fall ist.
Gemäß der Formel (6.74) ergibt sich die Antwort 4 des Oszillators auf eine Antriebsfunktion also
durch Faltung der Antriebsfunktion mit der Funktion . Als Faltung bezeichnet man allgemein
ein Integral der Form (6.74). Eine Faltung bildet eine Funktion, hier , linear auf eine andere Funktion,
hier 4 , ab, wobei als Faltungsfunktion oder Integralkern eine Funktion von zwei Variablen
auftritt.
Die Funktion wird auch als Greensche Funktion des Oszillators bezeichnet. Unter einer Greenschen Funktion versteht man im allgemeinen eine Funktion, mit deren Hilfe man durch Faltung eine inhomogene lineare Differenzialgleichung lösen kann. In unserem Fall hat die Greensche funktion noch eine
spezielle Eigenschaft. Da für gleich Null ist, können wir statt (6.74) auch
4 (6.76)
schreiben. Das ist physikalisch sehr sinnvoll. Um die Auslenkung 4 zu einem Zeitpunkt zu bestimmen,
genügt es, die Antriebsfunktion für zu kennen, also für Zeiten , die vor dem Zeitpunkt
liegen. Wie sich die Antriebskraft später, also für
verhält, ist unerheblich. Es gilt das Ursache
Wirkung-Prinzip, wonach die Ursache, die Antriebskraft , der Wirkung, also der Auslenkung 4 vorausgeht.
Man nennt deshalb auch eine retardierte Greensche Funktion. Sie bestimmt die Bewegungen
des Oszillators allein aus den Kräften, die in der Vergangenheit auf ihn einwirkten.
Die Antwort des eines harmonischen Oszillators auf eine beliebige Antriebskraft ergibt sich
durch Faltung der Antriebskraft mit seiner retardierten Greens-Funktion.
Aufgabe 6.28 Es soll eine inhomogene lineare Differenzialgleichung
die Funktion gelöst werden,
Es sei
eine Greensche Funktion mit der Eigenschaft
"
135
-ter Ordnung der Form (6.38) f ür
(6.77)
(6.78)
wobei die Ableitungen wieder nur auf das erste Argument wirken. Man zeige, dass dann eine spezielle
Lösung der Differenzialgleichung (6.38) durch
(6.79)
gegeben ist. Wie findet man eine solche Greensche Funktion? Ist sie eindeutig bestimmt? Wenn nicht, durch
welche zusätzliche Forderung wird sie eindeutig?
Aufgabe 6.29 Man finde eine spezielle Lösung des angetriebenen Oszillators für
6
für
für
(6.80)
Es wirkt also über ein gewisses Zeitintervall eine konstante Kraft .
Aufgabe 6.30 Man setze < und reproduziere die bereits bekannte Lösung der Bewegungsgleichung für eine periodische Antriebskraft mit der Methode der Greenschen Funktion.
Aufgabe 6.31 Man löse die folgende Differenzialgleichung zuerst mit Hilfe einer Greenschen Funktion
und bestimme dann diejenige Lösung, die zu der gestellten Anfangsbedingung gehört,
4 4 4 4 6 & 0 (6.81)
Der gekoppelte Oszillator
Zum Abschluss dieses Kapitels wollen wir noch eine wichtige Verallgemeinerung des harmonischen Oszillators kennen lernen. Bis jetzt haben wir nur Systeme mit einem Freiheitsgrad betrachtet, deren Bewegungen durch eine einzige Funktion 4 beschrieben werden. Als Verallgemeinerung davon kennen wir
bereits das mathematische Pendel in der linearen Näherung (5.55). Das war ein System mit zwei Freiheitsgraden.
Dort waren die Bewegungsgleichungen für die Ortskoordinaten 4 und bereits entkoppelt. Beim mathematischen Pendel in der linearen Näherung handelt es sich daher um ein System von zwei voneinander
schwingen. Die geunabhängigen Oszillatoren, die jeweils mit der gleichen Eigenfrequenz schlossenen Ellipsen in Abbildung 5.6 ergeben sich als Überlagerung zweier unabhängiger Schwingungen,
die senkrecht zueinander mit der gleichen Frequenz erfolgen.
Ein interessanterer Fall liegt von, wenn zwei Oszillatoren miteinander gekoppelt sind. Ein typisches
mechanisches System dieser Art ist in Abbildung 6.13(a) dargestellt. Es besteht aus zwei Oszillatoren,
die parallel zueinander in 4 -Richtung schwingen und durch eine zusätzliche Feder miteinander verbunden
sind. Beide Oszillatoren sollen dieselbe Masse und dieselbe Federkonstante haben. Ihre Bewegungen werden durch zwei Funktionen 4 3 und 4 beschrieben. Der Einfachheit halber sollen weder
Reibungskräfte vorliegen noch eine äußere Antriebskraft.
Auf den ersten Körper wirkt dann eine rückstellende Kraft " 4 , die ihn in die Ruhelage zurück zieht.
Auf den zweiten Körper wirkt entsprechend eine rückstellende Kraft " 4 . Von der dritten Feder wollen
wir annehmen, dass für sie ebenfalls ein lineares Kraftgesetz gilt. Auf den ersten Körper wirkt dadurch eine
zusätzliche Kraft " 4 " 4 , die ihn zum zweiten Körper hin zieht, während auf den zweiten Körper die
gleich große Gegenkraft " 4 " 4 wirkt. Die Federkonstante der Wechselwirkung ist im allgemeinen
von der Federkonstante der einzelnen Oszillatoren verschieden.
Setzen wir das alles zusammen, so ergeben sich die Bewegungsgleichungen
4 4 ;
4 " 4 6 136
4
4
<
4
" 4 6 (6.82)
replacements
(d)
(b)
(a)
(c)
Abbildung 6.13: Zwei oder mehr Oszillatoren werden durch eine zusätzliche Feder miteinander gekoppelt.
Diese Art der Wechselwirkung kennen wir bereits aus Kapitel 3. Dort hatten wir die Bewegungsgleichungen für ein Zwei-Teilchen-System mit linearem Kraftgesetz aufgestellt und gelöst. Der einzige Unterschied
ist, dass hier die Bewegungen nur in eine Raumrichtung erfolgen, und dass zusätzlich die Rückstellkräfte
auf die beiden Körper wirken.
Es handelt sich bei (6.82) um ein System von zwei gekoppelten linearen Differenzialgleichungen. Um
unsere oben entwickelte Methode zur Lösung von linearen Differentialgleichungen darauf anwenden zu
können, müssen wir sie zuerst entkoppeln. Wir bilden dazu die Summe und die Differenz der beiden
Gleichungen,
4 4 ; 4 4 6 4 " 4 7 4 " 4 6 (6.83)
Offenbar können wir auch hier die Bewegung der beiden Körper in eine Schwerpunkt- und eine Relativbewegung zerlegen. Wenn wir als Hilfsfunktionen
4 3 .4 7
4 und 4
4 1 " 4 7
(6.84)
einführen, so ergeben sich zwei voneinander unabhängige, lineare Differenzialgleichung für die Funktionen 4 und 4 , nämlich
4
4
6 4
7 4
6 (6.85)
Beides sind die Bewegungsgleichungen für einen harmonischen Oszillator. Die Lösungen dieser Gleichungen können wir leicht angeben. Die charakteristischen Eigenfrequenzen der beiden Oszillatoren sind
7 (6.86)
und die allgemeine Lösung der Bewegungsgleichungen (6.85) lautet
4 &
8
3! 4
1! (6.87)
Es treten vier Integrationskonstanten auf, also vier Parameter und , die wir den gestellten Anfangsbedingungen anpassen müssen. Für beide Körper können wir jeweils den Ort und die Geschwindigkeit zu
irgendeinem Zeitpunkt frei wählen.
137
replacements
(a)
(b)
(c)
(d)
(lanAbbildung 6.14: Zwei gekoppelte Oszillatoren können im Gleichtakt mit einer Periode ge Striche), oder im Gegentakt mit einer kleineren Periode schwingen (kurze Striche). Im
allgemeinen ergibt sich die Bewegung der Oszillatoren als Überlagerung von zwei solchen Eigenmoden
(durchgezogene Kurve).
Daraus können wir leicht die allgemeine Lösung der ursprünglichen Bewegungsgleichung ableiten. Wir
müssen nur die Definition (6.84) der Hilfsfunktionen umkehren. Das ergibt
4 3 & 4 .4 8 1! 4 & 4 " 4 8
1! " 3! 1! " (6.88)
Um die Bewegungen anschaulich darzustellen, betrachten wir zunächst zwei Spezialfälle, die als Eigenmoden des gekoppelten Oszillators bezeichnet werden.
Es sei zunächst 6 . In diesem Fall ist 4 3 4 . Die beiden Körper schwingen synchron,
also im Gleichtakt zueinander mit der Frequenz . Die mittlere Feder ist dabei stets entspannt, das heißt
die Körper verhalten sich so, als wäre sie gar nicht vorhanden. Tatsächlich ist die Kreisfrequenz genau die Kreisfrequenz eines einzelnen Oszillators mit der Masse und der Federkonstante .
Für 6 liegt ein anderer Spezialfall vor. In diesem Fall ist 4 1 " 4 . Die beiden
Körper schwingen jetzt gegeneinander, und zwar mit einer Kreisfrequenz . Jetzt trägt die mittlere
Feder sehr wohl zu den Kräften und damit zur Bewegungsgleichung bei, so dass sich eine höhere effektive
Federkonstante 7 ergibt, und somit auch eine höhere Schwingungsfrequenz.
Die beiden Eigenmoden sind in Abbildung 6.14 als gestrichelte Linien dargestellt. Die beiden Oszillatoren können miteinander mit der Periode 7 oder gegeneinander mit der Periode 7 schwingen, wobei für die Perioden stets gilt. Ein typische Lösung der Bewegungsgleichung ist
eine Überlagerung dieser beiden Eigenmoden, die als durchgezogene Linie dargestellt ist. Wir können das
wie folgt zusammenfassen:
Die Schwingungen eines gekoppelten harmonischen Oszillators lassen sich in Eigenmoden
zerlegen, die sich jeweils wie einzelne harmonische Oszillatoren verhalten und unabh ängig
voneinander mit verschiedenen Eigenfrequenzen schwingen.
138
Ein besonders interessanter Fall liegt vor, wenn die Kopplung zwischen den beiden Körpern nur schwach
ist, also sehr klein ist im Vergleich zu . Betrachten wir eine bestimmte Lösung der Bewegungsgleichung, indem wir als Anfangsbedingung
4 3 6 & 4 6 & 6 4 1 6 6 4 6 6
(6.89)
vorgeben. Wir lenken also nur den ersten Körper aus der Ruhelage aus und überlassen das System dann
sich selbst. Wie man leicht nachprüft, erfüllt der folgende Spezialfall der Lösung (6.88) diese Anfangsbedingungen,
4 3 1! 7
7 3! 4 1! 7
" 7 1! (6.90)
Um das ein wenig umzuformen, benutzen wir die Additionstheoreme (2.83) für die Kosinus-Funktionen.
Aus ihnen ergibt sich
"
3! 3! 7 3! 1! 1!
Setzen wir
7
7 " 3!
7
7
"
7
"
7
7
(6.91)
(6.92)
so lässt sich die Lösung (6.90) wie folgt schreiben,
4 3 1! 3! 4 " (6.93)
Da die beiden Eigenfrequenzen und sehr nahe beieinander liegen, ist sehr klein, während
ungefähr gleich der Kreisfrequenz eines einzelnen, ungekoppelten Oszillators ist. Die Funktionen mit den
7 Argumenten
oszillieren sehr schnell, mit der Periode
, während sich die Funktionen mit
den Argumenten nur langsam verändern. Die Zeitspanne zwischen zwei Nullstellen dieser Funktionen
beträgt .
Die Funktion 4 3 beschreibt also eine Schwingung mit der Periode , deren Amplitude sich mit der
Zeit langsam verändert und jeweils nach der Zeit einen Nulldurchgang hat. Sie ist in Abbildung 6.15 oben dargestellt. Ein solches Verhalten, das durch die Überlagerung zweier Schwingungen mit
annähernd gleicher Frequenz entsteht, bezeichnet man als Schwebung. Durch den geringen Frequenzunterschied kommt es dazu, dass sich die beiden Schwingungen einmal gegenseitig verstärken und einige
Zeit später gegenseitig auslöschen, weil sich ihre Phasen gegeneinander verschoben haben.
Die Funktion 4 hat ein ähnliches Verhalten, nur dass sowohl die Phase der eigentlichen Schwingung,
als auch das auf und ab der Amplitude gegenüber der Funktion 4 3 phasenverschoben ist. Insgesamt
ergibt sich daher folgendes Bild. Durch die spezielle Anfangsbedingung wird zuerst nur der Oszillator 0 in
Schwingungen mit der Amplitude versetzt. Nach einer gewissen Zeit überträgt sich diese Schwingung
durch die Kopplung auf den Oszillator 7 . Zur Zeit 7 schwingt der erste Oszillator gar nicht mehr,
der zweite jedoch mit der Amplitude . Dann wiederholt sich das Spiel in umgekehrter Richtung.
Die Kopplung bewirkt also eine Übertragung der Schwingung von dem einen auf den anderen Oszillator.
Wie wir andeutungsweise in den folgenden Aufgaben sehen werden, beruht auf diesem Prinzip die Ausbreitung von Wellen. Wir müssen uns dazu nur eine lange Kette von ganz vielen Oszillatoren vorstellen, so
dass die Schwingung jeweils von einem Oszillator zu seinem Nachbarn übertragen wird. Und das ist auch
letztlich der Grund, warum uns der harmonische Oszillator als ein sehr einfaches physikalisches System
immer wieder begegnen wird. Viele, auch sehr komplizierte Systeme lassen sich nämlich als gekoppelte
harmonische Oszillatoren verstehen.
139
replacements
(a)
(b)
(c)
(d)
Abbildung 6.15: Die Überlagerung zweier Schwingungen mit annähernd gleicher Frequenz wird Schwebung genannt. Sie tritt beim gekoppelten harmonischen Oszillator auf, wenn die Kopplung sehr schwach
ist. Die einzelnen Oszillatoren schwingen jeweils mit einer Periode , wobei die Amplitude dieser
Schwingungen mit einer Periode
zwischen den beiden Oszillatoren hin und her pendelt.
Aufgabe 6.32 Auf die beiden schwingenden Körper wirke zusätzlich eine Reibungskraft mit der Reibungskonstanten , sowie auf einen der beiden Körper eine periodische äußere Kraft 3 . Man
zeige, dass die Bewegungsgleichungen auch dann noch entkoppelt werden k önnen, und dass sich die beiden Eigenmoden in diesem Fall wie zwei einzelne harmonische Oszillatoren mit D ämpfung und Antrieb
verhalten. Nach einer gewissen Einschwingzeit führt das System eine erzwungene Schwingung aus, deren
Frequenz mit der die antreibenden Kraft übereinstimmt. Wie sieht diese Schwingung aus? Wie äußert sich
das Phänomen der Resonanz?
Aufgabe 6.33 Man diskutiere den Fall von zwei gekoppelten Oszillatoren, die nicht identisch sind, also
verschiedene Massen und und verschiedene Federkonstanten und
haben. Man zeige, dass
auch dann eine Entkoppelung der Bewegungsgleichungen m öglich ist. Man bestimme die beiden Eigenmoden und die zugehörigen Eigenfrequenzen und .
Aufgabe 6.34 In Abbildung 6.13(b) ist ein gekoppeltes System von drei identischen Oszillatoren 4 , 4
und 4 mit Massen und Federkonstanten dargestellt. Die Kopplung erfolgt durch zwei Federn mit
Federkonstanten . Wie lauten die Bewegungsgleichungen? Um die Eigenmoden, also eine Basis des
Lösungsraumes zu finden, macht man zunächst den Ansatz
4 3 & 1! 4 & 1! 4 1! (6.94)
Alle drei Körper sollen mit derselben Kreisfrequenz schwingen, wobei aber m öglicherweise Phasenverschiebungen auftreten. Das Gleichungssystem, das sich für die Koeffizienten und für 0 7 ergibt, hat dann nur für bestimmte Werte von Lösungen. Wie viele solche Frequenzen gibt es, und wie
sehen die zugehörigen Schwingungsmoden aus?
Aufgabe 6.35 In Abbildung 6.13(c) ist ein gekoppeltes System von unendlich vielen identischen Oszillatoren 4 , , mit Massen und Federkonstanten dargestellt. Die Kopplung zwischen zwei be
nachbarten Oszillatoren erfolgt jeweils durch eine Feder mit der Federkonstanten . Man zeige, dass die
Bewegungsgleichungen wie folgt lauten,
4
7 4 " <
4
.4 6 140
(6.95)
Um die Eigenmoden zu finden, wählt man den geschickten Ansatz
4 3! (6.96)
wobei , , und irgendwelche reellen Zahlen sind. Man zeige, dass diese Funktionen genau dann eine
Lösung der Bewegungsgleichungen liefern, wenn zwischen und die Beziehung
7 0 " 3!
(6.97)
besteht. Jede Lösung dieser Art beschreibt folglich eine Eigenmode des Systems mit der Eigenfrequenz .
Welchen Wertebereich und welche physikalische Bedeutung haben , , und ? Wie sieht die allgemeine Lösung der Bewegungsgleichungen aus? Welche Daten können als Anfangsbedingungen vorgegeben
werden?
7 Energie, Arbeit und Potenzial
Im letzten Kapitel haben wir uns ausführlich mit linearen Differenzialgleichungen beschäftigt. Leider sind
nur die wenigsten Bewegungsgleichungen von dieser Art, so dass sich die entsprechenden Methoden nur
in ganz speziellen Fällen überhaupt anwenden lassen. Nichtlineare Differenzialgleichungen lassen sich im
allgemeinen nicht explizit lösen, so dass wir über kompliziertere dynamische Systeme oft nur qualitative
Aussagen machen, oder deren Lösungen näherungsweise ermitteln können, zum Beispiel mit numerischen
Methoden oder durch eine geeignete Approximation an ein lineares System.
Das Ziel dieses Kapitels ist es, Methoden zu entwickeln, mit deren Hilfe wir möglichst viele Aussagen
über die Lösungen von bestimmten Bewegungsgleichungen machen können, ohne diese explizit zu kennen. Eine wichtige Rolle spielen dabei die Erhaltungsgrößen eines dynamischen Systems, von denen wir
einige schon kennen gelernt haben. Hier werden wir die Energie als eine neue Erhaltungsgröße einführen
und zeigen, dass sich die Bewegungsgleichungen vieler Systeme mit Hilfe dieser Erhaltungsgröße vereinfachen oder sogar lösen lassen.
Eindimensionale Systeme
Um das Konzept von Energie, Arbeit und Potenzial zu verstehen, ist es ganz nützlich, zunächst ein System mit nur einem Freiheitsgrad zu betrachten. Es ist dabei unerheblich, ob es sich um ein mechanisches
System mit Zwangsbedingungen handelt oder ob sich ein Teilchen aufgrund eines vorgegebenen Kraftgesetzes und spezieller Anfangsbedingungen nur in eine Richtung bewegt.
Die Bahn eines solchen Systems wir durch eine einzige reelle Funktion 4 beschrieben, und im allgemeinen gilt ein Kraftgesetz der Form 4 4 4 , das heißt die Kraft ist als Funktion des Ortes, der
Geschwindigkeit und der Zeit gegeben. Wie wollen hier den speziellen Fall betrachten, dass die Kraft nur
von Ort abhängt. Die Bewegungsgleichung lautet dann
4 4 (7.1)
Wir wollen versuchen, aus den Eigenschaften der Funktion 4 möglichst viele Informationen über das
Verhalten der Lösungen dieser Bewegungsgleichung abzuleiten. Der erste Schritt besteht darin, dass wir
uns eine anschauliche Vorstellung von der Wirkung der Kraft auf das Teilchen machen. Dazu ist es nützlich, eine Funktion 4 einzuführen, die wir Potenzial nennen. Sie ist durch
Potenzial
4 " 4 141
(7.2)
replacements
(d)
(b)
(a)
(c)
Abbildung 7.1: Der qualitative Verlauf der Bewegung eines Teilchens in einem Potenzial lässt sich aus
der Form des Potenzials ablesen. Besitzt das Potential Extrema, so kann das Teilchen dort ruhen (a).
Sonst wird das Teilchen zum fallenden Potenzial hin beschleunigt (b). In einer Potenzialmulde kann das
Teilchen schwingen (c).
definiert, also im wesentlichen die Stammfunktion des Kraftgesetzes. Das Potenzial ist bis auf eine additive
Konstante bestimmt, die wir frei wählen können.
Offenbar können wir statt der Funktion 4 dann auch die Funktion 4 vorgeben und die Bewegungsgleichung in der Form
4 " 4 (7.3)
schreiben. Damit ist zwar noch nicht viel gewonnen. Aber mit Hilfe eines Potenzials können wir das Kraftgesetz sehr gut grafisch veranschaulichen. In Abbildung 7.1 sind verschiedene Potenziale 4 dargestellt.
4 Nehmen wir an, das Teilchen befindet sich an einer Stelle 4 . Dann wirkt eine Kraft "
auf das Teilchen, die umso größer ist, je steiler der Graf der Funktion 4 an dieser Stelle ist. Sie wirkt stets in die
Richtung, in die das Potenzial abfällt.
Wir können uns sogar vorstellen, dass sich das Teilchen selbst auf der Potenzialkurve entlang bewegt,
wobei diese aufrecht in einem Gravitationsfeld aufgestellt ist. Zumindest qualitativ ergibt sich dann dasselbe Kraftgesetz. Die Kraft ist umso größer, je steiler die Kurve ist, und sie wirkt stets nach unten. Die
typischen Bewegungsabläufe können wir dann fast schon intuitiv erahnen.
4 6
Hat das Potenzial irgendwo ein Extremum, ist also
, so kann das Teilchen an der Stelle
4 4 ruhen. Fällt das Potenzial in einem Bereich zu größeren 4 hin ab, so erfährt das Teilchen dort eine
Beschleunigung in Richtung der 4 -Achse. Wenn wir es an irgendeiner Stelle aus der Ruhe startet lassen,
dann bewegt es sich beschleunigt nach rechts. Und schließlich, wenn das Potenzial um ein Minimum
herum eine Mulde bildet, so kann es dort eine Schwingung ausführen.
Wir wollen das ein wenig systematischer untersuchen. Wir zeigen zuerst, dass das Potenzial nicht nur
nützlich ist, um das Kraftgesetz anschaulich zu machen, sondern dass wir auch quantitative Aussagen
daraus ableiten können. Wir benutzen dazu einen Trick, den wir bereits in Kapitel 3 verwendet haben, um
die Bewegungsgleichung für den senkrechten Fall in einem Gravitationsfeld zu lösen. Wir multiplizieren
die Bewegungsgleichung (7.3) auf beiden Seiten mit 4 und schreiben alles auf eine Seite,
4 4 4 4 6 (7.4)
Dieser Ausdruck lässt sich mit Hilfe der Kettenregel auch wie folgt schreiben,
7 4 4 6 142
(7.5)
Folglich ist die Größe in der Klammer zeitlich konstant, also eine Erhaltungsgr öße. Sie wird Energie
genannt,
Energie
7
4 4 (7.6)
Die Energie hat die Dimension Masse mal Geschwindigkeit zum Quadrat, oder Kraft mal Länge,
0 kg m s 0 N m. Sie setzt sich zusammen aus einer kinetischen Energie, die von der Geschwindigkeit
des Teilchens abhängt, und einer potenziellen Energie, die davon abhängt, wo sich das Teilchen gerade
befindet und welchen Wert dort das Potenzial hat.
Hinter dieser Aufspaltung verbirgt sich die anschauliche Vorstellung, dass sich bei der Bewegung des
Teilchens fortwährend kinetische in potenzielle Energie verwandelt und umgekehrt, wobei die Summe aus
beiden konstant bleibt. Läuft das Teilchen einen Potenzialberg hinab, so wird es schneller, das heißt es wird
potenzielle in kinetische Energie verwandelt. Läuft es einen Potenzialberg hinauf, so wird die kinetische
Energie wieder in potenzielle Energie verwandelt.
Wir sagen auch, dass bei einem solchen Prozess Arbeit verrichtet wird. Unter Arbeit verstehen wir im
allgemeinen einen Prozess, bei dem eine Energieform in eine andere verwandelt wird.
Aufgabe 7.1 Ein Teilchen fällt senkrecht in in einem Gravitationsfeld, das heißt es gelte " .
Man bestimme das Potential und zeige anhand der bekannten L ösungen der Bewegungsgleichung,
dass die Energie tatsächlich zeitlich konstant ist.
Aufgabe 7.2 Man bestimme das Potenzial 4 für einen ungedämpften harmonischen Oszillator und
zeige, dass eine Potenzialmulde wie in Abbildung 7.1(c) vorliegt, in der das Teilchen schwingen kann.
Man berechne für die bekannte Lösung (6.12) die Energie und zeige, dass sie nicht von abh ängt.
Bewegungsformen
Mit Hilfe einer Erhaltungsgröße können wir die Lösungen der Bewegungsgleichung klassifizieren. Wir
können sie gewissermaßen nach dem Wert von sortieren. Dazu müssen wir zunächst feststellen, welche
Werte überhaupt annehmen kann. Die kinetische Energie kann nicht negativ sein, da sie proportional
zum Quadrat der Geschwindigkeit ist. Die Energie ist daher immer mindestens so groß wie das Potenzial
an dem Ort, an dem sich das Teilchen gerade befindet,
4 (7.7)
Insbesondere muss mindestens so groß sein wie das absolute Minimum der Funktion 4 , falls es ein
solches gibt. Ansonsten ist nicht nach unten beschränkt.
Wenn wir einen bestimmten Wert von vorgeben, dann wird durch die Forderung (7.7) eine Bedingung
an 4 gestellt. In Abbildung 7.2 sind drei typische Fälle dargestellt, wobei der jeweils zulässige Bereich
schattiert ist. Im Fall (a) ist die Bedingung
4 für alle 4 erfüllt. Die Energie ist größer als das
4 , also in einem
absolute Maximum der Potenzialfunktion. Im Fall (b) gilt
4 nur für 4
nach oben unbeschränkten aber nach unten beschränkten Intervall. Natürlich ist auch der umgekehrte Fall
4 nur für 4 4 gilt. Im Fall (c) schließlich erfordert die Bedingung
4 ,
denkbar, dass
4
4
4
4
dass in einem nach oben und unten beschränkten Intervall liegt.
Was bedeutet das konkret für die Lösungen der Bewegungsgleichung? Nehmen wir an, wir hätten eine
4 spezielle Lösung 4 gegeben und kennen den zugehörigen Wert von . Dann gilt natürlich
4
4
ist. Die
für alle . Also ist der Wertebereich von auf den Bereich eingeschränkt, in dem
Bewegung findet ganz innerhalb des jeweils erlaubten Bereichs statt. Das Teilchen kann diesem Bereich
nicht entkommen, weil es, anschaulich formuliert, nicht genug Energie hat, um den Potenzialberg weiter
hinauf zu steigen als bis zum Rand des jeweiligen Intervalls.
143
replacements
(d)
(a)
(b)
(c)
Abbildung 7.2: Aus dem Potenzialverlauf lassen sich die möglichen Bewegungsformen ableiten. Ist
für alle , so läuft das Teilchen über die ganze -Achse (a). Gilt nur für
, so läuft das Teilchen zunächst von rechts kommend bis zum Umkehrpunkt und dann
wieder zurück (b). Ist die Bedingung nur in einem beschränkten Intervall erfüllt, so pendelt das Teilchen in diesem Bereich.
Wir können sogar noch mehr über diese Bewegung aussagen, ohne die Funktion 4 explizit zu kennen.
Nehmen wir an, das Teilchen befindet sich gerade an einer Stelle 4 innerhalb des erlaubten Bereiches. Dann
können wir seine Geschwindigkeit 4 berechnen, denn laut (7.6) gilt
4 7
"
4 (7.8)
"
4 ist die Höhe des schattieren Bereichs in Abbildung 7.2 an der Stelle 4 . Sie
Die Differenz
bestimmt, welcher Teil der Energie auf die kinetische Energie entfällt, und damit die Geschwindigkeit bis
auf ihr Vorzeichen.
Wir wissen also, wie schnell das Teilchen ist. Es ist umso schneller, je tiefer das Potenzial an der Stelle
ist, an der es sich gerade befindet. Allerdings wir wissen nicht, in welche Richtung es sich gerade bewegt.
Aber wir wissen, dass die Geschwindigkeit eine stetige Funktion der Zeit ist. Also kann sie ihr Vorzeichen
nur dann ändern, wenn sie den Wert Null durchläuft. Das wiederum ist nur an den Rändern des jeweils
zulässigen Bereichs der Fall, an denen 4 *
ist, also an der Stelle 4 4 in Abbildung 7.2(b),
bzw. an den Stellen 4 4 oder 4 4 in Abbildung 7.2(c).
Daraus können wir folgenden Schluss ziehen. Solange das Teilchen nicht den Rand des zulässigen
Intervalls erreicht, bewegt es sich in eine Richtung. Seine Geschwindigkeit ist dabei durch die Gleichung
(7.8) bestimmt, wobei das Vorzeichen durch die Bewegungsrichtung festgelegt ist. Erreicht es den Rand
des zulässigen Bereichs, so wird es dort abgebremst und kehrt seine Bewegungsrichtung um. Anschließend
bewegt es sich in die andere Richtung, bis es wieder den Rand des zulässigen Bereichs erreicht, oder für
immer, wenn es keinen anderen Rand gibt.
Insgesamt ergibt sich daraus der folgende Bewegungsablauf. Wenn die Energie , wie in Abbildung 7.2(a), größer als das absolute Maximum des Potenzial ist, dann läuft das Teilchen einmal von links
nach rechts oder von rechts nach links durch, ohne jemals umzukehren. Seine Geschwindigkeit passt sich
dabei dem Verlauf des Potenzials an, das heißt das Teilchen wird abwechseln schneller und langsamer,
aber es hält nie an. Ist der erlaubte Bereich wie in Abbildung 7.2(b) nach unten beschränkt, so kehrt das
Teilchen dort, von rechts kommend, um, und läuft wieder nach rechts weg. Ist der zulässige Bereich wie
in Abbildung 7.2(c) ein endliches Intervall, so bleibt dem Teilchen schließlich nichts anderes übrig als
144
(d)
(a)
(b)
(c)
Abbildung 7.3: Verschiedene Spezialfälle, die bei der Diskussion der Bewegungsformen in einem Potenzial auftreten können.
zwischen den beiden Umkehrpunkten zu pendeln.
Je nach dem Wert von
und dem Verlauf der Potenzialfunktion 4 unterscheiden wir also verschiedene Bewegungsformen. Das Teilchen kann immer in eine Richtung laufen, einmal umkehren, oder
periodisch zwischen zwei Umkehrpunkten pendeln. Für verschiedene Werte von können sich dabei verschiedene Bewegungsformen ergeben. So ist zum Beispiel in Abbildung 7.2(b) auch eine Pendelbewegung
möglich, wenn wir die Energie etwas niedriger ansetzen, und in Abbildung 7.2(c) ist auch eine von links
einlaufendes und wieder nach links auslaufendes Teilchen möglich, wenn die Energie etwas höher ist.
Aus dem Graf der Potenzialfunktion 4 können wir also unmittelbar das qualitative Verhalten des
Teilchens ablesen, ohne die Bewegungsgleichung explizit lösen zu müssen. Wir müssen dazu nur seine
Energie
kennen, da sich abhängig von der Energie im allgemeinen verschiedene Bewegungsformen
ergeben.
Das Potenzial eines eindimensionalen Systems bestimmt die möglichen Bewegungsformen.
Die drei wichtigsten Bewegungsformen sind die in Abbildung 7.2 dargestellten. Es gibt aber noch gewisse
Grenz- und Sonderfälle, die in Abbildung 7.3 dargestellt sind und in den folgenden Aufgaben diskutiert
werden sollen.
Aufgabe 7.3 Es sei ein Potenzial 4 gegeben, das bei 4 4 ein Minimum hat, mit 4 ,
4 6
4 #
6 . Dann lässt sich des Potenzial in der Nähe des Minimums durch eine
und
quadratische Funktion approximieren,
4 4
4 7 " (7.9)
Man zeige, dass sich ein Teilchen, das in der Nähe dieser Potenzialmulde pendelt, näherungsweise wie ein
harmonischer Oszillator verhält. Man bestimme die Eigenfrequenz dieses Oszillators.
Aufgabe 7.4 Das Potential in Abbildung 7.3(a) hat ein lokales Maximum an der Stelle 4 4 . Es sei
4 . Es soll gezeigt werden, dass das Teilchen in diesem Fall keine Pendelbewegung
ausführt, und auch nicht über den Punkt 4 hinaus läuft, was ja erlaubt wäre, sondern dass es sich für
&
der Stelle 4 asymptotisch nähert und dort für immer liegen bleibt. Man stelle dazu das Potenzial
4 näherungsweise durch eine quadratische Funktion dar,
für 4
4 "
4
4 7 "
145
mit
"
4 6 (7.10)
und löse die Bewegungsgleichung (7.8) in der Nähe dieser Stelle für ein Teilchen, das sich von links nähert,
6 . Man zeige, dass die Geschwindigkeit des Teilchens exponentiell gegen Null
also für 4 =4 und 4
geht und bestimme die Relaxationszeit, also diejenige Zeit, in der die Geschwindigkeit um den Faktor 0
noch möglich?
abfällt. Welche Bewegungsformen sind für einem Grenzwert
Aufgabe 7.5 In Abbildung 7.3(b) ist ein Potenzial dargestellt, das sich f ür 4 6 eine Konstante ist und
von unten nähert. Für große 4 gelte 4 " 4 , wobei
4 6
der Exponent
bestimmt, wie schnell sich das Potenzial dem Grenzwert n ähert. Welcher qualitative
, bzw.
zu erwarten? Wie sieht im Fall die
Bewegungsablauf ist für
aus?
Funktion 4 für &
4 in zwei getrennten
Aufgabe 7.6 In Abbildung 7.3(c) ist der Fall dargestellt, dass die Bedingung
Intervallen erfüllt ist. Wie sieht in diesem Fall die Bewegung des Teilchen aus? Welche Bewegungsformen
sind in dem dargestellten Potenzial noch möglich?
Aufgabe 7.7 Für ein mathematisches Pendel der Länge im Schwerefeld hatten wir die Bewegungsgleichungen (5.45) hergeleitet. Wir betrachten den einfachen Fall, dass das Pendel nur in einer Ebene
schwingt, also konst ist. Die Bewegungsgleichung lautet dann
! (7.11)
! 7 betrachtet werden kann. Die Gleichung ist so geschrieben,
wobei ! als periodische Koordinate !
dass auf beiden Seite eine Größe der Dimension Kraft steht. Man bestimme das Potenzial ! , skizziere
es und beschreibe die möglichen Bewegungsformen, einschließlich der Grenzfälle.
Aufgabe 7.8 Das Potential 4 wurde durch das Kraftgesetz 4 nur bis auf eine additive Konstante
festgelegt. Warum hängen die möglichen Bewegungsformen eines Teilchens nicht davon ab, wie wir diese
Konstante wählen? Mit anderen Worten, warum unterscheiden sich die möglichen Bewegungsformen in
4 ?
einem Potenzial 4 nicht von denen in einem Potenzial 4 Integration der Bewegungsgleichung
Nachdem wir das qualitative Verhalten der Bewegung aus dem Verlauf der Potenzialfunktion abgelesen
haben, können wir versuchen, die Bewegungsgleichung explizit zu lösen. Wir gehen dabei von der Differenzialgleichung (7.8) aus,
4 &
7
4 "
(7.12)
Da wir hier das Vorzeichen festlegen müssen, betrachten wir immer nur ein Teilstück der Bewegung, bei
der das Teilchen sich in eine Richtung bewegt. Im Falle einer Pendelbewegung ist dies das Teilstück zwischen zwei Umkehrpunkten. Aus der allgemeinen Diskussion der möglichen Bewegungsformen wissen
wir, wie wir den Bewegungsablauf in solche Teilstücke zerlegen können. Es genügt daher, die Bewegungsgleichung stückweise zu lösen und die Lösungen entsprechend zusammenzusetzen. Der Einfachheit
halber betrachten wir hier zunächst eine Bewegung nach rechts, wählen also das positive Vorzeichen.
Um die Differenzialgleichung (7.12) zu lösen, benutzen wir die Methode der Separation der Variablen,
die wir bereits aus Kapitel 4 kennen. Wir schreiben die Bewegungsgleichung wie folgt um,
7
4 "
146
4 (7.13)
und integrieren anschließend beide Seiten über ein Zeitintervall von
7
4 4
"
bis ,
(7.14)
Das Integral auf der linken Seite können wir sofort ausrechnen. Auf der rechten Seite führen wir eine
Substitution durch, indem wir die Integrationsvariable durch 4 ersetzen,
7
"
4
"
4 (7.15)
Hier haben wir 4 4 und 4 4 gesetzt. Das sind die Orte, an denen sich das Teilchen zu
Beginn und am Ende des Zeitintervalls befindet, über das wir integriert haben.
Das Integral (7.15) liefert die Zeit " , die das Teilchen benötigt, um von 4 nach 4 zu gelangen.
Damit es wohldefiniert ist, muss offenbar
4 sein, und zwar im gesamten Integrationsintervall
4 4 4 . An den Rändern des Intervalls können wir
4 zulassen, solange das Integral dann
noch konvergiert. Das ist genau die Bedingung, die sich aus der allgemeinen Diskussion der möglichen
Bewegungsformen ergibt. Das Teilchen kann genau dann von 4 nach 4 gelangen, wenn beide Orte innerhalb des erlaubten Bereiches liegen, der in den Abbildungen 7.1 und (7.2) dargestellt sind.
Im Prinzip haben wir damit die Bewegungsgleichung gelöst, jedenfalls für einen Bahnabschnitt, in dem
sich das Teilchen von links nach rechts bewegt. Nehmen wir an, wir geben als Anfangsbedingung 4 4 und 4 ( 6 vor. Dann können wir daraus die Energie berechnen, die wir in (7.15) einsetzen
müssen. Sie ist durch den Ausdruck (7.6) gegeben, ausgewertet für . Wenn wir dann noch in (7.15)
4 4 und setzen und für 4 und einfach 4 und schreiben, so ergibt sich eine Beziehung
zwischen und 4 , nämlich
7
"
&
4
"
4 (7.16)
Wenn es uns gelingt, diese Gleichung nach 4 aufzulösen, dann haben wir die entsprechende Lösung 4 der Bewegungsgleichungen gefunden. Sie erfüllt die Anfangsbedingungen 4 & 4 und 4 6 ( .
Auf diese Weise können wir für jeden einzelnen Bahnabschnitt jeweils eine Lösung der Bewegungsgleichung finden. Das ist weniger kompliziert, als es zunächst den Anschein hat. Bewegt sich das Teilchen im
nächsten Bahnabschnitt von rechts nach links, so müssen wir nur das Vorzeichen der Wurzel umdrehen.
Außerdem ist die Energie für jeden Bahnabschnitt dieselbe. Daher müssen wir letztlich nur einmal das
Integral (7.15) ausrechnen. Wir müssen nur jeweils die Anfangsbedingungen anpassen, um die Bahnabschnitte anschließend richtig zusammenzusetzen. Wie das geht, werden wir gleich an ein paar einfachen
Beispielen demonstrieren.
Aufgabe 7.9 Das Potenzial 4 war durch das Kraftgesetz 4 nur bis auf eine additive Konstante
festgelegt. Warum ist der durch (7.15) hergestellte Zusammenhang zwischen und 4 unabhängig von
dieser Konstante?
Zwei einfache Beispiele
Wir wollen das Verfahren an zwei sehr einfachen Beispielen erläutern. Zuerst betrachten wir ein freies
Teilchen. In diesem Fall lautet die Bewegungsgleichung 4 6 . Es ist also 4 6 und wir können
6 gelten. Der Fall 6 ist uninteressant, denn
auch 4 6 setzen. Für die Energie muss dann
6 liegt der Fall aus Abbildung 7.2(a) vor, das
dann ruht das Teilchen einfach an irgendeinem Ort. Für
147
heißt das Teilchen bewegt sich für alle Zeiten in eine Richtung. Dies sei der Einfachheit halber wieder die
positive Richtung. Aus (7.15) ergibt sich in diesem Fall
7
&
"
4
"
4
4 4
" 4 7
"
(7.17)
6 seine konstante Geschwindigkeit ist. Die
Tatsächlich gilt für ein freies Teilchen ( 7 , wenn (
Beziehung (7.17) lautet also, einfacher ausgedrückt, 4 " 4 ( " . Und das ist natürlich genau
das erwartete Ergebnis. Bewegt sich das Teilchen nach links, so müssen wir in (7.17) nur das Vorzeichen
6 ist.
umdrehen. Auch dann gilt wieder 4 " 4 ( " , wobei jetzt ( =
Das freie Teilchen ist natürlich ein sehr einfaches Beispiel, da es nur ganz einfache Bewegungsformen
gibt. Das Teilchen kann entweder für immer nach rechts oder für immer nach links laufen, oder für immer
ruhen. Es gibt keine Umkehrpunkte, so dass wir die Bahn nicht stückweise berechnen müssen.
Als weniger triviales Beispiel wollen wir die Bewegung in einem konstanten Kraftfeld betrachten, zum
Beispiel im Schwerefeld der Erde. Es gilt dann
" $
7
mit
(7.18)
Eine konstante Kraft ist durch ein linear ansteigendes Potenzial gekennzeichnet. Da es nicht nach unten
beschränkt ist, kann die Energie jeden beliebigen Wert annehmen. Jedoch ist der erlaubte Bereich der
Ortskoordinate stets nach oben begrenzt. Ein Teilchen mit der Energie erreicht maximal eine Höhe
Bewegungsform. Das Teilchen nähert sich von unten, erreicht
. Es gibt nur eine mögliche
zu einer Zeit eine maximale Höhe , und fällt anschließend wieder herab.
6 und
Betrachten wir zuerst den Abschnitt , in dem das Teilchen nach oben steigt. Dann ist es gilt laut (7.15)
7
"
"
Das Integral, das wir berechnen müssen, ist
"
0
7 Der Einfachheit halber setzen wir
kehrpunkt. Außerdem schreiben wir für
zu
"
"
"
7 "
(7.19)
(7.20)
und somit , das heißt wir integrieren bis zum Umund einfach und . Dann vereinfacht sich das Ergebnis
7
Aufgelöst nach ergibt sich daraus
"
"
"
7 "
(7.21)
(7.22)
also die übliche Darstellung einer gleichmäßig beschleunigten Bewegung. Sie gilt zunächst nur für ,
da wir nur für diesen Bahnabschnitt die Bewegungsgleichung gelöst haben.
Für
, also für den Bahnabschnitt nach6 dem Umkehrpunkt, ergibt sich in (7.21) das umgekehrte Vorzeichen der Wurzel. Denn nun ist , das heißt wir müssen beim Auflösen der Definition der
Energie nach der Geschwindigkeit das umgekehrte Vorzeichen der Wurzel wählen. Es ergibt sich jedoch
148
dieselbe Funktion (7.22), da wir zum Auflösen der Gleichung nach diese quadrieren müssen. Außerdem müssen wir beim Zusammensetzen der beiden Bahnabschnitte dieselben Parameter und wählen.
Diese Parameter übernehmen hier die Rolle der Anfangsbedingungen. Wir erinnern uns, dass wir stets
zwei Anfangsbedingung stellen müssen, also zwei Integrationskonstanten festlegen müssen, um eine eindeutige Lösung der Bewegungsgleichung zu bekommen. Eine dieser Integrationskonstanten ist bei dem
hier entwickelten Verfahren die Energie . In den gerade diskutierten speziellen Fall entspricht das dem
Festlegen der maximalen Steighöhe , die zur Energie in einer einfachen Beziehung steht.
Als zweite Integrationskonstante können wir stets eine Zeit wählen, zum Beispiel die Zeit, in der das
Teilchen einen bestimmten Umkehrpunkt der Bahn erreicht, oder zu der es einen bestimmten Ort passiert.
Das bietet sich deshalb an, weil wir dazu nur eine der beiden Integrationsgrenzen entsprechend festlegen
müssen. Oft hängt es aber auch von der jeweilige Fragestellung ab, welche Integrationsgrenzen man am
besten wählt und wie die Lösungen an die gestellten Anfangsbedingungen anzupassen sind.
Aufgabe 7.10 Eine sehr typische Fragestellung ist die folgende. Es sei ein Potential 4 mit einer Mulde
gegeben, in der das Teilchen schwingen kann. Man bestimme die Schwingungsperiode in Abh ängigkeit
von der Energie . Man zeige, dass diese durch das Integral
;
&
7
4
(7.23)
4 "
gegeben ist, wobei für 4 und 4 die Umkehrpunkte einzusetzen sind, die sich aus
ergeben.
4 4 Aufgabe 7.11 Vom harmonischen Oszillator wissen wir, dass seine Schwingungsperiode immer gleich,
also insbesondere unabhängig von der Energie ist. Es soll gezeigt werden, dass der harmonische Oszil2" 4 ,
lator das einzige derartige System ist. Wir betrachten dazu ein symmetrisches Potenzial 4 4 6
4 6
4
6
4
6
das nach beiden Seiten hin monoton ansteigt, für
und für
. Man zeige,
dass die in (7.23) definierte Funktion ; genau dann konstant ist, wenn 4 4 ist.
Konservative Kraftfelder
Mit der gerade entwickelten Methode ist es offenbar möglich, jede Bewegungsgleichung eines mechanischen Systems mit einem Freiheitsgrad zu lösen, sofern die Kraft allein vom Ort abhängt. Wir müssen dazu
nur die Bahn in Teilstücke zerlegen, ein bestimmtes Integral berechnen und eine einfache reelle Gleichung
lösen. Natürlich wird es im allgemeinen nicht wie in den gerade gezeigten einfachen Beispielen gelingen,
die Lösung 4 durch elementare Funktionen auszudrücken. Aber das ist nicht entscheidend.
Es spielt letztlich für eine konkrete physikalische Fragestellung keine Rolle, ob die Lösung einer Bewegungsgleichung explizit durch Funktionen wie , 1! , ! etc. ausgedrückt werden kann oder implizit
durch ein bestimmtes Integral definiert wird. Letztlich sind ja auch die elementaren Funktionen implizit
durch ihre mathematischen Eigenschaften definiert, und es ist eine willkürliche Entscheidung, welchen
solchen Funktionen man einen speziellen Namen gibt und welchen nicht. Wir können daher das Problem,
die Bewegungen eines eindimensionalen mechanischen Systems zu beschreiben, durch das Integral (7.15)
als gelöst betrachten.
Es stellt sich nun die Frage, ob eine ähnliche Methode auch auf mehrdimensionale Systeme anwendbar
ist. Betrachten wir ein frei bewegliches Teilchen in einem Kraftfeld, das nur vom Ort abhängt,
149
(7.24)
Unter gewissen Bedingungen gibt es auch für dieses System eine Erhaltungsgröße , nach der wir die
Lösungen klassifizieren können. Um sie zu finden, wiederholen wir den entscheidenden Schritt aus dem
ersten Abschnitt. Wir multiplizieren die Bewegungsgleichung mit der Geschwindigkeit. Da es sich nun
um eine Vektorgleichung handelt, müssen wir jetzt das Skalarprodukt bilden,
+: :
(7.25)
Definieren wir analog zu einem Teilchen mit nur einem Freiheitsgrad die kinetische Energie als halbe
Masse mal Geschwindigkeit zum Quadrat, so ergibt sich
7
:
, (7.26)
Die Änderung der kinetischen Energie, also die pro Zeit vom Kraftfeld geleistete Arbeit, ist durch das
Skalarprodukt von Kraft und Geschwindigkeit gegeben. Man bezeichnet diese Größe auch als die Leistung
des Kraftfeldes.
Im Falle eines Systems mit einem Freiheitsgrad konnten wir die Leistung durch die Zeitableitung eines
Potenzials ausdrücken, und daraus ergab sich die Gesamtenergie als Erhaltungsgröße. Hier ist das nicht
mehr ohne weiteres möglich. Wenn das Kraftfeld von einer speziellen Art ist, gibt es aber auch hier ein
Potenzial und damit eine erhaltene Energie.
Um herauszufinden, wann das der Fall ist, führen wir ein kartesisches Koordinatensystem ein und zerlegen sowohl den Ortsvektor und die Geschwindigkeit,
(7.27)
als auch das Kraftfeld in Komponenten,
&
Man beachte, dass jede Kraftkomponente
stung lässt sich dann wie folgt schreiben,
:
(7.28)
eine Funktion der
dann ist
"
und somit ergibt sich aus (7.25)
:
7
"
& "
150
"
6 ist. Die Lei-
(7.29)
(7.30)
Daraus können wir folgenden Schluss ziehen. Wenn sich die Komponenten des Kraftfeldes
elle Ableitungen einer skalaren Funktion schreiben lassen,
. Ist der Ortsvektor
nach der Zeit
jeweils eine Funktion von drei Koordinaten Nun betrachten wir eine skalare Funktion
Zeit, so gilt für die Ableitung der Funktion
als parti-
(7.31)
(7.32)
(7.33)
Lässt sich ein Kraftfeld in dieser Art und Weise durch ein Potenzial darstellen, so existiert eine
Erhaltungsgröße, die Energie , die sich analog zu (7.6) aus einem kinetischen und einem potenziellen
Anteil zusammensetzt,
7 (7.34)
Ein Kraftfeld, für das ein solches Potenzial existiert, heißt konservatives Kraftfeld. Die Bezeichnung soll
andeuten, dass in einem konservativen Kraftfeld die Energie erhalten, also “konserviert” ist. Wie im eindimensionalen Fall wird während der Bewegung des Teilchens Arbeit verrichtet, also fortwährend kinetische
in potentielle Energie verwandelt und umgekehrt.
In einem konservativen Kraftfeld ist die Energie eine Erhaltungsgröße
Befindet sich das Teilchen an einem Ort und hat es eine Energie , so können wir aus der Differenz
zwischen und den Betrag der Geschwindigkeit bestimmen. Allerdings wissen wir dadurch noch
nichts über die Richtung, in die sich das Teilchen bewegt, und anders als im eindimensionalen Fall gibt es
nicht nur zwei mögliche Bewegungsrichtungen. Daher führt die Energieerhaltung nicht wie im eindimensionalen Fall unmittelbar auf eine Lösung der Bewegungsgleichung.
Viele der Schlussfolgerungen, die wir für eindimensionale System hergeleitet haben, lassen sich aber
übertragen. So ergibt sich zum Beispiel aus der Tatsache, dass die kinetische Energie immer positiv ist, eine
Einschränkung an die Bewegungsfreiheit eines Teilchens. Hat ein Teilchen die Energie , so kann es sich
ist. Handelt es sich dabei zum Beispiel um eine beschränkte
nur an Orten aufhalten, an denen , Teilmenge des Euklidischen Raumes, so können wir daraus schließen, dass das Teilchen gebunden ist, also
nicht ins Unendliche entkommen kann.
Oft lassen sich weitere Erhaltungsgrößen finden, etwa der Drehimpuls in einem Zentralkraftfeld, mit
deren Hilfe sich die Bewegungengleichungen dann vollständig lösen lassen, so wie im gerade diskutieren
eindimensionalen Systemen. Ein wichtiges Beispiel dafür werden wir im Kapitel 8 ausführlich diskutieren.
Mit Hilfe der Energie- und Drehimpulserhaltung ist es nämlich möglich, die Bewegungsgleichung für ein
Teilchen im Gravitationsfeld eines anderen Teilchens vollständig zu lösen. Wir können also alle möglichen
Planetenbahnen im Kraftfeld der Sonne angeben. Zuvor werden wir jedoch noch ein paar grundsätzliche
Eigenschaften von Kraftfeldern diskutieren.
Aufgabe 7.12 Man zeige, dass für das lineare Kraftgesetz
bestimme es.
, ?
" ein Potenzial
, existiert und
Aufgabe 7.13 Auch das Newtonsche Gravitationsgesetz ist konservativ. Wir betrachten das Kraftfeld, das
von einem ortsfesten Teilchen der Masse
erzeugt wird, und in dem sich ein Teilchen der Masse bewegt. Es gilt dann
"
(7.35)
Man zeige, dass dieses Kraftgesetz aus dem Potenzial
0
"
(7.36)
abgeleitet werden kann.
Gradient, Divergenz und Rotation
Wir wollen der Frage nachgehen, wann ein gegebenes Kraftfeld konservativ ist und wann nicht. Mit anderen Worten, welche Eigenschaften muss ein Kraftfeld haben, damit es sich in der Form (7.31) als
“Ableitung” eines Potenzials darstellen lässt?
151
Bevor wir uns konkret dieser sehr speziellen Frage zuwenden, führen wir ein paar allgemeine Begriffe
ein, die mit Ableitungen von Feldern im Raum zu tun haben. Unter einem Feld verstehen wir eine Ab bildung, deren Definitionsbereich der Euklidische Raum
ist. Ein skalares Feld ist eine Abbildung des
Raumes in die reellen Zahlen,
skalares Feld
(7.37)
Ein Vektorfeld ist entsprechend eine Abbildung des Euklidischen Raumes
in den zugeordneten Vektor
raum . Es ordnet jedem Punkt einen Vektor zu, den wir bezüglich einer beliebigen Orthonormalbasis
, in seine Komponenten zerlegen können,
Vektorfeld
% (7.38)
Benutzen wir dieselbe Orthonormalbasis verwenden, um auch den Ortsvektor in seine Komponenten
zu zerlegen, so können wir jedes Feld als Funktion der drei Koordinaten darstellen,
, &
2 (7.39)
Dabei handelt es sich um gewöhnliche reelle Funktionen von jeweils drei Variablen. Wenn diese Funktionen differenzierbar sind, können wir ihre partiellen Ableitungen bilden. Wir schreiben dafür
(7.40)
das heißt das Symbol bezeichnet die partielle Ableitung einer Funktion nach der Koordinate .
Betrachten wir nun speziell ein skalares Feld und seine partiellen Ableitungen . Diese lassen
sich zu einem Vektorfeld zusammenfassen, das wir mit
&
Gradient
, (7.41)
bezeichnen. Dieses Vektorfeld heißt Gradient von und wird oft auch mit bezeichnet.
Der Gradient ist in gewissem Sinne die räumliche Verallgemeinerung der gewöhnlichen Ableitung einer
Funktion von einer reellen Variablen. Da es im Raum drei Koordinaten gibt, hängt eine reelle Funktion auf
dem Raum von drei Variablen ab. Folglich hat sie drei partielle Ableitungen, das heißt ihre Ableitung hat
drei Komponenten, die man zu einem Vektor zusammenfassen kann.
Das Symbol , mit dem man diese Ableitung bezeichnet, heißt Nabla. Das Wort leitet sich von der
hebräischen Bezeichnung für ein antikes Saiteninstrument ab, das in etwa die Form dieses Zeichens hatte.
Manchmal wird fälschlicherweise behauptet, es handele sich um einen althebräischen Buchstaben. Das
Zeichen als solches wurde aber erst in der modernen Mathematik “erfunden”. Es soll ein auf den Kopf
gestelltes Delta darstellen.
Es ist nützlich, sich das Symbol als einen Differenzialoperator vorzustellen. Wenn er auf eine skalare
Funktion “wirkt”, erzeugt er den Gradienten
dieser Funktion. Wir schreiben dafür auch formal
Nabla
(7.42)
wobei wir uns vorstellen, dass die Ableitungen jeweils auf eine rechts von dem Operator stehende
Funktion wirken, so wie in (7.41).
Der Vektorpfeil über dem Symbol deutet an, dass sich dieser Differenzialoperator ansonsten wie ein
Vektor verhält. In (7.41) wird dieser Vektor mit dem Skalar multipliziert, so dass das Ergebnis wieder
152
ein Vektor ist. Der Operator
kann aber auch auf Vektorfelder wirken. Zum Beispiel können wir das
Skalarprodukt von mit einem Vektorfeld bilden,
:
Divergenz
& : , (7.43)
Das Ergebnis ist ein skalares Feld, das durch Summation aus den partiellen Ableitungen (7.40) der Komponenten des Vektorfeldes gebildet wird. Es wird auch Divergenz des Vektorfeldes genannt und
mit , bezeichnet.
Wenn wir statt des Skalarproduktes das Kreuzprodukt des Operators
mit einem Vektorfeld bilden, so ist das Ergebnis wieder ein Vektorfeld,
Rotation
& ,
&
, (7.44)
Dieses Vektorfeld wird auch als Rotation von bezeichnet, und man verwendet dafür die Schreibweise
! .
Wir können also mit Hilfe des Operators
auf drei verschiedene Arten räumliche Ableitungen von
Skalar- bzw. Vektorfeldern bilden. Diese entsprechen formal den drei Möglichkeiten, Skalare bzw. Vektoren zu multiplizieren. Der Gradient entspricht der skalaren Multiplikation und bildet ein skalares Feld
auf ein Vektorfeld ab. Die Divergenz entspricht dem Skalarprodukt und bildet ein Vektorfeld auf ein skalares Feld ab. Die Rotation ergibt sich aus dem Kreuzprodukt und bildet ein Vektorfeld wieder auf ein
Vektorfeld ab.
Aufgabe 7.14 Man bestimme den Gradienten den folgenden skalaren Felder,
& 5: &
Die Vektoren sind Konstanten, die Funktion che Bedingung muss im letzten Beispiel erfüllen, damit
(7.45)
ist stetig und differenzierbar. Welche zus ätzli an der Stelle ! wohldefiniert ist?
Aufgabe 7.15 Man bestimme die Divergenz und die Rotation der folgenden Vektorfelder,
, % <: (7.46)
Die Vektoren sind Konstanten, die Funktion . ist stetig und differenzierbar. Welche zus ätz: an der Stelle ! wohldefiniert
liche Bedingung muss im letzten Beispiel erfüllen, damit
ist?
Aufgabe 7.16 Es sei ein beliebiges skalares Feld. Dann ist ein Vektorfeld und folglich
! ebenfalls ein Vektorfeld. Man zeige, dass dieses Vektorfeld gleich Null ist.
Aufgabe 7.17 Gibt es ein nicht verschwindendes Vektorfeld mit !
Konstante ist?
, wobei eine vorgegebene
Aufgabe 7.18 Für den Ableitungsoperator gelten verschiedene Produktregeln. Man drücke die folgenden Ableitungen jeweils durch die Ableitungen, also den Gradienten, die Rotation bzw. die Divergenz der
einzelnen Felder aus,
:
: : 153
.
. (7.47)
Aufgabe 7.19 Wie führen einen weiteren Differentialoperator ein, der sowohl auf skalare als auch auf
Vektorfelder wirken kann. Es ist ein skalarer Operator . Er bildet die zweiten Ableitungen nach den
Koordinaten und summiert über diese,
(7.48)
und für ein Vektorfeld die folgenden Identitäten gelten,
Man zeige, dass für ein skalares Feld
:
" ! !
(7.49)
Richtungsableitung und Wegintegral
Es stellt sich nun die Frage, ob es für diese Ableitungen von Feldern auch jeweils eine anschauliche geo
metrische Interpretation gibt, etwa so wie die Ableitung 4 einer gewöhnlichen reellen Funktion 4 als Steigung interpretiert werden kann. Außerdem können wir uns fragen, ob sich die Ableitungsoperationen umkehren lassen. Mit anderen Worten, gibt es so etwas wie eine Stammfunktion eines Vektorfeldes
bzw. eines skalaren Feldes?
Tatsächlich ist der Gradient so etwas wie die Steigung eines skalaren Feldes. Jedoch hängt die Steigung
eines Feldes davon an, in welche Richtung man sich im Raum bewegt. Es sei irgendein Ort und
ein Vektor, der eine Richtung definiert. Das kann, muss aber kein Einheitsvektor sein. Dann können wir
folgende Frage stellen. Wie stark steigt ein skalares Feld an, wenn wir uns an der Stelle in Richtung
des Vektors bewegen?
Die Antwort auf diese Frage gibt die Richtungsableitung des Feldes an der Stelle in Richtung des
Vektors . Sie ist wie folgt definiert,
?
?
"
(7.50)
Wie man leicht mit Hilfe der Kettenregel zeigt, kann man die Richtungsableitung durch den Gradienten
von an der Stelle ausdrücken,
:
(7.51)
Die Richtungsableitung eines skalaren Feldes in Richtung eines Vektors wird durch den Differenzialoperator :
gebildet.
Wenn ein Einheitsvektor ist, so ist die Richtungsableitung die orthogonale Projektion von
, auf
. Diese Projektion ist dann maximal, wenn in die gleiche Richtung zeigt wie
, . Daraus ergibt sich
die folgende geometrisch anschauliche Interpretation des Gradienten. Der Vektor
zeigt in diejenige
Richtung, in die das Feld an der Stelle am stärksten ansteigt. Der Betrag dieses Vektors gibt an, wie
stark dieser Anstieg ist.
Aufgabe 7.20 Die Niveauflächen eines skalaren Feldes sind die Flächen mit ; konst. Im allge, stets
meinen liegt jeder Punkt auf genau einer solchen Niveaufläche. Man zeige, dass der Vektor
senkrecht auf der durch verlaufenden Niveaufläche steht.
die Steigung des skalaren Feldes ist, lässt sich dann das Feld , aus bis auf
Wenn
eine Konstante rekonstruieren, so wie man eine reelle Funktion 4 aus ihrer Ableitung 4 rekonstruieren kann? Mit anderen Worten, kann man ein Vektorfeld irgendwie integrieren, um wieder ein skalares
Feld zu erhalten?
In Abbildung 7.4(a) ist die Definition einer speziellen Art von Integration im Raum dargestellt. Wir
wollen zeigen, dass diese Integration im wesentlichen die Umkehrung des Gradienten ist. Sie wird wie
154
replacements
(c)
(d)
(b)
(a)
Abbildung 7.4: Um das Wegintegral eines Vektorfeldes
zu berechnen, zerlegt man den Weg und
infinitesimale Teilstücke, dargestellt durch Vektoren . Dann bildet man jeweils das Skalarprodukt dieser
Vektoren mit dem Vektorfeld und summiert über alle Teilstücke (a). Integriert man den Gradienten eines
skalaren Feldes entlang eines Weges, so erhält man die Differenz der Werte des Feldes am Anfangsund Endpunkt (b).
folgt ausgeführt. Gegeben sei eine Kurve im Raum, die wir mit bezeichnen. Sie verbindet zwei Punkte
. Ferner sei ein
und , und sie wird durch eine Ortsvektordarstellung beschrieben, mit Vektorfeld gegeben.
Wir definieren dann das Wegintegral des Feldes entlang der Kurve wie folgt. Zuerst zerlegen wir
zerschneiden. Die
die Kurve in Teilstücke, indem wir sie an den Stellen , , , ,
Ortsvektoren dieser Schnittstellen bezeichnen wir mit
. Jedem Teilstück ordnen wir außerdem
einen Vektor zu,
" 6 33 " 0 (7.52)
Anschließend bilden wir für jedes Teilstück das Skalarprodukt dieses Vektors mit dem Wert des Feldes
am Anfang des Teilstückes. Das Ergebnis
:
(7.53)
ist die in Abbildung 7.4(a) dargestellte orthogonale Projektion von auf das Kurvenstück
, multipliziert mit dessen Länge.
Schließlich summieren wir über die einzelnen Kurvenstücke und bilden den Grenzwert, in dem die
Anzahl der Kurvenelemente gegen Unendlich und deren Länge gegen Null geht. Das Ergebnis nennen wir
das Wegintegral des Vektorfeldes entlang der Kurve und schreiben dafür
Wegintegral
& :
: (7.54)
Diese Definition des Wegintegrals ist ganz analog zur üblichen Definition eines Integrals auf der reellen
Achse zu verstehen. Um eine Funktion 4 über ein Intervall von bis zu integrieren, zerlegen wir das
zerschneiden, und
Intervall in Teilintervalle, indem wir es an der Stellen 4 , 4 , , 4 , 4
bilden den Grenzwert der Summe
4
4 4
4 155
mit
4
4
4 " (7.55)
Wie man sich leicht überlegt,
ist das Wegintegral unabhängig davon, wie man die Kurve in kleine Stücke
zerlegt, sofern die Kurve und das Vektorfeld hinreichend glatt ist, genau wie das gewöhnliche reelle
Integral unabhängig von der Art der Zerlegung ist. Insbesondere hängt das Wegintegral nicht davon ab,
wie die Kurve als Funktion des Parameters dargestellt wird.
Um das formal zu beweisen, ist es nützlich, eine etwas einfacher zu handhabende Darstellung des Wegintegrals anzugeben als die Summendarstellung. Man kann das Wegintegral auf ein gewöhnliches reelles
Integral zurückführen. Für kleine Kurvenstücke gilt
"
"
(7.56)
und folglich
& :
&
:
: (7.57)
Wir können das Wegintegral berechnen, indem wir den Tangentenvektor der Kurve mit dem Vektorfeld
multiplizieren, und anschließend ein gewöhnliches reelles Integral ausführen.
Aufgabe 7.21 Man beweise durch eine einfache Substitution, dass das so definierte Wegintegral un
abhängig davon ist, wie man den Weg parametrisiert. Das Wegintegral h ängt also nur vom Weg
und vom Vektorfeld ab, nicht jedoch von der speziellen Wahl der Funktion .
Es ist jetzt nur noch ein kleiner Schritt, zu beweisen, dass das Bilden des Wegintegrals so etwas ist wie die
, gegeben und ein beliebiger Weg ,
Umkehrung des Gradienten. Dazu sei ein Vektorfeld , der die Punkte und miteinander verbindet, so wie in Abbildung 7.4(b) dargestellt. Für das Wegintegral
gilt dann
& :
:
(7.58)
Nun ist der Integrand aber nichts anderes als die Richtungsableitung des Feldes
tenvektors, also entlang der Kurve,
:
&
in Richtung des Tangen-
(7.59)
und folglich können wir das Integral (7.58) ausführen,
:
&
"
(7.60)
oder mit den Bezeichnungen wie in Abbildung 7.4(b),
Wegintegralsatz
:
"
(7.61)
Dies ist gewissermaßen die erste Version des Hauptsatzes der Integral- und Differenzialrechnung, angewandt auf Felder im Raum.
Das Wegintegral eines Gradienten entlang eines Weges ist die Differenz der Funktionswerte des skalaren Feldes an den Enden des Weges.
156
Zwei andere Versionen davon werden wir gleich noch kennen lernen.
Wir haben zwar damit die Frage, wann ein gegebenes Kraftfeld konservativ ist und wann nicht, noch
nicht beantwortet. Aber wir sind schon einen kleinen Schritt weiter, denn wir wissen jetzt, wie wir konkret
das Potential berechnen können, sobald wir wissen, dass ein Kraftfeld konservativ ist. Wir müssen dazu
nur ein geeignetes Wegintegral ausführen, also das Kraftfeld entlang eines bestimmten Weges integrieren.
Aufgabe 7.22 Es seien die folgenden Vektorfelder gegeben,
3 &
7
& " (7.62)
Gesucht ist jeweils ein skalares Feld , mit und ! # 6 . Man bestimme durch
Berechnung eines Wegintegrals entlang einer geraden Strecke von ! nach und zeige anschließend, dass
gilt.
für das so definierte Feld tatsächlich , &
Aufgabe 7.23 Es soll gezeigt werden, dass das Vektorfeld
, &= (7.63)
wobei ein nicht verschwindender Vektor ist, nicht der Gradient eines skalaren Feldes ist. Man f ühre die
gegenteilige Annahme zu einem Widerspruch. Man bestimme dazu wie in Aufgabe 7.22 ein Feld , und
zeige anschließend, dass dieses Feld nicht die Eigenschaft &
hat.
Aufgabe 7.24 Wege
lassen sich zusammensetzen
und umkehren. Verbindet ein Weg die Punkte und
, und ein Weg
die Punkte
und , so ist derjenige Weg, der von zuerst entlang
nach
und anschließend entlang
nach führt. Der inverse Weg ist der in die umgekehrte Richtung
durchlaufene Weg . Man beweise
:
&
:
:
:
& "
:
(7.64)
Aufgabe 7.25 Ein geschlossener Weg ist ein Weg, dessen Anfangspunkt mit dem Endpunkt identisch ist.
Man beweise, dass ein Vektorfeld genau dann der Gradient eines skalaren Feldes ist, wenn jedes Wegintegral des Vektorfeldes entlang jedes geschlossenen Weges gleich Null ist.
Flächen- und Volumenintegrale
Wegintegrale lassen sich zu Flächen- und Volumenintegralen verallgemeinern. Wie können ein Vektorfeld
auch über eine Fläche integrieren, oder ein skalares Feld über ein Volumen. Anschließend werden wir zeigen, dass es sich dabei in einer gewissen Art und Weise um die Umkehrungen von Rotation und Divergenz
handelt, wobei der Zusammenhang allerdings nicht mehr ganz so einfach ist wie der zwischen Wegintegral
und Gradient.
darstellen können. Ihre
Betrachten wir zunächst eine Fläche, die wir als eine Abbildung Ortsvektordarstellung bezeichen wir wie üblich mit , )( , wobei und ( die Flächenkoordinaten sind.
Durch die Wahl dieser Koordinaten wird auch eine Orientierung der Fläche festgelegt. Die Oberseite der
Fläche ist diejenige Seite, zu der der Normalenvektor zeigt. Wir definieren ihn durch
, )( &
(
Aufgabe 7.26 Warum steht dieser Vektor auf der Fläche senkrecht?
157
(7.65)
(c)
(d)
(b)
(a)
Abbildung 7.5: Zur Definition des Flächenintegrals eines Vektorfeldes zerlegt man die Fläche in einzelne
Flächenelemente (a). Entsprechend kann man ein skalares Feld über ein Volumen integrieren, indem man
dies in Volumenelemente zerlegt (b).
Genau wie eine Kurve können wir eine Fläche in kleine Stücke zerlegen. In Abbildung 7.5(a) ist ein
solches Flächenelement dargestellt. Die Ecken dieses Flächenelementes befindet sich an den Stellen , )( ,
)( , ( ( und )( ( . Sind die Abmessungen und ( hinreichend klein, so hat
es die Form eines Parallelogramms, welches von den Vektoren
und (
(
(7.66)
aufgespannt wird. Wir können dem Flächenelement einen Vektor zuordnen, dessen Betrag den Flächeninhalt repräsentiert, und der in Richtung des Normalenvektors zeigt,
(
(
(
, ) ( (7.67)
Der Einfachheit halber stellen wir uns hier von Anfang an infinitesimal kleine Flächenelemente vor, über
die wie später summieren, also integrieren werden. Die Fläche sei also in unendlich viele solche Flächenelemente zerlegt.
Nun sei zusätzlich ein Vektorfeld gegeben. Werten wir das Vektorfeld auf den Fläche aus, so
können wir es als Funktion )( 1 , )( darstellen. Ist das Vektorfeld hinreichend glatt, so
können wir es innerhalb eines infinitesimalen Flächenelementes als konstant betrachten. Wie in Abbildung 7.5(a) zu sehen ist, spannt der Vektor , )( zusammen mit dem Flächenelement einen Spat auf.
Das Volumen dieses Spates ist
:
)( & ( (
: ) ( (7.68)
Dieses Volumen ist positiv, wenn der Vektor )( nach oben, also in Richtung des Normalenvektors der
Fläche zeigt. Es ist negativ, wenn der Vektor )( nach unten zeigt.
Das Flächenintegral des Vektorfeldes ist durch die Summation über alle diese infinitesimalen Spate
definiert. Wir schreiben dafür
Flächenintegral
: (
158
(
: , )( (7.69)
Die Integrationsgrenzen für und ( sind dabei so zu wählen, dass die Fläche, über die zu integrieren ist,
genau einmal abgedeckt wird.
Man kann sich leicht überlegen, dass dieses Flächenintegral unabhängig davon ist, wie man die Fläche in
Flächenelemente zerlegt. Insbesondere ist es dann auch unabhängig davon, wie man die Fläche durch eine Ortsvektordarstellung , )( parametrisiert. Eine formalen Beweis werden wir hier nicht durchführen.
Er folgt aber wie beim Wegintegral durch eine einfache Substitution.
Anschaulich ergibt sich die Unabhängigkeit des Flächenintegrals von der Parametrisierung der Fläche
wie folgt aus der Darstellung in Abbildung 7.5(a). Wir stellen uns dazu vor, dass das Vektorfeld den
Fluss irgendeines Mediums durch die Fläche hindurch beschreibt. Innerhalb eines kurzen Zeitintervalls
wird dabei das dargestellte Flächenelement um ein Stück verschoben. Das in diesem Zeitintervall durch das
Flächenelement hindurchgeströmte Volumen des Mediums ist gerade das Volumen so erzeugten Spates.
Summieren wir über alle Flächenelemente, so ergibt sich das Volumen des insgesamt in einem kleinen
Zeitintervall durch die Fläche hindurchgeströmten Mediums. Das ist natürlich unabhängig davon, wie wir
die Fläche in kleine Flächenelemente zerlegen.
Um sich eine anschauliche Vorstellung von einem Flächenintegral zu machen, sollte man sich daher das
Vektorfeld am besten als das Strömungsfeld eines Mediums vorstellen. Wir werden darauf später noch
näher eingehen, denn solche Strömungsfelder spielen zum Beispiel in der Elektrodynamik eine wichtige
Rolle.
Aufgabe 7.27 Als Fläche sei ein Kreis mit Radius
durch kartesische Koordinaten
+
) ( &
.(
in der 4 - -Ebene gegeben. Er kann wahlweise
-(
oder durch Polarkoordinaten
&
3! -
.
6
(7.70)
" (7.71)
dargestellt werden. Als Vektorfeld sei ? gegeben. Man berechne das Flächenintegral von
über den Kreis mit beiden Parameterdarstellungen und zeige, dass das Ergebnis dasselbe ist.
Schließlich wollen wir noch ein Volumenintegral definieren. Ein Volumen ist im Prinzip einfach eine
Teilmenge des euklidischen Raumes mit bestimmten Eigenschaften. Wir können ein Volumen
aber
auch analog zu einer Kurve oder einem Weg durch eine Parameterdarstellung beschreiben, also durch eine
, oder durch die entsprechende Ortsvektordarstellung , )(' , die einen Ort im
Abbildung Volumen durch drei Koordinaten , )(' spezifiziert.
Um ein Integral über ein solches Volumen zu definieren, zerlegen wir es wieder in unendlich viele
infinitesimale Volumenelemente. In Abbildung 7.5(b) ist ein typisches solches Volumenelement dargestellt. Seine acht Ecken befinden sich in den Punkten mit den Koordinaten , )(' , )(' , ,
)( (' . Für hinreichend kleine , ( und hat es die Form eines Spates, aufgespannt
von den Vektoren
( ( (7.72)
Folglich ist der Inhalt dieses Volumenelementes
( :
( (7.73)
Im Gegensatz zum Flächenelement ist dies kein Vektor, sondern eine skalare Größe. Um ein Integral
über ein Volumen auszuführen, müssen wir daher als Integrand auch ein skalares Feld einsetzen. Wir
definieren analog zu (7.69)
Volumenintegral
( 159
:
( ($
(7.74)
Auch hier sind wieder die Integrationsgrenzen für , ( und entsprechend anzupassen.
Anschaulich ist ein Volumenintegral nichts anderes als das, was wir uns unter einer gewöhnlichen In tegration im Euklidischen Raum
vorstellen. Wählen wir nämlich als Integrationsvariable kartesische
4 Koordinaten, setzen also
, so ist das Spatprodukt in (7.73) gleich Eins, und es gilt
4 , )('
(7.75)
Die allgemeinere Darstellung (7.74) hat jedoch den Vorteil, dass wir auch andere Darstellungen eines
Volumens verwenden können, um ein solches Integral zu berechnen. Ein Beispiel dafür liefert die folgende
Aufgabe.
Aufgabe 7.28 Es soll das Volumen einer Kugel mit Radius berechnet werden. Wir setzen dazu & 0
und berechnen das Volumenintegral über eine Kugel mit Mittelpunkt im Ursprung. Als Parameterdarstellung wählen wir einmal die Darstellung durch kartesische Koordinaten
4 $ & 4
4
(7.76)
und einmal die Darstellung in Kugelkoordinaten,
! &
3! - ! .
1! !
6 ! " !
6
(7.77)
Man zeige, dass das Volumenintegral (7.74) in beiden Darstellungen dasselbe Ergebnis, n ämlich liefert.
Der Satz von Stokes
Was haben nun Flächen- und Volumenintegrale mit Rotation und Divergenz von Vektorfeldern zu tun?
Tatsächlich gibt es hier ganz ähnliche Beziehungen wie zwischen Wegintegralen und dem Gradienten
eines skalaren Feldes.
Als erstes zeigen wir, dass es einen Zusammenhang zwischen Rotation und Flächenintegralen gibt. Dieser Zusammenhang ist in Abbildung 7.6 anschaulich dargestellt. Er wird uns auch etwas über die geometrische Interpretation der Rotation verraten. Wir betrachten ein Vektorfeld und dessen Rotation .
Ferner sei eine Fläche, von der wir der Einfachheit halber annehmen, dass sie, wie in Abbildung 7.6
gezeigt, nur einen Rand hat, also von einer geschlossenen Linie
begrenzt wird.
Wir schreiben dafür auch , das heißt die Kurve
ist
der
Rand der Fläche . Da eine Fläche
stets eine Orientierung hat, erhält auch die Randkurve eine Orientierung. Wir verwenden dafür wieder
die Rechte-Hand-Regel. Die Richtung der Randkurve zeigt gegen der Uhrzeigersinn, wenn wir von oben
auf die Fläche schauen. Das entspricht der Definition des Drehsinns einer Ebene in Abbildung 2.1.
Der Satz von Stokes macht nun folgende Aussage über das Flächenintegral einer Rotation,
Satz von
Stokes
: 1 &
& :
Oder in Worten ausgedrückt:
Das Flächenintegral der Rotation ! eines Vektorfeldes über eine Fläche
tegral des Vektorfeldes entlang des Randes
.
160
(7.78)
ist das Wegin-
replacements
(c)
(d)
(b)
(a)
Abbildung 7.6: Der Satz von Stokes besagt, dass das Flächenintegral (a) über die Rotation eines Vektorfeldes als Linienintegral (b) des Vektorfeldes selbst über den Rand der Fläche dargestellt werden kann.
Das Flächenintegral der Rotation eines Vektorfeldes lässt sich also auf ein Wegintegral des Vektorfeldes
selbst zurückführen. Das ist insofern analog zum Wegintegralsatz (7.61), da dieser eine ganz ähnliche
Aussage macht. Das Wegintegral des Gradienten eines skalaren Feldes lässt sich als “Integral” über den
Rand des Weges schreiben. Allerdings ist dieses “Integral” dort einfach nur eine Summe, da der Rand
eines Weges nur aus zwei Punkten besteht.
Um den Satz von Stokes zu beweisen, stellen wir die Fläche in einer speziellen Art und Weise dar.
Wir verwenden eine verallgemeinerte Version der Polarkoordinaten in einer Ebene, das heißt wir
wählen irgendeinen Punkt in der Fläche aus und bezeichnen ihn als Ursprung. An diesem Punkt soll 6
sein, das heißt 6 soll nicht von abhängen. Außerdem soll die Koordinaten eine Periode von 7 haben, und für 0 soll sich die Randkurve 0 &
ergeben.
Für das Flächenintegral gilt dann
: 1 &
:
1
(7.79)
Um das doppelte Kreuzprodukt auszurechnen, können wir die Formel (2.36) verwenden, oder wir benutzen
das -Symbol. Der Integrand lässt sich dann wie folgt umformen,
:
1 " 1 1 " % 1 2 " 1 " 21 &
161
(7.80)
Dabei haben wir in den beiden letzten Schritten die Ketten- ud Produktregel so verwendet, dass wir den
gesamten Ausdruck als Ableitung einer Funktion nach bzw. schreiben konnten.
Wenn wir diese beiden Ausdrücke in das doppelte Integral (7.79) einsetzen, können wir jeweils eines
der Integrale ausführen, und bekommen so insgesamt vier Randterme,
: 1 &
1 "
%1 (7.81)
Nun fallen aber drei dieser vier Terme weg. Da die Funktion in periodisch ist, ergibt sich im
hinteren Term an der Stelle " stets derselbe Wert wie an der Stelle . Also ist dieser Anteil
gleich Null. Beim ersten Ausdruck ergibt sich für 6 stets Null, denn 6 hängt ja nicht von ab,
gleich Null. Es bleibt also nur ein Term
das heißt an der Stelle 6 ist die partielle Ableitung
übrig, und das ist gerade das Wegintegral von entlang des Randes der Fläche,
: 1 :
1 :
(7.82)
mit 0 . Damit haben wir den Satz von Stokes bewiesen, jedenfalls für eine Fläche, die sich
auf diese spezielle Art parametrisieren lässt.
Aufgabe 7.29 Man finde Beispiele für Flächen, die sich nicht auf die gezeigte Art und Weise parametrisieren lassen und formuliere eine entsprechende Verallgemeinerung des Satzes von Stokes.
Mit Hilfe des Satzes von Stokes lässt sich nun unsere ursprüngliche Frage beantworten. Wann ist ein
gegebenes Kraftfeld konservativ? In Aufgabe 7.25 wurde bereits gezeigt, dass dies genau dann der
Fall ist, wenn das Wegintegral des Kraftfeldes entlang jedes geschlossenen Weges gleich Null ist. Im
Euklidischen Raum ist andererseits jeder geschlossener Weg der Rand irgendeiner Fläche.
Also ist das Wegintegral von entlang jedes geschlossenen Weges genau dann gleich Null, wenn das
Flächenintegral von
über jede Fläche gleich Null ist. Und das wiederum ist genau dann der Fall,
wenn identisch verschwindet. Also gilt die folgende einfache Aussage:
Ein Kraftfeld ist genau dann konservativ, wenn seine Rotation
verschwindet.
In Abbildung 7.7 ist noch einmal schematisch dargestellt, wie man für ein konservatives Kraftfeld das
Potential bestimmen kann. Die Abbildung 7.7(a) zeigt ein konservatives Kraftfeld . Um das Potenzial
zu bestimmen, wählt man willkürlich einen festen Punkt sowie der Wert /
aus, und
setzt dann
&
" & : (7.83)
Wobei irgendein Weg von nach ist. Wegen der verschwindenden Rotation von ist dieses Integral
unabhängig von der Wahl des Weges , das heißt das Ergebnis hängt nur von ab.
Das Kraftfeld in Abbildung 7.7(b) ist nicht konservativ. Es hat eine nicht verschwindende Rotation, was
man daran erkennen kann, dass es eine Art Wirbel bildet. Daher ist das Wegintegral (7.83) vom gewählten
Weg abhängig, und deshalb lässt sich auf diese Weise kein Potenzial finden.
Aufgabe 7.30 Man betrachte das Kraftfeld
162
(7.84)
replacements
(c)
(d)
(b)
(a)
Abbildung 7.7: Für ein Kraftfeld mit verschwindender Rotation (a) hängt das Wegintegral nur vom
Anfangs- und Endpunkt des Weges ab, Daher lässt sich für ein solches Kraftfeld ein Potenzial auch Integration bestimmen. Ist die Rotation dagegen nicht Null (b), so hängt das Wegintegral auch vom Weg
selbst ab. In diesem Fall lässt sich durch Integration kein Potenzial definieren.
Eine naive Rechnung ergibt, dass die Rotation von verschwindet. Man berechne jedoch das Wegintegral
entlang eines Kreises, der parallel zur 4 - -Ebene liegt und seinen Mittelpunkt irgendwo auf der -Achse
hat. Man benutze das Ergebnis, um zu zeigen, dass die Rotation gar nicht überall verschwindet, sondern
durch
(7.85)
7 gegeben ist, wobei wie üblich ist. Die Rotation ist also überall Null, nur nicht auf
der -Achse, wo sie Unendlich groß ist.
Der Satz von Gauß
Der Vollständigkeit halber wollen wir nun noch kurz die dritte Version des Fundamentalsatzes darstellen.
Es ist der Satz von Gauß, der eine Beziehung zwischen der Divergenz eines Vektorfeldes und Volumenintegralen herstellt.
Wir betrachten dazu irgendein Volumen , das von einer Fläche begrenzt wird, zum Beispiel die in
Abbildung 7.8 dargestellte, etwas deformierte Kugel. Wir schreiben wieder
für den Rand des
Volumens. Die Fläche , die den Rand des Volumens definiert, ist so orientiert, dass ihr Normalenvektor
nach außen, also aus dem Volumen heraus zeigt.
Der Satz von Gauß stellt dann eine Beziehung her zwischen dem Volumenintegral der Divergenz eines
Vektorfeldes und dem Flächenintegral über das Vektorfeld selbst,
Satz von
Stokes
: :
Oder in Worten ausgedrückt:
163
: 1 (7.86)
replacements
(c)
(d)
(b)
(a)
Abbildung 7.8: Der Satz von Gauß besagt, dass das Volumenintegral (a) der Divergenz eines Vektorfeldes, hier dargestellt als eine mehr oder weniger dichte Verteilung von Punkten im Raum, durch das
Flächenintegral (b) des Vektorfeldes über den Rand des Volumens gegeben ist.
Das Volumenintegral der Divergenz eines Vektorfeldes über ein Volumen
Flächenintegral des Vektorfeldes über den Rand
.
ist das
Auch hier ist es wieder nützlich, sich vorzustellen, dass das Vektorfeld den Fluss irgendeines Mediums durch den Raum beschreibt. Das Flächenintegral auf der rechten Seite gibt dann an, wieviel dieses
Mediums durch die Fläche
fließt, also aus dem Volumen heraus.
Wenn das dasselbe ist wie das Volumenintegral über die Divergenz, dann beschreibt die Divergenz
offenbar so etwas wie die Erzeugung des Mediums, welches dann entlang des Vektorfeldes fließt. Denn
wenn aus dem Volumen mehr heraus als herein fließt, dann muss innerhalb des Volumens etwas entstehen.
Ist die Divergenz eines Vektorfeldes an einem Ort positiv, so sagen wir auch, dass sich dort eine Quelle
befindet. Es strömt mehr von dieser Quelle weg als zu ihr hin. Dort, wo die Divergenz negativ ist, liegt
eine Senke vor.
Divergenz und Rotation eines Vektorfeldes beschrieben also das, was wir uns anschaulich am besten
anhand eines Strömungsfeldes vorstellen können. Ein Strömungsfeld hat im allgemeinen Quellen, Senken,
und Wirbel. Bei der Diskussion von elektrischen und magnetischen Feldern wird sich diese anschauliche
Vorstellung als sehr nützlich erweisen.
Der Beweis des Satzes von Gauß kann ganz analog zum Satz von Stokes geführt werden. Wir werden
dies hier nicht explizit tun, sondern als Übungsaufgabe stellen.
Aufgabe 7.31 Zum Beweis des Satzes von Gauß ist folgende Formel n ützlich. Es sei irgendeine Vektor
mit Komponenten . Man zeige
" - " ?
6 (7.87)
Aufgabe 7.32 Man beweise den Satz von Gauß für ein Volumen, das wie in Abbildung 7.8 die Form einer
deformierten Kugel hat. Man kann dabei genau so vorgehen, wie im Falle des Satzes von Stokes. Man
wählt einen Punkt innerhalb des Volumens aus und verwendet verallgemeinerte Kugelkoordinaten, das
heißt man wählt eine Parameterdarstellung ! des Volumens so, dass 6 ! der ausgezeichnete
Punkt ist, und ! 0 ! eine Parameterdarstellung der Randfläche. Eine Rechnung analog zu
(7.79–7.82) führt dann zum gewünschten Ergebnis.
164
Aufgabe 7.33 Wie muss der Satz von Gauß verallgemeinert werden, damit er auch f ür Volumen gilt, die
nicht die Form einer deformierten Kugel haben?
Aufgabe 7.34 Man betrachte das Kraftfeld
(7.88)
Eine naive Rechnung ergibt, dass die Divergenz von verschwindet. Man berechne jedoch das Flächenintegral über eine Kugeloberfläche mit Mittelpunkt im Ursprung. Man benutze das Ergebnis, um zu zeigen,
dass die Divergenz gar nicht überall verschwindet, sondern durch
:
, & 7 gegeben ist, wobei wie üblich im Ursprung, wo sie Unendlich groß ist.
(7.89)
ist. Die Divergenz ist also überall Null, nur nicht
8 Das Kepler-System
In diesem Kapitel wollen wir die wohl bekannteste Anwendung der klassischen Mechanik vorstellen,
nämlich die Berechnung der Planetenbahnen im Sonnensystem. Sie hatte eine sehr wichtige historische
Bedeutung für die Newtonsche Mechanik.
Die Bahnen der Planeten waren schon lange bekannt und wurden von Astronomen wie Brahe, Kepler
und Galilei sehr genau vermessen. Es lagen also eine ganze Reihe von Messdaten vor, und die Tatsache,
dass diese Daten durch die Newtonsche Theorie erklärt werden konnten, konnte als eine eindruckvolle
Bestätigung derselben angesehen werden.
Teilweise haben wir das Problem schon in Abbildung 4 diskutiert. Im einfachsten Fall umkreisen zwei
Körper einander, die über die Gravitationskraft wechselwirken. Ist ein Körper sehr viel schwerer und
damit auch träger als der andere, so können wir diesen als ortsfest betrachten. Der andere bewegt sich
dann in einem Zentralkraftfeld. Dieses Problem werden wir zuerst diskutieren, und uns dann speziell der
Gravitationskraft und damit den Bewegungen der Planeten im Sonnensystem zuwenden.
Zentralkräfte und das effektive Potential
Wir betrachten zuerst ein ganz allgemeines, kugelsymmetrisches Zentralkraftproblem. Kugelsymmetrisch
heißt, dass die Kraft nicht nur radial nach innen oder außen zeigt, sondern dass der Betrag der Kraft auch
nur vom Abstand vom Zentrum anhängt. Für ein Teilchen der Masse mit Ortsvektor gilt dann die
Bewegungsgleichung
(8.1)
Hier bezeichnet wieder den in radiale Richtung zeigenden Einheitsvektor, also & .
Ein solches Zentralkraftfeld ist immer konservativ. Man kann dies zeigen, indem man die Rotation von
berechnet, oder indem man ein Potenzial angibt. Da der Betrag der Kraft nur vom Abstand vom
Ursprung abhängt, machen wir den Ansatz, dass auch das Potenzial nur davon abhängt. Es gilt dann
&
#
(8.2)
gerade
Hier haben wir das Resultat von Aufgabe 7.14 verwendet, wonach der Gradient der Funktion der in Richtung des Ortsvektors zeigende Einheitsvektor ist.
165
Für ein kugelsymmetrisches Zentralkraftfeld gilt also dasselbe wie für ein mechanisches System mit nur
einem Freiheitsgrad. Es gibt immer ein Potenzial, und es ist im wesentlichen durch die Stammfunktion des
Kraftgesetzes gegeben,
(8.3)
, "
"
Wir werden nun die Bewegungsgleichungen für dieses Teilchen durch geschicktes Ausnutzen von Erhaltungsgrößen und die Wahl eines speziellen Koordinatensystems so umformen, dass sie formal wie die
Bewegungsgleichungen für ein System mit nur einem Freiheitsgrad aussehen. Die entscheidenden Erhaltungsgrößen kennen wir schon. Es sind der Drehimpuls und die Energie,
7
(8.4)
Aus der Erhaltung des Drehimpulses folgt, dass die Bewegung des Teilchens in einer Ebene stattfindet. Wir
wählen das Koordinatensystem so, dass dies die 4 - -Ebene ist. Dann ist natürlich , und als Erhal
tungsgrößen bleiben noch zwei skalare Größen, nämlich und . Ohne Beschränkung der Allgemeinheit
können wir außerdem 6 annehmen.
Um die Bahn des Teilchens zu beschreiben, benutzen wir Kugelkoordinaten. Da die Bewegung auf die
4 - -Ebene beschränkt ist, können wir ! 7 setzen. Die Darstellung (5.21) des Ortsvektors lautet dann
einfach
1!
- (8.5)
Die Koordinaten , die die Äquatorebene der Kugelkoordinaten parametrisieren, werden auch als
Polarkoordinaten bezeichnet. Führen wir analog zu (5.29) die Einheitsvektoren
1! .
.
' " 1! (8.6)
so bilden diese für jedes zusammen mit eine Orthonormalbasis. Außerdem gilt für die Ableitungen
nach , analog zu (5.33), ' und ' " . Daraus ergeben sich die folgenden
Ausdrücke für den Ortsvektor, die Geschwindigkeit und die Beschleunigung,
*
' 7 ' "
(8.7)
Setzen wir das in die Bewegungsgleichung ein, so finden wir durch Vergleich der Koeffizienten von und ' " " 7 & 6 (8.8)
Dies sind zwei gekoppelte Differenzialgleichungen zweiter Ordnung für die Funktionen und .
Wir können sie entkoppeln und anschließend lösen, indem wir die Erhaltungsgrößen verwenden. Aus der
zweiten Gleichung folgt unmittelbar
7
Tatsächlich ist das die -Komponente des Drehimpulses,
- ' 6 (8.9)
(8.10)
6 ist. Das Teilchen soll sich also nicht im Kraftzentrum aufWir setzen im folgenden voraus, dass halten. Dann können wir die Winkelgeschwindigkeit durch den Drehimpuls ausdrücken, und dies in
166
die erste Bewegungsgleichung (8.8) einsetzen. Als Ergebnis bekommen wir eine Bewegungsgleichung erster Ordnung für , und eine Bewegungsgleichung zweiter Ordnung für , die nicht mehr von abhängt,
"
"
(8.11)
Damit haben wir die Bewegungsgleichungen entkoppelt. Wir können jetzt so vorgehen, dass wir zuerst die
Bewegungsgleichung für lösen, und das Ergebnis anschließend in die Bewegungsgleichung für einsetzen und diese lösen.
Die Bewegungsgleichung für sieht aus wie die für ein System mit einem Freiheitsgrad. Wir können
sie noch ein wenig umschreiben, um die Ähnlichkeit deutlich zu machen,
"
"
7
&
mit
(8.12)
Die Funktion wird effektives Potenzial genannt. Sie ist der Schlüssel zur allgemeinen Lösung des
kugelsymmetrischen Zentralkraftproblems.
In einem kugelsymmetrischen Potenzial verhält sich die radiale Komponente des
Ortsvektors wie die Ortskoordinate eines fiktiven Teilchens mit einem Freiheitsgrad im effektiven Potenzial .
Wie wir die radiale Bewegungsgleichung am besten lösen, hängt von der Art des effektiven Potentials
ab. Zum Beispiel können wir Methode aus Kapitel 7 verwenden, indem wir die Erhaltung der Energie
ausnutzen. Tatsächlich ist die Energie des fiktiven Teilchens, das sich im effektiven Potenzial bewegt,
identisch mit der Energie des realen Teilchens im dreidimensionalen Raum. Es gilt nämlich
7
&
7 &
7
(8.13)
Die Strategie zur Lösung des Zentralkraftproblems können wir nun wie folgt zusammenfassen. Falls be
stimmte Anfangsbedingungen vorgegeben sind, bestimmen wir zuerst die Erhaltungsgrößen und , wo
ist. Den entsprechenden Wert von setzen wir in
bei wir das Koordinatensystem so wählen, dass (8.12) ein und lösen anschließend die Bewegungsgleichung für . Anschließend setzen wir die gefundene Lösung in die Bewegungsgleichung (8.11) für ein und bestimmen daraus die Funktion .
Sind keine speziellen Anfangsbedingungen vorgegeben, so können wir die allgemeine Lösung der Be
wegungsgleichungen finden, indem wir das Verfahren auf alle möglichen Werte von und anwenden.
Da das effektive Potenzial explizit von abhängt, müssen wir eventuell verschiedene Fälle unterscheiden. Aber im Prinzip ist es immer möglich, die allgemeinste Lösung auf diesem Weg zu finden. Ob man
sie in geschlossener Form durch elementare Funktionen darstellen kann, hängt natürlich vom jeweiligen
Potenzial ab.
Die Drehimpulsbarriere
Um zu verstehen, welche anschauliche Bedeutung das effektive Potenzial hat, betrachten wir einen ganz
einfachen Spezialfall. Für ein freies Teilchen setzen wir 6 . Natürlich ist dies eine etwas umständliche Methode, die Bewegungsgleichung für ein freies Teilchen zu lösen, deren allgemeine Lösung wir
schon kennen. Aber wir werden auf diese Weise etwas besser verstehen, was es mit dem effektiven Potential auf sich hat.
Aus (8.12) ergibt sich
7
167
(8.14)
Wir unterscheiden die Fälle 6 und
gilt die Bewegungsgleichung +
dieser Bewegungsgleichungen ist
6 . Für 6 ist
6 , das heißt für die Radialkomponente
6 , und aus (8.11) ergibt sich + 6 . Die allgemeine Lösung
&
.(
(8.15)
mit beliebigen Konstanten )( . Setzt man das in (8.5) ein, so findet man offenbar eine Gerade durch
den Ursprung, die mit konstanter Geschwindigkeit ( durchlaufen wird. Ein freies Teilchen ohne Drehimpuls bewegt sich wie erwartet geradlinig und gleichförmig. Für ( 6 ruht es am Ort mit den Koordinaten
und 6 .
Der Fall
ist natürlich der interessantere. Das effektive Potenzial (8.14) ist in diesem Fall positiv,
geht für 6 gegen Unendlich und fällt für gegen Null ab. Es ist ein abstoßendes Potenzial, das
heißt die Kraft wirkt immer vom Ursprung weg, und der unendliche Anstieg verhindert, dass ein Teilchen
den Ursprung erreichen kann, egal wie hoch seine Energie ist. Man bezeichnet dieses effektive Potenzial
auch als Drehimpulsbarriere. Sie verhindert, dass ein Teilchen mit Drehimpuls den Ursprung erreichen
kann.
Es gibt in diesem Potenzial nur eine mögliche Bewegungsform. Die Energie ist immer positiv, da
das Potenzial überall positiv ist. Das Teilchen kommt aus dem Unendlichen, das heißt für " geht
6 , und dann entfernt
, es erreicht zu irgendeiner Zeit einen Umkehrpunkt bei es sich wieder, so dass für +
wieder gilt. Da am Umkehrpunkt das Potenzial gleich der
Energie ist, besteht zwischen der Energie , dem Drehimpuls und dem minimalen Abstand , den das
Teilchen zum Ursprung erreicht, der Zusammenhang
7
(8.16)
Statt können wir daher auch als Parameter verwenden, um die Lösungen zu klassifizieren. Außerdem
( 7 , und statt der Erhaltungsgrößen und ist es nützlich, ( zu setzen. Dann ist
können wir die Parameter und ( verwenden, die ebenfalls beide positiv sind.
Um die Lösungen der radialen Bewegungsgleichung zu finden, verwenden wir die Methode aus Kapitel 7. Ist gilt
"
0
(8.17)
0
"
"
Als untere Integrationsgrenze haben wir hier den Umkehrpunkt zur Zeit gewählt. Das obere Vorzeichen gilt für , da dann die Geschwindigkeit positiv ist, das untere Vorzeichen entsprechend für
. Die Integration lässt sich leicht ausführen,
"
7
(
0
"
(
(
0
"
(8.18)
Auflösen nach ergibt nun, unabhängig vom Vorzeichen,
&
-(
"
Tatsächlich hat diese Funktion das erwartete Verhalten. Für
erreicht sie ihr Minimum bei & .
168
(8.19)
gilt , und für
Jetzt müssen wir nur noch die Bewegungsgleichung (8.11) für lösen. Auch das ist eine einfache
Integration,
.(
(
"
Die allgemeine Lösung wird also durch insgesamt vier Parameter
(
, ,( "
und (8.20)
festgelegt.
Aufgabe 8.1 Man setze das Ergebnis (8.19) und (8.20) in die Ortsvektordarstellung (8.5) ein und verwende die Eigenschaften der Winkelfunktionen, um zu zeigen, dass es sich bei der L ösung um eine geradlinige,
gleichförmige Bewegung handelt, die wie folgt geschrieben werden kann,
1! "
Aufgabe 8.2 Man diskutiere den Grenzfall 3! ( " (
(8.21)
6 in (8.19) und (8.20).
Aufgabe 8.3 Man löse mit derselben Methode die Bewegungsgleichung für ein Teilchen der Masse
7 .
einem Potenzial in
Das Gravitationspotenzial
Nun wollen wir uns dem eigentlichen Thema dieses Kapitels zuwenden. Wir wollen die Bahnen von
Planeten im Sonnensystem berechnen. Wir nehmen dazu an, dass die Masse der Sonne sehr viel größer ist
als die Masse des Planeten, so dass wir die Sonne als im Koordinatenursprung ruhend annehmen und die
Wechselwirkung der Planeten untereinander vernachlässigen können.
Es sei also
die Masse der Sonne und die eines Planeten. Der Planet bewegt sich dann in einem
Zentralkraftfeld
"
" (8.22)
und wobei wir wieder gesetzt haben. Das zugehörige Potenzial ist
& "
"
(8.23)
Das Gravitationspotenzial ist negativ und steigt mit zunehmenden monoton an, da die Kraft stets anziehend ist. Für fällt sein Betrag mit 0 gegen Null ab.
Um die daraus resultierenden Bewegungsgleichungen zu lösen, gehen wir genau so vor wie eben für
das freie Teilchen. Wegen der Drehimpulserhaltung findet die Bewegung in der 4 - -Ebene statt, wenn wir
gilt
das Koordinatensystem entsprechend anpassen. Für die Erhaltungsgrößen und 7
& "
mit
7
(8.24)
Aus der allgemeinen Diskussion der Gravitationskraft wissen wir bereits, dass die Masse des Planeten für die Bewegung eigentlich keine Rolle spielt. Wir können sie eliminieren, indem wir eine spezifische Energie , einen spezifischen Drehimpuls und ein spezifisches effektives Potenzial
einführen. Dann lassen sich die Definitionen (8.24) der Erhaltungsgrößen und des effektiven
Potenzials wie folgt umschreiben,
7
0
mit
169
& "
7
(8.25)
replacements
(a)
(c)
(b)
(d)
Abbildung 8.1: Das effektive Potenzial für einen Körper im Gravitationsfeld der Sonne. Es sind vier
verschiedene Bewegungsformen möglich. Die Fälle (a) und (b) entsprechen den Planetenbahnen. Der
Körper führt eine periodische Umlaufbewegung aus. Die Fälle (c) und (d) entsprechen den Bahnen von
Kometen, die nur aus dem Unendlichen kommend nur einmal am Stern vorbeiziehen und dann wieder
verschwinden.
Es verbleibt also nur noch die Masse
der Sonne als Parameter in den Bewegungsgleichungen, und
natürlich die Gravitationskonstante .
Um die Bewegungsgleichung für die Radialkomponente zu lösen, müssen wir uns nun das effektive
6 . Die Bewegungsgleichungen
Potenzial etwas genauer ansehen. Wir betrachten hier nur den Fall
für verschwindenden Drehimpuls hatten wir bereits in Kapitel 4 gelöst, für den Fall von zwei Körpern, die
senkrecht aufeinander zu fallen. Wir werden am Schluss noch einmal auf diesen Fall zurück kommen, den
wir hier auch als Grenzfall 6 darstellen können.
6 ist in Abbildung 8.1 dargestellt. Es hat stets den gleichen quaDas effektive Potenzial für
litativen Verlauf. Für kleine dominiert der Anteil, der mit 0 ansteigt, also die Drehimpulsbarriere.
Sie verhindert, dass das fiktive Teilchen, welches die Radialbewegung des Himmelskörpers beschreibt,
den Ursprung erreicht. Für große dominiert dagegen der Anteil, der für mit " 0 abfällt, also
das Gravitationspotenzial. Für große ist das effektive Potenzial negativ und steigt monoton an, und für
geht 6 .
Aufgabe 8.4 Man zeige, dass die Funktion bei
mit
0
" 7 (8.26)
ein absolutes Minimum hat.
Wie in Abbildung 8.1 dargestellt, können wir vier mögliche Bewegungsformen des fiktiven Teilchens
unterschieden, das sich in diesem effektiven Potenzial bewegt.
Für , dargestellt in Abbildung 8.1(a), ruht das fiktive Teilchen im Minimum bei . Das
bedeutet allerdings nicht, dass sich der Himmelskörper wirklich in Ruhe befindet. Das effektive Potenzial
bestimmt ja nur die radiale Bewegung des Planeten. Die Radialkoordinate ist zeitlich konstant.
Aus (8.25) folgt aber, dass die Winkelkoordinate nicht konstant ist. Drücken wir den Drehimpuls gemäß
170
(8.26) durch aus, so ergibt sich daraus
(8.27)
Also ist zeitlich konstant, und wir bekommen als Lösung der Bewegungsgleichungen
mit
(8.28)
Diese spezielle Klasse von Lösungen kennen wir bereits. Es sind die Kreisbahnen, für die das dritte Keplersche Gesetz gilt, wonach sich die dritten Potenzen der Radien der Kreisbahnen wie die Quadrate der
Umlaufzeiten 7 verhalten.
6
ist in Abbildung 8.1(b) dargestellt. Das fiktive Teilchen pendelt jetzt in einer
Der Fall Potentialmulde, das heißt es bewegt sich periodisch zwischen einem minimalen Abstand und einem
maximalen Abstand hin und her. Dieser Fall liegt im allgemeinen vor, wenn ein Planet um einen Stern
kreist. Der Planet läuft nicht exakt auf einer Kreisbahn, so dass sein Abstand vom Kraftzentrum zwischen
einem minimalen Wert und einem maximalen Wert pendelt.
Die Umkehrpunkte und sind durch die Bedingung bestimmt. An diesen Stellen ist das
effektive Potenzial gleich der Gesamtenergie. Es gilt also
& "
7
7
(8.29)
Die Umkehrpunkte sind die Lösungen einer quadratischen Gleichung, in der und als Parameter auftreten. Statt diese Gleichung nach aufzulösen, gehen wir lieber den umgekehrten Weg und ersetzen die
Erhaltungsgrößen und durch die Parameter und . Bekanntlich besteht zwischen den Koeffizienten
einer quadratischen Gleichung und den Lösungen ein einfacher Zusammenhang, der in diesem Fall wie
folgt lautet,
oder
"
"
7
" 7 (8.30)
(8.31)
Wir können also die beiden die Umkehrpunkte und beliebig vorgeben, natürlich mit der Einschränkung 6 , und daraus die Größen und bestimmen. Die Planetenbahnen lassen sich
folglich durch die Angabe des minimalen Abstands und des maximalen Abstands von der Sonne
vollständig klassifizieren.
Aufgabe 8.5 Man zeige, dass sich im Grenzfall wieder (8.26) ergibt, das heißt wir können
die Kreisbewegung also Spezialfall der Pendelbewegung betrachten, wobei die beiden Umkehrpunkte zusammenfallen.
Es gibt aber noch andere mögliche Bewegungsformen eines Himmelskörpers im Gravitationsfeld eines
6 ergeben sich die in Abbildung 8.1(c) und (d) dargestellten Bewegungen.
anderen. Für 6 bzw. Das fiktive Teilchen nähert sich hier aus dem Unendlichen, kehrt an einer Stelle mit minimalem Anstand
um, und verschwindet wieder im Unendlichen. Wir bezeichnen diese Bahnen als Kometenbahnen und
werden sie später separat diskutieren.
Aufgabe 8.6 Man zeige, dass sich der Fall
6 für 6 " .
6 aus (8.31) als Grenzfall 171
ergibt, und der Fall
Planetenbahnen
Nun wollen wir versuchen, die Bahn eines Planeten explizit zu beschreiben. Als Parameter geben wir dazu
den minimalen Abstand und den maximalen Abstand vor.
Die Bewegungsgleichung für die radiale Komponente können wir dann wie folgt aufschreiben. Wir
lösen die Definition (8.25) der Energie nach auf und setzen für und die Ausdrücke (8.31) ein. Das
ergibt
7 "
7
"
& 7 0 0 "
" 7
7
Tatsächlich ist, wie es sein muss, an den Umkehrpunkten ist die rechte Seite dieser Gleichung positiv.
0 "
" 0 (8.32)
6 , und für
die Geschwindigkeit Die entsprechende Gleichung für die Winkelkoordinate, die sich aus der Definition des Drehimpulses
ergibt, lässt sich auf eine ähnliche Form bringen
7
(8.33)
6 annehmen, ist auch 6 , das heißt der Planet läuft im positiven Sinn um die Sonne herum.
Da wir
Im Prinzip können wir diese Gleichungen mit der üblichen Methode lösen. Es stellt sich allerdings heraus, dass sich die Lösungen nicht explizit durch elementare Funktionen darstellen lassen. Folglich können
wir mit ihnen nur wenig anfangen. Wir wollen uns daher überlegen, was wir überhaupt über die Planetenbahnen wissen wollen, und ob wir dies vielleicht auf einem anderen Weg herausbekommen können.
Die Angabe der Bahn durch die Koordinatenfunktionen und enthält im Prinzip zwei Arten
von Informationen, die sich unabhängig voneinander durch Beobachtung verifizieren lassen. Zum einen
enthalten sie Informationen über die Form der Bahn im Raum, also den Weg, den der Planet zurücklegt.
Andererseits können wir auch etwas über den zeitlichen Verlauf der Bewegung daraus ablesen, also insbesondere über die Umlaufzeit des Planeten.
Wir wollen versuchen, diese beiden Informationen unabhängig voneinander zu gewinnen. Es zeigt sich,
dass dies explizit möglich ist. Wir wollen also zunächst versuchen, den Weg zu beschreiben, den der Planet
auf seiner Bahn um die Sonne zurücklegt. Es genügt dazu, eine Funktion anzugeben, die uns sagt, wie
weit der Planet von der Sonne entfernt ist, wenn er sich in der Richtung befindet. Da monoton mit der
Zeit zunimmt, existiert eine solche Funktion immer. Hinterher können wir dann immer noch versuchen,
die Funktion zu ermitteln, um eine Aussage über den zeitlichen Ablauf zu erhalten.
Welche Differenzialgleichung müssen wir lösen, um die Funktion zu bestimmen? Es gilt
(8.34)
Nun kennen wir aus (8.32), und aus (8.33). Also gilt
0 "
" 0 "
"
(8.35)
Auf den ersten Blick sieht diese Differenzialgleichung auch nicht einfacher aus als (8.32). Aber es stellt
sich heraus, dass wir sie explizit lösen können. Wir führen dazu eine Substitution durch, nämlich
"
172
(8.36)
Eingesetzt in (8.35) erhalten wir
" "
"7 " "
&
7
(8.37)
Die Lösung dieser Gleichung können wir beinahe raten. Sie lautet
&
7
"
7
3! " (8.38)
wobei eine frei wählbare Integrationskonstante ist. Dass dies eine Lösung ist, sehen wir sehr einfach
wie folgt. Wenn wir ableiten, fällt der erste Term weg und aus dem Kosinus wird ein Sinus. Wenn
wir den konstanten Term dagegen abziehen, wie im letzten Term in (8.37) verlangt, erhalten wir dasselbe
Ergebnis, aber diesmal mit dem Kosinus. Addieren wir die Quadrate der beiden Terme, ergibt sich wegen
1!
0 gerade das Quadrat des Vorfaktors, also der erste Term auf der rechten Seite in (8.37).
Aufgabe 8.7 Wenn man diese Lösung nicht errät, kann man sie sich durch Separation der Variablen aus
(8.37) beschaffen. Man führe diese Rechnung aus, mit der aus Kapitel 7 bekannten Methode.
Die Integrationskonstante können wir ohne Beschränkung der Allgemeinheit gleich Null setzen. Eine Konstante, die wir zu addieren, bewirkt nur die Drehung der gesamten Bahn oder äquivalent eine
Drehung des Koordinatensystems. Machen wir schließlich noch die Substitution (8.36) rückgängig, so
bekommen wir die folgende Darstellung für den Weg des Planeten,
7
(8.39)
" 3! Tatsächlich pendelt diese Funktion zwischen und . Sie hat aber noch eine bemerkenswerte Eigen
7
&
schaft. Offenbar ist die Funktion nicht nur periodisch in , sondern sie hat sogar die Periode . Das
bedeutet, dass es sich um eine geschlossene Bahn handelt. Nach einer Umdrehung um das Kraftzentrum
ist der Planet wieder genau da, wo er zuvor auch war. Das ist keineswegs selbstverständlich, sondern eine
sehr spezielle Eigenschaft der Gravitationskraft. Wir werden das später sehen, wenn wir kleine Störungen
dieser Wechselwirkung betrachten.
In Abbildung 8.2(a) ist eine typische Planetenbahn dargestellt. Der minimale Abstand vom
Kraftzentrum wird bei 7 erreicht, mit , also in Richtung der positiven 4 -Achse. Dieser
Punkt mit dem Ortsvektor wird als Perihel bezeichnet, was soviel bedeutet wie “sonnennächster
Punkt”. Der maximale Abstand wird bei 7 /=0 erreicht, also auf der negativen 4 -Achse.
Der Punkt mit dem Ortsvektor " wird entsprechend als Aphel bezeichnet, was soviel bedeutet wie
“sonnenfernster Punkt”.
Die Keplerschen Gesetze
Wir wollen nun zeigen, dass es sich bei der in Abbildung 8.2(a) dargestellten Kurve um eine Ellipse
handelt, wobei einer der beiden Brennpunkte im Kraftzentrum liegt. Das ist die Aussage des ersten
Keplerschen Gesetzes:
Die Planetenbahnen sind Ellipsen, von denen jeweils ein Brennpunkt im Zentrum der Sonne
liegt.
Um das zu beweisen, erinnern wir und kurz an die geometrische Definition einer Ellipse. Es ist die Menge
7& von zwei Brennaller Punkte mit der Eigenschaft, dass die Summe der Abstände punkten und konstant ist. Die Größe wird als große Halbachse der Ellipse bezeichnet. Fallen die
beiden Brennpunkte zusammen, so ist der Radius eines Kreises.
173
(b)
(a)
Abbildung 8.2: Die Planetenbahnen sind Ellipsen (a), die Kometenbahnen Hyperbeln (b). Es liegt jeweils
ein Brennpunkt im Zentrum der Sonne.
Mit Hilfe der in Abbildung 8.2(a) eingeführten Bezeichnungen können wir eine solche Ellipse wie folgt
beschreiben. Der eine Brennpunkt sei der Koordinatenursprung, der andere Brennpunkt liege auf
der negativen 4 -Achse, am Punkt mit dem Ortsvektor " 7 . Die große Halbachse ist dann der halbe
Abstand der beiden Schnittpunkt der Ellipse mit der 4 -Achse. Diese Schnittpunkte liegen bei
". (8.40)
Nun sei irgendein Punkt auf der Ellipse, mit den Polarkoordinaten und . Dann ist natürlich der Ortsvektor dieses Punktes und somit der Abstand des Punktes vom Brennpunkt . Den
Abstand vom anderen Brennpunkt berechnen wir mit Hilfe des Kosinussatzes im Dreieck
. Der Winkel
ist " , also gilt
(8.41)
" 3! " &
3! Der Punkt liegt genau dann auf der Ellipse, wenn
7&
"
7&
" ist, oder
(8.42)
Ziehen wir die letzten beiden Gleichungen voneinander ab, so ergibt sich folgende Beziehung zwischen und ,
" " 1! (8.43)
3! Das ist das gleiche wie (8.39), wie man unmittelbar nach Einsetzen von (8.40) sehen kann. Damit haben
wir gezeigt, dass die Bahnkurve des Planeten tatsächlich eine Ellipse ist. Ihre geometrischen Daten, die
große Halbachse , den Abstand der Brennpunkte vom Mittelpunkt , und die kleine Halbachse lassen
sich als Funktionen der Bahnparameter und angeben. Es gilt
7
174
"
7
(8.44)
Aufgabe 8.8 Man beweise die angegebene Formel für die kleine Halbachse , die in Abbildung 8.2(a) als
maximaler Abstand der Ellipse von der 4 -Achse definiert ist.
Das zweite Keplersche Gesetz macht eine Aussage darüber, wie die Bahn zeitlich durchlaufen wird. Es
handelt sich dabei allerdings nur im eine Umformulierung des Drehimpulserhaltungssatzes:
Der Ortsvektor des Planeten überstreicht in gleichen Zeiten gleiche Flächen.
Dass der Betrag des Drehimpulses angibt, welche Fläche der Ortsvektor eines Teilchens pro Zeit überstreicht, hatten wir bereits in Abbildung 3.7 gezeigt. Das zweite Keplersche Gesetz ist also letztlich nur eine geometrisch anschauliche Formulierung der zweiten Bewegungsgleichung in (8.25). Es gilt unabhängig
vom Gravitationsgesetz für jedes Teilchen in einem Zentralkraftfeld.
Interessanter ist das dritte Keplersche Gesetz, das wir bereits für einen Spezialfall formuliert hatten. Es
sagt etwas über die Umlaufzeit der Planeten aus:
Die Quadrate der Umlaufzeiten der Planeten verhalten sich zueinander wie die dritten Potenzen der großen Halbachsen der Bahnen.
Um diesen Zusammenhang von den Kreisbahnen auf allgemeine Ellipsenbahnen zu verallgemeinern,
müssen wir also nur den Radius der Kreisbahn durch die große Halbachse der Ellipsen ersetzen.
Es gibt zwei Möglichkeiten, diese Aussage zu beweisen. Während eines Umlaufs des Planeten macht
das fiktive Teilchen, dessen Ortskoordinaten die radiale Koordinate ist, gerade eine Schwingung in
der Potenzialmulde in Abbildung 8.1(b). Für die Periode einer solchen Schwingung gilt die Formel (7.23),
also
7
"
(8.45)
Wenn wir hier und durch und ausdrücken, können wir das Integral lösen und so die Periode
berechnen.
Es gibt aber eine einfachere und sehr viel anschaulichere, geometrische Methode, um die Umlaufzeit
eines Planeten zu berechnen. Wie wir wissen, gilt für die vom Ortsvektor in der Zeit überstrichene Fläche
7 7 . Denn der Betrag des Drehimpulses bzw. des spezifischen Drehimpulses
, oder ist konstant, so dass die überstriche Fläche proportional zur Zeit ist.
Nach einem vollen Umlauf des Planeten um die Sonne hat der Ortsvektor gerade einmal die Ellipse in
Abbildung 8.2(a) überstrichen. Die Fläche einer Ellipse mit den Halbachsen und ist . Also
gilt
7
7 Nun müssen wir nur noch und durch die Parameter Halbachse ausdrücken. Laut (8.31) und (8.44) ist
7
und (8.46)
und anschließend durch die große
7 (8.47)
Damit haben wir das dritte Keplersche Gesetz bewiesen. Für eine Kreisbahn ergibt sich daraus wieder der
bekannte Zusammenhang (4.12).
Aufgabe 8.9 Man bestätige das dritte Keplersche Gesetz durch Ausrechnen das Integrals (8.45).
175
Aufgabe 8.10 Man diskutiere den Grenzfall 6 . Man halte dazu fest und bilde demn Grenzwert
6
. Wie sieht in diesem Fall die Bahn aus? Welche Umlaufzeit ergibt sich? Welche Beziehung besteht zwischen diesem Ergebnis und der in Kapitel 4 berechneten Fallzeit zweier K örper, die senkrecht
aufeinander zu stürzen? Dort hatten wir gesehen, dass es sinnlos ist, die Bahnen nach dem Zusammenstoß
fortzusetzen. Das gilt natürlich nur, wenn sie genau aufeinander stürzen. Was passiert, wenn wir ihnen
einen ganz kleinen Drehimpuls geben, so dass sie sich gerade so verfehlen?
Kometenbahnen
Nun wollen wir noch kurz die Bahnen von Himmelskörpern beschreiben, die sich aus dem unendlichen
Nähern, das Sonnensystem nur einmal besuchen, und dann wieder verschwinden. Wir nennen diese Lösungen der Bewegungsgleichung Kometenbahnen.
6 in Abbildung 8.1(d). Wie wir bereits in Aufgabe 8.6 gezeigt
Wie betrachten zuerst den Fall haben, ergeben sich die Kometenbahnen aus den Planetenbahnen, indem wir einfach das Vorzeichen von
ändern. Der Betrag von muss allerdings stets größer bleiben als der von . Dann ist die Energie in (8.31) positiv, und der Drehimpuls weiterhin wohldefiniert.
Die Berechnung des Weges , den der Komet zurückliegt, ist völlig identisch mit den Rechnung
(8.32–8.39) für die Planetenbahnen. Das heißt, wie bekommen auch hier die folgende Darstellung des
Weges in Polarkoordinaten,
&
7
" 3! (8.48)
Allerdings ist diese Funktion nicht mehr für alle wohldefiniert. Damit positiv ist, muss der Nenner
negativ sein, also
1! (8.49)
" 1! "
Da negativ und sein Betrag größer als ist, hat der Bruch auf der rechten Seite einen Wert zwischen
6 und " 0 , so dass sich für eine Einschränkung auf ein symmetrisches Intervall ergibt,
"
mit
3! "
(8.50)
An den Rändern dieses Intervalls, also für geht . Es handelt sich dabei um diejenigen
Richtungen, aus denen der Komet kommt bzw. in die er wieder verschwindet. In Abbildung 8.2(b) ist eine
typische solche Bahn dargestellt.
Es handelt sich bei dieser Bahn um eine Hyperbel. Der eine Brennpunkt der Hyperbel liegt im Kraftzentrum , der zweite an einem Punkt mit dem Ortsvektor 7 " auf der positiven 4 -Achse.
Die Geraden, denen sich die Hyperbel asymptotisch nähert, schneiden sich im Mittelpunkt der beiden
Brennpunkte auf der 4 -Achse. Der Winkel, unter dem sie sich schneiden, wird wie in Abbildung 8.2(b)
gezeigt durch den Winkel ! bestimmt.
Aufgabe 8.11 Man zeige, dass es sich bei dieser Bahn tatsächlich um eine Hyperbel handelt. Für die
Punkte auf einer Hyperbel gilt " 7& , wenn und die beiden Brennpunkte sind.
Die Kometenbahnen werden auf Streubahnen genannt. Man stellt sich dazu vor, dass irgenwo in großer
Entfernung zum Streuzentrum, also zur Sonne, jemand einen Körper abwirft. Weit draußen bewegt sich
dieser Körper nahezu geradlinig und gleichförmig auf der Geraden, der sich die Hyperbel asymptotisch
nähert. Kommt der Körper in die Nähe der Sonne, so wird er gestreut, das heißt er weicht von seiner
geraden Bahn ab. Wenn er sich dann wieder entfernt, bewegt er sich wieder nahezu geradlinig.
176
Jedoch ist seine Bahn jetzt gegenüber der ursprünglichen Bahn um einen Winkel gedreht, der als
Streuwinkel bezeichnet wird. Wie man leicht in Abbildung 8.2(b) ablesen kann, ist dieser Streuwinkel
gerade
7 " (8.51)
Für die Physik des Sonnensystems und die Gravitationstheorie sind diese Bahnen nicht von großer Bedeutung. Sie beschreiben zwar die Bewegungen von Kometen, die nur einmal in ihrem Leben das Sonnensystem besuchen, aber solche Ereignisse sind sehr selten. Allerdings spielen ähnliche Bahnen in der
Mikrophysik eine große Rolle. Dort geht es oft darum, ein Kraftfeld, zum Beispiel das eine Atomkerns,
zu vermessen, indem man Teilchen an diesem Kraftzentrum streut und deren Verhalten untersucht, also
under anderem den Streuwinkel misst. Wir werden uns deshalb an andere Stelle etwas ausfühlicher mit
den Streubahnen beschäftigen.
Aufgabe 8.12 Man drücke den Streuwinkel durch die Energie und den Drehimpuls des gestreuten K örpers
aus. Was gescheiht im Grenzfall 6 ? Wie groß ist dann der Streuwinkel, und wie sieht die Bahn aus?
Die Periheldrehung
Wenn man die Bahnen der Planeten im Sonnensystem sehr genau vermisst, stellt man fest, dass es sich
nicht wirklich um geschlossene Ellipsen handelt. Es gibt dafür mehrere Ursachen. So haben wir bei unseren Rechnungen bisher die Wechselwirkungen der Planeten untereinander völlig vernachlässigt. Diese
sind zwei klein, führen aber nach genügend vielen Umläufen der Planeten durchaus zu messbaren Abweichungen.
Da die Bahnen der Planeten schon seit vielen Hundert Jahren sehr genau vermessen wurden, kann man
diese Abweichungen leicht nachweisen. Jedoch erfordert eine Berechnung dieser Abweichungen für einen
Planeten die Berücksichtigung aller anderen Planeten, und sie lässt sich nur bei genauer Kenntnis aller
Daten der Planetenbahnen und deren Massen durchführen. Das wäre an dieser Stelle viel zu aufwendig.
Wir werden diesen Aspekt daher im folgenden nicht weiter diskutieren.
Es gibt aber noch eine andere mögliche Ursache für eine Abweichung der Planetenbahnen von den geschlossenen Keplerschen Ellipsen. Vielleicht stimmt das Newtonsche Gravitationsgesetz ja gar nicht exakt,
sondern nur innerhalb einer gewissen Näherung. Es ist deshalb ganz sinnvoll, zu untersuchen, welche Abweichungen sich in den Keplerschen Gesetzen ergeben, wenn wir das Gravitationsgesetz etwas verändern.
Sollte man diese Abweichung dann tatsächlich beobachten, oder eben nicht, so lassen sich daraus Schlüsse
über die Gültigkeit des allgemeinen Gravitationsgesetzes ziehen.
Wie könnte eine kleine Abweichung des Kraftgesetzes vom Newtonschen Gravitationsgesetz aussehen?
Für große Abstände der beteiligten Körper stimmt es offenbar sehr gut, also sollten wir davon ausgehen,
dass das “ 0 ”-Verhalten des Gravitationspotenzials für große richtig ist. Aber für sehr kleine Abstände
könnte es eventuell eine Abweichung geben. Wir könnten also zum Gravitationspotenzial (8.23) eine Korrektur hinzufügen, die nur für kleine Abstände relevant ist. Machen wir dazu den Ansatz
& "
0 (8.52)
Die zusätzliche eingeführte Konstante hat die Dimension eine Länge. Für ist der zusätzliche Term
sehr klein, so dass wir ihn vernachlässigen können. Die Konstante gibt also an, auf welcher Längenskala
sich eine Abweichung vom Newtonschen Gravitationgesetzt bemerkbar macht.
Ist zum Beispiel 0 mm, so wäre die Abweichung für die Planetenbahnen sehr klein, aber im Labor
würde man eine Abweichung feststellen, wenn sich zwei schwere Körper sehr nahe kommen. Für ein
positives wird die Anziehungskraft bei kleinen Abständen größer, für negatives wird sie kleiner und
kehrt sich bei Abständen " 7 sogar in eine Abstoßung um, wie man durch Ableiten von (8.52) nach
leicht bestätigen kann.
177
Tatsächlich ist das Newtonsche Gravitationsgesetz nur bis zu Größenordnungen von einigen Millimetern bei Massen von einigen Gramm experimentell bestätigt. Es ist nämlich sehr schwierig, große Massen
sehr dicht aneinander zu bringen, ohne dass dabei andere, zum Beispiel elektromagnetische Kräfte auftreten, die die Gravitationskräfte dann um viele Größenordnungen übersteigen. Es ist also keineswegs
ausgeschlossen, dass das Newtonsche Gravitationsgesetz bei kleinen Abständen gar nicht mehr gilt.
Natürlich könnten wir uns auch beliebige andere Abweichungen vom “ 0 ”-Potenzial ausdenken. Der
eigentliche Grund, warum wir gerade ein modifiziertes Potenzial der Form (8.52) betrachten, ist, dass
wir für dieses Potenzial die Bewegungsgleichungen unmittelbar lösen können. Wir müssen dazu nur die
bereits gefundenen Lösungen ein wenig modifizieren. Es soll hier also mehr darum gehen, mit möglichst
einfachen Mitteln zu untersuchen, was prinzipiell geschieht, wenn wir das Kraftgesetz ein wenig abändern.
Wir werden nicht die allgemeinste mögliche Veränderung diskutieren.
Was müssen wir tun, um die Bewegungsgleichungen für das veränderte Potenzial (8.52) zu lösen? Es
ist natürlich immer noch ein Zentralkraftpotenzial. Wir können wieder die Drehimpulserhaltung und die
Methode des effektiven Potenzials verwenden. Wir definieren die Erhaltungsgrößen Energie und Drehimpuls wie in (8.25), nur für das effektive Potenzial müssen wir jetzt einen anderen Ausdruck
einsetzen,
7
0
mit
& "
"
7
(8.53)
Wie sieht dieses effektive Potenzial aus? Es besitzt wieder einen 0 - und einen 0 -Anteil. Für große dominiert der 0 -Anteil, das heißt dort ist alles beim alten. Für kleine dominiert der 0 -Anteil. Sein
Vorzeichen hängt jetzt allerdings davon ab, ob größer oder kleiner als 7
ist.
Nur, wenn größer also 7
ist, hat der 0 -Term ein positives Vorzeichen, und das effektive
Potenzial sieht wie in Abbildung 8.1 aus. Andernfalls fällt es für 6 nach " ab. In diesem
Fall gibt es keine Potenzialmulde, also auch keine Pendelbewegungen und somit keine Planetenbahnen.
Da wir uns hier nur für Planetenbahnen interessieren, werden wir nur den Fall
7
96
(8.54)
betrachten. Für negatives ist diese Ungleichung offenbar immer erfüllt, für positives macht sie jedoch
eine Einschränkung an den Drehimpuls. In jedem Fall sich die Planetenbahnen wieder diejenigen Bahnen
mit negativer Energie, denn sonst entweicht das fiktive Teilchen, das sich im effektiven Potenzial bewegt,
ins Unendliche.
Mit einem einfachen Trick können wir die Lösungen der Bewegungsgleichungen aus den bekannten
6 herleiten. Das das effektive Potenzial von der gleiche Form ist, können wir die
Lösungen für
Planetenbahnen auch jetzt wieder durch den minimalen Abstand und den maximalen Abstand von
der Sonne klassifizieren. Die Umkehrpunkte sind auch hier wieder durch die Bedingung (8.29) festgelegt,
nur dass wir ein anderes effektives Potenzial einsetzen müssen. Es gilt also
"
" 7
7
" 7
7
(8.55)
Auch das ist wieder eine quadratische Gleichung, und wir können die Erhaltungsgrößen und durch die
Parameter ausdrücken. Statt (8.31) gilt jetzt
"
7
(8.56)
Wenn positiv ist, ergibt sich hieraus automatisch die Bedingung (8.54) ab den Drehimpuls . Ist
6 sein muss, eine zusätzliche Bedingung an und .
negativ, ergibt sich aus der Forderung, dass
178
Das liegt daran, dass die modifizierte Gravitationskraft für negatives bei kleinen Abständen abstoßend
wirkt. Daher sind in diesem Bereich keine Umlaufbahnen mehr möglich.
Wenn wir von diesen Einschränkungen einmal absehen, können wir jetzt genau so vorgehen wie vorher.
Wenn wir die Bewegungsgleichung für , die sich aus der Energieerhaltung, also der ersten Gleichung
in (8.55) ergibt, durch und ausdrücken, ergibt sich die Gleichung (8.32),
7
0 "
" 0 (8.57)
An der Radialbewegung des Planeten ändert sich also gar nichts. Er pendelt zwischen den Umkehrpunkten
und hin und her, und zwar mit der gleichen Periode wie vorher. Wir können sie sofort angeben, denn
sie ergibt sich aus dem dritten Keplerschen Gesetz zu
7 mit
(8.58)
Die entsprechende Bewegungsgleichung für wird jedoch leicht modifiziert. Statt (8.33) bekommen
wir
7
(8.59)
Um diese Differenzialgleichung wieder auf die Form (8.35) zu bringen, führen wir einen Korrekturfaktor
ein, Wir setzen
0 7
(8.60)
Die Bewegungsgleichungen (8.57) und (8.60) für und sind jetzt mit den ursprünglichen Bewegungsgleichungen (8.32) und (8.33) identisch, bis auf den Unterschied, dass hier statt die Funktion
steht.
Wir können daher die Lösungen der Bewegungsgleichungen unmittelbar übernehmen, wenn wir überall
ersetzen. Das gilt insbesondere für die Beziehung (8.39) zwischen und . Der Weg des
durch Planeten wird jetzt durch die Funktion
&
" 3! (8.61)
beschrieben. Der Korrekturfaktor tritt also im Argument des Kosinus auf.
Welche Konsequenzen hat das, und wie sehen diese Planetenbahnen aus? Offenbar ist die Periode der
Funktion jetzt nicht mehr 7 , sondern 7 . Mit anderen Worten, der Winkelabstand zwischen zwei
Minima der Funktion ist nicht 7 , sondern 7 . Die Bahn ist keine geschlossene Ellipse mehr,
sondern eine Art Rosette, wie sie in Abbildung 8.3 dargestellt ist. Dass sich aus dem Newtonschen Gravitationsgesetz geschlossene, also periodisch durchlaufene Bahnen ergeben, ist also tatsächlich nur ein
Zufall.
Während der oben berechneten Periode pendelt der Planet einmal vom sonnennächsten Punkt zum
sonnenfernsten Punkt und wieder zurück. Dabei macht er aber keine vollen Umlauf, sondern legt den
Winkel 7 zurück. Je nach dem, ob größer oder kleiner als Eins ist, kann das mehr oder weniger als
ein ganzer Umlauf sein. Das hängt offenbar vom Vorzeichen von ab. Ist positiv, so ist größer als
eins, das heißt während einer Pendelbewegung macht der Planet mehr als einen Umlauf. Dieser Fall ist
in Abbildung 8.3(a) dargestellt. Ist dagegen negativ, macht der Planet während einer Pendelbewegung
weniger als einen Umlauf. In diesem Fall ergibt sich die Bahn in Abbildung 8.3(b).
179
replacements
(c)
(d)
(b)
(a)
Abbildung 8.3: Eine Korrektur des Gravitationsgesetzes bewirkt, dass die Bahnen der Planeten nicht mehr
in sich geschlossen sind. Es ergeben sich rosettenförmige Bahnen. Während einer Pendelbewegung verschiebt sich das Perihel, also der sonnennächste Punkt, um einen Winkel in Richtung des Umlaufs (a),
oder gegen den Umlaufsinn (b).
Um eine solche Rosettenbahn quantitativ zu beschreiben, führt man die Periheldrehung ein. Darunter
versteht man den Winkel , um den zwei aufeinanderfolgende sonnennächste Punkte gegeneinander verschoben sind. In Abbildung 8.3(a) ist die Periheldrehung positiv, da der Planet mehr als eine Umdrehung
gemacht hat, in Abbildung 8.3(b) ist sie negativ, da der Planet weniger als eine Umdrehung gemacht hat.
Die Periheldrehung hängt natürlich von den Bahndaten des Planeten ab. Es ergibt sich
7 " 0 & 7 0 " 0 (8.62)
Für kleine können wir diesen Ausdruck in eine Taylor-Reihe entwickeln. Klein heißt in diesem Fall, dass
die Radien und groß sind im Vergleich zum Parameter , der ja die Dimension eine Länge hat. Für
4 0 ist 0 .4
0 .4 7 , also
(8.63)
Aufgabe 8.13 Wenn sich ein Planet auf einer Kreisbahn bewegt, kann man nat ürlich keine Periheldrehung
beobachten. Trotzdem liefert die Formel (8.62) für einen bestimmten Wert. Welche physikalische
Bedeutung hat dieser Wert?
Aufgabe 8.14 Welche Beziehung besteht zwischen dem Radius und der Umlaufzeit eines Planeten
auf einer Kreisbahn im modifizierten Gravitationspotenzial (8.52)? Was hat diese Aufgabe mit der Aufgabe 8.13 zu tun?
Der Merkur und die Relativitätstheorie
Eine Abweichung des Gravitationsgesetz von dem von Newton postulierten “ 0 ”-Potenzial führt also
dazu, dass die Planetenbahnen nicht mehr in sich geschlossen sind. Wie eingangs bereits erwähnt, hat man
eine solche Abweichung, also eine Periheldrehung der Planeten im Sonnensystem, tatsächlich beobachtet.
180
Der weitaus größte Teil dieses Effektes beruht aber auf der Wechselwirkung mit den anderen Planeten,
die wir hier nicht einbezogen haben. Auf diese Weise wurden sogar die äußeren Planeten Neptun und Pluto
“entdeckt”. Man fand in den Bahnen der bekannten Planeten Abweichungen von den Kepler-Ellipsen, die
sich nur dadurch erklären ließen, dass es noch weitere Planeten geben muss.
Unerklärt blieb jedoch bis ins Jahr 1916 die Periheldrehung, die man beim Merkur, also dem sonnennächsten Planeten beobachtet hatte. Zwar geht auch bei ihm der größte Teil der gemessenen Abweichung von der Keplerschen Ellipse auf die Anziehungskräfte der anderen Planeten zurück. Aber es stellte
sich heraus, dass eine zwar sehr kleine, aber nicht erklärbare Abweichung übrig blieb.
Diese Abweichung sollte in der Geschichte der Physik des letzten Jahrhunderts eine wichtige Rolle
spielen. Wir wollen daher ein wenig näher auf sie eingehen. Was man fand war eine Periheldrehung des
Winkelsekunden pro Erdjahrhundert. Mit anderen Worten, in hundert Erdjahren bewegte
Merkur von sich das Perihel des Merkur um
Winkelsekunden nach vorne. Umgerechnet ergibt sich daraus nach
unserer Konvention eine Periheldrehung des Merkur von
7: 0 6 (8.64)
Das ist natürlich unvorstellbar wenig. Trotzdem lässt sich dieser Wert leicht ermitteln, wenn man die Bahn
des Merkur über einige Jahrhunderte hinweg genau verfolgt. Der Grund dafür ist unter anderem, dass die
Merkurbahn stärker als die der anderen Planeten von einer Kreisbahn abweicht. Der jeweils sonnennächste
Punkt lässt sich daher sehr leicht beobachten. Für die Bahndaten findet man
6: 0 6
m
: 0 6 m
(8.65)
Nehmen wir nun an, diese Periheldrehung sei durch eine Abweichung des Gravitationsgesetzen von der
Art verursacht, wie wir sie hier untersucht haben. Dann folgt aus (8.63)
km (8.66)
Mit anderen Worten, das Gravitationsfeld der Sonne würde bei Abständen von einigen Kilometern deutliche Abweichungen vom Newtonschen Gesetz zeigen. Das ist natürlich unrealistisch, denn auf diesen
Skalen wäre es unsinnig die Sonne als Punktteilchen zu beschreiben, weil sie selbst ja viel größer ist.
Wir können eine solche Abweichung nicht direkt messen, indem wir uns dem Kraftzentrum nähern, weil
wir uns dann schon lange im Innern der Sonne befinden würden, wo das Kraftgesetz aus ganz anderen
Gründen nicht mehr gilt.
Trotzdem kann man sich fragen, ob es vielleicht irgendeinen Grund gibt, warum die Abweichung vom
Newtonschen Gravitationsgesetz gerade bei dieser Größenordnung auftritt, wenn es denn ein verändertes
Gravitationsgesetz ist, das diese Periheldrehung verursacht. Sicher spielt hier auch die Masse der Sonne eine Rolle, denn in irdischen Labors findet man, dass bei sehr viel kleineren beteiligten Massen das
Newtonsche Gesetz auch bei Abständen von viel weniger als einem Kilometer noch gilt.
Verblüffenderweise findet man, dass man durch geschicktes Kombinieren von Naturkonstanten und der
Sonnenmasse auch eine Größe bilden kann, die die Dimension einer Länge hat. Aus der Relation (8.47),
die Dimension Länge hoch drei geteilt durch
also dem dritten Keplerschen Gesetz, lesen wir ab, dass
Zeit zum Quadrat hat. Nun gibt es eine Naturkonstante, die die Dimension einer Geschwindigkeit hat. Sie
spielt zwar in der klassischen Mechanik keine besondere Rolle, jedoch in der Elektrodynamik und der
: 0 6 m s. Daraus können wir die Größe
Relativitätstheorie. Es ist die Lichtgeschwindigkeit 0 km
(8.67)
bilden. Überraschenderweise hat die sie gleiche Größenordnung wie die auf eine sehr naive Weise ermittelte Konstante . Eine solche “zufällige” Übereinstimmung von Größenordnungen ist ein deutlicher
Hinweis dafür, dass an der Vermutung eines veränderten Gravitationsgesetzes etwas dran ist.
181
Aber wie soll ein solchen verändertes Gravitationsgesetz aussehen? Darüber gibt die Messung der Periheldrehung keine Auskunft. Wir haben hier ja nur einen ganz speziellen Ansatz diskutiert. Es gibt viele
andere Möglichkeiten, das Gravitationsgesetz zu modifizieren. Fast alle führen im Rahmen der hier durchgeführten Näherung, und mit entsprechend angepassten Parametern, zum selben Ergebnis.
Es war deshalb sehr überraschend, dass eine aufgrund ganz anderer Überlegungen konstruierte Theorie
der Gravitation, nämlich die allgemeine Relativitätstheorie, genau die richtige Abweichung lieferte, ohne
dass man zusätzliche Annahmen machen musste. Damit war im Jahre 1916, also Einstein die endgültige
Version der Theorie veröffentlichte, das Rätsel der Periheldrehung des Merkur gelöst.
Wie genau diese Lösung aussieht, darauf können wir hier nicht näher eingehen, denn dazu müssten wir
erst einmal die allgemeine Relativitätstheorie verstehen. Was das Beispiel aber klar machen soll, ist, dass
es oft eine als zufällige erscheinende, unerklärbare Relation zwischen Messdaten und Naturkonstanten ist,
die auf eine noch unverstandene oder unbekannte Theorie hindeutet.
Die lange Zeit unerklärbare Beziehung zwischen den Bahndaten des Merkur und den Naturkonstanten
und ist eine der berühmtesten Beziehungen dieser Art, denn sie gilt also eine der wichtigesten frühen
experimentellen Bestätigungen der Relativitätstheorie. In der Geschichte der Physik gab es viele solche
‘’Schlüsselbeziehungen”, und es gibt sie natürlich auch heute noch.
182