theoretische physik

T HEORETISCHE P HYSIK
Hans-Jürgen Matschull
Institut für Physik, Universität Mainz
5.1.2003
T EIL I
T EILCHEN , K R ÄFTE , F ELDER
Was ist eine physikalische Theorie?
völlig kontextfrei in einer mathematischen Theorie definiert wurden. Sie stellt in diesem Sinne
eine Beziehung zwischen Mathematik und Realität her.
Auf diese Frage gibt es sicher keine eindeutige, allgemein akzeptierte und präzise Antwort. Verschiedene Physiker haben oft sogar sehr unterschiedliche Vorstellungen davon, was sich hinter
diesem Begriff verbirgt. Die Antworten reichen von sehr weit gefassten Umschreibungen wie
“eine physikalische Theorie ist eine Beschreibung von Naturvorgängen”, vielleicht noch ergänzt
durch den Zusatz “in der Sprache der Mathematik”, bis hin zu sehr konkreten Erklärungen wie
“eine physikalische Theorie ist eine -Algebra von beschränkten Operatoren auf einem HilbertRaum”.
Während die erste Definition viel zu vage ist, um damit konkret zu arbeiten, besticht die zweite
an dieser Stelle wohl vor allem durch ihre Unverständlichkeit. Wir wollen versuchen, eine einerseits möglichst allgemeine, auf die gesamte Physik anwendbare, aber andererseits auch sehr konkrete Definition zu geben. Eine solche Definition des Begriffes physikalische Theorie zur Hand
zu haben, wird sich an vielen Stellen als nützlich erweisen.
Was wollen wir mit einer physikalischen Theorie eigentlich erreichen? Zunächst wollen wir die
Phänomene beschreiben, die wir beobachten können. Darüber hinaus wollen wir Gesetzmäßigkeiten formulieren, die wir in diesen Phänomenen erkennen. In einem gewissen Sinne wollen
wir die Phänomene auch verstehen, indem wir sie auf möglichst wenige, vielleicht unerklärbare
Grundphänomene zurückführen. Und schließlich wollen wir mit Hilfe eine Theorie Vorhersagen
machen über zukünftige Phänomene und Beobachtungen, was auch zu der Möglichkeit von praktischen Anwendungen führt.
Als Werkzeug, und zwar sowohl als methodisches als auch als sprachliches Werkzeug, wollen
wir dabei die Mathematik verwenden. Eine physikalische Theorie baut auf einer mathematischen
Theorie auf. In einer mathematischen Theorie werden grundlegende Begriffe durch Axiome definiert. Axiome beschreiben die Objekte, aus denen eine mathematische Theorie aufgebaut wird,
durch ihre Eigenschaften und ihre Beziehungen zueinander. Die Axiome einer mathematischen
Theorie sagen allerdings nichts darüber aus, was diese Objekte sind. Sie sagen uns nur, wie sie
sich zueinander verhalten.
Genau das ist die Stärke der Mathematik. Sie lässt offen, was man sich unter den abstrakten Begriffe, die sie definiert, konkret vorstellen soll und kann. Und das ist auch genau die Schnittstelle,
an der eine physikalische Theorie ansetzt. Eine physikalische Theorie wählt aus einer mathematischen Theorie einige abstrakte Begriffe aus, und identifiziert sie mit realen, beobachtbaren
Objekten. Sie fügt zu den mathematischen Axiomen einer Theorie physikalische Axiome hinzu.
Ein physikalisches Axiom beantwortet also die Frage, was ein zunächst abstraktes mathematische Objekt ist. Es ordnet ihm ein Objekt in der realen Welt zu. Typischerweise wird eine solche
Zuordnung durch eine Messvorschrift hergestellt. Wie wir gleich im ersten Kapitel sehen werden,
können wir zum Beispiel eine Methode angeben, mit der wir den Abstand zweier Orte im Raum
messen können. Als eine andere Messgröße werden wir später die Zeit einführen. Sie wird, wie
sollte es anders sein, mit einer Uhr gemessen.
Eine physikalische Theorie identifiziert diese Messgrößen mit abstrakten Größen, die zuvor
Eine physikalische Theorie ist eine Abbildung von realen Objekten auf abstrakte
mathematische Strukturen.
Ein physikalische Theorie ist also mehr als reine Mathematik, denn die reine Mathematik kennt
eine solche Zuordnung nicht. Ihre Objekte existieren im luftleeren Raum der reinen Logik. Die
Physik erweckt die mathematischen Strukturen gewissermaßen zum realen Leben.
Eine physikalische Theorie ist aber andererseits auch mehr als eine reine Naturbeschreibung.
Durch die Abbildung der realen Objekte auf mathematische Strukturen macht sie sich nämlich
die sehr effektiven Möglichkeiten der Mathematik zu nutze, nahezu beliebig neue Objekte und
Strukturen einführen zu können. Die Stärke einer physikalischen Theorie liegt darin, mit diesen
Objekten und Strukturen rechnen und arbeiten zu können, ohne sich darüber Gedanken machen
zu müssen, welchen realen Objekten sie entsprechen.
Um mit Hilfe einer Theorie eine Vorhersage über eine zukünftige Beobachtung zu machen,
gehen wir in der Regel so vor, dass wir die bereits durchgeführten Messungen und Beobachtungen zunächst in die Sprache der Mathematik übersetzen. Dazu benötigen wir die Abbildung
der Realität auf die Mathematik, die eine physikalische Theorie herstellt. Dann können wir, ganz
ohne Bezug zur Realität, reine Mathematik betreiben, um aus unseren Beobachtungen logische
Schlüsse zu ziehen. Erst dann tauchen wir wieder auf, indem wir die Ergebnisse wieder in eine physikalische Sprache zurück übersetzen und so zum Beispiel das Ergebnis einer Messung
vorhersagen.
Es ist dabei nicht nötig, mit allen in den Zwischenschritten verwendeten Begriffen und Zusammenhängen irgendwelche physikalischen, also realen Vorstellungen zu verbinden. Meistens geht
das auch gar nicht, weil nur sehr wenige der in einer Theorie definierten mathematischen Objekte überhaupt einen direkten Bezug zur physikalischen Realität haben. Und in der Regel sind dies
auch nicht die durch die mathematischen Axiome definierten Objekte, sondern daraus abgeleitete,
also im mathematischen Sinne komplexere Objekte. Die im mathematischen Sinne “primitiven”
Objekte einer Theorie, also die, die durch die mathematischen Axiome definiert werden, müssen
nicht gleichzeitig die im physikalischen Sinne “primitiven” Objekte sein, also diejenigen, die
unmittelbar der Beobachtung oder Messung zugänglich sind.
In den klassischen Theorien, die wir hier zunächst einführen werden, liegen Mathematik und
Realität noch sehr eng beieinander. Die meisten mathematischen Größen haben zumindest eine anschauliche Entsprechung in der Realität, auch wenn sie nicht einer unmittelbaren Messung
zugänglich sind. Die meisten mathematischen Konstruktionen, die wir in diesen Theorien benötigen, können wir uns unmittelbar anschaulich vorstellen, was das Verständnis oft sehr erleichtert.
Jedoch besteht dadurch auch ein wenig die Gefahr, die wahre Stärke eine physikalischen Theorie
zu verkennen. Das ist die Fähigkeit, auch mit mathematischen Objekten arbeiten zu können, die
keinen direkten Bezug zur Realität mehr haben, oder deren Bezug zur Realität wir nicht kennen.
Spätestens, wenn wir uns mit der Quantenmechanik beschäftigen, werden wir mit dieser Tatsache ganz unmittelbar konfrontiert werden. Dort treten nämlich mathematische Strukturen auf,
1
(d)
1
die wir für die Berechnungen benötigen, von denen wir aber nicht sagen können, welchen realen Strukturen sie eigentlich entsprechen. Das führt sogar zu allerlei metaphysikalischen, also
philosophischen Fragen darüber, was man von so einer Theorie eigentlich halten soll. Aber entscheidend ist, dass sie sehr gut funktioniert, und zwar selbst dann, wenn wir nicht von allen
mathematischen Begriffen, die wir benutzen, den Zusammenhang mit der Realität kennen.
Viel tiefer wollen wir an dieser Stelle nicht in die Frage nach dem Wesen eine physikalischen
Theorie einsteigen. Vieles verstehen wir ohnehin erst, wenn wir ein paar Beispiele für physikalische Theorien kennen und vor allem benutzen gelernt haben. Die grundlegende Eigenschaft
einer physikalischen Theorie, also die Definition einer Abbildung der Realität auf die Mathematik, sollten wir jedoch stets im Auge behalten, wenn wir verstehen wollen, was eine physikalische
Theorie leisten kann und vor allem was sie nicht leisten kann.
(b)
(a)
(c)
Abbildung 1.1: Vektoren werden durch Pfeile im Raum dargestellt. Zwei Pfeile repräsentieren
denselben Vektor, wenn sie durch eine Verschiebung (a) aufeinander abgebildet werden. Die
Addition (b) von Vektoren erfolgt durch Zusammensetzen, die skalare Multiplikation (c) durch
Strecken der Pfeile. Der inverse Vektor ergibt sich durch Umkehren der Richtung.
Die Struktur des Raumes
Den physikalischen Raum stellen wir uns als eine Menge von Punkten vor. Einen Punkt oder Ort
im Raum können wir durch einen Gegenstand markieren, etwa die Ecke eines Tisches oder den
Mittelpunkt der Erde. Natürlich müssen wir an dieser Stelle ein wenig idealisieren, denn in der
Praxis können wir einen Ort immer nur mit einer endlichen Genauigkeit bestimmen. Weder die
Ecke eines Tisches noch der Mittelpunkt der Erde definiert einen wirklich punktförmigen Ort im
Raum. Wir können uns aber vorstellen, dass wir einen Ort beliebig genau festlegen können, wenn
wir unsere Methoden nur immer weiter verfeinern. Jedenfalls beruht die klassische Physik auf der
Annahme, dass das im Prinzip möglich ist.
Aber der Raum besteht nicht nur einfach aus einer Menge von Punkten, sondern diese Menge hat auch einer Struktur. Die klassische Physik geht davon aus, dass der physikalische Raum
die Struktur eines dreidimensionalen Euklidischen Raumes besitzt. In einem Euklidischen Raum
sind die aus der Geometrie bekannten Größen wie Längen und Winkel definiert, es gibt Operationen wie Verschiebungen und Drehungen, und das Konzept der Vektorrechnung. Allen diesen
mathematischen Strukturen entsprechen gewisse physikalische Strukturen des Raumes.
Im Sinne der Einleitung ist dies bereits eine physikalische Theorie. Die Euklidische Geometrie
macht Aussagen über bestimmte Größen, die wir im physikalischen Raum messen können, und
über Beziehungen zwischen solchen Messgrößen, die wir experimentell nachprüfen können. Sie
ist daher die älteste physikalische Theorie im modernen Sinne, obwohl die Erkenntnis, dass es
eine solche ist, relativ neu ist. Alle üblicherweise als “klassisch” bezeichneten physikalischen
Theorien, darunter die Newtonsche Mechanik und die Maxwellsche Elektrodynamik, bauen auf
dieser Theorie über die Struktur des Raumes auf.
Wir werden uns deshalb in diesem und dem nächsten Kapitel etwas ausführlicher mit der Euklidischen Geometrie beschäftigen und zeigen, in welchen Sinne sie als physikalische Theorie
zu verstehen ist. Allerdings werden wir sie nicht auf den traditionellen Euklidischen Axiomen
aufbauen, sondern eine für unsere Zwecke etwas besser geeignete Formulierung verwenden. Sie
baut auf dem Konzept eines metrischen affinen Raumes auf. Was das ist, werden wir natürlich erst
einmal erklären.
Vektorräume
Bevor wir den physikalischen Raum selbst als Punktmenge beschrieben, ist es nützlich, das
Konzept eines Vektors einzuführen. Die wichtigsten Eigenschaften von Vektoren sind in Abbildung 1.1 dargestellt. Einen Vektor stellen wir uns als einen Pfeil im Raum vor. Ein Pfeil ist die
gerichtete Verbindungslinie zweier Punkte. Ein Pfeil hat eine Länge und eine Richtung. Wir betrachten zwei Vektoren als gleich, wenn sie durch Pfeile gleicher Länge und Richtung dargestellt
werden. Das ist genau dann der Fall, wenn die Pfeile durch eine Verschiebung ineinander übergehen. Schließlich können wir Vektoren addieren, indem wir die Pfeile aneinander ansetzen, und
wir können sie mit reellen Zahlen multiplizieren, indem wir die Pfeile strecken bzw. stauchen.
Aus dieser anschaulichen Vorstellung wird das mathematische Konzept eines Vektorraumes
abgeleitet. Ein Vektorraum über dem Körper der reellen Zahlen besteht aus einer Menge von
Vektoren. Wir bezeichnen Vektoren durch ein Symbol mit Pfeil, das heißt wir schreiben
für die Elemente von . Die Struktur des Vektorraums wird durch zwei Abbildungen festgelegt,
nämlich die Addition von Vektoren,
Vektoraddition
(1.1)
und die skalare Multiplikation von Vektoren mit reellen Zahlen,
skalare Multiplikation
(1.2)
Bezüglich der Addition bildet der Vektorraum eine abelsche Gruppe, das heißt die Addition ist
2
gilt
kommutativ und assoziativ. Für alle
Aus der Symmetrie (1.8) folgen dann natürlich auch die entsprechenden Eigenschaften bezüglich
des zweiten Argumentes,
(1.10)
einen inversen Vektor
, sowie zu jedem Vektor
Schließlich ist das Skalarprodukt eines Vektors mit sich selbst stets positiv und nur dann gleich
Null, wenn der Vektor der Nullvektor ist. Es gilt also für alle
Außerdem gibt es einen Nullvektor
, so dass
(1.3)
(1.4)
(1.11)
und in , und mit der
Die skalare Multiplikation ist distributiv bezüglich der Additionen in
Multiplikation in verträglich. Für alle
und alle
gilt
Wegen der Assoziativität der Addition (1.3) können wir statt
oder
auch
einfach
schreiben. Das gleiche gilt für die skalare Multiplikation. Wegen der dritten Eigenschaft in (1.5), also der Verträglichkeit mit der Multiplikation in , schreiben wir statt
oder
einfach
. Und schließlich benutzen wir für
die Abkürzung
.
(1.5)
Auch hier können wir wieder die Eigenschaften des Skalarproduktes verwenden, um die Schreibweise zu vereinfachen. Statt
oder
schreiben wir einfach
. Wir müssen bei
solchen vereinfachten Schreibweisen nur darauf achten, dass auf beiden Seiten des Punktes stets
ein Vektor steht. Wir verwenden außerdem die Abkürzung
.
Ein Vektorraum, auf dem ein Skalarprodukt definiert ist, heißt metrischer Vektorraum. In einem
einen Betrag, der durch das Skalarprodukt des
metrischen Vektorraum hat jeder Vektor
Vektors mit sich selbst definiert ist,
(1.12)
Betrag
Aufgabe 1.1 Man zeige, dass es zu je zwei Vektoren
stets genau einen Vektor
gibt
, und dass es demnach auch nur genau einen Nullvektor
, und zu jedem Vektor
mit
nur genau einen inversen Vektor
gibt.
Aufgabe 1.2 Man beweise, dass für alle
folgende Identitäten gelten:
(1.6)
Der Betrag eines Vektors ist stets positiv, nur der Nullvektor hat den Betrag Null. Oft spricht man
statt vom Betrag auch von der Länge eines Vektors. Wir wollen das Wort “Länge” aber für einen
anderen Begriff reservieren, auf den wir am Ende dieses Kapitels näher eingehen werden. Der
Begriff des Betrages ist ein wenig allgemeiner, wie wir dort sehen werden.
Einen Vektor
, der die Eigenschaft
hat, dessen Betrag also gleich Eins ist,
nennen wir Einheitsvektor. Ein Einheitsvektor definiert quasi nur eine Richtung. Zu jedem Vektor
gibt es einen Einheitsvektor , der in dieselbe Richtung zeigt wie , nämlich
.
Mit Ausnahme des Nullvektors lässt sich jeder Vektor auf diese Weise eindeutig in Betrag und
Richtung zerlegen,
(1.13)
mit
(1.7)
Um auszudrücken, dass der Vektor in die Richtung von zeigt, schreiben wir
, das heißt
ist zu proportional. Das ist genau dann der Fall, wenn es ein
gibt mit
.
ist, so nennen wir die
Wenn das Skalarprodukt von zwei Vektoren verschwindet, also
Vektoren orthogonal und schreiben
. Der Nullvektor ist in diesem Sinne zu allen Vektoren,
auch zu sich selbst, orthogonal. Dass diese Sprechweise tatsächlich etwas mit rechten Winkeln zu
tun hat, wird in Aufgabe 1.20 gezeigt.
Skalarprodukt
Um den Betrag und die Richtung eines Vektors zu definieren, benötigen wir als zusätzliche Struktur auf dem Vektorraum ein Skalarprodukt oder eine Metrik. Die beiden Begriffe werden oft
synonym verwendet. Ein Skalarprodukt ist eine Abbildung, die jedem Paar von Vektoren eine
reelle Zahl zuordnet,
Das Skalarprodukt
gilt
(1.8)
Es hat die folgenden Eigenschaften. Es ist symmetrisch, das heißt für alle
Aufgabe 1.3 Man beweise die binomischen Formeln
Außerdem es linear, das heißt es verhält sich distributiv gegenüber der Addition, und es ist mit
der skalaren Multiplikation verträglich. Für alle
und alle
gilt
3
(1.9)
(1.14)
replacements
(c)
(d)
Basis und Dimension
Um in einem Vektorraum konkrete, also numerische Rechnungen durchzuführen, müssen wir eine
Basis einführen. Eine Basis ermöglicht es, das formale Rechnen mit Vektoren auf das Rechnen
mit Zahlen zurückzuführen. Das benötigen wir, um später zum Beispiel ganz konkret die Bahn
eines Körpers im Raum zu berechnen, was ja eine typische Aufgabe der Mechanik ist.
Wir betrachten einen Vektorraum , sowie einen Satz von beliebig ausgewählten Vektoren
, wobei
eine positive ganze Zahl ist. Der Index , mit dem wir die einzelnen
Vektoren durchnummerieren, soll im folgenden immer von bis laufen, also Werte aus der
Indexmenge
annehmen. Den kompletten Satz von Vektoren bezeichnen wir mit
.
Wir können ihm gewisse Begriffe und Eigenschaften zuordnen.
Eine Linearkombination der Vektoren
ist ein Ausdruck der Form
(b)
(a)
Abbildung 1.2: Ein Vektor lässt sich eindeutig in einen Anteil
proportional und einen Anteil
senkrecht zu einem Einheitsvektor zerlegen (a). Das Skalarprodukt
repräsentiert die
orthogonale Projektion von auf die Richtung von (b).
(1.20)
mit
.
Wir multiplizieren jeden Vektor mit einer reellen Zahl und addieren die Ergebnisse zu einem
neuen Vektor. Die Zahlen
, die wir ebenfalls zu einem Satz
zusammenfassen können,
sind die Koeffizienten der Linearkombination.
heißt vollständig, wenn jeder Vektor
als Linearkombination
Ein Satz von Vektoren
der gegebenen Vektoren dargestellt werden kann. Es existiert also für jeden Vektor
ein Satz
mit
von reellen Zahlen
(1.21)
Aufgabe 1.4 Man beweise die folgenden Eigenschaften des Skalarproduktes. Bei Multiplikation
eines Vektors mit einer reellen Zahl wird dieser um den Faktor
gestreckt, das heißt f ür alle
und alle
gilt
(1.15)
Aus der Kenntnis der Beträge aller Vektoren kann man das Skalarprodukt rekonstruieren. Es gilt
nämlich für alle
(1.16)
Wir sagen in diesem Fall auch, dass der Vektorraum von den Vektoren
aufgespannt wird.
Ein Satz von Vektoren
heißt linear unabhängig, wenn das Gleichungssystem
die Schwarzsche Ungleichung
Außerdem gilt für alle Vektoren
(1.17)
(1.22)
Wann gilt hier das Gleichheitszeichen?
Man zeige, dass eine solche orthogonale Zerlegung immer existiert, dass sie sogar eindeutig ist,
wie folgt darstellen lassen,
und dass sich die Vektoren und
für die Variablen
nur genau dann erfüllt ist, wenn alle
sind. Es gibt also nur genau
, die als Ergebnis den Nullvektor liefert. Das ist die,
eine Linearkombination der Vektoren
bei der alle Koeffizienten gleich Null sind.
Eine Basis von
ist ein Satz von Vektoren
, der sowohl linear unabhängig als auch
vollständig ist. Wenn
eine Basis von ist, dann lässt sich jeder Vektor
auf genau
eine Art und Weise als Linearkombination der Basisvektoren schreiben. Es gibt also zu jedem
Vektor genau einen Satz von Komponenten
, so dass
(1.19)
(1.23)
Aufgabe 1.5 Eine weitere nützliche Eigenschaft des Skalarproduktes ist in Abbildung 1.2(a) dargestellt. Es sei irgendein Vektor und ein Einheitsvektor. Dann kann man in zwei Vektoren
und
zerlegen, und zwar so, dass
zu proportional ist, und
zu senkrecht steht, also
(1.18)
Aufgabe 1.6 In Abbildung 1.2(b) wird gezeigt, dass das Skalarprodukt
die orthogonale
Projektion eines Vektors auf einen Einheitsvektor definiert. Wie ist das zu verstehen? Warum
kann die orthogonale Projektion von auf nur Werte zwischen
und
annehmen?
Dass es mindestens einen solchen Satz gibt, ergibt sich aus der Vollständigkeit der Basisvektoren.
Dass es für jeden Vektor nur genau einen Satz von Komponenten gibt, folgt aus der linearen
4
natürlich die Dimension von . Explizit ist die Abbildung wie folgt gegeben,
Dabei ist
ein zweiter Satz von Komponenten mit der
Unabhängigkeit der Basisvektoren. Sei nämlich
Eigenschaft (1.23). Dann ist
(1.26)
mit
Basis
(1.24)
eine Basis eines dreidimensionalen Vektorraumes . Ferner sei
Aufgabe 1.9 Es sei
. Somit folgt wegen
Das ist ein Gleichungssystem der Form (1.22) für die Variablen
der linearen Unabhängigkeit der Basisvektoren, dass alle gleich Null sind, also
.
Wenn es eine Basis von gibt, die aus Vektoren besteht, dann besteht jede andere Basis von
auch aus Vektoren. Das ergibt sich aus dem folgenden, sogar noch etwas allgemeineren Satz.
(1.27)
vollständig? Sind sie linear unabhängig?
bzw.
Sind die Vektoren
Vektoren, und
ist.
, mit
ein linear unabhängiger Satz von
ein vollständiger Satz von Vektoren. Man zeige, dass
Aufgabe 1.7 Es sei
mit
Aufgabe 1.10 Es sei ein -dimensionaler Vektorraum. Warum ist jeder vollst ändige Satz von
genau Vektoren eine Basis von ? Warum ist jeder linear unabh ängige Satz von genau Vektoren eine Basis von ?
Da jede Basis sowohl vollständig als auch linear unabhängig ist, folgt daraus, dass jede Basis
aus gleich vielen Vektoren bestehen muss. Die Zahl der Basisvektoren ist eine Eigenschaft
bezeichnet. Wir
des Vektorraumes . Sie wird als Dimension bezeichnet und mit
betrachten hier nur endlich-dimensionale Vektorräume, also solche, die eine Basis aus endlich
vielen Vektoren besitzen.
Mit Hilfe einer Basis lässt sich das Rechnen mit Vektoren auf das Rechnen mit reellen Zahlen
zurückführen. Um eine Vektoraddition oder eine skalare Multiplikation durchzuführen, müssen
wir nur die entsprechende Operation auf die Komponenten der Vektoren bezüglich irgendeiner
Basis anwenden.
(1.28)
und für alle
bzw.
die folgenden Rechenregeln
erklären. Man zeige, dass die Vektorraumaxiome erfüllt sind, dass dieser Vektorraum aber keine
Basis
aus endlich vielen Vektoren, also Funktionen
besitzt.
Aufgabe 1.8 Man zeige, dass für alle
gelten,
Aufgabe 1.11 Nicht jeder Vektorraum ist endlich-dimensional. Der Raum aller (stetigen, differenzierbaren, integrierbaren, ...) Funktionen
wird zu einem Vektorraum, wenn wir die Addition zweier Funktionen
und die skalare Multiplikation einer Funktion
mit einer reellen Zahl
durch
Orthonormalbasis und Kronecker-Symbol
(1.25)
Um auch das Skalarprodukt und damit den Betrag eines Vektors durch eine einfache Funktion seiner Komponenten auszudrücken, müssen wir eine spezielle Art von Basis wählen. Es sei zunächst
, mit
, irgendeine Basis eines -dimensionalen metrischen Vektorraumes .
Dann gilt für das Skalarprodukt von zwei Vektoren
aller -Tupel von reellen Zahlen ist natürlich selbst ein Vektorraum, wobei die
Der Raum
Addition und die skalare Multiplikation eintragsweise erklärt sind, also
bzw.
. Das entspricht genau den entsprechenden Operationen in (1.25), so dass
durch die Zuordnung eines Vektors
zu seinen Komponenten
eine lineare
Abbildung definiert wird.
Eine Abbildung zwischen zwei Vektorräumen heißt linear, wenn sie mit der Vektoraddition und
der skalaren Multiplikation verträglich ist. Die Summe von zwei Vektoren wird auf die Summe
der Bilder der beiden Vektoren abgebildet, und das skalare Vielfache eines Vektors auf des entsprechende Vielfache des Bildes. Genau das ist die Aussage von (1.25). Ist die Abbildung zudem
bijektiv, so werden die beiden Vektorräume vollständig miteinander identifiziert. Wir können die
Eigenschaften einer Basis daher wir folgt zusammenfassen:
(1.29)
Um diesen Ausdruck weiter umzuformen, müssen wir einen der Indizes umbenennen. Dann
können wir die Summen aus dem Skalarprodukt herausziehen, indem die Eigenschaft (1.9) verwenden,
5
.
Eine Basis ist eine bijektive lineare Abbildung
(1.30)
Das Skalarprodukt zweier Vektoren ist durch die Summe der Produkte ihrer Komponenten
bezüglich einer Orthonormalbasis gegeben. Für den Betrag eines Vektors gilt dann die einfache
Formel
(1.36)
Aufgabe 1.12 Man mache sich die einzelnen Schritte dieser Umformung durch explizites Ausschreiben der Summen klar. Warum ist es unbedingt nötig, den Indizes, über die jeweils summiert
wird, verschiedene Namen zu geben?
hätte die folgende spezielle Eigenschaft. Für die Skalarpro-
das heißt das Quadrat des Betrages eines Vektors ist durch die Summe der Quadrate seiner Komponenten gegeben.
(1.31)
Aufgabe 1.13 Im folgenden laufen alle Indizes von bis , und es sei
ein beliebiger Satz
von Vektoren. Man beweise die folgenden allgemeinen Rechenregeln f ür das Kronecker-Symbol,
für
für
Orthonormalbasis
Nehmen wir nun an, die Basis
dukte der Basisvektoren gilt
Eine solche Basis heißt Orthonormalbasis. Die spezielle Eigenschaft einer Orthonormalbasis ist,
dass alle Basisvektoren Einheitsvektoren sind, und dass sie paarweise zueinander senkrecht stehen. Genau das wird durch die Forderung (1.31) ausgedrückt.
(1.37)
Eine Orthonormalbasis besteht aus zueinander orthogonalen Einheitsvektoren.
Man berechne anschließend
für
für
(1.32)
Der Einfachheit halber fasst man Summen über mehrere Indizes zu einem Summenzeichen zusammen. Man mache sich klar, dass die Reihenfolge, in der die einzelnen Summationen ausgef ührt
werden, unerheblich ist.
KroneckerSymbol
(1.38)
Es ist nützlich, für die Eigenschaft (1.31) der Basisvektoren ein spezielles Symbol einzuführen.
Es heißt Kronecker-Symbol und wird wie folgt definiert,
Die Eigenschaft (1.31) einer Orthonormalbasis lässt sich dann sehr einfach durch die Gleichung
(1.33)
Aufgabe 1.14 Man zeige mit Hilfe des Kronecker-Symbols, dass die Komponenten
eines
Vektors
bezüglich einer Orthonormalbasis
durch die orthogonalen Projektionen des
Vektors auf die Basisvektoren gegeben sind, also
ausdrücken. Ferner lassen sich Summen, in denen das Kronecker-Symbol auftritt, sehr leicht vereinfachen. So gilt zum Beispiel für einen beliebigen Satz
von reellen Zahlen die Regel
(1.39)
(1.34)
Aufgabe 1.15 Man beweise, dass jeder endlich-dimensionale metrische Vektorraum eine Orthonormalbasis besitzt.
Wenn unter einer Summe ein Kronecker-Symbol steht, wobei über einen der beiden Indizes summiert wird, so bleibt von der Summe nur ein Term übrig, nämlich der, für den die beiden Indizes
gleich sind. Das Kronecker-Symbol greift gewissermaßen einen der Summanden aus der Summe
heraus und vernichtet alle anderen. Natürlich gilt das nur, wenn alle beteiligten Indizes, hier also
und , denselben Wertebereich haben. Da hier alle Summen von bis laufen, und auch alle
Indizes, über die nicht summiert wird, Werte von bis annehmen, ist das stets gewährleistet.
Wenn wir die Eigenschaft (1.33) der Basisvektoren in (1.30) einsetzen und anschließend diese Regel auf die Summe über den Index anwenden, so erhalten wir den folgenden einfachen
Ausdruck für das Skalarprodukt von zwei Vektoren,
Affine Räume
Wir wollen nun die anschauliche Vorstellung von einem Vektor als Pfeil, das heißt als gerichtete
Verbindungslinie zweier Punkte im Raum, mathematisch präzise formulieren. Wir benötigen dazu
das Konzept eines affinen Raumes.
Ein affiner Raum besteht aus einem Punktraum und einem zugeordneten Vektorraum . Die
bezeichnen, repräsentieren die PunkElemente von , die wir mit großen Buchstaben
te oder die Orte im Raum. Die Elemente von , die wir wieder
nennen, repräsentieren
6
(1.35)
Punktraumes auf sich selbst,
(1.42)
mit
Verschiebung
Diese Abbildung ist eine Verschiebung um den Vektor . Jeder Punkt wird durch den Vektor
auf einen Punkt
verschoben.
Eine Verschiebung hat genau die Eigenschaft, die wir am Anfang postuliert haben. Betrachten
zweier beliebiger Punkte, und verschieben beide, wie in
wir nämlich den Abstandsvektor
Abbildung 1.3(b) gezeigt, um einen Vektor , so gilt gemäß der Definition einer Verschiebung für
die Bildpunkte
und
. Daraus folgt
(c)
(b)
(a)
Abbildung 1.3: Vektoren werden in einem affinen Raum durch Pfeile dargestellt, die jeweils zwei
Punkte miteinander verbinden. Zeigt ein Pfeil von nach und ein anderer von nach , so
wird die Summe der beiden Vektoren durch einen Pfeil von nach dargestellt (a). Verschiebt
man sowohl den Anfangs- als auch den Endpunkt eines Pfeiles jeweils um einen Vektor
, so bleibt der Abstandsvektor
der beiden Punkte unverändert (b).
zweier Punkte ist durch den Betrag des Abstandsvektors
gegeben (c).
Der Abstand
(1.43)
Der Abstandsvektor wird durch die Verschiebung nicht verändert. Das ist genau die anschauliche
Eigenschaft eines Vektors, von der wir ausgegangen sind. Ein Vektor verändert sich nicht, wenn
wir ihn im Raum verschieben. Wir können das wie folgt zusammenfassen:
Ein affiner Raum besteht aus einem Punktraum und einem Vektorraum. Ein Vektor
wird durch einen Pfeil dargestellt und erzeugt eine Verschiebung im Punktraum.
die Vektoren, die durch Pfeile im Raum dargestellt werden. Die Beziehung zwischen dem Punktraum und dem Vektorraum ist durch eine Abbildung festgelegt, die je zwei Punkten einen
Abstandsvektor zuordnet,
(1.40)
Der Abstandsvektor
wird anschaulich durch einen Pfeil dargestellt, der vom Punkt
gilt
Punkt zeigt. Er soll folgende Eigenschaften haben. Für alle
zum
(1.41)
Das ist die formale Schreibweise für die in Abbildung 1.3(a) dargestellte Vorschrift, nach der
Vektoren durch das Zusammensetzen der entsprechenden Pfeile addiert werden. Zeigt ein Pfeil
von nach und ein zweiter Pfeil von nach , so wird die Summe der beiden durch einen
Pfeil von nach dargestellt.
Zusätzlich müssen wir noch verlangen, dass die Abbildung (1.40) im folgenden Sinne umkehrund jedem Vektor
gibt es genau einen Punkt
, so dass
bar ist. Zu jedem Punkt
ist. Um einen Vektor als Pfeil darzustellen, können wir einen beliebigen Anfangspunkt
wählen. Der Vektor zeigt dann von dort zu einem eindeutig definierten Punkt . Dadurch ist
unter anderem garantiert, dass wir immer die Vorschrift (1.41) anwenden können, um zwei Pfeile
zu addieren. Wir können den Anfangspunkt des zweiten Pfeiles stets so wählen, dass er mit dem
Endpunkt des ersten Pfeiles übereinstimmt.
Wir können diese Eigenschaft eines affinen Raumes auch anders interpretieren. Wir betrachten
und halten diesen fest. Zu jedem Punkt
gibt es dann genau einen
einen Vektor
Punkt
, so dass
ist. Folglich definiert der Vektor
eine Abbildung des
Tatsächlich ist das der Ursprung des Wortes “Vektor”. Es leitet sich aus dem lateinischen vehere
(etwas fahren, transportieren) ab. Ein Vektor transportiert etwas von einem Ort zum anderen. Statt
als Pfeil im Punktraum können wir uns einen Vektor auch als Verschiebung, das heißt als eine
Operation auf dem Punktraum vorstellen. Entscheidend ist dabei, dass ein Vektor eine gerichtete
Größe ist. Ein Pfeil zeigt in eine bestimmte Richtung, genau wie eine Verschiebung.
Eine Größe, die in irgendeiner Weise mit einer Richtung im Raum verknüpft ist, wird stets
durch einen Vektor dargestellt. Im Gegensatz dazu bezeichnet man eine Größe, die nicht gerichtet
ist, als Skalar. Daher kommt auch die Bezeichnung “Skalarprodukt” und “skalare Multiplikation”.
Eine reelle Zahl ist ein Skalar. Die Bezeichnung leitet sich aus dem Wort Skala ab, da man den
Wert eines Skalars an einer Skala ablesen kann, den Wert eines Vektors jedoch nicht, da es eine
gerichtete Größe ist.
Ein gutes Beispiel, um diesen Unterschied deutlich zu machen, ist die Definition des Abstands
zweier Punkte in einem affinen Raum, die in Abbildung 1.3(c) dargestellt ist. Ist der zugeordnete
zweier Punkte und im
Vektorraum ein metrischer Vektorraum, so ist der Abstand
Punktraum durch den Betrag des Abstandsvektors
definiert,
Abstandsvektor
(1.44)
Abstand
7
Auf diese Weise wird dem Vektor, also der gerichteten Größe
, ein Skalar, also eine ungerichtete Größe
zugeordnet. Wenn zum Beispiel zwei verschiedene Punkte und gleich weit
von einem Punkt entfernt sind, so gilt
, das heißt die ungerichteten Abstände sind
Wir identifizieren die Orte im physikalischen Raum mit den Punkten eines dreidimensionalen
Euklidischen Raumes, den wir mit
bezeichnen. Jedem Punkt
entspricht ein Ort im
Raum, den wir ebenfalls mit bezeichnen. Wir können diese Zurordnung einer physikalischen
Struktur zu einer mathematischen Struktur auch als Messvorschrift verstehen. Wir messen einen
Ort, also einen Punkt
, indem wir ihn mit einem Gegenstand markieren.
Damit allein können wir allerdings noch nicht viel anfangen. Wir können jetzt zwar verschiedene Orte messen, indem wir sie markieren, aber wir können daraus noch keine Aussagen über
die Struktur des Raumes ableiten, die wir experimentell testen können, oder mit deren Hilfe wir
Voraussagen über noch nicht durchgeführte Messungen machen können. Eine Messvorschrift allein für einzelne Punkte reicht noch nicht aus, um mit der Theorie sinnvolle Aussagen machen zu
können.
Wie benötigen noch andere Messvorschriften. Eine Messgröße, die sich dazu anbietet, ist der
Abstand zweier Orte. Mit einem geeigneten Messinstrument, zum Beispiel einem Maßband, auf
dem wir eine Skala angebracht haben, können wir den Abstand zweier Orte und messen.
Wir legen das Maßband zwischen den zuvor markierten Orten an, spannen es, und lesen die Skala
an der Stelle und an der Stelle
ab. Dann bilden wir den Betrag der Differenz der beiden
Skalenwerte, und nennen das Ergebnis den Abstand von und .
Das klingt zunächst sehr primitiv, und es ist wohl kaum möglich, auf diese Weise etwa den
Abstand von hier zum Mond zu messen, oder den Durchmesser eines Atoms. Darauf kommt es
aber im Moment nicht an. Entscheidend ist nur, dass wir eine Messvorschrift definiert haben, die
anwendbar ist, und die im Rahmen einer
zumindest auf bestimmte Paare von Orten und
gewissen Messgenauigkeit ein reproduzierbares Ergebnis liefert.
Damit das Ergebnis reproduzierbar ist, also eine zweite Messung dasselbe Ergebnis liefert,
muss die Skala auf dem Maßband regelmäßig sein. Regelmäßig heißt, dass die Skalenstriche immer den gleichen Abstand haben. Diese Forderung hört sich zunächst etwas merkwürdig an, weil
ja durch das Maßband die Größe Abstand überhaupt erst definiert wird. Sie ist aber durchaus
sinnvoll und lässt sich auch überprüfen, nämlich indem man dieselbe Abstandsmessung mehrmals wiederholt und dabei unterschiedliche Abschnitte des Maßbandes verwenden. Eine gutes
Maßband erkennen wir daran, dass es reproduzierbare Ergebnisse liefert.
Die so definierte Messgröße bilden wir nun auf eine mathematische Größe ab, die wir in der
Theorie bereits eingeführt haben. Das ist natürlich die Größe mit dem gleichen Namen, also der
, der über den Abstandsvektor und dessen Betrag, also das Skalarprodukt definiert
Abstand
ist. Sobald wir diese Zuordnung einer physikalischen Messgröße zu einer mathematischen Größe
vorgenommen haben, wird unsere Theorie zu einer experimentell überprüfbaren Theorie über die
Struktur des Raumes.
Sie macht jetzt nämlich Aussagen über Beziehungen zwischen Messgrößen, die wir durch
nachmessen überprüfen können. Es ist nicht ganz leicht, solche Aussagen zu finden, die nicht
ganz trivial sind und allein auf der Messung von Längen beruhen. Da es aber sehr wichtig ist, zu
verstehen, warum genau in diesem Moment der Übergang von der reinen Mathematik zur Physik
stattgefunden hat, wollen wir ein Beispiel für eine solche Vorhersage ganz explizit vorführen.
gleich. Die Vektoren
und
, also die gerichteten Größen, die neben der Information über
den Abstand auch noch die Richtungsinformation tragen, sind jedoch nicht gleich.
Ein affiner Raum, auf dem auf diese Weise der Abstand zweier Punkte definiert ist, heißt metrischer affiner Raum, oder auch Euklidischer Raum. Um die Struktur des physikalischen Raumes zu
beschreiben, müssen wir nur noch sagen, was die Dimension eines affinen Raumes ist. Sie ist ein.
fach durch die Dimension des zugeordneten Vektorraumes definiert. Es gilt also
ist.
genau dann gleich Null ist, wenn
und
und dass der Abstand zweier Punkte
Aufgabe 1.16 Man zeige, dass sich der Nullvektor und der inverse Vektor wie folgt als Pfeile
darstellen lassen,
(1.45)
genau
in einem
(1.46)
Wann gilt das Gleichheitszeichen?
Aufgabe 1.20 Aus der Euklidischen Geometrie kennen wir den Satz des Pythagoras, wonach ein
genau dann im Punkt rechtwinklig ist, wenn für die Seitenlängen die Beziehung
Dreieck
mit
(1.47)
gilt. Man zeige, dass dieser Satz auch in einem metrischen affinen Raum gilt, wobei rechte Winkel
und Längen über das Skalarprodukt der entsprechenden Abstandsvektoren definiert sind.
Da wir jetzt wissen, was ein metrischer affiner Raum, also ein Euklidischer Raum ist, und was
die Dimension eines affinen Raumes ist, können wir an dieser Stelle unsere erste physikalische
Theorie explizit formulieren. Die Kurzfassung lautet:
Der physikalische Raum hat die Struktur eines dreidimensionalen Euklidischen
Raumes.
8
Der physikalische Raum
Aufgabe 1.19 Man beweise die Dreiecksungleichung. Für je drei Punkte
metrischen affinen Raum gilt
und zu jedem Vektor
Aufgabe 1.18 Man beweise, dass es zu jedem Punkt
einen Punkt
gibt mit
.
Aufgabe 1.17 Verschiebungen lassen sich wie alle Abbildungen durch Verkettung verkn üpfen.
Man zeige, dass die Verknüpfung zweier Verschiebungen wieder eine Verschiebung ist, und dass
die Menge aller Verschiebungen eines affinen Raumes dadurch zu einer abelschen Gruppe wird.
Welcher Eigenschaft des zugeordneten Vektorraumes entspricht das?
Die Gleichheit der letzten drei Ausdrücke impliziert,
Das Experiment sieht wie folgt aus. Wir markieren im Raum fünf verschiedene Orte
. Dann messen wir ein paar Abstände zwischen ihnen und finden zufällig, dass neun
davon den gleichen Wert haben,
(1.56)
und zusätzlich bekommen wir folgende Gleichung, wenn wie die drei letzten drei Ausdrücke in
(1.55) addieren,
(1.57)
(1.48)
Das ist natürlich nur eine Annahme, die wir machen, um die Rechnung etwas zu vereinfachen.
Im Prinzip könnten wir auch von neun verschiedene Werten ausgehen. Dann würde die folgende
Rechnung jedoch nur unnötig kompliziert werden.
Den einzigen Abstand, den wir noch nicht gemessen haben, ist
. Wir wollen zeigen, dass
dieser durch die Theorie vorhergesagt wird. Wir benötigen dazu nichts weiter als die Definition
des Abstandes über des Skalarprodukt von Vektoren und die Behauptung der Theorie, dass der
Raum dreidimensional ist.
Die Herleitung dieser Vorhersage ist ein wenig länger, aber sie ist eine gute Übung für den
Umgang mit Vektoren und Skalarprodukten. Wir definieren zunächst die Vektoren
Jetzt benutzen wir, dass der Raum dreidimensional ist, und dass die Vektoren
eine Basis
bilden. Das ist leicht zu beweisen. Da es sich um drei Vektoren handelt, müssen wir nur zeigen,
dass die Vektoren linear unabhängig sind. Die Gleichung
(1.58)
darf also nur die Lösung
besitzt. Bilden wir auf beiden Seiten nacheinander
das Skalarprodukt mit , und und teilen das Ergebnis jeweils durch
, so ergeben sich die
Gleichungen
(1.49)
(1.59)
haben,
Wir wissen, dass alle diese Vektoren den Betrag
eine Basis, und somit können wir den Vektor also Linearkombination schreiben,
Also ist
(1.50)
(1.60)
und somit
Außerdem ist
Jetzt benutzen wir die Gleichung (1.56). Setzen wir (1.60) dort ein und teilen das ganze wieder
durch
, so ergibt noch einmal ein ähnliches Gleichungssystem, nämlich
(1.51)
(1.61)
Die gleiche Überlegung für jeweils zwei andere Vektoren ergibt
Die Koeffizienten der Linearkombination (1.60) müssen alle gleich sein, also
(1.52)
zu bestimmen, benutzen wir die Gleichung (1.57). Sie lautet nun
Um die Zahl
(1.53)
(1.63)
Benutzen wir diese Gleichungen, um die “gestrichenen” Vektoren durch die “ungestrichenen”
auszudrücken, so lauten die letzten drei Gleichungen von (1.52)
(1.62)
Gesucht ist die Länge des Vektors
oder
. Den ersten Fall können wir ausschließen, denn dann wäre
also
und somit
. Also ist
(1.64)
(1.54)
Um die Länge dieses Vektors zu berechnen, benötigen wir nur noch das Skalarprodukt
Wenn wir die Klammern ausmultiplizieren und die ersten drei Gleichungen von (1.52) verwenden,
so ergibt sich daraus
(1.55)
9
(1.65)
Wir finden also
gedrungen ist, und die nicht mehr mit dieser Beschreibung des Raumes auskommt. Das ist das
Global Positioning System “GPS”. Ein GPS-Gerät bestimmt seinen Ort durch Abstandsmessungen zu anderen, bekannten Orten, nämlich denen von Satelliten, die ihre Umwelt ununterbrochen
darüber informieren, wo sie sich gerade befinden.
Um seinen Standort zu bestimmen, muss ein solches Gerät Rechnungen ausführen, die im wesentlichen genau von der Art sind, wie wir sie gerade durchgeführt haben. Würde man diesen
Rechnungen jedoch die Euklidische Geometrie zugrunde legen, so würde man feststellen, dass
immer wieder Fehler auftreten, die sich nur dadurch erklären lassen, dass die Euklidische Theorie
die Struktur des Raumes nicht richtig beschreibt. Erst eine Berechnung mit Hilfe der allgemeinen Relativitätstheorie und der Riemannschen Geometrie liefert ein Ergebnis mit ausreichender
Genauigkeit.
(1.66)
sei genau um den Faktor
größer als die
Offenbar behauptet die Theorie, der Abstand
Abstände (1.48). Die Theorie macht also eine Vorhersage über eine Messung, die wir noch nicht
durchgeführt haben.
Wenn wir das vorhergesagte Messergebnis tatsächlich in der Realität finden, dann bestätigt das
die Richtigkeit der Theorie. Wie wir bereits aus unserer alltäglichen Erfahrung wissen, ist das der
Fall. Alle Experimente dieser Art bestätigen die Euklidische Geometrie. Sonst würden wir sie hier
nicht als Theorie über die Struktur des Raumes einführen. Auf ihr beruhen alle Landkarten, Baukonstruktionen, mechanischen Geräte und letztlich überhaupt alle Anwendungen der klassischen
Physik. Die Euklidische Geometrie beschreibt die Verhältnisse im physikalischen Raum richtig,
jedenfalls im Rahmen einer gewissen Messgenauigkeit.
Es könnte aber auch sein, dass wir ein ganz anderes Messergebnis finden. Um das Konzept
einer physikalischen Theorie zu verstehen, sollte man sich deshalb klar machen, dass es keinerlei
“vernünftigen”, also rein logischen oder mathematischen Grund gibt, warum die Messung des
den Wert
liefern soll. Es handelt sich um eine Messung, die von den
Abstandes
anderen neun durchgeführten Abstandsmessungen völlig unabhängig ist.
Und tatsächlich, wenn man genau genug misst, stellt man fest, dass der Faktor gar nicht genau
ist. Allerdings muss man schon sehr genau hinschauen. Die Abweichung von der Euklidischen Geometrie, die man bei Abstandsmessungen dieser Art im irdischen Bereich findet, beträgt
erst
etwa ein milliardstel. Das heißt für unser Experiment, dass eine Messung der Strecke
dann eine Abweichung von
ergeben würde, wenn wir alle Abstände bis auf mindestens
zehn Stellen genau messen würden.
Man stellt also bei genauerem Hinsehen fast, dass die Euklidische Geometrie doch nicht die
richtige Beschreibung der Struktur des Raumes ist. Sie liefert eine sehr gute Näherung, aber keine
exakte Beschreibung. Für unsere Zwecke ist diese Näherung aber gut genug. Solange wir keine
wirklich fundamentale physikalische Theorie gefunden haben, was vielleicht nie der Fall sein
wird, können wir von einer physikalischen Theorie ohnehin nur erwarten, dass die sie Natur
innerhalb einer gewissen Näherung möglichst gut beschreibt.
Die klassischen physikalischen Theorien haben also schon allein deshalb einen beschränkten
Gültigkeitsbereich, weil sie auf der Euklidischen Geometrie des Raumes aufbauen. Will man zu
einer genaueren Beschreibung übergehen, so muss man zur Beschreibung der Struktur des Raumes die allgemeine Relativitätstheorie heranziehen, die die Euklidische Geometrie durch eine Verallgemeinerung, die Riemannsche Geometrie ersetzt. Aber darauf können wir hier aus verständlichen Gründen nicht näher eingehen können. Das würde weit über das eigentliche Thema hinaus
führen.
Es sei nur noch angemerkt, dass zwar so gut wie alle “alltäglichen” physikalischen Anwendungen mit der Euklidischen Geometrie als Beschreibung des Raumes auskommen, dass es jedoch
inzwischen eine bekannte und sehr nützliche Anwendung gibt, die in unser tägliches Leben vor-
Aufgabe 1.21 Bei einem anderen Experiment der gleichen Art wie oben findet man die folgenden
,
Abstände von fünf paarweise verschiedenen Punkten
(1.67)
Man bestimme
. Warum sind mindestens fünf Punkte nötig, um eine solche Vorhersage für
eine Abstandsmessung zu machen? Wieviele Punkte wären nötig, wenn der Raum vierdimensional
wäre?
Aufgabe 1.22 Wie kann man allein durch Abstandsmessungen feststellen, ob drei Punkte
so angeordnet sind, dass
gilt. Was bedeutet das anschaulich?
Koordinatensysteme
Im Prinzip reicht eine Messvorschrift für Abstände zwischen Punkten vollkommen aus, um sämtliche Aussagen der Euklidischen Geometrie experimentell zu überprüfen und darauf andere Theorien wie die klassische Mechanik aufzubauen. Wie wir gerade an einem relativ einfachen Beispiel
gesehen haben, erfordert das aber recht komplizierte Rechnungen, wenn wir konkrete Beobachtungen und Experimente beschreiben wollen.
Um das Rechnen mit Punkten und ihren Abständen zu erleichtern, führen wir ein Koordinatensystem ein. Ein Koordinatensystem in einem affinen Raum ist das Analogon zu einer Basis in
einem Vektorraum. Es ermöglicht, das formale Rechnen mit Punkten und Vektoren auf das konkrete Rechnen mit Zahlen zurückzuführen, und zwar in einer sehr viel einfacheren Weise als wir
dies gerade getan haben. Wir werden ein Koordinatensystem zuerst als mathematisches Konzept
einführen, und anschließend zeigen, und wie man es durch eine Messvorschrift im physikalischen
Raum realisieren kann.
Die Konstruktion eines Koordinatensystems ist in Abbildung 1.4(a) dargestellt. Der erste
als Bezugspunkt oder Ursprung des Koordinatensystems
Schritt besteht darin, einen Ort
10
in Richtung des Vektors
verschieben. Die Strecken,
des Vektors , und schließlich um
die wir dabei zurücklegen, bilden die Kanten eines Koordinatenquaders. Je nachdem, in welcher
Reihenfolge wir dieser Verschiebungen durchführen, durchlaufen wir verschiedene Kanten dieses
Quaders.
Die so definierte bijektive Abbildung
(1.69)
mit
kartesische
Koordinaten
die jedem Punkt umkehrbar eindeutig seine Koordinaten zuordnet, heißt kartesisches Koordinatensystem.
(b)
(a)
und eine
um-
Ein kartesisches Koordinatensystem wird durch einen Ursprung
Orthonormalbasis
von
definiert. Es ordnet jedem Punkt
kehrbar eindeutig einen Satz von Koordinaten
zu.
Abbildung 1.4: Ein kartesisches Koordinatensystem im dreidimensionalen Raum
wird durch
einen Ursprung
und eine Orthonormalbasis
festgelegt (a). Die Koordinaten
eines Punktes
findet man, indem man den Ortsvektor
orthogonal auf
die Koordinatenachsen projiziert. Der Abstand zweier Punkte und ergibt sich aus der Summe der Quadrate der Seitenlängen des von und aufgespannten Koordinatenquaders (b).
Ein kartesisches Koordinatensystem hat die folgenden nützlichen Eigenschaften. Um den Abstandsvektor zweier Punkte zu bestimmen, müssen wir nur die Differenzen ihrer Koordinaten
zwei beliebige Punkte,
und
ihre Ortsvektobilden. Seien nämlich
ren und
bzw.
deren Komponenten, also die Koordinaten von und , so gilt für den
Abstandsvektor
(1.70)
festzulegen. Durch die Auswahl des Bezugspunktes wird jedem Ort
ein Ortsvektor
zugeordnet. Umgekehrt bestimmt jeder Ortsvektor
genau einen Ort
mit
. Die Zuordnung eines Ortes
zu seinem Ortsvektor
ist also bijektiv. Der
Ortsvektor gibt an, wie weit und in welche Richtung wir den Ursprung verschieben müssen,
um zum Ort zu gelangen.
ein. Es ist üblich,
Im zweiten Schritt führen wir eine Orthonormalbasis im Vektorraum
die Basisvektoren im physikalischen Raum mit
zu bezeichnen. Der Index , der die
Basisvektoren
durchnummeriert, läuft also von nun an über die Indexmenge
. An
den formalen Beziehungen zwischen den Basisvektoren und den Komponenten von Vektoren
ändert das nichts, weil wir die Indexmenge ohnehin nie explizit ausgeschrieben haben. Nur die
Dimension des Vektorraumes ist jetzt immer gleich .
zerlegt werden,
Der Ortsvektor eines Punktes kann nun in seine Komponenten
Außerdem können wir sehr leicht den Abstand zweier Punkte berechnen. Aus (1.70) und (1.36)
folgt nämlich
(1.71)
(1.68)
Ortsvektor
Auf diese Weise wird jedem Punkt ein Satz von Koordinaten
zugeordnet. Umgekehrt wird jeder Punkt wird eindeutig durch seine Koordinaten identifiziert.
Wie in Abbildung 1.4(a) gezeigt, finden wir den Punkt mit den Koordinaten
,
indem wir den Ursprung zuerst um
in Richtung des Vektors , dann um
in Richtung
11
Das ist die dreidimensionale Verallgemeinerung des Satzes des Pythagoras. Um den Abstand
zweier Punkte zu ermitteln, betrachten wir den in Abbildung 1.4(b) dargestellten Koordinatenquader, dessen gegenüber liegende Eckpunkte die Punkte und sind, und dessen Kanten in
die Richtungen der Koordinatenachsen zeigen. Das Quadrat der Länge der Diagonalen ist dann
durch die Summe der Quadrate der Kantenlängen gegeben.
Da die Bestimmung des Abstandsvektors und das Abstandes die einzigen “Rechenoperationen” sind, die wir mit Punkten durchführen können, haben wir haben damit auch das formale
Rechnen mit Punkten in einem affinen Raum auf des konkrete Rechnen mit Zahlen, also mit
Koordinaten und Komponenten zurückgeführt. Allerdings müssen wir beachten, dass die Wahl
eines kartesischen Koordinatensystems stets willkürlich ist. Wenn wir mit Koordinaten von Punkten und Komponenten von Vektoren rechnen, müssen wir stets mit angeben, bezügliche welchen
Koordinatensystems diese definiert sind.
Der Grund dafür ist, dass der physikalische Raum symmetrisch ist. Es gibt in ihm keinen irgendwie ausgezeichneten Punkt, also auch keine bevorzugte Wahl eines Ursprungs für ein Koorhomogen ist. Das bedeutet, dass alle Punkte in
dinatensystem. Wir sagen auch, dass der Raum
ihm gleichberechtigt sind. Der Raum sieht überall gleich aus, ist also symmetrisch unter Verschiebungen. Dasselbe gilt für die Orthonormalbasen. Es gibt keine besonders ausgezeichnete Basis
des Vektorraumes . Der Raum ist auch isotrop, das heißt er sieht in alle Richtungen gleich
aus. Wir können eine Orthonormalbasis beliebig drehen. Solange die Basisvektoren zueinander
senkrecht stehen und Einheitsvektoren sind, können wir eine Orthonormalbasis prinzipiell nicht
von einer anderen unterscheiden.
Das hat gewisse Vor- und Nachteile. Ein großer Vorteil dieser Freiheit der Wahl des Koordinatensystems besteht darin, dass wir, vor ein ganz spezielles physikalisches Problem gestellt, das
Koordinatensystem dem Problem anpassen können. Wir können den Ursprung und die Basis so
wählen, dass das Problem möglichst einfach formuliert und möglicherweise gelöst werden kann.
Davon werden wir später sehr häufig Gebrauch machen.
Ein Nachteil ist allerdings, dass wir, wenn wir allgemeine Gesetzmäßigkeiten finden und
formulieren wollen, stets darauf achten müssen, dass diese Gesetzmäßigkeiten nicht davon
abhängen, welches Koordinatensystem wir wählen, um sie zu beschreiben. Das ist auch der
Grund, warum wir in der Physik überhaupt das abstrakte Konzept eines metrischen affinen Raumes
benötigen. Durch ein Koordinatensystem wird dieser, wie wir gesehen haben, mit dem
Raum
identifiziert. Also könnten wir doch gleich sagen, dass der physikalische Raum die
Struktur des
hat, statt den Umweg über einen affinen Raum zu machen. Das käme der Auswahl eines festen, ein für alle Mal fixierten Koordinatensystems gleich.
Mit einer solchen Festlegung würden wir jedoch die Symmetrien des Raumes nicht mehr in
seiner Beschreibung wiederfinden. Denn es gäbe dann einen ausgezeichneten Punkt im Raum,
nämlich den Ursprung dieses Koordinatensystems, und es gäbe auch ausgezeichnete Richtungen,
nämlich die der ausgewählten Basisvektoren. In einer solchen Beschreibung würden wir wichtige
Eigenschaften einer physikalischen Theorie, nämlich ihre Symmetrien, nicht mehr oder jedenfalls
nur noch schwer erkennen. Symmetrien, und dazu gehören unter anderem die Symmetrien des
Raumes unter Drehungen und Verschiebungen, sind jedoch ein ganz entscheidendes Kriterium,
um physikalische Theorien zu klassifizieren und um deren Konsistenz zu prüfen.
Tatsächlich bauen fast alle modernen physikalischen Theorien auf sehr fundamentalen solchen
Symmetrieprinzipien auf. Wir werden uns daher später sehr ausführlich mit der Frage beschäftigen, was genau passiert, wenn wir von einem Koordinatensystem zu einem anderen übergehen,
und wie sich physikalische Gesetzmäßigkeiten dabei verhalten. Für den Anfang genügt es jedoch, immer nur ein, zwar willkürlich gewähltes, aber festes kartesisches Koordinatensystem zu
verwenden, um den physikalischen Raum damit zu erfassen.
Die einzige zusätzliche Forderung, die wir noch an das Koordinatensystem stellen können, ist,
dass es eine positive Orientierung hat. Das bedeutet folgendes. Wenn wir die Basisvektoren ,
und betrachten, so zeigen diese Vektoren in der gegebenen Reihenfolge in die Richtungen des
ausgestreckten Daumens, des ausgestreckten Zeigefingers und des angewinkelten Mittelfingers
(b)
(a)
Abbildung 1.5: Der Übergang von einem kartesischen Koordinatensystem (a) zu einem anderen
Koordinatensystem (b) setzt sich aus einer Verschiebung des Ursprungs und einer Drehung der
Basisvektoren zusammen.
der rechten Hand. Allgemein bezeichnen wir einen Satz von drei linear unabhängigen Vektoren,
die diese Rechte-Hand-Regel erfüllen, als Rechtsystem.
Wir haben dann immer noch die Freiheit, die Basisvektoren beliebig im Raum zu drehen, aber
wir können sie nicht mehr spiegeln. Würden wir zum Beispiel den Vektor
durch
ersetzen, das Koordinatensystem also an der - -Ebene spiegeln, so würden die drei Basisvektoren
hinterher ein Linkssystem bilden. Das gespiegelte Koordinatensystem hätte eine negative Orientierung. Das wollen wir im folgenden ausschließen. Die Beschränkung auf positive orientierte
Koordinatensysteme ist nützlich, da sie an vielen Stellen eine Fallunterscheidung unnötig macht.
Wo genau, werden wir im nächsten Kapitel sehen.
ein Punkt und
der um den Vektor
Aufgabe 1.23 Es sei
Wie hängen die Koordinaten
von mit den Koordinaten
von
gegeben, so dass für deren Ortsvektoren in einem
Aufgabe 1.24 Es seien drei Punkte
kartesischen Koordinatensystem gilt
verschobene Punkt.
zusammen?
(1.72)
gleichseitig
zu stellen, damit das Dreieck
Welche Bedingung ist an die Zahlen
ist? Wann ist es rechtwinklig?
Aufgabe 1.25 In Abbildung 1.5 sind zwei kartesische Koordinatensysteme dargestellt. Das “ungestrichene” Koordinatensystem wird durch einen Ursprung und eine Basis
festgelegt, das
12
,
gelten. Wir können also allein durch Abstandsmessungen feststellen, ob drei Vektoren
und
, und damit auch die Basisvektoren (1.74) zueinander senkrecht stehen.
Damit haben wir das Koordinatensystem definiert, indem wir vier verschiedene Punkte , ,
und markiert haben, die die Eigenschaften (1.75) haben. Aber wie finden wir jetzt zu einem
gegebenen Punkt die Koordinaten
, oder umgekehrt zu einem Satz von Koordinaten
den entsprechenden Punkt?
Auch das können wir auf Abstandsmessungen zurückführen. Es sei
irgendein markierter
Ort. Wir messen zunächst die Abstände der Punkte ,
und von . Das mussten wir ja
bereits tun, um die Orthogonalität der Basisvektoren zu prüfen. Wir bezeichnen diese Abstände
mit
,
und
. Es gilt dann für die Ortsvektoren der Punkte , und
“gestrichene” Koordinatensystem durch einen Ursprung
und eine Basis
. Der Ursprung
ergibt sich aus durch Verschiebung um einen Vektor
. Die Basis
ergibt sich
aus der Basis
durch eine Drehung, die durch eine Übergangsmatrix
beschrieben wird.
Es gilt
(1.73)
an. Warum existiert eine solche Übergangsmatrix
Alle Indizes nehmen jeweils die Werte
immer? Welche Bedingung muss die Übergangsmatrix
erfüllen, wenn mit
auch
eine Orthonormalbasis sein soll? Wie hängen die Koordinaten
eines Punktes im
gestrichenen Koordinatensystem mit den Koordinaten
desselben Punktes im ungestrichenen
Koordinatensystem zusammen?
(1.76)
was sich auch unmittelbar aus (1.74) ergibt. Nun sei irgendein Punkt, dessen Koordinaten wir
messen wollen. Was wir unmittelbar messen können, sind die Abstände
, also die Länge
des Ortsvektors
, sowie die Abstände
,
und
. Betrachten wir zunächst nur
den Abstand
. Für ihn gilt
Koordinaten als Messgrößen
(1.77)
Offenbar können wir aus den Messgrößen
,
und
das Skalarprodukt
bestimmen. Nun wissen wir aber aus (1.39), dass dies genau die gesuchte Komponenten
des Ortsvektors ist, und damit die -Koordinate des Punktes . Es gilt also
(1.78)
Jetzt müssen wir nur noch eine Messvorschrift angeben, mit deren Hilfe wir die Koordinaten eines
Punktes ermitteln, oder umgekehrt zu einem gegebenen Satz von Koordinaten den entsprechenden Punkt finden können. Dann können wir sämtliche Experimente und Beobachtungen, die wir
im physikalischen Raum machen, mit Hilfe eines Koordinatensystems beschreiben und entsprechende Berechnungen durchführen. Da fast alle folgenden Überlegungen auf dieser Konstruktion
von kartesischen Koordinaten beruhen, werden wir noch einmal sehr sorgfältig vorgehen und
zeigen, dass sich alle Messvorschriften, die wir dazu benötigen, letztlich auf Längenmessungen
zurückführen lassen.
Wir beginnen damit, ein Koordinatensystem im physikalischen Raum überhaupt zu definieren.
festlegen. Das tun wir wie üblich, indem wie den
Dazu müssen wir zuerst einen Ursprung
Ort mit einem Gegenstand markieren. Anschließend müssen wir die Basisvektoren
einführen. Da es sich dabei um Einheitsvektoren handelt, genügt es, deren Richtungen festzulegen. Wir tun dies, indem wir drei voneinander und von verschiedene Punkte , und
markieren, die auf den Koordinatenachsen liegen sollen, also von aus in den Richtungen der
Basisvektoren. Für diese gilt dann
Die anderen Koordinaten können wir bestimmen, indem wir den Punkt
ersetzen,
zuerst durch den Punkt
(1.79)
und dann durch den Punkt ,
(1.74)
(1.80)
das heißt sie sind durch die Punkte , , und eindeutig bestimmt.
Wir können die Punkte , und aber nicht beliebig wählen, sondern müssen dafür sorgen,
dass die Basisvektoren zueinander senkrecht stehen. Eine Messvorschrift für rechte Winkel ergibt
sich aus dem Satz des Pythagoras, den wir in Aufgabe 1.20 bewiesen haben. Die drei Vektoren
(1.74) sind genau dann zueinander senkrecht, wenn die Dreiecke
,
und
jeweils
im Punkt rechtwinklig sind. Das wiederum ist genau dann der Fall, wenn für die Seitenlängen
dieser Dreiecke die Beziehungen
Damit haben wir gezeigt, dass wir allein durch Abstandsmessungen die Koordinaten eines Punktes bezüglich eines vorher festgelegten Koordinatensystems ermitteln können.
Das werden wir in Zukunft natürlich nicht mehr in dieser ausführlichen Art und Weise beschreiben. Wir gehen ab jetzt einfach davon aus, dass es möglich ist, die Koordinaten eines Ortes
bezüglich eines gegebenen Koordinatensystems irgendwie zu ermitteln. In der Praxis wird man
dazu oft ganz andere Methoden verwenden als die hier beschriebene. Das gilt insbesondere dann,
(1.75)
13
wenn wir gar nicht mit Abstandsmessungen arbeiten können, etwa um die Koordinaten eines
Planeten im Sonnensystem oder eines Sterns in der Milchstraße zu bestimmen.
Die gezeigte Methode ist also weniger als eine praktische Anleitung zur Bestimmung von Koordinaten zu verstehen, sondern vielmehr als ein Beispiel dafür, wie man aus fundamentalen Messgrößen, die in einer Theorie definiert sind, Messvorschriften für andere Größen ableiten kann.
Die fundamentale Messgröße war hier der Abstand von zwei Orten, den wir über das Maßband
als Messgerät definiert haben, und die abgeleiteten Größen waren die Koordinaten eines Punktes
bezüglich eines vorgegebenen Koordinatensystems.
Aufgabe 1.26 Wieviele Freiheiten haben wir bei der Wahl eines kartesischen Koordinatensystems? Mit anderen Worten, wieviele durch reelle Zahlen darstellbare Parameter m üssen wir
unabhängig voneinander wählen, um ein kartesisches Koordinatensystem im dreidimensionalen
Raum eindeutig festzulegen?
Aufgabe 1.27 Wir betrachten noch einem das Experiment mit den f ünf Punkten
im Raum, deren Abstände (1.48) gemessen wurden. Man wähle ein Koordinatensystem, das diesem Problem angepasst ist, bestimme aus den bekannten Abst änden schrittweise die Koordinaten
der einzelnen Punkte, und berechne schließlich aus den Koordinaten der Punkte und deren
Abstand.
müssen wir uns stets auf eine Einheit beziehen. Das hat zur Folge, dass es verschiedene Gr ößenarten gibt, die in verschiedenen Einheiten gemessen werden, und die wir folglich nicht miteinander
vergleichen können. Der Abstand zweier Punkte definiert eine Größenart, die wir L änge nennen.
Später werden wir andere Größenarten wir Zeit und Masse einführen, für die wir auch jeweils
eine Einheit willkürlich festlegen müssen.
Eine andere gebräuchlich Sprechweise ist zu sagen, dass der Abstand zweier Orte die physikalische Dimension einer Länge hat. Wir bringen damit zum Ausdruck, dass es sich um eine
Größe handelt, die in einer willkürlich festgelegten Einheit für die Größenart Länge gemessen
wird. Dieser Begriff der physikalischen Dimension hat natürlich nichts mit der Dimension eines
Vektorraumes zu tun. Die Wortwahl ist daher vielleicht etwas ungeschickt. Aber sie ist so üblich,
und wir werden sie daher auch verwenden. Es gibt also in einer physikalischen Theorie Größen
verschiedener Dimensionen, oder verschiedene Größenarten.
Was heißt das genau? Wie wir gesehen haben, macht eine Theorie Vorhersagen über Messergebnisse, wenn wir vorher andere Messungen durchgeführt haben. Ein Beispiel für eine solche Vorhersage, die die Euklidische Geometrie über Abstandsmessungen macht, haben wir weiter oben relativ ausführlich diskutiert. Wir haben gezeigt, dass wir aus der Messung von neun
Abständen das Ergebnis einer zehnten Abstandsmessung vorhersagen konnten. Konkret sah das
so aus, dass aus den neun Messergebnissen, von denen wir der Einfachheit angenommen hatten,
für das zehnte Messergebnis folgte.
dass alle den gleichen Wert ergaben, der Wert
Betrachten wir die Euklidischen Geometrie als mathematische Theorie, so ist der Abstand
zweier Punkte ein Skalar, also eine reelle Zahl. Der Faktor
ist auch eine reelle Zahl, und
folglich ist auch das Produkt
eine reelle Zahl. Wenn wir diese Größen aber tatsächlich
messen, dann lesen wir an der Skala unseres Messgerätes gar keine reellen Zahlen ab, sondern
jeweils eine Länge, also eine physikalische Größe, die ein Einheit trägt. Wir nennen eine solche
Größe auch dimensionsbehaftet.
m.
Nehmen wir an, die neun gemessenen Abstände hätten einen Wert von, sagen wir,
m hat. Was wäre, wenn die TheoDaraus würde folgen, dass die zehnte Messgröße den Wert
rie für die zehnte Messgröße den Wert
statt
vorhergesagt hätte, also
m ? Das
kann offenbar nicht sein. Diese vorhergesagte Größe wäre nicht von der richtigen Größenart,
hätte also nicht die richtige physikalische Dimension. Es wäre keine Länge, sondern eine Fläche,
also eine Länge zum Quadrat. Würde eine Theorie eine solche Vorhersage machen, wäre etwas
an ihr falsch.
Wir müssen an eine physikalische Theorie eine Konsistenzbedingung stellen, die über die reine mathematische Konsistenz hinaus geht. Es muss möglich sein, allen darin vorkommenden
Größen physikalische Dimensionen zuzuordnen, also ihre Größenart zu bestimmen, so dass alle
Messgrößen, also diejenigen Größen, die unmittelbar experimentell zugänglich sind, die richtigen Einheiten bekommen. Wenn eine Theorie etwas über eine Messgröße aussagt, die in Meter
gemessen wird, dann muss der vorhergesagte Wert die Dimension einer Länge haben. Sonst ist
die Theorie inkonsistent.
Wie sieht das konkret aus? Zunächst müssen wir wissen, wie sich dimensionsbehaftete Größen,
Physikalische Dimensionen
14
Die Einheit Meter war ursprünglich als der zehnmillionste Teil der Länge des durch Paris verlaufenden Meridians vom Nordpol zum Äquator definiert. Es ist daher kein Zufall, dass die Erdkm beträgt. Seit etwa 1890 gibt es das Urmeter, einen Platinumfang ziemlich genau
Iridium-Stab, der in einem Tresor in Paris aufbewahrt wird, und der seit dem die Längeeinheit
Meter definiert hat. Heute ist man zu einer wesentlich genaueren und zudem überall reproduzierbaren Definition übergegangen. Das Meter ist ein bestimmtes Vielfaches der Wellenlänge einer
Spektrallinie eines Krypton-Atoms festgelegt wird. Wie man auf diese Weise eine Längeneinheit
definieren kann, werden wir allerdings erst im Rahmen der Quantenmechanik verstehen.
Aber darauf kommt es uns hier gar nicht an. Die theoretische Physik interessiert sich gar nicht
dafür, wie genau eine Maßeinheit definiert ist. Entscheidend ist nur, dass die Wahl einer Einheit grundsätzlich willkürlich ist. Wenn wir den Wert eine physikalischen Größe angeben wollen,
(1.81)
m
Einen wichtigen Aspekt einer physikalischen Theorie haben wir bis jetzt ignoriert. Als wir die
Messgröße “Abstand” eingeführt haben, haben wir dies mit Hilfe eines Maßbandes getan, auf
dem wir eine Skala angebracht haben. Die Wahl dieser Skala, also der Abstand der einzelnen
Striche, ist natürlich willkürlich.
Um Abstände zu messen, müssen wir eine Längeneinheit festlegen. Zum Beispiel können wir
das Maßband in Meter und Zentimeter einteilen. Dann ist dies die Einheit, in der Abstände gemessen werden. Wir schreiben dafür
also solche mit Einheiten, überhaupt verhalten, wenn wir sie miteinander verknüpfen. Denn letztlich beruht eine Theorie ja darauf, verschiedene Größen irgendwie miteinander zu verknüpfen.
Für das Rechnen mit physikalischen Einheiten gilt eine einfache Regel.
damit zu tun, ob wir diese Größen unmittelbar messen können oder nicht. Sie ergibt sich aus den
mathematischen Zusammenhängen zwischen den einzelnen Größen, sobald eine dieser Größen
eine Messgröße ist.
Deshalb verstehen wir unter dem “Betrag” eines Vektors auch etwas anderes als unter der
“Länge”. Der Betrag ist ein mathematisches Konzept, das jedem Vektor eine skalare Größe zuordnet. Um eine Länge handelt es sich aber dabei nur, wenn der Vektor ein Abstandsvektor ist,
also die Dimension einer Länge hat. Im nächsten Kapitel werden wir sehen, dass es auch Vektoren
gibt, die die Dimension einer Fläche haben. Ihr Betrag ist dann eine Fläche und keine Länge.
Ein anderes Beispiel für einen Vektor, der nicht die Dimension einer Länge hat, kennen wir
bereits. Betrachten wir den Einheitsvektor, den wir bilden, indem wir einen Abstandsvektor durch
. Um welche Größenart handelt es sich dabei? Da wir
seinen Betrag teilen, also
eine Größe der Dimension Länge durch eine andere Länge teilen, kürzen sich die Einheiten weg
und wir bekommen eine dimensionslose Größe. Eine dimensionslose Größe ist eine, die quasi
zufällig keine Einheit hat, weil sich alle Einheiten wegkürzen,
Physikalische Einheiten verhalten sich formal wie skalare Faktoren.
Mit anderen Worten, sie verhalten sich so, als wären es reelle Zahlen in einem Produkt. Daraus
folgt, dass wir physikalische Größen nur nach ganz bestimmten Kombinationsregeln miteinander
verknüpfen können. Wir können sie genau dann addieren oder miteinander vergleichen, wenn sie
die gleiche Einheit tragen, also die gleiche physikalische Dimension haben. Außerdem können
wir physikalische Größen beliebig miteinander multiplizieren, wobei sich die Einheiten ebenfalls
multiplikativ verhalten. Und schließlich können wir, als eine Verallgemeinerung dieser Multiplikationsregel, eine physikalische Größe in eine beliebige Potenz erheben, die nicht unbedingt
positiv und ganzzahlig sein muss.
(1.84)
m
m
Ein Einheitsvektor trägt also keine physikalische Einheit und ist daher dimensionslos. Das ergibt
ist, und nicht m oder m .
sich auch aus der Definition, wonach
Daraus folgt insbesondere, dass ein Einheitsvektor nicht als Abstandsvektor zweier Punkte
dargestellt werden kann. Es gibt keine zwei Punkte im Raum, die den Abstand haben, weil
eben keine Länge sondern eine dimensionslose Größe ist. Wenn wir uns einen Einheitsvektor
anschaulich vorstellen wollen, sollten wir daher nicht das Bild eines Pfeiles im Auge haben,
der zwei Punkte verbindet, sondern wir sollten uns vorstellen, dass durch einen solchen Vektor
wirklich nur eine Richtung, aber keine Länge definiert wird.
Wie sehen also, dass die Einführung einer einzigen Messvorschrift, die mit der willkürlichen
Festlegung einer Einheit verbunden ist, allen in der Theorie vorkommenden Größen bestimmte
physikalische Dimensionen zuordnet. Sie ergeben sich durch die mathematischen Beziehungen
der Messgröße zu allen anderen Größen. Als ganzes ist eine physikalische Theorie nur dann
konsistent, wenn diese Zuordnung von physikalischen Dimensionen zu den darin vorkommenden
Größen mit den Kombinationsregeln für dimensionsbehaftete Größen verträglich ist.
Die Einteilung von physikalischen Größen in Größenarten ist unabhängig davon, ob es sich um
zweier Punkt ist ein Skalar, der die Dimension
Skalare oder Vektoren handelt. Der Abstand
? Er hängt über die
einer Länge hat. Welche physikalische Dimension hat der Abstandsvektor
Beziehung
(1.82)
mit dem Abstand zusammen. Auf der linken Seite dieser Gleichung steht eine Größe der Dimension Länge zum Quadrat. Also muss auch auf der rechten Seite eine Größe dieser Art stehen. Da
sich Einheiten wie skalare Faktoren verhalten, folgt daraus, dass auch der Abstandsvektor
die
Dimension einer Länge haben muss. Nur dann ergibt das Skalarprodukt dieses Vektors mit sich
selbst eine Größe, die die Dimension einer Länge zum Quadrat hat.
in Meter gemessen wird,
Etwas vereinfacht können wir sagen, dass auch der Vektor
(1.83)
m
Aufgabe 1.28 Man mache sich klar, dass diese Kombinationsregeln auch auf Vektoren anwendbar sind. Insbesondere gilt die Multiplikationsregel auch für die skalare Multiplikation und das
Skalarprodukt.
Aufgabe 1.29 Dass ein Einheitsvektor eine Richtung, aber keine L änge hat, kann man sich anhand der orthogonalen Zerlegung eines Vektors in Abbildung 1.2 klar machen. Nehmen wir an,
der dort gezeigte Vektor hätte die Dimension einer Länge. Welche physikalischen Dimensionen
und ? Der Einheitsvektor wird
haben dann die anderen dargestellten Größen , ,
in der Abbildung zwar durch einen Pfeil dargestellt, der eine bestimmte L änge hat. Man mache
sich aber klar, dass die dargestellte Länge dieses Pfeiles keinerlei Auswirkungen auf die anderen
Vektoren hat. Nur die Richtung des Pfeiles ist relevant.
Allerdings ist dieser Formulierung ein wenig ungenau. Erstens können wir einen Vektor gar nicht
messen, denn wir haben dafür gar keine Messvorschrift. Und zweitens können wir den Wert dieser
Größe auch nicht in der Form “
m” oder so ähnlich angeben. Es handelt sich ja um einen
gerichteten Vektor, und nicht um eine ungerichtete, skalare Größe.
irgendwo versteckt die Einheit
Trotzdem ist es sinnvoll, sich vorzustellen, dass der Vektor
hat die Dimension einer
Meter trägt. So ist die Gleichung (1.83) zu verstehen. Der Vektor
Länge, weil es sich um einen Abstandsvektor zweier Punkte handelt. Unmittelbar messen können
wir jedoch nur seinen Betrag, und der hat stets dieselbe physikalische Dimension wie der Vektor
selbst. Die Einteilung von physikalischen Größen in verschiedene Größenarten hat also nichts
Aufgabe 1.30 Welche physikalischen Dimensionen haben die Basisvektoren
und die
Koordinaten
eines Punktes bezüglich eines kartesischen Koordinatensystems? Man
15
ein nulldimensionaler affiner Unterraum. Der zugeordnete Untervektorraum ist
so ist
der nulldimensionale Vektorraum
, denn der einzige Abstandsvektor, den wir in
bilden können, ist der Nullvektor
. Jeder einzelne Punkt eines affinen Raumes definiert
auf diese Weise einen nulldimensionalen affinen Unterraum.
vorgeben und von dem affinen Unterraum
Wenn wir zwei verschiedene Punkte
verlangen, dass
ist, dann enthält der zugeordnete Untervektorraum
zumindest den Vektor
. Da es sich um einen Vektorraum handelt, enthält er dann
aber auch alle Vielfache dieses Vektors. Und folglich enthält der affine Raum
auch alle
Punkte , die wir durch eine Verschiebung des Punktes in Richtung des Vektors
erreichen,
überprüfe alle Beziehungen, in denen diese Komponenten vorkommen, auf ihre Konsistenz, also
die Verträglichkeit mit den Kombinationsregeln, insbesondere die Gleichungen (1.68) und (1.71)
für den Ortsvektor und den Abstand im physikalischen Raum, sowie die Darstellungen (1.78–
1.80) der Koordinaten als Messgrößen.
, also den Orten
Aufgabe 1.31 Warum ist es nicht sinnvoll, den Punkten
im Raum irgendeine physikalische Dimension zuzuordnen, obwohl wir doch auch f ür sei eine
Messvorschrift angegeben haben?
Aufgabe 1.32 Es seien und zwei physikalische Größen, die über die Beziehung
zusammenhängen. Warum müssen beide Größen dimensionslos sein?
Euklidische Geometrie
Auf diese Weise wird in jedem affinen Raum durch zwei Punkte und eine Gerade festgelegt.
Um eine Ebene zu definieren, müssen wir drei Punkte
vorgeben, die in der Ebene
und
, von denen wir annehmen wollen, dass sie linear unliegen sollen. Die Vektoren
abhängig sind, spannen dann einen zweidimensionalen Untervektorraum
auf, und
besteht aus allen Punkten , deren Abstandsvektor von in diesem Undie Ebene
tervektorraum liegt. Es gilt also
2
(2.1)
Gerade
Bisher haben wir als einzige Messgröße den Abstand zwischen zwei Punkten im Raum definiert.
Wir können aber noch andere geometrische Objekte einführen und Messgrößen mit ihren assoziieren. Das sind zum Beispiel Geraden, Ebenen, allgemeine Kurven und Flächen, sowie Kreise
und Winkel. In der traditionellen Formulierung der Euklidischen Geometrie werden diese Objekte
axiomatisch definiert. In diesem Kapitel wollen wir zeigen, wie sie sich aus der Vektorraumstruktur und insbesondere aus dem Skalarprodukt ableiten lassen.
Unterräume
(2.2)
Ebene
Punkten
Das können wir leicht verallgemeinern. Wir nennen einen Satz von
linear unabhängig, wenn die Vektoren
linear unabhängig sind. Wenn wir einen solchen Satz von Punkten vorgeben, dann spannen diese Vektoren
einen -dimensionalen Untervektorraum
auf. Der affine Unterraum
(2.3)
Die einfachsten geometrischen Objekte, die wir in jedem affinen Raum einführen können, sind
die affinen Unterräume. Sie repräsentieren Punkte, Geraden, Ebenen und entsprechende höherdimensionale Objekte. Diese werden im allgemeinen als Hyperebenen bezeichnet, kommen aber in
einem dreidimensionen Raum nicht vor.
Ein affiner Unterraum ist analog zu einem Untervektorraum definiert. Eine Teilmenge
eines Vektorraumes ist genau dann ein Untervektorraum, wenn selbst wieder ein Vektorraum
ist. Da die Vektorraumaxiome dann automatisch erfüllt sind, ist eine notwendige und hinreichende
Bedingung dafür, dass eine Teilmenge
ein Untervektorraum ist, dass mit
und
stets auch
und
ist. Die Teilmenge muss unter der Vektoraddition und
der skalaren Multiplikation abgeschlossen sein.
eines affinen Raumes genau dann ein affiner UnterEntsprechend ist eine Teilmenge
raum, wenn selbst wieder ein affiner Raum ist. Der zu zugeordnete Vektorraum
ist dann
ein Untervektorraum des zu zugeordneten Vektorraumes . Mit anderen Worten, wenn wir die
Abstandsvektoren aller Paare von Punkten in
bilden, so liegen diese in einem Untervek. Und umgekehrt, wenn wir irgendeinen Punkt aus kennen, dann finden wir
torraum
alle anderen, indem wir diesen Punkt um einen Vektor aus
verschieben.
Einen speziellen affinen Unterraum können wir festlegen, indem wir eine bestimmte Anzahl
von Punkten vorgeben, die der Unterraum enthalten soll. Sei zum Beispiel
irgendein Punkt,
repräsentiert dann eine
-dimensionale Hyperebene. Allgemein gilt der folgende Satz:
linear unabhängige Punk-
Ein -dimensionaler affiner Unterraum wird durch
te eindeutig festgelegt.
sein, wenn die Dimension des affinen Raumes ist. Wenn
Natürlich muss
ist, dann sind die Vektoren
vollständig, das heißt in diesem Fall ist
und somit
. Die einzigen interessanten affinen Unterräume
sind diejenigen, deren Dimension kleiner ist als die des gegeben affinen Raumes .
Aufgabe 2.1 Bei der allgemeinen Definition (2.3) einer Hyperebene scheint der Punkt
spezielle Rolle zu spielen. Man zeige jedoch, dass dem nicht so ist. Die Teilmenge
hängt nicht davon ab, welchen der
Punkte wir mit
bezeichnen.
eine
16
ein ebenfalls selbst ist der einzige
Aufgabe 2.2 Es sei
ein -dimensionaler affiner Raum und
dimensionaler affiner Unterraum. Man zeige, dass
ist, das heißt
affine Unterraum, der die maximale Dimension hat.
von zwei affinen Unterräumen
Aufgabe 2.3 Man beweise, dass die Schnittmenge
, wenn sie nicht leer ist, wieder ein affiner Unterraum von ist. Warum kann die
Schnittmenge von zwei affinen Unterräumen
leer sein, während die Schnittmenge
eines beliebigen Vektorraumes stets mindestens
von zwei Untervektorräumen
einen Vektor, nämlich den Nullvektor, enthält?
(b)
(a)
Geraden und Ebenen
Jetzt betrachten wir wieder den dreidimensionalen Euklidischen Raum. Die einzigen interessanwird durch zwei verschieten Unterräume sind dann die Geraden und Ebenen. Eine Gerade
dene Punkte
festgelegt, eine Ebene
durch drei Punkte
, die ein
nicht entartetes Dreieck bilden. Wir wollen uns überlegen, wie wir die Lage eines solchen Objektes im Raum am besten beschreiben können, und was es zum Beispiel bedeutet, dass zwei solche
Objekte zueinander parallel liegen oder senkrecht stehen.
Um die Richtung einer Geraden
festzulegen, genügt es, den Richtungsvektor
zu kennen. Er legt die Lage der Geraden im Raum eindeutig fest. Wir kennen die
auf der Geraden kennen.
Gerade, wenn wir den Richtungsvektor und irgendeinen Punkt
Tatsächlich können wir die Definition (2.1) dann auch so schreiben,
Abbildung 2.1: Die affinen Unterräume des dreidimensionalen Euklidischen Raumes
(a). Ein
nulldimensionaler Unterraum
besteht nur aus einem Punkt
. Ein eindimensionaler Unterist eine Gerade, die von zwei Punkten
und
aufgespannt wird. Eine zweidimensioraum
nale Ebene
wird von drei Punkten ,
und
aufgespannt. Der einzige dreidimensionale
affine Unterraum ist der Raum
selbst. Die Schnittmenge von zwei Ebenen ist eine
Gerade (b).
die drei Punkte, die die Ebene aufspannen, so erfüllt der Normalenvektor
die
Gleichungen
(2.4)
mit
Umgekehrt ist der Richtungsvektor durch die Gerade aber nur bis auf sein Vorzeichen bestimmt.
Wir könnten in (2.4) statt auch
schreiben. Das ist natürlich gleichbedeutend mit dem Vertauschen der Punkte und . Wir können das ändern, indem wir der Geraden eine Orientierung
geben. Durch die Orientierung ist gewissermaßen eine Laufrichtung der Geraden festgelegt. Der
Richtungsvektor zeigt dann die Laufrichtung an, also in diesem Fall von nach .
(2.5)
Die ersten drei Gleichung sind nicht unabhängig, da aus den ersten beiden bereits folgt, dass
auf allen Abstandsvektoren, die wir in der Ebene bilden können, senkrecht steht. Es handelt sich
also um drei unabhängige Gleichungen für drei Unbekannte, nämlich die Komponenten von
bezüglich irgendeines Koordinatensystems. Eine Gleichung davon ist quadratisch, so dass sich
zwei Lösungen ergeben. Denn mit ist offenbar auch
eine Lösung.
Durch die Auswahl eines der beiden möglichen Normalenvektoren können wir die Orientierung
der Ebene festlegen. Wir können ihr eine Oberseite und eine Unterseite zuordnen, und verlangen,
dass der Normalenvektor von der Oberseite weg in den Raum zeigt. Die in Abbildung 2.1(a)
sichtbare Seite der Ebene wäre in diesem Fall die Oberseite. Wir können die Orientierung einer
festlegen, die die Ebene aufspannen. BeEbene auch durch die Reihenfolge der Punkte
trachtet man nämlich die Lage der drei Punkte auf der Ebene, so wird durch ihre Reihenfolge ein
Drehsinn definiert. Er ist in Abbildung 2.1(a) durch einen rotierenden Pfeil dargestellt, der sich
ergibt.
aus der Orientierung des Dreiecks
Um eine Beziehung zwischen den beiden Definitionen herzustellen, verwenden wir die folgende, leicht modifizierte Rechte-Hand-Regel. Zeigt der ausgestreckte Daumen in die Richtung
17
Mit Hilfe des Richtungsvektors können dann auch erklären, wann zwei Geraden zueinander parallel liegen oder aufeinander senkrecht stehen. Zwei Geraden liegen natürlich parallel, wenn ihre
Richtungsvektoren gleich sind. Wir nennen sie antiparallel, wenn ihre Richtungsvektoren entgegensetzt gleich sind, also wenn sie zwar im üblichen Sinne parallel sind, aber ihre Orientierungen
verschieden sind. Und schließlich stehen zwei Geraden genau dann zueinander senkrecht, wenn
das für ihre Richtungsvektoren gilt. Das ist unabhängig davon, ob sie sich schneiden oder nicht.
Mit einer Ebene verhält es sich ganz ähnlich. Auch ihre Lage im Raum lässt sich durch einen
Einheitsvektor beschreiben. Die Definition dieses Normalenvektors ist in Abbildung 2.1(a) dargestellt. Zu jeder Ebene gibt es genau zwei Einheitsvektoren, die zur Ebene senkrecht stehen. Sind
Zu jeder orientierten Geraden gehört genau ein Richtungsvektor.
des Normalenvektors, so zeigen die zur Faust zusammengerollten Finger den Drehsinn der Ebene
an. In der Abbildung ist der Drehsinn und der Normalenvektor so gewählt, dass das der Fall ist.
Der Normalenvektor einer Ebene legt auf diese Weise sowohl ihre Lage im Raum, als auch ihre
Orientierung, also ihren Drehsinn fest.
Das Kreuzprodukt
Da eine Ebene einschließlich ihrer Orientierung eindeutig durch drei linear unabhängige Punkte
bestimmt ist, muss es möglich sein, den Normalenvektor der Ebene irgendwie aus diesen Punkten
gegeben. Wie können wir dann einen Vektor
zu berechnen. Es seien also drei Punkte
finden, der die Eigenschaften (2.5) hat?
Am besten schreiben wir dazu die Gleichungen explizit aus, indem wir ein Koordinatensystem
einführen. Ohne Beschränkung der Allgemeinheit können wir dabei annehmen, dass einer der
. Wir machen also, um die Rechnung zu verdrei Punkte der Ursprung ist, zum Beispiel
einfachen, von der Möglichkeit Gebrauch, ein speziellen Koordinatensystem zu wählen. Gesucht
ist dann ein Einheitsvektor , der auf der Ebene, also insbesondere auf den Vektoren
und
senkrecht steht.
Das sind die Ortsvektoren der Punkte und . Die Komponenten dieser Vektoren seien wie
üblich mit
bzw.
bezeichnet. Es gilt also
Analog zur Darstellung (2.4) einer Geraden können wir nun auch eine Ebene eindeutig durch
einen einzigen Punkt und ihren Normalenvektor festlegen,
Zu jeder orientierten Ebene gehört genau ein Normalenvektor
(2.6)
wobei durch die Gleichungen (2.5) und die Orientierung der Ebene festgelegt ist.
Außerdem können wir parallele, antiparallele und senkrechte Ebenen definieren. Zwei Ebenen
liegen genau dann parallel, wenn ihre Normalenvektoren gleich sind. Sie heißen antiparallel,
wenn ihre Normalenvektoren entgegengesetzt gleich sind. Und sie stehen zueinander senkrecht,
wenn ihre Normalenvektoren zueinander senkrecht stehen.
(2.8)
Ebenso können wir den Vektor
in seine Komponenten zerlegen,
mit folgenden Koordinaten bez üglich eines positiv oriAufgabe 2.4 Es seien die Punkte
entierten kartesischen Koordinatensystems gegeben,
(2.9)
(2.7)
Da wir das Skalarprodukt von zwei Vektoren gemäß (1.35) durch die Komponenten ausdrücken
können, lautet die erste an zu stellende Bedingung
Man bestimme den Normalenvektor der von diesen Punkten aufgespannten Ebene. Um das richtige Vorzeichen des Normalenvektors zu finden, kann man sich mit Hilfe der Rechten-Hand-Regel
überlegen, auf welcher Seite der Ebene der Ursprung des Koordinatensystems liegt.
(2.10)
Das ist ein einfaches lineares Gleichungssystem für die unbekannten Komponenten , ,
des Vektors . Da es sich um zwei Gleichungen für drei Unbekannte handelt, und da die Vektoren
und , und somit auch die beiden Gleichungen linear unabhängig sind, gibt es eine eindimensionale Lösungsmenge.
Aufgabe 2.5 Die dreidimensionale Version des Parallelenaxioms besagt, dass es im Euklidischen
zu jeder Ebene und jedem Punkt
genau eine Ebene
gibt, mit
und
Raum
. Man beweise diese Aussage. Man zeige außerdem, dass zwei Ebenen genau dann parallel im Sinne der obigen Definition sind, wenn sie entweder gleich sind oder ihre Schnittmenge
leer ist.
Aufgabe 2.8 Man zeige, dass die allgemeine Lösung von (2.10) wie folgt gegeben ist, wobei
beliebig gewählt werden kann,
und
dargestellt, deren Schnittmenge
Aufgabe 2.6 In Abbildung 2.1(b) sind zwei Ebenen
eine Gerade ist. Durch welche Gleichungen ist der normierte Richtungsvektor
der Geraden durch die beiden Normalenvektoren
und
der Ebenen bis auf sein Vorzeichen
eindeutig bestimmt?
(2.11)
Wir kennen damit alle Vektoren , die zu und und damit zu der von ihnen aufgespannten Ebene
senkrecht stehen. Jetzt müssen wir nur noch die Zahl so bestimmen, dass sich ein Einheitsvektor
ergibt, der in die der Orientierung der Ebene entsprechende Richtung zeigt.
Bevor wir das tun, betrachten wir jedoch zunächst den Vektor, der sich aus (2.11) für
ergibt. Wir bezeichnen diesen Vektor mit
Aufgabe 2.7 Wann schneidet eine Gerade eine Ebene senkrecht?
18
(2.12)
Wie man sieht, wird durch diese Vorschrift eine Abbildung definiert, die zwei Vektoren wieder
einen Vektor zuordnet,
(2.13)
Diese Abbildung wird Kreuzprodukt genannt. Sie hat die typischen Eigenschaften eines Produktes. Das Kreuzprodukt ist linear, das heißt es verhält sich assoziativ gegenüber der Addition,
(2.14)
und es ist mit der skalaren Multiplikation verträglich,
(2.15)
Allerdings ist es nicht wie das Skalarprodukt symmetrisch, sondern antisymmetrisch,
Bei der Definition des Kreuzproduktes haben wir explizit eine bestimmte Orthonormalbasis verwendet. Es stellt sich daher die Frage, ob diese Definition des Kreuzproduktes davon abhängt,
welche Basis wir verwenden. Oder gibt es vielleicht auch eine anschauliche, “geometrische” Definition des Kreuzproduktes, die nicht auf der Zerlegung der Vektoren bezüglich eine Orthonormalbasis beruht?
Um diese geometrische Definition des Kreuzproduktes zu finden, müssen wir zuerst ein paar
Rechenregeln herleiten. Es ist nützlich, dafür ein neues Symbol einzuführen, das für das Kreuzprodukt eine ähnliche Rolle spielt wie das Kronecker-Symbol für das Skalarprodukt. Wir erinnern
uns, dass das Kronecker-Symbol durch die Eigenschaft definiert war, dass für in einer Orthonormalbasis
(2.19)
Kreuzprodukt
Das Levi-Civita-Symbol
(2.16)
ist. Das Kronecker-Symbol repräsentiert also die Skalarprodukte der Basisvektoren. Wir hatten
es benutzt, um das Skalarprodukt von zwei Vektoren durch deren Komponenten auszudrücken,
Und schließlich hat es noch genau die Eigenschaft, die wir gefordert haben. Das Kreuzprodukt
steht senkrecht auf den Vektoren und ,
Auf der Suche nach einem Vektor, der zu zwei vorgegebenen Vektoren senkrecht steht, sind wir
also auf ein spezielles Produkt von Vektoren gestoßen, das, anders als das Skalarprodukt, als
Ergebnis keinen Skalar, sondern wieder einen Vektor liefert. Wie wir gleich sehen werden, spielt
das Kreuzprodukt für die Berechnung von Flächen eine ähnliche Rolle wie das Skalarprodukt für
die Berechnung von Längen.
(2.20)
(2.17)
Das Kreuzprodukt hat die gleichen Eigenschaften wie das Skalarprodukt bezüglich der Addition
und skalaren Multiplikation von Vektoren. Folglich gilt ganz analog
(2.21)
und
,
Um das Kreuzprodukt von zwei beliebigen Vektoren zu berechnen, genügt die Kenntnis der
Kreuzprodukte der Basisvektoren. Der einzige Unterschied zum Skalarprodukt ist, dass das Ergebnis jetzt wieder ein Vektor ist. Folglich müssen wir, um (2.21) weiter auszuwerten, die Vektoren
wieder bezüglich der Basis
entwickeln. Wir schreiben dafür
Aufgabe 2.10 Man berechne alle neun möglichen Kreuzprodukte der Basisvektoren
, also
,
,
und so weiter.
Aufgabe 2.9 Man leite die Eigenschaften (2.14-2.17) des Kreuzproduktes aus der Definition
(2.12) her. Warum kann man ein Kreuzprodukt mit diesen Eigenschaften nur in einem dreidimensionalen Raum definieren?
(2.22)
Aufgabe 2.11 Man berechne die zwölf möglichen Kreuzprodukte von jeweils zwei der folgenden
Vektoren,
Die Koeffizienten
sind die Komponenten des Vektors
bezüglich der Basis
. Es
Zahlen, denn auf der linken Seite der Gleichung
handelt sich um ein Schema von insgesamt
(2.22) steht einer von neun möglichen Vektoren, und jeder davon hat drei Komponenten.
Wir werden diese Koeffizienten gleich berechnen und sehen, dass sie sehr einfach aussehen.
Zuerst wollen wir aber die Rechnung (2.21) fortsetzen. Wenn wir (2.22) dort einsetzen, dann
ergibt sich
(2.18)
Man zeige anhand dieser Beispiele und mit Hilfe der Rechten-Hand-Regel, dass die Vektoren
immer ein Rechtssystem bilden, wenn und linear unabhängig sind. Es sei dabei
vorausgesetzt, dass das verwendete Koordinatensystem positiv orientiert ist.
Aufgabe 2.12 Laut Aufgabe 2.11 kann die Richtung des Kreuzproduktes von zwei Vektoren durch
die Rechte-Hand-Regel bestimmt werden. Warum folgt daraus zwingend, dass das Kreuzprodukt
nicht symmetrisch sein kann, sondern nur antisymmetrisch?
19
(2.23)
Im letzten Schritt haben wir die Summe über abgespalten, um zu zeigen, dass das Ergebnis
jetzt wieder in der üblichen Art und Weise als Linearkombination der Basisvektoren dargestellt
wird. Wir können daraus die folgende Vorschrift ableiten, nach der sich die Komponenten des
Kreuzproduktes aus den Komponenten der beiden Vektoren berechnen lassen,
Aufgabe 2.14 Man leite die folgenden Eigenschaften des Levi-Civita-Symbols aus der Definition
her. Es ist antisymmetrisch bezüglich des Vertauschens zweier Indizes,
(2.28)
Es behält dagegen sein Vorzeichen bei, wenn wir die drei Indizes zyklisch vertauschen,
(2.24)
(2.29)
Aufgabe 2.15 Wie wir wissen, lassen sich die Komponenten eines Vektors bez üglich einer Orthonormalbasis durch das Skalarprodukt mit den Basisvektoren bestimmen. Aus (2.22) folgt also
Wenn wir dies nun mit der ursprünglichen Definition (2.12) des Kreuzproduktes vergleichen, also
mit
(2.25)
(2.30)
nur sechs nicht
Einträgen des Zahlenschemas
zu berechnen
(2.26)
Eintr äge von
Man benutze das Ergebnis von Aufgabe 2.10, um daraus alle
und das Ergebnis (2.27) zu reproduzieren.
so stellen wir fest, dass von den insgesamt
verschwinden. Es sind dies die Einträge
drei beliebige Vektoren. Man beweise
Aufgabe 2.16 Es seien
(2.31)
Betrachten wir die nicht verschwindenden Komponenten von
etwas genauer, so stellen wir
eine gewisse Regelmäßigkeit fest. Alle sechs haben die Eigenschaft, dass die drei Indizes
die Werte
annehmen, nur jeweils in einer anderen Reihenfolge. Es kommt niemals ein
Index doppelt vor. Die sechs auftretenden Kombinationen sind genau die sechs möglichen Permutationen der Indexmenge
.
Auch das Vorzeichen lässt sich leicht aus einer speziellen Eigenschaft der jeweiligen Permutation ableiten. Eine Permutation von drei Indizes heißt gerade, wenn sie sich durch zyklisches
,
,
. Für die ersten drei Einträge in (2.26) ist das
Vertauschen ergibt, also
der Fall. Wir sagen auch, dies seien zyklische Permutationen der Indizes
. Wir erkennen eine zyklische Permutation daran, dass die Reihenfolge der Indizes, wenn wir sie periodisch
fortsetzen, die “richtige” Reihenfolge ist, also - - - - - - .
Die anderen drei Indexkombinationen in (2.26) sind ungerade oder antizyklische Permutationen
der Indexmenge
. Sie ergeben sich durch Vertauschen von jeweils zwei Indizes, also
,
oder
. Wenn wir eine solche Permutation periodisch fortsetzen, erscheinen
die Indizes in der “falschen” Reihenfolge - - - - - - . Alle anderen Einträge von
, also
diejenigen, bei denen mindestens ein Index doppelt vorkommt und somit gar keine Permutation
vorliegt, sind gleich Null. Das fassen wir wie folgt zusammen.
von
Aufgabe 2.13 Man verifiziere dieses Ergebnis durch Einsetzen von (2.26) in (2.24) und Ausschreiben der Summen.
Aufgabe 2.17 Die folgenden Formeln stellen eine Beziehung her zwischen dem Levi-CivitaSymbol und dem Kronecker-Symbol. Man beweise sie, indem man sich zuerst überlege, für welche Indexkombinationen sich überhaupt auf beiden Seiten der Gleichung nicht verschwindenden
Terme ergeben können, und überprüfe anschließend diese Terme explizit auf Gleichheit. Die einfachste Formel lautet
(2.32)
Etwas schwieriger ist die folgende Formel, die wir noch sehr häufig benötigen werden,
(2.33)
Die allgemeinste Formel, mit der sich jedes Produkt von zwei Levi-Civita-Symbolen durch
Kronecker-Symbole ausdrücken lässt, ist
(2.34)
Diese Formel werden wir jedoch nie explizit benötigen.
(2.27)
ist,
eine gerade . . .
. . . eine ungerade . . .
. . . keine Permutation von
wenn
Levi-CivitaSymbol
Aufgabe 2.18 Man beweise die Jacobi-Identität
(2.35)
Das so definierte Zahlenschema
wird Levi-Civita-Symbol genannt. Aus den Eigenschaften
dieses Symbols lassen sich, nachdem wir den Umgang damit ein wenig geübt haben, sehr leicht
alle Eigenschaften des Kreuzproduktes ableiten.
und mache sich außerdem klar, dass das Kreuzprodukt nicht assoziativ ist, die Klammern hier
also nicht weggelassen werden können.
20
replacements
(c)
(d)
und einen Anteil
senkrecht zu zerlegen. Das Rechteck, das durch die Vektoren und
aufgespannt wird, hat dann denselben Flächeninhalt wie das Parallelogramm.
Die dazu notwendige orthogonale Zerlegung eines Vektors haben wir bereits in Aufgabe 1.5
durchgeführt. Zunächst bestimmen wir den zu gehörenden Einheitsvektor . Er ist durch
gegeben. Dann zerlegen wir den Vektor gemäß (1.19),
(2.38)
Und interessiert nur der Vektor
, also
. Die Fläche des Rechtecks und damit des Parallelogramms ist
(b)
(a)
Abbildung 2.2: Das Kreuzproduktes
repräsentiert die Fläche des von und aufgespannten
Parallelogramms. Es steht auf diese Fläche senkrecht und für die drei Vektoren , und
gilt die Rechte-Hand-Regel (a). Das Spatprodukt
liefert das Volumen eines von den
Vektoren , und aufgespannten Spates (b).
(2.39)
ist. Jetzt verwenden wir noch die Definition
. Das
Hier haben wir benutzt, dass
ergibt
(2.40)
Das ist genau der vorletzte Ausdruck in (2.37), der auch dann gilt, wenn das Skalarprodukt von
und nicht verschwindet. Damit haben wir gezeigt, dass der Betrag des Kreuzproduktes
gleich dem Flächeninhalt des von und aufgespannten Parallelogramms ist,
Aufgabe 2.19 Man benutze die Formeln aus Aufgabe 2.17, um folgende Beziehung zwischen dem
Kreuzprodukt und dem Skalarprodukt herzuleiten.
(2.41)
(2.36)
, als auch für den Betrag dieses Vektors eine
Das Kreuzprodukt
steht auf und senkrecht, wobei diese drei Vektoren ein
Rechtssystem bilden. Sein Betrag ist die Fläche des von und aufgespannten Parallelogramms.
Jetzt haben wir immer noch nicht gezeigt, dass die Definition des Kreuzproduktes von der gewählten Orthonormalbasis unabhängig ist, und wir haben noch keine anschauliche geometrische Interpretation dafür gefunden. Wir wissen bisher nur, dass
stets senkrecht auf und steht,
und dass die Richtung dieses Vektors durch die Rechte-Hand-Regel gefunden werden kann.
Wir werden jetzt zeigen, dass der Betrag des Kreuzproduktes etwas mit einem Flächeninhalt
zu tun hat. Wir betrachten zunächst zwei zueinander senkrechte Vektoren
und deren Kreuzprodukt
. Aus (2.36) entnehmen wir, dass für den Betrag des Kreuzproduktes in diesem Fall
gilt
(2.37)
Wir haben nun sowohl für die Richtung von
anschauliche geometrische Erklärung.
Fläche und Volumen
Wir haben jetzt zwar keinen formalen Beweis geführt, aber wir haben eine anschauliche geometrische Beschreibung des Kreuzproduktes gefunden, und uns somit zumindest intuitiv klar gemacht,
dass es nicht davon abhängt, welche Orthonormalbasis wir in (2.24) verwenden, um es Komponentenweise auszurechnen. Mit anderen Worten, die Formel
(2.42)
also
. Das ist offenbar der Flächeninhalt des von den Vektoren und aufgespannten Rechtecks.
Im allgemeinen spannen zwei Vektoren aber kein Rechteck, sondern ein Parallelogramm auf.
Ein solches ist in Abbildung 2.2(a) dargestellt. Um seinen Flächeninhalt zu berechnen, gehen
wir wie folgt vor. Wir halten die Seite, die dem Vektor entspricht, fest und scheren es so, dass
sich ein Rechteck ergibt. Offenbar müssen wir dazu den Vektor in einen Anteil
parallel zu
für die Komponenten des Kreuzproduktes gilt in jeder Orthonormalbasis. Genauer gesagt, sie gilt
in jeder positiv orientierten Orthonormalbasis, denn in einer negativ orientieren Basis würden wir
einen Vorzeichenfehler machen, weil die Rechte-Hand-Regel für die Basisvektoren nicht mehr
gilt.
21
bildung 2.2 der Fall, ein Rechtssystem bilden. Es ist dagegen negativ, wenn sie ein Linkssystem
bilden, und Null, wenn sie linear abhängig sind. In diesem Fall ist der Spat entartet.
Warum ist das so? Wie wir gesehen haben, genügt es, die Kreuzprodukte der Basisvektoren
zu kennen, um beliebige Kreuzprodukte auszurechnen. Nun gilt aber in jeder positiv orientierten
und
ein Einheitsquadrat aufspannen, also ein Parallelogramm der
Orthonormalbasis, dass
Fläche . Außerdem ist der Vektor, der darauf senkrecht steht und der mit und ein Rechtssystem bildet, immer der Basisvektor . So ist eine positiv orientierte Orthonormalbasis definiert.
, und entsprechend die Formel (2.22) für die anderen
Also gilt für jede solche Basis
Kreuzprodukte der Basisvektoren.
Diese Aussage ist analog zu der Aussage zu interpretieren, dass die Beziehung (2.19) für die
Skalarprodukte in jeder Orthonormalbasis gilt. Wir können diese Aussagen sogar umkehren und
sagen, dass eine positiv orientierte Orthonormalbasis durch die Eigenschaften
Aufgabe 2.21 Wir kennen bereits die Spatprodukte der Basisvektoren einer Orthonormalbasis.
. Welche anschauliche geometrische Erklärung ergibt sich nun für diese
Es ist
Formel?
Aufgabe 2.22 Die eigentliche Fragestellung, die uns zum Kreuzprodukt f ührte, war die Bestimmung des Normalenvektors einer Ebene, die von drei Punkten
aufgespannt wird. Man
zeige, dass dieser nun durch
(2.45)
(2.43)
definiert ist. Einen tieferen Grund für diesen Zusammenhang zwischen Orthonormalbasen und
und
werden wir später im Zusammenhang mit der Drehgruppe kennenden Symbolen
lernen. Es ist deshalb nützlich, diese Definition einer positiv orientierten Orthonormalbasis im
Gedächtnis zu behalten. Sie ist außerdem nützlich, weil sich alle Rechenregeln und Formeln für
und
letztlich aus diesen Eigenschaften der Skalar- und Kreuzprodukte herdie Symbole
leiten lassen.
Das Kreuzprodukt ist also eng mit Flächen verknüpft, so wie das Skalarprodukt mit Längen
zu tun hat. Wir wollen nun noch zeigen, dass ein Kombination von beiden das Volumen berechnet. Wir betrachten dazu drei Vektoren , und , die linear unabhängig sein sollen. Wie in
Abbildung 2.2(b) dargestellt, spannen diese Vektoren einen Spat auf, also eine dreidimensionale
Verallgemeinerung eines Parallelogramms. Wir wollen sein Volumen berechnen.
Das Volumen eines Spates ist durch Grundfläche mal Höhe gegeben. Die Grundfläche sei
das von und aufgespannte Parallelogramm. Es hat die Fläche
. Die Höhe des
Spates ist die orthogonale Projektion des Vektors auf die Richtung senkrecht zur Grundfläche,
. Die orthogonale Projektion ist, das wissen wir bereits, durch das
also auf die Richtung von
Skalarprodukt von mit dem Einheitsvektor
gegeben. Folglich ist
gegeben ist. Man prüfe, ob die drei Ausdrücke gleich sind, ob die Forderungen (2.5) erfüllt sind,
und ob der so definierte Vektor in die richtige, der Orientierung der Ebene entsprechende
Richtung zeigt.
und
bezeichnet.
,
Aufgabe 2.23 Die Seiten eines Dreiecks
sind durch die Vektoren
gegeben. Die Seitenlängen seien wie üblich mit
,
und
Man zeige
(2.46)
und dass für den Flächeninhalt
des Dreiecks die Formeln
(2.47)
gelten. Man beweise die Heronsche Formel
(2.48)
Aufgabe 2.24 Abbildung 2.3(a) zeigt die Zerlegung eines Spates in sechs Tetraeder, analog zur
Zerlegung eines Parallelogramms in zwei Dreiecke. Die Tetraeder sind alle gleich groß, da jeweils
zwei von ihnen eine gleich große Grundfläche und die gleiche Höhe haben. Das Volumen jedes
einzelnen Tetraeders ist folglich ein sechstel des Volumen des Spates. Es soll das Volumen eines
gleichseitigen Tetraeders der Kantenlänge berechnet werden. Wie in Abbildung 2.3(b) gezeigt,
wird ein solcher Tetraeder durch drei Vektoren , , aufgespannt, mit
(2.44)
(2.49)
22
Man leite daraus mit Hilfe der Rechenregeln für das Skalar- und Kreuzprodukt die Formel
ab.
Aufgabe 2.20 Auch für das Volumen gilt eine Vorzeichenregel. Man zeige, dass das durch (2.44)
definierte Volumen eines Spates genau dann positiv ist, wenn die Vektoren
, wie in Ab-
Diese Kombination von Kreuz- und Skalarprodukt wird Spatprodukt genannt, da es das Volumen
eines von drei Vektoren aufgespannten Spates repräsentiert. Wir hatten bereits in Aufgabe 2.16
gezeigt, dass es zyklisch ist, also bei einer zyklischen Permutation der drei Vektoren seinen Wert
nicht ändert. Das muss natürlich so sein, denn das Volumen eines Spates hängt natürlich nicht
davon ab, in welcher Reihenfolge wir die drei Vektoren angeben.
replacements
darstellen. Jeder reellen Zahl wird ein Punkt
zugeordnet. Die Gesamtheit aller dieser
Punkte bildet die Kurve. Die Variable wird Kurvenparameter genannt. Handelt es sich nur
um ein endliches Stück einer Kurve, so können wir den Definitionsbereich von entsprechend
einschränken, zum Beispiel auf ein Intervall
.
Um konkrete Rechnungen durchzuführen, ist es sinnvoll, statt der Funktion
die Ortsvektordarstellung oder die Koordinatendarstellung der Kurve zu benutzen. Wir fixieren einen
, und betrachten dann die Vektorfunktion
Ursprung und eine Orthonormalbasis
(c)
(d)
(2.51)
In einem kartesischen Koordinatensystem wird eine Kurve entweder durch eine vektorwertige
, oder durch einen Satz von drei reellen Funktionen
beschrieFunktion
ben. In Abbildung 2.4(a) ist eine solche Kurve dargestellt. Sie hat eine endliche Länge, es gilt
, und sie verbindet die Punkte
und
.
Wenn die Funktion
hinreichend stetig und differenzierbar ist, was wir im folgenden stets
annehmen wollen, dann können wir die Ableitung bilden,
(b)
(a)
Abbildung 2.3: Ein Spat (a) kann in sechs gleich große Tetraeder zerlegt werden. Die Kanten
eines gleichseitigen Tetraeders (b) sind Vektoren gleicher Länge .
(2.52)
Aufgabe 2.25 Man zeige, dass zwei Kanten eines gleichseitigen Tetraeders, die sich nicht an
einer Ecke berühren, zueinander senkrecht stehen. In Abbildung 2.3 sind dies zum Beispiel die
Kanten und
.
Tangentenvektor
Aufgabe 2.26 Bei der Definition von Flächen und Volumen haben wir bis jetzt keine Rücksicht
auf die physikalischen Dimensionen der beteiligten Vektoren genommen. Wenn sich die betrachteten Flächen und Körper im physikalischen Raum befinden, welche Dimensionen haben dann die
Vektoren, die sie aufspannen? Ergeben sich daraus die richtigen Dimensionen f ür den Flächeninhalt und das Volumen, also Länge zum Quadrat bzw. Länge hoch drei?
Die Definition der Ableitung als Grenzwert haben wir explizit aufgeschrieben, um zu zeigen,
dass wir auch in einem Vektorraum in der üblichen Art und Weise Ableitungen bilden können. Im
Zähler steht die Differenz zweier Vektoren, also wieder ein Vektor. Im Nennen steht eine reelle
Zahl, das heißt wir multiplizieren den Vektor mit einer reellen Zahl und erhalten wieder einen
Vektor. Dieser hängt von und ab, und wir bilden schließlich den Grenzwert
.
Wir müssen nur noch erklären, wie wir in einem Vektorraum einen Grenzwert bilden. Der
Grenzwert in einem Vektorraum ist so definiert, dass die elementaren Abbildungen, also die Vektoraddition, die skalare Multiplikation und das Skalarprodukt, stetig sind. Drücken wir die Vektoren in (2.52) durch ihre Komponenten aus, so ist
Kurven
(2.53)
Wegen der Stetigkeit der Addition und der skalaren Multiplikation können wie die Summe mit
den Grenzwert vertauschen. Außerdem sind die Basisvektoren konstant. Also gilt
(2.54)
Um die Ableitung einer Vektorfunktion zu bilden, können wir einfach die Ableitungen der Komponenten bezüglich irgendeiner Basis bilden. Das sind gewöhnliche reelle Funktionen, das heißt
hier hat die Ableitung ihre gewöhnliche Bedeutung.
(2.50)
parametrisierte
Kurve
Wir können jetzt Längen, Flächen und Volumen berechnen, jedoch nur, wenn es sich dabei um
ganz bestimmte Objekte handelt, zum Beispiel den Abstand zwischen zwei Punkten, die Fläche
eines Parallelogramms oder Dreiecks, oder das Volumen eines Spates oder eines Tetraeders. Im
Prinzip können wir jedes ein-, zwei-, bzw. dreidimensionales Objekt derart in Teile zerlegen, dass
wir seine Länge, Fläche bzw. sein Volumen auf diese Weise berechnen können. Wir wollen das
am Beispiel einer Kurve zeigen, deren Länge wir berechnen wollen.
Eine Kurve im Raum können wir durch eine Funktion
23
ponentenweise ausrechnen, das heißt wir können (2.55) auch wie folgt schreiben,
(2.56)
(b)
(a)
Die Gleichung (2.55) ist nichts anderes als die Verallgemeinerung des Fundamentalsatzes der
Analysis, angewandt auf eine Vektorfunktion.
Durch Integration des Tangentenvektors einer Kurve bekommen wir den insgesamt von der
Kurve zurückgelegten Weg, das heißt den Abstandsvektor zwischen dem Anfangs- und dem Endpunkt der Kurve. Aber eigentlich wollten wir ja die Länge der Kurve berechnen. Diese ist im
allgemeinen größer als der Abstand zwischen Anfangs- und Endpunkt, da die Kurve ja einen
Umweg machen könnte.
Die Berechnung der Länge einer Kurve ist in Abbildung 2.4(b) dargestellt. Wir definieren
zunächst eine Funktion
. Sie soll die Länge der Kurve von ihrem Anfangspunkt, oder von
irgendeinem anderen fest gewählten Punkt, bis zur Stelle repräsentieren. Dann fragen wir uns,
von abhängt, also wie sich die Funktion
ändert, wenn wir um eine kleines Stück
wie
erhöhen.
Die Differenz
ist die Länge des Kurvenstückes zwischen und
. Wenn
sehr klein ist, können wir dieses Kurvenstück sehr gut durch eine gerade Strecke approximieren.
Diese Strecke wird durch den Vektor
dargestellt. Folglich gilt für ein kleines,
aber positives
(2.57)
Abbildung 2.4: Eine Kurve im Raum wird durch eine Ortsvektorfunktion
dargestellt (a). Die
Ableitung
ist der Tangentenvektor der Kurve an der Stelle . Um die Länge der Kurve zu
berechnen, zerlegt man sie in Linienelemente
und integriert diese (b).
Für Ableitungen einer Funktion
schreiben wir wie üblich
, benutzen aber gelegentlich auch die Schreibweise
. Wie wir gleich sehen werden ist das sehr nützlich, denn
mit Hilfe dieser etwas formalen Darstellung der Ableitung als Quotient lässt sich ganz einfach rechnen. Anschaulich stellen wir uns darunter das Verhältnis einer sehr kleinen Differenz
und der ebenfalls sehr kleinen Größe
vor.
Die geometrische Bedeutung des Vektors
ist in Abbildung 2.4(a) dargestellt. Es ist der
Tangentenvektor der Kurve an der Stelle . Er zeigt dort in die Richtung, in die die Kurve verläuft.
Wenn wir diesen Tangentenvektor entlang der Kurve integrieren, ergibt sich der Abstandsvektor,
der vom Anfangspunkt der Kurve zu ihrem Endpunkt zeigt,
Die Näherung ist umso besser, je kleiner ist. Jedoch können wir nicht einfach den Grenzwert
bilden, denn dann steht auf beiden Seiten der Gleichung Null. Wir können aber zuerst die
Gleichung durch teilen und dann den Grenzwert bilden,
(2.58)
(2.55)
. Die rechte Seite formen wir noch ein
Auf der linken Seite steht nun offenbar die Ableitung
wenig um. Da wir
annehmen, können wir den Nenner unter den Betrag ziehen. Das gleiche
gilt für den Grenzwert, denn der Betrag ist über das Skalarprodukt und die Quadratwurzelfunktion
definiert und daher stetig. Daraus folgt
Für das Integral einer Vektorfunktion gilt das gleiche wie für die Ableitung. Wir können es kom-
24
(2.59)
vor die Summe ein
schreiben,
Jetzt müssen wir diese Gleichung nur noch integrieren und bekommen den folgenden Ausdruck
für die Gesamtlänge
einer Kurve
für den Abschnitt
,
(2.64)
Kurvenlänge
(2.60)
Jetzt ergibt das ganze wieder eine Sinn, und natürlich ist das genau die Formel (2.60), wenn wir
darstellen. Über den Trick mit
dort die Kurve explizit durch ihre Koordinatenfunktionen
dem Linienelement (2.62), das sich unmittelbar aus dem Satz von Pythagoras ergibt, lässt sich die
Formel für die Länge einer beliebigen Kurve auf diese Weise leicht “herleiten”, oder jedenfalls
reproduzieren.
zu
Es spielt jetzt keine Rolle mehr, welchen Bezugspunkt wir verwenden, um die Funktion
definieren. Es tritt bei der Integration nur noch die Differenz von zwei Funktionswerten auf, und
dies ist die Gesamtlänge
der Kurve zwischen den Orten
und
. Damit kennen wir
auch die Bedeutung des Betrages des Tangentenvektors
. Er gibt an, wie sich die Länge der
Kurve als Funktion des Kurvenparameters verändert.
Durch eine kleine “formale” Manipulation können wir die Formel (2.60) für die Länge einer
Kurve auch sehr anschaulich darstellen. Wir schreiben noch einmal die Beziehung (2.59) in einer
etwas anderen Form auf,
und
Aufgabe 2.27 Man berechne die Länge einer geraden Strecke zwischen zwei Punkten
übereinstimmt.
und zeige, dass sie mit dem Abstand
Aufgabe 2.28 Man beweise die verallgemeinerte Dreiecksungleichung: Die L änge einer Kurve
ist stets größer oder gleich dem Abstand ihrer Endpunkte. Eine gerade Strecke ist demnach die
kürzeste Verbindung zweier Punkte.
,
Diese Gleichung multiplizieren wir nun formal mit
Aufgabe 2.29 Wie wir wissen, hat der Ortsvektor im physikalischen Raum die Dimension einer
Länge. Der Kurvenparameter habe ebenfalls die Dimension einer L änge. Welche physikalische
Dimension ergibt sich daraus für den Tangentenvektor? Welche Dimension hat das Längenele?
ment, und welche ergibt sich für das Integral in (2.60), also für die Größe
(2.61)
Aufgabe 2.30 Man berechne die Länge einer Parabel
für den Abschnitt
. Wenn dies eine Kurve im physikalischen Raum darstellen soll, welche physikalischen
Dimensionen haben dann die Konstante und der Kurvenparameter ?
(2.62)
Wir nennen diesen Ausdruck für
das Linienelement. Es hat folgende, in Abbildung 2.4(b)
dargestellte anschauliche Bedeutung. Wir betrachten ein kleines Stück der Kurve. Die Länge
dieses Stückes können wir berechnen, indem wir einen Koordinatenquader bilden, die Quadrate
der Seitenlängen
,
und
dieses Quaders addieren, und aus der Summe die Wurzel
ziehen. Das besagt die Formel (2.62).
Da wir dabei die Kurve durch eine gerade Strecke approximieren, gilt diese Formel natürlich
nur im Grenzfall, also wenn die Länge des Kurvenstückes gegen Null geht. Um die Gesamtlänge
der Kurve zu berechnen, müssen wir die Kurve in sehr viele sehr kleine Stücke unterteilen, die
Längen dieser Stücke aufsummieren, und schließlich den Grenzwert bilden, in dem die Anzahl
der Stücke gegen unendlich geht und deren Länge gegen Null. Das ist natürlich nichts anderes als
die Definition eines Integrals. Es gilt also
und
gegeben. Ferner sei
Aufgabe 2.31 Es seien zwei Funktionen
eine streng monoton steigende Funktion, und es gelte
. Dann beschreiben
beide Funktionen und dieselbe Kurve im Raum. Sie unterscheiden sich nur durch die Art und
Weise, wie die Kurve parametrisiert wird. Warum ist das so? Man zeige, dass die L änge einer
Kurve nicht davon abhängt, welche Parametrisierung man wählt, das heißt das Integral (2.60)
liefert in beiden Fällen dasselbe Ergebnis.
im Intervall
Aufgabe 2.32 Man berechne die Länge der Kurve
. Welche Beziehung besteht zu dem Ergebnis von Aufgabe 2.30? Wenn dies eine Kurve im physikalischen Raum darstellen soll, welche physikalischen Dimensionen haben dann die
Konstanten und , sowie der Kurvenparameter ?
zwei vektorwertige Funktionen, die von einer reellen
Aufgabe 2.33 Es seien
Variablen abhängen. Man zeige, dass die Produktregel für die Ableitung auch auf das Skalarprodukt und das Kreuzprodukt anwendbar ist. Es gilt
(2.63)
Allerdings können wir mit diesem formalen Ausdruck noch nichts anfangen. Wir können ihn aber
jetzt wieder mit
erweitern, indem wir den Ausdruck unter der Summe durch
teilen, und
25
(2.65)
PSfrag replacements
(c)
(d)
Aufgabe 2.34 Eine Fläche kann durch eine Funktion
beschrieben werden, das
heißt man ordnet jedem Paar von reellen Zahlen
einen Punkt
zu, mit Ortsvektor
. Man leite mit einer ähnlichen Überlegung, wie wir sie gerade für eine Kurve
durchgeführt haben, die folgende Formel für den Flächeninhalt her
Der Integrationsbereich von und ist dabei so zu wählen, dass er genau die Fläche abdeckt,
und
sind die partiellen Ableideren Inhalt berechnet werden soll. Die Vektoren
tungen der Ortsvektorfunktion
. Welche geometrische Bedeutung haben sie, und welche
anschauliche Interpretation hat ihr Kreuzprodukt?
(2.66)
(b)
(a)
Winkelfunktionen
Abbildung 2.5: Ein Kreis mit Radius in einer durch zwei orthogonale Einheitsvektoren
und
aufgespannten Ebene wir durch die Ortsvektordarstellung (2.80) beschrieben (a). Der Kurvenparameter ist der durchlaufene Winkel, und die Umlaufrichtung entspricht der Orientierung
der Ebene, wenn ihr Normalenvektor durch
gegeben ist. Der Winkel zwischen
zwei Vektoren hängt über (2.88) mit den Skalarprodukt, und über (2.91) mit dem Kreuzprodukt
zusammen (b).
Zum Abschluss dieses Kapitels wollen wir noch die wichtigsten Winkelfunktionen einführen. Bis
jetzt wissen wir nur, was ein rechter Winkel ist. Über das Skalarprodukt kann man aber auch ganz
allgemein der Winkel zwischen zwei beliebigen Vektoren definieren.
Winkel lassen sich am besten am Kreis einführen. Ein Kreis ist eine Kurve, die in einer Ebene
liegt, und die einen konstanten Abstand von einem Mittelpunkt hat. Sei also der Mittelpunkt
des Kreises und gleichzeitig der Ursprung des Koordinatensystems. Die Ebene, in der der Kreis
liegen soll, werde von zwei zueinander senkrechten Einheitsvektoren
und
aufgespannt. Es
ist also
,
und
.
Eine beliebige Kurve in dieser Ebene und ihr Tangentenvektor kann dann wie folgt dargestellt
werden,
(2.67)
Hier ist der Kurvenparameter, und und sind zunächst zwei beliebige Funktionen, die nur
hinreichend oft differenzierbar sein müssen. Ein Kreis hat die Eigenschaft, dass jeder Punkt auf
der Kurve denselben Abstand
vom Mittelpunkt hat. Das ist genau dann der Fall, wenn
Die Gleichungen (2.68) und (2.69) lassen sich in eine Forderung an die Funktionen und un
deren Ableitungen übersetzen. Es muss eins von zwei Paaren von Gleichungen erfüllt sein, und
zwar entweder
(2.70)
oder
(2.71)
(2.68)
Aufgabe 2.35 Man zeige, dass die Forderungen (2.68) und (2.69) an die Kurve tats ächlich (2.70)
oder (2.71) implizieren, wenn man die explizite Darstellung (2.67) einsetzt.
ist. Zusätzlich wollen wir fordern, dass der Kurvenparameter der durchlaufene Winkel ist. Der
Winkel eines Kreisbogens ist definiert als das Verhältnis der Bogenlänge zum Radius. Sei also
wie oben
die Kurvenlänge, gemessen von der Stelle
aus. Dann soll
sein,
. Die Ableitung der Kurvenlänge hängt wiederum über (2.59) mit dem Betrag
und somit
des Tangentenvektors zusammen. Also lautet die zweite Forderung
Die beiden Alternativen (2.70) und (2.71) unterscheiden sich nur um das Vorzeichen einer der beiden gesuchten Funktionen. Das entspricht einer Umkehrung eines der Vektoren
oder , und
damit letztlich der Umlaufrichtung des Kreises. Wir können uns daher ohne Beschränkung der
Allgemeinheit auf eine Möglichkeit festlegen. Ferner können wir noch eine Anfangsbedingung
an der Stelle
stellen. Wie in Abbildung 2.5 gezeigt, soll die Kreislinie bei
beginnen. Insgesamt erhalten wir dann die folgenden an und zu stellenden Forderungen,
(2.69)
In Abbildung 2.5(a) sind diese Eigenschaften der Kurve
noch einmal zusammengefasst. Der
Kreis liegt in der von
und
aufgespannten Ebene, und der Kreisbogen, der zu einem Winkel
gehört, hat die Länge
.
26
(2.72)
ist. Nun definieren wir die Funktionen
und
Wir wissen also, dass
Für
sind dies die üblichen Definitionen der Winkelfunktionen Sinus und Kosinus. Sie sind
durch die Eigenschaften
(2.76)
und
(2.73)
. Leiten
(2.77)
und
Ferner gelten für die Funktionen
und
Für sie gelten die gleichen Differenzialgleichungen wie für die Funktionen
wir nämlich jeweils beide Seiten dieser Gleichungen nach ab, so finden wir
und
durch diese Fordefestgelegt. Man kann sich leicht überlegen, dass die Funktionen
rungen eindeutig bestimmt sind. Es handelt sich nämlich um ein System von Differenzialgleichungen erster Ordnung mit Anfangsbedingungen. Solche Gleichungssysteme sind in der Physik
von großer Bedeutung. Wir werden im nächsten Kapitel näher darauf eingehen.
Wir können aber hier schon kurz ein Argument dafür angeben, warum die Forderungen (2.73)
die Funktionen
und
eindeutig festlegen. Wir kennen die Funktionswerte an der Stelle
, und damit auch die Ableitungen der beiden Funktionen. Wir wissen also, wie sie sich verändern,
wenn wir ein wenig erhöhen. Damit kennen wir auch die Funktionswerte “in der Nähe” von
. Somit kennen wir auch die Ableitungen dort und können daraus wieder schließen, wie
sich die Funktionen verändern, und so weiter.
Auf diese Weise können wir uns, anschaulich formuliert, zu immer größeren Werten von
vortasten und so die Funktionswerte für jedes finden. Das ist, wie wir im nächsten Kapitel sehen
werden, genau die Vorstellung, nach der auch die Bahn eines Körpers im Raum durch dessen
Bewegungsgleichung bestimmt wird. Hier haben die Funktionen noch keine derartige unmittelbar
physikalische Bedeutung, aber der mathematische Sachverhalt ist der gleiche. Ein System von
Differenzialgleichungen mit Anfangsbedingungen legt einen Satz von Funktion eindeutig fest.
Wir können aus (2.73) aber noch mehr schließen. Als Beispiel wollen wir zunächst zeigen, dass
für alle
(2.74)
die gleichen Anfangsbedingungen,
(2.78)
. Und daraus
Also sind es die gleichen Funktionen. Es ist
und
wiederum folgt, dass sie die Winkelfunktionen periodisch sind,
(2.79)
Aufgabe 2.36 Man beweise, dass es eine solche Zahl tatsächlich gibt, indem man die Annahme,
es sei
für alle
zu einem Widerspruch führt.
Der Wert der Zahl lässt sich nur durch numerische Näherungsverfahren bestimmen. Man findet,
wie wir natürlich wissen, einen Wert von
. Die Periode der Winkelfunktionen
, und das ist folglich auch der Winkel eines vollen Kreises. Denn die eindeutige
ist dann
Lösung von (2.72) lautet nun
ist. Daraus folgt unter anderem, dass beide Funktionen nur Werte zwischen
und annehmen.
Der Beweis nicht schwierig. Setzen wir
. Dann ergibt sich unmittelbar
aus (2.73)
. Ferner gilt für die Ableitung
(2.80)
Es ist üblich, bei den Winkelfunktionen die Klammern wegzulassen, wenn das Argument der
und
“wirken” immer nur auf das
Funktion nur aus einem Symbol besteht. Die Funkionen
nächstfolgende Zeichen, hier also auf .
(2.75)
Die Funktion
erfüllt also die Gleichungen
und
. Auch das ist wieder
ist. Damit
eine Differenzialgleichung mit Anfangsbedingung, deren eindeutige Lösung
haben wir die Formel (2.74) bewiesen.
Mit Hilfe eines ähnlichen Argumentes lässt sich sogar zeigen, dass die Funktionen
und
periodisch sind. Wir nehmen dazu wir an, es gäbe irgendeine kleinste positive Zahl, nennen wir
sie , mit
. Die Zahl ist also die erste positive Nullstelle der Sinusfunktion. Dann
oder
. Aus der Definition (2.73) folgt aber, dass im
ist wegen (2.74)
Intervall
überall
ist. Denn es ist
, und zwischen
und gibt es keine Nullstelle. Daraus folgt wiederum
für
,
und somit muss
sein. Also ist
.
Aufgabe 2.37 Man beweise
(2.81)
und zeige anschließend
27
hat?
Warum folgt daraus, dass ein rechter Winkel den Wert
für
(2.82)
replacements
(a)
(b)
(c)
(d)
Aufgabe 2.41 In der Praxis werden Winkel in Grad angegeben. Daraus k önnte man schließen,
dass der Winkel eine physikalische Größe mit Einheit ist, also eine dimensionsbehaftete Größe.
Warum ist dieser Schluss falsch? Warum gibt es, laut unserer Definition, keine physikalische
Größenart “Winkel”? In welchem Sinne ist daher die “Einheit” Grad zu verstehen?
Winkel und Skalarprodukt
Schließlich können wir noch eine ganz allgemeine Beziehung zwischen dem Winkel zwischen
zwei Vektoren und dem Skalarprodukt herleiten. Wir betrachten noch einem die durch (2.80)
. Dann handelt es sich um einen
dargestellte Kreiskurve. Der Einfachheit halber setzen wir
Einheitskreis, und die Vektoren
sind Einheitsvektoren.
Bilden wir das Skalarprodukt von den Vektoren
und
, so finden wir
Abbildung 2.6: Die Winkelfunktionen Sinus und Kosinus sind durch die Differenzialgleichungen
mit Anfangsbedingungen (2.73) eindeutig festgelegt. Sie nehmen Werte zwischen
und an,
, kehren jeweils nach einer halben Periode ihr Vorzeichen um, und
haben eine Periode von
gehen bei Verschiebung um eine viertel Periode ineinander über.
(2.86)
Hier haben wir das Additionstheorem (2.83) sowie die Eigenschaft (2.81) des Sinus benutzt.
Nun ist
gerade der Winkel zwischen den Vektoren
und
. Wir schließen daraus,
dass das Skalarprodukt zweier Einheitsvektoren durch den Kosinus des von ihnen gebildeten
Winkels gegeben ist. Das ist deshalb der Fall, weil wir immer eine Ebene finden können, und
in diese Ebene einen Einheitskreis legen können, so dass die beiden Vektoren auf diese Weise
dargestellt werden können.
Das können wir leicht verallgemeinern. Es seien und irgendwelche zwei Vektoren. Dann
existiert immer eine Ebene, die die beiden Vektoren enthält. Wenn die Vektoren linear unabhängig
sind, also in verschiedene Richtungen zeigen, dann ist die Lage dieser Ebene eindeutig bestimmt.
Ansonsten sind die Vektoren zueinander proportional. Dann wählen wir einfach irgendeine Ebene
aus, die von den beiden Vektoren aufgespannte Gerade enthält. In dieser, in Abbildung 2.5(b)
dargestellten Ebene können wir den Winkel zwischen den beiden Vektoren messen, den wir mit
bezeichnen.
Dieser Winkel hängt natürlich nicht von dem Betrag der Vektoren ab, sondern nur von deren
Richtungen. Folglich können wir genauso gut den Winkel zwischen den Einheitsvektoren
und
bestimmen. Für diesen Winkel gilt, wie wir gerade gesehen haben, dass sein Kosinus
durch das Skalarprodukt der beiden Vektoren gegeben ist. Folglich ist
Aufgabe 2.38 Man leite aus der Definition (2.73) die folgenden Additionstheoreme f ür die Winkelfunktionen her,
Der Beweis kann analog zum Beweis der Formel (2.74) geführt werden, die sich aus dem ersten
ergibt.
Additionstheorem für
(2.83)
Aufgabe 2.39 Die Exponentialfunktion
hat die Eigenschaft, dass sie mit ihrer Ableitung
ist. Man benutze dies und die Definitionen (2.73) der Winkelfunktionen,
übereinstimmt und
um die Formel
(2.84)
numerisch zu berechnen, entwickelt man sie in
und
(2.87)
Aufgabe 2.40 Um die Funktionen
eine Potenzreihe,
ist.
zu beweisen, wobei die imaginäre Einheit, also
(2.85)
oder
28
Winkel zwischen
Vektoren
Man zeige, dass sich aus den Forderungen (2.73) Rekursionsformeln f ür die Koeffizienten und
dieser Reihen ergeben, und dass diese dadurch eindeutig bestimmt sind. Man bestimme sie.
(2.88)
Damit haben wir eine allgemeine Beziehung zwischen dem Skalarprodukt und einem Winkel
hergeleitet.
Das Skalarprodukt von zwei Vektoren ist das Produkt ihrer Beträge mit den Kosinus
des eingeschossenen Winkels.
Bei der Winkelmessung tritt jedoch ein Problem auf. Wir können ihn in zwei Richtungen messen.
Wenn wir wie in Abbildung 2.5(b) messen, bekommen wir einen Winkel
. Wenn wir
dagegen in die andere Richtung messen, ergibt sich der Wert
. Für die Beziehung (2.88)
zwischen Winkel und Skalarprodukt ist das unerheblich, denn es gilt
.
zwischen zwei von Null verschiedenen Vektoren eindeutig festzuleUm den Winkel
gen, können wir uns aber darauf einigen, ihn immer auf dem kürzesten Weg zu messen. Der
Wertebereich des Winkels ist dann
(2.89)
(b)
(a)
Abbildung 2.7: Der Winkel
in einem Dreieck ist durch den Winkel zwischen den Vekund
definiert (a). Führt man in einem allgemeinen Dreieck
die üblichen
toren
Bezeichnungen für die Seitenlängen und Winkel ein, so gelten die bekannten Sätze der Euklidischen Geometrie (b).
Das ist genau der maximale Bereich, auf dem die Kosinusfunktion in Abbildung 2.6 eindeutig
umkehrbar ist. Durch die Beziehung (2.88) wird daher für jedes Paar von Vektoren
eindeutig ein Winkel
definiert. Er ist genau dann gleich Null, wenn die Vektoren in die
gleiche Richtung zeigen, er ist gleich , wenn sie in entgegengesetzte Richtungen zeigen, und
nimmt sonst Werte dazwischen an.
Aufgabe 2.44 Es sei
das in Abbildung 2.7(b) dargestellte Dreieck. Wir verwenden die
üblichen Bezeichnungen für die Seitenlängen
(2.92)
Aufgabe 2.42 Welche Rolle spielt die Schwarzsche Ungleichung (1.17) bei dieser Definition des
?
Winkels
und die Winkel
(2.94)
(2.93)
Schließlich können wir auch Winkel im Raum einführen. Sind
drei paarweise
verschiedene Punkte, so ist der Innenwinkel des Dreiecks
im Punkt durch
gegeben, also durch den Winkel zwischen den beiden Vektoren, die von
nach
bzw. zeigen. Da der Innenwinkel in einem Dreieck ebenfalls nur Werte zwischen und
annehmen kann, ist er eindeutig durch die Gleichung
Man beweise den Kosinussatz,
den Sinussatz,
(2.90)
(2.95)
Winkel
im Raum
sowie den Satz über die Winkelsumme,
festgelegt. Diese Definition ist noch einmal in Abbildung 2.7(a) dargestellt.
Aufgabe 2.43 Man zeige, dass der Betrag des Kreuzproduktes ebenfalls durch die Betr äge der
Vektoren und den Winkel zwischen ihnen ausgedrückt werden kann,
(2.96)
Aufgabe 2.45 Der Winkel zwischen zwei sich schneidenden Ebenen ist durch den Winkel zwischen ihren Normalenvektoren gegeben. Man berechne der Winkel, unter dem sich je zwei Seitenflächen des gleichseitigen Tetraeders in Abbildung 2.3(b) schneiden.
(2.91)
Messgrößen und Axiome
Das ist natürlich auch eine bekannte Formel für den Flächeninhalt eines Parallelogramms.
Zum Schluss wollen wir noch einmal die Diskussion aufgreifen, die wir am Ende des letzten
Kapitels über Messgrößen und Messvorschriften geführt haben. Durch eine Messvorschrift wird
29
PSfrag replacements
(a)
(b)
(c)
(d)
Abbildung 2.8: Ausschnitt aus dem Netz von Dreiecken, die von Gauß um 1820 vermessen wurden. Eine Abweichung der Winkelsumme von konnte auch bei sehr großen Dreiecken nicht
gefunden werden.
Ganz konkret könnte man einwenden, dass er ja nicht wirklich den Winkel in einem Dreieck gemessen hätte, sondern den Winkel zwischen zwei Lichtstrahlen in einer Ecke des Dreiecks. Müssten wir demzufolge nicht erst einmal die Ausbreitung von Licht im Raum verstehen,
um überhaupt sagen zu können, was wir mit einem Sextanten messen? Ähnliches trifft auf die
Längenmessung zu. Müssten wir nicht erst einmal verstehen, woraus ein Maßband besteht, und
wie es ich verhält, wenn wir es entlang einer Kurve auslegen, ob es dadurch nicht vielleicht seine
eigene Länge verändern kann, um sagen zu können, ob durch diese Messung wirklich die Länge
der Kurve festgestellt wird?
Das klingt alles sehr vernünftig, geht aber an der Sache, also an der Frage, was eine physikalische Theorie ist und wie man sie überprüfen kann, vorbei. Wir erinnern uns, dass die Angabe einer
Messvorschrift ein Teil der Definition einer Theorie ist, genau wie die mathematischen Axiome
einer Theorie, die die grundlegenden mathematischen Begriffe und Strukturen definieren. Die
Messvorschriften sind gewissermaßen die physikalischen Axiome einer Theorie. Eine Axiom allein, also eine Definition, kann aber nicht falsch sein. Wir können es auch nicht testen, indem wir
irgendwelche Experimente machen.
Wir können nicht feststellen, ob das, was wir am Sextanten ablesen, wirklich die Größe
ist. Wir können nur drei solche Messungen in einem Dreieck machen und feststellen,
ob die Summe der Messergebnisse beträgt oder nicht. Wenn das nicht der Fall ist, ist es völlig
sinnlos zu fragen, woran das liegt. Liegt es daran, dass der Winkelsummensatz falsch ist, oder
daran, dass das, was der Sextant misst, gar nicht der Winkel ist? Ersteres würde in logischer Konsequenz bedeuten, dass eines der mathematischen Axiome falsch wäre, letzteres dagegen, dass
eine in der Theorie zunächst als abstraktes mathematisches Objekt eingeführte Größe mit der
Skala eines Messgerätes identifiziert. Als eine solche Messgröße hatten wir bereits den Abstand
zweier Orte definiert. Wir können nun entsprechende Messvorschriften für die neuen Größen
Fläche, Volumen, Kurvenlänge und Winkel einführen.
Zur Messung der Kurvenlänge können wir dasselbe Maßband verwenden, das wir auch schon
zur Definition der Messgröße Abstand benutzt haben. Wir müssen es nur, statt es zu spannen
,entlang der gegebene Kurve auslegen. Das ist deshalb möglich, weil beide Größen dieselbe physikalische Dimension haben, nämlich die einer Länge. Andere Größenarten können wir mit einem
Maßband jedoch nicht messen.
Um Flächen, Volumen und Winkel zu messen, müssen wir uns andere Messgeräte ausdenken.
Winkel sind in diesem Zusammenhang von besonderem Interesse, denn eine der experimentell am
einfachsten zu testenden Aussagen der Euklidischen Geometrie ist der Winkelsummensatz (2.96).
Während alle anderen Sätze über Dreiecke immer auch auf deren Seitenlängen Bezug nehmen,
genügt für die Überprüfung des Winkelsummensatzes allein die Messung von drei Winkeln.
Das hat den Vorteil, dass man relativ einfach sehr große Dreiecke vermessen kann, wenn es
gelingt, ein Messgerät für einen Winkel zu konstruieren, das “lokal” arbeitet, sich also ganz an
einem der drei Ecken des Dreiecks befindet. Ein solches Messgerät ist ein Sextant. Ein Sextant
besteht im wesentlichen aus zwei Spiegeln, mit deren Hilfe man zwei aus unterschiedlichen Richtungen einfallende Bilder übereinander projizieren kann. Aus der Stellung der Spiegel lässt sich
der Winkel zwischen den Einfallsrichtungen ablesen. Stellt man den Sextanten an einem Ort
auf und peilt zwei andere Orte und an, so misst man mit ihm den Winkel
.
Von der Antike bis zu den ersten Satellitenbildern beruhte fast die gesamte Landvermessung
auf der Vermessung von Dreiecken mit dieser Technik. Dass man solche Messungen auch als Test
der Euklidischen Geometrie benutzen kann, als allerdings eine relative neue Erkenntnis. Das lag
im wesentlichen daran, dass die Euklidische Geometrie, wie bereits erwähnt, lange Zeit als reine
Mathematik betrachtet wurde. Die Erkenntnis, das die der Raum auch eine andere Struktur haben
könnte, geht auf einige Mathematiker am Anfang des 19. Jahrhunderts zurück, darunter vor allem
Gauß und Riemann, der die schon erwähnte Riemannsche Geometrie entwickelt hat.
Gauß hat unter anderem auch ein Projekt zur Landvermessung in Norddeutschland geleitet.
Er hat die Ergebnisse, gewissermaßen als Nebenprodukt, zum Test der Euklidischen Geometrie verwendet. Konkret handelt sich sich dabei um die Bestimmung der Winkelsumme einiger
und
Kilometern bekannteste
sehr großer Dreieck, darunter das mit Kantenlängen von ,
Gaußsche Dreieck, dessen Eckpunkte die Berge Brocken, Inselberg und Hoher Hagen bildeten.
Natürlich hat er, im Rahmen der damals verfügbaren Messgenauigkeit, keine Abweichung vom
Winkelsummensatz gefunden.
Darauf kommt es uns aber im Moment nicht an. Wir wollen vielmehr eine andere Frage diskutieren. Nehmen wir an, jemand hätte Gauß bei seinen Messungen gefragt, ob das, was er dort
in einem Dreieck sei. Mit anderen Worten, wenn er
messe, denn überhaupt der Winkel
eine Abweichung vom Winkelsummensatz finden würde, würde das nicht vielmehr darauf hindeuten, dass es etwas ganz anderes gemessen hat als den Winkel?
30
ist in der Strahlenoptik durch ein physikalisches Axiom definiert, genau wie ein Sextant in der
Euklidischen Geometrie. Es wäre unsinnig, im Rahmen der Strahlenoptik verstehen zu wollen,
warum sich Licht an einem Spiegel den Reflexionsgesetzen gemäß verhält. Das ist nämlich das
Axiom, das einen Spiegel definiert. Verstehen können wir die Funktion eines Spiegels erst im
Rahmen einer noch umfassenderen Theorie, nämlich der Wellenoptik oder der Elektrodynamik.
Natürlich wollen wir hier nicht weiter auf diese Theorien eingehen, denn wir stehen ja erst
ganz am Anfang des physikalischen Theoriengebäudes. Um alle diese Theorien zu verstehen, ist
es aber wichtig, auch die Grenzen einer Theorie zu erkennen, und sich stets darüber im klaren zu
sein, dass letztlich jede Theorie auf physikalischen Axiomen aufbaut, die wir nicht innerhalb der
jeweiligen Theorie verstehen oder erklären können. Es war sogar gerade diese Einsicht, die die
Entwicklung vieler moderner Theorien erst ermöglicht hat.
Was Zeit wirklich ist, verstehen wir zum Beispiel erst, seit Einstein festgestellt hat, dass es
sich dabei um eine physikalische Größe wie jede andere handelt, die mit einem Messinstrument
assoziiert ist, das wir Uhr nennen, und zwar genau so wie Abstand eine Messgröße ist, die mit
einem Maßband als Messinstrument assoziiert ist. Aber darauf werden wir im nächsten Kapitel
gleich noch näher eingehen.
eines der physikalischen Axiome der Theorie falsch wäre. Beides ist für sich genommen aber
unsinnig. Nur die Theorie als ganzes kann richtig oder falsch sein. Wenn etwas nicht stimmt, ist
es nicht möglich, zu entscheiden, ob der Fehler auf einem “falschen” mathematischen oder einem
“falschen” physikalischen Axiom beruht.
Um eine physikalische Theorie zu verstehen, ist es deshalb ganz wichtig, sich klar zu machen, dass ein physikalischen Axiom, also eine Messvorschrift, innerhalb der Theorie die gleiche
logische Stellung hat wie ein mathematisches Axiom. Es wäre sinnlos, dieses als einzelnes zu hinterfragen oder zu versuchen, es auf seine Richtigkeit zu prüfen. Ein berühmtes Zitat von Einstein
bringt diesen Sachverhalt sehr gut auf den Punkt.
Die Theorie bestimmt, was wir beobachten.
Aufgabe 2.46 Wieviel ist ein Nachdruck der in Abbildung 2.8 gezeigten, von Gauß vermessenen
Dreiecke zusammen mit anderen auf ihn zurückgehenden mathematischen Darstellungen heute in
etwa wert?
Aufgabe 2.47 Mit einem Maßband als Messgerät können wir, das hatten wir schon festgestellt,
nicht den Abstand von hier zum Mond messen. Können wir diesen Abstand überhaupt irgendwie
messen? Und wenn nicht, warum kennen wir ihn trotzdem? Kennen wir ihn eigentlich wirklich?
Wie verhält es sich mit dem Abstand von hier zum Sirius? Oder mit dem Abstand des Sirius vom
Andromeda-Nebel?
3 Klassische Mechanik
Die klassische Mechanik beschreibt die Bewegungen von Körpern im Raum. Sie wurde im wesentlichen von Newton formuliert und wird deswegen auch als Newtonsche Mechanik bezeichnet.
Ihre Grundbegriffe wollen wir in diesem Kapitel einführen. Genau genommen handelt es sich bei
der klassischen Mechanik gar nicht um eine physikalische Theorie im eigentlichen Sinne, sondern
eher um ein Gerüst, oder ein allgemeines Schema zur Konstruktion einer Theorie.
Zu einer physikalischen Theorie wird die klassische Mechanik erst, wenn man für ein spezielles mechanisches System zusätzliche Aussagen über die Art der beteiligten Körper und deren
Beziehungen zueinander macht. Trotzdem bietet die klassische Mechanik ein sehr nützliches und
vor allem sehr allgemeines Rezept zur Formulierung solcher Theorien, weil man letztlich nur sehr
wenige Parameter an das jeweilige System anpassen muss, um eine fertige Theorie zu bekommen.
Zunächst werden wir uns nur mit sehr einfachen Systemen befassen und daran die Grundbegriffe der Mechanik erklären. Die einfachsten mechanischen Systeme bestehen aus Punktteilchen,
Die Betonung liegt hier auf “was”. Es geht nicht nur darum, dass die Theorie, so wie wir dies
bereits im letzten Kapitel gezeigt haben, Aussagen über konkrete Messergebnisse macht, also
Aussagen darüber, was im Sinne von welches Messergebnis wir finden. Die Theorie ist es auch,
die uns sagt, als was wir eine Größe, die wir messen, zu interpretieren haben, zum Beispiel
als Winkel im Dreieck, als Abstand zwischen zwei Punkten, als Kurvenlänge oder was auch
immer. Sie tut dies, indem sie als Teil ihrer Definition bestimmte mathematische Größen mit
Messinstrumenten identifiziert.
Es wäre sinnlos, im Rahmen einer Theorie verstehen wollen, warum dieses oder jenes Messgerät diese oder jene Größe misst. Im Rahmen der Euklidischen Geometrie, so wie wir sie hier
eingeführt haben, wird die Messgröße Winkel durch das Messinstrument Sextant definiert. Wir
können nicht verstehen, warum ein Sextant einen Winkel misst. Wir postulieren es einfach. Genauso wenig können wir verstehen, warum das Skalarprodukt symmetrisch ist. Es ist einfach ein
Teil der Definition des Begriffes “Skalarprodukt”, so die der Sextant ein Teil der Definition des
Begriffes “Winkel” ist.
Dass wir letztlich doch irgendwie verstehen können, warum ein Sextant einen Winkel misst,
liegt daran, dass es natürlich Theorien gibt, die über die reine Geometrie des Raumes hinaus
gehen. Im Rahmen einer umfassenderen Theorie können wir dann sehr wohl verstehen, wie ein
Sextant funktioniert. Bei der obigen Erklärung der Funktionsweise eine Sextanten haben wir eine
solche, umfassendere Theorie benutzt, ohne dies explizit zu sagen. Wir haben die elementaren
Begriffe und Aussagen der Strahlenoptik benutzt.
Die Strahlenoptik besagt im wesentlichen, dass sich Licht auf Geraden im Raum ausbreitet,
wobei die Geraden genau die Objekte sind, die wir am Anfang dieses Kapitels eingeführt haben.
Und sie besagt, dass sich Licht an Spiegeln so verhält, wie wir dies eben aus dem Alltag kennen,
nach den bekannten Reflexionsgesetzen. Im Rahmen der Strahlenoptik verstehen wir die Funktionsweise eines Sextanten, und wir verstehen auch, warum sich zwei Lichtstrahlen, die von der
schneiden.
Orten und kommen, am Ort unter dem Winkel
Aber wird dadurch das Problem gelöst, dass es immer die Theorie ist, die bestimmt, was wir
eigentlich beobachten? Nein, denn es wird nur verschoben. Wir verstehen zwar jetzt, wie ein Sextant funktioniert, aber wir verstehen immer noch nicht, wie ein Spiegel funktioniert. Ein Spiegel
31
ab, weil sie von einer Uhr gemessen wird. Raum und Zeit existierten in Newtons Vorstellung als
absolute Strukturen unabhängig von unseren Beobachtungen und Experimenten.
Dass diese Vorstellung falsch war, wissen wir seit Einstein die Relativitätstheorie formuliert
hat und diese auch experimentell bestätigt wurde. Es erfordert daher ein völliges Umdenken, den
Übergang von der klassischen zur modernen, relativistischen Physik zu vollziehen, wenn man
zuvor die klassische Physik auf einem absoluten Raum- und Zeitbegriff aufgebaut hat. Das wollen
wir vermeiden. Auch die klassische Mechanik lässt sich ohne den Begriff des absoluten Raumes
und der absoluten Zeit formulieren. So, wie wir in den letzten beiden Kapiteln die Struktur des
Raumes allein durch Messgrößen und ihre Zuordnung zu mathematischen Strukturen beschrieben
haben, können wir nun auch die Zeit als eine Messgröße beschreiben.
Da eine Uhr die Zeit auf einer Skala anzeigt, ist die Zeit eine skalare, also ungerichtete Größe.
Die klassischen Physik nimmt an, dass die Zeit eine kontinuierliche Größe ist, also durch eine
reelle Zahl dargestellt wird. Sie wird in der Regel mit bezeichnet. Da sie nichts mit Längen,
Flächen oder Winkeln zu tun hat, handelt es sich um eine neue Größenart. Wir müssen folglich
auch eine neue Einheit einführen, um die Zeit zu messen. Die gebräuchliche Einheit heißt Sekunde (s),
s
(3.1)
Zeit und Uhr
Sie wird durch eine genau definierte Standard-Uhr festgelegt. Ursprünglich war diese Standardste Teil eines mittleren Sonnentages
uhr die rotierende Erde. Eine Sekunde wurde als der
definiert, also durch den periodischen Vorgang des Sonnenauf- und -untergangs. Die Erdrotation
ist jedoch nicht ganz gleichmäßig. Die Gezeiten führen zum Beispiel dazu, dass die so definierte
“Erduhr” innerhalb von tausend Jahren um einige Stunden nach geht.
Heute definiert man die Sekunde, ähnlich wie das Meter, durch einen im Mikrokosmos ablaufenden periodischen Vorgang, nämlich die Schwingung eines Cäsium-Atoms. Wir können uns
vorstellen, dass ein Atom spezielle Eigenschwingungen ausführt, und dass man diese Schwingungen mit einem geeigneten Messgerät zählen kann. Auf diese Weise arbeitet eine Atomuhr. Für die
theoretische Physik ist das jedoch nicht weiter interessant. Entscheidend ist allein, dass durch die
Zeit eine neue Größenart, also eine neue physikalische Dimension definiert wird.
also Körpern, die keine oder eine vernachlässigbar kleine räumliche Ausdehnung haben. Später
werden wir zeigen, wie wir daraus Beschreibungen von komplexeren Systeme ableiten können,
zum Beispiel von starren Körpern oder Flüssigkeiten, ohne die grundlegenden Konzepte neu überdenken zu müssen.
Die klassische Mechanik mit den aus ihr abgeleiteten Theorien deckt, zusammen mit der klassischen Elektrodynamik, fast den gesamten “alltäglichen” Bereich der Physik ab. Das ist in etwa alles, was sich in uns unmittelbar zugänglichen, “irdischen” Größenordnungen abspielt. Ihre Grenzen findet die klassische Mechanik bei sehr kleinen Strukturen in atomaren Größenordnungen,
wo nur noch die Quantenmechanik eine richtige Beschreibung liefert, und in Größenordnungen,
bei denen die Beschreibung des Raumes durch die Euklidische Geometrie versagt.
Letzteres hatten wir in den ersten beiden Kapitel bereits kurz angesprochen. Um die Struktur
des Raumes, und übrigens auch die der Zeit, sehr genau und auf Größenordnungen, die über die
Abmessungen unseres Sonnensystems hinaus gehen, richtig zu beschreiben, müssen wir die Relativitätstheorie verwenden. Der Gültigkeitsbereich der klassischen Mechanik ist also nach oben
und unten begrenzt, umfasst aber ein sehr weites Gebiet, insbesondere fast den gesamten Bereich
der technischen Anwendungen der Physik.
Bis jetzt haben wir nur den Raum selbst im Rahmen einer physikalischen Theorie beschrieben.
Nun wollen wir Vorgänge beschreiben, die in diesem Raum stattfinden. Dazu müssen wir die Zeit
als eine neue physikalische Größe einführen. Sie wird durch ein Messgerät definiert, das wir Uhr
nennen.
Eine Uhr ist ein Gerät, in dem ein periodischer Vorgang abläuft, zum Beispiel eine Pendelbewegung, das Schwingen eines Kristalls oder der Umlauf eines Planeten um einen Stern. Ein auf
der Uhr angebrachtes Zählwerk zeigt an, wie viele dieser Vorgänge bereits abgelaufen sind. Die
Messgröße, die auf dieser Skala angezeigt wird, nennen wir “Zeit”.
Auch hier gilt, was wir gerade über Messgrößen wie Längen und Winkel gesagt haben. Es ist an
dieser Stelle nicht sinnvoll, danach zu fragen, was Zeit “wirklich” ist. Es handelt sich um eine Definition, gewissermaßen das erste physikalische Axiom der klassischen Mechanik. Es gilt in dieser
Form sogar für alle modernen physikalischen Theorien, einschließlich der Relativitätstheorie und
der Quantenphysik.
Dass sich hinter dem Begriff “Zeit” nicht mehr verbirgt als die Anzeige einer Uhr, ist auf den
ersten Blick vielleicht etwas befremdlich. Es entspricht auch gar nicht der ursprünglichen Vorstellung, die Newton von der Zeit hatte, als er die klassische Mechanik entwickelte. Die ursprüngliche
Vorstellung von Raum und Zeit in der klassischen Physik war, dass beide Strukturen unabhängig
von irgendwelchen Messinstrumenten existieren. Ein Ort im Raum wird nicht erst dadurch zu
einem Ort, dass er mit einem Gegenstand markiert wird, und die Zeit läuft auch nicht deshalb
Die Zeit ist das, was eine Uhr anzeigt.
Aufgabe 3.1 Uhren, die über einen langen Zeitraum hinweg genau genug arbeiten, um damit die
Abweichung der Erdrotation von einer exakt periodischen Bewegung zu messen, gibt es erst seit
wenigen Jahrzehnten. Warum lässt sich trotzdem die Rotationsbewegung der Erde über die letzten
etwa drei- bis viertausend Jahre hinweg mit einer sehr großen Genauigkeit rekonstruieren?
Dynamische Systeme
Mit Hilfe der Zeit als Messgröße lassen sich andere Vorgänge beschreiben. Das allgemeine Konzept, das einer solchen Beschreibung zu Grunde liegt, ist das eines dynamischen Systems. Ein
dynamisches System besteht aus einer Menge von physikalischen Objekten, die verschiedene
Zustände annehmen können. Die Objekte können Gegenstände im Raum, Elektronen in einem
32
eines Systems würde durch skalare Größen festgelegt. Das Symbol steht dann als Abkürzung
für einen Satz von reellen Zahlen, sagen wir
mit
. Entsprechend wird die
beschrieben, und
Zeitentwicklung des Systems durch einen Satz von reellen Funktionen
die Bewegungsgleichung (3.2) hat die Form
Atom, Planeten im Sonnensystem, elektrische Schaltungen, Lichtstrahlen in einem Glasfaserkabel, oder was auch immer sein.
Der Zustand eines dynamischen Systems beschreibt die momentane Konfiguration dieser Objekte. Wie genau diese Beschreibung aussieht, hängt natürlich von der Art des jeweiligen Systems
ab. Das Konzept eines dynamischen Systems ist sehr allgemein und lässt sich auf fast alle Bereiche der Physik anwenden. Bei einem mechanischen Systems wird der Zustand, wie wir gleich
sehen werden, durch die Orte und Geschwindigkeiten aller beteiligten Körper festgelegt.
Einem dynamischen System können wir einen Zustandsraum zuordnen. Das ist die Menge
aller möglichen Zustände, die das System annehmen kann. Jedem Zustand entspricht genau ein
Element
des Zustandsraumes. Um festzustellen, in welchem Zustand sich das System
gerade befindet, müssen wir eine oder mehrere Messungen an dem System vornehmen. Auf diese Weise können wir den Zustand bestimmen, oder zumindest gewisse Information über ihn
erlangen, etwa dass er in einer bestimmten Teilmenge von liegt.
Die wesentliche Eigenschaft eines dynamischen Systems ist, dass es seinen Zustand mit der
beschrieben, die zu jeder Zeit
Zeit verändert. Dieser Vorgang wird durch eine Funktion
angibt, in welchem Zustand
sich das System gerade befindet. Indem wir zu verschiedenen
Zeiten Messungen am System vornehmen und gleichzeitig eine Uhr ablesen, können wir einzelne
Funktionswerte
bestimmen, wobei
die an der Uhr abgelesenen Zeiten
sind. Im Idealfall kann es sogar möglich sein, das System über einen gewissen Zeitraum hinweg
für ein bestimmtes
quasi kontinuierlich zu beobachten, so dass man danach die Funktion
Zeitintervall kennt.
Eine physikalische Theorie über ein dynamisches System besteht im wesentlichen aus zwei
Teilen. Zunächst macht sie ein Aussage über die mathematische Struktur des Zustandsraumes.
In den meisten, aber nicht in allen Beispielen, die wir in diesem und den folgenden Kapiteln
diskutieren werden, wird dies ein affiner Raum oder sogar ein Vektorraum sein. So wird eine
Abbildung der gegebenen physikalischen Struktur auf eine mathematische Struktur hergestellt.
Darüber hinaus macht eine physikalische Theorie Aussagen darüber, wie sich der Zustand mit
der Zeit entwickelt. Deshalb können wir mit Hilfe der Theorie Vorhersagen über das zukünftige
Verhalten eines dynamischen Systems machen.
Konkret sieht das so aus, dass eine Theorie eine Zeitentwicklungsgleichung oder Bewegungsgleichung postuliert. Eine Bewegungsgleichung ist eine Differenzialgleichung, die uns sagt, wie
besich das System mit der Zeit verändert, wenn es sich zu einer Zeit in einem Zustand
findet. Es ist üblich, die Ableitung einer Funktion nach der Zeit mit einem Punkt statt mit einem
des Zustandes
Strich zu bezeichnen. Die Bewegungsgleichung liefert also die Zeitableitung
als Funktion des Zustandes
und eventuell der Zeit ,
(3.3)
Das ist ein gekoppeltes System von Differenzialgleichungen erster Ordnung. Die Ableitungen der
Funktionen
hängen von den Funktionen selbst und der Variablen ab. Ein Beispiel für ein
solches System von Differenzialgleichungen hatten wir in einem ganz anderen Zusammenhang
schon einmal benutzt, um die Winkelfunktionen zu definieren.
Wir wollen annehmen, dass die Funktionen , die jeweils von
Variablen abhängen, stetig
und differenzierbar sind. Nach dem Satz von Cauchy, Picard und Lindel öf besitzt das System von
Differenzialgleichungen (3.3) dann genau eine Lösung, wenn wir zusätzlich eine Anfangsbedingung vorgeben. Eine Anfangsbedingung legt den Zustand des Systems zu irgendeiner Zeit fest,
also die Funktionswerte
. Mit anderen Worten, wenn wir den Zustand
des Systems zu irgendeiner Zeit kennen, dann liefert die Bewegungsgleichung eine eindeutige
Funktion
, das heißt wir können den Zustand zu jeder anderen Zeit berechnen.
Die Zeitentwicklung eines dynamischen Systems ist eindeutig durch die Bewegungsgleichung und den Anfangszustand bestimmt.
Der andere Zeitpunkt kann in der Zukunft oder in der Vergangenheit liegen. Wir können sowohl
die zukünftige Entwicklung des Systems vorhersagen, als auch die vergangene Entwicklung rekonstruieren. Natürlich nur unter der Annahme, dass die Theorie richtig ist, dass also die Bewegungsgleichung das Verhalten des dynamischen Systems richtig beschreibt. Das müssen wir
zuerst durch Experimente überprüfen. Um eine theoretische Beschreibung eines dynamischen Systems zu testen, müssen wir es über einen gewissen Zeitraum hinweg beobachten und feststellen,
ob seine Zeitentwicklung tatsächlich durch die gegebene Bewegungsgleichung beschrieben wird.
Ein dynamisches System mit der Eigenschaft, dass seine gesamte vergangene und zukünftige
Entwicklung festliegt, sobald der Zustand zu irgendeinem gegebenen Zeitpunkt bekannt ist, nennt
man auch ein ein deterministisches System. Die Vorstellung der klassischen Mechanik ist, dass
die ganze Welt ein solches deterministisches System ist. Unsere Aufgabe wird im folgenden sein,
kleine Teile aus dieser Welt herauszugreifen, die sich in einer gewissen Näherung unabhängig
von Rest der Welt beschreiben lassen, und deren Verhalten zu berechnen, also ihre Bewegungsgleichungen zu lösen.
(3.2)
Bewegungsgleichung
Aufgabe 3.2 Die Zeit werde durch eine Uhr definiert. Wir stellen neben diese Uhr eine zweite
Uhr, und betrachten diese als dynamisches System. Der Zustand der zweiten Uhr werde durch
eine Funktion
beschrieben, die angibt, welche Zeit die zweite Uhr anzeigt, wenn die erste
Uhr die Zeit anzeigt. Wie lautet die Bewegungsgleichung für die Funktion
? Nehmen wir
an, die zweite Uhr sei defekt und gehe innerhalb eines Tages um eine Stunde nach. Wie lautet
dann die Bewegungsgleichung für die Funktion
?
Wie diese Bewegungsgleichung explizit aussieht, hängt wieder vom jeweiligen System ab, und
natürlich von der mathematischen Struktur des Zustandsraumes. Nehmen wir an, der Zustand
33
Das Punktteilchen
Die Bahn
Wie beschreiben wir nun konkret die Bewegung eines Punktteilchens? Die wesentliche Eigenschaft eines Punktteilchen ist, sich zu jedem Zeitpunkt an genau einem Ort im Raum aufzuhalten. Die Bahn des Teilchens wird durch eine Funktion
(3.4)
beschrieben, die zu jeder Zeit angibt, wo im Ortsraum
sich das Teilchen gerade befindet,
.
nämlich am Punkt
Um konkrete Rechnungen durchzuführen, ist es nützlich, statt der Funktion
eine vektorwertige Funktion
zu betrachten. Wir legen dazu einen Ursprung fest, so dass jedem Ort
eindeutig ein Ortsvektor
zugeordnet ist. Die Bahn des Teilchens kann
Was ein dynamisches System ist und wie es konkret beschrieben werden kann, lässt sich am besten an einem einfachen Beispiel erläutern. Das einfachste dynamische System, das die klassische
Mechanik kennt, ist das Punktteilchen. Ein Punktteilchen, oft auch einfach Teilchen genannt, ist
die idealisierte Vorstellung von einem Körper, der so klein ist, dass wir seine Ausdehnung um
Vergleich zu den Abmessungen des Raumes, in dem er sich bewegt, vernachlässigen können. Innerhalb einer gewissen Näherung können wir dann so tun, als befände sich der gesamte Körper
in einem Punkt des Raumes.
Was “klein” in diesem Zusammenhang bedeutet, hängt von der jeweiligen Fragestellung ab.
Wenn wir die Bewegung eines Elektrons in einer Bildröhre beschreiben wollen, können wir das
Elektron in diesem Sinne als klein ansehen. Falls es überhaupt eines Ausdehnung hat, so ist
diese sehr klein im Vergleich zu den Abmessungen der Bildröhre. Vielleicht ist ein Elektron
sogar wirklich punktförmig. Auf jedem Fall ist es so klein, dass die klassische Mechanik ohnehin
versagt, wenn wir versuchen, seine innere Struktur und damit seine räumliche Ausdehnung zu
beschreiben. Wir müssten statt dessen die Quantenmechanik verwenden.
Es wäre daher völlig sinnlos, ein Elektron als ausgedehntes Objekt zu betrachten, wenn wir
seine Bewegungen gleichzeitig mit Hilfe der klassischen Mechanik beschreiben würden. Denn
die klassische Mechanik ist letztlich nur eine Näherung der Quantenmechanik. Sie gilt nur für
Systeme von einer gewissen Größenordnung an aufwärts, etwa im Bereich von einigen Nanooder Mikrometern oder darüber. Da das Elektron sicher sehr viel kleiner als ein Nanometer ist,
kann es im Rahmen der klassischen Mechanik als punktförmiges Teilchen betrachtet werden.
Das Beispiel soll klar machen, dass die Vorstellung von einem punktförmigen Körper zwar auf
den ersten Blick etwas realitätsfern erscheint. Sie ist aber nicht mehr als eine N äherung, wie wir
sie in jeder praktischen Anwendung einer Theorie ohnehin durchführen müssen. Ob wir jemals
zu einer wirklich fundamentalen Theorie kommen werden, ist eine offene Frage. Solange wir
eine solche Theorie nicht haben, ist jede Theorie nur eine Näherung einer genaueren, vielleicht
umfassenderen Theorie. Es wäre deshalb sinnlos, auf eine Näherung innerhalb einer Theorie zu
verzichten, wenn man zuvor schon allein durch die Anwendung dieser Theorie eine Näherung
durchgeführt hat, die zu einem wesentlichen größeren Fehler führt.
Der Fehler, den wir machen, wenn wir ein Elektron mit Hilfe der klassischen Mechanik anstelle
der Quantenmechanik beschreiben, ist bereits viel größer als der, den wir machen, wenn wir eine
mögliche räumliche Ausdehnung des Elektrons vernachlässigen. Ob dieser Fehler immer noch
klein genug ist, um die Bewegung des Elektrons in der Bildröhre wenigstens annähernd richtig zu
beschreiben, ist eine ganz andere Frage. Um sie zu beantworten, müssen wir die Bewegung erst
einmal konkret berechnen und das Ergebnis dann mit der Realität vergleichen. Genau mit dieser
Art von Aufgaben werden wir uns in den folgenden Kapiteln ausführlich beschäftigen.
Ein anderes Beispiel für einen Körper, den wir als punktförmig ansehen können, ist ein Himmelskörper, dessen Bahn wir beschreiben wollen. Fast alle Himmelskörper sind sehr klein im
Vergleich zu den räumlichen Gebieten, in denen sie sich bewegen, und im Vergleich zu den Entfernungen zwischen ihnen. Die Planeten und ihre Monde sind sehr klein im Vergleich zu den
Abmessungen des Sonnensystems. Wenn es nur darum geht, die Bahnen der Planeten und Monde zu beschreiben, können wir sie als punktförmig betrachten. Die Erde ist in diesem Sinne ein
Punktteilchen. Das gleiche gilt für die Sterne in einer Galaxie. Die Himmelsmechanik ist im wesentlichen eine Mechanik von Punktteilchen.
Auch hier gilt, was wir zuvor über das Elektron gesagt haben. Es wäre sinnlos, einen Himmelskörper wie etwa die Erde im Sonnensystem als ausgedehntes Objekt zu betrachten, wenn
wir gleichzeitig die klassische Mechanik verwenden, um ihre Umlaufbahn um die Sonne zu berechnen. Die Abweichung der berechneten von der tatsächlichen Bahn, die sich auf Grund der
räumlichen Ausdehnung der Erde ergibt, ist nämlich wesentlich kleiner als der Fehler, den wir allein schon durch die Anwendung der Newtonschen Gravitationstheorie machen. Sie ist nämlich in
diesem Fall nur eine Näherung der allgemeinen Relativitätstheorie. Erst wenn wir diese, wesentlich genauere Theorie verwenden, um die Bahnen der Planeten zu beschreiben, ist es überhaupt
sinnvoll, sie als ausgedehnte Körper zu betrachten.
Das Konzept eines Punktteilchens ist demnach eine für praktische Zwecke sehr nützliche Näherung, obwohl es auf den ersten Blick einen sehr idealisierten und wirklichkeitsfernen Anschein
hat, die Ausdehnung eines Körpers zu vernachlässigen. Es gibt darüber hinaus sogar Situationen,
in denen diese Näherung immer noch sehr gut ist, obwohl die Ausdehnung eines Körpers nicht
mehr vernachlässigbar ist. Eine solche Situation liegt zum Beispiel dann vor, wenn ein Körper
starr, also nicht verformbar ist, und, aus welchen Gründen auch immer, nicht rotiert.
Wir werden das hier nicht beweisen können, weil wir dazu erst das Konzept eines starren
Körpers erarbeiten müssen. Es ist aber sehr nützlich, diese Aussage zunächst einmal zu akzeptieren. Ein nicht rotierender, starrer Körper verhält sich genau wie ein Punktteilchen, das sich im
Schwerpunkt des Körpers befindet. Viele der praktischen Beispiele, die wir in diesem und den
nächsten Kapiteln studieren werden, sind von dieser Art. Sie können als Systeme von Punktteilchen aufgefasst werden, obwohl die Ausdehnungen der beteiligten Körper nicht vernachlässigbar
klein sind. Den Beweis dafür, dass die Newtonsche Mechanik dies tatsächlich impliziert, werden
wir später nachliefern.
34
replacements
. Um die Schreibweise noch ein wenig zu
Die Summe läuft natürlich wieder über
vereinfachen, führen wir die Summenkonvention ein. Wie schreiben die Summenzeichen gar nicht
mehr explizit aus, sondern treffen die folgende Vereinbarung:
(c)
(d)
Über doppelt auftretende Vektorindizes wird summiert.
dann durch eine vektorwertige Funktion beschrieben werden,
(3.5)
Dass diese Vorschrift einen Sinn hat, ist nicht unmittelbar einzusehen. Außerdem stellen sich ein
paar Fragen. Wie sollen wir denn jetzt einen Ausdruck, bei dem über einen Index summiert wird,
von einem gleich lautenden Ausdruck, bei dem nicht summiert wird, unterscheiden? Und warum
gilt die Summenkonvention gerade dann, wenn ein Index in einem Produkt zweimal, aber nicht
dreimal oder nur einmal vorkommt?
Alle diese Fragen werden wir später beantworten können, wenn wir uns etwas genauer mit dem
Verhalten von Vektorkomponenten unter Koordinatentransformationen beschäftigen. Es stellt sich
nämlich heraus, dass ein Ausdruck, in dem Vektorkomponenten vorkommen, nur dann sinnvoll
ist, wenn jeder Index entweder genau einmal vorkommt, ohne das summiert wird, oder genau
zweimal, wobei dann aber über den Index summiert werden muss. Dahinter verbirgt sich eine
mathematische Struktur, auf die wir an dieser Stelle aber nicht näher eingehen können.
Wir verwenden sie Summenkonvention erst einmal nur, um und Schreibarbeit zu ersparen, und
ohne viel darüber nachzudenken. Dass sie funktioniert, nehmen wir einfach zur Kenntnis. Außerdem ist sie nur für Vektorindizes gültig, also für diejenigen Indizes, die die Komponenten von
annehmen. Wir verwenden
Vektoren und die Basisvektoren bezeichnen und die Werte
für diese Indizes immer die Buchstaben
.
Abbildung 3.1: Die Bahn eines Teilchens wird durch eine Funktion
beschrieben, die zu
jedem Zeitpunkt den Ort des Teilchens im Raum angibt (a). Sie kann explizit durch die Koordibezüglich eines ausgewählten Koordinatensystems dargestellt werden. Die
natenfunktionen
Geschwindigkeit
und die Beschleunigung
sind die ersten und zweiten Ableitungen des
. Der Vektor
zeigt tangential zur Bahn, der Vektor in die Richtung, in die
Ortsvektors
sich die Bahn krümmt (b).
Bahn
(b)
(a)
Mit anderen Worten, immer wenn in einem Produkt ein Index, der die Komponenten eines Vektors
oder die Basisvektoren durchnummeriert, genau zweimal auftritt, so stellen wir uns vor diesem
Term ein entsprechendes Summenzeichen vor. Zum Beispiel schreiben wir für den letzten Ausdruck in (3.7)
(3.8)
Da es sich um einen Ortsvektor handelt, hat die Funktion natürlich die Dimension einer Länge,
m.
Wenn wir diese Ortsvektordarstellung der Bahn verwenden, müssen wir jedoch beachten, dass
von der Wahl des Ursprungs abhängt. Wählen wir einen anderen Ursprung
die Funktion
, mit
, so gilt für die Darstellung derselben Bahn bezüglich des neuen Ursprungs
Aufgabe 3.3 Man führe folgenden “empirischen” Test der Summenkonvention durch. Man überprüfe in allen Gleichungen in den Kapiteln 1 und 2, in denen Vektorindizes vorkommen, ob
tatsächlich genau dann über einen Index summiert wird, wenn dieser genau zweimal auftritt.
Gibt es irgendeine Gleichung, in der ein Index mehr als zweimal auftritt?
(3.6)
Geschwindigkeit und Beschleunigung
Unter einer Verschiebung des Ursprungs um den Vektor transformiert sich der Ortsvektor und
.
damit die Darstellung der Bahn des Teilchens um einen konstanten Vektor
Um die Bahn noch konkreter zu beschreiben, müssen wir eine Basis festlegen und dadurch
ein Koordinatensystem einführen. Sei also
eine Orthonormalbasis von . Dann wird die
Bahnkurve des Teilchens durch drei reelle Koordinatenfunktionen beschrieben,
Aus der Bahn eines Teilchens, die wir im folgenden stets durch den Ortsvektor
als Funktion
der Zeit beschreiben, lassen sich weitere Größen ableiten, wobei “ableiten” an dieser Stelle ganz
wörtlich zu verstehen ist.
wird eine Kurve im Raum beschrieben, wobei die Zeit als KurvenpaDurch die Funktion
rameter dient. Der Tangentenvektor dieser Kurve ist die Geschwindigkeit des Teilchens. Sie kann
mit
(3.7)
35
definiert werden,
des Teilchens von der Wahl des Ursprungs des
Aufgabe 3.5 Warum hängt der Ortsvektor
gewählten Koordinatensystems ab, die Geschwindigkeit
und die Beschleunigung
aber
nicht?
oder durch ihre Komponenten
als Vektorfunktion
(3.9)
Geschwindigkeit
Die Newtonschen Gesetze
Wie bereits erwähnt, ist es üblich, Ableitungen nach der Zeit mit einem Punkt zu bezeichnen.
. Die übliche Einheit der
Wir verwenden wahlweise diese Notation oder die Schreibweise
Geschwindigkeit ergibt sich als Meter pro Sekunde,
m s. Die Geschwindigkeit ist wieder eine neue Größenart, allerdings eine, für die wir keine neue Einheit einführen
müssen. Es handelt sich um eine aus den fundamentalen Größenarten Länge und Zeit abgeleitete
Größenart. Die physikalische Dimension der Geschwindigkeit ist Länge geteilt durch Zeit.
Im allgemeinen ist auch die Geschwindigkeit eine Funktion der Zeit. Sie ist nur dann konstant,
wenn sich das Teilchen geradlinig und gleichförmig bewegt, also mit konstanter Geschwindigkeit
entlang einer Geraden. In diesem Fall ist
Die klassische Mechanik, wie sie von Newton formuliert wurde, sagt nun folgendes über die Bewegung eines Punktteilchens. Wenn auf ein Teilchen kein äußerer Einfluss einwirkt, dann bewegt
es sich geradlinig und gleichförmig, also mit einer konstanten Geschwindigkeit. Wir sprechen in
diesem Fall von einem freien Teilchen. Dies ist das erste Newtonsche Gesetz:
Ein freies Teilchen bewegt sich geradlinig und gleichförmig.
(3.10)
Wirkt auf das Teilchen ein äußerer Einfluss, so geschieht dies in Form eine Kraft. Eine Kraft
ist eine gerichtete Größe, also ein Vektor, der eine Abweichung der Bahn des Teilchens von der
geradlinigen und gleichförmigen Bewegung bewirkt. Wirken auf das Teilchen mehrere Einflüsse
gleichzeitig ein, so sind die entsprechenden Kraftvektoren zu einer Gesamtkraft zu addieren.
Die Gesamtkraft bewirkt eine zu diesem Vektor proportionale Beschleunigung das Teilchens.
Der Proportionalitätsfaktor ist eine Eigenschaft des jeweiligen Teilchens. Er wird Masse genannt
und mit bezeichnet. Es gilt also
wobei der Ortsvektor des Ortes ist, an dem sich das Teilchen zur Zeit
befindet, und
seine konstante Geschwindigkeit.
Um die Abweichung der Bewegung von einer geradlinigen und gleichförmigen Bewegung zu
beschreiben, definieren wir die Beschleunigung als die Ableitung der Geschwindigkeit nach der
Zeit, oder als die zweite Ableitung des Ortsvektors nach der Zeit. Auch diese Definition können
wir wahlweise als Vektorgleichung oder komponentenweise aufschreiben,
(3.13)
Kraft
wenn
die zur Zeit auf das Teilchen einwirkende Gesamtkraft ist. Dies ist das zweite Newtonsche Gesetz:
Beschleunigung
(3.11)
Wirkt eine Kraft auf ein Teilchen, so bewirkt diese eine Beschleunigung.
Als Einheit für die Beschleunigung ergibt sich
m s .
Höhere Ableitungen treten in den Gesetzen der klassischen Mechanik nicht auf. Meist ist die
Beschleunigung noch nicht einmal eine stetige Funktion der Zeit. Es genügt also, dass die Bahn
eine mindestens zweimal differenzierbare Funktion der Zeit ist.
Je größer die Masse
ist, desto träger ist das Teilchen, das heißt umso mehr versucht es, der
Krafteinwirkung zu widerstehen und auf seiner geradlinigen und gleichförmigen Bewegung zu
beharren. Die Masse ist ein Maß für die Trägheit eines Teilchens. Sie wird in einer willkürlich
gewählten Einheit Kilogramm (kg) gemessen, definiert also eine neue physikalische Dimension.
Wie ein Messgerät für die Masse eines Körpers aussieht, werden wir uns gleich noch überlegen.
Durch die Wahl der Einheit für die Masse wird auch die Einheit und damit die physikalische
Dimension der Kraft festgelegt,
Aufgabe 3.4 Es seien die folgenden Bahnen gegeben,
N
(3.14)
kg m
s
(3.12)
m
s
kg
Als Abkürzung führt man für die Kraft auch die Einheit Newton (N) ein.
Eigentlich ist das erste Newtonsche Gesetz nur ein Spezialfall des zweiten, der dann vorliegt,
wenn auf ein Teilchen keine Kräfte einwirken. Und für sich genommen sind beide Gesetze auch
noch nicht sehr aussagekräftig. Das ist der Grund, warum die klassische Mechanik eigentlich nur
Man berechne jeweils die Geschwindigkeit
und die Beschleunigung
, sowie deren Beträge
und
. Welchen physikalischen Dimensionen haben die jeweils
angegebenen Konstanten?
36
eine allgemeines Konzept zur Konstruktion einer physikalischen Theorie ist. Um konkrete Aussagen über die Bahn eines Teilchen abzuleiten, müssen wir zusätzlich wissen, welche Kräfte denn
nun konkret auf ein Teilchen einwirken, wenn es sich in einer bestimmten Situation befindet. Erst
PSfrag replacements
durch die Angabe solcher Kraftgesetze werden die Newtonschen Gesetze zu einer physikalischen
Theorie, die konkrete Aussagen über die Bahnen von Teilchen macht.
als Funktion der Zeit vor. Eine
Das einfachste mögliche Kraftgesetz gibt explizit die Kraft
(c)
solche Situation liegt vor, wenn wir das Teilchen gewissermaßen “von außen” steuern. Zu jedem
(d)
Zeitpunkt ist die Kraft durch einen bestimmten Vektor gegeben, der in der Abbildung 3.2(a) als
Pfeil am jeweiligen Ort des Teilchens dargestellt ist. Während sich das Teilchen bewegt, ändert
sich dieser Vektor in einer vorgegebenen Art und Weise, die unabhängig davon ist, wie sich das
Teilchen gerade bewegt.
(a)
Die Bewegungsgleichung sieht in diesem Fall sehr einfach aus. Es ist die Differenzialgleichung
für die Funktion
, die sich aus dem zweiten Newtonschen Gesetz ergibt,
Abbildung 3.2: Ist die Kraft explizit als Funktion
(b)
der Zeit gegeben, so ergibt sich die Bahn
aus der Bewegungsgleichung (3.15) (a). Ist die Kraft dagegen durch ein Kraftfeld
als
Funktion des Ortes gegeben, so gilt die Bewegungsgleichung (3.16) (b). Dargestellt ist jeweils
eine spezielle Lösung der Bewegungsgleichung, die sich eindeutig durch die Wahl bestimmter
Anfangsbedingungen ergibt. Die Punkte markieren gleich lange Zeitintervalle.
Wie wir gleich sehen werden, können wir diese Gleichung sehr leicht nach
auflösen, um so
die Bahn des Teilchens aus der gegebenen Kraftfunktion
berechnen.
Typischerweise wird die Kraft aber nicht explizit als Funktion der Zeit gegeben sein, sondern
zum Beispiel als Funktion des Ortes, an dem sich das Teilchen gerade befindet. Wir sprechen dann
von einem Kraftfeld, wie es in Abbildung 3.2(b) dargestellt ist. Ein Kraftfeld ordnet jedem Punkt
zu. Dieser gibt an, welche Kraft auf das Teilchen
im Raum mit Ortsvektor einen Vektor
einwirkt, wenn es sich am Ort befindet.
Um die Bewegungsgleichung für ein Teilchen in einem Kraftfeld aufzustellen, müssen wir auf
den Wert des Kraftfeldes an der Stelle einsetzen,
der rechten Seite der Gleichung (3.15) statt
an der sich das Teilchen gerade befindet, also
(3.15)
sich in Frage stellen. Denn das zweite Newtonsche Gesetz wäre sinnlos, wenn die Kraft selbst
wiederum als Funktion der Beschleunigung gegeben wäre.
Es gibt aber noch eine Verallgemeinerung des Kraftgesetzes (3.17), die für die Mechanik von
Punktteilchen sehr wesentlich ist. Bisher haben wir nur ein einzelnes Teilchen betrachtet. Bei
einem System von Teilchen beschreiben wir die Bahn jedes einzelnen Teilchens durch eine
Ortsvektorfunktion
, wobei der Index
die einzelnen Teilchen durchnummeriert. Um die Teilchenindizes nicht mit den Vektorindizes zu verwechseln, bezeichnen wir sie mit
kleinen griechischen Buchstaben.
repräsentiert den Ortsvektor des Teilchens mit der Nummer , und die
Die Funktion
Komponenten dieses Vektors, also die Koordinaten des Teilchens, sind durch die reellen Funkmit
gegeben. Da jedes Teilchen im allgemeinen eine andere Masse
tionen
hat, bezeichnen wir die Massen entsprechend mit
. Es gilt dann für jedes Teilchen das zweite
, wobei
die auf dieses Teilchen wirkende Kraft ist. Für die
Newtonsche Gesetz
Teilchenindizes gilt hier natürlich keine Summenkonvention.
Nun kann diese Kraft vom Ort und von der Geschwindigkeit des jeweiligen Teilchens
abhängen, sowie explizit von der Zeit. Bei einem System aus mehreren Teilchen kann sie aber
auch von den Orten und den Geschwindigkeiten aller anderen Teilchen abhängen. Das allgemeinste Kraftgesetz für ein -Teilchen System lautet also
(3.16)
Diese Differenzialgleichung ist schon ein wenig komplizierter als (3.15). Die unbekannte Funktion
erscheint auf beiden Seiten. Es handelt sich um eine Differenzialgleichung zweiter Ord, die wir im allgemeinen nicht mehr so einfach lösen können.
nung für die gesuchte Funktion
In diesem und den nächsten Kapiteln werden wir uns vor allem mit den Methoden beschäftigen,
solche Bewegungsgleichungen entweder explizit zu lösen oder zumindest qualitative Aussagen
über deren Lösungen zu machen.
Das ist aber noch nicht der allgemeinste Fall für ein Kraftgesetz. Zusätzlich kann das Kraftfeld noch explizit von der Zeit abhängen, oder auch von der Geschwindigkeit des Teilchens. Die
allgemeinste Form für die Bewegungsgleichung eines Teilchens in einem Kraftfeld lautet
(3.17)
Kraftgesetze, bei denen die Kraft auch noch von der Beschleunigung oder höheren Ableitungen
abhängt, sind nicht bekannt. Die Existenz solcher Kraftgesetze würde das Konzept der Kraft an
37
(3.18)
Jede Kraft, die ein Teilchen auf ein anderes ausübt, wird durch eine entsprechende Gegenkraft
gewissermaßen kompensiert. Oft wird das dritte Newtonsche Gesetz auch in der lateinischen
Kurzform “actio reactio” zitiert.
Wir müssen vektorwertige Funktion
angeben, die jeweils von
reellen Variablen
abhängen, nämlich von den Vektoren
und mit ihren jeweils drei Komponenten und von der
Zeit .
Meistens nimmt ein solches Kraftgesetz eine sehr spezielle Form an. Es treten in der Regel
nur Kräfte auf, die von den Orten und eventuell den Geschwindigkeiten von jeweils zwei Teilchen abhängen. Wir sagen dann, dass die Teilchen paarweise miteinander wechselwirken. Die
zusammen, die durch
Gesamtkraft , die auf das Teilchen wirkt, setzt sich aus Kräften
die Wechselwirkung des Teilchens mit dem Teilchen verursacht werden. Zusätzlich kann
noch eine äußere Kraft
auf jedes Teilchen wirken, die nicht von einem anderen Teilchen
verursacht ist, sondern von außen auf das System einwirkt.
Betrachten wir der Einfachheit halber nur Kräfte, die von den Orten, aber nicht den Geschwindigkeiten der Teilchen oder explizit von der Zeit abhängen. Dann werden die Wechselwirkungen
von Teilchen durch ein Kraftgesetz der Form
Jeder Kraft entspricht eine entgegengesetzte, gleich große Gegenkraft.
Eine äußere Kraft
, wie sie in (3.20) auftritt, widerspricht diesem Prinzip offenbar. Dass wir
solche Kräfte trotzdem zulassen, liegt daran, dass es manchmal sinnvoll ist, bestimmte Objekte, mit denen die Teilchen wechselwirken, nicht in das dynamische System einzubeziehen. Ein
typisches Beispiel ist die Anziehungskraft der Erde, die auf alle Teilchen in einem Labor gleichermaßen wirkt. Zwar üben die Teilchen auch eine gleich große Gegenkraft auf die Erde aus,
aber die Wirkung dieser Kraft ist wegen der großen Masse und damit großen Trägheit der Erde
vernachlässigbar.
Wir betrachten daher das “Teilchen” Erde als außerhalb des dynamischen Systems, dessen Bewegungen wir beschreiben wollen. Wir müssen dessen Wirkung auf die anderen Teilchen dann
aber in der Form (3.20) als äußere Kraft berücksichtigen. Genau genommen gilt das dritte Newtonsche Gesetz also nur für abgeschlossene Systeme, die nicht mit anderen Objekten wechselwirken.
(3.19)
beschrieben. Wir benutzen im folgenden die Konvention, dass
diejenige Kraft ist, die vom
Teilchen auf das Teilchen ausgeübt wird, das heißt die Kraft wird vom Teilchen verursacht und sie wirkt auf das Teilchen . Und für eine äußere Kraft, die auf das Teilchen wirkt,
schreiben wir
.
Meistens ist es zudem so, dass die Wechselwirkung des Teilchens mit dem Teilchen nur
von der relativen Position der beiden Teilchen abhängt, also von dem Abstandsvektor
.
Dann vereinfacht sich das Kraftgesetz noch ein wenig, da die Kräfte nur noch von jeweils einem
Vektor abhängen,
Aufgabe 3.6 Wir betrachten ein abgeschlossenes System aus Teilchen. Das Kraftgesetz sei von
der Form (3.19). Zusätzlich sollen die Funktionen
und
, die die Wechselwirkungen und äußeren Kräfte beschreiben, die folgende Symmetrie haben. Sie sollen unabh ängig
wir als Ursprung des Koordinatensystems w ählen. Mit anderen
davon sein, welchen Punkt
Worten, das Kraftgesetz soll sich nicht ändern, wenn wir die Ortsvektoren gemäß (3.6) transformieren. Man zeige, dass das Kraftgesetz dann von der Form (3.20) sein muss. Die Wechselwirkungen dürfen nur von den relativen Positionen der Teilchen abhängen. Außerdem müssen die
äußeren Kräfte konstant, also ortsunabhängig sein.
(3.20)
Zeitabhängige Kräfte
Als einfachstes Beispiel einer Bewegungsgleichung wollen wir nun etwas genauer den Fall einer
Kraft untersuchen, die gemäß (3.15) explizit als Funktion der Zeit gegeben ist,
Wir müssen jetzt nur noch insgesamt
Funktionen
und
angeben, die jeweils von
bzw.
.
drei reellen Variablen abhängen, nämlich von den Komponenten der Vektoren
Natürlich ist auch das im allgemeinen ein sehr kompliziertes System von gekoppelten Differenzialgleichungen, das wir nur in sehr speziellen Fällen explizit lösen können. Einige dieser Fälle
werden wir später ausführlich diskutieren.
Schließlich gibt es noch das dritte Newtonsche Gesetz, das eine Aussage über die in der Natur
tatsächlich vorkommenden Wechselwirkungen zwischen Teilchen macht. Es besagt, dass eine
Wechselwirkung, wie der Name schon andeutet, stets auf Gegenseitigkeit beruht. Bewirkt ein
Teilchen eine Kraft
auf ein Teilchen , so bewirkt das Teilchen umgekehrt auf das
Teilchen eine Kraft
, die entgegengesetzt gleich ist,
(3.22)
In diesem Fall macht es keinen Unterschied, ob wir ein einzelnes Teilchen oder ein System von
mehreren Teilchen betrachten. Für jedes Teilchen gilt unabhängig von den anderen Teilchen eine
Bewegungsgleichung der Form (3.22).
kennen, können wir diese Gleichung durch zweimaliges IntegrieDa wir die Funktion
ren lösen. Wir berechnen zuerst die Geschwindigkeit
als Funktion der Zeit, indem wir die
von einem willkürlich gewählten Zeitpunkt bis integrieren. Nach dem
Beschleunigung
reactio
actio
(3.21)
38
(c)
(d)
Hauptsatz der Integral- und Differenzialrechnung für vektorwertige Funktionen gilt
(3.23)
. Dann können wir
für die Geschwindigkeit des Teilchens zur Zeit
explizit angeben,
(b)
(a)
Wir schreiben
die Funktion
Abbildung 3.3: Beim schrägen Wurf wird ein Teilchen aus der Höhe oberhalb des Erdbodens
mit der Geschwindigkeit unter dem Winkel abgeworfen. Die Wurfweite ist der horizontale
Abstand des Ortes, an dem das Teilchen auf dem Boden auftrifft, von dem Punkt direkt unterhalb
der Abwurfstelle. Gezeigt ist die Flugbahn des Teilchens ohne (a) und mit (b) Luftreibung.
(3.24)
Die Geschwindigkeit
des Teilchens zur Zeit ist eindeutig bestimmt durch den Anfangswert
zur Zeit und die Kraftfunktion
. Durch nochmaliges Integrieren finden wir die gesuchte
Ortsfunktion
. Es gilt
(3.25)
und
Hier sind
beliebige Konstanten.
setzen,
und folglich, wenn wir
Aufgabe 3.8 Im Gravitationsfeld der Erde in der Nähe der Oberfläche wirkt auf ein Teilchen der
Masse eine konstante Kraft
(3.29)
m s
mit
Erdanziehung
(3.26)
wenn das Koordinatensystem so gewählt ist, dass der Basisvektor
vertikal nach oben zeigt.
Bei dem in Abbildung 3.3(a) dargestellten schrägen Wurf befindet sich ein Teilchen der Masse
in einer Höhe oberhalb des Bodens und wird dort mit einer Geschwindigkeit
unter
einem Winkel zur Horizontalen abgeworfen. Man berechne die Wurfweite als Funktion von
, und . Um die Bewegungsgleichung zu lösen, sollte man von der Freiheit der Wahl des
Koordinatensystems Gebrauch machen.
ausführen,
Wenn wir jetzt noch das äußere Integral aufspalten und dann die Integration über
ergibt sich
Aus der Kenntnis der Kraftfunktion
und den Anfangsbedingungen
und
, also des Ortes und der Geschwindigkeit zu irgendeinem Zeitpunkt , können wir die Bahn
zweimal integrieren.
des Teilchens eindeutig bestimmen. Wir müssen dazu nur die Funktion
(3.27)
Aufgabe 3.9 Beim schrägen Wurf aus Aufgabe 3.8 sei die Abwurfgeschwindigkeit und die H öhe
fixiert, aber der Abwurfwinkel variabel. Man bestimme die maximal erreichbare Wurfweite
als Funktion von und , sowie den optimalen Abwurfwinkel .
Aufgabe 3.7 Man löse die Bewegungsgleichung (3.15) für die folgenden Kräfte und Anfangsbedingungen:
Anfangsbedingung und Bewegungszustand
Am Beispiel einer zeitabhängigen Kraft haben wir gesehen, dass wir zusätzlich zum Kraftgesetz den Ort und die Geschwindigkeit eines Teilchens zu einem bestimmten Zeitpunkt vorgeben
müssen, um eine eindeutige Lösung der Bewegungsgleichung zu bekommen. Diese Schlussfolgerung können wir verallgemeinern. Es ist stets so, dass die Bewegung eines Teilchens eindeutig
(3.28)
39
Das können wir unmittelbar verallgemeinern und den Bewegungszustand eines -TeilchenSystems definieren. Führen wir analog zu (3.31) den Impuls des Teilchens ein,
durch das Kraftgesetz und die Angabe des Ortes und der Geschwindigkeit zu einem beliebigen
Zeitpunkt festgelegt ist. Im Sinne der einleitenden Bemerkungen über dynamische Systeme heißt
das, dass der Zustand, oder genauer der Bewegungszustand eines Teilchens durch die Angabe
seines Ortes und seiner Geschwindigkeit festgelegt wird.
Um das zu erklären, werden wir die Bewegungsgleichung ein wenig umschreiben. Jedes System von Differenzialgleichungen zweiter oder höherer Ordnung lässt sich auf ein System von
Differenzialgleichungen erster Ordnung reduzieren, indem man einen geeigneten Satz von Hilfsfunktionen einführt. Betrachten wir noch einmal die allgemeinste Bewegungsgleichung (3.17) für
ein einzelnes Teilchen,
(3.30)
(3.33)
so lassen sich die Bewegungsgleichungen (3.18) in der Form
(3.34)
schreiben. Der Zustand eines -Teilchen-Systems wird folglich durch die Angabe aller Orte
und aller Impulse
festgelegt. Auf der linken Seite des Gleichungssystem (3.34) steht die
Zeitableitung dieses Zustandes, auf der rechten Seite eine Funktion des Zustandes und der
Zeit .
Der Bewegungszustand eines -Teilchen-Systems wird durch die Orte und Impulse
aller Teilchen bestimmt.
Aus den allgemeinen Überlegungen über dynamische System können wir jetzt folgenden Schluss
ziehen. Wenn wir den Bewegungszustand eines Systems aus Teilchen, also alle Orte und Impulse zu einem bestimmten Zeitpunkt kennen, so können wir die Bewegungen der Teilchen für
alle Zeiten berechnen. Sie sind durch die eindeutige Lösung der Differenzialgleichungen (3.34)
gegeben, mit den Anfangsbedingungen
(3.31)
Impuls
Wenn wir den Ortsvektor und seine Ableitungen in ihre Komponenten bezüglich irgendeiner
Basis zerlegen, dann repräsentiert diese Vektorgleichung ein System von drei reellen Differenzialgleichungen zweiter Ordnung, die im allgemeinen miteinander gekoppelt sind. Um es in ein
System von Differenzialgleichungen erster Ordnung zu überführen, führen wir drei reelle Hilfsfunktionen ein, oder einfach eine vektorwertige Hilfsfunktion. Es ist üblich, dafür die Funktion
zu verwenden. Diese Größe nennt man Impuls. Sie hat die Dimension Masse mal Geschwindigkeit, also
kg m s.
Zwar könnten wir den Faktor an dieser Stelle ebenso gut weglassen und die Geschwindigkeit
als Hilfsfunktion verwenden. Aber wie wir gleich sehen werden, hat der Impuls ein
paar nützliche Eigenschaften, die das Lösen von Bewegungsgleichungen in vielen Fällen vereinfachen.
In jedem Fall ergibt sich jetzt ein System von Differenzialgleichungen erster Ordnung, das wir
wie folgt schreiben können,
(3.35)
.
die wir beliebig vorgeben können. Sie definieren den Anfangszustand
Hierbei müssen wir natürlich voraussetzen, dass wir das Kraftgesetz kennen, dass es das Verhalten des -Teilchen-Systems richtig beschreibt, und dass es ausreichend regulär ist, also die
Funktionen
in (3.34) stetig und differenzierbar sind. Wenn diese Voraussetzungen erfüllt sind,
ist die Mechanik von Punktteilchen eine deterministische Theorie, das heißt aus der Kenntnis des
Anfangszustandes lässt sich die Zeitentwicklung vorhersagen.
Allerdings macht der Satz von Cauchy, Picard und Lindelöf noch eine Einschränkung, auf die
wir an dieser Stelle hinweisen sollten. Unter den genannten Voraussetzungen garantiert der Satz
die Existenz einer Lösung der Bewegungsgleichung nur für ein endliches Zeitintervall
, das den Anfangszeitpunkt enthält. Es kann also vorkommen, dass die eindeutige Lösung
der Bewegungsgleichungen gar nicht für alle Zeiten existiert, sondern nur für einen endlichen
Zeitraum von
bis , wobei der Zeitpunkt , zu dem wir die Anfangsbedingungen gestellt
haben, natürlich innerhalb dieses Zeitraumes liegt.
Vom physikalischen Standpunkt aus betrachtet würde das bedeuten, dass etwas nicht ganz stimmen kann. Der Zustand eines dynamischen Systems, also in diesem Fall die Bahnen
und die
der Teilchen müssen für alle Zeiten existieren. Falls ein solcher Fall eintritt, ist
Impulse
(3.32)
40
Die erste Gleichung ist nichts anderes als die Definition der Hilfsfunktion
. Die zweite Gleichung besagt, dass die Kraft eine Änderung des Impulses bewirkt. Sie ergibt sich aus (3.30),
wobei wir jedoch das Kraftgesetz als Funktion des Ortes und des Impuls anstelle des Ortes und
der Geschwindigkeit angeben müssen. Die Umrechnung ist aber ganz einfach, denn wir müssen
an den entsprechenden Stellen einfügen, wenn wir explizit ein bestimmtes
nur den Faktor
Kraftgesetz gegeben haben.
Die Differenzialgleichungen (3.32) sind jetzt von der allgemeinen Form (3.2) der Bewegungsgleichung eines dynamisches System. Wenn wir den Bewegungszustand des Teilchens durch
definieren, also durch seinen Ort und seinen Impuls, dann steht auf der linken Seite der Gleichung die Zeitableitung des Zustandes, und auf der rechten Seite eine vorgegebene
Funktion des Zustandes und der Zeit .
soll sich der Körper am Ort befinden und einen Impuls bzw. eine GeschwinZur Zeit
digkeit
haben. Setzen wir den Ansatz für
in diese Gleichung und in die Bewegungsgleiund
sein muss, also
chung ein, so finden wir, dass
dies meist ein Hinweis darauf, dass wir bei der Beschreibung des physikalischen Systems eine unzulässige Vereinfachung oder Näherung gemacht haben. Die Theorie, die wir über ein spezielles
dynamische System aufgestellt haben, zeigt auf diese Weise ihre eigenen Grenzen auf.
Ein Beispiel dafür werden wir im nächsten Kapitel kennen lernen. Von solchen sehr speziellen
Fällen abgesehen ist es aber stets so, dass die Anfangsbedingungen zusammen mit den Bewegungsgleichungen die Bahnen eindeutig für und alle Zeiten bestimmen. Mechanische Systeme
verhalten sich stets deterministisch, und solange wir keine unzulässigen Vereinfachungen machen, existieren die Lösungen der Bewegungsgleichungen für alle Zeiten.
(3.40)
Der Impuls, und damit auch die Geschwindigkeit des Körpers nehmen exponentiell mit der Zeit
ab. Die Funktion
finden wir, indem wir die entsprechende Bewegungsgleichung von bis
integrieren,
Aufgabe 3.10 Man wiederhole die einzelnen Schritte (3.22–3.27) zur L ösung der Bewegungsgleichung für eine zeitabhänge Kraft, jedoch ausgehend von den Bewegungsgleichungen erster
Ordnung (3.32). Man löse zuerst die Bewegungsgleichung für den Impuls, dann die für die Bahn.
Reibungskräfte
(3.41)
Wir wollen an einem einfachen Beispiel zeigen, dass das Umschreiben der Bewegungsgleichung
in die Form (3.32) bzw. (3.34) eines Systems von Differenzialgleichungen erster Ordnung auch
einen praktischen Nutzen hat. Manchmal lassen sich diese Gleichungen nämlich einfacher lösen
als die ursprüngliche Bewegungsgleichung zweiter Ordnung.
Wir betrachten einen Körper der Masse , der sich in einem Gas oder einer Flüssigkeit bewegt und dadurch eine Reibungskraft spürt. Der Körper soll die eingangs erwähnten Bedingungen erfüllen, also starr sein und nicht rotieren, so dass wir ihn als punktförmig betrachten können.
Die Reibungskraft ist von der Geschwindigkeit abhängig und ihr entgegen gerichtet, da sie den
Körper stets abbremst. Solange die Geschwindigkeit nicht zu groß wird, können wir annehmen,
dass die Reibungskraft zur Geschwindigkeit proportional ist,
Für die Bahn und den Impuls des Körpers finden wir demnach folgende Funktionen, parametrisiert durch den Anfangsort und den Anfangsimpuls ,
(3.42)
Das war ein typisches Beispiel dafür, wie ein System von Differenzialgleichungen schrittweise
gelöst werden kann, wenn die einzelnen Gleichungen entkoppeln. Wir konnten zuerst die Bewegungsgleichung für den Impuls lösen, und anschließend die für den Ort. Die Lösung für den
Impuls konnten wir durch geschicktes Raten finden, die Lösung für den Ort anschließend durch
eine gezielte Integration.
(3.36)
mit
Reibungskraft
Aufgabe 3.11 Welche physikalische Dimension hat die Reibungskonstante ?
Die Größe heißt Reibungskonstante. Schreiben wir die Bewegungsgleichung in der Form (3.32)
auf, so ergibt sich
Aufgabe 3.12 Man zeige, dass die Bahn (3.42) für das Intervall
nur eine endliche
Länge hat, der Körper also so stark abgebremst wird, dass er insgesamt nur eine endliche Strecke
zurücklegt.
(3.37)
und zeige, dass sich in diesem Fall eine
Aufgabe 3.13 Man bilde in (3.42) den Grenzwert
geradlinige und gleichförmige Bewegung mit der Geschwindigkeit ergibt.
Die zweite Gleichung besagt, dass die Funktion
proportional zu ihrer eigenen Ableitung ist.
Das ist die typische Eigenschaft der Exponentialfunktion. Wir machen daher den Ansatz
Aufgabe 3.14 Um beim schrägen Wurf in Abbildung 3.3(b) die Luftreibung zu berücksichtigen,
machen wir für die Kraft den Ansatz
, wobei die Gravitationskraft durch (3.29),
die Reibungskraft durch (3.36) gegeben ist. Man schreibe die Bewegungsgleichung zuerst in der
Form (3.30) auf und bringe sie anschließend auf die Form (3.32). Man finde diejenige L ösung
der Bewegungsgleichung, die zu den Anfangsbedingungen aus Aufgabe 3.8 geh ört. Man zeige,
dass die Wurfweite stets kleiner ist als die entsprechende Wurfweite ohne Reibung bei gleichen
Anfangsbedingungen.
(3.38)
und
Konstanten sind. Diese müssen wir so wählen, dass die Bewegungsgleiwobei
chungen und die Anfangsbedingungen für den Impuls erfüllt sind. Die Anfangsbedingung wählen
wir so allgemein wir möglich,
(3.39)
41
so wird Impuls von jedem Teilchen auf jedes andere übertragen, aber die Gesamtmenge an Impuls
bleibt erhalten. Also ist der Gesamtimpuls eines -Teilchen-Systems eine Erhaltungsgröße. Der
Gesamtimpuls ist einfach die Summe aller Impulse der Teilchen,
Impuls und Schwerpunkt
Die Bewegungsgleichungen für ein mechanisches System sind in der Regel gekoppelte Differenzialgleichungen. Um ein gekoppeltes System von Differenzialgleichungen zu lösen, ist es immer
eine gute Strategie, zunächst zu versuchen, das Gleichungssystem zu entkoppeln. Das gelingt
natürlich nicht immer so einfach wie in dem gerade vorgeführten Beispiel. Es gibt aber ein paar
nützliche und sehr allgemeine Eigenschaften von mechanischen Systemen, die wir dazu benutzen
können, die Bewegungsgleichungen in einer ganz ähnlichen Art und Weise zu entkoppeln und
anschließend schrittweise zu lösen.
Die wichtigste solche Eigenschaft ist die Existenz von Erhaltungsgr ößen. Eine Erhaltungsgröße ist eine Funktion auf dem Zustandsraum eines dynamischen Systems, die zeitlich konstant
ist. Wenn sich das System zu irgendeiner Zeit in einem Zustand befindet, für den die Erhaltungsgröße einen bestimmten Wert annimmt, so nimmt diese Größe zu jeder anderen Zeit denselben
Wert an. Wir wissen also, ohne die Bewegungsgleichung gelöst zu haben, dass sich das dynamische System nur innerhalb einer durch die Erhaltungsgröße bestimmten Teilmenge des Zustandsraum bewegen kann.
Je mehr Erhaltungsgrößen wir finden, umso stärker können wir die Bewegungen des Systems
einschränken, und umso einfacher werden die verbleibenden Bewegungsgleichungen, die wir explizit lösen müssen. Bevor wir beginnen, explizit nach Lösungen der Bewegungsgleichung für
ein dynamisches System zu suchen, sollten wir daher versuchen, so viele Erhaltungsgrößen wie
möglich zu finden. Später werden wir sehen, dass es dafür eine spezielle Strategie gibt. Aber
zunächst wollen wir das Konzept einer Erhaltungsgröße an einem einfachen Beispiel erklären.
, Ortsvektoren und Impulsen
Wir betrachten ein System aus Punktteilchen mit Massen
. Die Teilchen sollen untereinander wechselwirken, aber es sollen keine äußeren Kräfte auf sie
einwirken. Es gelten dann die Bewegungsgleichungen (3.34) erster Ordnung in der Form
(3.44)
Gesamtimpuls
Im allgemeinen ist dieser Vektor eine Funktion der Zeit. Gilt aber eine Bewegungsgleichung der
Form (3.43) und das dritte Newtonsche Gesetz, so ist
(3.45)
Die Summe läuft über alle Paare
mit
. Zu jedem Term
gibt es folglich einen
Term
, der entgegensetzt gleich ist. Also ist die rechte Seite der Gleichung gleich Null,
konst
(3.46)
Das gilt für jedes abgeschlossene mechanische System, für das das dritte Newtonsche Gesetz gilt.
In jedem abgeschlossenen mechanischen System ist der Gesamtimpuls eine Erhaltungsgröße.
Darüber hinaus können wir auch noch eine Aussage über die Orte der Teilchen machen. Wir definieren den Schwerpunkt eines -Teilchen-Systems wie folgt. Es ist der Punkt mit dem Ortsvektor
mit
(3.47)
(3.43)
Wir mitteln über alle Ortsvektoren, wobei wir die Beiträge der einzelnen Teilchen jeweils mit
ihren Massen gewichten.
Die Zeitabhängigkeit schreiben wir ab jetzt nicht mehr explizit aus, wenn klar ist, welche Größen
von der Zeit abhängen. Hier sind dies natürlich die Orte und Impulse der Teilchen. Es ist an dieser
Stelle auch unerheblich, wovon die Wechselwirkungskräfte
abhängen. Wir verwenden nur
das dritte Newtonsche Gesetz, wonach
ist.
Daraus können wir folgenden Schluss ziehen. Die Kraft bestimmt die Änderung des Impulses
eine Impulsänderung des Teilchens , und
pro Zeit. Das Teilchen bewirkt durch die Kraft
umgekehrt bewirkt das Teilchen durch die Gegenkraft
eine gleich große, aber entgegengesetzte Impulsänderung des Teilchen . Wir können auch sagen, dass bei einer Wechselwirkung
von zwei Teilchen Impuls von einem Teilchen auf das andere übertragen wird.
Das hat zur Folge, dass sich die Impulse der beiden wechselwirkenden Teilchen ändern, die
Summe von beiden Impulse aber gleich bleibt. Das eine Teilchen “verliert” genau so viel Impuls,
wie das andere “gewinnt”. Wechselwirken alle Teilchen eines -Teilchen-Systems miteinander,
Aufgabe 3.15 Man zeige, dass durch den Ortsvektor unabhängig von der Wahl des Koordinatensystems ein Punkt im Raum definiert wird. Mit anderen Worten, wenn wir den Ursprung des
Koordinatensystems verschieben, so ändern sich zwar die Ortsvektoren der Teilchen und auch der
Vektor , aber nicht der Punkt, zu dem er zeigt.
Leiten wir die Gleichung (3.47) nach der Zeit ab, so ergibt sich
(3.48)
Zusammen mit (3.46) ergibt sich
42
(3.49)
(d)
kg
kg
(b)
(a)
Abbildung 3.4: Bei einem Stoßprozess wird Impuls von einem Teilchen auf ein anderes übertragen (a). Unabhängig von der Art der Wechselwirkung ist die Summe der Impulse vor und nach
eines Körpers zu messen, lässt man ihn unelastisch, also
dem Stoß dieselbe. Um die Masse
so, dass die Körper nach dem Stoß zusammenkleben, mit einem Körper bekannter Masse zusammenstoßen (b). Aus dem Verhältnis der Geschwindigkeiten und lässt sich die Masse
bestimmen.
Abbildung 3.5: Eine Rakete mit Rückstoßantrieb kann als System von vielen Teilchen beschrieben werden. Es besteht aus dem Raketenkörper und einer großen Zahl von Treibstoffteilchen. In
regelmäßigen Zeitabständen wird ein Treibstoffteilchen nach hinten ausgestoßen. Aus der Impulserhaltung ergibt sich die Bewegungsgleichung für die Rakete.
eines Körpers
Aufgabe 3.17 In Abbildung 3.4(b) ist ein Messgerät zur Bestimmung der Masse
dargestellt. Wie funktioniert es?
Das sind die Bewegungsgleichungen für ein einzelnes freies Teilchen mit Masse , Ortsvektor
und Impuls . Der Schwerpunkt eines abgeschlossenen -Teilchen-Systems verhält sich wie
ein freies Teilchen, auf das keine Kraft wirkt. Wir können die Lösung der Bewegungsgleichungen
und bewegt
(3.49) unmittelbar angeben. Befindet sich der Schwerpunkt zur Zeit an einem Ort
sich dieser mit einer Geschwindigkeit , so gilt
(3.50)
Aufgabe 3.18 In Abbildung 3.5 ist die Funktionsweise eines Rückstoßtriebwerks dargestellt. Eine
mit der Geschwindigkeit
Rakete stößt in regelmäßigen Zeitabständen eine Treibstoffmenge
nach hinten aus. Wenn man die pro Zeit ausgestoßene Treibstoffmenge
festh ält, den
Grenzwert
und
bildet, und außerdem beachtet, dass die Gesamtmasse der Rakete
durch den Treibstoffausstoß abnimmt, so ergibt sich aus der Impulserhaltung f ür abgeschlossene
mechanische System die Bewegungsgleichung für die Rakete.
Die Rakete befindet sich zunächst in Ruhe und soll auf die Geschwindigkeit beschleunigt werden. Der Raketenkörper zusammen mit der Nutzlast hat die Masse
. Gesucht ist die erforder. Man zeige, dass diese durch die Formel
liche Treibstoffmenge
Der Schwerpunkt eines abgeschlossenen mechanischen Systems aus beliebig vielen Punktteilchen bewegt sich stets geradlinig und gleichförmig.
Dadurch reduziert sich die Anzahl der zu lösenden Differenzialgleichungen. Zerlegen wir die
Orts- und Impulsvektoren aller Teilchen in ihre Komponenten, so bilden die ursprünglichen
Bewegungsgleichungen ein System von insgesamt
Differenzialgleichungen erster Ordnung
für
reelle Funktionen. Für sechs spezielle Kombinationen dieser Funktion kennen wir aber
bereits die Lösung, nämlich für die jeweils drei Komponenten des Gesamtimpulses und des
Ortsvektors des Schwerpunktes. Wir müssen also nur noch
unabhängige Differenzialgleichungen lösen.
(3.51)
gegeben ist, also exponentiell mit der angestrebten Geschwindigkeit ansteigt.
Aufgabe 3.16 Abbildung 3.4(a) zeigt einen Stoßprozess von zwei Teilchen. Die Teilchen bewegen sich zunächst aufeinander zu, wechselwirken dann kurzzeitig miteinander, und entfernen sich
schließlich wieder voneinander. Nur während eines kurzen Zeitraumes, wenn die Teilchen dicht
beieinander sind, soll eine Kraft wirken, die dem dritten Newtonschen Gesetz gen ügt. Man zeige, dass man durch Messung der Geschwindigkeiten der Teilchen vor und nach dem Stoß das
Massenverhältnis
bestimmen kann.
Das Zwei-Teilchen-System
Wir wollen am Beispiel eines Systems von zwei Teilchen zeigen, wie wir mit Hilfe der Impulserhaltung und des Schwerpunktes ein gekoppeltes System von Bewegungsgleichungen lösen
können. Der Einfachheit halber nehmen wir an, dass die Wechselwirkung der beiden Teilchen
43
(d)
nur von der relativen Position der beiden Teilchen abhängt. Die Kräfte, die die beiden Teilchen
aufeinander ausüben, sind dann durch eine Funktion
des Abstandsvektors
gegeben. Die Bewegungsgleichungen erster Ordnung lauten
(3.52)
Um dieses Gleichungssystem zu entkoppeln, führen wir als neue Variable zunächst den Ortsvektor
des Schwerpunktes und den Gesamtimpuls ein,
(3.53)
Wir wissen bereits, dass für diese Vektoren die Bewegungsgleichungen (3.49) gelten. Zusätzlich
definieren wir noch den Abstandvektor oder die relative Position der beiden Teilchen, sowie den
relativen Impuls,
(b)
(a)
Der relative Impuls hat zunächst keine besondere physikalische oder geometrische Bedeutung.
Seine Zeitableitung ist jedoch durch den folgenden Ausdruck gegeben,
Abbildung 3.6: Der Schwerpunkt (a) eines abgeschlossenen Zwei-Teilchen-Systems verhält sich
wie ein freies Teilchen mit Masse
, Ortsvektor
und Impuls . Er bewegt
sich geradlinig und gleichförmig, während die beiden Teilchen eine vom jeweiligen Kraftgesetz
abhängige Bewegung ausführen. Im speziellen Fall einer linearen, anziehenden Kraft verläuft die
Relativbewegung (b) in Form einer Ellipse mit Mittelpunkt im Ursprung. Der Drehimpuls steht
auf dieser Ebene senkrecht.
(3.54)
(3.56)
(3.55)
Außerdem finden wir für die Zeitableitung der relativen Position
Um anschließend aus den Bewegungen dieses fiktiven Teilchens wieder die Bewegungen der
zwei realen Teilchen zu rekonstruieren, müssen wir nur noch die Relationen (3.53) und (3.54)
umkehren. Man findet für die Ortsvektoren
Beides zusammen lässt sich wie folgt schreiben,
(3.58)
und für die Impulse
(3.57)
mit
(3.59)
Das sind die Bewegungsgleichungen für ein einzelnes Teilchen mit Ortsvektor und Impuls ,
bewegt. Die Masse dieses “fiktiven” Teilchens wird reduzierte
das sich in einem Kraftfeld
Masse genannt.
Um die Bewegungen von zwei wechselwirkenden Teilchen zu beschreiben, können wir diese offenbar in eine Schwerpunktbewegung und eine Relativbewegung zerlegen. Der Schwerpunkt
bewegt sich geradlinig und gleichförmig. Die Relativbewegung entspricht formal der Bewegung
eines einzelnen Teilchens in einem Kraftfeld. Statt der gekoppelten Bewegungsgleichungen für
ein Zwei-Teilchen-System müssen wir also nur noch die Bewegungsgleichungen für ein einzelnes Teilchen lösen, das zwar keine physikalische Existenz hat, das wir uns aber als ein fiktives
Teilchen in einem Kraftfeld vorstellen können.
Aus den ersten beiden Gleichungen ergibt sich unter anderem, dass der Schwerpunkt eines ZweiTeilchen-Systems immer auf der Verbindungslinie der beiden Teilchen liegt. Die typische Situation ist in Abbildung 3.6(a) dargestellt. Während sich der Schwerpunkt wie ein Teilchen der Masse
mit Ortsvektor und Impuls geradlinig und gleichförmig bewegt, führen die beiden Teilchen eine vom jeweiligen Kraftgesetz abhängige Relativbewegung aus. Im dort dargestellten Fall
umkreisen sie einander.
Aufgabe 3.19 Man zeige, dass eine Aufspaltung der Bewegungen eines Zwei-Teilchen-Systems in
Schwerpunkt- und Relativbewegung auch dann möglich ist, wenn die Wechselwirkung nicht nur
44
der beiden Teilchen
Wenn wir einmal von den Konstanten und absehen, und von der Tatsache, dass die gesuchten Funktionen und keine Skalare sondern Vektoren sind, so handelt es sich um ein
Gleichungssystem, das fast so aussieht wie das Gleichungsystem (2.70) oder (2.71), das wir zur
Definition der Winkelfunktionen benutzt haben. Es liegt daher nahe, für die gesuchten Funktionen
und
einen Ansatz zu machen, der die Winkelfunktionen
und
enthält.
Da wir noch nichts über die Anfangsbedingungen gesagt haben, machen wir einen möglichst
als auch
als Linearkombination einer Sinusallgemeinen Ansatz, bei dem wir sowohl
und einer Kosinus-Funktion darstellen. Außerdem müssen wir beachten, dass das Argument der
Funktionen
und
ein Winkel, also eine dimensionslose Größe ist. Die Zeit ist aber eine
dimensionsbehaftete Größe. Wir müssen sie also zunächst mit eine Größe multiplizieren, die
die Dimension einer inversen Zeit hat,
s. Wo wir eine solche Größe her bekommen,
werden wir gleich sehen.
Versuchen wir also, die Bewegungsgleichungen (3.62) mit dem folgenden Ansatz zu lösen,
vom Abstandsvektor, sondern auch von der relativen Geschwindigkeit
abhängt.
Aufgabe 3.20 Eine Aufspaltung in Schwerpunkt- und Relativbewegung ist im Prinzip auch dann
möglich, wenn die Wechselwirkung der beiden Teilchen nicht nur von ihrer relativen Position, sondern explizit von beiden Orten abhängt. Das ist mit dem dritten Newtonschen Gesetz verträglich,
so dass auch dann der Schwerpunkt eine geradlinige und gleichf örmige Bewegung ausführt. In
welcher Art von Kraftfeld bewegt sich in diesem Fall das fiktive Teilchen, das die Relativbewegung
beschreibt? Wie würde man zur Lösung der Bewegungsgleichungen am besten vorgehen?
Ein lineares Kraftgesetz
(3.63)
Für die Zeitableitungen dieser Funktionen finden wir
Um das ganze an einem expliziten Beispiel etwas deutlicher zu machen, betrachten wir ein lineares Kraftgesetz. Die beiden Teilchen sollen sich gegenseitig anziehen, wobei der Betrag der
Anziehungskraft proportional zu ihrem Abstand ist. Wir können uns dazu vorstellen, dass die
beiden Teilchen durch Gummiband miteinander verbunden sind, dessen Zugkraft proportional zu
seiner Länge ist.
Die Kraft, die das Teilchen auf das Teilchen ausübt, ist dann proportional zum Abstandsund zeigt in Richtung des Teilchens . Für die Kraft, die das Teilchen auf das
vektor
Teilchen ausübt, gilt dasselbe mit umgekehrtem Vorzeichen. Es ist also
(3.64)
Jetzt müssen wir das nur noch in (3.62) einsetzen und jeweils die linken und rechten Seiten der
Gleichungen miteinander vergleichen. Tatsächlich finden wir, dass es sich um eine Lösung der
Bewegungsgleichungen handelt, falls die folgenden Bedingungen erfüllt sind,
(3.60)
mit
Die Konstante ist eine Eigenschaft das Gummibandes, das die Teilchen miteinander verbindet.
Sie wird Federkonstante genannt und hat die Dimension Kraft geteilt durch Länge, also
N m
kg s
Schreiben wir die Bewegungsgleichungen des Zwei-Teilchen-Systems noch einmal in der Form
(3.52) auf, so lauten sie
(3.65)
Durch Kombination jeweils zwei dieser Gleichungen ergibt sich
(3.66)
(3.61)
Nun wissen wir bereits, wie wir sie am besten lösen können. Wir betrachten zunächst das fiktive
Ein-Teilchen-System, das durch die Bewegungsgleichungen (3.57) beschrieben wird, also
Die Lösung mit dem anderen Vorzeichen können wir ausschließen, da wir ohne Beschränkung
der Allgemeinheit
annehmen können. Sonst drehen wir in (3.63) einfach das Vorzeichen
von und um. Wie man leicht sieht, ist tatsächlich eine Größe der Dimension inverse Zeit,
denn hat die Dimension Masse geteilt durch Zeit zum Quadrat und ist eine Masse.
Die Vektoren , , und lassen sich nun leicht aus den Anfangsbedingungen bestimmen.
am Ort mit einem Impuls , so ergibt sich aus (3.63)
Befindet sich das Teilchen zur Zeit
für
, und anschließend aus (3.65)
Eine spezielle Eigenschaft dieses Systems ist, dass die Bewegungsgleichungen in den gesuchten Funktionen und linear sind. In Kapitel 6 werden wir uns sehr ausführlich mit solchen
Systemen beschäftigen und dort auch zeigen, mit welcher speziellen Technik man solche Differenzialgleichungen ganz allgemein lösen kann. Hier wollen wir uns mit einem gut motivierten
Ansatz begnügen und zeigen, dass dieser die gewünschte Lösung liefert.
(3.62)
mit
45
(3.67)
Folglich ergibt sich die Bahn des Teilchens zu
gleichförmig durch den Raum bewegt. Das ist bereits der erste Schritt zur Beschreibung eines
zusammengesetzten Körpers, der aus mehreren Teilchen besteht und eine räumliche Ausdehnung
besitzt.
(3.68)
, wobei die Periode
Das Teilchen führt eine periodische Bewegung aus. Es gilt
durch
Aufgabe 3.21 Zur Lösung der Bewegungsgleichungen (3.62) haben wir den Ansatz (3.63) gemacht und gesehen, dass dieser tatsächlich die Differenzialgleichungen erfüllt, wenn die Parameter die Bedingungen (3.65) erfüllen. Warum können wir sicher sein, damit die allgemeinste
Lösung der Bewegungsgleichungen gefunden zu haben?
(3.69)
Aufgabe 3.22 Eine Ellipse mit Mittelpunkt im Ursprung wird normalerweise durch ihre beiden
zueinander senkrecht stehenden Halbachsen beschrieben. Es seien und zwei zueinander senkrecht stehende Vektoren. Dann beschreibt die Kurve
gegeben ist. Wie in Abbildung 3.6(b) gezeigt wird, bewegt sich das Teilchen mit der Masse
in einer durch die Vektoren und aufgespannten Ebene und beschreibt dort eine Ellipse, die
periodisch durchlaufen wird.
Jetzt müssen wir nur noch mit Hilfe der Formeln (3.58) die Bewegung des fiktiven Teilchens
zurück in die Bewegungen der beiden realen Teilchen übersetzen. Dazu benötigen wir noch die
Anfangsbedingungen für die Schwerpunktbewegung. Es ist etwas einfacher, statt der Impulse die
und (3.68) wie folgt schreiben,
Geschwindigkeiten anzugeben. Dann können wir (3.50) mit
(3.73)
eine Ellipse in der durch und aufgespannten Ebene, mit Halbachsen und . Die Vektoren
und bestimmen also sowohl die Halbachsen als auch die Lage der Ellipse im Raum. Die
Darstellung (3.68) ist nicht von dieser Form, da und beliebig sind und daher im allgemeinen
nicht zueinander senkrecht stehen. Man zeige jedoch, dass die Bahn trotzdem eine Ellipse ist und
bestimme die beiden Halbachsen als Funktion von und .
(3.70)
Zentralkraft und Drehimpuls
Aus (3.58) ergibt sich schließlich
Bei der gerade berechneten Relativbewegung von zwei wechselwirkenden Teilchen haben wir
festgestellt, dass diese in einer Ebene stattfindet. Wir wollen zeigen, dass dies kein Zufall ist,
sondern dass es sich um eine allgemeine Eigenschaft einer bestimmten Klasse von Wechselwirkungen handelt.
Statt eines Zwei-Teilchen-Systems betrachten wir zunächst ein einzelnes Teilchen mit Masse
, Ortsvektor und Impuls in einem Kraftfeld
. Das Kraftfeld soll die Eigenschaft haben,
dass die Kraft stets zu einem bestimmten Punkt im Raum hin oder von diesem weg gerichtet ist.
Mit anderen Worten, das Teilchen wird von einem festen Punkt im Raum, dem Kraftzentrum,
angezogen oder abgestoßen. Der Betrag und das Vorzeichen der Kraft können jedoch beliebig
vom Ort des Teilchens abhängen.
Natürlich passen wir unser Koordinatensystem dem Kraftfeld an und wählen es so, dass das
ist dann proportional zum Ortsvektor ,
Kraftzentrum im Ursprung liegt. Die Kraft
(3.71)
Um das ursprünglich gestellte Problem zu lösen, nämlich die Bewegung der beiden Teilchen bei
vorgegebenen Anfangsbedingungen zu beschreiben, müssen wir jetzt nur noch die Anfangsbedingungen für Relativ- und Schwerpunktbewegung, also die Größen , ,
und , durch die
und die
entsprechenden Anfangsbedingungen für die beiden Teilchen, also die Anfangsorte
Anfangsgeschwindigkeiten
ausdrücken. Das ist nicht sehr schwierig. Wir müssen dazu nur
auswerten. Dann finden wir
(3.71) und die Ableitung davon bei
(3.74)
An die skalare Funktion
, die das Vorzeichen und den Betrag der Kraft bestimmt, stellen wir
keine weiteren Forderungen. Eine Kraft dieser Art heißt Zentralkraft.
Wir wollen zeigen, dass in einem Zentralkraftfeld eine Erhaltungsgröße existiert. Wir definieren dazu den Drehimpuls des Teilchens als das Kreuzprodukt des Ortsvektors mit dem Impuls,
(3.72)
Wir können jetzt zu beliebigen Anfangsbedingungen die eindeutige Lösung der Bewegungsgleichung des Zwei-Teilchen-Systems angeben. Die Bewegung verläuft stets so, dass die beiden Teilchen einander mit der Periode umlaufen, während sich das System als ganzes geradlinig und
46
Drehimpuls
(3.75)
Drehsinn der Ebene fest, in der es sich bewegt.
Wie man sich leicht mit Hilfe der Rechten-Hand-Regel überzeugen kann, stimmt diese Orifestgelegt wird, also
entierung mit derjenigen überein, die durch den Normalenvektor
durch die Richtung des Drehimpulses. Zeigt der Daumen der rechten Hand in Richtung des Drehimpulsvektors, so zeigen die zur Faust zusammengerollten Finger die Umlaufrichtung des Teilchens um den Ursprung an. In diesem Sinne beschreibt der Drehimpuls eine Rotationsbewegung.
Seine Richtung definiert die momentane Drehachse, um die das Teilchen rotiert.
Auch der Betrag des Drehimpulses hat eine geometrische Bedeutung. Wir betrachten dazu die
in Abbildung 3.7(a) dargestellte Fläche
, die der Ortsvektor in dem Zeitintervall von bis
überstreicht. Für sehr kleine Zeiten
ist die Fläche
die eines sehr lang gezogenen
Dreiecks, welches durch die Vektoren
und
aufgespannt wird. Da die Dreiecksfläche
die Hälfte der Fläche eines Parallelogramms ist, gilt näherungsweise
(b)
Abbildung 3.7: Der Drehimpulsvektor definiert die momentane Drehachse eines Teilchens,
wenn wir seine Bewegung als Umlaufbewegung um den Koordinatenursprung auffassen. Sein
der Ortsvektor des Teilchens innerhalb eines Zeitintervalls
Betrag gibt an, welche Fläche
überstreicht. Da sowohl die Drehachse als auch die überstrichene Fläche von der Wahl des
Ursprungs abhängen, ist auch der Drehimpulsvektor von der Wahl des Ursprungs abhängig.
(a)
(3.76)
, so ergibt
und bilden anschließend den Grenzwert
Teilen wir diese Gleichung durch
sich
(3.77)
Sehen wir von dem Faktor
einmal ab, so gibt der Betrag des Drehimpulses an, welche Fläche
der Ortsvektor des Teilchens pro Zeit überstreicht.
Das alles gilt natürlich immer nur für einen kurzen Moment der Bewegung. Im allgemeinen
ändert sich sowohl der Betrag als auch die Richtung des Drehimpulses mit der Zeit. Die spezielle Eigenschaft einer Zentralkraft ist jedoch, dass der Drehimpuls unter ihrem Einfluss zeitlich
konstant ist. Berechnen wir nämlich die Zeitableitung des Drehimpulses, so ergibt sich
Der Drehimpuls hat die Dimension Länge mal Impuls, also Masse mal Länge zum Quadrat geteilt
kg m s.
durch Zeit,
Um die Bezeichnung “Drehimpuls” zu verstehen, überlegen wir uns kurz, welche geometrisch
eines Teilchens
anschauliche Bedeutung dieser Vektor hat. In Abbildung 3.7(a) ist die Bahn
im Raum dargestellt. Wir betrachten ein kurzes Stück dieser Bahn, zwischen und
. Für
kleine Zeiten
können wir dieses Stück der Bahn näherungsweise durch eine gerade Strecke
beschreiben, also annehmen, dass die Geschwindigkeit und damit auch der Impuls des Teilchens
annähernd konstant ist.
Das Teilchen bewegt sich dann in einer Ebene, die durch den Ursprung verläuft und die von
den Vektoren und aufgespannt wird. Der Drehimpuls steht auf beiden senkrecht, definiert
also den Normalenvektor
dieser Ebene. Etwas vereinfacht können wir sagen, dass der
Drehimpulsvektor durch seine Richtung diejenige Ebene durch den Ursprung festlegt, auf der
sich das Teilchen zum Zeitpunkt gerade bewegt. Das Teilchen befindet sich in dieser Ebene, und
seine Geschwindigkeit, also der Tangentenvektor der Bahn, liegt ebenfalls in dieser Ebene.
Wir können auch die Orientierung dieser Ebene durch die Bewegung des Teilchens festlegen.
Blicken wir vom Ursprung aus auf das Teilchen, so bewegt es sich in eine von zwei möglichen
Richtungen, so als würde es um den Ursprung kreisen. Tatsächlich können wir das kleine Stücke
der Bahn statt durch eine gerade Strecke auch durch einen Kreisbogen approximieren, dessen
Mittelpunkt sich im Ursprung befindet. Die Bewegungsrichtung des Teilchens legt also einen
(3.78)
Hier haben wir die Bewegungsgleichungen (3.32) verwendet, und die Tatsache, dass das Kreuzprodukt eines Vektors mit sich selbst verschwindet.
Die Zeitableitung des Drehimpulses ist folglich durch die Größe
gegeben, die als Drehmoment bezeichnet wird. Für eine Zentralkraft ist das Drehmoment aber gleich Null, denn die
Kraft ist proportional zum Ortsvektor,
(3.79)
Also ist der Drehimpuls eine Erhaltungsgröße. Da der Vektor sowohl zu also auch zu
senkrecht steht, folgt daraus unmittelbar, dass die gesamte Bewegung des Teilchens in einer Ebene
stattfindet, und zwar in der zu senkrechten Ebene mit dem Normalenvektor
. Außerdem
ergibt sich, dass der Ortsvektor des Teilchens in gleichen Zeiten gleiche Flächen in dieser Ebene
überstreicht.
47
Beides sind übrigens auch Eigenschaften der Planetenbahnen im Sonnensystem, die Kepler
durch Beobachtungen derselben gefunden hatte. Wir werden darauf in Kapitel 8 noch näher eingehen, wo wir die Bahnen von Himmelskörpern unter dem Einfluss der Gravitation berechnen
werden. Auch dabei handelt es sich um Zentralkräfte. Der Drehimpuls als Erhaltungsgröße spielte
also bereits in den allerersten astronomischen Beobachtungen, die zur Bestätigung die Newtonsche Mechanik herangezogen wurden, eine entscheidende Rolle.
die Teilchen ziehen sich gegenseitig an oder stoßen sich ab. Die Kräfte sind dann proportional
zum jeweiligen Abstandsvektor,
(3.82)
, die die Vorzeichen und Beträge der Kräfte bestimmen, im einzelWovon die skalare Größen
nen abhängen, ist an dieser Stelle wieder nicht wichtig. Es soll aber das dritte Newtonsche Gesetz
gelten, also
(3.83)
Aufgabe 3.23 Man zeige, dass der Drehimpuls eines freien Teilchens genau dann gleich Null ist,
wenn das Teilchen entweder ruht, oder sich auf einer Geraden durch den Ursprung bewegt. In
allen anderen Fällen gibt es genau eine Ebene, die sowohl den Ursprung als auch die komplette
Bahn des Teilchens enthält.
Zusätzlich kann auf jedes Teilchen noch eine äußere Kraft wirken, von der wir aber ebenfalls
annehmen, dass es sich um eine Zentralkraft handelt. In diesem Fall ist das Kraftzentrum wieder
der Ursprung des Koordinatensystems,
Aufgabe 3.24 Von einem freien Teilchen sind der Impuls und der Drehimpuls bekannt. Lässt
des Teilchens bestimmen? Wenn ja, wie? Wenn nicht, wie sehen alle
sich daraus die Bahn
möglichen Bahnen aus, die zu den gegebenen Daten passen? Es sei
(3.84)
nach der Zeit gilt dann
Für die Ableitung des Drehimpulses des Teilchens
(3.80)
zwei Konstanten der Dimension Impuls bzw. Drehimpuls sind. Man bestimme eine
für ein freies Teilchen mit diesen Daten.
wobei
Bahn
Aufgabe 3.25 Ein Teilchen bewegt sich in einem Zentralkraftfeld. Es bewegt sich auf das Kraftzentrum zu, erreicht zu einem Zeitpunkt
einen minimalen Abstand, und entfernt sich wieder.
Sonst ist über die Bewegung nichts bekannt. Der minimale Abstand, den das Teilchen erreicht, sei
, und der Betrag des Impulses zu diesem Zeitpunkt sei
. Man zeige, dass der
Betrag des Drehimpulses, der in diesem Fall eine Erhaltungsgröße ist, durch
gegeben
ist.
(3.85)
Der erste Ausdruck in der zweiten Zeile ist Null, da eine äußere Zentralkraft auf ein einzelnes
Teilchen kein Drehmoment ausübt. Es bleibt aber ein nicht verschwindender Term stehen, der
von den Wechselwirkungen der Teilchen herrührt. Die einzelnen Drehimpulse der Teilchen sind
keine Erhaltungsgrößen.
Summieren wir jedoch über alle Teilchen und bilden den Gesamtdrehimpuls
Gesamt-, Schwerpunkt- und innerer Drehimpuls
(3.86)
Gesamtdrehimpuls
Es war also kein Zufall, dass die Relativbewegung der beiden Teilchen in dem zuletzt diskutierten
, von dem wir dort ausgegangen
Beispiel in einer Ebene stattfand. Das Kraftgesetz
sind, war nämlich eine Zentralkraft (3.74), mit
. Allerdings hatten wir dort ursprünglich ein Zwei-Teilchen-System betrachtet, das sich formal auf ein fiktives Ein-Teilchen-System
reduzieren ließt, während wir hier von Anfang an nur ein einzelnes Teilchen in einem äußeren
Kraftfeld untersucht haben.
Wir wollen daher die Definition des Drehimpulses auf ein -Teilchen-System erweitern.
Natürlich können wir für jedes einzelne Teilchen mit Ortsvektor
und Impuls
einen Drehimpuls einführen,
(3.81)
so ist dies eine Erhaltungsgröße. Für die Zeitableitung gilt nämlich
(3.87)
Die Summe läuft wieder über alle Paare
mit
. Folglich gibt es zu jedem Paar
ein entsprechendes Gegenpaar
. Die Beiträge dieser beiden Paare haben sich auf. Es ist
nämlich wegen (3.83)
, aber
. Also haben wir gezeigt, dass der
Gesamtdrehimpuls eine Erhaltungsgröße ist,
Nun nehmen wir an, dass sämtliche Wechselwirkungen zwischen den Teilchen durch Zentralkräfte gegeben sind. Das Kraftzentrum ist jetzt natürlich das jeweils andere Teilchen, das heißt
konst
48
(3.88)
Liegt ein abgeschlossenes System von Teilchen vor, deren Wechselwirkungen durch Zentralkräfte beschrieben werden, so ist sowohl der Gesamtimpuls als auch der Gesamtdrehimpuls
bezüglich jedes beliebigen Ursprungs eine Erhaltungsgröße. Allerdings gilt auch hier, dass nicht
alle diese Größen unabhängig sind, denn sie hängen über die Beziehung (3.90) zusammen.
Schließlich können wir in diesem Fall noch eine weitere interessante Erhaltungsgröße angeben, die wir weiter oben sogar schon benutzt haben. Bilden wir nämlich aus dem Ortsvektor
des Schwerpunktes und dem Gesamtimpuls eines abgeschlossenen Systems einen Drehimpulsvektor des Schwerpunktes, den wir mit bezeichnen,
Das gilt für jedes System von Teilchen, die über Zentralkräfte miteinander wechselwirken, und
unabhängig davon, wovon die Kräfte sonst noch abhängen. Außerdem können äußere Kräfte vorliegen, solange dies auch Zentralkräfte sind und das Kraftzentrum im Koordinatenursprung liegt.
In Systemen mit Zentralkräften ist der Gesamtdrehimpuls eine Erhaltungsgröße.
Offenbar scheint hier die Wahl des Koordinatenursprung eine spezielle Rolle zu spielen, während
sie zum Beispiel beim Gesamtimpuls als Erhaltungsgröße völlig unerheblich ist. Das liegt daran,
dass der Drehimpuls eines Teilchens, genau wie sein Ortsvektor, immer nur relativ zu einem
ausgewählten Bezugspunkt definiert werden kann. Der Ortsvektor tritt in der Definition (3.75)
explizit auf, und auch aus dem Vergleich der Abbildungen 3.7(a) und (b) sollte klar werden,
dass der Drehimpuls im Gegensatz zum Impuls eines Teilchens von der Wahl des Ursprungs
abhängt.
Was passiert, wenn wir den Ursprung um einen Vektor
verschieben, und einen neuen
definieren? Wie wir aus (3.6) wissen, hängt der
Drehimpuls bezüglich des neuen Ursprungs
neue Ortsvektor und mit dem alten Ortsvektor des Teilchens über
zusammen,
. Definieren wir
während der Impuls unter einer Verschiebung des Ursprungs invariant ist,
den Drehimpuls bezüglich des neuen Ursprungs, so finden wir
(3.91)
Schwerpunktdrehimpuls
so ist zunächst auch dies eine Erhaltungsgröße. Denn der Schwerpunkt eines abgeschlossenen
Systems bewegt sich wie ein freies Teilchen, also wirkt auf ihn insbesondere kein Drehmoment.
Man könnte vermuten, dass dieser Schwerpunktdrehimpuls daselbe ist wie der Gesamtdrehimpuls . Schließlich ist der Schwerpunktimpuls ja auch gleich dem Gesamtimpuls des Systems.
Man kann sich aber leicht davon überzeugen, dass dies nicht der Fall ist. Nur für ein einzelnes
Teilchen ist
.
Für ein System aus mehreren Teilchen bezeichnet man die Differenz
(3.89)
innerer
Drehimpuls
(3.92)
Bei einer Verschiebung des Ursprungs um den Vektor transformiert sich der Drehimpuls um
einen Vektor, der durch das Kreuzprodukt der Verschiebung mit dem Impuls gegeben ist.
Daraus können wir verschiedene interessante Schlüsse ziehen. Zunächst stellen wir fest, dass
wir zwar den Drehimpuls bezüglich jedes beliebigen Punktes im Raum definieren können, indem
wir diesen Punkt als Ursprung des Koordinatensystems wählen. Aber diese Größen sind nicht
voneinander unabhängig. Wenn wir den Drehimpuls eines Teilchens bezüglich irgendeines Punktes im Raum kennen, sowie seinen Impuls, so können wir den Drehimpuls bezüglich aller anderen
Bezugspunkte ausrechnen.
Außerdem gilt folgende Aussage über Erhaltungsgrößen. Wenn sowohl der Impuls als auch der
Drehimpuls bezüglich eines bestimmten Bezugspunktes Erhaltungsgrößen sind, so gilt das auch
für den Drehimpuls bezüglich irgendeines anderen Punktes im Raum. Für ein einzelnes Teilchen
ist diese Aussage ziemlich uninteressant, da der Impuls nur dann eine Erhaltungsgröße ist, wenn
das Teilchen frei ist und sich ohnehin nur geradlinig und gleichförmig bewegt.
Aber für ein System von mehreren Teilchen ist sie interessant. Für den Gesamtdrehimpuls eines
Systems von mehreren Teilchen gilt nämlich dasselbe Transformationsverhalten bei Verschiebung
des Ursprungs.
als inneren Drehimpuls. Auch dies ist natürlich eine Erhaltungsgröße, wenn das System abgeschlossen ist und alle Kräfte Zentralkräfte sind. Diese Größe ist deshalb interessant, weil sie nicht
von der Wahl des Ursprungs abhängt.
Aufgabe 3.27 Man beweise, dass bei einer Verschiebung des Ursprungs
Schwerpunktdrehimpuls das Transformationsgesetz (3.90) gilt,
auch für den
(3.93)
gilt.
und dass folglich für den inneren Drehimpuls
Für ein Zwei-Teilchen-Systems ist der innere Drehimpuls nichts anderes als der Drehimpuls der
Relativbewegung. Wie wir im letzten Abschnitt gezeigt haben, lässt sich ein abgeschlossenes
Zwei-Teilchen-System in eine Schwerpunkt- und eine Relativbewegung zerlegen, wobei die Relativbewegung formal als die Bewegung eines fiktiven, einzelnen Teilchens beschrieben werden
kann.
Ortsvektor und Impuls dieses Teilchens waren durch (3.54) gegeben. Bilden wir daraus den
Drehimpulsvektor der Relativbewegung, der in Abbildung 3.6(b) dargestellt ist, so ergibt sich
Aufgabe 3.26 Es sei der Gesamtdrehimpuls eines -Teilchen-Systems bezüglich des Ursprungs
, und
der entsprechende Gesamtdrehimpuls bezüglich eines anderen Ursprungs , mit
. Man zeige, dass dann
(3.90)
der Gesamtimpuls des Systems ist.
gilt, wobei
49
(3.94)
Für den Schwerpunktdrehimpuls gilt anderseits
Aufgabe 3.30 Man löse die Bewegungsgleichungen für ein Zwei-Teilchen-System, wobei auf beide Teilchen die Gravitationskraft (3.29) wirkt, sowie eine lineare Wechselwirkung der Form (3.60)
in
vorliegt. Als Anfangsbedingung sei vorgegeben, dass sich das Teilchen zum Zeitpunkt
einer Höhe senkrecht über dem Teilchen befindet und dort ruht, während sich das Teilchen
mit der Geschwindigkeit in horizontale Richtung bewegt. Bei einer geeigneten Wahl des Koordinatensystems gilt dann
(3.95)
(3.97)
Addieren wir die beiden Gleichungen, so bekommen wir
Man berechne die Zeit , die es dauert, bis beide Teilchen zum ersten Mal auf gleicher H öhe sind,
also die gleiche -Koordinaten haben, und bestimme diese H öhe.
(3.96)
also den Gesamtdrehimpuls. Aus der Definition
folgt also
. Der innere Drehimpuls eines Zwei-Teilchen-Systems ist der Drehimpuls des fiktiven Teilchens, welches die Relativbewegung der beiden realen Teilchen beschreibt.
In diesem Fall besteht übrigens kein Zweifel über den zu wählenden Bezugspunkt. Der Raum,
in dem die Relativbewegung zweier Teilchen stattfindet, ist kein affiner Raum sondern ein Vektorraum. Es gibt einen ausgezeichnet Nullpunkt in diesem Raum. Das fiktive Teilchen befindet
sich genau dann an diesem Nullpunkt, wenn sich die beiden realen Teilchen im physikalischen
Raum an demselben Ort befinden.
Das erklärt auch, warum der innere Drehimpuls eines -Teilchen-Systems unabhängig von
irgendeinem Bezugspunkt definiert ist. Hier dient gewissermaßen der Schwerpunkt des Systems
als “dynamischer” Bezugspunkt. Der innere Drehimpuls eines Systems aus vielen Teilchen ist der
Gesamtdrehimpuls bezüglich des Schwerpunktes.
Zusammenfassend können wir festhalten, dass in einem abgeschlossenen System mit Zentralkräften zunächst der Gesamtimpuls eine Erhaltungsgröße ist, und daher der Schwerpunkt
eine geradlinige und gleichförmige Bewegung ausführt. Diese Schwerpunktbewegung kann von
den Relativbewegungen der Teilchen entkoppelt werden. Zusätzlich existiert dann noch der innere Drehimpuls als Erhaltungsgröße, die verwendet werden kann, um die Bewegungsgleichungen für die Relativbewegung zu vereinfachen. Für ein Zwei-Teilchen-System entspricht die
Relativbewegung der Bewegung eines fiktiven Teilchens in einem Zentralkraftfeld, und der innere
Drehimpuls ist der gewöhnliche Drehimpuls dieses fiktiven Teilchens.
4 Die Gravitationskraft
Wir haben bereits den freien Fall eines Teilchens im Schwerefeld der Erde in der Nähe ihrer
Oberfläche berechnet. Dort konnten wir annehmen, dass die Erde eine konstante Anziehungskraft
auf das Teilchen ausübt, die unabhängig von Ort und Zeit ist. Das gilt natürlich nicht mehr, wenn
wir uns weiter von der Erdoberfläche entfernen, und wenn die beteiligten Körper selbst größere
Himmelskörper sind.
Um die Bewegungen vom Himmelskörpern zu beschreiben, die durch Gravitationskräfte miteinander wechselwirken, müssen wir dafür ein allgemeineres Kraftgesetz formulieren. Auch dieses Kraftgesetz geht auf Newton zurück, der als erster erkannte, dass die Wechselwirkungen zwischen Himmelskörpern letztlich die gleiche Ursache haben wie der freie Fall in der Nähe der
Erdoberfläche. Auf dieser Erkenntnis, gestützt durch die Beobachtungen von Galilei und Kepler,
beruhte der große Erfolg der klassischen Mechanik. Es war die erste physikalische Theorie, die
in einheitlicher Weise sowohl irdische als auch kosmische Vorgänge beschreiben konnte.
Das Newtonsche Gravitationsgesetz besagt, dass ein als punktförmig angenommener Körper
am Ort
auf einen ebenfalls punktförmigen Körper der Masse
am Ort
der Masse
eine anziehende Kraft ausübt, deren Betrag proportional zu den beiden Massen und umgekehrt
proportional zum Quadrat des Abstands der beiden Körper ist. In Formeln ausgedrückt, und mit
der im letzten Kapitel eingeführten Notation gilt
Aufgabe 3.28 Man berechne für die explizit durch (3.71) gegebenen Bahnen von zwei Teilchen
die Drehimpulse
,
, den Gesamtdrehimpuls , den Schwerpunktdrehimpuls , und den
inneren Drehimpuls .
(4.1)
Gravitationskraft
Es handelt sich um eine Zentralkraft der Form (3.82), deren Betrag nur vom Abstand der beiden
Teilchen abhängt. Das negative Vorzeichen besagt, dass die Kraft stets anziehend ist. Die universelle Konstante , die in diesem Kraftgesetz auftritt, heißt Gravitationskonstante. Sie hat den
Wert
Nm
m
(4.2)
kg
kg s
Aufgabe 3.29 Wir betrachten ein System von Teilchen, die über Zentralkräfte miteinander
wechselwirken. Zusätzlich wirkt auf alle Teilchen dieselbe konstante äußere Kraft, zum Beispiel
die Gravitationskraft (3.29). Da es sich weder um ein abgeschlossenes System handelt, noch alle Kräfte Zentralkräfte sind, ist weder der Gesamtimpuls , noch der Gesamtdrehimpuls eine
Erhaltungsgröße. Man zeige jedoch, dass der innere Drehimpuls eine Erhaltungsgröße ist.
50
replacements
der anderen beteiligten Körper spürt, umgekehrt aber die Anziehungskraft, die es auf die anderen
Körper ausübt, vernachlässigt werden kann. Ein typisches Beispiel wäre ein kleines Raumfahrzeug, das sich im Sonnensystem allein unter dem Einfluss der Gravitationskräfte der Sonne und
der Planeten bewegt.
die MasFür dieses Raumfahrzeug gilt eine Bewegungsgleichung der Form (4.3), wobei
se des Raumfahrzeugs ist. Für die Planeten und die Sonne gilt eine entsprechende Bewegungsgleichung. Jedoch können wir dort den Beitrag des Raumfahrzeugs vernachlässigen, denn die
Anziehungskraft des Raumfahrzeugs auf die Planeten und die Sonne ist sehr viel kleiner als die
gegenseitigen Anziehungskräfte dieser Körper. Das Raumfahrzeug als Testteilchen beeinflusst die
Bewegungen der Planeten nicht.
Letztlich folgt aus dieser Überlegung, dass die Masse
des Raumfahrzeugs in gar keiner
Bewegungsgleichung mehr auftritt. Aus der für das Raumfahrzeug kürzt sie sich heraus, und in
den Bewegungsgleichungen für die Sonne und die Planeten ist sie vernachlässigbar klein. Somit
, die das Raumfahrzeug beschreibt, nur von den Anfangsbedingungen
hängt die Bahn
und
für das Raumfahrzeug und von den Bahnen
von der Sonne und den Planeten ab.
Sie hängt aber nicht von der Masse oder irgendeiner anderen Eigenschaft des Raumfahrzeugs ab.
Einen Körper, auf den nur Gravitationskräfte wirken, bezeichnet man als frei fallenden Körper.
Die Bahn eines solchen frei fallenden Körpers hängt also, sofern seine Masse im Vergleich zu
den Massen der anderen Körper vernachlässigbar ist, nicht von irgendwelchen Eigenschaften des
Körpers ab, sondern nur von den Anfangsbedingungen. Das lässt sich auch wie folgt formulieren:
(c)
(d)
(b)
(a)
Abbildung 4.1: Die Gravitationskräfte als Wechselwirkungen zwischen Paaren von Teilchen (a).
Jedes Teilchen wird von allen anderen Teilchen angezogen, wobei der Betrag der Kraft von den
Massen der beteiligten Teilchen und von deren Abstand abhängt. Als spezielle Lösung der Bewegungsgleichungen für ein Zwei-Teilchen ergibt sich eine kreisförmige Bewegung der beiden
Teilchen um den gemeinsamen Schwerpunkt (b).
Soweit dies im Rahmen der klassischen Physik möglich ist, beschreibt das Newtonsche Gravitationsgesetz praktisch die gesamte Himmelsmechanik, insbesondere die Bewegungen der Planeten
im Sonnensystem.
Unter dem Einfluss von Gravitationskräften fallen alle Testteilchen gleich schnell.
Trägheit und Gewicht
Das ist ein sehr merkwürdiges Phänomen, das wir zwar aus dem Alltag kennen, für das es aber
im Rahmen der klassischen Mechanik keine Erklärung gibt. Es ist gewissermaßen ein “Zufall”,
dass auf beiden Seiten der Bewegungsgleichung (4.3) dieselbe Größe auftritt, nämlich die Masse
des jeweiligen Teilchens.
Wir erinnern uns, dass wir die Masse als ein Maß für die Trägheit eines Körpers eingeführt
hatten. Je größer die Masse ist, desto mehr widersetzt sich ein Körper gegen eine auf ihn einwirkende Kraft, die ihn beschleunigen will. Die Eigenschaft eines Körpers, Gravitationskräfte zu
spüren, nennt man Gewicht. Je größer das Gewicht eines Körpers ist, desto größer ist die Anziehungskraft, die er in Anwesenheit anderer Körper verspürt, und umso größer ist auch, nach dem
dritten Newtonschen Gesetz, die Anziehungskraft, die er auf andere Körper ausübt.
Auf den ersten Blick haben diese beiden Eigenschaften von Körpern oder Punktteilchen gar
nichts miteinander zu tun. Im Prinzip wäre es denkbar, dass ein Teilchen doppelt so träge ist
wie ein anderes, aber nur halb so schwer. Es würde dann unter dem Einfluss von Anziehungskräften anderer Körper nur ein Viertel der Beschleunigung des anderen Teilchens erfahren. Das
merkwürdige am Newtonsche Gravitationsgesetz ist, dass es die Existenz solcher unterschiedlich
gearteter Teilchen ausschließt. Es ist dieselbe physikalische Größe, nämlich die Masse eines Teilchens, die zwei ganz verschiedene Eigenschaften des Teilchens bestimmt, nämlich seine Tr ägheit
und sein Gewicht.
Dass die Anziehungskraft zwischen zwei Teilchen proportional zu deren Massen ist, hat eine
interessante Konsequenz. Betrachten wir nämlich die Bewegungsgleichung zweiter Ordnung für
eines der beteiligten Teilchen,
(4.3)
dieses Teilchens aus der Gleichung heraus,
so kürzt sich die Masse
(4.4)
Die Beschleunigung, die das Teilchen durch die Anziehungskräfte der anderen Teilchen erfährt,
hängt nur von deren Massen ab, sowie von den relativen Positionen der anderen Teilchen, aber
nicht von der Masse des Teilchens selbst.
Um zu verstehen, was das anschaulich bedeutet, betrachten wir ein System von mehreren Teilchen, die nur über Gravitationskräfte miteinander wechselwirken. Eines dieser Teilchen soll ein
Testteilchen sein. Ein Testteilchen hat eine so kleine Masse, dass es zwar die Anziehungskräfte
51
Abbildung 3.4(b). Man kann einen Körper auch wiegen, also sein Gewicht messen, um die Masse
zu ermitteln. Das ist natürlich auch der Grund, warum Messgeräte wie das in Abbildung 3.4(b)
nicht sehr weit verbreitet sind. Waagen, die direkt die auf einen Körper wirkende Anziehungskraft
der Erde messen, sind einfach praktischer und einfacher zu handhaben.
Natürlich ist das eine Aussage der Theorie, die experimentell überprüft werden kann. Dass verschiedene Körper im Schwerefeld der Erde gleich schnell fallen, ist eine Erkenntnis, die auf Galilei zurück geht. Es gilt zwar heute als fraglich, ob er tatsächlich die oft zitierten Fallexperimente
am schiefen Turm von Pisa ausgeführt hat. Er selbst hat nämlich nie über solche Experimente berichtet. Aber unbestritten ist, dass er durch Experimente und theoretische Überlegungen zu dem
Schluss gekommen ist, dass der Schlüsselbegriff zur Beschreibung des freien Falles die Beschleunigung ist. Er konnte damit erklären, dass alle Körper gleicher Art unabhängig von ihrer Größe
gleich schnell fallen. Eine Eisenkugel von einem Kilogramm erfährt die gleiche Beschleunigung
wie eine Eisenkugel von zehn Kilogramm.
Die Begründung ist ganz einfach. Man kann eine Eisenkugel von zwei Kilogramm in zwei
Teile zerlegen, die jeweils ein Kilogramm schwer sind. Lässt man diese nebeneinander fallen, so
kann die Fallbeschleunigung nicht davon abhängen, ob man das ganze als ein fallendes Objekt
oder als zwei fallende Objekte beschreibt. Also kann die Bahn eines fallenden Körpers nicht von
dessen Größe abhängen, solange nicht andere, von der Größe abhängigen Kräfte wie etwa die
Luftreibung auf ihn einwirken.
Was jedoch Galilei mit diesem Argument nicht erklären konnte, war die Tatsache, dass auch
Körper ganz verschiedener Art gleich schnell fallen. Es ist klar, oder zumindest verständlich,
dass zwei Eisenkugeln zusammen sowohl das doppelte Gewicht als auch die doppelte Trägheit
einer einzelnen Eisenkugel haben. Aber warum hat jeder Körper, der doppelt so träge ist wie ein
anderer, auch das doppelte Gewicht? Mit anderen Worten, warum ist das Verhältnis aus Gewicht
und Trägheit für eine Eisenkugel dasselbe wie für eine Stück Holz? Auf diese Frage gibt es, wie
gesagt, im Rahmen der klassischen Mechanik keine Antwort.
Ein geniale Erklärung dafür, warum derselbe Parameter sowohl die Trägheit als auch das Gewicht eines Körpers bestimmt, liefert erst die allgemeine Relativitätstheorie. Aus dieser Theorie
ergibt sich nämlich, dass Gewicht und Trägheit eben doch nicht zwei völlig verschiedene Eigenschaften eines Körpers sind, sondern dass sie in einem gewissen Sinne zueinander äquivalent
sind. Man findet im Rahmen dieser Theorie, dass es sogar so sein muss, dass beide durch denselben Parameter bestimmt werden. Ansonsten wäre die allgemeine Relativitätstheorie nämlich
inkonsistent.
Warum das so ist, können wir an dieser Stelle jedoch noch nicht verstehen. Es hängt mit der
Art und Weise zusammen, die in der Relativitätstheorie die Struktur von Raum und Zeit mit der
Beschreibung von Gravitationsfeldern zusammenhängt. An dieser Stelle bleibt uns daher nichts
anderes übrig als die Tatsache zu akzeptieren, dass Trägheit und Gewicht eines Körpers durch ein
und dieselbe Größe, nämlich die Masse des Körpers bestimmt werden und diese somit auf beiden
Seiten der Bewegungsgleichung (4.3) erscheint.
Aufgabe 4.1 Wie groß ist die Anziehungskraft zwischen zwei Bleikugeln von jeweils kg, wenn
der Abstand zwischen ihnen m beträgt. Obwohl die Abmessungen der Kugeln dann im Vergleich zu ihrem Abstand nicht mehr vernachlässigbar sind, betrachten wir sie hier trotzdem als
punktförmig. Wie wir später zeigen werden, ist das für kugelförmige Körper sogar gerechtfertigt.
Umlaufbahnen
Als Beispiel betrachten wir nun ein System aus zwei Teilchen, die über die Gravitationskraft
miteinander wechselwirken. Mit den Methoden, die wir bis jetzt entwickelt haben, können wir
die Bewegungsgleichungen für ein solches System zwar noch nicht vollständig lösen. Aber wir
können sie zumindest schon etwas vereinfachen, und wir können ein paar Lösungen mit speziellen
Eigenschaften angeben.
Wir wollen versuchen, eine ganz bestimmte Frage zu beantworten. Ist es möglich, dass sich
die beiden Körper umkreisen, also eine periodische Umlaufbewegung ausführen? Solche Bewegungen treten typischerweise bei Paaren von Himmelskörpern auf, die sich gegenseitig anziehen.
Der Einfachheit halber werden wir uns zunächst auf kreisförmige Umlaufbahnen beschränken,
das heißt der Abstand der beiden Körper soll während der Umlaufbewegung konstant bleiben,
und die Umlaufbahn soll in einer Ebene liegen.
Wir schreiben zunächst die Bewegungsgleichungen für das Zwei-Teilchen-System auf, so wie
sie sich aus (4.1) ergeben, nachdem wir die Massen herausgekürzt haben,
(4.5)
Da das dritte Newtonsche Gesetz erfüllt ist, ist der Gesamtimpuls eine Erhaltunggröße. Wir
können die Bewegung der Teilchen in eine Schwerpunkt- und eine Relativbewegung zerlegen.
Wir müssen dazu gar nicht die Impulse als Hilfsfunktionen einführen, sondern können direkt die
Bewegungsgleichungen zweiter Ordnung entsprechend umformen. Wir setzen
(4.6)
und erhalten durch Addition bzw. Subtraktion der Bewegungsgleichungen (4.5)
Trägheit und Gewicht eines Körpers sind äquivalente Eigenschaften und werden
durch die Masse des Körpers bestimmt.
mit
(4.7)
Ganz nebenbei folgt aus diesem Äquivalenzprinzip nicht nur, dass alle Körper gleich schnell fallen, sondern auch, dass man Massen auch ganz anders messen kann als mit Hilfe der Apparatur in
Die Bewegungsgleichung für den Schwerpunkt können wir unmittelbar lösen. Da es sich um
ein abgeschlossenes mechanisches System handelt, bewegt sich der Schwerpunkt geradlinig und
52
gleichförmig,
Es gibt also spezielle Lösungen der Bewegungsgleichungen, die kreisförmige Umlaufbahnen
beschreiben. Um die eigentlichen Bewegungen der beiden Teilchen im Raum zu beschreiben,
müssen wir die gefunden Lösungen für die Schwerpunkt- und Relativbewegung nur noch in die
Formeln (3.58) einsetzen. Das ergibt
(4.8)
Mit dem Index bezeichen wir wieder die Anfangswerte bei
, hier also den Ortsvektor
des Schwerpunktes und seine konstante Geschwindigkeit .
Interessant ist nur die Bewegungsgleichung für die Relativbewegung der beiden Teilchen, also
die zweite Gleichung in (4.7). Da sich die Massen zum Teil aus den Bewegungsgleichungen herauskürzen, ist es hier gar nicht nötig, die reduzierte Masse einzuführen. Die Bewegungsgleichung
für die Relativbewegung enthält als einzigen Parameter die Summe
der beiden Massen. Auch
das ist wieder eine Konsequenz der Äquivalenz von Trägheit und Gewicht.
Gesucht ist nun eine spezielle Lösung für die Relativbewegung der beiden Teilchen. Die Bewegung soll in einer Ebene stattfinden, und der Abstandsvektor soll eine konstante Länge haben.
Dass die Bewegung in einer Ebene stattfindet, ist keine besondere Einschränkung. Da es sich bei
der Gravitationskraft um eine Zentralkraft handelt, ist der Drehimpuls der Relativbewegung,
oder der innere Drehimpuls, eine Erhaltungsgröße. Also findet die Relativbewegung in einer Ebene senkrecht zu statt.
ist, mit
. Der Abstandsvektor
Wir können das Koordinatensystem so wählen, dass
liegt dann in der - -Ebene und läuft im positiven Sinn, also gegen der Uhrzeigersinn um.
Um eine kreisförmige Umlaufbewegung mit dem konstanten Abstand und der Umlaufzeit zu
beschreiben, machen wir den Ansatz
(4.13)
mit
mit
Die Lösung ähnelt sehr der Bewegung (3.71) eines Systems von zwei Teilchen mit einem linearen
Kraftgesetz. Die Teilchen umkreisen einander, während sich das System als ganzes geradlinig und
gleichförmig durch den Raum bewegt. Allerdings müssen wir beachten, dass wir hier nur eine sehr
spezielle Lösung angegeben haben. Wir haben nicht die Lösung der Bewegungsgleichungen zu
einem beliebigen Satz von Anfangsbedingungen gefunden.
Da die Schwerpunktbewegung völlig uninteressant ist, betrachten wir den speziellen Fall
und
, der in Abbildung 4.1(b) dargestellt ist,
(4.14)
Die Teilchen umkreisen in diesem Fall den gemeinsamen Schwerpunkt, der im Koordinatenursprung ruht. Die Radien
der beiden Kreisbahnen verhalten zueinander wie die Massen
.
Ein besonders interessanter Fall ergibt sich, wenn wir zusätzlich noch annehmen, dass die
sehr viel größer ist als die Masse
, eins der Teilchen also sehr schwer und das
Masse
andere sehr leicht ist. Wenn wir in (4.14) den Grenzwert
bilden, so finden wir
und
, uns somit
(4.9)
mit
Die Konstante wird als Kreisfrequenz oder Winkelgeschwindigkeit bezeichnet. Der Winkel zwischen der -Achse und dem Ortsvektor des Teilchens ist
, das heißt ist die
Ableitung dieses Winkels nach der Zeit.
Die entscheidende Frage ist nun, ob die Bahn (4.9) eine Lösung der Bewegungsgleichung ist.
Wir berechnen zunächst die Ableitungen und finden
(4.15)
Das schwere Teilchen ruht im Ursprung, während das leichte Teilchen auf einer Kreisbahn mit
dem Radius umläuft. Zwischen der Umlaufzeit
und dem Bahnradius besteht
natürlich immer noch die Beziehung (4.12). Allerdings können wir für die Gesamtmasse
jetzt
auch die Masse
des schweren Teilchens einsetzen.
Eine andere Möglichkeit, zu diesem Ergebnis zu kommen, setzt bereits bei den Bewegungsgleichungen an. Wenn eines der Teilchen sehr schwer ist, können wir seine durch die Anziehungskraft
des leichten Teilchens verursachte Beschleunigung wegen seiner großen Trägheit vernachlässigen. Wir können also annehmen, dass das schwere Teilchen im Koordinatenursprung ruht. Das
leichte Teilchen bewegt sich dann in einem konstanten äußeren Kraftfeld, welches durch die Anziehungskraft des ruhenden Teilchens gegeben ist. Die Bewegungsgleichung in diesem Kraftfeld
die Masse des schweren Teilchens
ist genau die für die Relativbewegung in (4.7), wobei für
einzusetzen ist.
(4.11)
und der Kreisfre-
(4.12)
3. Keplersches
Gesetz
,
Offenbar ist diese Gleichung genau dann erfüllt, wenn zwischen dem Radius
quenz bzw. der Umlaufzeit die folgende Beziehung besteht,
Eingesetzt in (4.7) ergibt sich, mit
(4.10)
53
Man bestimme alle Lösungen der Bewegungsgleichung, bei denen das Teilchen auf einer Kreisbahn umläuft,
(4.17)
Daraus können wir folgenden Schluss ziehen. Wenn ein sehr leichtes Teilchen ein schweres
umkreist, dann ist die Größe
, also das Verhältnis der dritten Potenz des Bahnradius zum
Quadrat der Umlaufzeit eine Konstante, die nur von der Masse des schweren Teilchens abhängt.
Das gilt auch dann noch, wenn mehrere leichte Teilchen das schwere Teilchen umkreisen. Wenn
wir nämlich die Anziehungskraft des leichten Teilchens auf das schwere Teilchen vernachlässigen können, dann können wir auch die Wechselwirkungen der leichten Teilchen untereinander
vernachlässigen. Jedes Teilchen läuft auf einer eigenen Bahn (4.15), wobei das Verhältnis
für jede Umlaufbahnen dasselbe ist.
Das ist genau die Situation, die im Sonnensystem vorliegt. Mehrere leichte Teilchen, die Planeten, umkreisen ein schweres Teilchen, die Sonne. Die Umlaufzeiten und Bahnradien der Planeten lassen sich leicht durch Beobachtung bestimmen. Tatsächlich hatte Kepler die Relation
konst für die Planetenbahnen bereits gefunden, und zwar etwa
Jahre bevor Newtons sein Gravitationsgesetz aufgestellt hatte. Die Bestätigung dieses Zusammenhangs, der auch
als drittes Keplersches Gesetz bezeichnet wird, war deshalb eine der wichtigsten frühen Erfolge
der Newtonschen Gravitationstheorie und damit auch der klassischen Mechanik. Es war die erste
und zugleich wichtigste experimentelle Bestätigung der Newtonschen Theorie auf dem Gebiet
der Himmelsmechanik.
Tatsächlich war auch schon zu Keplers Zeiten bekannt, dass die Planetenbahnen nicht, wie wir
hier angenommen haben, exakte Kreise sind. Derselbe Zusammenhang zwischen Umlaufzeit und
Bahnradius gilt aber auch für nicht kreisförmige Bahnen, wie wir in Kapitel 8 zeigen werden.
Allerdings müssen wir dazu zunächst die allgemeine Lösung der Bewegungsgleichungen finden,
was wir an dieser Stelle noch nicht können. Und natürlich müssen wir den “Radius” durch eine
andere Größe ersetzen, die die Abmessung der Bahn festlegt, wenn diese nicht kreisförmig ist.
Das dritte Keplersche Gesetz ist also etwas allgemeiner als es hier dargestellt ist.
Das ändert aber nichts an der Feststellung, dass bereits die relativ grobe Näherung, bei der sich
die Planeten auf Kreisbahnen bewegen, das Newtonsche Gravitationsgesetz in dieser eindruckvollen Art und Weise bestätigt. Was daran auch bemerkenswert ist, ist die Tatsache, dass keinerlei
Kenntnis der Sonnenmasse, der Gravitationskonstante oder gar der Massen der Planeten nötig ist,
um das Gravitationsgesetz qualitativ zu bestätigen. Auch das ist eine Konsequenz der Äquivalenz
von Trägheit und Gewicht. Würden die Umlaufzeiten nämlich auch von den Massen der Planeten abhängen, so wäre eine derart einfache experimentelle Bestätigung nicht möglich. Denn die
Planetenmassen lassen sich nur schwer direkt messen.
Welche Beziehung besteht zwischen dem Radius und der Umlaufzeit
sich ohne Beschränkung der Allgemeinheit jede Kreisbahn so darstellen?
? Warum l ässt
Aufgabe 4.4 Als Newton seine Gravitationstheorie formulierte, kannte er die “experimentellen”
Arbeiten von Kepler und Galilei, die beide etwa hundert Jahre vor ihm lebten. Insbesondere wusste er, dass das Verhältnis aus Bahnradius hoch drei und Umlaufzeit hoch zwei für alle bekannten
Planeten dasselbe war, und er wusste, dass kleine Testkörper unter dem Einfluss der Erdanziehung gleich schnell fallen. Welche Überlegungen führten ihn, ausgehend von diesen Beobachtungen und dem Ergebnis von Aufgabe 4.3 zu seinem Gravitationsgesetz (4.1)?
Aufgabe 4.5 Man berechne den Impuls
und den Drehimpuls
des leichten Teilchens auf
der Bahn
aus (4.15). Warum ist der Drehimpuls des Teilchens in diesem Fall eine
überstreicht der Ortsvektor in einer Zeit ?
Erhaltungsgröße? Welche Fläche
Aufgabe 4.6 Welche Beziehung muss zwischen dem Anfangsort und der Anfangsgeschwindigder Relativbewegung der beiden Teilchen gelten, damit sich als L ösung der Bewegungskeit
gleichung eine Kreisbahn ergibt.
Der senkrechte Fall
Die Frage nach den kreisförmigen Umlaufbahnen ließ sich offenbar sehr einfach beantworten.
Nun wollen wir eine etwas schwierigere Frage stellen, deren Sinn hauptsächlich darin liegt, eine
typische Methode zur Lösung von Bewegungsgleichungen vorzustellen, die wir später noch etwas
besser formalisieren und verallgemeinern werden.
Der Ausgangspunkt ist diesmal eine ganz bestimmte Anfangsbedingung für das Zwei-Teilchensollen sich die beiden Teilchen relativ zueinander in Ruhe befinden
System. Zum Zeitpunkt
und einen Abstand
haben. Da sich die Teilchen gegenseitig anziehen, werden sie sich
aufeinander zu bewegen. Wie lange dauert es, bis sie zusammenstoßen? Mit anderen Worten, zu
wird der Abstand zwischen den Teilchen gleich Null sein?
welcher Zeit
Die Schwerpunktbewegung der Teilchen ist für diese Frage irrelevant, so dass wir uns ganz
auf die Berechnung Relativbewegung beschränken können. Vorgegeben sind die Anfangsbedingungen
und
. Auch hier können wir wieder das Koordinatensystem an das
in die
gestellte Problem anpassen. Wir wählen es so, dass der Abstandsvektor zur Zeit
Richtung der -Achse zeigt, also
Aufgabe 4.2 Man verschaffe sich die Daten der Planetenbahnen aus einer geeigneten Quelle,
bestätige das dritte Keplersche Gesetz und berechne daraus die Masse der Sonne.
wird von einem Kraftzentrum angezogen. Der Betrag
des Abstands gegeben. Das Teilchen bewegt sich also in
Aufgabe 4.3 Ein Teilchen der Masse
der Kraft sei durch eine Funktion
einem Zentralkraftfeld
54
(4.16)
(4.18)
Wir können dann davon ausgehen, dass die Relativbewegung nur in Richtung der -Achse erfolgt.
Die Gravitationskraft ist nämlich eine Zentralkraft. Sie kann die Teilchen also nur entlang der Achse beschleunigen, wenn sie sich in der Position (4.18) befinden, und das wiederum führt dazu,
dass sie sich relativ zueinander auchnur in -Richtung bewegen können.
Wir machen daher zur Lösung der Bewegungsgleichung den Ansatz
ist an dieser Stelle nicht wichtig. Wir werden uns in Kapitel 7 sehr ausführlich mit der Energie als
Erhaltungsgröße beschäftigen und dort eine allgemeinere Version der hier verwendeten Methode
zur Lösung von Bewegungsgleichungen herleiten.
Hier genügt es, festzustellen, dass es sich bei dem Ausdruck in (4.23) um eine Erhaltungsgröße
ist
handelt, deren Wert wir aus den Anfangsbedingungen bestimmen können. Zur Zeit
und
, also gilt für alle Zeiten
(4.19)
(4.25)
(4.24)
Außerdem können wir
annehmen, denn wir interessieren uns nur für den Abschnitt der
Bahn vom Zeitpunkt
bis zum Zeitpunkt
, bei dem der Abstand zwischen den Teilchen
zum ersten Mal Null wird. Da
ist und
die erste Nullstelle der Funktion
ist, folgt daraus natürlich
für
.
Setzen wir (4.19) in die Bewegungsgleichung (4.7) für die Relativbewegung ein, so ergibt sich
auf, so ergibt sich
Lösen wir diese Gleichung nach
(4.20)
Das Vorzeichen der Wurzel haben wir so gewählt, dass
ist. In dem relevanten Zeitintervall
nähern sich die Teilchen einander an, das heißt der Abstand der Teilchens
nimmt mit der Zeit ab.
Es ist uns also gelungen, das Problem auf die Lösung einer Differenzialgleichung erster Ordnung zurückzuführen. Als Anfangsbedingung müssen wir jetzt nur noch den Abstand zur Zeit
vorgeben. Die zweite Anfangsbedingung, dass das Teilchen zur Zeit
ruhen soll, ist
und mit
implizit in die Differenzialgleichung (4.25) eingegangen. An der Stelle
liefert sie
.
Eine Differenzialgleichung der Form (4.25) kann durch Separation der Variablen gelöst werden. Dazu schreiben wir die Differenzialgleichung zunächst wie folgt um,
Offenbar ist die Annahme, die Relativbewegung erfolge nur entlang der -Achse, mit der Bewegungsgleichung verträglich. Es steht nämlich auf beiden Seiten der Gleichung ein Vektor, der zu
proportional ist. Die Bewegungsgleichung ist genau dann erfüllt, wenn die Funktion
der
folgende Differentialgleichung genügt, zu der wir noch die entsprechenden Anfangsbedingungen
stellen müssen,
(4.21)
Damit haben wir die physikalische Frage auf eine rein mathematische Frage zurückgeführt. Wir
müssen jetzt nur noch die Differenzialgleichung (4.21) mit Anfangsbedingung lösen und die erste
Nullstelle der Funktion
finden. Dazu benutzen wir eine spezielle Methode, die wir später
noch häufiger verwenden werden. Auch sie beruht auf der Idee, zunächst die Ordnung der Differenzialgleichungen zu reduzieren und diese dann mit Hilfe von Erhaltungsgrößen zu vereinfachen.
Um die Differenzialgleichung zweiter Ordnung (4.21) in eine Differenzialgleichung erster Ordnung zu transformieren, multiplizieren wir beide Seiten der Gleichung mit
und schreiben
anschließend alle Terme auf eine Seite,
(4.26)
Anschließend integrieren wir beide Seiten dieser Gleichung von bis ,
(4.27)
(4.22)
mit
Wie man leicht sieht, lässt sich die linke Seite jetzt als Ableitung einer bestimmten Funktion von
nach der Zeit schreiben, nämlich
Um den Ausdruck auf der linken Seite auszurechnen, führen wir eine Substitution durch. Als
, und für die Integralgrenzen gilt
neue Integrationsvariable wählen wir . Es ist dann
und
, also
(4.23)
(4.28)
Der Ausdruck in der Klammer hängt also nicht von der Zeit ab. Es ist eine Erhaltungsgröße. Es
ist im wesentlichen die Energie, die in der Relativbewegung der beiden Teilchen steckt, aber das
55
der Teilchen im Moment des ZusamAufgabe 4.9 Wie groß ist die Relativgeschwindigkeit
menstoßes? Was folgt daraus für die Funktion
, wenn wir diese über den Zeitpunkt
hinaus fortsetzen wollen? Ist diese Frage überhaupt physikalisch sinnvoll?
Viele Differenzialgleichungen erster Ordnung lassen sich mit diesem Verfahren lösen. Gesucht
ist eine Funktion
. Man schreibt die Differenzialgleichung so um, dass auf einer Seite der
Gleichung eine bekannte Funktion von steht. Im (4.26) ist dies eine Konstante. Auf der anderen
Seite der Gleichung steht ein Ausdruck, der nicht explizit von , sondern nur von der Funktion
abhängt und zur Ableitung
proportional ist.
Bei der Integration beider Seiten über lässt sich dann auf einer Seite die Integration direkt
ausführen, während auf der anderen Seite eine Substitution durchgeführt werden kann, wobei
die Integrationsvariable durch ersetzt wird. Diesen Schritt haben wir in (4.28) durchgeführt.
Der Integrationsbereich ist dabei so zu wählen, wie es der jeweiligen Fragestellung entspricht. In
unserem Fall haben wir von
bis
integriert, da wir die Fallzeit ermitteln wollen.
Wenn wir alles zusammensetzen, bekommen wir
Aufgabe 4.10 Man löse die folgenden Differenzialgleichung mit Anfangsbedingungen durch Separation der Variablen. Gesucht ist jeweils die Funktion
.
(4.33)
Gravitationsfelder
(4.29)
Nun wollen wir noch kurz der Frage nachgehen, wie es kommt, dass wir die Gravitationskraft, die
auf einen kleinen Körper der Masse in der Nähe der Erdoberfläche wirkt, in sehr guter Näherung durch eine konstante Kraft
beschreiben können, wenn wir das Koordinatensystem entsprechend wählen. Das muss sich irgendwie aus dem allgemeinen Gravitationsgesetz
(4.1) ergeben. Schließlich bestand der große Erfolg der Newtonschen Theorie je gerade darin, die
Himmelsphysik mit der irdischen zu vereinen.
Wir betrachten dazu folgende Situation. Ein einzelnes Testteilchen mit Masse und Ortsvektor
befindet sich in der Nähe einer großen Massenansammlung, die wir uns aus sehr vielen anderen
Teilchen mit Massen
und Ortsvektoren
zusammengesetzt vorstellen. Diese anderen Teilchen bewegen sich unter dem Einfluss ihrer gegenseitigen Anziehungkräfte oder irgendwelcher
im allgemeinen Funktionen der Zeit sind. Sie werden jeanderen Kräfte, so dass die Orte
doch von dem sehr kleinen Testteilchen, dessen Bewegungsgleichung wir aufstellen wollen, nicht
merklich beeinflusst.
und die Bahnen aller anderen Teilchen,
Wir können daher annehmen, dass wir die Massen
also die Funktionen
kennen, und dass diese nichts von der Anwesenheit des Testteilchens
spüren. Die Gravitationskraft , die auf das Testteilchen wirkt, ergibt sich dann als Summe der
Anziehungskräfte aller anderen Teilchen, also
Damit haben wir das Problem fast schon gelöst. Wir müssen nur noch ein bestimmtes Integral auswerten. Um die Wurzel im Nenner zum beseitigen, führen wir nochmal eine Substitution durch.
Wir setzen
(4.30)
Die neue Integrationsvariable läuft von bis , wenn von bis läuft. Wenn wir dann noch
die Grenzen des Integrals vertauschen und damit das Vorzeichen umdrehen, ergibt sich nach einer
kurzen Rechnung
(4.31)
Dieses Integral können wir sofort angeben. Es berechnet den Flächeninhalt eines Viertelkreises,
ist also gleich
. Damit haben wir die gesuchte Fallzeit berechnet. Es ist
(4.34)
mit
(4.32)
Aufgabe 4.7 Nehmen wir an, wir könnten die Erde auf ihre Bahn um die Sonne anhalten. Wie
lange würde es dann dauern, bis sie in die Sonne stürzt? Die Frage lässt sich ohne besondere
Kenntnis der Bahndaten der Erde sofort beantworten, wenn man die Zeit in Jahren (oder Monaten) angibt.
. Dieses Kraftfeld hängt
Das Testteilchen bewegt sich in einem zeitabhängigen Kraftfeld
des
von den Massen und Orten der anderen Teilchen ab, und es ist proportional zur Masse
Testteilchens. Es ist nützlich, diese Masse aus der Definition des Kraftfeldes heraus zu nehmen
und statt dessen ein Feld
zu definieren,
56
Gravitationsfeld
Aufgabe 4.8 Zwei Massen von jeweils einem Kilogramm befinden sich ruhend im Abstand von
einem Meter. Wir lange dauert es, bis sie aufgrund der Anziehung durch Gravitation zusammenstoßen?
(4.35)
replacements
Massen der Teilchen, die das Feld erzeugen, bestimmten also zunächst die Stärke und Richtung
des Gravitationsfeldes überall im Raum, und die Masse des Testteilchens, das sich darin bewegt,
bestimmt anschließend, wie stark dieses Teilchen an das Feld ankoppelt, also welche Kraft es
letztlich erfährt.
Da die Masse des Testteilchens sowohl als Gewicht als auch als Trägheit in die Bewegungsgleichung (4.36) eingeht, ergibt sich daraus eine einfache Messvorschrift für das Gravitationsfeld.
an einem Ort und zu einer Zeit zu bestimmen, müssen wir
Um den Wert des Feldes
nur ein Testteilchen an diese Stelle bringen und die Beschleunigung messen, die es dort erfährt.
Tatsächlich hat das Gravitationsfeld
die physikalische Dimension einer Beschleunigung,
das heißt der gefundene Wert der Beschleunigung des Testteilchens ist identisch mit dem Wert
des Feldes
.
Diese Beschreibung der Gravitationkraft mit einem Feld als Träger der Kraft hat den Vorteil,
dass wir, um die Bewegungen eines Testteilchens zu beschreiben, nur das Feld
in dem
Raumbereich kennen müssen, in dem sich das Testteilchen bewegt. Es ist nicht nötig, genau zu
wissen, durch welche anderen Teilchen es erzeugt wird und wo sich diese Teilchen genau befinden. Genau das tun wir zum Beispiel dann, wenn wir die Bewegung eines kleinen Körpers im
Gravitationsfeld der Erde beschreiben wollen.
Die Erde kann als eine kugelförmige Ansammlung von sehr vielen Teilchen betrachtet werden,
an irgendeinem Punkt im
wie sie in Abbildung 4.3(a) dargestellt ist. Das Gravitationsfeld
Raum ergibt sich aus (4.35) als Summe der Beiträge aller dieser Teilchen. Wenn wir die Erde als
ruhend annehmen und den Ursprung des Koordinatensystems in den Mittelpunkt legen, so folgt
aus der Symmetrie der Massenverteilung in der Erde und daraus, dass diese zeitlich konstant ist,
dass das Gravitationsfeld ein zeitunabhängiges Zentralkraftfeld ist.
Das Gravitationsfeld der Erde zeigt, so wie das Gravitationsfeld eines einzelnen Punktteilchens,
stets auf den Mittelpunkt der Erde zu. Außerdem ist sein Betrag nur vom Abstand vom Erdmittelpunkt abhängig. Auch das folgt aus der Symmetrie der Erdkugel. Auf einer Kugeloberfläche, die
sich in einem bestimmten Abstand vom Erdmittelpunkt befindet, sei es innerhalb oder außerhalb
der Erde, gibt es keinen irgendwie ausgezeichneten Punkt, also kann es auch keine Stelle geben,
an der das Gravitationsfeld besonders stark oder schwach ist.
Durch reine Symmetrieüberlegungen finden wir also, dass das Gravitationsfeld der Erde folgende Form annimmt,
(b)
(a)
(c)
(d)
Abbildung 4.2: Das Gravitationsfeld
eines einzelnen Teilchens (b) und einer Ansammlung
von vielen Teilchen (b). Ist die Ansammlung von Teilchen räumlich begrenzt, so sieht das Feld
in großer Entfernung aus wie das eines einzelnen Teilchens, dessen Masse sich aus der Summe
der Massen der einzelnen Teilchen ergibt.
Das Gravitationsfeld
hängt jetzt nur noch von den Massen und Orten der Teilchen ab, die
das Feld erzeugen, aber nicht mehr von der Masse
des Testteilchens, mit dem wir das Feld
gewissermaßen vermessen. Für das Testteilchen gilt die Bewegungsgleichung
Wir können das Gravitationsfeld
als Träger der Gravitationskraft interpretieren. Jedes Teilchen, das eine Masse
hat und einer Bahn
folgt, erzeugt um sich herum ein Gravitationsfeld
(4.37)
(4.38)
mit
Es ist proportional zu seiner Masse, zeigt auf das Teilchen zu, und sein Betrag fällt mit den
Quadrat des Abstandes nach außen hin ab. In Abbildung 4.2(a) ist ein solches Feld schematisch
dargestellt. Das Feld erfüllt den ganzen Raum und gibt uns an jeder Stelle darüber Auskunft, wo
sich das Teilchen befindet und wie weit es entfernt ist.
, dass sich gemäß (4.35) durch
Alle Teilchen zusammen erzeugen ein Gravitationsfeld
Summation aus den Feldern der einzelnen Teilchen ergibt. Für Gravitationsfelder gilt das Superpositionsprinzip. Sie verhalten sich additiv, das heißt sie werden einfach überlagert oder superponiert, wenn mehrere Teilchen jeweils ein eigenes Feld erzeugen. Betrachten wir eine große
Ansammlung von Teilchen wie in Abbildung 4.2(b), so ergibt sich das Gravitationsfeld aus der
Überlagerung aller einzelnen Felder.
Ein Testteilchen, das sich in einem von anderen Teilchen erzeugten Gravitationsfeld befindet,
spürt eine Kraft, die proportional zum Gravitationsfeld und zur Masse dieses Teilchens ist. Die
(4.36)
Dabei ist der Ortsvektor, also der Abstandsvektor vom Erdmittelpunkt,
ein Einheitsvektor,
der in die Richtung des Ortsvektors zeigt, und
eine noch unbekannte reelle Funktion, die den
Betrag des Gravitationsfeldes in Abhängigkeit von der Entfernung vom Erdmittelpunkt festlegt.
Ohne diese Funktion explizit zu kennen, können wir daraus bereits die Rechtfertigung für die
Annahme ableiten, dass das Gravitationsfeld der Erde in der Nähe ihrer Oberfläche in guter Näherung durch ein konstantes Kraftfeld approximiert werden kann. Betrachten wir nämlich einen im
57
sie durch ihre gegenseitige Anziehungskraft erfahren. Welche Massen m üssten die Körper haben,
wenn beide Effekte gleich groß sein sollen?
replacements
Aufgabe 4.12 Wir werden später zeigen, dass das Gravitationsfeld
eines ausgedehnten, kugelförmigen Körpers außerhalb dieses Körpers dasselbe ist wie das eines Punktteilchens gleicher
Masse. Man berechne aus der Erdbeschleunigung
m s und dem Erdradius
km
die Masse und die Dichte der Erde, also das Verhältnis aus Masse und Volumen. Ist das Ergebnis
realistisch?
(c)
(d)
(b)
(a)
5 Zwangskräfte
Abbildung 4.3: Das Gravitationsfeld
eines ausgedehnten Körpers kann man bestimmen, indem man den Körper in sehr viele Teilchen zerlegt, diese als punktförmig betrachtet und ihre
Gravitationsfelder überlagert (a). In einem im Vergleich zu den Abmessungen des Körpers kleinen Raumbereich kann das Gravitationsfeld als homogen angenommen werden, so dass auf ein
dort befindliches Testteilchen eine konstante Kraft wirkt (b).
Die Gravitationskraft ist eine fundamentale Wechselwirkung. Sie wirkt auf alle Körper in der
gleichen Art und Weise. Sie lässt sich daher auch nicht ausschalten oder abschirmen. Die elektromagnetische Wechselwirkung ist eine andere fundamentale Wechselwirkung. Letztlich leiten sich
alle in der Natur auftretenden Kräfte aus solchen fundamentalen Wechselwirkungen her. In der
Praxis ist es aber meist viel zu kompliziert, ein mechanisches System allein durch fundamentale
Wechselwirkungen zwischen den beteiligten Teilchen zu beschreiben.
Um die Bewegungsgleichungen für ein kompliziertes mechanisches System überhaupt aufstellen und lösen zu können, benötigt man eine effektive Beschreibung in Form eines Kraftgesetzes,
das zwar im Prinzip auf fundamentale Kräfte zurückgeführt werden kann, das sich aber im konkreten Einzelfall sehr viel einfacher aus ein paar Grundregeln ableiten lässt, ohne dass man dafür
die fundamentalen Wechselwirkungen überhaupt kennen muss.
In der Technik spielt eine bestimmte Klasse solcher effektiven Kräfte eine besondere Rolle.
In der technischen Anwendung der Mechanik geht es meist darum, Kräfte genau so einzusetzen, dass einzelne Körper bestimmte Bewegungen ausführen, also ganz bestimmte, vorgegebene
Bahnen durchlaufen. Wir wollen hier weder komplizierte mechanische Geräte beschreiben noch
danach fragen, wie solche mechanischen Kräfte entstehen. Anhand von ein paar einfachen Beispielen wollen wir aber das Prinzip solcher Kräfte erklären, die im allgemeinen als Zwangskr äfte
bezeichnet werden.
Die Bezeichnung rührt daher, dass Zwangskräfte dafür sorgen, dass ein Körper nur ganz bestimmte Bewegungen ausführen kann, also einem Zwang unterliegt. Ein typisches Beispiel für
einen solchen Körper ist ein Schienenfahrzeug. Es kann sich nur entlang einer vorgegebenen
Kurve im Raum bewegen. Ein anderes typisches Beispiel wäre ein Körper, der sich in zwei Richtungen auf einer Fläche bewegen, diese aber nicht verlassen kann.
Vergleich zur Größe der Erde sehr kleinen Raumbereich in der Nähe der Oberfläche, wie er in
Abbildung 4.3(b) dargestellt ist, so ist in diesem Bereich sowohl die Richtung als auch der Betrag
des Gravitationsfeldes annähernd konstant.
Der Betrag ist annähernd konstant, weil der obere Rand des Raumbereiches nur unwesentlich
weiter vom Erdmittelpunkt entfernt ist als der untere Rand. Die Richtung des Feldes ist annähernd
konstant, weil der Winkel zwischen den Vektoren, die vom Erdmittelpunkt zu zwei verschiedenen
Punkten in dem gekennzeichneten Raumbereich zeigen, verschwindend klein ist. Durch die Wahl
eines geeigneten Koordinatensystem können wir also stets erreichen, dass in guter Näherung ingilt.
nerhalb eines begrenzten Raumbereiches
Genau das hatten wir im letzten Kapitel angenommen, um den freien Fall eines Körpers auf
der Erdoberfläche zu beschreiben. Der tatsächlichen Wert der Erdbeschleunigung können wir
direkt messen. Der angegebene Wert von
m s ist ein Mittelwert. Da die Erde nicht exakt
kugelförmig ist und die Massen nicht ganz gleichmäßig darin verteilt sind, weicht dieser Wert je
nach Ort und Höhe um einige Promille vom Mittelwert ab. Auch die Richtung des Gravitationsfeldes zeigt nicht genau immer zum Erdmittelpunkt. Davon können wir aber absehen, wenn der
Raumbereich, in dem sich das betreffende Teilchen bewegt, klein genug ist.
Das Schienenfahrzeug
Aufgabe 4.11 In einem Labor auf der Erdoberfläche befinden sich zwei Körper mit einer Masse
von jeweils einem Kilogramm im Abstand von einem Meter auf gleicher H öhe. Auf beide wirkt die
Erdanziehungskraft, jedoch in etwas unterschiedliche Richtungen. Man berechne die Differenz
der beiden Anziehungskräfte und die relative Beschleunigung, die die Körper dadurch erfahren,
wenn sie frei fallen. Man vergleiche diese relative Beschleunigung der K örper mit derjenigen, die
Wir werden auch hier wieder die Annahme machen, dass ein Körper näherungsweise als
punktförmiges Teilchen beschrieben werden kann, und diskutieren zunächst das Beispiel eines
Schienenfahrzeugs. Das Gleis, auf dem sich das Fahrzeug bewegt, kann durch eine Funktion
58
Überraschenderweise ist das möglich, und zwar mit Hilfe eines ganz einfachen Tricks. Wir
müssen gewissermaßen Ursache und Wirkung vertauschen. Wir wissen zwar nicht, wie die Kraft
in den Schienen genau entsteht, das heißt wir können sie nicht aus einem fundamentalen Kraftgesetz ähnlich dem Gravitationsgesetz herleiten. Aber wir kennen die Wirkung dieser Kraft. Sie
bewirkt, dass das Fahrzeug auf den Schienen bleibt, also dem auferlegten Zwang gehorcht. Wir
können die Kraft daher implizit aus ihrer bekannten Wirkung berechnen.
Um zu sehen, wie das geht, schreiben wir zunächst die Bewegungsgleichung für ein Teilchen
auf, dass sich auf einer vorgegebenen Kurve
bewegt, wobei
die gesuchte Funktion der
Zeit ist. Es gilt dann für die Geschwindigkeit und die Beschleunigung
replacements
(c)
(d)
(b)
(a)
Abbildung 5.1: Typische mechanische Systeme mit Zwangskräften. Ein Schienenfahrzeug (a),
das sich nur entlang einer vorgegebenen Kurve im Raum bewegen kann, besitzt nur einen Freiheitsgrad. Ein Körper, der auf einer Fläche (b) gleitet, besitzt zwei Freiheitsgrade. In beiden
stets senkrecht zu den möglichen Bewegungsrichtungen des
Fällen wirkt die Zwangskraft
Körpers.
(5.1)
nach dem Kurvenparameter . Die
Der Strich bezeichnet wieder die Ableitung der Funktion
Bewegungsgleichung lautet
(5.2)
irgendeine äußere Kraft sein soll, zum Beispiel eine auf das Fahrzeug einwirkende
wobei
Gravitationskraft oder eine Reibungskraft, die durch die Fahrt auf den Schienen oder den Luftwiderstand verursacht wird. Von dieser äußeren Kraft setzen wir voraus, dass sie als eine bekannte
Funktion des Ortes, der Geschwindigkeit und möglicherweise der Zeit vorgegeben ist.
Zusätzlich wirkt auf das Fahrzeug eine noch unbekannte Zwangskraft . Von dieser wissen
wir bis jetzt nur, dass sie dafür sorgt, dass das Fahrzeug die Schiene nicht verlässt. Um sie zu
bestimmen, schreiben wir die Bewegungsgleichung zunächst als Differenzialgleichung für die
. Eingesetzt in die Bewegungsgleichung von oben ergibt sich
gesuchte Funktion
beschrieben werden, wobei
irgendein frei wählbarer Kurvenparameter ist. Genauer gesagt
soll
diejenige Kurve im Raum sein, auf der sich der Schwerpunkt des Fahrzeugs bewegt,
wenn dieses auf dem Gleis entlang fährt.
Zum Beispiel können wir eine gerade, entlang der -Achse verlaufende Strecke durch die
Funktion
beschreiben, oder eine kreisförmige Strecke mit Radius durch die Funktion
. Im ersten Fall wäre der Kurvenparameter die Länge
der Strecke, im zweiten Fall wäre der Kurvenparameter der zurückgelegte Winkel entlang der
Strecke. Im Prinzip können wir diesen Parameter aber auch beliebig anders wählen.
als Funktion der Zeit , lässt sich
Die eigentliche Bewegung des Teilchens, also seine Bahn
dann durch eine einzige reelle Funktion
beschreiben, indem wir
setzen. Wir
sagen auch, dass ein solches mechanisches System nur einen Freiheitsgrad besitzt. Das Schienenfahrzeug verhält sich im Prinzip wie ein Teilchen in einem eindimensionalen Raum. Seine
beschrieben, nicht wie im Fall eines frei beweglichen
Bahn wird durch eine einzige Funktion
Teilchens durch drei unabhängige Funktionen
.
, die wir irgendwie aus der
Gesucht ist nun eine Bewegungsgleichung für die Funktion
allgemeinen Bewegungsgleichung
herleiten müssen. Das Problem ist, dass wir gar nicht
so genau wissen, was wir für die Kraft einsetzen müssen. Welche Kraft übt eine Schiene auf
einen darauf fahrenden Körper aus? Müssen wir nicht, um diese Kraft zu bestimmen, das ganze
das System in seine Einzelteile zerlegen, also das Fahrzeug in seine Räder, Achsen, Naben etc.
aufteilen? Ist es überhaupt möglich, ein solch kompliziertes System im Rahmen einer einfachen
Mechanik von Punktteilchen adäquat zu beschreiben?
(5.3)
Die Zeitabhängigkeit von haben wir, wie üblich, nicht mehr explizit hingeschrieben. Außerdem
einfach
geschrieben. Da sich der Körper nur
haben wir für
entlang der vorgegeben Kurve bewegen kann, kann auch die äußere Kraft eine Funktion von
und dargestellt werden.
Die Bewegungsgleichung (5.3) ist eine Vektorgleichung, das heißt auf beiden Seiten steht ein
Vektor mit drei Komponenten. Es handelt sich also um drei reelle Gleichungen, wenn wir alle
Vektoren in Komponenten zerlegen. Jedoch kommen darin vier unbekannte Funktionen der Zeit
vor, nämlich die drei Komponenten der noch unbekannten Zwangskraft , sowie die gesuchte
Funktion , die die Bewegung des Körpers beschreibt. Wir benötigen also noch mindestens eine
zusätzliche Gleichung, um die Bewegungsgleichung eindeutig lösen zu können.
Betrachten wir dazu folgende Situation. Der Körper soll auf der Schiene ruhen, und auf ihn
soll eine äußere Kraft senkrecht zur Schiene wirken. Das ist zum Beispiel für einen ruhenden
Körper auf einer waagerechten Schiene in einem Gravitationsfeld der Fall. Dann soll der Körper
natürlich nicht beschleunigt werden. Dasselbe gilt auch dann, wenn sich der Körper auf einer
waagerechten Schiene bewegt. Wenn wir von Reibungskräften absehen, dann soll sich der Körper
59
nirgendwo verschwindet. Das können wir aber stets durch eine geeignete
Tangentenvektor
Parametrisierung der Kurve erreichen, sofern diese hinreichend glatt, also stetig und differenzierbar ist.
Die Bewegungsgleichung lässt sich sogar noch vereinfachen, wenn wir die Kurve in einer ganz
speziellen Art und Weise parametrisieren. Wir wählen den Kurvenparameter so, dass er die
soll durch die Differenz
Kurvenlänge repräsentiert. Die Länge eines Kurvenstückes
gegeben sein. Es ist immer möglich, eine solche Parametrisierung einer Kurve zu finden.
Wie man unmittelbar aus der Formel (2.60) für die Länge einer parametrisierten Kurve entnimmt,
ist das genau dann der Fall, wenn der Tangentenvektor überall den Betrag Eins hat, also ein
Einheitsvektor ist.
Dann vereinfacht sich das effektive Kraftgesetz (5.6). Der Nenner wird gleich Eins und der
zweite Term im Zähler fällt weg, denn es gilt
gleichmäßig, also mit konstanter Geschwindigkeit bewegen. Die Zwangskraft soll das Fahrzeug
weder abbremsen noch beschleunigen.
Daraus folgt, dass die Zwangskraft in diesem Fall genau die senkrecht zur Schiene wirkende
Gravitationskraft kompensieren muss, aber sie darf nicht parallel zur Schiene wirken und das
Fahrzeug beschleunigen. Das können wir als eine allgemeine Eigenschaft von Zwangskräften
festhalten, die einen Körper in seiner Bewegungsfreiheit einschränken.
Hätte nämlich die Zwangskraft eine nicht verschwindende Komponente in Richtung einer möglichen Bewegungsrichtung des Körpers, so würde sie ihn in diese Richtung beschleunigen. Das ist
aber nicht die Eigenschaft einer Zwangskraft, wie das anschauliche Beispiel eines Schienenfahrzeugs klar macht.
senkrecht zur allen möglichen BeWir bekommen also die zusätzliche Bedingung, dass
wegungsrichtungen steht. In diesem Fall gibt es nur eine Bewegungsrichtung, nämlich entlang
der Kurve
der Schiene. Die Richtung der Schiene im Raum ist durch den Tangentenvektor
gegeben, zu dem auch die Geschwindigkeit des Teilchens stets proportional ist. Also gilt
Zwangskräfte wirken stets senkrecht zu den möglichen Bewegungsrichtungen eines
Körpers.
(5.7)
Was bleibt ist
(5.8)
mit
(5.4)
Da der Tangentenvektor
ein Einheitsvektor ist, ist die effektive Kraft
in diesem Fall
auf die Bewegungsrichtung
nichts anderes als die orthogonale Projektion der äußeren Kraft
des Körpers.
Die kompliziertere Bewegungsgleichung (5.5) benötigen wir nur dann, wenn die Parametrisienicht so gewählt ist, dass mit der Kurvenlänge übereinstimmt. Dann treten
rung der Kurve
auf der rechten Seite der Bewegungsgleichung zusätzliche Terme auf, die vom Ort und von
der Geschwindigkeit abhängen. In jedem Fall aber bekommen wir eine Differenzialgleichung
zweiter Ordnung für die gesuchte Funktion
, also formal eine Bewegungsgleichung wie wir
sie auch für eine Teilchen ohne Zwangsbedingungen kennen.
Als Anfangsbedingungen müssen wir den Ort des Teilchens zu einem bestimmten Zeitpunkt
und seine Geschwindigkeit vorgeben, also die Funktionswerte
und
. Dann wird die
Funktion
und somit die Bahn
durch die Bewegungsgleichungen eindeutig
bestimmt. Da es sich um ein System mit nur einem Freiheitsgrad handelt, ist seine Bewegungsgleichung im allgemeinen sogar einfacher als die für ein frei bewegliches Teilchen mit drei Freiheitsgraden. Es handelt sich nur um eine einzige Differenzialgleichung statt um drei gekoppelte
Differenzialgleichungen.
Systeme mit Zwangskräften sind also einfacher zu berechnen als es zunächst den Anschein hat.
Offenbar müssen wir die Zwangskräfte selbst gar nicht kennen, um die Bewegungsgleichungen
zu lösen. Wir können sie aber nachträglich berechnen, indem wir die gefundenen Lösungen in die
auflösen. Das ist für technische Anwendungen
Gleichung (5.5) einsetzen und diese dann nach
natürlich besonders interessant. Die Zwangskräfte beeinflussen zwar nicht den Bewegungsablauf,
aber sie sind ein Maß für die Belastung des mechanischen Systems.
Das ist die vierte Gleichung, die wir benötigen, um die Bewegungsgleichung zu lösen. Im Prinzip
können wir jetzt das Gleichungssystem (5.3) und (5.4) für die gesuchten Funktionen
und
lösen. Wir benötigen dazu nur noch einen Satz von Anfangsbedingungen für die Funktion
, also den Ort
und die Geschwindigkeit
zu irgendeiner Zeit .
Es geht aber sogar noch etwas einfacher. Die Zwangskraft lässt sich nämlich aus dem Gleichungsystem eliminieren. Wir bilden dazu das Skalarprodukt der Vektorgleichung (5.3) mit
und bekommen
(5.5)
60
Das Schienenfahrzeug verhält sich wie ein Teilchen, das sich in einem eindimensionalen Raum
mit der Ortskoordinate bewegt, wobei die Kraft, die auf das Teilchen einwirkt, durch eine Funktion vom und gegeben ist. Die einzige Bedingung, die wir stellen müssen, ist, dass der
(5.6)
mit
effektive
Kraft
Die Zwangskraft kommt in dieser Gleichung gar nicht mehr vor. Statt dessen bekommen wir eine
gewöhnliche Differenzialgleichung zweiter Ordnung für die Funktion
. Sie sieht ein wenig
kompliziert aus, hat aber die übliche Form einer Bewegungsgleichung. Wir können sie in der
üblichen Form schreiben, indem wir die nach auflösen und alle Terme, die von , und eventuell
explizit von der Zeit abhängen, zu einer effektiven Kraft zusammenfassen,
replacements
Zwangskraft verschwindet?
(c)
(d)
Aufgabe 5.2 In Abbildung 5.2(b) ist ein Teilstück einer Achterbahn schematisch dargestellt. Es
hat die Form eine Spirale mit Radius und Steighöhe . Die Kurve lässt sich durch die Funktion
(5.9)
beschreiben. Man stelle für die Funktion
die Bewegungsgleichung auf, wobei als äußere
wirken soll. Man löse die Bewegungsgleichung mit
Kraft die Gravitationskraft
den Anfangsbedingungen
und
, das heißt das Fahrzeug l äuft aus dem Stand
los. Wie groß ist der Betrag der Geschwindigkeit des Fahrzeugs, wenn es sich in einer H öhe
unterhalb des Startpunktes befindet? Man vergleiche diese Geschwindigkeit mit der Geschwindigkeit, die ein frei fallendes Teilchen nach dieser Fallstrecke hätte.
(b)
(a)
Abbildung 5.2: Auf ein Schienenfahrzeug wirkt eine Zwangskraft, die stets senkrecht zur Bewegungsrichtung ausgerichtet ist. Sie lassen sich in eine Komponente
senkrecht und eine
Komponente
parallel zum Gleisbett zerlegen, welches um einen Winkel zur Horizontalen
führt zu seitlichen Scherkräften in der Schiene und im Gleiskörper
geneigt ist (a). Die Kraft
uns sollte daher so klein wie möglich sein. Bei einer Achterbahn in Form einer Spirale (b) muss
auftreten solder Neigungswinkel nach unter hin zunehmen, wenn keine seitlichen Kräfte
len.
Aufgabe 5.3 Man bestimme für die Bahn, die sich in Aufgabe 5.2 ergibt, explizit die Zwangskräfte, die auf das Fahrzeug einwirken, und gebe diese als Funktion des Ortes an, an dem sich
das Fahrzeug gerade befindet. Wie ist der Neigungswinkel des Gleises als Funktion von zu
auftreten sollen?
wählen, wenn keine seitlichen Zwangskräfte
Das mathematische Pendel
Nun wollen wir ein System mit zwei Freiheitsgraden etwas näher untersuchen, also ein Teilchen,
dessen Bewegungen nicht auf eine vorgegeben Kurve, sondern auf ein Fläche eingeschränkt sind.
Auch ein solches System lässt sich sehr allgemein definieren und analysieren. Um das Prinzip
zu verstehen, genügt es jedoch, ein einfaches Beispiel zu betrachten. Die Ergebnisse lassen sich
anschließend leicht verallgemeinern.
Das Beispiel, das wir uns näher anschauen wollen, ist das in Abbildung 5.3(a) dargestellte
mathematische Pendel. Es besteht aus einem als punktförmig angenommenen Körper der Masse
, der an einem Seil oder einer Stange der Länge aufgehängt ist. Die Stange kann sich um ihren
Aufhängepunkt frei in alle Richtungen drehen, und ihre Masse soll im Vergleich zur Masse des
Pendelkörpers vernachlässigbar klein sein. Die Bewegungsfreiheit des Körpers ist somit auf eine
Kugelschale mit dem Radius um den Aufhängepunkt eingeschränkt.
In diesem Fall ist es offensichtlich, dass die durch den Stab ausgeübte Zwangskraft senkrecht
zu den möglichen Bewegungsrichtungen des Körpers ausgerichtet ist. Der Stab kann nur einen
Druck oder einen Zug auf den Körper in radialer Richtung ausüben, also senkrecht zur Kugeloberfläche. Einer Bewegung des Körpers entlang der Kugeloberfläche gibt der Stab wegen seiner
vernachlässigbaren Trägheit sofort nach.
Wir wählen das Koordinatensystem so, dass der Ursprung genau dort liegt, wo das Pendel auf, und die Zwangskraft
gehängt ist. Der Pendelkörper befindet sich dann an einem Ort mit
zeigt in Richtung des Ortsvektor . Wir machen den Ansatz
Für unser Beispiel eines Schienenfahrzeugs kann man aus der Zwangskraft auf die Belastung
der Schienen schließen. Sie lässt sich sogar noch in zwei Komponenten zerlegen, die das Gleis
in unterschiedlicher Weise belasten. In Abbildung 5.2(a) ist ein Querschnitt von Fahrzeug und
wirkt ebenfalls senkSchiene senkrecht zur Bewegungsrichtung dargestellt. Die Zwangskraft
recht zur Bewegungsrichtung, liegt also in dieser Ebene. Sie lässt sich in eine Komponente
parallel und eine Komponente
senkrecht zum Gleisbett zerlegen.
Da die Zwangskraft durch eine Wechselwirkung des Fahrzeugs mit den Schienen entsteht, treten in den Schienen natürlich gleich große Gegenkräfte auf. Ohne das im einzelnen zu analysieren
dieser Gegenkraft die
kann man sich mit ein wenig Intuition überlegen, dass die Komponente
Schienen sehr viel stärker belastet als die Komponente
. Erstere führt nämlich zu seitlichen
Scherkräften in den Schienen und im Gleichbett, während letztere nur einen relativ harmlosen
Druck nach unten ausübt. Eine typische Aufgabe der Gleisbautechnik ist daher, den Neigungswinmöglichst
kel des Gleisbettes so zu wählen, dass die seitliche Komponente der Zwangskraft
klein wird.
Aufgabe 5.1 Ein Zug mit einer Masse von t pro Radsatz fährt mit einer Geschwindigkeit von
km h auf einer waagerechten Strecke durch eine Kurve mit einem Radius von km. Welche
wirkt auf einen einzelnen Radsatz? Um wieviel Prozent ist der Betrag dieser
Zwangskraft
Kraft größer als die Zwangskraft, die bei gerader Fahrt wirkt? Wie ist der in Abbildung 5.2(a)
definierte Neigungswinkel des Gleisbettes zu wählen, damit die seitliche Komponente
der
61
(5.10)
replacements
verwenden und einen Einheits-
Wir können das noch ein wenig umschreiben, indem wir
vektor
(c)
(d)
(5.15)
zeigt und die momentane Ausrichtung des Pendels
einführen, der in Richtung des Ortsvektors
bestimmt. Es gilt dann
(5.16)
mit
(b)
(a)
Die Größe
ist die Projektion der äußeren Kraft
auf die momentane Ausrichtung
des
Pendels, also die radiale Komponente der äußeren Kraft, und ist der Betrag der momentanen
Geschwindigkeit des Pendelkörpers.
Die zwei Anteile der Zwangskraft können wir folgendermaßen verstehen. Der erste Anteil
der
kompensiert die äußere Kraft, die auf den Pendelkörper wirkt. Genauer gesagt, der Anteil
äußeren Kraft in Richtung von wird kompensiert, so dass keine Beschleunigung des Körpers
in radiale Richtung auftreten kann. Versucht die äußere Kraft, den Körper nach innen oder außen
zu bewegen, so wird dieser Kraft durch die Zwangskraft entgegengewirkt.
hat.
Der zweite Anteil ist eine stets zum Ursprung hin gerichtete Kraft, die den Betrag
Das ist die Zentripetalkraft, die nötig ist, um einen Körper der Masse
mit der Geschwindigkeit auf eine Kreisbahn mit Radius zu zwingen. Die Zwangskraft gleicht also nicht nur den
radialen Anteil der äußeren Kraft aus, sondern sie sorgt gleichzeitig auch noch für die nötige Zentripetalkraft, um den Körper auf einer Bahn mit konstantem Abstand zum Aufhängepunkt, also
zum Koordinatenursprung zu halten.
Abbildung 5.3: Das mathematische Pendel (a) besteht aus einem Teilchen der Masse , das
an einem als masselos angenommenen Seil oder Stab der Länge in einem Gravitationsfeld
aufgehängt ist. Eine Hantel (b) besteht aus zwei Teilchen, die durch einen ebenfalls als masselos
angenommenen Stab der Länge verbunden sind. In beiden Fällen wirken die Zwangskräfte als
Zug- oder Druckkräfte in Richtung des Stabes. Beim Pendel wirkt eine äußere Kraft auf ein
Teilchen, bei der Hantel wechselwirken zwei Teilchen miteinander.
wobei eine noch unbekannte skalare Größe ist, die in irgendeiner Weise vom momentanen
Bewegungszustand des Pendels abhängen wird. Außerdem soll auf den Körper noch eine äußere
Kraft
wirken, die wie üblich als Funktion von und und eventuell der Zeit vorgegeben ist.
Daraus ergibt sich analog zu (5.2) die Bewegungsgleichung
wirken, nennen wir freies Pendel.
Aufgabe 5.4 Ein Pendel, auf das keine äußeren Kräfte
Man zeige, dass die allgemeine Lösung der Bewegungsgleichung für ein freies Pendel wie folgt
geschrieben werden kann,
(5.11)
Um die Größe und damit die Zwangskraft zu bestimmen, benutzen wir den gleichen Trick wie
gerade eben für das Schienenfahrzeug. Wir wissen, was die Zwangskraft bewirkt. Sie stellt sich
immer so ein, dass der Abstand des Teilchens zum Ursprung konstant bleibt. Durch zweimaliges
Ableiten finden wir
mit
(5.17)
Die Parameter der Lösung sind ein Einheitsvektor , der die Lage des Pendels zur Zeit
angibt, sowie ein dazu senkrecht stehender Vektor , der die Rotationsachse, um die das Pendel
rotiert, und die Winkelgeschwindigkeit festlegt. Wie hängen diese Parameter mit den Anfangsbedingungen
und
zusammen? Können die Anfangsbedingungen beliebig
gewählt werden?
und setzen die Bewegungsgleichung (5.11) ein, so
Multiplizieren wir die letzte Gleichung mit
ergibt sich
(5.12)
(5.13)
62
und zeige,
(5.14)
Aufgabe 5.5 Man berechne für die Bahn (5.17) den Drehimpuls des Pendels
dass es sich um eine Erhaltungsgröße handelt. Warum ist das so?
ergibt
Auflösen nach
PSfrag replacements
Kugelkoordinaten
(c)
(d)
Im Prinzip können wir jetzt die Zwangskraft (5.16) in die Bewegungsgleichung (5.11) einsetzen
und versuchen, diese für eine vorgegebene äußere Kraft
zu lösen. Geschickter ist es jedoch,
auch hier die Zwangskraft zuerst aus der Bewegungsgleichung zu eliminieren, so wie wir dies für
das Schienenfahrzeug getan haben. Dadurch reduziert sich die Anzahl der zu lösenden Differenzialgleichungen.
Was wir dazu benötigen, ist eine Beschreibung der Kugeloberfläche als parametrisierte Fl äche,
analog zur Darstellung der Schiene als parametrisierte Kurve. Erinnern wir uns kurz, wie wir dort
vorgegangen sind. Die Kurve, auf der sich das Fahrzeug bewegen konnte, war durch eine Funktion
(b)
(a)
(5.18)
parametrisierte
Kurve
Abbildung 5.4: Auf der Erdoberfläche wird jeder Punkt durch die Angabe seiner geographischen
Breite und Länge identifiziert (a). Die geographische Länge ist eine periodische Koordinate,
das heißt und
sind äquivalent. Der Breite nimmt Werte zwischen
am Südpol
am Nordpol an. Die in der Mathematik und Physik üblichen Kugelkoordinaten und
und
sind so definiert, dass am Nordpol
und am Südpol
gilt, und eine Periode von
hat (b).
oder die entsprechende Ortsvektordarstellung
vorgegeben. Ausgehend davon
konnten wir den Kurvenparameter als Ortskoordinate verwenden, das heißt wir konnten die
des Teilchens durch eine einzige reelle Funktion
beschreiben, mit
.
Bahn
Die Situation ist ganz analog zur Darstellung des Bahn
eines frei beweglichen Teilchens
durch die Koordinatenfunktionen
bezüglich eines kartesischen Koordinatensystems. In die, das heißt der Ortsvektor lässt sich als Funktion der drei kartesischen
sem Fall ist
Koordinaten darstellen. Im Falle eines Teilchens mit nur einem Freiheitsgrad übernimmt der
Kurvenparameter die Rolle der kartesischen Koordinaten. Der Ortsvektor wird als Funktion
der Koordinate dargestellt.
Ganz ähnlich können wir vorgehen, wenn sich das Teilchen auf einer Fläche bewegt. Ein Fläche
können wir durch eine Funktion von zwei reellen Variablen darstellen,
niertes Koordinatensystem auf der Erdoberfläche verwendet. Jeder Punkt auf der Erdoberfläche
wird eindeutig durch seinen Längen- und Breitengrad identifiziert.
Die Breite eines Punktes auf der Erdoberfläche ist durch den Winkelabstand vom Äquator festgelegt, wobei Orte auf der Nordhalbkugel eine positive Breite
und Orte auf der
haben. Am Nordpol ist
, am Südpol
.
Südhalbkugel eine negative Breite
Der Wertbereich der Breite ist demnach
, oder in dimensionslosen Größen aus. Die Breitenkreise, also die Linien gleicher Breite
konst sind
gedrückt
Kreise, die parallel zum Äquator verlaufen und an den Polen zu Punkten entarten.
Die Länge eines Punktes ist wie folgt festgelegt. Die Längenkreise oder Meridiane, also die
konst sind Großkreise, die den Nordpol mit den Südpol verbinden.
Linien gleicher Länge
Einer dieser Längenkreise ist willkürlich als Nullmeridian ausgewählt. Dort ist
. Für die anderen Längenkreise ergibt sich die Koordinate als Winkelabstand vom Nullmeridian, gemessen
entlang des Äquators in östlicher Richtung. Die Länge ist daher eine periodische Koordinate
mit der Periode
oder . Die Koordinaten
und
bezeichnen denselben
Punkt auf der Kugeloberfläche.
In der Mathematik und der Physik ist es üblich, dieses in der Geographie benutzte Koordinatensystem ein wenig zu modifizieren. Einen speziellen Grund dafür gibt es allerdings nicht. Man
ersetzt die Breite durch eine andere Koordinate , die den Winkelabstand zum Nordpol misst.
(5.19)
parametrisierte
Fläche
63
. Jeder Punkt auf der
oder durch eine entsprechende Ortsvektordarstellung
Fläche wird auf diese Weise eindeutig durch seine Koordinaten
identifiziert. Jedem Paar
von reellen Zahlen
entspricht genau ein Punkt auf der Fläche mit dem Ortsvektor
.
Wie bei einer parametrisierten Kurve nehmen wir stets an, dass die Funktion
hinreichend
oft stetig und differenzierbar ist.
Bewegt sich nun ein Teilchen auf einer solchen parametrisierten Fläche, so können wir seine
durch zwei reelle Funktionen
und
beschreiben, so dass
Bahn
ist. Die Koordinaten und übernehmen jetzt die Rolle der kartesischen Koordinaten eines
frei beweglichen Teilchens. Da ein Teilchen auf einer Fläche zwei Freiheitsgrade hat, wird seine
Bahn durch zwei Koordinatenfunktionen beschrieben.
Um ganz konkret die Bewegungen eines Pendels zu beschreiben, müssen wir auf der Kugeloberfläche geeignete Koordinaten einführen. Das einfachste und dafür am besten geeignete Koordinatensystem ist in Abbildung 5.4(a) dargestellt. Es wird unter anderem als ein weltweit defi-
Es gilt also
, und der Wertebereich ist
. Dieses modifizierte Koordinatensystem auf der Kugeloberfläche ist in Abbildung 5.4(b) dargestellt. Es unterscheidet sich nur
unwesentlich von dem Koordinatensystem in Abbildung 5.4(a).
Wir können jetzt den Ort, an dem sich das Pendel befindet, durch Angabe der Koordinaten
und festlegen. Die Bahn des Pendels wird durch zwei Funktionen
und
beschrieben,
beschrieben wurde. Wir
so wie zuvor die Bahn eines Schienenfahrzeugs durch ein Funktion
müssen uns nur noch überlegen, wie der Ortsvektor mit den Winkeln und zusammenhängt.
Dass sie nicht linear ist äußert sich darin, dass wir den Abstandsvektor zweier Punkte nicht
mehr aus den Differenzen der Koordinaten berechnen können. Folglich können wir den Abstand
zwischen zwei Punkten auch nicht mehr mit Hilfe der Pythagoras-Formel (1.71) bestimmen. Außerdem sind die Koordinatenlinien, also die Kurven, auf denen jeweils zwei der drei Koordinaten
konstant sind, keine zueinander senkrechte Geraden mehr. Dashalb nennt man ein solches Koordinatensystem krummlinig. Die Koordinatenlinien von und sind die in Abbildung 5.4 dargestellten Kreise, und die Koordinatenlinien von sind Geraden, die durch den Ursprung verlaufen.
Ein weiterer Nachteil des so definierten Koordinatensystems ist, dass die Abbildung (5.22)
nicht mehr bijektiv ist. Ein Punkt kann nämlich durch mehrere Sätze von Koordinaten dargestellt
werden. Wie wir bereits gesehen haben, ist die Koordinate periodisch, das heißt die Koordinaten
und
bezeichnen denselben Punkt im Raum. Eine genauere Betrachtung
der Definition (5.21) ergibt, dass zusätzlich noch die folgenden Identitäten gelten,
Aufgabe 5.6 Wir orientieren die Kugel in Abbildung 5.4 so im Raum, dass der Nordpol auf der
positiven -Achse liegt und der Äquator als Kreis mit Radius in der - -Ebene liegt. Man zeige,
auf der Kugeloberfl äche
dass dann der Ortsvektor eines Punktes mit den Koordinaten
durch
(5.20)
(5.23)
und dem Nordpol
gegeben ist. Man berechne dazu den Winkelabstand zwischen dem Punkt
konst
und zeige, dass dieser gleich ist. Man zeige außerdem, dass die Koordinatenlinien
Großkreise sind, also Kreise mit Radius , deren Abstand voneinander, auf den Äquator gemessen, durch die Differenz der -Koordinaten gegeben ist. Der Nullmeridian ist dabei derjenige
Längenkreis, der die positive -Achse schneidet. Außerdem ist nat ürlich zu zeigen, dass
ist.
und natürlich weitere Identitäten, die sich durch Kombination dieser Gleichungen ergeben. Außerdem ergibt sich
(5.24)
(5.25)
Innerhalb dieser Intervalle sind die Kugelkoordinaten dann eindeutig. Die an den Rändern der
Intervalle auftretenden Redundanzen (5.24) lassen sich dadurch allerdings nicht vermeiden.
Trotz dieser Mehrdeutigkeiten und der eingeschränkten Wertebereiche sind Kugelkoordinaten
oft ein sehr nützliches Hilfsmittel, um Situationen zu beschreiben, die wie das mathematische
Pendel eine Kugelsymmetrie besitzen. Wir werden dafür noch sehr viele Beispiele kennen lernen.
mit
(5.21)
Das ist ein Beispiel für ein krummliniges Koordinatensystem. Wie in einem kartesischen Koordinatensystem (1.69) wird ein Punkt durch die Angabe von drei reellen Zahlen festgelegt. Durch
(5.21) wird eine Abbildung definiert,
Kugelkoordinaten
das heißt für spezielle Werte von und sind einige der Koordinaten redundant. Der Punkt im
wird unabhängig von den Winkelkoordinaten
Raum hängt von ihnen nicht mehr ab. Für
und der Ursprung bezeichnet, und für
bzw.
ergibt sich stets ein Punkt auf der
-Achse, der von unabhängig ist. Das ist jeweils der Nord- bzw. Südpol der Kugel mit Radius
. Dort ist der Breitenkreis zu einem Punkt entartet und folglich die Koordinaten redundant.
Anschaulich können wir diese Eigenschaften der Kugelkoordinaten wie folgt verstehen. Beals eine Abbildung des
auf
trachten wir die in (5.20) definierte Abbildung
die Kugeloberfläche mit Radius , so wird der
in einer speziellen Art und Weise um die Kugel
herum gewickelt. Deshalb sind die Kugelkoordinaten nicht eindeutig. Wir können jedem Punkt
auf der Kugeloberfläche mehrere Sätze von Koordinaten zuordnen.
Um die Kugelkoordinaten dennoch so eindeutig wie möglich festzulegen, schränkt man üblicherweise den Wertebereich der Koordinaten ein,
Damit haben wir die Kugeloberfläche als parametrisierte Fläche
dargestellt. Wir können
sogar noch einen Schritt weiter gehen und folgende Feststellung machen. Wir können nicht
nur die Punkte auf einer bestimmten Kugeloberfläche mit diesen Koordinaten erfassen, sondern
darüber hinaus jeden Punkt im Raum durch die Angabe seiner Kugelkoordinaten identifizieren.
Wir müssen dazu nur zusätzlich zu den Koordinaten und , die auf jeder Kugeloberfläche eingeführt werden können, angeben, auf welcher Kugeloberfläche der Punkt liegt.
Wir müssen also zusätzlich den Radius dieser Kugel angeben. Das ist natürlich der Betrag
des Ortsvektors. Durch die Angabe von drei reellen Zahlen
wird dann eindeutig
ein Punkt im Raum festgelegt. Es ist der Punkt mit dem Ortsvektor
(5.22)
einen Punkt
zu. Jedoch unterscheidet
Sie ordnet jedem Tripel von reellen Zahlen
sich die Abbildung (5.22) von einem kartesischen Koordinatensystem dadurch, dass sie erstens
nicht linear, und zweitens nicht einmal bijektiv ist.
und
gegeben mit Kugelkoordinaten
.
64
Aufgabe 5.7 Es seien zwei Punkte
und
. Man berechne den Abstand
Aufgabe 5.8 Es sei eine Kurve
, mit
, durch Kugelkoordinaten
dargestellt. Man drücke den Tangentenvektor
durch die Funktionen
,
ihre Ableitungen aus und zeige, dass die Länge der Kurve wie folgt gegeben ist,
,
und
PSfrag replacements
(5.26)
(c)
(d)
Es gilt also für das Linienelement (2.62) in Kugelkoordinaten
(5.27)
(b)
(a)
Bewegungsgleichungen in Kugelkoordinaten
Abbildung 5.5: An jedem Punkt im Raum wird durch die Kugelkoordinaten eine Orthonormalbasis
festgelegt (a). Die Basisvektoren zeigen in die Richtungen der jeweiligen Koornach Süden, und
nach Osten. Nur an den Polen ist die
dinatenlinien, radial nach außen,
Basis nicht eindeutig, da die Koordinaten dort teilweise redundant sind. Bewegt sich ein Teilchen
auf einer Kugeloberfläche (b), so führt es die Basis
mit. Seine Geschwindigkeit ist
und .
an jeder Stelle der Bahn eine Linearkombination der dort definierten Vektoren
Kommen wir nun zurück zum Pendel. Analog zum Schienenfahrzeug beschreiben wir seine Bewegungen jetzt durch zwei Funktionen
und
, und setzen
(5.28)
wobei die Funktion
durch (5.20) gegeben ist. Um das in die Bewegungsgleichung (5.11)
einzusetzen, müssen wir die zweite Ableitung von
berechnen. Das ist eine etwas komplizierte
Rechnung, die wir schrittweise durchführen werden.
Wir führen zunächst ein paar nützliche Abkürzungen ein. Den Ortsvektor eine Punktes fassen
auf, die explizit durch
wir im folgenden stets als eine Funktion der Kugelkoordinaten
(5.21) gegeben ist. Wir definieren als erstes drei Einheitsvektoren ,
und , indem wir die
partiellen Ableitungen dieser Funktion bilden und die Vektoren anschließend normieren,
Anschaulich können wir uns die Vektoren
als eine am Punkt mit den Kugelkoordiaufgestellte Basis vorstellen, wie sie in Abbildung 5.5(a) dargestellt ist. An jedem
naten
Punkt im Raum wird auf diese Weise ein andere Orthonormalbasis von
definiert. Da die Vektoren
nicht von abhängen, genügt es, eine bestimmte Kugeloberfläche zu betrachten.
Der Vektor steht überall auf dieser Kugeloberfläche senkrecht, und die Vektoren
und
zeigen tangential zur Kugeloberfläche, in Richtung der Längen- und Breitenkreise. Der Vektor
zeigt überall nach Süden, der Vektor
nach Osten. Nur an der Polen, also entlang der -Achse
ist die Basis nicht eindeutig festgelegt. Das liegt an der Redundanz (5.24) der Kugelkoordinaten
an den Polen. Dieses Problem werden wir später noch einmal genauer untersuchen. Zunächst
werden wir es einfach ignorieren.
Wir können jetzt die Geschwindigkeit und die Beschleunigung des Pendels berechnen. Be, die in Kugelkoordinaten dargestellt ist,
trachten wir zunächst eine beliebige Bahn
. Aus (5.29) ergibt sich dann für die Geschwindigkeit
Kugelbasis
(5.29)
Aufgabe 5.9 Man zeige, dass die Vektoren
für alle
eine positiv orientierte
bilden. Es handelt sich also um drei zueinander senkrecht stehende
Orthonormalbasis von
Einheitsvektoren,
(5.32)
Außerdem gilt für die Kreuzprodukte
(5.30)
Bewegt sich das Teilchen nur auf einer Kugeloberfläche mit Radius
, so verschwindet
natürlich der erste Term. Die Geschwindigkeit ist dann eine Linearkombination der Vektoren
(5.31)
65
und . Da wir das Ergebnis später noch gebrauchen können, betrachten wir aber zunächst eine
Bahn, die nicht auf eine Kugeloberfläche eingeschränkt ist.
Um die Beschleunigung zu berechnen, müssen wir die Gleichung (5.32) noch einmal nach
ableiten. Dabei müssen wir beachten, dass die Basisvektoren
jetzt ebenfalls Funktionen der Zeit sind, denn sie hängen ja von und ab. Wenn sich das Teilchen bewegt, nimmt
mit, bezüglich der die Komponenten (5.32) der Geschwindigkeit
es quasi die Basis
definiert sind.
Da es sich dabei im eine Orthonormalbasis handelt, sind die Komponenten durch die Skalarprodukte gegeben,
(5.37)
lässt sich dann komponentenweise wie folgt schreiben,
Die Bewegungsgleichung
nach den Koordina-
Aufgabe 5.10 Man berechne die Ableitungen der Basisvektoren
ten
und beweise
(5.38)
Aufgabe 5.12 Gegeben sei die folgende Bahn eines Teilchens, dargestellt in Kugelkoordinaten
(5.34)
(5.33)
Wichtig ist an dieser Stelle, dass die Komponenten
der Kraft immer bezüglich der
Basis
an der Stelle definiert sind, an der sich das Teilchen gerade befindet. Wenn
die Kraft als Funktion des Ortes und der Geschwindigkeit vorgegeben ist, so müssen wir
diesen Vektor bezüglich der Basis
an der Stelle
in seine Komponenten
, die wir als Funktionen
zerlegen. Als Ergebnis erhalten wir dann die Komponenten
von , , und deren Zeitableitungen darstellen können.
Das Gleichungssystem (5.38) ist wieder ein gekoppeltes System von Differenzialgleichungen
,
und
. Es besitzt eine eindeutige Lösung,
zweiter Ordnung für drei reelle Funktionen
wenn wir einen Satz von Anfangsbedingungen, also den Ort und die Geschwindigkeit des Teilchens zu irgendeiner Zeit vorgeben. Es sieht ein wenig kompliziert aus, ist aber letztlich nur eine
andere Darstellung der gewöhnlichen Newtonschen Bewegungsgleichung
in kartesischen Koordinaten.
Für die Zeitableitungen der Basisvektoren ergibt sich daraus
Aufgabe 5.11 Man leite die Gleichung (5.32) noch einmal nach der Zeit ab und benutze (5.34),
um zu zeigen, dass für die Beschleunigung in Kugelkoordinaten gilt
(5.39)
wobei
irgendwelche Konstanten sind. Man berechne die Geschwindigkeit und die
Beschleunigung in Kugelkoordinaten. Was folgt aus dem Ergebnis? Um was f ür eine spezielle
Bahn handelt es sich?
Was durch diese Gleichungen ausgedrückt wird, ist genau das, was wir als “Mitnehmen” der
Basis durch das sich bewegende Teilchen bezeichnet haben. Während sich das Teilchen durch
den Raum bewegt, ändert sich der Ort, an dem es sich befindet, und entsprechend ändert sich
auch die Basis
, die an jedem Ort eine andere ist.
Die Pendelgleichungen
Nach diesen eher allgemeinen Ausführungen über Kugelkoordinaten kehren wir nun zur eigentlichen Fragen zurück. Es ging darum, für das mathematische Pendel einen Satz von Bewegungsgleichungen herzuleiten, aus dem die Zwangskraft eliminiert ist. Wir verwenden dazu die Bewe, und somit
und
.
gungsgleichungen in der Form (5.38). Für das Pendel gilt
Außerdem hatten wir die Kraft in eine äußere Kraft
und eine Zwangskraft
zerlegt.
(5.35)
Um die Bewegungsgleichung in Kugelkoordinaten darzustellen, müssen wir jetzt nur noch
die Kraft , die auf das Teilchen wirkt, ebenfalls in ihre Komponenten bezüglich der Basis
zerlegen, also
(5.36)
66
Masse unabhängig. Es ergeben sich schließlich folgende Bewegungsgleichungen für die Funktionen
und
,
Betrachten wir zunächst die radial Komponente der Bewegungsgleichungen, also die erste
Gleichung von (5.38). Sie lautet in diesem Fall
(5.45)
Pendelgleichungen
(5.40)
wobei
und
die radialen Komponenten der Kräfte sind. Die Zwangskraft hatten wir bereits ausgerechnet. Sie war durch (5.16) gegeben. Der dort definierte Vektor
ist genau der radiale Einheitsvektor, das heißt die Zwangskraft hat nur diese eine Komponente,
(5.41)
mit
Aufgabe 5.14 Es gibt zwei spezielle Lösungen der Pendelgleichungen, die wir unmittelbar ableund
beliebig, die andere ist
und
ebenfalls
sen können. Die eine ist
beliebig. Welche Art von Bewegung führt das Pendel dabei aus? Wie kommt es, dass die Funktionen
in beiden Fällen frei wählbar sind, obwohl doch die Bewegungen eines mechanischen
Systems durch die Anfangsbedingungen eindeutig festgelegt sind?
Offenbar hebt sich die radiale Komponente der äußeren Kraft gerade weg, und was von der radialen Komponente der Bewegungsgleichung übrig bleibt ist
Aufgabe 5.15 Man bestimme alle Lösungen der Pendelgleichung, bei denen das Pendel eine
Kreisbewegung ausführt, also eine Bahn der Form
(5.46)
(5.42)
durchläuft. Welche anschauliche Bedeutung haben in diesem Fall die Konstanten , und ?
Man bestimme den Zusammenhang zwischen und der Umlaufzeit f ür eine solche Kreisbahn.
Welche Werte können und annehmen?
und zeige, dass
Aufgabe 5.13 Man berechne den Betrag der Geschwindigkeit (5.32) f ür
die Gleichung (5.42) automatisch erfüllt ist.
Aufgabe 5.16 Eine andere spezielle Lösung der Pendelgleichungen, die sich exakt angeben l ässt,
ist
(5.47)
Die Umkehrfunktion
des Kotangens nimmt dabei Werte zwischen und an. Man zeige,
dass dies für beliebige Konstanten eine Lösung der Pendelgleichungen ist und bestimme . Wie
sieht diese spezielle Bewegung des Pendels aus?
Das muss auch so sein, denn wir haben die Zwangskraft ja genau so berechnet, dass das Teilchen
keine Beschleunigung in radialer Richtung erfährt.
Genau wie beim Schienenfahrzeug sind nur diejenigen Komponenten der Bewegungsgleichung
relevant, die den möglichen Bewegungsrichtungen des Pendels entsprechen. In diesen Gleichungen treten keine Zwangskräfte mehr auf, da die Zwangskraft stets in radiale Richtung wirkt. Die
Komponenten
und
verschwinden. Es bleiben also die letzten beiden Gleichungen von
(5.38), in die wir die entsprechenden Komponenten der äußeren Kraft einsetzen müssen. Für
ergibt sich
Aufgabe 5.17 Man zeige, dass der Drehimpuls des Pendelkörpers in Kugelkoordinaten durch
(5.43)
(5.48)
Das sind die Bewegungsgleichungen für das Pendel bei beliebig vorgegebenen äußeren Kräften.
Als spezielles Beispiel wollen wir im folgenden das Pendel im Schwerefeld der Erde betrachten,
sein. Wenn wir diese äußere Kraft in ihre Komponenten bezüglich
das heißt es soll
zerlegen, so finden wir
der Basis
gegeben ist. Man verifiziere anhand der Pendelgleichungen (5.43) f ür
tatsächlich eine Erhaltungsgröße ist.
, dass dies
Aufgabe 5.18 Für das Pendel im Schwerefeld ist der Drehimpuls nicht erhalten, weil die Schwerkraft nicht als Zentralkraft wirkt. Man zeige jedoch, dass die -Komponente des Drehimpulses
eine Erhaltungsgröße ist,
(5.49)
(5.44)
Setzen wir das in (5.43) ein, so kürzt sich die Masse des Pendelkörpers heraus. Das ist natürlich
wieder eine Konsequenz der Äquivalenz von Trägheit und Gewicht. Da die einzigen äußeren
Kräfte, die auf den Pendelkörper wirken, Gravitationskräfte sind, ist seine Bewegung von der
67
Kleine Auslenkungen
Diese Differenzialgleichungen kennen wir schon. Es sind die Bewegungsgleichungen für ein lineares Kraftgesetz. Das Pendel verhält sich wie ein Teilchen in einer durch die Koordinaten
und definierten Ebene, auf das eine linear mit dem Abstand wachsende Zentralkraft wirkt, die
es zum Ursprung zurück zieht.
Diese Bewegungsgleichungen haben wir schon einmal gelöst. Wenn die zweite Ableitung einer
Funktion proportional zur Funktion selbst ist, und der Proportionalitätsfaktor negativ ist, dann ist
die Lösung eine Linearkombination der Winkelfunktionen. Wie man leicht zeigt, ist die allgemeine Lösung des Gleichungssystems (5.55)
Die allgemeine Lösung der Pendelgleichungen (5.45) lässt sich nicht in geschlossener Form angeben. Wir können aber ein paar spezielle Lösungen beschreiben und dazu ein Näherungsverfahren
verwenden.
Das Pendel hat am Südpol, also bei
, eine stabile Ruhelage. Es hängt dort einfach senkrecht nach unten, ohne sich zu bewegen. Lenken wir es ein wenig aus dieser Ruhelage aus, so
wirkt eine Kraft, die es zum Südpol zurück zieht. Deshalb ist diese Ruhelage stabil. Am Nordpol
befindet sich eine instabile Ruhelage. Dort kann das Pendel auch ruhen, jedoch führt jede kleine
Auslenkung aus dieser Ruhelage dazu, dass eine abstoßende Kraft wirkt, die das Pendel noch
weiter auslenkt.
Wir wollen die Bewegungen des Pendels in der Nähe des Südpols, also der stabilen Ruhelage
ein, so dass die Ruhelage bei
beschreiben. Wir führen dazu eine neue Koordinate
liegt. Es gilt dann
(5.50)
mit
(5.56)
Die Parameter dieser Lösung werden durch die Anfangsbedingungen
(5.57)
und in den Pendelgleichungen (5.45) ändert sich ein Vorzeichen,
eindeutig festgelegt. Die Lösungen sind Ellipsen in der - -Ebene, deren Mittelpunkt im Koordinatenursprung liegt. Es sind periodische Bahnen, die mit der für das Pendel charakteristischen
Periode
(5.51)
(5.58)
durchlaufen werden. Solange die Auslenkungen des Pendels klein sind, schwingt es mit dieser
charakteristischen Periode. Für Kreisbahnen ergibt sich dieselbe Periode auch als Grenzwert der
Umlaufzeit für kleine Auslenkungen aus Aufgabe 5.15.
In Abbildung 5.6 sind ein paar typische Lösungen der Pendelgleichung dargestellt. Gezeigt ist
die Bahn des Pendels als Projektion auf die - -Ebene. Die Ringe sind Linien gleicher Auslenkung . Der Maßstab ist in den drei Abbildungen verschieden gewählt. Die durchgezogenen Ellipsen sind jeweils die Lösungen der linearisierten Pendelgleichung (5.52). Die gestrichelten Linien
sind die entsprechenden Lösungen der exakten Pendelgleichung (5.51) bei gleichen Anfangsbedingungen. Diese wurden numerisch ermittelt. Die Striche markieren jeweils Zeitintervalle, die
einer halben charakteristischen Periode (5.58) entsprechen.
Man sieht in Abbildung 5.6(a), dass die linearisierten Bewegungsgleichungen bei kleinen Auslenkungen von einigen Grad eine sehr gute Näherung liefern. Innerhalb von ein paar wenigen
Perioden weicht die genäherte Lösung kaum von der exakten ab. Bei mittleren Auslenkungen
ergeben sich bereits kleine Abweichungen. Zum einen sind die Bahnen keine geschlossenen Ellipsen mehr. Die Orte, an deren die maximale Auslenkung erreicht wird, beginnen zu wandern.
erreicht, sondern etAußerdem wird der nächste Umkehrpunkt nicht mehr nach einer Zeit
was später. Die exakte Schwingungsperiode hängt von der Auslenkung ab.
Für große Auslenkung, bei denen das Pendel bis fast zum Äquator schwingt, liefern die linearisierten Bewegungsgleichungen keine brauchbare Näherung mehr. In Abbildung 5.6(c) weicht die
tatsächlich Bahn des Pendels bereits nach einer Schwingung stark von der genäherten ab. Das ist
(5.52)
linearisierte
Pendelgleichungen
charakterische
Periode
Nun nehmen wir an, dass der Auslenkwinkel sehr klein ist. Das Pendel soll nur sehr wenig aus
seiner Ruhelage ausgelenkt werden. Wir führen dann eine lineare N äherung durch, bei der wir
oder höher sind, vernachlässigen. Wir setzen also
alle Terme, die von der Ordnung
und
. Aus den Pendelgleichungen verschwinden dann alle Winkelfunktionen, und sie
werden in linear,
Diese Differenzialgleichungen können wir lösen. Wir ersetzen dazu die Variablen
zwei andere Variable und , die wie folgt definiert sind,
und
durch
(5.53)
Dies sind die - und -Koordinaten des Ortes (5.20), an dem sich das Pendel befindet. Berechnen
wir die Ableitungen von (5.53), so finden wir
(5.54)
In den Klammern stehen genau die Ausdrücke, die auch auf der rechten Seite der Bewegungsgleichung (5.52) stehen. Daher gelten für die neuen Variablen näherungsweise die Bewegungsgleichungen
(5.55)
68
dass der Abstand zwischen ihnen fixiert ist,
replacements
(5.59)
(b)
(a)
Die Hantel ist dem Pendel sehr ähnlich. Der einzige Unterschied ist, dass beim Pendel das zweite
Teilchen irgendwo befestigt ist, sich also nicht bewegen kann.
Die Hantel ist als mechanisches System deshalb von besonderem Interesse, weil sie das einfachste Modell für einem starren Körper darstellt. Im Prinzip können wir uns einen starren Körper
immer als ein System von vielen Teilchen vorstellen, deren relative Abstände durch Zwangskräfte
konstant gehalten werden. Ein solcher Körper kann sich in alle Richtungen bewegen und drehen,
aber er kann nicht verformt werden.
Wir nehmen auch hier wieder an, dass die Stange im Vergleich zu den beiden an den Enden
befestigten Körpern sehr leicht ist, so dass wir deren Masse vernachlässigen können. Die Bewegungsgleichungen können wir dann wie folgt schreiben,
(d)
(c)
Abbildung 5.6: Die Lösungen der linearisierten Pendelgleichungen stimmen für kleine Auslenkungen (a) sehr gut mit den numerischen Lösungen der exakten Pendelgleichungen überein.
Für mittlere Auslenkungen (b) ergeben sich kleine Abweichungen. Für große Auslenkungen (c)
weicht die Bahn bereits nach einer halben Schwingung sehr stark von der Näherung ab.
(5.60)
und
äußere Kräfte sind, die auf die beiden Teilchen einwirken, und
die
wobei
Zwangskraft ist, die durch die Stange aufgebracht wird.
Da auch hier das Prinzip “actio reactio” gilt, müssen die Zwangskräfte, die auf die beiden
Teilchen wirken, entgegengesetzt gleich sein. Außerdem wirken wie beim Pendel die Zwangskräfte nur in Richtung der Stange. Die Zwangskraft ist also immer proportional zum Abstandsvektor,
(5.61)
natürlich zu erwarten, denn wir haben ja angenommen, dass
ist. Das ist für
sicher nicht mehr der Fall. Ein Pendel schwingt also nur dann mit seiner charakteristischen Periode
, wenn die Auslenkung klein ist.
Aufgabe 5.19 Wie sind die Anfangsbedingungen (5.57) zu w ählen, damit sich eine Kreisbahn
ergibt? Man vergleiche diese Kreisbahnen mit denen aus Aufgabe 5.15. Liefert die lineare N äherung eine zu große oder eine zu kleine Umlaufzeit ?
Was die äußeren Kräfte betrifft, so wollen wir zunächst nur den einfachen Fall betrachten, dass
sie nicht vorhanden sind.
Es ist dann nicht sehr schwierig, die Bewegungsgleichungen vollständig zu lösen. Zuerst zerlegen wir die Bewegung wie üblich in eine Schwerpunkt- und Relativbewegung. Wir setzen
Aufgabe 5.20 Neben den Kreisbahnen gibt es noch eine andere Klasse von exakt periodischen
Bahnen. Es sind diejenigen, bei denen
ist, das Pendel also in einer Ebene schwingt.
, wie die linearisierte BeweWie lautet in diesem Fall die exakte Bewegungsgleichung für
gungsgleichung? Es sei die Periode, die sich aus der exakten Bewegungsgleichung ergibt, und
die von der Auslenkung, also der Amplitude der Schwingung abh ängt. Ist größer oder kleiner
als die charakteristische Periode , die sich aus der linearisierten Bewegungsgleichung ergibt?
(5.62)
Da es sich um ein abgeschlossenen System handelt, ergibt sich natürlich eine geradlinige und
gleichförmige Bewegung des Schwerpunktes,
Mehrteilchensysteme
(5.63)
Zwangskräfte treten nicht nur als äußere Kräfte auf, die auf ein einzelnes Teilchen einwirken, sondern auch als Wechselwirkungen zwischen verschiedenen Teilchen. Ein einfaches Zwei-TeilchenSystem, bei dem die Wechselwirkung zwischen den Teilchen durch eine Zwangskraft erzeugt
wird, ist die in Abbildung 5.3(b) dargestellte Hantel. Sie besteht aus zwei Teilchen mit Massen
und
, die sich an den Orten und befinden. Sie sind durch eine Stange verbunden, so
Für die Relativbewegung bekommen wir die folgende Bewegungsgleichung, zu der wir noch die
Zwangsbedingung (5.59) hinzunehmen müssen,
69
(5.64)
(c)
(d)
zur Zeit
und die Ausrichtung
des Schwerpunktes, sowie die Winkelgeschwindigkeit
gegeben.
Aufgabe 5.23 Wieviele Freiheitsgrade hat die Hantel?
Aufgabe 5.24 In Abbildung 5.7(a) ist ein System mit zwei Teilchen darstellt, das nur einen Freiheitgrad besitzt. Ein Körper der Masse
gleitet auf einem Tisch. Er spürt dabei ein Reibungskraft, die linear mit der Geschwindigkeit anwächst. Die Reibungskonstante sei . Ein Seil verbindet diesen über eine Rolle mit einem anderen Körper der Masse
. Dieser hängt senkrecht nach
unten im Gravitationsfeld der Erde. Beide Körper können sich nur auf die Rolle zu oder von ihr
weg bewegen.
Die Lage der Körper im Raum wird durch eine einzige Variable festlegen, zum Beispiel die L änge
des nach unten hängenden Seiles. Man bestimme alle Kräfte, die auf die Körper wirken, und eliminiere die Zwangskräfte aus den Bewegungsgleichungen, so dass nur noch ein Bewegungsgleiübrig bleibt. Man finde die eindeutige Lösung zu den Anfangsbedingung
chung für
und
.
(b)
(a)
Abbildung 5.7: Beispiele für Systeme von mehreren Teilchen mit Zwangsbedingungen.
Hier ist
wieder die reduzierte Masse. Diese Bewegungsgleichung einschließlich der Zwangsbedingung kennen wir schon. Es ist die Bewegungsgleichung (5.11) eines
Pendels, auf das keine äußere Kraft wirkt. Die Hantel verhält sich also, was die Relativbewegung
der beiden Körper betrifft, wie ein freies Pendel.
Die Lösung dieser Bewegungsgleichungen hatten wir in bereits in (5.17) gefunden. Die Parameter der Lösung waren eine Winkelgeschwindigkeit und ein dazu senkrecht stehender Einheitsvektor ,
(5.65)
Für die Hantel haben diese Parameter die folgende Bedeutung. Der Vektor bezeichnet wie beim
freien Pendel die Ausrichtung der Stange zur Zeit
. Der Vektor legt die Richtung der
Rotationsachse fest, und sein Betrag bestimmt die Kreisfrequenz, mit der die Rotation erfolgt.
Die Hantel rotiert in einer Ebene, die zu senkrecht liegt, während sie sich als ganzes gemäß
(5.63) gleichförmig durch den Raum bewegt.
Dies ist die typische Bewegung eines starren Körpers. Sofern auf ihn keine äußeren Kräfte wirken, bewegt sich sein Schwerpunkt geradlinig und gleichförmig, während der Körper mit einer
konstanten Winkelgeschwindigkeit um eine feste Achse rotiert. Für die Hantel ist dieser Bewegungsablauf in Abbildung 5.3(b) angedeutet.
mit
Aufgabe 5.25 Ein etwas komplizierteres Zwei-Teilchen-System mit Zwangskr äften ist in Abbildung 5.7(b) dargestellt. Zwei Pendelkörper mit gleichen Massen sind über zwei Rollen so mitund
der beiden Pendel zwar veränderlich sind, die
einander verbunden, dass die Längen
Summe der beiden Längen aber stets konstant bleibt. Der Einfachheit halber sei außerdem angenommen, dass sich die Pendelkörper nur in einer Ebene bewegen können. Wieviel Freiheitsgrade
besitzt dieses System?
Als Anfangsbedingung sei folgende Situation gegeben. Beide K örper befinden sich in Ruhe. Der
sei gleich Null. Der
erste Körper hängt senkrecht nach unten, das heißt der Auslenkwinkel
Auslenkwinkel
des zweiten Körpers sei ungleich Null. Überlässt man das System in dieser
Situation sich selbst, so beginnt der zweite Körper natürlich zu pendeln. Was tut der erste Körper?
6 Schwingungen
Das mathematische Pendel gehört zu einer speziellen Klasse von mechanischen Systemen, die
eine bestimmte gemeinsame Eigenschaft haben. Sie besitzen eine Ruhelage, also einen Zustand,
in dem sich alle beteiligten Körper in Ruhe befinden, und sie führen Schwingungen um diese
Ruhelage aus, wenn sie aus der Ruhelage entfernt und sich selbst überlassen werden.
Das einfachste System dieser Art ist der harmonische Oszillator. Er lässt sich nicht nur als mechanisches System realisieren, sondern auch als elektrodynamisches oder quantenmechanisches
System. In der modernen Theorie der Elementarteilchen, der Quantenfeldtheorie, stellt man sich
sogar die Teilchen selbst als harmonische Oszillatoren vor. Wir wollen deshalb dieses im Prinzip
sehr einfache System etwas ausführlicher diskutieren. Es wird uns in fast allen Teilbereichen der
Physik, in der Schwingungen eine Rolle spielen, als Standardbeispiel wieder begegnen.
Aufgabe 5.21 Man berechne für die durch (5.63) und (5.65) definierte Bahn der Hantel den
Gesamtdrehimpuls , den Schwerpunktdrehimpuls und den inneren Drehimpuls .
Aufgabe 5.22 Die Hantel befindet sich nun im Schwerefeld der Erde, das heißt es sollen auf
die beiden Teilchen zusätzlich zu den Zwangskräften die äußeren Kräfte
und
wirken. Man bestimme für diesen Fall die allgemeine Lösung der Beweund die Geschwindigkeit
gungsgleichungen. Als Anfangsbedingung sei wieder der Ort
70
Der harmonische Oszillator ist außerdem eines der wenigen physikalischen Systeme, deren
Bewegungsgleichungen sich exakt lösen lassen. Für andere schwingende Systeme, deren Bewegungsgleichungen sich nicht exakt lösen lassen, dient der harmonische Oszillator alsPSfrag
Basis replacements
für
verschiedene Näherungsverfahren. Am Beispiel des mathematischen Pendels haben wir das im
(a)
letzten Kapitel bereits gesehen. Außerdem lassen sich aus dem Vergleich eines schwindenden
(b)
Systems mit einem harmonischen Oszillator oft qualitative Aussagen über dessen mögliche Be(c)
wegungen ableiten.
(d)
Der harmonische Oszillator
Ein sehr einfaches schwingendes mechanisches System ist in Abbildung 6.1 dargestellt. An einem
Körper, der sich aufgrund von Zwangsbedingungen nur entlang der -Achse bewegen kann, ist
eine Feder befestigt, deren anderes Ende an einem raumfesten Punkt fixiert ist. Die wesentliche
Eigenschaft einer Feder ist, dass die Kraft, die sie auf ihre beiden Enden ausübt, proportional
zu ihrer Auslenkung ist. Die Auslenkung ist die Differenz zwischen der tatsächlichen Länge der
Feder und ihrer Ruhelänge, die sie im entspannten Zustand annimmt.
Wir wählen das Koordinatensystem so, dass sich der Körper genau dann im Ursprung befindet,
, wobei gleichzeitig die
wenn die Feder entspannt ist. Für seinen Ortsvektor gilt also
Auslenkung der Feder ist. Aus den allgemeinen Überlegungen über Zwangskräfte wissen wir,
dass wir die Bewegungsgleichung für ein System mit nur einem Freiheitsgrad in der vereinfachten Form (5.8) schreiben können, wenn der dafür verwendete Kurvenparameter gleichzeitig die
geometrische Länge der Kurve angibt, auf der sich der Körper bewegt. Das ist für die Ortskoordinate natürlich der Fall. Sie ist ja gerade durch den Abstand eines Punktes auf der -Achse vom
Ursprung definiert.
Die effektive Kraft , die wir einsetzen müssen, ist die -Komponente der von außen auf den
Körper einwirkenden Kraft. Das soll die Federkraft sein, die proportional zur Auslenkung und ihr
entgegen gerichtet ist. Wir bekommen also die einfache Bewegungsgleichung
Abbildung 6.1: Der harmonische Oszillator als mechanisches System. Dargestellt ist ein typischer
Bewegungsablauf, wobei die Zeit von links nach rechts läuft. Der Körper wird aus der Ruhelage
ausgelenkt und anschließend sich selbst überlassen.
Ein dynamisches System, das einer solchen Bewegungsgleichung genügt, bezeichnet man allgemein als harmonischen Oszillator, unabhängig davon, ob es sich um ein mechanisches System
oder um ein System anderer Art handelt. Entscheidend ist, dass die rücktreibende Kraft, also die
zweite Ableitung des Zustands, proportional zur Auslenkung, also zur Abweichung es Zustands
vom Ruhezustand des Systems ist.
Ein harmonischer Oszillator ist ein schwingendes System, bei dem die rücktriebende
Kraft eine lineare Funktion der Auslenkung ist.
Aufgabe 6.1 Man zeige, dass sich dasselbe Kraftgesetz auch dann ergibt, wenn auf den K örper
zusätzlich noch die Schwerkraft wirkt, und zwar unabhängig davon, ob sich der Körper im Schwerefeld in horizontaler, vertikaler oder in irgendeiner anderen Richtung bewegen kann. Man muss
nur das Koordinatensystem entsprechend anpassen.
(6.1)
wobei die Masse des schwingenden Körpers ist und die Federkonstante. Sie hat die Dimension
N m
kg s . Die dreidimensionale Version dieses Kraftgesetzes
kennen wir schon aus Kapitel 3, wo wir ein lineares Kraftgesetz als Beispiel für die Wechselwirkung von zwei frei beweglichen Teilchen untersucht haben.
Dort hatten wir auch schon die allgemeine Lösung einer solchen Bewegungsgleichung gefunden, die sich als Linearkombination von Sinus- und Kosinusfunktionen schreiben ließ. Wir wollen
diese Lösung hier noch einmal reproduzieren, wobei wir ein wenig systematischer vorgehen, um
das Ergebnis hinterher zu verallgemeinern. Wir schreiben die Bewegungsgleichung zunächst in
der Standardform für eine lineare Differenzialgleichung,
Lineare Differenzialgleichungen
Die Bewegungsgleichung (6.2) ist eine lineare Differenzialgleichung für die gesuchte Funktion
. Solche Differenzialgleichungen lassen sich mit einer einfachen und sehr allgemeinen Methode lösen, die wir kurz herleiten wollen. Jedoch müssen wir dazu einen kleinen Umweg machen
und zunächst komplexe Funktionen von reellen Variablen betrachten.
Eine allgemeine lineare Differenzialgleichung -ter Ordnung für eine komplexe Funktion
einer reellen Variablen hat die Form
71
lineare
Differenzialgleichung
(6.2)
harmonischer
Oszillator
(6.3)
, und ihre jeweiligen Vielfach-
, deren Anzahl mit
lässt. Wir bezeichnen die Nullstellen mit
heiten mit . Dann ist
Wie üblich bezeichnet
die -te Ableitung der Funktion
. Die Koeffizienten
sind beliebige komplexe Zahlen, wobei wir ohne Beschränkung der Allgemeinheit
annehmen können.
Der Schlüssel zur Lösung einer linearen Differenzialgleichung liegt in einer speziellen Eigenschaft der Lösungsmenge. Unabhängig davon, ob die Koeffizienten
reell oder komplex sind,
reell oder komplex ist, bilden die Lösungen einen Vektorbzw. ob die gesuchte Funktion
raum. Der Beweis ist ganz einfach. Mit jeder Funktion
bzw.
und jedem
bzw.
ist offenbar auch die Funktion
eine Lösung der Differenzialgleichung. Und
mit je zwei Funktionen und ist auch die Funktion
eine Lösung. Damit sind skalare
Multiplikation und Vektoraddition erklärt, und es ist auch mehr oder weniger offensichtlich, dass
die Vektorraumaxiome erfüllt sind.
Wir können sogar etwas über die Dimension des Lösungsraumes aussagen, und auch diese
Aussage gilt wieder unabhängig davon, ob wir reelle oder komplexe Funktionen betrachten. Um
die Lösung einer Differenzialgleichung -ter Ordnung eindeutig zu bestimmen, müssen wir
Anfangsbedingungen festlegen. Zum Beispiel können wir den Funktionswert
und die ersten
Ableitungen
an irgendeiner Stelle
vorgeben.
Die -te Ableitung der Funktion und damit ihr Verlauf ist dann durch die Differenzialgleichung
festgelegt. Zu jeder möglichen Wahl dieser Anfangsbedingungen gehört also genau eine Lösung
der Differenzialgleichung.
Das sind reelle bzw. komplexe Zahlen, die wir unabhängig voneinander wählen können,
also ist der Lösungsraum ein -dimensionaler komplexer Vektorraum. Der formale Beweis dieser
Aussage, den wir hier nicht führen werden, beruht wieder auf dem Satz von Cauchy, Picard und
Lindelöf. Die Aussage ist völlig analog zur Kernaussage über dynamische System, wonach die
Zeiteintwicklung eines solchen Systems eindeutig durch die Anfangsbedingungen festgelegt ist.
Um die allgemeine Lösung der Differenzialgleichung (6.3) zu bestimmen, genügt es, eine Basis des Lösungsraumes anzugeben. Beschränken wir uns zunächst auf komplexe Funktionen, so
. Jede Lösung
besteht eine solche Basis aus genau linear unabhängigen Funktionen
lässt sich dann eindeutig als Linearkombination der Basisfunktionen darstellen. Um eine solche
Basis zu finden, müssen wir einen geeigneten Ansatz machen. Es bietet sich an, eine Exponentialfunktion zu wählen,
(6.6)
Das ist der Grund, warum wir zunächst komplexe Funktionen betrachten müssen. Über dem
Körper lassen sich Polynome nicht immer vollständig faktorisieren, da im allgemeinen nicht
alle Nullstellen eines reellen Polynoms reell sein müssen. Ein beliebiges komplexes Polynom ten Grades hat aber stets Nullstellen, wenn wir sie mit ihren jeweiligen Vielfachheiten zählen.
Wenn alle Nullstellen einfach sind, also alle
sind, dann gibt es
verschiedene
Nullstellen. In diesem Fall haben wir
linear unabhängige Funktionen
gefunden, die die Differenzialgleichung lösen. Sie bilden die gesuchte Basis des Lösungsraumes. Die
allgemeine Lösung ist somit eine Linearkombination von Exponentialfunktionen.
Wenn es Nullstellen zweiter oder höherer Ordnung gibt, also nicht alle gleich eins sind, dann
ist ihre Anzahl kleiner als der Grad des charakteristischen Polynoms. In diesem Fall bilden
die Funktionen
zwar noch immer einen linear unabhängigen Satz von Lösungen,
aber keinen vollständigen Satz und damit keine Basis des -dimensionalen Lösungsraumes. Es
muss also noch andere Lösungen geben.
-fache Nullstelle des charakteristischen Polynoms. Man zeige,
eine
Aufgabe 6.2 Es sei
dass dann die Funktionen
für
(6.7)
linear unabhängige Lösungen der Differenzialgleichung (6.3) sind.
des charakteristischen Polynoms nicht nur eine,
Es gibt also zu jeder mehrfachen Nullstelle
der Differenzialgleichung, wie es der Vielfachheit der Nullsondern so viele Lösungen
stelle
entspricht. Insgesamt finden wir auf diese Weise immer
linear unabhängige Lösungen. Diese bilden die gesuchte Basis des Lösungsraumes, und die allgemeine Lösung ist eine
Linearkombination dieser Basisfunktionen,
(6.4)
(6.8)
Setzen wir diesen Ansatz in (6.3) ein, so ergibt sich
Die Koeffizienten
, von denen es genau Stück gibt, können frei gewählt werden. Sie sind
an die jeweiligen Anfangsbedingungen anzupassen.
charakteristisches
Polynom
Die Lösungsmenge einer linearen Differenzialgleichung -ter Ordnung ist ein dimensionaler Vektorraum. Eine Basis dieses Raumes ist durch Exponentialfunktionen gegeben, die sich aus den Nullstellen des charakteristischen Polynoms bestimmen lassen.
wird charakteristisches Polynom der Differenzialgleichung (6.3) genannt. Es
-ten Grades in , das sich über dem Körper stets vollständig faktorisieren
Die Funktion
ist ein Polynom
(6.5)
72
Jetzt gibt es nur noch ein Problem. Wir kennen jetzt die allgemeine Lösung einer komplexen Differenzialgleichung. Die Lösungsmenge ist ein -dimensionaler Vektorraum über , von dem wir
eine Basis explizit angeben können. Aber eigentlich wollten wir eine reelle Differenzialgleichung
soll reell sein.
lösen. Die Koeffizienten sind reell, und auch die gesuchte Funktion
Natürlich können wir jede reellwertige Funktion
auch als eine komplexwertige
auffassen. Die reellen Lösungen sind daher als Teilmenge in den komplexen
Funktion
Lösungen (6.8) enthalten, und sie bilden einen -dimensionalen reellen Vektorraum. Andererseits wissen wir, dass wir eine reelle Lösung der Differenzialgleichung bekommen, wenn wir
reelle Anfangsbedingungen vorgeben. Denn unabhängig davon, mit welcher Technik wir eine
Differenzialgleichung lösen, gilt ja der Satz, dass die Lösung eindeutig durch die Anfangsbedingungen festgelegt ist.
Um zu einem gegebenen Satz von Anfangsbedingungen die richtige Lösung zu finden, müssen
wir also nur die Koeffizienten
entsprechend bestimmen, und es sollte sich automatisch eine
reelle Lösung ergeben, wenn die Anfangsbedingungen reell sind. Das lässt sich sogar leicht ganz
allgemein beweisen.
einfacher Spezialfall einer linear Differentialgleichung. Das charakteristische Polynom ist
(6.11)
mit
Es besitzt zwei einfache, zueinander komplexe konjugierte Nullstellen
. Die Konstante
hat die Dimension einer inversen Zeit, also einer Frequenz,
s.
Aus der Formel (6.8) können wir unmittelbar die allgemeine Lösung der Bewegungsgleichung
ablesen. Sie lautet
(6.12)
Als Parameter der Lösung haben wir hier zunächst zwei komplexe Zahlen
eingeführt.
Dann haben wir die Exponentialfunktionen durch Winkelfunktionen ausgedrückt und anschließend zwei neue Parameter
und
eingeführt. Es treten dann keine expliziten
Faktoren mehr auf, so dass wir unmittelbar ablesen können, für welche Werte der Parameter die
Lösung reell ist. Das ist genau dann der Fall, wenn und reell sind.
Damit kennen wir die allgemeine Lösung der Bewegungsgleichung. Und es ist auch nicht
schwierig, die Koeffizienten und so zu bestimmen, dass bestimmte Anfangsbedingungen
erfüllt sind. Geben wir zum Beispiel den Ort
und die Geschwindigkeit
zur Zeit
vor, so finden wir
Aufgabe 6.3 Zusätzlich zur Differenzialgleichung (6.3) sei ein Satz von Anfangsbedingungen
,
, ,
vorgegeben. Man zeige, dass die Koeffizienten
in (6.8) dadurch eindeutig festgelegt sind und somit genau eine L ösung der Differenzialgleichung existiert, die den gegebenen Anfangsbedingungen gen ügt.
Aufgabe 6.4 Man zeige, dass die Funktion
reell ist, wenn sowohl die Koeffizienten
der
Differenzialgleichung als auch die in Aufgabe 6.3 definierten Anfangsbedingungen
für
reell sind.
(6.13)
Aufgabe 6.5 Die Lösungen der folgenden Differenzialgleichungen lassen sich leicht erraten.
(6.9)
Offenbar führt der schwingende Körper eine periodische Bewegung aus, deren Periode allein von
den Parametern und , nicht jedoch von den Anfangsbedingungen abhängt. Ein paar typische
Bewegungsabläufe sind in Abbildung 6.2 dargestellt. Es gilt stets
Man bestimme jeweils das charakteristische Polynom, seine Nullstellen, und überprüfe die allgemeine Formel (6.8).
mit
(6.14)
Die Zeit
wird Eigenperiode, ihr Kehrwert
Eigenfrequenz des harmonischen Oszillators genannt. Die Größe
heißt Kreisfrequenz. Da die Frequenz fast immer im
Argument von Sinus- und Kosinus-Funktionen auftritt, ist es meist einfacher, die Kreisfrequenz
anzugeben, da dann keine expliziten Faktoren
auftreten. Oft wird auch einfach die Größe
als Eigenfrequenz bezeichnet.
Die wesentliche Eigenschaft eines harmonischen Oszillators ist demnach, dass seine Bewegung
abläuft, die sich in diesem Fall aus den beiden Parametern
stets mit derselben Kreisfrequenz
und des mechanischen Systems bestimmt.
der folgenden Differenzialgleichungen mit
Aufgabe 6.6 Man bestimme die Lösungen
Anfangsbedingungen:
(6.10)
Nach dieser kurzen Einführung in die Methoden zur Lösung von linearen Differenzialgleichungen
kehren wir zurück zum harmonischen Oszillator. Seine Bewegungsgleichung (6.2) ist ein sehr
Die Eigenfrequenz
Ein harmonischer Oszillator schwingt, unabhängig von den Anfangsbedingungen,
stets mit derselben charakteristischen Kreisfrequenz .
73
(a)
(b)
(c)
(d)
replacements
, zum Zeitpunkt
am Ort
. Ist die Lösung immer eindeutig? Gibt es
befindet sich der Körper am Ort
. Man bestimme daraus die Funktion
immer eine Lösung?
Zeitpunkt
Der schwach gedämpfte Oszillator
Bis jetzt sind wir von den Idealvorstellung ausgegangen, dass der Körper reibungsfrei schwingt,
das heißt außer der rücktreibende Kraft der Feder wirkt keine weitere Kraft. Für ein mechanisches
System ist das natürlich unrealistisch. Es wirkt auch eine Reibungskraft auf den Körper ein, sei es
direkt, zum Beispiel durch den Luftwiderstand, oder indirekt durch die innere Reibung der Feder.
Wie üblich machen wir für die Reibungskraft den Ansatz einer zur Geschwindigkeit proportionalen und ihr entgegengerichteten Kraft, wobei der Proportionalitätsfaktor die Reibungskonstante
ist. Die Bewegungsgleichung (6.1) lautet dann
Abbildung 6.2: Typische Lösungen
der Bewegungsgleichung eines harmonischen Oszilla. Es sind jeweils der Anfangsort
durch
tors für verschiedene Anfangsbedingungen bei
einen Punkt und die Anfangsgeschwindigkeit
durch einen Pfeil markiert. Alle Bewegungen
haben dieselbe Periode .
(6.18)
Die daraus resultierende Bewegungsgleichung ist noch immer linear in der gesuchten Funktion
,
(6.19)
gedämpfter
Oszillator
Ein dynamisches System dieser Art bezeichnet man als gedämpften harmonischen Oszillator. Mit
den Abkürzungen
Aufgabe 6.7 Es seien als Anfangsbedingungen der Ort
und die Geschwindigkeit zu einem
Zeitpunkt
vorgegeben. Man zeige, dass sich die Lösung der Bewegungsgleichung dann wie
folgt schreiben lässt,
(6.20)
vereinfacht sich seine Bewegungsgleichung zu
(6.15)
(6.21)
Aufgabe 6.8 Die allgemeine Lösung (6.12) der Bewegungsgleichung des harmonischen Oszillakann man
tors lässt sich auch auf andere Weise parametrisieren. Statt der Parameter
zwei Parameter
und
angeben, so dass
Die Größe
ist wieder die Kreisfrequenz des ungedämpften Oszillators, und ist ein Maß
für die Stärke der Dämpfung. Beide Größen haben die Dimension einer inversen Zeit,
s.
Um die Bewegungsgleichung mit der gerade entwickelten Methode zu lösen, betrachten wir
wieder das charakteristische Polynom und dessen Nullstellen,
andererseits die Beziehungen
und
Man zeige, dass zwischen und einerseits und
(6.16)
(6.22)
(6.17)
bzw.
Offenbar müssen wir hier eine Fallunterscheidung machen. Je nach dem Vorzeichen des Ausdrucks unter der Wurzel hat das charakteristische Polynom entweder zwei konjugiert komplexe
Nullstellen, eine doppelte reelle Nullstelle, oder zwei reelle Nullstellen. Wir betrachten zuerst den
Fall kleiner Reibung, also
gelten. Die Parameter und heißen Amplitude und Phase der Schwingung. Welche physikalische Dimension, und welche anschauliche Bedeutung haben diese Gr ößen?
Aufgabe 6.9 Als ‘Anfangsbedingungen’ können statt des Ortes und der Geschwindigkeit zu einem festen Zeitpunkt auch andere Vorgaben gemacht werden, zum Beispiel die folgende. Zum
74
(6.23)
In diesem Fall liegen zwei komplexe Nullstellen vor, nämlich
PSfrag
replacements
(6.24)
mit
(a)
(b)
(c)
(d)
Beides sind einfache Nullstellen, so dass sich aus der Formel (6.8) die folgende allgemeine
Lösung der Bewegungsgleichung ergibt,
(6.25)
Auch hier haben wir wieder die komplexen Exponentialfunktionen durch Winkelfunktionen ausgedrückt und anschließend
und
gesetzt, um die Faktoren zu eliminieren.
Offenbar unterscheidet sich die Lösung (6.25) von der Lösung (6.12) des reibungsfreien Oszillators durch den Vorfaktor
. Die Amplitude der Schwingung klingt exponentiell mit der
Zeit ab, das heißt die Schwingung ist gedämpft. Außerdem ist die Kreisfrequenz der Schwinim reibungsfreien Fall. Der gedämpfte Oszillator schwingt
gung kleiner als die Kreisfrequenz
langsamer als der ungedämpfte.
Abbildung 6.3: Typische Lösungen
der Bewegungsgleichung eines schwach gedämpften
harmonischen Oszillators. Die Anfangsbedingungen sind wie in Abbildung 6.2 gewählt, jedoch
bewirkt die Reibung jetzt ein exponentielles Abklingen der Schwingung auf der charakteristischen Zeitskala und gleichzeitig eine Dehnung der Schwingungsperiode .
Ein schwach gedämpfter harmonischer Oszillator schwingt mit einer kleineren Kreisfrequenz als der entsprechende ungedämpfte Oszillator, und seine Amplitude klingt
exponentiell mit der Zeit ab.
Der stark gedämpfte Oszillator
Nun betrachten wir den Fall starker Dämpfung, das heißt die Reibungskonstante soll über dem
kritischen Wert liegen,
(6.27)
Aufgabe 6.10 Man bestätige durch explizites Nachrechnen, dass die Funktionen (6.25) f ür beliebige Konstanten
Lösungen der Bewegungsgleichung (6.21) sind.
(6.29)
In Abbildung 6.3 sind die typischen Bewegungen eines gedämpften harmonischen Oszillators
dargestellt. Es treten dabei zwei charakteristische Zeitkonstanten auf, nämlich die Periode
der Schwingung, und die Abklingzeit
. Das ist die Zeit, in der die Amplitude der
Schwingung auf
der ursprünglichen Amplitude abgefallen ist.
Für kleine Reibungskonstanten ist die Abklingzeit sehr groß und die Periode weicht
nur wenig von der Periode
des ungedämpften Oszillators ab. Mit zunehmender Reibung wird
die Abklingzeit kleiner, das heißt die Amplitude fällt schneller ab, während gleichzeitig die
Schwingungsperiode größer wird. Wenn wir uns der oberen Grenze in (6.23) nähern, also
für
bzw.
, dann geht die Kreisfrequenz sogar gegen Null, das heißt die
Schwingungsperiode geht gegen unendlich.
In diesem Fall besitzt das charakteristische Polynom (6.22) zwei negative reelle Nullstellen,
nämlich
mit
(6.28)
Die allgemeine Lösung der Bewegungsgleichung ist nun eine Linearkombination von zwei exponentiell fallenden Funktionen,
Der Oszillator führt jetzt gar keine Schwingungen mehr aus, sondern fällt nur noch exponentiell in
seine Ruhelage zurück. Es treten dabei zwei Zeitkonstanten
und
auf. Die größere der beiden, also , bestimmt das Verhalten der Funktion
für große Zeiten.
Die charakteristische Abklingzeit, in der die Amplitude auf
der ursprünglichen Amplitude
gegeben.
abgefallen ist, ist durch
Der typische Bewegungsablauf eines stark gedämpften Oszillators ist in Abbildung 6.4 dargestellt. Die Funktion
hat höchstens eine Nullstelle, das heißt der der Körper schwingt
höchstens einmal durch die Ruhelage, und nähert sich dieser dann exponentiell abfallend an.
Aufgabe 6.11 Es seien wieder als Anfangsbedingungen der Ort
und die Geschwindigkeit
zum Zeitpunkt
vorgegeben. Man zeige, dass die Schwingung des ged ämpften harmonischen
Oszillators dann durch die folgende Funktion beschrieben wird,
75
(6.26)
(c)
(d)
replacements
(a)
(b)
(c)
(d)
Abbildung 6.4: Typische Lösungen
der Bewegungsgleichung eines stark gedämpften harmonischen Oszillators. Die Anfangsbedingungen sind wieder die gleichen wie in den Abbildungen 6.2 und 6.3. Der Oszillator fällt jetzt, ohne zu schwingen, in die Ruhelage zurück. Die
Abklingzeiten
bestimmen sich aus den Exponenten in (6.29).
(b)
(a)
Abbildung 6.5: Das Verhalten eines harmonischen Oszillators bei verschiedenen Reibungskonstanten . Im Diagramm (a) sind die Kreisfrequenz und Dämpfungskonstanten bzw.
dargestellt, die jeweils die Dimension einer inversen Zeit haben. Im Diagramm (b) sind die entsprechenden charakteristischen Zeitkonstanten dargestellt, also die Schwingungsperiode und
die Abklingzeiten bzw. .
Ein stark gedämpfter harmonischer Oszillator fällt innerhalb einer charakteristischen
Abklingzeit
exponentiell in die Ruhelage zurück, wobei er diese höchstens einmal
durchläuft.
Der aperiodische Grenzfall
Das charakteristische Polynom (6.22) hat in diesem Fall eine doppelte reelle Nullstelle bei
. Aus der allgemeinen Formel (6.8) ergibt sich die sehr einfache Lösung
(6.30)
und
Betrachten wir jetzt noch den Grenzfall, in dem die Reibungskonstante gerade den kritischen Wert
hat,
(6.33)
Aufgabe 6.12 Durch einen Trick lässt sich die Lösung (6.29) auf eine ähnliche Form bringen wie
(6.25). Benutzen wir die Definitionen
(6.34)
, so ist (6.29) dasselbe wie
und
der Hyperbelfunktionen, und setzen diesmal
Das Ergebnis von Aufgabe 6.11 lässt sich dann unmittelbar auf den Fall starker Dämpfung übertragen. Man zeige, dass die üblichen Anfangsbedingungen für Ort und Geschwindigkeit zur Zeit
jetzt auf die folgende eindeutig bestimmte Lösung führen,
wobei und jetzt zwei reelle Parameter sind. Qualitativ ergibt sich ein ähnliches Bild wie
beim stark gedämpften Oszillator in Abbildung 6.4. Es findet keine Schwingung statt, sondern
der Oszillator fällt nur noch in die Ruhelage zurück, wobei er diese höchstens einmal durchläuft.
gibt, die
Der einzige Unterschied ist, dass es jetzt nur noch eine Zeitkonstante
den exponentiellen Abfall beschreibt. Die Abklingzeit ist gerade die inverse Kreisfrequenz des
ungedämpften Oszillators.
In Abbildung 6.5 ist noch einmal das Verhalten eines harmonischen Oszillators bei unterschiedlichen Werten der Parameter dargestellt. Die Masse und die Federkonstante , und somit auch
die Kreisfrequenz
des ungedämpften Oszillators sind fest gewählt. Die Reibungskonstante
ist variabel und nimmt jeweils von links nach rechts zu. Ist kleiner als der kritische Wert
(6.31)
76
(6.32)
, so schwingt der Oszillator mit einer Kreisfrequenz , und seine Amplitude fällt
mit dem Exponenten
ab. Mit zunehmender Reibung wird die Kreisfrequenz kleiner und die
größer und die Abklingzeit
Dämpfung größer. Dadurch wird die Periode
kleiner.
Beim kritischen Wert
geht die Kreisfrequenz gegen Null und die Schwingungsperiode gegen unendlich. Jenseits des kritischen Wertes, also bei starker Dämpfung, tritt keine
Schwingung mehr auf. Statt dessen gibt es zwei Dämpfungskonstanten
und
, bzw. zwei
Zeitkonstanten
und . Sie bestimmen das Abklingverhalten der Auslenkung als Funktion der
Zeit. Die größere der beiden Zeitkonstanten bestimmt das Verhalten des Oszillators für große Zeiten, das heißt sie bestimmt letztlich, wie schnell der Oszillator wieder in seine Ruhelage zurück
fällt.
Leider ist diese Differenzialgleichung nicht mehr von der Form (6.3). Die linke Seite ist zwar li, aber auf der rechten Seite steht nicht mehr Null, sondern eine
near in der gesuchten Funktion
vorgegebene Funktion von . Es handelt sich um eine inhomogene lineare Differenzialgleichung,
während eine Gleichung von der Form (6.3) eine homogene Differenzialgleichung ist.
Wie können wir eine solche Differenzialgleichung lösen? Betrachten wir ganz allgemein eine
inhomogene lineare Differenzialgleichung der Form
(6.38)
inhomogene lineare
Differenzialgleichung
wobei
eine vorgegebene Funktion von ist. Ansonsten benutzen wir dieselbe Notation wie
vorher. An dieser Stelle spielt es keine Rolle, ob die gesuchte Funktion
reelle oder komplexe Werte annimmt. Wenn
komplex ist, darf natürlich auch
eine beliebige komplexe
Funktion sein.
Der Lösungsraum dieser Differenzialgleichung ist kein Vektorraum mehr. Wenn wir eine
Lösung mit einer Konstanten multiplizieren oder zwei Lösungen addieren, dann erhalten wir keine neue Lösung. Trotzdem können wir die gerade entwickelte Technik auch hier wieder verwenden. Wir müssen sie nur ein wenig modifizieren.
Betrachten wir zwei Lösungen und von (6.38). Dann gilt für die Funktion
Aufgabe 6.13 Aufgabe eines Stoßdämpfers ist es, die Reibungskonstante eines schwingenden Systems so einzustellen, dass sich das System bei einer plötzlich auftretenden Auslenkung so schnell
wie möglich wieder in die Ruhelage begibt. Warum ist ein Stoßdämpfer genau dann optimal eingestellt, wenn der aperiodische Grenzfall vorliegt? Nehmen wir an, die Stoßd ämpfer eines Autos
seien optimal eingestellt. Nun wird das Auto zusätzlich beladen. Was wird beim nächsten Schlagloch passieren? Wird das Auto beginnen zu schwingen, oder wird es nur langsamer als im unbeladenen Zustand wieder seine Ruhelage erreichen?
(6.39)
(6.35)
Aufgabe 6.14 Man zeige, dass sich die Lösung zu den üblichen Anfangsbedingungen im aperiodischen Grenzfall wie folgt schreiben lässt,
Offenbar ist die Funktion eine Lösung der homogenen Differenzialgleichung (6.3). Diese Funktionen kennen wir. Sie bilden einen -dimensionalen Vektorraum, und wir kennen sogar eine
Basis dieses Vektorraumes.
von Lösungen der inhomogenen Gleichung (6.38) ist demnach eine Lösung
Jedem Paar
der homogenen Gleichung (6.3) zugeordnet. Wie man sich leicht überlegt, erfüllt diese Zuordnung die Axiome der Abbildung (1.40) eines affinen Raumes auf den zugeordneten Vektorraum.
Mit anderen Worten, die Lösungsmenge einer inhomogenen linearen Differenzialgleichung ist ein
affiner Raum, dessen zugeordneter Vektorraum die Lösungsmenge der entsprechenden homogenen linearen Differenzialgleichung ist.
Nehmen wir an, wir würden eine ganz bestimmte Lösung der inhomogenen Differenzialgleichung kennen, also einen “Punkt” in dem affinen Raum, der aus allen Lösungen der inhomogenen
Gleichung besteht. Dann können wir diesen “Punkt” um einen “Vektor”, also um eine Lösung der
homogenen Gleichung “verschieben”, um einen anderen “Punkt”, also eine andere Lösung der
inhomogenen Gleichung zu finden. Wenn wir alle Lösungen der homogenen Gleichung kennen,
erhalten wir auf diese Weise alle Lösungen der inhomogenen Gleichung.
Nun hießt “verschieben” in diesem Fall einfach addieren. Wenn wir zu einer Lösung der inhomogenen Gleichung eine Lösung der homogenen Gleichung addieren, so erhalten wir wieder
und zeige, dass sich in
Aufgabe 6.15 Man bilde in (6.26) bzw. (6.32) den Grenzwert
beiden Fällen die Lösung (6.32) ergibt. Der aperiodische Grenzfall lässt sich also stetig von
beiden Seiten durch Grenzwertbildung darstellen.
Der angetriebene Oszillator
Jetzt wollen wir noch den Fall betrachten, dass ein gedämpfter harmonischer Oszillator von außen angetrieben wird. Zusätzlich zur rücktreibenden Federkraft und zur Reibungskraft soll eine
äußere Kraft auf den schwingenden Körper einwirken,
(6.36)
Die Funktion
, die wir beliebig vorgeben können, beschreibt die äußere Kraft als Funktion
der Zeit. Die Bewegungsgleichung in Standardform lautet dann
(6.37)
angetriebener
Oszillator
77
eine Lösung
der inhomogenen Gleichung. Da wir alle Lösungen der inhomogenen
Gleichung auf diese Weise darstellen können, genügt die Kenntnis einer einzigen Lösung der inPSfrag
homogenen Gleichung und der vollständige Lösungsmenge der homogenen Gleichung,
um replacements
die
vollständige Lösungsmenge der inhomogenen Gleichung zu bestimmen.
(a)
(b)
(c)
(d)
Die allgemeine Lösung einer inhomogenen linearen Differenzialgleichung ergibt sich
aus der allgemeinen Lösung der zugehörigen homogenen Differenzialgleichung durch
Addition einer speziellen Lösung der inhomogenen Differenzialgleichung.
Um die Bewegungsgleichung (6.37) des angetriebenen Oszillators zu lösen, müssen wir also nur
eine einzige spezielle Lösung finden, und zu dieser die zuvor ermittelte allgemeine Lösung der
Bewegungsgleichung eines gedämpften Oszillators addieren.
Abbildung 6.6: Der angetriebene harmonische Oszillator. Durch Bewegung des Aufhängepunktes
wirkt eine zusätzliche, von außen vorgegebene Kraft auf den Körper. Der Oszillator führt eine
erzwungene Schwingung aus, deren Frequenz durch die Frequenz der äußeren Kraft bestimmt
wird.
Periodischer Antrieb und Resonanz
nicht
Da das Auffinden einer speziellen Lösung für eine nicht weiter spezifizierte Funktion
ganz einfach ist, wollen wir zunächst einen Spezialfall betrachten, nämlich eine periodische Antiebskraft
(6.40)
Da dies für alle gelten muss, müssen die Ausdrücke in den Klammern verschwinden. Ein wenig
umgeformt ergibt sich
Das ist die Antriebskraft, die sich ergibt, wenn wir den Aufhängepunkt der Feder, wie in Abbildung 6.6 gezeigt, periodisch auf und ab bewegen, und zwar mit einer Amplitude
und einer
Kreisfrequenz . Eine Verschiebung des Aufhängepunktes um bewirkt nämlich eine Streckung
bzw. Stauchung der Feder um und somit eine zusätzliche Kraft
.
ist, so lautet die zu lösende Bewegungsgleichung nun
Benutzen wir, dass
(6.44)
Das ist ein lineares Gleichungssystem für die Parameter
steckt haben. Die eindeutige Lösung ist
(6.41)
und , die wir in den Ansatz hineinge-
Um einen geeigneten Ansatz für die Funktion
zu finden, überlegen wir uns, welche Art
von Bewegung zu erwarten ist. Wenn wir einen gedämpften Oszillator über einen längeren Zeitraum hinweg mit einer periodischen Kraft antreiben, so wird er sich, möglicherweise nach einer
gewissen Einschwingzeit, diesem Antrieb unterwerfen und ebenfalls mit der Kreisfrequenz
schwingen. Wir machen daher den Ansatz
(6.45)
(6.42)
zwei noch zu bestimmende Konstanten sind. Setzen wir das in die Bewegungswobei
gleichung (6.41) ein und fassen die Sinus- und Kosinus-Terme jeweils zusammen, so ergibt sich
nach einer kurzen Rechnung
Damit haben wir eine spezielle Lösung der Bewegungsgleichung gefunden. Wenn wir diese Werte
für und einsetzen, erfüllt die Funktion (6.42) die Differenzialgleichung (6.41). Der Ansatz war
also gut gewählt. Allerdings haben wir auf diese Weise nur genau eine Lösung gefunden.
Um die allgemeine Lösung der Bewegungsgleichung zu bekommen, müssen wir die allgemeine Lösung der zugehörigen homogenen Differenzialgleichung addieren. Dies ist die Bewegungsgleichung (6.21) des gedämpften Oszillators. Deren allgemeine Lösung kennen wir schon. Der
Einfachheit halber betrachten wir nur den Fall kleiner Reibung. In diesem Fall ist die allgemeine
Lösung der homogenen Gleichung durch (6.25) gegeben.
Also lautet die allgemeine Lösung der Bewegungsgleichung (6.41) für einen angetriebenen
Oszillator
(6.46)
78
(6.43)
PSfrag replacements
Für und sind die Ausdrücke (6.45) einzusetzen, die durch die Amplitude und Frequenz der
Antriebskraft eindeutig festgelegt sind. Die Parameter und sind dagegen frei wählbar. Sie
werden durch die Anfangsbedingungen festgelegt.
Wie sieht nun die Bewegung eines angetriebenen Oszillators qualitativ aus? Offenbar be(d)
schreibt (6.46) die Überlagerung von zwei Schwingungen. Da ist zunächst eine erzwungene
Schwingung mit der Kreisfrequenz , die von der Antriebskraft herrührt. Ihre Amplitude und Phase ist vollständig durch die Antriebskraft festgelegt, denn die Konstanten und werden durch
die Parameter des Oszillators sowie die Amplitude und Frequenz der Antriebskraft vollständig
fixiert. Wir werden darauf gleich noch näher eingehen.
(b)
(c)
(a)
Zusätzlich tritt eine Eigenschwingung des Oszillators mit der Kreisfrequenz auf. Sie ist von
der Antriebskraft unabhängig. Ihre Amplitude und Phase hängt von den Anfangsbedingungen
ab. Sie klingt allerdings exponentiell mit der Zeit ab, so dass für Zeiten, die sehr viel größer
Abbildung 6.7: Typische Schwingungen eines angetriebenen harmonischen Oszillators mit
sind als die charakteristische Abklingzeit
, nur noch die erzwungene Schwingung übrig
schwacher Dämpfung. Die gestrichelte Linie beschreibt die Auslenkung des Aufhängepunktes
bleibt. Nach einer gewissen Einschwingzeit sehen wir also nur noch die durch die Antriebskraft
der Feder, also die antreibende Kraft. Die durchgezogene Linie beschreibt die Bewegung des Osverursachte erzwungene Schwingung.
und
gewählt wurden. Nach
zillators, wobei als Anfangsbedingungen jeweils
einer kurzen Einschwingzeit, die von der Größenordnung ist, begibt sich der Oszillator in eine
erzwungene Schwingung, die nur von der Amplitude und Frequenz des Antriebs abhängt.
Ein durch eine periodische Kraft angetriebener harmonischer Oszillator führt nach
einer Einschwingzeit eine erzwungene Schwingung aus, die vollständig durch die
antreibende Kraft bestimmt ist.
Wie wir aus (6.45) entnehmen, hängt das Verhalten eines angetriebenen Oszillators im wesentlides Oszillators ab. Für
chen von der Differenz der Antriebsfrequenz von der Eigenfrequenz
einen sehr langsamen Antrieb, also im Grenzfall
, finden wir
und
, und
für große Zeiten gilt
. Nach der Einschwingzeit folgt der Oszillator einfach
der antreibenden Kraft, wie in Abbildung 6.7(a) zu sehen ist. Die Amplitude
der Schwingung
entspricht der Amplitude, mit der sich der Aufhängepunkt auf und ab bewegt.
Um das Verhalten der erzwungenen Schwingung im allgemeinen zu diskutieren, ist es sinnvoll,
die spezielle Lösung der Bewegungsgleichung in die Form
Die Funktion
ist als Umkehrfunktion des Kotangens so definiert, dass sie Werte zwischen
und annimmt, wenn das Argument von
bis läuft. Die Phasenverschiebung nimmt folglich
Werte zwischen und
an.
(6.47)
Wir betrachten die Amplitude und die Phasenverschiebung nun als Funktion der Kreisfrequenz der Antriebskraft. Wir stellen uns dabei vor, dass wir die Antriebsfrequenz langsam
verändern, den Oszillator immer wieder einschwingen lassen, und dabei seine Amplitude und
Phase beobachten.
Die Funktionen
und
, die sich so ergeben, sind in Abbildung 6.8 für verschiedene
Werte der Dämpfungskonstanten aufgetragen. Betrachten wir zunächst den Fall sehr kleiner
. In diesem Fall hat die Amplitude
ein scharfes Maximum bei einer
Dämpfung, also
Kreisfrequenz
, die sehr nahe an der Kreisfrequenz
des ungedämpften Oszillators
liegt. Dieses Phänomen wird Resonanz genannt.
umzuschreiben. Dann können wir unmittelbar die Amplitude und die Phase der Schwingung
ablesen. Der Winkel ist in diesem Fall die Phasenverschiebung zwischen der Phase der antreibenden Kraft und der Antwort des Oszillators.
Aufgabe 6.16 Die dazu nötige Umrechnung haben wir bereits in Aufgabe 6.8 durchgef ührt. Man
zeige, dass sich im hier vorliegenden Fall für die Amplitude
und zeige, dass dieses bei
Aufgabe 6.17 Man bestimme das Maximum der Funktion
(6.48)
mit
(6.50)
ergibt, und für die Phasenverschiebung gilt
ein, die unterhalb der Kreisliegt, Die Resonanz tritt demnach bei einer Antriebsfrequenz
frequenz
des ungedämpften Oszillators liegt, und ebenfalls unterhalb der Kreisfrequenz (6.24)
des gedämpften Oszillators.
(6.49)
79
(d)
(b)
(a)
(c)
Abbildung 6.9: Die Kastenfunktionen
(oben) und ihre Stammfunktionen
(unten) für
verschiedene Werte von . Für
ergibt sich als Grenzwert der Kastenfunktionen die Deltafunktion
, und als Grenzwert ihrer Stammfunktionen die Stufenfunktion
.
Abbildung 6.8: Amplitude
und Phasenverschiebung
einer erzwungenen Schwingung
als Funktion der Kreisfrequenz der Antriebskraft. Bei schwacher Dämpfung (a) ergibt sich eine
scharfe Resonanzkurve, bei mittlerer Dämpfung (b) ist die Resonanz weniger stark ausgeprägt,
und bei starker Dämpfung (c) verschwindet sie ganz.
Außerdem ändert sich mit der Antriebsfrequenz auch die Phasenverschiebung zwischen der Antriebskraft und dem Oszillator. Für
geht das Argument des Arkus-Kotangens in (6.49)
, der Arkus-Kotangens also gegen und somit geht die Phasenverschiebung
gegegen
gen Null. Der Oszillator folgt in diesem Fall unmittelbar der antreibenden Kraft. Dies hatten wir
schon in Abbildung 6.7(a) gesehen.
Mit zunehmender Antriebsfrequenz tritt eine zunehmende negative Phasenverschiebung auf.
Der Oszillator läuft der antreibenden Kraft hinterher. Für
ist das Argument des Arkus. Dieses Verhalten
Kotangens gleich Null, das heißt die Phasenverschiebung beträgt genau
sehen wir in Abbildung 6.7(b). In der Nähe der Resonanz ist die Amplitude besonders hoch und
die Phasenverschiebung beträgt genau eine viertel Periode.
Erhöhen wir die Antriebsfrequenz noch weiter, so nimmt die Amplitude der erzwungenen
Schwingung wieder ab und die Phasenverschiebung nimmt weiter zu. Für sehr große Antriebsfre, das heißt der Oszillator ist dann fast in Gegenphase
quenzen nähert sie sich dem Grenzwert
zur Antriebskraft. Das sehen wir in Abbildung 6.7(c). Nach einer gewissen Einschwingzeit, die
sich in diesem Fall über mehrere Perioden der Antriebskraft erstreckt, liegen die beiden Kurven
um etwa eine halbe Periode phasenverschoben zueinander.
Wenn wir die Reibung erhöhen, verschwindet das Phänomen der Resonanz allmählich. Wie
wir in Abbildung 6.8(b) sehen, ist das Maximum der Amplitude weniger stark ausgeprägt, wenn
die Dämpfungskonstante größer ist. Außerdem liegt die Resonanzfrequenz (6.50) hier bereits
deutlich unterhalb der Eigenfrequenz des Oszillators. Oberhalb eines kritischen Wertes der Reibungskonstanten, der bei
(6.51)
liegt, tritt keine Resonanz mehr auf. Man beachte, dass dies ein anderer kritischer Wert ist als
derjenige, bei dem keine Eigenschwingung des Oszillators mehr möglich ist. Dieser war durch
gegeben, ist also um den Faktor
größer. Die Resonanz verschwindet bereits
bevor die Eigenschwingungen in exponentiell fallendes Abklingen übergehen.
für
aus, also bei verschwindender Reibung?
Aufgabe 6.18 Wie sieht die Funktion
Was passiert in diesem Fall beim Eintritt der Resonanz, also an der Stelle
? Die spezielle
Lösung (6.42) existiert für
und
nicht. Warum nicht? Wie sieht statt dessen die
Lösung der Bewegungsgleichung aus, wenn als Anfangsbedingungen zum Beispiel
und
vorgegeben sind? Wie verhält sich diese Lösung für große Zeiten?
Delta-Funktion und Kraftstoß
Eine andere spezielle Situation liegt vor, wenn die antreibende Kraft nicht periodisch ist, sondern
der Oszillator nur einmal kurz angestoßen und dann wieder sich selbst überlassen wird. Dieser
Fall ist vor allem deshalb interessant, weil sich aus der Lösung dieses Problems schließlich auch
die “Antwort” des Oszillators auf eine beliebige antreibende Kraft herleiten lässt.
80
Um eine Antriebskraft zu beschreiben, die nur für ein kurzes Zeitintervall wirkt, führen wir die
in Abbildung 6.9 oben dargestellte Kastenfunktion ein,
(6.52)
für
für
Die Kastenfunktion ist so definiert, dass sie nur in einem Intervall der Breite von Null verschieden ist, und ihr Funktionswert dort ist so gewählt, dass die Fläche unter dem Kasten immer gleich
Eins ist. Ist
irgendeine stetige, integrierbare Funktion, so ist
(6.53)
Abbildung 6.10: Die Deltafunktion
kann auch als Grenzwert
einer glatten Funktion
dargestellt werden, hier der Gaußschen Normalverteilungsfunktion. Auch dann ergibt sich
als Stammfunktion
im Grenzwert
die Stufenfunktion
.
Das ist der Mittelwert von
im Intervall
. Nach dem Mittelwertsatz
der Integralrechnung gibt es eine Stelle innerhalb dieses Intervalls, so dass der Funktionswert
genau dieser Mittelwert ist. Bilden wir den Grenzwert
, so konvergiert gegen und
wir bekommen folglich den Funktionswert an der Stelle ,
(6.54)
(6.55)
Deltafunktion
Da die Funktion
für
nicht definiert ist, dürfen wir die beiden Grenzwerte in (6.54),
also
und das Bilden des Integrals, eigentlich nicht vertauschen. Es ist aber nützlich, es
einzuführen, die die folgende Eigenschaft haben soll,
trotzdem zu tun und eine Deltafunktion
Mit anderen Worten, wenn unter einem Integral eine Deltafunktion steht, so “denken” wir uns
vor dem Integral und die Funktion
durch
ersetzt.
einfach einen Grenzwert
Es handelt sich um eine abkürzende Schreibweise, die ähnlich zu verstehen ist wie die Summenkonvention für Vektorindizes. Sie ist sehr nützlich, weil man mit Hilfe der Deltafunktion formale
Umformungen durchführen kann, wobei man sie wie eine gewöhnliche Funktion behandeln kann.
Es gibt noch eine andere Möglichkeit, die Deltafunktion einzuführen und vielleicht ein wenig
besser zu verstehen. Dazu betrachten wir ihre Stammfunktion. Die Stammfunktionen der Kastensind in Abbildung 6.9 unten dargestellt. Wir bezeichnen sie mit
funktionen
(6.57)
Diese “formale” Definition ist wie folgt zu verstehen. Anschaulich formuliert ist
eine Funktion, die überall gleich Null ist außer an der Stelle
, wo sie unendlich groß wird, und zwar
so, dass ihr Integral über eine beliebig kleine Umgebung der Null gleich Eins ist,
(6.56)
(6.58)
für
für
für
Stufenfunktion
Eine solche Funktion existiert natürlich nicht wirklich. Steht sie jedoch unter einem Integral, so
ist unter einem eigentlich unsinnigen Ausdruck der Form (6.55) der sinnvolle Grenzwert (6.54)
zu verstehen.
für
für
für
. Dazwischen steigt die Funktion
. Im Grenzwert
gilt
für
und
an und es ist
Offenbar ist
für
linear mit der Steigung
Das ist die Stufenfunktion. Sie ergibt sich in dem oben definierten formalen Sinn als Stammfunktion der Deltafunktion. Zwischen der Stufenfunktion und der Deltafunktion bestehen somit die
81
formalen Beziehungen
PSfrag replacements
die wir auch als alternative Definition der Deltafunktion betrachten können.
(a)
(b)
(c)
(d)
(6.59)
Die Deltafunktion ist die Ableitung der Stufenfunktion.
Aufgabe 6.19 Wie ist die folgende Gleichung zu verstehen und wie kann man sie beweisen?
(6.60)
, wie sie sich aus der Darstellung (6.61) ergeben.
Abbildung 6.11: Die Ableitungen der Deltafunktion
Aufgabe 6.20 Die Deltafunktion kann auch als Grenzwert einer glatten Funktion definiert werden. Man betrachte zum Beispiel die in Abbildung 6.10 oben f ür verschiedene dargestellten
Funktionen
(6.61)
Man zeige, dass auch die so definierte Deltafunktion die oben aufgez ählten Eigenschaften hat.
, jetzt dargestellt als
Insbesondere ergibt sich als Stammfunktion wieder die Stufenfunktion
Grenzwert der in Abbildung 6.10 unten gezeigten glatten Funktionen.
Aufgabe 6.24 Für ein frei bewegliches Teilchen im dreidimensionalen Raum gelten die folgenden
Bewegungsgleichungen mit zeitabhängiger Kraft,
(6.64)
mit
wie in Aufgabe 6.20 als Grenzwert einer
Aufgabe 6.21 Definiert man die Deltafunktion
glatten Funktion, so kann man auch ihre Ableitungen
,
etc. einführen. Sie sind in Abbildung 6.11 dargestellt. Man leite die folgenden Formeln aus der Eigenschaft (6.55) ab,
Der dadurch beschriebene Vorgang wird als Kraftstoß bezeichnet. Warum? Was bewirkt ein Kraftstoß? Welche physikalische Dimension und welche Bedeutung hat der Vektor ? Wie sieht die
eindeutige Lösung der Bewegungsgleichungen aus, wenn als Anfangsbedingungen
und
vorgegeben sind? Man unterscheide hierbei die Fälle
,
und
.
(6.62)
Der angestoßene Oszillator
?
Wie lautet die entsprechende Formel für die -te Ableitung
Wir betrachten nun wieder die Bewegungsgleichung (6.37) für den angetriebenen harmonischen
. Für die Antriebskraft
setzen wir jetzt
Oszillator mit schwacher Dämpfung, also mit
eine Deltafunktion ein, multipliziert mit einer Konstanten , damit die rechte Seite der Gleichung
die richtige physikalische Dimension bekommt,
, wenn die Zeit
, wenn irgend-
Aufgabe 6.22 Welche physikalische Dimension hat die Deltafunktion
ist? Welche physikalische Dimension hat allgemein eine Deltafunktion
eine physikalische Größe ist?
(6.65)
Aufgabe 6.23 Es sei
eine streng monotone steigende Funktion mit der einzigen
Nullstelle
. Man beweise durch Substitution
Der Oszillator erfährt also zur Zeit
einen Kraftstoß der Stärke , ist aber ansonsten sich
selbst überlassen.
Gesucht ist nun irgendeine spezielle Lösung dieser Bewegungsgleichung. Die allgemeine
Lösung finden wir dann wie üblich durch Addition der allgemeinen Lösung der homogenen Gleichung, die wir bereits kennen. Da sowohl für
als auch für
keine Antriebskraft
(6.63)
82
vorliegt, gilt dort jeweils die Bewegungsgleichung für den antriebsfreien Oszillator. Wir machen
daher den Ansatz
für
(6.66)
PSfrag
replacements
für
(a)
(b)
(c)
(d)
wobei
eine Lösung der Bewegungsgleichung (6.21) für den antriebsfreien Oszillator ist. Der
Oszillator soll sich also vor dem Stoß in Ruhe befinden und danach eine gedämpfte Schwingung ausführen. Wir müssen nur noch herausfinden, welche Schwingung er genau ausführt. Dazu
müssen wir den Ansatz in die Bewegungsgleichung einsetzen. Für die Geschwindigkeit finden
wir
(6.67)
und nochmaliges Ableiten liefert die Beschleunigung
Abbildung 6.12: Antwort des gedämpften Oszillators auf einen Kraftstoß
.
ergibt sich die Lösung des antriebsfreien Oszillators aus Abbildung 6.3 mit den
Für
Anfangsbedingungen
und
.
(6.68)
Setzen wir das in (6.65) ein, so heben sich alle Terme weg, die zu
proportional sind.
Denn
war ja eine Lösung der zugehörigen homogenen Differenzialgleichung. Was bleibt ist
Aufgabe 6.26 Der Oszillator werde periodisch angestoßen, es gelte also
(6.69)
(6.71)
Da diese Gleichung für alle erfüllt sein muss und
und
zwei linear unabhängige
Funktionen sind, ergibt sich daraus
und
.
Damit haben wir die gesuchte spezielle Lösung der Bewegungsgleichung (6.65) gefunden. Wir
diejenige Lösung für den antriebsfreien Oszillator einsetzen, die sich aus den
müssen für
Anfangsbedingungen
und
ergibt. Diese kennen wir bereits aus (6.26).
und
setzen. Das ergibt
Wir müssen dort nur
Man finde eine spezielle Lösung der Bewegungsgleichung. Gibt es auch hier ein Resonanzph änomen, wenn man die Periode variiert?
Lineare Antwort und Greensche Funktion
Wir werden nun zeigen, dass wir auch die Bewegungsgleichung für eine beliebige Antriebskraft
die Antwort des Oslösen können. Wir können also für jede vorgegebene Kraftfunktion
zillators berechnen. Die Technik, die wir dazu verwenden, lässt sich später auf viele ähnliche
physikalische Fragestellungen anwenden. Entscheidend ist dabei, dass der der Oszillator linear
antwortet, das heißt seine Reaktion ist eine lineare Funktion der Antriebskraft.
Wir betrachten zunächst die Differenzialgleichung, die sich ergibt, wenn wir auf der rechten
als Antriebskraft einsetzen.
Seite der Bewegungsgleichung einfach nur eine Deltafunktion
Außerdem ersetzen wir sie Ortfunktion
durch eine Funktion
von zwei Variablen,
(6.70)
mit
Das ist die Antwort des Oszillators auf einen Kraftstoß zur Zeit , bei dem ein Impuls übertragen wird. Für festes und verschiedene Werte von sind diese Funktionen in (6.12) dargestellt.
ist der Oszillator in Ruhe. Zum Zeitpunkt
erfährt er einen Kraftstoß. Danach
Für
ist seine Geschwindigkeit nicht mehr Null sondern
. Mit dieser neu gesetzten Anfangsbedingung beginnt er dann zu schwingen, wobei die Amplitude für
wegen der Dämpfung
wieder exponentiell abklingt.
(6.72)
Dies ist eine Differenzialgleichung für die Funktion
, wobei der Punkt immer die Ableitung nach dem ersten Argument bezeichnet. Das zweite Argument haben wir nur deshalb
in Ruhe und werde dann zweimal hintermit
. Man löse die
Aufgabe 6.25 Der Oszillator befinde sich für
einander angestoßen. Es sei also
Bewegungsgleichung.
83
dazugeschrieben, weil es auch auf der rechten Seite der Gleichung auftritt, und weil folglich auch
die Lösungen dieser Differenzialgleichung von abhängen. Eine spezielle Lösung können wir
unmittelbar aus (6.70) ablesen. Sie lautet
statt (6.74) auch
(6.76)
(6.73)
schreiben. Das ist physikalisch sehr sinnvoll. Um die Auslenkung
zu einem Zeitpunkt zu
für
zu kennen, also für Zeiten , die
bestimmen, genügt es, die Antriebsfunktion
vor dem Zeitpunkt liegen. Wie sich die Antriebskraft
später, also für
verhält, ist
unerheblich. Es gilt das Ursache-Wirkung-Prinzip, wonach die Ursache, die Antriebskraft
,
der Wirkung, also der Auslenkung
vorausgeht.
Man nennt
deshalb auch eine retardierte Greensche Funktion. Sie bestimmt die Bewegungen des Oszillators allein aus den Kräften, die in der Vergangenheit auf ihn einwirkten.
Aufgabe 6.27 Ist dies die einzige Lösung der Differenzialgleichung (6.72)? Wenn nicht, durch
welche zusätzliche Forderung ist sie eindeutig festgelegt?
Nun betrachten wir die Funktion
(6.74)
Die Antwort des eines harmonischen Oszillators auf eine beliebige Antriebskraft ergibt sich durch Faltung der Antriebskraft mit seiner retardierten Greens-Funktion.
wobei
irgendeine integrierbare Funktion ist, so dass das Integral konvergiert. Da die Integration über erfolgt und nicht über , und wenn wir einmal voraussetzen, dass die Funktion
genügend glatt ist, so dass wir die Integration über mit der Ableitung nach vertauschen
können, so ergibt sich aus (6.74) und (6.72)
Aufgabe 6.28 Es soll eine inhomogene lineare Differenzialgleichung
(6.38) für die Funktion
gelöst werden,
-ter Ordnung der Form
(6.77)
eine Greensche Funktion mit der Eigenschaft
Es sei
(6.78)
(6.75)
Wir haben mit (6.74) also eine Lösung der Bewegungsgleichung für nahezu beliebige Antriebsgefunden. Die einzige Einschränkung ist, dass das Integral (6.74) konvergieren
funktionen
muss.
fällt für
Das ist aber eine relativ geringfügige Einschränkung, denn die Funktion
exponentiell ab, und für
ist sie wegen der Stufenfunktion ohnehin gleich Null. Das
Integral konvergiert also ganz sicher, wenn
zum Beispiel für alle Zeiten beschränkt ist, was
für einen realistischen Antrieb sicher der Fall ist.
Gemäß der Formel (6.74) ergibt sich die Antwort
des Oszillators auf eine Antriebsfunktion
also durch Faltung der Antriebsfunktion
mit der Funktion
. Als Faltung
bezeichnet man allgemein ein Integral der Form (6.74). Eine Faltung bildet eine Funktion, hier
, linear auf eine andere Funktion, hier
, ab, wobei als Faltungsfunktion oder Integralkern
von zwei Variablen auftritt.
eine Funktion
Die Funktion
wird auch als Greensche Funktion des Oszillators bezeichnet. Unter einer Greenschen Funktion versteht man im allgemeinen eine Funktion, mit deren Hilfe man durch
Faltung eine inhomogene lineare Differenzialgleichung lösen kann. In unserem Fall hat die Greenfür
gleich Null ist, können wir
sche funktion noch eine spezielle Eigenschaft. Da
wobei die Ableitungen wieder nur auf das erste Argument wirken. Man zeige, dass dann eine
spezielle Lösung der Differenzialgleichung (6.38) durch
(6.79)
gegeben ist. Wie findet man eine solche Greensche Funktion? Ist sie eindeutig bestimmt? Wenn
nicht, durch welche zusätzliche Forderung wird sie eindeutig?
Aufgabe 6.29 Man finde eine spezielle Lösung des angetriebenen Oszillators für
(6.80)
für
für
.
Es wirkt also über ein gewisses Zeitintervall eine konstante Kraft
84
und
beschrieben.
stante haben. Ihre Bewegungen werden durch zwei Funktionen
Der Einfachheit halber sollen weder Reibungskräfte vorliegen noch eine äußere Antriebskraft.
, die ihn in die Ruhelage
Auf den ersten Körper wirkt dann eine rückstellende Kraft
zurück zieht. Auf den zweiten Körper wirkt entsprechend eine rückstellende Kraft
. Von
der dritten Feder wollen wir annehmen, dass für sie ebenfalls ein lineares Kraftgesetz gilt. Auf
, die ihn zum zweiten Körper
den ersten Körper wirkt dadurch eine zusätzliche Kraft
hin zieht, während auf den zweiten Körper die gleich große Gegenkraft
wirkt. Die
Federkonstante der Wechselwirkung ist im allgemeinen von der Federkonstante der einzelnen
Oszillatoren verschieden.
Setzen wir das alles zusammen, so ergeben sich die Bewegungsgleichungen
replacements
Abbildung 6.13: Zwei oder mehr Oszillatoren werden durch eine zusätzliche Feder miteinander gekoppelt.
(c)
(b)
(a)
(d)
(6.82)
(6.83)
(6.81)
Aufgabe 6.30 Man setze
und reproduziere die bereits bekannte Lösung der
Bewegungsgleichung für eine periodische Antriebskraft mit der Methode der Greenschen Funktion.
Aufgabe 6.31 Man löse die folgende Differenzialgleichung zuerst mit Hilfe einer Greenschen
Funktion und bestimme dann diejenige Lösung, die zu der gestellten Anfangsbedingung gehört,
Diese Art der Wechselwirkung kennen wir bereits aus Kapitel 3. Dort hatten wir die Bewegungsgleichungen für ein Zwei-Teilchen-System mit linearem Kraftgesetz aufgestellt und gelöst. Der
einzige Unterschied ist, dass hier die Bewegungen nur in eine Raumrichtung erfolgen, und dass
zusätzlich die Rückstellkräfte auf die beiden Körper wirken.
Es handelt sich bei (6.82) um ein System von zwei gekoppelten linearen Differenzialgleichungen. Um unsere oben entwickelte Methode zur Lösung von linearen Differentialgleichungen darauf anwenden zu können, müssen wir sie zuerst entkoppeln. Wir bilden dazu die Summe und die
Differenz der beiden Gleichungen,
Offenbar können wir auch hier die Bewegung der beiden Körper in eine Schwerpunkt- und eine
Relativbewegung zerlegen. Wenn wir als Hilfsfunktionen
Der gekoppelte Oszillator
Zum Abschluss dieses Kapitels wollen wir noch eine wichtige Verallgemeinerung des harmonischen Oszillators kennen lernen. Bis jetzt haben wir nur Systeme mit einem Freiheitsgrad betrachtet, deren Bewegungen durch eine einzige Funktion
beschrieben werden. Als Verallgemeinerung davon kennen wir bereits das mathematische Pendel in der linearen Näherung (5.55).
Das war ein System mit zwei Freiheitsgraden.
Dort waren die Bewegungsgleichungen für die Ortskoordinaten und bereits entkoppelt.
Beim mathematischen Pendel in der linearen Näherung handelt es sich daher um ein System
von zwei voneinander unabhängigen Oszillatoren, die jeweils mit der gleichen Eigenfrequenz
schwingen. Die geschlossenen Ellipsen in Abbildung 5.6 ergeben sich als Überlagerung zweier unabhängiger Schwingungen, die senkrecht zueinander mit der gleichen Frequenz
erfolgen.
Ein interessanterer Fall liegt von, wenn zwei Oszillatoren miteinander gekoppelt sind. Ein typisches mechanisches System dieser Art ist in Abbildung 6.13(a) dargestellt. Es besteht aus zwei
Oszillatoren, die parallel zueinander in -Richtung schwingen und durch eine zusätzliche Feder
miteinander verbunden sind. Beide Oszillatoren sollen dieselbe Masse und dieselbe Federkon-
(6.84)
und
einführen, so ergeben sich zwei voneinander unabhängige, lineare Differenzialgleichung für die
und , nämlich
Funktionen
(6.85)
Beides sind die Bewegungsgleichungen für einen harmonischen Oszillator. Die Lösungen dieser Gleichungen können wir leicht angeben. Die charakteristischen Eigenfrequenzen der beiden
Oszillatoren sind
(6.86)
und die allgemeine Lösung der Bewegungsgleichungen (6.85) lautet
85
(6.87)
replacements
Es treten vier Integrationskonstanten auf, also vier Parameter
und , die wir denPSfrag
gestellten
(a)
Anfangsbedingungen anpassen müssen. Für beide Körper können wir jeweils den Ort und die
(b)
frei wählen.
Geschwindigkeit zu irgendeinem Zeitpunkt
(c)
Daraus können wir leicht die allgemeine Lösung der ursprünglichen Bewegungsgleichung ab(d)
leiten. Wir müssen nur die Definition (6.84) der Hilfsfunktionen umkehren. Das ergibt
(6.88)
Abbildung 6.14: Zwei gekoppelte Oszillatoren können im Gleichtakt mit einer Periode
(lange Striche), oder im Gegentakt mit einer kleineren Periode
schwingen
(kurze Striche). Im allgemeinen ergibt sich die Bewegung der Oszillatoren als Überlagerung von
zwei solchen Eigenmoden (durchgezogene Kurve).
Um die Bewegungen anschaulich darzustellen, betrachten wir zunächst zwei Spezialfälle, die als
Eigenmoden des gekoppelten Oszillators bezeichnet werden.
Es sei zunächst
. In diesem Fall ist
. Die beiden Körper schwingen
synchron, also im Gleichtakt zueinander mit der Frequenz
. Die mittlere Feder ist dabei stets
entspannt, das heißt die Körper verhalten sich so, als wäre sie gar nicht vorhanden. Tatsächlich ist
genau die Kreisfrequenz eines einzelnen Oszillators mit der Masse
die Kreisfrequenz
und der Federkonstante .
Für
liegt ein anderer Spezialfall vor. In diesem Fall ist
. Die
beiden Körper schwingen jetzt gegeneinander, und zwar mit einer Kreisfrequenz
. Jetzt
trägt die mittlere Feder sehr wohl zu den Kräften und damit zur Bewegungsgleichung bei, so
ergibt, und somit auch eine höhere
dass sich eine höhere effektive Federkonstante
Schwingungsfrequenz.
Die beiden Eigenmoden sind in Abbildung 6.14 als gestrichelte Linien dargestellt. Die beiden
oder gegeneinander mit der PeriOszillatoren können miteinander mit der Periode
schwingen, wobei für die Perioden stets
gilt. Ein typische Lösung
ode
der Bewegungsgleichung ist eine Überlagerung dieser beiden Eigenmoden, die als durchgezogene
Linie dargestellt ist. Wir können das wie folgt zusammenfassen:
Anfangsbedingungen,
(6.90)
Um das ein wenig umzuformen, benutzen wir die Additionstheoreme (2.83) für die KosinusFunktionen. Aus ihnen ergibt sich
(6.91)
Die Schwingungen eines gekoppelten harmonischen Oszillators lassen sich in Eigenmoden zerlegen, die sich jeweils wie einzelne harmonische Oszillatoren verhalten und
unabhängig voneinander mit verschiedenen Eigenfrequenzen schwingen.
Setzen wir
(6.92)
so lässt sich die Lösung (6.90) wie folgt schreiben,
Ein besonders interessanter Fall liegt vor, wenn die Kopplung zwischen den beiden Körpern nur
schwach ist, also sehr klein ist im Vergleich zu . Betrachten wir eine bestimmte Lösung der
Bewegungsgleichung, indem wir als Anfangsbedingung
(6.89)
und
sehr nahe beieinander liegen, ist sehr klein, während
Da die beiden Eigenfrequenzen
ungefähr gleich der Kreisfrequenz eines einzelnen, ungekoppelten Oszillators ist. Die Funktionen mit den Argumenten
oszillieren sehr schnell, mit der Periode
, während sich
vorgeben. Wir lenken also nur den ersten Körper aus der Ruhelage aus und überlassen das System
dann sich selbst. Wie man leicht nachprüft, erfüllt der folgende Spezialfall der Lösung (6.88) diese
86
(6.93)
übertragen wird. Und das ist auch letztlich der Grund, warum uns der harmonische Oszillator als
ein sehr einfaches physikalisches System immer wieder begegnen wird. Viele, auch sehr komplizierte Systeme lassen sich nämlich als gekoppelte harmonische Oszillatoren verstehen.
replacements
(a)
(b)
(c)
(d)
Aufgabe 6.32 Auf die beiden schwingenden Körper wirke zusätzlich eine Reibungskraft mit
der Reibungskonstanten , sowie auf einen der beiden Körper eine periodische äußere Kraft
. Man zeige, dass die Bewegungsgleichungen auch dann noch entkoppelt werden können, und dass sich die beiden Eigenmoden in diesem Fall wie zwei einzelne harmonische
Oszillatoren mit Dämpfung und Antrieb verhalten. Nach einer gewissen Einschwingzeit f ührt das
System eine erzwungene Schwingung aus, deren Frequenz mit der die antreibenden Kraft übereinstimmt. Wie sieht diese Schwingung aus? Wie äußert sich das Phänomen der Resonanz?
Aufgabe 6.33 Man diskutiere den Fall von zwei gekoppelten Oszillatoren, die nicht identisch
sind, also verschiedene Massen
und
und verschiedene Federkonstanten
und
haben. Man zeige, dass auch dann eine Entkoppelung der Bewegungsgleichungen m öglich ist. Man
und
.
bestimme die beiden Eigenmoden und die zugehörigen Eigenfrequenzen
Abbildung 6.15: Die Überlagerung zweier Schwingungen mit annähernd gleicher Frequenz wird
Schwebung genannt. Sie tritt beim gekoppelten harmonischen Oszillator auf, wenn die Kopplung
sehr schwach ist. Die einzelnen Oszillatoren schwingen jeweils mit einer Periode , wobei die
Amplitude dieser Schwingungen mit einer Periode
zwischen den beiden Oszillatoren hin
und her pendelt.
Aufgabe 6.34 In Abbildung 6.13(b) ist ein gekoppeltes System von drei identischen Oszillatoren
, und mit Massen und Federkonstanten dargestellt. Die Kopplung erfolgt durch zwei
Federn mit Federkonstanten . Wie lauten die Bewegungsgleichungen? Um die Eigenmoden, also
eine Basis des Lösungsraumes zu finden, macht man zunächst den Ansatz
die Funktionen mit den Argumenten
nur langsam verändern. Die Zeitspanne zwischen zwei
Nullstellen dieser Funktionen beträgt
.
Die Funktion
beschreibt also eine Schwingung mit der Periode , deren Amplitude sich
mit der Zeit langsam verändert und jeweils nach der Zeit
einen Nulldurchgang hat.
Sie ist in Abbildung 6.15 oben dargestellt. Ein solches Verhalten, das durch die Überlagerung
zweier Schwingungen mit annähernd gleicher Frequenz entsteht, bezeichnet man als Schwebung.
Durch den geringen Frequenzunterschied kommt es dazu, dass sich die beiden Schwingungen
einmal gegenseitig verstärken und einige Zeit später gegenseitig auslöschen, weil sich ihre Phasen
gegeneinander verschoben haben.
hat ein ähnliches Verhalten, nur dass sowohl die Phase der eigentlichen
Die Funktion
phasenverSchwingung, als auch das auf und ab der Amplitude gegenüber der Funktion
schoben ist. Insgesamt ergibt sich daher folgendes Bild. Durch die spezielle Anfangsbedingung
wird zuerst nur der Oszillator in Schwingungen mit der Amplitude versetzt. Nach einer gewissen Zeit überträgt sich diese Schwingung durch die Kopplung auf den Oszillator . Zur Zeit
schwingt der erste Oszillator gar nicht mehr, der zweite jedoch mit der Amplitude .
Dann wiederholt sich das Spiel in umgekehrter Richtung.
Die Kopplung bewirkt also eine Übertragung der Schwingung von dem einen auf den anderen
Oszillator. Wie wir andeutungsweise in den folgenden Aufgaben sehen werden, beruht auf diesem
Prinzip die Ausbreitung von Wellen. Wir müssen uns dazu nur eine lange Kette von ganz vielen
Oszillatoren vorstellen, so dass die Schwingung jeweils von einem Oszillator zu seinem Nachbarn
(6.94)
Alle drei Körper sollen mit derselben Kreisfrequenz schwingen, wobei aber m öglicherweise
Phasenverschiebungen auftreten. Das Gleichungssystem, das sich f ür die Koeffizienten und
für
ergibt, hat dann nur für bestimmte Werte von Lösungen. Wie viele solche
Frequenzen gibt es, und wie sehen die zugehörigen Schwingungsmoden aus?
Aufgabe 6.35 In Abbildung 6.13(c) ist ein gekoppeltes System von unendlich vielen identischen
, mit Massen und Federkonstanten dargestellt. Die Kopplung zwischen
Oszillatoren ,
zwei benachbarten Oszillatoren erfolgt jeweils durch eine Feder mit der Federkonstanten . Man
zeige, dass die Bewegungsgleichungen wie folgt lauten,
(6.95)
Um die Eigenmoden zu finden, wählt man den geschickten Ansatz
(6.96)
wobei , , und irgendwelche reellen Zahlen sind. Man zeige, dass diese Funktionen genau
dann eine Lösung der Bewegungsgleichungen liefern, wenn zwischen und die Beziehung
87
(6.97)
besteht. Jede Lösung dieser Art beschreibt folglich eine Eigenmode des Systems mit der Eigenfrequenz . Welchen Wertebereich und welche physikalische Bedeutung haben , , und ? Wie
PSfrag
replacements
sieht die allgemeine Lösung der Bewegungsgleichungen aus? Welche Daten können als
Anfangsbedingungen vorgegeben werden?
7
Energie, Arbeit und Potenzial
(d)
Im letzten Kapitel haben wir uns ausführlich mit linearen Differenzialgleichungen beschäftigt.
Leider sind nur die wenigsten Bewegungsgleichungen von dieser Art, so dass sich die entsprechenden Methoden nur in ganz speziellen Fällen überhaupt anwenden lassen. Nichtlineare Differenzialgleichungen lassen sich im allgemeinen nicht explizit lösen, so dass wir über kompliziertere dynamische Systeme oft nur qualitative Aussagen machen, oder deren Lösungen näherungsweise ermitteln können, zum Beispiel mit numerischen Methoden oder durch eine geeignete
Approximation an ein lineares System.
Das Ziel dieses Kapitels ist es, Methoden zu entwickeln, mit deren Hilfe wir möglichst viele
Aussagen über die Lösungen von bestimmten Bewegungsgleichungen machen können, ohne diese
explizit zu kennen. Eine wichtige Rolle spielen dabei die Erhaltungsgrößen eines dynamischen
Systems, von denen wir einige schon kennen gelernt haben. Hier werden wir die Energie als eine
neue Erhaltungsgröße einführen und zeigen, dass sich die Bewegungsgleichungen vieler Systeme
mit Hilfe dieser Erhaltungsgröße vereinfachen oder sogar lösen lassen.
(b)
(a)
(c)
Abbildung 7.1: Der qualitative Verlauf der Bewegung eines Teilchens in einem Potenzial lässt
sich aus der Form des Potenzials ablesen. Besitzt das Potential Extrema, so kann das Teilchen
dort ruhen (a). Sonst wird das Teilchen zum fallenden Potenzial hin beschleunigt (b). In einer
Potenzialmulde kann das Teilchen schwingen (c).
definiert, also im wesentlichen die Stammfunktion des Kraftgesetzes. Das Potenzial ist bis auf
eine additive Konstante bestimmt, die wir frei wählen können.
dann auch die Funktion
vorgeben und die
Offenbar können wir statt der Funktion
Bewegungsgleichung in der Form
Eindimensionale Systeme
(7.3)
Um das Konzept von Energie, Arbeit und Potenzial zu verstehen, ist es ganz nützlich, zunächst
ein System mit nur einem Freiheitsgrad zu betrachten. Es ist dabei unerheblich, ob es sich um ein
mechanisches System mit Zwangsbedingungen handelt oder ob sich ein Teilchen aufgrund eines
vorgegebenen Kraftgesetzes und spezieller Anfangsbedingungen nur in eine Richtung bewegt.
beschrieben, und
Die Bahn eines solchen Systems wir durch eine einzige reelle Funktion
im allgemeinen gilt ein Kraftgesetz der Form
, das heißt die Kraft ist als Funktion des Ortes, der Geschwindigkeit und der Zeit gegeben. Wie wollen hier den speziellen Fall
betrachten, dass die Kraft nur von Ort abhängt. Die Bewegungsgleichung lautet dann
schreiben. Damit ist zwar noch nicht viel gewonnen. Aber mit Hilfe eines Potenzials können wir
das Kraftgesetz sehr gut grafisch veranschaulichen. In Abbildung 7.1 sind verschiedene Potenziale
dargestellt. Nehmen wir an, das Teilchen befindet sich an einer Stelle . Dann wirkt
eine Kraft
auf das Teilchen, die umso größer ist, je steiler der Graf der Funktion
an
dieser Stelle ist. Sie wirkt stets in die Richtung, in die das Potenzial abfällt.
Wir können uns sogar vorstellen, dass sich das Teilchen selbst auf der Potenzialkurve entlang
bewegt, wobei diese aufrecht in einem Gravitationsfeld aufgestellt ist. Zumindest qualitativ ergibt
sich dann dasselbe Kraftgesetz. Die Kraft ist umso größer, je steiler die Kurve ist, und sie wirkt
stets nach unten. Die typischen Bewegungsabläufe können wir dann fast schon intuitiv erahnen.
, so kann das Teilchen an
Hat das Potenzial irgendwo ein Extremum, ist also
ruhen. Fällt das Potenzial in einem Bereich zu größeren hin ab, so erfährt
der Stelle
das Teilchen dort eine Beschleunigung in Richtung der -Achse. Wenn wir es an irgendeiner
Stelle aus der Ruhe startet lassen, dann bewegt es sich beschleunigt nach rechts. Und schließlich,
wenn das Potenzial um ein Minimum herum eine Mulde bildet, so kann es dort eine Schwingung
ausführen.
Wir wollen das ein wenig systematischer untersuchen. Wir zeigen zuerst, dass das Potenzial
(7.1)
Wir wollen versuchen, aus den Eigenschaften der Funktion
möglichst viele Informationen
über das Verhalten der Lösungen dieser Bewegungsgleichung abzuleiten. Der erste Schritt besteht
darin, dass wir uns eine anschauliche Vorstellung von der Wirkung der Kraft auf das Teilchen
einzuführen, die wir Potenzial nennen. Sie ist
machen. Dazu ist es nützlich, eine Funktion
durch
Potenzial
(7.2)
88
PSfrag replacements
(d)
nicht nur nützlich ist, um das Kraftgesetz anschaulich zu machen, sondern dass wir auch quantitative Aussagen daraus ableiten können. Wir benutzen dazu einen Trick, den wir bereits in Kapitel 3
verwendet haben, um die Bewegungsgleichung für den senkrechten Fall in einem Gravitationsund
feld zu lösen. Wir multiplizieren die Bewegungsgleichung (7.3) auf beiden Seiten mit
schreiben alles auf eine Seite,
(7.4)
Dieser Ausdruck lässt sich mit Hilfe der Kettenregel auch wie folgt schreiben,
(b)
(a)
(7.5)
(c)
Abbildung 7.2: Aus dem Potenzialverlauf lassen sich die möglichen Bewegungsformen ableiten.
für alle , so läuft das Teilchen über die ganze -Achse (a). Gilt
nur
Ist
, so läuft das Teilchen zunächst von rechts kommend bis zum Umkehrpunkt
für
und dann wieder zurück (b). Ist die Bedingung
nur in einem beschränkten Intervall
erfüllt, so pendelt das Teilchen in diesem Bereich.
(7.6)
Energie
Folglich ist die Größe in der Klammer zeitlich konstant, also eine Erhaltungsgr öße. Sie wird
Energie genannt,
Die Energie hat die Dimension Masse mal Geschwindigkeit zum Quadrat, oder Kraft mal Länge,
kg m s
N m. Sie setzt sich zusammen aus einer kinetischen Energie, die von der
Geschwindigkeit des Teilchens abhängt, und einer potenziellen Energie, die davon abhängt, wo
sich das Teilchen gerade befindet und welchen Wert dort das Potenzial hat.
Hinter dieser Aufspaltung verbirgt sich die anschauliche Vorstellung, dass sich bei der Bewegung des Teilchens fortwährend kinetische in potenzielle Energie verwandelt und umgekehrt,
wobei die Summe aus beiden konstant bleibt. Läuft das Teilchen einen Potenzialberg hinab, so
wird es schneller, das heißt es wird potenzielle in kinetische Energie verwandelt. Läuft es einen
Potenzialberg hinauf, so wird die kinetische Energie wieder in potenzielle Energie verwandelt.
Wir sagen auch, dass bei einem solchen Prozess Arbeit verrichtet wird. Unter Arbeit verstehen
wir im allgemeinen einen Prozess, bei dem eine Energieform in eine andere verwandelt wird.
feststellen, welche Werte überhaupt annehmen kann. Die kinetische Energie kann nicht negativ sein, da sie proportional zum Quadrat der Geschwindigkeit ist. Die Energie ist daher immer
mindestens so groß wie das Potenzial an dem Ort, an dem sich das Teilchen gerade befindet,
(7.7)
,
Insbesondere muss mindestens so groß sein wie das absolute Minimum der Funktion
falls es ein solches gibt. Ansonsten ist nicht nach unten beschränkt.
Wenn wir einen bestimmten Wert von vorgeben, dann wird durch die Forderung (7.7) eine
Bedingung an gestellt. In Abbildung 7.2 sind drei typische Fälle dargestellt, wobei der jeweils
zulässige Bereich schattiert ist. Im Fall (a) ist die Bedingung
für alle erfüllt. Die
Energie
ist größer als das absolute Maximum der Potenzialfunktion. Im Fall (b) gilt
nur für
, also in einem nach oben unbeschränkten aber nach unten beschränkten
Intervall. Natürlich ist auch der umgekehrte Fall denkbar, dass
nur für
gilt.
Im Fall (c) schließlich erfordert die Bedingung
, dass in einem nach oben und unten
liegt.
beschränkten Intervall
Was bedeutet das konkret für die Lösungen der Bewegungsgleichung? Nehmen wir an, wir
gegeben und kennen den zugehörigen Wert von . Dann gilt
hätten eine spezielle Lösung
natürlich
für alle . Also ist der Wertebereich von
auf den Bereich eingeschränkt, in dem
ist. Die Bewegung findet ganz innerhalb des jeweils erlaubten Bereichs statt. Das Teilchen kann diesem Bereich nicht entkommen, weil es, anschaulich formuliert,
nicht genug Energie hat, um den Potenzialberg weiter hinauf zu steigen als bis zum Rand des
Aufgabe 7.1 Ein Teilchen fällt senkrecht in in einem Gravitationsfeld, das heißt es gelte
. Man bestimme das Potential
und zeige anhand der bekannten L ösungen der Bewegungsgleichung, dass die Energie tatsächlich zeitlich konstant ist.
für einen ungedämpften harmonischen OszilAufgabe 7.2 Man bestimme das Potenzial
lator und zeige, dass eine Potenzialmulde wie in Abbildung 7.1(c) vorliegt, in der das Teilchen
schwingen kann. Man berechne für die bekannte Lösung (6.12) die Energie und zeige, dass sie
nicht von abhängt.
Bewegungsformen
Mit Hilfe einer Erhaltungsgröße können wir die Lösungen der Bewegungsgleichung klassifizieren. Wir können sie gewissermaßen nach dem Wert von sortieren. Dazu müssen wir zunächst
89
(d)
jeweiligen Intervalls.
Wir können sogar noch mehr über diese Bewegung aussagen, ohne die Funktion
explizit
zu kennen. Nehmen wir an, das Teilchen befindet sich gerade an einer Stelle innerhalb des
erlaubten Bereiches. Dann können wir seine Geschwindigkeit berechnen, denn laut (7.6) gilt
(7.8)
(b)
(a)
Die Differenz
ist die Höhe des schattieren Bereichs in Abbildung 7.2 an der Stelle . Sie bestimmt, welcher Teil der Energie auf die kinetische Energie entfällt, und damit die
Geschwindigkeit bis auf ihr Vorzeichen.
Wir wissen also, wie schnell das Teilchen ist. Es ist umso schneller, je tiefer das Potenzial an
der Stelle ist, an der es sich gerade befindet. Allerdings wir wissen nicht, in welche Richtung es
sich gerade bewegt. Aber wir wissen, dass die Geschwindigkeit eine stetige Funktion der Zeit ist.
Also kann sie ihr Vorzeichen nur dann ändern, wenn sie den Wert Null durchläuft. Das wiederum
ist nur an den Rändern des jeweils zulässigen Bereichs der Fall, an denen
ist, also
an der Stelle
in Abbildung 7.2(b), bzw. an den Stellen
oder
in
Abbildung 7.2(c).
Daraus können wir folgenden Schluss ziehen. Solange das Teilchen nicht den Rand des zulässigen Intervalls erreicht, bewegt es sich in eine Richtung. Seine Geschwindigkeit ist dabei durch
die Gleichung (7.8) bestimmt, wobei das Vorzeichen durch die Bewegungsrichtung festgelegt ist.
Erreicht es den Rand des zulässigen Bereichs, so wird es dort abgebremst und kehrt seine Bewegungsrichtung um. Anschließend bewegt es sich in die andere Richtung, bis es wieder den Rand
des zulässigen Bereichs erreicht, oder für immer, wenn es keinen anderen Rand gibt.
Insgesamt ergibt sich daraus der folgende Bewegungsablauf. Wenn die Energie , wie in Abbildung 7.2(a), größer als das absolute Maximum des Potenzial ist, dann läuft das Teilchen einmal
von links nach rechts oder von rechts nach links durch, ohne jemals umzukehren. Seine Geschwindigkeit passt sich dabei dem Verlauf des Potenzials an, das heißt das Teilchen wird abwechseln
schneller und langsamer, aber es hält nie an. Ist der erlaubte Bereich wie in Abbildung 7.2(b)
nach unten beschränkt, so kehrt das Teilchen dort, von rechts kommend, um, und läuft wieder
nach rechts weg. Ist der zulässige Bereich wie in Abbildung 7.2(c) ein endliches Intervall, so
bleibt dem Teilchen schließlich nichts anderes übrig als zwischen den beiden Umkehrpunkten zu
pendeln.
unterscheiden wir alJe nach dem Wert von und dem Verlauf der Potenzialfunktion
so verschiedene Bewegungsformen. Das Teilchen kann immer in eine Richtung laufen, einmal
umkehren, oder periodisch zwischen zwei Umkehrpunkten pendeln. Für verschiedene Werte von
können sich dabei verschiedene Bewegungsformen ergeben. So ist zum Beispiel in Abbildung 7.2(b) auch eine Pendelbewegung möglich, wenn wir die Energie etwas niedriger ansetzen,
und in Abbildung 7.2(c) ist auch eine von links einlaufendes und wieder nach links auslaufendes
Teilchen möglich, wenn die Energie etwas höher ist.
können wir also unmittelbar das qualitative VerhalAus dem Graf der Potenzialfunktion
(c)
Abbildung 7.3: Verschiedene Spezialfälle, die bei der Diskussion der Bewegungsformen in einem
Potenzial auftreten können.
ten des Teilchens ablesen, ohne die Bewegungsgleichung explizit lösen zu müssen. Wir müssen
dazu nur seine Energie kennen, da sich abhängig von der Energie im allgemeinen verschiedene
Bewegungsformen ergeben.
Das Potenzial eines eindimensionalen Systems bestimmt die möglichen Bewegungsformen.
Die drei wichtigsten Bewegungsformen sind die in Abbildung 7.2 dargestellten. Es gibt aber
noch gewisse Grenz- und Sonderfälle, die in Abbildung 7.3 dargestellt sind und in den folgenden
Aufgaben diskutiert werden sollen.
gegeben, das bei
ein Minimum hat, mit
Aufgabe 7.3 Es sei ein Potenzial
,
und
. Dann lässt sich des Potenzial in der Nähe des Minimums
durch eine quadratische Funktion approximieren,
(7.9)
Man zeige, dass sich ein Teilchen, das in der Nähe dieser Potenzialmulde pendelt, näherungsweise
wie ein harmonischer Oszillator verhält. Man bestimme die Eigenfrequenz dieses Oszillators.
.
Aufgabe 7.4 Das Potential in Abbildung 7.3(a) hat ein lokales Maximum an der Stelle
Es sei
. Es soll gezeigt werden, dass das Teilchen in diesem Fall keine
Pendelbewegung ausführt, und auch nicht über den Punkt
hinaus läuft, was ja erlaubt wäre,
der Stelle
asymptotisch nähert und dort für immer liegen
sondern dass es sich für
bleibt. Man stelle dazu das Potenzial für
näherungsweise durch eine quadratische
90
Funktion dar,
(7.10)
mit
Da wir hier das Vorzeichen festlegen müssen, betrachten wir immer nur ein Teilstück der Bewegung, bei der das Teilchen sich in eine Richtung bewegt. Im Falle einer Pendelbewegung ist dies
das Teilstück zwischen zwei Umkehrpunkten. Aus der allgemeinen Diskussion der möglichen Bewegungsformen wissen wir, wie wir den Bewegungsablauf in solche Teilstücke zerlegen können.
Es genügt daher, die Bewegungsgleichung stückweise zu lösen und die Lösungen entsprechend
zusammenzusetzen. Der Einfachheit halber betrachten wir hier zunächst eine Bewegung nach
rechts, wählen also das positive Vorzeichen.
Um die Differenzialgleichung (7.12) zu lösen, benutzen wir die Methode der Separation der
Variablen, die wir bereits aus Kapitel 4 kennen. Wir schreiben die Bewegungsgleichung wie folgt
um,
und löse die Bewegungsgleichung (7.8) in der Nähe dieser Stelle für ein Teilchen, das sich von
links nähert, also für
und
. Man zeige, dass die Geschwindigkeit des Teilchens
exponentiell gegen Null geht und bestimme die Relaxationszeit, also diejenige Zeit, in der die
Geschwindigkeit um den Faktor
abfällt. Welche Bewegungsformen sind für
noch
möglich?
einem GrenzAufgabe 7.5 In Abbildung 7.3(b) ist ein Potenzial dargestellt, das sich f ür
wert
von unten nähert. Für große gelte
, wobei
eine Konstante ist und der Exponent
bestimmt, wie schnell sich das Potenzial dem Grenzwert nähert. Welcher qualitative Bewegungsablauf ist für
,
bzw.
zu
erwarten? Wie sieht im Fall
die Funktion
für
aus?
(7.13)
bis
und integrieren anschließend beide Seiten über ein Zeitintervall von
,
in zwei
Aufgabe 7.6 In Abbildung 7.3(c) ist der Fall dargestellt, dass die Bedingung
getrennten Intervallen erfüllt ist. Wie sieht in diesem Fall die Bewegung des Teilchen aus? Welche
Bewegungsformen sind in dem dargestellten Potenzial noch möglich?
(7.14)
Aufgabe 7.7 Für ein mathematisches Pendel der Länge im Schwerefeld hatten wir die Bewegungsgleichungen (5.45) hergeleitet. Wir betrachten den einfachen Fall, dass das Pendel nur in
konst ist. Die Bewegungsgleichung lautet dann
einer Ebene schwingt, also
Das Integral auf der linken Seite können wir sofort ausrechnen. Auf der rechten Seite führen wir
eine Substitution durch, indem wir die Integrationsvariable durch ersetzen,
(7.15)
(7.11)
wobei als periodische Koordinate
betrachtet werden kann. Die Gleichung ist so
geschrieben, dass auf beiden Seite eine Größe der Dimension Kraft steht. Man bestimme das
Potenzial
, skizziere es und beschreibe die möglichen Bewegungsformen, einschließlich der
Grenzfälle.
Hier haben wir
und
gesetzt. Das sind die Orte, an denen sich das Teilchen
zu Beginn und am Ende des Zeitintervalls befindet, über das wir integriert haben.
, die das Teilchen benötigt, um von
nach
zu
Das Integral (7.15) liefert die Zeit
gelangen. Damit es wohldefiniert ist, muss offenbar
sein, und zwar im gesamten Integrationsintervall
. An den Rändern des Intervalls können wir
zulassen,
solange das Integral dann noch konvergiert. Das ist genau die Bedingung, die sich aus der allgemeinen Diskussion der möglichen Bewegungsformen ergibt. Das Teilchen kann genau dann
nach
gelangen, wenn beide Orte innerhalb des erlaubten Bereiches liegen, der in den
von
Abbildungen 7.1 und (7.2) dargestellt sind.
Im Prinzip haben wir damit die Bewegungsgleichung gelöst, jedenfalls für einen Bahnabschnitt, in dem sich das Teilchen von links nach rechts bewegt. Nehmen wir an, wir geben als
Anfangsbedingung
und
vor. Dann können wir daraus die Energie
berechnen, die wir in (7.15) einsetzen müssen. Sie ist durch den Ausdruck (7.6) gegeben, ausgewertet für
. Wenn wir dann noch in (7.15)
und
setzen und für
und
wurde durch das Kraftgesetz
nur bis auf eine additiAufgabe 7.8 Das Potential
ve Konstante festgelegt. Warum hängen die möglichen Bewegungsformen eines Teilchens nicht
davon ab, wie wir diese Konstante wählen? Mit anderen Worten, warum unterscheiden sich
die möglichen Bewegungsformen in einem Potenzial
nicht von denen in einem Potenzial
?
Nachdem wir das qualitative Verhalten der Bewegung aus dem Verlauf der Potenzialfunktion
abgelesen haben, können wir versuchen, die Bewegungsgleichung explizit zu lösen. Wir gehen
dabei von der Differenzialgleichung (7.8) aus,
Integration der Bewegungsgleichung
91
(7.12)
und schreiben, so ergibt sich eine Beziehung zwischen und , nämlich
Als weniger triviales Beispiel wollen wir die Bewegung in einem konstanten Kraftfeld betrachten, zum Beispiel im Schwerefeld der Erde. Es gilt dann
einfach
(7.18)
mit
(7.16)
Eine konstante Kraft ist durch ein linear ansteigendes Potenzial gekennzeichnet. Da es nicht nach
unten beschränkt ist, kann die Energie jeden beliebigen Wert annehmen. Jedoch ist der erlaubte
Bereich der Ortskoordinate stets nach oben begrenzt. Ein Teilchen mit der Energie erreicht
maximal eine Höhe
. Es gibt nur eine mögliche Bewegungsform. Das Teilchen
, und fällt anschließend
nähert sich von unten, erreicht zu einer Zeit eine maximale Höhe
wieder herab.
Betrachten wir zuerst den Abschnitt
, in dem das Teilchen nach oben steigt. Dann ist
und es gilt laut (7.15)
Wenn es uns gelingt, diese Gleichung nach aufzulösen, dann haben wir die entsprechende
Lösung
der Bewegungsgleichungen gefunden. Sie erfüllt die Anfangsbedingungen
und
.
Auf diese Weise können wir für jeden einzelnen Bahnabschnitt jeweils eine Lösung der Bewegungsgleichung finden. Das ist weniger kompliziert, als es zunächst den Anschein hat. Bewegt
sich das Teilchen im nächsten Bahnabschnitt von rechts nach links, so müssen wir nur das Vorzeichen der Wurzel umdrehen. Außerdem ist die Energie für jeden Bahnabschnitt dieselbe.
Daher müssen wir letztlich nur einmal das Integral (7.15) ausrechnen. Wir müssen nur jeweils die
Anfangsbedingungen anpassen, um die Bahnabschnitte anschließend richtig zusammenzusetzen.
Wie das geht, werden wir gleich an ein paar einfachen Beispielen demonstrieren.
(7.19)
Aufgabe 7.9 Das Potenzial
war durch das Kraftgesetz
nur bis auf eine additive Konund
stante festgelegt. Warum ist der durch (7.15) hergestellte Zusammenhang zwischen
unabhängig von dieser Konstante?
Das Integral, das wir berechnen müssen, ist
Zwei einfache Beispiele
(7.20)
Wir wollen das Verfahren an zwei sehr einfachen Beispielen erläutern. Zuerst betrachten wir ein
. Es ist also
freies Teilchen. In diesem Fall lautet die Bewegungsgleichung
und wir können auch
setzen. Für die Energie muss dann
gelten. Der Fall
ist uninteressant, denn dann ruht das Teilchen einfach an irgendeinem Ort. Für
liegt der
Fall aus Abbildung 7.2(a) vor, das heißt das Teilchen bewegt sich für alle Zeiten in eine Richtung.
Dies sei der Einfachheit halber wieder die positive Richtung. Aus (7.15) ergibt sich in diesem Fall
Der Einfachheit halber setzen wir
und somit
, das heißt wir integrieren bis zum
Umkehrpunkt. Außerdem schreiben wir für und einfach und . Dann vereinfacht sich das
Ergebnis zu
(7.22)
(7.21)
Aufgelöst nach ergibt sich daraus
(7.17)
Tatsächlich gilt für ein freies Teilchen
, wenn
seine konstante Geschwindigkeit
ist. Die Beziehung (7.17) lautet also, einfacher ausgedrückt,
. Und das ist
natürlich genau das erwartete Ergebnis. Bewegt sich das Teilchen nach links, so müssen wir in
, wobei jetzt
(7.17) nur das Vorzeichen umdrehen. Auch dann gilt wieder
ist.
Das freie Teilchen ist natürlich ein sehr einfaches Beispiel, da es nur ganz einfache Bewegungsformen gibt. Das Teilchen kann entweder für immer nach rechts oder für immer nach links
laufen, oder für immer ruhen. Es gibt keine Umkehrpunkte, so dass wir die Bahn nicht stückweise
berechnen müssen.
also die übliche Darstellung einer gleichmäßig beschleunigten Bewegung. Sie gilt zunächst nur
, da wir nur für diesen Bahnabschnitt die Bewegungsgleichung gelöst haben.
für
, also für den Bahnabschnitt nach dem Umkehrpunkt, ergibt sich in (7.21) das
Für
umgekehrte Vorzeichen der Wurzel. Denn nun ist
, das heißt wir müssen beim Auflösen der
Definition der Energie nach der Geschwindigkeit das umgekehrte Vorzeichen der Wurzel wählen.
diese
Es ergibt sich jedoch dieselbe Funktion (7.22), da wir zum Auflösen der Gleichung nach
quadrieren müssen. Außerdem müssen wir beim Zusammensetzen der beiden Bahnabschnitte
dieselben Parameter und
wählen.
92
Diese Parameter übernehmen hier die Rolle der Anfangsbedingungen. Wir erinnern uns, dass
wir stets zwei Anfangsbedingung stellen müssen, also zwei Integrationskonstanten festlegen
müssen, um eine eindeutige Lösung der Bewegungsgleichung zu bekommen. Eine dieser Integrationskonstanten ist bei dem hier entwickelten Verfahren die Energie . In den gerade diskutierten
speziellen Fall entspricht das dem Festlegen der maximalen Steighöhe
, die zur Energie in
einer einfachen Beziehung steht.
Als zweite Integrationskonstante können wir stets eine Zeit wählen, zum Beispiel die Zeit, in
der das Teilchen einen bestimmten Umkehrpunkt der Bahn erreicht, oder zu der es einen bestimmten Ort passiert. Das bietet sich deshalb an, weil wir dazu nur eine der beiden Integrationsgrenzen
entsprechend festlegen müssen. Oft hängt es aber auch von der jeweilige Fragestellung ab, welche
Integrationsgrenzen man am besten wählt und wie die Lösungen an die gestellten Anfangsbedingungen anzupassen sind.
kann oder implizit durch ein bestimmtes Integral definiert wird. Letztlich sind ja auch die elementaren Funktionen implizit durch ihre mathematischen Eigenschaften definiert, und es ist eine
willkürliche Entscheidung, welchen solchen Funktionen man einen speziellen Namen gibt und
welchen nicht. Wir können daher das Problem, die Bewegungen eines eindimensionalen mechanischen Systems zu beschreiben, durch das Integral (7.15) als gelöst betrachten.
Es stellt sich nun die Frage, ob eine ähnliche Methode auch auf mehrdimensionale Systeme
anwendbar ist. Betrachten wir ein frei bewegliches Teilchen in einem Kraftfeld, das nur vom Ort
abhängt,
(7.24)
Aufgabe 7.10 Eine sehr typische Fragestellung ist die folgende. Es sei ein Potential
mit einer Mulde gegeben, in der das Teilchen schwingen kann. Man bestimme die Schwingungsperiode
in Abhängigkeit von der Energie . Man zeige, dass diese durch das Integral
Unter gewissen Bedingungen gibt es auch für dieses System eine Erhaltungsgröße , nach der
wir die Lösungen klassifizieren können. Um sie zu finden, wiederholen wir den entscheidenden
Schritt aus dem ersten Abschnitt. Wir multiplizieren die Bewegungsgleichung mit der Geschwindigkeit. Da es sich nun um eine Vektorgleichung handelt, müssen wir jetzt das Skalarprodukt
bilden,
(7.25)
Definieren wir analog zu einem Teilchen mit nur einem Freiheitsgrad die kinetische Energie als
halbe Masse mal Geschwindigkeit zum Quadrat, so ergibt sich
(7.23)
die Umkehrpunkte einzusetzen sind, die sich aus
und
gegeben ist, wobei für
ergeben.
(7.26)
Aufgabe 7.11 Vom harmonischen Oszillator wissen wir, dass seine Schwingungsperiode immer gleich, also insbesondere unabhängig von der Energie ist. Es soll gezeigt werden, dass der
harmonische Oszillator das einzige derartige System ist. Wir betrachten dazu ein symmetrisches
, das nach beiden Seiten hin monoton ansteigt,
für
Potenzial
und
für
. Man zeige, dass die in (7.23) definierte Funktion
genau dann
ist.
konstant ist, wenn
Die Änderung der kinetischen Energie, also die pro Zeit vom Kraftfeld geleistete Arbeit, ist durch
das Skalarprodukt von Kraft und Geschwindigkeit gegeben. Man bezeichnet diese Größe auch als
die Leistung des Kraftfeldes.
Im Falle eines Systems mit einem Freiheitsgrad konnten wir die Leistung durch die Zeitableitung eines Potenzials ausdrücken, und daraus ergab sich die Gesamtenergie als Erhaltungsgröße.
Hier ist das nicht mehr ohne weiteres möglich. Wenn das Kraftfeld von einer speziellen Art ist,
gibt es aber auch hier ein Potenzial und damit eine erhaltene Energie.
Um herauszufinden, wann das der Fall ist, führen wir ein kartesisches Koordinatensystem ein
und zerlegen sowohl den Ortsvektor und die Geschwindigkeit,
Konservative Kraftfelder
(7.27)
Mit der gerade entwickelten Methode ist es offenbar möglich, jede Bewegungsgleichung eines
mechanischen Systems mit einem Freiheitsgrad zu lösen, sofern die Kraft allein vom Ort abhängt.
Wir müssen dazu nur die Bahn in Teilstücke zerlegen, ein bestimmtes Integral berechnen und eine
einfache reelle Gleichung lösen. Natürlich wird es im allgemeinen nicht wie in den gerade gezeigten einfachen Beispielen gelingen, die Lösung
durch elementare Funktionen auszudrücken.
Aber das ist nicht entscheidend.
Es spielt letztlich für eine konkrete physikalische Fragestellung keine Rolle, ob die Lösung
,
,
etc. ausgedrückt werden
einer Bewegungsgleichung explizit durch Funktionen wie
als auch das Kraftfeld in Komponenten,
(7.28)
jeweils eine Funktion von drei Koordinaten
Man beachte, dass jede Kraftkomponente
Die Leistung lässt sich dann wie folgt schreiben,
ist.
93
(7.29)
. Ist der Ortsvektor eine Funknach der Zeit
Nun betrachten wir eine skalare Funktion
tion der Zeit, so gilt für die Ableitung der Funktion
(7.30)
Daraus können wir folgenden Schluss ziehen. Wenn sich die Komponenten des Kraftfeldes
als partielle Ableitungen einer skalaren Funktion
schreiben lassen,
(7.31)
dabei zum Beispiel um eine beschränkte Teilmenge des Euklidischen Raumes, so können wir
daraus schließen, dass das Teilchen gebunden ist, also nicht ins Unendliche entkommen kann.
Oft lassen sich weitere Erhaltungsgrößen finden, etwa der Drehimpuls in einem Zentralkraftfeld, mit deren Hilfe sich die Bewegungengleichungen dann vollständig lösen lassen, so wie im
gerade diskutieren eindimensionalen Systemen. Ein wichtiges Beispiel dafür werden wir im Kapitel 8 ausführlich diskutieren. Mit Hilfe der Energie- und Drehimpulserhaltung ist es nämlich
möglich, die Bewegungsgleichung für ein Teilchen im Gravitationsfeld eines anderen Teilchens
vollständig zu lösen. Wir können also alle möglichen Planetenbahnen im Kraftfeld der Sonne
angeben. Zuvor werden wir jedoch noch ein paar grundsätzliche Eigenschaften von Kraftfeldern
diskutieren.
ein Potenzial
Aufgabe 7.12 Man zeige, dass für das lineare Kraftgesetz
existiert und bestimme es.
dann ist
(7.32)
Aufgabe 7.13 Auch das Newtonsche Gravitationsgesetz ist konservativ. Wir betrachten das Kraftfeld, das von einem ortsfesten Teilchen der Masse
erzeugt wird, und in dem sich ein Teilchen
der Masse bewegt. Es gilt dann
und somit ergibt sich aus (7.25)
(7.33)
(7.35)
Lässt sich ein Kraftfeld in dieser Art und Weise durch ein Potenzial
darstellen, so existiert
eine Erhaltungsgröße, die Energie , die sich analog zu (7.6) aus einem kinetischen und einem
potenziellen Anteil zusammensetzt,
Man zeige, dass dieses Kraftgesetz aus dem Potenzial
(7.36)
(7.34)
abgeleitet werden kann.
Ein Kraftfeld, für das ein solches Potenzial existiert, heißt konservatives Kraftfeld. Die Bezeichnung soll andeuten, dass in einem konservativen Kraftfeld die Energie erhalten, also “konserviert”
ist. Wie im eindimensionalen Fall wird während der Bewegung des Teilchens Arbeit verrichtet,
also fortwährend kinetische in potentielle Energie verwandelt und umgekehrt.
Gradient, Divergenz und Rotation
Wir wollen der Frage nachgehen, wann ein gegebenes Kraftfeld konservativ ist und wann nicht.
Mit anderen Worten, welche Eigenschaften muss ein Kraftfeld
haben, damit es sich in der
darstellen lässt?
Form (7.31) als “Ableitung” eines Potenzials
Bevor wir uns konkret dieser sehr speziellen Frage zuwenden, führen wir ein paar allgemeine
Begriffe ein, die mit Ableitungen von Feldern im Raum zu tun haben. Unter einem Feld verstehen
ist. Ein skalares Feld ist
wir eine Abbildung, deren Definitionsbereich der Euklidische Raum
eine Abbildung des Raumes in die reellen Zahlen,
In einem konservativen Kraftfeld ist die Energie eine Erhaltungsgröße
Befindet sich das Teilchen an einem Ort und hat es eine Energie , so können wir aus der
und
den Betrag der Geschwindigkeit bestimmen. Allerdings wisDifferenz zwischen
sen wir dadurch noch nichts über die Richtung, in die sich das Teilchen bewegt, und anders als
im eindimensionalen Fall gibt es nicht nur zwei mögliche Bewegungsrichtungen. Daher führt
die Energieerhaltung nicht wie im eindimensionalen Fall unmittelbar auf eine Lösung der Bewegungsgleichung.
Viele der Schlussfolgerungen, die wir für eindimensionale System hergeleitet haben, lassen
sich aber übertragen. So ergibt sich zum Beispiel aus der Tatsache, dass die kinetische Energie
immer positiv ist, eine Einschränkung an die Bewegungsfreiheit eines Teilchens. Hat ein Teilchen
ist. Handelt es sich
die Energie , so kann es sich nur an Orten aufhalten, an denen
(7.37)
skalares Feld
Ein Vektorfeld ist entsprechend eine Abbildung des Euklidischen Raumes
in den zugeordneten Vektorraum . Es ordnet jedem Punkt einen Vektor zu, den wir bezüglich einer beliebigen
94
in seine Komponenten zerlegen können,
Orthonormalbasis
kann aber auch auf Vektorfelder wirken. Zum
Ergebnis wieder ein Vektor ist. Der Operator
Beispiel können wir das Skalarprodukt von mit einem Vektorfeld
bilden,
(7.38)
Vektorfeld
(7.43)
Divergenz
Benutzen wir dieselbe Orthonormalbasis verwenden, um auch den Ortsvektor in seine Komponenten
zu zerlegen, so können wir jedes Feld als Funktion der drei Koordinaten
darstellen,
Das Ergebnis ist ein skalares Feld, das durch Summation aus den partiellen Ableitungen (7.40)
gebildet wird. Es wird auch Divergenz des Vektorfeldes
der Komponenten des Vektorfeldes
genannt und mit
bezeichnet.
Wenn wir statt des Skalarproduktes das Kreuzprodukt des Operators mit einem Vektorfeld
bilden, so ist das Ergebnis wieder ein Vektorfeld,
(7.39)
(7.44)
Rotation
Dabei handelt es sich um gewöhnliche reelle Funktionen von jeweils drei Variablen. Wenn diese
Funktionen differenzierbar sind, können wir ihre partiellen Ableitungen bilden. Wir schreiben
dafür
(7.40)
bezeichnet, und man verwendet dafür die
Dieses Vektorfeld wird auch als Rotation von
.
Schreibweise
Wir können also mit Hilfe des Operators auf drei verschiedene Arten räumliche Ableitungen
von Skalar- bzw. Vektorfeldern bilden. Diese entsprechen formal den drei Möglichkeiten, Skalare
bzw. Vektoren zu multiplizieren. Der Gradient entspricht der skalaren Multiplikation und bildet
ein skalares Feld auf ein Vektorfeld ab. Die Divergenz entspricht dem Skalarprodukt und bildet
ein Vektorfeld auf ein skalares Feld ab. Die Rotation ergibt sich aus dem Kreuzprodukt und bildet
ein Vektorfeld wieder auf ein Vektorfeld ab.
das heißt das Symbol bezeichnet die partielle Ableitung einer Funktion nach der Koordinate
.
Betrachten wir nun speziell ein skalares Feld
und seine partiellen Ableitungen
.
Diese lassen sich zu einem Vektorfeld zusammenfassen, das wir mit
(7.41)
Gradient
bezeichnen. Dieses Vektorfeld heißt Gradient von und wird oft auch mit
bezeichnet.
Der Gradient ist in gewissem Sinne die räumliche Verallgemeinerung der gewöhnlichen Ableitung einer Funktion von einer reellen Variablen. Da es im Raum drei Koordinaten gibt, hängt eine
reelle Funktion auf dem Raum von drei Variablen ab. Folglich hat sie drei partielle Ableitungen,
das heißt ihre Ableitung hat drei Komponenten, die man zu einem Vektor zusammenfassen kann.
Das Symbol , mit dem man diese Ableitung bezeichnet, heißt Nabla. Das Wort leitet sich von
der hebräischen Bezeichnung für ein antikes Saiteninstrument ab, das in etwa die Form dieses Zeichens hatte. Manchmal wird fälschlicherweise behauptet, es handele sich um einen althebräischen
Buchstaben. Das Zeichen als solches wurde aber erst in der modernen Mathematik “erfunden”.
Es soll ein auf den Kopf gestelltes Delta darstellen.
als einen Differenzialoperator vorzustellen. Wenn er auf
Es ist nützlich, sich das Symbol
eine skalare Funktion “wirkt”, erzeugt er den Gradienten
dieser Funktion. Wir schreiben
dafür auch formal
Nabla
(7.42)
Aufgabe 7.14 Man bestimme den Gradienten den folgenden skalaren Felder,
(7.45)
Die Vektoren
sind Konstanten, die Funktion
ist stetig und differenzierbar. Welche
zusätzliche Bedingung muss im letzten Beispiel erfüllen, damit
an der Stelle
wohldefiniert ist?
Aufgabe 7.15 Man bestimme die Divergenz und die Rotation der folgenden Vektorfelder,
(7.46)
Die Vektoren
sind Konstanten, die Funktion
ist stetig und differenzierbar. Welche
zusätzliche Bedingung muss im letzten Beispiel erfüllen, damit
an der Stelle
wohldefiniert ist?
wobei wir uns vorstellen, dass die Ableitungen jeweils auf eine rechts von dem Operator stehende Funktion wirken, so wie in (7.41).
Der Vektorpfeil über dem Symbol deutet an, dass sich dieser Differenzialoperator ansonsten
wie ein Vektor verhält. In (7.41) wird dieser Vektor mit dem Skalar multipliziert, so dass das
ein beliebiges skalares Feld. Dann ist
ein Vektorfeld und
ebenfalls ein Vektorfeld. Man zeige, dass dieses Vektorfeld gleich
Aufgabe 7.16 Es sei
folglich
Null ist.
95
PSfrag replacements
eine
, wobei
mit
Aufgabe 7.17 Gibt es ein nicht verschwindendes Vektorfeld
vorgegebene Konstante ist?
(c)
(d)
Aufgabe 7.18 Für den Ableitungsoperator gelten verschiedene Produktregeln. Man drücke die
folgenden Ableitungen jeweils durch die Ableitungen, also den Gradienten, die Rotation bzw. die
Divergenz der einzelnen Felder aus,
(7.47)
Aufgabe 7.19 Wie führen einen weiteren Differentialoperator ein, der sowohl auf skalare als
auch auf Vektorfelder wirken kann. Es ist ein skalarer Operator . Er bildet die zweiten Ableitungen nach den Koordinaten und summiert über diese,
(b)
(a)
Abbildung 7.4: Um das Wegintegral eines Vektorfeldes zu berechnen, zerlegt man den Weg
und infinitesimale Teilstücke, dargestellt durch Vektoren
. Dann bildet man jeweils das Skalarprodukt dieser Vektoren mit dem Vektorfeld und summiert über alle Teilstücke (a). Integriert
man den Gradienten eines skalaren Feldes entlang eines Weges, so erhält man die Differenz
der Werte des Feldes am Anfangs- und Endpunkt (b).
(7.48)
und für ein Vektorfeld
die folgenden Identitäten gelten,
Man zeige, dass für ein skalares Feld
(7.49)
Richtungsableitung und Wegintegral
Es stellt sich nun die Frage, ob es für diese Ableitungen von Feldern auch jeweils eine anschaueiner gewöhnlichen reelliche geometrische Interpretation gibt, etwa so wie die Ableitung
len Funktion
als Steigung interpretiert werden kann. Außerdem können wir uns fragen, ob
sich die Ableitungsoperationen umkehren lassen. Mit anderen Worten, gibt es so etwas wie eine
Stammfunktion eines Vektorfeldes bzw. eines skalaren Feldes?
Tatsächlich ist der Gradient so etwas wie die Steigung eines skalaren Feldes. Jedoch hängt die
Steigung eines Feldes davon an, in welche Richtung man sich im Raum bewegt. Es sei irgendein
Ort und ein Vektor, der eine Richtung definiert. Das kann, muss aber kein Einheitsvektor sein.
Dann können wir folgende Frage stellen. Wie stark steigt ein skalares Feld an, wenn wir uns an
der Stelle in Richtung des Vektors bewegen?
Die Antwort auf diese Frage gibt die Richtungsableitung des Feldes an der Stelle in Richtung des Vektors . Sie ist wie folgt definiert,
Wenn ein Einheitsvektor ist, so ist die Richtungsableitung die orthogonale Projektion von
auf . Diese Projektion ist dann maximal, wenn in die gleiche Richtung zeigt wie
. Daraus ergibt sich die folgende geometrisch anschauliche Interpretation des Gradienten.
zeigt in diejenige Richtung, in die das Feld an der Stelle am stärksten
Der Vektor
ansteigt. Der Betrag dieses Vektors gibt an, wie stark dieser Anstieg ist.
Aufgabe 7.20 Die Niveauflächen eines skalaren Feldes sind die Flächen mit
konst. Im
allgemeinen liegt jeder Punkt auf genau einer solchen Niveaufl äche. Man zeige, dass der Vektor
stets senkrecht auf der durch verlaufenden Niveaufläche steht.
Wenn
die Steigung des skalaren Feldes
ist, lässt sich dann das Feld
aus
bis auf eine Konstante rekonstruieren, so wie man eine reelle Funktion
aus ihrer Ableitung
rekonstruieren kann? Mit anderen Worten, kann man ein Vektorfeld irgendwie integrieren,
um wieder ein skalares Feld zu erhalten?
In Abbildung 7.4(a) ist die Definition einer speziellen Art von Integration im Raum dargestellt.
Wir wollen zeigen, dass diese Integration im wesentlichen die Umkehrung des Gradienten ist.
Sie wird wie folgt ausgeführt. Gegeben sei eine Kurve im Raum, die wir mit bezeichnen. Sie
beschrieben,
verbindet zwei Punkte und , und sie wird durch eine Ortsvektordarstellung
mit
. Ferner sei ein Vektorfeld
gegeben.
Wir definieren dann das Wegintegral des Feldes entlang der Kurve wie folgt. Zuerst zerlegen wir die Kurve in Teilstücke, indem wir sie an den Stellen
, , ,
,
(7.50)
Wie man leicht mit Hilfe der Kettenregel zeigt, kann man die Richtungsableitung durch den Gradienten von an der Stelle ausdrücken,
(7.51)
wird durch den Diffe-
96
Die Richtungsableitung eines skalaren Feldes in Richtung eines Vektors
renzialoperator
gebildet.
zerschneiden. Die Ortsvektoren dieser Schnittstellen bezeichnen wir mit
Teilstück ordnen wir außerdem einen Vektor zu,
. Jedem
Wir können das Wegintegral berechnen, indem wir den Tangentenvektor der Kurve mit dem Vektorfeld multiplizieren, und anschließend ein gewöhnliches reelles Integral ausführen.
Aufgabe 7.21 Man beweise durch eine einfache Substitution, dass das so definierte Wegintegral
unabhängig davon ist, wie man den Weg parametrisiert. Das Wegintegral h ängt also nur vom
Weg und vom Vektorfeld ab, nicht jedoch von der speziellen Wahl der Funktion
.
(7.52)
Anschließend bilden wir für jedes Teilstück das Skalarprodukt dieses Vektors mit dem Wert des
Feldes
am Anfang des Teilstückes. Das Ergebnis
Es ist jetzt nur noch ein kleiner Schritt, zu beweisen, dass das Bilden des Wegintegrals so etwas
ist wie die Umkehrung des Gradienten. Dazu sei ein Vektorfeld
gegeben und ein
beliebiger Weg , der die Punkte und miteinander verbindet, so wie in Abbildung 7.4(b)
dargestellt. Für das Wegintegral gilt dann
(7.53)
auf das Kurvenstück
ist die in Abbildung 7.4(a) dargestellte orthogonale Projektion von
, multipliziert mit dessen Länge.
Schließlich summieren wir über die einzelnen Kurvenstücke und bilden den Grenzwert, in dem
die Anzahl der Kurvenelemente gegen Unendlich und deren Länge gegen Null geht. Das Ergebnis
nennen wir das Wegintegral des Vektorfeldes entlang der Kurve und schreiben dafür
(7.58)
in Richtung des
Nun ist der Integrand aber nichts anderes als die Richtungsableitung des Feldes
Tangentenvektors, also entlang der Kurve,
(7.54)
Wegintegral
(7.59)
und folglich können wir das Integral (7.58) ausführen,
Diese Definition des Wegintegrals ist ganz analog zur üblichen Definition eines Integrals auf der
reellen Achse zu verstehen. Um eine Funktion
über ein Intervall von bis zu integrieren,
zerlegen wir das Intervall in Teilintervalle, indem wir es an der Stellen
, , ,
,
zerschneiden, und bilden den Grenzwert der Summe
(7.60)
(7.55)
mit
oder mit den Bezeichnungen wie in Abbildung 7.4(b),
Wie man sich leicht überlegt, ist das Wegintegral unabhängig davon, wie man die Kurve in kleine
Stücke zerlegt, sofern die Kurve und das Vektorfeld hinreichend glatt ist, genau wie das
gewöhnliche reelle Integral unabhängig von der Art der Zerlegung ist. Insbesondere hängt das
Wegintegral nicht davon ab, wie die Kurve als Funktion
des Parameters dargestellt wird.
Um das formal zu beweisen, ist es nützlich, eine etwas einfacher zu handhabende Darstellung des Wegintegrals anzugeben als die Summendarstellung. Man kann das Wegintegral auf ein
gewöhnliches reelles Integral zurückführen. Für kleine Kurvenstücke gilt
(7.61)
Wegintegralsatz
Dies ist gewissermaßen die erste Version des Hauptsatzes der Integral- und Differenzialrechnung,
angewandt auf Felder im Raum.
entlang eines Weges ist die Differenz der
Das Wegintegral eines Gradienten
Funktionswerte des skalaren Feldes an den Enden des Weges.
Zwei andere Versionen davon werden wir gleich noch kennen lernen.
Wir haben zwar damit die Frage, wann ein gegebenes Kraftfeld konservativ ist und wann nicht,
noch nicht beantwortet. Aber wir sind schon einen kleinen Schritt weiter, denn wir wissen jetzt,
wie wir konkret das Potential berechnen können, sobald wir wissen, dass ein Kraftfeld konservativ
ist. Wir müssen dazu nur ein geeignetes Wegintegral ausführen, also das Kraftfeld entlang eines
bestimmten Weges integrieren.
(7.56)
und folglich
(7.57)
97
(c)
(d)
Aufgabe 7.22 Es seien die folgenden Vektorfelder gegeben,
(7.62)
Gesucht ist jeweils ein skalares Feld
mit
und
. Man bestimme
durch Berechnung eines Wegintegrals entlang einer geraden Strecke von nach und zeige
anschließend, dass für das so definierte Feld tatsächlich
gilt.
Aufgabe 7.23 Es soll gezeigt werden, dass das Vektorfeld
(b)
(a)
(7.63)
Abbildung 7.5: Zur Definition des Flächenintegrals eines Vektorfeldes zerlegt man die Fläche
in einzelne Flächenelemente (a). Entsprechend kann man ein skalares Feld über ein Volumen
integrieren, indem man dies in Volumenelemente zerlegt (b).
wobei ein nicht verschwindender Vektor ist, nicht der Gradient eines skalaren Feldes ist. Man
führe die gegenteilige Annahme zu einem Widerspruch. Man bestimme dazu wie in Aufgabe 7.22
und zeige anschließend, dass dieses Feld nicht die Eigenschaft
hat.
ein Feld
Aufgabe 7.24 Wege lassen sich zusammensetzen und umkehren. Verbindet ein Weg
die Punkte
und , und ein Weg
die Punkte und , so ist
derjenige Weg, der von zuerst
nach und anschließend entlang
nach führt. Der inverse Weg
ist der in
entlang
die umgekehrte Richtung durchlaufene Weg . Man beweise
Aufgabe 7.26 Warum steht dieser Vektor auf der Fläche senkrecht?
(7.64)
Aufgabe 7.25 Ein geschlossener Weg ist ein Weg, dessen Anfangspunkt mit dem Endpunkt identisch ist. Man beweise, dass ein Vektorfeld genau dann der Gradient eines skalaren Feldes ist,
wenn jedes Wegintegral des Vektorfeldes entlang jedes geschlossenen Weges gleich Null ist.
Genau wie eine Kurve können wir eine Fläche in kleine Stücke zerlegen. In Abbildung 7.5(a) ist
ein solches Flächenelement dargestellt. Die Ecken dieses Flächenelementes befindet sich an den
Stellen
,
,
und
. Sind die Abmessungen
und
hinreichend klein, so hat es die Form eines Parallelogramms, welches von den Vektoren
(7.66)
und
aufgespannt wird. Wir können dem Flächenelement einen Vektor zuordnen, dessen Betrag den
Flächeninhalt repräsentiert, und der in Richtung des Normalenvektors zeigt,
Flächen- und Volumenintegrale
Wegintegrale lassen sich zu Flächen- und Volumenintegralen verallgemeinern. Wie können ein
Vektorfeld auch über eine Fläche integrieren, oder ein skalares Feld über ein Volumen. Anschließend werden wir zeigen, dass es sich dabei in einer gewissen Art und Weise um die Umkehrungen
von Rotation und Divergenz handelt, wobei der Zusammenhang allerdings nicht mehr ganz so
einfach ist wie der zwischen Wegintegral und Gradient.
darstellen
Betrachten wir zunächst eine Fläche, die wir als eine Abbildung
können. Ihre Ortsvektordarstellung bezeichen wir wie üblich mit
, wobei und die
Flächenkoordinaten sind. Durch die Wahl dieser Koordinaten wird auch eine Orientierung der
Fläche festgelegt. Die Oberseite der Fläche ist diejenige Seite, zu der der Normalenvektor zeigt.
Wir definieren ihn durch
(7.65)
(7.67)
Der Einfachheit halber stellen wir uns hier von Anfang an infinitesimal kleine Flächenelemente
vor, über die wie später summieren, also integrieren werden. Die Fläche sei also in unendlich
viele solche Flächenelemente zerlegt.
gegeben. Werten wir das Vektorfeld auf den Fläche aus,
Nun sei zusätzlich ein Vektorfeld
so können wir es als Funktion
darstellen. Ist das Vektorfeld hinreichend
glatt, so können wir es innerhalb eines infinitesimalen Flächenelementes als konstant betrachten.
Wie in Abbildung 7.5(a) zu sehen ist, spannt der Vektor
zusammen mit dem Flächeneleeinen Spat auf. Das Volumen dieses Spates ist
ment
98
(7.68)
Dieses Volumen ist positiv, wenn der Vektor
nach oben, also in Richtung des Normalenvektors der Fläche zeigt. Es ist negativ, wenn der Vektor
nach unten zeigt.
Das Flächenintegral des Vektorfeldes ist durch die Summation über alle diese infinitesimalen
Spate definiert. Wir schreiben dafür
Schließlich wollen wir noch ein Volumenintegral definieren. Ein Volumen ist im Prinzip einfach eine Teilmenge des euklidischen Raumes mit bestimmten Eigenschaften. Wir können ein
Volumen aber auch analog zu einer Kurve oder einem Weg durch eine Parameterdarstellung
beschreiben, also durch eine Abbildung
, oder durch die entsprechende Ortsvektordarstellung
, die einen Ort im Volumen durch drei Koordinaten
spezifiziert.
Um ein Integral über ein solches Volumen zu definieren, zerlegen wir es wieder in unendlich
viele infinitesimale Volumenelemente. In Abbildung 7.5(b) ist ein typisches solches Volumenele,
ment dargestellt. Seine acht Ecken befinden sich in den Punkten mit den Koordinaten
, ,
. Für hinreichend kleine ,
und
hat es die
Form eines Spates, aufgespannt von den Vektoren
(7.69)
Flächenintegral
Die Integrationsgrenzen für und sind dabei so zu wählen, dass die Fläche, über die zu integrieren ist, genau einmal abgedeckt wird.
Man kann sich leicht überlegen, dass dieses Flächenintegral unabhängig davon ist, wie man die
Fläche in Flächenelemente zerlegt. Insbesondere ist es dann auch unabhängig davon, wie man die
Fläche durch eine Ortsvektordarstellung
parametrisiert. Eine formalen Beweis werden
wir hier nicht durchführen. Er folgt aber wie beim Wegintegral durch eine einfache Substitution.
Anschaulich ergibt sich die Unabhängigkeit des Flächenintegrals von der Parametrisierung der
Fläche wie folgt aus der Darstellung in Abbildung 7.5(a). Wir stellen uns dazu vor, dass das Vektorfeld den Fluss irgendeines Mediums durch die Fläche hindurch beschreibt. Innerhalb eines
kurzen Zeitintervalls wird dabei das dargestellte Flächenelement um ein Stück verschoben. Das in
diesem Zeitintervall durch das Flächenelement hindurchgeströmte Volumen des Mediums ist gerade das Volumen so erzeugten Spates. Summieren wir über alle Flächenelemente, so ergibt sich
das Volumen des insgesamt in einem kleinen Zeitintervall durch die Fläche hindurchgeströmten
Mediums. Das ist natürlich unabhängig davon, wie wir die Fläche in kleine Flächenelemente
zerlegen.
Um sich eine anschauliche Vorstellung von einem Flächenintegral zu machen, sollte man sich
daher das Vektorfeld am besten als das Strömungsfeld eines Mediums vorstellen. Wir werden
darauf später noch näher eingehen, denn solche Strömungsfelder spielen zum Beispiel in der
Elektrodynamik eine wichtige Rolle.
(7.72)
Folglich ist der Inhalt dieses Volumenelementes
(7.73)
Im Gegensatz zum Flächenelement
ist dies kein Vektor, sondern eine skalare Größe. Um ein
Integral über ein Volumen auszuführen, müssen wir daher als Integrand auch ein skalares Feld
einsetzen. Wir definieren analog zu (7.69)
(7.74)
Volumenintegral
Auch hier sind wieder die Integrationsgrenzen für , und entsprechend anzupassen.
Anschaulich ist ein Volumenintegral nichts anderes als das, was wir uns unter einer gewöhnlivorstellen. Wählen wir nämlich als Integrationsvariachen Integration im Euklidischen Raum
ble kartesische Koordinaten, setzen also
, so ist das Spatprodukt in (7.73)
gleich Eins, und es gilt
Aufgabe 7.27 Als Fläche sei ein Kreis mit Radius in der - -Ebene gegeben. Er kann wahlweise durch kartesische Koordinaten
(7.75)
(7.70)
Die allgemeinere Darstellung (7.74) hat jedoch den Vorteil, dass wir auch andere Darstellungen
eines Volumens verwenden können, um ein solches Integral zu berechnen. Ein Beispiel dafür
liefert die folgende Aufgabe.
oder durch Polarkoordinaten
(7.71)
Aufgabe 7.28 Es soll das Volumen einer Kugel mit Radius berechnet werden. Wir setzen dazu
und berechnen das Volumenintegral über eine Kugel mit Mittelpunkt im Ursprung. Als
Parameterdarstellung wählen wir einmal die Darstellung durch kartesische Koordinaten
dargestellt werden. Als Vektorfeld sei
gegeben. Man berechne das Flächenintegral
mit beiden Parameterdarstellungen und zeige, dass das Ergebnis
über den Kreis
von
dasselbe ist.
99
(7.76)
PSfrag replacements
und einmal die Darstellung in Kugelkoordinaten,
(c)
(d)
(7.77)
Man zeige, dass das Volumenintegral (7.74) in beiden Darstellungen dasselbe Ergebnis, n ämlich
liefert.
Der Satz von Stokes
(b)
(a)
Abbildung 7.6: Der Satz von Stokes besagt, dass das Flächenintegral (a) über die Rotation eines
Vektorfeldes als Linienintegral (b) des Vektorfeldes selbst über den Rand der Fläche dargestellt
werden kann.
Was haben nun Flächen- und Volumenintegrale mit Rotation und Divergenz von Vektorfeldern zu
tun? Tatsächlich gibt es hier ganz ähnliche Beziehungen wie zwischen Wegintegralen und dem
Gradienten eines skalaren Feldes.
Als erstes zeigen wir, dass es einen Zusammenhang zwischen Rotation und Flächenintegralen
gibt. Dieser Zusammenhang ist in Abbildung 7.6 anschaulich dargestellt. Er wird uns auch etwas
über die geometrische Interpretation der Rotation verraten. Wir betrachten ein Vektorfeld und
dessen Rotation
. Ferner sei eine Fläche, von der wir der Einfachheit halber annehmen,
dass sie, wie in Abbildung 7.6 gezeigt, nur einen Rand hat, also von einer geschlossenen Linie
begrenzt wird.
Wir schreiben dafür auch
, das heißt die Kurve ist der Rand der Fläche . Da
eine Fläche stets eine Orientierung hat, erhält auch die Randkurve eine Orientierung. Wir
verwenden dafür wieder die Rechte-Hand-Regel. Die Richtung der Randkurve zeigt gegen der
Uhrzeigersinn, wenn wir von oben auf die Fläche schauen. Das entspricht der Definition des
Drehsinns einer Ebene in Abbildung 2.1.
Der Satz von Stokes macht nun folgende Aussage über das Flächenintegral einer Rotation,
das heißt wir wählen irgendeinen Punkt in der Fläche aus und bezeichnen ihn als Ursprung. An
diesem Punkt soll
sein, das heißt
soll nicht von abhängen. Außerdem soll die
Koordinaten eine Periode von
haben, und für
soll sich die Randkurve
ergeben.
Für das Flächenintegral gilt dann
(7.79)
(7.78)
Satz von
Stokes
Um das doppelte Kreuzprodukt auszurechnen, können wir die Formel (2.36) verwenden, oder wir
Oder in Worten ausgedrückt:
Das Flächenintegral der Rotation
eines Vektorfeldes über eine Fläche
Wegintegral des Vektorfeldes entlang des Randes
.
ist das
Das Flächenintegral der Rotation eines Vektorfeldes lässt sich also auf ein Wegintegral des Vektorfeldes selbst zurückführen. Das ist insofern analog zum Wegintegralsatz (7.61), da dieser eine
ganz ähnliche Aussage macht. Das Wegintegral des Gradienten eines skalaren Feldes lässt sich
als “Integral” über den Rand des Weges schreiben. Allerdings ist dieses “Integral” dort einfach
nur eine Summe, da der Rand eines Weges nur aus zwei Punkten besteht.
Um den Satz von Stokes zu beweisen, stellen wir die Fläche in einer speziellen Art und Weise
in einer Ebene,
dar. Wir verwenden eine verallgemeinerte Version der Polarkoordinaten
100
benutzen das -Symbol. Der Integrand lässt sich dann wie folgt umformen,
dann der Fall ist, wenn das Wegintegral des Kraftfeldes entlang jedes geschlossenen Weges gleich
Null ist. Im Euklidischen Raum ist andererseits jeder geschlossener Weg der Rand irgendeiner
Fläche.
Also ist das Wegintegral von entlang jedes geschlossenen Weges genau dann gleich Null,
wenn das Flächenintegral von
über jede Fläche gleich Null ist. Und das wiederum ist genau
identisch verschwindet. Also gilt die folgende einfache Aussage:
dann der Fall, wenn
verschwin-
ist genau dann konservativ, wenn seine Rotation
Ein Kraftfeld
det.
(7.80)
In Abbildung 7.7 ist noch einmal schematisch dargestellt, wie man für ein konservatives Kraftfeld
das Potential bestimmen kann. Die Abbildung 7.7(a) zeigt ein konservatives Kraftfeld
. Um
das Potenzial
zu bestimmen, wählt man willkürlich einen festen Punkt
sowie der Wert
aus, und setzt dann
(7.83)
Dabei haben wir in den beiden letzten Schritten die Ketten- ud Produktregel so verwendet, dass
wir den gesamten Ausdruck als Ableitung einer Funktion nach bzw. schreiben konnten.
Wenn wir diese beiden Ausdrücke in das doppelte Integral (7.79) einsetzen, können wir jeweils
eines der Integrale ausführen, und bekommen so insgesamt vier Randterme,
Wobei irgendein Weg von nach ist. Wegen der verschwindenden Rotation von ist dieses
Integral unabhängig von der Wahl des Weges , das heißt das Ergebnis hängt nur von ab.
Das Kraftfeld in Abbildung 7.7(b) ist nicht konservativ. Es hat eine nicht verschwindende Rotation, was man daran erkennen kann, dass es eine Art Wirbel bildet. Daher ist das Wegintegral
(7.83) vom gewählten Weg abhängig, und deshalb lässt sich auf diese Weise kein Potenzial finden.
(7.81)
Nun fallen aber drei dieser vier Terme weg. Da die Funktion
in periodisch ist, ergibt
sich im hinteren Term an der Stelle
stets derselbe Wert wie an der Stelle
. Also
ist dieser Anteil gleich Null. Beim ersten Ausdruck ergibt sich für
stets Null, denn
hängt ja nicht von ab, das heißt an der Stelle
ist die partielle Ableitung
gleich
Null. Es bleibt also nur ein Term übrig, und das ist gerade das Wegintegral von entlang des
Randes der Fläche,
Aufgabe 7.30 Man betrachte das Kraftfeld
(7.84)
Eine naive Rechnung ergibt, dass die Rotation von verschwindet. Man berechne jedoch das Wegintegral entlang eines Kreises, der parallel zur - -Ebene liegt und seinen Mittelpunkt irgendwo
auf der -Achse hat. Man benutze das Ergebnis, um zu zeigen, dass die Rotation gar nicht überall
verschwindet, sondern durch
(7.82)
(7.85)
Mit Hilfe des Satzes von Stokes lässt sich nun unsere ursprüngliche Frage beantworten. Wann ist
ein gegebenes Kraftfeld konservativ? In Aufgabe 7.25 wurde bereits gezeigt, dass dies genau
Aufgabe 7.29 Man finde Beispiele für Flächen, die sich nicht auf die gezeigte Art und Weise parametrisieren lassen und formuliere eine entsprechende Verallgemeinerung des Satzes von Stokes.
ist. Die Rotation ist also überall Null, nur
gegeben ist, wobei wie üblich
nicht auf der -Achse, wo sie Unendlich groß ist.
mit
. Damit haben wir den Satz von Stokes bewiesen, jedenfalls für eine Fläche,
die sich auf diese spezielle Art parametrisieren lässt.
Der Satz von Gauß
Der Vollständigkeit halber wollen wir nun noch kurz die dritte Version des Fundamentalsatzes
darstellen. Es ist der Satz von Gauß, der eine Beziehung zwischen der Divergenz eines Vektorfeldes und Volumenintegralen herstellt.
101
PSfrag replacements
(c)
(d)
replacements
(c)
(d)
(b)
(a)
Abbildung 7.8: Der Satz von Gauß besagt, dass das Volumenintegral (a) der Divergenz eines
Vektorfeldes, hier dargestellt als eine mehr oder weniger dichte Verteilung von Punkten im Raum,
durch das Flächenintegral (b) des Vektorfeldes über den Rand des Volumens gegeben ist.
(b)
(a)
Abbildung 7.7: Für ein Kraftfeld mit verschwindender Rotation (a) hängt das Wegintegral nur
vom Anfangs- und Endpunkt des Weges ab, Daher lässt sich für ein solches Kraftfeld ein Potenzial auch Integration bestimmen. Ist die Rotation dagegen nicht Null (b), so hängt das Wegintegral
auch vom Weg selbst ab. In diesem Fall lässt sich durch Integration kein Potenzial definieren.
Wir betrachten dazu irgendein Volumen , das von einer Fläche begrenzt wird, zum Beispiel
die in Abbildung 7.8 dargestellte, etwas deformierte Kugel. Wir schreiben wieder
für
den Rand des Volumens. Die Fläche , die den Rand des Volumens definiert, ist so orientiert,
dass ihr Normalenvektor nach außen, also aus dem Volumen heraus zeigt.
Der Satz von Gauß stellt dann eine Beziehung her zwischen dem Volumenintegral der Divergenz eines Vektorfeldes und dem Flächenintegral über das Vektorfeld selbst,
Aufgabe 7.31 Zum Beweis des Satzes von Gauß ist folgende Formel n ützlich. Es sei irgendeine
Vektor mit Komponenten . Man zeige
(7.86)
Satz von
Stokes
Wenn das dasselbe ist wie das Volumenintegral über die Divergenz, dann beschreibt die Divergenz offenbar so etwas wie die Erzeugung des Mediums, welches dann entlang des Vektorfeldes
fließt. Denn wenn aus dem Volumen mehr heraus als herein fließt, dann muss innerhalb des Volumens etwas entstehen. Ist die Divergenz eines Vektorfeldes an einem Ort positiv, so sagen wir
auch, dass sich dort eine Quelle befindet. Es strömt mehr von dieser Quelle weg als zu ihr hin.
Dort, wo die Divergenz negativ ist, liegt eine Senke vor.
Divergenz und Rotation eines Vektorfeldes beschrieben also das, was wir uns anschaulich am
besten anhand eines Strömungsfeldes vorstellen können. Ein Strömungsfeld hat im allgemeinen
Quellen, Senken, und Wirbel. Bei der Diskussion von elektrischen und magnetischen Feldern
wird sich diese anschauliche Vorstellung als sehr nützlich erweisen.
Der Beweis des Satzes von Gauß kann ganz analog zum Satz von Stokes geführt werden. Wir
werden dies hier nicht explizit tun, sondern als Übungsaufgabe stellen.
(7.87)
Oder in Worten ausgedrückt:
eines Vektorfeldes über ein Volumen
über den Rand
.
Das Volumenintegral der Divergenz
das Flächenintegral des Vektorfeldes
ist
102
Auch hier ist es wieder nützlich, sich vorzustellen, dass das Vektorfeld den Fluss irgendeines
Mediums durch den Raum beschreibt. Das Flächenintegral auf der rechten Seite gibt dann an,
wieviel dieses Mediums durch die Fläche
fließt, also aus dem Volumen heraus.
Aufgabe 7.32 Man beweise den Satz von Gauß für ein Volumen, das wie in Abbildung 7.8 die
Form einer deformierten Kugel hat. Man kann dabei genau so vorgehen, wie im Falle des Satzes
von Stokes. Man wählt einen Punkt innerhalb des Volumens aus und verwendet verallgemeinerte
Kugelkoordinaten, das heißt man wählt eine Parameterdarstellung
des Volumens so,
dass
der ausgezeichnete Punkt ist, und
eine Parameterdarstellung
der Randfläche. Eine Rechnung analog zu (7.79–7.82) führt dann zum gewünschten Ergebnis.
Hier bezeichnet wieder den in radiale Richtung zeigenden Einheitsvektor, also
.
Ein solches Zentralkraftfeld ist immer konservativ. Man kann dies zeigen, indem man die Roberechnet, oder indem man ein Potenzial
angibt. Da der Betrag der Kraft
tation von
nur vom Abstand vom Ursprung abhängt, machen wir den Ansatz, dass auch das Potenzial nur
davon abhängt. Es gilt dann
Aufgabe 7.33 Wie muss der Satz von Gauß verallgemeinert werden, damit er auch f ür Volumen
gilt, die nicht die Form einer deformierten Kugel haben?
Aufgabe 7.34 Man betrachte das Kraftfeld
(7.88)
(8.2)
Hier haben wir das Resultat von Aufgabe 7.14 verwendet, wonach der Gradient der Funktion
gerade der in Richtung des Ortsvektors zeigende Einheitsvektor
ist.
Für ein kugelsymmetrisches Zentralkraftfeld gilt also dasselbe wie für ein mechanisches System mit nur einem Freiheitsgrad. Es gibt immer ein Potenzial, und es ist im wesentlichen durch
die Stammfunktion des Kraftgesetzes gegeben,
(7.89)
Eine naive Rechnung ergibt, dass die Divergenz von verschwindet. Man berechne jedoch das
Flächenintegral über eine Kugeloberfläche mit Mittelpunkt im Ursprung. Man benutze das Ergebnis, um zu zeigen, dass die Divergenz gar nicht überall verschwindet, sondern durch
(8.3)
8
ist. Die Divergenz ist also überall Null,
gegeben ist, wobei wie üblich
nur nicht im Ursprung, wo sie Unendlich groß ist.
Wir werden nun die Bewegungsgleichungen für dieses Teilchen durch geschicktes Ausnutzen
von Erhaltungsgrößen und die Wahl eines speziellen Koordinatensystems so umformen, dass sie
formal wie die Bewegungsgleichungen für ein System mit nur einem Freiheitsgrad aussehen. Die
entscheidenden Erhaltungsgrößen kennen wir schon. Es sind der Drehimpuls und die Energie,
Das Kepler-System
(8.4)
Aus der Erhaltung des Drehimpulses folgt, dass die Bewegung des Teilchens in einer Ebene stattfindet. Wir wählen das Koordinatensystem so, dass dies die - -Ebene ist. Dann ist natürlich
, und als Erhaltungsgrößen bleiben noch zwei skalare Größen, nämlich und . Ohne
annehmen.
Beschränkung der Allgemeinheit können wir außerdem
Um die Bahn des Teilchens zu beschreiben, benutzen wir Kugelkoordinaten. Da die Bewesetzen. Die Darstellung (5.21) des
gung auf die - -Ebene beschränkt ist, können wir
Ortsvektors lautet dann einfach
(8.5)
, die die Äquatorebene der Kugelkoordinaten parametrisieren, werden auch
Die Koordinaten
als Polarkoordinaten bezeichnet. Führen wir analog zu (5.29) die Einheitsvektoren
In diesem Kapitel wollen wir die wohl bekannteste Anwendung der klassischen Mechanik vorstellen, nämlich die Berechnung der Planetenbahnen im Sonnensystem. Sie hatte eine sehr wichtige
historische Bedeutung für die Newtonsche Mechanik.
Die Bahnen der Planeten waren schon lange bekannt und wurden von Astronomen wie Brahe,
Kepler und Galilei sehr genau vermessen. Es lagen also eine ganze Reihe von Messdaten vor, und
die Tatsache, dass diese Daten durch die Newtonsche Theorie erklärt werden konnten, konnte als
eine eindruckvolle Bestätigung derselben angesehen werden.
Teilweise haben wir das Problem schon in Abbildung 4 diskutiert. Im einfachsten Fall umkreisen zwei Körper einander, die über die Gravitationskraft wechselwirken. Ist ein Körper sehr
viel schwerer und damit auch träger als der andere, so können wir diesen als ortsfest betrachten.
Der andere bewegt sich dann in einem Zentralkraftfeld. Dieses Problem werden wir zuerst diskutieren, und uns dann speziell der Gravitationskraft und damit den Bewegungen der Planeten im
Sonnensystem zuwenden.
Zentralkräfte und das effektive Potential
(8.6)
so bilden diese für jedes zusammen mit
eine Orthonormalbasis. Außerdem gilt für die Ableitungen nach , analog zu (5.33),
und
. Daraus ergeben sich
die folgenden Ausdrücke für den Ortsvektor, die Geschwindigkeit und die Beschleunigung,
Wir betrachten zuerst ein ganz allgemeines, kugelsymmetrisches Zentralkraftproblem. Kugelsymmetrisch heißt, dass die Kraft nicht nur radial nach innen oder außen zeigt, sondern dass der Betrag der Kraft auch nur vom Abstand vom Zentrum anhängt. Für ein Teilchen der Masse mit
Ortsvektor gilt dann die Bewegungsgleichung
(8.1)
103
(8.7)
Setzen wir das in die Bewegungsgleichung ein, so finden wir durch Vergleich der Koeffizienten
von
und
Potenzial bewegt, identisch mit der Energie des realen Teilchens im dreidimensionalen Raum. Es
gilt nämlich
(8.8)
(8.13)
Die Strategie zur Lösung des Zentralkraftproblems können wir nun wie folgt zusammenfassen.
Falls bestimmte Anfangsbedingungen vorgegeben sind, bestimmen wir zuerst die Erhaltungsist. Den entsprechengrößen und , wobei wir das Koordinatensystem so wählen, dass
den Wert von setzen wir in (8.12) ein und lösen anschließend die Bewegungsgleichung für
.
Anschließend setzen wir die gefundene Lösung in die Bewegungsgleichung (8.11) für
ein
und bestimmen daraus die Funktion
.
Sind keine speziellen Anfangsbedingungen vorgegeben, so können wir die allgemeine Lösung
der Bewegungsgleichungen finden, indem wir das Verfahren auf alle möglichen Werte von und
anwenden. Da das effektive Potenzial explizit von abhängt, müssen wir eventuell verschiedene
Fälle unterscheiden. Aber im Prinzip ist es immer möglich, die allgemeinste Lösung auf diesem
Weg zu finden. Ob man sie in geschlossener Form durch elementare Funktionen darstellen kann,
ab.
hängt natürlich vom jeweiligen Potenzial
Dies sind zwei gekoppelte Differenzialgleichungen zweiter Ordnung für die Funktionen
und
. Wir können sie entkoppeln und anschließend lösen, indem wir die Erhaltungsgrößen verwenden. Aus der zweiten Gleichung folgt unmittelbar
(8.9)
Tatsächlich ist das die -Komponente des Drehimpulses,
(8.10)
ist. Das Teilchen soll sich also nicht im Kraftzentrum
Wir setzen im folgenden voraus, dass
aufhalten. Dann können wir die Winkelgeschwindigkeit durch den Drehimpuls ausdrücken,
und dies in die erste Bewegungsgleichung (8.8) einsetzen. Als Ergebnis bekommen wir eine Be, und eine Bewegungsgleichung zweiter Ordnung für
wegungsgleichung erster Ordnung für
, die nicht mehr von
abhängt,
Die Drehimpulsbarriere
Um zu verstehen, welche anschauliche Bedeutung das effektive Potenzial hat, betrachten wir
einen ganz einfachen Spezialfall. Für ein freies Teilchen setzen wir
. Natürlich ist
dies eine etwas umständliche Methode, die Bewegungsgleichung für ein freies Teilchen zu lösen,
deren allgemeine Lösung wir schon kennen. Aber wir werden auf diese Weise etwas besser verstehen, was es mit dem effektiven Potential auf sich hat.
Aus (8.12) ergibt sich
(8.11)
Damit haben wir die Bewegungsgleichungen entkoppelt. Wir können jetzt so vorgehen, dass wir
lösen, und das Ergebnis anschließend in die Bewegungszuerst die Bewegungsgleichung für
gleichung für
einsetzen und diese lösen.
Die Bewegungsgleichung für
sieht aus wie die für ein System mit einem Freiheitsgrad.
Wir können sie noch ein wenig umschreiben, um die Ähnlichkeit deutlich zu machen,
(8.14)
Die Funktion
wird effektives Potenzial genannt. Sie ist der Schlüssel zur allgemeinen Lösung
des kugelsymmetrischen Zentralkraftproblems.
ist
, das heißt für die Radial, und aus (8.11) ergibt sich
. Die
(8.12)
und
. Für
Wir unterscheiden die Fälle
komponente
gilt die Bewegungsgleichung
allgemeine Lösung dieser Bewegungsgleichungen ist
mit
(8.15)
mit beliebigen Konstanten
. Setzt man das in (8.5) ein, so findet man offenbar eine
Gerade durch den Ursprung, die mit konstanter Geschwindigkeit durchlaufen wird. Ein freies
Teilchen ohne Drehimpuls bewegt sich wie erwartet geradlinig und gleichförmig. Für
ruht
und
.
es am Ort mit den Koordinaten
Der Fall
ist natürlich der interessantere. Das effektive Potenzial (8.14) ist in diesem
Fall positiv, geht für
gegen Unendlich und fällt für
gegen Null ab. Es ist ein
abstoßendes Potenzial, das heißt die Kraft wirkt immer vom Ursprung weg, und der unendliche
In einem kugelsymmetrischen Potenzial
verhält sich die radiale Komponente
des Ortsvektors wie die Ortskoordinate eines fiktiven Teilchens mit einem Freiheitsgrad im effektiven Potenzial
.
104
Wie wir die radiale Bewegungsgleichung am besten lösen, hängt von der Art des effektiven Potentials ab. Zum Beispiel können wir Methode aus Kapitel 7 verwenden, indem wir die Erhaltung
der Energie ausnutzen. Tatsächlich ist die Energie des fiktiven Teilchens, das sich im effektiven
Aufgabe 8.1 Man setze das Ergebnis (8.19) und (8.20) in die Ortsvektordarstellung (8.5) ein und
verwende die Eigenschaften der Winkelfunktionen, um zu zeigen, dass es sich bei der L ösung um
eine geradlinige, gleichförmige Bewegung handelt, die wie folgt geschrieben werden kann,
(8.21)
Anstieg verhindert, dass ein Teilchen den Ursprung erreichen kann, egal wie hoch seine Energie
ist. Man bezeichnet dieses effektive Potenzial auch als Drehimpulsbarriere. Sie verhindert, dass
ein Teilchen mit Drehimpuls den Ursprung erreichen kann.
Es gibt in diesem Potenzial nur eine mögliche Bewegungsform. Die Energie ist immer positiv, da das Potenzial überall positiv ist. Das Teilchen kommt aus dem Unendlichen, das heißt
geht
, es erreicht zu irgendeiner Zeit
einen Umkehrpunkt bei
für
, und dann entfernt es sich wieder, so dass für
wieder
gilt.
Da am Umkehrpunkt das Potenzial gleich der Energie ist, besteht zwischen der Energie , dem
Drehimpuls und dem minimalen Abstand , den das Teilchen zum Ursprung erreicht, der Zusammenhang
Aufgabe 8.2 Man diskutiere den Grenzfall
in (8.19) und (8.20).
Aufgabe 8.3 Man löse mit derselben Methode die Bewegungsgleichung für ein Teilchen der Mas.
se in einem Potenzial
(8.16)
Das Gravitationspotenzial
Nun wollen wir uns dem eigentlichen Thema dieses Kapitels zuwenden. Wir wollen die Bahnen
von Planeten im Sonnensystem berechnen. Wir nehmen dazu an, dass die Masse der Sonne sehr
viel größer ist als die Masse des Planeten, so dass wir die Sonne als im Koordinatenursprung
ruhend annehmen und die Wechselwirkung der Planeten untereinander vernachlässigen können.
die Masse der Sonne und die eines Planeten. Der Planet bewegt sich dann in
Es sei also
einem Zentralkraftfeld
Statt können wir daher auch als Parameter verwenden, um die Lösungen zu klassifizieren.
Außerdem ist es nützlich,
zu setzen. Dann ist
, und statt der Erhaltungsgrößen und können wir die Parameter und verwenden, die ebenfalls beide positiv
sind.
Um die Lösungen der radialen Bewegungsgleichung zu finden, verwenden wir die Methode
aus Kapitel 7. Ist gilt
(8.22)
gesetzt haben. Das zugehörige Potenzial ist
und
wobei wir wieder
(8.17)
(8.23)
Als untere Integrationsgrenze haben wir hier den Umkehrpunkt zur Zeit gewählt. Das obere Vorzeichen gilt für
, da dann die Geschwindigkeit positiv ist, das untere Vorzeichen
entsprechend für
. Die Integration lässt sich leicht ausführen,
Das Gravitationspotenzial ist negativ und steigt mit zunehmenden monoton an, da die Kraft
stets anziehend ist. Für
fällt sein Betrag mit
gegen Null ab.
Um die daraus resultierenden Bewegungsgleichungen zu lösen, gehen wir genau so vor wie
eben für das freie Teilchen. Wegen der Drehimpulserhaltung findet die Bewegung in der - Ebene statt, wenn wir das Koordinatensystem entsprechend anpassen. Für die Erhaltungsgrößen
und
gilt
(8.18)
Auflösen nach ergibt nun, unabhängig vom Vorzeichen,
(8.24)
mit
(8.19)
, und für
gilt
Aus der allgemeinen Diskussion der Gravitationskraft wissen wir bereits, dass die Masse des
Planeten für die Bewegung eigentlich keine Rolle spielt. Wir können sie eliminieren, indem wir
eine spezifische Energie
, einen spezifischen Drehimpuls
und ein spezifisches
effektives Potenzial
einführen. Dann lassen sich die Definitionen (8.24) der Erhaltungsgrößen und des effektiven Potenzials wie folgt umschreiben,
lösen. Auch das ist eine
Tatsächlich hat diese Funktion das erwartete Verhalten. Für
erreicht sie ihr Minimum bei
.
Jetzt müssen wir nur noch die Bewegungsgleichung (8.11) für
einfache Integration,
(8.20)
mit
festgelegt.
und
,
,
Die allgemeine Lösung wird also durch insgesamt vier Parameter
105
(8.25)
, dargestellt in Abbildung 8.1(a), ruht das fiktive Teilchen im Minimum bei
Für
. Das bedeutet allerdings nicht, dass sich der Himmelskörper wirklich in Ruhe befindet. Das
effektive Potenzial bestimmt ja nur die radiale Bewegung des Planeten. Die Radialkoordinate
ist zeitlich konstant. Aus (8.25) folgt aber, dass die Winkelkoordinate nicht konstant
ist. Drücken wir den Drehimpuls gemäß (8.26) durch aus, so ergibt sich daraus
(c)
(a)
(8.27)
Also ist
zeitlich konstant, und wir bekommen als Lösung der Bewegungsgleichungen
(d)
(b)
(8.28)
mit
Diese spezielle Klasse von Lösungen kennen wir bereits. Es sind die Kreisbahnen, für die das
dritte Keplersche Gesetz gilt, wonach sich die dritten Potenzen der Radien der Kreisbahnen wie
die Quadrate der Umlaufzeiten
verhalten.
ist in Abbildung 8.1(b) dargestellt. Das fiktive Teilchen pendelt jetzt in
Der Fall
einer Potentialmulde, das heißt es bewegt sich periodisch zwischen einem minimalen Abstand
und einem maximalen Abstand
hin und her. Dieser Fall liegt im allgemeinen vor, wenn
ein Planet um einen Stern kreist. Der Planet läuft nicht exakt auf einer Kreisbahn, so dass sein
Abstand vom Kraftzentrum zwischen einem minimalen Wert
und einem maximalen Wert
pendelt.
Die Umkehrpunkte
und
sind durch die Bedingung
bestimmt. An diesen
Stellen ist das effektive Potenzial gleich der Gesamtenergie. Es gilt also
Abbildung 8.1: Das effektive Potenzial für einen Körper im Gravitationsfeld der Sonne. Es sind
vier verschiedene Bewegungsformen möglich. Die Fälle (a) und (b) entsprechen den Planetenbahnen. Der Körper führt eine periodische Umlaufbewegung aus. Die Fälle (c) und (d) entsprechen den Bahnen von Kometen, die nur aus dem Unendlichen kommend nur einmal am Stern
vorbeiziehen und dann wieder verschwinden.
Es verbleibt also nur noch die Masse
der Sonne als Parameter in den Bewegungsgleichungen,
und natürlich die Gravitationskonstante .
Um die Bewegungsgleichung für die Radialkomponente
zu lösen, müssen wir uns nun
das effektive Potenzial
etwas genauer ansehen. Wir betrachten hier nur den Fall
. Die
Bewegungsgleichungen für verschwindenden Drehimpuls hatten wir bereits in Kapitel 4 gelöst,
für den Fall von zwei Körpern, die senkrecht aufeinander zu fallen. Wir werden am Schluss noch
darstellen können.
einmal auf diesen Fall zurück kommen, den wir hier auch als Grenzfall
für
ist in Abbildung 8.1 dargestellt. Es hat stets den gleichen
Das effektive Potenzial
qualitativen Verlauf. Für kleine dominiert der Anteil, der mit
ansteigt, also die Drehimpulsbarriere. Sie verhindert, dass das fiktive Teilchen, welches die Radialbewegung des Himmelskörpers beschreibt, den Ursprung erreicht. Für große dominiert dagegen der Anteil, der für
mit
abfällt, also das Gravitationspotenzial. Für große ist das effektive Potenzial
geht
.
negativ und steigt monoton an, und für
(8.29)
Die Umkehrpunkte
sind die Lösungen einer quadratischen Gleichung, in der und als Paaufzulösen, gehen wir lieber den umgekehrten
rameter auftreten. Statt diese Gleichung nach
Weg und ersetzen die Erhaltungsgrößen und durch die Parameter
und . Bekanntlich besteht zwischen den Koeffizienten einer quadratischen Gleichung und den Lösungen ein einfacher
Zusammenhang, der in diesem Fall wie folgt lautet,
(8.30)
bei
oder
Aufgabe 8.4 Man zeige, dass die Funktion
(8.31)
(8.26)
mit
Wir können also die beiden die Umkehrpunkte
und
beliebig vorgeben, natürlich mit der
Einschränkung
, und daraus die Größen und bestimmen. Die Planetenbahnen
lassen sich folglich durch die Angabe des minimalen Abstands
und des maximalen Abstands
von der Sonne vollständig klassifizieren.
ein absolutes Minimum hat.
Wie in Abbildung 8.1 dargestellt, können wir vier mögliche Bewegungsformen des fiktiven Teilchens unterschieden, das sich in diesem effektiven Potenzial bewegt.
106
Es gibt aber noch andere mögliche Bewegungsformen eines Himmelskörpers im Gravitationsfeld
eines anderen. Für
bzw.
ergeben sich die in Abbildung 8.1(c) und (d) dargestellten
Bewegungen. Das fiktive Teilchen nähert sich hier aus dem Unendlichen, kehrt an einer Stelle
um, und verschwindet wieder im Unendlichen. Wir bezeichnen diese
mit minimalem Anstand
Bahnen als Kometenbahnen und werden sie später separat diskutieren.
und
enthält im Prinzip zwei
Die Angabe der Bahn durch die Koordinatenfunktionen
Arten von Informationen, die sich unabhängig voneinander durch Beobachtung verifizieren lassen. Zum einen enthalten sie Informationen über die Form der Bahn im Raum, also den Weg,
den der Planet zurücklegt. Andererseits können wir auch etwas über den zeitlichen Verlauf der
Bewegung daraus ablesen, also insbesondere über die Umlaufzeit des Planeten.
Wir wollen versuchen, diese beiden Informationen unabhängig voneinander zu gewinnen. Es
zeigt sich, dass dies explizit möglich ist. Wir wollen also zunächst versuchen, den Weg zu beschreiben, den der Planet auf seiner Bahn um die Sonne zurücklegt. Es genügt dazu, eine Funkanzugeben, die uns sagt, wie weit der Planet von der Sonne entfernt ist, wenn er sich
tion
in der Richtung befindet. Da monoton mit der Zeit zunimmt, existiert eine solche Funktion
immer. Hinterher können wir dann immer noch versuchen, die Funktion
zu ermitteln, um
eine Aussage über den zeitlichen Ablauf zu erhalten.
Welche Differenzialgleichung müssen wir lösen, um die Funktion
zu bestimmen? Es gilt
Aufgabe 8.5 Man zeige, dass sich im Grenzfall
wieder (8.26) ergibt, das heißt
wir können die Kreisbewegung also Spezialfall der Pendelbewegung betrachten, wobei die beiden
Umkehrpunkte zusammenfallen.
ergibt, und
aus (8.31) als Grenzfall
Aufgabe 8.6 Man zeige, dass sich der Fall
der Fall
für
.
Planetenbahnen
(8.34)
Nun wollen wir versuchen, die Bahn eines Planeten explizit zu beschreiben. Als Parameter geben
und den maximalen Abstand
vor.
wir dazu den minimalen Abstand
Die Bewegungsgleichung für die radiale Komponente
können wir dann wie folgt aufauf und setzen für und die
schreiben. Wir lösen die Definition (8.25) der Energie nach
Ausdrücke (8.31) ein. Das ergibt
aus (8.33). Also gilt
Nun kennen wir aus (8.32), und
(8.35)
(8.32)
Tatsächlich ist, wie es sein muss, an den Umkehrpunkten
die Geschwindigkeit
, und
für
ist die rechte Seite dieser Gleichung positiv.
Die entsprechende Gleichung für die Winkelkoordinate, die sich aus der Definition des Drehimpulses ergibt, lässt sich auf eine ähnliche Form bringen
Auf den ersten Blick sieht diese Differenzialgleichung auch nicht einfacher aus als (8.32). Aber
es stellt sich heraus, dass wir sie explizit lösen können. Wir führen dazu eine Substitution durch,
nämlich
(8.36)
Eingesetzt in (8.35) erhalten wir
(8.37)
(8.33)
Die Lösung dieser Gleichung können wir beinahe raten. Sie lautet
Da wir
annehmen, ist auch
, das heißt der Planet läuft im positiven Sinn um die
Sonne herum.
Im Prinzip können wir diese Gleichungen mit der üblichen Methode lösen. Es stellt sich allerdings heraus, dass sich die Lösungen nicht explizit durch elementare Funktionen darstellen
lassen. Folglich können wir mit ihnen nur wenig anfangen. Wir wollen uns daher überlegen, was
wir überhaupt über die Planetenbahnen wissen wollen, und ob wir dies vielleicht auf einem anderen Weg herausbekommen können.
(8.38)
107
eine frei wählbare Integrationskonstante ist. Dass dies eine Lösung ist, sehen wir sehr
wobei
einfach wie folgt. Wenn wir
ableiten, fällt der erste Term weg und aus dem Kosinus wird ein
Sinus. Wenn wir den konstanten Term dagegen abziehen, wie im letzten Term in (8.37) verlangt,
erhalten wir dasselbe Ergebnis, aber diesmal mit dem Kosinus. Addieren wir die Quadrate der
gerade das Quadrat des Vorfaktors, also der
beiden Terme, ergibt sich wegen
erste Term auf der rechten Seite in (8.37).
erreicht,
wird entsprechend als
wird bei
wie “sonnennächster Punkt”. Der maximale Abstand
also auf der negativen -Achse. Der Punkt mit dem Ortsvektor
Aphel bezeichnet, was soviel bedeutet wie “sonnenfernster Punkt”.
Die Keplerschen Gesetze
Wir wollen nun zeigen, dass es sich bei der in Abbildung 8.2(a) dargestellten Kurve um eine
Ellipse handelt, wobei einer der beiden Brennpunkte im Kraftzentrum liegt. Das ist die Aussage
des ersten Keplerschen Gesetzes:
Die Planetenbahnen sind Ellipsen, von denen jeweils ein Brennpunkt im Zentrum
der Sonne liegt.
(b)
(a)
Um das zu beweisen, erinnern wir und kurz an die geometrische Definition einer Ellipse. Es ist
die Menge aller Punkte mit der Eigenschaft, dass die Summe der Abstände
von zwei Brennpunkten und konstant ist. Die Größe wird als große Halbachse der Ellipse
bezeichnet. Fallen die beiden Brennpunkte zusammen, so ist der Radius eines Kreises.
Mit Hilfe der in Abbildung 8.2(a) eingeführten Bezeichnungen können wir eine solche Ellipse
wie folgt beschreiben. Der eine Brennpunkt sei der Koordinatenursprung, der andere Brennpunkt liege auf der negativen -Achse, am Punkt mit dem Ortsvektor
. Die große Halbachse ist dann der halbe Abstand der beiden Schnittpunkt der Ellipse mit der -Achse. Diese
Schnittpunkte liegen bei
(8.40)
Abbildung 8.2: Die Planetenbahnen sind Ellipsen (a), die Kometenbahnen Hyperbeln (b). Es liegt
jeweils ein Brennpunkt im Zentrum der Sonne.
Nun sei
irgendein Punkt auf der Ellipse, mit den Polarkoordinaten und . Dann ist natürlich
der Ortsvektor dieses Punktes und somit
der Abstand des Punktes vom
vom anderen Brennpunkt berechnen wir mit Hilfe des
Brennpunkt . Den Abstand
Kosinussatzes im Dreieck
. Der Winkel
ist
, also gilt
Aufgabe 8.7 Wenn man diese Lösung nicht errät, kann man sie sich durch Separation der Variablen aus (8.37) beschaffen. Man führe diese Rechnung aus, mit der aus Kapitel 7 bekannten
Methode.
Die Integrationskonstante
können wir ohne Beschränkung der Allgemeinheit gleich Null setzen. Eine Konstante, die wir zu addieren, bewirkt nur die Drehung der gesamten Bahn oder
äquivalent eine Drehung des Koordinatensystems. Machen wir schließlich noch die Substitution
(8.36) rückgängig, so bekommen wir die folgende Darstellung für den Weg des Planeten,
liegt genau dann auf der Ellipse, wenn
Der Punkt
(8.39)
(8.41)
ist, oder
Tatsächlich pendelt diese Funktion zwischen
und . Sie hat aber noch eine bemerkenswerte Eigenschaft. Offenbar ist die Funktion
nicht nur periodisch in , sondern sie hat sogar
die Periode . Das bedeutet, dass es sich um eine geschlossene Bahn handelt. Nach einer Umdrehung um das Kraftzentrum ist der Planet wieder genau da, wo er zuvor auch war. Das ist
keineswegs selbstverständlich, sondern eine sehr spezielle Eigenschaft der Gravitationskraft. Wir
werden das später sehen, wenn wir kleine Störungen dieser Wechselwirkung betrachten.
In Abbildung 8.2(a) ist eine typische Planetenbahn dargestellt. Der minimale Abstand
vom Kraftzentrum wird bei
erreicht, mit
, also in Richtung der positiven
-Achse. Dieser Punkt mit dem Ortsvektor
wird als Perihel bezeichnet, was soviel bedeutet
(8.42)
Ziehen wir die letzten beiden Gleichungen voneinander ab, so ergibt sich folgende Beziehung
zwischen und ,
(8.43)
108
Das ist das gleiche wie (8.39), wie man unmittelbar nach Einsetzen von (8.40) sehen kann. Damit
haben wir gezeigt, dass die Bahnkurve des Planeten tatsächlich eine Ellipse ist. Ihre geometrischen Daten, die große Halbachse , den Abstand der Brennpunkte vom Mittelpunkt , und die
und
kleine Halbachse lassen sich als Funktionen der Bahnparameter
angeben. Es gilt
(8.44)
Nach einem vollen Umlauf des Planeten um die Sonne hat der Ortsvektor gerade einmal die
Ellipse in Abbildung 8.2(a) überstrichen. Die Fläche einer Ellipse mit den Halbachsen und ist
. Also gilt
(8.46)
Aufgabe 8.8 Man beweise die angegebene Formel für die kleine Halbachse , die in Abbildung 8.2(a) als maximaler Abstand der Ellipse von der -Achse definiert ist.
und
und anschließend durch die
Nun müssen wir nur noch und durch die Parameter
große Halbachse ausdrücken. Laut (8.31) und (8.44) ist
Das zweite Keplersche Gesetz macht eine Aussage darüber, wie die Bahn zeitlich durchlaufen
wird. Es handelt sich dabei allerdings nur im eine Umformulierung des Drehimpulserhaltungssatzes:
(8.47)
Damit haben wir das dritte Keplersche Gesetz bewiesen. Für eine Kreisbahn ergibt sich daraus
wieder der bekannte Zusammenhang (4.12).
Der Ortsvektor des Planeten überstreicht in gleichen Zeiten gleiche Flächen.
Kometenbahnen
Nun wollen wir noch kurz die Bahnen von Himmelskörpern beschreiben, die sich aus dem unendlichen Nähern, das Sonnensystem nur einmal besuchen, und dann wieder verschwinden. Wir
nennen diese Lösungen der Bewegungsgleichung Kometenbahnen.
in Abbildung 8.1(d). Wie wir bereits in Aufgabe 8.6
Wie betrachten zuerst den Fall
gezeigt haben, ergeben sich die Kometenbahnen aus den Planetenbahnen, indem wir einfach das
ändern. Der Betrag von
muss allerdings stets größer bleiben als der von
Vorzeichen von
. Dann ist die Energie in (8.31) positiv, und der Drehimpuls weiterhin wohldefiniert.
, den der Komet zurückliegt, ist völlig identisch mit den RechDie Berechnung des Weges
nung (8.32–8.39) für die Planetenbahnen. Das heißt, wie bekommen auch hier die folgende Darstellung des Weges in Polarkoordinaten,
(8.45)
Um diesen Zusammenhang von den Kreisbahnen auf allgemeine Ellipsenbahnen zu verallgemeinern, müssen wir also nur den Radius der Kreisbahn durch die große Halbachse der Ellipsen
ersetzen.
Es gibt zwei Möglichkeiten, diese Aussage zu beweisen. Während eines Umlaufs des Planeten
ist, gerade eine
macht das fiktive Teilchen, dessen Ortskoordinaten die radiale Koordinate
Schwingung in der Potenzialmulde in Abbildung 8.1(b). Für die Periode einer solchen Schwingung gilt die Formel (7.23), also
. Man halte dazu
fest und bilde demn
Aufgabe 8.10 Man diskutiere den Grenzfall
. Wie sieht in diesem Fall die Bahn aus? Welche Umlaufzeit ergibt sich?
Grenzwert
Welche Beziehung besteht zwischen diesem Ergebnis und der in Kapitel 4 berechneten Fallzeit
zweier Körper, die senkrecht aufeinander zu stürzen? Dort hatten wir gesehen, dass es sinnlos
ist, die Bahnen nach dem Zusammenstoß fortzusetzen. Das gilt nat ürlich nur, wenn sie genau
aufeinander stürzen. Was passiert, wenn wir ihnen einen ganz kleinen Drehimpuls geben, so dass
sie sich gerade so verfehlen?
Die Quadrate der Umlaufzeiten der Planeten verhalten sich zueinander wie die dritten
Potenzen der großen Halbachsen der Bahnen.
Aufgabe 8.9 Man bestätige das dritte Keplersche Gesetz durch Ausrechnen das Integrals (8.45).
Dass der Betrag des Drehimpulses angibt, welche Fläche der Ortsvektor eines Teilchens pro Zeit
überstreicht, hatten wir bereits in Abbildung 3.7 gezeigt. Das zweite Keplersche Gesetz ist also
letztlich nur eine geometrisch anschauliche Formulierung der zweiten Bewegungsgleichung in
(8.25). Es gilt unabhängig vom Gravitationsgesetz für jedes Teilchen in einem Zentralkraftfeld.
Interessanter ist das dritte Keplersche Gesetz, das wir bereits für einen Spezialfall formuliert
hatten. Es sagt etwas über die Umlaufzeit der Planeten aus:
Wenn wir hier und
durch
und
ausdrücken, können wir das Integral lösen und so die
Periode berechnen.
Es gibt aber eine einfachere und sehr viel anschaulichere, geometrische Methode, um die Umlaufzeit eines Planeten zu berechnen. Wie wir wissen, gilt für die vom Ortsvektor in der Zeit
überstrichene Fläche
, oder
. Denn der Betrag des Drehimpulses bzw.
des spezifischen Drehimpulses
ist konstant, so dass die überstriche Fläche proportional zur
Zeit ist.
(8.48)
positiv ist, muss der
wohldefiniert. Damit
Allerdings ist diese Funktion nicht mehr für alle
Nenner negativ sein, also
109
(8.49)
Da
negativ und sein Betrag größer als
ist, hat der Bruch auf der rechten Seite einen Wert
zwischen und , so dass sich für eine Einschränkung auf ein symmetrisches Intervall ergibt,
Die Periheldrehung
(8.50)
mit
An den Rändern dieses Intervalls, also für
geht
. Es handelt sich dabei
um diejenigen Richtungen, aus denen der Komet kommt bzw. in die er wieder verschwindet. In
Abbildung 8.2(b) ist eine typische solche Bahn dargestellt.
Es handelt sich bei dieser Bahn um eine Hyperbel. Der eine Brennpunkt der Hyperbel liegt im
auf der
Kraftzentrum , der zweite an einem Punkt mit dem Ortsvektor
positiven -Achse. Die Geraden, denen sich die Hyperbel asymptotisch nähert, schneiden sich im
Mittelpunkt der beiden Brennpunkte auf der -Achse. Der Winkel, unter dem sie sich schneiden,
wird wie in Abbildung 8.2(b) gezeigt durch den Winkel bestimmt.
Aufgabe 8.11 Man zeige, dass es sich bei dieser Bahn tatsächlich um eine Hyperbel handelt. Für
die Punkte auf einer Hyperbel gilt
, wenn und die beiden Brennpunkte
sind.
(8.52)
Die Kometenbahnen werden auf Streubahnen genannt. Man stellt sich dazu vor, dass irgenwo in
großer Entfernung zum Streuzentrum, also zur Sonne, jemand einen Körper abwirft. Weit draußen
bewegt sich dieser Körper nahezu geradlinig und gleichförmig auf der Geraden, der sich die
Hyperbel asymptotisch nähert. Kommt der Körper in die Nähe der Sonne, so wird er gestreut, das
heißt er weicht von seiner geraden Bahn ab. Wenn er sich dann wieder entfernt, bewegt er sich
wieder nahezu geradlinig.
Jedoch ist seine Bahn jetzt gegenüber der ursprünglichen Bahn um einen Winkel gedreht,
der als Streuwinkel bezeichnet wird. Wie man leicht in Abbildung 8.2(b) ablesen kann, ist dieser
Streuwinkel gerade
(8.51)
Wenn man die Bahnen der Planeten im Sonnensystem sehr genau vermisst, stellt man fest, dass
es sich nicht wirklich um geschlossene Ellipsen handelt. Es gibt dafür mehrere Ursachen. So haben wir bei unseren Rechnungen bisher die Wechselwirkungen der Planeten untereinander völlig
vernachlässigt. Diese sind zwei klein, führen aber nach genügend vielen Umläufen der Planeten
durchaus zu messbaren Abweichungen.
Da die Bahnen der Planeten schon seit vielen Hundert Jahren sehr genau vermessen wurden,
kann man diese Abweichungen leicht nachweisen. Jedoch erfordert eine Berechnung dieser Abweichungen für einen Planeten die Berücksichtigung aller anderen Planeten, und sie lässt sich nur
bei genauer Kenntnis aller Daten der Planetenbahnen und deren Massen durchführen. Das wäre
an dieser Stelle viel zu aufwendig. Wir werden diesen Aspekt daher im folgenden nicht weiter
diskutieren.
Es gibt aber noch eine andere mögliche Ursache für eine Abweichung der Planetenbahnen von
den geschlossenen Keplerschen Ellipsen. Vielleicht stimmt das Newtonsche Gravitationsgesetz
ja gar nicht exakt, sondern nur innerhalb einer gewissen Näherung. Es ist deshalb ganz sinnvoll,
zu untersuchen, welche Abweichungen sich in den Keplerschen Gesetzen ergeben, wenn wir das
Gravitationsgesetz etwas verändern. Sollte man diese Abweichung dann tatsächlich beobachten,
oder eben nicht, so lassen sich daraus Schlüsse über die Gültigkeit des allgemeinen Gravitationsgesetzes ziehen.
Wie könnte eine kleine Abweichung des Kraftgesetzes vom Newtonschen Gravitationsgesetz
aussehen? Für große Abstände der beteiligten Körper stimmt es offenbar sehr gut, also sollten
wir davon ausgehen, dass das “ ”-Verhalten des Gravitationspotenzials für große richtig ist.
Aber für sehr kleine Abstände könnte es eventuell eine Abweichung geben. Wir könnten also zum
Gravitationspotenzial (8.23) eine Korrektur hinzufügen, die nur für kleine Abstände relevant ist.
Machen wir dazu den Ansatz
110
Aufgabe 8.12 Man drücke den Streuwinkel durch die Energie und den Drehimpuls des gestreuten
? Wie groß ist dann der Streuwinkel, und wie sieht
Körpers aus. Was gescheiht im Grenzfall
die Bahn aus?
ist der zusätzDie zusätzliche eingeführte Konstante hat die Dimension eine Länge. Für
liche Term sehr klein, so dass wir ihn vernachlässigen können. Die Konstante gibt also an,
auf welcher Längenskala sich eine Abweichung vom Newtonschen Gravitationgesetzt bemerkbar
macht.
Ist zum Beispiel
mm, so wäre die Abweichung für die Planetenbahnen sehr klein, aber
im Labor würde man eine Abweichung feststellen, wenn sich zwei schwere Körper sehr nahe
kommen. Für ein positives wird die Anziehungskraft bei kleinen Abständen größer, für negatives wird sie kleiner und kehrt sich bei Abständen
sogar in eine Abstoßung um, wie
man durch Ableiten von (8.52) nach leicht bestätigen kann.
Tatsächlich ist das Newtonsche Gravitationsgesetz nur bis zu Größenordnungen von einigen
Millimetern bei Massen von einigen Gramm experimentell bestätigt. Es ist nämlich sehr schwierig, große Massen sehr dicht aneinander zu bringen, ohne dass dabei andere, zum Beispiel elektro
Für die Physik des Sonnensystems und die Gravitationstheorie sind diese Bahnen nicht von großer
Bedeutung. Sie beschreiben zwar die Bewegungen von Kometen, die nur einmal in ihrem Leben
das Sonnensystem besuchen, aber solche Ereignisse sind sehr selten. Allerdings spielen ähnliche
Bahnen in der Mikrophysik eine große Rolle. Dort geht es oft darum, ein Kraftfeld, zum Beispiel
das eine Atomkerns, zu vermessen, indem man Teilchen an diesem Kraftzentrum streut und deren
Verhalten untersucht, also under anderem den Streuwinkel misst. Wir werden uns deshalb an
andere Stelle etwas ausfühlicher mit den Streubahnen beschäftigen.
Es gilt also
(8.55)
magnetische Kräfte auftreten, die die Gravitationskräfte dann um viele Größenordnungen übersteigen. Es ist also keineswegs ausgeschlossen, dass das Newtonsche Gravitationsgesetz bei kleinen Abständen gar nicht mehr gilt.
Natürlich könnten wir uns auch beliebige andere Abweichungen vom “ ”-Potenzial ausdenken. Der eigentliche Grund, warum wir gerade ein modifiziertes Potenzial der Form (8.52) betrachten, ist, dass wir für dieses Potenzial die Bewegungsgleichungen unmittelbar lösen können.
Wir müssen dazu nur die bereits gefundenen Lösungen ein wenig modifizieren. Es soll hier also
mehr darum gehen, mit möglichst einfachen Mitteln zu untersuchen, was prinzipiell geschieht,
wenn wir das Kraftgesetz ein wenig abändern. Wir werden nicht die allgemeinste mögliche
Veränderung diskutieren.
Was müssen wir tun, um die Bewegungsgleichungen für das veränderte Potenzial (8.52) zu
lösen? Es ist natürlich immer noch ein Zentralkraftpotenzial. Wir können wieder die Drehimpulserhaltung und die Methode des effektiven Potenzials verwenden. Wir definieren die Erhaltungsgrößen Energie und Drehimpuls wie in (8.25), nur für das effektive Potenzial
müssen wir
jetzt einen anderen Ausdruck einsetzen,
Auch das ist wieder eine quadratische Gleichung, und wir können die Erhaltungsgrößen und
durch die Parameter
ausdrücken. Statt (8.31) gilt jetzt
(8.56)
Wenn positiv ist, ergibt sich hieraus automatisch die Bedingung (8.54) ab den Drehimpuls .
Ist negativ, ergibt sich aus der Forderung, dass
sein muss, eine zusätzliche Bedingung
und . Das liegt daran, dass die modifizierte Gravitationskraft für negatives bei kleinen
an
Abständen abstoßend wirkt. Daher sind in diesem Bereich keine Umlaufbahnen mehr möglich.
Wenn wir von diesen Einschränkungen einmal absehen, können wir jetzt genau so vorgehen
, die sich aus der Energieerhaltung, also
wie vorher. Wenn wir die Bewegungsgleichung für
der ersten Gleichung in (8.55) ergibt, durch
und
ausdrücken, ergibt sich die Gleichung
(8.32),
(8.57)
Wie sieht dieses effektive Potenzial aus? Es besitzt wieder einen
- und einen
-Anteil.
Für große dominiert der
-Anteil, das heißt dort ist alles beim alten. Für kleine dominiert
der
-Anteil. Sein Vorzeichen hängt jetzt allerdings davon ab, ob
größer oder kleiner als
ist.
Nur, wenn
größer also
ist, hat der
-Term ein positives Vorzeichen, und das
effektive Potenzial sieht wie in Abbildung 8.1 aus. Andernfalls fällt es für
nach
ab. In diesem Fall gibt es keine Potenzialmulde, also auch keine Pendelbewegungen und
somit keine Planetenbahnen.
Da wir uns hier nur für Planetenbahnen interessieren, werden wir nur den Fall
(8.53)
mit
An der Radialbewegung des Planeten ändert sich also gar nichts. Er pendelt zwischen den Umkehrpunkten
und
hin und her, und zwar mit der gleichen Periode wie vorher. Wir können
sie sofort angeben, denn sie ergibt sich aus dem dritten Keplerschen Gesetz zu
(8.58)
wird jedoch leicht modifiziert. Statt (8.33) be
Die entsprechende Bewegungsgleichung für
kommen wir
(8.54)
mit
(8.59)
betrachten. Für negatives ist diese Ungleichung offenbar immer erfüllt, für positives macht
sie jedoch eine Einschränkung an den Drehimpuls. In jedem Fall sich die Planetenbahnen wieder
diejenigen Bahnen mit negativer Energie, denn sonst entweicht das fiktive Teilchen, das sich im
effektiven Potenzial bewegt, ins Unendliche.
Mit einem einfachen Trick können wir die Lösungen der Bewegungsgleichungen aus den bekannten Lösungen für
herleiten. Das das effektive Potenzial von der gleiche Form ist,
können wir die Planetenbahnen auch jetzt wieder durch den minimalen Abstand
und den mavon der Sonne klassifizieren. Die Umkehrpunkte sind auch hier wieder durch
ximalen Abstand
die Bedingung (8.29) festgelegt, nur dass wir ein anderes effektives Potenzial einsetzen müssen.
Um diese Differenzialgleichung wieder auf die Form (8.35) zu bringen, führen wir einen Korrekturfaktor ein, Wir setzen
(8.60)
Die Bewegungsgleichungen (8.57) und (8.60) für
und
sind jetzt mit den ursprünglichen
Bewegungsgleichungen (8.32) und (8.33) identisch, bis auf den Unterschied, dass hier statt
die Funktion
steht.
111
Bahn in Abbildung 8.3(b).
Um eine solche Rosettenbahn quantitativ zu beschreiben, führt man die Periheldrehung ein.
Darunter versteht man den Winkel , um den zwei aufeinanderfolgende sonnennächste Punkte gegeneinander verschoben sind. In Abbildung 8.3(a) ist die Periheldrehung positiv, da der
Planet mehr als eine Umdrehung gemacht hat, in Abbildung 8.3(b) ist sie negativ, da der Planet
weniger als eine Umdrehung gemacht hat.
Die Periheldrehung hängt natürlich von den Bahndaten des Planeten ab. Es ergibt sich
replacements
(8.62)
(c)
(d)
(b)
(a)
Für kleine können wir diesen Ausdruck in eine Taylor-Reihe entwickeln. Klein heißt in diesem
und
groß sind im Vergleich zum Parameter , der ja die Dimension
Fall, dass die Radien
eine Länge hat. Für
ist
, also
Abbildung 8.3: Eine Korrektur des Gravitationsgesetzes bewirkt, dass die Bahnen der Planeten
nicht mehr in sich geschlossen sind. Es ergeben sich rosettenförmige Bahnen. Während einer
Pendelbewegung verschiebt sich das Perihel, also der sonnennächste Punkt, um einen Winkel
in Richtung des Umlaufs (a), oder gegen den Umlaufsinn (b).
(8.63)
Aufgabe 8.13 Wenn sich ein Planet auf einer Kreisbahn bewegt, kann man nat ürlich keine Perieinen bestimmten Wert.
heldrehung beobachten. Trotzdem liefert die Formel (8.62) f ür
Welche physikalische Bedeutung hat dieser Wert?
(8.61)
Aufgabe 8.14 Welche Beziehung besteht zwischen dem Radius
und der Umlaufzeit
eines
Planeten auf einer Kreisbahn im modifizierten Gravitationspotenzial (8.52)? Was hat diese Aufgabe mit der Aufgabe 8.13 zu tun?
Wir können daher die Lösungen der Bewegungsgleichungen unmittelbar übernehmen, wenn
ersetzen. Das gilt insbesondere für die Beziehung (8.39) zwischen und
wir überall durch
. Der Weg des Planeten wird jetzt durch die Funktion
Der Merkur und die Relativitätstheorie
112
Eine Abweichung des Gravitationsgesetz von dem von Newton postulierten “ ”-Potenzial führt
also dazu, dass die Planetenbahnen nicht mehr in sich geschlossen sind. Wie eingangs bereits
erwähnt, hat man eine solche Abweichung, also eine Periheldrehung der Planeten im Sonnensystem, tatsächlich beobachtet.
Der weitaus größte Teil dieses Effektes beruht aber auf der Wechselwirkung mit den anderen
Planeten, die wir hier nicht einbezogen haben. Auf diese Weise wurden sogar die äußeren Planeten
Neptun und Pluto “entdeckt”. Man fand in den Bahnen der bekannten Planeten Abweichungen
von den Kepler-Ellipsen, die sich nur dadurch erklären ließen, dass es noch weitere Planeten
geben muss.
Unerklärt blieb jedoch bis ins Jahr 1916 die Periheldrehung, die man beim Merkur, also dem
sonnennächsten Planeten beobachtet hatte. Zwar geht auch bei ihm der größte Teil der gemessenen Abweichung von der Keplerschen Ellipse auf die Anziehungskräfte der anderen Planeten
zurück. Aber es stellte sich heraus, dass eine zwar sehr kleine, aber nicht erklärbare Abweichung
übrig blieb.
beschrieben. Der Korrekturfaktor tritt also im Argument des Kosinus auf.
Welche Konsequenzen hat das, und wie sehen diese Planetenbahnen aus? Offenbar ist die Perijetzt nicht mehr , sondern
. Mit anderen Worten, der Winkelabstand
ode der Funktion
zwischen zwei Minima der Funktion
ist nicht , sondern
. Die Bahn ist keine geschlossene Ellipse mehr, sondern eine Art Rosette, wie sie in Abbildung 8.3 dargestellt ist. Dass sich
aus dem Newtonschen Gravitationsgesetz geschlossene, also periodisch durchlaufene Bahnen ergeben, ist also tatsächlich nur ein Zufall.
Während der oben berechneten Periode pendelt der Planet einmal vom sonnennächsten Punkt
zum sonnenfernsten Punkt
und wieder zurück. Dabei macht er aber keine vollen Umlauf,
zurück. Je nach dem, ob größer oder kleiner als Eins ist, kann das
sondern legt den Winkel
mehr oder weniger als ein ganzer Umlauf sein. Das hängt offenbar vom Vorzeichen von ab. Ist
positiv, so ist größer als eins, das heißt während einer Pendelbewegung macht der Planet mehr
als einen Umlauf. Dieser Fall ist in Abbildung 8.3(a) dargestellt. Ist dagegen negativ, macht der
Planet während einer Pendelbewegung weniger als einen Umlauf. In diesem Fall ergibt sich die
(8.64)
Das ist natürlich unvorstellbar wenig. Trotzdem lässt sich dieser Wert leicht ermitteln, wenn man
die Bahn des Merkur über einige Jahrhunderte hinweg genau verfolgt. Der Grund dafür ist unter
anderem, dass die Merkurbahn stärker als die der anderen Planeten von einer Kreisbahn abweicht.
Der jeweils sonnennächste Punkt lässt sich daher sehr leicht beobachten. Für die Bahndaten findet
man
m
m
(8.65)
Nehmen wir nun an, diese Periheldrehung sei durch eine Abweichung des Gravitationsgesetzen
von der Art verursacht, wie wir sie hier untersucht haben. Dann folgt aus (8.63)
(8.66)
km
(8.67)
113
km
Mit anderen Worten, das Gravitationsfeld der Sonne würde bei Abständen von einigen Kilometern
deutliche Abweichungen vom Newtonschen Gesetz zeigen. Das ist natürlich unrealistisch, denn
auf diesen Skalen wäre es unsinnig die Sonne als Punktteilchen zu beschreiben, weil sie selbst
ja viel größer ist. Wir können eine solche Abweichung nicht direkt messen, indem wir uns dem
Kraftzentrum nähern, weil wir uns dann schon lange im Innern der Sonne befinden würden, wo
das Kraftgesetz aus ganz anderen Gründen nicht mehr gilt.
Trotzdem kann man sich fragen, ob es vielleicht irgendeinen Grund gibt, warum die Abweichung vom Newtonschen Gravitationsgesetz gerade bei dieser Größenordnung auftritt, wenn es
denn ein verändertes Gravitationsgesetz ist, das diese Periheldrehung verursacht. Sicher spielt
hier auch die Masse der Sonne eine Rolle, denn in irdischen Labors findet man, dass bei sehr viel
kleineren beteiligten Massen das Newtonsche Gesetz auch bei Abständen von viel weniger als
einem Kilometer noch gilt.
Verblüffenderweise findet man, dass man durch geschicktes Kombinieren von Naturkonstanten und der Sonnenmasse auch eine Größe bilden kann, die die Dimension einer Länge hat. Aus
die Dimension
der Relation (8.47), also dem dritten Keplerschen Gesetz, lesen wir ab, dass
Länge hoch drei geteilt durch Zeit zum Quadrat hat. Nun gibt es eine Naturkonstante, die die Dimension einer Geschwindigkeit hat. Sie spielt zwar in der klassischen Mechanik keine besondere
Rolle, jedoch in der Elektrodynamik und der Relativitätstheorie. Es ist die Lichtgeschwindigkeit
m s. Daraus können wir die Größe
bilden. Überraschenderweise hat die sie gleiche Größenordnung wie die auf eine sehr naive Weise
ermittelte Konstante . Eine solche “zufällige” Übereinstimmung von Größenordnungen ist ein
deutlicher Hinweis dafür, dass an der Vermutung eines veränderten Gravitationsgesetzes etwas
dran ist.
Aber wie soll ein solchen verändertes Gravitationsgesetz aussehen? Darüber gibt die Messung
der Periheldrehung keine Auskunft. Wir haben hier ja nur einen ganz speziellen Ansatz diskutiert.
Es gibt viele andere Möglichkeiten, das Gravitationsgesetz zu modifizieren. Fast alle führen im
Rahmen der hier durchgeführten Näherung, und mit entsprechend angepassten Parametern, zum
selben Ergebnis.
Es war deshalb sehr überraschend, dass eine aufgrund ganz anderer Überlegungen konstruierte
Theorie der Gravitation, nämlich die allgemeine Relativitätstheorie, genau die richtige Abweichung lieferte, ohne dass man zusätzliche Annahmen machen musste. Damit war im Jahre 1916,
also Einstein die endgültige Version der Theorie veröffentlichte, das Rätsel der Periheldrehung
des Merkur gelöst.
Wie genau diese Lösung aussieht, darauf können wir hier nicht näher eingehen, denn dazu müssten wir erst einmal die allgemeine Relativitätstheorie verstehen. Was das Beispiel aber
klar machen soll, ist, dass es oft eine als zufällige erscheinende, unerklärbare Relation zwischen
Messdaten und Naturkonstanten ist, die auf eine noch unverstandene oder unbekannte Theorie
hindeutet.
Die lange Zeit unerklärbare Beziehung zwischen den Bahndaten des Merkur und den Naturkonstanten und ist eine der berühmtesten Beziehungen dieser Art, denn sie gilt also eine der
wichtigesten frühen experimentellen Bestätigungen der Relativitätstheorie. In der Geschichte der
Physik gab es viele solche ‘’Schlüsselbeziehungen”, und es gibt sie natürlich auch heute noch.
Diese Abweichung sollte in der Geschichte der Physik des letzten Jahrhunderts eine wichtige Rolle spielen. Wir wollen daher ein wenig näher auf sie eingehen. Was man fand war eine
Winkelsekunden pro Erdjahrhundert. Mit anderen Worten,
Periheldrehung des Merkur von
in hundert Erdjahren bewegte sich das Perihel des Merkur um
Winkelsekunden nach vorne.
Umgerechnet ergibt sich daraus nach unserer Konvention eine Periheldrehung des Merkur von