MMP Ergänzungsskript

Werbung
MATHEMATISCHE & PHYSIKALISCHE
ZUSÄTZE ZUM ERGÄNZUNGSFACH
“QUANTEN- UND ATOMPHYSIK”
Promotion 145
A. Gertsch
Zürich im August 2016
Inhaltsverzeichnis
1 Differenziation – Altes und Neues zur Ableitung
1.1 Die Ableitung als Steigung der Tangente an einen Funktionsgraphen
1.2 Die Ableitungsdefinition alt und neu betrachtet . . . . . . . . . . .
1.3 Repetition: Ein explizites Beispiel zur Ableitungsdefinition . . . . . .
1.4 Allgemeine Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . .
1.5 Ableitungen elementarer Funktionen . . . . . . . . . . . . . . . . .
1.6 Das infinitesimale Verständnis: Im unendlich Kleinen ist alles linear!
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
4
5
5
6
2 Altes und Neues zur Integration
2.1 Der Hauptsatz der Differenzial- und Integralrechnung . . . . . . . . . . .
2.1.1 Das bestimmte Integral als Fläche unter einem Funktionsgraphen
2.1.2 Der eigentliche Hauptsatz . . . . . . . . . . . . . . . . . . . . . .
2.1.3 Der Beweis des Hauptsatzes . . . . . . . . . . . . . . . . . . . .
2.1.4 Physikalische Saloppheit . . . . . . . . . . . . . . . . . . . . . .
2.1.5 Rechtecksflächen und Integralnotation . . . . . . . . . . . . . . .
2.1.6 Negative Integralwerte . . . . . . . . . . . . . . . . . . . . . . .
2.1.7 Unbestimmtes Integral, Integrationskonstante und Flächenfunktion
2.1.8 Das bestimmte Integral als Veränderung einer Grösse . . . . . . .
2.2 Allgemeine Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Auswahl unbestimmter Integrale . . . . . . . . . . . . . . . . . . . . . .
2.4 Integrationstechniken . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Symmetrien erkennen und ausnutzen . . . . . . . . . . . . . . . .
2.4.2 Erkennen äusserer und innerer Ableitungen . . . . . . . . . . . . .
2.4.3 Lineare Substitution . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.4 Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Spezielle bestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
7
8
10
10
12
13
14
15
15
16
16
18
19
22
23
24
3 Differenzialgleichungen – ein fundamental neuer Gleichungstyp
3.1 Was ist eine Differenzialgleichung (DGL)? . . . . . . . . . . . . . . . . . . . .
3.2 Erste Beispiele von DGLs (ohne physikalischen Kontext) . . . . . . . . . . . .
3.2.1 Stammfunktionen bestimmen . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Sinus- und Cosinusfunktion . . . . . . . . . . . . . . . . . . . . . . . .
3.2.4 Lineare, inhomogene DGL 2. Ordnung: . . . . . . . . . . . . . . . . .
3.3 Funktionen mit mehreren Variablen und partielle Ableitungen . . . . . . . . . .
3.3.1 Die Notation partieller Ableitungen . . . . . . . . . . . . . . . . . . . .
3.3.2 Weshalb verwendet man für partielle Ableitungen eine andere Notation?
3.3.3 Unser zentrales Beispiel: Wellenfunktion und Schrödingergleichung . . .
3.4 Differenzialoperatoren und mehrfache Ableitungen . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
27
27
27
28
30
30
30
31
31
32
.
.
.
.
.
.
.
.
33
33
36
38
39
39
39
40
44
4 Die
4.1
4.2
4.3
4.4
klassische Mechanik – eine differenzielle Theorie
Kinematik und Differentialrechnung . . . . . . . . . . . . . .
Kinematik und Integralrechnung . . . . . . . . . . . . . . . .
Das 2. Newton’sche Axiom als Differenzialgleichung . . . . . .
Beispiele zu Kraftgesetzen und daraus folgenden DGLs für x(t)
4.4.1 Freier Fall an der Erdoberfläche . . . . . . . . . . . . .
4.4.2 Fallen mit Luftwiderstand . . . . . . . . . . . . . . . .
4.4.3 Der klassische, ungedämpfte harmonische Oszillator . .
4.4.4 Gravitationsgesetz im Eindimensionalen . . . . . . . .
ii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.5
4.6
4.4.5 Beispiel für eine explizit von der Zeit abhängige Kraft . . . . . . . . . . .
Konservative Kräfte, Aktionsprinzip und Energieerhaltung . . . . . . . . . . . . .
4.5.1 Das Potenzial V (x, t) – ein allgemeinerer Blick auf die potenzielle Energie
4.5.2 Beispiele von Potenzialen und zugehörigen konservativen Kräften . . . . .
4.5.3 Energieerhaltung – das Aktionsprinzip mit konservativen Kräften . . . . .
Repetition/Ergänzung: Der klassische, ungedämpfte harmonische Oszillator . . .
4.6.1 Zwei wichtige Eigenschaften des klassischen harmonischen Oszillators . .
5 Komplexe Zahlen C
5.1 Althergebrachte Zahlenmengen . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Natürliche Zahlen N und ganze Zahlen Z . . . . . . . . . . . . . . .
5.1.2 Die rationalen Zahlen Q . . . . . . . . . . . . . . . . . . . . . . . .
5.1.3 Irrationale Zahlen I . . . . . . . . . . . . . .√. . . . . . . . . . . . .
5.1.4 Ein vielzitierter Beweis: Die Irrationalität von 2 . . . . . . . . . . .
5.1.5 Die reellen Zahlen R . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Die reellen Zahlen R als mathematischer Körper . . . . . . . . . . . . . . . .
5.2.1 Die neun Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.2 Anmerkungen zu Körpern und zu den Körperaxiomen . . . . . . . . .
5.3 Die Menge der komplexen Zahlen C . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Definition der komplexen Zahlen und Gauss’sche Zahlenebene . . . .
5.3.2 Komplexe Konjugation . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Rechenregeln – die komplexen Zahlen C als Zahlenkörper . . . . . . . . . . .
5.4.1 Ein näherer Blick auf die Addition komplexer Zahlen . . . . . . . . .
5.4.2 Ein näherer Blick auf die Multiplikation komplexer Zahlen . . . . . .
5.4.3 Der Betrag einer komplexen Zahl . . . . . . . . . . . . . . . . . . . .
5.4.4 Division: Bruchrechnen mit komplexen Zahlen . . . . . . . . . . . . .
5.4.5 Die imaginäre Einheit i und ihre Potenzen . . . . . . . . . . . . . . .
5.4.6 Überprüfung der Körperaxiome . . . . . . . . . . . . . . . . . . . . .
5.5 Komplexe Zahlen in Polarkoordinaten, Euler-Gleichung und Euler-Darstellung
5.5.1 Polarkoordinaten in der komplexen Ebene . . . . . . . . . . . . . . .
5.5.2 Euler-Gleichung und Euler-Darstellung komplexer Zahlen . . . . . . .
5.5.3 Repetition der Potenzgesetze . . . . . . . . . . . . . . . . . . . . . .
5.5.4 Das Verständnis der komplexen Multiplikation . . . . . . . . . . . . .
5.6 Weitere Zusammenhänge und erste Anwendungen mit komplexen Zahlen . .
5.6.1 Die Gleichung z n = 1 und die n-ten Einheitswurzeln . . . . . . . . .
5.6.2 Mehr vom Wurzelziehen im Komplexen . . . . . . . . . . . . . . . .
5.6.3 Quadratische Gleichungen im Komplexen . . . . . . . . . . . . . . .
5.6.4 Darstellung komplexer Funktionen . . . . . . . . . . . . . . . . . . .
5.6.5 Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . .
5.6.6 Die trigonometrischen Additionstheoreme . . . . . . . . . . . . . . .
5.6.7 Cosinus- und Sinusfunktion als Linearkombinationen von eiϕ und e−iϕ
5.6.8 Der harmonische Oszillator im Komplexen . . . . . . . . . . . . . . .
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
46
49
49
52
53
55
55
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
57
58
58
59
60
61
61
62
64
64
64
65
66
67
68
69
71
71
72
72
75
76
76
79
79
82
85
88
89
90
92
94
1
1.1
Differenziation – Altes und Neues zur Ableitung
Die Ableitung als Steigung der Tangente an einen Funktionsgraphen
Wir repetieren: Bei gegebener Funktion f (x) können Sie mittels Ableitungsregeln die Ableitungsfunktion f ′ (x) bestimmen. Für den Funktionsgraphen haben der Funktionswert f (x) und
der Wert der Ableitung f ′ (x) an der Stelle x anschauliche Bedeutungen (vgl. Abb. 1):
Funktionswert f (x): Geben wir uns eine bestimmte Stelle x auf der x-Achse vor, so beschreibt
f (x), auf welcher y-Höhe der Graph an dieser Stelle x vorbeikommt: y = f (x).
⇒ “Jeder Punkt P auf dem Graphen von f hat die Koordinaten P x, f (x) .”
Wert der Ableitung f ′ (x): Salopp wird die Ableitung häufig als Steigung des Funktionsgraphen
bezeichnet. Genauer ist die Formulierung: Die Ableitung f ′ (x)steht für die Steigung mt der
Tangente t an den Funktionsgraphen im Punkt P x, f (x) , also: mt = f ′ (x).
⇒ “Ableiten resp. Differenzieren heisst Steigungen berechnen.”
Bei Optimierungsfragen, d.h. für die Suche nach den Maxima oder Minima einer Funktion, ist das
Verständnis der Ableitung als Steigung des Funktionsgraphen sehr nützlich. Eine Stelle x kann nur
dann zu einem lokalen Maximum von f (= Kuppe im Graphen) gehören, wenn dort die Steigung
gleich 0 ist, also die Ableitung verschwindet. Die Lösungen x der Gleichung f ′ (x) = 0 sind Kandidaten für lokale Maximalstellen. Mit weiteren Betrachtungen lässt sich herausfinden, ob es sich
tatsächlich um ein Maximum, oder sonst um ein Minimum oder einen Sattelpunkt handelt, etc.
Abbildung 1: Die graphische Bedeutung von Funktionswert f (x) und Ableitung f ′ (x).
1.2
Die Ableitungsdefinition alt und neu betrachtet
Neben dem hilfreichen Bild der Ableitung als Steigung ist für unsere weiteren Betrachtungen vor
allem das folgende Verständnis zentral:
“Die Ableitung f ′ (x) beschreibt, wie sehr sich der
Funktionswert f (x) an der Stelle x am verändern ist.”
Je grösser die Ableitung f ′ (x) ist, desto steiler ist der Graph über dieser Stelle x und desto stärker
ist sich dort der Funktionswert f (x) am verändern. An einer steilen Stelle (grosses f ′ (x)) bewirkt
bereits eine geringe Veränderung der Variable x eine grosse Veränderung des Funktionswertes f (x).
1
Dieses Verständnis wollen wir weiter vertiefen, indem wir die Ihnen bereits bekannte Definition
der Ableitung nochmals unter die Lupe nehmen. Dabei lernen Sie auch gerade die in der höheren
Mathematik gängige Ableitungsschreibweise df
dx kennen.
Definition der Ableitung f ′ (x) einer Funktion f (x)
einer Funktion f (x) ist gegeben durch den
Die Ableitung f ′ (x) resp. df
dx
Grenzwert des Differenzenquotienten ∆f
∆x für ∆x → 0:
f ′ (x) ≡
df
∆f
f (x + ∆x) − f (x)
≡ lim
≡ lim
dx ∆x→0 ∆x ∆x→0
∆x
(1)
Dabei stehen dx und df für infinitesimale Veränderungen, also unendlich
kleine Schritte der Variable x und der Funktion f (x) (an der Stelle x).
Das dreifache Gleichheitszeichen “≡” steht für eine Definition resp. dafür, dass wir die beiden Objekte
links und rechts davon als vollkommen identisch miteinander betrachten wollen.
Erläuterungen zur Ableitungsdefinition
, also die Steigung ms
• Am Anfang der Ableitungsbildung steht der Differenzenquotient ∆f
∆x
1
einer Sekante s durch zwei Punkte auf dem Funktionsgraphen. Der erste
Punkt P x, f (x)
sitzt über der Stelle x, während der zweite Punkt Q x + ∆x, f (x + ∆x) von P aus um ∆x
nach rechts verschoben ist und demnach über der Stelle x + ∆x sitzt. Somit betragen die
Sekantensteigung ms resp. der Differenzenquotient ∆f
∆x (vgl. Abb. 2):
ms =
yQ − yP
f (x + ∆x) − f (x)
f (x + ∆x) − f (x)
∆f
=
=
≡
xQ − xP
x + ∆x − x
∆x
∆x
Abbildung 2: Das Steigungsdreieck an die Sekante.
1
lat. secare = schneiden ⇒ Sekante = schneidende Gerade.
2
• Lässt man ∆x immer kleiner werden, so rutscht Q auf dem Graphen immer näher an P heran.
Dadurch wird die Sekante s immer mehr zur Tangente t an den Graphen im Punkt P . Die
Sekantensteigung ms strebt gegen die Tangentensteigung mt .
• Wie klein wollen wir ∆x werden lassen?
Die Antwort lautet: Unendlich klein, aber nicht gleich 0! Für ∆x = 0 wäre nämlich die
Sekantensteigung ms resp. der Differenzenquotient ∆f
∆x gar nicht mehr definiert, weil im Nenner
eine 0 auftreten würde. Für jedes ∆x > 0 existiert aber ∆f
∆x .
Solange ∆x > 0 ist, wird die Sekantensteigung ms bei gebogenen Funktionsgraphen nie exakt
der Tangentensteigung mt entsprechen, aber für immer kleiner werdendes ∆x wird sie mt
beliebig nahe kommen!2 Deshalb sagen wir: Die Tangentensteigung mt ist der Grenzwert
oder eben der Limes (lim)3 , dem sich die Sekantensteigung ms für ∆x → 0 annähert:
mt = lim ms
(sprich: “Limes für Delta x gegen 0 von ms”)
∆x→0
• Formulieren wir dies nochmals mit der Ableitung f ′ (x) anstelle der Tangentensteigung mt und
dem Differenzenquotienten ∆f
∆x anstelle der Sekantensteigung ms , so haben wir die Gleichung
vor uns, die wir als Definition der Ableitung f ′ (x) ansehen wollen:
∆f
∆x→0 ∆x
f ′ (x) ≡ lim
• Im Grenzwert ∆x → 0 werden sowohl die Funktionswertdifferenz ∆f , wie auch der Variablenschritt ∆x unendlich klein. Ihr Verhältnis besitzt allerdings nach wie vor einen endlichen und
genau bezifferbaren Wert, der sich immer mehr der Ableitung annähert.
Diesen unbezifferbar klein gewordenen ∆f und ∆x sagen wir infinitesimale Veränderungen
oder infinitesimale Schritte und schreiben dafür df und dx. Damit lässt sich die Ableitung
ohne Limes schreiben:
df
∆f
≡
∆x→0 ∆x
dx
f ′ (x) ≡ lim
(sprich: “df nach dx”)
(2)
• Und damit sind wir schliesslich bei einem neuen und sehr interessanten Verständnis der Ableitung angelangt. Durch Umstellung (Multiplikation mit dx) können wir schreiben:
df = f ′ (x) · dx
An der Stelle x verändert sich der Funktionswert f (x) um den infinitesimalen Schritt df ,
wenn sich die Variable x um den infinitesimalen Schritt dx verändert. Dabei sind df und dx
proportional zueinander und die Proportionalitätskonstante an der Stelle x ist gerade f ′ (x).
Somit beschreibt die Ableitung f ′ (x), wie sich die Funktion f (x) an der Stelle x gerade am
verändern ist. Sie
steht für das Verhältnis der infinitesimalen Veränderungen df und dx im
Punkt x, f (x) .
Vielleicht denken Sie nun, dass sich mit diesem “infinitesimalen Zeugs” unmittelbar “nix
Gscheites” anfängen lässt, weil die infinitesimalen Veränderungen df und dx ja gar keine
angebbaren Zahlenwerte besitzen, aber warten Sie nur ein bisschen ab und Sie werden sehen,
wie nützlich dieses Verständnis der inifinitesimalen Schritte sein wird, z.B. bei der Integralrechnung im nächsten Kapitel. . .
2
Mathematisch exakter formuliert: Für jede noch so kleine Zahl ε > 0 kann man ∆x problemlos soweit verkleinern,
dass der Unterschied zwischen ms und mt kleiner ist als diese beliebig kleine Zahl ε: |ms − mt | < ε.
3
lat. limes = Grenze.
3
1.3
Repetition: Ein explizites Beispiel zur Ableitungsdefinition
1
6
Ich möchte wissen, wie sich die Funktion f (x) =
ist. D.h., ich frage nach f ′ (8).
x2 − 2x + 2 an der Stelle x = 8 am verändern
Variante 1: Ausführlicher Weg mittels Ableitungsdefinition
Unter Verwendung der Ableitungsdefinition schreibe ich:
f (x + ∆x) − f (x)
∆x→0
∆x
f ′ (x) = lim
1
6
(x + ∆x)2 − 2(x + ∆x) + 2 − ( 61 x2 − 2x + 2)
∆x→0
∆x
1
2
2 − 2x − 2∆x + 2 − 1 x2 + 2x − 2
6 x + 2x∆x + (∆x)
6
= lim
∆x→0
∆x
= lim
= lim
1
6
∆x→0
x2 + 31 x∆x + 16 (∆x)2 − 2x − 2∆x + 2 −
∆x
1
6
x2 + 2x − 2
1
3
x∆x + 16 (∆x)2 − 2∆x
∆x→0
∆x
1
1
x + ∆x − 2
= lim
∆x→0
3
6
= lim
=
1
x−2
3
Bemerken Sie: Erst von der vorletzten zur letzten Zeile kann die Limesbildung ∆x → 0
tatsächlich ausgeführt werden. Dadurch fällt der Term 16 ∆x weg, weil er gegenüber den anderen Termen unendlich klein wird. Voraussetzung dafür ist, dass beim Übergang von der
drittletzten zur zweitletzten Zeile ∆x gekürzt werden kann. Erst danach kann man ∆x gegen
0 gehen lassen, ohne dass dabei Probleme mit einem gegen Null strebenden Nenner entstehen.
Variante 2: Ausnutzung von Ableitungsregeln
Aus der Ableitungsdefinition (1) lassen sich einerseits die Ableitungsfunktionen aller elementaren Funktionstypen, andererseits allgemeine Ableitungsregeln herleiten (vgl. 1.4 und 1.5).
Für die Ableitung unseres f (x) brauchen wir beispielsweise die folgenden Informationen:
• Summenregel: Ist f (x) = u(x) + v(x), so gilt: f ′ (x) = u′ (x) + v ′ (x).
• Multiplikative Konstanten: Ist f (x) = c · u(x) (c ∈ R), so gilt: f ′ (x) = c · u′ (x).
• Ableitung von Potenzfunktionen: Ist f (x) = xn , so gilt: f ′ (x) = n · xn−1 .
Insbesondere gilt: [x]′ = 1 und [c]′ = 0 (c ∈ R).
Hat man diese Regeln resp. Ableitungsfunktionen im Kopf, so geht das Ableiten um einiges
rascher:
′
1
1
1 2
′
x − 2x + 2 = · 2x − 2 · 1 + 0 = x − 2
f (x) =
6
6
3
Abschluss: An der Stelle x = 8 folgt: f ′ (8) =
df
2
=
dx
3
1
3
·8−2 =
⇒
8
3
−
df =
6
3
= 23 , d.h. infinitesimal:
2
dx
3
An der Stelle x = 8 ist somit die infinitesimale Veränderung des Funktionswertes f (x) nur
so gross wie die zugehörige infinitesimale Veränderung der Variable x.
4
2
3
1.4
Allgemeine Ableitungsregeln
Aus der Ableitungsdefinition (1) können die folgenden allgemeinen Regeln hergeleitet werden:
f ′ (x) = u′ (x)
Additive Konstante:
f (x) = u(x) + c
⇒
Multiplikative Konstante:
f (x) = c · u(x)
⇒
Summenregel:
f (x) = u(x) + v(x)
⇒
Produktregel:
f (x) = u(x) · v(x)
⇒
f ′ (x) = u′ (x) · v(x) + u(x) · v ′ (x)
Quotientenregel:
f (x) =
⇒
f ′ (x) =
Kettenregel:
f (x) = u v(x)
1.5
u(x)
v(x)
⇒
f ′ (x) = c · u′ (x)
f ′ (x) = u′ (x) + v ′ (x)
u′ (x) · v(x) − u(x) · v ′ (x)
v 2 (x)
f ′ (x) = u′ v(x) · v ′ (x)
Ableitungen elementarer Funktionen
Aus (1) folgen grundsätzlich die Ableitungen aller Funktionen. Es lohnt sich aber die Ableitungen
einiger grundlegender Funktionen stets präsent zu haben, insbesondere:
f ′ (x) = 0
Konstante Funktion:
f (x) = c
⇒
Lineare Funktion:
f (x) = mx + b
Quadratische Funktion:
f (x) = ax2 + bx + c
⇒
Potenzfunktion:
f (x) = xn
Wurzelfunktion:
f (x) =
√
x = x2
⇒
1
f ′ (x) = √
2 x
Reziprozitätsfunktion:
f (x) =
1
= x−1
x
⇒
f ′ (x) = −
Exponentialfunktion zur Basis e:
f (x) = ex
f ′ (x) = ex
Allg. Exponentialfunktion:
f (x) = q x
⇒
⇒
f ′ (x) = q x · ln q
Logarithmus naturalis:
f (x) = ln |x| = loge |x|
⇒
f ′ (x) =
1
x
Allg. Logarithmusfunktion:
f (x) = logq |x|
⇒
f ′ (x) =
Sinusfunktion:
f (x) = sin x
⇒
1
x · ln q
f ′ (x) = cos x
Cosinusfunktion:
f (x) = cos x
⇒
f ′ (x) = − sin x
Tangensfunktion:
f (x) = tan x
⇒
f ′ (x) =
Arcussinusfunktion:
f (x) = arcsin x
⇒
Arcuscosinusfunktion:
f (x) = arccos x
⇒
Arcustangensfunktion:
f (x) = arctan x
⇒
Dabei sind a, b, c, m, n ∈ R und q ∈ R+ .
5
⇒
⇒
1
f ′ (x) = m
f ′ (x) = 2ax + b
f ′ (x) = n · xn−1
1
x2
1
cos2 x
1
f ′ (x) = √
1 − x2
1
f ′ (x) = − √
1 − x2
1
f ′ (x) =
1 + x2
1.6
Das infinitesimale Verständnis: Im unendlich Kleinen ist alles linear!
Denken wir nochmals an das Konzept der Ableitungsbildung zurück: Den horizontalen Schritt ∆x
liessen wir unendlich klein (aber 6= 0!) werden – so wurde aus ihm die infinitesimale Veränderung
dx. Parallel dazu ging die Differenz des Funktionswertes ∆f in die infinitesimale Veränderung df
über:
Übergang ins Infinitesimale:
∆x → dx und ∆f → df
Bei diesem Übergang ins unendlich Kleine passiert ganz Entscheidendes: Wenn wir unendlich nahe
an einen Punkt P auf dem Graphen einer Funktion heranzoomen, so erscheint uns der Graph dort
geradlinig. Wir können ihn gar nicht mehr von einer Gerade unterscheiden (vgl. Abb. 3).4
Das lässt uns umgekehrt sagen: Jeder Funktionsgraph setzt sich aus unendlich vielen, unendlich
kleinen, aber eben geradlinigen Abschnittchen zusammen. Auf infinitesimaler Grössenordnung sind
alle “einigermassen anständigen” mathematischen Funktion linear!5
Diese Linearität, also dass die infinitesimalen Veränderungen df und dx proportional zueinander
sind,6 bildet den Grundstein der modernen Analysis (Differentialrechnung, Integralrechnung, . . . ).
Ausgehend von dieser neuen Mathematik des unendlich Kleinen, die im 17. Jahrhundert von Sir Isaac
Newton (1642 – 1726) und von Gottfried Wilhelm Leibniz (1646 – 1716) unabhängig voneinander
entdeckt und entwickelt wurde, haben Mathematik und Naturwissenschaft in den letzten gut 350
Jahren unglaubliche Fortschritte erzielt, die vorher undenkbar gewesen wären.
Abbildung 3: Auf infinitesimaler Grössenordnung sind alle Funktionen linear, d.h., sie setzen sich aus
unendlich vielen geradlinigen Teilstücken zusammen.
4
Das ist vergleichbar mit Ihrer Situation an der Erdoberfläche. Wir wissen zwar alle, dass wir an der Oberfläche
einer riesigen Kugel herumspazieren, aber diese Oberfläche erscheint uns lokal absolut flach und wir machen mit dieser
Annahme in unserem Alltag auch keine Fehler. Je kleiner wir den betrachteten Erdoberflächenausschnitt machen, umso
geringfügiger resp. umso irrelevanter würde eine allfällige Abweichung zwischen gekrümmter und flacher Oberfläche.
Im Grenzwert eines unendlich kleinen Flächenstücks wird der Fehler unendlich klein und somit gibt es keinen messbaren
Unterschied mehr.
5
Es gibt durchaus eine Menge “unanständiger” Funktionen, bei denen dieses Hineinzoomen nicht zur Linearisierung
führt. Bei solchen Funktionen ist es in der Regel nur schon problematisch überhaupt eine Ableitung zu definieren, weil
der Grenzwert für ∆x → 0 gar nicht vernünftig ermittelt werden kann.
Glücklicherweise sind physikalische Funktionen in der Regel anständig. D.h., sie lassen sich problemlos (beliebig oft)
ableiten und sind im Infinitesimalen eben linear. Davon dürfen wir in unserem Kurs (fast) immer ausgehen.
6
Vgl. Beispiel auf Seite 4: df = 23 · dx ⇒ df und dx sind (an der Stelle x = 8) proportional zueinander.
6
2
Altes und Neues zur Integration
2.1
Der Hauptsatz der Differenzial- und Integralrechnung
Was Sie in diesem Abschnitt vorgelegt bekommen, dürften Sie im Mathematikunterricht mehrheitlich
bereits gesehen haben. Es kann aber nicht schaden, die Grundlagen der Integralrechnung nochmals
genau zu beleuchten.
Abbildung 4: Das Integral als Fläche unter einem Funktionsgraphen.
2.1.1
Das bestimmte Integral als Fläche unter einem Funktionsgraphen
Wir möchten die Fläche zwischen dem Graphen einer Funktion f (x) und der x-Achse berechnen.
Dabei legen die beiden Stellen x = a und x = b deren seitliche Grenzen fest (vgl. Abb. 4).
Wir gehen davon aus, dass f (x) zwischen a und b eine stetige Funktion ist. Es gibt also keine
Lücken oder Sprungstellen. Zweitens gelte (momentan) der Einfachheit halber für alle x ∈ [a; b], dass
f (x) ≥ 0 ist. Somit liegt die zu berechnende Fläche komplett oberhalb der x-Achse. Unter diesen
Voraussetzungen bezeichnen wir die gesuchte Fläche A als das bestimmte Integral der Funktion
f (x) mit Integrationsgrenzen a und b und schreiben dafür:
Z b
f (x) dx
A=
a
2.1.2
Der eigentliche Hauptsatz
In der Mathematik haben Sie gelernt, was für die Berechnung eines bestimmten Integrals genau zu
tun ist. Sie benutzen eine fundamentale Aussage der Analysis, nämlich den sogenannten
Hauptsatz der Differenzial- und Integralrechnung
Das bestimmte Integral der Funktion f (x) mit Integrationsgrenzen a und
b ist gegeben durch:
Z
a
b
f (x) dx = F (b) − F (a)
mit
f (x) = F ′ (x)
(3)
Dabei ist F (x) eine Stammfunktion von f (x). Das bedeutet, dass f (x)
die Ableitung von F (x) ist.
7
2.1.3
Der Beweis des Hauptsatzes
Wer den Hauptsatz zum ersten Mal liest und seine Aussage richtig begreift, wird vermutlich recht
überrascht sein: Das “Aufleiten”, also das Aufspüren einer Stammfunktion, erlaubt die Berechnung
der Fläche unter dem Funktionsgraphen! Woher kommt das? Was hat die Flächenberechnung mit
der Differenziation zu tun? Weshalb verlangt sie gerade nach dem umgekehrten Vorgang?
Um das besser zu verstehen und damit eben den Hauptsatz zu beweisen, packen wir die Sache
von der anderen Seite an. Wir nehmen an, dass wir bereits eine sogenannte Flächenfunktion F (x)
kennen. Für jedes x entspreche ihr Funktionswert F (x) der Fläche, welche oben und unten durch
den Graphen einer Funktion f (x) und die x-Achse, sowie links und rechts durch die y-Achse (x = 0)
und die Vertikale an der Stelle x beschränkt wird (vgl. Abb. 5).
Abbildung 5: Die Flächenfunktion F (x).
Klar ist, dass die Berechnung des bestimmten Integrals zwischen den Stellen x = a und x = b
kein Problem mehr darstellt, wenn wir diese Flächenfunktion F (x), denn:
Fläche von Stelle a bis b = (Fläche von 0 bis b) − (Fläche von 0 bis a) = F (b) − F (a)
Zum Beweis des Hauptsatzes müssen wir nun zeigen, dass dieses F (x) tatsächlich eine Stammfunktion der Funktion f (x) ist, dass also die Ableitung dF
dx die Funktion f (x) ergibt.
Allerdings kennen wir für F (x) keine explizite Funktionsgleichung. Wir wollen ja einen allgemeinen Zusammenhang beweisen. Also müssen wir die Ableitungsdefinition (1) auf Seite 2 Schritt für
Schritt befolgen. D.h., wir betrachten die Veränderung ∆F der Flächenfunktion bei einem endlichen
Variablenschritt ∆x, bilden aus diesen beiden Veränderungen den Differenzenquotienten ∆F
∆x und
lassen anschliessend den Schritt ∆x infinitesimal klein werden. Der Limes von ∆F
für
∆x
→ 0 ist
∆x
dF
′
schliesslich die gesuchte Ableitung F (x) = dx .
Schritt 1: Die endlich kleine Flächenvergrösserung ∆F : Wir untersuchen, wie sich der Wert
der Flächenfunktion F (x) verändert, wenn wir ihren rechten Rand von der Stelle x aus um den
endlichen Schritt ∆x nach rechts schieben. Dabei wird die Flächenfunktion um das ebenfalls
endliche Flächenstück ∆F vergrössert.
Abb. 6 zeigt die Situation. Der endliche Schritt ∆x soll bereits so klein sein, dass uns der
Funktionsgraph von f (x) als perfekte Gerade erscheint. Allerdings sind wir noch nicht im
unendlich Kleinen! Die infinitesimale Situation selber kann ich Ihnen nicht in einer Abbildung
zeigen, auch wenn ich das in Abb. 3 auf Seite 6 in gewisser Weise suggeriert habe. Eine
sichtbare Strecke lässt sich schliesslich automatisch immer noch weiter verkleinern. . .
8
Die Flächenveränderung ∆F ist die in Abb. 6 grau eingefärbte Trapezfläche, die sich aus
einem helleren Dreieck oben mit Fläche ∆F1 und einem dunkleren Rechteck mit Fläche ∆F2
zusammensetzt. Vergrössern wir also den Variablenwert von x nach x + ∆x, so finden wir für
die Veränderung ∆F der Flächenfunktion F (x) ohne Probleme:
∆F = ∆F1 + ∆F2 =
∆f · ∆x
+ f (x) · ∆x
2
∆F
:
∆x
Schritt 2: Bildung des Differenzenquotienten
(4)
Division durch ∆x liefert:
∆f
∆F
=
+ f (x)
∆x
2
Schritt 3: Übergang ins Infinitesimale: Die Ableitung von F (x) erhalten wir nun, indem wir den
Grenzwert des Differenzenquotienten für ∆x → 0 bilden:
dF
∆F
∆f
≡ lim
= lim
+ f (x) = f (x)
∆x→0 ∆x
∆x→0
dx
2
Der letzte Schritt braucht wohl noch eine kurze Erläuterung: f (x) bleibt bei der Limesbildung
∆x → 0 unverändert. Es ist einfach der Funktionswert der Funktion f an der Stelle x. Anders
sieht dies beim Term ∆f
2 aus. Bei der Ausführung von ∆x → 0 rückt der Punkt Q in Abb.
6 unendlich nahe an den Punkt P heran. Dabei wird ganz offensichtlich auch die Funktions7
wertdifferenz ∆f unendlich klein und der Term ∆f
2 verschwindet bei der Limesbildung.
Damit haben wir nun aber gezeigt, dass
dF
dx
= f (x) ist, und somit ist der Hauptsatz bewiesen.
Abbildung 6: Veränderung von F (x) beim endlich kleinen Variablenschritt ∆x.
7
Da wir im Infinitesimalen ja davon ausgehen dürfen, dass die Funktion f in P linear verläuft (Gerade mit Steigung
f (x)), könnten wir an dieser Stelle auch ∆f durch f ′ (x) · ∆x ersetzen. Damit wäre dann ganz direkt ersichtlich,
= 0 ist.
weshalb lim∆x→0 ∆f
2
′
9
2.1.4
Physikalische Saloppheit
In der Physik sind wir selbstverständlich froh um ein solides mathematisches Fundament. Manchmal
sind wir aber auch gerne ein bisschen speditiver unterwegs, wohlwissend, dass den Mathematikern
dabei zwischenzeitlich die Haare zu Berge stehen könnten. So hätten wir im Beweis des Hauptsatzes
aufgrund von Abb. 6 die Gleichung (4) direkt in differenzieller Form notieren können:
dF = dF1 + dF2 =
df dx
+ f (x) dx = f (x) dx
2
Im letzten Schritt nutzen wir die Tatsache, dass das Produkt zweier infinitesimaler Grössen – in
unserem Fall df · dx – stets unendlich mal viel kleiner ist als das Produkt aus einer endlichen und
einer infinitesimalen Grösse – hier: f (x) · dx. Aus diesem Grund dürfen wir den Term df2·dx ohne
Fehler weglassen und erhalten so viel schneller:
dF = f (x) dx
dF
= f (x)
dx
resp.
Diesen “saloppen” Umgang mit infinitesimalen Grössen erlauben wir uns in der Physik, weil wir
wissen resp. uns schon einmal davon überzeugt haben, dass es funktioniert. Die mathematisch fundiertere Vorgehensweise wäre allerdings stets die Betrachtung endlicher Grössen mit anschliessendem
Übergang ins Infinitesimale (Grenzwertbildung ∆x → 0).
2.1.5
Rechtecksflächen und Integralnotation
Das Wegfallen des Dreieckterms ∆f2·∆x bedeutet, dass wir im Infinitesimalen ausschliesslich über
Rechtecksflächen f (x) dx summieren.
Dieses Konzept wurde Ihnen vermutlich bereits in der Mathematik vorgestellt. Die geschwungene
Fläche unter dem Funktionsgraphen kann durch unendliche viele unendlich dünne Rechtecksflächen
beliebig genau angenähert werden. Das sehen Sie in Abb. 7 für n = 3, 6, 10, 20 Unterteilungen des
Intervalls [a; b]. Für n = 20 sieht man schon fast keinen Unterschied mehr zur exakten Fläche.
Bei n gleich grossen Unterteilungen des Intervalls [a; b] beträgt der einzelne Schritt auf der
x-Achse ∆xn = b−a
n . Das k-te Rechteck beginnt bei der Stelle xk , die gegeben ist durch:
xk = a + (k − 1)∆xn
mit
k = 1, . . . , n
k nennen wir einen Laufindex. Er durchläuft alle Werte von 1 bis n. So erhalten wir beispielsweise
für k = 4 die Stelle x4 = a + 3∆xn oder für k = 15 die Stelle x15 = a + 14∆xn .
Die k-te Rechtecksfläche Rk besitzt die Höhe f (xk ) und ihre Fläche beträgt:
Rk = f (xk ) ∆xn
Um die gesamte von den n Rechtecken abgedeckte Fläche R(n) zu notieren, empfiehlt sich die
Summenschreibweise:
R(n) = R1 + . . . + Rn =
n
X
k=1
Rk =
n
X
f (xk ) ∆xn
k=1
Das Summenzeichen Σ (gr. Grossbuchstabe Sigma) besagt, dass alle Terme aufaddiert werden
müssen. Unten am Summenzeichen deklariert man den Namen des Laufindexes inkl. Startwert, oben
dessen Endwert.
Wie liest man so eine Summe mit Summenzeichen vor?
n
X
k=1
f (xk ) ∆xn = “Summe mit k von 1 bis n über (alle Ausdrücke) f (xk ) ∆xn ”
= “Summe über (alle Ausdrücke) f (xk ) ∆xn mit k von 1 bis n”
10
Abbildung 7: Verfeinerung der Rechtecksflächenunterteilung zur Bestimmung der Fläche unter dem
Funktionsgraphen. Die Abdeckung wird im Limes n → ∞ unendlich genau.
Ein grösseres n entspricht einer verfeinerten Rechtecksunterteilung (vgl. Abb. 7). Lassen wir n
immer noch grösser werden, so kommt die Rechteckssumme R(n) der exakten Fläche A beliebig
nahe. Die exakte Fläche A ist also der Grenzwert von R(n) für n → ∞:
!
n
X
b−a
mit ∆xn =
f (xk ) ∆xn
A = lim R(n) = lim
n→∞
n→∞
n
k=1
Das sieht nun doch etwas kompliziert aus. Kein Wunder, dass bereits Gottfried Wilhelm Leibniz
(1646 – 1716), einer der beiden Väter der Differenzial- und der Integralrechnung,8 hierfür eine neue
Notation eingeführt hat, nämlich eben das Integralzeichen. Wir definieren:
!
Z b
n
X
f (x) dx ≡ lim
(5)
f (xk ) ∆xn
a
n→∞
k=1
Aus dem für n → ∞ immer kleiner werdenden ∆x
R n rechts ist links der infinitesimale Schritt dx
geworden. Die Summe Σ hat ein neues Zeichen
erhalten, das die voranstehende Limesbildung
limn→∞ mit enthält.9 In der Integralnotation ist immer noch ersichtlich, dass es sich im Prinzip um
eine Summe über Rechtecksflächen handelt: Der Ausdruck f (x) dx ist die Fläche des infinitesimalen
Rechtecks an der Stelle x.
8
9
Der andere Vater war ein
R gewisser Isaac Newton (1643 – 1727). . .
Das Integralzeichen ist ein stilisiertes, altdeutsches langes S, das für eine neue Art von Summe stehen soll.
11
2.1.6
Negative Integralwerte
Mit der Definition des bestimmten Integrals gemäss (5) lösen wir den Integralbegriff vom ursprünglichen Gedanken der Fläche unter einem Funktionsgraphen. Summiert wird über Ausdrücke der Form
f (xk ) ∆xn resp. f (x) dx unter dem Integral. Dabei handelt es sich einfach um Produkte zweier
Zahlen. Folglich müssen wir bei der Interpretation eines Integrals als Fläche etwas vorsichtig sein. . .
Beispiel 1: Wir möchten die Fläche zwischen dem Graphen der Sinusfunktion sin x und der xAchse während einer Periode, also von x = 0 bis x = 2π bestimmen (vgl. Abb. 8). Ohne gross
darüber nachzudenken verwenden wir den Hauptsatz (3) und schreiben:
Z 2π
2π
sin x dx = −[cos x] = −(cos 2π − cos 0) = −(1 − 1) = 0 ???
0
0
Dieses Resultat kann ganz offensichtlich nicht für die graue Fläche in Abb. 8 stehen!
Weshalb verschwindet denn dieses Integral? Ganz einfach, weil die Sinusfunktion sin x auf dem
Intervall [0; 2π] auch negative Werte annimmt. Für f (x) < 0 wird auch f (x) dx < 0. Das
bedeutet, Flächen unterhalb der x-Achse zählen bei der Berechnung des Integrals negativ.
Und weil bei unserer Sinusfunktion innerhalb einer Periode gleich viel Fläche oberhalb und
unterhalb der x-Achse liegt, erhalten wir das Resultat Null.
Wollen wir tatsächlich die graue Fläche in Abb. 8 berechnen, so müssen wir die Periode in die
Intervalle [0; π] und [π; 2π] unterteilen. Die beiden Teilflächen sind genau gleich gross, sodass
wir nur ein Integral zu berechnen brauchen und dessen Wert verdoppeln:
Z π
π
sin x dx = −2 [cos x] = −2 (cos π − cos 0) = −2 (−1) + (−1) = 4
A=2
0
0
Auf Seite 7 hatten wir “der Einfachheit halber” angenommen, dass f (x) ≥ 0 sein soll für alle
x ∈ [a; b]. Damit wollte ich dieser Komplikation mit negativ zählenden Flächenstücken zunächst mal
aus dem Weg gehen. Jetzt wissen wir besser Bescheid und diese Einschränkung ist nicht mehr nötig.
Auch über Abschnitte mit negativen Funktionswerten können wir integrieren, solange wir wissen,
was wir genau berechnen wollen – das Integral oder die Fläche.
Beispiel 2: Die Parabel zu f (x) = x2 − 4x ist nach oben geöffnet und schneidet die x-Achse bei
den Stellen x = 0 und x = 4. Für die Fläche zwischen Graph und x-Achse erhalten wir:
Z 4
4 64
32 32
1
3
2 2
x − 2x = − 32 − 0 = − =
A=
(x − 4x) dx = 3
3
3
3
0
0
Bei der Berechnung von Flächen unterhalb der x-Achse nehmen wir den Betrag des Integrals.
Abbildung 8: Flächenstücke in einer Periode der Sinusfunktion.
12
2.1.7
Unbestimmtes Integral, Integrationskonstante und Flächenfunktion
In der Mathematik haben Sie gelernt, dass man ein Integral auch ohne Angabe von Integrationsgrenzen notieren kann. Wir sprechen von einem unbestimmten Integral und fragen damit nach der
Stamm- oder Flächenfunktion F (x):
Z
f (x) dx = F (x) + C
Allerdings ist dieses F (x) nur bis auf eine beliebig wählbare Integrationskonstante C bestimmt.
Das kann nicht anders sein, denn durch Addition einer Konstante C verändert sich die Ableitung
einer Funktion F (x) ja nicht:
[F (x) + C]′ = F ′ (x) = f (x)
Zu einem f (x) gibt es somit unendlich viele Stammfunktionen F (x), die sich lediglich durch eine
andere Wahl der Integrationskonstante C voneinander unterscheiden. Für die Berechnung eines
bestimmten Integrals ist die Wahl dieses C’s belanglos, denn:
Z b
f (x) dx = F (b) + C − F (a) + C = F (b) − F (a)
a
Aber was für eine Bedeutung hat denn dieses C überhaupt? Die Antwort darauf liegt schon längst
auf dem Serviertablett bereit. Wir wollen sie nicht verpassen. . .
Beim Beweis des Hauptsatzes auf Seite 8 haben wir die Flächenfunktion F (x) eingeführt. F (a)
stand für die Fläche unter dem Funktionsgraphen von der Stelle x = 0 bis zur Stelle x = a. Diese
Wahl der Flächenfunktion war im Prinzip völlig willkürlich! Weshalb muss sie ausgerechnet bei der
Stelle x = 0 starten? Genauso gut könnte sie die Fläche von x = −2, x = 7 oder allgemein von
x = c aus berechnen. Dann ergäben sich für F (a) andere Werte, weil die Fläche von x = c bis
x = a einfach eine andere wäre. Genau diese Freiheit der Wahl eines beliebigen Startortes x = c für
die Flächenfunktion widerspiegelt sich in der Addition einer Integrationskonstanten C.
Abb. 9 verdeutlicht den Gedankengang nochmals anhand zweier verschiedener Flächenfunktionen
F1 (x) und F2 (x), deren Startorte bei x = c1 und x = c2 liegen. Die Integrationskonstante C, die
beim Wechsel von F1 (x) zu F2 (x) hinzuaddiert werden muss, entspricht der Fläche resp. dem Integral
zwischen den Stellen c2 und c1 :
F2 (x) = F1 (x) + C
Abbildung 9: Die Addition der Integrationskonstante C geht einher mit dem Wechsel des Startortes
der Flächenfunktion.
13
2.1.8
Das bestimmte Integral als Veränderung einer Grösse
Schauen wir nochmals zurück auf den Hauptsatz (3) und stellen ihn leicht um:
F (b) = F (a) +
Z
|
b
a
f (x) dx
{z }
F ′ (x) = f (x)
mit
(6)
=∆F
In dieser Form lässt sich dem Hauptsatz nochmals
R bein anderes und für die Physik sehr hilfreiches
Verständnis abgewinnen: Das bestimmte Integral a f (x) dx beschreibt, wie sich die Grösse F von
der Stelle a bis zur Stelle b verändert. F (b) ist gleich dem Ausgangswert F (a) bei der Stelle a und
die Veränderung ∆F entspricht dem bestimmten Integral.
Beispiel: Oftmals wissen wir in der Physik, dass eine Grösse die Ableitung einer anderen Grösse
ist. Z.B. werden wir uns im Kapitel 4 überlegen, dass die Momentangeschwindigkeit v(t) die
Ableitung der Ortsfunktion x(t) nach der Zeit t ist – v(t) beschreibt die aktuelle Veränderung
des Ortes x(t):
dx
v(t) = x′ (t) =
resp.
dx = v(t) dt
dt
Aus diesem Ableitungszusammenhang folgt aber immer auch der Integralzusammenhang (6)
und wir können schreiben:
Z
t1
x(t2 ) = x(t1 ) +
|
t2
v(t) dt
{z }
=∆x
Der Ort x(t2 ) zum Zeitpunkt t2 entspricht dem Ort x(t1 ) zum Zeitpunkt t1 plus die Ortsveränderung ∆x (= Strecke) während der Zeitspanne von t1 bis t2 . Diese Veränderung ist
durch das bestimmte Integral über die Geschwindigkeitsfunktion v(t) gegeben ist.
An diesem Beispiel sehen Sie, wie richtig es aus physikalischer Sicht ist, dass unsere Flächenfunktion – in diesem Fall x(t) – nur bis auf eine Integrationskonstante bestimmt ist. Dies
garantiert uns die freie Wahl des Bezugssystems. Wir dürfen selber entscheiden, wo wir den
Nullpunkt der Ortsachse platzieren resp. welche Koordinate x(t1 ) hat.
Betrachten wir die Angelegenheit nochmals allgemeiner. Mit dem Hauptsatz und mit dF = f (x) dx
können wir schreiben:
Z b
Z F (b)
Z F (b)
dF
kurz: ∆F =
dF
(7)
∆F = F (b) − F (a) =
f (x) dx =
F (a)
a
F (a)
Die endliche Veränderung ∆F der Grösse F (x) ist stets gleich dem Integral über die infinitesimalen
Veränderungen dF . Beachten Sie, dass wir in (7) die Integrationsgrenzen neu anschreiben mussten.
Sie müssen stets zur infinitesimalen Veränderung unter dem Integral passen. Zu dF gehören als
Integrationsgrenzen zwangsläufig zwei Werte der Flächenfunktion F (x).
Offenbar dürfen wir unter einem Integral einen infinitesimalen Schritt durch einen anderen ersetzen, wenn wir wissen, wie die beiden voneinander abhängen. Und diese Abhängigkeit ist durch den
Ableitungszusammenhang gegeben:
dF
= f (x)
dx
⇒
dF = f (x) dx
⇒
Z
F (b)
dF =
F (a)
Z
b
f (x) dx
a
Aber eben: Die Integrationsgrenzen wollen an den neuen infinitesimalen Schritt angepasst sein.
Im Abschnitt 2.4.3 werden wir aus dieser Änderung der Integrationsvariable eine Integrationstechnik mit Namen Substitution machen.
14
2.2
Allgemeine Integrationsregeln
Aus der Integraldefinition (5) können die folgenden allgemeinen Regeln hergeleitet werden:
Summenregel:
Z
b
f (x) ± g(x) dx =
a
Faktorregel:
Z
b
c · f (x) dx = c ·
a
Aufteilung des Integrals:
Z
c
f (x) dx =
a
Umkehrung der Integrationsgrenzen:
Z
b
a
Z
b
Z
b
Z
a
b
f (x) dx ±
g(x) dx
a
f (x) dx
a
f (x) dx = −
b
a
f (x) dx +
Z
Z
b
Z
c
f (x) dx
b
f (x) dx
a
In vielen Formelsammlungen und Mathematikbüchern finden sich unter diesen allgemeinen Integrationsregeln auch die Substitution und die partielle Integration. Wir werden diese Integrationstechniken
in den Abschnitten 2.4.2, 2.4.3 und 2.4.4 separat betrachten.
2.3
Auswahl unbestimmter Integrale
Mit der Kenntnis diverser Ableitungen (vgl. Abschnitt 1.5) lassen sich bereits einige Stammfunktionen
aufspüren. Es gibt aber doch die eine oder andere ab und zu auftretende Funktion, bei der wir froh
darum sind das unbestimmte Integral rasch nachschlagen zu können. Hier eine Auswahl:
Z
1
Potenzfunktion:
xn dx =
xn+1 + C
n+1
Z
1
Reziprozitätsfunktion:
dx = ln |x| + C
x
Z
Exponentialfunktion zur Basis e:
ex dx = ex + C
Z
Logarithmus naturalis:
ln |x| dx = x(ln |x| − 1) + C
Z
Sinusfunktion:
sin x dx = − cos x + C
Cosinusfunktion:
Tangensfunktion:
Quadratische Sinusfunktion:
Quadratische Cosinusfunktion:
Arcussinusfunktion:
Arcuscosinusfunktion:
Z
Z
cos x dx = sin x + C
tan x dx = − ln | cos x| + C
Z
1
sin2 x dx = (x − sin x cos x) + C
2
Z
1
cos2 x dx = (x + sin x cos x) + C
2
Z
p
arcsin x dx = x arcsin x + 1 − x2 + C
Z
p
arccos x dx = x arccos x − 1 − x2 + C
Natürlich gibt es weitaus umfangreichere Integralsammlungen. Ich habe mich auf die paar grundlegenden Integrale eingeschränkt, die wir am häufigsten benutzen werden.
15
2.4
Integrationstechniken
Die Berechnung bestimmter Integrale ist ein mathematisches Handwerk. In einfacheren Fällen möchte
man möglichst elegant, in schwierigeren Fällen überhaupt zum Ziel kommen. Leider gibt es kein
Standardrezept. Im schlimmsten Fall lassen wir uns von einem Rechner einen Näherungswert auf
soundso viele Stellen genau berechnen. Aber am liebsten haben wir es mathematisch exakt!
In diesem Abschnitt lernen Sie ein paar Tricks und Techniken zur exakten Berechnung von
bestimmten Integralen, denen wir im Rahmen der Quantenmechanik oft begegnen werden.
2.4.1
Symmetrien erkennen und ausnutzen
Gerade Funktionen / Achsensymmetrie: Der Graph einer sogenannt geraden Funktion zeigt
eine Achsensymmetrie bezüglich der y-Achse des Koordinatensystems (vgl. Abb. 10). Für
solche Funktionen gilt:
f (−x) = f (x)
Typische Beispiele sind cos x, c, x2 ,
1
x2
2
oder e−x .
Bei einer zum Ursprung symmetrischen Integration folgt für gerade Funktionen (vgl. Abb. 11):
Z a
Z a
f (x) dx = 2
f (x) dx
−a
0
Das ist sehr praktisch, weil das Einsetzen der Stelle x = 0 in die Stammfunktion typischerweise
besonders einfach ist.
Ungerade Funktionen / Punktsymmetrie: Der Graph einer ungeraden Funktion zeigt eine Punktsymmetrie des Funktionsgraphen bezüglich des Koordinatenursprungs (0, 0) (vgl. Abb. 10). Für
solche Funktionen gilt:
f (−x) = −f (x)
Typische Beispiele sind sin x, tan x, x, x3 oder
1
x.
Bei Integration von −a bis a folgt für ungerade Funktionen (vgl. Abb. 11):
Z a
f (x) dx = 0
−a
Die Punktsymmetrie macht diese Integration also ganz besonders leicht!
Aufgrund dieser allenfalls möglichen Vereinfachungen lohnt es sich immer vor dem Integrieren über
die Symmetrieeigenschaften einer Funktion nachzudenken!
Abbildung 10: cos x und sin x als Beispiele für gerade und ungerade Funktionen.
16
Abbildung 11: Symmetrische Integrale bei geraden und ungeraden Funktionen
Weitere Anmerkungen zu Symmetrieeigenschaften von Funktionen
• Der Kehrwert
Symmetrie.
1
f (x)
einer geraden oder ungeraden Funktion f (x) besitzt immer noch dieselbe
• Verknüpfungen von geraden (g) und/oder ungeraden (u) Funktionen durch Addition, Subtraktion, Multiplikation oder Division beeinflussen die Symmetrieeigenschaften wie folgt:
+/−
g
u
·/ :
g
u
g
→ g
•
g
→ g
→ u
u
•
→ u
u
→ u
→ g
• = “keine Symmetrie”
• Generell ist es sehr nützlich von möglichst vielen elementaren Funktionen ein ungefähres Bild
des Graphen im Kopf zu haben. Dazu gehören natürlich auch allfällige Symmetrieeigenschaften.
So verpasst man es nicht von obigen Vereinfachungen bei der Integration von geraden und
ungeraden Funktionen, wann immer möglich, zu profitieren.
4
Beispiel 1: Das Polynom f (x) = − x4 + x2 + 21 besitzt lauter Terme mit geraden Potenzen von
0
x ( 12 = x2 ). Somit handelt es sich um eine gerade Funktion, deren Graph links in Abb. 11
gezeigt wird. Für das Integral von −a = − 32 bis a = 23 ergibt sich:
5
3/2
Z 3/2 Z 3/2 3
4
1
1
x
x
x4
x
x
+ x2 +
+ x2 +
+
−
dx = 2 ·
dx = 2 · − +
−
4
2
4
2
20
3
2 −3/2
0
0
243 9 3
−243 + 720 + 480
957
=2· −
+ + −0 =
=
640 8 4
320
320
Beispiel 2: Das folgende Integral soll berechnet werden:
Z a
1
x sin2 x dx
2
−a
Wir bemerken zuerst die Symmetrie der Integrationsgrenzen bezüglich des Ursprungs. Unter
dem Integral steht ein Produkt zweier Funktionen. Die Funktion f (x) = x ist ungerade,
während g(x) = sin2 x wegen dem Quadrat eine gerade Funktion ist.10 Der Faktor 12 spielt
für die Symmetrie keine Rolle. Die ganze Funktion 21 f (x) g(x) = 21 x sin2 x ist also ungerade
(vgl. Abb. 11 rechts). Somit muss dieses Integral gleich Null sein!
Die Sinusfunktion ist ungerade. Durch das Quadrat in sin2 x werden also zwei ungerade Funktionen miteinander
multipliziert, was eine gerade Funktion ergibt.
10
17
2.4.2
Erkennen äusserer und innerer Ableitungen
Wer effizient integrieren will, sollte in Sachen Kettenregel (bei der Ableitung) geübt sein und somit
über ein geschultes Auge punkto innere Ableitungen verfügen. Dieses geschulte Auge holt man sich
nur durch eine gute Kenntnis der Ableitungen verschiedenster elementarer Funktionen und vor allem
durch viel Erfahrung und Übung.
Erinnern wir uns: Bei der Differenziation erklärt uns die Kettenregel, wie eine verschachtelte
Funktion abgeleitet werden muss:
′
u v(x) = u′ v(x) · v ′ (x)
Erkennen wir nun eine Funktion unter einem Integral als Produkt f (x) = u′ v(x) · v ′ (x) der
Ableitungen einer äusseren
und einer inneren Funktion, so ist die Stammfunktion eben gegeben
durch F (x) = u v(x) + C und wir erhalten für das bestimmte Integral:
Z
b
b
u′ v(x) · v ′ (x) dx = u v(x) (8)
a
a
Wie zielführend diese Methode ist, möchte ich an drei erläuterten Beispielen zeigen:
√
√
e
1 x2 2 1 2
x · e dx = e = e − e = (e − 1)
2
2
2
1
1
Z π/2
1
1
π/2 1
sin x · cos x dx = sin2 x = −0=
2
2
2
0
0
Z 1
1
2x
2
dx
=
ln(x
+
1)
= ln 2 − ln 1 = ln 2
2
0
0 x +1
Z
Beispiel 1:
Beispiel 2:
Beispiel 3:
2
x2
Beispiel 1: Äussere Funktion u(v) =
mit Ableitung v ′ (x) = 2x.11
1
2
ev mit Ableitung u′ (v) =
1
2
ev ; innere Funktion v(x) = x2
Im Nachhinein kann man die Richtigkeit stets leicht überprüfen, denn Ableiten ist typischerweise einfacher als Integrieren:
1 x2 ′ 1 x2
2
= e · 2x = x · ex
e
2
2
Beispiel 2: Äussere Funktion u(v) = 21 v 2 mit Ableitung u′ (v) = 12 ·2v = v = sin x; innere Funktion
v(x) = sin x mit Ableitung v ′ (x) = cos x.
Wir hätten auch cos x als innere Funktion mit Ableitung sin x auffassen können. Dann hätte
die äussere Funktion u(v) = − 12 v 2 gelautet und wir hätten gleichermassen erhalten:
Z
π/2
0
π/2
1
1
1
2 =0− −
=
sin x · cos x dx = − cos x 2
2
2
0
An diesem Beispiel sieht man sehr schön, dass sich unterschiedliche Stammfunktionen ergeben
können. Ganz offensichtlich ist 21 sin2 x 6= − 12 cos2 x. Die beiden Funktionsgraphen verlaufen
parallel übereinander und unterscheiden sich lediglich um eine Integrationskonstante C = 12 .
Für das bestimmte Integral spielt dieser Unterschied keine Rolle.
Beispiel 3: Äussere Funktion u(v) = ln v mit Ableitung u′ (v) = v1 ; innere Funktion v(x) = x2 + 1
mit Ableitung v ′ (x) = 2x. Zum Schluss habe ich verwendet, dass loga 1 = 0 ist.
11
c
c
Es sei daran erinnert, dass ab ≡ a(b
)
(6= (ab )c ).
18
2.4.3
Lineare Substitution
Oftmals taucht die Integrationsvariable x innerhalb der Funktion f (x), über die integriert wird,
in einem linearen Ausdruck mx + q auf. In diesem Fall ist es hilfreich mx + q durch eine neue
Integrationsvariable s = mx + q zu substitutieren (= ersetzen). In der Funktion sollen gar keine x
mehr vorkommen. D.h., wir ersetzen wirklich alle x und schreiben für die Funktion nur noch f (s).
Aus dem infinitesimalen Schritt dx wird ds. Dabei müssen wir berücksichtigen, dass:
ds
ds
= s′ = m
⇒
dx =
dx
m
Auch die Integrationsgrenzen müssen in s-Werte umgerechnet werden. Insgesamt folgt:
Z mb+q
Z b
1
f (s) ds
·
f (x) dx =
m ma+q
a
s = mx + q
⇒
(9)
Im Moment erkennen Sie vielleicht noch nicht so richtig, wie die Sache läuft resp. was sie bringt.
Die folgenden paar Beispiele sollen Licht ins Dunkel bringen.
Beispiel 1: Verschiebungs-Trick (m = 1)
Wir betrachten das folgende Integral:
Z
5
2
√
1
dx
x−1
Das sieht ein bisschen unschön aus. Von √1x kennen wir dank der Integrationsregel für Potenzfunktionen die Stammfunktion (vgl. Abschnitt 2.3). Aber wie sieht es mit der −1 unter der
Wurzel aus? Was verändert diese Subtraktion?
Vielleicht haben Sie in der Mathematik schon erkannt, dass die Ersetzung aller x in einer
Funktionsgleichung durch den Ausdruck x − 1 den Graphen der Funktion um 1 nach rechts
verschiebt. Machen wir das Umgekehrte, ersetzen wir also x − 1 durch x, so bedeutet dies eine
Verschiebung um 1 nach links.
Das nützen wir hier aus und setzen eine neue Integrationsvariable s = x − 1 an. Damit
verschieben wir im Prinzip den Funktionsgraphen um 1 nach links (vgl. Abb. 12). Es leuchtet
ein, dass dann auch die Integrationsgrenzen um 1 nach links verschoben werden müssen, damit
wir immer noch dasselbe Integral berechnen.
Zunächst betrachten wir aber den neuen infinitesimalen Schritt:
ds
m=
= s′ = [x − 1]′ = 1
dx
Solange also die Steigung m in unserer linearen Substitution s = mx+ q gleich 1 ist, verändert
sich am infinitesimalen Schritt gar nichts, ds = dx. Es folgt:
Z 4
Z 5−1
Z 5
1
1
1
√
√ ds =
√ ds
dx =
s
s
x−1
1
2−1
2
Das sieht schon freundlicher aus! Aus der Integrationsregel für Potenzfunktionen erhalten wir:
Z 4
Z 4
√
√ √ 4
1
1 4
1
√ ds =
s− 2 ds = 2s 2 = 2 s = 2 4 − 1 = 2
s
1
1
1
1
Bemerkung: Das anfängliche Integral hätten wir auch berechnen können, wenn wir uns klar
1
als Ableitung der inneren Funktion v(x) = x−1
gemacht hätten, dass die 1 im Zähler von √x−1
√
1
′
√
und u (v) = v als Ableitung der äusseren Funktion u(v) = 2 v angesehen werden können:
Z 5
5
√
√ √
1
√
dx = 2 x − 1 = 2 4 − 1 = 2
2
x−1
2
Beim Integrieren gibt es ab und zu also durchaus mehrere Wege, die zum Ziel führen.
19
Abbildung 12: Die Substitution s = x − 1 verschiebt den Graphen von f (x) um 1 nach links. Die
Integrationsgrenzen werden mitverschoben, sodass die Integrationsfläche gleich gross bleibt.
Beispiel 2: Reskalierungs-Trick (q = 0)
Oftmals taucht x innerhalb einer Funktion zusammen mit einem Vorfaktor auf, so z.B. in:
Z π/3
cos(3x) dx
π/6
Gerne würden wir nur über cos x integrieren. Daher lautet unsere Substitution s = 3x.
Ein Funktionsgraph wird bei der Ersetzung aller x durch 3x um den Faktor 3 horizontal
gestaucht. Hier machen wir genau das Umgekehrte. Wir ersetzen 3x durch die Variable s,
was eine horizontale Dehnung um den Faktor 3 bewirkt (vgl. Abb. 13). Dem entsprechend
müssen die Integrationsgrenzen verschoben werden, um das Integral immer noch “an denselben
Stellen” im Verlauf des Graphen zu begrenzen. Durch die Dehnung wird die Fläche effektiv
vergrössert. Dies wird durch die Veränderung des infinitesimalen Schrittes ausgeglichen:
ds
= s′ = [3x]′ = 3
dx
⇒
dx =
ds
ds
=
′
s
3
Insgesamt folgt für unser Integral:
Z 3·π/3
Z π/3
Z π
π
ds
1
1
1
1
cos s
cos(3x) dx =
= · (0 − 1) = −
cos s ds = · sin s = ·
3
3 π/2
3
3
3
π/2
3·π/6
π/6
Abbildung 13: Die Substitution s = 3x dehnt den Graphen von f (x) horizontal um den Faktor
3. Die Integrationsgrenzen werden mitgestreckt. Dadurch wird offensichtlich die Fläche vergrössert,
was beim Integral mit einer Division durch den Streckungsfaktor 3 ausgeglichen werden muss.
20
Beispiel 3: Lineare Substitution komplett (m 6= 1, q 6= 0)
Verschiebungs- und Reskalierungs-Trick sind nur Spezialfälle der am Anfang des Abschnittes
beschriebenen allgemeinen linearen Substitution s = mx + q. Beim Verschiebungs-Trick ist
m = 1, beim Reskalierungs-Trick ist q = 0. Im allgemeinen Fall (m 6= 1 und q 6= 0) Wird der
Funktionsgraph sowohl horizontal verschoben, wie auch gestreckt oder gestaucht. Beispiel:
f (x) =
1
3
1
x−4
mit s =
1
x−4
3
⇒
f (s) =
1
s
und
m=
ds
1
=
dx
3
Damit finden wir beim folgenden Integral:
Z 21
Z 1 ·21−4
Z 3
3
3
1
1
1
1
dx
=
·
ds
=
3
·
ds
=
3
·
ln
|s|
= 3 ln 3
1
1
1
s
s
1
·15−4
15 3 x − 4
1
3
3
Bemerken Sie, dass in dieser allgemeinen linearen Substitution die horizontale Verschiebung
nicht einfach der Zahl q entspricht. Vielmehr muss man den Streckungs- resp. Stauchungsfaktor
q
. Im Beispiel:
m ausklammern, um die effektive Verschiebung zu sehen. Sie ist gegeben durch m
s=
1
1
x − 4 = (x − 12)
3
3
⇒
Verschiebung um 12 nach links
Abbildung 14: Die Substitution s = 13 x − 4 = 13 (x − 12) verschiebt den Graphen horizontal um 12
nach links. Danach wird er mit dem Faktor 3 zur y-Achse hin gestaucht. Die Integrationsgrenzen
müssen entsprechend mitverschoben werden. Durch die Stauchung wird die Fläche verkleinert, was
beim Integral durch eine Multiplikation mit dem Stauchungsfaktor 3 ausgeglichen werden muss.
Zum Schluss dieses Abschnittes sei angefügt, dass die lineare Substitution einem Erkennen von
äusserer und innerer Ableitung entspricht. Anstatt lange zu theoretisieren zeige ich Ihnen an einem
Beispiel, wie das gemeint ist.
Beispiel 4: Das folgende Integral berechnen wir mit der linearen Substitution s = 2x − π3 :
Z π/6
Z π/4
π/6 1 1
1
1
1
π
dx = ·
= ·
cos s ds = · sin s −0 =
cos 2x −
3
2 0
2
2
2
4
0
π/6
Andererseits erkennen wir aber auch, dass der Cosinus die Ableitung einer äusseren Funktion
mit innerer Funktion 2x − π3 ist. Die konstante Ableitung der linearen inneren Funktion, also
der Faktor 2, ist nicht sichtbar. D.h., es braucht einen zusätzlichen Faktor 12 , der diese innere
Ableitung wegschafft. Die Stammfunktion lautet somit 12 sin(2x − π3 ) und wir erhalten:
Z π/4 2π π 1
1
π π/4 1
π
2π π =
dx = sin 2x −
−
sin
=
−
−
cos 2x −
sin
3
2
3 π/6 2
4
3
6
3
4
π/6
Je mehr Übung Sie haben, desto selbstverständlicher werden diese Rechnungen.
21
2.4.4
Partielle Integration
Diese ebenfalls sehr nützliche Integrationstechnik bedient sich der Produktregel beim Ableiten. Wir
erinnern uns:
[u(x) v(x)]′ = u′ (x) v(x) + u(x) v ′ (x)
Integrieren wir über beide Seiten, so ergibt sich:
Z
b
′
[u(x) v(x)] dx =
a
Z
b
′
u (x) v(x) dx +
a
Z
b
u(x) v ′ (x) dx
a
Nun steht auf der linken Seite aber das Integral über der Ableitung von u(x) v(x). Eine Stammfunktion dazu ist u(x) v(x) selber, woraus folgt:
Z b
b Z b
′
u(x) v ′ (x) dx
u (x) v(x) dx +
[u(x) v(x)] =
a
a
a
Durch Umstellen finden wir:
Z b
b Z b
′
u(x) v ′ (x) dx
u (x) v(x) dx = [u(x) v(x)] −
a
a
(10)
a
Diese Beziehung bezeichnet man als partielle Integration, weil von der Funktion f (x) = u′ (x) v(x)
quassi nur der “Part” resp. Anteil u′ (x) integriert, also aufgeleitet wird. Damit ist die Integration
von f (x) = u′ (x) v(x) noch nicht abgeschlossen, vielmehr hat man das Problem auf die Berechnung
des Integrals über g(x) = u(x) v ′ (x) verlagert. Dieses ist aber unter Umständen wesentlich leichter
zu berechnen, sodass sich die partielle Integration ausbezahlt.
Die nachfolgenden Beispiele demonstrieren den Nutzen der partiellen Integration.
Beispiel: Das folgende Integral ist ein Kandidat für eine partielle Integration, weil wir in ihm ein
Produkt zweier Funktionen entdecken:
Z π/2
x cos x dx
0
Mit unseren bisherigen Methoden kommen wir hier nicht weiter. Der Faktor x vor der Cosinusfunktion erschwert die Sache. Nur cos x – oder sin x – wäre ja völlig unproblematisch. Aber
genau dies können wir durch die partielle Integration erreichen mit der das Integral in gewisser
Weise ausgetauscht werden kann. Wir identifizieren u′ (x) = cos x und v(x) = x. Dann sind
u(x) = sin x und v ′ (x) = 1, sodass u(x)v ′ (x) = sin x. Somit erhalten wir:
Z
π/2 Z
x cos x dx = x sin x −
π/2
0
0
π/2
sin x dx =
0
π/2 π
π
π
= + (0 − 1) = − 1
− 0 + (cos x)
2
2
2
0
In die “andere Richtung” mit u′ (x) = x und v(x) = cos x bringt die partielle Integration keine
Verbesserung:
Z
0
π/2
π/2 Z π/2 1
1 2
−
x cos x dx = x cos x x2 sin x dx = ??
0
2
2
0
22
2.5
Uneigentliche Integrale
Manchmal kommt es vor, dass die Funktion f (x), über die integriert wird, bei einer Integrationsgrenze
κ gar nicht definiert ist, sei es, weil es sich bei κ um eine Definitionslücke von f (x) oder weil die
Integrationsgrenze gleich ±∞ ist und somit selber für keine reelle Zahl steht. In einem solchen Fall
sprechen wir von einem uneigentlichen Integral und wir müssen kurz deklarieren, was darunter zu
verstehen ist:
Definition uneigentlicher Integrale
Ein Integral bis zu einer Stelle κ heisst uneigentlich, wenn κ eine Definitionslücke von f (x) oder gleich ±∞ ist. Den Wert des uneigentlichen
Integrals definieren wir als Grenzwert eines problemlos berechenbaren Integrals:
Z b
Z κ
f (x) dx
(11)
f (x) dx ≡ lim
a
b→κ
a
Der Parameter b soll zwischen a und κ liegen. Natürlich kann das Integral
auch aufgrund der unteren oder sogar aufgrund beider Integrationsgrenzen
uneigentlich sein. Das Verfahren bleibt dasselbe. In letzterem Fall braucht
es dann zwei Limesbildungen.
Bei uneigentlichen Integralen kann es vorkommen, dass der Grenzwert gar
nicht gebildet und somit für das Integral kein Wert berechnet werden kann.
Ein paar Beispiele zeigen, dass die Sache relativ einfach ist. Mit etwas Übung wird es nur selten
notwendig sein aus Verständnisgründen die Grenzwertbildung ganz ausführlich zu betrachten.
Beispiel 1: Die Funktion f (x) = √1x besitzt bei x = 0 eine Polstelle. Somit ist das folgende Integral
uneigentlich, aber es lässt sich trotzdem berechnen:
Z 4
Z 4
√
√ 4
√ 1
1
√ dx ≡ lim
√ dx = lim 2 x = 2 lim
4 − a = 2(2 − 0) = 4
a→0
a→0
a→0
x
x
a
0
a
Dies war die ausführliche Notation. Wir scheuen uns meistens aber nicht vor einer etwas
salopperen Schreibweise ohne Limesbildung:
Z 4
√
√ √ 4
1
√ dx = 2 x = 2 4 − 0 = 4
x
0
0
Wichtig ist einfach, dass wir um die exaktere Schreibweise mit der Limesbildung wissen und
diese in kritischen Fällen hervornehmen können.
Links in Abb. 15 sehen wir die graphische Bedeutung unseres Resultates: Die Fläche unter
dem Funktionsgraphen zwischen x = 0 und x = 4 ist offenbar endlich gross, auch wenn die
Funktionswerte für x → 0 unendlich gross werden.
Beispiel 2: Betrachten wir nun ein Integral, dessen rechte Integrationsgrenze im Unendlichen liegt:
Z b
Z +∞
b −x
−x
−x e dx ≡ lim
e dx = lim −e = − lim e−b − e0 = −(0 − 1) = 1
0
b→∞
b→∞
0
0
b→∞
Auch hier sind wir gerne etwas schludriger, aber eben speditiver unterwegs:
Z +∞
+∞
= −(0 − 1) = 1
e−x dx = −e−x 0
0
23
Abbildung 15: Beispiele uneigentlicher Integrale: An den Integrationsgrenzen undefinierte Funktionen
können trotzdem endliche Flächen eingrenzen.
Beispiel 3: Nach den ersten beiden Beispielen könnte man den Eindruck erhalten, dass sich jedes
uneigentliche Integral berechnen lässt. Hier sehen Sie, dass dem überhaupt nicht so sein muss:
Z b
Z +∞
b 1
1
dx ≡ lim
dx = lim ln |x| = lim (ln b − ln 1) = undefiniert
b→∞
b→∞
b→∞
x
x
0
1
1
Der Logarithmus naturalis ist eine monoton wachsende Funktion, sodass limb→∞ ln b = ∞
und der Grenzwert somit undefiniert ist. Damit existiert dieses uneigentliche Integral nicht.
2.6
Spezielle bestimmte Integrale
In der Quantenmechanik werden wir ein paar bestimmte Integrale verwenden, deren Herleitung in
ein paar Fällen den Rahmen der uns zur Verfügung stehenden Mathematik sprengen würde:
Z ∞
xn e−x/a dx = n! an+1
mit a > 0, n ∈ N
Exponenzialintegral:
0
Gauss’sche Integrale:
Z
∞
e−x
2 /a2
dx =
0
Z
∞
x2n e−x
2 /a2
dx =
0
Z
Trigo-Integrale:
∞
√ a
π
2
√ (2n)! a 2n+1
π
n!
2
n! 2n+2
a
2
0
(
Z 2π
0 für m 6= n
sin(mx) sin(nx) dx =
π
für m = n
0
(
Z 2π
0 für m 6= n
cos(mx) cos(nx) dx =
π für m = n
0
Z 2π
sin(mx) cos(nx) dx = 0
x2n+1 e−x
2 /a2
dx =
mit
a>0
mit
a > 0, n ∈ N
mit
a > 0, n ∈ N
mit
m, n ∈ Z
mit
m, n ∈ Z
mit
m, n ∈ Z
mit
a>0
0
Z
∞
π
sin(ax)
dx =
x
2
0
r
Z ∞
Z ∞
π
2
2
cos(x ) dx =
sin(x ) dx =
8
0
0
24
3
Differenzialgleichungen – ein fundamental neuer Gleichungstyp
In Ihrer bisherigen “mathematischen Karriere” haben Sie eine Vielzahl von Gleichungen angetroffen.
Je nach Gleichungstyp gab es unterschiedlich viele Lösungen und vor allem auch immer wieder andere
Lösungsverfahren. Ein paar Beispiele:
• Lineare Gleichung (LG) in 1 Unbekannten: ax + b = 0 mit a 6= 0
⇒ genau 1 Lösung x, Verfahren: Separation.
• LG in 2 Unbekannten (Geradengleichung): ax + by + c = 0 mit entweder a oder b 6= 0
⇒ ∞-viele Lösungspunkte (x, y), bilden eine Gerade in einem x-y-Koordinatensystem.
• LG in 3 Unbekannten (Ebenengleichung): ax + by + cz + d = 0 mit a, b oder c 6= 0
⇒ ∞-viele Lösungspunkte (x, y, z), bilden eine Ebene in einem x-y-z-Koordinatensystem.
• Quadratische Gleichung (QG) in 1 Unbekannten: ax2 + bx + c = 0 mit a 6= 0
⇒ 0, 1 oder 2 Lösungen x, sind die Nullstellen einer Parabel, Verfahren allg.: Quadratische
Ergänzung resp. Mitternachtsformel, spez.: Binomische Formel resp. Zweiklammeransatz.
• Exponentialgleichung in 1 Unbekannten: ax = b mit a, b > 0
⇒ genau 1 Lösung x, Verfahren: Logarithmieren.
So unterschiedlich diese Gleichungstypen auch sind, eines haben sie alle gemeinsam: Ihre Lösungen
sind Punkte in einem ein- oder mehrdimensionalen Koordinatensystem.12
Nun wenden wir uns allerdings einem ganz neuen Gleichungstyp zu, dessen Lösungen einer
fundamental anderen Objektklasse angehören. Bei sogenannten Differenzialgleichungen (DGLs)
sind die Lösungen nämlich ganze Funktionen f (x), also Zuordnungsvorschriften von einer Variable
x zu einer davon abhängigen Grösse f (x). Gesucht sind alle Funktionsvorschriften f (x), welche die
durch die DGL beschriebenen Anforderungen erfüllen, also eben die DGL lösen.
Das tönt im Moment wohl etwas abstrakt und bedarf daher sicher einiger Erläuterung. . .
3.1
Was ist eine Differenzialgleichung (DGL)?
Die folgenden Ausführungen sind sinngemäss dem Buch Rechenmethoden für Studierende der Physik
im ersten Jahr [2] von Markus Otto entnommen:13
Allgemeine Definition: Eine gewöhnliche Differenzialgleichung (DGL) ist eine Gleichung, in
welcher Terme mit der/den Ableitung/en einer gesuchten Funktion y(x) auftreten. In der
Gleichung können zudem die Funktion y(x), wie auch die Variable x vorkommen.
Eine DGL zu lösen bedeutet, alle möglichen Funktionen y(x) zu finden, welche die DGL für
alle erlaubten Werte der Variable x erfüllen.
Ordnung der DGL: Definition: y (n) (x) ≡ n-te Ableitung von y(x). Ist y (n) (x) die höchste in der
DGL vorkommende Ableitung, so sprechen wir von einer DGL n-ter Ordnung.
Lineare und homogene DGLs: Eine DGL heisst linear, wenn die unbekannte Funktion y(x) und
ihre Ableitungen darin linear auftreten. D.h., die DGL enthält lauter einzelne Terme mit Potenz
1 von y(x), y ′ (x), y ′′ (x), etc. Die allgemeinste lineare DGL n-ter Ordnung lautet daher:
a0 (x)y(x) + a1 (x)y ′ (x) + a2 (x)y ′′ (x) + . . . + an (x)y (n) (x) = r(x)
Darin sind a0 (x), a1 (x), . . . , an (x) beliebige Funktionen der Variable x.
Ist die Störfunktion r(x) = 0, so spricht man von einer homogenen (linearen) DGL.
12
Eine einzelne Lösung x sitzt ja auch an irgendeinem Punkt auf einem Zahlenstrahl (= x-Achse), also in einem
eindimensionalen Koordinatensystem.
13
Otto 2011, S. 201ff [2].
25
Lösungen: Eine lineare, homogene DGL n-ter Ordnung besitzt n Einzellösungen y1 (x), . . . , yn (x).
Die allgemeine Lösung ergibt sich dann als Linearkombination der Einzellösungen:
y(x) = C1 y1 (x) + C2 y2 (x) + . . . + Cn yn (x)
Dabei sind die Koeffizienten C1 , . . . , Cn zunächst frei wählbare Zahlenwerte. D.h., es gibt nicht
eine einzige, eindeutige Lösung der DGL, sondern eine unendlich grosse Lösungsschar, deren
einzelnes Element durch eine bestimmte Koeffizientenkombination (C1 , . . . , Cn ) gegeben ist.
Rand- resp. Anfangsbedingungen (RBs): Da die Lösung einer DGL, wie eben erläutert, nicht
eindeutig ist, braucht es zusätzliche Bedingungen (Gleichungen), um die Funktion y(x) komplett festzulegen. Diese sogenannten Anfangs- oder Randbedingungen (RBs) sind in der
Regel Teil des Problems, für das die DGL die Lösung liefern soll.
Sind bei einer DGL n-ter Ordnung zusätzlich n RBs vorgegeben, so werden dadurch die Koeffizienten C1 , . . . , Cn in eindeutiger Weise festgelegt.
Ermittlung der Lösungen einer DGL: Trotz einiger raffinierter Verfahren für verschiedene Arten
von DGLs gibt es leider kein Patentrezept für die Lösung einer DGL. Oftmals ist Raten ein
guter erster Schritt. Aber am meisten hilft viel Erfahrung und vor allem ein solides, also ohne
Nachschlagen präsentes (!) Grundwissen über Ableitungsregeln und die konkreten Ableitungen
verschiedener Funktionen (vgl. Seite 5).
Allerdings ist es so, dass nur zu verhältnismässig wenigen DGLs überhaupt eine analytische
Lösung, also eine als geschlossener mathematischer Ausdruck notierbare Funktion, existiert.
Damit meint man nicht, dass in allen anderen Fällen gar keine Lösung existiert, aber die DGL
ist dann halt nur sogenannt numerisch lösbar. Das bedeutet, man kann sich der Lösungsfunktion durch Verwendung bestimmter Rechenmethoden im Prinzip beliebig genau annähern,
aber die Lösung selber, also die Grenzfunktion dieser Annäherung, kann einfach nicht so geschlossen aufgeschrieben werden, wie Sie sich das für Funktionen bisher gewohnt waren.14
Die Ausführung solcher Annäherungsrechnungen überlassen wir heutzutage dem Computer.
Auch hierzu werden Sie später, allerdings ohne ausführliche Rechnungen, ein paar Beispiele
vorfinden.
Hinweis: In diesem Ergänzungsfach wird es nur am Rande darum gehen DGLs zu lösen. Mit diesem Thema alleine könnte man problemlos ein ganzes Ergänzungsfachjahr füllen . . . Hingegen
sollten Sie einerseits in der Lage sein die Richtigkeit einer vorgegebenen Lösung zu überprüfen,
andererseits aus den RBs allfällige Parameter zu ermitteln. Beides ist wesentlich einfacher als
das Aufspüren von Lösungen, denn dazu brauchen Sie “lediglich” die angegebene Lösung in
die DGL einzusetzen, wofür Sie im Wesentlichen das Ableiten beherrschen müssen. . .
√
Das ist vergleichbar damit, dass Sie z.B. die Zahl 2 als Dezimalzahl auch nicht ganz genau aufschreiben können,
obwohl Sie genau wissen, dass diese Zahl existiert und die positive Lösung der Gleichung x2 = 2 ist.
14
26
3.2
3.2.1
Erste Beispiele von DGLs (ohne physikalischen Kontext)
Stammfunktionen bestimmen
Im Prinzip haben Sie bei der Integralrechnung bereits selber einfache DGLs gelöst, nämlich immer
dann, wenn Sie eine Stammfunktion y(x) zu einer vorgegebenen Funktion f (x) bestimmt haben.
Die zugehörige DGL lautete:
y ′ (x) = f (x)
Das ist eine lineare DGL 1. Ordnung. Allerdings ist sie nicht homogen, denn die Funktion f (x) stört
die Homogenität. Das hält uns aber nicht auf! Dank unserer Erfahrung wissen wir, dass wir y(x)
erhalten, indem wir das unbestimmte Integral von f (x) ermitteln:
Z
y(x) = f (x) dx + C
Wie es sich für eine DGL 1. Ordnung gehört, taucht ein einzelner, unbestimmter Parameter C
auf – Ihnen bekannt unter dem Namen Integrationskonstante. Die DGL liefert somit eine ganze
Lösungsschar von Funktionen y(x).
Beispiel: Gesucht sei die Lösung folgender DGL (inkl. RB):
y ′ (x) =
4
1 2 4
x − x+
4
3
3
mit RB: y(2) = 1
Für die Stammfunktion (unbestimmtes Integral) erhalten wir:
Z 4
1 3 2 2 4
1 2 4
x − x+
x − x + x+C
dx + C =
y(x) =
4
3
3
12
3
3
Aus der RB lässt sich schliesslich der Wert des Parameters C bestimmen:
y(2) =
2
2 8 8
!
− + +C = +C =1
3 3 3
3
⇒
C=
1
3
Somit erhalten wir für unsere gesuchte Funktion y(x):
y(x) =
1 3 2 2 4
1
x − x + x+
12
3
3
3
Abb. 16 zeigt die Funktion für verschiedene Werte von C. Es handelt sich immer um dieselbe
Kurve, allerdings auf verschiedenen Höhen. Das muss ja so sein, denn die DGL y ′ (x) = f (x)
schreibt lediglich vor, welche Steigung zu welcher Stelle x gehört. Die RB y(2) = 1 fixiert den
Graphen auf einer bestimmten Höhe. Der Punkt (2, 1) soll auf dem Funktionsgraphen liegen.
Daraus folgt der Wert von C, denn die Addition einer Konstante macht nichts anderes als den
Graphen einer Funktion vertikal zu verschieben.
3.2.2
Exponentialfunktion
Betrachten wir jetzt die folgende homogene, lineare DGL 1. Ordnung. Darin sei k eine beliebige Zahl
ausser 0:
y ′ (x) = ky(x) resp. y ′ (x) − ky(x) = 0
mit RB: y(0) = a
(12)
Natürlich werde ich Ihnen gleich die Lösung zu dieser DGL angeben. . . Andererseits lohnt es sich hier
kurz innezuhalten und sich zu fragen, ob man diese Lösung nicht selber erraten könnte: Gesucht ist
eine Funktion y(x), deren Ableitung y ′ (x) bis auf den konstanten Vorfaktor k wieder sich selber sein
soll. Für k = 1 wäre dann sogar y ′ (x) = y(x). Welche Funktion erfüllt grundsätzlich die Anforderung,
dass ihre Ableitung immer noch dieselbe Funktion ist?
27
Abbildung 16: Das graphische Verständnis eines unbestimmten Integrals. Erst die Randbedingung
legt schliesslich fest, auf welcher Höhe der Graph verläuft.
Genau: die Exponentialfunktion ex !
Jetzt müssen wir noch dafür sorgen, dass beim Ableiten ein Vorfaktor k rausspringt. Das k muss
das Resultat der inneren Ableitung sein. Die Einzellösung y1 (x) lautet daher:
y1 (x) = ekx
Da DGLs 1. Ordnung nur eine einzige Einzellösung besitzen, sind wir schon fertig. Für die allgemeine
Lösung müssen wir einfach noch einen Vorfaktor C anfügen:
y(x) = Cy1 (x) = Cekx
⇒
y ′ (x) = Cekx · k = ky(x)
⇒
Stimmt!
Als multiplikative Konstante bleibt der Vorfaktor C beim Ableiten einfach erhalten.
Bestimmen wir schliesslich aus der RB noch den konkreten Wert von C:
!
y(0) = C · ek·0 = C = a
⇒
y(x) = aekx
(13)
Würdigung der Euler’schen Zahl e: Bemerken Sie, welch spezielle Eigenschaft die Euler’sche Zahl
e ≈ 2.718 aufweist! Die Exponentialfunktion mit Basis e, also y(x) = Cex , ist die einzige von
der trivialen Funktion y(x) = 0 verschiedene Funktion, die beim Ableiten genau gleich bleibt.
Dies zeichnet e aus und macht diese Zahl quasi zur “natürlichen Basis” für sämtliche Exponentialfunktionen in Mathematik und Naturwissenschaft.15 Mit keiner anderen Basis lassen
sich Exponentialfunktionen so leicht handhaben.
Abb. 17 erläutert eine graphische Konsequenz von [ex ]′ = ex : Der Funktionsgraph von y(x) =
Cex hat die interessante Eigenschaft, dass die y-Koordinate jedes Punktes auf dem Graphen
auch gerade angibt, wie steil der Graph durch diesen Punkt hindurch verläuft.
3.2.3
Sinus- und Cosinusfunktion
Erneut betrachten wir eine homogene, lineare DGL, diesmal allerdings 2. Ordnung, weshalb zur
eindeutigen Lösung nun zwei RBs benötigt werden. Auch hier sei k eine beliebige Zahl 6= 0:
y ′′ (x) = −ky(x)
mit RBs: y(0) = A und
y ′ (0) = 0
(14)
Hier lautet die Frage zur DGL: “Welche Funktion y(x) hat die Eigenschaft, dass ihre 2. Ableitung
y ′′ (x) das Negative der Funktion selber ist?”
15
Und das sind weitaus mehr, als Sie im Moment vielleicht denken mögen! Sobald wir uns mit komplexen Zahlen
beschäftigen, wird dies noch deutlicher werden.
28
Abbildung 17: Die spezielle Eigenschaft der Exponentialfunktion ex : In jedem Punkt P (x, ex ) auf
dem Funktionsgraphen besitzt die zugehörige Tangente die Steigung ex .
Wer sich in den Funktionsableitungen auskennt, wird sofort ausrufen: “Die Sinusfunktion!” Klar:
[sin x]′ = cos x und [cos x]′ = − sin x, also in der Kombination: [sin x]′′ = − sin x.
“Aber Cosinus doch auch!” ruft jemand anders. Tatsächlich: [cos x]′′ = [− sin x]′ = − cos x.
Und schon haben wir die beiden Einzellösungen gefunden – zumindest fast: Wir müssen noch
die Konstante k einbauen. Das ist aber keine grosse Sache mehr, denn wiederum handelt es sich um
einen Faktor, der als Resultat der inneren Ableitung entsteht, diesmal allerdings doppelt:
y ′′ (x) = [sin(ωx)]′′ = [ω cos(ωx)]′ = −ω 2 sin(ωx) = −ky(x)
Die allgemeine Lösung der DGL lautet somit:
y(x) = C1 sin(ωx) + C2 cos(ωx)
mit
ω=
mit
√
ω2 = k
k
(15)
Was sagen die RB’s über die Werte von C1 und C2 ? Notieren wir y(x) und y ′ (x) nochmals und
setzen die RBs ein:
y(x) = C1 sin(ωx) + C2 cos(ωx)
!
⇒
y ′ (x) = ωC1 cos(ωx) − ωC2 sin(ωx)
y(0) = 0 + C2 = A
⇒
⇒
!
y ′ (0) = ωC1 + 0 = 0
C2 = A
⇒
C1 = 0
Somit lautet unser Schlussresultat:
y(x) = A cos(ωx)
mit ω =
√
k
(16)
Dieses Resultat ist bei Betrachtung der RBs nicht weiter erstaunlich: Bei x = 0 soll die Funktion
irgendeinen Wert A annehmen. Die Sinusfunktion ist dort aber gleich Null, somit muss das schon
die Cosinusfunktion hinkriegen. Ausserdem soll die Steigung bei x = 0 gleich Null sein. Das trifft für
die Cosinusfunktion zu, aber für die Sinusfunktion eben nicht. Somit muss es sich bei der gesuchten
Funktion um eine reine Cosinusfunktion handeln.
Bemerke! Als RB kann auch eine Wertfestlegung für eine Ableitung benutzt werden. Hier war dies
mit y ′ (0) = 0 der Fall.
√
Ergänzung Aus ω 2 = k könnte auch ω = − k folgen. Damit würden aber aufgrund der Symmetrieeigenschaften von Cosinus- und Sinusfunktion keine Lösungen entstehen, die nicht schon
durch (15) abgedeckt wären, denn cos(−a) = cos a und sin(−a) = − sin a. Beim Sinus würde
sich bei einer bestimmten Lösung einfach −C1 statt C1 ergeben.
29
3.2.4
Lineare, inhomogene DGL 2. Ordnung:
Schliesslich noch ein Beispiel ohne grossen Kommentar. Sie werden am Ende von Abschnitt 4.2 auf
Seite 37 genauer erfahren, worum es sich hier handelt – und erahnen es vermutlich auch schon.
Um Sie formal ein bisschen herauszufordern, heisst die Variable nun allerdings t und die davon
abhängige, gesuchte Funktion ist x(t):
x′′ (t) = a = const.
mit RBs: x(0) = x0
und x′ (0) = v0
(17)
Kennen wir die 2. Ableitung der Funktion, so erhalten wir die allgemeine Lösung durch zweimaliges
unbestimmtes Integrieren:
Z
Z
′
′′
x (t) = x (t) dt + C1 = a dt + C1 = at + C1
Z
Z
a
x(t) = x′ (t) dt + C2 = (at + C1 ) dt + C2 = t2 + C1 t + C2
2
Beachten Sie, dass bei der zweimaligen Integration die Integrationskonstante C1 des ersten unbestimmten Integrals ins zweite unbestimmte Integral mitgenommen werden muss.
Aus den RBs folgt für C1 und C2 :
!
x(0) = C2 = x0
!
x′ (0) = C1 = v0
und
Daraus ergibt sich schliesslich für die fertige Lösung (und ihre 1. Ableitung):
x(t) = x0 + v0 t +
a 2
t
2
und
x′ (t) = v0 + at
Na, kommt Ihnen das irgendwie bekannt vor? Wie schon gesagt: mehr dazu in Abschnitt 4.2.
3.3
3.3.1
Funktionen mit mehreren Variablen und partielle Ableitungen
Die Notation partieller Ableitungen
In Mathematik und Physik kann es durchaus vorkommen, dass eine Funktion von mehreren Variablen
resp. dass eine Grösse von mehreren anderen Grössen abhängt: f = f (x, y, . . .).
Beispiel: Die Zentripetalkraft FZ , also die resultierende Kraft, die notwendig ist, um einen Körper
der Masse m auf einer Kreisbahn mit Radius r zu halten, wenn seine Bahngeschwindigkeit v
beträgt, ist laut Newton gegeben durch:
FZ =
mv 2
r
Bei konstanter Körpermasse hängt FZ nur noch von v und r ab.16 Wir schreiben:
FZ = FZ (v, r)
D.h., wir notieren FZ ganz explizit als Funktion der zwei Grössen v und r.
16
Natürlich hängt FZ immer noch von der Masse m ab, aber dieses m wird sich bei vorgegebenem Körper im Verlauf
der Bewegung nicht ändern und muss deshalb nicht mehr als Variable (= “Veränderliche”) angeschaut werden.
30
Nun kann man sich fragen, wie sich FZ verändert, wenn ich den Bahnradius r unverändert
lasse und nur die Bahngeschwindigkeit v variiere. Es sollte Sie nicht allzu sehr verwundern,
dass wir die Antwort auf diese Frage durch Ableitung von FZ nach v erhalten. Da wir FZ als
Funktion von v und r ansehen, hier aber nur nach v ableiten wollen, spricht man von einer
partiellen Ableitung17 und verwendet dafür statt des differenziellen d’s das Symbol ∂:
2mv
∂FZ
=
∂v
r
Die andere partielle Ableitung nach dem Bahnradius r lautet:
mv 2
∂FZ
=− 2
∂r
r
3.3.2
Weshalb verwendet man für partielle Ableitungen eine andere Notation?
Die Antwort auf diese Frage ist für unsere weiteren Betrachtungen zwar nicht so wichtig,
schaden kann sie aber wohl kaum: Sind sich in unserem Beispiel von oben die Geschwindigkeit v
und der Bahnradius r gleichzeitig am verändern, so existieren zwei infinitesimale Veränderungen
dv und dr, die erst zusammen die infinitesimale Veränderung dFZ festlegen. Dieses dFZ
bezeichnet man deshalb auch als das totale Differenzial von FZ und es gilt:
dFZ =
∂FZ
∂FZ
· dv +
· dr
∂v
∂r
Mit dem leicht modifizierten Differenzial-Symbol ∂ will man nun speziell darauf hinweisen, dass
bei einer partiellen Ableitung nur eine einzige Variable verändert wird. Die anderen Variablen
werden konstant gehalten. Auf diesem Hintergrund können Sie verstehen, dass in der obigen
Zeile dFZ etwas wesentlich anderes als ∂FZ meint: dFZ ist die infinitesimale Veränderung von
Z
FZ bei infinitesimalen Veränderungen dv und dr, währenddem ∂FZ im Ausdruck ∂F
∂v für die
infinitesimale Veränderung von FZ steht, wenn sich einzig v am verändern ist.
Das tönt jetzt vielleicht alles etwas theoretisch, ist aber halb so wild! Wichtig ist abschliessend
nochmals einfach dies:
Sobald eine Funktion von mehreren Variablen abhängt, z.B. f (x, y),
schreiben wir für die Ableitung nach einer dieser Variablen, z.B. nach
y, neu eben ∂f
∂y und nennen dies die partielle Ableitung von f nach y.
3.3.3
Unser zentrales Beispiel: Wellenfunktion und Schrödingergleichung
Wie wir im Quantenmechanik-Buch von D.J. Griffiths 18 ganz zu Beginn des ersten Kapitels lesen,
ist die Wellenfunktion Ψ (x, t) jeweils die Lösung der Schrödinger-Gleichung:
i~
~2 ∂ 2 Ψ
∂Ψ
=−
+VΨ
∂t
2m ∂x2
(18)
Ohne im Moment darauf einzugehen, was diese Wellenfunktion ist, stellen wir fest, dass es sich
offenbar um eine Funktion Ψ handelt, die vom Ort x und von der Zeit t, also von zwei Variablen
abhängt. Jedem Ort x wird zu jedem Zeitpunkt t ein Funktionswert Ψ (x, t) zugeordnet.
17
“Partiell” ist zu verstehen als “teilweise”: Es wird nur nach einer einzigen Variable, also nur nach einem einzelnen
Bestandteil des gesamten Variablenkatalogs abgeleitet.
18
Griffiths 2012, S. 22 [1].
31
Dem entsprechend treten in der Schrödinger-Gleichung (18) eben partielle Ableitungen auf – auf
∂2Ψ
der linken Seite die einfache Ableitung ∂Ψ
∂t nach der Zeit t, rechts die zweifache Ableitung ∂x2 nach
dem Ort x. Die Schrödinger-Gleichung ist somit eine partielle Differenzialgleichung. Die Lösungen
der Schrödinger-Gleichung sind Funktionen Ψ (x, t), welche die Gleichung für alle Orte x und alle
Zeiten t erfüllen!19
Etwas später20 werden wir die Wellenfunktion Ψ (x, t) durch den Ansatz einer Variablenseparation in einen nur noch vom Ort x abhängigen Teil ψ(x) und einen nur noch von der Zeit t abhängigen
Teil ϕ(t) auftrennen:
Ψ (x, t) = ψ(x) ϕ(t)
Setzt man diesen Ansatz in die Schrödinger-Gleichung ein, so folgen daraus zwei neue Differentialgleichungen, eine für ψ(x) und eine für ϕ(t):
−
~2 d2 ψ
+ V ψ = Eψ
2m dx2
und
dϕ
iE
=− ϕ
dt
~
(19)
Beachten Sie, dass in diesen neuen DGLs nun wieder das d anstelle des ∂ auftaucht, weil ψ(x) und
ϕ(t) je nur noch von einer einzigen Variable abhängen.
Da lässt sich doch etwas wiedererkennen! Schauen Sie sich in (19) die rechte der beiden neuen
iE
DGLs an: Die Ableitung dϕ
dt ist bis auf den Vorfaktor − ~ gleich der Funktion ϕ(t) selber. . . Klingelt
da was? Na klar: Die Lösung muss eine Exponenzialfunktion sein, denn es handelt sich um die
zugehörige DGL (12) von Seite 27 und somit muss sich die Lösung (13) ergeben:
iE
iE
dϕ
iE
− iE
−
t
t
ϕ(t) = ae ~
= ae ~ · −
⇒ Stimmt!
= − ϕ(t)
⇒
dt
~
~
Anmerkung: Im Kontext von Funktionen mit mehreren Variablen können Sie nun gut nachvollziehen, weshalb sich die Strich-Schreibweise f ′ (x) im Prinzip nur für Funktionen mit einer
einzigen Variable eignet. Was soll denn bitte f ′ (x, y) bedeuten? Wonach wird da abgeleitet?
∂f
Das sollte doch explizit gesagt werden! Die differenzielle Schreibweise ∂f
∂x resp. ∂y bringt das
hingegen ganz klar zum Ausdruck.
3.4
Differenzialoperatoren und mehrfache Ableitungen
Ohne grosse Umstände können Sie nun ebenfalls verstehen, dass das “Ableiten nach einer bestimmten
Variable” als sogenannter Differenzialoperator notiert werden kann, z.B.:
d
∂
Differenzialoperator für die Ableitung nach x:
resp.
dx
∂x
Solche (Differenzial-)Operatoren müssen offensichtlich auf Funktionen angewendet werden. Das kann
auch mehrfach passieren, wie Sie es oben bereits gesehen haben. Z.B. schreibt man für die zweite
Ableitung nach x:
d df
d2 f
d ′
f (x) =
=
f ′′ (x) =
dx
dx dx
dx2
Achtung! Verwechseln Sie die zweite Ableitung nicht mit dem Quadrat einer ersten Ableitung:
2
2
df
d2 f
′
′′
=
f
(x)
=
6
f (x) =
dx2
dx
19
Klar: Solche partiellen DGLs sind nochmals eine Klasse für sich. Damit setzen wir uns dann ganz konkret und
länger als an dieser Stelle bei der Betrachtung von Lösungen der Schrödinger-Gleichung auseinander.
20
Griffiths 2012, S. 48 [1].
32
4
Die klassische Mechanik – eine differenzielle Theorie
Das Ziel der klassischen Mechanik nach Newton ist es, aufgrund der auf einen Körper wirkenden
Kräfte dessen Ortsfunktion x(t) zu bestimmen: Zu jedem Zeitpunkt t gehört ein eindeutiger Ort
x, der eben als Funktion des Zeitpunktes t aufgefasst wird. Wissen wir über die Funktionsweise
der Kräfte und den aktuellen Bewegungszustand des Körpers ganz genau Bescheid, so ist seine
Bewegung resp. seine Ortsfunktion x(t) bis in alle Zukunft vorausbestimmt.
Klarstellung: Eigentlich handelt es sich beim Ort um einen Punkt im dreidimensionalen Raum,
also um einen von der Zeit t abhängigen Ortsvektor ~r(t). Wir wollen uns hier vorerst aber
auf sogenannt geradlinige Bewegungen einschränken. Dabei ist der Ausdruck “geradlinig”
leicht irreführend. Es geht nicht darum nur Bewegungen längs einer Geraden zu studieren,
vielmehr schränken wir uns einfach auf die Bewegung des Körpers längs einer bereits bekannten
Trajektorie (= Bewegungsbahn) ein. D.h., uns interessiert nur das schneller oder langsamer
Werden, nicht aber die Kurvenfahrt des Körpers. Seine Bewegung ist sozusagen auf eine
Dimension eingeschränkt. Das ist auch der Grund, weshalb wir die Ortsfunktion hier x(t)
nennen und damit in gewisser Weise zum Ausdruck bringen, dass sich der Körper nur längs
einer vorgegebenen Bahn, die wir auf die x-Achse legen wollen, verschieben soll.
Wir wollen nun nachvollziehen, wie die Newton’sche Mechanik die Ortsfunktion x(t) voraussagt.
Zuerst werden wir die Kinematik, also die mathematische Beschreibung eines Bewegungsablaufs,
mittels Differenzial- und Integralrechnung neu formulieren. In der Folge lässt sich das Aktionsprinzip
(2. Newton’sches Axiom, F = m · a) neu verstehen, nämlich als Differenzialgleichung für die
Ortsfunktion x(t). Deren Lösung liefert nicht einfach eine oder mehrere Zahlen, sondern eben eine
ganze Funktion x(t), die den Bewegungsablauf des Körpers für alle Zeiten t beschreibt. Doch eins
nach dem andern. Starten wir mit der Kinematik. . .
4.1
Kinematik und Differentialrechnung
Zu Beginn der 1. Klasse hatten wir in der Physik Bewegungsdiagramme betrachtet, nämlich
das Orts-Diagramm (t-x)21 , das Geschwindigkeits-Diagramm (t-v) und das BeschleunigungsDiagramm (t-a). Damit verbunden waren die Definitionen von Geschwindigkeit und Beschleunigung:
• Momentane Geschwindigkeit v(t) = Steigung im t-x-Diagramm zum Zeitpunkt t.
• Momentane Beschleungiung a(t) = Steigung im t-v-Diagramm zum Zeitpunkt t.
Anfangs der 1. Klasse mussten wir unsere Berechnungen auf gerade Abschnitte der Graphen im t-xund im t-v-Diagramm einschränken, denn ohne Differentialrechnung konnten Sie damals eben erst
Steigungen von Geraden bestimmen (via Steigungsdreiecke).
Betrachten wir nochmals den VBZ-Trolleybus in unserem 1. Klass-Mechanik-Skript.22 Er
fährt von Haltestelle X zu Haltestelle Y. Wir hatten drei Bewegungsabschnitte unterschieden:
1. Losfahren = Gleichmässig beschl. Bew. ohne Anfangsgeschwindigkeit (gmbBoA)
Der Bus beschleunigt. Nach 7.0 s hat er seine Fahrtgeschwindigkeit von 12.5 ms erreicht.
2. Fahrt mit konstanter Geschwindigkeit = Gleichförmige Bewegung (gfB)
Der Bus fährt während den folgenden 10 s mit seiner erreichten Geschwindigkeit weiter.
3. Abbremsen = Gleichmässig beschl. Bew. mit Anfangsgeschwindigkeit (gmbBmA)
Der Bus bremst komplett ab. Dafür benötigt er eine Zeit von 5.0 s.
21
22
In der 1. Klasse hiess das Ortsdiagramm t-s-Diagramm.
Gertsch 2013, S. 6ff [3].
33
Abb. 18 zeigt die drei Bewegungsdiagramme. Nur während dem 2. Bewegungsabschnitt, also
während der gleichförmigen Bewegung, konnten Sie die Geschwindigkeit aus dem Steigungsdreieck
berechnen:
125 m
m
∆x
=
= 12.5
v=
∆t
10 s
s
Damit wir anschliessend weitergehen und auch Beschleunigungen bestimmen konnten, gingen wir
davon aus, dass Geschwindigkeitsänderungen stets gleichmässig ablaufen. Im t-v-Diagramm ergaben sich so im 1. und im 3. Bewegungsabschnitt wiederum Geraden, deren Steigungen für die
jeweiligen Beschleunigungen standen und die sich eben berechnen liessen. So erhielten wir:
a1 =
12.5 ms
m
∆v
=
= 1.8
∆t
7s
s
resp.
a3 =
−12.5 ms
∆v
m
=
= −2.5
∆t
5s
s
Abbildung 18: Die Bewegungsdiagramme zu einer Trolleybusfahrt.
34
Das war natürlich eine krasse Vereinfachung. Weshalb sollten Beschleunigungen stets gleichmässig ablaufen? Grundsätzlich sind doch beliebige Bewegungsabläufe mit variablen Beschleunigungen denkbar! Dennoch war das eben eine gute Annahme, denn so konnten Sie ein grundlegendes
Verständnis für Geschwindigkeit und Beschleunigung erhalten.
Dieses Verständnis bleibt auch jetzt immer noch dasselbe:
• Die Geschwindigkeit v soll beschreiben, wie schnell sich der (Aufenthalts-)Ort x eines Körpers
am verändern ist.
• Die Beschleunigung a soll beschreiben, wie schnell sich die Geschwindigkeit v eines Körpers
am verändern ist.
Das sind eigentlich infinitesimale Betrachtungen. Es geht um die momentanen Veränderungsraten
von x resp. v zu einem bestimmten Zeitpunkt t. D.h., wir bilden den Limes ∆t → 0 der beiden
∆v
Differenzenquotienten ∆x
∆t und ∆t und erhalten so die neuen, eben differentiellen Definitionen von
Geschwindigkeit und Beschleunigung:
Definition der Geschwindigkeit v(t)
Die momentane Geschwindigkeit v(t) ist gegeben durch die Ableitung der
Ortsfunktion x(t) nach der Zeit t:
v(t) ≡ x′ (t) ≡
dx
∆x
≡ lim
∆t→0 ∆t
dt
(20)
Definition der Beschleunigung a(t)
Die momentane Beschleunigung a(t) ist gegeben durch die Ableitung der
Geschwindigkeitsfunktion v(t) nach der Zeit t:
a(t) ≡ v ′ (t) ≡
∆v
dv
≡ lim
∆t→0 ∆t
dt
(21)
Damit wird die Beschleunigung a(t) zur zweiten Ableitung x′′ (t) der Ortsfunktion x(t):
dv
d dx
d2 x
a(t) = v ′ (t) =
=
(22)
= 2 = x′′ (t)
dt
dt dt
dt
Da Sie das Ableiten bereits gelernt haben, können Sie nun im Prinzip aus einer beliebigen Ortsfunktion x(t) die Geschwindigkeitsfunktion v(t) und die Beschleunigungsfunktion a(t) berechnen.
Ein erstes Beispiel – die gmbBmA: Bei der gleichmässig beschleunigten Bewegung mit Anfangsgeschwindigkeit (gmbBmA) lautet die quadratische Ortsfunktion x(t) = x0 +v0 t+ a2 t2 .23 Dabei
ist x0 der Startort, v0 die Anfangsgeschwindigkeit und a eben die konstante Beschleunigung.
Durch Ableiten erhalten wir:
v(t) = x′ (t) = v0 + at
(linear!)
und
a(t) = v ′ (t) = a = const.
(23)
Zwischen den Bewegungsgleichungen der gmbBmA gibt es also einen direkten, differentiellen
Zusammenhang, den Sie jetzt verstehen!
23
Vgl. Gertsch 2013, S. 14 [3].
35
4.2
Kinematik und Integralrechnung
Eben haben wir in Gleichung (20) die Geschwindigkeit v(t) als Ableitung der Ortsfunktion x(t) und
in (21) die Beschleunigung a(t) als Ableitung der Geschwindigkeitfunktion v(t) definiert.
Nehmen wir diese Definitionen ernst, so müssen nun in die jeweils umgekehrte Richtung auch
Integralzusammenhänge gelten, so wie dies in Abschnitt 2.1.8 auf Seite 14 dargestellt wurde. Die
Geschwindigkeitsfunktion v(t) ergibt sich als Integral über die Beschleunigungsfunktion a(t) und die
Ortsfunktion x(t) ist gleich dem Integral über die Geschwindigkeitsfunktion v(t):
v(t2 ) = v(t1 ) +
Z
|
t2
t1
a(t) dt
{z }
und
x(t2 ) = x(t1 ) +
Z
|
=∆v
t2
t1
v(t) dt
{z }
(24)
=∆x
Die Integrale stehen für die Veränderungen ∆v und ∆x von Geschwindigkeit und Ort während der
Zeitspanne ∆t von t1 bis t2 .
Wir wollen die beiden Gleichungen (24) noch ein wenig anders schreiben, nämlich so, wie wir
Sie bereits aus der ersten Klasse kennen und wie wir sie ab und zu auch brauchen werden:
• Wir sind frei in der Wahl des zeitlichen Nullpunktes. Daher setzen wir t1 = 0: “Die Zeitmessung
soll zu Beginn des Bewegungsvorganges starten.” Für v(t1 ) und x(t1 ) schreiben wir v0 und
x0 zur Kennzeichnung der Geschwindigkeit und des Ort zum Zeitpunkt t = 0. Auch v0 und
x0 dürfen wir frei wählen, denn für die Wahl des örtlichen Nullpunktes und für die Wahl
einer gleichförmige Bewegung des Bezugssystems gibt es in der Newton’schen Mechanik keine
Einschränkungen.
• Uns interessiert die Entwicklung bis zu einem Zeitpunkt t. D.h., wir setzen t2 = t.
• Und schliesslich wollen wir wissen, bis zu welchem Ort der Körper bis zum Zeitpunkt t gekommen ist. x2 ersetzen wir also durch die Ortsfunktion x(t).
Mit diesen Ersetzungen wird aus den Gleichungen (24) neu:
v(t) = v0 +
Z
t
a(τ ) dτ
und
0
x(t) = x0 +
Z
t
v(τ ) dτ
(25)
0
Zur Notation: Da die Zeitvariable t in (25) als obere Grenze für das Integral verstanden werden
soll, schreiben wir für die Zeit unter dem Integral neu τ (kleines gr. tau). Dieses τ durchläuft
unter dem Integral alle Zeitpunkte von 0 bis t.
Flächen unter dem Funktionsgraphen: Wir haben gerade festgestellt, dass die Momentangeschwindigkeit v(t) durch das Integral über die aktuelle Beschleunigung a(t) gegeben ist. Ebenso
entspricht der aktuelle Ort x(t) dem Integral über die Momentangeschwindigkeit v(t).
In einem Koordinatensystem steht das Integral für die Summe über die positiven und negativen Flächen zwischen Funktionsgraph und horizontaler Achse. Damit verstehen wir auch die
folgenden beiden Zusammenhänge, die wir bereits in der 1. Klasse formuliert hatten:24
• Die zurückgelegte Strecke ∆x ist im t-v-Diagramm sichtbar als Fläche zwischen dem
Graphen von v(t) und der t-Achse.
• Die Geschwindigkeitsveränderung ∆v ist im t-a-Diagramm sichtbar als Fläche zwischen dem Graphen von a(t) und der t-Achse.
24
Vgl. Gertsch 2013, S. 10f [3].
36
Beispiel: Die gleichmässig beschleunigte Bewegung
Aus (25) erhalten wir bei bekannter Geschwindigkeitsentwicklung v(t) die Ortsfunktion x(t).
Betrachten wir zur Veranschaulichung nochmals die gleichmässig beschleunigte Bewegung mit
Anfangsgeschwindigkeit – in der 1. Klasse abgekürzt durch “gmbBmA”.
“Gleichmässig” bedeutet, dass die Beschleunigung während des Vorgangs konstant bleiben
soll: a(t) = a = const.. Hieraus ergibt sich mit (25) für die Geschwindigkeitsfunktion:
v(t) = v0 +
Z
t
a(τ ) dτ = v0 +
Z
0
0
t
t
a dτ = v0 + [aτ ] = v0 + at
0
(26)
Sobald wir dieses v(t) kennen, können wir auch die Ortsfunktion angeben:
x(t) = x0 +
Z
t
v(τ ) dτ = x0 +
0
Z
t
0
a
v0 + aτ dτ = . . . = x0 + v0 t + t2
2
(27)
Die längst bekannten Bewegungsgleichungen x(t) = x0 + v0 t + a2 t2 und v(t) = v0 + at für
die gleichmässig beschleunigte Bewegung mit Anfangsgeschwindigkeit sind also einfach die
mathematisch logische Konsequenz der als konstant angenommenen Beschleunigung!
Dieses Ergebnis hatten wir schon auf Seite 30 als Lösung der DGL x′′ (t) = a = const. mit RBs
x(0) = x0 und x′ (0) = v0 erhalten. Damals hatten wir ebenfalls doppelt integriert, einfach mit
unbestimmten Integralen. Den physikalischen Hintergrund hatte ich jedoch nicht erläutert.
Aber woher kommt diese DGL x′′ (t) = a = const.? Rein kinematisch betrachtet ist die Sache
klar: Wenn wir von einer konstanten Beschleunigung a ausgehen, dann ergeben sich die Ortsund die Geschwindigkeitsfunktion einfach so, wie wir es in den Gleichungen (27) und (26)
gefunden haben.
Vielleicht sollte ich die Frage anders formulieren: Unter welchen physikalischen Umständen
ist denn die Beschleunigung a überhaupt konstant? Welche Bedingungen führen auf die DGL
x′′ (t) = a = const. für die Ortsfunktion x(t)?
Die Antwort auf diese Frage muss das Resultat einer physikalischen Theorie sein, die Aussagen
dazu macht, unter welchen Rahmenbedingungen Bewegungen so oder so ablaufen. Genau dies
ist die Klassische Mechanik, und wir werden gleich sehen, dass es eben das 2. Newton’sche
Axiom, also das Aktionsprinzip ist, aus dem entsprechende DGLs für die Ortsfunktion x(t)
hervorgehen. . .
37
4.3
Das 2. Newton’sche Axiom als Differenzialgleichung
In der 1. Klasse hatten wir das Aktionsprinzip (2. Newton’sches Axiom) kennengelernt. Es besagt,
dass die Beschleunigung a, die ein Körper erfährt, von der Kraft F abhängt, die auf ihn wirkt:25
F
(28)
m
Dabei steht die Masse m für die Trägheit des Körpers. Je grösser sie ist, umso kleiner wird die
Beschleunigung a bei vorgegebener Kraft F .
Die Ursache der Kraft F ist in der momentanen Situation (zum Zeitpunkt t) zu suchen. Sie
muss daher als Funktion des Ortes x(t), der Geschwindigkeit v(t) = x′ (t) und der Zeit t aufgefasst
werden:
F = F x(t), v(t), t = F x(t), x′ (t), t
(29)
F =m·a
resp.
a=
Eine solche Gleichung, die eine Kraft als Funktion der “aktuellen Umstände” beschreibt, nennt man
ein Kraftgesetz. Um richtig gut zu verstehen, was damit gemeint ist, folgen weiter unten ein paar
Beispiele von Situationen, bei denen Ihnen die Kraftgesetze zumindest teilweise bereits bekannt sind.
Gemäss (22) ist die Beschleunigung a(t) die zweite Ableitung x′′ (t) der Ortsfunktion x(t). Damit
notieren wir das 2. Newton’sche Axiom (28) nun in neuer Form:
Differenzielle Formulierung des 2. Newton’schen Axioms
(Aktionsprinzip) für geradlinige Bewegungen
Erfährt ein Körper die vom Ort x, der Geschwindigkeit x′ und der Zeit t
abhängige Kraft F (x, x′ , t), so erfüllt seine Ortsfunktion x(t) die DGL:
F (x, x′ , t) = m · x′′
(30)
Dabei ist m die Masse des Körpers.
In (30) und bei einigen nachfolgenden Gleichungen habe ich bei x(t), x′ (t) und x′′ (t) das Argument
(t) zugunsten einer besseren Übersichtlichkeit weggelassen.
Wir bemerken: Das Aktionsprinzip entspricht einer DGL 2. Ordnung für die Ortsfunktion x(t)!
Gesucht ist also eine Funktion x(t), welche diese DGL zu jedem beliebigen Zeitpunkt t
erfüllt. Als DGL 2. Ordnung tauchen bei der Lösung in der Regel zwei freie Parameter auf, die
typischerweise durch die Vorgabe von Rand- resp. Anfangsbedingungen wie dem Startort x0
und der Anfangsgeschwindigkeit v0 festgelegt werden.
Anmerkung: Nach wie vor betrachten wir geradlinige, also von vornherein auf 1 Dimension eingeschränkte Bewegungen. Das Aktionsprinzip (30) gilt aber auch im Dreidimensionalen. Dann
wird der Ort durch den Ortsvektor ~r(t) beschrieben. Kraft, Geschwindigkeit und Beschleunigung sind Vektoren:
~ (~r, ~r ′ , t) = m · ~r ′′
3D-Aktionsprinzip:
F
Natürlich müssten wir nun erläutern, wie die Ableitung eines Vektors zu bilden ist, was also
unter ~r ′ und ~r ′′ genau zu verstehen ist. Das lassen wir im Moment allerdings beiseite, weil
wir nicht unmittelbar damit arbeiten werden. Es genügt zu wissen, dass es diese Vektoren gibt
und dass sie wohldefiniert sind.
25
An dieser Stelle hatten wir in der 1. Klasse stets von der resultierenden Kraft Fres gesprochen. Im Prinzip gilt
(28) aber bereits für jede einzelne auf den Körper wirkende Kraft F . Jede solche Kraft erzeugt eine Beschleunigung
a. Und ob wir nun zuerst Kräfte zur resultierenden Kraft oder erst anschliessend die daraus hervorgehenden Beschleunigungen aufaddieren, spielt keine Rolle. Das Entscheidende ist, dass diese Addition – egal ob von Kräften oder von
Beschleunigungen – vektoriell erfolgt (vgl. Vektorgeometrie: “Vektoraddition = Pfeile aneinanderhängen”). Dies wird
häufig als 4. Newton’sches Axiom, Überlagerungs- oder Superpositionsprinzip bezeichnet.
38
4.4
4.4.1
Beispiele zu Kraftgesetzen und daraus folgenden DGLs für x(t)
Freier Fall an der Erdoberfläche
Wir betrachten ein Objekt in der Luft an der Erdoberfläche. Solange dabei Luftwiderstand und
Auftrieb vernachlässigbar klein sind, ist die Gewichtskraft FG die einzige Kraft, die auf den Körper
wirkt. Wir bezeichnen diese Situation als freien Fall.
Wir reduzieren unsere Betrachtung auf eine einzige Dimension, nämlich auf Bewegungen längs
einer vertikalen Ortsache (→ senkrechter Wurf). Deren positive Richtung zeige nach oben, sodass
im Kraftgesetz für die Gewichtskraft ein negatives Vorzeichen auftritt:
FG = −mg
N
der altbekannte Ortsfaktor. Das Aktionsprinzip resp. die DGL für ein frei
Darin ist g = 9.81 kg
fallendes Objekt lautet somit:
F = −mg = mx′′
resp.
x′′ = −g = const.
(31)
Der freie Fall ist ein Beispiel für eine konstante (resultierende) Kraft F . Das Kraftgesetz hängt weder
vom Ort x, noch von der Geschwindigkeit x′ , noch von der Zeit t ab. Wir betrachten also gerade
den einfachst möglichen Fall einer beschleunigten Bewegung.
Sobald die Kraft F gleich bleibt, haben wir es mit einer konstanten Beschleunigung zu tun.26
In der 1. Klasse hatten wir unsere Betrachtungen praktisch vollständig auf solche Situationen eingeschränkt, weil dabei stets gleichmässig beschleunigte Vorgänge herauskamen – und die konnten wir
eben mit den Gleichungen zur gleichmässig beschleunigten Bewegung (gmbB) behandeln.
Die zu (31) gehörige Lösung haben wir schon mehrfach gesehen (siehe insbesondere Seiten 30
und 37). Mit RBs x(0) = x0 und x′ (0) = v0 lautet sie:
x(t) = x0 + v0 t −
4.4.2
g 2
t
2
und
v(t) = x′ (t) = v0 − gt
Fallen mit Luftwiderstand
Ergänzen wir nun den freien Fall durch einen Luftwiderstand FL . Dieser ist typischerweise proportional zum Quadrat der Geschwindigkeit v 2 = (x′ )2 . Ausserdem ist er der aktuellen Bewegung
entgegengerichtet. Das lässt sich folgendermassen formulieren:
FL = −c · (x′ )2 ·
c · (x′ )3
x′
=−
′
|x |
|x′ |
′
′
Dabei ermittelt der Bruch |xx′ | das Vorzeichen der Geschwindigkeit27 und − |xx′ | kehrt dieses Vorzeichen um, sodass der Luftwiderstand eben stets entgegen der aktuellen Bewegungsrichtung wirkt.
Der Betrag des Luftwiderstandes ist durch c · (x′ )2 gegeben. c steht für eine Konstante, die
verschiedene Informationen enthält, wie z.B. die Luftdichte, den Strömungswiderstand des Gegenstandes28 oder die Angriffsfläche, mit der er gegen die Bewegungsrichtung ausgerichtet ist.
Alles zusammen ergibt sich so für das 2. Newton’sche Axiom als DGL:
mx′′ = FG + FL = −mg −
c · (x′ )3
|x′ |
26
resp.
x′′ = −g −
c · (x′ )3
m · |x′ |
(32)
Soviel zur Frage am Ende von Abschnitt 4.2 auf Seite 36.
a
a
Probieren Sie es aus! Für eine positive Zahl a > 0 ist |a|
= +1, für eine negative Zahl a < 0 ist |a|
= −1.
28
Dieser Strömungswiderstand hat mit der Form des Gegenstandes und seiner Oberflächenbeschaffenheit zu tun.
Ausserdem kommt es darauf an, mit welcher Ausrichtung der Gegenstand durch die Luft fliegt – ein quer zur Flugrichtung stehendes Flugzeug wäre aerodynamisch sicher sehr ungeeignet. . .
27
39
Der Körper sei in Abwärtsrichtung unterwegs. Dann ist x′ < 0 und (32) vereinfacht sich zu:
x′′ = −g +
c · (x′ )2
m
resp.
x′′ −
c ′ 2
(x ) = −g
m
(33)
Für diese inhomogene und nicht-lineare DGL 2. Ordnung gibt es in aller Allgemeinheit keine geschlossene Lösung. In einer Übung werden Sie einen Spezialfall davon untersuchen können.29
Eines ist allerdings klar: Es gibt einen stabilen Endzustand, in dem der Körper nicht mehr beschleunigt. Ist nämlich x′′ = 0, so gilt:
r
mg
c ′ 2
′
′′
(x ) = g resp. x = −
x =0
⇒
m
c
Diesen Grenzfall kennt man z.B. vom Fallen aus einem Flugzeug. Behält ein Mensch seine Flugposition bei, so wird er in etwa eine Grenzgeschwindigkeit von x′ ≈ −200 km
h erreichen. Dann ist FL
gleich gross wie die FG und es findet keine weitere Beschleunigung mehr statt (x′′ = 0).
4.4.3
Der klassische, ungedämpfte harmonische Oszillator
An eine (selber masselose) Spiralfeder hängen wir eine Kugel mit Masse m. Der Ort x dieses
Federpendels sei gegeben durch den Verbindungspunkt zwischen Spiralfeder und Kugel. In Abb. 19
sehen Sie links zunächst die Spiralfeder ohne angehängte Kugel. Dies ist die entspannte Lage des
Pendels. Wir bezeichnen den zugehörigen Ort mit xe .
Bei angehängter Kugel gibt es eine Ruhelage, also ein Höhe, auf der das Pendel ruhig hängen
bleiben kann. Da wir in der Wahl des Nullpunktes unserer vertikalen x-Achse prinzipiell frei sind,
dürfen wir festlegen, dass x = 0 der Ruhelage entspricht. Diese Wahl ist überhaupt nicht zwingend,
wird sich aber rechnerisch als sehr praktisch erweisen.30
Abbildung 19: Situationen beim Federpendel: entspannte Lage, Ruhelage und eine beliebige Lage.
c
(x′ )2 = 0. Ein Körper hat
Dabei geht es um die schwerelose Situation (g = 0), also um die homogene DGL x′′ − m
′
eine Anfangsgeschwindigkeit x (0) = v0 , mit der er in ein Gas eintaucht. Die Endgeschwindigkeit wird dann v∞ = 0
sein. Wie aber sieht die Geschwindigkeitsentwicklung bis dahin aus?
30
Das wird Sie nicht überraschen, denn Sie wissen ja bereits, dass ein Pendel um seine Ruhelage schwingt. D.h.,
diese Lage ist ein Symmetriepunkt der Bewegung. Lernen Sie einmal mehr: Wenn man Symmetrien ausnutzen kann,
sollte man das auch tun, denn dadurch vereinfacht sich die Mathematik in der Regel drastisch. Konkret heisst das: Die
Wahl des Koordinatensystems will stets gut überlegt, also an die Symmetrie des Problems angepasst sein.
29
40
Betrachten wir schliesslich das rauf und runter schwingende Pendel. Zu irgendeinem Zeitpunkt
t befindet es sich am Ort x(t). Genau diese Ortsfunktion suchen wir. Sie wird sich aus einer DGL
ergeben, wie das in der klassischen Mechanik eben sein muss. Die RBs ergeben sich durch die Art, wie
wir die Pendelschwingung gestartet haben. Ich nehme an, wir haben das Pendel aus der Ruhelage um
die Höhe A angehoben und dann losgelassen. Dieser Moment des Loslassens definiert den Zeitpunkt
t = 0, für den offenbar gilt:
RBs:
x(0) = A
und
x′ (0) = 0
Nun betrachten wir die Kräfte, die auf das Pendel wirken:
• Wir wollen von einer ungedämpften Schwingung ausgehen. D.h., wir tun so, als gäbe es
keinerlei Luftwiderstand oder sonstige Reibungseffekt, sodass das Pendel im Prinzip unendlich
lange weiterschwingen würde.
• Die Gewichtskraft FG zieht die Kugel nach unten. Sie ist konstant und gegeben durch:
FG = −mg
(34)
• Die Federkraft FF zieht die Kugel nach oben. Sie verändert sich ständig, weil sie in jedem
Moment davon abhängt, an welchem Ort x sich das Pendel gerade befindet. Das Kraftgesetz
für solche Spiralfedern und viele andere elastische Gegenstände lautet:31
Das Hooke’sche Federgesetz
Die Federkraft FF ist proportional zur Dehnung s (= Verlängerung oder
Auslenkung) der Feder aus ihrer entspannten Lage:
FF = Ds
(35)
Dabei steht D für die Federkonstante, ein Wert, der die Stärke oder Härte
N
angegeben wird.
einer Feder beschreibt und in der Einheit m
Zur Verdeutlichung: Jede Spiralfeder besitzt ihre eigene Federkonstante D in “Newton pro
N
). Die Federkonstante D beantwortet also die Frage, wie viele Newton Kraft
Meter” (= m
es bräuchte, um die Spiralfeder um einen ganzen Meter zu dehnen.32
Wegen der Proportionalität von Dehnung s und Federkraft FF sind die Skalen auf Federwaagen schön regelmässig – wie praktisch! Nun geht es uns aber um eine andere
Konsequenz des Federgesetzes resp. dieser Proportionalität, nämlich um die reine Sinusresp. Cosinusschwingung eines Federpendels. Diesen Bewegungstyp beobachten wir bei
allen schwingenden Systemen, bei denen die rücktreibende Kraft proportional zur Auslenkung ist!33
Bei unserer Feder ist die Dehnung s die Distanz zwischen der entspannten Lage xe und der weiter
unten liegenden aktuellen Lage x:
s(x) = xe − x
Somit gilt für die nach oben am Pendel ziehende Federkraft FF am Ort x:
FF (x) = Ds(x) = D xe − x
31
(36)
Robert Hooke (1635 – 1703), ein englischer Universalgelehrter und Zeitgenosse Newtons, wenn auch nicht gerade
sein bester Freund. . . Er untersuchte mitunter die Elastizitätseigenschaften verschiedener Materialien.
32
Natürlich wären die meisten unserer kleinen, alltäglichen Spiralfedern längst überdehnt (und damit kaputt), wenn
man sie tatsächlich um einen ganzen Meter verlängern würde. . .
33
Z.B. ist dies auch beim durch die Erde fallenden Stein in Abb. 21 auf Seite 46 der Fall.
41
Mit (34) und (36) haben wir nun alles beisammen, um die DGL für das Federpendel aufzustellen.
Aus dem Aktionsprinzip (30) folgt:
FF (x) + FG = D xe − x − mg = mx′′
(37)
Im Prinzip kennen wir mit dem in der Ruhelage ruhenden Pendel bereits eine Lösung der DGL, auch
wenn es sich dabei um den ganz trivialen Fall x(t) = 0 handelt. Aber auch dieser Fall muss durch
die DGL abgedeckt sein. Schauen wir kurz, was wir daraus folgern können!
In der Ruhesituation ist sowohl x = 0, als auch x′′ = 0 und es folgt:
FF (0) + FG = D xe − 0 − mg = 0 ⇒ Dxe = mg
(38)
Das wussten wir ja eigentlich schon seit jeher. In der Ruhesituation herrscht einfach das Kräftegleichgewicht zwischen FF und FG . Mit (38) lässt sich nun aber (37) wesentlich vereinfachen:
!
D xe − x − mg = Dxe − Dx − mg = mg − Dx − mg = −Dx = mx′′
Und schon steht sie da, unsere DGL für das Federpendel:
x′′ = −ω 2 x
mit
ω2 ≡
D
m
(39)
In Worten: “Die zweite Ableitung x′′ (t) welcher Funktion x(t) entspricht bis auf ein Minuszeichen
und einen konstanten Faktor ω 2 wieder der Funktion x(t) selber?”
Diese Frage resp. diese DGL haben wir bereits gelöst. In der DGL (14) auf Seite 28, als wir
DGLs noch ohne physikalischen Kontext betrachtet hatten, lautete die gesuchte Funktion einfach
y(x) statt x(t), zudem habe ich die damalige Konstante k neuerdings in ω (= gr. kleines omega)
umbenannt. Das sind lediglich neue Bezeichnungen, die Sie nicht weiter stören sollten! Machen Sie
sich jeweils klar, welches die Variable ist und wie die Funktion heisst, die davon abhängen soll.
Nutzen wir doch unsere damalige Vorarbeit aus und schreiben direkt die allgemeine Lösung auf
(vgl. (15) auf Seite 29):
x(t) = C1 sin(ωt) + C2 cos(ωt)
Unsere RBs lassen das Pendel zum Zeitpunkt t = 0 auf der Höhe x(0) = A mit Geschwindigkeit
x′ (0) = 0 starten. Daraus folgt für die fertige Lösung:
x(t) = A cos(ωt)
(40)
Diskussion der Lösung
• Feststellung: Das Resultat ist eine mathematisch exakte Sinus- resp. Cosinusschwingung. Das
an sich ist schon sehr bemerkenswert: Aus der Proportionalität des Hooke’schen Federgesetzes
– also aus einem linearen Zusammenhang! – geht die perfekte Cosinuskurve hervor.
• Die anfänglich vorgegebene Starthöhe A bleibt als Amplitude (= Höhe des Pendelausschlags)
in der Schwingung erhalten.
• Der Parameter ω heisst Kreisfrequenz. Er bestimmt, wie rasch die Schwingung abläuft, hängt
also direkt mit der Periode T resp. der Frequenz f der Schwingung zusammen:
ω=
2π
= 2πf
T
Das ermöglicht uns einen richtigen Erkenntnisgewinn zum Federpendel! Wovon hängt denn
die Schwingungsperiode T eines solchen Pendels ab? Antwort:
r
r
m
D
ω
1
2π
= 2π
resp.
f=
=
T =
ω
D
2π
2π m
42
Die Periode T ist proportional zur Wurzel der Pendelmasse m. Je mehr Masse am Pendel hängt,
umso träger ist es und umso länger wird eine ganze Schwingung eben dauern. Umgekehrt
schwingt das Pendel schneller, je härter die Feder, je grösser also die Federkonstante D ist.
Das wollen wir uns nochmals auf der Zunge zergehen lassen: Wir haben nun, ausgehend vom
Aktionsprinzip und dem Hooke’schen Federgesetz, theoretisch hergeleitet, wovon die Schwingungsfrequenz eines Federpendels abhängt – und wovon nicht! Wie viele Leute meinen z.B.,
dass die Pendelfrequenz durch die anfänglich mitgegebene Amplitude mitbestimmt wird. Dem
ist effektiv nicht so. Das Pendel schwingt bei allen Amplituden gleich schnell!
Diese Resultate lassen sich im Experiment übrigens bestens bestätigen. Natürlich kommen ein
paar Nebeneffekte hinzu:
– Die reale Pendelmasse ist etwas grösser als nur die Kugelmasse, denn ein Teil die Federmasse schwingt ja auch mit.
– Es gibt bremsende Effekte, die das Pendel nach und nach zum Stillstand bringen. Dazu
gehören z.B. der Luftwiderstand oder ev. auch die Reibung bei der Aufhängung.34 Ohne
diese bremsenden Effekte sprechen wir von einer ungedämpften Schwingung.
• Für die Geschwindigkeitsfunktion erhalten wir:
v(t) = x′ (t) = −Aω · sin(ωt) = −vmax · sin(ωt) mit
vmax = Aω
Gerne weise ich nochmals auf die Kettenregel hin: − sin(ωt) ist die äussere Ableitung von
cos(ωt). Die innere Ableitung des Cosinusargumentes ωt liefert einen zusätzlichen Faktor ω.
Ohne diesen neuen Faktor ω könnte es sich bei v(t) gar nicht um eine Geschwindigkeitsfunktion handeln: Es muss ja so sein, dass der neue Vorfaktor vmax = Aω einer Geschwindigkeit
entspricht, denn die Sinusfunktion hintendran ist dimensionslos.35 Die Amplitude A steht alleine aber erst für eine Strecke. Es muss also noch durch eine Zeit dividiert werden – und genau
dies passiert durch die Multiplikation mit ω, denn dieses besitzt die physikalische Dimension
1
Zeit . Die Kettenregel sorgt somit für die korrekte physikalische Dimension der Ableitung!
vmax = Aω steht für die maximale Geschwindigkeit, die das Pendel immer dann erreicht, wenn
es die Ruhelage x = 0 passiert.
• Der Vollständigkeit halber überprüfen wir nochmals die Richtigkeit der Lösung, indem wir ein
zweites Mal ableiten:
x′′ (t) = a(t) = v ′ (t) = −Aω 2 · cos(ωt) = −ω 2 x(t)
• Wo hat es uns nun eigentlich geholfen, dass wir x = 0 mit der Ruhelage xR identifiziert haben?
Hätten wir das nicht gemacht, so müsste unsere Lösung lauten:
x(t) = xR + A cos(ωt)
Gleichzeitig wäre die DGL inhomogen statt homogen herausgekommen:
x′′ = −ω 2 (x − xR )
Nun ist bei homogenen DGLs die Lösung in der Regel einfacher zu finden als bei inhomogenen.
Wenn man also durch das Ausnutzen einer Symmetrie das Problem auf eine homogene DGL
reduzieren kann, so ist das doch etwas Begrüssenswertes.
34
35
In den Übungen untersuchen Sie, welche Auswirkungen ein zur Geschwindigkeit proportionaler Bremseffekt hat.
Der Sinus ist schliesslich einfach eine Zahl zwischen −1 und +1.
43
Fassen wir zum Schluss dieses Beispiels nochmals das Wichtigste zusammen:
Der klassische, ungedämpfte harmonische Oszillator
Gehorcht ein Körper ausschliesslich einem Kraftgesetz, das ihn stets in Richtung
einer Ruhelage drückt und bei dem der Kraftbetrag proportional zum aktuellen
Abstand zu dieser Ruhelage ist, so sprechen wir von einem ungedämpften
harmonischen Oszillator.
Legen wir die Ruhelage in den Ursprung (x = 0), so folgt aus dem Aktionsprinzip der klassischen Mechanik die zugehörige DGL für die Ortsfunktion x(t):
x′′ = −ω 2 x
(41)
Die allgemeine Lösung ist eine harmonische Schwingung, beschrieben durch:
x(t) = A1 sin(ωt) + A2 cos(ωt)
(42)
Dabei steht ω für die Kreisfrequenz, die folgendermassen mit Periode T und
Frequenz f der Schwingung zusammenhängt:
ω=
4.4.4
2π
= 2πf
T
Gravitationsgesetz im Eindimensionalen
In Abschnitt 4.4.1 hatten wir den freien Fall eines Objektes an der Erdoberfläche betrachtet. Nun
wollen wir die Erdoberfläche verlassen. Die Gravitation FG sei aber immer noch die einzige auf das
Objekt wirkende Kraft und wir schränken seine Bewegung nach wie vor auf eine einzige Dimension
ein.
Je näher das Objekt an der Erde dran ist, umso grösser ist die Schwerkraft, mit der es von ihr
angezogen wird. Auf einer x-Achse, die gerade durch die Erde hindurchsticht und deren Nullpunkt
im Erdmittelpunkt liegt, ist das Kraftgesetz für die Erdanziehung gegeben durch das Newton’sche
Gravitationsgesetz:
GM mx
GM m x
=−
·
(43)
F (x) = −
2
x
|x|
|x|3
Dabei ist G die universelle Gravitationskonstante, M die Erdmasse und m die Körpermasse.36
x
Der Faktor |x|
sorgt, wie schon beim Luftwiderstand in Abschnitt 4.4.2, für das richtige Vorzeix
chen: Für ein x > 0 auf der positiven Ortsachse ist − |x|
= −1 und die Gewichtskraft zeigt in die
x
negative Richtung. Für ein x < 0 auf der negativen Ortsachse ist − |x|
= +1 und die Gewichtskraft
zeigt in die positive Richtung. Das ist genau richtig so, denn der Erdmittelpunkt soll ja eben bei
x = 0 sitzen.
m
steht für den Betrag der gravitativen Kraft F am Ort x, also für ihre Stärke.
Der Bruch GM
x2
x
Daneben sorgt der Faktor − |x|
für die richtige Richtung von F : Die Kraft F zeigt in die negative
Richtung für alle x > 0 und in die positive Richtung für alle x > 0.
Ganz rechts in (43) steht schliesslich die Zusammenfassung zu einem einzigen Bruch.37
2
G = 6.673 · 10−11 N·m
, M = 5.97 · 1024 kg und R = 6370 km.
kg2
37
Dabei bemerke man, dass für reelle Zahlen x stets gilt: x2 = |x|2 .
36
44
Abbildung 20: Der Verlauf der Gravitation in Abhängigkeit von der Distanz zum Erdmittelpunkt.
Innerhalb der Erde ist das Kraftgesetz proportional zu x, ausserhalb proportional zu x12 . Die Kraftangaben beziehen sich auf einen Körper der Masse 1 kg.
Das Kraftgesetz (43) gilt so allerdings nur für |x| ≥ R (= Erdradius), also für Orte x ausserhalb
der Erde. Dort nimmt die Anziehungskraft proportional zu x12 ab. Im Erdinneren gilt hingegen ein
anderes Gravitationsgesetz:
GM mx
F (x) = −
(44)
R3
Bereits Newton kannte dieses Kraftgesetz im Erdinneren. Man erhält es aus der Annahme, dass die
Erde ein homogener Planet ist, dass also ihre Dichte überall gleich gross ist.
Die Anziehungskraft im Erdinneren ist gemäss (44) proportional zur Distanz zum Erdmittelpunkt.
Im Erdmittelpunkt ist sie gleich Null, denn dort wird man von der Erde von allen Seiten her gravitativ
gleich stark angezogen, sodass sich alle diese Kräfte gegenseitig aufheben.
Abb. 20 zeigt den Verlauf der gravitativen Anziehung innerhalb und ausserhalb der Erde. Zusammengefasst kann man dafür nun auch schreiben:

GM m

für x < −R

x2

GM mx
F (x) =
für − R < x < R
− R3


 − GM m
für x > R
x2
Ausserhalb der Erde lautet nun das 2. Newton’sche Axiom für die Bewegung eines Körpers unter
dem ausschliesslichen Einfluss der Gravitation:
mx′′ = F (x) = −
GM mx
|x|3
Aus Symmetriegründen reicht es den Bereich x ≥ R zu betrachten. Dann ist |x| = x und es kürzt
sich neben m zudem ein x aus der Gleichung, sodass folgt:
x′′ = −
GM
x2
Dies ist eine nicht-lineare DGL 2. Ordnung. Sie muss mitunter beschreiben, wie die Bewegung
eines Körpers verläuft, den wir aus sehr grosser Höhe auf die Erde fallen lassen. Auf eine nähere
Lösungsbetrachtung verzichten wir aber an dieser Stelle.
45
Abbildung 21: Angenommen, wir könnten einen geraden Tunnel vom Nord- zum Südpol der Erde
graben, ihn evakuieren und würden anschliessend auf der einen Seite einen Stein hineinfallen lassen
(RBs: x(0) = R und x′ (0) = 0). Wie würde sich dieser Stein bewegen? Womit wäre die Bewegung
vergleichbar?
Analog führt uns das 2. Newton’sche Axiom innerhalb der Erde auf die DGL:
x′′ = −ω 2 x
mit
ω2 =
GM
R3
Diese DGL und ihre Lösung kennen wir bereits (vgl. Seite 44). Was für eine tolle Antwort folgt
daraus für die in Abb. 21 gezeigte Situation? Die Antwort steht in der Fussnote.38
4.4.5
Beispiel für eine explizit von der Zeit abhängige Kraft
Bei allen bisherigen Beispielen war das Kraftgesetz nur vom Ort x und/oder der Geschwindigkeit x′
des Körpers abhängig: F = F (x, x′ ) – oder die Kraft war konstant. Nun möchten wir auch noch ein
Beispiel untersuchen, bei dem das Kraftgesetz eine explizite Zeitabhängigkeit aufweist.
Zur Verdeutlichung: Bei einer von x oder x′ abhängigen Kraft berechnet sich die Kraft aus der
Angabe des aktuellen Ortes x und der aktuellen Geschwindigkeit x′ des Körpers, und zwar
unabhängig davon, wie sich diese beiden Grössen weiterentwickeln. Natürlich hängen x und x′
selber von der Zeit ab, sie entwickeln sich ja eben. Aber diese indirekte Zeitabhängigkeit ist
nicht gemeint, wenn ein Kraftgesetz explizit von der Zeit t abhängt.
Eine explizite Zeitabhängigkeit bedeutet vielmehr, dass sich die Kraft verändern kann, auch
wenn der Ort x oder die Geschwindigkeit x′ des Körpers gleich bleiben. Im Kraftgesetz muss
der Zeitpunkt t daher als eigenständige Variable auftreten. Damit Sie klar verstehen, was das
heisst, folgt hier ein Beispiel, bei dem das Kraftgesetz ausschliesslich von der Zeit t abhängt:
F = F (t).
38
Klar! Der Stein schwingt zwischen dem Nord- und dem Südpol hin und her, genau so, wie ein Federpendel auf
und ab schwingt (vgl. Kasten auf Seite 44). Konkret würde die Lösung lauten:
x(t) = R · cos(ωt)
In den Übungen können Sie berechnen, wie lange eine Periode dieser “Steinschwingung” dauern würde.
46
Abbildung 22: Einschuss eines Elektrons ins elektrische Wechselfeld eines Plattenkondensators.
Elektron im Plattenkondensator (vgl. Abb. 22): Wir betrachten ein Elektron, das zum Zeitpunkt t = 0 durch ein kleines Löchlein in der linken Platte in den Innenraum eines Plattenkondensators eingeschossen wird. Die linke Platte sitzt am Ort x = 0 und somit ist auch
der Startort des Elektron x(0) = 0. Seine fängliche Geschwindigkeit betrage x′ (0) = v0 . Die
Ladungen der Kondensatorplatten werden andauernd verändert, sodass sich auch das homogene39 elektrische Feld E dazwischen ständig verändert. Es gelte:
E = E(t) = Emax · cos(ωt)
Es handelt sich somit um ein Wechselfeld mit maximaler Feldstärke Emax (= Amplitude)
und Kreisfrequenz ω. Beim Eintritt des Elektrons ins Feld (Zeitpunkt t = 0) zeigt das E-Feld
gerade maximal in die positive Richtung – dafür sorgt die Cosinusfunktion (cos 0 = +1).
Die elektrische Kraft auf das Elektron: In diesem elektischen Feld erfährt das negativ geladene
Elektron (Ladung −e = −1.602·10−19 C) eine elektrische Kraft Fel , die stets entgegengesetzt
zum elektrischen Feld steht:
Fel = Fel (t) = −eE(t) = −eEmax · cos(ωt)
Abgesehen von dieser elektrischen Kraft gibt es keine weiteren Kräfte.40 Fel hängt offensichtlich
nur von der Zeit t ab. Der Ort x und die Geschwindigkeit x′ des Elektrons haben darauf keinen
Einfluss.
Die Aktionsprinzip-DGL: Mit dem 2. Newton’schen Axiom erhalten wir die DGL mit Anfangsbedingungen:
mx′′ = −eEmax · cos(ωt)
mit RBs: x(0) = 0 und
x′ (0) = v0
Zur Lösung stellen wir zuerst ein wenig um und vereinfachen durch das Zusammennehmen
mehrerer Konstanten zu einer einzigen:
eEmax
· cos(ωt) = −α · cos(ωt)
m
Damit ist die Sache übersichtlicher geworden.
x′′ = −
mit
α≡
eEmax
m
39
Homogen bedeutet, das E-Feld ist an allen Orten im Plattenkondensator gleich stark und gleich gerichtet. Homogen
bedeutet hingegen nicht, dass das E-Feld zeitlich konstant ist. Es soll sich ja eben um ein Wechselfeld handeln.
40
Der Innenraum des Plattenkondensators sei evakuiert und im Vergleich zur elektrischen Kraft ist die Gewichtskraft
aufgrund der geringen Elektronenmasse verschwindend klein und somit ohne messbaren Fehler vernachlässigbar.
47
Lösung: Da in x′′ = −α cos(ωt) die Ortsfunktion x und ihre Ableitung x′ rechts gar nicht vorkommen, erhalten wir die Lösung, indem wir zweimal integrieren (vgl. Abschnitt 4.2):41
v(t) = x′ (t) = v0 +
Z
0
t
x′′ (τ ) dτ = v0 − α
Z
t
cos(ωτ ) dτ
(45)
0
R
Doch halt! Diese Integration will wohl überlegt sein. Wir wissen zwar, dass cos x dx =
sin x + C ist, aber wie sieht es aus, wenn im Argument des Cosinus noch ein Vorfaktor ω ∈ R
steht? Das Stichwort lautet Reskalierungs-Trick (vgl. 2.4.3). Damit folgt:
Z t
Z
α ωt
α
cos(ωτ ) dτ = v0 −
v(t) = v0 − α
(46)
cos y dy = v0 − sin(ωt)
ω 0
ω
0
Nun integrieren wir noch ein zweites Mal, um x(t) zu erhalten:
Z t
α
v0 − · sin(ωτ ) dτ
v(τ ) dτ = x0 +
x(t) = x0 +
ω
0
0
i
h
α
α
α
t
= x0 + v0 τ + 2 · cos(ωτ ) = x0 + v0 t + 2 · cos(ωt) − 2
ω
ω
ω
0
Z
t
Mit dem Einbau der Ortsrandbedingung x0 = x(0) = 0 folgt schliesslich:
x(t) = v0 t +
α
·
cos(ωt)
−
1
ω2
Das −1 in der Klammer sorgt dafür, dass der Startort auch tatsächlich x(0) = 0 ist, denn
cos 0 = 1.
Das Elektron vollführt nun also eine Bewegung, die aus der Summe einer linearen und einer
Cosinusfunktion besteht. Das ergibt beispielsweise eine Ortsfunktion, wie sie in Abb. 23 gezeigt
wird.
Abbildung 23: Im Prinzip mögliche Ortsfunktion x(t) für das Elektron im Plattenkondensator.
41
Beachten Sie wieder: Die Zeit t der oberen Integrationsgrenze ist der Zeitpunkt, bis zu dem integriert wird. Die
Laufvariable τ unter dem Integral steht für die Zeitpunkte von 0 bis t. Deshalb unterscheiden wir sie vom Endzeitpunkt
t mittels eines griechischen t’s, eben einem tau τ .
48
4.5
4.5.1
Konservative Kräfte, Aktionsprinzip und Energieerhaltung
Das Potenzial V (x, t) – ein allgemeinerer Blick auf die potenzielle Energie
In der 1. Klasse bezog sich der Begriff der potenziellen Energie Epot ausschliesslich auf die Gravitation.42 Dieses Verständnis wollen wir nun etwas erweitern.
Grundsätzlich verstehen wir jede Energie der Lage als eine potenzielle Energie V . Je nachdem,
wo sich der Körper gerade aufhält, besitzt er mehr oder weniger potenzielle Energie: V = V (x).
Diese Energiefunktion V (x) wird oft einfach als Potenzial bezeichnet.
Die folgenden Gedankengänge sollen aufzeigen, wie wir zu den Gleichungen verschiedener Potenziale V (x) gelangen und weshalb wir dabei zwischen konservativen und dissipativen Kräften
unterscheiden müssen.
“Energieumsatz = Verschiebungsarbeit”: Wird ein Körper entgegengesetzt zu einer Kraft F
bewegt, so muss man dafür Arbeit an ihm verrichten resp. die Energie ∆E aufwenden. Typische
Beispiele sind:
–
–
–
–
–
Anheben eines Buchs gegen die Gewichtskraft FG .
Verschieben eines Schranks gegen die Reibungskraft FR .
Dehnen einer Feder gegen die Federkraft FF .
Bewegung gegen den Luftwiderstand FL .
Verschieben einer el. Ladung gegen die el. Kraft Fel in einem homogenen E-Feld.
Nicht interessieren soll uns, woher oder von wem der für diese Bewegung notwendige Energieumsatz ∆E kommt resp. aufgebracht wird. Der Arbeitsdefinition folgend – “Arbeit ist
Kraft mal Weg” – notieren wir für den Energieumsatz ∆E in differenzieller Form (∆E → dE):
dE = −F (x) · dx
dE ist der infinitesimale Energieumsatz, der aufgewendet werden muss, um den Körper um
das infinitesimale Wegstück dx gegen die Kraft F (x) zu bewegen. F (x) und dx sind
gegeneinander gerichtet, sodass ihr Produkt F (x) dx eine negative Zahl ergibt. Wir möchten
aber, dass der dem Körper zugeführte Energieumsatz positiv herauskommt und fügen deshalb
ein Minuszeichen ein.43
Speicherung des Energieumsatzes und Berechnung des Potenzials V (x): Wie gerade erläutert, muss zur Bewegung des Körpers gegen die Kraft F Verschiebungsarbeit verrichtet werden.
Dieser investierte Energieumsatz ist nicht einfach verpufft, sondern er steckt anschliessend
in einer anderen Energieform. Das Potenzial V (x) eines Körpers am Ort x entspricht dem
Energieumsatz, den wir investieren mussten, um den Körper an diesen Ort zu bringen. Von
wo aus? Von einem frei wählbaren Nullniveau x0 aus, an dem die potenzielle Energie eben
gleich Null sein soll: V (x0 ) = 0.
Zur Berechnung des Potenzials V (x) müssen somit die infinitesimalen Arbeitsbeträge dE über
die Strecke vom Nullniveau x0 bis zum Ort x aufaddiert werden. D.h., es wird integriert:44
Z x
V (x) = ∆E = −
F (ξ) dξ
(47)
x0
42
Gravitative Epot : Je weiter oben ein Körper ist, umso mehr potenzielle Energie hat er, weil der dann weiter fallen
kann, mehr Arbeit verrichten kann, “gefährlicher” ist, . . .
43
~ (~r) · d~r. Es wird also das Skalarprodukt von Kraftvektor
Im Dreidimensionalen müsste man schreiben: dE = −F
~
F (~r) und infinitesimalem Verschiebungsvektor ~r gebildet. Die Aussage bleibt allerdings die gleiche: Dieses Skalarprodukt
~ (~r) und ~r “eher” einander entgegengerichtet sind (Zwischenwinkel ϕ > 90◦ ).
generiert ein negatives Vorzeichen, wenn F
Genau dann soll aber der Energieumsatz positiv sein, und so braucht es wiederum ein Minuszeichen.
44
Für die örtliche Laufvariable unter dem Integral verwenden wir zur Unterscheidung von der oberen Integrationsgrenze x den griechischen Kleinbuchstaben ξ (xi).
49
Abbildung 24: Egal, über welchen Weg man das Potenzial V (~r) vom Nullniveau bei ~r0 aus berechnet,
das Resultat muss dasselbe ergeben, wenn es sich um ein “vernünftiges” Potenzial handeln soll.
Wegunabhängigkeit, konservative und dissipative Kräfte: Die Berechnung von V (x) in (47)
müssen wir durch eine essentielle Forderung ergänzen: Das Resultat muss wegunabhängig
sein! D.h., der Wert resp. die Berechnungsformel für V (x) darf nicht plötzlich anders herauskommen, wenn ich den Körper über einen anderen Pfad oder mit anderer Geschwindigkeit
von x0 nach x bewege. Für jedes x darf es nur einen ganz bestimmten Wert V (x) geben!
Ansonsten wäre der Begriff einer “Energie der Lage” resp. “des Ortes” eher unsinnig.
Im eindimensionalen Fall ist vielleicht noch nicht so klar, wo das Problem liegt. Abb. 24 zeigt
besser, worum es geht: Egal, entlang welchem der drei Wege von Nullniveau ~r0 bis zum Ort ~r
die Arbeit aufsummiert resp. das Potenzial berechnet wird, es muss immer dasselbe, eindeutige
Resultat V (~r) herauskommen. Diese Forderung wird nicht von jedem beliebigen Kraftgesetz
F (x) erfüllt. Nur bestimmte Kraftarten erlauben die Definition eines Potenzials V (x) gemäss
(47). Wir nennen diese Kräfte konservativ, andernfalls sprechen wir von dissipativen Kräften.
Betrachten wir zur Verdeutlichung unsere fünf Beispiele von weiter oben:
– Anheben eines Buchs gegen die Gewichtskraft FG .
Die Gewichtskraft ist das Paradebeispiel einer konservativen Kraft. Die verrichtete Hubarbeit ist anschliessend in Form von potenzieller Energie in der Höhenlage des Gegenstandes
gespeichert. Sie ist komplett wieder abruf- und verfügbar. So haben wir es in der 1. Klasse
gelernt und so soll es weiterhin gelten.45
– Verschieben eines Schranks gegen die Reibungskraft FR .
Wähle ich für die Verschiebung des Schranks nicht den geraden, sondern einen längeren
Weg, so muss mehr Reibungsarbeit verrichtet werden.46 FR ist also dissipativ.
Ein zweiter Punkt ist, dass die Reibungskraft den Energieumsatz in innere Energie umwandelt (Erwärmung an der Reibungsfläche). Diese Energie steht anschliessend gar nicht
mehr zur Verfügung. Sie verteilt sich und kann nicht einfach zurückgewonnen werden.
Keinesfalls verfügt der am Ort x angekommene Schrank über diese Energie. Genau in
diesem Sinn sind alle Arten von Reibungskräften ganz unbedingt dissipative Kräfte!47
45
Lat. conservare = bewahren, erhalten, (retten, schonen).
Auch im eindimensionalen Fall könnte es mir übrigens einfallen, den Schrank vorwärts, dann rückwärts und dann
wieder vorwärts zu bewegen und so einen längeren Verschiebungsweg zu erzeugen.
47
Lat. dissipare = verschwenden, zerstreuen.
46
50
– Dehnen einer Feder gegen die Federkraft FF .
Je nach Dehnung der Feder hat sie mehr oder weniger Federenergie gespeichert. Die
Federkraft ist ein zweites Beispiel einer ganz typischen konservativen Kraft.
– Bewegung gegen den Luftwiderstand FL .
Würde ich den Körper auf demselben Weg sehr langsam verschieben, so würde sich
für den Luftwiderstand ein deutlich anderer Betrag ergeben als bei einer sehr grossen
Geschwindigkeit. V (x) wäre also nicht eindeutig. Neben diesem weiteren Argument ist
der Luftwiderstand ja auch wieder eine Art der Reibung und somit ganz klar dissipativ.
– Verschieben einer el. Ladung gegen die el. Kraft Fel in einem homogenen E-Feld.
Je nach Ort im homogenen E-Feld besitzt eine elektrische Ladung mehr oder weniger
potenzielle elektrische Energie. Auch dies ist ein klassisches Beispiel einer konservativen
Kraft.
Zeitabhängige Potenziale: Schliessliche können Potenziale zeitabhängig sein: V = V (x, t). Die
Berechnung erfolgt dann immer noch nach (47), aber einfach zu einem ganz bestimmten
Zeitpunkt t:
Z
x
V (x, t) = −
F (ξ, t) dξ
(48)
x0
Wir werden aber kaum zeitabhängige Potenziale betrachten.
In (48) wird örtlich über die Kraft F (x, t) integriert, um V (x, t) zu erhalten. Das bedeutet aber
umgekehrt, dass F (x, t) die negative partielle Ableitung des Potenzials V (x, t) nach dem Ort x sein
muss:
∂V (x, t)
F (x, t) = −
∂x
Nur der Klarheit halber schreibe ich die Variablen x und t zur Potenzialfunktion V hinzu. Im Prinzip kann man immer selber entscheiden, ob man das will oder nicht. Hauptsache, es wird genau
verstanden, was gemeint ist resp. man weiss immer, von welchen Variablen eine Funktion abhängt.
Nach dieser Folgerung können wir nun, von der Potenzialseite her kommend, sauberer definieren,
was unter einer konservativen Kraft zu verstehen ist:
Definition konservativer und dissipativer Kräfte
Eine Kraft F (x, t) heisst konservativ, wenn es ein überall auf dem Definitionsbereich nach dem Ort x differenzierbares (= ableitbares) Potenzial
V = V (x, t) gibt, sodass:
F (x, t) = −
∂V
∂x
(49)
Zu einer bestimmten konservativen Kraft F (x, t) existieren mehrere Potenziale, die sich allerdings lediglich durch eine additive Konstante, also durch
eine unterschiedliche Wahl des Nullniveaus unterscheiden.
Nicht-konservative Kräfte nennen wir dissipativ.
51
4.5.2
Beispiele von Potenzialen und zugehörigen konservativen Kräften
Damit Sie sehen, was mit Gleichung (49) effektiv gemeint ist, folgen nun ein paar Potenzial-Beispiele
zu Ihnen bereits bekannten konservativen Kraftgesetzen.
• Potenzial zum konstanten, homogenen Gravitationsfeld (vgl. Abschnitt 4.4.1): Ein
Körper der Masse m besitzt in einem homogenen Gravitationsfeld mit Stärke g auf der Höhe
x – ehemals h – gegenüber dem Nullniveau bei x = 0 die potenzielle gravitative Energie:
V (x) = mgx
⇒
F =−
dV
= −mg = const.
dx
• Gravitationspotenzial eines Himmelkörpers (vgl. Abschnitt 4.4.4): Ein Körper der Masse m besitzt im Gravitationsfeld eines Himmelkörpers der Masse M , der bei x = 0 seinen
Mittelpunkt hat, die potenzielle gravitative Energie:
V (x) = −
GM m
x
⇒
F (x) = −
dV
GM m
=−
dx
x2
Dabei ist G die universelle Gravitationskonstante. Das Nullniveau wurde ins Unendliche gelegt:
limx→∞ V (x) = 0. (Ich habe hier nur den Fall x > 0 betrachtet.)
• Potenzial des harmonischen Oszillators (vgl. Abschnitt 4.4.3): Wird ein Körper durch
eine dem Hooke’schen Federgesetz (35) gehorchenden Kraft zu einer Ruhelage zurückgetrieben
und legen wir das Nullniveau in diese Ruhelage (x = 0), so beträgt die potenzielle elastische
Energie:
Dx2
dV
V (x) =
⇒
F (x) = −
= −Dx
(50)
2
dx
Dabei ist D die Federkonstante des elastischen Gegenstandes.
• Potenzial zum homogenen elektrischen Feld (vgl. Abschnitt 4.4.5): Ein Körper mit
elektrischer Ladung q besitzt in einem homogenen elektrischen Feld mit Stärke E am Ort x
gegenüber dem Nullniveau bei x = 0 die potenzielle elektrische Energie:
V (x, t) = −qEx
⇒
F (t) = −
∂V
= qE
∂x
Potenziale können auch zeitabhängig sein: V (x, t). Nur so entstehen zeitlich nicht konstante,
konservative Kräfte.
Z.B. kann die Feldstärke E zeitlich variieren, wie im Plattenkondensator-Beispiel in Abschnitt
4.4.5 mit E = Emax · cos(ωt). Damit wäre das Potenzial V explizit zeitabhängig: V = V (x, t).
Und für die Kraft ergäbe sich für ein Elektron (q = −e) die in Abschnitt 4.4.5 betrachtete
Zeitabhängigkeit: F = F (t) = −eEmax · cos(ωt).
• Potenzial einer elektrischen Punktladung: Ein Körper mit elektrischer Ladung q besitzt im
elektrischen Feld einer deutlich grösseren Punktladung Q, die bei x = 0 sitzt, die potenzielle
elektrische Energie:
V (x) =
1
Qq
·
4πε0 x
⇒
F (x) = −
dV
1
Qq
=
· 2
dx
4πε0 x
Dabei ist ε0 die elektrische Feldkonstante.48 Auch bei dieser potenziellen Energie wurde das
Nullniveau ins Unendliche gelegt: limx→∞ V (x) = 0.
48
ε0 = 8.854 · 10−12
C2
.
N·m2
52
4.5.3
Energieerhaltung – das Aktionsprinzip mit konservativen Kräften
Wir wollen uns nun einschränken auf Bewegungen, die alleine durch konservative Kräfte gesteuert
werden. Dann können wir im Aktionsprinzip (30) die Kraft F (x, t) durch die negative partielle
Ableitung des zugehörigen Potenzials V (x, t) nach dem Ort x ersetzen und es ergibt sich:
−
d2 x
∂V
=m 2
∂x
dt
(51)
2
Dabei habe ich die Beschleunigung x′′ nun wieder in der differenziellen Schreibweise x′′ (t) = ddt2x
notiert, um klar zu zeigen, dass rechts eine zweifache Ableitung nach der Zeit t und links eine
einfache Ableitung nach dem Ort x steht.
Plötzlich ist die Bewegung eines Körpers, also seine Ortsfunktion x(t) in Verbindung gebracht mit
der vom Ort und der Zeit abhängigen potenziellen Energiefunktion V (x, t). Das ist sehr interessant.
Spüren wir diesem Zusammenhang noch etwas weiter nach, indem wir einen Vorgang betrachten,
bei dem ein Körper – gesteuert durch eine rein konservative Kraft – zum Zeitpunkt t1 bei einem Ort
x1 vorbeikommt und zum Zeitpunkt t2 am Ort x2 . Nun integrieren wir örtlich über beide Seiten des
Aktionsprinzips (51):
Z x2
Z x2
d2 x
∂V
m 2 dx
dx =
(52)
−
dt
x1
x1 ∂x
Auf der linken Seite ergibt sich offensichtlich der Energieunterschied in der potenziellen Energie
zwischen dem Ort x2 und dem Ort x1 :49
Z x2
x2
∂V
dx = −V (x) = − V (x2 ) − V (x1 ) = −∆V
−
x1
x1 ∂x
Und was macht dieser Unterschied in der potenziellen Energie, der passiert, während der Körper von
x1 nach x2 geht? Gleichung (51) besagt, dass eine Beschleunigung entsteht, wenn sich der Wert
der potenziellen Energie verändert. Was bedeutet dies energetisch ausgedrückt? Es muss sich eine
Veränderung der kinetischen Energie ergeben!
Schauen wir mal, was wir mit unserer Integraltechnik rausbekommen. Zunächst substituieren wir
unter Hinzuziehung der Geschwindigkeitsdefinition x durch v:
v=
dx
dt
⇒
Damit und mit der weiteren Substitution dt =
Z
x2
x1
d2 x
m 2 dx =
dt
=
d2 x
d dx
dv
=
=
2
dt
dt dt
dt
dx = v dt und
Z
t2
t1
dv folgt:
dv
m
v dt =
dt
mv22
2
dt
dv
−
mv12
2
Z
v2
v1
mv 2 v2
mv dv =
2
v1
= T2 − T1 = ∆T
2
Dabei sind v1 und v2 die Geschwindigkeiten bei (t1 , x1 ) resp. (t2 , x2 ). T = mv
ist gerade die
2
kinetische Energie, die eine Masse m innehat, wenn sie mit der Geschwindigkeit v unterwegs ist.50
Die rechte Seite von (52) ist damit gleich dem Unterschied der kinetischen Energie ∆T .
Betrachten wir nun die integrierte Form von (51) insgesamt, so folgt schliesslich, dass:
−∆V = ∆T
resp.
49
∆V + ∆T = 0
Der Übersichtlichkeit halber wollen wir von einem zeitunabhängigen Potenzial ausgehen: V = V (x).
In der theoretischen Physik ist es üblich, die kinetische Energie mit dem Symbol T abzukürzen, so wie die potenzielle
Energie mit V abgekürzt wird.
50
53
Was haben wir hier entdeckt? Nichts anderes als die Energieerhaltung! Verändert sich die
potenzielle Energie V eines Körpers, so ändert sich ebenso seine kinetische Energie T . Nimmt V ab
(∆V < 0), so nimmt dafür T um denselben Betrag zu (∆T > 0), und umgekehrt. Die Summe beider
Veränderungen (inkl. Vorzeichen!) ist Null. D.h. die Gesamtenergie E des Körpers bleibt erhalten:
E = V + T = const.
Das ist fantastisch! Damit haben wir tatsächlich einen tiefgründigeren Zusammenhang der klassischen Mechanik entdeckt, der unter Voraussetzung konservativer Kräfte direkt aus dem Aktionsprinzip folgt:
Energieerhaltung in der klassischen Mechanik
Die mechanische Gesamtenergie E eines Körpers bleibt genau dann erhalten, wenn er ausschliesslich unter dem Einfluss konservativer Kräfte steht,
sich also das Kraftgesetz F (x, t) als Ableitung eines Potenzials V (x, t)
schreiben lässt:
E = V + T = const.
⇔
F (x, t) = −
∂V
∂x
(53)
Endlich verstehen wir, weshalb konservative Kräfte so genannt werden.51 Was wird denn durch solche
Kräfte konserviert? Eben die Gesamtenergie E! Konservative Kräfte sind genau diejenigen Kräfte,
unter deren Wirkung die Gesamtenergie eines Körpers (oder eines Systems von Körpern) erhalten
bleibt! Was für ein schönes Resultat!
Im Gegensatz dazu geht durch dissipative52 Kräfte Energie verloren, d.h. sie geht durch Reibung
in innere Energie über und ist somit makroskopisch nicht mehr als potenzielle oder kinetische Energie
vorhanden.
Da es Reibung auf Ebene der kleinsten Teilchen, also in der Quantenwelt gar nicht gibt, haben
wir es dort nur mit konservativen Kräften zu tun.53 Alle Vorgänge resp. Zustände hängen somit von
Potenzialen V (x, t) ab, die charakteristisch für das jeweilige Problem sind. Das Kraftkonzept im
Sinne Newtons wird nicht mehr gebraucht. Natürlich werden wir noch sehen müssen, wie es in der
Quantenmechanik um die Energieerhaltung steht. . .
51
Lat. conservare = bewahren, erhalten, (retten, schonen).
Lat. dissipare = verschwenden, zerstreuen.
53
Es gibt zwar eine Ausnahme zu dieser Regel, aber damit werden wir uns nicht beschäftigen.
52
54
4.6
Repetition/Ergänzung: Der klassische, ungedämpfte harmonische Oszillator
Kehren wir zum Abschluss des Kapitels nochmals zum klassischen harmonischen Oszillator zurück.
Er sei ungedämpft, d.h., die Bewegung laufe reibungsfrei ab. Es gibt also ein Potenzial V (x), dessen
negative Ableitung nach dem Ort das konservative Kraftgesetz F (x) liefert (vgl. Seite 52):
V (x) =
Dx2
2
⇒
F (x) = −
dV
= −Dx
dx
Dabei liegen der örtliche Nullpunkt und das Nullniveau bei der Ruhelage des Oszillators.
Die Lösung der zugehörigen DGL für die Ortsfunktion x(t) mit RBs x(0) = A und x′ (0) = 0
kennen wir auch schon (vgl. Seiten 42ff):
r
D
d2 x
2
= −ω x
⇒
x(t) = A cos(ωt)
mit ω =
2
dt
m
Zur Übersicht nochmals kurz die Bedeutungen der auftauchenden Grössen:
ω = Kreisfrequenz der Schwingung
D = Federkonstante = Stärke der Feder (beim Federpendel)
m = schwingende Masse des Oszillators
A = Amplitude = maximaler Ausschlag des Oszillators aus der Ruhelage
4.6.1
Zwei wichtige Eigenschaften des klassischen harmonischen Oszillators
An dieser Stelle ist es wichtig auf zwei Eigenschaften des klassischen harmonischen Oszillators hinzuweisen, die beim quantenmechanischen harmonischen Oszillator radikal anders aussehen werden!
Diese drastischen Unterschiede gibt es übrigens nicht nur beim harmonischen Oszillator. Vielmehr
sind sie ganz typisch für die Diskrepanz zwischen klassischer Mechanik und Quantenmechanik. Der
harmonische Oszillator ist einfach ein besonders schönes und wichtiges Beispiel.
Kontinuierliches Energiespektrum: Das einfachste reale Beispiel des harmonischen Oszillators ist
das Federpendel. Diesem führen wir zu Beginn die Energie E zu, indem wir es von Hand um
A aus der Ruhelage auslenken und anschliessend loslassen. E berechnet sich wegen x′ (0) = 0
resp. T (t = 0) = 0 direkt aus dem Potenzial am Ort x(0) = A:
E = V (A) =
DA2
2
(54)
Im konservativen System bleibt diese anfänglich hinein gegebene Energie erhalten.54 Sie hängt
einzig von der anfänglichen Auslenkung A ab, denn D ist eine vom System vorgegebene
Konstante. Das bedeutet, der klassische harmonische Oszillator lässt prinzipiell beliebige Energiewerte E > 0 zu, weil sich die Anfangsauslenkung A frei wählen lässt. Mit “beliebig” meine
ich, dass es keine unerlaubten Energiewerte gibt.55 Wir sagen:
Das Energiespektrum des klassischen harmonischen Oszillators ist kontinuierlich.
Das scheint im Moment vielleicht trivial, aber punkto Energiespektrum werden wir beim quantenmechanischen harmonischen Oszillator wirklich ein fundamental anderes Ergebnis erhalten!
54
Klar: Beim realen Federpendel nimmt die Pendelenergie aufgrund geringer Reibungseffekte langsam ab, bis das
Pendel wieder stillsteht. Wir sprechen dann von einem gedämpften harmonischen Oszillator.
55
Natürlich kann ein reales Federpendel aufgrund der begrenzten Dehnbarkeit der Feder nicht beliebig grosse Energien
aufnehmen. Aber wenn Emax die maximal mögliche vom Pendelenergie bezeichnet, so sind zwischen 0 und Emax eben
alle Energiewerte möglich.
55
Klassisch erlaubter/verbotener Bereich: Sobald mit der Anfangsauslenkung A ein bestimmter
Energieinhalt E vorgegeben ist, ist auch klar, an welchen Orten x der harmonische Oszillator
während seiner Bewegung vorbeikommt. Alle Orte |x| ≤ A werden erreicht, sie sind für den
klassischen harmonischen Oszillator erlaubt. Alle Orte |x| > A werden nicht erreicht, sie sind
verboten. Begründung: An einem erlaubten Ort x ist die Energie E grösser oder gleich wie
das dortige Potenzial V (x). An einem Ort x im verbotenen Gebiet wäre E geringer als V (x):
Klassisch erlaubtes Gebiet = Menge aller Orte x mit E ≥ V (x)
Klassisch verbotenes Gebiet = Menge aller Orte x mit E < V (x)
Die potenzielle Energie V (x) kann in der klassischen Mechanik zu keinem Zeitpunkt grösser
sein als die Gesamtenergie E – und so ergeben sich eben erlaubte und verbotene Gebiete. Abb.
25 veranschaulicht den Sachverhalt für den harmonischen Oszillator.
Abbildung 25: Erlaubte und verbotene Gebiete beim klassischen harmonischen Oszillator: Über jedem
Ort x auf der horizontalen Achse ist die jeweilige potenzielle Energie V (x) aufgetragen. Dies ist eine
2
Parabel mit Scheitelpunkt im Ursprung (V (x) = ax2 mit a = mω
2 ). Bei vorgegebener Energie E
sind nur Orte x erlaubt, für die E ≥ V (x) ist, die also im Intervall [−A, A] liegen.
Zusatzbemerkung: Rechts von x = 0 steigt V (x) an. Dort ist also dV
dx > 0. Das bedeutet, V (x)
wird dort grösser, wenn ich mit x in die positive Richtung gehe.
Allgemein: Das Vorzeichen einer Ableitung f ′ (x) gibt stets die Richtung an, in die man von der
Stelle x aus zu gehen hat, damit f (x) grösser wird. Das ist eine Art neues Ableitungsverständnis!
Eine konservative Kraft F = − dV
dx zeigt somit stets in die x-Richtung, in die das Potenzial V (x)
kleiner wird ⇒ Konservative Kräfte “möchten” die potenzielle Energie verkleinern.
Ganz zum Schluss wollen wir das Potenzial des klassischen harmonischen Oszillators noch etwas anders aufschreiben, nämlich so, wie wir es später beim quantenmechanischen harmonischen Oszillator
wieder notieren werden. Mit D = mω 2 folgt aus (50):
mω 2 x2
Dx2
=
(55)
2
2
Das Gute an dieser Schreibweise ist, dass man ohne Federkonstante D auskommt. Stattdessen
fliessen die Masse m und die Kreisfrequenz ω als Konstanten ins Potenzial V (x) mit ein.56
V (x) =
56
Zur Erinnerung: In der Kreisfrequenz ω stecken Frequenz f und Periode T , denn es gilt stets: ω = 2πf =
56
2π
.
T
5
Komplexe Zahlen C
Die sogenannten komplexen Zahlen C sind eine Erweiterung die reellen Zahlen R zu einer zweidimensionalen Zahlenmenge. Die entscheidende Idee hinter dem Wort Erweiterung ist, dass zwar
der Zahlenraum grösser gemacht wird, dass dabei aber die Rechenregeln für den Umgang mit den
Zahlen genau gleich bleiben sollen! Umgekehrt lassen sich die reellen Zahlen R als Einschränkung
der komplexen Zahlen C auf eine einzige Dimension auffassen, wobei ebenfalls die Rechenregeln
erhalten bleiben.
Was mit dieser zweidimensionalen Zahlenmenge und diesen Rechenregeln genau gemeint ist,
werden Sie in Kürze erfahren. Entscheidend ist, dass sich mit den komplexen Zahlen viele Problemstellungen und Rechnungen sehr elegant formulieren und lösen lassen. In der Mathematik erlauben sie
in vielen Fällen eine einheitlichere Darstellung und führen oftmals zu vollständigeren Lösungsmengen,
über die sich dann auch “schönere” Aussagen machen lassen als in der bisherigen Einschränkung
auf reelle Zahlen.
Für uns am wichtigsten ist aber dies: Die Mathematik der Quantenmechanik wäre um ein Vielfaches mühsamer und unübersichtlicher, wenn wir uns dafür nicht der komplexen Zahlen bedienen
würden. Im Prinzip liesse sich zwar alles mit reellen Zahlen handhaben – denn die von der Quantenmechanik vorausgesagten Messwerte sind, wie alle physikalischen Messgrössen, eben reell – die
daraus hervorgehenden Gleichungen wären aber derart umständlich, dass wir uns darin nur mit einem
sehr grossen Mehraufwand zurechtfinden würden. Durch Verwendung der komplexen Zahlen gewinnt
die Quantenmechanik ganz wesentlich an Überichtlichkeit und Verständlichkeit. Das wollen auch wir
uns nicht entgehen lassen. . .
5.1
Althergebrachte Zahlenmengen
Zahlen begleiten Sie schon seit jeher durchs Leben. Vermutlich wurde aber – auch in der Mathematik
– eher selten über Zahlenmengen nachgedacht. Vielleicht auch deshalb, weil dies für das elementare
Rechnen halt gar nicht notwendig ist. Je weiter man hingegen in die höhere Mathematik vordringt,
umso wichtiger ist es, sich Gedanken über diesen wichtigen Baustein der Mathematik zu machen,
quasi mit dem Gedanken im Hinterkopf: “Sollten wir bei unserem Zahlenfundament etwas falsch
verstanden haben und von falschen Annahmen ausgehen, so würde das schwerwiegende Fehler in
aller weiteren Mathematik nach sich ziehen.” Also wollen wir versuchen uns etwas mehr Sicherheit
zu verschaffen und uns hier kurz einige Gedanken zu den wichtigsten Zahlenmengen und ihren
Eigenschaften machen.
5.1.1
Natürliche Zahlen N und ganze Zahlen Z
Unter den natürlichen Zahlen verstehen wir – banal gesagt – diejenigen Zahlen, mit denen Sie als
Kind zu zählen begonnen haben, also 1, 2, 3, 4, etc. Zu ihrer Beschreibung notieren wir typischerweise
die Menge in aufzählender Form:
N ≡ {1, 2, 3, . . .}
Wollen wir die ominöse “Nichts-Zahl” Null mit dabei haben so schreibt man:
N0 ≡ {0, 1, 2, 3, . . .}
Setzen wir die Einerschritte über Null hinaus ins Negative fort, so erhalten wir die Menge der ganzen
Zahlen Z:
Z ≡ {. . . , −3, −2, −1, 0, 1, 2, 3, . . .}
Bereits N, N0 und Z sind unendlich mächtig, besitzen also unendlich viele Elemente. Aber nur dass
eine Zahlenmenge unendlich viele Zahlen beinhaltet, heisst ja noch lange nicht, dass es eben alle
Zahlen sind. Ganz offensichtlich gibt es zwischen den ganzen Zahlen noch jede Menge Platz. . .
57
5.1.2
Die rationalen Zahlen Q
Zunächst füllen wir die Räume zwischen den ganzen Zahlen, indem wir Verhältnisse oder eben
Brüche dieser ganzen Zahlen bilden. Ratio ist der lateinische Ausdruck für Verhältnis,57 weshalb wir
die neue Zahlenmenge als rationale Zahlen Q bezeichnen. Das “Q” steht für Quotient – nochmals
ein Fachausdruck für einen Bruch. Wir definieren:
nm o
Q=
m
∈
Z,
n
∈
N
(56)
n
Diese beschreibende Form der Menge liest sich wie folgt: “Q ist die Menge aller Zahlen der Form
m geteilt durch n, wobei m eine ganze und n eine natürliche Zahl ist.”
Es ist klar, dass die ganzen Zahlen Z eine echte Teilmenge der rationalen Q sind: Z ⊂ Q, denn
jede ganze Zahl m geteilt durch n = 1 ergibt wieder sich selber.
5.1.3
Irrationale Zahlen I
Spontan könnte man ja meinen, dass Q alle möglichen Zahlen von −∞ bis +∞ abdeckt, aber weit
gefehlt! Auf einem Zahlenstrahl, also auf einer typischen Zahlenachse, wie sie in Abb. 26 gezeigt
wird, existieren Punkte, also Zahlenwerte, die durch keine rationale Zahl beschrieben werden. Solche
Zahlen nennen wir irrational (Menge I). Tatsächlich gibt es jede Menge solcher irrationaler Zahlen.
Sie kommen keineswegs weniger häufig als die rationalen Zahlen vor.
In der Dezimalbruch-Schreibweise ist der Unterschied zwischen rationalen und irrationalen einfach zu benennen: Bei einer rationalen Zahl bricht der Dezimalbruch entweder irgendwo ab (nach
irgendeiner Anzahl Stellen folgen nur noch Nullen) oder er wird periodisch (eine bestimmte Abfolge von Ziffern wiederholt sich unendlich oft), bei einer irrationalen Zahl hingegen gibt es keinerlei
Periodizitäten, d.h., im Dezimalbruch lassen sich
√ echten Regelmässigkeiten entdecken.
√ keine
Zu den berühmtesten irrationalen gehören 2, 3, e und π. Es schadet nichts, sich ihre auf drei
Nachkommastellen gerundeten Werte zu merken:
√
√
2 = 1.41421 35623 73095 04880 16887 24209 . . . ⇒
2 ≈ 1.414
Wurzel aus 2:
√
√
Wurzel aus 3:
3 = 1.73205 08075 68877 29352 74463 41505 . . . ⇒
3 ≈ 1.732
Kreiszahl:
π = 3.14159 26535 89793 23846 26433 83279 . . .
Euler’sche Zahl:
e = 2.71828 18284 59045 23536 02874 71352 . . .
⇒
⇒
π ≈ 3.142
e ≈ 2.718
In der Geschichte der Mathematik dauerte es recht lange und bedurfte mehrerer Anläufe – von der
Antike bis vor etwa 150 Jahren – bis endgültig Klarheit über die Eigenschaften und die Häufigkeiten
dieser irrationalen Zahlen herrschte. Besonders entscheidend für die Mengenlehre insgesamt waren im
19. Jahrhundert die drei Mathematiker Augustin-Louis Cauchy (1789 – 1857), Karl Weierstrass
(1815 – 1897) und vor allem Georg Cantor (1845 – 1918). Mit dieser Geschichte wollen wir uns
hier aber nicht weiter beschäftigen, auch wenn sie durchaus spannend und erhellend wäre.
Abbildung 26: Die reellen Zahlen auf einem Zahlstrahl (x-Achse). Jedem Punkt auf dem Strahl kann
eine reelle Zahl x zugeordnet werden.
57
Lat. ratio bedeutet aber auch noch Vernunft oder Verstand.
58
5.1.4
Ein vielzitierter Beweis: Die Irrationalität von
√
2
Wenn wir auch nicht allzu auführlich auf die Irrationalität als Zahleneigenschaft eingehen, so sei
an dieser Stelle zumindest ein berühmter Beweis für die Irrationalität der Quadratwurzel aus
2 angeführt. An diesem Beispiel sehen Sie – vielleicht zum ersten Mal – wie sich eine derartige
Eigenschaft überhaupt beweisen lässt. Von ebenso grosser Bedeutung ist das dabei angewendete
Verfahren, nämlich eine indirekte Beweisführung durch Widerspruch: Man geht von einer Annahme aus, die dem Gegenteil der zu beweisenden Behauptung entspricht. Anschliessend zeigt man,
dass diese Annahme auf einen logischen Widerspruch führt. Folglich ist sie falsch und somit das
Gegenteil, also die eigentliche Behauptung zwingend wahr.
Die folgende Einleitung und den Beweis selber habe ich Wikipedia entnommen [5].
Euklid überlieferte einen Beweis dafür, dass die Quadratwurzel von 2 irrational ist. Der zahlentheoretische Beweis Euklids wird indirekt durch Widerspruch geführt und gilt als der erste Widerspruchsbeweis in der Geschichte der Mathematik.
Der unten angeführte Beweis stammt von Euklid aus Buch X der Elemente. Irrationale Grössenverhältnisse waren aber schon dem Pythagoreer Archytas bekannt, der Euklids Satz nachweislich
schon in allgemeinerer Form bewies. (. . . )
Beweisführung
Behauptung: Die Quadratwurzel aus 2 ist eine irrationale Zahl.
Widerspruchsannahme: Die Beweisführung erfolgt indirekt nach der Methode des Widerspruchsbeweises, d.h., es wird gezeigt, dass die Annahme, die Wurzel aus 2 sei eine rationale Zahl, zu
einem Widerspruch führt (lateinisch: reductio ad absurdum).
Es wird also angenommen, dass die Quadratwurzel aus 2 rational ist und sich somit als Bruch
p
q darstellen lässt. Es wird ferner angenommen, dass p und q teilerfremde ganze Zahlen sind,
der Bruch pq also in gekürzter Form vorliegt:
√
2=
p
q
Folgerungen bis zum Widerspruch: Das bedeutet, dass das Quadrat des Bruchs
2
p
=2
oder umgeformt
p2 = 2q 2
q
p
q
gleich 2 ist:
Da 2q 2 eine gerade Zahl ist, ist auch p2 gerade. Daraus folgt, dass auch die Zahl p gerade ist.
Die Zahl p lässt sich also darstellen durch:
p = 2r
wobei r eine ganze Zahl ist. Damit erhält man mit obiger Gleichung:
2q 2 = p2 = (2r)2 = 4r 2
und hieraus nach Division durch 2:
q 2 = 2r 2
Mit der gleichen Argumentation wie zuvor folgt, dass q 2 und damit auch q eine gerade Zahl
ist. Da p und q durch 2 teilbar sind, erhalten wir einen Widerspruch zur Teilerfremdheit.
Logischer Umkehrschluss: Dieser Widerspruch zeigt, dass die Annahme, die Wurzel aus 2 sei eine
rationale
Zahl, falsch ist und daher das Gegenteil gelten muss. Damit ist die Behauptung, dass
√
2 irrational ist, bewiesen.
59
5.1.5
Die reellen Zahlen R
Vereinigen wir die rationalen Zahlen Q mit den irrationalen Zahlen I, so erhalten wir die reellen
Zahlen R. Sie füllen den Zahlenstrahl in Abb. 26 nunmehr lückenlos, was man als Vollständigkeit
der reellen Zahlen bezeichnet. Damit steht uns schliesslich eine Zahlenachse zur Verfügung, wie wir
sie für eindimensionale physikalische Grössen, also Skalare, eben gerne haben möchten.
Die reellen Zahlen R sind die gebräuchliche Zahlenmenge schlechthin. In der Mathematik gehen
Sie in aller Regel stets von dieser Grundmenge aus, wenn nichts anderes gesagt wird. Wichtig
dabei sind aber nicht nur die Zahlen an sich, sondern auch die verlässlichen Eigenschaften dieser
Zahlenmenge, auf die wir uns in aller Mathematik und Naturwissenschaft stets abstützen. Darüber
werden Sie im nächsten Abschnitt mehr erfahren.
Zum Abschluss unserer Betrachtung der bisherigen Zahlenmengen verweise ich auf Abb. 27, wo
die Teilmengenverhältnisse dieser Mengen dargstellt sind. Dort ist zudem bereits angedeutet, dass
die komplexen Zahlen C nochmals eine Erweiterung der reellen Zahlen darstellen, so wie z.B. die
rationalen Zahlen Q eine Erweiterung der ganzen Zahlen Z sind.
Wofür könnten sich diese komplexen Zahlen denn eignen? Offensichtlich gibt es Problemstellungen, für die es innerhalb der reellen Zahlen keine Lösungen gibt. Die einfachste davon lautet:
x2 = −1
Tatsächlich bieten die komplexen Zahlen die vollumfängliche Möglichkeit, solche quadratischen und
Gleichungen höherer Ordnung zu lösen. Aber auch bereits bekannte mathematische Zusammenhänge
lassen sich mit ihnen unter Umständen übersichtlicher darstellen oder einfacher beweisen.
Abbildung 27: Darstellung der Teilmengenbeziehungen zwischen den verschiedenen Zahlenmengen.
Es gilt: N ⊂ Z ⊂ Q ⊂ R ⊂ C, sowie I = R \ Q resp. R = Q ∪ I mit Q ∩ I = {}.
60
5.2
Die reellen Zahlen R als mathematischer Körper
Bis hierhin haben wir bezüglich der althergebrachten Zahlenmengen einfach mal gesagt, welche
Elemente, also Zahlen sie enthalten. Damit ist das Zahlenfundament unserer vertrauenswürdigen
Mathematik aber erst halbwegs beschrieben. Entscheidend sind ebenso die Recheneigenschaften,
auf die wir uns stets verlassen können.
So wissen wir nämlich, dass es sich bei den reellen Zahlen R zusammen mit den beiden Verknüpfungen “+” und “ · ” um einen sogenannten Körper handelt. Was meint man damit genau?
1. Gegeben ist zunächst die Menge der reellen Zahlen R.
2. Auf dieser Menge existieren zwei – uns wohlbekannte – Verknüpfungen mit Namen Addition
“+” und Multiplikation “ · ”. Diese nehmen jeweils zwei Elemente a, b ∈ R und generieren
daraus ein drittes Element a + b ∈ R resp. a · b ∈ R.
3. Nun nennen wir die Menge R zusammen mit den beiden Verknüpfungen Addition “+” und
Multiplikation “ · ” einen Körper, weil die folgenden neun Körperaxiome erfüllt sind.
5.2.1
Die neun Körperaxiome
Eigenschaften der Addition “+”:
1. Assoziativität: Für beliebige a, b, c ∈ R gilt:
a + (b + c) = (a + b) + c
2. Kommutativität: Für beliebige a, b ∈ R gilt:
a+b=b+a
3. Neutrales Element: In R existiert ein bezüglich der Addition
neutrales Element 0 so, dass für ein beliebiges a ∈ R gilt:
a+0=a
4. Inverses Element: Zu jedem a ∈ R existiert ein bezüglich
der Addition inverses Element (−a) ∈ R so, dass gilt:
a + (−a) = 0
Eigenschaften der Multiplikation “ · ”:
5. Assoziativität: Für beliebige a, b, c ∈ R gilt:
a · (b · c) = (a · b) · c
6. Kommutativität: Für beliebige a, b ∈ R gilt:
a·b =b·a
7. Neutrales Element: In R \ {0} existiert ein bezüglich der Multiplikation neutrales Element 1 so, dass für ein beliebiges a ∈ R gilt:
a·1=a
8. Inverses Element: Zu jedem a ∈ R \ {0} existiert ein bezüglich
der Multiplikation inverses Element a−1 ∈ R so, dass gilt:
a · a−1 = 1
Kombinierte Eigenschaft von Addition “+” und Multiplikation “ · ”:
9. Distributivgesetz: Für beliebige a, b, c ∈ R gilt:
a · (b + c) = a · b + a · c
61
5.2.2
Anmerkungen zu Körpern und zu den Körperaxiomen
• Vielfalt mathematischer Körper: Es gibt unzählige Körper im mathematischen Sinne. Es
braucht irgendeine Menge X von Objekten und dazu eben zwei Verknüpfungen “+” und “ · ”,
die auf dieser Menge definiert sind. Sobald nun die beiden Verknüpfungen die Körperaxiome
erfüllen, sagen wir: “X bildet zusammen mit den Verknüpfungen “+” und “ · ” einen Körper.”
Ich habe bei den Körperaxiomen oben also lediglich zugunsten Ihres unmittelbaren Verständnisses die reellen Zahlen R verwendet. Bei dieser Zahlenmenge haben Sie nämlich bereits eine
gute Idee der Zahlen selber, wie auch von Addition und Multiplikation.
Bei der Menge X muss es sich also nicht unbedingt um die reellen Zahlen handeln. Es
muss nicht einmal eine Zahlenmenge sein. Die unterschiedlichsten Objekte können zu Mengen zusammengefasst werden. Denken Sie z.B. an die Menge aller Geraden in einem x-yKoordinatensystem, die Menge aller Vektoren im dreidimensionalen Raum, die Menge aller
Drehungen in der Ebene, die Menge aller Polynome mit Grad 5, etc. An den letzten beiden
Beispielen sehen Sie, dass man sogar Mengen von Abbildungen oder Funktionen definieren
kann – was soll schon dagegen sprechen?
Dem entsprechend muss aber für jede Menge X jeweils neu deklariert werden, was mit den
beiden Verknüpfungen Addition und Multiplikation gemeint sein soll. Und so kommt es eben
auch vor, dass man nicht aus jeder Menge einen Körper machen kann, weil einfach keine
Addition oder keine Multiplikation definiert werden kann, welche die Körperaxiome erfüllt.58
Die Zeichen “+” und “ · ” für Addition und Multiplikation sind übrigens willkürlich. Häufig
werden für diese Verknüpfungen auch ganz andere Symbole verwendet, z.B. ∗, ◦, •, ⋄ oder ×.
• Bisherige Zahlenmengen: Auch die rationalen Zahlen Q bilden – mit derselben Addition und
Multiplikation wie bei R – einen Körper. Das können Sie selber überprüfen, indem Sie sich
Punkt für Punkt von der Richtigkeit der Körperaxiome überzeugen.
Im Gegensatz dazu bilden die ganzen Zahlen Z zusammen mit der bekannten Addition und
Multiplikation keinen Körper. Bei der Addition funktioniert es zwar noch, aber bei der Multiplikation scheitert es an der Existenz des inversen Elementes. Für eine ganze Zahl a liegt
nämlich das inverse Element a−1 = a1 bis auf die Ausnahmen a = ±1 nicht mehr in Z.
• Subtraktion und Division: Vielleicht vermissen Sie innerhalb der Körperaxiome Aussagen
resp. Anforderungen an die Subtraktion “−” und an die Division “ : ”. Diese sind aber überflüssig, weil diese beiden Operationen durch zwei rein symbolische Festlegungen gegeben sind:
a
a − b ≡ a + (−b)
und
a : b = ≡ a · b−1
b
Subtraktion und Division sind also durch Addition und Multiplikation und die zugehörigen
inversen Elemente (−b) und b−1 festgelegt und müssen nicht separat behandelt werden.
• Der Nutzen von Körpern: Was bringt es eigentlich, wenn man von einer Menge und den
beiden darauf definierten Verknüpfungen weiss, dass es sich um einen Körper handelt? Ganz
einfach gesagt verschafft dies die Sicherheit, dass darauf weiterführende Mathematik aufgebaut
werden kann, weil ein Körper eben bestimmte Anforderungen erfüllt. Auf der Existenz von
Addition und Multiplikation inkl. neutraler und inverser Elemente basieren weitere wichtige
Rechenmethoden, wie z.B. die Bildung von Potenzen und deren Gesetze.
58
Nichts hindert uns daran auch gänzlich unmathematische Objekte zu Mengen zusammenzufassen, z.B. die Menge
aller blauen Autos, die Menge aller Schweizerinnen und Schweizer oder die Menge aller Hauptreihensterne, etc. Die
Bedingung für eine Menge ist einfach die Unterscheidbarkeit der einzelnen Elemente.
Natürlich stellt sich dann die Frage, was man unter einer Addition oder einer Multiplikation innerhalb einer solchen
Menge verstehen soll. . . Vermutlich wird sich mit solchen Mengen kein Körper bilden lassen, weil die Körperaxiome
mangels passender Addition und Multiplikation nicht erfüllt werden können.
62
• Erweiterungen von Zahlenmengen: In den nächsten Abschnitten wird es um eine wesentliche Erweiterung unseres bisherigen Zahlenbereichs gehen. Die reellen Zahlen R sollen zu den
komplexen Zahlen C erweitert werden. Betrachten wir an dieser Stelle kurz an einem wohlbekannten Beispiel, was uns eine solche Zahlbereichserweiterung bringen kann und worauf man
dabei achten muss.
Die reellen Zahlen R sind eine Erweiterung der rationalen Zahlen Q. D.h., R enthält zusätzlich
zu Q auch noch die irrationalen Zahlen I und ermöglicht dadurch ein umfangreicheres√Rechnen,
z.B. die Angabe von Lösungen zu einer Gleichung wie x2 = 145, nämlich x = ± 145, was
innerhalb von Q nicht existieren würde.
Gleichzeitig sind aber alle Lösungen von Gleichungen, die wir in Q erhalten können, auch
innerhalb von R richtig. Auch nach der Erweiterung von Q zu R sind beispielsweise x = ± 32 die
beiden Lösungen der Gleichung x2 − 49 = 0. Sie sind durch diese Erweiterung des Zahlenbereichs
nicht falsch geworden.
Woran liegt das? Weshalb ist diese Erweiterung in diesem Sinne unproblematisch? Der entscheidende Grund dafür ist, dass sowohl Q, wie auch R eben Körper sind, welche unter Verwendung
derselben Addition “+” und Multiplikation “ · ” die Körperaxiome erfüllen. Die neutralen Elemente von “+” und “ · ” bleiben ebenfalls die gleichen und auch die inversen Elemente (−a)
und a−1 jeder rationalen Zahl a sind in R immer noch dieselben.
Natürlich kann es bei einer Zahlenbereichserweiterung vorkommen, dass man Addition oder
Multiplikation selber passend erweitern muss, also für die neu dazukommenden Zahlen entsprechende Deklarationen vornehmen muss. Denken Sie z.B. wiederum an die Erweiterung von
Q auf R. Dabei muss man beispielsweise
das Vorgehen bei der Multiplikation von Wurzeln
√
√ √
festlegen, nämlich dass a · b = a · b sein soll.
• Blicken wir voraus auf die im nächsten Abschnitt erfolgende Einführung der komplexen Zahlen
C, so verstehen Sie nun, worauf wir unser Augenmerk zu richten haben, damit keine Widersprüche zu allen bisher gültigen Aussagen in R entstehen:
– Auch die komplexen Zahlen C sollen einen Körper bilden. D.h., auf C muss eine erweiterte Addition und eine erweiterte Multiplikation so definiert sein, dass die Körperaxiome
erüllt sind. Insbesondere müssen diese beiden Verknüpfungen assoziativ, wie auch kommutativ sein und zudem das Distributivgesetz erfüllen.
– Diese erweiterte Addition und Multiplikation müssen, eingeschränkt auf Zahlen a, b ∈ R,
immer noch dieselben Resultate liefern.
– Die neutralen Elemente 0 und 1 müssen bei der Erweiterung demnach gleich bleiben.
– Auch die inversen Elemente (−a) und a−1 müssen für jedes a ∈ R bei der Erweiterung
unverändert bleiben.
Und nun kommt sie also, die Einführung der komplexen Zahlen C, die die bisherigen reellen
Zahlen R umfassen und uns gleichzeitig weitreichende mathematischen Möglichkeiten geben soll,
wie z.B. die Lösung der Gleichung x2 = −1.
Es ist einleuchtend, dass es sich bei C um eine mehrdimensionale Zahlenmenge handeln muss,
denn die eine Dimension, die der Zahlenstrahl in Abb. 26 darstellt, ist durch die reellen Zahlen
bereits vollständig, also lückenlos abgedeckt. “Wo” die neuen Zahlen liegen, davon werden wir sehr
rasch eine praktische Vorstellung haben. Bei den komplexen Zahlen handelt es sich nämlich um
eine zweidimensionale Zahlenmenge, und so muss jede Zahl z ∈ C einem Punkt in einer Ebene
entsprechen.
Aber genug der Vorankündigungen! Jetzt machen wir diesen Schritt.
63
5.3
5.3.1
Die Menge der komplexen Zahlen C
Definition der komplexen Zahlen und Gauss’sche Zahlenebene
Die Ausführungen in diesem und dem nächsten Unterabschnitt folgen der Einführung der komplexen
Zahlen im Buch Rechenmethoden für Studierende der Physik im ersten Jahr [2] von Markus Otto.
Die komplexen Zahlen C stellen eine Erweiterung der reellen Zahlen R dar. Besagte Erweiterung
ist dabei durch die Einführung einer Grösse i gegeben, für die per Definition gilt:
i2 ≡ −1
Dieses i bezeichnet man als die imaginäre Einheit.59 Hierdurch werden im Reellen nicht lösbare
Gleichungen wie z.B. x2 = −1 plötzlich lösbar: x = i oder x = −i.
Definition der Menge der komplexen Zahlen
Jede komplexe Zahl z ∈ C lässt sich als Summe aus einem reellen Anteil
x und einem imaginären Anteil iy schreiben:
z =x+i·y
mit Re(z) = x
und
Im(z) = y
(57)
Dabei heisst x ∈ R Realteil (Re) und y ∈ R Imaginärteil (Im) von z.
Die Menge der komplexen Zahlen C definiert sich demnach wie folgt:
C ≡ {z = x + iy | x, y ∈ R}
(58)
“Die Menge der komplexen Zahlen C ist die Menge aller Zahlen z = x + iy,
wobei x und y reelle Zahlen sind.”
√
√
Z.B. ist für z = 3 − i 2 der Realteil Re(z) = 3 und der Imaginärteil Im(z) = − 2.
Eine komplexe Zahl z = x, also mit y = 0, ist reell, eine komplexe Zahl z = iy, also mit x = 0,
heisst rein imaginär.60
Die Darstellung resp. geometrische Interpretation einer komplexen Zahl geschieht in einem zweidimensionalen, kartesischen Koordinatensystem, also in einer x-y-Ebene, die wir als komplexe oder
Gauss’sche Zahlenebene61 bezeichnen, wie Abb. 28 zeigt.
Da die reellen Zahlen R vollständig sind und sich jede komplexe Zahl als Summe z = x + iy
mit x, y ∈ R schreiben lässt, sind auch die komplexen Zahlen C eine vollständige Zahlenmenge.
Anschaulich gibt es in der Gauss’schen Zahlenebene somit keine Lücken, also keinen Punkt, der nicht
durch eine komplexe Zahl z abgedeckt wäre.
5.3.2
Komplexe Konjugation
Das komplex Konjugierte z ∗ einer komplexen Zahl z erhält man, indem man i durch −i ersetzt:
z =x+i·y
→
z∗ = x − i · y
daraus folgt: (z ∗ )∗ = z
Anschaulich entspricht die Konjugations-Operation ∗ in der komplexen Ebene einer Spiegelung des
zu z gehörenden Punktes an der reellen Achse (vgl. Abb. 28).
59
Analog kann die Zahl 1 als reelle Einheit verstanden werden.
Die Anregung zu dieser in [2] vergessen gegangenen Deklaration habe ich dem im Orell Füssli Verlag erschienen
Lehrbuch Algebra 3, Aufgaben, Ergebnisse [6] entnommen.
61
Ein Miterfinder dieser Darstellung war der berühmte deutsche Mathematiker Carl Friedrich Gauss (1777 – 1855).
60
64
Abbildung 28: Die Gauss’sche Zahlenebene: Jeder Punkt (x, y) entspricht einer komplexen Zahl
z = x+iy. Auf der horizontalen Achse sitzen die reellen, auf der vertikalen Achse die rein imaginären
Zahlen. Durch Spiegelung von z an der x-Achse erhält man die komjugiert komplexe Zahl z ∗ = x−iy.
5.4
Rechenregeln – die komplexen Zahlen C als Zahlenkörper
Nun kommt der spannende Punkt der Erweiterung von R auf C. Wir erinnern uns an die auf Seite
63 deklarierten Anforderungen: Damit es keine Komplikationen mit den in C enthaltenen reellen
Zahlen R gibt, müssen Addition und Multiplikation auf C so definiert werden, dass damit erstens
die Körperaxiome (vgl. 5.2.1) erfüllt werden, zweitens sollen Rechnungen mit reellen Zahlen immer
noch dieselben Resultate ergeben. Letzteres schliesst mit ein, dass auch die neutralen Elemente 0
und 1 gleich bleiben und die inversen Elemente (−a) und a−1 für reelle Zahlen unverändert bleiben.
Definition von Addition und Multiplikation auf C
x1 , x2 ∈ R seien die Real- und y1 , y2 ∈ R die Imaginärteile zweier beliebiger
komplexer Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 .
Dann sind Addition “+” und Multiplikation “ · ” dieser beiden komplexen
Zahlen gegeben durch:
z1 + z2 ≡ (x1 + x2 ) + i(y1 + y2 )
z1 · z2 ≡ (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 )
(59)
Das bedeutet, bei der Addition zweier komplexer Zahlen werden einfach die
Real- und Imaginärteile separat addiert:
Re(z1 + z2 ) = x1 + x2
und
Im(z1 + z2 ) = y1 + y2
Bei der Multiplikation sieht die Sache komplizierter aus:
Re(z1 z2 ) = x1 x2 − y1 y2
und
Im(z1 z2 ) = x1 y2 + x2 y1
Zusammen mit dieser Addition und dieser Multiplikation bilden die komplexen Zahlen C einen vollständigen Zahlenkörper, der eine Erweiterung
der reellen Zahlen R darstellt.
Insbesondere die Multiplikation mag im Moment etwas verwirrend erscheinen, wir werden aber in
Kürze sehen, dass sich beide Verknüpfungen gut veranschaulichen und verstehen lassen.
65
5.4.1
Ein näherer Blick auf die Addition komplexer Zahlen
• Veranschaulichung in der Gauss’schen Zahlenebene (vgl. Abb. 29): Bei der Addition
zweier komplexer Zahlen z1 und z2 handelt es sich in der komplexen Zahlenebene einfach um
die Vektoraddition der beiden Ortsvektoren von 0 nach z1 resp. z2 .
• Ort des additiv Inversen: Das additiv inverse Element (−z) ist in der Gauss’schen Zahlenebene einfach die Spiegelung von z am Ursprung 0 (vgl. Abb. 29). Damit ist auch anschaulich
klar, dass es zu jedem z ∈ C auch nur genau ein solches additiv inverses Element (−z) gibt.
• Überprüfung von Assoziativität und Kommutativität: Dass die “neue” Addition assoziativ
und kommutativ ist, verstehen wir aufgrund der Vektoraddition sofort. Kommutativität und
Assoziativität sind nämlich auch Eigenschaften der Vektoraddition.62 Andererseits ergeben sich
diese Eigenschaften unmittelbar aus der Assoziativität und der Kommutativität reeller Zahlen:
Assoziativität:
Kommutativität:
d
z1 + (z2 + z3 ) = z1 + (x2 + x3 ) + i(y2 + y3 )
d
= x1 + (x2 + x3 ) + i y1 + (y2 + y3 )
r
= (x1 + x2 ) + x3 + i (y1 + y2 ) + y3
d
d
= (x1 + x2 ) + i(y1 + y2 ) + z3 = (z1 + z2 ) + z3
d
z1 + z2 = x1 + x2 + i(y1 + y2 )
r
d
= x2 + x1 + i(y2 + y1 ) = z2 + z1
Vielleicht erscheinen Ihnen diese Umformungen ein bisschen sehr trivial, aber für ein solides
Fundament ist es eben sehr wichtig, dass man die grundlegenden Eigenschaften ganz genau
überprüft, und zwar ausschliesslich mit nachweislich abgesicherten Einzelschritten. So habe ich
bei allen Schritten mit d die Definition der Addition und bei den mittleren Schritten mit r die
Kommutativität resp. Assoziativität reeller Zahlen verwendet.
Abbildung 29: In der komplexen Zahlenebene entspricht die Addition zweier Zahlen einer Vektoraddition. Die Ortsvektoren von 0 nach z1 und z2 werden aneinander gehängt. Die additiv inverse Zahl
(−z) entspricht einer Spiegelung des zu z gehörenden Punktes an 0.
62
Vektoraddition: ~a + ~b + ~c = ~a + ~b + ~c und ~a + ~b = ~b + ~a.
66
5.4.2
Ein näherer Blick auf die Multiplikation komplexer Zahlen
• Die explizite Ausmultiplikation: Die Festlegung der Multiplikation in (59) erscheint im ersten
Moment etwas unverständlich, ja vielleicht sogar willkürlich. Im Prinzip handelt es sich dabei
aber einfach um die Ausmultiplikation der Darstellungen zweier komplexer Zahlen z1 und z2
mit ihren Real- und Imaginärteilen:
z1 z2 = (x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2
= x1 x2 − y1 y2 + i(x1 y2 + y1 x2 )
Beachten Sie dabei die Ausnutzung von i2 ≡ −1.
• Aufgeschobene graphische Interpretation (vgl. Abb. 30): Betrachten wir ein explizites
Zahlenbeispiel. Gegeben seien z1 = 1 + 2i und z2 = −1 + i. Für ihr Produkt ergibt sich:
z1 z2 = (1 + 2i)(−1 + i) = −1 + i − 2i + 2i2 = −1 − i − 2 = −3 − i
Abb. 30 zeigt, wo sich dieses Resultat in der Gauss’schen Zahlenebene befindet. Tatsächlich
gibt es einen geometrischen Zusammenhang zwischen z1 , z2 und z1 z2 . Den werden wir aber
erst im Abschnitt 5.5.4 aufdecken und dann auf dieses Beispiel zurückschauen. Bis dahin dürfen
Sie sich darüber den Kopf zerbrechen, wie der Zusammenhang zwischen diesen drei Punkten
aussieht.
• Überprüfung von Assoziativität und Kommutativität: Diese Eigenschaften lassen sich sehr
analog zur Addition überprüfen. Dabei verwenden wir einerseits wiederum die Assoziativität
und die Kommutativität bei der Addition und der Multiplikation reeller Zahlen, andererseits
natürlich die Definition der Multiplikation komplexer Zahlen (59). Die Sache sieht nun allerdings etwas komplizierter aus. Ich beschränke mich an dieser Stelle auf die Überprüfung der
Kommutativität:
Kommutativität:
d
z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + x2 y1 )
r
d
= x2 x1 − y2 y1 + i(x2 y1 + x1 y2 ) = z2 z1
Abbildung 30: Im Moment ist noch unklar, welche geometrische Bedeutung die Multiplikation zweier
komplexer Zahlen z1 und z2 in der komplexen Zahlenebene hat. Die Auflösung folgt im Abschnitt
5.5. Über das multiplikativ inverse Element z −1 erfahren Sie mehr im Abschnitt 5.4.4.
67
5.4.3
Der Betrag einer komplexen Zahl
• Beträge reeller Zahlen: Unter dem Betrag |a| einer reellen Zahl a verstehen wir ihren
positiven Zahlenwert ohne Vorzeichen:
35 35
√ √
2 = 2
|3| = 3
| − 6| = 6
|0| = 0
− =
13
13
Auf dem reellen Zahlenstrahl kann man |a| als Abstand der Zahl a zum Nullpunkt 0
interpretieren – und Abstände sind per Definition immer positiv.
Häufig wird dieser Betrag einer Zahl auch Absolutbetrag genannt.63
• Beträge komplexer Zahlen: Auch bei komplexen Zahlen soll der Betrag |z| für den Abstand
zum Nullpunkt 0 stehen (vgl. Abb. 28). Folgende Definition erfüllt diese Anforderung:
Absolutbetrag einer komplexen Zahl z
Der Absolutbetrag oder Betrag |z| einer komplexen Zahl z = x + iy
ist gegeben durch die (positive) Wurzel des Produktes aus dem konjugiert
Komplexen z ∗ und z selber:
p
√
(60)
|z| ≡ z ∗ z = x2 + y 2
Diese Definition entspricht in der komplexen Ebene dem Abstand von z
zum Ursprung 0.
Betrachten wir eine beliebige komplexe Zahl z = x + iy, so erhalten wir für ihren Betrag:
p
p
p
√
|z| = z ∗ z = (x − iy)(x + iy) = x2 + ixy − ixy − i2 y 2 = x2 + y 2
Beachten Sie, wie −i2 schliesslich ein positives Vorzeichen von y 2 ergibt.
Tatsächlich entspricht dieses Resultat in der Gauss’schen Zahlenebene genau dem Abstand
von z zum Nullpunkt 0, wie Abb. 31 erklärt (Satz des Pythagoras!). Alle Zahlen z mit |z| = r
bilden zusammen den Kreis mit Radius r um den Ursprung 0.
• Betragsquadrat und Vorschau auf die Quantenmechanik: In obiger Betragsberechnung
sehen Sie zum ersten Mal den praktischen Einsatz des konjugiert Komplexen z ∗ . Damit lässt
sich das Betragsquadrat |z|2 in sehr einfacher Weise notieren:
|z|2 = z ∗ z
Dieses Betragsquadrat werden wir in der Quantenmechanik andauernd antreffen. Konkret
beträgt die Wahrscheinlichkeit dafür, ein Teilchen, dessen Verhalten durch die Schrödinger’sche
Wellenfunktion Ψ (x, t) beschrieben wird, zum Zeitpunkt t zwischen den Orten a und b zu
finden:
Z
Z
b
a
|Ψ (x, t)|2 dx =
b
Ψ ∗ (x, t)Ψ (x, t) dx
a
Dabei ist Ψ (x, t) eine Funktion mit komplexen Funktionswerten. Damit können Sie nachvollziehen, weshalb uns der Ausdruck Ψ ∗Ψ auf Schritt und Tritt auf dem Weg durch die
Quantenmechanik verfolgen wird.
63
Mit dieser Namensgebung wird klar, weshalb in manchen Rechenprogrammen der Betrag mit dem Kürzel abs()
aufgerufen werden kann. So z.B. auch in GeoGebra.
68
Abbildung 31: Der Betrag |z| einer komplexen Zahl z beschreibt in der komplexen Ebene den Abstand
des Punktes z vom Ursprung 0. Alle komplexen Zahlen mit demselben Betrag |z| = r liegen auf
einem Kreis mit Radius r um 0.
5.4.4
Division: Bruchrechnen mit komplexen Zahlen
Die Zahl z1 = x1 + iy1 soll durch die Zahl z2 = x2 + iy2 6= 0 geteilt werden, wodurch die Zahl
z3 = x3 + iy3 entsteht:
z1
z1 : z2 =
= z3
⇔
z1 = z2 · z3
z2
Stimmt die Division links, so muss auch die Multiplikation rechts richtig sein und umgekehrt, wenn
z2 6= 0. Daraus lässt sich auf den Realteil x3 und den Imaginärteil y3 von z3 schliessen:
z1 = z2 z3
⇒
x1 + iy1 = (x2 + iy2 )(x3 + iy3 ) = x2 x3 − y2 y3 + i(x3 y2 + x2 y3 )
{z
}
{z
}
|
|
=x1
=y1
Identifikationstrick: Da Real- und Imaginärteil der Zahl z1 = x1 + iy1 eindeutig sind, können wir
die Terme x2 x3 − y2 y3 und x3 y2 + x2 y3 ganz rechts mit x1 resp. y1 identifizieren. Es ergibt sich ein
ohne Weiteres lösbares lineares Gleichungssystem mit den beiden Unbekannten x3 und y3 :
x
x = x x −y y 1 = x 2 x3 − y 3 x2
y1
y2
x1
1
2
3
2
3
y2
y2
+
=
+
x3
⇒
⇒ y1
y 1 = x3 y 2 + x2 y 3 y2
x2
y2
x2
= y 2 x3 + y 3 x2
⇒
x2
x1 x2 + y1 y2 = (x22 + y22 ) x3
⇒
x3 =
x1 x2 + y 1 y 2
x22 + y22
In der Fortsetzung lässt sich auch y3 bestimmen – das können Sie selber überprüfen. Wir erhalten:
y3 =
x2 y 1 − x1 y 2
x22 + y22
Dieser Weg ist wegen des Identifikationstricks zwar lehrreich, aber nicht besonders elegant. Es folgt
nun eine zweite Berechnung von zz12 , die ebenso neue Aufschlüsse und Erkenntnisse mit sich bringt.
69
Der bessere Trick für die rasche Division zweier komplexer Zahlen z1 und z2 besteht in der
Erweiterung des Bruchs zz21 mit dem konjugiert Komplexen des Nenners, also mit z2∗ :
z1
z1 z2∗
z1 z2∗
(x1 + iy1 )(x2 − iy2 )
=
· ∗ =
=
z2
z2 z2
|z2 |2
x22 + y22
=
x1 x2 + y1 y2 + i(x2 y1 − x1 y2 )
x22 + y22
Das entspricht der Lösung von vorhin. Der Trick der Erweiterung mit z2∗ macht den Nenner reell.
Dort entsteht nämlich einfach das Betragsquadrat des Divisors: z2 z2∗ = |z2 |2 = x22 + y22 .
z z∗
Bereits der Bruch |z12 |22 in der Mitte der oberen Zeile kann als Resultat der Division aufgefasst
werden, einfach ohne Zerlegung in Real- und Imaginärteil. Damit können wir z.B. auch ganz leicht
verdeutlichen, was denn das multiplikativ inverse Element z −1 einer Zahl z ist:
z −1 =
1
1 z∗
z∗
1 z∗
= · ∗ = 2 =
·
z
z z
|z|
|z| |z|
Die Faktorisierung in zwei Brüche ganz am Schluss liefert uns ein anschauliches Verständnis in der
Gauss’schen Zahlenebene (vgl. Abb. 32). Wie wir bereits aus Abb. 28 wissen, besitzt z ∗ denselben
z∗
eine Zahl mit Betrag 1, die von 0 aus gesehen in Richtung
Betrag wie z, d.h. |z ∗ | = |z|. Somit ist |z|
1
∗
des konjugiert Komplexen z liegt. Darauf wird nun der zweite Faktor |z|
angewendet, sodass folgt:
• z −1 liegt von 0 aus gesehen in der Richtung von z ∗ .
1
• |z −1 | = |z|
. Dies bedeutet: Ist |z| > 1, so ist |z −1 | < 1 – und umgekehrt. In der komplexen
Ebene liegt das multiplikativ inverse Element z −1 innerhalb des Einheitskreises, wenn die Zahl
z selber ausserhalb desselben liegt – und umgekehrt.
Nun verstehen wir auch das Beispiel des multiplikativ inversen Elementes der Zahl z = 1 + 2i in
Abb. 30 auf Seite 67:
1 2
1 − 2i
1 − 2i
z∗
= − i
=
z −1 = 2 = 2
2
|z|
1 +2
5
5 5
Abbildung 32: Das multiplikativ inverse Element z −1 liegt von 0 aus gesehen in Richtung des konjugiert Komplexen z ∗ . Sein Betrag |z −1 | ist gleich dem Kehrwert von |z|.
70
5.4.5
Die imaginäre Einheit i und ihre Potenzen
Kurz wollen uns noch überlegen:
i0 = 1
i1 = i
i2 = −1
i3 = i2 · i = −i
i4 = 1
Ebenso:
i0 = 1
i−1 =
1
i
= 2 = −i
i
i
i−2 =
1
= −1
i2
i−3 = −
1
i
= 4 =i
3
i
i
i−4 =
1
=1
i4
Ab der vierten Potenz von i wiederholen sich die Werte. Also merken wir uns:
i4n = 1
i4n+1 = i
i4n+2 = −1
i4n+3 = −i = i2 · i
mit n ∈ Z
Vergleichen Sie dazu Abb. 33.
5.4.6
Überprüfung der Körperaxiome
Nachdem wir nun schon einiges zum Umgang mit komplexen Zahlen gesehen haben, sollten wir uns
eigentlich abschliessend nochmals davon überzeugen, dass C zusammen mit der in (59) definierten
Addition und Multiplikation die Körperaxiome von Seite 61 erfüllt. Darauf werde ich an dieser Stelle
allerdings verzichten, weil wir schon viele Punkte abgehakt haben:
• 1.+2. Körperaxiom: Assoziativität und Kommutativität der Addition.
• 6. Körperaxiom: Kommutativität der Multiplikation.
• 3.+7. Körperaxiom: Deklaration und Verifizierung der neutralen Elemente 0 und 1.
• 4. Körperaxiom: Existenz des additiv inversen Elementes (−z).
• 8. Körperaxiom: Existenz des multiplikativ inversen Elementes z −1 .
Es fehlen also nur noch die Überprüfung der Assoziativität der Multiplikation und des Distributivgesetzes (5.+9. Körperaxiom). Das wollen wir uns schenken.
Nochmals: Die komplexen Zahlen bilden zusammen mit den in (59) definierten Verknüpfungen “+”
und “ · ” einen Zahlenkörper. Mit Realteil x und Imaginärteil y einer komplexen Zahl z = x + iy,
sowie mit der komplexen Einheit i dürfen wir rechnen, wie wir es uns schon seit jeher gewohnt sind.
Speziell ist die Eigenschaft der komplexen Einheit i, nämlich dass i2 = −1.
Abbildung 33: Die imaginäre Einheit i und ihre Potenzen in der komplexen Ebene.
71
5.5
5.5.1
Komplexe Zahlen in Polarkoordinaten, Euler-Gleichung und Euler-Darstellung
Polarkoordinaten in der komplexen Ebene
Wir betrachten zunächst eine komplexe Zahl z1 mit Betrag |z1 | = 1. D.h., die Zahl z1 liegt in
der Gauss’schen Ebene auf dem Einheitskreis rund um den Ursprung 0 (vgl. Abb. 34). Wegen der
Definitionen von Sinus und Cosinus am Einheitskreis muss dann gerade gelten:
z1 = cos ϕ + i sin ϕ
Dabei ist ϕ der von der reellen Achse aus im Gegenuhrzeigersinn gemessene Winkel. Wir wollen
dafür von Anfang an und ausschliesslich das Bogenmass verwenden.64
Abbildung 34: Zu jedem von der reellen Achse im Gegenuhrzeigersinn abgetragenen Winkel ϕ gehört
genau ein Punkt auf dem Einheitskreis resp. eben eine komplexe Zahl z1 mit Betrag |z1 | = 1. Wegen
den bekannten Definitionen von Sinus und Cosinus am Einheitskreis gilt: z1 = cos ϕ + i sin ϕ.
Jede komplexe Zahl auf dem Einheitskreis lässt sich also ganz anschaulich mit nur einem Winkel resp. einer Winkelkoordinate ϕ beschreiben. Dabei gilt stets der “trigonometrische Satz des
Pythagoras”:65
cos2 ϕ + sin2 ϕ = 1
Multiplizieren wir nun unser z1 = cos ϕ + i sin ϕ mit einer reellen Zahl r ≥ 0, so erhalten wir eine
neue komplexe Zahl z:
z = r · z1 = r(cos ϕ + i sin ϕ) = r cos ϕ + i · r sin ϕ
| {z }
| {z }
=x
=y
z1 wird um den Faktor r vom Ursprung weggestreckt. Da |z1 | = 1 war, hat z nun den Betrag |z| = r,
also den Abstand r vom Ursprung, wovon man sich leicht überzeugen kann:
q
q
p
√
2
2
2
2
2
2
|z| = x + y = r cos ϕ + r sin ϕ = r 2 (cos2 ϕ + sin2 ϕ) = r 2 = r
Abb. 35 verdeutlicht den Zusammenhang zwischen z1 und z = r · z1 .
64
65
◦
Zur Erinnerung: Für die Umrechnung zwischen Bogenmass und Gradmass muss man sich merken, dass: π =180
b
.
2
2
2
2
Zur Klärung: cos ϕ ≡ (cos ϕ) und sin ϕ ≡ (sin ϕ) .
72
Abbildung 35: Nimmt man den Ursprung 0 als Streckzentrum und streckt die auf dem Einheitskreis
liegende Zahl z1 mit dem Faktor r, so resultiert die Zahl z = r · z1 . Zu ihr gehört nach wie vor die
Winkelkoordinate ϕ, aber ihr Betrag ist nun |z| = r. Das Paar aus Betrag r und Winkelkoordinate
ϕ bezeichnet als Polarkoordinaten von z.
Jede komplexe Zahl z = x + iy lässt sich also statt durch den Realteil x und den Imaginärteil y
auch durch ein Paar aus einem Betrag r und einer Winkelkoordinate ϕ beschreiben. r und ϕ nennt
man die Polarkoordinaten von z.
x und y lassen sich sehr leicht durch r und ϕ ausdrücken. Offensichtlich gilt:
x = r cos ϕ
und
y = r sin ϕ
Die umgekehrte Angabe, also wie sich r und ϕ durch x und y ausdrücken lassen, ist, zumindest was
die Winkelkoordinate ϕ angeht, etwas mühsamer. Für den Betrag r gilt offensichtlich:
p
r = x2 + y 2
Bezüglich der Winkelkoordinate ϕ machen wir uns zuerst bewusst, dass es zu einem bestimmten z
im Prinzip mehrere korrekte Werte von ϕ gibt. Wenn wir einen zu z passenden Winkel ϕ0 um 2π,
also um eine ganze Umdrehung vergrössern oder verkleinern, so schauen wir ja wieder in dieselbe
Richtung. Tatsächlich gibt es somit unendlich viele zu z passende Winkelwerte:
ϕ = ϕ0 ± n · 2π
mit
n∈N
Wenn wir aber effektiv mal die Winkelkoordinate zu einer komplexen Zahl anzugeben haben, dann
soll sie möglichst klein sein, also möglichst nahe bei 0 liegen. Wir fordern:
−π < ϕ ≤ π
Blicken wir kurz auf Abb. 35. Dort besitzt die Zahl z den Realteil x = r cos ϕ und den Imaginärteil
y = r sin ϕ. Der Bruch xy ergibt gerade tan ϕ, denn im grossen rechtwinkligen Dreieck ist dies genau
das Verhältnis der Gegenkathete von ϕ zur Ankathete. Daraus folgern wir:
y
ϕ = arctan
x
Allerdings kann dies noch nicht die letzte Wahrheit sein, denn so ergäbe sich z.B. für z = 3 + 2i und
z = −3 − 2i derselbe Winkelwert, weil:
−2
2
=
3
−3
73
Tatsächlich müssen wir eine Fallunterscheidung machen. Je nachdem, in welchem Quadranten
der komplexen Ebene die Zahl z liegt, muss ϕ leicht anders berechnet werden. Wissend, dass der
Arcustangens per Definition Winkelwerte − π2 < ϕ < π2 liefert (vgl. Abb. 36), notieren wir:
y
1. Quadrant: x > 0 und y > 0
⇒
ϕ = arctan
x
y
2. Quadrant: x < 0 und y > 0
⇒
ϕ = arctan + π
x
y
3. Quadrant: x < 0 und y < 0
⇒
ϕ = arctan − π
x
y
4. Quadrant: x > 0 und y < 0
⇒
ϕ = arctan
x
Auf diese Weise entstehen, wie weiter oben gefordert, lauter Winkelwerte −π < ϕ ≤ π.
Abbildung 36: Der Graph der Arcustangensfunktion.
Halten wir nochmals fest, was wir in diesem Abschnitt Neues gesehen haben:
Koordinaten komplexer Zahlen
Eine komplexe Zahl z wird einerseits durch ihre beiden kartesischen Koordinaten
x und y beschrieben. Wir sprechen vom Realteil x und vom Imaginärteil y und
es gilt:
z = x + iy
Andererseits gehören zu jeder komplexen Zahl z 6= 0 zwei Polarkoordinaten r
und ϕ. r = |z| ist der Betrag und ϕ die Winkelkoordinate von z und es gilt:
z = r(cos ϕ + i sin ϕ)
(61)
Für die Umrechnung von Polar- zu kartesischen Koordinaten gilt:
x = r cos ϕ
und
y = r sin ϕ
(62)
Umgekehrt ergibt sich für die Umrechnung von kartesischen zu Polarkoordinaten:
p
y
(63)
r = x2 + y 2
und
ϕ = arctan + kπ
x
Für z im 2. Quadranten der komplexen Ebene ist k = +1, für den 3. Quadranten
ist k = −1 und für den 1. und 4. Quadranten ist k = 0.
74
5.5.2
Euler-Gleichung und Euler-Darstellung komplexer Zahlen
Wir kommen nun zum eigentlichen Wunder der komplexen Zahlen und zum Grund dafür, dass sich
das Rechnen mit ihnen so dermassen durchgesetzt hat. Dieses Wunder heisst Euler’sche Gleichung
und gipfelt darin, dass sich eine Beziehung zwischen den fundamentalen Zahlenkonstanten e, i und
π sowie den Neutralelementen 1 und 0 von Multiplikation und Addition notieren lässt, nämlich:
eiπ + 1 = 0
Diese Gleichung wird von vielen Mathematikerinnen und Mathematikern als etwas vom Fundamentalsten und Schönsten überhaupt angesehen. . . Sie entspringt dem folgenden Zusammenhang:
Euler-Gleichung und Euler-Darstellung
Für die Euler’sche Zahl e und die beiden Winkelfunktionen Cosinus und
Sinus gilt die Euler-Gleichung:
eiϕ = cos ϕ + i sin ϕ
(64)
eiϕ ist somit die praktische Kurzschreibweise für eine komplexe Zahl auf
dem Einheitskreis der Gauss’schen Zahlenebene, denn genau dafür steht
cos ϕ + i sin ϕ ja. Mit (61) lässt sich nun jede komplexe Zahl z mit Polarkoordinaten r und ϕ in der sogenannten Euler-Darstellung notieren:
z = r · eiϕ
(65)
Damit darf man ganz normal rechnen. Insbesondere gelten für eiϕ die üblichen Potenzgesetze, was uns zahlreiche neue Rechenwege eröffnet.
Die Euler-Gleichung ist gar nicht einmal so schwierig zu beweisen. Wir kommen zu einem späteren
Zeitpunkt darauf zu sprechen. Im Moment wollen wir aber einfach von ihrer Richtigkeit ausgehen
und sehen, wie uns die Euler-Darstellung (65) in ganz neuer Art und Weise arbeiten lässt.
Zuerst aber noch ein paar direkte Bemerkungen zum eben Gesagten:
• Das konjugiert Komplexe einer Zahl z lässt sich auch in der Euler-Darstellung rasch notieren:
z = r eiϕ
z ∗ = r e−iϕ
⇒
• Da die Cosinus- und die Sinusfunktion 2π-periodisch sind, gilt dies nun auch für die Exponentialfunktion eiϕ . Das bedeutet:
ei(ϕ±2π) = eiϕ
für jede beliebige Winkelkoordinate ϕ
Das wird klar, wenn wir uns wieder vor Augen führen, dass cos ϕ + i sin ϕ für die zur Winkelkoordinate ϕ gehörende komplexe Zahl z auf dem Einheitskreis steht. Die Subtraktion oder
Addition von 2π erzeugt eine ganze Umdrehung im oder gegen den Uhrzeigersinn und führt
somit wieder auf dasselbe z auf dem Einheitskreis.
• Besonders wichtig, da häufig vorkommend, sind die speziellen Werte bei Vielfachen von
e0 = 1
π
ei 2 = i
eiπ = −1
ei
3π
2
= −i
ei2π = 1
Ab hier wiederholt sich die Abfolge wegen der 2π-Periodizität von eiϕ .
Hierin steckt auch die “besonders schöne” Gleichung von oben:
eiπ = −1
⇔
75
eiπ + 1 = 0
etc.
π
2:
5.5.3
Repetition der Potenzgesetze
Die Stärke der Euler-Darstellung z = reiϕ liegt insbesondere darin, dass man bei der Multiplikation
zweier komplexer Zahlen eben lediglich zwei Beträge und zwei Potenzen mit Basis e miteinander
zu multiplizieren hat. . . grübel, grübel . . . was passiert schon wieder bei der Multiplikation zweier
Potenzen mit gleicher Basis?
Damit diese und ähnlich Fragen zum Umgang mit Potenzen wieder geklärt sind, seien hier kurz
die Potenzregeln repetiert:
Rechenregeln für Potenzen
Grundverständnis für a ∈ C und n ∈ N:
an ≡ a
. . · a}
| · .{z
a0 ≡ 1
n−mal
a−1 ≡
1
a
Multiplikation/Division von Potenzen mit gleicher Basis:
ab · ac = ab+c
resp.
ab
= ab−c
ac
für
a, b, c ∈ C
Multiplikation/Division von Potenzen mit gleichem Exponenten:
ac · bc = (a · b)c
resp.
Potenzieren von Potenzen:
(ab )c = ab·c
ac a c
=
bc
b
für
für
a, b, c ∈ C
a, b, c ∈ C
Diese Potenzregeln funktionieren im Komplexen natürlich nur, weil wir schön dafür gesorgt haben,
dass die Körperaxiome erfüllt sind, dass es also eine wohldefinierte Addition und Multiplikation gibt!
5.5.4
Das Verständnis der komplexen Multiplikation
Im Abschnitt 5.4.2 war das graphische Verständnis für die Multiplikation zweier komplexer Zahlen
noch nicht so richtig greifbar (vgl. Abb. 30). Das Produkt zweier Zahlen liess sich zwar ohne Probleme
berechnen, wie wir im damaligen Beispiel mit z1 = 1 + 2i und z2 = −1 + i (vgl. Seite 67) gesehen
hatten:
z3 = z1 z2 = (1 + 2i)(−1 + i) = −1 + i − 2i + 2i2 = −1 − i − 2 = −3 − i
Mit der Euler-Darstellung wird nun aber endlich alles viel klarer!
Betrachten wir ganz allgemein zwei komplexe Zahlen in ihren Euler-Darstellungen z1 = r1 eiϕ1
und z2 = r2 eiϕ2 , so ergibt sich wegen der Potenzregel für ihr Produkt:
z3 = z1 z2 = r1 eiϕ1 · r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) = r3 eiϕ3
D.h., die neue Zahl z3 besitzt als Betrag (= Distanz zum Ursprung) das Produkt der Beträge der
beiden ursprünglichen Zahlen:
r3 = r1 r2
Und was passiert mit den Winkeln? Die werden einfach addiert! Die Winkelkoordinate ϕ3 der resultierenden Zahl z3 ist einfach die Summe der Winkelkoordinaten beider Faktoren:
ϕ3 = ϕ1 + ϕ2
Damit verstehen wir die Multiplikation zweier komplexer Zahlen nun auch graphisch ohne Weiteres.
76
Betrachten wir zur Veranschaulichung nochmals das Beispiel von oben resp. von Seite 67, jetzt
neu dargestellt in Abb. 37. Zu den beiden Zahlen z1 = 1 + 2i und z2 = −1 + i gehört je eine
Winkelkoordinate und ein Betrag, ebenso zum Resultat z3 = z1 z2 = −3 − i. Mittels der Koordinatentransformationen (63) erhalten wir für diese Koordinaten:
r1 =
r2 =
r3 =
p
12 + 22 =
√
5
und
11 + 12 =
√
2
und
p
31 + 12 =
√
10
und
p
2
≈ 1.107
1
1 π
3π
+π =− +π =
≈ 2.356
ϕ2 = arctan
−1
4
4
−1 ϕ3 = arctan
− π ≈ −2.820
−3
ϕ1 = arctan
Bei den Beträgen sehen wir sofort, dass der Zusammenhang stimmt:
√ √
√
r1 r2 = 5 · 2 = 10 = r3
Bei den Winkelkoordinaten müssen wir einen kurzen Moment länger überlegen:
ϕ1 + ϕ2 ≈ 1.107 + 2.356 = 3.463 > π
Dieses Ergebnis liegt ausserhalb des Intervalls ] − π; π]. Um es wieder in diesen Bereich zu bringen,
müssen wir davon einmal 2π abziehen. Dadurch verändern wir an der Richtung von ϕ1 + ϕ2 und
damit an z1 z2 nichts, denn die Addition oder Subtraktion von 2π entspricht ja einfach einer ganzen
Umdrehung:
ϕ1 + ϕ2 − 2π ≈ 3.643 − 2π ≈ −2.820
Nun stimmt das Resultat mit der weiter oben berechneten Winkelkoordinate ϕ3 von z3 überein.
Abbildung 37: Das graphische Verständnis der komplexen Multiplikation: Bei der Multiplikation
zweier komplexer Zahlen z1 und z2 zur Zahl z3 = z1 z2 werden die Beträge miteinander multipliziert
(r3 = r1 r2 ) und die Winkelkoordinaten addiert (ϕ3 = ϕ1 + ϕ2 ).
77
Halten wir zusammenfassend fest, was wir über die Multiplikation zweier komplexer Zahlen nun
gelernt und am Beispiel überprüft haben:
Komplexe Multiplikation in der Euler-Darstellung
Multiplizieren wir eine erste komplexe Zahl z1 = r1 eiϕ1 mit einer zweiten
komplexen Zahl z2 = r2 eiϕ2 , so erhalten wir die Zahl z3 mit:
z3 = z1 · z2 = r1 eiϕ1 · r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) = r3 eiϕ3
Die Multiplikation zweier in Euler-Darstellung gegebener komplexer Zahlen
bedeutet also:
•
Der Betrag von z3 ist das Produkt der Beträge von z1 und z2 :
r3 = r1 · r2
•
Die Winkelkoordinate von z3 ist die Summe der Winkelkoordinaten
von z1 und z2 :
ϕ3 = ϕ1 + ϕ2
Multiplikation als Drehstreckung in der komplexen Ebene
Die Multiplikation der Zahl z1 mit der Zahl z2 steht für eine Drehstreckung
von z1 um den Ursprung in der Gauss’schen Ebene:
•
z1 wird dabei erstens im Gegenuhrzeigersinn um den Winkel ϕ2 um
den Ursprung gedreht.
•
Zweitens wird z1 mit dem Faktor r2 gestreckt, wobei das Streckzentrum ebenfalls der Ursprung ist.
Natürlich kann dieselbe Multiplikation ebenso gut als Drehstreckung von z2
mit dem Winkel ϕ1 und dem Streckfaktor r1 aufgefasst werden.
Häufigster Spezialfall: eiϕ als rotierender Faktor
An dieser Stelle soll besonders darauf hingewiesen werden, dass die Multiplikation mit dem Faktor eiϕ einfach einer Drehung um den Ursprung mit
Drehwinkel ϕ entspricht (im Gegenuhrzeigersinn). Der Betrag der Zahl wird
durch diese Multiplikation nicht verändert.
Nach diesen Überlegungen zur Multiplikation fällt es nicht weiter schwer, noch kurz über die Division
zweier komplexer Zahlen nachzudenken. Auch diese Operation fällt einem mit Polarkoordinaten, also
in der Euler-Darstellung, wesentlich leichter als mit kartesischen Koordinaten:
z3 =
r1 eiϕ1
r1 i(ϕ1 −ϕ2 )
z1
=
=
e
= r3 eiϕ3
iϕ
2
z2
r2 e
r2
Somit gilt für den Betrag und die Winkelkoordinate des Resultates z3 :
r3 =
r1
r2
und
ϕ3 = ϕ1 − ϕ2
Immer noch handelt es sich um eine Drehstreckung: z1 wird um den Faktor r2 gegen den Ursprung
hin gestaucht und zudem um ϕ2 im Uhrzeigersinn gedreht (das Minuszeichen in ϕ1 − ϕ2 sorgt dafür,
dass die Drehung nicht im Gegenuhrzeigersinn, sondern eben im Uhrzeigersinn erfolgt).
78
5.6
Weitere Zusammenhänge und erste Anwendungen mit komplexen Zahlen
Nun haben wir das wesentliche Rüstzeug zum Umgang mit komplexen Zahlen beisammen: Die neue
Zahlenmenge C ist eingeführt, die Grundoperationen darauf sind diskutiert (auch graphisch) und
Sie haben gesehen, wie Rechnungen in der Euler-Darstellung (Polarkoordinaten) durch Ausnutzung
der Potenzgesetze vereinfacht werden. Jetzt sind wir bereit diese “neuen” Zahlen auch wirklich zu
gebrauchen und zu sehen, wie man sie geübt anwendet und wo sie ganz besonders praktisch sind.
5.6.1
Die Gleichung z n = 1 und die n-ten Einheitswurzeln
Vorüberlegung zur reellen Gleichung xn = 1: Wie Sie wissen, besitzt die Gleichung x2 = 1 die
beiden Lösungen x = ±1, zu x3 = 1 existiert allerdings nur eine Lösung x = 1. Dies setzt sich
fort und wir können für alle n ∈ N zusammenfassen:
(
+1 für ungerades n
n
x =1 ⇒ x=
±1 für gerades n
Offenbar gibt es im Reellen keine ganz einheitliche Aussage zu den Lösungen von xn = 1. Man
muss zwischen ungeraden und geraden Exponenten unterscheiden. . .
Komplexe Einheitswurzeln: Im Komplexen schreiben wir für die Unbekannte nicht mehr x, sondern z. Wie sieht es nun mit den Lösungen von z n = 1 mit n ∈ N aus?
Zur Behandlung dieser Gleichung empfiehlt es sich, z in der Euler-Darstellung anzusetzen.
Damit lässt sich sofort ein Ausdruck für z n notieren:
n
z = r eiϕ
⇒
z n = r eiϕ = r n einϕ
z n soll gleich 1 sein, also den Betrag r n = 1 aufweisen. Da r in der Euler-Darstellung per
Definition eine positive reelle Zahl ist, folgt sofort: r = 1. Alle Lösungen von z n = 1 liegen
also auf dem Einheitskreis und wir schreiben nur noch:
z = eiϕ
resp. z n = einϕ
(66)
An dieser Stelle machen wir uns nochmals klar, dass sich die reelle Einheit 1 mittels EulerDarstellung auf unendlich viele verschiedene Arten schreiben lässt:
1 = . . . = e−i6π = e−i4π = e−i2π = ei·0 = ei2π = ei4π = ei6π = . . .
Allgemein:
1 = ei2πk
mit
k∈Z
(67)
Alle zu 1 gehörenden Winkelkoordinaten 2πk mit k ∈ Z zeigen vom Ursprung aus in die
positive Richtung der rellen Achse, also eben in die Richtung von 1. Sie unterscheiden sich
lediglich darin, dass sie unterschiedlich viele ganze Umdrehungen (±2π) im Gegen- oder im
Uhrzeigersinn enthalten, was an der Zahl 1 aber nichts ändert.
Bei der nachfolgenden Lösung von z n = 1 soll die 1 durch ihre Euler-Darstellung ersetzt
werden. Um bei dieser Ersetzung garantiert keine Lösungen zu verlieren, dürfen wir keine
mögliche Winkelkoordinate von 1 einfach von vornherein ausschliessen. Wir sollten also ganz
unbedingt den allgemeinen Ausdruck 1 = ei2πk verwenden.
Mit der Euler-Darstellung von z n in (66) und derjenigen von 1 in (67) folgt nun:
zn = 1
einϕ = ei2πk
⇒
mit k ∈ Z
Damit die beiden Seiten der Gleichungen wirklich gleich sind, müssen die Winkelkoordinaten
übereinstimmen (= Identifikationstrick für Winkelkoordinaten, vgl. Seite 69):
nϕ = 2πk
79
mit
k∈Z
Für die möglichen Winkelkoordinaten erhalten wir daraus:
2π
k
mit k ∈ Z
n
Das sieht zunächst nach unendlich vielen Lösungen aus, weil k ja alle ganzen Zahlen von −∞
bis +∞ durchläuft. In Tat und Wahrheit gibt es aber nur genau n verschiedene Lösungen.
ϕ=
Wir überlegen: 2π
n ist der n-te Teil einer ganzen Umdrehung. Lässt man k bei 0 starten, so
erreicht ϕ = 2π
k
bei k = n den Wert ϕ = 2π und eine ganze Umdrehung ist abgeschlossen.
n
Die Winkelkoordinate ϕ = 2π gehört, ebenso wie die Winkelkoordinate ϕ = 0, zur Zahl z = 1.
Für k = n, n+1, n+2, . . . ergeben sich nun lauter Winkelrichtungen, die wir bereits abgedeckt
haben. Starten wir bei k = 0, so entsteht die letzte wirklich neue Winkelrichtung bei k = n−1.
Auch für negative k erhalten wir lauter Winkelrichtungen, die bereits abgedeckt sind.
Somit lassen sich die n echt verschiedenen Winkelwerte folgendermassen notieren:
2π
k
mit k = 0, 1, 2, . . . , n − 1
n
Fassen wir dieses Resultat allgemein zusammen:
ϕ=
Die n-ten Einheitswurzeln
Als n-te Einheitswurzeln bezeichnet man die Lösungen der Gleichung:
zn = 1
mit
n∈N
Zu jedem n gibt es n verschiedene Einheitswurzeln, nämlich:
2π
z = ei n k
mit
k = 0, 1, . . . , n − 1
Eine dieser Einheitswurzeln ist stets die reelle Einheit 1 selber. Die weiteren
Einheitswurzeln liegen von 1 ausgehend gleichverteilt auf dem Einheitskreis
der komplexen Ebene.
Die Einheitswurzeln werden so genannt, weil die Zahl 1 die (reelle) Einheit ist und die Gleichung
z n = 1 im klassischen Sinn eben nach den n-ten Wurzeln von 1 fragt.
Ein paar Beispiele (siehe Abb. 38): Als 2. Einheitswurzeln (= Quadratwurzeln von 1) ergeben
sich:
2π
z2 = 1
⇒
z1 = ei·0 = 1
z2 = ei 2 = eiπ = −1
Diese Lösungen kennen wir bereits aus dem Reellen!
Für die 3. Einheitswurzeln erhalten wir:
z3 = 1
⇒
z1 = ei·0 = 1
z2 = ei
2π
3
z3 = ei
4π
3
= e−i
2π
3
= z2∗
Die zweite und die dritte Lösung existieren, kommen aber einfach nicht auf den Strahl der
reellen Zahlen zu liegen! Daher gibt es in der Einschränkung auf die reellen Zahlen eben keine
andere dritte Wurzeln von 1 als die 1 selber.
Wir stellen fest: Eine Einheitswurzel oberhalb der reellen Achse hat stets ein Gegenüber
unterhalb der reellen Achse (Spiegelpunkt). D.h., das konjugiert Komplexe einer n-ten Einheitswurzel ist immer noch eine n-te Einheitswurzel. Wie wir auf Seite 75 bemerkt hatten,
wechselt beim Übergang zum konjugiert Komplexen in der Euler-Darstellung einfach das Vorzeichen des Exponenten. Somit gilt eben bei den 3. Einheitswurzeln z.B.:
2π
2π ∗
= e−i 3
z3 = z2∗ = ei 3
80
Betrachten wir auch noch die 4. und die 5. Einheitswurzeln:
z4 = 1
⇒
z1 = 1
z2 = ei
2π
4
z5 = 1
⇒
z1 = 1
z2 = ei
2π
5
π
= ei 2 = i
z3 = ei
4π
5
z3 = eiπ = −1
z4 = z3∗
z4 = z2∗ = −i
z5 = z2∗
Abbildung 38: Beispiele von n-ten Einheitswurzeln. Stets verteilen sie sich gleichmässig auf dem
Einheitskreis. Die 1 gehört immer dazu.
81
5.6.2
Mehr vom Wurzelziehen im Komplexen
Komplexe Wurzeln von positiven reellen Zahlen: Ausgehend von den Einheitswurzeln können
wir unsere “Wurzelzieh-Fähigkeiten” nun rasch weiter ausbauen. Zunächst wollen wir nun die
n-te Wurzel nicht nur von 1, sondern von einer beliebigen positiven, reellen a Zahl bestimmen.
Es sei also:
zn = a
mit a ∈ R+
Da sich ein solches a in der Form a = a ei2πk mit k ∈ Z schreiben lässt und wir auch z wieder
in der Euler-Darstellung notieren können, ergibt sich:
z n = r n einϕ = a ei2πk
mit k ∈ Z
Nun müssen auf der linken Seite und der rechten Seite sowohl die Beträge, wie auch die
Winkelkoordinaten übereinstimmen. Der Identifikationstrick funktioniert also auch bei Polarkoordinaten, weil sowohl der Betrag, als auch die Winkelrichtung einer bestimmten komplexen
Zahl eindeutig sind. Daraus folgt für den Betrag von z:
√
rn = a
⇒
r= na
√
Hier meint n a die althergebrachte n-te Wurzel im Reellen. Sie ist selber stets positiv und
eindeutig und existiert in jedem Fall, weil wir ja davon ausgegangen sind, dass a ∈ R+ .
Die Winkelkoordinaten-Gleichung einϕ = ei2πk haben wir bereits bei den Einheitswurzeln behandelt und wir kennen ihre n echt verschiedenen Lösungen:
ϕ=
2π
k
n
mit
k = 0, . . . , n − 1
Somit lässt sich für die n-ten Wurzeln einer positiven reellen Zahl a zusammenfassen:
zn = a
mit
a ∈ R+
⇒
z=
√
n
2π
a ei n k
mit
k = 0, . . . , n − 1
In der komplexen Ebene liegen diese n-ten Wurzeln allesamt auf einem Kreis mit Radius
√
r = n a um den Ursprung. Die Winkelrichtungen sind immer noch dieselben wie bei den n-ten
Einheitswurzeln.
Wurzeln beliebiger komplexer Zahlen: Schliesslich sei nun a ∈ C eine beliebige komplexe Zahl
mit Betrag |a| und Winkelkoordinate α:
a = |a| eiα
Damit lautet unsere Wurzelgleichung in Euler-Darstellung:
z n = r n einϕ = |a| ei(α+2πk)
mit k ∈ Z
Wir bemerken einmal mehr: Die Winkelkoordinate α ist nicht ganz strikt festgelegt, sie kann um
beliebige Vielfache von 2π variieren. Dadurch werden auch hier wiederum n echt verschiedene
Lösungen erzeugt:
nϕ = α + 2πk
⇒
ϕ=
α 2π
+
k
n
n
mit
k = 0, . . . , n − 1
Nun wissen wir vollständig Bescheid über die Lösungen einer Wurzelgleichung im Komplexen:
p
α
2π
mit k = 0, . . . , n − 1
z n = a mit a ∈ C
⇒
z = n |a| ei n + n k
82
Eine Zwischenbemerkung zur Wurzelnotation: Wie Ihnen vielleicht schon aufgefallen ist, ver√
wenden wir das klassische Wurzelsymbol . . . nicht für komplexe Zahlen. Wir schreiben für
√
die Lösungen von z n = a also nicht z = n a.
Mittlerweile verstehen Sie gut, weshalb wir das nicht machen. Die n-te Wurzel einer komplexen Zahl ist ja alles andere als eindeutig. Es gibt immer n verschiedene Lösungen von
z n = a. Im Reellen hatte es noch behelfsmässig funktioniert festzulegen, dass die Wurzel
2
immer positiv
√ z.B. x = 5
√ sein soll. So wusste man immer, welche der beiden Lösungen von
mit x = 5 gemeint war. Die gesamte Lösungsmenge lautete dann x = ± 5. Mit den n
Lösungen im Komplexen wird es da allerdings schwierig, sodass wir eben festlegen, unter dem
althergebrachten Wurzelsymbol keine komplexen Zahlen zu notieren!66
Der Platz unter einer Wurzel ist ausschliesslich für positive, reelle Zahlen reserviert!
Trotzdem sprechen wir von den n-ten Wurzeln der komplexen Zahl a. Damit meinen wir
– zur Erinnerung – alle Lösungen der Gleichung:
zn = a
mit
n∈N
und
a∈C
Wurzeln als Drehstreckungen: Wie wir schon gesehen haben, steht die Multiplikation mit einer
komplexen Zahl z = r eiϕ für eine Drehstreckung um den Ursprung der Gauss’schen Zahlenebene. z n steht somit für die n-malige Ausführung einer bestimmten Drehstreckung – ausgehend
von welcher Zahl? Von 1 aus, denn wir können stets schreiben:
z n = 1 · |z · .{z
. . · z}
n−mal
zn
Mit dem Lösen der Gleichung
= a bestimmen wir also alle Drehstreckungen z, die mich,
ausgehend vom Ort der reellen Einheit 1, nach n-facher Ausführung zur Zahl a bringen!
Konkrete Beispiele: Zum Schluss zwei handfeste Beispiele:
• Quadratwurzeln von a = 3 ei3π/4 :
a = 3 ei3π/4 liegt im 2. Quadranten der komplexen Ebene (vgl. Abb. 39). Wir ermitteln
Ihre Quadratwurzeln resp. eben die beiden Lösungen der Gleichung z 2 = 3 ei3π/4 :
√
√
3π
3π
2π
z = 3 ei 2·4 + 2 k = 3 ei 8 +πk
mit k = 0, 1
√ 11π
√ 3π
√
3π
⇒ z1 = 3 ei 8 und z2 = 3 ei 8 +π = 3 ei 8
√
Diese beiden Quadratwurzeln sitzen auf dem Kreis mit Radius 3 und zwar bei den
3π
11π
Winkeln ϕ1 = 3π
8 und ϕ2 = 8 + π = 8 .
Natürlich könnte man den Winkel ϕ2 auch im Intervall ] − π; π] angeben. Das wäre
5π
dann ϕ2 = 11π
8 − 2π = − 8 . Es ist für unsere Zwecke aber nicht wirklich wichtig diese
Umrechnung vorzunehmen – Hauptsache, wir haben die beiden Wurzeln mit je mindestens
einer korrekten Winkelkoordinatenangabe aufgespürt.
z1 und z2 stehen nun einerseits für einen Punkt in der Gauss’schen Zahlenebene, andererseits beschreiben sie eine Drehstreckung, die uns in bei doppelter Ausführung von der
reellen Einheit 1 zur Zahl a = 3 ei3π/4 führt. Das sehen Sie in Abb. 39.
1
ei5π/8 : Abb. 40 illustriert das folgende Beispiel:
• Die 5. Wurzeln von a = √
4 2
s
5π
π
2π
2π
5π
1
1
1
⇒ z = 5 √ ei 8 /5+ 5 k = √ ei 8 + 5 k
z 5 = √ ei 8
mit k = 0, . . . , 4
4 2
4 2
2
66
Allenfalls haben Sie sich schon gewundert, warum man die imaginäre Einheit i nicht einfach als
Nun haben Sie einen Grund dafür kennengelernt.
83
√
−1 definiert.
√
Abbildung
39: Die beiden Quadratwurzeln einer komplexen Zahl: Sowohl z1 = 3 ei3π/8 , also auch
√ i11π/8
lösen die Gleichung z 2 = a = 3 ei3π/4 . Beide Zahlen können als Vorschriften für
z2 = 3 e
eine Drehstreckung angesehen werden (Multiplikation mit einer komplexen Zahl). Die hintereinander
ausgeführten, identischen Drehstreckungen müssen von 1 nach a führen.
Abbildung 40: Die fünf 5. Wurzeln von a =
84
1
√
4 2
ei5π/8 .
5.6.3
Quadratische Gleichungen im Komplexen
Repetition: Reelle quadratische Gleichungen
Innerhalb der reellen Zahlen gibt es zu einer quadratischen Gleichung ax2 + bx + c = 0 (a, b, c ∈ R)
entweder keine, eine oder zwei Lösungen x. Man kann die drei Fälle klar voneinander unterscheiden:
Zwei Lösungen: Die quadratische Funktion f (x) = ax2 + bx + c auf der linken Gleichungsseite
lässt sich mittels eines Zweiklammeransatzes faktorisieren, also in die Nullstellenform bringen:
f (x) = ax2 + bx + c = a(x − x1 )(x − x2 ) = 0
mit
x1 , x2 ∈ R
Dann sind x1 , x2 ∈ R die beiden Lösungen der quadratischen Gleichung. Entdeckt man den
Zweiklammeransatz nicht auf Anhieb, so lassen sich x1 und x2 via Mitternachtsformel finden:
√
−b ± b2 − 4ac
x1/2 =
2a
Darin ist der Ausdruck unter der Wurzel die sogenannte Diskriminante D = b2 − 4ac. Durch
das ± im Zähler entstehen die beiden Lösungen. Die Parabel, also der Funktionsgraph zu f (x),
schneidet die x-Achse zweimal, eben bei den beiden Nullstellen x1 und x2 (vgl. Abb. 41).
Eine Lösung: Verschwindet die Diskriminante, D = 0, so fallen die beiden Lösungen x1 und x2
zusammen. Die Faktorisierung von f (x) entspricht dann der zweiten binomischen Formel:
f (x) = ax2 + bx + c = a(x − x1 )2 = 0
mit
z1 = −
b
2a
Graphisch betrachtet sitzt dann der Scheitelpunkt der Parabel zu f (x) auf der x-Achse.
Keine Lösung: f (x) = ax2 + bx + c lässt sich nicht faktorisieren. D.h. es gibt keinen Zweiklammeransatz f (x) = a(x − x1 )(x − x2 ) mit a, x1 , x2 ∈ R. Damit einher geht, dass die Diskriminante
D = b2 − 4ac einen negativen Wert annimmt und somit in der Mitternachtsformel unter der
Wurzel eine negative Zahl steht, was innerhalb der reellen Zahlen eben zu keiner Lösung führt.
In diesem Fall schneidet die Parabel die x-Achse nicht.
Abbildung 41: Die Lösungen quadratischer Gleichungen entsprechen den Nullstellen von Parabeln.
Daher gibt es Fälle mit zwei, einer oder keiner Lösung.
85
Komplexe Quadratische Gleichungen
Betrachten wir die Angelegenheit nun im Komplexen:
f (z) = az 2 + bz + c = 0
mit
a, b, c, z ∈ C
Neu ist nicht nur, dass die Variabel z komplex ist. Auch die Koeffizienten a, b, c dürfen im allgemeinen
Fall komplex sein. Und nun kommt die klare Aussage dazu:
Im Komplexen gibt es zu jeder quadratischen Gleichung stets zwei
Lösungen z1 und z2 , die als Spezialfall zusammenfallen können.
D.h., f (z) lässt sich im Komplexen immer in zwei Klammern faktorisieren, also in Nullstellenform
bringen:
f (z) = az 2 + bz + c = a(z − z1 )(z − z2 ) = 0
mit z1 , z2 ∈ C
z1 und z2 lassen sich nach wie vor durch die Mitternachtsformel bestimmen:
√
−b ± b2 − 4ac
z1/2 =
2a
Die Wurzel der Diskriminante kann innerhalb von C auf jeden Fall gezogen werden, sodass sicher
√
zwei Lösungen existieren. Allerdings haben wir gelernt, dass die Wurzelschreibweise a aus Gründen
der Eindeutigkeit für positive, reelle Zahlen a ∈ R+
0 reserviert ist. Wir schreiben daher korrekter:
z1/2 =
−b + w1/2
2a
wobei w1/2 die Lösungen von
w2 = D = b2 − 4ac
sind
Im Spezialfall D = 0 resp. w = 0 fallen die beiden Lösungen immer noch zusammen, dann gibt es
auch innerhalb von C nur eine einzige Lösung und die Faktorisierung der quadratischen Funktion
lautet:
f (z) = a(z − z1 )2
Beispiel 1: Starten wir mit reellen Koeffizienten. Wir interessieren uns für die Faktorisierung von:
f (z) =
1 2
z − 3z + 9
2
Diese quadratische Funktion kann im Reellen nicht faktorisiert werden, weil D = b2 − 4ac =
32 − 4 · 12 · 9 = −9. Im Komplexen ist nun allerdings:
w2 = D = −9
⇒
w1/2 = ±3i
Als Lösungen von f (z) = 0 ergeben sich damit (siehe Abb. 42):
z1/2 =
−b + w1/2
3 ± 3i
=
= 3 ± 3i
2a
2 · 21
Und damit lautet die Faktorisierung von f (z):
f (z) =
1 2
1
1
z − 3z + 9 = (z − z1 )(z − z2 ) = (z − 3 + 3i)(z − 3 − 3i)
2
2
2
Sie können durch Ausmultiplizieren selber überprüfen, dass dies so korrekt ist. Dazu ein Tipp:
Die beiden Klammern haben eine binomische Form (a + b)(a − b) mit a = z − 3 und b = 3i.
Beim Ausmultiplizieren lohnt sich es sich daher die dritte binomische Formel auszunützen:
(a + b)(a − b) = a2 − b2
86
Beispiel 2: Jetzt betrachten wir eine Funktion mit komplexem konstanten Term c = 2 + 2i
f (z) =
1 2
z − 2z + 2 + 2i
2
Wir berechnen die Diskriminante und wandeln sie in Polarkoordinaten um:
1
· (2 + 2i) = 4 − 4 − 4i = −4i (rein imaginär)
2
π
π
Polarkoordinaten: |D| = 4 und δ = −
⇒ D = 4 e−i 2
2
D = b2 − 4ac = 22 − 4 ·
⇒
Nun folgt für die Wurzeln der Diskriminante und daraus für die Lösungen von f (z) = 0:
−i π4 +π
−i π4
−i π4
w1 = 2 e
eiπ = −w1
und w2 = 2 e
= 2| e{z
} · |{z}
= w1
z1/2 =
−i π4
−b + w1/2
−b ± w1
2 ± 2e
=
=
2a
2a
2 · 12
=−1
π
= 2 ± 2 e−i 4
In der komplexen Ebene liegen sich die beiden Lösungen somit gegenüber auf einem Kreis mit
Radius 2 rund um die Zahl 2 auf der reellen Achse (vgl. Abb. 42). Für die faktorisierte Form
von f (z) können wir schreiben:
π
π
1
f (z) =
z − 2 − 2 e−i 4 z − 2 + 2 e−i 4
2
Zur Übung sollten Sie sich davon überzeugen, dass Sie durch Ausmultiplizieren wieder den
anfänglichen Ausdruck für f (z) erhalten.
Natürlich lassen sich die Lösungen auch in kartesischen Koordinaten schreiben, z.B. für z1 :
√ !
√
−π −π √
√
2
2
−i π4
= 2 + 2 cos
z1 = 2 + 2 e
+ i sin
=2+ 2−i 2
−i
=2+2
4
4
2
2
Abbildung 42: Die komplexen Lösungen zu den beiden Beispielen quadratischer Gleichungen: Die
beiden Lösungen können (mit Ausnahme des Zusammenfallens in einem Punkt) stets als gegenüberliegende Punkte auf einem Kreis aufgefasst werden. Der Kreis muss seinen Mittelpunkt aber nicht
notwendigerweise auf seiner reellen Achse haben, wie man hier eventuell denken könnte.
87
5.6.4
Darstellung komplexer Funktionen
Bitte bemerken Sie: Anders als Abb. 41 zeigt Abb. 42 keine Funktionsgraphen! Das Einzige, was zu
sehen ist, sind zwei komplexe Zahlen (= Punkte in der komplexen Ebene), die Null ergeben, wenn
man sie in die jeweilige quadratische Funktion f (z) einsetzt.
Die graphische Veranschaulichung komplexer Funktionen ist nicht mehr so einfach möglich. Unser
altes f (x) = ax2 + bx + c (mit a, b, c, x ∈ R) beschreibt eine Abbildung von R nach R, also von
einer eindimensionalen auf eine eindimensionale Zahlenmenge. Wir schreiben:
f :R→R
Damit lässt sich f (x) auf einem Blatt Papier gut darstellen. Jedem x auf einem ersten, horizontal
liegenden, reellen Zahlenstrahl (x-Achse) wird ein Wert y auf einem zweiten, vertikal verlaufenden,
reellen Zahlenstrahl (y-Achse) zugeordnet. So entstehen die Ihnen bekannten Funktionsgraphen.
Bei einer komplexen Funktionen wird hingegen jedem Punkt z in der Gauss’schen Zahlenebene
ein komplexer Funktionswert f (z) zugeordnet, der wiederum als Punkt irgendwo in der komplexen Ebene liegt. f (z) ist somit eine Abbildung von der zweidimensionalen Zahlenmenge C auf die
zweidimensionale Zahlenmenge C:
f :C→C
Das macht die Darstellung der komplexen Funktion als Ganzes unmöglich. Sie lässt sich nur eingeschränkt darstellen. Z.B. kann man das Abbild einer bestimmten Teilmenge darstellen.
In Abb. 43 werden sämtliche Punkte in der komplexen Ebene links mittels der Funktion f (z) =
1 2
z
− 2z + 2 + 2i auf Punkte in der komplexen Ebene rechts abgebildet. Um eine Ahnung zu bekom2
men, was dabei so alles passiert, betrachten wir die Abbildungen einzelner Punkte oder Punktstränge
von der linken in die rechte Graphik:
π
Nullstellen z1 und z2 : Die Nullstellen von f (z) lauten immer noch: z1/2 = 2 ± 2 e−i 4 . D.h., die
beiden Punkte z1 und z2 links werden rechts auf den Ursprung 0 abgebildet.
Punkt/Zahl A: Der komplexen Zahl A = 1 − 2i wird folgender Bildpunkt A′ zugeordnet:
A′ = f (A) =
1 2
1
3
A − 2A + 2 + 2i = (1 − 2i)2 − 2(1 − 2i) + 2 + 2i = . . . = − + 4i
2
2
2
Gerade g: Die Gerade g verläuft links in Abb. 43 durch die Nullstelle z1 . Demzufolge durchquert
das Abbild g′ dieser Gerade rechts genau einmal den Nullpunkt 0. Interessanterweise besitzt
g ′ die Form einer Parabel.
Kreis c: Der Kreis c links wurde so gewählt, dass die beiden Nullstellen z1 und z2 auf ihm liegen.
Das bedeutet, sein Abbild c′ muss rechts zweimal durch den Ursprung 0 verlaufen.
Wir sehen, was für eine “lustige” Kurve entsteht. Sie schliesst sich – wie das beim Kreis ja
auch der Fall ist – macht aber in gewisser Weise zwei Umläufe.
Um noch besser zu sehen, was durch f (z) wie von links nach rechts abgebildet wird, sind
die obere und die untere Kreishälfte unterschiedlich eingefärbt und diese Farben sind nach
rechts übertragen. Jeder Halbkreis enthält eine der beiden Nullstellen. Demnach erfolgt der
0-Durchgang rechts einmal in Blau und einmal in Rot.
Normalparabel q: Schliesslich habe ich links noch eine Parabel (alle Zahlen z = x + iy mit x2 = y)
eingetragen. Wir sehen das hübsch geschwungene Abbild q ′ davon rechts.
Die Gerade g wurde übrigens genau so gelegt, dass sie eine Tangente an die Parabel q ist.
Es gibt also einen Berührungspunkt S. Dessen Abbild S ′ ist auch auf der rechten Seite ein
Berührungspunkt zwischen q ′ und g′ .
88
Abbildung 43: Komplexe Abbildungen: Jede Funktion f (z) weist einer komplexen Zahl z eine andere
komplexe Zahl f (z) zu. Da es sich bei z und f (z) je um einen Punkt in der Gauss’schen Zahlenebene
handelt, ist eine Darstellung der Funktion insgesamt nicht möglich. Allerdings lassen sich die Abbilder
einzelner Punkte oder Kurven betrachten.
5.6.5
Der Fundamentalsatz der Algebra
Wie Sie aufgrund des obigen – noch relativ einfachen – Beispiels der komplexen Funktion f (z) =
1 2
2 z − 2z + 2 + 2i bereits erahnen können, dürfte die Untersuchung komplexer Funktionen resp.
Abbildungen ein spannenderes und grösseres Gebiet der Mathematik sein. Man nennt es komplexe Analysis oder Funktionentheorie. Damit werden wir uns allerdings nicht vertieft beschäftigen
können, obwohl die daraus gewonnen Erkenntnisse und neuen Methoden sehr toll sind. Eine der
wichtigsten Aussagen wollen wir aber nicht unerwähnt lassen:
Fundamentalsatz der Algebra
Gegeben sei eine (komplexe) Polynomfunktion n-ten Grades fn (z) mit
Koeffizienten a0 , . . . , an ∈ C:
fn (z) = an z n + an−1 z n−1 + . . . + a2 z 2 + a1 z + a0
Der Fundamentalsatz der Algebra besagt, dass jedes beliebige solche
fn (z) in genau n Klammern faktorisiert werden kann:
fn (z) = an (z − z1 )(z − z2 ) · . . . · (z − zn )
D.h., fn (z) besitzt genau n Nullstellen z1 , z2 , . . . , zn ∈ C, von denen
allerdings mehrere oder sogar alle identisch sein können.
Ohne Beschränkung der Allgemeinheit (O.B.d.A.) können wir also sagen,
dass die Gleichung fn (z) = 0 im Komplexen stets n Lösungen hat.
Wir verzichten auf den Beweis dieses Satzes, nehmen aber zur Kenntnis, dass wir damit z.B. verstehen, weshalb die Gleichung z n = 1 gerade n verschiedene Einheitswurzeln liefert. So hat das
Polynom fn (z) = z n − 1 eben n verschiedene Nullstellen. Z.B. ist für n = 3:
2π
4π
z 3 = 1 ⇒ f3 (z) = z 3 − 1 = 0 ⇒ f3 (z) = (z − 1) z − ei 3
z − ei 3 = 0
Dass diese Faktorisierung korrekt ist, können Sie via Ausmultiplizieren selber überprüfen!
89
5.6.6
Die trigonometrischen Additionstheoreme
Hier folgt ein Paradebeispiel dafür, wie toll sich manche reellen Zusammenhänge mit dem Umweg
über das Komplexe behandeln lassen. Es geht um die Herleitung der sogenannten trigonometrischen
Additionstheoreme.
Für manche Zwecke – in der Physik z.B. für das Verständnis sich überlagernder Schallwellen in
der Akustik – wäre es praktisch die Sinus- oder die Cosinusfunktion einer Summe zweier Winkel in
Funktionen der Einzelwinkel zu zerlegen. Wir möchten also wissen, wie sich sin(α+β) und cos(α+β)
als Kombination von sin α, cos α, sin β und cos β schreiben lassen.
Das scheint nicht ganz trivial zu sein! Abb. 44 zeigt die verschiedenen involvierten Grössen.
Gibt es da überhaupt einen Zusammenhang? Die Antwort lautet: Ja! Und er liesse sich durchaus
im Reellen herleiten, aber der Weg über das Komplexe ist nun so wunderbar einfach, dass es eine
Schande wäre ihn nicht zu benutzen!
Zunächst stellen wir unter Verwendung der Euler-Darstellung fest:
ei(α+β) = cos(α + β) + i sin(α + β)
| {z }
| {z }
=Re ei(α+β)
=Im ei(α+β)
Andererseits gilt bei der Multiplikation von Potenzen mit gleicher Basis aber eben auch:
ei(α+β) = eiα · eiβ = (cos α + i sin α)(cos β + i sin β)
= cos α cos β + i cos α sin β + i sin α cos β + i2 sin α sin β
= cos α cos β − sin α sin β + i (cos α sin β + sin α cos β)
{z
}
|
|
{z
}
=Re ei(α+β)
=Im ei(α+β)
Nun vergleichen wir die beiden Ausdrücke für ei(α+β) . Weil Realteil und Imaginärteil einer bestimmten
komplexen Zahl eindeutig sind, müssen sie in beiden Ausdrücken übereinstimmen. Dies ist einmal
mehr der Identifikationstrick von Seite 69. Daraus folgen sofort die beiden Additionstheoreme
für die Cosinus- und die Sinusfunktion:
cos(α + β) = cos α cos β − sin α sin β
sin(α + β) = cos α sin β + sin α cos β
(68)
Abbildung 44: Welche Grössen werden durch die Additionstheoreme miteinander verknüpft?
90
Unter Verwendung der Symmetrieeigenschaften cos(−α) = cos α und sin(−α) = − sin α lassen
sich diese beiden Additionstheoreme auch für Winkeldifferenzen umschreiben:
cos(α − β) = cos α cos β + sin α sin β
sin(α − β) = cos α sin β − sin α cos β
(69)
Die trigonometrischen Additionstheoreme sind immer wieder nützlich. Insbesondere lassen sich aus
ihnen auch die sogenannten Doppelwinkelformeln ableiten:
cos(2α) = cos2 α − sin2 α
(70)
sin(2α) = 2 sin α cos α
Die Cosinusformel kann unter der Verwendung des trigonometrischen Pythagoras sin2 α+cos2 α = 1
noch weiter umgeformt werden, sodass darin wahlweise nur noch cos2 α oder sin2 α auftritt:
cos(2α) = cos2 α − sin2 α = (1 − sin2 α) − sin2 α = 1 − 2 sin2 α
cos(2α) = cos2 α − sin2 α = cos2 α − (1 − cos2 α) = 2 cos2 α − 1
resp.
(71)
Daraus folgt weiter:
sin2 α =
1 1
− cos(2α)
2 2
und
cos2 α =
1 1
+ cos(2α)
2 2
(72)
sin2 α und cos2 α sind also selber wieder Cosinuskurven, allerdings mit halber Wellenlänge, denn
diese wird durch den Faktor 2 im Argument der Cosinusfunktion halbiert (vgl. Abb. 45).
Diese Umformungen ermöglichen uns beispielsweise beim Integrieren die Stammfunktionen von
sin2 α und von cos2 α zu bestimmen.
Abbildung 45: Die Graphen der Funktionen cos2 x und sin2 x sind selber wieder Cosinusfunktionen,
die mit Amplitude 12 , aber doppelt so “schnell” um die mittlere Höhe y = 12 schwanken.
91
5.6.7
Cosinus- und Sinusfunktion als Linearkombinationen von eiϕ und e−iϕ
Für eine Zahl z auf dem Einheitskreis in der Gauss’schen Zahlenebene und ihr konjugiert Komplexes
z ∗ gilt gemäss der Euler-Gleichung (64) bekanntlich:
z = eiϕ = cos ϕ + i sin ϕ
z ∗ = e−iϕ = cos ϕ − i sin ϕ
und
eiϕ und e−iϕ lassen sich also mittels geeigneter Koeffizienten ci ∈ C als Summe von cos ϕ und sin ϕ
darstellen:
eiϕ = c1 · cos ϕ + c2 · sin ϕ
e−iϕ = c3 · cos ϕ + c4 · sin ϕ
mit c1 = 1
und
c2 = i
mit c3 = 1
und
c4 = −i
Weil diese Summendarstellung möglich ist, sagen wir in der Sprache der höheren Algebra: “Die
Funktionen eiϕ und e−iϕ sind Linearkombinationen der beiden Funktionen cos ϕ und sin ϕ.” Der
Wortteil “linear” kommt daher, dass cos ϕ und sin ϕ in diesen beiden Summen nur mit Potenz 1
auftreten, dass also keine Terme mit sin2 ϕ oder cos5 ϕ, etc. benötigt werden.
In die umgekehrte Richtung überlegen wir uns:
eiϕ + e−iϕ = cos ϕ + i sin ϕ + cos(−ϕ) + i sin(−ϕ)
= cos ϕ + i sin ϕ + cos ϕ − i sin ϕ = 2 cos ϕ
Dabei haben wir ausgenutzt, dass die Cosinusfunktion achsensymmetrisch und die Sinusfunktion
punktsymmetrisch ist: cos(−ϕ) = cos ϕ und sin(−ϕ) = − sin ϕ. Es folgt:
cos ϕ =
1 iϕ 1 −iϕ eiϕ + e−iϕ
e + e
=
2
2
2
Analog finden wir:
eiϕ − e−iϕ = . . . = 2i sin ϕ
⇔
sin ϕ =
1 iϕ
1
eiϕ − e−iϕ
e − e−iϕ =
2i
2i
2i
cos ϕ und sin ϕ lassen sich also ebenso als Linearkombinationen von eiϕ und e−iϕ darstellen.
Graphisch ist der Zusammenhang übrigens leicht nachzuvollziehen. Erinnern wir uns daran, dass
die Addition zweier komplexer Zahlen in der Gauss’schen Zahlenebene dem Aneinanderhängen zweier
Pfeile entspricht, so führt uns eiϕ + e−iϕ auf die reelle Achse an den Ort 2 cos ϕ und eiϕ − e−iϕ auf
die imaginäre Achse an den Ort 2i sin ϕ, wie Abb. 46 veranschaulicht.
Halten wir dieses wichtige Resultat nochmals ganz explizit fest:
Euler-Schreibweisen für cos ϕ und sin ϕ
Cosinus- und Sinusfunktion lassen sich als Linearkombinationen von eiϕ und
dessen konjugiert Komplexen e−iϕ schreiben:
cos ϕ =
eiϕ + e−iϕ
2
und
sin ϕ =
eiϕ − e−iϕ
2i
(73)
Wir wollen uns diese Beziehungen unter dem (inoffiziellen) Namen EulerSchreibweisen von cos ϕ und sin ϕ merken, weil sie direkt aus der EulerGleichung eiϕ = cos ϕ + i sin ϕ folgen.
92
Abbildung 46: Die Summe und die Differenz von eiϕ und e−iϕ führen einerseits auf die reelle Achse
zur Stelle 2 cos ϕ, andererseits auf die imaginäre Achse zur Stelle 2i sin ϕ.
Die Euler-Schreibweisen für cos ϕ und sin ϕ sind ab und zu extrem praktisch. So lassen sich
aus manchmal unhandlichen trigonometrischen Ausdrücken rasch komplexe Exponentialausdrücke
gewinnen, mit denen das Rechnen aufgrund der Potenzgesetze leichter fällt. Beispiele gefällig?
Beispiel 1: Wie lässt sich das Produkt cos ϕ sin ϕ zusammenfassen/vereinfachen?
Wenn Sie sich an die Additionstheoreme erinnern, kennen Sie die Antwort bereits. Die Doppelwinkelformel für die Sinusfunktion lautet: sin(2ϕ) = 2 cos ϕ sin ϕ. Somit müssen wir finden:
cos ϕ sin ϕ = 12 sin(2ϕ). Und davon können wir uns nun eben in wenigen Schritten überzeugen:
eiϕ + e−iϕ eiϕ − e−iϕ
ei2ϕ − 1 + 1 − e−i2ϕ
·
=
2
2i
2 · 2i
i2ϕ
−i2ϕ
1 e −e
1
= ·
= sin(2ϕ)
2
2i
2
cos ϕ sin ϕ =
Beispiel 2: Sie haben schon seit jeher gelernt, dass die Ableitung der Sinusfunktion die Cosinusfunktion ist. Mit der Euler-Schreibweise zeigt man das ganz rasch:
d eiϕ − e−iϕ
eiϕ + e−iϕ
ieiϕ − (−i)e−iϕ
d
(sin ϕ) =
=
= cos ϕ
=
dϕ
dϕ
2i
2i
2
Beachten Sie: Die Kettenregel erzeugt bei der Ableitung von e±iϕ die Faktoren ±i!
An dieser Stelle sei zudem ganz explizit darauf hingewiesen, dass die Ableitungsregeln im
Komplexen ganz genau gleich funktionieren wie im Reellen! Grund dafür ist einmal mehr,
dass die komplexen Zahlen C zusammen mit Addition und Multiplikation einen vollständigen
Zahlenkörper bilden.
93
5.6.8
Der harmonische Oszillator im Komplexen
Zum Schluss von Abschnitt 4.4.3 hatten wir auf Seite 44 nochmals die DGL für den klassischen,
harmonischen Oszillator (z.B. Federpendel) notiert:
x′′ = −ω 2 x
mit
ω2 =
D
m
Diese DGL wollen wir nun unter Verwendung komplexer Zahlen erneut lösen, allerdings mit einem
anderen Lösungsansatz. Die zweite Ableitung x′′ soll der gesuchten Ortsfunktion x(t) bis auf den
Vorfaktor −ω 2 entsprechen. Dann müsste eine Exponentialfunktion x(t) = C · eλt doch ein brauchbarer Ansatz sein, denn Exponentialfunktionen bleiben beim Ableiten als solche erhalten. Wir setzen
also neu an:
x(t) = C · eλt
mit
x′ (t) = λC · eλt = λx(t)
und
x′′ (t) = λ2 C · eλt = λ2 x(t)
Durch Einsetzen in die DGL folgern wir:
x′′ = λ2 x = −ω 2 x
⇒
λ2 = −ω 2
(74)
q
D
Dabei ist ω = m
eine positive reelle Zahl. Innerhalb der reellen Zahlen wären wir hier am Ende
einer Sackgasse angelangt, denn (74) besitzt ganz offensichtlich keine reellen Lösungen λ ∈ R.
Lassen wir für λ nun allerdings auch komplexe Werte zu, so lösen wir munter weiter:
λ = ±iω
Immer noch handelt es sich um eine DGL zweiter Ordnung, sodass wir bei der Angabe der allgemeinen
Lösung zwei Koeffizienten C1 und C2 einzufügen haben:
x(t) = C1 eiωt + C2 e−iωt
mit
x′ (t) = iω C1 eiωt − C2 e−iωt
Die Koeffizienten C1 und C2 dürfen nun aber auch komplex sein! Da sich cos(ωt) und sin(ωt) gemäss
(73) als Linearkombinationen von eiωt und e−iωt schreiben lassen, deckt unsere neue allgemeine
Lösung den genau gleichen Lösungsraum ab wie die Alte (Gleichung (42) auf Seite 44):
x(t) = A1 cos(ωt) + A2 sin(ωt)
Im Prinzip hätten wir damals auch für A1 und A2 komplexe Werte zulassen dürfen. Da aber die
Ortsfunktion x(t) zum Federpendel für alle Zeiten t reell sein muss, wären dadurch nur unbrauchbare,
weil komplexe Lösungen hinzugekommen, denn cos(ωt) und sin(ωt) sind selber ja reell.
Bringen wir das Beispiel noch rasch zuende: Die Randbedingungen unseres Federpendels waren
x(0) = A und v(0) = x′ (0) = 0. Daraus erhalten wir:
C e0 + C e0 = C + C = A
x(0) =! A A
2
1
2
1
⇒
⇒ C1 = C2 =
0
0
!
iω C1 e − C2 e = iω(C1 − C2 ) = 0 x′ (0) = 0 2
Damit lautet unsere an die RBs angepasste Lösung:
x(t) =
A iωt A −iωt
eiωt + e−iωt
e + e
=A·
= A cos(ωt)
2
2
2
Und somit sind wir bei der genau gleichen Lösung wie in (42) auf Seite 44 gelandet.
Im Moment mag Ihnen diese komplexe Vorgehensweise eher schwieriger erscheinen. In der Quantenmechanik geht es bei der Lösung von DGLs in der Regel aber um die Bestimmung einer grundsätzlich komlexwertigen Wellenfunktion Ψ (x, t)! Erst das Betragsquadrat |Ψ |2 = Ψ ∗Ψ muss reell sein,
was aber für Beträge ohnehin der Fall ist. Und im Zusammenhang mit dieser Wellenfunktion werden
wir Ausdrücke wie eiωt sehr schätzen lernen.
94
Literatur
[1] Griffiths, David J. (2012). Quantenmechanik, Lehr- und Übungsbuch (2., aktualisierte Auflage).
Hallbergmoos: Pearson Deutschland GmbH.
[2] Otto, Markus (2011). Rechenmethoden für Studierende der Physik im ersten Jahr
(Nachdruck 2013). Heidelberg: Spektrum Akademischer Verlag.
[3] Gertsch, Alex (2013). Theorie-Dossier “Mechanik”. Zürich.
[4] Gertsch, Alex (2015). Schwingungen und Wellen – Kurztheorie. Zürich.
[5] Beweis der Irrationalität der Wurzel aus 2 bei Euklid. 3.2016. Wikipedia:
https://de.wikipedia.org/wiki/Beweis der Irrationalität der Wurzel aus 2 bei Euklid
(Abruf: 20.4.2016)
[6] Deller, Henri, Gebauer, Peter & Zinn, Jörg (2000). Algebra 3, Aufgaben, Ergebnisse. Zürich:
Orell Füssli Verlag AG.
Herunterladen