MMP Ergänzungsskript

MATHEMATISCHE & PHYSIKALISCHE
ZUSÄTZE ZUM ERGÄNZUNGSFACH
“QUANTEN- UND ATOMPHYSIK”
Promotion 145
A. Gertsch
Zürich im August 2016
Inhaltsverzeichnis
1 Differenziation – Altes und Neues zur Ableitung
1.1 Die Ableitung als Steigung der Tangente an einen Funktionsgraphen
1.2 Die Ableitungsdefinition alt und neu betrachtet . . . . . . . . . . .
1.3 Repetition: Ein explizites Beispiel zur Ableitungsdefinition . . . . . .
1.4 Allgemeine Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . .
1.5 Ableitungen elementarer Funktionen . . . . . . . . . . . . . . . . .
1.6 Das infinitesimale Verständnis: Im unendlich Kleinen ist alles linear!
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
4
5
5
6
2 Altes und Neues zur Integration
2.1 Der Hauptsatz der Differenzial- und Integralrechnung . . . . . . . . . . .
2.1.1 Das bestimmte Integral als Fläche unter einem Funktionsgraphen
2.1.2 Der eigentliche Hauptsatz . . . . . . . . . . . . . . . . . . . . . .
2.1.3 Der Beweis des Hauptsatzes . . . . . . . . . . . . . . . . . . . .
2.1.4 Physikalische Saloppheit . . . . . . . . . . . . . . . . . . . . . .
2.1.5 Rechtecksflächen und Integralnotation . . . . . . . . . . . . . . .
2.1.6 Negative Integralwerte . . . . . . . . . . . . . . . . . . . . . . .
2.1.7 Unbestimmtes Integral, Integrationskonstante und Flächenfunktion
2.1.8 Das bestimmte Integral als Veränderung einer Grösse . . . . . . .
2.2 Allgemeine Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Auswahl unbestimmter Integrale . . . . . . . . . . . . . . . . . . . . . .
2.4 Integrationstechniken . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Symmetrien erkennen und ausnutzen . . . . . . . . . . . . . . . .
2.4.2 Erkennen äusserer und innerer Ableitungen . . . . . . . . . . . . .
2.4.3 Lineare Substitution . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.4 Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Spezielle bestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
7
8
10
10
12
13
14
15
15
16
16
18
19
22
23
24
3 Differenzialgleichungen – ein fundamental neuer Gleichungstyp
3.1 Was ist eine Differenzialgleichung (DGL)? . . . . . . . . . . . . . . . . . . . .
3.2 Erste Beispiele von DGLs (ohne physikalischen Kontext) . . . . . . . . . . . .
3.2.1 Stammfunktionen bestimmen . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Sinus- und Cosinusfunktion . . . . . . . . . . . . . . . . . . . . . . . .
3.2.4 Lineare, inhomogene DGL 2. Ordnung: . . . . . . . . . . . . . . . . .
3.3 Funktionen mit mehreren Variablen und partielle Ableitungen . . . . . . . . . .
3.3.1 Die Notation partieller Ableitungen . . . . . . . . . . . . . . . . . . . .
3.3.2 Weshalb verwendet man für partielle Ableitungen eine andere Notation?
3.3.3 Unser zentrales Beispiel: Wellenfunktion und Schrödingergleichung . . .
3.4 Differenzialoperatoren und mehrfache Ableitungen . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
27
27
27
28
30
30
30
31
31
32
.
.
.
.
.
.
.
.
33
33
36
38
39
39
39
40
44
4 Die
4.1
4.2
4.3
4.4
klassische Mechanik – eine differenzielle Theorie
Kinematik und Differentialrechnung . . . . . . . . . . . . . .
Kinematik und Integralrechnung . . . . . . . . . . . . . . . .
Das 2. Newton’sche Axiom als Differenzialgleichung . . . . . .
Beispiele zu Kraftgesetzen und daraus folgenden DGLs für x(t)
4.4.1 Freier Fall an der Erdoberfläche . . . . . . . . . . . . .
4.4.2 Fallen mit Luftwiderstand . . . . . . . . . . . . . . . .
4.4.3 Der klassische, ungedämpfte harmonische Oszillator . .
4.4.4 Gravitationsgesetz im Eindimensionalen . . . . . . . .
ii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.5
4.6
4.4.5 Beispiel für eine explizit von der Zeit abhängige Kraft . . . . . . . . . . .
Konservative Kräfte, Aktionsprinzip und Energieerhaltung . . . . . . . . . . . . .
4.5.1 Das Potenzial V (x, t) – ein allgemeinerer Blick auf die potenzielle Energie
4.5.2 Beispiele von Potenzialen und zugehörigen konservativen Kräften . . . . .
4.5.3 Energieerhaltung – das Aktionsprinzip mit konservativen Kräften . . . . .
Repetition/Ergänzung: Der klassische, ungedämpfte harmonische Oszillator . . .
4.6.1 Zwei wichtige Eigenschaften des klassischen harmonischen Oszillators . .
5 Komplexe Zahlen C
5.1 Althergebrachte Zahlenmengen . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Natürliche Zahlen N und ganze Zahlen Z . . . . . . . . . . . . . . .
5.1.2 Die rationalen Zahlen Q . . . . . . . . . . . . . . . . . . . . . . . .
5.1.3 Irrationale Zahlen I . . . . . . . . . . . . . .√. . . . . . . . . . . . .
5.1.4 Ein vielzitierter Beweis: Die Irrationalität von 2 . . . . . . . . . . .
5.1.5 Die reellen Zahlen R . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Die reellen Zahlen R als mathematischer Körper . . . . . . . . . . . . . . . .
5.2.1 Die neun Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.2 Anmerkungen zu Körpern und zu den Körperaxiomen . . . . . . . . .
5.3 Die Menge der komplexen Zahlen C . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Definition der komplexen Zahlen und Gauss’sche Zahlenebene . . . .
5.3.2 Komplexe Konjugation . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Rechenregeln – die komplexen Zahlen C als Zahlenkörper . . . . . . . . . . .
5.4.1 Ein näherer Blick auf die Addition komplexer Zahlen . . . . . . . . .
5.4.2 Ein näherer Blick auf die Multiplikation komplexer Zahlen . . . . . .
5.4.3 Der Betrag einer komplexen Zahl . . . . . . . . . . . . . . . . . . . .
5.4.4 Division: Bruchrechnen mit komplexen Zahlen . . . . . . . . . . . . .
5.4.5 Die imaginäre Einheit i und ihre Potenzen . . . . . . . . . . . . . . .
5.4.6 Überprüfung der Körperaxiome . . . . . . . . . . . . . . . . . . . . .
5.5 Komplexe Zahlen in Polarkoordinaten, Euler-Gleichung und Euler-Darstellung
5.5.1 Polarkoordinaten in der komplexen Ebene . . . . . . . . . . . . . . .
5.5.2 Euler-Gleichung und Euler-Darstellung komplexer Zahlen . . . . . . .
5.5.3 Repetition der Potenzgesetze . . . . . . . . . . . . . . . . . . . . . .
5.5.4 Das Verständnis der komplexen Multiplikation . . . . . . . . . . . . .
5.6 Weitere Zusammenhänge und erste Anwendungen mit komplexen Zahlen . .
5.6.1 Die Gleichung z n = 1 und die n-ten Einheitswurzeln . . . . . . . . .
5.6.2 Mehr vom Wurzelziehen im Komplexen . . . . . . . . . . . . . . . .
5.6.3 Quadratische Gleichungen im Komplexen . . . . . . . . . . . . . . .
5.6.4 Darstellung komplexer Funktionen . . . . . . . . . . . . . . . . . . .
5.6.5 Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . .
5.6.6 Die trigonometrischen Additionstheoreme . . . . . . . . . . . . . . .
5.6.7 Cosinus- und Sinusfunktion als Linearkombinationen von eiϕ und e−iϕ
5.6.8 Der harmonische Oszillator im Komplexen . . . . . . . . . . . . . . .
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
46
49
49
52
53
55
55
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
57
58
58
59
60
61
61
62
64
64
64
65
66
67
68
69
71
71
72
72
75
76
76
79
79
82
85
88
89
90
92
94
1
1.1
Differenziation – Altes und Neues zur Ableitung
Die Ableitung als Steigung der Tangente an einen Funktionsgraphen
Wir repetieren: Bei gegebener Funktion f (x) können Sie mittels Ableitungsregeln die Ableitungsfunktion f ′ (x) bestimmen. Für den Funktionsgraphen haben der Funktionswert f (x) und
der Wert der Ableitung f ′ (x) an der Stelle x anschauliche Bedeutungen (vgl. Abb. 1):
Funktionswert f (x): Geben wir uns eine bestimmte Stelle x auf der x-Achse vor, so beschreibt
f (x), auf welcher y-Höhe der Graph an dieser Stelle x vorbeikommt: y = f (x).
⇒ “Jeder Punkt P auf dem Graphen von f hat die Koordinaten P x, f (x) .”
Wert der Ableitung f ′ (x): Salopp wird die Ableitung häufig als Steigung des Funktionsgraphen
bezeichnet. Genauer ist die Formulierung: Die Ableitung f ′ (x)steht für die Steigung mt der
Tangente t an den Funktionsgraphen im Punkt P x, f (x) , also: mt = f ′ (x).
⇒ “Ableiten resp. Differenzieren heisst Steigungen berechnen.”
Bei Optimierungsfragen, d.h. für die Suche nach den Maxima oder Minima einer Funktion, ist das
Verständnis der Ableitung als Steigung des Funktionsgraphen sehr nützlich. Eine Stelle x kann nur
dann zu einem lokalen Maximum von f (= Kuppe im Graphen) gehören, wenn dort die Steigung
gleich 0 ist, also die Ableitung verschwindet. Die Lösungen x der Gleichung f ′ (x) = 0 sind Kandidaten für lokale Maximalstellen. Mit weiteren Betrachtungen lässt sich herausfinden, ob es sich
tatsächlich um ein Maximum, oder sonst um ein Minimum oder einen Sattelpunkt handelt, etc.
Abbildung 1: Die graphische Bedeutung von Funktionswert f (x) und Ableitung f ′ (x).
1.2
Die Ableitungsdefinition alt und neu betrachtet
Neben dem hilfreichen Bild der Ableitung als Steigung ist für unsere weiteren Betrachtungen vor
allem das folgende Verständnis zentral:
“Die Ableitung f ′ (x) beschreibt, wie sehr sich der
Funktionswert f (x) an der Stelle x am verändern ist.”
Je grösser die Ableitung f ′ (x) ist, desto steiler ist der Graph über dieser Stelle x und desto stärker
ist sich dort der Funktionswert f (x) am verändern. An einer steilen Stelle (grosses f ′ (x)) bewirkt
bereits eine geringe Veränderung der Variable x eine grosse Veränderung des Funktionswertes f (x).
1
Dieses Verständnis wollen wir weiter vertiefen, indem wir die Ihnen bereits bekannte Definition
der Ableitung nochmals unter die Lupe nehmen. Dabei lernen Sie auch gerade die in der höheren
Mathematik gängige Ableitungsschreibweise df
dx kennen.
Definition der Ableitung f ′ (x) einer Funktion f (x)
einer Funktion f (x) ist gegeben durch den
Die Ableitung f ′ (x) resp. df
dx
Grenzwert des Differenzenquotienten ∆f
∆x für ∆x → 0:
f ′ (x) ≡
df
∆f
f (x + ∆x) − f (x)
≡ lim
≡ lim
dx ∆x→0 ∆x ∆x→0
∆x
(1)
Dabei stehen dx und df für infinitesimale Veränderungen, also unendlich
kleine Schritte der Variable x und der Funktion f (x) (an der Stelle x).
Das dreifache Gleichheitszeichen “≡” steht für eine Definition resp. dafür, dass wir die beiden Objekte
links und rechts davon als vollkommen identisch miteinander betrachten wollen.
Erläuterungen zur Ableitungsdefinition
, also die Steigung ms
• Am Anfang der Ableitungsbildung steht der Differenzenquotient ∆f
∆x
1
einer Sekante s durch zwei Punkte auf dem Funktionsgraphen. Der erste
Punkt P x, f (x)
sitzt über der Stelle x, während der zweite Punkt Q x + ∆x, f (x + ∆x) von P aus um ∆x
nach rechts verschoben ist und demnach über der Stelle x + ∆x sitzt. Somit betragen die
Sekantensteigung ms resp. der Differenzenquotient ∆f
∆x (vgl. Abb. 2):
ms =
yQ − yP
f (x + ∆x) − f (x)
f (x + ∆x) − f (x)
∆f
=
=
≡
xQ − xP
x + ∆x − x
∆x
∆x
Abbildung 2: Das Steigungsdreieck an die Sekante.
1
lat. secare = schneiden ⇒ Sekante = schneidende Gerade.
2
• Lässt man ∆x immer kleiner werden, so rutscht Q auf dem Graphen immer näher an P heran.
Dadurch wird die Sekante s immer mehr zur Tangente t an den Graphen im Punkt P . Die
Sekantensteigung ms strebt gegen die Tangentensteigung mt .
• Wie klein wollen wir ∆x werden lassen?
Die Antwort lautet: Unendlich klein, aber nicht gleich 0! Für ∆x = 0 wäre nämlich die
Sekantensteigung ms resp. der Differenzenquotient ∆f
∆x gar nicht mehr definiert, weil im Nenner
eine 0 auftreten würde. Für jedes ∆x > 0 existiert aber ∆f
∆x .
Solange ∆x > 0 ist, wird die Sekantensteigung ms bei gebogenen Funktionsgraphen nie exakt
der Tangentensteigung mt entsprechen, aber für immer kleiner werdendes ∆x wird sie mt
beliebig nahe kommen!2 Deshalb sagen wir: Die Tangentensteigung mt ist der Grenzwert
oder eben der Limes (lim)3 , dem sich die Sekantensteigung ms für ∆x → 0 annähert:
mt = lim ms
(sprich: “Limes für Delta x gegen 0 von ms”)
∆x→0
• Formulieren wir dies nochmals mit der Ableitung f ′ (x) anstelle der Tangentensteigung mt und
dem Differenzenquotienten ∆f
∆x anstelle der Sekantensteigung ms , so haben wir die Gleichung
vor uns, die wir als Definition der Ableitung f ′ (x) ansehen wollen:
∆f
∆x→0 ∆x
f ′ (x) ≡ lim
• Im Grenzwert ∆x → 0 werden sowohl die Funktionswertdifferenz ∆f , wie auch der Variablenschritt ∆x unendlich klein. Ihr Verhältnis besitzt allerdings nach wie vor einen endlichen und
genau bezifferbaren Wert, der sich immer mehr der Ableitung annähert.
Diesen unbezifferbar klein gewordenen ∆f und ∆x sagen wir infinitesimale Veränderungen
oder infinitesimale Schritte und schreiben dafür df und dx. Damit lässt sich die Ableitung
ohne Limes schreiben:
df
∆f
≡
∆x→0 ∆x
dx
f ′ (x) ≡ lim
(sprich: “df nach dx”)
(2)
• Und damit sind wir schliesslich bei einem neuen und sehr interessanten Verständnis der Ableitung angelangt. Durch Umstellung (Multiplikation mit dx) können wir schreiben:
df = f ′ (x) · dx
An der Stelle x verändert sich der Funktionswert f (x) um den infinitesimalen Schritt df ,
wenn sich die Variable x um den infinitesimalen Schritt dx verändert. Dabei sind df und dx
proportional zueinander und die Proportionalitätskonstante an der Stelle x ist gerade f ′ (x).
Somit beschreibt die Ableitung f ′ (x), wie sich die Funktion f (x) an der Stelle x gerade am
verändern ist. Sie
steht für das Verhältnis der infinitesimalen Veränderungen df und dx im
Punkt x, f (x) .
Vielleicht denken Sie nun, dass sich mit diesem “infinitesimalen Zeugs” unmittelbar “nix
Gscheites” anfängen lässt, weil die infinitesimalen Veränderungen df und dx ja gar keine
angebbaren Zahlenwerte besitzen, aber warten Sie nur ein bisschen ab und Sie werden sehen,
wie nützlich dieses Verständnis der inifinitesimalen Schritte sein wird, z.B. bei der Integralrechnung im nächsten Kapitel. . .
2
Mathematisch exakter formuliert: Für jede noch so kleine Zahl ε > 0 kann man ∆x problemlos soweit verkleinern,
dass der Unterschied zwischen ms und mt kleiner ist als diese beliebig kleine Zahl ε: |ms − mt | < ε.
3
lat. limes = Grenze.
3
1.3
Repetition: Ein explizites Beispiel zur Ableitungsdefinition
1
6
Ich möchte wissen, wie sich die Funktion f (x) =
ist. D.h., ich frage nach f ′ (8).
x2 − 2x + 2 an der Stelle x = 8 am verändern
Variante 1: Ausführlicher Weg mittels Ableitungsdefinition
Unter Verwendung der Ableitungsdefinition schreibe ich:
f (x + ∆x) − f (x)
∆x→0
∆x
f ′ (x) = lim
1
6
(x + ∆x)2 − 2(x + ∆x) + 2 − ( 61 x2 − 2x + 2)
∆x→0
∆x
1
2
2 − 2x − 2∆x + 2 − 1 x2 + 2x − 2
6 x + 2x∆x + (∆x)
6
= lim
∆x→0
∆x
= lim
= lim
1
6
∆x→0
x2 + 31 x∆x + 16 (∆x)2 − 2x − 2∆x + 2 −
∆x
1
6
x2 + 2x − 2
1
3
x∆x + 16 (∆x)2 − 2∆x
∆x→0
∆x
1
1
x + ∆x − 2
= lim
∆x→0
3
6
= lim
=
1
x−2
3
Bemerken Sie: Erst von der vorletzten zur letzten Zeile kann die Limesbildung ∆x → 0
tatsächlich ausgeführt werden. Dadurch fällt der Term 16 ∆x weg, weil er gegenüber den anderen Termen unendlich klein wird. Voraussetzung dafür ist, dass beim Übergang von der
drittletzten zur zweitletzten Zeile ∆x gekürzt werden kann. Erst danach kann man ∆x gegen
0 gehen lassen, ohne dass dabei Probleme mit einem gegen Null strebenden Nenner entstehen.
Variante 2: Ausnutzung von Ableitungsregeln
Aus der Ableitungsdefinition (1) lassen sich einerseits die Ableitungsfunktionen aller elementaren Funktionstypen, andererseits allgemeine Ableitungsregeln herleiten (vgl. 1.4 und 1.5).
Für die Ableitung unseres f (x) brauchen wir beispielsweise die folgenden Informationen:
• Summenregel: Ist f (x) = u(x) + v(x), so gilt: f ′ (x) = u′ (x) + v ′ (x).
• Multiplikative Konstanten: Ist f (x) = c · u(x) (c ∈ R), so gilt: f ′ (x) = c · u′ (x).
• Ableitung von Potenzfunktionen: Ist f (x) = xn , so gilt: f ′ (x) = n · xn−1 .
Insbesondere gilt: [x]′ = 1 und [c]′ = 0 (c ∈ R).
Hat man diese Regeln resp. Ableitungsfunktionen im Kopf, so geht das Ableiten um einiges
rascher:
′
1
1
1 2
′
x − 2x + 2 = · 2x − 2 · 1 + 0 = x − 2
f (x) =
6
6
3
Abschluss: An der Stelle x = 8 folgt: f ′ (8) =
df
2
=
dx
3
1
3
·8−2 =
⇒
8
3
−
df =
6
3
= 23 , d.h. infinitesimal:
2
dx
3
An der Stelle x = 8 ist somit die infinitesimale Veränderung des Funktionswertes f (x) nur
so gross wie die zugehörige infinitesimale Veränderung der Variable x.
4
2
3
1.4
Allgemeine Ableitungsregeln
Aus der Ableitungsdefinition (1) können die folgenden allgemeinen Regeln hergeleitet werden:
f ′ (x) = u′ (x)
Additive Konstante:
f (x) = u(x) + c
⇒
Multiplikative Konstante:
f (x) = c · u(x)
⇒
Summenregel:
f (x) = u(x) + v(x)
⇒
Produktregel:
f (x) = u(x) · v(x)
⇒
f ′ (x) = u′ (x) · v(x) + u(x) · v ′ (x)
Quotientenregel:
f (x) =
⇒
f ′ (x) =
Kettenregel:
f (x) = u v(x)
1.5
u(x)
v(x)
⇒
f ′ (x) = c · u′ (x)
f ′ (x) = u′ (x) + v ′ (x)
u′ (x) · v(x) − u(x) · v ′ (x)
v 2 (x)
f ′ (x) = u′ v(x) · v ′ (x)
Ableitungen elementarer Funktionen
Aus (1) folgen grundsätzlich die Ableitungen aller Funktionen. Es lohnt sich aber die Ableitungen
einiger grundlegender Funktionen stets präsent zu haben, insbesondere:
f ′ (x) = 0
Konstante Funktion:
f (x) = c
⇒
Lineare Funktion:
f (x) = mx + b
Quadratische Funktion:
f (x) = ax2 + bx + c
⇒
Potenzfunktion:
f (x) = xn
Wurzelfunktion:
f (x) =
√
x = x2
⇒
1
f ′ (x) = √
2 x
Reziprozitätsfunktion:
f (x) =
1
= x−1
x
⇒
f ′ (x) = −
Exponentialfunktion zur Basis e:
f (x) = ex
f ′ (x) = ex
Allg. Exponentialfunktion:
f (x) = q x
⇒
⇒
f ′ (x) = q x · ln q
Logarithmus naturalis:
f (x) = ln |x| = loge |x|
⇒
f ′ (x) =
1
x
Allg. Logarithmusfunktion:
f (x) = logq |x|
⇒
f ′ (x) =
Sinusfunktion:
f (x) = sin x
⇒
1
x · ln q
f ′ (x) = cos x
Cosinusfunktion:
f (x) = cos x
⇒
f ′ (x) = − sin x
Tangensfunktion:
f (x) = tan x
⇒
f ′ (x) =
Arcussinusfunktion:
f (x) = arcsin x
⇒
Arcuscosinusfunktion:
f (x) = arccos x
⇒
Arcustangensfunktion:
f (x) = arctan x
⇒
Dabei sind a, b, c, m, n ∈ R und q ∈ R+ .
5
⇒
⇒
1
f ′ (x) = m
f ′ (x) = 2ax + b
f ′ (x) = n · xn−1
1
x2
1
cos2 x
1
f ′ (x) = √
1 − x2
1
f ′ (x) = − √
1 − x2
1
f ′ (x) =
1 + x2
1.6
Das infinitesimale Verständnis: Im unendlich Kleinen ist alles linear!
Denken wir nochmals an das Konzept der Ableitungsbildung zurück: Den horizontalen Schritt ∆x
liessen wir unendlich klein (aber 6= 0!) werden – so wurde aus ihm die infinitesimale Veränderung
dx. Parallel dazu ging die Differenz des Funktionswertes ∆f in die infinitesimale Veränderung df
über:
Übergang ins Infinitesimale:
∆x → dx und ∆f → df
Bei diesem Übergang ins unendlich Kleine passiert ganz Entscheidendes: Wenn wir unendlich nahe
an einen Punkt P auf dem Graphen einer Funktion heranzoomen, so erscheint uns der Graph dort
geradlinig. Wir können ihn gar nicht mehr von einer Gerade unterscheiden (vgl. Abb. 3).4
Das lässt uns umgekehrt sagen: Jeder Funktionsgraph setzt sich aus unendlich vielen, unendlich
kleinen, aber eben geradlinigen Abschnittchen zusammen. Auf infinitesimaler Grössenordnung sind
alle “einigermassen anständigen” mathematischen Funktion linear!5
Diese Linearität, also dass die infinitesimalen Veränderungen df und dx proportional zueinander
sind,6 bildet den Grundstein der modernen Analysis (Differentialrechnung, Integralrechnung, . . . ).
Ausgehend von dieser neuen Mathematik des unendlich Kleinen, die im 17. Jahrhundert von Sir Isaac
Newton (1642 – 1726) und von Gottfried Wilhelm Leibniz (1646 – 1716) unabhängig voneinander
entdeckt und entwickelt wurde, haben Mathematik und Naturwissenschaft in den letzten gut 350
Jahren unglaubliche Fortschritte erzielt, die vorher undenkbar gewesen wären.
Abbildung 3: Auf infinitesimaler Grössenordnung sind alle Funktionen linear, d.h., sie setzen sich aus
unendlich vielen geradlinigen Teilstücken zusammen.
4
Das ist vergleichbar mit Ihrer Situation an der Erdoberfläche. Wir wissen zwar alle, dass wir an der Oberfläche
einer riesigen Kugel herumspazieren, aber diese Oberfläche erscheint uns lokal absolut flach und wir machen mit dieser
Annahme in unserem Alltag auch keine Fehler. Je kleiner wir den betrachteten Erdoberflächenausschnitt machen, umso
geringfügiger resp. umso irrelevanter würde eine allfällige Abweichung zwischen gekrümmter und flacher Oberfläche.
Im Grenzwert eines unendlich kleinen Flächenstücks wird der Fehler unendlich klein und somit gibt es keinen messbaren
Unterschied mehr.
5
Es gibt durchaus eine Menge “unanständiger” Funktionen, bei denen dieses Hineinzoomen nicht zur Linearisierung
führt. Bei solchen Funktionen ist es in der Regel nur schon problematisch überhaupt eine Ableitung zu definieren, weil
der Grenzwert für ∆x → 0 gar nicht vernünftig ermittelt werden kann.
Glücklicherweise sind physikalische Funktionen in der Regel anständig. D.h., sie lassen sich problemlos (beliebig oft)
ableiten und sind im Infinitesimalen eben linear. Davon dürfen wir in unserem Kurs (fast) immer ausgehen.
6
Vgl. Beispiel auf Seite 4: df = 23 · dx ⇒ df und dx sind (an der Stelle x = 8) proportional zueinander.
6
2
Altes und Neues zur Integration
2.1
Der Hauptsatz der Differenzial- und Integralrechnung
Was Sie in diesem Abschnitt vorgelegt bekommen, dürften Sie im Mathematikunterricht mehrheitlich
bereits gesehen haben. Es kann aber nicht schaden, die Grundlagen der Integralrechnung nochmals
genau zu beleuchten.
Abbildung 4: Das Integral als Fläche unter einem Funktionsgraphen.
2.1.1
Das bestimmte Integral als Fläche unter einem Funktionsgraphen
Wir möchten die Fläche zwischen dem Graphen einer Funktion f (x) und der x-Achse berechnen.
Dabei legen die beiden Stellen x = a und x = b deren seitliche Grenzen fest (vgl. Abb. 4).
Wir gehen davon aus, dass f (x) zwischen a und b eine stetige Funktion ist. Es gibt also keine
Lücken oder Sprungstellen. Zweitens gelte (momentan) der Einfachheit halber für alle x ∈ [a; b], dass
f (x) ≥ 0 ist. Somit liegt die zu berechnende Fläche komplett oberhalb der x-Achse. Unter diesen
Voraussetzungen bezeichnen wir die gesuchte Fläche A als das bestimmte Integral der Funktion
f (x) mit Integrationsgrenzen a und b und schreiben dafür:
Z b
f (x) dx
A=
a
2.1.2
Der eigentliche Hauptsatz
In der Mathematik haben Sie gelernt, was für die Berechnung eines bestimmten Integrals genau zu
tun ist. Sie benutzen eine fundamentale Aussage der Analysis, nämlich den sogenannten
Hauptsatz der Differenzial- und Integralrechnung
Das bestimmte Integral der Funktion f (x) mit Integrationsgrenzen a und
b ist gegeben durch:
Z
a
b
f (x) dx = F (b) − F (a)
mit
f (x) = F ′ (x)
(3)
Dabei ist F (x) eine Stammfunktion von f (x). Das bedeutet, dass f (x)
die Ableitung von F (x) ist.
7
2.1.3
Der Beweis des Hauptsatzes
Wer den Hauptsatz zum ersten Mal liest und seine Aussage richtig begreift, wird vermutlich recht
überrascht sein: Das “Aufleiten”, also das Aufspüren einer Stammfunktion, erlaubt die Berechnung
der Fläche unter dem Funktionsgraphen! Woher kommt das? Was hat die Flächenberechnung mit
der Differenziation zu tun? Weshalb verlangt sie gerade nach dem umgekehrten Vorgang?
Um das besser zu verstehen und damit eben den Hauptsatz zu beweisen, packen wir die Sache
von der anderen Seite an. Wir nehmen an, dass wir bereits eine sogenannte Flächenfunktion F (x)
kennen. Für jedes x entspreche ihr Funktionswert F (x) der Fläche, welche oben und unten durch
den Graphen einer Funktion f (x) und die x-Achse, sowie links und rechts durch die y-Achse (x = 0)
und die Vertikale an der Stelle x beschränkt wird (vgl. Abb. 5).
Abbildung 5: Die Flächenfunktion F (x).
Klar ist, dass die Berechnung des bestimmten Integrals zwischen den Stellen x = a und x = b
kein Problem mehr darstellt, wenn wir diese Flächenfunktion F (x), denn:
Fläche von Stelle a bis b = (Fläche von 0 bis b) − (Fläche von 0 bis a) = F (b) − F (a)
Zum Beweis des Hauptsatzes müssen wir nun zeigen, dass dieses F (x) tatsächlich eine Stammfunktion der Funktion f (x) ist, dass also die Ableitung dF
dx die Funktion f (x) ergibt.
Allerdings kennen wir für F (x) keine explizite Funktionsgleichung. Wir wollen ja einen allgemeinen Zusammenhang beweisen. Also müssen wir die Ableitungsdefinition (1) auf Seite 2 Schritt für
Schritt befolgen. D.h., wir betrachten die Veränderung ∆F der Flächenfunktion bei einem endlichen
Variablenschritt ∆x, bilden aus diesen beiden Veränderungen den Differenzenquotienten ∆F
∆x und
lassen anschliessend den Schritt ∆x infinitesimal klein werden. Der Limes von ∆F
für
∆x
→ 0 ist
∆x
dF
′
schliesslich die gesuchte Ableitung F (x) = dx .
Schritt 1: Die endlich kleine Flächenvergrösserung ∆F : Wir untersuchen, wie sich der Wert
der Flächenfunktion F (x) verändert, wenn wir ihren rechten Rand von der Stelle x aus um den
endlichen Schritt ∆x nach rechts schieben. Dabei wird die Flächenfunktion um das ebenfalls
endliche Flächenstück ∆F vergrössert.
Abb. 6 zeigt die Situation. Der endliche Schritt ∆x soll bereits so klein sein, dass uns der
Funktionsgraph von f (x) als perfekte Gerade erscheint. Allerdings sind wir noch nicht im
unendlich Kleinen! Die infinitesimale Situation selber kann ich Ihnen nicht in einer Abbildung
zeigen, auch wenn ich das in Abb. 3 auf Seite 6 in gewisser Weise suggeriert habe. Eine
sichtbare Strecke lässt sich schliesslich automatisch immer noch weiter verkleinern. . .
8
Die Flächenveränderung ∆F ist die in Abb. 6 grau eingefärbte Trapezfläche, die sich aus
einem helleren Dreieck oben mit Fläche ∆F1 und einem dunkleren Rechteck mit Fläche ∆F2
zusammensetzt. Vergrössern wir also den Variablenwert von x nach x + ∆x, so finden wir für
die Veränderung ∆F der Flächenfunktion F (x) ohne Probleme:
∆F = ∆F1 + ∆F2 =
∆f · ∆x
+ f (x) · ∆x
2
∆F
:
∆x
Schritt 2: Bildung des Differenzenquotienten
(4)
Division durch ∆x liefert:
∆f
∆F
=
+ f (x)
∆x
2
Schritt 3: Übergang ins Infinitesimale: Die Ableitung von F (x) erhalten wir nun, indem wir den
Grenzwert des Differenzenquotienten für ∆x → 0 bilden:
dF
∆F
∆f
≡ lim
= lim
+ f (x) = f (x)
∆x→0 ∆x
∆x→0
dx
2
Der letzte Schritt braucht wohl noch eine kurze Erläuterung: f (x) bleibt bei der Limesbildung
∆x → 0 unverändert. Es ist einfach der Funktionswert der Funktion f an der Stelle x. Anders
sieht dies beim Term ∆f
2 aus. Bei der Ausführung von ∆x → 0 rückt der Punkt Q in Abb.
6 unendlich nahe an den Punkt P heran. Dabei wird ganz offensichtlich auch die Funktions7
wertdifferenz ∆f unendlich klein und der Term ∆f
2 verschwindet bei der Limesbildung.
Damit haben wir nun aber gezeigt, dass
dF
dx
= f (x) ist, und somit ist der Hauptsatz bewiesen.
Abbildung 6: Veränderung von F (x) beim endlich kleinen Variablenschritt ∆x.
7
Da wir im Infinitesimalen ja davon ausgehen dürfen, dass die Funktion f in P linear verläuft (Gerade mit Steigung
f (x)), könnten wir an dieser Stelle auch ∆f durch f ′ (x) · ∆x ersetzen. Damit wäre dann ganz direkt ersichtlich,
= 0 ist.
weshalb lim∆x→0 ∆f
2
′
9
2.1.4
Physikalische Saloppheit
In der Physik sind wir selbstverständlich froh um ein solides mathematisches Fundament. Manchmal
sind wir aber auch gerne ein bisschen speditiver unterwegs, wohlwissend, dass den Mathematikern
dabei zwischenzeitlich die Haare zu Berge stehen könnten. So hätten wir im Beweis des Hauptsatzes
aufgrund von Abb. 6 die Gleichung (4) direkt in differenzieller Form notieren können:
dF = dF1 + dF2 =
df dx
+ f (x) dx = f (x) dx
2
Im letzten Schritt nutzen wir die Tatsache, dass das Produkt zweier infinitesimaler Grössen – in
unserem Fall df · dx – stets unendlich mal viel kleiner ist als das Produkt aus einer endlichen und
einer infinitesimalen Grösse – hier: f (x) · dx. Aus diesem Grund dürfen wir den Term df2·dx ohne
Fehler weglassen und erhalten so viel schneller:
dF = f (x) dx
dF
= f (x)
dx
resp.
Diesen “saloppen” Umgang mit infinitesimalen Grössen erlauben wir uns in der Physik, weil wir
wissen resp. uns schon einmal davon überzeugt haben, dass es funktioniert. Die mathematisch fundiertere Vorgehensweise wäre allerdings stets die Betrachtung endlicher Grössen mit anschliessendem
Übergang ins Infinitesimale (Grenzwertbildung ∆x → 0).
2.1.5
Rechtecksflächen und Integralnotation
Das Wegfallen des Dreieckterms ∆f2·∆x bedeutet, dass wir im Infinitesimalen ausschliesslich über
Rechtecksflächen f (x) dx summieren.
Dieses Konzept wurde Ihnen vermutlich bereits in der Mathematik vorgestellt. Die geschwungene
Fläche unter dem Funktionsgraphen kann durch unendliche viele unendlich dünne Rechtecksflächen
beliebig genau angenähert werden. Das sehen Sie in Abb. 7 für n = 3, 6, 10, 20 Unterteilungen des
Intervalls [a; b]. Für n = 20 sieht man schon fast keinen Unterschied mehr zur exakten Fläche.
Bei n gleich grossen Unterteilungen des Intervalls [a; b] beträgt der einzelne Schritt auf der
x-Achse ∆xn = b−a
n . Das k-te Rechteck beginnt bei der Stelle xk , die gegeben ist durch:
xk = a + (k − 1)∆xn
mit
k = 1, . . . , n
k nennen wir einen Laufindex. Er durchläuft alle Werte von 1 bis n. So erhalten wir beispielsweise
für k = 4 die Stelle x4 = a + 3∆xn oder für k = 15 die Stelle x15 = a + 14∆xn .
Die k-te Rechtecksfläche Rk besitzt die Höhe f (xk ) und ihre Fläche beträgt:
Rk = f (xk ) ∆xn
Um die gesamte von den n Rechtecken abgedeckte Fläche R(n) zu notieren, empfiehlt sich die
Summenschreibweise:
R(n) = R1 + . . . + Rn =
n
X
k=1
Rk =
n
X
f (xk ) ∆xn
k=1
Das Summenzeichen Σ (gr. Grossbuchstabe Sigma) besagt, dass alle Terme aufaddiert werden
müssen. Unten am Summenzeichen deklariert man den Namen des Laufindexes inkl. Startwert, oben
dessen Endwert.
Wie liest man so eine Summe mit Summenzeichen vor?
n
X
k=1
f (xk ) ∆xn = “Summe mit k von 1 bis n über (alle Ausdrücke) f (xk ) ∆xn ”
= “Summe über (alle Ausdrücke) f (xk ) ∆xn mit k von 1 bis n”
10
Abbildung 7: Verfeinerung der Rechtecksflächenunterteilung zur Bestimmung der Fläche unter dem
Funktionsgraphen. Die Abdeckung wird im Limes n → ∞ unendlich genau.
Ein grösseres n entspricht einer verfeinerten Rechtecksunterteilung (vgl. Abb. 7). Lassen wir n
immer noch grösser werden, so kommt die Rechteckssumme R(n) der exakten Fläche A beliebig
nahe. Die exakte Fläche A ist also der Grenzwert von R(n) für n → ∞:
!
n
X
b−a
mit ∆xn =
f (xk ) ∆xn
A = lim R(n) = lim
n→∞
n→∞
n
k=1
Das sieht nun doch etwas kompliziert aus. Kein Wunder, dass bereits Gottfried Wilhelm Leibniz
(1646 – 1716), einer der beiden Väter der Differenzial- und der Integralrechnung,8 hierfür eine neue
Notation eingeführt hat, nämlich eben das Integralzeichen. Wir definieren:
!
Z b
n
X
f (x) dx ≡ lim
(5)
f (xk ) ∆xn
a
n→∞
k=1
Aus dem für n → ∞ immer kleiner werdenden ∆x
R n rechts ist links der infinitesimale Schritt dx
geworden. Die Summe Σ hat ein neues Zeichen
erhalten, das die voranstehende Limesbildung
limn→∞ mit enthält.9 In der Integralnotation ist immer noch ersichtlich, dass es sich im Prinzip um
eine Summe über Rechtecksflächen handelt: Der Ausdruck f (x) dx ist die Fläche des infinitesimalen
Rechtecks an der Stelle x.
8
9
Der andere Vater war ein
R gewisser Isaac Newton (1643 – 1727). . .
Das Integralzeichen ist ein stilisiertes, altdeutsches langes S, das für eine neue Art von Summe stehen soll.
11
2.1.6
Negative Integralwerte
Mit der Definition des bestimmten Integrals gemäss (5) lösen wir den Integralbegriff vom ursprünglichen Gedanken der Fläche unter einem Funktionsgraphen. Summiert wird über Ausdrücke der Form
f (xk ) ∆xn resp. f (x) dx unter dem Integral. Dabei handelt es sich einfach um Produkte zweier
Zahlen. Folglich müssen wir bei der Interpretation eines Integrals als Fläche etwas vorsichtig sein. . .
Beispiel 1: Wir möchten die Fläche zwischen dem Graphen der Sinusfunktion sin x und der xAchse während einer Periode, also von x = 0 bis x = 2π bestimmen (vgl. Abb. 8). Ohne gross
darüber nachzudenken verwenden wir den Hauptsatz (3) und schreiben:
Z 2π
2π
sin x dx = −[cos x] = −(cos 2π − cos 0) = −(1 − 1) = 0 ???
0
0
Dieses Resultat kann ganz offensichtlich nicht für die graue Fläche in Abb. 8 stehen!
Weshalb verschwindet denn dieses Integral? Ganz einfach, weil die Sinusfunktion sin x auf dem
Intervall [0; 2π] auch negative Werte annimmt. Für f (x) < 0 wird auch f (x) dx < 0. Das
bedeutet, Flächen unterhalb der x-Achse zählen bei der Berechnung des Integrals negativ.
Und weil bei unserer Sinusfunktion innerhalb einer Periode gleich viel Fläche oberhalb und
unterhalb der x-Achse liegt, erhalten wir das Resultat Null.
Wollen wir tatsächlich die graue Fläche in Abb. 8 berechnen, so müssen wir die Periode in die
Intervalle [0; π] und [π; 2π] unterteilen. Die beiden Teilflächen sind genau gleich gross, sodass
wir nur ein Integral zu berechnen brauchen und dessen Wert verdoppeln:
Z π
π
sin x dx = −2 [cos x] = −2 (cos π − cos 0) = −2 (−1) + (−1) = 4
A=2
0
0
Auf Seite 7 hatten wir “der Einfachheit halber” angenommen, dass f (x) ≥ 0 sein soll für alle
x ∈ [a; b]. Damit wollte ich dieser Komplikation mit negativ zählenden Flächenstücken zunächst mal
aus dem Weg gehen. Jetzt wissen wir besser Bescheid und diese Einschränkung ist nicht mehr nötig.
Auch über Abschnitte mit negativen Funktionswerten können wir integrieren, solange wir wissen,
was wir genau berechnen wollen – das Integral oder die Fläche.
Beispiel 2: Die Parabel zu f (x) = x2 − 4x ist nach oben geöffnet und schneidet die x-Achse bei
den Stellen x = 0 und x = 4. Für die Fläche zwischen Graph und x-Achse erhalten wir:
Z 4
4 64
32 32
1
3
2 2
x − 2x = − 32 − 0 = − =
A=
(x − 4x) dx = 3
3
3
3
0
0
Bei der Berechnung von Flächen unterhalb der x-Achse nehmen wir den Betrag des Integrals.
Abbildung 8: Flächenstücke in einer Periode der Sinusfunktion.
12
2.1.7
Unbestimmtes Integral, Integrationskonstante und Flächenfunktion
In der Mathematik haben Sie gelernt, dass man ein Integral auch ohne Angabe von Integrationsgrenzen notieren kann. Wir sprechen von einem unbestimmten Integral und fragen damit nach der
Stamm- oder Flächenfunktion F (x):
Z
f (x) dx = F (x) + C
Allerdings ist dieses F (x) nur bis auf eine beliebig wählbare Integrationskonstante C bestimmt.
Das kann nicht anders sein, denn durch Addition einer Konstante C verändert sich die Ableitung
einer Funktion F (x) ja nicht:
[F (x) + C]′ = F ′ (x) = f (x)
Zu einem f (x) gibt es somit unendlich viele Stammfunktionen F (x), die sich lediglich durch eine
andere Wahl der Integrationskonstante C voneinander unterscheiden. Für die Berechnung eines
bestimmten Integrals ist die Wahl dieses C’s belanglos, denn:
Z b
f (x) dx = F (b) + C − F (a) + C = F (b) − F (a)
a
Aber was für eine Bedeutung hat denn dieses C überhaupt? Die Antwort darauf liegt schon längst
auf dem Serviertablett bereit. Wir wollen sie nicht verpassen. . .
Beim Beweis des Hauptsatzes auf Seite 8 haben wir die Flächenfunktion F (x) eingeführt. F (a)
stand für die Fläche unter dem Funktionsgraphen von der Stelle x = 0 bis zur Stelle x = a. Diese
Wahl der Flächenfunktion war im Prinzip völlig willkürlich! Weshalb muss sie ausgerechnet bei der
Stelle x = 0 starten? Genauso gut könnte sie die Fläche von x = −2, x = 7 oder allgemein von
x = c aus berechnen. Dann ergäben sich für F (a) andere Werte, weil die Fläche von x = c bis
x = a einfach eine andere wäre. Genau diese Freiheit der Wahl eines beliebigen Startortes x = c für
die Flächenfunktion widerspiegelt sich in der Addition einer Integrationskonstanten C.
Abb. 9 verdeutlicht den Gedankengang nochmals anhand zweier verschiedener Flächenfunktionen
F1 (x) und F2 (x), deren Startorte bei x = c1 und x = c2 liegen. Die Integrationskonstante C, die
beim Wechsel von F1 (x) zu F2 (x) hinzuaddiert werden muss, entspricht der Fläche resp. dem Integral
zwischen den Stellen c2 und c1 :
F2 (x) = F1 (x) + C
Abbildung 9: Die Addition der Integrationskonstante C geht einher mit dem Wechsel des Startortes
der Flächenfunktion.
13
2.1.8
Das bestimmte Integral als Veränderung einer Grösse
Schauen wir nochmals zurück auf den Hauptsatz (3) und stellen ihn leicht um:
F (b) = F (a) +
Z
|
b
a
f (x) dx
{z }
F ′ (x) = f (x)
mit
(6)
=∆F
In dieser Form lässt sich dem Hauptsatz nochmals
R bein anderes und für die Physik sehr hilfreiches
Verständnis abgewinnen: Das bestimmte Integral a f (x) dx beschreibt, wie sich die Grösse F von
der Stelle a bis zur Stelle b verändert. F (b) ist gleich dem Ausgangswert F (a) bei der Stelle a und
die Veränderung ∆F entspricht dem bestimmten Integral.
Beispiel: Oftmals wissen wir in der Physik, dass eine Grösse die Ableitung einer anderen Grösse
ist. Z.B. werden wir uns im Kapitel 4 überlegen, dass die Momentangeschwindigkeit v(t) die
Ableitung der Ortsfunktion x(t) nach der Zeit t ist – v(t) beschreibt die aktuelle Veränderung
des Ortes x(t):
dx
v(t) = x′ (t) =
resp.
dx = v(t) dt
dt
Aus diesem Ableitungszusammenhang folgt aber immer auch der Integralzusammenhang (6)
und wir können schreiben:
Z
t1
x(t2 ) = x(t1 ) +
|
t2
v(t) dt
{z }
=∆x
Der Ort x(t2 ) zum Zeitpunkt t2 entspricht dem Ort x(t1 ) zum Zeitpunkt t1 plus die Ortsveränderung ∆x (= Strecke) während der Zeitspanne von t1 bis t2 . Diese Veränderung ist
durch das bestimmte Integral über die Geschwindigkeitsfunktion v(t) gegeben ist.
An diesem Beispiel sehen Sie, wie richtig es aus physikalischer Sicht ist, dass unsere Flächenfunktion – in diesem Fall x(t) – nur bis auf eine Integrationskonstante bestimmt ist. Dies
garantiert uns die freie Wahl des Bezugssystems. Wir dürfen selber entscheiden, wo wir den
Nullpunkt der Ortsachse platzieren resp. welche Koordinate x(t1 ) hat.
Betrachten wir die Angelegenheit nochmals allgemeiner. Mit dem Hauptsatz und mit dF = f (x) dx
können wir schreiben:
Z b
Z F (b)
Z F (b)
dF
kurz: ∆F =
dF
(7)
∆F = F (b) − F (a) =
f (x) dx =
F (a)
a
F (a)
Die endliche Veränderung ∆F der Grösse F (x) ist stets gleich dem Integral über die infinitesimalen
Veränderungen dF . Beachten Sie, dass wir in (7) die Integrationsgrenzen neu anschreiben mussten.
Sie müssen stets zur infinitesimalen Veränderung unter dem Integral passen. Zu dF gehören als
Integrationsgrenzen zwangsläufig zwei Werte der Flächenfunktion F (x).
Offenbar dürfen wir unter einem Integral einen infinitesimalen Schritt durch einen anderen ersetzen, wenn wir wissen, wie die beiden voneinander abhängen. Und diese Abhängigkeit ist durch den
Ableitungszusammenhang gegeben:
dF
= f (x)
dx
⇒
dF = f (x) dx
⇒
Z
F (b)
dF =
F (a)
Z
b
f (x) dx
a
Aber eben: Die Integrationsgrenzen wollen an den neuen infinitesimalen Schritt angepasst sein.
Im Abschnitt 2.4.3 werden wir aus dieser Änderung der Integrationsvariable eine Integrationstechnik mit Namen Substitution machen.
14
2.2
Allgemeine Integrationsregeln
Aus der Integraldefinition (5) können die folgenden allgemeinen Regeln hergeleitet werden:
Summenregel:
Z
b
f (x) ± g(x) dx =
a
Faktorregel:
Z
b
c · f (x) dx = c ·
a
Aufteilung des Integrals:
Z
c
f (x) dx =
a
Umkehrung der Integrationsgrenzen:
Z
b
a
Z
b
Z
b
Z
a
b
f (x) dx ±
g(x) dx
a
f (x) dx
a
f (x) dx = −
b
a
f (x) dx +
Z
Z
b
Z
c
f (x) dx
b
f (x) dx
a
In vielen Formelsammlungen und Mathematikbüchern finden sich unter diesen allgemeinen Integrationsregeln auch die Substitution und die partielle Integration. Wir werden diese Integrationstechniken
in den Abschnitten 2.4.2, 2.4.3 und 2.4.4 separat betrachten.
2.3
Auswahl unbestimmter Integrale
Mit der Kenntnis diverser Ableitungen (vgl. Abschnitt 1.5) lassen sich bereits einige Stammfunktionen
aufspüren. Es gibt aber doch die eine oder andere ab und zu auftretende Funktion, bei der wir froh
darum sind das unbestimmte Integral rasch nachschlagen zu können. Hier eine Auswahl:
Z
1
Potenzfunktion:
xn dx =
xn+1 + C
n+1
Z
1
Reziprozitätsfunktion:
dx = ln |x| + C
x
Z
Exponentialfunktion zur Basis e:
ex dx = ex + C
Z
Logarithmus naturalis:
ln |x| dx = x(ln |x| − 1) + C
Z
Sinusfunktion:
sin x dx = − cos x + C
Cosinusfunktion:
Tangensfunktion:
Quadratische Sinusfunktion:
Quadratische Cosinusfunktion:
Arcussinusfunktion:
Arcuscosinusfunktion:
Z
Z
cos x dx = sin x + C
tan x dx = − ln | cos x| + C
Z
1
sin2 x dx = (x − sin x cos x) + C
2
Z
1
cos2 x dx = (x + sin x cos x) + C
2
Z
p
arcsin x dx = x arcsin x + 1 − x2 + C
Z
p
arccos x dx = x arccos x − 1 − x2 + C
Natürlich gibt es weitaus umfangreichere Integralsammlungen. Ich habe mich auf die paar grundlegenden Integrale eingeschränkt, die wir am häufigsten benutzen werden.
15
2.4
Integrationstechniken
Die Berechnung bestimmter Integrale ist ein mathematisches Handwerk. In einfacheren Fällen möchte
man möglichst elegant, in schwierigeren Fällen überhaupt zum Ziel kommen. Leider gibt es kein
Standardrezept. Im schlimmsten Fall lassen wir uns von einem Rechner einen Näherungswert auf
soundso viele Stellen genau berechnen. Aber am liebsten haben wir es mathematisch exakt!
In diesem Abschnitt lernen Sie ein paar Tricks und Techniken zur exakten Berechnung von
bestimmten Integralen, denen wir im Rahmen der Quantenmechanik oft begegnen werden.
2.4.1
Symmetrien erkennen und ausnutzen
Gerade Funktionen / Achsensymmetrie: Der Graph einer sogenannt geraden Funktion zeigt
eine Achsensymmetrie bezüglich der y-Achse des Koordinatensystems (vgl. Abb. 10). Für
solche Funktionen gilt:
f (−x) = f (x)
Typische Beispiele sind cos x, c, x2 ,
1
x2
2
oder e−x .
Bei einer zum Ursprung symmetrischen Integration folgt für gerade Funktionen (vgl. Abb. 11):
Z a
Z a
f (x) dx = 2
f (x) dx
−a
0
Das ist sehr praktisch, weil das Einsetzen der Stelle x = 0 in die Stammfunktion typischerweise
besonders einfach ist.
Ungerade Funktionen / Punktsymmetrie: Der Graph einer ungeraden Funktion zeigt eine Punktsymmetrie des Funktionsgraphen bezüglich des Koordinatenursprungs (0, 0) (vgl. Abb. 10). Für
solche Funktionen gilt:
f (−x) = −f (x)
Typische Beispiele sind sin x, tan x, x, x3 oder
1
x.
Bei Integration von −a bis a folgt für ungerade Funktionen (vgl. Abb. 11):
Z a
f (x) dx = 0
−a
Die Punktsymmetrie macht diese Integration also ganz besonders leicht!
Aufgrund dieser allenfalls möglichen Vereinfachungen lohnt es sich immer vor dem Integrieren über
die Symmetrieeigenschaften einer Funktion nachzudenken!
Abbildung 10: cos x und sin x als Beispiele für gerade und ungerade Funktionen.
16
Abbildung 11: Symmetrische Integrale bei geraden und ungeraden Funktionen
Weitere Anmerkungen zu Symmetrieeigenschaften von Funktionen
• Der Kehrwert
Symmetrie.
1
f (x)
einer geraden oder ungeraden Funktion f (x) besitzt immer noch dieselbe
• Verknüpfungen von geraden (g) und/oder ungeraden (u) Funktionen durch Addition, Subtraktion, Multiplikation oder Division beeinflussen die Symmetrieeigenschaften wie folgt:
+/−
g
u
·/ :
g
u
g
→ g
•
g
→ g
→ u
u
•
→ u
u
→ u
→ g
• = “keine Symmetrie”
• Generell ist es sehr nützlich von möglichst vielen elementaren Funktionen ein ungefähres Bild
des Graphen im Kopf zu haben. Dazu gehören natürlich auch allfällige Symmetrieeigenschaften.
So verpasst man es nicht von obigen Vereinfachungen bei der Integration von geraden und
ungeraden Funktionen, wann immer möglich, zu profitieren.
4
Beispiel 1: Das Polynom f (x) = − x4 + x2 + 21 besitzt lauter Terme mit geraden Potenzen von
0
x ( 12 = x2 ). Somit handelt es sich um eine gerade Funktion, deren Graph links in Abb. 11
gezeigt wird. Für das Integral von −a = − 32 bis a = 23 ergibt sich:
5
3/2
Z 3/2 Z 3/2 3
4
1
1
x
x
x4
x
x
+ x2 +
+ x2 +
+
−
dx = 2 ·
dx = 2 · − +
−
4
2
4
2
20
3
2 −3/2
0
0
243 9 3
−243 + 720 + 480
957
=2· −
+ + −0 =
=
640 8 4
320
320
Beispiel 2: Das folgende Integral soll berechnet werden:
Z a
1
x sin2 x dx
2
−a
Wir bemerken zuerst die Symmetrie der Integrationsgrenzen bezüglich des Ursprungs. Unter
dem Integral steht ein Produkt zweier Funktionen. Die Funktion f (x) = x ist ungerade,
während g(x) = sin2 x wegen dem Quadrat eine gerade Funktion ist.10 Der Faktor 12 spielt
für die Symmetrie keine Rolle. Die ganze Funktion 21 f (x) g(x) = 21 x sin2 x ist also ungerade
(vgl. Abb. 11 rechts). Somit muss dieses Integral gleich Null sein!
Die Sinusfunktion ist ungerade. Durch das Quadrat in sin2 x werden also zwei ungerade Funktionen miteinander
multipliziert, was eine gerade Funktion ergibt.
10
17
2.4.2
Erkennen äusserer und innerer Ableitungen
Wer effizient integrieren will, sollte in Sachen Kettenregel (bei der Ableitung) geübt sein und somit
über ein geschultes Auge punkto innere Ableitungen verfügen. Dieses geschulte Auge holt man sich
nur durch eine gute Kenntnis der Ableitungen verschiedenster elementarer Funktionen und vor allem
durch viel Erfahrung und Übung.
Erinnern wir uns: Bei der Differenziation erklärt uns die Kettenregel, wie eine verschachtelte
Funktion abgeleitet werden muss:
′
u v(x) = u′ v(x) · v ′ (x)
Erkennen wir nun eine Funktion unter einem Integral als Produkt f (x) = u′ v(x) · v ′ (x) der
Ableitungen einer äusseren
und einer inneren Funktion, so ist die Stammfunktion eben gegeben
durch F (x) = u v(x) + C und wir erhalten für das bestimmte Integral:
Z
b
b
u′ v(x) · v ′ (x) dx = u v(x) (8)
a
a
Wie zielführend diese Methode ist, möchte ich an drei erläuterten Beispielen zeigen:
√
√
e
1 x2 2 1 2
x · e dx = e = e − e = (e − 1)
2
2
2
1
1
Z π/2
1
1
π/2 1
sin x · cos x dx = sin2 x = −0=
2
2
2
0
0
Z 1
1
2x
2
dx
=
ln(x
+
1)
= ln 2 − ln 1 = ln 2
2
0
0 x +1
Z
Beispiel 1:
Beispiel 2:
Beispiel 3:
2
x2
Beispiel 1: Äussere Funktion u(v) =
mit Ableitung v ′ (x) = 2x.11
1
2
ev mit Ableitung u′ (v) =
1
2
ev ; innere Funktion v(x) = x2
Im Nachhinein kann man die Richtigkeit stets leicht überprüfen, denn Ableiten ist typischerweise einfacher als Integrieren:
1 x2 ′ 1 x2
2
= e · 2x = x · ex
e
2
2
Beispiel 2: Äussere Funktion u(v) = 21 v 2 mit Ableitung u′ (v) = 12 ·2v = v = sin x; innere Funktion
v(x) = sin x mit Ableitung v ′ (x) = cos x.
Wir hätten auch cos x als innere Funktion mit Ableitung sin x auffassen können. Dann hätte
die äussere Funktion u(v) = − 12 v 2 gelautet und wir hätten gleichermassen erhalten:
Z
π/2
0
π/2
1
1
1
2 =0− −
=
sin x · cos x dx = − cos x 2
2
2
0
An diesem Beispiel sieht man sehr schön, dass sich unterschiedliche Stammfunktionen ergeben
können. Ganz offensichtlich ist 21 sin2 x 6= − 12 cos2 x. Die beiden Funktionsgraphen verlaufen
parallel übereinander und unterscheiden sich lediglich um eine Integrationskonstante C = 12 .
Für das bestimmte Integral spielt dieser Unterschied keine Rolle.
Beispiel 3: Äussere Funktion u(v) = ln v mit Ableitung u′ (v) = v1 ; innere Funktion v(x) = x2 + 1
mit Ableitung v ′ (x) = 2x. Zum Schluss habe ich verwendet, dass loga 1 = 0 ist.
11
c
c
Es sei daran erinnert, dass ab ≡ a(b
)
(6= (ab )c ).
18
2.4.3
Lineare Substitution
Oftmals taucht die Integrationsvariable x innerhalb der Funktion f (x), über die integriert wird,
in einem linearen Ausdruck mx + q auf. In diesem Fall ist es hilfreich mx + q durch eine neue
Integrationsvariable s = mx + q zu substitutieren (= ersetzen). In der Funktion sollen gar keine x
mehr vorkommen. D.h., wir ersetzen wirklich alle x und schreiben für die Funktion nur noch f (s).
Aus dem infinitesimalen Schritt dx wird ds. Dabei müssen wir berücksichtigen, dass:
ds
ds
= s′ = m
⇒
dx =
dx
m
Auch die Integrationsgrenzen müssen in s-Werte umgerechnet werden. Insgesamt folgt:
Z mb+q
Z b
1
f (s) ds
·
f (x) dx =
m ma+q
a
s = mx + q
⇒
(9)
Im Moment erkennen Sie vielleicht noch nicht so richtig, wie die Sache läuft resp. was sie bringt.
Die folgenden paar Beispiele sollen Licht ins Dunkel bringen.
Beispiel 1: Verschiebungs-Trick (m = 1)
Wir betrachten das folgende Integral:
Z
5
2
√
1
dx
x−1
Das sieht ein bisschen unschön aus. Von √1x kennen wir dank der Integrationsregel für Potenzfunktionen die Stammfunktion (vgl. Abschnitt 2.3). Aber wie sieht es mit der −1 unter der
Wurzel aus? Was verändert diese Subtraktion?
Vielleicht haben Sie in der Mathematik schon erkannt, dass die Ersetzung aller x in einer
Funktionsgleichung durch den Ausdruck x − 1 den Graphen der Funktion um 1 nach rechts
verschiebt. Machen wir das Umgekehrte, ersetzen wir also x − 1 durch x, so bedeutet dies eine
Verschiebung um 1 nach links.
Das nützen wir hier aus und setzen eine neue Integrationsvariable s = x − 1 an. Damit
verschieben wir im Prinzip den Funktionsgraphen um 1 nach links (vgl. Abb. 12). Es leuchtet
ein, dass dann auch die Integrationsgrenzen um 1 nach links verschoben werden müssen, damit
wir immer noch dasselbe Integral berechnen.
Zunächst betrachten wir aber den neuen infinitesimalen Schritt:
ds
m=
= s′ = [x − 1]′ = 1
dx
Solange also die Steigung m in unserer linearen Substitution s = mx+ q gleich 1 ist, verändert
sich am infinitesimalen Schritt gar nichts, ds = dx. Es folgt:
Z 4
Z 5−1
Z 5
1
1
1
√
√ ds =
√ ds
dx =
s
s
x−1
1
2−1
2
Das sieht schon freundlicher aus! Aus der Integrationsregel für Potenzfunktionen erhalten wir:
Z 4
Z 4
√
√ √ 4
1
1 4
1
√ ds =
s− 2 ds = 2s 2 = 2 s = 2 4 − 1 = 2
s
1
1
1
1
Bemerkung: Das anfängliche Integral hätten wir auch berechnen können, wenn wir uns klar
1
als Ableitung der inneren Funktion v(x) = x−1
gemacht hätten, dass die 1 im Zähler von √x−1
√
1
′
√
und u (v) = v als Ableitung der äusseren Funktion u(v) = 2 v angesehen werden können:
Z 5
5
√
√ √
1
√
dx = 2 x − 1 = 2 4 − 1 = 2
2
x−1
2
Beim Integrieren gibt es ab und zu also durchaus mehrere Wege, die zum Ziel führen.
19
Abbildung 12: Die Substitution s = x − 1 verschiebt den Graphen von f (x) um 1 nach links. Die
Integrationsgrenzen werden mitverschoben, sodass die Integrationsfläche gleich gross bleibt.
Beispiel 2: Reskalierungs-Trick (q = 0)
Oftmals taucht x innerhalb einer Funktion zusammen mit einem Vorfaktor auf, so z.B. in:
Z π/3
cos(3x) dx
π/6
Gerne würden wir nur über cos x integrieren. Daher lautet unsere Substitution s = 3x.
Ein Funktionsgraph wird bei der Ersetzung aller x durch 3x um den Faktor 3 horizontal
gestaucht. Hier machen wir genau das Umgekehrte. Wir ersetzen 3x durch die Variable s,
was eine horizontale Dehnung um den Faktor 3 bewirkt (vgl. Abb. 13). Dem entsprechend
müssen die Integrationsgrenzen verschoben werden, um das Integral immer noch “an denselben
Stellen” im Verlauf des Graphen zu begrenzen. Durch die Dehnung wird die Fläche effektiv
vergrössert. Dies wird durch die Veränderung des infinitesimalen Schrittes ausgeglichen:
ds
= s′ = [3x]′ = 3
dx
⇒
dx =
ds
ds
=
′
s
3
Insgesamt folgt für unser Integral:
Z 3·π/3
Z π/3
Z π
π
ds
1
1
1
1
cos s
cos(3x) dx =
= · (0 − 1) = −
cos s ds = · sin s = ·
3
3 π/2
3
3
3
π/2
3·π/6
π/6
Abbildung 13: Die Substitution s = 3x dehnt den Graphen von f (x) horizontal um den Faktor
3. Die Integrationsgrenzen werden mitgestreckt. Dadurch wird offensichtlich die Fläche vergrössert,
was beim Integral mit einer Division durch den Streckungsfaktor 3 ausgeglichen werden muss.
20
Beispiel 3: Lineare Substitution komplett (m 6= 1, q 6= 0)
Verschiebungs- und Reskalierungs-Trick sind nur Spezialfälle der am Anfang des Abschnittes
beschriebenen allgemeinen linearen Substitution s = mx + q. Beim Verschiebungs-Trick ist
m = 1, beim Reskalierungs-Trick ist q = 0. Im allgemeinen Fall (m 6= 1 und q 6= 0) Wird der
Funktionsgraph sowohl horizontal verschoben, wie auch gestreckt oder gestaucht. Beispiel:
f (x) =
1
3
1
x−4
mit s =
1
x−4
3
⇒
f (s) =
1
s
und
m=
ds
1
=
dx
3
Damit finden wir beim folgenden Integral:
Z 21
Z 1 ·21−4
Z 3
3
3
1
1
1
1
dx
=
·
ds
=
3
·
ds
=
3
·
ln
|s|
= 3 ln 3
1
1
1
s
s
1
·15−4
15 3 x − 4
1
3
3
Bemerken Sie, dass in dieser allgemeinen linearen Substitution die horizontale Verschiebung
nicht einfach der Zahl q entspricht. Vielmehr muss man den Streckungs- resp. Stauchungsfaktor
q
. Im Beispiel:
m ausklammern, um die effektive Verschiebung zu sehen. Sie ist gegeben durch m
s=
1
1
x − 4 = (x − 12)
3
3
⇒
Verschiebung um 12 nach links
Abbildung 14: Die Substitution s = 13 x − 4 = 13 (x − 12) verschiebt den Graphen horizontal um 12
nach links. Danach wird er mit dem Faktor 3 zur y-Achse hin gestaucht. Die Integrationsgrenzen
müssen entsprechend mitverschoben werden. Durch die Stauchung wird die Fläche verkleinert, was
beim Integral durch eine Multiplikation mit dem Stauchungsfaktor 3 ausgeglichen werden muss.
Zum Schluss dieses Abschnittes sei angefügt, dass die lineare Substitution einem Erkennen von
äusserer und innerer Ableitung entspricht. Anstatt lange zu theoretisieren zeige ich Ihnen an einem
Beispiel, wie das gemeint ist.
Beispiel 4: Das folgende Integral berechnen wir mit der linearen Substitution s = 2x − π3 :
Z π/6
Z π/4
π/6 1 1
1
1
1
π
dx = ·
= ·
cos s ds = · sin s −0 =
cos 2x −
3
2 0
2
2
2
4
0
π/6
Andererseits erkennen wir aber auch, dass der Cosinus die Ableitung einer äusseren Funktion
mit innerer Funktion 2x − π3 ist. Die konstante Ableitung der linearen inneren Funktion, also
der Faktor 2, ist nicht sichtbar. D.h., es braucht einen zusätzlichen Faktor 12 , der diese innere
Ableitung wegschafft. Die Stammfunktion lautet somit 12 sin(2x − π3 ) und wir erhalten:
Z π/4 2π π 1
1
π π/4 1
π
2π π =
dx = sin 2x −
−
sin
=
−
−
cos 2x −
sin
3
2
3 π/6 2
4
3
6
3
4
π/6
Je mehr Übung Sie haben, desto selbstverständlicher werden diese Rechnungen.
21
2.4.4
Partielle Integration
Diese ebenfalls sehr nützliche Integrationstechnik bedient sich der Produktregel beim Ableiten. Wir
erinnern uns:
[u(x) v(x)]′ = u′ (x) v(x) + u(x) v ′ (x)
Integrieren wir über beide Seiten, so ergibt sich:
Z
b
′
[u(x) v(x)] dx =
a
Z
b
′
u (x) v(x) dx +
a
Z
b
u(x) v ′ (x) dx
a
Nun steht auf der linken Seite aber das Integral über der Ableitung von u(x) v(x). Eine Stammfunktion dazu ist u(x) v(x) selber, woraus folgt:
Z b
b Z b
′
u(x) v ′ (x) dx
u (x) v(x) dx +
[u(x) v(x)] =
a
a
a
Durch Umstellen finden wir:
Z b
b Z b
′
u(x) v ′ (x) dx
u (x) v(x) dx = [u(x) v(x)] −
a
a
(10)
a
Diese Beziehung bezeichnet man als partielle Integration, weil von der Funktion f (x) = u′ (x) v(x)
quassi nur der “Part” resp. Anteil u′ (x) integriert, also aufgeleitet wird. Damit ist die Integration
von f (x) = u′ (x) v(x) noch nicht abgeschlossen, vielmehr hat man das Problem auf die Berechnung
des Integrals über g(x) = u(x) v ′ (x) verlagert. Dieses ist aber unter Umständen wesentlich leichter
zu berechnen, sodass sich die partielle Integration ausbezahlt.
Die nachfolgenden Beispiele demonstrieren den Nutzen der partiellen Integration.
Beispiel: Das folgende Integral ist ein Kandidat für eine partielle Integration, weil wir in ihm ein
Produkt zweier Funktionen entdecken:
Z π/2
x cos x dx
0
Mit unseren bisherigen Methoden kommen wir hier nicht weiter. Der Faktor x vor der Cosinusfunktion erschwert die Sache. Nur cos x – oder sin x – wäre ja völlig unproblematisch. Aber
genau dies können wir durch die partielle Integration erreichen mit der das Integral in gewisser
Weise ausgetauscht werden kann. Wir identifizieren u′ (x) = cos x und v(x) = x. Dann sind
u(x) = sin x und v ′ (x) = 1, sodass u(x)v ′ (x) = sin x. Somit erhalten wir:
Z
π/2 Z
x cos x dx = x sin x −
π/2
0
0
π/2
sin x dx =
0
π/2 π
π
π
= + (0 − 1) = − 1
− 0 + (cos x)
2
2
2
0
In die “andere Richtung” mit u′ (x) = x und v(x) = cos x bringt die partielle Integration keine
Verbesserung:
Z
0
π/2
π/2 Z π/2 1
1 2
−
x cos x dx = x cos x x2 sin x dx = ??
0
2
2
0
22
2.5
Uneigentliche Integrale
Manchmal kommt es vor, dass die Funktion f (x), über die integriert wird, bei einer Integrationsgrenze
κ gar nicht definiert ist, sei es, weil es sich bei κ um eine Definitionslücke von f (x) oder weil die
Integrationsgrenze gleich ±∞ ist und somit selber für keine reelle Zahl steht. In einem solchen Fall
sprechen wir von einem uneigentlichen Integral und wir müssen kurz deklarieren, was darunter zu
verstehen ist:
Definition uneigentlicher Integrale
Ein Integral bis zu einer Stelle κ heisst uneigentlich, wenn κ eine Definitionslücke von f (x) oder gleich ±∞ ist. Den Wert des uneigentlichen
Integrals definieren wir als Grenzwert eines problemlos berechenbaren Integrals:
Z b
Z κ
f (x) dx
(11)
f (x) dx ≡ lim
a
b→κ
a
Der Parameter b soll zwischen a und κ liegen. Natürlich kann das Integral
auch aufgrund der unteren oder sogar aufgrund beider Integrationsgrenzen
uneigentlich sein. Das Verfahren bleibt dasselbe. In letzterem Fall braucht
es dann zwei Limesbildungen.
Bei uneigentlichen Integralen kann es vorkommen, dass der Grenzwert gar
nicht gebildet und somit für das Integral kein Wert berechnet werden kann.
Ein paar Beispiele zeigen, dass die Sache relativ einfach ist. Mit etwas Übung wird es nur selten
notwendig sein aus Verständnisgründen die Grenzwertbildung ganz ausführlich zu betrachten.
Beispiel 1: Die Funktion f (x) = √1x besitzt bei x = 0 eine Polstelle. Somit ist das folgende Integral
uneigentlich, aber es lässt sich trotzdem berechnen:
Z 4
Z 4
√
√ 4
√ 1
1
√ dx ≡ lim
√ dx = lim 2 x = 2 lim
4 − a = 2(2 − 0) = 4
a→0
a→0
a→0
x
x
a
0
a
Dies war die ausführliche Notation. Wir scheuen uns meistens aber nicht vor einer etwas
salopperen Schreibweise ohne Limesbildung:
Z 4
√
√ √ 4
1
√ dx = 2 x = 2 4 − 0 = 4
x
0
0
Wichtig ist einfach, dass wir um die exaktere Schreibweise mit der Limesbildung wissen und
diese in kritischen Fällen hervornehmen können.
Links in Abb. 15 sehen wir die graphische Bedeutung unseres Resultates: Die Fläche unter
dem Funktionsgraphen zwischen x = 0 und x = 4 ist offenbar endlich gross, auch wenn die
Funktionswerte für x → 0 unendlich gross werden.
Beispiel 2: Betrachten wir nun ein Integral, dessen rechte Integrationsgrenze im Unendlichen liegt:
Z b
Z +∞
b −x
−x
−x e dx ≡ lim
e dx = lim −e = − lim e−b − e0 = −(0 − 1) = 1
0
b→∞
b→∞
0
0
b→∞
Auch hier sind wir gerne etwas schludriger, aber eben speditiver unterwegs:
Z +∞
+∞
= −(0 − 1) = 1
e−x dx = −e−x 0
0
23
Abbildung 15: Beispiele uneigentlicher Integrale: An den Integrationsgrenzen undefinierte Funktionen
können trotzdem endliche Flächen eingrenzen.
Beispiel 3: Nach den ersten beiden Beispielen könnte man den Eindruck erhalten, dass sich jedes
uneigentliche Integral berechnen lässt. Hier sehen Sie, dass dem überhaupt nicht so sein muss:
Z b
Z +∞
b 1
1
dx ≡ lim
dx = lim ln |x| = lim (ln b − ln 1) = undefiniert
b→∞
b→∞
b→∞
x
x
0
1
1
Der Logarithmus naturalis ist eine monoton wachsende Funktion, sodass limb→∞ ln b = ∞
und der Grenzwert somit undefiniert ist. Damit existiert dieses uneigentliche Integral nicht.
2.6
Spezielle bestimmte Integrale
In der Quantenmechanik werden wir ein paar bestimmte Integrale verwenden, deren Herleitung in
ein paar Fällen den Rahmen der uns zur Verfügung stehenden Mathematik sprengen würde:
Z ∞
xn e−x/a dx = n! an+1
mit a > 0, n ∈ N
Exponenzialintegral:
0
Gauss’sche Integrale:
Z
∞
e−x
2 /a2
dx =
0
Z
∞
x2n e−x
2 /a2
dx =
0
Z
Trigo-Integrale:
∞
√ a
π
2
√ (2n)! a 2n+1
π
n!
2
n! 2n+2
a
2
0
(
Z 2π
0 für m 6= n
sin(mx) sin(nx) dx =
π
für m = n
0
(
Z 2π
0 für m 6= n
cos(mx) cos(nx) dx =
π für m = n
0
Z 2π
sin(mx) cos(nx) dx = 0
x2n+1 e−x
2 /a2
dx =
mit
a>0
mit
a > 0, n ∈ N
mit
a > 0, n ∈ N
mit
m, n ∈ Z
mit
m, n ∈ Z
mit
m, n ∈ Z
mit
a>0
0
Z
∞
π
sin(ax)
dx =
x
2
0
r
Z ∞
Z ∞
π
2
2
cos(x ) dx =
sin(x ) dx =
8
0
0
24
3
Differenzialgleichungen – ein fundamental neuer Gleichungstyp
In Ihrer bisherigen “mathematischen Karriere” haben Sie eine Vielzahl von Gleichungen angetroffen.
Je nach Gleichungstyp gab es unterschiedlich viele Lösungen und vor allem auch immer wieder andere
Lösungsverfahren. Ein paar Beispiele:
• Lineare Gleichung (LG) in 1 Unbekannten: ax + b = 0 mit a 6= 0
⇒ genau 1 Lösung x, Verfahren: Separation.
• LG in 2 Unbekannten (Geradengleichung): ax + by + c = 0 mit entweder a oder b 6= 0
⇒ ∞-viele Lösungspunkte (x, y), bilden eine Gerade in einem x-y-Koordinatensystem.
• LG in 3 Unbekannten (Ebenengleichung): ax + by + cz + d = 0 mit a, b oder c 6= 0
⇒ ∞-viele Lösungspunkte (x, y, z), bilden eine Ebene in einem x-y-z-Koordinatensystem.
• Quadratische Gleichung (QG) in 1 Unbekannten: ax2 + bx + c = 0 mit a 6= 0
⇒ 0, 1 oder 2 Lösungen x, sind die Nullstellen einer Parabel, Verfahren allg.: Quadratische
Ergänzung resp. Mitternachtsformel, spez.: Binomische Formel resp. Zweiklammeransatz.
• Exponentialgleichung in 1 Unbekannten: ax = b mit a, b > 0
⇒ genau 1 Lösung x, Verfahren: Logarithmieren.
So unterschiedlich diese Gleichungstypen auch sind, eines haben sie alle gemeinsam: Ihre Lösungen
sind Punkte in einem ein- oder mehrdimensionalen Koordinatensystem.12
Nun wenden wir uns allerdings einem ganz neuen Gleichungstyp zu, dessen Lösungen einer
fundamental anderen Objektklasse angehören. Bei sogenannten Differenzialgleichungen (DGLs)
sind die Lösungen nämlich ganze Funktionen f (x), also Zuordnungsvorschriften von einer Variable
x zu einer davon abhängigen Grösse f (x). Gesucht sind alle Funktionsvorschriften f (x), welche die
durch die DGL beschriebenen Anforderungen erfüllen, also eben die DGL lösen.
Das tönt im Moment wohl etwas abstrakt und bedarf daher sicher einiger Erläuterung. . .
3.1
Was ist eine Differenzialgleichung (DGL)?
Die folgenden Ausführungen sind sinngemäss dem Buch Rechenmethoden für Studierende der Physik
im ersten Jahr [2] von Markus Otto entnommen:13
Allgemeine Definition: Eine gewöhnliche Differenzialgleichung (DGL) ist eine Gleichung, in
welcher Terme mit der/den Ableitung/en einer gesuchten Funktion y(x) auftreten. In der
Gleichung können zudem die Funktion y(x), wie auch die Variable x vorkommen.
Eine DGL zu lösen bedeutet, alle möglichen Funktionen y(x) zu finden, welche die DGL für
alle erlaubten Werte der Variable x erfüllen.
Ordnung der DGL: Definition: y (n) (x) ≡ n-te Ableitung von y(x). Ist y (n) (x) die höchste in der
DGL vorkommende Ableitung, so sprechen wir von einer DGL n-ter Ordnung.
Lineare und homogene DGLs: Eine DGL heisst linear, wenn die unbekannte Funktion y(x) und
ihre Ableitungen darin linear auftreten. D.h., die DGL enthält lauter einzelne Terme mit Potenz
1 von y(x), y ′ (x), y ′′ (x), etc. Die allgemeinste lineare DGL n-ter Ordnung lautet daher:
a0 (x)y(x) + a1 (x)y ′ (x) + a2 (x)y ′′ (x) + . . . + an (x)y (n) (x) = r(x)
Darin sind a0 (x), a1 (x), . . . , an (x) beliebige Funktionen der Variable x.
Ist die Störfunktion r(x) = 0, so spricht man von einer homogenen (linearen) DGL.
12
Eine einzelne Lösung x sitzt ja auch an irgendeinem Punkt auf einem Zahlenstrahl (= x-Achse), also in einem
eindimensionalen Koordinatensystem.
13
Otto 2011, S. 201ff [2].
25
Lösungen: Eine lineare, homogene DGL n-ter Ordnung besitzt n Einzellösungen y1 (x), . . . , yn (x).
Die allgemeine Lösung ergibt sich dann als Linearkombination der Einzellösungen:
y(x) = C1 y1 (x) + C2 y2 (x) + . . . + Cn yn (x)
Dabei sind die Koeffizienten C1 , . . . , Cn zunächst frei wählbare Zahlenwerte. D.h., es gibt nicht
eine einzige, eindeutige Lösung der DGL, sondern eine unendlich grosse Lösungsschar, deren
einzelnes Element durch eine bestimmte Koeffizientenkombination (C1 , . . . , Cn ) gegeben ist.
Rand- resp. Anfangsbedingungen (RBs): Da die Lösung einer DGL, wie eben erläutert, nicht
eindeutig ist, braucht es zusätzliche Bedingungen (Gleichungen), um die Funktion y(x) komplett festzulegen. Diese sogenannten Anfangs- oder Randbedingungen (RBs) sind in der
Regel Teil des Problems, für das die DGL die Lösung liefern soll.
Sind bei einer DGL n-ter Ordnung zusätzlich n RBs vorgegeben, so werden dadurch die Koeffizienten C1 , . . . , Cn in eindeutiger Weise festgelegt.
Ermittlung der Lösungen einer DGL: Trotz einiger raffinierter Verfahren für verschiedene Arten
von DGLs gibt es leider kein Patentrezept für die Lösung einer DGL. Oftmals ist Raten ein
guter erster Schritt. Aber am meisten hilft viel Erfahrung und vor allem ein solides, also ohne
Nachschlagen präsentes (!) Grundwissen über Ableitungsregeln und die konkreten Ableitungen
verschiedener Funktionen (vgl. Seite 5).
Allerdings ist es so, dass nur zu verhältnismässig wenigen DGLs überhaupt eine analytische
Lösung, also eine als geschlossener mathematischer Ausdruck notierbare Funktion, existiert.
Damit meint man nicht, dass in allen anderen Fällen gar keine Lösung existiert, aber die DGL
ist dann halt nur sogenannt numerisch lösbar. Das bedeutet, man kann sich der Lösungsfunktion durch Verwendung bestimmter Rechenmethoden im Prinzip beliebig genau annähern,
aber die Lösung selber, also die Grenzfunktion dieser Annäherung, kann einfach nicht so geschlossen aufgeschrieben werden, wie Sie sich das für Funktionen bisher gewohnt waren.14
Die Ausführung solcher Annäherungsrechnungen überlassen wir heutzutage dem Computer.
Auch hierzu werden Sie später, allerdings ohne ausführliche Rechnungen, ein paar Beispiele
vorfinden.
Hinweis: In diesem Ergänzungsfach wird es nur am Rande darum gehen DGLs zu lösen. Mit diesem Thema alleine könnte man problemlos ein ganzes Ergänzungsfachjahr füllen . . . Hingegen
sollten Sie einerseits in der Lage sein die Richtigkeit einer vorgegebenen Lösung zu überprüfen,
andererseits aus den RBs allfällige Parameter zu ermitteln. Beides ist wesentlich einfacher als
das Aufspüren von Lösungen, denn dazu brauchen Sie “lediglich” die angegebene Lösung in
die DGL einzusetzen, wofür Sie im Wesentlichen das Ableiten beherrschen müssen. . .
√
Das ist vergleichbar damit, dass Sie z.B. die Zahl 2 als Dezimalzahl auch nicht ganz genau aufschreiben können,
obwohl Sie genau wissen, dass diese Zahl existiert und die positive Lösung der Gleichung x2 = 2 ist.
14
26
3.2
3.2.1
Erste Beispiele von DGLs (ohne physikalischen Kontext)
Stammfunktionen bestimmen
Im Prinzip haben Sie bei der Integralrechnung bereits selber einfache DGLs gelöst, nämlich immer
dann, wenn Sie eine Stammfunktion y(x) zu einer vorgegebenen Funktion f (x) bestimmt haben.
Die zugehörige DGL lautete:
y ′ (x) = f (x)
Das ist eine lineare DGL 1. Ordnung. Allerdings ist sie nicht homogen, denn die Funktion f (x) stört
die Homogenität. Das hält uns aber nicht auf! Dank unserer Erfahrung wissen wir, dass wir y(x)
erhalten, indem wir das unbestimmte Integral von f (x) ermitteln:
Z
y(x) = f (x) dx + C
Wie es sich für eine DGL 1. Ordnung gehört, taucht ein einzelner, unbestimmter Parameter C
auf – Ihnen bekannt unter dem Namen Integrationskonstante. Die DGL liefert somit eine ganze
Lösungsschar von Funktionen y(x).
Beispiel: Gesucht sei die Lösung folgender DGL (inkl. RB):
y ′ (x) =
4
1 2 4
x − x+
4
3
3
mit RB: y(2) = 1
Für die Stammfunktion (unbestimmtes Integral) erhalten wir:
Z 4
1 3 2 2 4
1 2 4
x − x+
x − x + x+C
dx + C =
y(x) =
4
3
3
12
3
3
Aus der RB lässt sich schliesslich der Wert des Parameters C bestimmen:
y(2) =
2
2 8 8
!
− + +C = +C =1
3 3 3
3
⇒
C=
1
3
Somit erhalten wir für unsere gesuchte Funktion y(x):
y(x) =
1 3 2 2 4
1
x − x + x+
12
3
3
3
Abb. 16 zeigt die Funktion für verschiedene Werte von C. Es handelt sich immer um dieselbe
Kurve, allerdings auf verschiedenen Höhen. Das muss ja so sein, denn die DGL y ′ (x) = f (x)
schreibt lediglich vor, welche Steigung zu welcher Stelle x gehört. Die RB y(2) = 1 fixiert den
Graphen auf einer bestimmten Höhe. Der Punkt (2, 1) soll auf dem Funktionsgraphen liegen.
Daraus folgt der Wert von C, denn die Addition einer Konstante macht nichts anderes als den
Graphen einer Funktion vertikal zu verschieben.
3.2.2
Exponentialfunktion
Betrachten wir jetzt die folgende homogene, lineare DGL 1. Ordnung. Darin sei k eine beliebige Zahl
ausser 0:
y ′ (x) = ky(x) resp. y ′ (x) − ky(x) = 0
mit RB: y(0) = a
(12)
Natürlich werde ich Ihnen gleich die Lösung zu dieser DGL angeben. . . Andererseits lohnt es sich hier
kurz innezuhalten und sich zu fragen, ob man diese Lösung nicht selber erraten könnte: Gesucht ist
eine Funktion y(x), deren Ableitung y ′ (x) bis auf den konstanten Vorfaktor k wieder sich selber sein
soll. Für k = 1 wäre dann sogar y ′ (x) = y(x). Welche Funktion erfüllt grundsätzlich die Anforderung,
dass ihre Ableitung immer noch dieselbe Funktion ist?
27
Abbildung 16: Das graphische Verständnis eines unbestimmten Integrals. Erst die Randbedingung
legt schliesslich fest, auf welcher Höhe der Graph verläuft.
Genau: die Exponentialfunktion ex !
Jetzt müssen wir noch dafür sorgen, dass beim Ableiten ein Vorfaktor k rausspringt. Das k muss
das Resultat der inneren Ableitung sein. Die Einzellösung y1 (x) lautet daher:
y1 (x) = ekx
Da DGLs 1. Ordnung nur eine einzige Einzellösung besitzen, sind wir schon fertig. Für die allgemeine
Lösung müssen wir einfach noch einen Vorfaktor C anfügen:
y(x) = Cy1 (x) = Cekx
⇒
y ′ (x) = Cekx · k = ky(x)
⇒
Stimmt!
Als multiplikative Konstante bleibt der Vorfaktor C beim Ableiten einfach erhalten.
Bestimmen wir schliesslich aus der RB noch den konkreten Wert von C:
!
y(0) = C · ek·0 = C = a
⇒
y(x) = aekx
(13)
Würdigung der Euler’schen Zahl e: Bemerken Sie, welch spezielle Eigenschaft die Euler’sche Zahl
e ≈ 2.718 aufweist! Die Exponentialfunktion mit Basis e, also y(x) = Cex , ist die einzige von
der trivialen Funktion y(x) = 0 verschiedene Funktion, die beim Ableiten genau gleich bleibt.
Dies zeichnet e aus und macht diese Zahl quasi zur “natürlichen Basis” für sämtliche Exponentialfunktionen in Mathematik und Naturwissenschaft.15 Mit keiner anderen Basis lassen
sich Exponentialfunktionen so leicht handhaben.
Abb. 17 erläutert eine graphische Konsequenz von [ex ]′ = ex : Der Funktionsgraph von y(x) =
Cex hat die interessante Eigenschaft, dass die y-Koordinate jedes Punktes auf dem Graphen
auch gerade angibt, wie steil der Graph durch diesen Punkt hindurch verläuft.
3.2.3
Sinus- und Cosinusfunktion
Erneut betrachten wir eine homogene, lineare DGL, diesmal allerdings 2. Ordnung, weshalb zur
eindeutigen Lösung nun zwei RBs benötigt werden. Auch hier sei k eine beliebige Zahl 6= 0:
y ′′ (x) = −ky(x)
mit RBs: y(0) = A und
y ′ (0) = 0
(14)
Hier lautet die Frage zur DGL: “Welche Funktion y(x) hat die Eigenschaft, dass ihre 2. Ableitung
y ′′ (x) das Negative der Funktion selber ist?”
15
Und das sind weitaus mehr, als Sie im Moment vielleicht denken mögen! Sobald wir uns mit komplexen Zahlen
beschäftigen, wird dies noch deutlicher werden.
28
Abbildung 17: Die spezielle Eigenschaft der Exponentialfunktion ex : In jedem Punkt P (x, ex ) auf
dem Funktionsgraphen besitzt die zugehörige Tangente die Steigung ex .
Wer sich in den Funktionsableitungen auskennt, wird sofort ausrufen: “Die Sinusfunktion!” Klar:
[sin x]′ = cos x und [cos x]′ = − sin x, also in der Kombination: [sin x]′′ = − sin x.
“Aber Cosinus doch auch!” ruft jemand anders. Tatsächlich: [cos x]′′ = [− sin x]′ = − cos x.
Und schon haben wir die beiden Einzellösungen gefunden – zumindest fast: Wir müssen noch
die Konstante k einbauen. Das ist aber keine grosse Sache mehr, denn wiederum handelt es sich um
einen Faktor, der als Resultat der inneren Ableitung entsteht, diesmal allerdings doppelt:
y ′′ (x) = [sin(ωx)]′′ = [ω cos(ωx)]′ = −ω 2 sin(ωx) = −ky(x)
Die allgemeine Lösung der DGL lautet somit:
y(x) = C1 sin(ωx) + C2 cos(ωx)
mit
ω=
mit
√
ω2 = k
k
(15)
Was sagen die RB’s über die Werte von C1 und C2 ? Notieren wir y(x) und y ′ (x) nochmals und
setzen die RBs ein:
y(x) = C1 sin(ωx) + C2 cos(ωx)
!
⇒
y ′ (x) = ωC1 cos(ωx) − ωC2 sin(ωx)
y(0) = 0 + C2 = A
⇒
⇒
!
y ′ (0) = ωC1 + 0 = 0
C2 = A
⇒
C1 = 0
Somit lautet unser Schlussresultat:
y(x) = A cos(ωx)
mit ω =
√
k
(16)
Dieses Resultat ist bei Betrachtung der RBs nicht weiter erstaunlich: Bei x = 0 soll die Funktion
irgendeinen Wert A annehmen. Die Sinusfunktion ist dort aber gleich Null, somit muss das schon
die Cosinusfunktion hinkriegen. Ausserdem soll die Steigung bei x = 0 gleich Null sein. Das trifft für
die Cosinusfunktion zu, aber für die Sinusfunktion eben nicht. Somit muss es sich bei der gesuchten
Funktion um eine reine Cosinusfunktion handeln.
Bemerke! Als RB kann auch eine Wertfestlegung für eine Ableitung benutzt werden. Hier war dies
mit y ′ (0) = 0 der Fall.
√
Ergänzung Aus ω 2 = k könnte auch ω = − k folgen. Damit würden aber aufgrund der Symmetrieeigenschaften von Cosinus- und Sinusfunktion keine Lösungen entstehen, die nicht schon
durch (15) abgedeckt wären, denn cos(−a) = cos a und sin(−a) = − sin a. Beim Sinus würde
sich bei einer bestimmten Lösung einfach −C1 statt C1 ergeben.
29
3.2.4
Lineare, inhomogene DGL 2. Ordnung:
Schliesslich noch ein Beispiel ohne grossen Kommentar. Sie werden am Ende von Abschnitt 4.2 auf
Seite 37 genauer erfahren, worum es sich hier handelt – und erahnen es vermutlich auch schon.
Um Sie formal ein bisschen herauszufordern, heisst die Variable nun allerdings t und die davon
abhängige, gesuchte Funktion ist x(t):
x′′ (t) = a = const.
mit RBs: x(0) = x0
und x′ (0) = v0
(17)
Kennen wir die 2. Ableitung der Funktion, so erhalten wir die allgemeine Lösung durch zweimaliges
unbestimmtes Integrieren:
Z
Z
′
′′
x (t) = x (t) dt + C1 = a dt + C1 = at + C1
Z
Z
a
x(t) = x′ (t) dt + C2 = (at + C1 ) dt + C2 = t2 + C1 t + C2
2
Beachten Sie, dass bei der zweimaligen Integration die Integrationskonstante C1 des ersten unbestimmten Integrals ins zweite unbestimmte Integral mitgenommen werden muss.
Aus den RBs folgt für C1 und C2 :
!
x(0) = C2 = x0
!
x′ (0) = C1 = v0
und
Daraus ergibt sich schliesslich für die fertige Lösung (und ihre 1. Ableitung):
x(t) = x0 + v0 t +
a 2
t
2
und
x′ (t) = v0 + at
Na, kommt Ihnen das irgendwie bekannt vor? Wie schon gesagt: mehr dazu in Abschnitt 4.2.
3.3
3.3.1
Funktionen mit mehreren Variablen und partielle Ableitungen
Die Notation partieller Ableitungen
In Mathematik und Physik kann es durchaus vorkommen, dass eine Funktion von mehreren Variablen
resp. dass eine Grösse von mehreren anderen Grössen abhängt: f = f (x, y, . . .).
Beispiel: Die Zentripetalkraft FZ , also die resultierende Kraft, die notwendig ist, um einen Körper
der Masse m auf einer Kreisbahn mit Radius r zu halten, wenn seine Bahngeschwindigkeit v
beträgt, ist laut Newton gegeben durch:
FZ =
mv 2
r
Bei konstanter Körpermasse hängt FZ nur noch von v und r ab.16 Wir schreiben:
FZ = FZ (v, r)
D.h., wir notieren FZ ganz explizit als Funktion der zwei Grössen v und r.
16
Natürlich hängt FZ immer noch von der Masse m ab, aber dieses m wird sich bei vorgegebenem Körper im Verlauf
der Bewegung nicht ändern und muss deshalb nicht mehr als Variable (= “Veränderliche”) angeschaut werden.
30
Nun kann man sich fragen, wie sich FZ verändert, wenn ich den Bahnradius r unverändert
lasse und nur die Bahngeschwindigkeit v variiere. Es sollte Sie nicht allzu sehr verwundern,
dass wir die Antwort auf diese Frage durch Ableitung von FZ nach v erhalten. Da wir FZ als
Funktion von v und r ansehen, hier aber nur nach v ableiten wollen, spricht man von einer
partiellen Ableitung17 und verwendet dafür statt des differenziellen d’s das Symbol ∂:
2mv
∂FZ
=
∂v
r
Die andere partielle Ableitung nach dem Bahnradius r lautet:
mv 2
∂FZ
=− 2
∂r
r
3.3.2
Weshalb verwendet man für partielle Ableitungen eine andere Notation?
Die Antwort auf diese Frage ist für unsere weiteren Betrachtungen zwar nicht so wichtig,
schaden kann sie aber wohl kaum: Sind sich in unserem Beispiel von oben die Geschwindigkeit v
und der Bahnradius r gleichzeitig am verändern, so existieren zwei infinitesimale Veränderungen
dv und dr, die erst zusammen die infinitesimale Veränderung dFZ festlegen. Dieses dFZ
bezeichnet man deshalb auch als das totale Differenzial von FZ und es gilt:
dFZ =
∂FZ
∂FZ
· dv +
· dr
∂v
∂r
Mit dem leicht modifizierten Differenzial-Symbol ∂ will man nun speziell darauf hinweisen, dass
bei einer partiellen Ableitung nur eine einzige Variable verändert wird. Die anderen Variablen
werden konstant gehalten. Auf diesem Hintergrund können Sie verstehen, dass in der obigen
Zeile dFZ etwas wesentlich anderes als ∂FZ meint: dFZ ist die infinitesimale Veränderung von
Z
FZ bei infinitesimalen Veränderungen dv und dr, währenddem ∂FZ im Ausdruck ∂F
∂v für die
infinitesimale Veränderung von FZ steht, wenn sich einzig v am verändern ist.
Das tönt jetzt vielleicht alles etwas theoretisch, ist aber halb so wild! Wichtig ist abschliessend
nochmals einfach dies:
Sobald eine Funktion von mehreren Variablen abhängt, z.B. f (x, y),
schreiben wir für die Ableitung nach einer dieser Variablen, z.B. nach
y, neu eben ∂f
∂y und nennen dies die partielle Ableitung von f nach y.
3.3.3
Unser zentrales Beispiel: Wellenfunktion und Schrödingergleichung
Wie wir im Quantenmechanik-Buch von D.J. Griffiths 18 ganz zu Beginn des ersten Kapitels lesen,
ist die Wellenfunktion Ψ (x, t) jeweils die Lösung der Schrödinger-Gleichung:
i~
~2 ∂ 2 Ψ
∂Ψ
=−
+VΨ
∂t
2m ∂x2
(18)
Ohne im Moment darauf einzugehen, was diese Wellenfunktion ist, stellen wir fest, dass es sich
offenbar um eine Funktion Ψ handelt, die vom Ort x und von der Zeit t, also von zwei Variablen
abhängt. Jedem Ort x wird zu jedem Zeitpunkt t ein Funktionswert Ψ (x, t) zugeordnet.
17
“Partiell” ist zu verstehen als “teilweise”: Es wird nur nach einer einzigen Variable, also nur nach einem einzelnen
Bestandteil des gesamten Variablenkatalogs abgeleitet.
18
Griffiths 2012, S. 22 [1].
31
Dem entsprechend treten in der Schrödinger-Gleichung (18) eben partielle Ableitungen auf – auf
∂2Ψ
der linken Seite die einfache Ableitung ∂Ψ
∂t nach der Zeit t, rechts die zweifache Ableitung ∂x2 nach
dem Ort x. Die Schrödinger-Gleichung ist somit eine partielle Differenzialgleichung. Die Lösungen
der Schrödinger-Gleichung sind Funktionen Ψ (x, t), welche die Gleichung für alle Orte x und alle
Zeiten t erfüllen!19
Etwas später20 werden wir die Wellenfunktion Ψ (x, t) durch den Ansatz einer Variablenseparation in einen nur noch vom Ort x abhängigen Teil ψ(x) und einen nur noch von der Zeit t abhängigen
Teil ϕ(t) auftrennen:
Ψ (x, t) = ψ(x) ϕ(t)
Setzt man diesen Ansatz in die Schrödinger-Gleichung ein, so folgen daraus zwei neue Differentialgleichungen, eine für ψ(x) und eine für ϕ(t):
−
~2 d2 ψ
+ V ψ = Eψ
2m dx2
und
dϕ
iE
=− ϕ
dt
~
(19)
Beachten Sie, dass in diesen neuen DGLs nun wieder das d anstelle des ∂ auftaucht, weil ψ(x) und
ϕ(t) je nur noch von einer einzigen Variable abhängen.
Da lässt sich doch etwas wiedererkennen! Schauen Sie sich in (19) die rechte der beiden neuen
iE
DGLs an: Die Ableitung dϕ
dt ist bis auf den Vorfaktor − ~ gleich der Funktion ϕ(t) selber. . . Klingelt
da was? Na klar: Die Lösung muss eine Exponenzialfunktion sein, denn es handelt sich um die
zugehörige DGL (12) von Seite 27 und somit muss sich die Lösung (13) ergeben:
iE
iE
dϕ
iE
− iE
−
t
t
ϕ(t) = ae ~
= ae ~ · −
⇒ Stimmt!
= − ϕ(t)
⇒
dt
~
~
Anmerkung: Im Kontext von Funktionen mit mehreren Variablen können Sie nun gut nachvollziehen, weshalb sich die Strich-Schreibweise f ′ (x) im Prinzip nur für Funktionen mit einer
einzigen Variable eignet. Was soll denn bitte f ′ (x, y) bedeuten? Wonach wird da abgeleitet?
∂f
Das sollte doch explizit gesagt werden! Die differenzielle Schreibweise ∂f
∂x resp. ∂y bringt das
hingegen ganz klar zum Ausdruck.
3.4
Differenzialoperatoren und mehrfache Ableitungen
Ohne grosse Umstände können Sie nun ebenfalls verstehen, dass das “Ableiten nach einer bestimmten
Variable” als sogenannter Differenzialoperator notiert werden kann, z.B.:
d
∂
Differenzialoperator für die Ableitung nach x:
resp.
dx
∂x
Solche (Differenzial-)Operatoren müssen offensichtlich auf Funktionen angewendet werden. Das kann
auch mehrfach passieren, wie Sie es oben bereits gesehen haben. Z.B. schreibt man für die zweite
Ableitung nach x:
d df
d2 f
d ′
f (x) =
=
f ′′ (x) =
dx
dx dx
dx2
Achtung! Verwechseln Sie die zweite Ableitung nicht mit dem Quadrat einer ersten Ableitung:
2
2
df
d2 f
′
′′
=
f
(x)
=
6
f (x) =
dx2
dx
19
Klar: Solche partiellen DGLs sind nochmals eine Klasse für sich. Damit setzen wir uns dann ganz konkret und
länger als an dieser Stelle bei der Betrachtung von Lösungen der Schrödinger-Gleichung auseinander.
20
Griffiths 2012, S. 48 [1].
32
4
Die klassische Mechanik – eine differenzielle Theorie
Das Ziel der klassischen Mechanik nach Newton ist es, aufgrund der auf einen Körper wirkenden
Kräfte dessen Ortsfunktion x(t) zu bestimmen: Zu jedem Zeitpunkt t gehört ein eindeutiger Ort
x, der eben als Funktion des Zeitpunktes t aufgefasst wird. Wissen wir über die Funktionsweise
der Kräfte und den aktuellen Bewegungszustand des Körpers ganz genau Bescheid, so ist seine
Bewegung resp. seine Ortsfunktion x(t) bis in alle Zukunft vorausbestimmt.
Klarstellung: Eigentlich handelt es sich beim Ort um einen Punkt im dreidimensionalen Raum,
also um einen von der Zeit t abhängigen Ortsvektor ~r(t). Wir wollen uns hier vorerst aber
auf sogenannt geradlinige Bewegungen einschränken. Dabei ist der Ausdruck “geradlinig”
leicht irreführend. Es geht nicht darum nur Bewegungen längs einer Geraden zu studieren,
vielmehr schränken wir uns einfach auf die Bewegung des Körpers längs einer bereits bekannten
Trajektorie (= Bewegungsbahn) ein. D.h., uns interessiert nur das schneller oder langsamer
Werden, nicht aber die Kurvenfahrt des Körpers. Seine Bewegung ist sozusagen auf eine
Dimension eingeschränkt. Das ist auch der Grund, weshalb wir die Ortsfunktion hier x(t)
nennen und damit in gewisser Weise zum Ausdruck bringen, dass sich der Körper nur längs
einer vorgegebenen Bahn, die wir auf die x-Achse legen wollen, verschieben soll.
Wir wollen nun nachvollziehen, wie die Newton’sche Mechanik die Ortsfunktion x(t) voraussagt.
Zuerst werden wir die Kinematik, also die mathematische Beschreibung eines Bewegungsablaufs,
mittels Differenzial- und Integralrechnung neu formulieren. In der Folge lässt sich das Aktionsprinzip
(2. Newton’sches Axiom, F = m · a) neu verstehen, nämlich als Differenzialgleichung für die
Ortsfunktion x(t). Deren Lösung liefert nicht einfach eine oder mehrere Zahlen, sondern eben eine
ganze Funktion x(t), die den Bewegungsablauf des Körpers für alle Zeiten t beschreibt. Doch eins
nach dem andern. Starten wir mit der Kinematik. . .
4.1
Kinematik und Differentialrechnung
Zu Beginn der 1. Klasse hatten wir in der Physik Bewegungsdiagramme betrachtet, nämlich
das Orts-Diagramm (t-x)21 , das Geschwindigkeits-Diagramm (t-v) und das BeschleunigungsDiagramm (t-a). Damit verbunden waren die Definitionen von Geschwindigkeit und Beschleunigung:
• Momentane Geschwindigkeit v(t) = Steigung im t-x-Diagramm zum Zeitpunkt t.
• Momentane Beschleungiung a(t) = Steigung im t-v-Diagramm zum Zeitpunkt t.
Anfangs der 1. Klasse mussten wir unsere Berechnungen auf gerade Abschnitte der Graphen im t-xund im t-v-Diagramm einschränken, denn ohne Differentialrechnung konnten Sie damals eben erst
Steigungen von Geraden bestimmen (via Steigungsdreiecke).
Betrachten wir nochmals den VBZ-Trolleybus in unserem 1. Klass-Mechanik-Skript.22 Er
fährt von Haltestelle X zu Haltestelle Y. Wir hatten drei Bewegungsabschnitte unterschieden:
1. Losfahren = Gleichmässig beschl. Bew. ohne Anfangsgeschwindigkeit (gmbBoA)
Der Bus beschleunigt. Nach 7.0 s hat er seine Fahrtgeschwindigkeit von 12.5 ms erreicht.
2. Fahrt mit konstanter Geschwindigkeit = Gleichförmige Bewegung (gfB)
Der Bus fährt während den folgenden 10 s mit seiner erreichten Geschwindigkeit weiter.
3. Abbremsen = Gleichmässig beschl. Bew. mit Anfangsgeschwindigkeit (gmbBmA)
Der Bus bremst komplett ab. Dafür benötigt er eine Zeit von 5.0 s.
21
22
In der 1. Klasse hiess das Ortsdiagramm t-s-Diagramm.
Gertsch 2013, S. 6ff [3].
33
Abb. 18 zeigt die drei Bewegungsdiagramme. Nur während dem 2. Bewegungsabschnitt, also
während der gleichförmigen Bewegung, konnten Sie die Geschwindigkeit aus dem Steigungsdreieck
berechnen:
125 m
m
∆x
=
= 12.5
v=
∆t
10 s
s
Damit wir anschliessend weitergehen und auch Beschleunigungen bestimmen konnten, gingen wir
davon aus, dass Geschwindigkeitsänderungen stets gleichmässig ablaufen. Im t-v-Diagramm ergaben sich so im 1. und im 3. Bewegungsabschnitt wiederum Geraden, deren Steigungen für die
jeweiligen Beschleunigungen standen und die sich eben berechnen liessen. So erhielten wir:
a1 =
12.5 ms
m
∆v
=
= 1.8
∆t
7s
s
resp.
a3 =
−12.5 ms
∆v
m
=
= −2.5
∆t
5s
s
Abbildung 18: Die Bewegungsdiagramme zu einer Trolleybusfahrt.
34
Das war natürlich eine krasse Vereinfachung. Weshalb sollten Beschleunigungen stets gleichmässig ablaufen? Grundsätzlich sind doch beliebige Bewegungsabläufe mit variablen Beschleunigungen denkbar! Dennoch war das eben eine gute Annahme, denn so konnten Sie ein grundlegendes
Verständnis für Geschwindigkeit und Beschleunigung erhalten.
Dieses Verständnis bleibt auch jetzt immer noch dasselbe:
• Die Geschwindigkeit v soll beschreiben, wie schnell sich der (Aufenthalts-)Ort x eines Körpers
am verändern ist.
• Die Beschleunigung a soll beschreiben, wie schnell sich die Geschwindigkeit v eines Körpers
am verändern ist.
Das sind eigentlich infinitesimale Betrachtungen. Es geht um die momentanen Veränderungsraten
von x resp. v zu einem bestimmten Zeitpunkt t. D.h., wir bilden den Limes ∆t → 0 der beiden
∆v
Differenzenquotienten ∆x
∆t und ∆t und erhalten so die neuen, eben differentiellen Definitionen von
Geschwindigkeit und Beschleunigung:
Definition der Geschwindigkeit v(t)
Die momentane Geschwindigkeit v(t) ist gegeben durch die Ableitung der
Ortsfunktion x(t) nach der Zeit t:
v(t) ≡ x′ (t) ≡
dx
∆x
≡ lim
∆t→0 ∆t
dt
(20)
Definition der Beschleunigung a(t)
Die momentane Beschleunigung a(t) ist gegeben durch die Ableitung der
Geschwindigkeitsfunktion v(t) nach der Zeit t:
a(t) ≡ v ′ (t) ≡
∆v
dv
≡ lim
∆t→0 ∆t
dt
(21)
Damit wird die Beschleunigung a(t) zur zweiten Ableitung x′′ (t) der Ortsfunktion x(t):
dv
d dx
d2 x
a(t) = v ′ (t) =
=
(22)
= 2 = x′′ (t)
dt
dt dt
dt
Da Sie das Ableiten bereits gelernt haben, können Sie nun im Prinzip aus einer beliebigen Ortsfunktion x(t) die Geschwindigkeitsfunktion v(t) und die Beschleunigungsfunktion a(t) berechnen.
Ein erstes Beispiel – die gmbBmA: Bei der gleichmässig beschleunigten Bewegung mit Anfangsgeschwindigkeit (gmbBmA) lautet die quadratische Ortsfunktion x(t) = x0 +v0 t+ a2 t2 .23 Dabei
ist x0 der Startort, v0 die Anfangsgeschwindigkeit und a eben die konstante Beschleunigung.
Durch Ableiten erhalten wir:
v(t) = x′ (t) = v0 + at
(linear!)
und
a(t) = v ′ (t) = a = const.
(23)
Zwischen den Bewegungsgleichungen der gmbBmA gibt es also einen direkten, differentiellen
Zusammenhang, den Sie jetzt verstehen!
23
Vgl. Gertsch 2013, S. 14 [3].
35
4.2
Kinematik und Integralrechnung
Eben haben wir in Gleichung (20) die Geschwindigkeit v(t) als Ableitung der Ortsfunktion x(t) und
in (21) die Beschleunigung a(t) als Ableitung der Geschwindigkeitfunktion v(t) definiert.
Nehmen wir diese Definitionen ernst, so müssen nun in die jeweils umgekehrte Richtung auch
Integralzusammenhänge gelten, so wie dies in Abschnitt 2.1.8 auf Seite 14 dargestellt wurde. Die
Geschwindigkeitsfunktion v(t) ergibt sich als Integral über die Beschleunigungsfunktion a(t) und die
Ortsfunktion x(t) ist gleich dem Integral über die Geschwindigkeitsfunktion v(t):
v(t2 ) = v(t1 ) +
Z
|
t2
t1
a(t) dt
{z }
und
x(t2 ) = x(t1 ) +
Z
|
=∆v
t2
t1
v(t) dt
{z }
(24)
=∆x
Die Integrale stehen für die Veränderungen ∆v und ∆x von Geschwindigkeit und Ort während der
Zeitspanne ∆t von t1 bis t2 .
Wir wollen die beiden Gleichungen (24) noch ein wenig anders schreiben, nämlich so, wie wir
Sie bereits aus der ersten Klasse kennen und wie wir sie ab und zu auch brauchen werden:
• Wir sind frei in der Wahl des zeitlichen Nullpunktes. Daher setzen wir t1 = 0: “Die Zeitmessung
soll zu Beginn des Bewegungsvorganges starten.” Für v(t1 ) und x(t1 ) schreiben wir v0 und
x0 zur Kennzeichnung der Geschwindigkeit und des Ort zum Zeitpunkt t = 0. Auch v0 und
x0 dürfen wir frei wählen, denn für die Wahl des örtlichen Nullpunktes und für die Wahl
einer gleichförmige Bewegung des Bezugssystems gibt es in der Newton’schen Mechanik keine
Einschränkungen.
• Uns interessiert die Entwicklung bis zu einem Zeitpunkt t. D.h., wir setzen t2 = t.
• Und schliesslich wollen wir wissen, bis zu welchem Ort der Körper bis zum Zeitpunkt t gekommen ist. x2 ersetzen wir also durch die Ortsfunktion x(t).
Mit diesen Ersetzungen wird aus den Gleichungen (24) neu:
v(t) = v0 +
Z
t
a(τ ) dτ
und
0
x(t) = x0 +
Z
t
v(τ ) dτ
(25)
0
Zur Notation: Da die Zeitvariable t in (25) als obere Grenze für das Integral verstanden werden
soll, schreiben wir für die Zeit unter dem Integral neu τ (kleines gr. tau). Dieses τ durchläuft
unter dem Integral alle Zeitpunkte von 0 bis t.
Flächen unter dem Funktionsgraphen: Wir haben gerade festgestellt, dass die Momentangeschwindigkeit v(t) durch das Integral über die aktuelle Beschleunigung a(t) gegeben ist. Ebenso
entspricht der aktuelle Ort x(t) dem Integral über die Momentangeschwindigkeit v(t).
In einem Koordinatensystem steht das Integral für die Summe über die positiven und negativen Flächen zwischen Funktionsgraph und horizontaler Achse. Damit verstehen wir auch die
folgenden beiden Zusammenhänge, die wir bereits in der 1. Klasse formuliert hatten:24
• Die zurückgelegte Strecke ∆x ist im t-v-Diagramm sichtbar als Fläche zwischen dem
Graphen von v(t) und der t-Achse.
• Die Geschwindigkeitsveränderung ∆v ist im t-a-Diagramm sichtbar als Fläche zwischen dem Graphen von a(t) und der t-Achse.
24
Vgl. Gertsch 2013, S. 10f [3].
36
Beispiel: Die gleichmässig beschleunigte Bewegung
Aus (25) erhalten wir bei bekannter Geschwindigkeitsentwicklung v(t) die Ortsfunktion x(t).
Betrachten wir zur Veranschaulichung nochmals die gleichmässig beschleunigte Bewegung mit
Anfangsgeschwindigkeit – in der 1. Klasse abgekürzt durch “gmbBmA”.
“Gleichmässig” bedeutet, dass die Beschleunigung während des Vorgangs konstant bleiben
soll: a(t) = a = const.. Hieraus ergibt sich mit (25) für die Geschwindigkeitsfunktion:
v(t) = v0 +
Z
t
a(τ ) dτ = v0 +
Z
0
0
t
t
a dτ = v0 + [aτ ] = v0 + at
0
(26)
Sobald wir dieses v(t) kennen, können wir auch die Ortsfunktion angeben:
x(t) = x0 +
Z
t
v(τ ) dτ = x0 +
0
Z
t
0
a
v0 + aτ dτ = . . . = x0 + v0 t + t2
2
(27)
Die längst bekannten Bewegungsgleichungen x(t) = x0 + v0 t + a2 t2 und v(t) = v0 + at für
die gleichmässig beschleunigte Bewegung mit Anfangsgeschwindigkeit sind also einfach die
mathematisch logische Konsequenz der als konstant angenommenen Beschleunigung!
Dieses Ergebnis hatten wir schon auf Seite 30 als Lösung der DGL x′′ (t) = a = const. mit RBs
x(0) = x0 und x′ (0) = v0 erhalten. Damals hatten wir ebenfalls doppelt integriert, einfach mit
unbestimmten Integralen. Den physikalischen Hintergrund hatte ich jedoch nicht erläutert.
Aber woher kommt diese DGL x′′ (t) = a = const.? Rein kinematisch betrachtet ist die Sache
klar: Wenn wir von einer konstanten Beschleunigung a ausgehen, dann ergeben sich die Ortsund die Geschwindigkeitsfunktion einfach so, wie wir es in den Gleichungen (27) und (26)
gefunden haben.
Vielleicht sollte ich die Frage anders formulieren: Unter welchen physikalischen Umständen
ist denn die Beschleunigung a überhaupt konstant? Welche Bedingungen führen auf die DGL
x′′ (t) = a = const. für die Ortsfunktion x(t)?
Die Antwort auf diese Frage muss das Resultat einer physikalischen Theorie sein, die Aussagen
dazu macht, unter welchen Rahmenbedingungen Bewegungen so oder so ablaufen. Genau dies
ist die Klassische Mechanik, und wir werden gleich sehen, dass es eben das 2. Newton’sche
Axiom, also das Aktionsprinzip ist, aus dem entsprechende DGLs für die Ortsfunktion x(t)
hervorgehen. . .
37
4.3
Das 2. Newton’sche Axiom als Differenzialgleichung
In der 1. Klasse hatten wir das Aktionsprinzip (2. Newton’sches Axiom) kennengelernt. Es besagt,
dass die Beschleunigung a, die ein Körper erfährt, von der Kraft F abhängt, die auf ihn wirkt:25
F
(28)
m
Dabei steht die Masse m für die Trägheit des Körpers. Je grösser sie ist, umso kleiner wird die
Beschleunigung a bei vorgegebener Kraft F .
Die Ursache der Kraft F ist in der momentanen Situation (zum Zeitpunkt t) zu suchen. Sie
muss daher als Funktion des Ortes x(t), der Geschwindigkeit v(t) = x′ (t) und der Zeit t aufgefasst
werden:
F = F x(t), v(t), t = F x(t), x′ (t), t
(29)
F =m·a
resp.
a=
Eine solche Gleichung, die eine Kraft als Funktion der “aktuellen Umstände” beschreibt, nennt man
ein Kraftgesetz. Um richtig gut zu verstehen, was damit gemeint ist, folgen weiter unten ein paar
Beispiele von Situationen, bei denen Ihnen die Kraftgesetze zumindest teilweise bereits bekannt sind.
Gemäss (22) ist die Beschleunigung a(t) die zweite Ableitung x′′ (t) der Ortsfunktion x(t). Damit
notieren wir das 2. Newton’sche Axiom (28) nun in neuer Form:
Differenzielle Formulierung des 2. Newton’schen Axioms
(Aktionsprinzip) für geradlinige Bewegungen
Erfährt ein Körper die vom Ort x, der Geschwindigkeit x′ und der Zeit t
abhängige Kraft F (x, x′ , t), so erfüllt seine Ortsfunktion x(t) die DGL:
F (x, x′ , t) = m · x′′
(30)
Dabei ist m die Masse des Körpers.
In (30) und bei einigen nachfolgenden Gleichungen habe ich bei x(t), x′ (t) und x′′ (t) das Argument
(t) zugunsten einer besseren Übersichtlichkeit weggelassen.
Wir bemerken: Das Aktionsprinzip entspricht einer DGL 2. Ordnung für die Ortsfunktion x(t)!
Gesucht ist also eine Funktion x(t), welche diese DGL zu jedem beliebigen Zeitpunkt t
erfüllt. Als DGL 2. Ordnung tauchen bei der Lösung in der Regel zwei freie Parameter auf, die
typischerweise durch die Vorgabe von Rand- resp. Anfangsbedingungen wie dem Startort x0
und der Anfangsgeschwindigkeit v0 festgelegt werden.
Anmerkung: Nach wie vor betrachten wir geradlinige, also von vornherein auf 1 Dimension eingeschränkte Bewegungen. Das Aktionsprinzip (30) gilt aber auch im Dreidimensionalen. Dann
wird der Ort durch den Ortsvektor ~r(t) beschrieben. Kraft, Geschwindigkeit und Beschleunigung sind Vektoren:
~ (~r, ~r ′ , t) = m · ~r ′′
3D-Aktionsprinzip:
F
Natürlich müssten wir nun erläutern, wie die Ableitung eines Vektors zu bilden ist, was also
unter ~r ′ und ~r ′′ genau zu verstehen ist. Das lassen wir im Moment allerdings beiseite, weil
wir nicht unmittelbar damit arbeiten werden. Es genügt zu wissen, dass es diese Vektoren gibt
und dass sie wohldefiniert sind.
25
An dieser Stelle hatten wir in der 1. Klasse stets von der resultierenden Kraft Fres gesprochen. Im Prinzip gilt
(28) aber bereits für jede einzelne auf den Körper wirkende Kraft F . Jede solche Kraft erzeugt eine Beschleunigung
a. Und ob wir nun zuerst Kräfte zur resultierenden Kraft oder erst anschliessend die daraus hervorgehenden Beschleunigungen aufaddieren, spielt keine Rolle. Das Entscheidende ist, dass diese Addition – egal ob von Kräften oder von
Beschleunigungen – vektoriell erfolgt (vgl. Vektorgeometrie: “Vektoraddition = Pfeile aneinanderhängen”). Dies wird
häufig als 4. Newton’sches Axiom, Überlagerungs- oder Superpositionsprinzip bezeichnet.
38
4.4
4.4.1
Beispiele zu Kraftgesetzen und daraus folgenden DGLs für x(t)
Freier Fall an der Erdoberfläche
Wir betrachten ein Objekt in der Luft an der Erdoberfläche. Solange dabei Luftwiderstand und
Auftrieb vernachlässigbar klein sind, ist die Gewichtskraft FG die einzige Kraft, die auf den Körper
wirkt. Wir bezeichnen diese Situation als freien Fall.
Wir reduzieren unsere Betrachtung auf eine einzige Dimension, nämlich auf Bewegungen längs
einer vertikalen Ortsache (→ senkrechter Wurf). Deren positive Richtung zeige nach oben, sodass
im Kraftgesetz für die Gewichtskraft ein negatives Vorzeichen auftritt:
FG = −mg
N
der altbekannte Ortsfaktor. Das Aktionsprinzip resp. die DGL für ein frei
Darin ist g = 9.81 kg
fallendes Objekt lautet somit:
F = −mg = mx′′
resp.
x′′ = −g = const.
(31)
Der freie Fall ist ein Beispiel für eine konstante (resultierende) Kraft F . Das Kraftgesetz hängt weder
vom Ort x, noch von der Geschwindigkeit x′ , noch von der Zeit t ab. Wir betrachten also gerade
den einfachst möglichen Fall einer beschleunigten Bewegung.
Sobald die Kraft F gleich bleibt, haben wir es mit einer konstanten Beschleunigung zu tun.26
In der 1. Klasse hatten wir unsere Betrachtungen praktisch vollständig auf solche Situationen eingeschränkt, weil dabei stets gleichmässig beschleunigte Vorgänge herauskamen – und die konnten wir
eben mit den Gleichungen zur gleichmässig beschleunigten Bewegung (gmbB) behandeln.
Die zu (31) gehörige Lösung haben wir schon mehrfach gesehen (siehe insbesondere Seiten 30
und 37). Mit RBs x(0) = x0 und x′ (0) = v0 lautet sie:
x(t) = x0 + v0 t −
4.4.2
g 2
t
2
und
v(t) = x′ (t) = v0 − gt
Fallen mit Luftwiderstand
Ergänzen wir nun den freien Fall durch einen Luftwiderstand FL . Dieser ist typischerweise proportional zum Quadrat der Geschwindigkeit v 2 = (x′ )2 . Ausserdem ist er der aktuellen Bewegung
entgegengerichtet. Das lässt sich folgendermassen formulieren:
FL = −c · (x′ )2 ·
c · (x′ )3
x′
=−
′
|x |
|x′ |
′
′
Dabei ermittelt der Bruch |xx′ | das Vorzeichen der Geschwindigkeit27 und − |xx′ | kehrt dieses Vorzeichen um, sodass der Luftwiderstand eben stets entgegen der aktuellen Bewegungsrichtung wirkt.
Der Betrag des Luftwiderstandes ist durch c · (x′ )2 gegeben. c steht für eine Konstante, die
verschiedene Informationen enthält, wie z.B. die Luftdichte, den Strömungswiderstand des Gegenstandes28 oder die Angriffsfläche, mit der er gegen die Bewegungsrichtung ausgerichtet ist.
Alles zusammen ergibt sich so für das 2. Newton’sche Axiom als DGL:
mx′′ = FG + FL = −mg −
c · (x′ )3
|x′ |
26
resp.
x′′ = −g −
c · (x′ )3
m · |x′ |
(32)
Soviel zur Frage am Ende von Abschnitt 4.2 auf Seite 36.
a
a
Probieren Sie es aus! Für eine positive Zahl a > 0 ist |a|
= +1, für eine negative Zahl a < 0 ist |a|
= −1.
28
Dieser Strömungswiderstand hat mit der Form des Gegenstandes und seiner Oberflächenbeschaffenheit zu tun.
Ausserdem kommt es darauf an, mit welcher Ausrichtung der Gegenstand durch die Luft fliegt – ein quer zur Flugrichtung stehendes Flugzeug wäre aerodynamisch sicher sehr ungeeignet. . .
27
39
Der Körper sei in Abwärtsrichtung unterwegs. Dann ist x′ < 0 und (32) vereinfacht sich zu:
x′′ = −g +
c · (x′ )2
m
resp.
x′′ −
c ′ 2
(x ) = −g
m
(33)
Für diese inhomogene und nicht-lineare DGL 2. Ordnung gibt es in aller Allgemeinheit keine geschlossene Lösung. In einer Übung werden Sie einen Spezialfall davon untersuchen können.29
Eines ist allerdings klar: Es gibt einen stabilen Endzustand, in dem der Körper nicht mehr beschleunigt. Ist nämlich x′′ = 0, so gilt:
r
mg
c ′ 2
′
′′
(x ) = g resp. x = −
x =0
⇒
m
c
Diesen Grenzfall kennt man z.B. vom Fallen aus einem Flugzeug. Behält ein Mensch seine Flugposition bei, so wird er in etwa eine Grenzgeschwindigkeit von x′ ≈ −200 km
h erreichen. Dann ist FL
gleich gross wie die FG und es findet keine weitere Beschleunigung mehr statt (x′′ = 0).
4.4.3
Der klassische, ungedämpfte harmonische Oszillator
An eine (selber masselose) Spiralfeder hängen wir eine Kugel mit Masse m. Der Ort x dieses
Federpendels sei gegeben durch den Verbindungspunkt zwischen Spiralfeder und Kugel. In Abb. 19
sehen Sie links zunächst die Spiralfeder ohne angehängte Kugel. Dies ist die entspannte Lage des
Pendels. Wir bezeichnen den zugehörigen Ort mit xe .
Bei angehängter Kugel gibt es eine Ruhelage, also ein Höhe, auf der das Pendel ruhig hängen
bleiben kann. Da wir in der Wahl des Nullpunktes unserer vertikalen x-Achse prinzipiell frei sind,
dürfen wir festlegen, dass x = 0 der Ruhelage entspricht. Diese Wahl ist überhaupt nicht zwingend,
wird sich aber rechnerisch als sehr praktisch erweisen.30
Abbildung 19: Situationen beim Federpendel: entspannte Lage, Ruhelage und eine beliebige Lage.
c
(x′ )2 = 0. Ein Körper hat
Dabei geht es um die schwerelose Situation (g = 0), also um die homogene DGL x′′ − m
′
eine Anfangsgeschwindigkeit x (0) = v0 , mit der er in ein Gas eintaucht. Die Endgeschwindigkeit wird dann v∞ = 0
sein. Wie aber sieht die Geschwindigkeitsentwicklung bis dahin aus?
30
Das wird Sie nicht überraschen, denn Sie wissen ja bereits, dass ein Pendel um seine Ruhelage schwingt. D.h.,
diese Lage ist ein Symmetriepunkt der Bewegung. Lernen Sie einmal mehr: Wenn man Symmetrien ausnutzen kann,
sollte man das auch tun, denn dadurch vereinfacht sich die Mathematik in der Regel drastisch. Konkret heisst das: Die
Wahl des Koordinatensystems will stets gut überlegt, also an die Symmetrie des Problems angepasst sein.
29
40
Betrachten wir schliesslich das rauf und runter schwingende Pendel. Zu irgendeinem Zeitpunkt
t befindet es sich am Ort x(t). Genau diese Ortsfunktion suchen wir. Sie wird sich aus einer DGL
ergeben, wie das in der klassischen Mechanik eben sein muss. Die RBs ergeben sich durch die Art, wie
wir die Pendelschwingung gestartet haben. Ich nehme an, wir haben das Pendel aus der Ruhelage um
die Höhe A angehoben und dann losgelassen. Dieser Moment des Loslassens definiert den Zeitpunkt
t = 0, für den offenbar gilt:
RBs:
x(0) = A
und
x′ (0) = 0
Nun betrachten wir die Kräfte, die auf das Pendel wirken:
• Wir wollen von einer ungedämpften Schwingung ausgehen. D.h., wir tun so, als gäbe es
keinerlei Luftwiderstand oder sonstige Reibungseffekt, sodass das Pendel im Prinzip unendlich
lange weiterschwingen würde.
• Die Gewichtskraft FG zieht die Kugel nach unten. Sie ist konstant und gegeben durch:
FG = −mg
(34)
• Die Federkraft FF zieht die Kugel nach oben. Sie verändert sich ständig, weil sie in jedem
Moment davon abhängt, an welchem Ort x sich das Pendel gerade befindet. Das Kraftgesetz
für solche Spiralfedern und viele andere elastische Gegenstände lautet:31
Das Hooke’sche Federgesetz
Die Federkraft FF ist proportional zur Dehnung s (= Verlängerung oder
Auslenkung) der Feder aus ihrer entspannten Lage:
FF = Ds
(35)
Dabei steht D für die Federkonstante, ein Wert, der die Stärke oder Härte
N
angegeben wird.
einer Feder beschreibt und in der Einheit m
Zur Verdeutlichung: Jede Spiralfeder besitzt ihre eigene Federkonstante D in “Newton pro
N
). Die Federkonstante D beantwortet also die Frage, wie viele Newton Kraft
Meter” (= m
es bräuchte, um die Spiralfeder um einen ganzen Meter zu dehnen.32
Wegen der Proportionalität von Dehnung s und Federkraft FF sind die Skalen auf Federwaagen schön regelmässig – wie praktisch! Nun geht es uns aber um eine andere
Konsequenz des Federgesetzes resp. dieser Proportionalität, nämlich um die reine Sinusresp. Cosinusschwingung eines Federpendels. Diesen Bewegungstyp beobachten wir bei
allen schwingenden Systemen, bei denen die rücktreibende Kraft proportional zur Auslenkung ist!33
Bei unserer Feder ist die Dehnung s die Distanz zwischen der entspannten Lage xe und der weiter
unten liegenden aktuellen Lage x:
s(x) = xe − x
Somit gilt für die nach oben am Pendel ziehende Federkraft FF am Ort x:
FF (x) = Ds(x) = D xe − x
31
(36)
Robert Hooke (1635 – 1703), ein englischer Universalgelehrter und Zeitgenosse Newtons, wenn auch nicht gerade
sein bester Freund. . . Er untersuchte mitunter die Elastizitätseigenschaften verschiedener Materialien.
32
Natürlich wären die meisten unserer kleinen, alltäglichen Spiralfedern längst überdehnt (und damit kaputt), wenn
man sie tatsächlich um einen ganzen Meter verlängern würde. . .
33
Z.B. ist dies auch beim durch die Erde fallenden Stein in Abb. 21 auf Seite 46 der Fall.
41
Mit (34) und (36) haben wir nun alles beisammen, um die DGL für das Federpendel aufzustellen.
Aus dem Aktionsprinzip (30) folgt:
FF (x) + FG = D xe − x − mg = mx′′
(37)
Im Prinzip kennen wir mit dem in der Ruhelage ruhenden Pendel bereits eine Lösung der DGL, auch
wenn es sich dabei um den ganz trivialen Fall x(t) = 0 handelt. Aber auch dieser Fall muss durch
die DGL abgedeckt sein. Schauen wir kurz, was wir daraus folgern können!
In der Ruhesituation ist sowohl x = 0, als auch x′′ = 0 und es folgt:
FF (0) + FG = D xe − 0 − mg = 0 ⇒ Dxe = mg
(38)
Das wussten wir ja eigentlich schon seit jeher. In der Ruhesituation herrscht einfach das Kräftegleichgewicht zwischen FF und FG . Mit (38) lässt sich nun aber (37) wesentlich vereinfachen:
!
D xe − x − mg = Dxe − Dx − mg = mg − Dx − mg = −Dx = mx′′
Und schon steht sie da, unsere DGL für das Federpendel:
x′′ = −ω 2 x
mit
ω2 ≡
D
m
(39)
In Worten: “Die zweite Ableitung x′′ (t) welcher Funktion x(t) entspricht bis auf ein Minuszeichen
und einen konstanten Faktor ω 2 wieder der Funktion x(t) selber?”
Diese Frage resp. diese DGL haben wir bereits gelöst. In der DGL (14) auf Seite 28, als wir
DGLs noch ohne physikalischen Kontext betrachtet hatten, lautete die gesuchte Funktion einfach
y(x) statt x(t), zudem habe ich die damalige Konstante k neuerdings in ω (= gr. kleines omega)
umbenannt. Das sind lediglich neue Bezeichnungen, die Sie nicht weiter stören sollten! Machen Sie
sich jeweils klar, welches die Variable ist und wie die Funktion heisst, die davon abhängen soll.
Nutzen wir doch unsere damalige Vorarbeit aus und schreiben direkt die allgemeine Lösung auf
(vgl. (15) auf Seite 29):
x(t) = C1 sin(ωt) + C2 cos(ωt)
Unsere RBs lassen das Pendel zum Zeitpunkt t = 0 auf der Höhe x(0) = A mit Geschwindigkeit
x′ (0) = 0 starten. Daraus folgt für die fertige Lösung:
x(t) = A cos(ωt)
(40)
Diskussion der Lösung
• Feststellung: Das Resultat ist eine mathematisch exakte Sinus- resp. Cosinusschwingung. Das
an sich ist schon sehr bemerkenswert: Aus der Proportionalität des Hooke’schen Federgesetzes
– also aus einem linearen Zusammenhang! – geht die perfekte Cosinuskurve hervor.
• Die anfänglich vorgegebene Starthöhe A bleibt als Amplitude (= Höhe des Pendelausschlags)
in der Schwingung erhalten.
• Der Parameter ω heisst Kreisfrequenz. Er bestimmt, wie rasch die Schwingung abläuft, hängt
also direkt mit der Periode T resp. der Frequenz f der Schwingung zusammen:
ω=
2π
= 2πf
T
Das ermöglicht uns einen richtigen Erkenntnisgewinn zum Federpendel! Wovon hängt denn
die Schwingungsperiode T eines solchen Pendels ab? Antwort:
r
r
m
D
ω
1
2π
= 2π
resp.
f=
=
T =
ω
D
2π
2π m
42
Die Periode T ist proportional zur Wurzel der Pendelmasse m. Je mehr Masse am Pendel hängt,
umso träger ist es und umso länger wird eine ganze Schwingung eben dauern. Umgekehrt
schwingt das Pendel schneller, je härter die Feder, je grösser also die Federkonstante D ist.
Das wollen wir uns nochmals auf der Zunge zergehen lassen: Wir haben nun, ausgehend vom
Aktionsprinzip und dem Hooke’schen Federgesetz, theoretisch hergeleitet, wovon die Schwingungsfrequenz eines Federpendels abhängt – und wovon nicht! Wie viele Leute meinen z.B.,
dass die Pendelfrequenz durch die anfänglich mitgegebene Amplitude mitbestimmt wird. Dem
ist effektiv nicht so. Das Pendel schwingt bei allen Amplituden gleich schnell!
Diese Resultate lassen sich im Experiment übrigens bestens bestätigen. Natürlich kommen ein
paar Nebeneffekte hinzu:
– Die reale Pendelmasse ist etwas grösser als nur die Kugelmasse, denn ein Teil die Federmasse schwingt ja auch mit.
– Es gibt bremsende Effekte, die das Pendel nach und nach zum Stillstand bringen. Dazu
gehören z.B. der Luftwiderstand oder ev. auch die Reibung bei der Aufhängung.34 Ohne
diese bremsenden Effekte sprechen wir von einer ungedämpften Schwingung.
• Für die Geschwindigkeitsfunktion erhalten wir:
v(t) = x′ (t) = −Aω · sin(ωt) = −vmax · sin(ωt) mit
vmax = Aω
Gerne weise ich nochmals auf die Kettenregel hin: − sin(ωt) ist die äussere Ableitung von
cos(ωt). Die innere Ableitung des Cosinusargumentes ωt liefert einen zusätzlichen Faktor ω.
Ohne diesen neuen Faktor ω könnte es sich bei v(t) gar nicht um eine Geschwindigkeitsfunktion handeln: Es muss ja so sein, dass der neue Vorfaktor vmax = Aω einer Geschwindigkeit
entspricht, denn die Sinusfunktion hintendran ist dimensionslos.35 Die Amplitude A steht alleine aber erst für eine Strecke. Es muss also noch durch eine Zeit dividiert werden – und genau
dies passiert durch die Multiplikation mit ω, denn dieses besitzt die physikalische Dimension
1
Zeit . Die Kettenregel sorgt somit für die korrekte physikalische Dimension der Ableitung!
vmax = Aω steht für die maximale Geschwindigkeit, die das Pendel immer dann erreicht, wenn
es die Ruhelage x = 0 passiert.
• Der Vollständigkeit halber überprüfen wir nochmals die Richtigkeit der Lösung, indem wir ein
zweites Mal ableiten:
x′′ (t) = a(t) = v ′ (t) = −Aω 2 · cos(ωt) = −ω 2 x(t)
• Wo hat es uns nun eigentlich geholfen, dass wir x = 0 mit der Ruhelage xR identifiziert haben?
Hätten wir das nicht gemacht, so müsste unsere Lösung lauten:
x(t) = xR + A cos(ωt)
Gleichzeitig wäre die DGL inhomogen statt homogen herausgekommen:
x′′ = −ω 2 (x − xR )
Nun ist bei homogenen DGLs die Lösung in der Regel einfacher zu finden als bei inhomogenen.
Wenn man also durch das Ausnutzen einer Symmetrie das Problem auf eine homogene DGL
reduzieren kann, so ist das doch etwas Begrüssenswertes.
34
35
In den Übungen untersuchen Sie, welche Auswirkungen ein zur Geschwindigkeit proportionaler Bremseffekt hat.
Der Sinus ist schliesslich einfach eine Zahl zwischen −1 und +1.
43
Fassen wir zum Schluss dieses Beispiels nochmals das Wichtigste zusammen:
Der klassische, ungedämpfte harmonische Oszillator
Gehorcht ein Körper ausschliesslich einem Kraftgesetz, das ihn stets in Richtung
einer Ruhelage drückt und bei dem der Kraftbetrag proportional zum aktuellen
Abstand zu dieser Ruhelage ist, so sprechen wir von einem ungedämpften
harmonischen Oszillator.
Legen wir die Ruhelage in den Ursprung (x = 0), so folgt aus dem Aktionsprinzip der klassischen Mechanik die zugehörige DGL für die Ortsfunktion x(t):
x′′ = −ω 2 x
(41)
Die allgemeine Lösung ist eine harmonische Schwingung, beschrieben durch:
x(t) = A1 sin(ωt) + A2 cos(ωt)
(42)
Dabei steht ω für die Kreisfrequenz, die folgendermassen mit Periode T und
Frequenz f der Schwingung zusammenhängt:
ω=
4.4.4
2π
= 2πf
T
Gravitationsgesetz im Eindimensionalen
In Abschnitt 4.4.1 hatten wir den freien Fall eines Objektes an der Erdoberfläche betrachtet. Nun
wollen wir die Erdoberfläche verlassen. Die Gravitation FG sei aber immer noch die einzige auf das
Objekt wirkende Kraft und wir schränken seine Bewegung nach wie vor auf eine einzige Dimension
ein.
Je näher das Objekt an der Erde dran ist, umso grösser ist die Schwerkraft, mit der es von ihr
angezogen wird. Auf einer x-Achse, die gerade durch die Erde hindurchsticht und deren Nullpunkt
im Erdmittelpunkt liegt, ist das Kraftgesetz für die Erdanziehung gegeben durch das Newton’sche
Gravitationsgesetz:
GM mx
GM m x
=−
·
(43)
F (x) = −
2
x
|x|
|x|3
Dabei ist G die universelle Gravitationskonstante, M die Erdmasse und m die Körpermasse.36
x
Der Faktor |x|
sorgt, wie schon beim Luftwiderstand in Abschnitt 4.4.2, für das richtige Vorzeix
chen: Für ein x > 0 auf der positiven Ortsachse ist − |x|
= −1 und die Gewichtskraft zeigt in die
x
negative Richtung. Für ein x < 0 auf der negativen Ortsachse ist − |x|
= +1 und die Gewichtskraft
zeigt in die positive Richtung. Das ist genau richtig so, denn der Erdmittelpunkt soll ja eben bei
x = 0 sitzen.
m
steht für den Betrag der gravitativen Kraft F am Ort x, also für ihre Stärke.
Der Bruch GM
x2
x
Daneben sorgt der Faktor − |x|
für die richtige Richtung von F : Die Kraft F zeigt in die negative
Richtung für alle x > 0 und in die positive Richtung für alle x > 0.
Ganz rechts in (43) steht schliesslich die Zusammenfassung zu einem einzigen Bruch.37
2
G = 6.673 · 10−11 N·m
, M = 5.97 · 1024 kg und R = 6370 km.
kg2
37
Dabei bemerke man, dass für reelle Zahlen x stets gilt: x2 = |x|2 .
36
44
Abbildung 20: Der Verlauf der Gravitation in Abhängigkeit von der Distanz zum Erdmittelpunkt.
Innerhalb der Erde ist das Kraftgesetz proportional zu x, ausserhalb proportional zu x12 . Die Kraftangaben beziehen sich auf einen Körper der Masse 1 kg.
Das Kraftgesetz (43) gilt so allerdings nur für |x| ≥ R (= Erdradius), also für Orte x ausserhalb
der Erde. Dort nimmt die Anziehungskraft proportional zu x12 ab. Im Erdinneren gilt hingegen ein
anderes Gravitationsgesetz:
GM mx
F (x) = −
(44)
R3
Bereits Newton kannte dieses Kraftgesetz im Erdinneren. Man erhält es aus der Annahme, dass die
Erde ein homogener Planet ist, dass also ihre Dichte überall gleich gross ist.
Die Anziehungskraft im Erdinneren ist gemäss (44) proportional zur Distanz zum Erdmittelpunkt.
Im Erdmittelpunkt ist sie gleich Null, denn dort wird man von der Erde von allen Seiten her gravitativ
gleich stark angezogen, sodass sich alle diese Kräfte gegenseitig aufheben.
Abb. 20 zeigt den Verlauf der gravitativen Anziehung innerhalb und ausserhalb der Erde. Zusammengefasst kann man dafür nun auch schreiben:

GM m

für x < −R

x2

GM mx
F (x) =
für − R < x < R
− R3


 − GM m
für x > R
x2
Ausserhalb der Erde lautet nun das 2. Newton’sche Axiom für die Bewegung eines Körpers unter
dem ausschliesslichen Einfluss der Gravitation:
mx′′ = F (x) = −
GM mx
|x|3
Aus Symmetriegründen reicht es den Bereich x ≥ R zu betrachten. Dann ist |x| = x und es kürzt
sich neben m zudem ein x aus der Gleichung, sodass folgt:
x′′ = −
GM
x2
Dies ist eine nicht-lineare DGL 2. Ordnung. Sie muss mitunter beschreiben, wie die Bewegung
eines Körpers verläuft, den wir aus sehr grosser Höhe auf die Erde fallen lassen. Auf eine nähere
Lösungsbetrachtung verzichten wir aber an dieser Stelle.
45
Abbildung 21: Angenommen, wir könnten einen geraden Tunnel vom Nord- zum Südpol der Erde
graben, ihn evakuieren und würden anschliessend auf der einen Seite einen Stein hineinfallen lassen
(RBs: x(0) = R und x′ (0) = 0). Wie würde sich dieser Stein bewegen? Womit wäre die Bewegung
vergleichbar?
Analog führt uns das 2. Newton’sche Axiom innerhalb der Erde auf die DGL:
x′′ = −ω 2 x
mit
ω2 =
GM
R3
Diese DGL und ihre Lösung kennen wir bereits (vgl. Seite 44). Was für eine tolle Antwort folgt
daraus für die in Abb. 21 gezeigte Situation? Die Antwort steht in der Fussnote.38
4.4.5
Beispiel für eine explizit von der Zeit abhängige Kraft
Bei allen bisherigen Beispielen war das Kraftgesetz nur vom Ort x und/oder der Geschwindigkeit x′
des Körpers abhängig: F = F (x, x′ ) – oder die Kraft war konstant. Nun möchten wir auch noch ein
Beispiel untersuchen, bei dem das Kraftgesetz eine explizite Zeitabhängigkeit aufweist.
Zur Verdeutlichung: Bei einer von x oder x′ abhängigen Kraft berechnet sich die Kraft aus der
Angabe des aktuellen Ortes x und der aktuellen Geschwindigkeit x′ des Körpers, und zwar
unabhängig davon, wie sich diese beiden Grössen weiterentwickeln. Natürlich hängen x und x′
selber von der Zeit ab, sie entwickeln sich ja eben. Aber diese indirekte Zeitabhängigkeit ist
nicht gemeint, wenn ein Kraftgesetz explizit von der Zeit t abhängt.
Eine explizite Zeitabhängigkeit bedeutet vielmehr, dass sich die Kraft verändern kann, auch
wenn der Ort x oder die Geschwindigkeit x′ des Körpers gleich bleiben. Im Kraftgesetz muss
der Zeitpunkt t daher als eigenständige Variable auftreten. Damit Sie klar verstehen, was das
heisst, folgt hier ein Beispiel, bei dem das Kraftgesetz ausschliesslich von der Zeit t abhängt:
F = F (t).
38
Klar! Der Stein schwingt zwischen dem Nord- und dem Südpol hin und her, genau so, wie ein Federpendel auf
und ab schwingt (vgl. Kasten auf Seite 44). Konkret würde die Lösung lauten:
x(t) = R · cos(ωt)
In den Übungen können Sie berechnen, wie lange eine Periode dieser “Steinschwingung” dauern würde.
46
Abbildung 22: Einschuss eines Elektrons ins elektrische Wechselfeld eines Plattenkondensators.
Elektron im Plattenkondensator (vgl. Abb. 22): Wir betrachten ein Elektron, das zum Zeitpunkt t = 0 durch ein kleines Löchlein in der linken Platte in den Innenraum eines Plattenkondensators eingeschossen wird. Die linke Platte sitzt am Ort x = 0 und somit ist auch
der Startort des Elektron x(0) = 0. Seine fängliche Geschwindigkeit betrage x′ (0) = v0 . Die
Ladungen der Kondensatorplatten werden andauernd verändert, sodass sich auch das homogene39 elektrische Feld E dazwischen ständig verändert. Es gelte:
E = E(t) = Emax · cos(ωt)
Es handelt sich somit um ein Wechselfeld mit maximaler Feldstärke Emax (= Amplitude)
und Kreisfrequenz ω. Beim Eintritt des Elektrons ins Feld (Zeitpunkt t = 0) zeigt das E-Feld
gerade maximal in die positive Richtung – dafür sorgt die Cosinusfunktion (cos 0 = +1).
Die elektrische Kraft auf das Elektron: In diesem elektischen Feld erfährt das negativ geladene
Elektron (Ladung −e = −1.602·10−19 C) eine elektrische Kraft Fel , die stets entgegengesetzt
zum elektrischen Feld steht:
Fel = Fel (t) = −eE(t) = −eEmax · cos(ωt)
Abgesehen von dieser elektrischen Kraft gibt es keine weiteren Kräfte.40 Fel hängt offensichtlich
nur von der Zeit t ab. Der Ort x und die Geschwindigkeit x′ des Elektrons haben darauf keinen
Einfluss.
Die Aktionsprinzip-DGL: Mit dem 2. Newton’schen Axiom erhalten wir die DGL mit Anfangsbedingungen:
mx′′ = −eEmax · cos(ωt)
mit RBs: x(0) = 0 und
x′ (0) = v0
Zur Lösung stellen wir zuerst ein wenig um und vereinfachen durch das Zusammennehmen
mehrerer Konstanten zu einer einzigen:
eEmax
· cos(ωt) = −α · cos(ωt)
m
Damit ist die Sache übersichtlicher geworden.
x′′ = −
mit
α≡
eEmax
m
39
Homogen bedeutet, das E-Feld ist an allen Orten im Plattenkondensator gleich stark und gleich gerichtet. Homogen
bedeutet hingegen nicht, dass das E-Feld zeitlich konstant ist. Es soll sich ja eben um ein Wechselfeld handeln.
40
Der Innenraum des Plattenkondensators sei evakuiert und im Vergleich zur elektrischen Kraft ist die Gewichtskraft
aufgrund der geringen Elektronenmasse verschwindend klein und somit ohne messbaren Fehler vernachlässigbar.
47
Lösung: Da in x′′ = −α cos(ωt) die Ortsfunktion x und ihre Ableitung x′ rechts gar nicht vorkommen, erhalten wir die Lösung, indem wir zweimal integrieren (vgl. Abschnitt 4.2):41
v(t) = x′ (t) = v0 +
Z
0
t
x′′ (τ ) dτ = v0 − α
Z
t
cos(ωτ ) dτ
(45)
0
R
Doch halt! Diese Integration will wohl überlegt sein. Wir wissen zwar, dass cos x dx =
sin x + C ist, aber wie sieht es aus, wenn im Argument des Cosinus noch ein Vorfaktor ω ∈ R
steht? Das Stichwort lautet Reskalierungs-Trick (vgl. 2.4.3). Damit folgt:
Z t
Z
α ωt
α
cos(ωτ ) dτ = v0 −
v(t) = v0 − α
(46)
cos y dy = v0 − sin(ωt)
ω 0
ω
0
Nun integrieren wir noch ein zweites Mal, um x(t) zu erhalten:
Z t
α
v0 − · sin(ωτ ) dτ
v(τ ) dτ = x0 +
x(t) = x0 +
ω
0
0
i
h
α
α
α
t
= x0 + v0 τ + 2 · cos(ωτ ) = x0 + v0 t + 2 · cos(ωt) − 2
ω
ω
ω
0
Z
t
Mit dem Einbau der Ortsrandbedingung x0 = x(0) = 0 folgt schliesslich:
x(t) = v0 t +
α
·
cos(ωt)
−
1
ω2
Das −1 in der Klammer sorgt dafür, dass der Startort auch tatsächlich x(0) = 0 ist, denn
cos 0 = 1.
Das Elektron vollführt nun also eine Bewegung, die aus der Summe einer linearen und einer
Cosinusfunktion besteht. Das ergibt beispielsweise eine Ortsfunktion, wie sie in Abb. 23 gezeigt
wird.
Abbildung 23: Im Prinzip mögliche Ortsfunktion x(t) für das Elektron im Plattenkondensator.
41
Beachten Sie wieder: Die Zeit t der oberen Integrationsgrenze ist der Zeitpunkt, bis zu dem integriert wird. Die
Laufvariable τ unter dem Integral steht für die Zeitpunkte von 0 bis t. Deshalb unterscheiden wir sie vom Endzeitpunkt
t mittels eines griechischen t’s, eben einem tau τ .
48
4.5
4.5.1
Konservative Kräfte, Aktionsprinzip und Energieerhaltung
Das Potenzial V (x, t) – ein allgemeinerer Blick auf die potenzielle Energie
In der 1. Klasse bezog sich der Begriff der potenziellen Energie Epot ausschliesslich auf die Gravitation.42 Dieses Verständnis wollen wir nun etwas erweitern.
Grundsätzlich verstehen wir jede Energie der Lage als eine potenzielle Energie V . Je nachdem,
wo sich der Körper gerade aufhält, besitzt er mehr oder weniger potenzielle Energie: V = V (x).
Diese Energiefunktion V (x) wird oft einfach als Potenzial bezeichnet.
Die folgenden Gedankengänge sollen aufzeigen, wie wir zu den Gleichungen verschiedener Potenziale V (x) gelangen und weshalb wir dabei zwischen konservativen und dissipativen Kräften
unterscheiden müssen.
“Energieumsatz = Verschiebungsarbeit”: Wird ein Körper entgegengesetzt zu einer Kraft F
bewegt, so muss man dafür Arbeit an ihm verrichten resp. die Energie ∆E aufwenden. Typische
Beispiele sind:
–
–
–
–
–
Anheben eines Buchs gegen die Gewichtskraft FG .
Verschieben eines Schranks gegen die Reibungskraft FR .
Dehnen einer Feder gegen die Federkraft FF .
Bewegung gegen den Luftwiderstand FL .
Verschieben einer el. Ladung gegen die el. Kraft Fel in einem homogenen E-Feld.
Nicht interessieren soll uns, woher oder von wem der für diese Bewegung notwendige Energieumsatz ∆E kommt resp. aufgebracht wird. Der Arbeitsdefinition folgend – “Arbeit ist
Kraft mal Weg” – notieren wir für den Energieumsatz ∆E in differenzieller Form (∆E → dE):
dE = −F (x) · dx
dE ist der infinitesimale Energieumsatz, der aufgewendet werden muss, um den Körper um
das infinitesimale Wegstück dx gegen die Kraft F (x) zu bewegen. F (x) und dx sind
gegeneinander gerichtet, sodass ihr Produkt F (x) dx eine negative Zahl ergibt. Wir möchten
aber, dass der dem Körper zugeführte Energieumsatz positiv herauskommt und fügen deshalb
ein Minuszeichen ein.43
Speicherung des Energieumsatzes und Berechnung des Potenzials V (x): Wie gerade erläutert, muss zur Bewegung des Körpers gegen die Kraft F Verschiebungsarbeit verrichtet werden.
Dieser investierte Energieumsatz ist nicht einfach verpufft, sondern er steckt anschliessend
in einer anderen Energieform. Das Potenzial V (x) eines Körpers am Ort x entspricht dem
Energieumsatz, den wir investieren mussten, um den Körper an diesen Ort zu bringen. Von
wo aus? Von einem frei wählbaren Nullniveau x0 aus, an dem die potenzielle Energie eben
gleich Null sein soll: V (x0 ) = 0.
Zur Berechnung des Potenzials V (x) müssen somit die infinitesimalen Arbeitsbeträge dE über
die Strecke vom Nullniveau x0 bis zum Ort x aufaddiert werden. D.h., es wird integriert:44
Z x
V (x) = ∆E = −
F (ξ) dξ
(47)
x0
42
Gravitative Epot : Je weiter oben ein Körper ist, umso mehr potenzielle Energie hat er, weil der dann weiter fallen
kann, mehr Arbeit verrichten kann, “gefährlicher” ist, . . .
43
~ (~r) · d~r. Es wird also das Skalarprodukt von Kraftvektor
Im Dreidimensionalen müsste man schreiben: dE = −F
~
F (~r) und infinitesimalem Verschiebungsvektor ~r gebildet. Die Aussage bleibt allerdings die gleiche: Dieses Skalarprodukt
~ (~r) und ~r “eher” einander entgegengerichtet sind (Zwischenwinkel ϕ > 90◦ ).
generiert ein negatives Vorzeichen, wenn F
Genau dann soll aber der Energieumsatz positiv sein, und so braucht es wiederum ein Minuszeichen.
44
Für die örtliche Laufvariable unter dem Integral verwenden wir zur Unterscheidung von der oberen Integrationsgrenze x den griechischen Kleinbuchstaben ξ (xi).
49
Abbildung 24: Egal, über welchen Weg man das Potenzial V (~r) vom Nullniveau bei ~r0 aus berechnet,
das Resultat muss dasselbe ergeben, wenn es sich um ein “vernünftiges” Potenzial handeln soll.
Wegunabhängigkeit, konservative und dissipative Kräfte: Die Berechnung von V (x) in (47)
müssen wir durch eine essentielle Forderung ergänzen: Das Resultat muss wegunabhängig
sein! D.h., der Wert resp. die Berechnungsformel für V (x) darf nicht plötzlich anders herauskommen, wenn ich den Körper über einen anderen Pfad oder mit anderer Geschwindigkeit
von x0 nach x bewege. Für jedes x darf es nur einen ganz bestimmten Wert V (x) geben!
Ansonsten wäre der Begriff einer “Energie der Lage” resp. “des Ortes” eher unsinnig.
Im eindimensionalen Fall ist vielleicht noch nicht so klar, wo das Problem liegt. Abb. 24 zeigt
besser, worum es geht: Egal, entlang welchem der drei Wege von Nullniveau ~r0 bis zum Ort ~r
die Arbeit aufsummiert resp. das Potenzial berechnet wird, es muss immer dasselbe, eindeutige
Resultat V (~r) herauskommen. Diese Forderung wird nicht von jedem beliebigen Kraftgesetz
F (x) erfüllt. Nur bestimmte Kraftarten erlauben die Definition eines Potenzials V (x) gemäss
(47). Wir nennen diese Kräfte konservativ, andernfalls sprechen wir von dissipativen Kräften.
Betrachten wir zur Verdeutlichung unsere fünf Beispiele von weiter oben:
– Anheben eines Buchs gegen die Gewichtskraft FG .
Die Gewichtskraft ist das Paradebeispiel einer konservativen Kraft. Die verrichtete Hubarbeit ist anschliessend in Form von potenzieller Energie in der Höhenlage des Gegenstandes
gespeichert. Sie ist komplett wieder abruf- und verfügbar. So haben wir es in der 1. Klasse
gelernt und so soll es weiterhin gelten.45
– Verschieben eines Schranks gegen die Reibungskraft FR .
Wähle ich für die Verschiebung des Schranks nicht den geraden, sondern einen längeren
Weg, so muss mehr Reibungsarbeit verrichtet werden.46 FR ist also dissipativ.
Ein zweiter Punkt ist, dass die Reibungskraft den Energieumsatz in innere Energie umwandelt (Erwärmung an der Reibungsfläche). Diese Energie steht anschliessend gar nicht
mehr zur Verfügung. Sie verteilt sich und kann nicht einfach zurückgewonnen werden.
Keinesfalls verfügt der am Ort x angekommene Schrank über diese Energie. Genau in
diesem Sinn sind alle Arten von Reibungskräften ganz unbedingt dissipative Kräfte!47
45
Lat. conservare = bewahren, erhalten, (retten, schonen).
Auch im eindimensionalen Fall könnte es mir übrigens einfallen, den Schrank vorwärts, dann rückwärts und dann
wieder vorwärts zu bewegen und so einen längeren Verschiebungsweg zu erzeugen.
47
Lat. dissipare = verschwenden, zerstreuen.
46
50
– Dehnen einer Feder gegen die Federkraft FF .
Je nach Dehnung der Feder hat sie mehr oder weniger Federenergie gespeichert. Die
Federkraft ist ein zweites Beispiel einer ganz typischen konservativen Kraft.
– Bewegung gegen den Luftwiderstand FL .
Würde ich den Körper auf demselben Weg sehr langsam verschieben, so würde sich
für den Luftwiderstand ein deutlich anderer Betrag ergeben als bei einer sehr grossen
Geschwindigkeit. V (x) wäre also nicht eindeutig. Neben diesem weiteren Argument ist
der Luftwiderstand ja auch wieder eine Art der Reibung und somit ganz klar dissipativ.
– Verschieben einer el. Ladung gegen die el. Kraft Fel in einem homogenen E-Feld.
Je nach Ort im homogenen E-Feld besitzt eine elektrische Ladung mehr oder weniger
potenzielle elektrische Energie. Auch dies ist ein klassisches Beispiel einer konservativen
Kraft.
Zeitabhängige Potenziale: Schliessliche können Potenziale zeitabhängig sein: V = V (x, t). Die
Berechnung erfolgt dann immer noch nach (47), aber einfach zu einem ganz bestimmten
Zeitpunkt t:
Z
x
V (x, t) = −
F (ξ, t) dξ
(48)
x0
Wir werden aber kaum zeitabhängige Potenziale betrachten.
In (48) wird örtlich über die Kraft F (x, t) integriert, um V (x, t) zu erhalten. Das bedeutet aber
umgekehrt, dass F (x, t) die negative partielle Ableitung des Potenzials V (x, t) nach dem Ort x sein
muss:
∂V (x, t)
F (x, t) = −
∂x
Nur der Klarheit halber schreibe ich die Variablen x und t zur Potenzialfunktion V hinzu. Im Prinzip kann man immer selber entscheiden, ob man das will oder nicht. Hauptsache, es wird genau
verstanden, was gemeint ist resp. man weiss immer, von welchen Variablen eine Funktion abhängt.
Nach dieser Folgerung können wir nun, von der Potenzialseite her kommend, sauberer definieren,
was unter einer konservativen Kraft zu verstehen ist:
Definition konservativer und dissipativer Kräfte
Eine Kraft F (x, t) heisst konservativ, wenn es ein überall auf dem Definitionsbereich nach dem Ort x differenzierbares (= ableitbares) Potenzial
V = V (x, t) gibt, sodass:
F (x, t) = −
∂V
∂x
(49)
Zu einer bestimmten konservativen Kraft F (x, t) existieren mehrere Potenziale, die sich allerdings lediglich durch eine additive Konstante, also durch
eine unterschiedliche Wahl des Nullniveaus unterscheiden.
Nicht-konservative Kräfte nennen wir dissipativ.
51
4.5.2
Beispiele von Potenzialen und zugehörigen konservativen Kräften
Damit Sie sehen, was mit Gleichung (49) effektiv gemeint ist, folgen nun ein paar Potenzial-Beispiele
zu Ihnen bereits bekannten konservativen Kraftgesetzen.
• Potenzial zum konstanten, homogenen Gravitationsfeld (vgl. Abschnitt 4.4.1): Ein
Körper der Masse m besitzt in einem homogenen Gravitationsfeld mit Stärke g auf der Höhe
x – ehemals h – gegenüber dem Nullniveau bei x = 0 die potenzielle gravitative Energie:
V (x) = mgx
⇒
F =−
dV
= −mg = const.
dx
• Gravitationspotenzial eines Himmelkörpers (vgl. Abschnitt 4.4.4): Ein Körper der Masse m besitzt im Gravitationsfeld eines Himmelkörpers der Masse M , der bei x = 0 seinen
Mittelpunkt hat, die potenzielle gravitative Energie:
V (x) = −
GM m
x
⇒
F (x) = −
dV
GM m
=−
dx
x2
Dabei ist G die universelle Gravitationskonstante. Das Nullniveau wurde ins Unendliche gelegt:
limx→∞ V (x) = 0. (Ich habe hier nur den Fall x > 0 betrachtet.)
• Potenzial des harmonischen Oszillators (vgl. Abschnitt 4.4.3): Wird ein Körper durch
eine dem Hooke’schen Federgesetz (35) gehorchenden Kraft zu einer Ruhelage zurückgetrieben
und legen wir das Nullniveau in diese Ruhelage (x = 0), so beträgt die potenzielle elastische
Energie:
Dx2
dV
V (x) =
⇒
F (x) = −
= −Dx
(50)
2
dx
Dabei ist D die Federkonstante des elastischen Gegenstandes.
• Potenzial zum homogenen elektrischen Feld (vgl. Abschnitt 4.4.5): Ein Körper mit
elektrischer Ladung q besitzt in einem homogenen elektrischen Feld mit Stärke E am Ort x
gegenüber dem Nullniveau bei x = 0 die potenzielle elektrische Energie:
V (x, t) = −qEx
⇒
F (t) = −
∂V
= qE
∂x
Potenziale können auch zeitabhängig sein: V (x, t). Nur so entstehen zeitlich nicht konstante,
konservative Kräfte.
Z.B. kann die Feldstärke E zeitlich variieren, wie im Plattenkondensator-Beispiel in Abschnitt
4.4.5 mit E = Emax · cos(ωt). Damit wäre das Potenzial V explizit zeitabhängig: V = V (x, t).
Und für die Kraft ergäbe sich für ein Elektron (q = −e) die in Abschnitt 4.4.5 betrachtete
Zeitabhängigkeit: F = F (t) = −eEmax · cos(ωt).
• Potenzial einer elektrischen Punktladung: Ein Körper mit elektrischer Ladung q besitzt im
elektrischen Feld einer deutlich grösseren Punktladung Q, die bei x = 0 sitzt, die potenzielle
elektrische Energie:
V (x) =
1
Qq
·
4πε0 x
⇒
F (x) = −
dV
1
Qq
=
· 2
dx
4πε0 x
Dabei ist ε0 die elektrische Feldkonstante.48 Auch bei dieser potenziellen Energie wurde das
Nullniveau ins Unendliche gelegt: limx→∞ V (x) = 0.
48
ε0 = 8.854 · 10−12
C2
.
N·m2
52
4.5.3
Energieerhaltung – das Aktionsprinzip mit konservativen Kräften
Wir wollen uns nun einschränken auf Bewegungen, die alleine durch konservative Kräfte gesteuert
werden. Dann können wir im Aktionsprinzip (30) die Kraft F (x, t) durch die negative partielle
Ableitung des zugehörigen Potenzials V (x, t) nach dem Ort x ersetzen und es ergibt sich:
−
d2 x
∂V
=m 2
∂x
dt
(51)
2
Dabei habe ich die Beschleunigung x′′ nun wieder in der differenziellen Schreibweise x′′ (t) = ddt2x
notiert, um klar zu zeigen, dass rechts eine zweifache Ableitung nach der Zeit t und links eine
einfache Ableitung nach dem Ort x steht.
Plötzlich ist die Bewegung eines Körpers, also seine Ortsfunktion x(t) in Verbindung gebracht mit
der vom Ort und der Zeit abhängigen potenziellen Energiefunktion V (x, t). Das ist sehr interessant.
Spüren wir diesem Zusammenhang noch etwas weiter nach, indem wir einen Vorgang betrachten,
bei dem ein Körper – gesteuert durch eine rein konservative Kraft – zum Zeitpunkt t1 bei einem Ort
x1 vorbeikommt und zum Zeitpunkt t2 am Ort x2 . Nun integrieren wir örtlich über beide Seiten des
Aktionsprinzips (51):
Z x2
Z x2
d2 x
∂V
m 2 dx
dx =
(52)
−
dt
x1
x1 ∂x
Auf der linken Seite ergibt sich offensichtlich der Energieunterschied in der potenziellen Energie
zwischen dem Ort x2 und dem Ort x1 :49
Z x2
x2
∂V
dx = −V (x) = − V (x2 ) − V (x1 ) = −∆V
−
x1
x1 ∂x
Und was macht dieser Unterschied in der potenziellen Energie, der passiert, während der Körper von
x1 nach x2 geht? Gleichung (51) besagt, dass eine Beschleunigung entsteht, wenn sich der Wert
der potenziellen Energie verändert. Was bedeutet dies energetisch ausgedrückt? Es muss sich eine
Veränderung der kinetischen Energie ergeben!
Schauen wir mal, was wir mit unserer Integraltechnik rausbekommen. Zunächst substituieren wir
unter Hinzuziehung der Geschwindigkeitsdefinition x durch v:
v=
dx
dt
⇒
Damit und mit der weiteren Substitution dt =
Z
x2
x1
d2 x
m 2 dx =
dt
=
d2 x
d dx
dv
=
=
2
dt
dt dt
dt
dx = v dt und
Z
t2
t1
dv folgt:
dv
m
v dt =
dt
mv22
2
dt
dv
−
mv12
2
Z
v2
v1
mv 2 v2
mv dv =
2
v1
= T2 − T1 = ∆T
2
Dabei sind v1 und v2 die Geschwindigkeiten bei (t1 , x1 ) resp. (t2 , x2 ). T = mv
ist gerade die
2
kinetische Energie, die eine Masse m innehat, wenn sie mit der Geschwindigkeit v unterwegs ist.50
Die rechte Seite von (52) ist damit gleich dem Unterschied der kinetischen Energie ∆T .
Betrachten wir nun die integrierte Form von (51) insgesamt, so folgt schliesslich, dass:
−∆V = ∆T
resp.
49
∆V + ∆T = 0
Der Übersichtlichkeit halber wollen wir von einem zeitunabhängigen Potenzial ausgehen: V = V (x).
In der theoretischen Physik ist es üblich, die kinetische Energie mit dem Symbol T abzukürzen, so wie die potenzielle
Energie mit V abgekürzt wird.
50
53
Was haben wir hier entdeckt? Nichts anderes als die Energieerhaltung! Verändert sich die
potenzielle Energie V eines Körpers, so ändert sich ebenso seine kinetische Energie T . Nimmt V ab
(∆V < 0), so nimmt dafür T um denselben Betrag zu (∆T > 0), und umgekehrt. Die Summe beider
Veränderungen (inkl. Vorzeichen!) ist Null. D.h. die Gesamtenergie E des Körpers bleibt erhalten:
E = V + T = const.
Das ist fantastisch! Damit haben wir tatsächlich einen tiefgründigeren Zusammenhang der klassischen Mechanik entdeckt, der unter Voraussetzung konservativer Kräfte direkt aus dem Aktionsprinzip folgt:
Energieerhaltung in der klassischen Mechanik
Die mechanische Gesamtenergie E eines Körpers bleibt genau dann erhalten, wenn er ausschliesslich unter dem Einfluss konservativer Kräfte steht,
sich also das Kraftgesetz F (x, t) als Ableitung eines Potenzials V (x, t)
schreiben lässt:
E = V + T = const.
⇔
F (x, t) = −
∂V
∂x
(53)
Endlich verstehen wir, weshalb konservative Kräfte so genannt werden.51 Was wird denn durch solche
Kräfte konserviert? Eben die Gesamtenergie E! Konservative Kräfte sind genau diejenigen Kräfte,
unter deren Wirkung die Gesamtenergie eines Körpers (oder eines Systems von Körpern) erhalten
bleibt! Was für ein schönes Resultat!
Im Gegensatz dazu geht durch dissipative52 Kräfte Energie verloren, d.h. sie geht durch Reibung
in innere Energie über und ist somit makroskopisch nicht mehr als potenzielle oder kinetische Energie
vorhanden.
Da es Reibung auf Ebene der kleinsten Teilchen, also in der Quantenwelt gar nicht gibt, haben
wir es dort nur mit konservativen Kräften zu tun.53 Alle Vorgänge resp. Zustände hängen somit von
Potenzialen V (x, t) ab, die charakteristisch für das jeweilige Problem sind. Das Kraftkonzept im
Sinne Newtons wird nicht mehr gebraucht. Natürlich werden wir noch sehen müssen, wie es in der
Quantenmechanik um die Energieerhaltung steht. . .
51
Lat. conservare = bewahren, erhalten, (retten, schonen).
Lat. dissipare = verschwenden, zerstreuen.
53
Es gibt zwar eine Ausnahme zu dieser Regel, aber damit werden wir uns nicht beschäftigen.
52
54
4.6
Repetition/Ergänzung: Der klassische, ungedämpfte harmonische Oszillator
Kehren wir zum Abschluss des Kapitels nochmals zum klassischen harmonischen Oszillator zurück.
Er sei ungedämpft, d.h., die Bewegung laufe reibungsfrei ab. Es gibt also ein Potenzial V (x), dessen
negative Ableitung nach dem Ort das konservative Kraftgesetz F (x) liefert (vgl. Seite 52):
V (x) =
Dx2
2
⇒
F (x) = −
dV
= −Dx
dx
Dabei liegen der örtliche Nullpunkt und das Nullniveau bei der Ruhelage des Oszillators.
Die Lösung der zugehörigen DGL für die Ortsfunktion x(t) mit RBs x(0) = A und x′ (0) = 0
kennen wir auch schon (vgl. Seiten 42ff):
r
D
d2 x
2
= −ω x
⇒
x(t) = A cos(ωt)
mit ω =
2
dt
m
Zur Übersicht nochmals kurz die Bedeutungen der auftauchenden Grössen:
ω = Kreisfrequenz der Schwingung
D = Federkonstante = Stärke der Feder (beim Federpendel)
m = schwingende Masse des Oszillators
A = Amplitude = maximaler Ausschlag des Oszillators aus der Ruhelage
4.6.1
Zwei wichtige Eigenschaften des klassischen harmonischen Oszillators
An dieser Stelle ist es wichtig auf zwei Eigenschaften des klassischen harmonischen Oszillators hinzuweisen, die beim quantenmechanischen harmonischen Oszillator radikal anders aussehen werden!
Diese drastischen Unterschiede gibt es übrigens nicht nur beim harmonischen Oszillator. Vielmehr
sind sie ganz typisch für die Diskrepanz zwischen klassischer Mechanik und Quantenmechanik. Der
harmonische Oszillator ist einfach ein besonders schönes und wichtiges Beispiel.
Kontinuierliches Energiespektrum: Das einfachste reale Beispiel des harmonischen Oszillators ist
das Federpendel. Diesem führen wir zu Beginn die Energie E zu, indem wir es von Hand um
A aus der Ruhelage auslenken und anschliessend loslassen. E berechnet sich wegen x′ (0) = 0
resp. T (t = 0) = 0 direkt aus dem Potenzial am Ort x(0) = A:
E = V (A) =
DA2
2
(54)
Im konservativen System bleibt diese anfänglich hinein gegebene Energie erhalten.54 Sie hängt
einzig von der anfänglichen Auslenkung A ab, denn D ist eine vom System vorgegebene
Konstante. Das bedeutet, der klassische harmonische Oszillator lässt prinzipiell beliebige Energiewerte E > 0 zu, weil sich die Anfangsauslenkung A frei wählen lässt. Mit “beliebig” meine
ich, dass es keine unerlaubten Energiewerte gibt.55 Wir sagen:
Das Energiespektrum des klassischen harmonischen Oszillators ist kontinuierlich.
Das scheint im Moment vielleicht trivial, aber punkto Energiespektrum werden wir beim quantenmechanischen harmonischen Oszillator wirklich ein fundamental anderes Ergebnis erhalten!
54
Klar: Beim realen Federpendel nimmt die Pendelenergie aufgrund geringer Reibungseffekte langsam ab, bis das
Pendel wieder stillsteht. Wir sprechen dann von einem gedämpften harmonischen Oszillator.
55
Natürlich kann ein reales Federpendel aufgrund der begrenzten Dehnbarkeit der Feder nicht beliebig grosse Energien
aufnehmen. Aber wenn Emax die maximal mögliche vom Pendelenergie bezeichnet, so sind zwischen 0 und Emax eben
alle Energiewerte möglich.
55
Klassisch erlaubter/verbotener Bereich: Sobald mit der Anfangsauslenkung A ein bestimmter
Energieinhalt E vorgegeben ist, ist auch klar, an welchen Orten x der harmonische Oszillator
während seiner Bewegung vorbeikommt. Alle Orte |x| ≤ A werden erreicht, sie sind für den
klassischen harmonischen Oszillator erlaubt. Alle Orte |x| > A werden nicht erreicht, sie sind
verboten. Begründung: An einem erlaubten Ort x ist die Energie E grösser oder gleich wie
das dortige Potenzial V (x). An einem Ort x im verbotenen Gebiet wäre E geringer als V (x):
Klassisch erlaubtes Gebiet = Menge aller Orte x mit E ≥ V (x)
Klassisch verbotenes Gebiet = Menge aller Orte x mit E < V (x)
Die potenzielle Energie V (x) kann in der klassischen Mechanik zu keinem Zeitpunkt grösser
sein als die Gesamtenergie E – und so ergeben sich eben erlaubte und verbotene Gebiete. Abb.
25 veranschaulicht den Sachverhalt für den harmonischen Oszillator.
Abbildung 25: Erlaubte und verbotene Gebiete beim klassischen harmonischen Oszillator: Über jedem
Ort x auf der horizontalen Achse ist die jeweilige potenzielle Energie V (x) aufgetragen. Dies ist eine
2
Parabel mit Scheitelpunkt im Ursprung (V (x) = ax2 mit a = mω
2 ). Bei vorgegebener Energie E
sind nur Orte x erlaubt, für die E ≥ V (x) ist, die also im Intervall [−A, A] liegen.
Zusatzbemerkung: Rechts von x = 0 steigt V (x) an. Dort ist also dV
dx > 0. Das bedeutet, V (x)
wird dort grösser, wenn ich mit x in die positive Richtung gehe.
Allgemein: Das Vorzeichen einer Ableitung f ′ (x) gibt stets die Richtung an, in die man von der
Stelle x aus zu gehen hat, damit f (x) grösser wird. Das ist eine Art neues Ableitungsverständnis!
Eine konservative Kraft F = − dV
dx zeigt somit stets in die x-Richtung, in die das Potenzial V (x)
kleiner wird ⇒ Konservative Kräfte “möchten” die potenzielle Energie verkleinern.
Ganz zum Schluss wollen wir das Potenzial des klassischen harmonischen Oszillators noch etwas anders aufschreiben, nämlich so, wie wir es später beim quantenmechanischen harmonischen Oszillator
wieder notieren werden. Mit D = mω 2 folgt aus (50):
mω 2 x2
Dx2
=
(55)
2
2
Das Gute an dieser Schreibweise ist, dass man ohne Federkonstante D auskommt. Stattdessen
fliessen die Masse m und die Kreisfrequenz ω als Konstanten ins Potenzial V (x) mit ein.56
V (x) =
56
Zur Erinnerung: In der Kreisfrequenz ω stecken Frequenz f und Periode T , denn es gilt stets: ω = 2πf =
56
2π
.
T
5
Komplexe Zahlen C
Die sogenannten komplexen Zahlen C sind eine Erweiterung die reellen Zahlen R zu einer zweidimensionalen Zahlenmenge. Die entscheidende Idee hinter dem Wort Erweiterung ist, dass zwar
der Zahlenraum grösser gemacht wird, dass dabei aber die Rechenregeln für den Umgang mit den
Zahlen genau gleich bleiben sollen! Umgekehrt lassen sich die reellen Zahlen R als Einschränkung
der komplexen Zahlen C auf eine einzige Dimension auffassen, wobei ebenfalls die Rechenregeln
erhalten bleiben.
Was mit dieser zweidimensionalen Zahlenmenge und diesen Rechenregeln genau gemeint ist,
werden Sie in Kürze erfahren. Entscheidend ist, dass sich mit den komplexen Zahlen viele Problemstellungen und Rechnungen sehr elegant formulieren und lösen lassen. In der Mathematik erlauben sie
in vielen Fällen eine einheitlichere Darstellung und führen oftmals zu vollständigeren Lösungsmengen,
über die sich dann auch “schönere” Aussagen machen lassen als in der bisherigen Einschränkung
auf reelle Zahlen.
Für uns am wichtigsten ist aber dies: Die Mathematik der Quantenmechanik wäre um ein Vielfaches mühsamer und unübersichtlicher, wenn wir uns dafür nicht der komplexen Zahlen bedienen
würden. Im Prinzip liesse sich zwar alles mit reellen Zahlen handhaben – denn die von der Quantenmechanik vorausgesagten Messwerte sind, wie alle physikalischen Messgrössen, eben reell – die
daraus hervorgehenden Gleichungen wären aber derart umständlich, dass wir uns darin nur mit einem
sehr grossen Mehraufwand zurechtfinden würden. Durch Verwendung der komplexen Zahlen gewinnt
die Quantenmechanik ganz wesentlich an Überichtlichkeit und Verständlichkeit. Das wollen auch wir
uns nicht entgehen lassen. . .
5.1
Althergebrachte Zahlenmengen
Zahlen begleiten Sie schon seit jeher durchs Leben. Vermutlich wurde aber – auch in der Mathematik
– eher selten über Zahlenmengen nachgedacht. Vielleicht auch deshalb, weil dies für das elementare
Rechnen halt gar nicht notwendig ist. Je weiter man hingegen in die höhere Mathematik vordringt,
umso wichtiger ist es, sich Gedanken über diesen wichtigen Baustein der Mathematik zu machen,
quasi mit dem Gedanken im Hinterkopf: “Sollten wir bei unserem Zahlenfundament etwas falsch
verstanden haben und von falschen Annahmen ausgehen, so würde das schwerwiegende Fehler in
aller weiteren Mathematik nach sich ziehen.” Also wollen wir versuchen uns etwas mehr Sicherheit
zu verschaffen und uns hier kurz einige Gedanken zu den wichtigsten Zahlenmengen und ihren
Eigenschaften machen.
5.1.1
Natürliche Zahlen N und ganze Zahlen Z
Unter den natürlichen Zahlen verstehen wir – banal gesagt – diejenigen Zahlen, mit denen Sie als
Kind zu zählen begonnen haben, also 1, 2, 3, 4, etc. Zu ihrer Beschreibung notieren wir typischerweise
die Menge in aufzählender Form:
N ≡ {1, 2, 3, . . .}
Wollen wir die ominöse “Nichts-Zahl” Null mit dabei haben so schreibt man:
N0 ≡ {0, 1, 2, 3, . . .}
Setzen wir die Einerschritte über Null hinaus ins Negative fort, so erhalten wir die Menge der ganzen
Zahlen Z:
Z ≡ {. . . , −3, −2, −1, 0, 1, 2, 3, . . .}
Bereits N, N0 und Z sind unendlich mächtig, besitzen also unendlich viele Elemente. Aber nur dass
eine Zahlenmenge unendlich viele Zahlen beinhaltet, heisst ja noch lange nicht, dass es eben alle
Zahlen sind. Ganz offensichtlich gibt es zwischen den ganzen Zahlen noch jede Menge Platz. . .
57
5.1.2
Die rationalen Zahlen Q
Zunächst füllen wir die Räume zwischen den ganzen Zahlen, indem wir Verhältnisse oder eben
Brüche dieser ganzen Zahlen bilden. Ratio ist der lateinische Ausdruck für Verhältnis,57 weshalb wir
die neue Zahlenmenge als rationale Zahlen Q bezeichnen. Das “Q” steht für Quotient – nochmals
ein Fachausdruck für einen Bruch. Wir definieren:
nm o
Q=
m
∈
Z,
n
∈
N
(56)
n
Diese beschreibende Form der Menge liest sich wie folgt: “Q ist die Menge aller Zahlen der Form
m geteilt durch n, wobei m eine ganze und n eine natürliche Zahl ist.”
Es ist klar, dass die ganzen Zahlen Z eine echte Teilmenge der rationalen Q sind: Z ⊂ Q, denn
jede ganze Zahl m geteilt durch n = 1 ergibt wieder sich selber.
5.1.3
Irrationale Zahlen I
Spontan könnte man ja meinen, dass Q alle möglichen Zahlen von −∞ bis +∞ abdeckt, aber weit
gefehlt! Auf einem Zahlenstrahl, also auf einer typischen Zahlenachse, wie sie in Abb. 26 gezeigt
wird, existieren Punkte, also Zahlenwerte, die durch keine rationale Zahl beschrieben werden. Solche
Zahlen nennen wir irrational (Menge I). Tatsächlich gibt es jede Menge solcher irrationaler Zahlen.
Sie kommen keineswegs weniger häufig als die rationalen Zahlen vor.
In der Dezimalbruch-Schreibweise ist der Unterschied zwischen rationalen und irrationalen einfach zu benennen: Bei einer rationalen Zahl bricht der Dezimalbruch entweder irgendwo ab (nach
irgendeiner Anzahl Stellen folgen nur noch Nullen) oder er wird periodisch (eine bestimmte Abfolge von Ziffern wiederholt sich unendlich oft), bei einer irrationalen Zahl hingegen gibt es keinerlei
Periodizitäten, d.h., im Dezimalbruch lassen sich
√ echten Regelmässigkeiten entdecken.
√ keine
Zu den berühmtesten irrationalen gehören 2, 3, e und π. Es schadet nichts, sich ihre auf drei
Nachkommastellen gerundeten Werte zu merken:
√
√
2 = 1.41421 35623 73095 04880 16887 24209 . . . ⇒
2 ≈ 1.414
Wurzel aus 2:
√
√
Wurzel aus 3:
3 = 1.73205 08075 68877 29352 74463 41505 . . . ⇒
3 ≈ 1.732
Kreiszahl:
π = 3.14159 26535 89793 23846 26433 83279 . . .
Euler’sche Zahl:
e = 2.71828 18284 59045 23536 02874 71352 . . .
⇒
⇒
π ≈ 3.142
e ≈ 2.718
In der Geschichte der Mathematik dauerte es recht lange und bedurfte mehrerer Anläufe – von der
Antike bis vor etwa 150 Jahren – bis endgültig Klarheit über die Eigenschaften und die Häufigkeiten
dieser irrationalen Zahlen herrschte. Besonders entscheidend für die Mengenlehre insgesamt waren im
19. Jahrhundert die drei Mathematiker Augustin-Louis Cauchy (1789 – 1857), Karl Weierstrass
(1815 – 1897) und vor allem Georg Cantor (1845 – 1918). Mit dieser Geschichte wollen wir uns
hier aber nicht weiter beschäftigen, auch wenn sie durchaus spannend und erhellend wäre.
Abbildung 26: Die reellen Zahlen auf einem Zahlstrahl (x-Achse). Jedem Punkt auf dem Strahl kann
eine reelle Zahl x zugeordnet werden.
57
Lat. ratio bedeutet aber auch noch Vernunft oder Verstand.
58
5.1.4
Ein vielzitierter Beweis: Die Irrationalität von
√
2
Wenn wir auch nicht allzu auführlich auf die Irrationalität als Zahleneigenschaft eingehen, so sei
an dieser Stelle zumindest ein berühmter Beweis für die Irrationalität der Quadratwurzel aus
2 angeführt. An diesem Beispiel sehen Sie – vielleicht zum ersten Mal – wie sich eine derartige
Eigenschaft überhaupt beweisen lässt. Von ebenso grosser Bedeutung ist das dabei angewendete
Verfahren, nämlich eine indirekte Beweisführung durch Widerspruch: Man geht von einer Annahme aus, die dem Gegenteil der zu beweisenden Behauptung entspricht. Anschliessend zeigt man,
dass diese Annahme auf einen logischen Widerspruch führt. Folglich ist sie falsch und somit das
Gegenteil, also die eigentliche Behauptung zwingend wahr.
Die folgende Einleitung und den Beweis selber habe ich Wikipedia entnommen [5].
Euklid überlieferte einen Beweis dafür, dass die Quadratwurzel von 2 irrational ist. Der zahlentheoretische Beweis Euklids wird indirekt durch Widerspruch geführt und gilt als der erste Widerspruchsbeweis in der Geschichte der Mathematik.
Der unten angeführte Beweis stammt von Euklid aus Buch X der Elemente. Irrationale Grössenverhältnisse waren aber schon dem Pythagoreer Archytas bekannt, der Euklids Satz nachweislich
schon in allgemeinerer Form bewies. (. . . )
Beweisführung
Behauptung: Die Quadratwurzel aus 2 ist eine irrationale Zahl.
Widerspruchsannahme: Die Beweisführung erfolgt indirekt nach der Methode des Widerspruchsbeweises, d.h., es wird gezeigt, dass die Annahme, die Wurzel aus 2 sei eine rationale Zahl, zu
einem Widerspruch führt (lateinisch: reductio ad absurdum).
Es wird also angenommen, dass die Quadratwurzel aus 2 rational ist und sich somit als Bruch
p
q darstellen lässt. Es wird ferner angenommen, dass p und q teilerfremde ganze Zahlen sind,
der Bruch pq also in gekürzter Form vorliegt:
√
2=
p
q
Folgerungen bis zum Widerspruch: Das bedeutet, dass das Quadrat des Bruchs
2
p
=2
oder umgeformt
p2 = 2q 2
q
p
q
gleich 2 ist:
Da 2q 2 eine gerade Zahl ist, ist auch p2 gerade. Daraus folgt, dass auch die Zahl p gerade ist.
Die Zahl p lässt sich also darstellen durch:
p = 2r
wobei r eine ganze Zahl ist. Damit erhält man mit obiger Gleichung:
2q 2 = p2 = (2r)2 = 4r 2
und hieraus nach Division durch 2:
q 2 = 2r 2
Mit der gleichen Argumentation wie zuvor folgt, dass q 2 und damit auch q eine gerade Zahl
ist. Da p und q durch 2 teilbar sind, erhalten wir einen Widerspruch zur Teilerfremdheit.
Logischer Umkehrschluss: Dieser Widerspruch zeigt, dass die Annahme, die Wurzel aus 2 sei eine
rationale
Zahl, falsch ist und daher das Gegenteil gelten muss. Damit ist die Behauptung, dass
√
2 irrational ist, bewiesen.
59
5.1.5
Die reellen Zahlen R
Vereinigen wir die rationalen Zahlen Q mit den irrationalen Zahlen I, so erhalten wir die reellen
Zahlen R. Sie füllen den Zahlenstrahl in Abb. 26 nunmehr lückenlos, was man als Vollständigkeit
der reellen Zahlen bezeichnet. Damit steht uns schliesslich eine Zahlenachse zur Verfügung, wie wir
sie für eindimensionale physikalische Grössen, also Skalare, eben gerne haben möchten.
Die reellen Zahlen R sind die gebräuchliche Zahlenmenge schlechthin. In der Mathematik gehen
Sie in aller Regel stets von dieser Grundmenge aus, wenn nichts anderes gesagt wird. Wichtig
dabei sind aber nicht nur die Zahlen an sich, sondern auch die verlässlichen Eigenschaften dieser
Zahlenmenge, auf die wir uns in aller Mathematik und Naturwissenschaft stets abstützen. Darüber
werden Sie im nächsten Abschnitt mehr erfahren.
Zum Abschluss unserer Betrachtung der bisherigen Zahlenmengen verweise ich auf Abb. 27, wo
die Teilmengenverhältnisse dieser Mengen dargstellt sind. Dort ist zudem bereits angedeutet, dass
die komplexen Zahlen C nochmals eine Erweiterung der reellen Zahlen darstellen, so wie z.B. die
rationalen Zahlen Q eine Erweiterung der ganzen Zahlen Z sind.
Wofür könnten sich diese komplexen Zahlen denn eignen? Offensichtlich gibt es Problemstellungen, für die es innerhalb der reellen Zahlen keine Lösungen gibt. Die einfachste davon lautet:
x2 = −1
Tatsächlich bieten die komplexen Zahlen die vollumfängliche Möglichkeit, solche quadratischen und
Gleichungen höherer Ordnung zu lösen. Aber auch bereits bekannte mathematische Zusammenhänge
lassen sich mit ihnen unter Umständen übersichtlicher darstellen oder einfacher beweisen.
Abbildung 27: Darstellung der Teilmengenbeziehungen zwischen den verschiedenen Zahlenmengen.
Es gilt: N ⊂ Z ⊂ Q ⊂ R ⊂ C, sowie I = R \ Q resp. R = Q ∪ I mit Q ∩ I = {}.
60
5.2
Die reellen Zahlen R als mathematischer Körper
Bis hierhin haben wir bezüglich der althergebrachten Zahlenmengen einfach mal gesagt, welche
Elemente, also Zahlen sie enthalten. Damit ist das Zahlenfundament unserer vertrauenswürdigen
Mathematik aber erst halbwegs beschrieben. Entscheidend sind ebenso die Recheneigenschaften,
auf die wir uns stets verlassen können.
So wissen wir nämlich, dass es sich bei den reellen Zahlen R zusammen mit den beiden Verknüpfungen “+” und “ · ” um einen sogenannten Körper handelt. Was meint man damit genau?
1. Gegeben ist zunächst die Menge der reellen Zahlen R.
2. Auf dieser Menge existieren zwei – uns wohlbekannte – Verknüpfungen mit Namen Addition
“+” und Multiplikation “ · ”. Diese nehmen jeweils zwei Elemente a, b ∈ R und generieren
daraus ein drittes Element a + b ∈ R resp. a · b ∈ R.
3. Nun nennen wir die Menge R zusammen mit den beiden Verknüpfungen Addition “+” und
Multiplikation “ · ” einen Körper, weil die folgenden neun Körperaxiome erfüllt sind.
5.2.1
Die neun Körperaxiome
Eigenschaften der Addition “+”:
1. Assoziativität: Für beliebige a, b, c ∈ R gilt:
a + (b + c) = (a + b) + c
2. Kommutativität: Für beliebige a, b ∈ R gilt:
a+b=b+a
3. Neutrales Element: In R existiert ein bezüglich der Addition
neutrales Element 0 so, dass für ein beliebiges a ∈ R gilt:
a+0=a
4. Inverses Element: Zu jedem a ∈ R existiert ein bezüglich
der Addition inverses Element (−a) ∈ R so, dass gilt:
a + (−a) = 0
Eigenschaften der Multiplikation “ · ”:
5. Assoziativität: Für beliebige a, b, c ∈ R gilt:
a · (b · c) = (a · b) · c
6. Kommutativität: Für beliebige a, b ∈ R gilt:
a·b =b·a
7. Neutrales Element: In R \ {0} existiert ein bezüglich der Multiplikation neutrales Element 1 so, dass für ein beliebiges a ∈ R gilt:
a·1=a
8. Inverses Element: Zu jedem a ∈ R \ {0} existiert ein bezüglich
der Multiplikation inverses Element a−1 ∈ R so, dass gilt:
a · a−1 = 1
Kombinierte Eigenschaft von Addition “+” und Multiplikation “ · ”:
9. Distributivgesetz: Für beliebige a, b, c ∈ R gilt:
a · (b + c) = a · b + a · c
61
5.2.2
Anmerkungen zu Körpern und zu den Körperaxiomen
• Vielfalt mathematischer Körper: Es gibt unzählige Körper im mathematischen Sinne. Es
braucht irgendeine Menge X von Objekten und dazu eben zwei Verknüpfungen “+” und “ · ”,
die auf dieser Menge definiert sind. Sobald nun die beiden Verknüpfungen die Körperaxiome
erfüllen, sagen wir: “X bildet zusammen mit den Verknüpfungen “+” und “ · ” einen Körper.”
Ich habe bei den Körperaxiomen oben also lediglich zugunsten Ihres unmittelbaren Verständnisses die reellen Zahlen R verwendet. Bei dieser Zahlenmenge haben Sie nämlich bereits eine
gute Idee der Zahlen selber, wie auch von Addition und Multiplikation.
Bei der Menge X muss es sich also nicht unbedingt um die reellen Zahlen handeln. Es
muss nicht einmal eine Zahlenmenge sein. Die unterschiedlichsten Objekte können zu Mengen zusammengefasst werden. Denken Sie z.B. an die Menge aller Geraden in einem x-yKoordinatensystem, die Menge aller Vektoren im dreidimensionalen Raum, die Menge aller
Drehungen in der Ebene, die Menge aller Polynome mit Grad 5, etc. An den letzten beiden
Beispielen sehen Sie, dass man sogar Mengen von Abbildungen oder Funktionen definieren
kann – was soll schon dagegen sprechen?
Dem entsprechend muss aber für jede Menge X jeweils neu deklariert werden, was mit den
beiden Verknüpfungen Addition und Multiplikation gemeint sein soll. Und so kommt es eben
auch vor, dass man nicht aus jeder Menge einen Körper machen kann, weil einfach keine
Addition oder keine Multiplikation definiert werden kann, welche die Körperaxiome erfüllt.58
Die Zeichen “+” und “ · ” für Addition und Multiplikation sind übrigens willkürlich. Häufig
werden für diese Verknüpfungen auch ganz andere Symbole verwendet, z.B. ∗, ◦, •, ⋄ oder ×.
• Bisherige Zahlenmengen: Auch die rationalen Zahlen Q bilden – mit derselben Addition und
Multiplikation wie bei R – einen Körper. Das können Sie selber überprüfen, indem Sie sich
Punkt für Punkt von der Richtigkeit der Körperaxiome überzeugen.
Im Gegensatz dazu bilden die ganzen Zahlen Z zusammen mit der bekannten Addition und
Multiplikation keinen Körper. Bei der Addition funktioniert es zwar noch, aber bei der Multiplikation scheitert es an der Existenz des inversen Elementes. Für eine ganze Zahl a liegt
nämlich das inverse Element a−1 = a1 bis auf die Ausnahmen a = ±1 nicht mehr in Z.
• Subtraktion und Division: Vielleicht vermissen Sie innerhalb der Körperaxiome Aussagen
resp. Anforderungen an die Subtraktion “−” und an die Division “ : ”. Diese sind aber überflüssig, weil diese beiden Operationen durch zwei rein symbolische Festlegungen gegeben sind:
a
a − b ≡ a + (−b)
und
a : b = ≡ a · b−1
b
Subtraktion und Division sind also durch Addition und Multiplikation und die zugehörigen
inversen Elemente (−b) und b−1 festgelegt und müssen nicht separat behandelt werden.
• Der Nutzen von Körpern: Was bringt es eigentlich, wenn man von einer Menge und den
beiden darauf definierten Verknüpfungen weiss, dass es sich um einen Körper handelt? Ganz
einfach gesagt verschafft dies die Sicherheit, dass darauf weiterführende Mathematik aufgebaut
werden kann, weil ein Körper eben bestimmte Anforderungen erfüllt. Auf der Existenz von
Addition und Multiplikation inkl. neutraler und inverser Elemente basieren weitere wichtige
Rechenmethoden, wie z.B. die Bildung von Potenzen und deren Gesetze.
58
Nichts hindert uns daran auch gänzlich unmathematische Objekte zu Mengen zusammenzufassen, z.B. die Menge
aller blauen Autos, die Menge aller Schweizerinnen und Schweizer oder die Menge aller Hauptreihensterne, etc. Die
Bedingung für eine Menge ist einfach die Unterscheidbarkeit der einzelnen Elemente.
Natürlich stellt sich dann die Frage, was man unter einer Addition oder einer Multiplikation innerhalb einer solchen
Menge verstehen soll. . . Vermutlich wird sich mit solchen Mengen kein Körper bilden lassen, weil die Körperaxiome
mangels passender Addition und Multiplikation nicht erfüllt werden können.
62
• Erweiterungen von Zahlenmengen: In den nächsten Abschnitten wird es um eine wesentliche Erweiterung unseres bisherigen Zahlenbereichs gehen. Die reellen Zahlen R sollen zu den
komplexen Zahlen C erweitert werden. Betrachten wir an dieser Stelle kurz an einem wohlbekannten Beispiel, was uns eine solche Zahlbereichserweiterung bringen kann und worauf man
dabei achten muss.
Die reellen Zahlen R sind eine Erweiterung der rationalen Zahlen Q. D.h., R enthält zusätzlich
zu Q auch noch die irrationalen Zahlen I und ermöglicht dadurch ein umfangreicheres√Rechnen,
z.B. die Angabe von Lösungen zu einer Gleichung wie x2 = 145, nämlich x = ± 145, was
innerhalb von Q nicht existieren würde.
Gleichzeitig sind aber alle Lösungen von Gleichungen, die wir in Q erhalten können, auch
innerhalb von R richtig. Auch nach der Erweiterung von Q zu R sind beispielsweise x = ± 32 die
beiden Lösungen der Gleichung x2 − 49 = 0. Sie sind durch diese Erweiterung des Zahlenbereichs
nicht falsch geworden.
Woran liegt das? Weshalb ist diese Erweiterung in diesem Sinne unproblematisch? Der entscheidende Grund dafür ist, dass sowohl Q, wie auch R eben Körper sind, welche unter Verwendung
derselben Addition “+” und Multiplikation “ · ” die Körperaxiome erfüllen. Die neutralen Elemente von “+” und “ · ” bleiben ebenfalls die gleichen und auch die inversen Elemente (−a)
und a−1 jeder rationalen Zahl a sind in R immer noch dieselben.
Natürlich kann es bei einer Zahlenbereichserweiterung vorkommen, dass man Addition oder
Multiplikation selber passend erweitern muss, also für die neu dazukommenden Zahlen entsprechende Deklarationen vornehmen muss. Denken Sie z.B. wiederum an die Erweiterung von
Q auf R. Dabei muss man beispielsweise
das Vorgehen bei der Multiplikation von Wurzeln
√
√ √
festlegen, nämlich dass a · b = a · b sein soll.
• Blicken wir voraus auf die im nächsten Abschnitt erfolgende Einführung der komplexen Zahlen
C, so verstehen Sie nun, worauf wir unser Augenmerk zu richten haben, damit keine Widersprüche zu allen bisher gültigen Aussagen in R entstehen:
– Auch die komplexen Zahlen C sollen einen Körper bilden. D.h., auf C muss eine erweiterte Addition und eine erweiterte Multiplikation so definiert sein, dass die Körperaxiome
erüllt sind. Insbesondere müssen diese beiden Verknüpfungen assoziativ, wie auch kommutativ sein und zudem das Distributivgesetz erfüllen.
– Diese erweiterte Addition und Multiplikation müssen, eingeschränkt auf Zahlen a, b ∈ R,
immer noch dieselben Resultate liefern.
– Die neutralen Elemente 0 und 1 müssen bei der Erweiterung demnach gleich bleiben.
– Auch die inversen Elemente (−a) und a−1 müssen für jedes a ∈ R bei der Erweiterung
unverändert bleiben.
Und nun kommt sie also, die Einführung der komplexen Zahlen C, die die bisherigen reellen
Zahlen R umfassen und uns gleichzeitig weitreichende mathematischen Möglichkeiten geben soll,
wie z.B. die Lösung der Gleichung x2 = −1.
Es ist einleuchtend, dass es sich bei C um eine mehrdimensionale Zahlenmenge handeln muss,
denn die eine Dimension, die der Zahlenstrahl in Abb. 26 darstellt, ist durch die reellen Zahlen
bereits vollständig, also lückenlos abgedeckt. “Wo” die neuen Zahlen liegen, davon werden wir sehr
rasch eine praktische Vorstellung haben. Bei den komplexen Zahlen handelt es sich nämlich um
eine zweidimensionale Zahlenmenge, und so muss jede Zahl z ∈ C einem Punkt in einer Ebene
entsprechen.
Aber genug der Vorankündigungen! Jetzt machen wir diesen Schritt.
63
5.3
5.3.1
Die Menge der komplexen Zahlen C
Definition der komplexen Zahlen und Gauss’sche Zahlenebene
Die Ausführungen in diesem und dem nächsten Unterabschnitt folgen der Einführung der komplexen
Zahlen im Buch Rechenmethoden für Studierende der Physik im ersten Jahr [2] von Markus Otto.
Die komplexen Zahlen C stellen eine Erweiterung der reellen Zahlen R dar. Besagte Erweiterung
ist dabei durch die Einführung einer Grösse i gegeben, für die per Definition gilt:
i2 ≡ −1
Dieses i bezeichnet man als die imaginäre Einheit.59 Hierdurch werden im Reellen nicht lösbare
Gleichungen wie z.B. x2 = −1 plötzlich lösbar: x = i oder x = −i.
Definition der Menge der komplexen Zahlen
Jede komplexe Zahl z ∈ C lässt sich als Summe aus einem reellen Anteil
x und einem imaginären Anteil iy schreiben:
z =x+i·y
mit Re(z) = x
und
Im(z) = y
(57)
Dabei heisst x ∈ R Realteil (Re) und y ∈ R Imaginärteil (Im) von z.
Die Menge der komplexen Zahlen C definiert sich demnach wie folgt:
C ≡ {z = x + iy | x, y ∈ R}
(58)
“Die Menge der komplexen Zahlen C ist die Menge aller Zahlen z = x + iy,
wobei x und y reelle Zahlen sind.”
√
√
Z.B. ist für z = 3 − i 2 der Realteil Re(z) = 3 und der Imaginärteil Im(z) = − 2.
Eine komplexe Zahl z = x, also mit y = 0, ist reell, eine komplexe Zahl z = iy, also mit x = 0,
heisst rein imaginär.60
Die Darstellung resp. geometrische Interpretation einer komplexen Zahl geschieht in einem zweidimensionalen, kartesischen Koordinatensystem, also in einer x-y-Ebene, die wir als komplexe oder
Gauss’sche Zahlenebene61 bezeichnen, wie Abb. 28 zeigt.
Da die reellen Zahlen R vollständig sind und sich jede komplexe Zahl als Summe z = x + iy
mit x, y ∈ R schreiben lässt, sind auch die komplexen Zahlen C eine vollständige Zahlenmenge.
Anschaulich gibt es in der Gauss’schen Zahlenebene somit keine Lücken, also keinen Punkt, der nicht
durch eine komplexe Zahl z abgedeckt wäre.
5.3.2
Komplexe Konjugation
Das komplex Konjugierte z ∗ einer komplexen Zahl z erhält man, indem man i durch −i ersetzt:
z =x+i·y
→
z∗ = x − i · y
daraus folgt: (z ∗ )∗ = z
Anschaulich entspricht die Konjugations-Operation ∗ in der komplexen Ebene einer Spiegelung des
zu z gehörenden Punktes an der reellen Achse (vgl. Abb. 28).
59
Analog kann die Zahl 1 als reelle Einheit verstanden werden.
Die Anregung zu dieser in [2] vergessen gegangenen Deklaration habe ich dem im Orell Füssli Verlag erschienen
Lehrbuch Algebra 3, Aufgaben, Ergebnisse [6] entnommen.
61
Ein Miterfinder dieser Darstellung war der berühmte deutsche Mathematiker Carl Friedrich Gauss (1777 – 1855).
60
64
Abbildung 28: Die Gauss’sche Zahlenebene: Jeder Punkt (x, y) entspricht einer komplexen Zahl
z = x+iy. Auf der horizontalen Achse sitzen die reellen, auf der vertikalen Achse die rein imaginären
Zahlen. Durch Spiegelung von z an der x-Achse erhält man die komjugiert komplexe Zahl z ∗ = x−iy.
5.4
Rechenregeln – die komplexen Zahlen C als Zahlenkörper
Nun kommt der spannende Punkt der Erweiterung von R auf C. Wir erinnern uns an die auf Seite
63 deklarierten Anforderungen: Damit es keine Komplikationen mit den in C enthaltenen reellen
Zahlen R gibt, müssen Addition und Multiplikation auf C so definiert werden, dass damit erstens
die Körperaxiome (vgl. 5.2.1) erfüllt werden, zweitens sollen Rechnungen mit reellen Zahlen immer
noch dieselben Resultate ergeben. Letzteres schliesst mit ein, dass auch die neutralen Elemente 0
und 1 gleich bleiben und die inversen Elemente (−a) und a−1 für reelle Zahlen unverändert bleiben.
Definition von Addition und Multiplikation auf C
x1 , x2 ∈ R seien die Real- und y1 , y2 ∈ R die Imaginärteile zweier beliebiger
komplexer Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 .
Dann sind Addition “+” und Multiplikation “ · ” dieser beiden komplexen
Zahlen gegeben durch:
z1 + z2 ≡ (x1 + x2 ) + i(y1 + y2 )
z1 · z2 ≡ (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 )
(59)
Das bedeutet, bei der Addition zweier komplexer Zahlen werden einfach die
Real- und Imaginärteile separat addiert:
Re(z1 + z2 ) = x1 + x2
und
Im(z1 + z2 ) = y1 + y2
Bei der Multiplikation sieht die Sache komplizierter aus:
Re(z1 z2 ) = x1 x2 − y1 y2
und
Im(z1 z2 ) = x1 y2 + x2 y1
Zusammen mit dieser Addition und dieser Multiplikation bilden die komplexen Zahlen C einen vollständigen Zahlenkörper, der eine Erweiterung
der reellen Zahlen R darstellt.
Insbesondere die Multiplikation mag im Moment etwas verwirrend erscheinen, wir werden aber in
Kürze sehen, dass sich beide Verknüpfungen gut veranschaulichen und verstehen lassen.
65
5.4.1
Ein näherer Blick auf die Addition komplexer Zahlen
• Veranschaulichung in der Gauss’schen Zahlenebene (vgl. Abb. 29): Bei der Addition
zweier komplexer Zahlen z1 und z2 handelt es sich in der komplexen Zahlenebene einfach um
die Vektoraddition der beiden Ortsvektoren von 0 nach z1 resp. z2 .
• Ort des additiv Inversen: Das additiv inverse Element (−z) ist in der Gauss’schen Zahlenebene einfach die Spiegelung von z am Ursprung 0 (vgl. Abb. 29). Damit ist auch anschaulich
klar, dass es zu jedem z ∈ C auch nur genau ein solches additiv inverses Element (−z) gibt.
• Überprüfung von Assoziativität und Kommutativität: Dass die “neue” Addition assoziativ
und kommutativ ist, verstehen wir aufgrund der Vektoraddition sofort. Kommutativität und
Assoziativität sind nämlich auch Eigenschaften der Vektoraddition.62 Andererseits ergeben sich
diese Eigenschaften unmittelbar aus der Assoziativität und der Kommutativität reeller Zahlen:
Assoziativität:
Kommutativität:
d
z1 + (z2 + z3 ) = z1 + (x2 + x3 ) + i(y2 + y3 )
d
= x1 + (x2 + x3 ) + i y1 + (y2 + y3 )
r
= (x1 + x2 ) + x3 + i (y1 + y2 ) + y3
d
d
= (x1 + x2 ) + i(y1 + y2 ) + z3 = (z1 + z2 ) + z3
d
z1 + z2 = x1 + x2 + i(y1 + y2 )
r
d
= x2 + x1 + i(y2 + y1 ) = z2 + z1
Vielleicht erscheinen Ihnen diese Umformungen ein bisschen sehr trivial, aber für ein solides
Fundament ist es eben sehr wichtig, dass man die grundlegenden Eigenschaften ganz genau
überprüft, und zwar ausschliesslich mit nachweislich abgesicherten Einzelschritten. So habe ich
bei allen Schritten mit d die Definition der Addition und bei den mittleren Schritten mit r die
Kommutativität resp. Assoziativität reeller Zahlen verwendet.
Abbildung 29: In der komplexen Zahlenebene entspricht die Addition zweier Zahlen einer Vektoraddition. Die Ortsvektoren von 0 nach z1 und z2 werden aneinander gehängt. Die additiv inverse Zahl
(−z) entspricht einer Spiegelung des zu z gehörenden Punktes an 0.
62
Vektoraddition: ~a + ~b + ~c = ~a + ~b + ~c und ~a + ~b = ~b + ~a.
66
5.4.2
Ein näherer Blick auf die Multiplikation komplexer Zahlen
• Die explizite Ausmultiplikation: Die Festlegung der Multiplikation in (59) erscheint im ersten
Moment etwas unverständlich, ja vielleicht sogar willkürlich. Im Prinzip handelt es sich dabei
aber einfach um die Ausmultiplikation der Darstellungen zweier komplexer Zahlen z1 und z2
mit ihren Real- und Imaginärteilen:
z1 z2 = (x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2
= x1 x2 − y1 y2 + i(x1 y2 + y1 x2 )
Beachten Sie dabei die Ausnutzung von i2 ≡ −1.
• Aufgeschobene graphische Interpretation (vgl. Abb. 30): Betrachten wir ein explizites
Zahlenbeispiel. Gegeben seien z1 = 1 + 2i und z2 = −1 + i. Für ihr Produkt ergibt sich:
z1 z2 = (1 + 2i)(−1 + i) = −1 + i − 2i + 2i2 = −1 − i − 2 = −3 − i
Abb. 30 zeigt, wo sich dieses Resultat in der Gauss’schen Zahlenebene befindet. Tatsächlich
gibt es einen geometrischen Zusammenhang zwischen z1 , z2 und z1 z2 . Den werden wir aber
erst im Abschnitt 5.5.4 aufdecken und dann auf dieses Beispiel zurückschauen. Bis dahin dürfen
Sie sich darüber den Kopf zerbrechen, wie der Zusammenhang zwischen diesen drei Punkten
aussieht.
• Überprüfung von Assoziativität und Kommutativität: Diese Eigenschaften lassen sich sehr
analog zur Addition überprüfen. Dabei verwenden wir einerseits wiederum die Assoziativität
und die Kommutativität bei der Addition und der Multiplikation reeller Zahlen, andererseits
natürlich die Definition der Multiplikation komplexer Zahlen (59). Die Sache sieht nun allerdings etwas komplizierter aus. Ich beschränke mich an dieser Stelle auf die Überprüfung der
Kommutativität:
Kommutativität:
d
z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + x2 y1 )
r
d
= x2 x1 − y2 y1 + i(x2 y1 + x1 y2 ) = z2 z1
Abbildung 30: Im Moment ist noch unklar, welche geometrische Bedeutung die Multiplikation zweier
komplexer Zahlen z1 und z2 in der komplexen Zahlenebene hat. Die Auflösung folgt im Abschnitt
5.5. Über das multiplikativ inverse Element z −1 erfahren Sie mehr im Abschnitt 5.4.4.
67
5.4.3
Der Betrag einer komplexen Zahl
• Beträge reeller Zahlen: Unter dem Betrag |a| einer reellen Zahl a verstehen wir ihren
positiven Zahlenwert ohne Vorzeichen:
35 35
√ √
2 = 2
|3| = 3
| − 6| = 6
|0| = 0
− =
13
13
Auf dem reellen Zahlenstrahl kann man |a| als Abstand der Zahl a zum Nullpunkt 0
interpretieren – und Abstände sind per Definition immer positiv.
Häufig wird dieser Betrag einer Zahl auch Absolutbetrag genannt.63
• Beträge komplexer Zahlen: Auch bei komplexen Zahlen soll der Betrag |z| für den Abstand
zum Nullpunkt 0 stehen (vgl. Abb. 28). Folgende Definition erfüllt diese Anforderung:
Absolutbetrag einer komplexen Zahl z
Der Absolutbetrag oder Betrag |z| einer komplexen Zahl z = x + iy
ist gegeben durch die (positive) Wurzel des Produktes aus dem konjugiert
Komplexen z ∗ und z selber:
p
√
(60)
|z| ≡ z ∗ z = x2 + y 2
Diese Definition entspricht in der komplexen Ebene dem Abstand von z
zum Ursprung 0.
Betrachten wir eine beliebige komplexe Zahl z = x + iy, so erhalten wir für ihren Betrag:
p
p
p
√
|z| = z ∗ z = (x − iy)(x + iy) = x2 + ixy − ixy − i2 y 2 = x2 + y 2
Beachten Sie, wie −i2 schliesslich ein positives Vorzeichen von y 2 ergibt.
Tatsächlich entspricht dieses Resultat in der Gauss’schen Zahlenebene genau dem Abstand
von z zum Nullpunkt 0, wie Abb. 31 erklärt (Satz des Pythagoras!). Alle Zahlen z mit |z| = r
bilden zusammen den Kreis mit Radius r um den Ursprung 0.
• Betragsquadrat und Vorschau auf die Quantenmechanik: In obiger Betragsberechnung
sehen Sie zum ersten Mal den praktischen Einsatz des konjugiert Komplexen z ∗ . Damit lässt
sich das Betragsquadrat |z|2 in sehr einfacher Weise notieren:
|z|2 = z ∗ z
Dieses Betragsquadrat werden wir in der Quantenmechanik andauernd antreffen. Konkret
beträgt die Wahrscheinlichkeit dafür, ein Teilchen, dessen Verhalten durch die Schrödinger’sche
Wellenfunktion Ψ (x, t) beschrieben wird, zum Zeitpunkt t zwischen den Orten a und b zu
finden:
Z
Z
b
a
|Ψ (x, t)|2 dx =
b
Ψ ∗ (x, t)Ψ (x, t) dx
a
Dabei ist Ψ (x, t) eine Funktion mit komplexen Funktionswerten. Damit können Sie nachvollziehen, weshalb uns der Ausdruck Ψ ∗Ψ auf Schritt und Tritt auf dem Weg durch die
Quantenmechanik verfolgen wird.
63
Mit dieser Namensgebung wird klar, weshalb in manchen Rechenprogrammen der Betrag mit dem Kürzel abs()
aufgerufen werden kann. So z.B. auch in GeoGebra.
68
Abbildung 31: Der Betrag |z| einer komplexen Zahl z beschreibt in der komplexen Ebene den Abstand
des Punktes z vom Ursprung 0. Alle komplexen Zahlen mit demselben Betrag |z| = r liegen auf
einem Kreis mit Radius r um 0.
5.4.4
Division: Bruchrechnen mit komplexen Zahlen
Die Zahl z1 = x1 + iy1 soll durch die Zahl z2 = x2 + iy2 6= 0 geteilt werden, wodurch die Zahl
z3 = x3 + iy3 entsteht:
z1
z1 : z2 =
= z3
⇔
z1 = z2 · z3
z2
Stimmt die Division links, so muss auch die Multiplikation rechts richtig sein und umgekehrt, wenn
z2 6= 0. Daraus lässt sich auf den Realteil x3 und den Imaginärteil y3 von z3 schliessen:
z1 = z2 z3
⇒
x1 + iy1 = (x2 + iy2 )(x3 + iy3 ) = x2 x3 − y2 y3 + i(x3 y2 + x2 y3 )
{z
}
{z
}
|
|
=x1
=y1
Identifikationstrick: Da Real- und Imaginärteil der Zahl z1 = x1 + iy1 eindeutig sind, können wir
die Terme x2 x3 − y2 y3 und x3 y2 + x2 y3 ganz rechts mit x1 resp. y1 identifizieren. Es ergibt sich ein
ohne Weiteres lösbares lineares Gleichungssystem mit den beiden Unbekannten x3 und y3 :
x
x = x x −y y 1 = x 2 x3 − y 3 x2
y1
y2
x1
1
2
3
2
3
y2
y2
+
=
+
x3
⇒
⇒ y1
y 1 = x3 y 2 + x2 y 3 y2
x2
y2
x2
= y 2 x3 + y 3 x2
⇒
x2
x1 x2 + y1 y2 = (x22 + y22 ) x3
⇒
x3 =
x1 x2 + y 1 y 2
x22 + y22
In der Fortsetzung lässt sich auch y3 bestimmen – das können Sie selber überprüfen. Wir erhalten:
y3 =
x2 y 1 − x1 y 2
x22 + y22
Dieser Weg ist wegen des Identifikationstricks zwar lehrreich, aber nicht besonders elegant. Es folgt
nun eine zweite Berechnung von zz12 , die ebenso neue Aufschlüsse und Erkenntnisse mit sich bringt.
69
Der bessere Trick für die rasche Division zweier komplexer Zahlen z1 und z2 besteht in der
Erweiterung des Bruchs zz21 mit dem konjugiert Komplexen des Nenners, also mit z2∗ :
z1
z1 z2∗
z1 z2∗
(x1 + iy1 )(x2 − iy2 )
=
· ∗ =
=
z2
z2 z2
|z2 |2
x22 + y22
=
x1 x2 + y1 y2 + i(x2 y1 − x1 y2 )
x22 + y22
Das entspricht der Lösung von vorhin. Der Trick der Erweiterung mit z2∗ macht den Nenner reell.
Dort entsteht nämlich einfach das Betragsquadrat des Divisors: z2 z2∗ = |z2 |2 = x22 + y22 .
z z∗
Bereits der Bruch |z12 |22 in der Mitte der oberen Zeile kann als Resultat der Division aufgefasst
werden, einfach ohne Zerlegung in Real- und Imaginärteil. Damit können wir z.B. auch ganz leicht
verdeutlichen, was denn das multiplikativ inverse Element z −1 einer Zahl z ist:
z −1 =
1
1 z∗
z∗
1 z∗
= · ∗ = 2 =
·
z
z z
|z|
|z| |z|
Die Faktorisierung in zwei Brüche ganz am Schluss liefert uns ein anschauliches Verständnis in der
Gauss’schen Zahlenebene (vgl. Abb. 32). Wie wir bereits aus Abb. 28 wissen, besitzt z ∗ denselben
z∗
eine Zahl mit Betrag 1, die von 0 aus gesehen in Richtung
Betrag wie z, d.h. |z ∗ | = |z|. Somit ist |z|
1
∗
des konjugiert Komplexen z liegt. Darauf wird nun der zweite Faktor |z|
angewendet, sodass folgt:
• z −1 liegt von 0 aus gesehen in der Richtung von z ∗ .
1
• |z −1 | = |z|
. Dies bedeutet: Ist |z| > 1, so ist |z −1 | < 1 – und umgekehrt. In der komplexen
Ebene liegt das multiplikativ inverse Element z −1 innerhalb des Einheitskreises, wenn die Zahl
z selber ausserhalb desselben liegt – und umgekehrt.
Nun verstehen wir auch das Beispiel des multiplikativ inversen Elementes der Zahl z = 1 + 2i in
Abb. 30 auf Seite 67:
1 2
1 − 2i
1 − 2i
z∗
= − i
=
z −1 = 2 = 2
2
|z|
1 +2
5
5 5
Abbildung 32: Das multiplikativ inverse Element z −1 liegt von 0 aus gesehen in Richtung des konjugiert Komplexen z ∗ . Sein Betrag |z −1 | ist gleich dem Kehrwert von |z|.
70
5.4.5
Die imaginäre Einheit i und ihre Potenzen
Kurz wollen uns noch überlegen:
i0 = 1
i1 = i
i2 = −1
i3 = i2 · i = −i
i4 = 1
Ebenso:
i0 = 1
i−1 =
1
i
= 2 = −i
i
i
i−2 =
1
= −1
i2
i−3 = −
1
i
= 4 =i
3
i
i
i−4 =
1
=1
i4
Ab der vierten Potenz von i wiederholen sich die Werte. Also merken wir uns:
i4n = 1
i4n+1 = i
i4n+2 = −1
i4n+3 = −i = i2 · i
mit n ∈ Z
Vergleichen Sie dazu Abb. 33.
5.4.6
Überprüfung der Körperaxiome
Nachdem wir nun schon einiges zum Umgang mit komplexen Zahlen gesehen haben, sollten wir uns
eigentlich abschliessend nochmals davon überzeugen, dass C zusammen mit der in (59) definierten
Addition und Multiplikation die Körperaxiome von Seite 61 erfüllt. Darauf werde ich an dieser Stelle
allerdings verzichten, weil wir schon viele Punkte abgehakt haben:
• 1.+2. Körperaxiom: Assoziativität und Kommutativität der Addition.
• 6. Körperaxiom: Kommutativität der Multiplikation.
• 3.+7. Körperaxiom: Deklaration und Verifizierung der neutralen Elemente 0 und 1.
• 4. Körperaxiom: Existenz des additiv inversen Elementes (−z).
• 8. Körperaxiom: Existenz des multiplikativ inversen Elementes z −1 .
Es fehlen also nur noch die Überprüfung der Assoziativität der Multiplikation und des Distributivgesetzes (5.+9. Körperaxiom). Das wollen wir uns schenken.
Nochmals: Die komplexen Zahlen bilden zusammen mit den in (59) definierten Verknüpfungen “+”
und “ · ” einen Zahlenkörper. Mit Realteil x und Imaginärteil y einer komplexen Zahl z = x + iy,
sowie mit der komplexen Einheit i dürfen wir rechnen, wie wir es uns schon seit jeher gewohnt sind.
Speziell ist die Eigenschaft der komplexen Einheit i, nämlich dass i2 = −1.
Abbildung 33: Die imaginäre Einheit i und ihre Potenzen in der komplexen Ebene.
71
5.5
5.5.1
Komplexe Zahlen in Polarkoordinaten, Euler-Gleichung und Euler-Darstellung
Polarkoordinaten in der komplexen Ebene
Wir betrachten zunächst eine komplexe Zahl z1 mit Betrag |z1 | = 1. D.h., die Zahl z1 liegt in
der Gauss’schen Ebene auf dem Einheitskreis rund um den Ursprung 0 (vgl. Abb. 34). Wegen der
Definitionen von Sinus und Cosinus am Einheitskreis muss dann gerade gelten:
z1 = cos ϕ + i sin ϕ
Dabei ist ϕ der von der reellen Achse aus im Gegenuhrzeigersinn gemessene Winkel. Wir wollen
dafür von Anfang an und ausschliesslich das Bogenmass verwenden.64
Abbildung 34: Zu jedem von der reellen Achse im Gegenuhrzeigersinn abgetragenen Winkel ϕ gehört
genau ein Punkt auf dem Einheitskreis resp. eben eine komplexe Zahl z1 mit Betrag |z1 | = 1. Wegen
den bekannten Definitionen von Sinus und Cosinus am Einheitskreis gilt: z1 = cos ϕ + i sin ϕ.
Jede komplexe Zahl auf dem Einheitskreis lässt sich also ganz anschaulich mit nur einem Winkel resp. einer Winkelkoordinate ϕ beschreiben. Dabei gilt stets der “trigonometrische Satz des
Pythagoras”:65
cos2 ϕ + sin2 ϕ = 1
Multiplizieren wir nun unser z1 = cos ϕ + i sin ϕ mit einer reellen Zahl r ≥ 0, so erhalten wir eine
neue komplexe Zahl z:
z = r · z1 = r(cos ϕ + i sin ϕ) = r cos ϕ + i · r sin ϕ
| {z }
| {z }
=x
=y
z1 wird um den Faktor r vom Ursprung weggestreckt. Da |z1 | = 1 war, hat z nun den Betrag |z| = r,
also den Abstand r vom Ursprung, wovon man sich leicht überzeugen kann:
q
q
p
√
2
2
2
2
2
2
|z| = x + y = r cos ϕ + r sin ϕ = r 2 (cos2 ϕ + sin2 ϕ) = r 2 = r
Abb. 35 verdeutlicht den Zusammenhang zwischen z1 und z = r · z1 .
64
65
◦
Zur Erinnerung: Für die Umrechnung zwischen Bogenmass und Gradmass muss man sich merken, dass: π =180
b
.
2
2
2
2
Zur Klärung: cos ϕ ≡ (cos ϕ) und sin ϕ ≡ (sin ϕ) .
72
Abbildung 35: Nimmt man den Ursprung 0 als Streckzentrum und streckt die auf dem Einheitskreis
liegende Zahl z1 mit dem Faktor r, so resultiert die Zahl z = r · z1 . Zu ihr gehört nach wie vor die
Winkelkoordinate ϕ, aber ihr Betrag ist nun |z| = r. Das Paar aus Betrag r und Winkelkoordinate
ϕ bezeichnet als Polarkoordinaten von z.
Jede komplexe Zahl z = x + iy lässt sich also statt durch den Realteil x und den Imaginärteil y
auch durch ein Paar aus einem Betrag r und einer Winkelkoordinate ϕ beschreiben. r und ϕ nennt
man die Polarkoordinaten von z.
x und y lassen sich sehr leicht durch r und ϕ ausdrücken. Offensichtlich gilt:
x = r cos ϕ
und
y = r sin ϕ
Die umgekehrte Angabe, also wie sich r und ϕ durch x und y ausdrücken lassen, ist, zumindest was
die Winkelkoordinate ϕ angeht, etwas mühsamer. Für den Betrag r gilt offensichtlich:
p
r = x2 + y 2
Bezüglich der Winkelkoordinate ϕ machen wir uns zuerst bewusst, dass es zu einem bestimmten z
im Prinzip mehrere korrekte Werte von ϕ gibt. Wenn wir einen zu z passenden Winkel ϕ0 um 2π,
also um eine ganze Umdrehung vergrössern oder verkleinern, so schauen wir ja wieder in dieselbe
Richtung. Tatsächlich gibt es somit unendlich viele zu z passende Winkelwerte:
ϕ = ϕ0 ± n · 2π
mit
n∈N
Wenn wir aber effektiv mal die Winkelkoordinate zu einer komplexen Zahl anzugeben haben, dann
soll sie möglichst klein sein, also möglichst nahe bei 0 liegen. Wir fordern:
−π < ϕ ≤ π
Blicken wir kurz auf Abb. 35. Dort besitzt die Zahl z den Realteil x = r cos ϕ und den Imaginärteil
y = r sin ϕ. Der Bruch xy ergibt gerade tan ϕ, denn im grossen rechtwinkligen Dreieck ist dies genau
das Verhältnis der Gegenkathete von ϕ zur Ankathete. Daraus folgern wir:
y
ϕ = arctan
x
Allerdings kann dies noch nicht die letzte Wahrheit sein, denn so ergäbe sich z.B. für z = 3 + 2i und
z = −3 − 2i derselbe Winkelwert, weil:
−2
2
=
3
−3
73
Tatsächlich müssen wir eine Fallunterscheidung machen. Je nachdem, in welchem Quadranten
der komplexen Ebene die Zahl z liegt, muss ϕ leicht anders berechnet werden. Wissend, dass der
Arcustangens per Definition Winkelwerte − π2 < ϕ < π2 liefert (vgl. Abb. 36), notieren wir:
y
1. Quadrant: x > 0 und y > 0
⇒
ϕ = arctan
x
y
2. Quadrant: x < 0 und y > 0
⇒
ϕ = arctan + π
x
y
3. Quadrant: x < 0 und y < 0
⇒
ϕ = arctan − π
x
y
4. Quadrant: x > 0 und y < 0
⇒
ϕ = arctan
x
Auf diese Weise entstehen, wie weiter oben gefordert, lauter Winkelwerte −π < ϕ ≤ π.
Abbildung 36: Der Graph der Arcustangensfunktion.
Halten wir nochmals fest, was wir in diesem Abschnitt Neues gesehen haben:
Koordinaten komplexer Zahlen
Eine komplexe Zahl z wird einerseits durch ihre beiden kartesischen Koordinaten
x und y beschrieben. Wir sprechen vom Realteil x und vom Imaginärteil y und
es gilt:
z = x + iy
Andererseits gehören zu jeder komplexen Zahl z 6= 0 zwei Polarkoordinaten r
und ϕ. r = |z| ist der Betrag und ϕ die Winkelkoordinate von z und es gilt:
z = r(cos ϕ + i sin ϕ)
(61)
Für die Umrechnung von Polar- zu kartesischen Koordinaten gilt:
x = r cos ϕ
und
y = r sin ϕ
(62)
Umgekehrt ergibt sich für die Umrechnung von kartesischen zu Polarkoordinaten:
p
y
(63)
r = x2 + y 2
und
ϕ = arctan + kπ
x
Für z im 2. Quadranten der komplexen Ebene ist k = +1, für den 3. Quadranten
ist k = −1 und für den 1. und 4. Quadranten ist k = 0.
74
5.5.2
Euler-Gleichung und Euler-Darstellung komplexer Zahlen
Wir kommen nun zum eigentlichen Wunder der komplexen Zahlen und zum Grund dafür, dass sich
das Rechnen mit ihnen so dermassen durchgesetzt hat. Dieses Wunder heisst Euler’sche Gleichung
und gipfelt darin, dass sich eine Beziehung zwischen den fundamentalen Zahlenkonstanten e, i und
π sowie den Neutralelementen 1 und 0 von Multiplikation und Addition notieren lässt, nämlich:
eiπ + 1 = 0
Diese Gleichung wird von vielen Mathematikerinnen und Mathematikern als etwas vom Fundamentalsten und Schönsten überhaupt angesehen. . . Sie entspringt dem folgenden Zusammenhang:
Euler-Gleichung und Euler-Darstellung
Für die Euler’sche Zahl e und die beiden Winkelfunktionen Cosinus und
Sinus gilt die Euler-Gleichung:
eiϕ = cos ϕ + i sin ϕ
(64)
eiϕ ist somit die praktische Kurzschreibweise für eine komplexe Zahl auf
dem Einheitskreis der Gauss’schen Zahlenebene, denn genau dafür steht
cos ϕ + i sin ϕ ja. Mit (61) lässt sich nun jede komplexe Zahl z mit Polarkoordinaten r und ϕ in der sogenannten Euler-Darstellung notieren:
z = r · eiϕ
(65)
Damit darf man ganz normal rechnen. Insbesondere gelten für eiϕ die üblichen Potenzgesetze, was uns zahlreiche neue Rechenwege eröffnet.
Die Euler-Gleichung ist gar nicht einmal so schwierig zu beweisen. Wir kommen zu einem späteren
Zeitpunkt darauf zu sprechen. Im Moment wollen wir aber einfach von ihrer Richtigkeit ausgehen
und sehen, wie uns die Euler-Darstellung (65) in ganz neuer Art und Weise arbeiten lässt.
Zuerst aber noch ein paar direkte Bemerkungen zum eben Gesagten:
• Das konjugiert Komplexe einer Zahl z lässt sich auch in der Euler-Darstellung rasch notieren:
z = r eiϕ
z ∗ = r e−iϕ
⇒
• Da die Cosinus- und die Sinusfunktion 2π-periodisch sind, gilt dies nun auch für die Exponentialfunktion eiϕ . Das bedeutet:
ei(ϕ±2π) = eiϕ
für jede beliebige Winkelkoordinate ϕ
Das wird klar, wenn wir uns wieder vor Augen führen, dass cos ϕ + i sin ϕ für die zur Winkelkoordinate ϕ gehörende komplexe Zahl z auf dem Einheitskreis steht. Die Subtraktion oder
Addition von 2π erzeugt eine ganze Umdrehung im oder gegen den Uhrzeigersinn und führt
somit wieder auf dasselbe z auf dem Einheitskreis.
• Besonders wichtig, da häufig vorkommend, sind die speziellen Werte bei Vielfachen von
e0 = 1
π
ei 2 = i
eiπ = −1
ei
3π
2
= −i
ei2π = 1
Ab hier wiederholt sich die Abfolge wegen der 2π-Periodizität von eiϕ .
Hierin steckt auch die “besonders schöne” Gleichung von oben:
eiπ = −1
⇔
75
eiπ + 1 = 0
etc.
π
2:
5.5.3
Repetition der Potenzgesetze
Die Stärke der Euler-Darstellung z = reiϕ liegt insbesondere darin, dass man bei der Multiplikation
zweier komplexer Zahlen eben lediglich zwei Beträge und zwei Potenzen mit Basis e miteinander
zu multiplizieren hat. . . grübel, grübel . . . was passiert schon wieder bei der Multiplikation zweier
Potenzen mit gleicher Basis?
Damit diese und ähnlich Fragen zum Umgang mit Potenzen wieder geklärt sind, seien hier kurz
die Potenzregeln repetiert:
Rechenregeln für Potenzen
Grundverständnis für a ∈ C und n ∈ N:
an ≡ a
. . · a}
| · .{z
a0 ≡ 1
n−mal
a−1 ≡
1
a
Multiplikation/Division von Potenzen mit gleicher Basis:
ab · ac = ab+c
resp.
ab
= ab−c
ac
für
a, b, c ∈ C
Multiplikation/Division von Potenzen mit gleichem Exponenten:
ac · bc = (a · b)c
resp.
Potenzieren von Potenzen:
(ab )c = ab·c
ac a c
=
bc
b
für
für
a, b, c ∈ C
a, b, c ∈ C
Diese Potenzregeln funktionieren im Komplexen natürlich nur, weil wir schön dafür gesorgt haben,
dass die Körperaxiome erfüllt sind, dass es also eine wohldefinierte Addition und Multiplikation gibt!
5.5.4
Das Verständnis der komplexen Multiplikation
Im Abschnitt 5.4.2 war das graphische Verständnis für die Multiplikation zweier komplexer Zahlen
noch nicht so richtig greifbar (vgl. Abb. 30). Das Produkt zweier Zahlen liess sich zwar ohne Probleme
berechnen, wie wir im damaligen Beispiel mit z1 = 1 + 2i und z2 = −1 + i (vgl. Seite 67) gesehen
hatten:
z3 = z1 z2 = (1 + 2i)(−1 + i) = −1 + i − 2i + 2i2 = −1 − i − 2 = −3 − i
Mit der Euler-Darstellung wird nun aber endlich alles viel klarer!
Betrachten wir ganz allgemein zwei komplexe Zahlen in ihren Euler-Darstellungen z1 = r1 eiϕ1
und z2 = r2 eiϕ2 , so ergibt sich wegen der Potenzregel für ihr Produkt:
z3 = z1 z2 = r1 eiϕ1 · r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) = r3 eiϕ3
D.h., die neue Zahl z3 besitzt als Betrag (= Distanz zum Ursprung) das Produkt der Beträge der
beiden ursprünglichen Zahlen:
r3 = r1 r2
Und was passiert mit den Winkeln? Die werden einfach addiert! Die Winkelkoordinate ϕ3 der resultierenden Zahl z3 ist einfach die Summe der Winkelkoordinaten beider Faktoren:
ϕ3 = ϕ1 + ϕ2
Damit verstehen wir die Multiplikation zweier komplexer Zahlen nun auch graphisch ohne Weiteres.
76
Betrachten wir zur Veranschaulichung nochmals das Beispiel von oben resp. von Seite 67, jetzt
neu dargestellt in Abb. 37. Zu den beiden Zahlen z1 = 1 + 2i und z2 = −1 + i gehört je eine
Winkelkoordinate und ein Betrag, ebenso zum Resultat z3 = z1 z2 = −3 − i. Mittels der Koordinatentransformationen (63) erhalten wir für diese Koordinaten:
r1 =
r2 =
r3 =
p
12 + 22 =
√
5
und
11 + 12 =
√
2
und
p
31 + 12 =
√
10
und
p
2
≈ 1.107
1
1 π
3π
+π =− +π =
≈ 2.356
ϕ2 = arctan
−1
4
4
−1 ϕ3 = arctan
− π ≈ −2.820
−3
ϕ1 = arctan
Bei den Beträgen sehen wir sofort, dass der Zusammenhang stimmt:
√ √
√
r1 r2 = 5 · 2 = 10 = r3
Bei den Winkelkoordinaten müssen wir einen kurzen Moment länger überlegen:
ϕ1 + ϕ2 ≈ 1.107 + 2.356 = 3.463 > π
Dieses Ergebnis liegt ausserhalb des Intervalls ] − π; π]. Um es wieder in diesen Bereich zu bringen,
müssen wir davon einmal 2π abziehen. Dadurch verändern wir an der Richtung von ϕ1 + ϕ2 und
damit an z1 z2 nichts, denn die Addition oder Subtraktion von 2π entspricht ja einfach einer ganzen
Umdrehung:
ϕ1 + ϕ2 − 2π ≈ 3.643 − 2π ≈ −2.820
Nun stimmt das Resultat mit der weiter oben berechneten Winkelkoordinate ϕ3 von z3 überein.
Abbildung 37: Das graphische Verständnis der komplexen Multiplikation: Bei der Multiplikation
zweier komplexer Zahlen z1 und z2 zur Zahl z3 = z1 z2 werden die Beträge miteinander multipliziert
(r3 = r1 r2 ) und die Winkelkoordinaten addiert (ϕ3 = ϕ1 + ϕ2 ).
77
Halten wir zusammenfassend fest, was wir über die Multiplikation zweier komplexer Zahlen nun
gelernt und am Beispiel überprüft haben:
Komplexe Multiplikation in der Euler-Darstellung
Multiplizieren wir eine erste komplexe Zahl z1 = r1 eiϕ1 mit einer zweiten
komplexen Zahl z2 = r2 eiϕ2 , so erhalten wir die Zahl z3 mit:
z3 = z1 · z2 = r1 eiϕ1 · r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) = r3 eiϕ3
Die Multiplikation zweier in Euler-Darstellung gegebener komplexer Zahlen
bedeutet also:
•
Der Betrag von z3 ist das Produkt der Beträge von z1 und z2 :
r3 = r1 · r2
•
Die Winkelkoordinate von z3 ist die Summe der Winkelkoordinaten
von z1 und z2 :
ϕ3 = ϕ1 + ϕ2
Multiplikation als Drehstreckung in der komplexen Ebene
Die Multiplikation der Zahl z1 mit der Zahl z2 steht für eine Drehstreckung
von z1 um den Ursprung in der Gauss’schen Ebene:
•
z1 wird dabei erstens im Gegenuhrzeigersinn um den Winkel ϕ2 um
den Ursprung gedreht.
•
Zweitens wird z1 mit dem Faktor r2 gestreckt, wobei das Streckzentrum ebenfalls der Ursprung ist.
Natürlich kann dieselbe Multiplikation ebenso gut als Drehstreckung von z2
mit dem Winkel ϕ1 und dem Streckfaktor r1 aufgefasst werden.
Häufigster Spezialfall: eiϕ als rotierender Faktor
An dieser Stelle soll besonders darauf hingewiesen werden, dass die Multiplikation mit dem Faktor eiϕ einfach einer Drehung um den Ursprung mit
Drehwinkel ϕ entspricht (im Gegenuhrzeigersinn). Der Betrag der Zahl wird
durch diese Multiplikation nicht verändert.
Nach diesen Überlegungen zur Multiplikation fällt es nicht weiter schwer, noch kurz über die Division
zweier komplexer Zahlen nachzudenken. Auch diese Operation fällt einem mit Polarkoordinaten, also
in der Euler-Darstellung, wesentlich leichter als mit kartesischen Koordinaten:
z3 =
r1 eiϕ1
r1 i(ϕ1 −ϕ2 )
z1
=
=
e
= r3 eiϕ3
iϕ
2
z2
r2 e
r2
Somit gilt für den Betrag und die Winkelkoordinate des Resultates z3 :
r3 =
r1
r2
und
ϕ3 = ϕ1 − ϕ2
Immer noch handelt es sich um eine Drehstreckung: z1 wird um den Faktor r2 gegen den Ursprung
hin gestaucht und zudem um ϕ2 im Uhrzeigersinn gedreht (das Minuszeichen in ϕ1 − ϕ2 sorgt dafür,
dass die Drehung nicht im Gegenuhrzeigersinn, sondern eben im Uhrzeigersinn erfolgt).
78
5.6
Weitere Zusammenhänge und erste Anwendungen mit komplexen Zahlen
Nun haben wir das wesentliche Rüstzeug zum Umgang mit komplexen Zahlen beisammen: Die neue
Zahlenmenge C ist eingeführt, die Grundoperationen darauf sind diskutiert (auch graphisch) und
Sie haben gesehen, wie Rechnungen in der Euler-Darstellung (Polarkoordinaten) durch Ausnutzung
der Potenzgesetze vereinfacht werden. Jetzt sind wir bereit diese “neuen” Zahlen auch wirklich zu
gebrauchen und zu sehen, wie man sie geübt anwendet und wo sie ganz besonders praktisch sind.
5.6.1
Die Gleichung z n = 1 und die n-ten Einheitswurzeln
Vorüberlegung zur reellen Gleichung xn = 1: Wie Sie wissen, besitzt die Gleichung x2 = 1 die
beiden Lösungen x = ±1, zu x3 = 1 existiert allerdings nur eine Lösung x = 1. Dies setzt sich
fort und wir können für alle n ∈ N zusammenfassen:
(
+1 für ungerades n
n
x =1 ⇒ x=
±1 für gerades n
Offenbar gibt es im Reellen keine ganz einheitliche Aussage zu den Lösungen von xn = 1. Man
muss zwischen ungeraden und geraden Exponenten unterscheiden. . .
Komplexe Einheitswurzeln: Im Komplexen schreiben wir für die Unbekannte nicht mehr x, sondern z. Wie sieht es nun mit den Lösungen von z n = 1 mit n ∈ N aus?
Zur Behandlung dieser Gleichung empfiehlt es sich, z in der Euler-Darstellung anzusetzen.
Damit lässt sich sofort ein Ausdruck für z n notieren:
n
z = r eiϕ
⇒
z n = r eiϕ = r n einϕ
z n soll gleich 1 sein, also den Betrag r n = 1 aufweisen. Da r in der Euler-Darstellung per
Definition eine positive reelle Zahl ist, folgt sofort: r = 1. Alle Lösungen von z n = 1 liegen
also auf dem Einheitskreis und wir schreiben nur noch:
z = eiϕ
resp. z n = einϕ
(66)
An dieser Stelle machen wir uns nochmals klar, dass sich die reelle Einheit 1 mittels EulerDarstellung auf unendlich viele verschiedene Arten schreiben lässt:
1 = . . . = e−i6π = e−i4π = e−i2π = ei·0 = ei2π = ei4π = ei6π = . . .
Allgemein:
1 = ei2πk
mit
k∈Z
(67)
Alle zu 1 gehörenden Winkelkoordinaten 2πk mit k ∈ Z zeigen vom Ursprung aus in die
positive Richtung der rellen Achse, also eben in die Richtung von 1. Sie unterscheiden sich
lediglich darin, dass sie unterschiedlich viele ganze Umdrehungen (±2π) im Gegen- oder im
Uhrzeigersinn enthalten, was an der Zahl 1 aber nichts ändert.
Bei der nachfolgenden Lösung von z n = 1 soll die 1 durch ihre Euler-Darstellung ersetzt
werden. Um bei dieser Ersetzung garantiert keine Lösungen zu verlieren, dürfen wir keine
mögliche Winkelkoordinate von 1 einfach von vornherein ausschliessen. Wir sollten also ganz
unbedingt den allgemeinen Ausdruck 1 = ei2πk verwenden.
Mit der Euler-Darstellung von z n in (66) und derjenigen von 1 in (67) folgt nun:
zn = 1
einϕ = ei2πk
⇒
mit k ∈ Z
Damit die beiden Seiten der Gleichungen wirklich gleich sind, müssen die Winkelkoordinaten
übereinstimmen (= Identifikationstrick für Winkelkoordinaten, vgl. Seite 69):
nϕ = 2πk
79
mit
k∈Z
Für die möglichen Winkelkoordinaten erhalten wir daraus:
2π
k
mit k ∈ Z
n
Das sieht zunächst nach unendlich vielen Lösungen aus, weil k ja alle ganzen Zahlen von −∞
bis +∞ durchläuft. In Tat und Wahrheit gibt es aber nur genau n verschiedene Lösungen.
ϕ=
Wir überlegen: 2π
n ist der n-te Teil einer ganzen Umdrehung. Lässt man k bei 0 starten, so
erreicht ϕ = 2π
k
bei k = n den Wert ϕ = 2π und eine ganze Umdrehung ist abgeschlossen.
n
Die Winkelkoordinate ϕ = 2π gehört, ebenso wie die Winkelkoordinate ϕ = 0, zur Zahl z = 1.
Für k = n, n+1, n+2, . . . ergeben sich nun lauter Winkelrichtungen, die wir bereits abgedeckt
haben. Starten wir bei k = 0, so entsteht die letzte wirklich neue Winkelrichtung bei k = n−1.
Auch für negative k erhalten wir lauter Winkelrichtungen, die bereits abgedeckt sind.
Somit lassen sich die n echt verschiedenen Winkelwerte folgendermassen notieren:
2π
k
mit k = 0, 1, 2, . . . , n − 1
n
Fassen wir dieses Resultat allgemein zusammen:
ϕ=
Die n-ten Einheitswurzeln
Als n-te Einheitswurzeln bezeichnet man die Lösungen der Gleichung:
zn = 1
mit
n∈N
Zu jedem n gibt es n verschiedene Einheitswurzeln, nämlich:
2π
z = ei n k
mit
k = 0, 1, . . . , n − 1
Eine dieser Einheitswurzeln ist stets die reelle Einheit 1 selber. Die weiteren
Einheitswurzeln liegen von 1 ausgehend gleichverteilt auf dem Einheitskreis
der komplexen Ebene.
Die Einheitswurzeln werden so genannt, weil die Zahl 1 die (reelle) Einheit ist und die Gleichung
z n = 1 im klassischen Sinn eben nach den n-ten Wurzeln von 1 fragt.
Ein paar Beispiele (siehe Abb. 38): Als 2. Einheitswurzeln (= Quadratwurzeln von 1) ergeben
sich:
2π
z2 = 1
⇒
z1 = ei·0 = 1
z2 = ei 2 = eiπ = −1
Diese Lösungen kennen wir bereits aus dem Reellen!
Für die 3. Einheitswurzeln erhalten wir:
z3 = 1
⇒
z1 = ei·0 = 1
z2 = ei
2π
3
z3 = ei
4π
3
= e−i
2π
3
= z2∗
Die zweite und die dritte Lösung existieren, kommen aber einfach nicht auf den Strahl der
reellen Zahlen zu liegen! Daher gibt es in der Einschränkung auf die reellen Zahlen eben keine
andere dritte Wurzeln von 1 als die 1 selber.
Wir stellen fest: Eine Einheitswurzel oberhalb der reellen Achse hat stets ein Gegenüber
unterhalb der reellen Achse (Spiegelpunkt). D.h., das konjugiert Komplexe einer n-ten Einheitswurzel ist immer noch eine n-te Einheitswurzel. Wie wir auf Seite 75 bemerkt hatten,
wechselt beim Übergang zum konjugiert Komplexen in der Euler-Darstellung einfach das Vorzeichen des Exponenten. Somit gilt eben bei den 3. Einheitswurzeln z.B.:
2π
2π ∗
= e−i 3
z3 = z2∗ = ei 3
80
Betrachten wir auch noch die 4. und die 5. Einheitswurzeln:
z4 = 1
⇒
z1 = 1
z2 = ei
2π
4
z5 = 1
⇒
z1 = 1
z2 = ei
2π
5
π
= ei 2 = i
z3 = ei
4π
5
z3 = eiπ = −1
z4 = z3∗
z4 = z2∗ = −i
z5 = z2∗
Abbildung 38: Beispiele von n-ten Einheitswurzeln. Stets verteilen sie sich gleichmässig auf dem
Einheitskreis. Die 1 gehört immer dazu.
81
5.6.2
Mehr vom Wurzelziehen im Komplexen
Komplexe Wurzeln von positiven reellen Zahlen: Ausgehend von den Einheitswurzeln können
wir unsere “Wurzelzieh-Fähigkeiten” nun rasch weiter ausbauen. Zunächst wollen wir nun die
n-te Wurzel nicht nur von 1, sondern von einer beliebigen positiven, reellen a Zahl bestimmen.
Es sei also:
zn = a
mit a ∈ R+
Da sich ein solches a in der Form a = a ei2πk mit k ∈ Z schreiben lässt und wir auch z wieder
in der Euler-Darstellung notieren können, ergibt sich:
z n = r n einϕ = a ei2πk
mit k ∈ Z
Nun müssen auf der linken Seite und der rechten Seite sowohl die Beträge, wie auch die
Winkelkoordinaten übereinstimmen. Der Identifikationstrick funktioniert also auch bei Polarkoordinaten, weil sowohl der Betrag, als auch die Winkelrichtung einer bestimmten komplexen
Zahl eindeutig sind. Daraus folgt für den Betrag von z:
√
rn = a
⇒
r= na
√
Hier meint n a die althergebrachte n-te Wurzel im Reellen. Sie ist selber stets positiv und
eindeutig und existiert in jedem Fall, weil wir ja davon ausgegangen sind, dass a ∈ R+ .
Die Winkelkoordinaten-Gleichung einϕ = ei2πk haben wir bereits bei den Einheitswurzeln behandelt und wir kennen ihre n echt verschiedenen Lösungen:
ϕ=
2π
k
n
mit
k = 0, . . . , n − 1
Somit lässt sich für die n-ten Wurzeln einer positiven reellen Zahl a zusammenfassen:
zn = a
mit
a ∈ R+
⇒
z=
√
n
2π
a ei n k
mit
k = 0, . . . , n − 1
In der komplexen Ebene liegen diese n-ten Wurzeln allesamt auf einem Kreis mit Radius
√
r = n a um den Ursprung. Die Winkelrichtungen sind immer noch dieselben wie bei den n-ten
Einheitswurzeln.
Wurzeln beliebiger komplexer Zahlen: Schliesslich sei nun a ∈ C eine beliebige komplexe Zahl
mit Betrag |a| und Winkelkoordinate α:
a = |a| eiα
Damit lautet unsere Wurzelgleichung in Euler-Darstellung:
z n = r n einϕ = |a| ei(α+2πk)
mit k ∈ Z
Wir bemerken einmal mehr: Die Winkelkoordinate α ist nicht ganz strikt festgelegt, sie kann um
beliebige Vielfache von 2π variieren. Dadurch werden auch hier wiederum n echt verschiedene
Lösungen erzeugt:
nϕ = α + 2πk
⇒
ϕ=
α 2π
+
k
n
n
mit
k = 0, . . . , n − 1
Nun wissen wir vollständig Bescheid über die Lösungen einer Wurzelgleichung im Komplexen:
p
α
2π
mit k = 0, . . . , n − 1
z n = a mit a ∈ C
⇒
z = n |a| ei n + n k
82
Eine Zwischenbemerkung zur Wurzelnotation: Wie Ihnen vielleicht schon aufgefallen ist, ver√
wenden wir das klassische Wurzelsymbol . . . nicht für komplexe Zahlen. Wir schreiben für
√
die Lösungen von z n = a also nicht z = n a.
Mittlerweile verstehen Sie gut, weshalb wir das nicht machen. Die n-te Wurzel einer komplexen Zahl ist ja alles andere als eindeutig. Es gibt immer n verschiedene Lösungen von
z n = a. Im Reellen hatte es noch behelfsmässig funktioniert festzulegen, dass die Wurzel
2
immer positiv
√ z.B. x = 5
√ sein soll. So wusste man immer, welche der beiden Lösungen von
mit x = 5 gemeint war. Die gesamte Lösungsmenge lautete dann x = ± 5. Mit den n
Lösungen im Komplexen wird es da allerdings schwierig, sodass wir eben festlegen, unter dem
althergebrachten Wurzelsymbol keine komplexen Zahlen zu notieren!66
Der Platz unter einer Wurzel ist ausschliesslich für positive, reelle Zahlen reserviert!
Trotzdem sprechen wir von den n-ten Wurzeln der komplexen Zahl a. Damit meinen wir
– zur Erinnerung – alle Lösungen der Gleichung:
zn = a
mit
n∈N
und
a∈C
Wurzeln als Drehstreckungen: Wie wir schon gesehen haben, steht die Multiplikation mit einer
komplexen Zahl z = r eiϕ für eine Drehstreckung um den Ursprung der Gauss’schen Zahlenebene. z n steht somit für die n-malige Ausführung einer bestimmten Drehstreckung – ausgehend
von welcher Zahl? Von 1 aus, denn wir können stets schreiben:
z n = 1 · |z · .{z
. . · z}
n−mal
zn
Mit dem Lösen der Gleichung
= a bestimmen wir also alle Drehstreckungen z, die mich,
ausgehend vom Ort der reellen Einheit 1, nach n-facher Ausführung zur Zahl a bringen!
Konkrete Beispiele: Zum Schluss zwei handfeste Beispiele:
• Quadratwurzeln von a = 3 ei3π/4 :
a = 3 ei3π/4 liegt im 2. Quadranten der komplexen Ebene (vgl. Abb. 39). Wir ermitteln
Ihre Quadratwurzeln resp. eben die beiden Lösungen der Gleichung z 2 = 3 ei3π/4 :
√
√
3π
3π
2π
z = 3 ei 2·4 + 2 k = 3 ei 8 +πk
mit k = 0, 1
√ 11π
√ 3π
√
3π
⇒ z1 = 3 ei 8 und z2 = 3 ei 8 +π = 3 ei 8
√
Diese beiden Quadratwurzeln sitzen auf dem Kreis mit Radius 3 und zwar bei den
3π
11π
Winkeln ϕ1 = 3π
8 und ϕ2 = 8 + π = 8 .
Natürlich könnte man den Winkel ϕ2 auch im Intervall ] − π; π] angeben. Das wäre
5π
dann ϕ2 = 11π
8 − 2π = − 8 . Es ist für unsere Zwecke aber nicht wirklich wichtig diese
Umrechnung vorzunehmen – Hauptsache, wir haben die beiden Wurzeln mit je mindestens
einer korrekten Winkelkoordinatenangabe aufgespürt.
z1 und z2 stehen nun einerseits für einen Punkt in der Gauss’schen Zahlenebene, andererseits beschreiben sie eine Drehstreckung, die uns in bei doppelter Ausführung von der
reellen Einheit 1 zur Zahl a = 3 ei3π/4 führt. Das sehen Sie in Abb. 39.
1
ei5π/8 : Abb. 40 illustriert das folgende Beispiel:
• Die 5. Wurzeln von a = √
4 2
s
5π
π
2π
2π
5π
1
1
1
⇒ z = 5 √ ei 8 /5+ 5 k = √ ei 8 + 5 k
z 5 = √ ei 8
mit k = 0, . . . , 4
4 2
4 2
2
66
Allenfalls haben Sie sich schon gewundert, warum man die imaginäre Einheit i nicht einfach als
Nun haben Sie einen Grund dafür kennengelernt.
83
√
−1 definiert.
√
Abbildung
39: Die beiden Quadratwurzeln einer komplexen Zahl: Sowohl z1 = 3 ei3π/8 , also auch
√ i11π/8
lösen die Gleichung z 2 = a = 3 ei3π/4 . Beide Zahlen können als Vorschriften für
z2 = 3 e
eine Drehstreckung angesehen werden (Multiplikation mit einer komplexen Zahl). Die hintereinander
ausgeführten, identischen Drehstreckungen müssen von 1 nach a führen.
Abbildung 40: Die fünf 5. Wurzeln von a =
84
1
√
4 2
ei5π/8 .
5.6.3
Quadratische Gleichungen im Komplexen
Repetition: Reelle quadratische Gleichungen
Innerhalb der reellen Zahlen gibt es zu einer quadratischen Gleichung ax2 + bx + c = 0 (a, b, c ∈ R)
entweder keine, eine oder zwei Lösungen x. Man kann die drei Fälle klar voneinander unterscheiden:
Zwei Lösungen: Die quadratische Funktion f (x) = ax2 + bx + c auf der linken Gleichungsseite
lässt sich mittels eines Zweiklammeransatzes faktorisieren, also in die Nullstellenform bringen:
f (x) = ax2 + bx + c = a(x − x1 )(x − x2 ) = 0
mit
x1 , x2 ∈ R
Dann sind x1 , x2 ∈ R die beiden Lösungen der quadratischen Gleichung. Entdeckt man den
Zweiklammeransatz nicht auf Anhieb, so lassen sich x1 und x2 via Mitternachtsformel finden:
√
−b ± b2 − 4ac
x1/2 =
2a
Darin ist der Ausdruck unter der Wurzel die sogenannte Diskriminante D = b2 − 4ac. Durch
das ± im Zähler entstehen die beiden Lösungen. Die Parabel, also der Funktionsgraph zu f (x),
schneidet die x-Achse zweimal, eben bei den beiden Nullstellen x1 und x2 (vgl. Abb. 41).
Eine Lösung: Verschwindet die Diskriminante, D = 0, so fallen die beiden Lösungen x1 und x2
zusammen. Die Faktorisierung von f (x) entspricht dann der zweiten binomischen Formel:
f (x) = ax2 + bx + c = a(x − x1 )2 = 0
mit
z1 = −
b
2a
Graphisch betrachtet sitzt dann der Scheitelpunkt der Parabel zu f (x) auf der x-Achse.
Keine Lösung: f (x) = ax2 + bx + c lässt sich nicht faktorisieren. D.h. es gibt keinen Zweiklammeransatz f (x) = a(x − x1 )(x − x2 ) mit a, x1 , x2 ∈ R. Damit einher geht, dass die Diskriminante
D = b2 − 4ac einen negativen Wert annimmt und somit in der Mitternachtsformel unter der
Wurzel eine negative Zahl steht, was innerhalb der reellen Zahlen eben zu keiner Lösung führt.
In diesem Fall schneidet die Parabel die x-Achse nicht.
Abbildung 41: Die Lösungen quadratischer Gleichungen entsprechen den Nullstellen von Parabeln.
Daher gibt es Fälle mit zwei, einer oder keiner Lösung.
85
Komplexe Quadratische Gleichungen
Betrachten wir die Angelegenheit nun im Komplexen:
f (z) = az 2 + bz + c = 0
mit
a, b, c, z ∈ C
Neu ist nicht nur, dass die Variabel z komplex ist. Auch die Koeffizienten a, b, c dürfen im allgemeinen
Fall komplex sein. Und nun kommt die klare Aussage dazu:
Im Komplexen gibt es zu jeder quadratischen Gleichung stets zwei
Lösungen z1 und z2 , die als Spezialfall zusammenfallen können.
D.h., f (z) lässt sich im Komplexen immer in zwei Klammern faktorisieren, also in Nullstellenform
bringen:
f (z) = az 2 + bz + c = a(z − z1 )(z − z2 ) = 0
mit z1 , z2 ∈ C
z1 und z2 lassen sich nach wie vor durch die Mitternachtsformel bestimmen:
√
−b ± b2 − 4ac
z1/2 =
2a
Die Wurzel der Diskriminante kann innerhalb von C auf jeden Fall gezogen werden, sodass sicher
√
zwei Lösungen existieren. Allerdings haben wir gelernt, dass die Wurzelschreibweise a aus Gründen
der Eindeutigkeit für positive, reelle Zahlen a ∈ R+
0 reserviert ist. Wir schreiben daher korrekter:
z1/2 =
−b + w1/2
2a
wobei w1/2 die Lösungen von
w2 = D = b2 − 4ac
sind
Im Spezialfall D = 0 resp. w = 0 fallen die beiden Lösungen immer noch zusammen, dann gibt es
auch innerhalb von C nur eine einzige Lösung und die Faktorisierung der quadratischen Funktion
lautet:
f (z) = a(z − z1 )2
Beispiel 1: Starten wir mit reellen Koeffizienten. Wir interessieren uns für die Faktorisierung von:
f (z) =
1 2
z − 3z + 9
2
Diese quadratische Funktion kann im Reellen nicht faktorisiert werden, weil D = b2 − 4ac =
32 − 4 · 12 · 9 = −9. Im Komplexen ist nun allerdings:
w2 = D = −9
⇒
w1/2 = ±3i
Als Lösungen von f (z) = 0 ergeben sich damit (siehe Abb. 42):
z1/2 =
−b + w1/2
3 ± 3i
=
= 3 ± 3i
2a
2 · 21
Und damit lautet die Faktorisierung von f (z):
f (z) =
1 2
1
1
z − 3z + 9 = (z − z1 )(z − z2 ) = (z − 3 + 3i)(z − 3 − 3i)
2
2
2
Sie können durch Ausmultiplizieren selber überprüfen, dass dies so korrekt ist. Dazu ein Tipp:
Die beiden Klammern haben eine binomische Form (a + b)(a − b) mit a = z − 3 und b = 3i.
Beim Ausmultiplizieren lohnt sich es sich daher die dritte binomische Formel auszunützen:
(a + b)(a − b) = a2 − b2
86
Beispiel 2: Jetzt betrachten wir eine Funktion mit komplexem konstanten Term c = 2 + 2i
f (z) =
1 2
z − 2z + 2 + 2i
2
Wir berechnen die Diskriminante und wandeln sie in Polarkoordinaten um:
1
· (2 + 2i) = 4 − 4 − 4i = −4i (rein imaginär)
2
π
π
Polarkoordinaten: |D| = 4 und δ = −
⇒ D = 4 e−i 2
2
D = b2 − 4ac = 22 − 4 ·
⇒
Nun folgt für die Wurzeln der Diskriminante und daraus für die Lösungen von f (z) = 0:
−i π4 +π
−i π4
−i π4
w1 = 2 e
eiπ = −w1
und w2 = 2 e
= 2| e{z
} · |{z}
= w1
z1/2 =
−i π4
−b + w1/2
−b ± w1
2 ± 2e
=
=
2a
2a
2 · 12
=−1
π
= 2 ± 2 e−i 4
In der komplexen Ebene liegen sich die beiden Lösungen somit gegenüber auf einem Kreis mit
Radius 2 rund um die Zahl 2 auf der reellen Achse (vgl. Abb. 42). Für die faktorisierte Form
von f (z) können wir schreiben:
π
π
1
f (z) =
z − 2 − 2 e−i 4 z − 2 + 2 e−i 4
2
Zur Übung sollten Sie sich davon überzeugen, dass Sie durch Ausmultiplizieren wieder den
anfänglichen Ausdruck für f (z) erhalten.
Natürlich lassen sich die Lösungen auch in kartesischen Koordinaten schreiben, z.B. für z1 :
√ !
√
−π −π √
√
2
2
−i π4
= 2 + 2 cos
z1 = 2 + 2 e
+ i sin
=2+ 2−i 2
−i
=2+2
4
4
2
2
Abbildung 42: Die komplexen Lösungen zu den beiden Beispielen quadratischer Gleichungen: Die
beiden Lösungen können (mit Ausnahme des Zusammenfallens in einem Punkt) stets als gegenüberliegende Punkte auf einem Kreis aufgefasst werden. Der Kreis muss seinen Mittelpunkt aber nicht
notwendigerweise auf seiner reellen Achse haben, wie man hier eventuell denken könnte.
87
5.6.4
Darstellung komplexer Funktionen
Bitte bemerken Sie: Anders als Abb. 41 zeigt Abb. 42 keine Funktionsgraphen! Das Einzige, was zu
sehen ist, sind zwei komplexe Zahlen (= Punkte in der komplexen Ebene), die Null ergeben, wenn
man sie in die jeweilige quadratische Funktion f (z) einsetzt.
Die graphische Veranschaulichung komplexer Funktionen ist nicht mehr so einfach möglich. Unser
altes f (x) = ax2 + bx + c (mit a, b, c, x ∈ R) beschreibt eine Abbildung von R nach R, also von
einer eindimensionalen auf eine eindimensionale Zahlenmenge. Wir schreiben:
f :R→R
Damit lässt sich f (x) auf einem Blatt Papier gut darstellen. Jedem x auf einem ersten, horizontal
liegenden, reellen Zahlenstrahl (x-Achse) wird ein Wert y auf einem zweiten, vertikal verlaufenden,
reellen Zahlenstrahl (y-Achse) zugeordnet. So entstehen die Ihnen bekannten Funktionsgraphen.
Bei einer komplexen Funktionen wird hingegen jedem Punkt z in der Gauss’schen Zahlenebene
ein komplexer Funktionswert f (z) zugeordnet, der wiederum als Punkt irgendwo in der komplexen Ebene liegt. f (z) ist somit eine Abbildung von der zweidimensionalen Zahlenmenge C auf die
zweidimensionale Zahlenmenge C:
f :C→C
Das macht die Darstellung der komplexen Funktion als Ganzes unmöglich. Sie lässt sich nur eingeschränkt darstellen. Z.B. kann man das Abbild einer bestimmten Teilmenge darstellen.
In Abb. 43 werden sämtliche Punkte in der komplexen Ebene links mittels der Funktion f (z) =
1 2
z
− 2z + 2 + 2i auf Punkte in der komplexen Ebene rechts abgebildet. Um eine Ahnung zu bekom2
men, was dabei so alles passiert, betrachten wir die Abbildungen einzelner Punkte oder Punktstränge
von der linken in die rechte Graphik:
π
Nullstellen z1 und z2 : Die Nullstellen von f (z) lauten immer noch: z1/2 = 2 ± 2 e−i 4 . D.h., die
beiden Punkte z1 und z2 links werden rechts auf den Ursprung 0 abgebildet.
Punkt/Zahl A: Der komplexen Zahl A = 1 − 2i wird folgender Bildpunkt A′ zugeordnet:
A′ = f (A) =
1 2
1
3
A − 2A + 2 + 2i = (1 − 2i)2 − 2(1 − 2i) + 2 + 2i = . . . = − + 4i
2
2
2
Gerade g: Die Gerade g verläuft links in Abb. 43 durch die Nullstelle z1 . Demzufolge durchquert
das Abbild g′ dieser Gerade rechts genau einmal den Nullpunkt 0. Interessanterweise besitzt
g ′ die Form einer Parabel.
Kreis c: Der Kreis c links wurde so gewählt, dass die beiden Nullstellen z1 und z2 auf ihm liegen.
Das bedeutet, sein Abbild c′ muss rechts zweimal durch den Ursprung 0 verlaufen.
Wir sehen, was für eine “lustige” Kurve entsteht. Sie schliesst sich – wie das beim Kreis ja
auch der Fall ist – macht aber in gewisser Weise zwei Umläufe.
Um noch besser zu sehen, was durch f (z) wie von links nach rechts abgebildet wird, sind
die obere und die untere Kreishälfte unterschiedlich eingefärbt und diese Farben sind nach
rechts übertragen. Jeder Halbkreis enthält eine der beiden Nullstellen. Demnach erfolgt der
0-Durchgang rechts einmal in Blau und einmal in Rot.
Normalparabel q: Schliesslich habe ich links noch eine Parabel (alle Zahlen z = x + iy mit x2 = y)
eingetragen. Wir sehen das hübsch geschwungene Abbild q ′ davon rechts.
Die Gerade g wurde übrigens genau so gelegt, dass sie eine Tangente an die Parabel q ist.
Es gibt also einen Berührungspunkt S. Dessen Abbild S ′ ist auch auf der rechten Seite ein
Berührungspunkt zwischen q ′ und g′ .
88
Abbildung 43: Komplexe Abbildungen: Jede Funktion f (z) weist einer komplexen Zahl z eine andere
komplexe Zahl f (z) zu. Da es sich bei z und f (z) je um einen Punkt in der Gauss’schen Zahlenebene
handelt, ist eine Darstellung der Funktion insgesamt nicht möglich. Allerdings lassen sich die Abbilder
einzelner Punkte oder Kurven betrachten.
5.6.5
Der Fundamentalsatz der Algebra
Wie Sie aufgrund des obigen – noch relativ einfachen – Beispiels der komplexen Funktion f (z) =
1 2
2 z − 2z + 2 + 2i bereits erahnen können, dürfte die Untersuchung komplexer Funktionen resp.
Abbildungen ein spannenderes und grösseres Gebiet der Mathematik sein. Man nennt es komplexe Analysis oder Funktionentheorie. Damit werden wir uns allerdings nicht vertieft beschäftigen
können, obwohl die daraus gewonnen Erkenntnisse und neuen Methoden sehr toll sind. Eine der
wichtigsten Aussagen wollen wir aber nicht unerwähnt lassen:
Fundamentalsatz der Algebra
Gegeben sei eine (komplexe) Polynomfunktion n-ten Grades fn (z) mit
Koeffizienten a0 , . . . , an ∈ C:
fn (z) = an z n + an−1 z n−1 + . . . + a2 z 2 + a1 z + a0
Der Fundamentalsatz der Algebra besagt, dass jedes beliebige solche
fn (z) in genau n Klammern faktorisiert werden kann:
fn (z) = an (z − z1 )(z − z2 ) · . . . · (z − zn )
D.h., fn (z) besitzt genau n Nullstellen z1 , z2 , . . . , zn ∈ C, von denen
allerdings mehrere oder sogar alle identisch sein können.
Ohne Beschränkung der Allgemeinheit (O.B.d.A.) können wir also sagen,
dass die Gleichung fn (z) = 0 im Komplexen stets n Lösungen hat.
Wir verzichten auf den Beweis dieses Satzes, nehmen aber zur Kenntnis, dass wir damit z.B. verstehen, weshalb die Gleichung z n = 1 gerade n verschiedene Einheitswurzeln liefert. So hat das
Polynom fn (z) = z n − 1 eben n verschiedene Nullstellen. Z.B. ist für n = 3:
2π
4π
z 3 = 1 ⇒ f3 (z) = z 3 − 1 = 0 ⇒ f3 (z) = (z − 1) z − ei 3
z − ei 3 = 0
Dass diese Faktorisierung korrekt ist, können Sie via Ausmultiplizieren selber überprüfen!
89
5.6.6
Die trigonometrischen Additionstheoreme
Hier folgt ein Paradebeispiel dafür, wie toll sich manche reellen Zusammenhänge mit dem Umweg
über das Komplexe behandeln lassen. Es geht um die Herleitung der sogenannten trigonometrischen
Additionstheoreme.
Für manche Zwecke – in der Physik z.B. für das Verständnis sich überlagernder Schallwellen in
der Akustik – wäre es praktisch die Sinus- oder die Cosinusfunktion einer Summe zweier Winkel in
Funktionen der Einzelwinkel zu zerlegen. Wir möchten also wissen, wie sich sin(α+β) und cos(α+β)
als Kombination von sin α, cos α, sin β und cos β schreiben lassen.
Das scheint nicht ganz trivial zu sein! Abb. 44 zeigt die verschiedenen involvierten Grössen.
Gibt es da überhaupt einen Zusammenhang? Die Antwort lautet: Ja! Und er liesse sich durchaus
im Reellen herleiten, aber der Weg über das Komplexe ist nun so wunderbar einfach, dass es eine
Schande wäre ihn nicht zu benutzen!
Zunächst stellen wir unter Verwendung der Euler-Darstellung fest:
ei(α+β) = cos(α + β) + i sin(α + β)
| {z }
| {z }
=Re ei(α+β)
=Im ei(α+β)
Andererseits gilt bei der Multiplikation von Potenzen mit gleicher Basis aber eben auch:
ei(α+β) = eiα · eiβ = (cos α + i sin α)(cos β + i sin β)
= cos α cos β + i cos α sin β + i sin α cos β + i2 sin α sin β
= cos α cos β − sin α sin β + i (cos α sin β + sin α cos β)
{z
}
|
|
{z
}
=Re ei(α+β)
=Im ei(α+β)
Nun vergleichen wir die beiden Ausdrücke für ei(α+β) . Weil Realteil und Imaginärteil einer bestimmten
komplexen Zahl eindeutig sind, müssen sie in beiden Ausdrücken übereinstimmen. Dies ist einmal
mehr der Identifikationstrick von Seite 69. Daraus folgen sofort die beiden Additionstheoreme
für die Cosinus- und die Sinusfunktion:
cos(α + β) = cos α cos β − sin α sin β
sin(α + β) = cos α sin β + sin α cos β
(68)
Abbildung 44: Welche Grössen werden durch die Additionstheoreme miteinander verknüpft?
90
Unter Verwendung der Symmetrieeigenschaften cos(−α) = cos α und sin(−α) = − sin α lassen
sich diese beiden Additionstheoreme auch für Winkeldifferenzen umschreiben:
cos(α − β) = cos α cos β + sin α sin β
sin(α − β) = cos α sin β − sin α cos β
(69)
Die trigonometrischen Additionstheoreme sind immer wieder nützlich. Insbesondere lassen sich aus
ihnen auch die sogenannten Doppelwinkelformeln ableiten:
cos(2α) = cos2 α − sin2 α
(70)
sin(2α) = 2 sin α cos α
Die Cosinusformel kann unter der Verwendung des trigonometrischen Pythagoras sin2 α+cos2 α = 1
noch weiter umgeformt werden, sodass darin wahlweise nur noch cos2 α oder sin2 α auftritt:
cos(2α) = cos2 α − sin2 α = (1 − sin2 α) − sin2 α = 1 − 2 sin2 α
cos(2α) = cos2 α − sin2 α = cos2 α − (1 − cos2 α) = 2 cos2 α − 1
resp.
(71)
Daraus folgt weiter:
sin2 α =
1 1
− cos(2α)
2 2
und
cos2 α =
1 1
+ cos(2α)
2 2
(72)
sin2 α und cos2 α sind also selber wieder Cosinuskurven, allerdings mit halber Wellenlänge, denn
diese wird durch den Faktor 2 im Argument der Cosinusfunktion halbiert (vgl. Abb. 45).
Diese Umformungen ermöglichen uns beispielsweise beim Integrieren die Stammfunktionen von
sin2 α und von cos2 α zu bestimmen.
Abbildung 45: Die Graphen der Funktionen cos2 x und sin2 x sind selber wieder Cosinusfunktionen,
die mit Amplitude 12 , aber doppelt so “schnell” um die mittlere Höhe y = 12 schwanken.
91
5.6.7
Cosinus- und Sinusfunktion als Linearkombinationen von eiϕ und e−iϕ
Für eine Zahl z auf dem Einheitskreis in der Gauss’schen Zahlenebene und ihr konjugiert Komplexes
z ∗ gilt gemäss der Euler-Gleichung (64) bekanntlich:
z = eiϕ = cos ϕ + i sin ϕ
z ∗ = e−iϕ = cos ϕ − i sin ϕ
und
eiϕ und e−iϕ lassen sich also mittels geeigneter Koeffizienten ci ∈ C als Summe von cos ϕ und sin ϕ
darstellen:
eiϕ = c1 · cos ϕ + c2 · sin ϕ
e−iϕ = c3 · cos ϕ + c4 · sin ϕ
mit c1 = 1
und
c2 = i
mit c3 = 1
und
c4 = −i
Weil diese Summendarstellung möglich ist, sagen wir in der Sprache der höheren Algebra: “Die
Funktionen eiϕ und e−iϕ sind Linearkombinationen der beiden Funktionen cos ϕ und sin ϕ.” Der
Wortteil “linear” kommt daher, dass cos ϕ und sin ϕ in diesen beiden Summen nur mit Potenz 1
auftreten, dass also keine Terme mit sin2 ϕ oder cos5 ϕ, etc. benötigt werden.
In die umgekehrte Richtung überlegen wir uns:
eiϕ + e−iϕ = cos ϕ + i sin ϕ + cos(−ϕ) + i sin(−ϕ)
= cos ϕ + i sin ϕ + cos ϕ − i sin ϕ = 2 cos ϕ
Dabei haben wir ausgenutzt, dass die Cosinusfunktion achsensymmetrisch und die Sinusfunktion
punktsymmetrisch ist: cos(−ϕ) = cos ϕ und sin(−ϕ) = − sin ϕ. Es folgt:
cos ϕ =
1 iϕ 1 −iϕ eiϕ + e−iϕ
e + e
=
2
2
2
Analog finden wir:
eiϕ − e−iϕ = . . . = 2i sin ϕ
⇔
sin ϕ =
1 iϕ
1
eiϕ − e−iϕ
e − e−iϕ =
2i
2i
2i
cos ϕ und sin ϕ lassen sich also ebenso als Linearkombinationen von eiϕ und e−iϕ darstellen.
Graphisch ist der Zusammenhang übrigens leicht nachzuvollziehen. Erinnern wir uns daran, dass
die Addition zweier komplexer Zahlen in der Gauss’schen Zahlenebene dem Aneinanderhängen zweier
Pfeile entspricht, so führt uns eiϕ + e−iϕ auf die reelle Achse an den Ort 2 cos ϕ und eiϕ − e−iϕ auf
die imaginäre Achse an den Ort 2i sin ϕ, wie Abb. 46 veranschaulicht.
Halten wir dieses wichtige Resultat nochmals ganz explizit fest:
Euler-Schreibweisen für cos ϕ und sin ϕ
Cosinus- und Sinusfunktion lassen sich als Linearkombinationen von eiϕ und
dessen konjugiert Komplexen e−iϕ schreiben:
cos ϕ =
eiϕ + e−iϕ
2
und
sin ϕ =
eiϕ − e−iϕ
2i
(73)
Wir wollen uns diese Beziehungen unter dem (inoffiziellen) Namen EulerSchreibweisen von cos ϕ und sin ϕ merken, weil sie direkt aus der EulerGleichung eiϕ = cos ϕ + i sin ϕ folgen.
92
Abbildung 46: Die Summe und die Differenz von eiϕ und e−iϕ führen einerseits auf die reelle Achse
zur Stelle 2 cos ϕ, andererseits auf die imaginäre Achse zur Stelle 2i sin ϕ.
Die Euler-Schreibweisen für cos ϕ und sin ϕ sind ab und zu extrem praktisch. So lassen sich
aus manchmal unhandlichen trigonometrischen Ausdrücken rasch komplexe Exponentialausdrücke
gewinnen, mit denen das Rechnen aufgrund der Potenzgesetze leichter fällt. Beispiele gefällig?
Beispiel 1: Wie lässt sich das Produkt cos ϕ sin ϕ zusammenfassen/vereinfachen?
Wenn Sie sich an die Additionstheoreme erinnern, kennen Sie die Antwort bereits. Die Doppelwinkelformel für die Sinusfunktion lautet: sin(2ϕ) = 2 cos ϕ sin ϕ. Somit müssen wir finden:
cos ϕ sin ϕ = 12 sin(2ϕ). Und davon können wir uns nun eben in wenigen Schritten überzeugen:
eiϕ + e−iϕ eiϕ − e−iϕ
ei2ϕ − 1 + 1 − e−i2ϕ
·
=
2
2i
2 · 2i
i2ϕ
−i2ϕ
1 e −e
1
= ·
= sin(2ϕ)
2
2i
2
cos ϕ sin ϕ =
Beispiel 2: Sie haben schon seit jeher gelernt, dass die Ableitung der Sinusfunktion die Cosinusfunktion ist. Mit der Euler-Schreibweise zeigt man das ganz rasch:
d eiϕ − e−iϕ
eiϕ + e−iϕ
ieiϕ − (−i)e−iϕ
d
(sin ϕ) =
=
= cos ϕ
=
dϕ
dϕ
2i
2i
2
Beachten Sie: Die Kettenregel erzeugt bei der Ableitung von e±iϕ die Faktoren ±i!
An dieser Stelle sei zudem ganz explizit darauf hingewiesen, dass die Ableitungsregeln im
Komplexen ganz genau gleich funktionieren wie im Reellen! Grund dafür ist einmal mehr,
dass die komplexen Zahlen C zusammen mit Addition und Multiplikation einen vollständigen
Zahlenkörper bilden.
93
5.6.8
Der harmonische Oszillator im Komplexen
Zum Schluss von Abschnitt 4.4.3 hatten wir auf Seite 44 nochmals die DGL für den klassischen,
harmonischen Oszillator (z.B. Federpendel) notiert:
x′′ = −ω 2 x
mit
ω2 =
D
m
Diese DGL wollen wir nun unter Verwendung komplexer Zahlen erneut lösen, allerdings mit einem
anderen Lösungsansatz. Die zweite Ableitung x′′ soll der gesuchten Ortsfunktion x(t) bis auf den
Vorfaktor −ω 2 entsprechen. Dann müsste eine Exponentialfunktion x(t) = C · eλt doch ein brauchbarer Ansatz sein, denn Exponentialfunktionen bleiben beim Ableiten als solche erhalten. Wir setzen
also neu an:
x(t) = C · eλt
mit
x′ (t) = λC · eλt = λx(t)
und
x′′ (t) = λ2 C · eλt = λ2 x(t)
Durch Einsetzen in die DGL folgern wir:
x′′ = λ2 x = −ω 2 x
⇒
λ2 = −ω 2
(74)
q
D
Dabei ist ω = m
eine positive reelle Zahl. Innerhalb der reellen Zahlen wären wir hier am Ende
einer Sackgasse angelangt, denn (74) besitzt ganz offensichtlich keine reellen Lösungen λ ∈ R.
Lassen wir für λ nun allerdings auch komplexe Werte zu, so lösen wir munter weiter:
λ = ±iω
Immer noch handelt es sich um eine DGL zweiter Ordnung, sodass wir bei der Angabe der allgemeinen
Lösung zwei Koeffizienten C1 und C2 einzufügen haben:
x(t) = C1 eiωt + C2 e−iωt
mit
x′ (t) = iω C1 eiωt − C2 e−iωt
Die Koeffizienten C1 und C2 dürfen nun aber auch komplex sein! Da sich cos(ωt) und sin(ωt) gemäss
(73) als Linearkombinationen von eiωt und e−iωt schreiben lassen, deckt unsere neue allgemeine
Lösung den genau gleichen Lösungsraum ab wie die Alte (Gleichung (42) auf Seite 44):
x(t) = A1 cos(ωt) + A2 sin(ωt)
Im Prinzip hätten wir damals auch für A1 und A2 komplexe Werte zulassen dürfen. Da aber die
Ortsfunktion x(t) zum Federpendel für alle Zeiten t reell sein muss, wären dadurch nur unbrauchbare,
weil komplexe Lösungen hinzugekommen, denn cos(ωt) und sin(ωt) sind selber ja reell.
Bringen wir das Beispiel noch rasch zuende: Die Randbedingungen unseres Federpendels waren
x(0) = A und v(0) = x′ (0) = 0. Daraus erhalten wir:
C e0 + C e0 = C + C = A
x(0) =! A A
2
1
2
1
⇒
⇒ C1 = C2 =
0
0
!
iω C1 e − C2 e = iω(C1 − C2 ) = 0 x′ (0) = 0 2
Damit lautet unsere an die RBs angepasste Lösung:
x(t) =
A iωt A −iωt
eiωt + e−iωt
e + e
=A·
= A cos(ωt)
2
2
2
Und somit sind wir bei der genau gleichen Lösung wie in (42) auf Seite 44 gelandet.
Im Moment mag Ihnen diese komplexe Vorgehensweise eher schwieriger erscheinen. In der Quantenmechanik geht es bei der Lösung von DGLs in der Regel aber um die Bestimmung einer grundsätzlich komlexwertigen Wellenfunktion Ψ (x, t)! Erst das Betragsquadrat |Ψ |2 = Ψ ∗Ψ muss reell sein,
was aber für Beträge ohnehin der Fall ist. Und im Zusammenhang mit dieser Wellenfunktion werden
wir Ausdrücke wie eiωt sehr schätzen lernen.
94
Literatur
[1] Griffiths, David J. (2012). Quantenmechanik, Lehr- und Übungsbuch (2., aktualisierte Auflage).
Hallbergmoos: Pearson Deutschland GmbH.
[2] Otto, Markus (2011). Rechenmethoden für Studierende der Physik im ersten Jahr
(Nachdruck 2013). Heidelberg: Spektrum Akademischer Verlag.
[3] Gertsch, Alex (2013). Theorie-Dossier “Mechanik”. Zürich.
[4] Gertsch, Alex (2015). Schwingungen und Wellen – Kurztheorie. Zürich.
[5] Beweis der Irrationalität der Wurzel aus 2 bei Euklid. 3.2016. Wikipedia:
https://de.wikipedia.org/wiki/Beweis der Irrationalität der Wurzel aus 2 bei Euklid
(Abruf: 20.4.2016)
[6] Deller, Henri, Gebauer, Peter & Zinn, Jörg (2000). Algebra 3, Aufgaben, Ergebnisse. Zürich:
Orell Füssli Verlag AG.