MATHEMATISCHE & PHYSIKALISCHE ZUSÄTZE ZUM ERGÄNZUNGSFACH “QUANTEN- UND ATOMPHYSIK” Promotion 145 A. Gertsch Zürich im August 2016 Inhaltsverzeichnis 1 Differenziation – Altes und Neues zur Ableitung 1.1 Die Ableitung als Steigung der Tangente an einen Funktionsgraphen 1.2 Die Ableitungsdefinition alt und neu betrachtet . . . . . . . . . . . 1.3 Repetition: Ein explizites Beispiel zur Ableitungsdefinition . . . . . . 1.4 Allgemeine Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . 1.5 Ableitungen elementarer Funktionen . . . . . . . . . . . . . . . . . 1.6 Das infinitesimale Verständnis: Im unendlich Kleinen ist alles linear! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 4 5 5 6 2 Altes und Neues zur Integration 2.1 Der Hauptsatz der Differenzial- und Integralrechnung . . . . . . . . . . . 2.1.1 Das bestimmte Integral als Fläche unter einem Funktionsgraphen 2.1.2 Der eigentliche Hauptsatz . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Der Beweis des Hauptsatzes . . . . . . . . . . . . . . . . . . . . 2.1.4 Physikalische Saloppheit . . . . . . . . . . . . . . . . . . . . . . 2.1.5 Rechtecksflächen und Integralnotation . . . . . . . . . . . . . . . 2.1.6 Negative Integralwerte . . . . . . . . . . . . . . . . . . . . . . . 2.1.7 Unbestimmtes Integral, Integrationskonstante und Flächenfunktion 2.1.8 Das bestimmte Integral als Veränderung einer Grösse . . . . . . . 2.2 Allgemeine Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Auswahl unbestimmter Integrale . . . . . . . . . . . . . . . . . . . . . . 2.4 Integrationstechniken . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Symmetrien erkennen und ausnutzen . . . . . . . . . . . . . . . . 2.4.2 Erkennen äusserer und innerer Ableitungen . . . . . . . . . . . . . 2.4.3 Lineare Substitution . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.4 Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Spezielle bestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 7 7 8 10 10 12 13 14 15 15 16 16 18 19 22 23 24 3 Differenzialgleichungen – ein fundamental neuer Gleichungstyp 3.1 Was ist eine Differenzialgleichung (DGL)? . . . . . . . . . . . . . . . . . . . . 3.2 Erste Beispiele von DGLs (ohne physikalischen Kontext) . . . . . . . . . . . . 3.2.1 Stammfunktionen bestimmen . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Sinus- und Cosinusfunktion . . . . . . . . . . . . . . . . . . . . . . . . 3.2.4 Lineare, inhomogene DGL 2. Ordnung: . . . . . . . . . . . . . . . . . 3.3 Funktionen mit mehreren Variablen und partielle Ableitungen . . . . . . . . . . 3.3.1 Die Notation partieller Ableitungen . . . . . . . . . . . . . . . . . . . . 3.3.2 Weshalb verwendet man für partielle Ableitungen eine andere Notation? 3.3.3 Unser zentrales Beispiel: Wellenfunktion und Schrödingergleichung . . . 3.4 Differenzialoperatoren und mehrfache Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 25 27 27 27 28 30 30 30 31 31 32 . . . . . . . . 33 33 36 38 39 39 39 40 44 4 Die 4.1 4.2 4.3 4.4 klassische Mechanik – eine differenzielle Theorie Kinematik und Differentialrechnung . . . . . . . . . . . . . . Kinematik und Integralrechnung . . . . . . . . . . . . . . . . Das 2. Newton’sche Axiom als Differenzialgleichung . . . . . . Beispiele zu Kraftgesetzen und daraus folgenden DGLs für x(t) 4.4.1 Freier Fall an der Erdoberfläche . . . . . . . . . . . . . 4.4.2 Fallen mit Luftwiderstand . . . . . . . . . . . . . . . . 4.4.3 Der klassische, ungedämpfte harmonische Oszillator . . 4.4.4 Gravitationsgesetz im Eindimensionalen . . . . . . . . ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 4.6 4.4.5 Beispiel für eine explizit von der Zeit abhängige Kraft . . . . . . . . . . . Konservative Kräfte, Aktionsprinzip und Energieerhaltung . . . . . . . . . . . . . 4.5.1 Das Potenzial V (x, t) – ein allgemeinerer Blick auf die potenzielle Energie 4.5.2 Beispiele von Potenzialen und zugehörigen konservativen Kräften . . . . . 4.5.3 Energieerhaltung – das Aktionsprinzip mit konservativen Kräften . . . . . Repetition/Ergänzung: Der klassische, ungedämpfte harmonische Oszillator . . . 4.6.1 Zwei wichtige Eigenschaften des klassischen harmonischen Oszillators . . 5 Komplexe Zahlen C 5.1 Althergebrachte Zahlenmengen . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Natürliche Zahlen N und ganze Zahlen Z . . . . . . . . . . . . . . . 5.1.2 Die rationalen Zahlen Q . . . . . . . . . . . . . . . . . . . . . . . . 5.1.3 Irrationale Zahlen I . . . . . . . . . . . . . .√. . . . . . . . . . . . . 5.1.4 Ein vielzitierter Beweis: Die Irrationalität von 2 . . . . . . . . . . . 5.1.5 Die reellen Zahlen R . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Die reellen Zahlen R als mathematischer Körper . . . . . . . . . . . . . . . . 5.2.1 Die neun Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Anmerkungen zu Körpern und zu den Körperaxiomen . . . . . . . . . 5.3 Die Menge der komplexen Zahlen C . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Definition der komplexen Zahlen und Gauss’sche Zahlenebene . . . . 5.3.2 Komplexe Konjugation . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Rechenregeln – die komplexen Zahlen C als Zahlenkörper . . . . . . . . . . . 5.4.1 Ein näherer Blick auf die Addition komplexer Zahlen . . . . . . . . . 5.4.2 Ein näherer Blick auf die Multiplikation komplexer Zahlen . . . . . . 5.4.3 Der Betrag einer komplexen Zahl . . . . . . . . . . . . . . . . . . . . 5.4.4 Division: Bruchrechnen mit komplexen Zahlen . . . . . . . . . . . . . 5.4.5 Die imaginäre Einheit i und ihre Potenzen . . . . . . . . . . . . . . . 5.4.6 Überprüfung der Körperaxiome . . . . . . . . . . . . . . . . . . . . . 5.5 Komplexe Zahlen in Polarkoordinaten, Euler-Gleichung und Euler-Darstellung 5.5.1 Polarkoordinaten in der komplexen Ebene . . . . . . . . . . . . . . . 5.5.2 Euler-Gleichung und Euler-Darstellung komplexer Zahlen . . . . . . . 5.5.3 Repetition der Potenzgesetze . . . . . . . . . . . . . . . . . . . . . . 5.5.4 Das Verständnis der komplexen Multiplikation . . . . . . . . . . . . . 5.6 Weitere Zusammenhänge und erste Anwendungen mit komplexen Zahlen . . 5.6.1 Die Gleichung z n = 1 und die n-ten Einheitswurzeln . . . . . . . . . 5.6.2 Mehr vom Wurzelziehen im Komplexen . . . . . . . . . . . . . . . . 5.6.3 Quadratische Gleichungen im Komplexen . . . . . . . . . . . . . . . 5.6.4 Darstellung komplexer Funktionen . . . . . . . . . . . . . . . . . . . 5.6.5 Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . 5.6.6 Die trigonometrischen Additionstheoreme . . . . . . . . . . . . . . . 5.6.7 Cosinus- und Sinusfunktion als Linearkombinationen von eiϕ und e−iϕ 5.6.8 Der harmonische Oszillator im Komplexen . . . . . . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 49 49 52 53 55 55 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 57 57 58 58 59 60 61 61 62 64 64 64 65 66 67 68 69 71 71 72 72 75 76 76 79 79 82 85 88 89 90 92 94 1 1.1 Differenziation – Altes und Neues zur Ableitung Die Ableitung als Steigung der Tangente an einen Funktionsgraphen Wir repetieren: Bei gegebener Funktion f (x) können Sie mittels Ableitungsregeln die Ableitungsfunktion f ′ (x) bestimmen. Für den Funktionsgraphen haben der Funktionswert f (x) und der Wert der Ableitung f ′ (x) an der Stelle x anschauliche Bedeutungen (vgl. Abb. 1): Funktionswert f (x): Geben wir uns eine bestimmte Stelle x auf der x-Achse vor, so beschreibt f (x), auf welcher y-Höhe der Graph an dieser Stelle x vorbeikommt: y = f (x). ⇒ “Jeder Punkt P auf dem Graphen von f hat die Koordinaten P x, f (x) .” Wert der Ableitung f ′ (x): Salopp wird die Ableitung häufig als Steigung des Funktionsgraphen bezeichnet. Genauer ist die Formulierung: Die Ableitung f ′ (x)steht für die Steigung mt der Tangente t an den Funktionsgraphen im Punkt P x, f (x) , also: mt = f ′ (x). ⇒ “Ableiten resp. Differenzieren heisst Steigungen berechnen.” Bei Optimierungsfragen, d.h. für die Suche nach den Maxima oder Minima einer Funktion, ist das Verständnis der Ableitung als Steigung des Funktionsgraphen sehr nützlich. Eine Stelle x kann nur dann zu einem lokalen Maximum von f (= Kuppe im Graphen) gehören, wenn dort die Steigung gleich 0 ist, also die Ableitung verschwindet. Die Lösungen x der Gleichung f ′ (x) = 0 sind Kandidaten für lokale Maximalstellen. Mit weiteren Betrachtungen lässt sich herausfinden, ob es sich tatsächlich um ein Maximum, oder sonst um ein Minimum oder einen Sattelpunkt handelt, etc. Abbildung 1: Die graphische Bedeutung von Funktionswert f (x) und Ableitung f ′ (x). 1.2 Die Ableitungsdefinition alt und neu betrachtet Neben dem hilfreichen Bild der Ableitung als Steigung ist für unsere weiteren Betrachtungen vor allem das folgende Verständnis zentral: “Die Ableitung f ′ (x) beschreibt, wie sehr sich der Funktionswert f (x) an der Stelle x am verändern ist.” Je grösser die Ableitung f ′ (x) ist, desto steiler ist der Graph über dieser Stelle x und desto stärker ist sich dort der Funktionswert f (x) am verändern. An einer steilen Stelle (grosses f ′ (x)) bewirkt bereits eine geringe Veränderung der Variable x eine grosse Veränderung des Funktionswertes f (x). 1 Dieses Verständnis wollen wir weiter vertiefen, indem wir die Ihnen bereits bekannte Definition der Ableitung nochmals unter die Lupe nehmen. Dabei lernen Sie auch gerade die in der höheren Mathematik gängige Ableitungsschreibweise df dx kennen. Definition der Ableitung f ′ (x) einer Funktion f (x) einer Funktion f (x) ist gegeben durch den Die Ableitung f ′ (x) resp. df dx Grenzwert des Differenzenquotienten ∆f ∆x für ∆x → 0: f ′ (x) ≡ df ∆f f (x + ∆x) − f (x) ≡ lim ≡ lim dx ∆x→0 ∆x ∆x→0 ∆x (1) Dabei stehen dx und df für infinitesimale Veränderungen, also unendlich kleine Schritte der Variable x und der Funktion f (x) (an der Stelle x). Das dreifache Gleichheitszeichen “≡” steht für eine Definition resp. dafür, dass wir die beiden Objekte links und rechts davon als vollkommen identisch miteinander betrachten wollen. Erläuterungen zur Ableitungsdefinition , also die Steigung ms • Am Anfang der Ableitungsbildung steht der Differenzenquotient ∆f ∆x 1 einer Sekante s durch zwei Punkte auf dem Funktionsgraphen. Der erste Punkt P x, f (x) sitzt über der Stelle x, während der zweite Punkt Q x + ∆x, f (x + ∆x) von P aus um ∆x nach rechts verschoben ist und demnach über der Stelle x + ∆x sitzt. Somit betragen die Sekantensteigung ms resp. der Differenzenquotient ∆f ∆x (vgl. Abb. 2): ms = yQ − yP f (x + ∆x) − f (x) f (x + ∆x) − f (x) ∆f = = ≡ xQ − xP x + ∆x − x ∆x ∆x Abbildung 2: Das Steigungsdreieck an die Sekante. 1 lat. secare = schneiden ⇒ Sekante = schneidende Gerade. 2 • Lässt man ∆x immer kleiner werden, so rutscht Q auf dem Graphen immer näher an P heran. Dadurch wird die Sekante s immer mehr zur Tangente t an den Graphen im Punkt P . Die Sekantensteigung ms strebt gegen die Tangentensteigung mt . • Wie klein wollen wir ∆x werden lassen? Die Antwort lautet: Unendlich klein, aber nicht gleich 0! Für ∆x = 0 wäre nämlich die Sekantensteigung ms resp. der Differenzenquotient ∆f ∆x gar nicht mehr definiert, weil im Nenner eine 0 auftreten würde. Für jedes ∆x > 0 existiert aber ∆f ∆x . Solange ∆x > 0 ist, wird die Sekantensteigung ms bei gebogenen Funktionsgraphen nie exakt der Tangentensteigung mt entsprechen, aber für immer kleiner werdendes ∆x wird sie mt beliebig nahe kommen!2 Deshalb sagen wir: Die Tangentensteigung mt ist der Grenzwert oder eben der Limes (lim)3 , dem sich die Sekantensteigung ms für ∆x → 0 annähert: mt = lim ms (sprich: “Limes für Delta x gegen 0 von ms”) ∆x→0 • Formulieren wir dies nochmals mit der Ableitung f ′ (x) anstelle der Tangentensteigung mt und dem Differenzenquotienten ∆f ∆x anstelle der Sekantensteigung ms , so haben wir die Gleichung vor uns, die wir als Definition der Ableitung f ′ (x) ansehen wollen: ∆f ∆x→0 ∆x f ′ (x) ≡ lim • Im Grenzwert ∆x → 0 werden sowohl die Funktionswertdifferenz ∆f , wie auch der Variablenschritt ∆x unendlich klein. Ihr Verhältnis besitzt allerdings nach wie vor einen endlichen und genau bezifferbaren Wert, der sich immer mehr der Ableitung annähert. Diesen unbezifferbar klein gewordenen ∆f und ∆x sagen wir infinitesimale Veränderungen oder infinitesimale Schritte und schreiben dafür df und dx. Damit lässt sich die Ableitung ohne Limes schreiben: df ∆f ≡ ∆x→0 ∆x dx f ′ (x) ≡ lim (sprich: “df nach dx”) (2) • Und damit sind wir schliesslich bei einem neuen und sehr interessanten Verständnis der Ableitung angelangt. Durch Umstellung (Multiplikation mit dx) können wir schreiben: df = f ′ (x) · dx An der Stelle x verändert sich der Funktionswert f (x) um den infinitesimalen Schritt df , wenn sich die Variable x um den infinitesimalen Schritt dx verändert. Dabei sind df und dx proportional zueinander und die Proportionalitätskonstante an der Stelle x ist gerade f ′ (x). Somit beschreibt die Ableitung f ′ (x), wie sich die Funktion f (x) an der Stelle x gerade am verändern ist. Sie steht für das Verhältnis der infinitesimalen Veränderungen df und dx im Punkt x, f (x) . Vielleicht denken Sie nun, dass sich mit diesem “infinitesimalen Zeugs” unmittelbar “nix Gscheites” anfängen lässt, weil die infinitesimalen Veränderungen df und dx ja gar keine angebbaren Zahlenwerte besitzen, aber warten Sie nur ein bisschen ab und Sie werden sehen, wie nützlich dieses Verständnis der inifinitesimalen Schritte sein wird, z.B. bei der Integralrechnung im nächsten Kapitel. . . 2 Mathematisch exakter formuliert: Für jede noch so kleine Zahl ε > 0 kann man ∆x problemlos soweit verkleinern, dass der Unterschied zwischen ms und mt kleiner ist als diese beliebig kleine Zahl ε: |ms − mt | < ε. 3 lat. limes = Grenze. 3 1.3 Repetition: Ein explizites Beispiel zur Ableitungsdefinition 1 6 Ich möchte wissen, wie sich die Funktion f (x) = ist. D.h., ich frage nach f ′ (8). x2 − 2x + 2 an der Stelle x = 8 am verändern Variante 1: Ausführlicher Weg mittels Ableitungsdefinition Unter Verwendung der Ableitungsdefinition schreibe ich: f (x + ∆x) − f (x) ∆x→0 ∆x f ′ (x) = lim 1 6 (x + ∆x)2 − 2(x + ∆x) + 2 − ( 61 x2 − 2x + 2) ∆x→0 ∆x 1 2 2 − 2x − 2∆x + 2 − 1 x2 + 2x − 2 6 x + 2x∆x + (∆x) 6 = lim ∆x→0 ∆x = lim = lim 1 6 ∆x→0 x2 + 31 x∆x + 16 (∆x)2 − 2x − 2∆x + 2 − ∆x 1 6 x2 + 2x − 2 1 3 x∆x + 16 (∆x)2 − 2∆x ∆x→0 ∆x 1 1 x + ∆x − 2 = lim ∆x→0 3 6 = lim = 1 x−2 3 Bemerken Sie: Erst von der vorletzten zur letzten Zeile kann die Limesbildung ∆x → 0 tatsächlich ausgeführt werden. Dadurch fällt der Term 16 ∆x weg, weil er gegenüber den anderen Termen unendlich klein wird. Voraussetzung dafür ist, dass beim Übergang von der drittletzten zur zweitletzten Zeile ∆x gekürzt werden kann. Erst danach kann man ∆x gegen 0 gehen lassen, ohne dass dabei Probleme mit einem gegen Null strebenden Nenner entstehen. Variante 2: Ausnutzung von Ableitungsregeln Aus der Ableitungsdefinition (1) lassen sich einerseits die Ableitungsfunktionen aller elementaren Funktionstypen, andererseits allgemeine Ableitungsregeln herleiten (vgl. 1.4 und 1.5). Für die Ableitung unseres f (x) brauchen wir beispielsweise die folgenden Informationen: • Summenregel: Ist f (x) = u(x) + v(x), so gilt: f ′ (x) = u′ (x) + v ′ (x). • Multiplikative Konstanten: Ist f (x) = c · u(x) (c ∈ R), so gilt: f ′ (x) = c · u′ (x). • Ableitung von Potenzfunktionen: Ist f (x) = xn , so gilt: f ′ (x) = n · xn−1 . Insbesondere gilt: [x]′ = 1 und [c]′ = 0 (c ∈ R). Hat man diese Regeln resp. Ableitungsfunktionen im Kopf, so geht das Ableiten um einiges rascher: ′ 1 1 1 2 ′ x − 2x + 2 = · 2x − 2 · 1 + 0 = x − 2 f (x) = 6 6 3 Abschluss: An der Stelle x = 8 folgt: f ′ (8) = df 2 = dx 3 1 3 ·8−2 = ⇒ 8 3 − df = 6 3 = 23 , d.h. infinitesimal: 2 dx 3 An der Stelle x = 8 ist somit die infinitesimale Veränderung des Funktionswertes f (x) nur so gross wie die zugehörige infinitesimale Veränderung der Variable x. 4 2 3 1.4 Allgemeine Ableitungsregeln Aus der Ableitungsdefinition (1) können die folgenden allgemeinen Regeln hergeleitet werden: f ′ (x) = u′ (x) Additive Konstante: f (x) = u(x) + c ⇒ Multiplikative Konstante: f (x) = c · u(x) ⇒ Summenregel: f (x) = u(x) + v(x) ⇒ Produktregel: f (x) = u(x) · v(x) ⇒ f ′ (x) = u′ (x) · v(x) + u(x) · v ′ (x) Quotientenregel: f (x) = ⇒ f ′ (x) = Kettenregel: f (x) = u v(x) 1.5 u(x) v(x) ⇒ f ′ (x) = c · u′ (x) f ′ (x) = u′ (x) + v ′ (x) u′ (x) · v(x) − u(x) · v ′ (x) v 2 (x) f ′ (x) = u′ v(x) · v ′ (x) Ableitungen elementarer Funktionen Aus (1) folgen grundsätzlich die Ableitungen aller Funktionen. Es lohnt sich aber die Ableitungen einiger grundlegender Funktionen stets präsent zu haben, insbesondere: f ′ (x) = 0 Konstante Funktion: f (x) = c ⇒ Lineare Funktion: f (x) = mx + b Quadratische Funktion: f (x) = ax2 + bx + c ⇒ Potenzfunktion: f (x) = xn Wurzelfunktion: f (x) = √ x = x2 ⇒ 1 f ′ (x) = √ 2 x Reziprozitätsfunktion: f (x) = 1 = x−1 x ⇒ f ′ (x) = − Exponentialfunktion zur Basis e: f (x) = ex f ′ (x) = ex Allg. Exponentialfunktion: f (x) = q x ⇒ ⇒ f ′ (x) = q x · ln q Logarithmus naturalis: f (x) = ln |x| = loge |x| ⇒ f ′ (x) = 1 x Allg. Logarithmusfunktion: f (x) = logq |x| ⇒ f ′ (x) = Sinusfunktion: f (x) = sin x ⇒ 1 x · ln q f ′ (x) = cos x Cosinusfunktion: f (x) = cos x ⇒ f ′ (x) = − sin x Tangensfunktion: f (x) = tan x ⇒ f ′ (x) = Arcussinusfunktion: f (x) = arcsin x ⇒ Arcuscosinusfunktion: f (x) = arccos x ⇒ Arcustangensfunktion: f (x) = arctan x ⇒ Dabei sind a, b, c, m, n ∈ R und q ∈ R+ . 5 ⇒ ⇒ 1 f ′ (x) = m f ′ (x) = 2ax + b f ′ (x) = n · xn−1 1 x2 1 cos2 x 1 f ′ (x) = √ 1 − x2 1 f ′ (x) = − √ 1 − x2 1 f ′ (x) = 1 + x2 1.6 Das infinitesimale Verständnis: Im unendlich Kleinen ist alles linear! Denken wir nochmals an das Konzept der Ableitungsbildung zurück: Den horizontalen Schritt ∆x liessen wir unendlich klein (aber 6= 0!) werden – so wurde aus ihm die infinitesimale Veränderung dx. Parallel dazu ging die Differenz des Funktionswertes ∆f in die infinitesimale Veränderung df über: Übergang ins Infinitesimale: ∆x → dx und ∆f → df Bei diesem Übergang ins unendlich Kleine passiert ganz Entscheidendes: Wenn wir unendlich nahe an einen Punkt P auf dem Graphen einer Funktion heranzoomen, so erscheint uns der Graph dort geradlinig. Wir können ihn gar nicht mehr von einer Gerade unterscheiden (vgl. Abb. 3).4 Das lässt uns umgekehrt sagen: Jeder Funktionsgraph setzt sich aus unendlich vielen, unendlich kleinen, aber eben geradlinigen Abschnittchen zusammen. Auf infinitesimaler Grössenordnung sind alle “einigermassen anständigen” mathematischen Funktion linear!5 Diese Linearität, also dass die infinitesimalen Veränderungen df und dx proportional zueinander sind,6 bildet den Grundstein der modernen Analysis (Differentialrechnung, Integralrechnung, . . . ). Ausgehend von dieser neuen Mathematik des unendlich Kleinen, die im 17. Jahrhundert von Sir Isaac Newton (1642 – 1726) und von Gottfried Wilhelm Leibniz (1646 – 1716) unabhängig voneinander entdeckt und entwickelt wurde, haben Mathematik und Naturwissenschaft in den letzten gut 350 Jahren unglaubliche Fortschritte erzielt, die vorher undenkbar gewesen wären. Abbildung 3: Auf infinitesimaler Grössenordnung sind alle Funktionen linear, d.h., sie setzen sich aus unendlich vielen geradlinigen Teilstücken zusammen. 4 Das ist vergleichbar mit Ihrer Situation an der Erdoberfläche. Wir wissen zwar alle, dass wir an der Oberfläche einer riesigen Kugel herumspazieren, aber diese Oberfläche erscheint uns lokal absolut flach und wir machen mit dieser Annahme in unserem Alltag auch keine Fehler. Je kleiner wir den betrachteten Erdoberflächenausschnitt machen, umso geringfügiger resp. umso irrelevanter würde eine allfällige Abweichung zwischen gekrümmter und flacher Oberfläche. Im Grenzwert eines unendlich kleinen Flächenstücks wird der Fehler unendlich klein und somit gibt es keinen messbaren Unterschied mehr. 5 Es gibt durchaus eine Menge “unanständiger” Funktionen, bei denen dieses Hineinzoomen nicht zur Linearisierung führt. Bei solchen Funktionen ist es in der Regel nur schon problematisch überhaupt eine Ableitung zu definieren, weil der Grenzwert für ∆x → 0 gar nicht vernünftig ermittelt werden kann. Glücklicherweise sind physikalische Funktionen in der Regel anständig. D.h., sie lassen sich problemlos (beliebig oft) ableiten und sind im Infinitesimalen eben linear. Davon dürfen wir in unserem Kurs (fast) immer ausgehen. 6 Vgl. Beispiel auf Seite 4: df = 23 · dx ⇒ df und dx sind (an der Stelle x = 8) proportional zueinander. 6 2 Altes und Neues zur Integration 2.1 Der Hauptsatz der Differenzial- und Integralrechnung Was Sie in diesem Abschnitt vorgelegt bekommen, dürften Sie im Mathematikunterricht mehrheitlich bereits gesehen haben. Es kann aber nicht schaden, die Grundlagen der Integralrechnung nochmals genau zu beleuchten. Abbildung 4: Das Integral als Fläche unter einem Funktionsgraphen. 2.1.1 Das bestimmte Integral als Fläche unter einem Funktionsgraphen Wir möchten die Fläche zwischen dem Graphen einer Funktion f (x) und der x-Achse berechnen. Dabei legen die beiden Stellen x = a und x = b deren seitliche Grenzen fest (vgl. Abb. 4). Wir gehen davon aus, dass f (x) zwischen a und b eine stetige Funktion ist. Es gibt also keine Lücken oder Sprungstellen. Zweitens gelte (momentan) der Einfachheit halber für alle x ∈ [a; b], dass f (x) ≥ 0 ist. Somit liegt die zu berechnende Fläche komplett oberhalb der x-Achse. Unter diesen Voraussetzungen bezeichnen wir die gesuchte Fläche A als das bestimmte Integral der Funktion f (x) mit Integrationsgrenzen a und b und schreiben dafür: Z b f (x) dx A= a 2.1.2 Der eigentliche Hauptsatz In der Mathematik haben Sie gelernt, was für die Berechnung eines bestimmten Integrals genau zu tun ist. Sie benutzen eine fundamentale Aussage der Analysis, nämlich den sogenannten Hauptsatz der Differenzial- und Integralrechnung Das bestimmte Integral der Funktion f (x) mit Integrationsgrenzen a und b ist gegeben durch: Z a b f (x) dx = F (b) − F (a) mit f (x) = F ′ (x) (3) Dabei ist F (x) eine Stammfunktion von f (x). Das bedeutet, dass f (x) die Ableitung von F (x) ist. 7 2.1.3 Der Beweis des Hauptsatzes Wer den Hauptsatz zum ersten Mal liest und seine Aussage richtig begreift, wird vermutlich recht überrascht sein: Das “Aufleiten”, also das Aufspüren einer Stammfunktion, erlaubt die Berechnung der Fläche unter dem Funktionsgraphen! Woher kommt das? Was hat die Flächenberechnung mit der Differenziation zu tun? Weshalb verlangt sie gerade nach dem umgekehrten Vorgang? Um das besser zu verstehen und damit eben den Hauptsatz zu beweisen, packen wir die Sache von der anderen Seite an. Wir nehmen an, dass wir bereits eine sogenannte Flächenfunktion F (x) kennen. Für jedes x entspreche ihr Funktionswert F (x) der Fläche, welche oben und unten durch den Graphen einer Funktion f (x) und die x-Achse, sowie links und rechts durch die y-Achse (x = 0) und die Vertikale an der Stelle x beschränkt wird (vgl. Abb. 5). Abbildung 5: Die Flächenfunktion F (x). Klar ist, dass die Berechnung des bestimmten Integrals zwischen den Stellen x = a und x = b kein Problem mehr darstellt, wenn wir diese Flächenfunktion F (x), denn: Fläche von Stelle a bis b = (Fläche von 0 bis b) − (Fläche von 0 bis a) = F (b) − F (a) Zum Beweis des Hauptsatzes müssen wir nun zeigen, dass dieses F (x) tatsächlich eine Stammfunktion der Funktion f (x) ist, dass also die Ableitung dF dx die Funktion f (x) ergibt. Allerdings kennen wir für F (x) keine explizite Funktionsgleichung. Wir wollen ja einen allgemeinen Zusammenhang beweisen. Also müssen wir die Ableitungsdefinition (1) auf Seite 2 Schritt für Schritt befolgen. D.h., wir betrachten die Veränderung ∆F der Flächenfunktion bei einem endlichen Variablenschritt ∆x, bilden aus diesen beiden Veränderungen den Differenzenquotienten ∆F ∆x und lassen anschliessend den Schritt ∆x infinitesimal klein werden. Der Limes von ∆F für ∆x → 0 ist ∆x dF ′ schliesslich die gesuchte Ableitung F (x) = dx . Schritt 1: Die endlich kleine Flächenvergrösserung ∆F : Wir untersuchen, wie sich der Wert der Flächenfunktion F (x) verändert, wenn wir ihren rechten Rand von der Stelle x aus um den endlichen Schritt ∆x nach rechts schieben. Dabei wird die Flächenfunktion um das ebenfalls endliche Flächenstück ∆F vergrössert. Abb. 6 zeigt die Situation. Der endliche Schritt ∆x soll bereits so klein sein, dass uns der Funktionsgraph von f (x) als perfekte Gerade erscheint. Allerdings sind wir noch nicht im unendlich Kleinen! Die infinitesimale Situation selber kann ich Ihnen nicht in einer Abbildung zeigen, auch wenn ich das in Abb. 3 auf Seite 6 in gewisser Weise suggeriert habe. Eine sichtbare Strecke lässt sich schliesslich automatisch immer noch weiter verkleinern. . . 8 Die Flächenveränderung ∆F ist die in Abb. 6 grau eingefärbte Trapezfläche, die sich aus einem helleren Dreieck oben mit Fläche ∆F1 und einem dunkleren Rechteck mit Fläche ∆F2 zusammensetzt. Vergrössern wir also den Variablenwert von x nach x + ∆x, so finden wir für die Veränderung ∆F der Flächenfunktion F (x) ohne Probleme: ∆F = ∆F1 + ∆F2 = ∆f · ∆x + f (x) · ∆x 2 ∆F : ∆x Schritt 2: Bildung des Differenzenquotienten (4) Division durch ∆x liefert: ∆f ∆F = + f (x) ∆x 2 Schritt 3: Übergang ins Infinitesimale: Die Ableitung von F (x) erhalten wir nun, indem wir den Grenzwert des Differenzenquotienten für ∆x → 0 bilden: dF ∆F ∆f ≡ lim = lim + f (x) = f (x) ∆x→0 ∆x ∆x→0 dx 2 Der letzte Schritt braucht wohl noch eine kurze Erläuterung: f (x) bleibt bei der Limesbildung ∆x → 0 unverändert. Es ist einfach der Funktionswert der Funktion f an der Stelle x. Anders sieht dies beim Term ∆f 2 aus. Bei der Ausführung von ∆x → 0 rückt der Punkt Q in Abb. 6 unendlich nahe an den Punkt P heran. Dabei wird ganz offensichtlich auch die Funktions7 wertdifferenz ∆f unendlich klein und der Term ∆f 2 verschwindet bei der Limesbildung. Damit haben wir nun aber gezeigt, dass dF dx = f (x) ist, und somit ist der Hauptsatz bewiesen. Abbildung 6: Veränderung von F (x) beim endlich kleinen Variablenschritt ∆x. 7 Da wir im Infinitesimalen ja davon ausgehen dürfen, dass die Funktion f in P linear verläuft (Gerade mit Steigung f (x)), könnten wir an dieser Stelle auch ∆f durch f ′ (x) · ∆x ersetzen. Damit wäre dann ganz direkt ersichtlich, = 0 ist. weshalb lim∆x→0 ∆f 2 ′ 9 2.1.4 Physikalische Saloppheit In der Physik sind wir selbstverständlich froh um ein solides mathematisches Fundament. Manchmal sind wir aber auch gerne ein bisschen speditiver unterwegs, wohlwissend, dass den Mathematikern dabei zwischenzeitlich die Haare zu Berge stehen könnten. So hätten wir im Beweis des Hauptsatzes aufgrund von Abb. 6 die Gleichung (4) direkt in differenzieller Form notieren können: dF = dF1 + dF2 = df dx + f (x) dx = f (x) dx 2 Im letzten Schritt nutzen wir die Tatsache, dass das Produkt zweier infinitesimaler Grössen – in unserem Fall df · dx – stets unendlich mal viel kleiner ist als das Produkt aus einer endlichen und einer infinitesimalen Grösse – hier: f (x) · dx. Aus diesem Grund dürfen wir den Term df2·dx ohne Fehler weglassen und erhalten so viel schneller: dF = f (x) dx dF = f (x) dx resp. Diesen “saloppen” Umgang mit infinitesimalen Grössen erlauben wir uns in der Physik, weil wir wissen resp. uns schon einmal davon überzeugt haben, dass es funktioniert. Die mathematisch fundiertere Vorgehensweise wäre allerdings stets die Betrachtung endlicher Grössen mit anschliessendem Übergang ins Infinitesimale (Grenzwertbildung ∆x → 0). 2.1.5 Rechtecksflächen und Integralnotation Das Wegfallen des Dreieckterms ∆f2·∆x bedeutet, dass wir im Infinitesimalen ausschliesslich über Rechtecksflächen f (x) dx summieren. Dieses Konzept wurde Ihnen vermutlich bereits in der Mathematik vorgestellt. Die geschwungene Fläche unter dem Funktionsgraphen kann durch unendliche viele unendlich dünne Rechtecksflächen beliebig genau angenähert werden. Das sehen Sie in Abb. 7 für n = 3, 6, 10, 20 Unterteilungen des Intervalls [a; b]. Für n = 20 sieht man schon fast keinen Unterschied mehr zur exakten Fläche. Bei n gleich grossen Unterteilungen des Intervalls [a; b] beträgt der einzelne Schritt auf der x-Achse ∆xn = b−a n . Das k-te Rechteck beginnt bei der Stelle xk , die gegeben ist durch: xk = a + (k − 1)∆xn mit k = 1, . . . , n k nennen wir einen Laufindex. Er durchläuft alle Werte von 1 bis n. So erhalten wir beispielsweise für k = 4 die Stelle x4 = a + 3∆xn oder für k = 15 die Stelle x15 = a + 14∆xn . Die k-te Rechtecksfläche Rk besitzt die Höhe f (xk ) und ihre Fläche beträgt: Rk = f (xk ) ∆xn Um die gesamte von den n Rechtecken abgedeckte Fläche R(n) zu notieren, empfiehlt sich die Summenschreibweise: R(n) = R1 + . . . + Rn = n X k=1 Rk = n X f (xk ) ∆xn k=1 Das Summenzeichen Σ (gr. Grossbuchstabe Sigma) besagt, dass alle Terme aufaddiert werden müssen. Unten am Summenzeichen deklariert man den Namen des Laufindexes inkl. Startwert, oben dessen Endwert. Wie liest man so eine Summe mit Summenzeichen vor? n X k=1 f (xk ) ∆xn = “Summe mit k von 1 bis n über (alle Ausdrücke) f (xk ) ∆xn ” = “Summe über (alle Ausdrücke) f (xk ) ∆xn mit k von 1 bis n” 10 Abbildung 7: Verfeinerung der Rechtecksflächenunterteilung zur Bestimmung der Fläche unter dem Funktionsgraphen. Die Abdeckung wird im Limes n → ∞ unendlich genau. Ein grösseres n entspricht einer verfeinerten Rechtecksunterteilung (vgl. Abb. 7). Lassen wir n immer noch grösser werden, so kommt die Rechteckssumme R(n) der exakten Fläche A beliebig nahe. Die exakte Fläche A ist also der Grenzwert von R(n) für n → ∞: ! n X b−a mit ∆xn = f (xk ) ∆xn A = lim R(n) = lim n→∞ n→∞ n k=1 Das sieht nun doch etwas kompliziert aus. Kein Wunder, dass bereits Gottfried Wilhelm Leibniz (1646 – 1716), einer der beiden Väter der Differenzial- und der Integralrechnung,8 hierfür eine neue Notation eingeführt hat, nämlich eben das Integralzeichen. Wir definieren: ! Z b n X f (x) dx ≡ lim (5) f (xk ) ∆xn a n→∞ k=1 Aus dem für n → ∞ immer kleiner werdenden ∆x R n rechts ist links der infinitesimale Schritt dx geworden. Die Summe Σ hat ein neues Zeichen erhalten, das die voranstehende Limesbildung limn→∞ mit enthält.9 In der Integralnotation ist immer noch ersichtlich, dass es sich im Prinzip um eine Summe über Rechtecksflächen handelt: Der Ausdruck f (x) dx ist die Fläche des infinitesimalen Rechtecks an der Stelle x. 8 9 Der andere Vater war ein R gewisser Isaac Newton (1643 – 1727). . . Das Integralzeichen ist ein stilisiertes, altdeutsches langes S, das für eine neue Art von Summe stehen soll. 11 2.1.6 Negative Integralwerte Mit der Definition des bestimmten Integrals gemäss (5) lösen wir den Integralbegriff vom ursprünglichen Gedanken der Fläche unter einem Funktionsgraphen. Summiert wird über Ausdrücke der Form f (xk ) ∆xn resp. f (x) dx unter dem Integral. Dabei handelt es sich einfach um Produkte zweier Zahlen. Folglich müssen wir bei der Interpretation eines Integrals als Fläche etwas vorsichtig sein. . . Beispiel 1: Wir möchten die Fläche zwischen dem Graphen der Sinusfunktion sin x und der xAchse während einer Periode, also von x = 0 bis x = 2π bestimmen (vgl. Abb. 8). Ohne gross darüber nachzudenken verwenden wir den Hauptsatz (3) und schreiben: Z 2π 2π sin x dx = −[cos x] = −(cos 2π − cos 0) = −(1 − 1) = 0 ??? 0 0 Dieses Resultat kann ganz offensichtlich nicht für die graue Fläche in Abb. 8 stehen! Weshalb verschwindet denn dieses Integral? Ganz einfach, weil die Sinusfunktion sin x auf dem Intervall [0; 2π] auch negative Werte annimmt. Für f (x) < 0 wird auch f (x) dx < 0. Das bedeutet, Flächen unterhalb der x-Achse zählen bei der Berechnung des Integrals negativ. Und weil bei unserer Sinusfunktion innerhalb einer Periode gleich viel Fläche oberhalb und unterhalb der x-Achse liegt, erhalten wir das Resultat Null. Wollen wir tatsächlich die graue Fläche in Abb. 8 berechnen, so müssen wir die Periode in die Intervalle [0; π] und [π; 2π] unterteilen. Die beiden Teilflächen sind genau gleich gross, sodass wir nur ein Integral zu berechnen brauchen und dessen Wert verdoppeln: Z π π sin x dx = −2 [cos x] = −2 (cos π − cos 0) = −2 (−1) + (−1) = 4 A=2 0 0 Auf Seite 7 hatten wir “der Einfachheit halber” angenommen, dass f (x) ≥ 0 sein soll für alle x ∈ [a; b]. Damit wollte ich dieser Komplikation mit negativ zählenden Flächenstücken zunächst mal aus dem Weg gehen. Jetzt wissen wir besser Bescheid und diese Einschränkung ist nicht mehr nötig. Auch über Abschnitte mit negativen Funktionswerten können wir integrieren, solange wir wissen, was wir genau berechnen wollen – das Integral oder die Fläche. Beispiel 2: Die Parabel zu f (x) = x2 − 4x ist nach oben geöffnet und schneidet die x-Achse bei den Stellen x = 0 und x = 4. Für die Fläche zwischen Graph und x-Achse erhalten wir: Z 4 4 64 32 32 1 3 2 2 x − 2x = − 32 − 0 = − = A= (x − 4x) dx = 3 3 3 3 0 0 Bei der Berechnung von Flächen unterhalb der x-Achse nehmen wir den Betrag des Integrals. Abbildung 8: Flächenstücke in einer Periode der Sinusfunktion. 12 2.1.7 Unbestimmtes Integral, Integrationskonstante und Flächenfunktion In der Mathematik haben Sie gelernt, dass man ein Integral auch ohne Angabe von Integrationsgrenzen notieren kann. Wir sprechen von einem unbestimmten Integral und fragen damit nach der Stamm- oder Flächenfunktion F (x): Z f (x) dx = F (x) + C Allerdings ist dieses F (x) nur bis auf eine beliebig wählbare Integrationskonstante C bestimmt. Das kann nicht anders sein, denn durch Addition einer Konstante C verändert sich die Ableitung einer Funktion F (x) ja nicht: [F (x) + C]′ = F ′ (x) = f (x) Zu einem f (x) gibt es somit unendlich viele Stammfunktionen F (x), die sich lediglich durch eine andere Wahl der Integrationskonstante C voneinander unterscheiden. Für die Berechnung eines bestimmten Integrals ist die Wahl dieses C’s belanglos, denn: Z b f (x) dx = F (b) + C − F (a) + C = F (b) − F (a) a Aber was für eine Bedeutung hat denn dieses C überhaupt? Die Antwort darauf liegt schon längst auf dem Serviertablett bereit. Wir wollen sie nicht verpassen. . . Beim Beweis des Hauptsatzes auf Seite 8 haben wir die Flächenfunktion F (x) eingeführt. F (a) stand für die Fläche unter dem Funktionsgraphen von der Stelle x = 0 bis zur Stelle x = a. Diese Wahl der Flächenfunktion war im Prinzip völlig willkürlich! Weshalb muss sie ausgerechnet bei der Stelle x = 0 starten? Genauso gut könnte sie die Fläche von x = −2, x = 7 oder allgemein von x = c aus berechnen. Dann ergäben sich für F (a) andere Werte, weil die Fläche von x = c bis x = a einfach eine andere wäre. Genau diese Freiheit der Wahl eines beliebigen Startortes x = c für die Flächenfunktion widerspiegelt sich in der Addition einer Integrationskonstanten C. Abb. 9 verdeutlicht den Gedankengang nochmals anhand zweier verschiedener Flächenfunktionen F1 (x) und F2 (x), deren Startorte bei x = c1 und x = c2 liegen. Die Integrationskonstante C, die beim Wechsel von F1 (x) zu F2 (x) hinzuaddiert werden muss, entspricht der Fläche resp. dem Integral zwischen den Stellen c2 und c1 : F2 (x) = F1 (x) + C Abbildung 9: Die Addition der Integrationskonstante C geht einher mit dem Wechsel des Startortes der Flächenfunktion. 13 2.1.8 Das bestimmte Integral als Veränderung einer Grösse Schauen wir nochmals zurück auf den Hauptsatz (3) und stellen ihn leicht um: F (b) = F (a) + Z | b a f (x) dx {z } F ′ (x) = f (x) mit (6) =∆F In dieser Form lässt sich dem Hauptsatz nochmals R bein anderes und für die Physik sehr hilfreiches Verständnis abgewinnen: Das bestimmte Integral a f (x) dx beschreibt, wie sich die Grösse F von der Stelle a bis zur Stelle b verändert. F (b) ist gleich dem Ausgangswert F (a) bei der Stelle a und die Veränderung ∆F entspricht dem bestimmten Integral. Beispiel: Oftmals wissen wir in der Physik, dass eine Grösse die Ableitung einer anderen Grösse ist. Z.B. werden wir uns im Kapitel 4 überlegen, dass die Momentangeschwindigkeit v(t) die Ableitung der Ortsfunktion x(t) nach der Zeit t ist – v(t) beschreibt die aktuelle Veränderung des Ortes x(t): dx v(t) = x′ (t) = resp. dx = v(t) dt dt Aus diesem Ableitungszusammenhang folgt aber immer auch der Integralzusammenhang (6) und wir können schreiben: Z t1 x(t2 ) = x(t1 ) + | t2 v(t) dt {z } =∆x Der Ort x(t2 ) zum Zeitpunkt t2 entspricht dem Ort x(t1 ) zum Zeitpunkt t1 plus die Ortsveränderung ∆x (= Strecke) während der Zeitspanne von t1 bis t2 . Diese Veränderung ist durch das bestimmte Integral über die Geschwindigkeitsfunktion v(t) gegeben ist. An diesem Beispiel sehen Sie, wie richtig es aus physikalischer Sicht ist, dass unsere Flächenfunktion – in diesem Fall x(t) – nur bis auf eine Integrationskonstante bestimmt ist. Dies garantiert uns die freie Wahl des Bezugssystems. Wir dürfen selber entscheiden, wo wir den Nullpunkt der Ortsachse platzieren resp. welche Koordinate x(t1 ) hat. Betrachten wir die Angelegenheit nochmals allgemeiner. Mit dem Hauptsatz und mit dF = f (x) dx können wir schreiben: Z b Z F (b) Z F (b) dF kurz: ∆F = dF (7) ∆F = F (b) − F (a) = f (x) dx = F (a) a F (a) Die endliche Veränderung ∆F der Grösse F (x) ist stets gleich dem Integral über die infinitesimalen Veränderungen dF . Beachten Sie, dass wir in (7) die Integrationsgrenzen neu anschreiben mussten. Sie müssen stets zur infinitesimalen Veränderung unter dem Integral passen. Zu dF gehören als Integrationsgrenzen zwangsläufig zwei Werte der Flächenfunktion F (x). Offenbar dürfen wir unter einem Integral einen infinitesimalen Schritt durch einen anderen ersetzen, wenn wir wissen, wie die beiden voneinander abhängen. Und diese Abhängigkeit ist durch den Ableitungszusammenhang gegeben: dF = f (x) dx ⇒ dF = f (x) dx ⇒ Z F (b) dF = F (a) Z b f (x) dx a Aber eben: Die Integrationsgrenzen wollen an den neuen infinitesimalen Schritt angepasst sein. Im Abschnitt 2.4.3 werden wir aus dieser Änderung der Integrationsvariable eine Integrationstechnik mit Namen Substitution machen. 14 2.2 Allgemeine Integrationsregeln Aus der Integraldefinition (5) können die folgenden allgemeinen Regeln hergeleitet werden: Summenregel: Z b f (x) ± g(x) dx = a Faktorregel: Z b c · f (x) dx = c · a Aufteilung des Integrals: Z c f (x) dx = a Umkehrung der Integrationsgrenzen: Z b a Z b Z b Z a b f (x) dx ± g(x) dx a f (x) dx a f (x) dx = − b a f (x) dx + Z Z b Z c f (x) dx b f (x) dx a In vielen Formelsammlungen und Mathematikbüchern finden sich unter diesen allgemeinen Integrationsregeln auch die Substitution und die partielle Integration. Wir werden diese Integrationstechniken in den Abschnitten 2.4.2, 2.4.3 und 2.4.4 separat betrachten. 2.3 Auswahl unbestimmter Integrale Mit der Kenntnis diverser Ableitungen (vgl. Abschnitt 1.5) lassen sich bereits einige Stammfunktionen aufspüren. Es gibt aber doch die eine oder andere ab und zu auftretende Funktion, bei der wir froh darum sind das unbestimmte Integral rasch nachschlagen zu können. Hier eine Auswahl: Z 1 Potenzfunktion: xn dx = xn+1 + C n+1 Z 1 Reziprozitätsfunktion: dx = ln |x| + C x Z Exponentialfunktion zur Basis e: ex dx = ex + C Z Logarithmus naturalis: ln |x| dx = x(ln |x| − 1) + C Z Sinusfunktion: sin x dx = − cos x + C Cosinusfunktion: Tangensfunktion: Quadratische Sinusfunktion: Quadratische Cosinusfunktion: Arcussinusfunktion: Arcuscosinusfunktion: Z Z cos x dx = sin x + C tan x dx = − ln | cos x| + C Z 1 sin2 x dx = (x − sin x cos x) + C 2 Z 1 cos2 x dx = (x + sin x cos x) + C 2 Z p arcsin x dx = x arcsin x + 1 − x2 + C Z p arccos x dx = x arccos x − 1 − x2 + C Natürlich gibt es weitaus umfangreichere Integralsammlungen. Ich habe mich auf die paar grundlegenden Integrale eingeschränkt, die wir am häufigsten benutzen werden. 15 2.4 Integrationstechniken Die Berechnung bestimmter Integrale ist ein mathematisches Handwerk. In einfacheren Fällen möchte man möglichst elegant, in schwierigeren Fällen überhaupt zum Ziel kommen. Leider gibt es kein Standardrezept. Im schlimmsten Fall lassen wir uns von einem Rechner einen Näherungswert auf soundso viele Stellen genau berechnen. Aber am liebsten haben wir es mathematisch exakt! In diesem Abschnitt lernen Sie ein paar Tricks und Techniken zur exakten Berechnung von bestimmten Integralen, denen wir im Rahmen der Quantenmechanik oft begegnen werden. 2.4.1 Symmetrien erkennen und ausnutzen Gerade Funktionen / Achsensymmetrie: Der Graph einer sogenannt geraden Funktion zeigt eine Achsensymmetrie bezüglich der y-Achse des Koordinatensystems (vgl. Abb. 10). Für solche Funktionen gilt: f (−x) = f (x) Typische Beispiele sind cos x, c, x2 , 1 x2 2 oder e−x . Bei einer zum Ursprung symmetrischen Integration folgt für gerade Funktionen (vgl. Abb. 11): Z a Z a f (x) dx = 2 f (x) dx −a 0 Das ist sehr praktisch, weil das Einsetzen der Stelle x = 0 in die Stammfunktion typischerweise besonders einfach ist. Ungerade Funktionen / Punktsymmetrie: Der Graph einer ungeraden Funktion zeigt eine Punktsymmetrie des Funktionsgraphen bezüglich des Koordinatenursprungs (0, 0) (vgl. Abb. 10). Für solche Funktionen gilt: f (−x) = −f (x) Typische Beispiele sind sin x, tan x, x, x3 oder 1 x. Bei Integration von −a bis a folgt für ungerade Funktionen (vgl. Abb. 11): Z a f (x) dx = 0 −a Die Punktsymmetrie macht diese Integration also ganz besonders leicht! Aufgrund dieser allenfalls möglichen Vereinfachungen lohnt es sich immer vor dem Integrieren über die Symmetrieeigenschaften einer Funktion nachzudenken! Abbildung 10: cos x und sin x als Beispiele für gerade und ungerade Funktionen. 16 Abbildung 11: Symmetrische Integrale bei geraden und ungeraden Funktionen Weitere Anmerkungen zu Symmetrieeigenschaften von Funktionen • Der Kehrwert Symmetrie. 1 f (x) einer geraden oder ungeraden Funktion f (x) besitzt immer noch dieselbe • Verknüpfungen von geraden (g) und/oder ungeraden (u) Funktionen durch Addition, Subtraktion, Multiplikation oder Division beeinflussen die Symmetrieeigenschaften wie folgt: +/− g u ·/ : g u g → g • g → g → u u • → u u → u → g • = “keine Symmetrie” • Generell ist es sehr nützlich von möglichst vielen elementaren Funktionen ein ungefähres Bild des Graphen im Kopf zu haben. Dazu gehören natürlich auch allfällige Symmetrieeigenschaften. So verpasst man es nicht von obigen Vereinfachungen bei der Integration von geraden und ungeraden Funktionen, wann immer möglich, zu profitieren. 4 Beispiel 1: Das Polynom f (x) = − x4 + x2 + 21 besitzt lauter Terme mit geraden Potenzen von 0 x ( 12 = x2 ). Somit handelt es sich um eine gerade Funktion, deren Graph links in Abb. 11 gezeigt wird. Für das Integral von −a = − 32 bis a = 23 ergibt sich: 5 3/2 Z 3/2 Z 3/2 3 4 1 1 x x x4 x x + x2 + + x2 + + − dx = 2 · dx = 2 · − + − 4 2 4 2 20 3 2 −3/2 0 0 243 9 3 −243 + 720 + 480 957 =2· − + + −0 = = 640 8 4 320 320 Beispiel 2: Das folgende Integral soll berechnet werden: Z a 1 x sin2 x dx 2 −a Wir bemerken zuerst die Symmetrie der Integrationsgrenzen bezüglich des Ursprungs. Unter dem Integral steht ein Produkt zweier Funktionen. Die Funktion f (x) = x ist ungerade, während g(x) = sin2 x wegen dem Quadrat eine gerade Funktion ist.10 Der Faktor 12 spielt für die Symmetrie keine Rolle. Die ganze Funktion 21 f (x) g(x) = 21 x sin2 x ist also ungerade (vgl. Abb. 11 rechts). Somit muss dieses Integral gleich Null sein! Die Sinusfunktion ist ungerade. Durch das Quadrat in sin2 x werden also zwei ungerade Funktionen miteinander multipliziert, was eine gerade Funktion ergibt. 10 17 2.4.2 Erkennen äusserer und innerer Ableitungen Wer effizient integrieren will, sollte in Sachen Kettenregel (bei der Ableitung) geübt sein und somit über ein geschultes Auge punkto innere Ableitungen verfügen. Dieses geschulte Auge holt man sich nur durch eine gute Kenntnis der Ableitungen verschiedenster elementarer Funktionen und vor allem durch viel Erfahrung und Übung. Erinnern wir uns: Bei der Differenziation erklärt uns die Kettenregel, wie eine verschachtelte Funktion abgeleitet werden muss: ′ u v(x) = u′ v(x) · v ′ (x) Erkennen wir nun eine Funktion unter einem Integral als Produkt f (x) = u′ v(x) · v ′ (x) der Ableitungen einer äusseren und einer inneren Funktion, so ist die Stammfunktion eben gegeben durch F (x) = u v(x) + C und wir erhalten für das bestimmte Integral: Z b b u′ v(x) · v ′ (x) dx = u v(x) (8) a a Wie zielführend diese Methode ist, möchte ich an drei erläuterten Beispielen zeigen: √ √ e 1 x2 2 1 2 x · e dx = e = e − e = (e − 1) 2 2 2 1 1 Z π/2 1 1 π/2 1 sin x · cos x dx = sin2 x = −0= 2 2 2 0 0 Z 1 1 2x 2 dx = ln(x + 1) = ln 2 − ln 1 = ln 2 2 0 0 x +1 Z Beispiel 1: Beispiel 2: Beispiel 3: 2 x2 Beispiel 1: Äussere Funktion u(v) = mit Ableitung v ′ (x) = 2x.11 1 2 ev mit Ableitung u′ (v) = 1 2 ev ; innere Funktion v(x) = x2 Im Nachhinein kann man die Richtigkeit stets leicht überprüfen, denn Ableiten ist typischerweise einfacher als Integrieren: 1 x2 ′ 1 x2 2 = e · 2x = x · ex e 2 2 Beispiel 2: Äussere Funktion u(v) = 21 v 2 mit Ableitung u′ (v) = 12 ·2v = v = sin x; innere Funktion v(x) = sin x mit Ableitung v ′ (x) = cos x. Wir hätten auch cos x als innere Funktion mit Ableitung sin x auffassen können. Dann hätte die äussere Funktion u(v) = − 12 v 2 gelautet und wir hätten gleichermassen erhalten: Z π/2 0 π/2 1 1 1 2 =0− − = sin x · cos x dx = − cos x 2 2 2 0 An diesem Beispiel sieht man sehr schön, dass sich unterschiedliche Stammfunktionen ergeben können. Ganz offensichtlich ist 21 sin2 x 6= − 12 cos2 x. Die beiden Funktionsgraphen verlaufen parallel übereinander und unterscheiden sich lediglich um eine Integrationskonstante C = 12 . Für das bestimmte Integral spielt dieser Unterschied keine Rolle. Beispiel 3: Äussere Funktion u(v) = ln v mit Ableitung u′ (v) = v1 ; innere Funktion v(x) = x2 + 1 mit Ableitung v ′ (x) = 2x. Zum Schluss habe ich verwendet, dass loga 1 = 0 ist. 11 c c Es sei daran erinnert, dass ab ≡ a(b ) (6= (ab )c ). 18 2.4.3 Lineare Substitution Oftmals taucht die Integrationsvariable x innerhalb der Funktion f (x), über die integriert wird, in einem linearen Ausdruck mx + q auf. In diesem Fall ist es hilfreich mx + q durch eine neue Integrationsvariable s = mx + q zu substitutieren (= ersetzen). In der Funktion sollen gar keine x mehr vorkommen. D.h., wir ersetzen wirklich alle x und schreiben für die Funktion nur noch f (s). Aus dem infinitesimalen Schritt dx wird ds. Dabei müssen wir berücksichtigen, dass: ds ds = s′ = m ⇒ dx = dx m Auch die Integrationsgrenzen müssen in s-Werte umgerechnet werden. Insgesamt folgt: Z mb+q Z b 1 f (s) ds · f (x) dx = m ma+q a s = mx + q ⇒ (9) Im Moment erkennen Sie vielleicht noch nicht so richtig, wie die Sache läuft resp. was sie bringt. Die folgenden paar Beispiele sollen Licht ins Dunkel bringen. Beispiel 1: Verschiebungs-Trick (m = 1) Wir betrachten das folgende Integral: Z 5 2 √ 1 dx x−1 Das sieht ein bisschen unschön aus. Von √1x kennen wir dank der Integrationsregel für Potenzfunktionen die Stammfunktion (vgl. Abschnitt 2.3). Aber wie sieht es mit der −1 unter der Wurzel aus? Was verändert diese Subtraktion? Vielleicht haben Sie in der Mathematik schon erkannt, dass die Ersetzung aller x in einer Funktionsgleichung durch den Ausdruck x − 1 den Graphen der Funktion um 1 nach rechts verschiebt. Machen wir das Umgekehrte, ersetzen wir also x − 1 durch x, so bedeutet dies eine Verschiebung um 1 nach links. Das nützen wir hier aus und setzen eine neue Integrationsvariable s = x − 1 an. Damit verschieben wir im Prinzip den Funktionsgraphen um 1 nach links (vgl. Abb. 12). Es leuchtet ein, dass dann auch die Integrationsgrenzen um 1 nach links verschoben werden müssen, damit wir immer noch dasselbe Integral berechnen. Zunächst betrachten wir aber den neuen infinitesimalen Schritt: ds m= = s′ = [x − 1]′ = 1 dx Solange also die Steigung m in unserer linearen Substitution s = mx+ q gleich 1 ist, verändert sich am infinitesimalen Schritt gar nichts, ds = dx. Es folgt: Z 4 Z 5−1 Z 5 1 1 1 √ √ ds = √ ds dx = s s x−1 1 2−1 2 Das sieht schon freundlicher aus! Aus der Integrationsregel für Potenzfunktionen erhalten wir: Z 4 Z 4 √ √ √ 4 1 1 4 1 √ ds = s− 2 ds = 2s 2 = 2 s = 2 4 − 1 = 2 s 1 1 1 1 Bemerkung: Das anfängliche Integral hätten wir auch berechnen können, wenn wir uns klar 1 als Ableitung der inneren Funktion v(x) = x−1 gemacht hätten, dass die 1 im Zähler von √x−1 √ 1 ′ √ und u (v) = v als Ableitung der äusseren Funktion u(v) = 2 v angesehen werden können: Z 5 5 √ √ √ 1 √ dx = 2 x − 1 = 2 4 − 1 = 2 2 x−1 2 Beim Integrieren gibt es ab und zu also durchaus mehrere Wege, die zum Ziel führen. 19 Abbildung 12: Die Substitution s = x − 1 verschiebt den Graphen von f (x) um 1 nach links. Die Integrationsgrenzen werden mitverschoben, sodass die Integrationsfläche gleich gross bleibt. Beispiel 2: Reskalierungs-Trick (q = 0) Oftmals taucht x innerhalb einer Funktion zusammen mit einem Vorfaktor auf, so z.B. in: Z π/3 cos(3x) dx π/6 Gerne würden wir nur über cos x integrieren. Daher lautet unsere Substitution s = 3x. Ein Funktionsgraph wird bei der Ersetzung aller x durch 3x um den Faktor 3 horizontal gestaucht. Hier machen wir genau das Umgekehrte. Wir ersetzen 3x durch die Variable s, was eine horizontale Dehnung um den Faktor 3 bewirkt (vgl. Abb. 13). Dem entsprechend müssen die Integrationsgrenzen verschoben werden, um das Integral immer noch “an denselben Stellen” im Verlauf des Graphen zu begrenzen. Durch die Dehnung wird die Fläche effektiv vergrössert. Dies wird durch die Veränderung des infinitesimalen Schrittes ausgeglichen: ds = s′ = [3x]′ = 3 dx ⇒ dx = ds ds = ′ s 3 Insgesamt folgt für unser Integral: Z 3·π/3 Z π/3 Z π π ds 1 1 1 1 cos s cos(3x) dx = = · (0 − 1) = − cos s ds = · sin s = · 3 3 π/2 3 3 3 π/2 3·π/6 π/6 Abbildung 13: Die Substitution s = 3x dehnt den Graphen von f (x) horizontal um den Faktor 3. Die Integrationsgrenzen werden mitgestreckt. Dadurch wird offensichtlich die Fläche vergrössert, was beim Integral mit einer Division durch den Streckungsfaktor 3 ausgeglichen werden muss. 20 Beispiel 3: Lineare Substitution komplett (m 6= 1, q 6= 0) Verschiebungs- und Reskalierungs-Trick sind nur Spezialfälle der am Anfang des Abschnittes beschriebenen allgemeinen linearen Substitution s = mx + q. Beim Verschiebungs-Trick ist m = 1, beim Reskalierungs-Trick ist q = 0. Im allgemeinen Fall (m 6= 1 und q 6= 0) Wird der Funktionsgraph sowohl horizontal verschoben, wie auch gestreckt oder gestaucht. Beispiel: f (x) = 1 3 1 x−4 mit s = 1 x−4 3 ⇒ f (s) = 1 s und m= ds 1 = dx 3 Damit finden wir beim folgenden Integral: Z 21 Z 1 ·21−4 Z 3 3 3 1 1 1 1 dx = · ds = 3 · ds = 3 · ln |s| = 3 ln 3 1 1 1 s s 1 ·15−4 15 3 x − 4 1 3 3 Bemerken Sie, dass in dieser allgemeinen linearen Substitution die horizontale Verschiebung nicht einfach der Zahl q entspricht. Vielmehr muss man den Streckungs- resp. Stauchungsfaktor q . Im Beispiel: m ausklammern, um die effektive Verschiebung zu sehen. Sie ist gegeben durch m s= 1 1 x − 4 = (x − 12) 3 3 ⇒ Verschiebung um 12 nach links Abbildung 14: Die Substitution s = 13 x − 4 = 13 (x − 12) verschiebt den Graphen horizontal um 12 nach links. Danach wird er mit dem Faktor 3 zur y-Achse hin gestaucht. Die Integrationsgrenzen müssen entsprechend mitverschoben werden. Durch die Stauchung wird die Fläche verkleinert, was beim Integral durch eine Multiplikation mit dem Stauchungsfaktor 3 ausgeglichen werden muss. Zum Schluss dieses Abschnittes sei angefügt, dass die lineare Substitution einem Erkennen von äusserer und innerer Ableitung entspricht. Anstatt lange zu theoretisieren zeige ich Ihnen an einem Beispiel, wie das gemeint ist. Beispiel 4: Das folgende Integral berechnen wir mit der linearen Substitution s = 2x − π3 : Z π/6 Z π/4 π/6 1 1 1 1 1 π dx = · = · cos s ds = · sin s −0 = cos 2x − 3 2 0 2 2 2 4 0 π/6 Andererseits erkennen wir aber auch, dass der Cosinus die Ableitung einer äusseren Funktion mit innerer Funktion 2x − π3 ist. Die konstante Ableitung der linearen inneren Funktion, also der Faktor 2, ist nicht sichtbar. D.h., es braucht einen zusätzlichen Faktor 12 , der diese innere Ableitung wegschafft. Die Stammfunktion lautet somit 12 sin(2x − π3 ) und wir erhalten: Z π/4 2π π 1 1 π π/4 1 π 2π π = dx = sin 2x − − sin = − − cos 2x − sin 3 2 3 π/6 2 4 3 6 3 4 π/6 Je mehr Übung Sie haben, desto selbstverständlicher werden diese Rechnungen. 21 2.4.4 Partielle Integration Diese ebenfalls sehr nützliche Integrationstechnik bedient sich der Produktregel beim Ableiten. Wir erinnern uns: [u(x) v(x)]′ = u′ (x) v(x) + u(x) v ′ (x) Integrieren wir über beide Seiten, so ergibt sich: Z b ′ [u(x) v(x)] dx = a Z b ′ u (x) v(x) dx + a Z b u(x) v ′ (x) dx a Nun steht auf der linken Seite aber das Integral über der Ableitung von u(x) v(x). Eine Stammfunktion dazu ist u(x) v(x) selber, woraus folgt: Z b b Z b ′ u(x) v ′ (x) dx u (x) v(x) dx + [u(x) v(x)] = a a a Durch Umstellen finden wir: Z b b Z b ′ u(x) v ′ (x) dx u (x) v(x) dx = [u(x) v(x)] − a a (10) a Diese Beziehung bezeichnet man als partielle Integration, weil von der Funktion f (x) = u′ (x) v(x) quassi nur der “Part” resp. Anteil u′ (x) integriert, also aufgeleitet wird. Damit ist die Integration von f (x) = u′ (x) v(x) noch nicht abgeschlossen, vielmehr hat man das Problem auf die Berechnung des Integrals über g(x) = u(x) v ′ (x) verlagert. Dieses ist aber unter Umständen wesentlich leichter zu berechnen, sodass sich die partielle Integration ausbezahlt. Die nachfolgenden Beispiele demonstrieren den Nutzen der partiellen Integration. Beispiel: Das folgende Integral ist ein Kandidat für eine partielle Integration, weil wir in ihm ein Produkt zweier Funktionen entdecken: Z π/2 x cos x dx 0 Mit unseren bisherigen Methoden kommen wir hier nicht weiter. Der Faktor x vor der Cosinusfunktion erschwert die Sache. Nur cos x – oder sin x – wäre ja völlig unproblematisch. Aber genau dies können wir durch die partielle Integration erreichen mit der das Integral in gewisser Weise ausgetauscht werden kann. Wir identifizieren u′ (x) = cos x und v(x) = x. Dann sind u(x) = sin x und v ′ (x) = 1, sodass u(x)v ′ (x) = sin x. Somit erhalten wir: Z π/2 Z x cos x dx = x sin x − π/2 0 0 π/2 sin x dx = 0 π/2 π π π = + (0 − 1) = − 1 − 0 + (cos x) 2 2 2 0 In die “andere Richtung” mit u′ (x) = x und v(x) = cos x bringt die partielle Integration keine Verbesserung: Z 0 π/2 π/2 Z π/2 1 1 2 − x cos x dx = x cos x x2 sin x dx = ?? 0 2 2 0 22 2.5 Uneigentliche Integrale Manchmal kommt es vor, dass die Funktion f (x), über die integriert wird, bei einer Integrationsgrenze κ gar nicht definiert ist, sei es, weil es sich bei κ um eine Definitionslücke von f (x) oder weil die Integrationsgrenze gleich ±∞ ist und somit selber für keine reelle Zahl steht. In einem solchen Fall sprechen wir von einem uneigentlichen Integral und wir müssen kurz deklarieren, was darunter zu verstehen ist: Definition uneigentlicher Integrale Ein Integral bis zu einer Stelle κ heisst uneigentlich, wenn κ eine Definitionslücke von f (x) oder gleich ±∞ ist. Den Wert des uneigentlichen Integrals definieren wir als Grenzwert eines problemlos berechenbaren Integrals: Z b Z κ f (x) dx (11) f (x) dx ≡ lim a b→κ a Der Parameter b soll zwischen a und κ liegen. Natürlich kann das Integral auch aufgrund der unteren oder sogar aufgrund beider Integrationsgrenzen uneigentlich sein. Das Verfahren bleibt dasselbe. In letzterem Fall braucht es dann zwei Limesbildungen. Bei uneigentlichen Integralen kann es vorkommen, dass der Grenzwert gar nicht gebildet und somit für das Integral kein Wert berechnet werden kann. Ein paar Beispiele zeigen, dass die Sache relativ einfach ist. Mit etwas Übung wird es nur selten notwendig sein aus Verständnisgründen die Grenzwertbildung ganz ausführlich zu betrachten. Beispiel 1: Die Funktion f (x) = √1x besitzt bei x = 0 eine Polstelle. Somit ist das folgende Integral uneigentlich, aber es lässt sich trotzdem berechnen: Z 4 Z 4 √ √ 4 √ 1 1 √ dx ≡ lim √ dx = lim 2 x = 2 lim 4 − a = 2(2 − 0) = 4 a→0 a→0 a→0 x x a 0 a Dies war die ausführliche Notation. Wir scheuen uns meistens aber nicht vor einer etwas salopperen Schreibweise ohne Limesbildung: Z 4 √ √ √ 4 1 √ dx = 2 x = 2 4 − 0 = 4 x 0 0 Wichtig ist einfach, dass wir um die exaktere Schreibweise mit der Limesbildung wissen und diese in kritischen Fällen hervornehmen können. Links in Abb. 15 sehen wir die graphische Bedeutung unseres Resultates: Die Fläche unter dem Funktionsgraphen zwischen x = 0 und x = 4 ist offenbar endlich gross, auch wenn die Funktionswerte für x → 0 unendlich gross werden. Beispiel 2: Betrachten wir nun ein Integral, dessen rechte Integrationsgrenze im Unendlichen liegt: Z b Z +∞ b −x −x −x e dx ≡ lim e dx = lim −e = − lim e−b − e0 = −(0 − 1) = 1 0 b→∞ b→∞ 0 0 b→∞ Auch hier sind wir gerne etwas schludriger, aber eben speditiver unterwegs: Z +∞ +∞ = −(0 − 1) = 1 e−x dx = −e−x 0 0 23 Abbildung 15: Beispiele uneigentlicher Integrale: An den Integrationsgrenzen undefinierte Funktionen können trotzdem endliche Flächen eingrenzen. Beispiel 3: Nach den ersten beiden Beispielen könnte man den Eindruck erhalten, dass sich jedes uneigentliche Integral berechnen lässt. Hier sehen Sie, dass dem überhaupt nicht so sein muss: Z b Z +∞ b 1 1 dx ≡ lim dx = lim ln |x| = lim (ln b − ln 1) = undefiniert b→∞ b→∞ b→∞ x x 0 1 1 Der Logarithmus naturalis ist eine monoton wachsende Funktion, sodass limb→∞ ln b = ∞ und der Grenzwert somit undefiniert ist. Damit existiert dieses uneigentliche Integral nicht. 2.6 Spezielle bestimmte Integrale In der Quantenmechanik werden wir ein paar bestimmte Integrale verwenden, deren Herleitung in ein paar Fällen den Rahmen der uns zur Verfügung stehenden Mathematik sprengen würde: Z ∞ xn e−x/a dx = n! an+1 mit a > 0, n ∈ N Exponenzialintegral: 0 Gauss’sche Integrale: Z ∞ e−x 2 /a2 dx = 0 Z ∞ x2n e−x 2 /a2 dx = 0 Z Trigo-Integrale: ∞ √ a π 2 √ (2n)! a 2n+1 π n! 2 n! 2n+2 a 2 0 ( Z 2π 0 für m 6= n sin(mx) sin(nx) dx = π für m = n 0 ( Z 2π 0 für m 6= n cos(mx) cos(nx) dx = π für m = n 0 Z 2π sin(mx) cos(nx) dx = 0 x2n+1 e−x 2 /a2 dx = mit a>0 mit a > 0, n ∈ N mit a > 0, n ∈ N mit m, n ∈ Z mit m, n ∈ Z mit m, n ∈ Z mit a>0 0 Z ∞ π sin(ax) dx = x 2 0 r Z ∞ Z ∞ π 2 2 cos(x ) dx = sin(x ) dx = 8 0 0 24 3 Differenzialgleichungen – ein fundamental neuer Gleichungstyp In Ihrer bisherigen “mathematischen Karriere” haben Sie eine Vielzahl von Gleichungen angetroffen. Je nach Gleichungstyp gab es unterschiedlich viele Lösungen und vor allem auch immer wieder andere Lösungsverfahren. Ein paar Beispiele: • Lineare Gleichung (LG) in 1 Unbekannten: ax + b = 0 mit a 6= 0 ⇒ genau 1 Lösung x, Verfahren: Separation. • LG in 2 Unbekannten (Geradengleichung): ax + by + c = 0 mit entweder a oder b 6= 0 ⇒ ∞-viele Lösungspunkte (x, y), bilden eine Gerade in einem x-y-Koordinatensystem. • LG in 3 Unbekannten (Ebenengleichung): ax + by + cz + d = 0 mit a, b oder c 6= 0 ⇒ ∞-viele Lösungspunkte (x, y, z), bilden eine Ebene in einem x-y-z-Koordinatensystem. • Quadratische Gleichung (QG) in 1 Unbekannten: ax2 + bx + c = 0 mit a 6= 0 ⇒ 0, 1 oder 2 Lösungen x, sind die Nullstellen einer Parabel, Verfahren allg.: Quadratische Ergänzung resp. Mitternachtsformel, spez.: Binomische Formel resp. Zweiklammeransatz. • Exponentialgleichung in 1 Unbekannten: ax = b mit a, b > 0 ⇒ genau 1 Lösung x, Verfahren: Logarithmieren. So unterschiedlich diese Gleichungstypen auch sind, eines haben sie alle gemeinsam: Ihre Lösungen sind Punkte in einem ein- oder mehrdimensionalen Koordinatensystem.12 Nun wenden wir uns allerdings einem ganz neuen Gleichungstyp zu, dessen Lösungen einer fundamental anderen Objektklasse angehören. Bei sogenannten Differenzialgleichungen (DGLs) sind die Lösungen nämlich ganze Funktionen f (x), also Zuordnungsvorschriften von einer Variable x zu einer davon abhängigen Grösse f (x). Gesucht sind alle Funktionsvorschriften f (x), welche die durch die DGL beschriebenen Anforderungen erfüllen, also eben die DGL lösen. Das tönt im Moment wohl etwas abstrakt und bedarf daher sicher einiger Erläuterung. . . 3.1 Was ist eine Differenzialgleichung (DGL)? Die folgenden Ausführungen sind sinngemäss dem Buch Rechenmethoden für Studierende der Physik im ersten Jahr [2] von Markus Otto entnommen:13 Allgemeine Definition: Eine gewöhnliche Differenzialgleichung (DGL) ist eine Gleichung, in welcher Terme mit der/den Ableitung/en einer gesuchten Funktion y(x) auftreten. In der Gleichung können zudem die Funktion y(x), wie auch die Variable x vorkommen. Eine DGL zu lösen bedeutet, alle möglichen Funktionen y(x) zu finden, welche die DGL für alle erlaubten Werte der Variable x erfüllen. Ordnung der DGL: Definition: y (n) (x) ≡ n-te Ableitung von y(x). Ist y (n) (x) die höchste in der DGL vorkommende Ableitung, so sprechen wir von einer DGL n-ter Ordnung. Lineare und homogene DGLs: Eine DGL heisst linear, wenn die unbekannte Funktion y(x) und ihre Ableitungen darin linear auftreten. D.h., die DGL enthält lauter einzelne Terme mit Potenz 1 von y(x), y ′ (x), y ′′ (x), etc. Die allgemeinste lineare DGL n-ter Ordnung lautet daher: a0 (x)y(x) + a1 (x)y ′ (x) + a2 (x)y ′′ (x) + . . . + an (x)y (n) (x) = r(x) Darin sind a0 (x), a1 (x), . . . , an (x) beliebige Funktionen der Variable x. Ist die Störfunktion r(x) = 0, so spricht man von einer homogenen (linearen) DGL. 12 Eine einzelne Lösung x sitzt ja auch an irgendeinem Punkt auf einem Zahlenstrahl (= x-Achse), also in einem eindimensionalen Koordinatensystem. 13 Otto 2011, S. 201ff [2]. 25 Lösungen: Eine lineare, homogene DGL n-ter Ordnung besitzt n Einzellösungen y1 (x), . . . , yn (x). Die allgemeine Lösung ergibt sich dann als Linearkombination der Einzellösungen: y(x) = C1 y1 (x) + C2 y2 (x) + . . . + Cn yn (x) Dabei sind die Koeffizienten C1 , . . . , Cn zunächst frei wählbare Zahlenwerte. D.h., es gibt nicht eine einzige, eindeutige Lösung der DGL, sondern eine unendlich grosse Lösungsschar, deren einzelnes Element durch eine bestimmte Koeffizientenkombination (C1 , . . . , Cn ) gegeben ist. Rand- resp. Anfangsbedingungen (RBs): Da die Lösung einer DGL, wie eben erläutert, nicht eindeutig ist, braucht es zusätzliche Bedingungen (Gleichungen), um die Funktion y(x) komplett festzulegen. Diese sogenannten Anfangs- oder Randbedingungen (RBs) sind in der Regel Teil des Problems, für das die DGL die Lösung liefern soll. Sind bei einer DGL n-ter Ordnung zusätzlich n RBs vorgegeben, so werden dadurch die Koeffizienten C1 , . . . , Cn in eindeutiger Weise festgelegt. Ermittlung der Lösungen einer DGL: Trotz einiger raffinierter Verfahren für verschiedene Arten von DGLs gibt es leider kein Patentrezept für die Lösung einer DGL. Oftmals ist Raten ein guter erster Schritt. Aber am meisten hilft viel Erfahrung und vor allem ein solides, also ohne Nachschlagen präsentes (!) Grundwissen über Ableitungsregeln und die konkreten Ableitungen verschiedener Funktionen (vgl. Seite 5). Allerdings ist es so, dass nur zu verhältnismässig wenigen DGLs überhaupt eine analytische Lösung, also eine als geschlossener mathematischer Ausdruck notierbare Funktion, existiert. Damit meint man nicht, dass in allen anderen Fällen gar keine Lösung existiert, aber die DGL ist dann halt nur sogenannt numerisch lösbar. Das bedeutet, man kann sich der Lösungsfunktion durch Verwendung bestimmter Rechenmethoden im Prinzip beliebig genau annähern, aber die Lösung selber, also die Grenzfunktion dieser Annäherung, kann einfach nicht so geschlossen aufgeschrieben werden, wie Sie sich das für Funktionen bisher gewohnt waren.14 Die Ausführung solcher Annäherungsrechnungen überlassen wir heutzutage dem Computer. Auch hierzu werden Sie später, allerdings ohne ausführliche Rechnungen, ein paar Beispiele vorfinden. Hinweis: In diesem Ergänzungsfach wird es nur am Rande darum gehen DGLs zu lösen. Mit diesem Thema alleine könnte man problemlos ein ganzes Ergänzungsfachjahr füllen . . . Hingegen sollten Sie einerseits in der Lage sein die Richtigkeit einer vorgegebenen Lösung zu überprüfen, andererseits aus den RBs allfällige Parameter zu ermitteln. Beides ist wesentlich einfacher als das Aufspüren von Lösungen, denn dazu brauchen Sie “lediglich” die angegebene Lösung in die DGL einzusetzen, wofür Sie im Wesentlichen das Ableiten beherrschen müssen. . . √ Das ist vergleichbar damit, dass Sie z.B. die Zahl 2 als Dezimalzahl auch nicht ganz genau aufschreiben können, obwohl Sie genau wissen, dass diese Zahl existiert und die positive Lösung der Gleichung x2 = 2 ist. 14 26 3.2 3.2.1 Erste Beispiele von DGLs (ohne physikalischen Kontext) Stammfunktionen bestimmen Im Prinzip haben Sie bei der Integralrechnung bereits selber einfache DGLs gelöst, nämlich immer dann, wenn Sie eine Stammfunktion y(x) zu einer vorgegebenen Funktion f (x) bestimmt haben. Die zugehörige DGL lautete: y ′ (x) = f (x) Das ist eine lineare DGL 1. Ordnung. Allerdings ist sie nicht homogen, denn die Funktion f (x) stört die Homogenität. Das hält uns aber nicht auf! Dank unserer Erfahrung wissen wir, dass wir y(x) erhalten, indem wir das unbestimmte Integral von f (x) ermitteln: Z y(x) = f (x) dx + C Wie es sich für eine DGL 1. Ordnung gehört, taucht ein einzelner, unbestimmter Parameter C auf – Ihnen bekannt unter dem Namen Integrationskonstante. Die DGL liefert somit eine ganze Lösungsschar von Funktionen y(x). Beispiel: Gesucht sei die Lösung folgender DGL (inkl. RB): y ′ (x) = 4 1 2 4 x − x+ 4 3 3 mit RB: y(2) = 1 Für die Stammfunktion (unbestimmtes Integral) erhalten wir: Z 4 1 3 2 2 4 1 2 4 x − x+ x − x + x+C dx + C = y(x) = 4 3 3 12 3 3 Aus der RB lässt sich schliesslich der Wert des Parameters C bestimmen: y(2) = 2 2 8 8 ! − + +C = +C =1 3 3 3 3 ⇒ C= 1 3 Somit erhalten wir für unsere gesuchte Funktion y(x): y(x) = 1 3 2 2 4 1 x − x + x+ 12 3 3 3 Abb. 16 zeigt die Funktion für verschiedene Werte von C. Es handelt sich immer um dieselbe Kurve, allerdings auf verschiedenen Höhen. Das muss ja so sein, denn die DGL y ′ (x) = f (x) schreibt lediglich vor, welche Steigung zu welcher Stelle x gehört. Die RB y(2) = 1 fixiert den Graphen auf einer bestimmten Höhe. Der Punkt (2, 1) soll auf dem Funktionsgraphen liegen. Daraus folgt der Wert von C, denn die Addition einer Konstante macht nichts anderes als den Graphen einer Funktion vertikal zu verschieben. 3.2.2 Exponentialfunktion Betrachten wir jetzt die folgende homogene, lineare DGL 1. Ordnung. Darin sei k eine beliebige Zahl ausser 0: y ′ (x) = ky(x) resp. y ′ (x) − ky(x) = 0 mit RB: y(0) = a (12) Natürlich werde ich Ihnen gleich die Lösung zu dieser DGL angeben. . . Andererseits lohnt es sich hier kurz innezuhalten und sich zu fragen, ob man diese Lösung nicht selber erraten könnte: Gesucht ist eine Funktion y(x), deren Ableitung y ′ (x) bis auf den konstanten Vorfaktor k wieder sich selber sein soll. Für k = 1 wäre dann sogar y ′ (x) = y(x). Welche Funktion erfüllt grundsätzlich die Anforderung, dass ihre Ableitung immer noch dieselbe Funktion ist? 27 Abbildung 16: Das graphische Verständnis eines unbestimmten Integrals. Erst die Randbedingung legt schliesslich fest, auf welcher Höhe der Graph verläuft. Genau: die Exponentialfunktion ex ! Jetzt müssen wir noch dafür sorgen, dass beim Ableiten ein Vorfaktor k rausspringt. Das k muss das Resultat der inneren Ableitung sein. Die Einzellösung y1 (x) lautet daher: y1 (x) = ekx Da DGLs 1. Ordnung nur eine einzige Einzellösung besitzen, sind wir schon fertig. Für die allgemeine Lösung müssen wir einfach noch einen Vorfaktor C anfügen: y(x) = Cy1 (x) = Cekx ⇒ y ′ (x) = Cekx · k = ky(x) ⇒ Stimmt! Als multiplikative Konstante bleibt der Vorfaktor C beim Ableiten einfach erhalten. Bestimmen wir schliesslich aus der RB noch den konkreten Wert von C: ! y(0) = C · ek·0 = C = a ⇒ y(x) = aekx (13) Würdigung der Euler’schen Zahl e: Bemerken Sie, welch spezielle Eigenschaft die Euler’sche Zahl e ≈ 2.718 aufweist! Die Exponentialfunktion mit Basis e, also y(x) = Cex , ist die einzige von der trivialen Funktion y(x) = 0 verschiedene Funktion, die beim Ableiten genau gleich bleibt. Dies zeichnet e aus und macht diese Zahl quasi zur “natürlichen Basis” für sämtliche Exponentialfunktionen in Mathematik und Naturwissenschaft.15 Mit keiner anderen Basis lassen sich Exponentialfunktionen so leicht handhaben. Abb. 17 erläutert eine graphische Konsequenz von [ex ]′ = ex : Der Funktionsgraph von y(x) = Cex hat die interessante Eigenschaft, dass die y-Koordinate jedes Punktes auf dem Graphen auch gerade angibt, wie steil der Graph durch diesen Punkt hindurch verläuft. 3.2.3 Sinus- und Cosinusfunktion Erneut betrachten wir eine homogene, lineare DGL, diesmal allerdings 2. Ordnung, weshalb zur eindeutigen Lösung nun zwei RBs benötigt werden. Auch hier sei k eine beliebige Zahl 6= 0: y ′′ (x) = −ky(x) mit RBs: y(0) = A und y ′ (0) = 0 (14) Hier lautet die Frage zur DGL: “Welche Funktion y(x) hat die Eigenschaft, dass ihre 2. Ableitung y ′′ (x) das Negative der Funktion selber ist?” 15 Und das sind weitaus mehr, als Sie im Moment vielleicht denken mögen! Sobald wir uns mit komplexen Zahlen beschäftigen, wird dies noch deutlicher werden. 28 Abbildung 17: Die spezielle Eigenschaft der Exponentialfunktion ex : In jedem Punkt P (x, ex ) auf dem Funktionsgraphen besitzt die zugehörige Tangente die Steigung ex . Wer sich in den Funktionsableitungen auskennt, wird sofort ausrufen: “Die Sinusfunktion!” Klar: [sin x]′ = cos x und [cos x]′ = − sin x, also in der Kombination: [sin x]′′ = − sin x. “Aber Cosinus doch auch!” ruft jemand anders. Tatsächlich: [cos x]′′ = [− sin x]′ = − cos x. Und schon haben wir die beiden Einzellösungen gefunden – zumindest fast: Wir müssen noch die Konstante k einbauen. Das ist aber keine grosse Sache mehr, denn wiederum handelt es sich um einen Faktor, der als Resultat der inneren Ableitung entsteht, diesmal allerdings doppelt: y ′′ (x) = [sin(ωx)]′′ = [ω cos(ωx)]′ = −ω 2 sin(ωx) = −ky(x) Die allgemeine Lösung der DGL lautet somit: y(x) = C1 sin(ωx) + C2 cos(ωx) mit ω= mit √ ω2 = k k (15) Was sagen die RB’s über die Werte von C1 und C2 ? Notieren wir y(x) und y ′ (x) nochmals und setzen die RBs ein: y(x) = C1 sin(ωx) + C2 cos(ωx) ! ⇒ y ′ (x) = ωC1 cos(ωx) − ωC2 sin(ωx) y(0) = 0 + C2 = A ⇒ ⇒ ! y ′ (0) = ωC1 + 0 = 0 C2 = A ⇒ C1 = 0 Somit lautet unser Schlussresultat: y(x) = A cos(ωx) mit ω = √ k (16) Dieses Resultat ist bei Betrachtung der RBs nicht weiter erstaunlich: Bei x = 0 soll die Funktion irgendeinen Wert A annehmen. Die Sinusfunktion ist dort aber gleich Null, somit muss das schon die Cosinusfunktion hinkriegen. Ausserdem soll die Steigung bei x = 0 gleich Null sein. Das trifft für die Cosinusfunktion zu, aber für die Sinusfunktion eben nicht. Somit muss es sich bei der gesuchten Funktion um eine reine Cosinusfunktion handeln. Bemerke! Als RB kann auch eine Wertfestlegung für eine Ableitung benutzt werden. Hier war dies mit y ′ (0) = 0 der Fall. √ Ergänzung Aus ω 2 = k könnte auch ω = − k folgen. Damit würden aber aufgrund der Symmetrieeigenschaften von Cosinus- und Sinusfunktion keine Lösungen entstehen, die nicht schon durch (15) abgedeckt wären, denn cos(−a) = cos a und sin(−a) = − sin a. Beim Sinus würde sich bei einer bestimmten Lösung einfach −C1 statt C1 ergeben. 29 3.2.4 Lineare, inhomogene DGL 2. Ordnung: Schliesslich noch ein Beispiel ohne grossen Kommentar. Sie werden am Ende von Abschnitt 4.2 auf Seite 37 genauer erfahren, worum es sich hier handelt – und erahnen es vermutlich auch schon. Um Sie formal ein bisschen herauszufordern, heisst die Variable nun allerdings t und die davon abhängige, gesuchte Funktion ist x(t): x′′ (t) = a = const. mit RBs: x(0) = x0 und x′ (0) = v0 (17) Kennen wir die 2. Ableitung der Funktion, so erhalten wir die allgemeine Lösung durch zweimaliges unbestimmtes Integrieren: Z Z ′ ′′ x (t) = x (t) dt + C1 = a dt + C1 = at + C1 Z Z a x(t) = x′ (t) dt + C2 = (at + C1 ) dt + C2 = t2 + C1 t + C2 2 Beachten Sie, dass bei der zweimaligen Integration die Integrationskonstante C1 des ersten unbestimmten Integrals ins zweite unbestimmte Integral mitgenommen werden muss. Aus den RBs folgt für C1 und C2 : ! x(0) = C2 = x0 ! x′ (0) = C1 = v0 und Daraus ergibt sich schliesslich für die fertige Lösung (und ihre 1. Ableitung): x(t) = x0 + v0 t + a 2 t 2 und x′ (t) = v0 + at Na, kommt Ihnen das irgendwie bekannt vor? Wie schon gesagt: mehr dazu in Abschnitt 4.2. 3.3 3.3.1 Funktionen mit mehreren Variablen und partielle Ableitungen Die Notation partieller Ableitungen In Mathematik und Physik kann es durchaus vorkommen, dass eine Funktion von mehreren Variablen resp. dass eine Grösse von mehreren anderen Grössen abhängt: f = f (x, y, . . .). Beispiel: Die Zentripetalkraft FZ , also die resultierende Kraft, die notwendig ist, um einen Körper der Masse m auf einer Kreisbahn mit Radius r zu halten, wenn seine Bahngeschwindigkeit v beträgt, ist laut Newton gegeben durch: FZ = mv 2 r Bei konstanter Körpermasse hängt FZ nur noch von v und r ab.16 Wir schreiben: FZ = FZ (v, r) D.h., wir notieren FZ ganz explizit als Funktion der zwei Grössen v und r. 16 Natürlich hängt FZ immer noch von der Masse m ab, aber dieses m wird sich bei vorgegebenem Körper im Verlauf der Bewegung nicht ändern und muss deshalb nicht mehr als Variable (= “Veränderliche”) angeschaut werden. 30 Nun kann man sich fragen, wie sich FZ verändert, wenn ich den Bahnradius r unverändert lasse und nur die Bahngeschwindigkeit v variiere. Es sollte Sie nicht allzu sehr verwundern, dass wir die Antwort auf diese Frage durch Ableitung von FZ nach v erhalten. Da wir FZ als Funktion von v und r ansehen, hier aber nur nach v ableiten wollen, spricht man von einer partiellen Ableitung17 und verwendet dafür statt des differenziellen d’s das Symbol ∂: 2mv ∂FZ = ∂v r Die andere partielle Ableitung nach dem Bahnradius r lautet: mv 2 ∂FZ =− 2 ∂r r 3.3.2 Weshalb verwendet man für partielle Ableitungen eine andere Notation? Die Antwort auf diese Frage ist für unsere weiteren Betrachtungen zwar nicht so wichtig, schaden kann sie aber wohl kaum: Sind sich in unserem Beispiel von oben die Geschwindigkeit v und der Bahnradius r gleichzeitig am verändern, so existieren zwei infinitesimale Veränderungen dv und dr, die erst zusammen die infinitesimale Veränderung dFZ festlegen. Dieses dFZ bezeichnet man deshalb auch als das totale Differenzial von FZ und es gilt: dFZ = ∂FZ ∂FZ · dv + · dr ∂v ∂r Mit dem leicht modifizierten Differenzial-Symbol ∂ will man nun speziell darauf hinweisen, dass bei einer partiellen Ableitung nur eine einzige Variable verändert wird. Die anderen Variablen werden konstant gehalten. Auf diesem Hintergrund können Sie verstehen, dass in der obigen Zeile dFZ etwas wesentlich anderes als ∂FZ meint: dFZ ist die infinitesimale Veränderung von Z FZ bei infinitesimalen Veränderungen dv und dr, währenddem ∂FZ im Ausdruck ∂F ∂v für die infinitesimale Veränderung von FZ steht, wenn sich einzig v am verändern ist. Das tönt jetzt vielleicht alles etwas theoretisch, ist aber halb so wild! Wichtig ist abschliessend nochmals einfach dies: Sobald eine Funktion von mehreren Variablen abhängt, z.B. f (x, y), schreiben wir für die Ableitung nach einer dieser Variablen, z.B. nach y, neu eben ∂f ∂y und nennen dies die partielle Ableitung von f nach y. 3.3.3 Unser zentrales Beispiel: Wellenfunktion und Schrödingergleichung Wie wir im Quantenmechanik-Buch von D.J. Griffiths 18 ganz zu Beginn des ersten Kapitels lesen, ist die Wellenfunktion Ψ (x, t) jeweils die Lösung der Schrödinger-Gleichung: i~ ~2 ∂ 2 Ψ ∂Ψ =− +VΨ ∂t 2m ∂x2 (18) Ohne im Moment darauf einzugehen, was diese Wellenfunktion ist, stellen wir fest, dass es sich offenbar um eine Funktion Ψ handelt, die vom Ort x und von der Zeit t, also von zwei Variablen abhängt. Jedem Ort x wird zu jedem Zeitpunkt t ein Funktionswert Ψ (x, t) zugeordnet. 17 “Partiell” ist zu verstehen als “teilweise”: Es wird nur nach einer einzigen Variable, also nur nach einem einzelnen Bestandteil des gesamten Variablenkatalogs abgeleitet. 18 Griffiths 2012, S. 22 [1]. 31 Dem entsprechend treten in der Schrödinger-Gleichung (18) eben partielle Ableitungen auf – auf ∂2Ψ der linken Seite die einfache Ableitung ∂Ψ ∂t nach der Zeit t, rechts die zweifache Ableitung ∂x2 nach dem Ort x. Die Schrödinger-Gleichung ist somit eine partielle Differenzialgleichung. Die Lösungen der Schrödinger-Gleichung sind Funktionen Ψ (x, t), welche die Gleichung für alle Orte x und alle Zeiten t erfüllen!19 Etwas später20 werden wir die Wellenfunktion Ψ (x, t) durch den Ansatz einer Variablenseparation in einen nur noch vom Ort x abhängigen Teil ψ(x) und einen nur noch von der Zeit t abhängigen Teil ϕ(t) auftrennen: Ψ (x, t) = ψ(x) ϕ(t) Setzt man diesen Ansatz in die Schrödinger-Gleichung ein, so folgen daraus zwei neue Differentialgleichungen, eine für ψ(x) und eine für ϕ(t): − ~2 d2 ψ + V ψ = Eψ 2m dx2 und dϕ iE =− ϕ dt ~ (19) Beachten Sie, dass in diesen neuen DGLs nun wieder das d anstelle des ∂ auftaucht, weil ψ(x) und ϕ(t) je nur noch von einer einzigen Variable abhängen. Da lässt sich doch etwas wiedererkennen! Schauen Sie sich in (19) die rechte der beiden neuen iE DGLs an: Die Ableitung dϕ dt ist bis auf den Vorfaktor − ~ gleich der Funktion ϕ(t) selber. . . Klingelt da was? Na klar: Die Lösung muss eine Exponenzialfunktion sein, denn es handelt sich um die zugehörige DGL (12) von Seite 27 und somit muss sich die Lösung (13) ergeben: iE iE dϕ iE − iE − t t ϕ(t) = ae ~ = ae ~ · − ⇒ Stimmt! = − ϕ(t) ⇒ dt ~ ~ Anmerkung: Im Kontext von Funktionen mit mehreren Variablen können Sie nun gut nachvollziehen, weshalb sich die Strich-Schreibweise f ′ (x) im Prinzip nur für Funktionen mit einer einzigen Variable eignet. Was soll denn bitte f ′ (x, y) bedeuten? Wonach wird da abgeleitet? ∂f Das sollte doch explizit gesagt werden! Die differenzielle Schreibweise ∂f ∂x resp. ∂y bringt das hingegen ganz klar zum Ausdruck. 3.4 Differenzialoperatoren und mehrfache Ableitungen Ohne grosse Umstände können Sie nun ebenfalls verstehen, dass das “Ableiten nach einer bestimmten Variable” als sogenannter Differenzialoperator notiert werden kann, z.B.: d ∂ Differenzialoperator für die Ableitung nach x: resp. dx ∂x Solche (Differenzial-)Operatoren müssen offensichtlich auf Funktionen angewendet werden. Das kann auch mehrfach passieren, wie Sie es oben bereits gesehen haben. Z.B. schreibt man für die zweite Ableitung nach x: d df d2 f d ′ f (x) = = f ′′ (x) = dx dx dx dx2 Achtung! Verwechseln Sie die zweite Ableitung nicht mit dem Quadrat einer ersten Ableitung: 2 2 df d2 f ′ ′′ = f (x) = 6 f (x) = dx2 dx 19 Klar: Solche partiellen DGLs sind nochmals eine Klasse für sich. Damit setzen wir uns dann ganz konkret und länger als an dieser Stelle bei der Betrachtung von Lösungen der Schrödinger-Gleichung auseinander. 20 Griffiths 2012, S. 48 [1]. 32 4 Die klassische Mechanik – eine differenzielle Theorie Das Ziel der klassischen Mechanik nach Newton ist es, aufgrund der auf einen Körper wirkenden Kräfte dessen Ortsfunktion x(t) zu bestimmen: Zu jedem Zeitpunkt t gehört ein eindeutiger Ort x, der eben als Funktion des Zeitpunktes t aufgefasst wird. Wissen wir über die Funktionsweise der Kräfte und den aktuellen Bewegungszustand des Körpers ganz genau Bescheid, so ist seine Bewegung resp. seine Ortsfunktion x(t) bis in alle Zukunft vorausbestimmt. Klarstellung: Eigentlich handelt es sich beim Ort um einen Punkt im dreidimensionalen Raum, also um einen von der Zeit t abhängigen Ortsvektor ~r(t). Wir wollen uns hier vorerst aber auf sogenannt geradlinige Bewegungen einschränken. Dabei ist der Ausdruck “geradlinig” leicht irreführend. Es geht nicht darum nur Bewegungen längs einer Geraden zu studieren, vielmehr schränken wir uns einfach auf die Bewegung des Körpers längs einer bereits bekannten Trajektorie (= Bewegungsbahn) ein. D.h., uns interessiert nur das schneller oder langsamer Werden, nicht aber die Kurvenfahrt des Körpers. Seine Bewegung ist sozusagen auf eine Dimension eingeschränkt. Das ist auch der Grund, weshalb wir die Ortsfunktion hier x(t) nennen und damit in gewisser Weise zum Ausdruck bringen, dass sich der Körper nur längs einer vorgegebenen Bahn, die wir auf die x-Achse legen wollen, verschieben soll. Wir wollen nun nachvollziehen, wie die Newton’sche Mechanik die Ortsfunktion x(t) voraussagt. Zuerst werden wir die Kinematik, also die mathematische Beschreibung eines Bewegungsablaufs, mittels Differenzial- und Integralrechnung neu formulieren. In der Folge lässt sich das Aktionsprinzip (2. Newton’sches Axiom, F = m · a) neu verstehen, nämlich als Differenzialgleichung für die Ortsfunktion x(t). Deren Lösung liefert nicht einfach eine oder mehrere Zahlen, sondern eben eine ganze Funktion x(t), die den Bewegungsablauf des Körpers für alle Zeiten t beschreibt. Doch eins nach dem andern. Starten wir mit der Kinematik. . . 4.1 Kinematik und Differentialrechnung Zu Beginn der 1. Klasse hatten wir in der Physik Bewegungsdiagramme betrachtet, nämlich das Orts-Diagramm (t-x)21 , das Geschwindigkeits-Diagramm (t-v) und das BeschleunigungsDiagramm (t-a). Damit verbunden waren die Definitionen von Geschwindigkeit und Beschleunigung: • Momentane Geschwindigkeit v(t) = Steigung im t-x-Diagramm zum Zeitpunkt t. • Momentane Beschleungiung a(t) = Steigung im t-v-Diagramm zum Zeitpunkt t. Anfangs der 1. Klasse mussten wir unsere Berechnungen auf gerade Abschnitte der Graphen im t-xund im t-v-Diagramm einschränken, denn ohne Differentialrechnung konnten Sie damals eben erst Steigungen von Geraden bestimmen (via Steigungsdreiecke). Betrachten wir nochmals den VBZ-Trolleybus in unserem 1. Klass-Mechanik-Skript.22 Er fährt von Haltestelle X zu Haltestelle Y. Wir hatten drei Bewegungsabschnitte unterschieden: 1. Losfahren = Gleichmässig beschl. Bew. ohne Anfangsgeschwindigkeit (gmbBoA) Der Bus beschleunigt. Nach 7.0 s hat er seine Fahrtgeschwindigkeit von 12.5 ms erreicht. 2. Fahrt mit konstanter Geschwindigkeit = Gleichförmige Bewegung (gfB) Der Bus fährt während den folgenden 10 s mit seiner erreichten Geschwindigkeit weiter. 3. Abbremsen = Gleichmässig beschl. Bew. mit Anfangsgeschwindigkeit (gmbBmA) Der Bus bremst komplett ab. Dafür benötigt er eine Zeit von 5.0 s. 21 22 In der 1. Klasse hiess das Ortsdiagramm t-s-Diagramm. Gertsch 2013, S. 6ff [3]. 33 Abb. 18 zeigt die drei Bewegungsdiagramme. Nur während dem 2. Bewegungsabschnitt, also während der gleichförmigen Bewegung, konnten Sie die Geschwindigkeit aus dem Steigungsdreieck berechnen: 125 m m ∆x = = 12.5 v= ∆t 10 s s Damit wir anschliessend weitergehen und auch Beschleunigungen bestimmen konnten, gingen wir davon aus, dass Geschwindigkeitsänderungen stets gleichmässig ablaufen. Im t-v-Diagramm ergaben sich so im 1. und im 3. Bewegungsabschnitt wiederum Geraden, deren Steigungen für die jeweiligen Beschleunigungen standen und die sich eben berechnen liessen. So erhielten wir: a1 = 12.5 ms m ∆v = = 1.8 ∆t 7s s resp. a3 = −12.5 ms ∆v m = = −2.5 ∆t 5s s Abbildung 18: Die Bewegungsdiagramme zu einer Trolleybusfahrt. 34 Das war natürlich eine krasse Vereinfachung. Weshalb sollten Beschleunigungen stets gleichmässig ablaufen? Grundsätzlich sind doch beliebige Bewegungsabläufe mit variablen Beschleunigungen denkbar! Dennoch war das eben eine gute Annahme, denn so konnten Sie ein grundlegendes Verständnis für Geschwindigkeit und Beschleunigung erhalten. Dieses Verständnis bleibt auch jetzt immer noch dasselbe: • Die Geschwindigkeit v soll beschreiben, wie schnell sich der (Aufenthalts-)Ort x eines Körpers am verändern ist. • Die Beschleunigung a soll beschreiben, wie schnell sich die Geschwindigkeit v eines Körpers am verändern ist. Das sind eigentlich infinitesimale Betrachtungen. Es geht um die momentanen Veränderungsraten von x resp. v zu einem bestimmten Zeitpunkt t. D.h., wir bilden den Limes ∆t → 0 der beiden ∆v Differenzenquotienten ∆x ∆t und ∆t und erhalten so die neuen, eben differentiellen Definitionen von Geschwindigkeit und Beschleunigung: Definition der Geschwindigkeit v(t) Die momentane Geschwindigkeit v(t) ist gegeben durch die Ableitung der Ortsfunktion x(t) nach der Zeit t: v(t) ≡ x′ (t) ≡ dx ∆x ≡ lim ∆t→0 ∆t dt (20) Definition der Beschleunigung a(t) Die momentane Beschleunigung a(t) ist gegeben durch die Ableitung der Geschwindigkeitsfunktion v(t) nach der Zeit t: a(t) ≡ v ′ (t) ≡ ∆v dv ≡ lim ∆t→0 ∆t dt (21) Damit wird die Beschleunigung a(t) zur zweiten Ableitung x′′ (t) der Ortsfunktion x(t): dv d dx d2 x a(t) = v ′ (t) = = (22) = 2 = x′′ (t) dt dt dt dt Da Sie das Ableiten bereits gelernt haben, können Sie nun im Prinzip aus einer beliebigen Ortsfunktion x(t) die Geschwindigkeitsfunktion v(t) und die Beschleunigungsfunktion a(t) berechnen. Ein erstes Beispiel – die gmbBmA: Bei der gleichmässig beschleunigten Bewegung mit Anfangsgeschwindigkeit (gmbBmA) lautet die quadratische Ortsfunktion x(t) = x0 +v0 t+ a2 t2 .23 Dabei ist x0 der Startort, v0 die Anfangsgeschwindigkeit und a eben die konstante Beschleunigung. Durch Ableiten erhalten wir: v(t) = x′ (t) = v0 + at (linear!) und a(t) = v ′ (t) = a = const. (23) Zwischen den Bewegungsgleichungen der gmbBmA gibt es also einen direkten, differentiellen Zusammenhang, den Sie jetzt verstehen! 23 Vgl. Gertsch 2013, S. 14 [3]. 35 4.2 Kinematik und Integralrechnung Eben haben wir in Gleichung (20) die Geschwindigkeit v(t) als Ableitung der Ortsfunktion x(t) und in (21) die Beschleunigung a(t) als Ableitung der Geschwindigkeitfunktion v(t) definiert. Nehmen wir diese Definitionen ernst, so müssen nun in die jeweils umgekehrte Richtung auch Integralzusammenhänge gelten, so wie dies in Abschnitt 2.1.8 auf Seite 14 dargestellt wurde. Die Geschwindigkeitsfunktion v(t) ergibt sich als Integral über die Beschleunigungsfunktion a(t) und die Ortsfunktion x(t) ist gleich dem Integral über die Geschwindigkeitsfunktion v(t): v(t2 ) = v(t1 ) + Z | t2 t1 a(t) dt {z } und x(t2 ) = x(t1 ) + Z | =∆v t2 t1 v(t) dt {z } (24) =∆x Die Integrale stehen für die Veränderungen ∆v und ∆x von Geschwindigkeit und Ort während der Zeitspanne ∆t von t1 bis t2 . Wir wollen die beiden Gleichungen (24) noch ein wenig anders schreiben, nämlich so, wie wir Sie bereits aus der ersten Klasse kennen und wie wir sie ab und zu auch brauchen werden: • Wir sind frei in der Wahl des zeitlichen Nullpunktes. Daher setzen wir t1 = 0: “Die Zeitmessung soll zu Beginn des Bewegungsvorganges starten.” Für v(t1 ) und x(t1 ) schreiben wir v0 und x0 zur Kennzeichnung der Geschwindigkeit und des Ort zum Zeitpunkt t = 0. Auch v0 und x0 dürfen wir frei wählen, denn für die Wahl des örtlichen Nullpunktes und für die Wahl einer gleichförmige Bewegung des Bezugssystems gibt es in der Newton’schen Mechanik keine Einschränkungen. • Uns interessiert die Entwicklung bis zu einem Zeitpunkt t. D.h., wir setzen t2 = t. • Und schliesslich wollen wir wissen, bis zu welchem Ort der Körper bis zum Zeitpunkt t gekommen ist. x2 ersetzen wir also durch die Ortsfunktion x(t). Mit diesen Ersetzungen wird aus den Gleichungen (24) neu: v(t) = v0 + Z t a(τ ) dτ und 0 x(t) = x0 + Z t v(τ ) dτ (25) 0 Zur Notation: Da die Zeitvariable t in (25) als obere Grenze für das Integral verstanden werden soll, schreiben wir für die Zeit unter dem Integral neu τ (kleines gr. tau). Dieses τ durchläuft unter dem Integral alle Zeitpunkte von 0 bis t. Flächen unter dem Funktionsgraphen: Wir haben gerade festgestellt, dass die Momentangeschwindigkeit v(t) durch das Integral über die aktuelle Beschleunigung a(t) gegeben ist. Ebenso entspricht der aktuelle Ort x(t) dem Integral über die Momentangeschwindigkeit v(t). In einem Koordinatensystem steht das Integral für die Summe über die positiven und negativen Flächen zwischen Funktionsgraph und horizontaler Achse. Damit verstehen wir auch die folgenden beiden Zusammenhänge, die wir bereits in der 1. Klasse formuliert hatten:24 • Die zurückgelegte Strecke ∆x ist im t-v-Diagramm sichtbar als Fläche zwischen dem Graphen von v(t) und der t-Achse. • Die Geschwindigkeitsveränderung ∆v ist im t-a-Diagramm sichtbar als Fläche zwischen dem Graphen von a(t) und der t-Achse. 24 Vgl. Gertsch 2013, S. 10f [3]. 36 Beispiel: Die gleichmässig beschleunigte Bewegung Aus (25) erhalten wir bei bekannter Geschwindigkeitsentwicklung v(t) die Ortsfunktion x(t). Betrachten wir zur Veranschaulichung nochmals die gleichmässig beschleunigte Bewegung mit Anfangsgeschwindigkeit – in der 1. Klasse abgekürzt durch “gmbBmA”. “Gleichmässig” bedeutet, dass die Beschleunigung während des Vorgangs konstant bleiben soll: a(t) = a = const.. Hieraus ergibt sich mit (25) für die Geschwindigkeitsfunktion: v(t) = v0 + Z t a(τ ) dτ = v0 + Z 0 0 t t a dτ = v0 + [aτ ] = v0 + at 0 (26) Sobald wir dieses v(t) kennen, können wir auch die Ortsfunktion angeben: x(t) = x0 + Z t v(τ ) dτ = x0 + 0 Z t 0 a v0 + aτ dτ = . . . = x0 + v0 t + t2 2 (27) Die längst bekannten Bewegungsgleichungen x(t) = x0 + v0 t + a2 t2 und v(t) = v0 + at für die gleichmässig beschleunigte Bewegung mit Anfangsgeschwindigkeit sind also einfach die mathematisch logische Konsequenz der als konstant angenommenen Beschleunigung! Dieses Ergebnis hatten wir schon auf Seite 30 als Lösung der DGL x′′ (t) = a = const. mit RBs x(0) = x0 und x′ (0) = v0 erhalten. Damals hatten wir ebenfalls doppelt integriert, einfach mit unbestimmten Integralen. Den physikalischen Hintergrund hatte ich jedoch nicht erläutert. Aber woher kommt diese DGL x′′ (t) = a = const.? Rein kinematisch betrachtet ist die Sache klar: Wenn wir von einer konstanten Beschleunigung a ausgehen, dann ergeben sich die Ortsund die Geschwindigkeitsfunktion einfach so, wie wir es in den Gleichungen (27) und (26) gefunden haben. Vielleicht sollte ich die Frage anders formulieren: Unter welchen physikalischen Umständen ist denn die Beschleunigung a überhaupt konstant? Welche Bedingungen führen auf die DGL x′′ (t) = a = const. für die Ortsfunktion x(t)? Die Antwort auf diese Frage muss das Resultat einer physikalischen Theorie sein, die Aussagen dazu macht, unter welchen Rahmenbedingungen Bewegungen so oder so ablaufen. Genau dies ist die Klassische Mechanik, und wir werden gleich sehen, dass es eben das 2. Newton’sche Axiom, also das Aktionsprinzip ist, aus dem entsprechende DGLs für die Ortsfunktion x(t) hervorgehen. . . 37 4.3 Das 2. Newton’sche Axiom als Differenzialgleichung In der 1. Klasse hatten wir das Aktionsprinzip (2. Newton’sches Axiom) kennengelernt. Es besagt, dass die Beschleunigung a, die ein Körper erfährt, von der Kraft F abhängt, die auf ihn wirkt:25 F (28) m Dabei steht die Masse m für die Trägheit des Körpers. Je grösser sie ist, umso kleiner wird die Beschleunigung a bei vorgegebener Kraft F . Die Ursache der Kraft F ist in der momentanen Situation (zum Zeitpunkt t) zu suchen. Sie muss daher als Funktion des Ortes x(t), der Geschwindigkeit v(t) = x′ (t) und der Zeit t aufgefasst werden: F = F x(t), v(t), t = F x(t), x′ (t), t (29) F =m·a resp. a= Eine solche Gleichung, die eine Kraft als Funktion der “aktuellen Umstände” beschreibt, nennt man ein Kraftgesetz. Um richtig gut zu verstehen, was damit gemeint ist, folgen weiter unten ein paar Beispiele von Situationen, bei denen Ihnen die Kraftgesetze zumindest teilweise bereits bekannt sind. Gemäss (22) ist die Beschleunigung a(t) die zweite Ableitung x′′ (t) der Ortsfunktion x(t). Damit notieren wir das 2. Newton’sche Axiom (28) nun in neuer Form: Differenzielle Formulierung des 2. Newton’schen Axioms (Aktionsprinzip) für geradlinige Bewegungen Erfährt ein Körper die vom Ort x, der Geschwindigkeit x′ und der Zeit t abhängige Kraft F (x, x′ , t), so erfüllt seine Ortsfunktion x(t) die DGL: F (x, x′ , t) = m · x′′ (30) Dabei ist m die Masse des Körpers. In (30) und bei einigen nachfolgenden Gleichungen habe ich bei x(t), x′ (t) und x′′ (t) das Argument (t) zugunsten einer besseren Übersichtlichkeit weggelassen. Wir bemerken: Das Aktionsprinzip entspricht einer DGL 2. Ordnung für die Ortsfunktion x(t)! Gesucht ist also eine Funktion x(t), welche diese DGL zu jedem beliebigen Zeitpunkt t erfüllt. Als DGL 2. Ordnung tauchen bei der Lösung in der Regel zwei freie Parameter auf, die typischerweise durch die Vorgabe von Rand- resp. Anfangsbedingungen wie dem Startort x0 und der Anfangsgeschwindigkeit v0 festgelegt werden. Anmerkung: Nach wie vor betrachten wir geradlinige, also von vornherein auf 1 Dimension eingeschränkte Bewegungen. Das Aktionsprinzip (30) gilt aber auch im Dreidimensionalen. Dann wird der Ort durch den Ortsvektor ~r(t) beschrieben. Kraft, Geschwindigkeit und Beschleunigung sind Vektoren: ~ (~r, ~r ′ , t) = m · ~r ′′ 3D-Aktionsprinzip: F Natürlich müssten wir nun erläutern, wie die Ableitung eines Vektors zu bilden ist, was also unter ~r ′ und ~r ′′ genau zu verstehen ist. Das lassen wir im Moment allerdings beiseite, weil wir nicht unmittelbar damit arbeiten werden. Es genügt zu wissen, dass es diese Vektoren gibt und dass sie wohldefiniert sind. 25 An dieser Stelle hatten wir in der 1. Klasse stets von der resultierenden Kraft Fres gesprochen. Im Prinzip gilt (28) aber bereits für jede einzelne auf den Körper wirkende Kraft F . Jede solche Kraft erzeugt eine Beschleunigung a. Und ob wir nun zuerst Kräfte zur resultierenden Kraft oder erst anschliessend die daraus hervorgehenden Beschleunigungen aufaddieren, spielt keine Rolle. Das Entscheidende ist, dass diese Addition – egal ob von Kräften oder von Beschleunigungen – vektoriell erfolgt (vgl. Vektorgeometrie: “Vektoraddition = Pfeile aneinanderhängen”). Dies wird häufig als 4. Newton’sches Axiom, Überlagerungs- oder Superpositionsprinzip bezeichnet. 38 4.4 4.4.1 Beispiele zu Kraftgesetzen und daraus folgenden DGLs für x(t) Freier Fall an der Erdoberfläche Wir betrachten ein Objekt in der Luft an der Erdoberfläche. Solange dabei Luftwiderstand und Auftrieb vernachlässigbar klein sind, ist die Gewichtskraft FG die einzige Kraft, die auf den Körper wirkt. Wir bezeichnen diese Situation als freien Fall. Wir reduzieren unsere Betrachtung auf eine einzige Dimension, nämlich auf Bewegungen längs einer vertikalen Ortsache (→ senkrechter Wurf). Deren positive Richtung zeige nach oben, sodass im Kraftgesetz für die Gewichtskraft ein negatives Vorzeichen auftritt: FG = −mg N der altbekannte Ortsfaktor. Das Aktionsprinzip resp. die DGL für ein frei Darin ist g = 9.81 kg fallendes Objekt lautet somit: F = −mg = mx′′ resp. x′′ = −g = const. (31) Der freie Fall ist ein Beispiel für eine konstante (resultierende) Kraft F . Das Kraftgesetz hängt weder vom Ort x, noch von der Geschwindigkeit x′ , noch von der Zeit t ab. Wir betrachten also gerade den einfachst möglichen Fall einer beschleunigten Bewegung. Sobald die Kraft F gleich bleibt, haben wir es mit einer konstanten Beschleunigung zu tun.26 In der 1. Klasse hatten wir unsere Betrachtungen praktisch vollständig auf solche Situationen eingeschränkt, weil dabei stets gleichmässig beschleunigte Vorgänge herauskamen – und die konnten wir eben mit den Gleichungen zur gleichmässig beschleunigten Bewegung (gmbB) behandeln. Die zu (31) gehörige Lösung haben wir schon mehrfach gesehen (siehe insbesondere Seiten 30 und 37). Mit RBs x(0) = x0 und x′ (0) = v0 lautet sie: x(t) = x0 + v0 t − 4.4.2 g 2 t 2 und v(t) = x′ (t) = v0 − gt Fallen mit Luftwiderstand Ergänzen wir nun den freien Fall durch einen Luftwiderstand FL . Dieser ist typischerweise proportional zum Quadrat der Geschwindigkeit v 2 = (x′ )2 . Ausserdem ist er der aktuellen Bewegung entgegengerichtet. Das lässt sich folgendermassen formulieren: FL = −c · (x′ )2 · c · (x′ )3 x′ =− ′ |x | |x′ | ′ ′ Dabei ermittelt der Bruch |xx′ | das Vorzeichen der Geschwindigkeit27 und − |xx′ | kehrt dieses Vorzeichen um, sodass der Luftwiderstand eben stets entgegen der aktuellen Bewegungsrichtung wirkt. Der Betrag des Luftwiderstandes ist durch c · (x′ )2 gegeben. c steht für eine Konstante, die verschiedene Informationen enthält, wie z.B. die Luftdichte, den Strömungswiderstand des Gegenstandes28 oder die Angriffsfläche, mit der er gegen die Bewegungsrichtung ausgerichtet ist. Alles zusammen ergibt sich so für das 2. Newton’sche Axiom als DGL: mx′′ = FG + FL = −mg − c · (x′ )3 |x′ | 26 resp. x′′ = −g − c · (x′ )3 m · |x′ | (32) Soviel zur Frage am Ende von Abschnitt 4.2 auf Seite 36. a a Probieren Sie es aus! Für eine positive Zahl a > 0 ist |a| = +1, für eine negative Zahl a < 0 ist |a| = −1. 28 Dieser Strömungswiderstand hat mit der Form des Gegenstandes und seiner Oberflächenbeschaffenheit zu tun. Ausserdem kommt es darauf an, mit welcher Ausrichtung der Gegenstand durch die Luft fliegt – ein quer zur Flugrichtung stehendes Flugzeug wäre aerodynamisch sicher sehr ungeeignet. . . 27 39 Der Körper sei in Abwärtsrichtung unterwegs. Dann ist x′ < 0 und (32) vereinfacht sich zu: x′′ = −g + c · (x′ )2 m resp. x′′ − c ′ 2 (x ) = −g m (33) Für diese inhomogene und nicht-lineare DGL 2. Ordnung gibt es in aller Allgemeinheit keine geschlossene Lösung. In einer Übung werden Sie einen Spezialfall davon untersuchen können.29 Eines ist allerdings klar: Es gibt einen stabilen Endzustand, in dem der Körper nicht mehr beschleunigt. Ist nämlich x′′ = 0, so gilt: r mg c ′ 2 ′ ′′ (x ) = g resp. x = − x =0 ⇒ m c Diesen Grenzfall kennt man z.B. vom Fallen aus einem Flugzeug. Behält ein Mensch seine Flugposition bei, so wird er in etwa eine Grenzgeschwindigkeit von x′ ≈ −200 km h erreichen. Dann ist FL gleich gross wie die FG und es findet keine weitere Beschleunigung mehr statt (x′′ = 0). 4.4.3 Der klassische, ungedämpfte harmonische Oszillator An eine (selber masselose) Spiralfeder hängen wir eine Kugel mit Masse m. Der Ort x dieses Federpendels sei gegeben durch den Verbindungspunkt zwischen Spiralfeder und Kugel. In Abb. 19 sehen Sie links zunächst die Spiralfeder ohne angehängte Kugel. Dies ist die entspannte Lage des Pendels. Wir bezeichnen den zugehörigen Ort mit xe . Bei angehängter Kugel gibt es eine Ruhelage, also ein Höhe, auf der das Pendel ruhig hängen bleiben kann. Da wir in der Wahl des Nullpunktes unserer vertikalen x-Achse prinzipiell frei sind, dürfen wir festlegen, dass x = 0 der Ruhelage entspricht. Diese Wahl ist überhaupt nicht zwingend, wird sich aber rechnerisch als sehr praktisch erweisen.30 Abbildung 19: Situationen beim Federpendel: entspannte Lage, Ruhelage und eine beliebige Lage. c (x′ )2 = 0. Ein Körper hat Dabei geht es um die schwerelose Situation (g = 0), also um die homogene DGL x′′ − m ′ eine Anfangsgeschwindigkeit x (0) = v0 , mit der er in ein Gas eintaucht. Die Endgeschwindigkeit wird dann v∞ = 0 sein. Wie aber sieht die Geschwindigkeitsentwicklung bis dahin aus? 30 Das wird Sie nicht überraschen, denn Sie wissen ja bereits, dass ein Pendel um seine Ruhelage schwingt. D.h., diese Lage ist ein Symmetriepunkt der Bewegung. Lernen Sie einmal mehr: Wenn man Symmetrien ausnutzen kann, sollte man das auch tun, denn dadurch vereinfacht sich die Mathematik in der Regel drastisch. Konkret heisst das: Die Wahl des Koordinatensystems will stets gut überlegt, also an die Symmetrie des Problems angepasst sein. 29 40 Betrachten wir schliesslich das rauf und runter schwingende Pendel. Zu irgendeinem Zeitpunkt t befindet es sich am Ort x(t). Genau diese Ortsfunktion suchen wir. Sie wird sich aus einer DGL ergeben, wie das in der klassischen Mechanik eben sein muss. Die RBs ergeben sich durch die Art, wie wir die Pendelschwingung gestartet haben. Ich nehme an, wir haben das Pendel aus der Ruhelage um die Höhe A angehoben und dann losgelassen. Dieser Moment des Loslassens definiert den Zeitpunkt t = 0, für den offenbar gilt: RBs: x(0) = A und x′ (0) = 0 Nun betrachten wir die Kräfte, die auf das Pendel wirken: • Wir wollen von einer ungedämpften Schwingung ausgehen. D.h., wir tun so, als gäbe es keinerlei Luftwiderstand oder sonstige Reibungseffekt, sodass das Pendel im Prinzip unendlich lange weiterschwingen würde. • Die Gewichtskraft FG zieht die Kugel nach unten. Sie ist konstant und gegeben durch: FG = −mg (34) • Die Federkraft FF zieht die Kugel nach oben. Sie verändert sich ständig, weil sie in jedem Moment davon abhängt, an welchem Ort x sich das Pendel gerade befindet. Das Kraftgesetz für solche Spiralfedern und viele andere elastische Gegenstände lautet:31 Das Hooke’sche Federgesetz Die Federkraft FF ist proportional zur Dehnung s (= Verlängerung oder Auslenkung) der Feder aus ihrer entspannten Lage: FF = Ds (35) Dabei steht D für die Federkonstante, ein Wert, der die Stärke oder Härte N angegeben wird. einer Feder beschreibt und in der Einheit m Zur Verdeutlichung: Jede Spiralfeder besitzt ihre eigene Federkonstante D in “Newton pro N ). Die Federkonstante D beantwortet also die Frage, wie viele Newton Kraft Meter” (= m es bräuchte, um die Spiralfeder um einen ganzen Meter zu dehnen.32 Wegen der Proportionalität von Dehnung s und Federkraft FF sind die Skalen auf Federwaagen schön regelmässig – wie praktisch! Nun geht es uns aber um eine andere Konsequenz des Federgesetzes resp. dieser Proportionalität, nämlich um die reine Sinusresp. Cosinusschwingung eines Federpendels. Diesen Bewegungstyp beobachten wir bei allen schwingenden Systemen, bei denen die rücktreibende Kraft proportional zur Auslenkung ist!33 Bei unserer Feder ist die Dehnung s die Distanz zwischen der entspannten Lage xe und der weiter unten liegenden aktuellen Lage x: s(x) = xe − x Somit gilt für die nach oben am Pendel ziehende Federkraft FF am Ort x: FF (x) = Ds(x) = D xe − x 31 (36) Robert Hooke (1635 – 1703), ein englischer Universalgelehrter und Zeitgenosse Newtons, wenn auch nicht gerade sein bester Freund. . . Er untersuchte mitunter die Elastizitätseigenschaften verschiedener Materialien. 32 Natürlich wären die meisten unserer kleinen, alltäglichen Spiralfedern längst überdehnt (und damit kaputt), wenn man sie tatsächlich um einen ganzen Meter verlängern würde. . . 33 Z.B. ist dies auch beim durch die Erde fallenden Stein in Abb. 21 auf Seite 46 der Fall. 41 Mit (34) und (36) haben wir nun alles beisammen, um die DGL für das Federpendel aufzustellen. Aus dem Aktionsprinzip (30) folgt: FF (x) + FG = D xe − x − mg = mx′′ (37) Im Prinzip kennen wir mit dem in der Ruhelage ruhenden Pendel bereits eine Lösung der DGL, auch wenn es sich dabei um den ganz trivialen Fall x(t) = 0 handelt. Aber auch dieser Fall muss durch die DGL abgedeckt sein. Schauen wir kurz, was wir daraus folgern können! In der Ruhesituation ist sowohl x = 0, als auch x′′ = 0 und es folgt: FF (0) + FG = D xe − 0 − mg = 0 ⇒ Dxe = mg (38) Das wussten wir ja eigentlich schon seit jeher. In der Ruhesituation herrscht einfach das Kräftegleichgewicht zwischen FF und FG . Mit (38) lässt sich nun aber (37) wesentlich vereinfachen: ! D xe − x − mg = Dxe − Dx − mg = mg − Dx − mg = −Dx = mx′′ Und schon steht sie da, unsere DGL für das Federpendel: x′′ = −ω 2 x mit ω2 ≡ D m (39) In Worten: “Die zweite Ableitung x′′ (t) welcher Funktion x(t) entspricht bis auf ein Minuszeichen und einen konstanten Faktor ω 2 wieder der Funktion x(t) selber?” Diese Frage resp. diese DGL haben wir bereits gelöst. In der DGL (14) auf Seite 28, als wir DGLs noch ohne physikalischen Kontext betrachtet hatten, lautete die gesuchte Funktion einfach y(x) statt x(t), zudem habe ich die damalige Konstante k neuerdings in ω (= gr. kleines omega) umbenannt. Das sind lediglich neue Bezeichnungen, die Sie nicht weiter stören sollten! Machen Sie sich jeweils klar, welches die Variable ist und wie die Funktion heisst, die davon abhängen soll. Nutzen wir doch unsere damalige Vorarbeit aus und schreiben direkt die allgemeine Lösung auf (vgl. (15) auf Seite 29): x(t) = C1 sin(ωt) + C2 cos(ωt) Unsere RBs lassen das Pendel zum Zeitpunkt t = 0 auf der Höhe x(0) = A mit Geschwindigkeit x′ (0) = 0 starten. Daraus folgt für die fertige Lösung: x(t) = A cos(ωt) (40) Diskussion der Lösung • Feststellung: Das Resultat ist eine mathematisch exakte Sinus- resp. Cosinusschwingung. Das an sich ist schon sehr bemerkenswert: Aus der Proportionalität des Hooke’schen Federgesetzes – also aus einem linearen Zusammenhang! – geht die perfekte Cosinuskurve hervor. • Die anfänglich vorgegebene Starthöhe A bleibt als Amplitude (= Höhe des Pendelausschlags) in der Schwingung erhalten. • Der Parameter ω heisst Kreisfrequenz. Er bestimmt, wie rasch die Schwingung abläuft, hängt also direkt mit der Periode T resp. der Frequenz f der Schwingung zusammen: ω= 2π = 2πf T Das ermöglicht uns einen richtigen Erkenntnisgewinn zum Federpendel! Wovon hängt denn die Schwingungsperiode T eines solchen Pendels ab? Antwort: r r m D ω 1 2π = 2π resp. f= = T = ω D 2π 2π m 42 Die Periode T ist proportional zur Wurzel der Pendelmasse m. Je mehr Masse am Pendel hängt, umso träger ist es und umso länger wird eine ganze Schwingung eben dauern. Umgekehrt schwingt das Pendel schneller, je härter die Feder, je grösser also die Federkonstante D ist. Das wollen wir uns nochmals auf der Zunge zergehen lassen: Wir haben nun, ausgehend vom Aktionsprinzip und dem Hooke’schen Federgesetz, theoretisch hergeleitet, wovon die Schwingungsfrequenz eines Federpendels abhängt – und wovon nicht! Wie viele Leute meinen z.B., dass die Pendelfrequenz durch die anfänglich mitgegebene Amplitude mitbestimmt wird. Dem ist effektiv nicht so. Das Pendel schwingt bei allen Amplituden gleich schnell! Diese Resultate lassen sich im Experiment übrigens bestens bestätigen. Natürlich kommen ein paar Nebeneffekte hinzu: – Die reale Pendelmasse ist etwas grösser als nur die Kugelmasse, denn ein Teil die Federmasse schwingt ja auch mit. – Es gibt bremsende Effekte, die das Pendel nach und nach zum Stillstand bringen. Dazu gehören z.B. der Luftwiderstand oder ev. auch die Reibung bei der Aufhängung.34 Ohne diese bremsenden Effekte sprechen wir von einer ungedämpften Schwingung. • Für die Geschwindigkeitsfunktion erhalten wir: v(t) = x′ (t) = −Aω · sin(ωt) = −vmax · sin(ωt) mit vmax = Aω Gerne weise ich nochmals auf die Kettenregel hin: − sin(ωt) ist die äussere Ableitung von cos(ωt). Die innere Ableitung des Cosinusargumentes ωt liefert einen zusätzlichen Faktor ω. Ohne diesen neuen Faktor ω könnte es sich bei v(t) gar nicht um eine Geschwindigkeitsfunktion handeln: Es muss ja so sein, dass der neue Vorfaktor vmax = Aω einer Geschwindigkeit entspricht, denn die Sinusfunktion hintendran ist dimensionslos.35 Die Amplitude A steht alleine aber erst für eine Strecke. Es muss also noch durch eine Zeit dividiert werden – und genau dies passiert durch die Multiplikation mit ω, denn dieses besitzt die physikalische Dimension 1 Zeit . Die Kettenregel sorgt somit für die korrekte physikalische Dimension der Ableitung! vmax = Aω steht für die maximale Geschwindigkeit, die das Pendel immer dann erreicht, wenn es die Ruhelage x = 0 passiert. • Der Vollständigkeit halber überprüfen wir nochmals die Richtigkeit der Lösung, indem wir ein zweites Mal ableiten: x′′ (t) = a(t) = v ′ (t) = −Aω 2 · cos(ωt) = −ω 2 x(t) • Wo hat es uns nun eigentlich geholfen, dass wir x = 0 mit der Ruhelage xR identifiziert haben? Hätten wir das nicht gemacht, so müsste unsere Lösung lauten: x(t) = xR + A cos(ωt) Gleichzeitig wäre die DGL inhomogen statt homogen herausgekommen: x′′ = −ω 2 (x − xR ) Nun ist bei homogenen DGLs die Lösung in der Regel einfacher zu finden als bei inhomogenen. Wenn man also durch das Ausnutzen einer Symmetrie das Problem auf eine homogene DGL reduzieren kann, so ist das doch etwas Begrüssenswertes. 34 35 In den Übungen untersuchen Sie, welche Auswirkungen ein zur Geschwindigkeit proportionaler Bremseffekt hat. Der Sinus ist schliesslich einfach eine Zahl zwischen −1 und +1. 43 Fassen wir zum Schluss dieses Beispiels nochmals das Wichtigste zusammen: Der klassische, ungedämpfte harmonische Oszillator Gehorcht ein Körper ausschliesslich einem Kraftgesetz, das ihn stets in Richtung einer Ruhelage drückt und bei dem der Kraftbetrag proportional zum aktuellen Abstand zu dieser Ruhelage ist, so sprechen wir von einem ungedämpften harmonischen Oszillator. Legen wir die Ruhelage in den Ursprung (x = 0), so folgt aus dem Aktionsprinzip der klassischen Mechanik die zugehörige DGL für die Ortsfunktion x(t): x′′ = −ω 2 x (41) Die allgemeine Lösung ist eine harmonische Schwingung, beschrieben durch: x(t) = A1 sin(ωt) + A2 cos(ωt) (42) Dabei steht ω für die Kreisfrequenz, die folgendermassen mit Periode T und Frequenz f der Schwingung zusammenhängt: ω= 4.4.4 2π = 2πf T Gravitationsgesetz im Eindimensionalen In Abschnitt 4.4.1 hatten wir den freien Fall eines Objektes an der Erdoberfläche betrachtet. Nun wollen wir die Erdoberfläche verlassen. Die Gravitation FG sei aber immer noch die einzige auf das Objekt wirkende Kraft und wir schränken seine Bewegung nach wie vor auf eine einzige Dimension ein. Je näher das Objekt an der Erde dran ist, umso grösser ist die Schwerkraft, mit der es von ihr angezogen wird. Auf einer x-Achse, die gerade durch die Erde hindurchsticht und deren Nullpunkt im Erdmittelpunkt liegt, ist das Kraftgesetz für die Erdanziehung gegeben durch das Newton’sche Gravitationsgesetz: GM mx GM m x =− · (43) F (x) = − 2 x |x| |x|3 Dabei ist G die universelle Gravitationskonstante, M die Erdmasse und m die Körpermasse.36 x Der Faktor |x| sorgt, wie schon beim Luftwiderstand in Abschnitt 4.4.2, für das richtige Vorzeix chen: Für ein x > 0 auf der positiven Ortsachse ist − |x| = −1 und die Gewichtskraft zeigt in die x negative Richtung. Für ein x < 0 auf der negativen Ortsachse ist − |x| = +1 und die Gewichtskraft zeigt in die positive Richtung. Das ist genau richtig so, denn der Erdmittelpunkt soll ja eben bei x = 0 sitzen. m steht für den Betrag der gravitativen Kraft F am Ort x, also für ihre Stärke. Der Bruch GM x2 x Daneben sorgt der Faktor − |x| für die richtige Richtung von F : Die Kraft F zeigt in die negative Richtung für alle x > 0 und in die positive Richtung für alle x > 0. Ganz rechts in (43) steht schliesslich die Zusammenfassung zu einem einzigen Bruch.37 2 G = 6.673 · 10−11 N·m , M = 5.97 · 1024 kg und R = 6370 km. kg2 37 Dabei bemerke man, dass für reelle Zahlen x stets gilt: x2 = |x|2 . 36 44 Abbildung 20: Der Verlauf der Gravitation in Abhängigkeit von der Distanz zum Erdmittelpunkt. Innerhalb der Erde ist das Kraftgesetz proportional zu x, ausserhalb proportional zu x12 . Die Kraftangaben beziehen sich auf einen Körper der Masse 1 kg. Das Kraftgesetz (43) gilt so allerdings nur für |x| ≥ R (= Erdradius), also für Orte x ausserhalb der Erde. Dort nimmt die Anziehungskraft proportional zu x12 ab. Im Erdinneren gilt hingegen ein anderes Gravitationsgesetz: GM mx F (x) = − (44) R3 Bereits Newton kannte dieses Kraftgesetz im Erdinneren. Man erhält es aus der Annahme, dass die Erde ein homogener Planet ist, dass also ihre Dichte überall gleich gross ist. Die Anziehungskraft im Erdinneren ist gemäss (44) proportional zur Distanz zum Erdmittelpunkt. Im Erdmittelpunkt ist sie gleich Null, denn dort wird man von der Erde von allen Seiten her gravitativ gleich stark angezogen, sodass sich alle diese Kräfte gegenseitig aufheben. Abb. 20 zeigt den Verlauf der gravitativen Anziehung innerhalb und ausserhalb der Erde. Zusammengefasst kann man dafür nun auch schreiben: GM m für x < −R x2 GM mx F (x) = für − R < x < R − R3 − GM m für x > R x2 Ausserhalb der Erde lautet nun das 2. Newton’sche Axiom für die Bewegung eines Körpers unter dem ausschliesslichen Einfluss der Gravitation: mx′′ = F (x) = − GM mx |x|3 Aus Symmetriegründen reicht es den Bereich x ≥ R zu betrachten. Dann ist |x| = x und es kürzt sich neben m zudem ein x aus der Gleichung, sodass folgt: x′′ = − GM x2 Dies ist eine nicht-lineare DGL 2. Ordnung. Sie muss mitunter beschreiben, wie die Bewegung eines Körpers verläuft, den wir aus sehr grosser Höhe auf die Erde fallen lassen. Auf eine nähere Lösungsbetrachtung verzichten wir aber an dieser Stelle. 45 Abbildung 21: Angenommen, wir könnten einen geraden Tunnel vom Nord- zum Südpol der Erde graben, ihn evakuieren und würden anschliessend auf der einen Seite einen Stein hineinfallen lassen (RBs: x(0) = R und x′ (0) = 0). Wie würde sich dieser Stein bewegen? Womit wäre die Bewegung vergleichbar? Analog führt uns das 2. Newton’sche Axiom innerhalb der Erde auf die DGL: x′′ = −ω 2 x mit ω2 = GM R3 Diese DGL und ihre Lösung kennen wir bereits (vgl. Seite 44). Was für eine tolle Antwort folgt daraus für die in Abb. 21 gezeigte Situation? Die Antwort steht in der Fussnote.38 4.4.5 Beispiel für eine explizit von der Zeit abhängige Kraft Bei allen bisherigen Beispielen war das Kraftgesetz nur vom Ort x und/oder der Geschwindigkeit x′ des Körpers abhängig: F = F (x, x′ ) – oder die Kraft war konstant. Nun möchten wir auch noch ein Beispiel untersuchen, bei dem das Kraftgesetz eine explizite Zeitabhängigkeit aufweist. Zur Verdeutlichung: Bei einer von x oder x′ abhängigen Kraft berechnet sich die Kraft aus der Angabe des aktuellen Ortes x und der aktuellen Geschwindigkeit x′ des Körpers, und zwar unabhängig davon, wie sich diese beiden Grössen weiterentwickeln. Natürlich hängen x und x′ selber von der Zeit ab, sie entwickeln sich ja eben. Aber diese indirekte Zeitabhängigkeit ist nicht gemeint, wenn ein Kraftgesetz explizit von der Zeit t abhängt. Eine explizite Zeitabhängigkeit bedeutet vielmehr, dass sich die Kraft verändern kann, auch wenn der Ort x oder die Geschwindigkeit x′ des Körpers gleich bleiben. Im Kraftgesetz muss der Zeitpunkt t daher als eigenständige Variable auftreten. Damit Sie klar verstehen, was das heisst, folgt hier ein Beispiel, bei dem das Kraftgesetz ausschliesslich von der Zeit t abhängt: F = F (t). 38 Klar! Der Stein schwingt zwischen dem Nord- und dem Südpol hin und her, genau so, wie ein Federpendel auf und ab schwingt (vgl. Kasten auf Seite 44). Konkret würde die Lösung lauten: x(t) = R · cos(ωt) In den Übungen können Sie berechnen, wie lange eine Periode dieser “Steinschwingung” dauern würde. 46 Abbildung 22: Einschuss eines Elektrons ins elektrische Wechselfeld eines Plattenkondensators. Elektron im Plattenkondensator (vgl. Abb. 22): Wir betrachten ein Elektron, das zum Zeitpunkt t = 0 durch ein kleines Löchlein in der linken Platte in den Innenraum eines Plattenkondensators eingeschossen wird. Die linke Platte sitzt am Ort x = 0 und somit ist auch der Startort des Elektron x(0) = 0. Seine fängliche Geschwindigkeit betrage x′ (0) = v0 . Die Ladungen der Kondensatorplatten werden andauernd verändert, sodass sich auch das homogene39 elektrische Feld E dazwischen ständig verändert. Es gelte: E = E(t) = Emax · cos(ωt) Es handelt sich somit um ein Wechselfeld mit maximaler Feldstärke Emax (= Amplitude) und Kreisfrequenz ω. Beim Eintritt des Elektrons ins Feld (Zeitpunkt t = 0) zeigt das E-Feld gerade maximal in die positive Richtung – dafür sorgt die Cosinusfunktion (cos 0 = +1). Die elektrische Kraft auf das Elektron: In diesem elektischen Feld erfährt das negativ geladene Elektron (Ladung −e = −1.602·10−19 C) eine elektrische Kraft Fel , die stets entgegengesetzt zum elektrischen Feld steht: Fel = Fel (t) = −eE(t) = −eEmax · cos(ωt) Abgesehen von dieser elektrischen Kraft gibt es keine weiteren Kräfte.40 Fel hängt offensichtlich nur von der Zeit t ab. Der Ort x und die Geschwindigkeit x′ des Elektrons haben darauf keinen Einfluss. Die Aktionsprinzip-DGL: Mit dem 2. Newton’schen Axiom erhalten wir die DGL mit Anfangsbedingungen: mx′′ = −eEmax · cos(ωt) mit RBs: x(0) = 0 und x′ (0) = v0 Zur Lösung stellen wir zuerst ein wenig um und vereinfachen durch das Zusammennehmen mehrerer Konstanten zu einer einzigen: eEmax · cos(ωt) = −α · cos(ωt) m Damit ist die Sache übersichtlicher geworden. x′′ = − mit α≡ eEmax m 39 Homogen bedeutet, das E-Feld ist an allen Orten im Plattenkondensator gleich stark und gleich gerichtet. Homogen bedeutet hingegen nicht, dass das E-Feld zeitlich konstant ist. Es soll sich ja eben um ein Wechselfeld handeln. 40 Der Innenraum des Plattenkondensators sei evakuiert und im Vergleich zur elektrischen Kraft ist die Gewichtskraft aufgrund der geringen Elektronenmasse verschwindend klein und somit ohne messbaren Fehler vernachlässigbar. 47 Lösung: Da in x′′ = −α cos(ωt) die Ortsfunktion x und ihre Ableitung x′ rechts gar nicht vorkommen, erhalten wir die Lösung, indem wir zweimal integrieren (vgl. Abschnitt 4.2):41 v(t) = x′ (t) = v0 + Z 0 t x′′ (τ ) dτ = v0 − α Z t cos(ωτ ) dτ (45) 0 R Doch halt! Diese Integration will wohl überlegt sein. Wir wissen zwar, dass cos x dx = sin x + C ist, aber wie sieht es aus, wenn im Argument des Cosinus noch ein Vorfaktor ω ∈ R steht? Das Stichwort lautet Reskalierungs-Trick (vgl. 2.4.3). Damit folgt: Z t Z α ωt α cos(ωτ ) dτ = v0 − v(t) = v0 − α (46) cos y dy = v0 − sin(ωt) ω 0 ω 0 Nun integrieren wir noch ein zweites Mal, um x(t) zu erhalten: Z t α v0 − · sin(ωτ ) dτ v(τ ) dτ = x0 + x(t) = x0 + ω 0 0 i h α α α t = x0 + v0 τ + 2 · cos(ωτ ) = x0 + v0 t + 2 · cos(ωt) − 2 ω ω ω 0 Z t Mit dem Einbau der Ortsrandbedingung x0 = x(0) = 0 folgt schliesslich: x(t) = v0 t + α · cos(ωt) − 1 ω2 Das −1 in der Klammer sorgt dafür, dass der Startort auch tatsächlich x(0) = 0 ist, denn cos 0 = 1. Das Elektron vollführt nun also eine Bewegung, die aus der Summe einer linearen und einer Cosinusfunktion besteht. Das ergibt beispielsweise eine Ortsfunktion, wie sie in Abb. 23 gezeigt wird. Abbildung 23: Im Prinzip mögliche Ortsfunktion x(t) für das Elektron im Plattenkondensator. 41 Beachten Sie wieder: Die Zeit t der oberen Integrationsgrenze ist der Zeitpunkt, bis zu dem integriert wird. Die Laufvariable τ unter dem Integral steht für die Zeitpunkte von 0 bis t. Deshalb unterscheiden wir sie vom Endzeitpunkt t mittels eines griechischen t’s, eben einem tau τ . 48 4.5 4.5.1 Konservative Kräfte, Aktionsprinzip und Energieerhaltung Das Potenzial V (x, t) – ein allgemeinerer Blick auf die potenzielle Energie In der 1. Klasse bezog sich der Begriff der potenziellen Energie Epot ausschliesslich auf die Gravitation.42 Dieses Verständnis wollen wir nun etwas erweitern. Grundsätzlich verstehen wir jede Energie der Lage als eine potenzielle Energie V . Je nachdem, wo sich der Körper gerade aufhält, besitzt er mehr oder weniger potenzielle Energie: V = V (x). Diese Energiefunktion V (x) wird oft einfach als Potenzial bezeichnet. Die folgenden Gedankengänge sollen aufzeigen, wie wir zu den Gleichungen verschiedener Potenziale V (x) gelangen und weshalb wir dabei zwischen konservativen und dissipativen Kräften unterscheiden müssen. “Energieumsatz = Verschiebungsarbeit”: Wird ein Körper entgegengesetzt zu einer Kraft F bewegt, so muss man dafür Arbeit an ihm verrichten resp. die Energie ∆E aufwenden. Typische Beispiele sind: – – – – – Anheben eines Buchs gegen die Gewichtskraft FG . Verschieben eines Schranks gegen die Reibungskraft FR . Dehnen einer Feder gegen die Federkraft FF . Bewegung gegen den Luftwiderstand FL . Verschieben einer el. Ladung gegen die el. Kraft Fel in einem homogenen E-Feld. Nicht interessieren soll uns, woher oder von wem der für diese Bewegung notwendige Energieumsatz ∆E kommt resp. aufgebracht wird. Der Arbeitsdefinition folgend – “Arbeit ist Kraft mal Weg” – notieren wir für den Energieumsatz ∆E in differenzieller Form (∆E → dE): dE = −F (x) · dx dE ist der infinitesimale Energieumsatz, der aufgewendet werden muss, um den Körper um das infinitesimale Wegstück dx gegen die Kraft F (x) zu bewegen. F (x) und dx sind gegeneinander gerichtet, sodass ihr Produkt F (x) dx eine negative Zahl ergibt. Wir möchten aber, dass der dem Körper zugeführte Energieumsatz positiv herauskommt und fügen deshalb ein Minuszeichen ein.43 Speicherung des Energieumsatzes und Berechnung des Potenzials V (x): Wie gerade erläutert, muss zur Bewegung des Körpers gegen die Kraft F Verschiebungsarbeit verrichtet werden. Dieser investierte Energieumsatz ist nicht einfach verpufft, sondern er steckt anschliessend in einer anderen Energieform. Das Potenzial V (x) eines Körpers am Ort x entspricht dem Energieumsatz, den wir investieren mussten, um den Körper an diesen Ort zu bringen. Von wo aus? Von einem frei wählbaren Nullniveau x0 aus, an dem die potenzielle Energie eben gleich Null sein soll: V (x0 ) = 0. Zur Berechnung des Potenzials V (x) müssen somit die infinitesimalen Arbeitsbeträge dE über die Strecke vom Nullniveau x0 bis zum Ort x aufaddiert werden. D.h., es wird integriert:44 Z x V (x) = ∆E = − F (ξ) dξ (47) x0 42 Gravitative Epot : Je weiter oben ein Körper ist, umso mehr potenzielle Energie hat er, weil der dann weiter fallen kann, mehr Arbeit verrichten kann, “gefährlicher” ist, . . . 43 ~ (~r) · d~r. Es wird also das Skalarprodukt von Kraftvektor Im Dreidimensionalen müsste man schreiben: dE = −F ~ F (~r) und infinitesimalem Verschiebungsvektor ~r gebildet. Die Aussage bleibt allerdings die gleiche: Dieses Skalarprodukt ~ (~r) und ~r “eher” einander entgegengerichtet sind (Zwischenwinkel ϕ > 90◦ ). generiert ein negatives Vorzeichen, wenn F Genau dann soll aber der Energieumsatz positiv sein, und so braucht es wiederum ein Minuszeichen. 44 Für die örtliche Laufvariable unter dem Integral verwenden wir zur Unterscheidung von der oberen Integrationsgrenze x den griechischen Kleinbuchstaben ξ (xi). 49 Abbildung 24: Egal, über welchen Weg man das Potenzial V (~r) vom Nullniveau bei ~r0 aus berechnet, das Resultat muss dasselbe ergeben, wenn es sich um ein “vernünftiges” Potenzial handeln soll. Wegunabhängigkeit, konservative und dissipative Kräfte: Die Berechnung von V (x) in (47) müssen wir durch eine essentielle Forderung ergänzen: Das Resultat muss wegunabhängig sein! D.h., der Wert resp. die Berechnungsformel für V (x) darf nicht plötzlich anders herauskommen, wenn ich den Körper über einen anderen Pfad oder mit anderer Geschwindigkeit von x0 nach x bewege. Für jedes x darf es nur einen ganz bestimmten Wert V (x) geben! Ansonsten wäre der Begriff einer “Energie der Lage” resp. “des Ortes” eher unsinnig. Im eindimensionalen Fall ist vielleicht noch nicht so klar, wo das Problem liegt. Abb. 24 zeigt besser, worum es geht: Egal, entlang welchem der drei Wege von Nullniveau ~r0 bis zum Ort ~r die Arbeit aufsummiert resp. das Potenzial berechnet wird, es muss immer dasselbe, eindeutige Resultat V (~r) herauskommen. Diese Forderung wird nicht von jedem beliebigen Kraftgesetz F (x) erfüllt. Nur bestimmte Kraftarten erlauben die Definition eines Potenzials V (x) gemäss (47). Wir nennen diese Kräfte konservativ, andernfalls sprechen wir von dissipativen Kräften. Betrachten wir zur Verdeutlichung unsere fünf Beispiele von weiter oben: – Anheben eines Buchs gegen die Gewichtskraft FG . Die Gewichtskraft ist das Paradebeispiel einer konservativen Kraft. Die verrichtete Hubarbeit ist anschliessend in Form von potenzieller Energie in der Höhenlage des Gegenstandes gespeichert. Sie ist komplett wieder abruf- und verfügbar. So haben wir es in der 1. Klasse gelernt und so soll es weiterhin gelten.45 – Verschieben eines Schranks gegen die Reibungskraft FR . Wähle ich für die Verschiebung des Schranks nicht den geraden, sondern einen längeren Weg, so muss mehr Reibungsarbeit verrichtet werden.46 FR ist also dissipativ. Ein zweiter Punkt ist, dass die Reibungskraft den Energieumsatz in innere Energie umwandelt (Erwärmung an der Reibungsfläche). Diese Energie steht anschliessend gar nicht mehr zur Verfügung. Sie verteilt sich und kann nicht einfach zurückgewonnen werden. Keinesfalls verfügt der am Ort x angekommene Schrank über diese Energie. Genau in diesem Sinn sind alle Arten von Reibungskräften ganz unbedingt dissipative Kräfte!47 45 Lat. conservare = bewahren, erhalten, (retten, schonen). Auch im eindimensionalen Fall könnte es mir übrigens einfallen, den Schrank vorwärts, dann rückwärts und dann wieder vorwärts zu bewegen und so einen längeren Verschiebungsweg zu erzeugen. 47 Lat. dissipare = verschwenden, zerstreuen. 46 50 – Dehnen einer Feder gegen die Federkraft FF . Je nach Dehnung der Feder hat sie mehr oder weniger Federenergie gespeichert. Die Federkraft ist ein zweites Beispiel einer ganz typischen konservativen Kraft. – Bewegung gegen den Luftwiderstand FL . Würde ich den Körper auf demselben Weg sehr langsam verschieben, so würde sich für den Luftwiderstand ein deutlich anderer Betrag ergeben als bei einer sehr grossen Geschwindigkeit. V (x) wäre also nicht eindeutig. Neben diesem weiteren Argument ist der Luftwiderstand ja auch wieder eine Art der Reibung und somit ganz klar dissipativ. – Verschieben einer el. Ladung gegen die el. Kraft Fel in einem homogenen E-Feld. Je nach Ort im homogenen E-Feld besitzt eine elektrische Ladung mehr oder weniger potenzielle elektrische Energie. Auch dies ist ein klassisches Beispiel einer konservativen Kraft. Zeitabhängige Potenziale: Schliessliche können Potenziale zeitabhängig sein: V = V (x, t). Die Berechnung erfolgt dann immer noch nach (47), aber einfach zu einem ganz bestimmten Zeitpunkt t: Z x V (x, t) = − F (ξ, t) dξ (48) x0 Wir werden aber kaum zeitabhängige Potenziale betrachten. In (48) wird örtlich über die Kraft F (x, t) integriert, um V (x, t) zu erhalten. Das bedeutet aber umgekehrt, dass F (x, t) die negative partielle Ableitung des Potenzials V (x, t) nach dem Ort x sein muss: ∂V (x, t) F (x, t) = − ∂x Nur der Klarheit halber schreibe ich die Variablen x und t zur Potenzialfunktion V hinzu. Im Prinzip kann man immer selber entscheiden, ob man das will oder nicht. Hauptsache, es wird genau verstanden, was gemeint ist resp. man weiss immer, von welchen Variablen eine Funktion abhängt. Nach dieser Folgerung können wir nun, von der Potenzialseite her kommend, sauberer definieren, was unter einer konservativen Kraft zu verstehen ist: Definition konservativer und dissipativer Kräfte Eine Kraft F (x, t) heisst konservativ, wenn es ein überall auf dem Definitionsbereich nach dem Ort x differenzierbares (= ableitbares) Potenzial V = V (x, t) gibt, sodass: F (x, t) = − ∂V ∂x (49) Zu einer bestimmten konservativen Kraft F (x, t) existieren mehrere Potenziale, die sich allerdings lediglich durch eine additive Konstante, also durch eine unterschiedliche Wahl des Nullniveaus unterscheiden. Nicht-konservative Kräfte nennen wir dissipativ. 51 4.5.2 Beispiele von Potenzialen und zugehörigen konservativen Kräften Damit Sie sehen, was mit Gleichung (49) effektiv gemeint ist, folgen nun ein paar Potenzial-Beispiele zu Ihnen bereits bekannten konservativen Kraftgesetzen. • Potenzial zum konstanten, homogenen Gravitationsfeld (vgl. Abschnitt 4.4.1): Ein Körper der Masse m besitzt in einem homogenen Gravitationsfeld mit Stärke g auf der Höhe x – ehemals h – gegenüber dem Nullniveau bei x = 0 die potenzielle gravitative Energie: V (x) = mgx ⇒ F =− dV = −mg = const. dx • Gravitationspotenzial eines Himmelkörpers (vgl. Abschnitt 4.4.4): Ein Körper der Masse m besitzt im Gravitationsfeld eines Himmelkörpers der Masse M , der bei x = 0 seinen Mittelpunkt hat, die potenzielle gravitative Energie: V (x) = − GM m x ⇒ F (x) = − dV GM m =− dx x2 Dabei ist G die universelle Gravitationskonstante. Das Nullniveau wurde ins Unendliche gelegt: limx→∞ V (x) = 0. (Ich habe hier nur den Fall x > 0 betrachtet.) • Potenzial des harmonischen Oszillators (vgl. Abschnitt 4.4.3): Wird ein Körper durch eine dem Hooke’schen Federgesetz (35) gehorchenden Kraft zu einer Ruhelage zurückgetrieben und legen wir das Nullniveau in diese Ruhelage (x = 0), so beträgt die potenzielle elastische Energie: Dx2 dV V (x) = ⇒ F (x) = − = −Dx (50) 2 dx Dabei ist D die Federkonstante des elastischen Gegenstandes. • Potenzial zum homogenen elektrischen Feld (vgl. Abschnitt 4.4.5): Ein Körper mit elektrischer Ladung q besitzt in einem homogenen elektrischen Feld mit Stärke E am Ort x gegenüber dem Nullniveau bei x = 0 die potenzielle elektrische Energie: V (x, t) = −qEx ⇒ F (t) = − ∂V = qE ∂x Potenziale können auch zeitabhängig sein: V (x, t). Nur so entstehen zeitlich nicht konstante, konservative Kräfte. Z.B. kann die Feldstärke E zeitlich variieren, wie im Plattenkondensator-Beispiel in Abschnitt 4.4.5 mit E = Emax · cos(ωt). Damit wäre das Potenzial V explizit zeitabhängig: V = V (x, t). Und für die Kraft ergäbe sich für ein Elektron (q = −e) die in Abschnitt 4.4.5 betrachtete Zeitabhängigkeit: F = F (t) = −eEmax · cos(ωt). • Potenzial einer elektrischen Punktladung: Ein Körper mit elektrischer Ladung q besitzt im elektrischen Feld einer deutlich grösseren Punktladung Q, die bei x = 0 sitzt, die potenzielle elektrische Energie: V (x) = 1 Qq · 4πε0 x ⇒ F (x) = − dV 1 Qq = · 2 dx 4πε0 x Dabei ist ε0 die elektrische Feldkonstante.48 Auch bei dieser potenziellen Energie wurde das Nullniveau ins Unendliche gelegt: limx→∞ V (x) = 0. 48 ε0 = 8.854 · 10−12 C2 . N·m2 52 4.5.3 Energieerhaltung – das Aktionsprinzip mit konservativen Kräften Wir wollen uns nun einschränken auf Bewegungen, die alleine durch konservative Kräfte gesteuert werden. Dann können wir im Aktionsprinzip (30) die Kraft F (x, t) durch die negative partielle Ableitung des zugehörigen Potenzials V (x, t) nach dem Ort x ersetzen und es ergibt sich: − d2 x ∂V =m 2 ∂x dt (51) 2 Dabei habe ich die Beschleunigung x′′ nun wieder in der differenziellen Schreibweise x′′ (t) = ddt2x notiert, um klar zu zeigen, dass rechts eine zweifache Ableitung nach der Zeit t und links eine einfache Ableitung nach dem Ort x steht. Plötzlich ist die Bewegung eines Körpers, also seine Ortsfunktion x(t) in Verbindung gebracht mit der vom Ort und der Zeit abhängigen potenziellen Energiefunktion V (x, t). Das ist sehr interessant. Spüren wir diesem Zusammenhang noch etwas weiter nach, indem wir einen Vorgang betrachten, bei dem ein Körper – gesteuert durch eine rein konservative Kraft – zum Zeitpunkt t1 bei einem Ort x1 vorbeikommt und zum Zeitpunkt t2 am Ort x2 . Nun integrieren wir örtlich über beide Seiten des Aktionsprinzips (51): Z x2 Z x2 d2 x ∂V m 2 dx dx = (52) − dt x1 x1 ∂x Auf der linken Seite ergibt sich offensichtlich der Energieunterschied in der potenziellen Energie zwischen dem Ort x2 und dem Ort x1 :49 Z x2 x2 ∂V dx = −V (x) = − V (x2 ) − V (x1 ) = −∆V − x1 x1 ∂x Und was macht dieser Unterschied in der potenziellen Energie, der passiert, während der Körper von x1 nach x2 geht? Gleichung (51) besagt, dass eine Beschleunigung entsteht, wenn sich der Wert der potenziellen Energie verändert. Was bedeutet dies energetisch ausgedrückt? Es muss sich eine Veränderung der kinetischen Energie ergeben! Schauen wir mal, was wir mit unserer Integraltechnik rausbekommen. Zunächst substituieren wir unter Hinzuziehung der Geschwindigkeitsdefinition x durch v: v= dx dt ⇒ Damit und mit der weiteren Substitution dt = Z x2 x1 d2 x m 2 dx = dt = d2 x d dx dv = = 2 dt dt dt dt dx = v dt und Z t2 t1 dv folgt: dv m v dt = dt mv22 2 dt dv − mv12 2 Z v2 v1 mv 2 v2 mv dv = 2 v1 = T2 − T1 = ∆T 2 Dabei sind v1 und v2 die Geschwindigkeiten bei (t1 , x1 ) resp. (t2 , x2 ). T = mv ist gerade die 2 kinetische Energie, die eine Masse m innehat, wenn sie mit der Geschwindigkeit v unterwegs ist.50 Die rechte Seite von (52) ist damit gleich dem Unterschied der kinetischen Energie ∆T . Betrachten wir nun die integrierte Form von (51) insgesamt, so folgt schliesslich, dass: −∆V = ∆T resp. 49 ∆V + ∆T = 0 Der Übersichtlichkeit halber wollen wir von einem zeitunabhängigen Potenzial ausgehen: V = V (x). In der theoretischen Physik ist es üblich, die kinetische Energie mit dem Symbol T abzukürzen, so wie die potenzielle Energie mit V abgekürzt wird. 50 53 Was haben wir hier entdeckt? Nichts anderes als die Energieerhaltung! Verändert sich die potenzielle Energie V eines Körpers, so ändert sich ebenso seine kinetische Energie T . Nimmt V ab (∆V < 0), so nimmt dafür T um denselben Betrag zu (∆T > 0), und umgekehrt. Die Summe beider Veränderungen (inkl. Vorzeichen!) ist Null. D.h. die Gesamtenergie E des Körpers bleibt erhalten: E = V + T = const. Das ist fantastisch! Damit haben wir tatsächlich einen tiefgründigeren Zusammenhang der klassischen Mechanik entdeckt, der unter Voraussetzung konservativer Kräfte direkt aus dem Aktionsprinzip folgt: Energieerhaltung in der klassischen Mechanik Die mechanische Gesamtenergie E eines Körpers bleibt genau dann erhalten, wenn er ausschliesslich unter dem Einfluss konservativer Kräfte steht, sich also das Kraftgesetz F (x, t) als Ableitung eines Potenzials V (x, t) schreiben lässt: E = V + T = const. ⇔ F (x, t) = − ∂V ∂x (53) Endlich verstehen wir, weshalb konservative Kräfte so genannt werden.51 Was wird denn durch solche Kräfte konserviert? Eben die Gesamtenergie E! Konservative Kräfte sind genau diejenigen Kräfte, unter deren Wirkung die Gesamtenergie eines Körpers (oder eines Systems von Körpern) erhalten bleibt! Was für ein schönes Resultat! Im Gegensatz dazu geht durch dissipative52 Kräfte Energie verloren, d.h. sie geht durch Reibung in innere Energie über und ist somit makroskopisch nicht mehr als potenzielle oder kinetische Energie vorhanden. Da es Reibung auf Ebene der kleinsten Teilchen, also in der Quantenwelt gar nicht gibt, haben wir es dort nur mit konservativen Kräften zu tun.53 Alle Vorgänge resp. Zustände hängen somit von Potenzialen V (x, t) ab, die charakteristisch für das jeweilige Problem sind. Das Kraftkonzept im Sinne Newtons wird nicht mehr gebraucht. Natürlich werden wir noch sehen müssen, wie es in der Quantenmechanik um die Energieerhaltung steht. . . 51 Lat. conservare = bewahren, erhalten, (retten, schonen). Lat. dissipare = verschwenden, zerstreuen. 53 Es gibt zwar eine Ausnahme zu dieser Regel, aber damit werden wir uns nicht beschäftigen. 52 54 4.6 Repetition/Ergänzung: Der klassische, ungedämpfte harmonische Oszillator Kehren wir zum Abschluss des Kapitels nochmals zum klassischen harmonischen Oszillator zurück. Er sei ungedämpft, d.h., die Bewegung laufe reibungsfrei ab. Es gibt also ein Potenzial V (x), dessen negative Ableitung nach dem Ort das konservative Kraftgesetz F (x) liefert (vgl. Seite 52): V (x) = Dx2 2 ⇒ F (x) = − dV = −Dx dx Dabei liegen der örtliche Nullpunkt und das Nullniveau bei der Ruhelage des Oszillators. Die Lösung der zugehörigen DGL für die Ortsfunktion x(t) mit RBs x(0) = A und x′ (0) = 0 kennen wir auch schon (vgl. Seiten 42ff): r D d2 x 2 = −ω x ⇒ x(t) = A cos(ωt) mit ω = 2 dt m Zur Übersicht nochmals kurz die Bedeutungen der auftauchenden Grössen: ω = Kreisfrequenz der Schwingung D = Federkonstante = Stärke der Feder (beim Federpendel) m = schwingende Masse des Oszillators A = Amplitude = maximaler Ausschlag des Oszillators aus der Ruhelage 4.6.1 Zwei wichtige Eigenschaften des klassischen harmonischen Oszillators An dieser Stelle ist es wichtig auf zwei Eigenschaften des klassischen harmonischen Oszillators hinzuweisen, die beim quantenmechanischen harmonischen Oszillator radikal anders aussehen werden! Diese drastischen Unterschiede gibt es übrigens nicht nur beim harmonischen Oszillator. Vielmehr sind sie ganz typisch für die Diskrepanz zwischen klassischer Mechanik und Quantenmechanik. Der harmonische Oszillator ist einfach ein besonders schönes und wichtiges Beispiel. Kontinuierliches Energiespektrum: Das einfachste reale Beispiel des harmonischen Oszillators ist das Federpendel. Diesem führen wir zu Beginn die Energie E zu, indem wir es von Hand um A aus der Ruhelage auslenken und anschliessend loslassen. E berechnet sich wegen x′ (0) = 0 resp. T (t = 0) = 0 direkt aus dem Potenzial am Ort x(0) = A: E = V (A) = DA2 2 (54) Im konservativen System bleibt diese anfänglich hinein gegebene Energie erhalten.54 Sie hängt einzig von der anfänglichen Auslenkung A ab, denn D ist eine vom System vorgegebene Konstante. Das bedeutet, der klassische harmonische Oszillator lässt prinzipiell beliebige Energiewerte E > 0 zu, weil sich die Anfangsauslenkung A frei wählen lässt. Mit “beliebig” meine ich, dass es keine unerlaubten Energiewerte gibt.55 Wir sagen: Das Energiespektrum des klassischen harmonischen Oszillators ist kontinuierlich. Das scheint im Moment vielleicht trivial, aber punkto Energiespektrum werden wir beim quantenmechanischen harmonischen Oszillator wirklich ein fundamental anderes Ergebnis erhalten! 54 Klar: Beim realen Federpendel nimmt die Pendelenergie aufgrund geringer Reibungseffekte langsam ab, bis das Pendel wieder stillsteht. Wir sprechen dann von einem gedämpften harmonischen Oszillator. 55 Natürlich kann ein reales Federpendel aufgrund der begrenzten Dehnbarkeit der Feder nicht beliebig grosse Energien aufnehmen. Aber wenn Emax die maximal mögliche vom Pendelenergie bezeichnet, so sind zwischen 0 und Emax eben alle Energiewerte möglich. 55 Klassisch erlaubter/verbotener Bereich: Sobald mit der Anfangsauslenkung A ein bestimmter Energieinhalt E vorgegeben ist, ist auch klar, an welchen Orten x der harmonische Oszillator während seiner Bewegung vorbeikommt. Alle Orte |x| ≤ A werden erreicht, sie sind für den klassischen harmonischen Oszillator erlaubt. Alle Orte |x| > A werden nicht erreicht, sie sind verboten. Begründung: An einem erlaubten Ort x ist die Energie E grösser oder gleich wie das dortige Potenzial V (x). An einem Ort x im verbotenen Gebiet wäre E geringer als V (x): Klassisch erlaubtes Gebiet = Menge aller Orte x mit E ≥ V (x) Klassisch verbotenes Gebiet = Menge aller Orte x mit E < V (x) Die potenzielle Energie V (x) kann in der klassischen Mechanik zu keinem Zeitpunkt grösser sein als die Gesamtenergie E – und so ergeben sich eben erlaubte und verbotene Gebiete. Abb. 25 veranschaulicht den Sachverhalt für den harmonischen Oszillator. Abbildung 25: Erlaubte und verbotene Gebiete beim klassischen harmonischen Oszillator: Über jedem Ort x auf der horizontalen Achse ist die jeweilige potenzielle Energie V (x) aufgetragen. Dies ist eine 2 Parabel mit Scheitelpunkt im Ursprung (V (x) = ax2 mit a = mω 2 ). Bei vorgegebener Energie E sind nur Orte x erlaubt, für die E ≥ V (x) ist, die also im Intervall [−A, A] liegen. Zusatzbemerkung: Rechts von x = 0 steigt V (x) an. Dort ist also dV dx > 0. Das bedeutet, V (x) wird dort grösser, wenn ich mit x in die positive Richtung gehe. Allgemein: Das Vorzeichen einer Ableitung f ′ (x) gibt stets die Richtung an, in die man von der Stelle x aus zu gehen hat, damit f (x) grösser wird. Das ist eine Art neues Ableitungsverständnis! Eine konservative Kraft F = − dV dx zeigt somit stets in die x-Richtung, in die das Potenzial V (x) kleiner wird ⇒ Konservative Kräfte “möchten” die potenzielle Energie verkleinern. Ganz zum Schluss wollen wir das Potenzial des klassischen harmonischen Oszillators noch etwas anders aufschreiben, nämlich so, wie wir es später beim quantenmechanischen harmonischen Oszillator wieder notieren werden. Mit D = mω 2 folgt aus (50): mω 2 x2 Dx2 = (55) 2 2 Das Gute an dieser Schreibweise ist, dass man ohne Federkonstante D auskommt. Stattdessen fliessen die Masse m und die Kreisfrequenz ω als Konstanten ins Potenzial V (x) mit ein.56 V (x) = 56 Zur Erinnerung: In der Kreisfrequenz ω stecken Frequenz f und Periode T , denn es gilt stets: ω = 2πf = 56 2π . T 5 Komplexe Zahlen C Die sogenannten komplexen Zahlen C sind eine Erweiterung die reellen Zahlen R zu einer zweidimensionalen Zahlenmenge. Die entscheidende Idee hinter dem Wort Erweiterung ist, dass zwar der Zahlenraum grösser gemacht wird, dass dabei aber die Rechenregeln für den Umgang mit den Zahlen genau gleich bleiben sollen! Umgekehrt lassen sich die reellen Zahlen R als Einschränkung der komplexen Zahlen C auf eine einzige Dimension auffassen, wobei ebenfalls die Rechenregeln erhalten bleiben. Was mit dieser zweidimensionalen Zahlenmenge und diesen Rechenregeln genau gemeint ist, werden Sie in Kürze erfahren. Entscheidend ist, dass sich mit den komplexen Zahlen viele Problemstellungen und Rechnungen sehr elegant formulieren und lösen lassen. In der Mathematik erlauben sie in vielen Fällen eine einheitlichere Darstellung und führen oftmals zu vollständigeren Lösungsmengen, über die sich dann auch “schönere” Aussagen machen lassen als in der bisherigen Einschränkung auf reelle Zahlen. Für uns am wichtigsten ist aber dies: Die Mathematik der Quantenmechanik wäre um ein Vielfaches mühsamer und unübersichtlicher, wenn wir uns dafür nicht der komplexen Zahlen bedienen würden. Im Prinzip liesse sich zwar alles mit reellen Zahlen handhaben – denn die von der Quantenmechanik vorausgesagten Messwerte sind, wie alle physikalischen Messgrössen, eben reell – die daraus hervorgehenden Gleichungen wären aber derart umständlich, dass wir uns darin nur mit einem sehr grossen Mehraufwand zurechtfinden würden. Durch Verwendung der komplexen Zahlen gewinnt die Quantenmechanik ganz wesentlich an Überichtlichkeit und Verständlichkeit. Das wollen auch wir uns nicht entgehen lassen. . . 5.1 Althergebrachte Zahlenmengen Zahlen begleiten Sie schon seit jeher durchs Leben. Vermutlich wurde aber – auch in der Mathematik – eher selten über Zahlenmengen nachgedacht. Vielleicht auch deshalb, weil dies für das elementare Rechnen halt gar nicht notwendig ist. Je weiter man hingegen in die höhere Mathematik vordringt, umso wichtiger ist es, sich Gedanken über diesen wichtigen Baustein der Mathematik zu machen, quasi mit dem Gedanken im Hinterkopf: “Sollten wir bei unserem Zahlenfundament etwas falsch verstanden haben und von falschen Annahmen ausgehen, so würde das schwerwiegende Fehler in aller weiteren Mathematik nach sich ziehen.” Also wollen wir versuchen uns etwas mehr Sicherheit zu verschaffen und uns hier kurz einige Gedanken zu den wichtigsten Zahlenmengen und ihren Eigenschaften machen. 5.1.1 Natürliche Zahlen N und ganze Zahlen Z Unter den natürlichen Zahlen verstehen wir – banal gesagt – diejenigen Zahlen, mit denen Sie als Kind zu zählen begonnen haben, also 1, 2, 3, 4, etc. Zu ihrer Beschreibung notieren wir typischerweise die Menge in aufzählender Form: N ≡ {1, 2, 3, . . .} Wollen wir die ominöse “Nichts-Zahl” Null mit dabei haben so schreibt man: N0 ≡ {0, 1, 2, 3, . . .} Setzen wir die Einerschritte über Null hinaus ins Negative fort, so erhalten wir die Menge der ganzen Zahlen Z: Z ≡ {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} Bereits N, N0 und Z sind unendlich mächtig, besitzen also unendlich viele Elemente. Aber nur dass eine Zahlenmenge unendlich viele Zahlen beinhaltet, heisst ja noch lange nicht, dass es eben alle Zahlen sind. Ganz offensichtlich gibt es zwischen den ganzen Zahlen noch jede Menge Platz. . . 57 5.1.2 Die rationalen Zahlen Q Zunächst füllen wir die Räume zwischen den ganzen Zahlen, indem wir Verhältnisse oder eben Brüche dieser ganzen Zahlen bilden. Ratio ist der lateinische Ausdruck für Verhältnis,57 weshalb wir die neue Zahlenmenge als rationale Zahlen Q bezeichnen. Das “Q” steht für Quotient – nochmals ein Fachausdruck für einen Bruch. Wir definieren: nm o Q= m ∈ Z, n ∈ N (56) n Diese beschreibende Form der Menge liest sich wie folgt: “Q ist die Menge aller Zahlen der Form m geteilt durch n, wobei m eine ganze und n eine natürliche Zahl ist.” Es ist klar, dass die ganzen Zahlen Z eine echte Teilmenge der rationalen Q sind: Z ⊂ Q, denn jede ganze Zahl m geteilt durch n = 1 ergibt wieder sich selber. 5.1.3 Irrationale Zahlen I Spontan könnte man ja meinen, dass Q alle möglichen Zahlen von −∞ bis +∞ abdeckt, aber weit gefehlt! Auf einem Zahlenstrahl, also auf einer typischen Zahlenachse, wie sie in Abb. 26 gezeigt wird, existieren Punkte, also Zahlenwerte, die durch keine rationale Zahl beschrieben werden. Solche Zahlen nennen wir irrational (Menge I). Tatsächlich gibt es jede Menge solcher irrationaler Zahlen. Sie kommen keineswegs weniger häufig als die rationalen Zahlen vor. In der Dezimalbruch-Schreibweise ist der Unterschied zwischen rationalen und irrationalen einfach zu benennen: Bei einer rationalen Zahl bricht der Dezimalbruch entweder irgendwo ab (nach irgendeiner Anzahl Stellen folgen nur noch Nullen) oder er wird periodisch (eine bestimmte Abfolge von Ziffern wiederholt sich unendlich oft), bei einer irrationalen Zahl hingegen gibt es keinerlei Periodizitäten, d.h., im Dezimalbruch lassen sich √ echten Regelmässigkeiten entdecken. √ keine Zu den berühmtesten irrationalen gehören 2, 3, e und π. Es schadet nichts, sich ihre auf drei Nachkommastellen gerundeten Werte zu merken: √ √ 2 = 1.41421 35623 73095 04880 16887 24209 . . . ⇒ 2 ≈ 1.414 Wurzel aus 2: √ √ Wurzel aus 3: 3 = 1.73205 08075 68877 29352 74463 41505 . . . ⇒ 3 ≈ 1.732 Kreiszahl: π = 3.14159 26535 89793 23846 26433 83279 . . . Euler’sche Zahl: e = 2.71828 18284 59045 23536 02874 71352 . . . ⇒ ⇒ π ≈ 3.142 e ≈ 2.718 In der Geschichte der Mathematik dauerte es recht lange und bedurfte mehrerer Anläufe – von der Antike bis vor etwa 150 Jahren – bis endgültig Klarheit über die Eigenschaften und die Häufigkeiten dieser irrationalen Zahlen herrschte. Besonders entscheidend für die Mengenlehre insgesamt waren im 19. Jahrhundert die drei Mathematiker Augustin-Louis Cauchy (1789 – 1857), Karl Weierstrass (1815 – 1897) und vor allem Georg Cantor (1845 – 1918). Mit dieser Geschichte wollen wir uns hier aber nicht weiter beschäftigen, auch wenn sie durchaus spannend und erhellend wäre. Abbildung 26: Die reellen Zahlen auf einem Zahlstrahl (x-Achse). Jedem Punkt auf dem Strahl kann eine reelle Zahl x zugeordnet werden. 57 Lat. ratio bedeutet aber auch noch Vernunft oder Verstand. 58 5.1.4 Ein vielzitierter Beweis: Die Irrationalität von √ 2 Wenn wir auch nicht allzu auführlich auf die Irrationalität als Zahleneigenschaft eingehen, so sei an dieser Stelle zumindest ein berühmter Beweis für die Irrationalität der Quadratwurzel aus 2 angeführt. An diesem Beispiel sehen Sie – vielleicht zum ersten Mal – wie sich eine derartige Eigenschaft überhaupt beweisen lässt. Von ebenso grosser Bedeutung ist das dabei angewendete Verfahren, nämlich eine indirekte Beweisführung durch Widerspruch: Man geht von einer Annahme aus, die dem Gegenteil der zu beweisenden Behauptung entspricht. Anschliessend zeigt man, dass diese Annahme auf einen logischen Widerspruch führt. Folglich ist sie falsch und somit das Gegenteil, also die eigentliche Behauptung zwingend wahr. Die folgende Einleitung und den Beweis selber habe ich Wikipedia entnommen [5]. Euklid überlieferte einen Beweis dafür, dass die Quadratwurzel von 2 irrational ist. Der zahlentheoretische Beweis Euklids wird indirekt durch Widerspruch geführt und gilt als der erste Widerspruchsbeweis in der Geschichte der Mathematik. Der unten angeführte Beweis stammt von Euklid aus Buch X der Elemente. Irrationale Grössenverhältnisse waren aber schon dem Pythagoreer Archytas bekannt, der Euklids Satz nachweislich schon in allgemeinerer Form bewies. (. . . ) Beweisführung Behauptung: Die Quadratwurzel aus 2 ist eine irrationale Zahl. Widerspruchsannahme: Die Beweisführung erfolgt indirekt nach der Methode des Widerspruchsbeweises, d.h., es wird gezeigt, dass die Annahme, die Wurzel aus 2 sei eine rationale Zahl, zu einem Widerspruch führt (lateinisch: reductio ad absurdum). Es wird also angenommen, dass die Quadratwurzel aus 2 rational ist und sich somit als Bruch p q darstellen lässt. Es wird ferner angenommen, dass p und q teilerfremde ganze Zahlen sind, der Bruch pq also in gekürzter Form vorliegt: √ 2= p q Folgerungen bis zum Widerspruch: Das bedeutet, dass das Quadrat des Bruchs 2 p =2 oder umgeformt p2 = 2q 2 q p q gleich 2 ist: Da 2q 2 eine gerade Zahl ist, ist auch p2 gerade. Daraus folgt, dass auch die Zahl p gerade ist. Die Zahl p lässt sich also darstellen durch: p = 2r wobei r eine ganze Zahl ist. Damit erhält man mit obiger Gleichung: 2q 2 = p2 = (2r)2 = 4r 2 und hieraus nach Division durch 2: q 2 = 2r 2 Mit der gleichen Argumentation wie zuvor folgt, dass q 2 und damit auch q eine gerade Zahl ist. Da p und q durch 2 teilbar sind, erhalten wir einen Widerspruch zur Teilerfremdheit. Logischer Umkehrschluss: Dieser Widerspruch zeigt, dass die Annahme, die Wurzel aus 2 sei eine rationale Zahl, falsch ist und daher das Gegenteil gelten muss. Damit ist die Behauptung, dass √ 2 irrational ist, bewiesen. 59 5.1.5 Die reellen Zahlen R Vereinigen wir die rationalen Zahlen Q mit den irrationalen Zahlen I, so erhalten wir die reellen Zahlen R. Sie füllen den Zahlenstrahl in Abb. 26 nunmehr lückenlos, was man als Vollständigkeit der reellen Zahlen bezeichnet. Damit steht uns schliesslich eine Zahlenachse zur Verfügung, wie wir sie für eindimensionale physikalische Grössen, also Skalare, eben gerne haben möchten. Die reellen Zahlen R sind die gebräuchliche Zahlenmenge schlechthin. In der Mathematik gehen Sie in aller Regel stets von dieser Grundmenge aus, wenn nichts anderes gesagt wird. Wichtig dabei sind aber nicht nur die Zahlen an sich, sondern auch die verlässlichen Eigenschaften dieser Zahlenmenge, auf die wir uns in aller Mathematik und Naturwissenschaft stets abstützen. Darüber werden Sie im nächsten Abschnitt mehr erfahren. Zum Abschluss unserer Betrachtung der bisherigen Zahlenmengen verweise ich auf Abb. 27, wo die Teilmengenverhältnisse dieser Mengen dargstellt sind. Dort ist zudem bereits angedeutet, dass die komplexen Zahlen C nochmals eine Erweiterung der reellen Zahlen darstellen, so wie z.B. die rationalen Zahlen Q eine Erweiterung der ganzen Zahlen Z sind. Wofür könnten sich diese komplexen Zahlen denn eignen? Offensichtlich gibt es Problemstellungen, für die es innerhalb der reellen Zahlen keine Lösungen gibt. Die einfachste davon lautet: x2 = −1 Tatsächlich bieten die komplexen Zahlen die vollumfängliche Möglichkeit, solche quadratischen und Gleichungen höherer Ordnung zu lösen. Aber auch bereits bekannte mathematische Zusammenhänge lassen sich mit ihnen unter Umständen übersichtlicher darstellen oder einfacher beweisen. Abbildung 27: Darstellung der Teilmengenbeziehungen zwischen den verschiedenen Zahlenmengen. Es gilt: N ⊂ Z ⊂ Q ⊂ R ⊂ C, sowie I = R \ Q resp. R = Q ∪ I mit Q ∩ I = {}. 60 5.2 Die reellen Zahlen R als mathematischer Körper Bis hierhin haben wir bezüglich der althergebrachten Zahlenmengen einfach mal gesagt, welche Elemente, also Zahlen sie enthalten. Damit ist das Zahlenfundament unserer vertrauenswürdigen Mathematik aber erst halbwegs beschrieben. Entscheidend sind ebenso die Recheneigenschaften, auf die wir uns stets verlassen können. So wissen wir nämlich, dass es sich bei den reellen Zahlen R zusammen mit den beiden Verknüpfungen “+” und “ · ” um einen sogenannten Körper handelt. Was meint man damit genau? 1. Gegeben ist zunächst die Menge der reellen Zahlen R. 2. Auf dieser Menge existieren zwei – uns wohlbekannte – Verknüpfungen mit Namen Addition “+” und Multiplikation “ · ”. Diese nehmen jeweils zwei Elemente a, b ∈ R und generieren daraus ein drittes Element a + b ∈ R resp. a · b ∈ R. 3. Nun nennen wir die Menge R zusammen mit den beiden Verknüpfungen Addition “+” und Multiplikation “ · ” einen Körper, weil die folgenden neun Körperaxiome erfüllt sind. 5.2.1 Die neun Körperaxiome Eigenschaften der Addition “+”: 1. Assoziativität: Für beliebige a, b, c ∈ R gilt: a + (b + c) = (a + b) + c 2. Kommutativität: Für beliebige a, b ∈ R gilt: a+b=b+a 3. Neutrales Element: In R existiert ein bezüglich der Addition neutrales Element 0 so, dass für ein beliebiges a ∈ R gilt: a+0=a 4. Inverses Element: Zu jedem a ∈ R existiert ein bezüglich der Addition inverses Element (−a) ∈ R so, dass gilt: a + (−a) = 0 Eigenschaften der Multiplikation “ · ”: 5. Assoziativität: Für beliebige a, b, c ∈ R gilt: a · (b · c) = (a · b) · c 6. Kommutativität: Für beliebige a, b ∈ R gilt: a·b =b·a 7. Neutrales Element: In R \ {0} existiert ein bezüglich der Multiplikation neutrales Element 1 so, dass für ein beliebiges a ∈ R gilt: a·1=a 8. Inverses Element: Zu jedem a ∈ R \ {0} existiert ein bezüglich der Multiplikation inverses Element a−1 ∈ R so, dass gilt: a · a−1 = 1 Kombinierte Eigenschaft von Addition “+” und Multiplikation “ · ”: 9. Distributivgesetz: Für beliebige a, b, c ∈ R gilt: a · (b + c) = a · b + a · c 61 5.2.2 Anmerkungen zu Körpern und zu den Körperaxiomen • Vielfalt mathematischer Körper: Es gibt unzählige Körper im mathematischen Sinne. Es braucht irgendeine Menge X von Objekten und dazu eben zwei Verknüpfungen “+” und “ · ”, die auf dieser Menge definiert sind. Sobald nun die beiden Verknüpfungen die Körperaxiome erfüllen, sagen wir: “X bildet zusammen mit den Verknüpfungen “+” und “ · ” einen Körper.” Ich habe bei den Körperaxiomen oben also lediglich zugunsten Ihres unmittelbaren Verständnisses die reellen Zahlen R verwendet. Bei dieser Zahlenmenge haben Sie nämlich bereits eine gute Idee der Zahlen selber, wie auch von Addition und Multiplikation. Bei der Menge X muss es sich also nicht unbedingt um die reellen Zahlen handeln. Es muss nicht einmal eine Zahlenmenge sein. Die unterschiedlichsten Objekte können zu Mengen zusammengefasst werden. Denken Sie z.B. an die Menge aller Geraden in einem x-yKoordinatensystem, die Menge aller Vektoren im dreidimensionalen Raum, die Menge aller Drehungen in der Ebene, die Menge aller Polynome mit Grad 5, etc. An den letzten beiden Beispielen sehen Sie, dass man sogar Mengen von Abbildungen oder Funktionen definieren kann – was soll schon dagegen sprechen? Dem entsprechend muss aber für jede Menge X jeweils neu deklariert werden, was mit den beiden Verknüpfungen Addition und Multiplikation gemeint sein soll. Und so kommt es eben auch vor, dass man nicht aus jeder Menge einen Körper machen kann, weil einfach keine Addition oder keine Multiplikation definiert werden kann, welche die Körperaxiome erfüllt.58 Die Zeichen “+” und “ · ” für Addition und Multiplikation sind übrigens willkürlich. Häufig werden für diese Verknüpfungen auch ganz andere Symbole verwendet, z.B. ∗, ◦, •, ⋄ oder ×. • Bisherige Zahlenmengen: Auch die rationalen Zahlen Q bilden – mit derselben Addition und Multiplikation wie bei R – einen Körper. Das können Sie selber überprüfen, indem Sie sich Punkt für Punkt von der Richtigkeit der Körperaxiome überzeugen. Im Gegensatz dazu bilden die ganzen Zahlen Z zusammen mit der bekannten Addition und Multiplikation keinen Körper. Bei der Addition funktioniert es zwar noch, aber bei der Multiplikation scheitert es an der Existenz des inversen Elementes. Für eine ganze Zahl a liegt nämlich das inverse Element a−1 = a1 bis auf die Ausnahmen a = ±1 nicht mehr in Z. • Subtraktion und Division: Vielleicht vermissen Sie innerhalb der Körperaxiome Aussagen resp. Anforderungen an die Subtraktion “−” und an die Division “ : ”. Diese sind aber überflüssig, weil diese beiden Operationen durch zwei rein symbolische Festlegungen gegeben sind: a a − b ≡ a + (−b) und a : b = ≡ a · b−1 b Subtraktion und Division sind also durch Addition und Multiplikation und die zugehörigen inversen Elemente (−b) und b−1 festgelegt und müssen nicht separat behandelt werden. • Der Nutzen von Körpern: Was bringt es eigentlich, wenn man von einer Menge und den beiden darauf definierten Verknüpfungen weiss, dass es sich um einen Körper handelt? Ganz einfach gesagt verschafft dies die Sicherheit, dass darauf weiterführende Mathematik aufgebaut werden kann, weil ein Körper eben bestimmte Anforderungen erfüllt. Auf der Existenz von Addition und Multiplikation inkl. neutraler und inverser Elemente basieren weitere wichtige Rechenmethoden, wie z.B. die Bildung von Potenzen und deren Gesetze. 58 Nichts hindert uns daran auch gänzlich unmathematische Objekte zu Mengen zusammenzufassen, z.B. die Menge aller blauen Autos, die Menge aller Schweizerinnen und Schweizer oder die Menge aller Hauptreihensterne, etc. Die Bedingung für eine Menge ist einfach die Unterscheidbarkeit der einzelnen Elemente. Natürlich stellt sich dann die Frage, was man unter einer Addition oder einer Multiplikation innerhalb einer solchen Menge verstehen soll. . . Vermutlich wird sich mit solchen Mengen kein Körper bilden lassen, weil die Körperaxiome mangels passender Addition und Multiplikation nicht erfüllt werden können. 62 • Erweiterungen von Zahlenmengen: In den nächsten Abschnitten wird es um eine wesentliche Erweiterung unseres bisherigen Zahlenbereichs gehen. Die reellen Zahlen R sollen zu den komplexen Zahlen C erweitert werden. Betrachten wir an dieser Stelle kurz an einem wohlbekannten Beispiel, was uns eine solche Zahlbereichserweiterung bringen kann und worauf man dabei achten muss. Die reellen Zahlen R sind eine Erweiterung der rationalen Zahlen Q. D.h., R enthält zusätzlich zu Q auch noch die irrationalen Zahlen I und ermöglicht dadurch ein umfangreicheres√Rechnen, z.B. die Angabe von Lösungen zu einer Gleichung wie x2 = 145, nämlich x = ± 145, was innerhalb von Q nicht existieren würde. Gleichzeitig sind aber alle Lösungen von Gleichungen, die wir in Q erhalten können, auch innerhalb von R richtig. Auch nach der Erweiterung von Q zu R sind beispielsweise x = ± 32 die beiden Lösungen der Gleichung x2 − 49 = 0. Sie sind durch diese Erweiterung des Zahlenbereichs nicht falsch geworden. Woran liegt das? Weshalb ist diese Erweiterung in diesem Sinne unproblematisch? Der entscheidende Grund dafür ist, dass sowohl Q, wie auch R eben Körper sind, welche unter Verwendung derselben Addition “+” und Multiplikation “ · ” die Körperaxiome erfüllen. Die neutralen Elemente von “+” und “ · ” bleiben ebenfalls die gleichen und auch die inversen Elemente (−a) und a−1 jeder rationalen Zahl a sind in R immer noch dieselben. Natürlich kann es bei einer Zahlenbereichserweiterung vorkommen, dass man Addition oder Multiplikation selber passend erweitern muss, also für die neu dazukommenden Zahlen entsprechende Deklarationen vornehmen muss. Denken Sie z.B. wiederum an die Erweiterung von Q auf R. Dabei muss man beispielsweise das Vorgehen bei der Multiplikation von Wurzeln √ √ √ festlegen, nämlich dass a · b = a · b sein soll. • Blicken wir voraus auf die im nächsten Abschnitt erfolgende Einführung der komplexen Zahlen C, so verstehen Sie nun, worauf wir unser Augenmerk zu richten haben, damit keine Widersprüche zu allen bisher gültigen Aussagen in R entstehen: – Auch die komplexen Zahlen C sollen einen Körper bilden. D.h., auf C muss eine erweiterte Addition und eine erweiterte Multiplikation so definiert sein, dass die Körperaxiome erüllt sind. Insbesondere müssen diese beiden Verknüpfungen assoziativ, wie auch kommutativ sein und zudem das Distributivgesetz erfüllen. – Diese erweiterte Addition und Multiplikation müssen, eingeschränkt auf Zahlen a, b ∈ R, immer noch dieselben Resultate liefern. – Die neutralen Elemente 0 und 1 müssen bei der Erweiterung demnach gleich bleiben. – Auch die inversen Elemente (−a) und a−1 müssen für jedes a ∈ R bei der Erweiterung unverändert bleiben. Und nun kommt sie also, die Einführung der komplexen Zahlen C, die die bisherigen reellen Zahlen R umfassen und uns gleichzeitig weitreichende mathematischen Möglichkeiten geben soll, wie z.B. die Lösung der Gleichung x2 = −1. Es ist einleuchtend, dass es sich bei C um eine mehrdimensionale Zahlenmenge handeln muss, denn die eine Dimension, die der Zahlenstrahl in Abb. 26 darstellt, ist durch die reellen Zahlen bereits vollständig, also lückenlos abgedeckt. “Wo” die neuen Zahlen liegen, davon werden wir sehr rasch eine praktische Vorstellung haben. Bei den komplexen Zahlen handelt es sich nämlich um eine zweidimensionale Zahlenmenge, und so muss jede Zahl z ∈ C einem Punkt in einer Ebene entsprechen. Aber genug der Vorankündigungen! Jetzt machen wir diesen Schritt. 63 5.3 5.3.1 Die Menge der komplexen Zahlen C Definition der komplexen Zahlen und Gauss’sche Zahlenebene Die Ausführungen in diesem und dem nächsten Unterabschnitt folgen der Einführung der komplexen Zahlen im Buch Rechenmethoden für Studierende der Physik im ersten Jahr [2] von Markus Otto. Die komplexen Zahlen C stellen eine Erweiterung der reellen Zahlen R dar. Besagte Erweiterung ist dabei durch die Einführung einer Grösse i gegeben, für die per Definition gilt: i2 ≡ −1 Dieses i bezeichnet man als die imaginäre Einheit.59 Hierdurch werden im Reellen nicht lösbare Gleichungen wie z.B. x2 = −1 plötzlich lösbar: x = i oder x = −i. Definition der Menge der komplexen Zahlen Jede komplexe Zahl z ∈ C lässt sich als Summe aus einem reellen Anteil x und einem imaginären Anteil iy schreiben: z =x+i·y mit Re(z) = x und Im(z) = y (57) Dabei heisst x ∈ R Realteil (Re) und y ∈ R Imaginärteil (Im) von z. Die Menge der komplexen Zahlen C definiert sich demnach wie folgt: C ≡ {z = x + iy | x, y ∈ R} (58) “Die Menge der komplexen Zahlen C ist die Menge aller Zahlen z = x + iy, wobei x und y reelle Zahlen sind.” √ √ Z.B. ist für z = 3 − i 2 der Realteil Re(z) = 3 und der Imaginärteil Im(z) = − 2. Eine komplexe Zahl z = x, also mit y = 0, ist reell, eine komplexe Zahl z = iy, also mit x = 0, heisst rein imaginär.60 Die Darstellung resp. geometrische Interpretation einer komplexen Zahl geschieht in einem zweidimensionalen, kartesischen Koordinatensystem, also in einer x-y-Ebene, die wir als komplexe oder Gauss’sche Zahlenebene61 bezeichnen, wie Abb. 28 zeigt. Da die reellen Zahlen R vollständig sind und sich jede komplexe Zahl als Summe z = x + iy mit x, y ∈ R schreiben lässt, sind auch die komplexen Zahlen C eine vollständige Zahlenmenge. Anschaulich gibt es in der Gauss’schen Zahlenebene somit keine Lücken, also keinen Punkt, der nicht durch eine komplexe Zahl z abgedeckt wäre. 5.3.2 Komplexe Konjugation Das komplex Konjugierte z ∗ einer komplexen Zahl z erhält man, indem man i durch −i ersetzt: z =x+i·y → z∗ = x − i · y daraus folgt: (z ∗ )∗ = z Anschaulich entspricht die Konjugations-Operation ∗ in der komplexen Ebene einer Spiegelung des zu z gehörenden Punktes an der reellen Achse (vgl. Abb. 28). 59 Analog kann die Zahl 1 als reelle Einheit verstanden werden. Die Anregung zu dieser in [2] vergessen gegangenen Deklaration habe ich dem im Orell Füssli Verlag erschienen Lehrbuch Algebra 3, Aufgaben, Ergebnisse [6] entnommen. 61 Ein Miterfinder dieser Darstellung war der berühmte deutsche Mathematiker Carl Friedrich Gauss (1777 – 1855). 60 64 Abbildung 28: Die Gauss’sche Zahlenebene: Jeder Punkt (x, y) entspricht einer komplexen Zahl z = x+iy. Auf der horizontalen Achse sitzen die reellen, auf der vertikalen Achse die rein imaginären Zahlen. Durch Spiegelung von z an der x-Achse erhält man die komjugiert komplexe Zahl z ∗ = x−iy. 5.4 Rechenregeln – die komplexen Zahlen C als Zahlenkörper Nun kommt der spannende Punkt der Erweiterung von R auf C. Wir erinnern uns an die auf Seite 63 deklarierten Anforderungen: Damit es keine Komplikationen mit den in C enthaltenen reellen Zahlen R gibt, müssen Addition und Multiplikation auf C so definiert werden, dass damit erstens die Körperaxiome (vgl. 5.2.1) erfüllt werden, zweitens sollen Rechnungen mit reellen Zahlen immer noch dieselben Resultate ergeben. Letzteres schliesst mit ein, dass auch die neutralen Elemente 0 und 1 gleich bleiben und die inversen Elemente (−a) und a−1 für reelle Zahlen unverändert bleiben. Definition von Addition und Multiplikation auf C x1 , x2 ∈ R seien die Real- und y1 , y2 ∈ R die Imaginärteile zweier beliebiger komplexer Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 . Dann sind Addition “+” und Multiplikation “ · ” dieser beiden komplexen Zahlen gegeben durch: z1 + z2 ≡ (x1 + x2 ) + i(y1 + y2 ) z1 · z2 ≡ (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ) (59) Das bedeutet, bei der Addition zweier komplexer Zahlen werden einfach die Real- und Imaginärteile separat addiert: Re(z1 + z2 ) = x1 + x2 und Im(z1 + z2 ) = y1 + y2 Bei der Multiplikation sieht die Sache komplizierter aus: Re(z1 z2 ) = x1 x2 − y1 y2 und Im(z1 z2 ) = x1 y2 + x2 y1 Zusammen mit dieser Addition und dieser Multiplikation bilden die komplexen Zahlen C einen vollständigen Zahlenkörper, der eine Erweiterung der reellen Zahlen R darstellt. Insbesondere die Multiplikation mag im Moment etwas verwirrend erscheinen, wir werden aber in Kürze sehen, dass sich beide Verknüpfungen gut veranschaulichen und verstehen lassen. 65 5.4.1 Ein näherer Blick auf die Addition komplexer Zahlen • Veranschaulichung in der Gauss’schen Zahlenebene (vgl. Abb. 29): Bei der Addition zweier komplexer Zahlen z1 und z2 handelt es sich in der komplexen Zahlenebene einfach um die Vektoraddition der beiden Ortsvektoren von 0 nach z1 resp. z2 . • Ort des additiv Inversen: Das additiv inverse Element (−z) ist in der Gauss’schen Zahlenebene einfach die Spiegelung von z am Ursprung 0 (vgl. Abb. 29). Damit ist auch anschaulich klar, dass es zu jedem z ∈ C auch nur genau ein solches additiv inverses Element (−z) gibt. • Überprüfung von Assoziativität und Kommutativität: Dass die “neue” Addition assoziativ und kommutativ ist, verstehen wir aufgrund der Vektoraddition sofort. Kommutativität und Assoziativität sind nämlich auch Eigenschaften der Vektoraddition.62 Andererseits ergeben sich diese Eigenschaften unmittelbar aus der Assoziativität und der Kommutativität reeller Zahlen: Assoziativität: Kommutativität: d z1 + (z2 + z3 ) = z1 + (x2 + x3 ) + i(y2 + y3 ) d = x1 + (x2 + x3 ) + i y1 + (y2 + y3 ) r = (x1 + x2 ) + x3 + i (y1 + y2 ) + y3 d d = (x1 + x2 ) + i(y1 + y2 ) + z3 = (z1 + z2 ) + z3 d z1 + z2 = x1 + x2 + i(y1 + y2 ) r d = x2 + x1 + i(y2 + y1 ) = z2 + z1 Vielleicht erscheinen Ihnen diese Umformungen ein bisschen sehr trivial, aber für ein solides Fundament ist es eben sehr wichtig, dass man die grundlegenden Eigenschaften ganz genau überprüft, und zwar ausschliesslich mit nachweislich abgesicherten Einzelschritten. So habe ich bei allen Schritten mit d die Definition der Addition und bei den mittleren Schritten mit r die Kommutativität resp. Assoziativität reeller Zahlen verwendet. Abbildung 29: In der komplexen Zahlenebene entspricht die Addition zweier Zahlen einer Vektoraddition. Die Ortsvektoren von 0 nach z1 und z2 werden aneinander gehängt. Die additiv inverse Zahl (−z) entspricht einer Spiegelung des zu z gehörenden Punktes an 0. 62 Vektoraddition: ~a + ~b + ~c = ~a + ~b + ~c und ~a + ~b = ~b + ~a. 66 5.4.2 Ein näherer Blick auf die Multiplikation komplexer Zahlen • Die explizite Ausmultiplikation: Die Festlegung der Multiplikation in (59) erscheint im ersten Moment etwas unverständlich, ja vielleicht sogar willkürlich. Im Prinzip handelt es sich dabei aber einfach um die Ausmultiplikation der Darstellungen zweier komplexer Zahlen z1 und z2 mit ihren Real- und Imaginärteilen: z1 z2 = (x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2 = x1 x2 − y1 y2 + i(x1 y2 + y1 x2 ) Beachten Sie dabei die Ausnutzung von i2 ≡ −1. • Aufgeschobene graphische Interpretation (vgl. Abb. 30): Betrachten wir ein explizites Zahlenbeispiel. Gegeben seien z1 = 1 + 2i und z2 = −1 + i. Für ihr Produkt ergibt sich: z1 z2 = (1 + 2i)(−1 + i) = −1 + i − 2i + 2i2 = −1 − i − 2 = −3 − i Abb. 30 zeigt, wo sich dieses Resultat in der Gauss’schen Zahlenebene befindet. Tatsächlich gibt es einen geometrischen Zusammenhang zwischen z1 , z2 und z1 z2 . Den werden wir aber erst im Abschnitt 5.5.4 aufdecken und dann auf dieses Beispiel zurückschauen. Bis dahin dürfen Sie sich darüber den Kopf zerbrechen, wie der Zusammenhang zwischen diesen drei Punkten aussieht. • Überprüfung von Assoziativität und Kommutativität: Diese Eigenschaften lassen sich sehr analog zur Addition überprüfen. Dabei verwenden wir einerseits wiederum die Assoziativität und die Kommutativität bei der Addition und der Multiplikation reeller Zahlen, andererseits natürlich die Definition der Multiplikation komplexer Zahlen (59). Die Sache sieht nun allerdings etwas komplizierter aus. Ich beschränke mich an dieser Stelle auf die Überprüfung der Kommutativität: Kommutativität: d z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + x2 y1 ) r d = x2 x1 − y2 y1 + i(x2 y1 + x1 y2 ) = z2 z1 Abbildung 30: Im Moment ist noch unklar, welche geometrische Bedeutung die Multiplikation zweier komplexer Zahlen z1 und z2 in der komplexen Zahlenebene hat. Die Auflösung folgt im Abschnitt 5.5. Über das multiplikativ inverse Element z −1 erfahren Sie mehr im Abschnitt 5.4.4. 67 5.4.3 Der Betrag einer komplexen Zahl • Beträge reeller Zahlen: Unter dem Betrag |a| einer reellen Zahl a verstehen wir ihren positiven Zahlenwert ohne Vorzeichen: 35 35 √ √ 2 = 2 |3| = 3 | − 6| = 6 |0| = 0 − = 13 13 Auf dem reellen Zahlenstrahl kann man |a| als Abstand der Zahl a zum Nullpunkt 0 interpretieren – und Abstände sind per Definition immer positiv. Häufig wird dieser Betrag einer Zahl auch Absolutbetrag genannt.63 • Beträge komplexer Zahlen: Auch bei komplexen Zahlen soll der Betrag |z| für den Abstand zum Nullpunkt 0 stehen (vgl. Abb. 28). Folgende Definition erfüllt diese Anforderung: Absolutbetrag einer komplexen Zahl z Der Absolutbetrag oder Betrag |z| einer komplexen Zahl z = x + iy ist gegeben durch die (positive) Wurzel des Produktes aus dem konjugiert Komplexen z ∗ und z selber: p √ (60) |z| ≡ z ∗ z = x2 + y 2 Diese Definition entspricht in der komplexen Ebene dem Abstand von z zum Ursprung 0. Betrachten wir eine beliebige komplexe Zahl z = x + iy, so erhalten wir für ihren Betrag: p p p √ |z| = z ∗ z = (x − iy)(x + iy) = x2 + ixy − ixy − i2 y 2 = x2 + y 2 Beachten Sie, wie −i2 schliesslich ein positives Vorzeichen von y 2 ergibt. Tatsächlich entspricht dieses Resultat in der Gauss’schen Zahlenebene genau dem Abstand von z zum Nullpunkt 0, wie Abb. 31 erklärt (Satz des Pythagoras!). Alle Zahlen z mit |z| = r bilden zusammen den Kreis mit Radius r um den Ursprung 0. • Betragsquadrat und Vorschau auf die Quantenmechanik: In obiger Betragsberechnung sehen Sie zum ersten Mal den praktischen Einsatz des konjugiert Komplexen z ∗ . Damit lässt sich das Betragsquadrat |z|2 in sehr einfacher Weise notieren: |z|2 = z ∗ z Dieses Betragsquadrat werden wir in der Quantenmechanik andauernd antreffen. Konkret beträgt die Wahrscheinlichkeit dafür, ein Teilchen, dessen Verhalten durch die Schrödinger’sche Wellenfunktion Ψ (x, t) beschrieben wird, zum Zeitpunkt t zwischen den Orten a und b zu finden: Z Z b a |Ψ (x, t)|2 dx = b Ψ ∗ (x, t)Ψ (x, t) dx a Dabei ist Ψ (x, t) eine Funktion mit komplexen Funktionswerten. Damit können Sie nachvollziehen, weshalb uns der Ausdruck Ψ ∗Ψ auf Schritt und Tritt auf dem Weg durch die Quantenmechanik verfolgen wird. 63 Mit dieser Namensgebung wird klar, weshalb in manchen Rechenprogrammen der Betrag mit dem Kürzel abs() aufgerufen werden kann. So z.B. auch in GeoGebra. 68 Abbildung 31: Der Betrag |z| einer komplexen Zahl z beschreibt in der komplexen Ebene den Abstand des Punktes z vom Ursprung 0. Alle komplexen Zahlen mit demselben Betrag |z| = r liegen auf einem Kreis mit Radius r um 0. 5.4.4 Division: Bruchrechnen mit komplexen Zahlen Die Zahl z1 = x1 + iy1 soll durch die Zahl z2 = x2 + iy2 6= 0 geteilt werden, wodurch die Zahl z3 = x3 + iy3 entsteht: z1 z1 : z2 = = z3 ⇔ z1 = z2 · z3 z2 Stimmt die Division links, so muss auch die Multiplikation rechts richtig sein und umgekehrt, wenn z2 6= 0. Daraus lässt sich auf den Realteil x3 und den Imaginärteil y3 von z3 schliessen: z1 = z2 z3 ⇒ x1 + iy1 = (x2 + iy2 )(x3 + iy3 ) = x2 x3 − y2 y3 + i(x3 y2 + x2 y3 ) {z } {z } | | =x1 =y1 Identifikationstrick: Da Real- und Imaginärteil der Zahl z1 = x1 + iy1 eindeutig sind, können wir die Terme x2 x3 − y2 y3 und x3 y2 + x2 y3 ganz rechts mit x1 resp. y1 identifizieren. Es ergibt sich ein ohne Weiteres lösbares lineares Gleichungssystem mit den beiden Unbekannten x3 und y3 : x x = x x −y y 1 = x 2 x3 − y 3 x2 y1 y2 x1 1 2 3 2 3 y2 y2 + = + x3 ⇒ ⇒ y1 y 1 = x3 y 2 + x2 y 3 y2 x2 y2 x2 = y 2 x3 + y 3 x2 ⇒ x2 x1 x2 + y1 y2 = (x22 + y22 ) x3 ⇒ x3 = x1 x2 + y 1 y 2 x22 + y22 In der Fortsetzung lässt sich auch y3 bestimmen – das können Sie selber überprüfen. Wir erhalten: y3 = x2 y 1 − x1 y 2 x22 + y22 Dieser Weg ist wegen des Identifikationstricks zwar lehrreich, aber nicht besonders elegant. Es folgt nun eine zweite Berechnung von zz12 , die ebenso neue Aufschlüsse und Erkenntnisse mit sich bringt. 69 Der bessere Trick für die rasche Division zweier komplexer Zahlen z1 und z2 besteht in der Erweiterung des Bruchs zz21 mit dem konjugiert Komplexen des Nenners, also mit z2∗ : z1 z1 z2∗ z1 z2∗ (x1 + iy1 )(x2 − iy2 ) = · ∗ = = z2 z2 z2 |z2 |2 x22 + y22 = x1 x2 + y1 y2 + i(x2 y1 − x1 y2 ) x22 + y22 Das entspricht der Lösung von vorhin. Der Trick der Erweiterung mit z2∗ macht den Nenner reell. Dort entsteht nämlich einfach das Betragsquadrat des Divisors: z2 z2∗ = |z2 |2 = x22 + y22 . z z∗ Bereits der Bruch |z12 |22 in der Mitte der oberen Zeile kann als Resultat der Division aufgefasst werden, einfach ohne Zerlegung in Real- und Imaginärteil. Damit können wir z.B. auch ganz leicht verdeutlichen, was denn das multiplikativ inverse Element z −1 einer Zahl z ist: z −1 = 1 1 z∗ z∗ 1 z∗ = · ∗ = 2 = · z z z |z| |z| |z| Die Faktorisierung in zwei Brüche ganz am Schluss liefert uns ein anschauliches Verständnis in der Gauss’schen Zahlenebene (vgl. Abb. 32). Wie wir bereits aus Abb. 28 wissen, besitzt z ∗ denselben z∗ eine Zahl mit Betrag 1, die von 0 aus gesehen in Richtung Betrag wie z, d.h. |z ∗ | = |z|. Somit ist |z| 1 ∗ des konjugiert Komplexen z liegt. Darauf wird nun der zweite Faktor |z| angewendet, sodass folgt: • z −1 liegt von 0 aus gesehen in der Richtung von z ∗ . 1 • |z −1 | = |z| . Dies bedeutet: Ist |z| > 1, so ist |z −1 | < 1 – und umgekehrt. In der komplexen Ebene liegt das multiplikativ inverse Element z −1 innerhalb des Einheitskreises, wenn die Zahl z selber ausserhalb desselben liegt – und umgekehrt. Nun verstehen wir auch das Beispiel des multiplikativ inversen Elementes der Zahl z = 1 + 2i in Abb. 30 auf Seite 67: 1 2 1 − 2i 1 − 2i z∗ = − i = z −1 = 2 = 2 2 |z| 1 +2 5 5 5 Abbildung 32: Das multiplikativ inverse Element z −1 liegt von 0 aus gesehen in Richtung des konjugiert Komplexen z ∗ . Sein Betrag |z −1 | ist gleich dem Kehrwert von |z|. 70 5.4.5 Die imaginäre Einheit i und ihre Potenzen Kurz wollen uns noch überlegen: i0 = 1 i1 = i i2 = −1 i3 = i2 · i = −i i4 = 1 Ebenso: i0 = 1 i−1 = 1 i = 2 = −i i i i−2 = 1 = −1 i2 i−3 = − 1 i = 4 =i 3 i i i−4 = 1 =1 i4 Ab der vierten Potenz von i wiederholen sich die Werte. Also merken wir uns: i4n = 1 i4n+1 = i i4n+2 = −1 i4n+3 = −i = i2 · i mit n ∈ Z Vergleichen Sie dazu Abb. 33. 5.4.6 Überprüfung der Körperaxiome Nachdem wir nun schon einiges zum Umgang mit komplexen Zahlen gesehen haben, sollten wir uns eigentlich abschliessend nochmals davon überzeugen, dass C zusammen mit der in (59) definierten Addition und Multiplikation die Körperaxiome von Seite 61 erfüllt. Darauf werde ich an dieser Stelle allerdings verzichten, weil wir schon viele Punkte abgehakt haben: • 1.+2. Körperaxiom: Assoziativität und Kommutativität der Addition. • 6. Körperaxiom: Kommutativität der Multiplikation. • 3.+7. Körperaxiom: Deklaration und Verifizierung der neutralen Elemente 0 und 1. • 4. Körperaxiom: Existenz des additiv inversen Elementes (−z). • 8. Körperaxiom: Existenz des multiplikativ inversen Elementes z −1 . Es fehlen also nur noch die Überprüfung der Assoziativität der Multiplikation und des Distributivgesetzes (5.+9. Körperaxiom). Das wollen wir uns schenken. Nochmals: Die komplexen Zahlen bilden zusammen mit den in (59) definierten Verknüpfungen “+” und “ · ” einen Zahlenkörper. Mit Realteil x und Imaginärteil y einer komplexen Zahl z = x + iy, sowie mit der komplexen Einheit i dürfen wir rechnen, wie wir es uns schon seit jeher gewohnt sind. Speziell ist die Eigenschaft der komplexen Einheit i, nämlich dass i2 = −1. Abbildung 33: Die imaginäre Einheit i und ihre Potenzen in der komplexen Ebene. 71 5.5 5.5.1 Komplexe Zahlen in Polarkoordinaten, Euler-Gleichung und Euler-Darstellung Polarkoordinaten in der komplexen Ebene Wir betrachten zunächst eine komplexe Zahl z1 mit Betrag |z1 | = 1. D.h., die Zahl z1 liegt in der Gauss’schen Ebene auf dem Einheitskreis rund um den Ursprung 0 (vgl. Abb. 34). Wegen der Definitionen von Sinus und Cosinus am Einheitskreis muss dann gerade gelten: z1 = cos ϕ + i sin ϕ Dabei ist ϕ der von der reellen Achse aus im Gegenuhrzeigersinn gemessene Winkel. Wir wollen dafür von Anfang an und ausschliesslich das Bogenmass verwenden.64 Abbildung 34: Zu jedem von der reellen Achse im Gegenuhrzeigersinn abgetragenen Winkel ϕ gehört genau ein Punkt auf dem Einheitskreis resp. eben eine komplexe Zahl z1 mit Betrag |z1 | = 1. Wegen den bekannten Definitionen von Sinus und Cosinus am Einheitskreis gilt: z1 = cos ϕ + i sin ϕ. Jede komplexe Zahl auf dem Einheitskreis lässt sich also ganz anschaulich mit nur einem Winkel resp. einer Winkelkoordinate ϕ beschreiben. Dabei gilt stets der “trigonometrische Satz des Pythagoras”:65 cos2 ϕ + sin2 ϕ = 1 Multiplizieren wir nun unser z1 = cos ϕ + i sin ϕ mit einer reellen Zahl r ≥ 0, so erhalten wir eine neue komplexe Zahl z: z = r · z1 = r(cos ϕ + i sin ϕ) = r cos ϕ + i · r sin ϕ | {z } | {z } =x =y z1 wird um den Faktor r vom Ursprung weggestreckt. Da |z1 | = 1 war, hat z nun den Betrag |z| = r, also den Abstand r vom Ursprung, wovon man sich leicht überzeugen kann: q q p √ 2 2 2 2 2 2 |z| = x + y = r cos ϕ + r sin ϕ = r 2 (cos2 ϕ + sin2 ϕ) = r 2 = r Abb. 35 verdeutlicht den Zusammenhang zwischen z1 und z = r · z1 . 64 65 ◦ Zur Erinnerung: Für die Umrechnung zwischen Bogenmass und Gradmass muss man sich merken, dass: π =180 b . 2 2 2 2 Zur Klärung: cos ϕ ≡ (cos ϕ) und sin ϕ ≡ (sin ϕ) . 72 Abbildung 35: Nimmt man den Ursprung 0 als Streckzentrum und streckt die auf dem Einheitskreis liegende Zahl z1 mit dem Faktor r, so resultiert die Zahl z = r · z1 . Zu ihr gehört nach wie vor die Winkelkoordinate ϕ, aber ihr Betrag ist nun |z| = r. Das Paar aus Betrag r und Winkelkoordinate ϕ bezeichnet als Polarkoordinaten von z. Jede komplexe Zahl z = x + iy lässt sich also statt durch den Realteil x und den Imaginärteil y auch durch ein Paar aus einem Betrag r und einer Winkelkoordinate ϕ beschreiben. r und ϕ nennt man die Polarkoordinaten von z. x und y lassen sich sehr leicht durch r und ϕ ausdrücken. Offensichtlich gilt: x = r cos ϕ und y = r sin ϕ Die umgekehrte Angabe, also wie sich r und ϕ durch x und y ausdrücken lassen, ist, zumindest was die Winkelkoordinate ϕ angeht, etwas mühsamer. Für den Betrag r gilt offensichtlich: p r = x2 + y 2 Bezüglich der Winkelkoordinate ϕ machen wir uns zuerst bewusst, dass es zu einem bestimmten z im Prinzip mehrere korrekte Werte von ϕ gibt. Wenn wir einen zu z passenden Winkel ϕ0 um 2π, also um eine ganze Umdrehung vergrössern oder verkleinern, so schauen wir ja wieder in dieselbe Richtung. Tatsächlich gibt es somit unendlich viele zu z passende Winkelwerte: ϕ = ϕ0 ± n · 2π mit n∈N Wenn wir aber effektiv mal die Winkelkoordinate zu einer komplexen Zahl anzugeben haben, dann soll sie möglichst klein sein, also möglichst nahe bei 0 liegen. Wir fordern: −π < ϕ ≤ π Blicken wir kurz auf Abb. 35. Dort besitzt die Zahl z den Realteil x = r cos ϕ und den Imaginärteil y = r sin ϕ. Der Bruch xy ergibt gerade tan ϕ, denn im grossen rechtwinkligen Dreieck ist dies genau das Verhältnis der Gegenkathete von ϕ zur Ankathete. Daraus folgern wir: y ϕ = arctan x Allerdings kann dies noch nicht die letzte Wahrheit sein, denn so ergäbe sich z.B. für z = 3 + 2i und z = −3 − 2i derselbe Winkelwert, weil: −2 2 = 3 −3 73 Tatsächlich müssen wir eine Fallunterscheidung machen. Je nachdem, in welchem Quadranten der komplexen Ebene die Zahl z liegt, muss ϕ leicht anders berechnet werden. Wissend, dass der Arcustangens per Definition Winkelwerte − π2 < ϕ < π2 liefert (vgl. Abb. 36), notieren wir: y 1. Quadrant: x > 0 und y > 0 ⇒ ϕ = arctan x y 2. Quadrant: x < 0 und y > 0 ⇒ ϕ = arctan + π x y 3. Quadrant: x < 0 und y < 0 ⇒ ϕ = arctan − π x y 4. Quadrant: x > 0 und y < 0 ⇒ ϕ = arctan x Auf diese Weise entstehen, wie weiter oben gefordert, lauter Winkelwerte −π < ϕ ≤ π. Abbildung 36: Der Graph der Arcustangensfunktion. Halten wir nochmals fest, was wir in diesem Abschnitt Neues gesehen haben: Koordinaten komplexer Zahlen Eine komplexe Zahl z wird einerseits durch ihre beiden kartesischen Koordinaten x und y beschrieben. Wir sprechen vom Realteil x und vom Imaginärteil y und es gilt: z = x + iy Andererseits gehören zu jeder komplexen Zahl z 6= 0 zwei Polarkoordinaten r und ϕ. r = |z| ist der Betrag und ϕ die Winkelkoordinate von z und es gilt: z = r(cos ϕ + i sin ϕ) (61) Für die Umrechnung von Polar- zu kartesischen Koordinaten gilt: x = r cos ϕ und y = r sin ϕ (62) Umgekehrt ergibt sich für die Umrechnung von kartesischen zu Polarkoordinaten: p y (63) r = x2 + y 2 und ϕ = arctan + kπ x Für z im 2. Quadranten der komplexen Ebene ist k = +1, für den 3. Quadranten ist k = −1 und für den 1. und 4. Quadranten ist k = 0. 74 5.5.2 Euler-Gleichung und Euler-Darstellung komplexer Zahlen Wir kommen nun zum eigentlichen Wunder der komplexen Zahlen und zum Grund dafür, dass sich das Rechnen mit ihnen so dermassen durchgesetzt hat. Dieses Wunder heisst Euler’sche Gleichung und gipfelt darin, dass sich eine Beziehung zwischen den fundamentalen Zahlenkonstanten e, i und π sowie den Neutralelementen 1 und 0 von Multiplikation und Addition notieren lässt, nämlich: eiπ + 1 = 0 Diese Gleichung wird von vielen Mathematikerinnen und Mathematikern als etwas vom Fundamentalsten und Schönsten überhaupt angesehen. . . Sie entspringt dem folgenden Zusammenhang: Euler-Gleichung und Euler-Darstellung Für die Euler’sche Zahl e und die beiden Winkelfunktionen Cosinus und Sinus gilt die Euler-Gleichung: eiϕ = cos ϕ + i sin ϕ (64) eiϕ ist somit die praktische Kurzschreibweise für eine komplexe Zahl auf dem Einheitskreis der Gauss’schen Zahlenebene, denn genau dafür steht cos ϕ + i sin ϕ ja. Mit (61) lässt sich nun jede komplexe Zahl z mit Polarkoordinaten r und ϕ in der sogenannten Euler-Darstellung notieren: z = r · eiϕ (65) Damit darf man ganz normal rechnen. Insbesondere gelten für eiϕ die üblichen Potenzgesetze, was uns zahlreiche neue Rechenwege eröffnet. Die Euler-Gleichung ist gar nicht einmal so schwierig zu beweisen. Wir kommen zu einem späteren Zeitpunkt darauf zu sprechen. Im Moment wollen wir aber einfach von ihrer Richtigkeit ausgehen und sehen, wie uns die Euler-Darstellung (65) in ganz neuer Art und Weise arbeiten lässt. Zuerst aber noch ein paar direkte Bemerkungen zum eben Gesagten: • Das konjugiert Komplexe einer Zahl z lässt sich auch in der Euler-Darstellung rasch notieren: z = r eiϕ z ∗ = r e−iϕ ⇒ • Da die Cosinus- und die Sinusfunktion 2π-periodisch sind, gilt dies nun auch für die Exponentialfunktion eiϕ . Das bedeutet: ei(ϕ±2π) = eiϕ für jede beliebige Winkelkoordinate ϕ Das wird klar, wenn wir uns wieder vor Augen führen, dass cos ϕ + i sin ϕ für die zur Winkelkoordinate ϕ gehörende komplexe Zahl z auf dem Einheitskreis steht. Die Subtraktion oder Addition von 2π erzeugt eine ganze Umdrehung im oder gegen den Uhrzeigersinn und führt somit wieder auf dasselbe z auf dem Einheitskreis. • Besonders wichtig, da häufig vorkommend, sind die speziellen Werte bei Vielfachen von e0 = 1 π ei 2 = i eiπ = −1 ei 3π 2 = −i ei2π = 1 Ab hier wiederholt sich die Abfolge wegen der 2π-Periodizität von eiϕ . Hierin steckt auch die “besonders schöne” Gleichung von oben: eiπ = −1 ⇔ 75 eiπ + 1 = 0 etc. π 2: 5.5.3 Repetition der Potenzgesetze Die Stärke der Euler-Darstellung z = reiϕ liegt insbesondere darin, dass man bei der Multiplikation zweier komplexer Zahlen eben lediglich zwei Beträge und zwei Potenzen mit Basis e miteinander zu multiplizieren hat. . . grübel, grübel . . . was passiert schon wieder bei der Multiplikation zweier Potenzen mit gleicher Basis? Damit diese und ähnlich Fragen zum Umgang mit Potenzen wieder geklärt sind, seien hier kurz die Potenzregeln repetiert: Rechenregeln für Potenzen Grundverständnis für a ∈ C und n ∈ N: an ≡ a . . · a} | · .{z a0 ≡ 1 n−mal a−1 ≡ 1 a Multiplikation/Division von Potenzen mit gleicher Basis: ab · ac = ab+c resp. ab = ab−c ac für a, b, c ∈ C Multiplikation/Division von Potenzen mit gleichem Exponenten: ac · bc = (a · b)c resp. Potenzieren von Potenzen: (ab )c = ab·c ac a c = bc b für für a, b, c ∈ C a, b, c ∈ C Diese Potenzregeln funktionieren im Komplexen natürlich nur, weil wir schön dafür gesorgt haben, dass die Körperaxiome erfüllt sind, dass es also eine wohldefinierte Addition und Multiplikation gibt! 5.5.4 Das Verständnis der komplexen Multiplikation Im Abschnitt 5.4.2 war das graphische Verständnis für die Multiplikation zweier komplexer Zahlen noch nicht so richtig greifbar (vgl. Abb. 30). Das Produkt zweier Zahlen liess sich zwar ohne Probleme berechnen, wie wir im damaligen Beispiel mit z1 = 1 + 2i und z2 = −1 + i (vgl. Seite 67) gesehen hatten: z3 = z1 z2 = (1 + 2i)(−1 + i) = −1 + i − 2i + 2i2 = −1 − i − 2 = −3 − i Mit der Euler-Darstellung wird nun aber endlich alles viel klarer! Betrachten wir ganz allgemein zwei komplexe Zahlen in ihren Euler-Darstellungen z1 = r1 eiϕ1 und z2 = r2 eiϕ2 , so ergibt sich wegen der Potenzregel für ihr Produkt: z3 = z1 z2 = r1 eiϕ1 · r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) = r3 eiϕ3 D.h., die neue Zahl z3 besitzt als Betrag (= Distanz zum Ursprung) das Produkt der Beträge der beiden ursprünglichen Zahlen: r3 = r1 r2 Und was passiert mit den Winkeln? Die werden einfach addiert! Die Winkelkoordinate ϕ3 der resultierenden Zahl z3 ist einfach die Summe der Winkelkoordinaten beider Faktoren: ϕ3 = ϕ1 + ϕ2 Damit verstehen wir die Multiplikation zweier komplexer Zahlen nun auch graphisch ohne Weiteres. 76 Betrachten wir zur Veranschaulichung nochmals das Beispiel von oben resp. von Seite 67, jetzt neu dargestellt in Abb. 37. Zu den beiden Zahlen z1 = 1 + 2i und z2 = −1 + i gehört je eine Winkelkoordinate und ein Betrag, ebenso zum Resultat z3 = z1 z2 = −3 − i. Mittels der Koordinatentransformationen (63) erhalten wir für diese Koordinaten: r1 = r2 = r3 = p 12 + 22 = √ 5 und 11 + 12 = √ 2 und p 31 + 12 = √ 10 und p 2 ≈ 1.107 1 1 π 3π +π =− +π = ≈ 2.356 ϕ2 = arctan −1 4 4 −1 ϕ3 = arctan − π ≈ −2.820 −3 ϕ1 = arctan Bei den Beträgen sehen wir sofort, dass der Zusammenhang stimmt: √ √ √ r1 r2 = 5 · 2 = 10 = r3 Bei den Winkelkoordinaten müssen wir einen kurzen Moment länger überlegen: ϕ1 + ϕ2 ≈ 1.107 + 2.356 = 3.463 > π Dieses Ergebnis liegt ausserhalb des Intervalls ] − π; π]. Um es wieder in diesen Bereich zu bringen, müssen wir davon einmal 2π abziehen. Dadurch verändern wir an der Richtung von ϕ1 + ϕ2 und damit an z1 z2 nichts, denn die Addition oder Subtraktion von 2π entspricht ja einfach einer ganzen Umdrehung: ϕ1 + ϕ2 − 2π ≈ 3.643 − 2π ≈ −2.820 Nun stimmt das Resultat mit der weiter oben berechneten Winkelkoordinate ϕ3 von z3 überein. Abbildung 37: Das graphische Verständnis der komplexen Multiplikation: Bei der Multiplikation zweier komplexer Zahlen z1 und z2 zur Zahl z3 = z1 z2 werden die Beträge miteinander multipliziert (r3 = r1 r2 ) und die Winkelkoordinaten addiert (ϕ3 = ϕ1 + ϕ2 ). 77 Halten wir zusammenfassend fest, was wir über die Multiplikation zweier komplexer Zahlen nun gelernt und am Beispiel überprüft haben: Komplexe Multiplikation in der Euler-Darstellung Multiplizieren wir eine erste komplexe Zahl z1 = r1 eiϕ1 mit einer zweiten komplexen Zahl z2 = r2 eiϕ2 , so erhalten wir die Zahl z3 mit: z3 = z1 · z2 = r1 eiϕ1 · r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) = r3 eiϕ3 Die Multiplikation zweier in Euler-Darstellung gegebener komplexer Zahlen bedeutet also: • Der Betrag von z3 ist das Produkt der Beträge von z1 und z2 : r3 = r1 · r2 • Die Winkelkoordinate von z3 ist die Summe der Winkelkoordinaten von z1 und z2 : ϕ3 = ϕ1 + ϕ2 Multiplikation als Drehstreckung in der komplexen Ebene Die Multiplikation der Zahl z1 mit der Zahl z2 steht für eine Drehstreckung von z1 um den Ursprung in der Gauss’schen Ebene: • z1 wird dabei erstens im Gegenuhrzeigersinn um den Winkel ϕ2 um den Ursprung gedreht. • Zweitens wird z1 mit dem Faktor r2 gestreckt, wobei das Streckzentrum ebenfalls der Ursprung ist. Natürlich kann dieselbe Multiplikation ebenso gut als Drehstreckung von z2 mit dem Winkel ϕ1 und dem Streckfaktor r1 aufgefasst werden. Häufigster Spezialfall: eiϕ als rotierender Faktor An dieser Stelle soll besonders darauf hingewiesen werden, dass die Multiplikation mit dem Faktor eiϕ einfach einer Drehung um den Ursprung mit Drehwinkel ϕ entspricht (im Gegenuhrzeigersinn). Der Betrag der Zahl wird durch diese Multiplikation nicht verändert. Nach diesen Überlegungen zur Multiplikation fällt es nicht weiter schwer, noch kurz über die Division zweier komplexer Zahlen nachzudenken. Auch diese Operation fällt einem mit Polarkoordinaten, also in der Euler-Darstellung, wesentlich leichter als mit kartesischen Koordinaten: z3 = r1 eiϕ1 r1 i(ϕ1 −ϕ2 ) z1 = = e = r3 eiϕ3 iϕ 2 z2 r2 e r2 Somit gilt für den Betrag und die Winkelkoordinate des Resultates z3 : r3 = r1 r2 und ϕ3 = ϕ1 − ϕ2 Immer noch handelt es sich um eine Drehstreckung: z1 wird um den Faktor r2 gegen den Ursprung hin gestaucht und zudem um ϕ2 im Uhrzeigersinn gedreht (das Minuszeichen in ϕ1 − ϕ2 sorgt dafür, dass die Drehung nicht im Gegenuhrzeigersinn, sondern eben im Uhrzeigersinn erfolgt). 78 5.6 Weitere Zusammenhänge und erste Anwendungen mit komplexen Zahlen Nun haben wir das wesentliche Rüstzeug zum Umgang mit komplexen Zahlen beisammen: Die neue Zahlenmenge C ist eingeführt, die Grundoperationen darauf sind diskutiert (auch graphisch) und Sie haben gesehen, wie Rechnungen in der Euler-Darstellung (Polarkoordinaten) durch Ausnutzung der Potenzgesetze vereinfacht werden. Jetzt sind wir bereit diese “neuen” Zahlen auch wirklich zu gebrauchen und zu sehen, wie man sie geübt anwendet und wo sie ganz besonders praktisch sind. 5.6.1 Die Gleichung z n = 1 und die n-ten Einheitswurzeln Vorüberlegung zur reellen Gleichung xn = 1: Wie Sie wissen, besitzt die Gleichung x2 = 1 die beiden Lösungen x = ±1, zu x3 = 1 existiert allerdings nur eine Lösung x = 1. Dies setzt sich fort und wir können für alle n ∈ N zusammenfassen: ( +1 für ungerades n n x =1 ⇒ x= ±1 für gerades n Offenbar gibt es im Reellen keine ganz einheitliche Aussage zu den Lösungen von xn = 1. Man muss zwischen ungeraden und geraden Exponenten unterscheiden. . . Komplexe Einheitswurzeln: Im Komplexen schreiben wir für die Unbekannte nicht mehr x, sondern z. Wie sieht es nun mit den Lösungen von z n = 1 mit n ∈ N aus? Zur Behandlung dieser Gleichung empfiehlt es sich, z in der Euler-Darstellung anzusetzen. Damit lässt sich sofort ein Ausdruck für z n notieren: n z = r eiϕ ⇒ z n = r eiϕ = r n einϕ z n soll gleich 1 sein, also den Betrag r n = 1 aufweisen. Da r in der Euler-Darstellung per Definition eine positive reelle Zahl ist, folgt sofort: r = 1. Alle Lösungen von z n = 1 liegen also auf dem Einheitskreis und wir schreiben nur noch: z = eiϕ resp. z n = einϕ (66) An dieser Stelle machen wir uns nochmals klar, dass sich die reelle Einheit 1 mittels EulerDarstellung auf unendlich viele verschiedene Arten schreiben lässt: 1 = . . . = e−i6π = e−i4π = e−i2π = ei·0 = ei2π = ei4π = ei6π = . . . Allgemein: 1 = ei2πk mit k∈Z (67) Alle zu 1 gehörenden Winkelkoordinaten 2πk mit k ∈ Z zeigen vom Ursprung aus in die positive Richtung der rellen Achse, also eben in die Richtung von 1. Sie unterscheiden sich lediglich darin, dass sie unterschiedlich viele ganze Umdrehungen (±2π) im Gegen- oder im Uhrzeigersinn enthalten, was an der Zahl 1 aber nichts ändert. Bei der nachfolgenden Lösung von z n = 1 soll die 1 durch ihre Euler-Darstellung ersetzt werden. Um bei dieser Ersetzung garantiert keine Lösungen zu verlieren, dürfen wir keine mögliche Winkelkoordinate von 1 einfach von vornherein ausschliessen. Wir sollten also ganz unbedingt den allgemeinen Ausdruck 1 = ei2πk verwenden. Mit der Euler-Darstellung von z n in (66) und derjenigen von 1 in (67) folgt nun: zn = 1 einϕ = ei2πk ⇒ mit k ∈ Z Damit die beiden Seiten der Gleichungen wirklich gleich sind, müssen die Winkelkoordinaten übereinstimmen (= Identifikationstrick für Winkelkoordinaten, vgl. Seite 69): nϕ = 2πk 79 mit k∈Z Für die möglichen Winkelkoordinaten erhalten wir daraus: 2π k mit k ∈ Z n Das sieht zunächst nach unendlich vielen Lösungen aus, weil k ja alle ganzen Zahlen von −∞ bis +∞ durchläuft. In Tat und Wahrheit gibt es aber nur genau n verschiedene Lösungen. ϕ= Wir überlegen: 2π n ist der n-te Teil einer ganzen Umdrehung. Lässt man k bei 0 starten, so erreicht ϕ = 2π k bei k = n den Wert ϕ = 2π und eine ganze Umdrehung ist abgeschlossen. n Die Winkelkoordinate ϕ = 2π gehört, ebenso wie die Winkelkoordinate ϕ = 0, zur Zahl z = 1. Für k = n, n+1, n+2, . . . ergeben sich nun lauter Winkelrichtungen, die wir bereits abgedeckt haben. Starten wir bei k = 0, so entsteht die letzte wirklich neue Winkelrichtung bei k = n−1. Auch für negative k erhalten wir lauter Winkelrichtungen, die bereits abgedeckt sind. Somit lassen sich die n echt verschiedenen Winkelwerte folgendermassen notieren: 2π k mit k = 0, 1, 2, . . . , n − 1 n Fassen wir dieses Resultat allgemein zusammen: ϕ= Die n-ten Einheitswurzeln Als n-te Einheitswurzeln bezeichnet man die Lösungen der Gleichung: zn = 1 mit n∈N Zu jedem n gibt es n verschiedene Einheitswurzeln, nämlich: 2π z = ei n k mit k = 0, 1, . . . , n − 1 Eine dieser Einheitswurzeln ist stets die reelle Einheit 1 selber. Die weiteren Einheitswurzeln liegen von 1 ausgehend gleichverteilt auf dem Einheitskreis der komplexen Ebene. Die Einheitswurzeln werden so genannt, weil die Zahl 1 die (reelle) Einheit ist und die Gleichung z n = 1 im klassischen Sinn eben nach den n-ten Wurzeln von 1 fragt. Ein paar Beispiele (siehe Abb. 38): Als 2. Einheitswurzeln (= Quadratwurzeln von 1) ergeben sich: 2π z2 = 1 ⇒ z1 = ei·0 = 1 z2 = ei 2 = eiπ = −1 Diese Lösungen kennen wir bereits aus dem Reellen! Für die 3. Einheitswurzeln erhalten wir: z3 = 1 ⇒ z1 = ei·0 = 1 z2 = ei 2π 3 z3 = ei 4π 3 = e−i 2π 3 = z2∗ Die zweite und die dritte Lösung existieren, kommen aber einfach nicht auf den Strahl der reellen Zahlen zu liegen! Daher gibt es in der Einschränkung auf die reellen Zahlen eben keine andere dritte Wurzeln von 1 als die 1 selber. Wir stellen fest: Eine Einheitswurzel oberhalb der reellen Achse hat stets ein Gegenüber unterhalb der reellen Achse (Spiegelpunkt). D.h., das konjugiert Komplexe einer n-ten Einheitswurzel ist immer noch eine n-te Einheitswurzel. Wie wir auf Seite 75 bemerkt hatten, wechselt beim Übergang zum konjugiert Komplexen in der Euler-Darstellung einfach das Vorzeichen des Exponenten. Somit gilt eben bei den 3. Einheitswurzeln z.B.: 2π 2π ∗ = e−i 3 z3 = z2∗ = ei 3 80 Betrachten wir auch noch die 4. und die 5. Einheitswurzeln: z4 = 1 ⇒ z1 = 1 z2 = ei 2π 4 z5 = 1 ⇒ z1 = 1 z2 = ei 2π 5 π = ei 2 = i z3 = ei 4π 5 z3 = eiπ = −1 z4 = z3∗ z4 = z2∗ = −i z5 = z2∗ Abbildung 38: Beispiele von n-ten Einheitswurzeln. Stets verteilen sie sich gleichmässig auf dem Einheitskreis. Die 1 gehört immer dazu. 81 5.6.2 Mehr vom Wurzelziehen im Komplexen Komplexe Wurzeln von positiven reellen Zahlen: Ausgehend von den Einheitswurzeln können wir unsere “Wurzelzieh-Fähigkeiten” nun rasch weiter ausbauen. Zunächst wollen wir nun die n-te Wurzel nicht nur von 1, sondern von einer beliebigen positiven, reellen a Zahl bestimmen. Es sei also: zn = a mit a ∈ R+ Da sich ein solches a in der Form a = a ei2πk mit k ∈ Z schreiben lässt und wir auch z wieder in der Euler-Darstellung notieren können, ergibt sich: z n = r n einϕ = a ei2πk mit k ∈ Z Nun müssen auf der linken Seite und der rechten Seite sowohl die Beträge, wie auch die Winkelkoordinaten übereinstimmen. Der Identifikationstrick funktioniert also auch bei Polarkoordinaten, weil sowohl der Betrag, als auch die Winkelrichtung einer bestimmten komplexen Zahl eindeutig sind. Daraus folgt für den Betrag von z: √ rn = a ⇒ r= na √ Hier meint n a die althergebrachte n-te Wurzel im Reellen. Sie ist selber stets positiv und eindeutig und existiert in jedem Fall, weil wir ja davon ausgegangen sind, dass a ∈ R+ . Die Winkelkoordinaten-Gleichung einϕ = ei2πk haben wir bereits bei den Einheitswurzeln behandelt und wir kennen ihre n echt verschiedenen Lösungen: ϕ= 2π k n mit k = 0, . . . , n − 1 Somit lässt sich für die n-ten Wurzeln einer positiven reellen Zahl a zusammenfassen: zn = a mit a ∈ R+ ⇒ z= √ n 2π a ei n k mit k = 0, . . . , n − 1 In der komplexen Ebene liegen diese n-ten Wurzeln allesamt auf einem Kreis mit Radius √ r = n a um den Ursprung. Die Winkelrichtungen sind immer noch dieselben wie bei den n-ten Einheitswurzeln. Wurzeln beliebiger komplexer Zahlen: Schliesslich sei nun a ∈ C eine beliebige komplexe Zahl mit Betrag |a| und Winkelkoordinate α: a = |a| eiα Damit lautet unsere Wurzelgleichung in Euler-Darstellung: z n = r n einϕ = |a| ei(α+2πk) mit k ∈ Z Wir bemerken einmal mehr: Die Winkelkoordinate α ist nicht ganz strikt festgelegt, sie kann um beliebige Vielfache von 2π variieren. Dadurch werden auch hier wiederum n echt verschiedene Lösungen erzeugt: nϕ = α + 2πk ⇒ ϕ= α 2π + k n n mit k = 0, . . . , n − 1 Nun wissen wir vollständig Bescheid über die Lösungen einer Wurzelgleichung im Komplexen: p α 2π mit k = 0, . . . , n − 1 z n = a mit a ∈ C ⇒ z = n |a| ei n + n k 82 Eine Zwischenbemerkung zur Wurzelnotation: Wie Ihnen vielleicht schon aufgefallen ist, ver√ wenden wir das klassische Wurzelsymbol . . . nicht für komplexe Zahlen. Wir schreiben für √ die Lösungen von z n = a also nicht z = n a. Mittlerweile verstehen Sie gut, weshalb wir das nicht machen. Die n-te Wurzel einer komplexen Zahl ist ja alles andere als eindeutig. Es gibt immer n verschiedene Lösungen von z n = a. Im Reellen hatte es noch behelfsmässig funktioniert festzulegen, dass die Wurzel 2 immer positiv √ z.B. x = 5 √ sein soll. So wusste man immer, welche der beiden Lösungen von mit x = 5 gemeint war. Die gesamte Lösungsmenge lautete dann x = ± 5. Mit den n Lösungen im Komplexen wird es da allerdings schwierig, sodass wir eben festlegen, unter dem althergebrachten Wurzelsymbol keine komplexen Zahlen zu notieren!66 Der Platz unter einer Wurzel ist ausschliesslich für positive, reelle Zahlen reserviert! Trotzdem sprechen wir von den n-ten Wurzeln der komplexen Zahl a. Damit meinen wir – zur Erinnerung – alle Lösungen der Gleichung: zn = a mit n∈N und a∈C Wurzeln als Drehstreckungen: Wie wir schon gesehen haben, steht die Multiplikation mit einer komplexen Zahl z = r eiϕ für eine Drehstreckung um den Ursprung der Gauss’schen Zahlenebene. z n steht somit für die n-malige Ausführung einer bestimmten Drehstreckung – ausgehend von welcher Zahl? Von 1 aus, denn wir können stets schreiben: z n = 1 · |z · .{z . . · z} n−mal zn Mit dem Lösen der Gleichung = a bestimmen wir also alle Drehstreckungen z, die mich, ausgehend vom Ort der reellen Einheit 1, nach n-facher Ausführung zur Zahl a bringen! Konkrete Beispiele: Zum Schluss zwei handfeste Beispiele: • Quadratwurzeln von a = 3 ei3π/4 : a = 3 ei3π/4 liegt im 2. Quadranten der komplexen Ebene (vgl. Abb. 39). Wir ermitteln Ihre Quadratwurzeln resp. eben die beiden Lösungen der Gleichung z 2 = 3 ei3π/4 : √ √ 3π 3π 2π z = 3 ei 2·4 + 2 k = 3 ei 8 +πk mit k = 0, 1 √ 11π √ 3π √ 3π ⇒ z1 = 3 ei 8 und z2 = 3 ei 8 +π = 3 ei 8 √ Diese beiden Quadratwurzeln sitzen auf dem Kreis mit Radius 3 und zwar bei den 3π 11π Winkeln ϕ1 = 3π 8 und ϕ2 = 8 + π = 8 . Natürlich könnte man den Winkel ϕ2 auch im Intervall ] − π; π] angeben. Das wäre 5π dann ϕ2 = 11π 8 − 2π = − 8 . Es ist für unsere Zwecke aber nicht wirklich wichtig diese Umrechnung vorzunehmen – Hauptsache, wir haben die beiden Wurzeln mit je mindestens einer korrekten Winkelkoordinatenangabe aufgespürt. z1 und z2 stehen nun einerseits für einen Punkt in der Gauss’schen Zahlenebene, andererseits beschreiben sie eine Drehstreckung, die uns in bei doppelter Ausführung von der reellen Einheit 1 zur Zahl a = 3 ei3π/4 führt. Das sehen Sie in Abb. 39. 1 ei5π/8 : Abb. 40 illustriert das folgende Beispiel: • Die 5. Wurzeln von a = √ 4 2 s 5π π 2π 2π 5π 1 1 1 ⇒ z = 5 √ ei 8 /5+ 5 k = √ ei 8 + 5 k z 5 = √ ei 8 mit k = 0, . . . , 4 4 2 4 2 2 66 Allenfalls haben Sie sich schon gewundert, warum man die imaginäre Einheit i nicht einfach als Nun haben Sie einen Grund dafür kennengelernt. 83 √ −1 definiert. √ Abbildung 39: Die beiden Quadratwurzeln einer komplexen Zahl: Sowohl z1 = 3 ei3π/8 , also auch √ i11π/8 lösen die Gleichung z 2 = a = 3 ei3π/4 . Beide Zahlen können als Vorschriften für z2 = 3 e eine Drehstreckung angesehen werden (Multiplikation mit einer komplexen Zahl). Die hintereinander ausgeführten, identischen Drehstreckungen müssen von 1 nach a führen. Abbildung 40: Die fünf 5. Wurzeln von a = 84 1 √ 4 2 ei5π/8 . 5.6.3 Quadratische Gleichungen im Komplexen Repetition: Reelle quadratische Gleichungen Innerhalb der reellen Zahlen gibt es zu einer quadratischen Gleichung ax2 + bx + c = 0 (a, b, c ∈ R) entweder keine, eine oder zwei Lösungen x. Man kann die drei Fälle klar voneinander unterscheiden: Zwei Lösungen: Die quadratische Funktion f (x) = ax2 + bx + c auf der linken Gleichungsseite lässt sich mittels eines Zweiklammeransatzes faktorisieren, also in die Nullstellenform bringen: f (x) = ax2 + bx + c = a(x − x1 )(x − x2 ) = 0 mit x1 , x2 ∈ R Dann sind x1 , x2 ∈ R die beiden Lösungen der quadratischen Gleichung. Entdeckt man den Zweiklammeransatz nicht auf Anhieb, so lassen sich x1 und x2 via Mitternachtsformel finden: √ −b ± b2 − 4ac x1/2 = 2a Darin ist der Ausdruck unter der Wurzel die sogenannte Diskriminante D = b2 − 4ac. Durch das ± im Zähler entstehen die beiden Lösungen. Die Parabel, also der Funktionsgraph zu f (x), schneidet die x-Achse zweimal, eben bei den beiden Nullstellen x1 und x2 (vgl. Abb. 41). Eine Lösung: Verschwindet die Diskriminante, D = 0, so fallen die beiden Lösungen x1 und x2 zusammen. Die Faktorisierung von f (x) entspricht dann der zweiten binomischen Formel: f (x) = ax2 + bx + c = a(x − x1 )2 = 0 mit z1 = − b 2a Graphisch betrachtet sitzt dann der Scheitelpunkt der Parabel zu f (x) auf der x-Achse. Keine Lösung: f (x) = ax2 + bx + c lässt sich nicht faktorisieren. D.h. es gibt keinen Zweiklammeransatz f (x) = a(x − x1 )(x − x2 ) mit a, x1 , x2 ∈ R. Damit einher geht, dass die Diskriminante D = b2 − 4ac einen negativen Wert annimmt und somit in der Mitternachtsformel unter der Wurzel eine negative Zahl steht, was innerhalb der reellen Zahlen eben zu keiner Lösung führt. In diesem Fall schneidet die Parabel die x-Achse nicht. Abbildung 41: Die Lösungen quadratischer Gleichungen entsprechen den Nullstellen von Parabeln. Daher gibt es Fälle mit zwei, einer oder keiner Lösung. 85 Komplexe Quadratische Gleichungen Betrachten wir die Angelegenheit nun im Komplexen: f (z) = az 2 + bz + c = 0 mit a, b, c, z ∈ C Neu ist nicht nur, dass die Variabel z komplex ist. Auch die Koeffizienten a, b, c dürfen im allgemeinen Fall komplex sein. Und nun kommt die klare Aussage dazu: Im Komplexen gibt es zu jeder quadratischen Gleichung stets zwei Lösungen z1 und z2 , die als Spezialfall zusammenfallen können. D.h., f (z) lässt sich im Komplexen immer in zwei Klammern faktorisieren, also in Nullstellenform bringen: f (z) = az 2 + bz + c = a(z − z1 )(z − z2 ) = 0 mit z1 , z2 ∈ C z1 und z2 lassen sich nach wie vor durch die Mitternachtsformel bestimmen: √ −b ± b2 − 4ac z1/2 = 2a Die Wurzel der Diskriminante kann innerhalb von C auf jeden Fall gezogen werden, sodass sicher √ zwei Lösungen existieren. Allerdings haben wir gelernt, dass die Wurzelschreibweise a aus Gründen der Eindeutigkeit für positive, reelle Zahlen a ∈ R+ 0 reserviert ist. Wir schreiben daher korrekter: z1/2 = −b + w1/2 2a wobei w1/2 die Lösungen von w2 = D = b2 − 4ac sind Im Spezialfall D = 0 resp. w = 0 fallen die beiden Lösungen immer noch zusammen, dann gibt es auch innerhalb von C nur eine einzige Lösung und die Faktorisierung der quadratischen Funktion lautet: f (z) = a(z − z1 )2 Beispiel 1: Starten wir mit reellen Koeffizienten. Wir interessieren uns für die Faktorisierung von: f (z) = 1 2 z − 3z + 9 2 Diese quadratische Funktion kann im Reellen nicht faktorisiert werden, weil D = b2 − 4ac = 32 − 4 · 12 · 9 = −9. Im Komplexen ist nun allerdings: w2 = D = −9 ⇒ w1/2 = ±3i Als Lösungen von f (z) = 0 ergeben sich damit (siehe Abb. 42): z1/2 = −b + w1/2 3 ± 3i = = 3 ± 3i 2a 2 · 21 Und damit lautet die Faktorisierung von f (z): f (z) = 1 2 1 1 z − 3z + 9 = (z − z1 )(z − z2 ) = (z − 3 + 3i)(z − 3 − 3i) 2 2 2 Sie können durch Ausmultiplizieren selber überprüfen, dass dies so korrekt ist. Dazu ein Tipp: Die beiden Klammern haben eine binomische Form (a + b)(a − b) mit a = z − 3 und b = 3i. Beim Ausmultiplizieren lohnt sich es sich daher die dritte binomische Formel auszunützen: (a + b)(a − b) = a2 − b2 86 Beispiel 2: Jetzt betrachten wir eine Funktion mit komplexem konstanten Term c = 2 + 2i f (z) = 1 2 z − 2z + 2 + 2i 2 Wir berechnen die Diskriminante und wandeln sie in Polarkoordinaten um: 1 · (2 + 2i) = 4 − 4 − 4i = −4i (rein imaginär) 2 π π Polarkoordinaten: |D| = 4 und δ = − ⇒ D = 4 e−i 2 2 D = b2 − 4ac = 22 − 4 · ⇒ Nun folgt für die Wurzeln der Diskriminante und daraus für die Lösungen von f (z) = 0: −i π4 +π −i π4 −i π4 w1 = 2 e eiπ = −w1 und w2 = 2 e = 2| e{z } · |{z} = w1 z1/2 = −i π4 −b + w1/2 −b ± w1 2 ± 2e = = 2a 2a 2 · 12 =−1 π = 2 ± 2 e−i 4 In der komplexen Ebene liegen sich die beiden Lösungen somit gegenüber auf einem Kreis mit Radius 2 rund um die Zahl 2 auf der reellen Achse (vgl. Abb. 42). Für die faktorisierte Form von f (z) können wir schreiben: π π 1 f (z) = z − 2 − 2 e−i 4 z − 2 + 2 e−i 4 2 Zur Übung sollten Sie sich davon überzeugen, dass Sie durch Ausmultiplizieren wieder den anfänglichen Ausdruck für f (z) erhalten. Natürlich lassen sich die Lösungen auch in kartesischen Koordinaten schreiben, z.B. für z1 : √ ! √ −π −π √ √ 2 2 −i π4 = 2 + 2 cos z1 = 2 + 2 e + i sin =2+ 2−i 2 −i =2+2 4 4 2 2 Abbildung 42: Die komplexen Lösungen zu den beiden Beispielen quadratischer Gleichungen: Die beiden Lösungen können (mit Ausnahme des Zusammenfallens in einem Punkt) stets als gegenüberliegende Punkte auf einem Kreis aufgefasst werden. Der Kreis muss seinen Mittelpunkt aber nicht notwendigerweise auf seiner reellen Achse haben, wie man hier eventuell denken könnte. 87 5.6.4 Darstellung komplexer Funktionen Bitte bemerken Sie: Anders als Abb. 41 zeigt Abb. 42 keine Funktionsgraphen! Das Einzige, was zu sehen ist, sind zwei komplexe Zahlen (= Punkte in der komplexen Ebene), die Null ergeben, wenn man sie in die jeweilige quadratische Funktion f (z) einsetzt. Die graphische Veranschaulichung komplexer Funktionen ist nicht mehr so einfach möglich. Unser altes f (x) = ax2 + bx + c (mit a, b, c, x ∈ R) beschreibt eine Abbildung von R nach R, also von einer eindimensionalen auf eine eindimensionale Zahlenmenge. Wir schreiben: f :R→R Damit lässt sich f (x) auf einem Blatt Papier gut darstellen. Jedem x auf einem ersten, horizontal liegenden, reellen Zahlenstrahl (x-Achse) wird ein Wert y auf einem zweiten, vertikal verlaufenden, reellen Zahlenstrahl (y-Achse) zugeordnet. So entstehen die Ihnen bekannten Funktionsgraphen. Bei einer komplexen Funktionen wird hingegen jedem Punkt z in der Gauss’schen Zahlenebene ein komplexer Funktionswert f (z) zugeordnet, der wiederum als Punkt irgendwo in der komplexen Ebene liegt. f (z) ist somit eine Abbildung von der zweidimensionalen Zahlenmenge C auf die zweidimensionale Zahlenmenge C: f :C→C Das macht die Darstellung der komplexen Funktion als Ganzes unmöglich. Sie lässt sich nur eingeschränkt darstellen. Z.B. kann man das Abbild einer bestimmten Teilmenge darstellen. In Abb. 43 werden sämtliche Punkte in der komplexen Ebene links mittels der Funktion f (z) = 1 2 z − 2z + 2 + 2i auf Punkte in der komplexen Ebene rechts abgebildet. Um eine Ahnung zu bekom2 men, was dabei so alles passiert, betrachten wir die Abbildungen einzelner Punkte oder Punktstränge von der linken in die rechte Graphik: π Nullstellen z1 und z2 : Die Nullstellen von f (z) lauten immer noch: z1/2 = 2 ± 2 e−i 4 . D.h., die beiden Punkte z1 und z2 links werden rechts auf den Ursprung 0 abgebildet. Punkt/Zahl A: Der komplexen Zahl A = 1 − 2i wird folgender Bildpunkt A′ zugeordnet: A′ = f (A) = 1 2 1 3 A − 2A + 2 + 2i = (1 − 2i)2 − 2(1 − 2i) + 2 + 2i = . . . = − + 4i 2 2 2 Gerade g: Die Gerade g verläuft links in Abb. 43 durch die Nullstelle z1 . Demzufolge durchquert das Abbild g′ dieser Gerade rechts genau einmal den Nullpunkt 0. Interessanterweise besitzt g ′ die Form einer Parabel. Kreis c: Der Kreis c links wurde so gewählt, dass die beiden Nullstellen z1 und z2 auf ihm liegen. Das bedeutet, sein Abbild c′ muss rechts zweimal durch den Ursprung 0 verlaufen. Wir sehen, was für eine “lustige” Kurve entsteht. Sie schliesst sich – wie das beim Kreis ja auch der Fall ist – macht aber in gewisser Weise zwei Umläufe. Um noch besser zu sehen, was durch f (z) wie von links nach rechts abgebildet wird, sind die obere und die untere Kreishälfte unterschiedlich eingefärbt und diese Farben sind nach rechts übertragen. Jeder Halbkreis enthält eine der beiden Nullstellen. Demnach erfolgt der 0-Durchgang rechts einmal in Blau und einmal in Rot. Normalparabel q: Schliesslich habe ich links noch eine Parabel (alle Zahlen z = x + iy mit x2 = y) eingetragen. Wir sehen das hübsch geschwungene Abbild q ′ davon rechts. Die Gerade g wurde übrigens genau so gelegt, dass sie eine Tangente an die Parabel q ist. Es gibt also einen Berührungspunkt S. Dessen Abbild S ′ ist auch auf der rechten Seite ein Berührungspunkt zwischen q ′ und g′ . 88 Abbildung 43: Komplexe Abbildungen: Jede Funktion f (z) weist einer komplexen Zahl z eine andere komplexe Zahl f (z) zu. Da es sich bei z und f (z) je um einen Punkt in der Gauss’schen Zahlenebene handelt, ist eine Darstellung der Funktion insgesamt nicht möglich. Allerdings lassen sich die Abbilder einzelner Punkte oder Kurven betrachten. 5.6.5 Der Fundamentalsatz der Algebra Wie Sie aufgrund des obigen – noch relativ einfachen – Beispiels der komplexen Funktion f (z) = 1 2 2 z − 2z + 2 + 2i bereits erahnen können, dürfte die Untersuchung komplexer Funktionen resp. Abbildungen ein spannenderes und grösseres Gebiet der Mathematik sein. Man nennt es komplexe Analysis oder Funktionentheorie. Damit werden wir uns allerdings nicht vertieft beschäftigen können, obwohl die daraus gewonnen Erkenntnisse und neuen Methoden sehr toll sind. Eine der wichtigsten Aussagen wollen wir aber nicht unerwähnt lassen: Fundamentalsatz der Algebra Gegeben sei eine (komplexe) Polynomfunktion n-ten Grades fn (z) mit Koeffizienten a0 , . . . , an ∈ C: fn (z) = an z n + an−1 z n−1 + . . . + a2 z 2 + a1 z + a0 Der Fundamentalsatz der Algebra besagt, dass jedes beliebige solche fn (z) in genau n Klammern faktorisiert werden kann: fn (z) = an (z − z1 )(z − z2 ) · . . . · (z − zn ) D.h., fn (z) besitzt genau n Nullstellen z1 , z2 , . . . , zn ∈ C, von denen allerdings mehrere oder sogar alle identisch sein können. Ohne Beschränkung der Allgemeinheit (O.B.d.A.) können wir also sagen, dass die Gleichung fn (z) = 0 im Komplexen stets n Lösungen hat. Wir verzichten auf den Beweis dieses Satzes, nehmen aber zur Kenntnis, dass wir damit z.B. verstehen, weshalb die Gleichung z n = 1 gerade n verschiedene Einheitswurzeln liefert. So hat das Polynom fn (z) = z n − 1 eben n verschiedene Nullstellen. Z.B. ist für n = 3: 2π 4π z 3 = 1 ⇒ f3 (z) = z 3 − 1 = 0 ⇒ f3 (z) = (z − 1) z − ei 3 z − ei 3 = 0 Dass diese Faktorisierung korrekt ist, können Sie via Ausmultiplizieren selber überprüfen! 89 5.6.6 Die trigonometrischen Additionstheoreme Hier folgt ein Paradebeispiel dafür, wie toll sich manche reellen Zusammenhänge mit dem Umweg über das Komplexe behandeln lassen. Es geht um die Herleitung der sogenannten trigonometrischen Additionstheoreme. Für manche Zwecke – in der Physik z.B. für das Verständnis sich überlagernder Schallwellen in der Akustik – wäre es praktisch die Sinus- oder die Cosinusfunktion einer Summe zweier Winkel in Funktionen der Einzelwinkel zu zerlegen. Wir möchten also wissen, wie sich sin(α+β) und cos(α+β) als Kombination von sin α, cos α, sin β und cos β schreiben lassen. Das scheint nicht ganz trivial zu sein! Abb. 44 zeigt die verschiedenen involvierten Grössen. Gibt es da überhaupt einen Zusammenhang? Die Antwort lautet: Ja! Und er liesse sich durchaus im Reellen herleiten, aber der Weg über das Komplexe ist nun so wunderbar einfach, dass es eine Schande wäre ihn nicht zu benutzen! Zunächst stellen wir unter Verwendung der Euler-Darstellung fest: ei(α+β) = cos(α + β) + i sin(α + β) | {z } | {z } =Re ei(α+β) =Im ei(α+β) Andererseits gilt bei der Multiplikation von Potenzen mit gleicher Basis aber eben auch: ei(α+β) = eiα · eiβ = (cos α + i sin α)(cos β + i sin β) = cos α cos β + i cos α sin β + i sin α cos β + i2 sin α sin β = cos α cos β − sin α sin β + i (cos α sin β + sin α cos β) {z } | | {z } =Re ei(α+β) =Im ei(α+β) Nun vergleichen wir die beiden Ausdrücke für ei(α+β) . Weil Realteil und Imaginärteil einer bestimmten komplexen Zahl eindeutig sind, müssen sie in beiden Ausdrücken übereinstimmen. Dies ist einmal mehr der Identifikationstrick von Seite 69. Daraus folgen sofort die beiden Additionstheoreme für die Cosinus- und die Sinusfunktion: cos(α + β) = cos α cos β − sin α sin β sin(α + β) = cos α sin β + sin α cos β (68) Abbildung 44: Welche Grössen werden durch die Additionstheoreme miteinander verknüpft? 90 Unter Verwendung der Symmetrieeigenschaften cos(−α) = cos α und sin(−α) = − sin α lassen sich diese beiden Additionstheoreme auch für Winkeldifferenzen umschreiben: cos(α − β) = cos α cos β + sin α sin β sin(α − β) = cos α sin β − sin α cos β (69) Die trigonometrischen Additionstheoreme sind immer wieder nützlich. Insbesondere lassen sich aus ihnen auch die sogenannten Doppelwinkelformeln ableiten: cos(2α) = cos2 α − sin2 α (70) sin(2α) = 2 sin α cos α Die Cosinusformel kann unter der Verwendung des trigonometrischen Pythagoras sin2 α+cos2 α = 1 noch weiter umgeformt werden, sodass darin wahlweise nur noch cos2 α oder sin2 α auftritt: cos(2α) = cos2 α − sin2 α = (1 − sin2 α) − sin2 α = 1 − 2 sin2 α cos(2α) = cos2 α − sin2 α = cos2 α − (1 − cos2 α) = 2 cos2 α − 1 resp. (71) Daraus folgt weiter: sin2 α = 1 1 − cos(2α) 2 2 und cos2 α = 1 1 + cos(2α) 2 2 (72) sin2 α und cos2 α sind also selber wieder Cosinuskurven, allerdings mit halber Wellenlänge, denn diese wird durch den Faktor 2 im Argument der Cosinusfunktion halbiert (vgl. Abb. 45). Diese Umformungen ermöglichen uns beispielsweise beim Integrieren die Stammfunktionen von sin2 α und von cos2 α zu bestimmen. Abbildung 45: Die Graphen der Funktionen cos2 x und sin2 x sind selber wieder Cosinusfunktionen, die mit Amplitude 12 , aber doppelt so “schnell” um die mittlere Höhe y = 12 schwanken. 91 5.6.7 Cosinus- und Sinusfunktion als Linearkombinationen von eiϕ und e−iϕ Für eine Zahl z auf dem Einheitskreis in der Gauss’schen Zahlenebene und ihr konjugiert Komplexes z ∗ gilt gemäss der Euler-Gleichung (64) bekanntlich: z = eiϕ = cos ϕ + i sin ϕ z ∗ = e−iϕ = cos ϕ − i sin ϕ und eiϕ und e−iϕ lassen sich also mittels geeigneter Koeffizienten ci ∈ C als Summe von cos ϕ und sin ϕ darstellen: eiϕ = c1 · cos ϕ + c2 · sin ϕ e−iϕ = c3 · cos ϕ + c4 · sin ϕ mit c1 = 1 und c2 = i mit c3 = 1 und c4 = −i Weil diese Summendarstellung möglich ist, sagen wir in der Sprache der höheren Algebra: “Die Funktionen eiϕ und e−iϕ sind Linearkombinationen der beiden Funktionen cos ϕ und sin ϕ.” Der Wortteil “linear” kommt daher, dass cos ϕ und sin ϕ in diesen beiden Summen nur mit Potenz 1 auftreten, dass also keine Terme mit sin2 ϕ oder cos5 ϕ, etc. benötigt werden. In die umgekehrte Richtung überlegen wir uns: eiϕ + e−iϕ = cos ϕ + i sin ϕ + cos(−ϕ) + i sin(−ϕ) = cos ϕ + i sin ϕ + cos ϕ − i sin ϕ = 2 cos ϕ Dabei haben wir ausgenutzt, dass die Cosinusfunktion achsensymmetrisch und die Sinusfunktion punktsymmetrisch ist: cos(−ϕ) = cos ϕ und sin(−ϕ) = − sin ϕ. Es folgt: cos ϕ = 1 iϕ 1 −iϕ eiϕ + e−iϕ e + e = 2 2 2 Analog finden wir: eiϕ − e−iϕ = . . . = 2i sin ϕ ⇔ sin ϕ = 1 iϕ 1 eiϕ − e−iϕ e − e−iϕ = 2i 2i 2i cos ϕ und sin ϕ lassen sich also ebenso als Linearkombinationen von eiϕ und e−iϕ darstellen. Graphisch ist der Zusammenhang übrigens leicht nachzuvollziehen. Erinnern wir uns daran, dass die Addition zweier komplexer Zahlen in der Gauss’schen Zahlenebene dem Aneinanderhängen zweier Pfeile entspricht, so führt uns eiϕ + e−iϕ auf die reelle Achse an den Ort 2 cos ϕ und eiϕ − e−iϕ auf die imaginäre Achse an den Ort 2i sin ϕ, wie Abb. 46 veranschaulicht. Halten wir dieses wichtige Resultat nochmals ganz explizit fest: Euler-Schreibweisen für cos ϕ und sin ϕ Cosinus- und Sinusfunktion lassen sich als Linearkombinationen von eiϕ und dessen konjugiert Komplexen e−iϕ schreiben: cos ϕ = eiϕ + e−iϕ 2 und sin ϕ = eiϕ − e−iϕ 2i (73) Wir wollen uns diese Beziehungen unter dem (inoffiziellen) Namen EulerSchreibweisen von cos ϕ und sin ϕ merken, weil sie direkt aus der EulerGleichung eiϕ = cos ϕ + i sin ϕ folgen. 92 Abbildung 46: Die Summe und die Differenz von eiϕ und e−iϕ führen einerseits auf die reelle Achse zur Stelle 2 cos ϕ, andererseits auf die imaginäre Achse zur Stelle 2i sin ϕ. Die Euler-Schreibweisen für cos ϕ und sin ϕ sind ab und zu extrem praktisch. So lassen sich aus manchmal unhandlichen trigonometrischen Ausdrücken rasch komplexe Exponentialausdrücke gewinnen, mit denen das Rechnen aufgrund der Potenzgesetze leichter fällt. Beispiele gefällig? Beispiel 1: Wie lässt sich das Produkt cos ϕ sin ϕ zusammenfassen/vereinfachen? Wenn Sie sich an die Additionstheoreme erinnern, kennen Sie die Antwort bereits. Die Doppelwinkelformel für die Sinusfunktion lautet: sin(2ϕ) = 2 cos ϕ sin ϕ. Somit müssen wir finden: cos ϕ sin ϕ = 12 sin(2ϕ). Und davon können wir uns nun eben in wenigen Schritten überzeugen: eiϕ + e−iϕ eiϕ − e−iϕ ei2ϕ − 1 + 1 − e−i2ϕ · = 2 2i 2 · 2i i2ϕ −i2ϕ 1 e −e 1 = · = sin(2ϕ) 2 2i 2 cos ϕ sin ϕ = Beispiel 2: Sie haben schon seit jeher gelernt, dass die Ableitung der Sinusfunktion die Cosinusfunktion ist. Mit der Euler-Schreibweise zeigt man das ganz rasch: d eiϕ − e−iϕ eiϕ + e−iϕ ieiϕ − (−i)e−iϕ d (sin ϕ) = = = cos ϕ = dϕ dϕ 2i 2i 2 Beachten Sie: Die Kettenregel erzeugt bei der Ableitung von e±iϕ die Faktoren ±i! An dieser Stelle sei zudem ganz explizit darauf hingewiesen, dass die Ableitungsregeln im Komplexen ganz genau gleich funktionieren wie im Reellen! Grund dafür ist einmal mehr, dass die komplexen Zahlen C zusammen mit Addition und Multiplikation einen vollständigen Zahlenkörper bilden. 93 5.6.8 Der harmonische Oszillator im Komplexen Zum Schluss von Abschnitt 4.4.3 hatten wir auf Seite 44 nochmals die DGL für den klassischen, harmonischen Oszillator (z.B. Federpendel) notiert: x′′ = −ω 2 x mit ω2 = D m Diese DGL wollen wir nun unter Verwendung komplexer Zahlen erneut lösen, allerdings mit einem anderen Lösungsansatz. Die zweite Ableitung x′′ soll der gesuchten Ortsfunktion x(t) bis auf den Vorfaktor −ω 2 entsprechen. Dann müsste eine Exponentialfunktion x(t) = C · eλt doch ein brauchbarer Ansatz sein, denn Exponentialfunktionen bleiben beim Ableiten als solche erhalten. Wir setzen also neu an: x(t) = C · eλt mit x′ (t) = λC · eλt = λx(t) und x′′ (t) = λ2 C · eλt = λ2 x(t) Durch Einsetzen in die DGL folgern wir: x′′ = λ2 x = −ω 2 x ⇒ λ2 = −ω 2 (74) q D Dabei ist ω = m eine positive reelle Zahl. Innerhalb der reellen Zahlen wären wir hier am Ende einer Sackgasse angelangt, denn (74) besitzt ganz offensichtlich keine reellen Lösungen λ ∈ R. Lassen wir für λ nun allerdings auch komplexe Werte zu, so lösen wir munter weiter: λ = ±iω Immer noch handelt es sich um eine DGL zweiter Ordnung, sodass wir bei der Angabe der allgemeinen Lösung zwei Koeffizienten C1 und C2 einzufügen haben: x(t) = C1 eiωt + C2 e−iωt mit x′ (t) = iω C1 eiωt − C2 e−iωt Die Koeffizienten C1 und C2 dürfen nun aber auch komplex sein! Da sich cos(ωt) und sin(ωt) gemäss (73) als Linearkombinationen von eiωt und e−iωt schreiben lassen, deckt unsere neue allgemeine Lösung den genau gleichen Lösungsraum ab wie die Alte (Gleichung (42) auf Seite 44): x(t) = A1 cos(ωt) + A2 sin(ωt) Im Prinzip hätten wir damals auch für A1 und A2 komplexe Werte zulassen dürfen. Da aber die Ortsfunktion x(t) zum Federpendel für alle Zeiten t reell sein muss, wären dadurch nur unbrauchbare, weil komplexe Lösungen hinzugekommen, denn cos(ωt) und sin(ωt) sind selber ja reell. Bringen wir das Beispiel noch rasch zuende: Die Randbedingungen unseres Federpendels waren x(0) = A und v(0) = x′ (0) = 0. Daraus erhalten wir: C e0 + C e0 = C + C = A x(0) =! A A 2 1 2 1 ⇒ ⇒ C1 = C2 = 0 0 ! iω C1 e − C2 e = iω(C1 − C2 ) = 0 x′ (0) = 0 2 Damit lautet unsere an die RBs angepasste Lösung: x(t) = A iωt A −iωt eiωt + e−iωt e + e =A· = A cos(ωt) 2 2 2 Und somit sind wir bei der genau gleichen Lösung wie in (42) auf Seite 44 gelandet. Im Moment mag Ihnen diese komplexe Vorgehensweise eher schwieriger erscheinen. In der Quantenmechanik geht es bei der Lösung von DGLs in der Regel aber um die Bestimmung einer grundsätzlich komlexwertigen Wellenfunktion Ψ (x, t)! Erst das Betragsquadrat |Ψ |2 = Ψ ∗Ψ muss reell sein, was aber für Beträge ohnehin der Fall ist. Und im Zusammenhang mit dieser Wellenfunktion werden wir Ausdrücke wie eiωt sehr schätzen lernen. 94 Literatur [1] Griffiths, David J. (2012). Quantenmechanik, Lehr- und Übungsbuch (2., aktualisierte Auflage). Hallbergmoos: Pearson Deutschland GmbH. [2] Otto, Markus (2011). Rechenmethoden für Studierende der Physik im ersten Jahr (Nachdruck 2013). Heidelberg: Spektrum Akademischer Verlag. [3] Gertsch, Alex (2013). Theorie-Dossier “Mechanik”. Zürich. [4] Gertsch, Alex (2015). Schwingungen und Wellen – Kurztheorie. Zürich. [5] Beweis der Irrationalität der Wurzel aus 2 bei Euklid. 3.2016. Wikipedia: https://de.wikipedia.org/wiki/Beweis der Irrationalität der Wurzel aus 2 bei Euklid (Abruf: 20.4.2016) [6] Deller, Henri, Gebauer, Peter & Zinn, Jörg (2000). Algebra 3, Aufgaben, Ergebnisse. Zürich: Orell Füssli Verlag AG.