Mathematische Methoden der Physik Prof. Dr. Ludger Santen Kontakt: Ludger Santen, Universität des Saarlandes, Geb. E2 6, Zi. 4.15 [email protected] http://www.uni-saarland.de/campus/fakultaeten/professuren/ naturwissenschaftlich-technische-fakultaet-ii/theoretische-physik/ professuren-theoretische-physik-fr-71/prof-dr-ludger-santen.html letzte Aktualisierung: 13. Januar 2011 1 Inhaltsverzeichnis 1 Komplexe Zahlen 1.1 Komplexe Zahlen und die komplexe Ebene . . . . . 1.2 Die vier Grundrechenarten mit komplexen Zahlen . . 1.2.1 Addition und Subtraktion . . . . . . . . . . . 1.2.2 Multiplikation . . . . . . . . . . . . . . . . . 1.2.3 Division . . . . . . . . . . . . . . . . . . . . 1.3 Eigenschaften komplexer Zahlen . . . . . . . . . . . 1.3.1 Die komplex konjugierte Zahl . . . . . . . . 1.3.2 Betrag und Argument komplexer Zahlen . . . 1.4 Komplexe Zahlen und die Exponentialfunktion . . . 1.4.1 Die Polardarstellung komplexer Zahlen . . . 1.4.2 Multiplikation und Division in Polarform . . 1.4.3 de Moivres Theorem . . . . . . . . . . . . . 1.5 Trigonometrische Funktionen . . . . . . . . . . . . . 1.5.1 Additionstheoreme . . . . . . . . . . . . . . 1.6 Die n-te Wurzel von 1 . . . . . . . . . . . . . . . . . 1.7 Der komplexe Logarithmus . . . . . . . . . . . . . . 1.8 Hyperbolische Funktionen . . . . . . . . . . . . . . 1.9 Hyperbolische Umkehrfunktionen – Areafunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Elemente der linearen Algebra 2.1 Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Lineare Gleichungen . . . . . . . . . . . . . . . . . . 2.1.2 Vektorräume: Definition und Beispiele . . . . . . . . . 2.2 Linearkombinationen, lineare Hülle und erzeugende Systeme . 2.3 Lineare (Un-) Abhängigkeit . . . . . . . . . . . . . . . . . . . 2.4 Vektorräume und Basis . . . . . . . . . . . . . . . . . . . . . 2.5 Lösen linearer Gleichungssysteme . . . . . . . . . . . . . . . 2.6 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Rechenoperationen mit Matrizen . . . . . . . . . . . . 2.6.2 Determinanten . . . . . . . . . . . . . . . . . . . . . 2.6.3 Matrixinversion . . . . . . . . . . . . . . . . . . . . . 2.6.4 Matrizen: Definitionen und Eigenschaften . . . . . . . 2.6.5 Das Eigenwertproblem . . . . . . . . . . . . . . . . . 2.6.6 Entartete Eigenwerte . . . . . . . . . . . . . . . . . . 2.6.7 Eigenvektoren und Eigenwerte einer normalen Matrix 2.6.8 Basiswechsel und Ähnlichkeitstransformationen . . . 2.6.9 Diagonalisierung von Matrizen . . . . . . . . . . . . . 3 Differentialrechnung im Rn 3.1 Funktionen mehrerer Variablen . . . . . . . . . . . . . . . 3.2 Das totale Differential und die totale Ableitung . . . . . . 3.3 Exakte und inexakte Differentiale . . . . . . . . . . . . . 3.4 Rechenregeln für partielle Ableitungen . . . . . . . . . . . 3.5 Variablentransformation . . . . . . . . . . . . . . . . . . . 3.6 Taylor-Entwicklung . . . . . . . . . . . . . . . . . . . . . 3.7 Stationäre Punkte von Funktionen mit mehreren Variablen 3.8 Extrema mit Nebenbedingungen . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 6 6 6 7 7 7 8 8 9 10 10 12 13 13 14 15 . . . . . . . . . . . . . . . . . 16 16 16 17 18 18 19 20 23 23 24 25 26 28 29 30 31 32 . . . . . . . . 35 35 36 37 37 38 39 40 41 4 Integralrechnung im Rn 4.1 Zweidimensionale Integrale . . . . . . . . . . . . . . 4.2 Dreifachintegrale . . . . . . . . . . . . . . . . . . . 4.3 Variablentransformation . . . . . . . . . . . . . . . . 4.3.1 Transformationen im R2 . . . . . . . . . . . 4.3.2 Variablentransformation in Dreifachintegralen 5 Vektoranalysis 5.1 Der Gradient . . . . . . . . . . . . . . . . 5.2 Raumkurven und Kurvenintegrale . . . . . 5.3 Länge und Bogenlänge . . . . . . . . . . . 5.4 Skalare Kurvenintegrale . . . . . . . . . . . 5.5 Vektorielle Kurvenintegrale . . . . . . . . . 5.5.1 Verhalten bei Umparametrisierung: 5.6 Konservative Vektorfelder und Potential . . 5.7 Weitere Vektoroperatoren . . . . . . . . . . 5.8 Oberflächenintegrale . . . . . . . . . . . . 5.9 Das vektorielle Oberflächenintegral . . . . 5.10 Der Integralsatz von Gauß . . . . . . . . . 5.11 Der Integralsatz von Stokes . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 43 44 45 45 47 . . . . . . . . . . . . 49 49 49 50 51 51 52 52 53 54 57 59 60 Vorbemerkungen Die Vorlesung Mathematische Methoden der Physik ist weder eine Mathematik- noch eine Physikvorlesung. Sie stellt vielmehr eine Vielzahl von Rechenmethoden für die Vorlesungen der theoretischen und experimentellen Physik zur Verfügung. Dieses Konzept hat einige praktische Konsequenzen: Training: Sie lernen nicht zu schwimmen, wenn Sie regelmäsig Wettkämpfe im Fernsehen schauen. Sie lernen es auch nicht, wenn Sie Freunden beim Schwimmen zusehen. Sie müssen selber schwimmen und das ist am Anfang schwer! Leichter wird es, wenn Ihnen ein Trainer Tipps gibt. Gleiches gilt für die mathematischen Methoden. Sie müssen selber rechnen, rechnen, rechnen! Lassen Sie sich aber bei Problemen von Ihren Trainern (Übungsgruppenleiter, Tutor, Kommilitonen) helfen. Tutorien: Die Vorlesung mathematische Methoden der Physik baut auf das Abiturwissen aus dem Mathematik-Grundkurs auf, also auf die Rechenmethoden, die wir im Vorkurs noch einmal wiederholt haben. Sollten Sie damit noch Probleme haben, sollten Sie sich bemühen, die Probleme schnell zu beseitigen, eventuell mit Hilfe des Tutoriums. Ausrichtung: Physik wird in dieser Vorlesung nur eine untergeordnete Rolle spielen, insbesondere werden Sie keine physikalischen Übungsaufgaben lösen. Dies hat den Grund, dass die Übertragung des physikalischen in ein geeignetes mathematisches Problem häufig den Schwierigkeitsgrad der Aufgabe erhöht und eigens eingeübt werden muss. Der geeignete Ort, um diese Fähigkeit zu üben, sind die Module der theoretischen und experimentellen Physik. Zur Vorlesung wird ein Skript veröffentlicht, das Sie für die Lösung der Übungen nutzen können. Sollten Sie zusätzlich Bedarf an einem Lehrbuch haben, gibt es eine reiche Auswahl an geeigneten Lehrbüchern. Eine unvollständige Auswahl finden Sie in folgender Liste: 1. Rainer Wüst, Höhere Mathematik für Mathematiker und Physiker, Bde 1& 2, Wiley VCH, 2003 2. Christian B. Lang, Norbert Puckler, Mathematische Methoden in der Physik, Spektrum Akademischer Verlag, 2005. 3. Helmut Fischer, Helmut Kaul, Mathematik für Physiker 1-3, Teubner, 2005 4 1 Komplexe Zahlen Durch die Einführung komplexer Variablen ist es für beliebige algebraische Gleichungen möglich, die Wurzeln der Gleichung anzugeben. Damit entfällt eine Einschränkung die im Körper der reellen Zahlen besteht. Die Einführung der komplexen Zahlen hat aber nicht nur den Lösungsraum algebraischer Gleichungen erweitert, sondern auch viele analytische Rechnungen stark vereinfacht, wie wir in einem späteren Abschnitt dieser Vorlesung sehen werden. 1.1 Komplexe Zahlen und die komplexe Ebene Obwohl komplexe Zahlen in sehr vielen Bereichen auftreten, begegnen sie uns am natürlichsten als Wurzeln von Polynomen. Dies wollen wir am Beispiel der quadratischen Gleichung z2 − b z + c = 0 . (1) diskutieren. Die Gleichung (1) hat die beiden Lösungen1 z1/2 = i p 1h b ± b2 − 4c . 2 (2) Wenn der Ausdruck unter der Wurzel (die Diskriminante) positiv ist, also b2 − 4c > 0 gilt, sind die beiden Lösungen reelle Zahlen. Für b2 − 4c < 0 steht man allerdings vor dem Problem, dass es im Körper der reellen Zahlen keine Lösung der obigen Gleichung gibt. Um nun trotzdem eine Lösung der Gleichung angeben zu können, muss man also den Zahlenraum erweitern. Dazu führt man eine neue Art von Zahl ein, die sog. imaginäre Einheit i mit der Definition i2 = −1 . (3) Mit dieser Vereinbarung lässt sich nun auch für b2 − 4c < 0 eine Lösung angeben z1/2 = i p 1h b ± i 4c − b2 . 2 (4) Ganz allgemein schreiben wir komplexe Zahlen in der Form z = x + iy , (5) wobei x und y reelle Zahlen sind. Man nennt√x den Realteil und y den Imaginärteil von z. In dem vorigen Beispiel ist x = b/2 und y = ± 4c − b2 /2. Man schreibt für den Real- und den Imaginärteil auch x = Re(z) y = Im(z). und (6) Der Fundamentalsatz der Algebra sagt uns auch, daß ein Polynom wie in Gl. (1) immer eine Lösung hat, nur ist diese manchmal komplex. Ist das Polynom von Grade 3 und höher, also vom Grade n, so sagt uns der Fundamentalsatz, daß es n-Lösungen gibt, die aber nicht alle ver2 schieden seinen √ müssen. Im speziellen Beispiel hat das Polynom z − 4z + 5 = 0 die Lösungen z1/2 = 2 ± 16 − 20/2 = 2 ± i. 1 Zur Erinnerung: Gleichung (1) kann umgeschrieben werden in (z − b/2)2 + c − b4 /4 = 0 bzw. (z − b/2)2 p p c. Zieht man daraus die Wurzel, so folgt z − b/2 = ± b2 /4 − c bzw. z = b/2 ± b2 /4 − c . 5 = b2 /4 − 1.2 Die vier Grundrechenarten mit komplexen Zahlen 1.2.1 Addition und Subtraktion Die Addition zweier komplexer Zahlen z1 und z2 ergibt im allgemeinen wieder eine komplexe Zahl. Dabei werden die Realteile xi und die Imaginärteile yi separat addiert. z1 + z2 = (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 ) . (7) Dies hat eine gewisse ähnlichkeit zu Vektoren, wo die Addition komponentenweise ausgeführt wird. Man kann sich auch sofort davon überzeugen, daß aus der Gültigkeit des Assoziativ- und Kommutativgesetzes für die Addition reeller Zahlen, diese Gesetze ebenso für komplexe Zahlen folgen. z1 + z2 = z2 + z1 (Kommutativgesetz) z1 + (z2 + z3 ) = (z1 + z2 ) + z3 (Assoziativgesetz) (8) (9) 1.2.2 Multiplikation Die Multiplikation zweier komplexer Zahlen ergibt gewöhnlich auch wieder eine komplexe Zahl. Das Produkt erhält man, indem man alles ausmultipliziert und sich daran erinnert, daß i2 = −1 gilt. z1 z2 = (x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2 = (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ). (10) Das Produkt der beiden Zahlen z1 = 3 + 2i und z2 = −1 − 4i ist demnach z1 z2 = (3 + 2i)(−1 − 4i) = −3 − 2i − 12i − 8i2 = 5 − 14i Wie für reelle Zahlen, so gelten auch für die Multiplikation komplexer Zahlen das Kommutativund das Assoziativgesetz z1 z2 = z2 z1 (z1 z2 )z3 = z1 (z2 z3 ) . (11) 1.2.3 Division Der Quotient zweier komplexer Zahlen ist z3 = z1 x1 + iy1 = z2 x2 + iy2 . Dies möchte man natürlich wieder in der Form z3 = x3 + iy3 mit x3 , y3 ε R darstellen und erweitert hierfür einfach den Quotienten mit (x2 − iy2 ). z1 z2 = = (x1 + iy1 )(x2 − iy2 ) (x1 x2 + y1 y2 ) + i(x2 y1 − x1 y2 ) = (x2 + iy2 )(x2 − iy2 ) x22 + y22 x1 x2 + y1 y2 x2 y1 − x1 y2 +i 2 x22 + y22 x2 + y22 6 (12) 1.3 Eigenschaften komplexer Zahlen 1.3.1 Die komplex konjugierte Zahl Zu einer komplexen Zahl z = x + iy wird noch die komplex konjugierte Zahl z∗ = x − iy niert. Es gelten einige nützliche Rechenregeln. Für z = x + iy gilt defi- (z∗ )∗ = z z + z∗ = 2x z − z∗ = 2iy (13) 1.3.2 Betrag und Argument komplexer Zahlen Da jede komplexe Zahl z = x + iy als geordnetes Paar reeller Zahlen betrachtet werden kann, lassen sich solche Zahlen durch Punkte in der xy-Ebene, der sogenannten komplexen Ebene (Argand Diagramm) darstellen. Eine komplexe Zahl die z.B. durch den Punkt P = (3, 4) in der xy-Ebene repräsentiert wird, kann daher als (3, 4) oder 3 + 4i gelesen werden. Für jede komplexe Zahl gibt es genau einen Punkt in der Ebene. Umgekehrt entspricht jedem Punkt der Ebene eine komplexe Zahl. Manchmal bezeichnet man die x und y-Achse als relle bzw. imaginäre Achse und die komplexe Ebene als z-Ebene. Abbildung 1: Punkt in der komplexen Ebene. Der Abstand des Punktes (x, y) vom Ursprung (0, 0) entspricht der Länge des Vektors~r = (x, y), was wir als den Betrag der komplexen Zahl interpretieren. Der Betrag einer komplexen Zahl wird also definiert durch: p | z |= x2 + y2 . (14) Wenn man die komplex konjugierte Zahl benutzt, kann man den Betrag auch in der Form p √ | z |= z · z∗ = (x + iy)(x − iy) (15) angeben. Mit dem Argument einer komplexen Zahl arg(z) wird der Winkel φ = arg z in Abb. 1 bezeichnet y arg(z) = arctan( ) . (16) x Durch Konvention wird dieser Winkel entgegen des Uhrzeigersinnes positiv gewählt. Zur Illustration betrachten wir das konkrete Beispiel z = 2 − 3i. Der Betrag dieser komplexen Zahl ist q √ | z |= 22 + (−3)2 = 13 7 und ihr Argument 3 arg(z) = arctan(− ) ∼ −56, 3◦ = −0.98279 2 1.4 Komplexe Zahlen und die Exponentialfunktion Nachdem wir die einfachen Rechenregeln für komplexe Zahlen diskutiert haben, müssen wir uns mit elementaren Funktionen komplexer Variablen beschäftigen. Dies ist eigentlich die Aufgabe der Funktionentheorie, die wir in einem späteren Abschnitt ausführlicher diskutieren werden. Eine wichtige Voraussetzung für eine sinnvolle Definition komplexer Zahlen ist, dass sie für verschwindenden Imaginärteil wieder in die entsprechende reelle Funktion übergehen. Eine komplexe Funktion von besonderer Bedeutung ist die Exponentialfunktion. Die komplexe Exponentialfunktion ist eng mit den trigonometrischen Funktionen verknüpft, woraus sich einige wichtige Rechenregeln ergeben. Die Reihendarstellung der komplexen Exponentialfunktion gilt auch für komplexe Zahlen: ∞ ez = ∑ k=0 zk . k! (17) Aus dieser Tatsache, die im Rahmen der Funktionentheorie ausführlicher diskutiert wird, lassen sich einige nützliche Zusammenhänge herleiten. 1.4.1 Die Polardarstellung komplexer Zahlen Im folgenden wählen wir ω = iφ mit reeller Variable φ . In diesen Fall ist dann ω rein imaginär und exp(ω) = exp(iφ ). Wir nutzen nun die Reihendarstellung (17) der Exponentialfunktion aus und schreiben davon die ersten Summanden hin i i2 i3 φ + φ2 + φ3 +... 1! 2! 3! i i2 2 i3 3 exp (−iφ ) = 1 − φ + φ − φ + . . . 1! 2! 3! exp (iφ ) = 1 + , . (18) Nutzen wir noch die Regel i2 = −1, so bekommen wir mit i2 2 i4 4 φ + φ + . . .) 2! 4! φ2 φ4 = 2(1 − + − . . .) 2! 4! exp (iφ ) + exp (−iφ ) = 2(1 + (19) wieder eine reelle Zahl! Offensichtlich sind für reelles φ die komplexen Zahlen z = eiφ und z = e−iφ konjugiert komplex zueinander, also z∗ = (eiφ )∗ = e−iφ . Demzufolge gilt z + z∗ = eiφ + e−iφ = 2 Re{eiφ } z − z∗ = eiφ − e−iφ = 2i Im{eiφ } . Für den Betrag von eiφ folgt mit der Regel (14) |z|2 = |eiφ |2 = zz∗ = eiφ e−iφ = eiφ −iφ = e0 = 1 Offensichtlich beschreibt eiφ einen Kreis mit Radius 1 in der komplexen Ebene. 8 (20) Abbildung 2: graphische Darstellung der Eulerformel Mit z = x +iy = eiφ sieht man aus Abb. 1 daß x = cos φ und y = sin φ . Daraus folgt die Eulersche Formel cos φ + i sin φ = eiφ . (21) Hier sieht man nun auch, daß es sich z.B. für z = iφ = iωt bei eiωt um eine Schwingung handelt. Die Exponentialfunktion in dieser Schreibweise ist daher bei der Untersuchung von Schwingungen unentbehrlich. Insbesondere folgt sofort eiπ = −1, eiπ/2 = i und ei0 = ei2π = 1. Mit der Darstellung (21) kann man auch leicht eine altbekannte Formel neu ableiten 1 = |z|2 = (cos φ + i sin φ )(cos φ − i sin φ ) = cos2 φ + sin2 φ = 1 . Darüberhinaus läßt sich jede komplexe Zahl in dieser sogenannten Polardarstellung z = reiφ schreiben, wobei r und φ reell sind. Das Argument arg(z) = φ ist in dieser Darstellung trivial abzulesen. 1.4.2 Multiplikation und Division in Polarform Die Multiplikation und Division komplexer Zahlen wird in Polardarstellung ausgesprochen einfach. Das Produkt der komplexen Zahlen z1 = r1 eiφ1 und z2 = r2 eiφ2 ist mit den Regeln für die Exponentialfunktion durch z1 z2 = r1 eiφ1 r2 eiφ2 = r1 r2 ei(φ1 +φ2 ) (22) gegeben. Daraus folgen auch unmittelbar |z1 z2 | = |z1 | · |z2 | und arg(z1 z2 ) = arg(z1 ) + arg(z2 ). Insbesondere ist auch die Division komplexer Zahlen in Polardarstellung sehr einfach z1 r1 eiφ1 r1 r1 = = eiφ1 e−iφ2 = ei(φ1 −φ2 ) iφ 2 z2 r2 e r2 r2 . Die Beziehungen |z1 /z2 | = |z1 |/|z2 | und arg(z1 /z2 ) = arg z1 − arg z2 folgen. 9 (23) 1.4.3 de Moivres Theorem Ein recht wichtiges Theorem für sin und cos folgt aus der einfachen Identität (eiφ )n = einφ . Schreibt man dies in der sin- und cos-Darstellung, so ist dies äquivalent mit n (cos φ + i sin φ )n = eiφ = einφ = cos(nφ ) + i sin(nφ ) . (24) 1.5 Trigonometrische Funktionen De Moivres Theorem zeigt deutlich den Zusammenhang zwischen (komplexer) Exponentialfunktion und den trigonometrischen Funktionen. Diesen Zusammenhang werden Sie beispielsweise bei der Lösung von Schwingungsgleichungen oder der Herleitung von Additionstheoremen nutzen können. Wir betrachten nun mit die komplexen Darstellungen von sin und cos: cos φ = sin φ = 1 iφ (e + e−iφ ) 2 1 iφ (e − e−iφ ) , 2i (25) welche unmittelbar aus (21) und (20) folgen. Mit Gl. (18) erhält man auch Reihendarstellungen für cos und sin cos φ = (−1)k 2k φ k=0 (2k)! sin φ = ∑ (2k + 1)! φ 2k+1 ∞ (26) ∑ ∞ (−1)k . (27) k=0 Entsprechend folgt auch für tan und cot eine Exponentialdarstellung. tan φ = cot φ = sin φ 1 eiφ − e−iφ , = cos φ i eiφ + e−iφ cos φ eiφ + e−iφ = i iφ . sin φ e − e−iφ (28) Ersetzt man nun φ = nΘ, so folgt auch für den n-fachen Winkel Θ zusammen mit z = eiΘ 1 n 1 1 inΘ cos(nΘ) = e + e−inΘ = z + n 2 2 z 1 n 1 1 inΘ −inΘ (29) z − n sin(nΘ) = = e −e 2i 2i z Anwendungsbeispiele 1) überlagerung zweier Schwingungen gleicher Frequenz ω, welche gegeneinander Phasenverschoben sind. Die Gesamtschwingung ist dann f (t) = A1 sin(ωt + ϕ1 ) + A2 sin(ωt + ϕ2 ) i 1 h i(ωt+ϕ1 ) = A1 e − e−i(ωt+ϕ1 ) + A2 ei(ωt+ϕ2 ) − e−i(ωt+ϕ2 ) 2i 1 1 i(ωt+ϕ1 ) = e A1 + A2 ei(ϕ2 −ϕ1 ) − e−i(ωt+ϕ1 ) A1 + A2 e−i(ϕ2 −ϕ1 ) 2i 2i 1 i(ωt+ϕ1 ) = e A1 + A2 ei(ϕ2 −ϕ1 ) + konj. komplex 2i 10 Nun kann man den Vorfaktor umschreiben und man erhält mit −η A1 + A2 ei(ϕ2 −ϕ1 ) = A eiϕ (30) wieder eine komplexe Zahl, die sich leicht mit den bisherigen Regeln berechnen läßt. Abbildung 3: Modellverstärker für den Input x(t) = 0.2sin(t) (durchgezogene Linie) und dem Output y(t) = 0.3sin(t) + 0.5sin2(t). Ein ähnliches Verhalten zeigen auch nichtlineare optische Frequenzverdoppler. Abbildung 4: Eine Überlagerung zweier leicht verstimmter Schwingungen y = cos(x) + cos(1.1x). Das Ergebnis ist eine Schwebung. Das Endsignal hat also die gleiche Frequenz, aber eine andere Amplitude und ist phasenverschoben f (t) = A cos(ωt + ϕ) . (31) 2) Betrachten wir einen Verstärker mit einem Input-Signal x(t) = x0 cos(ωt) und der Eigenschaft, daß der Output mit dem Input wie folgt zusammenhängt y(t) = B(x + f x2 ) = B(x0 cos(ωt) + x02 cos2 (ωt)) . (32) Um daran zu erkennen, welche Frequenzen im Output sind, muß man z.B. ausrechnen, wie cos2 (ωt) mit der ursprünglichen Frequenz zusammenhängt. 3) Ein anderes Problem von großer Bedeutung betrifft die überlagerung von zwei Schwingungen mit zwei leicht verstimmten Frequenzen: f (t) = A1 cos((ω + ∆ω)t + ϕ1 ) + A2 cos(ωt + ϕ2 ) . Das Resultat ist eine Schwebung. In der Akustik ist dieses Phänomen gut hörbar. 11 (33) 1.5.1 Additionstheoreme Die Herleitung von Additionstheoremen im Körper der reellen Zahlen ist häufig kompliziert. Durch die Beziehung zwischen komplexer Exponentialfunktion und den trigonometrischen Funktionen kann man dagegen diese Theoreme sehr leicht herleiten. Wir wollen dies an einigen Beispielen diskutieren. Wir betrachten dazu: sin(x + y) = 1 i(x+y) e − e−i(x+y) 2i . (34) Von exp(i(x + y)) brauchen wir nur den Imaginärteil und zur Umformung dieses Ausdruckes verwenden wir die Produktregel für Exponentialfunktionen und die Euler-Formel (21) ei(x+y) = eix eiy = (cos x + i sin x)(cos y + i sin y) = i(sin x cos y + cos x sin y) + cos x cos y − sin x sin y (35) Subtrahieren wir hiervon noch exp(−i(x + y)) so bleibt nur der Imaginärteil übrig. Insgesamt bekommen wir dadurch sin(x + y) = sin x cos y + cos x sin y . (36) Ein weiteres Problem, das man durch das Theorem von de Moivre leicht lösen kann, ist sin 3Θ und cos 3Θ durch Potenzen von cos Θ und sin Θ auszudrücken. Wir erhalten cos 3Θ + i sin 3Θ = (cos Θ + i sin Θ)3 = (cos3 Θ − 3 cos Θ sin2 Θ) + i(3 sin Θ cos2 Θ − sin3 Θ). Vergleichen wir die die Real- und Imaginärteile auf beiden Seiten, so bekommen wir cos 3Θ = cos3 Θ − 3 cos Θ sin2 Θ = cos3 Θ − 3 cos Θ(1 − cos2 Θ) = 4 cos3 Θ − 3 cos Θ (37) und sin 3Θ = 3 sin Θ cos2 Θ − sin3 Θ = 3 sin Θ(1 − sin2 Θ) − sin3 Θ = 3 sin Θ − 4 sin3 Θ . (38) Ein weiteres Beispiel ist cos3 Θ, das wir mit z = eiΘ und Gl. (20) leicht berechnen können cos3 Θ = = = = 1 1 (z + )3 3 2 z 1 3 1 1 (z + 3z + 3 + 3 ) 8 z z 1 1 3 1 3 (z + 3 ) + (z + ) 8 z 8 z 3 1 cos(3Θ) + cos Θ 4 4 (39) Potenzen von sin x und cos x führen offensichtlich zu höheren Harmonischen wie cos(3x) und umgekehrt lassen sich höhere harmonische Funktionen durch Potenzen der Grundfrequenz ausdrücken. An dem oben genannten nichtlinearen Verstärker wird dann eine Frequenzmischung deutlich. Auf diese und ähnliche Weise lassen sich eine Reihe weiterer nützlicher Beziehungen ableiten, die in Formelsammlungen aufgelistet werden. 12 1.6 Die n-te Wurzel von 1 Die Gleichung z2 = 1 hat die beiden bekannten Lösungen z = ±1. Nachdem uns die komplexen Zahlen bekannt sind, können wir auch alle Lösung von zn = 1 beschaffen. Nach dem Fundamentalsatz der Algebra gibt es für jedes Polynom n-ten Grades n Lösungen. Wir wissen auch schon, daß e2iπk = cos(2πk) + i sin(2πk) = 1 (40) falls k ∈ Z Demzufolge können wir schreiben zn = e2ikπ (41) oder z = e2iπk/n . (42) Dies bedeutet, die Lösungen von zn = 1 sind z1,2,...,n = 1, e2iπ/n , . . . , e2i(n−1)π/n , (43) wobei wir hier k = 0, 1, 2, . . . , n − 1 verwenden. Größere Werte von k ergeben keine neuen Lösungen, sondern sind nur eine Duplizierung der vorhandenen Lösungen. Betrachten wir als Beispiel die Lösungen der Gleichung z3 = 1. Wenden wir nun Formel (43) an, so erhalten wir z1 = 20i , z2 = e2iπ/3 , z3 e4iπ/3 . Für k = 3, also z4 = e6iπ/3 = e2iπ = 1 = z1 , nur eine Wiederholung von z1 . Es ist auch keine überraschung, daß wir auch |z|3 = |z3 | finden, da alle Wurzeln auf dem Einheitskreis liegen und damit den Betrag 1 haben. 1.7 Der komplexe Logarithmus Die Umkehrfunktion der Exponentialfunktion exp(x) = y ist der Logarithmus x = ln y (44) falls x, y ∈ R. Der Logarithmus ist auch die Umkehrfunktion der Exponentialfunktion für komplexe Zahlen. Für den Logarithmus einer komplexen Zahl z schreiben wir w = ln z mit z = ew (45) Jetzt können wir die Regeln für die Exponentialfunktion ausnutzen, um den Logarithmus eines Produktes komplexer Zahlen z1 · z2 = ew1 ew2 = ew1 +w2 (46) zu berechnen ln(z1 z2 ) = w1 + w2 = ln(z1 ) + ln(z2 ) . (47) Nehmen wir eine komplexe Zahl auf dem Einheitskreis, so wissen wir bereits, dass z = eiφ = ei(φ +2πk) . (48) Diese Vieldeutigkeit wirkt sich auch auf den Logarithmus aus und es folgt ln z = ln r + i(φ + 2π) . 13 (49) Um die Vieldeutigkeit zu vermeiden, schränkt man das Argument arg(z) = φ auf −π < φ ≤ π ein und nennt ln(z) bei dieser Einschränkung den Hauptwert. Und was ist ln(−i)? Hier schreiben wir zuerst −i in Exponentialform um π ln(−i) = ln ei(−π/2+2nπ) = i − + 2πn , (50) 2 mit einer natürlichen Zahl n. Dies bedeutet ln(−i) = −i π2 , 3i π2 , . . . Für den Hauptwert gilt ln(−i) = − π2 i. 1.8 Hyperbolische Funktionen Was bedeutet eigentlich cos(iφ ) oder sin(iφ )? Mit dieser Wahl eines rein imaginären Argumentes im cos und sin werden die Exponenten von e in Gl. (25) reell und es folgt eine neue Klasse von Funktionen: 1 −φ cos(iφ ) = (e + e+φ ) =: cosh φ 2 1 −φ (e − e+φ ) =: sinh φ . (51) i sin(iφ ) = 2 Die beiden Funktionen cosh φ und sinh φ bezeichnet man als ”Cosinus Hyperbolicus” oder ”Hyperbelcosinus” bzw. ”Sinus Hyperbolicus” oder ”Hyperbelsinus”. Diese hyperbolischen Funktionen sind die komplexen Analoga zu den trigonometrischen Funktionen. Neben den beiden fundamentalen Funktionen gibt es in Analogie zu den trigonometrischen Funktionen die verbleibenden hyperbolischen Funktionen sinh x ex − e−x = x cosh x e + e−x cosh x ex + e−x coth x = = x sinh x e + e−x 1 2 sechx = = cosh x ex + e−x 1 2 , (52) cosechx = = sinh x ex − e−x siehe Abb. 5. Folgende Beziehungen zwischen trigonometrischen und Hyperbelfunktionen sind noch ganz hilfreich tanh x = cosh x = cos(ix) i sinh x = sin(ix) cos x = cosh(ix) i sin x = sinh(ix) . (53) ähnlich zu den Relationen zwischen verschiedenen trigonometrischen Funktion lassen sich auch Hyperbelfunktionen durch andere Hyperbelfunktionen ausdrücken. Gehen wir von cos2 x+sin2 x = 1 aus und benutzen (53) so folgt mit cosh2 x = cos2 (ix) und sinh2 x = − sin2 (ix) cosh2 x − sinh2 x = 1 . (54) Einige andere Identitäten können ebenso abgeleitet werden. sech2 x = 1 − tanh2 x cosech2 x = coth2 x − 1 sinh(2x) = 2 sinh x cosh x cosh(2x) = cosh2 x + sinh2 x 14 (55) Abbildung 5: Graphen der verschieden hyperbolischen Funktion deren analytische Darstellung im Text angegeben ist. 1.9 Hyperbolische Umkehrfunktionen – Areafunktionen Die Umkehrfunktion von y = sinh x nennen wir x = arsinh y. Wir sind nun an der expliziten Form dieses Ausdruckes interessiert. Hierfür drückt man ex durch Linearkombinationen von cosh x und sinh x aus. ex = cosh p x + sinh x = 1 + sinh2 x + sinh x p = 1 + y2 + y . (56) Wenden wir auf beide Seiten den Logarithmus an, so folgt der explizite Ausdruck für die Umkehrfunktion p x = arsinh(y) = ln( 1 + y2 + y) . (57) Auf ähnliche Weise erhält man p x = arcosh(y) = ln( y2 − 1 + y) (58) für |y| > 1. Die Umkehrfunktion von tanh(x) nennen wir analog artanh(y) und die explizite Form ist 1 1+y x = artanh(y) = ln . (59) 2 1−y 15 2 Elemente der linearen Algebra Wobei die Beweiskraft einzig vom Geschick der Beweisinszenierung abhängt (worunter nicht nur Beweisrhetorik, Beweisinstallierung und Beweismarketing zu verstehen sind, sondern auch die Verwandlung der Wirklichkeit in einen beweisäquivalenten Zustand). Heinrich Steinfest - Cheng 2.1 Vektorräume In der Schule und im Vorkurs sind Ihnen einige wichtige Eigenschaften von Vektoren vorgestellt worden. Wir betrachten an dieser Stelle den Zusammenhang zwischen linearen Gleichungssystemen, Vektorräumen und Matrizen. 2.1.1 Lineare Gleichungen Lineare Gleichungen sind von der Form: L(u) = v, mit den Vektoren u und v Beispiele solcher Systeme gibt es häufig in der Physik: (i) Schwingungsgleichung: bzw. d d2 u(t) + a u(t) + b u(t) = v(t) 2 dt dt d2 d +a + b u(t) = v(t) dt 2 dt (ii) Potentialgleichung: d2 d2 u(x, y) + u(x, y) = v(x, y) dx2 dy2 2 d d2 + 2 u(x, y) = v(x, y) dx2 dy bzw. (iii) Vertrauter dürfte Ihnen die Form 2x1 + x2 − x3 = y1 −7x1 − 5x2 + 3x3 = y2 sein, mit x1 u = x2 , x3 v= y1 y2 , 16 L(u) = 2x1 + x2 − x3 −7x1 − 5x2 + 3x3 . Diese Probleme haben gemeinsam, dass für die Abbildung L : u 7→ L(u) gilt: L(α1 u1 + α2 u2 ) = α1 L(u1 ) + α2 L(u2 ). Dies sind die definierenden Eigenschaften von linearen Abbildungen. Einige Eigenschaften von linearen Abbildungen sind direkt offensichtlich: (i) Die homogene Gleichung L(u) = 0 besitzt immer die triviale Lösung u = 0 (ii) Sind u1 und u2 Lösungen der homogenen Gleichung, so ist auch jede Linearkombination α1 u1 + α2 u2 eine Lösung. Die Lösungen bilden einen Vektorraum. (iii) Ist u0 eine spezielle Lösung der homogenen Gleichung L(u) = 0, so erhält man sämtliche Lösungen durch u = uh + u0 , wobei uh sämtliche Lösungen der homogenen Gleichung durchläuft. Mit der Einführung von linearen Abbildungen sind offenbar einige Begriffe verbunden, die wir näher diskutieren wollen. Außerdem werden wir uns mit der Lösbarkeit von linearen Gleichungssystemen beschäftigen. 2.1.2 Vektorräume: Definition und Beispiele Definition: Einen nichtleere Menge V heißt Vektorraum über R bzw. über C, wenn auf V einen Addition und einen Multiplikation mit Zahlen aus R bzw. C erklärt ist, sodass die Rechenregeln der Vektorräume gelten. Im einzelnen wird ein Vektorraum durch folgende Eigenschaften bestimmt: Wenn u, v, w ∈ V gilt, dann ist auch u + v ∈ V . Ferner entlält V ein ausgezeichnetes Element 0. Es gelten dann die Regeln: (A1 ) (u + v) + w = u + (v + w) (A2 ) u + v = v + u (A3 ) u + 0 = u (A4 ) Die Gleichung u + x = v besitzt stets genau eine Lösung x. Mit u ∈ V , α ∈ R (bzw. α ∈ C) gehört auch α · u zu V und es gilt: (S1 ) (S2 ) (S3 ) (S4 ) (α + β ) · u = α · u + β · u α · (u + v) = α · u + α · v α · (β · u) = (α · β ) · u 1·u = u Die Elemente von V nennen wir Vektoren. Die Elemente des zugrundeliegenden Zahlenkörpers R bzw. C Skalar (z.B. α, β ). Das neutrale Element der Addition 0 nennen wir Nullvektor . Beispiele: • Rn und Cn sind Vektorräume über R bzw. C. Dies gilt auch für n = 1, wobei dann der Unterschied zwischen Vektoren und Skalaren nicht mehr besteht. 17 • Funktionenräume: M ist eine nichtleere Menge, K einer der Zahlenkörper R bzw. C. Dann ist F (M , K) = { f : M 7→ K} mit f + g : x 7→ f (x) + g(x) α · f : x 7→ α · f (x) ein Vektorraum über K. Definition: Teilräume Ist V ein Vektorraum über K, so nennen wir U einen Unterraum bzw. Teilraum, wenn mit u, v ∈ U auch jede Linearkombination α · u + β · v zu U gehört, mit α, β ∈ K. Weiterhin setzen wir vorraus, dass U eine nichtleere Teilmenge von V ist. Beispiele: • {0} ist immer Teilraum von V , genauso wie V selbst. • Die Lösungen x = (x1 , x2 , ..., xn ) ∈ Rn der Gleichung a1 · x1 + ... + an · xn = 0 bilden einen Teilraum des Rn . Übungsaufgabe: Gilt dies auch für a1 · x1 + ... + an · xn = mit t 6= 0? 2.2 Linearkombinationen, lineare Hülle und erzeugende Systeme Definition: Linearkombination Jeder Vektor der Form n α1 v1 + α2 v2 + ... + αn vn = ∑ αk vn mit αi ∈ K k=1 heißt Linearkombination der Vektoren v1 , ..., vn ∈ V . Definition: Aufspann bzw. lineare Hülle Die Menge aller Linearkombinationen aus v1 , ..., vn heißt ihr Aufspann bzw. ihre lineare Hülle span{v1 , ..., vn }. Der Aufspann ist ein Teilraum von V . 2.3 Lineare (Un-) Abhängigkeit Definition: Vektoren v1 , ..., vn eines K-Vektorraums V heißen linear abhängig (l.a.), falls es Skalare (α1 , ..., αn ) ∈ K gibt, die alle nicht Null sind, sodass α1 v1 + α2 v2 + ... + αn vn = 0 Andernfalls heißen sie linear unabhängig. 18 Beispiele: (i) Die Vektoren 1 e1 = 0 , 0 0 e2 = 1 , 0 0 e3 = 0 1 sind linear unabhängig. (ii) Sind die Vektoren 1 0 u= −1 , 0 0 1 v= 1 , −2 3 −1 w= −4 2 des R4 linear unabhängig? Wir müssen dazu offenbar die Gleichung x1 u + x2 v + x3 w = 0 lösen, bzw. in Koordinaten x1 + 3x3 =0 −x1 + x2 − 4x3 =0 −2x2 + 2x3 =0. Folglich x2 − x3 = 0 ⇒ x2 = x3 und − x1 − 3x3 = 0. Offenbar ist x1 = 3 und x2 = x3 = −1 Lösung des homogenen Gleichungssystems. Die Vektoren sind also linear abhängig. 2.4 Vektorräume und Basis Definition: Ein geordnetes n-Tupel B = (v1 , ..., vn ) von Vektoren des K-Vektorraums V heißt eine Basis von V , wenn sich jeder Vektor v ∈ V als Linearkombination v = α1 v1 + ... + αn vn in eindeutiger Weise darstellen lässt. Die durch v eindeutig bestimmten Zahlen α1 , ..., αn heißen die Koordinaten von v bezgl. der Basis B. Sie werden zu einem Koordinatenvektor α1 (v)B = ... αn zusammengefasst. Satz: B = (v1 , ..., vn ) ist genau dann eine Basis, wenn v1 , ..., vn ein linear unabhängiges Erzeugendensystem ist. Bemerkung: Es sei U = span{v1 , ..., vn } ein Teilraum von V , dann ist v1 , ..., vn ein Erzeugendensystem für U. 19 Beweis: (i) Es sei B = (v1 , ..., vn ) eine Basis. Nach Definition gilt V = span{v1 , ..., vn }. Jeder Vektor v ∈ V muss sich mit eindeutig bestimmten Koeffizienten aus den v1 , ..., vn bestimmen lassen. Dies gilt auch für den Nullvektor. Damit folgt aus α1 v1 + ... + αn vn = 0 ⇒ α1 , ..., αn = 0 und somit die lineare Unabhängigkeit. (i) Es seien v = α1 v1 + ... + αn vn = β1 v1 + ... + βn vn zwei Darstellungen von v. Mit (α1 − β1 )v1 + ... + (αn − βn )vn = 0 folgt aus der linearen Unabhängigkeit von v1 , ..., vn ; α1 = β1 , ..., αn = βn , also die Eindeutigkeit. Satz: Dimension eines Vektorraums Besitzt ein Vektorraum V eine Basis aus n Vektoren, so besteht auch jede andere Basis aus n Vektoren. n ist gleichzeitig die Dimension des Vektorraums V . Also dim V = n Bemerkung: Für V = {0} gilt dim V = 0, besitzt V keine endliche Basis, so bezeichnen wir ihr als unendlichdimensional. Basisergänzungssatz: Ist b1 , ..., bn ein Erzeugendensystem von V und sind a1 , ..., an lin. unabhängige Vektoren in V , die keine Basis von V bilden, so lassen sich die a1 , ..., an durch Hinzufügen geeigneter bk zu einer Basis von V ergänzen. Basisauswahlsatz: Besitzt der Vektorraum V 6= {0} ein endliches Erzeugendensystem b1 , ..., bn , so lässt sich aus diesem eine Basis für V auswählen. 2.5 Lösen linearer Gleichungssysteme Ein lineares Gleichungssystem (LGS) mit m Gleichungen für n Unbekannte hat die Form a11 x1 + a12 x2 + . . . + a1n xn = b1 .. . am1 xm + am2 xm + . . . + amn xm = bm Gegeben sind in diesem Problem die Koeffizienten aik ∈ K und die Zahlen bk ∈ K. Gesucht sind alle Vektoren x(x1 , ..., xn ) ∈ Kn , die die obige Gleichung erfüllen. Rangbedingung zur Lösbarkeit: Lineare Gleichungssysteme in der obigen Form können kompakt durch Ax = b geschrieben werden, mit der Koeffizientenmatrix x1 a11 . . . a1n .. , A = ... x = ... ∈ Kn . . xn am1 . . . amn Der Rang einer Matrix bestimmt sich aus: 20 (i) der Maximalzahl linear unabhängiger Zeilenvektoren (Zeilenrang) (ii) der Maximalzahl linear unabhängiger Spaltenvektoren (Spaltenrang) (iii) der Dimension des Bildraums der linearen Abbildung x 7→ Ax, Kn 7→ Km Beispiel: Die Matrix 1 −2 4 0 5 A = −2 1 −1 2 −6 −1 −1 3 2 −1 hat den Rang 2, da die ersten beiden Vektoren linear unabhängig sind und die dritte Zeile die Summe der ersten beiden ist. Rangbedingung: Hat V die Dimension n, W die Dimension m so ist die lineare Abbildung L : V 7→ W genau dann in jektiv (eineindeutig), wenn Rang(L) = n und genau dann sur jektiv, wenn Rang(L) = m. Bemerkung: Für eine injektive Abbildung gilt, dass jedem Bild höchsten ein Urbild zuzuordnen ist, d.h. dass aus f (x1 ) = f (x2 ) stets x1 = x2 und aus x1 6= x2 f (x1 ) 6= f (x2 ) folgt. Für eine surjektive Abbildung f M 7→ N gilt, dass N die Bildmenge von f ergibt, d.h. dass für jedes y ∈ N die Gleichung f (x) = y mindestens einen Lösung aus M existiert. Das LGS Ax = b ist also eindeutig lösbar, wenn Rang(A) = n und universell lösbar, wenn Rang(A) = m ist . Eliminationsverfahren: Gesucht: Alle Lösungen des LSG 4x2 + 4x3 + 3x4 − 2x5 = 16 −3x1 − 3x2 + 3x3 + x4 − 2x5 = − 2 2x2 + 2x3 + 3x4 − 4x5 = 14 4x1 − x2 − 9x3 − 2x4 − x5 = − 5 1. Schritt: Umstellung der Gleichungen (nur noch Koeffizenten), Vertauschung der Zeilen I&II −3 −3 3 1 −2 −2 0 4 4 3 −2 16 0 2 2 3 −4 14 4 −1 −9 −2 −1 −5 2. Schritt: Normierung der Kopfzeile 1 1 −1 − 13 23 23 0 4 4 3 −2 16 0 2 2 3 −4 14 4 −1 −9 −2 −1 −5 21 3. Schritt: Elimination von x1 aus der Zeile IV durch Multiplikation der Kopfzeile mit (−4) und Addition zur 4. Zeile 2 2 1 1 −1 − 13 3 3 0 4 4 3 −2 16 0 2 2 3 −4 14 2 − 23 0 −5 −5 − 3 − 11 3 3 4. Schritt: Normierung der Kopfzeile im Restsystem 3 1 1 4 2 2 3 −5 −5 − 23 − 21 −4 − 11 3 4 14 − 23 3 5. Schritt: Eliminatione von x2 aus den letzten beiden Gleichungen ((−2)· bzw 5· erste Zeile) 1 1 43 − 21 4 0 0 32 −3 6 37 37 0 0 37 3 12 − 6 6. Schritt: Die Koeffizienten von x3 verschwinden. Das obige Schema führt dann auf das Restsystem 3 −3 6 2 37 − 37 37 12 6 3 und schließlich nach Normierung der Kopfzeile und Elimination von x4 (und x5 ) in der unteren Zeile 1 −2 4 0 0 0 7. Schritt: Zeilenstufenform 1 0 0 0 1 −1 − 13 3 1 1 4 0 0 1 0 0 0 2 3 2 3 1 −2 4 −2 4 0 0 bzw. 1 2 2 x1 + x2 − x3 + − x4 + x5 = 3 3 3 3 1 x2 + x3 + x4 − x5 = 4 4 2 x4 − 2x5 = 4 8. Schritt: Auflösen der Gleichung in Zeilenstufenform. Mit der Festlegung x3 = s und x5 = t ergibt sich 1 1 2 1 −1 −1 x= 0 +s 1 +t 0 . 4 0 2 1 0 0 22 2.6 Matrizen 2.6.1 Rechenoperationen mit Matrizen (i) Matrizen werden elementweise addiert, die Addition ist (daher) kommutativ und assoziativ, d.h. A+B = B+A A + (B +C) = (A + B) +C. (ii) Multipliziert man eine Matrix mit einer Konstanten, so werden alle Elemente mit der Konstanten multipliziert. B = αA ⇔ bi j = ∧ik α · ai j . (iii) Die Multiplikation von Matrizen erfolgt nach der Regel „Zeile mal Spalte“: AB = C ⇔ Ci j = ∑ aik bk j k Aus der Rechenregel ergibt sich sofort, dass die Zahl der Spalten von A der Zahl der Zeilen von B entsprechen muss. (iv) Für die Matrixmultiplikation gilt das Distributiv- aber nicht das Kommutativgesetz. Beispiel: 0 1 1 0 A= B= 1 0 0 −1 0 · 1 + 1 · 0 0 · 0 + 1 · (−1) 0 −1 AB = = 1 · 1 + 0 · 0 1 · 0 + 0 · (−1) 1 0 0 1 BA = 6= AB −1 0 Die Matrixmultiplikation ist also nicht-kommutativ! Bemerkung: Die obigen Matrizen sind zwei der drei Pauli − Matrizen, die die Komponenten des quantenmechanischen Spinoperators bilden. Definition: Der Kommutator [A, B] ≡ AB − BA misst die Differenz zwischen den beiden Produkten von A, B. Spezielle Matrizen: (i) Nullelement (ii) Einheitsmatrix A = 0 ⇔ ai j = 0 A = 1 ⇔ ai j = δi j ( 0, wenn i 6= j δi j = 1, wenn i = j 23 mit Kronecker- Delta Es gilt offenbar A0 = 0A = 0 und A1 = 1A = A. Bemerkung: Bei Matrizen treten einige Eigenschaften auf, die man von der Multiplikation von gewöhnlichen Zahlen nicht kennt. Gegeben seien die Matrizen: 1 2 10 4 A= B= 3 6 −5 2 0 0 22 44 ; BA = ⇒ AB = 0 0 −11 −22 Das Produkt der Matrizen ergibt die Nullmatrix, obwohl keine der beiden Matrizen Null ist. Damit kann also auch AC = AD gelten, obwohl C 6= D. 2.6.2 Determinanten Die Determinante einer 2x2 Matrix wird definiert durch a11 a12 := a11 a22 − a21 a12 det(A) = a21 a22 Bem.: Das lineare Gleichungssystem a11 a12 Au = v mit A= ; a21 a22 u= u1 u2 ; v= v1 v2 ist genau dann universell und eindeutig lösbar, wenn det(A)6= 0. Laplacescher Entwicklungssatz Die Determinante einer nxn Matrix A = (ai j ) kann man durch Entwicklung nach der i-ten Zeile n det(A) = |A| = ∑ (−1)i+ j ai j Ai j j=1 bzw. der k-ten Spalte n det(A) = |A| = ∑ (−1) j+k a jk A jk j=1 berechnen. Mit: Ai j ist eine (n-1) x (n-1) Matrix, die durch Streichung der i-ten Zeile und der j-ten Spalte aus A hervorgeht. Beispiel Determinante einer 3x3 Matrix (Entwicklung nach der ersten Spalte) a11 a12 a13 a21 a22 a23 = a11 a22 a23 − a21 a12 a13 + a31 a12 a13 a22 a23 a32 a33 a32 a33 a31 a32 a33 Eigenschaften von Determinanten (i) det(A) = det(AT ) (ii) Für nxn Matrizen gilt: det(AB)= det(A)*det(B) 24 (iii) det(A−1 )= (det(A))−1 Determinantenformen Definition: Eine Abbildung F:Kn x...xKn → K(n > 1) heißt (i) Multilinearform auf Kn , wenn F in jedem der n Argumente (Spalten) linear bei festgehaltenen restlichen Spalten ist: F(..., αx + β y, ...) = αF(..., x, ...) + β F(..., y, ...) (ii) Alternierende Multilinearform falls (i) gilt und F(..., ai , ..., a j , ...) = −F(..., a j , ..., ai , ...) (iii) Determinantenform falls (i) und (ii) erfüllt sind und F(e1 , ..., en ) = 1 für die kanonische Basis e1 , ..., en des Kn gilt. (ei Einheitsvektor in i-Richtung) Bemerkungen: (i) Für alternierende Multilinearformen gilt F(a1 , ..., an ) = 0 falls a1 , ..., an linear abhängig sind. Insbesondere gilt natürlich, dass F(a1 , ..., an ) = 0 falls ai = ak für i 6= k, bzw. ai = αak . (ii) Die Determinante ändert sich nicht, wenn ein Vielfaches einer Zeile von einer anderen Zeile subtrahiert wird. Damit lässt sich die Matrix durch Umformungen auf obere Dreiecksform bringen, ohne dass sich die Determinante ämdert. Die Determinante ergibt sich dann einfach aus der Multiplikation der Diagonalelemente. Bsp.: a a det 11 12 a21 a22 a12 = det a11 0 a22 − a21 a12 a11 = a11 (a22 − a21 a12 ) = a11 a22 − a21 a12 a11 2.6.3 Matrixinversion Für quadratische Matrizen A kann man eine Matrix A−1 suchen, sodass AA−1 = A−1 A = 1. Die inverse Matrix lautet: A−1 ij = 1 C ji det(A) mit der Kofaktormatrix C ji = (−1)i+ j Mi j und dem Minor Mi j , d.h. die Determinante der Streichmatrix. Offenbar ist die Matrix nur dann invertierbar, wenn det(A) 6= 0. Da det(AA−1 ) = det(1) = 1 gilt, erhalten wir det(A−1 ) = 1 . det(A) Ferner gilt: (AB)−1 = B−1 A−1 wegen (AB)−1 (AB) = B−1 A−1 AB = B−1 B = 1 25 Beispiel: Bestimmung der Inversen der Matrix A 2 4 3 A = 1 −2 −2 −3 3 2 Kofaktoren: −2 −2 = −4 + 6 = 2 = 4 = C11 M11 = det 3 2 1 −2 M12 = det = 2 − 6 = −4 = −C12 −3 2 Insgesamt erhalten wir: 2 4 −3 C = 1 13 −18 −2 7 −8 det(A) = 2 · 2 + 1 · 1 + (−3) · (−2) = 11 und 2 1 −2 T C 1 4 13 7 A−1 = = det(A) 11 −3 −18 −8 Bemerkung: Ist die Koeffizientenmatriz eines LGS invertierbar, so kann man die Lösung des GS einfach durch Matrizinversion bestimmen. ⇒ Ax = b x = A−1 b 2.6.4 Matrizen: Definitionen und Eigenschaften • Die Spur einer Matrix: Die Spur einer Matrix Sp(A) bzw. tr(A) ist die Summe ihrer Diagonalelemente Sp(A) = tr(A) = ∑(A)ii = ∑ aii i i Es gilt: tr(AB) = ∑ Aik Bki = ∑ Bki Aik = tr(BA) ik ik Allgemeiner gilt: Die Spur ist invariant gegenüber zyklischer Vertauschung von Matrixprodukten, also tr(A1 A2 ...An ) = tr(An A1 ...An−1 ) • Die transponierte Matrix: AT : AT ij = (A) ji . Es gilt (AB)T = BT At . • Die komplex-konjugierte Matrix: A∗ bzw. A, die die Elemente a∗i j enthält. • Die hermitisch konjugierte Matrix (bzw. adjungierte Matrix): 26 A+ = AT ∗ • Die Diagonalmatrix: Nur die Diagonalelemente sind verschieden von Null. • Die symmetrische Matrix: A = AT Die antisymmetrische Matrix: A = (−1)AT • Die relle Matrix: A = A∗ Die imaginäre Matrix: A = −A∗ • Die orthogonale Matrix: AT = A−1 (für eine quadratische Matrix, z.B. die Drehmatrix) • Die hermitische Matrix: A+ = A Die antihermitische Matrix: A+ = −A • Die unitäre Matrix: A+ = A−1 • Die nilpotente Matrix: für n > n0 gilt An = 0 • Die singuläre Matrix: Matrix deren Determinante verschwindet (nicht invertierbar) 27 2.6.5 Das Eigenwertproblem Die Mutiplikation eines Vektors mit einer Matrix ist im Allgemeinen eine Drehstreckung, d.h. Richtung und Betrag des Vektors werden geändert. Liegt der Vektor aber parallel zur Drehachse, wird nicht seine Richtung, sondern ausschließlich sein Betrag geändert. Also gilt für einen solchen Vektor v Av = λ v. (60) Vektoren v, die die Gleichung (60) erfüllen, nennt man Eigenvektoren der Matrix A und den Skalierungsfaktor seinen Eigenwert. Zur Bestimmung von λ und v betrachtet man die homogene Gleichung (A − λ 1) v = 0, die direkt aus (60) folgt. Eine nichtlineare Lösung dieses homogenen Gleichungssystems kann offenbar nur dann erfolgen, wenn det (A − λ 1) verschwindet. Die Bedingung det (A − λ 1) = 0 (61) führt für eine n × n Matrix auf ein Polynom n-ten Grades in λ , das über den Körper C n (nicht notwendigerweise verschiede) Lösungen besitzt. Diese Lösungen sind die Eigenwerte des Problems. Das Polynom, das sich aus der Eigenwert- bzw. Säkulargleichung (61) ergibt, wird charakteristisches Polynom genannt. Beispiel: Bestimmung der Eigenwerte der Matrix A mit 1 1 −3 A = 1 1 −3 . 3 −3 −3 Die Säkulargleichung zur obigen Matrix lautet 1−λ det (A − λ 1) = det 1 3 ⇒ 1 1−λ −3 −3 −3 −3 − λ = 0. (1 − λ )2 (−3 − λ ) − (1 · (−3) · 3) + (−3 · 1 · (−3)) − 9(1 − λ ) − (−3 − λ ) + 9(1 − λ ) = 0 (1 − 2λ + λ 2 )(−3 − λ ) − 9 + 9 + 3 + λ = 0 −3 − λ + 6λ + 2λ 2 − 3λ 2 − λ 3 + 3 + λ = 0 −λ 3 − λ 2 + 6λ = 0 −λ (λ − 2)(λ + 3) = 0 Die Eigenwerte lauten demnach λ1 = 2, λ2 = 0 und λ3 = −3. Es bleibt also noch die Aufgabe die Eigenvektoren zu bestimmen. Dazu setzt man die Eigenwerte ein und löst das zugehörige homogene Gleichungssystem. Wir wollen dies am Beispiel von oben explizit durchführen. Für den Eigenwert λ1 = 2 ergibt sich das folgende Gleichungssystem: 28 −x1 + x2 + 3x3 = 0 x1 + x2 − 3x3 = 0 | +1· Zeile I 3x1 − 3x3 − 3x3 = 0 | +3· Zeile I −x1 + x2 + 3x3 = 0 0 =0 ⇒ 4x3 = 0 x3 = 0 ⇒ x1 = x3 = t Der zugehörige Eigenvektor lautet also t x1 = t . 0 Es ist nützlich mit normierten Eigenvektoren zu arbeiten, sodass ! |x1 | = 2t 2 = 1 1 t=√ 2 ⇒ Damit lautet der normierte Eigenvektor 1 1 x1 = √ 1 . 2 0 Analog ergibt sich für die übrigen Eigenvektoren 1 1 −1 x2 = √ und 3 1 1 1 −1 . x3 = √ 6 −2 Bemerkung: Die Menge der Eigenwerte und Eigenvektoren einer Matrix nennt man auch das Eigensystem. Die Eigenwerte von A und AT stimmen überein, die zugehörigen Eigenvektoren nicht unbedingt. Dies bedeutet, dass linke und rechte Eigenvektoren nicht übereinstimmen müssen. 2.6.6 Entartete Eigenwerte Wir wenden uns wiederum einem Beispiel zu. Es sei 0 1 A= . −1 2 ⇒ ! det (A − λ 1) = (−λ )(−2 − λ ) + 1 = (1 + λ )2 = 0 ⇒ λ1,2 = −1 Der einzige Eigenvektor dieser Matrix ist 1 x1 = √ 2 1 −1 . Die 2 × 2 Matrix A ist ein Beispiel für eine nicht-hermitische Matrix, bei der das Eigensystem eine niedrigere Dimension hat als die Matrix. Die geometrische Multiplizität, d.h. die Zahl der Eigenvektoren zu einem Eigenwert ist also in diesem Fall geringer als die algebraische Multiplizität. 29 2.6.7 Eigenvektoren und Eigenwerte einer normalen Matrix Wir wollen nun die Eigenschaften verschiedener Matrizen mit den Eigenschaften von Eigenvektoren und -werten in Verbindung bringen. Dazu betrachen wir zunächst normale Matrizen, d.h. Matrizen für die gilt A+ A = AA+ Bemerkung: Unitäre und hermitische Matrizen sind gleichzeitig normale Matrizen (bzw. orthogonale und symmetrische Matrizen im Falle reeller Matrizen). Es sei nun x Eigenvektor zum Eigenwert λ , also gilt (A − λ 1) x = 0. Mit B = A − λ 1 gilt dann Bx = 0 = x+ B+ ., also insgesamt x+ B+ Bx = 0 Explizit ergibt sich B+ B = (A − λ 1)+ (A − λ 1) = A+ − λ ∗ 1 (A − λ 1) = A+ A − λ ∗ A − λ A+ + λ λ ∗ = 0. Wegen AA+ = A+ A ergibt sich, dass B+ B = BB+ . Damit erhalten wir + x+ B+ Bx = x+ BB+ x = B+ x B+ x = |B+ x|2 = 0. sodass B+ x der Nullvektor ist und B+ x = (A+ − λ ∗ 1)x = 0 gilt. Für eine normale Matrix sind also die Eigenwerte von A+ die komplex konjugierten Eigenwerte von A. Es seinen nun xi und x j zwei Eigenvektoren zu zwei unterschiedlichen Eigenwerten λi und λ j . Dann gilt und Ax j = λ j x j . Axi = λi xi + Wenn wir nun die zweite Gleichung von links mit xi multiplizieren, erhalten wir xi + Ax j = λ j xi + x j. Es gilt aber auch xi + A = A+ xi + = λi∗ xi + = λi xi + . Damit erhalten wir insgesamt (λi − λ j ) xi + x j = 0. Da wir λi 6= λ j vorausgesetzt haben, müssen die Eigenvektoren orthogonal sein. Bemerkung: Für eine hermitische Matrix (A+ = A) gilt λ = λ ∗ . Somit sind die Eigenwerte reel. 30 2.6.8 Basiswechsel und Ähnlichkeitstransformationen Vektoren kann man als Komponenten bezüglich einer gegebenen Basis darstellen. Mit der Basis (e1 , . . . , en ) sei der Vektor v durch v1 v = v1 e1 + · · · + vn en , mit dem Spaltenvektor v = ... vn gegeben. Wir wollen nun untersuchen wie sich die Koordinaten ändern, wenn wir auf eine alternative Basis übergehen. Dafür führen wir eine neue Basis (e0 1 , . . . , e0 n ) ein. Die Basisvektoren seien durch n e0 j = ∑ Si j ei i=1 miteinander verknüpft. Damit ergibt sich für den Vektor v: n n n n n n j=1 j=1 i=1 i=1 j=1 ∑ v0j e0j = ∑ v0j ∑ Si j ei = ∑ ∑ v0j Si j v = ∑ vi ei = i=1 Wir identifizieren also: ! ei . n vi = ∑ Si j v0j . j=1 Kompakter lässt sich schreiben: v = S v0 bzw. v0 = S−1 v mit der Transformationsmartrix S, die den Basiswechsel beschreibt. Wir können in ähnlicher Weise die Transformation des linearen Operators A beschreiben. Es gelte y = Ax in der Basis (e1 , . . . , en ). In der Basis (e01 , . . . , e0n ) lautet die Transformaion y0 = A0 x0 . Mit der Relation von oben erhalten wir y = Sy0 = Ax = ASx0 ⇒ Sy0 = ASx0 ⇒ y0 = S−1 ASx0 = A0 x0 . Damit ergibt sich: A0 = S−1 AS. Die obige Gleichung ist ein Beispiel für eine Ähnlichkeitstransformation. Solche Ähnlichkeitstransformationen sind sehr nützlich, da sie Rechnungen stark vereinfachen können. 31 Für Ähnlichkeitstransformationen ergeben sich die folgenden Eigenschaften: (i) Falls A = 1, dann gilt A0 = 1, da: A0 = S−1 1S = S−1 S = 1. (ii) Es gilt: det (A) = det (A0 ), da: det A0 = det S−1 AS = det S−1 · det (A) · det (S) = det (A) · det S−1 S = det (A) . (iii) Das charakteristische Polynom und damit die Eigenwerte von A stimmen mit denen von A0 überein: det A0 − λ 1 = det S−1 AS − λ 1 = det S−1 (A − λ 1)S = det S−1 det (A − λ 1) det (S) = det (A − λ 1) . (iv) Die Spur der Matrix bleibt unverndert: tr A0 = ∑ A0ii = ∑ S−1 i j A jk Ski = ∑ Ski S−1 i j A jk = ∑ δk j A jk = ∑ A j j = tr (A) . i i jk i jk j jk Bemerkung: Von besonderer Bedeutung sind unitäre Transformationen, bei denen S eine unitäre Matrix ist. Unitäre Transformationen führen Orthonormalbasen ineinander über: 0 0 ei+ e j = !+ ∗ + + ∑ δki ek ∗ ∑ δr j er = ∑ δik∗ ∑ δr j e|{z} k er = ∑ δik δk j = S S i j = δi j r r k k k δkr Für unitäre Transformationen gilt ferner: (i) Falls A hermitisch (antihermitisch), dann ist auch A0 hermitisch (antihermitisch). (ii) Falls A unitär ist (d.h. A+ = A−1 ), dann ist auch A unitär. zu(i) 0 (A )+ = (S+ AS)+ = S+ A+ S = ±S+ AS = ±A zu(ii) 0 0 0 + (A )+ A = (S+ AS)+ (S+ AS) = S+ A+ |{z} SS+ AS = S+ A AS = 1 |{z} 1 1 2.6.9 Diagonalisierung von Matrizen A sei die Darstellung eines linearen Operators bzgl. der Basis (e1 , . . . , en ). Nun betrachten wir eine alternative Basis x j = ∑ni=1 Si j ei , wobei x j die Eigenvektoren des linearen Operators A sind, d.h. es gilt: Ax j = λ j x j . In der neuen Basis gilt: A0 = S−1 AS. Das Matrixelement Si j ist dann einfach die i-te Komponente 1 2 n des j-ten Eigenvektors, sodass wir S = x x . . . x erhalten. 32 Daraus folgt: A0i j = S−1 AS ij = ∑ S−1 ik Akl Sl j = ∑ S−1 ik Akl x j l = ∑ S−1 kl kl Die Matrix A0 lautet also: A0 = kl λ1 0 .. . 0 λ2 .. . ··· 0 .. . 0 ··· .. . 0 ··· 0 λn ik λ j xkj = ∑ λ j S−1 S ik k j = λ j δi j k . Damit ist das „Rezept“ zur Diagonalisierung von Matrizen vervollständigt. Da die Matrix S invertierbar sein muss, müssen die n-Eigenvektoren linear unabhängig sein und eine Basis des zugehörigen Vektorraums bilden. Beispiel: Wir wollen nun die Matrix 1 0 3 A = 0 −2 0 3 0 1 diagonalisieren, falls möglich. 1.Schritt: Bestimmung der Eigenwerte 1−λ 0 det(A − λ 1) = det 3 0 −2 − λ 0 3 0 = (1 − λ )2 (−2 − λ ) + 9(2 + λ ) = (4 − λ )(λ + 2)2 1−λ Damit lauten die Eigenwerte: λ1 = 4 & λ2 = λ3 = −2 2.Schritt: Bestimmung der Eigenvektoren Aus Ax = 4x ergibt sich der normierte Eigenvektor 1 1 1 √ 0 x = 2 1 Wir betrachten nun das LGS: Ax = −2x also I x1 + 3x3 = −2x1 ⇒ II −2x2 = −2x2 III 3x1 + x3 = −2x3 = −2x3 x3 = −x1 ⇒ x3 = −x1 s Damit erhalten wir den allgemeinen Eigenvektor x = b . −s Offensichtlich ist x orthogonal zu x1 für beliebige s, b (wie erwartet, da A symmetrisch ist und folglich normal). 33 Für die Diagonalisierung ist es günstig mit einem Satz orthonormaler EV zu arbeiten, so dass wir 1 0 1 1 und x3 = √ 1 x2 = √ 0 2 2 −1 0 festlegen. 3.Schritt: Diagonalisierung von A Die Transformationsmatrix S hat die Spaltenvektoren xi , so dass 1 √0 1 1 S= √ 0 2 0 2 1 0 −1 1 √0 1 1 √0 1 1 0 3 4 0 0 1 ⇒ S+ AS = 0 2 0 0 −2 0 0 2 0 = 0 −2 0 2 3 0 1 0 0 −2 1 0 −1 1 0 −1 34 3 Differentialrechnung im Rn (. . . ) was Essentielles. Hätte ich ein Mathematiklehrbuch, würde ich es lesen. Ein Mathematiklehrbuch ist einfach, unverlogen, lieb und unbestechlich. Und so leicht verständlich: Man muss nur fleißig sein, und schon versteht man alles (. . . ) Max Goldt - Die Radiotrinkerin 3.1 Funktionen mehrerer Variablen Funktionen mehrerer Variablen können Flächen im Raum beschreiben. Wenn beispielsweise die z-Koordinate Funktion der x- und y-Koordinate ist, d.h. z = f (x, y) gilt, und die Funktion eindeutig und reellwertig ist, beschreibt sie eine Fläche im dreidimensionalen Raum. (Beispiel: Die Oberfläche eines Gebirges ohne Überhänge.) Die hier vorgestellten Begriffe und Methoden sind allgemeiner gültig. Zur Veranschaulichung ist es aber nützlich, sich der entsprechenden Begriffe zu bedienen. Die partielle Ableitung ist die Ableitung der Funktion bei der man eine Variable festhält. Man schreibt die partielle Ableitung in der Form ∂f = ∂x f = fx bzw. ∂x Die Technik der partiellen Ableitung sei am Beispiel ∂f = ∂y f = fy ∂y f (x, y) = x3 y − exy erläutert. Dann ergibt sich ∂x f (x, y) = 3x2 y − yexy (d.h. die y-Variable wird wie eine Konstante behandelt), analog ergibt sich ∂y f (x, y) = x3 − xexy Man kann natürlich auch höhere und gemischte Ableitungen berechnen: ∂ ∂f = ∂xx f = 6xy − y2 exy ∂x ∂x ∂xy f = 3x2 − (1 + xy)exy = ∂yx f usw. In dem vorliegenden Beispiel kann man die Reihenfolge der partiellen Ableitungen vertauschen. Dies gilt aber nur dann, wenn die beiden gemischten Ableitungen in dem betreffenden Punkt stetig sind. Die Regeln lassen sich in analoger Weise für Funktionen mit mehreren Variablen verallgemeinern. 35 3.2 Das totale Differential und die totale Ableitung Beim totalen Differential betrachten wir die Änderung des Funktionswertes für simultane Änderungen von x und y. ∆ f = f (x + ∆x, y + ∆y) − f (x, y) = f (x + ∆x, y + ∆y ) − f (x, y + ∆y ) + f (x, y + ∆y ) − f (x, y) f (x + ∆x, y + ∆y) − f (x, y + ∆y ) f (x, y + ∆y) − f (x) ]∆x + [ ]∆y =[ ∆x ∆y ≈∂x f (x, y)∆x + ∂y f (x, y)∆y Für infinitesimale Änderungen wird die Formel exakt, also d f = ∂x f dx + ∂y f dy und für Funktionen mit mehreren Variablen ergibt sich analog df = ∂f ∂f ∂f dx1 + dx2 + ... + dxn ∂ x1 ∂ x2 ∂ xn Beispiel: Das totale Differential der Funktion f (x, y) = y ∗ exp(x + y) lautet: d f = ∂x f dx + ∂y f dy = y ∗ exp(x + y)dx + (y + 1) ∗ exp(x + y)dy Die obige Formel galt nur für unabhängige Variablen. Wir betrachten aber nun den Fall, dass die Variablen voneinander abhängen und nur eine Variable tatsächlich unabhängig ist, also xi = xi (x1 ) mit i = 2, ..., n Man kann dann in diesem Fall die xi durch x1 ersetzen und dann das totale Differential der Funktion f = f (x1 ) berechnen. Alternativ kann man die totale Ableitung aus der Kettenregel df ∂f ∂ f dx2 ∂ f dxn = + + ... + dx1 ∂ x1 ∂ x2 dx1 ∂ xn dx1 bestimmen. Beispiel: Bestimmen Sie die totale Ableitung von f (x, y) = x2 + 3xy ∂f = 2x + 3y ∂x ⇒ mit y = arcsin(x) ∂f = 3x ∂y dy 1 =√ dx 1 − x2 df 1 = 2x + 3y + 3x ∗ p dx (1 − x2 ) Direkte Methode: f (x) = x2 + 3x ∗ arcsin(x) ⇒ df 1 1 = 2x + 3 ∗ arcsin(x) + 3x ∗ √ = 2x + 3y + 3x ∗ √ 2 dx 1−x 1 − x2 36 3.3 Exakte und inexakte Differentiale Bei einigen Problemstellungen ist die Funktion f zu einem gegebenen Differential gesucht. Die Bestimmung von f ist i.A. nicht trivial. Für das Beispiel d f = xdy + ydx kann man die Funktion f (x, y) = x ∗ y + const. sofort angeben. Solche Differentiale nennt man exakt. Schwieriger wird es für xdy + 3ydx = (∂y f (x, y))dy + (∂x f (x, y))dx Integration bezüglich x: f (x, y) = 3xy + g(y) Integration bezüglich y: f (x, y) = xy + h(x) Offensichtlich sind die beiden Resultate inkompatibel und das Differential nicht exakt. Eine notwendige und hinreichende Bedingung für exakte Differential ist die folgende: Es sei d f = A(x, y)dx + B(x, y)dy Offensichtlich gilt: ∂f ∂f =A & =B ∂x ∂y Wenn f(x,y) zweimal stetig differenzierbar in dem Punkt (x,y) ist, muss gelten ∂xy f = ∂yx f bzw. ∂x B = ∂y A Im vorangegangenen Beispiel gilt: ∂x B = 1 und ∂y A = 3 woraus wie erwartet folgt, dass das Differential nicht exakt ist. Für ein totales Differential in n-Variablen ergibt sich entsprechend: n d f = ∑ gi (x1 , ..., xn )dxi i=1 Das Differential ist exakt, falls für alle Paare (i,j) gilt: ∂gj ∂ gi = ∂xj ∂ xi 3.4 Rechenregeln für partielle Ableitungen Für partielle Ableitungen kann man einige nützliche Identitäten herleiten, wenn man z = f (x, y) als zu x & y gleichberechtigte Variable betrachtet. Dann gilt beispielsweise x = x(y, z) und y = y(x, z). dx = ( ∂x ∂x )z dy + ( )y dz ∂y ∂z dy = ( ∂y ∂y )z dx + ( )x dz ∂x ∂z und 37 Damit erhalten wir: dx = ( ∂x ∂y ∂x ∂y ∂x )z ( )z dx + [( )z ( )x + ( )y ]dz ∂y ∂x ∂y ∂z ∂z Für z = const. gilt dann dz = 0 und somit ( ∂x ∂y )z ( )z = 1 ∂y ∂x ( ∂x ∂y )z = ( )−1 ∂y ∂x z sofern die partiellen Ableitungen nicht verschwinden. Für konstantes x (dx = 0) ergibt sich ( ⇒ ( ∂x ∂x ∂y )z ( )x + ( )y = 0 ∂y ∂z ∂z ∂x ∂y ∂z )z ( )x ( )y = −1 (zyklische Relation) ∂y ∂z ∂x Kettenregel: Es sei f = f (x1 , x2 , ..., xn ) wobei xi = xi (u). Dann ergibt sich n df ∂ f dxi =∑ du i=1 ∂ xi du Beispiel: f (x, y) = xe−y mit x(u) = 1 + αu, y = β u3 3 3 ∂ f dx ∂ f dy df = + =e−β u ∗ α + x ∗ e−β u ∗ 3β u2 du ∂ x du ∂ y du 3 =(α + 3β u2 + 3αβ u3 )e−β u 3.5 Variablentransformation Zur Lösung physikalischer Probleme kann es nützlich sein, Variablen einzuführen, die besonders gut an die Symmetrie des physikalischen Problems angepasst sind. Es sei nun xi = xi (u1 , ..., un ) und f = f (x1 , ..., xn ) Für die Ableitung der Funktion nach u j gilt dann nach der Kettenregel: n ∂f ∂ f ∂ xi =∑ j = 1, ..., m ∂ u j i=1 ∂ xi ∂ u j Für unabhängige Variablen {xi } und {u j } gilt dann m = n. Beispiel: Ein wichtiges Beispiel sind ebene Polarkoordinaten x = r ∗ cos(φ ) y = r ∗ sin(φ ) Aufgabe: Stellen Sie die Relation ∂2 f ∂2 f + mit f = f (x, y) ∂ x2 ∂ y2 38 als eine Relation für f (r, φ ) in den Koordinaten (r, φ ) dar. Zunächst gilt: x2 + y2 = r2 (cos2 φ + sin2 φ ) = r2 ⇒ r = p x 2 + y2 und y r ∗ sin φ y = = tan φ ⇒ φ = arctan( ) x r ∗ cos φ x Wir erhalten damit: ∂r x x ∂r =p = = cos φ , = sin φ ∂x r ∂y x 2 + y2 −1 y −y − sin φ ∂φ =p = = 2 ∂x r r 1 + y2 /x2 x , ∂φ cos φ = ∂y r so dass ∂ ∂ sin φ ∂ = cos φ − ∂x ∂r r ∂φ & ∂ ∂ cos φ ∂ = sin φ + ∂y ∂r r ∂φ Mit den Ausdrücken für ∂x f und ∂y f ergibt sich nach einigen Umformungen ∂2 f 1 ∂ f ∂2 f ∂2 f 1 ∂2 f + = + + ∂ x2 ∂ y2 ∂ r2 r ∂ r r2 ∂ φ 2 3.6 Taylor-Entwicklung In höheren Dimensionen lautet die Taylorentwicklung ∞ f (x) = 1 ∑ n! [(∆x ∗ ∇)n f (x)]x=x 0 n=0 mit ∆xi = xi − x0 und ∆x = (∆x1 , ..., ∆xn )T f (x) = f (x1 , ..., xn ) und ∇ = (∂ x1 , ..., ∂ xn ) (Gradient) Spezialfälle: • n = 2: ∞ f (x, y) = 1 ∂ ∂ ∑ n! [(∆x ∂ x + ∆y ∂ y )n f (x, y)]x ,y 0 0 n=0 • Entwicklung von f (x, y) bis zur Ordnung [ (∆x)2 bzw. (∆y)2 und (∆x∆y) ] 1 ∂2 f ∂2 f ∂2 f 1 ∂ ∂ [ 2 (∆x)2 + 2 ∆x∆y + 2 (∆y)2 ] = (∆x + ∆y )2 f (x, y) 2! ∂ x ∂ x∂ y ∂y 2! ∂x ∂y 39 3.7 Stationäre Punkte von Funktionen mit mehreren Variablen Die notwendige Bedingung für das Auftreten eines stationären Punktes ist das Verschwinden der partiellen Ableitungen von f (x1 , ..., xn ) ∂f =0 ∂ xi für alle xi Wenn wir nun die Art des stationären Punktes bestimmen wollen, können wir die Taylorentwicklung betrachten. In führender Ordnung gilt am stationären Punkt(∂xi f = 0) ∆ f = f (x) − f (x0 ) ≈ 1 ∂2 f ∆xi ∆x j ∑ 2 i, j ∂ xi ∂ x j Nun sei die Matrix M definiert durch: Mi, j = ∂2 f ∂ xi ∂ x j so dass 1 ∆ f = ∆xT M∆x mit ∆xT = (∆x1 , ..., ∆xn ) 2 Da die Matrix symmetrisch ist, hat sie reelle Eigenwerte λr und n orthogonale Eigenvektoren er , so dass für normierte Eigenvektoren er gilt: Mer = λ er , eTr es = δrs Die Eigenvektoren bilden eine Basis im Rn , so dass ∆x = ∑ αr er r und damit 1 1 ∆ f = ∆xT M∆x = ∑ λr er 2 2 r Ein Minimum liegt also vor, wenn alle Eigenwerte von M positiv sind, ein Maximum, wenn alle Eigenwerte negativ sind. Falls einige Eigenwerte positiv und einige negativ sind liegt ein Sattelpunkt vor. Bem.: Sollten einige Eigenwerte Null sein und die übrigen alle positiv (bzw. negativ) sein, so kann mit dieser Methode nicht entschieden werden, welche Art des stationären Punktes vorliegt. Wir wollen nun die Bedingungen für eine Funktion f (x, y) explizit formulieren. Die Matrix M lautet in diesem Fall M= fxx fyx fxy fyy Die Eigenwertgleichung lautet dann: 2 ( fxx − λ )( fyy − λ ) − fxy =0 40 ⇒ 2λ1,2 = ( fxx + fyy ) ± q 2 ( fxx − fyy )2 + 4 fxy Damit liegt ein Minimum vor, falls fxx , fyy > 0 und q 2) fxx + fyy > ( fxx + fyy )2 − 4( fxx fyy − fxy bzw. 2 fxx fyy − fxy >0 Analog für Maxima und Sattelpunkte. 3.8 Extrema mit Nebenbedingungen Im vorangegangenen Kapitel haben wir uns mit der Charakterisierung von Extrema unabhängiger Variablen beschäftigt. Häufig gibt es aber weitere Zwangsbedingungen, die einen Zusammenhang zwischen den Variablen herstellen. Beispiele für solche Fragestellungen sind: Finde das Maximum einer Funktion f(x,y) auf einem Kreis mit Radius R, sodass x2 + y2 = R2 . Eine Möglichkeit zur Lösung eines solchen Problems besteht natürlich darin, die Zwangsbedingungen dazu zu nutzen, die abhängigen Variablen zu ersetzen. Einen direkteren Zugang bietet die Methode der Lagrange’schen Multiplikatoren. Dazu betrachten wir die Funktion f(x,y) deren Maximum wir unter der Zwangsbedingung g(x, y) = c bestimmen wollen. Für unabhängige Variablen muss für ein Maximum df = ∂f ∂f dx + dy = 0 ∂x ∂y sein und damit fx = 0 = fy . Durch den Zusammenhang zwischen x und y sind dx & dy nicht unabhängig, sodass aus der Stationarität nicht notwendigerweise fx = 0 = fy folgt. Für die Zwangsbedingung folgt aber dg = ∂g ∂g dx + dy = 0 ∂x ∂y da g(x, y) = c = const. gilt. Damit erhalten wir d( f + λ g) = ( ∂f ∂g ∂f ∂g + λ )dx + ( + λ )dy = 0 ∂x ∂x ∂y ∂y Wir fordern nun, dass in dieser Gleichung dx und dy unabhängig sind, so dass λ die Bedingungen ∂g ∂f ∂g ∂f +λ =0 & +λ =0 ∂x ∂x ∂y ∂y erfüllen muss. Die obigen Gleichungen legen zusammen mit der Zwangsbedingung g(x, y) = c die Variablen x,y,c der stationären Punkte fest. B̆eispiel: Bestimmen Sie das Maximum der Funktion f (x, y) = 1 + xy auf dem Einheitskreis! Es gilt also offenbar g(x, y) = x2 + y2 = 1 ⇒ (i) y + 2λ x = 0 & (ii) x + 2λ y = 0 41 (i) ⇒ x = −2λ y ⇒ y − 4λ 2 y = 0 ⇒ (1 − 4λ 2 )y = 0 ⇒λ =± 1 & x = ∓y 2 1. Fall: y = x ⇒ x = ± √12 y = ± √12 2. Fall: y = −x ⇒ x = ∓ √12 y = ± √12 Die Maximalwerte werden für x = y = ± √12 erreicht, die übrigen stationären Punkte sind Minima. Die Methode der Lagrange’schen Multiplikatoren kann man auf mehrere Variablen verallgemeinern: Wir suchen also Extrema der Funktion f (x1 , ..., xn ) mit den Nebenbedingungen g1 (x1 , ..., xn ) = 0 . . . gm (x1 , ..., xn ) = 0 (m < n) Die Extrema ergeben sich also aus ∂F ∂ xi = 0 (i = 1, ..., n) und den Nebenbedingungen, wobei F(x1 , ...xn , λ1 , ..., λm ) = f (x1 , ..., xn ) + λ1 g1 (x1 , ..., xn ) + ... + λm gm (x1 , ..., xn ) Bem.: Die Wahl c1 = c2 = ... = cm = 0 stellt keine Einschränkung dar, da man die jeweiligen Konstanten einfach auf beiden Seiten abziehen kann. 42 4 Integralrechnung im Rn 4.1 Zweidimensionale Integrale Kurve C, die das Gebiet R begrenzt. Wir betrachten das Integral einer Funktion über dem Gebiet R, das von einer geschlossenen Kurve C begrenzt werde. Wir unterteilen nun das Gebiet in N Teilstücke ∆R p mit Teilfläche ∆A p ; p = 1, 2, ..., N. Es sei (x p , y p ) ein beliebiger Punkt in der Teilfläche ∆R p . Nun betrachten wir die Summe N S= ∑ f (x p , y p )∆A p p=1 im Limes N → ∞. Wenn der Wert eindeutig ist, dann ist der Grenzwert das zweidimensionale Integral Z Z Z I= f (x, y)dA = R f (x, y)dxdy R wobei dA für die infinitisimalen Flächenelemente ∆A p → 0 steht. Eine Möglichkeit das Integral auszuwerten besteht darin, das Integral entlang horizontaler Streifen auszuwerten, also Z y=d Z x=x2 (y) I= f (x, y)dx dy x=x1 (y) y=c Die Werte x1 (y) und x2 (y) hängen vom jeweiligen Gebiet ab. Alternativ kann man das Integral auch entlang vertikaler Streifen parallel zur y-Achse auswerten: Z x=b Z y=y2 (x) I= f (x, y)dy dx x=a y=y1 (x) Die Reihenfolge der Integration beeinflusst offenbar den Wert des Integrals nicht. Bem.: Bei unserer Betrachtung haben wir vorausgesetzt, dass jede Linie parallel zur x- bzw. yAchse die Kurve C (auch: ∂ R =Rand von R) nur zweimal schneidet. Diese Voraussetzung kann in der Regel durch Zerlegung des Integrationsgebiets erfüllt werden. Beispiel: Berechnen Sie das Integral Z Z I= x2 ydxdy R 43 wobei R das Gebiet ist, das durch x = 0, y = 0 und y = 1 − x begrenzt wird. Z x=1 Z 1−y x2 ydy)dx 1 1 3 1 4 1 5 1 1 2 2 x (1 − x) dx = ( x − x + x ) = 2 2 3 2 5 60 0 (i)I = = ( 0 Z y=1 Z x=y−1 (ii)I = ( y=0 = 2 x ydx)dy = Z y=1 3 x y x=1−y [ x=0 Z 1 (1 − y)3 y 0 0 x=0 Z 1 1 3 y=0 dy = 3 ]x=0 dy Z 1 1 − 3y2 + 3y3 − y4 3 0 1 1 2 1 5 1 1 33 4 dy = ( y − y y − y ) = 3 2 4 5 60 0 Wir können also die wie erwartet die Reihenfolge der Integration vertauschen. Bem.: Alternativ kann man die Notation Z y2 (x) Z b I= dy f (x, y) = dx y1 (x) a Z x2 (y) Z d dx f (x, y) dy x1 (y) c benutzen. 4.2 Dreifachintegrale Die Integration lässt sich auch für höherdimensionale Integrale fortsetzen. Wir betrachten dazu das dreidimensionale Gebiet R das wir wieder in N Teilgebiete ∆R p mit Volumen ∆Vp , p = 1, ..., N aufteilen. Es sei ferner (x p , y p , z p ) ein beliebiger Punkt in ∆R p . Wir bilden analog zum zweidimensionalen Integral die Summe N S= ∑ f (x p , y p , z p )∆Vp p=1 Im Limes N → ∞, ∆Vp → 0 ergibt sich dann das Integral Z I= Z Z Z f (x, y, z)dV = f (x, y, z)dxdydz R R falls S einen eindeutigen Wert annimmt. Für praktische Rechnungen benutzen wir wieder die Form Z y2 (x) Z x2 I= dx x1 Z z2 (x,y) dz f (x, y, z) dy y1 (x) z1 (x,y) Bem.: (i) Analog zum zweidimensionalen Integral kann man für konvexe Gebiete die Reihenfolge der Integration vertauschen. (ii) Die Definition kann in einfacher Weise für höhere Dimensionen verallgemeinert werden. 44 4.3 Variablentransformation 4.3.1 Transformationen im R2 Variablentransformationen ermöglichen es häufig die Integration stark zu vereinfachen, weil sich die Integralgrenzen und/oder der Integrand stark vereinfachen. In zwei Dimensionen besteht die Aufgabe darin, dass wir die Koordinaten x,y durch u(x,y) und v(x,y) ausdrücken und die Integralgrenzen sowie die infinitisimalen Flächenelemente dA = dxdy anpassen. Wir setzen voraus, dass u,v differenzierbar sind in jedem Punkt des Gebietes R. Wir müssen also die Fläche des durch die Eckpunkte K,L,M,N begrenzten Gebiets bestimmen. Offensichtlich ist v = const. entlang des Linienelements KL. Dieses Linienelement hat eine x(y)Komponente parallel zu ∂∂ ux du( ∂∂ uy du). Analog gilt für KN, dass das Element nur Komponenten in Richtung (∂ x/∂ v)dv und (∂ y/∂ v)dv hat. Die Fläche eines Parallelogramms ist gegeben durch A = |a| |b| sin Φ = |a × b| Da die beiden Vektoren in der (x,y)-Ebene liegen, hat das Kreuzprodukt nur eine von Null verschiedene Komponente, die z-Komponente. Insgesamt lautet also das Flächenelement ∂x ∂y ∂ y ∂ x ∂ x ∂ y ∂ y ∂ x dudv dA = du dv − du dv = − ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v Mit der Jacobi-Matrix: 45 ∂ (x, y) ∂ x ∂ y ∂ x ∂ y J= ≡ − = ∂ (u, v) ∂ u ∂ v ∂ v ∂ u ∂y ∂u ∂y ∂v ∂x ∂u ∂x ∂v ergibt sich für das Flächenelement ∂ (x, y) dudv dxdy = ∂ (u, v) Insgesamt erhalten wir Z Z ∂ (x, y) dudv g(u, v) ∂ (u, v) R‘ Z Z I= f (x, y)dxdy = R wobei R’ das Gebiet R in den Koordinaten u,v beschreibt. Beispiel: Berechne I = RR R (a + p x2 + y2 )dxdy auf der Kreisfläche x2 + y2 = a2 . Für dieses Problem bieten sich ebene Polarkoordinaten an, mit x = r cos φ y = r sin φ In Polarkoordinaten lautet das Integral ∂ (x, y) drdφ (a + r) ∂ (u, v) R0 Z Z I= Die Jacobi-Determinante kann man leicht berechnen: sin φ = r(cos2 φ + sin2 φ ) = r r cos φ ∂ (x, y) cos φ J= = −r sin φ ∂ (u, v) Damit ergibt sich für das Integral Z 2π Z Z I= R0 (a + r)rdrdφ = Z a dφ 0 0 Beispiel: Berechnung des Integrals I = 5πa3 1 2 1 3 dr(ar + r ) = 2π ar + r = 2 3 3 2 R ∞ −x2 dx ∞ e 2 Die Funktion e−x besitzt keine Stammfunktion. Zur Berechnung des bestimmten Integrals I kann man aber folgenden Trick anwenden: Wir berechnen das Integral I 2 I2 = Z ∞ ∞ 2 e−x dx Z ∞ 2 e−y dy = Z e−(x 2 +y2 ) dxdy R ∞ Dieses Integral vereinfacht sich offenbar in Polarkoordinaten, denn ZZ Z 2π Z ∞ 1 −r2 ∞ 2 −r2 −r2 =π I = e r drdφ = dφ dr re = 2π − e 2 R0 0 0 0 √ ⇒I= π Bem.: Die Konvergenz des Integrals kann man zeigen, wenn man 46 2 a −x bzw. wiederum I 2 (a) berechnet. das endliche Integral: I(a) = −a e Das Integral über die innen liegende Kreisfläche stellt offenbar eine untere Schranke dar, das über die äußere Kreisfläche eine obere. Wir erhalten R 2 2 π(1 − e−a ) < I 2 (a) < π(1 − e−2a ) und damit lim I 2 (a) = π a→∞ 4.3.2 Variablentransformation in Dreifachintegralen Die Variablentranformationen in drei Dimensionen folgen dem gleichen Schema wie Transformationen in der Ebene. Das Volumenelement dVu,v,w hat für Variablen u(x,y,z), v(x,y,z) und w(x,y,z) die Form ∂ (x, y, z) dudvdw dVu,v,w = ∂ (u, v, w) mit der Jacobi-Determinante ∂ (x, y, z) J= = ∂ (u, v, w) ∂x ∂u ∂x ∂v ∂x ∂w ∂y ∂u ∂y ∂v ∂y ∂w ∂z ∂u ∂z ∂v ∂z ∂w wobei wir wieder die Invertierbarkeit der Funktionen u,v,w voraussetzen. Die Transformationsregel für das Integral lautet dann Z I= R ∂ (x, y, z) dudvdw f (x, y, z)dxdydz = g(u, v, w) ∂ (u, v, w) R0 Z Für Kugelkoordinaten: 47 x = r sin θ cos φ y = r sin θ cos φ z = r cos θ ergibt sich: J = r2 sin θ , also dV = r2 sin θ drdθ dφ Für Zylinderkoordinaten ergibt sich: x = r cos φ , y = r sin φ , z = z und damit dV = rdrdφ dz Allgemeine Eigenschaften von Jacobi-Determinanten: Eine Transformation xi nach yi in n Dimensionen hat die Form ∂ (x1 , ..., xn ) dy1 ...dyn dx1 dx2 ...dxn = ∂ (y1 , ..., yn ) wobei die n-dimensionale Determinante analog zum 2- bzw. 3-dimensionalen Fall bestimmt wird. Für Jacobi-Determinanten gelten die folgenden Rechenregeln: ∂ (x1 , ..., xn ) ∂ (x1 , ..., xn ) ∂ (y1 , ..., yn ) = ∂ (z1 , ..., zn ) ∂ (y1 , ..., yn ) ∂ (z1 , ..., zn ) sowie ∂ (x1 , ..., xn ) ∂ (y1 , ..., yn ) −1 = ∂ (y1 , ..., yn ) ∂ (x1 , ..., xn ) 48 5 Vektoranalysis 5.1 Der Gradient Für eine Funktion f : Ω → R (Ω sei ein Gebiet im Rn ) können wir das Differential an der Stelle a ∈ Ω durch d f (a) = ∂x1 f (a)dx1 + ... + ∂xn f (a)dxn ausdrücken. Eine alternative Schreibweise ergibt sich durch Einführung des Gradienten ∂x1 f (a) . ∇ f (a) = . ∂xn f (a) und des Vektors dx1 . dx = . dxn Damit ist das Differential in der Form ˙ = d f (a) ∇ f (a)dx darstellbar, also als Skalarprodukt zwischen dem Gradienten und dem Vektor der Differentiale. 5.2 Raumkurven und Kurvenintegrale Raumkurven α sind Abbildungen eines Intervalls I in den Rn , also α1 (t) . α : I → Rn ,t → α(t) = . αn (t) Eine stetig differenzierbare Raumkurve nennt man regulär, wenn der Tangentenvektor α̇(t) an keiner Stelle t ∈ I verschwindet. Def.: Die Bildmenge α(I) heißt die Spur von I. Beispiele: (i) Die Archimedische Spirale t→ t cost t sint ist eine reguläre Kurve (t>0) 49 (ii) Schraubenlinie (Wendelgang im Guggenheim Museum New York): R cost t → R sint ht (t ∈ R ). Die Schraubenlinie ist regulär für t ∈ R. (iii) Die Zykloide t − sint 1 − cost 1 − cost sint t→ (t ∈ R ), ist nicht regulär, da α̇(t) = =0 für t = 0, ±2π, ±4π, . . . 5.3 Länge und Bogenlänge Definition: Die Länge L(C) eines Kurvenstücks ist definiert als das größte Element der in C einbeschriebenen Sehnenpolygone. Satz: Für eine stetig differenzierbare Parametrisierung der Kurve C: α : [a, b] → Rn gilt Z b L(C) = L(α) := kα̇(t)kdt a Dieser Satz erlaubt die praktische Berechnung von Längen von Raumkurven. Beispiel: Für ebene Kurven α(t) = (t, y(t)) gilt: ˙ = α(t) 1 ẏ(t) q kα̇(t)k = 1 + ẏ(t)2 . → und damit für Länge der Kurve Lab (α) = Z bq 1 + ẏ(t)2 dt. a 50 5.4 Skalare Kurvenintegrale Definition: Das skalare Kurvenintegral bzw. Wegintegral von f über C wird durch Z Z b Z f ds = C f (x) ds := C f (α(t)) kα̇(t)k dt a definiert, wobei ds = kα̇(t)k dt. Beispiele: Berechnen Sie die Masse und den Schwerpunkt eines kreisförmigen Drahtes mit Radius r und homogener Dichte ρ. ρ ist eine „Längendichte“, hat also die Dimension kg m. Die Drahtschleife hat die Parametrisierung q cos(t) α(t) = r → kα̇(t)k = sin2 (t) + cos2 (t) = r. sin(t) Z 2π M= Z ρ r dt = 2πρr = 0 dm C Für den Schwerpunkt gilt: S= 1 M Z I dm → Sx = C 1 M Z 2π 0 r cos(t) rρdt = 0 | {z } =x(t) und Analoges für Sy . 5.5 Vektorielle Kurvenintegrale Definition: Unter einem Vektorfeld auf dem Gebiet Ω ∈ Rn verstehen wir eine stetige Abbildung v1 (x) u : Ω → Rn , x → v(x) : ... . vn (x) Sind die Komponentenfunktionen v1 , . . . , vn zusätzlich σ -fach stetig differenzierbar (also Cσ -Funktionen), so spricht man von einem Cσ -Vektorfeld. Beispiele: • Geschwindigkeitsvektoren von Strömungen • Elektrische und magnetische Felder • Gravitationsfeld Definition: Für ein Vektorfeld v auf Ω ∈ Rn und eine reguläre C1 Kurve α : [a, b] → Rn in Ω definieren wir das vektorielle Kurven- oder Wegintegral durch Z α v · dx := Z b hv(α(t)), α̇(t)idt, a 51 wobei wir mit h·, ·i das Skalarprodukt bezeichnen. Beispiel: Ein Massenpunkt im Koordinatenursprung erzeugt das Gravitationsfeld (bis auf eine Konstante) x x 1 y . U(x) = − = − p 3 kxk3 x2 + y2 + z2 z Wenn man einen weiteren Massenpunkt mit der Masse m = 1 entlang des Weges α : [a, b] → Rn \{0} bewegt, so ist die dabei geleistete Arbeit gegeben durch: − Z U · dx = α Z b xẋ + yẏ + zż a (x2 + y2 + z2 )3/2 dt, wobei x = x(t) usw. gilt. 5.5.1 Verhalten bei Umparametrisierung: Es sei C ein stetig differenzierbares Kurvenstück in Ω und α, β zwei Parametrisierungen. Es gelte ferner α = β ◦ h. Dann gilt (R Z falls ḣ > 0, v dx vdx = β R α − β v dx falls ḣ < 0. Eine Orientierung einer Kurve C kann dadurch festgelegt werden, dass man eine Parametrisierung β als positiv orientiert definiert. Dann ist jede Parametrisierung α = β ◦ h mit h > 0 (h < 0) positv (negativ) orientiert. 5.6 Konservative Vektorfelder und Potential Definition: R Ein Vektorfeld v auf Ω ∈ Rn heißt konservativ oder exakt, wenn das Kurvenintegral γ v dx nur von den Endpunkten abhängt, nicht aber vom Verlauf von γ. Bemerkung: Offensichtlich verschwinden Kurvenintegrale über geschlossene Kurven bei konservativen Kraftfeldern. Satz: Ein Vektorfeld v auf Ω ∈ Rn ist genau dann konservativ, wenn es eine C1 -Funktion U : Ω → R gibt mit v = ∇ U. Wir nennen U eine Stammfunktion oder ein Potential des Vektorfeldes. Es gilt Z v · dx = U(x1 ) −U(x0 ), γ wobei mit x0 der Anfangs- und mit x1 der Endpunkt von γ bezeichnet wird. Satz: Ein C1 -Vektorfeld v auf Ω besitzt ein Potential, wenn es die Integrationsbedingungen ∂ vi ∂ vk = ∂ xk ∂ xi für i 6= k 52 erfüllt und wenn Ω ein einfaches Gebiet ist. Bemerkung: In einem einfachen Gebiet lässt sich jede geschlossene Kurve stetig auf einen Punkt zusammenziehen, ohne dabei Ω zu verlassen. 5.7 Weitere Vektoroperatoren Definition: Divergenz Für C1 -Vektorfelder v = (v1 , . . . , vn ) auf Ω ∈ Rn erklären wir die Divergenz durch div v = ∂ v1 ∂ vn +···+ = ∇ · v. ∂ x1 ∂ xn Beispiel: x 2 y2 v = y2 z2 x 2 z2 → div V = 2(xy2 + yz2 + zx2 ) Definition: Der Laplace-Operator U : Ω → R, wobei U eine C2 -Funktion ist. σU := ∂x2 U + ∂y2 U + ∂z2 U = div(∇ U) = (∇)2 U Beispiel: Es sei Φ = xy2 z3 . Damit ergibt sich ∆Φ = ∂x2 Φ + ∂y2 Φ + ∂z2 Φ = 2xz3 + 6xy2 z Definition: Rotation Die Rotation von C1 -Vektorfeldern v auf Ω ∈ R3 ist definiert durch ∂2 v3 − ∂3 v2 rot v = ∂3 v1 − ∂1 v3 = ∇ × v. ∂1 v2 − ∂2 v1 Einige nützliche Rechenregeln: (i) ∇ × ∇U = 0 (ii) ∇ · ∇ ×V = 0 (iii) ∇ · ( f ·V ) = (∇ f )V + f · ∇ ·V (iv) ∇ × ∇ ×V = 0 (v) ∇(V ×W ) = (∇ ×V )W −V · (∇ ×W ) (vi) ∇ × ( fV ) = ∇ f ×V + f ∇ ×V (vii) ∇ × (V ×W ) = (divV ) ·W + (divW ) ·V + divW − divV 53 5.8 Oberflächenintegrale Charakterisierung von Flächenstücken im R3 Erinnerung: Raumkurven sind Abbildungen eines Intervalls in den Rn : Abbildung 6: Kurven im R3 Analog: Flächenstücke im R3 sind Abbildungen zweidimensionaler Intervalle in den R3 : Abbildung 7: Flächen im R3 Definition: Flächenparametrisierung Als Flächenparametrisierung bezeichnen wir eine injektive Cr -Abbildung (r ≥ 1) auf einem Gebiet U ∈ R2 , die durch Φ : U → R3 gegeben ist. Es gilt also: Φ1 (u) u = (u1 , u2 ) → Φ(u) = Φ2 (u) Φ3 (u) wobei ∂1 Φ(u) und ∂2 Φ(u) an jeder Stelle u ∈ U linear unabhängig sind. ∂1 Φ(u) = ∂ Φ1 (u) ∂ u1 ∂ Φ2 (u) ∂ u1 ∂ Φ3 (u) ∂ u1 ; ∂2 Φ(u) = ∂ Φ1 (u) ∂ u2 ∂ Φ2 (u) ∂ u2 ∂ Φ3 (u) ∂ u2 Die Vektoren ∂1 Φ(u) und ∂2 Φ(u) sind Tangentenvektoren der Koordinatenlinien an der Stelle u (siehe Abb.). Das von ∂1 Φ(u) und ∂2 Φ(u) aufgespannte Flächenelement hat offenbar nur dann eine von Null verschiedene Fläche, wenn die beiden Vektoren linear unabhängig sind. 54 Beispiele für Flächen in R3 : (i) Ebene: (u1 , u2 ) 7→ a + u1 a1 + u2 a2 mit a1 × a2 6= 0 a, a1 , a2 ∈ R (ii) Obere (untere) Halbkugel: u1 u2 (u1 , u2 ) 7→ + p R2 − kuk2 (−) kuk < R (iii) Sphäre ohne Nullmeridian: sin θ cos φ (φ , θ ) 7→ sin θ sin φ cos θ mit 0 < φ Der Nullmeridian muss ausgenommen werden, damit die Injektivität der Abbildung gewährleistet ist. Def.: Flächenstücke: Eine Menge M ⊂ R3 heißt Cr -Flächenstück (mit r ≥ 1), wenn sie das Bild einer Cr -Flächenparametrisierung Φ : R2 ⊃ U → R3 mit stetiger Umkehrabbildung Φ−1 : M → U ist. Jede solche Abb. heißt eine (zulässige) Parametrisierung für M. Bemerkung: Die Stetigkeit der Umkehrabbildung stellt die Orientierbarkeit sicher (Gegenbeispiel: Möbius-Band). Durch die Definition auf offenen Teilmengen stellen wir sicher, dass es keine Probleme mit der Differenzierbarkeit am Rand gibt. Der Flächeninhalt von Flächenstücken Für eine Parametrisierung Φ : R2 ⊃ U → R3 definieren wir gik :=< ∂i Φ, ∂k Φ > sowie für i, k = 2 ; g g g = det(gik ) = 11 12 g21 g22 Wir betrachten nun das Flächenelement Φ(R) mit dem “kleinen” Rechteck R = [u1 , u1 + ∆u1 ] × [u2 , u2 + ∆u2 ] und definieren die Vektoren v1 = ∂1 Φ(u); v2 = ∂2 Φ(u). Das Flächenelement kann durch das Parallelogramm Ψ(R) approximiert werden. Für den Flächeninhalt des Parallelogramms AΨ ergibt sich AΨ = k(∆u1 v1 ) × (∆u2 v2 )k. Wir betrachten nun: kv1 × v2 k2 = kv1 k2 kv2 k2 sin2 φ = kv1 k2 kv2 k2 (1 − cos2 φ ) 2 2 2 = kv1 k kv2 k − < v1 , v2 > = g(u) und damit gilt: 55 AΨ = k(∆u1 v1 ) × (∆u2 v2 )k = p g(u)∆u1 ∆u2 Die Gesamtfläche A(Φ) kann näherungsweise durch die Summe von N Parallelogrammen mit den Aufpunkten u1 , . . . , uN und den Seitenlängen ∆u1 und ∆u2 beschrieben werden: N A(Φ) ' q ∑ g(uk )∆u1 ∆u2 k=1 Für kleine ∆u1 , ∆u2 wird durch die obige Summe das Integral A(Φ) := ximiert. R p k g(u) du1 du2 appro- Beispiel: Sphäre mit Radius r um den Ursprung Sr = {(x, y, z)|x2 + y2 + z2 = r2 } Diese Fläche ist kein Flächenstück, da die Abb. Φ(x, y, z) nicht injektiv ist. Wenn man den Nullmeridian ausnimmt Sr0 = Sr \ N mit N = {(r cos θ , 0, r sin θ )|0 ≤ θ ≤ π} erhält man ein Flächenstück. Sr0 ist am leichtesten durch Kugelkoordinaten parametrisierbar. r sin θ cos φ Φ : U → R ; (φ , θ ) 7→ r sin θ sin φ r cos θ mit U = {(φ , θ )|0 < φ < 2π ; 0 < θ < π} Für die Tangentenvektoren ergibt sich −r sin θ sin φ ∂φ Φ = r sin θ cos φ 0 ; r cos θ cos φ ∂θ Φ = r cos θ sin φ −r sin θ gφ φ =< ∂φ Φ; ∂φ Φ > = r2 sin2 θ sin2 φ + r2 sin2 θ cos2 φ = r2 sin2 θ gφ θ =< ∂φ Φ; ∂θ Φ > = −r2 sin θ sin φ cos θ cos φ + r2 sin θ cos φ cos θ sin φ = 0 =< ∂θ Φ; ∂φ Φ >= gθ φ gθ θ =< ∂θ Φ; ∂θ Φ > = r 2 gφ φ gθ φ r2 sin2 θ 0 = g= gφ θ gθ θ 0 r2 = r4 sin2 θ Abbildung 8: Parallelogramm Ψ(R) 56 Für die Gesamtfläche ergibt sich dann mit A(Φ) := A(Φ) := R p g(u) du1 du2 : k Z 2π Z π Z p g(φ , θ ) dφ dθ = 0 Sr r2 sin θ dφ dθ = 4πr2 0 Oberflächenintegrale Es sei M ⊂ R3 ein Flächenstück und f : M → R eine Funktion. Dann ist das skalare Oberflächenintegral von f über M durch Z Z f dA = M Z f (x) dA(x) := M p f (Φ(u)) g(u) du1 du2 U definiert, falls das Integral konvergiert. 5.9 Das vektorielle Oberflächenintegral Orientierte Flächenstücke Der von den Tangentenvektoren ∂1 Φ(u), ∂2 Φ(u) einer Parametrisierung Φ aufgespannte Teilraum des R3 heißt Tangentialraum von M um Punkt x = Φ(u) ∈ M. Der Tangentialraum wird mit Tx M bezeichnet. Das Einheitsnormalenfeld n : M → R3 wird durch u(x) ⊥ Tx M , ku(x)k = 1 für x ∈ M festgelegt. Satz: Für ein orientiertes Flächenstück M gibt es genau ein Einheitsnormalenfeld n von M mit der Eigenschaft u(x) = ± ∂1 Φ × ∂2 Φ (u) mit x = Φ(u) k∂1 Φ × ∂2 Φk Das Pluszeichen gilt für positive, das Minuszeichen für negative Parametrisierungen. Das vektorielle Oberflächenintegral Es sei M ein orientiertes Flächenstück und v : M → R3 ein auf M stetiges Vektorfeld. Dann ist das vektorielle Oberflächenintegral definiert durch Z M v · dA = Z M v(u) · dA(u) := ± Z U < v ◦ Φ, ∂1 Φ × ∂2 Φ > du1 du2 wobei Φ : R2 ⊃ U → R3 eine Parametrisierung von M ist und das Vorzeichen entsprechend der Parametrisierung gewählt wird. 57 Beispiele für das gerichtete Oberflächenintegral u1 u2 Beispiel: Es sei Φ die Abb. u = (u1 , u2 ) 7→ q a2 − (u21 + u22 ) (obere Hemisphäre) und v = u1 0 . 0 Z v · dA = M Z < v(u), ∂1 Φ × ∂2 Φ > du1 du2 U 1 0 mit ∂1 Φ = 0 , ∂2 Φ = 1 u1 z u2 z ∂1 Φ × ∂2 Φ = < v(u), ∂1 Φ × ∂2 Φ > u21 q du1 du2 U a2 − (u21 + u22 ) = u1 u2 , − , 1) z z 2 u1 /z ZZ 2 2πa3 r cos2 Φ √ r dr dφ = 3 a2 − r 2 0 ( Z = ↑ Polarkoord. U Beispiel: Wir betrachten das Integral über der Menge M mit M = (x, y, z)|x2 + y2 = 2z < 1 Die Fläche wird parametrisiert durch Φ : (u1 , u2 ) 7→ (Rotationsparaboloid) u1 u2 u21 +u22 ; n(0, 0, 0) = (0, 0, −1) 2 Das Vektorfeld ist gegeben durch: x3 v(x, y, z) = x2 y xyz u31 u21 u2 v ◦ Φ(u) = u1 u2 2 2 2 (u1 + u2 ) Der unnormierte Normalenvektor ∂1 Φ × ∂2 Φ ergibt sich aus: 1 0 −u1 ∂1 Φ = 0 ; ∂2 Φ = 1 ∂1 Φ × ∂2 Φ = −u2 u1 u2 1 Z v · dA = − M Z h −u41 − u21 u22 + i u1 u2 2 (u1 + u22 ) du1 du2 2 M Z2πZ1 = 0 0 = (r4 sin4 φ + r4 sin2 φ cos2 φ − r4 sin φ cos φ )r dr dθ | {z } | {z } | {z } 3 = 20 π 1 = 20 π π 5 58 =0 5.10 Der Integralsatz von Gauß Bevor wir uns dem Gaußschen Satz zuwenden, diskutieren wir zunächst die anschauliche Interpretation der Divergenz eines Vektorfeldes. Die Strömung einer Flüssigkeit kann durch das Vektorfeld f (x) = ρ(x)v(x) = ρ(x)v(x)e(x) beschrieben werden, wobei ρ(x) die Dichte und v(x) = v(x)e(x) die Geschwindigkeit des Fluids bezeichnet. Abbildung 9: Fluss durch die Fläche eines Quaders Wir betrachten nun einen um den Punkt x zentrierten Quader mit den Kantenlängen dx, dy, dz. Der Fluss durch die Fläche A ist dann einfach f · n dy dz = fy dy dz. (Eine besonders einfache Situation ergibt sich für v = v · ex mit v = const. und ρ(x) = const. = ρ. Durch die Fläche A wird dann innerhalb eines Zeitintervalls ∆t die Flüssigkeitsmenge ρv · n dy dz · ∆t = ρv∆t dy dz transportiert.) Abbildung 10: transportiertierte Flüssigkeitsmenge innerhalb ∆t Der “Nettoabfluss” ergibt sich aus der Differenz zwischen Abfluss durch die Fläche A und Zufluss durch B. Insgesamt erhält man für den Nettoabfluss dx dx f x + , y, z · ex − f x − , y, z · ex dy dz 2 2 dx dx ∂ f1 (x) = f1 x + , y, z − f1 x − , y, z dy dz = dx dy dz 2 2 ∂ x1 | {z } = dV Analoge Resultate erhält man für die übrigen Seiten des Quaders. 59 Nun beschreibt das gerichtete Oberflächenintegral Z v · n dA ∂Ω über eine geschlossene Fläche ∂Ω den Nettodurchsatz durch das von ∂Ω umschlossene Volumen Ω. Wie wir durch Betrachtung eine infinitesimalen Quaders plausibel gemacht haben, ist der Durchfluss mit der Divergenz verknüpft. ∇ · v dV = ∑ dAi ni · v i=1 wobei dAi den Inhalt der i-ten Seitenfläche und ui die zugehörige Flächennormale bezeichnet. Der Fluss durch das Volumen Ω ist dann einfach die Summe der Flüsse durch die infinitesimalen Volumina. Die inneren Flächen tragen offenbar nicht bei, so dass man insgesamt den Gaußschen Satz erhält: Satz: Ist Ω ⊂ R3 ein Gaußsches Gebiet und v ein C1 -Vektorfeld auf einer Umgebung von Ω (abgeschlossenes Gebiet, “Ω mit Rand”), so gilt Z Z v · dA = div v dV = ∂Ω Ω Z v · n dA ∂Ω wobei u die Flächennormale auf den Randseiten von Ω bezeichnet Bemerkung: Als ein Gaußsches Gebiet bezeichnet man ein beschränktes Gebiet Ω, dessen Oberfläche aus endlich vielen Flächenstücken besteht, die einen Normalenvektor besitzen. “Löcher” müssen geeignet berücksichtigt werden. 5.11 Der Integralsatz von Stokes Im Rahmen der Schulmathematik und der bisherigen Vorlesung haben Sie bereits 2 Integralsätze kennengelernt. Dies ist zunächst der Hauptsatz der Differential- und Integralrechnung Zb f 0 (x) dx = f (b) − f (a) a und dann die Integration von Gradienten entlang von Kurvenstücken γ Z ∇U(x) · dx = U(x1 ) −U(x0 ) γ wobei x0 den Anfangs- und x1 den Endpunkt des Weges darstellt. Hier betrachten wir den Integralsatz von Stokes, der einen Zusammenhang zwischen vektoriellen Oberflächenintegral und einem Wegintegral über den Rand der Fläche herstellt. 60 Integralsatz für Rechtecke Wir betrachten das offene Rechteck R = ]a, b[ × ]c, d[ in R2 , P1 und P2 seien in einer Umgebung von R stetig differenzierbar. Dann gilt Z Z (∂1 P2 − ∂2 P1 ) dx1 dx2 = R P1 dx1 + P2 dx2 ∂R Der Integrationsweg lässt sich folgendermaßen veranschaulichen Abbildung 11: Integrationsweg für das Rechteck R Das Integral über den Rand ∂ R von R ist also die Summe der Wegintegrale über die σ k (mit k = 1, 2, 3, 4). Die Wege haben die einfache Parametrisierung t b σ 1 : [a, b] 7→ R2 ; t 7→ ; σ 2 : [c, d] 7→ R2 ; t 7→ c t 2 σ 3 : [a, b] 7→ R ; t 7→ a+b−t d ; 2 σ 4 : [c, d] 7→ R ; a c+d −t t 7→ Entsprechend gilt: Zd Z ∂1 P2 dx1 dx2 = Zb c R Zd = (HDI) a ∂ P2 (x1 , x2 ) dx1 dx2 ∂ x1 (P2 (b, x2 ) − P2 (a, x2 )) dx2 = c σ1 P2 dx2 + σ2 Z P2 dx2 + σ3 Z Z P2 dx2 ∂R σ1 R R R ∂R Analog erhalten wir: ∂2 P1 dx1 dx2 = − P2 dx2 σ4 Z P2 dx2 = (da P2 dx2 σ4 Z P2 dx2 + = Z P2 dx2 + σ2 Z Z = Z P2 dx2 = 0 ) σ3 P1 dx1 Der Integralsatz von Stokes lässt sich auch für allgemeinere Flächen im R3 formulieren. Dazu führen wir den Begriff des zweidimensionalen Pflasters ein: 61 Definition: Ein zweidimensionales Pflaster in R3 ist ein orientiertes Flächenstück M, für das es eine C2 -Abbildung Φ : U 7→ R3 , (u1 , u2 ) 7→ Φ(u1 , u2 ) auf einer Umgebung U von [0, 1]2 gibt, mit den Eigenschaften (a) Die Einschränkung von Φ auf ]0, 1[2 ist eine positive Flächenparametrisierung von M (b) Die k-te Seitenkurve von Φ (k = 1, 2, 3, 4), eingeschränkt auf ]0, 1[ φk := Φ ◦ σk :]0, 1[7→ R3 ist entweder konstant (entartet) oder injektiv und regulär. (c) Für die Seiten, d.h. die Spuren φk (]0, 1[) gilt: Jede nicht-entartete Seite trifft höchstens eine weitere nicht entartete. Trifft sich die j-te Seite mit der k-ten für j 6= k, φ j (]0, 1[) ∩ φ j (]0, 1[) 6= 0 so gibt es eine C2 -Parametertransformation h :]0, 1[7→]0, 1[ mit φ j = φn ◦ h und h < 0, d.h. die gemeinsame Spur wird entgegengesetzt durchlaufen. Bemerkung: Den Begriff des Pflasters kann man anschaulich leicht verstehen: Ein Pflaster entsteht durch eine differenzierbare Deformation des Einheitsquadrats, wobei die Randstücke verklebt sein können. Für solche Flächen lässt sich der Satz von Stokes wie folgt formulieren: Ist v ein C1 -Vektorfeld auf Ω ⊂ R3 und M ein Pflaster mit |M| ⊂ Ω so gilt Z (∇ × v) · dA = M Z v · dx ∂M Der Beweis basiert darauf, das Vektorfeld v durch eine Parametrisierung auf das Einheitsquadrat abzubilden und anschließend den Stokesschen Satz für Rechtecke anzuwenden. 62