Anton Bovier Mathematik für Physiker III Vorlesungsskript, Uni Bonn, Wintersemester 2011/2 12. Januar 2013 IAM, Uni Bonn v Dieses Skript habe ich für eine Vorlesung Mathematik für Physikerinnen und Physiker im WS 2011/12 in Bonn geschrieben. Der Inhalt hat zwie wesentliche Teile. Im ersten wir eine Darstellung der wesentlichen Resultate der Funtionentheorie gegeben. Dabei wird die Theorie der mehrdimensionalen Integration vorausgesetzt. Kernstück ist natürlich die Theorie der komplexen Integration, mit dem Satz von Cauchy, der Cauchy’schen Integralformel, und schliesslich dem Residuenkalkül, der ja ein für Physiker unverzichtbares Hilfsmittel zur Berechnung von Integralen liefert Recht ausführlich wird auf die Theorie der harmonischen Funktionen und deren Zusammenhang mit analytischen Funktionen eingegangen, wobei auch der enge Zusammenhang der Lösung des Dirichletproblems in d = 2 und der Cauchy’schen Integralformel intensiv betrachtet wird. Besonders die Verwendung konformer Abbildungen zur Konstruktion von Lösungen des Dirichletproblems in komplizierten Gebieten scheint mir auch heute in der theoretischen Physik wieder wichtig genug zu sein, um hier behandelt zu werden. Aus dem gleichen Grund habe ich auch den Riemann’schen Abbildungssatz behandelt. Der zweite Teil der Vorlesung behandelt die Theorie der Sturm-Liouville’schen Randwertprobleme. In der Physike treten diese ständig auf, ganz prominent natürlich in der Quantenmechanik. Gerade in der Quantenmechanik hat man es natürlich oft mit Problemen auf undendliche Gebieten zu tun, die nach Separation der Variablem auf SL-Probleme auf der Halbachse führen. Daher wird auch die etwas schwierige Theorie der singulären Sturm-Liouville Probleme gerade für diesen Fall behandelt. Für den reguläare Fall geben wir einen vollständigen Beweis des Spekralsatzes, und auch für den singulären Fall wird dieser zumindest in den gröberen Zügen erklärt. Die Darstellung ist bewusst kompakt gehalten, und es werden keine umfangreichen Beispiele behandelt. Ich hoffe, dass damit diese Notizen eine Hilfe dabei sind, sich rasch und effizient in der Materie zurechtzufinden. Zur weiterführenden Lektüre gibt es Lerhbücher in Hülle und Fülle. Bonn, Januar 2012, Anton Bovier Inhaltsverzeichnis 1 Komplexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Matrixdarstellung der komplexen Zahlen . . . . . . . . . . . . . . . . 1.1.2 Elementare Eigenschaften der komplexen Zahlen . . . . . . . . . 1.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Komplexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Analytische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Potenzreihen als analytische Funktionen . . . . . . . . . . . . . . . . . 1.4 Analytische Funktionen und konforme Abbildungen . . . . . . . . . . . . . 1.4.1 Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Konforme Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.3 Möbiustransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 2 5 10 10 12 15 15 16 17 2 Komplexe Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Die Cauchy’sche Integralformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Höhere Ableitungen und Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Weitere Eigenschaften analytischer Funktionen . . . . . . . . . . . 2.4 Residuenkalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Weitere Interpretationen des Residuums und das Argumentenprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Harmonische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Das Mittelwertsatz und das Maximumsprinzip . . . . . . . . . . . . 2.5.2 Der Poissonkern und das Dirichletproblem . . . . . . . . . . . . . . . 2.5.3 Harmonische Funktionen und konforme Abbildungen . . . . . . 2.5.4 Beispiel: Joukowski Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Der Riemann’sche Abbildungssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Möbiustransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Weitere Reihenentwicklungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7.1 Folgen analytischer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 2.7.2 Laurentreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 19 24 25 30 33 39 41 43 44 47 48 49 52 54 54 55 vii viii 3 Inhaltsverzeichnis Sturm-Liouville Eigenwertprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Reguläre Sturm-Liouville Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Der Sturm’sche Vergleichsatz . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Vollständigkeit der Eigenfunktionen . . . . . . . . . . . . . . . . . . . . 3.3 Singuläre Sturm-Liouville Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Motivierendes Beispiel: Laplace Gleichung . . . . . . . . . . . . . . 3.3.2 Sturm-Liouville Probleme auf der Halbachse . . . . . . . . . . . . . 3.3.3 Vollständigkeit und verallgemeinerte Fouriertransformation im Limespunktfall . . . . . . . . . . . . . . . . 3.3.4 Diskretes und kontinuierliches Spektrum . . . . . . . . . . . . . . . . 59 59 60 61 62 63 67 72 73 74 79 85 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Kapitel 1 Komplexe Funktionen Der wichtigste Teil der Vorlesung Mathematik für Physiker befasst sich mit der komplexen Anlysis, auch Funktionentheorie gennannt. Bereits im der Mathematik für Physikerinnen 2 sind uns komplexe Zahlen im Zusammenhang mit Lösungen von partiellen Differentialgleichungen begegnet. Die komplexe Analysis spielt in fast allen Bereichen der Physik eine zentrale Rolle. Das reicht von der Elektrodynamik, die Quantenmechanik, bis zu aktuellen Problemen der konformen Feldtheorie. In vielen Fällen ist die komplexe Analysis ein unverzichtbares Hilfsmittel, etwa bei der Berechnung einer Vielzahl von wichtigen Integralen. Die Cauchy’sche Integralformel und der damit zusammenhängende Residuenkalkül wird daher auch das Kernstück dieser Vorlesung sein. Es gibt eine grosse Zahl von Lehrbüchern zu diesem Thema. Die Vorlesung wird sich zum Teil an dem schönen Buch “Complex Analysis” von Lars Ahlfors [1] orientieren. Ein empfehlenswertes Buch auf Deutsch ist das von Remmert [5] und die deutsche Übersetzung des Buchs von Cartan [3]. 1.1 Komplexe Zahlen Die Einführung komplexer Zahlen entspringt dem Bedürfnis, Lösungen allgemeiner algebraischer Gleichungen finden zu können. Bereits die Einführung irrationaler 2 Zahlen wurde dadurch motiviert, dass etwa √ die Gleichung x = 2 keine rationalen Lösungen besitzt. Die irrationale Zahl 2, die eine Lösung dieser Gleichung darstellt, konnte dann allerdings als Grenzwert einer Folge rationaler Zahlen realisiert werden. Die reellen Zahlen wurden dann als Abschluss der rationalen Zahlen definiert: die rationalen Zahlen wurden um alle ”Grenzwerte”von Cauchyfolgen erweitert. Allerdings bleibt damit die einfache Gleichung x2 = 1 weiter unlösbar. Wenn wir nun künstlich die Zahl i einführen, der wir die Eigenschaft i2 = −1 andefinieren, können wir den Körper der rellen Zahlen zu einem neuen Zahlenkörper, C, erweitern, der der kleinste Körper ist, der alle reellen Zahlen und die Zahl i enthält. 1 2 1 Komplexe Funktionen 1.1.1 Matrixdarstellung der komplexen Zahlen Die Einführung der Zahl i mag zunächst sehr merkwürdig und künstlich erscheinen. Es ist vielleicht beruhigend zu sehen, dass wir ein Object, dass diese Eigenschaft besitzt durchaus im Rahmen dessen, was wir schon verstehen, realisieren können. Dazu betrachten wir denRaum der reellen 2 × 2-Matrizen. Wit ordnen jeder reellen a0 Zahl, a ∈ R, die Matrik zu. Unter der Addition und Matrizenmultiplikation 0a bilden diese einen Körper, der isomorph zum Körper der reellen Zahlen ist. Nun 0 −1 fügen wir die Matrix zu diesem Körper hinzu. Offenbar gilt, dass 1 0 0 −1 0 −1 −1 0 · = . (1.1.1) 1 0 1 0 0 −1 0 −1 D.h., die Matrix hat die Eigenschaft, die wir von der Zahl i forden. Man 1 0 kann sich leicht überzeugen (Übung), dass diedie Menge der die man Matrizen a0 0 −1 erhält, wenn zuu den Matrizen der Form die Matrix sowie alles 0a 1 0 was man durch Addition und Matrixmultiplikation daraus erhalten kann, gerade die Menge der Matrizen der Form a −b , (1.1.2) b a mit a, b ∈ R, ist, und dass diese Menge einen Körper bez. Addition und Multiplikation bildet. Dieser Körper ist isomorph zu dem Körper der komplexen Zahlen. Dazu müssen wir nur nachprüfen, dass die Multiplikationsregeln erfüllt sind: Im Körper C haben wir wegen der Assoziativität (a + ib)(c + id) = (ab − cd) + i(bc + ad). (1.1.3) Dementsprend gilt a −b c −d (ac − bd) −(bc + ad) · = (1.1.4) −b a −d c −(bc + ad)( (ac − bd) 10 0 −1 = (ac − bd) + (bc + ad) . 01 1 0 Wir werden diese Matrikdarstellung im Folgenden nicht benutzen. 1.1.2 Elementare Eigenschaften der komplexen Zahlen Wir fassen zusammen: 1.1 Komplexe Zahlen 3 Definition 1.1. Die komplexen Zahlen sind die Menge C ≡ {z = a + ib, a ∈ R, b ∈ R} (1.1.5) auf denen die algebraischen Operationen Addition und Multiplilakation wie folgt definiert sind: (a + ib) + (c + id) = (a + c) + i(b + d), (1.1.6) (a + ib) · (c + id) = (ac − bd) + i(ad + bc). (1.1.7) Eine komplexe Zahl, z = a + ib, heisst reell, wenn b = 0 und imaginär, wenn a = 0 und b 6= 0 ist. Theorem 1.2. Die komplexen Zahlen bilden bezüglich Addition und Multiplikation einen Körper. Dieser Körper ist algebraisch abgeschlossen, d.h. jede Polynomiale Gleichung der Form n ∑ ck zk = 0 (1.1.8) k=0 mit n ≥ 1 und ck ∈ C und wo cn 6= 0 ist besitzt mindestens eine Lösung in C. Beweis. Die erste Aussage ist eine Übungsaufgabe. Die Abgeschlossenheit ist nicht trivial und kann an dieser Stelle noch nicht bewiesen werden. t u Die komplexen Zahlen bilden in natürlicher Weise auch einen Vektroraum der Dimension 2 über den reellen Zahlen. Hierzu indentifizieren wir die komplexe Zahl z = a + ib mit dem Vektor (a, b) ∈ R2 . Geometrisch entspricht damit jede komplexe Zahl einem Punkt im R2 , den wir in diesem Zusammenhang auch als komplexe Ebene bezeichnen. Da auf dem R2 die Euklidische Metrik eine Norm definiert ist, liegt es nahe, einer komplexen Zahl z = a + ib die Norm p (1.1.9) |z| ≡ k(a, b)k ≡ a2 + b2 zuzuordnen. Diese kann auch in anderer Weise ausgedrückt werden. Dazu benötigen wir die im folgenden wichtige Operation der komplexen Konjugation, die üblicherweise als z → z∗ notiert wird. Dabei ist für z = a + ib, z∗ ≡ a − ib. (1.1.10) Geometrisch entspricht diese Operation der Spiegelung des der Zahl z entsprechenden Punktes der komplexen Ebene an der reellen Achse. Die reellen Zahlen sind damit charakterisierbar als diejenigen komplexen Zahlen für die gilt z = z∗ , während für die imaginären Zahlen gilt z = −z∗ . Man sieht nun leicht, dass damit |z|2 = zz∗ (1.1.11) gilt. Wir nennen |z| auch den Betrag der komplexen Zahl z. Betrachten wir nun diejenigen komplexen Zahlen die Betrag 1 haben. Klarerweise gilt für zwei solche Zahlen z, y, dass |zy| = |z||y|, das heisst, auch das Produkt 4 1 Komplexe Funktionen zweier solcher Zahlen liegt auf dem Einheitskreis. Da eine Zahl mit Betrag 1 einem Punkt auf dem Einheitskreis entspricht, können wir sie in der Form z = cos φ + i sin φ (1.1.12) mit φ ∈ [0, 2π) darstellen. Wenn y = cos ψ + i sin ψ ist, so gilt dann zy = (cos φ cos ψ − sin φ sin ψ) + i (cos φ sin ψ + sin φ cos ψ) (1.1.13) = cos(φ + ψ) + i sin(φ + ψ). Das heisst, die Multiplikation zweier komplexer Zahlen mit Betrag 1 entspricht der Addition der Winkel der entsprechenden Punkte auf dem Einheitskreis. Dementsprechend kann man im Allgemeinen das Produkt zweier komplexer Zahlen so interpretieren, dass deren Beträge multipliziert werden und die Winkel addiert werden: wenn z = r cos φ + ir sin φ , und y = r0 cos ψ + ir0 sin ψ, dann gilt zy = rr0 cos(φ + ψ) + irr0 sin(φ + ψ). (1.1.14) Abb. 1.1 Graphische Darstellung der Multiplication von 3 + 2 i and 1 − i Der Körper der komplexen Zahlen bildet einen normierten und damit metrischen und topologischen Raum auf dem Fragen der Konvergenz genauso wie auf den reellen Zahlen diskutiert werden können. insbesonder sagen wir, dass eine Folge von komplexen Zahlen, zn ∈ C, gegen eine komplexe Zahl z ∈ C konvergiert, genau dann, wenn |zn − z| gegen 0 konvergiert. Man kann sehr leicht zeigen, dass folgendes gilt: 1.2 Potenzreihen 5 Theorem 1.3. Der Körper der komplexen Zahlen, C, ist topologisch abgeschlossen, d.h., jede Cauchy-Folge zn ∈ C besitzt einen Grenzwert in C. 1.2 Potenzreihen Analysis handelt von Funktionen, und komplexe Analysis von Funktionen komplexer Variablen. Die einfachsten Funktionen einer komplexen Variablen, z, sind sicher die Polynome: da wir die Multiplikation und Addition definiert haben, können wir Polynome der Form p : C → C, bilden, d.h. Ausdrücke der Form n ∑ ck zk , p(z) = (1.2.1) k=0 mit cn ∈ C. Die nächstliegende Verallgemeinerung sind dann unenedliche n, d.h. Auddrücke der Form ∞ ∑ ck zk . p(z) = (1.2.2) k=0 Hier stellen sich nun schon interessante Fragen. Zunächst kann man für eine beliebige Folge komplexer Zahlen einen solchen Ausdruck formal hinschreiben. Man nennt dies dann auch eine formale Potenzreihe, und man kann bereits mit diesen diverse Rechenoperationen ausführen. Andererseits kann man sich fragen wann und ob ein solcher Ausdruck als konvergente Reihe sinnvoll interpretiert werden kann und dann ggf. eine Funktion auf einer Teilmenge der komplexen Ebene darstellt. Dies wollen wir nun untersuchen. Wenn die formale Potenzreihe p(z) durch (1.2.2) gegeben ist, so sezten wir n pn (z) ≡ ∑ ck zk (1.2.3) k=0 für die Partialreihe der Ordnung n. Definition 1.4. Eine Potenzreihe, p(z), konvergiert am Punkt z zu der komplexen Zahl y ∈ C, genau dann wenn lim |pn (z) − y| = 0. n↑∞ (1.2.4) Definition 1.5. Eine Potenzreihe p(z) heisst absolut konvergent im Punkt z, wenn die Reihe ∞ ∑ |ck ||z|k < ∞. (1.2.5) k=0 Wenn D ⊂ C eine Teilmenge von C ist so heisst p(z) absolut konvergent in D, wenn p(z) für jedes z ∈ D absolut konvergiert. Wir zeigen zunächst, dass die absolute Konvergenz stärker ist als die Konvergenz. 6 1 Komplexe Funktionen Lemma 1.6. Ist eine Potenzreihe p(z) in z absolut konvergent, so existiert eine komplexe Zahl y so dass pn (z) gegen y konvergiert. Beweis. Wir bezeichnen mit p̄(z) und p̄n (z) die Potenzreiche ∞ p̄(z) ≡ ∑ |ck ||z|k , (1.2.6) k=0 bzw. deren Partialreihen. Offensichtlich ist die Folge p̄n (z) monoton wachsend und durch den nach Voraussetzung endlichen Wert p̄(z) beschränkt. Daher existiert eine Zahl b ∈ R+ , so dass p̄n (z) gegen b konvergiert. Offensichtlich ist dann ∞ | p̄n (z) − b| = ∑ k=n+1 |ck ||z|k , (1.2.7) und es folgt dass die rechte Seite dieser Gleichung gegen Null konvergiert. Weiterhin gilt, dass |pn (z)| ≤ p̄n (z) ≤ b, (1.2.8) so dass die Folge pn (z) mindestens einen Häufungspunkt besitzt. Wir nehmen an, es gäbe zwei Häufungspunkte, y und y0 . Seien nun n` und n0` Unterfolgen, so dass pn` (z) → y, und pn0 (z) → y0 , ` wenn ` ↑ ∞. (1.2.9) Sei ohne Beschränkung der Allgemeinheit n0` ≥ n` . Dann folgt, dass pn0` (z) − pn` (z) ≤ ∞ ∑ k=n` +1 |ck ||z|k . (1.2.10) Wir wissen aber, dass die rechte Seite gegen Null strebt, wenn ` ↑ ∞. Nun ist aber |y − y0 | = y − pn` (z) − y0 + pn0 (z) + pn` (z) − pn0 (z) (1.2.11) ` ` ≤ y − pn` (z) + y0 − pn0 (z) + pn0 (z) − pn` (z) . ` ` Nach Vorraussetzung streben alle drei Terme auf der rechten Seite nach Null, was im Widerspruch zu der Annahme y 6= y0 steht. Also hat pn (z) genau einen Häufungspunkt und konvergiert1 . t u Beachte, dass es Reihen gibt, die konvergieren, ohne absolut zu konvergieren. Zum Beispiel gilt n (−1)k+1 lim ∑ = ln 2, n↑∞ k=1 k 1 Dies folgt aus folgendem Grund: Jeden unendliche Punktmenge in einen beschränkten Gebiet hat mindestens einen Häfungspunt. Wenn also die Folge pn (z) nur einen Häufungspunkt hat, und wir lassen alle Folgenglieder weg, die nicht in einer ε-Umgebung dieses Häufungspunktes liegen, so muss diese Menge endlich sein. Damit aber konvergiert die Folge 1.2 Potenzreihen 7 die Reihe ist aber nicht absolut konvergent. Eine der wichtigsten Potenzreihen ist die geometrische Reihe, ∞ g(z) = ∑ zk . (1.2.12) k=0 Hier können wir alles explizit berechnen, da n gn (z) = ∑ zk = k=0 1 − zn+1 1−z (1.2.13) Wir sehen, dass für |z| < 1, ḡn (z) = 1 − |z|n+1 1 → , 1 − |z| 1 − |z| (1.2.14) d.h. g(z) konvergiert absolut im inneren des Einheitskreises |z| < 1, und es gilt gn (z) → g(z) = 1 . 1−z (1.2.15) Für Werte von z mit |z| = 1 konvergiert die Reihe nicht. Die Bedeutung der geometrischen Reihe liegt darin, dass fast die Kontrolle des Konvergenzverhaltens von Potenzreihen fast immer auf einen Vergleich mit der geometrischen Reihe hinausläuft. Ein weiterer wichtiger Begriff ist der der gleichmässigen oder uniformen Konvergenz. Definition 1.7. Eine Potenzreihe, p(z) konvergiert gleichmässig in D ⊂ C, wenn es für jedes ε > 0 ein n0 ∈ N gibt, dass für jedes z ∈ D ein y(z) ∈ C existiert, so dass für alle n > n0 , |pn (z) − y(z)| < ε. (1.2.16) Lemma 1.8. Falls eine Potenzreihe p(z) für einen Wert z0 ∈ C konvergiert, so gilt folgendes: • Für jedes z mit |z| < |z0 | konvergiert p(z) absolut. • Für jede kompakte Teilmenge der Scheibe {z ∈ C : |z| < |z0 } konvergiert p(z) gleichmässig. Beweis. Es ist klar, dass wir durch Umbenennung ck → ck zk0 die Aussage des Satzes auf den Fall z0 = 1 zurückführen können. Dann können wir weiter durch Subtraktion der Konstanten ∑∞ k=0 ck von c0 den allgemeinen Fall auf den zurückführen, wo p(1) = 0 ist. Nun gilt in jedem Fall ck = pk (1) − pk−1 (1), und da pk (1) nach null konvergiert muss notwending ck nach Null konvergieren. Insbesonder ist damit die Folge |ck | beschränkt, e.g. |ck | ≤ M < ∞. Damit folgt aber für |z| < 1, ∞ ∞ k=0 k=0 M ∑ |ck ||z|k ≤ M ∑ |z|k = 1 − |z| < ∞, (1.2.17) 8 1 Komplexe Funktionen d.h. die Reihe ist absolut konvergent wie behauptet. Als nächstes beobachten wir, dass in diesem Fall n−1 pn (z) = (1 − z) ∑ pk (1)zk + pn (1)zn . (1.2.18) k=0 Hier benutzen wir nur, dass ck = pk (1) − pk−1 (1). Nun konvergiert pn (1) nach Null, und damit auch |pn (1)| → 0. Dann konvergiert bereits der letzte Summand in (1.2.18) für |z| ≤ 1 gegen Null. Weiter ist die Nullfolge |pn (1)| notwendig beschränkt, sagen wir durch einen Wert M < ∞. Für die erste Summe haben wir damit n−1 n−1 1 , (1.2.19) (1 − z) ∑ pn (1)zk ≤ |1 − z| ∑ |pk (1)||z|k ≤ |1 − z|M 1 − |z| k=0 k=0 was unter unseren Annahmen endlich ist. Dies beweist aber die gleochmässige Konvergenz in jedem Gebiet D in dem supz∈D |1−z| u 1−|z| < ∞. t Definition 1.9. Sei p(z) eine Potenzreihe. Dann heisst r0 ≡ sup {|z|, so dass p(z) konvergiert} , (1.2.20) der Konvergenzradius der Potenzreihe p(z). Für Potenzreihen gilt also eine interessante Dichotomie: Es gibt eine (möglicherweise verschwindende) Zahl r0 ≥ 0, so dass ausserhalb des Kreises vom Radius r0 die Reihe nicht konvergiert, während sie im inneren dieses Kreises absolut konvergiert. Lediglich auf dem Kreis kann komplexeres Verhalten vorliegen. Dies lässt auch eine alternative Beschreibung des Konvergenzradius zu, der sich für dessen Berechnung anbietet. Lemma 1.10. Der Konvergenzradius eine Potenzreihe p(z) ist gegeben durch ( ) ∞ r0 = sup r ≥ 0 : ∑ |ck |rk < ∞ . (1.2.21) k=0 Beweis. Der Beweis dieser Aussage folgt aud dem oben gesagten sofort. t u Korollar 1.11. Der Konvergenzradius einer Potenzreihe ist gegeben durch r0 = lim inf |cn |−1/n ⇔ 1 = . lim inf |cn |1/n . r0 (1.2.22) Beweis. Sei r < r0 . Dann gibt es ein ε > 0, so dass r + ε < r0 , und ein n0 , so dass für alle n > n0 , |cn |1/n ≤ (r + ε/2)−1 . 1.2 Potenzreihen 9 ∞ ∑ |ck |rk = k=0 = ∞ k 1/k |c | r ∑ k k=0 n0 ∑ k=0 |ck |1/k r ≤ Cε + 2 k (1.2.23) ∞ + ∑ k=n0 +1 r r + ε/2 k r + ε/2 < ∞, ε so dass der Konvergenzradius also mindestens lim sup |cn |−1/n ist. Umgekehrt, wenn r > lim sup |cn |−1/n , so gibt es auch ein ε, so dass r > ε + lim sup |cn |−1/n . Weiterhin gibt es eine unendliche Folge n` , so dass für alle `, |cn` |−1/n` > lim sup |cn |−1/n − ε/2. Dann aber ist ∞ ∞ ∑ |ck |rk ≥ ∑ n` |cn` |1/n` r `=0 ∞ k=0 ≥ ∑ `=0 ∞ ≥ ∑ `=0 r r − ε/2 r r − ε/2 (1.2.24) n` ` = ∞. Damit ist auch die umgekehrte Behauptung und somit das Korollar bewiesen. t u Die Aussage des Korollares heisst auch Cauchy’sches Wurzelkriterium. Einfacher zu handhaben ist das folgende Quotientenkriterium, dass auf Hadamard zurückgeführt wird. Korollar 1.12. Der Konvergenzradius einer Potenzreihe ist gegeben durch r0 = lim n↑∞ |cn | , |cn+1 | (1.2.25) sofern dieser Grenzwert existiert. Beweis. Übung. t u Es gibt gelegentlich Fälle, in denen das Quotientenkriterium versagt. Ein Beispiel ist die Reihe mit ( 2, wenn n gerade, cn = 1, wenn n ungerade Der Kovergenzradius der Reihe ist r0 = 1, aber die Folge der Quotientien |cn /cn+1 | oszilliert zwischen 2 und 1/2 und konvergiert nicht. Klarerweise hat die geometrische Reihe den Konvergenzradius r0 = 1. Eine weitere Reihe von zentraler Bedeutung ist die Exponentialreihe, ∞ exp(z) = zk ∑ k! k=0 (1.2.26) 10 1 Komplexe Funktionen Der Konvergenzradius der Exponentialreihe ist r0 = ∞. Umgekehrt hat die Reihe ∞ ∑ k!zk (1.2.27) k=0 den Konvergenzradius r0 = 0 (Übung!). 1.3 Komplexe Funktionen Unter einer komplexen Funktion verstehen wir in natürlicher Weise eine Abbildung f einer Teilmenge D ⊂ C in die komplexen Zahlen. Dabei ist D der Definitionsbereich von f und f (D) der Wertebereich. Wir sagen, dass eine komplexe Funktion f einen Grenzwert, w ∈ C bei einem Punkt a ∈ C besitzt und schreiben lim f (z) = w, z→a (1.3.1) wenn es für jedes ε > 0 ein δ > 0 gibt, so dass für alle y : |y − a| < δ , | f (y) − w| < ε gilt (Man schreibt hierfür gerne ∀ε>0 ∃δ <0 ∀y| y−a|<δ | f (y) − w| < ε). Wir sagen weiter, dass eine komplexe Funktion bei astetig ist, genau dann wenn a im Inneren des Definitionsbereichs D liegt, und wenn lim f (z) = f (w) z→a (1.3.2) gilt. f heisst stetig in einer Menge M ⊂ D, wenn f in jedem Punkt a ∈ M stetig ist. f heisst gleichmässig stetig in einer Menge M, wenn es für jedes ε > 0 ein δ > 0 gibt, so dass für alle a ∈ M| und für alle y : |y − a| < δ , | f (y) − f (a)| < ε gilt. Wir sehen, dass soweit alles genauso ist, als wäre f eine Funktion von R2 nach 2 R . 1.3.1 Analytische Funktionen Der nächste natürliche Schritt in der Untersuchung von komplexen Funktionen ist die Frage nach der Differenzierbarkeit. Hier wird sich ein wesentlicher neuer Gesichtspunkt ergeben. Wir haben in der reellen Analysis gelernt, dass die Ableitung einer Funktion an einem Punkt x eine lineare Abbildung ist, und zwar diejenige, die die Funktion lokal am besten approximiert. Eine Funktion heisst dann differenzierbar, wenn es eine eindeutig bestimmte beste lineare Approximation gibt. Eine lineare Abbildung in der komplexen Ebene ist nun im allgemeinen eine 2 × 2-Matrix mitreellen Ein x trägen, die den der komplexen Zahl z = x + iy entsprechenden Vektor abbildet y 1.3 Komplexe Funktionen auf 11 a11 a21 x a11 x + a21 y = , a12 a22 y a12 x + a22 y d.h. die komplexe Zahl z = x + iy wird auf die komplexe Zahl (a11 x + a21 y) + i(a12 x + a22 y) abgebildet. Eine spezielle Klasse von linearen Abbildungen, die der Körperstruktur der komplexen Zahlen naheliegt, sind diejenigen linearen Abbildungen, die sich als Multiplikation mit einer komplexen Zahl realisieren lassen, also wenn z → wz für w ∈ C. Man sieht leicht, dass dies genau dann der Fall ist, wenn a11 = a22 , und a21 = −a12 . (1.3.3) in diesem Fall entspricht die Abbildung der Multiplikation mit der komplexen Zahl a11 + ia12 . Der strukturelle Reichtum der komplexen Analysis entspringt nun der Idee, eine komplexe Funktion nur dann für differenzierbar zu erklären, wenn ihre Linearisierung als Multiplikation mit einer komplexen Zahl dargestellt werden kann. Definition 1.13. Eine komplexe Funktion f : D → C heisst differenzierbar in a ∈ D, genaus dann wenn es eine komplexe Zahl w ∈ C gibt, so dass lim z→a f (z) − f (a) = w. z−a (1.3.4) Wir schreiben dann w = f 0 (a) und nennen w die Ableitung von f bei a. Anmerkung 1.14. Wir sehen, dass die Definition formal identisch zur Definition der Ableitung von reellen Funktionen einer reellen Variablen. An sich ist die Bezeichnung ”differenzierbarnicht sehr glücklich, besser wäre von änalytischßu sprechen, doch wird dieser Begriff restriktiver gehandhabt. Lemma 1.15. Eine komplexe Funktion f (z) = g(z) + ih(z), wo g, h reell wertige Funktionen sind, ist genau dann differenzierbar in a, wenn die Funktionen g, h aufgefasst als Funktionen von R2 → R, differenzierbar sind und wenn gilt ∂ g(a) ∂ h(a) = , ∂x ∂y und ∂ g(a) ∂ h(a) =− . ∂y ∂x (1.3.5) In anderen Worten, eine komplexe Funktion ist differenzierbar, wenn sie differenzierbar ist als Funktion R2 → R2 im üblichen Sinne, und wenn ihre Ableitung eine lineare Abbildung ist, die als Multiplikation mit einer komplexen Zahl realisiert werden kann. Anmerkung 1.16. Die Gleichungen (1.3.5) heissen Cauchy-Riemann (Differential) Gleichungen. Beweis. Der Beweis ist nach dem bisher gesagten elementar. t u 12 1 Komplexe Funktionen Definition 1.17. Sei D ⊂ C eine offenen Menge und sei f auf D definiert. f heisst analytisch oder holomorph auf D, wenn f an jedem Punkt z ∈ D differenzierbar ist. 1.3.2 Potenzreihen als analytische Funktionen Es wird sich heraustellen, dass analytische Funktionen unendlich oft differenzierbar sind und dass sie in jedem Punkt in D als konvergente Potenzreihen dargestellt werden können. Um dies zu zu zeigen benötigen wir aber einige tiefe Resultate aus der Theorie der Integration von komplexen Funktionen. Allerdings können wir schon jetzt die Umkehraussage beweisen: n Lemma 1.18. Sei p(z) ≡ ∑∞ k=0 an z eine Potenzreihe mit Konvergenzradius r. Dann stellt f (z) = p(z) ein analytische Funktion auf der Menge D = {z : |z| < r} dar. Es gilt, dass f (n) (0) = n!an . Beweis. Wir müssen nachprüfen, ob der Limes lim h−1 ( f (z + h) − f (z)) h→0 (1.3.6) existiert. Nun ist für jedes z ∈ D auch z + h ∈ D, sofern nur |h| hinreichend klein ist. Also sind für solche z, h sowohl f (z + h) als auch f (z) konvergente Reihen. Für alle hinreichend kleinen h 6= 0 haben wir daher ∞ h−1 ( f (z + h) − f (z)) = h−1 ∑ ak (z + h)k − zk k=0 k k k−` ` k z h −z k=0 `=0 ` ∞ k k k−` ` = h−1 ∑ ak ∑ z h k=1 `=1 ` ∞ k k k−` `−1 = ∑ ak ∑ z h k=1 `=1 ` ∞ k k−1 = ∑ ak z 1 k=1 ∞ k k k−` `−1 + ∑ ak ∑ z h k=2 `=2 ` ∞ = h−1 ∑ ak ∑ Der erste Term ist unabhängig von h und wird die gewünschte Ableitung sein. Wir müssen also nur zeigen, dass der zweite Term verschwindet, wenn h → 0 strebt. Nun ist aber 1.3 Komplexe Funktionen 13 ∞ ∞ k k k k−` `−1 k z h ≤ |h| ∑ ak ∑ |z|k−` |h|`−2 ∑ ak ∑ k=2 `=2 ` k=2 `=2 ` ∞ k−2 k ≤ |h| ∑ |ak | ∑ |z|k−2−` |h|` ` + 2 k=2 `=0 Wir müssen also nur zeigen, dass die Summe in der letzten Zeile für hinreichend kleine h konvergiert. Nun ist aber k − 2 k2 k−2 k(k − 1) k ≤ . = (` + 1)(` + 2) ` 2 ` `+2 Daher ist ∞ k−2 ∑ |ak | ∑ k=2 `=0 ∞ k |z|k−2−` |h|` ≤ ∑ |ak+2 2(|z| + |h|)k `+2 k=0 Nun ist aber der Konvegenzradius dieser Reihe nach der Cauchyformel gleich 1/k 2 1/k (k + 2)2 1/k k/(k−2) (k + 2) = lim sup ak lim sup ak+2 2 2 k k↑∞ 1/k = lim sup ak = r. k Das heisst, die Reihe konvergiert sobals |z| + |h| < r, was aber für hinreichend kleines h stets gilt, da ja |z| < r ist. Damit ist aber die Differenzierbarkeit bewiesen. Wir haben auch eine explizite Formel für die Ableitung, f 0 (z) = ∞ ∑ (k + 1)ak+1 zk . k=0 Dies ist wieder eine Potenzreihe und eine einfache Anwendung des Cauchy-Kriteriums zeigt dass, deren Konvergenzradium wiederum r ist. D.h., auch f 0 (z) ist eine analytische Funktion im selben Gebiet, und es folgt durch Iteration dieses Arguments, dass f in Inneren seines Konvergenzkreises unendlich oft differenzierbar ist. Einfaches Nachrechnen zeigt, dass f (n) (z) = ∞ ∑ (k + 1) . . . (k + n)ak+n zk k=0 gilts, so dass klarerweise f (n) (0) = n!an . t u Wir können nun dieses Resultat benutzen, um weitere Eigenschaften wichtiger durch Potenzreihen definierter Funktionen zu untersuchen. Als erstes betrachten wir die 14 1 Komplexe Funktionen 1.3.2.1 Exponentialfunktion. Wir haben oben die Exponentialreihe exp(z) definiert. Da diese den Konvergenzradius r0 = ∞, ist sie auch überall unendlich oft differenzierbar und es gilt exp0 (z) = ∞ k ∞ 1 ∞ 1 ∑ k! zk−1 = ∑ (k − 1)! zk−1 = ∑ k! zk = exp(z). k=0 k=1 (1.3.7) k=0 Das, heisst, die Exponentialreihe ist die komplexe Erweiterung der durch die Differentialgleichung f 0 (x) = f (x) definierten reellen Exponentialfunktion. In der Tat können wir auch im Komplexen die Exponentialfunktion als Lösung dieser Gleichung definieren, und die Reihendastellung daraus gewinnen. Die Differentialgleichung erlaubt weitere Schlüsse zu ziehen, ohne mühevoll mit Reihen rechnen zu müssen. So gilt inbesondere die fundamentale Identität exp(z) exp(y) = exp(z + y), (1.3.8) für alle z, y ∈ C. Beide Seiten der Gleichung erfüllen nämlich die Differentialgleichung d f (z) = f (z) dz mit der Anfangsbedingung f (0) = exp(y), und so folgt die Identität aus der Eindeutigkeit der Lösung solcher Gleichungen. Insbesondere gilt daher für b ∈ R, dass | exp(ib)|2 = exp(ib) exp(−ib) = exp(0) = 1, dass also exp(ib) für b ∈ R auf dem Einheitskreis liegt, und damit für z = a + ib mit a, b ∈ R, exp(a + ib) = exp(a) exp(ib) (1.3.9) und somit | exp(z)| = exp(ℜ(z)). Weiterhin gilt für reelle φ , ψ ∈ R, ℜ exp(i(φ + ψ)) = ℜ exp(iφ )ℜ exp(iψ) − ℑ exp(iφ )ℑ exp(iψ)) ℑ exp(i(φ + ψ)) = ℜ exp(iφ )ℑ exp(iψ) − ℑ exp(iφ )ℜ exp(iψ)), Die sind aber gerade die Additionstheoreme für cos φ = ℜ exp(iφ )) und sin(φ ) = ℑ exp(iφ ). Die Identiäte exp(iφ ) = cos φ + i sin φ kann auch direkt über die bekannten Reihendarstellungen erhalten werden. Eine wichtige Beobachtung ist, dass die Exponentialfunktion periodisch in der imaginären Richtung ist, nämlich exp(z + 2πi) = exp(z), für alle z ∈ C. Dies hat wichtige Konsequenzen für ihre Umkehrfunktion, dem Logarithmus. 1.4 Analytische Funktionen und konforme Abbildungen 15 1.3.2.2 Der Logarithmus Die komplexe Exponentialfuntion bildet die komplexe Ebene auf C ohne die Null ab. Wir wollen die Umkehrfunktion ln w definieren. Sie soll die Eigenschaft haben, dass z = ln w, wenn exp(z) = w. Ausser für den Fall w = 0, können wir (1.3.9) benutzen um diese Gleichung in die zwei Gleichungen exp(a) = |w|, exp(ib) = w/|w|, zu zerlegen, wobei z = a + ib angenommen ist. Die erste Gleicung für den Realteil des Logarithmus hat für alle |w| = 6 0 eine eindeutige Lösung. Die zweite Gleichung hat eine eindeutige Lösung im Streigen 0 ≤ b < 2π, aber mit b sind auch alle Zahlen b = 2nπ mit n ∈ Z Lösungen. Wir bezeichnen den Imaginärteil des Logarithmus mit arg(w) und schreiben ln w = ln |w| + i arg w. Es gibt also unendlich viele Möglichkeiten, den Logarithmus zu definieren. Interessant wird dies erst, wenn man eine Wahl für die Definition längs einer Kurve treffen will (dies wird uns in der Integrationstheorie interessieren). Betrachte z.B. den Einheitskreis, z = exp(iφ ). Eine kanonische Wahl für den Logarithmus scheint dann ln z = φ . Allerdings ist diese längs des Kreises nicht stetig: am Punkt 1 springt ln z von 2π auf 0 zurück. Alternativ könnte man eine stetige Funktion längs der Kurve wählen, bei der nach der Umkreisung der Null nun eine andere Wahl des Logarithmus eingesetzt wird. Die werden wir darauf im Kontext Riemann’scher Flächen zurückkommen. 1.4 Analytische Funktionen und konforme Abbildungen Wir wollen in diesem Abschnitt die geometrischen Eigenschaften analytischer Funktionen als Abbildungen der komplexen Ebene auf sich selbst betrachten. Dabei wird der Begriff der komformen Abbildungen eine zentrale Rolle spielen. 1.4.1 Kurven Wir betrachten Kurven in der komplexen Ebene als parametrischen Abbilildungen γ : I → C, wo I ⊂ R ein Intervall ist und γ eine stetige Funktion. Wie in der Integrationstheorie, verstehen wir unter der eigentlichen Kurve die Equivalenzklasse solcher Abbildungen unter stetigen und monotonen Reparametrisierungen (siehe Kapitel 2 im Skript [2]). 16 1 Komplexe Funktionen Eine Kurve heisst einfach oder eine Jordan Kurve, wenn γ(t1 ) = γ(t2 ) impliziert, dass t1 = t2 . 1.4.2 Konforme Abbildungen Sei γ eine Kurve mit Parametrisierung γ(t), a ≤ t ≤ b, die in einem Gebiet Ω enthalten ist. Sei f : Ω → C eine stetige Funktion. Dann ist γ 0 (t) ≡ f (γ(t)) die Paramatrisierung einer neuen Kurve g, dem Bild von γ. Wenn f sogar analytisch ist, und γ differenzierbar, dann ist dies auch g und g0 (t) = f 0 (γ(t))γ 0 (t). (1.4.1) Solange weder γ 0 (t) noch f 0 (γ(t)) verschwindet, folgt dass g bei g(t) einen Tangentialvektor besitzt. Die Richtung dieses Tangentialvektors ist bestimmt durch arg g0 (t) = arg f 0 (γ(t)) + arg γ 0 (t). (1.4.2) Das heisst, dass der Winkel zwischen den Tangenten der ursprünglichen Kurve und der Bildkurve am jeweiligen Bild nur von der Abbildung f abhängt, nicht aber von der Betrachteten Kurven: Haben zwei Kurven an einem Punkt die gleiche Tangente, so gilt dies auch für ihre Bilder. Diese Eigenschaft wird als winkelerhaltend oder konform bezeichnet. Eine weitere Eigenschaft analytischer Funktionen betrifft die Streckung von Liniensegmenten. Wegen der Definition der Differenuzierbarkeit gilt ja, dass lim h↓0 | f (γ(t + h)) − f (γ(t))| = | f 0 (γ(t)|. |γ(t + h) − γ(t)| (1.4.3) Die rechte Seite ist wieder unabhängig von γ sondern hängt nur von dem Punkt z0 = γ(t) ab, d.h. jede Kurve durch den Punkt z0 wird lokal um den gleichen Faktor | f 0 (z0 )| gestreckt. Beide Aussagen besagen letztlich nichts anderes, als was wir schon wissen: die Ableitung einer analytischen Funktion ist eine Dreh-Steckung, und eine analytische Funktion ist lokal gut durch ihre Ableitung approximiert. Natürlich können wir dasselbe Ergebnis auch über die Cauchy-Riemann Gleichungen verifizieren. Dazu nehmen wir an, dass die partiellen Ableitungen von f stetig seien. Es sei γ(t) = x(t) + iy(t). Dann ist g0 (t) = ∂ f (γ(t)) 0 ∂ f (γ(t)) 0 x (t) + y (t). ∂x ∂y Dies können wir umschreiben in der Form (1.4.4) 1.4 Analytische Funktionen und konforme Abbildungen 17 ∂ f (γ(t)) ∂ f (γ(t)) 0 1 ∂ f (γ(t)) ∂ f (γ(t)) 0 ∗ −i γ (t) + +i γ (t) . ∂x ∂y 2 ∂x ∂y (1.4.5) Um die Winkeltreue zu garantieren, muss dass Argument von g0 (t) und γ 0 (t) sich um einen von der Richtung von γ 0 (t) unabhängigen Betrag unterscheiden, also arg(g0 (t)/γ 0 (t)) unabhängig von arg(γ 0 (t) sein. Nun ist aber ∂ f (γ(t)) 1 ∂ f (γ(t)) ∂ f (γ(t)) γ 0 (t)∗ g0 (t) 1 ∂ f (γ(t)) = − i + + i . γ 0 (t) 2 ∂x ∂y 2 ∂x ∂y γ 0 (t) g0 (t) = 1 2 Damit dies für alle möglichen Richtungen von γ 0 (t) gleich ist, muss ∂ f (γ(t)) ∂ f (γ(t)) +i =0 ∂x ∂y gelten, was (in Komplex- und Realteil ausgeschrieben) die Cauchy-Riemann Gleichungen sind. Wir fassen zusammen: Theorem 1.19. Eine Abbildung f : Ω → C ist genau dann Konform, wenn sie analytisch ist und ihre Ableitung in Ω nirgends verschwindet. 1.4.3 Möbiustransformationen Eine wichtige Klasse von Funktionen sind die rationalen Funktionen vom Grade 1, d.h. Funktionen der Form az + b . (1.4.6) f (z) = cz + d Diese werden auch gebrochene linearae Abbildungen oder Möbiustransformationen gennant. Man prüft leicht nach, dass diese Abbildung invertierbar ist, sofern ad − bc 6= 0; das inverse ist gegeben durch f −1 (w) = dw − b . −cw + a (1.4.7) Eine Möbiustranformation ist ausser im Punkt w = −d/c differenzierbar, wie man leicht nachrechnet. Damit ist sie in jedem Gebiet, dass diesen Punkt nicht enthält analytisch. Es besteht ein enger Zusammenhang zwischen den Möbiustranformationen und der Gruppe derlinearen Abbildungen on C2 → C2 . Betrachten wir nämliche Ele z mente von C2 , 1 , und die Abbildung von C2 nach C,gegeben durch z2 z1 → z2 /z1 , z2 18 1 Komplexe Funktionen so gilt folgendes: Wenn z = z1 /z2 und w = w1 /w2 , f die Möbiustransformation (1.4.6), dann ist f (z) = w wenn w1 ab z1 . = w2 cd z2 Beachte, dass die Invertierbarleit der Möbiustransformation gerade die bekannte Form ab det 6= 0 cd annimmt. Möbiustransformationen werden auch als Abbildungen der erweiterten komplexen Ebene, C ∪ {∞}, bei der der Punkt ∞ zu den komplexen Zahlen formal hinzugenommen wird. Wir haben dann f (∞) = b/d, und f (−d/c) = ∞. Eine konkrete Realisierung der erweiterten komplexen Ebene gewinnt man z.B. durch die sog. Riemmann’sche Kugel. Hier betrachten wir die Einheitskugel im R3 . Jeder Punkt, (x1 , x2 , x3 ) der Kugel wir auf die erweiterte komplexe Ebene abgebildet durch z= x1 + ix2 , 1 − x3 wobei der Nordpol, (0, 0, 1), auf den Punkt ∞ fällt. Die Abbildung ist eins-zu-eins mit der Umkehrabbildung gegeben durch x3 = |z|2 − 1 , |z|2 + 1 x2 = i(z∗ − z) , |z|2 + 1 x1 = z + z∗ , |z|2 + 1 Kapitel 2 Komplexe Integration Die Theorie die komplexen Integration ist der in der Praxis wichtigste Teil der Funktionentheorie. Sie liefert erstaunlich hilfreiche Methoden zu Berechnung bestimmter Integrale. 2.1 Kurvenintegrale In der Theorie der komplexen Integration interessieren wir uns für Integrale komplexer Funktionen längs Kurven in der komplexen Ebene. Wie schon bei der Definition der Ableitung, wird wieder so vorgegangen, als könnten wir Formeln einfach aus der reellen Integration übertragen. Definition 2.1. Sei γ : [a, b] → C und f eine komplexe Funktion. Dann definieren wir Z Z b f (z)dz ≡ f (γ(t))γ 0 (t)dt. (2.1.1) γ a Anmerkung 2.2. Wenn γ nur stückweise differenzierbar ist, so verstehen wir unter der rechten Seite die Summe über die entsprechenden differenzierbaren Stücke. Anmerkung 2.3. Das komplexe Integral “passt” zu dem reellen Integral in dem Sinne, dass für Kurven, die in in der reellen Achse liegen, der Real- und Imaginärteil des Integrals einfach die Integrale von Real- und Imaginärteil der Funktion f im üblichen Sinn sind. Beachte, dass das Integral einer komplexen Funktion eine komplexe Zahl ist. Wir können Real- und Imaginärteil als Kurvenintegral der Differentialformen im üblichen Sinn auffassen, ω ≡ u(z)dx − v(z)dy, b ≡ v(z)dx + u(z)dy ω und (2.1.2) (2.1.3) 19 20 2 Komplexe Integration auffassen, wenn f = u + iv ist. Das heisst, wir haben Z Z Z f (z)dz = ω +i γ γ γ b ω. Interessanterweise gilt, dass ∂u ∂v dx ∧ dy − − ∂y ∂x ∂v ∂u b= − + dω dx ∧ dy. ∂y ∂x dω = (2.1.4) (2.1.5) Insbesondere folgt aus den Cauchy-Riemmann Gleichungen, dass für analytische Funktionen f , beide Differentialformen geschlossen sind. Dies ist in der Tat die Grundlage für alle Besonderheiten der komplexen Integration. Aus der Definition des komplexen Integrals ergibt sich insbesondere die Invarianz unter Reparametrisierung der Kurve, die wir ja für gewöhnliche Kurvenintegrale gezeigt hatten [2]: Theorem 2.4. Sei γ : [a, b] → C eine differenzierbare Parametrisierung einer Kurve, und sei τ : [α, β ] → [a, b] streng monoton wachsend und differenzierbar. Dann parametrisiert g(s) ≡ γ(τ(s)) dieselbe Kurve und es gilt für jede stetige Funktion f , gilt Z b a f (γ(t))γ 0 (t)dt = Z β f (g(s))g0 (s)ds. (2.1.6) α Beweis. Übung. t u Wir wollen nun den zentralen Satz von Cauchy beweisen. Theorem 2.5. Sei f analytisch in einem offenen Kreis D ⊂ C. Sein γ eine geschlossene Kurve in D. Dann gilt Z f (z)dz = 0. (2.1.7) γ Beweis. Wir müssen nur zeigen, dass die geschlossenen Differentialformen ω und b auch exakt sind. Sei obdA z = x + iy mit x, y > 0. Ohne Beschränkung der Allω gemeinheit sei D um die Null zentriert. Wir suchen eine komplexe Funktion deren b erzeugt. Eine naheReal- und Imaginärteil gerade die Differentialformen ω und ω liegender Versuch ist es, die Funktion f längs einer einfachen Kurve zu integrieren. Wir wählen dazu das Rechteck mit den Ecken (0, x, x + iy, iy), und die zwei Kurven R1 , R2 von 0 nach x + iy, die längs er Kanten des Rechtecks verlaufen. Wir machen nun die Annahme, dass Z Z f (w)dw = R1 R2 f (w)dw ≡ F(z) (2.1.8) gilt. Wir werden diese Annahme später beweisen. Seien U(z) and V (z) Real- bzw. Imaginärteil von F. Dann erhalten wir folgende explizite Darstellungen durch reelle 2.1 Kurvenintegrale 21 Integrale: Z x U(z) = 0 u(r)dr − Z x V (z) = Z y v(x + is)ds (2.1.9) u(x + is)ds (2.1.10) Z 0y v(r)dr + 0 0 bzw. U(z) = − Z y Z y v(ir)dr + Z x0 V (z) = u(x + is)ds (2.1.11) Z y 0 u(r)dr + 0 u(x + is)ds (2.1.12) 0 Die Tatsache, dass wir beide Darstellungen haben, erlaubt uns alle partiellen Ableitungen einfach zu berechnen. Wir erhalten ∂U(z) ∂x ∂U(z) ∂y ∂V (z) ∂x ∂V (z) ∂y = u(z), (2.1.13) = −v(z), (2.1.14) = v(z), (2.1.15) = u(z), (2.1.16) bzw. dU = ω b dV = ω. (2.1.17) (2.1.18) Damit aber sind unsere beiden Differentialformen exakt, und die Aussage des Satzes folgt unmittelbar. Bleibt zu zeigen, dass (2.1.8) gilt. Dazu sein ∂ R der Rand unseres Rechteckes. Wir können dieses Rechteck nun in 4n gleich grosse Rechtecke zerlegen deren Kantenlänge jeweils 2−n x, bzw. 2−n y ist. Wir numerieren diese Rechtecke mit Rn1 , . . . Rn4n durch. Wir wollen zeigen, dass Z f (w)dw = 0. ∂R Es ist elementar einzusehen, dass 4n Z f (w)dw = ∂R ∑ Z n k=1 ∂ Rk f (w)dw. Insbesondere muss gelten, dass für mindestens eines dieser Rechtecke, 22 2 Komplexe Integration Z Z −n ∂ Rn f (w)dw ≥ 4 ∂ R f (w)dw . (2.1.19) k In der Tat kann man sogar eine Folge von Rechtecken, Rnn so finden, dass R ⊃ R21 ⊂ R22 ⊃ · · · ⊃ Rnn , indem man das Argument aus (2.1.19) in jedem Schritt anwendet. Es gilt dann, dass die Folge der Rechtecke Rnn gegen einen Punkt w0 konvergiert. Da f analytisch ist, gibt es für jedes ε > 0 ein δ , so dass | f (w) − f (w0 ) − (w − w0 ) f 0 (w0 )| ≤ ε|w − w0 |. (2.1.20) Nun sei n so gross, dass das Rechteck Rnn im Kreis mit Radius δ um z0 liegt. Dann ist Z ∂ Rnn Z f (w)dw = ∂ Rnn Z + ∂ Rnn f (w0 ) − (w − w0 ) f 0 (w0 ) dw (2.1.21) f (w) − f (w0 ) − (w − w0 ) f 0 (w0 ) dz. Das erste Integral verschwindet, z.b. durch explizites Nachrechnen. Für das zweite Integral benutzen wir (2.1.20) und die elementare ABschätzung Z 0 ≤ |∂ Rnn | max f (w0 ) − (w − w0 ) f 0 (w0 ) f (w ) − (w − w ) f (w ) dw 0 0 0 ∂ Rn w∈∂ Rn n n ≤ 2−n ε(x + y)2 2−n ≤ ε4−nC. (2.1.22) Damit aber haben wir, dass unser ursprüngliches Integral im Betrag kleiner als jedes ε > 0 ist, also verschwinden muss. Dies beschliesst den Beweis des Satzes. t u Anmerkung 2.6. Der letzte Teil des Beweises kann auch so zusammengefasst werden: Jede geschlossene Differentialform in einem Kreis ist exakt. Diese Aussage lässt sich, ebenso wie der Satz von Cauchy selbst, noch dahingehend verallgemeinern, dass statt des Kreise auch viel allgemeinere Gebiete genommen werden können. Das Argument des Beweises lässt sich so zusammenfassen: die Differentialformen die einer affinen Funktion f entsprechen sind trivialerweise exakt, mit F(z) = az2 + bz. Andererseits ist die lokale Approximation durch lineare Funktionen so gut, dass die Fehlerterme schneller verschwinden, als die einzelnen Beiträge wachsen. Als eine erste Anwendung des Satzes von Cauchy wollen wir die Berechnung der Fouriertransformierten der Gaussverteilung anschauen. Sei u ∈ R. Wir suchen 1 φ (u) = √ 2π Quadratische Ergäntzung liefert Z ∞ −∞ e−x 2 /2+iux dx. 2.1 Kurvenintegrale 23 2 /2 φ (u) = e−u 1 √ 2π Z ∞ 2 /2 −∞ e−(x−iu) dx. Das Integral in diesem Ausdruck können wir als komplexes Integral der Funktion exp(−z2 /2) längs der Kurve γ(t) = t − iu, t ∈ R, auffassen. Genau er gesagt, sollten wir es als Grenzwert des Integrals längs der Kurven γn (t) = t − iu,t ∈ [−n, n] auffassen. Nun sie Rn das Rechteck mit den Eckpunkten (−n − iu, n − iu, n, −n). Da die Funktion exp(−z2 /2) analytisch ist, gilt Z exp(z)dz = 0. ∂ Rn Andererseits ist Z n Z 0= = ∂ Rn Z 0 + −u −n exp(−(x − iu)2 /2)dx + exp(−(n + iy)2 /2)dy + Z −u Z −n exp(−x2 /2)dx n exp(−(−n + iy)2 /2)dy. 0 Für die beiden letzten Integrale gilt Z 0 2 ≤ u exp(−(n2 − u2 )/2, exp(−(n + iy) /2)dy −u und Z −u 2 2 2 0 exp(−(−n + iy) /2)dy ≤ u exp(−(n − u )/2, so dass beide Terme nach Null streben, wenn n ↑ ∞. Damit folgt Z n lim n↑∞ −n 2 exp(−(x − iu) /2) = Z −∞ exp(−x2 /2) = √ 2π, ∞ und somit φ (u) = exp(−u2 /2). Eine wichtige Verallgemeinerung des Satzes von Cauchy ist folgende Aussage. Theorem 2.7. Sei D eine offen Kreisscheibe, und sei ξ1 , . . . , ξk eine endliche Menge von Punkten in D. Sei D0 = D\{ξ1 , . . . , ξk }. Sei f analytisch auf D0 ist, und es gelte für alle Punte ξ j , lim (z − ξ j ) f (z) = 0. (2.1.23) z→ξ j Dann gilt die Aussage des Satzes von Chauchy für jede geschlossene Kurve in D0 . b weiterhin exakt Beweis. Wir müssen nur zeigen, dass die Differentialformen ω, ω sind. Wir betrachten der Einfachheit halber den Fall k = 1. Sei R0 ein Quadrat, das 24 2 Komplexe Integration den Punkt ξ1 enthält. Dann ist leicht zu sehen, dass Z Z f (w)dw = R f (w)dw. R0 Wegen der Eigenschaft (2.1.23) folgt aber, dass für jedes ε > 0 R0 so klein gewählt werden kann, dass auf seinem Rand | f (w)| ≤ ε |ξ1 − w| gilt. Nun ist aber Z 1 dw ∂ R |ξ1 − w| ≤ 8, 0 (2.1.24) so dass das Integral über ∂ R0 durch 8ε beschränkt ist. Dies liefert die gewünschte Aussage. Für den Fall, dass einer der Ausnahmepunkte auf dem Rand des Rechteckes zu liegen käme, muss man die Konstruktion etwas komplizierten, das Ergebnis bleibt aber bestehen. t u 2.2 Die Cauchy’sche Integralformel Der Satz von Cauchy hat eine bemerkenswerte Konsequenz, die Cauchy’sche Integralformel. Um diese herzuleiten, benötigen wir noch das folgende Resultat. Lemma 2.8. Sei γ eine stückweise differenzierbare geschlossene Kurve in der komplexen Ebene, die den Punkt a ∈ C nicht enthält. Dann gibt es ein κ ∈ Z, so dass Z γ dz = κ2πi. z−a (2.2.1) Beweis. Sei γ : [0, T ] → C eine Parametrisierung der Kurve γ. Wir nehmen der Einfachheit halber an, dass γ(t) überall differenzierbar ist – andernfalls muss man stückeln. Wir definieren Z t γ 0 (s) h(t) ≡ ds. (2.2.2) 0 γ(s) − a Dann ist h0 (t) = γ 0 (s) γ((t)−a . e−h(t) (γ(t) − a) tion Also gilt Einfaches Nachrechnen zeigt, dass die Ableitung der Funk- verschwindet, die Funktion also konstant gleich γ(0) − a ist. eh(t) = γ(t) − a . γ(0) − a (2.2.3) Da die Kurve geschlossen ist, ist auch γ(T ) = γ(0), also eh(T ) = 1. (2.2.4) 2.3 Höhere Ableitungen und Taylorreihen 25 Daher muss h(T ) ein vielfaches von 2π sein. h(T ) ist aber das gesuchte Integral und das Lemma ist bewiesen. t u 1 dz Die ganze Zahl n(γ, a) = 2πi γ z−a heisst Windungszahl (oder Index) der Kurve γ bezüglich des Punktes a. Indem wir a = 0 setzen, so sehen wir, dass für eine Kurve, die sich gerade einmal um den Nullpunkt windet, n(γ, 0) = 1 gilt. R Theorem 2.9. Sei f analytisch in einer offenen Kreisscheibe D und sei γ eine geschlossene Kurve in D. Dann gilt für jeden Punkt a ∈ D\γ, 1 2πi f (z)dz = f (a)n(γ, a). z−a Z γ (2.2.5) Insbesondere ist für Kurven mit Windungszahl 1 1 2πi Z γ f (z)dz = f (a). z−a (2.2.6) Beweis. Der Beweis ist recht einfach. Wir schreiben Z γ f (z)dz = z−a Z γ f (a)dz + z−a Z γ f (z) − f (a) dz. z−a Der erste Term gibt wie behauptet n(γ, a) f (a). Der zweite Term verschwindet, da der Integrand die Vorraussetzungen des Theorems 2.7 erfüllt. Die Funktion F(z) ≡ f (z)− f (a) ist nämlich ausser im Punkte z = a in D analytisch und da f in a stetig ist, z−a gilt limz→a F(z)(z − a) = 0. t u 2.3 Höhere Ableitungen und Taylorreihen Die Cauchy’sche Integralformel mag zunächst seltsam erscheinen. Ihre Stärke zeigt sich aber, wenn wir Ableitungen berechnen wollen. Wir erhalten nämlich, indem wir (2.2.6) benutzen, für jede Kurve mit Windungszahl 1, d 1 f (a) = da 2πi Z f (z) γ d 1 1 dz = da z − a 2πi Z γ f (z) dz. (z − a)2 (2.3.1) Dabei benutzen wir die Leibnitzregel nach der die Ableitung in das Integral ziehen können (die Bedingungen dafür sind leicht nachzuprüfen). Genauso können wir integrieren und erhalten dn n! f (a) = n da 2πi Z γ f (z) dz. (z − a)n+1 (2.3.2) 26 2 Komplexe Integration Diese Beobachtung zeigt uns, dass, wie schon angekündigt, alle analytischen Funktionen unendlich oft differenzierbar sind. Die Formel (2.3.2) liefert aber noch viel mehr. Wir hatten schon im Theorem 2.7 gesehen, dass singuläre Punkte an denen (2.1.23) gilt in Hinblick auf den Satz von Cauchy ungefährlich sind. Wir wollen dies nun noch weiter formalisieren. Theorem 2.10. Sei f in einen Gebiet Ω 0 = Ω \{ξ1 , . . . , ξk } analytisch, wo Ω eine zusammenhängende offene Menge ist. Dann existiert eine analytische Funktion auf Ω , die mit f auf Ω 0 koinzidiert, genau dann wenn für alle i = 1, . . . , k, (2.1.23) gilt. Beweis. Zuächst ist klar, dass die Bedingungen (2.1.23) notwendig sind, das ja f zumindestens an allen Punkten ξ j einen endlichen Grenzwert haben muss sein muss. Als nächstest stellen wir fest, dass um jeden Punkt ξ j ein Kreis, C j , gelegt werden kann, so dass Cauchy’s Formel gilt und f (z) = 1 2πi Z Cj f (w) dw w−z (2.3.3) für jedes z 6= ξ j innerhalb von C j gilt. Das Integral in (2.3.3) ist aber eine analytische Funktion überall innerhalb von C j , insbesondere auch in ξ j . Damit ist die Funktion ( f (z), ifz ∈ Ω 0 , ˜f (z) = R (2.3.4) f (w) 1 2πi C j w−z dw, ifz = ξ j , analytisch in Ω , und stellt die gewünschte analytische Fortsetzung der Funktion f dar. t u Man sagt auch, die Funktion f habe in den Punkten ξ j hebbare Singulritäten. Wir können die obige Konstruktion als eine Fortsetzung der Funktion f auf die singulären Punkte ξ j auffassen. Das folgende Lemma gibt eine Verallgemeinerung dieser Konstruktion, die im Folgenden wichtig sein wird. Lemma 2.11. Sei γ eine geschlossene Kurve und sei φ : γ → C stetig auf γ. Dann sind die Funktionen Z φ (w) dw (2.3.5) Fn (z) ≡ n γ (w − z) für n ∈ N analytisch innerhalb (und auch ausserhalb) der Kurve γ, und es gilt Fn0 (z) = nFn+1 (z). (2.3.6) Beweis. Wir betrachten zunächst F1 (z). Sei z0 ein Punkt, der nicht auf γ liegt. Dann gibt es auch eine δ -Umgebung von z0 , die γ nicht schneidet. Wir nehmen nun z in einer δ /2-Umgebung von z0 . Es gilt, weil 1/(w − z) − 1/(w − z0 ) = (z − z0 )/(w − z)(w − z0 ), Z φ (w) F1 (z) − F1 (z0 ) = (z − z0 ) dw, (2.3.7) (w − z)(w − z0 ) γ 2.3 Höhere Ableitungen und Taylorreihen und so 27 |F1 (z) − F1 (z0 )| ≤ |z − z0 |δ −2 max |φ (w)||γ|. w∈γ Hieraus folgt zunächst, dass F1 ausserhalb und innerhalb von γ jeweils stetig (aber nicht gleichmässig!) stetig ist. Da dieses Resultat auch gilt, wenn wir φ durch φ /(w − z0 ) ersetzen, folgt, dass der Differenzenquotient F1 (z) − F1 (z0 ) = z − z0 Z γ φ (w) dw (w − z)(w − z0 ) (2.3.8) gegen einen Grenzwert konvergiert, wenn z → z0 strebt. Damit ist F1 in den betrachteten Gebieten differenzierbar, und also analytisch. Ausserdem sehen, wir, dass F10 (z0 ) = Z γ φ (w) dw = F2 (z0 ). (w − z0 )2 (2.3.9) Der allgemeine Fall folgt nun durch vollständige Induktion. Dazu nimmt man an, dass das Resultat für n−1 gilt, und benutzt dann das obige Ergebnis für die Funktion φ (w)/(w − z)n−1 . Genauer benutzt man wieder, dass 1 1 1 1 1 = + (z − z0 ) − − . (w − z) (w − z0 )n (w − z)n−1 (w − z0 ) (w − z0 )n (w − z)n (w − z0 ) Wir setzen Z Fbn−1 (z) = γ φ (w)/(w − z0 ) dw (w − z)n−1 Damit ist Z Fn (z) − Fn (z0 ) Fbn−1 (z) − Fbn−1 (z0 ) φ (w) = + dw. n z − z0 z − z0 γ (w − z) (w − z0 ) Da Fbn−1 nach Induktionshypothese analytisch ist, erhalten wir, Fn (z) − Fn (z0 ) b0 = Fn−1 (z0 ) + Fn+1 (z0 ) = (n − 1)Fbn (z0 ) + Fn+1 (z0 ). z→z0 z − z0 Fn0 (z0 ) = lim Da aber Fbn (z0 ) = Fn+1 (zo ) ist, folgt to behauptete Gleichung für Fn0 . t u Lemma (2.11) impliziert insbesondere die Gleichungen (2.3.2) ohne Rückgriff auf die Leibnitz-Regel. Wenn nämlich φ sogar analytisch ist, und γ Windungszahl 1 hat, dass besagt Theorem 2.9, dass F1 (z) = 2πiφ (z), und demnach Fn+1 (z) = n!2πi f (n) (z). Sei nun f eine analytische Funktion. Wir setzen F(z) = f (z) − f (a) . z−a (2.3.10) 28 2 Komplexe Integration Dann ist F analytisch ausser in a, hat aber in a eine hebbare Singularität. Ausserdem wissen wir, dass limz→a F(z) = f 0 (z) existiert. Daher existiert nach dem vorherigen Satz eine analytische Funktion, f1 , so dass f1 (z) = F(z), für z 6= a und f1 (a) = f 0 (a). Damit ist f (z) = f (a) + (z − a) f1 (z). dieselbe Prozedur können wir nun auf f1 anwenden um eine Funktion f2 zu erhalten, so dass f1 (z) = f1 (a) + (z − a) f2 (z), und so weiter, bis fn−1 (z) = fn−1 (a) + (x − a) fn (z). Dabei hat fn die Integraldarstellung f (w) dw. C w−z Z fn (z) = Wenn wir diese Folge von Identitäten ineinander einsetzen erhalten wir, dass f (z) = f (a)+(z−a) f1 (a)+(z−a)2 f2 (a)+· · ·+(z−a)(n−1) fn−1 (a)+(z−a)n fn (z). (2.3.11) Man kann diese Gleichung n-mal ableiten und dann z = a einsetzen. Man erhält dann f (n) (a) = n! fn (a), (2.3.12) da auf der rechten Seite nur der Term übrigbleibt, in dem wir alle n Ableitungen auf (z − a)n angewandt haben. Dies liefert die Taylorformel: Theorem 2.12. Wenn f in Ω analytisch ist, und z, a ∈ Ω , so gilt (z − a)(n−1) (n−1) (z − a)2 00 f (a)+· · ·+ f (a)+(z−a)n fn (z). 2! (n − 1)! (2.3.13) Dabei ist fn (z) analytisch in Ω und es gilt, dass f (z) = f (a)+(z−a) f 0 (a)+ fn (z) = 1 2πi f (w) dw. n C (w − a) (w − z) Z (2.3.14) Beweis. Der erste Teil der Aussage folgt aus dem oben gesagten sofort. Um die Formel (2.3.14) zu gewinnen, lösen wir (2.3.13) nach fn (z) auf und setzen das Ergebnis in die Identität Z fn (w) 1 fn (z) = dw 2πi C w − z ein. Dies ergibt 2.3 Höhere Ableitungen und Taylorreihen fn (z) = 1 2πi n−1 29 f (w) dw n C (w − a) (w − z) Z 1 1 + ∑ f (k) (a) k! 2πi k=0 Z C (2.3.15) 1 dw. (w − a)n−k (w − z) Wir wollen zeigen, dass die Termin in der zweiten Zeile alle gleich Null sind. Dazu setzen wir Z 1 F` (a) = dw. ` C (w − a) (w − z) Wir betrachten zunächst F1 (a), F1 (a) ≡ 1 dw. C (w − a)(w − z) Z (n) Wir wissen aus Lemma 2.11, dass Fn+1 (a) = n!F1 (a). Andererseits ist aber (siehe die Identität vor Gleichung (2.3.7)) für a innerhalb von C, Z 1 1 1 F1 (a) = − dw = 0 z−a C w−z w−a weil C bezüglich a und z die gleiche Windungszahl hat. Damit verschwinden aber auch alle Fn (a), und somit alle Terme in der zweiten Zeile von (2.3.15). (2.3.14) ist bewiesen. Lemma 2.13. Sei f eine analytische Funktion in der Scheibe Dr (a) vom Radius r mit Zentrum in a. Sei M ≡ supz∈Dr (a) | f (z)| < ∞. Dann gilt (2.3.2) und | f (n) (a)| ≤ n!Mr−n . (2.3.16) Dieses Lemma hat eine höchst interessante Konsequenz: Theorem 2.14. Sei f eine analytische Funktion in der Scheibe Dr (a) vom Radius r mit Zentrum in a. Dann konvergiert die Taylorreihe ∞ 1 ∑ k! f (k) (a)(z − a)k , (2.3.17) k=0 für alle |z − a| < r absolut, und stellt f (z) dar. Beweis. Der Beweis ist elementar. Lemma 2.13 zeigt, dass die Potenzreihe (in der Variablen (z − a)) mindestens den Konvergenzradius r hat, und daher konvergiert die Reihe wie behauptet. Andererseits folgt aus Theorem 2.12 und derselben Abschätuung an das Restglied, dass diese gegen f (z) konvergiert. Damit haben wir gezeigt, dass alle analytischen Funktionen lokal als konvergente Potenzreihen dargestellt werden können. 30 2 Komplexe Integration 2.3.1 Weitere Eigenschaften analytischer Funktionen Wir sammeln noch einige weitere interessante Beobachtungen über analytische Funktionen, die aus den obigen Formeln folgen. Theorem 2.15. [Satz von Liouville] Eine Funktion, die auf ganz C analytisch und beschränkt ist, ist konstant. Beweis. Wenn | f (z)| überall durch eine Konstante, M, beschränkts ist, und die Funktion überall analytisch ist, so erhalten wir die Schranke | f 0 (z)| ≤ Mr−1 für jedes r < ∞, weswegen f 0 z) = 0 gilt. Damit muss f konstant sein. Als weiteres Resultat erhalten wir den Fundamentalsatz der Algebra: Theorem 2.16. Jedes nicht konstante Polynom besitzt in C mindestens eine Nullstelle. Beweis. Sei P(z) ein Polynom. Dann ist P in C analytisch. Sei nun P(z) 6= 0 für alle z. Dann ist auch 1/P(z) analytisch in ganz C. Nun gilt offenbar, dass |P(z)| → ∞, wenn |z| ↑ ∞. Daher strebt 1/P(z) gegen Null, wenn |z| ↑ ∞. Daraus aber folgt, dass 1/P(z) beschränkt ist, und somit dass P(z) konstant ist. Als nächstes wollen wir zeigen, dass eine analytische Funktion verschwindet, wenn alle ihre Ableitungen in einem Punkt verschwindet. Lemma 2.17. Sei f analytisch in einem Gebiet Ω . Wenn für einen Punkt a ∈ Ω gilt, dass f (k) (a) = 0, für alle k = 0, 1, 2, . . . . Dann ist f (z) = 0 für alle z ∈ Ω . Beweis. Wir benutzen den Satz von Taylor und erhalten, dass für alle n, f (z) = (z − a)n fn (z), wobei wir in der Darstellung γ als Kreis mit Radius R mit Mittelpunkt in a wählen und z innerhalb des Kreises liege. Dann liefert uns die Formel (2.3.14) die Schranke | fn (z)| ≤ C Rn−1 (R − |z − a|) , wo C das Maximum von f auf γ ist. so dass R |z − a| n | f (z)| ≤ C . R R − |z − a| Da |z − a| < R, folgt, dass die rechte Seite nach null strebt, wenn n nach unendlich strebt. Daher muss f (z) = 0 sein, für alle z im Innern von γ. Es folgt dann auch, dass alle Ableitungen von f dort verschwinden. 2.3 Höhere Ableitungen und Taylorreihen 31 Ein einfaches Argument zeigt, dass die Funktion sogar auf ganz Ω verschwindet. Dazu definieren wir die Teilmengen E1 , E2 ⊂ Ω mit den Eigenschaften E1 ≡ {z ∈ Ω : f (k) (z) = 0, ∀k = 0, 1, . . . .} E2 ≡ {z ∈ Ω : ∃k≥0 : f (k) (z) 6= 0}. Klarerweise ist sind E1 und E2 disjunkt und ihre Vereinigung ist gleich Ω . Daher können insbesondere nicht sowohl E1 als auch E2 offen sein, ausser eine der Mengen wäre leer. Nun haben wir gerade gezeigt, dass E1 offen ist: wenn ein Punkt a in E1 liegt, so gibt es eine Umgebung, die auch noch in E1 liegt. Andererseits ist auch E2 offen: da ja f und alle ihre Ableitungen stetig sind, so gibt es zu jedem Punkt, z and dem e.g. f (k) (z) > 0, auch eine Umgebung auf der dies wahr bleibt. Daraus folgt nun, dass E1 entweder leer ist (was der Annahme widerspricht), oder gleich Ω ist. Das beweist die Aussage. t u Das obige Ergebnis hat interessante Folgerungen. Sei a eine Nullstelle einer analytischen Funktion. Dann muss es ein k ∈ N geben, so dass f (z) = (z − a)k fk (z), wobei fk analytisch ist und fk (a) 6= 0 ist. Da fk insbesondere auch stetig ist, gibt es dann eine Umgebung von a, wo fk und somit auch f von Null verschieden sind: die Nullstellen einer analytischen Funktion sind isoliert. Eine analytische Funktion kann also in einem endlichen Gebiet nur endlich viele Nullstellen haben. Als nächstes betrachten wir Funktionen die in einer Umgebung eines Punktes analytisch sind, nicht aber in diesem selbst. Der Punkt a heisst dann eine isolierte Singularität von f . Der Fall, dass f (z) bei a einen endlichen Grenzwert besitzt führt auf den schon behandelten Fall der hebbaren Singularitäten. Wir betrachten nun den Fall, dass limz→a f (z) = ∞. Es existiert dann eine Umgebung, Uδ (a) = {z : |z − a| < δ }, so dass f (z) 6= 0 für alle z ∈ Uδ (a) (wegen der Stetigkeit von f ). In diesem Gebiet ist dann g(z) ≡ 1/ f (z) wohldefiniert und analytisch. Weiter ist die Singularität von g bei a hebbar, da lim (z − a)g(z) = lim (z − a)/ f (z) = 0. z→a z→a Weiter hat g in a eine isolierte Nullstelle, also die Form g(z) = (z − a)k gk (z), mit gk analytisch und gk (a) 6= 0. Daraus folgt, dass f (z) = (z − a)−k fk (z), (2.3.18) wo fk analytisch ist und in a nicht verschwindet. Man sagt dann, dass f bei a einen Pol der Ordnung k hat. Eine Funktion f , die in einem Gebiet ausser an isolierten Polstellen analytisch ist, heisst meromorph. 32 2 Komplexe Integration Aus der Tatsache, dass analytische Funktionen nur isolierte Nullstellen haben, folgt, dass der Quotient f (z)/g(z) zweier analytischer Funktionen stets meromorph ist (sofern g nicht identisch Null ist). Der folgende Satz gibt eine allgemeine Klassifizierung isolierter Singularitäten. Theorem 2.18. Sei eine Funktion f auf einem Gebiet Ω bis auf einen Punkt a analytisch. Dann gilt eine der folgenden Aussagen: (i) f (z) ist identisch Null in Ω ; (ii)es gibt eine ganze Zahl k ∈ Z, so dass für alle reellen Zahlen α > h, limz→a (z − a)α f (z) = 0, und für alle reellen Zahlen α < h, limz→a (z − a)α f (z) = ∞. (iii)Für keine reelle Zahl α gilt, dass entweder limz→a (z−a)α f (z) = 0 oder limz→a (z− a)α f (z) = ∞. Eine Singlarität der Form (ii) heisst algebraisch von Grad k, eine Singularität vom Typ (iii) heisst essentiell. Beweis. Wir nehmen zunächst an, dass für ein α ∈ R limz→a (z − a)α f (z) = 0. Dann gilt dasselbe für jeden gösseren Wert von α, und mithin gibt es eine kleinste Ganze Zahl, k, so dass limz→a (z − a)k f (z) = 0 gilt. Dann hat (z − a)k f (z) eine hebbare Singularität bei a. Also hat diese Funktion eine Nullstelle der Ordnung m. Somit gilt limz→a (z − a)α f (z) = 0, für alle α > m − k, und limz→a (z − a)α f (z) = ∞, für alle α < −m − k, da (z − a)α f (z) = (z − a)α−k+m g(z) wo g analytisch ist und bei a nicht verschwindet. Falls umgekehrt für α ∈ R, limz→a (z − a)α f (z) = ∞, so gilt dasselbe für alle kleineren Exponenten, und somit gibt es eine ganze Zahl k, so dass limz→a (z−a)k f (z) = ∞. Dann hat (z − a)k f (z) einen Pol mit einer Ordnung m, und es folgt wieder, dass limz→a (z − a)α f (z) = 0, für alle α > +m + k, und limz→a (z − a)α f (z) = ∞, für alle α < m + k. Damit sind wir stets in der Situation (i) oder (ii), solange die Aussage des Falls (iii) nicht gilt, was den Satz beweist. t u Im Fall einer algebraischen Singularität der Ordnung k können wir stets den Satz von Taylor auf die Funktion (z − a)k f (z) anwenden. Damit erhalten wir eine Entwicklung der Form f (z) = Bk (z − a)−k + Bk−1 (z − a)−(k−1) + B1 (z − a)−1 + φ (z), (2.3.19) wo φ (z) analytisch ist. Funktionen mit essentiellen Singularitäten haben ein viel komplizierteres Verhalten. Theorem 2.19. Sei f eine analytische Funktion mit einer wesentlichen Singularität in a. Dann nähert sich die Funktion in jeder Umgebung von a jeder komplexen Zahl beliebig nahe an. Beweis. Nehmen wir das Gegenteil an. Dann gibt es eine Zahl A ∈ C und ε, δ > 0, so dass in Uδ (a)\{a}, | f (z) − A| > ε. Dann gilt aber für alle α < 0, 2.4 Residuenkalkül 33 lim |z − a|α | f (z) − A| = ∞. z→a Dann wäre aber a keine essentielle Singulariät der Funktion f (z) − A. Wenn aber f (z) − A eine algebraische Singularität hat, dann hat nach dem oben gesagten aber auch f (z) eine algebraischen Singularität, da sich beide Funktionen nur um eine analytische Funktion unterscheiden. t u 2.4 Residuenkalkül Die Darstellung (2.3.19) für Funktionen mit isolierten algebraischen Singularitäten hat eine bemerkenswerte Konsequenz, die schon von Cauchy beobachtet wurde und den sogenannten Residuenkalkül begründet. Wir geben unsere erste Formulierung des Residuensatzen. Theorem 2.20. Sei f eine meromorphe Funktion mit isolierter algebraischer Singularität bei a. Sei f durch (2.3.19) dargestellt und sein γ eine geschlossene Kurve mit n(γ, a) = 1, die keine weitere Singularität von f umschliesst. Dann gilt 1 2πi Z f (z)dz = B1 . (2.4.1) γ Beweis. Indem wir die Darstellung (2.3.19) benutzen, finden wir k Z f (z)dz = γ ∑ Bm m=1 Z γ dz + (z − a)m Z φ (z)dz. (2.4.2) γ Nach dem Satz von Cauchy ist das letzte Integral gleich Null, während die IntegraR dz le γ (z−a) m für m ≥ 2 aufgrund von Lemma 2.11 verschwinden: Für m = 1 stellt das Integral eine Konstante dar, und die Terme mit m ≥ 2 sind deren Ableitungen, verschwinden also. Es bleibt somit nur der Term mit m = 1, der nach Lemma 2.8 gerade das behauptete Ergebnis liefert. t u Der obige Satz liefert ein zunächst verblüffendes Ergebnis, indem er die Berechnung von Integralen auf die Untersuchung der Singularitäten der Funktion f zurückführen lässt. Tatsächlich ist er im Lichte der Cauchy’schen Integralformel fast trivial: Falls f einen Pol der Ordnung k besitzt, so ist (z − a)k f (z) analytisch, und Z Z f (z)dz = γ γ f (z)(z − a)k 2πi d k−1 k dz = f (z)(z − a) . (k − 1)! dzk−1 z=a (z − a)k Den Koeffizienten B1 in der Entwicklung (2.3.19) einer Funktion f an einem Pol a nennt man das Residuum der Funktion f bei a und schreibt, B1 = Res( f , a), oder kurz Res(a). 34 2 Komplexe Integration Wir können das obige Ergebnis leicht auf den Fall verallgemeinern, dass eine Funktion f innerhalb von γ endlich viele isolierte Pole hat. Theorem 2.21. Sei γ eine geschlossene Kurve so dass für jeden Punkt, a, innerhalb der Kurve n(γ, a) = 1. Sei f analytisch innerhalb von γ ausser an endlich vielen isolierten Singularitäten, a j . Dann gilt Z γ f (z)dz = 2πi ∑ Res( f , a j ), (2.4.3) j wo Res(a j ) das Residuum der Funktion f and der Singularität a j ist, also der Koeffizient von (z − a j )−1 in der Entwicklung der Funktion f in der Form (2.3.19) um den Punkt a j . Beweis. Seien k Singularitäten innnerhalb γ. Dann kann man stets eine das Innere von γ so in zwei Teile schneiden, dass einer davon genau eine Singularität, sagen wir a1 , enthält. Indem man an diesem Schnitt entlang einmal in die eine und einmal in die andere Richtung integriert, kann man das Integral in zwei Integrale zerlegen, von denen eines nur die Singularität a1 , das andere aber eine Singularität weniger enthält. Das das ursprüngliche Kurvenintegral die Summe beider Integrale ist, folgt die Aussage durch Induktion. t u Der Residuensatz ist ein wichtiges Hilfsmittel zur Berechnung bestimmter Integrale. Wir betrachten zwei Beispiele: Beispiel 1: Betrachte das reelle Integral Z 2π 0 Wir haben Z 2π 0 dt = a + cost dt . a + cost Z 2π 0 a+ dt = + 12 e−it 1 it 2e Wir wollen dieses Integral als komplexes Integral über den Einheitskreis auffassen. Dazu parametrisieren wir diesen als z(t) = exp(it), und bemerken , dass dz(t) = iz(t)dt (Nachprüfen!!!), und daher für Funktionen f (cost, sint), Z 2π Z 1 1 f (cost, sint)dt = −i f (z + 1/z), (z − 1/z) z−1 dz. 2 2i 0 |z|=1 Für unseren Fall erhalten wir also Z 2π 1 dz 2 + 2az + 1 z 0 |z|=1 √ Der Nenner hat die Nullstellen z± = −a ± a2 − 1, von denen für a > 1 nur z+ im Innern des Einheitskreises liegt. Dann ist 1 dt = −i a + cos φt Z 2.4 Residuenkalkül 35 dz = 2 |z|=1 z + 2az + 1 Z dz 2πi πi 2πi = =√ . =− √ 2 z− − z+ |z|=1 (z+ − z)(z− z) 2 a −1 a2 − 1 Z Thus Z 2π 0 dt π . =√ 2 a + cost a −1 Beispiel 2: Fouriertransformationen. Betrachten wir nun eine Funktion f (z), die in der oberen Halbebene, {z ∈ C : ℑ(z) ≥ 0} nur endlich viele isolierte Pole hat. Wir betrachten zunächst den Fall, dass keiner davon auf der reellen Achse liegt. Wir wollen das reelle Integral Z ∞ f (x)eiux dx −∞ mit u ∈ R+ berechnen. WIr nehmen an, dass f (z) bei unendlich gegen Null strebt, genauer, wir nehmen an, dass zumindest in der oberen Halbebene |z f (z)| ≤ C < ∞, Dazu betrachten wir eine Folge von Rechtecken Cn deren Kanten durch die Geraden (−n, n), (n, n + in), (n + in, −n + in) und (−n + in, −n) gegeben sind. Dann gilt zunächst, für n so gross, dass alle Pole von f in Cn liegen, Z ∂Cn f (z)eiuz dz = 2πi ∑ Res( f (z)eiuz , a j ). j Betrachten wir nun die Integrale längs der einzelnen Kanten des Rechtecks. Z n+in f (z)eiuz dz = −n+in Z n f (x + in)eiux−nu dx. −n Offenbar gilt Z n+in iuz max | f (x + in)|e−un 2n. −n+in f (z)e dz ≤ x∈[−n,n] Klarerweise strebt dieser Term gegen Null, wenn n ↑ ∞. Als nächstest betrachten wir das Integral Z n+in f (z)eiuz dz = f (n + ix)eiun−ux dx. 0 n Wir haben Z n Z n+in Zn 1C C iuz −ux f (z)e dz n ≤ 0 |n + ix| e dx ≤ u n , was ebenfalls mit n ↑ ∞ nach Null strebt. Genau die gleiche Abschätug haben wir für das Integral längs der Kante (−n, −n + in). Es folgt daher, dass Z ∞ −∞ f (x)eiux dx = lim Z n↑∞ ∂Cn f (z)eiuz dz = 2πi ∑ Res( f (z)eiuz , a j ). j 36 2 Komplexe Integration In vielen Fällen ist allerdings die Vorraussetzung, dass f keine Singlarität auf der reellen Achse hat, nicht erfüllt. Wir betrachten den Fall, dass f (oBdA) bei Null einen Pol der Ordnung 1 mit Residuum Res(0) hat. Dann betrachten wir wieder Im −n + in n + in −δ −n δ n Re Abb. 2.1 Integrationskontur Rechtecke Cn , verformen diese aber dadurch, dass wir das Stück (−δ , δ ) auf der reellen Achse durch einen Halbkreis hδ mit Radius δ der in die negative Halbebene zeigt, ersetzen. Das erhaltene Objekt nennen wir C̃n . Dann gilt wieder Z ∂ C̃n f (z)eiuz dz = 2πi ∑ Res( f (z)eiuz , a j ) + 2πiRes( f , 0), j wobei die Summe den Pol bei Null nicht enthält. Andererseits ist Z f (z)eiuz dz = Z −δ −n Z n ∂ C̃n + f (x)eiux dx + f (x)eiux dx + f (n + ix)eiu(n+ix) dx + Z f (z)eiuz dz cδ δ 0 Z −n f (x + in)eiu(x+in) dx n Z 0 + Z n f (−n + ix)eiu(−n+ix) dx. n Wir wissen schon, dass die letzten drei Integrale verschwinden, wenn n ↑ 0. Andererseits wissen wir, dass bei Null, f (z)eiuz = Res(0) + R0 (z), z wo R0 (z) analytisch ist. Nun können wir explizit nachrechnen (siehe Beispiel 1), dass Z 2π Z dz = idt = iπ, cδ z π 2.4 Residuenkalkül 37 whärend das Integral der analytischen Funktion R0 beschränkt ist durch Z R0 (z)dz ≤ Cδ . cδ Damit erhalten wir Z ∞ −∞ f (x)eiux dx ≡ lim lim Z −δ δ →0 n↑∞ −n f (x)eiux dx + Z n f (x)eiux dx δ = 2πi ∑ Res(a j ) + πiRes(0). (2.4.4) j Hier ist das Integral als uneigentliches Integral verstanden. Als explizites Beispiel nehmen wir die Funktion f (z) = z(z21+1) . Diese hat einen einfachen Pol bei Null mit Residuum Res(0) = 1. Weiter besitzt die Funktion in der oberen Halbenene einen Pol der Ordnung eins bei z = i, mit Residuum Res(i) = 1 1 i2i = − 2 . Daher gilt eiux dx = −πie−u + πi = iπ(1 − e−u ). 2 −∞ x(x + 1) Z ∞ ∞ sin(ux)dx = π(e−u − 1). Insbesondere ist −∞ x(x2 +1) Ein einfaches, aber wichtiges Beispiel ist R π eikx dx = e−um , 2 + m2 k m −∞ Z ∞ für m > 0 und u reell. Beachte, dass das Integral für m = 0 divergiert. Beispiel 3: Im nächsten Beispiel wollen wir zeigen, wie der Residuenkalkül für Funktionen angewandt werden kann, die andere Singularitäten als Pole haben. Sei α ∈ (0, 1), und sei f eine Funktion, die bei Unendlich abfällt, so dass |z f (z)| ≤ C, für alle |z| > K. Weiter habe f bei Null höchstens einen Pol und ansonsten nur isolierte Singularitäten. Das neue Problem ist nun, dass zα f (z) wie wir es schon beim Logarithmus gesehen haben nicht eindeutig definiert ist, und insbesondere nicht überall als stetige Funktion definiert werden kann. Eine mögliche Wahl ist zα = exp(α ln z) = exp (α ln |z| + iα arg(z)) wobei arg(z) ∈ [0, 2π) liegt. Diese Funktion ist analytisch auf dem Gebiet, dass man erhält, wenn man von C die positive reelle Achse entfernt. Längs der reellen Achse hat die Funktion dann einen Sprung von e2πiα f (x), ist aber im Imaginärteil von oben bzw. von unten halbstetig. Wir konstruieren nun folgende Schar von Kurven: γn,1 ist ein Kreisbogen von (n, iδ ) nach (n, −iδ ), der die reelle Achse vermeidet. γn,2 ist ein Kreisbogen von (δ , −iδ ) nach (δ , iδ ), die ebenfalls die reelle Achse vermeidet. Schliesslich sind γn,3 , γn,4 die Geraden von (δ , iδ ) nach (n, iδ ) bzw. on 38 2 Komplexe Integration Im Re Abb. 2.2 Integrationskontur (n, −iδ ) nach (δ , −iδ ). Sei γn die geschlossene Kurve, die man erhält wenn man γn,1 , γn,3 , γn,2 und γn,4 nacheinander durchläuft. Dann gilt, für n gross genug und δ klein genug, Z γn zα f (z) = 2πi ∑ Res(a j ), j wo a j die Pole von f (z) in der oberen Halbebene, und Res(a j ) die entsprechenden Residuen von zα f (z) sind. Andererseits ist Z lim n↑∞ γn,1 und Z lim δ ↓0 γn,2 zα f (z)dz = 0, zα f (z)dz = 0. Schliesslich ist Z ∞ zα f (z)dz = lim lim Z δ ↓0 n↑∞ γn,4 0 zα f (z)dz = −e−2πα lim lim Z δ ↓0 n↑∞ γn,3 Setzen wir dies zusammen, erhalten wir Z ∞ −1 zα f (z)dz = 1 − e2πiα 2πi ∑ Res(a j ). 0 j zα f (z)dz. 2.4 Residuenkalkül 39 Beispiel 4: Laplacetransformierte Es sei u ∈ C mit ℜ(u) > 0. Ferner sei α > −1. Wir wollen das Integral Z ∞ 0 e−ux xα dx berechnen. Zunächst sehen wir, dass dieses Integral endlich existiert. Wenn u reell ist, so finden wir durch Substitution Z ∞ −ux α e 0 −α−1 Z ∞ x dx = u 0 e−x xα dx = u−α−1Γ (α + 1). (2.4.5) Falls u komplex mit positivem Realteil und positivem Imaginärteil ist, so können wir ebenso xu = y substituieren, sie neue Variable muss aber jetzt in der komplexen Ebene längs der Halbgeraden, die in Null startet und durch den Punkt u läuft integriert werden. Wir können aber den Cauchy’schen Integralsatz ausnutzen um zu sehen, dass dieses Integral für alle genannten u gleich dem Integral längs der positiven reellen Achse ist. Falls dagegen ℜ(u) > 0 aber ℑ(u) < 0, so ist Z u∞ 0 e−z zα dz = e−2πiα Γ (α + 1), da wir die Unstetigkeit auf der reellen Achse nicht überqueren können. Wir erhalten also in diesem Fall Z ∞ 0 e−ux uα dx = e−2πiα u−α−1Γ (α + 1). Um dieses Ergebnis aber richtig zu verstehen, müssen wir uns überlegen, wie wir u−α−1 interpretieren müssen. Unter unseren Annahmen an u gibt es β < π/2, so dass u = |u|ei(2π−β ) . Dann ist u−α−1 = |u|−α−1 e−i(2π−β )(α+1) , und e−2πiα u−α−1 = |u|−α−1 e−i(2π−β )(α+1)−2πiα = |u|−α−1 eiβ (α+1) . was wir erhielten, wenn wir u als u = |u|e−β i auffassen. Mit dieser Interpretation haben wir dann immer die Formel (2.4.5). 2.4.1 Weitere Interpretationen des Residuums und das Argumentenprinzip Die Rolle, die der Term der Ordnung (z − a)−1 in der Entwicklung einer Funktion mit Pol bei a spielt kann noch anders interpretiert werden, wie folgende alternative Definition des Residuums zeigt: Definition 2.22. Das Residuum einer Funktion f mit isolierter Singularität bei a ist die eindeutige Zahl, R, so dass die Funktion f (z) − R/(z.a) in einem Gebiet 0 < |z − a| ≤ δ die Ableitung einer einwertigen analytischen Funktion ist. 40 2 Komplexe Integration Um zu verstehen, dass diese Definition mit unseren bisherigen Definitionen übereinstimmt, beobachten wir, dass f (z) − k Res( f , a) = ∑ Bk (z − a)−` + φ (z). z−a `=2 Nun ist φ analytisch, also lokal eine Potenzreihe, und somit Ableitung einer Potenzd 1 ( dz (z − a)−`+1 , für ` ≥ 2. Lediglich der Term reihe. Ausserdem sind (z − a)−` = 1−` −1 (z − a) hat als Stammfunktion die mehrdeutige Funktion ln(z − a). Damit gilt Z γ ( f (z) − R/(z − a))dz = 0, was dem Residuensatz entspricht. Eine andere wichtige Beobachtung ist das Argumentenprinzip . Es basiert auf folgender Beobachtung. Wenn f eine k-fache Nullstelle bei a hat, so ist f (z) = (z − a)k fk (z), und f 0 (z) = k(z − a)k−1 fk (z) + (z − a)k fk0 (z). Folglich ist f 0 (z)/ f (z) = k/(z − a) + fk0 (z)/ fk (z), wobei der zweite Term analytisch ist. Damit hat f 0 / f Residuum k bei a. Ähnlich gilt für den Fall eines Pols der Ordnung k bei a, dass f 0 (z)/ f (z) = −k/(z − a) + fk0 (z)/ fk (z), mit den nähmlichen Eigenschaften für den zweiten Term. Damit haben wir aber folgenden Satz: Theorem 2.23. Sei f meromorph in einem Gebiet Ω mit Nullstellen a j der Ordnungen k j und Polen bi der Ordnung hi ; sei γ eine geschlossene Kurve in Ω die weder Nullstellen noch Pole von f enthält. Dann gilt Z γ f 0 (z) dz = ∑ k j n(γ, a j ) − ∑ hi n(γ, bi ). f (z) j i (2.4.6) Das Argumentenprinzip hat eine sehr wichtige Konsequenz, die als Satz von Rouché’s bekannt ist. Theorem 2.24. Sein Ω ∈ C ein Gebiet und γ eine geschlossene Kurve in Ω , so dass für jeden Punkt z, der nicht auf γ liegt, n(γ, z) ∈ {0, 1}. Seien f und g analytisch in Ω , und es gelte | f (z) − g(z)| < | f (z)| für z ∈ γ. Dann haben f und g die gleiche Zahl von Nullstellen innerhalb von γ. Beweis. Die Voraussetzung and f und g impliziert, dass sowohl f als auch f auf γ keine Nullstellen haben. Ferner gilt auf γ g(z) f (z) − 1 < 1. 2.5 Harmonische Funktionen 41 Das heisst, die Abbildung F(z) = g(z)/ f (z) bildet γ auf eine Kurge Γ ≡ F(γ), ab,die innerhalb des Einheitskreises um den Punkt 1 liegt. Nun ist Z F 0 (z)/F(z)dz = γ Z 1/zdz = n(Γ , 0). Γ In unserem Fall ist aber n(Γ , 0) = 0. Andererseits ist Z Z 0 g (z) f 0 (z) 0 = F 0 (z)/F(z)dz = − dz. g(z) f (z) γ γ Da f und g nur Nullstellen haben, folgt dass deren Anzahle in γ gleich sein muss aus dem vorherigen Theorem. t u Eine weitere Folgerung dieses Resultats ist die Beobachtung, dass wenn ft (z) eine Familie von analytischen Funktionen ist, die stetig von dem Parameter t abhängen, dann auch isolierte Nullstellen stetig von t abhängen. 2.5 Harmonische Funktionen Die Theorie analytischer Funktionen ist eng mit der der harmonischen Funktionen in Dimension d = 2 verknüpft. Diese wiederum sind von grosser Bedeutung in vielen Gebieten der Physik, insbesondere der Elektrostatik in d = 2 und der Hydrodynamik, wo das Geschwindigkeitsfeld eines inkompressiblen Flusses der Gradient einer harmonischen Funktion ist. Eine harmonische Funktion in d = 2 ist eine reellwertige Funktion u(x, y), die die Laplacegleichung ∆u ≡ ∂ 2u ∂ 2u + =0 ∂ x 2 ∂ y2 (2.5.1) löst. Wir hatten schon gesehen, dass die Real- und Imaginärteile einer analytischen Funktion als Funktion von Real- und Imaginärteil von z betrachtet, harmonisch sind. umgekehrt kann man aus einer harmonischen Funktion u auch eine analytische Funktion gewinnen, indem wir setzten f (z) = f (x + iy) = ∂ u(x, y) ∂ u(x, y) −i . ∂x ∂y (2.5.2) Dies überprüft man leicht, indem man zeigt, dass die Cauchy-Riemann Gleichungen erfüllt sind. Nun erinnern wir uns an den Zusammenhang zwischen komplexem Kurvenintegral und den Differentialformen ω und ω̂, (2.1.2) and (2.1.3). Für den Fall der Funktion (2.5.2) gibt dies 42 2 Komplexe Integration ∂u ∂u dx + dy ∂x ∂y ∂u ∂u ω̂ = − dx + dy. ∂y ∂x ω= (2.5.3) (2.5.4) Offenbar ist jetzt ω das Differential von u, d.h. ω = du, (2.5.5) während ω̂ gerade das duale des Differentials ist, ω̂ = ∗ du. (2.5.6) f dz = du + i∗ du. (2.5.7) Damit können wir also schreiben Wir hatten zum Beweis des Cauchy’schen Integralsatzes gezeigt, dass ω und ω̂ exakte Differentialformen sind, das heisst also dass nicht nur du sondern auch ∗ du exakt sind. Explizit heisst das, dass für jede geschlossene Kurve γ in einem Gebiet, in dem u harmonisch ist , Z ∗ du = 0. (2.5.8) γ Diese Gleichung hat eine interessante Bedeutung, die sich zeigt, wenn wir eine Parametrisierung γ(t) = (γx (t), γy (t)) wählen. Dann ist Z Z T ∂u 0 ∂u 0 ∗ (2.5.9) du = − γx (t) + γy (t) dt ∂y ∂x γ 0 Der Integrand ist das Skalarprodukt des Tangentialvektors γ 0 (t) and die Kurve mit der Normalenableitung von u bezüglich γ. Schliesslich bemerken wir noch, dass lokal jede harmonische Funktion der Realteil einer analytischen Funktion ist. Theorem 2.25. Sei u eine harmonische Funktion in einem (offenen) Gebiet Ω . Dann existiert in in einer offenen Umgebung jedes Punktes in Ω eine analytische Funktion, F, so dass in Ω ℜ(F(x + iy)) = u(x, y). Wenn darüber hinaus Ω einfach zusammenhängend ist, so gibt es eine solche Funktion für ganz Ω . Die Funktion F ist bis auf eine Konstante eindeutig. Beweis. Wir haben oben gezeigt, dass die in (2.5.2) definierte Funktion f analytisch ist. Andererseits wissen wir, dass die Differentialformen ω, ω̂ aus Gleichung (2.5.3) exakt sind, d.h. jeder Punkt in Ω besitzt eine offene Umgebung, O, so dass in O ω = dU, ω̂ = dV, wo U,V , der Real- bzw. Imaginärteil einer analytischen Funktion F = U + iV sind (siehe den Beweis des Satzes von Cauchy 2.5). Die Aussage bez. einfach zusam- 2.5 Harmonische Funktionen 43 menhängender Gebiete hatten wir explizit für Kreisscheiben bewiesen, sie gilt aber wie der Satz von Cauchy in grösserer Allgemeinheit. 2.5.1 Das Mittelwertsatz und das Maximumsprinzip Aus der Causchy’schen Integralformel können wir durch Wahl von γ als Kreis mit Radius r und Mittelpunkt a folgende Formel für eine analytische Funktionen f herleiten: Z 1 2π f (a + reit )dt. (2.5.10) f (a) = 2π 0 Hierzu haben wir lediglich die Parametrisierung γ(t) = reit + a gewählt. Diese Formel liefert sofort die analoge Formel für den Realteil von f , und mithin für harmonische Funktionen. Man nennt diese Eigenschaft die Mittelwerteigenschaft. Diese impliziert nun sofort das Maximumsprinzip. Theorem 2.26. Sei u harmonisch in einem offenen Gebiet Ω . Wenn u in Ω ein lokales Maximum besitzt, so ist u in Ω konstant. Beweis. Sei a ein Punkt in dem U ein lokales Maximum hat. Da u stetig ist, gibt es eine Umgebung U von a in der u(z) ≤ u(a). Wähle einen Kreis Cr (a) mit Mittelpunkt der ganz in U liegt. Dann folgt aus (2.5.10) u(a) = 1 2π Z 2π 0 u(a + reit )dt ≤ max u(z) (2.5.11) z∈Cr (a) Offenbar muss also maxz∈Cr (a) u(z) ≥ a, nach Voraussetzung also maxz∈Cr (a) u(z) = a. Dann ist aber Gleichheit in der nur dann möglich, wenn u(z) = u(a) für alle z ∈ Cr (a). Dann aber folgt, dass u(z) ≡ u(a) in Ω ist, da ja u als Realteil einer analytischen Funktion nur isolierte Nullstellen haben kann. t u Eine offensichtliche Konsequenz des Maximumsprinzips ist die Formulierung “eine harmonische Funktion in einem Gebiet Ω nimmt ihr Maximum auf dem Rand von Ω an”. Klarerweise gilt das für Maxima gesagte auch für Minima. Daraus erhalten wir: Theorem 2.27. Wenn eine harmonische Funktion u auf dem Rand eines Gebiets Ω verschwindet, dann ist u(z) = 0 für alle z ∈ Ω . Beweis. Aus dem vorigen Satz folgt, dass für alle z ∈ Ω , u(z) ≤ 0 und u(z) ≥ 0. t u Das folgende Korollar ist ebenso wichtig wie offensichtlich: Korollar 2.28. Seinen u, v harmonisch auf einem Gebiet Ω , und gelte u(z) = v(z) für alle z ∈ ∂ Ω . Dann ist u(z) = v(z) für alle z ∈ Ω . 44 2 Komplexe Integration 2.5.2 Der Poissonkern und das Dirichletproblem Nachdem wir gesehen haben, dass harmonische Funktionen durch ihre Werte auf dem Rand eines Gebiets eindeutig bestimmt sind, stellt sich in natürlicher Weise die Frage, wie man aus den Randdaten eine entsprechende harmonische Funktion findet. Diese sogennante Dirichletproblem ist eine zentrale Fragestellung aus der Theorie der partiellen Differentialgleichungen. Im allgemeinen stellt es sich wie folgt: Definition 2.29. Sei Ω ∈ Rd ein offenes Gebiet, und sein g : ∂ Ω → R eine Funktion auf dem Rand von Ω . Finde eine stetige Funktion u : Ω̄ → R, so dass ∆ u(x) = 0, x∈Ω u(x) = g(x), x ∈ ∂Ω. (2.5.12) (2.5.13) Die Existenz von Lösungen eines Dirichletproblems ist im allgemeinen nicht unproblematisch und hängt von Eigenschaften sowohl des Gebiets Ω als auch der Randdaten g ab. Für den Fall d = 2 liefert die komplexe Analysis einen eleganten Zugang zu dem Problem. Wir werden im folgenden den Fall behandeln, dass Ω eine offene Kreischeibe x2 + y2 < R2 ist. Wir wissen dann, dass u der Realteil einer analytischen Funktion f ist, die die Darstellung ∞ f (z) = ∑ an zn (2.5.14) n=0 als absolut konvergente Reihe besitzt. Wir können den Koeffizienten a0 als reell annehmen. Mit der Darstellung z = reit erhalten wir die Darstellung von g in Polarkoordinaten 1 ∞ (2.5.15) g̃(r,t) ≡ g(r cost, r sint) = a0 + ∑ rn an eint + a∗n e−int . 2 n=1 Wir erinnern uns, dass diese Darstellung als Funktion der Variablen t ∈ [0, 2π) gerade die Fourierreihe von g̃(r,t) ist. Damit erhalten wir die Darstellung der Koeffizienten an als Fourierintegrale: 1 2π g̃(r,t)dt, 2π 0 Z 2π 1 g̃(r,t) an = dt, n ≥ 1. π 0 rn eint Z a0 = (2.5.16) (2.5.17) Übung: Hier offenbart sich ein direkter Zusammenhang zwischen Fourierreihen und der Cauchy’schen Intergralformel. Zeige dazu, dass man die Darstellung (2.5.16) durch Anwendung der Cauchy’schen Integralformel erhalten kann. Nun kann man diese Formel in (2.5.14) einsetzen. Es folgt, für |z| < r, 2.5 Harmonische Funktionen 45 1 f (z) = 2π Z 2π 1 2π Z 2π = 0 ! z n dt g̃(r,t) 1 + 2 ∑ it n=1 re ∞ g̃(r,t) 0 reit + z dt. reit − z (2.5.18) (2.5.19) Hier haben wir lediglich die auftretende geometrische Reihe aufsummiert. Wir müssen nun nur noch den Realteil der rechten Seite berechnen um unsere Darstellung für g zu erhalten: it r2 − |z|2 re + z = . ℜ reit − z |reit − z|2 Somit erhalten wir, für |z| < r, g(x, y) = 1 2π Z 2π g̃(r,t) 0 2 r2 − |z|2 dt, |reit − z|2 (2.5.20) 2 r −|z| where z = x + iy. Die Funktion ζ (z) ≡ |re it −z|2 heisst Poissonkern, und die Darstellung (2.5.20) Poissonintegral . Indem wir für g die konstante Funktion g(z) = 1 einsetzen, erhalten wir die Identität Z 1 2π r2 − |z|2 dt = 1. (2.5.21) 2π 0 |reit − z|2 Wir können nun die Poisson’sche Integralformel benutzen, um das Dirichletproblem für den Kreis zu lösen. Theorem 2.30. Sei Cr (0) wie oben. Sei g̃(t) eine stetige periodische Funktion mit Periode 2π. Dann ist F(x, y) ≡ 1 2π Z 2π g̃(t) 0 r2 − |z|2 dt |reit − z|2 (2.5.22) die einzige Lösung des Dirichletproblems auf Cr (0) mit Randdaten g(reit ) = g̃(t). Beweis. Zunächst ist die Funktion F(x, y) nach Konstruktion der Realteil der Funktion Z 1 2π reit + z dt, g̃(t) it 2π 0 re − z die offenbar analytisch ist. Damit ist F harmonisch. Es bleibt also nur zu zeigen, dass die Funktion am Rand der Kreischeibe stetig ist, d.h. lim z→rit ,|z|<r F(x, z) = g̃(t). (2.5.23) Nun hatten wir schon gesehen, dass der Poissonkern sich zu 1 integriert. (2.5.23) folgt also, wenn wir zeigen, dass 46 2 Komplexe Integration 1 r2 − |z|2 2π |reit − z|2 eine Dirac-Folge ist, die gegen die Dirac-Funktion an der Stelle t konvergiert, wenn z → reit strebt. Dazu müssen wir nur zeigen, dass der Poissonkern ausserhalb jeder Umgebung des Punktes reit in diesem Limes gegen Null strebt, was leicht zu sehen ist und als Übung gestellt wird. t u Beispiel: Betrachte den Einheitskreis und Randwerte g̃(t) = cost. Es empfiehlt sich, statt direkt den Realteil auszurechnen, zunächst die analytische Funktion f zu berechnen. Diese hat die Darstellung f (z) = Z 2π 1 2π cost 0 eit + z dt. eit − z Um dieses Integral zu berechnen, benutzen wir den Residuenkalkül und gehen wie im Beispiel 1 vor. Wir erhalten dann f (z) = 1 2πi Z ∂C1 (0) 1 w+z (w + 1/w) dw. 2 (w − z)w Im Innern des Einheitskreises hat der Integrand Pole bei 0 und bei z. Der Pol bei z ist einfach, und das Residuum ergibt sich als: 1 Res(z) = (z + 1/z)(2z)/z = z + 1/z. 2 Der Pol bei Null ist vom Grad 2 und das Residuum berechnet sich als Res(0) = 1 (w − z) − (w + z) 1 d w + z = = −z−1 . w=0 w=0 2 dw w − z 2 (w − z)2 Daher haben wir f (z) = z. Der Realteil ist r cost, und diese ist als Realteil der analytischen Funktion z harmonisch, und erfüllt die Randbedingung. Genauso (Übung!) zeigt man, dass für Randbedingungen g̃(t) = cos nt, die Lösung des Dirichletproblems durch die Funktion u(x, y) = ℜ(zn ) = rn costn gegeben ist. Beachte, dass die Lösung gegen Null um so schneller abklingt, je hochfrequenter die Randdaten sind. Wir hätten natürlich die Antwort direkt erraten können: Wir brauchen nur zu bemerken, dass cos nt auf dem Einheitskreis der Realteil der analytischen Funktion zn ist. Dann wissen wir sofort, dass deren Realteil harmonisch ist und die Randbedingung erfüllt, und also die einzige Lösung sein muss. 2.5 Harmonische Funktionen 47 Anmerkung 2.31. Ich werde im Folgenden stets u(z) schreiben, wenn man korrekterweise u(x, y) setzen müsste. 2.5.3 Harmonische Funktionen und konforme Abbildungen Die Lösung des Dirichletproblems mittels des Poissonintegrals für den Fall des Kreises mag sehr speziell erscheinen. In Wirklichkeit liefert sie aber ein Hilfsmittel zur Lösung des Dirichletproblems in viel allgemeineren Gebieten. Zunächst machen wir folgende einfache Beobachtung: Lemma 2.32. Sei Ω ein offenes Gebiet und f eine analytische Funktion Ω → f (Ω ) ⊂ C, die auf f (Ω ) invertierbar ist. Sei u : f (Ω ) → R eine harmonische Funktion. Dann ist U(z) ≡ u( f (z)) eine harmonische Funktion auf Ω . Beweis. Wir wissen, dass u lokal der Realteil einer analytischen Funktion h ist. Dann ist aber auch h( f (z)) analytisch und deren Realteil ist eine harmonische Funktion. Sei nun Ω ein Gebiet, und sei f eine analytische Funktion, die Ω auf die offene Einheitskreisscheibe wie oben abbildet. Wir suchen eine Lösung des Dirichletproblems ∆U(z) = 0, z ∈ Ω, U(z) = g(z), z ∈ ∂Ω. (2.5.24) (2.5.25) Ein Kandidat für die Lösung ist die Funktion u( f (z)), wo u das Dirichletproblem im Einheitskreis löst, nämlich ∆ u(z) = 0, z ∈ C1 (0), u(z) = f −1 (g(z)), z ∈ ∂C1 (0). (2.5.26) (2.5.27) Wir wissen schon, dass h( f (z)) die harmonisch in C1 (0) ist, und ebenso gilt, dass auf dem Rand des Kreises u( f (z)) = g(z), sofern f auf ganz C̄1 (0) invertierbar ist. Die einzige übrige Bedingung, die nachzuprüfen ist, ist die Stetigkeit am Rand, also ob lim u( f (z)) = u( f (z0 )) Ω 3ζ →z0 ∈∂ Ω gilt. Da u stetig ist, reduziert sich die Frage auf die Stetigkeit der Abbildung f am Rand von Ω . Generell stellt sich die Frage, für welche Gebiete Ω es analytische Funktionen gibt, die Ω auf den Kreis abbilden und die oben gewünschten Eigenschaften haben. 48 2 Komplexe Integration 2.5.4 Beispiel: Joukowski Funktion Eine einfache Anwendung in der Elektrostatik ist das folgende Beispiel. Wir betrachten einen Halbzylinder mit Radius r Wir suchen eine nicht-triviale harmonische Funktion, die auf der rellen Achse und auf dem Halbkreis mit Radius r verschwindet, d.h. die Funktion verschwinde auf dem Rand der Menge Or = {zx + iy ∈ C : y > 0, x2 + y2 > r}. Dazu betrachten wir die sog. Joukowski Funktion f (z) = z + 1/z. Aus der Darstellung in Polarkoordinaten, f (reit ) = (r + 1/r) cost + i(r − 1/r) sint sieht man leicht, dass der Imaginärteil von f (z) verschwindet wenn z rell ist oder r = 1, d.h. f bildet den Rand der Menge O1 auf die reelle Achse ab. f bildet in der Tat sogar die Menge O1 eins-zu-eins auf die obere Halbebene ab. Andererseits ist f auf der Menge O1 analytisch, f erlaubt also eine harmonische Funktion auf der oberen Halbebene mit Randbedingung auf der reellen Achse auf eine harmonische Funktion in O1 abzubilden. Wie man auch leicht sieht, ist f am Rande von O1 stetig (sogar analytisch). Eine harmonische Funktion mit Randbedingung u(x, y) = 0, für y = 0 ist nun u(x, y) = y. Dann ist die Funktion h(x, y) = u( f (x + iy)) = (r − 1/r) sint = y − y x2 + y2 harmonisch in O1 und verschwindet auf dem Rand. Bei unendlich ist h(x, y) ∼ y, dh. im Unedendlichen liegt ein konstantes elektrisches Feld in die y-Richtung vor. Wichtiger ist die Anwendung der Joukowski Funktion in der Hydrodynamik. Für wirbelfreie Strömungen in einem inkompressiblen Medium, erhält man für ein (stationäres) Geschwindigkeitsfeld v die Gleichungen rotv = 0 und divv = 0. Daraus ergibt sich, dass v der Gradient eines Potentials φ ist, dass harmonisch ist, ∆ φ = 0. Zu der harmonischen Funktion φ gehört nun eine analytische Funktion, F, deren Realteil φ ist. Der Imaginärteil dieser Funktion, ψ, hat, wie wir gesehen haben die Eigenschaft, dass dψ(z) = ∗ dφ (z) = −v2 (z)dx + v1 (z)dy, d.h. der Gradient von ψ ist das um π/2 gedrehte Geschwindigkeitsfeld. Nun betrachten wir dies in unserem obigen Beispiel: Wir suchen eine Strömung in O1 mit 2.6 Der Riemann’sche Abbildungssatz 49 der Eigenschaft, dass die Geschwindigkeit am Rand von O1 keine Komponente hat, die senkrecht zum Rand steht. Dieses Problem ist für die obere Halbebene leicht zu lösen, nämlich gerade durch die Funktion u(x, y) = y (denn die zugehörige Geschwindigkeit ist v = (1, 0)). Mittels der Joukowski Funktion erhalten wir daraus die gewünschte Lösung für das Gebiet 01 , also xy x 2 − y2 , − . v(x, y) = 1 − 2 (x + y2 )2 (x2 + y2 )2 Man kann das obige Resultat auch einfach auf ganz C ausdehen, indem man die erhaltenen Lösung an der reellen Achse spiegelt. Die Funktion ψ(x, y) ≡ y − y/(x2 + y2 ) ist dann harmonisch ausserhalb des Einheitskreises und verschwindet auf ihm. Wir sehen auch an der Formel für das Geschwindigkeitsfeld, dass dieses in der unteren Halbebene gerade das Spiegelbild des Feldes in der oberen Halbebene ist. Damit kann man jetzt durch weitere konforme Abbildungen Stömungsfelder für kompliziertere Objekte gewinnen. So kann man zunächst das Problem für allgemeine Kreise mit Mittelpunkt a und Radius r einfach durch die Abbildung z → (z − a)/r lösen. Die entsprechende harmonische Funktion ist dann h(x, y) = (y−ℑa)/r −r (x−ℜa)y−ℑa) 2 +(y−ℑa)2 . Dann kann man weitere Gebiete erhalten, indem man zB die Joukowski Funktion einsetzt. Der Kreis kann dann auf Figuren abgebildet werden, die wie Tragflächenprofile aussehen, und dies war tatsächlich die von Joukowski angestrebte Anwendung. Die harmonische Funktion für dieses komplizierte Gebiet ist dann der Realteil von F(w) = (g(w) − a)/r,pwo g eine Umkehrfunktion der Joukowski Funktion ist, also etwa g(w) = w/2 + w2 /4 − 1, wobei die Wurzel so zu definieren ist, dass eine ein-wertige analytische Funktion im Äusseren des Bildes des Kreises unter der Joukowski Funktion is 2.6 Der Riemann’sche Abbildungssatz Man kann sich fragen, für welche Gebiete man im Prinzip eine konforme Abbildung auf den Einheitskreis finden kann. Ein wesentliches, und zunächst äusserst überraschndes Resultat hierzu ist der folgende Riemann’sche Abbildungssatz. Theorem 2.33. Sei Ω eine einfach zusammenhängendes offenes Gebiet in C das nicht gleich C ist, und sei z0 ∈ Ω ein beliebiger Punkt in Ω . Dann existiert eine einzige analytische Funktion f auf Ω , mit den Eigenschaften f (z0 ) = 0, f 0 (z0 ) > 0, und f ist eine eins-zu-eins Abbildung zwischen Ω und dem Inneren des Einheitkreises, D1 ≡ {z ∈ C : |z| < 1}. Anmerkung 2.34. Die obige Aussage ist nicht die allgemeinste Form des Riemmanschen Abbildungsatzes. Es gibt auch Resultate für nicht einfach zusammenhängende Gebiete. Der Satz löst aber das Problem der Lösung von Dirichletproblemen noch 50 2 Komplexe Integration nicht völlig, da nicht klar ist, wann die Abbildung f auch am Rand von Ω stetig ist. Überhaupt ist die Theorie des Randverhaltens dieser Abbildungen ein sehr kompliziertes Thema, dass wir hier nicht im Einzelnen diskutieren können. Es ist allergings für alle “vernünftigen” zusammenhängenden Gebiete (z.B. alle von einer Jordan-Kurve begrenzten Gebiete können so konform auf den Kreis abgebildet werden, dass die Abbildung auf dem Abschluss des Gebiets stetig ist). D Beweis. Wir kommen nun zum Beweis des Riemann’schen Abbildungssates. Wir benötigen zunächst ein Hilfsergebnis. Lemma 2.35. [Satz von Schwarz] Es sei f analytisch auf {z : |z| < 1}, und | f (z)| ≤ 1, f (0) = 0. Dann gilt | f (z)| ≤ |z| und | f 0 (0)| ≤ 1. Gleichheit gilt nur wenn f (z) = cz mit |c| = 1. Beweis. Die Funktion f1 (z) = f (z)/z, z 6= 0 und f1 (0) = f 0 (0) ist unter den Voraussetzungen analytisch und und erfüllt das Maximumsprinzip. Nun ist auf jedem Kreis vom Radium r < 1, | f1 (z)| ≤ 1/r, und also für alle |z| < 1, | f1 (z)| ≤ 1, was die Behauptung ist. Falls irgendwo Gleicheit herrscht, so hat die Funktion im Kreis ein lokales Maximum und muss daher konstant sein, was die zweite Aussage ist. Sein nun f eine konforme eins-zu-eins Abbildung von D1 auf sich selbst, dann ist dies auch f −1 , und sei f (0) = 0. Beide Funktionen erfüllen die Vorraussetzung des Lemma. Da nun gelten muss, dass z = f ( f −1 (z)), folgt |z| = f ( f −1 (z)) ≤ f −1 (z) ≤ |z|. dies kann aber nur der Fall sein, wenn in beiden Ungleichungen Gleichheit gilt, d.h. es ist f (z) = cz. Diese Beobachtung impliziert sofort, dass es höchstens eine Abbildung geben kann, die die in Satz 2.33 geforderten Eigenschaften hat. Gäbe es nämlich zwei derartige Abbildungen, etwa f und g, dann wäre Es ist nämlich g◦ f −1 eine konforme umkehrbare Abbildung von D1 nach D1 . Ausserdem gilt g( f −1 (0)) = g(z0 ) = 0, so dass wir wissen, dass g( f −1 (z) = cz. Ferner ist c= d g( f −1 (0) = g0 (z0 )/ f 0 (z0 ). dz Da sowohl g0 (z0 ) als auch f 0 (z0 ) reell und positive sind, kann nur c = 1 in Frage kommen, alse f = g. Der Beweis der Existenz ist etwas schwieriger. Wir definieren dafür eine Menge F von Funktionen f auf Ω die die Eigenschaften haben: (i) g ist analytisch und eins-zu-eins, i.e. g(z1 ) = g(z2 ) impliziert z1 = z2 . (ii)|g(z)| ≤ 1, für alle z ∈ Ω . (iii)g(z0 ) = 0, g0 (z0 ) > 0. Die Idee des Beweises ist zu zeigen, dass diese Menge nicht leer ist, und das dasjenige Element, dass maximale Ableitung hat, die gesuchte Abbildung f ist. Um zu √ sehen, dass F nicht leer ist, nehmen wir einen Punkt a 6∈ Ω und setzen h(z) = z − a, wobei h eine ein-wertige Wahl der Wurzel ist; da a 6∈ Ω und Ω 2.6 Der Riemann’sche Abbildungssatz 51 einfach zusammenhängend ist, kann man eine Wahl so treffen, dass h auf ganz Ω definiert ist. h ist auf Ω eins-zu-eins, und es gibt auch keine zwei Punkte in Ω , so dass h(z1 ) = −h(z2 ). Dies impliziert aber, dass, da es sicher ein ρ > 0, so dass das Bild on Ω unter h die Scheibe {w : |w − h(z0 )| < ρ} enthält, alle Spiegelpunkte dieser Menge, also die Menge {w : |w + h(z0 )| < ρ}, gerade nicht im Bild von Ω liegen. Daher ist für alle z ∈ Ω , |h(z) + h(z0 )| > ρ. Insbesondere gilt |h(z0 )| > ρ/2. Aus der Funtkion h konstruieren wir nun ein Element von F , nämlich g0 (z) ≡ ρ |h0 (z0 )| h(z0 ) h(z) − h(z0 ) . 4 |h(z0 )|2 h0 (z0 ) h(z) + h(z0 ) Offenbar gilt (i), da h eins-zu-eins und analytisch ist und g eine gebrochen lineare Funktion von h ist deren Nenner keine Nullstelle in Ω hat. Weiter gilt ρ 1 h(z) − h(z0 ) |g0 (z)| = 4 |h(z0 )| h(z) + h(z0 ) 1 ρ 1 2 ≤ 1, = |h(z0 )| − 4 |h(z0 )| h(z) h(z) + h(z0 ) d.h. (ii) gilt ebenfalls. Schliesslich ist g(z0 ) = 0, und g00 (z) = ρ |h0 (z0 )| h(z0 ) h0 (z)(h(z) + h(z0 ) − (h(z) − h(z0 ))h0 (z) , 4 |h(z0 )|2 h0 (z0 ) (h(z) + h(z0 ))2 und daher g00 (z0 ) = ρ |h0 (z0 )| > 0. 8 |h(z0 )|2 Somit ist auch (iii) erfüllt. Wir setzen nun B ≡ supg∈F g0 (z0 ). Dann existiert eine Folge gn ∈ F , so dass limn↑∞ gn (z0 ) = B. Man kann nun zeigen, dass diese Folge so gewählt werden kann, dass gn gegen eine analytische Funktion f konvergiert. Dann ist f (z0 ) = 0, | f (z)| ≤ 1, für alle z ∈ Ω , und f 0 (z0 ) = B, weswegen auch B < ∞ gelten muss. Schliesslich ist f nicht konstant, und es folgt dann, dass f ebenfalls eins-zu-eins ist. Es bleibt also nur zu zeigen, dass f jeden Wert in D1 annimmt. Nehmen wir an dies sei nicht so, und f nehme den Wert w0 nicht an. Dann können wir einen ein-wertigen Zweig der Funktion s f (z) − w0 F(z) = 1 − w∗0 f (z) definieren. Es ist klar, dass |F(z)| ≤ 1. Wir setzen nun G(z) = |F 0 (z0 )| F(z) − F(z0 ) . F 0 (z0 ) 1 − F(z0 )∗ F(z) Diese Funktion ist aber auch wieder in F , und es gilt 52 2 Komplexe Integration G0 (z) = |F 0 (z0 )| F 0 (z)(1 − F(z0 )∗ F(z)) + (F(z) − F(z0 ))F(z0 )∗ F 0 (z) , F 0 (z0 ) (1 − F(z0 )∗ F(z))2 und so G0 (z0 ) = Schliesslich ist F(z0 ) = √ −w0 und |F 0 (z0 )| ; 1 − F(z0 )∗ F(z0 ) 1 1 + |w0 |2 F 0 (z0 ) = (−w0 )−1/2 f 0 (z0 )(1 + w0 w∗0 ) = B √ 2 −w0 und daher G0 (z0 ) = B 1 + |w0 | 1 1 + |w0 |2 p =B p > B. 1 − |w0 | |w0 | |w0 | Dies führt aber zum Widerspruch, und der Satz ist bewiesen. t u Anmerkung 2.36. Der Beweis dieses Satzes ist extrem unkonstruktiv und zeigt nicht wirklich, wie man die gewünschte Abbildung wirklich finden soll. Es gibt explizite Formeln für die Abbildung von Polygonen auf den Einheitskreis, die allerdings recht unhandlich sind (sie involvieren elliptische Funktionen). 2.6.1 Möbiustransformationen Eine in der Praxis wichtige Klasse von konformen Abbildungen sind die schon früher betrachteten gebrochen linearen Abbildungen, oder Möbiustransformationen . Wir wollen hier nochmals auf deren Eigenschaften eingehen. Theorem 2.37. Jede Möbiustransformation kann durch die Hintereinanderausführungen der folgenden drei elementaren Möbiustransformationen erhalten werden: (i) Translation: z → z + a, a ∈ C; (ii)Multiplikation (“Drehstreckung”): z → bz, b ∈ C, und (iii)Inversion: z → 1/z. Beweis. Sei f (z) = az+b cz+d . Durch Erweitern sieht man, dass f (z) = ad − bc a − . c c(cz + d) Dies können wir mittels der elementaren Transformationen wie folgt konstruieren z → cz → cz + d → c(cz + d) → 1 ad − bc ad − bc a →− →− + . c(cz + d) c(cz + d) c(cz + d) c Damit ist die Behauptung bewiesen. t u 2.6 Der Riemann’sche Abbildungssatz 53 Eine wichtige Konsequenz ist die Tatsache, dass Möbiustransformationen Kreise auf Kreise oder Geraden abbilden. Theorem 2.38. Sei f eine Möbiustransformation und γ ein Kreis oder eine Gerade. Dann ist das Bild von f ein Kreis oder eine Gerade. Beweis. Sei γ ein Kreis. Offenbar ist das Bild eines Kreises unter Translation und Multiplikation wieder ein Kreis. Falls γ die Null nicht enthält, so ist auch unter der Inversion das Bild von γ ein Kreis, da für eine Menge K = {z ∈ C : |z − a| = r} gilt 2 ∗ 1 r2 = + a . z r2 − |a|2 (r2 − |a|2 )2 Hier is angenommen, dass r 6= |a|, also der Nullpunkt nicht auf dem Kreis liegt. Was passiert, wenn die Null auf dem Kreis liegt, also |a| = r ist? Zunächst kann man durch Anwendung einer Drehstreckung den allgemeinen Fall auf den mit r = 1 und a = 1 zurückführen. Dann ist das Bild des Kreises parametrisiert durch 1/z(t) = e−it/2 1 1 = = − i tan(t/2). it 2 cos(t/2) 2 1+e Dies is aber die Paramterisierung der Geraden { 21 + iR}. Ähnlich zeigt man, dass auch die Blder von Geraden nur Kreise oder Geraden sein können, wobei die zwei Fälle davon abhängen, ob die Gerade durch die Null geht, oder nicht. Wie man leicht sieht, bildet die Möbiustransformation z → z−1 z+1 den Einheitskreis auf die imaginäre Achse ab. Dabei wird der Punkt −1 aufgespalten und nach +∞ und −∞ gesendet. Das Innere des Einheitskreises wird auf die linke Halbebene, und das Äussere auf die rechte Halbebene abgebildet. Eine weiteres wichtiges Resultat ist noch folgender Satz. Theorem 2.39. Seien z1 , z2 , z3 und w1 , w2 , w3 jeweils verschiedene Punkte in C. Dabb gibt es genau eine Möbiustransformation, f , so dass für i = 1, 2, 3, f (zi ) = wi . (2.6.1) Beweis. Wir zeigen zunächst, dass es eine eindeutige Möbiustransformation gibt, die (z1 , z2 , z3 ) nach (1, 0.∞) abbildet, nämlich S(z) = z − z2 z1 − z3 . z − z3 z1 − z2 Das S die gewünschte Eigenschaft hat, ist offensichtlich. Gäbe es eine weitere solche Abbildung, sagen wir T , so würde S ◦ T −1 die Punkte (1, 0, ∞) auf sich selbst abbilden. Da diese die Form (az + b)/(cz + d) haben muss, erhielten wir die Gleichungen 54 2 Komplexe Integration a+b c+d b 0= d a∞ + b a ∞= = . c∞ + d c 1= Offenbar implieziert die letzte Gleichung c = 0, die zweite b = 0, und dann erste a = d, so dass die Abbildung die Identität ist. Sei nun S die Abbildung von eben, und T die einzige Möbiustransformation, die (w1 , w2 , w3 ) auf (1, 0, ∞) abbildet. Dann ist S−1 T die gewüschte Möbiustransformation. Falls es zwei solche Abbildugen gäbe, gäbe es eine Möbiustransformation, die (z1 , z2 .z3 ) auf sich abbildet und nicht die Identität ist. Daraus könnte man aber eine zweite Abbildung basteln, die (z1 , z2 , z3 ) auf (1, 0, ∞) abblildet, was aber nicht geht. t u 2.7 Weitere Reihenentwicklungen 2.7.1 Folgen analytischer Funktionen Wir betrachten eine Folge von analytischen Funktionen fn auf Gebieten Ωn . Es gelte, dass fn auf einem Gebiet Ω gegen eine Funktion f konvergiert. Wann können wir erwarten, dass f analytisch ist? Der folgende Satz von Weierstrass beantwortet diese Frage. Theorem 2.40. Seien fn auf Gebieten Ωn analytische Funktionen, und die Folge von Funktionen fn konvergiere gegen eine Funktion f auf Ω , und zwar gleichmässig auf jeder kompakten Teilmenge von Ω . Dann ist f analytisch in Ω und die Folge fn0 konvergiert gegen f 0 gleichmässig auf jeder kompakten Teilmenge von Ω . Beweis. Wir benutzen die Tatsache, dass eine Funktion auf einem Gebiet analyR tisch ist, wenn für alle geschlossenen Kurven γ in diesem Gebiet γ f (z)dz = 0. Wir dürfen annehmen, dass Ω ⊂ Ωn für alle n. Für jede abgeschlossene Kreisscheibe Dr (a) ≡ {|z − a| ≤ r} ⊂ Ω und jeden geschlossenen Weg γ ⊂ Dr (a) gilt nun Z fn (z)dz = 0 γ . Da fn auf Dr (a) uniform konvergiert, folgt auch Z 0 = lim n↑∞ γ Z fn (z)dz = Z lim fn (z)dz = γ n↑∞ f (z)dz, γ so dass f in Dr (a) analytisch ist. Daraus folgt dass f in Ω analytisch ist. (2.7.1) 2.7 Weitere Reihenentwicklungen 55 Die Konvergenz der Ableitungen folgt aus der Konvergenz der Funktion mittels Cauchy’schen Integralsatzes. Wir haben ja fn0 (w) = Z γ fn (z) dz, (z − w)2 (2.7.2) mit γ z.B. ein kleiner Kreis um w. Da fn uniform konvergiert, tut dies auch fn0 . t u Ein wichtiges Beispiel sind Reihen von analytischen Funktionen, ∞ f (z) = ∑ gk (z), k=0 wo die gk analytisch sind und die Reihe unifomr auf kompakten Teilmengen konvergiert. Dann folgt aud dem obigen Satz, dass f analytisch ist, und die Ableitung gegeben ist als f 0 (z) = ∞ ∑ g0k (z). n=0 Eine weitere interessante und überraschende Anwendung ist der Satz von Hurwitz. Theorem 2.41. Die Funktionen fn seien analytisch in Ω und haben keine Nullstelle in Ω . fn konvergiere gegen f uniform auf kompakten Teilmengen von Ω . Dann ist entweder f (z) ≡ 0, oder f hat keine Nullstelle in Ω . Beweis. Wenn f nicht identisch verschwindet, so hat f nur isolierte Nullstellen. Für jeden Punkt w gibt es daher eine positive Zahl r, so dass f (z) für 0 < |z − |0 | ≤ r nicht verschwindet. Wegen dem Maximumsprinzip ist nimmt dann | f (z)| sein Maximum auf dem Rand C dieser Scheibe an. Daher konvergiert dort auch 1/ fn (z) gleichmässig gegen 1/ f (z) (denn |1/ fn (z)−1/ f (z)| = | fn (z)− f (z)|/(| fn (z)|| f (z)|). Hier konvergiert der Zähler nach Voraussetzung nach Null und der Nenner ist nach unten beschränkt). Da auch fn0 konvergiert, haben wir Z lim n↑∞ C fn0 (z) dz = fn (z) Z C f 0 (z) dz. f (z) (2.7.3) Die linke Seite ist aber gleich Null, da fn keine Nullstellen hat, und somit gilt dasselbe auch für f . t u 2.7.2 Laurentreihen Wir hatten bereits gesehen, dass jede analytische Funktion lokal durch eine absolut konvergente Taylorreihe dargestellt werden kann, ∞ f (z) = 1 ∑ n! f (n) (z0 )(z − z0 )n . n=0 56 2 Komplexe Integration Solche Reihen sind in einem Gebiet der Form |z − z0 | < r absolut konvergent, wo r der Konvergenzradius der Reihe ist. Umgekehrt könnte man hoffen, durch Übergang zu Variablen 1/(z − z0 ) eine Reihenentwicklung der Form ∞ ∑ An (z − z0 )−n f (z) = n=0 zu erhalten, die dann in einem Gebiet der Form |z − z0 | > 1/r konvergieren mag. Sei in der Tat f (z) analytisch für |z − z0 | > r. Dann setzen wir g(z) = f (z0 + 1/(z − z0 )), und es folgt, dass g für |z − z0 | < R analytisch ist. Dann hat g(z) eine konvergente Taylorentwicklung ∞ g(z) = ∑ an (z − z0 )n n=0 und somit gilt ∞ f (z) = g(z0 + 1/(z − z0 )) = ∑ an (z − z0 )−n . n=0 Diese Reihe konvergiert für |z − z0 | > R. Die Koeffizienten an ergeben sich aus der Taylorformel für g als an = n!1 g(n) (z0 ). Noch allgemeiner kann man in einem Gebiet der Form r < |z − z0 | < R eine Darstellung ∞ f (z) = ∑ n=−∞ Bn (z − z0 )n (2.7.4) erwarten. Solche Reihen nennt man Laurentreihen. Theorem 2.42. Sei f in einem Kreisring r < |z − z0 | < R analytisch. Dann besitz f in diesem Gebiet eine Darstellung als konvergente Laurentreihe der Form (2.7.4). Die Koeffizienten Bn sind gegeben durch Bn = 1 2πi Z |z−z0 |=ρ f (z)dz , (z − z0 )n+1 (2.7.5) für irgendein R1 < ρ < R. Beweis. Im Folgenden setzen wir der notationellen Einfacheit halber z0 = 0. Der allgemeine Fall folgt durch einfache Variablentransformation. Die Idee des Beweises beruht darauf zu zeigen, dass wir f als Summe zweier Funktionen f1 und f2 darstellen können, wobei f1 (z) für |z − z0 | < R, und f2 (z) für |z − z0 | > r analytisch sind. Dazu setzen wir aber einfach Z f1 (z) = für |z| < ρ1 < R, und f2 (z) = − |w|=ρ1 1 2πi f (w)dw , w−z Z |w|=ρ2 f (w)dw , w−z (2.7.6) (2.7.7) 2.7 Weitere Reihenentwicklungen 57 für r < ρ2 < |z|. Cauchy’s Integralsatz zeigt, dass die Werte der Integrale nicht von der Wahl von ρ1 und ρ2 abhängen, soweit die Ungleichungen eingehalten sind. Die Funktionen f1 und f2 sind analytische Funktionen in den Gebieten |z| < R bzw. |z| > r. Schliesslich können wir für jedes r < |z| < R, ρ1 > |z| > ρ2 so wählen, dass Z Z f (w)dw 1 − f1 (z) + f2 (z) = . (2.7.8) 2πi |w|=ρ1 w−z |w|=ρ2 Dies ist aber das Integral längs des grösseren Kreises gefolgt vom Integral längs des inneren Kreises in umgekehrter Richtung, was (wie man durch aufschneiden sieht), äquivalent zu einem Integral über eine geschlossene Kurve die z enthält ist. Daher ist für alle |z| in dem Ring r < |z| < R die rechte Seite der Gleichung gleich f (z), wegen dem Cauchy’schen Integralsatz. Also haben wir die geünschte Darstellung = Abb. 2.3 Integrationskontur f (z) = f1 (z) = f2 (z). (2.7.9) Nun hat aber f1 eine Taylorentwicklung mit positiven Potenzen ∞ f1 (z) = ∑ Bn zn , n=0 mit Bn wie behauptet. Wir sehen, dass f2 (∞) = 0. Daher hat g(w) = f2 (1/w) eine Taylorentwicklung ohne den Term der Ordnung 0, d.h. ∞ g(w) = ∑ an wn . n=1 Dabei ist an = 1 2πi Z |w|=1/ρ g(w)dw wn+1 für 1/ρ < 1/r. Durch Variablentransformation w = 1/z erhalten wir (2.7.10) 58 2 Komplexe Integration Z |w|=1/ρ g(w)dw = wn+1 Z |z|=ρ g(1/z)(−z−2 )dz = z−n−1 Z |z|=ρ f2 (z)dz z−n+1 Setzen wir die Definition von f2 ein und verwenden wieder den Cauchy’schen Integralsatz, so finden wir Z f (z)dz 1 an = 2πi |z|=ρ z−n+1 und somit, da für n < 0, Bn = a−n , Bn = wie behauptet. t u 1 2πi Z |z|=ρ f (z)dz zn+1 Kapitel 3 Sturm-Liouville Eigenwertprobleme Wir betrachten im letzten Teil der Vorlesung nochmals Eigenwertprobleme, wie sie in der Physik sehr verbreitet vorkommen. Es gibt zahlreiche gute Darstellungen dieser Theorie, z.B. das Buch von Coddington und Levinson [4], auf das ich teilweise zurückgreife. 3.1 Definitionen Ein wichtiger Typ von Differentialgleichungen, die in der Physik wiederholt auftreten, sind Gleichungen der Form − (h(x) f 0 (x))0 + v(x) f (x) = λ w(x) f (x) (3.1.1) für x ∈ a, b ⊂ R, mit Randbedingungen, die im allgemeinen die Form cos α f (a) + sin αh(a) f 0 (a) = 0, cos β f (b) + sin β h(b) f 0 (b) = 0, (3.1.2) annehmen können, als die gesuchte Funktion f und ihre Ableitungen involvieren. Es ist angenommen, dass w(x) > 0 und h(x) > 0, für alle x ∈ (a, b). Gesucht ist eine Funktion f und ein Wert λ für den dieses Problem einen Lösung hat. Man spricht hier also von einem Eigenwertproblem, genauer von einem Eigenwertproblem von Sturm-Liouville Typ. Die einfachste Form des Problems hat die Form − f 00 (x) + v(x) f (x) = λ f (x) (3.1.3) mit Dirichlet Randbedingungen f (a) = f (b) = 0. (3.1.4) Eine Differentialgleichung der Form 3.1.3 nennt man auch Schrödingergleichung.Sie entpricht in der Quantenmechanik der zeitunabhängigen Schrödingergleichung für 59 60 3 Sturm-Liouville Eigenwertprobleme ein Teilchen, dass sich in einer Dimension in einem Intervall [a, b| unter dem Einfluss eines Potentials v bewegt. Im Fall eines konstanten Potentials kann man ein solches Problem leicht mittels Fouriertransformation lösen, im allgemeines ist das aber nicht möglich und wir benötigen eine aufwendigere Theorie. Deren Grundzüge wollen wir in diesem Kapitel erarbeiten. Grundsätzlich unterscheidet man zwei Fälle: (i) Reguläre Sturm-Liouville Probleme: Hier sind sowohl a als b endlich, d.h. wir betrachten Lösungen auf einem endlichen Intervall. Darüberhinaus haben die Koeffizientenfunkionen an den Randpunkten keine Singularitäten, d.h. v ist stetig und h sogar stetig differenzierbar, darüberhinaus haben weder p noch w Nullstellen am Rand. (ii)Singuläre Sturm-Liouville Problem: Hier ist das Intervall [a, b] undendlich, oder die Koeffizientenfunktionen haben Singularitäten an den Intervallgrenzen, oder beides. Der reguläre Fall ist naturgemäss viel einfacher, und wir werden zunächst diesen betrachten. Leider kommen in der Physik häufig auch singuläre Probleme vor. 3.1.1 Beispiele Sturm-Liouville Probleme treten in einer Vielzahl von Anwendungsgebieten auf. Es gibt mehrere hundert spezielle Typen, die besondere Namen tragen. Wir geben hier nur eine kleine Liste an. • Radiale Laplace Gleichung in Kugelkoordinaten: d 2 d r f (r) + `(` − 1) f (r) = 0 − dr dr (3.1.5) • Schrödinger Gleichung für ein-dimensionalen harmonischen Oszillator: − f 00 (x) + ω 2 x2 f (x) = E f (x). (3.1.6) • Radiale Schrödinger Gleichung für harmonischen Oszillator in d = 3: d d r2 f (r) + ω 2 r2 f (x) + `(` − 1) f (r) = λ f (x) (3.1.7) − dr dr • Radiale Schrödinger Gleichung für das Wasserstoff-Atom d = 3: c d 2 d − r f (r) + f (x) + `(` − 1) f (r) = λ f (x) dr dr r • Legendre Gleichung: (3.1.8) 3.2 Reguläre Sturm-Liouville Probleme 61 − (1 − x2 ) f 0 (x) = λ f (x). (3.1.9) ’ 3.2 Reguläre Sturm-Liouville Probleme Das wesentliche Ziel der Sturm-Liouville Theorie ist es, zu zeigen, dass sich das Problem qualitativ so ähnlich verhält, wie das Randwertproblem für die Laplacegleichung − f 00 = λ f . Der erste Schritt ist zu zeigen, dass der Sturm-Liouville Operator L≡− 1 d d v(x) h(x) + , w(x) dx dx w(x) (3.2.1) ein selbstadjungierter (symmetrischer) Operator in einem geeigneten Hilbertraum ist. Wir verstehen hier L als Abbildung auf einem Raum von Funktionen, die die Funktiion f in die Funktion (L f ) abbildet, wobei (L f )(x) = − 1 v(x) (h(x) f 0 (x))0 + f (x) w(x) w(x) ist. Das entspechende Skalarprodukt definieren wir als h f , giw ≡ Z b a f ∗ (x)g(x)w(x)dx, (3.2.2) was unserem schon aus MfPII bekannten Skalarprodukt bezüglich des Masses m(x)dx entspricht. Wir erlauben hierbei auch komplexe Funktionen einer reellen Veränderlichen. Die nächste Aussage beschreibt in welchem Sinn L selbtadjungiert ist. Theorem 3.1. Seien f , g zweimal stetig differenzierbar in (a, b) und seine sowohl die Funktionen als ihre Ableitungen und zweiten Ableitungen im Raum L2 (R, m(x)dx). f und g erfüllen darüberhinaus die Randbedingungen (3.1.2). Dann gilt h f , (Lg)iw = h(L f ), giw . (3.2.3) Beweis. Der Beweis besteht im wesentlichen in der Anwendung der Formeln für die partielle Integration. Wir haben 62 3 Sturm-Liouville Eigenwertprobleme Z b 1 v(x) w(x) f ∗ (x) − (h(x)g0 (x))0 + g(x) dx w(x) w(x) a Z b =− f ∗ (x) (h(x)g0 (x))0 + v(x)g(x) dx h f , (Lg)i = (3.2.4) a Z b = a b f ∗0 (x)(h(x)g0 (x) + f ∗ (x)v(x)g(x) dx − f ∗ (x)(h(x)g0 (x)) a Z b 1 −( f 0 (x)(h(x))0 + v(x) f (x) g(x)w(x)dx a w(x) b b + f ∗0 (x)h(x)g(x) a − f ∗ (x)(h(x)g0 (x)) a b b = h(L f )∗ , gi + f ∗0 (x)h(x)g(x) a − f ∗ (x)(h(x)g0 (x)) a . = Nun sind die Randterme ausgeschrieben b b f ∗0 (x)h(x)g(x) a − f ∗ (x)(h(x)g0 (x)) a ∗0 ∗ (3.2.5) 0 = f (b)h(b)g(b) − f (b)h(b)g (b) − f ∗0 (a)h(a)g(a) + f ∗ (a)h(a)g0 (a). Nur erlauben die Randbedingungen es, h(a) f 0 (a) durch f (a) (und genauso natürlich für den Rand b) auszudrücken, und tut man dies sieht man, dass die rechte Seite von (??) gleich Null ist. Damit ist aber die Behauptung gezeigt. t u Die Selbstadjungiertheit hat sofort eine wichtige Konsequenz: Theorem 3.2. Seien λ1 6= λ2 Eigenwerte eines regulären Sturm-Liouville Problems, und seien f1 und f2 die zugehörigen Eigenfunktionen, so gilt (i) λ1 , λ2 ∈ R; (ii) h f1 , f2 iw = 0. (3.2.6) Beweis. Der Beweis geht wie in endlichdimensionalen Vektorräumen: Zunächst ist λi∗ h fi , fi iw = hL fi , fi iw = h fi , L fi iw 0 = h fi , fi iλi , weshalb λi = λi∗ folgt. Weiter ist λ1 h f1 , f2 i = h(L f1 ), f2 i = h f1 , (L f2 )i = λ2 h1 , f2 i, weswegen die Behauptung wegwn λ1 6= λ2 folgt. t u 3.2.1 Normalform Wir wollen nun zeigen, dass wir durch eine Variablentransformation die allgemeine Sturm-Liouville Gleichung auf die Schrödinger Form vereinfachen können. Dazu 3.2 Reguläre Sturm-Liouville Probleme setzen wir z(x) ≡ 63 Z x dt a h(t) . (3.2.7) Da h nach Vorraussetzung positiv ist, ist diese eine invertierbare Funktion. Wie benutzen sie um die Variablentransformation x → z durchzuführen. Dazu setzen wir g(z(x)) = f (x), (3.2.8) g(z) = f (x(z)), (3.2.9) oder wo x(z) die Umkehrfunktion von z(x) ist. Da z0 (x) = 1/h(x), haben wir 1 dg(z(x) d f (x) = , dx h(x) dz (3.2.10) d 2 f (x) 1 d 2 g(z(x)) h0 (x) dg(z(x)) = − 2 dx h(x)2 dz2 h(x)2 dz (3.2.11) und Somit ist d 2 g(z) d 2 f (x) d f (x) = h(x)2 + h0 (x)h(x) 2 dz dx2 dx 0 0 = h(x) h(x) f (x) . (3.2.12) Also ist d 2 g(z) + v(x(z))h(x(z)) − λ w(x(z)h(x(z)) = 0, (3.2.13) dz2 wenn f die Gleichung (3.2.1) löst. Somit können wir die Lösung des allgemeinen Sturm-Liouville Problems auf den Fall − − g00 (x) +V (x)g(x) = λ µ(x)g(x) (3.2.14) zurückführen. 3.2.2 Der Sturm’sche Vergleichsatz Der wesentliche Inhalt der Sturm-Liouville Theorie beruht auf dem Vergleich des Oszillationsverhaltens von Lösungen der Gleichung (3.2.14) für verschiedene Werte von λ . Wir beschränken uns im Folgenden der Einfachheit halber auf den Schrödinger-Fall, µ(x) = 1. Zur Vorbereitung betrachten wir einige Eigenschaften des Anfangswertproblems. Lemma 3.3. Alle Lösungen der Gleichung 64 3 Sturm-Liouville Eigenwertprobleme − f 00 (x) +V (x) f (x) = λ f (x), (3.2.15) mit Anfangsbedingung fλ (a) = 0, fλ0 (a) = c, mit c 6= 0 haben die gleichen Nullstellen. Beweis. Sei gλ (a) die einzige Lösung der Gleichung mit Anfangsbedingungen gλ (a) = 0, g0λ (a) = 1. Dann ist fλ (x) = cgλ (x). Damit folgt die Behauptung trivialerweise. Lemma 3.4. Sei fλ0 Lösung der Gleichung (3.2.15) mit Anfangsbedingung fλ0 (a) = 0, und sei fλ0 (xλ0 ) = 0. Dann gibt es eine stetige Funktion x(λ ), mit x(λ0 ) = xλ0 , so dass fλ (x(λ )) = 0. Beweis. Das einfachste Argument ist, fλ (x) ist stetig in λ und zweimal differenzierbar in x. Dann kann man den Satz über implizite Funktionen verwenden um zu erhalten, dass die Lösung der Gleichung fλ (x) = 0 stetig in λ sind. Theorem 3.5 (Sturm’scher Vergleichsatz). Seien f1 , f2 Lösungen der Gleichung − fi00 (x) +V (x) fi (x) = λi fi (x) (3.2.16) die nicht identisch Null sind. Sei 1 (a) = f1 (b) = 0, und λ2 > λ1 . Dann hat f2 eine Nullstelle in (a, b). Wenn λ1 = λ2 ist und f2 (a) 6= 0, dann hat f2 ebenfalls eine Nullstelle in (a, b). Beweis. Die sogenannte Wronski-Determinante, W (x) ≡ f10 (x) f2 (x) − f1 (x) f20 (x), (3.2.17) spielt heir eine entscheidende Rolle. Es gilt nämlich wegen (3.2.16), W 0 (x) = f100 f2 (x) − f1 (x) f200 (x) (3.2.18) = (λ2 − λ1 ) f1 (x) f2 (x). Es genügt anzunehmen, dass a and b aufeinanderfolgende Nullstellen von f1 sind, und dass f1 (x) > 0, für x ∈ (a, b). Weiter können wir annehmen, dass es ein ε > 0 gibt, so dass f2 (x) > 0 für x ∈ (a, a + ε). Dann ist W (a) = f10 (a) f2 (a) ≥ 0, und wenn f2 (a) 6= 0, sogar W (a) > 0. Falls nun f2 in (a, b) nicht verschwindet, so ist f2 in diesem Intervall positiv, und somit ist W 0 (x) ≥ 0 für x ∈ (a, b), mit Gleichheit nur im Fall λ1 = λ2 . Somit ist falls λ1 6= λ2 , W (b) = (λ2 − λ1 ) Z b a f1 (x) f2 (x)dx > 0, während im Fall λ1 = λ2 , W (b) = W (a) > 0, wenn f2 (a) 6= 0. Somit ist in jedem Fall W (b) > 0, was aber unmöglich ist, da ja W (b) = f10 (b) f2 (b) und f10 (b) < 0 und 3.2 Reguläre Sturm-Liouville Probleme 65 f2 (b) > 0 nach Annahme. Damit haben wir einen Widerspruch und die Aussage des Satzes ist bewiesen. t u Wir können aus diesem Satz sofort die folgende Aussage herleiten: Korollar 3.6. Sei fλ (x) Lösung der Gleichung (3.2.16) mit fλ (a) = 0. Sei N(b, λ ) die Zahl der Nullstellen von fλ im Intervall [a, b]. Dann ist N(b, λ2 ) ≥ N(b, λ1 ), wenn λ2 > λ1 . Beweis. Der Beweis folgt sofort aus dem vorigen Satz und wird als Übung gestellt. t u Man kann die Aussage des obigen Satzes leicht verallgemeinern: Theorem 3.7. Seien f1 , f2 Lösungen der Gleichungen − (h(x) fi0 (x))0 + gi (x) fi (x)0, i = 1, 2, (3.2.19) und sei für x ∈ (a, b), g2 (x) < g1 (x). Wenn f1 (a) = 0 und f1 (b) = 0, dann hat f2 eine Nullstelle in (a, b). Beweis. Indem wir die Gleichungen (3.2.19) mit f1 bzw. f2 multiplizieren und voneinander abziehen, erhalten wir − f2 (x)(h(x) f10 (x))0 + f1 (x)(h(x) f10 (x))0 + (g1 (x) − g2 (x)) f1 (x) f2 (x) = 0. (3.2.20) Nehmen wir an, dass f2 (x) in (a, b) nicht verschwindet. Dann können wir annehmen, dass f1 und f2 in (a, b) beide positiv sind. Damit erhalten wir, dass Z b a Z b f2 (x)(h(x) f10 (x))0 − f1 (x)(h(x) f10 (x))0 dx = (g1 (x)−g2 (x)) f1 (x) f2 (x)dx > 0. a (3.2.21) Andererseits ist der Integrand auf der linken Seite der Gleichung gerade d h(x) f2 (x) f10 (x) − f1 (x) f20 (x) . dx (3.2.22) Somit ist 0 < h(b) f2 (b) f10 (b) − f1 (b) f20 (b) − h(a) f2 (a) f10 (a) − f1 (a) f20 (a) (3.2.23) = h(b) f2 (b) f10 (b) − h(a) f2 (a) f10 (a). Nun muss aber f10 (a) > 0 und f10 (b) < 0 sein, und da weiter f2 (a) ≥ 0 und f2 (b) ≥ 0 sind, führt dies zum Widerspruch. Damit ist das Lemma bewiesen. Wir können Satz 3.7 benutzen um zu zeigen, dass die Anzahl der Nullstellen N(b, λ ) nach unendlich geht, wenn λ ↑ ∞. 66 3 Sturm-Liouville Eigenwertprobleme Lemma 3.8. Mit der obigen Notation gilt, dass lim N(b, λ ) = +∞. λ ↑∞ (3.2.24) Umgekehrt gibt es ein λ0 , so dass für λ < λ0 , N(b, λ ) = 0. Beweis. Da V stetig auf [a, b], gibt est V0 < ∞, so dass V (x) ≤ V0 , für alle x ∈ [a, b]. Daher ist V (x) − λ ≤ V0 − λ , und die Lösungen der Gleichung − f 00 + (V (x) − λ ) f = 0 mit f (a) = 0 haben mehr Nullstellen in [a, b] als die Löungen der Gleichung − f 00 (x) + (V0 − λ ) f (x) = 0. (3.2.25) Die Lösungen dieser Gleichung sind aber, für λ > V0 , p λ −V0 (x − a) . fλ (x) = C sin Da diese Funktion aber für wachsendes λ beliebig viele Nullstellen in [a, b] bekommt, folgt die erste Aussage des Lemma. Die zweite Aussage folgt in völlig analoger Weise daraus, dass − f 00 − λ f = 0 für hinreichend kleine λ keine Nullstelle in (a, b] hat. t u Jetzt kommen wir zum Sturm’schen Oszillationssatz. Theorem 3.9. Seien λ0 < λ1 < λ2 < . . . die Eigenwerte des Randwertproblems mit Randbedingungen f (a) = f (b) = 0. Dann hat die Eigenfunktion fn (x) ≡ fλn (x) genau n Nullstellen in (a, b). Beweis. Betrachte zunächst den Fall n = 0. Angenommen, f0 habe eine Nullstelle, z ∈ (a, b). Dann können wir die Funktionen v1 (x) ≡ f0 (x)1Ix∈(a,z) und v2 (x) = 2 d f0 (x)1Ix∈(z,b) definieren. Mit L = − dx 2 +V (x) ist hv1 , Lv2 i = Z b a v01 (x)v02 (x) +V (x)v1 (x)v2 (x) dx = 0 (3.2.26) hvi , Lvi i = λ0 kvi k22 . Hier haben partiell integriert und benutzt, dass die Funktionen vi an der Stelle z zwar nicht differenzierbar sind, die Ableitung aber nur einen Sprung hat, und somit diese Stelle im Integral keinen Beitrag liefert. (Dies ist der Grund, warum wir diese Argument nur dann benutzen können, wenn f ein Nullstelle hat). Damit gibt es einen zweidimensionalen Unterraum in L2 in dem h f , L f i = λ0 k f k22 . Darin liegt bereits die Eigenfunktion f0 . Jetzt können wir in dem zu f0 orthogonalen Unterraum Testfunktionen finden, für die h f , L f i = λ0 k f k22 . Dann besagt das sog. Variationsprinzip, dass es in dem zu f2 orthogonalen Raum eine Eigenfunktion f−1 von L gibt mit Eigenwert λ−1 kleiner oder gleich λ0 . Die Möglichkeit 3.2 Reguläre Sturm-Liouville Probleme 67 λ−1 = λ0 fällt weg, weil alle Lösungen mit f (a) = 0 und gleichem λ Vielfache voneinander sind. Es folgt also, das es einen Eigenwert λ−1 < λ0 gibt, was im Widerspruch zur Annahme steht, dass λ0 der kleinste Eigenwert ist. Also hat f0 keine Nullstelle in (a, b). Nehmen wir an, fn habe n Nullstellen z1 < z2 < · · · < zn in (a, b). Da λn+1 > λn , muss fn+1 in jedem Intervall (zi , zi+1 ) eine Nusstelle haben, also mindestens n + 1 in (a, b). Um zu zeigen, dass fn+1 nicht mehr als n + 1 Nullstellen haben kann, geht man wie im Fall n = 0 vor: Hat fn m > n + 1 Nullstellen, so gibt es einen mdimensionalen Teilraum von L2 in dem h f , L f i = λn+1 k f k22 . Daraus folgt wieder aus dem Variationsprinzip, dass es m Eigenwerte geben muss, die kleiner oder gleich λn+1 sind. Dies steht aber im Widerspruch dazu, dass λn+1 gerade der n + 1-ste Eigenwert ist. t u Man kenn dieses Resultat auch so formulieren: Die Zahl der Eigenwerte von L die kleiner als λ sind ist gleich der Zahl der Nullstellen der Funktion fλ (x) im Intervall (a, b). Wir können diese Beobachtungen wie folgt zusammenfassen: Korollar 3.10. Das Randwertproblem aus Lemma 3.3 besitzt abzählbar undendlich viele Eigenwerte −∞ < λ0 < λ1 < . . . . Die Anzahle der Eigenwerte, die kleiner sind als E, ist gleich der Anzahl der Nullstellen der Lösungen fE aus Korollar 3.6. 3.2.3 Vollständigkeit der Eigenfunktionen Die letzte Aussage gilt auch für die allgemeine Form des regulären Sturm-Liouville Problems, was wir aber nicht im Detail nachprüfen wollen. Man findet diese z.B. in [4]. Schliesslich können wir noch zeigen, dass die Eigenfunktionen eine vollständige Basis im Hilbertraum L2 ([a, b], dx) bilden. Dazu gehen wir im wesentlichen vor wie im Fall der Fourierreihen. Zunächst zeigen wir, dass glatte Funktionen, die die Randbedingungen erfüllen, gut approximiert werden. Theorem 3.11. Seien φi , i = 0, 1, 2, 3, . . . normierten Eigenfunktionen des Problems (3.3). (i) Sei f ∈ C2 ([a, b] zweimal stetig differenzierbar. Dann gilt ∞ f (x) = ∑ h f , φn iφn (x), (3.2.27) n=0 für alle x ∈ [a, b], und die Reihe konvergiert gleichmässig in [a, b]. (ii)Die Funktionen φn bilden eine Basis des Hilbertraums L2 ([a, b], dx). Beweis. Wir erinnern uns zunächst daran, dass für jede Funktion f ∈ L2 ([a, b], dx) gilt, dass für jedes m ∈ N, 68 3 Sturm-Liouville Eigenwertprobleme m ∑ h f , φk i2 ≤ k f k22 . (3.2.28) k=0 Wir nehmen im Folgenden ohne Beschränkung der Allgemeinheit an, dass die Eid2 genwerte unseres Problems alle strikt positiv sind . Wir schreiben L ≡ − dx 2 +V (x). Dann hat die inhomogene Gleichung L f (x) = u(x), (3.2.29) eine eindeutige Lösung, die mit Hilfe der Methode der Variation der Konstanten gezeigt werden kann. Wir haben nämlich: Lemma 3.12. Seien ψ1 (x), ψ2 (x) Lösungen der Gleichung Lψi = 0 mit ψ1 (a) = ψ2 (b) = 0. Es sei 0 kein Eigenwert von L. Dann hat (3.2.29) eine eindeutige Lösung, die in folgender Form dargestellt werden kann: Z b f (x) = ψ1 (x) x ψ2 (y) g(y)dy + ψ2 (x) W (ψ1 , ψ2 )(y) Z x a ψ1 (y) g(y)dy. (3.2.30) W (ψ1 , ψ2 )(y) Beweis. Der Beweis des Lemmas ist elementar. Zunächst beachten wir, dass W (ψ1 , ψ2 )(y) eine Konstante ist die gar nich von y abhängt, wie wir schon gesehen haben. Dann ist Z b d2 ψ2 (y) ψ1 (x) g(y)dy dx2 x W (ψ1 , ψ2 )(y) Z b d ψ2 (x) ψ2 (y) 0 = ψ1 (x) g(y)dy − ψ1 (x) g(x) dx W (ψ1 , ψ2 )(x) x W (ψ1 , ψ2 )(y) Z b ψ2 (y) ψ2 (x) = ψ100 (x) g(y)dy − 2ψ10 (x) g(x) W (ψ , ψ )(y) W (ψ x 1 2 1 , ψ2 )(x) ψ20 (x) ψ2 (x) g(x) + ψ1 (x) g0 (x). −ψ1 (x) W (ψ1 , ψ2 )(x) W (ψ1 , ψ2 )(x) Daher ist Z b x ψ2 (y) ψ1 (y) g(y)dy + ψ200 (x) g(y)dy W (ψ , ψ )(y) W (ψ x a 1 2 1 , ψ2 )(y) ψ2 (x) ψ1 (x) − ψ10 (x) g(x) + ψ20 (x) g(x)dy W (ψ1 , ψ2 )(x) W (ψ1 , ψ2 )(x) Z b Z x ψ1 (y) ψ2 (y) = ψ100 (x) g(y)dy + ψ200 (x) g(y)dy − g(x) W (ψ , ψ )(y) W (ψ x a 1 2 1 , ψ2 )(y) f 00 (x) = ψ100 (x) Z weshalb L f (x) = g(x). Ausserdem überprüft man leicht, dass die Randbedingungen für f erfüllt sind. t u Das Lemma liefert eine Darstellung von f in der Form 3.2 Reguläre Sturm-Liouville Probleme 69 Z b f (x) = G(x, y)g(y)dy, (3.2.31) a wo ( G(x, y) = ψ1 (x)ψ2 (y) W (ψ1 ,ψ2 )(y) , ψ2 (x)ψ1 (y) W (ψ1 ,ψ2 )(y) , wenn x < y, wenn x ≥ y (3.2.32) Die Funktion G(x, y) heisst Green’sche Funktion. Natürlich können wir auch schreiben Z b f (x) = (L−1 u)(x) ≡ G(x, y)u(y)dy. a und L−1 ist der inverse Operator zum Operator L. Wegen der Selbstadjungiertheit von L ist G symmetrisch, also G(x, y) = G(y, x). Da LL−1 f = f , gilt insbesondere, dass L−1 φk = λk−1 φk , was man einfach sieht, indem man L auf beide Seiten anwendet. Insbesondere ist also Z b a G(x, y)φk (y) = λk−1 φk (x). Also ist auch, für alle m, m m k=0 k=0 m ∑ λk−2 φk (x)2 = ∑ (G(x, y)φk (y))2 = ≤ (3.2.33) ∑ hG(x, ·), φk i2 k=0 Z b dyG(x, y)2 , a wo wir die Ungleichung (3.2.28) benutzt haben. Nach Integrationüber x erhalten wir m ∑ λk−2 ≤ k=0 Z b Z b dx a a dyG(x, y)2 ≤ (b − a)2 γ 2 , (3.2.34) mit γ ≡ sup(x,y∈[a,b] |G(x, y)|. Insbesondere strebt λk−1 gegen Null. Nun setzen wir m−1 Gm (x, y) ≡ G(x, y) − ∑ λk−1 φk (x)φk (y), (3.2.35) k=0 und wir bezeichnen mit Gm den zugehörigen Integraloperator. Wir setzen für einen Operator A auf unserem Hilbertraum kAk ≡ sup u∈L2 :kuk2 =1 kAuk2 . (3.2.36) 70 3 Sturm-Liouville Eigenwertprobleme kAk heisst die Norm des Operators A. Man kann leicht zeigen, dass für selbstadjungierte Operatoren gilt, dass kAk ≡ sup u∈L2 :kuk2 =1 |hu, Aui|. (3.2.37) Damit ist insbesondere kAk der grösste Eigenwert von A; das bedeutet für unseren Operator L−1 , dass (wir nehmen an dass λ0 > 0) kL−1 k = λ0−1 , und es folgt, dass kGm k = λm−1 . Daher gilt m−1 −1 lim L f − ∑ λk−1 h f , φk iφk = 0. m↑∞ k=0 (3.2.38) Andererseits konvergiert die Reihe ∞ ∑ λk−1 h f , φk iφk (x) (3.2.39) k=0 nicht nur in L2 sondern auch uniform: Dies folgt daraus, dass für jedes m, n, n ∑ k=m λk−1 h f , φk iφk (x) = n ∑ L−1 (h f , φk iφk (x)) k=m Z b = n ∑ h f , φk iφk (y)dy. G(y, x) a k=m Daher ist wegen der Cauchy-Schwartz Ungleichung Z b n n ∑ λk−1 h f , φk iφk (x) ≤ G(x, y) ∑ h f , φk iφk (y)dy a k=m k=m Z b ≤ G(x, y)2 dy a Z b = (3.2.40) Z b a n G(x, y) dy a !2 ∑ h f , φk iφk (z) 1/2 dz k=m !!1/2 n 2 (3.2.41) 2 ∑ h f , φk i k=m s n √ ≤ γ b − a ∑ h f , φk i2 , k=m wobei wir im letzten Schritt die Orthonormalität der φk und die Ungleichung Rb G(x, y)2 dy ≤ γ 2 (b − a) ausgenutzt haben. Da die rechte Seite mit m, n ↑ ∞ gea 3.2 Reguläre Sturm-Liouville Probleme 71 gen Null strebt, und die Schranke von x unabhängig ist, folgt die gleichmässige Konvergenz der Reihe (3.2.39). Insbesondere stellt die Reihe eine stetige Funktion dar. Darau und aus (3.2.38) folgt aber, dass diese Funktion gerade L−1 f ist. Schliesslich ist für jede zweimal stetig differenzierbare Funktion g, die die Randbedingungn erfüllt Lg ≡ f stetig, und es gilt f = L−1 g. Wir haben gezeigt, dass ∞ f (x) = ∑ λk−1 hg, φk iφk (x) (3.2.42) k=0 ∞ = ∑ λk−1 hL f , φk iφk (x) k=0 ∞ = ∑ h f , φk iφk (x), k=0 mit gleichförmiger Konvergenz, wie gewünscht. Die Vollständigkeit des Funktionensystems im Hilbertraum L2 folgt dann wie im Fall der Fourierreihen weil die oben betrachteten Funktionen in diesem Raum dicht liegen. t u Der obige Beweis lieftert auch eine Darstellung der Green’schen Funktion wie wir sie schon von den Fourierreihen kennen: ∞ G(x, y) = ∑ λk−1 φk (x)φk (y). (3.2.43) k=0 Aus der Aussage des letzten Satzes kann man auch das im Beweis von Theorem 3.9 verwendete Variationsprinzip herleiten. Es folgt nämlich, dass wenn f ∈ L2 eine Funktion ist, so dass h f , L f i = λ k f k22 , dann konvergiert die Reihe ∞ ∑ h f , φn iφn n=0 in der L2 Norm gegen f . Insbesondere ist dass ∞ h f,L f i = λn k f k22 . ∑ λn h f , φn i2 ≥ inf n n=0 Daraus folgt, dass infn λn ≤ λ , was das Variationsprinzip ist. Wenn man zusätzlich noch darauf besteht, dass f zu gewissen Eigenfunktionen orthogonal ist, so fallen die zugehörigen Eigenwerte in dem Infimum weg, und man erhält die entsprechenden Aussagen für Unterräume. 72 3 Sturm-Liouville Eigenwertprobleme 3.2.3.1 Resolvente und Spektrum Wir haben im Beweis des obigen Satzes den Lösungsoperator L−1 kennengelernt. Wir können dieses Konzept verallgemeinern, indem wir die sogenannte Resolvente, Rλ ≡ (L − λ )−1 , einführen. Für einen gegebenen Sturm-Liouville Operator L (mit spezifizierten Randbedingungen) ist dies nichts anderes als der Operator, der einer Funktion u die Lösung, f = Rλ u, der Gleichung (L − λ ) f (x) = u(x) mit den entsprechenden Randbedingungen zuordnet, sofern diese Gleichung eine eindeutige Lösung besitzt. In völliger Analogie zum vorher betrachteten Fall wissen wir, dass dies genau dann der Fall ist, wenn λ kein Eigenwert des Randwertproblems ist. Man sagt: Definition 3.13. Die Resolventenmenge ist die Menge aller λ ∈ C, so dass Rλ ein beschränkter Operator ist. Das Komplement der Resolventenmenge in C heisst das Spektrum von L (mit gegebenen Randbedingungen). Man kann unter sehr allgemeinen Annahmen zeigen, dass die Resolventenmenge stets eine offene Menge ist. Für den Fall regulärer Sturm-Liouville Operatoren haben wir gerade gezeigt, dass das Spektrum eine abzählbar unendliche, nach unten beschränkte Teilmenge von R ist. Man sagt in diesem Fall, der Operator L habe diskretes Spektrum oder reines Punktspektrum. . Die Aussage des vorhergehenden Satzes ist dann eine spezielle Form des Spektralsatzes: Wenn ein selbstadjugierter Operator auf einem Hilbertraum ein reines Punktspektrum besitzt, so bilden seine Eigenfunktionen eine vollständiges Orthorgonalsystem (oder eine Orthogonalbasis) des Hilbertraums. 3.3 Singuläre Sturm-Liouville Probleme In der Physik treten sehr häufig Sturm-Liouville Probleme auf, die nicht in die Klasse der regulären Probleme fallen. Insbesondere sind wir häufig mit Eigenwertproblemen auf unendlichen Intervallen, also R oder R+ konfrontiert. Letzteres ist e.g. der Fall für die radiale Schrödingergleichung. Hier stellt sich dann die Frage, was die Rolle von Randbedingungen übernimmt, da wir bei undendlich schlecht eine Funktionswert fordern können. Aus physikalischen Gründen werden Randbedingungen z.B. in der Quantenmechanik durch Integrabilitätsbedingungen ersetz, d.h. man sucht etwa nach Lösungen der Schrödingergleichung im Raum L2 der quadratisch integrablen Funktionen. 3.3 Singuläre Sturm-Liouville Probleme 73 3.3.1 Motivierendes Beispiel: Laplace Gleichung Um eine Idee davon zu bekommen, was im singulären Fall zu erwarten ist, betrachten wir den einfachen Fall der Gleichung − f 00 (x) = λ f (x), f (0) = 0. x ∈ (0, ∞) (3.3.1) Wir wollen versuchen, dieses Problem als den Grenzfall der Probleme − f 00 (x) = λ f (x), f (0) = 0, x ∈ (0, b) (3.3.2) f (b) = 0, aufzufasssen, wenn b ↑ ∞. Nun wissen wir schon, dass die normierten Eigenfunktionen des letzteren Problems gegeben sind durch r 2 kπx φk (x) = sin , b b 2 mit k = 0, 1, 2, . . . , die Eigenwerte sind alse λk= kπx . b Sei nun f eine Funktion auf R+ , die kompakten Träger hat, d.h. es gibt ein c < ∞, so dass für alle x ≥ c, f (x) = 0. Dann ist Wir setzen g(t) ≡ Z ∞ sin(tx) f (x)dx. 0 Für alle b ≥ c ist dann aber r Z b g(kπ/b) = sin(kπx/b) f (x)dx = 0 b hφk , f i 2 gerade der k-te Fourierkoefizient des Problems (3.3.2). Die Vollständigkeitsrelation besagt nun, dass Z ∞ 0 | f (x)|2 dx = Z b 0 | f (x)|2 dx = 2 ∞ ∑ |g(kπ/b)|2 , b k=1 (3.3.3) für alle b > c. Nun können wir die letzte Gleichung auch als Integral darstellen, wenn wir die Stufenfunktionen ρb (x) einführen, die be Null starten und an den Stellen kπ/b jeweils um 2/b springen. Dann ist nämlich (3.3.3) Z ∞ 0 | f (x)|2 dx = Z ∞ 0 |g(t)|2 dρb (t). (3.3.4) Wenn b ↑ ∞, so konvergiert ρb (t) → ρ(t) ≡ π2 t, punktweise, und wir erhalten 74 3 Sturm-Liouville Eigenwertprobleme Z ∞ 0 | f (x)|2 dx = Z ∞ 0 |g(t)|2 dρ(x) = 2 π Z ∞ 0 |g(t)|2 dt (3.3.5) Die letztere Gleichung gilt nun für alle Funktionen mit beschränktem Träger, und weil diese dicht in L2 liegen, für alle f ∈ L2 . Es ist die schon bekannte Vollständigkeitsrelation für die (einseitige) Fouriertransformation (PlancherelRelation). Wir können die Funktionen sintx, für t ∈ R+ als verallgemeinerte Eigenfunktionen unseres Randwertproblems (3.3.1) auffassen, und alle Werte λ ∈ R+ als verallgemeinerte Eigenwerte, R+ dementsprecend als das (kontinuierliche) Spektrum. Das Spektrum ist die Menge der Werte λ , an denen die Funtktion ρ(λ ) ≡ limb↑∞ ρb (λ ) wächst. In unserem Fall ist das also gerade die Menge [0, ∞). Tatsächlich können wir dies auch wie folgt charakterisieren: Das Spektrum des Problems (3.3.1) sind alle Werte λ ∈ C für die es Lösungen gibt, die nicht expo00 nentiell wachsen. Denn wir wissen √ ja schon, dass alle Lösungen von − f = λ f Linearkombinationen von exp(± λ x) sind (ausser für λ = 0, wo wir stattdessen 1 und √ x haben). Damit √ auch f (0) = 0 gilt, bleiben nur noch die Vielfachen von exp( λ x) − exp(− λ x). Ausser für λ ∈ R+ wachsen diese stets exponentiel an. 3.3.2 Sturm-Liouville Probleme auf der Halbachse Unser Ziel ist es, den oben angegebenen Zugang zu verallgemeinern. Wir betrachten das Problem L f (x) = λ f (x), sin α f (0) − cos α f 0 (0) = 0. x ∈ R+ , (3.3.6) Der Einfachheit wollen wir annehmen, dass L ein Schrödingeroprator ist. Alle Resutlte gelten aber auch für den allgemeinen Fall. Im folgenden wird es sehr nützlich sein, λ als komplexe Zahl, und somit auch die Lösung f als komplexwertige Lösung aufzufassen. Zunächst beginnen wir mit einer Fallunterscheidung. Definition 3.14. Wenn würR einen Wert λ0 ∈ C jede Lösung der Gleichung L f = λ0 f quadratintegrabel ist, also 0∞ | f (x)|2 dx < ∞, so sagen wir, dass L vom Limes-KreisTyp bei Unendlich ist. Andernfalls ist er von Limes-Punkt-Typ. Die Definition scheint merkwürdig, da eine Eingenschaft nur für einen Wert von λ0 gefordert wird. Das nächste überraschende Resultat erklärt dies. Theorem 3.15. Falls für ein λ0 ∈ C jede Lösung von L f = λ0 f quadratintegrabel ist, so gilt dies für alle λ ∈ C. Beweis. Seien φ und ψ zwei orthonormale Lösungen von L f = λ0 f . Sei g eine Lösung von Lg = λ g = λ0 g + (λ − λ0 )g. 3.3 Singuläre Sturm-Liouville Probleme 75 Indem wir den Term (λ − λ0 )g als gegebene Inhomogenität auffassen, können wir so tun als suchten wir die Lösung der inhomogenen Gleichung L f − λ f = (λ − λ0 )g, die wir mittels der Methode der Variation der Konstanten durch die Lösungen φ und ψ der homogenen Gleichung erhalten, nämlich g(x) = c1 φ (x) + c2 ψ(x) + (λ − λ0 ) Z x c (φ (x)ψ(y) − φ (y)ψ(x)) g(y)dy. mit Konstanten c, c1 , c2 , wobei c beleibig gewählt werden kann (wovon dann c1 , c2 abhängen. Wir benutzen die Abkürzung rZ x k f k2,c ≡ | f (y)|2 dy. c pR ∞ pR ∞ 2 2 Wir setzen M = max c |φ (y)| dy, c |ψ(y)| dy . Beachte, dass wir M so klein machen können, wie wir wollen, indem wir c gross genug wählen. Es folgt dann mit der Dreiecks und Cauchy-Schwartz Ungleichung, dass kgk2,c ≤ (c1 + c2 )M + 2|λ − λ0 |M 2 kgk2,c . Jetzt möchten wir diese Ungleichung nach kgk2,c auflösen: dazu wählen wir c so, dass 2|λ − λ0 |M 2 ≤ 12. Es folgt kgk2,c ≤ 2(c1 + c2 )M. Die rechte Seite hängt nicht von x ab, also folgt, indem wir x nach unendlich schicken, rZ ∞ |g(y)|2 dy ≤ 2(c1 + c2 )M, c und somit kgk2 < ∞. t u Wir werden nun sehen, was es mit den Bezeichnungen Limespunkt und Limeskreis auf sich hat. Betrachten wir dazu zunächst zwei linear unabhängige Lösungen von L f = λ φ , ψ, die die Anfangsbedingungen φ (0, λ ) = sin α, 0 φ (0, λ ) = − cos α, ψ(0, λ ) = cos α (3.3.7) 0 ψ (0, λ ) = sin α erfüllen. Es gilt, dass W (φ , ψ)(0) = 1, und damit W (φ , ψ)(x) = 1 für alle x ≥ 0. Die Funktionen sind stetig differenzierbar und als Funktionen vom λ analytisch. Sie erfüllen bei 0 die Randbedingungen 76 3 Sturm-Liouville Eigenwertprobleme cos αφ (0, λ ) + sin αφ 0 (0, λ ) = 0 (3.3.8) 0 sin αψ(0, λ ) − cos αψ (0, λ ) = 0. Jede andere Lösung von L f = λ f ist, bis auf Vielfache, von der Form χ(x, λ ) = φ (x, λ ) + m(λ )ψ(x, λ ). (3.3.9) Wir wollen nun bei b > 0 eine Randbedingung cos β χ(b, λ ) + sin β χ 0 (b, λ ) = 0 (3.3.10) fordern. Diese kann als Bedingung für m(λ ) aufgelöst werden. m(λ ) = − cot β φ (b, λ ) + φ 0 (b, λ ) . cot β ψ(b, λ ) + ψ 0 (b, λ ) (3.3.11) m is nunmehr eine Funktion von b, β , λ , und als Funktion von λ meromorph. Für reelle λ ist m reell. Nun durchläuft z ≡ cot β mit β die reelle Achse. Dann ist aber für gegebenes b, λ m als Funktion von z eine Möbiustransformation, und wir wissen deshablb, dass das Bild der reellen Achse ein Kreis in der komplexen Ebene ist. Wir nennen diesen Kreis Cb . Es sei im Folgenden ℑλ > 0. Man kann die Gleichung für diesen Kreis in der Form W (χ, χ ∗ )(b) = 0 (3.3.12) ausdrücken. Eine längere Rechnung, die wir hier nicht vorstellen wollen, zeigt, dass dieser Kreis dem Mittelpunkt W (φ , ψ ∗ )(b) W (ψ, ψ ∗ )(b) (3.3.13) 1 |W (ψ, ψ ∗ )(b)| (3.3.14) cb = − und Radius rb = hat. Nun ist ψ ∗ (x, λ ) = ψ(x, λ ∗ ), und daher gilt d W (ψ, ψ ∗ )(x) = (λ − λ ∗ )ψ(x, λ )ψ ∗ (x, λ ), dx (3.3.15) und somit, da weiterhin W (ψ, ψ ∗ )(0) = 0, W (ψ, ψ ∗ )(b) = 2iℑλ Z b 0 |ψ(x, λ )|2 dx. (3.3.16) Hier sehen wir, den Zusammenhang zwischen dem Verhalten der Norm von ψ und rb , wenn b → ∞. Im Fall des Grenzkreises ist ist jedenfalls kψk2 < ∞, und somit limb→∞ rb > 0. 3.3 Singuläre Sturm-Liouville Probleme 77 Man kann nun ebenfalls zeigen, dass die Kreise Cb für wachsendes b inneinander liegen. Damit gibt es genau zwei Fälle: • Cb → C∞ mit r∞ > 0, oder • Cb → c∞ , wo c∞ ein Punkt ist. Im ersten Fall wissen wir schon, dass ψ ∈ L2 ist. Nun ist weiter W (χ, χ ∗ )(b) = 2iℑm Z b 0 |χ(x, λ )|2 dx +W (χ, χ ∗ )(0), Da W (χ, χ ∗ )(0) = −2iℑλ , und W (χ, χ ∗ )(b) = 0 wenn χ die Randbedingung erfült,so folgt, dass Z b ℑm |χ(x, λ )|2 dx = , (3.3.17) ℑλ 0 und es ist insbesondere wegen ℑλ 6= 0, kχk2 < ∞. Man kann zeigen, dass für m, die W (χ,χ ∗ )(b) ∗ im Inneren des Kreises Cb liegen, W (ψ,ψ ∗ )(b) < 0. Die Gleichung W (χ, χ ) = 0 ist nämlich ausgeschrieben F(m, m∗ ) ≡ W (φ , φ ∗ ) + m∗W (φ , ψ ∗ ) + mW (ψ, φ ∗ ) + mm∗W (ψ, ψ ∗ ) = 0. Beachte dass stets W ( f , f ∗ ) rein imaginär ist, und auch die beiden mittleren Terme rein imaginär sind. Die rein imaginäre quadratische Funktion von m auf der linken Seite strebt also, wenn |m|2 ↑ ∞ nach ∞W (ψ, ψ ∗ ). Daher trennt der Kreis F(m, m∗ ) = 0 gerade die Gebiete wo F(m, m∗ )/W (ψ, ψ ∗ ) positiv bzw. negative sind, und der negative Bereich ist das Innere des Kreises. Somit gilt für solche χ, Z b 0 |χ(x, λ )|2 dx ≤ ℑm . ℑλ Nehmen wir nun m so dass m im Innern aller Kreise Cb , liegt, bzw. m = c∞ im Limespunktfall, so gilt diese Ungleichung für jedes b, und mithin gilt kχk22 ≤ ℑm < ∞. ℑλ Somit haben wir also in jedem Fall für ℑλ > 0 eine Lösung in L2 , und im Fall des Limeskreises sogar 2. Wir haben also gezeigt: Theorem 3.16. Sei ℑλ 6= 0 und seien φ , ψ, χ wie oben. Dann erfüllt χ eine reelle Randbedingung der Form (3.3.10) genau dann wenn m auf dem Kreis Cb der durch die Gleichung W (χ, χ ∗ )(b) = 0 beschrieben ist. Wenn b ↑ ∞, so konvergiert Cb entweder zu einem Grenzkreis C∞ oder zu einem Punkt c∞ . Im ersten Fall sind alle Lösungen von L f = λ f in L2 , und im zweiten Fall ist genau eine Lösung in L2 falls ℑλ 6= 0. 78 3 Sturm-Liouville Eigenwertprobleme Wir können nun die Green’sche Funktion für das Randwertproblem L f (x) = λ f (x), 0 sin α f (0) − cos α f (0) = 0, x ∈ (0, b), (3.3.18) cos β f (b) + sin β f 0 (b) = 0, angeben, nämlich ( ψ(x, λ ) (φ (y, λ ) + m(λ , b, β )ψ(y, λ )) , wenn x ≤ y G(x, y; λ ) = ψ(y, λ ) (φ (x, λ ) + m(λ , b, β )ψ(x, λ )) , wenn x > y. (3.3.19) Wir sehen nun, dass im Fall des Grenzpunktes m und somit G(x, y; λ ) konvergiert und zwar zu ( ψ(x, λ ) (φ (y, λ ) + c∞ (λ )ψ(y, λ )) , wenn x ≤ y (3.3.20) G(x, y; λ ) = ψ(y, λ ) (φ (x, λ ) + c∞ (λ )ψ(x, λ )) , wenn x > y. Für nicht-reelle Werte von λ ist G(x, y; λ ) quadratintegrabel in jeder der beiden Variablen x und y, nicht aber notwendig bezüglich beider gleichzeitig. Beispiel: Wir wollen zu unserem einfachen Beispiel − f 00 = λ f zurückkommen. Wir setzen λ = ω 2 und ω = v + iu. Betrachte weiter den Fall α = 0. Hier ist φ (x) = − sin(ωx) , ω ψ(x) = cos(ωx). Für m erhalten wir also den Ausdruck m=− 1 − cot β sin(ωb) − ω cos(ωb) . ω cot β cos(ωb) − ω sin(ωb) Für b ↑ ∞ und u > 0 haben wir cos(b(v + iu)) ∼ 1 exp(−ivb + bu), 2 sin(b(v + iu)) ∼ i exp(−ivb + bu) 2 und damit m∼ 1 i cot β exp(−ivb + bu) + ω exp(−ivb + bu) ∼ i/ω, ω cot β exp(−ivb + bu) − ωi exp(−ivb + bu) das heisst wir sind im Limespunktfall. Für die Funktion χ erhalten wir im Grenzwert b↑∞ χ(x, λ , ∞) = ω −1 (− sin(ωx) + i cos(ωx)) = i exp(iωx). Diese Funktion ist in der Tat die einzige (bis auf Vielfache) quadratintegrable Lösung der Gleichung (für u > 0). Andererseits haben wir 3.3 Singuläre Sturm-Liouville Probleme 79 χ 0 (0, λ , ∞) = −1. χ(0, λ , ∞) = i/ω, Damit erfüllt χ be Null keine reelle Randbedingung, in Übereinstimmung mit unserem allgemeinen Resultat, dass die Wronski-Determinante W (χ, χ ∗ )(0) 6= 0. Die Green’sche Funktion ist also ( cos(ωx) (− sin(ωy) + i cos(ωy)) /ω, wenn x ≤ y G(x, y; λ ) = cos(ωy) (− sin(ωx) + i cos(ωx)) /ω, wenn x > y. Nun ist aber − sin(ωy) + i cos(ωy) = i exp(iωy), was für ℑω > 0 integrabel ist. Die Green’sche Funktion ist daher stets L2 wenn ω nicht reell ist, also für alle λ 6∈ R+ . Wir finden also wieder, dass das Spektrum des Laplaceoperators auf der Halbachse die positiven reellen Zahlen sind. In fasst allen praktischen Anwendungen finden wir uns im Limespunktfall. Dies zeigt zum Beispiel folgender Satz, den ich nicht beweisen werde. 2 d 2 Theorem 3.17. Sei L = − dx 2 + V (x) auf R+ und sei V (x) ≥ −Cx für ein C > 0. Dann ist L im Limes-Punkt-Typ. 3.3.3 Vollständigkeit und verallgemeinerte Fouriertransformation im Limespunktfall Wir wollen nun zeigen, dass im Limespunktfall eine Darstellung der Green’schen Funktion analog zu (3.3.5) gilt. Wir betrachten wieder das Randwertproblem (3.3.18) auf dem endlichen Intervall (0, b). Wir wissen, dass es eine unendliche Folge von Eigenwerten λn,b und zugehörigen Eigenfunktionen en,b gibt. Seien ψ, φ wieder wie oben definiert. Da ψ die Randbedingung bei Null erfüllt, müssen die Eigenfunktionen Vielfache davon sein, also en,b (x) = rn,b ψ(x, λn,b ). (3.3.21) Für jede stetige Funktion f mit kompaktem Träger gilt dann, dass für hinreichend grosses b, Z ∞ 0 Z b 2 | f (x)| dx = ∑ |rn,b | f (x)ψ(x, λn,b )dx (3.3.22) | f (x)| dx = 0 0 n=0 Z ∞ 2 ∞ 2 = ∑ |rn,b | f (x)ψ(x, λn,b )dx . 2 Z b n=0 ∞ 2 2 0 Nun sei wieder ρb (x) eine Stufenfunktion, die and den Stellen λn,b um den Wert |bn,b |2 springt. Sei weiter 80 3 Sturm-Liouville Eigenwertprobleme g(λ ) ≡ Z ∞ f (x)ψ(x, λ )dx. (3.3.23) 0 Dann können wir (3.3.22) schreiben als Z ∞ 0 Z ∞ | f (x)|2 dx = −∞ |g(λ )|2 dρb (λ ). (3.3.24) Wenn wir zeigen können, dass ρb gegen eine nichtfallende Funktion ρ konvergiert, wenn b ↑ ∞, dann erhalten wir die gewünschte Vollständigkeitrelation Z ∞ 0 | f (x)|2 dx = Z ∞ −∞ |g(λ )|2 dρ(λ ), (3.3.25) zunächst für alle Funktionen f mit kompaktem Träger und dann durch ein einfaches Approxiationsargument für alle Funktionen in L2 . Die Funktion ρ heisst dann die Spektralfunktion bzw. das Spektralmass von L. Die Funktionen ψ(x, λ ), für λ an Stellen wo ρ wächst heissen verallgemeinerte Eigenfunktionen von L. Für den Fall, dass ρ an der Stelle λ einen Sprung hat, ist ψ(x, λ ) eine echte Eigenfunktion von L und liegt in L2 . In der Tat gilt folgender Satz. Theorem 3.18. Sei L im Limespunktfall. Dann gilt folgendes: (i) Es gibt eine nicht-fallende Funktion ρ auf R so dass ρ(λ ) − ρ(µ) = lim (ρb (λ ) − ρb (µ)) , b↑∞ (3.3.26) für alle Punkte λ , µ an denen ρ stetig ist. (ii)Für jedes f ∈ L2 (R+ , dx) gibt es eine Funktions g(λ ) ∈ L2 (R, dρ(x)), so dass Z ∞ g(λ ) − lim a↑∞ −∞ Z a 0 2 f (x)ψ(x, λ )dx dρ(λ ) = 0; (3.3.27) 2 g(λ )ψ(x, λ )dρ(λ ) dx = 0, (3.3.28) (iii) lim Z ∞ a,b→∞ 0 f (x) − Z b −a d.h. die Umkehrformel Z ∞ f (x) = −∞ g(λ )ψ(x, λ )dρ(λ ) gilt im L2 -Sinn. (iv)Wenn c∞ (λ ) der Limespunkt ist, so gilt ρ(λ ) − ρ(µ) = lim ε↓0 1 π Z λ ℑc∞ (ν + iε)dν, µ an allen Stetigkeitstellen von ρ. Umgekehrt ist (3.3.29) 3.3 Singuläre Sturm-Liouville Probleme c∞ (l) − c∞ (l0 ) = 81 Z ∞ 1 λ −l −∞ − 1 λ − l0 dρ(λ ). Beweis. Der Beweis dieses Satzes wurde in der Vorlesung nicht mehr behandelt. Ich gebe hier eine gekürzte Version des Beweises, wie er sich in [4]) findet. Wir werden zwei Lemmata aus der Analysis benutzen. Lemma 3.19. Seien hn : R → R eine Familie von nicht-fallenden Funktionen, und H → R+ eine nichtfallende stetige und nicht-negative Funktion, so dass für alle y ∈ R, |h(y)| ≤ H(y). Dann existiert einen Folge nk ↑ ∞ und eine nicht-fallende Funktion h, so dass lim hnk (y) = h(y), k↑∞ für alle y ∈ R. Lemma 3.20. Sei hn eine Folge nicht-fallender Funktionen, die gleichmässig beschränkt ist und die punktweise gegen eine nicht-fallende Funktion h konvergiert. Dann gilt für jedes endliche Interval (a, b) und jede stetige Funktion f , dass Z b lim n↑∞ a Z b f (y)dhn (y) = f (y)dh(y). a Wir kommen nun zu dem eigentlichen Beweis. Wir fixieren wieder b < ∞, und wir wählen mb (λ ) auf dem Kreis Cb (λ ). Wir setzten χb = φ + mb (λ )ψ wie früher beschrieben. Jetzt können wir die Vollsatändigkeitsrelation für diese Funktion benutzen und wir erhalten 2 Z b Z b ∞ 2 2 (3.3.30) |χb (x)| dx = ∑ |rn,b | ξb (x)ψ(x, λn.b )dx . 0 n=0 0 Andererseit erhalten wir W (χb , ψ(·, λn,b )∗ )(b) −W (χb , ψ(·, λn,b )∗ )(0) = (λ − λn,b ) Z b 0 χb (x)ψ(x, λn,b )dt. (3.3.31) Nur erfüllen aber χb und ψ(·, λn,b ) dieselben Randbedingungen bei b, so dass W (χb , ψ(·, λn,b )∗ )(b) = 0. Da ausserdem W (χb , ψ(·, λn,b )∗ )(0) = 1, folgt dass Z b 0 χb (x)ψ(x, λn,b )dt = 1 . λn,b − λ Wenn wir dies in (3.3.30) einsetzen und die Definition der Funktion ρb benutzen, so erhalten wir Z b Z ∞ dρb (k) |χb (x)|2 dx = . (3.3.32) 2 0 −∞ |λ − k| 82 3 Sturm-Liouville Eigenwertprobleme Nun ist andererseits, für ℑ(λ ) > 0, Z b 0 so dass |χb (x)|2 dx = Z ∞ dρb (k) 2 −∞ |λ − k| = ℑ(mb (λ ) , ℑ(λ ) ℑ(mb (λ ) . ℑ(λ ) (3.3.33) Nun sind ja die Kreise Cb alle ineinader enthlaten, und also insbesondere, gibte es K < ∞, so dass, für alle b > 1, ℑ(mb (i)) ≤ K. Dann haben wir aber, indem wir λ = i wählen, dass Z ∞ dρb (k) ≤ K. (3.3.34) 2 −∞ k + 1 Damit gilt auch, für jedes ν > 0, dass Z ν −ν dρb (k) ≤ k(1 + ν 2 ). (3.3.35) WIr bemerken noch, dass in der Definition der Funktion ρb ohne Effekt eine Konstante addiert werden kann. Wir können also ρb (0) = 0 festlegen. Dann ist |ρb (k)| ≤ K(1 + k2 ), für alle k ∈ R. Daher können wir wegen Lemma 3.19 Folgen bn und geeignete β = βn finden, so dass ρbn → ρ, für eine nichtfallende Funktion ρ. Nun sei f eine zweimal stetig differenzierbare Funktion, die bei 0 verschwindet und die kompakten Träger hat. Dann gilt zunächst Z ∞ 0 Z ∞ Z ∞ 2 |L f (x)| dx = −∞ 0 2 (L f )(x)ψ(x, k)dx dρb (k). (3.3.36) Andererseit gilt wegen der Selbstadjungiertheit von L, Z ∞ Z ∞ (L f )(x)ψ(x, k)dx = k 0 f (x)ψ(x, k)dx = kg(k), (3.3.37) 0 also Z ∞ 0 |L f (x)|2 dx = Z ∞ −∞ k2 |g(k)|2 dρb (k). (3.3.38) Wir setzen jetzt ∆ = R \ (−µ, µ). Dann erhalten wir aus den beiden vorherigen Gleichungen Z Z ∞ |g(k)|2 dρb (k) ≤ µ −2 |L f (x)|2 dx. 0 ∆ Da nun aber Z ∞ 0 | f (x)|2 dx = Z µ −µ |g(k)|2 dρb (k) + Z ∆ |g(k)|2 dρb (k) 3.3 Singuläre Sturm-Liouville Probleme 83 haben wir Z ∞ Z ∞ Z µ −2 2 2 ≤ µ |L f (x)|2 dx. | f (x)| dx − |g(k)| dρ (k) b 0 0 −µ (3.3.39) Wenn wir nun b längs der Folge bn nach unendlich schicken, und das Lemma 3.20 verwenden, folgt Z ∞ Z ∞ Z µ 2 2 ≤ µ −2 |L f (x)|2 dx. (3.3.40) | f (x)| dx − |g(k)| dρ(k) −µ 0 0 Schliesslich schicken wir auch µ nach unendlich und erhalten die Parsevalgleichung Z ∞ 0 | f (x)|2 dx = Z ∞ −∞ |g(k)|2 dρ(k). (3.3.41) Eine Verallgemeinerung dieser Gleichung auf beliebige L2 Funktionen f folgt wegen der Dichtheit der betrachteten Funktionen. Der Beweis der L2 -Konvergenz ist weitgehend eine Konsequenz der ParsevalGleichung. Wir lassen ∆ = (µ, λ ] ⊂ R ein endliches Interval sein und setzten Z f∆ (x) g(λ )ψ(x, λ )dρ(λ ). ∆ Aus der Parseval-Identität folgt für beliebige L2 Funktionen f1 , f2 , dass Z ∞ 0 f 1(x) f2 (x)∗ dx = Z g1 (k)g2 (k)∗ dρ(k). R Dies benutzt lediglich, dass 4 f1 f2∗ = | f1 + f2 |2 − | f1 − f2 |2 + i| f1 + i f2 |2 − i| f 1 − i f2 |2 , und die Parseval identität für die vier auftretenden Funktionen. Sei nun h ∈ L2 mit Träger auf (0, a), und sei ĥ ihre verallg. Fouriertransformierte. Dann haben wir Z a Z aZ f∆ (x)h(x)dx = 0 0 Z = D g(k)Ψ (x, k)dρ(k)h(x)∗ dx (3.3.42) ∆ g(k)ĥ(k)∗ dρ(k). Daher gilt Z ∞ 0 ( f (x) − f∆ (x))h(x)∗ dx = Z ∆c g(k)ĥ(k)∗ dρ(k). (3.3.43) Damit erhalten wir unter Verwendung der Cauchy-Schwartz Ungleichung Z ∞ 2 Z Z Z ∞ Z 2 2 2 2 ( f (x) − f∆ (x))h(x)2 dx ≤ |g(k)| dρ(k) | ĥ(k)| dρ(k) ≤ |g(k)| dρ(k) |h(x)| (3.3.44) dx. 0 0 ∆c R ∆c 84 3 Sturm-Liouville Eigenwertprobleme Wenn wir jetzt h(x) = ( f (x) − f∆ (x))1Ix≤a wählen, so erhalten wir Z a 0 2 | f (x) − f∆ (x)| dx ≤ Z Dc |g(k)|2 dρ(k). (3.3.45) Da die Schranke nicht von a abhängt, gilt sie auch im Limes a ↑ ∞. Ferner geht die rechte Seite geht nach Null, wenn µ, λ nach (−∞, ∞) gehen. Damit haben wir (3.3.28) bewiesen. Die Gleichung (3.3.29) und (3.3.47) folgen im wesentlichen aus der Relation 3.3.33, und implizieren dann die Eindeutigkeit der Grenzfunktion ρ. Die obigen Resultate verallgemeinern in der Tat die Theorie der Fouriertransformation. Jeder Sturm-Liouville Operator im Limespunktfall liefert uns die Möglichkeit Funktionen durch (verallgemeinerte) Eigenfunktionen dieses Operators darzustellen. Insbesondere erhalten wir die eine Darstellung für die Green’schen Funktion: Wenn wir eine Lösung der Gleichung L f (x) − λ f (x) = u(x) mit Randbedingungen in Null wie oben suchen, dann ist diese durch 1 φ (k, x) k − λ −∞ Z ∞ f (x) = Z ∞ u(y)ψ(y, k)dydρ(k) 0 gegeben. Formal is damit die Green’sche Funktion G(x, y; λ ) = Z ∞ φ (x, k)φ (y, k) −∞ k−λ dρ(k). Wir wollen noch zeigen, dass die Green’sche Funktion eine beschränkte Abbldung R von L2 nach L2 ist, falls λ nicht im Spektrum von L liegt. Sei û(k) = u(x)ψ(x, k)dx. Dann haben wir zum einen die Darstellung der Lösung als Z ∞ f (x) = 0 Z ∞ Gλ (x, y)u(y)dy = −∞ 1 û(k)ψ(x, k)dρ(k). k−λ Nun wissen wir aus der Vollständigkeitsrelation (Parseval-Gleichung), dass 1 |û(k)|2 dρ(k) |k − λ |2 1 1 kûk22,ρ = inf kuk22 , ≤ inf 2 k∈R |k − λ | k∈R |k − λ |2 k f k22 = Z ∞ −∞ (3.3.46) was endlich ist sofern λ nicht auf der reellen Achse ist (mit etas mehr Sorfalt kann der Abstand vom der reellen Achse durch den Abstand von der Menge der Punkte in R, bei denen ρ wächst ersetzt werden). Wir sehen also, dass wie im regulären Fall, λ genau dann nicht um Spektrum von L liegt, wenn die Gleichung (L−λ ) f = u eine eindeutige quadratintegrable Lösung besitzt, die die Randbedingung in 0 erfüllt. 3.3 Singuläre Sturm-Liouville Probleme 85 3.3.4 Diskretes und kontinuierliches Spektrum Die Eigenschaften der Funktion ρ bestimmen unterschiedliche Typen des Spektrums eines Operators L. Das Spektrum ist zunächst einmal die Menge der Punkte in R an denen ρ nicht konstant ist: σ (L) = {λ ∈ R : ∀l>λ ρ(l) > ρ(λ )} . (3.3.47) Da ρ eine wachsende Funktion ist, kann es ausser Sprüngen keine Unstetigkeiten. Die Menge der Punkte λ an denen ρ springt nennt man das Punktspektrum oder das diskrete Spektrum von L. Zu diesen Werten gehören echte Eigenfunktionen. Den verbleibenden Teil des Spektrums nennt man das kontinuierliche Spektrum von L. Eine wichtige Frage ist es zu verstehen, wann man mit diskretem Spektrum rechnen kann. Wir haben schon gesehen, dass etwa der quantenmechanische harmonische Oszillator diskretes Spektrum hat. Die Frage ist im allgemeinen nicht immer einfach zu beantworten. Der folgende Satz gibt ein einfaches Kriterium: 2 d Theorem 3.21. Sei L = − dx 2 + V (x) auf R+ . Wenn V (x) ↑ +∞ wenn x ↑ ∞, dann hat L rein diskretes Spektrum mit Eigenwerten −∞ < λ0 < λ1 < λ2 < . . . . Die zugehörigen Eigenfunktionen en (x) = ψ(x, λn ) haben genau n Nullstellen in (0, ∞) und bilden eine vollständige Orthonormalbasis von L2 . Beweis. Der Beweis benutzt im Wesentlichen den Sturm’schen Oszillationssatz. Dieser liefert zunächst folgende Hilfsaussage: Lemma 3.22. Sei f Lösung von − f 00 (x) + q(x) f (x) = 0 auf [b, ∞) und es sei q(x) ≥ 1. Dann haben sowohl f als auch f 0 höchstens eine Nullstelle in [b, ∞). Beweis. Wir benutzen zunächst den Satz 3.7, der besagt, dass zwischen zwei Nullstellen von f eine Nullstelle der Lösung der Gleichung −u00 (x) + u(x) = 0 liegen muss. Nun ist aber die allgemeine Lösung dieser Gleichung u(x) = ce−x + dex . Falls f zwei Nullstellen hätte, so müsste jede Funktion u ebenfalls eine Nullstelle haben, was aber nicht wahr ist. Also hat f nur eine Nullstelle. Weiter gilt f 00 (x) > f (x), wenn f (x) > 0, und f 00 (x) < f (x), wenn f (x) negativ ist. Falls also einmal f und f 0 gleiches Vorzeichen haben, so bleibt dies so für immer und f 0 wird nie mehr eine Nullstelle haben. Wenn f negativ ist und wächst und f 0 verschwindet, bevor f eine Nullstelle hat, dann wird f 0 nach dieser Nullstelle nie wieder positiv und insbesodere gibt es keine zweite Nullstelle von f 0 . Falls f eine Nullstelle vor f 0 hat, dann wird f 0 danach nur noch wachsen und hat keine Nullstelle. Entsprechendes gilt wenn f positiv ist und fällt. 86 3 Sturm-Liouville Eigenwertprobleme Korollar 3.23. Unter den Annahmen des Satzes gibt es für jedes λ ein xλ , so dass für x > xλ , V (x) − λ > 1. Daher hat Ψ (·, λ ) höchstens eine Nullstelle x > xλ . Insbesondere hat ψ(x, λ ) nur endlich viele Nullstellen. Dasselbe gilt für ψ 0 (x, λ ). Weiter folgt, dass für x → ∞, entweder f und f 0 beide gegen +∞, beide gegen −∞ oder beide gegen 0 streben. Wie im regulären Fall gibt es einen kleinsten Wert λ0 so dass ψ(x, λ ) überhaupt eine Nullstelle hat. Weiter nimmt die Zahl der Nullstellen mit λ zu, und es folgt, dass es eine diskrete Folge von Zahlen λ0 < λ1 < λ2 < . . . gibts, so dass ψ(x, λ ) gerade n Nullstellen für λ < λn und n + 1 Nullstellen für λ > λn hat. Nun wissen wir, dass die n-ten Eigenfunktionen des Randwertproblems auf (0, b) gerade n Nullstellen haben, und die Spektralfunktionen ρb (λ ) gerade an diesen Eigenwerten λn einen Sprung haben. Es folgt daraus, dass λn,b > λn ist. Andererseits ist für hinreichend grosses b, λn,b < λn + ε, für jedes ε > 0, da ja ψ(x, λn + ε) n + 1 Nullstellen hat. Damit müssen die Sprünge von ρb gerade gegen die Punkte λn konvergieren, während sonst der Grenzwert konstant ist. Bleibt die quadratische Integrierbarkeit von Ψ (x, λn ) zu zeigen. Wenn diese Funktion bei unendlich divergieren würde, dann könnte sich die Zahl ihrer Nullstellen nicht bei einer beliebig kleinen Vergrösserung von λ um eins vergrössern. Daher muss ψ(x, λn ) und ihre Ableitung nach Null konvergieren. Daher folgt, dass (für c gross genug) Z ∞ c und somit, da ψ(x, λn ) = Z ∞ c ψ 00 (x,λn ) V (x)−λn , |ψ 00 (x, λn )|dx < ∞, auch |ψ(x, λn )|2 dx ≤ Z ∞ c |ψ(x, λn )|dx < ∞. Da die Integrale von 0 bis c nur endlich sein können, folgt die Behauptung. Literaturverzeichnis 1. Lars V. Ahlfors. Complex analysis. McGraw-Hill Book Co., New York, third edition, 1978. An introduction to the theory of analytic functions of one complex variable, International Series in Pure and Applied Mathematics. 2. Anton Bovier. Mathematik für Physiker II. Universität Bonn, 2011. 3. Henri Cartan. Elementare Theorie der analytischen Funktionen einer oder mehrerer komplexen Veränderlichen. Übersetzt aus dem französischen von Volkmar Lindenau. B. I. Hochschultaschenbücher, Band 112/112a. Bibliographisches Institut, Mannheim, 1966. 4. Earl A. Coddington and Norman Levinson. Theory of ordinary differential equations. McGrawHill Book Company, Inc., New York-Toronto-London, 1955. 5. Reinhold Remmert. Funktionentheorie. I, volume 5 of Grundwissen Mathematik [Basic Knowledge in Mathematics]. Springer-Verlag, Berlin, 1984. 87 Sachverzeichnis absolute Konvergenz, 5 analytisch, 11 Andernfalls betrachten wir den Operator L + λ für hinreichend grosses λ ., 68 Argumentenprinzip, 40 Basis, 67 Cauchy Satz von, 20 Cauchy’sche Integralformel, 24 Cauchy-Riemann Gleichungen, 11, 17, 20 Differentialform, 19 Differenzierbarkeit, 11 Dirichletproblem, 44 Eigenfunktion, 62 Eigenfunktionen verallgemeinerte, 74 Eigenwert, 62 essentielle Singularität, 32 exakte Differentialform, 21 Exponentialfunktion, 14 Funktion analytische, 11 differenzierbare, 11 geometrische Reihe, 7 geschlossene Differentialformen, 20 Green’sche Funktion, 69, 78 hebbare Singularität, 26 Hilbertaum, 61 Hilbertraum, 67 holomorph, 11 Index, 25 isolierte SIngularität, 31 Joukowski Funktion, 48 komplexe Ebene, 3 komplexe Konjugations, 3 komplexe Zahlen, 2 komplexes Integral, 19 konforme Abbildung, 15 Konvergenz, 5 gleichmässige, 7 Konvergenzradius, 8 Kurvenintegrale, 19 Laplacetransformierte, 39 Laurentreihe, 56 Logarithmus, 15 Möbiustransformation, 52 Möbiustransformationen, 17 Maximumsprinzip für analytische Funktionen, 43 für harmonische Funktionen, 43 meromorph, 31 Mittelwerteigenschaft, 43 Norm, 3, 70 Poisson’sch Integralformel, 45 Poissonkern, 45 Pol, 31 Potenzreihe, 5 formale, 5 Punktspektrum, 72, 84 Quotientenkriterium, 9 89 90 Residuensatz, 33 Residuum, 33, 39 Resolvente, 72 Resolventenmenge, 72 Riemann’scher Abbildungssatz, 49 Satz von Cauchy, 20 selbstadjungiert, 61 Singularität essentielle, 32 hebbare, 26 isolierte, 31 Skalarprodukt, 61 Spektralfunktion, 80 Spektralmass, 80 Sachverzeichnis Spektralsatz, 72 Spektrum, 72, 74, 84 diskretes, 72, 84 kontinuierliches, 74, 84 stetig, 10 gleichmässig, 10 Variationsprinip, 71 Vollständigkeit, 67 Windungszahl, 25 winkeltreu, 15 Wronski-Determinante, 64 Wurzelkriterium Cauchy’sches, 9