Mathematische Methoden der Physik I Helmut Neufeld Fakultät für Physik Universität Wien Sommersemester 2008 ii Inhaltsverzeichnis 1 Euklidische Vektorräume 1 1.1 Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Transponierte Abbildung . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Norm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Orthonormalbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.5 Orthogonale Transformationen . . . . . . . . . . . . . . . . . . . . 9 1.6 SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.7 Eulersche Winkel . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2 Unitäre Vektorräume 19 2.1 Komplexes Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . 19 2.2 Adjungierte Abbildung . . . . . . . . . . . . . . . . . . . . . . . . 22 2.3 Orthonormalbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.4 Projektionsoperatoren . . . . . . . . . . . . . . . . . . . . . . . . 25 2.5 Hermitesche Operatoren . . . . . . . . . . . . . . . . . . . . . . . 27 2.6 Unitäre Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.7 Normale Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.8 Spektralsatz für normale Operatoren . . . . . . . . . . . . . . . . 30 2.9 Gleichzeitige Diagonalisierbarkeit . . . . . . . . . . . . . . . . . . 35 2.10 Funktionen normaler Operatoren . . . . . . . . . . . . . . . . . . 36 2.11 Anwendung des Spektralsatzes auf relle Matrizen . . . . . . . . . 38 iii INHALTSVERZEICHNIS iv 3 Einfache Quantensysteme 43 3.1 Grundpostulate der Quantentheorie . . . . . . . . . . . . . . . . . 43 3.2 Spin 1/2 System 49 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Tensorprodukte von Vektorräumen 55 4.1 Tensorprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.2 Tensoren in reellen Vektorräumen . . . . . . . . . . . . . . . . . . 57 4.3 Metrischer Tensor . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.4 Levi-Cività-Tensor . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.5 Tensoren im dreidimensionalen Raum . . . . . . . . . . . . . . . . 62 4.6 Tensorprodukt von Zustandsräumen . . . . . . . . . . . . . . . . . 63 5 Gewöhnliche Differentialgleichungen 67 5.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5.2 Richtungsfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 5.3 Trennung der Variablen . . . . . . . . . . . . . . . . . . . . . . . . 70 5.4 Exakte Differentialgleichungen . . . . . . . . . . . . . . . . . . . . 74 5.5 Lineare Differentialgleichungen erster Ordnung . . . . . . . . . . . 76 5.6 Bernoullische Differentialgleichung . . . . . . . . . . . . . . . . . . 80 5.7 Iterationsverfahren von Picard . . . . . . . . . . . . . . . . . . . . 80 5.8 Existenz- und Eindeutigkeitssatz . . . . . . . . . . . . . . . . . . 81 5.9 Lineare Differentialgleichungssysteme 1. Ordnung . . . . . . . . . 82 5.10 Zeitentwicklung in der Quantenmechanik . . . . . . . . . . . . . . 85 5.11 Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 5.12 Lineare DGLn 2. Ordnung mit konst. Koeff. . . . . . . . . . . . . 87 5.13 Lineare Differentialgleichungen mit konstanten Koeffizienten . . . 90 5.14 Lineare Differentialgleichungssysteme 2.Ordnung . . . . . . . . . . 90 INHALTSVERZEICHNIS v 6 Komplexe Analysis 93 6.1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 6.2 Komplexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 94 6.3 Riemannsche Flächen . . . . . . . . . . . . . . . . . . . . . . . . . 96 6.4 Differentiation im Komplexen . . . . . . . . . . . . . . . . . . . . 98 6.5 Integration im Komplexen . . . . . . . . . . . . . . . . . . . . . . 100 6.6 Integralsatz von Cauchy . . . . . . . . . . . . . . . . . . . . . . . 108 6.7 Unbestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . . 118 6.8 Cauchysche Integralformel . . . . . . . . . . . . . . . . . . . . . . 119 6.9 Ableitungen einer holomorphen Funktion . . . . . . . . . . . . . . 122 6.10 Unendliche Reihen komplexer Zahlen . . . . . . . . . . . . . . . . 126 6.11 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.12 Reihen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 133 6.13 Sätze über Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . 136 6.14 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.15 Laurentreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 6.16 Residuen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 6.17 Residuensatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 6.18 Berechnung von reellen Integralen . . . . . . . . . . . . . . . . . . 149 Danksagungen Harald Höller hat die mühevolle Arbeit der Umwandlung meiner handschriftlichen Notizen in ein LATEX-file übernommen. Ihm möchte ich besonders danken. Eine große Hilfe waren auch Paul Posch und Mathias Tomandl, die die Abbildungen des 6. Kapitels angefertigt haben. Walter Grimus hat mich mit vielen nützlichen Anregungen unterstützt. Auch das Manuskript einer seiner früheren M1-Vorlesungen war für mich eine Quelle wertvoller Inspiration. Schließlich möchte ich jenen Hörern meiner Vorlesung danken, die mich auf Druckfehler in den früheren Versionen des Skriptums aufmerksam gemacht haben. Literatur C. B. Lang, N. Pucker, Mathematische Methoden in der Physik, Spektrum E. Kreyszig, Advanced Engineering Mathematics, John Wiley & Sons J. Cigler, Einführung in die Lineare Algebra und Geometrie, 2. Teil, Manz A. Duschek, Vorlesungen über höhere Mathematik, III. Band, Springer vi INHALTSVERZEICHNIS Kapitel 1 Euklidische Vektorräume In einem Vektorraum sind als Verknüpfungsvorschriften die Vektoraddition und die Multiplikation von Vektoren mit Skalaren (den Elementen des Grundkörpers) erklärt. Fügt man als weitere Struktur ein Skalarprodukt hinzu, so gelangt man im Fall eines reellen Vektorraums zur Definition des euklidischen und für komplexe Vektorräume zur Definition des unitären Vektorraums. 1.1 Skalarprodukt Wie bereits aus dem Schulunterricht bekannt ist, kann man in der Ebene oder im dreidimensionalen Raum die Länge eines Vektors und den zwischen zwei Vektoren eingeschlossenen Winkel mit Hilfe des Skalarproduktes ausdrücken. Wir wollen hier Skalarprodukte axiomatisch, das heißt durch die Angabe ihrer charakteristischen Eigenschaften, einführen. Dadurch gewinnen wir einerseits mehr Einblick in die zugrundeliegenden mathematischen Strukturen und lösen uns andererseits von der Einengung auf elementargeometrische Anwendungen. Definition: Ein (endlichdimensionaler) Vektorraum E über dem Grundkörper heißt euklidisch, falls für je zwei Elemente x, y ∈ E ein Skalarprodukt (oder inneres Produkt) (x|y) ∈ definiert ist, mit folgenden Eigenschaften: 1. (a1 x1 + a2 x2 |y) = a1 (x1 |y) + a2 (x2 |y), x1,2 ∈ E, a1,2 ∈ 2. (x|y) = (y|x) 3. (x|x) ≥ 0, (x|x) = 0 ⇔ x = 0 Bemerkung: Die Eigenschaften 1 (Linearität im ersten Argument) und 2 (Symmetrie) implizieren Linearität auch im zweiten Argument, das heißt das Skalarprodukt ist bilinear. 1 KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 2 Beispiele: 1. Das Paradebeispiel schlechthin ist natürlich der Raum produkt 3 xi yi . (x|y) = 3 mit dem Skalar- i=1 3 Fasst man die Elemente des auf, als Spaltenvektoren (oder 3 × 1-Matrizen) ⎛ ⎞ x1 ⎝ x = x2 ⎠ , x3 so kann man mit Hilfe des dazugehörigen Zeilenvektors (bzw. der zu x transponierten 1 × 3-Matrix) xT = (x1 , x2 , x3 ) das Skalarprodukt auch in Matrixnotation schreiben: (x|y) = xT y. 2. Im n sei ein Skalarprodukt T (x|y) = x y = n xi yi i=1 definiert. Diesen Raum nennen wir E n . 3. Im n sei ein inneres Produkt durch (x|y) = n pi xi yi i=1 definiert, wobei pi > 0 (i = 1, . . . n) ist. 4. In dem Funktionenraum der auf einem endlichen Intervall [a, b] ⊂ nierten reellen Polynome vom Grad ≤ n, p(x) = n ck ∈ ck xk , , x ∈ [a, b], k=0 kann man durch b dx p(x)q(x) (p|q) = a ein inneres Produkt definieren. defi- 1.2. TRANSPONIERTE ABBILDUNG 1.2 3 Transponierte Abbildung Im Raum E n (Beispiel 2) ist das Skalarprodukt durch (x|y) = xT y definiert, wobei xT die transponierte Matrix von x“ bedeutet. Diese sehr praktische Schreibweise ” kann für beliebige euklidische Räume verallgemeinert werden. Dazu geht man von der Beobachtung aus, dass im Falle des E n die Abbildung x → xT eine Identifizierung“ von E n (dem Raum der n-dimensionalen Spaltenvektoren) mit ” n (dem Raum der n-dimensionalen Zeilenvektoren) darstellt. seinem Dualraum E Die Vorgabe eines Skalarproduktes erlaubt es nun, jeden euklidischen Vektorraum E mit seinem Dualraum E auf kanonische Weise zu identifizieren. Dazu ordnet man jedem x ∈ E das lineare Funktional xT ∈ E zu, welches durch xT (y) = xT y = (x|y) ∀ y ∈ E definiert ist. Man überzeugt sich leicht davon, dass die Abbildung x → xT linear und injektiv ist. Da dim E = dim E ist, stimmt das Bild von E unter der Abbildung T mit ganz E überein. Bezeichnet man die inverse Abbildung ebenfalls mit T , so ist xT T = x ∀ x ∈ E erfüllt. Für eine lineare Abbildung A : E n → E n gilt (x|Ay) = (AT x|y), da (AT x|y) = (AT x)T y = xT AT T y = xT Ay = (x|Ay). Diese Konstruktion lässt sich ebenfalls auf den allgemeinen Fall übertragen: V und W seien euklidische Vektorräume mit dem Skalarprodukt (.|.)V , bzw. (.|.)W und A : V → W eine lineare Abbildung. Dann ist die zu A transponierte Abbildung AT : W → V durch (AT w|v)V = (w|Av)W ∀ v ∈ V, ∀ w ∈ W definiert. Wieder überzeugt man sich leicht davon, dass AT wohldefiniert und linear ist. Eigenschaften der transponierten Abbildung: 1. (a1 A1 + a2 A2 )T = a1 AT1 + a2 AT2 , 2. AT T = A, a1,2 ∈ , A1,2 ∈ L(V, W). A ∈ L(V, W). 3. (BA)T = AT B T , A ∈ L(V, W), B ∈ L(W, X ). KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 4 1.3 Norm Im E n kann die Länge eines Vektors durch x = x21 + · · · + x2n = (x|x) bestimmt werden. Im allgemeinen Fall eines beliebigen euklidischen Vektorraums E definiert man die Norm x eines Elementes x ∈ E durch x = (x|x). Für das Skalarprodukt gilt die Ungleichung von Cauchy-Schwarz: |(x|y)| ≤ x y . Beweis: Für x = 0 oder y = 0 ist die Ungleichung trivialerweise erfüllt. Man kann sich daher auf den Fall x = 0 ∧ y = 0 beschränken. Es sei = ±1 so gewählt, dass |(x|y)| = (x|y). x (x|y) y x y (x|x) (y|y) + −2 0 ≤ − − = 2 2 x y x y x y x y |(x|y)| = 2 1− ⇒ |(x|y)| ≤ x y . x y ⇒ Anschauliche Bedeutung der Ungleichung von Cauchy-Schwarz in der Ebene oder im dreidimensionalen Raum: y : x θ |x · y | = |x||y| | cos θ| ≤ |x||y| Eigenschaften der Norm: 1. x ≥ 0, x = 0 ⇔ x = 0 2. ax = |a| x ∀ a ∈ 3. x + y ≤ x + y ≤1 1.3. NORM 5 Beweis: Die ersten beiden Eigenschaften folgen unmittelbar aus der Definition der Norm. Die dritte Eigenschaft (Dreiecksungleichung) ergibt sich aus der Ungleichung von Cauchy-Schwarz: x + y 2 = (x + y|x + y) = (x|x) + (y|y) + 2(x|y) ≤ x 2 + y 2 + 2 x y = ( x + y )2. Definition: Ein Vektor x heißt normiert oder Einheitsvektor, wenn x = 1 ist. Zwei Vektoren x, y heißen orthogonal, wenn (x|y) = 0 ist. Beispiele: 1. Im E 2 bildet die Menge aller Einheitsvektoren x 2 = (x|x) = x21 + x22 = 1 einen Kreis mit Radius 1 (Einheitskreis). 2 6 '$ x = 1 - 1 &% 2. Im Fall des 2 mit dem inneren Produkt x1 y1 x2 y2 (x|y) = 2 + 2 a b liegen die Einheitsvektoren auf der Ellipse x 2 = (x|x) = x21 x22 + 2 =1 a2 b (Ellipse als Einheitskugel“). Die Richtungsvektoren zweier Durchmesser ” 2 6 x = 1 b a - 1 sind genau dann orthogonal“, wenn es sich um konjugierte Durchmesser ” handelt. KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 6 3. Wir betrachten in dem Vektorraum der Polynome vom Grad ≤ n auf [0, 1] mit dem inneren Produkt 1 dx p(x)q(x) (p|q) = 0 √ √ die Elemente p0 (x) = 1, p1 (x) = x und p2 (x) = x2 . p0 , 3p1 und 5p2 sind Einheitsvektoren, p0 und p1 sind nicht orthogonal, jedoch sind p0 und p0 − 2p1 orthogonal. 1.4 Orthonormalbasis Definition: Unter einem Orthonormalsystem (ONS) in einem euklidischen Vektorraum E versteht man eine Menge von Einheitsvektoren, die paarweise aufeinander orthogonal stehen: f1 , . . . , fk ∈ E, (fi |fj ) = δij . Bildet {f1 , . . . , fk } ein ONS, dann sind diese Vektoren linear unabhängig, denn k ai fi = 0 i=1 ⇒ 0 = (fj | k ai fi ) = i=1 k i=1 ai (fj |fi ) = aj ∀ j, 1 ≤ j ≤ k. δij Definition: Ein Orthonormalsystem heißt vollständig (VONS) oder Orthonormalbasis (ONB) von E, wenn es eine Basis von E bildet. Beispiele: 1. Im E n ist die Standardbasis ⎛ ⎞ ⎛ ⎞ 1 0 ⎜ 0 ⎟ ⎜ 1 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ e1 = ⎜ 0 ⎟ , e2 = ⎜ 0 ⎟ , . . . , ⎜ .. ⎟ ⎜ .. ⎟ ⎝ . ⎠ ⎝ . ⎠ 0 0 eine ONB, weil (ei |ej ) = δij ist. ⎛ 0 0 .. . ⎜ ⎜ ⎜ en = ⎜ ⎜ ⎝ 0 1 ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 1.4. ORTHONORMALBASIS 7 2. Im E 2 bilden die Vektoren cos ϕ , f1 = sin ϕ f2 = − sin ϕ cos ϕ eine ONB. {f1 , . . . , fn } sei eine ONB eines n-dimensionalen euklidischen Vektorraumes E. Dann lässt sich jedes x ∈ E in der Form x= n fi ai i=1 schreiben, wobei die Entwicklungskoeffizienten ai ∈ eindeutig durch ai = (fi |x) = fiT x bestimmt sind. Man hat also die Beziehung x= n fi fiT x ∀ x ∈ E i=1 und erhält somit die Vollständigkeitsrelation n fi fiT = 1. i=1 Es ist instruktiv, die Vollständigkeitsrelation für die beiden oben angegebenen Beispiele zu verifizieren. Eine ONB {f1 , . . . , fn } eines n-dimensionalen euklidischen Vektorraumes kann also auch durch die beiden Eigenschaften (fi |fj ) = δij , n fi fiT = 1 i=1 charakterisiert werden. Das Gram-Schmidtsche Orthonormalisierungsverfahren ist eine Methode, ausgehend von einer beliebigen Basis {g1 , . . . , gn } eines euklidischen Vektorraumes, eine ONB (ein VONS) {f1 , . . . , fn } zu konstruieren. f1 = g1 g1 g2 = f1 (f1 |g2 ) + g2 − f1 (f1 |g2 ) f1 ⊥f1 KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 8 ⇒ f2 = g2 >6g2 − f1 (f1 |g2 ) 6f2 - g2 − f1 (f1 |g2 ) g2 − f1 (f1 |g2 ) f1 (f1 |g2) f1 g3 = f (f |g ) + f (f |g ) 1 1 3 2 2 3 + g3 − f1 (f1 |g3 ) − f2 (f2 |g3) ⊥f1 ,f2 liegt in dem von f1 , f2 aufgespannten linearen Teilraum ⇒ f3 = g3 − f1 (f1 |g3 ) − f2 (f2 |g3) g3 − f1 (f1 |g3 ) − f2 (f2 |g3) usw. → VONS {f1 , . . . , fn }. Bemerkung: Aus diesem Resultat folgt auch unmittelbar, dass ein VONS stets existiert. Ein beliebiger n-dimensionaler euklidischer Vektorraum E unterscheidet sich in gewisser Weise nicht von einem E n . Wählt man nämlich in E eine ONB {f1 , . . . , fn }, so lässt sich jedes x ∈ V eindeutig in der Form x= n fi xi , xi = (fi |x) i=1 schreiben. Der Vektor x ist also (bei vorgegebener ONB) eindeutig durch die n Zahlen ⎛ ⎞ x1 ⎜ .. ⎟ n ⎝ . ⎠∈E xn bestimmt. Weiters gilt (x + y)i = xi + yi , (axi ) = axi und (x|y) = n i=1 d.h. die Zuordnung n n n fi xi fj yj = xi yj (fi |fj ) = xi yi , j=1 i,j=1 ⎞ x1 ⎟ ⎜ x ∈ E ↔ ⎝ ... ⎠ ∈ E n xn ⎛ δij i=1 1.5. ORTHOGONALE TRANSFORMATIONEN 9 respektiert sowohl die Vektoraddition, die Multiplikation mit Skalaren als auch die Bildung des Skalarprodukts. Man sagt auch, dass jeder n-dimensionale euklidische Vektorraum isomorph zu E n ist. Bemerkung: Eine lineare Abbildung T : V → W heißt Isomorphismus der euklidischen Vektorräume V, W, falls T ein Vektorraumisomorphismus (d.h. eine bijektive lineare Abbildung) ist mit der zusätzlichen Eigenschaft (T x|T y)W = (x|y)V ∀ x, y ∈ V. Die Matrixdarstellung (Aij ) einer linearen Abbildung A ∈ L(E) (d.h. A : E → E) in einem euklidischen Vektorraum E hat bezüglich einer ONB {f1 , . . . , fn } eine besonders einfache Form. Bildet man nämlich das Skalaprodukt von fi mit dem Ausdruck n Afj = fk Akj , k=1 so erhält man (fi |Afj ) = (fi | n k=1 fk Akj ) = n k=1 Akj (fi |fk ) = Aij . δik Das heißt man bildet einfach ein Sandwich“ des Operators A zwischen den Vek” toren fi und fj um das Matrixelement Aij zu erhalten: Aij = (fi |Afj ) = fiT Afj . Die Matrixdarstellung (AT )ij der durch (AT x|y) = (x|Ay) ∀ x, y ∈ E definierten, zu A transponieren Abbildung AT : E → E ist dann bezüglich einer ONB durch (AT )ij = (fi |AT fj ) = (Afi |fj ) = (fj |Afi ) = Aji gegeben, d.h. Zeilen und Spalten werden einfach vertauscht. 1.5 Orthogonale Transformationen Wir wollen nun mit den sogenannten orthogonalen Abbildungen noch kurz eine wichtige Klasse von Operatoren ∈ L(E) besprechen. Dazu gehen wir von der folgenden Beobachtung aus: Satz: Sei O ∈ L(E) (E ein euklidischer Vektorraum). Dann sind die folgenden Aussagen äquivalent: KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 10 1. O ist invertierbar mit O −1 = O T (d.h. O T O = OO T = 1). 2. (Ox|Oy) = (x|y) ∀ x, y ∈ E. 3. O ist isometrisch, d.h. Ox = x ∀ x ∈ E. 4. O bildet jede ONB von E wieder auf eine ONB von E ab. Ist eine dieser Bedingungen erfüllt, nennt man die Abbildung O orthogonal. In der früher eingeführten Sprechweise ist O dann ein Isomorphismus des euklidischen Vektorraumes E mit sich, ein sogenannter Automorphismus. Bei dem Beweis des obigen Satzes bereitet nur die Implikation 3 ⇒ 2 etwas Mühe. Man benötigt dazu den folgenden Hilfssatz (Polarisierungsidentität): (x|y) = x + y 2 − x − y 2 . 4 Beweis des Hilfssatzes: Man subtrahiere die Ausdrücke (x + y|x + y) = x 2 + y 2 + 2(x|y), (x − y|x − y) = x 2 + y 2 − 2(x|y). Nimmt man nun an, dass Ox = x ∀ x ∈ E erfüllt ist, so folgt unter Verwendung des Hilfssatzes tatsächlich, dass O(x + y) 2 − O(x − y) 2 Ox + Oy 2 − Ox − Oy 2 = 4 4 2 2 (x + y) − (x − y) = (x|y) ∀ x, y ∈ E = 4 (Ox|Oy) = erfüllt ist. Bemerkungen: 1. Aus O T O = 1 folgt für eine orthogonale Transformation det(O T O) = det O T det O = (det O)2 = 1 und somit det O = ±1. 2. Die orthogonalen Transformationen auf einem n-dimensionalen euklidischen Vektorraum bilden eine Gruppe, man nennt sie O(n). Jene orthogonalen Transformationen R, welche die Zusatzbedingung det R = 1 erfüllen, bilden ebenfalls eine Gruppe, diese wird als SO(n) bezeichnet. 1.5. ORTHOGONALE TRANSFORMATIONEN 11 fn } sei eine beliebige ONB eines euklidischen Vektorraumes E. 3. {f1 , . . . , n T Wegen i=1 fi fi = 1 lässt sich dann jede orthogonale Transformation O ∈ L(E) in der Form O = O1 = O n fi fiT = i=1 n OfifiT = gi fiT i=1 schreiben, wobei die Vektoren gi = Ofi (i = 1, . . . , n) wegen der Eigenschaft 4 wieder eine ONB von E bilden. Für den Spezialfall E = E n kann man daher jede orthogonale n × n-Matrix O in der Form O= n gi eTi = (g1 , . . . , gn ) i=1 schreiben, das heißt in den Spalten von O steht die ONB {g1 , . . . , gn } = {Oe1 , . . . , Oen }. Ebenso bilden die Zeilen einer orthogonalen Matrix ein VONS, da O = 1O = ⎛ n ⎞ i=1 hT1 ⎟ ⎜ = ⎝ ... ⎠ , hTn ei eTi O = n T T ei (O ei ) = i=1 n ei hTi i=1 hi = O T ei . Die orthogonalen n × n-Matrizen sind also genau jene Elemente aus L(E n ), deren Spalten bzw. Zeilen ein VONS von E n bilden. Beispiele: 1. Im E 2 lässt sich jeder Einheitsvektor f1 in der Form cos α f1 = sin α schreiben, für einen auf f1 orthogonal stehenden Vektor f2 gibt es dann nur mehr die zwei Möglichkeiten − sin α , ε = ±1. f2 = ε cos α Nach den obigen Überlegungen hat eine orthogonale Matrix O im E 2 dann die allgemeine Gestalt cos α −ε sin α O= . sin α ε cos α KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 12 Für ε = 1 handelt es sich um eine Drehung mit Drehwinkel α. In diesem Fall ist det O = 1. Im Fall ε = −1 hat man es mit einer Drehspiegelung zu tun, wobei det O = −1 ist. 2. Eine reine Spiegelung im E 2 wäre z.B. die Transformation S= 1 0 0 −1 , die einer Spiegelung an der 1-Achse entspricht. 3. Wir wollen im dreidimensionalen Raum eine Drehung um den Winkel α beschreiben. Die 3-Achse unseres Koordinatensystems legen wir dabei in Richtung der Drehachse. Als ONB haben wir (in der in der Physik für räumliche Vektoren üblichen Schreibweise) {e1 , e2 , e3 }, welche (in der angegebenen Reihenfolge) ein Rechtssystem bilden soll. Wegen der Linearität der Drehoperation R genügt es, ihre Wirkung auf die drei Basisvektoren zu kennen: Re1 = e1 cos α + e2 sin α, Re2 = −e1 sin α + e2 cos α, Re3 = e3 . Daraus können wir unmittelbar die Matrixdarstellung (Rij ) von R bezüglich der gewählten ONB ablesen: ⎛ ⎞ cos α − sin α 0 (Rij ) = ⎝ sin α cos α 0 ⎠ 0 0 1 Re2 BM e2 6 B B B B e1 1 R e3 Be α - e1 B B Bemerkungen: (a) Wir stellen fest, dass det R = 1 ist. Reine Drehungen im dreidimensionalen Raum entsprechen den Elementen der Drehgruppe SO(3). 1.5. ORTHOGONALE TRANSFORMATIONEN 13 (b) Eine Drehung im dreidimensionalen Raum ist bereits festgelegt, wenn man das Bild von zwei orthonormierten Vektoren kennt, da dann auch das Bild des dritten Basisvektors bereits bestimmt ist. Tatsächlich folgt bei unserem Beispiel aus Re2 = −e1 sin α + e2 cos α und Re3 = e3 mit e1 = e2 × e3 das Transformationsverhalten von e1 : Re1 = R(e2 × e3 ) = Re2 × Re3 = (−e1 sin α + e2 cos α) × e3 = e1 cos α + e2 sin α. (c) Ein Vektor x = 3 ei xi i=1 mit Komponenten xi bezüglich der ONB {e1 , e2 , e3 } wird durch die Drehung R ∈ SO(3) in den Vektor Rx = R 3 ej xj = j=1 3 Rej xj = j=1 mit den Komponenten 3 3 ei Rij xj i,j=1 Rij xj j=1 transformiert. Man spricht in diesem Fall von einer aktiven Transformation des Vektors. Bei einer passiven Transformation bleibt der Vektor x selbst unverändert, man betrachtet jedoch seine Komponenten xi bezüglich einer transformierten ONB {e1 , e2 , e3 }. Im Fall unserer Drehung ist 3 ej = Rej = ei Rij . i=1 Wegen x = 3 ei xi = i=1 3 ej xj = j=1 3 ei Rij xj , i,j=1 ist der Zusammenhang zwischen den Komponenten xi und den Komponenten xi durch xi = 3 j=1 Rij xj ⇔ xi = 3 −1 Rij xj j=1 gegeben. Das Transformationsverhalten der Komponenten des Vektors ist also invers zu jenem der aktiven Transformation. KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 14 4. Das Standardbeispiel für eine orthogonale Transformation mit negativer Determinante ist in drei Raumdimensionen die Paritätstransformation P = −1. Jedes Element O ∈ O(3) mit det O = −1 lässt sich in der Form O = P R, R ∈ SO(3), schreiben. 1.6 SO(3) Die Menge der Drehungen im dreidimensionalen Raum ist ein Beispiel für eine nichtabelsche Liegruppe. Die Elemente der Gruppe SO(3) können durch den sogenannten Drehvektor α parametrisiert werden. Dieser zeigt (gemäß der Rechtsschraubenregel) in Richtung der Drehachse, sein Betrag ist gleich dem Drehwinkel α = | α| (0 ≤ α < 2π). Die entsprechende Transformation bezeichnen wir mit R( α). Es handelt sich bei der SO(3) also um eine kontinuierliche Gruppe von Transformationen (eine sogenannte Liegruppe), deren wesentliche Eigenschaften durch die Gestalt ihrer Elemente in einer infinitesimalen Umgebung des Einheitselements bereits festgelegt sind. Für infinitesimales ε hat eine Drehung die einfache Form ε × x ε 6 yXX X x x. R(ε ) x = x + ε × x = ( + ε · Λ) Man kann nun eine beliebige endliche Drehung um den Drehwinkel α durch die wiederholte Anwendung von N Drehungen um den Drehwinkel α /N erhalten: R( α) = R( α/N)N . Für genügend großes N (und somit einen entsprechend kleinen Wert von α/N) kann man schreiben: α ·Λ )N R( α) ( + N Im Limes N → ∞ erhält man somit die Formel R( α) = exp( α · Λ). Bemerkung: Wegen (ε × x)i = ikj εk xj = −εk kij xj (Summenkonvention!) sind zusammengefassten linearen Abbildungen die Matrixdarstellungen der drei in Λ 1.7. EULERSCHE WINKEL 15 Λ1 , Λ2 , Λ3 bezüglich der ONB {e1 , e2 , e3 } durch (Λk )ij = −kij gegeben. Diese Matrizen bilden eine dreidimensionale Darstellung der Generatoren (oder Erzeuger) der SO(3). aus, so Führt man zuerst die Drehung R( α) und anschließend die Drehung R(β) wird sich das Resultat im Allgemeinen von jenem unterscheiden, das man erhält, wenn man die beiden Operationen in der umgekehrten Reihenfolge durchführt. Es handelt sich bei der SO(3) nämlich um eine nichtabelsche (oder nichtkommutative) Gruppe, das heißt ihre Elemente vertauschen (kommutieren) im Allgemeinen nicht: i.A. = R(β)R( α). R( α)R(β) Konkret bedeutet das im Fall der SO(3), dass α = R(β)R( −1 . R R(β) α)R(β) Für infinitesimales α = ε ist diese Relation leicht zu sehen: −1x = R(β) R(β) −1x + ε × R(β) −1x R(β)R( ε )R(β) ε × x = x + R(β) ε x. = R R(β) Im Fall eines endlichen Drehwinkels α schreiben wir −1 = R(β)R( −1 = R(β)R( −1 N . R(β)R( α)R(β) α/N)N R(β) α/N)R(β) Für genügend großes N können wir die für den infinitesimalen Drehwinkel α /N bereits gezeigte Formel −1 = R R(β) α/N R(β)R( α/N)R(β) einsetzen und erhalten auf diese Weise das behauptete Ergebnis. Bemerkung: Stimmen die durch α und β beschriebenen Drehachsen überein, α = α kommutieren in dann ist R(β) und die beiden Drehungen R( α), R(β) diesem Fall. 1.7 Eulersche Winkel Jedes Element der dreiparametrigen Liegruppe SO(3) lässt sich eindeutig als Produkt von drei Drehungen um drei bestimmte Standardachsen beschreiben. Eine andere Möglichkeit zur Parametrisierung der Elemente der SO(3) stellen die drei Eulerschen Winkel dar. Sei D ∈ SO(3) und {e1 , e2 , e3 } eine (rechtshändige) ONB. Ist De3 = e3 , dann handelt es sich um den bereits behandelten Fall KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 16 einer Drehung um die 3-Achse. Es sei also De3 = e3 . Die beiden durch den Ursprung gehenden und auf e3 , beziehungsweise auf De3 normal stehenden Ebenen schneiden einander dann in einer Geraden, der sogenannten Knotenlinie. Wie auch bei Verwendung von Kugelkoordinaten üblich, bezeichnen wir den Winkel zwischen e3 und De3 mit θ (0 ≤ θ ≤ π) und den Winkel zwischen e1 und der Projektion von De3 auf den von e1 und e2 aufgespannten Unterraum mit φ (0 ≤ φ < 2π). Als ersten Schritt wenden wir eine Drehung Rφ = R(φe3 ) mit der Drehachse e3 um den Winkel φ an. Diese bildet die ONB {e1 , e2 , e3 } auf die von den Vektoren ej = Rφej = 3 ei Rφ,ij , j = 1, . . . 3, i=1 {e1 , e2 , e3 } ab, wobei (Rφ,ij ) die Matrixdarstellung von Rφ gebildete ONB bezüglich der ONB {e1 , e2 , e3 } bezeichnet. Die explizite Form dieser Transformation ist durch e1 = Rφe1 = e1 cos φ + e2 sin φ, e2 = Rφe2 = −e1 sin φ + e2 cos φ, e3 = Rφe3 = e3 mit ⎛ ⎞ cos φ − sin φ 0 (Rφ,ij ) = ⎝ sin φ cos φ 0 ⎠ 0 0 1 gegeben. Der Vektor e2 liegt in der Knotenlinie. Im zweiten Schritt führen wir eine Drehung Rθ = R(θe2 ) mit der Drehachse e2 um den Winkel θ durch. Die Wirkung dieser Drehung auf die gestrichene ONB {e1 , e2 , e3 }, ej = Rθej = 3 ei Rθ,ij , j = 1, . . . 3, i=1 ist durch e1 = Rθe1 = e1 cos θ − e3 sin θ, e2 = Rθe2 = e2 e3 = Rθe3 = e1 sin θ + e3 cos θ 1.7. EULERSCHE WINKEL 17 ) der Drehung Rθ bezüglich der gestrichegegeben. Die Matrixdatstellung (Rθ,ij nen Basis liest man sofort als ⎛ ⎞ cos θ 0 sin θ )=⎝ 0 1 0 ⎠ (Rθ,ij − sin θ 0 cos θ ab. Da e3 bereits mit De3 übereinstimmt, benötigt man als dritte Drehung nur mehr eine Rotation um e3 um den Winkel ψ (0 ≤ ψ < 2π), Rψ = R(ψe3 ), um die Wirkung der gesamten Drehung D als Produkt D = Rψ Rθ Rφ = R(ψe3 )R(θe2 )R(φe3 ) darzustellen. Wir betrachten also die Wirkung der Transformation Rψ auf die Orthonormalbasis {e1 , e2 , e3 }, Dej = Rψej = 3 ei Rψ,ij , j = 1, . . . 3. i=1 In expliziter Form hat man De1 = Rψe1 = e1 cos ψ + e2 sin ψ, De2 = Rψe2 = −e1 sin ψ + e2 cos ψ, De3 = Rψe3 = e3 , ) von Rψ bezüglich der ONB {e1 , e2 , e3 } lautet und die Matrixdarstellung (Rψ,ij daher: ⎞ ⎛ cos ψ − sin ψ 0 (Rψ,ij ) = ⎝ sin ψ cos ψ 0 ⎠ . 0 0 1 Um nun die Matrixdarstellung (Dij ) der Gesamtdrehung bezüglich der ursprünglichen ONB {e1 , e2 , e3 } zu erhalten, setzen wir diese aus den drei Einzeldrehungen zusammen: Dej = 3 ei Dij = Rψej i=1 = 3 en Rψ,nj n=1 = 3 Rθen Rψ,nj n=1 = 3 m,n=1 = 3 em Rθ,mn Rψ,nj m,n=1 Rφem Rθ,mn Rψ,nj = 3 i,m,n=1 ei Rφ,im Rθ,mn Rψ,nj . KAPITEL 1. EUKLIDISCHE VEKTORRÄUME 18 Das heißt also, dass Dij = (Rψ Rθ Rφ )ij = 3 Rφ,im Rθ,mn Rψ,nj , m,n=1 bzw. ⎛ ⎞⎛ ⎞⎛ ⎞ cos φ − sin φ 0 cos θ 0 sin θ cos ψ − sin ψ 0 1 0 ⎠ ⎝ sin ψ cos ψ 0⎠ . (Dij ) = ⎝ sin φ cos φ 0⎠ ⎝ 0 0 0 1 − sin θ 0 cos θ 0 0 1 Wie aus diesem Ergebnis ersichtlich ist, lässt sich die Drehung D auch auf eine andere Art erhalten: Man dreht zunächst um e3 um den Winkel ψ, dann um die Drehachse e2 (kein Strich!) um den Winkel θ und schließlich wieder um e3 um den Winkel φ. Mit anderen Worten, es gilt die Beziehung D = R(ψe3 )R(θe2 )R(φe3 ) = R(φe3 )R(θe2 )R(ψe3 ). Die zweite Form hat den Vorteil, dass nur um Achsen der ursprünglichen ONB gedreht wird. Die hier gefundene Beziehung ist natürlich kein Zufall, sondern hat ihren tieferen Grund in der schon früher besprochenen Formel α = R(β)R( −1 . R R(β) α)R(β) Um dies zu sehen, setzen wir e2 = R(φe3 )e2 und e3 = R(θe2 )e3 = R R(φe3 )θe2 R(φe3 )e3 = R(φe3 )R(θe2 ) R(φe3)−1 R(φe3 ) e3 = R(φe3 )R(θe2 )e3 in R(ψe3 )R(θe2 )R(φe3 ) ein: R R(φe3 )R(θe2 )ψe3 R R(φe3 )θe2 R(φe3 ) R(ψ e3 ) R(θe2 ) = R(φe3 )R(θe2 )R(ψe3 )R(θe2 )−1 R(φe3 )−1 R(φe3 ) R(θe2 ) R(φe3 )−1 R(φe3 ) = R(φe3 )R(θe2 )R(ψe3 ) R(θe2 )−1 R(θe2 ) = R(φe3 )R(θe2 )R(ψe3 ). Bemerkung: Die hier gewählte Konvention zur Definition der Eulerschen Winkel hat in der Quantenmechanik gewisse Vorteile. In der klassischen Mechanik wird oft eine Konvention verwendet, bei der zunächst der Vektor e1 durch eine Rotation um e3 in die Knotenlinie gedreht wird, anschließend wird um e1 gedreht und schließlich um e3 . Physikalische Resultate können natürlich von der Wahl einer bestimmten Konvention nicht abhängen. Kapitel 2 Unitäre Vektorräume Die Verwendung des Grundkörpers der komplexen Zahlen besitzt eine Reihe von rechentechnischen Vorteilen. Will man etwa die Eigenwerte einer n × n-Matrix bestimmen, so besitzt das dazugehörige charakteristische Polynom über stets ja bekanntlich n (eventuell teilweise zusammenfallende) Nullstellen, was über nicht der Fall zu sein braucht. Darüberhinaus ist die Theorie der unitären Vektorräume in der Physik von allergrößter Bedeutung, handelt es sich dabei doch um jene mathematischen Methoden, die in der Quantentheorie ihre natürliche Anwendung finden. Wir beschränken uns hier ausschließlich auf den endlichdimensionalen Fall. Es sei jedoch darauf hingewiesen, dass die hier dargestellte Theorie ihre volle Bedeutung erst im unendlichdimensionalen Fall erlangt, wo sie im Rahmen der Funktionalanalysis in die Theorie der (unendlichdimensionalen) Hilberträume (→ Mathematische Methoden der Physik II) übergeht. 2.1 Komplexes Skalarprodukt Definition: Ein (endlichdimensionaler) Vektorraum U über heißt unitär (oder endlichdimensionaler Hilbertraum), wenn ∀ ϕ, ψ ∈ U ein Skalarprodukt (inneres Produkt) ϕ | ψ ∈ U definiert ist mit den folgenden Eigenschaften: 1. ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 , ∀ ϕ, ψ1,2 ∈ U, ∀ c1,2 ∈ 2. ϕ | ψ = ψ | ϕ∗ 3. ψ | ψ ≥ 0, ψ | ψ = 0 ⇔ ψ = 0 Bemerkungen: ϕ | ψ ist sesquilinear, d.h. linear in der zweiten Variablen 19 KAPITEL 2. UNITÄRE VEKTORRÄUME 20 und antilinear in der ersten Variablen, da c1 ϕ1 + c2 ϕ2 | ψ = ψ | c1 ϕ1 + c2 ϕ2 ∗ = c∗1 ψ | ϕ1 ∗ + c∗2 ψ | ϕ2 ∗ = c∗1 ϕ1 | ψ + c∗2 ϕ2 | ψ. Wir verwenden hier die in der physikalischen Literatur üblichen Konventionen. In der mathematischen Literatur ist das innere Produkt oft in der ersten Variablen linear und in der zweiten antilinear. Weiters findet man dort häufig die Schreibweise z̄ statt z ∗ für die zur komplexen Zahl z = a + ib (a, b ∈ ) konjugiert komplexe Zahl z ∗ = a − ib. Beispiele für unitäre Vektorräume: 1. U n = n mit dem Skalarprodukt x | y = n x∗k yk . k=1 2. Der Vektorraum, der auf [a, b] ⊂ definierten komplexen Polynome vom Grad ≤ n, n p(x) = ck xk , ck ∈ , x ∈ [a, b] k=0 mit dem inneren Produkt b p | q = dx p(x)∗ q(x). a 3. Der Vektorraum der komplexwertigen Funktionen der Form ψ(x) = N cn e2πinx , cn ∈ n=−N auf dem Intervall [0, 1] mit dem Skalarprodukt 1 ϕ | ψ = 0 dx ϕ(x)∗ ψ(x). , 2.1. KOMPLEXES SKALARPRODUKT 21 4. Der Vektorraum der komplexwertigen Funktionen der Form ϕ(x) = e−x auf 2 /2 p(x) , wobei p(x) ein Polynom vom Grad ≤ n ist, mit dem Skalarprodukt ∞ ϕ | ψ = −∞ ∞ = dx ϕ(x)∗ ψ(x) 2 dx e−x p(x)∗ q(x), −∞ −x2 /2 wobei ψ(x) = e q(x). Norm, Einheitsvektor und Orthogonalität zweier Vektoren und ONB (VONS) werden wie im Fall des euklidischen Vektorraumes definiert. Auch den Beweis der Cauchy-Schwarzschen Ungleichung |ϕ | ψ| ≤ ϕ ψ kann man praktisch ungeändert übernehmen, man muss nur ε ∈ wählen, dass εϕ | ψ = |ϕ | ψ| ⇒ (|ε| = 1) so ε∗ ϕ | ψ∗ = |ϕ | ψ| . Aufpassen muss man nur dort, wo die Sesquilinearität stärker in Erscheinung tritt, wie z.B. bei der komplexen Form der Polarisierungsidentität: 1 k i ϕ + ik ψ 2 4 k=1 4 ψ | ϕ = Bemerkung: Die Funktionen en (x) = e2πinx (−N ≤ n ≤ N) bilden eine ONB des in Beispiel 3 angegebenen unitären Vektorraumes. Aus diesem Grund lassen sich die Entwicklungskoeffizienten cn in der Form 1 cn = en | ψ = dx e−2πinx ψ(x) 0 schreiben. Im (formalen) Limes N → ∞ erhält man die Fourierreihe cn e2πinx . ψ(x) = n∈ Im Sinn welches Konvergenzbegriffes sich welche Funktionen ψ(x) durch diese Formel approximieren lassen, wird in den Mathematischen Methoden der Physik II besprochen. KAPITEL 2. UNITÄRE VEKTORRÄUME 22 2.2 Adjungierte Abbildung Die Rolle der transponierten Matrix AT wird im komplexen Fall durch die adjungierte Matrix A† = (AT )∗ übernommen. Die Operation A ∈ L(U n , U m ) → A† ∈ L(U m , U n ) besitzt die folgende Eigenschaften: (c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 , (AB)† = B † A† , A†† = A c1,2 ∈ Fasst man im Raum U n ein Element ⎞ x1 ⎟ ⎜ x = ⎝ ... ⎠ xn ⎛ als n × 1-Matrix auf, dann ist x† = (x∗1 , . . . , x∗n ) und das Skalarprodukt kann in Matrixnotation x | y = x† y geschrieben werden. Die Abbildung x → x† stellt eine Identifizierung“ des U n ” n dar, allerdings ist diese Identifizierung“ mit seinem Dualraum U nicht linear: ” (c1 x1 + c2 x2 )† = c∗1 x†1 + c∗2 x†2 Das Konzept der adjungierten Abbildung kann nun leicht auf den allgemeinen Fall eines beliebigen unitären Raumes U erweitert werden. Da wir ein Skalarprodukt zur Verfügung haben, können wir U mit seinem Dualraum U auf kanonische Weise identifizieren“ . Dazu ordnen wir jedem ϕ ∈ U das Funktional ϕ† ∈ U zu, welches ” durch ϕ† ψ = ϕ | ψ ∀ ψ ∈ U definiert ist. Diese Abbildung führt linear unabhängige Vektoren wieder in linear unabhängige Vektoren über und ist injektiv. Da die Dimension von U mit der seines Dualraums übereinstimmt, ist sie auch surjektiv. Die inverse Abbildung bezeichnen wir ebenfalls mit † , sodass ϕ†† = ϕ gilt. Seien U und V unitäre Vektorräume und A : U → V eine lineare Abbildung. Die zu A adjungierte Abbildung A† : V → U ist durch A† ϕ | ψU = ϕ | AψV ∀ ψ ∈ U, ∀ ϕ ∈ V 2.3. ORTHONORMALBASIS 23 definiert. Diese Definition ist äquivalent mit A† ϕ = (ϕ† A)† ∀ ϕ ∈ V. Die so definierte Abbildung ist wohldefiniert und linear, da † (c1 ϕ1 + c2 ϕ2 )† A † = (c∗1 ϕ†1 + c∗2 ϕ†2 )A A† (c1 ϕ1 + c2 ϕ2 ) = = c1 (ϕ†1 A)† + c2 (ϕ†2 A)† = c1 A† ϕ1 + c2 A† ϕ2 ϕ1,2 ∈ V, c1,2 ∈ . Eigenschaften der adjungierten Abbildung: 1. (c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 , 2. A†† = A, , A1,2 ∈ L(U, V). A ∈ L(U, V). 3. (BA)† = A† B † , 2.3 c1,2 ∈ A ∈ L(U, V), B ∈ L(V, W). Orthonormalbasis Bezüglich einer ONB {ϕ1 , . . . , ϕn } eines n-dimensionalen unitären Vektorraumes U lässt sich jedes ψ ∈ U in der Form ψ= n ϕ k ck k=1 schreiben, wobei die Entwicklungskoeffizienten ck ∈ eindeutig durch ck = ϕk | ψ = ϕ†k ψ gegeben sind. Das heißt, dass ψ= n ϕk ϕ†k ψ ∀ ψ ∈ U, k=1 und man erhält somit die Vollständigkeitsrelation für den Fall eines unitären Vektorraumes: n ϕk ϕ†k = 1 k=1 KAPITEL 2. UNITÄRE VEKTORRÄUME 24 Das bedeutet, dass eine Menge von n Vektoren {ϕ1 , . . . , ϕn } in einem ndimensionalen unitären Vektorraum U genau dann eine ONB von U ist, falls die Bedingungen n ϕk ϕ†k = 1 ϕk | ϕl = δkl , k=1 erfüllt sind. Beispiel: Verifizieren Sie die oben angegebenen Eigenschaften für die folgende ONB von U 2 : 1 1 1 i √ , √ . i 1 2 2 Die Formeln des Gram-Schmidtschen Orthonormalisierungsverfahrens, die wir für euklidische Vektorräume bereits hergeleitet haben, können für den Fall eines unitären Vektorraumes direkt übernommen werden. Man muss nur ( | ) durch | ersetzen und beachten, dass es jetzt auf die Reihenfolge der Variablen im Skalarprodukt ankommt. Ebenso zeigt man, dass jeder n-dimensionale unitäre Vektorraum isomorph zu U n ist. Auch für die Matrixelemente eines linearen Operators ∈ L(U) bezüglich einer ONB {ϕ1 , . . . , ϕn } von U erhält man analog zu früher Akl = ϕk | Aϕl = ϕ†k Aϕl . Für die Matrixelemente des zu A ∈ L(U) adjungierten Operators A† ∈ L(U) erhält man daher bezüglich einer ONB (A† )kl = ϕk | A† ϕl = Aϕk | ϕl = ϕl | Aϕk ∗ = A∗lk . Bemerkung: In der Physik wird oft die sogenannte Diracschreibweise verwendet. Statt ψ ∈ U schreibt man dann |ψ ∈ U (ket-Vektor) und für ein Element des Dualraums ψ † ∈ U verwendet man die Notation ψ| (bra-Vektor). Die etwas seltsame Sprechweise kommt von dem englischen Wort bracket = Klammer = | . In der Diracschreibweise schreibt man z.B. die Vollständigkeitsrelation als n |ϕk ϕk | = 1, k=1 oder oft in der Form n |kk| = 1, k=1 wobei |k kurz für den Vektor |ϕk der gewählten ONB steht. Einige weitere Beispiele mit Übersetzung“ : ” |ϕψ| = ϕψ † 2.4. PROJEKTIONSOPERATOREN 25 |kl| = |ϕk ϕl | = ϕk ϕ†l k|l = ϕk |ϕl = ϕ†k ϕl k |A| l = ϕk |A| ϕl = ϕk | Aϕl = Akl 2.4 Projektionsoperatoren Sei M ein Teilraum eines unitären Vektorraumes U. Dann bezeichnen wir mit M⊥ das orthogonale Komplement von M, welches aus allen Elementen ψ ∈ U mit ϕ|ψ = 0 ∀ ϕ ∈ M besteht. Dann ist M⊥ wieder ein Teilraum von U und M ∩ M⊥ = {0}, denn ψ1,2 ∈ M⊥ ⇒ ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 = 0 ⇒ c1 ψ1 + c2 ψ2 ∈ M⊥ , ψ | ψ = 0 ⇒ ψ = 0. ψ ∈ M ∩ M⊥ ⇒ ∈M ∈M⊥ Mit dem Skalarprodukt von U ist M selbst ein unitärer Raum. Daher besitzt M eine ONB {ϕ1 , . . . ϕm }. Für jeden Vektor ψ ∈ U sei ψM = m ϕk ϕk | ψ = k=1 m ϕk ϕ†k ψ k=1 Dann ist ψM ∈ M und ψ − ψM ∈ M⊥ , weil ϕk | ψ − ψM = ϕk | ψ − ϕk | ψM m ϕl ϕl | ψ = ϕk | ψ − ϕk | l=1 = ϕk | ψ − m l=1 ϕl | ψ ϕk | ϕl = ϕk | ψ − ϕk | ψ = 0 δkl ∀ k = 1, . . . , m ⇒ ψ = ψM + (ψ − ψM ) mit ψM ∈ M und ψ − ψM = ψM⊥ ∈ M⊥ . Diese Darstellung ist eindeutig, weil M ∩ M⊥ = {0} ist, d.h. U = M ⊕ M⊥ und dim M ⊥ = dim U − dim M. Weiters ist M⊥⊥ = M für jeden Teilraum M. Man bezeichnet ψM als die orthogonale Projektion von ψ auf den Teilraum M. Aus der Gleichung ψM = m k=1 ϕk ϕ†k ψ KAPITEL 2. UNITÄRE VEKTORRÄUME 26 sieht man, dass der Operator PM = m ϕk ϕ†k = k=1 m |ϕk ϕk | ∈ L(U) (m ≤ dim U) k=1 die Projektion ψ → ψM auf den m-dimensionalen Teilraum M bewerkstelligt, wobei PM M⊥ = 0. PM heißt daher (orthogonaler) Projektionsoperator oder (orthogonaler) Projektor auf M. PM ist natürlich von der Wahl der ONB {ϕ1 , . . . , ϕm } in M unabhängig. Eigenschaften von PM : 2 = PM (idempotent) wegen PM ψ = ψM , PM ψM = ψM . 1. PM Anderer Beweis: 2 PM = m ϕk ϕ†k k=1 m ϕl ϕ†l = l=1 m ϕk ϕ†k ϕl k,l=1 ϕ†l = m ϕk ϕ†k = PM k=1 δkl † 2. PM = PM (einen Operator mit dieser Eigenschaft nennt man hermitesch oder selbstadjungiert). † PM = m † ϕk ϕ†k = k=1 m ϕk ϕ†k † = k=1 m k=1 † ϕ†† k ϕk = m ϕk ϕ†k = PM k=1 Umgekehrt definiert jeder Operator P ∈ L(U), der die Eigenschaften P 2 = P und P † = P erfüllt, durch sein Bild M = P U einen linearen Teilraum, wobei P M⊥ = 0, da χ | P ψ = P † χ | ψ = P χ | ψ = 0 ∀ ψ ∈ M⊥ , ∀χ ∈ U ∈M wobei P † = P verwendet wurde. Bemerkung: PM⊥ = 1 − PM , PM PM⊥ = 0. PM besitzt die Eigenwerte 0 (falls dim M < dim U = n) und 1, da PM ϕ = ϕ, ∀ ϕ ∈ M und PM ψ = 0 ∀ ψ ∈ M⊥ und U = M ⊕ M⊥ . Man kann die ONB {ϕ1 , . . . , ϕm } von M (die aus n linear unabhängigen Eigenvektoren von PM zum Eigenwert 1 besteht) durch die Hinzunahme einer beliebigen ONB {ϕm+1 , . . . , ϕn } von M⊥ (die aus n − m linear unabhängigen Eigenvektoren von PM zum Eigenwert 0 besteht) zu einem VONS {ϕ1 , . . . , ϕm , ϕm+1 , . . . , ϕn } des ganzen Raumes U = M ⊕ M⊥ ergänzen. 2.5. HERMITESCHE OPERATOREN 2.5 27 Hermitesche Operatoren Definition: Ein Operator A ∈ L(U) (U ist ein unitärer Vektorraum) heißt hermitesch oder selbstadjungiert, wenn A† = A ist. Die Eigenwerte eines hermiteschen Operators sind reell: Sei ψ ∈ U ein Eigenvektror von A mit Eigenwert a (Aψ = aψ). Dann ist ψ | Aψ = ψ | aψ = aψ | ψ. Andererseits ist wegen A† = A ψ | Aψ = A† ψ | ψ = Aψ | ψ = aψ | ψ = a∗ ψ | ψ, und somit (a − a∗ )ψ | ψ = 0. Da ψ als Eigenvektor nicht der Nullvektor sein kann, ist auch ψ | ψ = 0, woraus a = a∗ ∈ folgt. Bemerkung: Die Umkehrung gilt nicht, das heißt ein Operator, der nur reelle Eigenwerte besitzt, ist nicht notwendigerweise hermitesch. Gegenbeispiel im U 2 : 1 0 1 1 † , A= = A = 1 1 0 1 jedoch hat A den (einfach entarteten) Eigenwert 1. Beispiele für hermitesche Operatoren: 1. Die allgemeine Form einer hermiteschen Matrix im U 2 ist a c + id A= , a, b, c, d ∈ . c − id b Überzeugen Sie sich, dass die Eigenwerte von A tatsächlich reell sind. 2. Mit den orthogonalen Projektoren (P 2 = P, P † = P ) haben wir bereits Spezialfälle von hermiteschen Operatoren kennengelernt. Man kann auch sagen, dass die Projektionsoperatoren genau jene hermiteschen Elemente aus L(U) sind, deren Eigenwerte 0 oder 1 sind. 3. In einem unitären Vektorraum U mögen die Vektoren {ϕ1 , . . . , ϕn } ein VONS von U bilden. Dann ist n n † A= ak ϕk ϕk = ak |ϕk ϕk | , ak ∈ k=1 k=1 ein hermitescher Operator. Die reellen Zahlen ak (k = 1, . . . , n) sind Eigenwerte von A und die ONB {ϕ1 , . . . , ϕn } besteht aus Eigenvektoren von A. Wir werden später sehen, dass sich jeder hermitesche Operator in der oben angegebenen Form (Spektraldarstellung) schreiben lässt. KAPITEL 2. UNITÄRE VEKTORRÄUME 28 2.6 Unitäre Operatoren Definition: Ein Operator U ∈ L(U) (U ein unitärer Vektorraum) heißt unitär, falls U invertierbar ist mit U −1 = U † (d.h. U † U = UU † = 1). Bemerkung: Es handelt sich bei einer unitären Transformation offensichtlich um die Verallgemeinerung des bei den euklidischen Vektorräumen besprochenen Konzepts der orthogonalen Transformation. Satz: Sei U ∈ L(U) (U ein unitärer Vektorraum). Dann sind die folgenden Aussagen äquivalent: 1. U ist unitär. 2. Uϕ | Uψ = ϕ | ψ 3. Uψ = ψ ∀ ϕ, ψ ∈ U. ∀ ψ ∈ U. 4. U bildet jede ONB von U wieder auf eine ONB von U ab. Bemerkung: Der Beweis verläuft analog zum euklidischen Fall, man muss jetzt aber die komplexe Version der Polarisierungsidentität verwenden. Sind U1 , U2 ∈ L(U) zwei unitäre Operatoren, dann ist auch das Produkt U1 U2 ein unitärer Operator, da (U1 U2 )−1 = U2−1 U1−1 = U2† U1† = (U1 U2 )† Die Eigenwerte eines unitären Operators haben den Betrag eins, da Uψ = uψ (ψ = 0, u ∈ ) ⇒ ψ | ψ = Uψ | Uψ = uψ | uψ = |u|2 ψ | ψ ⇒ |u| = 1 =0 ⇒ iα u=e , α∈ . Das heißt, das Spektrum (die Menge der Eigenwerte) eines unitären Operators ist eine Teilmenge des Einheitskreises in der komplexen Zahlenebene. Beispiele von unitären Abbildungen: 1. Sei U eine unitäre Matrix auf U n . Dann wird die Standardbasis {e1 , . . . , en } (VONS von U n ) in einanderes VONS von U n {Ue1 , . . . , Uen } = {f1 , . . . , fn } übergeführt. Wegen nk=1 fk fk† = 1 kann man schreiben: U = U1 = U n k=1 ek e†k = n k=1 Uek e†k fk = n fk e†k = (f1 , . . . , fn ), k=1 d.h. die Spalten einer unitären Matrix bilden ein VONS. 2.7. NORMALE OPERATOREN 29 2. Die allgemeine Form einer unitären 2 × 2 Matrix ist daher: a −b∗ U= eiα , a, b ∈ , |a|2 + |b|2 = 1, α ∈ b a∗ . 3. Die Vektoren {ϕ1 , . . . , ϕn } mögen ein VONS eines unitären Vektorraums bilden. Dann ist U= n iαk e ϕk ϕ†k = k=1 n eiαk |ϕk ϕk | , αk ∈ , k=1 ein unitärer Operator. Die komplexe Zahl eiαk ist ein Eigenwert von U mit dazugehörigem Eigenvektor ϕk . Wieder kann man zeigen, dass sich jeder unitäre Operator in der obigen Form schreiben lässt. 2.7 Normale Operatoren Definition: Ein Operator A ∈ L(U) (U ein unitärer Vektorraum) heißt normal, falls AA† = A† A. Bemerkung: Definiert man den Kommutator zweier Operatoren A, B ∈ L(U) durch [A, B] = AB − BA, so ist die Eigenschaft, dass bei einem normalen Operator A und A† vertauschen, gleichbedeutend mit A, A† = 0. Beispiele für normale Operatoren: 1. Hermitesche und unitäre Operatoren sind normal. 2. Sei {ϕ1 , . . . , ϕn } ein VONS eines unitären Vektorraumes U. Dann ist A= n k=1 ak ϕk ϕ†k = n ak |ϕk ϕk | , ak ∈ k=1 ein normaler Operator. Wir werden im nächsten Abschnitt zeigen, dass sich jeder normale Operator in dieser Form schreiben lässt. Das ist die Aussage des Spektralsatzes für normale Operatoren. Dieser behauptet nämlich, dass die normalen Operatoren genau diejenigen sind, die eine ONB von Eigenvektoren besitzen. KAPITEL 2. UNITÄRE VEKTORRÄUME 30 Bemerkungen: 1. Im Raum U 2 ist die Matrix A= 1 1 0 1 nicht normal (AA† = A† A). Diese Matrix hat nur einen Eigenvektor! 2. Für jedes A ∈ L(U) sind A† A und AA† hermitesch. 3. Für jedes A ∈ L(U) sind A1 = 1 A + A† 2 und A2 = 1 A − A† 2i hermitesche Operatoren und es gilt A = A1 + iA2 Der Operator A ist genau dann normal, wenn [A1 , A2 ] = 0 gilt. Daraus ergibt sich, dass man normale Operatoren in gewisser Hinsicht als Verallgemeinerung der komplexen Zahlen interpretieren kann, wobei die hermiteschen Operatoren den reellen Zahlen entsprechen. Die unitären Operatoren (U † U = UU † = 1) stellen das Analogon zu einer komplexen Zahl z mit z ∗ z = 1, d.h. |z| = 1, dar. 2.8 Spektralsatz für normale Operatoren Normale Operatoren lassen sich dadurch charakterisieren, dass sie ein vollständiges Orthonormalsystem von Eigenvektoren besitzen. Die Spektraldarstellung normaler Operatoren ist eine unmittelbare Folgerung aus dieser Eigenschaft. Diese wird in den verschiedensten physikalischen Anwendungen benötigt. Spektralsatz für normale Operatoren: Jeder normale Operator in einem unitären Vektorraum besitzt ein vollständiges Orthonormalsystem von Eigenvektoren. Beweis: Sei A ∈ L(U) ein normaler Operator ( A, A† = 0) in einem ndimensionalen unitären Vektorraum U. Dann besitzt das charakteristische Polynom von A, pA (a) = det(a1 − A), mindestens eine Nullstelle a1 ∈ . Die Eigenwertgleichung Aϕ = a1 ϕ 2.8. SPEKTRALSATZ FÜR NORMALE OPERATOREN 31 besitzt daher eine nichttriviale Lösung ϕ1 = 0, wobei man ϕ1 |ϕ1 = 1 wählen kann. Da A normal ist, ist ϕ1 auch Eigenvektor des adjungierten Operators A† zum Eigenwert a∗1 : A† ϕ1 = a∗1 ϕ1 . Das kann man folgendermaßen sehen: 0 = = = = = (A − a1 )ϕ1 | (A − a1 )ϕ1 ϕ1 | (A − a1 )† (A − a1 )ϕ1 ϕ1 | (A − a1 )(A − a1 )† ϕ1 (A − a1 )† ϕ1 | (A − a1 )† ϕ1 (A† − a∗1 )ϕ1 | (A† − a∗1 )ϕ1 A† ϕ1 = a∗1 ϕ1 ⇒ Man betrachtet nun den (n-1)-dimensionalen Teilraum N = [ϕ1 ]⊥ = {ψ ∈ U | ϕ1 |ψ = 0} . Die Anwendung von A bzw. A† auf Elemente von N führt aus diesem Teilraum nicht heraus, denn für ψ ∈ N gilt ϕ1 | Aψ = A† ϕ1 | ψ = a∗1 ϕ1 | ψ = a1 ϕ1 | ψ = 0 und ϕ1 | A† ψ = Aϕ1 | ψ = a1 ϕ1 | ψ = a∗1 ϕ1 | ψ = 0. Man kann daher A als Opertaor auf N auffassen, der natürlich auch normal ist. Man wiederholt nun das Verfahren von vorhin und erhält ein ϕ2 ∈ N (d.h. ϕ2 |ϕ1 = 0), ϕ2 = 1, mit Aϕ2 = a2 ϕ2 . Die weitere Fortsetzung dieser Prozedur liefert nach insgesamt n Schritten ein VONS {ϕ1 , . . . , ϕn } von Eigenvektoren von A: Aϕk = ak ϕk . Zur Spektraldarstellung eines normalen Operators, A= n ak ϕk ϕ†k = k=1 n ak |ϕk ϕk | , k=1 gelangt man nun einfach durch die Verwendung der Vollständigkeitsrelation für die ONB {ϕ1 , . . . , ϕn }: A = A1 = A n k=1 ϕk ϕ†k = n k=1 Aϕk ϕ†k = n k=1 ak ϕk ϕ†k KAPITEL 2. UNITÄRE VEKTORRÄUME 32 Bemerkung: Sei A ∈ L(U n ) eine normale n × n-Matrix. Dann gibt es ein VONS {f1 , . . . , fn } von Eigenvektoren von A: fk† fl = δkl , n fk fk† = 1, Afk = ak fk . k=1 ⎛ A= n k=1 ⎜ fk ak fk† = (f1 , . . . , fn ) ⎝ U a1 ⎞⎛ ⎞ f1† ⎟ ⎜ .. ⎟ .. ⎠⎝ . ⎠ . an fn†  Die Matrizen U= n U† fk e†k = (f1 , . . . , fn ) k=1 und ⎞ f1† ⎟ ⎜ ek fk† = ⎝ ... ⎠ U† = k=1 fn† ⎛ n sind unitär (UU † = U † U = 1). Der Spektralsatz besagt also, dass man jede normale n × n-Matrix in der Form A = U ÂU † schreiben kann, wobei U unitär ist und  die aus den Eigenwerten a1 , . . . , an gebildete Diagonalmatrix  = diag(a1 , . . . , an ) ist. Multipliziert man die obige Gleichung von links mit U † und von rechts mit U, so erhält man U † AU =  d.h. eine n × n-Matrix lässt sich genau dann durch eine unitäre Transformation auf Diagonalgestalt bringen, wenn sie normal ist. An dieser Stelle sei an den allgemeinen Fall einer diagonalisierbaren n × n-Matrix erinnert, bei der eine Basis {f1 , . . . , fn } von Eigenvektoren Afk = ak fk existiert. Bildet man die Matrix S = (f1 , . . . fn ), so ist S −1 AS =  = diag(a1 , . . . , an ) die gewünschte Diagonalisierung. In unserem Fall einer normalen Matrix haben wir also den Spezialfall, dass die Eigenvektoren eine ONB bilden und S daher unitär ist (S −1 = S † ). Kochrezept für das Diagonalisieren einer normalen n × n-Matrix A (d.h. einer Matrix mit A, A† = 0): 1. Man berechne das charakteristische Polynom von A: pA (a) = det(a1 − A) 2.8. SPEKTRALSATZ FÜR NORMALE OPERATOREN 33 2. Man berechne die Eigenwerte von A, indem man die Nullstellen des charakteritischen Polynoms bestimmt. Es kann natürlich vorkommen, dass manche der Eigenwerte entartet sind. 3. Man ermittle die dazugehörigen Eigenvektoren fk aus der Eigenwertgleichung Afk = ak fk und normiere sie ( fk = 1). Eigenvektoren zu verschiedenen Eigenwerten (ak = al ) sind automatisch orthogonal, denn † fk† Afl = al fk† fl = A† fk fl = ak fk† fl ⇒ (ak − al ) fk† fl = 0 fk† fl = 0. ⇒ =0 Ist ein Eigenwert d-fach entartet, so gibt es d linear unabhängige Eigenvektoren (d.h. der Eigenraum dieses Eigenwertes ist d-dimensional). Diese Eigenvektoren können aber stets orthonormal gewählt werden. Auf diese Weise erhält man ein VONS {f1 , . . . , fn } von U n . 4. Man bilde die unitäre Matrix U = (f1 , . . . , fn ) mit den Eigenvektoren als Spalten ⇒ U † AU =  = diag(a1 , . . . , an ). Beispiele: 1. Die Matrix R= cos θ − sin θ sin θ cos θ ist in U 2 unitär, ihre Eigenwerte sind e±iθ , die dazugehörigen normierten Eigenvektoren sind 1 1 (zum Eigenwert e+iθ ), f1 = √ −i 2 1 1 (zum Eigenwert e−iθ ). f2 = √ i 2 somit ist 1 U = (f1 , f2 ) = √ 2 und 1 1 −i i U † RU = diag eiθ , e−iθ . KAPITEL 2. UNITÄRE VEKTORRÄUME 34 2. Die 3 × 3-Matrix ⎛ ⎞ 1 −2 1 A = ⎝ −2 1 1 ⎠ 1 1 −2 ist hermitesch, die Eigenwerte müssen daher reell sein. Für das charakteristische Polynom erhält man pA (a) = a(a2 − 9) und somit die Eigenwerte a1 = 0, a2 = 3, a3 = −3. Die Eigenwertgleichungen Af1 = 0, Af2 = 3f2 , Af3 = −3f3 ergeben die (normierten) Lösungen ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 1 1 1 1 1 f1 = √ ⎝ 1 ⎠ , f2 = √ ⎝ −1 ⎠ , f3 = √ ⎝ 1 ⎠ , 3 2 6 1 0 −2 Man überprüft leicht, dass {f1 , f2 , f3 } tatsächlich eine ONB von U 3 ist. Ebenso kann man als Probe die Spektraldarstellung A= 3 ak fk fk† = 3 f2 f2† − f3 f3† k=1 überprüfen“. Für die unitäre Matrix U = (f1 , f2 , f3 ), welche die Diagona” lisierung von A in der Form U † AU = diag(0, 3, −3) bewerkstelligt, erhält man daher ⎞ ⎛ ⎜ U =⎝ √1 3 √1 3 √1 3 √1 2 − √12 0 √1 6 √1 6 − √26 ⎟ ⎠. Bemerkung: Wir haben die Spektraldarstellung eines normalen Operators A in einem n-dimensionalen unitären Raum so formuliert, dass wir A als Linearkombination von eindimensionalen Projektionsoperatoren |ϕk ϕk | geschrieben haben, n ak |ϕk ϕk | . A= k=1 Wenn es entartete Eigenwerte gibt, dann sind einige der ak gleich und es ist möglich die entsprechenden Terme zusammenzufassen. Dazu ändern wir unsere Notation etwas ab: {aα }m α=1 sei das Spektrum von A (d.h. aα = aβ für α = β). a1 , . . . , am bezeichnen also jetzt die m ≤ n verschiedenen Eigenwerte von A mit dazugehörigen Eigenräumen Mα (α = 1, . . . , m), die paarweise aufeinander orthogonal stehen: Mα ⊥ Mβ für α = β, U = M 1 ⊕ · · · ⊕ Mm . 2.9. GLEICHZEITIGE DIAGONALISIERBARKEIT 35 Durch eine geeignete Umbenennung der Vektoren der ONB {|ϕ1 , . . . , |ϕn } in {| α, r} r = 1, . . . dα = dim Mα α = 1, . . . m, kann man die Projektoren auf die Eigenräume Mα (α = 1, . . . , m) in der Form PMα = dα | α, rα, r | r=1 schreiben. Die Tatsache, dass die PMα orthogonale Projektionsoperatoren auf die paarweise orthogonal stehenden Teilräume M1 , . . . , Mm sind, drückt sich durch die Relationen † PMα PMβ = δαβ PMα , PM = PMα α aus. Zusammen mit der Vollständigkeitsrelation m PMα = 1 α=1 gelangen wir schließlich zur gewünschten alternativen Formulierung der Spektraldarstellung von A: m A= aα PMα . α=1 2.9 Gleichzeitige Diagonalisierbarkeit Das folgende Kriterium für die gleichzeitige Diagonalisierbarkeit normaler Operatoren wird vor allem in der Quantenmechanik oft benötigt. Satz: A, B ∈ L(U) seien normale Operatoren, die miteinander vertauschen ([A, B] = 0). Dann gibt es eine gemeinsame ONB von Eigenvektoren für beide Operatoren. Beweis: Seien aα (α = 1, . . . m) die verschiedenen Eigenwerte von A und Mα die entsprechenden Eigenräume. ψ ∈ Mα ⇒ Bψ ∈ Mα , denn ABψ = BAψ = Baα ψ = aα Bψ ⇒ B|Mα ist ein normaler Operator auf Mα ⇒ ∃ ONB von Mα {|α, 1, . . . |α, dα} von Eigenvektoren von B. Außerdem ist natürlich A|α, r = aα |α, r. Die Vektoren |α, r (α = 1, . . . m, r = 1, . . . , dα = dim Mα ) bilden ein VONS von U, das aus Eigenvektoren von A und B gebildet wird. Bemerkung: Für normale n × n-Matrizen A, B mit [A, B] = 0 bedeutet das: ∃ unitäre Matrix U, sodass U † AU und U † BU Diagonalmatrizen sind. (A und B sind gleichzeitig diagonalisierbar.) KAPITEL 2. UNITÄRE VEKTORRÄUME 36 2.10 Funktionen normaler Operatoren Funktionen von linearen Operators treten etwa bei der Behandlung von Systemen linearer Differentialgleichungen, der Beschreibung von Symmetrietransformationen und der Zeitentwicklung in der Quantenmechanik auf. Die Berechnung der Funktion eines normalen Operators ist erstaunlich einfach. Sie kann auf die Bestimmung der Funktionswerte auf dem Spektrum des Operators zurückgeführt werden. Um dies zu sehen, gehen wir von der Spektraldarstellung eines normalen Operators A in der Form n A= ak ϕk ϕ†k k=1 aus. Multipliziert man diesen Ausdruck mit sich selbst (was einer nochmaligen Anwendung der Abbildung A entspricht), so erhält man 2 A = AA = n ak ϕk ϕ†k k=1 = n n al ϕl ϕ†l l=1 = n k,l=1 ak al ϕk ϕ†k ϕl ϕ†l δkl a2k ϕk ϕ†k k=1 bzw. für beliebiges m ∈ , · · A = A =A · m m-mal n † am k ϕk ϕk . k=1 Ebenso erhält man für ein Polynom von A den Ausdruck n n † m m cm A = cm ak ϕk ϕk = p(ak )ϕk ϕ†k . p(A) = m k=1 m k=1 Für eine beliebige komplexwertige Funktion f , die auf dem Spektrum des normalen Operators A ∈ L(U) (das ist die Menge der Eigenwerte von A) definiert ist, kann man f (A) ∈ L(U) daher durch f (A) = n f (ak )ϕk ϕ†k k=1 definieren, wobei f (A) natürlich wieder ein normaler Operator ist. 2.10. FUNKTIONEN NORMALER OPERATOREN 37 Beispiele: 1. Sei A ∈ L(U n ) eine normale n×n-Matrix. A =U ÂU † ,  = diag(a 1 , . . . , an ), † U unitär ⇒ f (A) = Uf (Â)U , f (Â) = diag f (a1 ), . . . , f (an ) . 2. Sei U ∈ L(U) ein unitärer Operator. Seine Eigenwerte haben dann die Gestalt eiαk (α ∈ ) und die Spektraldarstellung lautet U= n eiαk ϕk ϕ†k = eiA , k=1 wobei A = n † k=1 αk ϕk ϕk = A† . Das heißt, jeder unitäre Operator kann in der Form U = eiA , A = A† , geschrieben werden. 3. Die Funktion f (A) eines normalen Operators A in einem zweidimensionalen unitären Raum kann als Linearkombination des Einheitsoperators und von A selbst geschrieben werden. Sind die zwei möglichen Eigenwerte entartet, so ist A = a1 und daher f (A) = f (a)1, womit die Behauptung offensichtlich erfüllt ist. Im Fall verschiedener Eigenwerte (a1 = a2 ) hat man A = a1 P1 + a2 P2 , P1 + P2 = 1, wobei P1 = ϕ1 ϕ†1 , P2 = ϕ2 ϕ†2 die beiden eindimensionalen Projektoren auf die von den Eigenvektoren ϕ1,2 aufgespannten Eigenräume sind. Aus der Spektraldarstellung und der Vollständigkeitsrelation kann man die beiden Projektionsoperatoren als Linearkombinationen von 1 und A schreiben: P1 = A − a2 , a1 − a2 P2 = A − a1 . a2 − a1 Somit erhält man A − a2 A − a1 + f (a2 ) a1 − a2 a1 − a2 f (a2 )a1 − f (a1 )a2 f (a1 ) − f (a2 ) = 1+ A. a1 − a2 a1 − a2 f (A) = f (a1 )P1 + f (a2 )P2 = f (a1 ) KAPITEL 2. UNITÄRE VEKTORRÄUME 38 4. In der Quantenmechanik treten bei der Beschreibung des Spin 1/2-Systems die Paulischen Spinmatrizen 0 1 0 −i 1 0 , σ2 = , σ3 = σ1 = 1 0 i 0 0 −1 auf. Sie sind in U 2 hermitesch mit Eigenwerten ±1. Sie erfüllen die Vertauschungsrelationen [σk , σl ] = 2i 3 klm σm m=1 und die Antivertauschungsrelationen σk σl + σl σk = 2δkl . Bildet man die Linearkombination n · σ = 3 ni σi k=1 mit einem Einheitsvektor ⎛ ⎞ n1 ⎝ n2 ⎠ ∈ n3 3 , n21 + n22 + n23 = 1, so ist n · σ wieder hermitesch mit Eigenwerten ±1. Bei der Beschreibung der räumlichen Drehung eines Spins um den Winkel α mit Drehachse n, tritt die Matrix e−iαn·σ/2 auf. Überprüfen Sie, dass diese Matrix in der Form e−iαn·σ/2 = 1 cos α α − in · σ sin 2 2 geschrieben werden kann. Hinweis: Wenden Sie die Formel von Beispiel 3 an. 2.11 Anwendung des Spektralsatzes auf relle Matrizen Einige Resultate über reelle n × n Matrizen erhält man auf sehr einfache Weise dadurch, dass man sie als Abbildungen in einem unitären Vektorraum auffasst. 2.11. ANWENDUNG DES SPEKTRALSATZES AUF RELLE MATRIZEN 39 A ∈ L(E n ) sei eine reelle n × n-Matrix mit AT A = AAT . Lässt sich dann A durch eine orthogonale Transformation auf Diagonalgestalt bringen? Das Beispiel a b A= a, b ∈ −b a zeigt, dass das im Allgemeinen nicht möglich ist, denn die Eigenwerte sind a ± ib und das Produkt reeller Matrizen ist wieder reell, kann also nie eine komplexe Diagonalmatrix ergeben. Allerdings ist das in gewisser Weise das einzige Gegenbeispiel. Sei also A = A∗ mit AT A = AAT , dann können wir A als Operator im U n auffassen und wir wissen, dass es ein VONS von Eigenvektoren {f1 , . . . , fn } gibt, die im Allgemeinen komplex sind. Seien also aα (α = 1, . . . , m) die verschiedenen Eigenwerte von A mit Vielfachheit dα . Wir unterscheiden zwei Fälle: 1. aα ∈ Af1 = aα f1 , 0 = f1 = p1 + iq2 , A(p1 + iq1 ) = aα (p1 + ip2 ) ⇒ Ap1 + iAq1 = aα p1 + iaα p2 p1 , q1 ∈ n Vergleich von Real- und Imaginärteil auf der linken und der rechten Seite ergibt: Ap1 = aα p1 , Aq1 = aα q1 Da f1 = p1 + iq1 = 0 ist entweder p = 0 oder q = 0 (oder beide), d.h. es gibt eine reelle Lösung r1 für den Eigenvektor. Ist nun dα = 1, dann sind wir fertig, ist dα ≥ 2, dann betrachten wir [r1 ]⊥ . Das heißt, wir suchen einen Vektor f2 = 0 mit r1† f2 = r1T f2 = 0 und Af2 = aα f2 (die Existenz von f2 ist klar). Wir zerlegen f2 wieder in Real- und Imaginärteil: f2 = p2 + iq2 , ⇒ r1† p2 = r1T p2 = 0, r1† q2 = r1T q2 = 0, p2 , q2 ∈ n Ap2 = aα p2 , Aq2 = aα q2 . Da f2 = 0, ist wieder p2 = 0 oder q2 = 0. Auf diese Weise erhält man eine reelle Lösung r2 der Eigenwertgleichung Ar2 = aα r2 mit r1T r2 = 0. Setzt man dieses Verfahren fort, so erhält man dα reelle Eigenvektoren zum Eigenwert aα , die ein Orthonormalsystem bilden: Ark = aα rk , k = 1, . . . , dα, rk ∈ n , rkT rl = δkl . KAPITEL 2. UNITÄRE VEKTORRÄUME 40 / 2. aα ∈ ⇒ Ag = aα g, Ag ∗ = a∗α g ∗ g∈ n , g†g = 1 Da laut Vorraussetzung aα = a∗α ist, stehen die Vektoren g und g ∗ aufeinander orthogonal (g †g ∗ = 0). Schreibt man g in der Form g= x + iy √ , 2 x, y ∈ n , so ergibt sich 1 0 = g †g ∗ = (x + iy)† (x − iy) 2 1 T = x x − y T y − ixT y − iy T x 2 1 T = x x − y T y − 2ixT y 2 ⇒ xT x = y T y, xT y = 0. Aus der Normierung erhält man 1 1 1 = g † g = (x + iy)† (x + iy) = (xT x + y T y) 2 2 und zusammen mit xT x = y T y somit xT x = y T y = 1. Zerlegt man die Eigenwertgleichung A(x + iy) = (Re aα + i Im aα ) (x + iy) in Real- und Imaginärteil, so erhält man Ax = x Re aα − y Im aα , Ay = x Im aα + y Re aα . Die Matrixdarstellung von A in dem von x und y gebildeten Unterraum ist also Re aα Im aα . −Im aα Re aα Die Eigenvektoren {r1 , . . . , rs , g1 , g1∗ , . . . , gt , gt∗ } (rk ∈ n , s + 2t = n) bilden ein VONS in U n . Aus diesem kann man durch √ √ xk = 2 Re gk ∈ n , yk = 2 Im gk ∈ n 2.11. ANWENDUNG DES SPEKTRALSATZES AUF RELLE MATRIZEN 41 eine ONB des E n erhalten: {r1 , . . . , rs , x1 , y1 , . . . , xt , yt } . Bezüglich dieser Basis erhält man die Fast-Diagonalgestalt ⎞ ⎛ a1 .. ⎟ ⎜ . ⎟ ⎜ ⎟ ⎜ a ⎟ ⎜ s =⎜ S T AS = A ⎟. Bs+1 ⎟ ⎜ ⎟ ⎜ . ⎠ ⎝ .. Bs+t mit den 2 × 2-Blöcken Bl der Form Re al Im al Bl = −Im al Re al und der orthogonalen Matrix S = (r1 , . . . , rs , x1 , y1, . . . , xt , yt ) Besonders wichtig ist der Spezialfall einer reellen symmetrischen Matrix A, d.h. einer Matrix mit AT = A. Das ist der Spezialfall einer hermiteschen Matrix, daher sind alle Eigenwerte reell und A kann durch eine orthogonale Transformation S auf Diagonalgestalt gebracht werden: S T AS = diag(a1 , . . . , an ), S T S = SS T = 1. Beispiel: Eine quadratische Form n xi , Aij = Aji ∈ xi Aij xj = xT Ax, i,j=1 kann durch eine orthogonale Transformation x = Sy auf die besonders einfache Hauptachsenform n T y Ây = ai yi2 i=1 gebracht werden (Hauptachsentransformation). Beweis: A = S ÂS T ⇒ xT Ax = xT S ÂS T x T T T T = (S x) ÂS x = y Ây = n i=1 wobei y = S x ⇔ x = Sy. T ai yi2 , 42 KAPITEL 2. UNITÄRE VEKTORRÄUME Kapitel 3 Einfache Quantensysteme Die in der Theorie der unitären Räume eingeführten mathematischen Konzepte haben eine unmittelbare Entsprechung zu jenen grundlegenden physikalischen Begriffen, die bei der Formulierung der Grundpostulate der Quantentheorie verwendet werden. Obwohl man zur Beschreibung der meisten realistischen quantenmechanischen Systeme unendlichdimensionale Hilberträume benötigt, können die wesentlichen Grundideen der mathematischen Struktur der Quantentheorie bereits an Hand des einfacheren Spezialfalls eines endlichdimensionalen Zustandsraumes erläutert werden. 3.1 Grundpostulate der Quantentheorie Zu jedem quantenmechanischen System gibt es einen geeigneten Hilbertraum H, den sogenannten Zustandsraum des betrachteten Systems. Obwohl der Zustandsraum i.Allg. unendlichdimensional ist, gibt es physikalische Probleme, bei denen nur ein endlicher Teilraum des gesamten Hilbertraums relevant ist. Wir wollen uns also bei der Formulierung der Axiome der Quantentheorie auf Systeme beschränken, die sich durch einen endlichdimensionalen Zustandsraum H (unitären Vektorraum) beschreiben lassen. Die beobachtbaren Größen (Observable) des betrachteten quantenmechanischen Systems werden durch die hermiteschen Elemente der Observablenalgebra L(H) repräsentiert. Beispiele für Observable wären etwa die Energie oder der Drehimpuls des Systems. Der wesentliche Unterschied zur klassischen Physik liegt darin, dass man es in der Quantenmechanik mit einer nichtkommutativen Obervablenalgebra zu tun hat, d.h. es gibt Operatoren A, B ∈ L(H) mit [A, B] = 0. 43 KAPITEL 3. EINFACHE QUANTENSYSTEME 44 Die möglichen Messwerte der durch den hermiteschen Operator A ∈ L(H) beschrieben Observablen sind die Elemente des Spektrums von A (d.h. die Eigenwerte von A). D.h. bei einer Messung der Observablen A kann als Messergebnis immer nur einer der Eigenwerte a1 , . . . , an von A auftreten. Bemerkung: Eine besondere Rolle spielen die Projektionsoperatoren, die als hermitesche Operatoren ja ebenfalls beobachtbare Größen repräsentieren. Ist ein hermitescher Operator durch seine Spektraldarstellung A= m aα Pα α=1 gegeben (m ist die Anzahl der verschiedenen Eigenwere von A), so entspricht dem Projektor Pα (der auf den Eigenraum des Eigenwertes aα projiziert) die Durchführung des folgenden ja-nein-Experiments: Erhält man bei einer Messung ” der Observablen A den Messwert aα ?“ Da der Projektionsoperator Pα nur die Eigenwerte 1 und 0 besitzt, entspricht dem Eigenwert 1 die Antwort ja“ und ” dem Eigenwert 0 die Antwort nein“. ” Die möglichen Zustände des Systems werden durch lineare Funktionale auf der Observablenalgebra beschrieben, die zusätzlich nicht negativ und normiert sind. Bei einem Zustand ω handelt es sich also um eine Abbildung ω : L(H) → mit folgenden Eigenschaften: 1. ω(c1 A1 + c2 A2 ) = c1 ω(A1 ) + c2 ω(A2 ), 2. ω(A† A) ≥ 0 c1,2 ∈ , A1,2 ∈ L(H) ∀ A ∈ L(H) 3. ω(1) = 1 Durch den Zustand ω wird jeder Observablen A ihr Erwartungswert ω(A) zugeordnet. Für den Projektionsoperator Pα = Pα† = Pα Pα erhält man wegen der Eigenschaft 2 pα = ω(Pα ) = ω(PαPα ) = ω Pα† Pα ≥ 0. pα = ω(Pα ) ist die Wahrscheinlichkeit bei einer Messung der Observablen A den Messwert aα zu erhalten, wenn sich das System in dem durch ω beschriebenen Zustand befindet. Wegen der Vollständigkeitsrelation m Pα = 1 α=1 und der Linearität der Normierung von ω erhält man m m m pα = ω(Pα ) = ω Pα = ω(1) = 1 α=1 α=1 α=1 3.1. GRUNDPOSTULATE DER QUANTENTHEORIE 45 für die Wahrscheinlichkeit irgendeinen der Eigenwerte von A zu messen. Der Erwartungswert von A im Zustand ω lässt sich dann, wieder unter Verwendung der Linearität von ω, in der Form m m m ω(A) = ω aα Pα = aα ω(Pα) = aα pα α=1 α=1 α=1 schreiben. Präpariert man eine große Anzahl N von identischen Kopien des Systems alle im gleichen Zustand ω und führt dann an jeder dieser Kopien eine Messung der Observablen A durch, so wird man Nα -mal den Messwert aα erhalten, wobei Nα −→ pα N N →∞ und m α=1 Nα = N ist. Für den Mittelwert der Messwerte ergibt sich daher m m Nα aα aα pα = ω(A). −→ N N →∞ α=1 α=1 Beispiele von Zuständen: 1. ψ ∈ H sei ein Einheitsvektor. Dann wird durch ω(A) = ψ|Aψ ∀ A ∈ L(H) ein sogenannter reiner Zustand definiert. Man überzeugt sich leicht, dass die Eigenschaften 1-3 tatsächlich erfüllt sind. Man nennt ψ dann den Zustandsvektor des entsprechenden reinen Zustands. Bemerkung: Der Zustandsvektor eiϕ ψ beschreibt den selben Zustand. 2. ω1 , ω2 , . . . , ωr seien Zustände r und p1 , p2 , . . . , pr positive Zahlen mit r j=1 pj = 1. Dann ist ω = j=1 pj ωj ebenfalls ein Zustand. Insbesondere wird durch r ω(A) = pj ψj |Aψj ∀A ∈ L(H) j=1 ein Zustand definiert, wenn die |ψj (nicht notwendigerweise aufeinander normal stehende) Zustandsvektoren (ψj |ψj = 1) sind. Zustände, die man nicht in der Form ω(A) = ψ|Aψ schreiben kann, heißen gemischte Zustände. Man kann eine Standardform für die Beschreibung von Zuständen angeben. Da ω(A) linear in A ist, muss sich ω(A) in der Form ω(A) = ρkl Alk k,l KAPITEL 3. EINFACHE QUANTENSYSTEME 46 schreiben lassen, wobei Alk = ϕl |Aϕk die Matrixelemente des Operators A bezüglich einer beliebigen ONB {ϕ1 , . . . , ϕn } (n = dim H) sind. Die Koeffizikann man dann ebenfalls als die Matrixelemente eines Operators enten ρkl ∈ ρ ∈ L(H) bezüglich der selben ONB auffassen (ρkl = ϕk |ρϕl ). ⇒ n n ω(A) = ϕk | ρϕl ϕl | Aϕk k=1 l=1 n ϕk | ρAϕk = Tr(ρA), = k=1 wobei die Spur eines Operators B, n n TrB = ϕk | Bϕk = Bkk k=1 k=1 unabhängig von der gewählten Basis ist. (Tr = trace = Spur). Bis jetzt wurde nur die Linearität von ω verwendet. Die Eigenschaft ω A† A ≥ 0 ∀ A ∈ L(H) liefert eine weitere Einschränkung an den Operator ρ. Nimmt man für A nämlich den eindimensionalen Projektor A = |ϕϕ| (wobei |ϕ ein beliebiger Einheitsvektor ist), so erhält man wegen A† A = A ϕ | ρϕ ≥ 0. Ergänzt man nämlich |ϕ zu einer ONB {|ϕ, |ϕ2, . . . , |ϕn } von H, so ergibt sich n ϕk | ρϕ ϕ | ϕk Tr ρA A = Tr (ρA) = ϕ | ρϕ ϕ | ϕ + † 1 k=2 0 = ϕ | ρϕ ≥ 0 und daher mit |ψ = c|ϕ (c ∈ ) die Aussage ψ | ρψ ≥ 0 ∀ ψ ∈ H. Einen Operator mit dieser Eigenschaft nennt man nicht negativ (ρ ≥ 0). Man kann zeigen, dass die folgenden Aussagen äquivalent sind: 1. ψ | ρψ ≥ 0 ∀ ψ ∈ H. 2. ρ ist hermitesch und alle Eigenwerte sind ≥ 0. 3.1. GRUNDPOSTULATE DER QUANTENTHEORIE 47 3. Es gibt einen Operator A ∈ L(H), sodass ρ = A† A. Beweis: 1 ⇒ 2 : Es seien ψk und ψl zwei aufeinander orthogonal stehende Einheitsvektoren. Dann ist laut Vorraussetzung ψk + ψl |ρ(ψk + ψl ) = ρkk + ρll +ρkl + ρlk ≥ 0 ≥0 ⇒ Im(ρkl + ρlk ) = 0, ≥0 ψk + iψl |ρ(ψk + iψl ) = ρkk + ρll +iρkl − iρlk ≥ 0 ≥0 ⇒ ⇒ Re(ρkl − ρlk ) = 0, ≥0 ρkl = ρ∗lk ⇒ ρ = ρ† . Ist nun χk = 0 ein Eigenvektor von ρ zum Eigenwert ρk , so ist χk |ρχk = χk |ρk χk = ρk χk |χk ≥ 0 ⇒ ρk ≥ 0. >0 2 ⇒ 3 : Laut Voraussetzung gibt es eine ONB {χ1 , . . . , χn } von Eigenvektoren von ρ mit Eigenwerten ρk ≥ 0. In der Spektraldarstellung hat ρ die Gestalt ρ= n ρk |χk χk | k=1 Man kann hier problemlos den hermiteschen (und ebenfalls nicht negativen) Operator n √ √ ρ= ρk |χk χk | k=1 √ √ √ √ bilden und erhält ρ = ρ ρ = ( ρ)† ρ. 3 ⇒ 1 : ψ|ρ|ψ = ψ|A† Aψ = Aψ|Aψ ≥ 0. Die Implikationskette 1 ⇒ 2 ⇒ 3 ⇒ 1 ist somit geschlossen und die Äquivalenz von 1,2,3 gezeigt. Jede dieser drei Eigenschaften kann daher zur Definition eines nicht negativen Operators herangezogen werden. Es gibt also eine ONB {χ1 , . . . , χn } von Eigenvektoren von ρ mit Eigenwerten ρk ≥ 0. Schließlich impliziert die Normierungsbedingung ω(1) = Trρ = 1 ⇒ n ρk = 1. k=1 Der Dichteoperator ρ= n k=1 ρk |χk χk | , ρk ≥ 0, Trρ = n k=1 ρk = 1, KAPITEL 3. EINFACHE QUANTENSYSTEME 48 liefert also mit ω(A) = Tr(ρA) ∀ A ∈ L(H) die gewünschte Standardform für die Darstellung des Zustands ω. Man kann sich also einen beliebigen Zustand ω als statistisches Gemisch von reinen Zuständen (repräsentiert durch die Zustandsvektoren |χk ) vorstellen, wobei |χk mit der Wahrscheinlichkeit ρk auftritt. Ein reiner Zustand ist dadurch charakterisiert, dass alle ρk bis auf eines verschwinden. Der Dichteoperator, der dem Zustandsvektor |ψ entspricht, ist ρψ = |ψψ|, also ein eindimensionaler Projektor (ρ†ψ = ρψ , ρ2ψ = ρψ ). Die Eigenschaft ρ2 = ρ charakterisiert jene Dichteoperatoren, die reinen Zuständen entsprechen, denn in diesem Fall kann n ρ nur die Eigenwerte 0, 1 besitzen und wegen der Normierungsbedingung k=1 ρk = 1 kann der Eigenwert 1 nur ein einziges Mal auftreten ⇒ ρ = |ψψ|. Für den Erwartungswert eines Operators A in einem beliebigen (gemischten) Zustand ergibt sich ω(A) = Tr(ρA) = n χk | ρAχk = k=1 n ρk χk | Aχk . k=1 Hat A die Spektraldarstellung A= m aα Pα , α=1 so erhält man ω(A) = n m k=1 α=1 ρk χk | Pα χk aα . pkα Es treten hier sowohl die quantenmechanischen“ Wahrscheinlichkeiten pkα als ” auch die klassischen“ statistischen Wahrscheinlichkeiten ρk auf. pkα ist die Wahr” scheinlichkeit bei einer Messung der Observablen A in dem durch den Zustandsvektor |χk beschriebenen reinen Zustand den Messwert aα zu erhalten. Dagegen ist ρk die Wahrscheinlichkeit in dem gemischten Zustand ω den durch |χk beschriebenen reinen Zustand vorzufinden. Die Wahrscheinlichkeit bei einer Messung von A im Zustand ω den Messwert aα zu erhalten, ist daher ω (Pα ) = n ρk χk | Pα χk = k=1 n ρk pkα . k=1 Ist ωψ ein reiner Zustand (mit Dichteoperator ρψ = |ψψ|), so vereinfachen sich die Formeln: ωψ (A) = ψ | Aψ = m α=1 ωψ (Pα ) = ψ | Pα ψ. ψ | Pα ψaα , 3.2. SPIN 1/2 SYSTEM 49 Verwendet man die Spektraldarstellung Pα = dα |α, rα, r| r=1 des Projektors auf den Eigenraum Mα , so kann man auch schreiben: ωψ (Pα ) = dα ψ | α, rα, r | ψ = dα r=1 |α, r | ψ|2 . r=1 Ist dα = 1, so hat man einfach ωψ (Pα ) = |α|ψ|2. Beispiele für Dichteoperatoren gemischter Zustände: 1. Sei dim H = n, dann beschreibt der Dichteoperator ρ = 1/n den Zustand mit maximaler Mischung. 2. Jener hermitesche Operator, welcher der Observablen Gesamtenergie des ” Systems“ entspricht, wird als Hamiltonoperator H bezeichnet. Befindet sich das betrachtete System im thermischen Gleichgewicht mit einem Wärmebad“ der absoluten Temperatur T , so wird der entsprechende ” Zustand des Systems durch den Dichteoperator ρ= e−H/kT Tre−H/kT beschrieben, wobei k 1.38 × 10−23 JK−1 die Boltzmann-Konstante ist. Ist {|ϕ1 , . . . , |ϕn } eine ONB von Eigenvektoren von H, H|ϕk = Ek |ϕk , ϕk |ϕl = δkl , n |ϕk ϕk | = 1, k=1 so ist die Spektraldarstellung des Dichteoperators durch ρ= n e−El /kT l=1 Z |ϕl ϕl | , Z= n e−El /kT l=1 gegeben. 3.2 Spin 1/2 System Die doch einigermaßen abstrakten allgemeinen Spielregeln der Quantentheorie sollen nun durch ihre Anwendung auf ein möglichst einfaches quantenmechanisches System mit etwas mehr Leben erfüllt werden. KAPITEL 3. EINFACHE QUANTENSYSTEME 50 Sieht man von den Translationsfreiheitsgraden eines Elektrons (oder eines beliebigen anderen Spin 1/2 Teilchens) ab, so werden seine Spinfreiheitsgrade durch einen zweidimensionalen Zustandsraum beschrieben. Da ein zweidimensionaler unitärer Vektorraum isomorph zu U 2 ist, kann man die Zustandsvektoren durch komplexe zweidimensionale Spaltenvektoren darstellen, die Observablenalgebra ist dann nichts anderes als die Menge der komplexen 2 × 2-Matrizen. Den drei entsprechen räumlichen Komponenten S1 , S2 , S3 des Spindrehimpulsvektors S die hermiteschen Matrizen Sk = h̄ σk 2 (1 ≤ k ≤ 3) mit den bereits früher besprochenen Paulischen Spinmatrizen σk . Die Komponenten des Spinvektors in einer beliebigen räumlichen Richtung n (|n| = 1) wird durch die Matrix h̄ h̄ h̄ nk σk = n · σ = 2 2 k=1 2 3 n1 − in2 n3 n1 + in2 −n3 beschrieben. Die Eigenwerte dieser Matrix sind ±h̄/2, d.h. bei der Messung einer Spinkomponente in einer beliebigen räumlichen Richtung kann als Messwert nur entweder +h̄/2 oder −h̄/2 auftreten (daher Spin 1/2“ ). ” Die Matrix h̄/2 0 S3 = 0 −h̄/2 besitzt die ONB von Eigenvektoren 1 χ↑ = , 0 wobei S3 χ↑ = h̄ χ↑ , 2 Dagegen besitzt S1 = χ↓ = 0 1 , h̄ S3 χ↓ = − χ↓ . 2 0 h̄/2 h̄/2 0 die ONB von Eigenvektoren 1 ϕ↑ = √ 2 mit S1 ϕ ↑ = 1 1 , h̄ ϕ↑ , 2 1 ϕ↓ = √ 2 1 −1 h̄ S1 ϕ ↓ = − ϕ ↓ . 2 , 3.2. SPIN 1/2 SYSTEM 51 Nehmen wir nun an, dass sich das System in dem durch den Zustandsvektor χ↑ beschriebenen reinen Zustand ω befindet (d.h. ω(A) = χ†↑ Aχ↑ , A ∈ L(U 2 )). Die Wahrscheinlichkeit bei einer Messung der Spinkomponente S3 in diesem Zustand den Messwert +h̄/2 zu erhalten, ist durch den Erwartungswert des Projektionsoperators χ↑ χ†↑ gegeben: ω χ↑ χ†↑ = χ†↑ χ↑ χ†↑ χ↑ = 1. 1 1 Das heißt, bei einer Messung von S3 erhält man in diesem Zustand immer den Messwert +h̄/2. Dementsprechend ist die Wahrscheinlichkeit in diesem Zustand für S3 den Messwert −h̄/2 zu erhalten gleich null: † ω χ↓ χ↓ = χ†↑ χ↓ χ†↓ χ↑ = 0. 0 0 Der Erwartungswert von S3 ist in diesem Zustand dann natürlich durch h̄ 2 gegeben. Misst man dagegen in dem selben Zustand die Spinkomponente S1 , so erhält man für die Erwartungswerte der Projektoren ϕ↑ ϕ†↑ , ϕ↓ ϕ†↓ 1 † ω ϕ↑ ϕ↑ = χ†↑ ϕ↑ ϕ†↑ χ↑ = , 2 ω(S3 ) = χ†↑ S3 χ↑ = √1 2 ω ϕ↓ ϕ†↓ 1 √ 2 1 = χ†↑ ϕ↓ ϕ†↓ χ↑ = , 2 √1 2 1 √ 2 was bedeutet, dass man bei einer Messung von S1 in der Hälfte der Fälle den Messwert +h̄/2 und in der anderen Hälfte den Messwert −h̄/2 erhalten wird. Der Erwartungswert von S1 muss in dem betrachteten Zustand dann klarerweise verschwinden: ω(S1 ) = χ†↑ S1 χ↑ = 0 Wir wollen noch kurz den allgemeinen Fall der Messung der Spinkomponente = h̄ n · σ , n · S 2 |n| = 1 besprechen. Man kann den räumlichen Einheitsvektor n in der Form ⎛ ⎞ ⎛ ⎞ n1 sin θ cos φ ⎝ n2 ⎠ = ⎝ sin θ sin φ ⎠ n3 cos θ KAPITEL 3. EINFACHE QUANTENSYSTEME 52 parametrisieren. Für den Projektor P↑ auf den (eindimensionalen) Eigenraum zum Eigenwert +1 von n · σ erhält man 1 1 + cos θ sin θ e−iφ 1 + n · σ P↑ = = sin θ eiφ 1 − cos θ 2 2 und für den Projektor P↓ auf den Eigenraum zum Eigenwert −1 von n · σ 1 1 − n · σ 1 − cos θ − sin θ e−iφ = P↓ = . 2 2 − sin θ eiφ 1 + cos θ Nehmen wir wieder an, dass sich unser System in dem durch den Zustandsvektor 1 χ↑ = 0 beschriebenen reinen Zustand ω befindet, so ist ω (P↑ ) = θ 1 + cos θ = cos2 , 2 2 ω (P↓ ) = θ 1 − cos θ = sin2 . 2 2 Für den speziellen Wert θ = π/2 ergeben sich die früher erhaltenen Resultate. Für den durch die Dichtematrix ρ = 1/2 beschriebenen maximal gemischten Zustand (entspricht z.B. einem Strahl unpolarisierter Teilchen) erhält man die Erwartungswerte 1 Tr(ρA) = TrA. 2 Somit verschwinden in diesem Fall die Erwartungswerte von S1 , S2 , S3 , dagegen 2 erhält man wegen Si2 = h̄4 1 h̄2 2 Tr(ρSi ) = . 4 Befindet sich ein Spin 1/2-System mit magnetischem Moment μ = μσ so ist der Hamiltonoperator in einem äußeren Magnetfeld B, H = −μ · B. Legt man die 3-Achse des räumlichen Koordinatensystems in Richtung des Ma = Be3 ), so ist gnetfeldes (B −μB 0 H = −μBσ3 = 0 +μB 3.2. SPIN 1/2 SYSTEM 53 diagonal mit Energieeigenwerten E↑ = −μB, E↓ = +μB und dazugehörigen (normierten) Eigenvektoren 1 0 χ↑ = , χ↓ = . 0 1 Befindet sich dieses magnetische Moment nun im Kontakt mit einem Wärmebad der Temperatur T , so ist seine Dichtematrix μB/kT 1 1 −H/kT 0 e , = ρ= e 0 e−μB/kT Z Z wobei μB . kT Die Erwartungswerte vo μ1 und μ2 (bzw. auch S1 und S2 ) verschwinden in diesem Zustand, dagegen erhält man für den Erwartungswert von μ3 den Ausdruck Z = Tre−H/kT = eμB/kT + e−μB/kT = 2 cosh Tr(ρμ3 ) = μ tanh μB , kT der in der Theorie des Paramagnetismus eine Rolle spielt. 54 KAPITEL 3. EINFACHE QUANTENSYSTEME Kapitel 4 Tensorprodukte von Vektorräumen Tensorprodukte und Tensoren sind Standardkonstruktionen der linearen Algebra. Sie treten in praktisch allen Gebieten der Physik auf. Erwähnt seien hier nur der Trägheitstensor in der klassischen Mechanik, der metrische Tensor in der Relativitätstheorie, der Feldstärketensor in der Elektrodynamik sowie das Tensorprodukt von Zustandsräumen zur Beschreibung zusammengesetzter Systeme in der Quantenmechanik. 4.1 Tensorprodukte V (1) , . . . , V (r) seien r (i.A. verschiedene) Vektorräume über einem Grundkörper K ( oder ). Unter dem Tensorprodukt V (1) ⊗ . . . ⊗ V (r) dieser Vektorräume versteht man die Menge aller multilinearen Funktionale (1) × . . . × V (r) → K T :V (1) , . . . , V (r) . auf dem kartesischen Produkt der Dualräume V Definiert man in V (1) ⊗ . . . ⊗ V (r) eine Addition und eine Multiplikation mit Skalaren durch (a1 T1 + a2 T2 )( v (1) , . . . , v (r) ) = a1 T1 ( v (1) , . . . , v (r) ) + a2 T2 ( v (1) , . . . , v (r) ), (k) , a1,2 ∈ K, T1,2 ∈ V (1) ⊗ . . . ⊗ V (r) , v (k) ∈ V so bildet V (1) ⊗ . . . ⊗ V (r) seinerseits einen Vektorraum. 55 KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN 56 Das Tensorprodukt v (1) ⊗ . . . ⊗ v (r) ∈ V (1) ⊗ . . . ⊗ V (r) der Vektoren v (1) , . . . , v (r) (v (k) ∈ V (k) ) wird durch (1) (1) v (r) = v ,..., v (1) v (1) . . . v(r) v (r) v ⊗ . . . ⊗ v (r) definiert. Sind in den Vektorräumen V (1) , . . . , V (r) Basissysteme (k) (k) {e1 , . . . , edimV (k) }, 1 ≤ k ≤ r, gegeben, dann bilden die Elemente (1) (r) {ei1 ⊗ . . . ⊗ eir }, 1 ≤ ik ≤ dim V (k) , 1 ≤ k ≤ r, eine Basis von V (1) ⊗ . . . ⊗ V (r) . Somit gilt: dim V (1) ⊗ ...⊗V (r) r dim V (k) . = k=1 Jedes Element von V (1) ⊗ . . . ⊗ V (r) lässt sich daher in der Form (1) (r) ei1 ⊗ . . . ⊗ eir Ti1 ...ir T = i1 ,...ir schreiben. T bezeichnet man als Tensor r-ter Stufe mit Komponenten Ti1 ...ir bezüglich der gewählten Basis. Das Transformationsverhalten der Tensorkomponenten bei einem Basiswechsel ist damit offensichtlich. Sind r lineare Abbildungen A(k) : V (k) → V (k) , 1 ≤ k ≤ r, gegeben, dann definiert man die lineare Abbildung A(1) ⊗ . . . ⊗ A(r) : V (1) ⊗ . . . ⊗ V (r) → V (1) ⊗ . . . ⊗ V (r) durch A(1) ⊗ . . . ⊗ A(r) v (1) ⊗ . . . ⊗ v (r) = A(1) v (1) ⊗ . . . ⊗ A(r) v (r) . Die Erweiterung auf beliebige Tensoren (d.h. solche, die sich nicht in Produktform schreiben lassen) erfolgt durch die Linearitätsforderung. Bemerkung: Für die hier durchgeführten Konstruktionen müssen die Vektorräume V (1) , . . . , V (r) nicht mit Skalarprodukten versehen sein. 4.2. TENSOREN IN REELLEN VEKTORRÄUMEN 4.2 57 Tensoren in reellen Vektorräumen Wir betrachten nun den in der Physik häufig anzutreffenden Fall eines einzigen n-dimensionalen Vektorraums V über dem Grundkörper K = . In V sei eine Basis {e1 , . . . , en } schreiben wir als gegeben. Die dazugehörige duale Basis V {e1 , . . . , en }, ei (ej ) = δji . Für die Zerlegung eines Vektors v ∈ V bezüglich der gewählten Basis schreiben wir v = ei v i , v i ∈ , wobei wir hier die Einsteinsche Summenkonvention verwenden, nach der über doppelt vorkommende Indizes summiert wird, d.h. v = ei v ≡ i n ei v i . i=1 bezüglich der dualen Analog schreibt man die Zerlegung eines Elements l ∈ V Basis in der Form l = ei li . Für den Raum1 ⊗ ...⊗V V pq = V . . ⊗ V ⊗ V ⊗ . p−mal q−mal kann man durch {ei1 ⊗ . . . ⊗ eip ⊗ ej1 ⊗ . . . ⊗ ejq }, 1 ≤ ik , jk ≤ n, eine Basis konstruieren. Ein Element T ∈ V p q hat dann bezüglich dieser Basis die Zerlegung T = ei1 ⊗ . . . ⊗ eip ⊗ ej1 ⊗ . . . ⊗ ejq T i1 ...ip j1 ...jq , wobei T i1 ...ip j1 ...jq = T (ei1 , . . . , eip , ej1 , . . . , ejq ). Man bezeichnet T als p-fach kontravarianten und q-fach kovarianten Tensor der Stufe p + q, oder kurz als Tensor vom Typ (p, q). In dieser Sprechweise sind die Elemente v = ei v i des Vektorraums V Tensoren vom Typ (1, 0), die Elemente 1 = V. Beachten Sie die Identifizierung V KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN 58 Tensoren vom Typ (0, 1) und Skalare Tensoren vom l = ei li des Dualraums V Typ (0, 0). Ein Basiswechsel in V, ek = Sēk = ēi S ik ⇔ el = (S −1 )lj ēj , wird durch eine invertierbare Abbildung S ∈ L(V) bewerkstelligt. Bezeichnet i1 ...ip man die Komponenten des Tensors T bezüglich der neuen Basis mit T j1 ...jq , so erhält man das Transformationsgesetz T i1 ...ip l j1 ...jq = S i1k1 . . . S ipkp T k1 ...kp l1 ...lq (S −1 ) 1j1 . . . (S −1 ) lq jq . Bemerkung: In der saloppen Sprechweise der Physik werden die Komponenten T i1 ...ip j1 ...jq eines Tensors oft als Tensor“ bezeichnet, wobei man ihn durch sein ” Transformationsverhalten bei einem Basiswechsel charakterisiert. 4.3 Metrischer Tensor Im Raum der Tensoren vom Typ (0, 2) bilden die symmetrischen Elemente, g(v1 , v2 ) = g(v2 , v1 ), v1,2 ∈ V, einen Teilraum. Bezüglich einer Basis hat ein solcher Tensor die Gestalt g = ei ⊗ ej gij , gij = gji. Bei einem Basiswechsel transformieren die Tensorkomponenten gemäß g ij = gkl (S −1 ) i (S −1 ) j k l ⇔ S ik g ij S jl = gkl . Man kann daher stets eine Basis finden, sodass ! σi für i = j , σi ∈ {−1, 0, 1}. gij = 0 für i = j Ist zusätzlich σi = 0 ∀ i = 1, . . . , n erfüllt, nennt man g nichtsingulär. g ist dann ein sogenannter metrischer Tensor. In diesem Fall folgt aus g(v, w) = 0 ∀ w ∈ V, dass v = 0 sein muss. Durch v(w) = g(v, w), v ∈ V fest, w ∈ V zuordnen. Als Folge kann man jedem Vektor v ∈ V ein lineares Funktional v∈V der Nichtsingularität von g ist diese Zuordnung injektiv und wegen dimV = dimV 4.3. METRISCHER TENSOR 59 auch surjektiv. Bei Vorliegen eines metrischen Tensors kann somit der Vektorraum auf basisunabhängige Weise identifiziert werden. V mit seinem Dualraum V Ist eine Basis {e1 , . . . , en } von V gegeben, dann besteht wegen ei (v) = g(ei , v) = g(ei , ej v j ) = gij v j = gij ej (v) ∀ v ∈ V die Beziehung ei = gij ej . Ist ein Vektor v = ei v i ∈ V gegeben, dann bezeichnen wir die Komponenten von v bezüglich der dualen Basis {e1 , . . . , en } mit vi (untere Indizes): v = ei vi . Da andererseits v = ei gij v j , besteht zwischen den Komponenten mit unteren und oberen Indizes die Beziehung vi = gij v j . Man kann daher schreiben: v(w) = w(v) = g(v, w) = g(ei v i , ej w j ) = v i gij w j = v i wi = w i vi , v, w ∈ V. Bemerkung: Für einen metrischen Tensors g ist die Abbildung (v, w) ∈ V × V → g(v, w) zwar bilinear und symmetrisch, aus der Nichtsingularität von g folgt aber nicht notwendigerweise, dass g(v, v) ≥ 0 ist, oder dass g(v, v) = 0 auch v = 0 impliziert. Ein metrischer Tensor definiert also im Allgemeinen kein Skalarprodukt im Sinne eines euklidischen Vektorraumes. Ist allerdings (bezüglich der oben besprochenen Basis) σi = σ ∀ i = 1, . . . , n, dann wird durch (v|w) = σg(v, w) ein positiv definites Skalarprodukt definiert. Beispiele: n einen metrischen Tensor g durch ! 1 für i = j , 1 ≤ i, j ≤ n, g(ei, ej ) = gij = 0 für i = j 1. Definiert man im bezüglich der Standardbasis {e1 , . . . , en }, dann ist durch (x|y) = g(x, y), x, y ∈ n , 60 KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN das übliche Skalarprodukt des E n definiert. Eine orthogonale Transformation O ist durch die Eigenschaft g(Ox, Oy) = g(x, y), ∀ x, y charakterisiert. Beschränkt man sich bei einem Basiswechsel auf orthogonale Transformationen, dann ändern sich die Komponenten gij des metrischen Tensors nicht. ist ein vierdimensionaler reeller Vektorraum mit 2. Der Minkowskiraum einem metrischen Tensor g, dessen Komponenten bezüglich einer Basis {e0 , e1 , e2 , e3 } die Diagonalgestalt g00 = 1, g11 = −1, g22 = −1, g33 = −1 besitzen. Dieser Raum spielt in der speziellen Relativitätstheorie eine zentrale Rolle. Ein zu einem bestimmten Zeitpunkt t an einem Ort mit den kartesischen Koordinaten x1 , x2 , x3 stattfindendes Ereignis wird durch Element des Minkowskiraumes (einen sogenannten Raum-ZeitVierervektor), x = eμ xμ , beschrieben, wobei x0 = ct ist (c ist die Lichtgeschwindigkeit). Der Ausdruck g(x, y) = xμ gμν y ν = xμ yμ = x · y ist das Viererskalarprodukt der beiden Vierervektoren x, y. Unter dem Viererabstand des Ereignisses x vom Ereignis 0 (Ursprung des Minkowskiraumes) versteht man den Ausdruck g(x, x) = xμ gμν xν = x · x = c2 t2 − x · x. Ist g(x, x) > 0 (x ist ein zeitartiger Vierervektor), dann ist eine kausale Verknüpfung des Ereignisses x mit dem Ereignis 0 durch Signale mit Unterlichtgeschwindigkeit möglich. Ist g(x, x) = 0 (x ist ein lichtartiger Vierervektor), dann ist diese Verbindung nur durch Lichtsignale möglich. Für g(x, x) < 0 (x ist ein raumartiger Vierervektor) besteht keine kausale Verknüpfung zwischen den Ereignissen x und 0. Eine Lorentztransformation L ∈ L( ) ist dadurch charakterisiert, dass sie die Eigenschaft g(Lx, Ly) = g(x, y) ∀ x, y ∈ erfüllt. Die Menge der Lorentztransformationen bildet eine Gruppe, die Lorentzgruppe L. Wichtig ist die Untergruppe L↑+ = {L ∈ L| detL = +1, L0 0 ≥ 1} 4.4. LEVI-CIVITÀ-TENSOR 61 der eigentlichen orthochronen Lorentztransformationen. Wird eine Basistransformation mit Hilfe eines Elements L ∈ L↑+ durchgeführt, dann entspricht dies dem Wechsel vom ursprünglichen Bezugssystem in ein anderes Inertialsystem. 4.4 Levi-Cività-Tensor Wir betrachten einen n-dimensionalen reellen Vektorraum V. Die total antisymmetrischen Tensoren vom Typ (0, n), T v (1) , . . . , v (i) , . . . , v (j) , . . . , v (n) = −T v (1) , . . . , v (j) , . . . , v (i) , . . . , v (n) , bilden einen Teilraum von V 0n . Normiert man für V = trischen Tensor durch (e1 , . . . , en ) = 1, n den total antisymme- dann ist dieser Tensor natürlich nichts anderes als die Determinante, ≡ det. Bezüglich der Standardbasis des n sind die Komponenten des -Tensors (oder Levi-Cività-Tensors) daher durch ⎧ ⎪ ⎨ 1 i1 , . . . , in gerade Permutation von 1, . . . , n i1 ...in = (ei1 , . . . , ein ) = −1 i1 , . . . , in unger. Permutation von 1, . . . , n ⎪ ⎩ 0 sonst gegeben. Wegen det(AB) = det A det B verhalten sich die Komponenten des Levi-CivitàTensors bei einem Basiswechsel ei = Sēi gemäß der Transformationsformel i1 ...in = (ei1 , . . . , ein ) = (Sēi1 , . . . , Sēin ) = det S (ēi1 , . . . , ēin ) = det S i1 ...in . Geschieht der Basiswechsel durch eine unimodulare Transformation S (das ist eine Abbildung mit det S = 1), dann ändern sich die Komponenten des -Tensors demnach nicht. Im Fall n = 2 ist (x, y) = (ei xi , ej y j ) = ij xi y j = x1 y 2 − x2 y 1 nichts anderes als der orientierte Flächeninhalt des von den Vektoren x, y aufgespannten Parallelogramms. KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN 62 Für n = 3 ist (x, y, z) = (ei xi , ej y j , ek z k ) = ijk xi y j z k das orientierte Volumen des von den Vektoren x, y, z aufgespannten Parallelepipeds. Allgemein ist im n durch v (1) , . . . , v (n) das orientierte Volumen des von den Vektoren v (1) , . . . , v (n) ∈ n aufgespannten n-dimensionalen Gebiets & n ' λi v | 0 ≤ λi ≤ 1 (i) i=1 gegeben. 4.5 Tensoren im dreidimensionalen Raum Beschränkt man sich im dreidimensionalen euklidischen Raum auf Basistransformationen S ∈ SO(3), so wird eine rechtshändige orthonormierte Standardbasis {e1 , e2 , e3 } wieder in eine gleich orientierte Orthonormalbasis übergeführt. In diesem Fall ändern sich die Komponenten des metrischen Tensors gij = δij bei einem Basiswechsel nicht und es kann auf die Unterscheidung oberer und unterer Indizes verzichtet werden. Man schreibt dann einfach (unter Verwendung der Summenkonvention) x = ei xi für Vektoren und x · y = xi yi für das Skalarprodukt von x, y . Wegen der Unimodularität von SO(3)-Matrizen ändern sich auch die Komponenten des dreidimensionalen -Tensors, ⎧ ⎪ ⎨ 1 falls i, j, k gerade Permutation von 1, 2, 3 ijk = (ei , ej , ek ) = −1 falls i, j, j unger. Permutation von 1, 2, 3 ⎪ ⎩ 0 sonst bei einer derartigen Basistransformation nicht. Das Vektorprodukt (Kreuzprodukt, äußeres Produkt) c = a × b steht normal auf die von a und b aufgespannte Fläche, seine Richtung ist durch die Rechtsschraubenregel (Rechte-Hand-Regel) festgelegt. Die Länge ist gleich der Fläche des von a und b aufgespannten Parallelogramms = |a||b|| sin α|. Das Kreuzprodukt a × b ist bilinear und antisymmetrisch (a × b = −b × a). Die Wirkung des Vektorprodukts auf die Vektoren einer rechtshändigen Orthonormalbasis, e1 × e2 = e3 , e2 × e3 = e1 , e3 × e1 = e2 , 4.6. TENSORPRODUKT VON ZUSTANDSRÄUMEN 63 lässt sich mit Hilfe des -Tensors in kompakter Form ausdrücken: ei × ej = ijkek . Sind a = ei ai und b = ei bi bezüglich der Orthonormalbasis e1 , e2 , e3 gegeben, so folgt aus der Bilinearität des Kreuzprodukts und der obigen Formel: a × b = ej aj × ek bk = ej × ek aj bk = ei jki aj bk = ei ijk aj bk . Das heißt, die i-te Komponente von a × b ist gegeben durch: (a × b)i = ijk aj bk . Das Spatprodukt a · (b × c ) = ai ijk bj ck = ijk ai bj ck = (a, b, c ) ergibt das orientierte Volumen des von den Vektoren a, b, c aufgespannten Parallelepipeds (positives Vorzeichen falls a, b, c Rechtsystem, negatives Vorzeichen für Linkssystem). Aufgabe: Beweisen Sie die oft benötigten Relationen ijk ilm = δjl δkm − δjm δkl , imn jmn = 2δij . Hinweis: Beweis der ersten Formel entweder durch Ausprobieren aller Möglichkeiten oder durch Verwendung von ijk = det(ei , ej , ek ) und den bekannten Rechenregeln für Determinanten (det AT = det A, det(AB) = det A det B). Die zweite Formel (mit zwei überschobenen Indizes) folgt dann aus der ersten. Zeigen Sie damit: a × (b × c ) = b(a · c ) − c(a · b), 4.6 = (a · c )(b · d) − (b · c )(a · d). (a × b) · (c × d) Tensorprodukt von Zustandsräumen Wird ein Teil A eines Quantensystems durch den Zustandsraum H(A) und ein Teil B durch den Zustandsraum H(B) beschrieben, dann ist das Tensorprodukt H(A) ⊗ H(B) der geeignete Zustandsraum für das Gesamtsystem A ∪ B. Wir wollen der Einfachheit halber wieder annehmen, dass H(A) und H(B) endlichdimensionale unitäre Vektorräume mit Skalarprodukten (A) (A) ϕ ψ , ϕ(A) , ψ (A) ∈ H(A) , ϕ(B) |ψ (B) H(B) , ϕ(B) , ψ (B) ∈ H(B) H(A) KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN 64 sind. Das Skalarprodukt in H(A) ⊗ H(B) wird durch (A) ϕ ⊗ ϕ(B) ψ (A) ⊗ ψ (B) H(A) ⊗H(B) = ϕ(A) ψ (A) H(A) ϕ(B) ψ (B) H(B) zusammen mit der Linearitätsforderung erklärt. Ist {ϕ1 , . . . , ϕn }, ϕa ∈ H(A) {χ1 , . . . , χν }, χα ∈ H(B) eine ONB von H(A) und eine ONB von H(B) , dann ist {ϕa ⊗ χα }, 1 ≤ a ≤ n, 1 ≤ α ≤ ν eine ONB von H(A) ⊗ H(B) . Ein Vektor Ψ ∈ H(A) ⊗ H(B) besitzt dann bezüglich dieser ONB die Darstellung Ψ= n ν ϕa ⊗ χα caα , ca,α = ϕa ⊗ χα |Ψ ∈ . a=1 α=1 Besteht zwischen den beiden Teilen des Systems keine Wechselwirkung, dann ist jener hermitesche Operator, welcher der Observablen Gesamtenergie des Sy” stems“ entspricht von der Form H = H (A) ⊗ + ⊗ H (B) (Hamiltonoperator des Gesamtsystems ohne Wechselwirkung), wobei die hermiteschen Operatoren † † H (A) = H (A) ∈ L(H(A) ), H (B) = H (B) ∈ L(H(B) ) die Hamiltonoperatoren der Teilsysteme sind. Bei Vorhandensein einer Wechselwirkung zwischen den beiden Teilsystemen hat man H = H (A) ⊗ + ⊗ H (B) + W, wobei der Wechselwirkungsterm W = W † ∈ L(H(A) ⊗ H(B) ) die Struktur † † (Xr(A) ⊗ Yr(B) + Xr(A) ⊗ Yr(B) ), Xr(A) ∈ L(H(A) ), Yr(B) ∈ L(H(B) ) W = r besitzt. 4.6. TENSORPRODUKT VON ZUSTANDSRÄUMEN 65 Bemerkungen: † † 1. (X (A) ⊗ Y (B) )† = X (A) ⊗ Y (B) , X (A) ∈ L(H(A) ), Y (B) ∈ L(H(B) ). 2. In der physikalischen Literatur findet man oft die Schreibweise |a, α statt ϕa ⊗ χα . Statt X (A) ⊗ und ⊗ Y (B) schreibt man kurz X (A) und Y (B) wobei der Kommutator [X (A) , Y (B) ] = 0 ist. Wegen (X (A) ⊗ )( ⊗ Y (B) ) = X (A) ⊗ Y (B) schreibt man dann einfach X (A) Y (B) statt X (A) ⊗ Y (B) . Beispiel: Zwei Spins werden im Zustandsraum U 2 ⊗ U 2 beschrieben. Den räumlichen Komponenten von Spin A entsprechen die Operatoren (A) Sk = k = 1, 2, 3, h̄ ⊗ σk , 2 k = 1, 2, 3. h̄ σk ⊗ , 2 jenen von Spin B die Operatoren (B) Sk = Der Operator für den Gesamtspinvektor des Systems ist durch =S (A) + S (B) = h̄ (σ ⊗ S 2 + ⊗ σ) gegeben. Wir wählen die Eigenvektoren von σ3 , 1 , χ↑ = 0 χ↓ = 0 1 , als ONB von U 2 . Dann bilden die Tensorprodukte dieser Vektoren, χ↑ ⊗ χ↑ , χ↑ ⊗ χ↓ , χ↓ ⊗ χ↑ , χ↓ ⊗ χ↓ , eine ONB von U 2 ⊗U 2 . Diese Elemente von U 2 ⊗U 2 sind natürlich auch gleichzeitig (A) (B) Eigenvektoren von von S3 und S3 : h̄ (A) S3 (χ↑ ⊗ χ↑ ) = + χ↑ ⊗ χ↑ , 2 h̄ (A) S3 (χ↑ ⊗ χ↓ ) = + χ↑ ⊗ χ↓ , 2 h̄ (A) S3 (χ↓ ⊗ χ↑ ) = − χ↓ ⊗ χ↑ , 2 h̄ (A) S3 (χ↓ ⊗ χ↓ ) = − χ↓ ⊗ χ↓ , 2 h̄ (B) S3 (χ↑ ⊗ χ↑ ) = + χ↑ ⊗ χ↑ , 2 h̄ (B) S3 (χ↑ ⊗ χ↓ ) = − χ↑ ⊗ χ↓ , 2 h̄ (B) S3 (χ↓ ⊗ χ↑ ) = + χ↓ ⊗ χ↑ , 2 h̄ (B) S3 (χ↓ ⊗ χ↓ ) = − χ↓ ⊗ χ↓ . 2 66 KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN Wir betrachten nun das Quadrat des Gesamtspinvektors 3h̄2 2 S = ⊗ 2 3 h̄2 + σk ⊗ σk . 2 k=1 Unter Verwendung von σ1 χ↑ = χ↓ , σ1 χ↓ = χ↑ , σ2 χ↑ = iχ↓ , σ2 χ↓ = −iχ↑ 2 sind: rechnet man leicht nach, dass χ↑ ⊗ χ↑ und χ↓ ⊗ χ↓ Eigenvektoren von S 2 (χ↑ ⊗ χ↑ ) = 2h̄2 χ↑ ⊗ χ↑ , S 2 (χ↓ ⊗ χ↓ ) = 2h̄2 χ↓ ⊗ χ↓ . S 2 . Man erhält Dagegen sind χ↑ ⊗ χ↓ und χ↓ ⊗ χ↑ keine Eigenvektoren von S vielmehr 2 (χ↑ ⊗ χ↓ ) = h̄2 (χ↑ ⊗ χ↓ + χ↓ ⊗ χ↑ ) S 2 (χ↓ ⊗ χ↑ ) = h̄2 (χ↑ ⊗ χ↓ − χ↓ ⊗ χ↑ ) S Allerdings bilden die Vektoren ψs,s3 , 1 ψ0,0 = √ (χ↑ ⊗ χ↓ − χ↓ ⊗ χ↑ ), 2 ψ1,1 = χ↑ ⊗ χ↑ , 1 ψ1,0 = √ (χ↑ ⊗ χ↓ + χ↓ ⊗ χ↑ ), 2 ψ1,−1 = χ↓ ⊗ χ↓ , (4.1) 2 und S3 : eine ONB von Eigenvektoren von S 2 ψs,s3 = s(s + 1)h̄2 ψs,s3 , S S3 ψs,s3 = s3h̄ψs,s3 . Es gibt also einen Zustand mit Spin s = 0 (Singulett) und drei Zustände mit Spin s = 1 (Triplett). Kapitel 5 Gewöhnliche Differentialgleichungen 5.1 Grundbegriffe Unter einer gewöhnlichen Differentialgleichung versteht man einen Ausdruck, der eine unabhängige Variable x und eine abhängige Variable y mit einer gewissen Anzahl ihrer Ableitungen enthält: F (x, y, y , . . . , y (n)) = 0, n ≥ 1. Unter der Ordnung der Differentialgleichung versteht man die Ordnung der höchsten vorkommenden Ableitung. Eine Funktion y(x), welche in einem gewissen Bereich I x den vorgegeben Ausdruck identisch erfüllt, heißt Lösung der Differentialgleichung. Bemerkungen: 1. Handelt es sich bei der abhängigen Variablen um die Zeit t, so schreibt man eine Differentialgleichung üblicherweise in der Form F (t, x, ẋ, . . . , x(n) ) = 0, n ≥ 1. wobei x(t) gesucht ist. 2. Kommen wenigstens zwei unabhängige Variable vor, spricht man von einer partiellen Differentialgleichung. Ein Beispiel wäre die Laplacegleichung ∂2u ∂2u + = 0, ∂x2 ∂y 2 bei der u(x, y) gesucht ist. Wir werden uns in diesem Kapitel nur mit gewöhnlichen Differentialgleichungen beschäftigen. 67 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 68 3. Ein Gleichungssystem der Form (n) (n) F1 (t, x1 , . . . xk , ẋ1 , . . . ẋk , . . . , x1 , . . . , xk ) = 0 ... = ... (n) (n) Fl (t, x1 , . . . xk , ẋ1 , . . . ẋk , . . . , x1 , . . . , xk ) = 0 bezeichnet man als System von l gewöhnlichen Differentialgleichungen nter Ordnung für die k abhängigen Variablen x1 , . . . , xk . Beispiele: 1. Radioaktiver Zerfall: Zum Zeitpunkt t = 0 seien N0 Atome vorhanden. Wieviele Atome N(t) sind zum Zeitpunkt t noch nicht zerfallen? Handelt es sich um eine sehr große Anzahl von Atomen, dann kann man N(t) durch eine kontinuierliche Funktion approximieren. Im Zeitintervall [t, t + Δt] hat man ΔN = N(t + Δt) − N(t) −λN(t)Δt wobei λ > 0 eine für die betrachtete Substanz charakteristische Konstante der Dimension (Zeit)−1 ist. Im Limes Δt → 0 erhält man die gewöhnliche Differentialgleichung erster Ordnung dN = −λN dt Ihre allgemeine Lösung N(t) = Ce−λt enthält eine willkürliche Integrationskonstante C, deren Wert durch die Anfangsbedingung N(0) = N0 festgelegt wird: N(t) = N0 e−λt . 2. Newtonsche Bewegungsgleichung für ein Punktteilchen: Die Bewegung eines Teilchens mit Masse m wird in der (nichtrelativistischen) Mechanik durch die Bewegungsgleichung mx¨ = F (t, x, x˙ ) beschrieben. Die Gestalt der auf das Teilchen wirkenden Kraft F (t, x, x˙ ) hängt von der gegebenen physikalischen Situation ab. Explizit angeschrieben hat man mx¨1 = F1 (t, x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 ), mx¨2 = F2 (t, x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 ), mx¨3 = F3 (t, x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 ) Es handelt sich also um eine System von drei gewöhnlichen Differentialgleichungen zweiter Ordnung. 5.1. GRUNDBEGRIFFE 69 3. Kräftefreie Bewegung: Im Fall F = 0 entkoppeln die drei Differentialgleichungen und es genügt, die Bewegungsgleichung für einen Freiheitsgrad x zu untersuchen: ẍ = 0. Einmalige Integration liefert ẋ(t) = C1 , und nochmaliges Integrieren ergibt die allgemeine Lösung x(t) = C1 t + C2 . Befindet sich das Teilchen zum Zeitpunkt t = 0 am Ort x(0) und besitzt die Geschwindigkeit v (0) , so erhält man x(0) = x(0) = C2 v (0) = v(0) = C1 und somit x(t) = v (0) t + x(0) . Für alle drei Freiheitsgrade bekommt man die allgemeine Lösung x(t) = v (0) t + x (0) , das heißt, das Teilchen bewegt sich mit konstanter Geschwindigkeit v (0) . 4. Bewegung in konstantem Gravitationsfeld: Auch für F = −mge3 entkoppeln die drei Differentialgleichungen. Für x1 , x2 ergibt sich nichts Neues, dagegen lautet die Differentialgleichung für x3 jetzt: ⇒ ⇒ ẍ3 = −g ẋ3 (t) = −gt + C1 gt2 + C1 t + C2 x3 (t) = − 2 Wieder können die beiden Integrationskonstanten C1 , C2 der allgemeinen (0) (0) Lösung durch die Anfangsbedingungen x3 (0) = x3 , ẋ3 (0) = v3 ausgedrückt werden: (0) (0) C2 = x3 , C1 = v3 ⇒ x3 (t) = − gt2 (0) (0) + v3 t + x3 . 2 Zusammen mit den Lösungen für die beiden anderen Freiheitsgrade x1 , x2 , erhält man als vollständige Lösung: x(t) = − gt2 e3 + v (0) t + x (0) 2 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 70 5.2 Richtungsfeld Bei gewöhnlichen Differentialgleichungen erster Ordnung, die sich in der expliziten Form y = f (x, y) schreiben lassen, kann man sich durch die graphische Darstellung des Richtungsfeldes in der x − y-Ebene einen qualitativen Überblick über die Lösungskurven der Differentialgleichung verschaffen. Durch y = f (x, y) wird nämlich jedem Punkt (x, y) die Steigung der durch ihn gehenden Lösungskurve zugeordnet. Dazu zeichnet man zunächst einige Kurven konstanter Steigung (sogenannte Isoklinen) f (x, y) = k = const. in der x − y-Ebene. Längs der Isokline f (x, y) = k zeichnet man eine Anzahl von kurzen Linienelementen mit Steigung k. Das führt man jetzt für alle eingezeichneten Isoklinen durch und erhält auf diese Weise ein Feld von Linienelementen, das sogenannte Richtungsfeld der Differentialgleichung. Die Lösungen der Differentialgleichung sind nun jene Kurven, die in das Richtungsfeld hineinpassen“. ” Beispiel: Zeichnen Sie das Richtungsfeld der Differentialgleichung y = −λy und skizzieren Sie die Lösungskurven. Vergleichen Sie ihr Resultat mit der exakten Lösung. 5.3 Trennung der Variablen Lässt sich eine Differentialgleichung erster Ordnung in der Form y = f (x) g(y) schreiben, so erhält man ihre allgemeine Lösung durch Integration von dy g(y) = dx f (x). Das heißt dy g(y) = dx f (x) +C, G(y) F (x) wobei F die Stammfunktion von f und G eine Stammfunktion von g ist. 5.3. TRENNUNG DER VARIABLEN 71 Beispiele: 1. Die Lösungen der bereits früher besprochenen Differentialgleichung y = −λy lassen sich auf diese Weise finden: dy = −λdx y ⇒ |y| = ce−λx ⇒ ⇒ ln |y| = −λx + ln c y = ±ce−λx ⇒ y = Ce−λx . 2. y = −2λxy ⇒ ⇒ ln |y| = −λx2 + ln cx ⇒ y = ±ce−λx 2 ⇒ dy = −2λxdx y 2 ⇒ |y| = ce−λx y = Ce−λx 2 3. Die eindimensionale Bewegung eines Körpers mit Masse m in einem konstanten Gravitationsfeld bei Berücksichtigung des Luftwiderstands wird durch die Bewegungsgleichung mẍ = mg − k|ẋ|ẋ, k>0 beschrieben. Für die Geschwindigkeit v = ẋ erhält man daher eine Differentialgleichung erster Ordnung: mv̇ = mg − k|v|v Unabhängig von der Anfangsgeschwindigkeit nähert sich für t → ∞ die Geschwindigkeit v(t) asymptotisch der Grenzgeschwindigkeit ( mg v∞ = k an. Die Rechnung wird übersichtlicher, wenn man statt der Geschwindigkeit v die dimensionslose Variable u, ( mg u v= k und statt der Zeit die dimensionslose Variable ( gk t τ= m 72 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN verwendet. In den neuen Variablen hat die Differentialgleichung die einfache Form du = 1 − |u|u. dτ Aufgabe: Zeichnen Sie das Richtungsfeld dieser Differentialgleichung und skizzieren Sie die Lösungskurven. Welche Fälle sind zu unterscheiden? Geben Sie eine physikalische Interpretation! Wegen du = dτ 1 − |u|u sind bei der Integration der Differentialgleichung die Fälle u > 1, u = 1 und u > 1 zu unterscheiden. (a) Für u > 1 hat man du = dτ. 1 − u2 Wegen 1 1 = 1 − u2 2 erhält man ⇒ 1 1 − u+1 u−1 1 u+1 ln =)τ − τ0 2 u−1 u(τ ) = coth(τ − τ0 ) für τ − τ0 > 0. (b) Der Fall u = 1 entspricht der Bewegung mit konstanter Grenzgeschwindigkeit. (c) Für u < 1 muss man die folgenden zwei Fälle unterscheiden: & 1 + u2 für u < 0 1 − |u|u = 1 − u2 für 0 ≤ u < 1 Im ersten Fall (u < 0) ergibt die Integration du = arctan u = τ − τ0 1 + u2 und im zweiten Fall (0 ≤ u < 1) * ) 1 1 1 du + = 1 − u2 2 u+1 u−1 1 1+u 1 [ln(1 + u) − ln(1 − u)] = ln = τ − τ0 = 2 2 1−u Somit erhält man die Lösung & für − π2 < τ − τ0 ≤ 0 tan(τ − τ0 ) u(τ ) = tanh(τ − τ0 ) für τ − τ0 ≥ 0 5.3. TRENNUNG DER VARIABLEN 73 u(τ ) ist an der Anstückelungsstelle“ τ − τ0 stetig differenzierbar. ” Man kann nun die Lösung der Bewegungsgleichung wieder durch die ursprünglichen Variablen t, v ausdrücken. Die Grenzgeschwindigkeit v∞ = mg/k gestattet die Klassifizierung der drei Lösungstypen: (a) Ist die Anfangsgeschwindigkeit größer als die Grenzgeschwindigkeit, dann ist ( ( mg gk v(t) = coth (t − t0 ) , t > t0 . k m (b) v(t) = v∞ ist eine Lösung der Bewegungsgleichung. (c) Ist die Anfangsgeschwindigkeit kleiner als die Grenzgeschwindigkeit, dann ist ( mg & π mg (t − t ) , − < t − t0 ≤ 0 tan mg 0 k 2 k × v(t) = mg tanh (t − t0 ) , t − t0 ≥ 0 k k Bemerkung: Differentialgleichungen vom Typ y y =g x können durch die Substitution u = y/x auf eine Form gebracht werden, in der die Trennung der neuen Variablen x, u möglich ist: ⇒ y(x) = u(x)x ⇒ y = u + u x dx du = u + u x = g(u) ⇒ g(u) − u x Beispiel: Um die Lösung der Differentialgleichung 2xyy − y 2 + x2 = 0 zu finden, dividiert man zu nächst durch x2 , y 2 y 2 y − + 1 = 0. x x Mit Hilfe der Substitution u = y/x erhält man 2u(u + u x) − u2 + 1 = 0 oder 2xuu + u2 + 1 = 0. 74 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Trennung der Variablen liefert 2udu dx =− . 2 u +1 x Die Integration ergibt ln(u2 + 1) = − ln |x| + k y2 2c 2c ⇒ 2 +1= ⇒ u2 + 1 = x x x 2 2 2 ⇒ x + y = 2cx ⇒ (x − c) + y 2 = c2 5.4 Exakte Differentialgleichungen In der x − y-Ebene seien Kurvenscharen durch die implizite Gleichung Φ(x, y) = C gegeben. Wenn wir annehmen, dass Φ in einem gewissen Bereich stetig differenzierbar ist, dann erfüllen diese Kurven die Differentialgleichung dΦ = ∂Φ ∂Φ dx + dy = 0 ∂x ∂y oder ∂Φ ∂Φ + y = 0. ∂x ∂y Ist Φ zwei mal stetig differenzierbar, dann gilt ∂ ∂Φ ∂ ∂Φ = . ∂y ∂x ∂x ∂y Wenn nun umgekehrt eine Differentialgleichung der Form ⇔ P (x, y) + Q(x, y)y = 0 P (x, y)dx + Q(x, y)dy = 0 gegeben ist, so heißt diese exakt, wenn P und Q in einem einfach zusammenhängenden Gebiet der x − y-Ebene stetig differenzierbar sind, und die Integrabilitätsbedingung ∂P ∂Q = ∂y ∂x erfüllen. Dann existiert eine Funktion Φ(x, y) mit P = ∂Φ , ∂x Q= ∂Φ ∂y 5.4. EXAKTE DIFFERENTIALGLEICHUNGEN 75 und Φ(x, y) = C ist die Lösungsschar der exakten Differentialgleichung. Beispiel: Die Differentialgleichung yexy dx + (2 + xexy )dy = 0 ist exakt, da ∂ ∂ (yexy ) = (2 + xexy ) ∂y ∂x in der gesamten x − y-Ebene erfüllt ist. ⇒ ∂Φ(x, y) = yexy ⇒ Φ(x, y) = exy + f (y) ∂x ∂Φ(x, y) = xexy + f (y) = 2x + xexy ∂y f (y) = 2 ⇒ f (y) = 2y + k ⇒ Die Lösungen der Differentialgleichungen sind die Kurven exy + 2y = C. Ist bei einer Differentialgleichung der Gestalt P (x, y)dx + Q(x, y)dy = 0 die Integranilitätsbedingung nicht erfüllt, so kann man versuchen, sie durch Multiplikation mit einem integrierenden Faktor μ(x, y) exakt zu machen. Die Funktion μ muss in diesem Fall die Bedingung ∂(μP ) ∂(μQ) = ∂y ∂x erfüllen. μ ist also eine Lösung der folgenden partiellen Differentialgleichung erster Ordnung: ∂P ∂μ ∂μ ∂Q Q− P =μ − . ∂x ∂y ∂y ∂x Es ist nun keineswegs nötig die allgemeine Lösung dieser partiellen Differentialgleichung zu kennen, es genügt eine spezielle Lösung für μ(x, y) zu finden. Beispiel: Die Differentialgleichung (x2 + 2y)dx + xdy = 0 ist nicht exakt, da ∂ 2 ∂ (x + 2y) = 2 = = 1. ∂x ∂x 76 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Ein integrierender Faktor μ(x, y) muss die partielle Differentialgleichung ∂μ ∂μ 2 (x + 2y) + 2μ = +μ ∂y ∂x erfüllen. Wir versuchen für μ eine Lösung zu finden, die nur von x abhängt. μ (x)x = μ(x) ⇒ ⇒ μ(x) = kx. Wir wählen k = 1 und erhalten die exakte Differentialgleichung x(x2 + 2y)dx + x2 dy = 0. ∂Φ(x, y) = x2 ⇒ Φ(x, y) = x2 y + f (x) ∂y ∂Φ(x, y) = 2xy + f (x) = x3 + 2xy ∂x x4 ⇒ f (x) = x3 ⇒ f (x) = +k 4 Somit erhält man als Lösung der Differentialgleichung: x2 y + 5.5 x4 = C. 4 Lineare Differentialgleichungen erster Ordnung Eine Differentialgleichung erster Ordnung heißt linear, wenn sie in der Form y + P (x)y = Q(x) geschrieben werden kann. Wesentlich ist, dass y und y nur linear enthalten sind (d.h. in der ersten Potenz stehen). Ist Q(x) ≡ 0 heißt die Gleichung homogen, andernfalls nennt man sie inhomogen. Die allgemeine Lösung yh (x) der homogenen Gleichung yh + P (x)yh = 0 findet man durch Trennung der Variablen: ⇒ dyh = −P (x)dx yh ln |yh | = − dx P (x) + ln c ⇒ yh (x) = Ce− R dxP (x) . 5.5. LINEARE DIFFERENTIALGLEICHUNGEN ERSTER ORDNUNG 77 Die allgemeine Lösung der inhomogenen Gleichung erhält man nun als Summe der allgemeinen Lösung der homogenen Gleichung und einer speziellen (partikulären) Lösung ys (x) der inhomogenen Gleichung: y(x) = yh (x) + ys (x) Eine spezielle Lösung der inhomogenen Gleichung erhält man durch die auf Lagrange zurückgehende Methode der Variation der Konstanten. Darunter versteht man den Ansatz R ys (x) = C(x)e− dx P (x) für die spezielle Lösung. ys (x) + P (x)ys (x) = C (x)e− ⇒ R C (x) = Q(x)e dx P (x) ⇒ R dx P (x) = Q(x) R C(x) = dx Q(x)e dx P (x) . Beispiele: 1. Die eindimensionale Bewegung eines Körpers mit Masse m, auf den eine konstante Kraft F0 und eine geschwindigkeitsproportionale Reibungskraft −cẋ wirkt, wird durch die Bewegungsgleichung mẍ = F0 − cẋ beschrieben (z.B. Kugel in zäher Flüssigkeit). Für die Geschwindigkeit v = ẋ erhält man die lineare Differentialgleichung erster Ordnung mv̇ + cv = F0 , c > 0. Die allgemeine Lösung der homogenen Gleichung v˙h + ist durch c vh = 0 m vh (t) = Ke−ct/m gegeben, wobei K eine Integrationskonstante ist. Man sieht sofort, dass vs (t) = F0 c eine spezielle Lösung der inhomogenen Gleichung ist. Somit ist die allgemeine Lösung der Bewegungsgleichung: v(t) = vh (t) + vs (t) = Ke−ct/m + F0 . c 78 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Die Integrationskonstante K kann durch die Anfangsbedingung v(0) = v0 fixiert werden: F0 K = v0 − . c Die Geschwindigkeit F0 v∞ = lim v(t) = t→∞ c ist proportional zur konstanten Kraft F0 und unabhängig von der Anfangsgeschwindigkeit v0 ( Aristotelische Physik“). τ = m/c ist ein Maß für die ” Zeitdauer, innerhalb der sich v∞ einstellt. 2. Führt man in dem vorigen Beispiel die Ersetzungen v m c F0 → → → → I L R U0 (Strom) (Induktivität) (Widerstand) (EMK) durch, so erhält man die Differentialgleichung eines RL-Kreises: L dI + RI = U0 dt U0 U0 I(t) = + I0 − e−Rt/L R R I0 = 0, so erhält man das zeitliche Verhalten des Stromes nach dem Einschalten der Spannungsquelle: U0 1 − e−Rt/L I(t) = R Die Größe τ = L/R ist ein Maß für die Zeitdauer, in welcher der Strom I∞ = U0 /R (praktisch) erreicht wird. Setzt man in 3. Im Fall einer zeitabhängigen EMK U(t) ist die Differentialgleichung dI + RI = U(t) dt zu lösen. Wie vorhin, hat man als Lösung der homogenen Gleichung L Ih (t) = Ke−Rt/L , eine spezielle Lösung der inhomogenen Gleichung erhät man daraus durch Variation der Konstanten: ⇒ Is = K(t)e−Rt/L LK̇(t)e−Rt/L = U(t) 1 U(t)eRt/L . ⇒ K̇(t) = L 5.5. LINEARE DIFFERENTIALGLEICHUNGEN ERSTER ORDNUNG 79 Eine mögliche Wahl von Is (t) ist daher t e−Rt/L Is (t) = L dt U(t )eRt /L . 0 Als allgemeine Lösung der inhomogenen Gleichung erhalten wir den Ausdruck t −Rt/L e dt U(t )eRt /L I(t) = Ke−Rt/L + L 0 wobei K = I(0) ist. 4. Wir wollen noch den wichtigen Spezialfall einer Wechselspannung U(t) = U0 cos ωt behandeln. Es ist vorteilhaft, die Differentialgleichung L dI + RI = U0 dt eiωt cos ωt+i sin ωt für eine komplexe Größe I(t) zu lösen und am Ende den Realteil von I(t) zu nehmen. Nach unseren vorangegangenen Überlegungen ist −Rt/L I(t) = Ke e−Rt/L + L t dt U0 eiωt eRt /L 0 −1 R + iωL iωt R − iωL −Rt/L − e e . = Ke−Rt/L + U0 2 R + (ωL)2 −Rt/L = Ke Mit R + iωL = iωt Rt/L e −Rt/L e + U0 e R2 + (ωL)2 eiδ , δ = arctan ωL R erhalten wir als komplexe Lösung U0 U0 e−iδ ei(ωt−δ) e−Rt/L + I(t) = K − R2 + (ωL)2 R2 + (ωL)2 und somit die reelle Lösung I(t) = I(0) − U0 cos δ R2 + (ωL)2 U0 cos(ωt − δ) e−Rt/L + R2 + (ωL)2 für U(t) = U0 cos ωt. Nach einer Einschwingphase der Dauer τ ∼ L/R stellt sich eine phasenverschobene Schwingung mit der Kreisfrequenz ω ein, die unabhängig von der Anfangsbedingung I(0) ist. 80 5.6 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Bernoullische Differentialgleichung Die Bernoullische Differentialgleichung y + P (x)y = Q(x)y n , n = 1, lässt sich durch Einführung der neuen Variablen z = y 1−n auf eine lineare Differentialgleichung zurückfuhren: z = (1 − n)y −n y ⇒ y = z yn 1−n z yn + P (x)zy n = Q(x)y n 1−n ⇒ z + (1 − n)P (x)z = (1 − n)Q(x) ⇒ Beispiel: y + y = xy 2/3 2 1 1 ⇒ z + z = x 3 3 3 zh (x)Ce−x/3 , zs (x) = C(x)e−x/3 1 1 C (x)e−x/3 = x ⇒ C (x) = xex/3 3 3 n= C(x) = xex/3 − dx ex/3 = (x − 3)ex/3 zs (x) = x − 3 z(x) = zh (x) + zs (x) = Ce−x/3 + x − 3 3 y(x) = z(x)3 = Ce−x/3 + x − 3 5.7 Iterationsverfahren von Picard Ist die Integration des Anfangswertproblems y = f (x, y), y(x0 ) = y0 nicht exakt möglich, kann man Näherungsverfahren anwenden. Ein Beispiel dafür ist das Picardsche Iterationsverfahren. Durch Integration der Differentialgleichung bei Berücksichtigung der Anfangsbedingung erhält man die Integralgleichung x y(x) = y0 + dx f (x , y(x)) . x0 5.8. EXISTENZ- UND EINDEUTIGKEITSSATZ 81 Als nullte Näherung nimmt man die konstante Funktion y0 , setzt diese in die Integralgleichung ein, um auf diese Weise die erste Näherung x y1 (x) = y0 + dx f (x , y0 ) x0 zu erhalten. Man setzt dieses Verfahren nun fort und bekommt x y2 (x) = y0 + dx f (x , y1(x )) . x0 Der n-te Iterationsschritt liefert x yn (x) = y0 + dx f (x , yn−1(x )) . x0 Man erhält auf diese Weise eine Folge von Funktionen y0 , y1 (x), y2 (x), . . . , yn (x), . . . , die unter gewissen Voraussetzungen (siehe nächster Abschnitt) gegen die Lösung des Anfangswertproblems konvergiert. Beispiel: Behandeln Sie das Anfangswertproblem y = 1 + y2, y(0) = 0 mit Hilfe des Picardschen Iterationsverfahrens und vergleichen Sie ihr Ergebnis mit der exakten Lösung. 5.8 Existenz- und Eindeutigkeitssatz Das Anfangswertproblem xy = 2y, y(0) = 1 besitzt keine Lösung. Das Anfangswertproblem y = 2x, y(0) = 1 hat genau eine Lösung, nämlich y(x) = x2 + 1. Das Anfangswertproblem xy = y − 1, y(0) = 1 82 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN besitzt unendlich viele Lösungen der Form y(x) = 1 + kx (k beliebig). Der folgende Satz gibt ein hinreichendes Kriterium für die Existenz und Eindeutigkeit der Lösung des Anfangswertproblems y = f (x, y), y(x0 ) = y0 . Existenz: Die Funktion f (x, y) sei in einem offenen Rechteck , + D = (x, y)|x − x0 | < a, |y − y0 | < b stetig und beschränkt, das heißt |f (x, y)| ≤ K, ∀ (x, y) ∈ D, dann besitzt das Anfangswertproblem mindestens eine Lösung, die wenigstens auf dem Intervall I = {x |x − x0 | < min(a, b/K)} definiert ist. Eindeutigkeit: Ist außerdem die partielle Ableitung ∂f /∂y auf D stetig und beschänkt, ∂f (x, y) ∂y ≤ M ∀ (x, y) ∈ D, dann besitzt das Anfangswertptroblem nur eine Lösung, die jedenfalls ∀ x ∈ I definiert ist. Die Funktionenfolge des Picardschen Iterationsvefahrens konvergiert dann gegen diese Lösung. Bemerkung: Die Voraussetzungen dieses Satzes sind hinreichend aber keineswegs notwendig und können daher abgeschwächt werden. So kann etwa |∂f /∂y| ≤ M durch die schwächere Voraussetzung |f (x, y2 ) − f (x, y1)| ≤ M|y2 − y1 | (Lipschitz-Bedingung) ersetzt werden. 5.9 Systeme linearer Differentialgleichungen erster Ordnung mit konstanten Koeffizienten Wir haben n abhängige Veränderliche x1 (t), . . . , xn (t) und schreiben das Differentialgleichungssystem in kompakter Form ẋ(t) = Ax(t) 5.9. LINEARE DIFFERENTIALGLEICHUNGSSYSTEME 1. ORDNUNG 83 ⎛ ⎞ x1 ⎜.⎟ ⎜ ⎟ ⎟ x=⎜ ⎜ . ⎟, ⎝.⎠ xn mit ⎛ a11 ⎜ . ⎜ A=⎜ ⎜ . ⎝ . an1 . . . . . . . . . . ⎞ . a1n . . ⎟ ⎟ . . ⎟ ⎟, . . ⎠ . ann aik ∈ . Die allgemeine Lösung ist durch x(t) = eAt x(0) gegeben. Beispiele: 1. Die (nichtrelativistische) Bewegung eines Punktteilchens mit Masse m und elektromagnetischer Ladung q, das sich in einem zeitlich und räumlich kon = Bn (|n| = 1) befindet, wird durch stanten Magnetfeld B v mv̇ = q × B c beschrieben, d.h. v̇ = − qB n × v . mc ω Die Lösung dieses Systems von drei linearen Differentialgleichungen erster Ordnung ist daher v (t) = e−ωtn×v (0) ∞ (−ωt)k n × n × . . . n × v (0) . . . = k! k=0 k−mal Man zerlegt den Vektor v(0) in einen Anteil v (0) parallel zur Richtung des Magnetfeldes und einen Anteil v(0)⊥ normal dazu, v (0) = n n · v(0) + v(0) − n n · v (0) , v (0) v(0)⊥ und erhält somit in den einzelnen Summanden: k k k k k =0 =1 =2 =3 =4 ... v(0) n × v(0)⊥ n × (n × v (0)⊥ ) = −v (0)⊥ n × (−v (0)⊥ ) = −n × v (0)⊥ n × (−n × v (0)⊥ ) = v(0)⊥ ... 84 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN ⇒ v(t) = v (0) + v (0)⊥ (cos ωt − 1) − n × v (0)⊥ sin ωt = n n · v (0) + v (0) − n n · v (0) cos ωt − n × v (0) sin ωt Durch Integration von x˙ = v erhält man die Bahnkurve des Teilchens (Schraubenlinie): cos ωt sin ωt v (0) − n n · v(0) + n × v (0) x(t) = a + n n · v(0) t + ω ω 2. Wir betrachten das Differentialgleichungssystem ẋ1 = x1 + x2 ẋ2 = x2 1 1 A= 0 1 ⇒ ⇒ k A = 1 k 0 1 A ist nicht diagonalisierbar! → At e ∞ tk 1 k t 1 t = =e 0 1 k! 0 1 k=0 Lösung: x1 (t) = et x1 (0) + tx2 (0) x2 (t) = et x2 (0) Falls die Matrix A diagonalisierbar ist, d.h. wenn A eine Basis {v1 , . . . vn } von Eigenvektoren (Avi = ai vi ) besitzt, haben wir die folgende Situation: A = S ÂS −1 , ⇒  = diag(a1 , . . . an ), eAt = SeÂt S −1 , S = (v1 , . . . vn ) eÂt = diag(ea1 t , . . . ean t ). Zerlegt man den Vektor x(0) bezüglich der Basisvektoren, x(0) = n ci vi , i=1 so erhält man die Lösung in der Form At x(t) = e x(0) = n ci eai t vi . i=1 Bemerkung: Ist für einen der Eigenwerte ai = a∗i , dann ist auch a∗i ein Eigenwert von A (da A reell ist) mit dazugehörigem Eigenvektor vi∗ . ⇒ Re eai t vi , Im eai t vi sind reelle Lösungen. 5.10. ZEITENTWICKLUNG IN DER QUANTENMECHANIK 5.10 85 Zeitentwicklung in der Quantenmechanik In der Quantenmechanik wird die Zeitentwicklung eines Zustandsvektors ψ(t) ∈ H (im Schrödingerbild) durch die Schrödingergleichung ih̄ dψ(t) = Hψ(t) dt beschrieben. Dabei ist H ein hermitescher Operator (Hamiltonoperator), welcher der Observablen Gesamtenergie des betrachteten Systems“ entspricht. Die ” Lösung der Schrödingergleichung ist dann (wenn H zeitlich konstant ist) durch ψ(t) = exp(−iHt/h̄) ψ(0) gegeben. Da H hermitesch ist, ist der hier auftretende Operator exp(−iHt/h̄) unitär, woraus folgt, dass sich die Norm des Zustandsvektors nicht ändert: ψ(t)|ψ(t) = ψ(0)|ψ(0). Da H weiters eine ONB von Eigenvektoren, {φ1, . . . φn }, Hφk = Ek φk besitzt (E1 , . . . En sind die Energieeigenwerte), hat H die Spektraldarstellung H= n Ek φk φ†k = k=1 n Ek |φk φk | k=1 Somit ist exp(−iHt/h̄) = n −iEk t/h̄ e k=1 φk φ†k = n e−iEk t/h̄ |φk φk | k=1 und ψ(t) = exp(−iHt/h̄) ψ(0) n = e−iEk t/h̄ φk φ†k ψ(0) k=1 = n k=1 e−iEk t/h̄ |φk φk |ψ(0). 86 5.11 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Energie Die Differentialgleichung zweiter Ordnung mẍ = F (x) beschreibt die eindimensionale Bewegung eines Teilchens mit Masse m, das sich in einem rein ortsabhängigen Kraftfeld F (x) befindet. Schreibt man das Kraftfeld mit Hilfe der potentiellen Energie V (x) in der Form F (x) = − ∂V (x) , ∂x so erhält man ∂V (x) ẋ = 0 mẍẋ + ∂x ⇒ d mẋ2 + V (x) = 0. dt 2 Die Gesamtenergie mẋ2 + V (x) 2 bleibt somit während der gesamten Bewegung konstant, man spricht von einer sogenannten Erhaltungsgröße. Durch die Existenz dieser Erhaltungsgröße konnten wir die Differentialgleichung zweiter Ordnung auf eine Differentialgleichung erster Ordnung zurückführen, ( 2 E − V (x) , ẋ = ± m E= welche nun durch Separation der Variablen gelöst werden kann: dx ± = t − t0 . 2 E − V (x) m Beispiel: Der eindimensionale harmonische Oszillator wird durch das Kraftfeld F (x) = −kx beschrieben. Die dazupassende potentielle Energie ist daher V (x) = kx2 /2 und mẋ2 kx2 E= + 2 2 ist eine Erhaltungsgröße. Lässt sich diese Methode auch auf den Fall einer Bewegung in drei Dimensionen, mx¨ = F (x), 5.12. LINEARE DGLN 2. ORDNUNG MIT KONST. KOEFF. 87 übertragen? Dies ist nur dann der Fall, wenn es sich um ein sogenanntes konservatives Kraftfeld, (x), F (x) = −∇V handelt. Die Gesamtenergie E= mx˙ 2 + V (x) 2 ist dann wieder eine Erhaltungsgröße und eine der insgesamt sechs Integrationen ist damit ausgeführt. Beispiel: Das Zentralkraftfeld GmM x F (x) = − x 2 |x| besitzt die potentielle Energie V (x) = − 5.12 GmM . |x| Lineare Differentialgleichungen zweiter Ordnung mit konstanten Koeffizienten ẍ(t) + a1 ẋ(t) + a0 x(t) = f (t), a0 , a1 ∈ . Für die homogene Gleichung (f (t) = 0) machen wir den Ansatz: xh (t) = exp(λt) ⇒ λ2 + a1 λ + a0 = 0 ⇒ λ1,2 a1 =− ± 2 ( a21 − a0 . 4 Die folgende Fallunterscheidung ist nötig: 1. λ1 = λ2 (a) λi ∈ ⇒ xh (t) = Aeλ1 t + Beλ2 t , A, B ∈ . (b) λi = d.h. λ1,2 = α ± iω, ω = 0 ⇒ eλ1,2 t = eαt (cos ωt ± i sin ωt) Die allgemeine (reelle) Lösung ist daher in diesem Fall: xh (t) = eαt (A cos ωt + B sin ωt), A, B ∈ . 88 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 2. λ1 = λ2 = λ = −a1 /2 Die allgemeine Lösung ist in diesem Fall: xh (t) = Aeλt + Bteλt Beweis: Man muss nur durch Einsetzen in die homogene Differentialgleichung überprüfen, dass t exp λt eine Lösung ist. Bemerkung: Die homogene Differentialgleichung zweiter Ordnung, ẍh (t) + a1 ẋh (t) + a0 xh (t) = 0, kann auch als System von zwei linearen Differentialgleichungen erster Ordnung geschrieben werden, wenn man x1 = xh und x2 = ẋh setzt: ẋ1 = x2 ẋ2 = −a0 x1 − a1 x2 Aufgabe: Ermitteln Sie die Lösung mit Hilfe des früher besprochenen Verfahrens zur Behandlung von Systemen linearer Differentialgleichungen erster Ordnung. Die allgemeine Lösung der inhomogenen Differentialgleichung ist durch x(t) = xh (t) + xs (t) gegeben, wobei xs (t) eine beliebige spezielle Lösung der inhomogenen Gleichung ist. Ich diskutiere zunächst den wichtigen Spezialfall f (t) = exp μt (μ ∈ 1. μ = λ1 , λ2 Ansatz : xs (t) = Ceμt ⇒ C= 1 μ2 + a1 μ + a0 2. μ = λ1 = λ2 Ansatz : xs (t) = Cteμt ⇒ C= 1 2μ + a1 3. μ = λ1 = λ2 Ansatz : xs (t) = Ct2 eμt ⇒ C= 1 2 ): 5.12. LINEARE DGLN 2. ORDNUNG MIT KONST. KOEFF. 89 Bemerkung: Wählt man μ = μ1 +iμ2 (μ2 = 0), so ist Re xs (t) eine reelle Lösung für f (t) = Re exp μt = exp μ1 t cos μ2 t. Beispiel: Ich betrachte den Fall μ = iΩ = λ1,2 . Eine spezielle Lösung für f (t) = cos Ωt ist daher eiΩt −ω 2 + ia1 Ω + a0 (cos Ωt + i sin Ωt)(−Ω2 + a0 − ia1 Ω) = Re (−Ω2 + a0 )2 + a21 Ω2 (−Ω2 + a0 ) cos Ωt + a1 Ω sin Ωt = . (−Ω2 + a0 )2 + a21 Ω2 xs (t) = Re Bemerkung: Der Nenner hat sein Minimum für Ω2 = a0 . Das macht sich besonders stark bemerkbar, wenn ( a1 a2 λ1,2 = α ± iω = − ± i a0 − 1 2 4 √ und a21 a0 . Dann ist nämlich ω a0 und Ω → ω führt zur Resonanzkata” strophe“. Für eine allgemeine Form der Funktion f (t) und den Fall λ1 = λ2 ist eine spezielle Lösung der inhomogenen Gleichung durch die Formel 1 xs (t) = λ1 − λ2 t dt eλ1 (t−t ) − eλ2 (t−t ) f (t ) t0 gegeben. Der Beweis dieser Formel erfolgt durch Einsetzen in die Differentialgleichung. Die hier angegebene spezielle Lösung ist so gewählt, dass xs (t0 ) = 0 und ẋs (t0 ) = 0. Die Erfüllung der Randbedingungen x(t0 ) = x0 und ẋ(t0 ) = ẋ0 der allgemeinen Lösung x(t) = xh (t) + xs (t) erfolgt durch geeignete Wahl der zwei in xh (t) enthaltenen freien Konstanten. Bemerkung: Im Fall λ1,2 = α ± iω hat man 1 xs (t) = ω t dt eα(t−t ) sin ω(t − t )f (t ) t0 Im Fall λ1 = λ2 = λ ist t xs (t) = t0 dt (t − t )eλ(t−t ) f (t ). 90 5.13 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Lineare Differentialgleichungen mit konstanten Koeffizienten Wir suchen die allgemeine Lösung der folgenden linearen, homogenen Differentialgleichung n-ter Ordnung mit konstanten Koeffizienten: x(n) (t) + an−1 x(n−1) (t) + . . . + a1 ẋ(t) + a0 x(t) = 0, ai ∈ . Ansatz: x(t) = eλt ⇒ P (λ) = λn + an−1 λn−1 + . . . + a1 λ + a0 = 0. (n1 ) Das Polynom P (λ) habe die Nullstellen λ1 ( nα = n). (nk ) , . . . , λk mit Vielfachheiten nα Behauptung: Die linear unabhängigen Lösungen der Differentialgleichung sind: eλ1 t , . . . , tn1 −1 eλ1 t ; . . . ; eλk t , . . . , tnk −1 eλk t . Beweis: Es ist zu zeigen, dass die Funktionen tν eλi t , ν = 0, . . . , ni − 1 Lösungen sind. Mit Hilfe des Differentialoperators D= dn−1 d dn + a + . . . + +a1 + a0 n−1 n n−1 dt dt dt kann man die Differentialgleichung in der Form Dx = 0 schreiben. dν λt dν dν ν λi t λt λt = ν De = ν P (λ)e . Dt e = D ν e dλ dλ dλ λ=λi λ=λi λ=λi P (λ) = (λ − λ1 )n1 . . . (λ − λi )ni . . . (λ − λk )nk = Q(λ)(λ − λi )ni dν dν λt P (λ) = 0 f ür ν < ni ⇒ P (λ)e = 0 ⇒ Dtν eλt = 0. ν ν dλ dλ λ=λi 5.14 λ=λi Systeme linearer Differentialgleichungen 2. Ordnung mit konstanten Koffizienten Wir schreiben dieses Differentialgleichungssystem wieder in kompakter Form ẍ(t) + B ẋ(t) + Cx(t) = 0 5.14. LINEARE DIFFERENTIALGLEICHUNGSSYSTEME 2.ORDNUNG 91 ⎛ ⎞ x1 ⎜.⎟ ⎜ ⎟ ⎟ x=⎜ ⎜.⎟ ⎝.⎠ xn mit und reellen n × n-Matrizen B, C. Macht man den Ansatz x(t) = eλt v, so erhält man (λ2 + λB + C)v = 0, woraus folgt, dass λ die Gleichung det(λ2 + λB + C) = 0 erfüllen muss. Da sich ein lineares Differentialgleichungssystem zweiter Ordnung auf ein solches erster Ordnung zurückführen lässt, kann man auch so vorgehen: Man definiert x1 . x1 = x, x2 = ẋ = ẋ1 , X = x2 Das Differentialgleichungssystem lässt sich dann mit Hilfe des 2n-dimensionalen Spaltenvektors X und der 2n × 2n-Matrix A in der Form 0 Ẋ(t) = X(t) −C −B A schreiben. Die (formale) Lösung ist daher X(t) = eAt X(0). Ich beschränke mich hier auf die Diskussion eines Differentialgleichungssystems der Form M ẍ(t) = −Kx(t), M T = M, M > 0, K T = K, K ≥ 0. Dieser wichtige Spezialfall tritt bei der Behandlung kleiner Schwingungen in der Mechnik auf und folgt aus der Lagrangefunktion (→ T1) 1 1 L = ẋT M ẋ − xT Kx 2 2 92 KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN Da die Matrix M strikt positiv ist, existiert M −1/2 und man kann das Differentialgleichungssystem auch in der Form M 1/2 ẍ(t) = −M −1/2 KM −1/2 M 1/2 x(t) schreiben. Da die Matrix M −1/2 KM −1/2 symmetrisch und positiv ist, kann sie durch eine (reelle) Orthogonalmatrix S diagonalisiert werden: M −1/2 KM −1/2 = SΩ2 S T , Ω2 = diag(ω12 , . . . ωn2 ), ωi2 ≥ 0. Die Eigenfrequenzen ω1 , . . . ωn erhält man aus der Gleichung det(ω 2 − M −1/2 KM −1/2 ) = det(ω 2 M − K) = 0 Definiert man Q(t) = S T M 1/2 x(t), so ergibt sich ein System von n entkoppelten Differentialgleichungen Q̈(t) = −Ω2 Q(t) für die Normalkoordinaten Q1 (t), . . . , Qn (t): Q̈i (t) = −ωi2 Qi (t), i = 1, . . . , n. Für ωi = 0 erhält man die allgemeine Lösung Qi (t) = Ai cos ωi t + Bi sin ωi t. Im aperiodischen Grenzfall ωi = 0 ist die Lösung Qi (t) = Ai + Bi t. Die allgemeine Lösung Q(t) ist somit Q(t) = n Qi (t)ei . i=1 In den ursprünglichen Koordinaten hat man daher x(t) = M −1/2 SQ(t) = n i=1 Qi (t) M −1/2 Sei . vi Die Vektoren v1 , . . . , vn erfüllen die Eigenwertgleichungen (Mωi2 − K)vi = 0 und sind gemäß viT Mvj = δij normiert. Kapitel 6 Komplexe Analysis Die Verwendung von Methoden der komplexen Analysis führt oft zu einer gewaltigen Vereinfachung sonst meist langwieriger Rechnungen. Grundkenntnisse der komplexen Analysis zählen daher zum Standardrepertoire in der theoretischen Physik. 6.1 Komplexe Zahlen 6imaginäre Achse * r θ HH HH x = r cos θ HH HH HH H j H z = x + iy = reiθ y = r sin θ - reelle Achse z ∗ = x − iy = re−iθ Eine komplexe Zahl z = x + iy ∈ mit Realteil x = Re z ∈ und Imaginärteil y = Im z ∈ lässt sich durch einen (Orts-)Vektor in der komplexen ist die imaginäre Einheit mit Zahlenebene veranschaulichen. Die Zahl i ∈ 2 i = −1. Die zu z = x + iy (komplex) konjugierte Zahl z ∗ = x − iy entspricht 93 KAPITEL 6. KOMPLEXE ANALYSIS 94 der Spiegelung von z an der reellen Achse. Die Länge oder der Betrag von z ist durch √ |z| = |x + iy| = x2 + y 2 = z ∗ z gegeben. Wichtig ist auch die Polardarstellung z = r cos θ + ir sin θ = r (cos θ + i sin θ), eiθ r = |z| ≥ 0 , θ = arg z ∈ [0, 2π) . Die Addition von zwei komplexen Zahlen, z1 + z2 = (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 ) entspricht einfach der Vektoraddition. Die geometrische Interpretation der Multiplikation zweier komplexer Zahlen ist bei Verwendung der Polardarstellung besonders leicht zu sehen: z1 z2 = r1 eiθ1 r2 eiθ2 = r1 r2 ei(θ1 +θ2 ) Die Längen |z1 | = r1 , |z2 | = r2 der beiden komplexen Zahlen werden miteinander multipliziert und die Argumente arg z1 = θ1 , arg z2 = θ2 werden addiert. Man kann sich auch leicht von der Gültigkeit der Dreiecksungleichung |z1 + z2 | ≤ |z1 | + |z2 | ∀ z1 , z2 ∈ und der Formel |z1 z2 | = |z1 ||z2 | ∀ z1 , z2 ∈ überzeugen. 6.2 Komplexe Funktionen Die Exponentialfunktion lässt sich durch die Definion ez = exp z = ex (cos y + i sin y) = ex eiy , zu einer Abbildung exp : wohnten Rechenregeln z = x + iy → verallgemeinern. Es gelten weiterhin die geez1 +z2 = ez1 ez2 , ∀ z1,2 ∈ , sowie die aus der reellen Analysis bekannte Potenzreihenentwicklung z e = ∞ zn n=0 n! , z∈ . 6.2. KOMPLEXE FUNKTIONEN 95 Für die trigonometrischen Funktionen suggerieren die aus der Eulerschen Formel eix = cos x + i sin x (x ∈ ) folgenden Relationen eix + e−ix , cos x = 2 eix − e−ix sin x = , 2i x∈ die Definitionen: cos z = eiz + e−iz , 2 sin z = eiz − e−iz , 2i z∈ . Alle gewohnten Formeln für die reellen trigonometrischen Funktionen gelten dann auch im Komplexen (z.B. sin2 z + cos2 z = 1, etc.) Analog definiert man die Hyperbelfunktionen durch die bekannten Formeln cosh z = ez + e−z , 2 sinh z = ez − e−z , 2 z∈ . Die Berechnung der n-ten Wurzel einer komplexen Zahl z erfordert etwas mehr Vorsicht. Betrachten wir die Beziehung , fix), so entspricht jedem vorgegebenen Wert w ∈ genau ein Wert z ∈ . Dagegen z = wn, (n ∈ gibt es zu jedem z = 0 n verschiedene mögliche Werte von w. Der Ausdruck √ w= nz ist somit mehrdeutig und stellt keine Funktion → dar. Zur Bestimmung der n verschiedenen möglichen Werte von w geht man folgendermaßen vor: z = reiθ w = Reiφ ' ⇒ n inφ e reiθ = R wn z √ ⇒ r = Rn ⇒ R = n r ≥ 0 (eindeutig) i(θ+2kπ) iθ inφ e =e =e , k∈ θ 2kπ , k = 0, 1, . . . , n − 1, ⇒ φ= + n n √ √ θ 2kπ ⇒ w = n z = n r ei( n + n ) , k = 0, 1, . . . , n − 1. √ Die n verschiedenen Werte von n z liegen auf einem Kreis mit Radius n |z| um den Ursprung und bilden die Eckpunkte eines Polygons mit n gleich langen Seiten. KAPITEL 6. KOMPLEXE ANALYSIS 96 Ebenso ist der Logarithmus einer komplexen Zahl ein mehrdeutiger Ausdruck. Gehen wir, analog zu vorhin, von der Relation z = ew aus, so gibt es wieder zu jedem vorgegebenen Wert von w genau einen Wert von z. Dagegen gibt es zu jedem Wert von z = 0 unendlich viele verschiedene Werte von w, da w und w + 2πik (k ∈ ) das gleiche z liefern: ' z = reiθ ⇒ reiθ = eu eiv w = u + iv ⇒ eu = r ⇒ u = ln r (eindeutig) i(θ+2πk) iθ iv e =e =e , k∈ ⇒ v = θ + 2πk, k ∈ ⇒ w = ln z = ln r + i (θ + 2πk) , k ∈ Beispiel: ln i = i π 2 + 2πk , k∈ Allgemeine Potenzen komplexer Zahlen kann man durch den i.Allg. mehrdeutigen Ausdruck z c = ec ln z , c ∈ , z = 0 definieren. z c = ec ln r eicθ eic2πk , k∈ ist eindeutig für c = n ∈ : k∈ n inθ z n = en ln r einθ ei2πkn = r e , 1 Für c = n1 , (n = 2, 3, . . . , ) erhält man den bereits bekannten Ausdruck für 1 1 θ z n = e n ln r ei n ei π 2kπ n = π √ n θ r ei( n + 2kπ n √ n z: ). Beispiel: ii = ei ln i = eii( 2 +2kπ) = e−( 2 +2kπ) , k ∈ . ii ist somit rein reell. 6.3 Riemannsche Flächen √ Die Verwendung mehrdeutiger Ausdrücke wie z oder ln z lässt sich vermeiden, indem man für den Definitionsbereich statt der komplexen Zahlenebene geeignet gewählte Mannigfaltigkeiten, sogenannte Riemannsche Flächen, verwendet. 6.3. RIEMANNSCHE FLÄCHEN 97 Um eine geeignete Riemannsche Fläche für die Quadratwurzel zu konstruieren, betrachten wir zunächst die Abbildung z → z 2 der komplexen Zahlenebene auf 2 2 sich selbst. Diese Abbildung √ ist wegen (−z) = z nicht injektiv und2 somit nicht invertiertbar (und z daher mehrdeutig). Fasst man aber z → z nicht als Abbildung → , sondern als Abbildung → R auf, so ist diese Abbildung injektiv und somit invertierbar. R ist die unten dargestellte zweiblättrige Riemannsche Fläche. Eine mögliche Parametrisierung von R ist: (r, θ), r ≥ 0, 0 ≤ θ < 4π (0 und 4π werden identifiziert) √ Somit ist z → z, aufgefasst als Abbildung R → , eine Funktion (also nicht mehr mehrdeutig). √ √ θ (r, θ) −→ ( r, ) 2 θ 0 ≤ θ < 4π 0 ≤ < 2π 2 Bemerkungen: Der Ursprung ist in dem obigen Beispiel ein Verzweigungspunkt (erster Ordnung). Die Lage des Verzweigungsschnittes, der 0 und ∞ verbindet, ist an sich willkürlich, Hier wurde er längs der positiven reellen Achse gewählt. Allgemein heißt ein Verzweigungspunkt von der Ordnung n − 1, wenn √ n er n Blätter verbindet. Die Riemannsche Fläche für z besitzt n Blätter mit einem Verzweigungspunkt der Ordnung n − 1 bei z = 0. Die Riemannsche Fläche für den Logarithmus hat unendlich viele Blätter (der Nullpunkt gehört nicht dazu). Mögliche Parametrisierung: (r, θ), (r, θ) ln −→ r > 0, θ∈ ln r + iθ ∈ KAPITEL 6. KOMPLEXE ANALYSIS 98 6.4 Differentiation im Komplexen Die Forderung der Differenzierbarkeit einer Funktion ist im Komplexen, wegen der größeren Bewegungsfreiheit in der komplexen Zahlenebene, wesentlich einschränkender als die Differenzierbarkeit im Reellen. Zunächst einige Definitionen: Definition: D ⊆ heißt offen, wenn mit jedem Punkt z ∈ D auch eine offene Kreisscheibe + , mit Mittelpunkt z ganz in D liegt (d.h. ∀ z ∈ D ∃ r > 0 : y |y − z| < r ⊆ D). Sei nun f : D → eine auf einer offenen Teilmenge D ⊆ definierte Funktion, und z0 ∈ D. f (z) = f (x + iy) = u(x, y) + iv(x, y) Definition: lim f (z) = w :⇔ z→z0 ∀ ε > 0 ∃ δ(ε) > 0, sodass |f (z) − w| < ε ∀ z mit |z − z0 | < δ(ε). Man sagt in diesem Fall: f (z) hat den Grenzwert (Limes) w für z → z0“. ” Bemerkung: Die Funktion f (z) strebt in diesem Fall bei jeder beliebigen Annäherung z → z0 gegen den Grenzwert w. Definition: f heißt stetig im Punkt z0 ∈ D, wenn lim f (z) = f (z0 ). z→z0 Definition: f heißt stetig auf D, wenn f in jedem Punkt von D stetig ist. Definition: f heißt differenzierbar im Punkt z ∈ D, wenn der Limes f (z + h) − f (z) h→0 h f (z) = lim existiert. Dies ist äquivalent zu f (z + h) = f (z) + f (z)h + α(h)h mit lim α(h) = 0, h→0 woraus folgt: f differenzierbar im Punkt z ⇒ f stetig im Punkt z. 6.4. DIFFERENTIATION IM KOMPLEXEN 99 Definition: f heißt holomorph auf D, wenn f in jedem Punkt von D differenzierbar ist. Satz: Ist eine Funktion f (z) = u(x, y) + iv(x, y) im Punkt z = x + iy differenzierbar, dann erfüllen u, v im Punkt (x, y) die Cauchy-Riemannschen Differentialgleichungen ∂u ∂v ∂u ∂v = , =− . ∂x ∂y ∂y ∂x Beweis: h = Δx + iΔy, f (z) = = = = = u(x + Δx, y + Δy) + iv(x + Δx, y + Δy) − u(x, y) − iv(x, y) Δx+iΔy→0 Δx + iΔy u(x + Δx, y) + iv(x + Δx, y) − u(x, y) − iv(x, y) lim Δx→0,Δy=0 Δx ∂u ∂v +i ∂x ∂x u(x, y + Δy) + iv(x, y + Δy) − u(x, y) − iv(x, y) lim Δx=0,Δy→0 iΔy 1 ∂u ∂v + . i ∂y ∂y lim Durch Vergleich von Real- und Imaginärteil folgt die Behauptung. Bemerkung: Es gilt auch die Umkehrung, d.h. erfüllen zwei reelle Funktionen u, v im Punkt (x, y) die Cauchy-Riemannschen Differentialgleichungen, so ist die komplexe Funktion f = u + iv im Punkt z = x + iy differenzierbar. Beispiele: 1. f (z) = z 2 (z + h)2 − z 2 z 2 + 2zh + h2 − z 2 = lim h→0 h→0 h h = lim (2z + h) = 2z (wie im Reellen) f (z) = lim h→0 z 2 = (x + iy)2 = x2 − y 2 +i 2xy u(x,y) ⇒ ∂u = 2x, ∂x v(x,y) ∂u = −2y, ∂y ∂v = 2y, ∂x ∂v = 2x. ∂y Die Cauchy-Riemannschen Differentialgleichungen sind somit erfüllt. 2. f (z) = z ∗ ist nicht differenzierbar. z ∗ = x − iy ⇒ u(x, y) = x, v(x, y) = −y KAPITEL 6. KOMPLEXE ANALYSIS 100 ∂u ∂v ∂v ∂u ∂v ∂u = 1, = 0, = 0, = −1 ⇒ = . ∂x ∂y ∂x ∂y ∂x ∂y Die Cauchy-Riemannschen Differentialgleichungen sind in diesem Fall nicht erfüllt. Bemerkung: Es gelten die aus der reellen Analysis vertrauten Rechenregeln. f, g differenzierbar ⇒ (f + g) = f + g , (f g) = f g + f g . (z n ) = nz n−1 , (sin z) = cos z, 6.5 (ez ) = ez , (cos z) = − sin z, etc. Integration im Komplexen Eine glatte orientierte Kurve γ in der komplexen Zahlenebene wird durch eine Parameterdarstellung [a, b] ⊂ → , t → z(t) = x(t) + iy(t) beschrieben, wobei ż(t) = 0 für alle t ∈ [a, b] existiert und stetig ist. Sei nun f eine auf γ definierte und dort stetige komplexwertige Funktion. Dann definiert man das Kurvenintegral durch b dz f (z) := γ dt ż(t)f (z(t)). a 6.5. INTEGRATION IM KOMPLEXEN 101 Bemerkungen: 1. Die Definition des Kurvenintegrals ist unabhängig von der Wahl der Parametrisierung der Kurve γ. 2. Das Kurvenintegral kann auch als Grenzwert aufgefasst werden: dz f (z) = lim n→∞ γ n Δzm f (ζm ), Δzm = zm − zm−1 . m=1 3. Die Definition des Kurvenintegrals kann unmittelbar auf stückweise glatte Kurven erweitert werden: dz f (z) = dz f (z) γ k γ k Beispiele: 1. f (z) = z n , n ∈ γ sei ein Kreis mit Radius r und Mittelpunkt im Ursprung, der ein Mal im mathematisch positiven Sinn (d.h. gegen den Uhrzeigersinn) durchlaufen wird. Eine mögliche Parametrisierung ist z(t) = reit , 0 ≤ t ≤ 2π. KAPITEL 6. KOMPLEXE ANALYSIS 102 '$ γ r@@ I 0 &% ⇒ ż(t) = ireit 2π dz f (z) = dt ireit r n eint = γ 0 dz z n ! 2π 2π n+1 ei(n+1)t ir = 0 für n = −1 i(n+1) = ir n+1 dt ei(n+1)t = , 0 2πi für n = −1 0 & 0 für n = −1 = n∈ . 2πi für n = −1 γ Bemerkung: Für f (z) = (z−z0 )n , n ∈ und einen Kreis mit Mittelpunkt z0 erhält man das gleiche Resultat: & 0 für n = −1 n dz (z − z0 ) = n∈ . 2πi für n = −1 γ 2. Das Kurvenintegral einer nichtholomorphen Funktion: f (z) = Re z = x 6.5. INTEGRATION IM KOMPLEXEN γ1 : z(t) = (1 + i)t, 0 ≤ t ≤ 1 ⇒ Re z = t 1 1+i dz f (z) = dt (1 + i)t = 2 γ1 γ2 : 103 0 zunächst z(t) = t, 0 ≤ t ≤ 1, (Re z = t), dann z(t) = 1 + it, 0 ≤ t ≤ 1, (Re z = 1), 1 1 1 dz f (z) = dt t + i dt = + i. 2 γ2 0 0 Der Wert des Integrals hängt in diesem Fall nicht nur von den Endpunkten der Integrationskurve, sondern auch von ihrer Form ab. Einige Eigenschaften komplexer Kurvenintegrale: 1. γ sei eine Kurve mit Anfangspunkt z1 und Endpunkt z2 . Bezeichnet man die in der entgegengesetzten Richtung durchlaufene Kurve mit −γ (diese besitzt also den Anfangpunkt z2 und den Endpunkt z1 ), so gilt dz f (z) = − dz f (z) −γ γ 2. dz [λ1 f1 (z) + λ2 f2 (z)] = λ1 γ dz f1 (z) + λ2 γ dz f2 (z), γ λ1,2 ∈ KAPITEL 6. KOMPLEXE ANALYSIS 104 dz f (z) ≤ M l(γ) 3. γ dabei ist l(γ) die Länge der Kurve γ und |f (z)| ≤ M für alle z auf γ, denn n n n Δzm f (ζm ) ≤ |Δzm | |f (ζm )| ≤ M |zm | → M l(γ) m=1 m=1 m=1 Bsp. : γ dz ≤ z 2πr r '$ γ r@@ I = 2π 0 &% Angenommen f (z) besitze eine Stammfunktion F (z), d.h. F (z) = f (z). Dann ist b dz f (z) = γ b dt ż(t)f (z(t)) = a a b dt = dt ż(t)F (z(t)) d F (z(t)) = F (z(b)) − F (z(a)). dt a Bemerkung: Dabei wurde verwendet, dass dF (z) d dz(t) F (z(t)) = dt dz z=z(t) dt ist: F (x + iy) = u(x, y) + iv(x, y) ∂u ∂v ∂v ∂u ẋ + ẏ + i ẋ + ẏ . ⇒ Ḟ = ∂x ∂y ∂x ∂y Andererseits ist ∂u dF (z) ∂v ż = +i (ẋ + iẏ) dz ∂x ∂y ∂v ∂y − ∂u ∂y ∂u ∂u ẋ + ẏ + i = ∂x ∂y ∂v ∂v ẋ + ẏ ∂x ∂y = Ḟ . 6.5. INTEGRATION IM KOMPLEXEN 105 Wenn also f eine Stammfunktion besitzt, dann hängt dz f (z) γ nur von den Endpunkten, aber nicht von der Form des dazwischenliegenden Integrationsweges ab. dz f (z) = γ1 dz f (z) γ2 Weiters folgt, dass der Wert des Integrals über eine geschlossene Kurve in diesem Fall verschwindet (da Anfangs- und Endpunkt der Kurve zusammenfallen). dz f (z) = F (z0 ) − F (z0 ) = 0 γ KAPITEL 6. KOMPLEXE ANALYSIS 106 Beispiele: 1. f (z) = k ∈ (k = const.) ⇒ F (z) = kz ∀z ∈ . Das Integral z2 dz k = k(z2 − z1 ) z1 ist daher unabhängig von dem zwischen z1 und z2 gewählten Weg. 2. f (z) = z ⇒ F (z) = z 2 /2 ∀ z ∈ . Das Integral z2 z 2 − z12 dz z = 2 2 z1 ist daher unabhängig vom Weg zwischen z1 und z2 . 3. f (z) = 1/z; F (z) = ln z ist mehrdeutig, man kann z.B. Ln z = ln r + iθ, r > 0, 0 ≤ θ < 2π auswählen. Dies ist aber keine Stammfunktion von 1/z ∀ z ∈ \ {0}, da Ln z längs der reellen Achse unstetig ist (Sprung um 2πi). 6.5. INTEGRATION IM KOMPLEXEN Ln z ist aber Stammfunktion von 1/z, wenn man sich etwa auf das Gebiet beschränkt. In diesem Gebiet hängt dz γ dz γ 1 z 107 \ + nur von den Endpunkten ab: 1 r2 2 = [ln r + iθ]rr21 ,θ + i(θ2 − θ1 ) ,θ1 = ln z r1 Wählt man r1 = r2 = r und θ1 = ε/2, θ2 = 2π − ε/2, so folgt dz = i(2π − ε) −→ 2πi. ε→0 z γ Weiters ist dz rε 0 z ≤ r = ε −→ ε→0 γ für die direkte Verbindung γ der Länge l(γ ) = rε zwischen z2 und z1 . Somit erhält man das Ergebnis, dass . dz = 2πi z für eine beliebige geschlossene Kurve, die den Nullpunkt ein Mal im mathematisch positiven Sinn umläuft. (Für den Spezialfall eines Kreises mit Mittelpunkt im Ursprung hatten wir dieses Resultat bereits hergeleitet.) Umschließt dagegen eine geschlossene Integrationskurve γ den Nullpunkt nicht, dann ist dz =0 z 108 KAPITEL 6. KOMPLEXE ANALYSIS Diese Formeln kann man durch eine Verschiebung 0 → z0 sofort verallgemeinern (γ ist wieder eine geschlossene Kurve, die ein Mal im mathematisch positiven Sinn durchlaufen wird): & . dz 2πi falls γ den Punkt z0 umschließt = 0 falls γ den Punkt z0 nicht umschließt z − z 0 γ 6.6 Integralsatz von Cauchy Wir werden im Folgenden mit zusammenhängenden offenen Gebieten D ⊆ zu tun haben, bei denen je zwei Punkte z1,2 ∈ D durch eine (stückweise) glatte, ganz in D liegende Kurve verbunden werden können. Ein solches Gebiet heißt einfach zusammenhängend, falls jede einfach geschlossene (doppelpunktfreie) Kurve in D nur Punkte von D umschließt. Man kann dies auch so ausdrücken, dass sich in diesem Fall jede einfach geschlossene, in D liegende Kurve stetig auf einen in D liegenden Punkt zusammenziehen lässt, ohne dass dabei D verlassen wird. 6.6. INTEGRALSATZ VON CAUCHY 109 Ein Punkt z ∈ D heißt Randpunkt von D, falls in jeder Umgebung von z sowohl Punkte von D als auch nicht zu D gehörende Punkte liegen. Die Menge der Randpunkte von D bildet den Rand von D, der mit ∂D bezeichnet wird. Besteht ∂D aus (i. Allg. mehreren) einfach geschlossenen Kurven, so wählen wir die Orientierung von ∂D so, dass sich D stets am linken Ufer des Randes befindet. Ein nicht einfach zusammenhängendes Gebiet heißt mehrfach zusammenhängend. Das Innere eines Kreises ist einfach zusammenhängend, dagegen ist ein Kreisring mehrfach zusammenhängend (genauer: zweifach zusammenhängend). Ebenso ist D = {z ∈ | 0 < |z| < r} (das Innere eines Kreises, bei dem der Mittelpunkt entfernt wurde) zweifach zusammenhängend. Allgemein heißt ein beschränktes Gebiet D n-fach zusammenhängend, falls sein Rand ∂D aus n voneinander getrennten geschlossenen Kurven oder isolierten Punkten besteht. Beispiel für ein dreifach zusammenhängendes Gebiet: Integralsatz von Cauchy: Ist f (z) holomorph in einem einfach zusammenhängenden offenen Gebiet D, dann gilt für jede (einfach) geschlossene Kurve γ in D: dz f (z) = 0. γ Beweis: γ sei zunächst der Rand eines Dreiecks, der im mathematisch positiven Sinn durchlaufen werde. Man verbindet die Mittelpunkte der Dreiecksseiten und unterteilt das Dreieck dadurch in vier kongruente Teildreiecke, deren Ränder mit γI , γII , γIII , γIV bezeichnet werden. Man erhält dz f (z) = dz f (z) + dz f (z) + dz f (z) + dz f (z), γ γI γII γIII γIV KAPITEL 6. KOMPLEXE ANALYSIS 110 da auf der rechten Seite entlang der drei Unterteilungsstrecken jeweils in beiden Richtungen integriert wird und die entsprechenden Beiträge in der Gesamtsumme somit wegfallen. Die Anwendung der Dreiecksungleichung ergibt dz f (z) ≤ dz f (z) + dz f (z) + + dz f (z) . dz f (z) γ γI γII γIII γIV Von den vier Summanden auf der rechten Seite wählt man den größten aus, bezeichnet die entsprechende Randkurve mit γ1 und erhält dz f (z) ≤ 4 dz f (z) . γ γ1 Das durch γ1 berandete Dreieck wird nun wie vorhin in Teildreiecke zerlegt. Für eines von ihnen (mit Rand γ2 ) gilt wieder dz f (z) ≤ 4 dz f (z) γ1 γ2 dz f (z) ≤ 42 dz f (z) . und somit γ γ2 Setzt man das Verfahren fort, dann erhält man eine unendliche Folge von Dreiecken D1 ⊃ D2 ⊃ D3 ⊃ . . . mit Rändern γ1 , γ2, γ3 , . . . und n dz f (z) ≤ 4 dz f (z) , n = 1, 2, 3, . . . γ γn Es sei nun z0 jener Punkt, der in allen Dreiecken D1 , D2 , . . . enthalten ist. Da die Funktion f laut Voraussetzung am Punkt z0 differenzierbar ist, kann man schreiben f (z) = f (z0 ) + f (z0 )(z − z0 ) + α(z)(z − z0 ), 6.6. INTEGRALSATZ VON CAUCHY 111 wobei lim α(z) = 0. Integriert man diesen Ausdruck längs der Randkurve γn , so z→z0 erhält man dz f (z) = dz f (z0 ) + dz f (z0 )(z − z0 ) + dz α(z)(z − z0 ). γn γn γn 0 γn 0 Da α(z) → 0 für z → z0 , gibt es zu jedem ε > 0 ein δ(ε) > 0, sodass |α(z)| < ε ∀ z mit |z − z0 | < δ(ε) . Wir wählen nun n so groß, dass für alle Punkte z ∈ Dn |z−z0 | < δ(ε) ist. Bezeichnet man die Länge von γn mit ln , dann ist |z−z0 | ≤ ln /2 für alle z ∈ γn und z0 ∈ Dn . Somit erhält man 2 dz f (z) = dz α(z)(z − z0 ) < ε ln ln = εln . 2 2 γn γn Sei nun l die Länge von γ. Dann hat die Kurve γ1 die Länge l1 = l/2 und schließlich hat γn die Länge ln = l/2n . 2 l ε ε ε 2 n n 2 n l . = ⇒ dz f (z) = 4 dz f (z) < 4 ln = 4 2 2 2n 2 γ γn Da ε > 0 beliebig klein gewählt werden kann, folgt dz f (z) = 0. γn Bis jetzt hatten wir uns auf den Spezialfall beschränkt, dass γ der Rand eines Dreiecks ist. Der Beweis für den Fall, dass es sich bei γ um den Rand eines Polygons handelt folgt unmittelbar aus dem Beweis für ein Dreieck, da sich jedes Polygon in Teildreiecke zerlegen lässt. KAPITEL 6. KOMPLEXE ANALYSIS 112 Der allgemeine Fall einer einfach geschlossenen Kurve γ kann nun dadurch behandelt werden, dass man γ beliebig genau durch die Seiten eines Polygons approximiert. Beispiele: 1. - dz ez = 0 für eine beliebige geschlossene Kurve γ, da ez in der gesam- γ ten komplexen Zahlenebene holomorph ist. In diesem Fall kann man auch argumentieren, dass ez Stammfunktion von ez in der gesamten komplexen Zahlenebene ist und das Kurvenintegral von ez über eine geschlossene Kurve somit verschwinden muss. 2. Ebenso gilt dz sin z = dz cos z = 0 für eine beliebige geschlossene Kurve γ. γ γ 3. Die komplexe Funktion sin z cos z ist für jene Werte von z nicht definiert (und somit auch nicht differenzierbar), bei denen cos z = 0 ist. Es sind dies die auf der reellen Achse liegenden Zahlen zn = π/2 + nπ, n ∈ . Der Cauchysche Integralsatz ist in diesem Fall somit nur auf einfach zusammenhängende Gebiete anwendbar, welche keine der Punkte zn enthalten. Man kann dies auch so formulieren: dz tan z = 0, tan z = γ falls die geschlossene Kurve γ keine der zn umschließt. 6.6. INTEGRALSATZ VON CAUCHY 113 Ist f holomorph in einem einfach zusammenhängenden offenen Gebiet D und sind γ1 und γ2 zwei ganz in D liegende Kurven mit gemeinsamem Anfangspunkt z1 und gemeinsamem Endpunkt z2 , dann folgt aus dem Cauchyschen Integralsatz: 0 = dz f (z) + dz f (z) −γ2 γ1 dz f (z) − = γ1 dz f (z) = γ1 dz f (z) γ2 ⇒ dz f (z), γ2 d.h. das Integral ist wegunabhängig. Anders ausgedrückt: Bei festgehaltenem Anfangs- und Endpunkt der Integrationskurve ändert sich der Wert des Integrals nicht, wenn man den Integrationsweg stetig deformiert (ohne dabei das Holomorphiegebiet der Funktion zu verlassen). Bis jetzt hatten wir immer angenommen, dass das Holomorphiegebiet D der betrachteten Funktion einfach zusammenhängend ist. Ist D dagegen mehrfach zusammenhängend, so kann dieses Gebiet in geeignete einfach zusammenhängende Teilgebiete zerlegt werden, auf die dann der Cauchysche Integralsatz anwendbar ist. Beispiel: Das zweifach zusammenhängende Gebiet D enthalte die geschlossenen (im entgegengesetzten Sinn durchlaufenen) Kurven γ, γ, wobei wir annehmen wollen, dass sich beide (innerhalb von D) nicht stetig auf einen Punkt zusammenziehen lassen. Die Funktion f sei auf D holomorph. Die von γ , einem Teil von γ, γ und schließlich einem Teil von γ gebildete geschlossene Kurve liegt nun vollständig in einem einfach zusammenhängenden Holomorphiegebiet von f . Der Cauchysche Integralsatz ist somit anwendbar. Analog KAPITEL 6. KOMPLEXE ANALYSIS 114 gilt dies für die aus −γ , dem zweiten Teil von γ, −γ und dem zweiten Teil von γ gebildete geschlossene Kurve. Kombiniert man diese beiden Resultate und beachtet weiters, dass dz f (z) + dz f (z) = dz f (z) + dz f (z) = 0, γ −γ γ so erhält man das Ergebnis dz f (z) + γ −γ dz f (z) = 0. γ Bevorzugt man für beide Kurven den gleichen Umlaufsinn, so hat man (γ1 := −γ) dz f (z) = dz f (z) γ γ1 Für den allgemeinen Fall eines n + 1-fach zusammenhängenden Gebiets erhält man: n dz f (z) = dz f (z) γ k=1 γ k 6.6. INTEGRALSATZ VON CAUCHY 115 Eine andere Formulierung könnte auch so lauten: Sei D ein mehrfach zusammenhängendes Gebiet, dessen Rand ∂D aus einfach geschlossenen Kurven besteht. Weiters liege D zusammen mit seinem Rand in einem Holomorphiegebiet der Funktion f . Dann gilt: dz f (z) = 0 ∂D Beispiele: 1. Die Formel dz = z γ dz = 2πi z K gilt für eine beliebige einfach geschlossene Kurve γ, die den Nullpunkt umschließt: 2. Analog ist & dz(z − z0 ) = n γ 0 n = −1 2πi n = −1 für eine beliebige geschlossene Kurve, die den Punkt z0 (im mathematisch positiven Sinn) ein Mal umschließt. KAPITEL 6. KOMPLEXE ANALYSIS 116 3. Wir wollen γ dz z2 + 1 für die abgebildete Integrationskurve berechnen. Die geschlossene Integrationskurve γ wird gebildet Intervall aus dem reellen , + [−R, +R] und dem Halbkreisbogen HR = Reiϕ 0 ≤ ϕ ≤ π, R > 1 . dx dz + 2 2 x +1 z +1 −R HR 1 dz dz 1 2πi = =π − = 2i z − i 2i z+i 2i γ γ dz = 2 z +1 γ +R 0 2πi Um das reelle Integral ∞ −∞ dx = lim 2 x + 1 R→∞ +R −R dz +1 z2 zu bestimmen, benötigen wir eine Abschätzung für z 21+1 : Auf dem Halb- 6.6. INTEGRALSATZ VON CAUCHY 117 kreisbogen HR gilt: ⇒ ⇒ ⇒ R2 = |z 2 | = |(z 2 + 1) − 1| ≤ |z 2 + 1| + 1 R2 − 1 ≤ |z 2 + 1| 1 1 ≥ 2 2 R −1 |z + 1| dz πR −→ 0 z 2 + 1 ≤ R2 − 1 R→∞ HR ∞ ⇒ −∞ dx =π +1 x2 4. Umschließt die Integrationskurve γ von γ rere der Nullstellen zn = π 2 dz tan z = - dz sin z/ cos z meh- γ + nπ von cos z, so genügt es die Integrale dz tan z |z−zn |=r zu berechnen, wobei der gegen den Uhrzeigersinn durchlaufene Kreis |z − zn | = r innerhalb von γ liegt und außer zn keine weitere Nullstelle umschließt. Da man den Radius r beliebig klein machen kann, muss man das Verhalten des Integranden nur in infinitesimalen Umgebungen der von γ umschlossenen zn untersuchen. dz tan z = dz tan z (zn innerhalb von γ) γ n |z−zn |=r KAPITEL 6. KOMPLEXE ANALYSIS 118 6.7 Unbestimmtes Integral Wir wissen bereits: Wenn f (z) in einem offenen Gebiet D eine Stammfunktion F (z) besitzt (d.h. F (z) = f (z)), dann ist z2 dz f (z) = F (z2 ) − F (z1 ) z1 für beliebige, ganz in D liegende Integrationskurven mit Anfangspunkt z1 und Endpunkt z2 . D.h. das Integral ist wegunabhängig. Wir wollen nun eine Bedingung dafür angeben, dass eine Funktion f (z) eine Stammfunktion F (z) besitzt: Satz: Sei f (z) stetig in einem mehrfach zusammenhängenden offenen Gebiet D -z2 und außerdem dz f (z) wegunabhängig in D, dann ist z1 z F (z) = dz f (z ) z0 holomorph in D und F (z) = f (z). Bemerkung: Die Voraussetzungen dieses Satzes sind insbesondere für jede in D holomorphe Funktion erfüllt. 6.8. CAUCHYSCHE INTEGRALFORMEL 119 Beweis: z+h z F (z + h) − F (z) = dz f (z ) − dz f (z ) z0 z0 z+h = ⇒ dz f (z ) z z+h dz [f (z ) − f (z)] F (z + h) − F (z) = z − f (z) h h ≤ max z ∈{z |z =z+th, 0≤t≤1} |f (z ) − f (z)| Wegen der Stetigkeit von f gibt es zu jedem ε > 0 ein δ(ε) > 0, sodass |f (z ) − f (z)| < ε sofern |z − z | < δ(ε). Wählt man nun |h| < δ(ε), so ist wegen |z − z| ≤ |h| F (z + h) − F (z) − f (z) < ε h und somit gezeigt, dass F (z) = f (z). 6.8 Cauchysche Integralformel Die wichtigste Folgerung aus dem Cauchyschen Integralsatz ist die Cauchysche Integralformel, die man, zusammen mit den notwendigen Voraussetzungen, in dem folgenden Satz formulieren kann: KAPITEL 6. KOMPLEXE ANALYSIS 120 Satz: Sei f (z) holomorph in einem einfach zusammenhängenden offenen Gebiet D. Dann gilt für jeden Punkt z0 ∈ D und jede einfach geschlossene Kurve γ in D, welche z0 umschließt f (z) dz = 2πif (z0 ), z − z0 γ wobei die Integration im mathematisch positiven Sinn (gegen den Uhrzeigersinn) erfolgt. Beweis: f (z) = f (z0 ) + [f (z) − f (z0 )] dz f (z) f (z) − f (z0 ) ⇒ dz = f (z0 ) + dz . z − z0 z − z0 z − z0 γ γ γ 2πi Wir müssen also zeigen, dass der zweite Term auf der rechten Seite verschwindet. Dazu ersetzen wir γ durch eine Kreislinie K mit Mittelpunkt z0 . Da f stetig ist, gibt es zu jedem ε > 0 ein δ(ε) > 0, sodass |f (z)−f (z0 )| < ε sofern |z−z0 | < δ(ε). Wir wählen nun den Radius r von K kleiner als δ(ε) f (z) − f (z0 ) < ε ⇒ z − z0 r f (z) − f (z0 ) ε ⇒ dz 2πr = 2πε. < z − z0 r K Da ε beliebig klein gewählt werden kann, verschwindet dieses Integral tatsächlich. Bemerkung: Dass man die Voraussetzung der Differenzierbarkeit von f in D keinesfalls durch die schwächere Forderung der Stetigkeit von f in D ersetzen 6.8. CAUCHYSCHE INTEGRALFORMEL 121 kann, zeigt das folgende Gegenbeispiel mit der zwar stetigen, aber nicht holomorphen Funktion f (z) = (Re z)2 : . (Re z)2 dz = z |z|=r 2π (r cos t)2 dt ireit reit 0 2π = ir dt cos2 t 2 0 2 = iπr = 0. Beispiele: Berechnung von dz γi 1. γ1 z2 + 1 z2 − 1 z2 + 1 dz = 2πi (z + 1)(z − 1) ) z2 + 1 z−1 * = −2πi z=−1 durch Anwenden der Cauchyschen Integralformel mit z0 = −1 und f (z) = (z 2 + 1)/(z − 1). 2. γ2 z2 + 1 = 2πi dz (z + 1)(z − 1) ) z2 + 1 z+1 * = 2πi z=1 durch Anwendung der Cauchyschen Integralformel mit z0 = 1 und f (z) = (z 2 + 1)/(z + 1). KAPITEL 6. KOMPLEXE ANALYSIS 122 3. dz γ3 z2 + 1 =0 z2 − 1 als direkte Konsequenz des Cauchyschen Integralsatzes. Auch die Cauchysche Integralformel lässt sich auf den Fall eines mehrfach zusammenhängenden Gebiets verallgemeinern: Satz: D sei ein mehrfach zusammenhängendes offenes Gebiet, dessen Rand ∂D aus einfach geschlossenen (stückweise) glatten Kurven besteht. D möge zusammen mit ∂D in einem Holomorphiegebiet liegen. Dann gilt für jeden Punkt z0 ∈ D, dass f (z) dz = 2πif (z0 ). z − z0 ∂D 6.9 Ableitungen einer holomorphen Funktion Man kann in der Cauchyschen Integralformel 1 f (z) f (z0 ) = dz 2πi z − z0 γ (beliebig oft) unter dem Integralzeichen nach z0 differenzieren. Diese bemerkenswerte Tatsache lässt sich auf folgende Weise präzise formulieren: Satz: Ist f (z) holomorph in einem offenen Gebiet D, dann ist f in D beliebig oft differenzierbar, wobei n! f (z) (n) dz , z0 ∈ D, n = 0, 1, 2, . . . f (z0 ) = 2πi (z − z0 )n+1 γ 6.9. ABLEITUNGEN EINER HOLOMORPHEN FUNKTION 123 Dabei ist γ eine einfach geschlossene, im Gegenuhrzeigersinn durchlaufene Kurve, die zusammen mit ihrem Inneren in D liegt. Der Beweis dieses Satzes erfolgt durch vollständige Induktion. Für n = 0 handelt es sich einfach um die Cauchysche Integralformel, von deren Gültigkeit wir uns ja schon überzeugt hatten. Wir nehmen also an, dass die obige Formel für die natürliche Zahl n richtig ist und versuchen aus dieser Annahme ihre Gültigkeit für n + 1 zu folgern: f (n) (z0 + h) − f (n) (z0 ) h→0 h ⎡ ⎤ n! ⎣ f (z) f (z) ⎦. dz − dz = lim h→0 2πih (z − z0 − h)n+1 (z − z0 )n+1 f (n+1) (z0 ) = lim γ γ Hier wurde im ersten Schritt die Definition der n+1-ten Ableitung und im zweiten die Induktionsannahme verwendet. Wir definieren nun eine Funktion g(z − z0 , h) durch * ) 1 1 n+1 1 − + g(z − z0 , h). = n+1 n+1 h (z − z0 − h) (z − z0 ) (z − z0 )n+2 Oben eingesetzt ergibt dies f (n+1) (n + 1)! (z0 ) = 2πi γ f (z) n! dz + lim n+2 (z − z0 ) 2πi h→0 Wenn wir also zeigen können, dass lim dz g(z − z0 , h) h→0 γ dz g(z − z0 , h). γ KAPITEL 6. KOMPLEXE ANALYSIS 124 verschwindet, dann haben wir den Satz bewiesen. Man rechnet leicht nach, dass ) (n + 1)2 h − g(z − z0 − h) = (z − z0 − h)n+1 (z − z0 )2 3 n+1 (−h)k−2 n+1 − [z − z0 + (n + 1)h] , k+1 k (z − z 0) k=2 wobei letztlich nur wesentlich ist, dass g(z − z0 , h) −→ 0. h→0 Da dz g(z − z0 , h) = dz g(z − z0 , h), |z−z0 |=r γ wobei man |h| ≤ r/2 wählen kann, erhält man mit Hilfe der Dreiecksungleichung und 2 1 ≤ |z − z0 − h| d die Abschätzung dz g(z − z0 h) ≤ |h|C(r) + O(|h|2) −→ 0. h→0 γ Bemerkung: Dieser Satz zeigt, wie stark die Forderung der Differenzierbarkeit einer Funktion im Komplexen ist. Ist sie ein Mal differenzierbar, so ist sie bereits beliebig oft differenzierbar. Dies gilt für Funktionen f : → natürlich nicht. Die Abbildung & 0 für x < 0 f (x) = 2 für x ≥ 0 x ist zwar für alle x ∈ nicht differenzierbar. stetig differenzierbar, doch bereits f (x) ist bei x = 0 Wir können jetzt die Umkehrung des Satzes von Cauchy zeigen: Satz von Morera: Ist f stetig in einem einfach zusammenhängenden offenen Gebiet D und ist dz f (z) = 0 γ für jede geschlossene Kurve γ in D, dann ist f holomorph in D. 6.9. ABLEITUNGEN EINER HOLOMORPHEN FUNKTION 125 Beweis: Wir hatten bereits früher gezeigt, dass unter der Voraussetzung des Satzes von Morera die Funktion z F (z) = dz f (z ) z0 in D holomorph ist mit F (z) = f (z). Aus dem vorigen Satz folgt nun darüberhinaus, dass F (z) = f (z) ebenfalls holomorph ist. Ungleichung von Cauchy: Sei f holomorph und K ein Kreis mti Radius R und Mittelpunkt z0 . Weiters sei M das Maximum von |f (z)| auf K. Dann gilt die Ungleichung (n) f (z0 ) ≤ n!M . rn Beweis: Man verwendet den Satz über die n-te Ableitung einer holomorphen Funktion: (n) f (z) f (z0 ) = n! dz ≤ n! M 2πr. n+1 2π (z − z0 ) 2π r n+1 K Aus dieser Ungleichung folgt der Satz von Louiville: Eine in ganz und beschränkte Funktion ist konstant. holomorphe Beweis: Laut Voraussetzung ist |f (z)| < K ∀ z ∈ . Aus der Ungleichung von Cauchy mit n = 1 folgt, dass K |f (z0 )| ≤ r für beliebig großes r. Somit ist |f (z0 )| = 0 und da z0 beliebig ist, ist f (z) = 0 ∀ z ∈ ⇒ f (z) ist konstant. Bemerkung: Auch das ist wieder ein Satz, der in der reellen Analysis nicht gilt. So ist z.B. die Funktion x → cos x für reelle x differenzierbar und es gilt | cos x| ≤ 1. Aber die Funktion ist offensichtlich nicht konstant. Fundamentalsatz der Algebra: Jedes Polynom der Form p(z) = z n + an−1 z n−1 + · · · + a1 z + a0 , n ≥ 1, mit komplexen Koeffizienten ak besitzt mindestens eine komplexe Nullstelle. Der Beweis wird indirekt geführt: Angenommen p(z) hätte in der ganzen komplexen Ebene keine Nullstelle. Dann wäre die Funktion f (z) = 1 p(z) KAPITEL 6. KOMPLEXE ANALYSIS 126 in ganz holomorph . Setzt man z = 1/z̃, so ist z̃ n 1 f (z) = f ( ) = g(z̃) = z̃ 1 + an−1 z̃ + · · · + a0 z̃ n eine für z̃ = 0 stetige Funktion mit g(0) = 0. Wegen der Stetigkeit gibt es für alle ε > 0 ein δ(ε) > 0, sodass |g(z̃)| < ε, sofern |z̃| < δ(ε). Das bedeutet aber, dass |f (z)| < ε für |z| > 1 . δ(ε) Da f (z) im kompakten Gebiet |z| ≤ 1/δ(ε) stetig und damit beschränkt ist, ist f (z) in ganz beschränkt und somit ist f (z) nach dem Satz von Louiville eine konstante Funktion. Daraus folgt, dass auch p(z) konstant ist, was für Polynome deren Grad mindestens gleich eins ist, sicher nicht zutrifft. Man erhält also einen Widerspruch. Bemerkung: Auch dieser Satz gilt im Reellen nicht. So besitzt z.B. das reelle Polynom x2 + 1 keine reelle Nullstelle (sehr wohl aber komplexe Nullstellen ±i). Aus dem Fundamentalsatz der Algebra folgt natürlich sofort, dass p(z) in der Form p(z) = (z − z1 )(z − z2 ) . . . (z − zn ) geschrieben werden kann, wobei die Zahlen zk ∈ die Nullstellen des Polynoms sind, wobei natürlich auch zk = zl für k = l möglich ist. Bezeichnen wir nämlich jene nach dem Fundamentalsatz der Algebra sicher existierende Nullstelle mit z1 , so haben wir p(z) = z n + an−1 z n−1 + · · · + a1 z + a0 0 = z1n + an−1 z1n−1 + · · · + a1 z1 + a0 . Subtrahiert man die beiden Zeilen und beachtet die Formel z k − z1k = (z − z1 )(z k−1 + z k−2 z1 + · · · + z1k−1 ), so erhält man p(z) = (z − z1 )q(z) mit einem Polynom q(z) vom Grad n−1. Auf dieses Polynom wendet man wieder den Fundamentalsatz der Algebra an und gelangt durch Iteration des Verfahrens schließlich zu der obigen Zerlegung von p(z) in Linearfaktoren. 6.10 Unendliche Reihen komplexer Zahlen Vergleichskriterium: Es sei ∞ n=1 cn , cn ∈ 6.10. UNENDLICHE REIHEN KOMPLEXER ZAHLEN 127 eine unendliche Reihe, über deren Konvergenz zu entscheiden sei. Hinreichend für ihre Konvergenz ist, dass es nichtnegative Zahlen dn gibt, sodass |cn | ≤ dn und die Majoranten-Reihe ∞ dn n=1 konvergiert. Die geometrische Reihe ∞ zn = n=0 konvergiert für |z| < 1, z ∈ 1 1−z . Die Reihe divergiert für |z| ≥ 1. Die geometrische Reihe als Vergleichsreihe: Die unendliche Reihe ∞ cn n=1 ist konvergent, falls ab einem gewissen Index N |cn | ≤ Mq n mit M > 0 und 0 < q < 1. Quotientenkriterium: Man betrachtet die Reihe ∞ cn . n=1 Ist für alle n ≥ N cn+1 cn ≤ q (0 < q < 1), dann ist die Reihe absolut konvergent. Ist dagegen cn+1 cn ≥ 1 ∀ n ≥ N, dann divergiert die Reihe. Beweis: |cN +1 | ≤ q|cN |, |cN +2 | ≤ q|cN +1| ≤ q 2 |cN |, ... ... |cN +ν | ≤ q ν |cN |. ⇒ ∞ n=1 |cn | = N −1 n=1 |cn | + ∞ ν=0 |c |≤ N+ν ≤q ν |cN | N −1 n=1 |cn | + |cn | . 1−q KAPITEL 6. KOMPLEXE ANALYSIS 128 Ist dagegen cn+1 cn ≥ 1 ∀ n ≥ N ⇒ |cn+1 | ≥ |cn |, d.h. die cn bilden keine Nullfolge und die Reihe ist daher divergent. Manchmal sieht man folgende Formulierung des Quotientenkriteriums: Angenom∞ men |cn+1 /cn | ist konvergent und lim |cn+1 /cn | = L. cn ist dann absolut konn→∞ n=1 vergent, falls L < 1 und divergent, falls L > 1. Im Fall L = 1 ist keine Aussage über die Konvergenz der Reihe möglich. Diese Form des Quotientenkriteriums folgt unmittelbar aus der usrprünglichen Formulierung: 1. Es sei L < 1. Man wähle ε > 0 so, dass L + ε < 1. Da |cn+1 /cn | −→ L gibt es einen Index N(ε), sodass ||cn+1 /cn | − L| < ε ∀ n ≥ N(ε). cn+1 < L + ε ∀ n ≥ N(ε). ⇒ cn n→∞ q ∞ ⇒ cn ist konvergent. n=1 2. Es sei L > 1. Dann ist |cn+1 /cn | > 1 für fast alle n. ⇒ ∞ cn ist divergent. n=1 Beispiele: 1. Für die Potenzreihe der Exponentialfunktion, ∞ zn , e = n! n=0 z z∈ , cn gilt für beliebiges z ∈ 2. Die Reihe cn+1 z |z| −→ 0 < 1 cn = n + 1 = n + 1 n→∞ . Die Reihe konvergiert daher in ganz . ∞ 1 n n=1 6.10. UNENDLICHE REIHEN KOMPLEXER ZAHLEN 129 ist divergent, aber 1 n cn+1 n+1 −→ 1. cn = 1 = n + 1 n→∞ n In diesem Fall gestattet das Quotientenkriterium keine Aussage. 3. Die Reihe ∞ 1 n2 n=1 ist konvergent, aber 1 n2 cn+1 (n+1) 2 −→ 1. cn = 1 = (n + 1)2 n→∞ n2 Wieder versagt das Quotientenkriterium. 4. Im Fall der Reihe 1 + 12 + 18 1 + 64 + 18 1 + 12 ist 1 + 16 1 + 128 1 + 64 + 12 · 1 + 512 + 12 · 1 8 1 + 512 +··· = 1 64 +... cn+1 1 1 1 1 cn = 2 , 4 , 2 , 4 , . . . Das Quotientenkriterium in der zweiten Fassung ist in diesem Fall nicht anwendbar, wohl aber in der ersten Fassung, da cn+1 1 cn ≤ 2 < 1 ∀ n. Die Reihe ist daher konvergent. Wurzelkriterium: Man betrachtet die Reihe ∞ cn . n=1 Wenn für alle n ≥ N gilt, dass n |cn | ≤ q < 1ist, dann ist die Reihe absolut konvergent. Ist dagegen für unendlich viele n n |cn | ≥ 1, dann divergiert die Reihe. KAPITEL 6. KOMPLEXE ANALYSIS 130 Beweis: 1. n |cn | ≤ q < 1 ⇒ |cn | ≤ q n ⇒ ∞ cn ist absolut konvergent durch n=1 Vergleich mit der geometrischen Reihe. 2. n |cn | ≥ 1 für unendlich viele n ⇒ |cn | ≥ 1 für unendlich viele n ⇒ cn bilden keine Nullfolge ⇒ die Reihe ist divergent. Eine andere Formulierung des Wurzelkriteriums: Ist n |cn | konvergent mit dem Limes L, dann ist die Reihe absolut konvergent, falls L < 1 ist und divergent für L > 1. Für L = 1 ist keine Aussage möglich. Beweis: Analog zum Beweis der zweiten Version des Quotientenkriteriums. Beispiele: 1. Die Reihe ∞ n2 n=1 ist konvergent, da ( n e2/n ln n 1 n2 e0 n2/n = −→ = < 1. = n n→∞ 2 2 2 2 2 ln x x→∞ x Bemerkung: lim 2n = lim 1 x x→∞ 1 = 0. 2. Für die divergente Reihe ∞ 1 n n=1 gestattet das Wurzelkriterium keine Aussage, da ( 1 1 n 1 = 1/n = 1/n ln n −→ 1. n→∞ n n e 3. Auch für die konvergente Reihe ∞ 1 n2 n=1 ist mit Hilfe des Wurzelkriteriums keine Entscheidung möglich: ( 1 1 1 n = 2/n = 2/n ln n −→ 1. 2 n→∞ n n e 6.11. POTENZREIHEN 131 Was macht man, wenn die Folge n |cn | keinen Grenzwert besitzt? Im Allgemeinen wird die Folge einfach mehrere Häufungspunkte besitzen. Den größten dieser Häufungspunkte bezeichnet man mit lim sup n |cn | ≡ lim n |cn | n→∞ n→∞ Man kann daher das Wurzelkriterium auch so formulieren: lim sup n n→∞ lim sup n→∞ 6.11 n |cn | < 1 ⇒ |cn | > 1 ⇒ ∞ n=1 ∞ cn absolut konvergent, cn divergent. n=1 Potenzreihen Wir stellen uns nun die Frage, für welche z ∈ ∞ an z n , eine Potenzreihe an ∈ n=0 konvergiert. Wir wenden das Wurzelkriterium auf cn = an z n an und erhalten die Aussage, dass die Reihe absolut konvergiert, wenn lim sup n |an ||z| < 1. n→∞ Anders ausgedrückt, die Potenzreihe ist absolut konvergent, für alle z ∈ |z| < 1 lim sup n→∞ n |an | mit =: ρ. Dieser Ausdruck für den Konvergenzradius ρ der Reihe wird auch als Formel von Cauchy-Hadamard bezeichnet. Für |z| > ρ divergiert die Potenzreihe und für |z| = ρ kann sie konvergent oder divergent sein. Ist die Folge |an+1 /an | konvergent, dann kann das Quotientenkriterium zur Berechnung des Konvgergenzradius benutzt werden. Die Potenzreihe ist konvergent, wenn an+1 z an+1 |z| < 1, lim = lim n→∞ an n→∞ an das heißt die Reihe ist für alle z ∈ |z| < mit 1 =ρ lim an+1 an n→∞ KAPITEL 6. KOMPLEXE ANALYSIS 132 konvergent. Bemerkung: Die hier angestellten Überlegungen gelten natürlich auch für Potenzreihen vom Typ ∞ an (z − z0 )n , n=0 wenn man z durch z − z0 ersetzt. Beispiele: ∞ 1. Die geometrische Reihe z n besitzt den Konvergenzradius ρ = 1. Sie ist n=0 für |z| = 1 divergent, da die Zahlen einθ keine Nullfolge bilden. 2. Für die Reihe ∞ n=1 zn n ergibt das Quotientenkriterium: an+1 = an 1 n+1 1 n = n −→ 1 n + 1 n→∞ ⇒ ρ = 1. Abgesehen von z = 1 ist diese Reihe für |z| = 1 konvergent. 3. Das Quotientenkriterium liefert für die Reihe ∞ n=1 an+1 = an 1 (n+1)2 1 n2 = n2 −→ 1 (n + 1)2 n→∞ zn : n2 ⇒ ρ = 1. Diese Reihe ist für alle z mit |z| = 1 konvergent. 4. Die Potenzreihenentwicklung der Exponentialfunktion, ∞ zn n=0 n! , ist nach dem Quotientenkriterium für alle z ∈ an+1 = an 1 (n+1)! 1 n! = 1 −→ 0 n + 1 n→∞ konvergent: ⇒ ρ = ∞. 6.12. REIHEN VON FUNKTIONEN 6.12 133 Reihen von Funktionen Die Potenzreihe ist ein Spezialfall einer Funktionenreihe, ∞ gk (z), k=0 definiert sind. wobei die Funktionen gk auf einem gemeinsamen Gebiet G ⊆ Man sagt, dass eine solche Reihe in G gleichmäßig gegen die Funktion f (z) konvergiert, falls es zu jedem ε > 0 einen von z unabhängigen Index N(ε) gibt, n gk (z) < ε, sofern n ≥ N(ε). sodass f (z) − k=0 Das Konvergenzkriterium von Weierstrass besagt, dass gleichmäßig und absolut konvergiert, wenn für alle z ∈ G n gk (z) in G k=0 |gk (z)| ≤ ck und die Reihe n ck konvergent ist. k=0 Beweis: Laut Voraussetzung gibt es zu jedem ε > 0 einen Index N(ε), sodass cn+1 + cn+2 + · · · + cn+p < ε für alle p > 0, sofern n ≥ N(ε) (Cauchysches Konvergenzkriterium für die Reihe ∞ ck ). Dann ist aber auch k=0 |gk+1 (z) + · · · + gk+p (z)| ≤ |gk+1 (z)| + · · · + |gk+p(z)| ≤ ck+1 + · · · + ckp < ε unabhängig von z ∈ G. ∞ Satz: Ist f (z) = gk (z) in einem Gebiet G ⊆ k=0 gleichmäßig konvergent und sind die einzelnen Funktionen gk (z) stetig an einem Punkt z0 ∈ G, dann ist auch die Funktion f am Punkt z0 stetig. Beweis: Wir betrachten die n-te Partialsumme n gk sn = k=0 und den dazugehörigen Reihenrest Rn = ∞ k=n+1 gk . KAPITEL 6. KOMPLEXE ANALYSIS 134 Es sei nun eine Zahl ε > 0 vorgegeben. Dann kann man wegen der gleichmäßigen Konvergenz der Reihe einen (von z unabhängigen) Index N finden, sodass |RN (z)| < ε 3 ∀ z ∈ G. Da sN die Summe von endlich vielen an der Stelle z0 stetigen Funktionen ist, ist sN bei z0 stetig. Man kann daher ein δ > 0 finden, sodass ε |sN (z) − sN (z0 )| < ∀ z ∈ G mit |z − z0 | < δ 3 ⇒ |F (z) − F (z0 )| = |sN (z) + RN (z) − sN (z0 ) − RN (z0 )| ≤ |sN (z) − sN (z0 )| + |Rn (z)| + |RN (z0 )| < ε ∀ z mit |z − z0 | < δ ⇒ F ist an der Stelle z0 stetig. Falls die Funktionen gk in allen Punkten einer in G liegenden Kurve γ der Länge ∞ l(γ) < ∞ stetig sind, dann ist somit f (z) = gk (z) auf γ stetig und kann daher k=0 längs dieser Kurve integriert werden. Es gilt ∞ dz f (z) = dz gk (z), k=0 γ γ d.h. eine gleichmäßig konvergente Reihe stetiger Funktionen kann gliedweise integriert werden. Der Beweis dieser Behauptung folgt unmittelbar aus der Abschätzung dz f (z) − dz sn (z) = dz [f (z) − sn (z)] ≤ |f (z) − sn (z)| l(γ). γ γ γ Es seien nun die Funktionen gk in einem einfach zusammenhängenden offenen ∞ Gebiet G holomorph und gk in jeder kompakten Teilmenge von G gleichmäßig k=0 konvergent. Dann folgt aus den eben bewiesenen Sätzen, dass f in G stetig ist und die Reihe längs jeder ganz in G verlaufenden Kurve gliedweise integriert werden kann. Insbesondere gilt für jede geschlossene, ganz in G verlaufende Kurve γ . ∞ . dz f (z) = dz gk (z) = 0, k=0 γ γ da wegen des Cauchyschen Integralsatzes . dz gk (z) = 0 γ 6.12. REIHEN VON FUNKTIONEN 135 für die holomorphen Funktionen gk . Nach dem Satz von Morera ist somit auch die Funktion f in G holomorph. Es sei nun γ eine ganz in G liegende, einfach geschlossene und im Gegenuhrzeigersinn durchlaufene Kurve. Dann gilt für alle Punkte z0 im Inneren von γ, dass . 1 f (z) f (z0 ) = dz 2πi z − z0 γ 1 = 2πi = 1 2πi . ∞ gk (z) dz z − z0 k=0 γ . ∞ dz k=0 γ gk (z) . z − z0 Nur der letzte Schritt bedarf einer Erläuterung: Es sei d = inf |z − z0 |, z∈γ ∞ d.h. |z − z0 | > d ∀ z ∈ γ. Da die Reihe gk (z) laut Voraussetzung auf der durch k=0 die Kurve gebildeten γ kompakten Menge gleichmäßig und absolut konvergent ist, ist wegen der für alle z ∈ γ erfüllten Ungleichung gk (z) |gk (z)| z − z0 < d auch die Reihe ∞ gk (z) z − z0 k=0 auf γ gleichmäßig konvergent. Die Vertauschung von Summe und Integral ist somit gerechtfertigt. Völlig analog zeigt man, dass unter den obigen Voraussetzungen auch n! (z0 ) = 2πi k=0 ∞ f (n) . γ (n) gk (z) dz = gk (z0 ), (z − z0 )n+1 k=0 erfüllt ist. Das heißt, die Reihe ∞ ∞ k=0 werden. n = 0, 1, 2, . . . gk (z) kann beliebig oft gliedweise differenziert KAPITEL 6. KOMPLEXE ANALYSIS 136 6.13 Sätze über Potenzreihen Die im vorigen Abschnitt über Reihen von Funktionen erhaltenen Resultate können nun auf den Spezialfall von Potenzreihen angewendet werden. Satz: Eine Potenzreihe f (z) = ∞ ak z k k=0 mit Konvergenzradius ρ konvergiert in jedem kompakten Gebiet Kr = {z |z| ≤ r, r < ρ} gleichmäßig und absolut. Sie ist für |z| < ρ beliebig oft gliedweise differenzierbar. Der Konvergenzradius der abgeleiteten Reihe ist wieder ρ. Ebenso kann die Potenzreihe für |z| < ρ gliedweise integriert werden. Bemerkung: Dass f (z) = ∞ kak z k−1 k=1 den gleichen Konvergenzradius wie f (z) besitzt, folgt aus k √ k |kak | = k k |ak |. −→ 1 k→∞ Ebenso hat die durch gliedweise Integration von f (z) erhaltene Potenzreihe ∞ ak k+1 z F (z) = k + 1 k=0 den gleichen Konvergenzradius, da ( lim sup k→∞ k+1 |ak | = lim sup k |ak |. k + 1 k→∞ Definition: f heißt analytisch in einem Gebiet D ⊆ z0 ∈ G in eine Potenzreihe ∞ ak (z − z0 )k , wenn f in jedem Punkt k=0 mit Konvergenzradius ρ > 0 entwickelbar ist. f analytisch ⇒ f holomorph 6.14. TAYLORREIHEN 137 Identitätssatz für Potenzreihen: Wenn zwei Potenzreihen ∞ ∞ ak z k und k=0 bk z k für |z| < ρ (ρ > 0) konvergieren und wenn für |z| < ρ gilt k=0 ∞ k ak z = ∞ k=0 bk z k , k=0 dann ist ak = bk für k = 0, 1, 2, . . . . Beweis: Setzt man z = 0 ein, so folgt a0 = b0 . Nach n-maligem Differenzieren und Einsetzen von z = 0 erhält man an = bn . Bemerkung: f (z) = ∞ ak z k ⇒ f (n) (0) = n! an k=0 ⇒ f (z) = ∞ f (k) (0) k! k=0 zk . Jede Potenzreihe ist Taylorsche Reihe der durch sie dargestellten Funktion. 6.14 Taylorreihen Die Funktion f sei holomorph in einer Umgebung des Ursprungs. Sei K ein Kreis mit Mittelpunkt 0, der ganz in dieser Umgebung liegt. Wir wenden die Cauchysche Integralformel an (z im Inneren von K): f (z) = 1 2πi 4 K dz f (z )/(z − z) '$ K • I z • z &% 1 1 = , z − z z (1 − zz ) z < 1 z KAPITEL 6. KOMPLEXE ANALYSIS 138 1 + q + q2 + · · · + qn = 1 − q n+1 , 1−q q = 1 q n+1 1 = 1 + q + q2 + · · · + qn + 1−q 1−q ⎡ z n+1 ⎤ n k f (z ) z f (z ) 1 ⎣ dz + dz z z ⎦ ⇒ f (z) = 2πi k=0 z z z 1 − z K K ⎡ ⎤ ⇒ ⎢ ⎥ n ⎥ 1 ⎢ f (z ) f (z ) ⎢ k ⎥ n+1 = z dz k+1 +z dz ⎢ ⎥ n+1 2πi ⎢ (z ) (z − z)(z ) ⎥ k=0 ⎣ ⎦ K K 2πif (k) (0) = n f (k) (0) k! k=0 f (z ) z n+1 z + dz 2πi (z − z)(z )n+1 K k Rn (z) Noch zu zeigen: Rn (z) −→ 0, z innerhalb von K. n→∞ z liegt auf K, z innerhalb von K ⇒ |z − z | > 0. f (z ) < M ∀ z ∈ K (für festes z) ⇒ z − z r sei der Radius von K. ⇒ |z|n+1 2πr M n+1 = 2π r |z|n+1 = Mr n+1 −→ 0 n→∞ r |Rn (z)| ≤ Allgemein: f (z) = ∞ f (k) (z0 ) k=0 k! da (z − z0 )k f holomorph ⇒ f analytisch Zusammen mit dem früheren Resultat: f holomorph ⇔ f analytisch |z| <1 r 6.15. LAURENTREIHEN 139 Bemerkung: Das ist wieder ein Resultat, das in der reellen Analysis nicht gilt, denn dort folgt aus der Differenzierbarkeit einer Funktion keineswegs auch schon deren Analytizität. Man betrachte die durch & 0 für x ≤ 0 f (x) = −1/x für x > 0 e definierte Funktion f : → . f ist am Punkt x = 0 zwar beliebig oft differenzierbar, doch die Taylorreihe ∞ f (k) (0) k x k! k=0 stellt wegen f (k) (0) = 0 für k = 0, 1, 2, . . . die Funktion f in keiner noch so kleinen Umgebung des Punktes 0 dar. Beispiele für Taylorreihen: 1. cos z = ∞ 2k z (−1)k (2k)! =1− k=0 2. sin z = ∞ z2 2! 2k+1 z (−1)k (2k+1)! =z− k=0 6.15 + z3 3! z4 4! + − +... z5 5! − +... Laurentreihen Wir betrachten eine unendliche Reihe der Form f (z) = ∞ an (z − z0 ) = n ∞ ∞ n=1 an (z − z0 ) + n=0 n=−∞ n f1 (z) 1 lim sup n n≥0 |an | = ρ1 , f2 (z) ist konvergent für lim sup n≥1 n |a−n | 1 < 1, |z − z0 | das heißt für |z − z0 | > lim sup n≥1 n f2 (z) f1 (z) ist konvergent für |z − z0 | < a−n (z − z0 )n . |a−n | = ρ2 KAPITEL 6. KOMPLEXE ANALYSIS 140 ⇒ f ist konvergent für ρ2 < |z − z0 | < ρ1 . Satz: Jede in einem Kreisring ρ2 < |z − z0 | < ρ1 holomorphe Funktion lässt sich in diesem Kreisring in eine Laurentreihe entwickeln. Für die Koeffizienten an , n ∈ gilt: f (z ) 1 dz an = 2πi (z − z0 )n+1 γ Bemerkung: Aus diesem Satz folgt insbesondere, dass die Laurentreihe gliedweise integriert werden kann: n = −1 : a−1 1 = 2πi dz f (z ) γ Beweis: Ich beschränke mich der Einfachheit halber auf den Fall z0 = 0. Nach 6.15. LAURENTREIHEN 141 der Cauchyschen Integralformel ist f (z ) 1 1 f (z ) dz − dz f (z) = 2πi z − z 2πi z −z K1 K2 f1 (z) f2 (z) Bei der Integration über K1 ist |z/z | < 1. Man entwickelt daher z 1 1 = −z z 1− z z in eine geometrische Reihe z n 8 17 z 1 z n+1 1 = 1+ +···+ + z − z z z z z − z z und schätzt den sich ergebenden Reihenrest wie im Beweis für die Taylorreihe ab. ∞ f (z ) z n 1 dz ⇒ f1 (z) = 2πi n=0 z (z )n K1 1 f (z ) = z dz n+1 . 2πi (z ) n=0 K1 ∞ n an , n≥0 Die Verschiebung K1 → γ ist möglich, da der Integrand f (z )/(z )n+1 im Gebiet zwischen K1 und γ holomorph ist. Bei der Integration über K2 ist |z /z| < 1, man setzt daher n+1 ) n * 1 z 1 z z 1 + = 1+ + ···+ z −z z z z z−z z KAPITEL 6. KOMPLEXE ANALYSIS 142 in das Integral ein. Wieder kann man sich überzeugen, dass der Reihenrest gegen Null konvergiert und man erhält 1 f2 (z) = 2πi ∞ k=0 K dz f (z ) k (z ) z k+1 2 ∞ 1 1 = dz f (z )(z )n−1 . n 2πi z n=1 K2 a−n Wieder ist die Verschiebung des Integrationsweges K2 → γ möglich. Bemerkung: Die Laurentreihe einer gegebenen holomorphen Funktion ist innerhalb ihres Konvergenzkreisringes eindeutig. Beispiele: 1. Die Laurententwicklung von z 2 e1/z um z0 = 0, 2 1/z z e 1 1 1 1 = z 1+ + + + ... + 1!z 2!z 2 3!z 3 4!z 4 z 1 1 1 = z2 + + + + ... + 1! 2! 3!z 4!z 2 2 ist für |z| > 0 konvergent. 2. Laurentreihen der Funktion f (z) = um z0 = 1: 1 1 − z2 6.15. LAURENTREIHEN 143 1 1 =− (1 − z)(1 + z) (z + 1)(z − 1) 1 1 1 1 = = = z+1 2 + (z − 1) 2 1 − z−1 2 ∞ ∞ (−1)n 1 (−1)n n (z − 1) = (z − 1)n = n n+1 2 n=0 2 2 n=0 f (z) = konvergiert für |z − 1| < 2. ⇒ f (z) = ∞ (−1)n+1 2n+1 n=0 = − (z − 1)n−1 1 1 1 1 1 + − (z − 1) + (z − 1)2 + . . . 2z −1 4 8 16 für 0 < |z − 1| < 2. Entwicklung für |z − 1| > 2: 1 1 1 = = = 2 1+z z−1+2 (z − 1)(1 + z−1 ) n ∞ ∞ (−2)n 1 2 = = − z − 1 n=0 z−1 (z − 1)n+1 n=0 2 < 1, d.h. |z − 1| > 2. konvergiert für z−1 ⇒ f (z) = − ∞ n=0 = − (−2)n (z − 1)n+2 1 2 4 + − + ... 2 3 (z − 1) (z − 1) (z − 1)4 für |z − 1| > 2. Bemerkung: Ist z0 der einzige singuläre Punkt von f (z) in einer gewissen Umgebung von z0 , dann konvergiert die Laurentreihe um z0 in einem Bereich von der Form 0 < |z − z0 | < R. Die Singularität von f (z) bei z = z0 heißt Pol, wenn die Laurententwicklung endlich viele negative Potenzen besitzt. Sie heißt wesentliche Singularität, wenn die Laurententwicklung unendlich viele negative Potenzen besitzt. Entscheidend ist dabei, dass die Laurententwicklung in der Umgebung von z0 untersucht wird! Eine Funktion, die bis auf Pole holomorph ist, heißt meromorph. KAPITEL 6. KOMPLEXE ANALYSIS 144 6.16 Residuen Die Funktion f habe eine isolierte Singularität bei z = z0 . Dann kann f in einer Umgebung von z0 (mit Ausnahme von z0 ) durch eine Laurentreihe beschrieben werden: ∞ f (z) = an (z − z0 )n n=−∞ konvergiert für 0 < |z − z0 | < R. R ist der Abstand von z0 zur nächsten Singularität von f . Wir wissen: Diese Zahl bezeichnet man als Residuum von f an der Stelle z0 . ⇒ dz f (z) = 2πi Resf (z) z=z0 γ Beispiel: ) * 1 1 z3 z5 1 z sin z + − +... = 3 + + − +... f (z) = 4 = 4 z − z z 3! 5! z 3!z 5! a−1 = Resf (z) = − ⇒ z=0 ⇒ dz γ 1 3! πi sin z 2πi =− =− 4 z 3! 3 6.16. RESIDUEN 145 Methoden zur Berechnung des Residuums: Angenommen f hat einen einfachen Pol an der Stelle z0 , d.h. a−1 + an (z − z0 )n z − z0 n=0 ∞ f (z) = (z − z0 )f (z) = a−1 + ∞ (0 < |z − z0 | < R) an (z − z0 )n+1 n=0 ⇒ Resf (z) = a−1 = lim (z − z0 )f (z) z=z0 z→z0 für einfachen Pol. Anwendung auf Funktionen der Gestalt f (z) = p(z) . q(z) p, q holomorph bei z = z0 , p(z0 ) = 0, q(z) habe eine einfache Nullstelle bei z = z0 , q(z0 ) = 0. q (z0 ) (z − z0 )2 + . . . q(z) = q (z0 )(z − z0 ) + 2! Resf (z) = z=z0 lim (z − z0 ) z→z0 p(z) q(z) (z − z0 )p(z) z→z0 (z − z0 ) [q (z0 )(z − z0 ) + q (z0 )(z − z0 )2 /2! + . . . ] p(z0 ) = q (z0 ) = lim ⇒ p(z0 ) p(z) = z=z0 q(z) q (z0 ) Resf (z) = Res z=z0 im Fall eines einfachen Pols bei z0 . Beispiel: Die Funktion f (z) = hat einfache Pole bei z = 0 und z = 1. 4 − 3z z2 − z 4 − 3z = −4 Resf (z) = z=0 2z − 1 z=0 4 − 3z =1 Resf (z) = z=1 2z − 1 z=1 KAPITEL 6. KOMPLEXE ANALYSIS 146 Pole höherer Ordnung: f habe einen Pol der Ordnung m > 1 am Punkt z0 : ∞ a−m a−1 f (z) = +···+ an (z − z0 )n + m (z − z0 ) (z − z0 ) n=0 (z − z0 ) f (z) = a−m + · · · + a−1 (z − z0 ) m =:g(z) ⇒ m−1 + ∞ an (z − z0 )n+1 n=0 g (m−1) (z0 ) z=z0 (m − 1)! * ) m−1 d 1 m = lim (z − z0 ) f (z) (m − 1)! z→z0 dz m−1 a−1 = Resf (z) = für einen Pol m-ter Ordnung. Beispiel: Die Funktion 2z (z + 4)(z − 1)2 hat einen Pol zweiter Ordnung an der Stelle z = 1. ) * d 2z 1 8 (z + 4)2 − 2z 2 (z − 1) = Resf (z) = lim = z=1 1! z→1 dz (z + 4)(z − 1)2 (z + 4)2 25 z=1 f (z) = Partialbruchzerlegung: A B C 1 = + + 2 (z + 4)(z − 1) z + 4 z − 1 (z − 1)2 1 = A(z − 1)2 + B(z + 4)(z − 1) + C(z + 4) z=1 z = −4 z=0 1 = 5C ⇒ C= 1 25 1 = A − 4B + 4C 1 5 A= ⇒ 4B = A + 4C − 1 = 4 25 1 + 20 − 25 4 1 + − = =− 25 5 25 25 25 1 25 ) * 4z 5 z 2 2z + + = f (z) = (z + 4)(z − 1)2 25 z + 4 z − 1 (z − 1)2 8 8 ⇒ Resf (z) = , Res f (z) = − z=1 z=−4 25 25 2z 8 Res f (z) = =− 2 z=−4 (z − 1) z=−4 25 ⇒ B=− 6.17. RESIDUENSATZ 6.17 147 Residuensatz Die Funktion f sei holomorph, bis auf endlich viele Singularitäten z1 , . . . , zn . Dann gilt n n dz f (z) = dz f (z) = 2πi Res f (z), k=1 γ γ k k=1 z=zk wobei γk nur zk umschließt, aber keine weitere Singularität von f . Beispiele: 1. Die Funktion 4 − 3z z2 − z hat einfache Pole bei z = 0 und z = 1 mit Residuen −4 und 1. 4 − 3z = 2πi(−4 + 1) = −6πi dz 2 ⇒ z −z γ für jede einfach geschlossene Kurve γ, die 0 und 1 umschließt. KAPITEL 6. KOMPLEXE ANALYSIS 148 Umschließt dagegen eine Kurve γ nur den den Nullpunkt, aber nicht den Punkt 1, so ist 4 − 3z = 8πi. z2 − z γ 2. Die Funktion f (z) = (z 3 1 − 1)2 hat Pole zweiter Ordnung bei z = 1, e2πi/3 , e4πi/3 . Die Kurve γ umschließt nur den Pol bei z = 1. ) * d 1 1 2 Resf (z) = lim (z − 1) 3 z=1 1! z→1 dz (z − 1)2 2 z−1 d = lim z→1 dz (z − 1)(z 2 + z + 1) = −2(z 2 + z + 1)−3 (2z + 1)z=1 2 2 = − 33 = − 3 9 1 4πi . dz 3 =− ⇒ 2 (z − 1) 9 γ 6.18. BERECHNUNG VON REELLEN INTEGRALEN 6.18 149 Berechnung von reellen Integralen Die Berechnung von vielen Typen bestimmter und uneigentlicher Integrale reeller Funktionen kann mit Hilfe des Residuensatzes in wenigen Zeilen abgetan werden. 1. Integrale vom Typ ∞ dx f (x). −∞ f sei eine rationale Funktion mit f (z) −→ k/z m , m ≥ 2, ohne reelle Pole. z→∞ +r dz f (z) + dz f (z) = 2πi Res f (z) −r |k| dz f (z) < m πr −→ 0, r→∞ r δ(r) ∞ ⇒ dx f (x) = 2πi k ∞ −∞ da m ≥ 2 −∞ Beispiel: Berechnung von z=zk k δ(r) Res f (z) z=zk dx . 1 + x4 Der Integrand hat vier einfache Pole bei z1 = eiπ/4 , z2 = e3iπ/4 , z3 = e5iπ/34 , z4 = e7iπ/4 . ) 1 Resf (z) = z=z1 (1 + z 4 ) Resf (z) = z=z2 * = z=z1 1 4e9iπ/4 = 1 4e3iπ/4 1 4e−iπ/4 = 1 = e−3iπ/4 4 e−iπ/4 4 KAPITEL 6. KOMPLEXE ANALYSIS 150 1 z4 f (z) −→ z→∞ ∞ ⇒ −∞ ⎛ ⎞ dx 2πi ⎝ −3iπ/4 −iπ/4 ⎠ = e +e 4 1+x 4 −iπ/4 e πi −iπ/4 e + e−iπ/4 = − 2 2i sin = π sin ∞ ⇒ 0 2. Integrale vom Typ π π =√ 4 2 π 4 dx π = √ 4 1+x 2 2 2π I = dθ f (cos θ, sin θ). 0 f (cos θ, sin θ) sei dabei eine rationale Funktion in cos θ und sin θ, die für 0 ≤ θ ≤ 2π endlich bleibt. Setzt man eiθ = z, so erhält man 1 eiθ + e−iθ 1 = cos θ = z+ 2 2 z iθ −iθ 1 1 e −e = z− sin θ = 2 2i z dz dz = ieiθ dθ ⇒ dθ = iz 1 dz 1 1 1 ⇒ I = f z+ , z− iz 2 z 2i z |z|=1 6.18. BERECHNUNG VON REELLEN INTEGRALEN Beispiel: Sei p ∈ 2π 0 151 , 0 < p < 1, dθ = 1 − 2p cos θ + p2 . |z|=1 1− . = |z|=1 . = |z|=1 2 p2 i [z − dz/iz z + 1z + p2 dz − p + p2 z] pz 2 dz . i (1 − pz) (z − p) Der Integrand hat Pole bei z = 1/p > 1 und z = p < 1. Nur der letzte Pol liegt innerhalb des Einheitskreises. 1 1 1 = = Res z=p i (1 − pz) (z − p) i(1 − pz) z=p i(1 − p2 ) 2π ⇒ 0 dθ 2π = 2 1 − 2p cos θ + p 1 − p2 (0 < p < 1) 3. Integrale von der Form ∞ ∞ dx f (x) cos sx, −∞ dx f (x) sin sx −∞ wobei s > 0, Man betrachtet f (x) reell, lim |z|→∞, Imz≥0 ∞ dx f (x) eisx −∞ cos sx+i sin sx f (z) = 0. KAPITEL 6. KOMPLEXE ANALYSIS 152 r isx dx f (x)e dz f (z)eisz = 2πi + −r k δ(r) Res f (z)eisz z=zk Abschätzung des Integrals über den Halbkreis δ(r): z(θ) = reiθ π iθ isr(cos θ+i sin θ) isz iθ dz f (z)e = dθ re i f re e δ(r) 0 π ≤ dθ r f reiθ e−sr sin θ 0 π ≤ M(r)r dθ e−sr sin θ 0 wobei M(r) = max f (reiθ ). 0≤θ≤π Abschätzung von π r dθ e−sr sin θ π/2 = 2r dθ e−sr sin θ 0 0≤θ≤ π 2 sr>0 ⇒ ⇒ 2 π ≤ 0 sin θ θ ≤1 sin θ ≥ π2 θ π/2 π/2 −sr sin θ 2r dθ e ≤ 2r dθ e−2srθ/π 0 ⇒ ⇒ 0 ∞ ∞ 2r −srθ π −2srθ/π ≤ 2r dθ e = −2sr e = s π 0 0 π isz dz f (z)e ≤ M(r) −→ 0 s r→∞ δ(r) ∞ ⇒ dx f (x)eisx = 2πi k −∞ f (z) −→ |z|→∞,Imz≥0 0, Res f (z)eisz z=zk s>0 6.18. BERECHNUNG VON REELLEN INTEGRALEN 153 Beispiel: ∞ −∞ eisx dx 2 = k + x2 ∞ −∞ cos sx dx 2 +i k + x2 ∞ dx −∞ sin sx , k 2 + x2 s > 0. eisz eisz = k2 + z2 (z − ik)(z + ik) hat in der oberen Halbebene einen einfachen Pol bei z = ik und das asymptotische Verhalten 1 −→ 0. 2 k + z 2 |z|→∞ e−sk eisz eisik = = z=ik k 2 + z 2 2ik 2ik Res ∞ ⇒ dx π eisx e−sk = e−sk = 2πi 2 2 k +x 2ik k dx cos sx π −sk = e 2 2 k +x k dx sin sx = 0 k 2 + x2 −∞ ∞ ⇒ −∞ ∞ −∞ 4. Cauchyscher Hauptwert Die reelle Funktion f habe - b einen Pol bei x = x0 . Unter dem Cauchyschen Hauptwert des Integrals a dx f (x) versteht man dann ⎤ ⎡ x −ε b 0 b H dx f (x) = lim ⎣ dx f (x) + dx f (x)⎦ ε↓0 a a x0 +ε KAPITEL 6. KOMPLEXE ANALYSIS 154 (falls dieser Grenzwert existiert). Bemerkung: x0 −ε b dx f (x) + lim lim ε→0 η→0 x0 +η a dx f (x) muss nicht existieren! Beispiel: Zu berechnen ist der Cauchysche Hauptwert von ∞ −∞ dx . (x + 1)(x2 + 2) √ Der Integrand hat Pole bei z = −1 und z = ±i 2. Man wählt den folgenden Integrationsweg: −1+ε −r r dx dx + + 2 (x + 1)(x + 2) (x + 1)(x2 + 2) −1+ε dz dz 1 + + = 2πi Res √ 2 2 2 (z + 1)(z + 2) (z + 1)(z + 2) z=i 2 (z + 1)(z + 2) γ3 γ1 −→0 r→∞ 1 √ = 2πi √ (i 2 + 1)2i 2 √ 2 − 2i π =π = √ 6 2 + 2i lim ε→0 dz dz = −iπ Res 2 z=−1 (z + 1)(z + 2) (z + 1)(z 2 + 2) γ3 = −iπ 1 3 6.18. BERECHNUNG VON REELLEN INTEGRALEN ∞ ⇒ H −∞ 155 √ √ dx 2 − 2i iπ 2π =π + = 2 (x + 1)(x + 2) 6 3 6 Im allgemeinen Fall gilt ∞ H dx f (x) = 2πi −∞ zk Res f (z) + πi z=zk xk Res f (z) z=xk wobei die zk Pole im Inneren der oberen Halbebene und xk Pole auf der reellen Achse sind. Ein weiteres Beispiel: ∞ sin x x 0 Wir betrachten dazu das komplexe Kurvenintegral iz e γ z mit dem Integrationsweg ∞ ⇒ ∞ ∞ cos x i sin x eiz eix =H = πi Res = πi H +H dx z=0 z x x x −∞ −∞ −∞ 0 KAPITEL 6. KOMPLEXE ANALYSIS 156 ∞ ⇒ −∞ sin x dx =π x Int. symm. ⇒ ∞ sin x π dx = x 2 0 5. Integrale vom Typ ∞ f (x) dx α x 0 0 < α < 1, f rationale Funktion ohne Pol auf der reellen Halbachse x ≥ 0, f (x) ∼ 1/xm , m ≥ 1 für x → ∞. γ f (z) f (z) dz α = 2πi Res α z=zk z z k=1 n = f (z) dz α + z KR Kε f (z) dz α = z f (x) dx α − x ε KR +Kε z α = eα ln z R R dx f (x) xα e2πiα ε z=reiθ = eα[ln r+iθ] = r α eiθα 2π f (reiθ ) dθ ireiθ α iθ −→ 0 r e r→∞ 0 f (z) dz α = − z 2π f (εeiθ ) dθ iεeiθ α iθ −→ 0 ε→0 ε e 0 wegen ε = ε1−α α ε 6.18. BERECHNUNG VON REELLEN INTEGRALEN n f (z) Res = 2πi z=zk z α k=1 ⇒ 157 ∞ f (x) 1 − 2πiα dx α e x 1 0 ∞ n f (x) 2πi f (z) dx α = Res x 1 − e−2πiα k=1 z=zk z α 0 Beispiel: ∞ I= dx , + 1) xα (x 0<α<1 0 Res 1 1 = iπα + 1) e π 1 2πi 2πi = ⇒ I = = −2πiα iπα 1−e e 2i sin πα sin πα z=−1 z α (z 6. Beispiel eines anderen Typs: ∞ I= dx , 1 + xα α∈ , α > 1. 0 Man arbeitet am besten auf Rln . Rln wird parametrisiert durch (r, θ), r > 0, θ ∈ . z α = r α eiαθ r α eiαθ = −1 = eiπ ei2kπ ⇒ r = 1, θk = π + 2kπ (k ∈ ) α ⇒ θ0 = π , 2 θ1 = 3π ,... 2 KAPITEL 6. KOMPLEXE ANALYSIS 158 dz 2πi = α 1+z αz0α−1 γ dz + 1 + zα = KR +Kε Kε 1 − e2πi/α dx − e2πi/α α 1+x ε dz −→ 0, 1 + z α ε→0 R R dx 1 + xα ε dz −→ 0 1 + z α R→∞ wegen α > 1 KR ∞ dx 2πi = α iπ(α−1)/α 1+x αe 0 ∞ 0 2πi dx 2πi = = α iπ/2 −iπ/2 1+x α (e −e ) α2i sin απ ∞ dx π/α = α 1+x sin πα 0 7. Allgemein können Integrale vom Typ ∞ dxf (x) 0 mit einer rationalen Funktion f , deren n Polstellen nicht zu + gehören und mit f (z) ∼ 1/z m , z → ∞, m ≥ 2 folgendermaßen berechnet werden: Man betrachtet das Integral dz f (z) ln z γ mit dem Integrationsweg γ, der alle Pole von f umschließt. dz f (z) ln z = 2πi n k=1 γ Res [f (z) ln z] z=zk R dx f (x) ln x − dz f (z) ln z + = KR +Kε 0 R − dx f (x)(ln x + 2πi) 0 6.18. BERECHNUNG VON REELLEN INTEGRALEN Die Integrale über Kε und KR verschwinden für ε → 0 bzw. R → 0. ∞ n Res [f (z) ln z] ⇒ dx f (x) = − k=1 0 Beispiel: ∞ z=zk dx 1 + x3 0 Der Integrand hat einfache Pole bei zk = eiπ/3 , eiπ , e5iπ/3 . ∞ ⇒ 0 8. Integrale vom Typ ln zk dx = − 1 + x3 3zk3 k * ) 1 iπ/3 iπ 5iπ/3 = − + + 3 e2iπ/3 e2iπ e10iπ/3 * ) 5 2iπ/3 iπ 1 −2iπ/3 +1+ e = − e 3 3 3 √ 2π 3 = 9 ∞ dx f (x) ln x 0 159 KAPITEL 6. KOMPLEXE ANALYSIS 160 mit einer rationalen Funktion f , die auf der reellen Halbachse Pole besitzt und für x → ∞ das asymptotische Verhalten f (x) ∼ x→∞ 1 , xm + keine m≥2 aufweist. Betrachte dz f (z)(ln z)2 , γ wie vorhin. γ ∞ ∞ 2 dx f (x)(ln x) − dx f (x)(ln x + 2πi)2 = 2πi Res f (z)(ln z)2 0 k 0 z=zk ∞ ∞ −4πi dx f (x) ln x + 4π 2 dx f (x) = 2πi Res f ln z 0 k 0 z=zk ∞ 1 dx f (x) ln x = − Res f (z)(ln z)2 − z=z 2 k k 0 ∞ −iπ dx f (x) 0 f reell ⇒ ∞ 1 dx f (x) ln x = − Re Res f (z)(ln z)2 z=zk 2 k 0 Beispiel: ∞ I= dx ln x (1 + x3 ) 0 1 d2 (ln z)2 (ln z)2 3 = (1 + z) Res z=−1 (1 + z)3 2! dz 2 (1 + z)3 z=−1 1 z z − ln z 1 1 d 2 ln z = = 2 dz z z=−1 z2 z=−1 1 = 2 (1 − ln z) = 1 − ln eiπ = 1 − iπ z z=−1 1 1 I = − Re(1 − iπ) = − 2 2