Mathematische Methoden der Physik I

Werbung
Mathematische Methoden der Physik I
Helmut Neufeld
Fakultät für Physik
Universität Wien
Sommersemester 2008
ii
Inhaltsverzeichnis
1 Euklidische Vektorräume
1
1.1
Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Transponierte Abbildung . . . . . . . . . . . . . . . . . . . . . . .
3
1.3
Norm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.4
Orthonormalbasis . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.5
Orthogonale Transformationen . . . . . . . . . . . . . . . . . . . .
9
1.6
SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
1.7
Eulersche Winkel . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2 Unitäre Vektorräume
19
2.1
Komplexes Skalarprodukt . . . . . . . . . . . . . . . . . . . . . .
19
2.2
Adjungierte Abbildung . . . . . . . . . . . . . . . . . . . . . . . .
22
2.3
Orthonormalbasis . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
2.4
Projektionsoperatoren . . . . . . . . . . . . . . . . . . . . . . . .
25
2.5
Hermitesche Operatoren . . . . . . . . . . . . . . . . . . . . . . .
27
2.6
Unitäre Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . .
28
2.7
Normale Operatoren . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.8
Spektralsatz für normale Operatoren . . . . . . . . . . . . . . . .
30
2.9
Gleichzeitige Diagonalisierbarkeit . . . . . . . . . . . . . . . . . .
35
2.10 Funktionen normaler Operatoren . . . . . . . . . . . . . . . . . .
36
2.11 Anwendung des Spektralsatzes auf relle Matrizen . . . . . . . . .
38
iii
INHALTSVERZEICHNIS
iv
3 Einfache Quantensysteme
43
3.1
Grundpostulate der Quantentheorie . . . . . . . . . . . . . . . . .
43
3.2
Spin 1/2 System
49
. . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Tensorprodukte von Vektorräumen
55
4.1
Tensorprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
4.2
Tensoren in reellen Vektorräumen . . . . . . . . . . . . . . . . . .
57
4.3
Metrischer Tensor . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
4.4
Levi-Cività-Tensor . . . . . . . . . . . . . . . . . . . . . . . . . .
61
4.5
Tensoren im dreidimensionalen Raum . . . . . . . . . . . . . . . .
62
4.6
Tensorprodukt von Zustandsräumen . . . . . . . . . . . . . . . . .
63
5 Gewöhnliche Differentialgleichungen
67
5.1
Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
5.2
Richtungsfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
5.3
Trennung der Variablen . . . . . . . . . . . . . . . . . . . . . . . .
70
5.4
Exakte Differentialgleichungen . . . . . . . . . . . . . . . . . . . .
74
5.5
Lineare Differentialgleichungen erster Ordnung . . . . . . . . . . .
76
5.6
Bernoullische Differentialgleichung . . . . . . . . . . . . . . . . . .
80
5.7
Iterationsverfahren von Picard . . . . . . . . . . . . . . . . . . . .
80
5.8
Existenz- und Eindeutigkeitssatz
. . . . . . . . . . . . . . . . . .
81
5.9
Lineare Differentialgleichungssysteme 1. Ordnung . . . . . . . . .
82
5.10 Zeitentwicklung in der Quantenmechanik . . . . . . . . . . . . . .
85
5.11 Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
5.12 Lineare DGLn 2. Ordnung mit konst. Koeff. . . . . . . . . . . . .
87
5.13 Lineare Differentialgleichungen mit konstanten Koeffizienten . . .
90
5.14 Lineare Differentialgleichungssysteme 2.Ordnung . . . . . . . . . .
90
INHALTSVERZEICHNIS
v
6 Komplexe Analysis
93
6.1
Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
6.2
Komplexe Funktionen
. . . . . . . . . . . . . . . . . . . . . . . .
94
6.3
Riemannsche Flächen . . . . . . . . . . . . . . . . . . . . . . . . .
96
6.4
Differentiation im Komplexen . . . . . . . . . . . . . . . . . . . .
98
6.5
Integration im Komplexen . . . . . . . . . . . . . . . . . . . . . . 100
6.6
Integralsatz von Cauchy . . . . . . . . . . . . . . . . . . . . . . . 108
6.7
Unbestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . . 118
6.8
Cauchysche Integralformel . . . . . . . . . . . . . . . . . . . . . . 119
6.9
Ableitungen einer holomorphen Funktion . . . . . . . . . . . . . . 122
6.10 Unendliche Reihen komplexer Zahlen . . . . . . . . . . . . . . . . 126
6.11 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.12 Reihen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 133
6.13 Sätze über Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . 136
6.14 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.15 Laurentreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.16 Residuen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
6.17 Residuensatz
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
6.18 Berechnung von reellen Integralen . . . . . . . . . . . . . . . . . . 149
Danksagungen
Harald Höller hat die mühevolle Arbeit der Umwandlung meiner handschriftlichen Notizen in ein LATEX-file übernommen. Ihm möchte ich besonders danken.
Eine große Hilfe waren auch Paul Posch und Mathias Tomandl, die die Abbildungen des 6. Kapitels angefertigt haben. Walter Grimus hat mich mit vielen
nützlichen Anregungen unterstützt. Auch das Manuskript einer seiner früheren M1-Vorlesungen war für mich eine Quelle wertvoller Inspiration. Schließlich
möchte ich jenen Hörern meiner Vorlesung danken, die mich auf Druckfehler in
den früheren Versionen des Skriptums aufmerksam gemacht haben.
Literatur
C. B. Lang, N. Pucker, Mathematische Methoden in der Physik, Spektrum
E. Kreyszig, Advanced Engineering Mathematics, John Wiley & Sons
J. Cigler, Einführung in die Lineare Algebra und Geometrie, 2. Teil, Manz
A. Duschek, Vorlesungen über höhere Mathematik, III. Band, Springer
vi
INHALTSVERZEICHNIS
Kapitel 1
Euklidische Vektorräume
In einem Vektorraum sind als Verknüpfungsvorschriften die Vektoraddition und
die Multiplikation von Vektoren mit Skalaren (den Elementen des Grundkörpers)
erklärt. Fügt man als weitere Struktur ein Skalarprodukt hinzu, so gelangt man im
Fall eines reellen Vektorraums zur Definition des euklidischen und für komplexe
Vektorräume zur Definition des unitären Vektorraums.
1.1
Skalarprodukt
Wie bereits aus dem Schulunterricht bekannt ist, kann man in der Ebene oder im
dreidimensionalen Raum die Länge eines Vektors und den zwischen zwei Vektoren
eingeschlossenen Winkel mit Hilfe des Skalarproduktes ausdrücken. Wir wollen
hier Skalarprodukte axiomatisch, das heißt durch die Angabe ihrer charakteristischen Eigenschaften, einführen. Dadurch gewinnen wir einerseits mehr Einblick
in die zugrundeliegenden mathematischen Strukturen und lösen uns andererseits
von der Einengung auf elementargeometrische Anwendungen.
Definition: Ein (endlichdimensionaler) Vektorraum E über dem Grundkörper
heißt euklidisch, falls für je zwei Elemente x, y ∈ E ein Skalarprodukt (oder
inneres Produkt) (x|y) ∈ definiert ist, mit folgenden Eigenschaften:
1. (a1 x1 + a2 x2 |y) = a1 (x1 |y) + a2 (x2 |y),
x1,2 ∈ E,
a1,2 ∈
2. (x|y) = (y|x)
3. (x|x) ≥ 0,
(x|x) = 0 ⇔ x = 0
Bemerkung: Die Eigenschaften 1 (Linearität im ersten Argument) und 2 (Symmetrie) implizieren Linearität auch im zweiten Argument, das heißt das Skalarprodukt ist bilinear.
1
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
2
Beispiele:
1. Das Paradebeispiel schlechthin ist natürlich der Raum
produkt
3
xi yi .
(x|y) =
3
mit dem Skalar-
i=1
3
Fasst man die Elemente des
auf,
als Spaltenvektoren (oder 3 × 1-Matrizen)
⎛ ⎞
x1
⎝
x = x2 ⎠ ,
x3
so kann man mit Hilfe des dazugehörigen Zeilenvektors (bzw. der zu x
transponierten 1 × 3-Matrix)
xT = (x1 , x2 , x3 )
das Skalarprodukt auch in Matrixnotation schreiben:
(x|y) = xT y.
2. Im
n
sei ein Skalarprodukt
T
(x|y) = x y =
n
xi yi
i=1
definiert. Diesen Raum nennen wir E n .
3. Im
n
sei ein inneres Produkt durch
(x|y) =
n
pi xi yi
i=1
definiert, wobei pi > 0 (i = 1, . . . n) ist.
4. In dem Funktionenraum der auf einem endlichen Intervall [a, b] ⊂
nierten reellen Polynome vom Grad ≤ n,
p(x) =
n
ck ∈
ck xk ,
,
x ∈ [a, b],
k=0
kann man durch
b
dx p(x)q(x)
(p|q) =
a
ein inneres Produkt definieren.
defi-
1.2. TRANSPONIERTE ABBILDUNG
1.2
3
Transponierte Abbildung
Im Raum E n (Beispiel 2) ist das Skalarprodukt durch (x|y) = xT y definiert, wobei
xT die transponierte Matrix von x“ bedeutet. Diese sehr praktische Schreibweise
”
kann für beliebige euklidische Räume verallgemeinert werden. Dazu geht man
von der Beobachtung aus, dass im Falle des E n die Abbildung x → xT eine
Identifizierung“ von E n (dem Raum der n-dimensionalen Spaltenvektoren) mit
”
n (dem Raum der n-dimensionalen Zeilenvektoren) darstellt.
seinem Dualraum E
Die Vorgabe eines Skalarproduktes erlaubt es nun, jeden euklidischen Vektorraum
E mit seinem Dualraum E auf kanonische Weise zu identifizieren. Dazu ordnet
man jedem x ∈ E das lineare Funktional xT ∈ E zu, welches durch
xT (y) = xT y = (x|y) ∀ y ∈ E
definiert ist. Man überzeugt sich leicht davon, dass die Abbildung x → xT linear
und injektiv ist. Da dim E = dim E ist, stimmt das Bild von E unter der Abbildung
T
mit ganz E überein. Bezeichnet man die inverse Abbildung ebenfalls mit T , so
ist xT T = x ∀ x ∈ E erfüllt.
Für eine lineare Abbildung A : E n → E n gilt
(x|Ay) = (AT x|y),
da
(AT x|y) = (AT x)T y = xT AT T y = xT Ay = (x|Ay).
Diese Konstruktion lässt sich ebenfalls auf den allgemeinen Fall übertragen: V
und W seien euklidische Vektorräume mit dem Skalarprodukt (.|.)V , bzw. (.|.)W
und A : V → W eine lineare Abbildung. Dann ist die zu A transponierte
Abbildung AT : W → V durch
(AT w|v)V = (w|Av)W
∀ v ∈ V, ∀ w ∈ W
definiert. Wieder überzeugt man sich leicht davon, dass AT wohldefiniert und
linear ist.
Eigenschaften der transponierten Abbildung:
1. (a1 A1 + a2 A2 )T = a1 AT1 + a2 AT2 ,
2. AT T = A,
a1,2 ∈
,
A1,2 ∈ L(V, W).
A ∈ L(V, W).
3. (BA)T = AT B T ,
A ∈ L(V, W), B ∈ L(W, X ).
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
4
1.3
Norm
Im E n kann die Länge eines Vektors durch
x
= x21 + · · · + x2n = (x|x)
bestimmt werden. Im allgemeinen Fall eines beliebigen euklidischen Vektorraums
E definiert man die Norm x
eines Elementes x ∈ E durch
x
= (x|x).
Für das Skalarprodukt gilt die Ungleichung von Cauchy-Schwarz:
|(x|y)| ≤ x
y
.
Beweis: Für x = 0 oder y = 0 ist die Ungleichung trivialerweise erfüllt. Man
kann sich daher auf den Fall x = 0 ∧ y = 0 beschränken. Es sei = ±1 so
gewählt, dass
|(x|y)| = (x|y).
x
(x|y)
y x
y
(x|x) (y|y)
+
−2
0 ≤
−
−
=
2
2
x
y
x
y
x
y
x
y
|(x|y)|
= 2 1−
⇒ |(x|y)| ≤ x
y
.
x
y
⇒
Anschauliche Bedeutung der Ungleichung von Cauchy-Schwarz in der Ebene oder
im dreidimensionalen Raum:
y :
x
θ
|x · y | = |x||y| | cos θ| ≤ |x||y|
Eigenschaften der Norm:
1. x
≥ 0,
x
= 0 ⇔ x = 0
2. ax
= |a|
x
∀ a ∈
3. x + y
≤ x
+ y
≤1
1.3. NORM
5
Beweis: Die ersten beiden Eigenschaften folgen unmittelbar aus der Definition
der Norm. Die dritte Eigenschaft (Dreiecksungleichung) ergibt sich aus der
Ungleichung von Cauchy-Schwarz:
x + y
2 = (x + y|x + y) = (x|x) + (y|y) + 2(x|y)
≤ x
2 + y
2 + 2
x
y
= (
x
+ y
)2.
Definition: Ein Vektor x heißt normiert oder Einheitsvektor, wenn x
= 1
ist. Zwei Vektoren x, y heißen orthogonal, wenn (x|y) = 0 ist.
Beispiele:
1. Im E 2 bildet die Menge aller Einheitsvektoren
x
2 = (x|x) = x21 + x22 = 1
einen Kreis mit Radius 1 (Einheitskreis).
2 6
'$
x
= 1
-
1
&%
2. Im Fall des
2
mit dem inneren Produkt
x1 y1 x2 y2
(x|y) = 2 + 2
a
b
liegen die Einheitsvektoren auf der Ellipse
x
2 = (x|x) =
x21 x22
+ 2 =1
a2
b
(Ellipse als Einheitskugel“). Die Richtungsvektoren zweier Durchmesser
”
2 6
x
= 1
b
a
-
1
sind genau dann orthogonal“, wenn es sich um konjugierte Durchmesser
”
handelt.
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
6
3. Wir betrachten in dem Vektorraum der Polynome vom Grad ≤ n auf [0, 1]
mit dem inneren Produkt
1
dx p(x)q(x)
(p|q) =
0
√
√
die Elemente p0 (x) = 1, p1 (x) = x und p2 (x) = x2 . p0 , 3p1 und 5p2
sind Einheitsvektoren, p0 und p1 sind nicht orthogonal, jedoch sind p0 und
p0 − 2p1 orthogonal.
1.4
Orthonormalbasis
Definition: Unter einem Orthonormalsystem (ONS) in einem euklidischen
Vektorraum E versteht man eine Menge von Einheitsvektoren, die paarweise aufeinander orthogonal stehen:
f1 , . . . , fk ∈ E,
(fi |fj ) = δij .
Bildet {f1 , . . . , fk } ein ONS, dann sind diese Vektoren linear unabhängig, denn
k
ai fi = 0
i=1
⇒
0 = (fj |
k
ai fi ) =
i=1
k
i=1
ai (fj |fi ) = aj
∀ j, 1 ≤ j ≤ k.
δij
Definition: Ein Orthonormalsystem heißt vollständig (VONS) oder Orthonormalbasis (ONB) von E, wenn es eine Basis von E bildet.
Beispiele:
1. Im E n ist die Standardbasis
⎛ ⎞
⎛ ⎞
1
0
⎜ 0 ⎟
⎜ 1 ⎟
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ ⎟
e1 = ⎜ 0 ⎟ , e2 = ⎜ 0 ⎟ , . . . ,
⎜ .. ⎟
⎜ .. ⎟
⎝ . ⎠
⎝ . ⎠
0
0
eine ONB, weil (ei |ej ) = δij ist.
⎛
0
0
..
.
⎜
⎜
⎜
en = ⎜
⎜
⎝ 0
1
⎞
⎟
⎟
⎟
⎟
⎟
⎠
1.4. ORTHONORMALBASIS
7
2. Im E 2 bilden die Vektoren
cos ϕ
,
f1 =
sin ϕ
f2 =
− sin ϕ
cos ϕ
eine ONB.
{f1 , . . . , fn } sei eine ONB eines n-dimensionalen euklidischen Vektorraumes E.
Dann lässt sich jedes x ∈ E in der Form
x=
n
fi ai
i=1
schreiben, wobei die Entwicklungskoeffizienten ai ∈
eindeutig durch
ai = (fi |x) = fiT x
bestimmt sind. Man hat also die Beziehung
x=
n
fi fiT x ∀ x ∈ E
i=1
und erhält somit die Vollständigkeitsrelation
n
fi fiT = 1.
i=1
Es ist instruktiv, die Vollständigkeitsrelation für die beiden oben angegebenen
Beispiele zu verifizieren.
Eine ONB {f1 , . . . , fn } eines n-dimensionalen euklidischen Vektorraumes kann
also auch durch die beiden Eigenschaften
(fi |fj ) = δij ,
n
fi fiT = 1
i=1
charakterisiert werden.
Das Gram-Schmidtsche Orthonormalisierungsverfahren ist eine Methode,
ausgehend von einer beliebigen Basis {g1 , . . . , gn } eines euklidischen Vektorraumes, eine ONB (ein VONS) {f1 , . . . , fn } zu konstruieren.
f1 =
g1
g1 g2 = f1 (f1 |g2 ) + g2 − f1 (f1 |g2 )
f1
⊥f1
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
8
⇒
f2 =
g2
>6g2 − f1 (f1 |g2 )
6f2
-
g2 − f1 (f1 |g2 )
g2 − f1 (f1 |g2 )
f1 (f1 |g2)
f1
g3 =
f (f |g ) + f (f |g )
1 1 3 2 2 3
+ g3 − f1 (f1 |g3 ) − f2 (f2 |g3)
⊥f1 ,f2
liegt in dem von f1 , f2
aufgespannten linearen Teilraum
⇒
f3 =
g3 − f1 (f1 |g3 ) − f2 (f2 |g3)
g3 − f1 (f1 |g3 ) − f2 (f2 |g3)
usw. → VONS {f1 , . . . , fn }.
Bemerkung: Aus diesem Resultat folgt auch unmittelbar, dass ein VONS stets
existiert.
Ein beliebiger n-dimensionaler euklidischer Vektorraum E unterscheidet sich
in gewisser Weise nicht von einem E n . Wählt man nämlich in E eine ONB
{f1 , . . . , fn }, so lässt sich jedes x ∈ V eindeutig in der Form
x=
n
fi xi ,
xi = (fi |x)
i=1
schreiben. Der Vektor x ist also (bei vorgegebener ONB) eindeutig durch die n
Zahlen
⎛
⎞
x1
⎜ .. ⎟
n
⎝ . ⎠∈E
xn
bestimmt. Weiters gilt (x + y)i = xi + yi , (axi ) = axi und
(x|y) =
n
i=1
d.h. die Zuordnung
n
n
n
fi xi
fj yj =
xi yj (fi |fj ) =
xi yi ,
j=1
i,j=1
⎞
x1
⎟
⎜
x ∈ E ↔ ⎝ ... ⎠ ∈ E n
xn
⎛
δij
i=1
1.5. ORTHOGONALE TRANSFORMATIONEN
9
respektiert sowohl die Vektoraddition, die Multiplikation mit Skalaren als auch die
Bildung des Skalarprodukts. Man sagt auch, dass jeder n-dimensionale euklidische
Vektorraum isomorph zu E n ist.
Bemerkung: Eine lineare Abbildung T : V → W heißt Isomorphismus der
euklidischen Vektorräume V, W, falls T ein Vektorraumisomorphismus (d.h. eine
bijektive lineare Abbildung) ist mit der zusätzlichen Eigenschaft
(T x|T y)W = (x|y)V
∀ x, y ∈ V.
Die Matrixdarstellung (Aij ) einer linearen Abbildung A ∈ L(E) (d.h. A : E →
E) in einem euklidischen Vektorraum E hat bezüglich einer ONB {f1 , . . . , fn }
eine besonders einfache Form. Bildet man nämlich das Skalaprodukt von fi mit
dem Ausdruck
n
Afj =
fk Akj ,
k=1
so erhält man
(fi |Afj ) = (fi |
n
k=1
fk Akj ) =
n
k=1
Akj (fi |fk ) = Aij .
δik
Das heißt man bildet einfach ein Sandwich“ des Operators A zwischen den Vek”
toren fi und fj um das Matrixelement Aij zu erhalten:
Aij = (fi |Afj ) = fiT Afj .
Die Matrixdarstellung (AT )ij der durch (AT x|y) = (x|Ay) ∀ x, y ∈ E definierten,
zu A transponieren Abbildung AT : E → E ist dann bezüglich einer ONB durch
(AT )ij = (fi |AT fj ) = (Afi |fj ) = (fj |Afi ) = Aji
gegeben, d.h. Zeilen und Spalten werden einfach vertauscht.
1.5
Orthogonale Transformationen
Wir wollen nun mit den sogenannten orthogonalen Abbildungen noch kurz
eine wichtige Klasse von Operatoren ∈ L(E) besprechen. Dazu gehen wir von der
folgenden Beobachtung aus:
Satz: Sei O ∈ L(E) (E ein euklidischer Vektorraum). Dann sind die folgenden
Aussagen äquivalent:
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
10
1. O ist invertierbar mit O −1 = O T (d.h. O T O = OO T = 1).
2. (Ox|Oy) = (x|y) ∀ x, y ∈ E.
3. O ist isometrisch, d.h. Ox
= x
∀ x ∈ E.
4. O bildet jede ONB von E wieder auf eine ONB von E ab.
Ist eine dieser Bedingungen erfüllt, nennt man die Abbildung O orthogonal. In
der früher eingeführten Sprechweise ist O dann ein Isomorphismus des euklidischen Vektorraumes E mit sich, ein sogenannter Automorphismus.
Bei dem Beweis des obigen Satzes bereitet nur die Implikation 3 ⇒ 2 etwas Mühe.
Man benötigt dazu den folgenden Hilfssatz (Polarisierungsidentität):
(x|y) =
x + y
2 − x − y
2
.
4
Beweis des Hilfssatzes: Man subtrahiere die Ausdrücke
(x + y|x + y) = x
2 + y
2 + 2(x|y),
(x − y|x − y) = x
2 + y
2 − 2(x|y).
Nimmt man nun an, dass Ox
= x
∀ x ∈ E erfüllt ist, so folgt unter Verwendung des Hilfssatzes tatsächlich, dass
O(x + y)
2 − O(x − y)
2
Ox + Oy
2 − Ox − Oy
2
=
4
4
2
2
(x + y)
− (x − y)
= (x|y) ∀ x, y ∈ E
=
4
(Ox|Oy) =
erfüllt ist.
Bemerkungen:
1. Aus O T O = 1 folgt für eine orthogonale Transformation det(O T O) =
det O T det O = (det O)2 = 1 und somit det O = ±1.
2. Die orthogonalen Transformationen auf einem n-dimensionalen euklidischen
Vektorraum bilden eine Gruppe, man nennt sie O(n). Jene orthogonalen
Transformationen R, welche die Zusatzbedingung det R = 1 erfüllen, bilden
ebenfalls eine Gruppe, diese wird als SO(n) bezeichnet.
1.5. ORTHOGONALE TRANSFORMATIONEN
11
fn } sei eine beliebige ONB eines euklidischen Vektorraumes E.
3. {f1 , . . . ,
n
T
Wegen
i=1 fi fi = 1 lässt sich dann jede orthogonale Transformation
O ∈ L(E) in der Form
O = O1 = O
n
fi fiT
=
i=1
n
OfifiT =
gi fiT
i=1
schreiben, wobei die Vektoren gi = Ofi (i = 1, . . . , n) wegen der Eigenschaft 4 wieder eine ONB von E bilden. Für den Spezialfall E = E n kann
man daher jede orthogonale n × n-Matrix O in der Form
O=
n
gi eTi = (g1 , . . . , gn )
i=1
schreiben, das heißt in den Spalten von O steht die ONB {g1 , . . . , gn } =
{Oe1 , . . . , Oen }. Ebenso bilden die Zeilen einer orthogonalen Matrix ein
VONS, da
O = 1O =
⎛
n
⎞
i=1
hT1
⎟
⎜
= ⎝ ... ⎠ ,
hTn
ei eTi O
=
n
T
T
ei (O ei ) =
i=1
n
ei hTi
i=1
hi = O T ei .
Die orthogonalen n × n-Matrizen sind also genau jene Elemente aus L(E n ),
deren Spalten bzw. Zeilen ein VONS von E n bilden.
Beispiele:
1. Im E 2 lässt sich jeder Einheitsvektor f1 in der Form
cos α
f1 =
sin α
schreiben, für einen auf f1 orthogonal stehenden Vektor f2 gibt es dann nur
mehr die zwei Möglichkeiten
− sin α
, ε = ±1.
f2 = ε
cos α
Nach den obigen Überlegungen hat eine orthogonale Matrix O im E 2 dann
die allgemeine Gestalt
cos α −ε sin α
O=
.
sin α ε cos α
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
12
Für ε = 1 handelt es sich um eine Drehung mit Drehwinkel α. In diesem
Fall ist det O = 1. Im Fall ε = −1 hat man es mit einer Drehspiegelung
zu tun, wobei det O = −1 ist.
2. Eine reine Spiegelung im E 2 wäre z.B. die Transformation
S=
1 0
0 −1
,
die einer Spiegelung an der 1-Achse entspricht.
3. Wir wollen im dreidimensionalen Raum eine Drehung um den Winkel α
beschreiben. Die 3-Achse unseres Koordinatensystems legen wir dabei in
Richtung der Drehachse. Als ONB haben wir (in der in der Physik für
räumliche Vektoren üblichen Schreibweise) {e1 , e2 , e3 }, welche (in der angegebenen Reihenfolge) ein Rechtssystem bilden soll. Wegen der Linearität
der Drehoperation R genügt es, ihre Wirkung auf die drei Basisvektoren zu
kennen:
Re1 = e1 cos α + e2 sin α,
Re2 = −e1 sin α + e2 cos α,
Re3 = e3 .
Daraus können wir unmittelbar die Matrixdarstellung (Rij ) von R bezüglich
der gewählten ONB ablesen:
⎛
⎞
cos α − sin α 0
(Rij ) = ⎝ sin α cos α 0 ⎠
0
0
1
Re2 BM
e2
6
B
B
B
B
e1
1 R
e3 Be α
- e1
B
B
Bemerkungen:
(a) Wir stellen fest, dass det R = 1 ist. Reine Drehungen im dreidimensionalen Raum entsprechen den Elementen der Drehgruppe SO(3).
1.5. ORTHOGONALE TRANSFORMATIONEN
13
(b) Eine Drehung im dreidimensionalen Raum ist bereits festgelegt, wenn
man das Bild von zwei orthonormierten Vektoren kennt, da dann auch
das Bild des dritten Basisvektors bereits bestimmt ist. Tatsächlich folgt
bei unserem Beispiel aus Re2 = −e1 sin α + e2 cos α und Re3 = e3 mit
e1 = e2 × e3 das Transformationsverhalten von e1 :
Re1 = R(e2 × e3 ) = Re2 × Re3
= (−e1 sin α + e2 cos α) × e3
= e1 cos α + e2 sin α.
(c) Ein Vektor
x =
3
ei xi
i=1
mit Komponenten xi bezüglich der ONB {e1 , e2 , e3 } wird durch die
Drehung R ∈ SO(3) in den Vektor
Rx = R
3
ej xj =
j=1
3
Rej xj =
j=1
mit den Komponenten
3
3
ei Rij xj
i,j=1
Rij xj
j=1
transformiert. Man spricht in diesem Fall von einer aktiven Transformation des Vektors. Bei einer passiven Transformation bleibt der
Vektor x selbst unverändert, man betrachtet jedoch seine Komponenten xi bezüglich einer transformierten ONB {e1 , e2 , e3 }. Im Fall unserer
Drehung ist
3
ej = Rej =
ei Rij .
i=1
Wegen
x =
3
ei xi =
i=1
3
ej xj =
j=1
3
ei Rij xj ,
i,j=1
ist der Zusammenhang zwischen den Komponenten xi und den Komponenten xi durch
xi =
3
j=1
Rij xj
⇔
xi
=
3
−1
Rij
xj
j=1
gegeben. Das Transformationsverhalten der Komponenten des Vektors
ist also invers zu jenem der aktiven Transformation.
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
14
4. Das Standardbeispiel für eine orthogonale Transformation mit negativer
Determinante ist in drei Raumdimensionen die Paritätstransformation
P = −1. Jedes Element O ∈ O(3) mit det O = −1 lässt sich in der Form
O = P R, R ∈ SO(3), schreiben.
1.6
SO(3)
Die Menge der Drehungen im dreidimensionalen Raum ist ein Beispiel für eine
nichtabelsche Liegruppe.
Die Elemente der Gruppe SO(3) können durch den sogenannten Drehvektor α
parametrisiert werden. Dieser zeigt (gemäß der Rechtsschraubenregel) in Richtung der Drehachse, sein Betrag ist gleich dem Drehwinkel α = |
α| (0 ≤ α < 2π).
Die entsprechende Transformation bezeichnen wir mit R(
α). Es handelt sich bei
der SO(3) also um eine kontinuierliche Gruppe von Transformationen (eine sogenannte Liegruppe), deren wesentliche Eigenschaften durch die Gestalt ihrer
Elemente in einer infinitesimalen Umgebung des Einheitselements bereits festgelegt sind. Für infinitesimales ε hat eine Drehung die einfache Form
ε × x
ε 6
yXX
X
x
x.
R(ε ) x = x + ε × x = ( + ε · Λ)
Man kann nun eine beliebige endliche Drehung um den Drehwinkel α
durch die
wiederholte Anwendung von N Drehungen um den Drehwinkel α
/N erhalten:
R(
α) = R(
α/N)N .
Für genügend großes N (und somit einen entsprechend kleinen Wert von α/N)
kann man schreiben:
α
·Λ
)N
R(
α) ( +
N
Im Limes N → ∞ erhält man somit die Formel
R(
α) = exp(
α · Λ).
Bemerkung: Wegen (ε × x)i = ikj εk xj = −εk kij xj (Summenkonvention!) sind
zusammengefassten linearen Abbildungen
die Matrixdarstellungen der drei in Λ
1.7. EULERSCHE WINKEL
15
Λ1 , Λ2 , Λ3 bezüglich der ONB {e1 , e2 , e3 } durch (Λk )ij = −kij gegeben. Diese Matrizen bilden eine dreidimensionale Darstellung der Generatoren (oder
Erzeuger) der SO(3).
aus, so
Führt man zuerst die Drehung R(
α) und anschließend die Drehung R(β)
wird sich das Resultat im Allgemeinen von jenem unterscheiden, das man erhält,
wenn man die beiden Operationen in der umgekehrten Reihenfolge durchführt.
Es handelt sich bei der SO(3) nämlich um eine nichtabelsche (oder nichtkommutative) Gruppe, das heißt ihre Elemente vertauschen (kommutieren) im
Allgemeinen nicht:
i.A.
= R(β)R(
α).
R(
α)R(β)
Konkret bedeutet das im Fall der SO(3), dass
α = R(β)R(
−1 .
R R(β)
α)R(β)
Für infinitesimales α
= ε ist diese Relation leicht zu sehen:
−1x = R(β)
R(β)
−1x + ε × R(β)
−1x
R(β)R(
ε )R(β)
ε × x
= x + R(β)
ε x.
= R R(β)
Im Fall eines endlichen Drehwinkels α
schreiben wir
−1 = R(β)R(
−1 = R(β)R(
−1 N .
R(β)R(
α)R(β)
α/N)N R(β)
α/N)R(β)
Für genügend großes N können wir die für den infinitesimalen Drehwinkel α
/N
bereits gezeigte Formel
−1 = R R(β)
α/N
R(β)R(
α/N)R(β)
einsetzen und erhalten auf diese Weise das behauptete Ergebnis.
Bemerkung: Stimmen die durch α
und β beschriebenen Drehachsen überein,
α = α
kommutieren in
dann ist R(β)
und die beiden Drehungen R(
α), R(β)
diesem Fall.
1.7
Eulersche Winkel
Jedes Element der dreiparametrigen Liegruppe SO(3) lässt sich eindeutig als Produkt von drei Drehungen um drei bestimmte Standardachsen beschreiben.
Eine andere Möglichkeit zur Parametrisierung der Elemente der SO(3) stellen die
drei Eulerschen Winkel dar. Sei D ∈ SO(3) und {e1 , e2 , e3 } eine (rechtshändige) ONB. Ist De3 = e3 , dann handelt es sich um den bereits behandelten Fall
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
16
einer Drehung um die 3-Achse. Es sei also De3 = e3 . Die beiden durch den Ursprung gehenden und auf e3 , beziehungsweise auf De3 normal stehenden Ebenen
schneiden einander dann in einer Geraden, der sogenannten Knotenlinie. Wie
auch bei Verwendung von Kugelkoordinaten üblich, bezeichnen wir den Winkel zwischen e3 und De3 mit θ (0 ≤ θ ≤ π) und den Winkel zwischen e1 und
der Projektion von De3 auf den von e1 und e2 aufgespannten Unterraum mit φ
(0 ≤ φ < 2π).
Als ersten Schritt wenden wir eine Drehung
Rφ = R(φe3 )
mit der Drehachse e3 um den Winkel φ an. Diese bildet die ONB {e1 , e2 , e3 } auf
die von den Vektoren
ej
= Rφej =
3
ei Rφ,ij ,
j = 1, . . . 3,
i=1
{e1 , e2 , e3 }
ab, wobei (Rφ,ij ) die Matrixdarstellung von Rφ
gebildete ONB
bezüglich der ONB {e1 , e2 , e3 } bezeichnet. Die explizite Form dieser Transformation ist durch
e1 = Rφe1 = e1 cos φ + e2 sin φ,
e2 = Rφe2 = −e1 sin φ + e2 cos φ,
e3 = Rφe3 = e3
mit
⎛
⎞
cos φ − sin φ 0
(Rφ,ij ) = ⎝ sin φ cos φ 0 ⎠
0
0
1
gegeben. Der Vektor e2 liegt in der Knotenlinie.
Im zweiten Schritt führen wir eine Drehung
Rθ = R(θe2 )
mit der Drehachse e2 um den Winkel θ durch. Die Wirkung dieser Drehung auf
die gestrichene ONB {e1 , e2 , e3 },
ej = Rθej =
3
ei Rθ,ij
,
j = 1, . . . 3,
i=1
ist durch
e1 = Rθe1 = e1 cos θ − e3 sin θ,
e2 = Rθe2 = e2
e3 = Rθe3 = e1 sin θ + e3 cos θ
1.7. EULERSCHE WINKEL
17
) der Drehung Rθ bezüglich der gestrichegegeben. Die Matrixdatstellung (Rθ,ij
nen Basis liest man sofort als
⎛
⎞
cos θ 0 sin θ
)=⎝
0
1
0 ⎠
(Rθ,ij
− sin θ 0 cos θ
ab.
Da e3 bereits mit De3 übereinstimmt, benötigt man als dritte Drehung nur mehr
eine Rotation um e3 um den Winkel ψ (0 ≤ ψ < 2π),
Rψ = R(ψe3 ),
um die Wirkung der gesamten Drehung D als Produkt
D = Rψ Rθ Rφ = R(ψe3 )R(θe2 )R(φe3 )
darzustellen. Wir betrachten also die Wirkung der Transformation Rψ auf die
Orthonormalbasis {e1 , e2 , e3 },
Dej =
Rψej
=
3
ei Rψ,ij
,
j = 1, . . . 3.
i=1
In expliziter Form hat man
De1 = Rψe1 = e1 cos ψ + e2 sin ψ,
De2 = Rψe2 = −e1 sin ψ + e2 cos ψ,
De3 = Rψe3 = e3 ,
) von Rψ bezüglich der ONB {e1 , e2 , e3 } lautet
und die Matrixdarstellung (Rψ,ij
daher:
⎞
⎛
cos ψ − sin ψ 0
(Rψ,ij
) = ⎝ sin ψ cos ψ 0 ⎠ .
0
0
1
Um nun die Matrixdarstellung (Dij ) der Gesamtdrehung bezüglich der ursprünglichen ONB {e1 , e2 , e3 } zu erhalten, setzen wir diese aus den drei Einzeldrehungen
zusammen:
Dej =
3
ei Dij =
Rψej
i=1
=
3
en Rψ,nj
n=1
=
3
Rθen Rψ,nj
n=1
=
3
m,n=1
=
3
em
Rθ,mn
Rψ,nj
m,n=1
Rφem Rθ,mn
Rψ,nj
=
3
i,m,n=1
ei Rφ,im Rθ,mn
Rψ,nj
.
KAPITEL 1. EUKLIDISCHE VEKTORRÄUME
18
Das heißt also, dass
Dij = (Rψ Rθ Rφ )ij =
3
Rφ,im Rθ,mn
Rψ,nj
,
m,n=1
bzw.
⎛
⎞⎛
⎞⎛
⎞
cos φ − sin φ 0
cos θ 0 sin θ
cos ψ − sin ψ 0
1
0 ⎠ ⎝ sin ψ cos ψ 0⎠ .
(Dij ) = ⎝ sin φ cos φ 0⎠ ⎝ 0
0
0
1
− sin θ 0 cos θ
0
0
1
Wie aus diesem Ergebnis ersichtlich ist, lässt sich die Drehung D auch auf eine
andere Art erhalten: Man dreht zunächst um e3 um den Winkel ψ, dann um die
Drehachse e2 (kein Strich!) um den Winkel θ und schließlich wieder um e3 um
den Winkel φ. Mit anderen Worten, es gilt die Beziehung
D = R(ψe3 )R(θe2 )R(φe3 ) = R(φe3 )R(θe2 )R(ψe3 ).
Die zweite Form hat den Vorteil, dass nur um Achsen der ursprünglichen ONB
gedreht wird.
Die hier gefundene Beziehung ist natürlich kein Zufall, sondern hat ihren tieferen
Grund in der schon früher besprochenen Formel
α = R(β)R(
−1 .
R R(β)
α)R(β)
Um dies zu sehen, setzen wir e2 = R(φe3 )e2 und
e3 = R(θe2 )e3 = R R(φe3 )θe2 R(φe3 )e3 = R(φe3 )R(θe2 ) R(φe3)−1 R(φe3 ) e3
= R(φe3 )R(θe2 )e3
in R(ψe3 )R(θe2 )R(φe3 ) ein:
R R(φe3 )R(θe2 )ψe3 R R(φe3 )θe2 R(φe3 )
R(ψ
e3 )
R(θe2 )
= R(φe3 )R(θe2 )R(ψe3 )R(θe2 )−1 R(φe3 )−1 R(φe3 ) R(θe2 ) R(φe3 )−1 R(φe3 )
= R(φe3 )R(θe2 )R(ψe3 ) R(θe2 )−1 R(θe2 )
= R(φe3 )R(θe2 )R(ψe3 ).
Bemerkung: Die hier gewählte Konvention zur Definition der Eulerschen Winkel
hat in der Quantenmechanik gewisse Vorteile. In der klassischen Mechanik wird
oft eine Konvention verwendet, bei der zunächst der Vektor e1 durch eine Rotation
um e3 in die Knotenlinie gedreht wird, anschließend wird um e1 gedreht und
schließlich um e3 . Physikalische Resultate können natürlich von der Wahl einer
bestimmten Konvention nicht abhängen.
Kapitel 2
Unitäre Vektorräume
Die Verwendung des Grundkörpers der komplexen Zahlen besitzt eine Reihe von
rechentechnischen Vorteilen. Will man etwa die Eigenwerte einer n × n-Matrix
bestimmen, so besitzt das dazugehörige charakteristische Polynom über
stets
ja bekanntlich
n (eventuell teilweise zusammenfallende) Nullstellen, was über
nicht der Fall zu sein braucht. Darüberhinaus ist die Theorie der unitären Vektorräume in der Physik von allergrößter Bedeutung, handelt es sich dabei doch
um jene mathematischen Methoden, die in der Quantentheorie ihre natürliche
Anwendung finden. Wir beschränken uns hier ausschließlich auf den endlichdimensionalen Fall. Es sei jedoch darauf hingewiesen, dass die hier dargestellte
Theorie ihre volle Bedeutung erst im unendlichdimensionalen Fall erlangt, wo sie
im Rahmen der Funktionalanalysis in die Theorie der (unendlichdimensionalen)
Hilberträume (→ Mathematische Methoden der Physik II) übergeht.
2.1
Komplexes Skalarprodukt
Definition: Ein (endlichdimensionaler) Vektorraum U über heißt unitär (oder
endlichdimensionaler Hilbertraum), wenn ∀ ϕ, ψ ∈ U ein Skalarprodukt (inneres Produkt) ϕ | ψ ∈ U definiert ist mit den folgenden Eigenschaften:
1. ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 ,
∀ ϕ, ψ1,2 ∈ U,
∀ c1,2 ∈
2. ϕ | ψ = ψ | ϕ∗
3. ψ | ψ ≥ 0,
ψ | ψ = 0 ⇔ ψ = 0
Bemerkungen: ϕ | ψ ist sesquilinear, d.h. linear in der zweiten Variablen
19
KAPITEL 2. UNITÄRE VEKTORRÄUME
20
und antilinear in der ersten Variablen, da
c1 ϕ1 + c2 ϕ2 | ψ = ψ | c1 ϕ1 + c2 ϕ2 ∗
= c∗1 ψ | ϕ1 ∗ + c∗2 ψ | ϕ2 ∗
= c∗1 ϕ1 | ψ + c∗2 ϕ2 | ψ.
Wir verwenden hier die in der physikalischen Literatur üblichen Konventionen. In
der mathematischen Literatur ist das innere Produkt oft in der ersten Variablen
linear und in der zweiten antilinear. Weiters findet man dort häufig die Schreibweise z̄ statt z ∗ für die zur komplexen Zahl z = a + ib (a, b ∈ ) konjugiert
komplexe Zahl z ∗ = a − ib.
Beispiele für unitäre Vektorräume:
1. U n =
n mit dem Skalarprodukt
x | y =
n
x∗k yk .
k=1
2. Der Vektorraum, der auf [a, b] ⊂
definierten komplexen Polynome vom
Grad ≤ n,
n
p(x) =
ck xk , ck ∈ , x ∈ [a, b]
k=0
mit dem inneren Produkt
b
p | q =
dx p(x)∗ q(x).
a
3. Der Vektorraum der komplexwertigen Funktionen der Form
ψ(x) =
N
cn e2πinx ,
cn ∈
n=−N
auf dem Intervall [0, 1] mit dem Skalarprodukt
1
ϕ | ψ =
0
dx ϕ(x)∗ ψ(x).
,
2.1. KOMPLEXES SKALARPRODUKT
21
4. Der Vektorraum der komplexwertigen Funktionen der Form
ϕ(x) = e−x
auf
2 /2
p(x)
, wobei p(x) ein Polynom vom Grad ≤ n ist, mit dem Skalarprodukt
∞
ϕ | ψ =
−∞
∞
=
dx ϕ(x)∗ ψ(x)
2
dx e−x p(x)∗ q(x),
−∞
−x2 /2
wobei ψ(x) = e
q(x).
Norm, Einheitsvektor und Orthogonalität zweier Vektoren und ONB
(VONS) werden wie im Fall des euklidischen Vektorraumes definiert. Auch den
Beweis der Cauchy-Schwarzschen Ungleichung
|ϕ | ψ| ≤ ϕ
ψ
kann man praktisch ungeändert übernehmen, man muss nur ε ∈
wählen, dass
εϕ | ψ = |ϕ | ψ|
⇒
(|ε| = 1) so
ε∗ ϕ | ψ∗ = |ϕ | ψ| .
Aufpassen muss man nur dort, wo die Sesquilinearität stärker in Erscheinung
tritt, wie z.B. bei der komplexen Form der Polarisierungsidentität:
1 k
i ϕ + ik ψ
2
4 k=1
4
ψ | ϕ =
Bemerkung: Die Funktionen en (x) = e2πinx (−N ≤ n ≤ N) bilden eine ONB
des in Beispiel 3 angegebenen unitären Vektorraumes. Aus diesem Grund lassen
sich die Entwicklungskoeffizienten cn in der Form
1
cn = en | ψ =
dx e−2πinx ψ(x)
0
schreiben. Im (formalen) Limes N → ∞ erhält man die Fourierreihe
cn e2πinx .
ψ(x) =
n∈
Im Sinn welches Konvergenzbegriffes sich welche Funktionen ψ(x) durch diese
Formel approximieren lassen, wird in den Mathematischen Methoden der Physik
II besprochen.
KAPITEL 2. UNITÄRE VEKTORRÄUME
22
2.2
Adjungierte Abbildung
Die Rolle der transponierten Matrix AT wird im komplexen Fall durch die adjungierte Matrix A† = (AT )∗ übernommen. Die Operation A ∈ L(U n , U m ) →
A† ∈ L(U m , U n ) besitzt die folgende Eigenschaften:
(c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 ,
(AB)† = B † A† , A†† = A
c1,2 ∈
Fasst man im Raum U n ein Element
⎞
x1
⎟
⎜
x = ⎝ ... ⎠
xn
⎛
als n × 1-Matrix auf, dann ist
x† = (x∗1 , . . . , x∗n )
und das Skalarprodukt kann in Matrixnotation
x | y = x† y
geschrieben werden. Die Abbildung x → x† stellt eine Identifizierung“ des U n
”
n dar, allerdings ist diese Identifizierung“
mit seinem Dualraum U
nicht linear:
”
(c1 x1 + c2 x2 )† = c∗1 x†1 + c∗2 x†2
Das Konzept der adjungierten Abbildung kann nun leicht auf den allgemeinen Fall
eines beliebigen unitären Raumes U erweitert werden. Da wir ein Skalarprodukt
zur Verfügung haben, können wir U mit seinem Dualraum U auf kanonische Weise
identifizieren“ . Dazu ordnen wir jedem ϕ ∈ U das Funktional ϕ† ∈ U zu, welches
”
durch
ϕ† ψ = ϕ | ψ ∀ ψ ∈ U
definiert ist. Diese Abbildung führt linear unabhängige Vektoren wieder in linear
unabhängige Vektoren über und ist injektiv. Da die Dimension von U mit der
seines Dualraums übereinstimmt, ist sie auch surjektiv. Die inverse Abbildung
bezeichnen wir ebenfalls mit † , sodass ϕ†† = ϕ gilt.
Seien U und V unitäre Vektorräume und A : U → V eine lineare Abbildung. Die
zu A adjungierte Abbildung A† : V → U ist durch
A† ϕ | ψU = ϕ | AψV
∀ ψ ∈ U, ∀ ϕ ∈ V
2.3. ORTHONORMALBASIS
23
definiert. Diese Definition ist äquivalent mit
A† ϕ = (ϕ† A)†
∀ ϕ ∈ V.
Die so definierte Abbildung ist wohldefiniert und linear, da
†
(c1 ϕ1 + c2 ϕ2 )† A
†
= (c∗1 ϕ†1 + c∗2 ϕ†2 )A
A† (c1 ϕ1 + c2 ϕ2 ) =
= c1 (ϕ†1 A)† + c2 (ϕ†2 A)†
= c1 A† ϕ1 + c2 A† ϕ2
ϕ1,2 ∈ V,
c1,2 ∈
.
Eigenschaften der adjungierten Abbildung:
1. (c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 ,
2. A†† = A,
,
A1,2 ∈ L(U, V).
A ∈ L(U, V).
3. (BA)† = A† B † ,
2.3
c1,2 ∈
A ∈ L(U, V), B ∈ L(V, W).
Orthonormalbasis
Bezüglich einer ONB {ϕ1 , . . . , ϕn } eines n-dimensionalen unitären Vektorraumes
U lässt sich jedes ψ ∈ U in der Form
ψ=
n
ϕ k ck
k=1
schreiben, wobei die Entwicklungskoeffizienten ck ∈
eindeutig durch
ck = ϕk | ψ = ϕ†k ψ
gegeben sind. Das heißt, dass
ψ=
n
ϕk ϕ†k ψ
∀ ψ ∈ U,
k=1
und man erhält somit die Vollständigkeitsrelation für den Fall eines unitären
Vektorraumes:
n
ϕk ϕ†k = 1
k=1
KAPITEL 2. UNITÄRE VEKTORRÄUME
24
Das bedeutet, dass eine Menge von n Vektoren {ϕ1 , . . . , ϕn } in einem ndimensionalen unitären Vektorraum U genau dann eine ONB von U ist, falls
die Bedingungen
n
ϕk ϕ†k = 1
ϕk | ϕl = δkl ,
k=1
erfüllt sind.
Beispiel: Verifizieren Sie die oben angegebenen Eigenschaften für die folgende
ONB von U 2 :
1
1
1
i
√
, √
.
i
1
2
2
Die Formeln des Gram-Schmidtschen Orthonormalisierungsverfahrens,
die wir für euklidische Vektorräume bereits hergeleitet haben, können für den
Fall eines unitären Vektorraumes direkt übernommen werden. Man muss nur ( | )
durch | ersetzen und beachten, dass es jetzt auf die Reihenfolge der Variablen
im Skalarprodukt ankommt.
Ebenso zeigt man, dass jeder n-dimensionale unitäre Vektorraum isomorph
zu U n ist. Auch für die Matrixelemente eines linearen Operators ∈ L(U)
bezüglich einer ONB {ϕ1 , . . . , ϕn } von U erhält man analog zu früher
Akl = ϕk | Aϕl = ϕ†k Aϕl .
Für die Matrixelemente des zu A ∈ L(U) adjungierten Operators A† ∈ L(U)
erhält man daher bezüglich einer ONB
(A† )kl = ϕk | A† ϕl = Aϕk | ϕl = ϕl | Aϕk ∗ = A∗lk .
Bemerkung: In der Physik wird oft die sogenannte Diracschreibweise verwendet. Statt ψ ∈ U schreibt man dann |ψ ∈ U (ket-Vektor) und für ein Element
des Dualraums ψ † ∈ U verwendet man die Notation ψ| (bra-Vektor). Die etwas
seltsame Sprechweise kommt von dem englischen Wort bracket = Klammer =
| . In der Diracschreibweise schreibt man z.B. die Vollständigkeitsrelation als
n
|ϕk ϕk | = 1,
k=1
oder oft in der Form
n
|kk| = 1,
k=1
wobei |k kurz für den Vektor |ϕk der gewählten ONB steht. Einige weitere
Beispiele mit Übersetzung“ :
”
|ϕψ| = ϕψ †
2.4. PROJEKTIONSOPERATOREN
25
|kl| = |ϕk ϕl | = ϕk ϕ†l
k|l = ϕk |ϕl = ϕ†k ϕl
k |A| l = ϕk |A| ϕl = ϕk | Aϕl = Akl
2.4
Projektionsoperatoren
Sei M ein Teilraum eines unitären Vektorraumes U. Dann bezeichnen wir mit
M⊥ das orthogonale Komplement von M, welches aus allen Elementen ψ ∈ U
mit ϕ|ψ = 0 ∀ ϕ ∈ M besteht. Dann ist M⊥ wieder ein Teilraum von U und
M ∩ M⊥ = {0}, denn
ψ1,2 ∈ M⊥ ⇒ ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 = 0
⇒ c1 ψ1 + c2 ψ2 ∈ M⊥ ,
ψ | ψ = 0 ⇒ ψ = 0.
ψ ∈ M ∩ M⊥ ⇒
∈M
∈M⊥
Mit dem Skalarprodukt von U ist M selbst ein unitärer Raum. Daher besitzt M
eine ONB {ϕ1 , . . . ϕm }. Für jeden Vektor ψ ∈ U sei
ψM =
m
ϕk ϕk | ψ =
k=1
m
ϕk ϕ†k ψ
k=1
Dann ist ψM ∈ M und ψ − ψM ∈ M⊥ , weil
ϕk | ψ − ψM = ϕk | ψ − ϕk | ψM m
ϕl ϕl | ψ
= ϕk | ψ − ϕk |
l=1
= ϕk | ψ −
m
l=1
ϕl | ψ ϕk | ϕl = ϕk | ψ − ϕk | ψ = 0
δkl
∀ k = 1, . . . , m
⇒ ψ = ψM + (ψ − ψM ) mit ψM ∈ M und ψ − ψM = ψM⊥ ∈ M⊥ . Diese
Darstellung ist eindeutig, weil M ∩ M⊥ = {0} ist, d.h. U = M ⊕ M⊥ und
dim M ⊥ = dim U − dim M. Weiters ist M⊥⊥ = M für jeden Teilraum M. Man
bezeichnet ψM als die orthogonale Projektion von ψ auf den Teilraum M.
Aus der Gleichung
ψM =
m
k=1
ϕk ϕ†k ψ
KAPITEL 2. UNITÄRE VEKTORRÄUME
26
sieht man, dass der Operator
PM =
m
ϕk ϕ†k =
k=1
m
|ϕk ϕk | ∈ L(U) (m ≤ dim U)
k=1
die Projektion ψ → ψM auf den m-dimensionalen Teilraum M bewerkstelligt,
wobei PM M⊥ = 0. PM heißt daher (orthogonaler) Projektionsoperator oder
(orthogonaler) Projektor auf M. PM ist natürlich von der Wahl der ONB
{ϕ1 , . . . , ϕm } in M unabhängig.
Eigenschaften von PM :
2
= PM (idempotent) wegen PM ψ = ψM , PM ψM = ψM .
1. PM
Anderer Beweis:
2
PM
=
m
ϕk ϕ†k
k=1
m
ϕl ϕ†l
=
l=1
m
ϕk ϕ†k ϕl
k,l=1
ϕ†l
=
m
ϕk ϕ†k = PM
k=1
δkl
†
2. PM
= PM (einen Operator mit dieser Eigenschaft nennt man hermitesch
oder selbstadjungiert).
†
PM
=
m
†
ϕk ϕ†k
=
k=1
m ϕk ϕ†k
†
=
k=1
m
k=1
†
ϕ††
k ϕk
=
m
ϕk ϕ†k = PM
k=1
Umgekehrt definiert jeder Operator P ∈ L(U), der die Eigenschaften P 2 = P
und P † = P erfüllt, durch sein Bild M = P U einen linearen Teilraum, wobei
P M⊥ = 0, da
χ | P ψ = P † χ | ψ = P χ | ψ = 0
∀ ψ ∈ M⊥ ,
∀χ ∈ U
∈M
wobei P † = P verwendet wurde.
Bemerkung: PM⊥ = 1 − PM ,
PM PM⊥ = 0.
PM besitzt die Eigenwerte 0 (falls dim M < dim U = n) und 1, da PM ϕ =
ϕ, ∀ ϕ ∈ M und PM ψ = 0 ∀ ψ ∈ M⊥ und U = M ⊕ M⊥ . Man kann
die ONB {ϕ1 , . . . , ϕm } von M (die aus n linear unabhängigen Eigenvektoren
von PM zum Eigenwert 1 besteht) durch die Hinzunahme einer beliebigen ONB
{ϕm+1 , . . . , ϕn } von M⊥ (die aus n − m linear unabhängigen Eigenvektoren von
PM zum Eigenwert 0 besteht) zu einem VONS {ϕ1 , . . . , ϕm , ϕm+1 , . . . , ϕn } des
ganzen Raumes U = M ⊕ M⊥ ergänzen.
2.5. HERMITESCHE OPERATOREN
2.5
27
Hermitesche Operatoren
Definition: Ein Operator A ∈ L(U) (U ist ein unitärer Vektorraum) heißt hermitesch oder selbstadjungiert, wenn A† = A ist.
Die Eigenwerte eines hermiteschen Operators sind reell: Sei ψ ∈ U ein Eigenvektror von A mit Eigenwert a (Aψ = aψ). Dann ist
ψ | Aψ = ψ | aψ = aψ | ψ.
Andererseits ist wegen A† = A
ψ | Aψ = A† ψ | ψ = Aψ | ψ = aψ | ψ = a∗ ψ | ψ,
und somit
(a − a∗ )ψ | ψ = 0.
Da ψ als Eigenvektor nicht der Nullvektor sein kann, ist auch ψ | ψ = 0, woraus
a = a∗ ∈ folgt.
Bemerkung: Die Umkehrung gilt nicht, das heißt ein Operator, der nur reelle
Eigenwerte besitzt, ist nicht notwendigerweise hermitesch. Gegenbeispiel im U 2 :
1 0
1 1
†
,
A=
= A =
1 1
0 1
jedoch hat A den (einfach entarteten) Eigenwert 1.
Beispiele für hermitesche Operatoren:
1. Die allgemeine Form einer hermiteschen Matrix im U 2 ist
a
c + id
A=
,
a, b, c, d ∈ .
c − id
b
Überzeugen Sie sich, dass die Eigenwerte von A tatsächlich reell sind.
2. Mit den orthogonalen Projektoren (P 2 = P, P † = P ) haben wir bereits
Spezialfälle von hermiteschen Operatoren kennengelernt. Man kann auch
sagen, dass die Projektionsoperatoren genau jene hermiteschen Elemente
aus L(U) sind, deren Eigenwerte 0 oder 1 sind.
3. In einem unitären Vektorraum U mögen die Vektoren {ϕ1 , . . . , ϕn } ein
VONS von U bilden. Dann ist
n
n
†
A=
ak ϕk ϕk =
ak |ϕk ϕk | , ak ∈
k=1
k=1
ein hermitescher Operator. Die reellen Zahlen ak (k = 1, . . . , n) sind Eigenwerte von A und die ONB {ϕ1 , . . . , ϕn } besteht aus Eigenvektoren von A.
Wir werden später sehen, dass sich jeder hermitesche Operator in der oben
angegebenen Form (Spektraldarstellung) schreiben lässt.
KAPITEL 2. UNITÄRE VEKTORRÄUME
28
2.6
Unitäre Operatoren
Definition: Ein Operator U ∈ L(U) (U ein unitärer Vektorraum) heißt unitär,
falls U invertierbar ist mit U −1 = U † (d.h. U † U = UU † = 1).
Bemerkung: Es handelt sich bei einer unitären Transformation offensichtlich
um die Verallgemeinerung des bei den euklidischen Vektorräumen besprochenen
Konzepts der orthogonalen Transformation.
Satz: Sei U ∈ L(U) (U ein unitärer Vektorraum). Dann sind die folgenden Aussagen äquivalent:
1. U ist unitär.
2. Uϕ | Uψ = ϕ | ψ
3. Uψ
= ψ
∀ ϕ, ψ ∈ U.
∀ ψ ∈ U.
4. U bildet jede ONB von U wieder auf eine ONB von U ab.
Bemerkung: Der Beweis verläuft analog zum euklidischen Fall, man muss jetzt
aber die komplexe Version der Polarisierungsidentität verwenden.
Sind U1 , U2 ∈ L(U) zwei unitäre Operatoren, dann ist auch das Produkt U1 U2
ein unitärer Operator, da
(U1 U2 )−1 = U2−1 U1−1 = U2† U1† = (U1 U2 )†
Die Eigenwerte eines unitären Operators haben den Betrag eins, da
Uψ = uψ (ψ = 0, u ∈ ) ⇒
ψ | ψ = Uψ | Uψ = uψ | uψ = |u|2 ψ | ψ
⇒
|u| = 1
=0
⇒
iα
u=e ,
α∈
.
Das heißt, das Spektrum (die Menge der Eigenwerte) eines unitären Operators
ist eine Teilmenge des Einheitskreises in der komplexen Zahlenebene.
Beispiele von unitären Abbildungen:
1. Sei U eine unitäre Matrix auf U n . Dann wird die Standardbasis {e1 , . . . , en }
(VONS von U n ) in einanderes VONS von U n {Ue1 , . . . , Uen } = {f1 , . . . , fn }
übergeführt. Wegen nk=1 fk fk† = 1 kann man schreiben:
U = U1 = U
n
k=1
ek e†k
=
n
k=1
Uek e†k
fk
=
n
fk e†k = (f1 , . . . , fn ),
k=1
d.h. die Spalten einer unitären Matrix bilden ein VONS.
2.7. NORMALE OPERATOREN
29
2. Die allgemeine Form einer unitären 2 × 2 Matrix ist daher:
a −b∗
U=
eiα , a, b ∈ , |a|2 + |b|2 = 1, α ∈
b a∗
.
3. Die Vektoren {ϕ1 , . . . , ϕn } mögen ein VONS eines unitären Vektorraums
bilden. Dann ist
U=
n
iαk
e
ϕk ϕ†k
=
k=1
n
eiαk |ϕk ϕk | ,
αk ∈
,
k=1
ein unitärer Operator. Die komplexe Zahl eiαk ist ein Eigenwert von U mit
dazugehörigem Eigenvektor ϕk . Wieder kann man zeigen, dass sich jeder
unitäre Operator in der obigen Form schreiben lässt.
2.7
Normale Operatoren
Definition: Ein Operator A ∈ L(U) (U ein unitärer Vektorraum) heißt normal,
falls AA† = A† A.
Bemerkung: Definiert man den Kommutator zweier Operatoren A, B ∈ L(U)
durch [A, B] = AB − BA, so ist die Eigenschaft, dass
bei
einem normalen Operator A und A† vertauschen, gleichbedeutend mit A, A† = 0.
Beispiele für normale Operatoren:
1. Hermitesche und unitäre Operatoren sind normal.
2. Sei {ϕ1 , . . . , ϕn } ein VONS eines unitären Vektorraumes U. Dann ist
A=
n
k=1
ak ϕk ϕ†k
=
n
ak |ϕk ϕk | ,
ak ∈
k=1
ein normaler Operator. Wir werden im nächsten Abschnitt zeigen, dass
sich jeder normale Operator in dieser Form schreiben lässt. Das ist die
Aussage des Spektralsatzes für normale Operatoren. Dieser behauptet
nämlich, dass die normalen Operatoren genau diejenigen sind, die eine ONB
von Eigenvektoren besitzen.
KAPITEL 2. UNITÄRE VEKTORRÄUME
30
Bemerkungen:
1. Im Raum U 2 ist die Matrix
A=
1 1
0 1
nicht normal (AA† = A† A). Diese Matrix hat nur einen Eigenvektor!
2. Für jedes A ∈ L(U) sind A† A und AA† hermitesch.
3. Für jedes A ∈ L(U) sind
A1 =
1
A + A†
2
und A2 =
1 A − A†
2i
hermitesche Operatoren und es gilt
A = A1 + iA2
Der Operator A ist genau dann normal, wenn [A1 , A2 ] = 0 gilt. Daraus
ergibt sich, dass man normale Operatoren in gewisser Hinsicht als Verallgemeinerung der komplexen Zahlen interpretieren kann, wobei die hermiteschen Operatoren den reellen Zahlen entsprechen. Die unitären Operatoren
(U † U = UU † = 1) stellen das Analogon zu einer komplexen Zahl z mit
z ∗ z = 1, d.h. |z| = 1, dar.
2.8
Spektralsatz für normale Operatoren
Normale Operatoren lassen sich dadurch charakterisieren, dass sie ein vollständiges Orthonormalsystem von Eigenvektoren besitzen. Die Spektraldarstellung normaler Operatoren ist eine unmittelbare Folgerung aus dieser Eigenschaft. Diese
wird in den verschiedensten physikalischen Anwendungen benötigt.
Spektralsatz für normale Operatoren: Jeder normale Operator in einem
unitären Vektorraum besitzt ein vollständiges Orthonormalsystem von Eigenvektoren.
Beweis: Sei A ∈ L(U) ein normaler Operator ( A, A† = 0) in einem ndimensionalen unitären Vektorraum U. Dann besitzt das charakteristische Polynom von A,
pA (a) = det(a1 − A),
mindestens eine Nullstelle a1 ∈
. Die Eigenwertgleichung
Aϕ = a1 ϕ
2.8. SPEKTRALSATZ FÜR NORMALE OPERATOREN
31
besitzt daher eine nichttriviale Lösung ϕ1 = 0, wobei man ϕ1 |ϕ1 = 1 wählen
kann. Da A normal ist, ist ϕ1 auch Eigenvektor des adjungierten Operators A†
zum Eigenwert a∗1 :
A† ϕ1 = a∗1 ϕ1 .
Das kann man folgendermaßen sehen:
0 =
=
=
=
=
(A − a1 )ϕ1 | (A − a1 )ϕ1
ϕ1 | (A − a1 )† (A − a1 )ϕ1
ϕ1 | (A − a1 )(A − a1 )† ϕ1
(A − a1 )† ϕ1 | (A − a1 )† ϕ1
(A† − a∗1 )ϕ1 | (A† − a∗1 )ϕ1
A† ϕ1 = a∗1 ϕ1
⇒
Man betrachtet nun den (n-1)-dimensionalen Teilraum
N = [ϕ1 ]⊥ = {ψ ∈ U | ϕ1 |ψ = 0} .
Die Anwendung von A bzw. A† auf Elemente von N führt aus diesem Teilraum
nicht heraus, denn für ψ ∈ N gilt
ϕ1 | Aψ = A† ϕ1 | ψ = a∗1 ϕ1 | ψ = a1 ϕ1 | ψ = 0
und
ϕ1 | A† ψ = Aϕ1 | ψ = a1 ϕ1 | ψ = a∗1 ϕ1 | ψ = 0.
Man kann daher A als Opertaor auf N auffassen, der natürlich auch normal
ist. Man wiederholt nun das Verfahren von vorhin und erhält ein ϕ2 ∈ N (d.h.
ϕ2 |ϕ1 = 0), ϕ2 = 1, mit Aϕ2 = a2 ϕ2 . Die weitere Fortsetzung dieser Prozedur
liefert nach insgesamt n Schritten ein VONS {ϕ1 , . . . , ϕn } von Eigenvektoren von
A: Aϕk = ak ϕk .
Zur Spektraldarstellung eines normalen Operators,
A=
n
ak ϕk ϕ†k
=
k=1
n
ak |ϕk ϕk | ,
k=1
gelangt man nun einfach durch die Verwendung der Vollständigkeitsrelation für
die ONB {ϕ1 , . . . , ϕn }:
A = A1 = A
n
k=1
ϕk ϕ†k
=
n
k=1
Aϕk ϕ†k
=
n
k=1
ak ϕk ϕ†k
KAPITEL 2. UNITÄRE VEKTORRÄUME
32
Bemerkung: Sei A ∈ L(U n ) eine normale n × n-Matrix. Dann gibt es ein VONS
{f1 , . . . , fn } von Eigenvektoren von A:
fk† fl
= δkl ,
n
fk fk† = 1,
Afk = ak fk .
k=1
⎛
A=
n
k=1
⎜
fk ak fk† = (f1 , . . . , fn ) ⎝
U
a1
⎞⎛
⎞
f1†
⎟ ⎜ .. ⎟
..
⎠⎝ . ⎠
.
an
fn†
Â
Die Matrizen
U=
n
U†
fk e†k = (f1 , . . . , fn )
k=1
und
⎞
f1†
⎟
⎜
ek fk† = ⎝ ... ⎠
U† =
k=1
fn†
⎛
n
sind unitär (UU † = U † U = 1). Der Spektralsatz besagt also, dass man jede
normale n × n-Matrix in der Form
A = U ÂU †
schreiben kann, wobei U unitär ist und  die aus den Eigenwerten a1 , . . . , an
gebildete Diagonalmatrix  = diag(a1 , . . . , an ) ist. Multipliziert man die obige
Gleichung von links mit U † und von rechts mit U, so erhält man
U † AU = Â
d.h. eine n × n-Matrix lässt sich genau dann durch eine unitäre Transformation auf Diagonalgestalt bringen, wenn sie normal ist. An dieser Stelle sei an den
allgemeinen Fall einer diagonalisierbaren n × n-Matrix erinnert, bei der eine Basis {f1 , . . . , fn } von Eigenvektoren Afk = ak fk existiert. Bildet man die Matrix
S = (f1 , . . . fn ), so ist S −1 AS = Â = diag(a1 , . . . , an ) die gewünschte Diagonalisierung. In unserem Fall einer normalen Matrix haben wir also den Spezialfall,
dass die Eigenvektoren eine ONB bilden und S daher unitär ist (S −1 = S † ).
Kochrezept
für das
Diagonalisieren einer normalen n × n-Matrix A (d.h. einer
Matrix mit A, A† = 0):
1. Man berechne das charakteristische Polynom von A:
pA (a) = det(a1 − A)
2.8. SPEKTRALSATZ FÜR NORMALE OPERATOREN
33
2. Man berechne die Eigenwerte von A, indem man die Nullstellen des charakteritischen Polynoms bestimmt. Es kann natürlich vorkommen, dass
manche der Eigenwerte entartet sind.
3. Man ermittle die dazugehörigen Eigenvektoren fk aus der Eigenwertgleichung
Afk = ak fk
und normiere sie (
fk = 1). Eigenvektoren zu verschiedenen Eigenwerten
(ak = al ) sind automatisch orthogonal, denn
†
fk† Afl = al fk† fl = A† fk fl = ak fk† fl
⇒
(ak − al ) fk† fl = 0
fk† fl = 0.
⇒
=0
Ist ein Eigenwert d-fach entartet, so gibt es d linear unabhängige Eigenvektoren (d.h. der Eigenraum dieses Eigenwertes ist d-dimensional). Diese
Eigenvektoren können aber stets orthonormal gewählt werden. Auf diese
Weise erhält man ein VONS {f1 , . . . , fn } von U n .
4. Man bilde die unitäre Matrix U = (f1 , . . . , fn ) mit den Eigenvektoren als
Spalten ⇒ U † AU = Â = diag(a1 , . . . , an ).
Beispiele:
1. Die Matrix
R=
cos θ − sin θ
sin θ cos θ
ist in U 2 unitär, ihre Eigenwerte sind e±iθ , die dazugehörigen normierten
Eigenvektoren sind
1
1
(zum Eigenwert e+iθ ),
f1 = √
−i
2
1
1
(zum Eigenwert e−iθ ).
f2 = √
i
2
somit ist
1
U = (f1 , f2 ) = √
2
und
1 1
−i i
U † RU = diag eiθ , e−iθ .
KAPITEL 2. UNITÄRE VEKTORRÄUME
34
2. Die 3 × 3-Matrix
⎛
⎞
1 −2 1
A = ⎝ −2 1
1 ⎠
1
1 −2
ist hermitesch, die Eigenwerte müssen daher reell sein. Für das charakteristische Polynom erhält man pA (a) = a(a2 − 9) und somit die Eigenwerte
a1 = 0,
a2 = 3,
a3 = −3.
Die Eigenwertgleichungen Af1 = 0, Af2 = 3f2 , Af3 = −3f3 ergeben die
(normierten) Lösungen
⎛ ⎞
⎛
⎞
⎛
⎞
1
1
1
1
1
1
f1 = √ ⎝ 1 ⎠ , f2 = √ ⎝ −1 ⎠ , f3 = √ ⎝ 1 ⎠ ,
3
2
6
1
0
−2
Man überprüft leicht, dass {f1 , f2 , f3 } tatsächlich eine ONB von U 3 ist.
Ebenso kann man als Probe die Spektraldarstellung
A=
3
ak fk fk† = 3 f2 f2† − f3 f3†
k=1
überprüfen“. Für die unitäre Matrix U = (f1 , f2 , f3 ), welche die Diagona”
lisierung von A in der Form U † AU = diag(0, 3, −3) bewerkstelligt, erhält
man daher
⎞
⎛
⎜
U =⎝
√1
3
√1
3
√1
3
√1
2
− √12
0
√1
6
√1
6
− √26
⎟
⎠.
Bemerkung: Wir haben die Spektraldarstellung eines normalen Operators A
in einem n-dimensionalen unitären Raum so formuliert, dass wir A als Linearkombination von eindimensionalen Projektionsoperatoren |ϕk ϕk | geschrieben
haben,
n
ak |ϕk ϕk | .
A=
k=1
Wenn es entartete Eigenwerte gibt, dann sind einige der ak gleich und es ist
möglich die entsprechenden Terme zusammenzufassen. Dazu ändern wir unsere
Notation etwas ab: {aα }m
α=1 sei das Spektrum von A (d.h. aα = aβ für α = β).
a1 , . . . , am bezeichnen also jetzt die m ≤ n verschiedenen Eigenwerte von A
mit dazugehörigen Eigenräumen Mα (α = 1, . . . , m), die paarweise aufeinander
orthogonal stehen:
Mα ⊥ Mβ
für α = β,
U = M 1 ⊕ · · · ⊕ Mm .
2.9. GLEICHZEITIGE DIAGONALISIERBARKEIT
35
Durch eine geeignete Umbenennung der Vektoren der ONB {|ϕ1 , . . . , |ϕn } in
{| α, r}
r = 1, . . . dα = dim Mα
α = 1, . . . m,
kann man die Projektoren auf die Eigenräume Mα (α = 1, . . . , m) in der Form
PMα =
dα
| α, rα, r |
r=1
schreiben. Die Tatsache, dass die PMα orthogonale Projektionsoperatoren auf die
paarweise orthogonal stehenden Teilräume M1 , . . . , Mm sind, drückt sich durch
die Relationen
†
PMα PMβ = δαβ PMα , PM
= PMα
α
aus. Zusammen mit der Vollständigkeitsrelation
m
PMα = 1
α=1
gelangen wir schließlich zur gewünschten alternativen Formulierung der Spektraldarstellung von A:
m
A=
aα PMα .
α=1
2.9
Gleichzeitige Diagonalisierbarkeit
Das folgende Kriterium für die gleichzeitige Diagonalisierbarkeit normaler Operatoren wird vor allem in der Quantenmechanik oft benötigt.
Satz: A, B ∈ L(U) seien normale Operatoren, die miteinander vertauschen
([A, B] = 0). Dann gibt es eine gemeinsame ONB von Eigenvektoren für beide
Operatoren.
Beweis: Seien aα (α = 1, . . . m) die verschiedenen Eigenwerte von A und Mα
die entsprechenden Eigenräume. ψ ∈ Mα ⇒ Bψ ∈ Mα , denn
ABψ = BAψ = Baα ψ = aα Bψ
⇒ B|Mα ist ein normaler Operator auf Mα ⇒ ∃ ONB von Mα {|α, 1, . . . |α, dα}
von Eigenvektoren von B. Außerdem ist natürlich A|α, r = aα |α, r.
Die Vektoren |α, r (α = 1, . . . m, r = 1, . . . , dα = dim Mα ) bilden ein VONS von
U, das aus Eigenvektoren von A und B gebildet wird.
Bemerkung: Für normale n × n-Matrizen A, B mit [A, B] = 0 bedeutet das:
∃ unitäre Matrix U, sodass U † AU und U † BU Diagonalmatrizen sind. (A und B
sind gleichzeitig diagonalisierbar.)
KAPITEL 2. UNITÄRE VEKTORRÄUME
36
2.10
Funktionen normaler Operatoren
Funktionen von linearen Operators treten etwa bei der Behandlung von Systemen linearer Differentialgleichungen, der Beschreibung von Symmetrietransformationen und der Zeitentwicklung in der Quantenmechanik auf. Die Berechnung
der Funktion eines normalen Operators ist erstaunlich einfach. Sie kann auf die
Bestimmung der Funktionswerte auf dem Spektrum des Operators zurückgeführt
werden.
Um dies zu sehen, gehen wir von der Spektraldarstellung eines normalen Operators A in der Form
n
A=
ak ϕk ϕ†k
k=1
aus. Multipliziert man diesen Ausdruck mit sich selbst (was einer nochmaligen
Anwendung der Abbildung A entspricht), so erhält man
2
A
= AA =
n
ak ϕk ϕ†k
k=1
=
n
n
al ϕl ϕ†l
l=1
=
n
k,l=1
ak al ϕk ϕ†k ϕl ϕ†l
δkl
a2k ϕk ϕ†k
k=1
bzw. für beliebiges m ∈
,
· · A =
A =A
·
m
m-mal
n
†
am
k ϕk ϕk .
k=1
Ebenso erhält man für ein Polynom von A den Ausdruck
n
n
†
m
m
cm A =
cm ak ϕk ϕk =
p(ak )ϕk ϕ†k .
p(A) =
m
k=1
m
k=1
Für eine beliebige komplexwertige Funktion f , die auf dem Spektrum des normalen Operators A ∈ L(U) (das ist die Menge der Eigenwerte von A) definiert
ist, kann man f (A) ∈ L(U) daher durch
f (A) =
n
f (ak )ϕk ϕ†k
k=1
definieren, wobei f (A) natürlich wieder ein normaler Operator ist.
2.10. FUNKTIONEN NORMALER OPERATOREN
37
Beispiele:
1. Sei A ∈ L(U n ) eine normale n×n-Matrix. A =U ÂU † , Â = diag(a
1 , . . . , an ),
†
U unitär ⇒ f (A) = Uf (Â)U , f (Â) = diag f (a1 ), . . . , f (an ) .
2. Sei U ∈ L(U) ein unitärer Operator. Seine Eigenwerte haben dann die
Gestalt eiαk (α ∈ ) und die Spektraldarstellung lautet
U=
n
eiαk ϕk ϕ†k = eiA ,
k=1
wobei A =
n
†
k=1 αk ϕk ϕk
= A† .
Das heißt, jeder unitäre Operator kann in der Form
U = eiA ,
A = A† ,
geschrieben werden.
3. Die Funktion f (A) eines normalen Operators A in einem zweidimensionalen unitären Raum kann als Linearkombination des Einheitsoperators
und von A selbst geschrieben werden. Sind die zwei möglichen Eigenwerte
entartet, so ist A = a1 und daher f (A) = f (a)1, womit die Behauptung
offensichtlich erfüllt ist. Im Fall verschiedener Eigenwerte (a1 = a2 ) hat
man
A = a1 P1 + a2 P2 , P1 + P2 = 1,
wobei
P1 = ϕ1 ϕ†1 ,
P2 = ϕ2 ϕ†2
die beiden eindimensionalen Projektoren auf die von den Eigenvektoren
ϕ1,2 aufgespannten Eigenräume sind. Aus der Spektraldarstellung und der
Vollständigkeitsrelation kann man die beiden Projektionsoperatoren als Linearkombinationen von 1 und A schreiben:
P1 =
A − a2
,
a1 − a2
P2 =
A − a1
.
a2 − a1
Somit erhält man
A − a2
A − a1
+ f (a2 )
a1 − a2
a1 − a2
f (a2 )a1 − f (a1 )a2
f (a1 ) − f (a2 )
=
1+
A.
a1 − a2
a1 − a2
f (A) = f (a1 )P1 + f (a2 )P2 = f (a1 )
KAPITEL 2. UNITÄRE VEKTORRÄUME
38
4. In der Quantenmechanik treten bei der Beschreibung des Spin 1/2-Systems
die Paulischen Spinmatrizen
0 1
0 −i
1 0
, σ2 =
, σ3 =
σ1 =
1 0
i 0
0 −1
auf. Sie sind in U 2 hermitesch mit Eigenwerten ±1. Sie erfüllen die Vertauschungsrelationen
[σk , σl ] = 2i
3
klm σm
m=1
und die Antivertauschungsrelationen
σk σl + σl σk = 2δkl .
Bildet man die Linearkombination
n · σ =
3
ni σi
k=1
mit einem Einheitsvektor
⎛
⎞
n1
⎝ n2 ⎠ ∈
n3
3
,
n21 + n22 + n23 = 1,
so ist n · σ wieder hermitesch mit Eigenwerten ±1. Bei der Beschreibung
der räumlichen Drehung eines Spins um den Winkel α mit Drehachse n,
tritt die Matrix
e−iαn·σ/2
auf. Überprüfen Sie, dass diese Matrix in der Form
e−iαn·σ/2 = 1 cos
α
α
− in · σ sin
2
2
geschrieben werden kann. Hinweis: Wenden Sie die Formel von Beispiel 3
an.
2.11
Anwendung des Spektralsatzes auf relle
Matrizen
Einige Resultate über reelle n × n Matrizen erhält man auf sehr einfache Weise
dadurch, dass man sie als Abbildungen in einem unitären Vektorraum auffasst.
2.11. ANWENDUNG DES SPEKTRALSATZES AUF RELLE MATRIZEN 39
A ∈ L(E n ) sei eine reelle n × n-Matrix mit AT A = AAT . Lässt sich dann A durch
eine orthogonale Transformation auf Diagonalgestalt bringen? Das Beispiel
a b
A=
a, b ∈
−b a
zeigt, dass das im Allgemeinen nicht möglich ist, denn die Eigenwerte sind a ± ib
und das Produkt reeller Matrizen ist wieder reell, kann also nie eine komplexe
Diagonalmatrix ergeben. Allerdings ist das in gewisser Weise das einzige Gegenbeispiel.
Sei also A = A∗ mit AT A = AAT , dann können wir A als Operator im U n
auffassen und wir wissen, dass es ein VONS von Eigenvektoren {f1 , . . . , fn } gibt,
die im Allgemeinen komplex sind. Seien also aα (α = 1, . . . , m) die verschiedenen
Eigenwerte von A mit Vielfachheit dα . Wir unterscheiden zwei Fälle:
1. aα ∈
Af1 = aα f1 ,
0 = f1 = p1 + iq2 ,
A(p1 + iq1 ) = aα (p1 + ip2 )
⇒ Ap1 + iAq1 = aα p1 + iaα p2
p1 , q1 ∈
n
Vergleich von Real- und Imaginärteil auf der linken und der rechten Seite
ergibt:
Ap1 = aα p1 ,
Aq1 = aα q1
Da f1 = p1 + iq1 = 0 ist entweder p = 0 oder q = 0 (oder beide), d.h. es gibt
eine reelle Lösung r1 für den Eigenvektor. Ist nun dα = 1, dann sind wir
fertig, ist dα ≥ 2, dann betrachten wir [r1 ]⊥ . Das heißt, wir suchen einen
Vektor f2 = 0 mit r1† f2 = r1T f2 = 0 und Af2 = aα f2 (die Existenz von f2 ist
klar). Wir zerlegen f2 wieder in Real- und Imaginärteil:
f2 = p2 + iq2 ,
⇒
r1† p2 = r1T p2 = 0,
r1† q2 = r1T q2 = 0,
p2 , q2 ∈
n
Ap2 = aα p2 ,
Aq2 = aα q2 .
Da f2 = 0, ist wieder p2 = 0 oder q2 = 0. Auf diese Weise erhält man
eine reelle Lösung r2 der Eigenwertgleichung Ar2 = aα r2 mit r1T r2 = 0.
Setzt man dieses Verfahren fort, so erhält man dα reelle Eigenvektoren
zum Eigenwert aα , die ein Orthonormalsystem bilden:
Ark = aα rk ,
k = 1, . . . , dα,
rk ∈
n
,
rkT rl = δkl .
KAPITEL 2. UNITÄRE VEKTORRÄUME
40
/
2. aα ∈
⇒
Ag = aα g,
Ag ∗ = a∗α g ∗
g∈
n ,
g†g = 1
Da laut Vorraussetzung aα = a∗α ist, stehen die Vektoren g und g ∗ aufeinander orthogonal (g †g ∗ = 0). Schreibt man g in der Form
g=
x + iy
√ ,
2
x, y ∈
n
,
so ergibt sich
1
0 = g †g ∗ = (x + iy)† (x − iy)
2
1 T
=
x x − y T y − ixT y − iy T x
2
1 T
=
x x − y T y − 2ixT y
2
⇒ xT x = y T y, xT y = 0.
Aus der Normierung erhält man
1
1
1 = g † g = (x + iy)† (x + iy) = (xT x + y T y)
2
2
und zusammen mit xT x = y T y somit xT x = y T y = 1.
Zerlegt man die Eigenwertgleichung
A(x + iy) = (Re aα + i Im aα ) (x + iy)
in Real- und Imaginärteil, so erhält man
Ax = x Re aα − y Im aα ,
Ay = x Im aα + y Re aα .
Die Matrixdarstellung von A in dem von x und y gebildeten Unterraum ist
also
Re aα Im aα
.
−Im aα Re aα
Die Eigenvektoren {r1 , . . . , rs , g1 , g1∗ , . . . , gt , gt∗ } (rk ∈ n , s + 2t = n) bilden
ein VONS in U n . Aus diesem kann man durch
√
√
xk = 2 Re gk ∈ n , yk = 2 Im gk ∈ n
2.11. ANWENDUNG DES SPEKTRALSATZES AUF RELLE MATRIZEN 41
eine ONB des E n erhalten:
{r1 , . . . , rs , x1 , y1 , . . . , xt , yt } .
Bezüglich dieser Basis erhält man die Fast-Diagonalgestalt
⎞
⎛
a1
..
⎟
⎜
.
⎟
⎜
⎟
⎜
a
⎟
⎜
s
=⎜
S T AS = A
⎟.
Bs+1
⎟
⎜
⎟
⎜
.
⎠
⎝
..
Bs+t
mit den 2 × 2-Blöcken Bl der Form
Re al Im al
Bl =
−Im al Re al
und der orthogonalen Matrix
S = (r1 , . . . , rs , x1 , y1, . . . , xt , yt )
Besonders wichtig ist der Spezialfall einer reellen symmetrischen Matrix A,
d.h. einer Matrix mit AT = A. Das ist der Spezialfall einer hermiteschen Matrix,
daher sind alle Eigenwerte reell und A kann durch eine orthogonale Transformation S auf Diagonalgestalt gebracht werden:
S T AS = diag(a1 , . . . , an ),
S T S = SS T = 1.
Beispiel: Eine quadratische Form
n
xi , Aij = Aji ∈
xi Aij xj = xT Ax,
i,j=1
kann durch eine orthogonale Transformation x = Sy auf die besonders einfache
Hauptachsenform
n
T
y Ây =
ai yi2
i=1
gebracht werden (Hauptachsentransformation).
Beweis: A = S ÂS T ⇒
xT Ax = xT S ÂS T x
T
T
T
T
= (S x) ÂS x = y Ây =
n
i=1
wobei y = S x ⇔ x = Sy.
T
ai yi2 ,
42
KAPITEL 2. UNITÄRE VEKTORRÄUME
Kapitel 3
Einfache Quantensysteme
Die in der Theorie der unitären Räume eingeführten mathematischen Konzepte haben eine unmittelbare Entsprechung zu jenen grundlegenden physikalischen
Begriffen, die bei der Formulierung der Grundpostulate der Quantentheorie verwendet werden. Obwohl man zur Beschreibung der meisten realistischen quantenmechanischen Systeme unendlichdimensionale Hilberträume benötigt, können die
wesentlichen Grundideen der mathematischen Struktur der Quantentheorie bereits an Hand des einfacheren Spezialfalls eines endlichdimensionalen Zustandsraumes erläutert werden.
3.1
Grundpostulate der Quantentheorie
Zu jedem quantenmechanischen System gibt es einen geeigneten Hilbertraum
H, den sogenannten Zustandsraum des betrachteten Systems. Obwohl der Zustandsraum i.Allg. unendlichdimensional ist, gibt es physikalische Probleme,
bei denen nur ein endlicher Teilraum des gesamten Hilbertraums relevant ist.
Wir wollen uns also bei der Formulierung der Axiome der Quantentheorie auf
Systeme beschränken, die sich durch einen endlichdimensionalen Zustandsraum H (unitären Vektorraum) beschreiben lassen.
Die beobachtbaren Größen (Observable) des betrachteten quantenmechanischen Systems werden durch die hermiteschen Elemente der Observablenalgebra L(H) repräsentiert. Beispiele für Observable wären etwa die Energie oder
der Drehimpuls des Systems. Der wesentliche Unterschied zur klassischen Physik
liegt darin, dass man es in der Quantenmechanik mit einer nichtkommutativen Obervablenalgebra zu tun hat, d.h. es gibt Operatoren A, B ∈ L(H) mit
[A, B] = 0.
43
KAPITEL 3. EINFACHE QUANTENSYSTEME
44
Die möglichen Messwerte der durch den hermiteschen Operator A ∈ L(H) beschrieben Observablen sind die Elemente des Spektrums von A (d.h. die Eigenwerte von A). D.h. bei einer Messung der Observablen A kann als Messergebnis
immer nur einer der Eigenwerte a1 , . . . , an von A auftreten.
Bemerkung: Eine besondere Rolle spielen die Projektionsoperatoren, die als
hermitesche Operatoren ja ebenfalls beobachtbare Größen repräsentieren. Ist ein
hermitescher Operator durch seine Spektraldarstellung
A=
m
aα Pα
α=1
gegeben (m ist die Anzahl der verschiedenen Eigenwere von A), so entspricht
dem Projektor Pα (der auf den Eigenraum des Eigenwertes aα projiziert) die
Durchführung des folgenden ja-nein-Experiments: Erhält man bei einer Messung
”
der Observablen A den Messwert aα ?“ Da der Projektionsoperator Pα nur die
Eigenwerte 1 und 0 besitzt, entspricht dem Eigenwert 1 die Antwort ja“ und
”
dem Eigenwert 0 die Antwort nein“.
”
Die möglichen Zustände des Systems werden durch lineare Funktionale auf
der Observablenalgebra beschrieben, die zusätzlich nicht negativ und normiert
sind. Bei einem Zustand ω handelt es sich also um eine Abbildung ω : L(H) →
mit folgenden Eigenschaften:
1. ω(c1 A1 + c2 A2 ) = c1 ω(A1 ) + c2 ω(A2 ),
2. ω(A† A) ≥ 0
c1,2 ∈
, A1,2 ∈ L(H)
∀ A ∈ L(H)
3. ω(1) = 1
Durch den Zustand ω wird jeder Observablen A ihr Erwartungswert ω(A)
zugeordnet. Für den Projektionsoperator Pα = Pα† = Pα Pα erhält man wegen der
Eigenschaft 2
pα = ω(Pα ) = ω(PαPα ) = ω Pα† Pα ≥ 0.
pα = ω(Pα ) ist die Wahrscheinlichkeit bei einer Messung der Observablen A
den Messwert aα zu erhalten, wenn sich das System in dem durch ω beschriebenen
Zustand befindet. Wegen der Vollständigkeitsrelation
m
Pα = 1
α=1
und der Linearität der Normierung von ω erhält man
m
m
m
pα =
ω(Pα ) = ω
Pα = ω(1) = 1
α=1
α=1
α=1
3.1. GRUNDPOSTULATE DER QUANTENTHEORIE
45
für die Wahrscheinlichkeit irgendeinen der Eigenwerte von A zu messen. Der
Erwartungswert von A im Zustand ω lässt sich dann, wieder unter Verwendung
der Linearität von ω, in der Form
m
m
m
ω(A) = ω
aα Pα =
aα ω(Pα) =
aα pα
α=1
α=1
α=1
schreiben. Präpariert man eine große Anzahl N von identischen Kopien des Systems alle im gleichen Zustand ω und führt dann an jeder dieser Kopien eine
Messung der Observablen A durch, so wird man Nα -mal den Messwert aα erhalten, wobei
Nα
−→ pα
N N →∞
und m
α=1 Nα = N ist. Für den Mittelwert der Messwerte ergibt sich daher
m
m
Nα
aα
aα pα = ω(A).
−→
N N →∞ α=1
α=1
Beispiele von Zuständen:
1. ψ ∈ H sei ein Einheitsvektor. Dann wird durch ω(A) = ψ|Aψ ∀ A ∈
L(H) ein sogenannter reiner Zustand definiert. Man überzeugt sich leicht,
dass die Eigenschaften 1-3 tatsächlich erfüllt sind. Man nennt ψ dann den
Zustandsvektor des entsprechenden reinen Zustands. Bemerkung: Der
Zustandsvektor eiϕ ψ beschreibt den selben Zustand.
2. ω1 , ω2 , . . . , ωr seien Zustände
r und p1 , p2 , . . . , pr positive Zahlen mit
r
j=1 pj = 1. Dann ist ω =
j=1 pj ωj ebenfalls ein Zustand. Insbesondere
wird durch
r
ω(A) =
pj ψj |Aψj ∀A ∈ L(H)
j=1
ein Zustand definiert, wenn die |ψj (nicht notwendigerweise aufeinander
normal stehende) Zustandsvektoren (ψj |ψj = 1) sind. Zustände, die man
nicht in der Form ω(A) = ψ|Aψ schreiben kann, heißen gemischte
Zustände.
Man kann eine Standardform für die Beschreibung von Zuständen angeben. Da
ω(A) linear in A ist, muss sich ω(A) in der Form
ω(A) =
ρkl Alk
k,l
KAPITEL 3. EINFACHE QUANTENSYSTEME
46
schreiben lassen, wobei Alk = ϕl |Aϕk die Matrixelemente des Operators A
bezüglich einer beliebigen ONB {ϕ1 , . . . , ϕn } (n = dim H) sind. Die Koeffizikann man dann ebenfalls als die Matrixelemente eines Operators
enten ρkl ∈
ρ ∈ L(H) bezüglich der selben ONB auffassen (ρkl = ϕk |ρϕl ).
⇒
n n
ω(A) =
ϕk | ρϕl ϕl | Aϕk k=1 l=1
n
ϕk | ρAϕk = Tr(ρA),
=
k=1
wobei die Spur eines Operators B,
n
n
TrB =
ϕk | Bϕk =
Bkk
k=1
k=1
unabhängig von der gewählten Basis ist.
(Tr = trace = Spur).
Bis jetzt wurde nur die Linearität von ω verwendet. Die Eigenschaft
ω A† A ≥ 0 ∀ A ∈ L(H)
liefert eine weitere Einschränkung an den Operator ρ. Nimmt man für A nämlich
den eindimensionalen Projektor A = |ϕϕ| (wobei |ϕ ein beliebiger Einheitsvektor ist), so erhält man wegen A† A = A
ϕ | ρϕ ≥ 0.
Ergänzt man nämlich |ϕ zu einer ONB {|ϕ, |ϕ2, . . . , |ϕn } von H, so ergibt sich
n
ϕk | ρϕ ϕ | ϕk Tr ρA A = Tr (ρA) = ϕ | ρϕ ϕ | ϕ +
†
1
k=2
0
= ϕ | ρϕ ≥ 0
und daher mit |ψ = c|ϕ (c ∈
) die Aussage
ψ | ρψ ≥ 0 ∀ ψ ∈ H.
Einen Operator mit dieser Eigenschaft nennt man nicht negativ (ρ ≥ 0). Man
kann zeigen, dass die folgenden Aussagen äquivalent sind:
1. ψ | ρψ ≥ 0 ∀ ψ ∈ H.
2. ρ ist hermitesch und alle Eigenwerte sind ≥ 0.
3.1. GRUNDPOSTULATE DER QUANTENTHEORIE
47
3. Es gibt einen Operator A ∈ L(H), sodass ρ = A† A.
Beweis:
1 ⇒ 2 : Es seien ψk und ψl zwei aufeinander orthogonal stehende Einheitsvektoren. Dann ist laut Vorraussetzung
ψk + ψl |ρ(ψk + ψl ) = ρkk + ρll +ρkl + ρlk ≥ 0
≥0
⇒
Im(ρkl + ρlk ) = 0,
≥0
ψk + iψl |ρ(ψk + iψl ) = ρkk + ρll +iρkl − iρlk ≥ 0
≥0
⇒
⇒
Re(ρkl − ρlk ) = 0,
≥0
ρkl = ρ∗lk
⇒
ρ = ρ† .
Ist nun χk = 0 ein Eigenvektor von ρ zum Eigenwert ρk , so ist
χk |ρχk = χk |ρk χk = ρk χk |χk ≥ 0
⇒
ρk ≥ 0.
>0
2 ⇒ 3 : Laut Voraussetzung gibt es eine ONB {χ1 , . . . , χn } von Eigenvektoren
von ρ mit Eigenwerten ρk ≥ 0. In der Spektraldarstellung hat ρ die Gestalt
ρ=
n
ρk |χk χk |
k=1
Man kann hier problemlos den hermiteschen (und ebenfalls nicht negativen) Operator
n
√
√
ρ=
ρk |χk χk |
k=1
√ √
√ √
bilden und erhält ρ = ρ ρ = ( ρ)† ρ.
3 ⇒ 1 : ψ|ρ|ψ = ψ|A† Aψ = Aψ|Aψ ≥ 0.
Die Implikationskette 1 ⇒ 2 ⇒ 3 ⇒ 1 ist somit geschlossen und die Äquivalenz
von 1,2,3 gezeigt. Jede dieser drei Eigenschaften kann daher zur Definition eines
nicht negativen Operators herangezogen werden.
Es gibt also eine ONB {χ1 , . . . , χn } von Eigenvektoren von ρ mit Eigenwerten
ρk ≥ 0. Schließlich impliziert die Normierungsbedingung
ω(1) = Trρ = 1
⇒
n
ρk = 1.
k=1
Der Dichteoperator
ρ=
n
k=1
ρk |χk χk | ,
ρk ≥ 0,
Trρ =
n
k=1
ρk = 1,
KAPITEL 3. EINFACHE QUANTENSYSTEME
48
liefert also mit ω(A) = Tr(ρA) ∀ A ∈ L(H) die gewünschte Standardform für
die Darstellung des Zustands ω. Man kann sich also einen beliebigen Zustand
ω als statistisches Gemisch von reinen Zuständen (repräsentiert durch die
Zustandsvektoren |χk ) vorstellen, wobei |χk mit der Wahrscheinlichkeit ρk auftritt. Ein reiner Zustand ist dadurch charakterisiert, dass alle ρk bis auf eines
verschwinden. Der Dichteoperator, der dem Zustandsvektor |ψ entspricht, ist
ρψ = |ψψ|, also ein eindimensionaler Projektor (ρ†ψ = ρψ , ρ2ψ = ρψ ). Die Eigenschaft ρ2 = ρ charakterisiert jene Dichteoperatoren, die reinen Zuständen
entsprechen, denn in diesem Fall kann
n ρ nur die Eigenwerte 0, 1 besitzen und
wegen der Normierungsbedingung
k=1 ρk = 1 kann der Eigenwert 1 nur ein
einziges Mal auftreten ⇒ ρ = |ψψ|.
Für den Erwartungswert eines Operators A in einem beliebigen (gemischten)
Zustand ergibt sich
ω(A) = Tr(ρA) =
n
χk | ρAχk =
k=1
n
ρk χk | Aχk .
k=1
Hat A die Spektraldarstellung
A=
m
aα Pα ,
α=1
so erhält man
ω(A) =
n m
k=1 α=1
ρk χk | Pα χk aα .
pkα
Es treten hier sowohl die quantenmechanischen“ Wahrscheinlichkeiten pkα als
”
auch die klassischen“ statistischen Wahrscheinlichkeiten ρk auf. pkα ist die Wahr”
scheinlichkeit bei einer Messung der Observablen A in dem durch den Zustandsvektor |χk beschriebenen reinen Zustand den Messwert aα zu erhalten. Dagegen
ist ρk die Wahrscheinlichkeit in dem gemischten Zustand ω den durch |χk beschriebenen reinen Zustand vorzufinden. Die Wahrscheinlichkeit bei einer Messung von A im Zustand ω den Messwert aα zu erhalten, ist daher
ω (Pα ) =
n
ρk χk | Pα χk =
k=1
n
ρk pkα .
k=1
Ist ωψ ein reiner Zustand (mit Dichteoperator ρψ = |ψψ|), so vereinfachen sich
die Formeln:
ωψ (A) = ψ | Aψ =
m
α=1
ωψ (Pα ) = ψ | Pα ψ.
ψ | Pα ψaα ,
3.2. SPIN 1/2 SYSTEM
49
Verwendet man die Spektraldarstellung
Pα =
dα
|α, rα, r|
r=1
des Projektors auf den Eigenraum Mα , so kann man auch schreiben:
ωψ (Pα ) =
dα
ψ | α, rα, r | ψ =
dα
r=1
|α, r | ψ|2 .
r=1
Ist dα = 1, so hat man einfach ωψ (Pα ) = |α|ψ|2.
Beispiele für Dichteoperatoren gemischter Zustände:
1. Sei dim H = n, dann beschreibt der Dichteoperator ρ = 1/n den Zustand
mit maximaler Mischung.
2. Jener hermitesche Operator, welcher der Observablen Gesamtenergie des
”
Systems“ entspricht, wird als Hamiltonoperator H bezeichnet. Befindet
sich das betrachtete System im thermischen Gleichgewicht mit einem
Wärmebad“ der absoluten Temperatur T , so wird der entsprechende
”
Zustand des Systems durch den Dichteoperator
ρ=
e−H/kT
Tre−H/kT
beschrieben, wobei k 1.38 × 10−23 JK−1 die Boltzmann-Konstante ist.
Ist {|ϕ1 , . . . , |ϕn } eine ONB von Eigenvektoren von H,
H|ϕk = Ek |ϕk ,
ϕk |ϕl = δkl ,
n
|ϕk ϕk | = 1,
k=1
so ist die Spektraldarstellung des Dichteoperators durch
ρ=
n
e−El /kT
l=1
Z
|ϕl ϕl | ,
Z=
n
e−El /kT
l=1
gegeben.
3.2
Spin 1/2 System
Die doch einigermaßen abstrakten allgemeinen Spielregeln der Quantentheorie
sollen nun durch ihre Anwendung auf ein möglichst einfaches quantenmechanisches System mit etwas mehr Leben erfüllt werden.
KAPITEL 3. EINFACHE QUANTENSYSTEME
50
Sieht man von den Translationsfreiheitsgraden eines Elektrons (oder eines beliebigen anderen Spin 1/2 Teilchens) ab, so werden seine Spinfreiheitsgrade durch
einen zweidimensionalen Zustandsraum beschrieben. Da ein zweidimensionaler
unitärer Vektorraum isomorph zu U 2 ist, kann man die Zustandsvektoren durch
komplexe zweidimensionale Spaltenvektoren darstellen, die Observablenalgebra
ist dann nichts anderes als die Menge der komplexen 2 × 2-Matrizen. Den drei
entsprechen
räumlichen Komponenten S1 , S2 , S3 des Spindrehimpulsvektors S
die hermiteschen Matrizen
Sk =
h̄
σk
2
(1 ≤ k ≤ 3)
mit den bereits früher besprochenen Paulischen Spinmatrizen σk . Die Komponenten des Spinvektors in einer beliebigen räumlichen Richtung n (|n| = 1)
wird durch die Matrix
h̄
h̄ h̄
nk σk =
n · σ =
2
2 k=1
2
3
n1 − in2
n3
n1 + in2
−n3
beschrieben. Die Eigenwerte dieser Matrix sind ±h̄/2, d.h. bei der Messung einer
Spinkomponente in einer beliebigen räumlichen Richtung kann als Messwert nur
entweder +h̄/2 oder −h̄/2 auftreten (daher Spin 1/2“ ).
”
Die Matrix
h̄/2
0
S3 =
0 −h̄/2
besitzt die ONB von Eigenvektoren
1
χ↑ =
,
0
wobei
S3 χ↑ =
h̄
χ↑ ,
2
Dagegen besitzt
S1 =
χ↓ =
0
1
,
h̄
S3 χ↓ = − χ↓ .
2
0 h̄/2
h̄/2 0
die ONB von Eigenvektoren
1
ϕ↑ = √
2
mit
S1 ϕ ↑ =
1
1
,
h̄
ϕ↑ ,
2
1
ϕ↓ = √
2
1
−1
h̄
S1 ϕ ↓ = − ϕ ↓ .
2
,
3.2. SPIN 1/2 SYSTEM
51
Nehmen wir nun an, dass sich das System in dem durch den Zustandsvektor χ↑
beschriebenen reinen Zustand ω befindet (d.h. ω(A) = χ†↑ Aχ↑ , A ∈ L(U 2 )). Die
Wahrscheinlichkeit bei einer Messung der Spinkomponente S3 in diesem Zustand
den Messwert +h̄/2 zu erhalten, ist durch den Erwartungswert des Projektionsoperators χ↑ χ†↑ gegeben:
ω χ↑ χ†↑ = χ†↑ χ↑ χ†↑ χ↑ = 1.
1
1
Das heißt, bei einer Messung von S3 erhält man in diesem Zustand immer den
Messwert +h̄/2. Dementsprechend ist die Wahrscheinlichkeit in diesem Zustand
für S3 den Messwert −h̄/2 zu erhalten gleich null:
†
ω χ↓ χ↓ = χ†↑ χ↓ χ†↓ χ↑ = 0.
0
0
Der Erwartungswert von S3 ist in diesem Zustand dann natürlich durch
h̄
2
gegeben. Misst man dagegen in dem selben Zustand die Spinkomponente S1 , so
erhält man für die Erwartungswerte der Projektoren ϕ↑ ϕ†↑ , ϕ↓ ϕ†↓
1
†
ω ϕ↑ ϕ↑ = χ†↑ ϕ↑ ϕ†↑ χ↑ = ,
2
ω(S3 ) = χ†↑ S3 χ↑ =
√1
2
ω
ϕ↓ ϕ†↓
1
√
2
1
= χ†↑ ϕ↓ ϕ†↓ χ↑ = ,
2
√1
2
1
√
2
was bedeutet, dass man bei einer Messung von S1 in der Hälfte der Fälle den
Messwert +h̄/2 und in der anderen Hälfte den Messwert −h̄/2 erhalten wird.
Der Erwartungswert von S1 muss in dem betrachteten Zustand dann klarerweise
verschwinden:
ω(S1 ) = χ†↑ S1 χ↑ = 0
Wir wollen noch kurz den allgemeinen Fall der Messung der Spinkomponente
= h̄ n · σ ,
n · S
2
|n| = 1
besprechen. Man kann den räumlichen Einheitsvektor n in der Form
⎛
⎞ ⎛
⎞
n1
sin θ cos φ
⎝ n2 ⎠ = ⎝ sin θ sin φ ⎠
n3
cos θ
KAPITEL 3. EINFACHE QUANTENSYSTEME
52
parametrisieren. Für den Projektor P↑ auf den (eindimensionalen) Eigenraum
zum Eigenwert +1 von n · σ erhält man
1 1 + cos θ sin θ e−iφ
1 + n · σ
P↑ =
=
sin θ eiφ 1 − cos θ
2
2
und für den Projektor P↓ auf den Eigenraum zum Eigenwert −1 von n · σ
1
1 − n · σ
1 − cos θ − sin θ e−iφ
=
P↓ =
.
2
2 − sin θ eiφ 1 + cos θ
Nehmen wir wieder an, dass sich unser System in dem durch den Zustandsvektor
1
χ↑ =
0
beschriebenen reinen Zustand ω befindet, so ist
ω (P↑ ) =
θ
1 + cos θ
= cos2 ,
2
2
ω (P↓ ) =
θ
1 − cos θ
= sin2 .
2
2
Für den speziellen Wert θ = π/2 ergeben sich die früher erhaltenen Resultate.
Für den durch die Dichtematrix ρ = 1/2 beschriebenen maximal gemischten
Zustand (entspricht z.B. einem Strahl unpolarisierter Teilchen) erhält man die
Erwartungswerte
1
Tr(ρA) = TrA.
2
Somit verschwinden in diesem Fall die Erwartungswerte von S1 , S2 , S3 , dagegen
2
erhält man wegen Si2 = h̄4 1
h̄2
2
Tr(ρSi ) = .
4
Befindet sich ein Spin 1/2-System mit magnetischem Moment
μ = μσ
so ist der Hamiltonoperator
in einem äußeren Magnetfeld B,
H = −μ · B.
Legt man die 3-Achse des räumlichen Koordinatensystems in Richtung des Ma = Be3 ), so ist
gnetfeldes (B
−μB
0
H = −μBσ3 =
0
+μB
3.2. SPIN 1/2 SYSTEM
53
diagonal mit Energieeigenwerten E↑ = −μB, E↓ = +μB und dazugehörigen
(normierten) Eigenvektoren
1
0
χ↑ =
, χ↓ =
.
0
1
Befindet sich dieses magnetische Moment nun im Kontakt mit einem Wärmebad
der Temperatur T , so ist seine Dichtematrix
μB/kT
1
1 −H/kT
0
e
,
=
ρ= e
0
e−μB/kT
Z
Z
wobei
μB
.
kT
Die Erwartungswerte vo μ1 und μ2 (bzw. auch S1 und S2 ) verschwinden in diesem
Zustand, dagegen erhält man für den Erwartungswert von μ3 den Ausdruck
Z = Tre−H/kT = eμB/kT + e−μB/kT = 2 cosh
Tr(ρμ3 ) = μ tanh
μB
,
kT
der in der Theorie des Paramagnetismus eine Rolle spielt.
54
KAPITEL 3. EINFACHE QUANTENSYSTEME
Kapitel 4
Tensorprodukte von
Vektorräumen
Tensorprodukte und Tensoren sind Standardkonstruktionen der linearen Algebra.
Sie treten in praktisch allen Gebieten der Physik auf. Erwähnt seien hier nur
der Trägheitstensor in der klassischen Mechanik, der metrische Tensor in der
Relativitätstheorie, der Feldstärketensor in der Elektrodynamik sowie das Tensorprodukt von Zustandsräumen zur Beschreibung zusammengesetzter Systeme
in der Quantenmechanik.
4.1
Tensorprodukte
V (1) , . . . , V (r) seien r (i.A. verschiedene) Vektorräume über einem Grundkörper
K ( oder ). Unter dem Tensorprodukt
V (1) ⊗ . . . ⊗ V (r)
dieser Vektorräume versteht man die Menge aller multilinearen Funktionale
(1) × . . . × V
(r) → K
T :V
(1) , . . . , V
(r) .
auf dem kartesischen Produkt der Dualräume V
Definiert man in V (1) ⊗ . . . ⊗ V (r) eine Addition und eine Multiplikation mit
Skalaren durch
(a1 T1 + a2 T2 )(
v (1) , . . . , v (r) ) = a1 T1 (
v (1) , . . . , v (r) ) + a2 T2 (
v (1) , . . . , v (r) ),
(k) ,
a1,2 ∈ K, T1,2 ∈ V (1) ⊗ . . . ⊗ V (r) , v (k) ∈ V
so bildet V (1) ⊗ . . . ⊗ V (r) seinerseits einen Vektorraum.
55
KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN
56
Das Tensorprodukt
v (1) ⊗ . . . ⊗ v (r) ∈ V (1) ⊗ . . . ⊗ V (r)
der Vektoren v (1) , . . . , v (r) (v (k) ∈ V (k) ) wird durch
(1)
(1)
v (r) = v ,...,
v (1) v (1) . . . v(r) v (r)
v ⊗ . . . ⊗ v (r) definiert.
Sind in den Vektorräumen V (1) , . . . , V (r) Basissysteme
(k)
(k)
{e1 , . . . , edimV (k) },
1 ≤ k ≤ r,
gegeben, dann bilden die Elemente
(1)
(r)
{ei1 ⊗ . . . ⊗ eir },
1 ≤ ik ≤ dim V (k) ,
1 ≤ k ≤ r,
eine Basis von V (1) ⊗ . . . ⊗ V (r) . Somit gilt:
dim V
(1)
⊗ ...⊗V
(r)
r
dim V (k) .
=
k=1
Jedes Element von V (1) ⊗ . . . ⊗ V (r) lässt sich daher in der Form
(1)
(r)
ei1 ⊗ . . . ⊗ eir Ti1 ...ir
T =
i1 ,...ir
schreiben. T bezeichnet man als Tensor r-ter Stufe mit Komponenten Ti1 ...ir
bezüglich der gewählten Basis. Das Transformationsverhalten der Tensorkomponenten bei einem Basiswechsel ist damit offensichtlich.
Sind r lineare Abbildungen
A(k) : V (k) → V (k) ,
1 ≤ k ≤ r,
gegeben, dann definiert man die lineare Abbildung
A(1) ⊗ . . . ⊗ A(r) : V (1) ⊗ . . . ⊗ V (r) → V (1) ⊗ . . . ⊗ V (r)
durch
A(1) ⊗ . . . ⊗ A(r) v (1) ⊗ . . . ⊗ v (r) = A(1) v (1) ⊗ . . . ⊗ A(r) v (r) .
Die Erweiterung auf beliebige Tensoren (d.h. solche, die sich nicht in Produktform
schreiben lassen) erfolgt durch die Linearitätsforderung.
Bemerkung: Für die hier durchgeführten Konstruktionen müssen die Vektorräume V (1) , . . . , V (r) nicht mit Skalarprodukten versehen sein.
4.2. TENSOREN IN REELLEN VEKTORRÄUMEN
4.2
57
Tensoren in reellen Vektorräumen
Wir betrachten nun den in der Physik häufig anzutreffenden Fall eines einzigen
n-dimensionalen Vektorraums V über dem Grundkörper K = . In V sei eine
Basis
{e1 , . . . , en }
schreiben wir als
gegeben. Die dazugehörige duale Basis V
{e1 , . . . , en },
ei (ej ) = δji .
Für die Zerlegung eines Vektors v ∈ V bezüglich der gewählten Basis schreiben
wir
v = ei v i , v i ∈ ,
wobei wir hier die Einsteinsche Summenkonvention verwenden, nach der
über doppelt vorkommende Indizes summiert wird, d.h.
v = ei v ≡
i
n
ei v i .
i=1
bezüglich der dualen
Analog schreibt man die Zerlegung eines Elements l ∈ V
Basis in der Form
l = ei li .
Für den Raum1
⊗ ...⊗V
V pq = V
. . ⊗ V ⊗ V
⊗ .
p−mal
q−mal
kann man durch
{ei1 ⊗ . . . ⊗ eip ⊗ ej1 ⊗ . . . ⊗ ejq },
1 ≤ ik , jk ≤ n,
eine Basis konstruieren. Ein Element T ∈ V p q hat dann bezüglich dieser Basis
die Zerlegung
T = ei1 ⊗ . . . ⊗ eip ⊗ ej1 ⊗ . . . ⊗ ejq T i1 ...ip j1 ...jq ,
wobei
T i1 ...ip j1 ...jq = T (ei1 , . . . , eip , ej1 , . . . , ejq ).
Man bezeichnet T als p-fach kontravarianten und q-fach kovarianten Tensor der
Stufe p + q, oder kurz als Tensor vom Typ (p, q). In dieser Sprechweise sind die
Elemente v = ei v i des Vektorraums V Tensoren vom Typ (1, 0), die Elemente
1
= V.
Beachten Sie die Identifizierung V
KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN
58
Tensoren vom Typ (0, 1) und Skalare Tensoren vom
l = ei li des Dualraums V
Typ (0, 0).
Ein Basiswechsel in V,
ek = Sēk = ēi S ik ⇔ el = (S −1 )lj ēj ,
wird durch eine invertierbare Abbildung S ∈ L(V) bewerkstelligt. Bezeichnet
i1 ...ip
man die Komponenten des Tensors T bezüglich der neuen Basis mit T
j1 ...jq ,
so erhält man das Transformationsgesetz
T
i1 ...ip
l
j1 ...jq
= S i1k1 . . . S ipkp T k1 ...kp l1 ...lq (S −1 ) 1j1 . . . (S −1 )
lq
jq .
Bemerkung: In der saloppen Sprechweise der Physik werden die Komponenten
T i1 ...ip j1 ...jq eines Tensors oft als Tensor“ bezeichnet, wobei man ihn durch sein
”
Transformationsverhalten bei einem Basiswechsel charakterisiert.
4.3
Metrischer Tensor
Im Raum der Tensoren vom Typ (0, 2) bilden die symmetrischen Elemente,
g(v1 , v2 ) = g(v2 , v1 ),
v1,2 ∈ V,
einen Teilraum. Bezüglich einer Basis hat ein solcher Tensor die Gestalt
g = ei ⊗ ej gij ,
gij = gji.
Bei einem Basiswechsel transformieren die Tensorkomponenten gemäß
g ij = gkl (S −1 ) i (S −1 ) j
k
l
⇔
S ik g ij S jl = gkl .
Man kann daher stets eine Basis finden, sodass
!
σi
für i = j
, σi ∈ {−1, 0, 1}.
gij =
0
für i = j
Ist zusätzlich σi = 0 ∀ i = 1, . . . , n erfüllt, nennt man g nichtsingulär. g ist
dann ein sogenannter metrischer Tensor. In diesem Fall folgt aus g(v, w) = 0
∀ w ∈ V, dass v = 0 sein muss. Durch
v(w) = g(v, w),
v ∈ V fest, w ∈ V
zuordnen. Als Folge
kann man jedem Vektor v ∈ V ein lineares Funktional v∈V
der Nichtsingularität von g ist diese Zuordnung injektiv und wegen dimV = dimV
4.3. METRISCHER TENSOR
59
auch surjektiv. Bei Vorliegen eines metrischen Tensors kann somit der Vektorraum
auf basisunabhängige Weise identifiziert werden.
V mit seinem Dualraum V
Ist eine Basis {e1 , . . . , en } von V gegeben, dann besteht wegen
ei (v) = g(ei , v) = g(ei , ej v j ) = gij v j = gij ej (v) ∀ v ∈ V
die Beziehung
ei = gij ej .
Ist ein Vektor v = ei v i ∈ V gegeben, dann bezeichnen wir die Komponenten von
v bezüglich der dualen Basis {e1 , . . . , en } mit vi (untere Indizes):
v = ei vi .
Da andererseits
v = ei gij v j ,
besteht zwischen den Komponenten mit unteren und oberen Indizes die Beziehung
vi = gij v j .
Man kann daher schreiben:
v(w) = w(v)
= g(v, w) = g(ei v i , ej w j ) = v i gij w j = v i wi = w i vi ,
v, w ∈ V.
Bemerkung: Für einen metrischen Tensors g ist die Abbildung
(v, w) ∈ V × V → g(v, w)
zwar bilinear und symmetrisch, aus der Nichtsingularität von g folgt aber nicht
notwendigerweise, dass g(v, v) ≥ 0 ist, oder dass g(v, v) = 0 auch v = 0 impliziert.
Ein metrischer Tensor definiert also im Allgemeinen kein Skalarprodukt im Sinne
eines euklidischen Vektorraumes. Ist allerdings (bezüglich der oben besprochenen
Basis) σi = σ ∀ i = 1, . . . , n, dann wird durch (v|w) = σg(v, w) ein positiv
definites Skalarprodukt definiert.
Beispiele:
n
einen metrischen Tensor g durch
!
1
für i = j
, 1 ≤ i, j ≤ n,
g(ei, ej ) = gij =
0
für i = j
1. Definiert man im
bezüglich der Standardbasis {e1 , . . . , en }, dann ist durch
(x|y) = g(x, y),
x, y ∈
n
,
60
KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN
das übliche Skalarprodukt des E n definiert. Eine orthogonale Transformation O ist durch die Eigenschaft
g(Ox, Oy) = g(x, y),
∀ x, y
charakterisiert. Beschränkt man sich bei einem Basiswechsel auf orthogonale Transformationen, dann ändern sich die Komponenten gij des metrischen
Tensors nicht.
ist ein vierdimensionaler reeller Vektorraum mit
2. Der Minkowskiraum
einem metrischen Tensor g, dessen Komponenten bezüglich einer Basis
{e0 , e1 , e2 , e3 } die Diagonalgestalt
g00 = 1, g11 = −1, g22 = −1, g33 = −1
besitzen. Dieser Raum spielt in der speziellen Relativitätstheorie eine
zentrale Rolle. Ein zu einem bestimmten Zeitpunkt t an einem Ort
mit den kartesischen Koordinaten x1 , x2 , x3 stattfindendes Ereignis wird
durch Element des Minkowskiraumes (einen sogenannten Raum-ZeitVierervektor),
x = eμ xμ ,
beschrieben, wobei x0 = ct ist (c ist die Lichtgeschwindigkeit). Der Ausdruck
g(x, y) = xμ gμν y ν = xμ yμ = x · y
ist das Viererskalarprodukt der beiden Vierervektoren x, y. Unter dem
Viererabstand des Ereignisses x vom Ereignis 0 (Ursprung des Minkowskiraumes) versteht man den Ausdruck
g(x, x) = xμ gμν xν = x · x = c2 t2 − x · x.
Ist g(x, x) > 0 (x ist ein zeitartiger Vierervektor), dann ist eine kausale Verknüpfung des Ereignisses x mit dem Ereignis 0 durch Signale mit
Unterlichtgeschwindigkeit möglich. Ist g(x, x) = 0 (x ist ein lichtartiger
Vierervektor), dann ist diese Verbindung nur durch Lichtsignale möglich.
Für g(x, x) < 0 (x ist ein raumartiger Vierervektor) besteht keine kausale
Verknüpfung zwischen den Ereignissen x und 0.
Eine Lorentztransformation L ∈ L( ) ist dadurch charakterisiert, dass
sie die Eigenschaft
g(Lx, Ly) = g(x, y) ∀ x, y ∈
erfüllt. Die Menge der Lorentztransformationen bildet eine Gruppe, die Lorentzgruppe L. Wichtig ist die Untergruppe
L↑+ = {L ∈ L| detL = +1, L0 0 ≥ 1}
4.4. LEVI-CIVITÀ-TENSOR
61
der eigentlichen orthochronen Lorentztransformationen. Wird eine Basistransformation mit Hilfe eines Elements L ∈ L↑+ durchgeführt, dann entspricht dies dem Wechsel vom ursprünglichen Bezugssystem in ein anderes
Inertialsystem.
4.4
Levi-Cività-Tensor
Wir betrachten einen n-dimensionalen reellen Vektorraum V. Die total antisymmetrischen Tensoren vom Typ (0, n),
T v (1) , . . . , v (i) , . . . , v (j) , . . . , v (n) = −T v (1) , . . . , v (j) , . . . , v (i) , . . . , v (n) ,
bilden einen Teilraum von V 0n . Normiert man für V =
trischen Tensor durch
(e1 , . . . , en ) = 1,
n
den total antisymme-
dann ist dieser Tensor natürlich nichts anderes als die Determinante, ≡ det.
Bezüglich der Standardbasis des n sind die Komponenten des -Tensors (oder
Levi-Cività-Tensors) daher durch
⎧
⎪
⎨ 1 i1 , . . . , in gerade Permutation von 1, . . . , n
i1 ...in = (ei1 , . . . , ein ) = −1 i1 , . . . , in unger. Permutation von 1, . . . , n
⎪
⎩
0 sonst
gegeben.
Wegen det(AB) = det A det B verhalten sich die Komponenten des Levi-CivitàTensors bei einem Basiswechsel ei = Sēi gemäß der Transformationsformel
i1 ...in = (ei1 , . . . , ein )
= (Sēi1 , . . . , Sēin ) = det S (ēi1 , . . . , ēin )
= det S i1 ...in .
Geschieht der Basiswechsel durch eine unimodulare Transformation S (das ist
eine Abbildung mit det S = 1), dann ändern sich die Komponenten des -Tensors
demnach nicht.
Im Fall n = 2 ist
(x, y) = (ei xi , ej y j ) = ij xi y j = x1 y 2 − x2 y 1
nichts anderes als der orientierte Flächeninhalt des von den Vektoren x, y
aufgespannten Parallelogramms.
KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN
62
Für n = 3 ist
(x, y, z) = (ei xi , ej y j , ek z k ) = ijk xi y j z k
das orientierte Volumen des von den Vektoren x, y, z aufgespannten Parallelepipeds.
Allgemein ist im n durch v (1) , . . . , v (n) das orientierte Volumen des von den
Vektoren v (1) , . . . , v (n) ∈ n aufgespannten n-dimensionalen Gebiets
&
n
'
λi v | 0 ≤ λi ≤ 1
(i)
i=1
gegeben.
4.5
Tensoren im dreidimensionalen Raum
Beschränkt man sich im dreidimensionalen euklidischen Raum auf Basistransformationen S ∈ SO(3), so wird eine rechtshändige orthonormierte Standardbasis
{e1 , e2 , e3 } wieder in eine gleich orientierte Orthonormalbasis übergeführt. In diesem Fall ändern sich die Komponenten des metrischen Tensors gij = δij bei einem
Basiswechsel nicht und es kann auf die Unterscheidung oberer und unterer Indizes
verzichtet werden. Man schreibt dann einfach (unter Verwendung der Summenkonvention) x = ei xi für Vektoren und x · y = xi yi für das Skalarprodukt von
x, y .
Wegen der Unimodularität von SO(3)-Matrizen ändern sich auch die Komponenten des dreidimensionalen -Tensors,
⎧
⎪
⎨ 1 falls i, j, k gerade Permutation von 1, 2, 3
ijk = (ei , ej , ek ) = −1 falls i, j, j unger. Permutation von 1, 2, 3
⎪
⎩
0 sonst
bei einer derartigen Basistransformation nicht.
Das Vektorprodukt (Kreuzprodukt, äußeres Produkt) c = a × b steht normal
auf die von a und b aufgespannte Fläche, seine Richtung ist durch die Rechtsschraubenregel (Rechte-Hand-Regel) festgelegt. Die Länge ist gleich der Fläche
des von a und b aufgespannten Parallelogramms = |a||b|| sin α|. Das Kreuzprodukt a × b ist bilinear und antisymmetrisch (a × b = −b × a).
Die Wirkung des Vektorprodukts auf die Vektoren einer rechtshändigen Orthonormalbasis,
e1 × e2 = e3 , e2 × e3 = e1 , e3 × e1 = e2 ,
4.6. TENSORPRODUKT VON ZUSTANDSRÄUMEN
63
lässt sich mit Hilfe des -Tensors in kompakter Form ausdrücken:
ei × ej = ijkek .
Sind a = ei ai und b = ei bi bezüglich der Orthonormalbasis e1 , e2 , e3 gegeben, so
folgt aus der Bilinearität des Kreuzprodukts und der obigen Formel:
a × b = ej aj × ek bk = ej × ek aj bk = ei jki aj bk = ei ijk aj bk .
Das heißt, die i-te Komponente von a × b ist gegeben durch:
(a × b)i = ijk aj bk .
Das Spatprodukt
a · (b × c ) = ai ijk bj ck = ijk ai bj ck = (a, b, c )
ergibt das orientierte Volumen des von den Vektoren a, b, c aufgespannten Parallelepipeds (positives Vorzeichen falls a, b, c Rechtsystem, negatives Vorzeichen
für Linkssystem).
Aufgabe: Beweisen Sie die oft benötigten Relationen
ijk ilm = δjl δkm − δjm δkl ,
imn jmn = 2δij .
Hinweis: Beweis der ersten Formel entweder durch Ausprobieren aller Möglichkeiten oder durch Verwendung von ijk = det(ei , ej , ek ) und den bekannten Rechenregeln für Determinanten (det AT = det A, det(AB) = det A det B). Die zweite
Formel (mit zwei überschobenen Indizes) folgt dann aus der ersten.
Zeigen Sie damit:
a × (b × c ) = b(a · c ) − c(a · b),
4.6
= (a · c )(b · d)
− (b · c )(a · d).
(a × b) · (c × d)
Tensorprodukt von Zustandsräumen
Wird ein Teil A eines Quantensystems durch den Zustandsraum H(A) und ein
Teil B durch den Zustandsraum H(B) beschrieben, dann ist das Tensorprodukt
H(A) ⊗ H(B)
der geeignete Zustandsraum für das Gesamtsystem A ∪ B. Wir wollen der Einfachheit halber wieder annehmen, dass H(A) und H(B) endlichdimensionale
unitäre Vektorräume mit Skalarprodukten
(A) (A) ϕ ψ
, ϕ(A) , ψ (A) ∈ H(A) , ϕ(B) |ψ (B) H(B) , ϕ(B) , ψ (B) ∈ H(B)
H(A)
KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN
64
sind. Das Skalarprodukt in H(A) ⊗ H(B) wird durch
(A)
ϕ ⊗ ϕ(B) ψ (A) ⊗ ψ (B) H(A) ⊗H(B) = ϕ(A) ψ (A) H(A) ϕ(B) ψ (B) H(B)
zusammen mit der Linearitätsforderung erklärt.
Ist
{ϕ1 , . . . , ϕn },
ϕa ∈ H(A)
{χ1 , . . . , χν },
χα ∈ H(B)
eine ONB von H(A) und
eine ONB von H(B) , dann ist
{ϕa ⊗ χα }, 1 ≤ a ≤ n, 1 ≤ α ≤ ν
eine ONB von H(A) ⊗ H(B) . Ein Vektor Ψ ∈ H(A) ⊗ H(B) besitzt dann bezüglich
dieser ONB die Darstellung
Ψ=
n ν
ϕa ⊗ χα caα ,
ca,α = ϕa ⊗ χα |Ψ ∈
.
a=1 α=1
Besteht zwischen den beiden Teilen des Systems keine Wechselwirkung, dann
ist jener hermitesche Operator, welcher der Observablen Gesamtenergie des Sy”
stems“ entspricht von der Form
H = H (A) ⊗
+ ⊗ H (B)
(Hamiltonoperator des Gesamtsystems ohne Wechselwirkung), wobei die hermiteschen Operatoren
†
†
H (A) = H (A) ∈ L(H(A) ), H (B) = H (B) ∈ L(H(B) )
die Hamiltonoperatoren der Teilsysteme sind. Bei Vorhandensein einer Wechselwirkung zwischen den beiden Teilsystemen hat man
H = H (A) ⊗
+ ⊗ H (B) + W,
wobei der Wechselwirkungsterm W = W † ∈ L(H(A) ⊗ H(B) ) die Struktur
†
†
(Xr(A) ⊗ Yr(B) + Xr(A) ⊗ Yr(B) ), Xr(A) ∈ L(H(A) ), Yr(B) ∈ L(H(B) )
W =
r
besitzt.
4.6. TENSORPRODUKT VON ZUSTANDSRÄUMEN
65
Bemerkungen:
†
†
1. (X (A) ⊗ Y (B) )† = X (A) ⊗ Y (B) , X (A) ∈ L(H(A) ), Y (B) ∈ L(H(B) ).
2. In der physikalischen Literatur findet man oft die Schreibweise |a, α statt
ϕa ⊗ χα . Statt X (A) ⊗ und ⊗ Y (B) schreibt man kurz X (A) und Y (B)
wobei der Kommutator [X (A) , Y (B) ] = 0 ist. Wegen (X (A) ⊗ )( ⊗ Y (B) ) =
X (A) ⊗ Y (B) schreibt man dann einfach X (A) Y (B) statt X (A) ⊗ Y (B) .
Beispiel: Zwei Spins werden im Zustandsraum U 2 ⊗ U 2 beschrieben. Den räumlichen Komponenten von Spin A entsprechen die Operatoren
(A)
Sk
=
k = 1, 2, 3,
h̄
⊗ σk ,
2
k = 1, 2, 3.
h̄
σk ⊗ ,
2
jenen von Spin B die Operatoren
(B)
Sk
=
Der Operator für den Gesamtspinvektor des Systems ist durch
=S
(A) + S
(B) = h̄ (σ ⊗
S
2
+ ⊗ σ)
gegeben.
Wir wählen die Eigenvektoren von σ3 ,
1
,
χ↑ =
0
χ↓ =
0
1
,
als ONB von U 2 . Dann bilden die Tensorprodukte dieser Vektoren,
χ↑ ⊗ χ↑ , χ↑ ⊗ χ↓ , χ↓ ⊗ χ↑ , χ↓ ⊗ χ↓ ,
eine ONB von U 2 ⊗U 2 . Diese Elemente von U 2 ⊗U 2 sind natürlich auch gleichzeitig
(A)
(B)
Eigenvektoren von von S3 und S3 :
h̄
(A)
S3 (χ↑ ⊗ χ↑ ) = + χ↑ ⊗ χ↑ ,
2
h̄
(A)
S3 (χ↑ ⊗ χ↓ ) = + χ↑ ⊗ χ↓ ,
2
h̄
(A)
S3 (χ↓ ⊗ χ↑ ) = − χ↓ ⊗ χ↑ ,
2
h̄
(A)
S3 (χ↓ ⊗ χ↓ ) = − χ↓ ⊗ χ↓ ,
2
h̄
(B)
S3 (χ↑ ⊗ χ↑ ) = + χ↑ ⊗ χ↑ ,
2
h̄
(B)
S3 (χ↑ ⊗ χ↓ ) = − χ↑ ⊗ χ↓ ,
2
h̄
(B)
S3 (χ↓ ⊗ χ↑ ) = + χ↓ ⊗ χ↑ ,
2
h̄
(B)
S3 (χ↓ ⊗ χ↓ ) = − χ↓ ⊗ χ↓ .
2
66
KAPITEL 4. TENSORPRODUKTE VON VEKTORRÄUMEN
Wir betrachten nun das Quadrat des Gesamtspinvektors
3h̄2
2
S =
⊗
2
3
h̄2 +
σk ⊗ σk .
2 k=1
Unter Verwendung von
σ1 χ↑ = χ↓ , σ1 χ↓ = χ↑ , σ2 χ↑ = iχ↓ , σ2 χ↓ = −iχ↑
2 sind:
rechnet man leicht nach, dass χ↑ ⊗ χ↑ und χ↓ ⊗ χ↓ Eigenvektoren von S
2 (χ↑ ⊗ χ↑ ) = 2h̄2 χ↑ ⊗ χ↑ ,
S
2 (χ↓ ⊗ χ↓ ) = 2h̄2 χ↓ ⊗ χ↓ .
S
2 . Man erhält
Dagegen sind χ↑ ⊗ χ↓ und χ↓ ⊗ χ↑ keine Eigenvektoren von S
vielmehr
2 (χ↑ ⊗ χ↓ ) = h̄2 (χ↑ ⊗ χ↓ + χ↓ ⊗ χ↑ )
S
2 (χ↓ ⊗ χ↑ ) = h̄2 (χ↑ ⊗ χ↓ − χ↓ ⊗ χ↑ )
S
Allerdings bilden die Vektoren ψs,s3 ,
1
ψ0,0 = √ (χ↑ ⊗ χ↓ − χ↓ ⊗ χ↑ ),
2
ψ1,1 = χ↑ ⊗ χ↑ ,
1
ψ1,0 = √ (χ↑ ⊗ χ↓ + χ↓ ⊗ χ↑ ),
2
ψ1,−1 = χ↓ ⊗ χ↓ ,
(4.1)
2 und S3 :
eine ONB von Eigenvektoren von S
2 ψs,s3 = s(s + 1)h̄2 ψs,s3 ,
S
S3 ψs,s3 = s3h̄ψs,s3 .
Es gibt also einen Zustand mit Spin s = 0 (Singulett) und drei Zustände mit
Spin s = 1 (Triplett).
Kapitel 5
Gewöhnliche
Differentialgleichungen
5.1
Grundbegriffe
Unter einer gewöhnlichen Differentialgleichung versteht man einen Ausdruck,
der eine unabhängige Variable x und eine abhängige Variable y mit einer
gewissen Anzahl ihrer Ableitungen enthält:
F (x, y, y , . . . , y (n)) = 0,
n ≥ 1.
Unter der Ordnung der Differentialgleichung versteht man die Ordnung der
höchsten vorkommenden Ableitung. Eine Funktion y(x), welche in einem gewissen Bereich I x den vorgegeben Ausdruck identisch erfüllt, heißt Lösung der
Differentialgleichung.
Bemerkungen:
1. Handelt es sich bei der abhängigen Variablen um die Zeit t, so schreibt man
eine Differentialgleichung üblicherweise in der Form
F (t, x, ẋ, . . . , x(n) ) = 0,
n ≥ 1.
wobei x(t) gesucht ist.
2. Kommen wenigstens zwei unabhängige Variable vor, spricht man von einer
partiellen Differentialgleichung. Ein Beispiel wäre die Laplacegleichung
∂2u ∂2u
+
= 0,
∂x2 ∂y 2
bei der u(x, y) gesucht ist. Wir werden uns in diesem Kapitel nur mit
gewöhnlichen Differentialgleichungen beschäftigen.
67
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
68
3. Ein Gleichungssystem der Form
(n)
(n)
F1 (t, x1 , . . . xk , ẋ1 , . . . ẋk , . . . , x1 , . . . , xk ) = 0
... = ...
(n)
(n)
Fl (t, x1 , . . . xk , ẋ1 , . . . ẋk , . . . , x1 , . . . , xk ) = 0
bezeichnet man als System von l gewöhnlichen Differentialgleichungen nter Ordnung für die k abhängigen Variablen x1 , . . . , xk .
Beispiele:
1. Radioaktiver Zerfall: Zum Zeitpunkt t = 0 seien N0 Atome vorhanden.
Wieviele Atome N(t) sind zum Zeitpunkt t noch nicht zerfallen? Handelt
es sich um eine sehr große Anzahl von Atomen, dann kann man N(t) durch
eine kontinuierliche Funktion approximieren. Im Zeitintervall [t, t + Δt] hat
man
ΔN = N(t + Δt) − N(t) −λN(t)Δt
wobei λ > 0 eine für die betrachtete Substanz charakteristische Konstante
der Dimension (Zeit)−1 ist. Im Limes Δt → 0 erhält man die gewöhnliche
Differentialgleichung erster Ordnung
dN
= −λN
dt
Ihre allgemeine Lösung
N(t) = Ce−λt
enthält eine willkürliche Integrationskonstante C, deren Wert durch die
Anfangsbedingung N(0) = N0 festgelegt wird:
N(t) = N0 e−λt .
2. Newtonsche Bewegungsgleichung für ein Punktteilchen: Die Bewegung eines Teilchens mit Masse m wird in der (nichtrelativistischen) Mechanik durch die Bewegungsgleichung
mx¨ = F (t, x, x˙ )
beschrieben. Die Gestalt der auf das Teilchen wirkenden Kraft F (t, x, x˙ )
hängt von der gegebenen physikalischen Situation ab. Explizit angeschrieben hat man
mx¨1 = F1 (t, x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 ),
mx¨2 = F2 (t, x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 ),
mx¨3 = F3 (t, x1 , x2 , x3 , ẋ1 , ẋ2 , ẋ3 )
Es handelt sich also um eine System von drei gewöhnlichen Differentialgleichungen zweiter Ordnung.
5.1. GRUNDBEGRIFFE
69
3. Kräftefreie Bewegung: Im Fall F = 0 entkoppeln die drei Differentialgleichungen und es genügt, die Bewegungsgleichung für einen Freiheitsgrad
x zu untersuchen:
ẍ = 0.
Einmalige Integration liefert
ẋ(t) = C1 ,
und nochmaliges Integrieren ergibt die allgemeine Lösung
x(t) = C1 t + C2 .
Befindet sich das Teilchen zum Zeitpunkt t = 0 am Ort x(0) und besitzt die
Geschwindigkeit v (0) , so erhält man
x(0) = x(0) = C2
v (0) = v(0) = C1
und somit
x(t) = v (0) t + x(0) .
Für alle drei Freiheitsgrade bekommt man die allgemeine Lösung
x(t) = v (0) t + x (0) ,
das heißt, das Teilchen bewegt sich mit konstanter Geschwindigkeit v (0) .
4. Bewegung in konstantem Gravitationsfeld: Auch für F = −mge3
entkoppeln die drei Differentialgleichungen. Für x1 , x2 ergibt sich nichts
Neues, dagegen lautet die Differentialgleichung für x3 jetzt:
⇒
⇒
ẍ3 = −g
ẋ3 (t) = −gt + C1
gt2
+ C1 t + C2
x3 (t) = −
2
Wieder können die beiden Integrationskonstanten C1 , C2 der allgemeinen
(0)
(0)
Lösung durch die Anfangsbedingungen x3 (0) = x3 , ẋ3 (0) = v3 ausgedrückt werden:
(0)
(0)
C2 = x3 , C1 = v3
⇒
x3 (t) = −
gt2
(0)
(0)
+ v3 t + x3 .
2
Zusammen mit den Lösungen für die beiden anderen Freiheitsgrade x1 , x2 ,
erhält man als vollständige Lösung:
x(t) = −
gt2
e3 + v (0) t + x (0)
2
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
70
5.2
Richtungsfeld
Bei gewöhnlichen Differentialgleichungen erster Ordnung, die sich in der expliziten Form
y = f (x, y)
schreiben lassen, kann man sich durch die graphische Darstellung des Richtungsfeldes in der x − y-Ebene einen qualitativen Überblick über die Lösungskurven
der Differentialgleichung verschaffen. Durch y = f (x, y) wird nämlich jedem
Punkt (x, y) die Steigung der durch ihn gehenden Lösungskurve zugeordnet.
Dazu zeichnet man zunächst einige Kurven konstanter Steigung (sogenannte
Isoklinen)
f (x, y) = k = const.
in der x − y-Ebene. Längs der Isokline f (x, y) = k zeichnet man eine Anzahl von
kurzen Linienelementen mit Steigung k. Das führt man jetzt für alle eingezeichneten Isoklinen durch und erhält auf diese Weise ein Feld von Linienelementen,
das sogenannte Richtungsfeld der Differentialgleichung. Die Lösungen der Differentialgleichung sind nun jene Kurven, die in das Richtungsfeld hineinpassen“.
”
Beispiel: Zeichnen Sie das Richtungsfeld der Differentialgleichung y = −λy und
skizzieren Sie die Lösungskurven. Vergleichen Sie ihr Resultat mit der exakten
Lösung.
5.3
Trennung der Variablen
Lässt sich eine Differentialgleichung erster Ordnung in der Form
y =
f (x)
g(y)
schreiben, so erhält man ihre allgemeine Lösung durch Integration von
dy g(y) = dx f (x).
Das heißt
dy g(y) = dx f (x) +C,
G(y)
F (x)
wobei F die Stammfunktion von f und G eine Stammfunktion von g ist.
5.3. TRENNUNG DER VARIABLEN
71
Beispiele:
1. Die Lösungen der bereits früher besprochenen Differentialgleichung y =
−λy lassen sich auf diese Weise finden:
dy
= −λdx
y
⇒
|y| = ce−λx
⇒
⇒
ln |y| = −λx + ln c
y = ±ce−λx
⇒
y = Ce−λx .
2.
y = −2λxy
⇒
⇒
ln |y| = −λx2 + ln cx
⇒
y = ±ce−λx
2
⇒
dy
= −2λxdx
y
2
⇒ |y| = ce−λx
y = Ce−λx
2
3. Die eindimensionale Bewegung eines Körpers mit Masse m in einem konstanten Gravitationsfeld bei Berücksichtigung des Luftwiderstands wird
durch die Bewegungsgleichung
mẍ = mg − k|ẋ|ẋ,
k>0
beschrieben. Für die Geschwindigkeit v = ẋ erhält man daher eine Differentialgleichung erster Ordnung:
mv̇ = mg − k|v|v
Unabhängig von der Anfangsgeschwindigkeit nähert sich für t → ∞ die
Geschwindigkeit v(t) asymptotisch der Grenzgeschwindigkeit
(
mg
v∞ =
k
an. Die Rechnung wird übersichtlicher, wenn man statt der Geschwindigkeit
v die dimensionslose Variable u,
(
mg
u
v=
k
und statt der Zeit die dimensionslose Variable
(
gk
t
τ=
m
72
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
verwendet. In den neuen Variablen hat die Differentialgleichung die einfache
Form
du
= 1 − |u|u.
dτ
Aufgabe: Zeichnen Sie das Richtungsfeld dieser Differentialgleichung und
skizzieren Sie die Lösungskurven. Welche Fälle sind zu unterscheiden? Geben Sie eine physikalische Interpretation!
Wegen
du
= dτ
1 − |u|u
sind bei der Integration der Differentialgleichung die Fälle u > 1, u = 1
und u > 1 zu unterscheiden.
(a) Für u > 1 hat man
du
= dτ.
1 − u2
Wegen
1
1
=
1 − u2
2
erhält man
⇒
1
1
−
u+1 u−1
1 u+1
ln
=)τ − τ0
2 u−1
u(τ ) = coth(τ − τ0 ) für τ − τ0 > 0.
(b) Der Fall u = 1 entspricht der Bewegung mit konstanter Grenzgeschwindigkeit.
(c) Für u < 1 muss man die folgenden zwei Fälle unterscheiden:
&
1 + u2 für u < 0
1 − |u|u =
1 − u2 für 0 ≤ u < 1
Im ersten Fall (u < 0) ergibt die Integration
du
= arctan u = τ − τ0
1 + u2
und im zweiten Fall (0 ≤ u < 1)
*
)
1
1
1
du
+
=
1 − u2
2
u+1 u−1
1 1+u
1
[ln(1 + u) − ln(1 − u)] = ln
= τ − τ0
=
2
2 1−u
Somit erhält man die Lösung
&
für − π2 < τ − τ0 ≤ 0
tan(τ − τ0 )
u(τ ) =
tanh(τ − τ0 ) für τ − τ0 ≥ 0
5.3. TRENNUNG DER VARIABLEN
73
u(τ ) ist an der Anstückelungsstelle“ τ − τ0 stetig differenzierbar.
”
Man kann nun die Lösung der Bewegungsgleichung wieder durch die ursprünglichen Variablen t, v ausdrücken. Die Grenzgeschwindigkeit v∞ =
mg/k gestattet die Klassifizierung der drei Lösungstypen:
(a) Ist die Anfangsgeschwindigkeit größer als die Grenzgeschwindigkeit,
dann ist
(
(
mg
gk
v(t) =
coth
(t − t0 ) , t > t0 .
k
m
(b) v(t) = v∞ ist eine Lösung der Bewegungsgleichung.
(c) Ist die Anfangsgeschwindigkeit kleiner als die Grenzgeschwindigkeit,
dann ist
(
mg
&
π
mg
(t
−
t
)
,
−
< t − t0 ≤ 0
tan mg
0
k
2
k
×
v(t) =
mg
tanh
(t − t0 ) , t − t0 ≥ 0
k
k
Bemerkung: Differentialgleichungen vom Typ
y
y =g
x
können durch die Substitution u = y/x auf eine Form gebracht werden, in der
die Trennung der neuen Variablen x, u möglich ist:
⇒
y(x) = u(x)x ⇒ y = u + u x
dx
du
=
u + u x = g(u) ⇒
g(u) − u
x
Beispiel: Um die Lösung der Differentialgleichung
2xyy − y 2 + x2 = 0
zu finden, dividiert man zu nächst durch x2 ,
y 2
y
2 y −
+ 1 = 0.
x
x
Mit Hilfe der Substitution u = y/x erhält man
2u(u + u x) − u2 + 1 = 0
oder
2xuu + u2 + 1 = 0.
74
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Trennung der Variablen liefert
2udu
dx
=− .
2
u +1
x
Die Integration ergibt
ln(u2 + 1) = − ln |x| + k
y2
2c
2c
⇒ 2 +1=
⇒ u2 + 1 =
x
x
x
2
2
2
⇒ x + y = 2cx ⇒ (x − c) + y 2 = c2
5.4
Exakte Differentialgleichungen
In der x − y-Ebene seien Kurvenscharen durch die implizite Gleichung
Φ(x, y) = C
gegeben. Wenn wir annehmen, dass Φ in einem gewissen Bereich stetig differenzierbar ist, dann erfüllen diese Kurven die Differentialgleichung
dΦ =
∂Φ
∂Φ
dx +
dy = 0
∂x
∂y
oder
∂Φ ∂Φ +
y = 0.
∂x
∂y
Ist Φ zwei mal stetig differenzierbar, dann gilt
∂ ∂Φ
∂ ∂Φ
=
.
∂y ∂x
∂x ∂y
Wenn nun umgekehrt eine Differentialgleichung der Form
⇔
P (x, y) + Q(x, y)y = 0
P (x, y)dx + Q(x, y)dy = 0
gegeben ist, so heißt diese exakt, wenn P und Q in einem einfach zusammenhängenden Gebiet der x − y-Ebene stetig differenzierbar sind, und die Integrabilitätsbedingung
∂P
∂Q
=
∂y
∂x
erfüllen. Dann existiert eine Funktion Φ(x, y) mit
P =
∂Φ
,
∂x
Q=
∂Φ
∂y
5.4. EXAKTE DIFFERENTIALGLEICHUNGEN
75
und Φ(x, y) = C ist die Lösungsschar der exakten Differentialgleichung.
Beispiel: Die Differentialgleichung
yexy dx + (2 + xexy )dy = 0
ist exakt, da
∂
∂
(yexy ) =
(2 + xexy )
∂y
∂x
in der gesamten x − y-Ebene erfüllt ist.
⇒
∂Φ(x, y)
= yexy ⇒ Φ(x, y) = exy + f (y)
∂x
∂Φ(x, y)
= xexy + f (y) = 2x + xexy
∂y
f (y) = 2 ⇒ f (y) = 2y + k
⇒ Die Lösungen der Differentialgleichungen sind die Kurven
exy + 2y = C.
Ist bei einer Differentialgleichung der Gestalt
P (x, y)dx + Q(x, y)dy = 0
die Integranilitätsbedingung nicht erfüllt, so kann man versuchen, sie durch Multiplikation mit einem integrierenden Faktor μ(x, y) exakt zu machen. Die
Funktion μ muss in diesem Fall die Bedingung
∂(μP )
∂(μQ)
=
∂y
∂x
erfüllen. μ ist also eine Lösung der folgenden partiellen Differentialgleichung erster
Ordnung:
∂P
∂μ
∂μ
∂Q
Q−
P =μ
−
.
∂x
∂y
∂y
∂x
Es ist nun keineswegs nötig die allgemeine Lösung dieser partiellen Differentialgleichung zu kennen, es genügt eine spezielle Lösung für μ(x, y) zu finden.
Beispiel: Die Differentialgleichung
(x2 + 2y)dx + xdy = 0
ist nicht exakt, da
∂ 2
∂
(x + 2y) = 2 =
= 1.
∂x
∂x
76
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Ein integrierender Faktor μ(x, y) muss die partielle Differentialgleichung
∂μ
∂μ 2
(x + 2y) + 2μ =
+μ
∂y
∂x
erfüllen. Wir versuchen für μ eine Lösung zu finden, die nur von x abhängt.
μ (x)x = μ(x)
⇒
⇒
μ(x) = kx.
Wir wählen k = 1 und erhalten die exakte Differentialgleichung
x(x2 + 2y)dx + x2 dy = 0.
∂Φ(x, y)
= x2 ⇒ Φ(x, y) = x2 y + f (x)
∂y
∂Φ(x, y)
= 2xy + f (x) = x3 + 2xy
∂x
x4
⇒ f (x) = x3 ⇒ f (x) =
+k
4
Somit erhält man als Lösung der Differentialgleichung:
x2 y +
5.5
x4
= C.
4
Lineare Differentialgleichungen erster Ordnung
Eine Differentialgleichung erster Ordnung heißt linear, wenn sie in der Form
y + P (x)y = Q(x)
geschrieben werden kann. Wesentlich ist, dass y und y nur linear enthalten sind
(d.h. in der ersten Potenz stehen). Ist Q(x) ≡ 0 heißt die Gleichung homogen,
andernfalls nennt man sie inhomogen.
Die allgemeine Lösung yh (x) der homogenen Gleichung
yh + P (x)yh = 0
findet man durch Trennung der Variablen:
⇒
dyh
= −P (x)dx
yh
ln |yh | = − dx P (x) + ln c
⇒
yh (x) = Ce−
R
dxP (x)
.
5.5. LINEARE DIFFERENTIALGLEICHUNGEN ERSTER ORDNUNG
77
Die allgemeine Lösung der inhomogenen Gleichung erhält man nun als Summe
der allgemeinen Lösung der homogenen Gleichung und einer speziellen (partikulären) Lösung ys (x) der inhomogenen Gleichung:
y(x) = yh (x) + ys (x)
Eine spezielle Lösung der inhomogenen Gleichung erhält man durch die auf Lagrange zurückgehende Methode der Variation der Konstanten. Darunter versteht man den Ansatz
R
ys (x) = C(x)e− dx P (x)
für die spezielle Lösung.
ys (x) + P (x)ys (x) = C (x)e−
⇒
R
C (x) = Q(x)e
dx P (x)
⇒
R
dx P (x)
= Q(x)
R
C(x) =
dx Q(x)e dx P (x) .
Beispiele:
1. Die eindimensionale Bewegung eines Körpers mit Masse m, auf den eine
konstante Kraft F0 und eine geschwindigkeitsproportionale Reibungskraft
−cẋ wirkt, wird durch die Bewegungsgleichung
mẍ = F0 − cẋ
beschrieben (z.B. Kugel in zäher Flüssigkeit). Für die Geschwindigkeit v =
ẋ erhält man die lineare Differentialgleichung erster Ordnung
mv̇ + cv = F0 ,
c > 0.
Die allgemeine Lösung der homogenen Gleichung
v˙h +
ist durch
c
vh = 0
m
vh (t) = Ke−ct/m
gegeben, wobei K eine Integrationskonstante ist. Man sieht sofort, dass
vs (t) =
F0
c
eine spezielle Lösung der inhomogenen Gleichung ist. Somit ist die allgemeine Lösung der Bewegungsgleichung:
v(t) = vh (t) + vs (t) = Ke−ct/m +
F0
.
c
78
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Die Integrationskonstante K kann durch die Anfangsbedingung v(0) = v0
fixiert werden:
F0
K = v0 − .
c
Die Geschwindigkeit
F0
v∞ = lim v(t) =
t→∞
c
ist proportional zur konstanten Kraft F0 und unabhängig von der Anfangsgeschwindigkeit v0 ( Aristotelische Physik“). τ = m/c ist ein Maß für die
”
Zeitdauer, innerhalb der sich v∞ einstellt.
2. Führt man in dem vorigen Beispiel die Ersetzungen
v
m
c
F0
→
→
→
→
I
L
R
U0
(Strom)
(Induktivität)
(Widerstand)
(EMK)
durch, so erhält man die Differentialgleichung eines RL-Kreises:
L
dI
+ RI = U0
dt
U0
U0
I(t) =
+ I0 −
e−Rt/L
R
R
I0 = 0, so erhält man das zeitliche Verhalten des Stromes nach dem Einschalten der Spannungsquelle:
U0 1 − e−Rt/L
I(t) =
R
Die Größe τ = L/R ist ein Maß für die Zeitdauer, in welcher der Strom
I∞ = U0 /R (praktisch) erreicht wird.
Setzt man in
3. Im Fall einer zeitabhängigen EMK U(t) ist die Differentialgleichung
dI
+ RI = U(t)
dt
zu lösen. Wie vorhin, hat man als Lösung der homogenen Gleichung
L
Ih (t) = Ke−Rt/L ,
eine spezielle Lösung der inhomogenen Gleichung erhät man daraus durch
Variation der Konstanten:
⇒
Is = K(t)e−Rt/L
LK̇(t)e−Rt/L = U(t)
1
U(t)eRt/L .
⇒ K̇(t) =
L
5.5. LINEARE DIFFERENTIALGLEICHUNGEN ERSTER ORDNUNG
79
Eine mögliche Wahl von Is (t) ist daher
t
e−Rt/L
Is (t) =
L
dt U(t )eRt /L .
0
Als allgemeine Lösung der inhomogenen Gleichung erhalten wir den Ausdruck
t
−Rt/L e
dt U(t )eRt /L
I(t) = Ke−Rt/L +
L
0
wobei K = I(0) ist.
4. Wir wollen noch den wichtigen Spezialfall einer Wechselspannung
U(t) = U0 cos ωt
behandeln. Es ist vorteilhaft, die Differentialgleichung
L
dI
+ RI = U0
dt
eiωt
cos ωt+i sin ωt
für eine komplexe Größe I(t) zu lösen und am Ende den Realteil von I(t)
zu nehmen. Nach unseren vorangegangenen Überlegungen ist
−Rt/L
I(t) = Ke
e−Rt/L
+
L
t
dt U0 eiωt eRt /L
0
−1
R + iωL
iωt
R
−
iωL
−Rt/L
−
e
e
.
= Ke−Rt/L + U0 2
R + (ωL)2
−Rt/L
= Ke
Mit
R + iωL =
iωt Rt/L
e
−Rt/L e
+ U0 e
R2 + (ωL)2 eiδ ,
δ = arctan
ωL
R
erhalten wir als komplexe Lösung
U0
U0 e−iδ
ei(ωt−δ)
e−Rt/L + I(t) = K − R2 + (ωL)2
R2 + (ωL)2
und somit die reelle Lösung
I(t) =
I(0) − U0 cos δ
R2 + (ωL)2
U0 cos(ωt − δ)
e−Rt/L + R2 + (ωL)2
für U(t) = U0 cos ωt. Nach einer Einschwingphase der Dauer τ ∼ L/R stellt
sich eine phasenverschobene Schwingung mit der Kreisfrequenz ω ein, die
unabhängig von der Anfangsbedingung I(0) ist.
80
5.6
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Bernoullische Differentialgleichung
Die Bernoullische Differentialgleichung
y + P (x)y = Q(x)y n ,
n = 1,
lässt sich durch Einführung der neuen Variablen z = y 1−n auf eine lineare Differentialgleichung zurückfuhren:
z = (1 − n)y −n y ⇒ y =
z yn
1−n
z yn
+ P (x)zy n = Q(x)y n
1−n
⇒ z + (1 − n)P (x)z = (1 − n)Q(x)
⇒
Beispiel: y + y = xy 2/3
2
1
1
⇒ z + z = x
3
3
3
zh (x)Ce−x/3 , zs (x) = C(x)e−x/3
1
1
C (x)e−x/3 = x ⇒ C (x) = xex/3
3 3
n=
C(x) = xex/3 −
dx ex/3 = (x − 3)ex/3
zs (x) = x − 3
z(x) = zh (x) + zs (x) = Ce−x/3 + x − 3
3
y(x) = z(x)3 = Ce−x/3 + x − 3
5.7
Iterationsverfahren von Picard
Ist die Integration des Anfangswertproblems
y = f (x, y),
y(x0 ) = y0
nicht exakt möglich, kann man Näherungsverfahren anwenden. Ein Beispiel
dafür ist das Picardsche Iterationsverfahren. Durch Integration der Differentialgleichung bei Berücksichtigung der Anfangsbedingung erhält man die Integralgleichung
x
y(x) = y0 + dx f (x , y(x)) .
x0
5.8. EXISTENZ- UND EINDEUTIGKEITSSATZ
81
Als nullte Näherung nimmt man die konstante Funktion y0 , setzt diese in die
Integralgleichung ein, um auf diese Weise die erste Näherung
x
y1 (x) = y0 +
dx f (x , y0 )
x0
zu erhalten. Man setzt dieses Verfahren nun fort und bekommt
x
y2 (x) = y0 +
dx f (x , y1(x )) .
x0
Der n-te Iterationsschritt liefert
x
yn (x) = y0 +
dx f (x , yn−1(x )) .
x0
Man erhält auf diese Weise eine Folge von Funktionen
y0 , y1 (x), y2 (x), . . . , yn (x), . . . ,
die unter gewissen Voraussetzungen (siehe nächster Abschnitt) gegen die Lösung
des Anfangswertproblems konvergiert.
Beispiel: Behandeln Sie das Anfangswertproblem
y = 1 + y2,
y(0) = 0
mit Hilfe des Picardschen Iterationsverfahrens und vergleichen Sie ihr Ergebnis
mit der exakten Lösung.
5.8
Existenz- und Eindeutigkeitssatz
Das Anfangswertproblem
xy = 2y,
y(0) = 1
besitzt keine Lösung. Das Anfangswertproblem
y = 2x,
y(0) = 1
hat genau eine Lösung, nämlich y(x) = x2 + 1. Das Anfangswertproblem
xy = y − 1,
y(0) = 1
82
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
besitzt unendlich viele Lösungen der Form y(x) = 1 + kx (k beliebig).
Der folgende Satz gibt ein hinreichendes Kriterium für die Existenz und Eindeutigkeit der Lösung des Anfangswertproblems
y = f (x, y),
y(x0 ) = y0 .
Existenz: Die Funktion f (x, y) sei in einem offenen Rechteck
,
+
D = (x, y)|x − x0 | < a, |y − y0 | < b
stetig und beschränkt, das heißt
|f (x, y)| ≤ K,
∀ (x, y) ∈ D,
dann besitzt das Anfangswertproblem
mindestens eine Lösung, die wenigstens
auf dem Intervall I = {x |x − x0 | < min(a, b/K)} definiert ist.
Eindeutigkeit: Ist außerdem die partielle Ableitung ∂f /∂y auf D stetig und
beschänkt,
∂f (x, y) ∂y ≤ M ∀ (x, y) ∈ D,
dann besitzt das Anfangswertptroblem nur eine Lösung, die jedenfalls ∀ x ∈ I
definiert ist. Die Funktionenfolge des Picardschen Iterationsvefahrens konvergiert
dann gegen diese Lösung.
Bemerkung: Die Voraussetzungen dieses Satzes sind hinreichend aber keineswegs notwendig und können daher abgeschwächt werden. So kann etwa |∂f /∂y| ≤
M durch die schwächere Voraussetzung
|f (x, y2 ) − f (x, y1)| ≤ M|y2 − y1 |
(Lipschitz-Bedingung) ersetzt werden.
5.9
Systeme linearer Differentialgleichungen erster Ordnung mit konstanten Koeffizienten
Wir haben n abhängige Veränderliche x1 (t), . . . , xn (t) und schreiben das Differentialgleichungssystem in kompakter Form
ẋ(t) = Ax(t)
5.9. LINEARE DIFFERENTIALGLEICHUNGSSYSTEME 1. ORDNUNG 83
⎛
⎞
x1
⎜.⎟
⎜ ⎟
⎟
x=⎜
⎜ . ⎟,
⎝.⎠
xn
mit
⎛
a11
⎜ .
⎜
A=⎜
⎜ .
⎝ .
an1
.
.
.
.
.
.
.
.
.
.
⎞
. a1n
. . ⎟
⎟
. . ⎟
⎟,
. . ⎠
. ann
aik ∈
.
Die allgemeine Lösung ist durch
x(t) = eAt x(0)
gegeben.
Beispiele:
1. Die (nichtrelativistische) Bewegung eines Punktteilchens mit Masse m und
elektromagnetischer Ladung q, das sich in einem zeitlich und räumlich kon = Bn (|n| = 1) befindet, wird durch
stanten Magnetfeld B
v
mv̇ = q × B
c
beschrieben, d.h.
v̇ = −
qB
n × v .
mc
ω
Die Lösung dieses Systems von drei linearen Differentialgleichungen erster
Ordnung ist daher
v (t) = e−ωtn×v (0)
∞
(−ωt)k
n × n × . . . n × v (0) . . .
=
k! k=0
k−mal
Man zerlegt den Vektor v(0) in einen Anteil v (0) parallel zur Richtung des
Magnetfeldes und einen Anteil v(0)⊥ normal dazu,
v (0) = n n · v(0) + v(0) − n n · v (0) ,
v (0)
v(0)⊥
und erhält somit in den einzelnen Summanden:
k
k
k
k
k
=0
=1
=2
=3
=4
...
v(0)
n × v(0)⊥
n × (n × v (0)⊥ ) = −v (0)⊥
n × (−v (0)⊥ ) = −n × v (0)⊥
n × (−n × v (0)⊥ ) = v(0)⊥
...
84
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
⇒ v(t) = v (0) + v (0)⊥ (cos ωt − 1) − n × v (0)⊥ sin ωt
= n n · v (0) + v (0) − n n · v (0) cos ωt − n × v (0) sin ωt
Durch Integration von x˙ = v erhält man die Bahnkurve des Teilchens
(Schraubenlinie):
cos ωt
sin ωt v (0) − n n · v(0) +
n × v (0)
x(t) = a + n n · v(0) t +
ω
ω
2. Wir betrachten das Differentialgleichungssystem
ẋ1 = x1 + x2
ẋ2 =
x2
1 1
A=
0 1
⇒
⇒
k
A =
1 k
0 1
A ist nicht diagonalisierbar!
→
At
e
∞
tk 1 k
t 1 t
=
=e
0 1
k! 0 1
k=0
Lösung:
x1 (t) = et x1 (0) + tx2 (0)
x2 (t) = et x2 (0)
Falls die Matrix A diagonalisierbar ist, d.h. wenn A eine Basis {v1 , . . . vn } von
Eigenvektoren (Avi = ai vi ) besitzt, haben wir die folgende Situation:
A = S ÂS −1 ,
⇒
 = diag(a1 , . . . an ),
eAt = SeÂt S −1 ,
S = (v1 , . . . vn )
eÂt = diag(ea1 t , . . . ean t ).
Zerlegt man den Vektor x(0) bezüglich der Basisvektoren,
x(0) =
n
ci vi ,
i=1
so erhält man die Lösung in der Form
At
x(t) = e x(0) =
n
ci eai t vi .
i=1
Bemerkung: Ist für einen der Eigenwerte ai = a∗i , dann ist auch a∗i ein Eigenwert
von A (da A reell ist) mit dazugehörigem Eigenvektor vi∗ .
⇒
Re eai t vi , Im eai t vi
sind reelle Lösungen.
5.10. ZEITENTWICKLUNG IN DER QUANTENMECHANIK
5.10
85
Zeitentwicklung in der Quantenmechanik
In der Quantenmechanik wird die Zeitentwicklung eines Zustandsvektors
ψ(t) ∈ H (im Schrödingerbild) durch die Schrödingergleichung
ih̄
dψ(t)
= Hψ(t)
dt
beschrieben. Dabei ist H ein hermitescher Operator (Hamiltonoperator), welcher der Observablen Gesamtenergie des betrachteten Systems“ entspricht. Die
”
Lösung der Schrödingergleichung ist dann (wenn H zeitlich konstant ist) durch
ψ(t) = exp(−iHt/h̄) ψ(0)
gegeben. Da H hermitesch ist, ist der hier auftretende Operator
exp(−iHt/h̄)
unitär, woraus folgt, dass sich die Norm des Zustandsvektors nicht ändert:
ψ(t)|ψ(t) = ψ(0)|ψ(0).
Da H weiters eine ONB von Eigenvektoren,
{φ1, . . . φn },
Hφk = Ek φk
besitzt (E1 , . . . En sind die Energieeigenwerte), hat H die Spektraldarstellung
H=
n
Ek φk φ†k
=
k=1
n
Ek |φk φk |
k=1
Somit ist
exp(−iHt/h̄) =
n
−iEk t/h̄
e
k=1
φk φ†k
=
n
e−iEk t/h̄ |φk φk |
k=1
und
ψ(t) = exp(−iHt/h̄) ψ(0)
n
=
e−iEk t/h̄ φk φ†k ψ(0)
k=1
=
n
k=1
e−iEk t/h̄ |φk φk |ψ(0).
86
5.11
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Energie
Die Differentialgleichung zweiter Ordnung
mẍ = F (x)
beschreibt die eindimensionale Bewegung eines Teilchens mit Masse m, das sich
in einem rein ortsabhängigen Kraftfeld F (x) befindet. Schreibt man das Kraftfeld
mit Hilfe der potentiellen Energie V (x) in der Form
F (x) = −
∂V (x)
,
∂x
so erhält man
∂V (x)
ẋ = 0
mẍẋ +
∂x
⇒
d mẋ2
+ V (x) = 0.
dt 2
Die Gesamtenergie
mẋ2
+ V (x)
2
bleibt somit während der gesamten Bewegung konstant, man spricht von einer sogenannten Erhaltungsgröße. Durch die Existenz dieser Erhaltungsgröße konnten wir die Differentialgleichung zweiter Ordnung auf eine Differentialgleichung
erster Ordnung zurückführen,
(
2
E − V (x) ,
ẋ = ±
m
E=
welche nun durch Separation der Variablen gelöst werden kann:
dx
± = t − t0 .
2
E
−
V
(x)
m
Beispiel: Der eindimensionale harmonische Oszillator wird durch das Kraftfeld
F (x) = −kx beschrieben. Die dazupassende potentielle Energie ist daher V (x) =
kx2 /2 und
mẋ2 kx2
E=
+
2
2
ist eine Erhaltungsgröße.
Lässt sich diese Methode auch auf den Fall einer Bewegung in drei Dimensionen,
mx¨ = F (x),
5.12. LINEARE DGLN 2. ORDNUNG MIT KONST. KOEFF.
87
übertragen? Dies ist nur dann der Fall, wenn es sich um ein sogenanntes konservatives Kraftfeld,
(x),
F (x) = −∇V
handelt. Die Gesamtenergie
E=
mx˙ 2
+ V (x)
2
ist dann wieder eine Erhaltungsgröße und eine der insgesamt sechs Integrationen
ist damit ausgeführt.
Beispiel: Das Zentralkraftfeld
GmM x
F (x) = −
x 2 |x|
besitzt die potentielle Energie
V (x) = −
5.12
GmM
.
|x|
Lineare Differentialgleichungen zweiter
Ordnung mit konstanten Koeffizienten
ẍ(t) + a1 ẋ(t) + a0 x(t) = f (t),
a0 , a1 ∈
.
Für die homogene Gleichung (f (t) = 0) machen wir den Ansatz:
xh (t) = exp(λt)
⇒
λ2 + a1 λ + a0 = 0
⇒
λ1,2
a1
=− ±
2
(
a21
− a0 .
4
Die folgende Fallunterscheidung ist nötig:
1. λ1 = λ2
(a) λi ∈
⇒
xh (t) = Aeλ1 t + Beλ2 t ,
A, B ∈
.
(b) λi = d.h. λ1,2 = α ± iω, ω = 0 ⇒ eλ1,2 t = eαt (cos ωt ± i sin ωt)
Die allgemeine (reelle) Lösung ist daher in diesem Fall:
xh (t) = eαt (A cos ωt + B sin ωt),
A, B ∈
.
88
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
2. λ1 = λ2 = λ = −a1 /2
Die allgemeine Lösung ist in diesem Fall:
xh (t) = Aeλt + Bteλt
Beweis: Man muss nur durch Einsetzen in die homogene Differentialgleichung überprüfen, dass t exp λt eine Lösung ist.
Bemerkung: Die homogene Differentialgleichung zweiter Ordnung,
ẍh (t) + a1 ẋh (t) + a0 xh (t) = 0,
kann auch als System von zwei linearen Differentialgleichungen erster Ordnung
geschrieben werden, wenn man x1 = xh und x2 = ẋh setzt:
ẋ1 =
x2
ẋ2 = −a0 x1 − a1 x2
Aufgabe: Ermitteln Sie die Lösung mit Hilfe des früher besprochenen Verfahrens
zur Behandlung von Systemen linearer Differentialgleichungen erster Ordnung.
Die allgemeine Lösung der inhomogenen Differentialgleichung ist durch
x(t) = xh (t) + xs (t)
gegeben, wobei xs (t) eine beliebige spezielle Lösung der inhomogenen Gleichung
ist.
Ich diskutiere zunächst den wichtigen Spezialfall f (t) = exp μt (μ ∈
1. μ = λ1 , λ2
Ansatz : xs (t) = Ceμt
⇒
C=
1
μ2 + a1 μ + a0
2. μ = λ1 = λ2
Ansatz : xs (t) = Cteμt
⇒
C=
1
2μ + a1
3. μ = λ1 = λ2
Ansatz : xs (t) = Ct2 eμt
⇒
C=
1
2
):
5.12. LINEARE DGLN 2. ORDNUNG MIT KONST. KOEFF.
89
Bemerkung: Wählt man μ = μ1 +iμ2 (μ2 = 0), so ist Re xs (t) eine reelle Lösung
für f (t) = Re exp μt = exp μ1 t cos μ2 t.
Beispiel: Ich betrachte den Fall μ = iΩ = λ1,2 . Eine spezielle Lösung für f (t) =
cos Ωt ist daher
eiΩt
−ω 2 + ia1 Ω + a0
(cos Ωt + i sin Ωt)(−Ω2 + a0 − ia1 Ω)
= Re
(−Ω2 + a0 )2 + a21 Ω2
(−Ω2 + a0 ) cos Ωt + a1 Ω sin Ωt
=
.
(−Ω2 + a0 )2 + a21 Ω2
xs (t) = Re
Bemerkung: Der Nenner hat sein Minimum für Ω2 = a0 . Das macht sich besonders stark bemerkbar, wenn
(
a1
a2
λ1,2 = α ± iω = − ± i a0 − 1
2
4
√
und a21 a0 . Dann ist nämlich ω a0 und Ω → ω führt zur Resonanzkata”
strophe“.
Für eine allgemeine Form der Funktion f (t) und den Fall λ1 = λ2 ist eine
spezielle Lösung der inhomogenen Gleichung durch die Formel
1
xs (t) =
λ1 − λ2
t
dt eλ1 (t−t ) − eλ2 (t−t ) f (t )
t0
gegeben. Der Beweis dieser Formel erfolgt durch Einsetzen in die Differentialgleichung. Die hier angegebene spezielle Lösung ist so gewählt, dass xs (t0 ) = 0 und
ẋs (t0 ) = 0. Die Erfüllung der Randbedingungen x(t0 ) = x0 und ẋ(t0 ) = ẋ0 der
allgemeinen Lösung x(t) = xh (t) + xs (t) erfolgt durch geeignete Wahl der zwei in
xh (t) enthaltenen freien Konstanten.
Bemerkung: Im Fall λ1,2 = α ± iω hat man
1
xs (t) =
ω
t
dt eα(t−t ) sin ω(t − t )f (t )
t0
Im Fall λ1 = λ2 = λ ist
t
xs (t) =
t0
dt (t − t )eλ(t−t ) f (t ).
90
5.13
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Lineare Differentialgleichungen mit konstanten Koeffizienten
Wir suchen die allgemeine Lösung der folgenden linearen, homogenen Differentialgleichung n-ter Ordnung mit konstanten Koeffizienten:
x(n) (t) + an−1 x(n−1) (t) + . . . + a1 ẋ(t) + a0 x(t) = 0,
ai ∈
.
Ansatz:
x(t) = eλt
⇒
P (λ) = λn + an−1 λn−1 + . . . + a1 λ + a0 = 0.
(n1 )
Das
Polynom P (λ) habe die Nullstellen λ1
( nα = n).
(nk )
, . . . , λk
mit Vielfachheiten nα
Behauptung: Die linear unabhängigen Lösungen der Differentialgleichung sind:
eλ1 t , . . . , tn1 −1 eλ1 t ; . . . ; eλk t , . . . , tnk −1 eλk t .
Beweis: Es ist zu zeigen, dass die Funktionen
tν eλi t ,
ν = 0, . . . , ni − 1
Lösungen sind. Mit Hilfe des Differentialoperators
D=
dn−1
d
dn
+
a
+ . . . + +a1 + a0
n−1
n
n−1
dt
dt
dt
kann man die Differentialgleichung in der Form Dx = 0 schreiben.
dν λt dν
dν
ν λi t
λt λt = ν De = ν P (λ)e .
Dt e = D ν e dλ
dλ
dλ
λ=λi
λ=λi
λ=λi
P (λ) = (λ − λ1 )n1 . . . (λ − λi )ni . . . (λ − λk )nk = Q(λ)(λ − λi )ni
dν
dν
λt P (λ)
= 0 f ür ν < ni ⇒
P (λ)e = 0 ⇒ Dtν eλt = 0.
ν
ν
dλ
dλ
λ=λi
5.14
λ=λi
Systeme linearer Differentialgleichungen 2.
Ordnung mit konstanten Koffizienten
Wir schreiben dieses Differentialgleichungssystem wieder in kompakter Form
ẍ(t) + B ẋ(t) + Cx(t) = 0
5.14. LINEARE DIFFERENTIALGLEICHUNGSSYSTEME 2.ORDNUNG 91
⎛
⎞
x1
⎜.⎟
⎜ ⎟
⎟
x=⎜
⎜.⎟
⎝.⎠
xn
mit
und reellen n × n-Matrizen B, C.
Macht man den Ansatz
x(t) = eλt v,
so erhält man
(λ2 + λB + C)v = 0,
woraus folgt, dass λ die Gleichung
det(λ2 + λB + C) = 0
erfüllen muss.
Da sich ein lineares Differentialgleichungssystem zweiter Ordnung auf ein solches
erster Ordnung zurückführen lässt, kann man auch so vorgehen: Man definiert
x1
.
x1 = x, x2 = ẋ = ẋ1 , X =
x2
Das Differentialgleichungssystem lässt sich dann mit Hilfe des 2n-dimensionalen
Spaltenvektors X und der 2n × 2n-Matrix A in der Form
0
Ẋ(t) =
X(t)
−C −B
A
schreiben. Die (formale) Lösung ist daher
X(t) = eAt X(0).
Ich beschränke mich hier auf die Diskussion eines Differentialgleichungssystems
der Form
M ẍ(t) = −Kx(t),
M T = M, M > 0,
K T = K, K ≥ 0.
Dieser wichtige Spezialfall tritt bei der Behandlung kleiner Schwingungen in der
Mechnik auf und folgt aus der Lagrangefunktion (→ T1)
1
1
L = ẋT M ẋ − xT Kx
2
2
92
KAPITEL 5. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Da die Matrix M strikt positiv ist, existiert M −1/2 und man kann das Differentialgleichungssystem auch in der Form
M 1/2 ẍ(t) = −M −1/2 KM −1/2 M 1/2 x(t)
schreiben. Da die Matrix M −1/2 KM −1/2 symmetrisch und positiv ist, kann sie
durch eine (reelle) Orthogonalmatrix S diagonalisiert werden:
M −1/2 KM −1/2 = SΩ2 S T ,
Ω2 = diag(ω12 , . . . ωn2 ),
ωi2 ≥ 0.
Die Eigenfrequenzen ω1 , . . . ωn erhält man aus der Gleichung
det(ω 2 − M −1/2 KM −1/2 ) = det(ω 2 M − K) = 0
Definiert man
Q(t) = S T M 1/2 x(t),
so ergibt sich ein System von n entkoppelten Differentialgleichungen
Q̈(t) = −Ω2 Q(t)
für die Normalkoordinaten Q1 (t), . . . , Qn (t):
Q̈i (t) = −ωi2 Qi (t),
i = 1, . . . , n.
Für ωi = 0 erhält man die allgemeine Lösung
Qi (t) = Ai cos ωi t + Bi sin ωi t.
Im aperiodischen Grenzfall ωi = 0 ist die Lösung
Qi (t) = Ai + Bi t.
Die allgemeine Lösung Q(t) ist somit
Q(t) =
n
Qi (t)ei .
i=1
In den ursprünglichen Koordinaten hat man daher
x(t) = M
−1/2
SQ(t) =
n
i=1
Qi (t) M −1/2 Sei .
vi
Die Vektoren v1 , . . . , vn erfüllen die Eigenwertgleichungen
(Mωi2 − K)vi = 0
und sind gemäß
viT Mvj = δij
normiert.
Kapitel 6
Komplexe Analysis
Die Verwendung von Methoden der komplexen Analysis führt oft zu einer gewaltigen Vereinfachung sonst meist langwieriger Rechnungen. Grundkenntnisse
der komplexen Analysis zählen daher zum Standardrepertoire in der theoretischen
Physik.
6.1
Komplexe Zahlen
6imaginäre
Achse
*
r θ
HH
HH x = r cos θ
HH
HH
HH
H
j
H
z = x + iy = reiθ
y = r sin θ
-
reelle Achse
z ∗ = x − iy = re−iθ
Eine komplexe Zahl z = x + iy ∈
mit Realteil x = Re z ∈
und Imaginärteil y = Im z ∈ lässt sich durch einen (Orts-)Vektor in der komplexen
ist die imaginäre Einheit mit
Zahlenebene veranschaulichen. Die Zahl i ∈
2
i = −1. Die zu z = x + iy (komplex) konjugierte Zahl z ∗ = x − iy entspricht
93
KAPITEL 6. KOMPLEXE ANALYSIS
94
der Spiegelung von z an der reellen Achse. Die Länge oder der Betrag von z
ist durch
√
|z| = |x + iy| = x2 + y 2 = z ∗ z
gegeben. Wichtig ist auch die Polardarstellung
z = r cos θ + ir sin θ = r (cos θ + i sin θ),
eiθ
r = |z| ≥ 0 ,
θ = arg z ∈ [0, 2π) .
Die Addition von zwei komplexen Zahlen,
z1 + z2 = (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 )
entspricht einfach der Vektoraddition. Die geometrische Interpretation der Multiplikation zweier komplexer Zahlen ist bei Verwendung der Polardarstellung
besonders leicht zu sehen:
z1 z2 = r1 eiθ1 r2 eiθ2 = r1 r2 ei(θ1 +θ2 )
Die Längen |z1 | = r1 , |z2 | = r2 der beiden komplexen Zahlen werden miteinander
multipliziert und die Argumente arg z1 = θ1 , arg z2 = θ2 werden addiert. Man
kann sich auch leicht von der Gültigkeit der Dreiecksungleichung
|z1 + z2 | ≤ |z1 | + |z2 |
∀ z1 , z2 ∈
und der Formel
|z1 z2 | = |z1 ||z2 |
∀ z1 , z2 ∈
überzeugen.
6.2
Komplexe Funktionen
Die Exponentialfunktion lässt sich durch die Definion
ez = exp z = ex (cos y + i sin y) = ex eiy ,
zu einer Abbildung exp :
wohnten Rechenregeln
z = x + iy
→ verallgemeinern. Es gelten weiterhin die geez1 +z2 = ez1 ez2 ,
∀ z1,2 ∈
,
sowie die aus der reellen Analysis bekannte Potenzreihenentwicklung
z
e =
∞
zn
n=0
n!
,
z∈
.
6.2. KOMPLEXE FUNKTIONEN
95
Für die trigonometrischen Funktionen suggerieren die aus der Eulerschen
Formel eix = cos x + i sin x (x ∈ ) folgenden Relationen
eix + e−ix
,
cos x =
2
eix − e−ix
sin x =
,
2i
x∈
die Definitionen:
cos z =
eiz + e−iz
,
2
sin z =
eiz − e−iz
,
2i
z∈
.
Alle gewohnten Formeln für die reellen trigonometrischen Funktionen gelten dann
auch im Komplexen (z.B. sin2 z + cos2 z = 1, etc.) Analog definiert man die
Hyperbelfunktionen durch die bekannten Formeln
cosh z =
ez + e−z
,
2
sinh z =
ez − e−z
,
2
z∈
.
Die Berechnung der n-ten Wurzel einer komplexen Zahl z erfordert etwas mehr
Vorsicht. Betrachten wir die Beziehung
, fix),
so entspricht jedem vorgegebenen Wert w ∈ genau ein Wert z ∈ . Dagegen
z = wn,
(n ∈
gibt es zu jedem z = 0 n verschiedene mögliche Werte von w. Der Ausdruck
√
w= nz
ist somit mehrdeutig und stellt keine Funktion → dar. Zur Bestimmung
der n verschiedenen möglichen Werte von w geht man folgendermaßen vor:
z = reiθ
w = Reiφ
'
⇒
n inφ
e reiθ = R
wn
z
√
⇒ r = Rn ⇒ R = n r ≥ 0
(eindeutig)
i(θ+2kπ)
iθ
inφ
e
=e =e , k∈
θ 2kπ
, k = 0, 1, . . . , n − 1,
⇒ φ= +
n
n
√
√
θ
2kπ
⇒ w = n z = n r ei( n + n ) , k = 0, 1, . . . , n − 1.
√
Die n verschiedenen Werte von n z liegen auf einem Kreis mit Radius n |z| um
den Ursprung und bilden die Eckpunkte eines Polygons mit n gleich langen Seiten.
KAPITEL 6. KOMPLEXE ANALYSIS
96
Ebenso ist der Logarithmus einer komplexen Zahl ein mehrdeutiger Ausdruck.
Gehen wir, analog zu vorhin, von der Relation
z = ew
aus, so gibt es wieder zu jedem vorgegebenen Wert von w genau einen Wert von
z. Dagegen gibt es zu jedem Wert von z = 0 unendlich viele verschiedene
Werte von w, da w und w + 2πik (k ∈ ) das gleiche z liefern:
'
z = reiθ
⇒ reiθ = eu eiv
w = u + iv
⇒ eu = r ⇒ u = ln r
(eindeutig)
i(θ+2πk)
iθ
iv
e
=e =e , k∈
⇒ v = θ + 2πk, k ∈
⇒ w = ln z = ln r + i (θ + 2πk) , k ∈
Beispiel: ln i = i
π
2
+ 2πk ,
k∈
Allgemeine Potenzen komplexer Zahlen kann man durch den i.Allg. mehrdeutigen Ausdruck
z c = ec ln z , c ∈ , z = 0
definieren.
z c = ec ln r eicθ eic2πk ,
k∈
ist eindeutig für c = n ∈ :
k∈
n inθ
z n = en ln r einθ ei2πkn
= r e ,
1
Für c = n1 , (n = 2, 3, . . . , ) erhält man den bereits bekannten Ausdruck für
1
1
θ
z n = e n ln r ei n ei
π
2kπ
n
=
π
√
n
θ
r ei( n +
2kπ
n
√
n
z:
).
Beispiel: ii = ei ln i = eii( 2 +2kπ) = e−( 2 +2kπ) , k ∈ . ii ist somit rein reell.
6.3
Riemannsche Flächen
√
Die Verwendung mehrdeutiger Ausdrücke wie z oder ln z lässt sich vermeiden,
indem man für den Definitionsbereich statt der komplexen Zahlenebene geeignet
gewählte Mannigfaltigkeiten, sogenannte Riemannsche Flächen, verwendet.
6.3. RIEMANNSCHE FLÄCHEN
97
Um eine geeignete Riemannsche Fläche für die Quadratwurzel zu konstruieren,
betrachten wir zunächst die Abbildung z → z 2 der komplexen Zahlenebene auf
2
2
sich selbst. Diese Abbildung
√ ist wegen (−z) = z nicht injektiv und2 somit
nicht invertiertbar (und z daher mehrdeutig). Fasst man aber z → z nicht
als Abbildung
→ , sondern als Abbildung
→ R auf, so ist diese Abbildung injektiv und somit invertierbar. R ist die unten dargestellte zweiblättrige
Riemannsche Fläche.
Eine mögliche Parametrisierung von R ist:
(r, θ), r ≥ 0, 0 ≤ θ < 4π
(0 und 4π werden identifiziert)
√
Somit ist z → z, aufgefasst als Abbildung R → , eine Funktion (also nicht
mehr mehrdeutig).
√
√ θ
(r, θ) −→ ( r, )
2
θ
0 ≤ θ < 4π
0 ≤ < 2π
2
Bemerkungen: Der Ursprung ist in dem obigen Beispiel ein Verzweigungspunkt (erster Ordnung). Die Lage des Verzweigungsschnittes, der 0 und ∞
verbindet, ist an sich willkürlich, Hier wurde er längs der positiven reellen Achse
gewählt. Allgemein heißt ein Verzweigungspunkt von der
Ordnung n − 1, wenn
√
n
er n Blätter verbindet. Die Riemannsche Fläche für z besitzt n Blätter mit
einem Verzweigungspunkt der Ordnung n − 1 bei z = 0. Die Riemannsche Fläche
für den Logarithmus hat unendlich viele Blätter (der Nullpunkt gehört nicht
dazu). Mögliche Parametrisierung:
(r, θ),
(r, θ)
ln
−→
r > 0,
θ∈
ln r + iθ ∈
KAPITEL 6. KOMPLEXE ANALYSIS
98
6.4
Differentiation im Komplexen
Die Forderung der Differenzierbarkeit einer Funktion ist im Komplexen, wegen
der größeren Bewegungsfreiheit in der komplexen Zahlenebene, wesentlich einschränkender als die Differenzierbarkeit im Reellen.
Zunächst einige Definitionen:
Definition: D ⊆
heißt offen, wenn mit jedem Punkt z ∈ D auch eine offene
Kreisscheibe
+
, mit Mittelpunkt z ganz in D liegt (d.h. ∀ z ∈ D ∃ r > 0 :
y |y − z| < r ⊆ D).
Sei nun f : D →
eine auf einer offenen Teilmenge D ⊆ definierte Funktion,
und z0 ∈ D.
f (z) = f (x + iy) = u(x, y) + iv(x, y)
Definition:
lim f (z) = w
:⇔
z→z0
∀ ε > 0 ∃ δ(ε) > 0,
sodass |f (z) − w| < ε ∀ z mit |z − z0 | < δ(ε).
Man sagt in diesem Fall: f (z) hat den Grenzwert (Limes) w für z → z0“.
”
Bemerkung: Die Funktion f (z) strebt in diesem Fall bei jeder beliebigen
Annäherung z → z0 gegen den Grenzwert w.
Definition: f heißt stetig im Punkt z0 ∈ D, wenn
lim f (z) = f (z0 ).
z→z0
Definition: f heißt stetig auf D, wenn f in jedem Punkt von D stetig ist.
Definition: f heißt differenzierbar im Punkt z ∈ D, wenn der Limes
f (z + h) − f (z)
h→0
h
f (z) = lim
existiert. Dies ist äquivalent zu
f (z + h) = f (z) + f (z)h + α(h)h mit lim α(h) = 0,
h→0
woraus folgt:
f differenzierbar im Punkt z ⇒ f stetig im Punkt z.
6.4. DIFFERENTIATION IM KOMPLEXEN
99
Definition: f heißt holomorph auf D, wenn f in jedem Punkt von D differenzierbar ist.
Satz: Ist eine Funktion f (z) = u(x, y) + iv(x, y) im Punkt z = x + iy differenzierbar, dann erfüllen u, v im Punkt (x, y) die Cauchy-Riemannschen Differentialgleichungen
∂u
∂v
∂u
∂v
=
,
=− .
∂x
∂y
∂y
∂x
Beweis: h = Δx + iΔy,
f (z) =
=
=
=
=
u(x + Δx, y + Δy) + iv(x + Δx, y + Δy) − u(x, y) − iv(x, y)
Δx+iΔy→0
Δx + iΔy
u(x + Δx, y) + iv(x + Δx, y) − u(x, y) − iv(x, y)
lim
Δx→0,Δy=0
Δx
∂u
∂v
+i
∂x
∂x
u(x, y + Δy) + iv(x, y + Δy) − u(x, y) − iv(x, y)
lim
Δx=0,Δy→0
iΔy
1 ∂u ∂v
+
.
i ∂y ∂y
lim
Durch Vergleich von Real- und Imaginärteil folgt die Behauptung.
Bemerkung: Es gilt auch die Umkehrung, d.h. erfüllen zwei reelle Funktionen
u, v im Punkt (x, y) die Cauchy-Riemannschen Differentialgleichungen, so ist die
komplexe Funktion f = u + iv im Punkt z = x + iy differenzierbar.
Beispiele:
1. f (z) = z 2
(z + h)2 − z 2
z 2 + 2zh + h2 − z 2
= lim
h→0
h→0
h
h
= lim (2z + h) = 2z (wie im Reellen)
f (z) = lim
h→0
z
2
= (x + iy)2 = x2 − y 2 +i 2xy
u(x,y)
⇒
∂u
= 2x,
∂x
v(x,y)
∂u
= −2y,
∂y
∂v
= 2y,
∂x
∂v
= 2x.
∂y
Die Cauchy-Riemannschen Differentialgleichungen sind somit erfüllt.
2. f (z) = z ∗ ist nicht differenzierbar.
z ∗ = x − iy
⇒
u(x, y) = x,
v(x, y) = −y
KAPITEL 6. KOMPLEXE ANALYSIS
100
∂u
∂v
∂v
∂u
∂v
∂u
= 1,
= 0,
= 0,
= −1 ⇒
=
.
∂x
∂y
∂x
∂y
∂x
∂y
Die Cauchy-Riemannschen Differentialgleichungen sind in diesem Fall nicht
erfüllt.
Bemerkung: Es gelten die aus der reellen Analysis vertrauten Rechenregeln. f, g
differenzierbar ⇒ (f + g) = f + g , (f g) = f g + f g .
(z n ) = nz n−1 ,
(sin z) = cos z,
6.5
(ez ) = ez ,
(cos z) = − sin z,
etc.
Integration im Komplexen
Eine glatte orientierte Kurve γ in der komplexen Zahlenebene wird durch eine
Parameterdarstellung
[a, b] ⊂
→
,
t → z(t) = x(t) + iy(t)
beschrieben, wobei ż(t) = 0 für alle t ∈ [a, b] existiert und stetig ist.
Sei nun f eine auf γ definierte und dort stetige komplexwertige Funktion. Dann
definiert man das Kurvenintegral durch
b
dz f (z) :=
γ
dt ż(t)f (z(t)).
a
6.5. INTEGRATION IM KOMPLEXEN
101
Bemerkungen:
1. Die Definition des Kurvenintegrals ist unabhängig von der Wahl der Parametrisierung der Kurve γ.
2. Das Kurvenintegral kann auch als Grenzwert aufgefasst werden:
dz f (z) = lim
n→∞
γ
n
Δzm f (ζm ),
Δzm = zm − zm−1 .
m=1
3. Die Definition des Kurvenintegrals kann unmittelbar auf stückweise glatte Kurven erweitert werden:
dz f (z) =
dz f (z)
γ
k γ
k
Beispiele:
1. f (z) = z n , n ∈
γ sei ein Kreis mit Radius r und Mittelpunkt im Ursprung, der ein Mal im
mathematisch positiven Sinn (d.h. gegen den Uhrzeigersinn) durchlaufen
wird. Eine mögliche Parametrisierung ist z(t) = reit , 0 ≤ t ≤ 2π.
KAPITEL 6. KOMPLEXE ANALYSIS
102
'$
γ
r@@ I
0
&%
⇒ ż(t) = ireit
2π
dz f (z) =
dt ireit r n eint =
γ
0
dz z n
!
2π
2π
n+1 ei(n+1)t ir
= 0 für n = −1
i(n+1) = ir n+1 dt ei(n+1)t =
,
0
2πi
für
n
=
−1
0
&
0
für n = −1
=
n∈ .
2πi für n = −1
γ
Bemerkung: Für f (z) = (z−z0 )n , n ∈ und einen Kreis mit Mittelpunkt
z0 erhält man das gleiche Resultat:
&
0
für n = −1
n
dz (z − z0 ) =
n∈ .
2πi für n = −1
γ
2. Das Kurvenintegral einer nichtholomorphen Funktion:
f (z) = Re z = x
6.5. INTEGRATION IM KOMPLEXEN
γ1 :
z(t) = (1 + i)t, 0 ≤ t ≤ 1 ⇒ Re z = t
1
1+i
dz f (z) = dt (1 + i)t =
2
γ1
γ2 :
103
0
zunächst z(t) = t, 0 ≤ t ≤ 1, (Re z = t),
dann z(t) = 1 + it, 0 ≤ t ≤ 1, (Re z = 1),
1
1
1
dz f (z) = dt t + i dt = + i.
2
γ2
0
0
Der Wert des Integrals hängt in diesem Fall nicht nur von den Endpunkten
der Integrationskurve, sondern auch von ihrer Form ab.
Einige Eigenschaften komplexer Kurvenintegrale:
1. γ sei eine Kurve mit Anfangspunkt z1 und Endpunkt z2 . Bezeichnet man
die in der entgegengesetzten Richtung durchlaufene Kurve mit −γ (diese
besitzt also den Anfangpunkt z2 und den Endpunkt z1 ), so gilt
dz f (z) = − dz f (z)
−γ
γ
2.
dz [λ1 f1 (z) + λ2 f2 (z)] = λ1
γ
dz f1 (z) + λ2
γ
dz f2 (z),
γ
λ1,2 ∈
KAPITEL 6. KOMPLEXE ANALYSIS
104
dz f (z) ≤ M l(γ)
3.
γ
dabei ist l(γ) die Länge der Kurve γ und |f (z)| ≤ M für alle z auf γ, denn
n
n
n
Δzm f (ζm ) ≤
|Δzm | |f (ζm )| ≤ M
|zm | → M l(γ)
m=1
m=1
m=1
Bsp. : γ
dz ≤
z 2πr
r
'$
γ
r@@ I
= 2π
0
&%
Angenommen f (z) besitze eine Stammfunktion F (z), d.h. F (z) = f (z). Dann
ist
b
dz f (z) =
γ
b
dt ż(t)f (z(t)) =
a
a
b
dt
=
dt ż(t)F (z(t))
d
F (z(t)) = F (z(b)) − F (z(a)).
dt
a
Bemerkung: Dabei wurde verwendet, dass
dF (z) d
dz(t)
F (z(t)) =
dt
dz z=z(t) dt
ist:
F (x + iy) = u(x, y) + iv(x, y)
∂u
∂v
∂v
∂u
ẋ +
ẏ + i
ẋ +
ẏ .
⇒ Ḟ =
∂x
∂y
∂x
∂y
Andererseits ist
∂u
dF (z)
∂v ż =
+i
(ẋ + iẏ)
dz
∂x
∂y
∂v
∂y
− ∂u
∂y
∂u
∂u
ẋ +
ẏ + i
=
∂x
∂y
∂v
∂v
ẋ +
ẏ
∂x
∂y
= Ḟ .
6.5. INTEGRATION IM KOMPLEXEN
105
Wenn also f eine Stammfunktion besitzt, dann hängt
dz f (z)
γ
nur von den Endpunkten, aber nicht von der Form des dazwischenliegenden
Integrationsweges ab.
dz f (z) =
γ1
dz f (z)
γ2
Weiters folgt, dass der Wert des Integrals über eine geschlossene Kurve in diesem Fall verschwindet (da Anfangs- und Endpunkt der Kurve zusammenfallen).
dz f (z) = F (z0 ) − F (z0 ) = 0
γ
KAPITEL 6. KOMPLEXE ANALYSIS
106
Beispiele:
1. f (z) = k ∈
(k = const.)
⇒
F (z) = kz
∀z ∈
. Das Integral
z2
dz k = k(z2 − z1 )
z1
ist daher unabhängig von dem zwischen z1 und z2 gewählten Weg.
2. f (z) = z
⇒
F (z) = z 2 /2 ∀ z ∈
. Das Integral
z2
z 2 − z12
dz z = 2
2
z1
ist daher unabhängig vom Weg zwischen z1 und z2 .
3. f (z) = 1/z; F (z) = ln z ist mehrdeutig, man kann z.B. Ln z = ln r + iθ, r >
0, 0 ≤ θ < 2π auswählen. Dies ist aber keine Stammfunktion von 1/z
∀ z ∈ \ {0}, da Ln z längs der reellen Achse unstetig ist (Sprung um
2πi).
6.5. INTEGRATION IM KOMPLEXEN
Ln z ist aber Stammfunktion von 1/z, wenn man sich etwa auf das Gebiet
beschränkt.
In diesem Gebiet hängt dz
γ
dz
γ
1
z
107
\
+
nur von den Endpunkten ab:
1
r2
2
= [ln r + iθ]rr21 ,θ
+ i(θ2 − θ1 )
,θ1 = ln
z
r1
Wählt man r1 = r2 = r und θ1 = ε/2, θ2 = 2π − ε/2, so folgt
dz
= i(2π − ε) −→ 2πi.
ε→0
z
γ
Weiters ist
dz rε
0
z ≤ r = ε −→
ε→0
γ
für die direkte Verbindung γ der Länge l(γ ) = rε zwischen z2 und z1 . Somit
erhält man das Ergebnis, dass
.
dz
= 2πi
z
für eine beliebige geschlossene Kurve, die den Nullpunkt ein Mal im mathematisch positiven Sinn umläuft. (Für den Spezialfall eines Kreises mit Mittelpunkt
im Ursprung hatten wir dieses Resultat bereits hergeleitet.)
Umschließt dagegen eine geschlossene Integrationskurve γ den Nullpunkt nicht,
dann ist
dz
=0
z
108
KAPITEL 6. KOMPLEXE ANALYSIS
Diese Formeln kann man durch eine Verschiebung 0 → z0 sofort verallgemeinern
(γ ist wieder eine geschlossene Kurve, die ein Mal im mathematisch positiven
Sinn durchlaufen wird):
&
.
dz
2πi falls γ den Punkt z0 umschließt
=
0
falls γ den Punkt z0 nicht umschließt
z
−
z
0
γ
6.6
Integralsatz von Cauchy
Wir werden im Folgenden mit zusammenhängenden offenen Gebieten D ⊆
zu tun haben, bei denen je zwei Punkte z1,2 ∈ D durch eine (stückweise) glatte,
ganz in D liegende Kurve verbunden werden können.
Ein solches Gebiet heißt einfach zusammenhängend, falls jede einfach geschlossene (doppelpunktfreie) Kurve in D nur Punkte von D umschließt. Man
kann dies auch so ausdrücken, dass sich in diesem Fall jede einfach geschlossene,
in D liegende Kurve stetig auf einen in D liegenden Punkt zusammenziehen lässt,
ohne dass dabei D verlassen wird.
6.6. INTEGRALSATZ VON CAUCHY
109
Ein Punkt z ∈ D heißt Randpunkt von D, falls in jeder Umgebung von z
sowohl Punkte von D als auch nicht zu D gehörende Punkte liegen. Die Menge
der Randpunkte von D bildet den Rand von D, der mit ∂D bezeichnet wird.
Besteht ∂D aus (i. Allg. mehreren) einfach geschlossenen Kurven, so wählen wir
die Orientierung von ∂D so, dass sich D stets am linken Ufer des Randes befindet.
Ein nicht einfach zusammenhängendes Gebiet heißt mehrfach zusammenhängend. Das Innere eines Kreises ist einfach zusammenhängend, dagegen ist ein Kreisring mehrfach zusammenhängend (genauer: zweifach zusammenhängend). Ebenso ist D = {z ∈ | 0 < |z| < r} (das Innere eines Kreises,
bei dem der Mittelpunkt entfernt wurde) zweifach zusammenhängend. Allgemein
heißt ein beschränktes Gebiet D n-fach zusammenhängend, falls sein Rand ∂D aus
n voneinander getrennten geschlossenen Kurven oder isolierten Punkten besteht.
Beispiel für ein dreifach zusammenhängendes Gebiet:
Integralsatz von Cauchy: Ist f (z) holomorph in einem einfach zusammenhängenden offenen Gebiet D, dann gilt für jede (einfach) geschlossene Kurve γ in D:
dz f (z) = 0.
γ
Beweis: γ sei zunächst der Rand eines Dreiecks, der im mathematisch positiven
Sinn durchlaufen werde.
Man verbindet die Mittelpunkte der Dreiecksseiten und unterteilt das Dreieck
dadurch in vier kongruente Teildreiecke, deren Ränder mit γI , γII , γIII , γIV bezeichnet werden. Man erhält
dz f (z) = dz f (z) + dz f (z) +
dz f (z) + dz f (z),
γ
γI
γII
γIII
γIV
KAPITEL 6. KOMPLEXE ANALYSIS
110
da auf der rechten Seite entlang der drei Unterteilungsstrecken jeweils in beiden
Richtungen integriert wird und die entsprechenden Beiträge in der Gesamtsumme
somit wegfallen. Die Anwendung der Dreiecksungleichung ergibt
dz f (z) ≤ dz f (z) + dz f (z) + + dz f (z) .
dz
f
(z)
γ
γI
γII
γIII
γIV
Von den vier Summanden auf der rechten Seite wählt man den größten aus,
bezeichnet die entsprechende Randkurve mit γ1 und erhält
dz f (z) ≤ 4 dz f (z) .
γ
γ1
Das durch γ1 berandete Dreieck wird nun wie vorhin in Teildreiecke zerlegt. Für
eines von ihnen (mit Rand γ2 ) gilt wieder
dz f (z) ≤ 4 dz f (z)
γ1
γ2
dz f (z) ≤ 42 dz f (z) .
und somit
γ
γ2
Setzt man das Verfahren fort, dann erhält man eine unendliche Folge von Dreiecken D1 ⊃ D2 ⊃ D3 ⊃ . . . mit Rändern γ1 , γ2, γ3 , . . . und
n
dz f (z) ≤ 4 dz f (z) , n = 1, 2, 3, . . .
γ
γn
Es sei nun z0 jener Punkt, der in allen Dreiecken D1 , D2 , . . . enthalten ist. Da
die Funktion f laut Voraussetzung am Punkt z0 differenzierbar ist, kann man
schreiben
f (z) = f (z0 ) + f (z0 )(z − z0 ) + α(z)(z − z0 ),
6.6. INTEGRALSATZ VON CAUCHY
111
wobei lim α(z) = 0. Integriert man diesen Ausdruck längs der Randkurve γn , so
z→z0
erhält man
dz f (z) = dz f (z0 ) + dz f (z0 )(z − z0 ) + dz α(z)(z − z0 ).
γn
γn
γn
0
γn
0
Da α(z) → 0 für z → z0 , gibt es zu jedem ε > 0 ein δ(ε) > 0, sodass |α(z)| < ε ∀ z
mit |z − z0 | < δ(ε) . Wir wählen nun n so groß, dass für alle Punkte z ∈ Dn
|z−z0 | < δ(ε) ist. Bezeichnet man die Länge von γn mit ln , dann ist |z−z0 | ≤ ln /2
für alle z ∈ γn und z0 ∈ Dn . Somit erhält man
2
dz f (z) = dz α(z)(z − z0 ) < ε ln ln = εln .
2
2
γn
γn
Sei nun l die Länge von γ. Dann hat die Kurve γ1 die Länge l1 = l/2 und
schließlich hat γn die Länge ln = l/2n .
2
l
ε
ε
ε 2
n
n
2
n
l .
=
⇒ dz f (z) = 4 dz f (z) < 4 ln = 4
2
2 2n
2
γ
γn
Da ε > 0 beliebig klein gewählt werden kann, folgt
dz f (z) = 0.
γn
Bis jetzt hatten wir uns auf den Spezialfall beschränkt, dass γ der Rand eines
Dreiecks ist. Der Beweis für den Fall, dass es sich bei γ um den Rand eines
Polygons handelt folgt unmittelbar aus dem Beweis für ein Dreieck, da sich jedes
Polygon in Teildreiecke zerlegen lässt.
KAPITEL 6. KOMPLEXE ANALYSIS
112
Der allgemeine Fall einer einfach geschlossenen Kurve γ kann nun dadurch behandelt werden, dass man γ beliebig genau durch die Seiten eines Polygons approximiert.
Beispiele:
1.
-
dz ez = 0 für eine beliebige geschlossene Kurve γ, da ez in der gesam-
γ
ten komplexen Zahlenebene holomorph ist. In diesem Fall kann man auch
argumentieren, dass ez Stammfunktion von ez in der gesamten komplexen
Zahlenebene ist und das Kurvenintegral von ez über eine geschlossene Kurve
somit verschwinden muss.
2. Ebenso gilt dz sin z = dz cos z = 0 für eine beliebige geschlossene Kurve
γ.
γ
γ
3. Die komplexe Funktion
sin z
cos z
ist für jene Werte von z nicht definiert (und somit auch nicht differenzierbar), bei denen cos z = 0 ist. Es sind dies die auf der reellen Achse liegenden
Zahlen zn = π/2 + nπ, n ∈ . Der Cauchysche Integralsatz ist in diesem
Fall somit nur auf einfach zusammenhängende Gebiete anwendbar, welche
keine der Punkte zn enthalten. Man kann dies auch so formulieren:
dz tan z = 0,
tan z =
γ
falls die geschlossene Kurve γ keine der zn umschließt.
6.6. INTEGRALSATZ VON CAUCHY
113
Ist f holomorph in einem einfach zusammenhängenden offenen Gebiet D und sind
γ1 und γ2 zwei ganz in D liegende Kurven mit gemeinsamem Anfangspunkt z1
und gemeinsamem Endpunkt z2 , dann folgt aus dem Cauchyschen Integralsatz:
0 =
dz f (z) + dz f (z)
−γ2
γ1
dz f (z) −
=
γ1
dz f (z) =
γ1
dz f (z)
γ2
⇒
dz f (z),
γ2
d.h. das Integral ist wegunabhängig. Anders ausgedrückt: Bei festgehaltenem
Anfangs- und Endpunkt der Integrationskurve ändert sich der Wert des Integrals nicht, wenn man den Integrationsweg stetig deformiert (ohne dabei das
Holomorphiegebiet der Funktion zu verlassen).
Bis jetzt hatten wir immer angenommen, dass das Holomorphiegebiet D der betrachteten Funktion einfach zusammenhängend ist. Ist D dagegen mehrfach zusammenhängend, so kann dieses Gebiet in geeignete einfach zusammenhängende
Teilgebiete zerlegt werden, auf die dann der Cauchysche Integralsatz anwendbar
ist.
Beispiel: Das zweifach zusammenhängende Gebiet D enthalte die geschlossenen (im entgegengesetzten Sinn durchlaufenen) Kurven γ, γ, wobei wir annehmen
wollen, dass sich beide (innerhalb von D) nicht stetig auf einen Punkt zusammenziehen lassen. Die Funktion f sei auf D holomorph.
Die von γ , einem Teil von γ, γ und schließlich einem Teil von γ gebildete geschlossene Kurve liegt nun vollständig in einem einfach zusammenhängenden Holomorphiegebiet von f . Der Cauchysche Integralsatz ist somit anwendbar. Analog
KAPITEL 6. KOMPLEXE ANALYSIS
114
gilt dies für die aus −γ , dem zweiten Teil von γ, −γ und dem zweiten Teil von
γ gebildete geschlossene Kurve. Kombiniert man diese beiden Resultate und beachtet weiters, dass
dz f (z) + dz f (z) = dz f (z) +
dz f (z) = 0,
γ
−γ γ so erhält man das Ergebnis
dz f (z) +
γ
−γ dz f (z) = 0.
γ
Bevorzugt man für beide Kurven den gleichen Umlaufsinn, so hat man (γ1 := −γ)
dz f (z) = dz f (z)
γ
γ1
Für den allgemeinen Fall eines n + 1-fach zusammenhängenden Gebiets erhält
man:
n dz f (z) =
dz f (z)
γ
k=1 γ
k
6.6. INTEGRALSATZ VON CAUCHY
115
Eine andere Formulierung könnte auch so lauten: Sei D ein mehrfach zusammenhängendes Gebiet, dessen Rand ∂D aus einfach geschlossenen Kurven
besteht. Weiters liege D zusammen mit seinem Rand in einem Holomorphiegebiet der Funktion f . Dann gilt:
dz f (z) = 0
∂D
Beispiele:
1. Die Formel
dz
=
z
γ
dz
= 2πi
z
K
gilt für eine beliebige einfach geschlossene Kurve γ, die den Nullpunkt
umschließt:
2. Analog ist
&
dz(z − z0 ) =
n
γ
0
n = −1
2πi n = −1
für eine beliebige geschlossene Kurve, die den Punkt z0 (im mathematisch
positiven Sinn) ein Mal umschließt.
KAPITEL 6. KOMPLEXE ANALYSIS
116
3. Wir wollen
γ
dz
z2 + 1
für die abgebildete Integrationskurve berechnen.
Die geschlossene Integrationskurve γ wird gebildet
Intervall
aus dem reellen ,
+
[−R, +R] und dem Halbkreisbogen HR = Reiϕ 0 ≤ ϕ ≤ π, R > 1 .
dx
dz
+
2
2
x +1
z +1
−R
HR
1
dz
dz
1
2πi
=
=π
−
=
2i
z − i 2i
z+i
2i
γ
γ
dz
=
2
z +1
γ
+R
0
2πi
Um das reelle Integral
∞
−∞
dx
= lim
2
x + 1 R→∞
+R
−R
dz
+1
z2
zu bestimmen, benötigen wir eine Abschätzung für z 21+1 : Auf dem Halb-
6.6. INTEGRALSATZ VON CAUCHY
117
kreisbogen HR gilt:
⇒
⇒
⇒
R2 = |z 2 | = |(z 2 + 1) − 1| ≤ |z 2 + 1| + 1
R2 − 1 ≤ |z 2 + 1|
1
1
≥ 2
2
R −1
|z + 1|
dz πR
−→ 0
z 2 + 1 ≤ R2 − 1 R→∞
HR
∞
⇒
−∞
dx
=π
+1
x2
4. Umschließt die Integrationskurve γ von
γ
rere der Nullstellen zn =
π
2
dz tan z =
-
dz sin z/ cos z meh-
γ
+ nπ von cos z, so genügt es die Integrale
dz tan z
|z−zn |=r
zu berechnen, wobei der gegen den Uhrzeigersinn durchlaufene Kreis
|z − zn | = r innerhalb von γ liegt und außer zn keine weitere Nullstelle
umschließt. Da man den Radius r beliebig klein machen kann, muss man
das Verhalten des Integranden nur in infinitesimalen Umgebungen der von
γ umschlossenen zn untersuchen.
dz tan z =
dz tan z (zn innerhalb von γ)
γ
n
|z−zn |=r
KAPITEL 6. KOMPLEXE ANALYSIS
118
6.7
Unbestimmtes Integral
Wir wissen bereits: Wenn f (z) in einem offenen Gebiet D eine Stammfunktion
F (z) besitzt (d.h. F (z) = f (z)), dann ist
z2
dz f (z) = F (z2 ) − F (z1 )
z1
für beliebige, ganz in D liegende Integrationskurven mit Anfangspunkt z1 und
Endpunkt z2 . D.h. das Integral ist wegunabhängig.
Wir wollen nun eine Bedingung dafür angeben, dass eine Funktion f (z) eine
Stammfunktion F (z) besitzt:
Satz: Sei f (z) stetig in einem mehrfach zusammenhängenden offenen Gebiet D
-z2
und außerdem dz f (z) wegunabhängig in D, dann ist
z1
z
F (z) =
dz f (z )
z0
holomorph in D und F (z) = f (z).
Bemerkung: Die Voraussetzungen dieses Satzes sind insbesondere für jede in D
holomorphe Funktion erfüllt.
6.8. CAUCHYSCHE INTEGRALFORMEL
119
Beweis:
z+h
z
F (z + h) − F (z) =
dz f (z ) − dz f (z )
z0
z0
z+h
=
⇒
dz f (z )
z
z+h
dz [f (z ) − f (z)] F (z + h) − F (z)
= z
−
f
(z)
h
h
≤
max
z ∈{z |z =z+th, 0≤t≤1}
|f (z ) − f (z)|
Wegen der Stetigkeit von f gibt es zu jedem ε > 0 ein δ(ε) > 0, sodass |f (z ) −
f (z)| < ε sofern |z − z | < δ(ε). Wählt man nun |h| < δ(ε), so ist wegen |z − z| ≤
|h|
F (z + h) − F (z)
− f (z) < ε
h
und somit gezeigt, dass F (z) = f (z).
6.8
Cauchysche Integralformel
Die wichtigste Folgerung aus dem Cauchyschen Integralsatz ist die Cauchysche
Integralformel, die man, zusammen mit den notwendigen Voraussetzungen, in
dem folgenden Satz formulieren kann:
KAPITEL 6. KOMPLEXE ANALYSIS
120
Satz: Sei f (z) holomorph in einem einfach zusammenhängenden offenen Gebiet
D. Dann gilt für jeden Punkt z0 ∈ D und jede einfach geschlossene Kurve γ in
D, welche z0 umschließt
f (z)
dz
= 2πif (z0 ),
z − z0
γ
wobei die Integration im mathematisch positiven Sinn (gegen den Uhrzeigersinn)
erfolgt.
Beweis: f (z) = f (z0 ) + [f (z) − f (z0 )]
dz
f (z)
f (z) − f (z0 )
⇒
dz
= f (z0 )
+ dz
.
z − z0
z − z0
z − z0
γ
γ
γ
2πi
Wir müssen also zeigen, dass der zweite Term auf der rechten Seite verschwindet.
Dazu ersetzen wir γ durch eine Kreislinie K mit Mittelpunkt z0 . Da f stetig ist,
gibt es zu jedem ε > 0 ein δ(ε) > 0, sodass |f (z)−f (z0 )| < ε sofern |z−z0 | < δ(ε).
Wir wählen nun den Radius r von K kleiner als δ(ε)
f (z) − f (z0 ) < ε
⇒ z − z0 r
f (z) − f (z0 ) ε
⇒ dz
2πr = 2πε.
<
z − z0 r
K
Da ε beliebig klein gewählt werden kann, verschwindet dieses Integral tatsächlich.
Bemerkung: Dass man die Voraussetzung der Differenzierbarkeit von f in D
keinesfalls durch die schwächere Forderung der Stetigkeit von f in D ersetzen
6.8. CAUCHYSCHE INTEGRALFORMEL
121
kann, zeigt das folgende Gegenbeispiel mit der zwar stetigen, aber nicht holomorphen Funktion f (z) = (Re z)2 :
.
(Re z)2
dz
=
z
|z|=r
2π
(r cos t)2
dt ireit
reit
0
2π
= ir
dt cos2 t
2
0
2
= iπr = 0.
Beispiele: Berechnung von
dz
γi
1.
γ1
z2 + 1
z2 − 1
z2 + 1
dz
= 2πi
(z + 1)(z − 1)
)
z2 + 1
z−1
*
= −2πi
z=−1
durch Anwenden der Cauchyschen Integralformel mit z0 = −1 und f (z) =
(z 2 + 1)/(z − 1).
2.
γ2
z2 + 1
= 2πi
dz
(z + 1)(z − 1)
)
z2 + 1
z+1
*
= 2πi
z=1
durch Anwendung der Cauchyschen Integralformel mit z0 = 1 und f (z) =
(z 2 + 1)/(z + 1).
KAPITEL 6. KOMPLEXE ANALYSIS
122
3.
dz
γ3
z2 + 1
=0
z2 − 1
als direkte Konsequenz des Cauchyschen Integralsatzes.
Auch die Cauchysche Integralformel lässt sich auf den Fall eines mehrfach zusammenhängenden Gebiets verallgemeinern:
Satz: D sei ein mehrfach zusammenhängendes offenes Gebiet, dessen Rand ∂D
aus einfach geschlossenen (stückweise) glatten Kurven besteht. D möge zusammen
mit ∂D in einem Holomorphiegebiet liegen. Dann gilt für jeden Punkt z0 ∈ D,
dass
f (z)
dz
= 2πif (z0 ).
z − z0
∂D
6.9
Ableitungen einer holomorphen Funktion
Man kann in der Cauchyschen Integralformel
1
f (z)
f (z0 ) =
dz
2πi
z − z0
γ
(beliebig oft) unter dem Integralzeichen nach z0 differenzieren. Diese bemerkenswerte Tatsache lässt sich auf folgende Weise präzise formulieren:
Satz: Ist f (z) holomorph in einem offenen Gebiet D, dann ist f in D beliebig
oft differenzierbar, wobei
n!
f (z)
(n)
dz
, z0 ∈ D, n = 0, 1, 2, . . .
f (z0 ) =
2πi
(z − z0 )n+1
γ
6.9. ABLEITUNGEN EINER HOLOMORPHEN FUNKTION
123
Dabei ist γ eine einfach geschlossene, im Gegenuhrzeigersinn durchlaufene Kurve,
die zusammen mit ihrem Inneren in D liegt.
Der Beweis dieses Satzes erfolgt durch vollständige Induktion. Für n = 0
handelt es sich einfach um die Cauchysche Integralformel, von deren Gültigkeit
wir uns ja schon überzeugt hatten. Wir nehmen also an, dass die obige Formel für
die natürliche Zahl n richtig ist und versuchen aus dieser Annahme ihre Gültigkeit
für n + 1 zu folgern:
f (n) (z0 + h) − f (n) (z0 )
h→0
h
⎡
⎤
n! ⎣
f (z)
f (z)
⎦.
dz
−
dz
= lim
h→0 2πih
(z − z0 − h)n+1
(z − z0 )n+1
f (n+1) (z0 ) = lim
γ
γ
Hier wurde im ersten Schritt die Definition der n+1-ten Ableitung und im zweiten
die Induktionsannahme verwendet. Wir definieren nun eine Funktion g(z − z0 , h)
durch
*
)
1
1
n+1
1
−
+ g(z − z0 , h).
=
n+1
n+1
h (z − z0 − h)
(z − z0 )
(z − z0 )n+2
Oben eingesetzt ergibt dies
f
(n+1)
(n + 1)!
(z0 ) =
2πi
γ
f (z)
n!
dz
+
lim
n+2
(z − z0 )
2πi h→0
Wenn wir also zeigen können, dass
lim dz g(z − z0 , h)
h→0
γ
dz g(z − z0 , h).
γ
KAPITEL 6. KOMPLEXE ANALYSIS
124
verschwindet, dann haben wir den Satz bewiesen. Man rechnet leicht nach, dass
)
(n + 1)2
h
−
g(z − z0 − h) =
(z − z0 − h)n+1 (z − z0 )2
3
n+1 (−h)k−2
n+1
−
[z − z0 + (n + 1)h] ,
k+1
k
(z
−
z
0)
k=2
wobei letztlich nur wesentlich ist, dass
g(z − z0 , h) −→ 0.
h→0
Da
dz g(z − z0 , h) =
dz g(z − z0 , h),
|z−z0 |=r
γ
wobei man |h| ≤ r/2 wählen kann, erhält man mit Hilfe der Dreiecksungleichung
und
2
1
≤
|z − z0 − h|
d
die Abschätzung
dz g(z − z0 h) ≤ |h|C(r) + O(|h|2) −→ 0.
h→0
γ
Bemerkung: Dieser Satz zeigt, wie stark die Forderung der Differenzierbarkeit
einer Funktion im Komplexen ist. Ist sie ein Mal differenzierbar, so ist sie bereits
beliebig oft differenzierbar. Dies gilt für Funktionen f : → natürlich nicht.
Die Abbildung
&
0
für x < 0
f (x) =
2
für x ≥ 0
x
ist zwar für alle x ∈
nicht differenzierbar.
stetig differenzierbar, doch bereits f (x) ist bei x = 0
Wir können jetzt die Umkehrung des Satzes von Cauchy zeigen:
Satz von Morera: Ist f stetig in einem einfach zusammenhängenden offenen
Gebiet D und ist
dz f (z) = 0
γ
für jede geschlossene Kurve γ in D, dann ist f holomorph in D.
6.9. ABLEITUNGEN EINER HOLOMORPHEN FUNKTION
125
Beweis: Wir hatten bereits früher gezeigt, dass unter der Voraussetzung des
Satzes von Morera die Funktion
z
F (z) =
dz f (z )
z0
in D holomorph ist mit F (z) = f (z). Aus dem vorigen Satz folgt nun darüberhinaus, dass F (z) = f (z) ebenfalls holomorph ist.
Ungleichung von Cauchy: Sei f holomorph und K ein Kreis mti Radius R
und Mittelpunkt z0 . Weiters sei M das Maximum von |f (z)| auf K. Dann gilt
die Ungleichung
(n)
f (z0 ) ≤ n!M .
rn
Beweis: Man verwendet den Satz über die n-te Ableitung einer holomorphen
Funktion:
(n)
f (z)
f (z0 ) = n! dz
≤ n! M 2πr.
n+1
2π (z − z0 ) 2π r n+1
K
Aus dieser Ungleichung folgt der Satz von Louiville: Eine in ganz
und beschränkte Funktion ist konstant.
holomorphe
Beweis: Laut Voraussetzung ist |f (z)| < K ∀ z ∈ . Aus der Ungleichung von
Cauchy mit n = 1 folgt, dass
K
|f (z0 )| ≤
r
für beliebig großes r. Somit ist |f (z0 )| = 0 und da z0 beliebig ist, ist f (z) =
0 ∀ z ∈ ⇒ f (z) ist konstant.
Bemerkung: Auch das ist wieder ein Satz, der in der reellen Analysis nicht
gilt. So ist z.B. die Funktion x → cos x für reelle x differenzierbar und es gilt
| cos x| ≤ 1. Aber die Funktion ist offensichtlich nicht konstant.
Fundamentalsatz der Algebra: Jedes Polynom der Form
p(z) = z n + an−1 z n−1 + · · · + a1 z + a0 ,
n ≥ 1,
mit komplexen Koeffizienten ak besitzt mindestens eine komplexe Nullstelle.
Der Beweis wird indirekt geführt: Angenommen p(z) hätte in der ganzen komplexen Ebene keine Nullstelle. Dann wäre die Funktion
f (z) =
1
p(z)
KAPITEL 6. KOMPLEXE ANALYSIS
126
in ganz
holomorph . Setzt man z = 1/z̃, so ist
z̃ n
1
f (z) = f ( ) = g(z̃) =
z̃
1 + an−1 z̃ + · · · + a0 z̃ n
eine für z̃ = 0 stetige Funktion mit g(0) = 0. Wegen der Stetigkeit gibt es für alle
ε > 0 ein δ(ε) > 0, sodass |g(z̃)| < ε, sofern |z̃| < δ(ε). Das bedeutet aber, dass
|f (z)| < ε für |z| >
1
.
δ(ε)
Da f (z) im kompakten Gebiet |z| ≤ 1/δ(ε) stetig und damit beschränkt ist, ist
f (z) in ganz beschränkt und somit ist f (z) nach dem Satz von Louiville eine
konstante Funktion. Daraus folgt, dass auch p(z) konstant ist, was für Polynome
deren Grad mindestens gleich eins ist, sicher nicht zutrifft. Man erhält also einen
Widerspruch.
Bemerkung: Auch dieser Satz gilt im Reellen nicht. So besitzt z.B. das reelle
Polynom x2 + 1 keine reelle Nullstelle (sehr wohl aber komplexe Nullstellen ±i).
Aus dem Fundamentalsatz der Algebra folgt natürlich sofort, dass p(z) in der
Form
p(z) = (z − z1 )(z − z2 ) . . . (z − zn )
geschrieben werden kann, wobei die Zahlen zk ∈ die Nullstellen des Polynoms
sind, wobei natürlich auch zk = zl für k = l möglich ist. Bezeichnen wir nämlich
jene nach dem Fundamentalsatz der Algebra sicher existierende Nullstelle mit z1 ,
so haben wir
p(z) = z n + an−1 z n−1 + · · · + a1 z + a0
0 = z1n + an−1 z1n−1 + · · · + a1 z1 + a0 .
Subtrahiert man die beiden Zeilen und beachtet die Formel
z k − z1k = (z − z1 )(z k−1 + z k−2 z1 + · · · + z1k−1 ),
so erhält man
p(z) = (z − z1 )q(z)
mit einem Polynom q(z) vom Grad n−1. Auf dieses Polynom wendet man wieder
den Fundamentalsatz der Algebra an und gelangt durch Iteration des Verfahrens
schließlich zu der obigen Zerlegung von p(z) in Linearfaktoren.
6.10
Unendliche Reihen komplexer Zahlen
Vergleichskriterium: Es sei
∞
n=1
cn ,
cn ∈
6.10. UNENDLICHE REIHEN KOMPLEXER ZAHLEN
127
eine unendliche Reihe, über deren Konvergenz zu entscheiden sei. Hinreichend
für ihre Konvergenz ist, dass es nichtnegative Zahlen dn gibt, sodass |cn | ≤ dn
und die Majoranten-Reihe
∞
dn
n=1
konvergiert.
Die geometrische Reihe
∞
zn =
n=0
konvergiert für |z| < 1, z ∈
1
1−z
. Die Reihe divergiert für |z| ≥ 1.
Die geometrische Reihe als Vergleichsreihe: Die unendliche Reihe
∞
cn
n=1
ist konvergent, falls ab einem gewissen Index N |cn | ≤ Mq n mit M > 0 und
0 < q < 1.
Quotientenkriterium: Man betrachtet die Reihe
∞
cn .
n=1
Ist für alle n ≥ N
cn+1 cn ≤ q (0 < q < 1),
dann ist die Reihe absolut konvergent.
Ist dagegen
cn+1 cn ≥ 1 ∀ n ≥ N,
dann divergiert die Reihe.
Beweis:
|cN +1 | ≤ q|cN |,
|cN +2 | ≤ q|cN +1| ≤ q 2 |cN |,
...
...
|cN +ν | ≤ q ν |cN |.
⇒
∞
n=1
|cn | =
N
−1
n=1
|cn | +
∞
ν=0
|c
|≤
N+ν
≤q ν |cN |
N
−1
n=1
|cn | +
|cn |
.
1−q
KAPITEL 6. KOMPLEXE ANALYSIS
128
Ist dagegen
cn+1 cn ≥ 1 ∀ n ≥ N
⇒ |cn+1 | ≥ |cn |, d.h. die cn bilden keine Nullfolge und die Reihe ist daher divergent.
Manchmal sieht man folgende Formulierung des Quotientenkriteriums: Angenom∞
men |cn+1 /cn | ist konvergent und lim |cn+1 /cn | = L.
cn ist dann absolut konn→∞
n=1
vergent, falls L < 1 und divergent, falls L > 1. Im Fall L = 1 ist keine Aussage
über die Konvergenz der Reihe möglich.
Diese Form des Quotientenkriteriums folgt unmittelbar aus der usrprünglichen
Formulierung:
1. Es sei L < 1. Man wähle ε > 0 so, dass L + ε < 1. Da |cn+1 /cn | −→ L gibt
es einen Index N(ε), sodass ||cn+1 /cn | − L| < ε ∀ n ≥ N(ε).
cn+1 < L + ε ∀ n ≥ N(ε).
⇒ cn n→∞
q
∞
⇒
cn ist konvergent.
n=1
2. Es sei L > 1. Dann ist |cn+1 /cn | > 1 für fast alle n. ⇒
∞
cn ist divergent.
n=1
Beispiele:
1. Für die Potenzreihe der Exponentialfunktion,
∞
zn
,
e =
n!
n=0 z
z∈
,
cn
gilt
für beliebiges z ∈
2. Die Reihe
cn+1 z |z|
−→ 0 < 1
cn = n + 1 = n + 1 n→∞
. Die Reihe konvergiert daher in ganz .
∞
1
n
n=1
6.10. UNENDLICHE REIHEN KOMPLEXER ZAHLEN
129
ist divergent, aber
1 n cn+1 n+1
−→ 1.
cn = 1 = n + 1 n→∞
n
In diesem Fall gestattet das Quotientenkriterium keine Aussage.
3. Die Reihe
∞
1
n2
n=1
ist konvergent, aber
1 n2 cn+1 (n+1)
2 −→ 1.
cn = 1 = (n + 1)2 n→∞
n2
Wieder versagt das Quotientenkriterium.
4. Im Fall der Reihe
1 + 12 + 18
1
+ 64
+ 18
1
+ 12
ist
1
+ 16
1
+ 128
1
+ 64
+ 12 ·
1
+ 512
+ 12 ·
1
8
1
+ 512
+··· =
1
64
+...
cn+1 1 1 1 1
cn = 2 , 4 , 2 , 4 , . . .
Das Quotientenkriterium in der zweiten Fassung ist in diesem Fall nicht
anwendbar, wohl aber in der ersten Fassung, da
cn+1 1
cn ≤ 2 < 1 ∀ n.
Die Reihe ist daher konvergent.
Wurzelkriterium: Man betrachtet die Reihe
∞
cn .
n=1
Wenn für alle n ≥ N gilt, dass n |cn | ≤ q < 1ist, dann ist die Reihe absolut
konvergent. Ist dagegen für unendlich viele n n |cn | ≥ 1, dann divergiert die
Reihe.
KAPITEL 6. KOMPLEXE ANALYSIS
130
Beweis:
1.
n
|cn | ≤ q < 1 ⇒ |cn | ≤ q n
⇒
∞
cn ist absolut konvergent durch
n=1
Vergleich mit der geometrischen Reihe.
2. n |cn | ≥ 1 für unendlich viele n ⇒ |cn | ≥ 1 für unendlich viele n ⇒ cn
bilden keine Nullfolge ⇒ die Reihe ist divergent.
Eine andere Formulierung des Wurzelkriteriums: Ist n |cn | konvergent mit dem
Limes L, dann ist die Reihe absolut konvergent, falls L < 1 ist und divergent für
L > 1. Für L = 1 ist keine Aussage möglich.
Beweis: Analog zum Beweis der zweiten Version des Quotientenkriteriums.
Beispiele:
1. Die Reihe
∞
n2
n=1
ist konvergent, da
(
n
e2/n ln n
1
n2
e0
n2/n
=
−→
= < 1.
=
n
n→∞ 2
2
2
2
2
ln x
x→∞ x
Bemerkung: lim
2n
= lim
1
x
x→∞ 1
= 0.
2. Für die divergente Reihe
∞
1
n
n=1
gestattet das Wurzelkriterium keine Aussage, da
(
1
1
n 1
= 1/n = 1/n ln n −→ 1.
n→∞
n
n
e
3. Auch für die konvergente Reihe
∞
1
n2
n=1
ist mit Hilfe des Wurzelkriteriums keine Entscheidung möglich:
(
1
1
1
n
= 2/n = 2/n ln n −→ 1.
2
n→∞
n
n
e
6.11. POTENZREIHEN
131
Was macht man, wenn die Folge n |cn | keinen Grenzwert besitzt? Im Allgemeinen wird die Folge einfach mehrere Häufungspunkte besitzen. Den größten
dieser Häufungspunkte bezeichnet man mit
lim sup n |cn | ≡ lim n |cn |
n→∞
n→∞
Man kann daher das Wurzelkriterium auch so formulieren:
lim sup
n
n→∞
lim sup
n→∞
6.11
n
|cn | < 1 ⇒
|cn | > 1 ⇒
∞
n=1
∞
cn absolut konvergent,
cn divergent.
n=1
Potenzreihen
Wir stellen uns nun die Frage, für welche z ∈
∞
an z n ,
eine Potenzreihe
an ∈
n=0
konvergiert. Wir wenden das Wurzelkriterium auf cn = an z n an und erhalten die
Aussage, dass die Reihe absolut konvergiert, wenn
lim sup n |an ||z| < 1.
n→∞
Anders ausgedrückt, die Potenzreihe ist absolut konvergent, für alle z ∈
|z| <
1
lim sup
n→∞
n
|an |
mit
=: ρ.
Dieser Ausdruck für den Konvergenzradius ρ der Reihe wird auch als Formel
von Cauchy-Hadamard bezeichnet. Für |z| > ρ divergiert die Potenzreihe und
für |z| = ρ kann sie konvergent oder divergent sein.
Ist die Folge |an+1 /an | konvergent, dann kann das Quotientenkriterium zur Berechnung des Konvgergenzradius benutzt werden. Die Potenzreihe ist konvergent,
wenn
an+1 z an+1 |z| < 1,
lim
= lim n→∞ an n→∞
an das heißt die Reihe ist für alle z ∈
|z| <
mit
1
=ρ
lim an+1
an n→∞
KAPITEL 6. KOMPLEXE ANALYSIS
132
konvergent.
Bemerkung: Die hier angestellten Überlegungen gelten natürlich auch für Potenzreihen vom Typ
∞
an (z − z0 )n ,
n=0
wenn man z durch z − z0 ersetzt.
Beispiele:
∞
1. Die geometrische Reihe
z n besitzt den Konvergenzradius ρ = 1. Sie ist
n=0
für |z| = 1 divergent, da die Zahlen einθ keine Nullfolge bilden.
2. Für die Reihe
∞
n=1
zn
n
ergibt das Quotientenkriterium:
an+1
=
an
1
n+1
1
n
=
n
−→ 1
n + 1 n→∞
⇒ ρ = 1.
Abgesehen von z = 1 ist diese Reihe für |z| = 1 konvergent.
3. Das Quotientenkriterium liefert für die Reihe
∞
n=1
an+1
=
an
1
(n+1)2
1
n2
=
n2
−→ 1
(n + 1)2 n→∞
zn
:
n2
⇒ ρ = 1.
Diese Reihe ist für alle z mit |z| = 1 konvergent.
4. Die Potenzreihenentwicklung der Exponentialfunktion,
∞
zn
n=0
n!
,
ist nach dem Quotientenkriterium für alle z ∈
an+1
=
an
1
(n+1)!
1
n!
=
1
−→ 0
n + 1 n→∞
konvergent:
⇒ ρ = ∞.
6.12. REIHEN VON FUNKTIONEN
6.12
133
Reihen von Funktionen
Die Potenzreihe ist ein Spezialfall einer Funktionenreihe,
∞
gk (z),
k=0
definiert sind.
wobei die Funktionen gk auf einem gemeinsamen Gebiet G ⊆
Man sagt, dass eine solche Reihe in G gleichmäßig gegen die Funktion f (z)
konvergiert,
falls es zu jedem
ε > 0 einen von z unabhängigen Index N(ε) gibt,
n
gk (z) < ε, sofern n ≥ N(ε).
sodass f (z) −
k=0
Das Konvergenzkriterium von Weierstrass besagt, dass
gleichmäßig und absolut konvergiert, wenn für alle z ∈ G
n
gk (z) in G
k=0
|gk (z)| ≤ ck
und die Reihe
n
ck konvergent ist.
k=0
Beweis: Laut Voraussetzung gibt es zu jedem ε > 0 einen Index N(ε), sodass
cn+1 + cn+2 + · · · + cn+p < ε
für alle p > 0, sofern n ≥ N(ε) (Cauchysches Konvergenzkriterium für die Reihe
∞
ck ). Dann ist aber auch
k=0
|gk+1 (z) + · · · + gk+p (z)| ≤ |gk+1 (z)| + · · · + |gk+p(z)|
≤ ck+1 + · · · + ckp < ε
unabhängig von z ∈ G.
∞
Satz: Ist f (z) =
gk (z) in einem Gebiet G ⊆
k=0
gleichmäßig konvergent und
sind die einzelnen Funktionen gk (z) stetig an einem Punkt z0 ∈ G, dann ist auch
die Funktion f am Punkt z0 stetig.
Beweis: Wir betrachten die n-te Partialsumme
n
gk
sn =
k=0
und den dazugehörigen Reihenrest
Rn =
∞
k=n+1
gk .
KAPITEL 6. KOMPLEXE ANALYSIS
134
Es sei nun eine Zahl ε > 0 vorgegeben. Dann kann man wegen der gleichmäßigen
Konvergenz der Reihe einen (von z unabhängigen) Index N finden, sodass
|RN (z)| <
ε
3
∀ z ∈ G.
Da sN die Summe von endlich vielen an der Stelle z0 stetigen Funktionen ist,
ist sN bei z0 stetig. Man kann daher ein δ > 0 finden, sodass
ε
|sN (z) − sN (z0 )| <
∀ z ∈ G mit |z − z0 | < δ
3
⇒ |F (z) − F (z0 )| = |sN (z) + RN (z) − sN (z0 ) − RN (z0 )|
≤ |sN (z) − sN (z0 )| + |Rn (z)| + |RN (z0 )|
< ε ∀ z mit |z − z0 | < δ
⇒ F ist an der Stelle z0 stetig.
Falls die Funktionen gk in allen Punkten einer in G liegenden Kurve γ der Länge
∞
l(γ) < ∞ stetig sind, dann ist somit f (z) =
gk (z) auf γ stetig und kann daher
k=0
längs dieser Kurve integriert werden. Es gilt
∞ dz f (z) =
dz gk (z),
k=0 γ
γ
d.h. eine gleichmäßig konvergente Reihe stetiger Funktionen kann gliedweise
integriert werden. Der Beweis dieser Behauptung folgt unmittelbar aus der
Abschätzung
dz f (z) − dz sn (z) = dz [f (z) − sn (z)] ≤ |f (z) − sn (z)| l(γ).
γ
γ
γ
Es seien nun die Funktionen gk in einem einfach zusammenhängenden offenen
∞
Gebiet G holomorph und
gk in jeder kompakten Teilmenge von G gleichmäßig
k=0
konvergent. Dann folgt aus den eben bewiesenen Sätzen, dass f in G stetig ist und
die Reihe längs jeder ganz in G verlaufenden Kurve gliedweise integriert werden
kann. Insbesondere gilt für jede geschlossene, ganz in G verlaufende Kurve γ
.
∞ .
dz f (z) =
dz gk (z) = 0,
k=0 γ
γ
da wegen des Cauchyschen Integralsatzes
.
dz gk (z) = 0
γ
6.12. REIHEN VON FUNKTIONEN
135
für die holomorphen Funktionen gk . Nach dem Satz von Morera ist somit auch
die Funktion f in G holomorph.
Es sei nun γ eine ganz in G liegende, einfach geschlossene und im Gegenuhrzeigersinn durchlaufene Kurve. Dann gilt für alle Punkte z0 im Inneren von γ,
dass
.
1
f (z)
f (z0 ) =
dz
2πi
z − z0
γ
1
=
2πi
=
1
2πi
.
∞
gk (z)
dz
z − z0
k=0
γ
.
∞
dz
k=0 γ
gk (z)
.
z − z0
Nur der letzte Schritt bedarf einer Erläuterung: Es sei
d = inf |z − z0 |,
z∈γ
∞
d.h. |z − z0 | > d ∀ z ∈ γ. Da die Reihe
gk (z) laut Voraussetzung auf der durch
k=0
die Kurve gebildeten γ kompakten Menge gleichmäßig und absolut konvergent
ist, ist wegen der für alle z ∈ γ erfüllten Ungleichung
gk (z) |gk (z)|
z − z0 < d
auch die Reihe
∞
gk (z)
z − z0
k=0
auf γ gleichmäßig konvergent. Die Vertauschung von Summe und Integral ist
somit gerechtfertigt. Völlig analog zeigt man, dass unter den obigen Voraussetzungen auch
n! (z0 ) =
2πi k=0
∞
f
(n)
.
γ
(n)
gk (z)
dz
=
gk (z0 ),
(z − z0 )n+1
k=0
erfüllt ist. Das heißt, die Reihe
∞
∞
k=0
werden.
n = 0, 1, 2, . . .
gk (z) kann beliebig oft gliedweise differenziert
KAPITEL 6. KOMPLEXE ANALYSIS
136
6.13
Sätze über Potenzreihen
Die im vorigen Abschnitt über Reihen von Funktionen erhaltenen Resultate
können nun auf den Spezialfall von Potenzreihen angewendet werden.
Satz: Eine Potenzreihe
f (z) =
∞
ak z k
k=0
mit Konvergenzradius ρ konvergiert in jedem kompakten Gebiet Kr = {z |z| ≤
r, r < ρ} gleichmäßig und absolut. Sie ist für |z| < ρ beliebig oft gliedweise
differenzierbar. Der Konvergenzradius der abgeleiteten Reihe ist wieder ρ. Ebenso
kann die Potenzreihe für |z| < ρ gliedweise integriert werden.
Bemerkung: Dass
f (z) =
∞
kak z k−1
k=1
den gleichen Konvergenzradius wie f (z) besitzt, folgt aus
k
√
k
|kak | = k k |ak |.
−→ 1
k→∞
Ebenso hat die durch gliedweise Integration von f (z) erhaltene Potenzreihe
∞
ak k+1
z
F (z) =
k
+
1
k=0
den gleichen Konvergenzradius, da
(
lim sup
k→∞
k+1
|ak |
= lim sup k |ak |.
k + 1 k→∞
Definition: f heißt analytisch in einem Gebiet D ⊆
z0 ∈ G in eine Potenzreihe
∞
ak (z − z0 )k
, wenn f in jedem Punkt
k=0
mit Konvergenzradius ρ > 0 entwickelbar ist.
f analytisch ⇒ f holomorph
6.14. TAYLORREIHEN
137
Identitätssatz für Potenzreihen: Wenn zwei Potenzreihen
∞
∞
ak z k und
k=0
bk z k für |z| < ρ (ρ > 0) konvergieren und wenn für |z| < ρ gilt
k=0
∞
k
ak z =
∞
k=0
bk z k ,
k=0
dann ist ak = bk für k = 0, 1, 2, . . . .
Beweis: Setzt man z = 0 ein, so folgt a0 = b0 . Nach n-maligem Differenzieren
und Einsetzen von z = 0 erhält man an = bn .
Bemerkung:
f (z) =
∞
ak z k ⇒ f (n) (0) = n! an
k=0
⇒
f (z) =
∞
f (k) (0)
k!
k=0
zk .
Jede Potenzreihe ist Taylorsche Reihe der durch sie dargestellten Funktion.
6.14
Taylorreihen
Die Funktion f sei holomorph in einer Umgebung des Ursprungs. Sei K ein
Kreis mit Mittelpunkt 0, der ganz in dieser Umgebung liegt. Wir wenden die
Cauchysche Integralformel an (z im Inneren von K):
f (z) =
1
2πi
4
K
dz f (z )/(z − z)
'$
K
•
I
z
•
z
&%
1
1
=
,
z − z
z (1 − zz )
z
< 1
z
KAPITEL 6. KOMPLEXE ANALYSIS
138
1 + q + q2 + · · · + qn =
1 − q n+1
,
1−q
q = 1
q n+1
1
= 1 + q + q2 + · · · + qn +
1−q
1−q
⎡
z n+1 ⎤
n k
f (z ) z
f (z ) 1 ⎣
dz + dz z z ⎦
⇒ f (z) =
2πi k=0
z
z
z 1 − z
K
K
⎡
⎤
⇒
⎢
⎥
n
⎥
1 ⎢
f
(z
)
f
(z
)
⎢ k
⎥
n+1
=
z
dz k+1 +z
dz ⎢
⎥
n+1
2πi ⎢
(z )
(z − z)(z ) ⎥
k=0
⎣
⎦
K
K
2πif (k) (0)
=
n
f (k) (0)
k!
k=0
f (z )
z n+1
z +
dz 2πi
(z − z)(z )n+1
K
k
Rn (z)
Noch zu zeigen: Rn (z) −→ 0, z innerhalb von K.
n→∞
z liegt auf K, z innerhalb von K ⇒ |z − z | > 0.
f (z ) < M ∀ z ∈ K (für festes z)
⇒ z − z r sei der Radius von K.
⇒
|z|n+1 2πr
M n+1 =
2π
r
|z|n+1
= Mr n+1 −→ 0
n→∞
r
|Rn (z)| ≤
Allgemein:
f (z) =
∞
f (k) (z0 )
k=0
k!
da
(z − z0 )k
f holomorph ⇒ f analytisch
Zusammen mit dem früheren Resultat:
f holomorph ⇔ f analytisch
|z|
<1
r
6.15. LAURENTREIHEN
139
Bemerkung: Das ist wieder ein Resultat, das in der reellen Analysis nicht gilt,
denn dort folgt aus der Differenzierbarkeit einer Funktion keineswegs auch schon
deren Analytizität. Man betrachte die durch
&
0
für x ≤ 0
f (x) =
−1/x
für x > 0
e
definierte Funktion f : → . f ist am Punkt x = 0 zwar beliebig oft differenzierbar, doch die Taylorreihe
∞
f (k) (0) k
x
k!
k=0
stellt wegen f (k) (0) = 0 für k = 0, 1, 2, . . . die Funktion f in keiner noch so
kleinen Umgebung des Punktes 0 dar.
Beispiele für Taylorreihen:
1. cos z =
∞
2k
z
(−1)k (2k)!
=1−
k=0
2. sin z =
∞
z2
2!
2k+1
z
(−1)k (2k+1)!
=z−
k=0
6.15
+
z3
3!
z4
4!
+
− +...
z5
5!
− +...
Laurentreihen
Wir betrachten eine unendliche Reihe der Form
f (z) =
∞
an (z − z0 ) =
n
∞
∞
n=1
an (z − z0 ) +
n=0
n=−∞
n
f1 (z)
1
lim sup
n
n≥0
|an |
= ρ1 ,
f2 (z) ist konvergent für
lim sup
n≥1
n
|a−n |
1
< 1,
|z − z0 |
das heißt für
|z − z0 | > lim sup
n≥1
n
f2 (z)
f1 (z) ist konvergent für
|z − z0 | <
a−n (z − z0 )n .
|a−n | = ρ2
KAPITEL 6. KOMPLEXE ANALYSIS
140
⇒ f ist konvergent für ρ2 < |z − z0 | < ρ1 .
Satz: Jede in einem Kreisring ρ2 < |z − z0 | < ρ1 holomorphe Funktion lässt
sich in diesem Kreisring in eine Laurentreihe entwickeln. Für die Koeffizienten
an , n ∈ gilt:
f (z )
1
dz an =
2πi
(z − z0 )n+1
γ
Bemerkung: Aus diesem Satz folgt insbesondere, dass die Laurentreihe gliedweise integriert werden kann:
n = −1 :
a−1
1
=
2πi
dz f (z )
γ
Beweis: Ich beschränke mich der Einfachheit halber auf den Fall z0 = 0. Nach
6.15. LAURENTREIHEN
141
der Cauchyschen Integralformel ist
f (z )
1
1
f (z )
dz −
dz f (z) =
2πi
z − z 2πi
z −z
K1
K2
f1 (z)
f2 (z)
Bei der Integration über K1 ist |z/z | < 1. Man entwickelt daher
z
1
1
= −z
z 1−
z
z
in eine geometrische Reihe
z n 8
17
z
1 z n+1
1
= 1+ +···+ + z − z
z
z
z
z − z z
und schätzt den sich ergebenden Reihenrest wie im Beweis für die Taylorreihe
ab.
∞ f (z ) z n
1 dz ⇒ f1 (z) =
2πi n=0
z (z )n
K1
1
f (z )
=
z
dz n+1 .
2πi
(z )
n=0
K1
∞
n
an , n≥0
Die Verschiebung K1 → γ ist möglich, da der Integrand f (z )/(z )n+1 im Gebiet
zwischen K1 und γ holomorph ist.
Bei der Integration über K2 ist |z /z| < 1, man setzt daher
n+1
)
n *
1
z
1
z
z
1
+
=
1+ + ···+
z −z
z
z
z
z−z z
KAPITEL 6. KOMPLEXE ANALYSIS
142
in das Integral ein. Wieder kann man sich überzeugen, dass der Reihenrest gegen
Null konvergiert und man erhält
1 f2 (z) =
2πi
∞
k=0 K
dz f (z ) k
(z )
z k+1
2
∞
1 1
=
dz f (z )(z )n−1 .
n 2πi
z
n=1
K2
a−n
Wieder ist die Verschiebung des Integrationsweges K2 → γ möglich.
Bemerkung: Die Laurentreihe einer gegebenen holomorphen Funktion ist innerhalb ihres Konvergenzkreisringes eindeutig.
Beispiele:
1. Die Laurententwicklung von z 2 e1/z um z0 = 0,
2 1/z
z e
1
1
1
1
= z 1+
+
+
+ ...
+
1!z 2!z 2 3!z 3 4!z 4
z
1
1
1
= z2 + + +
+ ...
+
1! 2! 3!z 4!z 2
2
ist für |z| > 0 konvergent.
2. Laurentreihen der Funktion
f (z) =
um z0 = 1:
1
1 − z2
6.15. LAURENTREIHEN
143
1
1
=−
(1 − z)(1 + z)
(z + 1)(z − 1)
1
1
1
1
=
=
=
z+1
2 + (z − 1)
2 1 − z−1
2
∞
∞
(−1)n
1 (−1)n
n
(z − 1) =
(z − 1)n
=
n
n+1
2 n=0 2
2
n=0
f (z) =
konvergiert für |z − 1| < 2.
⇒
f (z) =
∞
(−1)n+1
2n+1
n=0
= −
(z − 1)n−1
1 1
1
1 1
+ − (z − 1) + (z − 1)2 + . . .
2z −1 4 8
16
für 0 < |z − 1| < 2.
Entwicklung für |z − 1| > 2:
1
1
1
=
=
=
2
1+z
z−1+2
(z − 1)(1 + z−1
)
n ∞ ∞
(−2)n
1 2
=
=
−
z − 1 n=0
z−1
(z − 1)n+1
n=0
2 < 1, d.h. |z − 1| > 2.
konvergiert für z−1
⇒
f (z) = −
∞
n=0
= −
(−2)n
(z − 1)n+2
1
2
4
+
−
+ ...
2
3
(z − 1)
(z − 1)
(z − 1)4
für |z − 1| > 2.
Bemerkung: Ist z0 der einzige singuläre Punkt von f (z) in einer gewissen Umgebung von z0 , dann konvergiert die Laurentreihe um z0 in einem Bereich von
der Form 0 < |z − z0 | < R. Die Singularität von f (z) bei z = z0 heißt Pol,
wenn die Laurententwicklung endlich viele negative Potenzen besitzt. Sie heißt
wesentliche Singularität, wenn die Laurententwicklung unendlich viele negative Potenzen besitzt. Entscheidend ist dabei, dass die Laurententwicklung in der
Umgebung von z0 untersucht wird! Eine Funktion, die bis auf Pole holomorph
ist, heißt meromorph.
KAPITEL 6. KOMPLEXE ANALYSIS
144
6.16
Residuen
Die Funktion f habe eine isolierte Singularität bei z = z0 . Dann kann f in einer
Umgebung von z0 (mit Ausnahme von z0 ) durch eine Laurentreihe beschrieben
werden:
∞
f (z) =
an (z − z0 )n
n=−∞
konvergiert für 0 < |z − z0 | < R. R ist der Abstand von z0 zur nächsten Singularität von f .
Wir wissen:
Diese Zahl bezeichnet man als Residuum von f an der Stelle z0 .
⇒
dz f (z) = 2πi Resf (z)
z=z0
γ
Beispiel:
)
*
1
1
z3 z5
1
z
sin z
+
− +... = 3 +
+ − +...
f (z) = 4 = 4 z −
z
z
3!
5!
z
3!z 5!
a−1 = Resf (z) = −
⇒
z=0
⇒
dz
γ
1
3!
πi
sin z
2πi
=−
=−
4
z
3!
3
6.16. RESIDUEN
145
Methoden zur Berechnung des Residuums:
Angenommen f hat einen einfachen Pol an der Stelle z0 , d.h.
a−1
+
an (z − z0 )n
z − z0 n=0
∞
f (z) =
(z − z0 )f (z) = a−1 +
∞
(0 < |z − z0 | < R)
an (z − z0 )n+1
n=0
⇒
Resf (z) = a−1 = lim (z − z0 )f (z)
z=z0
z→z0
für einfachen Pol.
Anwendung auf Funktionen der Gestalt
f (z) =
p(z)
.
q(z)
p, q holomorph bei z = z0 , p(z0 ) = 0, q(z) habe eine einfache Nullstelle bei z = z0 ,
q(z0 ) = 0.
q (z0 )
(z − z0 )2 + . . .
q(z) = q (z0 )(z − z0 ) +
2!
Resf (z) =
z=z0
lim (z − z0 )
z→z0
p(z)
q(z)
(z − z0 )p(z)
z→z0 (z − z0 ) [q (z0 )(z − z0 ) + q (z0 )(z − z0 )2 /2! + . . . ]
p(z0 )
= q (z0 )
=
lim
⇒
p(z0 )
p(z)
= z=z0 q(z)
q (z0 )
Resf (z) = Res
z=z0
im Fall eines einfachen Pols bei z0 .
Beispiel: Die Funktion
f (z) =
hat einfache Pole bei z = 0 und z = 1.
4 − 3z
z2 − z
4 − 3z = −4
Resf (z) =
z=0
2z − 1 z=0
4 − 3z =1
Resf (z) =
z=1
2z − 1 z=1
KAPITEL 6. KOMPLEXE ANALYSIS
146
Pole höherer Ordnung:
f habe einen Pol der Ordnung m > 1 am Punkt z0 :
∞
a−m
a−1
f (z) =
+···+
an (z − z0 )n
+
m
(z − z0 )
(z − z0 ) n=0
(z − z0 ) f (z) = a−m + · · · + a−1 (z − z0 )
m
=:g(z)
⇒
m−1
+
∞
an (z − z0 )n+1
n=0
g (m−1) (z0 )
z=z0
(m − 1)!
*
) m−1
d
1
m
=
lim
(z − z0 ) f (z)
(m − 1)! z→z0 dz m−1
a−1 = Resf (z) =
für einen Pol m-ter Ordnung.
Beispiel: Die Funktion
2z
(z + 4)(z − 1)2
hat einen Pol zweiter Ordnung an der Stelle z = 1.
)
*
d
2z
1
8
(z + 4)2 − 2z 2
(z − 1)
=
Resf (z) = lim
=
z=1
1! z→1 dz
(z + 4)(z − 1)2
(z + 4)2
25
z=1
f (z) =
Partialbruchzerlegung:
A
B
C
1
=
+
+
2
(z + 4)(z − 1)
z + 4 z − 1 (z − 1)2
1 = A(z − 1)2 + B(z + 4)(z − 1) + C(z + 4)
z=1
z = −4
z=0
1 = 5C
⇒
C=
1
25
1 = A − 4B + 4C
1
5
A=
⇒ 4B = A + 4C − 1 =
4 25
1 + 20 − 25
4
1
+ −
=
=−
25 5 25
25
25
1
25
)
*
4z
5
z
2
2z
+
+
=
f (z) =
(z + 4)(z − 1)2
25 z + 4 z − 1 (z − 1)2
8
8
⇒ Resf (z) = , Res f (z) = −
z=1
z=−4
25
25
2z 8
Res f (z) =
=−
2
z=−4
(z − 1) z=−4
25
⇒ B=−
6.17. RESIDUENSATZ
6.17
147
Residuensatz
Die Funktion f sei holomorph, bis auf endlich viele Singularitäten z1 , . . . , zn .
Dann gilt
n n
dz f (z) =
dz f (z) = 2πi
Res f (z),
k=1 γ
γ
k
k=1
z=zk
wobei γk nur zk umschließt, aber keine weitere Singularität von f .
Beispiele:
1. Die Funktion
4 − 3z
z2 − z
hat einfache Pole bei z = 0 und z = 1 mit Residuen −4 und 1.
4 − 3z
= 2πi(−4 + 1) = −6πi
dz 2
⇒
z −z
γ
für jede einfach geschlossene Kurve γ, die 0 und 1 umschließt.
KAPITEL 6. KOMPLEXE ANALYSIS
148
Umschließt dagegen eine Kurve γ nur den den Nullpunkt, aber nicht den
Punkt 1, so ist
4 − 3z
= 8πi.
z2 − z
γ
2. Die Funktion
f (z) =
(z 3
1
− 1)2
hat Pole zweiter Ordnung bei z = 1, e2πi/3 , e4πi/3 .
Die Kurve γ umschließt nur den Pol bei z = 1.
)
*
d
1
1
2
Resf (z) =
lim
(z − 1) 3
z=1
1! z→1 dz
(z − 1)2
2
z−1
d
= lim
z→1 dz
(z − 1)(z 2 + z + 1)
= −2(z 2 + z + 1)−3 (2z + 1)z=1
2
2
= − 33 = −
3
9
1
4πi
.
dz 3
=−
⇒
2
(z − 1)
9
γ
6.18. BERECHNUNG VON REELLEN INTEGRALEN
6.18
149
Berechnung von reellen Integralen
Die Berechnung von vielen Typen bestimmter und uneigentlicher Integrale reeller
Funktionen kann mit Hilfe des Residuensatzes in wenigen Zeilen abgetan werden.
1. Integrale vom Typ
∞
dx f (x).
−∞
f sei eine rationale Funktion mit f (z) −→ k/z m , m ≥ 2, ohne reelle Pole.
z→∞
+r
dz f (z) +
dz f (z) = 2πi
Res f (z)
−r
|k|
dz f (z) < m πr −→ 0,
r→∞
r
δ(r)
∞
⇒
dx f (x) = 2πi
k
∞
−∞
da m ≥ 2
−∞
Beispiel: Berechnung von
z=zk
k
δ(r)
Res f (z)
z=zk
dx
.
1 + x4
Der Integrand hat vier einfache Pole bei z1 = eiπ/4 , z2 = e3iπ/4 , z3 = e5iπ/34 ,
z4 = e7iπ/4 .
)
1
Resf (z) =
z=z1
(1 + z 4 )
Resf (z) =
z=z2
*
=
z=z1
1
4e9iπ/4
=
1
4e3iπ/4
1
4e−iπ/4
=
1
= e−3iπ/4
4
e−iπ/4
4
KAPITEL 6. KOMPLEXE ANALYSIS
150
1
z4
f (z) −→
z→∞
∞
⇒
−∞
⎛
⎞
dx
2πi ⎝ −3iπ/4 −iπ/4 ⎠
=
e +e
4
1+x
4
−iπ/4
e
πi −iπ/4
e
+ e−iπ/4
= −
2 2i sin
= π sin
∞
⇒
0
2. Integrale vom Typ
π
π
=√
4
2
π
4
dx
π
= √
4
1+x
2 2
2π
I = dθ f (cos θ, sin θ).
0
f (cos θ, sin θ) sei dabei eine rationale Funktion in cos θ und sin θ, die für
0 ≤ θ ≤ 2π endlich bleibt. Setzt man eiθ = z, so erhält man
1
eiθ + e−iθ
1
=
cos θ =
z+
2
2
z
iθ
−iθ
1
1
e −e
=
z−
sin θ =
2
2i
z
dz
dz = ieiθ dθ ⇒ dθ =
iz
1
dz
1
1
1
⇒ I =
f
z+
,
z−
iz
2
z
2i
z
|z|=1
6.18. BERECHNUNG VON REELLEN INTEGRALEN
Beispiel: Sei p ∈
2π
0
151
, 0 < p < 1,
dθ
=
1 − 2p cos θ + p2
.
|z|=1
1−
.
=
|z|=1
.
=
|z|=1
2 p2
i [z −
dz/iz
z + 1z + p2
dz
− p + p2 z]
pz 2
dz
.
i (1 − pz) (z − p)
Der Integrand hat Pole bei z = 1/p > 1 und z = p < 1. Nur der letzte Pol
liegt innerhalb des Einheitskreises.
1
1
1
=
=
Res
z=p i (1 − pz) (z − p)
i(1 − pz) z=p i(1 − p2 )
2π
⇒
0
dθ
2π
=
2
1 − 2p cos θ + p
1 − p2
(0 < p < 1)
3. Integrale von der Form
∞
∞
dx f (x) cos sx,
−∞
dx f (x) sin sx
−∞
wobei
s > 0,
Man betrachtet
f (x) reell,
lim
|z|→∞, Imz≥0
∞
dx f (x) eisx
−∞
cos sx+i sin sx
f (z) = 0.
KAPITEL 6. KOMPLEXE ANALYSIS
152
r
isx
dx f (x)e
dz f (z)eisz = 2πi
+
−r
k
δ(r)
Res f (z)eisz
z=zk
Abschätzung des Integrals über den Halbkreis δ(r): z(θ) = reiθ
π
iθ isr(cos θ+i sin θ) isz iθ
dz f (z)e = dθ re i f re e
δ(r)
0
π
≤
dθ r f reiθ e−sr sin θ
0
π
≤ M(r)r
dθ e−sr sin θ
0
wobei M(r) = max f (reiθ ).
0≤θ≤π
Abschätzung von
π
r
dθ e−sr sin θ
π/2
= 2r dθ e−sr sin θ
0
0≤θ≤
π
2
sr>0
⇒
⇒
2
π
≤
0
sin θ
θ
≤1
sin θ ≥ π2 θ
π/2
π/2
−sr sin θ
2r dθ e
≤ 2r dθ e−2srθ/π
0
⇒
⇒
0
∞
∞
2r −srθ π
−2srθ/π
≤ 2r dθ e
= −2sr e
= s
π
0
0
π
isz dz f (z)e ≤ M(r) −→ 0
s r→∞
δ(r)
∞
⇒
dx f (x)eisx = 2πi
k
−∞
f (z)
−→
|z|→∞,Imz≥0
0,
Res f (z)eisz
z=zk
s>0
6.18. BERECHNUNG VON REELLEN INTEGRALEN
153
Beispiel:
∞
−∞
eisx
dx 2
=
k + x2
∞
−∞
cos sx
dx 2
+i
k + x2
∞
dx
−∞
sin sx
,
k 2 + x2
s > 0.
eisz
eisz
=
k2 + z2
(z − ik)(z + ik)
hat in der oberen Halbebene einen einfachen Pol bei z = ik und das asymptotische Verhalten
1
−→ 0.
2
k + z 2 |z|→∞
e−sk
eisz
eisik
=
=
z=ik k 2 + z 2
2ik
2ik
Res
∞
⇒
dx
π
eisx
e−sk
= e−sk
=
2πi
2
2
k +x
2ik
k
dx
cos sx
π −sk
=
e
2
2
k +x
k
dx
sin sx
= 0
k 2 + x2
−∞
∞
⇒
−∞
∞
−∞
4. Cauchyscher Hauptwert
Die reelle Funktion f habe
- b einen Pol bei x = x0 . Unter dem Cauchyschen
Hauptwert des Integrals a dx f (x) versteht man dann
⎤
⎡ x −ε
b
0
b
H dx f (x) = lim ⎣
dx f (x) +
dx f (x)⎦
ε↓0
a
a
x0 +ε
KAPITEL 6. KOMPLEXE ANALYSIS
154
(falls dieser Grenzwert existiert).
Bemerkung:
x0 −ε
b
dx f (x) + lim
lim
ε→0
η→0
x0 +η
a
dx f (x)
muss nicht existieren!
Beispiel: Zu berechnen ist der Cauchysche Hauptwert von
∞
−∞
dx
.
(x + 1)(x2 + 2)
√
Der Integrand hat Pole bei z = −1 und z = ±i 2. Man wählt den folgenden
Integrationsweg:
−1+ε
−r
r
dx
dx
+
+
2
(x + 1)(x + 2)
(x + 1)(x2 + 2)
−1+ε
dz
dz
1
+
+
= 2πi Res
√
2
2
2
(z + 1)(z + 2)
(z + 1)(z + 2)
z=i 2 (z + 1)(z + 2)
γ3
γ1
−→0
r→∞
1
√
= 2πi √
(i 2 + 1)2i 2
√
2 − 2i
π
=π
= √
6
2 + 2i
lim
ε→0
dz
dz
= −iπ Res
2
z=−1
(z + 1)(z + 2)
(z + 1)(z 2 + 2)
γ3
= −iπ
1
3
6.18. BERECHNUNG VON REELLEN INTEGRALEN
∞
⇒
H
−∞
155
√
√
dx
2 − 2i iπ
2π
=π
+
=
2
(x + 1)(x + 2)
6
3
6
Im allgemeinen Fall gilt
∞
H
dx f (x) = 2πi
−∞
zk
Res f (z) + πi
z=zk
xk
Res f (z)
z=xk
wobei die zk Pole im Inneren der oberen Halbebene und xk Pole auf der
reellen Achse sind.
Ein weiteres Beispiel:
∞
sin x
x
0
Wir betrachten dazu das komplexe Kurvenintegral
iz
e
γ z
mit dem Integrationsweg
∞
⇒
∞
∞
cos x
i sin x
eiz
eix
=H
= πi Res
= πi
H
+H
dx
z=0 z
x
x
x
−∞
−∞
−∞
0
KAPITEL 6. KOMPLEXE ANALYSIS
156
∞
⇒
−∞
sin x
dx
=π
x
Int. symm.
⇒
∞
sin x
π
dx
=
x
2
0
5. Integrale vom Typ
∞
f (x)
dx α
x
0
0 < α < 1, f rationale Funktion ohne Pol auf der reellen Halbachse x ≥ 0,
f (x) ∼ 1/xm , m ≥ 1 für x → ∞.
γ
f (z)
f (z)
dz α = 2πi
Res α
z=zk z
z
k=1
n
=
f (z)
dz α +
z
KR
Kε
f (z)
dz α =
z
f (x)
dx α −
x
ε
KR +Kε
z α = eα ln z
R
R
dx
f (x)
xα e2πiα
ε
z=reiθ
= eα[ln r+iθ] = r α eiθα
2π
f (reiθ )
dθ ireiθ α iθ −→ 0
r e r→∞
0
f (z)
dz α = −
z
2π
f (εeiθ )
dθ iεeiθ α iθ −→ 0
ε→0
ε e
0
wegen
ε
= ε1−α
α
ε
6.18. BERECHNUNG VON REELLEN INTEGRALEN
n
f (z)
Res
=
2πi
z=zk z α
k=1
⇒
157
∞
f (x)
1 − 2πiα
dx α
e
x
1
0
∞
n
f (x)
2πi
f (z)
dx α =
Res
x
1 − e−2πiα k=1 z=zk z α
0
Beispiel:
∞
I=
dx
,
+ 1)
xα (x
0<α<1
0
Res
1
1
= iπα
+ 1)
e
π
1
2πi
2πi
=
⇒ I =
=
−2πiα
iπα
1−e
e
2i sin πα
sin πα
z=−1 z α (z
6. Beispiel eines anderen Typs:
∞
I=
dx
,
1 + xα
α∈
, α > 1.
0
Man arbeitet am besten auf Rln . Rln wird parametrisiert durch (r, θ), r >
0, θ ∈ .
z α = r α eiαθ
r α eiαθ = −1 = eiπ ei2kπ
⇒
r = 1,
θk =
π + 2kπ
(k ∈ )
α
⇒
θ0 =
π
,
2
θ1 =
3π
,...
2
KAPITEL 6. KOMPLEXE ANALYSIS
158
dz
2πi
=
α
1+z
αz0α−1
γ
dz
+
1 + zα
=
KR +Kε
Kε
1 − e2πi/α
dx
− e2πi/α
α
1+x
ε
dz
−→ 0,
1 + z α ε→0
R
R
dx
1 + xα
ε
dz
−→ 0
1 + z α R→∞
wegen α > 1
KR
∞
dx
2πi
=
α
iπ(α−1)/α
1+x
αe
0
∞
0
2πi
dx
2πi
=
=
α
iπ/2
−iπ/2
1+x
α (e
−e
)
α2i sin απ
∞
dx
π/α
=
α
1+x
sin πα
0
7. Allgemein können Integrale vom Typ
∞
dxf (x)
0
mit einer rationalen Funktion f , deren n Polstellen nicht zu + gehören
und mit f (z) ∼ 1/z m , z → ∞, m ≥ 2 folgendermaßen berechnet werden:
Man betrachtet das Integral
dz f (z) ln z
γ
mit dem Integrationsweg γ, der alle Pole von f umschließt.
dz f (z) ln z = 2πi
n
k=1
γ
Res [f (z) ln z]
z=zk
R
dx f (x) ln x −
dz f (z) ln z +
=
KR +Kε
0
R
−
dx f (x)(ln x + 2πi)
0
6.18. BERECHNUNG VON REELLEN INTEGRALEN
Die Integrale über Kε und KR verschwinden für ε → 0 bzw. R → 0.
∞
n
Res [f (z) ln z]
⇒ dx f (x) = −
k=1
0
Beispiel:
∞
z=zk
dx
1 + x3
0
Der Integrand hat einfache Pole bei zk = eiπ/3 , eiπ , e5iπ/3 .
∞
⇒
0
8. Integrale vom Typ
ln zk
dx
=
−
1 + x3
3zk3
k
*
)
1 iπ/3
iπ
5iπ/3
= −
+
+
3 e2iπ/3 e2iπ e10iπ/3
*
)
5 2iπ/3
iπ 1 −2iπ/3
+1+ e
= −
e
3 3
3
√
2π 3
=
9
∞
dx f (x) ln x
0
159
KAPITEL 6. KOMPLEXE ANALYSIS
160
mit einer rationalen Funktion f , die auf der reellen Halbachse
Pole besitzt und für x → ∞ das asymptotische Verhalten
f (x) ∼
x→∞
1
,
xm
+
keine
m≥2
aufweist.
Betrachte
dz f (z)(ln z)2 ,
γ wie vorhin.
γ
∞
∞
2
dx f (x)(ln x) − dx f (x)(ln x + 2πi)2 = 2πi
Res f (z)(ln z)2
0
k
0
z=zk
∞
∞
−4πi dx f (x) ln x + 4π 2 dx f (x) = 2πi
Res f ln z
0
k
0
z=zk
∞
1
dx f (x) ln x = −
Res f (z)(ln z)2 −
z=z
2 k
k
0
∞
−iπ dx f (x)
0
f reell
⇒
∞
1 dx f (x) ln x = − Re
Res f (z)(ln z)2
z=zk
2
k
0
Beispiel:
∞
I=
dx
ln x
(1 + x3 )
0
1 d2 (ln z)2
(ln z)2
3
=
(1
+
z)
Res
z=−1 (1 + z)3
2! dz 2 (1 + z)3
z=−1
1
z z − ln z 1 1 d
2 ln z =
=
2 dz
z z=−1
z2
z=−1
1
= 2 (1 − ln z)
= 1 − ln eiπ = 1 − iπ
z
z=−1
1
1
I = − Re(1 − iπ) = −
2
2
Herunterladen