Hilberträume und Quantenmechanik

Werbung
1
Hilberträume und
Quantenmechanik
Inhalt:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
Hilberträume
Beschränkte lineare Operatoren
Fourier-Reihen und der Satz von Fejér
Orthonormalbasen
Beschränkte lineare Operatoren auf Hilberträumen
Konsequenzen aus dem Satz von Baire
Schwache Konvergenz
Grundlagen der Spektraltheorie
Abgeschlossene und abschließbare Operatoren
Symmetrische und selbstadjungierte Operatoren
Kompakte Operatoren und Fredholmoperatoren
Kompakte normale Operatoren
Spektralzerlegungen und Quantenmechanik
Distributionen
Fourier-Transformation und Sobolev-Räume
Friedrichs-Fortsetzung und harmonischer Oszillator
Observable und symmetrische Störungen
2
Literatur
GGK I. Gohberg, S. Goldberg, M.A. Kaashoek: Basic Classes of Linear Operators.
Birkhäuser, Basel-Boston 2003.
Hel G. Helmberg: Introduction to Spectral Theory in Hilbert Space.
Dover Bokks on Mathematics 2008.
KA W. Kaballo: Einführung in die Analysis I – III.
Spektrum-Verlag, Heidelberg-Berlin 2000, 1997, 1999.
KFA W. Kaballo: Grundkurs Funktionalanalysis.
Spektrum-Verlag, Heidelberg-Berlin 2011.
KFO W. Kaballo: Aufbaukurs Funktionalanalysis und Operatortheorie.
Spektrum-Verlag, Heidelberg-Berlin 2014.
Mau K. Maurin: Methods of Hilbert Spaces.
Polish Scientific Publishers, Warschau 1972.
No W. Nolting: Grundkurs Theoretische Physik 5/1: Quantenmechanik.
Springer, Berlin-Heidelberg 2004.
RS M. Reed, B. Simon: Methods of Mathematical Physics I: Functional Analysis.
Academic Press New York 1972.
Sch F. Schwabel: Quantenmechanik.
Springer, Berlin-Heidelberg 2005.
Tr H. Triebel: Höhere Analysis.
Deutscher Verlag der Wissenschaften, Berlin 1972.
Wei J. Weidmann: Lineare Operatoren in Hilberträumen.
Teubner, Stuttgart 1994.
3
Einleitung
Zur physikalischen Beschreibung atomarer Teilchen entwickelten E. Schrödinger und
W. Heisenberg 1925/26 unabhängig voneinander zwei verschieden aussehende Theorien der Quantenmechanik. Diese stellten sich bald als isomorph“ heraus und lassen
”
sich als spezielle Realisierungen abstrakterer Begriffsbildungen interpretieren:
Zustände und Observable. a) Ein (reiner) Zustand eines quantenmechanischen
Systems wird durch einen Einheitsvektor x ∈ H in einem separablen Hilbertraum
H beschrieben. Dabei beschreiben alle Vektoren αx mit | α | = 1 den gleichen Zustand.
b) Eine beobachtbare Größe oder Observable eines quantenmechanischen Systems
wie etwa Ort, Impuls oder Energie wird durch einen selbstadjungierten Operator im
Hilbertraum H beschrieben.
c) Die Menge aller möglichen Messergebnisse einer Observablen A ist durch das
Spektrum σ(A) ⊆ R des Operators gegeben. Für einen Zustand x ∈ D(A) im
Definitionsbereich des Operators ist die Zahl h Ax|x i ∈ R der Mittelwert oder Erwartungswert von A in x . Die Quantenmechanik sagt jedoch das Messergebnis i. a.
nicht exakt voraus, sondern gibt nur“ Wahrscheinlichkeiten dafür an, dass dieses in
”
eine vorgegebene (Borel-messbare) Teilmenge des Spektrums fällt.
Die zeitliche Entwicklung eines quantenmechanischen Systems wird beschrieben durch
Hamilton-Operator und Schrödinger-Gleichung. Zu einem quantenmechanischen System gehört ein eindeutig bestimmter selbstadjungierter Operator, der
Hamilton-Operator H . Ist x(t) ∈ D(H) der Zustand des Systems zur Zeit t ∈ R ,
so gilt die Schrödinger-Gleichung
ẋ(t) = − h̄i Hx(t) ,
x(0) = x0 ∈ D(H) ,
(1)
mit der Planckschen Konstanten 2πh̄ > 0 und einem Anfangszustand x0 ∈ D(H) .
Dies ist eine Evolutionsgleichung mit der eindeutig bestimmten Lösung
t
x(t) = e−i h̄ H x0 .
(2)
Quantisierung. a) Zur Konstruktion des“ Hamilton-Operators bestimmt man
”
zunächst die klassische Hamilton-Funktion des Systems und gewinnt daraus mittels einer Übersetzungsvorschrift (Quantisierung) den“ Hamilton-Operator. Hei”
senbergs Quantisierung liefert unendliche Matrizen, die im Raum ℓ2 der quadratsummierbaren Folgen operieren, Schrödingers Quantisierung (i. a. singuläre elliptische) Differentialoperatoren, die in einem Hilbertraum L2 quadratintegrierbarer
Funktionen operieren. In dieser Vorlesung befassen wir uns nur mit Schrödingers
Quantisierung.
b) Ein Teilchen im Raum wird in der klassischen Physik durch Ortskoordinaten
x1 , x2 , x3 und zugehörige Impulse p1 , p2 , p3 sowie die die Energie repräsentierende
Hamilton-Funktion H(xj , pj ) beschrieben. In der Schrödinger-Darstellung erklärt
4
man den Ortsoperator Qj als Multiplikationsoperator Qj := Mxj mit der Funktion
xj im Hilbertraum L2 (R3 ) und den Impulsoperator Pj durch den Differentialoperator Pj := −ih̄ ∂x∂ j . Der Hamilton-Operator ergibt sich durch formales Einsetzen“
”
der Operatoren Qj und Pj in die Hamilton-Funktion.
Beispiel. Ein Teilchen der Masse m > 0 bewege sich in einem äußeren Kraftfeld
F = − grad V mit Potential V . Die Energie ist dann gegeben durch m2 ẋ2 + V (x) ,
p2
die Hamilton-Funktion also durch H(xj , pj ) = 2m
+ V (x) . Der Hamilton-Operator
sollte also durch die Formel
2
h̄
∆u(x) + V (x) u(x)
Hu(x) = − 2m
mit dem Laplace-Operator ∆ =
3
P
j=1
∂2
∂x2j
(3)
gegeben sein.
Ziele der Quantenmechanik. a) Aus Ausdrücken wie (6) ist zunächst ein selbstadjungierter Operator zu bilden; dies kann durchaus eine schwierige Aufgabe sein.
b) Anschließend ist das Spektrum des selbstadjungierten Operators zu studieren
und die Spektralzerlegung zu berechnen. Stationäre Zustände beispielsweise sind genau die Eigenvektoren des Hamilton-Operators.
c) Schließlich lässt sich die Schrödinger-Gleichung dann mittels Formel (5) lösen.
Es ist das Ziel dieser Vorlesung, die angesprochenen Begriffe und Resultate mathematisch exakt zu entwickeln. Es werden keine Vorkenntnisse aus der Physik benötigt;
erforderlich sind mathematische Vorkenntnisse aus den Vorlesungen Analysis I-III
/ Lineare Algebra I oder Höhere Mathematik I-III.
Hilberträume und
Quantenmechanik
Inhalt:
5
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
10.
13.
14.
15.
16.
Hilberträume
Beschränkte lineare Operatoren
Fourier-Reihen und der Satz von Fejér
Orthonormalbasen
Beschränkte lineare Operatoren auf Hilberträumen
Konsequenzen aus dem Satz von Baire
Schwache Konvergenz
Grundlagen der Spektraltheorie
Abgeschlossene und abschließbare Operatoren
Symmetrische und selbstadjungierte Operatoren
Kompakte Operatoren und Fredholmoperatoren
Kompakte normale Operatoren
Spektralzerlegungen und Quantenmechanik
Distributionen und Fourier-Transformation
Friedrichs-Fortsetzung und harmonischer Oszillator
Observable und symmetrische Störungen
6
Literatur
GGK I. Gohberg, S. Goldberg, M.A. Kaashoek: Basic Classes of Linear Operators.
Birkhäuser, Basel-Boston 2003.
KA W. Kaballo: Einführung in die Analysis I – III.
Spektrum-Verlag, Heidelberg-Berlin 2000, 1997, 1999.
KFA W. Kaballo: Grundkurs Funktionalanalysis.
Spektrum-Verlag, Heidelberg-Berlin 2011.
KFO W. Kaballo: Aufbaukurs Funktionalanalysis und Operatortheorie.
Spektrum-Verlag, Heidelberg-Berlin 2014.
Mau K. Maurin: Methods of Hilbert Spaces.
Polish Scientific Publishers, Warschau 1972.
No W. Nolting: Grundkurs Theoretische Physik 5/1: Quantenmechanik.
Springer, Berlin-Heidelberg 2004.
RS M. Reed, B. Simon: Methods of Mathematical Physics I: Functional Analysis.
Academic Press New York 1972.
Sch F. Schwabel: Quantenmechanik.
Springer, Berlin-Heidelberg 2005.
Tr H. Triebel: Höhere Analysis.
Deutscher Verlag der Wissenschaften, Berlin 1972.
Wei J. Weidmann: Lineare Operatoren in Hilberträumen.
Teubner, Stuttgart 1994.
7
Einleitung
Zur physikalischen Beschreibung atomarer Teilchen entwickelten E. Schrödinger und
W. Heisenberg 1925/26 unabhängig voneinander zwei verschieden aussehende Theorien der Quantenmechanik. Diese stellten sich bald als isomorph“ heraus und lassen
”
sich als spezielle Realisierungen abstrakterer Begriffsbildungen interpretieren:
Zustände und Observable. a) Ein (reiner) Zustand eines quantenmechanischen
Systems wird durch einen Einheitsvektor x ∈ H in einem separablen Hilbertraum
H beschrieben. Dabei beschreiben alle Vektoren αx mit | α | = 1 den gleichen Zustand.
b) Eine beobachtbare Größe oder Observable eines quantenmechanischen Systems
wie etwa Ort, Impuls oder Energie wird durch einen selbstadjungierten Operator im
Hilbertraum H beschrieben.
c) Die Menge aller möglichen Messergebnisse einer Observablen A ist durch das
Spektrum σ(A) ⊆ R des Operators gegeben. Für einen Zustand x ∈ D(A) im
Definitionsbereich des Operators ist die Zahl h Ax|x i ∈ R der Mittelwert oder Erwartungswert von A in x . Die Quantenmechanik sagt jedoch das Messergebnis i. a.
nicht exakt voraus, sondern gibt nur“ Wahrscheinlichkeiten dafür an, dass dieses in
”
eine vorgegebene (Borel-messbare) Teilmenge des Spektrums fällt.
Die zeitliche Entwicklung eines quantenmechanischen Systems wird beschrieben durch
Hamilton-Operator und Schrödinger-Gleichung. Zu einem quantenmechanischen System gehört ein eindeutig bestimmter selbstadjungierter Operator, der
Hamilton-Operator H . Ist x(t) ∈ D(H) der Zustand des Systems zur Zeit t ∈ R ,
so gilt die Schrödinger-Gleichung
ẋ(t) = − h̄i Hx(t) ,
x(0) = x0 ∈ D(H) ,
(4)
mit der Planckschen Konstanten 2πh̄ > 0 und einem Anfangszustand x0 ∈ D(H) .
Dies ist eine Evolutionsgleichung mit der eindeutig bestimmten Lösung
t
x(t) = e−i h̄ H x0 .
(5)
Quantisierung. a) Zur Konstruktion des“ Hamilton-Operators bestimmt man
”
zunächst die klassische Hamilton-Funktion des Systems und gewinnt daraus mittels einer Übersetzungsvorschrift (Quantisierung) den“ Hamilton-Operator. Hei”
senbergs Quantisierung liefert unendliche Matrizen, die im Raum ℓ2 der quadratsummierbaren Folgen operieren, Schrödingers Quantisierung (i. a. singuläre elliptische) Differentialoperatoren, die in einem Hilbertraum L2 quadratintegrierbarer
Funktionen operieren. In dieser Vorlesung befassen wir uns nur mit Schrödingers
Quantisierung.
b) Ein Teilchen im Raum wird in der klassischen Physik durch Ortskoordinaten
x1 , x2 , x3 und zugehörige Impulse p1 , p2 , p3 sowie die die Energie repräsentierende
Hamilton-Funktion H(xj , pj ) beschrieben. In der Schrödinger-Darstellung erklärt
8
man den Ortsoperator Qj als Multiplikationsoperator Qj := Mxj mit der Funktion
xj im Hilbertraum L2 (R3 ) und den Impulsoperator Pj durch den Differentialoperator Pj := −ih̄ ∂x∂ j . Der Hamilton-Operator ergibt sich durch formales Einsetzen“
”
der Operatoren Qj und Pj in die Hamilton-Funktion.
Beispiel. Ein Teilchen der Masse m > 0 bewege sich in einem äußeren Kraftfeld
F = − grad V mit Potential V . Die Energie ist dann gegeben durch m2 ẋ2 + V (x) ,
p2
die Hamilton-Funktion also durch H(xj , pj ) = 2m
+ V (x) . Der Hamilton-Operator
sollte also durch die Formel
2
h̄
∆u(x) + V (x) u(x)
Hu(x) = − 2m
mit dem Laplace-Operator ∆ =
3
P
j=1
∂2
∂x2j
(6)
gegeben sein.
Ziele der Quantenmechanik. a) Aus Ausdrücken wie (6) ist zunächst ein selbstadjungierter Operator zu bilden; dies kann durchaus eine schwierige Aufgabe sein.
b) Anschließend ist das Spektrum des selbstadjungierten Operators zu studieren
und die Spektralzerlegung zu berechnen. Stationäre Zustände beispielsweise sind genau die Eigenvektoren des Hamilton-Operators.
c) Schließlich lässt sich die Schrödinger-Gleichung dann mittels Formel (5) lösen.
Es ist das Ziel dieser Vorlesung, die angesprochenen Begriffe und Resultate mathematisch exakt zu entwickeln. Es werden keine Vorkenntnisse aus der Physik benötigt;
erforderlich sind mathematische Vorkenntnisse aus den Vorlesungen Analysis I-III
/ Lineare Algebra I oder Höhere Mathematik I-III.
1 Hilberträume
1
I. Hilberträume und beschränkte lineare Operatoren
1
Hilberträume
1.1 Skalarprodukte. Es sei H ein Vektorraum über K = R oder K = C .
a) Eine Abbildung h | i : H × H → K heißt Halbskalarprodukt auf H , falls gilt:
hαx1 + x2 |yi = αhx1 |yi + hx2 |yi ,
hx|yi = hy|xi ,
hx|xi ≥ 0 ,
α ∈ K , x1 , x2 , y ∈ H ,
x, y ∈ H ,
x∈H.
(1)
(2)
(3)
b) Gilt zusätzlich hx|xi > 0 für x 6= 0 , so heißt h | i definit und dann ein Skalarprodukt auf H . Ein Raum H mit Skalarprodukt h | i heißt Prä-Hilbertraum.
c) Für x, y ∈ E gilt nach (1) und (2) die binomische Formel“
”
hx + y|x + yi = hx|xi + 2 Re hx|yi + hy|yi .
(4)
1.2 Satz (Schwarzsche Ungleichung). Es sei h | i ein Halbskalarprodukt auf H .
Für alle x, y ∈ H gilt dann
| hx|yi |2 ≤ hx|xi · hy|yi .
(5)
Beweis. Für alle λ ∈ K gilt nach (3) und (4)
0 ≤ hλx + y|λx + yi = | λ |2hx|xi + 2 Re hλx|yi + hy|yi .
hy|xi
Aus hx|xi = 0 folgt dann auch hx|yi = 0 ; im Fall hx|xi =
6 0 setzt man λ = − hx|xi
und erhält (5) aus
0 ≤
| hx|yi |2
| hx|yi |2
hx|xi
−
2
+ hy|yi .
hx|xi2
hx|xi
1.3 Hilberträume und Banachräume. a) Für ein Halbskalarprodukt h | i wird
durch
k x k :=
q
hx|xi für x ∈ H
(6)
eine Halbnorm auf H definiert. Dies bedeutet
k αx k = | α | k x k für α ∈ K und x ∈ H ,
(7)
kx + yk ≤ kxk + kyk
(8)
kxk ≥ 0.
(Dreiecks-Ungleichung),
(9)
2
I. Hilberträume und beschränkte lineare Operatoren
Im Fall eines Skalarprodukts gilt zusätzlich k x k > 0 für k x k 6= 0 ; dann handelt
es sich um eine Norm.
b) In der Tat folgt die Dreiecks-Ungleichung (8) wegen (4) und (5) aus
k x + y k2 ≤ k x k2 + 2k x kk y k + k y k2 = (k x k + k y k)2 .
c) Auch Normen, die nicht durch ein Skalarprodukt definiert werden können, spielen
eine wichtige Rolle. Ein Vektorraum X mit einer Norm k k heißt normierter Raum.
d) Ein normierter Raum X heißt vollständig oder Banachraum, wenn jede CauchyFolge in X konvergiert. Ein Prä-Hilbertraum, der unter der Norm aus (6) vollständig
ist, heißt Hilbertraum.
1.4 Endlichdimensionale Räume. Auf dem Raum Kn wird durch
hx|yi :=
n
P
j=1
xj yj
für x = (xj ) , y = (yj ) ∈ Kn ,
(10)
ein Skalarprodukt definiert; die entsprechende Norm gemäß (6) ist gegeben durch
| x | = k x k2 = (
n
P
j=1
| xj |2 )
1/
2
.
(11)
Wir schreiben ℓn2 (K) oder einfach ℓn2 für diesen Hilbertraum.
1.5 Raum der quadratsummierbaren Folgen. Auf dem Folgenraum
ℓ2 := {x = (xj )j∈N0 |
j=0
wird durch
hx|yi :=
∞
P
j=0
xj yj
∞
P
| xj |2 < ∞}
(12)
für x = (xj ) , y = (yj ) ∈ ℓ2 ,
(13)
ein Skalarprodukt definiert; für x, y ∈ ℓ2 ist in der Tat aufgrund der Schwarzschen
Ungleichung für endliche Summen die Reihe in (13) absolut konvergent. Die entsprechende Norm gemäß (6) ist gegeben durch
k x k2 = (
∞
P
j=0
| xj |2 )
1/
2
.
(14)
1.6 Satz. Der Folgenraum ℓ2 ist vollständig, also ein Hilbertraum.
(n)
(n)
(m)
Beweis. Es sei (x(n) ) = ((xj )) eine Cauchy-Folge in ℓ2 . Wegen | xj − xj | ≤
(n)
k x(n) − x(m) k2 sind die Folgen (xj ) für festes j ∈ N0 Cauchy-Folgen in K . Somit
(n)
existieren die Grenzwerte xj := lim xj ∈ K . Zu ε > 0 gibt es n0 ∈ N mit
n→∞
ℓ
P
j=0
(n)
(m) 2
| xj − xj
| ≤ k x(n) − x(m) k22 ≤ ε2
für feste ℓ ∈ N0 und alle n, m ≥ n0 . Mit m → ∞ folgt auch
ℓ
P
j=0
(n)
| xj − xj |2 ≤ ε2
für n ≥ n0 und alle ℓ ∈ N0 . Für die Folge x := (xj ) gilt also x(n) − x ∈ ℓ2
und k x(n) − x k2 ≤ ε für n ≥ n0 , und daraus ergibt sich auch x ∈ ℓ2 sowie
k x(n) − x k2 → 0 .
3
3
1 Hilberträume
1.7 Banachräume p -summierbarer Folgen. Auf dem Folgenraum
ℓp := {x = (xj )j∈N0 |
wird für 1 ≤ p < ∞ durch
k x kp = (
∞
P
j=0
| xj |p )
∞
P
j=0
| xj |p < ∞}
(15)
1/
p
(16)
eine Norm definiert; die Dreiecks-Ungleichung (8) heißt in diesem Fall Minkowskische
Ungleichung. Der Beweis von Satz 1.6 zeigt, dass auch die Räume ℓp vollständig sind.
1.8 Banachräume beschränkter Funktionen. a) Auf dem Vektorraum B(M) =
ℓ∞ (M) aller auf einer Menge M beschränkten Funktionen wird die SupremumsNorm oder sup-Norm erklärt durch
k f ksup := k f k∞ := k f kM := sup | f (t) | ,
t∈M
f ∈ B(M) .
(17)
b) Die sup-Norm beschreibt die gleichmäßige Konvergenz von Funktionenfolgen; für
eine Folge (fn ) in B(M) , eine Funktion f ∈ B(M) und ε > 0 gilt in der Tat
k f − fn ksup ≤ ε ⇔ ∀ t ∈ M : | f (t) − fn (t) | ≤ ε .
c) Für eine abzählbare Menge M ist ℓ∞ (M) ein Folgenraum; speziell hat man die
Notation ℓ∞ = ℓ∞ (N0 , K) .
d) Auch die Räume ℓ∞ (M) sind vollständig; dies ergibt sich wie in Satz 1.6.
1.9 Stetige Funktionen. Es seien X , Y normierte Räume und M ⊆ X . Eine
Abbildung f : M → Y heisst stetig in a ∈ M , falls eine der folgenden äquivalenten
Bedingungen erfüllt ist (mit Uδ (a) = {x ∈ X | k x − a k < δ} bezeichnen wir die
offene Kugel mit Radius δ > 0 um a ∈ X ):
∀ ε > 0 ∃ δ > 0 ∀ x ∈ M : k x − a k < δ ⇒ k f (x) − f (a) k < ε ,
(18)
∀ ε > 0 ∃ δ > 0 : f (Uδ (a) ∩ M) ⊆ Uε (f (a)) ,
(19)
xn → a ⇒ f (xn ) → f (a) für jede Folge (xn ) in M .
(20)
Weiter heisst f stetig auf M , falls f in jedem Punkt von M stetig ist. C(M, Y )
bezeichnet die Menge aller stetigen Abbildungen von M nach Y , und wir schreiben
einfach C(M) = C(M, K) .
1.10 Gleichmäßige Stetigkeit. a) Eine Abbildung f : M → Y heisst gleichmäßig
stetig auf M , falls gilt
∀ ε > 0 ∃ δ > 0 ∀ x1 , x2 ∈ M : k x1 −x2 k < δ ⇒ k f (x1 )−f (x2 ) k < ε . (21)
Gleichmäßige Stetigkeit bedeutet also, dass in der Stetigkeitsbedingung (18) für alle
Punkte die gleiche Zahl δ = δ(ε) > 0 gewählt werden kann.
b) Gleichmäßig stetige Abbildungen sind natürlich stetig. Die Funktionen t 7→
(0, 1) oder t 7→ t2 auf [0, ∞) sind stetig, aber nicht gleichmäßig stetig.
1
t
auf
c) Gleichmäßig stetige Abbildungen bilden Cauchy-Folgen wieder in Cauchy-Folgen
ab; für nur stetige Abbildungen ist dies i. a. nicht richtig.
4
I. Hilberträume und beschränkte lineare Operatoren
1.11 Distanzfunktionen. Es seien X ein normierter Raum und M ⊆ X . Für
x ∈ X wird die Distanz von x zu M durch
dM (x) := inf {k x − a k | a ∈ M}
(22)
definiert. Es seien x, y ∈ X mit k x − y k > 0 und ε > 0 . Man wählt a ∈ M mit
k x − a k < dM (x) + εk x − y k und erhält
dM (y) ≤ k y − a k ≤ | y − x | + k x − a k ≤ dM (x) + (1 + ε) k x − y k ,
also dM (y) − dM (x) ≤ (1 + ε) k x − y k . Vertauscht man noch die Rollen von x und
y , so ergibt sich mit ε → 0 :
| dM (x) − dM (y) | ≤ k x − y k .
(23)
Insbesondere ist die Funktion dM : X → R gleichmäßig stetig. Es ist d−1
M (0) abge−1
−1
schlossen, und aus M ⊆ dM (0) folgt auch M ⊆ dM (0) . Ist umgekehrt dM (x) = 0 ,
so gibt es eine Folge (an ) in M mit k x − an k → 0 , und man hat x ∈ M . Somit
gilt also dM (x) = 0 ⇔ x ∈ M .
1.12 Kompakte Mengen. Es sei X ein normierter Raum. Eine Menge K ⊆ X
heißt kompakt, wenn jede Folge in K eine dort konvergente Teilfolge besitzt. Eine
Menge K ⊆ Kn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen
ist (Satz von Bolzano-Weierstraß). In unendlichdimensionalen Räumen gilt nur die
Aussage ⇒ “, nicht aber ihre Umkehrung. Beispiele kompakter Mengen in Rn sind
”
n
Q
[aj , bj ] oder abgeschlossene
etwa kompakte Intervalle [a, b] , kompakte Quader
j=1
n
Kugeln Kr (a) = {x ∈ R | | x − a | ≤ r} .
1.13 Satz. Es seien X , Y normierte Räume, M ⊆ X kompakt und f : M → Y
stetig. Dann ist f gleichmäßig stetig.
Beweis. Ist (21) nicht richtig, so gilt
∃ ε > 0 ∀ n ∈ N ∃ xn , yn ∈ M : k xn − yn k <
1
n
,
k f (xn ) − f (yn ) k ≥ ε .
Nun hat (xn ) eine Teilfolge xnj → a ∈ M ; wegen k xn −yn k < n1 gilt auch ynj → a .
Da f in a stetig ist, gilt f (xnj ) → f (a) und auch f (ynj ) → f (a) , und man erhält
den Widerspruch
k f (xnj ) − f (ynj ) k ≤ k f (xnj ) − f (a) k + k f (a) − f (ynj ) k → 0 . 3
1.14 Banachräume stetiger Funktionen. a) Für eine kompakte Menge K ist
jede stetige Funktion f ∈ C(K) auf K beschränkt (und nimmt ihr Maximum und
ihr Minimum an). Somit ist der Raum C(K) ein Unterraum von ℓ∞ (K) . Dieser ist
abgeschlossen und somit ein Banachraum, da sich bei gleichmäßiger Konvergenz die
Stetigkeit auf die Grenzfunktion vererbt.
b) Bei nur punktweiser Konvergenz ist letzteres i. a. nicht der Fall, wie etwa das
Beispiel der Funktionenfolge (fn (t) := tn ) in C([0, 1], R) zeigt.
1 Hilberträume
5
1.15 Räume quadratintegrierbarer Funktionen. a) Es sei Ω ⊆ Rn eine
(Lebesgue-) messbare Menge (oder allgemeiner (Ω, Σ, µ) ein Maßraum). Auf dem
Raum
L2 (Ω) := {f : Ω 7→ K | f messbar und
R
Ω
| f (t) |2 dµ < ∞}
(24)
der quadratintegrierbaren Funktionen auf Ω wird durch
hf |gi :=
R
Ω
f (t) g(t) dµ
(25)
ein Halbskalarprodukt definiert; die entsprechende Halbnorm gemäß (6) ist gegeben
durch
k f k = k f k L2 = (
R
Ω
| f (t) |2 dµ)
1/
2
.
(26)
b) Für eine messbare Funktion gilt
k f kL2 = 0 ⇔ f (t) = 0 fast überall (f.ü.);
(27)
die Menge dieser Nullfunktionen bildet den Vektorraum
N (Ω) = {f : Ω 7→ K | f (t) = 0 f.ü.} .
(28)
1.16 Halbnormen und Äquivalenzklassen. a) Allgemeiner sei nun (X, k k) ein
halbnormierter Raum. Der Kern
N := {x ∈ X | k x k = 0}
der Halbnorm ist offenbar ein Unterraum von X . Durch
x ∼ y :⇔ x − y ∈ N ⇔ k x − y k = 0
(29)
wird eine Äquivalenzrelation auf X defininiert. Die Äquivalenzklassen
x̃ = {y ∈ X | y ∼ x} = x + N := {x + n | n ∈ N} ,
x∈X,
sind affine Unterräume von X
parallel“ zu N .
”
b) Offenbar folgt aus x ∼ x′ und y ∼ y ′ auch x + y ∼ x′ + y ′ und αx ∼ αx′ für
α ∈ K . Daher kann man auf den Äquivalenzklassen Addition und Skalarmultiplikation durch
f ,
x̃ + ỹ := xg
+ y , α x̃ := αx
x, y ∈ X , α ∈ K ,
(30)
definieren. Diese bilden damit einen Vektorraum, den Quotientenraum X/N .
c) Auf diesem Quotientenraum wird durch
k x̃ k := k x k ,
x∈X,
(31)
dann eine Norm definiert: Aus k x̃ k = 0 folgt nämlich sofort x ∈ N , und somit ist
x̃ das Nullelement von X/N . Man nennt ( X/N , k k) den zu (X, k k) assoziierten
normierten Raum.
6
I. Hilberträume und beschränkte lineare Operatoren
1.17 Der Raum L2 (Ω) . a) Der zu (L2 (Ω), k kL2 ) assoziierte normierte Raum
wird mit
L2 (Ω) = L2 (Ω)/N (Ω)
bezeichnet; er besteht also aus Äquivalenzklassen fast überall gleicher meßbarer
Funktionen. Die L2 -Norm beschreibt die Konvergenz im quadratischen Mittel. In
der Notation wird zwischen einer Funktion f ∈ L2 (Ω) und ihrer Äquivalenzklasse
f˜ ∈ L2 (Ω) meist nicht unterschieden.
b) Nach Konstruktion des Integrals ist der Raum der Treppenfunktionen dicht in
L2 (Rn ) . Für eine lokalkompakte Menge Ω ⊆ Rn (z. B. eine offene oder abgeschlossene Menge) und das Lebesgue-Maß gilt dies auch in L2 (Ω) für den Raum Cc (Ω)
der stetigen Funktionen auf Ω mit kompaktem Träger (vgl. [KA3], Lemma 6.20)
supp f := {t ∈ Ω | f (t) 6= 0} .
1.18 Theorem (Riesz-Fischer). Die Räume L2 (Ω) sind vollständig, also Hilberträume.
Das Argument im Beweis von Satz 1.6 ist hier nicht anwendbar, da aus einer CauchyBedingung für eine Folge in L2 (Ω) eine punktweise Cauchy-Bedingung fast überall
nicht folgt. Der mittels Satz 1.22 unten folgende Beweis verwendet die Konvergenzsätze der Integrationstheorie und
1.19 Reihen. a) Eine (unendliche) Reihe
P
ak in einem normierten Raum X heißt
konvergent, falls die Folge der Partialsummen (sn :=
der Reihe ist dann gegeben durch
∞
P
k=1
n
P
k=1
ak ) konvergiert; die Summe
ak := s := n→∞
lim sn .
b) Eine Reihe
P
ak heißt absolut konvergent, falls
(32)
∞
P
k=1
k ak k < ∞ gilt.
1.20 Satz. Ein normierter Raum X ist genau dann vollständig, wenn in X jede
absolut konvergente Reihe konvergiert.
Beweis. ⇒ “: Für m > n gilt k sm − sn k = k
”
∞
P
k=1
m
P
k=n+1
ak k ≤
m
P
k=n+1
k ak k ; wegen
k ak k < ∞ ist (sn ) eine Cauchy-Folge in E und damit konvergent.
⇐ “: Es sei (sn ) eine Cauchy-Folge in E . Zu ε := 2−j gibt es dann nj ∈ N mit
”
k sn − sm k ≤ 2−j für n, m ≥ nj . Man kann nj > nj−1 annehmen. Es sei nun
a1 := sn1 und ak := snk − snk−1 für k ≥ 2 ; für die Teilfolge (snj ) von (sn ) gilt dann
sn j =
j
P
k=1
ak
für alle j ∈ N .
Nach Konstruktion ist k ak k ≤ 2−(k−1) für k ≥ 2 , also
∞
P
k=1
k ak k < ∞ . Nach
Voraussetzung ist (snj ) konvergent, und nach dem folgenden Lemma konvergiert
dann auch die Folge (sn ) gegen den gleichen Limes.
3
1 Hilberträume
7
1.21 Lemma. Gegeben sei eine Cauchy-Folge (xn ) in einem normierten Raum X .
Hat (xn ) eine konvergente Teilfolge xnj → x ∈ X , so konvergiert auch (xn ) selbst
gegen x .
Beweis. Zu ε > 0 gibt es n0 ∈ N mit k xn − xm k < ε für n, m ≥ n0 und j0 ∈ N
mit k xnj − x k < ε für j ≥ j0 . Man wählt dann m = nj mit j ≥ max {j0 , n0 } und
erhält k xn − x k ≤ k xn − xnj k + k xnj − x k < 2ε für n ≥ n0 .
3
Ein Beweis des Satzes von Riesz-Fischer 1.18 ergibt sich nun aus Satz 1.20 und der
folgenden L2 -Version“ des Satzes von B. Levi:
”
1.22 Satz. Es sei (gk ) eine Folge in L2 (Ω) mit
∞
P
die Reihe
k=1
(
k=1
| gk (t) | fast überall, und die Reihe
Beweis. a) Für die Funktionen hn := (
R
1
/2
= k
Ω hn (t) dµ)
n
P
k=1
n
P
k=1
∞
P
P
k gk kL2 < ∞ . Dann konvergiert
k≥1
gk konvergiert in L2 (Ω) .
| gk |)2 ∈ L1 (Ω) gilt 0 ≤ hn ≤ hn+1 und
| g k | k L2 ≤
∞
P
k=1
k g k k L2 < ∞
für alle n ∈ N . Nach dem Satz über monotone Konvergenz existiert h(t) :=
lim hn (t) fast überall, und es ist h ∈ L1 (Ω) .
n→∞
b) Es folgt
∞
P
k=1
| gk (t) | < ∞ fast überall. Daher ist die Funktion g :=
überall definiert und messbar. Wegen | g −
über majorisierte Konvergenz
in L2 (Ω) .
R
Ω
|g −
n
P
k=1
n
P
k=1
∞
P
k=1
gk fast
gk |2 ≤ 4h ∈ L1 (Ω) liefert der Satz
gk |2 dµ → 0 für n → ∞ , also
∞
P
k=1
gk = g
3
Der Beweis von Satz 1.22 liefert sofort diese
1.23 Folgerung. Eine in L2 (Ω) konvergente Folge besitzt eine fast überall konvergente Teilfolge.
Dagegen muss eine in L2 (Ω) konvergente Folge selbst nicht fast überall konvergent
sein, vgl. etwa [KA3], Beispiel 5.4.
1.24 Räume p -integrierbarer Funktionen. In obigem Beweis wurde der Raum
L1 (Ω) aller integrierbaren Funktionen auf Ω benutzt. Für 1 ≤ p < ∞ wird allgemeiner durch
Lp (Ω) := {f : Ω 7→ K | f messbar und k f kpLp :=
R
Ω
| f (t) |p dµ < ∞} (33)
ein halbnormierter Raum definiert, und durch Lp (Ω) = Lp (Ω)/N (Ω) erhält man
einen normierten Raum. Wie in Theorem 1.18 ergibt sich dessen Vollständigkeit
aus einer Lp -Version“ des Satzes von B. Levi; Lp (Ω) ist also ein Banachraum.
”
Wie in 1.17 ist der Raum der Treppenfunktionen dicht in Lp (Rn ) , und für eine
lokalkompakte Menge Ω ⊆ Rn gilt dies auch für den Raum Cc (Ω) in Lp (Ω) .
8
I. Hilberträume und beschränkte lineare Operatoren
1.25 Separable Räume. a) Eine Menge M ⊆ X in einem normierten Raum X
heißt separabel, falls es in M eine abzählbare dichte Teilmenge gibt.
b) Rn ist separabel, da die abzählbare Menge Qn der rationalen n -Tupel in Rn
dicht ist.
c) Der Hilbertraum ℓ2 ist separabel: Zunächst ist der Raum
ϕ := {x = (xj ) | ∃ n ∈ N ∀ j > n : xj = 0}
(34)
aller endlichen Folgen dicht in ℓ2 . Weiter ist die Menge der endlichen Folgen mit
rationalen Folgengliedern abzählbar und dicht in ϕ .
d) Auch die Folgenräume ℓp sind für 1 ≤ p < ∞ separabel.
e) Die Separabilität des Hilberraums L2 (Rn ) zeigen wir in Satz 4.15.
1.26 Satz. Es seien X ein normierter Raum und K ⊆ X kompakt.
a) Für ε > 0 besitzt K ein endliches ε -Netz, d. h. es gibt endlich viele Punkte
S
a1 , . . . , ar ∈ K mit K ⊆ rj=1 Uε (aj ) .
b) Eine kompakte Menge K ist separabel.
Beweis. a) Für ein ε > 0 gebe es kein endliches ε -Netz. Dann kann man rekursiv
eine Folge (xn ) in M wählen, für die stets
xn+1 ∈ M \ (Uε (x1 ) ∪ · · · ∪ Uε (xn )) ,
also k xn − xm k ≥ ε für n 6= m gilt. Dann besitzt (xn ) keine Cauchy-Teilfolge.
b) Für j ∈ N hat K ein endliches
abzählbar und dicht in K .
1
j
-Netz Nj . Dann ist die Menge A :=
S∞
j=1 Nj
3
1.27 Satz. Es sei M ⊆ X eine separable Menge. Dann ist auch jede Teilmenge
N ⊆ M separabel.
Beweis. a) Es sei A ⊆ M eine abzählbare dichte Menge in M . Wir betrachten das
System A1 := {Ur (a) | a ∈ A , 0 < r ∈ Q} der offenen Kugeln mit rationalen Radien
um Punkte aus A und dessen Teilsystem A2 := {Ur (a) ∈ A1 | Ur (a) ∩ N 6= ∅} ; dann
sind A1 und A2 abzählbare Mengen. Für jede Kugel Ur (a) ∈ A2 wählt man ein
b ∈ Ur (a) ∩ N und erhält so eine abzählbare Menge B ⊆ N .
b) Es seien nun t ∈ N und ε > 0 . Man wählt a ∈ A mit k t−a k < 3ε und r ∈ Q mit
ε
< r < 2ε . Dann ist t ∈ Ur (a) und somit Ur (a) ∈ A2 ; es gibt also b ∈ B ∩ Ur (a) .
3
Es folgt k t − b k ≤ k t − a k + k a − b k < 3ε + r < ε ; B ist also dicht in N .
3
1.28 Beispiel. Der Folgenraum ℓ∞ ist nicht separabel. In der Tat enthält ℓ∞ die
überabzählbare Menge
E := {ǫ = (ǫj )∞
j=0 | ǫj = ±1 für j ∈ N} .
Man hat k ǫ − ǫ′ k = 2 für ǫ, ǫ′ ∈ E mit ǫ 6= ǫ′ . Nun sei A eine dichte Menge in ℓ∞ .
Zu ǫ ∈ E wählt man aǫ ∈ A mit k ǫ − aǫ k < 1 . Dann gilt aǫ 6= aǫ′ für ǫ, ǫ′ ∈ E mit
ǫ 6= ǫ′ , und daher kann A nicht abzählbar sein.
2 Beschränkte lineare Operatoren
2
9
Beschränkte lineare Operatoren
2.1 Lineare Operatoren. Es seien E, F Vektorräume über K = R oder K = C .
Eine Abbildung T : E 7→ F heißt linear, falls
T (α x1 + x2 ) = α T (x1 ) + T (x2 ) für x1 , x2 ∈ E , α ∈ K ,
gilt. Der Nullraum oder Kern von T ,
N(T ) = T −1 {0} = {x ∈ E | T (x) = 0}
ist ein Unterraum von E , das Bild ( Range“)
”
R(T ) = T (E) = {T (x) | x ∈ E}
von T ist ein Unterraum von F .
2.2 Satz. Für normierte Räume X, Y und lineare Operatoren T : X 7→ Y sind
äquivalent:
(a) ∃ C ≥ 0 ∀ x ∈ X : k T (x) k ≤ C k x k .
(b) T ist gleichmäßig stetig auf X .
(c) T ist in einem Punkt a ∈ X stetig.
(d) Es gilt k T k := sup k T (x) k < ∞ .
k x k≤1
Beweis. (a) ⇒ (b) “: Man hat k T (x)−T (y) k = k T (x−y) k ≤ C k x−y k aufgrund
”
der Linearität von T ; in (1.21) kann also δ = Cε gewählt werden.
(b) ⇒ (c) “ ist klar.
”
(c) ⇒ (d) “: Zu ε := 1 gibt es δ > 0 mit k x − a k ≤ δ ⇒ k T (x) − T (a) k ≤ 1 . Für
”
k x k ≤ 1 gilt dann k (a + δx) − a k ≤ δ , also k T (δx) k = k T (a + δx) − T (a) k ≤ 1
und somit k T (x) k ≤ 1δ .
(d) ⇒ (a) “: Für x 6= 0 ist k k xx k k = 1 , also k T ( k xx k ) k ≤ k T k , und daher ist
”
k T (x) k ≤ k T k k x k für alle x ∈ E . 3
(1)
2.3 Bemerkungen und Definitionen. a) Eine Menge B ⊆ X heißt beschränkt,
wenn es C > 0 mit k x k ≤ C für alle x ∈ B gibt. Nach Satz 2.2 ist also ein linearer
Operator T : X 7→ Y genau dann stetig, wenn er die Einheitskugel B = BX von
X in eine beschränkte Teilmenge von Y abbildet oder wenn er alle beschränkten
Teilmengen von X in beschränkte Teilmengen von Y abbildet. Daher nennt man
stetige lineare Operatoren oder Linearformen auch beschränkte lineare Operatoren
oder Linearformen.
b) Das in 2.2 (d) definierte Supremum k T k ist wegen (1) die minimal mögliche
Konstante C in 2.2 (a) und definiert eine Norm auf dem Vektorraum L(X, Y ) aller
stetigen linearen Abbildungen von X nach Y . Statt L(X, X) schreibt man einfach
L(X) . Der Raum X ′ := L(X, K) heißt Dualraum von X , seine Elemente heißen
stetige Linearformen oder stetige lineare Funktionale auf X .
10
I. Hilberträume und beschränkte lineare Operatoren
c) Für normierte Räume X , Y , Z und Operatoren T ∈ L(X, Y ) und S ∈ L(Y, Z)
T
S
X −→ Y −→ Z
gilt auch S T ∈ L(X, Z) sowie k S T k ≤ k S k k T k für die Komposition dieser
Operatoren. Wegen (1) folgt dies sofort aus
k ST x k ≤ k S k k T x k ≤ k S k k T k k x k für x ∈ X .
2.4 Satz. a) Es seien X, Y normierte Räume. Mit Y ist dann auch L(X, Y ) vollständig.
b) Der Dualraum X ′ eines normierten Raumes X ist ein Banachraum.
Beweis. Es sei (Tn ) eine Cauchy-Folge in L(X, Y ) . Für festes x ∈ X gilt dann
k Tm (x) − Tn (x) k ≤ k Tm − Tn k k x k ; daher ist (Tn (x)) eine Cauchy-Folge in Y
und somit konvergent. Durch
T (x) := lim Tn (x) , x ∈ X ,
n→∞
wird eine lineare Abbildung T : X 7→ Y definiert. Zu ε > 0 gibt es n0 ∈ N mit
k Tm (x) − Tn (x) k ≤ k Tm − Tn k k x k ≤ εk x k für n, m ≥ n0 .
Mit m → ∞ folgt auch k T (x) − Tn (x) k ≤ εk x k für n ≥ n0 . Somit ist T − Tn ,
also auch T = (T − Tn ) + Tn stetig, und es gilt k T − Tn k ≤ ε für n ≥ n0 . Folglich
konvergiert (Tn ) in L(X, Y ) gegen T ∈ L(X, Y ) .
3
Für einen Hilbertraum H ist L(H) ein Banachraum, der kein Hilbertraum und im
Fall dim H = ∞ auch nicht separabel ist.
Interessante Beispiele stetiger Linearformen liefert:
2.5 Satz. Es seien K ⊆ Rn kompakt und g ∈ L1 (K) . Durch
J(g)(f ) :=
R
K
f (t) g(t) dt ,
f ∈ C(K) ,
(2)
wird ein stetiges lineares Funktional J(g) ∈ C(K)′ definiert mit
k J(g) k =
R
K
| g(t) | dt = k g kL1 .
(3)
Beweis. a) Wegen | J(g)(f ) | ≤ k g kL1 k f ksup gilt k J(g) k ≤ k g kL1 ; es ist also
J : L1 (K) 7→ C(K)′ ein stetiger linearer Operator.
b) Nun sei zunächst g ∈ C(K) . Zu ε > 0 definiert man f (t) :=
f ∈ C(K) mit k f ksup ≤ 1 , und es ist
J(g)(f ) =
R
| g(t) |2
K | g(t) |+ε
dt ≥
R
K
| g(t) |2 −ε2
| g(t) |+ε
dt ≥
R
K (| g(t) |
g(t)
| g(t) |+ε
. Dann ist
− ε) dt = k g kL1 − ε λ(K) .
Somit gilt die Behauptung (3) für g ∈ C(K) .
c) Nach 1.24 ist C(K) dicht in L1 (K) . Es gibt also eine Folge (gj ) in C(K) mit
k g − gj kL1 (K) → 0 . Aus a) und b) ergibt sich dann schließlich
k J(g) k = lim k J(gj ) k = lim k gj kL1 = k g kL1 . 3
j→∞
j→∞
2 Beschränkte lineare Operatoren
11
2.6 Satz. Es seien X ein normierter Raum, Y ein Banachraum, V ⊆ X ein Unterraum und T : V 7→ Y eine stetige lineare Abbildung. Dann existiert genau eine
stetige Fortsetzung T : V 7→ Y von T , und diese ist linear mit k T k = k T k .
Beweis. Es seien x ∈ V und (vn ) eine Folge in V mit k x − vn k → 0 . Falls eine
stetige Fortsetzung T von T existiert, so gilt für diese
T (x) = lim T (vn ) ;
n→∞
(4)
sie ist also eindeutig bestimmt. Umgekehrt ist nun wegen
k T (vn ) − T (vm ) k = k T (vn − vm ) k ≤ k T k k vn − vm k
die Folge (T (vn )) eine Cauchy-Folge in Y , und wegen der Vollständigkeit von Y
existiert der Grenzwert lim T (vn ) .
n→∞
Für eine weitere Folge (un ) in V mit k x − un k → 0 gilt
k T (vn ) − T (un ) k ≤ k T k k vn − un k ≤ k T k (k vn − x k + k x − un k) → 0 ,
d. h. durch (4) kann T auf V (wohl)definiert werden. Offenbar ist V ein Unterraum
von X , und T ist linear. Aus k T (vn ) k ≤ k T k k vn k folgt mit n → ∞ sofort auch
k T (x) k ≤ k T k k x k für x ∈ V ; somit ist T stetig, und es gilt k T k ≤ k T k . 3
2.7 Bemerkungen. a) Ist in Satz 2.6 der Operator T : V 7→ Y injektiv, so muß
dies nicht für die Fortsetzung T : V 7→ Y von T gelten.
b) Ist aber T : V 7→ Y isometrisch, d. h. gilt k T x k = k x k für alle x ∈ V , so gilt
dies wegen (4) auch für T : V 7→ Y . Dies wurde im Beweis von Satz 2.5 benutzt.
c) Ein Fortsetzungssatz 2.6 gilt auch für nichtlineare gleichmäßig stetige Abbildungen (vgl. [KA2], Aufgabe 16.8).
2.8 Vervollständigungen. a) Ein normierter Raum X kann in einen Banachraum
c eingebettet werden, d. h. es gibt eine lineare Isometrie i : X 7→ X
c , so daß i(X)
X
c
c
in X dicht ist. Aufgrund von Satz 2.6 ist der Raum X bis auf lineare Isometrie
eindeutig; er heißt die Vervollständigung von X .
c etwa als Menge von Äquivalenzklassen der Cauchy-Folgen in X
b) Man kann X
konstruieren, analog zu G. Cantors Konstruktion der reellen Zahlen aus den rationalen Zahlen (vgl. [KA2], 15.4); dies liefert eine abstrakte Vervollständigung“ von
”
X . Eine konkretere Vervollständigung“ kann man erhalten, indem man X in einen
”
konkreten“ vollständigen Raum einbettet und dort abschließt.
”
c) Mit dem Skalarprodukt (1.25) ist C[a, b] ein Prä-Hilbertraum mit Vervollständigung L2 [a, b] .
c ein Hilbertraum. Man kann diesen als Abschluss
d) Für Prä-Hilberträume H ist H
einer isometrischen Kopie von H in seinem vollständigen Bidualraum konstruieren:
2.9 Stetige Linearformen auf Hilberträumen. a) Es sei H ein Prä-Hilbertraum.
Für y ∈ H wird durch
η : x 7→ hx|yi für x ∈ H
12
I. Hilberträume und beschränkte lineare Operatoren
wegen (1.1) eine Linearform auf H definiert. Aufgrund der Schwarzschen Ungleichung gilt k η k ≤ k y k , und wegen η(y) = k y k2 ist k η k = k y k . Die Abbildung
j = jH : H 7→ H ′ ,
j(y)(x) := h x|y i ,
x, y ∈ H ,
(5)
ist eine additive Isometrie von H in H ′ , die im Fall K = R linear und im Fall
K = C antilinear ist, d. h. j(αx) = ᾱj(x) erfüllt.
b) Die Abbildung
ι = ιH : H → H ′′ ,
x ∈ H , η ∈ H′ ,
ι(x)(η) := η(x) ,
(6)
von H in den Bidualraum H ′′ ist auch im Fall K = C linear, und es gilt | ι(x)(η) | ≤
k x k k η k , also k ι(x) k ≤ k x k . Wegen ι(x)(j(x)) = j(x)(x) = h x|x i = k x k k j(x) k
c := ι (H) eine Verist ιH sogar isometrisch. Da H ′′ ein Banachraum ist, ist H
H
vollständigung des Prähilbertraums H . Die Norm von ιH (H) wird gemäß (1.6)
durch das Skalarprodukt h ι(x1 )|ι(x2 ) i := h x1 |x2 i induziert. Nach Bemerkung 2.7 c)
lässt sich dieses auf den Abschluss ιH (H) von ιH (H) in H ′′ stetig fortsetzen, und
c := ι (H) ein Hilbertraum.
daher ist H
H
c) Der Rieszsche Darstellungssatz 5.6 besagt, dass jH für Hilberträume H surjektiv
ist, und dies gilt dann auch für ιH .
Die Konstruktion in b) lässt sich auch für normierte Räume durchführen; dabei
verwendet man den Satz von Hahn-Banach (vgl. [KFA], Abschnitt 9.3).
2.10 Abschätzungen für Matrizen-Normen. a) Es seien Y ein normierter
Raum und T ∈ L(ℓn2 , Y ) . Für x = (x1 , . . . , xn ) ∈ Kn gilt x =
den Einheitsvektoren ej := (δjk )nk=1 . Hier bezeichnet δjk :=
Kronecker-Symbol. Mittels Schwarzscher Ungleichung folgt
k T (x) k = k T (
≤ (
n
P
j=1
n
P
j=1
xj ej ) k = k
k T ej k2 )
1/
2
(
n
P
j=1
n
P
j=1
| xj |2 )
folglich ist T : ℓn2 7→ Y stetig mit k T k ≤ (
n
P
n
P
xj T (ej ) k ≤
j=1
1/
2
j=1
;
k T ej k2 )
1/
2
(
n
P
j=1
xj ej mit
1 , j=k
0 , j 6= k
das
| xj | k T (ej ) k
.
b) Eine lineare Abbildung T ∈ L(Kn , Km ) kann eindeutig durch eine Matrix
A = (aij ) = M(T ) ∈ M(m, n) = MK (m, n) repräsentiert werden; mittels der Einheitsvektoren werden die Matrixelemente aij ∈ K festgelegt durch
T (ej ) =
m
P
i=1
aij ei ,
j = 1, . . . , n .
(7)
Im Zusammenhang mit dem Matrizenkalkül schreiben wir ab jetzt Vektoren im Kn
stets als Spalten
x = (x1 , . . . , xn )⊤ ,
wobei ⊤“ allgemein die Transposition von Matrizen bezeichnet, bei der Zeilen und
”
Spalten vertauscht werden.
2 Beschränkte lineare Operatoren
13
c) Für T ∈ L(Kn , Km ) ist also T (ej ) nach (7) die j -te Spalte der Matrix A = (aij ) ,
und nach a) ist daher
≤ k A kHS := (
k T kL(ℓn2 ,ℓm
2 )
n P
m
P
j=1 i=1
| aij |2 )
1/
2
.
(8)
Die Zahl k A kHS heißt Hilbert-Schmidt-Norm von A bzw. T .
d) Mit der Spaltensummen-Norm und Zeilensummen-Norm
m
P
n
k A kSS := max
m
| aij | ,
j=1 i=1
k A kZS := max
i=1
n
P
j=1
| aij |
(9)
der Matrix A = (aij ) = M(T ) ergibt sich eine andere Normabschätzung so:
k T x k22 =
m
P
i=1
|
n
P
j=1
≤ k A kZS
aij xj |2 ≤
n
m P
P
i=1 j=1
m
P
i=1
q
n
P
j=1
| aij |) (
n
P
j=1
| aij | | xj |2 = k A kZS
≤ k A kZS k A kSS · k x k22 ,
k T kL(ℓn2 ,ℓm
≤
2 )
{(
also
| aij | | xj |2 ) }
m
n P
P
j=1 i=1
| aij | | xj |2
k A kZS k A kSS .
(10)
In den Abschätzungen (8) und (10) gilt i. a. keine Gleichheit, vgl dazu auch [KFA],
S. 51/52. Es ist nicht (ohne weiteres) möglich, die Norm k T kL(ℓn2 ,ℓm
direkt durch
2 )
die Matrixelemente auszudrücken.
2.11 Beschränkte Matrix-Operatoren auf ℓ2 . a) Geeignete Matrizen A = (aij )
über N0 × N0 definieren beschränkte lineare Operatoren auf ℓ2 . Entsprechende
Kriterien ergeben sich leicht aus (8) und (10) mit n, m → ∞ :
b) Gilt für die Hilbert-Schmidt-Norm
k A kHS := (
∞
∞ P
P
i=1 j=1
| aij |2 )
1/
2
< ∞,
(11)
so wird durch
T : x = (xj )j∈N0 7→ (
∞
P
j=0
aij xj )i∈N0
(12)
ein Operator T ∈ L(ℓ2 ) definiert mit k T k ≤ k A kHS .
c) Gilt für die Zeilensummen-Norm und Spaltensummen-Norm
∞
k A kZS := sup
∞
P
i=1 j=1
∞
| aij | < ∞ und k A kSS := sup
∞
P
j=1 i=1
| aij | < ∞ ,
so wird durch (12) ebenfalls ein Operator T ∈ L(ℓ2 ) definiert mit
kT k ≤
q
k A kZS k A kSS .
(13)
14
I. Hilberträume und beschränkte lineare Operatoren
2.12 Lineare Integraloperatoren. a) Wir untersuchen nun lineare Integraloperatoren
R
S := Sκ : f 7→ (Sf )(t) :=
K
κ(t, s) f (s) ds ,
t∈K,
(14)
die durch stetige Kerne κ ∈ C(K 2 ) über einer kompakten Teilmenge K von Rn definiert werden. Man kann κ(t, s) als kontinuierliches Analogon“ einer quadratischen
”
Matrix (aij ) betrachten. In Analogie zu (9) und (13) nennen wir
R
k κ kSI := sup
K
s∈K
| κ(t, s) | dt und k κ kZI := sup
t∈K
R
K
| κ(t, s) | ds
(15)
die Spaltenintegral-Norm und Zeilenintegral-Norm des Kerns κ . Offenbar gilt stets
k κ kSI ≤ λ(K) k κ ksup und k κ kZI ≤ λ(K) k κ ksup .
b) Der Integraloperator S = Sκ aus (14) bildet L2 (K) in C(K) ab. Wegen der
Kompaktheit von K ist κ nach Satz 1.13 gleichmäßig stetig auf K 2 ; zu ε > 0 gibt
es also δ > 0 mit | κ(t1 , s) − κ(t2 , s)) | ≤ ε für | t1 − t2 | ≤ δ und alle s ∈ K . Daraus
ergibt sich dann für | t1 − t2 | ≤ δ
| Sf (t1) − Sf (t2 ) | ≤
R
K
| κ(t1 , s) − κ(t2 , s)) | | f (s) | ds
q
≤ ε k f kL1 ≤ ε λ(K) k f kL2 .
(16)
c) Nach der Schwarzschen Ungleichung hat man
| Sf (t) | ≤ (
R
K
| κ(t, s) |2 ds)
k Sf ksup ≤ (sup
t∈K
R
K
1/
2
k f k L2 ,
| κ(t, s) |2 ds)
1/
2
also
k f k L2 .
(17)
Es gelten Normabschätzungen analog zu (8) und (10):
2.13 Satz. Für den Integraloperator S = Sκ aus (14) gelten die Abschätzungen
k Sκ f kL2 ≤ k κ kL2 (K 2 ) · k f kL2 ,
f ∈ L2 (K) ,
1/
1/
k Sκ f kL2 ≤ k κ kZI2 k κ kSI2 · k f kL2 ,
(18)
f ∈ L2 (K) .
(19)
Beweis. a) Abschätzung (18) ergibt sich aus der Schwarzschen Ungleichung:
R
K
R
R
| Sκ f (t) |2 dt = K | K κ(t, s) f (s) ds |2 dt
R
R R
≤ K ( K | κ(t, s) |2 ds K | f (s) |2 ds) dt .
b) Für (19) schätzen wir wiederum mit der Schwarzschen Ungleichung und dem Satz
von Fubini-Tonelli wie im Beweis von (10) ab:
R
K
| Sκ f (t) |2 dt ≤
≤
≤
≤
≤
R
R
{ K | κ(t, s) | /2 (| κ(t, s) | /2 | f (s) |) ds}2 dt
R
R
R
2
K { K | κ(t, s) | ds K | κ(t, s) | | f (s) | ) ds)} dt
R R
k κ kZI K K | κ(t, s) | | f (s) |2 ds dt
R R
k κ kZI K K | κ(t, s) | dt | f (s) |2 ds
R
k κ kZI k κ kSI K | f (s) |2 ds . 3
K
1
1
2 Beschränkte lineare Operatoren
15
2.14 Messbare Kerne. Satz 2.13 gilt auch für Integraloperatoren (14) mit nur
messbaren Kernen κ : Ω × Ω 7→ K auf Maßräumen Ω ; die Existenz der vorkommenden Integrale muss dann aber sorgfältiger begründet werden. Die Suprema in
(15) sind als wesentliche Suprema zu interpretieren, und das Maß wird als σ -endlich
vorausgesetzt. Dies bedeutet, dass es eine Folge (Ωj ) messbarer Teilmengen von Ω
mit µ(Ωj ) < ∞ und Ω =
∞
S
j=1
Ωj gibt; diese Bedingung wird für den Satz von Tonelli
benötigt. Wir verweisen auf [KFA], Sätze A.3.18 – A.3.20.
16
3
I. Hilberträume und beschränkte lineare Operatoren
Fourier-Reihen und der Satz von Fejér
3.1 Überlagerung harmonischer Schwingungen. a) Schwingungsphänomene
werden durch periodische Funktionen beschrieben. Für die Periode 2π hat man die
Grundschwingungen sin t und cos t , aber auch die Oberschwingungen sin kt und
cos kt für k ≥ 2 .
b) Man versucht nun, möglichst allgemeine 2π -periodische Funktionen als Überlagerungen dieser harmonischen Schwingungen zu schreiben, d. h. als Fourier-Reihen
1
a
2 0
∞
P
+
k=1
ak , bk ∈ C , t ∈ R .
(ak cos kt + bk sin kt ) ,
(1)
Nach der Eulerschen Formel eit = cos t + i sin t ist es äquivalent, Reihen der Form
∞
P
k=−∞
ck eikt ,
ck ∈ C , t ∈ R ,
zu betrachten, deren Konvergenz über die Partialsummen (sn (t) :=
n
P
k=−n
niert sei. Die Koeffizienten hängen folgendermaßen zusammen:
ck
(




ck eikt ) defi-
1
2
(ak − ibk ) , k > 0
1
=
a , k=0 ,
2 0


 1 (a + ib ) , k < 0
−k
−k
2
(2)
ak = (ck + c−k )
, k≥0
.
bk = i (ck − c−k ) , k ≥ 1
d) Es sei nun die Reihe
f (t) :=
∞
P
k=−∞
P
ikt
k∈Z ck e
ck eikt ,
(3)
auf R gleichmäßig konvergent. Dann wird durch
t ∈ R,
(4)
eine stetige und 2π - periodische Funktion f ∈ C2π := C2π (R, C) definiert. Mittels
Restriktion und Fortsetzung kann man für festes τ ∈ R den Raum C2π mit dem
Unterraum
C2π [τ − π, τ + π] := {f ∈ C[τ − π, τ + π] | f (τ − π) = f (τ + π)}
von C[τ − π, τ + π] identifizieren.
d) Die folgenden Orthogonalitätsrelationen rechnet man sofort nach: Für m, n ∈ Z
gilt
1
2π
Rπ
−π
int −imt
e e
dt = δnm =
(
1 , n=m
.
0 , n 6= m
(5)
Damit lassen sich in (4) die Koeffizienten cm aus der Funktion f zurückgewinnen:
1
2π
Rπ
−π
f (t)e−imt dt =
∞
P
k=−∞
1
ck 2π
Rπ
−π
eikt e−imt dt =
∞
P
k=−∞
ck δkm = cm .
17
3 Fourier-Reihen und der Satz von Fejér
3.2 Definition. Für f ∈ L1 [−π, π] sei
fb(k) :=
Rπ
1
2π
−π
f (s) e−iks ds ,
k ∈ Z,
(6)
der k-te Fourier-Koeffizient von f , und
P
f (t) ∼
k∈Z
fb(k) eikt
(7)
sei die zu f assoziierte Fourier-Reihe.
3.3 Bemerkungen. a) Wie in 3.2 kann man auch die Fourier-Reihe einer Funktion
f definieren, die auf irgendeinem Intervall der Länge 2π Lebesgue-integrierbar ist.
Mit fe bezeichnen wir deren 2π - periodische Fortsetzung auf R .
b) Das Symbol ∼“ in (7) behauptet zunächst keinerlei Konvergenz der Reihe.
”
Konvergiert die Reihe aber auf einem Intervall der Länge 2π , so konvergiert sie auf
ganz R gegen eine 2π -periodische Funktion.
c) Für gerade bzw. ungerade Funktionen f ∈ L1 [−π, π] berechnet man die FourierReihe zweckmäßigerweise in der Form (1), da dann die bk bzw. ak dort verschwinden.
Aus (3) und (2) folgt
ak =
1
π
bk =
1
π
Rπ
−π
Rπ
−π
f (s) cos ks ds ,
k ∈ N0 ,
f (s) sin ks ds ,
k ∈ N.
3.4 Beispiel. (
Es wird die Fourier-Reihe der Funktion h ∈ L∞ [0, 2π] berechnet, die
π−t
, 0 < t < 2π
e ungerade ist, gilt a = 0 ,
2
durch h(t) :=
definiert sei. Da h
k
0 , t = 0 , 2π
und man hat
bk =
=
1
π
R 2π
0
1
2π
(s
Folglich gilt
h(t) ∼
Wegen
∞
P
k=1
1
k
∞
P
k=1
π−s
2
1
sin ks ds = − 2π
2π
cos ks )−
k
0
sin kt
k
R 2π
1
2π
0
R 2π
cos ks
k
0
s sin ks ds
ds =
1
2πk
2π cos 2πk =
1
k
.
.
(8)
= ∞ ist es zunächst unklar, ob diese Reihe (gegen h ) konvergiert.
3.5 Dirichlet-Kerne. a) Es sei f ∈ L1 [−π, π] . Für die Partialsummen
sn (f ; t) :=
n
P
k=−n
fb(k)eikt ,
t ∈ R,
(9)
der Fourier-Reihe gilt die Darstellung
sn (f ; t) =
1
2π
Rπ
−π
Dn (t − s) f (s) ds ,
t ∈ R,
(10)
mit den geraden, stetigen und 2π - periodischen Dirichlet-Kernen
Dn (u) =
sin (2n + 1) u2
sin u2
,
u∈R
( Dn (2kπ) = 2n + 1 ) .
(11)
18
I. Hilberträume und beschränkte lineare Operatoren
b) In der Tat gilt nach (2) und (9)
sn (f ; t) =
=
Dn (u) =
n
P
1
2π
Rπ
−π
f (s) e−iks ds eikt =
k=−n
1 Rπ
Dn (t
2π −π
n
P
iku
e
1
2π
− s) f (s) ds mit
= 1+2
k=−n
n
P
Rπ
cos ku =
k=1
−π
f (s)
n
P
eik(t−s) ds
k=−n
sin((2n+1) u2 )
sin u
2
,
wobei man die letzte Formel durch Induktion oder mit Hilfe der Eulerschen Formel
beweisen kann (vgl. etwa [KA1], 37.5).
3.6 Cesàro-Konvergenz. Eine Reihe
Folge
(σn :=
1
n+1
n
P
j=0
P
k≥0 ak
heißt Cesàro-konvergent, wenn die
sj )
der arithmetischen Mittel der Partialsummen sn konvergiert. In diesem Fall heißt
C-
∞
P
k=0
ak := n→∞
lim σn
die Cesàro-Summe der Reihe.
3.7 Bemerkungen und Beispiel. a) Eine konvergente Reihe ist auch Cesàrokonvergent; Summe und Cesàro-Summe stimmen dann überein.
b) Für die divergente Reihe
P
k≥0 (−1)
k
hat man offenbar (sj ) = (1, 0, 1, 0, . . .) und
(σn ) = (1, 12 , 32 , 21 , 53 , . . .) ; sie ist Cesàro-konvergent mit C-
∞
P
(−1)k = lim σn =
k=0
n→∞
1
2
.
c) Die Umkehrung von a) ist also i. a. falsch; sie gilt jedoch, wenn eine Abschätzung
| ak | = O( k1 ) vorliegt (vgl. [KA1], 38.19).
3.8 Fejér-Kerne. a) Wie untersuchen nun die Cesàro-Konvergenz von FourierReihen. Dazu definieren wir die Fejér-Kerne Fn ∈ C2π als arithmetische Mittel der
Dirichlet-Kerne:
Fn (u) :=
1
n
n−1
P
j=0
u ∈ R.
Dj (u) ,
(12)
Für die arithmetischen Mittel
σn (f ; t) :=
1
n
n−1
P
j=0
sj (f ; t)
(13)
der Partialsummen sn (f ; t) der Fourier-Reihe von f ∈ L1 [−π, π] gilt dann
σn (f ; t) =
1
2π
Rπ
−π
Fn (t − s)f (s) ds, ,
t ∈ R.
(14)
3.9 Satz. a) Für die Fejér-Kerne Fn ∈ C2π gilt
1
Fn (u) =
n
sin nu
2
u
sin 2
!2
,
u∈R
( Fn (2kπ) = n ) .
b) Es ist Fn gerade und Fn ≥ 0 ; weiter gilt
1
2π
Rπ
−π
lim
Fn (u) du = 1 ,
sup Fn (u) = 0
n→∞ η≤|u|≤π
für alle η > 0 .
(15)
(16)
(17)
3 Fourier-Reihen und der Satz von Fejér
19
Beweis. a) Formel (15) ergibt sich aus
2 sin2
=
n−1
P
j=0
u
2
n−1
P
j=0
n−1
P
Dj (u) =
j=0
2 sin u2 sin (2j + 1) u2
( cos ju − cos(j + 1)u) = 1 − cos nu = 2 sin2
nu
2
.
b) Die ersten Aussagen folgen sofort aus a). Setzt man f = 1 in (10), so ergibt sich
1 Rπ
Dn (u) du = 1 und daher (16). Schließlich gibt es α > 0 mit sin2 u2 ≥ α > 0
2π −π
für η ≤ |u| ≤ π , und daraus folgt sup Fn (u) ≤ α1n → 0 .
3
η≤|u|≤π
3.10 Theorem (Fejér). Für f ∈ C2π gilt σn (f ; t) → f (t) gleichmäßig auf R .
Beweis. a) Für t ∈ R folgt aus (14) mit der Substitution s = t − u auch
1
σn (f ; t) = − 2π
R t−π
t+π
Fn (u) f (t − u) du =
1
2π
Rπ
−π
Fn (u) f (t − u) du .
(18)
b) Zu ε > 0 gibt es η > 0 mit | f (t) − f (t − u) | ≤ ε für t ∈ R und | u | ≤ η , da ja
f ∈ C2π gleichmäßig stetig ist. Nach (17) gibt es n0 ∈ N mit sup Fn (u) ≤ ε für
η≤|u|≤π
n ≥ n0 . Damit ergibt sich
R
π
1
| f (t) − σn (f ; t) | = | 2π
−π Fn (u) (f (t) − f (t − u)) du |
1 Rη
≤ 2π
−η Fn (u) | f (t) − f (t − u) | du
1 R
+ 2π η≤| u |≤π Fn (u) | f (t) − f (t − u) | du
1
≤ ε 2π
≤ ε (1
Rη
−η
+ π1
für n ≥ n0 und alle t ∈ R .
1
Fn (u) du + ε 2π
Rπ
−π
| f (u) | du)
R
η≤| u |≤π
| f (t) − f (t − u) | du
3
Wir zeigen in Satz 6.7, daß dieses Theorem für die Folge (sn (f ; t)) der Partialsummen der Fourier-Reihe nicht gilt; für f ∈ C2π ist die Folge (sn (f ; t)) i. a. nicht einmal
punktweise konvergent.
3.11 Einseitige Grenzwerte. Wir zeigen nun, daß für L1 -Funktionen f noch
σn (f ; t) → f (t) in Stetigkeitspunkten von f gilt. Existieren allgemeiner für t ∈ R
die einseitigen Grenzwerte
fe(t+ ) := lim+ fe(s) ,
s→t
so definiert man
f ∗ (t) :=
1
2
fe(t− ) := lim− fe(s) ,
(fe(t+ ) + fe(t− ))
s→t
(19)
als ihren Mittelwert. In Stetigkeitspunkten von fe gilt natürlich f ∗ (t) = fe(t) . Für
e
die Funktion h aus Beispiel 3.4 gilt h∗ (t) = h(t)
auch in den Sprungstellen.
3.12 Satz (Fejér). Für f ∈ L1 (−π, π] und t ∈ R mögen die einseitigen Grenzwerte
fe(t+ ) und fe(t− ) existieren. Dann gilt σn (f ; t) → f ∗ (t) .
20
I. Hilberträume und beschränkte lineare Operatoren
Beweis. Da die Fn gerade Funktionen sind, gilt
von Theorem 3.10 folgt daher
1
2
fe(t− ) −
1
2π
Rπ
Fn (s) fe(t − s) ds =
0
1
2π
für n → ∞ und ebenso
R0
−π
1
2π
Rπ
1
2π
Rπ
0
0
Fn (u) du = 12 . Wie im Beweis
Fn (s) (fe(t− ) − fe(t − s)) ds → 0
Fn (s) fe(t − s) ds →
1
2
fe(t+ ) .
3
3.13 Folgerungen und Beispiele. a) Ist in der Situation von Satz 3.12 die FourierReihe von f an der Stelle t ∈ R konvergent, so gilt
∞
P
k=−∞
fb(k) eikt = f ∗ (t) .
b) Satz 3.12 gilt insbesondere für die Funktion h aus Beispiel 3.4. Für t = π2 ist
ihre Fourier-Reihe die nach dem Leibniz-Kriterium konvergente Leibniz-Reihe, und
somit hat man deren Summe berechnet:
∞
P
k=0
(−1)k
2k+1
= 1 − 13 + 51 − 71 + · · · = h( π2 ) =
π
4
.
c) Nach dem Dirichlet-Kriterium (vgl. etwa [KA1], 38.4) konvergiert die FourierReihe von h sogar für alle t ∈ R ; a) impliziert dann die Gleichheit in (8).
Der Satz von Fejér 3.10 impliziert, daß stetige 2π-periodische Funktionen gleichmäßig durch trigonometrische Polynome in T approximiert werden können. Daraus
folgt leicht auch die folgende wichtige Aussage über die gleichmäßige Approximation
stetiger Funktionen durch Polynome :
3.14 Theorem (Weierstraßscher Approximationssatz). Es seien J ⊆ R ein
kompaktes Intervall, f ∈ C(J, C) und ε > 0 . Dann gibt es ein Polynom P ∈ C[t]
mit
k f − P kJ = sup | f (t) − P (t) | ≤ ε .
t∈J
Beweis. Nach einer linearer Transformation können wir J ⊆ (−π, π) annehmen
und setzen f zu einer stetigen Funktion in C2π fort. Nach dem Satz von Fejér 3.10
gibt es ein m ∈ N und Zahlen (ck )−m≤k≤m ⊆ C mit
sup | f (t) −
t∈J
m
P
k=−m
ck eikt | ≤
ε
2
.
Aufgrund der auf J gleichmäßig konvergenten Entwicklung eikt =
ℓ=0
nk ∈ N mit
sup | ck | | eikt −
t∈J
Mit P (t) :=
∞
P
m
P
k=−m
ck
nk
P
ℓ=0
nk
P
ℓ=0
(ikt)ℓ
ℓ!
(ikt)ℓ
ℓ!
| ≤
ε
2(2m+1)
(ikt)ℓ
ℓ!
gibt es
.
∈ C[t] folgt dann die Behauptung.
3
Für f ∈ C(J, R) kann natürlich P ∈ R[t] gewählt werden; notfalls ersetzt man
einfach das Polynom P durch dessen Realteil Re P .
Insbesondere ist also der Raum C ∞ [a, b] dicht in C[a, b] . Nun wollen wir daraus
schließen, daß der Raum D(a, b) = C ∞ (R) ∩ Cc (a, b) der Testfunktionen auf (a, b)
für 1 ≤ p < ∞ in Lp [a, b] dicht ist. Der Grund für diese Bezeichnung wird in Satz
12.4 deutlich werden. Wir benötigen
3 Fourier-Reihen und der Satz von Fejér
21
3.15 C ∞ -Abschneidefunktionen. a) Wir wählen eine Funktion ρ ∈ C ∞ (R) mit
R
ρ ≥ 0 , supp ρ ⊆ [−1, 1] und
R
ρ(t) dt = 1 ,
z. B. ρ(t) = c exp( t21−1 ) für | t | < 1 für ein geeignetes c > 0 sowie ρ(t) = 0 für
|t| ≥ 1.
b) Für ε > 0 definieren wir dann ρε (t) :=
1
ε
ρ( εt ) und erhalten
ρε ∈ C ∞ (R) , ρε ≥ 0 , supp ρε ⊆ [−ε, ε] und
R
R
ρε (t) dt = 1 .
(20)
c) Für ein kompaktes Intervall J = [a, b] ⊆ R und ε > 0 sei
χJ,ε (t) :=
Rb
a
ρε (t − s) ds
, t ∈ R.
(21)
Offenbar gilt 0 ≤ χJ,ε ≤ 1 , χJ,ε (t) = 0 für t ≤ a − ε und t ≥ b + ε sowie χJ,ε (t) = 1
für a + ε ≤ t ≤ b − ε .
3.16 Satz. Für 1 ≤ p < ∞ und a < b ∈ R ist der Raum D(a, b) dicht in Lp [a, b] .
Beweis. Nach dem Weierstraßschen Approximationssatz und 1.24 ist der Raum
C ∞ [a, b] dicht in Lp [a, b] . Für f ∈ C ∞ [a, b] und kleine ε > 0 definieren wir mit dem
Intervall J := [a + 2ε, b − 2ε] die Testfunktion fε := f · χJ,ε ∈ D(a, b) und erhalten
k f − fε kpLp ≤
R
a+3ε
a
+
Rb
b−3ε
| f (t) (1 − χJ,ε (t)) |p dt ≤ 6 ε k f kpsup . 3
3.17 Satz. Für eine Funktion f ∈ L1 [a, b] gelte
Rb
a
f (t) ϕ(t) dt = 0
für alle ϕ ∈ D(a, b) .
(22)
Dann ist f = 0 fast überall.
Beweis. a) Nach Satz 2.5 folgt f = 0 im Raum der Äquivalenzklassen L1 [a, b],
wenn (22) sogar für alle ϕ ∈ C[a, b] gilt. Wegen der Dichtheit von C ∞ [a, b] in C[a, b]
genügt es, (22) für alle ϕ ∈ C ∞ [a, b] zu zeigen.
b) Für n ∈ N sei Jn := [a + n2 , b − n2 ] und ϕn := ϕ · χJn , 1 ∈ D(a, b) . Dann gilt
n
ϕn (t) → ϕ(t) für alle t ∈ (a, b) sowie | f (t) ϕn (t) | ≤ | f (t) | | ϕ(t) | . Mit dem Satz
über majorisierte Konvergenz folgt dann
Rb
a
f (t) ϕ(t) dt = lim
n→∞
Rb
a
f (t) ϕn (t) dt = 0 . 3
Satz 3.17 liefert eine Erklärung für den Namen Raum der Testfunktionen“ für
”
D(a, b) : Eine L1 -Funktion ist durch ihre Wirkung“ gemäß (22) auf alle Testfunk”
tionen eindeutig festgelegt.
22
4
I. Hilberträume und beschränkte lineare Operatoren
Orthonormalbasen
4.1 Orthonormalsysteme. a) Zwei Vektoren x, y ∈ H in einem Hilbertraum
heißen orthogonal, Notation: x ⊥ y , falls hx|yi = 0 gilt. Das Orthogonalkomplement
einer Menge ∅ =
6 M ⊆ H wird definiert durch
M ⊥ := {x ∈ H | hx|yi = 0 für alle y ∈ M} .
Es ist M ⊥ ein abgeschlossener Unterraum von H .
b) Eine Menge {ei }i∈I ⊆ H heißt Orthonormalsystem, falls gilt:
(
hei |ej i = δij =
0 , i 6= j
, i, j ∈ I .
1 , i=j
Ein Orthonormalsystem {ei }i∈I in H mit {ei }⊥ = {0} heißt maximal. Maximalität
bedeutet offenbar, daß {ei }i∈I nicht zu einem echt größeren Orthonormalsystem erweitert werden kann.
c) Wir betrachten hier nur abzählbare Orthonormalsysteme und verwenden als Indexmenge I = N0 oder I = Z .
d) Die Einheitsvektoren“ {ek := (δki )i∈N0 } | k ∈ N0 } bilden ein Orthonormalsystem
”
in ℓ2 . Dieses ist maximal: Ist nämlich ξ = (ξi ) ∈ ℓ2 mit hξ|ek i = ξk = 0 für alle
k ∈ N0 , so muß offenbar ξ = 0 sein.
e) Aufgrund der Orthogonalitätsrelationen (3.5) bilden die Funktionen {eikt }k∈Z
ein Orthonormalsystem im Hilbertraum L2 ([−π, π],dt)
¯ , wobei wir zur Abkürzung
dt
setzen.
dt
¯ = 2π
f) Analog zur konkreten Situation in e) heißen für ein Orthonormalsystem {ei }i∈I
in einem Hilbertraum H und x ∈ H die Zahlen
xb(i) := hx|ei i , i ∈ I ,
(1)
Fourier-Koeffizienten von x bezüglich {ei }i∈I .
4.2 Lemma. Es sei {ei }i∈I ein Orthonormalsystem in einem Hilbertraum H . Für
eine endliche Teilmenge I ′ ∈ E(I) von I gilt
k
P
i∈I ′
kx−
ξi ei k2 =
P
i∈I ′
P
| ξi |2 ,
i∈I ′
ξi ∈ K ,
xb(i)ei k2 = k x k2 −
P
i∈I ′
Beweis. Zunächst ergibt sich (2) aus
k
P
i∈I ′
ξi ei k2 = h
P
i∈I ′
ξi ei |
P
j∈I ′
und
(2)
| xb(i) |2 ,
ξj ej i =
P
i,j∈I ′
x∈H.
ξi ξj δij =
(3)
P
i∈I ′
| ξi |2 ,
daraus mit (4) und (1) dann (3):
kx−
P
i∈I ′
xb(i)ei k2 = k x k2 − 2
= k x k2 −
P
i∈I ′
P
i∈I ′
| xb(i) |2 + k
| xb(i) |2 .
P
i∈I ′
xb(i)ei k2
23
4 Orthonormalbasen
Aussage (2) ist eine Version des Satzes des Pythagoras. Wir bemerken in 5.4 unP
ten, dass P x :=
xb(i)ei die orthogonale Projektion von x ∈ H auf die lineare
i∈I ′
Hülle [ei ]i∈I ′ der {ei }i∈I ′ ist. Aus Formel (3) folgt sofort die wichtige Besselsche
Ungleichung:
4.3 Satz (Besselsche Ungleichung). Für x ∈ H gilt (xb(i))i∈I ∈ ℓ2 (I) und
P
i∈I
| xb(i) |2 ≤ k x k2 .
Als erste Anwendung zeigen wir:
1
4.4 Satz. Für eine periodische C 1 -Funktion f ∈ C2π
(R) gilt
∞
P
k=−∞
| fb(k) | < ∞ ;
(4)
insbesondere konvergiert die Fourier-Reihe von f gleichmäßig gegen f .
Beweis. a) Für k ∈ Z\{0} folgt mit partieller Integration
fb(k) =
1
ik
fb′ (k) .
(5)
b) Für n ∈ N folgt nun aus der Schwarzschen Ungleichung im R2n und der Besselschen Ungleichung
P
0<| k |≤n
| fb(k) | =
P
0<| k |≤n
≤ (
1
|k|
P
0<| k |≤n
| fb′ (k) |
1
1
) /2
| k |2
(
P
0<| k |≤n
| fb′ (k) |2)
1/
2
≤ C k f ′ k L2 .
Nun verwendet man den Satz von Fejér bzw. Bemerkung 3.13 a).
1
Für f ∈ C2π
(R) gilt sogar
∞
P
k=−∞
3
| fb(k) |p < ∞ für p > 32 , und Satz 4.4 gilt sogar für
alle f ∈ C2π (R) , die eine Hölder-Bedingung | f (t) − f (s) | ≤ C | t − s |α mit α >
erfüllen. Dazu sei etwa auf [KFA], Abschnitt 6.2 verwiesen.
1
2
4.5 Orthogonale Summen. a) Es seien {ek }k∈N0 ein Orthonormalsystem in einem
Hilbertraum H und ξ = (ξk ) ∈ ℓ2 . Nach dem Satz des Pythagoras (2) gilt
k
n
P
k=m
ξk ek k2 =
n
P
k=m
| ξk |2 ;
wegen der Vollständigkeit von H ist daher die Reihe x :=
∞
P
k=0
ξk ek in H konvergent.
b) Jede Umordnung der Reihe liefert die gleiche Summe. Dies kann man wegen
(2) wie im Fall absolut konvergenter skalarer Reihen beweisen, vgl. etwa [KA1],
32.9. Beachten Sie, dass die Reihe nur für ξ = (ξk ) ∈ ℓ1 sogar absolut konvergent
ist. Im Gegensatz zum skalaren und zum endlichdimensionalen Fall gibt es also in
jedem unendlichdimensionalen Hilbertraum unbedingt konvergente Reihen, die nicht
absolut konvergieren.
c) Wegen b) kann man entsprechende Summen über jede (abzählbare) Indexmenge,
insbesondere über Z , bilden.
24
I. Hilberträume und beschränkte lineare Operatoren
4.6 Die Fourier-Abbildung. Es sei {ei }i∈I ein Orthonormalsystem in einem
Hilbertraum H . Aufgrund der Besselschen Ungleichung hat man die lineare FourierAbbildung
F : H 7→ ℓ2 (I) , F (x) := (xb(i))i∈I
mit k F k ≤ 1 . Diese ist stets surjektiv: Für ξ = (ξi ) ∈ ℓ2 (I) setzt man x =
und erhält sofort hx|ej i = ξj für alle j ∈ I und somit F (x) = ξ .
P
i∈I
ξi ei
Die Fourier-Abbildung ist genau dann injektiv, wenn das Orthonormalsystem maximal ist. Weitere dazu äquivalente Aussagen enthält der folgende
4.7 Satz. Für ein Orthonormalsystem {ei }i∈I in einem Hilbertraum H sind äquivalent:
(a) Es gilt x =
P
i∈I
xb(i)ei für alle x ∈ H .
(b) Für alle x ∈ H gilt die Parsevalsche Gleichung
P
i∈I
| xb(i) |2 = k x k2 .
(6)
(c) Die Fourier-Abbildung F : H 7→ ℓ2 (I) ist isometrisch.
(d) Die lineare Hülle [ei ]i∈I von {ei }i∈I ist dicht in H .
(e) Die Fourier-Abbildung F : H 7→ ℓ2 (I) ist injektiv.
(f ) Das Orthonormalsystem {ei }i∈I ist maximal.
Beweis.
(a) ⇔ (b)“ folgt sofort aus (3),
(b) ⇔ (c)“ und
”
”
(a) ⇒ (d)“ sind klar.
”
(d) ⇒ (e)“: Aus F (x) = 0 folgt hx|yi = 0 für alle y ∈ [ei ]i∈I , wegen der Dichtheit
”
dieser Menge in H also auch hx|xi = 0 .
(e) ⇒ (f)“: Für x ∈ {ei }⊥ gilt F (x) = 0 , also auch x = 0 .
”
P
xb(i)ei in
(f) ⇒ (a)“: Für x ∈ E ist (xb(i))i∈I ∈ ℓ2 (I) , und daher existiert x1 :=
”
i∈I
H . Man berechnet sofort hx − x1 |ei i = 0 für alle i ∈ I , und die Maximalität von
{ei }i∈I impliziert dann x − x1 = 0 .
3
4.8 Polarformel. a) Das Skalarprodukt eines Hilbertraumes kann mittels der Polarformel aus der Norm rekonstruiert werden. Diese ergibt sich leicht aus (1.4) und
lautet im reellen Fall
4 hx|yi = k x + y k2 − k x − y k2 ;
(7)
im komplexen Fall hat man
4 hx|yi = k x + y k2 − k x − y k2 + i k x + iy k2 − i k x − iy k2 .
(8)
b) Aufgrund der Polarformel ist die Parsevalsche Gleichung (6) äquivalent zu
P
i∈I
xb(i) yb(i) = hx|yi für x, y ∈ H .
(9)
25
4 Orthonormalbasen
4.9 Orthonormalbasen. Ein maximales Orthonormalsystem {ei }i∈I in einem
Hilbertraum H heißt vollständig oder eine Orthonormalbasis von H ; es gelten
dann also die Eigenschaften (a)–(f) aus Satz 4.7. Insbesondere besitzt nach (a) dann
P
xb(i)ei nach den Basisvekjeder Vektor x ∈ H eine Fourier-Entwicklung“ x =
”
i∈I
toren {ei } .
Die Einheitsvektoren“ {ek := (δki )i∈I }k∈I sind nach 4.1 d) ein maximales Ortho”
normalsystem in ℓ2 (I) , bilden also eine Orthonormalbasis dieses Hilbertraums. Ein
weiteres wesentliches Beispiel sind natürlich die konkreten“ Fourier-Reihen:
”
ikt
4.10 Theorem. Die Funktionen {e }k∈Z bilden eine Orthonormalbasis des Hilbertraumes L2 ([−π, π],dt)
¯ . Für f ∈ L2 [−π, π] konvergiert also die Fourier-Reihe im
quadratischen Mittel gegen f , d.h. es gilt
kf −
n
P
k=−n
fb(k)eikt kL2 → 0
für n → ∞ .
Man hat die Parsevalsche Gleichung
∞
P
k=−∞
| fb(k) |2 = k f k2L2 =
Rπ
1
2π
−π
| f (t) |2 dt ,
f ∈ L2 [−π, π] ,
(10)
und somit die isometrische und surjektive Fourier-Abbildung
F : L2 [−π, π] 7→ ℓ2 (Z) ,
F (f ) := (fb(k))k∈Z .
Beweis. Wie in 1.17 erwähnt, ist der Raum C2π dicht in L2 [−π, π] . Nach dem Satz
von Fejér ist die lineare Hülle [eikt ]k∈Z der Basisfunktionen dicht in C2π bzgl. der
sup -Norm, erst recht also bzgl. der L2 -Norm. Somit ist Bedingung (d) von Satz 4.7
erfüllt.
3
4.11 Beispiele und Folgerungen. a) Mit den Koeffizienten ak , bk der reellen
Fourier-Entwicklung von f ∈ L2 [−π, π] (vgl. die Formeln (3.2) und (3.3)) gilt die
Parsevalsche Gleichung in der Form
| a0 |2
2
+
∞
P
k=1
| ak |2 +
b) Die Entwicklung
π−t
2
=
∞
P
k=1
∞
P
k=1
| bk |2 =
sin kt
k
1
π
Rπ
−π
| f (t) |2 dt .
(11)
(vgl. Formel (3.8)) gilt nach Theorem 4.10 also
in L2 [0, 2π] . Die Parsevalsche Gleichung (11) liefert dann die Eulersche Formel
∞
P
k=1
1
k2
=
1
π
R 2π π−t 2
0
2
dt =
π2
6
.
4.12 Satz. Ein Hilbertraum H besitzt genau dann eine abzählbare Orthonormalbasis, wenn H separabel ist. In diesem Fall ist H isometrisch isomorph zum Folgenraum ℓ2 .
Beweis. ⇒ “ ist klar, da ℓ2 separabel ist.
”
⇐ “: Wir wählen eine dichte Folge in H und erhalten durch Weglassen überflüssi”
”
ger“ Vektoren eine Folge {xk }k≥0 linear unabhängiger Vektoren mit [xk ]k≥0 = H .
Dann konstruieren wir induktiv ein Orthonormalsystem {ek }k≥0 in H mit
[x0 , . . . , xk ] = [e0 , . . . , ek ] für k ≥ 0 .
(12)
26
I. Hilberträume und beschränkte lineare Operatoren
Dazu seien e0 := k xx00 k und orthonormale Vektoren {e0 , . . . , en−1 } mit (12) für
k = 0, . . . , n − 1 schon konstruiert. Dann ist
0 6= w := xn −
n−1
P
k=0
und wir definieren en :=
von H .
hxn |ek i ek ∈ [e0 , . . . , en−1 ]⊥ ,
w
kwk
(13)
. Offenbar ist dann {ek }k≥0 eine Orthonormalbasis
3
Im Beweis von Satz 4.12 haben wir die Gram-Schmidt-Orthonormalisierung verwendet.
4.13 Überabzählbare Orthonormalbasen. Ein nicht separabler Hilbertraum H
besitzt eine überabzählbare Orthonormalbasis. Um dies einzusehen, startet man
mit einem Orthonormalsystem, z. B. mit einem einzigen Einheitsvektor, und erweitert dieses so lange durch zusätzliche orthonormale Vektoren, bis dies nicht mehr
”
möglich ist“; das so konstruierte Orthonormalsystem ist dann maximal, also eine Orthonormalbasis von H . Dieses naive“ Erweiterungsargument kann mit Hilfe
”
transfiniter Induktion oder des Zorschen Lemmas präzisiert werden.
Nach Theorem 4.10 gilt insbesondere L2 [−π, π] ∼
= ℓ2 ; wir zeigen nun sogar
= ℓ2 (Z) ∼
n
∼
L2 (Ω) = ℓ2 für jede messbare Menge Ω ⊆ R . Zunächst gilt
4.14 Satz. Es seien {ej }j∈N0 und {fk }k∈N0 Orthonormalbasen von L2 (Ω1 ) und
L2 (Ω2 ) . Mit Ω := Ω1 × Ω2 ist dann {ej (t)fk (s)}j,k∈N0 eine Orthonormalbasis von
L2 (Ω) .
Beweis. Offenbar ist {ej (t)fk (s)}j,k∈N0 ein Orthonormalsystem in L2 (Ω) . Für
f ∈ L2 (Ω) liegen die Funktionen (t, s) 7→ f (t, s)ej (t)fk (s) in L1 (Ω) . Nun gelte
R
Ω
f (t, s)ej (t)fk (s) d(s, t) = 0 für alle j, k ∈ N0 .
Nach dem Satz von Fubini ist dann
R
Ω1
R
Ω2
f (t, s)fk (s) ds ej (t) dt = 0 für alle j, k ∈ N0 ,
R
Ω2
also
f (t, s)fk (s) ds = 0 für fast alle t ∈ Ω1 und alle k ∈ N0 .
Es folgt ft = 0 f.ü. auf Ω2 für fast alle t ∈ Ω1 , und der Satz von Fubini liefert
R
Ω
| f (t, s) |2 d(s, t) =
R
Ω1
R
Ω2
| f (t, s) |2 ds dt = 0 . 3
4.15 Satz. Es sei Ω ⊆ Rn eine messbare Menge. Dann ist der Hilbertraum L2 (Ω)
separabel und somit isometrisch isomorph zum Folgenraum ℓ2 .
Beweis. a) Nach Theorem 4.10 ist dies für den Hilbertraum L2 [−π, π] richtig
und folgt mittels linearer Variablentransformation sofort auch für den Hilbertraum
L2 [a, b] .
b) Nach Satz 4.14 ist auch der Hilbertraum L2 ([−k, k]n ) für alle k ∈ N separabel.
c) Durch Fortsetzung einer Funktion zu 0 außerhalb von Ω kann man L2 (Ω) mit
einem abgeschlossenen Unterraum von L2 (Rn ) identifizieren. Dieser Raum ist sepaS
rabel, da k∈N L2 ([−k, k]n ) , in L2 (Rn ) dicht ist.
4 Orthonormalbasen
d) Schließlich verwendet man Satz 1.27.
27
3
Aufgrund von Satz 4.15 können Observable der Quantenmechanik als (partielle
Differential-) Operatoren in L2 (Ω) oder als Matrix-Operatoren in ℓ2 realisiert werden; E. Schrödingers Wellenmechanik und W. Heisenbergs Matrizenmechanik sind
äquivalente Formulierungen der Quantenmechanik.
Wir geben noch einige konkrete Orthonormalbasen an:
4.16 Legendre-Polynome. Nach dem Weierstraßschen Approximationssatz ist die
lineare Hülle [tk ]k≥0 der Monome dicht in C[a, b] , also auch dicht in (L2 [a, b], dt) .
Ihre Gram-Schmidt-Orthonormalisierung liefert die Orthonormalbasis {Pk }k≥0 aus
Legendre-Polynomen von L2 [a, b] :
√
d k
2k + 1
(
Pk (t) =
) ((t − a)k (t − b)k ) , k ∈ N0 .
(14)
1
k+ 2
dt
k!
(b − a)
4.17 Hermite-Funktionen. a) Die Hermite-Polynome vom Grad n werden definiert durch
2
2
Hn (t) := (−1)n et ( dtd )n e−t , n ∈ N0 .
(15)
2
b) Man hat die erzeugende Funktion e2ut−u , es gilt die Formel
2
e2ut−u =
∞
P
n=0
1
n!
Hn (t) un .
2
(16)
2
2
Dazu differenziert man e2ut−u = et e−(t−u) n -mal nach u und wertet das Resultat
in u = 0 aus.
c) Nun differenziert man (16) nach t ; durch Vergleich der links und rechts stehenden
Reihen erhält die Rekursionsformel
Hn′ = 2nHn−1
für alle n ∈ N .
(17)
d) Die Hermite-Funktionen werden durch
√
1
t2
hn (t) := (2n n! π)− 2 Hn (t) e− 2
(18)
definiert; sie bilden ein Orthonormalsystem in L2 (R) . Für n ≤ m liefert in der Tat
partielle Integration wegen (17)
R∞
2
−∞
Hn (t) Hm (t) e−t dt =
R∞
2
−∞
n
2nHn−1 (t) (− dtd )m−1 e−t dt = . . .
= 2 n!
R∞
−∞
2
H0 (t) (− dtd )m−n e−t dt .
Wegen H0 (t) = 1 ergibt sich
√ hHn |Hm i =2 0 für n < m , und für n = m hat man
R∞
2 −t2
n
H
(t)
e
dt
=
2
n!
π , also k hn k = 1 .
n
−∞
e) Die Hermite-Funktionen sind sogar eine Orthonormalbasis von L2 (R) . Dies ergibt
sich mittels Fourier-Transformation (vgl. Abschnitt 14):
t2
Ist f ∈ [hn ]⊥ , so gilt f ⊥ tn e− 2 für alle n ∈ N0 . Für feste τ ∈ R gilt
m
P
n=0
t2
t2
| n!1 (−itτ )n | e− 2 ≤ e| t || τ |− 2
für alle m ∈ N
28
I. Hilberträume und beschränkte lineare Operatoren
t2
und daher die Reihenentwicklung e−itτ − 2 =
Satz über majorisierte Konvergenz. Es folgt
∞
P
n=0
∞
R
P
t2
t2
¯ =
F (e− 2 f¯)(τ ) = R e−itτ e− 2 f¯(t)dt
n=0
1
n!
t2
(−itτ )n e− 2 in L2 (R) nach dem
(−iτ )n
n!
R
2
R
t
tn e− 2 f¯(t)dt
¯ =0
t2
für alle τ ∈ R . Da F isometrisch ist, impliziert dies e− 2 f¯(t) = 0 fast überall und
somit f (t) = 0 fast überall. Nun verwendet man Satz 4.7.
5 Beschränkte lineare Operatoren auf Hilberträumen
5
29
Beschränkte lineare Operatoren auf Hilberträumen
5.1 Satz. Es seien H ein Hilbertraum und C ⊆ H eine abgeschlossene konvexe
Menge. Zu x ∈ H gibt es genau ein P (x) = PC (x) ∈ C mit
k x − P (x) k = dC (x) = inf {k x − y k | y ∈ C} .
(1)
Die metrische Projektion P = PC : H 7→ C ist eine stetige Abbildung.
Beweis. a) Mittels (1.6) bestätigt man sofort die Parallelogrammgleichung
k ξ + η k2 + k ξ − η k2 = 2 (k ξ k2 + k η k2 ) für ξ, η ∈ H .
(2)
b) Nun sei (yk ) eine Minimalfolge in C für x ∈ H , d. h. es gelte k x−yk k → dC (x) .
Die Parallelogrammgleichung liefert dann
kx−
yk +yj
2
k2 + k
yk −yj
2
k2 =
1
2
(k x − yk k2 + k x − yj k2 ) → dC (x)2 ;
j
j
wegen yk +y
∈ C gilt aber auch k x− yk +y
k2 ≥ dC (x)2 , und es folgt k yk −yj k → 0 ,
2
2
d. h. (yk ) ist eine Cauchy-Folge. Ihr Grenzwert P (x) := lim yk ∈ C erfüllt dann
offenbar (1).
k→∞
c) Sind y, z ∈ C mit k y −x k = k z −x k = dC (x) , so ist die Folge (y, z, y, z, y, z, . . .)
eine Minimalfolge für x , nach b) also eine Cauchy-Folge. Dies impliziert offenbar
y = z . Somit wird durch (1) also tatsächlich eine Abbildung P = PC : H 7→ C
definiert.
d) Nun sei (xk ) eine Folge in H mit xk → x . Wegen der Stetigkeit der Distanzfunktion dC gilt
dC (x) ≤ k x − P (xk ) k ≤ k x − xk k + k xk − P (xk ) k
= k x − xk k + dC (xk ) → dC (x) ,
und (P (xk )) ist eine Minimalfolge für x . Aufgrund der Beweisteile b) und c) folgt
dann P (xk ) → P (x) .
3
Für die stetige Abbildung PC : H 7→ C gilt offenbar PC (x) = x für x ∈ C ; eine
solche Abbildung nennt man eine Retraktion von H auf C .
Für die Formulierung des nächsten Satzes benötigen wir noch einen Begriff:
5.2 Direkte und orthogonale Summen. a) Es seien E ein Vektorraum und
V, W Unterräume von E . Die Summe
V + W = {v + w | v ∈ V , w ∈ W }
heißt direkt, falls V ∩ W = {0} gilt; dies ist genau dann der Fall, wenn jeder Vektor
x ∈ V + W eine eindeutige Zerlegung x = v + w mit v ∈ V und w ∈ W hat.
Direkte Summen werden als V ⊕ W notiert.
b) Nun seien H ein Hilbertraum und V, W Unterräume von H . Die Summe V + W
heißt orthogonal, falls V ⊥ W gilt. Eine orthogonale Summe bezeichnen wir mit
V ⊕2 W ; sie ist natürlich stets direkt.
30
I. Hilberträume und beschränkte lineare Operatoren
Für abgeschlossene Unterräume F ⊆ H ist die metrische Projektion PF : H 7→ F
ein linearer Operator, die orthogonale Projektion von H auf F :
5.3 Satz. Es seien H ein Hilbertraum und F ⊆ H ein abgeschlossener Unterraum.
a) Für x ∈ H gibt es genau einen Vektor x1 ∈ F mit x − x1 ⊥ F , nämlich
x1 = P (x) = PF (x) .
b) Man hat die orthogonale Zerlegung
H = F ⊕2 F ⊥ = R(P ) ⊕2 N(P ) ,
(3)
und P : x1 + x2 7→ x1 ist die entsprechende orthogonale Projektion von H auf F .
Man hat P ∈ L(H) , P 2 = P und k P k = 1 . Für x, y ∈ H gilt
hP x|yi = hP x|P yi = hx|P yi .
(4)
Beweis. a) Eindeutigkeit: Sind x1 , x′1 ∈ F mit x − x1 ⊥ F und x − x′1 ⊥ F , so
folgt x1 − x′1 = (x1 − x) + (x − x′1 ) ∈ F ⊥ ∩ F , also x1 − x′1 = 0 .
Existenz: Wir zeigen, daß für x ∈ H und die metrische Projektion x1 := PF x der
Vektor x − x1 zu F orthogonal ist. Für y ∈ F mit k y k = 1 und α := hx − x1 |yi
gilt in der Tat
k x − x1 k2 ≤ k x − x1 − αy k2
= k x − x1 k2 − ᾱ hx − x1 |yi − α hy|x − x1 i + | α |2
= k x − x1 k2 − | α |2
aufgrund von (1); dies impliziert α = 0 und somit x − x1 ⊥ F .
b) Wir zeigen zunächst H = F ⊕2 F ⊥ : es ist F ⊥ F ⊥ klar, und für x ∈ H gilt
x = x1 + x2 mit x1 = P (x) ∈ F und x2 = x − x1 ∈ F ⊥ nach a). Offenbar hat man
F = R(P ) und F ⊥ = N(P ) .
Die Linearität von P sieht man so: Für x, y ∈ H und α ∈ K hat man
(αx + y) − (αP x + P y) = α (x − P x) + (y − P y) ∈ F ⊥ ,
also P (αx + y) = (αP x + P y) .
Wegen P (P x) = P x gilt P 2 = P , und wegen k x k2 = k P x k2 + k x − P x k2 hat
man k P k = 1 . Aussage (4) folgt schließlich aus hP x|y − P yi = hx − P x|P yi = 0 .
3
5.4 Bemerkungen und Folgerungen. a) Nach Satz 4.12 besitzt jeder abgeschlossene Unterraum F eines (separablen) Hilbertraums H eine Orthonormalbasis
P
P
{ei }i∈I . Für x ∈ H hat man x − xb(i) ei ⊥ F wegen hx − xb(i) ei |ej i = 0 für
alle j ∈ I ; folglich gilt
Px =
P
i∈I
i∈I
xb(i) ei , x ∈ H .
i∈I
(5)
Die orthogonale Projektion von H auf einen abgeschlossenen Unterraum F läßt
sich also ohne Verwendung von Satz 5.1 auch mittels (5) konstruieren, wobei die
Existenz einer Orthonormalbasis von F verwendet wird.
31
5 Beschränkte lineare Operatoren auf Hilberträumen
b) Offenbar gilt M ⊆ (M ⊥ )⊥ und damit auch [M] ⊆ (M ⊥ )⊥ für jede nicht leere
Menge M ⊆ H . Mit F := [M] gilt H = F ⊕2 F ⊥ nach (3). Ist nun entsprechend
x = x1 + x2 ∈ (M ⊥ )⊥ = (F ⊥ )⊥ , so folgt
hx2 |x2 i = hx2 |x1 + x2 i = hx2 |xi = 0
und somit x = x1 ∈ F . Es gilt also
(M ⊥ )⊥ = [M] für ∅ =
6 M ⊆H.
(6)
5.5 Adjungierte Operatoren. Beim Studium von Matrizen über K = R oder
K = C spielen adjungierte Matrizen eine wichtige Rolle. Entsprechend möchte man
für Hilberträume H, G zu T ∈ L(H, G) den adjungierten“ Operator T ∗ ∈ L(G, H)
”
definieren, sodass
h T x|y i = h x|T ∗ y i für alle x ∈ H und y ∈ G
gilt. Dazu benötigt man die Surjektivität der Isometrie j = jH : H → H ′ eines
Hilbertraums in seinen Dualraum aus (3.6):
5.6 Satz(Rieszscher Darstellungssatz). Es sei η ∈ H ′ eine stetige Linearform
auf einem Hilbertraum H . Dann gibt es genau ein y ∈ H mit
η(x) = hx|yi
für x ∈ H .
Beweis. Für η = 0 wählt man y = 0 . Für η 6= 0 ist der Kern N(η) ein abgeschlossener Unterraum von H . Nach Satz 5.3 gibt es z ∈ N(η)⊥ mit k z k = 1 , also
η(z) 6= 0 . Für x ∈ H gibt es daher α ∈ K mit η(x) = α η(z) , also η(x − αz) = 0
und x − αz ∈ N(η) . Es folgt h x − αz|z i = 0 , also α = h αz|z i = h x|z i , und man
erhält
η(x) = h x|z i η(z) =: h x|y i mit y := η(z) z ∈ N(η)⊥ . 3
5.7 Satz. Es seien H, G Hilberträume über K . Zu T ∈ L(H, G) gibt es genau
einen Operator T ∗ ∈ L(G, H) mit
h T x|y i = h x|T ∗ y i für alle x ∈ H und y ∈ G ,
(7)
den adjungierten Operator zu T . Es gilt k T ∗ k = k T k .
Beweis. Für y ∈ G wird durch x 7→ h T x|y i eine stetige Linearform auf H definiert. Nach dem Rieszschen Darstellungssatz 5.6 gibt es genau ein y ∗ ∈ H mit
h T x|y i = hx|y ∗ i für x ∈ H . Durch T ∗ : y 7→ y ∗ wird dann ein linearer Operator
von G nach H mit (7) definiert, und man hat
k T ∗ k = sup {k T ∗y k | k y k ≤ 1} = sup {| h x|T ∗y i | | k x k , k y k ≤ 1}
= sup {| h T x|y i | | k x k , k y k ≤ 1} = sup {k T x k | k x k ≤ 1} = k T k .
5.8 Bemerkungen. Stets gilt (T ∗ )∗ = T , (T1 + T2 )∗ = T1∗ + T2∗ , (λT )∗ = λ̄T ∗ und
(ST )∗ = T ∗ S ∗ . Ist T ein Isomorphismus, so gilt dies auch für T ∗ , und man hat
(T ∗ )−1 = (T −1 )∗ . Diese Aussagen sind leicht nachzurechnen.
32
I. Hilberträume und beschränkte lineare Operatoren
5.9 Definition. Ein Operator T ∈ L(H) heißt selbstadjungiert, falls T ∗ = T ,
unitär, falls T ∗ = T −1 und normal, falls T ∗ T = T T ∗ ist.
Der Begriff unitär“ ist auch sinnvoll für Operatoren T ∈ L(H, G) zwischen ver”
schiedenen Hilberträumen.
5.10 Matrix-Darstellungen und adjungierte Matrizen. Es seien H, G (separable) Hilberträume mit Orthonormalbasen {ej }j∈J und {fi }i∈I . Für T ∈ L(H, G)
P
xb(j)ej ∈ H gilt
und x =
j∈J
Tx =
P
j∈J
mit der Matrix
xb(j)T ej =
P
j∈J
xb(j)
P
i∈I
aij fi =
P P
i∈I j∈J
aij xb(j) fi
M(T ) := (aij )i∈I,j∈J = (hT ej |fi i)i∈I,j∈J .
(8)
(9)
Umgekehrt definiert eine Matrix durch (8) wie in (2.12) einen Operator T ∈ L(H, G) ,
wenn k A kHS < ∞ oder k A kZS k A kSS < ∞ gilt.
b) Im Fall H = G wählt man die gleiche Orthonormalbasis {ei }i∈I für Urbildraum
und Bildraum. Mit der Fourier-Abbildung F : H 7→ ℓ2 (I) ist dann der auf ℓ2 (I)
wirkende Matrix-Operator M(T ) = F T F −1 ähnlich zu T . Da F ein unitärer Operator ist, ist M(T ) sogar unitär äquivalent zu T .
c) In der Situation von a) gilt
aij = hT ej |fi i = hej |T ∗ fi i = hT ∗ fi |ej i = a∗ji ,
und somit ist die Matrix von T ∗ ∈ L(G, H) bezüglich der Orthonormalbasen {fi }i∈I
und {ej }j∈J gegeben durch M(T ∗ ) = (a∗ji ) = (aij ) , also durch die adjungierte Matrix
zu M(T ) . Diese Aussage gilt natürlich insbesondere im endlichdimensionalen Fall.
d) Für einen Diagonaloperator D = diag(αk ) auf ℓ2 hat man insbesondere
D ∗ = diag(αk ) und D ∗ D = DD ∗ = diag(| αk |2 ) . Somit ist D stets normal; D ist
genau dann selbstadjungiert, wenn alle αk reell sind und genau dann unitär, wenn
| αk | = 1 für alle k gilt.
5.11 Multiplikationsoperatoren. a) Es sei K ⊆ Rn kompakt. Für eine stetige
Funktion a ∈ C(K) wird ein Multiplikationsoperator Ma ∈ L(L2 (K)) definiert durch
(Ma f )(t) := a(t) f (t) ,
t ∈ K , f ∈ L2 (K) .
(10)
Offenbar ist k Ma k ≤ k a ksup , und es ist sogar k Ma k = k a ksup . Für Funktionen
f, g ∈ L2 (K) hat man
h Ma f |g i =
R
K
a(t)f (t) g(t) dt = h f |Ma∗ g i mit
(Ma∗ g)(t) := a(t) g(t) = (Mā g)(t) ,
t ∈ K , g ∈ L2 (K) ,
also Ma∗ = Mā . Offenbar ist Ma stets normal; Ma ist selbstadjungiert genau dann,
wenn a reellwertig ist und unitär genau dann, wenn | a(t) | = 1 für alle t ∈ K gilt.
5 Beschränkte lineare Operatoren auf Hilberträumen
33
b) Für a ∈ C2π und H = L2 ([−π, π],dt)
¯ berechnen wir die Matrix von Ma bezüglich
ikt
der Basis {e }k∈Z . Nach (9) ist
akj = hMa e0j |e0k i =
Rπ
−π
a(t) eijt e−ikt dt
¯ = ab(k − j)
für k, j ∈ Z ; somit ist M(Ma ) die zweiseitig unendliche Toeplitz-Matrix

M(Ma ) =
..












..
..
.
..
.
..
..
.
. ab(0) ab(−1) ab(−2) ab(−3)
. ab(1)
ab(2)
ab(0)
ab(1)
..
.

.
ab(−1) ab(−2)
..
.
.
ab(−1) . .
..
..
.
.
ab(0)
..
.












,
wobei das Element ab(0) an der Stelle (0, 0) steht. Beachten Sie, dass k A kHS < ∞
nur für a = 0 erfüllt ist und dass k A kZS k A kSS < ∞ genau dann gilt, wenn
∞
P
k=−∞
1
| ab(k) | < ∞ ist, also z. B. im Fall a ∈ C2π
(R) (vgl. Satz 4.4).
5.12 Adjungierte Integraloperatoren. Es sei Ω ein σ -endlicher Maßraum, z. B.
eine meßbare Menge in Rn , und für den meßbaren Kern κ : Ω2 7→ K gelte
κ ∈ L2 (Ω2 ) oder k κ kSI k κ kZI < ∞ .
(11)
Für den linearen Integraloperator
(Sκ f )(t) :=
R
Ω
κ(t, s) f (s) ds ,
t ∈ Ω , f ∈ L2 (Ω) ,
und f, g ∈ L2 (Ω) hat man nach den Sätzen von Fubini und Tonelli
h Sκ f |g i =
R R
Ω Ω
κ(t, s)f (s) ds g(t) dt =
(Sκ∗ g)(t) =
R
Ω
κ(s, t) g(s) ds ,
R
Ω
f (s)
R
Ω
κ(t, s)g(t) dt ds = h f |Sκ∗g i mit
t ∈ Ω , g ∈ L2 (Ω) .
(12)
Mit κ erfüllt auch der adjungierte Kern κ∗ (t, s) = κ(s, t) Bedingung (11). Es ist Sκ
genau dann selbstadjungiert, wenn κ = κ∗ fast überall auf Ω2 gilt.
5.13 Der Shift-Operator oder Rechts-Shift-Operator auf ℓ2 ist definiert durch
S+ (x0 , x1 , x2 , x3 , . . .) := (0, x0 , x1 , x2 , . . .) .
(13)
Er wird durch die Matrix
M(S+ ) =







0
1
0
..
.

0 0 ···

0 0 ··· 


1 0 ··· 

..
..
.
.
dargestellt. Für diese gilt Bedingung (2.13), nicht aber Bedingung (2.11). Offenbar
ist S+ eine Isometrie von ℓ2 in ℓ2 , die nicht surjektiv ist.
34
I. Hilberträume und beschränkte lineare Operatoren
∞
Für Folgen x = (xk )∞
k=0 , y = (yk )k=0 ∈ ℓ2 gilt
h S+ x|y i =
∞
P
k=1
xk−1 yk =
mit dem Links-Shift-Operator
∞
P
j=0
xj yj+1 = h x|S− y i
S+∗ = S− : (y0 , y1, y2 , y3 , . . .) 7→ (y1 , y2 , y3, . . .) .
(14)
Offenbar ist S− S+ = I und
S+ S− (y0 , y1 , y2 , y3, . . .) = (0, y1, y2 , y3, . . .) ,
also S+ S− die orthogonale Projektion von ℓ2 auf den Unterraum {y ∈ ℓ2 | y0 = 0} .
Insbesondere sind S+ und S− nicht normal.
5.14 Satz. Es seien H, G Hilberträume. Für T ∈ L(H, G) gilt
R(T )⊥ = N(T ∗ ) und R(T ) = N(T ∗ )⊥ .
(15)
Ist R(T ) abgeschlossen, so gilt also R(T ) = N(T ∗ )⊥ .
Beweis. a) Man hat die Äquivalenzen
y ∈ R(T )⊥ ⇔ ∀ x ∈ H : h T x|y i = 0 ⇔ ∀ x ∈ H : h x|T ∗y i = 0
⇔ T ∗ y = 0 ⇔ y ∈ N(T ∗ ) .
b) Mit (6) ergibt sich nun R(T ) = (R(T )⊥ )⊥ = N(T ∗ )⊥ .
3
5.15 Satz. Ein Operator P ∈ L(H) ist genau eine orthogonale Projektion, wenn
P ∗ = P = P 2 gilt.
Beweis. ⇒ “ folgt aus Satz 5.3, insbesondere (4).
”
⇐ “: Es sei F := R(P ) . Wegen P = P 2 gilt
”
y ∈ F ⇔ ∃ x ∈ H : y = P x = P 2 x ⇔ y = P y ⇔ y ∈ N(I − P ) .
Somit ist F = N(I − P ) abgeschlossen, und aus Satz 5.14 folgt
F ⊥ = R(P )⊥ = N(P ∗ ) = N(P ) .
Daher ist P die orthogonale Projektion auf F .
3
5.16 Satz. Für T ∈ L(H, G) gelte die Abschätzung
∃ γ > 0 ∀ x ∈ N(T )⊥ : k T x k ≥ γ k x k .
(16)
Dann ist R(T ) abgeschlossen.
Beweis. Es sei P die orthogonale Projektion auf N(T )⊥ ; dann gilt T P = T . Für
y ∈ R(T ) existiert eine Folge (xn ) in H mit T xn → y . Dann folgt auch T P xn → y ,
und wegen (16) ist (P xn ) eine Cauchy-Folge in N(T )⊥ . Aus P xn → x ∈ N(T )⊥
folgt dann y = n→∞
lim T P xn = T x und somit y ∈ R(T ) .
3
Es gilt auch die Umkehrung dieser Aussage (vgl. 6.9). Weiter hat man:
5 Beschränkte lineare Operatoren auf Hilberträumen
35
5.17 Satz. Für einen Operator T ∈ L(H) gelte die Abschätzung
∃ γ > 0 ∀ x ∈ H : | h T x|x i | ≥ γ k x k2 .
(17)
Dann ist T ∈ GL(H) invertierbar mit k T −1 k ≤ γ −1 .
Beweis. Aus (17) folgt k T x k ≥ γ k x k für x ∈ H mittels Schwarzscher Ungleichung. Somit ist T injektiv, und nach Satz 5.16 ist R(T ) abgeschlossen. Nun gilt
Bedingung (17) auch für T ∗ , und nach Satz 5.14 folgt R(T ) = N(T ∗ )⊥ = H . 3
Die Sätze 5.16 und 5.17 liefern Informationen über beschränkte selbstadjungierte Operatoren A = A∗ ∈ L(H) . Wegen h Ax|x i = h x|Ax i = h Ax|x i gilt stets
h Ax|x i ∈ R .
5.18 Satz. Es seien H ein Hilbertraum über C und A = A∗ ∈ L(H) selbstadjungiert. Für λ ∈ C\R existiert dann (λI − A)−1 , und man hat
k (λI − A)−1 k ≤ | Im λ |−1
für λ ∈ C\R .
(18)
Beweis. Für λ = α + iβ ∈ C und x ∈ H gilt
| h (λI − A)x|x i | = | h (αI − A)x|x i + h iβx|x i | ≥ | β | k x k2
wegen h Ax|x i ∈ R . Für β 6= 0 gilt also (17), und man verwendet Satz 5.17.
(19)
3
5.19 Polarformeln. a) Wir betrachten wieder Hilberträume H über K = R oder
K = C . Die in (17) auftretende Abbildung
QT : H 7→ K ,
QT (x) := h T x|x i ,
(20)
heißt die quadratische Form des linearen Operators T ∈ L(H) . Eine quadratische
Form mit Eigenschaft (17) heißt koerziv.
b) Für A = A∗ gelten analog zu (4.7) und (4.8) die Polarformeln
4 hAx|yi = QA (x + y) − QA (x − y) bzw.
(21)
4 hAx|yi = QA (x + y) − QA (x − y) + i (QA (x + iy) − QA (x − iy))
(22)
im reellen Fall bzw. im komplexen Fall.
5.20 Satz. Es sei H ein Hilbertraum über K = R oder K = C .
a) Für einen selbstadjungierten Operator A ∈ L(H) gilt
k A k = sup {| h Ax, x i | | k x k ≤ 1} .
(23)
b) Für T ∈ L(H) ist T ∗ T selbstadjungiert, und man hat
k T ∗ T k = k T k2 .
(24)
36
I. Hilberträume und beschränkte lineare Operatoren
Beweis. a) Offenbar gilt k A k ≥ q(A) := sup {| h Ax, x i | | k x k ≤ 1} . Wegen
QA (z) ∈ R für alle z ∈ H liefert die Polarformel für K = R und K = C
4 Re hAx|yi = QA (x + y) − QA (x − y) .
(25)
Für x, y ∈ H mit k x k, k y k ≤ 1 gibt es α ∈ K mit | α | = 1 und
| h Ax|y i | = h αAx|y i = 41 (QA (αx + y) − QA (αx − y))
≤ 14 q(A) (k αx + y k2 + k αx − y k2 )
≤ 21 q(A) (k x k2 + k y k2 ) ≤ q(A)
aufgrund von (25) und der Parallelogrammgleichung (2).
b) Man hat
k T k2 =
sup k T x k2 = sup | h T x|T x i | = sup | h T ∗T x|x i |
k x k≤1
∗
k x k≤1
∗
k x k≤1
2
≤ kT T k ≤ kT kkT k = kT k . 3
5.21 Bemerkungen. a) Für einen selbstadjungierten Operator A ∈ L(H) folgt
aus QA = 0 also bereits A = 0 .
b) Im Fall K = C ist T ∈ L(H) genau dann selbstadjungiert, wenn h T x|x i ∈ R für
alle x ∈ H gilt. Aus QT = 0 folgt dann also immer T = 0 .
Zum Beweis seien x, y ∈ H und a := h T x|y i , b := h T y|x i ∈ C . Das Ausmultiplizieren von QT (x + y) liefert a + b ∈ R , und durch das von QT (x + iy) erhält
man i(b − a) ∈ R . Dies erzwingt b = ā .
c) Im Fall K = R sind die Aussagen von b) nicht richtig, wie etwa das Beispiel einer
Drehung D : (x1 , x2 ) 7→ (−x2 , x1 ) des R2 um den Winkel π2 zeigt.
5.22 Satz. Ein Operator T ∈ L(H) ist genau dann normal, wenn k T x k = k T ∗x k
für alle x ∈ H gilt.
Beweis. Für alle x ∈ H gilt
k T x k2 = hT x|T xi = hT ∗ T x|xi und
k T ∗x k2 = hT ∗ x|T ∗ xi = hT T ∗ x|xi .
Da T ∗ T und T T ∗ selbstadjungiert sind, folgt die Behauptung aus der Polarformel.
3
5.23 Satz. Ein Operator U ∈ L(H) ist genau dann unitär, wenn U eine Isometrie
von H auf H ist.
Beweis. Ist U unitär, so gilt wegen U ∗ = U −1 für alle x ∈ H
k Ux k2 = hUx|Uxi = hU ∗ Ux|xi = k x k2 .
(26)
Umgekehrt impliziert (26) aufgrund der Polarformel wieder U ∗ U = I . Nach Voraussetzung ist U ∈ GL(H) , und es folgt U ∗ = U −1 .
3
5 Beschränkte lineare Operatoren auf Hilberträumen
37
5.24 Evolution von Systemen. Die Evolution eines quantenmechanischen Systems ist gegeben durch
t ∈ R;
x(t) = U(t) x0 ,
t
hierbei sind die U(t) = e−i h̄ H unitäre Operatoren auf einem Hilbertraum H und
x0 ∈ H mit k x0 k = 1 ein Anfangszustand des Systems (vgl. Formel (5) in der
Einleitung). Es ist U(s)x0 der Zustand zur Zeit s und dann U(t)U(s)x0 der Zustand
zur Zeit t + s ; daher gilt
U(0) = I ,
U(t + s) = U(t) U(s) ,
t, s ∈ R .
(27)
b) Wir betrachten hier diskrete Zeitschritte t = n ∈ Z , wegen (27) also die Potenzen
(U n )n∈Z eines unitären Operators U ∈ L(H) . Diese besitzen für n → ∞ einen
Grenzwert in einem geeigneten Sinn:
c) Im Fall dim H = 1 ist U einfach eine komplexe Zahl mit | U | = 1 , und für U 6= 1
existiert n→∞
lim U n nicht. Für die arithmetischen Mittel der U n gilt jedoch
1
n
Vn :=
n−1
P
j=0
Uj =
U n −1
1
n U −1
→
(
0 , U=
6 1
.
1 , U =1
Diese einfache Beobachtung lässt sich auf den allgemeinen Fall übertragen:
5.25 Satz (Ergodensatz). Es seien U ∈ GL(H) ein unitärer Operator und P die
orthogonale Projektion auf den Eigenraum E(U; 1) = {y ∈ H | Uy = y} . Für alle
x ∈ H gilt dann
n−1
1 P
Ujx
n
n→∞
j=0
lim
= Px.
(28)
Beweis. a) Für x ∈ E(U; 1) gilt natürlich U j x = x für alle j ∈ N0 und somit auch
Vn x :=
1
n
n−1
P
j=0
Ujx = x = P x .
b) Nach Satz 5.14 gilt E(U; 1)⊥ = N(I − U)⊥ = R(I − U ∗ ) = R(I − U −1 ) . Für
einen Vektor x = y − U −1 y ∈ R(I − U −1 ) hat man für n → ∞ :
Vn x =
1
n
n−1
P
j=0
Ujx =
1
n
n−1
P
j=0
Ujy −
1
n
n−1
P
j=0
U j−1 y =
1
n
(U n−1 y − U −1 y) → 0 .
c) Wegen k Vn k ≤ 1 gilt nach dem folgenden Satz 5.26 dann auch Vn x → 0 = P x
für alle x ∈ R(I − U ∗ ) = E(U; 1)⊥ .
3
5.26 Satz. Es seien X, Y Banachräume und (Tn ) eine Folge in L(X, Y ) mit
C := sup k Tn k < ∞ , die auf einer dichten Menge A ⊆ X punktweise konvern∈N
giert. Dann existiert
T x := lim Tn x
n→∞
für alle x ∈ X ; man hat T ∈ L(X, Y ) mit k T k ≤ C , und die Konvergenz ist
gleichmäßig auf kompakten Teilmengen von X .
38
I. Hilberträume und beschränkte lineare Operatoren
Beweis. a) Für eine kompakte Menge K ⊆ X und ε > 0 gibt es nach Satz 1.26
b1 , . . . , br ∈ K mit K ⊆
r
S
j=1
Uε (bj ) . Für j = 1, . . . , r wählt man aj ∈ A mit
k aj − bj k < ε . Da (Tn (aj )) konvergiert, gibt es n0 ∈ N mit k Tn (aj ) − Tm (aj ) k < ε
für n, m ≥ n0 und j = 1, . . . , r .
b) Es seien nun n, m ≥ n0 und x ∈ K . Man wählt j ∈ {1, . . . , r} mit k x−aj k < 2ε
und erhält
k Tn x − Tm x k ≤ k Tn x − Tn aj k + k Tn aj − Tm aj k + k Tm aj − Tm x k < (4C + 1) ε .
Somit gilt sup k Tn x−Tm x k ≤ (4C +1) ε für n, m ≥ n0 , und wegen der Vollständigx∈K
keit von Y ist die Folge (Tn ) auf K gleichmäßig konvergent, insbesondere also auf
X punktweise konvergent.
c) Zu zeigen bleiben die Aussagen T ∈ L(X, Y ) und k T k ≤ C . Diese ergeben sich
mit n → ∞ sofort aus
k Tn x k ≤ k Tn k k x k ≤ C k x k für x ∈ X und n ∈ N . 3
6 Konsequenzen aus dem Satz von Baire
6
39
Konsequenzen aus dem Satz von Baire
Im Jahre 1897 zeigte W.F. Osgood den folgenden
6.1 Satz. Es sei M eine punktweise beschränkte Menge stetiger Funktionen auf
R . Es gibt ein offenes Intervall I 6= ∅ , sodass M auf I gleichmäßig beschränkt ist.
Dazu betrachtet man für n ∈ N die Mengen An := {t ∈ R | ∀ f ∈ M : | f (t) | ≤ n} .
S
Diese sind in R abgeschlossen, und es ist ∞
n=1 An = R . Nach dem von R. Baire
1899 isolierten Kern des Beweises folgt daraus, dass ein An ein nichtleeres Inneres
haben muss. Allgemeiner gilt:
6.2 Theorem (Baire). Es seien X ein Banachraum und D ⊆ X offen. Gilt
D=
∞
S
n=1
An mit in D abgeschlossenen Mengen An , so gibt es r ∈ N mit A◦r 6= ∅ .
Beweis. Andernfalls wählt man a ∈ D und r > 0 mit Br (a) ⊆ D . Wegen A◦1 = ∅
gibt es einen Punkt a1 ∈ Ur (a)\A1 , also 0 < r1 ≤ 2r mit Br1 (a1 ) ⊆ Br (a) und
Br1 (a1 ) ∩ A1 = ∅ . Wegen A◦2 = ∅ gibt es 0 < r2 ≤ r21 und eine Kugel Br2 (a2 ) ⊆
Br1 (a1 ) mit Br2 (a2 ) ∩A2 = ∅ . Induktiv findet man Radien 0 < rn ≤ 2rn und Kugeln
Brn (an ) ⊆ Brn−1 (an−1 ) mit Brn (an ) ∩ An = ∅ . Wegen
k an − an−1 k ≤ rn−1 ≤ r 2−n+1
für n ≥ 2
ist (an ) eine Cauchy-Folge, und aufgrund der Vollständigkeit von X existiert der
Limes x := lim an ∈ X (vgl. Satz 1.20). Offenbar gilt dann x ∈ Brn (an ) für alle
n→∞
n ∈ N , und man erhält den Widerspruch x ∈ D\
∞
S
n=1
An .
3
Im Satz von Baire kann man an Stelle eines Banachraumes auch eine abgeschlossene
Teilmenge eines Banachraumes nehmen.
6.3 Theorem (Prinzip der gleichmäßigen Beschränktheit). Es seien X ein
Banachraum, Y ein normierter Raum und H ⊆ L(X, Y ) eine punktweise beschränkte Menge stetiger linearer Operatoren von X nach Y . Dann gilt
sup {k T k | T ∈ H} < ∞ .
(1)
Beweis. Für n ∈ N betrachten wir die abgeschlossenen Mengen
Xn := {x ∈ X | ∀ T ∈ H : k T x k ≤ n} .
Nach Voraussetzung ist X =
∞
S
n=1
Xn ; nach dem Satz von Baire gibt es ein n ∈ N
mit Xn◦ 6= ∅ . Es gibt also a ∈ X und r > 0 mit Br (a) ⊆ Xn ; für k x k ≤ r und alle
T ∈ H gilt dann k T (a + x) k ≤ n , also
k T x k ≤ n + k T a k ≤ 2n ;
dies bedeutet aber k T x k ≤
2n
r
k x k für alle x ∈ X und T ∈ H , also (1).
3
40
I. Hilberträume und beschränkte lineare Operatoren
Schwach beschränkte Mengen. Eine Menge M ⊆ H in einem Hilbertraum H
heißt schwach beschränkt, wenn
∀ y ∈ H : sup {| hy|xi | | x ∈ M} < ∞
(2)
gilt. Mit der Isometrie j = jH : H → H ′ eines Hilbertraums in seinen Dualraum
aus (3.6) ist dies genau dann der Fall, wenn die Menge j(M) in L(H, K) punktweise
beschränkt ist. Nach dem Prinzip der gleichmäßigen Beschränktheit 6.3 gilt daher:
6.4 Satz. Eine schwach beschränkte Menge in einem Hilbertraum ist auch in der
Norm des Hilbertraumes beschränkt.
6.5 Satz (Banach-Steinhaus). Es seien X ein Banachraum, Y ein normierter
Raum und (Tn ) eine Folge in L(X, Y ) , so dass der Limes
T x := lim Tn x
(3)
n→∞
für alle x ∈ X existiert. Dann gilt T ∈ L(X, Y ) , k T k ≤ supn k Tn k < ∞ , und
man hat Tn → T gleichmäßig auf allen kompakten Teilmengen von X .
Beweis. Nach Voraussetzung sind die Mengen {Tn x | n ∈ N} für alle x ∈ X
beschränkt, und nach Theorem 6.3 gibt es C > 0 mit k Tn k ≤ C für alle n ∈ N .
Die weiteren Aussagen ergeben sich dann aus Satz 5.26.
3
6.6 Satz. Es seien X, Y Banachräume und (Tn ) eine Folge in L(X, Y ) . Dann sind
die folgenden Aussagen äquivalent :
(a) (Tn ) konvergiert gleichmäßig auf kompakten Mengen in X .
(b) (Tn ) konvergiert punktweise auf X .
(c) (Tn ) konvergiert punktweise auf einer dichten Teilmenge von X ,
und es gilt sup {k Tn k | n ∈ N} < ∞ .
Beweis. (a) ⇒ (b)“ ist klar. Für (b) ⇒ (c)“ benutzt man Theorem 6.3, und die
”
”
Implikation (c) ⇒ (a)“ folgt wieder aus Satz 5.26.
3
”
Es folgt eine Anwendung auf Fourier-Reihen stetiger periodischer Funktionen:
6.7 Satz. Für t ∈ [−π, π] gibt es eine Funktion f ∈ C2π , so dass die Partialsummen
(sn (f ; t) =
n
P
k=−n
fb(k)eikt ) der Fourier-Reihe unbeschränkt sind.
Beweis. Nach Satz 2.5 ist stn : f 7→ sn (f ; t) eine stetige Linearform auf C2π mit
k stn k =
Rπ
−π
| Dn (t − s) |ds
¯ = k Dn k L 1 .
Ist die Behauptung falsch, so folgt sup k stn k < ∞ aus dem Prinzip der gleichmäßigen
n∈N
Beschränktheit. Man berechnet aber leicht
Widerspruch.
Rπ
−π
| Dn (t) |dt
¯ ≥ c log n und erhält einen
3
Mit geeigneten topologischen Begriffen lässt sich zeigen, dass sogar für viele“ Funk”
tionen in C2π die Folge (sn (f ; t)) in vielen“ Punkten t unbeschränkt ist, vgl. [KFA],
”
Abschnitt 8.4. Nach einem tiefliegenden Satz von L. Carleson (1966) ist jedoch die
6 Konsequenzen aus dem Satz von Baire
41
Fourier-Reihe einer L2 -Funktion fast überall konvergent. R.A. Hunt zeigte 1968, dass
dies für p > 1 auch für die Fourier-Reihe einer Lp -Funktion gilt. Bereits 1926 hatte aber A. Kolmogorov eine L1 -Funktion konstruiert, deren Fourier-Reihe überall
divergent ist.
6.8 Theorem (vom inversen Operator). Es seien X, Y Banachräume und
T ∈ L(X, Y ) bijektiv. Dann ist auch der inverse Operator T −1 : Y → X stetig
(und linear).
Beweis. a) Für die offenen Einheitskugeln U und V von X und Y gilt
∃ δ > 0 : T (U) ⊇ δ V .
Denn: Wegen X =
∞
S
(4)
k U gilt Y = R(T ) =
k=1
∞
S
T (kU) . Nach dem Satz von Baire
k=1
◦
gibt es n ∈ N mit T (nU) 6= ∅ . Somit existieren y0 ∈ Y und α > 0 mit Vα (y0 ) ⊆
T (nU) . Für y ∈ α V gilt dann y0 ∈ T (nU) und y +y0 ∈ T (nU) ; es gibt also Folgen
(aj ) und (bj ) in U mit nT (aj ) → y0 und nT (bj ) → y + y0 für j → ∞ . Folglich
gilt nT (bj − aj ) → y , und wegen k bj − aj k < 2 erhält man y ∈ T (2nU) und damit
α
α V ⊆ T (2nU) = 2n T (U) . Daraus folgt (4) mit δ = 2n
.
b) Die Behauptung folgt nun aus a) und
(1 + ε) T (U) ⊇ T (U) für alle ε > 0 .
(5)
Dazu sei ε1 := 1 , und δ > 0 erfülle Bedingung (4). Wir wählen eine Nullfolge
(εn )n≥2 in (0, ∞) mit εn−1 > εn und
∞
P
n=2
εn < ε und setzen δn = δ εn . Zu y ∈ T (U)
gibt es z1 ∈ T (U) mit y − z1 =: y2 ∈ δ2 V . Wegen (4) gilt δ2 V ⊆ T (ε2 U) ; zu y2
gibt es also z2 ∈ T (ε2 U) mit y − z1 − z2 = y2 − z2 =: y3 ∈ δ3 V ⊆ T (ε3 U) . So
fortfahrend konstruieren wir für n ∈ N Elemente zn ∈ T (εn U) und yn ∈ δn V mit
y−
n
P
j=1
zj = yn+1 , n ∈ N .
(6)
Nun wählen wir xj ∈ εj U mit T xj = zj . Wegen
der Vollständigkeit von X existiert x :=
sich schließlich T x =
∞
P
j=1
T xj =
∞
P
j=1
∞
P
j=1
∞
P
j=1
k xj k ≤ 1 +
∞
P
j=2
εj < 1 + ε und
xj ∈ (1 + ε) U . Wegen yn → 0 ergibt
zj = y .
3
Im Beweis von Theorem 6.8 wurde die Injektivität von T nicht benutzt. Die Aussagen (4) und (5) gelten daher für alle surjektiven Abbildungen zwischen Banachräumen; diese sind dann offene Abbildungen. Dieses von S. Banach und J. Schauder stammende Resultat heißt Satz von der offenen Abbildung, vgl. [KFA], 8.3 für eine noch
etwas allgemeinere Aussage.
6.9 Normal auflösbare Gleichungen. Aus Theorem 6.8 ergibt sich auch die
Umkehrung von Satz 5.16: Es seien H, G Hilberträume, und T ∈ L(H, G) habe
abgeschlossenes Bild. Dann ist T1 := T |N (T )⊥ : N(T )⊥ → R(T ) eine stetige lineare
Bijektion zwischen Banachräumen, und nach Theorem 6.8 ist die Umkehrabbildung
T1−1 stetig. Daher gilt (5.16):
∃ γ > 0 ∀ x ∈ N(T )⊥ : k T x k ≥ γ k x k .
42
I. Hilberträume und beschränkte lineare Operatoren
6.10 Operatoren mit abgeschlossenen Graphen. a) Es seien X, Y normierte
Räume. Für eine lineare Abbildung T : X → Y ist der Graph
Γ(T ) = {(x, T x) | x ∈ X}
ein Unterraum von X × Y ; dieser ist genau dann abgeschlossen in X × Y , wenn
für jede Folge (xn ) in X gilt:
xn → x in X und T xn → y in Y ⇒ y = T x .
(7)
b) Stetige lineare Operatoren T ∈ L(X, Y ) besitzen also abgeschlossene Graphen.
Die Umkehrung dieser Aussage ist i. a. nicht richtig: Der Differentialoperator
d
dt
: (C 1 [a, b], k ksup ) → (C[a, b], k ksup ) ,
d
f
dt
:= f ′ ,
ist unstetig. Gilt aber k fn − f ksup → 0 und k dtd fn − g ksup → 0 , so folgt
(vgl. [KA1], 22.14), und somit ist Γ( dtd ) abgeschlossen. Es gilt jedoch:
(8)
d
f
dt
=g
6.11 Satz (vom abgeschlossenen Graphen). Es seien X, Y Banachräume und
T : X → Y eine lineare Abbildung mit abgeschlossenem Graphen. Dann ist T stetig.
Beweis. Durch j : x 7→ (x, T x) wird eine lineare Bijektion von X auf Γ(T )
definiert. Offenbar ist j −1 stetig. Da X und Γ(T ) Banachräume sind, ist nach Satz
6.8 auch j stetig, und dies gilt dann auch für T .
3
Eine typische Anwendung des Graphensatzes ist der folgende Beweis:
6.12 Satz (Hellinger-Toeplitz). Es seien H ein Hilbertraum und T : H → H ein
symmetrischer linearer Operator, d. h. es gelte hT x|yi = hx|T yi für alle x, y ∈ H .
Dann ist T stetig.
Beweis. Es gelte xn → x und T xn → y in H . Für z ∈ H ist dann
hT x|zi = hx|T zi = lim hxn |T zi = lim hT xn |zi = hy|zi ,
n→∞
n→∞
und es folgt y = T x . Nach (7) hat also T einen abgeschlossenen Graphen und ist
somit stetig aufgrund von Satz 6.11.
3
7 Schwache Konvergenz
7
43
Schwache Konvergenz
Der Nachweis der Existenz eines Maximums oder Minimums einer beschränkten
reellwertigen Funktion beruht oft auf Kompaktheitsargumenten. Die Einheitskugel
unendlichdimensionaler Hilberträume ist nicht kompakt; wir zeigen in den Sätzen
7.5 und 7.8 aber doch schwache Versionen“ des Satzes von Bolzano-Weierstraß, mit
”
deren Hilfe Kompaktheitsargumente zur Lösung von Variationsproblemen verwendet
werden können.
7.1 Definition. Es sei H ein Hilbertraum. Eine Folge (xn ) in H konvergiert
w
schwach gegen x ∈ H , Notation: xn → x , falls gilt
hy|xn i → hy|xi
für alle y ∈ H .
(1)
7.2 Beispiele und Bemerkungen. a) Mittels der Isometrie
j : H → H′ ,
jx(y) = hy|xi für y ∈ H ,
aus 2.9 kann man Vektoren aus H als stetige Linearformen auf H auffassen; schwache Konvergenz einer Folge (xn ) in H bedeutet dann punktweise Konvergenz der
Folge (jxn ) in H ′ . Insbesondere sind schwache Grenzwerte eindeutig bestimmt.
w
b) Für eine orthonormale Folge (en ) gilt k en k = 1 , aber en → 0 aufgrund der
w
w
Besselschen Ungleichung (4.3). Aus xn → x und zn → z folgt also i. a. nicht
hxn |zn i → hx|zi .
c) Für eine beliebige Folge in H gilt
w
k x − xn k → 0 ⇔ xn → x und k xn k → k x k .
Aussage ⇒ “ ist klar, und ⇐ “ folgt aus
”
”
2
k x − xn k = k x k2 − 2 Re hxn |xi + k xn k2 .
(2)
w
d) Es seien H und G Hilberträume und T ∈ L(H, G) . Aus xn → x in H folgt
w
dann T xn → T x in G wegen hy|T xn i = hT ∗ y|xn i → hT ∗ y|xi = hy|T xi für y ∈ G .
e) Es sei V ein Unterraum von H . Für eine Folge (vn ) in V gilt dann
w
vn → v in V
⇔
w
vn → v in H ,
(3)
da ja hy|vn i = 0 für y ∈ V ⊥ ist.
f) Aufgrund von Satz 6.4 sind schwach konvergente Folgen in H Norm-beschränkt.
7.3 Satz. Eine Folge (x(n) ) konvergiert genau dann schwach gegen x in ℓ2 , wenn
die folgende Aussage gilt:
sup k x(n) k < ∞
n∈N
und
(n)
xk → xk für alle k ∈ N0 .
(4)
Beweis. ⇒ “ folgt aus 7.2 f) und xk = hx|ek i .
”
⇐ “: Nach Voraussetzung gilt jxn (ek ) → jx(ek ) für alle k ∈ N0 , also jxn → jx
”
punktweise auf [ek ]∞
k=1 . Wegen der Dichtheit dieses Raumes in ℓ2 impliziert Satz
5.26 dann jxn → jx punktweise auf ℓ2 .
3
Das folgende Lemma spielt eine wichtige Rolle bei Kompaktheitsbeweisen:
44
I. Hilberträume und beschränkte lineare Operatoren
7.4 Lemma. Es seien A eine abzählbare Menge und (fn ) eine punktweise beschränkte Folge von Funktionen auf A , d. h. für alle a ∈ A seien die Folgen (fn (a))
in K beschränkt. Dann hat (fn ) eine punktweise konvergente Teilfolge.
Beweis. Es sei A = {aj | j ∈ N .} Da (fn (a1 )) in K beschränkt ist, hat (fn )
eine Teilfolge (fn(1) ) , für die (fn(1) (a1 )) konvergiert. Dann hat (fn(1) ) eine Teilfolge
(fn(2) ) , für die (fn(2) (a2 )) konvergiert. So fortfahrend wählt man für j ∈ N rekursiv Teilfolgen (fn(j) ) von (fn(j−1) ) , für die (fn(j) (aj )) konvergiert. Nach Konstruktion
konvergiert dann (fn(j) (ak )) für k ≤ j . Aus diesen sukzessive ausgewählten Teilfolgen
f1
(1)
f1
(2)
f1
(3)
f1
(4)
f1
(5)
f1
..
.
f2
(1)
f2
(2)
f2
(3)
f2
(4)
f2
(5)
f2
..
.
f3
(1)
f3
(2)
f3
(3)
f3
(4)
f3
(5)
f3
..
.
f4
(1)
f4
(2)
f4
(3)
f4
(4)
f4
(5)
f4
..
.
f5
(1)
f5
(2)
f5
(3)
f5
(4)
f5
(5)
f5
..
.
f6
(1)
f6
(2)
f6
(3)
f6
(4)
f6
(5)
f6
..
.
···
···
···
···
···
···
..
.
bildet man nun die Diagonalfolge (fn∗ ) := (fn(n) ) . Diese ist Teilfolge von (fn ) und,
für n ≥ j , auch von (fn(j) ) ; daher konvergiert (fn∗ (aj )) für alle j ∈ N .
3
Es gilt die folgende schwache Version“ des Satzes von Bolzano-Weierstraß:
”
7.5 Theorem. Eine beschränkte Folge (xn ) in einem Hilbertraum H besitzt eine
schwach konvergente Teilfolge.
Beweis. Die Folge (xn ) liegt in einem separablen Unterraum V von H . Wegen
7.2 e) kann man daher annehmen, dass H separabel ist; es gibt also eine in H
dichte abzählbare Menge A . Nach Lemma 7.4 besitzt die Folge (jxn ) eine auf A
punktweise konvergente Teilfolge, und nach Satz 5.26 ist diese Teilfolge dann wegen
ihrer Beschränktheit auf ganz H punktweise konvergent.
3
7.6 Beispiel. Zur Vorbereitung des nächsten Satzes betrachten wir eine orthonorw
male Folge (en ) in einem Hilbertraum H . Es gilt en → 0 , und man hat
k n1
n
P
k=1
ek k2 =
n
P
k=1
1
n2
=
1
n
→ 0.
7.7 Satz (Banach-Saks). In einem Hilbertraum gelte die schwache Konvergenz
w
xn → x . Dann gibt es eine Teilfolge (xnj ) von (xn ) mit k k1
Beweis. a) Wegen
1
k
k
P
j=1
xnj − x =
1
k
k
P
k
P
j=1
xnj − x k → 0 .
(xnj − x) kann man x = 0 annehmen.
j=1
b) Nach 7.2 f) gibt es C ≥ 0 mit k xn k ≤ C für alle n . Es sei n1 = 1 . Wegen
w
xn → 0 gibt es n2 > 1 mit | hxn1 |xn i | ≤ 21 für n ≥ n2 . Weiter gibt es n3 > n2
7 Schwache Konvergenz
45
mit | hxn2 |xn i | ≤ 14 und | hxn1 |xn i | ≤ 14 für n ≥ n3 . So fortfahrend erhält man eine
Teilfolge mit | hxnj |xnk+1 i | ≤ 2−j für 1 ≤ j ≤ k . Daraus folgt
k n1
n
P
j=1
n
P
xnj k2 =
1
n2
=
1
n2
(
1
n2
(n + C n + n) ≤ (C + 2) ·
≤
hxnj |xnk i
j,k=1
n k−1
P
P
hxnj |xnk i +
k=1 j=1
2
n
P
k=1
2
k xnk k2 +
1
n
n j−1
P
P
hxnj |xnk i)
j=1 k=1
. 3
Nach Theorem 7.5 und dem Satz von Banach-Saks 7.7 besitzt also jede beschränkte
Folge (xn ) in einem Hilbertraum H eine im Mittel konvergente Teilfolge:
7.8 Satz. Es sei (xn ) eine beschränkte Folge in einem Hilbertraum H . Dann gibt
es eine Teilfolge (xnj ) von (xn ) , sodass die Folge ( k1
k
P
j=1
xnj ) konvergiert.
7.9 Folgerung. Es seien H ein Hilbertraum, C ⊆ H eine konvexe abgeschlossene
w
Menge und (xn ) eine Folge in C mit xn → x ∈ H . Dann folgt auch x ∈ C .
Folgerung 7.9 ist ohne die Konvexitätsbedingung nicht richtig. So ist z. B. die Einheitssphäre S = {x ∈ ℓ2 | k x k = 1} in ℓ2 abgeschlossen, aber für die Einheitsvekw
toren S ∋ en gilt en → 0 nach Beispiel 7.2 b).
Wir wollen nun einen Existenzsatz für Minima reeller Funktionale beweisen. Dazu
benötigen wir die folgenden Begriffe:
7.10 Konvexe Funktionen und halbstetige Funktionen. a) Es seien E ein
Vektorraum und C ⊆ E eine konvexe Menge. Eine Funktion F : C → R heißt
konvex, falls gilt
F(
n
P
k=1
sk xk ) ≤
n
P
k=1
sk F (xk ) für xk ∈ C , 0 ≤ sk ≤ 1 und
n
P
k=1
sk = 1 . (5)
b) Es seien X ein normierter Raum und Ω ⊆ X . Eine Funktion F : Ω → R heißt
unterhalbstetig in x0 ∈ Ω , wenn diese Hälfte“ der Stetigkeitsbedingung erfüllt ist:
”
∀ ε > 0 ∃ δ > 0 ∀ x ∈ Ω : k x − x0 k < δ ⇒ F (x) > F (x0 ) − ε .
(6)
7.11 Satz. Es seien H ein Hilbertraum und ∅ =
6 C ⊆ H eine abgeschlossene
konvexe Menge. Eine nach unten beschränkte unterhalbstetige konvexe Funktion
F : C → R mit
F (x) → ∞
für x ∈ C und k x k → ∞
(7)
besitzt ein Minimum auf C .
Beweis. a) Es sei d = inf F (x) ∈ R und (xn ) eine Minimalfolge in C , d. h. es gelte
x∈C
F (xn ) → d . Wegen (7) ist dann (xn ) beschränkt, und nach Theorem 7.5 gibt es eine
gegen x0 ∈ H schwach konvergente Teilfolge, die wir wieder mit (xn ) bezeichnen.
Nach Satz 7.9 gilt x0 ∈ C .
46
I. Hilberträume und beschränkte lineare Operatoren
b) Zu ε > 0 wählen wir k ∈ N mit F (xn ) < d + ε für n ≥ k sowie δ > 0 gemäß (6).
Nun wenden wir den Satz von Banach-Saks auf die Folge (xn )n≥k an und finden eine
konvexe Kombinationen x =
r
P
j=k
von F folgt
F (x0 ) ≤ F (x) + ε ≤
sj xj ∈ C mit k x−x0 k < δ . Wegen der Konvexität
r
P
j=k
sj F (xj ) + ε ≤ d + 2ε ,
und mit ε → 0 ergibt sich F (x0 ) ≤ d .
3
Der Projektionssatz 5.1 ist ein Spezialfall von Satz 7.11; in der Tat erfüllt für x1 ∈ H
die Funktion F : x 7→ k x1 − x k dessen Voraussetzungen. Auf Anwendungen in der
Variationsrechnung können wir hier nicht eingehen.
Wir zeigen noch die folgende Version des Ergodensatzes 5.25:
7.12 Satz. Es seien H ein Hilbertraum und T ∈ L(H) mit k T n k ≤ C für alle
n−1
1 P
T jx
n→∞ n j=0
n ∈ N . Dann existiert der Limes P x := lim
für alle x ∈ H , und P
ist eine stetige (nicht notwendig orthogonale) Projektion von H auf N(I − T ) mit
N(P ) = R(I − T ) .
Beweis. a) Für die Operatoren Pn : x 7→
1
n
n−1
P
j=0
T j x gilt k Pn k ≤ C . Für Vektoren
x ∈ N(I − T ) gilt offenbar Pn x = x für alle n ∈ N . Wie im Beweis von Satz 5.25
hat man n→∞
lim Pn x = 0 für x = y − T y ∈ R(I − T ) , also auch für x ∈ R(I − T )
aufgrund von Satz 5.26.
b) Für x ∈ N(I − T ) ∩ R(I − T ) gilt x = lim Pn x und lim Pn x = 0 , also x = 0 .
n→∞
Wir zeigen nun H = N(I − T ) ⊕ R(I − T ) :
n→∞
w
c) Es sei x ∈ H gegeben. Nach Theorem 7.5 gilt Pnj x → x∗ ∈ H für eine geeignete Teilfolge von (Pn x) . Wegen k T Pn x − Pn x k → 0 ist T x∗ = x∗ , also
⊥
x∗ ∈ N(I−T ) . Weiter ist x−x∗ ∈ R(I − T ) . Andernfalls gibt es y ∈ R(I − T ) mit
hx − x∗ |yi =
6 0 . Wegen T n x−T n−1 x ∈ R(I −T ) für n ∈ N ist aber hT n x|yi = hx|yi
für alle n ∈ N , also auch hx − Pn x|yi = 0 und schließlich hx − x∗ |yi = 0 wegen
w
Pnj x → x∗ .
d) Nach a)–c) existiert P x := lim Pn x für alle x ∈ H , und der Satz von Banachn→∞
Steinhaus liefert P ∈ L(H) . Wegen P = I auf N(I − T ) und P = 0 auf R(I − T )
ist P eine stetige Projektion von H auf N(I − T ) mit N(P ) = R(I − T ) .
3
8 Grundlagen der Spektraltheorie
8
47
Grundlagen der Spektraltheorie
Die geometrische Reihe liefert das folgende einfache, aber fundamentale Resultat der
Störungstheorie:
8.1 Satz (Neumannsche Reihe). Es seien X ein Banachraum und T ∈ L(X)
P
mit k T k < 1 . Dann ist die Reihe k T k in L(X) absolut konvergent, und es gilt
∞
P
k=0
T k = (I − T )−1 .
(1)
Insbesondere ist also I − T invertierbar.
Beweis. Die absolute Konvergenz der Reihe folgt sofort aus k T k k ≤ k T kk und
k T k < 1 . Nach Satz 1.20 existiert also S :=
∞
P
(I − T ) S = S(I − T ) =
k=0
Tk −
8.2 Bemerkungen. a) Die Summe S :=
Sn :=
n
P
∞
P
∞
P
k=0
∞
P
T k ∈ L(X) , und man hat
Tk = I .
k=1
3
T k lässt sich iterativ berechnen: Mit
k=0
T
k
k=0
gilt offenbar S0 = I , Sn+1 = I + T Sn und Sn → S .
b) Für n ∈ N hat man die Fehlerabschätzung
∞
P
k S − Sn k = k
k=n+1
Tk k ≤
∞
P
k=n+1
kTk k ≤
es liegt also mindestens lineare Konvergenz vor.
∞
P
k=n+1
k T kk =
k T kn+1
1−k T k
;
8.3 Spektralradius. a) Statt k T k < 1 “ genügt für die Konvergenz der Neu”
mannschen Reihe auch die schwächere Bedingung
∞
P
k=0
kTk k < ∞;
(2)
diese Verschärfung ist etwa für Volterrasche Integralgleichungen (vgl. Beispiel 8.6)
wesentlich. Nach dem Wurzelkriterium folgt diese bereits aus
r(T ) := lim sup
q
k
kTk k < 1.
(3)
Die Zahl r(T ) ∈ [0, k T k] heißt Spektralradius von T ; die Namensgebung erklären
wir in Satz 8.14.
b) Der Limes superior in (3) ist sogar ein echter Limes: Für αk := k T k k gilt stets
αi+j ≤ αi αj . Für feste k ∈ N schreibt man n = mk + r mit 0 ≤ r < k und erhält
m/
1
1/
1
− r/kn
αn/n ≤ αk n αr/n = αk k αk
1
αr/n ,
1/
1
1
1/
also lim sup αn/n ≤ inf k αk k und damit lim αn/n = inf k αk k .
n→∞
c) An Stelle von (2) genügt für die Invertierbarkeit von I − T auch die Bedingung
∀x∈X :
Durch Sx :=
∞
P
k=0
∞
P
k=0
k T kx k < ∞ .
(4)
T k x wird in der Tat eine linearer Operator S : X → X definiert,
der (I − T )Sx = x und S(I − T )x = x für alle x ∈ X erfüllt. Die Stetigkeit von S
folgt aus dem Satz von Banach-Steinhaus oder dem Satz vom inversen Operator.
48
I. Hilberträume und beschränkte lineare Operatoren
8.4 Fredholmsche Integralgleichungen. a) Es seien Ω ⊆ Rn messbar und
κ : Ω2 7→ K ein messbarer Kern mit
k κ k2L2 < 1 oder k κ kZI k κ kSI < 1 .
(5)
Dann hat die Integralgleichung
f (t) −
R
K
κ(t, s) f (s) ds = g(t) ,
t∈K,
(6)
nach den Sätzen 8.1 und 2.13 bzw. 2.14 für jede Funktion g ∈ L2 (Ω) genau eine
Lösung f ∈ L2 (Ω) .
b) Nun seien K ⊆ Rn kompakt und κ ∈ C(K 2 ) stetig. Gilt (5), so gibt es zu
g ∈ C(K) genau eine Lösung f ∈ L2 (K) von (I − Sκ )f = g . Nun gilt Sκ f ∈ C(K)
und somit auch f ∈ C(K) ; der Operator I − Sκ ist unter der Bedingung (5) also
auch auf dem Banachraum C(K) bijektiv.
8.5 Lineare Systeme von Differentialgleichungen. a) Es seien J ⊆ R ein
kompaktes Intervall, a ∈ J , ξ ∈ Kn , A ∈ C(J, MK (n)) und b ∈ C(J, Kn ) . Das
Anfangswertproblem
ẋ = A(t) x + b(t) ,
x(a) = ξ
(7)
ist aufgrund des Hauptsatzes der Differential- und Integralrechnung äquivalent zur
Integralgleichung
x(t) = ξ +
Rt
a (A(s) x(s)
+ b(s)) ds ,
t∈J.
b) Man führt den Integraloperator
(V x)(t) :=
Rt
a
ein. Mit B(t) := ξ +
A(s) x(s) ds ,
Rt
a
t ∈ J , x ∈ C(J, Kn ) ,
b(s) ds , t ∈ J , ist diese dann äquivalent zur Gleichung
(I − V ) x = B
im Banachraum C(J, Kn ) .
(8)
c) Es ist V ein spezieller Volterra-Operator auf C(J, Kn ) . Für diesen zeigen wir
r(V ) = 0 in (11) unten. Somit besitzt die Gleichung (8) und daher auch das Anfangswertproblem (7) genau eine Lösung in C(J, Kn ) (Satz von Picard-Lindelöf für
lineare Systeme).
8.6 Volterrasche Integralgleichungen. a) Für einen stetigen Matrix-wertigen
Kern κ ∈ C(J 2 , MK (n)) wird durch
(V f )(t) := (Vκ )f (t) :=
Rt
a
κ(t, s) f (s) ds , t ∈ J , f ∈ C(J, Kn ) ,
(9)
ein linearer Operator V : C(J, Kn ) 7→ C(J, Kn ) definiert.
b) Wegen
k V f (t) k ≤ (t − a) k κ ksup k f ksup ,
t∈J,
(10)
ist V ∈ L(C(J, Kn )) . Aus (9) und (10) folgt weiter
k V 2 f (t) k ≤ k κ k
Rt
a
k V f (s) k ds ≤ k κ k2 k f k
Rt
a (s
− a) ds =
(t−a)2
2
k κ k2 k f k .
49
8 Grundlagen der Spektraltheorie
Induktiv liefert dieses Argument k V j f (t) k ≤
kVj k ≤
(b−a)j
j!
k κ kj
(t−a)j
j!
k κ kj k f k , also
für j ∈ N .
(11)
c) Aus (11) folgt r(V ) = 0 für den Spektralradius von V , insbesondere also die
Konvergenz der Neumannschen Reihe
Integralgleichung
f (t) −
Rt
a
∞
P
j=0
V j = (I −V )−1 . Somit ist die Volterrasche
κ(t, s) f (s) ds = (I − V )f (t) = g(t)
(12)
für alle g ∈ C(J, Kn ) durch f = (I − V )−1 g in C(J, Kn ) eindeutig lösbar.
d) Es gilt auch r(V ) = 0 für den Volterra-Operator aus (9) auf dem Hilbertraum
L2 (J) . Für f ∈ L2 (J) gilt in der Tat V f ∈ C(J) und daher
√
√
j−1
b − a k V j−1 V f ksup ≤ b − a (b−a)
k V j f k L2 ≤
k κ kj−1 k V f ksup
(j−1)!
≤
(b−a)j
(j−1)!
k κ k j k f k L2 .
Die Spektraltheorie linearer Operatoren verallgemeinert das Studium von Eigenwerten und Eigenvektoren auf den unendlichdimensionalen Fall“.
”
8.7 Offene Gruppe und stetige Inversion. a) Für einen Banachraum X sei
GL(X) := {T ∈ L(X) | ∃ S ∈ L(X) : T S = ST = I}
die Gruppe der invertierbaren Operatoren in L(X) .
b) Für T ∈ GL(X) und S ∈ L(X) mit k S − T k < k T −1 k−1 gilt
S = T + (S − T ) = (I + (S − T ) T −1 ) T
und k (S − T ) T −1 k < 1 .
Aus 8.1 folgt I + (S − T ) T −1 ∈ GL(X) und daher auch S ∈ GL(X) . Weiter ist
S −1 = T −1 (I + (S − T ) T −1 )−1 = T −1
und daraus folgt
k S −1 − T −1 k ≤ k T −1 k
∞
P
k=1
∞
P
(−1)k ((S − T ) T −1)k ,
k=0
k S − T kk k T −1 kk =
k T −1 k2 k S − T k
.
1 − k T −1 k k S − T k
c) Nach b) ist also GL(X) offen in L(X) , und die Inversion T 7→ T −1 ist stetig. Da die Inversion mit ihrer Umkehrabbildung übereinstimmt, ist sie sogar eine
Homöomorphie von GL(X) auf GL(X) .
8.8 Definition. Es seien X ein Banachraum und T ∈ L(X) .
a) Die Menge σ(T ) := {λ ∈ K | λI − T 6∈ GL(X)} heißt Spektrum von T .
b) Das Komplement ρ(T ) := K\σ(T ) des Spektrums heißt Resolventenmenge von T .
c) Die durch RT : λ → (λI − T )−1 definierte Funktion RT : ρ(T ) 7→ GL(X) heißt
Resolvente von T .
50
I. Hilberträume und beschränkte lineare Operatoren
8.9 Feststellungen. a) Nach 8.7 c) ist die Resolventenmenge ρ(T ) offen in K , und
die Resolvente RT : ρ(T ) 7→ L(X) ist stetig.
b) Für λ, µ ∈ ρ(T ) gilt λI − T = (µI − T ) + (λ − µ)I ; Multiplikation von links mit
RT (λ) und von rechts mit RT (µ) liefert die Resolventengleichung
RT (λ) − RT (µ) = −(λ − µ) RT (λ) RT (µ) , λ, µ ∈ ρ(T ) .
(13)
c) Diese impliziert sofort
lim
λ→µ
RT (λ)−RT (µ)
λ−µ
= −RT (µ)2 für µ ∈ ρ(T ) ;
die Resolvente ist im Fall K = C also holomorph auf ρ(T ) . Funktionentheoretische
Methoden spielen eine große Rolle in der Spektraltheorie; Illustrationen dazu folgen
in den Sätzen 8.13 und 8.14.
d) Für | λ | > r(T ) existiert
RT (λ) = λ−1 (I − Tλ )−1 =
1
λ
∞
P
( Tλ )k ;
(14)
k=0
daher ist das Spektrum σ(T ) kompakt mit
max {| λ | | λ ∈ σ(T )} ≤ r(T ) .
(15)
Im Fall K = C gilt sogar Gleichheit in (15), was den Namen Spektralradius für r(T )
erklärt; wir beweisen diese Tatsache in Satz 8.14. Insbesondere ist der Spektralradius
von T ∈ L(Cn ) von der Wahl einer Norm auf Cn unabhängig. Weiter erhält man
aus (14) die Abschätzung
k RT (λ) k ≤
1
| λ |−k T k
für | λ | > k T k .
(16)
8.10 Eigenwerte. a) Für T ∈ L(X) heißt eine Zahl λ ∈ K Eigenwert von T , falls
es einen Vektor 0 6= x ∈ X mit T x = λx gibt; x heißt dann Eigenvektor von T
zum Eigenwert λ .
b) Für λ ∈ K gilt stets
N(λI − T ) 6= {0} ⇒ λI − T 6∈ GL(X) ⇔ λ ∈ σ(T ) ,
(17)
und im Fall dim X < ∞ gilt auch die Umkehrung dieser Aussage. Eigenwerte von
T liegen also stets in σ(T ) , und im Fall dim X < ∞ stimmt σ(T ) mit der Menge
aller Eigenwerte von T überein.
c) Im Fall dim X < ∞ hat man weiter
λ ∈ σ(T ) ⇔ χT (λ) := det (λI − T ) = 0 ;
die Eigenwerte von T sind also die Nullstellen des charakteristischen Polynoms von
T . Die Existenz von Eigenwerten im Fall K = C und dim X < ∞ beruht daher auf dem Fundamentalsatz der Algebra und ist zu diesem sogar äquivalent, da
jedes komplexe Polynom charakteristisches Polynom einer geeigneten Matrix ist.
Der Fundamentalsatz der Algebra kann mit Hilfe des funktionentheoretischen Satzes von Liouville bewiesen werden. Dieser besagt, daß jede auf ganz C holomorphe
beschränkte Funktion konstant ist (vgl. etwa [KA3], 22.18).
8 Grundlagen der Spektraltheorie
51
d) Der spezielle Volterra-Operator
(V f )(t) :=
Rt
a
f (s) ds , t ∈ [a, b] ,
(18)
auf C[a, b] ist wegen (V f )′ = f injektiv, wegen (V f )(a) = 0 oder V f ∈ C 1 [a, b]
aber nicht surjektiv; die Umkehrung von (17) ist in diesem Fall also falsch. Man hat
0 ∈ σ(V ) , aber 0 ist kein Eigenwert von V . Wegen r(V ) = 0 gilt also σ(V ) =
{0} , V hat aber keinen Eigenwert.
e) Wir zeigen jedoch in Satz 8.13, wiederum mit Hilfe des Satzes von Liouville, daß
stetige lineare Operatoren stets ein nichtleeres Spektrum haben. Diese Aussage ist
also eine Verallgemeinerung des Fundamentalsatzes der Algebra.
8.11 Beispiel. Der Links-Shift-Operator wird auf ℓ2 definert durch
S− (x0 , x1 , x2 , x3 , . . .) := (x1 , x2 , x3 , x4 , . . .) .
(19)
Wegen k S k = 1 hat man σ(S− ) ⊆ {λ ∈ C | | λ | ≤ 1} . Für | λ | < 1 gilt offenbar
S− (1, λ, λ2, λ3 , . . .) = λ (1, λ, λ2, λ3 , . . .) ,
d. h. λ ist ein Eigenwert von S− . Folglich gilt {λ ∈ C | | λ | < 1} ⊆ σ(S− ) , und
wegen der Kompaktheit des Spektrums muss σ(S− ) = {λ ∈ C | | λ | ≤ 1} sein.
Für den Beweis des folgenden Satzes 8.13 verwenden wir die folgende Konsequenz
aus dem Satz von Hahn-Banach (vgl. [KFA], 9.1), den wir in dieser Vorlesung nicht
benötigen:
8.12 Satz. Zu jedem Vektor x 6= 0 in einem Banachraum X gibt es eine stetige
Linearform f ∈ X ′ mit f (x) 6= 0 .
Für Hilberträume X ist dies klar, man setzt einfach f (y) := hy|xi . Auch für einige
konkrete Banachräume wie X = ℓp , Lp (Ω) , C(K) ist Satz 8.12 leicht zu verifizieren.
8.13 Satz. Es seien X ein Banachraum über C und T ∈ L(X) . Dann gilt σ(T ) 6= ∅ .
Beweis. Andernfalls ist nach 8.9 c) die Resolvente RT auf ganz C holomorph, und
aus (16) folgt lim k RT (λ) k = 0 . Ist nun RT nicht konstant, so gibt es x ∈ X ,
| λ |→∞
sodass die Funktion RT x nicht konstant ist. Nach Satz 8.12 gibt es eine stetige
Linearform f ∈ X ′ , für die f (RT x) nicht konstant ist. Nun ist aber f (RT x) ∈ O(C)
eine skalare beschränkte ganze Funktion, und man hat einen Widerspruch zum Satz
von Liouville. Somit ist RT konstant, und aus k RT (λ) k → 0 für | λ | → ∞ ergibt
sich schließlich der Widerspruch RT = 0 .
3
8.14 Satz. Es seien H ein komplexer Hilbertraum und T ∈ L(H) . Für den Spektralradius gilt dann
max {| λ | | λ ∈ σ(T )} = r(T ) = lim
n→∞
q
n
kTn k.
(20)
52
I. Hilberträume und beschränkte lineare Operatoren
Beweis. Abschätzung ≤“ wurde in (15) gezeigt. Im Fall r(T ) = 0 hat man Gleich”
heit, da nach Satz 8.13 stets σ(T ) 6= ∅ gilt. Nun gelte
0 ≤ R := max {| λ | | λ ∈ σ(T )} < r(T ) .
Nach (14) gilt RT (λ) =
∞
P
k=0
Tk
λk+1
für | λ | > r(T ) . Für x, y ∈ H ist dann
∞
P
k=0
hT k x|yi
λk+1
die Laurent-Entwicklung in ∞ der skalaren Funktion hRT x|yi . Da diese auf dem
Ring {λ ∈ C | | λ | > R} holomorph ist, konvergiert die Laurent-Entwicklung für
| λ | > R (vgl. etwa [KA3], 23.1). Insbesondere ist für R < | λ | < r(T ) die Menge
k
k
{h λTk+1x |yi} für alle x, y ∈ H beschränkt. Für x ∈ H ist also die Menge { λTk+1x }
in H schwach beschränkt, nach Satz 6.4 also auch in der Norm beschränkt. Nach
dem Prinzip der gleichmäßigen Beschränktheit gibt es also C = C(λ) ≥ 0 mit
k
3
k λTk+1 k ≤ C für alle k ∈ N , und es folgt der Widerspruch r(T ) ≤ | λ | .
Satz 8.14 gilt auch für Operatoren auf komplexen Banachräumen; dazu verwendet
man den Satz von Hahn-Banach.
8.15 Satz. Für einen normalen Operator T ∈ L(H) auf einem Hilbertraum stimmen Spektralradius und Norm überein; es gilt
r(T ) = max {| λ | | λ ∈ σ(T )} = n→∞
lim
Beweis. Aus Formel (5.24) ergibt sich
q
n
kTn k = kT k.
k T 2 k2 = k (T 2 )∗ T 2 k = k (T ∗T )∗ (T ∗ T ) k = k T ∗ T k2 = k T k4 ,
k
k
induktiv also k T 2 k = k T k2 für alle k ∈ N . Da der obige Limes existiert (vgl.
8.3 b)), folgt daraus die Behauptung.
3
8.16 Satz. Es sei H ein Hilbertraum über C .
a) Für einen selbstadjungierten Operator A ∈ L(H) gilt σ(A) ⊆ R und
k RA (λ) k ≤ | Im λ |−1
für λ ∈ C\R .
(21)
b) Für einen unitären Operator U ∈ L(H) gilt σ(U) ⊆ S 1 = {z ∈ C | | z | = 1} und
k RU (λ) k ≤ (1 − | λ |)−1
für λ ∈ C\S 1 .
(22)
Beweis. a) ist gerade die Aussage von Satz 5.18.
b) Wegen k U k ≤ 1 gilt σ(U) ⊆ D := {z ∈ C | | z | ≤ 1} . Für | λ | < 1 gilt aber
λI − U = U (λU −1 − I) ∈ GL(H) wegen k U −1 k = 1 .
Für | λ | > 1 hat man | h (λI − U)x|x i | = | λh x|x i − h Ux|x i | ≥ (| λ | − 1) k x k2 ,
und es folgt k RU (λ) k ≤ (| λ | − 1)−1 nach Satz 7.8. Für | λ | < 1 argumentiert man
ähnlich.
3
8.17 Nilpotente und quasinilpotente Operatoren. a) Es sei X ein Banachraum. Ein Operator T ∈ L(X) heißt nilpotent, wenn T p = 0 für ein p ∈ N gilt und
quasinilpotent, wenn r(T ) = 0 ist.
b) Nach (11) sind die Volterra-Integraloperatoren aus 8.6 quasinilpotent; der Operator aus (18) zeigt, daß sie i. a. aber nicht nilpotent sind.
8 Grundlagen der Spektraltheorie
53
c) Im Fall K = C ist T ∈ L(X) genau dann quasinilpotent, wenn σ(T ) = {0} gilt;
dies folgt aus den Sätz 8.13 und 8.14. Im Fall dim X = n < ∞ ist jeder quasinilpotente Operator T ∈ L(X) sogar nilpotent mit T n = 0 . Zum Beweis betrachtet
man die Kette der Bildräume
X ⊇ R(T ) ⊇ R(T 2 ) ⊇ . . . ⊇ R(T j ) ⊇ R(T j+1) . . . .
Aus Dimensionsgründen gibt es 0 ≤ p ≤ n mit R(T p ) = R(T p+1) . Dann ist
T ∈ L(R(T p )) surjektiv, also invertierbar. Ist T p 6= 0 , so hat T auf R(T p ) einen
Eigenwert 6= 0 im Widerpruch zu σ(T ) = {0} .
8.18 Kommutatoren. a) In der Quantenmechanik werden physikalische Größen
wie Ort, Impuls, Energie usw. durch (selbstadjungierte, i. a. unbeschränkte) lineare
Operatoren beschrieben; das Spektrum (⊆ R ) eines solchen Operators ist dann die
Menge der möglichen Meßergebnisse.
b) Der Kommutator [P, Q] := P Q − QP der Operatoren Q und P von Ort und
Impuls eines eindimensionalen Teilchens muß die Heisenbergsche Vertauschungsrelation
P Q − QP =
h̄
i
I
(23)
erfüllen, wobei 2πh̄ > 0 die Plancksche Konstante ist; diese impliziert dann die
Heisenbergsche Unschärferelation (vgl. 13.5). Durch
Qf (t) := t f (t) ,
P f (t) :=
h̄ df
i dt
kann (23) leicht auf den Definitionsbereichen C ∞ (R) oder D(R) := C ∞ (R) ∩ Cc (R)
realisiert werden.
b) Andererseits kann (23) nicht durch beschränkte lineare Operatoren auf einem
Banachraum X realisiert werden. Für T, S ∈ L(X) gilt nämlich stets
T S − ST 6= I .
(24)
Andernfalls folgt leicht mit Induktion
T n S − ST n = n T n−1 6= 0 .
(25)
Für n = 1 ist (25) gerade (24). Gilt nun (25) für n ∈ N , so folgt zunächst T n 6= 0
und dann auch
T n+1 S − ST n+1 = T (ST n + nT n−1 ) − ST n+1 = (T S − ST )T n + nT n = (n + 1) T n .
Aus (25) erhält man dann
n k T n−1 k = k T n S − ST n k ≤ 2 k T n k k S k ≤ 2 k T n−1 k k T k k S k
und somit den Widerspruch n ≤ 2 k T k k S k für alle n ∈ N .
c) Die Aussage von b) folgt auch aus der Gleichung
σ(T S) ∪ {0} = σ(ST ) ∪ {0} ,
die sogar in jeder Algebra (ohne eine Norm) gültig ist.
(26)
54
9
II. Unbeschränkte Operatoren und Observable der Quantenmechanik
Abgeschlossene und abschließbare Operatoren
9.1 Lineare Operatoren und Graphen. Es seien X , Y Banachräume über K =
R oder K = C .
a) Ein linearer Operator von X nach Y ist eine lineare Abbildung T : D(T ) → Y
mit einem Unterraum D(T ) ⊆ X als Definitionsbereich. Mit R(T ) ⊆ Y bezeichnen
wir das Bild von T . Im Fall X = Y nennen wir T einen Operator in X .
b) Ein Operator U von X nach Y heisst Erweiterung von T , falls D(T ) ⊆ D(U)
und Ux = T x für x ∈ D(T ) gilt; wir schreiben dann T ⊆ U .
c) Mit Γ(T ) := {(x, T x) | x ∈ D(T )} ⊆ X × Y bezeichnen wir wie in 6.10 den
Graphen von T . Durch
τ : D(T ) → Γ(T ) ,
τ x := (x, T x) ,
wird eine lineare Isomorphie von D(T ) auf den Graphen Γ(T ) definiert.
d) Auf dem Produktraum X × Y verwenden wir die ℓ2 -Norm
k (x, y) k2 := k x k2 + k y k2 ,
(x, y) ∈ X × Y ;
im Fall von Hilberträumen X, Y ist dann auch X × Y ein Hilbertraum. Auf dem
Vektorraum D(T ) definieren wir die Graphennorm durch
k x k2T := k x k2 + k T x k2 ,
x ∈ D(T ) ,
(1)
und führen die Bezeichnung
DT := (D(T ), k kT )
(2)
für den durch die Graphennorm normierten Raum D(T ) ein. Damit wird die obige
Isomorphie τ zu einer Isometrie
τ : DT → Γ(T ) ,
τ x := (x, T x) .
(3)
Die Inklusion
i : DT → X ,
ix := x ,
(4)
und der Operator T : DT → Y sind offenbar stetig.
e) Ein Operator T von X nach Y heisst abgeschlossen, falls sein Graph Γ(T ) in
X × Y abgeschlossen ist. Nach dem Satz vom abgeschlossenen Graphen 6.11 ist ein
abgeschlossener Operator mit D(T ) = X automatisch stetig.
f) Ein Operator T von X nach Y heisst abschließbar, falls der Abschluss Γ(T ) des
Graphen wieder ein Graph in X × Y ist.
9.2 Satz. Es seien X , Y Banachräume. Für einen Operator T von X nach Y
sind äquivalent:
(a) T ist abgeschlossen.
(b) Für eine Folge (xn ) in D(T ) mit xn → x in X und T xn → y in Y folgt
x ∈ D(T ) und T x = y .
(c) Der normierte Raum DT ist vollständig.
11 Abgeschlossene und abschließbare Operatoren
55
Beweis. Es ist (b) eine Ausformulierung der Abgeschlossenheit von Γ(T ) , also
äquivalent zu (a). Weiter folgt (a) ⇔ (c)“ sofort aus der Vollständigkeit von X ×Y
”
und der Isometrie DT ∼
3
= Γ(T ) .
9.3 Multiplikationsoperatoren und Ortsoperatoren. a) Es seien Ω ⊆ Rn offen
und a ∈ C(Ω) eine stetige, i. a. unbeschränkte Funktion. Als erstes Beispiel betrachten wir den Multiplikationsoperator Ma : f 7→ af in L2 (Ω) mit Definitionsbereich
D(Ma ) := {f ∈ L2 (Ω) |
R
Ω
| a(t) f (t) |2 dt < ∞} .
(5)
Offenbar besteht D(Ma ) aus allen Äquivalenzklassen modulo Nullfunktionen messbarer Funktionen auf Ω mit
k f k2Ma =
R
Ω
| f (t) |2 (1 + | a(t) |)2 dt < ∞ ,
und daher ist DMa = L2 (Ω, (1 + | a |2) dt) ein Hilbertraum. Der Operator Ma ist
also abgeschlossen.
b) Speziell für a(t) = tj ist durch Qj := Mtj : f (t) 7→ tj f (t) in L2 (Rn ) der
Ortsoperator der j -ten Koordinate gegeben.
c) Allgemeiner können wir Multiplikationsoperator Ma : f 7→ af in L2 (Ω, Σ, µ)
über beliebigen Maßräumen mit messbaren Funktionen a betrachten, vgl. dazu etwa
[KFO], Satz 16.1.
9.4 Diagonaloperatoren. Nun sei a = (aj )j∈N0 eine beliebige Folge. Als diskre”
ten Multiplikationsoperator“ betrachten wir im Folgenraum ℓ2 den Diagonaloperator
∆a = diag(aj ) : (xj ) 7→ (aj xj ) mit Definitionsbereich
D(∆a ) := {x = (xj ) ∈ ℓ2 |
∞
P
j=0
| aj xj |2 < ∞} .
(6)
1
Dann ist auch D∆a = ℓ2 ((1 + | a |2 ) /2 ) ein Hilbertraum, und der Operator ∆a ist
ebenfalls abgeschlossen.
9.5 Ein Differentialoperator. a) Über einem kompakten Intervall J = [a, b] betrachten wir den Differentialoperator T : f 7→ f ′ mit Definitionsbereich D(T ) =
C 1 (J) im Banachraum C(J) . Für die Folge (fn (t) := n1 sin n(t−a)) gilt k fn ksup → 0 ,
aber (fn′ (t) = cos n(t − a)) und somit k T fn ksup = 1 6→ 0 ; der Operator
T : (D(T ), k ksup ) → C(J) ist also unstetig.
b) Es ist jedoch T ein abgeschlossener Operator in C(J) , da C 1 (J) unter der zu
k kC 1 äquivalenten Graphennorm vollständig ist. Dies ergibt sich auch aus Satz
9.2 (b): Für eine Folge (fn ) in C 1 (J) mit fn → f in C(J) und fn′ → g in C(J) folgt
f ∈ C 1 (J) und f ′ = g (vgl. etwa [KA1], 22.14 für eine etwas schärfere Aussage).
c) Im Hilbertraum L2 (J) dagegen ist T nicht abgeschlossen, da man für eine Folge (fn ) in C 1 (J) aus fn → f in L2 (J) und fn′ → g in L2 (J) nicht f ∈ C 1 (J)
schließen kann. Der Operator ist jedoch abschließbar; zum Nachweis dieser Tatsache
verwenden wir den folgenden
56
II. Unbeschränkte Operatoren und Observable der Quantenmechanik
9.6 Satz. Es seien X , Y Banachräume. Für einen Operator T von X nach Y
sind äquivalent:
(a) T ist abschließbar.
(b) Für eine Folge (xn ) in D(T ) mit xn → 0 in X und T xn → y in Y folgt
y = 0.
d → X der Inklusion (4) auf die Vervollständigung
(c) Die stetige Fortsetzung bi : D
T
von DT ist injektiv.
Beweis. (a) ⇒ (b)“: In (b) gilt (0, y) ∈ Γ(T ) , also y = 0 , da Γ(T ) ein Graph
”
ist.
(b) ⇒ (a)“: Für (x, y) ∈ Γ(T ) und (x, y ′ ) ∈ Γ(T ) gibt es Folgen (xn , yn ) und
” ′ ′
(xn , yn ) in Γ(T ) mit (xn , yn ) → (x, y) und (x′n , yn′ ) → (x, y ′ ) . Dann ist (xn − x′n )
eine Folge in D(T ) mit xn − x′n → 0 in X und T (xn − x′n ) → y − y ′ in Y . Aus (b)
folgt dann y − y ′ = 0 , und folglich ist Γ(T ) ein Graph.
(a) ⇔ (c)“: Der Operator τ aus (3) lässt sich zu einer bijektiven Isometrie
”
d → Γ(T )
τb : D
T
auf die Vervollständigung von DT fortsetzen. Mit der Projektion
π :X ×Y → X,
π(x, y) := x ,
gilt i = πτ und somit auch bi = π τb . Daher ist bi genau dann injektiv, wenn dies auf
3
π|Γ(T ) zutrifft, und dies ist genau dann der Fall, wenn Γ(T ) ein Graph ist.
Beachten Sie bitte, dass die stetige Fortsetzung eines injektiven linearen Operators
auf den Abschluss oder die Vervollständigung von dessen Definitionsbereich i. a.
nicht injektiv ist, vgl. dazu 2.7.
9.7 Abschluss von Operatoren. a) Für einen abschließbaren Operator T von
X nach Y ist also Γ(T ) der Graph eines Operators T von X nach Y , und dieser
Abschluss T von T ist offenbar die minimale abgeschlossene Erweiterung von T .
b) Für ein Paar (x, T x) ∈ Γ(T ) = Γ(T ) gibt es eine Folge ((xn , T xn )) in Γ(T )
mit (xn , T xn ) → (x, T x) in X × Y . Dann ist (xn ) eine Cauchy-Folge in DT und
d . Es folgt x = bix
d → Y
b und T (x) = Tb x
b , wobei Tb : D
hat einen Limes xb in D
T
T
die stetige Fortsetzung von T auf die Vervollständigung von dessen Definitionsbed auch
reich bezüglich der Graphennorm ist. Umgekehrt ist für ein Element xb ∈ D
T
bix
b
b ∈ D(T ) ; aufgrund der Injektivität von i gilt also zusammenfassend
d
D(T ) = biD
T
und T (bixb) = Tb xb für bixb ∈ D(T ) .
(7)
9.8 Satz. Der Operator T : f 7→ f ′ in L2 (J) mit D(T ) = C 1 (J) ist abschließbar.
Beweis. Es sei (fn ) eine Folge in C 1 (J) mit fn → 0 in L2 (J) und fn′ → g in
L2 (J) . Für jede Testfunktion ϕ ∈ D(a, b) gilt dann
Rb
a
Rb ′
f (t) ϕ(t) dt
n→∞ a n
g(t) ϕ(t) dt = lim
und Satz 3.17 impliziert g = 0 .
Rb
n→∞ a
= − lim
fn (t) ϕ′ (t) dt = 0 ,
3
11 Abgeschlossene und abschließbare Operatoren
57
9.9 Ein Sobolev-Raum. a) Der Definitionsbereich des Operators T heißt SobolevRaum W21 (a, b) := D(T ) . Dieser ist also der Raum aller Funktionen f ∈ L2 [a, b] , für
die eine Folge (fn ) in C 1 [a, b] existiert, sodass k f − fn kL2 → 0 gilt und die Folge
(fn′ ) eine Cauchy-Folge in L2 [a, b] ist. Der Limes T f = n→∞
lim fn′ hängt nach Satz
9.8 nicht von der Wahl der Folge (fn ) ab und kann als verallgemeinerte Ableitung
f ′ := T f von f in L2 [a, b] betrachtet werden. Die Graphennorm von T ist die
Sobolev-Norm
k f kW21 :=
R
b
a
| f (t) |2 dt +
1/2
Rb
′
2
a | f (t) | dt
.
b) Für f ∈ W21 (a, b) und eine Testfunktion ϕ ∈ D(a, b) gilt
Rb
a
Rb
a
Rb
n→∞ a
f (t) ϕ′(t) dt = lim
f (t) ϕ′ (t) dt = −
Rb
a
Rb
n→∞ a
fn (t) ϕ′ (t) dt = − lim
fn′ (t) ϕ(t) dt ,
g(t) ϕ(t) dt für ϕ ∈ D(a, b)
also
(8)
und g = f ′ = T f . Nach Satz 3.17 ist g ∈ L2 [a, b] durch Eigenschaft (8) eindeutig
bestimmt und heißt dann schwache Ableitung von f ∈ L2 [a, b] . Mittels Approximation von g in L2 [a, b] durch stetige Funktionen ergibt sich, dass jede Funktion
f ∈ L2 [a, b] mit schwacher Ableitung in L2 [a, b] bereits in W21 (a, b) liegt (vgl. [KFA],
Satz 5.11).
c) In Abschnitt 14 zeigen wir, dass schwache Ableitungen ein Spezialfall von Distributionsableitungen sind und gehen genauer auf Sobolev-Räume ein, auch in mehreren
Variablen.
1
Hier zeigen wir noch W21 (a, b) ⊆ Λ /2 [a, b] ⊆ C[a, b] und verwenden dabei
9.10 Räume Hölder-stetiger Funktionen. Es seien K eine kompakte Menge
in einem Banachraum und 0 < α ≤ 1 . Eine Funktion f : K 7→ K erfüllt eine
O -Hölderbedingung zum Exponenten α , falls es C > 0 gibt mit
| f (s) − f (t) | ≤ C k s − t kα
für alle s, t ∈ K .
Der Raum aller dieser Funktionen ist gegeben durch
(t) |
Λα (K) := {f : K 7→ K | [f ]α := sup | fk(s)−f
< ∞} .
s−t kα
s6=t
Der Ausdruck [ ]α ist eine Halbnorm auf Λα (K) . Mit
k f kΛα := [f ]α + k f ksup
erhält man eine Norm, unter der Λα (K) dann ein Banachraum ist. Eine HölderBedingung zum Exponenten α = 1 heißt auch Lipschitz-Bedingung.
1
9.11 Satz. Man hat W21 (a, b) ⊆ Λ /2 [a, b] , und für f ∈ W21 (a, b) gilt eine SobolevAbschätzung
k f kΛ 1/2 ≤ C k f kW21
für
f ∈ W21 (a, b) .
(9)
58
II. Unbeschränkte Operatoren und Observable der Quantenmechanik
a) Es genügt, (9) für f ∈ C 1 [a, b] zu zeigen; dann folgt die Behauptung mittels Satz
1
2.6, der Vollständigkeit von Λ /2 [a, b] und Satz 9.8.
b) Für f ∈ C 1 [a, b] gibt es nach dem Mittelwertsatz der Integralrechnung einen Punkt
t0 ∈ [a, b] mit
1
b−a
Rb
a
f (s) ds = f (t0 ) .
Aus dem Hauptsatz ergibt sich dann
f (t) = f (t0 ) +
Rt
t0
f ′ (τ ) dτ =
1
b−a
Rb
a
f (τ ) dτ +
Rt
t0
f ′ (τ ) dτ
für alle t ∈ [a, b] , und daraus folgt mit der Schwarzschen Ungleichung
k f ksup ≤
1
b−a
k f kL1 + k f ′ kL1 ≤ (b − a)−1/2 k f kL2 + (b − a)1/2 k f ′ kL2 .
c) Weiter hat man
| f (t) − f (s) | = |
Rt
s
f ′ (τ ) dτ | ≤ k f ′ kL2 | t − s |1/2
und erhält insgesamt eine Abschätzung (9).
3
9.12 Summen, Produkte und Inverse von Operatoren. a) Bei der Definition
von Summen und Produkten von Operatoren ist natürlich auf die Definitionsbereiche
zu achten. Für Operatoren T und S von X nach Y setzen wir
D(T + S) := D(T ) ∩ D(S) und (T + S)x := T x + Sx für x ∈ D(T + S) .
b) Für einen weiteren Operator U von Y nach Z sei
D(UT ) := {x ∈ D(T ) | T x ∈ D(U)} und (UT )x := UT x für x ∈ D(UT ) .
c) Für einen injektiven Operator T definieren wir den inversen Operator von Y nach
X einfach durch D(T −1 ) := R(T ) und T −1 y := x für y = T x ; dann gilt offenbar
R(T −1 ) = D(T ) . Für die Isometrie
V :X ×Y →Y ×X,
V (x, y) := (y, x) ,
(10)
gilt dann Γ(T −1 ) = V Γ(T ) ; somit ist T −1 genau dann abgeschlossen, wenn dies auf
T zutrifft.
9.13 Spektrum und Resolvente. Es sei T ein Operator in einem Banachraum
X . Die Resolventenmenge von T wird definiert durch
ρ(T ) := {λ ∈ C | λI−T : D(T ) → X bijektiv, (λI−T )−1 beschränkt} , (11)
ihr Komplement σ(T ) := C\ρ(T ) heisst Spektrum von T . Die Resolvente wird auf
ρ(T ) definiert durch RT (λ) := (λI − T )−1 ∈ L(X) .
9.14 Satz. Es sei T ein abgeschlossener Operator im Banachraum X .
a) Für λ ∈ C ist auch λI − T abgeschlossen.
b) Die Resolventenmenge von T ist gegeben durch
ρ(T ) := {λ ∈ C | λI − T : D(T ) → X ist bijektiv} .
Sie ist offen in C , und die Resolvente RT : ρ(T ) → L(X) ist holomorph.
(12)
11 Abgeschlossene und abschließbare Operatoren
59
Beweis. a) Es sei (xn ) eine Folge in D(λI − T ) = D(T ) mit xn → x in X und
(λI − T )xn → y in X . Dann folgt T xn → λx − y , also x ∈ D(T ) = D(λI − T )
und T x = λx − y , also (λI − T )x = y .
b) Es sei µ ∈ C , so dass µI − T : D(T ) → X bijektiv ist. Da DT und X Banachräume sind und µI − T : DT → X stetig ist, ist auch die Inverse (µI − T )−1 :
X → DT stetig aufgrund des Satzes vom inversen Operator 6.8. Insbesondere hat
man µ ∈ ρ(T ) und RT (µ) ∈ L(X) .
Nun sei λ ∈ C mit | λ − µ | < k RT (µ) k−1 . Nach Satz 8.1 ist dann auch
λI − T = (λ − µ)I + µI − T = [(λ − µ)RT (µ) + I] (µI − T ) : D(T ) → X
ein bijektiver Operator von D(T ) nach X , und man hat λ ∈ ρ(T ) . Weiter ist
(λI − T )−1 = (µI − T )−1
∞
P
(−1)k RT (µ)k (λ − µ)k
k=0
für | λ − µ | < k RT (µ) k−1 , und somit ist die Resolvente holomorph.
3
Für abgeschlossene Operatoren T und λ ∈ ρ(T ) ist also (λI −T )−1 : X → DT stetig,
insbesondere also auch stetig als Operator von X nach X . Mit der Resolventen
RT (λ) ∈ L(X) ist im folgenden immer der letztere Operator gemeint. Dann ist also
RT : ρ(T ) → L(X) holomorph; der Beweis des Satzes zeigt auch, dass sogar die
Funktion ( · I − T )−1 : ρ(T ) → L(X, DT ) holomorph ist.
9.15 Beispiele. a) Für den Diagonaloperator ∆a in ℓ2 aus (6) ist aj ein Eigenwert
mit dem Einheitsvektor ej als Eigenvektor; daher gilt {aj | j ∈ N0 } ⊆ σ(∆a ) . Für
λ ∈ C\{aj | j ∈ N0 } gibt es δ > 0 mit | λ − aj | ≥ δ für alle j ∈ N0 ; der Operator
1
) ist daher auf ℓ2 beschränkt. Somit gilt
diag( λ−a
j
1
σ(∆a ) = {aj | j ∈ N0 } und R∆a (λ) = diag( λ−a
) für λ ∈ ρ(∆a ) . (13)
j
b) Für den Multiplikationsoperator Ma in L2 (Ω) aus (5) gilt analog zu a)
σ(Ma ) = a(Ω) und RMa (λ) = M(λ−a)−1 für λ ∈ ρ(Ma ) .
(14)
⊆“ ergibt sich wie in a). Ein Punkt λ = a(τ ) ∈ a(Ω)
muss nicht un( n
”
/2
k
, |t−τ | ≤
bedingt ein Eigenwert von Ma sein. Für die Funktionen fk (t) :=
0 , |t−τ | >
√
gilt jedoch k fk kL2 = ωn , wobei ωn das Volumen der n -dimensionalen Einheitskugel ist. Weiter gilt
√
k (λ − Ma )fk kL2 ≤ ωn sup {| λ − a(t) | | | t − τ | ≤ k1 } → 0 ;
Die Inklusion
daher kann keine Abschätzung k (λ − Ma )f k ≥ c k f k mit einer Konstanten c > 0
gelten, und man hat λ ∈ σ(Ma ) .
c) Für den Ortsoperator aus 9.3 b) gilt σ(Qj ) = R und
RQj (λ) = M(λ−tj )−1
für λ ∈ C\R .
(15)
Für eine in C dichte Folge a = (aj )j∈N0 gilt ρ(∆a ) = ∅ nach (13), ganz im Gegensatz
zum Fall beschränkter linearer Operatoren. Umgekehrt kann auch σ(T ) = ∅ gelten:
1
k
1
k
60
II. Unbeschränkte Operatoren und Observable der Quantenmechanik
9.16 Beispiele. a) Wir betrachten den abgeschlossenen Differentialoperator
T : f 7→ f ′ mit D(T ) = C 1 [a, b] in C[a, b] aus 9.5. Wegen (λI − T )eλt = 0 ist
jeder Punkt λ ∈ C ein Eigenwert von T , und daher ist ρ(T ) = ∅ .
b) Jetzt betrachten wir die Einschränkung T0 von T auf den Definitionsbereich
D(T0 ) := {f ∈ C 1 [a, b] | f (a) = 0} . Die Eigenfunktionen eλt aus a) liegen dann
nicht in D(T0 ) . Im Gegensatz zu a) ist der abgeschlossene Operator λI − T0 :
D(T0 ) → C[a, b] für alle λ ∈ C bijektiv, da das Anfangswertproblem
−ẋ(t) + λx(t) = g(t) ,
x(a) = 0 ,
für jede Funktion g ∈ C[a, b] die eindeutige Lösung
f (t) =
Rt
a
g(s) eλ(s−t) ds
in C 1 [a, b] hat Folglich gilt σ(T0 ) = ∅ .
12 Symmetrische und selbstadjungierte Operatoren
10
61
Symmetrische und selbstadjungierte Operatoren
Ab jetzt betrachten wir nur noch Operatoren zwischen Hilberträumen H , G . Das
Skalarprodukt auf dem Hilbertraum H × G ist gegeben durch
h(x1 , y1 )|(x2 , y2 )i = hx1 |x2 iH + hy1 |y2 iG .
10.1 Konstruktion adjungierter Operatoren. a) Es seien H, G Hilberträume
und T : D(T ) → G ein Operator von H nach G . Ist für ein y ∈ G die Linearform
x 7→ hT x|yi stetig auf D(T ), so kann sie nach Satz 2.6 zu einer stetigen Linearform
auf D(T ) fortgesetzt werden. Nach dem Rieszschen Darstellungssatz 5.6 gibt es dann
genau einen Vektor z ∈ D(T ) mit
hT x|yi = hx|zi ,
x ∈ D(T ) .
b) Diese Formel gilt auch für jeden Vektor z + n mit n ∈ D(T )⊥ ; ein Vektor z ∈ H
ist also durch sie genau dann eindeutig bestimmt, wenn D(T )⊥ = {0} ist, wenn also
D(T ) in H dicht ist. In diesem Fall setzen wir
D(T ∗) := {y ∈ G | x 7→ hT x|yi ist stetig}
(1)
und definieren den adjungierten Operator T ∗ : D(T ∗ ) → H zu T durch
hx|T ∗ yi = hT x|yi ,
x ∈ D(T ) , y ∈ D(T ∗ ) .
(2)
10.2 Beispiele. a) Es seien Ω ⊆ Rn offen und a ∈ C(Ω) . Der Multiplikationsoperator Ma in L2 (Ω) aus (9.5) ist dicht definiert wegen Cc (Ω) ⊆ D(Ma ) , und es ist
Ma∗ = Mā . In der Tat gilt zunächst
hMa f |gi =
R
Ω
a(t)f (t) g(t) dt =
R
Ω
f (t) a(t)g(t) dt = hf |Mā gi
für f ∈ D(Ma ) und g ∈ D(Mā ) = D(Ma ) , und dies zeigt Mā ⊆ Ma∗ . Umgekehrt
sei nun g ∈ D(Ma∗ ) und h := Ma∗ g ∈ L2 (Ω) . Dann gilt
R
Ω
a(t)f (t) g(t) dt = hMa f |gi = hf |hi =
R
Ω
f (t) h(t) dt
(3)
für alle f ∈ D(Ma ) . Nun sei K ⊆ Ω kompakt und ϕ ∈ L2 (K) . Die durch 0 auf Ω
fortgesetzte Funktion ϕe liegt dann in D(Ma ) , und aus (3) folgt
R
K
a(t)ϕ(t) g(t) dt =
R
Ω
e
a(t)ϕ(t)
g(t) dt =
R
Ω
e
ϕ(t)
h(t) dt =
R
K
ϕ(t) h(t) dt .
Dies zeigt a(t)g(t) = h(t) fast überall auf K und somit auch fast überall auf Ω .
Folglich gilt āg ∈ L2 (Ω) und somit g ∈ D(Mā ) .
b) Der Diagonaloperator ∆a in ℓ2 aus (9.6) ist wegen [ej ]j∈N0 ⊆ D(∆a ) dicht
definiert, und analog zu a) ergibt sich ∆∗a = ∆ā .
In ungünstigen Fällen kann D(T ∗ ) = {0} sein:
62
II. Unbeschränkte Operatoren und Observable der Quantenmechanik
10.3 Beispiel. a) Es seien {ek }k∈N0 die Einheitsvektoren in ℓ2 und D(T ) = [ek ]k∈N0 .
Für eine Indizierung {eij }N0 ×N0 dieser Einheitsvektoren über N0 × N0 definieren wir
T : D(T ) → ℓ2 durch T ekj = ek , k ∈ N0 , und lineare Fortsetzung.
b) Nun sei y = (yk )k∈N0 ∈ D(T ∗ ) . Für k, j ∈ N gilt
hekj |T ∗yi = hT ekj |yi = hek |yi = yk .
Nach der Besselschen Ungleichung ist aber
∞
P
j=1
| hekj |T ∗ yi |2 < ∞ , und somit gilt
yk = lim hekj |T ∗ yi = 0 für alle k ∈ N0 . Folglich ist D(T ∗ ) = {0} .
j→∞
Der Operator T aus dem letzten Beispiel ist nicht abschließbar aufgrund des folgenden Resultats:
10.4 Satz. a) Ein adjungierter Operator T ∗ : D(T ∗ ) → H ist stets abgeschlossen.
b) Es ist D(T ∗) genau dann dicht in G , wenn T abschließbar ist.
∗
c) Für abschließbare Operatoren gilt T = T ∗ und T ∗∗ = T .
Beweis. Ähnlich wie in (9.10) verwenden wir die Isometrie
U : G×H → H ×G,
U(y, x) := (−x, y) ;
(4)
a) ergibt sich dann sofort aus der Formel
U(Γ(T ∗ )) = Γ(T )⊥ .
(5)
Die Inklusion ⊆“folgt sofort aus (2). Ist umgekehrt (u, v) ∈ Γ(T )⊥ gegeben, so gilt
”
hx|ui + hT x|vi = 0 für x ∈ D(T ) . Dies bedeutet v ∈ D(T ∗ ) und T ∗ v = −u , und
es folgt (u, v) = (−T ∗ v, v) = U(v, T ∗ v) ∈ U(Γ(T ∗ )) .
b) ⇒ “: Es sei (xn ) eine Folge in D(T ) mit xn → 0 in H und T xn → y in G . Für
”
z ∈ D(T ∗ ) gilt dann
hy|zi = n→∞
lim hT xn |zi = n→∞
lim hxn |T ∗ zi = 0 ,
und wegen der Dichtheit von D(T ∗ ) in G muss y = 0 sein.
⇐ “: Für z ∈ D(T ∗)⊥ gilt (z, 0) ∈ Γ(T ∗ )⊥ und somit
”
(0, z) ∈ U(Γ(T ∗ )⊥ ) = (UΓ(T ∗ ))⊥ = Γ(T )⊥⊥ = Γ(T )
nach (5) und (5.6). Da nun Γ(T ) ein Graph ist, folgt z = 0 , und somit ist D(T ∗ )
dicht in G .
c) Aus (5) ergibt sich weiter
U(Γ(T ∗ )) = Γ(T )⊥ = Γ(T )
⊥
∗
= Γ(T )⊥ = U(Γ(T ))
∗
und damit Γ(T ) = Γ(T ∗ ) .
Schließlich wenden wir Aussage (5) auf T ∗ an. Der Isometrie U aus (4) entspricht
W :H ×G→G×H,
W (x, y) := (−y, x) = −U −1 (x, y) .
Damit ergibt sich W (Γ(T ∗∗ )) = Γ(T ∗ )⊥ mittels (5), also
Γ(T ∗∗ ) = W −1 (Γ(T ∗ )⊥ ) = (W −1 Γ(T ∗ ))⊥ = (UΓ(T ∗ ))⊥ = Γ(T )⊥⊥ = Γ(T )
und somit die Behauptung T ∗∗ = T .
3
Adjungierten- und Inversenbildung sind in folgendem Sinne miteinander verträglich:
63
12 Symmetrische und selbstadjungierte Operatoren
10.5 Satz. Es sei T ein injektiver Operator von H nach G mit D(T ) = H und
D(T −1 ) = G . Dann existiert (T ∗ )−1 , und es ist (T ∗ )−1 = (T −1 )∗ .
Beweis. a) Es sei y ∈ D(T ∗ ) mit T ∗ y = 0 . Dann gilt hT x|yi = hx|T ∗ yi = 0 für
alle x ∈ D(T ) , also hz|yi = 0 für alle z ∈ R(T ) . Da aber R(T ) = D(T −1 ) in G
dicht ist, folgt y = 0 . Somit ist T ∗ injektiv, und (T ∗ )−1 existiert.
b) Nun seien v = T u ∈ D(T −1 ) ⊆ G und x = T ∗ y ∈ D((T ∗ )−1 ) ⊆ H . Dann gilt
hT −1v|xi = hu|T ∗yi = hT u|yi = hv|(T ∗)−1 xi ;
daher ist v 7→ hT −1 v|xi stetig, und man hat x ∈ D((T −1)∗ ) sowie (T −1 )∗ x =
(T ∗ )−1 x . Dies zeigt (T ∗ )−1 ⊆ (T −1 )∗ .
c) Nun sei umgekehrt x ∈ D((T −1)∗ ) ⊆ H und y = (T −1 )∗ x ∈ G . Für einen Vektor
v = T u ∈ D(T −1 ) ⊆ G folgt hT −1 v|xi = hv|yi ; man hat also hu|xi = hT u|yi für
alle u ∈ D(T ) . Dies zeigt y ∈ D(T ∗ ) und x = T ∗ y ∈ R(T ∗ ) = D((T ∗ )−1 ) .
3
Satz 5.14 gilt auch für unbeschränkte Operatoren:
10.6 Satz. Es sei T ein abschließbarer Operator von H nach G mit dichtem Definitionsbereich. Dann gilt
R(T )⊥ = N(T ∗ )
und
R(T ∗ )⊥ = N(T )
R(T ) = N(T ∗ )⊥
und
R(T ∗ ) = N(T )⊥ .
sowie
(6)
(7)
Beweis. a) Für y ∈ N(T ∗ ) gilt h T x|y i = h x|T ∗y i = 0 für alle x ∈ D(T ) , also
y ∈ R(T )⊥ . Ist umgekehrt y ∈ R(T )⊥ , so ist x 7→ h T x|y i (= 0) stetig auf D(T ) ,
also y ∈ D(T ∗ ) und T ∗ y = 0 . Dies zeigt die erste Gleichung in (6). Damit folgt auch
die zweite Gleichung wegen R(T ∗ )⊥ = N(T ∗∗ ) = N(T ) aufgrund von Satz 10.4 c).
b) Aussage (7) folgt sofort aus (6) durch Bildung von Orthogonalkomplementen (vgl.
Formel (5.6)).
3
Die Formeln (7) liefern wie in Abschnitt 5 Informationen über die Lösbarkeit linearer
Gleichungen T x = y und T ∗ v = u . Im Fall abgeschlossener Operatoren ist die
Abgeschlossenheit der Bilder von T und von T ∗ sogar äquivalent. Dieses wichtige
Resultat geht auf S. Banach (1929) und F. Hausdorff (1932) zurück:
10.7 Theorem(vom abgeschlossenen Bild). Es seien H, G Hilberträume. Für
einen abgeschlossenen Operator von H nach G mit D(T ) = H sind äquivalent:
(a) R(T ) ist abgeschlossen in G .
(b) R(T ) = N(T ∗ )⊥ .
(c) R(T ∗ ) = N(T )⊥ .
(d) R(T ∗ ) ist abgeschlossen in H .
Beweis. Die Äquivalenzen (a) ⇔ (b)“ und (c) ⇔ (d)“ folgen aus Formel (7).
”
”
(a) ⇒ (c)“: Es sei x ∈ N(T )⊥ gegeben. Durch
”
ϕ : v 7→ h u|x i für u ∈ D(T ) und v = T u
64
II. Unbeschränkte Operatoren und Observable der Quantenmechanik
wird eine Linearform auf R(T ) definiert: Gilt auch v = T u′ , so ist u − u′ ∈ N(T )
und somit h u|x i = h u′|x i .
Die Bijektion T : (DT ∩ N(T )⊥ ) → R(T ) besitzt nach Theorem 6.8 eine stetige
Inverse, da DT und R(T ) Hilberträume sind. Für eine Nullfolge (vn ) in R(T ) gilt
daher vn = T un für eine Nullfolge (un ) in DT , und es folgt ϕ(vn ) = h un |x i → 0 .
Die Linearform ϕ ist also stetig auf R(T ) , und nach dem Rieszschen Darstellungssatz 5.6 gibt es genau ein y ∈ R(T ) ⊆ G mit ϕ(v) = h v|y i für v ∈ R(T ) . Dies
bedeutet
h T u|y i = h u|x i für alle u ∈ D(T ) ,
also y ∈ D(T ∗ ) und x = T ∗ y ∈ R(T ∗ ) .
(d) ⇒ (a)“: Nach der soeben bewiesenen Implikation (a) ⇒ (d)“ folgt aus der
”
”
Abgeschlossenheit von R(T ∗ ) die von R(T ∗∗ ) = R(T ) aufgrund von Satz 10.4 c). 3
Ein linearer Operator in einem Hilbertraum H mit dichtem Definitionsbereich lässt
sich mit seinem adjungierten Operator vergleichen:
10.8 Definition. Es sei H ein Hilbertraum. Ein Operator A in H mit D(A) = H
a) heisst symmetrisch, falls A ⊆ A∗ gilt,
b) heisst selbstadjungiert, falls A = A∗ ist.
10.9 Beispiele und Bemerkungen. a) Ein Multiplikationsoperator Ma in L2 (Ω)
oder ein Diagonaloperator ∆a in ℓ2 ist genau dann symmetrisch, wenn er selbstadjungiert ist, nämlich genau dann, wenn a reellwertig ist. Insbesondere sind die
Ortsoperatoren Qj der Quantenmechanik selbstadjungiert.
b) Nach Satz 10.4 a) ist ein selbstadjungierter Operator A abgeschlossen. Durch Einschränkung von A auf echte dichte Unterräume des Definitionsbereichs DA erhält
man symmetrische Operatoren, die nicht abgeschlossen, also auch nicht selbstadjungiert sind.
10.10 Symmetrische Operatoren. a) Ein Operator A in H mit D(A) = H ist
also genau dann symmetrisch, falls gilt
hAx|yi = hx|Ayi für x , y ∈ D(A) .
(8)
Insbesondere ist dann also h Ax|x i ∈ R für alle x ∈ D(A) .
b) Ein symmetrischer Operator A in H ist stets abschließbar. Dies folgt sofort aus
Satz 10.4 b), kann aber auch leicht direkt gezeigt werden. Nach Satz 10.4 c) gilt dann
∗
also A = A∗ und A∗∗ = A .
c) Für einen symmetrischen Operator A in H gilt
k (λI − A)x k ≥ | Im λ | k x k ,
x ∈ D(A) , λ ∈ C .
(9)
Dies folgt wie in (5.19): Für λ = α + iβ ∈ C und x ∈ D(A) hat man
k (λI − A)x k k x k ≥ | h (λI − A)x|x i | = | h (αI − A)x|x i + h iβx|x i |
≥ | β | k x k2
wegen h (αI − A)x|x i ∈ R . Für Im λ 6= 0 ist daher der Operator λI − A injektiv.
Er besitzt auch ein abgeschlossenes Bild, falls er abgeschlossen ist. Er ist jedoch i. a.
nicht surjektiv, denn es gilt:
12 Symmetrische und selbstadjungierte Operatoren
65
10.11 Satz. Es sei A ein symmetrischer Operator in H .
a) Ist R(λI − A) = R(λ̄I − A) = H für ein λ ∈ C , so ist A selbstadjungiert.
b) Ist N(λI − A∗ ) = N(λ̄I − A∗ ) = {0} für ein λ ∈ C\R , so ist A selbstadjungiert.
Beweis. a) Es sei y ∈ D(A∗ ) . Für x ∈ D(A) gilt
h(λI − A)x|yi = λ hx|yi − hAx|yi = hx|λ̄yi − hx|A∗ yi = hx|(λ̄I − A∗ )yi .
Da λ̄I − A surjektiv ist, gibt es z ∈ D(A) mit (λ̄I − A∗ )y = (λ̄I − A)z , und es folgt
h(λI − A)x|yi = hx|(λ̄I − A)zi = h(λI − A)x|zi .
Da auch λI − A surjektiv ist, impliziert dies y = z ∈ D(A) .
b) Für λ ∈ C\R sind R(λI − A) und R(λ̄I − A) nach (9) abgeschlossen. Die
Behauptung folgt daher aus a) und der ersten Formel in (7).
3
Für selbstadjungierte Operatoren gilt in Erweiterung von Satz 5.18:
10.12 Satz. Es sei A ein selbstadjungierter Operator in H .
a) Dann gilt σ(A) ⊆ R .
b) Für Im λ 6= 0 sind die Resolventen RA (λ) normal; man hat RA (λ)∗ = RA (λ̄)
und
1
| Im λ |
k RA (λ) k ≤
,
Im λ 6= 0 .
(10)
Beweis. a) Es sei λ ∈ C\R . Der Operator λI−A ist nach Satz 10.4 a) abgeschlossen
und nach (9) injektiv mit abgeschlossenem Bild. Weiter gilt
R(λI − A)⊥ = N(λ̄I − A∗ ) = N(λ̄I − A) = {0}
wiederum nach (9). Somit ist λ ∈ ρ(A) , und man hat σ(A) ⊆ R .
b) Die Aussage RA (λ)∗ = RA (λ̄) folgt wegen (λI − A)∗ = (λ̄I − A∗ ) = (λ̄I − A)
aus Satz 10.5, und daraus ergibt sich die Normalität dieser Resolventen. Schließlich
folgt (10) sofort aus (9).
3
10.13 Ein Differentialoperator. a) Wir haben in 9.8 den (verallgemeinerten)
Differentialoperator T : f 7→ f ′ in L2 [a, b] mit D(T ) = W21 (a, b) als Abschluss des
Differentialoperators T : f 7→ f ′ in L2 [a, b] mit D(T ) = C 1 [a, b] konstruiert; T
ist also ein abgeschlossener Operator. Nach Satz 9.11 ist W21 (a, b) stetig in C[a, b]
eingebettet. Daher ist
D(A) := {f ∈ W21 (a, b) | f (a) = f (b) = 0}
(11)
ein abgeschlossener Unterraum von W21 (a, b) , und auch der durch Af := if ′ auf
D(A) definerte Operator ist in L2 [a, b] abgeschlossen.
b) Für f, g ∈ W21 (a, b) liefert partielle Integration
Rb
a
if ′ g dt −
Rb
a
f ig ′ dt = if g|ba .
(12)
66
II. Unbeschränkte Operatoren und Observable der Quantenmechanik
Dies ist klar für f, g ∈ C 1 [a, b] und folgt für f, g ∈ W21 (a, b) durch Approximation.
Somit ist A symmetrisch. Formel (12) besagt aber
hAf |gi = hf |ig ′i
für alle f ∈ D(A) und alle g ∈ W21 (a, b) ; daher hat man W21 (a, b) ⊆ D(A∗ ) und
A∗ g = ig ′ für g ∈ W21 (a, b) . Der Operator A ist also nicht selbstadjungiert.
c) Wir zeigenRnun D(A∗ ) = W21 (a, b) : Für g ∈ D(A∗ ) setzen wir h := A∗ g ∈ L2 [a, b]
und H(t) := at h(τ ) dτ . Wir wählen eine Folge hn ∈ C[a, b] mit hn → h in L2 [a, b]
R
uns setzen Hn (t) := at hn (τ ) dτ . Dann gelten Hn → H und Hn′ = hn → h in
L2 [a, b] , und daraus folgt H ∈ W21 (a, b) und H ′ = h .
Für eine Testfunktion ϕ ∈ D(a, b) ergibt sich mittels (12)
Rb
a
iϕ′ g dt = h Aϕ|g i = h ϕ|A∗ g i = h ϕ|h i =
Rb
a
Rb
a
ϕ h dt = −
(H − ig)ϕ′ dt = 0 für alle ϕ ∈ D(a, b) .
Rb
a
ϕ′ H dt ,
also
(13)
Nach dem folgenden Lemma ist H − ig eine konstante Funktion, und daraus folgt
g ∈ W21 (a, b) .
∗
d) Nach (11) ist also dim D(A )/D(A) = 2 . Wir suchen nun selbstadjungierte Erweiterungen Ae von A . Aus A ⊆ Ae folgt sofort Ae = Ae∗ ⊆ A∗ , also A ⊆ Ae ⊆ A∗ .
e muss also ein D(A) enthaltender Unterraum von
Der Definitionsbereich D(A)
∗
1
e nach (12)
D(A ) = W2 (a, b) der Kodimension 1 sein. Weiter muss für f, g ∈ D(A)
f g(b) = f g(a) gelten. Dies kann durch eine Randbedingung f (b) = γf (a) erreicht
werden, wobei wegen f g(b) = γγf g(a) offenbar γγ = 1 gelten muss. Selbstadjungierte Erweiterungen von A sind also für γ ∈ C mit | γ | = 1 gegeben durch
D(Aeγ ) := {f ∈ W21 (a, b) | f (b) = γf (a)} und Aeγ f = if ′ für f ∈ D(Aeγ ) . (14)
10.14 Lemma. Es sei f ∈ L2 [a, b] mit
ist f eine konstante Funktion.
Rb
a
f ϕ′ dt = 0 für alle ϕ ∈ D(a, b) . Dann
R
Beweis.R a) Für ϕ ∈ D(a, b) setzen wir Φ(t) := at ϕ(s) ds , a ≤ t ≤ b . Ist nun
I(ϕ) := ab ϕ(s) ds = 0 , so folgt Φ ∈ D(a, b) , und die Voraussetzung liefert
Rb
a
f (t) ϕ(t) dt =
Rb
a
f (t) Φ′ (t) dt = 0 .
b) Nun wählen wir χ ∈ D(a, b)
mit I(χ) = 1 . Für ϕ ∈ D(a, b) gilt dann
Rb
I(ϕ − I(ϕ)χ) = 0 . Aus a) folgt a f (t) (ϕ(t) − I(ϕ) χ(t)) dt = 0 , also
0 =
Rb
a
f (t) ϕ(t) dt −
Rb
a
f (s) χ(s) (
Rb
a
ϕ(t) dt) ds =
Rb
a (f (t)
− I(f χ)) ϕ(t) dt .
Nach Satz 3.17 stimmt daher f (fast überall) mit der konstanten Funktion I(f χ)
überein.
3
Lemma 10.14 gilt auch für L1 -Funktionen. Die Aussage ist der einfachste Fall eines
Regularitätssatzes für Differentialgleichungen.
Herunterladen