1 Hilberträume und Quantenmechanik Inhalt: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. Hilberträume Beschränkte lineare Operatoren Fourier-Reihen und der Satz von Fejér Orthonormalbasen Beschränkte lineare Operatoren auf Hilberträumen Konsequenzen aus dem Satz von Baire Schwache Konvergenz Grundlagen der Spektraltheorie Abgeschlossene und abschließbare Operatoren Symmetrische und selbstadjungierte Operatoren Kompakte Operatoren und Fredholmoperatoren Kompakte normale Operatoren Spektralzerlegungen und Quantenmechanik Distributionen Fourier-Transformation und Sobolev-Räume Friedrichs-Fortsetzung und harmonischer Oszillator Observable und symmetrische Störungen 2 Literatur GGK I. Gohberg, S. Goldberg, M.A. Kaashoek: Basic Classes of Linear Operators. Birkhäuser, Basel-Boston 2003. Hel G. Helmberg: Introduction to Spectral Theory in Hilbert Space. Dover Bokks on Mathematics 2008. KA W. Kaballo: Einführung in die Analysis I – III. Spektrum-Verlag, Heidelberg-Berlin 2000, 1997, 1999. KFA W. Kaballo: Grundkurs Funktionalanalysis. Spektrum-Verlag, Heidelberg-Berlin 2011. KFO W. Kaballo: Aufbaukurs Funktionalanalysis und Operatortheorie. Spektrum-Verlag, Heidelberg-Berlin 2014. Mau K. Maurin: Methods of Hilbert Spaces. Polish Scientific Publishers, Warschau 1972. No W. Nolting: Grundkurs Theoretische Physik 5/1: Quantenmechanik. Springer, Berlin-Heidelberg 2004. RS M. Reed, B. Simon: Methods of Mathematical Physics I: Functional Analysis. Academic Press New York 1972. Sch F. Schwabel: Quantenmechanik. Springer, Berlin-Heidelberg 2005. Tr H. Triebel: Höhere Analysis. Deutscher Verlag der Wissenschaften, Berlin 1972. Wei J. Weidmann: Lineare Operatoren in Hilberträumen. Teubner, Stuttgart 1994. 3 Einleitung Zur physikalischen Beschreibung atomarer Teilchen entwickelten E. Schrödinger und W. Heisenberg 1925/26 unabhängig voneinander zwei verschieden aussehende Theorien der Quantenmechanik. Diese stellten sich bald als isomorph“ heraus und lassen ” sich als spezielle Realisierungen abstrakterer Begriffsbildungen interpretieren: Zustände und Observable. a) Ein (reiner) Zustand eines quantenmechanischen Systems wird durch einen Einheitsvektor x ∈ H in einem separablen Hilbertraum H beschrieben. Dabei beschreiben alle Vektoren αx mit | α | = 1 den gleichen Zustand. b) Eine beobachtbare Größe oder Observable eines quantenmechanischen Systems wie etwa Ort, Impuls oder Energie wird durch einen selbstadjungierten Operator im Hilbertraum H beschrieben. c) Die Menge aller möglichen Messergebnisse einer Observablen A ist durch das Spektrum σ(A) ⊆ R des Operators gegeben. Für einen Zustand x ∈ D(A) im Definitionsbereich des Operators ist die Zahl h Ax|x i ∈ R der Mittelwert oder Erwartungswert von A in x . Die Quantenmechanik sagt jedoch das Messergebnis i. a. nicht exakt voraus, sondern gibt nur“ Wahrscheinlichkeiten dafür an, dass dieses in ” eine vorgegebene (Borel-messbare) Teilmenge des Spektrums fällt. Die zeitliche Entwicklung eines quantenmechanischen Systems wird beschrieben durch Hamilton-Operator und Schrödinger-Gleichung. Zu einem quantenmechanischen System gehört ein eindeutig bestimmter selbstadjungierter Operator, der Hamilton-Operator H . Ist x(t) ∈ D(H) der Zustand des Systems zur Zeit t ∈ R , so gilt die Schrödinger-Gleichung ẋ(t) = − h̄i Hx(t) , x(0) = x0 ∈ D(H) , (1) mit der Planckschen Konstanten 2πh̄ > 0 und einem Anfangszustand x0 ∈ D(H) . Dies ist eine Evolutionsgleichung mit der eindeutig bestimmten Lösung t x(t) = e−i h̄ H x0 . (2) Quantisierung. a) Zur Konstruktion des“ Hamilton-Operators bestimmt man ” zunächst die klassische Hamilton-Funktion des Systems und gewinnt daraus mittels einer Übersetzungsvorschrift (Quantisierung) den“ Hamilton-Operator. Hei” senbergs Quantisierung liefert unendliche Matrizen, die im Raum ℓ2 der quadratsummierbaren Folgen operieren, Schrödingers Quantisierung (i. a. singuläre elliptische) Differentialoperatoren, die in einem Hilbertraum L2 quadratintegrierbarer Funktionen operieren. In dieser Vorlesung befassen wir uns nur mit Schrödingers Quantisierung. b) Ein Teilchen im Raum wird in der klassischen Physik durch Ortskoordinaten x1 , x2 , x3 und zugehörige Impulse p1 , p2 , p3 sowie die die Energie repräsentierende Hamilton-Funktion H(xj , pj ) beschrieben. In der Schrödinger-Darstellung erklärt 4 man den Ortsoperator Qj als Multiplikationsoperator Qj := Mxj mit der Funktion xj im Hilbertraum L2 (R3 ) und den Impulsoperator Pj durch den Differentialoperator Pj := −ih̄ ∂x∂ j . Der Hamilton-Operator ergibt sich durch formales Einsetzen“ ” der Operatoren Qj und Pj in die Hamilton-Funktion. Beispiel. Ein Teilchen der Masse m > 0 bewege sich in einem äußeren Kraftfeld F = − grad V mit Potential V . Die Energie ist dann gegeben durch m2 ẋ2 + V (x) , p2 die Hamilton-Funktion also durch H(xj , pj ) = 2m + V (x) . Der Hamilton-Operator sollte also durch die Formel 2 h̄ ∆u(x) + V (x) u(x) Hu(x) = − 2m mit dem Laplace-Operator ∆ = 3 P j=1 ∂2 ∂x2j (3) gegeben sein. Ziele der Quantenmechanik. a) Aus Ausdrücken wie (6) ist zunächst ein selbstadjungierter Operator zu bilden; dies kann durchaus eine schwierige Aufgabe sein. b) Anschließend ist das Spektrum des selbstadjungierten Operators zu studieren und die Spektralzerlegung zu berechnen. Stationäre Zustände beispielsweise sind genau die Eigenvektoren des Hamilton-Operators. c) Schließlich lässt sich die Schrödinger-Gleichung dann mittels Formel (5) lösen. Es ist das Ziel dieser Vorlesung, die angesprochenen Begriffe und Resultate mathematisch exakt zu entwickeln. Es werden keine Vorkenntnisse aus der Physik benötigt; erforderlich sind mathematische Vorkenntnisse aus den Vorlesungen Analysis I-III / Lineare Algebra I oder Höhere Mathematik I-III. Hilberträume und Quantenmechanik Inhalt: 5 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 10. 13. 14. 15. 16. Hilberträume Beschränkte lineare Operatoren Fourier-Reihen und der Satz von Fejér Orthonormalbasen Beschränkte lineare Operatoren auf Hilberträumen Konsequenzen aus dem Satz von Baire Schwache Konvergenz Grundlagen der Spektraltheorie Abgeschlossene und abschließbare Operatoren Symmetrische und selbstadjungierte Operatoren Kompakte Operatoren und Fredholmoperatoren Kompakte normale Operatoren Spektralzerlegungen und Quantenmechanik Distributionen und Fourier-Transformation Friedrichs-Fortsetzung und harmonischer Oszillator Observable und symmetrische Störungen 6 Literatur GGK I. Gohberg, S. Goldberg, M.A. Kaashoek: Basic Classes of Linear Operators. Birkhäuser, Basel-Boston 2003. KA W. Kaballo: Einführung in die Analysis I – III. Spektrum-Verlag, Heidelberg-Berlin 2000, 1997, 1999. KFA W. Kaballo: Grundkurs Funktionalanalysis. Spektrum-Verlag, Heidelberg-Berlin 2011. KFO W. Kaballo: Aufbaukurs Funktionalanalysis und Operatortheorie. Spektrum-Verlag, Heidelberg-Berlin 2014. Mau K. Maurin: Methods of Hilbert Spaces. Polish Scientific Publishers, Warschau 1972. No W. Nolting: Grundkurs Theoretische Physik 5/1: Quantenmechanik. Springer, Berlin-Heidelberg 2004. RS M. Reed, B. Simon: Methods of Mathematical Physics I: Functional Analysis. Academic Press New York 1972. Sch F. Schwabel: Quantenmechanik. Springer, Berlin-Heidelberg 2005. Tr H. Triebel: Höhere Analysis. Deutscher Verlag der Wissenschaften, Berlin 1972. Wei J. Weidmann: Lineare Operatoren in Hilberträumen. Teubner, Stuttgart 1994. 7 Einleitung Zur physikalischen Beschreibung atomarer Teilchen entwickelten E. Schrödinger und W. Heisenberg 1925/26 unabhängig voneinander zwei verschieden aussehende Theorien der Quantenmechanik. Diese stellten sich bald als isomorph“ heraus und lassen ” sich als spezielle Realisierungen abstrakterer Begriffsbildungen interpretieren: Zustände und Observable. a) Ein (reiner) Zustand eines quantenmechanischen Systems wird durch einen Einheitsvektor x ∈ H in einem separablen Hilbertraum H beschrieben. Dabei beschreiben alle Vektoren αx mit | α | = 1 den gleichen Zustand. b) Eine beobachtbare Größe oder Observable eines quantenmechanischen Systems wie etwa Ort, Impuls oder Energie wird durch einen selbstadjungierten Operator im Hilbertraum H beschrieben. c) Die Menge aller möglichen Messergebnisse einer Observablen A ist durch das Spektrum σ(A) ⊆ R des Operators gegeben. Für einen Zustand x ∈ D(A) im Definitionsbereich des Operators ist die Zahl h Ax|x i ∈ R der Mittelwert oder Erwartungswert von A in x . Die Quantenmechanik sagt jedoch das Messergebnis i. a. nicht exakt voraus, sondern gibt nur“ Wahrscheinlichkeiten dafür an, dass dieses in ” eine vorgegebene (Borel-messbare) Teilmenge des Spektrums fällt. Die zeitliche Entwicklung eines quantenmechanischen Systems wird beschrieben durch Hamilton-Operator und Schrödinger-Gleichung. Zu einem quantenmechanischen System gehört ein eindeutig bestimmter selbstadjungierter Operator, der Hamilton-Operator H . Ist x(t) ∈ D(H) der Zustand des Systems zur Zeit t ∈ R , so gilt die Schrödinger-Gleichung ẋ(t) = − h̄i Hx(t) , x(0) = x0 ∈ D(H) , (4) mit der Planckschen Konstanten 2πh̄ > 0 und einem Anfangszustand x0 ∈ D(H) . Dies ist eine Evolutionsgleichung mit der eindeutig bestimmten Lösung t x(t) = e−i h̄ H x0 . (5) Quantisierung. a) Zur Konstruktion des“ Hamilton-Operators bestimmt man ” zunächst die klassische Hamilton-Funktion des Systems und gewinnt daraus mittels einer Übersetzungsvorschrift (Quantisierung) den“ Hamilton-Operator. Hei” senbergs Quantisierung liefert unendliche Matrizen, die im Raum ℓ2 der quadratsummierbaren Folgen operieren, Schrödingers Quantisierung (i. a. singuläre elliptische) Differentialoperatoren, die in einem Hilbertraum L2 quadratintegrierbarer Funktionen operieren. In dieser Vorlesung befassen wir uns nur mit Schrödingers Quantisierung. b) Ein Teilchen im Raum wird in der klassischen Physik durch Ortskoordinaten x1 , x2 , x3 und zugehörige Impulse p1 , p2 , p3 sowie die die Energie repräsentierende Hamilton-Funktion H(xj , pj ) beschrieben. In der Schrödinger-Darstellung erklärt 8 man den Ortsoperator Qj als Multiplikationsoperator Qj := Mxj mit der Funktion xj im Hilbertraum L2 (R3 ) und den Impulsoperator Pj durch den Differentialoperator Pj := −ih̄ ∂x∂ j . Der Hamilton-Operator ergibt sich durch formales Einsetzen“ ” der Operatoren Qj und Pj in die Hamilton-Funktion. Beispiel. Ein Teilchen der Masse m > 0 bewege sich in einem äußeren Kraftfeld F = − grad V mit Potential V . Die Energie ist dann gegeben durch m2 ẋ2 + V (x) , p2 die Hamilton-Funktion also durch H(xj , pj ) = 2m + V (x) . Der Hamilton-Operator sollte also durch die Formel 2 h̄ ∆u(x) + V (x) u(x) Hu(x) = − 2m mit dem Laplace-Operator ∆ = 3 P j=1 ∂2 ∂x2j (6) gegeben sein. Ziele der Quantenmechanik. a) Aus Ausdrücken wie (6) ist zunächst ein selbstadjungierter Operator zu bilden; dies kann durchaus eine schwierige Aufgabe sein. b) Anschließend ist das Spektrum des selbstadjungierten Operators zu studieren und die Spektralzerlegung zu berechnen. Stationäre Zustände beispielsweise sind genau die Eigenvektoren des Hamilton-Operators. c) Schließlich lässt sich die Schrödinger-Gleichung dann mittels Formel (5) lösen. Es ist das Ziel dieser Vorlesung, die angesprochenen Begriffe und Resultate mathematisch exakt zu entwickeln. Es werden keine Vorkenntnisse aus der Physik benötigt; erforderlich sind mathematische Vorkenntnisse aus den Vorlesungen Analysis I-III / Lineare Algebra I oder Höhere Mathematik I-III. 1 Hilberträume 1 I. Hilberträume und beschränkte lineare Operatoren 1 Hilberträume 1.1 Skalarprodukte. Es sei H ein Vektorraum über K = R oder K = C . a) Eine Abbildung h | i : H × H → K heißt Halbskalarprodukt auf H , falls gilt: hαx1 + x2 |yi = αhx1 |yi + hx2 |yi , hx|yi = hy|xi , hx|xi ≥ 0 , α ∈ K , x1 , x2 , y ∈ H , x, y ∈ H , x∈H. (1) (2) (3) b) Gilt zusätzlich hx|xi > 0 für x 6= 0 , so heißt h | i definit und dann ein Skalarprodukt auf H . Ein Raum H mit Skalarprodukt h | i heißt Prä-Hilbertraum. c) Für x, y ∈ E gilt nach (1) und (2) die binomische Formel“ ” hx + y|x + yi = hx|xi + 2 Re hx|yi + hy|yi . (4) 1.2 Satz (Schwarzsche Ungleichung). Es sei h | i ein Halbskalarprodukt auf H . Für alle x, y ∈ H gilt dann | hx|yi |2 ≤ hx|xi · hy|yi . (5) Beweis. Für alle λ ∈ K gilt nach (3) und (4) 0 ≤ hλx + y|λx + yi = | λ |2hx|xi + 2 Re hλx|yi + hy|yi . hy|xi Aus hx|xi = 0 folgt dann auch hx|yi = 0 ; im Fall hx|xi = 6 0 setzt man λ = − hx|xi und erhält (5) aus 0 ≤ | hx|yi |2 | hx|yi |2 hx|xi − 2 + hy|yi . hx|xi2 hx|xi 1.3 Hilberträume und Banachräume. a) Für ein Halbskalarprodukt h | i wird durch k x k := q hx|xi für x ∈ H (6) eine Halbnorm auf H definiert. Dies bedeutet k αx k = | α | k x k für α ∈ K und x ∈ H , (7) kx + yk ≤ kxk + kyk (8) kxk ≥ 0. (Dreiecks-Ungleichung), (9) 2 I. Hilberträume und beschränkte lineare Operatoren Im Fall eines Skalarprodukts gilt zusätzlich k x k > 0 für k x k 6= 0 ; dann handelt es sich um eine Norm. b) In der Tat folgt die Dreiecks-Ungleichung (8) wegen (4) und (5) aus k x + y k2 ≤ k x k2 + 2k x kk y k + k y k2 = (k x k + k y k)2 . c) Auch Normen, die nicht durch ein Skalarprodukt definiert werden können, spielen eine wichtige Rolle. Ein Vektorraum X mit einer Norm k k heißt normierter Raum. d) Ein normierter Raum X heißt vollständig oder Banachraum, wenn jede CauchyFolge in X konvergiert. Ein Prä-Hilbertraum, der unter der Norm aus (6) vollständig ist, heißt Hilbertraum. 1.4 Endlichdimensionale Räume. Auf dem Raum Kn wird durch hx|yi := n P j=1 xj yj für x = (xj ) , y = (yj ) ∈ Kn , (10) ein Skalarprodukt definiert; die entsprechende Norm gemäß (6) ist gegeben durch | x | = k x k2 = ( n P j=1 | xj |2 ) 1/ 2 . (11) Wir schreiben ℓn2 (K) oder einfach ℓn2 für diesen Hilbertraum. 1.5 Raum der quadratsummierbaren Folgen. Auf dem Folgenraum ℓ2 := {x = (xj )j∈N0 | j=0 wird durch hx|yi := ∞ P j=0 xj yj ∞ P | xj |2 < ∞} (12) für x = (xj ) , y = (yj ) ∈ ℓ2 , (13) ein Skalarprodukt definiert; für x, y ∈ ℓ2 ist in der Tat aufgrund der Schwarzschen Ungleichung für endliche Summen die Reihe in (13) absolut konvergent. Die entsprechende Norm gemäß (6) ist gegeben durch k x k2 = ( ∞ P j=0 | xj |2 ) 1/ 2 . (14) 1.6 Satz. Der Folgenraum ℓ2 ist vollständig, also ein Hilbertraum. (n) (n) (m) Beweis. Es sei (x(n) ) = ((xj )) eine Cauchy-Folge in ℓ2 . Wegen | xj − xj | ≤ (n) k x(n) − x(m) k2 sind die Folgen (xj ) für festes j ∈ N0 Cauchy-Folgen in K . Somit (n) existieren die Grenzwerte xj := lim xj ∈ K . Zu ε > 0 gibt es n0 ∈ N mit n→∞ ℓ P j=0 (n) (m) 2 | xj − xj | ≤ k x(n) − x(m) k22 ≤ ε2 für feste ℓ ∈ N0 und alle n, m ≥ n0 . Mit m → ∞ folgt auch ℓ P j=0 (n) | xj − xj |2 ≤ ε2 für n ≥ n0 und alle ℓ ∈ N0 . Für die Folge x := (xj ) gilt also x(n) − x ∈ ℓ2 und k x(n) − x k2 ≤ ε für n ≥ n0 , und daraus ergibt sich auch x ∈ ℓ2 sowie k x(n) − x k2 → 0 . 3 3 1 Hilberträume 1.7 Banachräume p -summierbarer Folgen. Auf dem Folgenraum ℓp := {x = (xj )j∈N0 | wird für 1 ≤ p < ∞ durch k x kp = ( ∞ P j=0 | xj |p ) ∞ P j=0 | xj |p < ∞} (15) 1/ p (16) eine Norm definiert; die Dreiecks-Ungleichung (8) heißt in diesem Fall Minkowskische Ungleichung. Der Beweis von Satz 1.6 zeigt, dass auch die Räume ℓp vollständig sind. 1.8 Banachräume beschränkter Funktionen. a) Auf dem Vektorraum B(M) = ℓ∞ (M) aller auf einer Menge M beschränkten Funktionen wird die SupremumsNorm oder sup-Norm erklärt durch k f ksup := k f k∞ := k f kM := sup | f (t) | , t∈M f ∈ B(M) . (17) b) Die sup-Norm beschreibt die gleichmäßige Konvergenz von Funktionenfolgen; für eine Folge (fn ) in B(M) , eine Funktion f ∈ B(M) und ε > 0 gilt in der Tat k f − fn ksup ≤ ε ⇔ ∀ t ∈ M : | f (t) − fn (t) | ≤ ε . c) Für eine abzählbare Menge M ist ℓ∞ (M) ein Folgenraum; speziell hat man die Notation ℓ∞ = ℓ∞ (N0 , K) . d) Auch die Räume ℓ∞ (M) sind vollständig; dies ergibt sich wie in Satz 1.6. 1.9 Stetige Funktionen. Es seien X , Y normierte Räume und M ⊆ X . Eine Abbildung f : M → Y heisst stetig in a ∈ M , falls eine der folgenden äquivalenten Bedingungen erfüllt ist (mit Uδ (a) = {x ∈ X | k x − a k < δ} bezeichnen wir die offene Kugel mit Radius δ > 0 um a ∈ X ): ∀ ε > 0 ∃ δ > 0 ∀ x ∈ M : k x − a k < δ ⇒ k f (x) − f (a) k < ε , (18) ∀ ε > 0 ∃ δ > 0 : f (Uδ (a) ∩ M) ⊆ Uε (f (a)) , (19) xn → a ⇒ f (xn ) → f (a) für jede Folge (xn ) in M . (20) Weiter heisst f stetig auf M , falls f in jedem Punkt von M stetig ist. C(M, Y ) bezeichnet die Menge aller stetigen Abbildungen von M nach Y , und wir schreiben einfach C(M) = C(M, K) . 1.10 Gleichmäßige Stetigkeit. a) Eine Abbildung f : M → Y heisst gleichmäßig stetig auf M , falls gilt ∀ ε > 0 ∃ δ > 0 ∀ x1 , x2 ∈ M : k x1 −x2 k < δ ⇒ k f (x1 )−f (x2 ) k < ε . (21) Gleichmäßige Stetigkeit bedeutet also, dass in der Stetigkeitsbedingung (18) für alle Punkte die gleiche Zahl δ = δ(ε) > 0 gewählt werden kann. b) Gleichmäßig stetige Abbildungen sind natürlich stetig. Die Funktionen t 7→ (0, 1) oder t 7→ t2 auf [0, ∞) sind stetig, aber nicht gleichmäßig stetig. 1 t auf c) Gleichmäßig stetige Abbildungen bilden Cauchy-Folgen wieder in Cauchy-Folgen ab; für nur stetige Abbildungen ist dies i. a. nicht richtig. 4 I. Hilberträume und beschränkte lineare Operatoren 1.11 Distanzfunktionen. Es seien X ein normierter Raum und M ⊆ X . Für x ∈ X wird die Distanz von x zu M durch dM (x) := inf {k x − a k | a ∈ M} (22) definiert. Es seien x, y ∈ X mit k x − y k > 0 und ε > 0 . Man wählt a ∈ M mit k x − a k < dM (x) + εk x − y k und erhält dM (y) ≤ k y − a k ≤ | y − x | + k x − a k ≤ dM (x) + (1 + ε) k x − y k , also dM (y) − dM (x) ≤ (1 + ε) k x − y k . Vertauscht man noch die Rollen von x und y , so ergibt sich mit ε → 0 : | dM (x) − dM (y) | ≤ k x − y k . (23) Insbesondere ist die Funktion dM : X → R gleichmäßig stetig. Es ist d−1 M (0) abge−1 −1 schlossen, und aus M ⊆ dM (0) folgt auch M ⊆ dM (0) . Ist umgekehrt dM (x) = 0 , so gibt es eine Folge (an ) in M mit k x − an k → 0 , und man hat x ∈ M . Somit gilt also dM (x) = 0 ⇔ x ∈ M . 1.12 Kompakte Mengen. Es sei X ein normierter Raum. Eine Menge K ⊆ X heißt kompakt, wenn jede Folge in K eine dort konvergente Teilfolge besitzt. Eine Menge K ⊆ Kn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist (Satz von Bolzano-Weierstraß). In unendlichdimensionalen Räumen gilt nur die Aussage ⇒ “, nicht aber ihre Umkehrung. Beispiele kompakter Mengen in Rn sind ” n Q [aj , bj ] oder abgeschlossene etwa kompakte Intervalle [a, b] , kompakte Quader j=1 n Kugeln Kr (a) = {x ∈ R | | x − a | ≤ r} . 1.13 Satz. Es seien X , Y normierte Räume, M ⊆ X kompakt und f : M → Y stetig. Dann ist f gleichmäßig stetig. Beweis. Ist (21) nicht richtig, so gilt ∃ ε > 0 ∀ n ∈ N ∃ xn , yn ∈ M : k xn − yn k < 1 n , k f (xn ) − f (yn ) k ≥ ε . Nun hat (xn ) eine Teilfolge xnj → a ∈ M ; wegen k xn −yn k < n1 gilt auch ynj → a . Da f in a stetig ist, gilt f (xnj ) → f (a) und auch f (ynj ) → f (a) , und man erhält den Widerspruch k f (xnj ) − f (ynj ) k ≤ k f (xnj ) − f (a) k + k f (a) − f (ynj ) k → 0 . 3 1.14 Banachräume stetiger Funktionen. a) Für eine kompakte Menge K ist jede stetige Funktion f ∈ C(K) auf K beschränkt (und nimmt ihr Maximum und ihr Minimum an). Somit ist der Raum C(K) ein Unterraum von ℓ∞ (K) . Dieser ist abgeschlossen und somit ein Banachraum, da sich bei gleichmäßiger Konvergenz die Stetigkeit auf die Grenzfunktion vererbt. b) Bei nur punktweiser Konvergenz ist letzteres i. a. nicht der Fall, wie etwa das Beispiel der Funktionenfolge (fn (t) := tn ) in C([0, 1], R) zeigt. 1 Hilberträume 5 1.15 Räume quadratintegrierbarer Funktionen. a) Es sei Ω ⊆ Rn eine (Lebesgue-) messbare Menge (oder allgemeiner (Ω, Σ, µ) ein Maßraum). Auf dem Raum L2 (Ω) := {f : Ω 7→ K | f messbar und R Ω | f (t) |2 dµ < ∞} (24) der quadratintegrierbaren Funktionen auf Ω wird durch hf |gi := R Ω f (t) g(t) dµ (25) ein Halbskalarprodukt definiert; die entsprechende Halbnorm gemäß (6) ist gegeben durch k f k = k f k L2 = ( R Ω | f (t) |2 dµ) 1/ 2 . (26) b) Für eine messbare Funktion gilt k f kL2 = 0 ⇔ f (t) = 0 fast überall (f.ü.); (27) die Menge dieser Nullfunktionen bildet den Vektorraum N (Ω) = {f : Ω 7→ K | f (t) = 0 f.ü.} . (28) 1.16 Halbnormen und Äquivalenzklassen. a) Allgemeiner sei nun (X, k k) ein halbnormierter Raum. Der Kern N := {x ∈ X | k x k = 0} der Halbnorm ist offenbar ein Unterraum von X . Durch x ∼ y :⇔ x − y ∈ N ⇔ k x − y k = 0 (29) wird eine Äquivalenzrelation auf X defininiert. Die Äquivalenzklassen x̃ = {y ∈ X | y ∼ x} = x + N := {x + n | n ∈ N} , x∈X, sind affine Unterräume von X parallel“ zu N . ” b) Offenbar folgt aus x ∼ x′ und y ∼ y ′ auch x + y ∼ x′ + y ′ und αx ∼ αx′ für α ∈ K . Daher kann man auf den Äquivalenzklassen Addition und Skalarmultiplikation durch f , x̃ + ỹ := xg + y , α x̃ := αx x, y ∈ X , α ∈ K , (30) definieren. Diese bilden damit einen Vektorraum, den Quotientenraum X/N . c) Auf diesem Quotientenraum wird durch k x̃ k := k x k , x∈X, (31) dann eine Norm definiert: Aus k x̃ k = 0 folgt nämlich sofort x ∈ N , und somit ist x̃ das Nullelement von X/N . Man nennt ( X/N , k k) den zu (X, k k) assoziierten normierten Raum. 6 I. Hilberträume und beschränkte lineare Operatoren 1.17 Der Raum L2 (Ω) . a) Der zu (L2 (Ω), k kL2 ) assoziierte normierte Raum wird mit L2 (Ω) = L2 (Ω)/N (Ω) bezeichnet; er besteht also aus Äquivalenzklassen fast überall gleicher meßbarer Funktionen. Die L2 -Norm beschreibt die Konvergenz im quadratischen Mittel. In der Notation wird zwischen einer Funktion f ∈ L2 (Ω) und ihrer Äquivalenzklasse f˜ ∈ L2 (Ω) meist nicht unterschieden. b) Nach Konstruktion des Integrals ist der Raum der Treppenfunktionen dicht in L2 (Rn ) . Für eine lokalkompakte Menge Ω ⊆ Rn (z. B. eine offene oder abgeschlossene Menge) und das Lebesgue-Maß gilt dies auch in L2 (Ω) für den Raum Cc (Ω) der stetigen Funktionen auf Ω mit kompaktem Träger (vgl. [KA3], Lemma 6.20) supp f := {t ∈ Ω | f (t) 6= 0} . 1.18 Theorem (Riesz-Fischer). Die Räume L2 (Ω) sind vollständig, also Hilberträume. Das Argument im Beweis von Satz 1.6 ist hier nicht anwendbar, da aus einer CauchyBedingung für eine Folge in L2 (Ω) eine punktweise Cauchy-Bedingung fast überall nicht folgt. Der mittels Satz 1.22 unten folgende Beweis verwendet die Konvergenzsätze der Integrationstheorie und 1.19 Reihen. a) Eine (unendliche) Reihe P ak in einem normierten Raum X heißt konvergent, falls die Folge der Partialsummen (sn := der Reihe ist dann gegeben durch ∞ P k=1 n P k=1 ak ) konvergiert; die Summe ak := s := n→∞ lim sn . b) Eine Reihe P ak heißt absolut konvergent, falls (32) ∞ P k=1 k ak k < ∞ gilt. 1.20 Satz. Ein normierter Raum X ist genau dann vollständig, wenn in X jede absolut konvergente Reihe konvergiert. Beweis. ⇒ “: Für m > n gilt k sm − sn k = k ” ∞ P k=1 m P k=n+1 ak k ≤ m P k=n+1 k ak k ; wegen k ak k < ∞ ist (sn ) eine Cauchy-Folge in E und damit konvergent. ⇐ “: Es sei (sn ) eine Cauchy-Folge in E . Zu ε := 2−j gibt es dann nj ∈ N mit ” k sn − sm k ≤ 2−j für n, m ≥ nj . Man kann nj > nj−1 annehmen. Es sei nun a1 := sn1 und ak := snk − snk−1 für k ≥ 2 ; für die Teilfolge (snj ) von (sn ) gilt dann sn j = j P k=1 ak für alle j ∈ N . Nach Konstruktion ist k ak k ≤ 2−(k−1) für k ≥ 2 , also ∞ P k=1 k ak k < ∞ . Nach Voraussetzung ist (snj ) konvergent, und nach dem folgenden Lemma konvergiert dann auch die Folge (sn ) gegen den gleichen Limes. 3 1 Hilberträume 7 1.21 Lemma. Gegeben sei eine Cauchy-Folge (xn ) in einem normierten Raum X . Hat (xn ) eine konvergente Teilfolge xnj → x ∈ X , so konvergiert auch (xn ) selbst gegen x . Beweis. Zu ε > 0 gibt es n0 ∈ N mit k xn − xm k < ε für n, m ≥ n0 und j0 ∈ N mit k xnj − x k < ε für j ≥ j0 . Man wählt dann m = nj mit j ≥ max {j0 , n0 } und erhält k xn − x k ≤ k xn − xnj k + k xnj − x k < 2ε für n ≥ n0 . 3 Ein Beweis des Satzes von Riesz-Fischer 1.18 ergibt sich nun aus Satz 1.20 und der folgenden L2 -Version“ des Satzes von B. Levi: ” 1.22 Satz. Es sei (gk ) eine Folge in L2 (Ω) mit ∞ P die Reihe k=1 ( k=1 | gk (t) | fast überall, und die Reihe Beweis. a) Für die Funktionen hn := ( R 1 /2 = k Ω hn (t) dµ) n P k=1 n P k=1 ∞ P P k gk kL2 < ∞ . Dann konvergiert k≥1 gk konvergiert in L2 (Ω) . | gk |)2 ∈ L1 (Ω) gilt 0 ≤ hn ≤ hn+1 und | g k | k L2 ≤ ∞ P k=1 k g k k L2 < ∞ für alle n ∈ N . Nach dem Satz über monotone Konvergenz existiert h(t) := lim hn (t) fast überall, und es ist h ∈ L1 (Ω) . n→∞ b) Es folgt ∞ P k=1 | gk (t) | < ∞ fast überall. Daher ist die Funktion g := überall definiert und messbar. Wegen | g − über majorisierte Konvergenz in L2 (Ω) . R Ω |g − n P k=1 n P k=1 ∞ P k=1 gk fast gk |2 ≤ 4h ∈ L1 (Ω) liefert der Satz gk |2 dµ → 0 für n → ∞ , also ∞ P k=1 gk = g 3 Der Beweis von Satz 1.22 liefert sofort diese 1.23 Folgerung. Eine in L2 (Ω) konvergente Folge besitzt eine fast überall konvergente Teilfolge. Dagegen muss eine in L2 (Ω) konvergente Folge selbst nicht fast überall konvergent sein, vgl. etwa [KA3], Beispiel 5.4. 1.24 Räume p -integrierbarer Funktionen. In obigem Beweis wurde der Raum L1 (Ω) aller integrierbaren Funktionen auf Ω benutzt. Für 1 ≤ p < ∞ wird allgemeiner durch Lp (Ω) := {f : Ω 7→ K | f messbar und k f kpLp := R Ω | f (t) |p dµ < ∞} (33) ein halbnormierter Raum definiert, und durch Lp (Ω) = Lp (Ω)/N (Ω) erhält man einen normierten Raum. Wie in Theorem 1.18 ergibt sich dessen Vollständigkeit aus einer Lp -Version“ des Satzes von B. Levi; Lp (Ω) ist also ein Banachraum. ” Wie in 1.17 ist der Raum der Treppenfunktionen dicht in Lp (Rn ) , und für eine lokalkompakte Menge Ω ⊆ Rn gilt dies auch für den Raum Cc (Ω) in Lp (Ω) . 8 I. Hilberträume und beschränkte lineare Operatoren 1.25 Separable Räume. a) Eine Menge M ⊆ X in einem normierten Raum X heißt separabel, falls es in M eine abzählbare dichte Teilmenge gibt. b) Rn ist separabel, da die abzählbare Menge Qn der rationalen n -Tupel in Rn dicht ist. c) Der Hilbertraum ℓ2 ist separabel: Zunächst ist der Raum ϕ := {x = (xj ) | ∃ n ∈ N ∀ j > n : xj = 0} (34) aller endlichen Folgen dicht in ℓ2 . Weiter ist die Menge der endlichen Folgen mit rationalen Folgengliedern abzählbar und dicht in ϕ . d) Auch die Folgenräume ℓp sind für 1 ≤ p < ∞ separabel. e) Die Separabilität des Hilberraums L2 (Rn ) zeigen wir in Satz 4.15. 1.26 Satz. Es seien X ein normierter Raum und K ⊆ X kompakt. a) Für ε > 0 besitzt K ein endliches ε -Netz, d. h. es gibt endlich viele Punkte S a1 , . . . , ar ∈ K mit K ⊆ rj=1 Uε (aj ) . b) Eine kompakte Menge K ist separabel. Beweis. a) Für ein ε > 0 gebe es kein endliches ε -Netz. Dann kann man rekursiv eine Folge (xn ) in M wählen, für die stets xn+1 ∈ M \ (Uε (x1 ) ∪ · · · ∪ Uε (xn )) , also k xn − xm k ≥ ε für n 6= m gilt. Dann besitzt (xn ) keine Cauchy-Teilfolge. b) Für j ∈ N hat K ein endliches abzählbar und dicht in K . 1 j -Netz Nj . Dann ist die Menge A := S∞ j=1 Nj 3 1.27 Satz. Es sei M ⊆ X eine separable Menge. Dann ist auch jede Teilmenge N ⊆ M separabel. Beweis. a) Es sei A ⊆ M eine abzählbare dichte Menge in M . Wir betrachten das System A1 := {Ur (a) | a ∈ A , 0 < r ∈ Q} der offenen Kugeln mit rationalen Radien um Punkte aus A und dessen Teilsystem A2 := {Ur (a) ∈ A1 | Ur (a) ∩ N 6= ∅} ; dann sind A1 und A2 abzählbare Mengen. Für jede Kugel Ur (a) ∈ A2 wählt man ein b ∈ Ur (a) ∩ N und erhält so eine abzählbare Menge B ⊆ N . b) Es seien nun t ∈ N und ε > 0 . Man wählt a ∈ A mit k t−a k < 3ε und r ∈ Q mit ε < r < 2ε . Dann ist t ∈ Ur (a) und somit Ur (a) ∈ A2 ; es gibt also b ∈ B ∩ Ur (a) . 3 Es folgt k t − b k ≤ k t − a k + k a − b k < 3ε + r < ε ; B ist also dicht in N . 3 1.28 Beispiel. Der Folgenraum ℓ∞ ist nicht separabel. In der Tat enthält ℓ∞ die überabzählbare Menge E := {ǫ = (ǫj )∞ j=0 | ǫj = ±1 für j ∈ N} . Man hat k ǫ − ǫ′ k = 2 für ǫ, ǫ′ ∈ E mit ǫ 6= ǫ′ . Nun sei A eine dichte Menge in ℓ∞ . Zu ǫ ∈ E wählt man aǫ ∈ A mit k ǫ − aǫ k < 1 . Dann gilt aǫ 6= aǫ′ für ǫ, ǫ′ ∈ E mit ǫ 6= ǫ′ , und daher kann A nicht abzählbar sein. 2 Beschränkte lineare Operatoren 2 9 Beschränkte lineare Operatoren 2.1 Lineare Operatoren. Es seien E, F Vektorräume über K = R oder K = C . Eine Abbildung T : E 7→ F heißt linear, falls T (α x1 + x2 ) = α T (x1 ) + T (x2 ) für x1 , x2 ∈ E , α ∈ K , gilt. Der Nullraum oder Kern von T , N(T ) = T −1 {0} = {x ∈ E | T (x) = 0} ist ein Unterraum von E , das Bild ( Range“) ” R(T ) = T (E) = {T (x) | x ∈ E} von T ist ein Unterraum von F . 2.2 Satz. Für normierte Räume X, Y und lineare Operatoren T : X 7→ Y sind äquivalent: (a) ∃ C ≥ 0 ∀ x ∈ X : k T (x) k ≤ C k x k . (b) T ist gleichmäßig stetig auf X . (c) T ist in einem Punkt a ∈ X stetig. (d) Es gilt k T k := sup k T (x) k < ∞ . k x k≤1 Beweis. (a) ⇒ (b) “: Man hat k T (x)−T (y) k = k T (x−y) k ≤ C k x−y k aufgrund ” der Linearität von T ; in (1.21) kann also δ = Cε gewählt werden. (b) ⇒ (c) “ ist klar. ” (c) ⇒ (d) “: Zu ε := 1 gibt es δ > 0 mit k x − a k ≤ δ ⇒ k T (x) − T (a) k ≤ 1 . Für ” k x k ≤ 1 gilt dann k (a + δx) − a k ≤ δ , also k T (δx) k = k T (a + δx) − T (a) k ≤ 1 und somit k T (x) k ≤ 1δ . (d) ⇒ (a) “: Für x 6= 0 ist k k xx k k = 1 , also k T ( k xx k ) k ≤ k T k , und daher ist ” k T (x) k ≤ k T k k x k für alle x ∈ E . 3 (1) 2.3 Bemerkungen und Definitionen. a) Eine Menge B ⊆ X heißt beschränkt, wenn es C > 0 mit k x k ≤ C für alle x ∈ B gibt. Nach Satz 2.2 ist also ein linearer Operator T : X 7→ Y genau dann stetig, wenn er die Einheitskugel B = BX von X in eine beschränkte Teilmenge von Y abbildet oder wenn er alle beschränkten Teilmengen von X in beschränkte Teilmengen von Y abbildet. Daher nennt man stetige lineare Operatoren oder Linearformen auch beschränkte lineare Operatoren oder Linearformen. b) Das in 2.2 (d) definierte Supremum k T k ist wegen (1) die minimal mögliche Konstante C in 2.2 (a) und definiert eine Norm auf dem Vektorraum L(X, Y ) aller stetigen linearen Abbildungen von X nach Y . Statt L(X, X) schreibt man einfach L(X) . Der Raum X ′ := L(X, K) heißt Dualraum von X , seine Elemente heißen stetige Linearformen oder stetige lineare Funktionale auf X . 10 I. Hilberträume und beschränkte lineare Operatoren c) Für normierte Räume X , Y , Z und Operatoren T ∈ L(X, Y ) und S ∈ L(Y, Z) T S X −→ Y −→ Z gilt auch S T ∈ L(X, Z) sowie k S T k ≤ k S k k T k für die Komposition dieser Operatoren. Wegen (1) folgt dies sofort aus k ST x k ≤ k S k k T x k ≤ k S k k T k k x k für x ∈ X . 2.4 Satz. a) Es seien X, Y normierte Räume. Mit Y ist dann auch L(X, Y ) vollständig. b) Der Dualraum X ′ eines normierten Raumes X ist ein Banachraum. Beweis. Es sei (Tn ) eine Cauchy-Folge in L(X, Y ) . Für festes x ∈ X gilt dann k Tm (x) − Tn (x) k ≤ k Tm − Tn k k x k ; daher ist (Tn (x)) eine Cauchy-Folge in Y und somit konvergent. Durch T (x) := lim Tn (x) , x ∈ X , n→∞ wird eine lineare Abbildung T : X 7→ Y definiert. Zu ε > 0 gibt es n0 ∈ N mit k Tm (x) − Tn (x) k ≤ k Tm − Tn k k x k ≤ εk x k für n, m ≥ n0 . Mit m → ∞ folgt auch k T (x) − Tn (x) k ≤ εk x k für n ≥ n0 . Somit ist T − Tn , also auch T = (T − Tn ) + Tn stetig, und es gilt k T − Tn k ≤ ε für n ≥ n0 . Folglich konvergiert (Tn ) in L(X, Y ) gegen T ∈ L(X, Y ) . 3 Für einen Hilbertraum H ist L(H) ein Banachraum, der kein Hilbertraum und im Fall dim H = ∞ auch nicht separabel ist. Interessante Beispiele stetiger Linearformen liefert: 2.5 Satz. Es seien K ⊆ Rn kompakt und g ∈ L1 (K) . Durch J(g)(f ) := R K f (t) g(t) dt , f ∈ C(K) , (2) wird ein stetiges lineares Funktional J(g) ∈ C(K)′ definiert mit k J(g) k = R K | g(t) | dt = k g kL1 . (3) Beweis. a) Wegen | J(g)(f ) | ≤ k g kL1 k f ksup gilt k J(g) k ≤ k g kL1 ; es ist also J : L1 (K) 7→ C(K)′ ein stetiger linearer Operator. b) Nun sei zunächst g ∈ C(K) . Zu ε > 0 definiert man f (t) := f ∈ C(K) mit k f ksup ≤ 1 , und es ist J(g)(f ) = R | g(t) |2 K | g(t) |+ε dt ≥ R K | g(t) |2 −ε2 | g(t) |+ε dt ≥ R K (| g(t) | g(t) | g(t) |+ε . Dann ist − ε) dt = k g kL1 − ε λ(K) . Somit gilt die Behauptung (3) für g ∈ C(K) . c) Nach 1.24 ist C(K) dicht in L1 (K) . Es gibt also eine Folge (gj ) in C(K) mit k g − gj kL1 (K) → 0 . Aus a) und b) ergibt sich dann schließlich k J(g) k = lim k J(gj ) k = lim k gj kL1 = k g kL1 . 3 j→∞ j→∞ 2 Beschränkte lineare Operatoren 11 2.6 Satz. Es seien X ein normierter Raum, Y ein Banachraum, V ⊆ X ein Unterraum und T : V 7→ Y eine stetige lineare Abbildung. Dann existiert genau eine stetige Fortsetzung T : V 7→ Y von T , und diese ist linear mit k T k = k T k . Beweis. Es seien x ∈ V und (vn ) eine Folge in V mit k x − vn k → 0 . Falls eine stetige Fortsetzung T von T existiert, so gilt für diese T (x) = lim T (vn ) ; n→∞ (4) sie ist also eindeutig bestimmt. Umgekehrt ist nun wegen k T (vn ) − T (vm ) k = k T (vn − vm ) k ≤ k T k k vn − vm k die Folge (T (vn )) eine Cauchy-Folge in Y , und wegen der Vollständigkeit von Y existiert der Grenzwert lim T (vn ) . n→∞ Für eine weitere Folge (un ) in V mit k x − un k → 0 gilt k T (vn ) − T (un ) k ≤ k T k k vn − un k ≤ k T k (k vn − x k + k x − un k) → 0 , d. h. durch (4) kann T auf V (wohl)definiert werden. Offenbar ist V ein Unterraum von X , und T ist linear. Aus k T (vn ) k ≤ k T k k vn k folgt mit n → ∞ sofort auch k T (x) k ≤ k T k k x k für x ∈ V ; somit ist T stetig, und es gilt k T k ≤ k T k . 3 2.7 Bemerkungen. a) Ist in Satz 2.6 der Operator T : V 7→ Y injektiv, so muß dies nicht für die Fortsetzung T : V 7→ Y von T gelten. b) Ist aber T : V 7→ Y isometrisch, d. h. gilt k T x k = k x k für alle x ∈ V , so gilt dies wegen (4) auch für T : V 7→ Y . Dies wurde im Beweis von Satz 2.5 benutzt. c) Ein Fortsetzungssatz 2.6 gilt auch für nichtlineare gleichmäßig stetige Abbildungen (vgl. [KA2], Aufgabe 16.8). 2.8 Vervollständigungen. a) Ein normierter Raum X kann in einen Banachraum c eingebettet werden, d. h. es gibt eine lineare Isometrie i : X 7→ X c , so daß i(X) X c c in X dicht ist. Aufgrund von Satz 2.6 ist der Raum X bis auf lineare Isometrie eindeutig; er heißt die Vervollständigung von X . c etwa als Menge von Äquivalenzklassen der Cauchy-Folgen in X b) Man kann X konstruieren, analog zu G. Cantors Konstruktion der reellen Zahlen aus den rationalen Zahlen (vgl. [KA2], 15.4); dies liefert eine abstrakte Vervollständigung“ von ” X . Eine konkretere Vervollständigung“ kann man erhalten, indem man X in einen ” konkreten“ vollständigen Raum einbettet und dort abschließt. ” c) Mit dem Skalarprodukt (1.25) ist C[a, b] ein Prä-Hilbertraum mit Vervollständigung L2 [a, b] . c ein Hilbertraum. Man kann diesen als Abschluss d) Für Prä-Hilberträume H ist H einer isometrischen Kopie von H in seinem vollständigen Bidualraum konstruieren: 2.9 Stetige Linearformen auf Hilberträumen. a) Es sei H ein Prä-Hilbertraum. Für y ∈ H wird durch η : x 7→ hx|yi für x ∈ H 12 I. Hilberträume und beschränkte lineare Operatoren wegen (1.1) eine Linearform auf H definiert. Aufgrund der Schwarzschen Ungleichung gilt k η k ≤ k y k , und wegen η(y) = k y k2 ist k η k = k y k . Die Abbildung j = jH : H 7→ H ′ , j(y)(x) := h x|y i , x, y ∈ H , (5) ist eine additive Isometrie von H in H ′ , die im Fall K = R linear und im Fall K = C antilinear ist, d. h. j(αx) = ᾱj(x) erfüllt. b) Die Abbildung ι = ιH : H → H ′′ , x ∈ H , η ∈ H′ , ι(x)(η) := η(x) , (6) von H in den Bidualraum H ′′ ist auch im Fall K = C linear, und es gilt | ι(x)(η) | ≤ k x k k η k , also k ι(x) k ≤ k x k . Wegen ι(x)(j(x)) = j(x)(x) = h x|x i = k x k k j(x) k c := ι (H) eine Verist ιH sogar isometrisch. Da H ′′ ein Banachraum ist, ist H H vollständigung des Prähilbertraums H . Die Norm von ιH (H) wird gemäß (1.6) durch das Skalarprodukt h ι(x1 )|ι(x2 ) i := h x1 |x2 i induziert. Nach Bemerkung 2.7 c) lässt sich dieses auf den Abschluss ιH (H) von ιH (H) in H ′′ stetig fortsetzen, und c := ι (H) ein Hilbertraum. daher ist H H c) Der Rieszsche Darstellungssatz 5.6 besagt, dass jH für Hilberträume H surjektiv ist, und dies gilt dann auch für ιH . Die Konstruktion in b) lässt sich auch für normierte Räume durchführen; dabei verwendet man den Satz von Hahn-Banach (vgl. [KFA], Abschnitt 9.3). 2.10 Abschätzungen für Matrizen-Normen. a) Es seien Y ein normierter Raum und T ∈ L(ℓn2 , Y ) . Für x = (x1 , . . . , xn ) ∈ Kn gilt x = den Einheitsvektoren ej := (δjk )nk=1 . Hier bezeichnet δjk := Kronecker-Symbol. Mittels Schwarzscher Ungleichung folgt k T (x) k = k T ( ≤ ( n P j=1 n P j=1 xj ej ) k = k k T ej k2 ) 1/ 2 ( n P j=1 n P j=1 | xj |2 ) folglich ist T : ℓn2 7→ Y stetig mit k T k ≤ ( n P n P xj T (ej ) k ≤ j=1 1/ 2 j=1 ; k T ej k2 ) 1/ 2 ( n P j=1 xj ej mit 1 , j=k 0 , j 6= k das | xj | k T (ej ) k . b) Eine lineare Abbildung T ∈ L(Kn , Km ) kann eindeutig durch eine Matrix A = (aij ) = M(T ) ∈ M(m, n) = MK (m, n) repräsentiert werden; mittels der Einheitsvektoren werden die Matrixelemente aij ∈ K festgelegt durch T (ej ) = m P i=1 aij ei , j = 1, . . . , n . (7) Im Zusammenhang mit dem Matrizenkalkül schreiben wir ab jetzt Vektoren im Kn stets als Spalten x = (x1 , . . . , xn )⊤ , wobei ⊤“ allgemein die Transposition von Matrizen bezeichnet, bei der Zeilen und ” Spalten vertauscht werden. 2 Beschränkte lineare Operatoren 13 c) Für T ∈ L(Kn , Km ) ist also T (ej ) nach (7) die j -te Spalte der Matrix A = (aij ) , und nach a) ist daher ≤ k A kHS := ( k T kL(ℓn2 ,ℓm 2 ) n P m P j=1 i=1 | aij |2 ) 1/ 2 . (8) Die Zahl k A kHS heißt Hilbert-Schmidt-Norm von A bzw. T . d) Mit der Spaltensummen-Norm und Zeilensummen-Norm m P n k A kSS := max m | aij | , j=1 i=1 k A kZS := max i=1 n P j=1 | aij | (9) der Matrix A = (aij ) = M(T ) ergibt sich eine andere Normabschätzung so: k T x k22 = m P i=1 | n P j=1 ≤ k A kZS aij xj |2 ≤ n m P P i=1 j=1 m P i=1 q n P j=1 | aij |) ( n P j=1 | aij | | xj |2 = k A kZS ≤ k A kZS k A kSS · k x k22 , k T kL(ℓn2 ,ℓm ≤ 2 ) {( also | aij | | xj |2 ) } m n P P j=1 i=1 | aij | | xj |2 k A kZS k A kSS . (10) In den Abschätzungen (8) und (10) gilt i. a. keine Gleichheit, vgl dazu auch [KFA], S. 51/52. Es ist nicht (ohne weiteres) möglich, die Norm k T kL(ℓn2 ,ℓm direkt durch 2 ) die Matrixelemente auszudrücken. 2.11 Beschränkte Matrix-Operatoren auf ℓ2 . a) Geeignete Matrizen A = (aij ) über N0 × N0 definieren beschränkte lineare Operatoren auf ℓ2 . Entsprechende Kriterien ergeben sich leicht aus (8) und (10) mit n, m → ∞ : b) Gilt für die Hilbert-Schmidt-Norm k A kHS := ( ∞ ∞ P P i=1 j=1 | aij |2 ) 1/ 2 < ∞, (11) so wird durch T : x = (xj )j∈N0 7→ ( ∞ P j=0 aij xj )i∈N0 (12) ein Operator T ∈ L(ℓ2 ) definiert mit k T k ≤ k A kHS . c) Gilt für die Zeilensummen-Norm und Spaltensummen-Norm ∞ k A kZS := sup ∞ P i=1 j=1 ∞ | aij | < ∞ und k A kSS := sup ∞ P j=1 i=1 | aij | < ∞ , so wird durch (12) ebenfalls ein Operator T ∈ L(ℓ2 ) definiert mit kT k ≤ q k A kZS k A kSS . (13) 14 I. Hilberträume und beschränkte lineare Operatoren 2.12 Lineare Integraloperatoren. a) Wir untersuchen nun lineare Integraloperatoren R S := Sκ : f 7→ (Sf )(t) := K κ(t, s) f (s) ds , t∈K, (14) die durch stetige Kerne κ ∈ C(K 2 ) über einer kompakten Teilmenge K von Rn definiert werden. Man kann κ(t, s) als kontinuierliches Analogon“ einer quadratischen ” Matrix (aij ) betrachten. In Analogie zu (9) und (13) nennen wir R k κ kSI := sup K s∈K | κ(t, s) | dt und k κ kZI := sup t∈K R K | κ(t, s) | ds (15) die Spaltenintegral-Norm und Zeilenintegral-Norm des Kerns κ . Offenbar gilt stets k κ kSI ≤ λ(K) k κ ksup und k κ kZI ≤ λ(K) k κ ksup . b) Der Integraloperator S = Sκ aus (14) bildet L2 (K) in C(K) ab. Wegen der Kompaktheit von K ist κ nach Satz 1.13 gleichmäßig stetig auf K 2 ; zu ε > 0 gibt es also δ > 0 mit | κ(t1 , s) − κ(t2 , s)) | ≤ ε für | t1 − t2 | ≤ δ und alle s ∈ K . Daraus ergibt sich dann für | t1 − t2 | ≤ δ | Sf (t1) − Sf (t2 ) | ≤ R K | κ(t1 , s) − κ(t2 , s)) | | f (s) | ds q ≤ ε k f kL1 ≤ ε λ(K) k f kL2 . (16) c) Nach der Schwarzschen Ungleichung hat man | Sf (t) | ≤ ( R K | κ(t, s) |2 ds) k Sf ksup ≤ (sup t∈K R K 1/ 2 k f k L2 , | κ(t, s) |2 ds) 1/ 2 also k f k L2 . (17) Es gelten Normabschätzungen analog zu (8) und (10): 2.13 Satz. Für den Integraloperator S = Sκ aus (14) gelten die Abschätzungen k Sκ f kL2 ≤ k κ kL2 (K 2 ) · k f kL2 , f ∈ L2 (K) , 1/ 1/ k Sκ f kL2 ≤ k κ kZI2 k κ kSI2 · k f kL2 , (18) f ∈ L2 (K) . (19) Beweis. a) Abschätzung (18) ergibt sich aus der Schwarzschen Ungleichung: R K R R | Sκ f (t) |2 dt = K | K κ(t, s) f (s) ds |2 dt R R R ≤ K ( K | κ(t, s) |2 ds K | f (s) |2 ds) dt . b) Für (19) schätzen wir wiederum mit der Schwarzschen Ungleichung und dem Satz von Fubini-Tonelli wie im Beweis von (10) ab: R K | Sκ f (t) |2 dt ≤ ≤ ≤ ≤ ≤ R R { K | κ(t, s) | /2 (| κ(t, s) | /2 | f (s) |) ds}2 dt R R R 2 K { K | κ(t, s) | ds K | κ(t, s) | | f (s) | ) ds)} dt R R k κ kZI K K | κ(t, s) | | f (s) |2 ds dt R R k κ kZI K K | κ(t, s) | dt | f (s) |2 ds R k κ kZI k κ kSI K | f (s) |2 ds . 3 K 1 1 2 Beschränkte lineare Operatoren 15 2.14 Messbare Kerne. Satz 2.13 gilt auch für Integraloperatoren (14) mit nur messbaren Kernen κ : Ω × Ω 7→ K auf Maßräumen Ω ; die Existenz der vorkommenden Integrale muss dann aber sorgfältiger begründet werden. Die Suprema in (15) sind als wesentliche Suprema zu interpretieren, und das Maß wird als σ -endlich vorausgesetzt. Dies bedeutet, dass es eine Folge (Ωj ) messbarer Teilmengen von Ω mit µ(Ωj ) < ∞ und Ω = ∞ S j=1 Ωj gibt; diese Bedingung wird für den Satz von Tonelli benötigt. Wir verweisen auf [KFA], Sätze A.3.18 – A.3.20. 16 3 I. Hilberträume und beschränkte lineare Operatoren Fourier-Reihen und der Satz von Fejér 3.1 Überlagerung harmonischer Schwingungen. a) Schwingungsphänomene werden durch periodische Funktionen beschrieben. Für die Periode 2π hat man die Grundschwingungen sin t und cos t , aber auch die Oberschwingungen sin kt und cos kt für k ≥ 2 . b) Man versucht nun, möglichst allgemeine 2π -periodische Funktionen als Überlagerungen dieser harmonischen Schwingungen zu schreiben, d. h. als Fourier-Reihen 1 a 2 0 ∞ P + k=1 ak , bk ∈ C , t ∈ R . (ak cos kt + bk sin kt ) , (1) Nach der Eulerschen Formel eit = cos t + i sin t ist es äquivalent, Reihen der Form ∞ P k=−∞ ck eikt , ck ∈ C , t ∈ R , zu betrachten, deren Konvergenz über die Partialsummen (sn (t) := n P k=−n niert sei. Die Koeffizienten hängen folgendermaßen zusammen: ck ( ck eikt ) defi- 1 2 (ak − ibk ) , k > 0 1 = a , k=0 , 2 0 1 (a + ib ) , k < 0 −k −k 2 (2) ak = (ck + c−k ) , k≥0 . bk = i (ck − c−k ) , k ≥ 1 d) Es sei nun die Reihe f (t) := ∞ P k=−∞ P ikt k∈Z ck e ck eikt , (3) auf R gleichmäßig konvergent. Dann wird durch t ∈ R, (4) eine stetige und 2π - periodische Funktion f ∈ C2π := C2π (R, C) definiert. Mittels Restriktion und Fortsetzung kann man für festes τ ∈ R den Raum C2π mit dem Unterraum C2π [τ − π, τ + π] := {f ∈ C[τ − π, τ + π] | f (τ − π) = f (τ + π)} von C[τ − π, τ + π] identifizieren. d) Die folgenden Orthogonalitätsrelationen rechnet man sofort nach: Für m, n ∈ Z gilt 1 2π Rπ −π int −imt e e dt = δnm = ( 1 , n=m . 0 , n 6= m (5) Damit lassen sich in (4) die Koeffizienten cm aus der Funktion f zurückgewinnen: 1 2π Rπ −π f (t)e−imt dt = ∞ P k=−∞ 1 ck 2π Rπ −π eikt e−imt dt = ∞ P k=−∞ ck δkm = cm . 17 3 Fourier-Reihen und der Satz von Fejér 3.2 Definition. Für f ∈ L1 [−π, π] sei fb(k) := Rπ 1 2π −π f (s) e−iks ds , k ∈ Z, (6) der k-te Fourier-Koeffizient von f , und P f (t) ∼ k∈Z fb(k) eikt (7) sei die zu f assoziierte Fourier-Reihe. 3.3 Bemerkungen. a) Wie in 3.2 kann man auch die Fourier-Reihe einer Funktion f definieren, die auf irgendeinem Intervall der Länge 2π Lebesgue-integrierbar ist. Mit fe bezeichnen wir deren 2π - periodische Fortsetzung auf R . b) Das Symbol ∼“ in (7) behauptet zunächst keinerlei Konvergenz der Reihe. ” Konvergiert die Reihe aber auf einem Intervall der Länge 2π , so konvergiert sie auf ganz R gegen eine 2π -periodische Funktion. c) Für gerade bzw. ungerade Funktionen f ∈ L1 [−π, π] berechnet man die FourierReihe zweckmäßigerweise in der Form (1), da dann die bk bzw. ak dort verschwinden. Aus (3) und (2) folgt ak = 1 π bk = 1 π Rπ −π Rπ −π f (s) cos ks ds , k ∈ N0 , f (s) sin ks ds , k ∈ N. 3.4 Beispiel. ( Es wird die Fourier-Reihe der Funktion h ∈ L∞ [0, 2π] berechnet, die π−t , 0 < t < 2π e ungerade ist, gilt a = 0 , 2 durch h(t) := definiert sei. Da h k 0 , t = 0 , 2π und man hat bk = = 1 π R 2π 0 1 2π (s Folglich gilt h(t) ∼ Wegen ∞ P k=1 1 k ∞ P k=1 π−s 2 1 sin ks ds = − 2π 2π cos ks )− k 0 sin kt k R 2π 1 2π 0 R 2π cos ks k 0 s sin ks ds ds = 1 2πk 2π cos 2πk = 1 k . . (8) = ∞ ist es zunächst unklar, ob diese Reihe (gegen h ) konvergiert. 3.5 Dirichlet-Kerne. a) Es sei f ∈ L1 [−π, π] . Für die Partialsummen sn (f ; t) := n P k=−n fb(k)eikt , t ∈ R, (9) der Fourier-Reihe gilt die Darstellung sn (f ; t) = 1 2π Rπ −π Dn (t − s) f (s) ds , t ∈ R, (10) mit den geraden, stetigen und 2π - periodischen Dirichlet-Kernen Dn (u) = sin (2n + 1) u2 sin u2 , u∈R ( Dn (2kπ) = 2n + 1 ) . (11) 18 I. Hilberträume und beschränkte lineare Operatoren b) In der Tat gilt nach (2) und (9) sn (f ; t) = = Dn (u) = n P 1 2π Rπ −π f (s) e−iks ds eikt = k=−n 1 Rπ Dn (t 2π −π n P iku e 1 2π − s) f (s) ds mit = 1+2 k=−n n P Rπ cos ku = k=1 −π f (s) n P eik(t−s) ds k=−n sin((2n+1) u2 ) sin u 2 , wobei man die letzte Formel durch Induktion oder mit Hilfe der Eulerschen Formel beweisen kann (vgl. etwa [KA1], 37.5). 3.6 Cesàro-Konvergenz. Eine Reihe Folge (σn := 1 n+1 n P j=0 P k≥0 ak heißt Cesàro-konvergent, wenn die sj ) der arithmetischen Mittel der Partialsummen sn konvergiert. In diesem Fall heißt C- ∞ P k=0 ak := n→∞ lim σn die Cesàro-Summe der Reihe. 3.7 Bemerkungen und Beispiel. a) Eine konvergente Reihe ist auch Cesàrokonvergent; Summe und Cesàro-Summe stimmen dann überein. b) Für die divergente Reihe P k≥0 (−1) k hat man offenbar (sj ) = (1, 0, 1, 0, . . .) und (σn ) = (1, 12 , 32 , 21 , 53 , . . .) ; sie ist Cesàro-konvergent mit C- ∞ P (−1)k = lim σn = k=0 n→∞ 1 2 . c) Die Umkehrung von a) ist also i. a. falsch; sie gilt jedoch, wenn eine Abschätzung | ak | = O( k1 ) vorliegt (vgl. [KA1], 38.19). 3.8 Fejér-Kerne. a) Wie untersuchen nun die Cesàro-Konvergenz von FourierReihen. Dazu definieren wir die Fejér-Kerne Fn ∈ C2π als arithmetische Mittel der Dirichlet-Kerne: Fn (u) := 1 n n−1 P j=0 u ∈ R. Dj (u) , (12) Für die arithmetischen Mittel σn (f ; t) := 1 n n−1 P j=0 sj (f ; t) (13) der Partialsummen sn (f ; t) der Fourier-Reihe von f ∈ L1 [−π, π] gilt dann σn (f ; t) = 1 2π Rπ −π Fn (t − s)f (s) ds, , t ∈ R. (14) 3.9 Satz. a) Für die Fejér-Kerne Fn ∈ C2π gilt 1 Fn (u) = n sin nu 2 u sin 2 !2 , u∈R ( Fn (2kπ) = n ) . b) Es ist Fn gerade und Fn ≥ 0 ; weiter gilt 1 2π Rπ −π lim Fn (u) du = 1 , sup Fn (u) = 0 n→∞ η≤|u|≤π für alle η > 0 . (15) (16) (17) 3 Fourier-Reihen und der Satz von Fejér 19 Beweis. a) Formel (15) ergibt sich aus 2 sin2 = n−1 P j=0 u 2 n−1 P j=0 n−1 P Dj (u) = j=0 2 sin u2 sin (2j + 1) u2 ( cos ju − cos(j + 1)u) = 1 − cos nu = 2 sin2 nu 2 . b) Die ersten Aussagen folgen sofort aus a). Setzt man f = 1 in (10), so ergibt sich 1 Rπ Dn (u) du = 1 und daher (16). Schließlich gibt es α > 0 mit sin2 u2 ≥ α > 0 2π −π für η ≤ |u| ≤ π , und daraus folgt sup Fn (u) ≤ α1n → 0 . 3 η≤|u|≤π 3.10 Theorem (Fejér). Für f ∈ C2π gilt σn (f ; t) → f (t) gleichmäßig auf R . Beweis. a) Für t ∈ R folgt aus (14) mit der Substitution s = t − u auch 1 σn (f ; t) = − 2π R t−π t+π Fn (u) f (t − u) du = 1 2π Rπ −π Fn (u) f (t − u) du . (18) b) Zu ε > 0 gibt es η > 0 mit | f (t) − f (t − u) | ≤ ε für t ∈ R und | u | ≤ η , da ja f ∈ C2π gleichmäßig stetig ist. Nach (17) gibt es n0 ∈ N mit sup Fn (u) ≤ ε für η≤|u|≤π n ≥ n0 . Damit ergibt sich R π 1 | f (t) − σn (f ; t) | = | 2π −π Fn (u) (f (t) − f (t − u)) du | 1 Rη ≤ 2π −η Fn (u) | f (t) − f (t − u) | du 1 R + 2π η≤| u |≤π Fn (u) | f (t) − f (t − u) | du 1 ≤ ε 2π ≤ ε (1 Rη −η + π1 für n ≥ n0 und alle t ∈ R . 1 Fn (u) du + ε 2π Rπ −π | f (u) | du) R η≤| u |≤π | f (t) − f (t − u) | du 3 Wir zeigen in Satz 6.7, daß dieses Theorem für die Folge (sn (f ; t)) der Partialsummen der Fourier-Reihe nicht gilt; für f ∈ C2π ist die Folge (sn (f ; t)) i. a. nicht einmal punktweise konvergent. 3.11 Einseitige Grenzwerte. Wir zeigen nun, daß für L1 -Funktionen f noch σn (f ; t) → f (t) in Stetigkeitspunkten von f gilt. Existieren allgemeiner für t ∈ R die einseitigen Grenzwerte fe(t+ ) := lim+ fe(s) , s→t so definiert man f ∗ (t) := 1 2 fe(t− ) := lim− fe(s) , (fe(t+ ) + fe(t− )) s→t (19) als ihren Mittelwert. In Stetigkeitspunkten von fe gilt natürlich f ∗ (t) = fe(t) . Für e die Funktion h aus Beispiel 3.4 gilt h∗ (t) = h(t) auch in den Sprungstellen. 3.12 Satz (Fejér). Für f ∈ L1 (−π, π] und t ∈ R mögen die einseitigen Grenzwerte fe(t+ ) und fe(t− ) existieren. Dann gilt σn (f ; t) → f ∗ (t) . 20 I. Hilberträume und beschränkte lineare Operatoren Beweis. Da die Fn gerade Funktionen sind, gilt von Theorem 3.10 folgt daher 1 2 fe(t− ) − 1 2π Rπ Fn (s) fe(t − s) ds = 0 1 2π für n → ∞ und ebenso R0 −π 1 2π Rπ 1 2π Rπ 0 0 Fn (u) du = 12 . Wie im Beweis Fn (s) (fe(t− ) − fe(t − s)) ds → 0 Fn (s) fe(t − s) ds → 1 2 fe(t+ ) . 3 3.13 Folgerungen und Beispiele. a) Ist in der Situation von Satz 3.12 die FourierReihe von f an der Stelle t ∈ R konvergent, so gilt ∞ P k=−∞ fb(k) eikt = f ∗ (t) . b) Satz 3.12 gilt insbesondere für die Funktion h aus Beispiel 3.4. Für t = π2 ist ihre Fourier-Reihe die nach dem Leibniz-Kriterium konvergente Leibniz-Reihe, und somit hat man deren Summe berechnet: ∞ P k=0 (−1)k 2k+1 = 1 − 13 + 51 − 71 + · · · = h( π2 ) = π 4 . c) Nach dem Dirichlet-Kriterium (vgl. etwa [KA1], 38.4) konvergiert die FourierReihe von h sogar für alle t ∈ R ; a) impliziert dann die Gleichheit in (8). Der Satz von Fejér 3.10 impliziert, daß stetige 2π-periodische Funktionen gleichmäßig durch trigonometrische Polynome in T approximiert werden können. Daraus folgt leicht auch die folgende wichtige Aussage über die gleichmäßige Approximation stetiger Funktionen durch Polynome : 3.14 Theorem (Weierstraßscher Approximationssatz). Es seien J ⊆ R ein kompaktes Intervall, f ∈ C(J, C) und ε > 0 . Dann gibt es ein Polynom P ∈ C[t] mit k f − P kJ = sup | f (t) − P (t) | ≤ ε . t∈J Beweis. Nach einer linearer Transformation können wir J ⊆ (−π, π) annehmen und setzen f zu einer stetigen Funktion in C2π fort. Nach dem Satz von Fejér 3.10 gibt es ein m ∈ N und Zahlen (ck )−m≤k≤m ⊆ C mit sup | f (t) − t∈J m P k=−m ck eikt | ≤ ε 2 . Aufgrund der auf J gleichmäßig konvergenten Entwicklung eikt = ℓ=0 nk ∈ N mit sup | ck | | eikt − t∈J Mit P (t) := ∞ P m P k=−m ck nk P ℓ=0 nk P ℓ=0 (ikt)ℓ ℓ! (ikt)ℓ ℓ! | ≤ ε 2(2m+1) (ikt)ℓ ℓ! gibt es . ∈ C[t] folgt dann die Behauptung. 3 Für f ∈ C(J, R) kann natürlich P ∈ R[t] gewählt werden; notfalls ersetzt man einfach das Polynom P durch dessen Realteil Re P . Insbesondere ist also der Raum C ∞ [a, b] dicht in C[a, b] . Nun wollen wir daraus schließen, daß der Raum D(a, b) = C ∞ (R) ∩ Cc (a, b) der Testfunktionen auf (a, b) für 1 ≤ p < ∞ in Lp [a, b] dicht ist. Der Grund für diese Bezeichnung wird in Satz 12.4 deutlich werden. Wir benötigen 3 Fourier-Reihen und der Satz von Fejér 21 3.15 C ∞ -Abschneidefunktionen. a) Wir wählen eine Funktion ρ ∈ C ∞ (R) mit R ρ ≥ 0 , supp ρ ⊆ [−1, 1] und R ρ(t) dt = 1 , z. B. ρ(t) = c exp( t21−1 ) für | t | < 1 für ein geeignetes c > 0 sowie ρ(t) = 0 für |t| ≥ 1. b) Für ε > 0 definieren wir dann ρε (t) := 1 ε ρ( εt ) und erhalten ρε ∈ C ∞ (R) , ρε ≥ 0 , supp ρε ⊆ [−ε, ε] und R R ρε (t) dt = 1 . (20) c) Für ein kompaktes Intervall J = [a, b] ⊆ R und ε > 0 sei χJ,ε (t) := Rb a ρε (t − s) ds , t ∈ R. (21) Offenbar gilt 0 ≤ χJ,ε ≤ 1 , χJ,ε (t) = 0 für t ≤ a − ε und t ≥ b + ε sowie χJ,ε (t) = 1 für a + ε ≤ t ≤ b − ε . 3.16 Satz. Für 1 ≤ p < ∞ und a < b ∈ R ist der Raum D(a, b) dicht in Lp [a, b] . Beweis. Nach dem Weierstraßschen Approximationssatz und 1.24 ist der Raum C ∞ [a, b] dicht in Lp [a, b] . Für f ∈ C ∞ [a, b] und kleine ε > 0 definieren wir mit dem Intervall J := [a + 2ε, b − 2ε] die Testfunktion fε := f · χJ,ε ∈ D(a, b) und erhalten k f − fε kpLp ≤ R a+3ε a + Rb b−3ε | f (t) (1 − χJ,ε (t)) |p dt ≤ 6 ε k f kpsup . 3 3.17 Satz. Für eine Funktion f ∈ L1 [a, b] gelte Rb a f (t) ϕ(t) dt = 0 für alle ϕ ∈ D(a, b) . (22) Dann ist f = 0 fast überall. Beweis. a) Nach Satz 2.5 folgt f = 0 im Raum der Äquivalenzklassen L1 [a, b], wenn (22) sogar für alle ϕ ∈ C[a, b] gilt. Wegen der Dichtheit von C ∞ [a, b] in C[a, b] genügt es, (22) für alle ϕ ∈ C ∞ [a, b] zu zeigen. b) Für n ∈ N sei Jn := [a + n2 , b − n2 ] und ϕn := ϕ · χJn , 1 ∈ D(a, b) . Dann gilt n ϕn (t) → ϕ(t) für alle t ∈ (a, b) sowie | f (t) ϕn (t) | ≤ | f (t) | | ϕ(t) | . Mit dem Satz über majorisierte Konvergenz folgt dann Rb a f (t) ϕ(t) dt = lim n→∞ Rb a f (t) ϕn (t) dt = 0 . 3 Satz 3.17 liefert eine Erklärung für den Namen Raum der Testfunktionen“ für ” D(a, b) : Eine L1 -Funktion ist durch ihre Wirkung“ gemäß (22) auf alle Testfunk” tionen eindeutig festgelegt. 22 4 I. Hilberträume und beschränkte lineare Operatoren Orthonormalbasen 4.1 Orthonormalsysteme. a) Zwei Vektoren x, y ∈ H in einem Hilbertraum heißen orthogonal, Notation: x ⊥ y , falls hx|yi = 0 gilt. Das Orthogonalkomplement einer Menge ∅ = 6 M ⊆ H wird definiert durch M ⊥ := {x ∈ H | hx|yi = 0 für alle y ∈ M} . Es ist M ⊥ ein abgeschlossener Unterraum von H . b) Eine Menge {ei }i∈I ⊆ H heißt Orthonormalsystem, falls gilt: ( hei |ej i = δij = 0 , i 6= j , i, j ∈ I . 1 , i=j Ein Orthonormalsystem {ei }i∈I in H mit {ei }⊥ = {0} heißt maximal. Maximalität bedeutet offenbar, daß {ei }i∈I nicht zu einem echt größeren Orthonormalsystem erweitert werden kann. c) Wir betrachten hier nur abzählbare Orthonormalsysteme und verwenden als Indexmenge I = N0 oder I = Z . d) Die Einheitsvektoren“ {ek := (δki )i∈N0 } | k ∈ N0 } bilden ein Orthonormalsystem ” in ℓ2 . Dieses ist maximal: Ist nämlich ξ = (ξi ) ∈ ℓ2 mit hξ|ek i = ξk = 0 für alle k ∈ N0 , so muß offenbar ξ = 0 sein. e) Aufgrund der Orthogonalitätsrelationen (3.5) bilden die Funktionen {eikt }k∈Z ein Orthonormalsystem im Hilbertraum L2 ([−π, π],dt) ¯ , wobei wir zur Abkürzung dt setzen. dt ¯ = 2π f) Analog zur konkreten Situation in e) heißen für ein Orthonormalsystem {ei }i∈I in einem Hilbertraum H und x ∈ H die Zahlen xb(i) := hx|ei i , i ∈ I , (1) Fourier-Koeffizienten von x bezüglich {ei }i∈I . 4.2 Lemma. Es sei {ei }i∈I ein Orthonormalsystem in einem Hilbertraum H . Für eine endliche Teilmenge I ′ ∈ E(I) von I gilt k P i∈I ′ kx− ξi ei k2 = P i∈I ′ P | ξi |2 , i∈I ′ ξi ∈ K , xb(i)ei k2 = k x k2 − P i∈I ′ Beweis. Zunächst ergibt sich (2) aus k P i∈I ′ ξi ei k2 = h P i∈I ′ ξi ei | P j∈I ′ und (2) | xb(i) |2 , ξj ej i = P i,j∈I ′ x∈H. ξi ξj δij = (3) P i∈I ′ | ξi |2 , daraus mit (4) und (1) dann (3): kx− P i∈I ′ xb(i)ei k2 = k x k2 − 2 = k x k2 − P i∈I ′ P i∈I ′ | xb(i) |2 + k | xb(i) |2 . P i∈I ′ xb(i)ei k2 23 4 Orthonormalbasen Aussage (2) ist eine Version des Satzes des Pythagoras. Wir bemerken in 5.4 unP ten, dass P x := xb(i)ei die orthogonale Projektion von x ∈ H auf die lineare i∈I ′ Hülle [ei ]i∈I ′ der {ei }i∈I ′ ist. Aus Formel (3) folgt sofort die wichtige Besselsche Ungleichung: 4.3 Satz (Besselsche Ungleichung). Für x ∈ H gilt (xb(i))i∈I ∈ ℓ2 (I) und P i∈I | xb(i) |2 ≤ k x k2 . Als erste Anwendung zeigen wir: 1 4.4 Satz. Für eine periodische C 1 -Funktion f ∈ C2π (R) gilt ∞ P k=−∞ | fb(k) | < ∞ ; (4) insbesondere konvergiert die Fourier-Reihe von f gleichmäßig gegen f . Beweis. a) Für k ∈ Z\{0} folgt mit partieller Integration fb(k) = 1 ik fb′ (k) . (5) b) Für n ∈ N folgt nun aus der Schwarzschen Ungleichung im R2n und der Besselschen Ungleichung P 0<| k |≤n | fb(k) | = P 0<| k |≤n ≤ ( 1 |k| P 0<| k |≤n | fb′ (k) | 1 1 ) /2 | k |2 ( P 0<| k |≤n | fb′ (k) |2) 1/ 2 ≤ C k f ′ k L2 . Nun verwendet man den Satz von Fejér bzw. Bemerkung 3.13 a). 1 Für f ∈ C2π (R) gilt sogar ∞ P k=−∞ 3 | fb(k) |p < ∞ für p > 32 , und Satz 4.4 gilt sogar für alle f ∈ C2π (R) , die eine Hölder-Bedingung | f (t) − f (s) | ≤ C | t − s |α mit α > erfüllen. Dazu sei etwa auf [KFA], Abschnitt 6.2 verwiesen. 1 2 4.5 Orthogonale Summen. a) Es seien {ek }k∈N0 ein Orthonormalsystem in einem Hilbertraum H und ξ = (ξk ) ∈ ℓ2 . Nach dem Satz des Pythagoras (2) gilt k n P k=m ξk ek k2 = n P k=m | ξk |2 ; wegen der Vollständigkeit von H ist daher die Reihe x := ∞ P k=0 ξk ek in H konvergent. b) Jede Umordnung der Reihe liefert die gleiche Summe. Dies kann man wegen (2) wie im Fall absolut konvergenter skalarer Reihen beweisen, vgl. etwa [KA1], 32.9. Beachten Sie, dass die Reihe nur für ξ = (ξk ) ∈ ℓ1 sogar absolut konvergent ist. Im Gegensatz zum skalaren und zum endlichdimensionalen Fall gibt es also in jedem unendlichdimensionalen Hilbertraum unbedingt konvergente Reihen, die nicht absolut konvergieren. c) Wegen b) kann man entsprechende Summen über jede (abzählbare) Indexmenge, insbesondere über Z , bilden. 24 I. Hilberträume und beschränkte lineare Operatoren 4.6 Die Fourier-Abbildung. Es sei {ei }i∈I ein Orthonormalsystem in einem Hilbertraum H . Aufgrund der Besselschen Ungleichung hat man die lineare FourierAbbildung F : H 7→ ℓ2 (I) , F (x) := (xb(i))i∈I mit k F k ≤ 1 . Diese ist stets surjektiv: Für ξ = (ξi ) ∈ ℓ2 (I) setzt man x = und erhält sofort hx|ej i = ξj für alle j ∈ I und somit F (x) = ξ . P i∈I ξi ei Die Fourier-Abbildung ist genau dann injektiv, wenn das Orthonormalsystem maximal ist. Weitere dazu äquivalente Aussagen enthält der folgende 4.7 Satz. Für ein Orthonormalsystem {ei }i∈I in einem Hilbertraum H sind äquivalent: (a) Es gilt x = P i∈I xb(i)ei für alle x ∈ H . (b) Für alle x ∈ H gilt die Parsevalsche Gleichung P i∈I | xb(i) |2 = k x k2 . (6) (c) Die Fourier-Abbildung F : H 7→ ℓ2 (I) ist isometrisch. (d) Die lineare Hülle [ei ]i∈I von {ei }i∈I ist dicht in H . (e) Die Fourier-Abbildung F : H 7→ ℓ2 (I) ist injektiv. (f ) Das Orthonormalsystem {ei }i∈I ist maximal. Beweis. (a) ⇔ (b)“ folgt sofort aus (3), (b) ⇔ (c)“ und ” ” (a) ⇒ (d)“ sind klar. ” (d) ⇒ (e)“: Aus F (x) = 0 folgt hx|yi = 0 für alle y ∈ [ei ]i∈I , wegen der Dichtheit ” dieser Menge in H also auch hx|xi = 0 . (e) ⇒ (f)“: Für x ∈ {ei }⊥ gilt F (x) = 0 , also auch x = 0 . ” P xb(i)ei in (f) ⇒ (a)“: Für x ∈ E ist (xb(i))i∈I ∈ ℓ2 (I) , und daher existiert x1 := ” i∈I H . Man berechnet sofort hx − x1 |ei i = 0 für alle i ∈ I , und die Maximalität von {ei }i∈I impliziert dann x − x1 = 0 . 3 4.8 Polarformel. a) Das Skalarprodukt eines Hilbertraumes kann mittels der Polarformel aus der Norm rekonstruiert werden. Diese ergibt sich leicht aus (1.4) und lautet im reellen Fall 4 hx|yi = k x + y k2 − k x − y k2 ; (7) im komplexen Fall hat man 4 hx|yi = k x + y k2 − k x − y k2 + i k x + iy k2 − i k x − iy k2 . (8) b) Aufgrund der Polarformel ist die Parsevalsche Gleichung (6) äquivalent zu P i∈I xb(i) yb(i) = hx|yi für x, y ∈ H . (9) 25 4 Orthonormalbasen 4.9 Orthonormalbasen. Ein maximales Orthonormalsystem {ei }i∈I in einem Hilbertraum H heißt vollständig oder eine Orthonormalbasis von H ; es gelten dann also die Eigenschaften (a)–(f) aus Satz 4.7. Insbesondere besitzt nach (a) dann P xb(i)ei nach den Basisvekjeder Vektor x ∈ H eine Fourier-Entwicklung“ x = ” i∈I toren {ei } . Die Einheitsvektoren“ {ek := (δki )i∈I }k∈I sind nach 4.1 d) ein maximales Ortho” normalsystem in ℓ2 (I) , bilden also eine Orthonormalbasis dieses Hilbertraums. Ein weiteres wesentliches Beispiel sind natürlich die konkreten“ Fourier-Reihen: ” ikt 4.10 Theorem. Die Funktionen {e }k∈Z bilden eine Orthonormalbasis des Hilbertraumes L2 ([−π, π],dt) ¯ . Für f ∈ L2 [−π, π] konvergiert also die Fourier-Reihe im quadratischen Mittel gegen f , d.h. es gilt kf − n P k=−n fb(k)eikt kL2 → 0 für n → ∞ . Man hat die Parsevalsche Gleichung ∞ P k=−∞ | fb(k) |2 = k f k2L2 = Rπ 1 2π −π | f (t) |2 dt , f ∈ L2 [−π, π] , (10) und somit die isometrische und surjektive Fourier-Abbildung F : L2 [−π, π] 7→ ℓ2 (Z) , F (f ) := (fb(k))k∈Z . Beweis. Wie in 1.17 erwähnt, ist der Raum C2π dicht in L2 [−π, π] . Nach dem Satz von Fejér ist die lineare Hülle [eikt ]k∈Z der Basisfunktionen dicht in C2π bzgl. der sup -Norm, erst recht also bzgl. der L2 -Norm. Somit ist Bedingung (d) von Satz 4.7 erfüllt. 3 4.11 Beispiele und Folgerungen. a) Mit den Koeffizienten ak , bk der reellen Fourier-Entwicklung von f ∈ L2 [−π, π] (vgl. die Formeln (3.2) und (3.3)) gilt die Parsevalsche Gleichung in der Form | a0 |2 2 + ∞ P k=1 | ak |2 + b) Die Entwicklung π−t 2 = ∞ P k=1 ∞ P k=1 | bk |2 = sin kt k 1 π Rπ −π | f (t) |2 dt . (11) (vgl. Formel (3.8)) gilt nach Theorem 4.10 also in L2 [0, 2π] . Die Parsevalsche Gleichung (11) liefert dann die Eulersche Formel ∞ P k=1 1 k2 = 1 π R 2π π−t 2 0 2 dt = π2 6 . 4.12 Satz. Ein Hilbertraum H besitzt genau dann eine abzählbare Orthonormalbasis, wenn H separabel ist. In diesem Fall ist H isometrisch isomorph zum Folgenraum ℓ2 . Beweis. ⇒ “ ist klar, da ℓ2 separabel ist. ” ⇐ “: Wir wählen eine dichte Folge in H und erhalten durch Weglassen überflüssi” ” ger“ Vektoren eine Folge {xk }k≥0 linear unabhängiger Vektoren mit [xk ]k≥0 = H . Dann konstruieren wir induktiv ein Orthonormalsystem {ek }k≥0 in H mit [x0 , . . . , xk ] = [e0 , . . . , ek ] für k ≥ 0 . (12) 26 I. Hilberträume und beschränkte lineare Operatoren Dazu seien e0 := k xx00 k und orthonormale Vektoren {e0 , . . . , en−1 } mit (12) für k = 0, . . . , n − 1 schon konstruiert. Dann ist 0 6= w := xn − n−1 P k=0 und wir definieren en := von H . hxn |ek i ek ∈ [e0 , . . . , en−1 ]⊥ , w kwk (13) . Offenbar ist dann {ek }k≥0 eine Orthonormalbasis 3 Im Beweis von Satz 4.12 haben wir die Gram-Schmidt-Orthonormalisierung verwendet. 4.13 Überabzählbare Orthonormalbasen. Ein nicht separabler Hilbertraum H besitzt eine überabzählbare Orthonormalbasis. Um dies einzusehen, startet man mit einem Orthonormalsystem, z. B. mit einem einzigen Einheitsvektor, und erweitert dieses so lange durch zusätzliche orthonormale Vektoren, bis dies nicht mehr ” möglich ist“; das so konstruierte Orthonormalsystem ist dann maximal, also eine Orthonormalbasis von H . Dieses naive“ Erweiterungsargument kann mit Hilfe ” transfiniter Induktion oder des Zorschen Lemmas präzisiert werden. Nach Theorem 4.10 gilt insbesondere L2 [−π, π] ∼ = ℓ2 ; wir zeigen nun sogar = ℓ2 (Z) ∼ n ∼ L2 (Ω) = ℓ2 für jede messbare Menge Ω ⊆ R . Zunächst gilt 4.14 Satz. Es seien {ej }j∈N0 und {fk }k∈N0 Orthonormalbasen von L2 (Ω1 ) und L2 (Ω2 ) . Mit Ω := Ω1 × Ω2 ist dann {ej (t)fk (s)}j,k∈N0 eine Orthonormalbasis von L2 (Ω) . Beweis. Offenbar ist {ej (t)fk (s)}j,k∈N0 ein Orthonormalsystem in L2 (Ω) . Für f ∈ L2 (Ω) liegen die Funktionen (t, s) 7→ f (t, s)ej (t)fk (s) in L1 (Ω) . Nun gelte R Ω f (t, s)ej (t)fk (s) d(s, t) = 0 für alle j, k ∈ N0 . Nach dem Satz von Fubini ist dann R Ω1 R Ω2 f (t, s)fk (s) ds ej (t) dt = 0 für alle j, k ∈ N0 , R Ω2 also f (t, s)fk (s) ds = 0 für fast alle t ∈ Ω1 und alle k ∈ N0 . Es folgt ft = 0 f.ü. auf Ω2 für fast alle t ∈ Ω1 , und der Satz von Fubini liefert R Ω | f (t, s) |2 d(s, t) = R Ω1 R Ω2 | f (t, s) |2 ds dt = 0 . 3 4.15 Satz. Es sei Ω ⊆ Rn eine messbare Menge. Dann ist der Hilbertraum L2 (Ω) separabel und somit isometrisch isomorph zum Folgenraum ℓ2 . Beweis. a) Nach Theorem 4.10 ist dies für den Hilbertraum L2 [−π, π] richtig und folgt mittels linearer Variablentransformation sofort auch für den Hilbertraum L2 [a, b] . b) Nach Satz 4.14 ist auch der Hilbertraum L2 ([−k, k]n ) für alle k ∈ N separabel. c) Durch Fortsetzung einer Funktion zu 0 außerhalb von Ω kann man L2 (Ω) mit einem abgeschlossenen Unterraum von L2 (Rn ) identifizieren. Dieser Raum ist sepaS rabel, da k∈N L2 ([−k, k]n ) , in L2 (Rn ) dicht ist. 4 Orthonormalbasen d) Schließlich verwendet man Satz 1.27. 27 3 Aufgrund von Satz 4.15 können Observable der Quantenmechanik als (partielle Differential-) Operatoren in L2 (Ω) oder als Matrix-Operatoren in ℓ2 realisiert werden; E. Schrödingers Wellenmechanik und W. Heisenbergs Matrizenmechanik sind äquivalente Formulierungen der Quantenmechanik. Wir geben noch einige konkrete Orthonormalbasen an: 4.16 Legendre-Polynome. Nach dem Weierstraßschen Approximationssatz ist die lineare Hülle [tk ]k≥0 der Monome dicht in C[a, b] , also auch dicht in (L2 [a, b], dt) . Ihre Gram-Schmidt-Orthonormalisierung liefert die Orthonormalbasis {Pk }k≥0 aus Legendre-Polynomen von L2 [a, b] : √ d k 2k + 1 ( Pk (t) = ) ((t − a)k (t − b)k ) , k ∈ N0 . (14) 1 k+ 2 dt k! (b − a) 4.17 Hermite-Funktionen. a) Die Hermite-Polynome vom Grad n werden definiert durch 2 2 Hn (t) := (−1)n et ( dtd )n e−t , n ∈ N0 . (15) 2 b) Man hat die erzeugende Funktion e2ut−u , es gilt die Formel 2 e2ut−u = ∞ P n=0 1 n! Hn (t) un . 2 (16) 2 2 Dazu differenziert man e2ut−u = et e−(t−u) n -mal nach u und wertet das Resultat in u = 0 aus. c) Nun differenziert man (16) nach t ; durch Vergleich der links und rechts stehenden Reihen erhält die Rekursionsformel Hn′ = 2nHn−1 für alle n ∈ N . (17) d) Die Hermite-Funktionen werden durch √ 1 t2 hn (t) := (2n n! π)− 2 Hn (t) e− 2 (18) definiert; sie bilden ein Orthonormalsystem in L2 (R) . Für n ≤ m liefert in der Tat partielle Integration wegen (17) R∞ 2 −∞ Hn (t) Hm (t) e−t dt = R∞ 2 −∞ n 2nHn−1 (t) (− dtd )m−1 e−t dt = . . . = 2 n! R∞ −∞ 2 H0 (t) (− dtd )m−n e−t dt . Wegen H0 (t) = 1 ergibt sich √ hHn |Hm i =2 0 für n < m , und für n = m hat man R∞ 2 −t2 n H (t) e dt = 2 n! π , also k hn k = 1 . n −∞ e) Die Hermite-Funktionen sind sogar eine Orthonormalbasis von L2 (R) . Dies ergibt sich mittels Fourier-Transformation (vgl. Abschnitt 14): t2 Ist f ∈ [hn ]⊥ , so gilt f ⊥ tn e− 2 für alle n ∈ N0 . Für feste τ ∈ R gilt m P n=0 t2 t2 | n!1 (−itτ )n | e− 2 ≤ e| t || τ |− 2 für alle m ∈ N 28 I. Hilberträume und beschränkte lineare Operatoren t2 und daher die Reihenentwicklung e−itτ − 2 = Satz über majorisierte Konvergenz. Es folgt ∞ P n=0 ∞ R P t2 t2 ¯ = F (e− 2 f¯)(τ ) = R e−itτ e− 2 f¯(t)dt n=0 1 n! t2 (−itτ )n e− 2 in L2 (R) nach dem (−iτ )n n! R 2 R t tn e− 2 f¯(t)dt ¯ =0 t2 für alle τ ∈ R . Da F isometrisch ist, impliziert dies e− 2 f¯(t) = 0 fast überall und somit f (t) = 0 fast überall. Nun verwendet man Satz 4.7. 5 Beschränkte lineare Operatoren auf Hilberträumen 5 29 Beschränkte lineare Operatoren auf Hilberträumen 5.1 Satz. Es seien H ein Hilbertraum und C ⊆ H eine abgeschlossene konvexe Menge. Zu x ∈ H gibt es genau ein P (x) = PC (x) ∈ C mit k x − P (x) k = dC (x) = inf {k x − y k | y ∈ C} . (1) Die metrische Projektion P = PC : H 7→ C ist eine stetige Abbildung. Beweis. a) Mittels (1.6) bestätigt man sofort die Parallelogrammgleichung k ξ + η k2 + k ξ − η k2 = 2 (k ξ k2 + k η k2 ) für ξ, η ∈ H . (2) b) Nun sei (yk ) eine Minimalfolge in C für x ∈ H , d. h. es gelte k x−yk k → dC (x) . Die Parallelogrammgleichung liefert dann kx− yk +yj 2 k2 + k yk −yj 2 k2 = 1 2 (k x − yk k2 + k x − yj k2 ) → dC (x)2 ; j j wegen yk +y ∈ C gilt aber auch k x− yk +y k2 ≥ dC (x)2 , und es folgt k yk −yj k → 0 , 2 2 d. h. (yk ) ist eine Cauchy-Folge. Ihr Grenzwert P (x) := lim yk ∈ C erfüllt dann offenbar (1). k→∞ c) Sind y, z ∈ C mit k y −x k = k z −x k = dC (x) , so ist die Folge (y, z, y, z, y, z, . . .) eine Minimalfolge für x , nach b) also eine Cauchy-Folge. Dies impliziert offenbar y = z . Somit wird durch (1) also tatsächlich eine Abbildung P = PC : H 7→ C definiert. d) Nun sei (xk ) eine Folge in H mit xk → x . Wegen der Stetigkeit der Distanzfunktion dC gilt dC (x) ≤ k x − P (xk ) k ≤ k x − xk k + k xk − P (xk ) k = k x − xk k + dC (xk ) → dC (x) , und (P (xk )) ist eine Minimalfolge für x . Aufgrund der Beweisteile b) und c) folgt dann P (xk ) → P (x) . 3 Für die stetige Abbildung PC : H 7→ C gilt offenbar PC (x) = x für x ∈ C ; eine solche Abbildung nennt man eine Retraktion von H auf C . Für die Formulierung des nächsten Satzes benötigen wir noch einen Begriff: 5.2 Direkte und orthogonale Summen. a) Es seien E ein Vektorraum und V, W Unterräume von E . Die Summe V + W = {v + w | v ∈ V , w ∈ W } heißt direkt, falls V ∩ W = {0} gilt; dies ist genau dann der Fall, wenn jeder Vektor x ∈ V + W eine eindeutige Zerlegung x = v + w mit v ∈ V und w ∈ W hat. Direkte Summen werden als V ⊕ W notiert. b) Nun seien H ein Hilbertraum und V, W Unterräume von H . Die Summe V + W heißt orthogonal, falls V ⊥ W gilt. Eine orthogonale Summe bezeichnen wir mit V ⊕2 W ; sie ist natürlich stets direkt. 30 I. Hilberträume und beschränkte lineare Operatoren Für abgeschlossene Unterräume F ⊆ H ist die metrische Projektion PF : H 7→ F ein linearer Operator, die orthogonale Projektion von H auf F : 5.3 Satz. Es seien H ein Hilbertraum und F ⊆ H ein abgeschlossener Unterraum. a) Für x ∈ H gibt es genau einen Vektor x1 ∈ F mit x − x1 ⊥ F , nämlich x1 = P (x) = PF (x) . b) Man hat die orthogonale Zerlegung H = F ⊕2 F ⊥ = R(P ) ⊕2 N(P ) , (3) und P : x1 + x2 7→ x1 ist die entsprechende orthogonale Projektion von H auf F . Man hat P ∈ L(H) , P 2 = P und k P k = 1 . Für x, y ∈ H gilt hP x|yi = hP x|P yi = hx|P yi . (4) Beweis. a) Eindeutigkeit: Sind x1 , x′1 ∈ F mit x − x1 ⊥ F und x − x′1 ⊥ F , so folgt x1 − x′1 = (x1 − x) + (x − x′1 ) ∈ F ⊥ ∩ F , also x1 − x′1 = 0 . Existenz: Wir zeigen, daß für x ∈ H und die metrische Projektion x1 := PF x der Vektor x − x1 zu F orthogonal ist. Für y ∈ F mit k y k = 1 und α := hx − x1 |yi gilt in der Tat k x − x1 k2 ≤ k x − x1 − αy k2 = k x − x1 k2 − ᾱ hx − x1 |yi − α hy|x − x1 i + | α |2 = k x − x1 k2 − | α |2 aufgrund von (1); dies impliziert α = 0 und somit x − x1 ⊥ F . b) Wir zeigen zunächst H = F ⊕2 F ⊥ : es ist F ⊥ F ⊥ klar, und für x ∈ H gilt x = x1 + x2 mit x1 = P (x) ∈ F und x2 = x − x1 ∈ F ⊥ nach a). Offenbar hat man F = R(P ) und F ⊥ = N(P ) . Die Linearität von P sieht man so: Für x, y ∈ H und α ∈ K hat man (αx + y) − (αP x + P y) = α (x − P x) + (y − P y) ∈ F ⊥ , also P (αx + y) = (αP x + P y) . Wegen P (P x) = P x gilt P 2 = P , und wegen k x k2 = k P x k2 + k x − P x k2 hat man k P k = 1 . Aussage (4) folgt schließlich aus hP x|y − P yi = hx − P x|P yi = 0 . 3 5.4 Bemerkungen und Folgerungen. a) Nach Satz 4.12 besitzt jeder abgeschlossene Unterraum F eines (separablen) Hilbertraums H eine Orthonormalbasis P P {ei }i∈I . Für x ∈ H hat man x − xb(i) ei ⊥ F wegen hx − xb(i) ei |ej i = 0 für alle j ∈ I ; folglich gilt Px = P i∈I i∈I xb(i) ei , x ∈ H . i∈I (5) Die orthogonale Projektion von H auf einen abgeschlossenen Unterraum F läßt sich also ohne Verwendung von Satz 5.1 auch mittels (5) konstruieren, wobei die Existenz einer Orthonormalbasis von F verwendet wird. 31 5 Beschränkte lineare Operatoren auf Hilberträumen b) Offenbar gilt M ⊆ (M ⊥ )⊥ und damit auch [M] ⊆ (M ⊥ )⊥ für jede nicht leere Menge M ⊆ H . Mit F := [M] gilt H = F ⊕2 F ⊥ nach (3). Ist nun entsprechend x = x1 + x2 ∈ (M ⊥ )⊥ = (F ⊥ )⊥ , so folgt hx2 |x2 i = hx2 |x1 + x2 i = hx2 |xi = 0 und somit x = x1 ∈ F . Es gilt also (M ⊥ )⊥ = [M] für ∅ = 6 M ⊆H. (6) 5.5 Adjungierte Operatoren. Beim Studium von Matrizen über K = R oder K = C spielen adjungierte Matrizen eine wichtige Rolle. Entsprechend möchte man für Hilberträume H, G zu T ∈ L(H, G) den adjungierten“ Operator T ∗ ∈ L(G, H) ” definieren, sodass h T x|y i = h x|T ∗ y i für alle x ∈ H und y ∈ G gilt. Dazu benötigt man die Surjektivität der Isometrie j = jH : H → H ′ eines Hilbertraums in seinen Dualraum aus (3.6): 5.6 Satz(Rieszscher Darstellungssatz). Es sei η ∈ H ′ eine stetige Linearform auf einem Hilbertraum H . Dann gibt es genau ein y ∈ H mit η(x) = hx|yi für x ∈ H . Beweis. Für η = 0 wählt man y = 0 . Für η 6= 0 ist der Kern N(η) ein abgeschlossener Unterraum von H . Nach Satz 5.3 gibt es z ∈ N(η)⊥ mit k z k = 1 , also η(z) 6= 0 . Für x ∈ H gibt es daher α ∈ K mit η(x) = α η(z) , also η(x − αz) = 0 und x − αz ∈ N(η) . Es folgt h x − αz|z i = 0 , also α = h αz|z i = h x|z i , und man erhält η(x) = h x|z i η(z) =: h x|y i mit y := η(z) z ∈ N(η)⊥ . 3 5.7 Satz. Es seien H, G Hilberträume über K . Zu T ∈ L(H, G) gibt es genau einen Operator T ∗ ∈ L(G, H) mit h T x|y i = h x|T ∗ y i für alle x ∈ H und y ∈ G , (7) den adjungierten Operator zu T . Es gilt k T ∗ k = k T k . Beweis. Für y ∈ G wird durch x 7→ h T x|y i eine stetige Linearform auf H definiert. Nach dem Rieszschen Darstellungssatz 5.6 gibt es genau ein y ∗ ∈ H mit h T x|y i = hx|y ∗ i für x ∈ H . Durch T ∗ : y 7→ y ∗ wird dann ein linearer Operator von G nach H mit (7) definiert, und man hat k T ∗ k = sup {k T ∗y k | k y k ≤ 1} = sup {| h x|T ∗y i | | k x k , k y k ≤ 1} = sup {| h T x|y i | | k x k , k y k ≤ 1} = sup {k T x k | k x k ≤ 1} = k T k . 5.8 Bemerkungen. Stets gilt (T ∗ )∗ = T , (T1 + T2 )∗ = T1∗ + T2∗ , (λT )∗ = λ̄T ∗ und (ST )∗ = T ∗ S ∗ . Ist T ein Isomorphismus, so gilt dies auch für T ∗ , und man hat (T ∗ )−1 = (T −1 )∗ . Diese Aussagen sind leicht nachzurechnen. 32 I. Hilberträume und beschränkte lineare Operatoren 5.9 Definition. Ein Operator T ∈ L(H) heißt selbstadjungiert, falls T ∗ = T , unitär, falls T ∗ = T −1 und normal, falls T ∗ T = T T ∗ ist. Der Begriff unitär“ ist auch sinnvoll für Operatoren T ∈ L(H, G) zwischen ver” schiedenen Hilberträumen. 5.10 Matrix-Darstellungen und adjungierte Matrizen. Es seien H, G (separable) Hilberträume mit Orthonormalbasen {ej }j∈J und {fi }i∈I . Für T ∈ L(H, G) P xb(j)ej ∈ H gilt und x = j∈J Tx = P j∈J mit der Matrix xb(j)T ej = P j∈J xb(j) P i∈I aij fi = P P i∈I j∈J aij xb(j) fi M(T ) := (aij )i∈I,j∈J = (hT ej |fi i)i∈I,j∈J . (8) (9) Umgekehrt definiert eine Matrix durch (8) wie in (2.12) einen Operator T ∈ L(H, G) , wenn k A kHS < ∞ oder k A kZS k A kSS < ∞ gilt. b) Im Fall H = G wählt man die gleiche Orthonormalbasis {ei }i∈I für Urbildraum und Bildraum. Mit der Fourier-Abbildung F : H 7→ ℓ2 (I) ist dann der auf ℓ2 (I) wirkende Matrix-Operator M(T ) = F T F −1 ähnlich zu T . Da F ein unitärer Operator ist, ist M(T ) sogar unitär äquivalent zu T . c) In der Situation von a) gilt aij = hT ej |fi i = hej |T ∗ fi i = hT ∗ fi |ej i = a∗ji , und somit ist die Matrix von T ∗ ∈ L(G, H) bezüglich der Orthonormalbasen {fi }i∈I und {ej }j∈J gegeben durch M(T ∗ ) = (a∗ji ) = (aij ) , also durch die adjungierte Matrix zu M(T ) . Diese Aussage gilt natürlich insbesondere im endlichdimensionalen Fall. d) Für einen Diagonaloperator D = diag(αk ) auf ℓ2 hat man insbesondere D ∗ = diag(αk ) und D ∗ D = DD ∗ = diag(| αk |2 ) . Somit ist D stets normal; D ist genau dann selbstadjungiert, wenn alle αk reell sind und genau dann unitär, wenn | αk | = 1 für alle k gilt. 5.11 Multiplikationsoperatoren. a) Es sei K ⊆ Rn kompakt. Für eine stetige Funktion a ∈ C(K) wird ein Multiplikationsoperator Ma ∈ L(L2 (K)) definiert durch (Ma f )(t) := a(t) f (t) , t ∈ K , f ∈ L2 (K) . (10) Offenbar ist k Ma k ≤ k a ksup , und es ist sogar k Ma k = k a ksup . Für Funktionen f, g ∈ L2 (K) hat man h Ma f |g i = R K a(t)f (t) g(t) dt = h f |Ma∗ g i mit (Ma∗ g)(t) := a(t) g(t) = (Mā g)(t) , t ∈ K , g ∈ L2 (K) , also Ma∗ = Mā . Offenbar ist Ma stets normal; Ma ist selbstadjungiert genau dann, wenn a reellwertig ist und unitär genau dann, wenn | a(t) | = 1 für alle t ∈ K gilt. 5 Beschränkte lineare Operatoren auf Hilberträumen 33 b) Für a ∈ C2π und H = L2 ([−π, π],dt) ¯ berechnen wir die Matrix von Ma bezüglich ikt der Basis {e }k∈Z . Nach (9) ist akj = hMa e0j |e0k i = Rπ −π a(t) eijt e−ikt dt ¯ = ab(k − j) für k, j ∈ Z ; somit ist M(Ma ) die zweiseitig unendliche Toeplitz-Matrix M(Ma ) = .. .. .. . .. . .. .. . . ab(0) ab(−1) ab(−2) ab(−3) . ab(1) ab(2) ab(0) ab(1) .. . . ab(−1) ab(−2) .. . . ab(−1) . . .. .. . . ab(0) .. . , wobei das Element ab(0) an der Stelle (0, 0) steht. Beachten Sie, dass k A kHS < ∞ nur für a = 0 erfüllt ist und dass k A kZS k A kSS < ∞ genau dann gilt, wenn ∞ P k=−∞ 1 | ab(k) | < ∞ ist, also z. B. im Fall a ∈ C2π (R) (vgl. Satz 4.4). 5.12 Adjungierte Integraloperatoren. Es sei Ω ein σ -endlicher Maßraum, z. B. eine meßbare Menge in Rn , und für den meßbaren Kern κ : Ω2 7→ K gelte κ ∈ L2 (Ω2 ) oder k κ kSI k κ kZI < ∞ . (11) Für den linearen Integraloperator (Sκ f )(t) := R Ω κ(t, s) f (s) ds , t ∈ Ω , f ∈ L2 (Ω) , und f, g ∈ L2 (Ω) hat man nach den Sätzen von Fubini und Tonelli h Sκ f |g i = R R Ω Ω κ(t, s)f (s) ds g(t) dt = (Sκ∗ g)(t) = R Ω κ(s, t) g(s) ds , R Ω f (s) R Ω κ(t, s)g(t) dt ds = h f |Sκ∗g i mit t ∈ Ω , g ∈ L2 (Ω) . (12) Mit κ erfüllt auch der adjungierte Kern κ∗ (t, s) = κ(s, t) Bedingung (11). Es ist Sκ genau dann selbstadjungiert, wenn κ = κ∗ fast überall auf Ω2 gilt. 5.13 Der Shift-Operator oder Rechts-Shift-Operator auf ℓ2 ist definiert durch S+ (x0 , x1 , x2 , x3 , . . .) := (0, x0 , x1 , x2 , . . .) . (13) Er wird durch die Matrix M(S+ ) = 0 1 0 .. . 0 0 ··· 0 0 ··· 1 0 ··· .. .. . . dargestellt. Für diese gilt Bedingung (2.13), nicht aber Bedingung (2.11). Offenbar ist S+ eine Isometrie von ℓ2 in ℓ2 , die nicht surjektiv ist. 34 I. Hilberträume und beschränkte lineare Operatoren ∞ Für Folgen x = (xk )∞ k=0 , y = (yk )k=0 ∈ ℓ2 gilt h S+ x|y i = ∞ P k=1 xk−1 yk = mit dem Links-Shift-Operator ∞ P j=0 xj yj+1 = h x|S− y i S+∗ = S− : (y0 , y1, y2 , y3 , . . .) 7→ (y1 , y2 , y3, . . .) . (14) Offenbar ist S− S+ = I und S+ S− (y0 , y1 , y2 , y3, . . .) = (0, y1, y2 , y3, . . .) , also S+ S− die orthogonale Projektion von ℓ2 auf den Unterraum {y ∈ ℓ2 | y0 = 0} . Insbesondere sind S+ und S− nicht normal. 5.14 Satz. Es seien H, G Hilberträume. Für T ∈ L(H, G) gilt R(T )⊥ = N(T ∗ ) und R(T ) = N(T ∗ )⊥ . (15) Ist R(T ) abgeschlossen, so gilt also R(T ) = N(T ∗ )⊥ . Beweis. a) Man hat die Äquivalenzen y ∈ R(T )⊥ ⇔ ∀ x ∈ H : h T x|y i = 0 ⇔ ∀ x ∈ H : h x|T ∗y i = 0 ⇔ T ∗ y = 0 ⇔ y ∈ N(T ∗ ) . b) Mit (6) ergibt sich nun R(T ) = (R(T )⊥ )⊥ = N(T ∗ )⊥ . 3 5.15 Satz. Ein Operator P ∈ L(H) ist genau eine orthogonale Projektion, wenn P ∗ = P = P 2 gilt. Beweis. ⇒ “ folgt aus Satz 5.3, insbesondere (4). ” ⇐ “: Es sei F := R(P ) . Wegen P = P 2 gilt ” y ∈ F ⇔ ∃ x ∈ H : y = P x = P 2 x ⇔ y = P y ⇔ y ∈ N(I − P ) . Somit ist F = N(I − P ) abgeschlossen, und aus Satz 5.14 folgt F ⊥ = R(P )⊥ = N(P ∗ ) = N(P ) . Daher ist P die orthogonale Projektion auf F . 3 5.16 Satz. Für T ∈ L(H, G) gelte die Abschätzung ∃ γ > 0 ∀ x ∈ N(T )⊥ : k T x k ≥ γ k x k . (16) Dann ist R(T ) abgeschlossen. Beweis. Es sei P die orthogonale Projektion auf N(T )⊥ ; dann gilt T P = T . Für y ∈ R(T ) existiert eine Folge (xn ) in H mit T xn → y . Dann folgt auch T P xn → y , und wegen (16) ist (P xn ) eine Cauchy-Folge in N(T )⊥ . Aus P xn → x ∈ N(T )⊥ folgt dann y = n→∞ lim T P xn = T x und somit y ∈ R(T ) . 3 Es gilt auch die Umkehrung dieser Aussage (vgl. 6.9). Weiter hat man: 5 Beschränkte lineare Operatoren auf Hilberträumen 35 5.17 Satz. Für einen Operator T ∈ L(H) gelte die Abschätzung ∃ γ > 0 ∀ x ∈ H : | h T x|x i | ≥ γ k x k2 . (17) Dann ist T ∈ GL(H) invertierbar mit k T −1 k ≤ γ −1 . Beweis. Aus (17) folgt k T x k ≥ γ k x k für x ∈ H mittels Schwarzscher Ungleichung. Somit ist T injektiv, und nach Satz 5.16 ist R(T ) abgeschlossen. Nun gilt Bedingung (17) auch für T ∗ , und nach Satz 5.14 folgt R(T ) = N(T ∗ )⊥ = H . 3 Die Sätze 5.16 und 5.17 liefern Informationen über beschränkte selbstadjungierte Operatoren A = A∗ ∈ L(H) . Wegen h Ax|x i = h x|Ax i = h Ax|x i gilt stets h Ax|x i ∈ R . 5.18 Satz. Es seien H ein Hilbertraum über C und A = A∗ ∈ L(H) selbstadjungiert. Für λ ∈ C\R existiert dann (λI − A)−1 , und man hat k (λI − A)−1 k ≤ | Im λ |−1 für λ ∈ C\R . (18) Beweis. Für λ = α + iβ ∈ C und x ∈ H gilt | h (λI − A)x|x i | = | h (αI − A)x|x i + h iβx|x i | ≥ | β | k x k2 wegen h Ax|x i ∈ R . Für β 6= 0 gilt also (17), und man verwendet Satz 5.17. (19) 3 5.19 Polarformeln. a) Wir betrachten wieder Hilberträume H über K = R oder K = C . Die in (17) auftretende Abbildung QT : H 7→ K , QT (x) := h T x|x i , (20) heißt die quadratische Form des linearen Operators T ∈ L(H) . Eine quadratische Form mit Eigenschaft (17) heißt koerziv. b) Für A = A∗ gelten analog zu (4.7) und (4.8) die Polarformeln 4 hAx|yi = QA (x + y) − QA (x − y) bzw. (21) 4 hAx|yi = QA (x + y) − QA (x − y) + i (QA (x + iy) − QA (x − iy)) (22) im reellen Fall bzw. im komplexen Fall. 5.20 Satz. Es sei H ein Hilbertraum über K = R oder K = C . a) Für einen selbstadjungierten Operator A ∈ L(H) gilt k A k = sup {| h Ax, x i | | k x k ≤ 1} . (23) b) Für T ∈ L(H) ist T ∗ T selbstadjungiert, und man hat k T ∗ T k = k T k2 . (24) 36 I. Hilberträume und beschränkte lineare Operatoren Beweis. a) Offenbar gilt k A k ≥ q(A) := sup {| h Ax, x i | | k x k ≤ 1} . Wegen QA (z) ∈ R für alle z ∈ H liefert die Polarformel für K = R und K = C 4 Re hAx|yi = QA (x + y) − QA (x − y) . (25) Für x, y ∈ H mit k x k, k y k ≤ 1 gibt es α ∈ K mit | α | = 1 und | h Ax|y i | = h αAx|y i = 41 (QA (αx + y) − QA (αx − y)) ≤ 14 q(A) (k αx + y k2 + k αx − y k2 ) ≤ 21 q(A) (k x k2 + k y k2 ) ≤ q(A) aufgrund von (25) und der Parallelogrammgleichung (2). b) Man hat k T k2 = sup k T x k2 = sup | h T x|T x i | = sup | h T ∗T x|x i | k x k≤1 ∗ k x k≤1 ∗ k x k≤1 2 ≤ kT T k ≤ kT kkT k = kT k . 3 5.21 Bemerkungen. a) Für einen selbstadjungierten Operator A ∈ L(H) folgt aus QA = 0 also bereits A = 0 . b) Im Fall K = C ist T ∈ L(H) genau dann selbstadjungiert, wenn h T x|x i ∈ R für alle x ∈ H gilt. Aus QT = 0 folgt dann also immer T = 0 . Zum Beweis seien x, y ∈ H und a := h T x|y i , b := h T y|x i ∈ C . Das Ausmultiplizieren von QT (x + y) liefert a + b ∈ R , und durch das von QT (x + iy) erhält man i(b − a) ∈ R . Dies erzwingt b = ā . c) Im Fall K = R sind die Aussagen von b) nicht richtig, wie etwa das Beispiel einer Drehung D : (x1 , x2 ) 7→ (−x2 , x1 ) des R2 um den Winkel π2 zeigt. 5.22 Satz. Ein Operator T ∈ L(H) ist genau dann normal, wenn k T x k = k T ∗x k für alle x ∈ H gilt. Beweis. Für alle x ∈ H gilt k T x k2 = hT x|T xi = hT ∗ T x|xi und k T ∗x k2 = hT ∗ x|T ∗ xi = hT T ∗ x|xi . Da T ∗ T und T T ∗ selbstadjungiert sind, folgt die Behauptung aus der Polarformel. 3 5.23 Satz. Ein Operator U ∈ L(H) ist genau dann unitär, wenn U eine Isometrie von H auf H ist. Beweis. Ist U unitär, so gilt wegen U ∗ = U −1 für alle x ∈ H k Ux k2 = hUx|Uxi = hU ∗ Ux|xi = k x k2 . (26) Umgekehrt impliziert (26) aufgrund der Polarformel wieder U ∗ U = I . Nach Voraussetzung ist U ∈ GL(H) , und es folgt U ∗ = U −1 . 3 5 Beschränkte lineare Operatoren auf Hilberträumen 37 5.24 Evolution von Systemen. Die Evolution eines quantenmechanischen Systems ist gegeben durch t ∈ R; x(t) = U(t) x0 , t hierbei sind die U(t) = e−i h̄ H unitäre Operatoren auf einem Hilbertraum H und x0 ∈ H mit k x0 k = 1 ein Anfangszustand des Systems (vgl. Formel (5) in der Einleitung). Es ist U(s)x0 der Zustand zur Zeit s und dann U(t)U(s)x0 der Zustand zur Zeit t + s ; daher gilt U(0) = I , U(t + s) = U(t) U(s) , t, s ∈ R . (27) b) Wir betrachten hier diskrete Zeitschritte t = n ∈ Z , wegen (27) also die Potenzen (U n )n∈Z eines unitären Operators U ∈ L(H) . Diese besitzen für n → ∞ einen Grenzwert in einem geeigneten Sinn: c) Im Fall dim H = 1 ist U einfach eine komplexe Zahl mit | U | = 1 , und für U 6= 1 existiert n→∞ lim U n nicht. Für die arithmetischen Mittel der U n gilt jedoch 1 n Vn := n−1 P j=0 Uj = U n −1 1 n U −1 → ( 0 , U= 6 1 . 1 , U =1 Diese einfache Beobachtung lässt sich auf den allgemeinen Fall übertragen: 5.25 Satz (Ergodensatz). Es seien U ∈ GL(H) ein unitärer Operator und P die orthogonale Projektion auf den Eigenraum E(U; 1) = {y ∈ H | Uy = y} . Für alle x ∈ H gilt dann n−1 1 P Ujx n n→∞ j=0 lim = Px. (28) Beweis. a) Für x ∈ E(U; 1) gilt natürlich U j x = x für alle j ∈ N0 und somit auch Vn x := 1 n n−1 P j=0 Ujx = x = P x . b) Nach Satz 5.14 gilt E(U; 1)⊥ = N(I − U)⊥ = R(I − U ∗ ) = R(I − U −1 ) . Für einen Vektor x = y − U −1 y ∈ R(I − U −1 ) hat man für n → ∞ : Vn x = 1 n n−1 P j=0 Ujx = 1 n n−1 P j=0 Ujy − 1 n n−1 P j=0 U j−1 y = 1 n (U n−1 y − U −1 y) → 0 . c) Wegen k Vn k ≤ 1 gilt nach dem folgenden Satz 5.26 dann auch Vn x → 0 = P x für alle x ∈ R(I − U ∗ ) = E(U; 1)⊥ . 3 5.26 Satz. Es seien X, Y Banachräume und (Tn ) eine Folge in L(X, Y ) mit C := sup k Tn k < ∞ , die auf einer dichten Menge A ⊆ X punktweise konvern∈N giert. Dann existiert T x := lim Tn x n→∞ für alle x ∈ X ; man hat T ∈ L(X, Y ) mit k T k ≤ C , und die Konvergenz ist gleichmäßig auf kompakten Teilmengen von X . 38 I. Hilberträume und beschränkte lineare Operatoren Beweis. a) Für eine kompakte Menge K ⊆ X und ε > 0 gibt es nach Satz 1.26 b1 , . . . , br ∈ K mit K ⊆ r S j=1 Uε (bj ) . Für j = 1, . . . , r wählt man aj ∈ A mit k aj − bj k < ε . Da (Tn (aj )) konvergiert, gibt es n0 ∈ N mit k Tn (aj ) − Tm (aj ) k < ε für n, m ≥ n0 und j = 1, . . . , r . b) Es seien nun n, m ≥ n0 und x ∈ K . Man wählt j ∈ {1, . . . , r} mit k x−aj k < 2ε und erhält k Tn x − Tm x k ≤ k Tn x − Tn aj k + k Tn aj − Tm aj k + k Tm aj − Tm x k < (4C + 1) ε . Somit gilt sup k Tn x−Tm x k ≤ (4C +1) ε für n, m ≥ n0 , und wegen der Vollständigx∈K keit von Y ist die Folge (Tn ) auf K gleichmäßig konvergent, insbesondere also auf X punktweise konvergent. c) Zu zeigen bleiben die Aussagen T ∈ L(X, Y ) und k T k ≤ C . Diese ergeben sich mit n → ∞ sofort aus k Tn x k ≤ k Tn k k x k ≤ C k x k für x ∈ X und n ∈ N . 3 6 Konsequenzen aus dem Satz von Baire 6 39 Konsequenzen aus dem Satz von Baire Im Jahre 1897 zeigte W.F. Osgood den folgenden 6.1 Satz. Es sei M eine punktweise beschränkte Menge stetiger Funktionen auf R . Es gibt ein offenes Intervall I 6= ∅ , sodass M auf I gleichmäßig beschränkt ist. Dazu betrachtet man für n ∈ N die Mengen An := {t ∈ R | ∀ f ∈ M : | f (t) | ≤ n} . S Diese sind in R abgeschlossen, und es ist ∞ n=1 An = R . Nach dem von R. Baire 1899 isolierten Kern des Beweises folgt daraus, dass ein An ein nichtleeres Inneres haben muss. Allgemeiner gilt: 6.2 Theorem (Baire). Es seien X ein Banachraum und D ⊆ X offen. Gilt D= ∞ S n=1 An mit in D abgeschlossenen Mengen An , so gibt es r ∈ N mit A◦r 6= ∅ . Beweis. Andernfalls wählt man a ∈ D und r > 0 mit Br (a) ⊆ D . Wegen A◦1 = ∅ gibt es einen Punkt a1 ∈ Ur (a)\A1 , also 0 < r1 ≤ 2r mit Br1 (a1 ) ⊆ Br (a) und Br1 (a1 ) ∩ A1 = ∅ . Wegen A◦2 = ∅ gibt es 0 < r2 ≤ r21 und eine Kugel Br2 (a2 ) ⊆ Br1 (a1 ) mit Br2 (a2 ) ∩A2 = ∅ . Induktiv findet man Radien 0 < rn ≤ 2rn und Kugeln Brn (an ) ⊆ Brn−1 (an−1 ) mit Brn (an ) ∩ An = ∅ . Wegen k an − an−1 k ≤ rn−1 ≤ r 2−n+1 für n ≥ 2 ist (an ) eine Cauchy-Folge, und aufgrund der Vollständigkeit von X existiert der Limes x := lim an ∈ X (vgl. Satz 1.20). Offenbar gilt dann x ∈ Brn (an ) für alle n→∞ n ∈ N , und man erhält den Widerspruch x ∈ D\ ∞ S n=1 An . 3 Im Satz von Baire kann man an Stelle eines Banachraumes auch eine abgeschlossene Teilmenge eines Banachraumes nehmen. 6.3 Theorem (Prinzip der gleichmäßigen Beschränktheit). Es seien X ein Banachraum, Y ein normierter Raum und H ⊆ L(X, Y ) eine punktweise beschränkte Menge stetiger linearer Operatoren von X nach Y . Dann gilt sup {k T k | T ∈ H} < ∞ . (1) Beweis. Für n ∈ N betrachten wir die abgeschlossenen Mengen Xn := {x ∈ X | ∀ T ∈ H : k T x k ≤ n} . Nach Voraussetzung ist X = ∞ S n=1 Xn ; nach dem Satz von Baire gibt es ein n ∈ N mit Xn◦ 6= ∅ . Es gibt also a ∈ X und r > 0 mit Br (a) ⊆ Xn ; für k x k ≤ r und alle T ∈ H gilt dann k T (a + x) k ≤ n , also k T x k ≤ n + k T a k ≤ 2n ; dies bedeutet aber k T x k ≤ 2n r k x k für alle x ∈ X und T ∈ H , also (1). 3 40 I. Hilberträume und beschränkte lineare Operatoren Schwach beschränkte Mengen. Eine Menge M ⊆ H in einem Hilbertraum H heißt schwach beschränkt, wenn ∀ y ∈ H : sup {| hy|xi | | x ∈ M} < ∞ (2) gilt. Mit der Isometrie j = jH : H → H ′ eines Hilbertraums in seinen Dualraum aus (3.6) ist dies genau dann der Fall, wenn die Menge j(M) in L(H, K) punktweise beschränkt ist. Nach dem Prinzip der gleichmäßigen Beschränktheit 6.3 gilt daher: 6.4 Satz. Eine schwach beschränkte Menge in einem Hilbertraum ist auch in der Norm des Hilbertraumes beschränkt. 6.5 Satz (Banach-Steinhaus). Es seien X ein Banachraum, Y ein normierter Raum und (Tn ) eine Folge in L(X, Y ) , so dass der Limes T x := lim Tn x (3) n→∞ für alle x ∈ X existiert. Dann gilt T ∈ L(X, Y ) , k T k ≤ supn k Tn k < ∞ , und man hat Tn → T gleichmäßig auf allen kompakten Teilmengen von X . Beweis. Nach Voraussetzung sind die Mengen {Tn x | n ∈ N} für alle x ∈ X beschränkt, und nach Theorem 6.3 gibt es C > 0 mit k Tn k ≤ C für alle n ∈ N . Die weiteren Aussagen ergeben sich dann aus Satz 5.26. 3 6.6 Satz. Es seien X, Y Banachräume und (Tn ) eine Folge in L(X, Y ) . Dann sind die folgenden Aussagen äquivalent : (a) (Tn ) konvergiert gleichmäßig auf kompakten Mengen in X . (b) (Tn ) konvergiert punktweise auf X . (c) (Tn ) konvergiert punktweise auf einer dichten Teilmenge von X , und es gilt sup {k Tn k | n ∈ N} < ∞ . Beweis. (a) ⇒ (b)“ ist klar. Für (b) ⇒ (c)“ benutzt man Theorem 6.3, und die ” ” Implikation (c) ⇒ (a)“ folgt wieder aus Satz 5.26. 3 ” Es folgt eine Anwendung auf Fourier-Reihen stetiger periodischer Funktionen: 6.7 Satz. Für t ∈ [−π, π] gibt es eine Funktion f ∈ C2π , so dass die Partialsummen (sn (f ; t) = n P k=−n fb(k)eikt ) der Fourier-Reihe unbeschränkt sind. Beweis. Nach Satz 2.5 ist stn : f 7→ sn (f ; t) eine stetige Linearform auf C2π mit k stn k = Rπ −π | Dn (t − s) |ds ¯ = k Dn k L 1 . Ist die Behauptung falsch, so folgt sup k stn k < ∞ aus dem Prinzip der gleichmäßigen n∈N Beschränktheit. Man berechnet aber leicht Widerspruch. Rπ −π | Dn (t) |dt ¯ ≥ c log n und erhält einen 3 Mit geeigneten topologischen Begriffen lässt sich zeigen, dass sogar für viele“ Funk” tionen in C2π die Folge (sn (f ; t)) in vielen“ Punkten t unbeschränkt ist, vgl. [KFA], ” Abschnitt 8.4. Nach einem tiefliegenden Satz von L. Carleson (1966) ist jedoch die 6 Konsequenzen aus dem Satz von Baire 41 Fourier-Reihe einer L2 -Funktion fast überall konvergent. R.A. Hunt zeigte 1968, dass dies für p > 1 auch für die Fourier-Reihe einer Lp -Funktion gilt. Bereits 1926 hatte aber A. Kolmogorov eine L1 -Funktion konstruiert, deren Fourier-Reihe überall divergent ist. 6.8 Theorem (vom inversen Operator). Es seien X, Y Banachräume und T ∈ L(X, Y ) bijektiv. Dann ist auch der inverse Operator T −1 : Y → X stetig (und linear). Beweis. a) Für die offenen Einheitskugeln U und V von X und Y gilt ∃ δ > 0 : T (U) ⊇ δ V . Denn: Wegen X = ∞ S (4) k U gilt Y = R(T ) = k=1 ∞ S T (kU) . Nach dem Satz von Baire k=1 ◦ gibt es n ∈ N mit T (nU) 6= ∅ . Somit existieren y0 ∈ Y und α > 0 mit Vα (y0 ) ⊆ T (nU) . Für y ∈ α V gilt dann y0 ∈ T (nU) und y +y0 ∈ T (nU) ; es gibt also Folgen (aj ) und (bj ) in U mit nT (aj ) → y0 und nT (bj ) → y + y0 für j → ∞ . Folglich gilt nT (bj − aj ) → y , und wegen k bj − aj k < 2 erhält man y ∈ T (2nU) und damit α α V ⊆ T (2nU) = 2n T (U) . Daraus folgt (4) mit δ = 2n . b) Die Behauptung folgt nun aus a) und (1 + ε) T (U) ⊇ T (U) für alle ε > 0 . (5) Dazu sei ε1 := 1 , und δ > 0 erfülle Bedingung (4). Wir wählen eine Nullfolge (εn )n≥2 in (0, ∞) mit εn−1 > εn und ∞ P n=2 εn < ε und setzen δn = δ εn . Zu y ∈ T (U) gibt es z1 ∈ T (U) mit y − z1 =: y2 ∈ δ2 V . Wegen (4) gilt δ2 V ⊆ T (ε2 U) ; zu y2 gibt es also z2 ∈ T (ε2 U) mit y − z1 − z2 = y2 − z2 =: y3 ∈ δ3 V ⊆ T (ε3 U) . So fortfahrend konstruieren wir für n ∈ N Elemente zn ∈ T (εn U) und yn ∈ δn V mit y− n P j=1 zj = yn+1 , n ∈ N . (6) Nun wählen wir xj ∈ εj U mit T xj = zj . Wegen der Vollständigkeit von X existiert x := sich schließlich T x = ∞ P j=1 T xj = ∞ P j=1 ∞ P j=1 ∞ P j=1 k xj k ≤ 1 + ∞ P j=2 εj < 1 + ε und xj ∈ (1 + ε) U . Wegen yn → 0 ergibt zj = y . 3 Im Beweis von Theorem 6.8 wurde die Injektivität von T nicht benutzt. Die Aussagen (4) und (5) gelten daher für alle surjektiven Abbildungen zwischen Banachräumen; diese sind dann offene Abbildungen. Dieses von S. Banach und J. Schauder stammende Resultat heißt Satz von der offenen Abbildung, vgl. [KFA], 8.3 für eine noch etwas allgemeinere Aussage. 6.9 Normal auflösbare Gleichungen. Aus Theorem 6.8 ergibt sich auch die Umkehrung von Satz 5.16: Es seien H, G Hilberträume, und T ∈ L(H, G) habe abgeschlossenes Bild. Dann ist T1 := T |N (T )⊥ : N(T )⊥ → R(T ) eine stetige lineare Bijektion zwischen Banachräumen, und nach Theorem 6.8 ist die Umkehrabbildung T1−1 stetig. Daher gilt (5.16): ∃ γ > 0 ∀ x ∈ N(T )⊥ : k T x k ≥ γ k x k . 42 I. Hilberträume und beschränkte lineare Operatoren 6.10 Operatoren mit abgeschlossenen Graphen. a) Es seien X, Y normierte Räume. Für eine lineare Abbildung T : X → Y ist der Graph Γ(T ) = {(x, T x) | x ∈ X} ein Unterraum von X × Y ; dieser ist genau dann abgeschlossen in X × Y , wenn für jede Folge (xn ) in X gilt: xn → x in X und T xn → y in Y ⇒ y = T x . (7) b) Stetige lineare Operatoren T ∈ L(X, Y ) besitzen also abgeschlossene Graphen. Die Umkehrung dieser Aussage ist i. a. nicht richtig: Der Differentialoperator d dt : (C 1 [a, b], k ksup ) → (C[a, b], k ksup ) , d f dt := f ′ , ist unstetig. Gilt aber k fn − f ksup → 0 und k dtd fn − g ksup → 0 , so folgt (vgl. [KA1], 22.14), und somit ist Γ( dtd ) abgeschlossen. Es gilt jedoch: (8) d f dt =g 6.11 Satz (vom abgeschlossenen Graphen). Es seien X, Y Banachräume und T : X → Y eine lineare Abbildung mit abgeschlossenem Graphen. Dann ist T stetig. Beweis. Durch j : x 7→ (x, T x) wird eine lineare Bijektion von X auf Γ(T ) definiert. Offenbar ist j −1 stetig. Da X und Γ(T ) Banachräume sind, ist nach Satz 6.8 auch j stetig, und dies gilt dann auch für T . 3 Eine typische Anwendung des Graphensatzes ist der folgende Beweis: 6.12 Satz (Hellinger-Toeplitz). Es seien H ein Hilbertraum und T : H → H ein symmetrischer linearer Operator, d. h. es gelte hT x|yi = hx|T yi für alle x, y ∈ H . Dann ist T stetig. Beweis. Es gelte xn → x und T xn → y in H . Für z ∈ H ist dann hT x|zi = hx|T zi = lim hxn |T zi = lim hT xn |zi = hy|zi , n→∞ n→∞ und es folgt y = T x . Nach (7) hat also T einen abgeschlossenen Graphen und ist somit stetig aufgrund von Satz 6.11. 3 7 Schwache Konvergenz 7 43 Schwache Konvergenz Der Nachweis der Existenz eines Maximums oder Minimums einer beschränkten reellwertigen Funktion beruht oft auf Kompaktheitsargumenten. Die Einheitskugel unendlichdimensionaler Hilberträume ist nicht kompakt; wir zeigen in den Sätzen 7.5 und 7.8 aber doch schwache Versionen“ des Satzes von Bolzano-Weierstraß, mit ” deren Hilfe Kompaktheitsargumente zur Lösung von Variationsproblemen verwendet werden können. 7.1 Definition. Es sei H ein Hilbertraum. Eine Folge (xn ) in H konvergiert w schwach gegen x ∈ H , Notation: xn → x , falls gilt hy|xn i → hy|xi für alle y ∈ H . (1) 7.2 Beispiele und Bemerkungen. a) Mittels der Isometrie j : H → H′ , jx(y) = hy|xi für y ∈ H , aus 2.9 kann man Vektoren aus H als stetige Linearformen auf H auffassen; schwache Konvergenz einer Folge (xn ) in H bedeutet dann punktweise Konvergenz der Folge (jxn ) in H ′ . Insbesondere sind schwache Grenzwerte eindeutig bestimmt. w b) Für eine orthonormale Folge (en ) gilt k en k = 1 , aber en → 0 aufgrund der w w Besselschen Ungleichung (4.3). Aus xn → x und zn → z folgt also i. a. nicht hxn |zn i → hx|zi . c) Für eine beliebige Folge in H gilt w k x − xn k → 0 ⇔ xn → x und k xn k → k x k . Aussage ⇒ “ ist klar, und ⇐ “ folgt aus ” ” 2 k x − xn k = k x k2 − 2 Re hxn |xi + k xn k2 . (2) w d) Es seien H und G Hilberträume und T ∈ L(H, G) . Aus xn → x in H folgt w dann T xn → T x in G wegen hy|T xn i = hT ∗ y|xn i → hT ∗ y|xi = hy|T xi für y ∈ G . e) Es sei V ein Unterraum von H . Für eine Folge (vn ) in V gilt dann w vn → v in V ⇔ w vn → v in H , (3) da ja hy|vn i = 0 für y ∈ V ⊥ ist. f) Aufgrund von Satz 6.4 sind schwach konvergente Folgen in H Norm-beschränkt. 7.3 Satz. Eine Folge (x(n) ) konvergiert genau dann schwach gegen x in ℓ2 , wenn die folgende Aussage gilt: sup k x(n) k < ∞ n∈N und (n) xk → xk für alle k ∈ N0 . (4) Beweis. ⇒ “ folgt aus 7.2 f) und xk = hx|ek i . ” ⇐ “: Nach Voraussetzung gilt jxn (ek ) → jx(ek ) für alle k ∈ N0 , also jxn → jx ” punktweise auf [ek ]∞ k=1 . Wegen der Dichtheit dieses Raumes in ℓ2 impliziert Satz 5.26 dann jxn → jx punktweise auf ℓ2 . 3 Das folgende Lemma spielt eine wichtige Rolle bei Kompaktheitsbeweisen: 44 I. Hilberträume und beschränkte lineare Operatoren 7.4 Lemma. Es seien A eine abzählbare Menge und (fn ) eine punktweise beschränkte Folge von Funktionen auf A , d. h. für alle a ∈ A seien die Folgen (fn (a)) in K beschränkt. Dann hat (fn ) eine punktweise konvergente Teilfolge. Beweis. Es sei A = {aj | j ∈ N .} Da (fn (a1 )) in K beschränkt ist, hat (fn ) eine Teilfolge (fn(1) ) , für die (fn(1) (a1 )) konvergiert. Dann hat (fn(1) ) eine Teilfolge (fn(2) ) , für die (fn(2) (a2 )) konvergiert. So fortfahrend wählt man für j ∈ N rekursiv Teilfolgen (fn(j) ) von (fn(j−1) ) , für die (fn(j) (aj )) konvergiert. Nach Konstruktion konvergiert dann (fn(j) (ak )) für k ≤ j . Aus diesen sukzessive ausgewählten Teilfolgen f1 (1) f1 (2) f1 (3) f1 (4) f1 (5) f1 .. . f2 (1) f2 (2) f2 (3) f2 (4) f2 (5) f2 .. . f3 (1) f3 (2) f3 (3) f3 (4) f3 (5) f3 .. . f4 (1) f4 (2) f4 (3) f4 (4) f4 (5) f4 .. . f5 (1) f5 (2) f5 (3) f5 (4) f5 (5) f5 .. . f6 (1) f6 (2) f6 (3) f6 (4) f6 (5) f6 .. . ··· ··· ··· ··· ··· ··· .. . bildet man nun die Diagonalfolge (fn∗ ) := (fn(n) ) . Diese ist Teilfolge von (fn ) und, für n ≥ j , auch von (fn(j) ) ; daher konvergiert (fn∗ (aj )) für alle j ∈ N . 3 Es gilt die folgende schwache Version“ des Satzes von Bolzano-Weierstraß: ” 7.5 Theorem. Eine beschränkte Folge (xn ) in einem Hilbertraum H besitzt eine schwach konvergente Teilfolge. Beweis. Die Folge (xn ) liegt in einem separablen Unterraum V von H . Wegen 7.2 e) kann man daher annehmen, dass H separabel ist; es gibt also eine in H dichte abzählbare Menge A . Nach Lemma 7.4 besitzt die Folge (jxn ) eine auf A punktweise konvergente Teilfolge, und nach Satz 5.26 ist diese Teilfolge dann wegen ihrer Beschränktheit auf ganz H punktweise konvergent. 3 7.6 Beispiel. Zur Vorbereitung des nächsten Satzes betrachten wir eine orthonorw male Folge (en ) in einem Hilbertraum H . Es gilt en → 0 , und man hat k n1 n P k=1 ek k2 = n P k=1 1 n2 = 1 n → 0. 7.7 Satz (Banach-Saks). In einem Hilbertraum gelte die schwache Konvergenz w xn → x . Dann gibt es eine Teilfolge (xnj ) von (xn ) mit k k1 Beweis. a) Wegen 1 k k P j=1 xnj − x = 1 k k P k P j=1 xnj − x k → 0 . (xnj − x) kann man x = 0 annehmen. j=1 b) Nach 7.2 f) gibt es C ≥ 0 mit k xn k ≤ C für alle n . Es sei n1 = 1 . Wegen w xn → 0 gibt es n2 > 1 mit | hxn1 |xn i | ≤ 21 für n ≥ n2 . Weiter gibt es n3 > n2 7 Schwache Konvergenz 45 mit | hxn2 |xn i | ≤ 14 und | hxn1 |xn i | ≤ 14 für n ≥ n3 . So fortfahrend erhält man eine Teilfolge mit | hxnj |xnk+1 i | ≤ 2−j für 1 ≤ j ≤ k . Daraus folgt k n1 n P j=1 n P xnj k2 = 1 n2 = 1 n2 ( 1 n2 (n + C n + n) ≤ (C + 2) · ≤ hxnj |xnk i j,k=1 n k−1 P P hxnj |xnk i + k=1 j=1 2 n P k=1 2 k xnk k2 + 1 n n j−1 P P hxnj |xnk i) j=1 k=1 . 3 Nach Theorem 7.5 und dem Satz von Banach-Saks 7.7 besitzt also jede beschränkte Folge (xn ) in einem Hilbertraum H eine im Mittel konvergente Teilfolge: 7.8 Satz. Es sei (xn ) eine beschränkte Folge in einem Hilbertraum H . Dann gibt es eine Teilfolge (xnj ) von (xn ) , sodass die Folge ( k1 k P j=1 xnj ) konvergiert. 7.9 Folgerung. Es seien H ein Hilbertraum, C ⊆ H eine konvexe abgeschlossene w Menge und (xn ) eine Folge in C mit xn → x ∈ H . Dann folgt auch x ∈ C . Folgerung 7.9 ist ohne die Konvexitätsbedingung nicht richtig. So ist z. B. die Einheitssphäre S = {x ∈ ℓ2 | k x k = 1} in ℓ2 abgeschlossen, aber für die Einheitsvekw toren S ∋ en gilt en → 0 nach Beispiel 7.2 b). Wir wollen nun einen Existenzsatz für Minima reeller Funktionale beweisen. Dazu benötigen wir die folgenden Begriffe: 7.10 Konvexe Funktionen und halbstetige Funktionen. a) Es seien E ein Vektorraum und C ⊆ E eine konvexe Menge. Eine Funktion F : C → R heißt konvex, falls gilt F( n P k=1 sk xk ) ≤ n P k=1 sk F (xk ) für xk ∈ C , 0 ≤ sk ≤ 1 und n P k=1 sk = 1 . (5) b) Es seien X ein normierter Raum und Ω ⊆ X . Eine Funktion F : Ω → R heißt unterhalbstetig in x0 ∈ Ω , wenn diese Hälfte“ der Stetigkeitsbedingung erfüllt ist: ” ∀ ε > 0 ∃ δ > 0 ∀ x ∈ Ω : k x − x0 k < δ ⇒ F (x) > F (x0 ) − ε . (6) 7.11 Satz. Es seien H ein Hilbertraum und ∅ = 6 C ⊆ H eine abgeschlossene konvexe Menge. Eine nach unten beschränkte unterhalbstetige konvexe Funktion F : C → R mit F (x) → ∞ für x ∈ C und k x k → ∞ (7) besitzt ein Minimum auf C . Beweis. a) Es sei d = inf F (x) ∈ R und (xn ) eine Minimalfolge in C , d. h. es gelte x∈C F (xn ) → d . Wegen (7) ist dann (xn ) beschränkt, und nach Theorem 7.5 gibt es eine gegen x0 ∈ H schwach konvergente Teilfolge, die wir wieder mit (xn ) bezeichnen. Nach Satz 7.9 gilt x0 ∈ C . 46 I. Hilberträume und beschränkte lineare Operatoren b) Zu ε > 0 wählen wir k ∈ N mit F (xn ) < d + ε für n ≥ k sowie δ > 0 gemäß (6). Nun wenden wir den Satz von Banach-Saks auf die Folge (xn )n≥k an und finden eine konvexe Kombinationen x = r P j=k von F folgt F (x0 ) ≤ F (x) + ε ≤ sj xj ∈ C mit k x−x0 k < δ . Wegen der Konvexität r P j=k sj F (xj ) + ε ≤ d + 2ε , und mit ε → 0 ergibt sich F (x0 ) ≤ d . 3 Der Projektionssatz 5.1 ist ein Spezialfall von Satz 7.11; in der Tat erfüllt für x1 ∈ H die Funktion F : x 7→ k x1 − x k dessen Voraussetzungen. Auf Anwendungen in der Variationsrechnung können wir hier nicht eingehen. Wir zeigen noch die folgende Version des Ergodensatzes 5.25: 7.12 Satz. Es seien H ein Hilbertraum und T ∈ L(H) mit k T n k ≤ C für alle n−1 1 P T jx n→∞ n j=0 n ∈ N . Dann existiert der Limes P x := lim für alle x ∈ H , und P ist eine stetige (nicht notwendig orthogonale) Projektion von H auf N(I − T ) mit N(P ) = R(I − T ) . Beweis. a) Für die Operatoren Pn : x 7→ 1 n n−1 P j=0 T j x gilt k Pn k ≤ C . Für Vektoren x ∈ N(I − T ) gilt offenbar Pn x = x für alle n ∈ N . Wie im Beweis von Satz 5.25 hat man n→∞ lim Pn x = 0 für x = y − T y ∈ R(I − T ) , also auch für x ∈ R(I − T ) aufgrund von Satz 5.26. b) Für x ∈ N(I − T ) ∩ R(I − T ) gilt x = lim Pn x und lim Pn x = 0 , also x = 0 . n→∞ Wir zeigen nun H = N(I − T ) ⊕ R(I − T ) : n→∞ w c) Es sei x ∈ H gegeben. Nach Theorem 7.5 gilt Pnj x → x∗ ∈ H für eine geeignete Teilfolge von (Pn x) . Wegen k T Pn x − Pn x k → 0 ist T x∗ = x∗ , also ⊥ x∗ ∈ N(I−T ) . Weiter ist x−x∗ ∈ R(I − T ) . Andernfalls gibt es y ∈ R(I − T ) mit hx − x∗ |yi = 6 0 . Wegen T n x−T n−1 x ∈ R(I −T ) für n ∈ N ist aber hT n x|yi = hx|yi für alle n ∈ N , also auch hx − Pn x|yi = 0 und schließlich hx − x∗ |yi = 0 wegen w Pnj x → x∗ . d) Nach a)–c) existiert P x := lim Pn x für alle x ∈ H , und der Satz von Banachn→∞ Steinhaus liefert P ∈ L(H) . Wegen P = I auf N(I − T ) und P = 0 auf R(I − T ) ist P eine stetige Projektion von H auf N(I − T ) mit N(P ) = R(I − T ) . 3 8 Grundlagen der Spektraltheorie 8 47 Grundlagen der Spektraltheorie Die geometrische Reihe liefert das folgende einfache, aber fundamentale Resultat der Störungstheorie: 8.1 Satz (Neumannsche Reihe). Es seien X ein Banachraum und T ∈ L(X) P mit k T k < 1 . Dann ist die Reihe k T k in L(X) absolut konvergent, und es gilt ∞ P k=0 T k = (I − T )−1 . (1) Insbesondere ist also I − T invertierbar. Beweis. Die absolute Konvergenz der Reihe folgt sofort aus k T k k ≤ k T kk und k T k < 1 . Nach Satz 1.20 existiert also S := ∞ P (I − T ) S = S(I − T ) = k=0 Tk − 8.2 Bemerkungen. a) Die Summe S := Sn := n P ∞ P ∞ P k=0 ∞ P T k ∈ L(X) , und man hat Tk = I . k=1 3 T k lässt sich iterativ berechnen: Mit k=0 T k k=0 gilt offenbar S0 = I , Sn+1 = I + T Sn und Sn → S . b) Für n ∈ N hat man die Fehlerabschätzung ∞ P k S − Sn k = k k=n+1 Tk k ≤ ∞ P k=n+1 kTk k ≤ es liegt also mindestens lineare Konvergenz vor. ∞ P k=n+1 k T kk = k T kn+1 1−k T k ; 8.3 Spektralradius. a) Statt k T k < 1 “ genügt für die Konvergenz der Neu” mannschen Reihe auch die schwächere Bedingung ∞ P k=0 kTk k < ∞; (2) diese Verschärfung ist etwa für Volterrasche Integralgleichungen (vgl. Beispiel 8.6) wesentlich. Nach dem Wurzelkriterium folgt diese bereits aus r(T ) := lim sup q k kTk k < 1. (3) Die Zahl r(T ) ∈ [0, k T k] heißt Spektralradius von T ; die Namensgebung erklären wir in Satz 8.14. b) Der Limes superior in (3) ist sogar ein echter Limes: Für αk := k T k k gilt stets αi+j ≤ αi αj . Für feste k ∈ N schreibt man n = mk + r mit 0 ≤ r < k und erhält m/ 1 1/ 1 − r/kn αn/n ≤ αk n αr/n = αk k αk 1 αr/n , 1/ 1 1 1/ also lim sup αn/n ≤ inf k αk k und damit lim αn/n = inf k αk k . n→∞ c) An Stelle von (2) genügt für die Invertierbarkeit von I − T auch die Bedingung ∀x∈X : Durch Sx := ∞ P k=0 ∞ P k=0 k T kx k < ∞ . (4) T k x wird in der Tat eine linearer Operator S : X → X definiert, der (I − T )Sx = x und S(I − T )x = x für alle x ∈ X erfüllt. Die Stetigkeit von S folgt aus dem Satz von Banach-Steinhaus oder dem Satz vom inversen Operator. 48 I. Hilberträume und beschränkte lineare Operatoren 8.4 Fredholmsche Integralgleichungen. a) Es seien Ω ⊆ Rn messbar und κ : Ω2 7→ K ein messbarer Kern mit k κ k2L2 < 1 oder k κ kZI k κ kSI < 1 . (5) Dann hat die Integralgleichung f (t) − R K κ(t, s) f (s) ds = g(t) , t∈K, (6) nach den Sätzen 8.1 und 2.13 bzw. 2.14 für jede Funktion g ∈ L2 (Ω) genau eine Lösung f ∈ L2 (Ω) . b) Nun seien K ⊆ Rn kompakt und κ ∈ C(K 2 ) stetig. Gilt (5), so gibt es zu g ∈ C(K) genau eine Lösung f ∈ L2 (K) von (I − Sκ )f = g . Nun gilt Sκ f ∈ C(K) und somit auch f ∈ C(K) ; der Operator I − Sκ ist unter der Bedingung (5) also auch auf dem Banachraum C(K) bijektiv. 8.5 Lineare Systeme von Differentialgleichungen. a) Es seien J ⊆ R ein kompaktes Intervall, a ∈ J , ξ ∈ Kn , A ∈ C(J, MK (n)) und b ∈ C(J, Kn ) . Das Anfangswertproblem ẋ = A(t) x + b(t) , x(a) = ξ (7) ist aufgrund des Hauptsatzes der Differential- und Integralrechnung äquivalent zur Integralgleichung x(t) = ξ + Rt a (A(s) x(s) + b(s)) ds , t∈J. b) Man führt den Integraloperator (V x)(t) := Rt a ein. Mit B(t) := ξ + A(s) x(s) ds , Rt a t ∈ J , x ∈ C(J, Kn ) , b(s) ds , t ∈ J , ist diese dann äquivalent zur Gleichung (I − V ) x = B im Banachraum C(J, Kn ) . (8) c) Es ist V ein spezieller Volterra-Operator auf C(J, Kn ) . Für diesen zeigen wir r(V ) = 0 in (11) unten. Somit besitzt die Gleichung (8) und daher auch das Anfangswertproblem (7) genau eine Lösung in C(J, Kn ) (Satz von Picard-Lindelöf für lineare Systeme). 8.6 Volterrasche Integralgleichungen. a) Für einen stetigen Matrix-wertigen Kern κ ∈ C(J 2 , MK (n)) wird durch (V f )(t) := (Vκ )f (t) := Rt a κ(t, s) f (s) ds , t ∈ J , f ∈ C(J, Kn ) , (9) ein linearer Operator V : C(J, Kn ) 7→ C(J, Kn ) definiert. b) Wegen k V f (t) k ≤ (t − a) k κ ksup k f ksup , t∈J, (10) ist V ∈ L(C(J, Kn )) . Aus (9) und (10) folgt weiter k V 2 f (t) k ≤ k κ k Rt a k V f (s) k ds ≤ k κ k2 k f k Rt a (s − a) ds = (t−a)2 2 k κ k2 k f k . 49 8 Grundlagen der Spektraltheorie Induktiv liefert dieses Argument k V j f (t) k ≤ kVj k ≤ (b−a)j j! k κ kj (t−a)j j! k κ kj k f k , also für j ∈ N . (11) c) Aus (11) folgt r(V ) = 0 für den Spektralradius von V , insbesondere also die Konvergenz der Neumannschen Reihe Integralgleichung f (t) − Rt a ∞ P j=0 V j = (I −V )−1 . Somit ist die Volterrasche κ(t, s) f (s) ds = (I − V )f (t) = g(t) (12) für alle g ∈ C(J, Kn ) durch f = (I − V )−1 g in C(J, Kn ) eindeutig lösbar. d) Es gilt auch r(V ) = 0 für den Volterra-Operator aus (9) auf dem Hilbertraum L2 (J) . Für f ∈ L2 (J) gilt in der Tat V f ∈ C(J) und daher √ √ j−1 b − a k V j−1 V f ksup ≤ b − a (b−a) k V j f k L2 ≤ k κ kj−1 k V f ksup (j−1)! ≤ (b−a)j (j−1)! k κ k j k f k L2 . Die Spektraltheorie linearer Operatoren verallgemeinert das Studium von Eigenwerten und Eigenvektoren auf den unendlichdimensionalen Fall“. ” 8.7 Offene Gruppe und stetige Inversion. a) Für einen Banachraum X sei GL(X) := {T ∈ L(X) | ∃ S ∈ L(X) : T S = ST = I} die Gruppe der invertierbaren Operatoren in L(X) . b) Für T ∈ GL(X) und S ∈ L(X) mit k S − T k < k T −1 k−1 gilt S = T + (S − T ) = (I + (S − T ) T −1 ) T und k (S − T ) T −1 k < 1 . Aus 8.1 folgt I + (S − T ) T −1 ∈ GL(X) und daher auch S ∈ GL(X) . Weiter ist S −1 = T −1 (I + (S − T ) T −1 )−1 = T −1 und daraus folgt k S −1 − T −1 k ≤ k T −1 k ∞ P k=1 ∞ P (−1)k ((S − T ) T −1)k , k=0 k S − T kk k T −1 kk = k T −1 k2 k S − T k . 1 − k T −1 k k S − T k c) Nach b) ist also GL(X) offen in L(X) , und die Inversion T 7→ T −1 ist stetig. Da die Inversion mit ihrer Umkehrabbildung übereinstimmt, ist sie sogar eine Homöomorphie von GL(X) auf GL(X) . 8.8 Definition. Es seien X ein Banachraum und T ∈ L(X) . a) Die Menge σ(T ) := {λ ∈ K | λI − T 6∈ GL(X)} heißt Spektrum von T . b) Das Komplement ρ(T ) := K\σ(T ) des Spektrums heißt Resolventenmenge von T . c) Die durch RT : λ → (λI − T )−1 definierte Funktion RT : ρ(T ) 7→ GL(X) heißt Resolvente von T . 50 I. Hilberträume und beschränkte lineare Operatoren 8.9 Feststellungen. a) Nach 8.7 c) ist die Resolventenmenge ρ(T ) offen in K , und die Resolvente RT : ρ(T ) 7→ L(X) ist stetig. b) Für λ, µ ∈ ρ(T ) gilt λI − T = (µI − T ) + (λ − µ)I ; Multiplikation von links mit RT (λ) und von rechts mit RT (µ) liefert die Resolventengleichung RT (λ) − RT (µ) = −(λ − µ) RT (λ) RT (µ) , λ, µ ∈ ρ(T ) . (13) c) Diese impliziert sofort lim λ→µ RT (λ)−RT (µ) λ−µ = −RT (µ)2 für µ ∈ ρ(T ) ; die Resolvente ist im Fall K = C also holomorph auf ρ(T ) . Funktionentheoretische Methoden spielen eine große Rolle in der Spektraltheorie; Illustrationen dazu folgen in den Sätzen 8.13 und 8.14. d) Für | λ | > r(T ) existiert RT (λ) = λ−1 (I − Tλ )−1 = 1 λ ∞ P ( Tλ )k ; (14) k=0 daher ist das Spektrum σ(T ) kompakt mit max {| λ | | λ ∈ σ(T )} ≤ r(T ) . (15) Im Fall K = C gilt sogar Gleichheit in (15), was den Namen Spektralradius für r(T ) erklärt; wir beweisen diese Tatsache in Satz 8.14. Insbesondere ist der Spektralradius von T ∈ L(Cn ) von der Wahl einer Norm auf Cn unabhängig. Weiter erhält man aus (14) die Abschätzung k RT (λ) k ≤ 1 | λ |−k T k für | λ | > k T k . (16) 8.10 Eigenwerte. a) Für T ∈ L(X) heißt eine Zahl λ ∈ K Eigenwert von T , falls es einen Vektor 0 6= x ∈ X mit T x = λx gibt; x heißt dann Eigenvektor von T zum Eigenwert λ . b) Für λ ∈ K gilt stets N(λI − T ) 6= {0} ⇒ λI − T 6∈ GL(X) ⇔ λ ∈ σ(T ) , (17) und im Fall dim X < ∞ gilt auch die Umkehrung dieser Aussage. Eigenwerte von T liegen also stets in σ(T ) , und im Fall dim X < ∞ stimmt σ(T ) mit der Menge aller Eigenwerte von T überein. c) Im Fall dim X < ∞ hat man weiter λ ∈ σ(T ) ⇔ χT (λ) := det (λI − T ) = 0 ; die Eigenwerte von T sind also die Nullstellen des charakteristischen Polynoms von T . Die Existenz von Eigenwerten im Fall K = C und dim X < ∞ beruht daher auf dem Fundamentalsatz der Algebra und ist zu diesem sogar äquivalent, da jedes komplexe Polynom charakteristisches Polynom einer geeigneten Matrix ist. Der Fundamentalsatz der Algebra kann mit Hilfe des funktionentheoretischen Satzes von Liouville bewiesen werden. Dieser besagt, daß jede auf ganz C holomorphe beschränkte Funktion konstant ist (vgl. etwa [KA3], 22.18). 8 Grundlagen der Spektraltheorie 51 d) Der spezielle Volterra-Operator (V f )(t) := Rt a f (s) ds , t ∈ [a, b] , (18) auf C[a, b] ist wegen (V f )′ = f injektiv, wegen (V f )(a) = 0 oder V f ∈ C 1 [a, b] aber nicht surjektiv; die Umkehrung von (17) ist in diesem Fall also falsch. Man hat 0 ∈ σ(V ) , aber 0 ist kein Eigenwert von V . Wegen r(V ) = 0 gilt also σ(V ) = {0} , V hat aber keinen Eigenwert. e) Wir zeigen jedoch in Satz 8.13, wiederum mit Hilfe des Satzes von Liouville, daß stetige lineare Operatoren stets ein nichtleeres Spektrum haben. Diese Aussage ist also eine Verallgemeinerung des Fundamentalsatzes der Algebra. 8.11 Beispiel. Der Links-Shift-Operator wird auf ℓ2 definert durch S− (x0 , x1 , x2 , x3 , . . .) := (x1 , x2 , x3 , x4 , . . .) . (19) Wegen k S k = 1 hat man σ(S− ) ⊆ {λ ∈ C | | λ | ≤ 1} . Für | λ | < 1 gilt offenbar S− (1, λ, λ2, λ3 , . . .) = λ (1, λ, λ2, λ3 , . . .) , d. h. λ ist ein Eigenwert von S− . Folglich gilt {λ ∈ C | | λ | < 1} ⊆ σ(S− ) , und wegen der Kompaktheit des Spektrums muss σ(S− ) = {λ ∈ C | | λ | ≤ 1} sein. Für den Beweis des folgenden Satzes 8.13 verwenden wir die folgende Konsequenz aus dem Satz von Hahn-Banach (vgl. [KFA], 9.1), den wir in dieser Vorlesung nicht benötigen: 8.12 Satz. Zu jedem Vektor x 6= 0 in einem Banachraum X gibt es eine stetige Linearform f ∈ X ′ mit f (x) 6= 0 . Für Hilberträume X ist dies klar, man setzt einfach f (y) := hy|xi . Auch für einige konkrete Banachräume wie X = ℓp , Lp (Ω) , C(K) ist Satz 8.12 leicht zu verifizieren. 8.13 Satz. Es seien X ein Banachraum über C und T ∈ L(X) . Dann gilt σ(T ) 6= ∅ . Beweis. Andernfalls ist nach 8.9 c) die Resolvente RT auf ganz C holomorph, und aus (16) folgt lim k RT (λ) k = 0 . Ist nun RT nicht konstant, so gibt es x ∈ X , | λ |→∞ sodass die Funktion RT x nicht konstant ist. Nach Satz 8.12 gibt es eine stetige Linearform f ∈ X ′ , für die f (RT x) nicht konstant ist. Nun ist aber f (RT x) ∈ O(C) eine skalare beschränkte ganze Funktion, und man hat einen Widerspruch zum Satz von Liouville. Somit ist RT konstant, und aus k RT (λ) k → 0 für | λ | → ∞ ergibt sich schließlich der Widerspruch RT = 0 . 3 8.14 Satz. Es seien H ein komplexer Hilbertraum und T ∈ L(H) . Für den Spektralradius gilt dann max {| λ | | λ ∈ σ(T )} = r(T ) = lim n→∞ q n kTn k. (20) 52 I. Hilberträume und beschränkte lineare Operatoren Beweis. Abschätzung ≤“ wurde in (15) gezeigt. Im Fall r(T ) = 0 hat man Gleich” heit, da nach Satz 8.13 stets σ(T ) 6= ∅ gilt. Nun gelte 0 ≤ R := max {| λ | | λ ∈ σ(T )} < r(T ) . Nach (14) gilt RT (λ) = ∞ P k=0 Tk λk+1 für | λ | > r(T ) . Für x, y ∈ H ist dann ∞ P k=0 hT k x|yi λk+1 die Laurent-Entwicklung in ∞ der skalaren Funktion hRT x|yi . Da diese auf dem Ring {λ ∈ C | | λ | > R} holomorph ist, konvergiert die Laurent-Entwicklung für | λ | > R (vgl. etwa [KA3], 23.1). Insbesondere ist für R < | λ | < r(T ) die Menge k k {h λTk+1x |yi} für alle x, y ∈ H beschränkt. Für x ∈ H ist also die Menge { λTk+1x } in H schwach beschränkt, nach Satz 6.4 also auch in der Norm beschränkt. Nach dem Prinzip der gleichmäßigen Beschränktheit gibt es also C = C(λ) ≥ 0 mit k 3 k λTk+1 k ≤ C für alle k ∈ N , und es folgt der Widerspruch r(T ) ≤ | λ | . Satz 8.14 gilt auch für Operatoren auf komplexen Banachräumen; dazu verwendet man den Satz von Hahn-Banach. 8.15 Satz. Für einen normalen Operator T ∈ L(H) auf einem Hilbertraum stimmen Spektralradius und Norm überein; es gilt r(T ) = max {| λ | | λ ∈ σ(T )} = n→∞ lim Beweis. Aus Formel (5.24) ergibt sich q n kTn k = kT k. k T 2 k2 = k (T 2 )∗ T 2 k = k (T ∗T )∗ (T ∗ T ) k = k T ∗ T k2 = k T k4 , k k induktiv also k T 2 k = k T k2 für alle k ∈ N . Da der obige Limes existiert (vgl. 8.3 b)), folgt daraus die Behauptung. 3 8.16 Satz. Es sei H ein Hilbertraum über C . a) Für einen selbstadjungierten Operator A ∈ L(H) gilt σ(A) ⊆ R und k RA (λ) k ≤ | Im λ |−1 für λ ∈ C\R . (21) b) Für einen unitären Operator U ∈ L(H) gilt σ(U) ⊆ S 1 = {z ∈ C | | z | = 1} und k RU (λ) k ≤ (1 − | λ |)−1 für λ ∈ C\S 1 . (22) Beweis. a) ist gerade die Aussage von Satz 5.18. b) Wegen k U k ≤ 1 gilt σ(U) ⊆ D := {z ∈ C | | z | ≤ 1} . Für | λ | < 1 gilt aber λI − U = U (λU −1 − I) ∈ GL(H) wegen k U −1 k = 1 . Für | λ | > 1 hat man | h (λI − U)x|x i | = | λh x|x i − h Ux|x i | ≥ (| λ | − 1) k x k2 , und es folgt k RU (λ) k ≤ (| λ | − 1)−1 nach Satz 7.8. Für | λ | < 1 argumentiert man ähnlich. 3 8.17 Nilpotente und quasinilpotente Operatoren. a) Es sei X ein Banachraum. Ein Operator T ∈ L(X) heißt nilpotent, wenn T p = 0 für ein p ∈ N gilt und quasinilpotent, wenn r(T ) = 0 ist. b) Nach (11) sind die Volterra-Integraloperatoren aus 8.6 quasinilpotent; der Operator aus (18) zeigt, daß sie i. a. aber nicht nilpotent sind. 8 Grundlagen der Spektraltheorie 53 c) Im Fall K = C ist T ∈ L(X) genau dann quasinilpotent, wenn σ(T ) = {0} gilt; dies folgt aus den Sätz 8.13 und 8.14. Im Fall dim X = n < ∞ ist jeder quasinilpotente Operator T ∈ L(X) sogar nilpotent mit T n = 0 . Zum Beweis betrachtet man die Kette der Bildräume X ⊇ R(T ) ⊇ R(T 2 ) ⊇ . . . ⊇ R(T j ) ⊇ R(T j+1) . . . . Aus Dimensionsgründen gibt es 0 ≤ p ≤ n mit R(T p ) = R(T p+1) . Dann ist T ∈ L(R(T p )) surjektiv, also invertierbar. Ist T p 6= 0 , so hat T auf R(T p ) einen Eigenwert 6= 0 im Widerpruch zu σ(T ) = {0} . 8.18 Kommutatoren. a) In der Quantenmechanik werden physikalische Größen wie Ort, Impuls, Energie usw. durch (selbstadjungierte, i. a. unbeschränkte) lineare Operatoren beschrieben; das Spektrum (⊆ R ) eines solchen Operators ist dann die Menge der möglichen Meßergebnisse. b) Der Kommutator [P, Q] := P Q − QP der Operatoren Q und P von Ort und Impuls eines eindimensionalen Teilchens muß die Heisenbergsche Vertauschungsrelation P Q − QP = h̄ i I (23) erfüllen, wobei 2πh̄ > 0 die Plancksche Konstante ist; diese impliziert dann die Heisenbergsche Unschärferelation (vgl. 13.5). Durch Qf (t) := t f (t) , P f (t) := h̄ df i dt kann (23) leicht auf den Definitionsbereichen C ∞ (R) oder D(R) := C ∞ (R) ∩ Cc (R) realisiert werden. b) Andererseits kann (23) nicht durch beschränkte lineare Operatoren auf einem Banachraum X realisiert werden. Für T, S ∈ L(X) gilt nämlich stets T S − ST 6= I . (24) Andernfalls folgt leicht mit Induktion T n S − ST n = n T n−1 6= 0 . (25) Für n = 1 ist (25) gerade (24). Gilt nun (25) für n ∈ N , so folgt zunächst T n 6= 0 und dann auch T n+1 S − ST n+1 = T (ST n + nT n−1 ) − ST n+1 = (T S − ST )T n + nT n = (n + 1) T n . Aus (25) erhält man dann n k T n−1 k = k T n S − ST n k ≤ 2 k T n k k S k ≤ 2 k T n−1 k k T k k S k und somit den Widerspruch n ≤ 2 k T k k S k für alle n ∈ N . c) Die Aussage von b) folgt auch aus der Gleichung σ(T S) ∪ {0} = σ(ST ) ∪ {0} , die sogar in jeder Algebra (ohne eine Norm) gültig ist. (26) 54 9 II. Unbeschränkte Operatoren und Observable der Quantenmechanik Abgeschlossene und abschließbare Operatoren 9.1 Lineare Operatoren und Graphen. Es seien X , Y Banachräume über K = R oder K = C . a) Ein linearer Operator von X nach Y ist eine lineare Abbildung T : D(T ) → Y mit einem Unterraum D(T ) ⊆ X als Definitionsbereich. Mit R(T ) ⊆ Y bezeichnen wir das Bild von T . Im Fall X = Y nennen wir T einen Operator in X . b) Ein Operator U von X nach Y heisst Erweiterung von T , falls D(T ) ⊆ D(U) und Ux = T x für x ∈ D(T ) gilt; wir schreiben dann T ⊆ U . c) Mit Γ(T ) := {(x, T x) | x ∈ D(T )} ⊆ X × Y bezeichnen wir wie in 6.10 den Graphen von T . Durch τ : D(T ) → Γ(T ) , τ x := (x, T x) , wird eine lineare Isomorphie von D(T ) auf den Graphen Γ(T ) definiert. d) Auf dem Produktraum X × Y verwenden wir die ℓ2 -Norm k (x, y) k2 := k x k2 + k y k2 , (x, y) ∈ X × Y ; im Fall von Hilberträumen X, Y ist dann auch X × Y ein Hilbertraum. Auf dem Vektorraum D(T ) definieren wir die Graphennorm durch k x k2T := k x k2 + k T x k2 , x ∈ D(T ) , (1) und führen die Bezeichnung DT := (D(T ), k kT ) (2) für den durch die Graphennorm normierten Raum D(T ) ein. Damit wird die obige Isomorphie τ zu einer Isometrie τ : DT → Γ(T ) , τ x := (x, T x) . (3) Die Inklusion i : DT → X , ix := x , (4) und der Operator T : DT → Y sind offenbar stetig. e) Ein Operator T von X nach Y heisst abgeschlossen, falls sein Graph Γ(T ) in X × Y abgeschlossen ist. Nach dem Satz vom abgeschlossenen Graphen 6.11 ist ein abgeschlossener Operator mit D(T ) = X automatisch stetig. f) Ein Operator T von X nach Y heisst abschließbar, falls der Abschluss Γ(T ) des Graphen wieder ein Graph in X × Y ist. 9.2 Satz. Es seien X , Y Banachräume. Für einen Operator T von X nach Y sind äquivalent: (a) T ist abgeschlossen. (b) Für eine Folge (xn ) in D(T ) mit xn → x in X und T xn → y in Y folgt x ∈ D(T ) und T x = y . (c) Der normierte Raum DT ist vollständig. 11 Abgeschlossene und abschließbare Operatoren 55 Beweis. Es ist (b) eine Ausformulierung der Abgeschlossenheit von Γ(T ) , also äquivalent zu (a). Weiter folgt (a) ⇔ (c)“ sofort aus der Vollständigkeit von X ×Y ” und der Isometrie DT ∼ 3 = Γ(T ) . 9.3 Multiplikationsoperatoren und Ortsoperatoren. a) Es seien Ω ⊆ Rn offen und a ∈ C(Ω) eine stetige, i. a. unbeschränkte Funktion. Als erstes Beispiel betrachten wir den Multiplikationsoperator Ma : f 7→ af in L2 (Ω) mit Definitionsbereich D(Ma ) := {f ∈ L2 (Ω) | R Ω | a(t) f (t) |2 dt < ∞} . (5) Offenbar besteht D(Ma ) aus allen Äquivalenzklassen modulo Nullfunktionen messbarer Funktionen auf Ω mit k f k2Ma = R Ω | f (t) |2 (1 + | a(t) |)2 dt < ∞ , und daher ist DMa = L2 (Ω, (1 + | a |2) dt) ein Hilbertraum. Der Operator Ma ist also abgeschlossen. b) Speziell für a(t) = tj ist durch Qj := Mtj : f (t) 7→ tj f (t) in L2 (Rn ) der Ortsoperator der j -ten Koordinate gegeben. c) Allgemeiner können wir Multiplikationsoperator Ma : f 7→ af in L2 (Ω, Σ, µ) über beliebigen Maßräumen mit messbaren Funktionen a betrachten, vgl. dazu etwa [KFO], Satz 16.1. 9.4 Diagonaloperatoren. Nun sei a = (aj )j∈N0 eine beliebige Folge. Als diskre” ten Multiplikationsoperator“ betrachten wir im Folgenraum ℓ2 den Diagonaloperator ∆a = diag(aj ) : (xj ) 7→ (aj xj ) mit Definitionsbereich D(∆a ) := {x = (xj ) ∈ ℓ2 | ∞ P j=0 | aj xj |2 < ∞} . (6) 1 Dann ist auch D∆a = ℓ2 ((1 + | a |2 ) /2 ) ein Hilbertraum, und der Operator ∆a ist ebenfalls abgeschlossen. 9.5 Ein Differentialoperator. a) Über einem kompakten Intervall J = [a, b] betrachten wir den Differentialoperator T : f 7→ f ′ mit Definitionsbereich D(T ) = C 1 (J) im Banachraum C(J) . Für die Folge (fn (t) := n1 sin n(t−a)) gilt k fn ksup → 0 , aber (fn′ (t) = cos n(t − a)) und somit k T fn ksup = 1 6→ 0 ; der Operator T : (D(T ), k ksup ) → C(J) ist also unstetig. b) Es ist jedoch T ein abgeschlossener Operator in C(J) , da C 1 (J) unter der zu k kC 1 äquivalenten Graphennorm vollständig ist. Dies ergibt sich auch aus Satz 9.2 (b): Für eine Folge (fn ) in C 1 (J) mit fn → f in C(J) und fn′ → g in C(J) folgt f ∈ C 1 (J) und f ′ = g (vgl. etwa [KA1], 22.14 für eine etwas schärfere Aussage). c) Im Hilbertraum L2 (J) dagegen ist T nicht abgeschlossen, da man für eine Folge (fn ) in C 1 (J) aus fn → f in L2 (J) und fn′ → g in L2 (J) nicht f ∈ C 1 (J) schließen kann. Der Operator ist jedoch abschließbar; zum Nachweis dieser Tatsache verwenden wir den folgenden 56 II. Unbeschränkte Operatoren und Observable der Quantenmechanik 9.6 Satz. Es seien X , Y Banachräume. Für einen Operator T von X nach Y sind äquivalent: (a) T ist abschließbar. (b) Für eine Folge (xn ) in D(T ) mit xn → 0 in X und T xn → y in Y folgt y = 0. d → X der Inklusion (4) auf die Vervollständigung (c) Die stetige Fortsetzung bi : D T von DT ist injektiv. Beweis. (a) ⇒ (b)“: In (b) gilt (0, y) ∈ Γ(T ) , also y = 0 , da Γ(T ) ein Graph ” ist. (b) ⇒ (a)“: Für (x, y) ∈ Γ(T ) und (x, y ′ ) ∈ Γ(T ) gibt es Folgen (xn , yn ) und ” ′ ′ (xn , yn ) in Γ(T ) mit (xn , yn ) → (x, y) und (x′n , yn′ ) → (x, y ′ ) . Dann ist (xn − x′n ) eine Folge in D(T ) mit xn − x′n → 0 in X und T (xn − x′n ) → y − y ′ in Y . Aus (b) folgt dann y − y ′ = 0 , und folglich ist Γ(T ) ein Graph. (a) ⇔ (c)“: Der Operator τ aus (3) lässt sich zu einer bijektiven Isometrie ” d → Γ(T ) τb : D T auf die Vervollständigung von DT fortsetzen. Mit der Projektion π :X ×Y → X, π(x, y) := x , gilt i = πτ und somit auch bi = π τb . Daher ist bi genau dann injektiv, wenn dies auf 3 π|Γ(T ) zutrifft, und dies ist genau dann der Fall, wenn Γ(T ) ein Graph ist. Beachten Sie bitte, dass die stetige Fortsetzung eines injektiven linearen Operators auf den Abschluss oder die Vervollständigung von dessen Definitionsbereich i. a. nicht injektiv ist, vgl. dazu 2.7. 9.7 Abschluss von Operatoren. a) Für einen abschließbaren Operator T von X nach Y ist also Γ(T ) der Graph eines Operators T von X nach Y , und dieser Abschluss T von T ist offenbar die minimale abgeschlossene Erweiterung von T . b) Für ein Paar (x, T x) ∈ Γ(T ) = Γ(T ) gibt es eine Folge ((xn , T xn )) in Γ(T ) mit (xn , T xn ) → (x, T x) in X × Y . Dann ist (xn ) eine Cauchy-Folge in DT und d . Es folgt x = bix d → Y b und T (x) = Tb x b , wobei Tb : D hat einen Limes xb in D T T die stetige Fortsetzung von T auf die Vervollständigung von dessen Definitionsbed auch reich bezüglich der Graphennorm ist. Umgekehrt ist für ein Element xb ∈ D T bix b b ∈ D(T ) ; aufgrund der Injektivität von i gilt also zusammenfassend d D(T ) = biD T und T (bixb) = Tb xb für bixb ∈ D(T ) . (7) 9.8 Satz. Der Operator T : f 7→ f ′ in L2 (J) mit D(T ) = C 1 (J) ist abschließbar. Beweis. Es sei (fn ) eine Folge in C 1 (J) mit fn → 0 in L2 (J) und fn′ → g in L2 (J) . Für jede Testfunktion ϕ ∈ D(a, b) gilt dann Rb a Rb ′ f (t) ϕ(t) dt n→∞ a n g(t) ϕ(t) dt = lim und Satz 3.17 impliziert g = 0 . Rb n→∞ a = − lim fn (t) ϕ′ (t) dt = 0 , 3 11 Abgeschlossene und abschließbare Operatoren 57 9.9 Ein Sobolev-Raum. a) Der Definitionsbereich des Operators T heißt SobolevRaum W21 (a, b) := D(T ) . Dieser ist also der Raum aller Funktionen f ∈ L2 [a, b] , für die eine Folge (fn ) in C 1 [a, b] existiert, sodass k f − fn kL2 → 0 gilt und die Folge (fn′ ) eine Cauchy-Folge in L2 [a, b] ist. Der Limes T f = n→∞ lim fn′ hängt nach Satz 9.8 nicht von der Wahl der Folge (fn ) ab und kann als verallgemeinerte Ableitung f ′ := T f von f in L2 [a, b] betrachtet werden. Die Graphennorm von T ist die Sobolev-Norm k f kW21 := R b a | f (t) |2 dt + 1/2 Rb ′ 2 a | f (t) | dt . b) Für f ∈ W21 (a, b) und eine Testfunktion ϕ ∈ D(a, b) gilt Rb a Rb a Rb n→∞ a f (t) ϕ′(t) dt = lim f (t) ϕ′ (t) dt = − Rb a Rb n→∞ a fn (t) ϕ′ (t) dt = − lim fn′ (t) ϕ(t) dt , g(t) ϕ(t) dt für ϕ ∈ D(a, b) also (8) und g = f ′ = T f . Nach Satz 3.17 ist g ∈ L2 [a, b] durch Eigenschaft (8) eindeutig bestimmt und heißt dann schwache Ableitung von f ∈ L2 [a, b] . Mittels Approximation von g in L2 [a, b] durch stetige Funktionen ergibt sich, dass jede Funktion f ∈ L2 [a, b] mit schwacher Ableitung in L2 [a, b] bereits in W21 (a, b) liegt (vgl. [KFA], Satz 5.11). c) In Abschnitt 14 zeigen wir, dass schwache Ableitungen ein Spezialfall von Distributionsableitungen sind und gehen genauer auf Sobolev-Räume ein, auch in mehreren Variablen. 1 Hier zeigen wir noch W21 (a, b) ⊆ Λ /2 [a, b] ⊆ C[a, b] und verwenden dabei 9.10 Räume Hölder-stetiger Funktionen. Es seien K eine kompakte Menge in einem Banachraum und 0 < α ≤ 1 . Eine Funktion f : K 7→ K erfüllt eine O -Hölderbedingung zum Exponenten α , falls es C > 0 gibt mit | f (s) − f (t) | ≤ C k s − t kα für alle s, t ∈ K . Der Raum aller dieser Funktionen ist gegeben durch (t) | Λα (K) := {f : K 7→ K | [f ]α := sup | fk(s)−f < ∞} . s−t kα s6=t Der Ausdruck [ ]α ist eine Halbnorm auf Λα (K) . Mit k f kΛα := [f ]α + k f ksup erhält man eine Norm, unter der Λα (K) dann ein Banachraum ist. Eine HölderBedingung zum Exponenten α = 1 heißt auch Lipschitz-Bedingung. 1 9.11 Satz. Man hat W21 (a, b) ⊆ Λ /2 [a, b] , und für f ∈ W21 (a, b) gilt eine SobolevAbschätzung k f kΛ 1/2 ≤ C k f kW21 für f ∈ W21 (a, b) . (9) 58 II. Unbeschränkte Operatoren und Observable der Quantenmechanik a) Es genügt, (9) für f ∈ C 1 [a, b] zu zeigen; dann folgt die Behauptung mittels Satz 1 2.6, der Vollständigkeit von Λ /2 [a, b] und Satz 9.8. b) Für f ∈ C 1 [a, b] gibt es nach dem Mittelwertsatz der Integralrechnung einen Punkt t0 ∈ [a, b] mit 1 b−a Rb a f (s) ds = f (t0 ) . Aus dem Hauptsatz ergibt sich dann f (t) = f (t0 ) + Rt t0 f ′ (τ ) dτ = 1 b−a Rb a f (τ ) dτ + Rt t0 f ′ (τ ) dτ für alle t ∈ [a, b] , und daraus folgt mit der Schwarzschen Ungleichung k f ksup ≤ 1 b−a k f kL1 + k f ′ kL1 ≤ (b − a)−1/2 k f kL2 + (b − a)1/2 k f ′ kL2 . c) Weiter hat man | f (t) − f (s) | = | Rt s f ′ (τ ) dτ | ≤ k f ′ kL2 | t − s |1/2 und erhält insgesamt eine Abschätzung (9). 3 9.12 Summen, Produkte und Inverse von Operatoren. a) Bei der Definition von Summen und Produkten von Operatoren ist natürlich auf die Definitionsbereiche zu achten. Für Operatoren T und S von X nach Y setzen wir D(T + S) := D(T ) ∩ D(S) und (T + S)x := T x + Sx für x ∈ D(T + S) . b) Für einen weiteren Operator U von Y nach Z sei D(UT ) := {x ∈ D(T ) | T x ∈ D(U)} und (UT )x := UT x für x ∈ D(UT ) . c) Für einen injektiven Operator T definieren wir den inversen Operator von Y nach X einfach durch D(T −1 ) := R(T ) und T −1 y := x für y = T x ; dann gilt offenbar R(T −1 ) = D(T ) . Für die Isometrie V :X ×Y →Y ×X, V (x, y) := (y, x) , (10) gilt dann Γ(T −1 ) = V Γ(T ) ; somit ist T −1 genau dann abgeschlossen, wenn dies auf T zutrifft. 9.13 Spektrum und Resolvente. Es sei T ein Operator in einem Banachraum X . Die Resolventenmenge von T wird definiert durch ρ(T ) := {λ ∈ C | λI−T : D(T ) → X bijektiv, (λI−T )−1 beschränkt} , (11) ihr Komplement σ(T ) := C\ρ(T ) heisst Spektrum von T . Die Resolvente wird auf ρ(T ) definiert durch RT (λ) := (λI − T )−1 ∈ L(X) . 9.14 Satz. Es sei T ein abgeschlossener Operator im Banachraum X . a) Für λ ∈ C ist auch λI − T abgeschlossen. b) Die Resolventenmenge von T ist gegeben durch ρ(T ) := {λ ∈ C | λI − T : D(T ) → X ist bijektiv} . Sie ist offen in C , und die Resolvente RT : ρ(T ) → L(X) ist holomorph. (12) 11 Abgeschlossene und abschließbare Operatoren 59 Beweis. a) Es sei (xn ) eine Folge in D(λI − T ) = D(T ) mit xn → x in X und (λI − T )xn → y in X . Dann folgt T xn → λx − y , also x ∈ D(T ) = D(λI − T ) und T x = λx − y , also (λI − T )x = y . b) Es sei µ ∈ C , so dass µI − T : D(T ) → X bijektiv ist. Da DT und X Banachräume sind und µI − T : DT → X stetig ist, ist auch die Inverse (µI − T )−1 : X → DT stetig aufgrund des Satzes vom inversen Operator 6.8. Insbesondere hat man µ ∈ ρ(T ) und RT (µ) ∈ L(X) . Nun sei λ ∈ C mit | λ − µ | < k RT (µ) k−1 . Nach Satz 8.1 ist dann auch λI − T = (λ − µ)I + µI − T = [(λ − µ)RT (µ) + I] (µI − T ) : D(T ) → X ein bijektiver Operator von D(T ) nach X , und man hat λ ∈ ρ(T ) . Weiter ist (λI − T )−1 = (µI − T )−1 ∞ P (−1)k RT (µ)k (λ − µ)k k=0 für | λ − µ | < k RT (µ) k−1 , und somit ist die Resolvente holomorph. 3 Für abgeschlossene Operatoren T und λ ∈ ρ(T ) ist also (λI −T )−1 : X → DT stetig, insbesondere also auch stetig als Operator von X nach X . Mit der Resolventen RT (λ) ∈ L(X) ist im folgenden immer der letztere Operator gemeint. Dann ist also RT : ρ(T ) → L(X) holomorph; der Beweis des Satzes zeigt auch, dass sogar die Funktion ( · I − T )−1 : ρ(T ) → L(X, DT ) holomorph ist. 9.15 Beispiele. a) Für den Diagonaloperator ∆a in ℓ2 aus (6) ist aj ein Eigenwert mit dem Einheitsvektor ej als Eigenvektor; daher gilt {aj | j ∈ N0 } ⊆ σ(∆a ) . Für λ ∈ C\{aj | j ∈ N0 } gibt es δ > 0 mit | λ − aj | ≥ δ für alle j ∈ N0 ; der Operator 1 ) ist daher auf ℓ2 beschränkt. Somit gilt diag( λ−a j 1 σ(∆a ) = {aj | j ∈ N0 } und R∆a (λ) = diag( λ−a ) für λ ∈ ρ(∆a ) . (13) j b) Für den Multiplikationsoperator Ma in L2 (Ω) aus (5) gilt analog zu a) σ(Ma ) = a(Ω) und RMa (λ) = M(λ−a)−1 für λ ∈ ρ(Ma ) . (14) ⊆“ ergibt sich wie in a). Ein Punkt λ = a(τ ) ∈ a(Ω) muss nicht un( n ” /2 k , |t−τ | ≤ bedingt ein Eigenwert von Ma sein. Für die Funktionen fk (t) := 0 , |t−τ | > √ gilt jedoch k fk kL2 = ωn , wobei ωn das Volumen der n -dimensionalen Einheitskugel ist. Weiter gilt √ k (λ − Ma )fk kL2 ≤ ωn sup {| λ − a(t) | | | t − τ | ≤ k1 } → 0 ; Die Inklusion daher kann keine Abschätzung k (λ − Ma )f k ≥ c k f k mit einer Konstanten c > 0 gelten, und man hat λ ∈ σ(Ma ) . c) Für den Ortsoperator aus 9.3 b) gilt σ(Qj ) = R und RQj (λ) = M(λ−tj )−1 für λ ∈ C\R . (15) Für eine in C dichte Folge a = (aj )j∈N0 gilt ρ(∆a ) = ∅ nach (13), ganz im Gegensatz zum Fall beschränkter linearer Operatoren. Umgekehrt kann auch σ(T ) = ∅ gelten: 1 k 1 k 60 II. Unbeschränkte Operatoren und Observable der Quantenmechanik 9.16 Beispiele. a) Wir betrachten den abgeschlossenen Differentialoperator T : f 7→ f ′ mit D(T ) = C 1 [a, b] in C[a, b] aus 9.5. Wegen (λI − T )eλt = 0 ist jeder Punkt λ ∈ C ein Eigenwert von T , und daher ist ρ(T ) = ∅ . b) Jetzt betrachten wir die Einschränkung T0 von T auf den Definitionsbereich D(T0 ) := {f ∈ C 1 [a, b] | f (a) = 0} . Die Eigenfunktionen eλt aus a) liegen dann nicht in D(T0 ) . Im Gegensatz zu a) ist der abgeschlossene Operator λI − T0 : D(T0 ) → C[a, b] für alle λ ∈ C bijektiv, da das Anfangswertproblem −ẋ(t) + λx(t) = g(t) , x(a) = 0 , für jede Funktion g ∈ C[a, b] die eindeutige Lösung f (t) = Rt a g(s) eλ(s−t) ds in C 1 [a, b] hat Folglich gilt σ(T0 ) = ∅ . 12 Symmetrische und selbstadjungierte Operatoren 10 61 Symmetrische und selbstadjungierte Operatoren Ab jetzt betrachten wir nur noch Operatoren zwischen Hilberträumen H , G . Das Skalarprodukt auf dem Hilbertraum H × G ist gegeben durch h(x1 , y1 )|(x2 , y2 )i = hx1 |x2 iH + hy1 |y2 iG . 10.1 Konstruktion adjungierter Operatoren. a) Es seien H, G Hilberträume und T : D(T ) → G ein Operator von H nach G . Ist für ein y ∈ G die Linearform x 7→ hT x|yi stetig auf D(T ), so kann sie nach Satz 2.6 zu einer stetigen Linearform auf D(T ) fortgesetzt werden. Nach dem Rieszschen Darstellungssatz 5.6 gibt es dann genau einen Vektor z ∈ D(T ) mit hT x|yi = hx|zi , x ∈ D(T ) . b) Diese Formel gilt auch für jeden Vektor z + n mit n ∈ D(T )⊥ ; ein Vektor z ∈ H ist also durch sie genau dann eindeutig bestimmt, wenn D(T )⊥ = {0} ist, wenn also D(T ) in H dicht ist. In diesem Fall setzen wir D(T ∗) := {y ∈ G | x 7→ hT x|yi ist stetig} (1) und definieren den adjungierten Operator T ∗ : D(T ∗ ) → H zu T durch hx|T ∗ yi = hT x|yi , x ∈ D(T ) , y ∈ D(T ∗ ) . (2) 10.2 Beispiele. a) Es seien Ω ⊆ Rn offen und a ∈ C(Ω) . Der Multiplikationsoperator Ma in L2 (Ω) aus (9.5) ist dicht definiert wegen Cc (Ω) ⊆ D(Ma ) , und es ist Ma∗ = Mā . In der Tat gilt zunächst hMa f |gi = R Ω a(t)f (t) g(t) dt = R Ω f (t) a(t)g(t) dt = hf |Mā gi für f ∈ D(Ma ) und g ∈ D(Mā ) = D(Ma ) , und dies zeigt Mā ⊆ Ma∗ . Umgekehrt sei nun g ∈ D(Ma∗ ) und h := Ma∗ g ∈ L2 (Ω) . Dann gilt R Ω a(t)f (t) g(t) dt = hMa f |gi = hf |hi = R Ω f (t) h(t) dt (3) für alle f ∈ D(Ma ) . Nun sei K ⊆ Ω kompakt und ϕ ∈ L2 (K) . Die durch 0 auf Ω fortgesetzte Funktion ϕe liegt dann in D(Ma ) , und aus (3) folgt R K a(t)ϕ(t) g(t) dt = R Ω e a(t)ϕ(t) g(t) dt = R Ω e ϕ(t) h(t) dt = R K ϕ(t) h(t) dt . Dies zeigt a(t)g(t) = h(t) fast überall auf K und somit auch fast überall auf Ω . Folglich gilt āg ∈ L2 (Ω) und somit g ∈ D(Mā ) . b) Der Diagonaloperator ∆a in ℓ2 aus (9.6) ist wegen [ej ]j∈N0 ⊆ D(∆a ) dicht definiert, und analog zu a) ergibt sich ∆∗a = ∆ā . In ungünstigen Fällen kann D(T ∗ ) = {0} sein: 62 II. Unbeschränkte Operatoren und Observable der Quantenmechanik 10.3 Beispiel. a) Es seien {ek }k∈N0 die Einheitsvektoren in ℓ2 und D(T ) = [ek ]k∈N0 . Für eine Indizierung {eij }N0 ×N0 dieser Einheitsvektoren über N0 × N0 definieren wir T : D(T ) → ℓ2 durch T ekj = ek , k ∈ N0 , und lineare Fortsetzung. b) Nun sei y = (yk )k∈N0 ∈ D(T ∗ ) . Für k, j ∈ N gilt hekj |T ∗yi = hT ekj |yi = hek |yi = yk . Nach der Besselschen Ungleichung ist aber ∞ P j=1 | hekj |T ∗ yi |2 < ∞ , und somit gilt yk = lim hekj |T ∗ yi = 0 für alle k ∈ N0 . Folglich ist D(T ∗ ) = {0} . j→∞ Der Operator T aus dem letzten Beispiel ist nicht abschließbar aufgrund des folgenden Resultats: 10.4 Satz. a) Ein adjungierter Operator T ∗ : D(T ∗ ) → H ist stets abgeschlossen. b) Es ist D(T ∗) genau dann dicht in G , wenn T abschließbar ist. ∗ c) Für abschließbare Operatoren gilt T = T ∗ und T ∗∗ = T . Beweis. Ähnlich wie in (9.10) verwenden wir die Isometrie U : G×H → H ×G, U(y, x) := (−x, y) ; (4) a) ergibt sich dann sofort aus der Formel U(Γ(T ∗ )) = Γ(T )⊥ . (5) Die Inklusion ⊆“folgt sofort aus (2). Ist umgekehrt (u, v) ∈ Γ(T )⊥ gegeben, so gilt ” hx|ui + hT x|vi = 0 für x ∈ D(T ) . Dies bedeutet v ∈ D(T ∗ ) und T ∗ v = −u , und es folgt (u, v) = (−T ∗ v, v) = U(v, T ∗ v) ∈ U(Γ(T ∗ )) . b) ⇒ “: Es sei (xn ) eine Folge in D(T ) mit xn → 0 in H und T xn → y in G . Für ” z ∈ D(T ∗ ) gilt dann hy|zi = n→∞ lim hT xn |zi = n→∞ lim hxn |T ∗ zi = 0 , und wegen der Dichtheit von D(T ∗ ) in G muss y = 0 sein. ⇐ “: Für z ∈ D(T ∗)⊥ gilt (z, 0) ∈ Γ(T ∗ )⊥ und somit ” (0, z) ∈ U(Γ(T ∗ )⊥ ) = (UΓ(T ∗ ))⊥ = Γ(T )⊥⊥ = Γ(T ) nach (5) und (5.6). Da nun Γ(T ) ein Graph ist, folgt z = 0 , und somit ist D(T ∗ ) dicht in G . c) Aus (5) ergibt sich weiter U(Γ(T ∗ )) = Γ(T )⊥ = Γ(T ) ⊥ ∗ = Γ(T )⊥ = U(Γ(T )) ∗ und damit Γ(T ) = Γ(T ∗ ) . Schließlich wenden wir Aussage (5) auf T ∗ an. Der Isometrie U aus (4) entspricht W :H ×G→G×H, W (x, y) := (−y, x) = −U −1 (x, y) . Damit ergibt sich W (Γ(T ∗∗ )) = Γ(T ∗ )⊥ mittels (5), also Γ(T ∗∗ ) = W −1 (Γ(T ∗ )⊥ ) = (W −1 Γ(T ∗ ))⊥ = (UΓ(T ∗ ))⊥ = Γ(T )⊥⊥ = Γ(T ) und somit die Behauptung T ∗∗ = T . 3 Adjungierten- und Inversenbildung sind in folgendem Sinne miteinander verträglich: 63 12 Symmetrische und selbstadjungierte Operatoren 10.5 Satz. Es sei T ein injektiver Operator von H nach G mit D(T ) = H und D(T −1 ) = G . Dann existiert (T ∗ )−1 , und es ist (T ∗ )−1 = (T −1 )∗ . Beweis. a) Es sei y ∈ D(T ∗ ) mit T ∗ y = 0 . Dann gilt hT x|yi = hx|T ∗ yi = 0 für alle x ∈ D(T ) , also hz|yi = 0 für alle z ∈ R(T ) . Da aber R(T ) = D(T −1 ) in G dicht ist, folgt y = 0 . Somit ist T ∗ injektiv, und (T ∗ )−1 existiert. b) Nun seien v = T u ∈ D(T −1 ) ⊆ G und x = T ∗ y ∈ D((T ∗ )−1 ) ⊆ H . Dann gilt hT −1v|xi = hu|T ∗yi = hT u|yi = hv|(T ∗)−1 xi ; daher ist v 7→ hT −1 v|xi stetig, und man hat x ∈ D((T −1)∗ ) sowie (T −1 )∗ x = (T ∗ )−1 x . Dies zeigt (T ∗ )−1 ⊆ (T −1 )∗ . c) Nun sei umgekehrt x ∈ D((T −1)∗ ) ⊆ H und y = (T −1 )∗ x ∈ G . Für einen Vektor v = T u ∈ D(T −1 ) ⊆ G folgt hT −1 v|xi = hv|yi ; man hat also hu|xi = hT u|yi für alle u ∈ D(T ) . Dies zeigt y ∈ D(T ∗ ) und x = T ∗ y ∈ R(T ∗ ) = D((T ∗ )−1 ) . 3 Satz 5.14 gilt auch für unbeschränkte Operatoren: 10.6 Satz. Es sei T ein abschließbarer Operator von H nach G mit dichtem Definitionsbereich. Dann gilt R(T )⊥ = N(T ∗ ) und R(T ∗ )⊥ = N(T ) R(T ) = N(T ∗ )⊥ und R(T ∗ ) = N(T )⊥ . sowie (6) (7) Beweis. a) Für y ∈ N(T ∗ ) gilt h T x|y i = h x|T ∗y i = 0 für alle x ∈ D(T ) , also y ∈ R(T )⊥ . Ist umgekehrt y ∈ R(T )⊥ , so ist x 7→ h T x|y i (= 0) stetig auf D(T ) , also y ∈ D(T ∗ ) und T ∗ y = 0 . Dies zeigt die erste Gleichung in (6). Damit folgt auch die zweite Gleichung wegen R(T ∗ )⊥ = N(T ∗∗ ) = N(T ) aufgrund von Satz 10.4 c). b) Aussage (7) folgt sofort aus (6) durch Bildung von Orthogonalkomplementen (vgl. Formel (5.6)). 3 Die Formeln (7) liefern wie in Abschnitt 5 Informationen über die Lösbarkeit linearer Gleichungen T x = y und T ∗ v = u . Im Fall abgeschlossener Operatoren ist die Abgeschlossenheit der Bilder von T und von T ∗ sogar äquivalent. Dieses wichtige Resultat geht auf S. Banach (1929) und F. Hausdorff (1932) zurück: 10.7 Theorem(vom abgeschlossenen Bild). Es seien H, G Hilberträume. Für einen abgeschlossenen Operator von H nach G mit D(T ) = H sind äquivalent: (a) R(T ) ist abgeschlossen in G . (b) R(T ) = N(T ∗ )⊥ . (c) R(T ∗ ) = N(T )⊥ . (d) R(T ∗ ) ist abgeschlossen in H . Beweis. Die Äquivalenzen (a) ⇔ (b)“ und (c) ⇔ (d)“ folgen aus Formel (7). ” ” (a) ⇒ (c)“: Es sei x ∈ N(T )⊥ gegeben. Durch ” ϕ : v 7→ h u|x i für u ∈ D(T ) und v = T u 64 II. Unbeschränkte Operatoren und Observable der Quantenmechanik wird eine Linearform auf R(T ) definiert: Gilt auch v = T u′ , so ist u − u′ ∈ N(T ) und somit h u|x i = h u′|x i . Die Bijektion T : (DT ∩ N(T )⊥ ) → R(T ) besitzt nach Theorem 6.8 eine stetige Inverse, da DT und R(T ) Hilberträume sind. Für eine Nullfolge (vn ) in R(T ) gilt daher vn = T un für eine Nullfolge (un ) in DT , und es folgt ϕ(vn ) = h un |x i → 0 . Die Linearform ϕ ist also stetig auf R(T ) , und nach dem Rieszschen Darstellungssatz 5.6 gibt es genau ein y ∈ R(T ) ⊆ G mit ϕ(v) = h v|y i für v ∈ R(T ) . Dies bedeutet h T u|y i = h u|x i für alle u ∈ D(T ) , also y ∈ D(T ∗ ) und x = T ∗ y ∈ R(T ∗ ) . (d) ⇒ (a)“: Nach der soeben bewiesenen Implikation (a) ⇒ (d)“ folgt aus der ” ” Abgeschlossenheit von R(T ∗ ) die von R(T ∗∗ ) = R(T ) aufgrund von Satz 10.4 c). 3 Ein linearer Operator in einem Hilbertraum H mit dichtem Definitionsbereich lässt sich mit seinem adjungierten Operator vergleichen: 10.8 Definition. Es sei H ein Hilbertraum. Ein Operator A in H mit D(A) = H a) heisst symmetrisch, falls A ⊆ A∗ gilt, b) heisst selbstadjungiert, falls A = A∗ ist. 10.9 Beispiele und Bemerkungen. a) Ein Multiplikationsoperator Ma in L2 (Ω) oder ein Diagonaloperator ∆a in ℓ2 ist genau dann symmetrisch, wenn er selbstadjungiert ist, nämlich genau dann, wenn a reellwertig ist. Insbesondere sind die Ortsoperatoren Qj der Quantenmechanik selbstadjungiert. b) Nach Satz 10.4 a) ist ein selbstadjungierter Operator A abgeschlossen. Durch Einschränkung von A auf echte dichte Unterräume des Definitionsbereichs DA erhält man symmetrische Operatoren, die nicht abgeschlossen, also auch nicht selbstadjungiert sind. 10.10 Symmetrische Operatoren. a) Ein Operator A in H mit D(A) = H ist also genau dann symmetrisch, falls gilt hAx|yi = hx|Ayi für x , y ∈ D(A) . (8) Insbesondere ist dann also h Ax|x i ∈ R für alle x ∈ D(A) . b) Ein symmetrischer Operator A in H ist stets abschließbar. Dies folgt sofort aus Satz 10.4 b), kann aber auch leicht direkt gezeigt werden. Nach Satz 10.4 c) gilt dann ∗ also A = A∗ und A∗∗ = A . c) Für einen symmetrischen Operator A in H gilt k (λI − A)x k ≥ | Im λ | k x k , x ∈ D(A) , λ ∈ C . (9) Dies folgt wie in (5.19): Für λ = α + iβ ∈ C und x ∈ D(A) hat man k (λI − A)x k k x k ≥ | h (λI − A)x|x i | = | h (αI − A)x|x i + h iβx|x i | ≥ | β | k x k2 wegen h (αI − A)x|x i ∈ R . Für Im λ 6= 0 ist daher der Operator λI − A injektiv. Er besitzt auch ein abgeschlossenes Bild, falls er abgeschlossen ist. Er ist jedoch i. a. nicht surjektiv, denn es gilt: 12 Symmetrische und selbstadjungierte Operatoren 65 10.11 Satz. Es sei A ein symmetrischer Operator in H . a) Ist R(λI − A) = R(λ̄I − A) = H für ein λ ∈ C , so ist A selbstadjungiert. b) Ist N(λI − A∗ ) = N(λ̄I − A∗ ) = {0} für ein λ ∈ C\R , so ist A selbstadjungiert. Beweis. a) Es sei y ∈ D(A∗ ) . Für x ∈ D(A) gilt h(λI − A)x|yi = λ hx|yi − hAx|yi = hx|λ̄yi − hx|A∗ yi = hx|(λ̄I − A∗ )yi . Da λ̄I − A surjektiv ist, gibt es z ∈ D(A) mit (λ̄I − A∗ )y = (λ̄I − A)z , und es folgt h(λI − A)x|yi = hx|(λ̄I − A)zi = h(λI − A)x|zi . Da auch λI − A surjektiv ist, impliziert dies y = z ∈ D(A) . b) Für λ ∈ C\R sind R(λI − A) und R(λ̄I − A) nach (9) abgeschlossen. Die Behauptung folgt daher aus a) und der ersten Formel in (7). 3 Für selbstadjungierte Operatoren gilt in Erweiterung von Satz 5.18: 10.12 Satz. Es sei A ein selbstadjungierter Operator in H . a) Dann gilt σ(A) ⊆ R . b) Für Im λ 6= 0 sind die Resolventen RA (λ) normal; man hat RA (λ)∗ = RA (λ̄) und 1 | Im λ | k RA (λ) k ≤ , Im λ 6= 0 . (10) Beweis. a) Es sei λ ∈ C\R . Der Operator λI−A ist nach Satz 10.4 a) abgeschlossen und nach (9) injektiv mit abgeschlossenem Bild. Weiter gilt R(λI − A)⊥ = N(λ̄I − A∗ ) = N(λ̄I − A) = {0} wiederum nach (9). Somit ist λ ∈ ρ(A) , und man hat σ(A) ⊆ R . b) Die Aussage RA (λ)∗ = RA (λ̄) folgt wegen (λI − A)∗ = (λ̄I − A∗ ) = (λ̄I − A) aus Satz 10.5, und daraus ergibt sich die Normalität dieser Resolventen. Schließlich folgt (10) sofort aus (9). 3 10.13 Ein Differentialoperator. a) Wir haben in 9.8 den (verallgemeinerten) Differentialoperator T : f 7→ f ′ in L2 [a, b] mit D(T ) = W21 (a, b) als Abschluss des Differentialoperators T : f 7→ f ′ in L2 [a, b] mit D(T ) = C 1 [a, b] konstruiert; T ist also ein abgeschlossener Operator. Nach Satz 9.11 ist W21 (a, b) stetig in C[a, b] eingebettet. Daher ist D(A) := {f ∈ W21 (a, b) | f (a) = f (b) = 0} (11) ein abgeschlossener Unterraum von W21 (a, b) , und auch der durch Af := if ′ auf D(A) definerte Operator ist in L2 [a, b] abgeschlossen. b) Für f, g ∈ W21 (a, b) liefert partielle Integration Rb a if ′ g dt − Rb a f ig ′ dt = if g|ba . (12) 66 II. Unbeschränkte Operatoren und Observable der Quantenmechanik Dies ist klar für f, g ∈ C 1 [a, b] und folgt für f, g ∈ W21 (a, b) durch Approximation. Somit ist A symmetrisch. Formel (12) besagt aber hAf |gi = hf |ig ′i für alle f ∈ D(A) und alle g ∈ W21 (a, b) ; daher hat man W21 (a, b) ⊆ D(A∗ ) und A∗ g = ig ′ für g ∈ W21 (a, b) . Der Operator A ist also nicht selbstadjungiert. c) Wir zeigenRnun D(A∗ ) = W21 (a, b) : Für g ∈ D(A∗ ) setzen wir h := A∗ g ∈ L2 [a, b] und H(t) := at h(τ ) dτ . Wir wählen eine Folge hn ∈ C[a, b] mit hn → h in L2 [a, b] R uns setzen Hn (t) := at hn (τ ) dτ . Dann gelten Hn → H und Hn′ = hn → h in L2 [a, b] , und daraus folgt H ∈ W21 (a, b) und H ′ = h . Für eine Testfunktion ϕ ∈ D(a, b) ergibt sich mittels (12) Rb a iϕ′ g dt = h Aϕ|g i = h ϕ|A∗ g i = h ϕ|h i = Rb a Rb a ϕ h dt = − (H − ig)ϕ′ dt = 0 für alle ϕ ∈ D(a, b) . Rb a ϕ′ H dt , also (13) Nach dem folgenden Lemma ist H − ig eine konstante Funktion, und daraus folgt g ∈ W21 (a, b) . ∗ d) Nach (11) ist also dim D(A )/D(A) = 2 . Wir suchen nun selbstadjungierte Erweiterungen Ae von A . Aus A ⊆ Ae folgt sofort Ae = Ae∗ ⊆ A∗ , also A ⊆ Ae ⊆ A∗ . e muss also ein D(A) enthaltender Unterraum von Der Definitionsbereich D(A) ∗ 1 e nach (12) D(A ) = W2 (a, b) der Kodimension 1 sein. Weiter muss für f, g ∈ D(A) f g(b) = f g(a) gelten. Dies kann durch eine Randbedingung f (b) = γf (a) erreicht werden, wobei wegen f g(b) = γγf g(a) offenbar γγ = 1 gelten muss. Selbstadjungierte Erweiterungen von A sind also für γ ∈ C mit | γ | = 1 gegeben durch D(Aeγ ) := {f ∈ W21 (a, b) | f (b) = γf (a)} und Aeγ f = if ′ für f ∈ D(Aeγ ) . (14) 10.14 Lemma. Es sei f ∈ L2 [a, b] mit ist f eine konstante Funktion. Rb a f ϕ′ dt = 0 für alle ϕ ∈ D(a, b) . Dann R Beweis.R a) Für ϕ ∈ D(a, b) setzen wir Φ(t) := at ϕ(s) ds , a ≤ t ≤ b . Ist nun I(ϕ) := ab ϕ(s) ds = 0 , so folgt Φ ∈ D(a, b) , und die Voraussetzung liefert Rb a f (t) ϕ(t) dt = Rb a f (t) Φ′ (t) dt = 0 . b) Nun wählen wir χ ∈ D(a, b) mit I(χ) = 1 . Für ϕ ∈ D(a, b) gilt dann Rb I(ϕ − I(ϕ)χ) = 0 . Aus a) folgt a f (t) (ϕ(t) − I(ϕ) χ(t)) dt = 0 , also 0 = Rb a f (t) ϕ(t) dt − Rb a f (s) χ(s) ( Rb a ϕ(t) dt) ds = Rb a (f (t) − I(f χ)) ϕ(t) dt . Nach Satz 3.17 stimmt daher f (fast überall) mit der konstanten Funktion I(f χ) überein. 3 Lemma 10.14 gilt auch für L1 -Funktionen. Die Aussage ist der einfachste Fall eines Regularitätssatzes für Differentialgleichungen.