Funktionalanalysis I Wintersemester 2001/2002 Skript zur Vorlesung von Prof. E. Zehnder Christian Frei D-MATH [email protected] Version Februar 2006 i INHALTSVERZEICHNIS Inhaltsverzeichnis 1 Metrische Räume, Baire Kategorie 1.1 Definitionen, Notation . . . . . . . . . . . . . . . 1.2 Die Begriffe offen, abgeschlossen, konvergent, . . . 1.3 Kompaktheit in metrischen Räumen . . . . . . . 1.4 Die Baire-Kategorie . . . . . . . . . . . . . . . . 1.5 Erste Anwendungen von Baire . . . . . . . . . . 1.6 Vervollständigung . . . . . . . . . . . . . . . . . . . . . . . . 1 1 3 6 9 13 15 2 Normierte Räume 2.1 Definitionen und erste Folgerungen . . . . . . . . . . . . . . . . . . . 2.2 L(X, Y ), zur Erinnerung . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Quotientenräume und Produkträume . . . . . . . . . . . . . . . . . . 18 18 23 28 3 Prinzipien der Funktionalanalysis 3.1 Prinzip der gleichmässigen Beschränktheit . . . . . . . . . . . . . . . 3.2 Prinzip der offenen Abbildung . . . . . . . . . . . . . . . . . . . . . . 3.3 Abschliessbare Operatoren . . . . . . . . . . . . . . . . . . . . . . . . 30 30 31 37 4 Der Fortsetzungssatz von Hahn-Banach 4.1 Der Satz von Hahn-Banach . . . . . . . . . . . . . . . . . . . . . . . 4.2 Folgerungen aus dem Fortsetzungssatz . . . . . . . . . . . . . . . . . 40 40 43 5 Sobolev-Räume 5.1 Der Glättungsoperator . . . . . . . . . . . . . . . . . . . . . . . . . . ◦ 5.2 Die Funktionenräume W m,p (Ω), H m,p (Ω) und H m,p (Ω) . . . . . . . 5.3 Dirichlet-Problem und schwache Lösung . . . . . . . . . . . . . . . . 47 47 51 59 6 Reflexive Räume und schwache Konvergenz 6.1 Separable Räume . . . . . . . . . . . . . . . . . 6.2 Reflexive Räume . . . . . . . . . . . . . . . . . 6.3 Beispiele von Dualräumen . . . . . . . . . . . . 6.4 Schwache Konvergenz und Variationsprobleme . . . . 63 63 64 66 69 7 Spektrum und Resolvente 7.1 Adjungierte Operatoren im Hilbert-Raum . . . . . . . . . . . . . . . 7.2 Spektrum und Resolvente . . . . . . . . . . . . . . . . . . . . . . . . 76 76 79 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Halbgruppen 8.1 Gewöhnliche Differentialgleichungen im Banach-Raum 8.2 Spezialfall: Lineare Gleichungen . . . . . . . . . . . . . 8.3 Problemstellung: Das Cauchy-Anfangswert-Problem . 8.4 Kontraktionshalbgruppen . . . . . . . . . . . . . . . . 8.5 Unitäre Gruppen auf H . . . . . . . . . . . . . . . . . 8.6 Kontraktionshalbgruppen in Hilberträumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 . 86 . 86 . 87 . 87 . 99 . 104 9 Beispiele von Kontraktionshalbgruppen 9.1 Flüsse von Vektorfeldern . . . . . . . . . 9.2 Unitäre Gruppen auf L2 (Rn ) . . . . . . 9.3 Wärmeleitungsgleichung . . . . . . . . . 9.4 Freie Schrödinger-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 106 110 112 115 116 1 1 METRISCHE RÄUME, BAIRE KATEGORIE 1 Metrische Räume, Baire Kategorie In diesem Abschnitt werden die wichtigsten Grundbegriffe eingeführt, die uns in der Funktionalanalysis immer wieder begegnen werden. Viele davon werden dem Leser schon bekannt sein, sollen aber zur Erinnerung nochmals aufgeführt werden. 1.1 Definitionen, Notation Definition 1.1. (metrischer Raum, Metrik) Ein metrischer Raum ist ein Paar (M, d), wobei M eine Menge und d eine auf M definierte Funktion d : M × M → R ist, so dass für alle x, y, z ∈ M gilt: i) d(x, y) ≥ 0 und d(x, y) = 0 ⇐⇒ x = y; ii) d(x, y) = d(y, x) und iii) d(x, y) ≤ d(x, z) + d(z, y). Eine solche Funktion d auf M heisst Metrik oder Abstandsfunktion. Folgerung: Die Metrik ist stetig, denn es gilt |d(x, y) − d(u, v)| ≤ d(x, u) + d(y, v). Bemerkungen: 1) Sei (M, d) ein metrischer Raum, A ⊂ M . Dann ist (A, d) ebenfalls ein metrischer Raum. 2) Jede Menge ist metrisierbar mit der diskreten Metrik ( 1 x 6= y d(x, y) = . 0 sonst Beispiel. Wir betrachten einige metrische Räume: 1. M = R, d(x, y) = |x − y|. 2. Der Raum S aller Folgen {x : N → R} = {x = (xj )j |xj ∈ R}: sei x = (xj ) und y = (yj ) ∈ S. Definiere die Funktion d(x, y) = ∞ X 1 X 1 |xj − yj | ≤ = 1. j 2 1 + |xj − yj | 2j j=1 j≥1 Behauptung: Die so definierte Funktion d ist eine Metrik auf S. Beweis. i) d(x, y) ≥ 0 folgt auf Grund der Definition, und es ist leicht zu sehen, dass d(x, y) = 0 ⇐⇒ xj = yj ∀j ≥ 1 ⇐⇒ x = y; ii) d(x, y) = d(y, x) ist klar; t für t ≥ 0. Für diese Funktion gilt iii) Wir definieren die Funktion ϕ(t) = 1+t 1 0 ϕ(0) = 0 und ϕ (t) = (1+t)2 > 0. Das heisst, ϕ ist monoton steigend. Aus der Dreiecksungleichung |a + b| ≤ |a| + |b| folgt dann |a + b| |a| + |b| |a| |b| ≤ ≤ + und 1 + |a + b| 1 + |a| + |b| 1 + |a| 1 + |b| N N N X X X 1 |xj − zj | 1 |zj − yj | 1 |xj − yj | ≤ + . j 1 + |x − y | j 1 + |x − z | j 1 + |z − y | 2 2 2 j j j j j j j=1 j=1 j=1 Mit limN →∞ bekommen wir d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z in S, wie behauptet. 2 1 METRISCHE RÄUME, BAIRE KATEGORIE 3. Wir verwenden denselben Trick wie oben für den Raum C ∞ (Ω), wobei die Menge Ω ⊂ Rn offen ist. DazuSnehmen wir eine Folge von kompakten Mengen Kj mit Kj ⊂ Kj+1 ⊂ . . . ⊂ j≥1 Kj =: Ω und definieren eine Metrik d für f, g ∈ C ∞ (Ω): d(f, g) = ∞ X 1 pj (f − g) , wobei 2j 1 + pj (f − g) j=1 pj (f − g) = kf − gkC j (Kj ) = max x∈Kj , 0≤|α|≤j |∂ α f (x) − ∂ α g(x)| und α = (α1 , . . . , αn ), ∂ α = ∂1α1 ∂2α2 . . . ∂nαn , ∂j = ∂ , ∂xj |α| = α1 + α2 + . . . + αn . Es ist unsere Konvention, dass ∂ 0 f (x) − ∂ 0 g(x) = f (x) − g(x). Dass d(f, g) wirklich eine Metrik ist, lässt sich wie im vorhergehenden Beispiel zeigen. 4. Die Räume `p , 1 ≤ p ≤ ∞. Der Raum `∞ = {x = (xj )j |xj ∈ R und supj≥1 |xj | < ∞} hat noch mehr Struktur als ein metrischer Raum; er ist sogar ein Vektorraum, es gilt also für x = (xj ), y = (yj ) die Beziehung x + y = (xj + yj )j ∈ `∞ . Wir definieren auf `∞ die Metrik d∞ (x, y) := sup |xj − yj | < ∞. j≥1 Die Metrik ist wohldefiniert, und die Eigenschaften i) und ii) folgen sofort. Für iii) gilt für alle j: |xj − yj | = |xj − zj + zj − yj | ≤ |xj − zj | + |zj − yj | ≤ sup |xj − zj | + sup |zj − yj | = d(x, z) + d(z, y). j≥1 j≥1 Machen wir auf der linken Seite den Übergang ins Supremum, so ergibt sich d(x, y) ≤ d(x, z) + d(z, y). P Auch die Räume `p = {x = (xj )j | j≥1 |xj |p < ∞} mit 1 ≤ p < ∞ sind Vektorräume, es gilt also auch hier für x = (xj ), y = (yj ) aus `p die Vektoraddition (x + y) = (xj + yj )j ∈ `p . Wegen der Minkowski-Ungleichung ist 1/p 1/p 1/p N N N X X X |xj + yj |p ≤ |xj |p + |yj |p . j=1 j=1 j=1 Mit dem Grenzübergang N → ∞ wird daraus 1/p 1/p 1/p ∞ ∞ ∞ X X X |xj + yj |p ≤ |xj |p + |yj |p . j=1 Dass die Funktion j=1 dp (x, y) = ∞ X j=1 j=1 1/p |xj − yj |p eine Metrik auf `p definiert, beweist man wie vorher mit der MinkowskiUngleichung. 1 METRISCHE RÄUME, BAIRE KATEGORIE 1.2 3 Die Begriffe offen, abgeschlossen, konvergent, . . . Im Folgenden sei ein metrischer Raum (M, d) vorgegeben. Definition 1.2. (offen, Durchmesser, konvergente Folge, Grenzwert) • Eine offene Kugel mit Zentrum a ∈ M und Radius r > 0 ist die Menge B(a, r) = Br (a) = {x ∈ M |d(x, a) < r}; • Eine Menge U ⊂ M heisst offen, falls für jedes x ∈ U ein r > 0 existiert, so dass Br (x) ⊂ U ; • Der Durchmesser δ einer Teilmenge A ⊂ M ist definiert durch δ(A) = sup{d(x, y)|x, y ∈ A}. • Eine Folge (xj ) ⊂ M heisst konvergent, falls ein x ∈ M existiert, so dass limn→∞ d(xn , x) = 0, das heisst, zu jedem ε > 0 gibt es ein N = Nε , so dass d(xn , x) < ε für alle n ≥ N . Der Punkt x heisst der Grenzwert der Folge (xn ). Wir verwenden die Notationen lim xn = x oder xn → x in (M, d). n→∞ Der Grenzwert einer Folge – sofern er existiert – ist eindeutig, denn mit xn → x, xn → y folgt 0 ≤ d(x, y) ≤ d(x, xn ) + d(xn , y) → 0 (n → ∞), also d(x, y) = 0 und, nach Definition der Metrik, endlich x = y. An dieser Stelle stellt sich nun die Frage: Was bedeutet die Konvergenz in den einzelnen Räumen? Dazu betrachten wir die Konvergenz einer Folge von Folgen in (S, d) und `∞ : Konvergenz im Raume (S, d). Wir betrachten die Folge x(n) von Folgen in S, (n) also x(n) = (xj )j mit dem Grenzwert x = (xj ). Nach dem vorangehenden Beispiel 2 ist (n) ∞ X 1 |xj − xj | (n) . d(x , x) = 2j 1 + |x(n) − xj | j=1 j (n) Somit schliessen wir, dass limn→∞ x = x genau dann, wenn für jedes einzelne (n) j ≥ 1 gilt limn→∞ |xj − xj | = 0, das heisst, wenn die Funktionen x(n) : N → R auf N punktweise gegen eine Funktion x : N → R konvergieren. (n) Im Gegensatz dazu gilt für x(n) = (xj ), x = (xj ) in `∞ (n) (n) lim x = x in `∞ ⇐⇒ lim sup |xj − xj | = 0. n→∞ n→∞ j≥1 In anderen Worten: die Funktionen x(n) : N → R konvergieren gleichmässig auf N gegen die Funktion x : N → R. Um diesen Unterschied noch etwas zu verdeutlichen betrachten wir folgende Aufgabe: Konvergiert die Folge x(n) = (1, 1, . . . , 1, 0, . . .) mit ( 1 j ≤ n) (n) . xj = 0 sonst gegen die Folge x = (1, 1, . . .)? Die Antwort lautet ja in (S, d), aber nein in `∞ , denn es ist offensichtlich d∞ (x(n) , x) ≡ 1 für alle n. 1 METRISCHE RÄUME, BAIRE KATEGORIE 4 Definition 1.3. (Abschluss, abgeschlossene Menge) Der Abschluss Ā einer Teilmenge A ⊂ M ist die Menge Ā = {x ∈ M |x = lim xn , xn ∈ A ∀n}. n→∞ Offensichtlich ist A ⊂ Ā: Nehme für alle x ∈ A xn = x. Bemerkung: der Abschluss einer Menge kann viel grösser sein als die Menge selber, siehe untenstehendes Beispiel 1. Eine Teilmenge A ⊂ M heisst abgeschlossen in M , falls Ā = A. Beispiel. Abgeschlossene Mengen: 1. Q̄ = R. 2. Es sei (M, d) = (C[0, 1], d∞ ), d∞ (x, y) = max0≤t≤1 |x(t) − y(t)| < ∞, der metrische Raum der auf dem abgeschlossenen Intervall [0, 1] stetigen Funktionen, und A = {P olynome} ⊂ C[0, 1]. Dann ist nach dem Satz von Weierstrass Ā = C[0, 1]. Die zur Metrik gehörende Konvergenz ist die gleichmässige Konvergenz. Definition 1.4. (dichte Menge, kompakte Menge, Cauchy-Folge) • A ⊂ M heisst dicht in M , falls Ā = M , das heisst, zu jedem x ∈ M und jedem r > 0 existiert ein a ∈ A mit a ∈ Br (x). • A ⊂ M heisst (folgen-)kompakt im metrischen Raum M , falls jede Folge (xj ) in A eine in A konvergente Teilfolge (xjk )k besitzt: lim xjk = x ∈ A. k→∞ Insbesondere sind kompakte Mengen abgeschlossen. In den einzelnen metrischen Räumen (M, d) gibt es im Allgemeinen Kompaktheitskriterien, so zum Beispiel in (Rn , k · k2 ): Nach Heine-Borel ist A genau dann kompakt, wenn A abgeschlossen und beschränkt ist. • Eine Folge (xn ) ⊂ M heisst eine Cauchy-Folge, falls es zu jedem ε > 0 ein N = Nε gibt, so dass d(xn , xm ) < ε für alle n, m ≥ N . Äquivalente Formulierung: Sei Xn = {xj |j ≥ n} ⊂ M, Xn ⊃ Xn+1 . Die Folge (xj ) ist eine Cauchy-Folge, falls δ(Xn ) → 0 (n → ∞). Bemerkung: Cauchy-Folge ist kein topologischer Begriff. Eine stetige Abbildung bildet konvergente Folgen auf konvergente Folgen ab, aber nicht notwendigerweise Cauchy-Folgen auf Cauchy-Folgen. Hingegen bilden gleichmässig stetige Abbildungen Cauchy-Folgen auf Cauchy-Folgen ab. Nicht jede Cauchy-Folge ist konvergent. Betrachten wir zum Beispiel den Raum Z 1 (M, d) = (C[0, 1], d1 ), d1 (x, y) = |x(t) − y(t)|dt ≤ d∞ (x, y). 0 Die Folge 0 ≤ t ≤ 1/2 0 xn (t) = n(t − 1/2) 1/2 ≤ t ≤ 1/2 + 1/n 1 1/2 + 1/n ≤ t ≤ 1 1 ist eine Cauchy-Folge in (M, d1 ), denn d1 (xn , xm ) ≤ n1 + m . Die Folge xn konvergiert 1 punktweise und in L ([0, 1]) gegen ( 0 0 ≤ t ≤ 1/2 x(t) = 1 1/2 < t ≤ 1. Aber x liegt nicht mehr in C([0, 1]). Das heisst, die Folge konvergiert nicht in (M, d1 ). 1 METRISCHE RÄUME, BAIRE KATEGORIE 5 Definition 1.5. (vollständiger (metrischer) Raum) Ein metrischer Raum (M, d) heisst vollständig, falls jede Cauchy-Folge in M konvergiert. In vollständigen (metrischen) Räumen gilt daher das bekannte CauchyKriterium. Satz 1.1 (Zusammenhang vollständig - abgeschlossen). Sei (M, d) ein metrischer Raum, A ⊂ M eine Teilmenge von M . Dann gelten folgende Aussagen: i) Ist (M, d) vollständig und Ā = A, so ist auch (A, d) vollständig; ii) Ist (A, d) vollständig, so gilt A = Ā. Beweis. i) Sei (xn ) eine Cauchy-Folge in A. Dann ist (xn ) auch eine Cauchy-Folge in M . Weil M vollständig ist, existiert der Grenzwert x = limj→∞ xj in M mit xj ∈ A. Daher ist x im Abschluss Ā von A und, da A abgeschlossen ist, liegt x in A selber. Das heisst, jede Cauchy-Folge konvergiert in A, und somit ist (A, d) vollständig. ii) Sei x ∈ Ā. Nach Definition des Abschlusses einer Menge ist x der Grenzwert einer Folge in A, also x = limj→∞ xj , xj ∈ A. Daher ist (xj ) eine Cauchy-Folge in A. A ist jedoch vollständig, also existiert ein y in A mit y = limj→∞ xj . Da der Grenzwert einer Folge eindeutig ist, folgt x = y ∈ A. Theorem 1.1 (Prinzip der Intervallschachtelung). Wir beweisen: Ein metrischer Raum (M, d) ist genau dann vollständig, wenn für jede Folge Aj ⊂ M von Teilmengen mit i) Aj = Āj , ii) Aj ⊃ Aj+1 ⊃ . . ., iii) δ(Aj ) → 0 (j → ∞) T gilt, dass j≥1 Aj = {x∗ } genau ein Punkt x∗ ∈ M ist. Bemerkung: In diesem Satz sind die Voraussetzungen besonders wichtig! Betrachten wir folgende Beispiele mit M = R: T • Für An = {0 < x < 1/n} gilt n≥1 An = ∅. Die Voraussetzungen An ⊃ An+1 ⊃ . . . und δ(An ) → 0 sind zwar erfüllt, aber die An sind nicht abgeschlossen. Also ist der Satz hier nicht anwendbar. T • Es gilt n≥1 {x ≥ n} = ∅. Auch hier ist der Satz nicht anwendbar. Zwar sind die Mengen An = {x ≥ n} abgeschlossen und absteigend (An ⊃ An+1 ⊃ . . .), aber es ist δ(An ) = ∞ für alle n. Beweis. (⇒) Wir wählen xj ∈ Aj , j ≥ 1. Dann definieren wir die Mengen Ej = {xj , xj+1 , xj+2 , . . .} ⊂ Aj . Es gilt offenbar δ(Ej ) → 0 (j → ∞). Daher ist (xj ) eine Cauchy-Folge und, weil M vollständig, konvergent: es existiert ein x ∈ M mit x = limj→∞ xj .TWegen ii) ist x ∈ Āj für j ≥ T 1 und wegen i) folgt x ∈ Aj (j ≥ 1), das heisst x ∈ j≥1 Aj . Sei nun auch y ∈ j≥1 Aj . Dann sind x, y ∈ Aj für alle j ≥ 1 und es folgt 0 ≤ d(x, y) ≤ δ(Aj ) → 0, (j → ∞), also ist x = y. (⇐) Sei (xj ) eine Cauchy-Folge. Es genügt, die Konvergenz einer Teilfolge zu zeigen. Wir definieren den Abschluss Aj = {xj , xj+1 , xj+2 , . . .} ⊂ M. 1 METRISCHE RÄUME, BAIRE KATEGORIE 6 Dann gilt δ(Aj ) → 0 (j → ∞), weil (xj ) eine Cauchy-Folge ist. Überdies ist Aj ⊃ Aj+1 , das heisst, (Aj ) erfüllt i) − iii). Nach Voraussetzung existiert ein x ∈ M mit T x ∈ j≥1 Aj . Weil x ∈ {xj , xj+1 , . . .} für jedes j ≥ 1, so finden wir nach Definition des Abschlusses eine Teilfolge (xjk )k mit x = lim xjk , k→∞ und, da (xj ) eine Cauchy-Folge ist, x = limj→∞ xj . 1.3 Kompaktheit in metrischen Räumen Definition 1.6. Sei (M, d) ein metrischer Raum. • Eine Teilmenge K ⊂ M heisst überdeckungskompakt, falls es für jede (nicht notwendigerweise abzählbare) offene Überdeckung {Ui }i∈I , das heisst K ⊂ S U , eine endliche Teilüberdeckung {Ui1 , . . . , Uin } gibt, das heisst K ⊂ i∈I i Ui1 ∪ · · · ∪ U in . • Eine Teilmenge K ⊂ M heisst folgenkompakt, wenn jede Folge in K eine Teilfolge hat welche gegen einen Punkt aus K konvergiert. Dies kann auch folgendermassen gesagt werden: Jede Folge in K hat einen Häufungspunkt in K. • Eine Teilmenge K ⊂ M heisst total beschränkt, wenn sie für jedes ε > 0 mit endlich vielen Bällen vom Radius ε überdeckt werden kann. Man kann annehmen, dass die Mittelpunkte der Bälle in K liegen, denn ist K ⊂ Bε (x1 )∪ · · · ∪ Bε (xn ), so gilt für yi ∈ Bε (xi ) ∩ K, dass K ⊂ B2ε (y1 ) ∪ · · · ∪ B2ε (yn ). • Eine Teilmenge R ⊂ X heisst relativ kompakt, falls ihr Abschluss R̄ kompakt ist. Satz 1.2. Für eine Teilmenge K eines metrischen Raums (M, d) sind äquivalent: i) K ist überdeckungskompakt, ii) K ist folgenkompakt, iii) K ist total beschränkt und vollständig. Beweis. “i) ⇒ ii)”: Sei {xn }n∈N ⊂ K eine Folge ohne Häufungspunkt in K. Für jedes y ∈ K gibt es einen Radius ry > 0, so dass der Ball Bry (y) nur endlich viele Folgenglieder enthält. Die {Bry (y)}y∈K sind eine offene Überdeckung von K, so dass es y1 , . . . , yn ∈ K gibt mit K ⊂ Bry1 (y1 ) ∪ · · · ∪ Bryn (yn ). Da die Folge {xn }n∈N keinen Häufungspunkt in K hat, besteht sie aus unendlich vielen verschiedenen Folgengliedern (sonst müsste ein Folgenglied unendlich oft auftreten und wäre damit ein Häufungspunkt), die alle in mindestens einem der Bälle Bryi (yi ) liegen, einer davon enthält also unendlich viele Folgenglieder, im Widerspruch zur Wahl von ry . Es gibt also keine Folge ohne Häufungspunkt in K. “ii) ⇒ iii)”: Sei {xn }n∈N eine Cauchy-Folge in K. Nach Annahme besitzt die Folge einen Häufungspunkt x ∈ K. Da Cauchy-Folgen höchstens einen Häufungspunkt besitzen, konvergiert die Folge gegen x ∈ K, und K ist vollständig. Wäre K nicht total beschränkt, gäbe es ein ε > 0, für das es keine endliche Überdeckung von K mit Bällen vom Radius ε gibt. Wähle x1 ∈ K beliebig. Nach Annahme gibt es ein x2 ∈ K \ Bε (x1 ). Sind x1 , . . . , xn ∈ K schon konstruiert, so wähle xn+1 in K \ (Bε (x1 ) ∪ · · · ∪ Bε (xn )), was nach Annahme möglich ist. Aufgrund der Konstruktion ist d(xi , xj ) > ε, die Folge {xn }n∈N besitzt somit keinen Häufungspunkt. Deswegen muss K total beschränkt sein. 7 1 METRISCHE RÄUME, BAIRE KATEGORIE “iii) ⇒ i)”: Sei {Ui }i∈I eine Überdeckung von K mit offenen Mengen, die keine endliche Teilüberdeckung hat. Sei εn = 2−n . Aufgrund der totalen Beschränktheit wird K von endlich vielen Bε1 (xi ) überdeckt. Da die {Ui }i∈I keine endliche Teilüberdeckung besitzen, wird eines der K ∩ Bε1 (xi ) auch von keiner endlichen Teilüberdeckung überdeckt. Sei y1 = xi . Die Menge K ∩ Bε1 (y1 ) ist als Teilmenge von K total beschränkt, wird also von endlich vielen Bε2 (x0j ) überdeckt. Eines dieser Bε2 (x0j ) wird von keiner endlichen Teilüberdeckung von {Ui }i∈I überdeckt. Sei y2 = x0j . Durch dieses Verfahren wird induktiv eine Folge {yn }n∈N definiert. Für n ≤ m ist d(yn , ym ) ≤ εn + · · · + εm ≤ 2−n+1 , daher sind die {yn }n∈N eine Cauchy-Folge und konvergieren gegen ein y ∈ K, da K vollständig ist. Dieses y ist in einem Ui der Überdeckung enthalten. Da jenes offen ist, enthält es einen Ball Bδ (y) für δ > 0. Wähle n so gross, dass d(y, yn ) ≤ δ2 und εn ≤ δ2 . Die Inklusionen Bεn (yn )∩K ⊂ Bδ (y)∩K ⊂ Ui widersprechen der Wahl von Bεn (yn ), da dieses nicht von endlich vielen Mengen {Ui }i∈I überdeckt wird. Bemerkung: In topologischen Räumen gilt weder i) ⇒ ii) noch ii) ⇒ i). Das Konzept der Totalbeschränktheit besitzt kein Analogon in topologischen Räumen. Satz 1.3. Eine total beschränkte Menge in einem vollständigen metrischen Raum ist relativ kompakt. Beweis. Da eine abgeschlossene Teilmenge eines vollständigen metrischen Raumes ist vollständig ist, genügt es zu zeigen, dass der Abschluss einer totalbeschränkten Menge total beschränkt ist. Sei K total beschränkt und ε > 0. Es gibt x1 , . . . , xn , so dass K ⊂ B 2ε (x1 ) ∪ · · · ∪ B ε2 (xn ). Weiter gilt K̄ ⊂ B̄ 2ε (x1 ) ∪ · · · ∪ B̄ 2ε (xn ) ⊂ Bε (x1 ) ∪ · · · ∪ Bε (xn ), was zu zeigen war. Satz 1.4 (Heine-Borel). Eine Teilmenge des Rn (versehen mit der euklidischen Metrik) ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. Beweis. Eine kompakte Menge ist beschränkt (überdecke K mit {Bn (0)}n∈N ) und abgeschlossen (aus xn → x folgt, dass x als einziger Häufungspunkt der Folge {xn }n∈N selbst in K liegen muss). Jede beschränkte Teilmenge des Rn ist total beschränkt: Nach Annahme ist sie in einem Ball und daher auch in einem Würfel enthalten. Dieser Würfel kann in endlich viele Würfel beliebig kleiner Seitenlänge ε zerlegt werden. Diese kleinen √ Würfel liegen je in einer Kugel mit Radius nε, d.h. jede beschränkte Teilmenge des Rn ist total beschränkt. Da Rn vollständig ist, ist es auch jede abgeschlossene Teilmenge, insbesondere ist jede beschränkte abgeschlossene Menge total beschränkt und vollständig, also kompakt. x y Bemerkung: Bezüglich der Metrik d(x, y) = √1+x2 − √ 2 ist R beschränkt 1+y und abgeschlossen, aber nicht kompakt, denn die Folge {n}n∈N hat keinen Häufungspunkt in (R, d). Ein anderes Beispiel einer nicht kompakten aber beschränkten und abgeschlossenen Menge ist die Einheitssphäre in `p (betrachte die Standardbasis als Folge). Allgemeiner folgt aus einem Satz von Riesz (wird später in der Vorlesung behandelt), dass nur in endlichdimensionalen normierten Vektorräumen alle beschränkten und abgeschlossenen Mengen kompakt sind. Satz 1.5. In einem kompakten metrischen Raum gibt es eine abzählbare dichte Teilmenge, d.h. ein kompakter metrischer Raum ist separabel. 8 1 METRISCHE RÄUME, BAIRE KATEGORIE Beweis. Sei (K, d) ein kompakter metrischer Raum. Für jedes n ∈ N gibt es Punkte (n) (n) x1 , . . . , xmn ∈ K, mit (n) K ⊂ B n1 (x1 ) ∪ · · · ∪ B n1 (x(n) mn ). Es ist einfach zu sehen, dass D = menge von K ist. S (n) (n) n {x1 , . . . , xmn } eine abzählbare dichte Teil- Definition 1.7. Seien (X, dX ) und (Y, dY ) metrische Räume, weiter sei X kompakt. Eine Familie F ⊂ C(X, Y ) heisst gleichgradig stetig, wenn es für jedes ε > 0 ein δ = δ(ε) > 0 gibt, so dass dX (x, x0 ) < δ ⇒ dY (f (x), f (x0 )) < ε ∀ x, x0 ∈ X, ∀ f ∈ F. Beachte, dass jede Funktion in einer gleichgradig stetigen Familie gleichmässig stetig ist. Bemerkung: Der Raum C(X, Y ) wird mit der Metrik d∞ (f, g) = sup dY (f (x), g(x)) x∈X zu einem vollständigen metrischen Raum. Satz 1.6 (Arzelà–Ascoli). Sei (X, dX ) ein kompakter metrischer Raum und (Y, dY ) ein vollständiger metrischer Raum. Eine Familie F von stetigen Funktionen ist genau dann relativ kompakt in (C (X, Y ) , d∞ ), wenn die Famile F gleichgradig stetig ist und für jedes x ∈ X die Menge F (x) := {f (x) | f ∈ F} relativ kompakt in (Y, dY ) ist. Beweis. =⇒: Sei der Abschluss F̄ von F kompakt. Da die Abbildung evx : (C (X, Y ) , d∞ ) −→ (Y, dY ) f 7→ f (x) für jedes x ∈ X stetig ist, folgt, dass die Menge F̄ (x) als Bild der kompakten Menge F̄ kompakt ist, somit deren Teilmenge F (x) relativ kompakt ist. Sei ε > 0 gewählt. Da F̄ als kompakte Menge in (C (X, Y ) , d∞ ) nach Satz 1.2 totalbeschränkt ist, somit auch F totalbeschränkt ist, existieren f1 , . . . , fn ∈ F mit [ Bε (fi ), also gibt es für jedes f ∈ F ein 1 ≤ if ≤ n mit F⊂ 1≤i≤n d∞ f, fif ≤ ε. Weiter existiert, weil stetige Funktionen auf kompakten Räumen gleichmässig stetig sind, ein δ > 0 mit dY (fi (x) , fi (y)) ≤ ε für alle x, y ∈ X mit dX (x, y) ≤ δ und alle 1 ≤ i ≤ n. Für f ∈ F gilt insgesamt dY (f (x) , f (y)) ≤ dY f (x) , fif (x) +dY fif (x) , fif (y) +dY fif (y) , f (y) ≤ 3ε für alle x, y ∈ X mit dX (x, y) ≤ δ, somit ist F gleichgradig stetig. ⇐=: Sei zunächst eine Folge fn von Funktionen aus F gegeben. Um eine in (C (X, Y ) , d∞ ) konvergente Teilfolge zu konstruieren, wähle zuerst eine abzählbare, dichte Teilmenge (xn )n∈N des kompakten Raumes (X, dX ). Da F (x1 ) nach Voraussetzung relativ kompakt ist, existiert eine Teilfolge fn1,j sodass fn1,j (x1 ) konvergiert. Induktiv kann analog für alle k ∈ N eine Teilfolge fnk+1,j von fnk,j erhalten werden so, dass fnk+1,j (xk+1 ) konvergiert. Die Diagonalfolge gk := fnk,k konvergiert somit auf allen Punkten (xn )n∈N . Weil (C (X, Y ) , d∞ ) vollsändig ist, genügt es zu 1 METRISCHE RÄUME, BAIRE KATEGORIE 9 zeigen, dass die Folge gk eine Cauchyfolge ist. Sei ε > 0 und wähle δ > 0 mit der gleichgradigen Stetigkeit von F. Da (X, dX ) kompakt ist und (xn )n∈N dicht liegt, [ existiert ein n0 so, dass X = Bδ (xi ) gilt. Also gibt es für jedes x ∈ X ein 1≤i≤n0 1 ≤ ix ≤ n0 mit Weiter existiert ein N ∈ N mit dX (x, xix ) ≤ δ. dY (gl (xi ) , gm (xi )) ≤ ε für alle l, m ≥ N und alle 1 ≤ i ≤ n0 , da gk auf allen Punkten (xn )n∈N konvergiert. Für alle x ∈ X und l, m ≥ N gilt insgesamt dY (gl (x) , gm (x)) ≤ dY (gl (x) , gl (xix )) + dY (gl (xix ) , gm (xix )) + dY (gm (xix ) , gm (x)) ≤ 3ε, also ist gk eine Cauchyfolge im vollständigen Raum (C (X, Y ) , d∞ ) und somit konvergent. Sei nun allgemein hk eine Folge von Funktionen aus dem Abschluss F̄ von F. Nach Definiton des Abschlusses kann eine Folge fn von Funktionen aus F mit d∞ (fn , hn ) ≤ n1 gewählt werden, welche nach dem soeben Bewiesenen eine konvergente Teilfolge fnk besitzt, deren Limes f aufgrund der Abgeschlossenheit in F̄ liegt. Insgesamt konvergiert jedoch auch hnk gegen f ∈ F̄ und die Kompaktheit von F̄ ist gezeigt. Satz 1.7. Sei (X, dX ) ein kompakter metrischer Raum. Eine Familie F von stetigen, reel- oder komplexwertigen Funktionen ist genau dann relativ kompakt in (C (X) , k·k∞ ), wenn die Famile F gleichgradig stetig und beschränkt ist. Beweis. Falls F beschränkt ist in (C (X) , k·k∞ ) ist auch F (x) für jedes x ∈ X beschränkt und also nach Heine-Borel relativ kompakt. Somit kann Satz 1.6 angewendet werden. Da kompakte Mengen in Normierten Räumen beschränkt sind, ergibt sich auch die andere Implikation aus Satz 1.6. 1.4 Die Baire-Kategorie Der historische Ursprung des Begriffes Baire-Kategorie war folgende Frage: Angenommen, für eine gegebene Folge fn : [0, 1] → R von stetigen Funktionen existiere der Grenzwert lim fn (x) = f (x) n→∞ für jedes x ∈ [0, 1], das heisst, die Folge konvergiere punktweise. Ist nun die Menge A der Punkte x in [0, 1], in denen f (x) nicht stetig ist gross“ oder klein“? Die ” ” Antwort dazu gab Baire: er sagte, die Menge A sei von erster Kategorie – Kat(A) = 1 – oder die Menge sei mager. Zunächst betrachten wir noch eine Folgerung aus der Vollständigkeit eines metrischen Raumes. Theorem 1.2. Der metrische Raum (M, d) sei vollständig. Dann gelten folgende Aussagen: T i) Die Mengen Uj ⊂ M seien offen und dicht für j ≥ 1. Dann ist j≥1 Uj dicht in M; S ii) Sei M von der Form M = j≥1 Aj mit Aj = Āj für j ≥ 1. Dann gibt es (mindestens) ein j, so dass Aj eine in M offene Kugel von M enthält. 10 1 METRISCHE RÄUME, BAIRE KATEGORIE Bemerkung: In diesem Theorem ist es wichtig, dass M vollständig ist und die Folgen (Uj ), (Aj ) abzählbar sind: S • Sei M = R = x∈R {x}. {x} ist jeweils abgeschlossen in R, enthält aber keine offene Kugel in R. Denn die Vereinigung ist nicht abzählbar. S • Ähnlich ist es mit M = Q = q∈Q {q}. {q} ist abgeschlossen, enthält aber wiederum keine offene Kugel in Q. Diesmal ist die Vereinigung abzählbar, doch: Q ist nicht vollständig. Beweis. Wir benutzen dazu die Vollständigkeit von M und Theorem 1.1: i) Wir wollen zeigen: eine offene Kugel B = Br (x) sei gegeben mit r > 0. Dann existiert ein x∗ ∈ M mit \ x∗ ∈ B ∩ Uj . j≥1 Da B offen und U1 dicht ist, schliessen wir, dass B ∩ U1 6= ∅. Weil U1 offen ist, ist auch B ∩ U1 offen. Folglich existiert ein x1 ∈ B, so dass es eine abgeschlossene Kugel B̄r1 (x1 ) ⊂ B ∩ U1 gibt mit 0 < r1 < 12 . Da Br1 (x1 ) und U2 wiederum offen sind und Ū2 = M , existiert ein x2 ∈ Br1 (x1 ), so dass B̄r2 (x2 ) ⊂ Br1 (x1 ) ∩ U2 0 < r2 < 1 . 22 Induktiv finden wir nun für jedes j ≥ 1 ein xj ∈ Br1 (x1 ), so dass B̄rj (xj ) ⊂ Brj−1 (xj−1 ) ∩ Uj 0 < rj < 1 . 2j Definieren wir Aj := B̄rj (xj ), so erhalten wir die absteigende Folge von Mengen B ⊃ A1 ⊃ A2 ⊃ . . . aus abgeschlossenen Aj , für die zudem gilt δ(Aj ) → 0, wenn j → ∞. Nach unseren Voraussetzungen ist M vollständig, und wir können nun Theorem 1.1Tanwenden. Demnach gibt es genau einen Punkt x∗ ∈ M , für welchen gilt {x∗ } = j≥1 Aj . Daraus schliessen wir, dass x∗ ∈ Aj ⊂ B̄r1 (x1 ) ∩ Uj für alle j ≥ 1. Nach unserer obigen Konstruktion heisst das aber, dass \ x∗ ∈ B ∩ Uj , j≥1 wie gewünscht. Aus i) folgt ii): wir nehmen an, die abgeschlossenen Aj = Āj enthalten keine offene Kugel von M für alle j.SDann sind die Mengen Uj = M \ Aj offen und dicht in M für alle j ≥ 1. Mit A = j≥1 Aj ergibt sich M \A =M \ [ Aj = j≥1 \ j≥1 (M \ Aj ) = \ j≥1 Uj 6= ∅, und M \ A ist nach i) sogar dicht in M . Also ist A 6= M , im Widerspruch zur Annahme. Definition 1.8. (nirgends dichte Menge) Eine Teilmenge A ⊂ M heisst nirgends dicht in M , falls Ā keine offene Kugel von M enthält. Äquivalent dazu ist folgende Formulierung: A ⊂ M ist nirgends dicht, falls M \ Ā dicht in M ist. Beispiel. Z ⊂ R ist nirgends dicht in R. Definition 1.9. (Baire-Kategorie, residuelle Menge) 11 1 METRISCHE RÄUME, BAIRE KATEGORIE i) Eine Teilmenge A ⊂ M heisst von 1. Kategorie oder mager, falls A von der S Form A = j≥1 Aj ist und die Aj nirgends dicht sind. Notation: Kat(A) = 1; ii) A ⊂ M heisst von 2. Kategorie, falls A nicht von erster Kategorie ist. Wir schreiben analog Kat(A) = 2; iii) Das Komplement einer Menge A mit Kat(A) = 1 heisst residuell, in Formeln: R = M \ A, Kat(A) = 1. Bemerkungen: 1. Eine Teilmenge einer Menge 1. Kategorie ist wieder von 1. Kategorie. Die abzählbare Vereinigung von Mengen 1. Kategorie ist ebenfalls von 1. Kategorie. Umgekehrt ist die Obermenge einer Menge 2. Kategorie selbst eine Menge von 2. Kategorie. 2. Eine Menge 1. Kategorie kann dicht sein in M . Ein Beispiel: S Betrachte M = R und die abzählbaren Vereinigung Q = q∈Q {q}. Es ist Kat(Q) = 1 und Q̄ = R. Andererseits gilt: Kat(R \ Q) = 2, denn R ist vollständig. Beweis. Angenommen, es sei Kat(R \ Q) = 1. Dann ist [ [ R = Q ∪ (R \ Q) = {q} ∪ Aj , q∈Q j≥1 wobei die Aj nirgends dicht sind. Offensichtlich enthält keine der abzählbar vielen Mengen auf der rechten Seite eine offene Kugel in R, im Widerspruch zu Theorem 1.2. T Lemma 1.1. Eine Teilmenge R ⊂ M ist residuell genau dann, wenn R ⊃ j≥1 Uj mit offenen und in M dichten Uj für alle j ≥ 1. S S Beweis. (=⇒) Es ist R = M \ A mit A = j≥1 Aj ⊂ j≥1 Āj für Aj nirgends dicht. Dann ist [ [ \ \ R=M\ Aj ⊃ M \ Āj = (M \ Āj ) = Uj j≥1 j≥1 j≥1 j≥1 für Uj := M \ Ā Tj offen und dicht in M. (⇐=) Sei R ⊃ j≥1 Uj mit offenen und dichten Uj . Dann ist M \R ⊂M \ \ Uj = j≥1 [ j≥1 (M \ Uj ) = [ Aj , j≥1 wobei die Aj nirgends dicht sind. Somit ist M \ R enthalten in einer Menge 1. Kategorie, also selbst von 1. Kategorie. Theorem 1.3 (Baire). Sei (M, d) ein vollständiger Raum. Dann ist i) Kat(M ) = 2; ii) Kat(A) = 1 ⇒ Kat(M \ A) = 2 und M \ A ist dicht in M ; iii) ∅ 6= U ist offen ⇒ Kat(U ) = 2. 1 METRISCHE RÄUME, BAIRE KATEGORIE 12 Beweis. i) Dies ist die Aussage von Theorem 1.2. ii) Sei also A von erster Kategorie. Wenn nun Kat(M \ A) = 1 gilt, so ist Kat(M ) = Kat(A ∪ (M \ A)) = 1, im Widerspruch zu i). Also muss (M \ A) von T zweiter Kategorie sein. Weil dann M \ A ⊃ j≥1 Uj für offene und dichte Uj , folgt M \ A = M mit Theorem 1.2.i). iii) Für ein offenes U 6= ∅ ist M \ U nicht dicht in M . Daher ist Kat(U ) 6= 1 wegen ii), also Kat(U ) = 2. Definition 1.10. (innerer Punkt, Inneres einer Menge) Ein Punkt x ∈ A einer Teilmenge A ⊂ M heisst innerer Punkt von A, falls in M eine offene Kugel Br (x) mit r > 0 existiert, so dass Br (x) noch ganz in A enthalten ◦ ist, also Br (x) ⊂ A. Das Innere von A, int(A) ≡ A, ist die Menge aller inneren Punkte von A. Nach dieser Definition ist A genau dann nirgends dicht, falls das Innere seines Abschlusses leer ist: A nirgends dicht ⇐⇒ int(Ā) = ∅. Satz 1.8. In einem metrischen Raum (M, d) sind die folgenden vier Aussagen äquivalent: i) Falls A ⊂ M von 1. Kategorie, so ist M \A =: Ac dicht in M , das Komplement jeder mageren Menge ist also dicht in M ; S ii) Falls A = j≥1 Aj für abgeschlossene Aj mit int(Aj ) = ∅ für alle j ≥ 1, so ist int(A) = ∅: Das Innere jeder mageren Menge ist leer; iii) Falls U 6= ∅ offen ist, so ist U von 2. Kategorie, die leere Menge ist also die einzige offene und magere Teilmenge; T iv) Falls U = j≥1 Uj für offene und in M dichte Uj , so ist auch U dicht: abzählbare Durchschnitte offener und dichter Mengen sin dicht in M . Beweis. Man beweist leicht die Reihenfolge i) ⇒ ii) ⇒ iii) ⇒ iv) ⇒ i) (Übungsaufgabe). Wenn wir nun die vorangehenden Erkenntnisse zusammenfassen, dann ergibt sich Theorem 1.4 (Baire). In einem vollständigen metrischen Raum (M, d) gelten die Aussagen i)–iv) des Satzes 1.8. Beweis. Das Theorem ist eine direkte Folge aus Theorem 1.2 und Satz 1.8. Bemerkung: Die Nullmenge ist eine mengentheoretisch völlig andere Vorstellung einer mageren Menge: Satz 1.9. Sei M = R, dann existiert eine Teilmenge A ⊂ R von erster Kategorie so, dass R = A ∪ (R \ A) mit Kat(R \ A) = 2 und R \ A eine Lebesgue-Nullmenge. Beweis. Wir benutzen, dass R vollständig ist: Wir nehmen eine abzählbare, dichte Menge {a1 , a2 , . . .} in R, zum Beispiel Q, und definieren die offenen Intervalle Iij := {x ∈ R| |x − ai | < 2−(i+j+1) } für i, j ≥ 1. T S Dann ist Uj := i≥1 Iij für jedes j offen und dicht, und U = j≥1 Uj ist eine Lebesgue-Nullmenge, also m(U ) = 0, denn aus S der Monotonie und der Subadditivität des Lebesgue-Masses ist (mit U ⊂ Uj = i≥1 Iij ) X X 0 ≤ m(U ) ≤ m(Uj ) ≤ m(Iij ) = 2−(i+j) = 2−j i≥1 i≥1 1 METRISCHE RÄUME, BAIRE KATEGORIE 13 für jedes feste j ≥ 1. Also ist m(U ) = 0. Wir definieren nun [ [ Aj , (R \ Uj ) = A=R\U = | {z } j≥1 j≥1 :=Aj wobei die Aj nirgends dicht sind, das heisst Kat(A) = 1. Weil R vollständig ist, folgt Kat(R \ A) = Kat(U ) = 2. 1.5 Erste Anwendungen von Baire Wir stellen uns die Frage: Gibt es stetige Funktionen, die nirgends differenzierbar sind? Die Antwort ist: Ja, im Sinne der Kategorie sind sie sogar der typische Fall! Satz 1.10 (Banach, 1931). Sei R die Menge der auf [0, 1] stetigen und nirgends differenzierbaren Funktionen. Dann ist R residuell im vollständigen metrischen Raum (C[0, 1], d∞ ), also insbesondere dicht. Beweis. Zum Beweis des Satzes benutzen wir die Vollständigkeit von C[0, 1] und Theorem 1.2: Wir setzen die stetige Funktion f : [0, 1] → R durch Konstanten stetig fort, so dass f auf ganz R definiert ist. Für n ≥ 1 setzen wir ) ( x(t + h) − x(t) > n ∀ t ∈ [0, 1] , Un = x ∈ C[0, 1] sup h 0<|h|≤1 \ Un ⊂ R. U= n≥1 Ein x ∈ U ist demnach in keinem Punkt von [0, 1] differenzierbar. Wir zeigen: die Un sind offen und dicht. Dann folgt, dass R residuell und dicht ist (Lemma 1.1 bzw. Theorem 1.2). i) Un ist offen: Sei x ∈ Un . Dann gibt es (nach der Definition des Supremums) zu jedem t ∈ [0, 1] ein δt > 0 und ein ht mit 0 < |ht | ≤ 1 so, dass x(t + ht ) − x(t) > n + δt . ht Weil x stetig ist, existiert ein offenes Intervall It 3 t, so dass für alle s ∈ It gilt x(s + ht ) − x(s) > n + δt . ht Weil [0, 1] kompakt ist, gibt es endlich viele solcher Intervalle It1 , . . . , ItN , welche [0, 1] überdecken. Somit können wir δ = min{δt1 , . . . , δtN } > 0, h = min{|ht1 |, . . . , |htN |} > 0 definieren. Wir nehmen nun ein y ∈ C[0, 1] und ein t ∈ [0, 1]. Also ist t ∈ Itj für ein j ∈ {1, . . . , N }. Damit folgt |x(t + htj ) − x(t)| ≤ |x(t + htj ) − y(t + htj )| + |y(t + htj ) − y(t)| + |y(t) − x(t)| ≤ 2kx − yk∞ + |y(t + htj ) − y(t)|. 1 METRISCHE RÄUME, BAIRE KATEGORIE 14 Sei kx − yk∞ < ε, dann ist y(t + htj ) − y(t) x(t + htj ) − x(t) 2kx − yk∞ ≥ − htj htj |htj | 2ε > n, ≥n+δ− h falls ε hinreichend klein ist. Dies gilt jedoch für jedes t ∈ [0, 1], und so ist y ∈ Un . ii) Un ist dicht (nach Weierstrass): Sei Bε (y) ⊂ C[0, 1] eine offene Kugel. Wir werden zeigen: es existiert ein x ∈ Bε (y) ∩ Un . Nach Weierstrass existiert ein Polynom p, so dass ky − pk∞ < ε/2. Wir suchen nun ein x ∈ Un mit kx − pk∞ < ε/2. Dazu definieren wir eine stetige, periodische Zick-Zack-Funktion z. Offenbar ist z(t) stetig und pez(t) riodisch, mit |z(t)| ≤ 1 für alle 6 1 t ∈ R. Wir definieren für λ > 0 @ @ @ die Funktion @ @ @ @ @ @ -t xλ (t) = p(t) + zλ (t), 0 -2 -1 1 2 mit zλ (t) = λ z(t/λ2 ). Mit den obigen Definitionen ist dann |zλ (t)| ≤ λ, |Steigung zλ (t)| = 1/λ und kxλ − pk∞ = λ. Es gilt dann xλ (t + h) − xλ (t) zλ (t + h) − zλ (t) p(t + h) − p(t) ≥ − . h h h Wenn wir |h| klein genug wählen, folgt mit dem Mittelwertsatz xλ (t + h) − xλ (t) 1 d ≥ − p > n, λ dt h ∞ falls λ hinreichend klein ist. Dies gilt für alle t, also ist x ∈ Bε (y) ∩ Un für kleine λ, was zu beweisen war. An dieser Stelle beweisen wir noch ein Theorem, welches später für uns wichtig sein wird: Theorem 1.5 (Prinzip der gleichmässigen Beschränktheit). Sei (M, d) ein vollständiger, metrischer Raum, fλ : M → R, λ ∈ Λ, eine Familie von stetigen Funktionen. Falls die Familie punktweise beschränkt ist, das heisst, sup |fλ (x)| < ∞ λ∈Λ ∀ x ∈ M, dann gibt es eine offene Kugel B ⊂ M , so dass sup λ∈Λ,x∈B |fλ (x)| < ∞, das heisst, die Familie ist gleichmässig beschränkt auf B. Beweis. Wir benutzen dazu Theorem 1.2 sowie die Stetigkeit der fλ : Für jedes λ ∈ Λ und n ≥ 1 definieren wir An,λ := {x ∈ M | |fλ (x)| ≤ n}. Jedes An,λ ist abgeschlossen, da fλ stetig ist. Wir bilden dann die Menge \ An := An,λ = {x ∈ M | |fλ (x)| ≤ n ∀ λ ∈ Λ}. λ∈Λ 1 METRISCHE RÄUME, BAIRE KATEGORIE 15 Insbesondere ist An abgeschlossen. Nach S Voraussetzung existiert für jedes x ∈ M ein j, so dass x ∈ Aj , also ist M = j≥1 Aj . Weil nun M vollständig ist, gibt es nach Theorem 1.2 ein j und eine offene Kugel B ⊆ Aj , das heisst |fλ (x)| ≤ j ∀ λ ∈ Λ, ∀ x ∈ B. Satz 1.11 (Baire). Sei (M, d) ein vollständiger metrischer Raum, fn eine Folge von stetigen Funktionen fn : M → R, n ≥ 1 und es existiere der Grenzwert lim fn (x) =: f (x) ∈ R n→∞ für jedes x ∈ M . Dann ist R = {x ∈ M |f stetig in x} eine residuelle Menge, also insbesondere dicht in M. Beweis. Übungsaufgabe 1.6 Vervollständigung Definition 1.11. (Isometrie) Eine Abbildung ϕ : (M1 , d1 ) → (M2 , d2 ) heisst eine Isometrie, falls d2 (ϕ(x), ϕ(y)) = d1 (x, y) ∀ x, y ∈ M1 . Sie ist gleichmässig stetig auf M1 und injektiv, aber nicht notwendigerweise auch surjektiv. Für den Beweis des nächsten Theorems beweisen wir zunächst die beiden nachfolgenden Hilfssätze: Lemma 1.2. Sei (M, d) ein metrischer Raum und es bezeichne B(M, R) den Raum der beschränkten Funktionen B(M, R) := {f : M −→ R| sup |f (x)| < ∞}. x∈M Dann existiert eine Isometrie ϕ : (M, d) −→ (B(M, R), d∞ ). Beweis. Wir fixieren ein x∗ ∈ M und definieren für x ∈ M die Funktion fx : M −→ R durch y 7−→ fx (y) := d(x, y) − d(x∗ , y) y ∈ M. Aus |d(x, y) − d(u, v)| ≤ d(x, u) + d(y, v) folgt dann |fx (y)| ≤ d(x, x∗ ) ∀ y ∈ M. Folglich liegt fx in B(M, R). Es ist dann d∞ (fx , fz ) = sup |fx (y) − fz (y)| = sup |d(x, y) − d(z, y)| y∈M y∈M ≤ d(x, z). Das Supremum in der obigen Gleichungsfolge wird angenommen für y = z, daher folgt d∞ (fx , fz ) = d(x, z). Die Abbildung ϕ : M → B(M, R); x 7→ ϕ(x) =: fx ist die gesuchte Isometrie, weil d∞ (ϕ(x), ϕ(z)) = d(x, z) für alle x, z ∈ M . 16 1 METRISCHE RÄUME, BAIRE KATEGORIE Lemma 1.3 (Eindeutigkeit der Vervollständigung). Seien (M1 , d1 ) und (M2 , d2 ) zwei vollständige Räume, A1 ⊂ M1 , A2 ⊂ M2 Teilmengen mit Ā1 = M1 und Ā2 = M2 sowie ϕ : A1 → A2 eine surjektive Isometrie von A1 auf A2 . Dann existiert genau eine surjektive Isometrie ϕ∗ : M1 → M2 von M1 auf M2 , so dass ϕ∗ (x) = ϕ(x) für alle x ∈ A1 . Beweis. Übungsaufgabe Nun kommen wir zum eigentlichen Theorem 1.6. Sei (M, d) ein metrischer Raum. Dann gibt es einen metrischen Raum (M ∗ , d∗ ), so dass i) (M ∗ , d∗ ) vollständig ist und ii) es eine Isometrie ϕ : (M, d) → (M ∗ , d∗ ) gibt mit ϕ(M ) = M ∗ . (M ∗ , d∗ ) heisst Vervollständigung von (M, d). Sind (M1∗ , d∗1 ) und (M2∗ , d∗2 ) zwei Vervollständigungen von (M, d), dann gibt es eine Isometrie von (M1∗ , d∗1 ) auf (M2∗ , d∗2 ). Beweis. Sei M 6= ∅ eine Menge. Dann ist der Raum B(M, R) der beschränkten Funktionen B(M, R) := {f : M → R| sup |f (x)| < ∞} x∈M mit der Metrik d∞ (f, g) := supx∈M |f (x)−g(x)| ein vollständiger, metrischer Raum, weil R vollständig ist. Mit Lemma 1.2 folgt dann, dass wie gewünscht eine Isometrie ϕ : (M, d) → (B(M, R), d∞ ) existiert. Weil B(M, R) vollständig ist, ist der Abschluss (ϕ(M ), d∞ ) ein vollständiger Raum nach Satz 1.1. Wir wählen daher (M ∗ , d∗ ) = (ϕ(M ), d∞ ). Damit folgen die Aussagen i), ii) von Theorem 1.6. Die Eindeutigkeit der Vervollständigung wurde in Lemma 1.3 bewiesen. Wie wir gesehen haben, können wir abstrakt jeden metrischen Raum sofort vervollständigen. Eine Frage bleibt: lässt sich die Vervollständigung wieder konkret darstellen? Dazu hier ein Beispiel. Sei Ω ⊂ Rn offen, Cc∞ (Ω) die Menge der C ∞ (Ω)-Funktionen mit kompaktem Träger supp(f ) in Ω, wobei supp(f ) = {x ∈ Ω|f (x) 6= 0}. Wir definieren eine Metrik auf Cc∞ (Ω) =: M durch das Riemann’sche Integral d(f, g) = Z I |f (x) − g(x)|p dx p1 , wobei I ein kompaktes Intervall ist mit I ⊃ supp(f ), supp(g). Die Vervollständigung des metrischen Raumes (Cc∞ (Ω), d) ist Lp (Ω), also der Raum der Äquivalenzklassen der Lebesgue-messbaren Funktionen f : Ω → R, so dass |f |p Lebesgue-integrabel ist. Dies folgt aus i) Lp (Ω) ist vollständig; ii) Cc∞ (Ω) ⊂ Lp (Ω) ist dicht in der Lp -Metrik; 1 METRISCHE RÄUME, BAIRE KATEGORIE 17 iii) In Cc∞ (Ω) ist Lebesgue-integrabel gleich Riemann-integrabel, und wir haben die Isometrie Z Z |f − g|p dµ = |f (x) − g(x)|p dx . | Ω {z } |I {z } Lebesgue-Integral Riemann-Integral 18 2 NORMIERTE RÄUME 2 Normierte Räume 2.1 Definitionen und erste Folgerungen Definition 2.1. (normierter Raum, Norm, Banach-Raum) Ein normierter Raum ist ein Paar (X, ρ), wobei X ein Vektorraum und ρ : X → R eine Norm, das heisst, eine Funktion ρ(x) := kxk ist mit den Eigenschaften i) kxk ≥ 0 und kxk = 0 ⇐⇒ x = 0, ii) kλxk = |λ|kxk, iii) kx + yk ≤ kxk + kyk für alle λ ∈ C, x, y ∈ X. Die zur Norm assoziierte Metrik ist gegeben durch d(x, y) := kx − yk. Der normierte Raum (X, ρ) heisst Banach-Raum, falls (X, d) vollständig ist. Aus obigen Definitionen können wir schon erste Folgerungen ziehen: Satz 2.1 (Stetigkeitseigenschaften). In einem normierten Raum (X, k k) gilt i) Die Norm ρ : X → R ist stetig, das heisst: kxk − kyk ≤ kx − yk = d(x, y). ii) Vektorraumoperationen sind stetig: {x, y} 7→ x + y : X × X {λ, y} 7→ λy : C×X → X, → X. Beweis. i) Schreibe x = (x − y) + y. Dann folgt aus der Dreiecksungleichung kxk ≤ kx − yk + kyk, und, formen wir um, kxk − kyk ≤ kx − yk. Durch Vertauschung von x und y erhalten wir kyk − kxk ≤ ky − xk = k(−1)(x − y)k = kx − yk. ii) Für die Addition gilt: k(x + y) − (x∗ + y ∗ )k ≤ kx − x∗ k + ky − y ∗ k, und für die skalare Multiplikation ist kλx − λ∗ x∗ k = kλ(x − x∗ ) + (λ − λ∗ )x∗ k ≤ |λ| kx − x∗ k + |λ − λ∗ |kx∗ k. Beispiel (Der Raum der beschränkten Funktionen). Sei M eine Menge, (X, k k) ein normierter Raum. Wir bezeichnen mit B(M, X) := {f : M → X| sup kf (t)k < ∞} t∈M den Raum der beschränkten Funktionen f von M nach X. Damit überträgt sich die Vektorraum-Struktur von X auf B(M, X), denn es ist f +g : λf : −f : 0: (f + g)(t) (λf )(t) (−f )(t) 0(t) := := := := f (t) + g(t), λf (t), −f (t), 0 ∈ X ∀ t ∈ M. 19 2 NORMIERTE RÄUME Mit der Norm kf k := supt∈M kf (t)k wird B(M, X) zu einem normierten Raum. Dass dies auch wirklich eine Norm ist, zeigt man so: i) sei kf k = 0. Dann ist nach Definition kf (t)k = 0 für alle t ∈ M und folglich f (t) = 0. Das ist genau dann der Fall, falls f = 0 ∈ X. ii) folgt direkt aus den Definitionen der Norm und des Supremums. iii) Dreiecksungleichung: k(f + g)(t)k = kf (t) + g(t)k ≤ kf (t)k + kg(t)k ≤ sup kf (t)k + sup kg(t)k t∈M t∈M = kf k + kgk. Mit dem Übergang ins Supremum über t auf der linken Seite folgt dann, wie gewünscht, kf + gk ≤ kf k + kgk. Zu B(M, X) beweisen wir noch folgenden Satz 2.2. Ist X ein Banach-Raum, so ist auch B(M, X) wieder ein Banach-Raum. Beweis. Sei fn eine Cauchy-Folge in B(M, X). Wir wollen zeigen, dass die Folge in B(M, X) konvergiert. Wir geben uns also ein beliebiges ε > 0 vor. Dann gibt es ein Nε , so dass kfn − fm k < ε für alle n, m ≥ Nε . Nach Definition der Norm ist dann kfn (t) − fm (t)k < ε ∀ n, m ≥ Nε , ∀ t ∈ M. (2.1) Das bedeutet aber nichts anderes, als dass fn (t) für jedes t eine Cauchy-Folge in X ist. Nach Voraussetzung ist X ein Banach-Raum, also insbesondere vollständig, und es existiert der punktweise Grenzwert f (t) := lim fn (t) n→∞ ∈X für alle t in M . Aus (2.1) folgt mit m → ∞ und der Stetigkeit der Norm, dass kfn (t) − f (t)k = lim kfn (t) − fm (t)k ≤ ε m→∞ (2.2) für alle n ≥ Nε und für alle t in M . Wenden wir die Dreiecksungleichung an, so erhalten wir kf (t)k ≤ kfn (t) − f (t)k + kfn (t)k ≤ ε + kfn k < ∞. Somit liegt f wieder in B(M, X). Nehmen wir in der mit (2.2) gekennzeichneten Gleichung das Supremum über alle t, so erhalten wir kfn − f k := sup kfn (t) − f (t)k ≤ ε ∀ n ≥ Nε . t∈M Dies gilt für alle ε > 0. Somit strebt die Folge fn nach der Definition der Konvergenz in B(M, X) gegen die Funktion f ∈ B(M, X). Damit konvergiert jede Cauchy-Folge in B(M, X), und der Satz ist bewiesen. Definition 2.2. (äquivalente Normen) Zwei Normen ρ1 , ρ2 auf dem Vektorraum X heissen äquivalent, falls zwei Zahlen m, M existieren mit 0 < m < M , so dass für alle x 6= 0 gilt m≤ ρ1 (x) ≤ M. ρ2 (x) 20 2 NORMIERTE RÄUME Gleichbedeutend ist die Formulierung für die assoziierte Metrik: es ist dann m≤ ρ1 (x − y) ≤M ρ2 (x − y) für alle x 6= y. Zum Vergleich: Zwei Metriken d1 , d2 auf X heissen äquivalent, falls eine Folge genau dann bezüglich d1 konvergiert, wenn sie auch bezüglich d2 konvergiert. Äquivalente Normen auf einem Vektorraum definieren ein und dieselbe Topologie und dieselben Cauchyfolgen. Satz 2.3. Auf dem endlich-dimensionalen Vektorraum X = Cn sind alle Normen äquivalent. Beweis. Wir benutzen, dass in einem endlich-dimensionalen Vektorraum die Einheitskugel kompakt ist (dass dies für unendlich-dimensionale Vektorräume nicht der Fall ist, werden wir später sehen). Es genügt zu zeigen, dass alle Normen zu einer einzigen äquivalent ist. Wir beweisen dies für die bekannte Euklidische Norm d2 (x, y) = kx − yk2 . Sei ρ : Cn → R eine Norm. Dann ist ρ : (Cn , d2 ) → R stetig: n X |ρ(x) − ρ(y)| ≤ ρ(x − y) = ρ (xj − yj )ej j=1 ≤ n X j=1 |xj − yj |ρ(ej ) ≤ kx − yk∞ n X ρ(ej ) j=1 | {z } =:c ≤ ckx − yk2 . Die Funktion ρ : S = {x ∈ Cn | kxk2 = 1} → R ist stetig und es ist ρ(x) > 0 für alle x in S. Weil S kompakt ist, nimmt ρ ihr Minimum und Maximum an, also 0 < m = ρ(x∗ ) ≤ ρ(x) ≤ ρ(x∗ ) = M, und daher gilt m≤ρ x kxk2 = ρ(x) ≤ M. kxk2 Folglich ist ρ äquivalent zur Euklidischen Norm. Da ρ beliebig war, folgt die Behauptung. Folgerungen: In einem endlich-dimensionalen Vektorraum X sind alle Normen äquivalent: Sei (X, k k) e in n-dimensionaler Vektorraum. Wir wählen eine Basis e1 , . . . , en in X und definieren die Abbildung ϕ : Cn → X durch ϕ(x) = n X ∈ X. xj e j j=1 Das so definierte ϕ ist ein linearer Isomorphismus, und somit ist kϕ(x)k eine neue Norm auf Cn . Nach Satz 2.3 gibt es m, M derart, dass 0<m≤ für alle x 6= 0 in Cn . Dann ist aber m≤ ϕ(x) ≤M kxk2 kyk kϕ−1 (y)k 2 ≤M 2 NORMIERTE RÄUME 21 für y 6= 0 in X. Dies gilt jedoch für jede Norm k k, also ist die Aussage bewiesen. Da Cn auch vollständig ist, folgt sofort Satz 2.4. Sei (X, k k) ein endlich-dimensionaler normierter Raum. In diesem Falle ist (X, k k) ein Banach-Raum. Folgerung: Sei (Y, k k) ein normierter Raum, X ⊂ Y ein linearer Teilraum endlicher Dimension. Dann ist (X, k k) vollständig und nach Satz 1.1 deshalb eine in Y abgeschlossene Menge. Sind X und Y zwei beliebige Vektorräume und A : X → Y eine Abbildung, so heisst A linear , falls A(x + y) = A(x) + A(y) und A(λx) = λA(x) für alle x, y ∈ X. Das heisst, die Abbildung A ist mit der Vektorraum-Stuktur in Y verträglich (analog erhalten Gruppenhomomorphismen ϕ : G → F die Gruppenstruktur in F ). Es ist allgemein gebräuchlich, dass eine lineare Abbildung auch als Operator bezeichnet wird. Satz 2.5. Seien X, Y zwei normierte Räume und A : X → Y eine lineare Abbildung. Dann sind folgende Aussagen äquivalent: i) A ist stetig im Punkt 0 ∈ X; ii) A ist stetig in jeden Punkt x ∈ X; iii) A ist gleichmässig stetig auf X; iv) Es existiert ein c ≥ 0, so dass kA(x)k ≤ ckxk für alle x ∈ X; v) A ist beschränkt auf der Einheitskugel: supkxk≤1 kA(x)k < ∞. Beweis. Wir beweisen die Reihenfolge i) ⇒ v) ⇒ iv) ⇒ iii) ⇒ ii) ⇒ i). i) ⇒ v): Angenommen, A sei nicht beschränkt auf der Einheitskugel, dann existiert eine Folge xj ∈ X, so dass kxj k ≤ 1 und kA(xj )k ≥ j für j ≥ 1. Es folgt somit, dass die Folge yj := xj /j gegen 0 konvergiert, weil kxj /jk ≤ 1/j. Für die yj folgt dann 1 kA(yj )k = kA(xj )k ≥ 1 j für alle j ≥ 1. Weil aber A(0) = 0 ist, kann A in 0 nicht stetig sein, im Widerspruch zu unserer Annahme. v) ⇒ iv): Sei c := supkxk≤1 kA(x)k < ∞. Dann ist für x 6= 0 x ≤ c ⇐⇒ 1 kA(x)k ≤ c. A kxk kxk Also haben wir unsere Konstante c gefunden. iv) ⇒ iii): Aus der Linearität und iv) folgt kA(x) − A(y)k = kA(x − y)k ≤ ckx − yk. A ist demnach gleichmässig stetig auf X. Die Schritte iii) ⇒ ii) ⇒ i) sind offensichtlich. Anders ausgedrückt: eine lineare Abbildung A : X → Y von normierten Vektorräumen ist genau dann stetig, wenn sie (auf der Einheitskugel) beschränkt ist. Wir zeigen an dieser Stelle noch eine überraschende Eigenschaft von unendlichdimensionalen Vektorräumen: Lemma 2.1. Sei (X, k k) ein unendlich-dimensionaler Vektorraum. Dann existiert eine lineare, nicht-stetige Funktion A : X → R. 22 2 NORMIERTE RÄUME Beweis. Da X ein Vektorraum ist, besitzt X eine algebraische Basis , das heisst, es gibt eine (eventuell unendliche) Familie eλ , λ ∈ Λ, so dass jedes x ∈ X eine eindeutige Darstellung der Form X x= αλ (x)eλ λ∈Λ besitzt, mit Koeffizienten αλ ∈ R, wobei nur endlich viele der αλ von Null verschieden sind. Die Koeffizienten αλ (x) sind zudem linear in x. Da dim(X) = ∞, können wir eine abzählbare Familie λ1 , λ2 , . . . ∈ Λ auswählen und schreiben zur Vereinfachung ej := eλj , αj (x) := αλj (x). Nun definieren wir eine lineare Abbildung A : X → R durch A(x) := ∞ X j=1 jkej kαj (x) ∈ R. Diese Summe ist für jedes x endlich. Mit dieser Definition ist jetzt X X ∞ ∞ es es kej k αj (es ) = s A = jkej kαj = j kes k ke k ke s sk j=1 j=1 für alle s ≥ 1, da αj (es ) = δjs . Weil gilt k keess k k = 1, ist A auf der Einheitssphäre nicht beschränkt, und daher auch nicht stetig. Das führt uns zum Theorem 2.1. In einem normierten Raum (X, k k) sind äquivalent: i) Der Vektorraum ist endlich (dim(X) < ∞); ii) Alle Normen sind äquivalent; iii) Alle linearen Abbildungen A : X → Y in einen normierten Raum Y sind stetig; iv) Jede beschränkte Folge besitzt eine konvergente Teilfolge; v) Die Einheitssphäre S = {x ∈ X| kxk = 1} ist kompakt. Speziell gilt in endlich-dimensionalen Vektorräumen, dass aus der algebraischen Eigenschaft linear“ die topologische Eigenschaft stetig“ folgt. ” ” Beweis. i) ⇒ ii) folgt aus Satz 2.3, i) ⇒ iv) aus dem Satz von Bolzano-Weierstrass und i) ⇒ v) aus dem Satz von Heine-Borel. i) ⇒ iii) Wir betrachten einen endlich-dimensionalen Vektorraum X, eine lineare Abbildung A : X → Y und definieren eine neue Norm auf X durch kxkA := kxk + kA(x)k. Nach Satz 2.3 ist kxkA ≤ M kxk für ein geeignetes (endliches) M . Das heisst, kA(x)k ≤ kxkA ≤ M kxk, sprich, A ist beschränkt und nach Satz 2.5 also stetig. iii) ⇒ i) folgt aus dem obigen Lemma 2.1. ii) ⇒ i) Sei dim(X) = ∞. Wir definieren auf X wieder eine neue Norm kxkA = kxk + |A(x)| für die lineare Funktion A aus Lemma 2.1. Dann ist kxkA nicht äquivalent zu k k, da kxkA x 6= 0 kxk nicht beschränkt ist. iv) ⇒ i) folgt aus den nachfolgenden Lemmata 2.2 und 2.3. 23 2 NORMIERTE RÄUME Lemma 2.2 (Franz Riesz). Sei (X, k k) ein normierter Raum und Y ⊂ X ein abgeschlossener linearer Teilraum mit X 6= Y . Dann gibt es zu jedem ε ∈ (0, 1) ein x = xε mit (1) kxk = 1 und (2) d(x, Y ) = inf y∈Y kx − yk > 1 − ε. Beweis. Da Y 6= X ist, können wir ein x∗ ∈ X \ Y wählen. Weil Ȳ = Y, ist der Abstand von x∗ zu Y echt positiv, also d := inf |x∗ − y| = d(x∗ , Y ) > 0. y∈Y Sei nun ein ε mit 0 < ε < 1 vorgegeben. Dann existiert nach der Definition des d Infimums ein y ∗ ∈ Y mit d ≤ kx∗ − y ∗ k < 1−ε . Wir definieren nun xε = x = x∗ − y ∗ , kx∗ − y ∗ k also ist kxk = 1. Es gilt auch (2), denn für ein beliebiges y ∈ Y ist ∗ x − y∗ kx − yk = − y kx∗ − y ∗ k 1 = ∗ kx∗ − (y ∗ + kx∗ − y ∗ ky) k {z } | kx − y ∗ k d ≥ ∗ > 1 − ε. kx − y ∗ k ∈Y Lemma 2.3. In einem unendlich-dimensionalen normierten Raum (X, k k) gibt es eine Folge xj ∈ X mit kxj k = 1, welche keine konvergente Teilfolge besitzt. Beweis. Wir wählen ein x1 ∈ X mit kx1 k = 1 und definieren den linearen Unterraum Y1 := hx1 i ⊂ X. Nach Satz 2.4 ist Y1 ein Banach-Raum, also insbesondere abgeschlossen in X. Nach Lemma 2.2 existiert daher ein x2 ∈ X \ Y1 mit kx2 k = 1 und kx2 − x1 k > 21 . Nun definieren wir Y2 = hx1 , x2 i, dim(Y2 ) = 2. Wiederum ist Y2 nach Satz 2.4 abgeschlossen in X, und nach Lemma 2.2 existiert ein x3 ∈ X \ Y2 mit kx3 k = 1 und kx3 − x1 k > 21 , kx3 − x2 k > 21 . Induktiv finden wir so eine Folge xj ∈ X, denn dim(X) = ∞, mit kxj k = 1 und kxi − xj k > 12 für alle i 6= j. Daraus schliessen wir, dass xj keine konvergente Teilfolge besitzt. In anderen Worten: Einheitskugeln in unendlich-dimensionalen Vektorräumen sind gross“. ” 2.2 L(X, Y ), zur Erinnerung In diesem Abschnitt betrachten wir eine bestimmte Menge von Funktionen. Dazu nehmen wir zwei normierte Räume X, Y und definieren L(X, Y ) := {A : X → Y |A ist linear und stetig}. Wir sehen leicht, dass L(X, Y ) ein Vektorraum ist, denn die lineare Struktur ist durch die Linearität der Abbildungen gegeben, und wir können in diesem Vektorraum eine Norm kA(x)k <∞ kAk := sup kA(x)k = sup kxk x6=0 kxk≤1 24 2 NORMIERTE RÄUME festlegen. Falls der Raum X von unendlicher Dimension ist, dann braucht das Supremum nicht angenommen zu werden, weil dann die Einheitskugel nicht mehr kompakt ist (zur Erinnerung: auf kompakten Mengen nimmt eine reellwertige und stetige Funktion immer ihr Supremum und Infimum an). Satz 2.6. Mit den obigen Definitionen gilt: i) Ist A ∈ L(X, Y ), B ∈ L(Y, Z), so ist BA ∈ L(X, Z) und BA erfüllt die Ungleichung kBAk ≤ kBk kAk. Insbesondere ist für X = Y die j-te Potenz Aj = AA . . . A wohldefiniert und es ist kAj k ≤ kAkj für j ≥ 1. ii) Die obige Abbildung (Verkettung) L(X, Y ) × L(Y, Z) −→ L(X, Z), {A, B} 7−→ BA ist stetig. Beweis. Für die Normen in den Räumen X, Y, Z gilt k(BA)(x)k = kB(Ax)k ≤ kBk kA(x)k ≤ kBk kAk kxk und somit folgt i). Um die Stetigkeit zu beweisen, schreiben wir B1 A1 − BA = B1 (A1 − A) + (B1 − B)A. Dann folgt mit dem Teil i) kB1 A1 − BAk ≤ kB1 k kA1 − Ak + kB1 − Bk kAk. Satz 2.7. Ist der Bildraum Y ein Banach-Raum, so ist auch der Raum L(X, Y ) ein Banach-Raum Beweis. Wir wollen zeigen, dass eine Cauchy-Folge in L(X, Y ) konvergiert. Darum nehmen wir eine solche Cauchy-Folge An und geben uns ein beliebiges, aber festes ε > 0 vor. Dann existiert nach Definition der Cauchy-Folge ein Nε =: N , so dass kAn − Am k < ε für alle n, m > N . Dann folgt kAn (x) − Am (x)k ≤ εkxk ∀ n, m > N, (2.3) das heisst, An (x) ist für jedes x ∈ X eine Cauchy-Folge in Y . Nach Voraussetzung ist Y ein Banach-Raum, daher existiert der (punktweise) Grenzwert lim An (x) = A(x) ∈ Y n→∞ für jedes x ∈ X. Weil die Addition in normierten Räumen stetig ist, ist auch A wiederum linear. Mit m → ∞ folgt aus (2.3) kAn (x) − A(x)k ≤ εkxk ∀ n > N. Zusammen mit der Dreiecksungleichung führt dies zu kA(x)k ≤ kA(x) − An (x)k + kAn (x)k ≤ (ε + kAn k)kxk, 25 2 NORMIERTE RÄUME das heisst, A ist wieder in L(X, Y ). Andererseits ist für x 6= 0 kAn (x) − A(x)k ≤ ε ∀ n > N. kxk Nehmen wir auf der linken Seite das Supremum über alle x 6= 0, so erhalten wir, dass kAn − Ak ≤ ε für alle n > Nε und dies gilt für alle ε > 0. Nach der Definition der Konvergenz in L(X, Y ) folgt also, dass An in L(X, Y ) gegen A konvergiert. Ganz analog zum bekannten Raum R definieren wir auch in L(X, Y ) Folgen und Reihen: Ist Aj ∈ L(X, Y ) eine Folge für j ≥ 0, so legen wir eine weitere Folge (N-te Partialsumme) N X Aj ∈ L(X, Y ) SN := j=0 fest. Falls die Folge SN in L(X, Y ) konvergiert, so schreiben w ir für den Grenzwert lim SN := N →∞ ∞ X ∈ L(X, Y ). Aj j=0 Wie wir bereits gesehen haben, ist L(X, Y ) vollständig, wenn Y vollständig ist. Als Folge gilt dann auch in L(X, Y ) das Cauchy-Kriterium: SN konvergiert genau dann, wenn SN eine Cauchy-Folge in L(X, Y ) ist. Satz 2.8. Sei nun Y ein Banach-Raum und Aj , j ≥ 0, eine Folge in L(X, Y ). Falls ∞ X j=0 kAj k < ∞, dann existiert der Grenzwert lim SN = N →∞ in L(X, Y ), und k P j≥0 Aj k ≤ P j≥0 X Aj j≥0 kAj k Beweis. Wir wenden das Cauchy-Kriterium an: Nach Voraussetzung existiert X j≥0 kAj k = lim N →∞ N X j=0 kAj k =: lim sN | {z } N →∞ ∈ R. =:sN WegenP dem Cauchy-Kriterium ist sN eine Cauchy-Folge in R. Dann ist aber auch N SN = j=0 Aj eine Cauchy-Folge in L(X, Y ), denn NX N +k X +k kAj k = |sN +k − sN |. ≤ Aj kSN +k − SN k = j=N +1 j=N +1 Weil L(X, Y ) vollständig ist, konvergiert SN in L(X, Y ). Wurzelkriterium:P Wir können ein Resultat der Analysis auf unser Problem anwenden: Die Reihe j≥1 kAj k konvergiert, wenn lim supj→∞ kAj k1/j < 1. Wir betrachten im Folgenden den Spezialfall X = Y und schreiben zur Abkürzung L(X, X) =: L(X). Insbesondere nehmen wir an, dass X ein Banach-Raum ist. Damit wird L(X) wegen Satz 2.7 zu einem vollständigen Raum. 26 2 NORMIERTE RÄUME Sei jetzt f (z) eine Potenzreihe im komplexen Raum C, also X f (z) = aj z j j≥0 für z ∈ C. Dann besitzt die Potenzreihe einen wohldefinierten Konvergenzradius R ≥ 0. Nehme an R > 0. Dann ist auch für A ∈ L(X) mit kAk < R die Reihe X aj Aj f (A) = j≥0 in L(X) konvergent, denn es gilt X X |aj | kAkj kaj Aj k ≤ j≥0 j≥0 und wir haben vorausgesetzt, dass kAk < R. Um diese Idee noch etwas zu illustrieren, hier noch zwei Beispiele: P j 1. Exponentialreihe: f (z) = j≥0 zj! =: ez ∈ C. Diese Reihe besitzt den Konvergenzradius R = ∞, also konvergiert die Reihe eA := X Aj j≥0 j! für alle A ∈ L(X), falls X ein Banach-Raum ist. 2. Geometrische Reihe: In C konvergiert die Reihe f (z) = ∞ X zj j=0 für alle z mit |z| < 1 und es ist dann f (z) = (1 − z)−1 . Das Selbe gilt für A ∈ L(X), falls X vollständig ist: Theorem 2.2 (Neumann’sche Reihe). Sei X ein Banach-Raum, A ∈ L(X) mit P∞ kAk < 1. Dann konvergiert die Reihe j=0 Aj in L(X) und es gilt ∞ X Aj = (1 − A)−1 j=0 ∈ L(X). Beweis. Die oben definierte Folge konvergiert in L(X), denn wegen Satz 2.8 ist für kAk < 1 ∞ X kAkj = (1 − kAk)−1 < ∞. j=0 Definieren wir wieder die N -te Partialsumme durch SN = N X j=0 Aj ∈ L(X), so ist (1 − A)SN = SN (1 − A) = 1 − AN +1 . Mit der Stetigkeit des Produkts in L(X) folgern wir dann lim (1 − A)SN = (1 − A) lim SN = ( lim SN )(1 − A) = 1 − lim AN +1 = 1. N →∞ N →∞ N →∞ N →∞ 27 2 NORMIERTE RÄUME Wir verallgemeinern das Resultat von Theorem 2.2 wie folgt: Sei X ein BanachRaum und A eine lineare, stetige Abbildung wie in Theorem 2.2, also A ∈ L(X), für welche gilt kAj k ≤ cϑj für ein ϑ ∈ (0, 1), für alle j ≥ 1 und für eine Konstante c > 0. Dann konvergiert die Reihe ∞ X j=0 Aj = (1 − A)−1 in L(X). Dies folgt aus dem Wurzelkriterium und Satz 2.8, denn es ist 1 lim sup kAj k j ≤ ϑ < 1. j→∞ Satz 2.9 (Spektralradius rA ). Sei A ∈ L(X). Dann existiert der Grenzwert 1 1 rA := lim kAn k n = inf kAn k n ≤ kAk. n→∞ n≥1 rA heisst der Spektralradius von A. 1 Beweis. Wir setzen α = inf n≥1 kAn k n ∈ R und geben uns ein ε > 0 vor. Nach 1 Definition des Infimums gibt es nun ein m ≥ 1, so dass α ≤ kAm k m < α + ε. Damit können wir M := max{1, kAk, kA2k, . . . , kAm−1 k} definieren und für jedes n > 0 können wir schreiben: n = kn m + ln , wobei 0 ≤ ln ≤ m − 1 sein soll. Es folgt dann 1 1 1 1 kAn k n = kAkn m Aln k n ≤ kAln k n (kAm kkn ) n 1 ≤ M n kAm k kn n 1 ≤ M n (α + ε) kn n m 1 ln = M n (α + ε)1− n . Der Limes auf der rechten Seite für n → ∞ ist gerade (α + ε). Daher existiert ein N , so dass 1 α ≤ kAn k n < α + 2ε für alle n ≥ N . Dies gilt wiederum für alle ε > 0, also folgt die Behauptung des Satzes. Ist A ∈ L(X), so hängt die Operatornorm kAk von der Wahl der jeweiligen Norm im Vektorraum X ab. Der Spektralradius rA ∈ R jedoch ist unabhängig von der Wahl einer Norm in einer Äquivalenzklasse von Normen auf X. Satz 2.10. Sei X ein Banach-Raum und A ∈ L(X) mit rA < 1. Dann konvergiert die Neumann-Reihe in L(X) und es ist ∞ X j=0 Aj = (1 − A)−1 ∈ L(X). Beweis. Der Satz folgt sofort aus Satz 2.8 (Wurzelkriterium): 1 rA := lim kAj k j < 1. j→∞ An dieser Stelle soll auch noch eine Anwendung dieses Satzes gegeben werden: Wir betrachten wieder einen Banach-Raum X und eine Abbildung A ∈ L(X) mit einem Spektralradius rA < 1. Dann hat die lineare Gleichung x − Ax = y ∈X für jedes vorgegebene y ∈ X eine eindeutige Lösung x = (1 − A)−1 (y) = ∞ X Aj (y). j=0 Die Lösung x hängt stetig von y ab, da kxk ≤ k(1 − A)−1 k kyk. 28 2 NORMIERTE RÄUME 2.3 Quotientenräume und Produkträume Aus der Linearen Algebra können wir Folgendes übernehmen: Ist X ein Vektorraum und Y ⊂ X ein linearer Teilraum von X, so ist der Quotientenraum X/Y der Vektorraum, dessen Elemente aus den Restklassen x̂ := x + Y = {x + y|y ∈ Y }, x∈X bezüglich der Äquivalenzrelation x ∼ ξ ⇐⇒ x − ξ ∈ Y bestehen. Die VektorraumStruktur ist gegeben durch x̂ + ŷ := x[ + y, c λx̂ := λx, 0 := 0̂ x ∈ x̂, y ∈ ŷ x ∈ x̂, λ ∈ C Ist (X, k k) ein normierter Raum, so können wir auf X/Y die Funktion kx̂k = inf kxk = inf kx − yk = d(x, Y ) y∈Y x∈x̂ definieren. Wenn Y abgeschlossen ist, so ist kx̂k eine Norm auf X/Y . Um das zu beweisen, überprüfen wir die drei Kriterien für eine Norm: i) Es ist kx̂k = 0 ⇐⇒ d(x, Y ) = 0 ⇐⇒ x ∈ Ȳ = Y ⇐⇒ x̂ = 0̂; ii) Folgt aus der Definition und der Linearität des Vektorraumes; iii) Seien x̂1 , x̂2 ∈ X/Y und ε > 0 vorgegeben. Dann gibt es nach der Definition des Infimums zwei Elemente y1 , y2 ∈ Y , so dass kxj −yj k ≤ kx̂j k+ε (j = 1, 2). Es folgt dann kx̂1 + x̂2 k = kx\ 1 + x2 k ≤ k(x1 + x2 ) − (y1 + y2 ) k | {z } ∈Y ≤ kx1 − y1 k + kx2 − y2 k ≤ kx̂1 k + ε + kx̂2 k + ε. Dies gilt für jedes ε > 0 und daher ist kx̂1 + x̂2 k ≤ kx̂1 k + kx̂2 k. Satz 2.11. Sei X ein normierter Raum, Y ⊂ X ein abgeschlossener linearer Teilraum. Dann ist der Vektorraum X/Y mit kx̂k := d(x, Y ), x ∈ x̂ ∈ X/Y ein normierter Raum, und es gilt i) Die lineare Abbildung p : X −→ X/Y ; x 7−→ x̂ ist stetig, surjektiv und bildet offene Mengen auf offene Mengen ab. p heisst auch Projektion. ii) Ist X ein Banach-Raum, so ist auch X/Y ein Banach-Raum. Beweis. Übungsaufgabe. Analog wie in einem endlich-dimensionalen Raum können wir ganz allgemein Produkträume definieren: 29 2 NORMIERTE RÄUME Gegeben seien die endliche Familie (Xj , k kj ), (j = 1, . . . , n), von Vektorräumen. Dann definieren wir die Menge X := X1 × X2 × · · · × Xn der Elemente x = (x1 , x2 , . . . , xn ) mit xj ∈ Xj , wobei die Vektorraum-Struktur komponentenweise gegeben ist. Auf diesem Produktraum gibt es viele Vektornormen, zum Beispiel n X kxk1 := kxj kj j=1 oder dazu äquivalente Normen kxk∞ := max kxj kj oder 1≤j≤n kxkp := n X j=1 p1 kxj kpj . Der Produktraum X ist genau dann ein Banach-Raum, wenn jeder Faktor Xj ein Banach-Raum ist. 30 3 PRINZIPIEN DER FUNKTIONALANALYSIS 3 Prinzipien der Funktionalanalysis 3.1 Prinzip der gleichmässigen Beschränktheit Zum Anfang ziehen wir weitere Folgerungen aus dem Theorem 1.5 von Baire: Theorem 3.1. Sei X ein Banach-Raum und Aj ∈ L(X, Y ) eine Folge von linearen und stetigen Abbildungen. Wir nehmen zusätzlich an, dass für jedes x ∈ X gilt: sup kAj (x)k < ∞. j≥1 Dann ist supj≥1 kAj k < ∞. Beweis. Wir definieren die stetigen Funktionen fj (x) := kAj (x)k : X → R. Weil X vollständig ist, folgt aus Theorem 1.5, dass ein x∗ ∈ X, eine Kugel K, K := {x ∈ X| kx − x∗ k ≤ r}, r > 0, und ein γ > 0 existieren, so dass kAj (x)k ≤ γ, x ∈ K, j ≥ 1. Sei nun ein y ∈ X vorgegeben mit kyk ≤ 1. Dann liegt x := x∗ + ry in der Kugel K und es folgt somit x − x∗ ≤ 1 kAj (x)k + 1 kAj (x∗ )k ≤ 2 γ kAj (y)k = Aj r r r r für alle y ∈ X mit kyk ≤ 1 und alle j ≥ 1. Das heisst, es ist kAj k ≤ 2 γ r für alle j ≥ 1. Daraus folgt Satz 3.1. Sei wieder X ein Banach-Raum und Aj ∈ L(X, Y ), j ≥ 1 und es existiere in Y der punktweise Grenzwert lim Aj (x) =: A(x) j→∞ für alle x ∈ X. Dann ist A ∈ L(X, Y ), zudem gilt sup kAj k < ∞ und kAk ≤ lim inf kAj k. j→∞ j≥1 In Worten: der punktweise Grenzwert von linearen und stetigen Funktionen ist wieder linear und stetig, falls X vollständig ist. Beweis. Nach Voraussetzung konvergiert die Folge Aj (x), also ist sup kAj (x)k < ∞ j≥1 für alle x ∈ X und daher gilt, nach Theorem 3.1, dass auch supj≥1 kAj k < ∞ ist. Weil die Normen stetig sind, ist kA(x)k = lim kAj (x)k = lim inf kAj (x)k ≤ (lim inf kAj k)kxk j→∞ j→∞ für alle x ∈ X, das heisst, es gilt kAk ≤ lim inf kAj k j→∞ nach der Definition der Norm kAk. j→∞ 3 PRINZIPIEN DER FUNKTIONALANALYSIS 31 Vorsicht: Der obige Satz ist falsch, falls X nicht vollständig ist! Dazu betrachten wir den Raum X := {x ∈ `∞ |x = (xi )i≥1 , xi 6= 0 für nur endlich viele i} mit der Norm kxk := supj≥1 kxj k < ∞. Der so definierte Raum X ist nicht vollständig. Wir definieren die linearen Funktionen A, An auf X durch An (x) = (x1 , 2x2 , . . . , nxn , 0, . . .), A(x) = (x1 , 2x2 , . . . , nxn , (n + 1)xn+1 , . . .) = (jxj )j≥1 . Für jedes n ist An stetig und kAn k = n. Überdies, A(x) = limn→∞ An (x) für alle x ∈ X. A ist offensichtlich aber nicht beschränkt und somit sicherlich auch nicht stetig. Wir können die Aussage von Satz 3.1 noch verschärfen, wenn wir voraussetzen, dass auch Y vollständig ist: Theorem 3.2 (Banach-Steinhaus). Es seien X, Y zwei Banach-Räume und die Aj ∈ L(X, Y ) eine Folge von stetigen und linearen Abbildungen. Dann sind folgende Aussagen äquivalent: i) limj→∞ Aj (x) = A(x) existiert in Y für jedes x in X (aus Satz 3.1 folgt, dass A ∈ L(X, Y )); ii) (a) Es ist supj≥1 kAj k < ∞ und (b) es gibt eine dichte Menge D ⊂ X, so dass lim Aj (x) =: A(x) j→∞ existiert für alle x ∈ D. Beweis. i) ⇒ ii) Dies ist gerade die Aussage von Satz 3.1. Also beweisen wir noch ii) ⇒ i): Wir wählen ein x ∈ X. Weil Y ein Banach-Raum ist, genügt es zu zeigen, dass Aj (x) eine Cauchy-Folge in Y ist. Mit der Dreiecksungleichung können wir schreiben: kAn (x) − Am (x)k ≤ kAn (x) − An (y)k + kAn (y) − Am (y)k + kAm (y) − Am (x)k ≤ kAn (y) − Am (y)k + 2 sup kAj k kx − yk. j≥1 Sei ein ε > 0 beliebig vorgegeben. Nach (a) ist supj≥1 kAj k < ∞ und wir können nach (b) ein y ∈ D wählen, so dass der zweite Term in der obigen Gleichung kleiner als 2ε ist. Nach (b) folgt zudem, dass der erste Term kleiner als 2ε ist für alle n, m ≥ N (ε), und somit ist An (x) eine Cauchy-Folge für jedes x ∈ X. 3.2 Prinzip der offenen Abbildung Für lineare und stetige Abbildung zwischen Banach-Räumen gilt das folgende Theorem. Theorem 3.3 (Prinzip der offenen Abbildung). Seien X und Y Banach-Räume, A ∈ L(X, Y ) eine surjektive, stetige und lineare Abbildung. Dann existiert ein c > 0, so dass für die offenen Kugeln B1 (0) ⊂ X und Bc (0) ⊂ Y gilt A(B1 (0)) ⊃ Bc (0). 32 3 PRINZIPIEN DER FUNKTIONALANALYSIS Beweis. Wir schreiben zur Abkürzung B := B 21 (0) ⊂ X und benutzen zuerst, dass der Raum Y vollständigSist: X lässt sich darstellen als abzählbare Vereinigung von Bällen B, nämlich X = j≥1 jB. Da die Abbildung A surjektiv ist, folgt Y = A(X) = [ jA(B) = j≥1 [ A(jB) = j≥1 [ A(jB). j≥1 Weil Y ein Banach-Raum ist, existiert nach Theorem 1.2 ein j0 , so dass A(j0 B) eine offene Kugel enthält. Wegen der Linearität von A gibt es ein y ∗ ∈ Y und ein r > 0, so dass Br (y ∗ ) ⊂ A(B) ⊂ Y ist. Dann folgt auch, dass Br (0) = Br (y ∗ ) − y ∗ ⊂ A(B) − y ∗ ⊂ A(B) − A(B) ⊂ A(2B) ⊂ Y und schliesslich Br (0) ⊂ A(B1 (0)) ⊂ Y. | {z } ⊂X Wir zeigen nun, dass in Y gilt B r2 (0) ⊂ A(B1 (0)). Das heisst, zu gegebenem y ∈ Y mit kyk < 2r existiert ein x ∈ X mit kxk < 1, so dass y = A(x). Dazu setzen wir Bj := B2−j (0) ⊂ X für j ≥ 1. Wir wissen schon, dass Br2−j (0) ⊂ A(Bj ) ⊂ Y, j≥1 ist. Sei nun ein y ∈ Y mit kyk < r2 gegeben. Wir konstruieren jetzt eine Folge (xj ), deren Partialsummen gegen ein x konvergieren, welches die Behauptung erfüllt. • j = 1 : Nach Definition des Abschlusses gibt es ein x1 ∈ B1 , so dass ky − A(x1 )k < r2−2 . • j = 2 : Wir betrachten die Menge y − A(x1 ) ⊂ Br2−2 (0) ⊂ A(B2 ). Wiederum gibt es nach Definition des Abschlusses ein x2 ∈ B2 , so dass k(y − A(x1 )) − A(x2 )k < r2−3 . Iterativ finden wir für jedes j ≥ 1 ein xj mit den Eigenschaften i) xj ∈ Bj und kxj k < 2−j sowie ii) ky − A(x1 + x2 + . . . + xj )k < r2−(j+1) . P Aus i) folgt, dass die Summe j kxj k konvergiert mit X j kxj k < X 2−j = 1 j und weil X als vollständig vorausgesetzt war, existiert der Limes x := lim N →∞ N X xj j=1 in X wegen dem Cauchy-Kriterium. Aus ii) und der Stetigkeit von A schliessen wir, dass A(x) = y. Folgerung: A bildet offene Mengen auf offene Mengen ab. 3 PRINZIPIEN DER FUNKTIONALANALYSIS 33 Beweis. Sei U ⊂ X offen. Wir müssen zeigen, dass A(U ) ⊂ Y ebenfalls offen ist. Sei y0 ∈ A(U ), das heisst, y0 = A(x0 ) für ein x0 ∈ U . Wir wählen nun r > 0 so, dass Br (x0 ) ⊂ U (⊂ X). Daraus schliessen wir, dass auch x0 + Br (0) ⊂ U gilt. Da A linear ist, folgt A(x0 ) + A(Br (0)) ⊂ A(U ). Nach Theorem 3.3 ist Brc (0) ⊂ A(Br (0)) ⊂ Y , und somit können wir aus obiger Gleichung folgern, dass A(x0 ) + Brc (0) = Brc (y0 ) ⊂ A(U ) gilt für rc > 0. Mit anderen Worten: A(U ) ist offen. Dies führt uns zum Theorem 3.4 (Prinzip der stetigen Inversen). Seien X, Y zwei Banach-Räume und A ∈ L(X, Y ) injektiv und surjektiv (also bijektiv). Dann liegt die zu A inverse Abbildung A−1 in L(Y, X). Beweis. Wir benutzen obiges Theorem 3.3: Demnach gibt es in Y eine offene Kugel Bc (0), so dass gilt Bc (0) ⊂ A(B1 (0)) für c > 0. Dann folgt in X mittels der Inversen A−1 A−1 (Bc (0)) ⊂ B1 (0) ⊂ X. Sei nun y ∈ Y mit kyk ≤ 1 gegeben. Dann folgt wegen der Linearität von A−1 für die Norm −1 c c −1 y = kA (y)k ≤ 1. A 2 2 Das heisst, es ist kA−1 (y)k ≤ 2c für jedes y mit kyk ≤ 1, und somit ist A−1 beschränkt auf der Einheitskugel, also ist A−1 nach Satz 2.5 stetig. Neben diesen allgemeinen Eigenschaften können wir für sogenannte abgeschlossene Operatoren noch weitere Folgerungen ziehen. Dazu führen wir noch einige neue Begriffe ein: Für eine lineare Abbildung A : DA ⊂ X → Y , die auf dem linearen Teilraum DA – dem Definitionsbereich von A – von X operiert, definieren wir den linearen Teilraum WA := A(DA ) = {y ∈ Y |y = A(x) für ein x ∈ DA }, der Wertebereich oder Bildbereich von A. Einem linearen Operator kann man einen Graphen im Raume X × Y zuordnen. Sind X und Y normiert, so ist X × Y auch ein normierter Raum mit der Norm k{x, y}k := kxkX + kykY , {x, y} ∈ X × Y. Definition 3.1. (Graph) Sei A : DA ⊂ X → Y linear. Dann heisst die Menge ΓA in X × Y , definiert durch ΓA := { {x, y} ⊂ X × Y |y = A(x), x ∈ DA } der Graph von A in X × Y . Dies ist ein linearer Teilraum. Definition 3.2. (abgeschlossener Operator) Ein linearer Operator A : DA ⊂ X → Y heisst abgeschlossen, falls ΓA in X × Y abgeschlossen ist. Satz 3.2. Sei A : DA ⊂ X → Y linear und stetig. Dann gelten: i) Aus DA = D̄A folgt, dass A abgeschlossen ist. ii) Ist A abgeschlossen und Y vollständig, so ist DA = D̄A . 34 3 PRINZIPIEN DER FUNKTIONALANALYSIS Beweis. i) Es sei DA = D̄A und {x, y} ∈ Γ̄A , das heisst, es existiert eine Folge {xn , A(xn )} ∈ ΓA mit {xn , A(xn )} → {x, y} in X × Y . Nach der Definition der Norm in X × Y heisst das, dass xn → x in X und A(xn ) → y in Y . Weil nun DA abgeschlossen ist, folgt x ∈ DA , und weil A stetig ist, A(xn ) → A(x) in Y . Das wiederum bedeutet, dass A(x) = y, also ist {x, y} ∈ ΓA . Folglich ist ΓA abgeschlossen. ii) Sei A abgeschlossen und stetig und x ∈ D̄A . Dann lässt sich x schreiben als Limes einer Folge xn in DA , also x = limn→∞ xn . Weil kA(xn ) − A(xm )k ≤ kAk kxn − xm k, ist A(xn ) eine Cauchy-Folge in Y und, nach Vorgabe (Y ist vollständig), konvergent. Nach der Definition der Norm in X×Y konvergiert die Folge {xn , A(xn )} dann gegen {x, y} ∈ X × Y . Daher ist {x, y} ∈ Γ̄A = ΓA , das heisst, y = A(x) für ein x ∈ DA . Insbesondere folgt dann, dass DA abgeschlossen ist. Folgerung: Ist A ∈ L(X, Y ) auf ganz X definiert, so ist A abgeschlossen! Also: ein stetiger Operator auf einem abgeschlossenen Definitionsbereich ist abgeschlossen. Aber es gibt auch abgeschlossene Operatoren, die nicht stetig sind: d auf dem Raum X = C[0, 1]. Es ist Wir betrachten den Differentialoperator dt hier X = Y und wir wählen DA = C 1 [0, 1] ⊂ X. Für ein x ∈ DA schreiben wir A(x)(t) = d x(t). dt Es gilt: (a) A : DA ⊂ X → Y ist nicht stetig und (b) A ist abgeschlossen. (a) Wir betrachten die Folge xn (t) = tn , die für 0 ≤ t ≤ 1 definiert ist und auch in C 1 [0, 1] liegt. Für jedes natürliche n gilt kxn k = sup |xn (t)| = sup |tn | = 1. t∈[0,1] und t∈[0,1] d n kA(xn )k = sup |A(xn )(t)| = sup t = sup |ntn−1 | = n. dt t∈[0,1] t∈[0,1] t∈[0,1] Also ist A auf der Einheitskugel in DA ∩ C([0, 1]) nicht beschränkt und somit auch nicht stetig. (b) Wir wählen ein {x, y} ∈ Γ̄A und es existiert eine Folge {xn , A(xn )} in ΓA , die in X × Y gegen {x, y} konvergiert. Nach der Definition der Norm im Produktraum X × Y heisst das, dass xn in X gegen x und A(xn ) gegen y in Y konvergiert. Konvergenz in der Supremumsnorm k k∞ ist jedoch die gleichmässige Konvergenz auf dem Intervall [0, 1], also folgt aus Z t d xn (t) − xn (0) = xn (s)ds dt 0 für n → ∞ die Gleichung x(t) − x(0) = Z t y(s)ds. 0 Damit erhalten wir die Identität d x(t) = y(t) dt für 0 ≤ t ≤ 1. Daher ist x ∈ C 1 [0, 1] = DA und es ist y = A(x). Demnach liegt {x, y} in ΓA , und daher ist Γ̄A = ΓA . 2 35 3 PRINZIPIEN DER FUNKTIONALANALYSIS Theorem 3.5 (Satz vom abgeschlossenen Graphen). Es seien X und Y zwei Banach-Räume und A : X → Y eine lineare Abbildung. Dann ist A genau dann stetig, wenn A abgeschlossen ist. Beweis. Dass aus der Stetigkeit die Abgeschlossenheit folgt, ist die Aussage von Satz 3.2. Umgekehrt sei ΓA ⊂ X × Y abgeschlossen. Weil unter unseren Voraussetzungen der Produktraum vollständig ist (Kapitel 2), ist auch (ΓA , k k) ein Banach-Raum. Wir definieren die Abbildung P : ΓA → X : {x, A(x)} 7→ x in X. Dann ist P ∈ L(ΓA , X) surjektiv und injektiv. Nach Theorem 3.4 liegt die Inverse P −1 in L(X, ΓA ). Daher folgt aus der Konvergenz xn → x in X P −1 (xn ) = {xn , A(xn )} → P −1 (x) = {x, A(x)} in X × Y. Nach der Definition der Norm in X × Y folgt dann: xn → x und A(xn ) → A(x), also ist A stetig in x. Bemerkungen: 1. In Theorem 3.5 war DA = X. Der Satz gilt allgemeiner für A : DA ⊂ X → Y , falls der Definitionsbereich DA abgeschlossen ist, weil dann der Raum (DA , k k) ein Banach-Raum ist. 2. Sind X, Y zwei Banach-Räume und A : DA ⊂ X → Y linear und abgeschlossen aber nicht stetig, so ist DA nicht abgeschlossen. Insbesondere ist DA 6= X. 3. Was gewinnen wir durch Theorem 3.5? Antwort: Wir müssen weniger Eigenschaften des Operators überprüfen. Um dies zu erläutern, untersuchen wir den Unterschied zwischen abgeschlossen und stetig: • Stetigkeit: Hier müssen wir zeigen, dass aus der Aussage xn → x die zwei Aussagen A(xn ) → y (n → ∞) A(x) = y folgen. • Abgeschlossenheit: Wir müssen zeigen, dass aus den zwei Aussagen xn → x (n → ∞) A(xn ) → y (n → ∞) die eine Aussage A(x) = y folgt, das heisst, aus (x, y) ∈ Γ̄A müssen wir (x, y) ∈ ΓA folgern. Satz 3.3 (Hellinger-Toeplitz). Sei H ein Hilbert-Raum mit Skalarprodukt ( , ) und A : H → H eine lineare und symmetrische Abbildung, das heisst, es gilt (A(x), y) = (x, A(y)) für alle x, y in H. Dann liegt A in L(H) (es soll hier DA = H sein). Beweis. Wir müssen zeigen, dass ΓA in H ×H abgeschlossen ist. Sei also ein Element {x, y} ∈ Γ̄A vorgegeben. Dann existiert eine Folge xn in H, so dass {xn , A(xn )} in H × H gegen {x, y} konvergiert. Da A symmetrisch ist, folgt für jedes z in H (A(xn ), z) = (xn , A(z)) ↓ ↓ (n→∞) (y, z) = (x, A(z)) = (A(x), z) 36 3 PRINZIPIEN DER FUNKTIONALANALYSIS Mit der Linearität des Skalarproduktes folgt dann, dass (y − A(x), z) = 0 für alle z in H. Insbesondere ist dann (y − A(x), y − A(x)) = ky − A(x)k2 = 0. Die bedeutet aber, dass y = A(x) sein muss und daher liegt {x, y} in ΓA . Damit haben wir bewiesen, dass ΓA abgeschlossen ist und deshalb ist A nach Theorem 3.5 stetig. Satz 3.4. Es sei A : DA ⊂ X → Y eine injektive Abbildung. Dann ist A genau dann abgeschlossen, wenn die zu A inverse Abbildung A−1 : DA−1 ⊂ Y → X, definiert auf dem Wertebereich WA = DA−1 von A, abgeschlossen ist. Beweis. Nach Definition des Graphs gilt ΓA = { {x, A(x)}|x ∈ DA } −1 ΓA−1 = { {y, A (y)}|y ∈ WA } = { {A(x), x}|x ∈ DA }. ⊂ X × Y, ⊂Y ×X Wir definieren eine Bijektion I : X × Y → Y × X durch {x, y} 7→ {y, x}. I ist eine surjektive Isometrie, denn es gilt kI({x, y})k = k{y, x}k = kyk + kxk = k{x, y}k. Wir schliessen daraus, dass I(ΓA ) = ΓA−1 sein muss. Da eine Isometrie abgeschlossene Mengen auf abgeschlossene Mengen abbildet, folgt sofort die Behauptung des Satzes. Mit diesem Satz können wir die Voraussetzung stetig“ in Theorem 3.4 durch ab” ” geschlossen“ ersetzen: Theorem 3.6 (Satz von der stetigen Inversen). Es seien X, Y zwei Banach-Räume und A : DA ⊂ X → Y eine abgeschlossene, injektive und surjektive Abbildung. Dann gilt A−1 ∈ L(Y, X). Beweis. Da A abgeschlossen ist, ist nach Satz 3.4 auch A−1 abgeschlossen. Nach Voraussetzung ist DA−1 = WA = Y , daher ist A−1 : Y → X linear und abgeschlossen. Somit ist nach Theorem 3.5 A−1 stetig. Als Anwendung der obigen Theorie zeigen wir noch einen Zusammenhang zwischen der Algebra und der Topologie: Satz 3.5. Sei X ein Banach-Raum. Wir nehmen an, es existierten zwei lineare Teilräume X1 , X2 von X, für welche gelte X1 + X 2 = X und X1 ∩ X2 = {0}, (3.1) mit anderen Worten, X1 ⊕X2 = X ist die algebraische direkte Summe. Falls X1 , X2 abgeschlossen sind, dann definiert A : X1 × X2 → X, {x1 , x2 } 7→ x1 + x2 = A({x1 , x2 }) einen stetigen Isomorphismus mit stetiger Inversen A−1 . Also: In Banach-Räumen ist die algebraische direkte Summe von abgeschlossenen linearen Räumen eine topologische direkte Summe! Beweis. Nach Voraussetzung sind X, Y = X1 × X2 Banach-Räume, und es gilt kA({x1 , x2 })k = kx1 + x2 k ≤ kx1 k + kx2 k = k{x1 , x2 }k. Daher ist A : X1 × X2 → X linear und stetig. Wegen (3.1) ist A surjektiv und injektiv. Mit Theorem 3.4 folgt somit, dass A−1 stetig ist. 37 3 PRINZIPIEN DER FUNKTIONALANALYSIS 3.3 Abschliessbare Operatoren Es seien X, Y zwei normierte Räume. Ein linearer Teilraum Γ ⊂ X × Y heisst ein linearer Graph, falls gilt: Y Γ {x, y} ∈ Γ 6 0 ⇒ y = y {x, y 0 } ∈ Γ oder äquivalent dazu y {0, y} ∈ Γ ⇒ y = 0, r {x,y} x -X denn Γ ist ja linear. Ein Graph Γ ⊂ X × Y definiert immer einen linearen Operator A : DA ⊂ X → Y durch DA := {x ∈ X|∃ y ∈ Y mit {x, y} ∈ Γ} A(x) = y für x ∈ DA (⇔ {x, y} ∈ Γ) Es gilt dann Γ = ΓA . Definition 3.3. (abschliessbarer Operator) Ein linearer Operator A : DA ⊂ X → Y heisst abschliessbar, falls der Abschluss des Graphen von A, Γ̄A ⊂ X × Y , wieder ein Graph in X × Y ist ( Γ̄A ist ein linearer Teilraum in X × Y ). Mit anderen Worten: falls {0, y} ∈ Γ̄A , dann ist y = 0, oder explizit, falls {xn , A(xn )} gegen {0, y} konvergiert für xn ∈ DA , dann ist y = 0. Zum Beispiel ist jeder stetige Operator A : DA ⊂ X → Y abschliessbar: Es sei xn ∈ DA eine Folge, so dass {xn , A(xn )} in X × Y gegen {0, y} konvergiert. Dann folgt nach der Definition der Norm im Produktraum, dass xn in X gegen 0 und A(xn ) in Y gegen y konvergiert. Weil gilt: kA(xn )k ≤ kAk kxn k → 0 (n → ∞), folgt A(xn ) → 0, also ist y = 0. Definition 3.4. (Abschluss eines Operators) Sei A : DA ⊂ X → Y ein abschliessbarer Operator. Dann ist der Abschluss Ā von A der durch den Graphen Γ̄A definierte Operator, so dass Γ̄A = ΓĀ . Explizit ausgedrückt: es ist Ā : DĀ ⊂ X → Y mit DĀ = {x ∈ X| ∃y ∈ Y, so dass {x, y} ∈ Γ̄A } = {x ∈ X| ∃xn ∈ DA mit {xn , A(xn )} → {x, y} in X × Y }, und Ā(x) = y, x ∈ DĀ . Der so definierte Operator Ā ist abgeschlossen und die kleinste abgeschlossene Erweiterung von A. Es gilt Ā ⊃ A ⇐⇒ DĀ ⊃ DA und Ā(x) = A(x) für x ∈ DA . Beispiele: 1. Sei A : DA ⊂ X → Y ein stetiger Operator auf den zwei Banach-Räumen X, Y . Dann ist A abschliessbar (siehe obiges Beispiel) und Ā : DĀ ⊂ X → Y ist die stetige Erweiterung von A in DA auf DĀ = D̄A . 2. Differentialoperatoren sind abschliessbar (siehe nachfolgenden Satz 3.6). 38 3 PRINZIPIEN DER FUNKTIONALANALYSIS Definition 3.5. (Differentialoperator) Es sei Ω ⊂ Rn offen und zusammenhängend. Wir definieren für α ∈ Nn formal den Differentialoperator A durch X aα (x)Dα , A := |α|≤N wobei wir folgende Notation verwenden: Dα = D1α1 · · · Dnαn , ∂ , Dj = ∂xj aα ∈ C N (Ω), α = (α1 , . . . , αn ), |α| = α1 + · · · + αn . Sei DA = Cc∞ (Ω) die Menge der glatten Funktionen von Ω nach R mit kompaktem Träger in Ω. Dann ist der Operator A : DA ⊂ Lp (Ω) → Lp (Ω) für p ≥ 1 definiert durch X aα (x)Dα f (x), f ∈ DA , x ∈ Ω. (Af )(x) := |α|≤N Es ist klar, dass Cc∞ (Ω) ⊂ Lp (Ω) und für eine Funktion f ∈ Cc∞ (Ω) ist Af stetig mit kompaktem Träger, also liegt Af wieder in Lp (Ω) Satz 3.6. Der Differentialoperator ist abschliessbar. Beweis. Wir müssen zeigen, dass für eine Folge fn ∈ Cc∞ (Ω), die in Lp (Ω) gegen 0 konvergiert, mit A(fn ) → g in Lp (Ω), folgt, dass g = 0 in Lp (Ω). Es sei ein ϕ ∈ Cc∞ (Ω) beliebig vorgegeben, dann folgt mit dem Satz von Fubini und partieller Integration (die Randterme verschwinden jeweils wegen dem kompakten Träger) Z Z X fn (−1)|α| Dα (aα ϕ) dx A(fn )ϕ dx = Ω Ω Z ↓ gϕ dx = Ω Z |α|≤N ↓ | {z g ∗ ∈Lp (Ω) n→∞ } 0 g ∗ dx, Ω denn ϕ liegt in Lq (Ω) mit p1 + 1q = 1 und nach Hölder ist Z Z Z A(fn )ϕ dx − A(fn ) − g ϕ dx gϕ dx = Ω Ω ZΩ ≤ | A(fn ) − g | |ϕ| dx {z } Ω | ∈Lp (Ω) R ≤ kA(fn ) − gkLp (Ω) kϕkLq (Ω) . | {z } →0 Cc∞ (Ω). Dann ist, wie wir später sehen Das heisst, es ist Ω gϕ dx = 0 für alle ϕ ∈ werden, g(x) = 0 für fast alle x ∈ Ω, das heisst, es ist g = 0 in Lp (Ω). Was ist nun der Abschluss des Differentialoperators A? Nach Definition ist (wegen der Vollständigkeit von Lp (Ω)) der Definitionsbereich DĀ die Menge aller Funktionen f ∈ Lp (Ω), so dass eine Folge ϕn ∈ Cc∞ (Ω) existiert, die in Lp (Ω) gegen f konvergiert, und A(ϕn ) eine Cauchy-Folge in Lp (Ω) ist. 3 PRINZIPIEN DER FUNKTIONALANALYSIS 39 Sei f ∈ DĀ , dann ist Ā(f ) = lim A(ϕn ) in Lp (Ω). n→∞ DĀ enthält Elemente aus Lp (Ω), die nicht mehr differenzierbar zu sein brauchen. Das führt uns später zu den sogenannten Sobolev-Räumen. Zudem ist auch nicht jeder Operator abschliessbar. Wir betrachten zum Beispiel die Räume X = L2 (R) und Y = R und setzen DA := {x ∈ L2 |x ≡ 0 ausserhalb eines kompakten Intervalls} ⊂ L2 (R) ∩ L1 (R). Wir definieren für x ∈ DA den Operator A durch Z ∞ A(x) = x(t) dt. −∞ Die Folge xn mit xn (t) = ( 1/n |t| ≤ n 0 |t| > n liegt in DA und es ist A(xn ) = 2 für alle n. Es gilt Z ∞ 2 2 kxn kL2 (R) = x2n (t) dt = → 0. n −∞ Also konvergiert xn in L2 (R) gegen 0 und A(xn ) in R gegen 2. Also ist {0, 2} ∈ Γ̄A . Dann aber kann Γ̄A kein Graph in L2 (R) × R sein. 4 DER FORTSETZUNGSSATZ VON HAHN-BANACH 4 40 Der Fortsetzungssatz von Hahn-Banach In diesem Abschnitt wollen wir den Fortsetzungssatz für lineare Abbildungen von Hahn und Banach beweisen. Der Satz gibt uns die Möglichkeit, eine lineare Funktion f : M ⊂ X → R (C), welche auf dem linearen Teilraum M eines Vektorraumes X definiert ist, unter Einhaltung einer gewissen Abschätzung, auf ganz X fortzusetzen. 4.1 Der Satz von Hahn-Banach Wir unterscheiden zwischen reellem und komplexem Fall und beweisen den Satz für die beiden Fälle getrennt. Für den Beweis des Fortsetzungssatzes benötigen wir das Lemma von Zorn, welches wir allerdings nicht beweisen werden: Definition 4.1. (binäre Relation, Halbordnung) Es sei P eine Menge. Eine binäre Relation in P ist eine Teilmenge R von P × P . Anstelle von (a, b) ∈ R schreibt man auch aRb. Ist die binäre Relation R zusätzlich reflexiv, antisymmetrisch und transitiv, das heisst, für alle a, b, c ∈ P besitzt R die Eigenschaften aRa :⇐⇒ R ist reflexiv, aRb ∧ bRa ⇒ a = b :⇐⇒ R ist antisymmetrisch, aRb ∧ bRc ⇒ aRc :⇐⇒ R ist transitiv, so bezeichnet man R auch als Halbordnung in P und schreibt a < b statt aRb. Definition 4.2. (linear bzw. total geordnete Menge) Eine Teilmenge P0 ⊂ P heisst linear (oder total ) geordnet, falls für je zwei Elemente h, g ∈ P0 gilt, dass h < g oder h > g. Lemma 4.1 (Zorn’sches Lemma). Es sei (P, <) eine nicht-leere, halbgeordnete Menge, so dass jede linear geordnete Teilmenge eine obere Schranke besitzt. Dann existiert ein maximales Element h∗ in P , das heisst, es gilt: Ist h∗ < h für ein h ∈ P , so ist h∗ = h. Bemerkung: Das Zorn’sche Lemma ist äquivalent zum Auswahlaxiom. Nun kommen wir zum Theorem 4.1 (Hahn-Banach, reell). Gegeben seien ein reeller Vektorraum X, eine reellwertige Funktion p : X → R, so dass für alle x, y in X gilt p(x + y) ≤ p(x) + p(y) p(tx) = t p(x) und für t ≥ 0, sowie ein linearer Teilraum M ⊂ X und eine lineare Funktion f : M → R, mit der Eigenschaft f (x) ≤ p(x) ∀ x ∈ M. Dann existiert eine lineare Funktion F : X → R mit F (x) = f (x) F (x) ≤ p(x) ∀ x ∈ M und ∀ x ∈ X. Beweis. Wir dürfen annehmen, dass M 6= X ist (sonst gäbe es nichts zu beweisen). Daher gibt es ein x1 , welches nicht in M liegt. Somit können wir die Menge M1 := {x + tx1 |x ∈ M, t ∈ R} definieren, welche M enthält (setze t = 0). Wir suchen nun eine lineare Funktion f1 : M1 → R mit den Eigenschaften f1 (x) = f (x) auf M und f1 (x) ≤ p(x) auf M1 . 4 DER FORTSETZUNGSSATZ VON HAHN-BANACH 41 Weil f1 linear sein soll, gilt nach obiger Definition auf M1 f1 (x + tx1 ) = f1 (x) + f1 (tx1 ) = f (x) + t f1 (x1 ). Gesucht ist nun eine Konstante c = f1 (x1 ), so dass für alle z ∈ M1 giltf1 (z) ≤ p(z). Nach Voraussetzung gilt für alle x, y ∈ M f (x) + f (y) = f (x + y) ≤ p(x + y) = p(x − x1 + y + x1 ) ≤ p(x − x1 ) + p(y + x1 ). Schreiben wir obige Gleichung um, so folgt f (x) − p(x − x1 ) ≤ p(y + x1 ) − f (y) ∀ x, y ∈ M. Wir legen c nun fest als c := sup f (x) − p(x − x1 ) ≤ p(y + x1 ) − f (y) ∀ y ∈ M. x∈M Daraus folgt f (x) − c ≤ p(x − x1 ) ∀ x ∈ M . f (y) + c ≤ p(y + x1 ) ∀ y ∈ M (4.1) Damit können wir nun f1 definieren durch f1 (x+tx1 ) = f (x)+tc. Für diese Funktion gilt f1 (z) ≤ p(z) auf M1 , denn: Aus (4.1) folgt, nach der Multiplikation mit t > 0 und der Ersetzung von x durch xt : t f xt − tc ≤ t p xt − x1 t f yt + tc ≤ t p yt + x1 . Mit der Linearität von f und den Eigenschaften von p folgt f1 (x − tx1 ) = f (x) − tc ≤ p(x − tx1 ) f1 (y + tx1 ) = f (y) + tc ≤ p(y + tx1 ) für alle x, y ∈ M und t > 0. Wir hatten vorausgesetzt, dass auf M gilt f (x) ≤ p(x), und so folgt f1 (x + tx1 ) ≤ p(x + tx1 ) für alle x ∈ M und t ∈ R, das heisst, es ist f1 (z) ≤ p(z) auf ganz M1 . Jetzt führen wir eine transfinite Induktion (nach Zorn) durch. Es bezeichne P die Menge aller linearen Abbildungen h : Dh ⊃ M → R, definiert auf einem linearen Teilraum Dh ⊂ X, mit den Eigenschaften 1) h : Dh → R, 2) 3) M ⊂ Dh ⊂ X, h(x) = f (x) x ∈ M h(x) ≤ p(x) x ∈ Dh Die Menge P ist sicher nicht leer (sie enthält f ), und wir definieren die Halbordnung < auf P: h1 < h2 ⇐⇒ Dh1 ⊂ Dh2 und h1 = h2 auf Dh1 . Die Axiome für eine Halbordnung lassen sich schnell überprüfen: 1. h < h für alle h ∈ P; 2. Aus h1 < h2 und h2 < h1 folgt h1 = h2 ; 3. Gilt h1 < h2 und h2 < h3 , so ist auch h1 < h3 . 4 DER FORTSETZUNGSSATZ VON HAHN-BANACH 42 Also ist P eine halb-geordnete Menge. Als nächstes zeigen wir, dass jede linear geordnete Teilmenge P0 ⊂ P eine obere Schranke h0 besitzt: Wir definieren h0 auf [ D h0 = Dh ⊂ X h∈P0 durch h0 (x) = h(x) x ∈ Dh . Es ist dann h0 ∈ P und h < h0 für alle h ∈ P0 . Nun können wir das Lemma von Zorn anwenden: wir wählen ein maximales Element h∗ ∈ P. Dann ist ∗ h (x) = f (x) ∀ x ∈ M nach Konstruktion von P h∗ (x) ≤ p(x) ∀ x ∈ Dh∗ und es ist Dh∗ = X. Denn wäre dies nicht der Fall, so würde, nach dem ersten Beweisschritt, eine von h∗ verschiedene Abbildung h ∈ P mit h∗ < h existieren, im Widerspruch zur Maximalität von h∗ . Wir sehen, dass h∗ die gesuchte Abbildung F ist. Theorem 4.2 (Hahn-Banach, komplex). Analog zum obigen reellen Fall seien ein komplexer Vektorraum X und eine reellwertige Funktion p : X → R mit den Eigenschaften p(x + y) ≤ p(x) + p(y), p(αx) = |α|p(x), p(x) ≥ 0 für alle x, y aus X und für alle α ∈ C gegeben, sowie ein komplexer linearer Teilraum M ⊂ X und eine C-lineare Abbildung f : M → C, mit |f (x)| ≤ p(x) x ∈ M, gegeben. Dann existiert eine C-lineare Funktion F : X → C mit F (x) = f (x) |F (x)| ≤ p(x) x ∈ M, x ∈ X. Beweis. Wir führen den Beweis auf den reellen Fall zurück. Dazu betrachten wir die Funktion f einmal etwas genauer. Diese Funktion lässt sich schreiben als f (x) = Re f (x) + i Im f (x) = f1 (x) + i f2 (x). In dieser Zerlegung sind f1 , f2 R-linear und, weil f C-linear ist, f (ix) = i f (x) ⇐⇒ f1 (ix) + i f2 (ix) = i f1 (x) − f2 (x) ⇒ f2 (x) = −f1 (ix). Das heisst, f ist von der Form f (x) = f1 (x) − i f1 (ix). (4.2) Unserer Annahme zu Folge ist f1 (x) ≤ |f1 (x)| ≤ |f (x)| ≤ p(x) x ∈ M, 4 DER FORTSETZUNGSSATZ VON HAHN-BANACH 43 es existiert daher nach Theorem 4.1 eine R-lineare Abbildung F1 : X → R, so dass gilt x ∈ M, F1 (x) = f1 (x) F1 (x) ≤ p(x) x ∈ X. Zudem folgt aus den Eigenschaften von p, dass mit −F1 (x) = F1 (−x) ≤ p(−x) = p(x) x∈X für alle x aus X gilt |F1 (x)| ≤ p(x). Wir definieren auf X nun die Abbildung F (x) = F1 (x) − i F1 (ix). Damit ist wegen (4.2) für alle x ∈ M F (x) = f (x) und wir zeigen: i) F : X → C ist C-linear und ii) es gilt: |F (x)| ≤ p(x) für alle x aus X. Für den ersten Teil genügt es zu zeigen, dass F (ix) = i F (x), also F (ix) = F1 (ix) − i F1 (−x) = F1 (ix) + i F1 (x) = i(F1 (x) − i F1 (ix)) = i F (x). Für den zweiten Teil setzen wir F (x) = re−iϑ für ein ϑ in R. Dann ist r = |F (x)| = eiϑ F (x) = F (eiϑ x) ≥ 0, insbesondere ist F (eiϑ x) reell und nicht negativ, also ist 0 ≤ |F (x)| = F (eiϑ x) = F1 (eiϑ x) = |F1 (eiϑ x)| ≤ p(eiϑ x) = |eiϑ |p(x) = p(x). 4.2 Folgerungen aus dem Fortsetzungssatz Definition 4.3. (Dualraum) Der Dualraum X 0 (auch X ∗ ) eines normierten Raumes X ist der normierte Raum X 0 = L(X, C) beziehungsweise X 0 = L(X, R) mit der Norm kf k := sup |f (x)|, kxk≤1 f ∈ X 0. Bemerkung: Solche Dualräume sind immer auch Banach-Räume, weil C beziehungsweise R vollständig sind (siehe dazu Satz 2.7). Satz 4.1. Ist X ein normierter Raum, M ein linearer Teilraum von X und f ∈ M 0 , so existiert ein F ∈ X 0 mit den Eigenschaften F (x) = f (x), x∈M und kF k = kf k. Beweis. Wir definieren die Funktion p : X → R durch p(x) := kf k kxk für alle x aus X. Da f ein Element aus L(M, C) ist, folgt |f (x)| ≤ kf k kxk = p(x) ∀ x ∈ M. Nach Theorem 4.2 existiert eine Abbildung F : X → C, welche auf M mit f identisch ist und für die auf ganz X gilt |F (x)| ≤ p(x) = kf k kxk. Das heisst, F ist ein Element von L(X, C) = X 0 und es ist kF k ≤ kf k. Weil F ≡ f auf M gilt, so folgt kF k ≥ kf k und der Satz ist bewiesen. 4 DER FORTSETZUNGSSATZ VON HAHN-BANACH 44 Satz 4.2. Sei X ein normierter Raum, 0 6= x∗ ∈ X. Dann existiert eine Abbildung f ∈ X 0 mit f (x∗ ) = kx∗ k > 0 und kf k = 1. Beweis. Wir benutzen obigen Satz 4.1. Dazu definieren wir die Menge M := {αx∗ |α ∈ C} ⊂ X. M ist ein linearer Teilraum von X. Nun betrachten wir die Funktion ϕ ∈ M 0 , die durch ϕ(αx∗ ) = αkx∗ k definiert ist. Es ist offensichtlich ϕ(x∗ ) = kx∗ k und |ϕ(αx∗ )| = |α| kx∗ k = kαx∗ k, und daher |ϕ(x)| = kxk für alle x in M . Also ist kϕk = 1. Die gesuchte Abbildung f findet man jetzt nach Satz 4.1. Daraus können wir nun Folgendes schliessen 1. Ist ein x0 in X gegeben und ist f (x0 ) = 0 für alle f aus X 0 , so ist x0 = 0. 2. Sind x 6= y in X, dann existiert eine lineare Abbildung f ∈ X 0 , für welche gilt: f (x) 6= f (y) und kf k = 1, denn nach Satz 4.2 gibt es eine Funktion f ∈ X 0 mit f (x − y) = kx − yk > 0 und kf k = 1. Mit anderen Worten: wir können zwei verschiedene Punkte in X durch eine lineare Funktion f ∈ X 0 voneinander trennen. Doch wir können noch mehr erreichen: Satz 4.3. Es seien X ein normierter Raum, M ein linearer Teilraum von X und x∗ 6∈ M̄ , das heisst, d = dist(x∗ , M ) = inf kx∗ − xk > 0. x∈M Dann existiert eine Abbildung F ∈ X 0 , rx∗ so dass PP PP d PP F (x) = 0 für x ∈ M r PP M PP P F (x) = d für x = x∗ . PP P PP kF k = 1 PP Mit anderen Worten: wir können einen abgeschlossenen Teilraum M̄ und einen Punkt x∗ 6∈ M̄ durch eine Abbildung f in X 0 voneinander trennen. Beweis. Wir definieren den linearen Teilraum M1 := {x + tx∗ |x ∈ M, t ∈ R} ⊂ X und die lineare Abbildung f : M1 → C f (x + tx∗ ) := td, wobei d = dist(x∗ , M ) sei. Mit dieser Definition ist f (x) = 0 für alle x aus M (t = 0) und f (x∗ ) = d (t = 1). Wir zeigen nun, dass kf k = 1 gilt, und dann folgt Satz 4.3 aus Satz 4.1: 4 DER FORTSETZUNGSSATZ VON HAHN-BANACH 45 Jedes y ∈ M1 lässt sich schreiben als y = x + tx∗ , wobei x ∈ M ist. Sei nun t 6= 0. Dann ist nach Definition des Infimums 1 1 ∗ ∗ ∗ x + x = |t| x + x ≥ |t|d = |f (y)|, kyk = kx + tx k = t t t da 1t x wieder in M liegt. Somit ist |f (y)| ≤ kyk und daher kf k ≤ 1. Um die andere Richtung zu zeigen, geben wir uns ein beliebiges ε > 0 vor. Nach der Definition des Infimums existiert ein x ∈ M mit kx−x∗ k ≤ d+ε. Wir definieren y := mit kyk = 1. Es folgt x − x∗ ∈ M1 , kx − x∗ k kf k ≥ |f (y)| = −1 d d≥ . kx − x∗ k d+ε Dies gilt für jedes ε > 0, also ist kf k ≥ 1. Dieses Resultat wollen wir nun in der Approximationstheorie anwenden: gesucht sind Abschätzungen von inf kx∗ − xk = dist(x∗ , M ). x∈M Dazu benötigen wir folgende Definition: Definition 4.4. (Annihilator) Sei A ⊂ X eine Teilmenge von X. Der Annihilator von A ist die Menge A⊥ := {f ∈ X 0 |f (x) = 0 ∀ x ∈ A} ⊂ X 0 . Theorem 4.3. Es sei M ein abgeschlossener, linearer Teilraum von X und x ∗ 6∈ M . Dann existiert eine Abbildung f ∗ ∈ X 0 mit f ∗ ∈ M ⊥ und kf ∗ k = 1, so dass d(x∗ , M ) = f ∗ (x∗ ) = sup |f (x∗ )|. kf k=1 f ∈M ⊥ Beweis. Nach Satz 4.3 existiert ein f ∗ in X 0 mit kf ∗ k = 1 und f ∗ ∈ M ⊥ , so dass d(x∗ , M ) = f ∗ (x∗ ). Es bleibt noch zu zeigen, dass f ∗ ein Maximum ist. Es sei f ∈ M ⊥ mit kf k = 1 und m ∈ M . Es ist f (m) = 0 und es folgt |f (x∗ )| = |f (x∗ − m)| ≤ kf k kx∗ − mk = kx∗ − mk. Daher gilt sup |f (x∗ )| ≤ kx∗ − mk, kf k=1 f ∈M ⊥ und zwar für alle m ∈ M , also ist sup |f (x∗ )| ≤ inf kx∗ − mk = d(x∗ , M ) = f ∗ (x∗ ). kf k=1 f ∈M ⊥ m∈M 4 DER FORTSETZUNGSSATZ VON HAHN-BANACH 46 Bemerkung: In der Gleichung inf kx∗ − mk = d(x∗ , M ) = sup |f (x∗ )| m∈M kf k=1 f ∈M ⊥ wird das Infimum auf der linken Seite nicht immer angenommen (falls X nicht reflexiv ist, dazu später mehr). Das Supremum rechts wird hingegen immer angenommen, das heisst, es existiert ein Maximum. Satz 4.4. Es sei A eine Teilmenge von X und hAi die lineare Hülle von A. Dann sind äquivalent: i) x∗ ∈ hAi; ii) f (x∗ ) = 0 für alle f ∈ A⊥ . Beweis. i) ⇒ ii) Sei x∗ ∈ hAi. Daher ist x∗ = limn→∞ xn für eine Folge xn ∈ hAi. Dann gilt für jedes f ∈ A⊥ , dass f (xn ) = 0 ist für alle n. Da f stetig ist, folgt 0 = lim f (xn ) = f (x∗ ). n→∞ ii) ⇒ i) Es sei x∗ 6∈ hAi =: M . Dann existiert nach Theorem 4.3 ein f ∈ M ⊥ ⊂ A⊥ , so dass f (x∗ ) = dist(x∗ , M ) > 0. Für das Paar X 0 , X von normierten Räumen erhalten wir die kanonische Bilinearform X 0 × X −→ C, {f, x} 7−→ f (x) =: hf, xi. Die Bilinearform ist stetig, denn nach der Definition der Norm in X 0 ist |hf, xi| ≤ kf k kxk. Satz 4.5. Sei X ein normierter Raum. Dann ist i) f ∈ X 0 : kf k = ii) x ∈ X : kxk = sup x∈X,kxk≤1 |hf, xi|; sup f ∈X 0 ,kf k≤1 |hf, xi|. Beweis. i) ist die Definition der Norm für f ∈ X 0 . ii) Wir nehmen ein f ∈ X 0 mit kf k ≤ 1. Dann ist |hf, xi| ≤ kf k kxk ≤ kxk, also sup f ∈X 0 ,kf k≤1 |hf, xi| ≤ kxk. Umgekehrt sei x 6= 0 ∈ X, dann existiert nach Satz 4.2 eine Abbildung f ∈ X 0 mit kf k = 1 und f (x) = kxk, das heisst, mit hf, xi = kxk. Also ist sup f ∈X 0 ,kf k=1 |hf, xi| ≥ kxk. 47 5 SOBOLEV-RÄUME 5 Sobolev-Räume In diesem Abschnitt betrachten wir Sobolev-Räume, das sind Funktionenräume, in welchen integrable und gleichzeitig differenzierbare Eigenschaften von Funktionen kontrolliert werden. 5.1 Der Glättungsoperator Die Faltung zweier Funktionen f, g : Rn → C (R) ist, zunächst formal, die Funktion f ∗ g : Rn → C (R), definiert durch Z f ∗ g(x) = f (x − y)g(y)dy x ∈ Rn n ZR = f (ξ)g(x − ξ)dξ (ξ = x − y) Rn = g ∗ f (x). Wann aber existiert dieses Faltungsprodukt? Dazu zitieren wir einen Satz aus der Integrationstheorie. Satz 5.1 (Faltung). Sei f ∈ L1 (Rn ) und g ∈ Lp (Rn ) für ein p ≥ 1. Dann ist, für fast alle x ∈ Rn , die Funktion y 7−→ f (x − y)g(y) auf Rn integrabel und es ist f ∗ g ∈ Lp (Rn ) und kf ∗ gkLp ≤ kf kL1 kgkLp . Beweis. Der Beweis wird durch die Sätze von Tonelli und Fubini geführt und kann zum Beispiel dem Buch Analyse fonctionelle von H. Brezis entnommen werden. In Anlehnung zur Masstheorie definieren wir Lp (Rn ) := {Äquivalenzklassen von f : Rn → C/R|f messbar und |f |p ∈ L1 (Rn )}, das heisst, Z Rn n |f (x)|p dx < ∞. Wir können, etwas allgemeiner, R durch eine beliebige messbare Teilmenge Ω von Rn ersetzen: Es ist dann Lp (Ω) := {f : Ω → C/R|f messbar und χΩ ◦ f ∈ Lp (Rn )}. Auf dem so definierten Funktionenraum können wir für p ≥ 1 eine Norm festsetzen: kf kLp(Ω) := kf kp = Z Ω |f (x)|p dx p1 . Damit wird Lp (Ω) zu einem Banach-Raum. Wir betrachten nun eine Klasse von ganz speziellen Funktionen: es sei ρ : Rn → R mit den Eigenschaften i) ρ ∈ C ∞ (Rn ); ii) ρ(x) ≥ 0 für alle x und ρ(x) = 0 für alle x mit |x| ≥ 1; R iii) Rn ρ dµ = 1. 48 5 SOBOLEV-RÄUME Zum Beispiel können wir ρ wählen als ( 1 ce |x|2 −1 ρ(x) = 0 |x| < 1 , |x| ≥ 1 wobei c > 0 so gewählt ist, dass ρ die Bedingung iii) erfüllt. Definition 5.1. (Dirac-Folge) Eine Dirac-Folge zu ρ ist die Familie von Funktionen ρλ ∈ C ∞ (Rn ), λ > 0, mit ρλ (x) = Es gilt: 1 x ρ λn λ x ∈ Rn . 6 i) ρλ ∈ C ∞ (Rn ); ii) ρλ (x) ≥ 0 für alle x und ρλ (x) = 0 für alle x mit |x| ≥ λ; R iii) Rn ρλ dµ = 1. ρλ ρ −1 −λ λ 1 Lemma 5.1 (Glättung). Sei u ∈ L1loc (Rn ), das heisst lokal integrabel für alle kompakten Teilmengen K ⊂ Rn ( ⇐⇒ χK ◦ u ∈ L1 (K)). Dann ist ρλ ∗ u ∈ C ∞ (Rn ). Beweis. Wir betrachten ρλ ∗ u(x) = Z Rn ρλ (x − y)u(y) dy. Das Integral existiert, weil nur über ein kompaktes Intervall integriert wird, denn es ist ja ρλ (x − y) = 0, falls |x − y| ≥ λ. Wir schreiben daher Z ρλ ∗ u(x) = ρλ (x − y)u(y) dy |x−y|≤λ und 1 (ρλ ∗ u(x + hej ) − ρλ ∗ u(x)) = h Z Rn 1 (ρλ (x + hej − y) − ρλ (x − y)) u(y) dy. h Die rechte Seite konvergiert nach dem Lebesgue-Majorantensatz mit h → 0 gegen Z Dj ρλ (x − y)u(y) dy. Rn Das heisst, es ist (mit Dj = ∂ ∂xj ) Dj (ρλ ∗ u) = (Dj ρλ ) ∗ u. Wir können dieses Vorgehen wiederholt anwenden und erhalten so, mit der Notation von Definition von Seite 38, Dα (ρλ ∗ u)(x) = (Dα ρλ ) ∗ u(x). Da ρλ glatt (also in C ∞ (Rn )) ist, folgt die Behauptung. 49 5 SOBOLEV-RÄUME Wir führen noch folgende Notation ein: für A ⊂ Rn ist Aε := {x ∈ Rn |dist(x, A) ≤ ε}. Lemma 5.2. Es sei u ∈ L1loc (Rn ) mit kompaktem Träger supp(u). Dann ist ρλ ∗ u ∈ Cc∞ (Rn ) und supp(ρλ ∗ u) ⊂ supp(u) λ für alle λ > 0. Beweis. Es ist ρλ (x − y)u(y) = 0, falls y 6∈ supp(u) oder falls |x − y| ≥ λ. Daher ist ρλ ∗ u(x) = 0, falls dist(x, supp(u)) ≥ λ. Lemma 5.3 (Approximation). Es sei u ∈ Cc (Rn ) Dann gilt λ→0 sup |ρλ ∗ u(x) − u(x)| = kρλ ∗ u − uk∞ −−−→ 0. x∈Rn Beweis. Wegen der Eigenschaft iii) von ρλ folgt Z |ρλ ∗ u(x) − u(x)| = ρλ (x − y) u(y) − u(x) dy Rn Z ≤ ρλ (x − y)|u(y) − u(x)|dy |x−y|≤λ Z ρλ (x − y)dy . ≤ sup |u(y) − u(x)| n |x−y|≤λ |R {z } =1 Weil der Träger supp(u) von u kompakt ist, ist u gleichmässig stetig auf Rn , das heisst, das Supremum in der letzten Zeile konvergiert für alle x ∈ Rn gleichmässig gegen 0, falls λ gegen 0 geht. In der Folge gilt sogar: mit den Voraussetzungen von Lemma 5.3 gilt kρλ ∗ u − ukp −→ 0 (λ → 0). Denn wählen wir eine kompakte Menge K gross genug, so ist Z Z p p p kρλ ∗ u − ukp = |ρλ ∗ u(x) − u(x)| dx ≤ kρλ ∗ u − uk∞ 1 dx , K | K{z } =m(K)<∞ und die rechte Seite konvergiert gemäss Lemma 5.3 gegen 0, wenn λ gegen 0 strebt. Theorem 5.1. Es seien Ω ⊂ Rn offen und u ∈ Lp (Ω) für ein p ≥ 1 (wir setzen u(x) = 0 für alle x 6∈ Ω). Dann ist i) ρλ ∗ u ∈ C ∞ (Ω) ∩ Lp (Ω); ii) kρλ ∗ ukLp(Ω) ≤ kukLp(Ω) ; iii) kρλ ∗ u − ukLp(Ω) −→ 0 für λ → 0. Beweis. Zuerst zeigen wir, dass u in L1loc (Ω) liegt: Zu gegebenem p wählen wir ein q, so dass p1 + 1q = 1. Zudem sei K ⊂ Ω kompakt. Dann gilt χK ◦ u = χK ◦ (χK ◦ u) |{z} | {z } ∈Lq ∈Lp ∈ L1 (K), 50 5 SOBOLEV-RÄUME das heisst, u ist ein Element von L1loc (Ω) (siehe dazu auch Lemma 5.1). Weil kρλ kL1 (Ω) = 1, so folgen die Aussagen i) und ii) aus Satz 5.1 und Lemma 5.1. Für den Beweis von iii) sei v ∈ Cc (Ω). Wir bekommen dann mit der Dreiecksungleichung (zweimal angewendet) ku − ρλ ∗ ukLp(Ω) ≤ ku − vkLp (Ω) + kv − ρλ ∗ vkLp (Ω) + kρλ ∗ v − ρλ ∗ ukLp(Ω) {z } | =kρλ ∗(v−u)kLp (Ω) ≤ 2ku − vkLp (Ω) + kv − ρλ ∗ vkLp (Ω) . Wir benutzen, dass Cc (Ω) in Lp (Ω) für jedes p ≥ 1 dicht liegt. So existiert nämlich zu jedem ε > 0 ein v ∈ Cc (Ω) mit ku−vkLp(Ω) < ε. Zudem können wir nach Lemma 5.3 λ so klein wählen, dass kv − ρλ ∗ vkLp (Ω) < ε wird. Damit erhalten wir ku − ρλ ∗ ukLp (Ω) < 3ε. Eine Folgerung aus obigem Theorem werden wir jetzt formulieren: Theorem 5.2. Der Raum Cc∞ (Ω) liegt dicht in Lp (Ω) für alle p ≥ 1. Beweis. Es sei u ∈ Lp (Ω) und v ∈ Cc (Ω). Dann ist nach den Lemmata 5.1 und 5.2 ρλ ∗ v ∈ Cc∞ (Ω) für kleine λ. Mit der Dreiecksungleichung folgt: ku − ρλ ∗ vkLp (Ω) ≤ ku − vkLp (Ω) + kv − ρλ ∗ vkLp (Ω) . Zu kleinem ε > 0 wählen wir ein v ∈ Cc (Ω), so dass ku−vkLp(Ω) < ε. Nach Lemma 5.3 existiert ein λ > 0, klein genug, dass kv − ρλ ∗ vkLp (Ω) < ε ist. Ω supp(ϕ) Somit wäre das Theorem bewiesen. Theorem 5.3. Es sei Ω ⊂ Rn offen und es gelte f ∈ L1loc (Ω) und für alle ϕ ∈ Cc∞ (Ω). Dann ist f = 0 fast überall in Ω. R Ω f ϕ dµ = 0 Beweis. Wir führen den Beweis auf den trivialen Fall zurück, wo f stetig ist: Zu x0 in Ω wählen wir eine offene Kugel Br mit Zentrum x0 , so dass x0 ∈ Br ⊂ B̄2r ⊂ Ω. Es genügt nun zu zeigen, dass kf kL1 (Br ) = 0. Dazu definieren wir die Funktion ( ˆ = f (x) x ∈ B̄2r . f(x) 0 sonst Da f nach Voraussetzung in L1loc (Rn ) liegt, ist fˆ ∈ L1 (Rn ) und für kleines λ gilt ρλ ∗ f (x) = ρλ ∗ fˆ(x), x ∈ B̄r . Es sei nun ϕ ∈ Cc∞ (Br ) beliebig. Es folgt nach Lemma 5.2 ρλ ∗ ϕ ∈ Cc∞ (B2r ) ⊂ Cc∞ (Ω), falls λ klein genug ist. Nach Voraussetzung ist nun Z Z Z 0= f (ρλ ∗ ϕ)dµ = f (ρλ ∗ ϕ)dµ = fˆ (ρλ ∗ ϕ)dµ Ω B2r B2r Z Z ∗ ˆ = (ρλ ∗ f) ϕ dµ = (ρλ ∗ fˆ) ϕ dµ Rn Ω 51 5 SOBOLEV-RÄUME (∗: wegen dem Satz von Fubini) für alle ϕ ∈ Cc∞ (Br ). Weil ρλ ∗ fˆ stetig ist, muss (ρλ ∗ fˆ)(x) = 0 sein für alle x ∈ Br . Es folgt nun λ→0 ˆ L1 (B ) ≤ kfˆ − ρλ ∗ fˆkL1 (B ) + kρλ ∗ fˆkL1 (B ) −−−→ 0 kf kL1 (Br ) = kfk r r r | {z } =0 nach Theorem 5.1. Also ist kf kL1 (Br ) = 0, wie behauptet. 5.2 ◦ Die Funktionenräume W m,p (Ω), H m,p (Ω) und H m,p (Ω) Wir beginnen diesen Abschnitt mit einer Vorbemerkung über die partielle Integration: Ist Ω ⊂ Rn offen, u ∈ C 1 (Ω) und ϕ ∈ Cc∞ (Ω), ϕ hat also einen kompakten Träger supp(ϕ) ⊂ Ω. Dann folgt Z Z ∂ ∂ u(x) u(x)ϕ(x) dx = ϕ(x) dx. (−1) ∂x ∂x j j Ω Ω Um dies einzusehen, wenden wir den Satz von Fubini an, nachdem wir über die j-te Variable partiell integriert haben. Die bei der Integration auftretenden Randterme verschwinden, da ϕ kompakten Träger hat und daher auf ∂Ω verschwindet. Falls nun u ∈ C |α| (Ω) liegt, so können wir dieses Argument |α|-mal wiederholen und erhalten so die Gleichung Z Z Dα u(x)ϕ(x) dx = u(x)Dα ϕ(x) dx. (−1)|α| Ω Ω Dabei ist die rechte Seite definiert für alle Funktionen u in L1loc (Ω). Definition 5.2. (schwache Ableitung) Es sei u in L1loc (Ω). Wir nehmen an, es gäbe eine Funktion v ∈ L1loc (Ω) und ein α = (α1 , . . . , αn ), so dass für alle ϕ ∈ Cc∞ (Ω) gilt Z Z |α| (−1) v(x)ϕ(x) dx = u(x)Dα ϕ(x) dx. Ω Ω Dann heisst v die schwache α-Ableitung von u und man schreibt dafür v = Dα u (schwach). Bemerkungen 1. Die schwache Ableitung von u, sofern sie überhaupt existiert, ist wegen Theorem 5.3 eindeutig. Denn: sind v1 , v2 ∈ L1loc (Ω) mit v1 = Dα u und v2 = Dα u, so folgt Z (v1 − v2 )ϕ dµ = 0 ∀ϕ ∈ Cc∞ (Ω), Ω also ist v1 = v2 fast überall auf Ω, nach Theorem 5.3. 2. Die schwache Ableitung hat zunächst nichts mit dem Differentialquotienten der (klassischen) Ableitung zu tun. Falls aber u ∈ C |α| (Ω) ist, so folgt aus der Eindeutigkeit der Ableitung, dass v = D α u ist im üblichen Sinn. 52 5 SOBOLEV-RÄUME Definition 5.3. (Sobolev-Raum W m,p ) Wir definieren den Sobolev-Raum W m,p (Ω) für ganze m als Teilraum von Lp (Ω) dadurch, dass für u ∈ Lp (Ω) alle schwachen Ableitungen D α u in Lp (Ω) existieren für 0 ≤ |α| ≤ m, in Formeln es existieren alle schwachen Ableitungen D α u und W m,p (Ω) := u ∈ Lp (Ω) α D u ∈ Lp (Ω) für 0 ≤ |α| ≤ m Auf dieser Menge legen wir auch eine Norm fest durch X kDα ukLp (Ω) . |u|m,p := kukW m,p (Ω) := 0≤|α|≤m Eine zweite (äquivalente) Definition des Raumes W m,p (Ω) folgt später mittels Approximationseigenschaften mit glatten Funktionen. Um diese abstrakte Definition etwas zu veranschaulichen, hier noch zwei Beispiele 1. Als erstes betrachten wir die Menge Ω = (−1, 1) ⊂ R und die Funktion u(x) = 21 (|x| + x). Wir behaupten, dass u für p ≥ 1 in W 1,p (Ω) liegt. Um dies zu beweisen, testen wir mit einer Funktion ϕ ∈ Cc∞ (Ω): Z 1 u Dϕ dx = −1 Z 1 0 =− Z 1 x ϕ0 dx = (x ϕ) − | {z }0 =0 Z y 16 v(x) = -x 1 ϕ dx 0 −1 1 1 y 16 v ϕ dx −1 mit ( u −1 0 −1 < x < 0 1 0<x<1 v -x 1 Es ist offensichtlich v ∈ Lp (Ω) und aus obiger Gleichung folgt Z Z v ϕ dµ u Dϕ dµ = − Ω Ω Cc∞ (Ω). für alle ϕ aus Somit ist v nach unserer Definition die schwache Ableitung v = Du, also liegt u in W 1,p (Ω). Wir haben gezeigt, dass eine – im klassischen Sinne – nicht differenzierbare Funktion schwach differenzierbar sein kann. 2. Nun zeigen wir, dass die so gefundene schwache Ableitung v für kein p ≥ 1 in W 1,p (Ω) liegt, und daraus können wir dann schliessen, dass u 6∈ W 2,p (Ω). Es genügt zu zeigen, dass v keine schwache Ableitung in L1loc (Ω) und somit auch keine in Lp (Ω) hat. Dazu nehmen wir an, es gäbe ein w ∈ L1loc (Ω) mit Z 1 Z 1 v Dϕ dx = − w ϕ dx ∀ ϕ ∈ Cc∞ (Ω). −1 −1 Die linke Seite oben stehender Gleichung können wir ausrechnen, und wegen ϕ(1) = 0 ist Z 1 Z 1 v Dϕ dx = ϕ0 dx = ϕ(1) − ϕ(0) = −ϕ(0). −1 0 53 5 SOBOLEV-RÄUME Die schwache Ableitung w erfüllt daher Z w ϕ dµ = ϕ(0) ∀ ϕ ∈ Cc∞ (Ω). Ω (5.1) Da ϕ ∈ Cc∞ (Ω \ {0}) kompakten Träger auf Ω \ {0} hat, gilt Z w ϕ dµ = 0 ∀ ϕ ∈ Cc∞ (Ω \ {0}). Ω Nach Theorem 5.3 ist dann aber w = 0 fast überall auf Ω \ {0}. Folglich ist auch w = 0 fast überall auf ganz Ω und daher ist Z w ϕ dµ = 0 ∀ ϕ ∈ Cc∞ (Ω), Ω was im Widerspruch steht zu (5.1), denn wir können ein ϕ ∈ Cc∞ (Ω) wählen mit ϕ(0) 6= 0. Satz 5.2. Der Raum W m,p (Ω) ist vollständig. Beweis. Als Grundlage dieses Beweises dient die Vollständigkeit der Räume Lp (Ω). Es sei nun also uj eine Cauchy-Folge in W m,p (Ω), das heisst, es gibt für jedes ε > 0 eine Schranke N = Nε so, dass |uj − uk |m,p ≤ ε ∀ j, k ≥ N. (5.2) Nach der Definition der Norm auf W m,p (Ω) gilt dann kDα uj − Dα uk kLp (Ω) ≤ ε ∀ j, k ≥ N, ∀ 0 ≤ |α| ≤ m. In Worten: für jedes α ist (Dα uj ) eine Cauchy-Folge in Lp (Ω). Nun ist Lp (Ω) vollständig, also existieren Funktionen f α in Lp (Ω) so, dass Dα uj −→ f α in Lp (Ω) ∀ 0 ≤ |α| ≤ m. Wir definieren nun f := f 0 , und wollen zeigen, dass f α = Dα f (schwach) für alle 0 ≤ |α| ≤ m und somit dann auch f ∈ W m,p (Ω) gilt. Wir testen also mit einer Funktion ϕ ∈ Cc∞ (Ω) und erhalten Folgendes: R R α |α| α ∞ Ω uj D ϕ dµ = (−1) Ω D uj ϕ dµ ∀ϕ ∈ Cc (Ω) ↓(i) ↓R(ii) , R α |α| α ∞ f D ϕ dµ = (−1) f ϕ dµ ∀ ϕ ∈ C (Ω) c Ω Ω da nach dem oben Gesagten gilt: (i) uj → f in Lp (Ω) und (ii) Dα uj → f α in Lp (Ω). Mit der Hölder’schen Ungleichung und p1 + q1 = 1 folgt Z Z Z α uj Dα ϕ dµ − |uj − f | |Dα ϕ| dµ f D ϕ dµ ≤ Ω Ω Ω ≤ kuj − f kLp(Ω) kDα ϕkLq (Ω) , | {z } j→∞ −−−→0 woraus die obige Konvergenz (im Diagramm) folgt. Nach der Definition der schwachen Ableitung folgt aus der zweiten Zeile des Diagrammes, dass f α = Dα f . Nun haben wir einen Kandidaten in Lp (Ω) für den Limes von uj , nämlich f . Aus (5.2) folgt, mit k → ∞, |uj − f |m,p ≤ ε ∀ j ≥ N, dies gilt für alle ε > 0, also ist tatsächlich uj → f in W m,p (Ω). 54 5 SOBOLEV-RÄUME Bemerkung: Ist u ∈ C ∞ (Ω) und die gewöhnlichen Ableitungen D α u ∈ Lp (Ω) für alle 0 ≤ |α| ≤ m, dann ist nach Definition u ∈ W m,p (Ω) ∩ C ∞ (Ω) und X |u|m,p = kDα ukLp(Ω) < ∞. 0≤|α|≤m Definition 5.4. (H m,p (Ω)) Wir definieren den Raum H m,p (Ω) als Abschluss in W m,p (Ω) der Menge {u ∈ C ∞ (Ω)| |u|m,p < ∞}. Dies lässt sich auch schreiben als: H m,p (Ω) := C ∞ (Ω) ∩ W m,p (Ω) W m,p . Das heisst, H m,p (Ω) ist ein abgeschlossener linearer Teilraum des vollständigen Raumes W m,p (Ω) und daher selber ein Banach-Raum. Mit dem folgenden Satz können wir dann H m,p (Ω) mit W m,p (Ω) identifizieren: Satz 5.3 (Meyers-Serrin). Sei Ω ⊂ Rn offen. Dann ist C ∞ (Ω) ∩ W m,p (Ω) dicht in W m,p (Ω), das heisst, für alle u ∈ W m,p (Ω) existiert eine Funktionenfolge uj in C ∞ (Ω) ∩ W m,p (Ω), so dass |u − uj |m,p → 0, falls j → ∞. Beweis. Wir werden den Beweis nicht durchführen. Er beruht auf der Zerlegung der Eins und Glättungsoperatoren. Für Details wird an dieser Stelle auf die Bücher von H. W. Alt, Seite 108, und von Adams, Seite 52, verwiesen. Folgerung: Nach Satz 5.3 folgt nun, dass H m,p (Ω) = W m,p (Ω) und wir haben die zur ersten Definition 5.3 äquivalente Definition des Sobolev-Raumes W m,p (Ω) gefunden: Definition 5.5. (W m,p (Ω) = H m,p (Ω)) Wir charakterisieren den Raum W m,p (Ω) mittels Approximationseigenschaften glatter Funktionen: ∃ uj ∈ C ∞ (Ω) mit Dα uj ∈ Lp (Ω), 0 ≤ |α| ≤ m W m,p (Ω) := . u ∈ Lp (Ω) so dass uj → u in Lp (Ω), Dα uj ist Cauchy-Folge in Lp (Ω), 0 ≤ |α| ≤ m Bemerkung: Da der Raum Lp (Ω) vollständig ist, existiert der in der Definition 5.5 auftretende Limes in Lp (Ω): lim Dα uj =: uα j→∞ ∈ Lp (Ω), 0 ≤ |α| ≤ m. Genau wie im Beweis von Satz 5.2 folgt, dass uα = Dα u (schwach). Die Norm in W m,p (Ω) ist dann definiert durch X kDα ukLp (Ω) . |u|m,p := 0≤|α|≤m Es gilt immer: Cc∞ (Ω) ⊂ H m,p (Ω). 55 5 SOBOLEV-RÄUME ◦ Definition 5.6. (Hm,p (Ω)) ◦ Es sei Hm,p (Ω) der Abschluss von Cc∞ (Ω) in der H m,p (Ω)-Norm: ◦ Hm,p (Ω) := Cc∞ (Ω) H m,p (Ω) ⊂ H m,p (Ω). ◦ Mit dieser Definition ist Hm,p (Ω) ein abgeschlossener Teilraum von H m,p (Ω), also ◦ selber wieder ein Banach-Raum. Im Allgemeinen ist Hm,p (Ω) 6= H m,p (Ω). Zur Illustration werden wird nun zeigen, dass für I = (0, 1) ⊂ R die beiden ◦ Räume H m,p (I) und Hm,p (I) nicht identisch sind: Dazu betrachten wir eine Funktion ϕ ∈ Cc∞ (I). Es gilt Z x ϕ ϕ0 (t) dt ϕ(x) − ϕ(0) = 16 0 mit ϕ(0) = 0. Also ist |ϕ(x)| ≤ Z 0 1 0 I |ϕ|dµ ≤ 1 0 |ϕ (t)| dt ϕ0 16 und somit auch Z -t Z I |ϕ0 |dµ. 0 -t 1 Es bezeichne 1 die konstante Funktion 1(x) = 1. Es ist 1 ≤ |ϕ(x)| + |1 − ϕ(x)|. Integrieren wir nun über das Intervall I, so erhalten wir Z Z Z Z 1 ≤ |ϕ|dµ + |1 − ϕ|dµ ≤ |ϕ0 |dµ + |(1 − ϕ)|dµ I I I ZI Z = |(1 − ϕ)0 |dµ + |(1 − ϕ)|dµ. I I Aus der letzten Gleichung schliessen wir, dass |1 − ϕ|1,1 ≥ 1 ∀ ϕ ∈ Cc∞ (I), in Worten: 1 ∈ H 1,1 (I) kann nicht durch eine Folge ϕn ∈ Cc∞ (I) angenähert werden, ◦ also liegt 1 nicht in H1,1 (I). ◦ Satz 5.4. Es gilt Hm,p (Rn ) = H m,p (Rn ). Beweis. Wir schreiben zur Abkürzung Rn =: Ω. Wir müssen für den Beweis zeigen, dass Cc∞ (Ω) in H m,p (Ω) dicht liegt. Wir spalten den Beweis in zwei Teile auf: zuerst zeigen wir, dass C ∞ (Ω) ∩ H m,p (Ω) dicht in H m,p (Ω) liegt, und dann nähern wir u ∈ C ∞ (Ω) ∩ H m,p (Ω) durch Cc∞ (Ω) in H m,p (Ω) an. 1. Schritt: Es sei nun u ∈ H m,p (Ω). Dann ist Dα (ρλ ∗ u) = ρλ ∗ (Dα u) (0 ≤ |α| ≤ m) nach Definition der schwachen Ableitung, da für jedes feste x y 7→ ρλ (x − y) ∈ Cc∞ (Ω). Mit Theorem 5.1 folgt dann, dass ρλ ∗ u ∈ C ∞ (Ω) ∩ Lp (Ω). 56 5 SOBOLEV-RÄUME Es gilt weiter |Dα (ρλ ∗ u)|Lp (Ω) ≤ |Dα u|Lp (Ω) und λ→0 |Dα (u − ρλ ∗ u)|Lp (Ω) = |Dα u − ρλ ∗ (Dα u)|Lp (Ω) −−−→ 0 ∀ 0 ≤ |α| ≤ m. Wir haben nun also gezeigt, dass ρλ ∗ u ∈ C ∞ (Ω) ∩ H m,p (Ω) und λ→0 |u − ρλ ∗ u|m,p −−−→ 0. 2.Schritt: Wir nehmen die “Abschneidefunktion“ η ∈ Cc∞ (Ω), so dass η(x) = 1 für alle x mit |x| ≤ 1 und η(x) = 0, falls |x| ≥ 2. Nun definieren wir die Funktionenfolge x uj (x) := η u(x) ∈ Cc∞ (Ω). j Nach Leibnitz folgt nun, dass für 0 ≤ |α| ≤ m gilt X |Dα uj (x)| ≤ cα |Dβ u(x)|. 0≤|β|≤m Demnach ist Dα uj ∈ Lp (Ω) und somit ist Z Z |Dα (u − uj )|p dµ |Dα (u − uj )|p dµ = |x|≥j Ω Z p ≤2 (|Dα u|p + |Dα uj |p ) dµ |x|≥j X Z j→∞ ≤K |Dα u|p dµ −−−→ 0 0≤|α|≤m |x|≥j nach dem Lebesgue’schen Monotonie-Satz, denn es ist |D α u|p ∈ L1 (Ω). Dies gilt für alle 0 ≤ |α| ≤ m, also ist |u − uj |m,p → 0 j → ∞. Ein Element u ∈ W m,p (Rn ) ist eine Äquivalenzklasse von Lp -Funktionen mit den von uns geforderten zusätzlichen Eigenschaften. Nun stellt sich die Frage: können wir noch mehr haben? Gibt es einen Repräsentanten jeder Klasse, der stetig, differenzierbar oder beschränkt ist? Theorem 5.4 (Morrey-Sobolev). Falls p > n, so hat jedes u ∈ W 1,p (Rn ) einen stetigen und beschränkten Repräsentanten, den wir wiederum mit u bezeichnen. Man schreibt in diesem Sinne W 1,p (Rn ) ⊂ Cb (Rn ). Es gibt, genauer gesagt, eine Konstante M > 0, so dass für jedes u ∈ W 1,p (Rn ) ein Repräsentant existiert mit i) ii) n |u(x) − u(y)| ≤ M |x − y|1− p |u(x)| ≤ M kukLp(Rn ) + n X j=1 n X j=1 kDj ukLp(Rn ) ; kDj ukLp (Rn ) ! = M |u|1,p . für alle x, y ∈ Rn . Es ist M = 4(1 − n/p)−1 und der Exponent 1 − n/p liegt nach Voraussetzung im offenen Intervall (0, 1). 57 5 SOBOLEV-RÄUME Beweis. Wir benutzen die zweite Definition von W 1,p (Rn ). Zuerst werden wir den Satz für eine Funktion u ∈ C ∞ (Rn ) ∩ W 1,p (Rn ) zeigen. Es sei u ∈ C ∞ (Rn ) und Il ⊂ Rn ein achsenparalleler Würfel mit Kantenlänge l. Wir definieren den Mittelwert von u in Il mittels Z 1 [u]Il := u(x) dx, |Il | = vol(Il ) = ln . |Il | Il Zu i): es seien x, y ∈ Rn . Wir wählen einen Würfel Il ⊂ Rn , der x und y enthält. Mit dem nachfolgenden Lemma von Morrey ergibt sich dann |u(x) − u(y)| ≤ |u(x) − [u]Il | + [u]Il − u(y) n X 1− n p kDj ukLp (Rn ) . ≤ 2cl j=1 Wählen wir speziell einen Würfel mit l = 2|x − y| für die Kantenlänge, so folgt die Aussage i) mit M = 4c. Zu ii): Wählen wir l = 1 und x ∈ I1 , so ist vol(I1 ) = 1 und |u(x)| ≤ |[u]I1 − u(x)| + |[u]I1 |. Der zweite Term auf der rechten Seite lässt sich durch die Hölder’sche Ungleichung abschätzen: Es ist dann p1 Z Z Z p [u]I1 ≤ |u| dx χI1 |u| dx ≤ ≤ kukLp(Rn ) . |u| dx = I1 I1 I1 Mit dem Lemma folgt dann ii). Nun kommen wir zu u ∈ W 1,p (Rn ). Wir approximieren mit dem Satz 5.4 oder Meyers-Serrin die Funktion u durch eine Folge uj , so dass uj ∈ C ∞ (Rn ) ∩ W 1,p (Rn ), uj → u in W 1,p (Rn ). Aus der Ungleichung ii) für die uj , j ≥ 1, folgt dann, dass uj eine Cauchy-Folge in Cb (Rn ), der Menge der stetigen und beschränkten Funktionen auf Rn , ist. Weil nun Cb (Rn ) mit der Supremums-Norm vollständig ist, existiert ein ũ ∈ Cb (Rn ) mit uj → ũ in Cb (Rn ). Die Konvergenz ist gleichmässig, also auch punktweise. Es folgt nun, dass i) und ii) gelten, wobei links an Stelle von u nun ũ steht. Auf der rechten Seite steht immer noch u. Weil die Folge uj in Lp (Rn ) gegen u konvergiert existiert eine Teilfolge ujk , so dass lim ujk (x) = u(x) k→∞ für fast jedes feste x ∈ Rn . Weil nun auch lim ujk (x) = ũ(x) k→∞ für alle x ∈ Rn , ist ũ = u fast überall auf Rn , also ist ũ der von uns gesuchte Repräsentant. Nun zum erwähnten Lemma: Lemma 5.4 (Morrey). Es sei p > n. Dann gilt für c = (1 − n/p)−1 : n X [u]Il − u(x) ≤ cl(1−n/p) kDj ukLp (Il ) j=1 n für alle l, alle x ∈ Il , alle Würfel Il ⊂ R der Kantenlänge l und alle u ∈ C ∞ (Rn ). 58 5 SOBOLEV-RÄUME Beweis. Es genügt wegen der Translationsinvarianz, das Lemma für x = 0 zu beweisen. Es sei also u ∈ C ∞ (Rn ). Es ist nach Definition dann Z 1 u(x) − u(0) dx. [u]Il − u(0) = |Il | Il Für x ∈ Il ist Z Z n 1 d 1X |u(x) − u(0)| = Dj u(tx) xj dt u(tx) dt = 0 dt 0 j=1 Z 1X n |Dj u(tx)| dt, ≤l 0 j=1 wobei wir benutzt haben, dass |xj | ≤ l ist. Setzen wir die beiden Formeln zusammen, so erhalten wir Z 1 X n Z [u]I − u(x) ≤ l |Dj u(tx)| dx dt l |Il | 0 j=1 Il und mit der Substitution y = tx wird die rechte Seite Z 1 X n Z l dy = |Dj u(y)| n . dt |Il | 0 t j=1 t Il Mit der Hölder’schen Ungleichung können wir das Integral über y abschätzen: Es ist Z q1 Z p1 Z Z p |Dj u| dµ = χt Il |Dj u| dµ ≤ χt Il dµ |Dj u| dµ t Il tIl ≤ vol(t Il )1/q Z t Il Il |Dj u|p dµ p1 t Il für 1/p + 1/q = 1. Zusammen erhalten wir nun also n n/q Z 1 X −n(1−1/q) [u]Il − u(x) ≤ l l kDj ukLp(Il ) . t dt ln |0 {z } j=1 (∗) Das mit (∗) bezeichnete Integral ist endlich, denn mit p > n ist auch das Integral R 1 −n/p t dt endlich. Wir erhalten schliesslich 0 n 1−n/p X [u]I − u(x) ≤ l kDj ukLp(Il ) , l 1 − n/p j=1 was zu beweisen war. Definition 5.7. (C m,β (Ω)) Es sei m ≥ 0 eine ganze Zahl, 0 < β < 1 und Ω ⊂ Rn offen. Dann sei C m,β (Ω) := {u ∈ C m (Ω)|u|m,β < ∞}, wobei | |m,β definiert ist durch |u|m,β := β sup x∈Ω 0≤|α|≤m Wir schreiben auch C für C |Dα u(x) − Dα u(y)| . |x − y|β |α|=m |Dα u(x)| + sup 0,β x6=y . 59 5 SOBOLEV-RÄUME Theorem 5.4 (umformuliert). Sei p > n, β = 1 − n/p. Dann ist W 1,p (Rn ) ,→ C β (Rn ) stetig eingebettet, das heisst, es gibt eine Konstante M ≥ 0, so dass jedes Element u ∈ W 1,p (Rn ) einen Repräsentanten in C β (Rn ) hat mit |u|C β (Rn ) ≤ M kukW 1,p (Rn ) . Genau gleich beweist man für eine offene Teilmenge Ω ⊂ Rn , m ≥ 1, β = 1−n/p und p > n ◦ Hm,p (Ω) ,→ C m−1,β (Ω̄) stetig eingebettet ist. Hierzu wendet man das Lemma von Morrey auf eine Funktion u ∈ Cc∞ (Ω) und auf Dα u, 0 ≤ |α| ≤ m, an und benutzt, dass ◦ Cc∞ (Ω) = Hm,p (Ω). Es folgt somit, dass \ ◦ Hm,p (Ω) = C ∞ (Ω̄) m≥1 für Ω ⊂ Rn offen. Theorem 5.5 (Sobolev-Einbettungstheorem). Es sei Ω ⊂ Rn offen, m ≥ 1 eine ganze Zahl und p ≥ 1. Wir nehmen an, dass m − n/p = k + β für eine ganze Zahl k ≥ 0 und 0 < β < 1. Dann ist ◦ Hm,p (Ω) ,→ C k,β (Ω̄) stetig eingebettet. Beweis. Es wird auf die schon erwähnten Bücher von H. Brezis oder H. W. Alt verwiesen. Folgerung: Für Ω ⊂ Rn und p ≥ 1 ist \ ◦ Hm,p (Ω) = C ∞ (Ω̄). m≥1 5.3 Dirichlet-Problem und schwache Lösung ◦ Die Räume H m,p (Ω) und Hm,p (Ω) sind für p = 2 ausgezeichnete Räume: es sind Hilbert-Räume, versehen mit dem Skalarprodukt X (u, v) = (Dα u, Dα v)L2 (Ω) u, v ∈ H m,p (Ω) 0≤|α|≤m mit (f, g)L2 (Ω) = Z f ḡ dµ Ω f, g ∈ L2 (Ω). Es sei Ω ⊂ Rn offen und beschränkt. Wir betrachten das Dirichlet-Randwertproblem: gegeben sei f : Ω → R, und gesucht ist u : Ω̄ → R, so dass −∆u(x) = f (x) x ∈ Ω , (5.3) u(x) = 0 x ∈ ∂Ω wobei ∆ den Laplace-Operator ∆u = Pn ∂2u j=1 ∂x2j bezeichnet. 60 5 SOBOLEV-RÄUME Es sei u ∈ C 2 (Ω) ∩ C(Ω̄) eine klassische Lösung von (5.3) für f ∈ C(Ω̄), das heisst, (5.3) gilt punktweise. Wir nehmen nun an, dass ∇u ∈ L2 (Ω). Dann folgt aus Z Z − ∆u ϕ dµ = f ϕ dµ ϕ ∈ Cc∞ (Ω) Ω Ω mittels partieller Integration (weil die Randterme verschwinden): Z Z X n ∂u ∂ϕ f ϕ dµ ϕ ∈ Cc∞ (Ω). dµ = Ω Ω j=1 ∂xj ∂xj Anders geschrieben, es ist Z Z h∇u, ∇ϕi dµ = f ϕ dµ Ω Weil nun Cc∞ (Ω) ◦ ϕ ∈ Cc∞ (Ω). Ω 1,2 in H (Ω) dicht liegt, folgt Z Z f v dµ h∇u, ∇vi dµ = ◦ v ∈ H1,2 (Ω). Ω Ω Somit haben wir folgenden Begriff motiviert: Definition 5.8. (schwache Lösung) ◦ Eine Funktion u ∈ H1,2 (Ω) heisst eine schwache Lösung des Dirichlet-Randwertproblems für ein gegebenes f ∈ L2 (Ω), falls Z Z f v dµ h∇u, ∇vi dµ = Ω Ω ◦ 1,2 für alle v ∈ H (Ω). Bemerkung: Falls u ∈ Cc∞ (Ω), so ist u = 0 auf ∂Ω. Deshalb sagt man, dass ◦ u ∈ H1,2 (Ω) verallgemeinerte Nullrandwerte auf ∂Ω hat. Man kann tatsächlich zeigen (siehe H. Brezis, s. 171): für ∂Ω aus der Klasse C 1 und für u ∈ H 1,2 (Ω) ∩ C(Ω̄) gilt ◦ u = 0 auf ∂Ω ⇐⇒ u ∈ H1,2 (Ω). Im Folgenden seien alle beteiligten Räume reell, auch wenn dies nicht explizit erwähnt wird. Es gilt nun, die Existenz und Eindeutigkeit der schwachen Lösungen des Dirichlet-Randwertproblems zu zeigen. ◦ Zuvor definieren wir noch ein Skalarprodukt auf H1,2 (Ω) durch Z Z ◦ u, v ∈ H1,2 (Ω). u v dµ + h∇u, ∇vi dµ (u, v)H := Ω Ω ◦ 1,2 Lemma 5.5. Es sei u, v ∈ H (Ω). Dann definiert Z a(u, v) := h∇u, ∇vi dµ Ω ◦ ein zu (u, v)H äquivalentes Skalarprodukt auf dem Hilbert-Raum H1,2 (Ω), das heisst, es gilt mit der Notation dass es ein C > 0 gibt, so dass (u, v)∗ := a(u, v), p kuk∗ = (u, u)∗ , 1 ≤ kuk∗ ≤ Ckuk ◦1,2 kuk ◦1,2 H (Ω) H (Ω) C ◦ für alle u ∈ H1,2 (Ω) für offenes und beschränktes Ω. 61 5 SOBOLEV-RÄUME Das Lemma 5.5 folgt sofort aus Lemma 5.6 (Poincaré-Ungleichung). Es sei Ω ⊂ Rn offen und in einer Richtung, ohne Beschränkung der Allgemeinheit in x1 -Richtung, beschränkt, also Ω ⊂ {x = (x1 , . . . , xn ) ∈ Rn |x1 | ≤ d}. Dann ist X kDα uk2L2 (Ω) kuk2L2 (Ω) ≤ (2d)2 |α|=1 beziehungsweise Z Ω |u|2 dµ ≤ (2d)2 Z Ω |∇u|2 dµ ◦ für alle u ∈ H1,2 (Ω). Beweis. Es genügt, die Ungleichung für u ∈ Cc∞ (Ω) zu zeigen, da Cc∞ (Ω) dicht in ◦ H1,2 (Ω) liegt. Mit dem Satz von Fubini und partieller Integration in x1 – wobei die Randterme verschwinden, da u kompakten Träger in Ω hat – folgt Z Z Z ∂ x1 1 |u|2 dµ = − |u|2 dµ = kuk2L2(Ω) = |u|2 dµ ∂x 1 Ω Ω Z ZΩ ∂ ∂ = −2 x1 u, u dµ ≤ 2d u dµ |u| ∂x1 ∂x1 Ω Ω ∂ ≤ 2dkukL2(Ω) ∂x1 u 2 . L (Ω) Die letzte Ungleichung folgt mit der Hölder’schen Ungleichung. Dividieren wir obiges Resultat durch kukL2(Ω) und quadrieren anschliessend, so erhalten wir kuk2L2 (Ω) ∂ 2 u ≤ (2d) ∂x1 2 2 L (Ω) n X ∂ 2 ≤ (2d) ∂xj u 2 2 j=1 . L (Ω) Nun kommen wir zu dem vorher angekündigten Theorem: Theorem 5.6 (Dirichlet, Riemann, Hilbert). Es sei Ω ⊂ Rn eine offene und beschränkte Teilmenge, f ∈ L2 (Ω). Dann gibt es genau eine schwache Lösung ◦ u ∈ H1,2 (Ω) des Dirichlet-Problems. Diese Lösung ist überdies die eindeutige Lösung des Variationsproblems Z Z 1 2 min |∇v| dµ − f v dµ . ◦ 2 Ω Ω v∈H1,2 (Ω) Beweis. Wir verwenden hierzu das obige Lemma 5.5 und den Darstellungssatz von Riesz, wobei wir den Beweis in drei Schritte zerlegen. ◦ 1. Schritt: In Lemma 5.5 haben wir bereits bewiesen, dass H1,2 (Ω) mit dem Skalarprodukt (·, ·)∗ ein Hilbert-Raum ist, den wir im Folgenden H∗ nennen wollen. 2. Schritt: Wir wenden den Darstellungssatz von Riesz an: Dazu definieren wir Z ◦ ϕ(u) := f u dµ u ∈ H1,2 (Ω). Ω Somit liegt ϕ im Dualraum H∗0 , denn nach Lemma 5.5 ist |ϕ(u)| ≤ |f |L2 (Ω) |u|L2 (Ω) ≤ |f |L2 (Ω) kuk∗, 62 5 SOBOLEV-RÄUME das heisst, ϕ : H∗ → R ist stetig und linear. Nach dem Riesz’schen Darstellungssatz existiert genau ein u0 ∈ H∗ , so dass (u, u0 )∗ = ϕ(u) ∀ u ∈ H∗ . Dies ist nach Definition des Skalarproduktes in H∗ gerade äquivalent dazu, dass ◦ u0 ∈ H1,2 (Ω) die schwache Lösung des Dirichlet-Problemes ist. 3. Schritt: Das Variationsproblem. Wir definieren das zu minimierende Funk◦ tional F : H1,2 (Ω) → R durch Z Z 1 1 f u dµ = kuk2∗ − ϕ(u) |∇u|2 dµ − F (u) := 2 Ω 2 Ω ◦ ◦ für alle u ∈ H1,2 (Ω). Es sei nun u0 ∈ H1,2 (Ω) die eindeutige Lösung des Dirichlet◦ Problemes aus Schritt 2, das heisst, (u, u0 )∗ = ϕ(u) für alle u ∈ H1,2 (Ω). Dann können wir nachrechnen: F (u) − F (u0 ) = 1 ku − u0 k2∗ > 0, 2 u 6= u0 . Das heisst, es ist min ◦ F (u) = F (u0 ), u∈H1,2 (Ω) also gibt es genau ein Minimum, nämlich u0 . Nun haben wir zwar die Existenz und Eindeutigkeit der schwachen Lösung des Dirichlet-Problems gefunden, aber es stellen sich hier die folgenden Fragen: 1. Wie finden wir die (eindeutige) schwache Lösung? Wir werden dazu die Antwort später geben können (mittels einer minimierenden Folge des Variationsfunktionals). 2. Wann ist die schwache Lösung auch eine klassische Lösung? Die Antwort dazu liefern die Regularitätstheorie und elliptische partielle Differentialgleichungen (siehe zum Beispiel H. Brezis, H. W. Alt). Ohne dies zu beweisen: Nehmen wir in Theorem 5.6 zusätzlich an, dass ∂Ω ◦ aus der Klasse C ∞ (glatt) und f ∈ C ∞ (Ω̄) ist, so ist u0 ∈ H1,2 (Ω) ∩ C ∞ (Ω̄) und damit eine klassische Lösung. 63 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 6 Reflexive Räume und schwache Konvergenz 6.1 Separable Räume Definition 6.1. (separabler Raum) Ein metrischer Raum (M, d) heisst separabel, falls es eine abzählbare und dichte Teilmenge D ⊂ M gibt. Satz 6.1. Jede Teilmenge A ⊂ M eines separablen Raumes ist separabel. Beweis. Ist M separabel, so existiert eine abzählbare Menge D = {x1 , x2 , . . .} ⊂ M mit D̄ = M . Es sei nun A ⊂ M , dann gibt es zu jedem k ≥ 1 und n ≥ 1 ein akn ∈ A so, dass 1 d(xk , akn ) < d(xk , A) + , n nach Definition der Distanzfunktion d. Wir wollen nun zeigen, dass die Teilmenge DA := {akn }k,n≥1 ⊂ A dicht in A liegt, also dass D̄A = A. Dazu seien a ∈ A und ε > 0 gegeben. Weil D̄ = M , so gibt es ein xk ∈ D derart, dass d(xk , a) < ε. Wir wählen nun n so, dass n1 < ε. Dann gilt nach dem oben Gesagten für das zugehörige akn : d(a, akn ) ≤ d(a, xk ) + d(xk , akn ) < ε + d(xk , A) + ≤ ε + d(xk , a) + 1 n 1 ≤ 3ε. n Da ε > 0 beliebig war, folgt die Behauptung. Zur Illustration geben wir hier noch einige Beispiele: 1. Rn ist separabel, denn die rationalen Zahlen liegen dicht in R. Daraus folgt: jeder endlich-dimensionale metrische Raum ist separabel. 2. Die Räume `p sind separabel, falls 1 ≤ p < ∞. Der Raum `∞ hingegen ist nicht separabel. Beweis. Zuerst beweisen wir, dass `p , 1 ≤ p < ∞ separabel ist: Nach Definition ist X n o lp := x = (xj )j |xj |p < ∞ . j≥1 Wir betrachten die Mengen DN := {a ∈ `p |a = (aj ), aj rational, aj = 0 j ≥ N + 1}. und bezeichnen mit D die abzählbare Vereinigung all dieser Mengen DN : [ D= DN . N ≥1 D ist eine abzählbare Menge und wir behaupten, es gelte D̄ = `p . Es sei x = (xj ) ∈ `p und ε > 0 vorgegeben. Wir suchen ein a ∈ D so, dass d(a, x) < ε. Dazu wählen wir N so gross, dass X |xj |p < ε. j≥N +1 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 64 Dann wählen wir ein a ∈ DN so, dass N X j=1 |xj − aj |p < ε. Zusammen erhalten wir also ∞ X j=1 |xj − aj |p = N X j=1 |xj − aj |p + X j≥N +1 |xj |p < 2ε. Es ist also d(a, x) < 2ε. 2 Nun zu l∞ . Es sei x = (xj ) mit kxk∞ = supj≥1 |xj |. Wir nehmen eine abzählbare Folge x(n) ∈ l∞ , also eine Folge von Folgen (n) x(n) = xj , n = 1, 2, . . . Jetzt definieren wir eine neue Folge y = (yj )j durch ( (j) 1 falls xj ≤ 0 yj = . (j) −1 falls xj > 0 Dann ist nach Konstruktion y ∈ l∞ mit kyk∞ = 1 und es gilt: ky − x(n) k∞ ≥ |yn − x(n) n | ≥1 ∀ n = 1, 2, . . . Die Folge x(n) ist somit nicht dicht in `∞ . Dies gilt für jede Folge (x(n) )n , daher ist l∞ nicht separabel. 3. C[0, 1] mit der Supremums-Norm ist separabel, denn die Menge der Polynome mit rationalen Koeffizienten liegt dicht in C[0, 1], nach dem Satz von Weierstrass. 4. Der Raum Cb (0, 1) der beschränkten, stetigen Funktionen auf (0, 1) mit der Supremums-Norm ist nicht separabel. 5. Jeder kompakte metrische Raum ist separabel. 6. Die Räume Lp (Ω), 1 ≤ p < ∞ sind separabel, L∞ (Ω) hingegen nicht. Zum Beweis benutzt man, dass Cc (Ω) dicht in Lp (Ω) liegt sowie den Satz von Weierstrass. 6.2 Reflexive Räume In diesem Abschnitt betrachten wir eine wichtige Klasse von Banach-Räumen. Es sei X ein normierter Raum, so ist sein Dualraum X 0 definiert durch X 0 ≡ X ∗ = L(X, C) mit der Norm kf k = sup |f (x)|, kxk≤1 f ∈ X ∗. Wie wir bereits wissen ist X ∗ ein Banach-Raum. Wiederholen wir die Konstruktion, so erhalten wir den Bi-Dualraum (X ∗ )∗ := X ∗∗ . 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 65 Definition 6.2. (kanonische Einbettung) Die kanonische Einbettung X → X ∗∗ , I : X −→ (X ∗ )∗ x 7−→ I(x) ∈ L(X ∗ , C) ist definiert durch I(x) (f ) = f (x), f ∈ X ∗ = L(X, C). Satz 6.2. Die kanonische Einbettung I : X → X ∗∗ ist linear und isometrisch. Beweis. Nach Konstruktion ist I linear, da f ∈ L(X, C) linear ist. Mit dem Satz 4.5 (Hahn-Banach) folgt: kI(x)k = sup |I(x) (f )| = sup |f (x)| = kxk. f ∈X ∗ kf k≤1 f ∈X ∗ kf k≤1 Es kann vorkommen, dass I(X) 6= X ∗∗ , das heisst, das Bild dieser linearen Isometrie I(X) ⊂ X ∗∗ braucht nicht der ganze Raum zu sein. Definition 6.3. (reflexiver Raum) Ein Banach-Raum heisst reflexiv, falls die kanonische Einbettung I : X → X ∗∗ surjektiv ist, das heisst, wenn gilt I(X) = X ∗∗ . Achtung: Diese Definition bezieht sich immer auf die kanonische Einbettung, nicht irgend eine beliebige surjektive Einbettung X → X ∗∗ ! Satz 6.3. Ein Hilbert-Raum H ist immer reflexiv. Beweis. Nach dem Satz von Riesz gibt es eine konjugiert lineare Isometrie von H auf H ∗ , definiert durch ϕ : H −→ H ∗ y 7−→ ϕ(y) mit ϕ(y) (x) = (x, y) für alle x ∈ H und mit kϕ(y)k = kyk für alle y ∈ H. Für die kanonische Isometrie I : H → H ∗∗ gilt I(x) ϕ(y) = ϕ(y) (x) = (x, y) für alle ϕ(y) ∈ H ∗ . Wir betrachten für α ∈ (H ∗ )∗ die Komposition y 7→ α(ϕ(y)) ∈ H ∗ . Es existiert nach Riesz ein x0 ∈ H, so dass für alle y ∈ H gilt α(ϕ(y)) = (x0 , y) = ϕ(y) (x0 ) = I(x0 ) ϕ(y) . Weil ϕ auf H ∗ surjektiv ist, gilt α(f ) = I(x0 ) (f ) für alle f ∈ H ∗ , also α = I(x0 ). Es folgen nun zwei nützliche Struktursätze: Satz 6.4. Es sei X ein Banach-Raum. Dann gilt: i) X ist reflexiv ⇒ jeder abgeschlossene Teilraum von X ist reflexiv. ii) X ist reflexiv ⇐⇒ X ∗ ist reflexiv. 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 66 Beweis. Übungsaufgabe (Hinweis: Fortsetzungssatz von Hahn-Banach). Satz 6.5. Sei X ein Banach-Raum. Dann gelten folgende Aussagen: i) Ist X ∗ separabel, dann ist auch X separabel. ii) Ist X separabel und reflexiv, so ist X ∗ separabel. Beweis. i) Ist X ∗ separabel, dann existiert eine in X ∗ dichte und abzählbare Teilmenge D∗ = {f1 , f2 , . . .}. Nach Definition der Norm im Raum X ∗ gibt es zu jedem j ein xj ∈ X mit kxj k ≤ 1 und 1 kfj k ≤ |fj (xj )|, 2 j ∈ N. Wir bezeichnen mit D die Menge aller (endlichen) Linearkombinationen von (xj ) mit rationalen Koeffizienten. D ist somit abzählbar. Wir wollen nun zeigen, dass D dicht in X liegt. Es sei also x ∈ X. Zu zeigen ist, dass x ∈ D̄ liegt. Nach Satz 4.4 genügt es zu zeigen, dass f (x) = 0 für alle f ∈ D⊥ . Daher sei nun f ∈ D⊥ und ε > 0 beliebig. Weil D∗ in X ∗ dicht liegt, existiert eine Funktion fn ∈ D∗ mit kf − fn k < ε. Nach unserer Definition von D (und weil f ∈ D ⊥ ) ist daher 1 kfn k ≤ |fn (xn )| = |fn (xn ) − f (xn ) | ≤ kfn − f k kxn k ≤ kfn − f k < ε. | {z } 2 =0 Also ist kfn k < 2ε und mit der Dreiecksungleichung folgt dann kf k ≤ kfn − f k + kfn k < 3ε ∀ ε > 0. Also ist kf k = 0 und damit ist f = 0 in X ∗ , mit anderen Worten, es ist f (x) = 0 für alle x aus X. ii) folgt direkt aus i): Da X separabel und reflexiv ist, ist I(X) = (X ∗ )∗ separabel, denn I ist eine Isometrie auf (X ∗ )∗ . Es folgt aus i), dass X ∗ separabel ist. 6.3 Beispiele von Dualräumen Als erstes betrachten wir die Folgenräume `p , zuallererst den Raum `1 . Es sei y = (yj ) ∈ `∞ , kyk∞ = supj≥1 |yj | < ∞. Wir ordnen dieser Folge y ein Funktional ϕ(y) aus `∗1 zu mittels X ϕ(y) (x) = y j xj ∀ x = (xj ) ∈ `1 . j≥1 Wir behaupten, es sei ϕ(y) ∈ `∗1 und kϕ(y)k`∗1 ≤ kyk∞ . Es gilt für alle x ∈ `1 : kϕ(y) (x)k ≤ X j≥1 |yj | |xj | ≤ sup |yj | j≥1 X j≥1 |xj | = kyk∞ kxk`1 . Daher ist kϕ(y)k`∗1 ≤ kyk∞ . Es gilt sogar: Mit dieser einfachen Konstruktion haben wir schon alle Funktionen f ∈ `∗1 gefunden! 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 67 Satz 6.6. Die oben konstruierte Funktion ϕ : `∞ → `∗1 ist eine surjektive Isometrie, das heisst, es ist kϕ(y)k`∗1 = kyk∞ ∀ y ∈ `∞ . Zusatz: Der Raum `1 ist nicht reflexiv. Beweis. Es seien f ∈ `∗1 = L(`1 , C), x eine Folge (xj ) = (x1 , x2 , . . .) ∈ `1 und ei = (0, . . . , 0, 1, 0, . . .) der i-te Einheitsvektor in `1 . Dann ist x = lim N →∞ = X N X xj e j in `1 j=1 xj e j in `1 . j≥1 Weil f linear und stetig ist, folgt f (x) = lim f N →∞ N X xj e j j=1 ! = lim N →∞ N X xj f (ej ). j=1 Wir definieren die Zahlenfolge y = (yj ) durch yj = f (ej ) und zeigen, dass y ∈ `∞ und kyk∞ ≤ kf k: Es gilt nämlich |yj | = |f (ej )| ≤ kf k kej k`1 ≤ kf k ∀ j ≥ 1. Also ist kyk∞ = sup |yj | ≤ kf k j≥1 und es folgt somit f (x) = lim N →∞ N X xj y j = j=1 X ∀ x ∈ `1 . xj yj = ϕ(y) (x) j≥1 Daher ist f = ϕ(y). Weil kyk∞ ≤ kϕ(y)k ist und nach Vorbemerkung kϕ(y)k ≤ kyk∞ ist, folgt kϕ(y)k = kyk∞ . Daher ist ϕ : `∞ → `∗1 eine surjektive Isometrie. Und nun zum Zusatz: Wir nehmen an, dass `1 reflexiv ist. Weil `1 separabel ist, folgt mit Satz 6.5, dass `∗1 separabel ist. Nun ist `∗1 isometrisch isomorph zu `∞ , also ist auch `∞ separabel. Dies ist jedoch falsch, demnach ist `1 nicht reflexiv. Nun kommen wir zu `p für p > 1. Es sei q ∈ R so, dass das Funktional 1 p + 1q = 1. Wir definieren ϕ : `q −→ `∗p y 7−→ ϕ(y) durch ϕ(y) (x) = X j≥1 xj y j ∀ x = (xj ) ∈ `p . Die Funktion ϕ(y) liegt in `∗p , und mit der Hölder’schen Ungleichung folgt ⇒ |ϕ(y) (x)| ≤ kxkp kykq kϕ(y)k ≤ kykq . Wieder haben wir schon alle stetigen Funktionale auf `p gefunden. 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 68 Satz 6.7. Es sei 1 < p < ∞ und p1 + 1q = 1. Dann ist ϕ : `q → `∗p eine surjektive Isometrie, das heisst, es ist kϕ(y)k`∗p = kyk`q . Für f ∈ `∗p gibt es eine Darstellung der Form X f (x) = ϕ(y) (x) = xj y j x = (xj ) ∈ `p j≥1 für ein eindeutiges y = (yj ) ∈ `q . Zusatz: `p ist reflexiv für 1 < p < ∞. Beweis. Wir werden nur den Zusatz beweisen: dazu müssen wir zeigen, dass I : `p → (`∗p )∗ surjektiv ist. Nach Satz 6.7 existieren zwei surjektive Isometrien ϕ : `q −→ `∗p , ψ : `p −→ `∗q . Es sei nun α ∈ (`∗p )∗ . Dann ist y 7→ α ϕ(y) ∈ `∗q . Daher existiert nach Satz 6.7 ein x ∈ `p so, dass für alle y ∈ `q gilt X α ϕ(y) = ψ(y) (x) = yj xj = ϕ(x) (y) = I(x) ϕ(y) . j≥1 Da ϕ : `q → `∗p surjektiv ist, gilt α(f ) = I(x) (f ) für alle f ∈ `∗p , also ist α = I(x). Als nächstes betrachten wir die Räume Lp (Ω) für ein offenes Ω ⊂ Rn . Bei genauerer Betrachtung fällt auf, dass das nachfolgende Theorem, der Darstellungssatz von Riesz, gerade den Aussagen der Sätze 6.6 und 6.7 entspricht, nur diesmal für Lp (Ω) an Stelle von `p . Wir beginnen wieder mit p = 1: Wir definieren das Funktional ϕ : L∞ (Ω) −→ L1 (Ω)∗ y 7−→ ϕ(y) durch ϕ(y) (x) = Z x ∈ L1 (Ω). xy dµ Ω Das Funktional ϕ(y) liegt in L1 (Ω)∗ , denn es gilt Z |x| dµ = kyk∞ kxkL1 (Ω) , |ϕ(y) (x)| ≤ kyk∞ Ω also ist kϕ(y)k ≤ kyk∞ . Es seien nun p, q ∈ R so, dass p > 1 und das Funktional 1 p + 1 q = 1. Wieder konstruieren wir ϕ : Lq (Ω) −→ Lp (Ω)∗ y 7−→ ϕ(y) durch ϕ(y) (x) = Z xy dµ Ω x ∈ Lp (Ω). Wegen der Hölder’schen Ungleichung ist ϕ(y) ∈ Lp (Ω)∗ , denn es gilt |ϕ(y) (x)| ≤ kxkLp(Ω) kykLq (Ω) . Wiederum haben wir so alle stetigen Funktionen gefunden: 69 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ Theorem 6.1 (Darstellungssatz von Riesz). Mit obigen Definitionen gilt: i) Das Funktional ϕ : L∞ (Ω) → L1 (Ω)∗ ist eine surjektive Isometrie; es gilt L1 (Ω)∗ ∼ = L∞ (Ω). ii) Das Funktional ϕ : Lq (Ω) → Lp (Ω)∗ , p1 + q1 = 1, p > 1, ist eine surjektive Isometrie: Lp (Ω)∗ ∼ = Lq (Ω). Zusatz: Die Räume Lp (Ω) sind für 1 < p < ∞ reflexiv, die Räume L1 (Ω) und L∞ (Ω) sind es nicht. Beweis. Das Theorem zeigt man mittels Integrationstheorie. 6.4 Schwache Konvergenz und Variationsprobleme Es bezeichne X einen normierten Raum und X ∗ = L(X, C). Für eine Funktion f ∈ X ∗ gilt wegen der Stetigkeit: Konvergiert eine Folge (xj ) in X gegen x, so konvergiert f (xj ) mit j → ∞ in C gegen f (x). Die Umkehrung muss aber nicht gelten. Das motiviert folgende Definition: Definition 6.4. (schwach konvergente Folge) Eine Folge xj ∈ X konvergiert schwach gegen x ∈ X, falls gilt lim f (xj ) = f (x) j→∞ für alle f ∈ X ∗ . Wir schreiben dann xj * x. Als Beispiel betrachten wir X = Lp (Ω) mit p > 1 und p1 + xj in X schwach gegen x, so ist Z Z lim xj y dµ = xy dµ ∀ y ∈ Lq (Ω). j→∞ Ω 1 q = 1. Konvergiert Ω Bemerkungen: 1. Der schwache Limes ist eindeutig: xj xj * x * y ⇐⇒ ⇐⇒ f (xj ) f (xj ) → f (x) → f (y) ∀ f ∈ X ∗. Dann ist f (x) = f (y) für alle f ∈ X ∗ , nach Satz 4.2 also x = y. 2. Es gilt xj → x ⇒ xj * x, xj * x ⇒ xj → x, die Umkehrung, also gilt im Allgemeinen hingegen nicht: Es sei X = `p , 1 < p < ∞, p1 + q1 = 1 und X ∗ = `∗q . Wir wählen Folgen (n) x(n) ∈ `p mit xj = (δjn ). Dann ist kx(n) − x(m) kp`p = 2 n 6= m, 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 70 also ist x(n) keine Cauchy-Folge in `p . Es gilt jedoch x(n) * 0 in `p , denn nehmen wir ϕ : `q → `∗p , so ist X (n) yj xj = yn → 0 (n → ∞), ϕ(y) x(n) = j≥1 weil P j≥1 |yj |q < ∞ für alle y ∈ `q . Nun ist ϕ surjektiv, also folgt f (x(n) ) → 0 für alle f ∈ `∗p , mit anderen Worten, es gilt x(n) * 0. Betrachten wir den Dualraum X ∗ einmal etwas genauer, so stellen wir fest, dass es drei Konvergenzbegriffe in X ∗ gibt: i) Norm-Konvergenz: Die übliche“ Form der Konvergenz, wir schreiben ” fj → f in X ∗ . ii) schwache Konvergenz: wie oben definiert: es ist fj * f in X ∗ ⇐⇒ α(fj ) → α(f ) ∀ α ∈ (X ∗ )∗ . iii) schwache-∗-Konvergenz: Wir schreiben ∗ fj * f ⇐⇒ α(fj ) → α(f ) ∀ α ∈ I(X) ⊂ (X ∗ )∗ , wobei I : X → (X ∗ )∗ die kanonische Injektion mit I(x) (f ) := f (x) f ∈ X ∗, x ∈ X bezeichnet Definition 6.5. (schwache-∗-Konvergenz) Es gilt ∗ fj * f in X ∗ ⇐⇒ fj (x) → f (x) ∀x ∈ X, das heisst, f konvergiert punktweise. In der obigen Aufzählung der Konvergenzbegriffe gilt: i) ⇒ ii) ⇒ iii), wobei ii) und iii) äquivalent sind, falls X reflexiv ist, weil dann I(X) = (X ∗ )∗ ist. Theorem 6.2. Die Folge xj konvergiere schwach in X, das heisst, es sei xj * x. Dann gilt i) sup kxj k < ∞, j≥1 ii) kxk ≤ lim inf kxj k. j→∞ Das heisst, schwach konvergente Folgen sind beschränkt und wir können den schwachen Limes abschätzen. Beweis. Nach Voraussetzung ist f (xj ) → f (x) für alle f aus dem Dualraum X ∗ . Für die Folge von linearen Operatoren I(xj ) ∈ L(X ∗ , C), I(xj ) (f ) = f (xj ) gilt daher I(xj ) (f ) → I(x) (f ) ∀ f ∈ X ∗. Weil X ∗ ein Banach-Raum ist, folgt aus den Sätzen 3.1 und 6.2 sup kxj k = sup kI(xj )k < ∞ j≥1 j≥1 und kxk = kI(x)k ≤ lim inf kI(xj )k = lim inf kxj k. j→∞ j→∞ 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 71 Satz 6.8. Folgende Aussagen sind äquivalent: i) Die Folge xj konvergiert in X schwach gegen x: xj * x; ii) Die Folge xj erfüllt (1) sup kxj k < ∞, j≥1 (2) lim f (xj ) = f (x) j→∞ ∀ f ∈ D mit D̄ = X ∗ . Beweis. i) ⇒ ii) entspricht gerade der Aussage von Theorem 6.2. Also müssen wir noch den umgekehrten Weg zeigen. Es sei g ∈ X ∗ gegeben. Es ist zu zeigen, dass limj→∞ g(xj ) = g(x). Dazu nehmen wir ein f ∈ X ∗ , dann ist |g(xj ) − g(x)| ≤ |g(xj ) − f (xj )| + |f (xj ) − f (x)| + |f (x) − g(x)| ≤ kg − f k kxj k + kf − gk kxk + |f (xj ) − f (x)|. Nach Voraussetzung ii) existiert eine Konstante C > 0 so, dass kxj k ≤ C und kxk ≤ C, also ist |g(xj ) − g(x)| ≤ Ckf − gk + |f (xj ) − f (x)| ∀ j ≥ 1. (6.1) es sei ε > 0. Da wir f frei gewählt haben, sei f ∈ D nach (2) so, dass der erste Term der Gleichung (6.1) < ε/2. Nun wählen wir für dieses f ein j0 (ε), so dass der zweite Term in (6.1) < ε/2 für alle j > j0 . Damit folgt die Behauptung. Bisher haben wir zwar mit dem Begriff der schwachen Konvergenz gearbeitet, doch: was bedeutet schwache Konvergenz in den spezifischen Räumen? Um diese Frage zu beantworten brauchen wir die Darstellungssätze. Wir werden einen solchen für X = `p für p > 1 beweisen. Wie gewohnt schreiben wir (n) x(n) = xj j ∈ `p , x = (xj )j ∈ `p für eine Folge (x(n) ) von Elementen (also Folgen) in `p beziehungsweise für ein Element x in `p . Satz 6.9. Es ist x(n) eine in `p schwach gegen x konvergierende Folge (p > 1) genau dann, wenn (1) sup kx(n) k < ∞, n≥1 (2) (n) n→∞ xj −→ xj ∀ j, das heisst, x(n) konvergiert koordinatenweise. Beweis. Zuerst beweisen wir ⇒. (1) folgt sofort aus Theorem 6.2. Für (2) definieren wir eine Folge fj ∈ `∗p durch fj (x) = xj , x = (xj ) ∈ `p . Dann gilt für alle j (n) xj = fj (x(n) ) → fj (x) = xj n→∞ nach Voraussetzung. Nun zu ⇐: Wir machen obige Schritte einfach rückwärts: also definieren wir die Menge D = hf1 , f2 . . .i ⊂ `∗p . Ist p > 1, so ist D̄ = `∗p , also folgt xj * x aus (1) und (2) mit Hilfe von Satz 6.8. Doch wozu beschäftigen wir uns überhaupt mit der schwachen Konvergenz? Eine Anwendung ist eine schwache Form des Satzes von Heine-Borel: 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 72 Theorem 6.3. Es sei X ein reflexiver Raum, xj ∈ X eine beschränkte Folge, kxj k ≤ M , j ≥ 1. Dann existiert ein x ∈ X und eine Teilfolge xjk , so dass in X, (k → ∞). xj k * x Aus Theorem 6.2 folgt kxk ≤ M . Bemerkung: In einem reflexiven Raum hat jede beschränkte Folge eine schwach konvergente Teilfolge. Diese Eigenschaft charakterisiert die Reflexivität eines Raumes (Satz von Eberlein-Šmulyan, siehe Yosida, Seite 149ff). Definition 6.6. (schwach abgeschlossene Menge) Eine Teilmenge A ⊂ X heisst schwach (folgen-)abgeschlossen, falls xj ∈ A ⇒ x ∈ A. xj * x Lemma 6.1. Ist A schwach abgeschlossen, so ist Ā = A. Beweis. Es sei x ∈ Ā, dann existiert eine Folge xj ∈ A mit xj → x. Also ist auch xj * x, nach Voraussetzung ist dann x ∈ A, folglich ist Ā = A. Beispiel: der Menge A = (Übungsaufgabe) Für p > 1 ist der schwache Abschluss {x ∈ `p kxkp = 1} die abgeschlossene Kugel K = {x ∈ `p kxkp ≤ 1}. Lemma 6.2. Die folgenden Mengen A ⊂ X sind schwach abgeschlossen: i) A ist abgeschlossen und linear; ii) Die abgeschlossene Kugel A = {xkxk ≤ R}; iii) A konvex und abgeschlossen. Beweis. Wir benutzen den Satz von Hahn-Banach. i): Es sei xj ∈ A und xj * x. Dann ist f (xj ) → f (x) für alle f ∈ X ∗ . Wir nehmen speziell eine Funktion f ∈ A⊥ , denn somit ist f (xj ) = 0 für alle j ≥ 1. Demnach ist f (x) = 0 für alle solche f ∈ A⊥ . Daher ist mit Satz 4.4 x ∈ Ā. Weil A abgeschlossen ist, liegt x in A. ii) Sei kxj k ≤ R und xj * x. Dann folgt mit Theorem 6.2 kxk ≤ lim inf kxj k ≤ R. j→∞ Für den Beweis von iii) siehe H. W. Alt. Theorem 6.4 (Approximationstheorem). Es sei X reflexiv, M ⊂ X abgeschlossen und linear, x∗ ∈ X. Dann existiert ein m∗ ∈ M so, dass d(x∗ , M ) = inf kx∗ − xk = kx∗ − m∗ k, x∈M mit anderen Worten, das Minimum existiert. Beweis. Dazu benötigen wir die Theoreme 6.2 und 6.3: Nach der Definition des Infimums existiert eine Minimalfolge mj ∈ M mit kx∗ − mj k −→ inf kx∗ − mk =: α. m∈M Das heisst, die Folge mj ist beschränkt. Weil X reflexiv ist, existiert nach Theorem 6.3 ein Element m∗ ∈ X und eine Teilfolge mjk so, dass mit k → ∞ die Teilfolge in X schwach gegen m∗ konvergiert, also mj k * m ∗ in X. 73 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ Weil M abgeschlossen ist, so ist M schwach abgeschlossen (Lemma 6.2), und daher ist m∗ ∈ M . Mit Theorem 6.2 folgt dann α ≤ kx∗ − m∗ k ≤ lim inf kx∗ − mjk k = lim kx∗ − mjk k = α. k→∞ k→∞ Folglich ist kx∗ − m∗ k = α. Wir wollen nun noch etwas allgemeiner werden: Definition 6.7. (schwach-folgen-unterhalb-stetige Funktion) Es sei A ⊂ X eine Teilmenge. Eine Funktion F : A → 6 R heisst im Punkt x ∈ A schwach-folgen-unterhalbstetig (kurz: s.f.u.s.), falls für jede Folge xj ∈ A mit F (x) xj * x gilt b r F (x) ≤ lim inf F (xj ). j→∞ x - Dazu möchten wir einige Beispiele geben: 1. Die Norm F (x) = kxk, F : X → R ist s.f.u.s. wegen Theorem 6.2. 2. Allgemeiner: sei F : A ⊂ X → R stetig und konvex, A abgeschlossen und konvex. Dann ist F s.f.u.s. auf A. Denn: Die Menge Ar := {x ∈ A|F (x) ≤ r}, r ∈ R, ist abgeschlossen und konvex. Falls die Aussage falsch ist, so existiert x ∈ A und eine Folge xj * x so, dass F (x) > lim inf F (xj ). j→∞ Es existiert ein r < F (x) und eine Teilfolge xjk ∈ Ar , so dass F (xjk ) ≤ r für k ≥ 1. Weil Ar nach Lemma 6.2.iii) schwach abgeschlossen ist, folgt aus xjk * x, dass x ∈ Ar , das heisst, es ist F (x) ≤ r, im Widerspruch zu F (x) > r. Theorem 6.5 (Variationsprinzip). Es sei X reflexiv, A ⊂ X eine beschränkte und schwach abgeschlossene Teilmenge und F : A → R s.f.u.s. auf A. Dann existiert ein x∗ ∈ A mit F (x∗ ) = inf F (x) ∈ R, x∈A das heisst, es existiert ein Minimum. Beweis. Zuerst zeigen wir, dass inf A F > −∞ ist. Sei inf A F = −∞. Dann existiert xj ∈ A, so dass F (xj ) < −j. Weil X reflexiv und A beschränkt ist, existiert nach Theorem 6.3 ein x∗ ∈ X so, dass eine Teilfolge xjk schwach gegen x∗ konvergiert. Weil nun A schwach abgeschlossen ist, ist x∗ ∈ A. Da F s.f.u.s. in x∗ ist, folgt −∞ < F (x∗ ) ≤ lim inf F (xjk ) = −∞, k→∞ was offenbar ein Widerspruch ist. Nun sei inf A F = α ∈ R. Wir nehmen eine minimierende Folge xj , das heisst, es ist F (xj ) → α. Nach unserer Annahme ist A beschränkt und schwach abgeschlossen, daher existiert – wiederum nach Theorem 6.3 – ein x∗ ∈ A so, dass es eine Teilfoge xjk gibt, die schwach gegen x∗ ∈ A konvergiert. Da F s.f.u.s. in x∗ ist, ergibt sich α ≤ F (x∗ ) ≤ lim inf F (xjk ) = lim F (xjk ) = α. k→∞ ∗ Also ist F (x ) = α. k→∞ 74 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ Bemerkung: Die Eindeutigkeit des Minimums erfordert zusätzliche Bedingungen an die Funktion F , Theorem 6.5 garantiert nur die Existenz des Minimums. Zum Beispiel genügt es anzunehmen, dass F strikt konvex und A konvex ist, das heisst, für x1 , x2 ∈ X mit x1 6= x2 und 0 < λ < 1 gilt F (λx1 + (1 − λ)x2 ) < λF (x1 ) + (1 − λ)F (x2 ). Das Minimum ist eindeutig, denn mit x1 6= x2 und F (x1 ) = F (x2 ) < F (x) für alle x folgt für 0 < λ < 1 F (x1 ) ≤ F (λx1 + (1 − λ)x2 ) < λF (x1 ) + (1 − λ)F (x2 ) = F (x1 ), was offensichtlich ein Widerspruch ist. In Theorem 6.4 ist das Minimum eindeutig, falls, zum Beispiel, die Norm eine strikte Norm ist, das heisst, wenn gilt x, y 6= 0 und kx + yk = kxk + kyk ⇒ x = λy, λ > 0. Als Beispiel betrachten wir wieder das Dirichlet-Problem (siehe (5.3), Seite 59): ◦ Es sei F : H1,2 (Ω) → R, Ω ⊂ Rn offen und beschränkt, f ∈ L2 (Ω) mit Z Z ◦ 1 F (x) = f x dµ x ∈ H1,2 (Ω). |∇x|2 dµ − 2 Ω Ω Dieses F ist strikt konvex und s.f.u.s. Da wir das Theorem 6.3 noch nicht bewiesen haben, wollen wir das jetzt noch nachholen. Als Vorbereitung folgt jetzt ein Satz über den Dualraum X ∗ eines separablen Raumes X: Die abgeschlossene Einheitskugel in X ∗ ist schwach-∗-folgenkompakt. Satz 6.10 (Alaoglu-Banach). Es sei X separabel, fj ∈ X ∗ eine beschränkte Folge, kfj k ≤ M für j ≥ 1. Dann existiert ein f ∈ X ∗ und eine Teilfolge fjk so, dass kf k ≤ M und ∀ x ∈ X, lim fjk (x) = f (x) k→∞ also konvergiert die Teilfolge punktweise gegen f ∈ L(X, C) = X ∗ . Beweis. Wir benutzen den Satz von Heine-Borel und den bekannten Diagonal-Trick: Weil X separabel ist, existiert eine dichte Folge D = {x1 , x2 , . . .} ⊂ X mit D̄ = X. Nach Voraussetzung ist sup |fj (xn )| ≤ M kxn k < ∞ j≥1 für jedes feste n. Die beschränkte Zahlenfolge fj (xn ) j hat nach Heine-Borel eine konvergente Teilfolge, und zwar für jedes feste n = 1, 2, . . .. Nach dem Diagonalverfahren finden wir eine Teilfolge fjk so, dass lim fjk (xn ) k→∞ existiert für jedes n. Wir definieren die lineare Hülle Y = hx1 , x2 , . . .i = hDi ⊂ X. Dann folgt, dass lim fjk (y) =: ϕ(y) k→∞ y∈Y 6 REFLEXIVE RÄUME UND SCHWACHE KONVERGENZ 75 existiert und ϕ : Y → C linear und stetig ist, denn es gilt |ϕ(y)| = lim |fjk (y)| ≤ M kyk k→∞ und somit kϕk ≤ M . Nach Voraussetzung ist Ȳ = X, daher existiert eine eindeutige stetige Fortsetzung von ϕ auf X, wir nennen sie f ∈ X ∗ . Es gilt kf k = kϕk ≤ M . Weil f (x) = ϕ(x) für alle x ∈ D und weil D̄ = X, so folgt lim fjk (x) = f (x) k→∞ ∀ x ∈ X. Als letztes beweisen wir nun das Theorem 6.3: Beweis. Es sei X reflexiv und eine beschränkte Folge xj ∈ X mit kxj k ≤ M gegeben. Wir definieren die abgeschlossene Menge Y = hx1 , x2 , . . .i ⊂ X. Weil X reflexiv ist, gilt dies wegen Satz 6.4 auch für Y . Nach Konstruktion ist Y separabel und mit Satz 6.5 folgt, dass auch Y ∗ separabel ist. Nun wenden wir Satz 6.10 auf Y ∗ an. Betrachten wir die Folge I(xj ) ∈ (Y ∗ )∗ , xj ∈ Y im Dualraum von Y ∗ . Sie ist nach Voraussetzung beschränkt, da kI(xj )k = kxj k ≤ M. Nach Satz 6.10 existiert daher ein y ∗∗ ∈ (Y ∗ )∗ mit ky ∗∗ k ≤ M und eine Teilfolge xjk so, dass k→∞ I(xjk ) (y ∗ ) −−−− → y ∗∗ (y ∗ ) für jedes y ∗ ∈ Y ∗ . Da Y reflexiv ist, existiert x ∈ Y mit y ∗∗ = I(x). Daher ist nach Definition von I : Y → (Y ∗ )∗ y ∗ (xjk ) = I(xjk ) (y ∗ ) → I(x) (y ∗ ) = y ∗ (x) für jedes y ∗ ∈ Y ∗ . Es sei nun x∗ ∈ X ∗ = L(X, C), dann ist die Restriktion x∗ |Y ∈ Y ∗ und deshalb x∗ (xjk ) → x∗ (x) ⇐⇒ xjk * x in X. Überdies ist kxk = kI(x)k = ky ∗∗ k ≤ M . ∀ x∗ ∈ X ∗ 76 7 SPEKTRUM UND RESOLVENTE 7 Spektrum und Resolvente Als einleitendende Bemerkungen wollen wir einige Begiffe wiederholen, denen wir in diesem Abschnitt des öfteren begegnen werden: Definition 7.1. (Skalarprodukt) Ein Skalarprodukt auf dem Vektorraum X ist eine zweiparametrige Funktion (·, ·) : X × X → K, wobei K ein Körper ist, mit den Eigenschaften i) (x1 + x2 , y) = (x1 , y) + (x2 , y); ii) (λx, y) = λ(x, y); iii) (x, y) = (y, x); iv) (x, x) ≥ 0; v) (x, x) = 0 ⇔ x = 0. Aus den Eigenschaften i) − iii) folgt automatisch, dass (x, y1 + y2 ) = (x, y1 ) + (x, y2 ) und (x, λy) = λ̄(x, y). Aus der Linearen Algebra entnehmen wir folgendes Resultat, ohne es zu beweisen: Lemma 7.1 (Cauchy-Schwarz’sche Ungleichung). Für ein Skalarprodukt (·, ·) auf dem Vektorraum X gilt |(x, y)|2 ≤ (x, x) (y, y) ∀x, y ∈ X. Definition 7.2. (Hilbert-Raum) Ein Hilbert-Raum ist ein vollständiger normierter Raum (H, k k) mit einem Skalarprodukt (·, ·), so dass 1 ∀x ∈ X. (x, x) 2 = kxk 7.1 Adjungierte Operatoren im Hilbert-Raum Es sei H ein Hilbert-Raum. Dann erfüllt das Skalarprodukt (·, ·) die Ungleichung |(x, y)| ≤ kxk kyk und es ist linear im ersten Argument, anti-linear im zweiten. Beispiel: Z H = L2 (Ω), (f, g) = f ḡ dµ. Ω Definition 7.3. (formal adjungierter Operator) Es sei A : DA ⊂ H → H. Dann heisst ein Operator B : DB ⊂ H → H formal adjungiert zu A, falls (Ax, y) = (x, By) x ∈ D A , y ∈ DB . d wählen wir DA = Cc∞ (R). Mittels partieller Beispiel. Mit H = L2 (Ω) und A = i dt Integration folgt, dass (Ax, y) = (x, Ay) das heisst, A ist formal selbstadjungiert . ∀ x, y ∈ DA , 77 7 SPEKTRUM UND RESOLVENTE Ein Operator kann sehr viele formal adjungierte Operatoren besitzen. Ist jedoch D̄A = H, so gibt es darunter einen ausgezeichneten, den zu A adjungierten Operator A∗ : Definition 7.4. (adjungierter Operator) Es sei A : DA ⊂ H → H dicht definiert auf H, das heisst, es sei D̄A = H. Dann ist sein adjungierter Operator A ∗ : DA ∗ ⊂ H → H wie folgt definiert: die lineare Abbildung DA → C, gegeben durch ∗ DA := y ∈ H x 7→ (Ax, y) ist stetig Weil D̄A = H, so existiert für y ∈ DA∗ eine eindeutige stetige Fortsetzung von x 7→ (Ax, y) zu einer stetigen, linearen Abbildung f ∈ H ∗ = L(H, C). Nach dem Satz von Riesz existiert ein eindeutiges y ∗ ∈ H so, dass f (x) = (x, y ∗ ) für alle x ∈ H. Daher ist (Ax, y) = (x, y ∗ ) ∀ x ∈ DA . Damit können wir schreiben DA∗ = {y ∈ H| ∃y ∗ : (Ax, y) = (x, y ∗ ) ∀ x ∈ DA }. Dieses y ∗ ∈ H ist eindeutig, und man definiert damit A∗ y = y ∗ y ∈ D A∗ . Es folgt dann (Ax, y) = (x, A∗ y) ∗ ∀x ∈ DA , y ∈ DA∗ , das heisst, A ist ein zu A formal adjungierter Operator. Es gilt sogar: A∗ ist der maximale zu A formal adjungierte Operator. Satz 7.1. Es sei A : DA ⊂ H → H, D̄A = H. Dann hat A∗ folgende Eigenschaften: i) A∗ ist der maximale zu A formal adjungierte Operator; ii) A∗ ist abgeschlossen; iii) Ist A ⊂ B, so folgt B ∗ ⊂ A∗ . Zur Notation: Wir schreiben A ⊂ B und meinen dabei DA ⊂ DB und Ax = Bx für alle x ∈ DA . Beweis. i) Es sei B : DB ⊂ H → H ein zu A formal adjungierter Operator, das heisst, es gelte (Ax, y) = (x, By) für alle x ∈ DA , y ∈ DB . Wir betrachten ein festes y ∈ DB . Das lineare Funktional (x, By) ist stetig in x ∈ DA . Nach Definition der Adjungierten A∗ liegt y in DA∗ und es ist A∗ y = By, also ist B ⊂ A∗ . ii) Sei {yj , A∗ yj } eine Folge in H ⊕H mit yj ∈ DA∗ , die gegen {y, z} konvergiert. Dann ist (Ax, yj ) = (x, A∗ yj ) x ∈ DA ↓ ↓ (Ax, y) = (x, z) x ∈ DA . Das Funktional auf der rechten Seite ist stetig in x ∈ DA , und nach der Definition der Adjungierten A∗ heisst das, dass y in DA∗ liegt und dass A∗ y = z ist. Folglich ist A∗ abgeschlossen. iii) Es sei y ∈ DB ∗ , dann gilt für alle x ∈ DA ⊂ DB (Ax, y) = (Bx, y) = (x, B ∗ y). Auf der rechten Seite steht ein in x ∈ DA stetiges Funktional (also auch auf der linken). Nach Definition von A∗ gilt dann aber: y ∈ DA∗ und A∗ y = B ∗ y, das heisst, es ist B ∗ ⊂ A∗ . 78 7 SPEKTRUM UND RESOLVENTE Definition 7.5. (symmetrischer, selbstadjungierter Operator) Ein Operator A : DA ⊂ H → H mit D̄A = H heisst symmetrisch, falls A ⊂ A∗ . Äquivalent dazu ist (Ax, y) = (x, Ay) für alle x, y ∈ DA . Der Operator heisst selbstadjungiert, falls A = A∗ , das heisst, wenn A ⊂ A∗ und DA∗ = DA . Bemerkungen: 1. Falls der Operator A stetig ist, also A ∈ L(H), so ist symmetrisch gleichbedeutend wie selbstadjungiert. 2. In der älteren Literatur werden selbstadjungierte Operatoren auch maximal symmetrische Operatoren genannt. Dies hat folgende Motivation: Es sei A = A∗ , A ⊂ B mit B ⊂ B ∗ , das heisst, B ist eine symmetrische Erweiterung von A. Nach Satz 7.1.iii) ist dann A = A∗ ⊃ B ∗ ⊃ B also A ⊃ B, und daher ist A = B. Zur Illustration betrachten wir ein Beispiel: Es sei H = L2 (0, 1) mit komplexwertigen Funktionen mit dem Skalarprodukt Z 1 (f, g) = f ḡ dµ. 0 Die Operatoren seien gegeben durch Ak := i d : DAk ⊂ L2 (0, 1) → L2 (0, 1). dt Sie unterscheiden sich nur durch den Definitionsbereich. Wichtig: der Operator wirkt als schwache Ableitung! Als Definitionsbereiche untersuchen wir DA1 := H 1,2 (0, 1) DA2 := H 1,2 DA3 := H 1,2 d dt maximaler Definitionsbereich (0, 1) ∩ {x(0) − x(1) = 0} (0, 1) ∩ {x(0) = 0 = x(1)} periodische Randbedingungen Dirichlet-Randbedingungen Zur Erinnerung: es ist H 1,2 (0, 1) ⊂ C[0, 1]. Da Cc∞ (0, 1) in L2 (0, 1) dicht liegt und Cc∞ (0, 1) ⊂ DAk für k = 1, 2, 3, sind die Operatoren dicht definiert. Zudem sind alle Operatoren (nach Sobolev) abgeschlossen. Daher existieren alle Adjungierten A∗k und mit DA3 ⊂ DA2 ⊂ DA1 folgt A3 ⊂ A 2 ⊂ A 1 ⇒ A∗1 ⊂ A∗2 ⊂ A∗3 . Satz 7.2. Es gilt A∗3 = A1 , A∗2 = A2 , A∗1 = A3 . Beweis. Übungsaufgabe (mittels partieller Integration). Folgerungen: 1. A3 ist symmetrisch, aber nicht selbstadjungiert (der Definitionsbereich ist zu klein): A3 ⊂ A2 = A∗2 ⊂ A∗3 ⇒ A3 ⊂ A∗3 . Also: A∗3 = A1 % A3 . 2. A2 ist eine selbstadjungierte Erweiterung des symmetrischen Operators A3 . 3. A1 ist eine echte Erweiterung des selbstadjungierten Operators A2 , kann daher also nicht symmetrisch sein: A∗1 = A3 $ A1 . 79 7 SPEKTRUM UND RESOLVENTE 7.2 Spektrum und Resolvente Definition 7.6. (Resolventenmenge) Es sei X ein komplexer Banach-Raum und A : DA ⊂ X → X ein linearer Operator des Raumes in sich selbst. Wir definieren die Resolventenmenge ρ von A durch ρ(A) := {λ ∈ C|(λ1 − A) : DA → X ist bijektiv mit (λ1 − A)−1 ∈ L(X)} ⊂ C. Bemerkungen: 1. Es sei ρ(A) 6= ∅ und λ ∈ ρ(A), also ist (λ1−A)−1 in L(X). Dann ist (λ1−A)−1 abgeschlossen. Daraus folgt aus Satz 3.4, dass auch (λ1 − A) abgeschlossen ist und schliesslich muss auch A abgeschlossen sein. Umgekehrt können wir sagen: ist A nicht abgeschlossen, so ist ρ(A) = ∅. 2. Ist A abgeschlossen, (λ1 − A) injektiv und surjektiv, so ist (λ1 − A)−1 ∈ L(X) wegen Theorem 3.6. Definition 7.7. (Resolvente) Die Resolvente von A ist eine operatorwertige Funktion ρ(A) → L(X) λ 7→ (λ1 − A)−1 =: Rλ = Rλ (A). Bemerkung: Ist λ ∈ ρ(A), dann ist Rλ (A) : X → DA bijektiv und (λ1−A)Rλ = 1 auf X sowie Rλ (λ1 − A) = 1 auf DA . Satz 7.3. Es gelten folgende algebraische Eigenschaften für die Resolvente, falls λ, µ ∈ ρ(A): i) Rλ A ⊂ ARλ ; ii) ARλ = λRλ − 1 ∈ L(X); iii) Rλ − Rµ = (µ − λ)Rλ Rµ ; iv) Rλ Rµ = Rµ Rλ . Beweis. Aus λ ∈ ρ(A) folgt für alle x ∈ X x = (λ1 − A)Rλ x = λRλ x − ARλ x, woraus wir sofort ii) ablesen können. Mit x ∈ DA schliessen wir, dass x = Rλ (λ1 − A)x = λRλ x − Rλ Ax, also ist ARλ x = Rλ Ax für x ∈ DA . Dies ist die Aussage von i). Zudem ist Rλ = Rλ 1 = Rλ (µ1 − A)Rµ = Rλ (µ1 − λ1 + λ1 − A)Rµ = (µ − λ)Rλ Rµ + Rλ (λ1 − A) Rµ | {z } =1DA Damit ist iii) bewiesen und iv) folgt unmittelbar aus iii) Definition 7.8. (Spektrum) Das Spektrum eines linearen Operators A : DA ⊂ X → X ist die Menge σ(A) := C \ ρ(A). 80 7 SPEKTRUM UND RESOLVENTE Bemerkung: σ(A) enthält die Eigenwerte von A, sofern es solche gibt: Sei λ ∈ C ein Eigenwert von A. Dies ist genau dann der Fall, wenn λ1 − A nicht injektiv ist, d.h. es gibt ein 0 6= x ∈ X mit (λ1 − A)x = 0 oder, anders geschrieben, Ax = λx. Die Menge der Eigenwerte heisst Punktspektrum von A: σp (A) := {λ ∈ C|λ Eigenwert von A} ⊂ σ(A). Falls X ein Hilbert-Raum ist und A ⊂ A∗ , dann ist σp (A) ⊂ R, denn mit Ax = λx folgt (Ax, x) = λkxk2 und (Ax, x) = (x, Ax) = (x, Ax). Wir wollen nun den Unterschied zwischen unendlich-dimensionalen und endlichdimensionalen Räumen betrachten. Als erstes sei X ein komplexer Raum mit dimX < ∞ und A ∈ L(X). Wählen wir eine Basis von X, so lässt sich A als quadratische Matrix darstellen. Es gilt λ1 − A ist injektiv ⇐⇒ λ1 − A ist surjektiv ⇐⇒ det(λ1 − A) 6= 0. Nach Definition ist σ(A) = {λ ∈ C | det(λ1 − A) = 0} = σp (A) und aus der linearen Algebra wissen wir, dass σp (A) höchstens dim(X) Punkte enthält. Weil ρ(A) = C \ σp (A) ist ρ(A) sicher nicht leer. Dass dies in unendlichdimensionalen Räumen nicht der Fall zu sein braucht, zeigt uns folgendes Beispiel: Wir betrachen den Raum X = L2 (0, 1) von komplexwertigen Funktionen und die Operatoren d Ak = i : DAk ⊂ L2 (0, 1) → L2 (0, 1), dt welche als schwache Ableitungen auf L2 (0, 1) wirken. Als Definitionsbereiche nehmen wir DA1 := H 1,2 (0, 1) DA2 := H 1,2 DA3 := H 1,2 DA4 := H 1,2 (0, 1) ∩ {x(0) − x(1) = 0} (0, 1) ∩ {x(0) = 0 = x(1)} maximaler Definitionsbereich periodische Randbedingungen Dirichlet-Randbedingungen (0, 1) ∩ {x(0) = 0} Satz 7.4. Im obigen Beispiel gilt (1) σ(A1 ) = σp (A1 ) = C (2) (3) σ(A2 ) = σp (A2 ) = 2πZ σ(A3 ) = C, σp (A3 ) = ∅ (4) σ(A4 ) = ∅ ρ(A1 ) = ∅ ρ(A2 ) 6= ∅ ρ(A3 ) = ∅ ρ(A4 ) = C Bemerkung: Die Operatoren sind dicht definiert, abgeschlossen, A ∗2 = A2 ist selbstadjungiert und A3 ⊂ A∗3 ist symmetrisch. Beweis. Übungsaufgabe Zur Notation: Von nun an schreiben wir (λ − A) statt (λ1 − A). Satz 7.5. Sei X ein Banach-Raum, A : DA ⊂ X → X und z0 ∈ ρ(A) 6= ∅. Dann enthält ρ(A) die offene Kreisscheibe D = {z |z − z0 | < k(z0 − A)−1 k−1 } 81 7 SPEKTRUM UND RESOLVENTE auf der die Resolvente darstellbar ist durch die in L(X) konvergente Reihe X (z − A)−1 = (z0 − z)n Rz0 (A)n+1 z∈D n≥0 mit Rz0 (A) = (z0 − A)−1 ∈ L(X). Beweis. Auf dem Definitionsbereich DA gilt z − A = (z0 − A) − (z0 − z) = 1 − (z0 − z)(z0 − A)−1 (z0 − A). Weil X ein Banach-Raum ist, so ist für k(z0 − z)(z0 − A)−1 k < 1 der Operator 1 − (z0 − z)(z0 − A)−1 in L(X) ein stetiger Isomorphismus von X und hat die durch die geometrische Reihe dargestellte stetige Inverse. Daher ist z − A injektiv und surjektiv; es ist X n (z − A)−1 = (z0 − z)(z0 − A)−1 (z0 − A)−1 , n≥0 wobei die Reihe in L(X) für jedes z ∈ D konvergiert. Eine direkte Folgerung aus Satz 7.5 ist folgender Satz: Satz 7.6. Sei X ein Banach-Raum und A : DA ⊂ X → X. Dann ist ρ(A) offen und σ(A) abgeschlossen in C. Die Resolventenfunktion z 7→ (z − A)−1 ∈ L(X) ist eine auf ρ(A) analytische Funktion mit Werten in L(X), zudem gilt für z ∈ ρ(A) k(z − A)−1 k ≥ 1 . dist(z, σ(A)) Einen Spezialfall stellen die beschränkten Operatoren A ∈ L(X) dar: Sie besitzen den Spektralradius 1 rA := lim kAn k n n→∞ ≤ kAk. Theorem 7.1. Es sei X ein Banach-Raum und A ∈ L(X) Dann ist ρ(A) 6= ∅ und σ(A) 6= ∅. Genauer gilt i) |z| > rA ⇒ ii) z ∈ σ(A) z ∈ ρ(A); ⇒ |z| ≤ rA ; iii) rA = sup |z|; z∈σ(A) iv) (z − A)−1 = v) 1 X An konvergiert in L(X) für |z| > rA ; z zn n≥0 lim k(z − A)−1 k = 0. |z|→∞ Beweis. Zum Beweis verwenden wir Theorem 2.2 über die Neumann’sche Reihe, die Cauchy-Formel für holomorphe Funktionen und den Satz von Liouville: Es sei |z| > kAk. Dann konvergiert die Reihe (z − A)−1 = 1 1 X An A −1 = 1− z z z zn n≥0 (7.1) 82 7 SPEKTRUM UND RESOLVENTE in L(X) und es gilt k(z − A)−1 k ≤ 1 1 1 |z|→∞ = −→ 0. kAk |z| 1 − |z| − kAk |z| Nach dem Wurzelkriterium und der Definition von rA konvergiert obige Reihe für |z| > rA in L(X). Durch Multiplikation der Reihe mit (z − A) von links und von rechts erhalten wir die Identität, so dass die Formel (7.1) gilt für |z| > rA , das heisst, z ∈ ρ(A), und es folgt rA ≥ σ0 := sup |z|. z∈σ(A) Zu zeigen ist, dass rA ≤ σ0 . Es sei |z| > rA . Dann ist, wie wir bereits wissen, (z − A)−1 = 1 X An = z −1 1 + z −2 A + z −3 A2 + z −4 A3 + . . . z zn n≥0 konvergent in L(X). Termweise Integration über den Kreis Kr (0) mit Radius r > rA und Zentrum 0 liefert mit der Cauchy-Formel für holomorphe Funktionen Z 1 n z n (z − A)−1 dz n = 1, 2, . . . . (7.2) A = 2πi Kr (0) Weil (z − A)−1 holomorph ist, gilt die Formel (7.2) auch für r > σ0 . Wir definieren für r > σ0 M (r) = max kf (reiϑ )k f (z) = (z − A)−1 . ϑ Dann folgt aus (7.2) und somit kAn k ≤ rn+1 M (r) 1 rA = lim kAn k n ≤ r. n→∞ Dies gilt für alle r > σ0 , daher ist rA ≤ σ0 . Zusammen ist also rA = σ0 . Wir nehmen an, es sei σ(A) = ∅. Dann ist z 7→ (z − A)−1 ∈ L(X) analytisch auf C. Nehmen wir f ∈ X ∗ und x ∈ X, so ist z 7→ f (Rz x) : C → C analytisch auf ganz C und es gilt lim f (Rz x) = 0. |z|→∞ Nach dem Satz von Liouville ist die Funktion konstant und daher ist f (Rz x) = 0 für alle z ∈ C und alle x ∈ X. Dies wiederum gilt für alle f ∈ X ∗ . Mit dem Satz von Hahn-Banach folgt nun, dass Rz x = 0 für alle z ∈ C und für alle x ∈ X, im Widerspruch zu (z − A)Rz x = x ∀ |z| > kAk. Lemma 7.2. Es sei A ⊂ A∗ ein symmetrischer Operator auf dem Hilbert-Raum H. Dann gilt k(z − A)uk ≥ |Im(z)| kuk u ∈ DA . Ist Im(z) 6= 0, so ist (z − A) injektiv; ist zusätzlich (z − A) surjektiv, so folgt k(z − A)−1 k ≤ 1 . |Im(z)| 83 7 SPEKTRUM UND RESOLVENTE Beweis. Es gilt: A ⊂ A∗ ⇐⇒ (Au, u) = (u, Au) für u ∈ DA . Daher ist (u, Au) = (Au, u) = (u, Au) ∈ R und es gilt |Im(z)| kuk2 = Im u, (z − A)u ≤ u, (z − A)u ≤ kuk k(z − A)uk für u ∈ DA . Theorem 7.2 (Kriterium für Selbstadjungiertheit). Es sei H ein Hilbert-Raum, A dicht definiert und symmetrisch, das heisst, A ⊂ A∗ . Dann sind folgende Aussagen äquivalent: i) A = A∗ (A ist selbstadjungiert); ii) σ(A) ⊂ R; iii) Wz−A = H für je ein z in Im(z) > 0 und Im(z) < 0; iv) A ist abgeschlossen und es ist kern(z − A∗ ) = {0} für je ein z in Im(z) > 0 und Im(z) < 0. Bemerkung: Ist A selbstadjungiert, so ist σ(A) nicht leer, wie wir später noch sehen werden. Beweis. Wir beweisen die Reihenfolge iii) ⇒ ii) ⇒ i) ⇒ iii) ⇔ iv). 1. Teil Sei Wz0 −A = H für ein z0 in Im(z) > 0. 6 Dann folgt aus Lemma 7.2, dass z0 − A : DA → H '$ bijektiv ist, und p D z0p z1 1 1 −1 k(z0 − A) k ≤ = . &% |Im(z )| Im(z ) 0 0 Daher ist z0 ∈ ρ(A) und, nach Satz 7.5, enthält ρ(A) die offene Kreisscheibe D = {z ∈ C |z − z0 | < Im(z0 )}. Wir wiederholen dieses Argument in jedem Punkt von D (in der Skizze durch z1 angedeutet) und schliessen so fortlaufend, dass ρ(A) die ganze obere Halbebene Im(z) > 0 enthält. Analog verfahren wir mit der unteren Halbebene Im(z) < 0. Damit erhalten wir σ(A) = C \ ρ(A) ⊂ {z ∈ C|Im(z) = 0} = R. 2. Teil Sei σ(A) ⊂ R und A ⊂ A∗ . Zu zeigen ist DA∗ = DA . Also nehmen wir ein u ∈ DA∗ . Nach Annahme ist ±i ∈ ρ(A), daher ist WA−i = H = WA+i . Deshalb existiert ein v ∈ DA so, dass (A∗ − i)u = (A − i)v = (A∗ − i)v, letztere Gleichung wegen A ⊂ A∗ . Also ist (A∗ − i)(u − v) = 0 und deshalb gilt für alle w ∈ DA (A + i)w, u − v = w, (A∗ − i)(u − v) = 0. Weil WA+i = H, folgt u − v = 0 und damit u = v ∈ DA . 3. Teil Es sei A = A∗ . Zu zeigen ist Wz−A = H für Im(z) 6= 0. Zuerst zeigen wir: Ist Im(z) 6= 0, so ist Wz−A ⊂ H abgeschlossen. Es sei also v ∈ W z−A , das heisst, es gibt eine Folge un ∈ DA mit limn→∞ (z − A)un = v. Weil Im(z) 6= 0 84 7 SPEKTRUM UND RESOLVENTE folgt aus Lemma 7.2, dass un eine Cauchy-Folge ist, also un in H gegen ein u ∈ H konvergiert. Weil A = A∗ abgeschlossen ist (Satz 7.1), schliessen wir u ∈ DA und (z − A)u = v. Also ist v ∈ Wz−A . Nun beweisen wir, dass für Im(z) 6= 0 der Wertebereich Wz−A in H dicht liegt. ⊥ Wir nehmen ein v ∈ Wz−A . Dann ist v, (z − A)u = 0 für alle u ∈ DA . Das heisst, das Funktional f (u) = (Au, v) = (u, z̄v) ist stetig (es handelt sich um ein Skalarprodukt) in u ∈ DA . Nach Definition der Adjungierten ist v ∈ DA∗ und A∗ v = z̄v. Weil A selbstadjungiert ist, folgt (z̄ − A)v = 0. Da Im(z) 6= 0, folgt aus ⊥ Lemma 7.2, dass v = 0. Wir haben gezeigt, dass Wz−A = {0}. Folglich ist Wz−A abgeschlossen und dicht in H und es folgt Wz−A = H. 4. Teil Der Beweis iii) ⇐⇒ iv) wird dem Leser als Übung überlassen. Selbstadjungiertheit ist stabil unter Störungen, wie wir als nächstes zeigen werden. Lemma 7.3. Sei A ⊂ A∗ , z ∈ ρ(A), z 6= 0 und z + z̄ = 0. Zudem bezeichne Rz = (z − A)−1 . Dann ist kA Rz uk ≤ kuk, 1 kuk kRz uk ≤ |z| ∀ u ∈ H. Beweis. Es ist u = (z − A)Rz u = z Rz u − ARz u für alle u ∈ H. Es folgt kuk2 = (u, u) = (z Rz u − ARz u, z Rz u − ARz u) = |z|2 kRz uk2 − (z + z̄)(ARz u, Rz u) + kARz uk2 , | {z } =0 das zweite Gleichheitszeichen gilt wegen A ⊂ A∗ . Damit folgt die Behauptung. Theorem 7.3 (Stabilitätssatz von Kato-Rellich). Sei A = A∗ ein selbstadjungierter und B ⊂ B ∗ ein symmetrischer Operator mit DA ⊂ DB . Wir nehmen an, B sei klein bezüglich A im Sinne von kBuk ≤ akAuk + bkuk u ∈ DA mit 0 ≤ a < 1 und b ≥ 0. Dann ist der Operator A + B mit DA+B = DA selbstadjungiert. Spezialfall: Ist A = A∗ und B = B ∗ ∈ L(X), so ist A + B auf DA selbstadjungiert. Wir wählen a = 0 und b = kBk. Beweis. Wir benutzen Theorem 7.2 und die Eigenschaften der Neumann’schen Reihe. Nach Voraussetzung ist A + B auf DA symmetrisch. Nach Theorem 7.2 ist zu zeigen, dass Wz−(A+B) = H für je ein z in Im(z) > 0 und Im(z) < 0. Weil A selbstadjungiert ist, gilt nach Theorem 7.2 für z mit Im(z) 6= 0, dass z ∈ ρ(A) und (z − A)−1 (H) = DA ⊂ DB . Auf DA gilt ausserdem z − (A + B) = 1 − B(z − A)−1 (z − A). Weil (z − A) surjektiv ist, genügt es zu zeigen, dass 1 − B(z − A)−1 ein stetiger Isomorphismus von H ist für z = iµ, µ ∈ R und |µ| gross. Nach Neumann genügt es nun zu zeigen, dass für ein solches z kB(z − A)−1 k < 1. 7 SPEKTRUM UND RESOLVENTE 85 Aus den Voraussetzungen folgt für alle u ∈ H kB(z − A)−1 uk ≤ akA(z − A)−1 uk + bk(z − A)−1 uk. Mit Lemma 7.3 ist nun b b kuk. kuk = a + |µ| |µ| b = α < 1. Für diese Weil a < 1 ist, können wir µ so gross wählen, dass a + |µ| z = iµ folgt dann kB(z − A)−1 k ≤ α < 1. kB(z − A)−1 uk ≤ akuk + Somit ist das Theorem bewiesen. 86 8 HALBGRUPPEN 8 8.1 Halbgruppen Gewöhnliche Differentialgleichungen im Banach-Raum Wir betrachten ein lipschitzstetiges Vektorfeld f : X → X auf einem Banach-Raum X; d.h. kf (x) − f (y)k ≤ Lkx − yk für alle x, y ∈ X und eine Konstante L > 0. Dann gibt es zu jedem vorgegebenen x ∈ X genau eine Kurve R → X, t 7→ x(t), welche in jedem t ∈ R in dem Sinne differenzierbar ist, dass der Limes x(t + h) − x(t) d =: x(t) =: x0 (t) ∈ X h→0 h dt lim in X existiert, und welche die Gleichungen d x(t) = f (x(t)) , t ∈ R dt x(0) = x, erfüllt. Das Cauchy-Anfangswert-Problem in X ist also eindeutig lösbar für jede Anfangsbedingung x ∈ X, und die Lösung existiert für alle Zeiten. Dies ist der Satz von Cauchy-Picard-Lindelöff . Für die eindeutige Lösungskurve x(t) durch x, schreibt man gewöhnlich ϕt (x) = x(t) , ϕ0 (x) = x, die Abbildung t 7→ ϕt nennt man Lösungsfluss. Aus der Eindeutigkeit der Lösung des Cauchy-Anfangswert-Problems folgt sofort ϕt+s (x) = ϕt ϕs (x) = ϕs ϕt (x) für alle t, s ∈ R und alle x ∈ X. Wir können eine einparametrige Familie ϕt von stetigen Abbildungen ϕt : X → X, x 7→ ϕt (x), t ∈ R definieren. Diese Familie ist eine einparametrige Gruppe von (Lipschitz-)Homöomorphismen von X ϕt+s = ϕt ◦ ϕs , 8.2 (ϕt )−1 = ϕ−t , ϕ0 = 1. Spezialfall: Lineare Gleichungen Sei f (x) = Ax, mit A ∈ L(X). Dann ist A ein lipschitzstetiges Vektorfeld, da ja kf (x)−f (y)k = kA(x−y)k ≤ kAk kx−yk. Der Lösungsfluss ϕt (x) ist explizit durch die Exponentialfunktion gegeben ϕt (x) = P t (x) , P t ∈ L(X) ∞ n X t n A ∈ L(X) P t := exp(tA) = n! j=0 mit Konvergenz in L(X). Nach den Eigenschaften der Exponentialfunktion bildet die Familie P t ∈ L(X) eine Gruppe, P 0 = 1 , P t P s = P t+s = P s P t . Überdies existiert der Limes d t 1 t+h P := lim P − P t in L(X), h→0 dt h und erfüllt für alle t ∈ R d t P = P t A = AP t . dt 87 8 HALBGRUPPEN Insbesondere ist also die sogenannte Erzeugende A der Gruppe P t gegeben durch d A = Pt . dt t=0 Umgekehrt, falls P t eine einparametrige Gruppe von beschränkten Operatoren ist, welche in dem Sinne gleichmässig stetig ist, dass lim P t − 1 = 0 in L(X), t→0 dann ist P t = etA , mit einem beschränkten Operator A ∈ L(X), siehe Satz 8.3. Dies ist für uns zu einschränkend! Für unbeschränkte Operatoren versagt die Lösungsmethode mit der Exponentialfunktion. 8.3 Problemstellung: Das Cauchy-Anfangswert-Problem Sei A : DA ⊂ X → X ein linearer, nicht notwendigerweise stetiger Operator. Gibt es zu vorgegebenem x ∈ X eine stetige Kurve t 7→ x(t), t ∈ R, welche für t > 0 differenzierbar ist mit x(t) ∈ DA , so, dass d x(t) = Ax(t) , t > 0 dt x(0) = x ? Für welche Operatoren A und für welche Anfangsbedingungen x existiert die Lösung für alle Zeiten? Ist sie eindeutig? Hängt sie stetig ab von den Anfangsbedingungen? In welchem Sinne gibt es zum Beispiel eine Dynamik für den Schrödingeroperator in X = L2 Rn , 8.4 1 d u(t) = ∆ − V (x) u(t) , t ∈ R i dt u(0) = u ∈ L2 Rn ? Kontraktionshalbgruppen Um zur Klasse der unbeschränkten Operatoren A : DA ⊂ X → X zu gelangen, für welche Existenz und Eindeutigkeit des Cauchy-Anfangswert-Problems gilt, starten wir mit den Lösungen! Definition 8.1. (Halbgruppe) Eine Halbgruppe auf dem Banach-Raum X ist eine Familie P t ∈ L(X), t ≥ 0, von beschränkten Operatoren, so, dass P 0 = 1, P s P t = P t P s = P t+s für t, s ≥ 0 und lim P t (x) = x für jedes x ∈ X. t→0 t→0 Achtung! Wir fordern nicht, dass kP t − 1k −−−→ 0 in L(X) gilt. Dies würde zu P t = etA und A ∈ L(X) führen, also zu nichts neuem, siehe auch Satz 8.3! Beispiel (Translationsgruppe P t in X = L2 (R)). Sei P t u(x) = u(x + t) , u ∈ L2 (R). Es ist dann lim P t (u) = u für jedes u ∈ L2 (R). Denn t→0 t P (u) − u2 = Z +∞ −∞ 2 t→0 u(x + t) − u(x) dx −−−→ 0. 88 8 HALBGRUPPEN 2 2 Aber P t − 1 = supkuk≤1 P t (u) − u = 2 für t > 0, sodass die Gruppe P t nicht stetig in L(X) ist. Die Erzeugende A der Gruppe ist die (schwache) Ableitung d A = dt in L2 (R), wie wir sehen werden. Satz 8.1. Sei P t , t ≥ 0, eine Halbgruppe auf X. Dann gibt es zwei Konstanten a ≥ 1 und b > 0, sodass kP t k ≤ aebt , t ≥ 0. Überdies gilt für alle t ≥ 0, dass lim P s (x) = P t (x) für jedes x ∈ X. s→t Beweis. Es gibt ein ε > 0, sodass kP t k ≤ a für ein a ≥ 1 auf dem Intervall 0 ≤ t ≤ ε. Denn sonst gäbe es eine Folge tn → 0 mit kP tn k → ∞, was wegen des Prinzips der gleichmässigen Beschränktheit (Theorem 3.1) ein Widerspruch ist zur Stetigkeitseigenschaft lim P tn (x) = x für jedes x ∈ X. n→∞ Jedes t ≥ 0 ist von der Form t = nε + δ mit n ganz und 0 ≤ δ < ε. Mit a ≥ 1 folgt aus den Gruppenstrukturen n t kP t k = kP nε P δ k ≤ k P ε k kP δ k ≤ aan ≤ aa ε = aebt . Nach Definition gilt lims→0 P s (x) = x für jedes x ∈ X. Sei 0 < s < t, dann folgt mit der Gruppenstruktur, dass t P − P s (x) = P s 1 − P t−s (x) ≤ aebs 1 − P t−s (x). Die rechte Seite konvergiert gegen 0 für (t − s) → 0. Analog argumentiert man für (s − t) → 0. Man hat also Stetigkeit im Punkt t = s! Folgerung: Die Halbgruppe Qt := P t e−bt mit t ≥ 0 ist beschränkt, da kQt k ≤ a. Definiere eine neue Norm durch kuk∗ := sups≥0 kQs (u)k, u ∈ X. Diese ist wegen kuk ≤ kuk∗ ≤ akuk äquivalent zur alten Norm, und kQt uk∗ = sup kQs Qt uk = sup kQs+t uk s≥0 s≥0 = sup kQs uk ≤ sup kQs uk = kuk∗ s≥t s≥0 für alle t ≥ 0, sodass kQt uk∗ ≤ kuk∗ . Ohne Beschränkung der Allgemeinheit fordern wir deshalb im Folgenden kP t k ≤ 1. Definition 8.2. (Kontraktionshalbgruppe) Eine Kontraktionshalbgruppe auf X ist eine Familie P t ∈ X, t ≥ 0, mit 1. P 0 = 1 , P s P t = P t P s = P t+s für alle t, s ≥ 0; 2. kP t k ≤ 1 für alle t ≥ 0; 3. lim P t (x) = x für alle x ∈ X. t→0 Bei der Exponentialfunktion in X = C ist P tx = eat x, x ∈ C, a ∈ C. Dies bedeutet, dass Re(a) ≤ 0 sein muss, weil dann eat = eRe(a) t ≤ 1 für t ≥ 0. Die “Erzeugende” einer Kontraktionshalbgruppe ist formal die Ableitung in t an der Stelle t = 0. Definition 8.3. (Erzeugende einer Kontraktionshalbgruppe) Die Erzeugende A einer Kontraktionshalbgruppe P t ist der (lineare) Operator A : DA ⊂ X → X, definiert durch 1 h DA : = x ∈ X : der Limes lim P (x) − x in X existiert . h→0 h 1 h P (x) − x ∈ X, x ∈ DA . Ax = lim h→0 h 89 8 HALBGRUPPEN Sicher ist 0 ∈ DA und DA ist ein linearer Unterraum von X. Es ist sogar ein dichter Unterraum, wie wir später (Theorem 8.1) zeigen werden. Beispiel (Translationsgruppe). Sei X = Lp (0, ∞), p ≥ 1. Definiere P t ∈ L(X) durch P t u(x) := u(x + t) , t ≥ 0. Sei k · kp die p-Norm in Lp (0, ∞). Dann konvergiert Z ∞ Z ∞ t p t→∞ p p P u = |u(x + t)| dx = |u(s)| ds −−−→ 0 p 0 t nach Lebesgue. Es folgt die Kontraktionseigenschaft für t ≥ 0 Z ∞ t p p p P u ≤ |u(s)| ds = u . p 0 Durch punktweises Ableiten nach t in t = 0 erhalten wir formal A = gende. Genauer: d dx als Erzeu- Lemma 8.1 (Erzeugende von P t ). Für die Erzeugende A der Translationsgruppe gilt: 1. DA = H 1, p (0, ∞) ⊂ Lp (0, ∞); 2. Au = d u, u ∈ DA (schwache Ableitung). dx Beweis. Zunächst zeigen wir DA ⊂ H 1,p (0, ∞). Sei u ∈ DA . Dann existiert nach Definition von DA der Grenzwert 1 t P u − u =: Au in Lp (0, ∞). t→0 t lim Dies bedeutet für u ∈ Lp (0, ∞) das Folgende: Sei ϕ ∈ Cc∞ (0, ∞). Dann folgt für t > 0, dass Z ∞ Z ∞ 1 1 u(x + t) − u(x) ϕ(x) dx = u(x) ϕ(x − t) − ϕ(x) dx. t t 0 0 Im Limes t → 0 folgt mit Hölder links und Lebesgue rechts Z ∞ Z ∞ d Au(x) ϕ(x) dx = − u(x) ϕ(x) dx, ϕ ∈ Cc∞ (R). dx 0 0 Nach Voraussetzung sind u und Au in Lp (0, ∞). Nach Definition des Sobolevd u die schwache Ableitung von u und u Raumes H 1,p (0, ∞) ist deshalb Au = dx 1, p liegt in H (0, ∞). Das Lemma folgt, sobald H 1, p (0, ∞) ⊂ DA gezeigt ist. Sei u ∈ H 1, p (0, ∞), d kürze ab u0 := dx u ∈ Lp (0, ∞) für die schwache Ableitung, und benutze Z x u(x) − u(0) = u0 (y) dy. 0 Mit Hölder ist h Z th i i 1 0 0 u(x + t) − u(t) − u0 (x) = 1 u (x + y) − u (x) dy t t 0 p1 Z t 1 p −p 0 0 |u (x + y) − u (x)| dy . ≤t 0 90 8 HALBGRUPPEN Deshalb ist p Z 1 P t (u) − u − u0 = t p 1 [u(x + t) − u0 (x)] − u0 (x) dx t 0 Z tZ ∞ 1 p ≤ |u0 (x + y) − u0 (x)| dx dy t 0 0 Z ∞ t→0 p ≤ max |u0 (x + y) − u0 (x)| dx −−−→ 0. ∞ 0≤y≤t limt→0 1t 0 t (P (u) − u) = u0 in Lp (o, ∞) existiert, ist u ∈ DA und Weil der Limes 0 Au = u . Insgesamt also DA = H 1, p (0, ∞) und A(u) = u0 ist die schwache Ableitung. Theorem 8.1 (Hille-Yosida). Sei X ein Banach-Raum und P t , t ≥ 0, eine Kontraktionshalbgruppe mit Erzeugender A. Dann gilt i) DA = X, und A ist abgeschlossen. ii) P t (DA ) ⊂ DA für t ≥ 0, und AP t u = P t A u, u ∈ DA . iii) Für u ∈ DA ist t 7→ P t (u) ∈ X differenzierbar und d P t u = A P t u = P t Au , t ≥ 0 . dt iv) ρ(A) ⊃ {z ∈ C : Re(z) > 0}, und für Re(z) > 0 gilt Z ∞ −1 e−tz P t u dt, u ∈ X, Rz (u) = (z − A) (u) = 0 (uneigentliches Riemann-Integral für stetige Funktionen), und kRz k ≤ 1 . Re(z) v) Die Kontraktionshalbgruppe P t ist durch A eindeutig bestimmt. Bemerkung: In Analogie zu den Eigenschaften der Exponentialfunktion schreibt man oft symbolisch P t = etA für die Kontraktionshalbgruppe P t mit der Erzeugenden A. Bevor wir Theorem 8.1 beweisen, verwenden wir es, um das Cauchy-Anfangswert-Problem zu lösen: Theorem 8.2 (Cauchy-Anfangswert-Problem). Sei A : DA ⊂ X → X Erzeugende einer Kontraktionshalbgruppe P t ∈ L(X), t ≥ 0 und u ∈ DA gegeben. Dann existiert genau eine differenzierbare Kurve t 7→ x(t) ∈ X für alle t ≥ 0 mit x(t) ∈ DA , d t dt x(t) = Ax(t), t ≥ 0 und x(0) = u. Es ist x(t) = P u. Die stetige Abhängigkeit der Lösungen folgt aus kP t u − P t vk ≤ kP t k ku − vk ≤ ku − vk für alle t ≥ 0. Beweis. 1. Existenz. Für u ∈ DA ist die Funktion t 7→ P t (u) =: u(t) ∈ X in t ≥ 0 stetig differenzierbar und löst das Cauchy-Anfangswert-Problem d u = Au, u(0) = u ∈ DA . dt Dies folgt aus Theorem 8.1 ii) und iii). 91 8 HALBGRUPPEN 2. Eindeutigkeit. Sei t 7→ x(t) ∈ X, t ≥ 0, eine Lösung des Cauchy-AnfangswertProblems mit Anfangsbedingung x(0) = u, d.h. x(t) ist stetig für t ≥ 0 und differenzierbar für t > 0, x(t) ∈ DA und d x(t) = Ax(t), t > 0 dt x(0) = u ∈ DA . Dann ist x(t) = P t (u), wie wir gleich zeigen werden. Sei nun x(t), t ≥ 0 eine Lösung des Anfangswertproblems mit x(0) = u ∈ DA . Sei t > 0 fest. Definiere für 0 ≤ s ≤ t die Funktion s 7−→ P t−s x(s) ∈ X. Wegen x(s) ∈ DA und P t A = AP t auf DA nach Theorem 8.1 erhalten wir durch Differentiation in s d d d t−s t−s x(s) + P t−s x(s) P x(s) = P ds ds ds = −AP t−s x(s) + P t−s Ax(s) = 0. Nach dem nachfolgenden Lemma 8.2 ist daher P t−s x(s) = c für alle 0 ≤ s ≤ t. Evaluation in s = 0 einerseits liefert c = P t x(0) = P t u, Evaluation in s = t andererseits ergibt c = P 0 u(t) = x(t), sodass x(t) = P t u wie behauptet. Lemma 8.2. Sei x : [a, b] → X, x 7→ x(t), stetig und Dann ist x(t) = x(a) für a ≤ t ≤ b, d.h. konstant. d dt x(t) = 0 für a < t < b. Beweis. Sei x(τ ) 6= x(a) für ein τ . Nach Hahn-Banach existiert ein λ ∈ X ∗ mit λ x(τ ) 6= λ x(a) (8.1) Die Funktion f : [a, b] → C , f (t) = λ x(t) ist stetig, und d d f (t) = λ x(t) = λ(0) = 0 für alle a < t < b. dt dt Mit dem Mittelwertsatz folgt also f (t) = f (a) für alle t, im Widerspruch zu (8.1). Beweis von Theorem 8.2. Beweis von ii) und iii). Für u ∈ X und s > 0 gilt wegen der Gruppenstruktur 1 1 1 P t+s − P t u = (P s − 1) P t u = P t (P s − 1) u. s s s Für u ∈ DA konvergiert nach Definition von A der letzte Term gegen P t Au für s → 0. Daher konvergiert auch der mittlere Term und deshalb ist P t u ∈ DA und AP t u = P t Au. Damit ist die Existenz der rechtsseitigen Ableitung von P t u gezeigt. Analog zeigt man, dass für t > 0 die linksseitige Ableitung von P t u existiert und gleich P t Au ist, indem man − betrachtet. 1 1 P t−s − P t u = P t−s (P s − 1) u s s 92 8 HALBGRUPPEN Beweis von iv). Sei Re(z) > 0. Definiere Qz ∈ L(X) als das uneigentliche Riemann-Integral Qz (u) := lim N →∞ Z N e −zt t P u dt = 0 Z ∞ e−zt P t u dt 0 für u ∈ X. Der Limes existiert nach dem Cauchy-Kriterium, und Z ∞ Z ∞ −zt t 1 e P u dt ≤ kQz (u)k ≤ e−t Re(z) dt kuk = kuk. Re(z) 0 0 Es folgt kQz k ≤ 1 Re(z) . Wie man leicht verifiziert, gilt die folgende Identität: Z ∞ 1 1 s 1 s e−zt P t (P s − 1)u dt (P − 1) Qz (u) = Qz (P − 1) u = s s s 0 Z Z 1 ∞ −zt t s 1 ∞ −zt t = e P P u dt − e P u dt s 0 s 0 (mit den Substitutionen s + t → τ im ersten und t → τ im zweiten Integral) Z Z 1 zs ∞ −zτ τ 1 ∞ −zτ τ e e P u dτ − e P u dτ s s 0 s Z ∞ Z 1 s −zτ τ 1 e−zτ P τ u dτ − ezs e P u dτ = (ezs − 1) s s 0 0 Z 1 1 s −zt t = (ezs − 1) Qz (u) − ezs e P u dt. s s 0 = Für u ∈ X konvergiert die letzte Zeile für s → 0 gegen zQz (u)−u. Daher konvergiert auch der erste Term für s → 0. Deshalb gilt nach Definition von A, dass Qz (u) ∈ DA und AQz (u) = zQz (u) − u. Wir haben bewiesen, dass (z − A) Qz (u) = u, u ∈ X. Sei nun u ∈ DA . Dann konvergiert nach Definition von DA der zweite Term für s → 0 gegen Qz (Au), sodass Qz (Au) = zQz (u) − u und somit Qz (z − A)(u) = u , u ∈ DA . −1 Insgesamt ist also Qz = (z − A) = Rz für Re(z) > 0, und iv) ist bewiesen. Beweis von i). Wegen iv) ist ρ(A) 6= ∅ und A = Ā ein abgeschlossener Operator. Wir zeigen DA = X und benutzen dazu folgendes Lemma: Lemma 8.3. Für u ∈ X und t ≥ 0 gilt Z 1 t+ε s lim P u ds = P t u. ε→0 ε t Beweis. Es gilt Z t+ε Z t+ε 1 1 s t s t P u − P u ds P u ds − P u = ε ε t t ε→0 ≤ max P s − P t u −−−→ 0, t≤s≤t+ε was zu zeigen war. 93 8 HALBGRUPPEN Wegen P 0 u = u genügt es wegen Lemma 8.3 zu zeigen, dass für jedes u ∈ X und ε > 0 Z ε P t u dt uε := 0 ein Element von DA ist. Sei ε > 0 und 0 < h < ε. Dann gilt Z Z 1 h 1 h s 1 ε+h s P u ds − P u ds. (P − 1)uε = h h ε h 0 Mit Lemma 8.3 konvergiert die rechte Seite für h → 0 in X gegen P ε u − u. Nach Definition von DA und A ist daher uε ∈ DA und Auε = P ε u − u. Zusammenfassend: Rε Lemma 8.4. Für u ∈ X und ε > 0 gilt A 0 P t u dt = P ε u − u. 2 Für u ∈ DA ist P t u stetig differenzierbar und deshalb Z ε Z ε d t ε AP t u dt, P u dt = P u−u= 0 0 dt sodass mit Lemma 8.3 die folgende Formel gilt: Z ε Z ε Z t A AP t u dt = P u dt = 0 0 ε 0 P t Au dt , u ∈ DA . Beweis von v). Für zwei Kontraktionshalbgruppen P t und Qt mit derselben Erzeugenden A zeigen wir P t = Qt . Sei t > 0 und u ∈ DA , dann ist die Funktion s 7→ P t−s Qs u , 0 ≤ s ≤ t differenzierbar in s, nach Lemma 8.2 daher konstant. Evaluation der Funktion an der Stelle s = 0 und s = t liefert P t Q0 u = P t u = P 0 Qt u = Q t u , u ∈ DA . Wegen DA = X folgt P t u = Qt u für alle u ∈ X und P t = Qt , t ≥ 0. Damit ist der Beweis von Theorem 8.1 fertig. Bemerkung: Wir haben uns bisher auf Kontraktionshalbgruppen beschränkt, das heisst, es galt jeweils kP t k ≤ 1. Wir können die Theoreme 8.1 und 8.2 auf allgemeine Halbgruppen verallgemeinern: Es sei P t eine Halbgruppe mit Erzeuender A, dann ist nach Satz 8.1 kP t k ≤ aebt für t ≥ 0, a ≥ 1 und b ≥ 0. Es gelten dieselben Aussagen wie in den Theoremen 8.1 und 8.2 mit den folgenden Änderungen: ρ(A) ⊃ {z ∈ C|Re(z) > b} und, falls Re(z) > b Z ∞ Rz u = e−zt P t u dt, u ∈ X und 0 n kRz k ≤ a (Re(z) − b)n Der folgende Satz macht die Bedeutung der Halbgruppen für das Cauchy-Anfangswert-Problem deutlich. Theorem 8.3 (Hille,1952). Sei A : DA ⊂ X → X ein linearer Operator auf dem Banach-Raum X mit D A = X, und ρ(A) 6= ∅. Das Cauchy-Anfangswert-Problem u̇(t) = Au(t) , u(0) = x ∈ DA , hat genau dann eine eindeutige Lösung u(t) ∈ DA , t ≥ 0, welche stetig differenzierbar ist auf [0, ∞) für jede Anfangsbedingung x ∈ DA , falls A Erzeugende einer Halbgruppe P t ∈ L(X), t ≥ 0 ist. Die Lösung ist dann u(t) = P t (x). 94 8 HALBGRUPPEN Beweis. Siehe in A. Pazy:“Semigroups of linear operators and applications to PDE”, Springer 1983, p.102. Bisher können wir schon einiges über Halbgruppe und deren Erzeugende aussagen, doch: Woran erkennen wir, dass ein Operator A : DA ⊂ X → X Erzeugende einer Halbgruppe ist? Und wie lässt sich aus der Erzeugenden die Halbgruppe konstruieren? Die Antwort dazu liefern die nachfolgenden Theoreme 8.4 bis 8.6 Theorem 8.4 (Hille-Yosida). Für A : DA ⊂ X → X in einem Banach-Raum X sind äquivalent 1. A ist Erzeugende einer Kontraktionshalbgruppe. 2. DA ist dicht und es gibt eine Folge λn ∈ ρ(A), λn > 0, λn → ∞, sodass −1 k(λn − A)k ≤ 1 . λn Beweis. i) ⇒ ii) folgt unmittelbar aus Theorem 8.1, ii) ⇒ i) beweisen wir in vier Schritten: 1. Approximiere A durch An ∈ L(X). 2. Definiere P t als Limes von etAn . 3. Zeige, dass P t , t ≥ 0 eine Kontraktionshalbgruppe ist. 4. Zeige, dass A die Erzeugende von P t ist. Schritt 1. Sei λn ∈ ρ(A) wie in Theorem 8.4.ii). Definiere An ∈ L(X) durch An := λn A(λn − A) −1 = λn 2 (λn − A) −1 − λn . Lemma 8.5. Mit den obigen Bezeichnungen ist lim An u = Au, u ∈ DA . n→∞ Beweis von Lemma 8.5. Weil die Resolvente mit dem Operator A auf DA ver−1 tauscht (Satz 7.3), gilt für u ∈ DA , dass An u = λn (λn − A) Au. Es genügt daher zu zeigen, dass −1 lim λn (λn − A) v = v, v ∈ X. n→∞ Für v ∈ DA folgt dies aus v = (λn − A) −1 (λn − A) v = λn (λn − A) −1 v − (λn − A) −1 Av weil der letzte Term wegen (λn − A)−1 Av ≤ (λn − A)−1 kAvk ≤ 1 kAvk λn für n → ∞ nach 0 konvergiert (Annahme an λn ). Da nach Voraussetzung DA ⊂ X −1 dicht ist, und da kλn (λn − A) k ≤ 1, so folgt die Behauptung für jedes v ∈ X und der Beweis von Lemma 8.5 ist fertig. Schritt 2. Definiere mittels der Exponentialreihe für beschränkte Operatoren die Familie Pnt ∈ L(X) durch 2 −1 Pnt := etAn = etλn (λn −A) e−tλn . 95 8 HALBGRUPPEN Wegen (λn − A)−1 ≤ 1 λn gilt 2 kPnt k ≤ e−tλn eλn tk(λn −A) −1 k ≤ e−tλn etλn = 1. Für jedes n ∈ N ist Pnt eine stark stetige Kontraktionshalbgruppe mit der Erzeugenden An ∈ L(X). Die Resolventen kommutieren, daher auch die Operatoren An und deshalb auch Pnt und Am . Somit gilt t t Pnt Pm = etAn etAm = etAn +tAm = etAm etAn = Pm Pnt , und daher ist Z t d t−s s t−s s Pm Pn u ds = Pm Pn (An − Am ) u ds. 0 0 ds t Wegen kPnt k ≤ 1 folgt (Pnt − Pm )u ≤ t k(An − Am ) uk. Wir schliessen, dass für u ∈ DA der Grenzwert P t u := lim Pnt u ∈ X t u= Pnt − Pm Z t n→∞ gleichmässig in t auf beschränkten Intervallen existiert. Weil D A = X und kPnt k ≤ 1 ist, gilt dies auch für alle u ∈ X, und es folgt: Lemma 8.6. Der Grenzwert P t u := limn→∞ Pnt u, u ∈ X existiert gleichmässig in t auf beschränkten Intervallen. 2 Schritt 3. Es ist P t , t ≥ 0, eine Kontraktionshalbgruppe. Die Gruppeneigenschaften und die Kontraktionseigenschaften folgen aus denjenigen für Pnt im Limes n → ∞. Ebenso folgt die Stetigkeitseigenschaft limn→0 P t u = u für alle u ∈ X aus der gleichmässigen Konvergenz auf beschränkten Intervallen. Schritt 4. Wir zeigen zuerst, dass A die Erzeugende von P t ist. Für u ∈ DA ist Z t Z t d Pnt u − u = (Pns u) ds = Pns An u ds 0 ds 0 Z t = (Pns Au + Pns (An − A) u) ds. 0 Mit n → ∞ folgt aus der gleichmässigen Konvergenz auf beschränkten Zeitintervallen und Lemma 8.5 die Formel Z t P tu − u = P s Au ds , u ∈ DA , 0 und daher für u ∈ DA 1 1 P t u − u = lim t→0 t t→0 t lim Z t P s Au ds = P 0 Au = Au. Sei nun B die Erzeugende der Kontraktionshalbgruppe P t . Dann ist, wie schon bewiesen, DA ⊂ DB und Au = Bu für u ∈ DA , das heisst, A ⊂ B. Wähle λ = λn für ein n. Dann folgt aus den Voraussetzungen für A und aus den Eigenschaften von B in Theorem 8.1, dass λ ∈ ρ(A) ∩ ρ(B). Insbesondere sind die Operatoren (λ − A) und (λ − B) beide injektiv und surjektiv und aus A ⊂ B folgt deshalb A = B. Der Beweis von Theorem 8.4 ist fertig. Ganz analog wie in Theorem 8.4 beweist man das Kriterium für stark stetige Halbgruppen: 96 8 HALBGRUPPEN Theorem 8.5 (Hille-Yosida). Die Abbildung A : DA ⊂ X → X auf dem BanachRaum X ist Erzeugende einer stark stetigen Halbgruppe P t ∈ L(X), t ≥ 0 mit kP t k ≤ aebt , t ≥ 0 genau dann, falls 1. DA in X dicht ist und 2. ρ(A) ⊃ {λ ∈ R|λ > b} und, für λ > b kRλ n k = k (λ − A)−1 n k≤ a , n = 1, 2, . . . (λ − b)n Im Beweis von Theorem 8.4 ist die folgende Konstruktion der Halbgruppe aus ihrer Erzeugenden gezeigt worden. Theorem 8.6 (Konstruktion der Erzeugenden). Die Kontraktionshalbgruppe P t , t ≥ 0 im Banach-Raum X habe die Erzeugende A. Definiere für 0 < λ, λ ∈ ρ(A) −1 den beschränkten Operator A¯λ = λA(λ − A) . Dann gilt limλ→∞ Aλ u = u für u ∈ DA , und P t u = limλ→∞ etAλ u, u ∈ X, wobei der Limes gleichmässig in t auf beschränkten Zeitintervallen ist. Es gibt auch noch andere Exponentialformeln für Kontraktionshalbgruppen mit Erzeugender A (zum Beweis siehe zum Beispiel im oben erwähnten Buch von A. Pazy, Seiten 82ff.): Definiere Ah ∈ L(X) durch Ah := Ph − 1 ∈ L(X), h > 0. h Dann ist der Grenzübergang P t x = lim etAh x, x ∈ X h&0 gleichmässig in t auf abgeschlossenen Intervallen [0, T ], T > 0. Wie sich leicht zeigen −n , und analog folgt für x ∈ X lässt, ist eta = lim 1 − ta n n→∞ t P x = lim n→∞ tA 1− n −n x = lim n→∞ −1 n n −A t t n , denn für t > 0 ist nt ∈ ρ(A) für grosse n. Der Limes ist gleichmässig in t auf abgeschlossenen Intervallen. Praktisch nützlich ist die Feststellung, dass die Erzeugende oft durch kleine Definitionsbereiche schon völlig bestimmt ist. Theorem 8.7 (E. Nelson). Sei A : DA ⊂ X → X die Erzeugende der Kontraktionshalbgruppe P t , t ≥ 0. Ist D ⊂ X ein dichter Teilraum mit D ⊂ DA und P t (D) ⊂ D für alle t ≥ 0, so ist A = A|D . Beweis. Kürze ab, A0 := A|D , sodass A0 ⊂ A. Weil A = Ā abgeschlossen ist, ist A0 abschliessbar und Ā0 ⊂ A. Es genügt zu zeigen, dass λ ∈ ρ(Ā0 ) für λ > 0. Denn dann ist nach Theorem 8.1 λ ∈ ρ(Ā0 ) ∩ ρ(A) und die Operatoren (λ − Ā0 ) und (λ − A) sind beide injektiv und surjektiv. Wegen Ā0 ⊂ A folgt somit Ā0 = A. 1. Behauptung: Es ist (8.2) Wλ−A0 = X für λ > 0. Wir beweisen dies indirekt und nehmen an, dass Wλ−A0 6= X. Nach einer Folgerung von Hahn-Banach (Satz 4.3) existiert ein ϕ ∈ X ∗ , ϕ 6= 0, sodass ϕ(x) = 0 97 8 HALBGRUPPEN für alle x = (λ − A0 )u, u ∈ D. Wegen P t (D) ⊂ D folgt somit ϕ ((λ − A0 ) P t u) = 0 für alle u ∈ D und t ≥ 0. Da ϕ linear und stetig ist und D ⊂ DA , folgt mit den Eigenschaften von P t in Theorem 8.1, dass λ ϕ(P t u) = ϕ(λP t u) = ϕ(A0 P t u) = ϕ(AP t u) = ϕ( = d t P u) dt d ϕ(P t u). dt Für t = 0 ist ϕ(P 0 u) = ϕ(u). Da die Lösung des Cauchy-Anfangswert-Problemes für gewöhnliche Differentialgleichungen eindeutig ist, schliessen wir ϕ(P t u) = eλt ϕ(u) , t ≥ 0. Aus |ϕ(P t u)| ≤ kϕk kP t uk ≤ kϕk kuk und λ > 0 folgt ϕ(u) = 0. Dies gilt für alle u ∈ D, und weil D = X ist, erhalten wir ϕ(u) = 0 für alle u ∈ X, im Widerspruch zu ϕ 6= 0. Damit ist die Gleichung (8.2) bewiesen. 2. Behauptung: Es gilt Wλ−Ā0 = X , λ > 0 : (8.3) Für x ∈ X existiert nach (8.2) eine Folge un ∈ D mit x = lim (λ − A0 )un . Nach n→∞ Theorem 8.1 ist λ ∈ ρ(A) und k(λ − A) uk ≥ λkuk , u ∈ DA . Wegen A0 ⊂ A folgt, dass un eine Cauchy-Folge ist, sodass un → u in X. Weil auch (λ − A0 )un → x, erhalten wir u ∈ Dλ−Ā0 und (λ − Ā0 )u = x, nach Definition des Abschlusses eines abschliessbaren Operators. Dies gilt für jedes x ∈ X, und (8.3) ist bewiesen. Nach (8.3) ist (λ − Ā0 ) surjektiv. Wegen λ − Ā0 u ≥ λkuk, u ∈ DĀ0 ist der Operator (λ − Ā0 ) auch injektiv und somit λ ∈ ρ(Ā0 ), wie gewünscht. Beispiel (Translationsgruppe). Die Translationsgruppe P t u(x) = u(x + t), t ≥ 0 in X = Lp (0, ∞), p ≥ 1 hat die Erzeugende A= d , DA = H 1, p (0, ∞). dx Sei D = Cc∞ (0, ∞) ∩ Lp (0, ∞). Dann ist D ⊂ DA , D = X und P t (D) ⊂ D, und deshalb folgt aus Theorem 8.7 d A= . dx D Wir kommen zu einer nützlichen Verallgemeinerung der Charakterisierung einer Erzeugenden einer Kontraktionshalbgruppe. Zur Erinnerung zuerst ein einfacher Satz. Satz 8.2. 1. Ist A : DA ⊂ X → Y abschliessbar mit injektivem Abschluss Ā, so ist (Ā) −1 = A−1 . 2. Sei A injektiv und seien A und A−1 beide abschliessbar, dann ist Ā injektiv −1 und somit (Ā) = A−1 nach i). 98 8 HALBGRUPPEN −1 Beweis. Beweis von i). Es ist A ⊂ Ā, daher ist A injektiv und A−1 ⊂ (Ā) . −1 Nach Satz 3.4 ist (Ā) abgeschlossen und daher A−1 abschliessbar und A−1 ⊂ −1 (Ā) . Sei y ∈ D(Ā)−1 , dann ist y = Ā(x) für ein x ∈ DĀ . Nach der Definition des Abschlusses von A ist x = lim xn und y = lim Axn für eine Folge xn ∈ DA . Daher: A−1 (Axn ) = xn → x und Axn → y und somit, nach Definition des Abschlusses von A−1 , y ∈ DA−1 und A−1 (y) = x. Wir haben bewiesen, dass DA−1 = D(Ā)−1 . Beweis von ii). Sei Āx = 0, dann existiert eine Folge xn ∈ DA mit x = limn→∞ xn und 0 = lim Axn . Deshalb A−1 (Axn ) = xn → x und somit (0, x) ∈ ΓA−1 . Weil A−1 abschliessbar ist, folgt x = 0, und Ā ist injektiv. Theorem 8.8. Sei X ein Banach-Raum. Für A : DA ⊂ X → X sind die folgenden Aussagen äquivalent: 1. Ā existiert und ist Erzeugende einer Kontraktionshalbgruppe. 2. DA ist dicht, und für alle λ > 0 ist Wλ−A dicht in X und k(λ − A)uk ≥ λkuk , u ∈ DA . Beweis. i) ⇒ ii) folgt aus Theorem 8.1. ii) ⇒ i). Sei λ > 0. Aus der Abschätzung in ii) folgt, dass (A − λ) eine bijektive Abbildung DA → Wλ−A ist, und (λ − A)−1 u ≤ λ1 kuk für u ∈ Wλ−A . Daher ist −1 (λ − A) : Wλ−A ⊂ X → X stetig, und weil nach Voraussetzungen Wλ−A dicht in X ist, gibt es eine stetige Erweiterung (λ − 1) −1 1 −1 (λ − A) u ≤ kuk, λ ∈ L(X), und es gilt: u ∈ X. (8.4) Falls auch Ā existiert, so folgt aus ii) dass (λ − Ā) injektiv ist und daher ist nach −1 −1 −1 Satz 8.2 λ − Ā = (λ − A) , und somit λ − (Ā) u ≤ λ1 kuk für alle u ∈ X. Deshalb ist λ ∈ ρ(Ā) und Ā ist nach Theorem 8.4 Erzeugende einer Kontraktionshalbgruppe. Es bleibt also noch zu zeigen, dass A abschliessbar ist. Wir zeigen zuerst, dass (8.5) lim λ λ − A−1 u = u , für alle u ∈ X. λ→∞ Zum Beweis sei zunächst u ∈ DA . Dann gilt u = (λ − A) −1 (λ − A)u = λ (λ − A) −1 u − (λ − A) −1 Au −1 und (8.5) folgt aus (8.4) für u ∈ DA . Weil λ (λ − A) ≤ 1 nach (8.4), und weil DA dicht ist, folgt (8.5) für alle u ∈ X. Sei nun un ∈ DA mit limn→∞ un = 0 und limn→∞ Aun = v. Wir haben zu zeigen, dass v = 0 ist. Nehme λn > 0 mit λn → ∞ und wähle eine Teilfolge unk , sodass limk→∞ (λk unk ) = 0 ist. Dann ist −1 limk→∞ ((λk − A) unk + v) = 0 und wegen kλk (λk − A) k ≤ 1 folgt mit (8.5) −1 0 = lim λk (λk − A) (λk − A)unk + v k→∞ = lim λk unk + λk (λk − A)−1 v = lim λk (λk − A)−1 v = v. k→∞ k→∞ Also ist v = 0, und A ist abschliessbar. Zum Abschluss dieses Abschnittes beweisen wir noch die Behauptung, die wir ganz zu Beginn als Motivation für die Einführung der stark stetigen Halbgruppen angeführt hatten: 99 8 HALBGRUPPEN Satz 8.3 (uniform stetige Halbgruppe). Sei P t ∈ L(X), t ≥ 0 eine Halbgruppe im Banach-Raum X mit lim kP t − 1k = 0. (8.6) t&0 Dann existiert ein A ∈ L(X) so, dass P t = etA = X (tA)n , n! n≥0 wobei die Reihe in L(X) konvergiert. Beweis. Mit den Eigenschaften von Halbgruppe folgt aus der Stetigkeit (8.6), dass t 7→ P t (x) stetig ist für alle t ≥ 0, genau wie im Beweis von Satz 8.1. Dann ist t 7→ P t (x) ∈ L(X) Riemann-integrabel und Z Z τ 1 τ s s 1 − 1 (1 − P ) ds P ds = τ 0 τ Z τ0 1 ≤ k1 − P s k ds τ 0 ≤ max k1 − P s k −→ 0, τ → 0. 0≤s≤τ Rτ Wir können daher τ > 0 so klein wählen, dass 1 − τ1 0 P s ds < 1. Dann ist mit Theorem 2.2 Z Z 1 τ s 1 τ s 1− 1− P ds = P ds τ 0 τ 0 ein stetiger Isomorphismus und daher auch Z τ B := P s ds. 0 Es folgt 1 1 h (P − 1)B = h h = = 1 h 1 h Z Z τ P s+t 0 τ +h h Z τ +h τ 1 ds − h P t dt − 1 h P t dt − 1 h Z Z Z τ P s ds und mit s + h = t 0 τ P t dt 0 h 0 h→0 P t dt −−−→ P τ − 1 ∈ L(X), 0 mit P = 1. Daraus folgt, dass lim h&0 1 h (P − 1) = (P τ − 1)B −1 =: A ∈ L(X). h Das heisst, die Erzeugende von P t ist A ∈ L(X). Andererseits hat auch etA die Erzeugende A, und wegen der Eindeutigkeit der Erzeugenden (Theorem 8.1) ist somit P t = etA für t ≥ 0. 8.5 Unitäre Gruppen auf H Sei H ein Hilbertraum, dann kann man die zu einer Kontraktionshalbgruppe konjugierte Gruppe ebenfalls in H definieren. 100 8 HALBGRUPPEN Satz 8.4. Sei A der Erzeuger der Kontraktionshalbgruppe P t , t ≥ 0 im Hilbertraum ∗ H. Dann ist (P t ) , t ≥ 0 eine Kontraktionshalbgruppe in H mit Erzeuger A∗ . Formal: ∗ ∗ etA = etA , t ≥ 0. Zuerst eine Bemerkung. Lemma 8.7. Sei H ein Hilbertraum. Dann gilt A ∈ L (H) =⇒ A∗ ∈ L (H) und kAk = kA∗ k . Beweis. Übungsaufgabe. ∗ Beweis von Satz 8.4. (P t ) ist eine Kontraktionshalbgruppe in H, denn ∗ ∗ P 0 = 1∗ = 1 und P t = P t ≤ 1 für alle t ≥ 0 (Lemma 8.7) und die Gruppenstruktur ist klar. Die Stetigkeit folgt aus 2 ∗ ∗ t ∗ u − u = P t u − u, P t u − u P ∗ ∗ ∗ 2 2 = P t u + kuk − P t u, u − u, P t u ∗ 2 2 = P t u + kuk − u, P t u − P t u, u 2 2 ≤ kuk + kuk − u, P t u − P t u, u = − u, P t u − u − P t u − u, u ≤ 2 kuk P t u − u −→ 0 für t & 0. ∗ Somit ist (P t ) stark stetig in t = 0 und deshalb für alle t ≥ 0 (Satz 8.1). ∗ Sei A der Erzeuger von P t und B der Erzeuger von (P t ) , somit bleibt B = A∗ zu zeigen. 1. B ⊂ A∗ : Sei u ∈ DA und v ∈ DB , dann gilt 1 P tu − u , v t&0 t 1 t ∗ = lim u, P v−v t&0 t (Au, v) = lim = (u, Bv) . Nach Definition der Adjungierten, weil (Au, v) stetig in u ∈ DA ist, folgt v ∈ DA∗ und A∗ v = Bv, somit B ⊂ A∗ . 2. A∗ ⊂ B: 101 8 HALBGRUPPEN Sei u ∈ DA und v ∈ DA∗ , dann gilt ∗ u, P t v − v = P tu − u , v = Zt = Zt d Hille-Yosida (P s u, v) ds = ds 0 0 Zt (AP s u, v) ds 0 ∗ u, (P s ) A∗ v ds = u, Zt 0 ∗ (P s ) A∗ v ds . Da dies für alle u ∈ DA gilt und DA = H, so folgt 1 1 t ∗ P v−v = t t Zt ∗ (P s ) A∗ v ds 0 ∗ für alle t > 0. Die rechte Seite konvergiert für t & 0 gegen A∗ v, da P 0 = 1. ∗ Nach Definition des Erzeugers von (P t ) , folgt daher v ∈ DB und Bv = A∗ v, somit A∗ ⊂ B. Insgesamt deshalb A∗ = B. Definition 8.4. (Unitär) Sei H ein Hilbertraum. Ein U ∈ L (H) heisst unitär, falls U ∗U = 1 = U U ∗, gilt, oder äquivalent, U ∈ L (H) bijektiv ist und U −1 = U ∗ gilt. Folgerung: Ein unitärer Operator U ist eine surjektive Isometrie, denn es gilt (U x, U y) = (x, U ∗ U y) = (x, y) für alle x, y ∈ H, daher auch, kU xk = kxk für alle x ∈ H. Definition 8.5. (Unitäre Gruppe) Eine 1-parametrige unitäre Gruppe in H ist eine Familie U t ∈ L (H), t ∈ R sodass 1. U 0 = 1, U t U s = U t+s für alle t,s ∈ R 2. U t ist unitär 3. limt7→0 U t x = x, für jedes x ∈ H. 102 8 HALBGRUPPEN Folgerung: t U x = kxk , für t ∈ R, x ∈ H t U = 1 ∗ −1 Ut = Ut = U −t , für t ∈ R. Erzeuger: Der Erzeuger A einer 1-parametrige unitären Gruppe U t , t ∈ R ist wie früher definiert, nämlich 1 U t u − u , u ∈ DA Au = lim t→0 t 1 DA = u ∈ H lim U t u − u existiert . t→0 t Theorem 8.9 (Stone). Für einen Operator A : DA ⊂ H −→ H, DA = H im Hilbertraum H sind äquivalent: 1. A ist Erzeuger einer 1-parametrige unitären Gruppe U t , t ∈ R. 2. A∗ = −A. 3. S = S ∗ , wobei A = iS. Erzeuger: Es gibt einen 1-1 deutigen Zusammenhang zwischen selbstadjungierten Operatoren S im Hilbertraum H und unitären Gruppen U t , t ∈ R, man schreibt oft formal: U t = eitS , S = S ∗ . ∗ Beweis. 2.) ⇐⇒ 3.): (iS) = −iS ∗ . 1.) =⇒ 2.): (Satz 8.4) Sei U t eine unitäre Gruppe. Dann ist Ut deshalb für u ∈ H, t ∈ R, − ∗ = Ut −1 = U −t , 1 1 t ∗ U −t − 1 u = U − 1 u. −t t Nach Satz 8.4 (für Gruppen) ist A Erzeuger von U t genau dann, wenn A∗ Erzeuger ∗ ist von (U t ) . Daher folgt für t → 0 u ∈ D A ⇔ u ∈ D A∗ und −Au = A∗ u, für u ∈ DA = DA∗ , insgesamt A∗ = −A. 2.) =⇒ 1.): (Theorem 7.1, Lemma 7.1, Theorem 8.4) Sei A∗ = −A. Definiere S durch A = iS, dann ist S ∗ = S selbstadjungiert. Wir wissen aus Theorem 7.1, dass σ (S) reel ist, daher σ (A) = σ (iS) = iσ (S) ⊂ iR und σ (−A) = σ (−iS) = −iσ (S) ⊂ iR. 103 8 HALBGRUPPEN Aus S ∗ = S folgt mit Theorem 7.1 und Lemma 7.1, dass 1 −1 (z − S) ≤ |Im z| für alle Im z 6= 0. Daher, für alle Re z 6= 0, −1 (z ± A) ≤ 1 . |Re z| Es folgt daher aus Hille-Yosida (Theorem 8.4), dass A und −A Erzeuger sind von Kontraktionshalbgruppen. Sei P t , t ≥ 0 die Kontraktionshalbgruppe mit Erzeuger A Qt , t ≥ 0 die Kontraktionshalbgruppe mit Erzeuger − A. Definiere U t , t ∈ R durch Ut = P t , für t ≥ 0 , Q , für − t ≥ 0 −t dann ist U t stark stetig in t = 0. Beh: U t , t ∈ R ist unitär. Bew: Sei u ∈ DA , dann ist die Ableitung der Funktion t 7→ P t Qt u, t ≥ 0 nach Hille-Yosida (Theorem 8.4), d P t Qt u = AP t Qt u + P t − AQt u = 0, dt also gleich null, und deshalb (Lemma 8.3) die Funktion konstant in t. Für t = 0 ist sie die Identität somit, weil DA = H, P t Qt = 1, t ≥ 0, (*) Qt P t = 1, t ≥ 0. (*) und ebenso t t Weil kP k ≤ 1 und kQ k ≤ 1 für t ≥ 0 (Hille-Yosida, Theorem 8.4) folgt kuk = P t Qt u ≤ Qt u ≤ kuk , sodass kuk = kQt uk und ebenso kuk = kP t uk für t ≥ 0. Die Operatoren P t , Qt sind isometrisch und wegen (∗) auch surjektiv. Mit der Polarisationsidentität für das Skalarprodukt folgt für U t , t ≥ 0 ∗ (x, y) = U t x, U t y = x, U t U t y ∗ für alle x, y ∈ H. Folglich (U t ) U t = 1, sodass U t ein unitärer Operator ist. Die Gruppenstruktur von U t folgt aus der Halbgruppenstruktur von P t , Qt , t ≥ 0 und (∗). Der Erzeuger von U t ist offenbar A = iS. Dynamische Bedeutung von selbstadjungierten Operatoren: Sei S = S ∗ im Hilbertraum. Dann existiert eine eindeutige Lösung des C.A.W.P u̇ (t) = iSu (t) , t ∈ R u (0) = u ∈ DS 104 8 HALBGRUPPEN in H für alle Zeiten t ∈ R. Die Lösung t 7→ u (t) : R −→ H ist stetig differenziertbar und u (t) ∈ DA für alle t ∈ R. Diese Lösung ist gegeben durch die von iS erzeugte unitäre Gruppe u (t) = U t u = eitS u, t ∈ R. Zudem gilt der Erhaltungssatz ku (t)k = U t u = ku (0)k , t ∈ R und die Lösung hängt stetig ab von den Anfangsbedingungen u ∈ DA . Problem mit Zukunft und Vergangenheit! Wie die Gruppe U t aussieht hängt ab von den linearen Invarianten des Erzeugers iS, d.h. von der Spektralzerlegung des Operators S = S ∗ , ähnlich wie in endlichen Dimensionen, wo man die Jordan-Normalform zur Verfügung hat. Beispiel. Sei λ ∈ σp (S), dann ist λ reel und es gibt ein u ∈ DS mit Su = λu. Es folgt dann (wie in Hille-Yosida) d t U u = U t (iS) u = iλU t u. dt Andererseits ist auch u (t) = eitλ u eine Lösung desselben C.A.W.P, aus der Eindeutigkeit folgt daher U t u = eitλ u und wir erhalten eine periodische Lösung. 8.6 Kontraktionshalbgruppen in Hilberträumen t Sei P , t ≥ 0 eine Kontraktionshalbgruppe im Hilbertraum H, dann gilt t P u, u ≤ P t u kuk ≤ kuk2 = (u, u) für t ≥ 0 und u ∈ H. Daher sodass Re P t u − u, u = Re P t u, u − (u, u) ≤ P t u, u − (u, u) ≤ 0 Re 1 P tu − u , u ≤ 0 t gilt für t > 0, u ∈ H. Sei A der Erzeuger von P t , so folgt für t → 0 Re (Au, u) ≤ 0 für u ∈ DA . Definition 8.6. Ein Operator A : DA ⊂ H −→ H heisst dissipativ, falls Re (Au, u) ≤ 0 für alle u ∈ H. 105 8 HALBGRUPPEN Beispiel (Multiplikationsoperatoren in L2 (Ω) ). Sei Au := au für a : Ω −→ C messbar und DA := u ∈ L2 (Ω) | au ∈ L2 (Ω) . Für Re a ≤ 0 ist der Operator A ist dissipativ, denn dann gilt Z Z Re (au, u) = Re auū = Re a |u|2 ≤ 0. Ω Ω Satz 8.5. Für einen dissipativen Operator A : DA ⊂ H −→ H gilt. 1. k(z − A) uk ≥ Re z kuk für u ∈ DA , z ∈ C. 2. Falls es ein z0 in {Re z > 0} mit Wz0 −A = H gibt, so gehört die ganze offene Halbebene {Re z > 0} zur Resolventenmenge ρ (A) und es gilt dort: Beweis. 1.): −1 (z − A) u ≤ 1 . Re z k(z − A) uk kuk ≥ |((z − A) u, u)| ≥ Re ((z − A) u, u) = Re z (u, u) − Re (Au, u) | {z } 2 ≤0 ≥ Re z kuk 2.): Folgt aus 1.) genau so wie im Beweis von Theorem 7.2 Aus Satz 8.5 und Theorem 8.4 (Hille-Yosida) folgt unmittelbar. Theorem 8.10 (Lumer-Phillips). Für einen Operator A : DA ⊂ H −→ H im Hilbertraum H sind äquivalent: 1. A ist Erzeuger einer Kontraktionshalbgruppe. 2. A ist ein dicht definierter, dissipativer Operator, und es gibt ein z0 in {Re z > 0} mit Wz0 −A = H. 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 9 106 Beispiele von Kontraktionshalbgruppen 9.1 Flüsse von Vektorfeldern Es sei V : R → R ein C 1 -Vektorfeld, dann existiert ein lokaler Fluss. Wir nehmen nun an, das Vektorfeld erzeuge einen globalen Fluss (dies ist der Fall, wenn zum Beispiel |V (x)| ≤ α + β|x| ∀x ∈ Rn , das heisst, die Lösungen x(t) = ϕt (x) des Cauchy-Anfangswert-Problems d t ϕ (x) = V ϕt (x) dt ϕ0 (x) = x t∈R existieren für alle t ∈ R und alle Anfangsbedingungen x ∈ Rn . Wird t festgehalten, dann ist die Abbildung ϕt : Rn −→ Rn , x 7−→ ϕt (x) ein C ∞ -Diffeomorphismus von Rn auf sich selbst. Weil das Vektorfeld V nicht zeitabhängig ist, folgt aus der Eindeutigkeit der Lösungen des Cauchy-AnfangswertProblems die Gruppeneigenschaft ϕt ϕs (x) = ϕs+t (x) = ϕs ϕt (x) für alle s, t ∈ R und alle x ∈ Rn . Mit anderen Worten, die Familie {ϕt }t∈R von C ∞ Diffeomorphismen bilden zusammen eine Gruppe unter der Komposition ϕs ◦ ϕt = ϕt ◦ ϕs = ϕs+t , s, t ∈ R mit Neutralelement ϕ0 = id und der Inversen (ϕt )−1 = ϕ−t . Diese Gruppe induziert eine 1-parametrige Gruppe P t , t ∈ R, von linearen Abbildungen im Vektorraum F := {u : Rn → R}, Pt : F → F (P t u)(x) = u ϕt (x) u ∈ F, x ∈ Rn Wir wollen nun die folgende Frage beantworten: Wann ist P t eine Kontraktionshalbgruppe in Lp (Rn )? Definition 9.1. (Divergenz) Die Divergenz eines Vektorfeldes V = (V1 , . . . , Vn ) ist der Operator div, definiert durch n X ∂ Vj (x) ∈ R. div V (x) = ∂x j j=1 Für die Ableitung von ϕt : Rn → Rn schreiben wir dϕt (x) = ∂ t ϕ (x) ∂x ∈ L(X). dϕt (x) heisst Jacobi-Matrix von ϕt an der Stelle x ∈ Rn . Satz 9.1 (Liouville). Es sei ω(t) = det dϕt (x) für x ∈ Rn fest. Dann ist ω̇(t) = div V ϕt (x) ω(t), ω(0) = 1, und deshalb det dϕt (x) = exp Z t 0 div V ϕs (x) ds . 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 107 d t Beweis. Wir leiten dt ϕ (x) = V ϕt (x) nach x ab unter der Benutzung der Kettenregel und beachten, dass ϕ0 (x) = x ist. Es ist damit d dϕt (x) = dV ϕt (x) dϕt (x) dt dϕ0 (x) = 1 t Halten wir nun x fest und schreiben zur Abkürzung X(t) := dϕ (x) und A(t) := t dV ϕ (x) , dann ist ( Ẋ(t) = A(t) X(t) t ∈ R X(0) = 1 und wir können mit Taylor schreiben X(t + h) = X(t) + hẊ(t) + o(h) = X(t) + hA(t)X(t) + o(h) = 1 + hA(t) X(t) + o(h), wobei o(h) eine Funktion in L(Rn ) ist mit ω(t) = det(X(t)) 1 h o(h) → 0 für h → 0. Es folgt nun für ω(t + h) = det 1 + hA(t) det X(t) + o(h) = 1 + h[tr A(t)] ω(t) + o(h) und nach Umformung 1 ω(t + h) − ω(t) = [tr A(t)] ω(t) + o(h) h h und, mit h → 0, ω̇(t) = [tr A(t)] ω(t) ∈ R. Dies ist eine lineare Differentialgleichung erster Ordnung für ω, deren Lösung wir sofort angeben können: Z t tr A(s) ds ω(0). ω(t) = exp 0 Mit ω(0) = det X(0) = det(1) = 1 und tr A(t) = tr dV ϕt (x) = div V ϕt (x) folgt die Behauptung des Satzes. Der Satz liefert uns auch eine Interpretation von div V . Es ist d div V (x) = det dϕt (x) . dt t=0 Daraus wiederum folgen die beiden Beziehungen div V (x) ≥ 0 ∀x ∈ Rn ⇐⇒ det dϕt (x) ≥ 1 ∀x ∈ Rn , t ≥ 0, div V (x) = 0 ∀x ∈ Rn ⇐⇒ det dϕt (x) = 1 ∀x ∈ Rn , t ∈ R, deren Bedeutung im folgenden Satz klarer wird. Satz 9.2. Es sei V : Rn → Rn ein C 1 -Vektorfeld. 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 108 i) Sei div V (x) ≥ 0 für alle x ∈ Rn , dann ist P t : Lp (Rn ) → Lp (Rn ), t≥0 eine stark stetige Kontraktionshalbgruppe für alle p ≥ 1. ii) Ist div V (x) = 0 für alle x ∈ Rn , so ist P t : Lp (Rn ) → Lp (Rn ), t∈R eine stark stetige Gruppe von Isometrien für p ≥ 1. Beweis. Wir beweisen nur die Aussage i). Mit den Transformationsformeln der Integralrechnung folgt für t ≥ 0 Z Z u ϕt (x) p det dϕt (x) dx kukpLp = |u(x)|p dx = {z } | Rn Rn ≥ Z Rn ≥1 u ϕt (x) p dx = kP t ukp p , L u ∈ Lp (Rn ). Es ist daher für alle u ∈ Lp (Rn ) und t ≥ 0 kP t ukLp ≤ kukLp . Auf der dichten Teilmenge Cc∞ (Rn ) ⊂ Lp (Rn ) gilt nach dem Majorantensatz von Lebesgue Z t→0 u ϕt (x) − u(x)p dx − −−→ 0, kP t u − ukpLp = Rn weil der Integrand punktweise gegen 0 konvergiert und eine L1 -Majorante existiert. Da kP t k ≤ 1 für t ≥ 0 und Cc∞ (Rn ) = Lp (Rn ), so folgt lim P t u = u in Lp (Rn ) t&0 für alle u ∈ Lp (Rn ), das heisst, P t ist eine stark stetige Kontraktionshalbgruppe. Beispiel (Lineare Vektorfelder). Wir betrachten Vektorfelder der Form V (x) = ax für a ∈ L(Rn ). Wir erhalten dann ϕt (x) = eta , t P (u) = u e ta div V (x) = tr a. , t∈R x ∈ Rn Daraus folgt, dass det dϕt (x) = et tr(a) unabhängig von x ist. In diesem Spezialfall erhalten wir eine stark stetige Gruppe P t ∈ L(Lp (Rn )) für alle p ≥ 1 und alle t ∈ R. Für die Norm von P t u gilt dann t kP t ukLp = e− p tr(a) kukLp , t ∈ R. Ist tr(a) ≥ 0, so ist P t eine Kontraktionshalbgruppe für t ≥ 0, ist tr(a) = 0, so ist P t für alle t ∈ R eine Isometrie. t 1 n Wie sieht die Erzeugende der Halbgruppe P aus? Nehmen wir ein u ∈ Cc (R ), t dann können wir u ϕ (x) für festes x punktweise in t differenzieren: d t d u ϕt (x) = du ϕt (x) ϕ (x) = du ϕt (x) V ϕt (x) dt dt = ∇u ϕt (x) , V ϕt (x) , 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 109 wobei ∇ den Gradienten und h , i das Euklidische Skalarprodukt auf Rn bezeichnet. Evaluation der letzten Gleichung in t = 0 ergibt d t u ϕ (x) = h∇u(x), V (x)i. dt t=0 Daraus folgt 1 1 t→0 u ϕt (x) − u(x) − h∇u(x), V (x)i = o(t) −−−→ 0. t t (9.1) Nun definieren wir A0 als Differentialoperator erster Ordnung mit variablen Koeffizienten auf D0 = Cc1 (Rn ) ⊂ Lp (Rn ) durch A0 : D0 ⊂ Lp (Rn ) −→ Lp (Rn ) n X ∂ u(x), x ∈ Rn , u ∈ D0 . A0 u (x) = Vj (x) ∂x j j=1 Dann ist A0 u ∈ Cc0 (Rn ). Es sei A : DA ⊂ Lp (Rn ) → Lp (Rn ) die Erzeugende von P t , t ≥ 0. Dann gilt, nach der Definiton der Erzeugenden, für u ∈ DA 1 t t&0 (P u − u) − Au − p −−→ 0. t L Andererseits folgt aus (9.1) für u ∈ D0 nach Lebesgue 1 t t&0 (P u − u) − A0 u − t p −−→ 0. L Nach Definiton der Erzeugenden folgt, dass u ∈ DA und Au = A0 u, also A|D0 = A0 . Weil D0 = Lp (Rn ) und Cc∞ (Rn ) ⊂ Cc1 (Rn ), ist P t (D0 ) ⊂ D0 für alle t ≥ 0. Aus Theorem 8.7 folgt A = A|D0 Bemerkung: Es ist daher es gibt eine Folge uj ∈ D0 = Cc1 (Rn ) DA = u ∈ Lp (Rn ) mit u = limj→∞ uj in Lp (Rn ) und A0 uj ist eine Cauchy-Folge in Lp (Rn ) sowie Au = lim A0 uj ∈ Lp (Rn ). j→∞ Wir haben soeben bewiesen: Theorem 9.1. Es sei V : Rn → Rn ein C 1 -Vektorfeld mit globalem Fluss ϕt (x), t ∈ R und x ∈ Rn , mit div V (x) ≥ 0 für alle x ∈ Rn . Wir definieren P t u(x) := u ϕt (x) , x ∈ Rn , t ≥ 0. Dann ist P t ∈ L(Lp (Rn )), t ≥ 0, eine stark stetige Kontraktionshalbgruppe mit der Erzeugenden A = A|D0 , wobei D0 = Cc1 (Rn ) und A|D0 = n X j=1 Vj (x) ∂ ∂xj die Ableitung in Richtung des Vektorfeldes V ist. 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 110 Bemerkung: Ist in Theorem 9.1 das Vektorfeld aus C ∞ , so sind die ϕt alle C ∞ Diffeomorphismen und wir können D0 ersetzen durch Cc∞ (Rn ) ⊂ Cc1 (Rn ). Beispiel (Lineare Vektorfelder, Forts.). Wie wir bereits gesehen haben, ist P t = eat für V (x) = ax mit a ∈ L(Rn ) und tr(a) ≥ 0 eine Kontraktionshalbgruppe in Lp (Rn ) mit Erzeugender n X ∂ A= (ax)j ∂xj ∞ n Cc (R ) j=1 nach Theorem 9.1. 9.2 Unitäre Gruppen auf L2 (Rn ) Wir betrachten nun den Hilbertraum L2 (Rn ). Falls V : Rn −→ Rn ein C ∞ Vektorfeld mit div V = 0 ist, dessen Fluss ϕt (x) für alle x ∈ Rn und alle t ∈ R t 2 n existiert, so ist U ∈ L L (R ) , t ∈ R, definiert durch U t u (x) = u ϕt (x) , t ∈ R für u ∈ L2 (Rn ), eine stark stetige, 1-parametrige unitäre Gruppe und es folgt die zu Theorem 9.1 analoge Aussage. Theorem 9.2 (Selbstadjungierte Operatoren). Sei V : Rn −→ Rn ein C ∞ -Vektorfeld mit globalem Fluss und div V = 0. Dann definiert U t u (x) = u ϕt (x) , t ∈ R für u ∈ L2 (Rn ) eine stark stetige, 1-parametrige unitäre Gruppe U t im Hilbertraum L2 (Rn ) mit Erzeuger A = A|D , wobei D = Cc∞ (Rn ) und A|D = n X Vj (x) j=1 ∂ , ∂xj mit V (x) = (V1 (x) , . . . , Vn (x)). Nach dem Satz von Stone (Theorem 8.9) ist der Operator 1 S= A i selbstadjungiert im Hilbertraum L2 (Rn ). Beispiele: Translation und Impulsoperator: Sei V (x) = e ∈ Rn ein konstantes Vektorfeld auf Rn . Dann ist div V = 0 und der Fluss von V ist explizit gegeben durch die Formel ϕt (x) = x + te, t ∈ R, x ∈ Rn . Der Erzeuger der unitären Gruppe (U t u) (x) = u (x + te), t ∈ R im Hilbertraum L2 (Rn ) ist gegeben durch A = A|D , wobei D = Cc∞ (Rn ) und A|D = n X j=1 ej ∂ . ∂xj Der Operator S = 1i A ist selbstadjungiert im Hilbertraum L2 (Rn ). Er heisst der zur Translationsgruppe x 7→ x + te gehörige quantenmechanische Impulsoperator in Richtung e. 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 111 Drehungen und Drehimpulsoperator: Sei V (x) = ax ein lineares Vektorfeld auf Rn mit der reellen Matrix a ∈ L (Rn ). Dann ist der Fluss von V explizit gegeben durch die Exponentialfunktion ϕt (x) = eta x, t ∈ R, x ∈ Rn . Nehme nun an, dass a schiefsymmetrisch ist, d.h. aT = −a, dann ist div V = 0 und eta eine orthogonale 1-parametrige Gruppe, d.h. eine Drehgruppe. Denn T −1 T eta = eta = e−ta = eta . Für den Erzeuger A der unitären Gruppe (U t u) (x) = u (eta x), t ∈ R im Hilbertraum L2 (Rn ) gilt A = A|D , wobei D = Cc∞ (Rn ) und A|D = ∂ ax, ∂x = n X aij xj i,j=1 ∂ . ∂xi ∂ ist selbstadjungiert in L2 (Rn ) . Er heisst der zur Der Operator 1i A = 1i ax, ∂x |D ta Drehgruppe e gehörige quantenmechanische Drehimpulsoperator. Sei zum Beispiel 0 1 0 a = −1 0 0 0(n−2)×(n−2) und x = (x1 , . . . , xn ) ∈ Rn , dann folgt ax = (x2 , −x1 , 0, . . . , 0) und somit cos t sin t 0 . eta = − sin t cos t 0 1(n−2)×(n−2) ∂ ∂ − x1 ∂x2 ist selbstadjungiert in L2 (Rn ) . Die dazugehörige Der Operator 1i x2 ∂x1 |D unitäre Gruppe U t in L2 (Rn ) ist periodisch, U t+2π = U t , t ∈ R. Hamiltonsche Vektorfelder: Zu einer C ∞ -Funktion h : R2n −→ R gehört das sogenannte Hamiltonsche Vektorfeld V (x) = J∇h (x) , x ∈ R2n mit dem Euklidischen Gradienten ∇h (x) ∈ R2n , wobei J die schiefsymmetrische Matrix 0 1n J= ∈ L R2n −1n 0 ist. Es folgt div V = 0. Nehme wiederum an, dass V einenglobalen Fluss ϕt erzeugt. Dies ist zum Beispiel der Fall, wenn alle Energieflächen x ∈ R2n | h (x) = const kompakt sind. Dann ist U t u (x) = u ϕt (x) , t ∈ R für u ∈ L2 (Rn ) eine stark stetige, 1-parametrige unitäre Gruppe U t im Hilbertraum L2 (Rn ) mit Erzeuger A = A|D , wobei D = Cc∞ (Rn ) und ∂ A|D = J∇h (x) , , ∂x Wiederum ist der Operator 1i A selbstadjungiert im Hilbertraum L2 R2n . 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 9.3 112 Wärmeleitungsgleichung Gesucht sind Lösungen u in Lp (Rn ), p ≥ 1 für t ≥ 0 der Wärmeleitungsgleichung ∂ t>0 ∂t u(t, x) = ∆u(x, t), (9.2) u(0, x) = u(x), t=0 bei vorgegebenen Anfangsbedingungen u(x) in Lp (Rn ). Wir suchen spezielle Lösungen der partiellen Differentialgleichung, nämlich solche in einem vorgegebenen Banach-Raum. Pn ∂ 2 Der Operator ∆ = hat konstante Koeffizienten. Wir betrachten i=i ∂xj 2 n daher zuerst p = 2, das heisst L (R ) und benutzen Fouriertransformation, um zu den Lösungen zu gelangen. Fouriertransformation: Wir arbeiten auf dem Schwartz-Raum S , welcher wie folgt definiert ist: S (Rn ) := {u ∈ C ∞ (Rn )| sup |xα Dβ u(x)| < ∞ ∀α, β}, x∈Rn mit Cc∞ (Rn ) ⊂ S (Rn ) ⊂ L2 (Rn ), wobei wir folgende Notation verwenden: αn 1 α2 xα = x α 1 x2 . . . x n α = (α1 , . . . , αn ) x = (x1 , . . . xn ) Dβ = D1β1 D2β2 . . . Dnβn Dj = ∂ ∂xj Die Fouriertransformation F : S (Rn ) → S (Rn ) ist definiert als die lineare Abbildung Z 1 fˆ(ξ) := F [f ] (ξ) = e−ihx,ξi f (x) dx. (9.3) (2π)n/2 Rn Die Fouriertransformation ist eine Bijektion von S (R n ) auf S (Rn ) mit der Inversen Z 1 ˆ (x) f (x) = F −1 [f] eihx,ξi fˆ(ξ) dξ. (2π)n/2 Rn Dies folgt aus den Formeln Dα fˆ(ξ) = F [(−ix)α f ] (ξ), (iξ)α fˆ(ξ) = F [Dα f ] (ξ). Nach dem Satz von Plancherel ist kûkL2 = kukL2 für u ∈ S (Rn ), das heisst, die Fouriertransformation F ist eine Isometrie in der L2 -Norm von S (Rn ) auf S (Rn ). Weil S (Rn ) ⊂ L2 (Rn ) dicht ist, existiert eine eindeutige stetige Fortsetzung von F zu einer Isometrie von L2 (Rn ) auf sich. Diese Fortsetzung wird wieder mit F bezeichnet, obwohl die Integralformel (9.3) nicht gilt für f 6∈ L1 (Rn ). Führen wir die Fouriertransformation der partiellen Differentialgleichung (9.2) in der Variablen x mit Parameter t und ut (x) := u(t, x) durch, so ergibt sich formal wegen i2 = −1: d ût (ξ) = −|ξ|2 ût (ξ) t ≥ 0 dt û0 (ξ) = û(ξ). Halten wir ξ fest, so ist dies eine gewöhnliche Differentialgleichung in t, deren Lösung 2 ût (ξ) = e−t|ξ| û(ξ) lautet. Dies führt zu t≥0 113 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN Definition 9.2. (Kontraktionshalbgruppe P̂ t ) Es bezeichne 2 P̂ t u(ξ) = e−t|ξ| u(ξ) für ξ ∈ Rn , t ≥ 0 und u ∈ L2 (Rn ). Aus Lebesgue folgt, dass dies eine stark stetige Kontraktionshalbgruppe in L2 (Rn ) ist für t ≥ 0. Diese Kontraktionshalbgruppe kann auf L2 (Rn ) nicht für t < 0 fortgesetzt werden! Lemma 9.1. Die Erzeugende A : DA ⊂ L2 (Rn ) → L2 (Rn ) der Kontraktionshalbgruppe P̂ t ist der Multiplikationsoperator Au(ξ) = −|ξ|2 u(ξ) ξ ∈ Rn definiert auf DA := {u ∈ L2 (Rn ) |ξ|2 u ∈ L2 (Rn )}. Beweis. Es sei zuerst u ∈ DA . Dann gilt nach Definition der Erzeugenden 1 t t&0 P̂ u − u −−−→ Au in L2 (Rn ). t Es folgt für alle ϕ ∈ Cc∞ (Rn ) Z 1 t P̂ − 1 uϕ dξ Rn t Z = ↓ Auϕ dξ Rn = Z Z u Rn 1 −t|ξ|2 e − 1 ϕ dξ t ↓ u(−|ξ|2 )ϕ dξ Rn für n → 0 wegen Hölder und Lebesgue. Dies gilt für alle ϕ ∈ Cc∞ (Rn ). Daher ist nach Theorem 5.3 −|ξ|2 u = Au ∈ L2 (Rn ), und darum A ⊂ −|ξ|2 . Sei nun u ∈ L2 (Rn ) so, dass |ξ|2 u ∈ L2 (Rn ). Dann gilt punktweise 1 t P̂ u(ξ) − u(ξ) + |ξ|2 u(ξ) = |ξ|2 u(ξ) t Z 1 0 1 − e−ts|ξ| 2 t&0 ds −−− → 0, und deshalb, mit dem Satz von Lebesgue, 1 t&0 t 2 P̂ u − u − (−|ξ |)u 2 n −−−→ 0. t L (R ) Nach unserer Defintion der Erzeugenden ist daher u ∈ DA und Au = −|ξ|2 u. Somit ist −|ξ|2 ⊂ A. Insgesamt ist also −|ξ|2 = A. Nach dem Theorem von Nelson (oder auch direkt) folgt A = −|ξ|2 S (Rn ) . Rücktransformation der Gruppe P̂ t , t ≥ 0: Wir definieren eine stark stetige Kontraktionshalbgruppe L2 (Rn ) → L2 (Rn ) durch die unitäre Äquivalenz der Fouriertransformation 2 P t u = F −1 P̂ t F u = F −1 e−t|ξ| û 114 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN für u ∈ L2 (Rn ). Dies ist eine Kontraktionshalbgruppe im x-Raum. Doch: wie sieht sie aus? Für die Fouriertransformation der Faltung gilt auf S (Rn ) ˆ f[ ∗ u(ξ) = (2π)n/2 f(ξ)û(ξ) und für die Exponentialfunktion gilt die Formel g(x) = 2 1 e|x| /(4a) n/2 (2a) ĝ(ξ) = e−a|ξ| 2 2 d t u(ξ) = e−t|ξ| û(ξ), so erhalten wir für alle a > 0. Wenden wir dies an auf P P t u(x) = pt ∗ u(x) t>0 2 1 pt (x) = e−|x| /(4t) (4πt)n/2 Wir definieren nun P t : L2 (Rn ) → L2 (Rn ) durch Z 2 1 P t u(x) = e|x−y| /(4t) u(y) dy n/2 (4πt) Rn P 0 u(x) = u(x) t>0 (9.4) t = 0. Dies ist eine stark stetige Kontraktionshalbgruppe in L2 (Rn ), symbolisch schreiben wir P t = et∆“. ” Für die Erzeugende erhalten wir A = ∆ = F −1 − |ξ|2 F DA = H 2,2 (Rn ), wobei für Sobolev-Räume gilt (Übungsaufgabe) F H 2,2 (Rn ) = û ∈ L2 (Rn )|(1 + |ξ|2 )û ∈ L2 (Rn ) = D|ξ|2 . Zudem gilt ∆ = ∆|S (Rn ) . Aus Theorem 9.1 folgt, dass zu jeder Anfangsbedingung u ∈ H 2,2 (Rn ) genau eine Funktion t 7→ u(t) ∈ L2 (Rn ), t ≥ 0, existiert, sodass d dt u(t) = ∆u(t) t ≥ 0 . u(0) = u Es ist dann u(t) = P t u, t ≥ 0. Aus der Formel (9.4) erhalten wir zusätzliche Eigenschaften: u ≥ 0 =⇒ P t u ≥ 0 ∀t ≥ 0, u ∈ L2 (Rn ) =⇒ P t u ∈ L2 (Rn ) ∩ C ∞ (Rn ), 0 6= u ∈ L2 (Rn ), u ≥ 0 =⇒ supp(P t u) = Rn , t ≥ 0. Insbesondere ist u(t, x) = P t u(x) für t > 0, u ∈ L2 (Rn ), eine klassische Lösung der partiellen Differentialgleichung ∂ u(t, x) = ∆u(t, x). ∂t Es gibt auch andere klassische Lösungen, zum Beispiel sogenannte Nulllösungen. Diese sind nicht in L2 (Rn ) für alle t ≥ 0. 9 BEISPIELE VON KONTRAKTIONSHALBGRUPPEN 115 Die Formel (9.4) für P t definiert eine Kontraktionshalbgruppe in jedem Lp (Rn ) mit p ≥ 1, nicht nur für p = 2. Die Eigenschaft der Kontraktion folgt aus dem Faltungssatz 5.1 und aus Z kpt kL1 = pt (x) dx = p̂t (0) = 1 Rn für t > 0. Die starke Stetigkeit von P t in t = 0, das heisst, lim P t u = u in Lp (Rn ), t&0 folgt analog zu Theorem 5.1 9.4 Freie Schrödinger-Gleichung Wir suchen Lösungen u ∈ L2 (Rn ) der freien Schrödinger-Gleichung ∂ ∂t u(t, x) = i∆u(t, x) t ∈ R u(0, x) = u(x) (9.5) Die Fouriertransformation liefert in diesem Fall d ût (ξ) = −i|ξ|2 ût (ξ). dt Die Lösungen (in t) dieser gewöhnlichen Differentialgleichung führen zur unitären Gruppe Û t ∈ L2 (Rn ), t ∈ R, mit 2 Û t u(ξ) = e−it|ξ| u(ξ) ∀ t ∈ R, u ∈ L2 (Rn ). Es gilt offensichtlich t Û u L2 (Rn ) = kukL2 (Rn ) t ∈ R, u ∈ L2 (Rn ). Die Erzeugende A der Gruppe lautet A = −i|ξ|2 und ist definiert auf 2unitären 2 n 2 DA = {u ∈ L (R ) |ξ| u ∈ L (Rn )}. Die Rücktransformation liefert die unitäre Gruppe 2 U t u = F −1 e−it|ξ| F [u] t∈R U t ∈ L(L2 (Rn )) mit der Erzeugenden i∆ = F −1 − i|ξ|2 F (u) auf dem Definitonsbereich Di∆ = H 2,2 (Rn ), es gilt zudem i∆ = i∆S (Rn ) . Für spezielle Anfangsbedingungen u erhalten wir eine spezielle Lösungsformel für U t u: Es sei u ∈ S (Rn ), dann ist Z 2 2 1 U t u(x) =: u(t, x) = F −1 e−it|ξ| F (u) = eihx,ξi e−it|ξ| û(ξ) dξ. (2π)n/2 Rn Es ist u(t, ·) ∈ S (Rn ) eine klassische Lösung der partiellen Differentialgleichung (9.5). Nach Theorem 9.1 existiert zu jeder Anfangsbedingung u ∈ H 2,2 (Rn ) genau eine stetig differenzierbare Funktion R → L2 (Rn ), t 7→ u(t) ∈ L2 (Rn ), welche die Schrödingergleichung 1∂ t∈R i ∂t u(t, x) = ∆u(t, x), u(0, x) = u(x) ∈ H 2,2 (Rn ), t = 0 löst. Es gilt t ku(t)kL2 (Rn ) = ku(0)kL2 (Rn ) und es ist u(t) = P u, t ∈ R. t∈R 116 A DAS RIEMANN-INTEGRAL A Das Riemann-Integral Wir definieren das Riemann-Integral für stetige Funktionen auf kompakten Intervallen mit Werten in Banach-Räumen. Sei [a, b] ein kompaktes Intervall, und X ein Banach-Raum. Sei B = B ([a, b], X) der Banach-Raum aller beschränkten Funktionen f : [a, b] → X, mit der Supremumsnorm kf k := sup kf (t)k a≤t≤b Eine Stufenfunktion ϕ : [a, b] → X ist eine Funktion, für die eine Partition P : a0 = a < a1 < · · · < an = b des Intervalles existiert, und Elemente u1 , u2 , . . . , un ∈ X, sodass ϕ(t) = uj für aj−1 < t < aj und j = 1, 2, . . . , n. Sind ϕ und ψ zwei Stufenfunktionen, so existiert eine gemeinsame Verfeinerung P ihrer Partitionen, sodass ϕ und ψ Stufenfunktionen bezüglich der Partition P sind. Die Menge S aller Stufenfunktionen auf [a, b] ist daher ein linearer Teilraum von B. Das Integral einer Stufenfunktion ϕ : [a, b] → X mit Partition P ist das Element von X definiert durch IP (ϕ) := n X j=1 (aj − aj−1 ) uj ∈ X. Das Integral ist unabhängig von der Wahl der Partition, und man schreibt dafür I(ϕ) := IP (ϕ) = Z b ϕ ∈ S. ϕ, a Die Abbildung I : S → X ist linear und stetig wegen kI(ϕ)k ≤ (b − a)kϕk. Wir können deshalb die lineare Abbildung I : S → X eindeutig stetig auf den Abschluss S von S im Banach-Raum erweitern. Diese Erweiterung bezeichnen wir ebenfalls mit I. Man nennt die Funktionen in S, welche also gleichmässige Limites von Stufenfunktionen sind, Regelfunktionen . Weil eine stetige Funktion f : [a, b] → X gleichmässig stetig ist, folgt C ([a, b], X) ⊂ S, und wir haben das Integral I insbesondere für stetige Funktionen definiert. Die üblichen Eigenschaften des Riemann-Integrals I folgen aus denjenigen für Stufenfunktionen durch Limesbildung bezüglich der Supremumsnorm. Speziell gelten für stetige Funktionen f ∈ C([a, b], X) die folgenden Aussagen: 1. I : C([a, b]) → X ist stetig. R R b b 2. a f ≤ a kf (t)k dt ≤ (b − a)kf k. Rb Rc Rb 3. a < c < b ⇒ a f = a f + c f . Rt d f (s) ds = f (t) ∈ X. 4. dt a 5. Mit Lemma 8.3 und 4.) folgt für t 7→ u(t) ∈ X stetig differenzierbar u(b) − u(a) = Z b a d u(t) dt . dt 6. Seien X und Y Banach-Räume. Dann gilt für A ∈ L(X, Y ), dass ! Z Z b b f (t) dt A a A f (t) dt . = a 117 A DAS RIEMANN-INTEGRAL 7. Das uneigentliche Riemann-Integral für eine stetige Funktion f : [a, ∞] → X ist wie üblich definiert als Z ∞ Z N f (t) dt := lim f (t) dt ∈ X , a N →∞ falls der Limes rechts in X existiert. a Index C m,β , 58 H m,p (Ω), 54 Lp (Ω), 47 W m,p (Ω), 52, 54 ◦ Hm,p (Ω), 55 Glättung, 48 gleichgradig stetig, 8 Graph, 33 linearer, 37 Grenzwert, 3 Abbildung lineare, 21 Ableitung schwache, 51 Abschluss, 4 eines Operators, 37 Annihilator, 45 Approximation, 49 Approximationstheorem, 72 Halbgruppe, 87 Halbordnung, 40 Hamiltonsche Vektorfelder, 111 Hilbert-Raum, 76 Baire-Kategorie, 10 Banach-Raum, 18 Basis algebraische, 22 beschränkt gleichmässig, 14 punktweise, 14 Bi-Dualraum, 64 Bildbereich, 33 Cauchy-Anfangswert-Problem, 90 Cauchy-Folge, 4 Definitionsbereich, 33 dicht definiert, 77 Differentialoperator, 38 Dirac-Folge, 48 Dirichlet-Randwertproblem, 59 Divergenz, 106 Drehimpulsoperator, 111 Dualraum, 43, 64 Durchmesser, 3 Eigenwert, 80 Einbettung kanonische, 65 Element maximales, 40 Erhaltungssatz, 104 Erzeugende, 87 Kontraktionshalbgruppe, 88 Faltung, 47 Satz von der, 47 Flüsse von Vektorfeldern, 106 Fouriertransformation, 112 Impulsoperator, 110 Isometrie, 15 Jacobi-Matrix, 106 Kompakt überdeckungs, 6 folgen, 6 relativ, 6 konjugierte Gruppen, 100 Kontraktionshalbgruppe, 88 konvergent, 3 punktweise, 70 schwach, 69 schwach-∗-, 70 Kriterium für Selbstadjungiertheit, 83 Kugel offene, 3 Lösungsfluss, 86 Lemma von Riesz, 23 Morrey, 57 Zorn, 40 Menge abgeschlossene, 4 dichte, 4 Inneres einer, 12 kompakte, 4 linear geordnete, 40 magere, 10 nirgends dichte, 10 offene, 3 residuelle, 10 schwach (folgen-) abgeschlossene, 72 total geordnete, 40 Metrik, 1 assoziierte, 18 diskrete, 1 Multiplikationsoperator, 113 118 119 INDEX Neumann’sche Reihe, 26 Norm, 18 Normen äquivalente, 19 Operator, 21 abgeschlossener, 33 abschliessbarer, 37 Abschluss eines, 37 adjungierter, 77 dissipativer, 104 formal adjungierter, 76 formal selbstadjungierter, 76 maximaler formal adj., 77 selbstadjungierter, 78 symmetrischer, 78 unitärer, 101 Partition, 116 Poincaré-Ungleichung, 61 Prinzip der gleichm. Beschränktheit, 14 Prinzip der Intervallschachtelung, 5 Prinzip der stetigen Inversen, 33 Produktraum, 28 Projektion, 28 Punkt innerer, 12 Quotientenraum, 28 Raum metrischer, 1 normierter, 18 reflexiver, 65 separabler, 63 vollständiger, 5 Regelfunktion, 116 Relation, binäre, 40 Resolvente, 79 Resolventenmenge, 79 Riemann-Integral uneigentliches, 117 Satz vom abgeschl. Graphen, 35 Satz von Alaoglu-Banach, 74 Arzelà–Ascoli, 8 Baire, 11, 12, 15 Banach, 13 Banach-Steinhaus, 31 Cauchy-Picard-Lindeloff, 86 Dirichlet, Riemann, Hilbert, 61 Hahn-Banach, komplex, 42 Hahn-Banach, reell, 40 Heine-Borel, 7 Hellinger-Toeplitz, 35 Hille, 93 Hille-Yosida, 94 Kato-Rellich, 84 Liouville, 106 Meyers-Serrin, 54 Morrey-Sobolev, 56 Plancherel, 112 Riesz (Darstellungssatz), 69 Satz von der stetigen Inversen, 36 Schrödingergleichung, 115 schwach (folgen-) abgeschlossen, 72 schwach folgen unterhalb stetig, 73 schwach konvergent, 69 schwache Lösung, 60 Schwartz-Raum, 112 Skalarprodukt, 76 Sobolev-Einbettungstheorem, 59 Sobolev-Raum, 52 Spektralradius, 27 Spektrum, 79 Stabilitätssatz, 84 Stufenfunktion, 116 Theorem von Hille-Yosida, 90 Lumer-Phillips, 105 Nelson, 96 Stone, 102 total beschränkt, 6 Uniform stetige Halbgruppe, 99 Unitäre Gruppe, 101 Variationsprinzip, 73 Vervollständigung, 16 Wärmeleitungsgleichung, 112 Wertebereich, 33