Mathematik II für Studierende der Physik Ulf Kühn Department Mathematik Universität Hamburg www.math.uni-hamburg.de/home/kuehn Hamburg, Sommersemester 20081 1 version: July 1, 2008 1 / 327 Inhaltsverzeichnis I 1 Euklidische Vektorräume Orientierung Diagonalisierbarkeit Multilineare Abbildungen Dualraum Symmetrische und schiefymmetrische Bilinearformen Euklidische Vektorräume Normierte Vektorräume Metrische Räume Die Parallelogrammgleichung Orthonormale Basen Die orthogonale Gruppe 2 Hermitesche Vektorräume Die unitäre Gruppe Normalform unitärer Abbildungen Normalform orthogonaler Endomorphismen 2 / 327 Inhaltsverzeichnis II Selbstadjungierte Endomorphismen Normalform selbstadjungierte Endomorphismen Normalform Hermitescher Formen Hauptachsentransformation Normale Endomorphismen 3 Hilberträume Vollständigkeit Vervollständigung Quadratisch summierbare Folgen Orthogonalprojektion Orthonormale Familien Hilbertbasen Stetige lineare Abbildungen, Operatornorm Darstellungssatz von Riesz 4 Topologische Grundbegriffe Kompaktheit 3 / 327 Inhaltsverzeichnis III Kompaktheit Satz von Heine-Borel 5 Differenzialrechnung im kartesischen Raum Partielle Ableitungen Grundbegriffe der Vektoranalysis Differenzierbarkeit Kettenregel Mittelwertsatz Kettenregel Mittelwertsatz Niveaumengen und lokale Extrema Taylorentwicklung Hessematrix und lokale Extrema Umkehrsatz Satz über implizite Funktionen Abbildungen von konstantem Rang 4 / 327 Inhaltsverzeichnis IV Untermannigfaltigkeiten des kartesischen Raums Tangentialraum Extrema mit Nebenbedingungen Gewöhnliche Differenzialgleichungen Parameterabhängige Integrale Anwendung auf gew. DGLn Fourier-Reihen 5 / 327 Vorbemerkung Diese Vorlesung ist eine Fortsetzung der Vorlesung Mathematik I für Studierende der Physik. Die Bezeichnungen in diesem Skript orientieren sich an denen aus dem Handout des vergangenen Semester: www.math.uni-hamburg.de/home/kuehn/mfp1 6 / 327 Orientierung Definition Sei V ein endlichdimensionaler reeller VR. Zwei Basen B = (b1 , . . . , bn ) und B 0 = (b10 , . . . , bn0 ) heißen gleich orientiert, wenn der Basiswechsel F = φB 0 ◦ φ−1 B : V → V positive Determinante hat. Bemerkungen Beachte, dass F (bi ) = bi0 . Die darstellende Matrix von F bez. der Basis B ist n n MB (F ) = φ−1 B ◦ φB 0 : R → R . Daher gilt −1 det(φB 0 ◦ φ−1 B ) = det F = det MB (F ) = det(φB ◦ φB 0 ). 7 / 327 Definition (Äquivalenzrelation) Eine Relation auf einer Menge X ist eine Teilmenge R ⊂ X × X . Wir schreiben x ∼ y für (x, y ) ∈ R. Eine Relation R ⊂ X × X heißt Äquivalenzrelation, wenn sie folgende Eigenschaften hat: (i) x ∼ x für alle x ∈ X , (ii) x ∼ y =⇒ y ∼ x und (iii) x ∼ y ∼ z =⇒ x ∼ z. Jedes Element x ∈ X definiert eine Äquivalenzklasse [x] := {y ∈ X |y ∼ x}. 8 / 327 Satz Sei V ein reeller VR der Dimension n ∈ N. Wir schreiben B ∼ B 0 , falls B und B 0 gleich orientierte Basen von V sind. a) Die Relation “∼” ist eine Äquivalenzrelation auf der Menge der Basen von V . b) Jede Basis B definiert eine Äquivalenzklasse [B] := {B 0 Basis von V |B 0 ∼ B} und es gibt genau zwei Äquivalenzklassen. Beweis. a) ist eine einfache Übungsaufgabe. b) Sei B = (b1 , . . . , bn ) eine Basis. Jede Basis ist entweder gleich orientiert zu B oder zu (−b1 , b2 , . . . , bn ). Daher gibt es genau zwei Äquivalenzklassen. 9 / 327 Definition Sei V ein reeller Vektorraum der Dimension n ∈ N. Eine Orientierung von V ist eine Äquivalenzklasse gleich orientierter Basen von V . Bemerkungen Jede Basis B = (b1 , . . . , bn ) definiert eine Orientierung [B]. Wie wir gesehen haben gibt es genau zwei Orientierungen [B] und [B]op = [(−b1 , b2 , . . . , bn )]. Letztere heißt die zu [B] entgegengesetzte (oder umgekehrte) Orientierung. Automorphismen F ∈ GL(V ) mit det F > 0 heißen orientierungserhaltend, denn FB = (Fb1 , . . . , Fbn ) ∈ [B] für jede Basis B = (b1 , . . . , bn ). F ∈ GL(V ) mit det F < 0 heißt orientierungsumkehrend, denn FB = (Fb1 , . . . , Fbn ) ∈ [B]op für jede Basis B. 10 / 327 Beispiele I Die kanonische Orientierung des Rn ist die durch die kanonische Basis definierte Orientierung [(e1 , . . . , en )]. Die Basen (e2 , e3 , e1 ) und (−e2 , e1 , e3 ) definieren z.B. die kanonische Orientierung des R3 . Die Basis (e2 , e1 , e3 ) definiert die entgegengesetzte Orientierung [(−e1 , e2 , e3 )]. Die Drehung (um die z-Achse) cos ϕ − sin ϕ 0 D = sin ϕ cos ϕ 0 0 0 1 ist wegen det D = 1 > 0 orientierungserhaltend. 11 / 327 Beispiele II Die Spiegelung (an der (x, y )-Ebene) 1 0 0 S = 0 1 0 0 0 −1 ist wegen det S = −1 < 0 orientierungsumkehrend. 12 / 327 Diagonalisierbarkeit Definition Sei V ein K-VR der Dimension n. F ∈ End(V ) heißt diagonalisierbar, wenn es eine Basis B = (b1 , . . . , bn ) von V gibt, so dass die darstellende Matrix von F Diagonalgestalt hat: MB (F ) = diag(λ1 , . . . , λn ), λ1 , . . . , λn ∈ K. Bemerkung Die Basisvektoren bi sind dann Eigenvektoren von F und die Diagonaleinträge λi sind die zugehörigen Eigenwerte λi . F ist also genau dann diagonalisierbar, wenn es eine Basis aus Eigenvektoren gibt. 13 / 327 Satz Das charakteristische Polynom eines diagonalisierbaren Endomorphismus F zerfällt in Linearfaktoren. Beweis. Aus MB (F ) = diag(λ1 , . . . , λn ) folgt PF (t) = det(diag(λ1 − t, . . . , λn − t)) = (λ1 − t) · · · (λn − t) = (−1)n (t − λ1 ) · · · (t − λn ). Bemerkung Beachte die Umkehrung des Satzes gilt nicht immer. 14 / 327 Beispiele I Sei F = 0 −1 1 0 ∈ End(K2 ). Dann gilt PF (t) = t 2 + 1. Für K = R hat PF (t) keine Nullstellen und zerfällt also nicht in Linearfaktoren. Insbesondere ist F nicht diagonalisierbar. (Bemerkung: F ist die 90◦ -Drehung und hat auch deshalb keine Eigenvektoren.) Für K = C zerfällt PF (t) = t 2 + 1 = (t + i)(t − i). Darüber hinaus ist F diagonalisierbar: F (e1 − ie2 ) = e2 + ie1 = i(e1 − ie2 ) F (e1 + ie2 ) = e2 − ie1 = −i(e1 + ie2 ). 15 / 327 Beispiele II Sei F = 1 1 0 1 ∈ End(K2 ). PF (t) = (t − 1)2 zerfällt in Linearfaktoren, aber F ist nicht diagonalisierbar: 1 ist der einzige Eigenwert und V1 = Ke1 . Es gibt also keine Basis aus Eigenvektoren. 16 / 327 Definition (Multiplizität der Nullstellen des char. Polynoms) Sei F ein Endomorphismus eines endlichdimensionalen K-Vektorraums V und λ eine Nullstelle von PF . Wir bezeichnen die Multiplizität von λ mit mλ : PF (t) = (t − λ)mλ Q(t), Q ∈ K[t], Q(λ) 6= 0. 17 / 327 Satz Es sei Vλ der Eigenraum zu λ und nλ := dim Vλ , dann gilt nλ ≤ mλ . Beweis. Sei Bλ = (b1 , . . . , bnλ ) eine Basis des Eigenraums Vλ . Nach dem Basisergänzungssatz können wir Bλ zu einer Basis B von V ergänzen. Dann gilt MB (F ) = λ1nλ 0 ∗ D , wobei D eine quadratische Matrix ist. Daraus ergibt sich PF (t) = (−1)nλ (t − λ)nλ PD (t) und somit nλ ≤ m λ . 18 / 327 Definition (Direkte Summe von mehr als zwei Unterräumen) Sei V ein VR und V1 , V2 , . . . , Vk ⊂ V Unterräume. Wir schreiben V = V1 ⊕ V2 ⊕ · · · ⊕ Vk , falls gilt: (i) V = V1 + V2 + · · · + Vk := {v1 + v2 + · · · + vk |vi ∈ Vi , i = 1, 2, . . . , k} (ii) jedes k-Tupel (v1 , v2 , . . . , vk ) von Vektoren vi ∈ Vi \ 0 ist linear unabhängig. 19 / 327 Satz/ÜA Die folgenden Bedingungen sind äquivalent: (i) V = V1 ⊕ V2 ⊕ · · · ⊕ Vk , (ii) Jeder Vektor v ∈ V hat eine eindeutige Darstellung v = v1 + v2 + · · · + vk mit vi ∈ Vi und (iii) V = (· · · ((V1 ⊕ V2 ) ⊕ V3 ) ⊕ · · · ⊕ Vk−1 ) ⊕ Vk . Bemerkung Für unendlichdimensionale Vektorräume V sind die folgenden Verallgemeinerungen nützlich. Sei (Vi )i∈I eine beliebige (nicht notwendiger Weise endliche) Familie von Unterräumen Vi ⊂ V . P Wir definieren i∈I Vi := span{∪i∈I Vi } und schreiben L P V = i∈I Vi , falls (i) V = i∈I Vi und (ii) jede Familie (vi )i∈I von Vektoren vi ∈ Vi \ 0 linear unabhängig ist. 20 / 327 Satz Sei V ein VR, F ∈ End(V ) und vi , i = 1, . . . , k, seien Eigenvektoren zu paarweise verschiedenen Eigenwerten λi . Dann sind (v1 , . . . , vk ) linear unabhängig. Beweis. Wir führen den Beweis durch Induktion nach k. Für k = 1 ist nichts zu zeigen. Es gelte k ≥ 2. Wir nehmen an, dass (v1 , . . . , vk−1 ) linear unabhängig sind. 21 / 327 Weiter im Beweis: Angenommen es gelte 0 = Pk i=1 ci vi , k X 0= so folgt folgt einerseits λk c i vi i=1 und andererseits durch Anwendung von F 0= k X λi ci vi . i=1 Subtraktion der beiden Gleichungen liefert 0= k−1 X (λk − λi )ci vi i=1 und somit ci = 0 für i = 1, . . . , k − 1. Es folgt P 0 = ki=1 ci vi = ck vk und somit auch ck = 0. 22 / 327 Satz Sei V ein endlichdimensionaler VR und F ∈ End(V ). F ist genau dann diagonalisierbar, wenn das charakteristische Polynom PF in Linearfaktoren zerfällt und mλ = nλ für alle Eigenwerte λ. Beweis. L λ1 , . . . , λk seien die Eigenwerte von F und U = ki=1 Vλi ⊂ V die Summe der Eigenräume. Sei BU eine Basis von U. Nach dem Austauschlemma können wir BU zu einer Basis B von V ergänzen. 23 / 327 Weiter im Beweis: Die darstellende Matrix von F bez. B hat dann die Gestalt A ∗ MB (F ) = , 0 D wobei A die darstellende Matrix der Einschränkung F |U bez. BU ist und D eine (m × m)-Matrix ist. Hierbei ist m = dim V − dim U. Daraus folgt PF (t) = PA (t)Q(t), wobei Q(t) = PD (t), falls m > 0 und Q(t) = 1, falls m = 0. F ist genau dann diagonalisierbar, wenn U = V , d.h. wenn m = 0. m = 0 ist gleichbedeutend mit PF (t) = PA (t) = (λ1 − t)nλ1 · · · (λk − t)nλk . 24 / 327 Multilineare Abbildungen Definition V und W seien K-Vektorräume. Eine Abbildung µ : Vk = V × ··· × V → W (v1 , . . . , vk ) 7→ µ(v1 , . . . , vk ) heißt multilinear (genauer k-linear), wenn µ in jedem der k Argumente linear ist, d.h. wenn µ(v1 , . . . , vi−1 , λv + λ0 v 0 , vi+1 , . . . , vk ) = λµ(v1 , . . . , v , . . . , vk ) + λ0 µ(v1 , . . . , v 0 , . . . , vk ) für alle i = 1, . . . , k, v , v 0 ∈ V , λ, λ0 ∈ K. 25 / 327 Beispiele 1-lineare Abbildungen V → W sind genau lineare Abbildungen. Rb Bespielsweise ist f 7→ a f (x)dx eine Linearform auf dem VR der integrierbaren Funktionen auf dem Intervall [a, b]. 2-lineare Abbildungen V × V → W nennt man auch bilineare Abbildungen. In den Fällen k = 1, 2 spricht man von Linearformen bzw. von Bilinearformen auf V . Multilineare Abbildungen V × · · · × V → K mit Werten in K nennt man auch multilineare Formen. Die Determinante det : Mat(n, K) = (Kn )n → K ist n-linear. 26 / 327 Dualraum Definition (Dualraum) Der Vektorraum aller Linearformen auf V heißt Dualraum von V und wird mit V ∗ bezeichnet. Satz Für jeden endlichdimensionalen VR gilt dim V ∗ = dim V . Beweis. Sei B = (b1 , . . . , bn ) eine Basis von V . Sei b i = bi∗ ∈ V ∗ die Linearform mit b i (bj ) = δij , j = 1, . . . n. Behauptung: Dann ist (b 1 , . . . , b n ) eine Basis von V ∗ (die sogenannte duale Basis) und somit dim V ∗ = n = dim V . 27 / 327 Weiter im Beweis. Pn i sind linear unabhängig, denn aus i Die bP i=1 λi b = 0 folgt n 0 = i=1 λi b i (bj ) = λj für alle j. Sie bilden auch ein P Erzeugendensystem, denn für jede Linearform β ∈ V ∗ gilt β = ni=1 β(bi )b i . Pn Pn i In der Tat: i=1 β(bi )b (bj ) = i=1 β(bi )δij = β(bj ). 28 / 327 Definition Zu jeder linearen Abbildung F : V → W gehört eine lineare Abbildung F ∗ : W ∗ → V ∗, die definiert ist durch F ∗ (w ∗ )(v ) := w ∗ (F (v )), für alle v ∈ V, w ∗ ∈ W ∗. Sie heißt die zu F duale Abbildung. 29 / 327 Satz Sei F : V → W eine lineare Abbildung zwischen endlichdimensionalen K-Vektorräumen. Sei 0 A = MBB (F ) ∈ Mat(m, n, K) ihre darst. Matrix bez. Basen 0 ) von V bzw. W . Dann gilt B = (b1 , . . . , bn ) und B 0 = (b10 , . . . , bm für die darst. Matrix der dualen Abbildung F ∗ : W ∗ → V ∗ bez. der 0 ∗ ) und B ∗ = (b ∗ , . . . , b ∗ ) von W ∗ dualen Basen B 0 ∗ = (b10 ∗ , . . . , bm n 1 bzw. V ∗ : ∗ MBB0 ∗ (F ∗ ) = At ∈ Mat(n, m, K). Beweis. P k 0 Aus F ∗ (bi0 ∗ )(bj ) = bi0 ∗ (Fbj ) = bi0 ∗ ( m k=1 aj bk ) = Pm P Pn m k 0∗ 0 k i i ∗ 0∗ i ∗ k=1 aj bi (bk ) = k=1 aj δk = aj folgt F (bi ) = j=1 aj bj , ∗ d.h. MBB0 ∗ (F ∗ ) = At . 30 / 327 Symmetrische und schiefymmetrische Bilinearformen Definition Eine Bilinearform β :V ×V →K heißt symmetrisch, wenn β(v , w ) = β(w , v ) für alle v , w ∈ V . Sie heißt schiefsymmetrisch, wenn β(v , w ) = −β(w , v ) für alle v, w ∈ V . Die Bilinearform β heißt nicht entartet, wenn die lineare Abbildung v 7→ β(v , ·), V → V ∗ , injektiv ist. (M.a.W. wenn v = 0 der einzige Vektor ist, für den β(v , w ) = 0 für alle w ∈ V .) 31 / 327 Definition Sei α : V × V → K eine Bilinearform und B = (b1 , . . . , bn ) eine Basis von V . Die (n × n)-Matrix A mit den Einträgen αij := α(bi , bj ) heißt darstellende Matrix von α. Bemerkungen/ÜA α ist genau dann symmetrisch bzw. schiefsymmetrisch, wenn A symmetrisch bzw. schiefsymmetrisch ist, d.h. wenn A = At bzw. A = −At . α ist genau dann nicht entartet, wenn A invertierbar ist. (Hinweis: Die darstellende Matrix der linearen Abbildung v 7→ α(v , ·), V → V ∗ , ist At .) 32 / 327 Euklidische Vektorräume Definition Sei V ein reeller VR. Eine symmetrische Bilinearform h·, ·i : V × V → R, (v , w ) 7→ hv , w i heißt positiv definit, wenn für alle v ∈ V \ 0 hv , v i > 0. Ein (Euklidisches) Skalarprodukt auf V ist eine positiv definite symmetrische Bilinearform V × V → R. Ein Euklidischer Vektorraum ist ein reeller VR zusammen mit einem Skalarprodukt darauf. Bemerkung Skalarprodukte sind nicht entartet, denn aus hv , v i = 0 folgt v = 0. 33 / 327 Beispiel Das kanonische Skalarprodukt von Rn ist definiert durch hx, y i := n X xiyi, i=1 wobei x = Pn i=1 x ie i und y = Pn i=1 y des kanonischen Skalarprodukts von ist die Einheitsmatrix 1n , denn ie Rn i. Die darstellende Matrix bez. der kanonischen Basis ( 1, falls i = j hei , ej i = δij := 0 sonst. 34 / 327 Definition Sei V ein Euklidischer VR. Die Länge eines Vektors v ∈ V ist die Zahl kv k := p hv , v i. Der Abstand d(x, y ) zweier Punkte x, y ∈ V ist die Länge des Vektors y − x: d(x, y ) := ky − xk. 35 / 327 Satz (Cauchy-Schwarzsche Ungleichung) Sei V ein Euklidischer VR. Dann gilt für alle v , w ∈ V : |hv , w i| ≤ kv k · kw k, mit Gleichheit genau dann, wenn v und w linear abhängig sind. Beweis. Wir können annehmen, dass v 6= 0 und w 6= 0, denn sonst ist nichts zu zeigen. 36 / 327 Weiter im Beweis: Für alle λ, µ ∈ R gilt 0 ≤ hλv + µw , λv + µw i = λ2 kv k2 + µ2 kw k2 + 2λµhv , w i. q q k kv k und µ = ± Einsetzen von λ = kw kv k kw k liefert die CSU. Gleichheit gilt genau dann, wenn für eine dieser beiden Wahlen λv + µw = 0, d.h. wenn v und w linear abhängig sind. 37 / 327 Definition Sei V ein Euklidischer VR und v , w ∈ V \ 0. Der Winkel ∠(v , w ) zwischen v und w ist definiert als ∠(v , w ) := arccos hv , w i ∈ [0, π]. kv kkw k | {z } ∈[−1,1] Man sagt, dass v , w ∈ V senkrecht aufeinander stehen, wenn hv , w i = 0 und schreibt dafür v ⊥ w . 38 / 327 Normierte Vektorräume Definition Sei V eine K-VR, wobei K = R oder K = C. Eine Norm auf V ist eine Abbildung k · k : V → [0, ∞), v 7→ kv k, mit folgenden Eigenschaften: N1) Für v ∈ V gilt genau dann kv k = 0, wenn v = 0. N2) kλv k = |λ| · kv k für alle v ∈ V , λ ∈ K. N3) kv + w k ≤ kv k + kw k für alle v , w ∈ V ( Dreiecksungleichung). Ein normierter Vektorraum ist ein reeller oder komplexer VR zusammen mit einer Norm darauf. 39 / 327 Satz Sei V ein reeller VR. Jedes Skalarprodukt h·, ·i auf V definiert eine Norm k · k auf V : kv k := p hv , v i, v ∈ V. Beweis. N1) folgt daraus, dass h·, ·i positiv definit ist. N2) folgt aus der Bilinearität von h·, ·i: kλv k2 = hλv , λv i = λ2 hv , v i = λ2 kv k2 . N3) folgt aus der CSU: kv + w k2 = kv k2 + kw k2 + 2hv , w i ≤ kv k2 + kw k2 + 2kv kkw k = (kv k + kw k)2 . 40 / 327 Metrische Räume Definition Eine Metrik (ein Abstandsbegriff) auf einer Menge X ist eine Abbildung d : X × X → [0, ∞) mit folgenden Eigenschaften: M1) Für x, y ∈ X gilt genau dann d(x, y ) = 0, wenn x = y . M2) d(x, y ) = d(y , x) für alle x, y ∈ X . M3) d(x, z) ≤ d(x, y ) + d(y , z) für alle x, y , z ∈ X ( Dreiecksungleichung). 41 / 327 Satz Jede Norm k · k auf einem reellen oder komplexen VR V definiert eine Metrik d : V × V → [0, ∞) durch d(x, y ) := kx − y k, x, y ∈ V . Beweis. M1, M2 sind trivial. M3 folgt aus N3: kx − zk = kx − y + y − zk ≤ kx − y k + ky − zk. Beispiel Die durch die Euklidische Norm von Rn definierte Metrik d heißt die Euklidische Metrik des Rn . 42 / 327 Definition Sei (X , d) ein metrischer Raum. (i) Eine Folge xn ∈ X , n ∈ N, heißt konvergent mit dem Grenzwert x ∈ X , wenn die Folge d(xn , x) ∈ R eine Nullfolge ist. (ii) Eine Funktion f : X → C heißt im Punkt x ∈ X stetig, wenn limn→∞ f (xn ) = f (x) für jede gegen x ∈ X konvergente Folge xn ∈ X . f heißt stetig, wenn f in allen Punkten x ∈ X stetig ist. Beispiel Sei (V , k · k) ein normierter VR mit zugehöriger Metrik d. Dann ist k · k : V → R eine stetige Funktion (bezüglich der Metrik d), denn aus N3 folgt |kxk − ky k| ≤ kx − y k. 43 / 327 Satz (Parallelogrammgleichung) Eine Norm k · k auf einem reellen VR V wird genau dann durch ein SKP auf V induziert, wenn für alle v , w ∈ V die Parallelogrammgleichung gilt: (∗) kv + w k2 + kv − w k2 = 2kv k2 + 2kw k2 . Beweis. “=⇒” Aus kuk2 = hu, ui für alle u ∈ V ergibt sich (*) durch Berechnung der linken Seite mittels der Bilinearität des SKP. 44 / 327 “⇐=” Wir definieren hv , w i := 1 kv + w k2 − kv − w k2 . 4 Dann gilt offenbar hv , w i = hw , v i und hv , v i = kv k2 . Es genügt daher die Linearität von h·, ·i im ersten Argument nachzuweisen. Für alle u, u 0 ∈ V gilt: = (∗) = = hu + u 0 , w i + hu − u 0 , w i 1 ku + u 0 + w k2 − ku + u 0 − w k2 4 + ku − u 0 + w k2 − ku − u 0 − w k2 1 1 (ku + w k2 + ku 0 k2 ) − (ku − w k2 + ku 0 k2 ) 2 2 1 2 2 (ku + w k − ku − w k ) = 2hu, w i. 2 45 / 327 Wir haben gezeigt, dass (1) hu + u 0 , w i + hu − u 0 , w i = 2hu, w i. Für u = u 0 erhält man h2u, w i = 2hu, w i. Mit v = u + u 0 und v 0 = u − u 0 ∈ V erhalten wir daher aus (1): hv , w i + hv 0 , w i = h2u, w i = hv + v 0 , w i. Daraus folgt leicht hnv , w i = nhv , w i für alle n ∈ Z. Einsetzen von v = n1 u liefert hu, w i = nh n1 u, w i für alle u ∈ V , n ∈ Z∗ und somit (2) hλu, w i = λhu, w i für alle λ ∈ Q. Die Stetigkeit der Norm liefert nun die Gleichung (2) für alle λ ∈ R, da es zu jeder reellen Zahl λ eine Folge rationaler Zahlen gibt, die gegen λ konvergiert. 46 / 327 Beispiele (i) Durch kxk1 := n X |x i |, x= X x i e i ∈ Rn , i=1 wird eine Norm auf Rn definiert. Diese erfüllt nicht die Parallelogrammgleichung, denn z.B. ist 8 = ke1 + e2 k2 + ke1 − e2 k2 6= 2ke1 k2 + 2ke2 k2 = 4. (ii) Die Euklidische Norm auf Rn ist die durch pPndas kanonische i 2 SKP definierte Norm: kxk := kxk2 := i=1 (x ) . (iii) Die Maximumsnorm kxkmax := max{|x 1 |, |x 2 |, . . . , |x n |} auf Rn erfüllt nicht die Parallelogrammgleichung. 47 / 327 Orthonormale Basen Satz Sei V ein Euklidischer VR und (vi )i∈I eine orthogonale Familie von Vektoren vi ∈ V \ 0, d.h. vi ⊥ vj für alle i 6= j. Dann ist (vi )i∈I linear unabhängig. Beweis. P Sei 0 = j∈J λj vj , wobei J ⊂ I eine endliche Teilmenge ist und λj ∈ R. Daraus folgt für alle i ∈ J 0 = hvi , X j∈J λj vj i = X λj hvi , vj i = λi kvi k2 j∈J und somit λi = 0. 48 / 327 Definition Sei V ein n-dimensionaler Euklidischer VR. (i) Eine Vektor v ∈ V heißt Einheitsvektor, wenn kv k = 1. (ii) Eine orthogonale Familie (b1 , . . . , bn ) bestehend aus n Einheitsvektoren bi ∈ V heißt Orthonormalbasis von V . (iii) Für jeden Unterraum U ⊂ V heißt der UR U ⊥ := {v ∈ V |v ⊥ U} das orthogonale Komplement von U in V . Beispiel Die kanonische Basis von Rn ist orthonormal (bez. des kan. SKP). 49 / 327 Lemma Sei β eine nichtentartete Bilinearform auf einem endlichdimensionalen VR V und U ⊂ V ein UR. (i) Dann hat der UR U 0 := {v ∈ V |β(u, v ) = 0 für alle u ∈ U} die Dimension dim V − dim U. (ii) Die Unterräume U und U 0 sind genau dann komplementär, wenn U ∩ U 0 = 0. Beweis. Sei (u1 , . . . , ur ) eine Basis von U. Der Unterraum U 0 ist genau der Lösungsraum des linearen Gleichungssystems β(ui , v ) = 0, für alle i = 1, . . . , r . 50 / 327 Somit gilt dim U 0 = dim V − r , denn unter der injektiven linearen Abbildung u 7→ β(u, ·) gehen die Basisvektoren ui ∈ U in linear unabhängige Linearformen β(ui , ·) ∈ V ∗ über. (ii) folgt aus (i) und der Dimensionsformel: dim(U + U 0 ) = dim U + dim U 0 − dim(U ∩ U 0 ) (i) = dim V − dim(U ∩ U 0 ). 51 / 327 Satz Sei U ⊂ V ein UR eines endlichdimensionalen Euklidischen Vektorraums. Dann ist U ⊥ ein Komplement zu U in V . Beweis. Nach dem vorigen Lemma genügt es U ∩ U ⊥ = 0 zu zeigen. Aus v ∈ U ∩ U ⊥ folgt hv , v i = 0 und somit v = 0. 52 / 327 Das Orthonormalisierungsverfahren von Gram und Schmidt Satz (Gram-Schmidt) Jeder endlichdimensionale Euklidische VR V besitzt eine ONB. Beweis. Wir beweisen den Satz durch Induktion nach n = dim V ∈ N. Falls dim V = 1, so existiert v ∈ V \ 0 und b1 := v kv k ist eine ONB. Wir nehmen an, dass jeder Euklid. VR der Dimension < n eine ONB hat und zeigen, dass dann auch jeder n-dimensionale Euklid. VR eine ONB hat. Sei v ∈ V \ 0. Nach Induktion besitzt der (n − 1)-dimensionale UR v ⊥ := (Rv )⊥ eine ONB (b2 , . . . , bn ). Durch b1 := kvv k wird diese zu einer ONB von V ergänzt. 53 / 327 Die orthogonale Gruppe Definition Sei (V , h·, ·i) ein Euklidischer VR. Eine surjektive lineare Abbildung F : V → V heißt orthogonal, wenn hF (v ), F (w )i = hv , w i für alle v, w ∈ V . (1) Bemerkung: Aus (1) folgt, dass F injektiv ist. Falls dim V < ∞, so folgt daraus die Surjektivität. Diese muss dann also nicht gefordert werden. ÜA: Die orthogonalen Abbildungen bilden eine Untergruppe O(V ) ⊂ Aut(V ), die sogenannte orthogonale Gruppe. Beispiel A ∈ O(n) := O(Rn ) ⇐⇒ At A = 1n . 54 / 327 Hermitesche Vektorräume Definition Eine Hermitesche Form auf einem komplexen Vektorraum V ist eine Abbildung h·, ·i : V × V → C, die C-linear im ersten Argument ist und hv , w i = hw , v i für alle v , w ∈ V erfüllt. Bemerkung Daraus folgt, dass h·, ·i : V × V → C konjugiert-linear im zweiten Argument ist, d.h. hu, λv + µw i = λhu, v i + µhu, w i für alle u, v , w ∈ V , λ, µ ∈ C. 55 / 327 Definition Eine Hermitesche Form h·, ·i : V × V → C heißt positiv definit, wenn für alle v ∈ V \ 0 hv , v i > 0. Ein (Hermitesches) Skalarprodukt auf V ist eine positiv definite Hermitesche Form V × V → C. Ein Hermitescher Vektorraum ist ein komplexer VR zusammen mit einem Hermiteschen Skalarprodukt darauf. (Hermitescher Vektorräume werden manchmal auch unitäre Vektorräume genannt.) 56 / 327 Beispiel Das kanonische (Hermitesche) Skalarprodukt von Cn ist definiert durch n X hz, w i := zi wi , i=1 wobei z = Pn i=1 z ie i und w = Pn i=1 w ie i. 57 / 327 Satz (Cauchy-Schwarzsche Ungleichung) Sei h = h·, ·i ein Hermitesches SKP auf einem C-VR V. (i) Dann gilt für alle v , w ∈ V : (∗) |hv , w i| ≤ kv k · kw k, wobei kv k := p hv , v i. (ii) Gleichheit in (∗) gilt genau dann, wenn v und w linear abhängig sind. 58 / 327 Beweis. (i) Wir können annehmen, dass hv , w i = 6 0 und setzen λ := hv , w i . |hv , w i| Dann gilt |λ| = 1 und somit: (1) |hv , w i| = |λhv , w i| = λhv , w i = hλv , w i. Die CSU für das Euklidische SKP g = Re(h) liefert weiter (2) hλv , w i = g (λv , w ) ≤ p p g (λv , λv ) g (w , w ) = kv k·kw k. (ii) Gleichheit in (2) und somit in (∗) gilt genau dann, wenn λv und w linear abhängig über R und somit v und w linear abhängig über C sind. 59 / 327 Satz (Hermitesche Vektorräume als normierte C-Vektorräume) Sei V ein komplexer VR. Jedes Hermitesche Skalarprodukt h·, ·i auf V definiert eine Norm k · k auf V : p kv k := hv , v i, v ∈ V . Beweis. Vgl. entsprechenden Beweis für Euklidische Skalarprodukte. 60 / 327 Definition (Unitäre Basen) Sei V ein endlichdimensionaler Hermitescher VR. Eine unitäre Basis von V ist eine Basis (b1 , . . . , bn ) mit hbi , bj i = δij . (Dieser Begriff ist analog zum Begriff der Orthonormalbasis im Fall Euklidischer Vektorräume.) Übungsaufgabe Zeigen Sie, dass jeder endlichdimensionale Hermitesche VR eine unitäre Basis besitzt. 61 / 327 Definition (Unitäre Gruppe) Sei (V , h·, ·i) ein Hermitescher VR. Ein surjektivera Endomorphismus F : V → V heißt unitär, wenn (∗) hF (v ), F (w )i = hv , w i für alle v, w ∈ V . Die unitären Endomorphismen bilden eine Untergruppe (ÜA !) U(V ) ⊂ Aut(V ), die sogenannte unitäre Gruppe. a Falls dim V < ∞, so folgt die Surjektivität aus (*). Beispiel t A ∈ U(n) := U(Cn ) ⇐⇒ A A = 1n . Übungsaufgabe Zeigen Sie, dass U(n) als eine Untergruppe der orthogonalen Gruppe O(2n) aufgefasst werden kann. 62 / 327 Satz (Normalform unitärer Endomorphismen) (i) Eigenwerte unitärer Endomorphismen sind komplexe Zahlen vom Betrag 1. (ii) Eigenvektoren zu verschiedenen Eigenwerten stehen senkrecht aufeinander. (iii) Sei V ein endlichdimensionaler Hermitescher Vektorraum. Zu jedem unitären Endomorphismus F ∈ U(V ) gibt es eine unitäre Basis von V bestehend aus Eigenvektoren von F . Beweis. (i) Sei v ein Eigenvektor eines unitären Endomorphismus F und λ ∈ C der zugehörige Eigenwert. Aus 0 6= hv , v i = hFv , Fv i = hλv , λv i = λλhv , v i ergibt sich |λ| = 1. 63 / 327 (ii) Seien v , w ∈ V Eigenvektoren von F zu den Eigenwerten λ bzw. µ 6= λ. Wegen (i) gilt λµ 6= 1. Aus hv , w i = hFv , Fw i = λµhv , w i folgt daher hv , w i = 0. 64 / 327 (iii) Beweis durch Induktion nach n = dim V . Der Fall n = 1 ist klar. Sei dim V ≥ 2. Nach dem Fundamentalsatz der Algebra hat jedes nicht-konstante komplexe Polynom eine Nullstelle. Insbesondere hat das charakteristische Polynom von F eine Nullstelle und F mithin einen Eigenwert λ1 . Wir wählen einen zugehörigen Eigenvektor b1 ∈ V der Länge 1 und betrachten W := b1⊥ . Es gilt dim W = n − 1 und FW ⊂ W , denn aus w ∈ W folgt 0 = hb1 , w i = hFb1 , Fw i = λ1 hb1 , Fw i und somit Fw ∈ W . (Wg. (i) ist λ1 6= 0.) Nach Induktionsvoraussetzung gibt es eine unitäre Basis (b2 , . . . , bn ) von W bestehend aus Eigenvektoren von F und (b1 , b2 , . . . , bn ) ist die gesuchte unitäre Basis von V . 65 / 327 Folgerung (i) Eigenwerte orthogonaler Endomorphismen sind reelle Zahlen vom Betrag 1. (ii) Eigenvektoren zu verschiedenen Eigenwerten stehen senkrecht aufeinander. (iii) Sei V ein endlichdimensionaler Euklidischer Vektorraum. Jeder orthogonale Endomorphismus F ∈ O(V ) besitzt eine Orthonormalbasis, bez. der F durch eine Blockdiagonalmatrix folgender Art dargestellt wird diag(λ1 , . . . , λp , Dϕ1 , . . . , Dϕq ), wobei λi ∈ {±1}, Dϕ = cos ϕ − sin ϕ sin ϕ cos ϕ , ϕj ∈ R und p + 2q = dim V . 66 / 327 Beweis. (i-ii) Gleicher Beweis wie für unitäre Endomorphismen. (iii) Da die Eigenräume V±1 von F : V → V senkrecht aufeinander stehen, existiert eine ONB (b1 , . . . , bp ) von U := V1 ⊕ V−1 bestehend aus Eigenvektoren. F bildet das orthogonale Komplement W := U ⊥ in sich ab und W enthält keine Eigenvektoren von F . Insbesondere hat W gerade Dimension m = 2q, denn sonst hätte das charakteristische Polynom der Einschränkung F |W eine reelle Nullstelle. Es genügt zu zeigen, dass W eine ONB besitzt, bez. der die darstellende Matrix von F |W die Gestalt diag(Dϕ1 , . . . , Dϕq ) hat . 67 / 327 Weiter im Beweis: Durch Wahl einer ONB von W können wir annehmen, dass W = Rm der Euklidische Raum ist und F |W = A ∈ O(m). Wenn wir A als komplexe Matrix auffassen, so gilt offenbar A ∈ U(m), t denn aus At A = 1m und A = A folgt A A = 1m . Daher gibt es eine unitäre Basis (β1 , . . . , βq , β1 , . . . , βq ) von Cm = C2q bestehend aus Eigenvektoren von A ∈ U(m) mit zugehörigen Eigenwerten (µ1 , . . . , µq , µ1 , . . . , µq ). Die Eigenwerte µj = e iϕj (ϕj ∈ R) treten in Paaren auf, denn die komplexe Konjugation bildet den Eigenraum zum Eigenwert µ isomorph auf den Eigenraum zum Eigenwert µ ab: Av = µv =⇒ Av = Av = µv = µ · v . 68 / 327 Weiter im Beweis: Wir setzen βj0 = βj00 = 1 √ (βj + βj ) 2 i √ (βj − βj ). 2 (β10 , β100 , . . . , βq0 , βq00 ) ist eine ONB von Rm . (Das Euklidische SKP von Rm ist die Einschränkung des Hermiteschen SKP von Cm .) Die darstellende Matrix von A bez. dieser Basis ist diag(Dϕ1 , . . . , Dϕq ). 69 / 327 Definition (Selbstadjungierte Endomorphismen) Sei F ein Endomorphismus eines Euklidischen oder Hermiteschen Vektorraums V . Ein Endomorphismus F ad ∈ End(V ) heißt zu F adjungiert, wenn hFv , w i = hv , F ad w i für alle v, w ∈ V . (Man überlegt sich leicht, dass F ad eindeutig ist und für endlichdimensionale Vektorräume auch existiert.) F heißt selbstadjungiert, wenn F ad existiert und F = F ad . (Selbstadjungierte Endomorphismen eines Euklidischen bzw. Hermiteschen Vektorraums heißen auch symmetrische bzw. Hermitesche Endomorphismen.) 70 / 327 Beispiel 1) Wir betrachten V = Cn mit dem kanonischen Hermiteschen SKP. hz, w i = z t w , z, w ∈ Cn . Dann gilt für A ∈ End(Cn ): t Aad = A , denn für alle z, w ∈ Cn gilt t t hAz, w i = (Az)t w = z t At w = z t A w = hz, A w i. 2) Ebenso Aad = At für Endomorphismen des Rn . 71 / 327 Satz Sei F ein Endomorphismus eines Euklidischen oder Hermiteschen Vektorraums V . Dann gilt Kern F Kern F ad = (Bild F ad )⊥ = (Bild F )⊥ Beweis. Das folgt unmittelbar aus der definierenden Gleichung hFv , w i = hv , F ad w i, v, w ∈ V . 72 / 327 Satz Sei V ein endlichdimensionaler Euklidischer oder Hermitescher VR und A die darstellende Matrix eines Endomorphismus F von V bez. einer orthonormalen bzw. unitären Basis. Die darstellende Matrix von F ad ist Aad . Somit gilt F selbstadjungiert ⇐⇒ A = Aad . Beweis. Sei (e1 , . . . , en ) eine orthonormale bzw. unitäre Basis und A = (aji ) bzw. B = (bji ) die darstellenden Matrizen von F bzw. F ad . Dann gilt j aji = hFej , ei i = hej , F ad ei i = hF ad ei , ej i = b i , t d.h. B = A = Aad . 73 / 327 Satz (Normalform selbstadjungierte Endomorphismen) Sei V ein Euklidischer oder Hermitescher VR. (i) Die Eigenwerte selbstadjungierter F ∈ End(V ) sind reell. (ii) Eigenvektoren zu verschiedenen Eigenwerten von F stehen senkrecht aufeinander. (iii) Falls dim V < ∞, so besitzt V eine orthonormale bzw. unitäre Basis bestehend aus Eigenvektoren von F . Beweis. (i) Aus Fv = λv , kv k = 1, folgt λ = hFv , v i = hv , Fv i = λ. (ii) v , w seien Eigenvektoren zu verschiedenen Eigenwerten λ, µ ∈ R. Dann folgt aus λhv , w i = hFv , w i = hv , Fw i = µhv , w i hv , w i = 0. 74 / 327 Weiter im Beweis: (iii) Es genügt zu zeigen, dass F einen Eigenvektor v besitzt. F erhält dann das orthogonale Komplement W := v ⊥ : hv , w i = 0 =⇒ hv , Fw i = hFv , w i = 0. Somit ist ein Induktionsbeweis möglich. Nach dem Fundamentalsatz der Algebra hat das charakteristische Polynom von F eine komplexe Nullstelle λ. λ ist wegen (i) reell. Also hat F auch im Fall eines reellen Vektorraums V einen Eigenvektor v ∈ V . 75 / 327 Folgerung Sei V ein endlichdimensionaler komplexer VR und h eine Hermitesche Form auf V . (i) Dann existiert eine Basis von V , bez. der die darstellende Matrix von h folgende Gestalt hat: diag(1r+ , −1r− , 0 · 1r0 ). (ii) Die Zahlen r+ , r− und r0 hängen nicht von der Wahl der Basis ab. Beweis. (i) Wir wählen ein Hermitesches SKP h·, ·i auf V und definieren H ∈ End(V ) durch h(v , w ) = hHv , w i, v, w ∈ V . 76 / 327 Dann ist H selbstadjungiert: hHv , w i = h(v , w ) = h(w , v ) = hHw , v i = hv , Hw i. Es gibt daher eine unitäre Basis (u1 , . . . , un ) aus Eigenvektoren von H mit zugehörigen Eigenwerten λ1 , . . . , λn . Sei r+ bzw. r− die Anzahl der positiven bzw. negativen λi und r0 = dim Kern (H). Durch Multiplikation von ui mit √1 , |λi | falls λi 6= 0 und Umordnung erhalten wir eine Basis mit der gewünschten Eigenschaft. (ii) Aus V0 = Kern H = Kern h := {v |h(v , w ) = 0 für alle w ∈ V } folgt die Unabhängigkeit von r0 = dim V0 von allen Wahlen. 77 / 327 Weiter im Beweis Es bleibt zu zeigen, dass auch die Zahlen r± unabhängig von allen Wahlen sind. Wir zeigen das z.B. für r+ . Sei V+ bzw. V− die Summe der Eigenräume zu den positiven bzw. negativen Eigenwerten von H. h ist auf V+ positiv definit und auf dem Komplement V− ⊕ V0 negativ semi-definit, d.h. h(v , v ) ≤ 0 für alle v ∈ V− ⊕ V0 . Sei W ⊂ V ein UR, auf dem h positiv definit ist. Dann gilt W ∩ (V− ⊕ V0 ) = 0 und somit dim W ≤ r+ . Also r+ = max{dim W |W ⊂ V , h auf W positiv-definit}. Das beweist die Unabhängigkeit. 78 / 327 Hauptachsentransformation Folgerung (Hauptachsentransformation) Sei V ein endlichdimensionaler Euklidischer VR und s eine symmetrische Bilinearform auf V . (i) Dann existiert eine orthogonale Basis (b1 , . . . , bn ) von V , bez. der die darstellende Matrix von s folgende Gestalt hat: diag(1r+ , −1r− , 0 · 1r0 ). (Die Geraden Rbi heißen Hauptachsen von s.) (ii) Die Zahlen r+ , r− und r0 hängen nicht von der Wahl der Basis ab. Beweis. Siehe Beweis des vorhergehenden Satzes. Aussage (i) ist bekannt als Satz von der Hauptachsentransformation, (ii) als Trägheitssatz von Sylvester. 79 / 327 Beispiel Sei V = R2 und 0 x x s , = 5xx 0 + 5yy 0 + 3xy 0 + 3yx 0 . y y0 Für die Basis b1 = 14 (e1 + e2 ), b2 = 21 (e1 − e2 ) gilt s(bi , bj ) = δij . Insbesondere sind die Hauptachsen von s die Diagonalen y = x und y = −x. Das sind genau die Hauptachsen der Ellipse x E= v= s(v , v ) ≤ 1 . y Es gilt s(v , v ) = 5x 2 + 5y 2 + 6xy = 4(x + y )2 + (x − y )2 . 80 / 327 Definition (Normale Endomorphismen) Sei V ein Hermitescher VR und F ∈ End(V ). F heißt normal, wenn F ◦ F ad = F ad ◦ F . Beispiele Unitäre Endomorphismen erfüllen F ad = F −1 und sind daher normal. Hermitesche (F ad = F ) und schief-Hermitesche (F ad = −F ) Endomorphismen F sind normal. 81 / 327 Satz Sei V ein endlichdim. Hermitescher VR und F ∈ End(V ). V besitzt genau dann eine unitäre Basis bestehend aus Eigenvektoren von F , wenn F normal ist. Beweis. =⇒ Sei A = diag(λ1 , . . . , λn ) die darstellende Matrix von F bez. einer unitären Basis von Eigenvektoren. Dann gilt Aad = diag(λ1 , . . . , λn ). Daher kommutieren A und Aad und somit auch F und F ad . ⇐= Die Rückrichtung beweisen wir durch Induktion nach n = dim V . Wegen des Fundamentalsatzes der Algebra hat F einen Eigenvektor. Sei 0 6= Vλ ⊂ V der zugehörige Eigenraum. 82 / 327 Weiter im Beweis: Es genügt zu zeigen, dass FVλ⊥ ⊂ Vλ⊥ , denn dann können wir nach Induktion eine unitäre Basis von Vλ⊥ aus Eigenvektoren von F wählen und diese durch eine unitäre Basis von Vλ zu der gewünschten Basis von V ergänzen. Dazu benutzen wir folgenden Hilfssatz: Lemma Sei F ein normaler Endomorphismus eines Hermiteschen Vektorraums. Dann gilt Kern F = Kern F ad . Beweis (des Lemmas). Für v ∈ V gilt hFv , Fv i = hv , F ad Fv i = hv , FF ad v i = hFF ad v , v i = hF ad v , F ad v i und somit Fv = 0 ⇐⇒ F ad v = 0. 83 / 327 Weiter im Beweis: Wir wenden das Lemma auf den normalen Endomorphismus G := F − λId an und erhalten Vλ = Ker G = Ker G ad = (Bild G )⊥ und somit Vλ⊥ = Bild G . Daraus folgt wie gewünscht FVλ⊥ ⊂ Vλ⊥ , denn FGv = GFv , v ∈ V. 84 / 327 Folgerung Für eine Matrix A ∈ Mat(n, C) sind folgende Bedingungen äquivalent: t t (i) A ist normal, d.h. AA = A A. t (ii) Es gibt S ∈ U(n), so dass S AS eine Diagonalmatrix ist. Beweis. =⇒ Da A normal ist, existiert eine unitäre Basis b1 , . . . , bn ∈ Cn mit Abi = λi bi , i = 1, 2, . . . , n. Sei S die unitäre Matrix mit den Spalten b1 , . . . , bn . t Für jede unitäre Matrix gilt S = S −1 und daher t t t S ASei = S Abi = λi S bi = λi S −1 bi = λi ei . t Das zeigt, dass S AS eine Diagonalmatrix ist. 85 / 327 Weiter im Beweis: ⇐= Sei nun umgekehrt S eine unitäre Matrix derart, dass t D = S AS eine Diagonalmatrix ist. t D = S AS = S −1 AS ist genau die darstellende Matrix von A bez. der unitären Basis (b1 , . . . , bn ) mit bi := Sei . Die Normalität von A folgt daher aus D ad D = DD ad . 86 / 327 Definition (Vollständigkeit) Sei (X , d) ein metrischer Raum. Eine Folge xn ∈ X heißt Cauchy-Folge, wenn es zu jedem > 0 ein N ∈ N gibt, so dass d(xm , xn ) < für alle m, n ≥ N. (X , d) heißt vollständig, wenn jede Cauchy-Folge in X gegen einen Grenzwert x ∈ X konvergiert. Ein reeller bzw. komplexer Hilbertraum ist ein Euklidischer bzw. Hermitescher Vektorraum, der bez. der vom SKP abgeleiteten Metrik vollständig ist. Ein Banachraum ist ein normierter Vektorraum, der bez. der von der Norm abgeleiteten Metrik vollständig ist. 87 / 327 Beispiele 1) Aus der Vollständigkeit von K = R, C folgt unmittelbar, dass (Kn , k · kmax ) ein Banachraum ist. 2) Endlichdimensionale Euklidische und Hermitesche Vektorräume sind vollständig. Insbesondere ist Rn mit dem Euklidischen und Cn mit dem Hermiteschen SKP ein reeller bzw. komplexer Hilbertraum. Das folgt aus 1) und den Ungleichungen √ kxkmax ≤ kxk ≤ nkxkmax , x ∈ Rn . 88 / 327 Satz Je zwei Normen k · k und k · k0 auf einem endlichdimensionalen reellen oder komplexen VR V sind äquivalent, d.h. es gibt positive konstanten c, C , so dass ckv k ≤ kv k0 ≤ C kv k für alle v ∈ V . Folgerung Jeder endlichdimensionale normierte reelle oder komplexe Vektorraum ist vollständig. 89 / 327 Beweis (des Satzes). Sei B := (b1 , . . . , bn ) eine Basis von V . P Für x = ni=1 x i bi ∈ V definieren wir kxkmax := max{|x 1 |, . . . , |x n |}. Wir zeigen, dass jede Norm auf V äquivalent zu k · kmax ist. Für jede Norm k · k auf V gilt nach der Dreiecksungl. kxk = k n X i=1 i x bi k ≤ n X i=1 i |x | · kbi k ≤ C kxkmax , C := n X kbi k. i=1 90 / 327 Weiter im Beweis: Wir nehmen an, es gäbe kein c > 0 mit ck · kmax ≤ k · k. P Dann gibt es für alle k ∈ N einen Vektor xk = ni=1 xki bi ∈ V mit 1 kxk kmax > kxk k. k Wir können annehmen, dass kxk kmax = 1. Nach Bolzano-Weierstraß hat jede der beschränkten Zahlenfolgen (xki )k∈N , i = 1, . . . , n, eine konvergente Teilfolge. Wir könnenP daher annehmen, dass (xk ) bez. der Norm k · kmax gegen x = ni=1 x i bi ∈ V konvergiert. Es gilt dann kxk ≤ kx − xk k + kxk k ≤ C kx − xk kmax + 1 (k→∞) −→ 0. k Also x = 0 und somit 0 = kxkmax = limk→∞ kxk kmax , im Widerspruch zu kxk kmax = 1. 91 / 327 Satz b die Menge der Sei (X , d) ein metrischer Raum und X Äquivalenzklassen von Cauchy-Folgen (xk )k∈N in X , bez. der Äquivalenzrelation (xk ) ∼ (xk0 ) :⇐⇒ lim d(xk , xk0 ) = 0. k→∞ b ein vollständiger metrischer Raum mit der Metrik (i) Dann ist X b k ), (x 0 )) := lim d(xk , x 0 ). d((x k k k→∞ b , die x ∈ X die konstante Folge (ii) Die Abbildung I : X → X k 7→ xk = x zuordnet, ist abstandstreu: b (x), I (y )) = d(x, y ) d(I für alle x, y ∈ X . (iii) Für jede Cauchy-Folge (xk ) in X gilt: (xk ) = lim`→∞ I (x` ). 92 / 327 Beweis. (i) Aus der Dreiecksungleichung folgt die Ungleichung |d(x, z) − d(y , z)| ≤ d(x, y ) für alle x, y , z ∈ X und somit |d(xk , xk0 ) − d(x` , x`0 )| ≤ |d(xk , xk0 ) − d(x` , xk0 )| + |d(x` , xk0 ) − d(x` , x`0 )| ≤ d(xk , x` ) + d(xk0 , x`0 ) Diese Ungleichung zeigt, dass k 7→ d(xk , xk0 ) eine Cauchy-Folge ist und somit konvergiert. Der Grenzwert hängt nur von den Äquivalenzklassen von (xk ) und (xk0 ) ab. b ×X b → [0, ∞) Man überprüft nun leicht ( ÜA), dass, db : X eine Metrik ist und die Eigenschaften (ii) und (iii) erfüllt. 93 / 327 Weiter im Beweis: b , d) b zu beweisen. Es bleibt noch die Vollständigkeit von (X b , k ∈ N, eine Cauchy-Folge, xk = (xk (i))i∈N . Sei xk ∈ X Da die Folge i 7→ xk (i) eine Cauchy-Folge ist, existiert Nk ∈ N, so dass d(xk (i), xk (j)) ≤ 1 k für alle i, j ≥ Nk . Wir setzen x(k) := xk (Nk ). Dann ist x = (x(k))k∈N eine Cauchy-Folge in X , denn für i ≥ max{Nk , N` } gilt d(x(k), x(`)) ≤ d(x(k), xk (i)) +d(xk (i), x` (i)) +d(x` (i), x(`)). | {z } | {z } | {z } ≤1/k (i→∞) b k ,x` ) −→ d(x ≤1/` Sei > 0. Da x eine Cauchy-Folge ist, existiert N() ∈ N mit d(x(k), x(`)) ≤ für alle k, ` ≥ N(). 94 / 327 Weiter im Beweis: Wir behaupten x = limk→∞ xk . Für k ≥ M() := max{N( 2 ), 2 } und i ≥ max{N( 2 ), Nk } gilt d(x(i), xk (i)) ≤ d(x(i), x(k)) + d(x(k), xk (i)) ≤ 1 + ≤ . 2 k Daraus folgt b xk ) = lim d(x(i), xk (i)) ≤ d(x, i→∞ b xk ) = 0. für alle k ≥ M() und somit limk→∞ d(x, 95 / 327 Wiederholung b die Menge der Sei (X , d) ein metrischer Raum und X Äquivalenzklassen von Cauchy-Folgen (xk )k∈N in X , bez. der Äquivalenzrelation (xk ) ∼ (xk0 ) :⇐⇒ lim d(xk , xk0 ) = 0. k→∞ b ein vollständiger metrischer Raum mit der Metrik (i) Dann ist X b k ), (x 0 )) := lim d(xk , x 0 ). d((x k k k→∞ b , die x ∈ X die konstante Folge (ii) Die Abbildung I : X → X k 7→ xk = x zuordnet, ist abstandstreu: b (x), I (y )) = d(x, y ) d(I für alle x, y ∈ X . (iii) Für jede Cauchy-Folge (xk ) in X gilt: (xk ) = lim`→∞ I (x` ). 96 / 327 Satz/ÜA b , d) b Sei (V , k · k) ein normierter VR, d die induzierte Metrik und (V die Vervollständigung des metrischen Raums (V , d). Dann definiert b x), kxkb := d(0, b, x ∈V b und es gilt eine Norm auf V b y ) = kx − y kb für alle d(x, b. x, y ∈ V Definition b , k · kb) heißt Vervollständigung des Der Banachraum (V normierten Vektorraumes (V , k · k). 97 / 327 Satz Sei (V , h·, ·i) ein Euklidischer oder Hermitescher VR, k · k die b , k · kb) die Vervollständigung des induzierte Norm und (V normierten Raums (V , k · k). b , k · kb) in kanonischer Weise ein Hilbertraum. Dann ist (V Beweis. Aus der Parallelogrammgl. für die Norm von V folgt durch b. Grenzübergang die Parallelogrammgl. für die Norm von V Somit bestimmt die Norm k · kb ein Euklidisches SKP g . Falls V ein komplexer Vektorraum ist, so gilt g (ix, iy ) = g (x, y ) b und deshalb definiert für alle x, y ∈ V h(x, y ) := g (x, y ) + ig (x, iy ), b. ein Hermitesches SKP auf V b, x, y ∈ V 98 / 327 Satz Der VR der quadratisch summierbaren komplexen Zahlenfolgen ) ( ∞ X |x(n)|2 < ∞ `2 = x : N → C n=1 mit dem Hermiteschen SKP (siehe Übungsaufgaben) hx, y i = ∞ X x(n)y (n) n=1 ist ein Hilbertraum. 99 / 327 Beweis. Wir beweisen die Vollständigkeit von `2 . Sei (xk )k∈N eine Cauchy-Folge in `2 . Dann ist jede der Komponentenfolgen (xk (n))k∈N eine Cauchy-Folge und konvergiert daher gegen einen Grenzwert x(n) := limk→∞ xk (n). Wir behaupten x ∈ `2 und x = limk→∞ xk . Da (xk ) eine Cauchy-Folge ist, gibt es zu > 0 ein N ∈ N mit m X |xk (n) − x` (n)|2 < 2 n=1 für alle k, ` ≥ N und alle m ∈ N. P 2 2 Grenzübergang k → ∞ liefert: m n=1 |x(n) − x` (n)| ≤ für alle ` ≥ N und alle m ∈ N, d.h. kx − x` k ≤ . 100 / 327 Bemerkung Die Folgen x ∈ `2 mit x(n) ∈ Q + iQ ⊂ C für alle n ∈ N und x(n) = 0 für fast alle n ∈ N bilden eine abzählbare dichte Teilmenge S, d.h. jedes Element x ∈ `2 ist Grenzwert einer Folge xk ∈ S. Definition (Separabel) Metrische Räume, die eine abzählbare dichte Teilmenge enthalten heißen separabel. Wir werden noch sehen, dass jeder unendlichdimensionale separable komplexe Hilbertraum (V , h·, ·iV ) isomorph zu `2 ist, d.h. es gibt einen Isomorphismus von Vektorräumen φ : V → `2 , der hφ(x), φ(y )i`2 = hx, y iV für alle x, y ∈ V erfüllt. 101 / 327 Satz Sei V ein Euklidischer oder Hermitescher VR und U ⊂ V ein vollständiger Unterraum. (i) Dann existiert zu jedem x ∈ V genau ein xU ∈ U mit kleinstem Abstand zu x, d.h. kx − xU k ≤ kx − y k für alle y ∈ U. (ii) Das Element xU ∈ U ist durch x − xU ∈ U ⊥ charakterisiert. (iii) Es gilt V = U ⊕ U ⊥ . (iv) Die Zuordnung x 7→ xU definiert eine stetige lineare Abbildung P : V → U (die sogenannte orthogonale Projektion auf U). 102 / 327 Beweis. (i) Sei yn ∈ U eine Folge mit limn→∞ kx − yn k = d := inf y ∈U kx − y k. (yn ) ist eine Cauchy-Folge, denn wg. der Parallelogrammgl. gilt kyn − ym k2 = k(yn − x) − (ym − x)k2 = 2kyn − xk2 + 2kym − xk2 − k(yn − x) + (ym − x)k2 yn + ym = 2kyn − xk2 + 2kym − xk2 − 4k − xk2 2 ≤ 2kyn − xk2 + 2kym − xk2 − 4d 2 (m,n→∞) −→ 0 Wg. der Vollständigkeit von U konvergiert (yn ) in U, xU := limn→∞ yn ∈ U, und kx − xU k = d, wg. der Stetigkeit der Norm. 103 / 327 Weiter im Beweis: Aus xU , xU0 ∈ U mit kxU − xk = kxU0 − xk = d folgt wie oben kxU − xU0 k2 = 2kxU − xk2 + 2kxU0 − xk2 − kxU + xU0 − 2xk2 = 4d 2 − kxU + xU0 − 2xk2 ≤ 4d 2 − 4d 2 = 0. Das beweist die Eindeutigkeit. (ii) Für alle y ∈ U, t ∈ R gilt mit z = x − xU : kzk2 ≤ kz + ty k2 = d 2 + 2tRe hz, y i + t 2 ky k2 . Das ist nur möglich, wenn Re hz, y i = 0 für alle y ∈ U, d.h. wenn z ⊥ U. Umgekehrt folgt aus u ∈ U und z = x − u ⊥ U: kzk2 ≤ kz + y k2 = kzk2 + ky k2 für alle y ∈ U, d.h. u = xU . 104 / 327 (iii) In (i-ii) haben wir gezeigt, dass jeder Vektor x ∈ V eine eindeutige Darstellung x = xU + (x − xU ) besitzt mit xU ∈ U und x − xU ∈ U ⊥ . Das beweist V = U ⊕ U ⊥ . (iv) Die Linearität der Abbildung x → 7 xU folgt aus der Charakterisierung (ii). Aus der Orthogonalität der Zerlegung V = U ⊕ U ⊥ folgt kxU k ≤ kxk und somit die Stetigkeit von P. 105 / 327 Satz Sei V ein separabler Euklidischer oder Hermitescher VR. Dann ist jede orthonormale Familie (vi )i∈I abzählbar. Beweis. √ Für alle i, j ∈ I mit i 6= j gilt kvi − vj k = 2. Sei A ⊂ V eine abzählbare dichte Teilmenge. Zu jedem i ∈ I existiert a(i) ∈ A mit kvi − a(i)k < √ 2 2 . Wir zeigen, dass die Zuordnung I → A, i 7→ a(i), injektiv ist: ka(i) − a(j)k = kvi − vj + a(i) − vi + vj − a(j)k ≥ kvi − vj k − ka(i) − vi k − kvj − a(j)k > 0 für alle i, j ∈ I mit i 6= j. 106 / 327 Satz (Besselsche Ungleichung) Sei V ein Euklidischer oder Hermitescher VR und (v1 , v2 , . . .) eine (endliche oder unendliche) orthonormale Familie. Dann gilt für alle x ∈ V : X |hx, vk i|2 ≤ kxk2 . k Gleichheit gilt genau dann, wenn X x= hx, vk ivk . k 107 / 327 Beweis. Wir betrachten den endlichdimensionalen und somit vollständigen UR UN := span{v1 , v2 , . . . , vN } ⊂ V . Sei xN ∈ UN die Orthogonalprojektion von x in UN . P PN Es gilt xN = N k=1 hx, vk ivk , denn x − k=1 hx, vk ivk ⊥ UN . Aus der orthogonalen Zerlegung x = xN + (x − xN ) folgt dann N X |hx, vk i|2 = kxN k2 ≤ kxk2 . k=1 Daraus folgt die P Besselsche Ungl. und die absolute Konvergenz der Reihe x∞ := k hx, vk ivk . Für x∞ gilt x∞ ⊥ x − x∞ und somit kxk2 − kx∞ k2 = kx − x∞ k2 = 0 ⇐⇒ x = x∞ . 108 / 327 Definition Sei V ein Euklidischer oder Hermitescher VR. Eine orthonormale Familie (v1 , v2 , . . .) heißt P Hilbertbasis, wenn jeder Vektor x ∈ V eine Darstellung x = k hx, vk ivk besitzt. Beispiele (i) Falls dim V < ∞, so sind Hilbertbasen nichts anderes als orthonormale bzw. unitäre Basen. (ii) Sei V = `2 der Hilbertraum der quadratisch summierbaren Folgen x : N → C. Die Folgen ej ∈ `2 mit ej (k) = δjk (j, k ∈ N) bilden eine Hilbertbasis (ej )j∈N , die sogenannte kanonische Hilbertbasis von `2 . (ej )j∈N ist aber keine Vektorraumbasis, denn die lineare Hülle der ej ist {x : N → C|x(i) = 0 für fast alle i ∈ N} ( `2 . 109 / 327 Satz Für eine orthonormale Familie B = (b1 , b2 , . . .) von Vektoren eines Euklidischen oder Hermiteschen VR V sind folgende Aussagen äquivalent: (i) span{b1 , b2 , . . .} ist dicht in V. (ii) B ist eine Hilbertbasis. (iii) Für alle x, y ∈ V gilt hx, y i = X hx, bk ihy , bk i. k (iv) Für alle x ∈ V gilt die Parsevalsche Gleichung X kxk2 = |hx, bk i|2 . k 110 / 327 Beweis. (i)⇒(ii) Zu x ∈ V existiert xi ∈ span{b1 , b2 , . . .} mit x = limi→∞ xi . Wir können annehmen, dass xi ∈ Ui := span{b1 , . . . , bNi }, wobei Ni ∈ N eine monoton wachsende Folge ist. P i Für die orthogonale Projektion xi0 = N k=1 hx, bk ibk von x in Ui gilt kx − xi0 k ≤ kx − xi k P und somit x = limi→∞ xi0 = k hx, bk ibk . 111 / 327 Weiter im Beweis: (ii)⇒(iii) Wenn B = (b1 , b2 , . . .) eine Hilbertbasis ist, so können wir x, y ∈ V schreiben als X X x= x i bi , y = y j bj , i j wobei x i = hx, bi i, y j = hy , bj i. Daraus folgt X X hx, y i = h x i bi , y i = x i hbi , y i i hbi , y i = hbi , i X j y bj i = j X y j hbi , bj i = y i j und somit hx, y i = X xiyi. i 112 / 327 Weiter im Beweis: (iii)⇒(iv) Setze x = y . (iv)⇒(i) Aus der Parsevalschen Gleichung folgt x = alle x ∈ V . P k hx, bk ibk für Das beweist (i). 113 / 327 Satz (Hilbertbasen) Jeder unendlichdimensionale separable Hilbertraum V besitzt eine abzählbare unendliche Hilbertbasis B = (b1 , b2 , . . .). Folgerung Jeder unendlichdimensionale separable Hilbertraum V über K = R oder K = C ist isomorph zum Hilbertraum ) ( X 2 2 |x(k)| < ∞ ` (K) = x : N → K k der quadratisch summierbaren Folgen mit Werten in K . Beweis. Jede Hilbertbasis B = (b1 , b2 , . . .) definiert einen Isomorphismus X X φB : `2 (K) → V , x = x k ek 7→ φB (x) = x k bk . k k 114 / 327 Für den Beweis des Satzes benötigen wir das Zornsche Lemma, das aus dem Auswahlaxiom der Mengenlehre folgt. (Mit dem Zornschen Lemma beweist man auch, dass jeder Vektorraum eine Basis besitzt.) Definition Eine Relation ≤ auf einer Menge X heißt Ordnungsrelation, wenn folgenden Eigenschaften für alle x, y , z ∈ X erfüllt sind: x ≤ x, aus x ≤ y und y ≤ x folgt x = y und aus x ≤ y und y ≤ z folgt x ≤ z. Die Ordnungsrelation heißt total, wenn für alle x, y ∈ X eine der beiden Ungleichungen x ≤ y oder y ≤ x gilt. x ∈ X heißt maximal, wenn es kein y ∈ X mit x < y gibt (d.h. mit x ≤ y und x 6= y ). x ∈ X heißt eine obere Schranke von Y ⊂ X , falls y ≤ x für alle y ∈ Y. 115 / 327 Lemma (Zornsches Lemma) Auf der Menge X sei eine Ordnungsrelation ≤ gegeben, derart dass jede total geordnete Teilmenge Y ⊂ X eine obere Schranke besitzt. Dann hat X ein maximales Element. Beweis (des Satzes). Wir wissen bereits, jede orthonormale Familie in einem separablen Hilbertraum V abzählbar ist. Wir zeigen, dass sich jede orthonormale Familie F0 zu einer Hilbertbasis ergänzen läßt. 116 / 327 Weiter im Beweis: Sei X die Menge aller orthonormale Familien in V , die F0 enhalten. X ist durch Inklusion ⊂ geordnet und die Vereinigung ∪F ∈Y F einer total geordneten Teilmenge Y ⊂ X ist eine obere Schranke für Y . Nach dem Zornschen Lemma hat X ein maximales Element B = (b1 , b2 , . . .). Aus der Maximalität folgt für alle y ∈ V y ⊥ bi für alle i ∈ N =⇒ y = 0. Daraus erhalten wir, dass B eine Hilbertbasis ist, P denn aus y := x − k hx, bk ibk ⊥ bi für alle i ∈ N folgt y = 0. 117 / 327 Wiederholung Satz Für eine orthonormale Familie B = (b1 , b2 , . . .) von Vektoren eines Euklidischen oder Hermiteschen VR V sind folgende Aussagen äquivalent: (i) span{b1 , b2 , . . .} ist dicht in V. (ii) B ist eine Hilbertbasis, d.h. jeder Vektor x ∈ V hat eine P Darstellung x = k hx, vk ivk . (iii) Für alle x, y ∈ V gilt hx, y i = X hx, bk ihy , bk i. k (iv) Für alle x ∈ V gilt die Parsevalsche Gleichung X kxk2 = |hx, bk i|2 . k 118 / 327 Satz (Hilbertbasen) Jeder unendlichdimensionale separable Hilbertraum V besitzt eine abzählbare unendliche Hilbertbasis B = (b1 , b2 , . . .). Folgerung Jeder unendlichdimensionale separable Hilbertraum V über K = R oder K = C ist isomorph zum Hilbertraum ( ) X `2 (K) = x : N → K |x(k)|2 < ∞ k der quadratisch summierbaren Folgen mit Werten in K . Beweis. Jede Hilbertbasis B = (b1 , b2 , . . .) definiert einen Isomorphismus X X φB : `2 (K) → V , x = x k ek 7→ φB (x) = x k bk . k k 119 / 327 Lemma (ÜA) Eine lineare Abbildung F : V1 → V2 zwischen normierten Vektorräumen (V1 , k · k1 ) und (V2 , k · k2 ) ist genau dann stetig, wenn kFxk2 < ∞. sup 06=x∈V1 kxk1 Definition Stetige lineare Abbildungen heißen daher auch beschränkte Operatoren. Die Zahl kF k := sup 06=x∈V1 kFxk2 kxk1 heißt Operatornorm von F . 120 / 327 Bemerkungen/ÜA Durch die Operatornorm wird der VR Lb (V1 , V2 ) := {F ∈ L(V1 , V2 )| kF k < ∞} der beschränkten Operatoren zu einem normierten VR. Insbesondere ist V 0 := Lb (V , K) ein normierter VR für jeden normierten K-Vektorraum V . Hierbei ist K (= R oder C) durch den Betrag normiert. 121 / 327 Satz (Darstellungssatz von Riesz) Sei V ein Hilbertraum über K (= R oder C) und V 0 der Vektorraum aller stetigen linearen Abbildungen V → K. Dann ist durch φ(x) := h·, xi, x ∈ V, ein konjugiert-linearer Isomorphismus normierter Vektorräume φ : V → V 0 gegeben. Beweis. Die Stetigkeit der Linearform φ(x) : V → K ergibt sich aus der CSU: |φ(x)(y )| = |hy , xi| ≤ kxk · ky k für alle y ∈ V. 122 / 327 Weiter im Beweis: Die CSU liefert zunächst kφ(x)k ≤ kxk. Für y = x erhalten wir Gleichheit in der CSU und somit kφ(x)k = kxk. Daraus folgt die Injektivität von φ. Es ist klar, dass φ konjugiert-linear ist, denn das SKP ist konjugiert-linear im zweiten Argument. Es bleibt noch die Surjektivität von φ zu zeigen. Sei dazu α ∈ V 0 und v ∈ V mit α(v ) = 1. Wg. der Stetigkeit von α ist U = Kern α ⊂ V vollständig und V = U ⊕ U ⊥. Wir setzen x0 := v − vU ∈ U ⊥ , wobei vU ∈ U die Orthogonalprojektion von v in U ist. Dann gilt α(x0 ) = 1 und für alle y ∈ V ist daher y = (y − α(y )x0 ) + α(y )x0 ∈ U ⊕ U ⊥ . Somit hy , x0 i = α(y )kx0 k2 und α = φ( kxx00k2 ). 123 / 327 Definition (Topologie) Eine Topologie auf einer Menge X ist eine Familie O von Teilmengen von X mit folgenden Eigenschaften: (i) ∅, X ∈ O. (ii) U, V ∈ O =⇒ U ∩ V ∈ O. (iii) Für jede Familie (Ui )i∈I von Teilmengen von X gilt: Ui ∈ O für alle i ∈ I =⇒ ∪i∈I Ui ∈ O. Definition Ein topologischer Raum (X , O) ist eine mit einer Topologie ausgestattete Menge X . Eine Teilmenge U ⊂ X heißt offen, wenn U ∈ O. Eine Teilmenge A ⊂ X heißt abgeschlossen, wenn X \ A offen ist. Eine Teilmenge V ⊂ X heißt Umgebung eines Punktes x ∈ X , wenn es eine offene Teilmenge U ⊂ X mit x ∈ U ⊂ V gibt. 124 / 327 Definition Sei X ein topologischer Raum und A ⊂ X . (i) Die offene Teilmenge ◦ [ A := B B⊂A offen heißt Inneres von A. (ii) Die abgeschlossene Teilmenge A := \ B B⊃A abgeschl. heißt Abschluss von A. ◦ (iii) ∂A := A \ A heißt Rand von A. 125 / 327 Beispiel: Metrische Räume (i) Sei (X , d) ein metrischer Raum. Br (x) := {y ∈ X |d(y , x) < r } heißt Kugel (oder Ball) vom Radius r und Mittelpunkt x. Eine Teilmenge U ⊂ X heißt offen, wenn es zu jedem x ∈ U ein r > 0 gibt, so dass Br (x) ⊂ U. Das definiert eine Topologie O auf X . Die Kugel Br (x) ⊂ X ist offen, denn aus y ∈ Br (x) und r 0 < r − d(y , x) folgt Br 0 (y ) ⊂ Br (x). (ii) ÜA: Der Abschluss der offenen Kugel Br (x) ⊂ Rn im Euklidischen Raum ist die abgeschlossene Kugel B r (x) = {y ∈ Rn |d(y , x) ≤ r }. Der Rand der Kugel ist die Sphäre: ∂Br (x) = Sr (x) := {y ∈ Rn |d(y , x) = r }. 126 / 327 Definition (Konvergenz und Stetigkeit) Sei X ein topologischer Raum. Eine Folge xk ∈ X , k ∈ N, heißt konvergent mit dem Grenzwert x ∈ X , wenn es zu jeder Umgebung U von x ein N ∈ N gibt, so dass xk ∈ U für alle k ≥ N. Eine Abbildung F : X → Y zwischen topologischen Räumen X und Y heißt stetig, wenn die Urbilder F −1 (U) ⊂ X offener Teilmengen U ⊂ Y offen sind. F : X → Y heißt stetig in x ∈ X , wenn das Urbild F −1 (U) ⊂ X jeder Umgebung U von F (x) ∈ Y eine Umgebung von x ist. 127 / 327 Übungsaufgaben: 1) F : X → Y ist genau dann stetig, wenn F in allen Punkten x ∈ X stetig ist. 2) Sei F : X → Y stetig in x und xk ∈ X eine Folge mit Grenzwert x. Dann konvergiert F (xk ) gegen F (x). 3) Für metrische Räume (X , d) gilt auch die Umkehrung: Wenn für jede Folge xk ∈ X mit Grenzwert x die Bildfolge F (xk ) ∈ Y gegen F (x) konvergiert, dann ist F in x stetig. 128 / 327 Satz (Abgeschlossene Teilmengen von metrischen Räumen) Für eine Teilmenge A ⊂ X eines metrischen Raumes X sind folgende Bedingungen äquivalent: (i) A ist abgeschlossen. (ii) Für alle x ∈ X gilt: Wenn x ∈ X Grenzwert einer konvergenten Folge von Elementen von A ist, so gilt x ∈ A. Beweis. (i) ⇒ (ii) Sei xk ∈ A eine Folge mit Grenzwert x ∈ X . Wenn x 6∈ A, so wäre (wg. der Abgeschlossenheit von A) U = X \ A eine Umgebung von x. Das steht im Widerspruch zur Konvergenz der Folge xk ∈ A gegen x. Also gilt x ∈ A. 129 / 327 Weiter im Beweis: (ii) ⇒ (i) Sei x ∈ X \ A. Wir zeigen, dass es r > 0 gibt mit Br (x) ⊂ X \ A. Sonst gibt es eine Folge xk ∈ B1/k (x) ∩ A. Da diese Folge gegen x konvergiert, folgt x ∈ A, im Widerspruch zu x ∈ X \ A. Bemerkung Der Beweis zeigt, dass für jeden topologischen Raum (i) =⇒ (ii). 130 / 327 Folgerung (i) Jede (bez. der induzierten Metrik) vollständige Teilmenge A eines metrischen X Raumes ist abgeschlossen. (ii) Jede abgeschlossene Teilmenge A eines vollständigen metrischen Raumes X ist vollständig. Beweis. (i) Sei xk ∈ A konvergent mit Grenzwert x ∈ X . Dann ist (xk ) eine Cauchy-Folge und somit x ∈ A (A ist vollständig). (ii) Sei xk ∈ A eine Cauchy-Folge. Dann konvergiert (xk ) gegen x ∈ X (X ist vollständig) und somit x ∈ A (A ist abgeschlossen). 131 / 327 Definition (Kompaktheit) Sei X ein topologischer Raum. (i) X heißt Hausdorffsch, wenn es zu allen x, y ∈ X mit x 6= y Umgebungen U von x und V von y mit U ∩ V = ∅ gibt. (ii) Eine (offene) Überdeckung einer Teilmenge A ⊂ X ist eine Familie (Ui )i∈I von (offenen) Teilmengen Ui ⊂ X mit A ⊂ ∪i∈I Ui . (iii) Eine Teilmenge A ⊂ X eines Hausdorffschen topologischen Raumes heißt kompakt, wenn es zu jeder offenen Überdeckung (Ui )i∈I von A eine endliche Teilüberdeckung (Ui1 , Ui2 , . . . , Uik ), i1 , . . . , ik ∈ I , gibt. Beispiel Metrische Räume sind Hausdorffsch, denn Br (x) ∩ Br (y ) = ∅, wenn r ≤ d(x, y )/2. 132 / 327 Satz Sei X ein Hausdorffscher topologischer Raum und A ⊂ X eine kompakte Teilmenge. Dann hat jede Folge in A eine konvergente Teilfolge mit Grenzwert in A. Beweis. Sei xk ∈ A, k ∈ N, eine Folge. Wenn (xk )k∈N keine konvergente Teilfolge mit Grenzwert in A hat, dann gibt es zu jedem a ∈ A eine offene Umg. Ua , die nur endlich viele Glieder der Folge xk enthält. (Ua )a∈A ist eine offene Überdeckung der kompakten Menge A und besitzt daher eine endliche Teilüberdeckung Ua1 , Ua2 , . . . , Uar . Nach Konstruktion enthält ∪ri=1 Uai ⊃ A nur endlich viele Glieder der Folge, im Widerspruch zu xk ∈ A. 133 / 327 Folgerung (i) Jede kompakte Teilmenge A ⊂ X eines Hausdorffschen topologischen Raumes X ist abgeschlossen. (ii) Jede kompakte Teilmenge A ⊂ X eines metrischen Raumes X ist vollständig. Beweis. (i) Sei xk ∈ A eine konvergente Folge mit Grenzwert x ∈ X . Wir müssen zeigen, dass x ∈ A. Nach dem vorigen Satz hat xk eine konvergente Teilfolge mit Grenzwert in A. Daraus folgt x ∈ A. (ii) Sei xk ∈ A eine Cauchy-Folge. Nach dem vorigen Satz hat xk eine konvergente Teilfolge mit Grenzwert a ∈ A. Also konvergiert (xk ) gegen a. 134 / 327 Satz Jede kompakte Teilmenge A ⊂ X eines metrischen Raumes X ist vollständig (mithin abgeschlossen) und beschränkt. Beweis. Die Vollständigkeit wurde im vorigen Satz bewiesen. Die Beschränktheit bedeutet, dass es x ∈ X und R > 0 gibt, so dass A ⊂ BR (x). Für alle x ∈ X ist (Bk (x))k∈N eine offene Überdeckung von X und somit von A. Also existiert eine endliche Teilüberdeckung Bk1 (x), . . . , Bkr (x) und mit R = max{k1 , . . . , kr } erhalten wir A ⊂ BR (x). 135 / 327 Satz X kompakt, A ⊂ X abgeschlossen =⇒ A kompakt. Beweis. Sei (Ui )i∈I eine offene Überdeckung von A. Dann ist (X \ A, (Ui )i∈I ) eine offene Überdeckung des Kompaktums X . Also gibt es eine endliche Teilüberdeckung (X \ A, Ui1 , . . . , Uik ) von X. (Ui1 , . . . , Uik ) ist eine endliche Teilüberdeckung von A. Folgerung Sei X ein metrischer Raum, in dem die abgeschlossenen Kugeln B r (x) kompakt sind. Die kompakten Teilmengen von X sind dann genau die abgeschlossenen beschränkten Teilmengen. 136 / 327 Satz (Satz von Heine-Borel) Eine Teilmenge A ⊂ Rn ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. Beweis. Wg. der Folgerung genügt es zu zeigen, dass die abgeschlossenen Kugeln B r (x) ⊂ Rn kompakt sind. Da alle Normen auf Rn äquivalent sind, können wir z.B. die Maximumsnorm zu Grunde legen. Außerdem können wir x = 0 (Translationsinvarianz des Abstands) und r = 1 (Homogenität) annehmen, d.h. B r (x) = B 1 (0) = [−1, 1]n =: W . Sei (Ui )i∈I eine offene Überdeckung des Würfels W = W0 . Wir nehmen an, es gibt keine endliche Teilüberdeckung und führen diese Annahme zum Widerspruch. 137 / 327 Weiter im Beweis: Wir konstruieren durch sukzessive Halbierung der Kantenlängen eine Folge von Würfeln Wk der Kantenlänge 21−k , so dass keiner der Wk durch endlich viele der Ui überdeckt wird. Halbierung der Kanten führt zu einer Zerlegung des Würfels Wk in 2n Teilwürfel, von denen mindestens einer nicht durch endlich viele Ui überdeckt werden kann (sonst könnte man Wk durch endlich viele Ui überdecken). Sei xk ∈ Wk . Dann ist xk eine Cauchy-Folge. Wg. der Abgeschlossenheit von Wi gilt x = limk→∞ xk ∈ Wi , denn xk ∈ Wi für alle k ≥ i. Daraus folgt x ∈ ∩i Wi ⊂ W . Also existiert ein i0 mit x ∈ Uio und somit B (x) ⊂ Uio , wenn > 0 klein genug ist. Daraus ergibt sich Wk ⊂ B (x) ⊂ Uio , wenn 21−k < . Ein Widerspruch! (Hierbei haben wir benutzt, dass kx − y kmax ≤ 21−k für alle y ∈ Wk .) 138 / 327 Satz Sei F : X → Y eine stetige Abbildung zwischen Hausdorffschen topologischen Räumen und A ⊂ X sei kompakt. Dann ist F (A) ⊂ Y kompakt Beweis. Sei (Ui )i∈I eine offene Überdeckung von F (A). Dann bilden die Vi := F −1 (Ui ) eine offene Überdeckung des Kompaktums A. Also gibt es eine endliche Teilüberdeckung (Vi1 , . . . , Vik ) und (Ui1 , . . . , Uik ) überdeckt dann F (A). 139 / 327 Folgerung Sei f : X → R eine stetige Funktion und X kompakt. Dann ist f beschränkt und nimmt ihr Minimum und Maximum in X an. Beweis. Nach dem vorigen Satz ist f (X ) kompakt und somit beschränkt und abgeschlossen. 140 / 327 Satz Jede stetige Abbildung F : X → Y von einem kompakten metrischen Raum X in einen metrischen Raum Y ist gleichmäßig stetig, d.h. für alle > 0 existiert δ > 0, so dass für alle x, x 0 ∈ X gilt d(x, x 0 ) < δ =⇒ d(F (x), F (x 0 )) < . Beweis. Für alle x ∈ X existiert δ(x) > 0, so dass d(x, x 0 ) < δ(x) =⇒ d(F (x), F (x 0 )) < . 2 141 / 327 Weiter im Beweis: Da die offenen Kugeln Ux := Bδ(x)/2 (x) das Kompaktum X überdecken, gibt es x1 , . . . , xk ∈ X mit X = ∪ki=1 Uxi . Seien nun x, x 0 ∈ X mit d(x, x 0 ) < δ := min δ(xi )/2. i=1,...,k Dann gibt es xi mit x ∈ Uxi , d.h. d(x, xi ) < δ(xi )/2, und somit d(x 0 , xi ) < δ(xi ). Daraus ergibt sich d(F (x), F (xi )) < /2 und somit d(F (x), F (x 0 )) < . und d(F (x 0 ), F (xi )) < /2 142 / 327 Definition (Kompaktheit) Sei X ein topologischer Raum. (i) X heißt Hausdorffsch, wenn es zu allen x, y ∈ X mit x 6= y Umgebungen U von x und V von y mit U ∩ V = ∅ gibt. (ii) Eine (offene) Überdeckung einer Teilmenge A ⊂ X ist eine Familie (Ui )i∈I von (offenen) Teilmengen Ui ⊂ X mit A ⊂ ∪i∈I Ui . (iii) Eine Teilmenge A ⊂ X eines Hausdorffschen topologischen Raumes heißt kompakt, wenn es zu jeder offenen Überdeckung (Ui )i∈I von A eine endliche Teilüberdeckung (Ui1 , Ui2 , . . . , Uik ), i1 , . . . , ik ∈ I , gibt. Beispiel Metrische Räume sind Hausdorffsch, denn Br (x) ∩ Br (y ) = ∅, wenn r ≤ d(x, y )/2. 143 / 327 Satz Sei X ein Hausdorffscher topologischer Raum und A ⊂ X eine kompakte Teilmenge. Dann hat jede Folge in A eine konvergente Teilfolge mit Grenzwert in A. Folgerung (i) Jede kompakte Teilmenge A ⊂ X eines Hausdorffschen topologischen Raumes X ist abgeschlossen. (ii) Jede kompakte Teilmenge A ⊂ X eines metrischen Raumes X ist vollständig. 144 / 327 Satz Jede kompakte Teilmenge A ⊂ X eines metrischen Raumes X ist vollständig (mithin abgeschlossen) und beschränkt. Satz X kompakt, A ⊂ X abgeschlossen =⇒ A kompakt. Folgerung Sei X ein metrischer Raum, in dem die abgeschlossenen Kugeln B r (x) kompakt sind. Die kompakten Teilmengen von X sind dann genau die abgeschlossenen beschränkten Teilmengen. 145 / 327 Satz (Satz von Heine-Borel) Eine Teilmenge A ⊂ Rn ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. Beweis. Wg. der Folgerung genügt es zu zeigen, dass die abgeschlossenen Kugeln B r (x) ⊂ Rn kompakt sind. Da alle Normen auf Rn äquivalent sind, können wir z.B. die Maximumsnorm zu Grunde legen. Außerdem können wir x = 0 (Translationsinvarianz des Abstands) und r = 1 (Homogenität) annehmen, d.h. B r (x) = B 1 (0) = [−1, 1]n =: W . Sei (Ui )i∈I eine offene Überdeckung des Würfels W = W0 . Wir nehmen an, es gibt keine endliche Teilüberdeckung und führen diese Annahme zum Widerspruch. 146 / 327 Weiter im Beweis: Wir konstruieren durch sukzessive Halbierung der Kantenlängen eine Folge von Würfeln Wk der Kantenlänge 21−k , so dass keiner der Wk durch endlich viele der Ui überdeckt wird. Halbierung der Kanten führt zu einer Zerlegung des Würfels Wk in 2n Teilwürfel, von denen mindestens einer nicht durch endlich viele Ui überdeckt werden kann (sonst könnte man Wk durch endlich viele Ui überdecken). Sei xk ∈ Wk . Dann ist xk eine Cauchy-Folge. Wg. der Abgeschlossenheit von Wi gilt x = limk→∞ xk ∈ Wi , denn xk ∈ Wi für alle k ≥ i. Daraus folgt x ∈ ∩i Wi ⊂ W . Also existiert ein i0 mit x ∈ Uio und somit B (x) ⊂ Uio , wenn > 0 klein genug ist. Daraus ergibt sich Wk ⊂ B (x) ⊂ Uio , wenn 21−k < . Ein Widerspruch! (Hierbei haben wir benutzt, dass kx − y kmax ≤ 21−k für alle y ∈ Wk .) 147 / 327 Satz Sei F : X → Y eine stetige Abbildung zwischen Hausdorffschen topologischen Räumen und A ⊂ X sei kompakt. Dann ist F (A) ⊂ Y kompakt Beweis. Sei (Ui )i∈I eine offene Überdeckung von F (A). Dann bilden die Vi := F −1 (Ui ) eine offene Überdeckung des Kompaktums A. Also gibt es eine endliche Teilüberdeckung (Vi1 , . . . , Vik ) und (Ui1 , . . . , Uik ) überdeckt dann F (A). 148 / 327 Folgerung Sei f : A → R eine stetige Funktion und A kompakt. Dann ist f beschränkt und nimmt ihr Minimum und Maximum in X an. Beweis. Nach dem vorigen Satz ist f (X ) kompakt und somit beschränkt und abgeschlossen. 149 / 327 Satz Jede stetige Abbildung F : X → Y von einem kompakten metrischen Raum X in einen metrischen Raum Y ist gleichmäßig stetig, d.h. für alle > 0 existiert δ > 0, so dass für alle x, x 0 ∈ X gilt d(x, x 0 ) < δ =⇒ d(F (x), F (x 0 )) < . Beweis. Für alle x ∈ X existiert δ(x) > 0, so dass d(x, x 0 ) < δ(x) =⇒ d(F (x), F (x 0 )) < . 2 150 / 327 Weiter im Beweis: Da die offenen Kugeln Ux := Bδ(x)/2 (x) das Kompaktum X überdecken, gibt es x1 , . . . , xk ∈ X mit X = ∪ki=1 Uxi . Seien nun x, x 0 ∈ X mit d(x, x 0 ) < δ := min δ(xi )/2. i=1,...,k Dann gibt es xi mit x ∈ Uxi , d.h. d(x, xi ) < δ(xi )/2, und somit d(x 0 , xi ) < δ(xi ). Daraus ergibt sich d(F (x), F (xi )) < /2 und somit d(F (x), F (x 0 )) < . und d(F (x 0 ), F (xi )) < /2 151 / 327 Definition Sei U ⊂ Rn eine offene Teilmenge und v ∈ Rn ein Vektor. (i) Eine Funktion f : U → R heißt an der Stelle x ∈ U in Richtung v differenzierbar, wenn die Funktion g : (−, ) → R, g (t) := f (x + tv ), bei t = 0 differenzierbar ist. (Hierbei ist > 0 so klein, dass x + tv ∈ U für alle t ∈ (−, ).) (ii) Die Zahl d (∂v f )(x) := g (0) = f (x + tv ) dt t=0 0 heißt Ableitung von f an der Stelle x in Richtung v . 152 / 327 Definition Sei (e1 , . . . , en ) die kanonische Basis des Rn , U ⊂ Rn offen und f : U → R. Die Funktion f heißt an der Stelle x ∈ U partiell differenzierbar, wenn f an der Stelle x in alle Koordinatenrichtungen ei differenzierbar ist. Die Zahl (∂i f )(x) := (∂ei f )(x), i = 1, 2, . . . n, heißt i-te partielle Ableitung von f an der Stelle x. f heißt partiell differenzierbar, wenn f in allen Punkten x ∈ U partiell differenzierbar ist. Die Funktion ∂i f : U → R heißt i-te partielle Ableitung von f . Man schreibt dafür auch ∂f . ∂x i 153 / 327 Bemerkung P Die i-te partielle Ableitung (∂i f )(x) an der Stelle x = nj=1 x j ej ist genau die Ableitung der Funktion h(t) := f (x 1 , . . . , x i−1 , t, x i+1 , . . . , x n ) an der Stelle t = x i : d (∂i f )(x) = f (x 1 , . . . , x i−1 , x i + t, x i+1 , . . . , x n ) = h0 (x i ). dt t=0 Beim Berechnen der i-ten partiellen Ableitung sind also die Variablen x j für j 6= i als Konstanten zu behandeln. Differenziert wird nach der Variablen x i . Beispiel Die Funktion f : Rn → R, f (x) = kxk2 = differenzierbar und ∂f (x) = 2x i . ∂x i Pn j=1 (x j )2 , ist partiell 154 / 327 Definition Sei U ⊂ Rn offen und f : U → R. (i) Für k ≥ 2 definiert man rekursiv: f heißt k-mal partiell differenzierbar, wenn f partiell differenzierbar ist und die partiellen Ableitungen ∂i f (k-1)-mal partiell differenzierbar sind. (f heißt einmal partiell differenzierbar, wenn f partiell differenzierbar ist.) (ii) f heißt k-mal stetig differenzierbar, wenn f k-mal partiell differenzierbar ist und alle partiellen Ableitungen ∂k f := ∂i1 ∂i2 · · · ∂ik f ∂x i1 ∂x i2 · · · ∂x ik der Ordnung k stetig sind. 155 / 327 Satz Sei f : U → R (U ⊂ Rn offen) zweimal stetig differenzierbar. Dann gilt für alle i, j ∈ {1, 2, . . . , n}: ∂i ∂j f = ∂j ∂i f . Beweis. Da es nur um zwei Koordinatenrichtungen ei und ej geht, können wir annehmen, dass n = 2. Wir berechnen die zweiten partiellen Ableitungen an der Stelle (x0 , y0 ) ∈ U. Wir können annehmen, dass (x0 , y0 ) = (0, 0) und dass U ein Quadrat Q = {(x, y )| |x| < und |y | < } enthält ( > 0). 156 / 327 Weiter im Beweis: Nach dem Mittelwertsatz angewendet auf die Funktion g (x) = f (x, y ) − f (x, 0) gibt es zu (x, y ) ∈ Q ein ξ ∈ (−|x|, |x|) mit (1) g (x) − g (0) = xg 0 (ξ) = x(∂1 f (ξ, y ) − ∂1 f (ξ, 0)). Anwendung des MWS auf y 7→ ∂1 f (ξ, y ) liefert η ∈ (−|y |, |y |) mit (2) ∂1 f (ξ, y ) − ∂1 f (ξ, 0) = y ∂2 ∂1 f (ξ, η). Aus (1) und (2) ergibt sich (3) g (x) − g (0) = xy ∂2 ∂1 f (ξ, η). Analog ergibt sich mit h(y ) = f (x, y ) − f (0, y ) (30 ) ˜ η̃), h(y ) − h(0) = xy ∂1 ∂2 f (ξ, ˜ < |x| und |η̃| < |y |. wobei |ξ| 157 / 327 Weiter im Beweis: Aus (3) und (3’) erhalten wir wg. g (x) − g (0) = h(y ) − h(0): (4) ˜ η̃). ∂2 ∂1 f (ξ, η) = ∂1 ∂2 f (ξ, Die Stetigkeit der zweiten partiellen Ableitungen erlaubt nun den Grenzübergang (x, y ) → (0, 0) in (4), woraus sich ∂2 ∂1 f (0, 0) = ∂1 ∂2 f (0, 0) ergibt. 158 / 327 Definition Sei U ⊂ Rn offen und f : U → R an der Stelle x ∈ U partiell differenzierbar. Der Spaltenvektor grad f (x) := ∂1 f (x) ∂2 f (x) .. . ∂n f (x) heißt Gradient von f an der Stelle x. 159 / 327 Beispiel Sei r = r (x) = kxk die Euklidische Norm von x ∈ Rn und f : R+ → R eine differenzierbare Funktion. Dann ist die rotationssymmetrische Funktion x 7→ f (r ) = f (r (x)) auf U = Rn \ {0} partiell differenzierbar. Die partiellen Ableitungen erhält man mittels der Kettenregel: ∂i f (r ) = f 0 (r )∂i r √ ∂i r 2 xi = . ∂i r = ∂i r 2 = 2r r Der Gradient ist somit x grad f (r ) = f 0 (r )grad r = f 0 (r ) , r 160 / 327 Definition (Divergenz) Sei U ⊂ Rn offen. P i m (i) Eine Abbildung f = m i=1 f ei : U → R heißt (in x) partiell differenzierbar, wenn Ihre Komponentenfunktionen f i , i = 1, 2, . . . m, (in x) partiell differenzierbar sind. (ii) Ein Vektorfeld auf U ⊂ Rn ist eine Abbildung v : U → Rn . (iii) Die Divergenz eines P in x ∈ U partiell differenzierbaren Vektorfeldes v = i=1 v i ei : U → Rn is die Zahl div v (x) := n X ∂i v i (x). i=1 161 / 327 Beispiel Der Gradient einer zweimal partiell differenzierbaren Funktion f : U → R ist ein partiell differenzierbares Vektorfeld grad f : U → Rn . Somit definiert ∆f := div grad f = n X ∂i2 f i=1 eine Funktion U → R. Der Differentialoperator ∆ heißt Laplace-Operator. Die partielle Differentialgleichung ∆f = 0 heißt Potenzialgleichung. Die Lösungen dieser Gleichung heißen harmonische Funktionen. 162 / 327 Beispiel: rotationssymmetrische Potenziale Sei f : R+ → R eine zweimal differenzierbare Funktion und f (r ) die zugehörige rotationssymm. zweimal partiell differenzierbare Funktion auf Rn \ {0}. Dann gilt ∂i f (r ) = f 0 (r )x i /r und ∂j ∂i f (r ) = f 00 (r ) δji r − x i x j /r xjxi 0 + f (r ) r2 r2 Daraus folgt ∆f (r ) = f 00 (r ) + n−1 0 r f (r ). Differentialgleichung f 00 (r ) 0 Jede Lösung der + n−1 r f (r ) = 0 definiert somit eine rotationssymm. harmonische Funktion. 163 / 327 Für n = 1 erhalten wir f (r ) = ar + b. Unter der Voraussetzung, dass h(r ) := f 0 (r ) keine Nullstellen hat, können wir die DGL an f für n ≥ 2 wie folgt umformen: n−1 r ln |h(r )| = −(n − 1) ln r + c ec |h(r )| = n−1 . r (ln |h(r )|)0 = − Somit ist f (r ) = n = 2. a r n−2 + b falls n > 2 und f (r ) = a ln r + b für Für n = 3 erhalten wir mit b = 0 das Newtonsche Gravitationspotenzial − GM r einer im Nullpunkt konzentrierten Masse M. (Hierbei ist G > 0 die Gravitationskonstante.) Das elektrische Potenzial einer Punktladung Q ist ebenfalls von der Form ar , wobei a = kQ und k > 0 eine Naturkonstante ist. 164 / 327 Das Newtonsche Gravitationsfeld Jede partiell differenzierbare Funktion V : U → R auf einer offenen Teilmenge U ⊂ Rn definiert ein Vektorfeld −gradV . Für das Newtonpotenzial V (r ) = − GM r erhalten wir −gradV = − GM x , r2 r x ∈ R3 \ {0}, das Newtonsche Gravitationsfeld. Die auf eine Probemasse m im Punkt x wirkende Kraft ist F = −mgradV = − GmM x . r2 r Die Gravitationskraft ist also immer anziehend. Die Bewegung der Probemasse t 7→ x(t) genügt der (von m 6= 0 unabhängigen!) Differenzialgleichung F = mẍ ⇐⇒ ẍ = −GM x . r3 165 / 327 Das elektrostatische Feld Für das elektrische Potenzial V (r ) = E = −gradV = kQ x , r2 r kQ r ergibt sich entsprechend x ∈ R3 \ {0}, als elektrisches Feld. Die auf eine Probeladung q im Punkt x wirkende Kraft ist F = qE = kqQ x . r2 r Die elektrische Kraft ist also abstoßend, wenn qQ > 0 und anziehend wenn qQ < 0. Die Bewegung einer Probeladung t 7→ x(t) der Masse m genügt der Differenzialgleichung F = mẍ, d.h. ẍ = kqQx (m 6= 0). mr 3 166 / 327 Definition (Vektorprodukt/Kreuzprodukt) Das Vektorprodukt (oder Kreuzprodukt) von x = P und y = 3i=1 y i ei ∈ R3 ist der Vektor 2 3 x y − x 3y 2 x × y := x 3 y 1 − x 1 y 3 . x 1y 2 − x 2y 1 P3 i=1 x ie i ∈ R3 167 / 327 Satz (Eigenschaften des Vektorprodukts) Für alle x, y ∈ R3 gilt: (i) x × y = −y × x. (ii) x × y ist senkrecht zu x und y . (iii) kx × y k2 = kxk2 ky k2 − hx, y i2 . (iv) kx × y k = kxk · ky k sin ϕ, wenn x, y ∈ R3 \ {0} und ϕ = ∠(x, y ) ∈ [0, π]. (v) x × y = 0 ⇐⇒ x und y linear abhängig. (vi) Wenn x und y linear unabhängig sind, dann ist (x, y , x × y ) eine positiv orientierte Basis. (vii) Wenn x und y orthonormal sind, dann ist (x, y , x × y ) eine positiv orientierte Orthonormalbasis. Beweis. Übungsaufgabe 168 / 327 Satz Für alle x, y , z ∈ R3 gilt: (∗) hx × y , zi = det(xyz). Beweis. Es genügt die Gleichung (*) für x, y , z ∈ {e1 , e2 , e3 } zu überprüfen. Offenbar ist hei × ej , ek i = 0 = det(ei ej ek ), wenn zwei der drei Indizes übereinstimmen. Sei (i, j, k) eine Permutation von (1, 2, 3). Da (ei , ej ) orthonormal ist, gilt ei × ej = ijk ek , wobei ijk das Vorzeichen der Permutation ist. Also hei × ej , ek i = ijk = det(ei ej ek ) für jede Permutation. 169 / 327 Bemerkung Die alternierende Trilinearform (x, y , z) 7→ hx × y , zi heißt Spatprodukt. |hx × y , zi| ist das Volumena des durch x, y , z aufgespannten Parallelepipeds oder Spats: P = {ax + by + cz|a, b, c ∈ [0, 1]}. a Berechnung von Volumina wird in der Vorlesung Mathem. für Phys. III behandelt 170 / 327 Definition P Sei v = 3i=1 v i ei ein partiell differenzierbares Vektorfeld auf einer offenen Teilmenge U ⊂ R3 . Das Vektorfeld ∂2 v 3 − ∂3 v 2 rot v := ∂3 v 1 − ∂1 v 3 ∂1 v 2 − ∂2 v 1 heißt Rotation von v . 171 / 327 Bemerkung Wir können den Gradienten als vektorwertigen Differentialoperator auffassen: ∂1 grad = ∂2 . ∂3 Daraus ergibt sich formal: div v = hgrad, v i, rot v = grad × v . Weiterhin folgt formal (das ist kein Beweis!): rot grad f div rot v = grad × grad f = 0 = hgrad, grad × v i = 0. 172 / 327 Satz (Übungsaufgabe) Sei U ⊂ R3 offen und f : U → R, v : U → R3 zweimal stetig differenzierbar. Dann gilt rot grad f = 0 und div rot v = 0. 173 / 327 Definition (Differenzierbarkeit) Sei U ⊂ Rn offen und F : U → Rm . (i) F heißt im Punkt x ∈ U (total) differenzierbar, wenn es eine lineare Abbildung A : Rn → Rm gibt, so dass F (x + ξ) = F (x) + Aξ + ϕ(ξ), wobei ϕ(ξ) = 0. ξ→0 kξk lim (ii) Die lineare Abbildung dFx := A heißt dann Differenzial (oder Ableitung) von F im Punkt x. (iii) F : U → Rm heißt differenzierbar, wenn F in allen Punkten x ∈ U differenzierbar ist. 174 / 327 Beispiel f : Rn → R, f (x) = kxk2 , ist überall differenzierbar, denn f (x + ξ) = f (x) + 2hx, ξi + f (ξ) und f (ξ)/kξk = kξk → 0 (ξ → 0). Das Differenzial dfx ∈ (Rn )∗ = Mat(1 × n, R) ist gegeben durch: dfx ξ = 2hx, ξi = 2x t ξ, ξ ∈ Rn . Also dfx = 2x t (Zeilenvektor). 175 / 327 Satz Sei U ⊂ Rn offen und F = differenzierbar. Dann gilt: Pm j=1 F je j : U → Rm in x (i) F ist in x stetig. (ii) F ist in x partiell differenzierbar und ∂1 F 1 (x) · · · ∂n F 1 (x) .. .. dFx = . . m m ∂1 F (x) · · · ∂n F (x) Beweis. (i) Aus limξ→0 ϕ(ξ)/kξk = 0 folgt limξ→0 ϕ(ξ) = 0 und somit ξ→0 F (x + ξ) = F (x) + Aξ + ϕ(ξ) −→ F (x). 176 / 327 Weiter im Beweis: (ii) Aus der Differenzierbarkeit von F in x folgt komponentenweise F j (x + ξ) = F j (x) + Aj ξ + ϕj (ξ), P j j j j wobei ϕ = m j=1 ϕ ej und A = (A1 , . . . , An ) die j-te Zeile der Matrix A = dFx ist. Mit ξ = tei erhalten wir F j (x + tei ) − F j (x) ϕj (tei ) = Aji + , t t woraus wg. limξ→0 ϕ(ξ)/kξk = 0 die partielle Differenzierbarkeit von F j in x folgt und ∂i F j (x) = Aji . 177 / 327 Folgerung Sei U ⊂ Rn offen und f : U → R eine differenzierbare Funktion. Dann ist f partiell differenzierbar und df = (∂1 f , . . . , ∂n f ) = (grad f )t : U → (Rn )∗ , x 7→ dfx . Beispiel Für die Koordinatenfunktionen f (x) = x j haben wir grad(x j ) = ej und somit dx j = e j = ejt . Man schreibt daher für jede differenzierbare P Funktion f auf einer offenen Teilmenge U ⊂ Rn auch df = ni=1 ∂i fdx i . 178 / 327 Satz Sei U ⊂ Rn offen und f : U → R eine in x differenzierbare Funktion. Dann existiert für alle v ∈ Rn die Richtungsableitung ∂v f (x) und es gilt (∗) ∂v f (x) = dfx v = hgrad f (x), v i. Beweis. Wir wissen bereits, dass dfx v = hgrad f (x), v i. Aus f (x + tv ) = f (x) + tdfx v + ϕ(tv ) folgt mit limξ→0 ϕ(ξ)/kξk = 0 die Differenzierbarkeit von f an der Stelle x in Richtung v und ∂v f (x) = dfx v . 179 / 327 Satz P j m U ⊂ Rn sei offen, F = m j=1 F ej : U → R partiell differenzierbar und die partiellen Ableitungen ∂i F j seien an der Stelle x ∈ U stetig. Dann ist F in x differenzierbar. Beweis. Wir können o.B.d.A. annehmen, dass m = 1. P Sei > 0 so klein, dass B (x) ⊂ U und ξ = ni=1 ξ i ei ∈ B (0). P Wir setzen xk := x + ki=1 ξ i ei ∈ B (x) ⊂ U (=⇒ x0 = x, xn = x + ξ). Dann existiert wg. des MWS ein θk ∈ [0, 1] mit F (xk ) − F (xk−1 ) = ξ k ∂k F (yk ), yk := xk−1 + θk ξ k ek . 180 / 327 Weiter im Beweis: Somit F (x + ξ) − F (x) = n X F (xk ) − F (xk−1 ) = k=1 = ϕ(ξ) = n X k=1 n X n X ξ k ∂k F (yk ) k=1 ξ k ∂k F (x) + ϕ(ξ) ξ k (∂k F (yk ) − ∂k F (x)). k=1 Aus ξ → 0 folgt yk → x und somit, wg. der Stetigkeit von ∂k F in x, limξ→0 ϕ(ξ)/kξk = 0. 181 / 327 Satz (Kettenregel) Seien U ⊂ Rn , V ⊂ Rm offen, F : U → Rm , F (U) ⊂ V und G : V → Rk . Wenn F in x und G in y = F (x) differenzierbar sind, dann ist G ◦ F : U → Rk in x differenzierbar und d(G ◦ F )x = dGy ◦ dFx . Beweis. Wir haben F (x + ξ) = F (x) + Aξ + ϕ(ξ), G (y + η) = G (y ) + Bη + ψ(η), A = dFx , B = dGy , wobei limξ→0 ϕ(ξ)/kξk = limη→0 ψ(η)/kηk = 0. 182 / 327 Weiter im Beweis: Mit η = F (x + ξ) − y = Aξ + ϕ(ξ) erhalten wir (G ◦ F )(x + ξ) − (G ◦ F )(x) = G (y + η) − G (y ) = Bη + ψ(η) = BAξ + Bϕ(ξ) + ψ(η) Es genügt also zu zeigen, dass limξ→0 ψ(η)/kξk = 0. Aus der Definition von η erhält man leicht die Existenz von C > 0 und δ > 0, so dass kηk ≤ C kξk für alle ξ ∈ Bδ (0). Also folgt aus ξ → 0 zunächst η → 0 und dann ψ(η)/kξk ≤ C ψ(η)/kηk → 0. 183 / 327 Folgerung (Kettenregel in Komponenten) Seien U ⊂ Rn , V ⊂ Rm offen, F : U → Rm , F (U) ⊂ V und G : V → R. Desweitern sei F in x und G in y = F (x) differenzierbar. Dann ist G ◦ F : U → R in x differenzierbar und ∂i (G ◦ F )(x) = m X ∂j G (y )∂i F j (x), i = 1, 2, . . . , n. j=1 184 / 327 Beispiele (i) Sei c : (−, ) → Rn ( > 0) eine im Nullpunkt differenzierbare Kurve, c(0) = x, c 0 (0) = v . Ferner sei f : U → R eine in einer offenen Umgebung U ⊂ Rn von x definierte und in x differenzierbare Funktion. Dann gilt für die Ableitung der Funktion f ◦ c : (−, ) → R: (f ◦ c)0 (0) = dfc(0) c 0 (0) = dfx v = ∂v f (x). (ii) Für A ∈ Mat(n × n, R) sei F (A) = A2 und G (A) = spurA. F und G sind auf Mat(n × n, R) differenzierbar mit dFA B = AB + BA, dGA B = spurB, A, B ∈ Mat(n × n, R). Somit ist G ◦ F : A 7→ spur(A2 ) differenzierbar und d(G ◦F )A B = dGF (A) ◦dFA B = spur(AB +BA) = 2spur(AB). 185 / 327 Satz (Mittelwertsatz) Sei U ⊂ Rn offen und F : U → Rm stetig differenzierbar. Dann gilt Z (∗) F (x + ξ) − F (x) = 1 ∂ξ F (x + tξ)dt, 0 wobei x ∈ U, ξ ∈ Rn , so dass x + tξ ∈ U für alle t ∈ [0, 1]. Beweis. Wenn F stetig diff. ist, dann auch g (t) := F (x + tξ) und 1 Z g (1) − g (0) = g 0 (t)dt. 0 Das ist (*), denn g 0 (t) = d ds s=0 g (t + s) = ∂ξ F (x + tξ). 186 / 327 Folgerung Unter den Voraussetzungen des vorhergehenden Satzes gilt mit C := maxt∈[0,1] kdFx+tξ k: kF (x + ξ) − F (x)k ≤ C kξk. Beweis. Es gilt k∂ξ F (x + tξ)k = kdFx+tξ ξk ≤ kdFx+tξ k · kξk ≤ C kξk. Daraus folgt 1 Z kF (x + ξ) − F (x)k = k Z ≤ ∂ξ F (x + tξ)dtk 0 1 k∂ξ F (x + tξ)kdt ≤ C kξk. 0 187 / 327 Hierbei haben wir folgenden Satz verwendet. Satz Sei c : [0, 1] → Rn eine stetige Kurve. Dann gilt Z 1 Z 1 c(t)dt kc(t)kdt. ≤ 0 0 Beweis. R1 Es genügt das Integral 0 c(t)dt als Grenzwert Riemannscher Summen zu schreiben, die Dreiecksungleichung auf die Summen anzuwenden und anschließend zum Grenzwert überzugehen. 188 / 327 Wiederholung:Differenzierbarkeit Definition (Differenzierbarkeit) Sei U ⊂ Rn offen und F : U → Rm . (i) F heißt im Punkt x ∈ U (total) differenzierbar, wenn es eine lineare Abbildung A : Rn → Rm gibt, so dass F (x + ξ) = F (x) + Aξ + ϕ(ξ), wobei lim ξ→0 ϕ(ξ) = 0. kξk (ii) Die lineare Abbildung dFx := A heißt dann Differenzial (oder Ableitung) von F im Punkt x. (iii) F : U → Rm heißt differenzierbar, wenn F in allen Punkten x ∈ U differenzierbar ist. 189 / 327 Satz Sei U ⊂ Rn offen und F = differenzierbar. Dann gilt: Pm j=1 F je j : U → Rm in x (i) F ist in x stetig. (ii) F ist in x partiell differenzierbar und ∂1 F 1 (x) · · · ∂n F 1 (x) .. .. dFx = . . ∂1 F m (x) · · · ∂n F m (x) Satz P j m U ⊂ Rn sei offen, F = m j=1 F ej : U → R partiell differenzierbar und die partiellen Ableitungen ∂i F j seien an der Stelle x ∈ U stetig. Dann ist F in x differenzierbar. 190 / 327 Satz (Kettenregel) Seien U ⊂ Rn , V ⊂ Rm offen, F : U → Rm , F (U) ⊂ V und G : V → Rk . Wenn F in x und G in y = F (x) differenzierbar sind, dann ist G ◦ F : U → Rk in x differenzierbar und d(G ◦ F )x = dGy ◦ dFx . Folgerung (Kettenregel in Komponenten) Seien U ⊂ Rn , V ⊂ Rm offen, F : U → Rm , F (U) ⊂ V und G : V → R. Desweitern sei F in x und G in y = F (x) differenzierbar. Dann ist G ◦ F : U → R in x differenzierbar und ∂i (G ◦ F )(x) = m X ∂j G (y )∂i F j (x), i = 1, 2, . . . , n. j=1 191 / 327 Beispiele (i) Sei c : (−, ) → Rn ( > 0) eine im Nullpunkt differenzierbare Kurve, c(0) = x, c 0 (0) = v . Ferner sei f : U → R eine in einer offenen Umgebung U ⊂ Rn von x definierte und in x differenzierbare Funktion. Dann gilt für die Ableitung der Funktion f ◦ c : (−, ) → R: (f ◦ c)0 (0) = dfc(0) c 0 (0) = dfx v = ∂v f (x). (ii) Für A ∈ Mat(n × n, R) sei F (A) = A2 und G (A) = spurA. F und G sind auf Mat(n × n, R) differenzierbar mit dFA B = AB + BA, dGA B = spurB, A, B ∈ Mat(n × n, R). Somit ist G ◦ F : A 7→ spur(A2 ) differenzierbar und d(G ◦F )A B = dGF (A) ◦dFA B = spur(AB +BA) = 2spur(AB). 192 / 327 Satz (Mittelwertsatz) Sei U ⊂ Rn offen und F : U → Rm stetig differenzierbar. Dann gilt Z (∗) F (x + ξ) − F (x) = 1 ∂ξ F (x + tξ)dt, 0 wobei x ∈ U, ξ ∈ Rn , so dass x + tξ ∈ U für alle t ∈ [0, 1]. Beweis. Wenn F stetig diff. ist, dann auch g (t) := F (x + tξ) und 1 Z g (1) − g (0) = g 0 (t)dt. 0 Das ist (*), denn g 0 (t) = d ds s=0 g (t + s) = ∂ξ F (x + tξ). 193 / 327 Folgerung Unter den Voraussetzungen des vorhergehenden Satzes gilt mit C := maxt∈[0,1] kdFx+tξ k: kF (x + ξ) − F (x)k ≤ C kξk. Beweis. Es gilt k∂ξ F (x + tξ)k = kdFx+tξ ξk ≤ kdFx+tξ k · kξk ≤ C kξk. Daraus folgt 1 Z kF (x + ξ) − F (x)k = k Z ≤ ∂ξ F (x + tξ)dtk 0 1 k∂ξ F (x + tξ)kdt ≤ C kξk. 0 194 / 327 Hierbei haben wir folgenden Satz verwendet. Satz Sei c : [0, 1] → Rn eine stetige Kurve. Dann gilt Z 1 Z 1 c(t)dt kc(t)kdt. ≤ 0 0 Beweis. R1 Es genügt das Integral 0 c(t)dt als Grenzwert Riemannscher Summen zu schreiben, die Dreiecksungleichung auf die Summen anzuwenden und anschließend zum Grenzwert überzugehen. 195 / 327 Satz Sei U ⊂ Rn offen, f : U → R stetig differenzierbar. Dann steht grad f senkrecht auf den Niveaumengen Nf (k) := {x ∈ Rn |f (x) = k}, d.h. für jede in Nf (k) verlaufende differenzierbare Kurve c : (a, b) → Rn gilt grad f |c(t) ⊥ c 0 (t) für alle t ∈ (a, b). Beweis. Das folgt durch Ableiten der Gleichung f ◦ c = k: 0 = dfc ◦ c 0 = hgrad f , c 0 i. 196 / 327 Bemerkung Wenn grad f (x) 6= 0 ist, so gibt der Gradient die Richtung des stärksten Anstiegs der Funktion f im Punkt x ∈ U an, denn für jeden Einheitsvektor v ∈ Rn gilt ∂v f (x) = hgrad f (x), v i ≤ kgrad f (x)k mit Gleichheit genau dann, wenn v = grad f (x) kgrad f (x)k . 197 / 327 Definition Sei U ⊂ Rn , f : U → R eine Funktion und x ∈ U. Man sagt, dass f in x ein lokales Maximum (bzw. ein lokales Minimum) annimmt, falls es > 0 gibt, derart dass f (x) ≥ f (ξ) (bzw. f (x) ≤ f (ξ)) für alle ξ ∈ U mit kx − ξk < . Lokale Minima und Maxima heißen auch lokale Extrema. Man spricht von einem isolierten lokalen Extremum, falls zusätzlich f (ξ) 6= f (x) für alle ξ ∈ U \ {x} mit kx − ξk < . 198 / 327 Satz f : U → R sei an der Stelle x ∈ U partiell differenzierbar (U ⊂ Rn offen). Wenn f an der Stelle x ∈ U ein lokales Extremum annimmt, dann gilt grad f (x) = 0. Beweis. Die Funktion t 7→ g (t) := f (x + tei ) ist im Nullpunkt differenzierbar und hat dort ein lokales Extremum. Demnach gilt 0 = g 0 (0) = ∂i f (x). 199 / 327 Satz (Taylorentwicklung) Sei f : I → R eine (m + 1)-mal stetig differenzierbare Funktion auf einem Intervall I ⊂ R. Dann gilt 1 1 f (x+ξ) = f (x)+f 0 (x)ξ+ f 00 (x)ξ 2 +· · ·+ f (m) (x)ξ m +Rm+1 (x, ξ), 2 m! Z ξ m+1 1 Rm+1 (x, ξ) = (1 − t)m f (m+1) (x + tξ)dt, m! 0 für alle x, ξ ∈ R, so dass {x + tξ|t ∈ [0, 1]} ⊂ I . Beweis (durch Induktion nach m) Der Fall m = 0 ist der Fundamentalsatz der Differenzial- und Integralrechnung: Z f (x + ξ) − f (x) = x x+ξ f 0 (s)ds = ξ Z 1 f 0 (x + tξ)dt = R1 (x, ξ). 0 200 / 327 Weiter im Beweis: Induktionschritt Wir gehen aus von: Rm (x, ξ) = ξm (m − 1)! Partielle Integration ergibt − Z R1 0 1 (1 − t)m−1 f (m) (x + tξ)dt. 0 (1 − t)m−1 f (m) (x + tξ)dt = 1 1 (1 − t)m f (m) (x + tξ)|10 + m m 1 Z (1 − t)m f (m+1) (x + tξ)ξdt. 0 und somit ξ m (m) ξ m+1 Rm (x, ξ) = f (x) + m! m! Z 1 (1 − t)m f (m+1) (x + tξ)dt. 0 201 / 327 Satz (Restglied) Unter den Voraussetzungen des letzten Satzes existiert τ ∈ [0, 1] mit ξ m+1 (m+1) f (x + τ ξ). Rm+1 (x, ξ) = (m + 1)! Beweis. Sei k bzw. K das Maximum bzw. Minimum der stetigen Funktion t 7→ f (m+1) (x + tξ) auf dem Intervall [0, 1]. R1 Dann gilt mit I := 0 (1 − t)m dt: Z kI ≤ 1 (1 − t)m f (m+1) (x + tξ)dt ≤ K I. 0 Nach dem Zwischenwertsatz existiert daher τ ∈ [0, 1] mit R1 m (m+1) (x + tξ)dt = f (m+1) (x + τ ξ)I. 0 (1 − t) f 202 / 327 Weiter im Beweis: Insgesamt ergibt sich Rm+1 (x, ξ) = = = Z ξ m+1 1 (1 − t)m f (m+1) (x + tξ)dt m! 0 ξ m+1 (m+1) f (x + τ ξ)I m! ξ m+1 (m+1) f (x + τ ξ), (m + 1)! denn Z I= 0 1 (1 − t)m dt = − 1 (1 − t)m+1 1 . = m + 1 0 m + 1 203 / 327 Notation: Multiindizes Um die Taylorentwicklung für Funktionen von mehreren Veränderlichen kompakt schreiben zu können, führen wir die folgenden Abkürzungen ein. P Für α1 , α2 , . . . , αn ∈ N und x = ni=1 x i ei ∈ Rn setzen wir α := (α1 , α2 , . . . , αn ) |α| := α1 + α2 + · · · + αn α! := α1 !α2 ! · · · αn ! x α := (x 1 )α1 (x 2 )α2 · · · (x n )αn ∂ α := ∂1α1 ∂2α2 · · · ∂nαn 204 / 327 Satz (Taylorentwicklung) Sei U ⊂ Rn offen, f : U → R eine (m + 1)-mal stetig differenzierbare Funktion, x ∈ U und ξ ∈ Rn , so dass {x + tξ|t ∈ [0, 1]} ⊂ U. Dann existiert τ ∈ [0, 1], so dass f (x + ξ) = X 1 ∂ α f (x)ξ α + α! |α|≤m X |α|=m+1 1 α ∂ f (x + τ ξ)ξ α . α! Beweis. Wir führen den Satz auf den Fall n = 1 zurück. Dazu betrachten wir die (m + 1)-mal stetig differenzierbare Hilfsfunktion t 7→ g (t) := f (x + tξ). 205 / 327 Lemma Für die partiellen Ableitung der Ordnung k ≤ m + 1 der Funktion g : [0, 1] → R, g (t) = f (x + tξ), gilt g (k) (t) = k! X 1 ∂ α f (x + tξ)ξ α . α! |α|=k Weiter im Beweis des Satzes: Der Satz folgt nun mit Hilfe des Lemmas aus der Taylorentwicklung von g im Nullpunkt: m X 1 1 (k) g (0) + g (m+1) (τ ) f (x + ξ) = g (1) = k! (m + 1)! k=0 X 1 X 1 = ∂ α f (x)ξ α + ∂ α f (x + τ ξ)ξ α . α! α! |α|≤m |α|=m+1 206 / 327 Beweis des Lemmas: Wir beweisen das Lemma durch Induktion nach k. Für k = 0 ist nichts zu zeigen. Wir berechnen g (k+1) (t) aus g (k) (t) = k! X 1 ∂ α f (x + tξ)ξ α . α! |α|=k Mit der Kettenregel erhalten wir: n X d α ∂ f (x + tξ) = ∂i ∂ α f (x + tξ)ξ i dt i=1 und somit g (k+1) (t) = k! n X X 1 ∂i ∂ α f (x + tξ)ξ α ξ i . α! i=1 |α|=k 207 / 327 Weiter im Beweis: Daraus ergibt ich weiter: g (k+1) n X X 1 (t) = k! ∂i ∂ α f (x + tξ)ξ α ξ i α! = k! i=1 |α|=k n X X i=1 |β|=k+1 = (k + 1)! βi β ∂ f (x + tξ)ξ β β! X |β|=k+1 denn Pn i=1 βi = |β| = k + 1. 1 β ∂ f (x + tξ)ξ β , β! 208 / 327 Folgerung Sei U ⊂ Rn offen, f : U → R eine m-mal stetig differenzierbare Funktion und x ∈ U. Dann existiert δ > 0 und ϕ : Bδ (0) → R, so dass Bδ (x) ⊂ U und f (x + ξ) = X 1 ∂ α f (x)ξ α + ϕ(ξ) α! |α|≤m für alle ξ ∈ Bδ (0), wobei ϕ(ξ) = 0. ξ→0 kξkm lim 209 / 327 Beweis (der Folgerung). Da U offen ist, existiert Bδ (x) ⊂ U und aus der Taylorentwicklung der Ordnung m − 1 folgt für ξ ∈ Bδ (0): f (x + ξ) = X |α|≤m−1 X 1 1 α ∂ f (x)ξ α + ∂ α f (x + τ ξ)ξ α , α! α! |α|=m mit τ ∈ [0, 1]. Wir setzen ϕ(ξ) := X 1 (∂ α f (x + τ ξ) − ∂ α f (x))ξ α . α! |α|=m Dann gilt f (x + ξ) = ϕ(ξ)/kξkm limξ→0 f sind stetig. 1 α α |α|≤m α! ∂ f (x)ξ P + ϕ(ξ) und = 0, denn die m-ten partiellen Ableitungen von 210 / 327 Beispiel Sei U ⊂ Rn offen, f : U → R zweimal stetig differenzierbar und x, ξ ∈ Rn derart, dass {x + tξ|t ∈ [0, 1]} ⊂ U. Dann gilt f (x + ξ) = f (x) + n X i=1 n 1 X ∂i ∂j f (x)ξ i ξ j + ϕ(ξ), ∂i f (x)ξ + 2 i i,j=1 wobei limξ→0 ϕ(ξ)/kξk2 = 0. 211 / 327 Definition Die symmetrische Matrix Hess f (x) := (∂i ∂j f (x))i,j=1,2,...,n heißt Hessematrix von f im Punkt x. Nachtrag zum letzen Beispiel: Die obige Gleichung läßt sich nun indexfrei schreiben: 1 f (x + ξ) = f (x) + hgrad f (x), ξi + hHess f (x)ξ, ξi + ϕ(ξ). 2 212 / 327 Definition (i) Eine symmetrische Bilinearform α auf einem reellen VR heißt positiv semi-definit, wenn α(v , v ) ≥ 0 für alle v ∈ V. (ii) α heißt negativ definit (bzw. negativ semi-definit), wenn −α positiv definit (bzw. positiv semi-definit) ist. (iii) α heißt indefinit, wenn α weder positiv noch negativ semi-definit ist. (iv) Ein symmetrischer Endomorphismus A eines Euklidischen VR heißt positiv definit (bzw. positiv semi-definit, indefinit etc. ) , wenn die zugehörige symmetrische Bilinearform α(v , w ) = hv , Aw i, v, w ∈ V , positiv definit (bzw. positiv semi-definit, indefinit etc. ) ist. 213 / 327 Satz Sei U ⊂ Rn offen, f : U → R zweimal stetig differenzierbar. (i) Wenn f an der Stelle x ∈ U ein lokales Minimum (bzw. Maximum) hat, dann ist grad f (x) = 0 und Hess f (x) ist positiv (bzw. negativ) semi-definit. (ii) Wenn der Gradient von f an der Stelle x ∈ U verschwindet und Hess f (x) positiv (bzw. negativ) definit ist, dann hat f in x ein isoliertes lokales Minimum (bzw. Maximum). 214 / 327 Beweis. (i) f habe in x z.B. ein lokales Minimum. Wir wissen bereits, dass grad f (x) = 0 und mit h(ξ) := 21 hHess f (x)ξ, ξi gilt f (x) ≤ f (x + ξ) = f (x) + h(ξ) + ϕ(ξ). Daraus folgt h(ξ) ≥ −ϕ(ξ) und somit mit t ∈ R∗ : h(ξ) ξ h(tξ) ϕ(tξ) t→0 = −→ 0. h = ≥− 2 2 kξk kξk ktξk ktξk2 Das impliziert h(y ) ≥ 0 für alle Einheitsvektoren y , d.h. h ≥ 0. (ii) Sei nun umgekehrt grad f (x) = 0 und h(ξ) > 0 für alle ξ 6= 0. Dann ist m = minky k=1 h(y ) > 0 und es gibt zu 0 < < m ein δ > 0, so dass |ϕ(ξ)| < kξk2 für alle 0 6= ξ ∈ Bδ (0). Aus der Taylorentwicklung folgt dann f (x + ξ) = f (x) + h(ξ) + ϕ(ξ) > f (x) + mkξk2 − kξk2 > f (x). 215 / 327 Satz (Umkehrsatz) Sei U ⊂ Rn offen, f : U → Rn stetig differenzierbar und p ∈ U. Wenn dfp ∈ L(Rn , Rn ) invertierbar ist, so existieren offene Umgebungen V ⊂ U von p und W von q := f (p), so dass f |V : V → W bijektiv ist und (f |V )−1 : W → V stetig differenzierbar ist. Beweis. Wir können o.B.d.A. annehmen, dass p = q = 0 und dfp = Id. Die Abbildung U 3 x 7→ ϕ(x) := f (x) − x ∈ Rn ist stetig differenzierbar mit ϕ(0) = 0 und dϕ0 = 0. Also existiert δ > 0, so dass B δ (0) ⊂ U und kdϕx k ≤ 1 2 für alle x ∈ B δ (0). 216 / 327 Weiter im Beweis: Nach dem MWS gilt dann für alle x, x 0 ∈ B δ (0): 1 (∗) kϕ(x) − ϕ(x 0 )k ≤ kx − x 0 k 2 und somit (wg. f (x) = x + ϕ(x)) (∗∗) 1 kf (x) − f (x 0 )k ≥ kx − x 0 k − kϕ(x) − ϕ(x 0 )k ≥ kx − x 0 k. 2 Das beweist die Injektivität von f auf B δ (0). Als Nächstes zeigen wir, dass f (B δ (0)) ⊃ B δ/2 (0). Sei b ∈ B δ/2 (0). Gesucht ist a ∈ B δ (0) mit f (a) = b, d.h. a = b − ϕ(a). Wir definieren rekursiv x0 := 0, xk := b − ϕ(xk−1 ), k ∈ N. Das definiert eine Folge in B δ (0), denn aus xk−1 ∈ B δ (0) folgt wg. (*) ϕ(xk−1 ) ∈ B δ/2 (0) und somit xk ∈ B δ (0). 217 / 327 Weiter im Beweis: Aus (*) folgt desweiteren, dass (xk ) eine Cauchy-Folge ist: 1 kxk+m − xk k = kϕ(xk+m−1 ) − ϕ(xk−1 )k ≤ kxk+m−1 − xk−1 k 2 δ 1 ≤ · · · ≤ k kxm − x0 k ≤ k . 2 2 Grenzübergang in der Rekursionsformel xk = b − ϕ(xk−1 ) liefert für a = limk→∞ xk ∈ B δ (0): a = b − ϕ(a), d.h. f (a) = b. Das Argument zeigt, dass f (x) ein innerer Punkt von f (U) ist, wenn x ∈ U und dfx invertierbar ist. Insbesondere ist f (V ) offen, wenn V ⊂ U offen ist und dfx für alle x ∈ V invertierbar ist. 218 / 327 Weiter im Beweis: Da f stetig differenzierbar ist und df0 invertierbar ist, existiert eine offene Umgebung V ⊂ Bδ (0) von 0, so dass dfx für alle x ∈ V invertierbar ist. Die Bildmenge W := f (V ) ⊂ Rn ist dann offen und f |V : V → W ist stetig und bijektiv. g := (f |V )−1 : W → V ist stetig, denn f |V bildet offene Menge in offene Mengen ab. Wir zeigen, dass g in jedem Punkt q ∈ W differenzierbar ist. Sei wieder o.B.d.A. q = f (0) = 0, df0 = Id und δ > 0 wie oben, so dass B δ/2 (0) ⊂ f (B δ (0)) ⊂ W . Wir setzen ψ(y ) := g (y ) − y , y ∈ W . 219 / 327 Weiter im Beweis: Für y ∈ B δ/2 (0) ⊂ f (B δ (0)) gilt mit x = g (y ), y = f (x): 1 ky k = kf (x)k ≥ kxk, 2 siehe (∗∗). Also folgt aus y → 0 auch x = g (y ) → 0. Somit gilt mit 0 6= y → 0: kg (y ) − y k kx − f (x)k kϕ(x)k kϕ(x)k kψ(y )k = = = ≤2 → 0. ky k ky k ky k ky k kxk Das beweist die Differenzierbarkeit von g . Aus der Differenzierbarkeit von f , g folgt mit der Kettenregel dgf (x) dfx = Id für alle x ∈ V. Also ist dgy = dfg−1 (y ) für alle y ∈ W . Die Abbildung x 7→ dfx−1 ist stetig, denn f ist stetig differenzierbar und GL(n) 3 A 7→ A−1 ∈ GL(n) ist stetig (sogar rational). 220 / 327 Weiter im Beweis: Aus der Stetigkeit von x 7→ dfx−1 und g folgt nun die Stetigkeit von y 7→ dgy = dfg−1 (y ) . Das beweist die stetige Differenzierbarkeit von g = (f |V )−1 . Bemerkung: g ist sogar k-mal stetig differenzierbar, wenn f k-mal stetig differenzierbar ist (k ∈ N). Die Gleichung dgy = dfg−1 (y ) zeigt nämlich, dass g k-mal stetig differenzierbar ist, wenn f k-mal und g (k − 1)-mal stetig differenzierbar ist. 221 / 327 Beispiel (ebene Polarkoordinaten) Die Abbildung 2 2 f :R →R , r ϕ 7→ x y = r cos ϕ r sin ϕ , ist unendlich oft differenzierbar. Ihr Differenzial ist df = ∂x ∂r ∂y ∂r ∂x ∂ϕ ∂y ∂ϕ ! = cos ϕ −r sin ϕ sin ϕ r cos ϕ Da det df = r , gibt es zu jedem Punkt p = (r0 , ϕ0 ) ∈ R∗ × R eine offene Umgebung U ⊂ R∗ × R, so dass f U bijektiv auf eine offene Menge V = f (U) ⊂ R2 abbildet mit unendlich oft differenzierbarer Umkehrabbildung (f |U )−1 : V → U. Z.B. U = R+ × (ϕ0 − π, ϕ0 + π) (→ Zeichnung). 222 / 327 Satz (Satz über implizite Funktionen) Sei U ⊂ Rm × Rn offen, f : U → Rn k-mal stetig differenzierbar (k ≥ 1) und (a, b) ∈ U, so dass f (a, b) = 0. Das Differenzial der Abbildung y → f (a, y ) sei im Punkt y = b invertierbar. Dann gibt es offene Umgebungen V ⊂ Rm von a und W ⊂ Rn von b mit V × W ⊂ U und eine k-mal stetig differenzierbare Abbildung g : V → W , so dass für alle (x, y ) ∈ V × W : f (x, y ) = 0 ⇐⇒ y = g (x). Beweis. Wir betrachten F : U → Rm × Rn , F (x, y ) := (x, f (x, y )). Das Differenzial von F berechnet sich wie folgt aus dem Differenzial dx f der Abbildung x 7→ f (x, y ) und dem Differenzial dy f der Abbildung y 7→ f (x, y ). 223 / 327 Weiter im Beweis: dF = 1m dx f 0 dy f Da dy f im Punkt (a, b) invertierbar ist, ist auch dF im Punkt (a, b) invertierbar. Nach dem Umkehrsatz gibt es offene Umgebungen V1 ⊂ Rm von a und V2 ⊂ Rn von b, so dass V1 × V2 ⊂ U ⊂ Rm × Rn durch F bijektiv auf eine offene Umgebung Ω ⊂ Rm × Rn von F (a, b) = (a, f (a, b)) = (a, 0) abgebildet wird, und zwar so, dass die Umkehrabbildung G = (G1 , G2 ) : Ω → V1 × V2 k-mal stetig differenzierbar ist. 224 / 327 Weiter im Beweis: Aus Ω 3 (x, y ) = F (G (x, y )) = (G1 (x, y ), f (G1 (x, y ), G2 (x, y ))) folgt G1 (x, y ) = x und f (x, G2 (x, y )) = y . Insbesondere gilt mit g (x) := G2 (x, 0) für alle (x, 0) ∈ Ω: f (x, g (x)) = 0. V := {x ∈ V1 |(x, 0) ∈ Ω} ist eine offene Umg. V ⊂ V1 von a. Wir setzen W := V2 . Aus g (V ) = G2 (V × {0}) ⊂ V2 = W folgt g : V → W . Umgekehrt folgt aus (x, y ) ∈ V × W und f (x, y ) = 0: F (x, y ) = (x, f (x, y )) = (x, 0) und somit (x, y ) = G (F (x, y )) = G (x, 0) = (G1 (x, 0), G2 (x, 0)) = (x, g (x)), d.h. y = g (x). 225 / 327 Beispiel (zweischaliges Hyperboloid) Die Funktion f : R3 = R2 × R → R, f (x, y , z) := x 2 + y 2 − z 2 + 1, erfüllt ∂f ∂z = −2z 6= 0 für alle (x, y , z) ∈ H := f −1 (0). Nach dem Satz über implizite Funktionen definiert die Gleichung f (x, y , z) = 0 also lokal eine unendlich oft differenzierbare Funktion (x, y ) 7→ z = g (x, y ). Diese kann man durch Auflösen der Gleichung f (x, y , z) = 0 nach z berechnen: p g± (x, y ) = ± x 2 + y 2 + 1. Der Graph von g+ : R2 → R (bzw. g− ) ist die obere (bzw. untere) Schale des Hyperboloids H. 226 / 327 Bemerkung Unter den Voraussetzungen des Satzes über implizite Funktionen läßt sich das Differenzial der durch die Gleichung f (x, y ) = 0 implizit definierten Abbildung x 7→ g (x) wie folgt berechnen. Ableiten der Gleichung f (x, g (x)) = 0 liefert nach der Kettenregel: 0 = dx f + dy fdg =⇒ dg = −(dy f )−1 dx f , Hierbei ist dg an der Stelle x und dx f , dy f an der Stelle (x, g (x)) auszuwerten: −1 dg |x = − dy f |(x,g (x)) dx f |(x,g (x)) . 227 / 327 Definition (Rang einer differenzierbaren Abbildung) U ⊂ Rm sei offen und f : U → Rn differenzierbar. (i) Der Rang von f im Punkt p ∈ U ist definiert als rg(f )p := rg dfp ≤ min{m, n}. Das definiert eine Funktion rg(f ) : U → {0, 1, 2, . . . , min{m, n}}. (ii) f heißt Immersion, wenn rg(f ) = m. (iii) f heißt Submersion, wenn rg(f ) = n. (iv) k-mal stetig differenzierbare Abbildungen heißen auch von der Klasse C k oder C k -Abbildungen, k ∈ N ∪ {∞}. (v) U ⊂ Rm , V ⊂ Rn seien offen. Eine C k -Abbildung f : U → V heißt C k -Diffeomorphismus, wenn f bijektiv ist und f −1 von der Klasse C k ist. 228 / 327 Beispiele (i) Sei m ≤ n. Rm 3 (x 1 , . . . , x m ) 7→ (x 1 , . . . , x m , 0, . . . , 0) ∈ Rm ×Rn−m = Rn ist eine Immersion. (ii) Sei m ≥ n. Rm 3 (x 1 , . . . , x m ) 7→ (x 1 , . . . , x n ) ∈ Rn ist eine Submersion. (iii) Sei r ≤ min{m, n}. Rm 3 (x 1 , . . . , x m ) 7→ (x 1 , . . . , x r , 0, . . . , 0) ∈ Rr × Rn−r = Rn hat konstanten Rang r . 229 / 327 Beispiele (iv) Der Rang eines Diffeomorphismus f : U → V (U ⊂ Rm , V ⊂ Rn offen) ist konstant gleich m = n. Durch Ableiten der Gleichungen f −1 ◦ f = Id U und f ◦ f −1 = Id V folgt nämlich, dass dfp für alle p ∈ U invertierbar ist, d.h. m = n = rg (f ). Umgekehrt besagt der Umkehrsatz, dass jede C k -Abbildung f : U → V vom Rang n zwischen offenen Mengen des Rn lokal ein C k -Diffeomorphismus ist. 230 / 327 Satz (Immersionen) Sei U ⊂ Rm offen, p ∈ U und f : U → Rn eine C k -Abbildung mit rg(f )p = m. Dann existiert eine offene Umgebung V von f (p) und ein C k -Diffeomorphismus ϕ : V → ϕ(V ) ⊂ Rn , so dass (ϕ ◦ f )(x 1 , . . . , x m ) = (x 1 , . . . , x m , 0, . . . , 0) in einer Umg. von p. Beweis. Nach eventueller Umnummerierung der Koordinaten im Rn können wir annehmen, dass die ersten m Zeilen der (n × m)-Matrix dfp linear unabhängig sind. 231 / 327 Weiter im Beweis: Betrachte F : U × Rn−m → Rn , F (x, y ) = f (x) + (0, y ). F ist von der Klasse C k und dF(p,y ) = dfp 0 1n−m . Da insbesondere dF(p,0) invertierbar ist, existiert nach dem Umkehrsatz eine offene Umgebung W von (p, 0) ∈ Rn , so dass F |W : W → F (W ) ein Diffeomorphismus auf eine offene Umg. V = F (W ) von F (p, 0) = f (p) ist. Der Diffeomorphismus ϕ := (F |W )−1 : V → W erfüllt dann, wie gewünscht, (x, 0) = ϕ(F (x, 0)) = ϕ(f (x)). 232 / 327 Satz (Submersionen) Sei U ⊂ Rm offen, p ∈ U und f : U → Rn eine C k -Abbildung mit rg(f )p = n. Dann existiert eine offene Umgebung V ⊂ U von p und ein C k -Diffeomorphismus ϕ : V → ϕ(V ) ⊂ Rm , so dass (f ◦ ϕ−1 )(x 1 , . . . , x m ) = (x 1 , . . . , x n ) auf ϕ(V ). Beweis. Nach eventueller Umnummerierung der Koordinaten im Rm können wir annehmen, dass die ersten n Spalten der (n × m)-Matrix dfp linear unabhängig sind. 233 / 327 Weiter im Beweis: Betrachte F : U → Rm , F (x 0 , x 00 ) = (f (x 0 , x 00 ), x 00 ), wobei (x 0 , x 00 ) ∈ U ⊂ Rn × Rm−n , x 0 = (x 1 , . . . , x n ), x 00 = (x n+1 , . . . , x m ). F ist von der Klasse C k und dFp = dfp 0 1m−n . Da dFp invertierbar ist, existiert nach dem Umkehrsatz eine offene Umgebung V ⊂ U von p ∈ Rm , so dass ϕ := F |V : V → F (V ) ein Diffeomorphismus ist. ϕ erfüllt dann für alle (x 0 , x 00 ) ∈ ϕ(V ): (x 0 , x 00 ) = F (ϕ−1 (x 0 , x 00 )) und somit, wie gewünscht, f (ϕ−1 (x 0 , x 00 )) = x 0 . 234 / 327 Satz (Allgemeine Abbildungen von konstantem Rang) Sei U ⊂ Rm offen, p ∈ U und f : U → Rn eine C k -Abbildung mit rg(f ) = r auf U. Dann existieren offene Umgebungen V ⊂ U von p und W ⊂ Rn von f (p) und C k -Diffeomorphismen ϕ : V → ϕ(V ) ⊂ Rm , ψ : W → ψ(W ) ⊂ Rn , so dass (ψ ◦ f ◦ ϕ−1 )(x 1 , . . . , x m ) = (x 1 , . . . , x r , 0, . . . , 0) auf ϕ(V ). Beweis. Nach eventueller Umnummerierung der Koordinaten im Rm und Rn können wir annehmen, dass die Matrix i ∂f (p) invertierbar ist. A= ∂x j i,j=1,...,r 235 / 327 Weiter im Beweis: Betrachte F (x) = (f 1 (x), . . . , f r (x), x r +1 , . . . , x m ). Da A ∗ dFp = 0 1m−r invertierbar ist, existiert eine offene Umgebung V ⊂ U von p, so dass ϕ := F |V : V → ϕ(V ) ein Diffeomorphismus ist. Aus F ◦ ϕ−1 (x) = x folgt dann f i (ϕ−1 (x)) = x i für alle i ≤ r und x ∈ ϕ(V ). Wir können also o.B.d.A. annehmen, dass f i (x) = x i für alle i ≤ r . Somit ist dfp = 1r ∗ 0 B , B= ∂f i ∂x j . i,j≥r +1 und aus rg(f ) = r folgt nun B = 0, d.h. f hängt nur von (x 1 , . . . , x r ) ab. 236 / 327 Weiter im Beweis: Wir haben gezeigt, dass f von der Form f (x) = (x 0 , f 00 (x 0 )) ist, wobei x 0 = (x 1 , . . . , x r ) und f 00 = (f r +1 , . . . , f n ). Sei nun U 0 ⊂ Rr die Projektion von U ⊂ Rr × Rm−r . W := U 0 × Rn−r ist eine offene Umgebung von f (p) = (p 0 , f 00 (p 0 )), wobei p 0 ∈ Rr die Projektion von p = (p 0 , p 00 ) ∈ U ⊂ Rr × Rm−r ist. Es genügt nun folgenden Diffeomorphismus ψ : W → ψ(W ) ⊂ Rn zu verwenden: ψ(x) = (x 0 , x 00 − f 00 (x 0 )), x = (x 0 , x 00 ) ∈ W = U 0 × Rn−r . In der Tat gilt, wie gewünscht, ψ(f (x)) = ψ(x 0 , f 00 (x 0 )) = (x 0 , f 00 (x 0 ) − f 00 (x 0 )) = (x 0 , 0). 237 / 327 Beispiel Die Abbildung f : Mat(n, R) → Mat(n, R), A 7→ f (A) = At A, hat auf der offenen Teilmenge GL(n) ⊂ Mat(n, R) konstanten Rang , wie im Folgenden gezeigt wird. r = n(n+1) 2 Wir können f als Abbildung f : Mat(n, R) → Sym(n, R) in den Unterraum Sym(n, R) ⊂ Mat(n, R) der symmetrischen Matrizen auffassen. Das Differenzial dfA : B 7→ B t A + At B, Mat(n, R) → Sym(n, R), ist für A ∈ GL(n) surjektiv: Sei C ∈ Sym(n, R). dfA bildet B = 12 (A−1 )t C auf 12 (C t + C ) = C ab. Daraus folgt rg(f )A = dim Sym(n, R) = 1 + 2 + · · · + n = n(n+1) . 2 238 / 327 Bemerkung Sei Y ⊂ X eine Teilmenge eines topologischen Raumes (X , O). Das Teilmengensystem OY := {U ∩ Y |U ∈ O} ist eine Topologie auf Y , die sogenannte induzierte Topologie. Jede Teilmenge eines topologischen Raumes ist somit in kanonischer Weise wieder ein topologischer Raum. Beispiel Die obere Halbsphäre {(x, y , z) ∈ S1 (0)|z > 0} ist eine offene Teilmenge der zweidimensionalen Einheitssphäre S 2 = S1 (0) = {(x, y , z) ∈ R3 |x 2 + y 2 + z 2 = 1}. 239 / 327 Definition Eine bijektive stetige Abbildung f : X → Y zwischen topologischen Räumen X und Y heißt Homöomorphismus, wenn f −1 : Y → X stetig ist Beispiel Die Abbildung f : [0, 2π) → S 1 = {z ∈ C||z| = 1}, f (ϕ) = e iϕ , ist stetig und bijektiv, aber kein Homöomorphismus. (zn = f (2π − n1 ) ∈ S 1 konvergergiert gegen 1 aber f −1 (zn ) = 2π − n1 ∈ [0, 2π) konvergiert nicht gegen f −1 (1) = 0.) Die Einschränkung von f auf das offene Intervall (0, 2π) definiert jedoch einen Homöomorphismus von (0, 2π) auf die offene Teilmenge S 1 \ {1} der Einheitskreislinie S 1 . 240 / 327 Definition (Untermannigfaltigkeiten) Eine Teilmenge M ⊂ Rn heißt m-dimensionale C k -Untermannigfaltigkeit, wenn es zu jedem p ∈ M offene Teilmengen U ⊂ Rm , p ∈ V ⊂ Rn gibt und eine C k -Immersion F : U → Rn , die U homöomorph auf F (U) = V ∩ M abbildet. F heißt lokale Parametrisierung von M. Zweidimensionale Untermannigfaltigkeit heißen Flächen. (m − 1)-dimensionale Untermannigfaltigkeiten von Rm heißen Hyperflächen. 241 / 327 Beispiel Sei U ⊂ Rm offen und f : U → Rr eine C k -Abbildung. Dann ist der Graph von f Γf = {(x, y ) ∈ U × Rr |y = f (x)} eine m-dimensionale C k -Untermf. von Rn , wobei n = m + r . Die C k -Immersion F : U → Rn , F (x) = (x, f (x)), bildet U homöomorph auf F (U) = Γf ab. 242 / 327 Beispiel Die Sphäre S 2 ist eine C ∞ -Fläche. Sie besitzt nämlich eine Überdeckung durch 6 Halbsphären Hi± := {x = (x 1 , x 2 , x 3 ) ∈ S 2 | ± x i > 0} und jede der Halbsphären ist ein Graph. Z.B. ist 2 H1+ = {(f p(u), u)|u ∈ U} mit f : U = {u ∈ R |kuk < 1} → R, f (u) = 1 − kuk2 . 243 / 327 Satz Sei U ⊂ Rm offen und f : U → Rn eine C k -Abbildung von konstantem Rang r und q ∈ f (U). Dann ist M = f −1 (q) ⊂ U eine C k -Untermf. der Dimension m − r . Beweis. Sei p = (p 1 , . . . , p m ) ∈ M. Wg. der Normalform von Abbildungen von konstantem Rang, können wir annehmen, dass f : (x 1 , . . . , x m ) 7→ (x 1 , . . . , x r , 0, . . . , 0) auf einer offenen Umg. V = V1 × V2 ⊂ U ⊂ Rr × Rm−r von p. Dann ist aber V2 3 y 7→ (p 1 , . . . , p r , y ) ∈ V = V1 × V2 eine Immersion, die V2 homöomorph auf M ∩ V abbildet. 244 / 327 Beispiele (i) Die Abbildung f : GL(n) → Sym(n, R), A 7→ At A, hat überall den Rang n(n + 1)/2. Somit ist O(n) = f −1 (1n ) ⊂ Mat(n, R) eine (kompakte) C ∞ -Untermf. der Dimension n(n − 1)/2. (ii) Zeigen Sie auf ähnliche Weise, dass U(n) ⊂ Mat(n, C) eine kompakte C ∞ -Untermf. der Dimension n2 ist. (iii) Sei p ∈ Rn+1 . Die Abbildung f : Rn+1 → R, f (x) = kx − pk2 , definiert eine Submersion von Rn+1 \ {p} auf R+ . Die n-dimensionalen Sphären Sr (p) = f −1 (r ) ⊂ Rn (r > 0) sind also C ∞ -Hyperflächen. 245 / 327 Satz Eine Teilmenge M ⊂ Rn ist genau dann eine m-dimensionale C k -Untermf., wenn es zu jedem p ∈ M eine Umg. V ⊂ Rn gibt und eine C k -Submersion f : V → Rr (r = n − m), so dass M ∩ V = f −1 (0). Beweis. “=⇒” Sei F : U → V ⊂ Rn eine lokale Parametrisierung, wobei U ⊂ Rm und p ∈ F (U) = M ∩ V . Wg. der Normalform von Immersionen können wir annehmen, dass F : (x 1 , . . . , x m ) 7→ (x 1 , . . . , x m , 0, . . . , 0). f : V → Rr , f (x 1 , . . . , x n ) = (x m+1 , . . . , x n ), ist dann die gesuchte Submersion. Die Umkehrung haben wir schon gezeigt. 246 / 327 Definition (Tangentialvektoren) Sei M ⊂ Rn eine C 1 -Untermf. und p ∈ M. Ein Vektor v ∈ Rn heißt Tangentialvektor an M in p, wenn es eine C 1 -Kurve c : (−, ) → M ⊂ Rn gibt mit v = c 0 (0) ( > 0). Sei Tp M die Menge aller Tangentialvektoren an M in p. 247 / 327 Satz (Tangentialraum) (i) Tp M ist ein Vektorraum der Dimension m = dim M. (ii) Sei F : U → V eine lok. Parametrisierung von M, u ∈ U mit p = F (u). Dann bilden die Vektoren ∂1 F (u), . . . , ∂m F (u) eine Basis von Tp M. (iii) Sei V eine offene Umg. von p und f = (f 1 , . . . , f r ) : V → Rr (r = m − n) eine C 1 -Submersion, so dass M ∩ V = f −1 (q), wobei q = f (p). Dann ist Tp M = Kern(dfp ) = ∩rj=1 (grad f j (p))⊥ . (iv) Insbesondere gilt Tp M ⊥ = span{grad f 1 (p), . . . , grad f r (p)}. 248 / 327 Beweis. Da m + r = n, genügt es zu zeigen, dass (∗) span{∂1 F (u), . . . , ∂m F (u)} ⊂ Tp M und grad f j (p) ⊥ Tp M für alle j = 1, . . . , r . P i m Sei v = m i=1 v ei ∈ R . Dann definiert c(t) := F (u + tv ) eine 1 C -Kurve (−, ) → F (U) ⊂ M mit 0 c (0) = dFp v = m X v i ∂i F (u). i=1 Das beweist (*). Für jede C 1 -Kurve c : (−, ) → = p gilt F (U) ⊂ M mit c(0) d 0 f (c(t)) = q und somit 0 = dt t=0 f (c(t)) = dfp c (0). Das zeigt Tp M ⊂ Kern(dfp ) = ∩rj=1 (grad f j (p))⊥ . 249 / 327 Satz (Extrema mit Nebenbedingungen) Sei M ⊂ Rn eine Untermf., U ⊂ Rn offen und f : U → R im Punkt p ∈ M ∩ U differenzierbar (i) Wenn F = f |U∩M im Punkt p ein lokales Extremum annimmt, so ist (∗) Tp M ⊂ Kern dfp = (grad f (p))⊥ . (ii) (*) gilt genau dann, wenn es Konstanten λ1 , . . . , λr ∈ R (sogenannte Lagrangemultiplikatoren) gibt mit grad f (p) = r X λj grad hj (p), j=1 wobei r = m − n und h = (h1 , . . . , hr ) : U → Rr eine C 1 -Submersion ist, so dass M ∩ U = h−1 (0). 250 / 327 Beweis. Sei c : (−, ) → M ∩ U ⊂ Rn eine C 1 -Kurve mit c(0) = p. f ◦ c : (−, ) → R hat ein lokales Extremum in 0 und somit d 0= f (c(t)) = dfp c 0 (0) = hgrad f (p), c 0 (0)i. dt t=0 Das beweist (i) und (ii) folgt nun aus Tp M ⊥ = span{grad h1 (p), . . . , grad hr (p)}. 251 / 327 Beispiel Wir beweisen (die bereits bekannte Tatsache), dass jeder symm. Endomorphismus A eines endlichdim. Euklidischen Vektorraums V einen Eigenvektor hat. Da die Einheitssphäre S = S1 (0) ⊂ V kompakt ist, nimmt die stetige Fkt. (genauer quadratische Form) x 7→ q(x) := hx, Axi in einem Punkt p ∈ S ihr Minimum an. Nach dem vorigen Satz gilt also grad q(p) = 2Ap ∈ (Tp S)⊥ = Rp, d.h. p ist ein Eigenvektor von A. 252 / 327 Gewöhnliche Differenzialgleichungen Sei Ω ⊂ R2 und f : Ω → R eine stetige Funktion. Wir betrachten die Differenzialgleichung erster Ordnung (∗) y 0 = f (x, y ). Unter einer Lösung der DGL (∗) versteht man eine auf einem (nicht entarteten) Intervall I ⊂ R differenzierbare Funktion ϕ : I → R, so dass (i) der Graph Γϕ ⊂ Ω und (ii) ϕ0 (x) = f (x, ϕ(x)) für alle x ∈ I . Geometrische Interpretation: f definiert eine Verteilung von Geraden Ω 3 p 7→ L(p), wobei L(p) die Gerade durch p mit Steigung f (p) ist. Die Bedingung (ii) ist gleichbedeutend mit: Für alle p ∈ Γϕ ist L(p) die Tangente an Γϕ im Punkt p. 253 / 327 Seien I , J ⊂ R offene Intervalle und f : I → R, g : J → R \ {0} stetige Funktionen. Wir betrachten auf Ω = I × J ⊂ R2 die DGL (∗) y 0 = f (x)g (y ). Sei (x0 , y0 ) ∈ Ω. Wir definieren F : I → R, G : J → R durch: Z x Z y du F (x) := f (t)dt, G (y ) := . x0 y0 g (u) Die Funktion G : J → G (J) ist streng monoton, denn G 0 (y ) = g (y )−1 6= 0. Satz (Differenzialgleichungen mit getrennten Variablen) Sei I0 ⊂ F −1 (G (J)) ein Intervall, so dass x0 ∈ I0 . Dann ist G −1 ◦ F |I0 : I0 → R die eindeutig bestimmte Lsg. ϕ : I0 → R von (∗) mit der Anfangsbedingung ϕ(x0 ) = y0 . 254 / 327 Beweis. Sei ϕ : I0 → R eine Lsg. von (∗) mit ϕ(x0 ) = y0 . Aus ϕ0 (t) = f (t)g (ϕ(t)), t ∈ I0 , folgt mit Hilfe der Substitution u = ϕ(t): Z ϕ(x) G (ϕ(x)) = y0 du = g (u) Z x x0 ϕ0 (t)dt = g (ϕ(t)) Z x f (t)dt = F (x). x0 Also gilt ϕ(x) = G −1 (F (x)). Das beweist die Eindeutigkeit. Wir müssen noch überprüfen, dass ϕ := G −1 ◦ F |I0 : I0 → R tatsächlich eine Lsg. von (∗) mit ϕ(x0 ) = y0 ist. Es gilt G −1 (F (x0 )) = G −1 (0) = y0 und für alle x ∈ I0 : (G −1 ◦ F )0 (x) = 1 G 0 (G −1 (F (x))) F 0 (x) = g (ϕ(x))f (x). 255 / 327 Beispiel Sei −∞ ≤ a < b ≤ ∞ und v : (a, b) → R, x 7→ v (x), ein stetiges nirgends verschwindendes Vektorfeld auf (a, b). Gesucht ist eine Parametrisierung ϕ : (c, d) → (a, b) mit ϕ0 (t) = v (ϕ(t)) für alle t ∈ (c, d) und ϕ(t0 ) = x0 , wobei −∞ ≤ c < t0 = 0 < d ≤ ∞ und x0 ∈ (a, b). Die Methode der getrennten Variablen führt auf den C 1 -Diffeomorphismus Z x du −1 ϕ := ψ , ψ : (a, b) → (c, d), ψ(x) := , x0 v (u) wobei c = inf ψ und d = sup ψ. ÜA: Sei c : (a, b) → Rn eine C 1 -Kurve mit c 0 (t) 6= 0 für alle t ∈ (a, b). Zeigen Sie, dass ein C 1 -Diffeo. ϕ : (c, d) → (a, b) existiert, so dass die Geschwindigkeit von c̃ = c ◦ ϕ ein Einheitsvektorfeld ist. 256 / 327 Definition (Systeme von gewöhnliche Differenzialgleichungen) Sei Ω ⊂ R × Rn und f : Ω → Rn stetig. (∗) y 0 = f (x, y ) ist ein System von n gewöhnlichen DGLn erster Ordnung. Unter einer Lösung versteht man eine diffb. Kurve ϕ : I → Rn , so dass (i) der Graph Γϕ ⊂ Ω und (ii) ϕ0 (x) = f (x, ϕ(x)) für alle x ∈ I . Geometrische Interpretation: Sei L(p) die Gerade durch p ∈ Ω mit Richtungsvektor (1, f (p)) ∈ R × Rn . (ii) ⇐⇒ Für alle p ∈ Γϕ ist L(p) die Tangente an Γϕ im Punkt p. 257 / 327 Beispiel 1) Sei U ⊂ Rn und v : U → Rn , x 7→ v (x), ein stetiges Vektorfeld. Gesucht ist eine Kurve c : I → U mit c 0 (t) = v (c(t)) für alle t ∈ I, d.h. eine Lsg. des Systems DGLn 1. Ordnung. dx dt = v (x) von n gewöhnlichen 2) Sei Ω ⊂ R2 , f : Ω → R und v = (1, f ) : Ω → R2 . Die gew. DGL 1. Ordnung y 0 = f (x, y ) ist äquivalent zu folgendem System d (x, y ) = v (x, y ) = (1, f (x, y )). dt 258 / 327 Definition Sei Ω ⊂ Rm × Rn und f : Ω → Rk , (x, y ) 7→ f (x, y ). f heißt auf Ω bez. y Lipschitzstetig mit der Lipschitzkonstanten L ≥ 0, wenn (∗) kf (x, y1 ) − f (x, y2 )k ≤ Lky1 − y2 k für alle (x, y1 ), (x, y2 ) ∈ Ω. f heißt auf Ω bez. y lokal Lipschitzstetig, wenn es zu jedem p ∈ Ω eine Umgebung U von p gibt, so dass (∗) für alle (x, y1 ), (x, y2 ) ∈ U ∩ Ω mit einer von U abhängigen Konstanten L. 259 / 327 Satz (Lipschitzbedingung) Sei Ω ⊂ Rm × Rn offen und f : Ω → Rk , (x, y ) 7→ f (x, y ), von der Klasse C 1 . Dann ist f auf Ω bez. y lokal Lipschitzstetig. Beweis. Sei U ⊂ Ω eine kompakte Umg. von p ∈ Ω. Da f stetig diffb. ist, existiert L ≥ 0 mit kdy f k ≤ L auf U. Aus dem MWS folgt dann für alle (x, y1 ), (x, y2 ) ∈ U: kf (x, y1 ) − f (x, y2 )k ≤ Lky1 − y2 k. 260 / 327 Satz (Eindeutigkeitssatz) Sei Ω ⊂ R × Rn , f : Ω → Rn stetig und bez. y lokal Lipschitzstetig. Seien ϕ, ψ : I → Rn zwei Lösungen von y 0 = f (x, y ) mit ϕ(x0 ) = ψ(x0 ) =: y0 für ein x0 ∈ I . Dann gilt ϕ = ψ. Beweis. Sei U ⊂ R × Rn eine Umgebung von (x0 , y0 ), so dass f auf U Lipschitzstetig mit der Lipschitzkonstanten L > 0 ist. Desweiteren sei > 0 so klein, dass (t, ϕ(t)), (t, ψ(t)) ∈ U für alle t ∈ B (x0 ) ∩ I . 261 / 327 Weiter im Beweis: Für alle x ∈ I gilt Z x ϕ(x) − ψ(x) = ϕ0 (t) − ψ 0 (t) dt. x0 Für alle t ∈ B (x0 ) ∩ I gilt: kϕ0 (t) − ψ 0 (t)k = kf (t, ϕ(t)) − f (t, ψ(t))k ≤ Lkϕ(t) − ψ(t)k. Daraus folgt für alle x ∈ B (x0 ) ∩ I : kϕ(x) − ψ(x)k ≤ L sup kϕ − ψk. B (x0 )∩I Für < 1 L folgt daraus ϕ(x) = ψ(x) für alle x ∈ B (x0 ) ∩ I . 262 / 327 Weiter im Beweis: Aus dem Bisherigen folgt: (∗) Wenn x1 ∈ I und ϕ(x1 ) = ψ(x1 ), so existiert > 0, so dass ϕ(x) = ψ(x) für alle x ∈ B (x1 ) ∩ I . Sei nun b = sup{x1 ∈ I |ϕ(x) = ψ(x) für alle x ∈ [x0 , x1 )}. Es genügt zu zeigen, dass b = sup I . Wir nehmen an, dass b < sup I . Aus der Stetigkeit von ϕ, ψ folgt ϕ(b) = ψ(b) und somit wg. (∗), dass ϕ(x) = ψ(x) für alle x ∈ B (b) ∩ I . Das steht im Widerspruch zur Definition von b. 263 / 327 Satz (Existenzsatz) Sei Ω ⊂ R × Rn offen, f : Ω → Rn stetig und bez. y lokal Lipschitzstetig. Dann existiert zu jedem (x0 , y0 ) ∈ Ω ein > 0 und eine Lösung ϕ : (x0 − , x0 + ) → Rn von (∗) y 0 = f (x, y ), y (x0 ) = y0 . Beweis. Der Beweis, der auf Picard und Lindelöf zurückgeht, benutzt das folgende Iterationsverfahren, das wir auch schon beim Beweis des Umkehrsatzes verwendet haben. 264 / 327 Satz (Banachscher Fixpunktsatz) Sei (X , d) ein vollständiger metrischer Raum und F : X → X eine Kontraktion, d.h. es existiert 0 ≤ θ < 1, so dass d(F (p), F (q)) ≤ θd(p, q) für alle p, q ∈ X . Dann konvergiert die rekursiv definierte Folge x0 := a, xk+1 = F (xk ), für alle Anfangswerte a ∈ X gegen die eindeutig bestimmt Lsg. der Gleichung F (x) = x. Beweis. Einfache Übungsaufgabe. 265 / 327 Beweis des Existenzsatzes Für jede Lösung ϕ : I := [x0 − , x0 + ] → Rn von (∗) gilt für alle x ∈ I : Z x Z x ϕ(x) = y0 + ϕ0 (t)dt = y0 + f (t, ϕ(t))dt =: F (ϕ)(x). x0 x0 Somit ist ϕ ein Fixpunkt der Abbildung F . Sei nun U ⊂ Ω ⊂ R × Rn eine Umgebung von (x0 , y0 ), so dass f auf U Lipschitzstetig mit der Lipschitzkonstanten L > 0 ist und , δ > 0 seien so klein, dass I × B δ (y0 ) ⊂ U. Dann ist F auf X := {ψ ∈ C (I , Rn )| kψ − y0 kI ≤ δ} definiert und X ist als abgeschlossene Teilmenge des Banachraums C (I , Rn ) vollständig. Sei C := max{kf (p)k |p ∈ I × B δ (y0 )} und so klein, dass C < δ. Dann gilt F (X ) ⊂ X , denn für alle ψ ∈ X , x ∈ I gilt: Z x kf (t, ϕ(t))kdt ≤ C < δ. kF (ψ)(x) − y0 k ≤ x0 266 / 327 Ende des Beweises: Wir müssen noch zeigen, dass F eine Kontraktion ist. Für ϕ, ψ ∈ X und x ∈ I gilt: Z x kF (ϕ)(x) − F (ψ)(x)k ≤ kf (t, ϕ(t)) − f (t, ψ(t))kdt x0 ≤ Lkϕ − ψkI und somit kF (ϕ) − F (ψ)kI ≤ Lkϕ − ψkI . Für < 1 L ist F also eine Kontraktion. Nach dem Banachschen Fixpunktsatz hat F einen Fixpunkt ϕ ∈ X und aus ϕ(x) = F (ϕ)(x) folgt durch Ableiten bzw. Auswerten an der Stelle x0 , dass ϕ eine Lsg. von (∗) ist. 267 / 327 Satz (Lineare DGLn) Sei I ⊂ R ein Intervall, A : I → Mat(n, R), b : I → Rn seien stetig und (x0 , y0 ) ∈ I × Rn . Dann hat das System (∗) y 0 = A(x)y + b(x) inhomogener linear DGLn genau eine globale Lösung ϕ : I → Rn mit ϕ(x0 ) = y0 . Beweis. f (x, y ) = A(x)y + b(x) ist offenbar Lipschitzstetig bez. y auf J × Rn für jedes kompakte Intervall J ⊂ I . Die zugehörige Lipschitzkonstante ist L = supx∈J kA(x)k. Daraus folgt bereits die Eindeutigkeit. 268 / 327 Weiter im Beweis: Das Picard-Lindelöfsche R x Iterationsverfahren liefert die Folge ϕ0 = y0 , ϕk+1 (x) = y0 + x0 f (t, ϕk (t))dt. Wir zeigen, dass die Folge ϕk auf jedem kompakten Intervall x0 ∈ J ⊂ I gleichmäßig gegen die Lösung von (∗) konvergiert. Behauptung: kϕk+1 (x) − ϕk (x)k ≤ CLk |x − x0 |k k! für alle x ∈ J, wobei C = kϕ1 − y0 kJ . Für k = 0 ist nichts zu zeigen. Induktionsschritt: Z x kϕk+1 (x) − ϕk (x)k ≤ kf (t, ϕk (t)) − f (t, ϕk−1 (t))kdt x0 Z ≤ x kϕk (t) − ϕk−1 (t)kdt L x0 ≤ Ind.vor . CLk Z x x0 |t − x0 |k−1 |x − x0 |k dt = CLk (k − 1)! k! 269 / 327 Weiter im Beweis: Aus der Behauptung folgt mit r = maxx∈J |x − x0 |: ∞ X kϕk+1 (x) − ϕk (x))k ≤ C exp(L|x − x0 |) ≤ C exp(Lr ) k=0 und somit die gleichmäßige Konvergenz der Folge ϕk = (ϕk − ϕk−1 ) + · · · + (ϕ1 − ϕ0 ) + y0 gegen eine stetige Abbildung ϕ : J → Rn . Grenzübergang in der Rekursionsformel Z x ϕk+1 (x) = y0 + f (t, ϕk (t))dt x0 zeigt, dass ϕ : J → Rn eine Lsg. von (∗) ist. Da jeder Punkt von I in einem kompakten Intervall J ⊂ I mit x0 ∈ J enthalten ist, erhalten wir so die gesuchte Lsg. ϕ : I → Rn . 270 / 327 Satz (homogene Lineare DGLn) Sei I ⊂ R ein Intervall und A : I → Mat(n, R) sei stetig. Dann bilden die Lösungen ϕ : I → Rn des homogenen Systems (∗) y 0 = A(x)y einen n-dimensionalen VR. Beweis. Der Lösungsraum L ist der Kern der linearen Abbildung ϕ 7→ ϕ0 − Aϕ und somit ein Unterraum von C 1 (I , Rn ). Sei x0 ∈ I . Die Auswertung ϕ 7→ ϕ(x0 ) definiert eine lineare Abbildung ev : L → Rn . Wegen der Existenz und Eindeutigkeit der Lösungen zu gegebenen Anfangsbedingungen ist ev surjektiv und injektiv. 271 / 327 Satz (inhomogene Lineare DGLn) Sei I ⊂ R ein Intervall, A : I → Mat(n, R) und b : I → Rn seien stetig. Dann bilden die Lösungen ϕ : I → Rn des inhomogenen Systems (∗) y 0 = A(x)y + b(x) einen n-dimensionalen affinen Raum L + ψ, wobei ψ eine spezielle Lsg. von (∗) ist und L der Lösungsraum des zugehörigen homogenen Systems y 0 = A(x)y . Beweis. Das folgt daraus, dass die Differenz zweier Lösungen von (∗) eine Lösung des homogenen Systems ist. 272 / 327 Variation der Konstanten Eine spezielle Lsg. ψ der inhomog. DGL y 0 = A(x)y + b(x) kann wie folgt bestimmt werden. Sei Φ := (ϕ1 , . . . , ϕn ) eine Basis des Lösungsraums L der homog. DGL y 0 = A(x)y . Die Matrix Φ erfüllt die Matrixgleichung Φ0 = AΦ. Jedes Element ϕ ∈ L besitzt eine Darstellung der Form ϕ = Φu, wobei u ∈ Rn . Der unter dem Namen Variation der Konstanten bekannte Ansatz besteht darin, den konst. Vektor u ∈ Rn durch eine zu bestimmende diffb. Abb. u : I → Rn , x 7→ u(x), zu ersetzen. Einsetzen von ψ = Φu in die inhomogene DGL liefert mit ψ 0 = Φ0 u + Φu 0 = AΦu + Φu 0 : ψ 0 = AΦu + Φu 0 = Aψ + b = AΦu + b und somit u 0 = Φ−1 b. Das führt auf die Formel Z u(x) = x Φ(t)−1 b(t)dt + const. 273 / 327 Beispiel: Lineare DGLn mit konstanten Koeffizienten Sei A ∈ Mat(n, R), b ∈ Rn und (x0 , y0 ) ∈ R × Rn . a) Es gibt genau eine Lsg. ϕ : R → Rn des homogenen Systems y 0 = Ay mit der Anfangsbedingung ϕ(x0 ) = y0 , und zwar ϕ(x) = e (x−x0 )A y0 , A e := ∞ X Ak k=0 k! . b) Es gibt genau eine Lsg. ψ : R → Rn des inhomogenen Systems y 0 = Ay + b mit der Anfangsbedingung ψ(x0 ) = y0 , und zwar Z x ψ(x) = ϕ(x) + ψ0 (x), ψ0 (x) = e xA e −tA bdt. x0 Rx Wenn A invertierbar ist, so ist x0 e −tA bdt = −A−1 e −tA b|xx0 und somit ψ0 (x) = −A−1 b + e (x−x0 )A A−1 b. Beachte, dass −A−1 b eine (konstante) Lsg. von y 0 = Ay + b ist. 274 / 327 Sei nun A diagonalisierbar und (v1 , . . . , vn ) eine Basis von Rn bestehend aus Eigenvektoren von A: Avi = λi vi . Wir setzen ϕi (x) := e λi x vi . Dann bilden die ϕi : R → Rn eine Basis des Lösungsraums des homog. Systems y 0 = Ay . Eine spezielle Lsg. des inhomog. Systems y 0 = Ay + b ist ( i n X − λb̃ i falls λi 6= 0 ψ(x) = c i (x)vi , c i (x) := x b̃ i falls λi = 0, i=1 wobei b = Pn i=1 b ie i = Pn i=1 b̃ iv i. Nicht jede quadratische Matrix ist diagonalisierbar. Man kann aber jede quadratische Matrix in Jordansche Normalform bringen. 275 / 327 Eine Einführung in das Lösen von Differentialgleichungen mit Maple findet man auf der webpage: http://www.physik.uniregensburg.de/studium/edverg/maple/script/html/maple kap3.html 276 / 327 Satz (Jordansche Normalform) Sei A ∈ Mat(n, C). Dann existiert S ∈ GL(n, C), so dass e = SAS −1 folgende Gestalt hat A e = diag(Jm (λ1 ), · · · , Jm (λk )), A 1 k wobei λ 1 0 ··· Jm (λ) = 0 λ .. . 1 .. . .. 0 ··· . λ 0 0 .. . ∈ Mat(m, C) 0 1 λ Hierbei sind λi die (nicht notwendig verschiedenen) Eigenwerte von A. (Die Matrizen Jm (λ) heißen Jordanblöcke.) 277 / 327 Satz (reelle Jordansche Normalform) Sei A ∈ Mat(n, R). Dann existiert S ∈ GL(n, R), so dass e = SAS −1 folgende Gestalt hat A e = diag(J` (λ1 ), · · · , J` (λr ), J2m (α1 , β1 ), · · · , J2m (αs , βs )), A s r 1 1 Jm (α) −β1m J2m (α, β) = ∈ Mat(m, R) β1m Jm (α) Hierbei sind λi die (nicht notw. verschiedenen) reellen Eigenwerte von A und µj = αj + iβj , µj die (nicht notw. versch.) imaginären Eigenwerte von A.a a Die Multiplizität eines reellenPEigenwerts λP (bzw. eines imaginären Eigenwerts µ) berechnet sich zu λi =λ `i bzw µj =µ mj . Beweis. Siehe z.B. Klingenberg: Lineare Algebra und Geometrie. 278 / 327 Anwendung auf lineare DGLn Sei y 0 = Ay ein lineares DGL-System mit konstanten Koeffizienten. Durch eine Substitution ỹ = Sy , S ∈ GL(n), können wir annehmen, dass A Jordan-Normalform hat. DannPläßt sich die allgemeine Lösung ϕ(x) = e xA c, c = ni=1 c i ei ∈ Rn , expliziter angeben. Es genügt die Fälle A = Jn (λ) und A = J2m (α, β) zu untersuchen. Im ersten Fall erhalten wir wg. Jn (λ) = λ1n + Jn (0): ϕ(x) = e xλ e xJn (0) c = e λx (p(x), p 0 (x), · · · , p (n−1) (x))t , wobei p(x) = ck k−1 . k=1 (k−1)! x Pn Im zweiten Fall ist ϕ(x) = e αx cos βx(p(x), · · · , p (m−1) (x), q(x), · · · , q (m−1) (x))t + e αx sin βx(−q(x), · · · , −q (m−1) (x), p(x), · · · , p (m−1) (x))t mit beliebigen Polynomen p, q vom Grad ≤ m − 1. 279 / 327 Definition (Gewöhnliche DGLn höherer Ordnung) Sei Ω ⊂ R × Rn und f : Ω → R stetig. y (n) = f (x, y , y 0 , . . . , y (n−1) ) ist eine gewöhnliche DGL n-ter Ordung. Unter einer Lösung versteht man eine auf einem Intervall I ⊂ R definierte n-mal diffb. Funktion ϕ : I → R, so dass (i) der Graph ΓΦ ⊂ Ω, wobei Φ = (ϕ, ϕ0 , . . . , ϕ(n−1) ) : I → Rn und (ii) ϕ(n) (x) = f (x, ϕ(x), ϕ0 (x), . . . , ϕ(n−1) (x)) für alle x ∈ I . 280 / 327 Unter den obigen Voraussetzungen, definieren wir F : Ω → Rn , F (x, Y ) := (y 1 , . . . , y n−1 , f (x, Y )), wobei Y = (y 0 , . . . , y n−1 ) ∈ Rn . Dann gilt: Satz ϕ : I → R ist genau dann eine Lösung der DGL n-ter Ordnung y (n) = f (x, y , y 0 , . . . , y (n−1) ), wenn Φ = (ϕ, ϕ0 , . . . , ϕ(n−1) ) eine Lsg. des Systems Y 0 = F (x, Y ) von n Differenzialgleichungen erster Ordnung ist. 281 / 327 Folgerung Sei Ω ⊂ R × Rn offen und f : Ω → R, (x, Y ) 7→ f (x, Y ), sei stetig und bez. Y Lipschitz-stetig. (i) Sei I ⊂ R ein Intervall, x0 ∈ I und ϕ, ψ : I → R seien zwei Lösungen der DGL (∗) y (n) = f (x, y , y 0 , . . . , y (n−1) ) mit Φ(x0 ) = Ψ(x0 ) := (ψ(x0 ), ψ 0 (x0 ), . . . , ψ (n−1) (x0 )). Dann gilt ϕ = ψ. (ii) Zu jedem (x0 , Y0 ) ∈ Ω existiert > 0 und (genau) eine Lsg. ϕ : (x0 − , x0 + ) → R von (∗) mit der Anfangsbedingung Φ(x0 ) = Y0 . Beweis. Das folgt aus dem Existenz- und Eindeutigkeitssatz für Systeme von DGLn 1. Ordnung, denn aus der Lipschitz-Stetigkeit von f bez. Y folgt die von (x, Y ) 7→ F (x, Y ) = (y 1 , . . . , y n−1 , f (x, Y )). 282 / 327 Folgerung Sei I ⊂ R ein Intervall, und b, ak : I → R seien stetige Funktionen, k = 0, 1, . . . , n − 1. (i) Die Lösungen ϕ : I → R der homogenen DGL n. Ordnung y (n) + an−1 (x)y (n−1) + · · · + a1 (x)y + a0 (x) = 0 bilden einen n-dimensionalen Vektorraum L. (ii) Die Lösungen ϕ : I → R der inhomogenen DGL n. Ordnung (∗) y (n) + an−1 (x)y (n−1) + · · · + a1 (x)y + a0 (x) = b(x) bilden einen n-dimensionalen affinen Raum L + ψ, wobei ψ eine spezielle Lsg. von (∗) ist. 283 / 327 Satz (Lineare gewöhnliche DGLn mit konstanten Koeffizienten) Sei P(t) = t n + an−1 t n−1 + · · · + a1 t + a0 ∈ R[t] ein Polynom vom Grad n. λj seien die reellen und µk = αk + iβk , µk die imaginären Nullstellen von P mit den zugehörigen Multiplizitäten `j , mk , wobei j = 1, . . . , r und k = 1, . . . , s. Dann bilden die Funktionen x ` e λj x , x m e αk x cos βk x, ` = 0, 1, . . . , `j − 1, x m e αk x sin βk x, m = 0, 1, . . . , mk − 1, eine Basis des Lösungsraums der homog. DGL d )y := y (n) + an−1 y (n−1) + · · · + a1 y + a0 = 0. P( dx 284 / 327 Beweis. Wir zeigen zuerst, dass die Funktion x ` e λx die DGL löst, wenn λ eine NS von P mit Multiplizität > ` ist. Da P den Faktor (t − λ)`+1 enthält, folgt das aus der Behauptung: (d/dx − λ)k p(x)e λx = p (k) (x)e λx für alle Polynome p. (Bew. durch Induktion nach k ≥ 0.) Das beweist, dass die Funktionen x ` e λj x für ` ≤ `j − 1 und x m e µk x , x m e µk x für m ≤ mk − 1 die DGL lösen und ebenso die reellwertigen Linearkombinationen x m e αk x cos βk x = Re x m e µk x und x m e αk x sin βk x = Im x m e µk x . Die lineare Unabhängigkeit obiger Lösungen folgt aus dem nächsten Lemma. 285 / 327 Lemma Seien c1 , . . . , cn ∈ C paarweise verschieden und p1 (x), . . . , pn (x) ∈ C[x]. Dann folgt aus p1 (x)e c1 x + · · · + pn (x)e cn x = 0 für alle x ∈R p1 = · · · = pn = 0. Beweis. n = 1: Aus p1 (x)e c1 x = 0 folgt p1 (x) = 0. Induktionsschritt n → n + 1: Wir nehmen an, dass Pn+1 cj x = 0 für alle x ∈ R. p (x)e j=1 j Sei k der Grad des Polynoms pn+1 . Dann gilt (d/dx − cn+1 )k+1 pn+1 (x)e cn+1 x = 0 und somit 286 / 327 Weiter im Beweis des Lemmas: 0 = (d/dx − cn+1 ) k+1 n+1 X pj (x)e cj x = j=1 n X hj (x)e cj x j=1 mit gewissen Polynomen hj . Aus der Induktionsvoraussetzung folgt hj = 0. Um zu zeigen, dass pj = 0, schreiben wir P m (t − cn+1 )k+1 = k+1 m=0 am (t − cj ) mit a0 6= 0. Daraus ergibt sich hj (x)e cj x = (d/dx − cn+1 )k+1 pj (x)e cj x = k+1 X (m) am pj (x)e cj x m=0 und somit hat hj denselben Grad wie pj . Das ist nur möglich, wenn pj = 0. 287 / 327 Satz (Inhomog. lin. gewöhnliche DGLn mit konst. Koeffizienten) Sei P(t) = t n + an−1 t n−1 + · · · + a1 t + a0 ∈ R[t] und µ ∈ R mit P(µ) 6= 0. Dann gilt: (i) e µx P(µ) d ist eine Lsg. der inhomog. DGL P( dx )y = e µx . (ii) Sei f (x) ∈ R[x] vom Grad m. Dann hat die inhomog. DGL d P( dx )y = f (x)e µx eine Lsg. der Form g (x)e µx , wobei g (x) ∈ R[x] vom Grad m ist. 288 / 327 Beweis. Wir schreiben P(t) = b0 = P(µ) 6= 0. Pn k=0 bk (t − µ)k mit Daraus ergibt sich n X d P( )x m e µx = bk (x m )(k) e µx =: f0 (x)e µx , dx k=0 wobei f0 (x) ∈ R[x] vom Grad m ist. d Insbesondere P( dx )e µx = P(µ)e µx . Das beweist (i) und liefert den Induktionsanfang m = 0 für (ii). Es gibt c 6= 0, so dass h(x) = f (x) − cf0 (x) Grad ≤ m − 1 hat. Daher existiert nach Ind.vor. eine Lsg. g1 (x)e µx von d P( dx )y = h(x)e µx mit einem Polynom g1 (x) vom Grad ≤ m − 1. g (x) = cx m + g1 (x) ist dann das gesuchte Polynom vom Grad m. 289 / 327 Satz Sei µ ∈ R eine k-fache Nullstelle von P(t) = t n + an−1 t n−1 + · · · + a1 t + a0 ∈ R[t] und f (x) ∈ R[x] vom Grad m. d Dann hat die inhomog. DGL P( dx )y = f (x)e µx eine Lsg. der Form h(x)e µx , wobei k+m X h(x) = cj x j . j=k 290 / 327 Beweis. Wir schreiben P(t) = Q(t)(t − µ)k , mit einem Polynom Q(t) vom Grad m − k und Q(µ) 6= 0. Nach dem vorigen Satz existiert ein Polynom g (x) vom Grad m, so d )y = f (x)e µx ist. dass g (x)e µx eine Lsg. von Q( dx P j (k) (x) = g (x). Dann ist Sei h(x) = k+m j=k cj x derart, dass h d h(x)e µx die gesuchte Lsg. von P( dx )y = f (x)e µx . Bemerkung. Die letzten beiden Sätze gelten auch für DGLn mit komplexen Koeffizienten, d.h. P, f , g , h ∈ C[x], µ ∈ C. Die Lösungen ϕ : R → C sind komplexwertige Funktionen der reellen Variablen x. 291 / 327 Beispiel: Harmonischer Oszillator Wir betrachten die DGL (∗) ẍ + ω02 x = a cos ωt, ω, ω0 > 0, a ∈ R∗ . Die Lösungen der homogenen Gleichung sind Linearkombinationen von sin ω0 t und cos ω0 t. 292 / 327 Um eine Lsg. von (∗) zu finden betrachten wir die DGL (∗∗) ẍ + ω02 x = ae iωt . (i) Wenn ω 6= ω0 , so existiert eine Lsg. von (∗∗) von der Form a ce iωt . Einsetzen in (∗∗) liefert c = ω2 −ω 2. 0 ϕ(t) = Re ce iωt = c cos ωt ist dann eine Lsg. von (∗). (ii) Wenn ω = ω0 (d.h. der harm. Oszillator wird mit der Eigenfrequenz ω0 angeregt) dann gibt es eine Lsg. von (∗∗) a von der Form cte iωt . Einsetzten in (∗∗) liefert c = 2iω . a ϕ(t) = Re cte iωt = 2ω t sin ωt ist dann eine Lsg. von (∗) und a die Amplitude der Schwingung | 2ω t| → ∞ für t → ∞ ( Resonanzkatastrophe). 293 / 327 Satz Sei [a, b] ⊂ R, U ⊂ Rn und f : [a, b] × U → R stetig. Dann ist die durch Z ϕ(y ) := b f (x, y )dx a definierte Funktion ϕ : U → R stetig. 294 / 327 Beweis. Sei yk ∈ U eine konvergente Folge mit dem Grenzwert c ∈ U. Die Menge K = {yk |k ∈ N} ∪ {c} ist kompakt und ebenso [a, b] × K . Daher ist die stetige Funktion f auf [a, b] × K gleichmäßig stetig und die Funktionen Fk : [a, b] → R, Fk (x) := f (x, yk ), konvergieren gleichmäßig gegen die stetige Funktion F (x) = f (x, c). Rb Daraus folgt die Konvergenz von ϕ(yk ) = a Fk (x)dx gegen Rb ϕ(c) = a F (x)dx: |ϕ(yk ) − ϕ(c)| ≤ (b − a) sup |Fk − F | → 0 (k → ∞). [a,b] 295 / 327 Satz Seien [a, b], I ⊂ R Intervalle und f : [a, b] × I → R, (x, y ) 7→ f (x, y ), stetig und bez. y stetig diffb. Dann ist die durch Z b f (x, y )dx ϕ(y ) := a definierte Funktion ϕ : I → R stetig diffb. und es gilt 0 Z ϕ (y ) = a b ∂f (x, y ) dx. ∂y Beweis. Sei c ∈ I und c 6= yk ∈ I konvergiere gegen c. 296 / 327 Weiter im Beweis: Wir betrachten die Folge Fk (x) := f (x,yk )−f (x,c) . yk −c Wg. des MWS existiert ηk zwischen c und yk mit Fk (x) = Da ∂f ∂y ∂f (x,ηk ) . ∂y stetig ist, konvergiert Fk : [a, b] → R gleichmäßig gegen die stetige Funktion F : [a, b] → R, F (x) := ∂f (x,c) ∂y . Daher konvergiert ϕ(yk ) − ϕ(c) = yk − c gegen Rb a F (x)dx = Rb a Z b Fk (x)dx a ∂f (x,c) ∂y dx. Somit ist ϕ diffb. die Stetigkeit der Ableitung R b ∂fund (x,y ) 0 y 7→ ϕ (y ) = a ∂y dx folgt, wg. des vorigen Satzes, aus der Stetigkeit des Integranden ∂f (x,y ) ∂y . 297 / 327 Folgerung Sei [a, b] ⊂ Rm , U ⊂ Rn offen und f : [a, b] × U → R, (x, y ) 7→ f (x, y ), stetig und bez. y k-mal stetig diffb. Dann ist die durch Z ϕ(y ) := b f (x, y )dx a definierte Abbildung ϕ : U → Rm k-mal stetig diffb. 298 / 327 Anwendung auf gew. DGLn Sei Ω ⊂ R × Rn × Rm und f : Ω → Rn stetig. Sei I ⊂ R ein Intervall und U ⊂ Rm . Eine partiell nach x diffb. Funktion ϕ : I × U → Rn heißt Lsg. der DGL. (∗) y 0 = f (x, y , z), wenn (i) Γϕ ⊂ Ω und (ii) ∂ϕ(x,z) ∂x = f (x, ϕ(x, z), z) für alle (x, z) ∈ I × U. 299 / 327 Satz Mit den obigen Bezeichnungen sei Ω offen, f Lipschitz-stetig bez. y und (x0 , y0 , z0 ) ∈ Ω. (i) Dann existiert ein offenes Intervall I 3 x0 und eine offene Umgebung U von z0 , so dass das die Folge Z x f (t, ϕk (t, z), z)dt ϕ0 = y0 , ϕk+1 (x, z) = y0 + x0 auf I × U gleichmäßig gegen eine Lösung ϕ von (∗) mit der Anfangsbed. ϕ(x0 , z) = y0 konvergiert. Insbesondere ist ϕ : I × U → Rn stetig. (ii) ϕ ist von der Klasse C k ist, wenn f es ist. 300 / 327 Beweis. (i) Sei V ⊂ R × Rm und ϕ : V → Rn eine stetige Abbildung, so dass Γϕ ⊂ Ω. Dann definiert das parameterabhängige Integral Z x F (ϕ)(x, z) := y0 + f (t, ϕ(t, z), z)dt x0 eine stetige Abbildung F (ϕ) : V → Rn . Wie beim Beweis des Existenzsatzes zeigt man, dass F eine Kontraktion F : X → X auf einer geeigneten abgeschlossenen Teilmenge X des Banachraums C (B δ (x0 , z0 ), Rn ) definiert, wenn δ > 0 klein genug ist. Die Picard-Lindelöfsche Folge ϕk konvergiert dann auf B δ (x0 , z0 ) ⊃ I × U gleichmäßig gegen eine stetige Grenzfkt. ϕ. 301 / 327 Weiter im Beweis: Grenzübergang in der Rekursionsformel liefert daher Z x ϕ(x, z) = y0 + f (t, ϕ(t, z), z)dt. x0 Diese Integralgleichung zeigt, dass ϕ eine Lsg. von (∗) mit ϕ(x0 , z) = y0 ist. (ii) Wir zeigen nun, dass ϕ : I × U → Rn stetig diffb. ist, wenn f es ist. Aus der Stetigkeit von f und ϕ folgt mit Hilfe der DGL ∂ϕ(x, z) = f (x, ϕ(x, z), z) ∂x die Stetigkeit der partiellen Ableitung ∂ϕ ∂x . Um die Darstellung zu vereinfachen, nehmen wir o.B.d.A. an, dass m = 1. Um zu zeigen, dass ∂ϕ ∂z existiert und stetig ist benutzen wir folgendes Lemma. 302 / 327 Weiter im Beweis: Lemma Sei I ⊂ R ein Intervall und fk : I → R eine Folge stetig diffb. Funktionen, die punktweise gegen f : I → R konvergiert und so, dass fk0 gleichmäßig gegen g : I → R konvergiert. Dann ist f stetig diffb. und f 0 = g . Beweis. Grenzübergang in der Gleichung Z x fk (x) = fk (x0 ) + fk0 (t)dt x0 liefert f (x) = f (x0 ) + Rx x0 g (t)dt. f 0 = g . f ist Somit ist f diffb. und stetig diffb., denn g ist als Limes einer glm. konvergenten Folge stetiger Funktionen stetig. 303 / 327 Weiter im Beweis: Wg. des Lemmas genügt es zu zeigen, dass (nach evtl. Verkleinerung von δ) ψk := ∂ϕk ∂z auf Qδ := B δ (x0 ) × B δ (z0 ) gleichmäßig konvergiert, wobei Z x ϕ0 = y0 , ϕk+1 (x, z) = y0 + f (t, ϕk (t, z), z)dt. x0 Ableiten dieser Rekursionsformel nach z liefert (1) ψk+1 (x, z) = Z x ∂f ∂f ( (t, ϕk (t, z), z)ψk (t, z) + (t, ϕk (t, z), z))dt. ∂y x0 |∂z {z } | {z } Ak (t,z):= bk (t,z):= 304 / 327 Weiter im Beweis: Wir setzen A(t, z) := ∂f (t, ϕ(t, z), z), ∂y b(x, z) := ∂f (t, ϕ(t, z), z). ∂z Da f C 1 ist und ϕk glm. gegen ϕ konvergiert, konvergieren Ak , bk glm. gegen A bzw. b. Wenn ψk glm. konvergiert, dann gilt für den Limes ψ also Z x (2) ψ(x, z) = (A(t, z)ψ(t, z) + b(t, z)) dt. x0 ψ ist dann notwendigerweise die Lsg. der inhomog. DGL y 0 = A(x, z)y + b(x, z) mit ψ(x0 , z) = 0. Insbesondere ist ψ stetig. Sei ψ diese eindeutig bestimmte Lsg. Wir zeigen, dass ψk tatsächlich glm. gegen ψ konvergiert. 305 / 327 Weiter im Beweis: Wir schreiben kv k∞ := supQδ kv (x, z)k für jede vektor- oder matrixwertige Funktion v auf Qδ . Da ψ stetig ist und Ak glm. konvergiert, existiert K > 0 mit kψk∞ , kAk k∞ ≤ K . Außerdem existiert, wg. der glm. Konvergenz von Ak , bk gegen A, b, für alle > 0 ein N() ∈ N, so dass kA − Ak k∞ , kb − bk k∞ ≤ . für alle k ≥ N(). 306 / 327 Weiter im Beweis: Aus (1) und (2) folgt hk+1 (x, z) := kψ(x, z) − ψk+1 (x, z)k Z x ≤ kA(t, z)ψ(t, z) − Ak (t, z)ψk (t, z)kdt x0 Z x + kb(t, z) − bk (t, z)kdt x0 Z x Z x ≤ kA − Ak k∞ kψk∞ dt + kAk k∞ kψ(x, z) − ψk (x, z)kdt x0 x0 Z x + kb − bk k∞ dt x0 Z x ≤ |x − x0 |K + K kψ(x, z) − ψk (x, z)kdt + |x − x0 | x0 Z x = C |x − x0 | + K hk (x, z)dt, x0 wobei C := K + 1. 307 / 327 Weiter im Beweis: Insgesamt erhalten wir Z (∗k+1 ) x hk+1 (x, z) ≤ C |x − x0 | + C hk (x, z)dt. x0 Daraus ergibt sich mit Hk := kψ − ψk k∞ : (1) hk+1 (x, z) ≤ C (Hk + )|x − x0 |. Einsetzten von (1) in (∗k+2 ) ergibt (2) hk+2 (x, z) ≤ C |x − x0 | + C 2 (Hk + ) |x − x0 |2 . 2 Einsetzen von (2) in (∗k+3 ) liefert (3) hk+3 (x, z) ≤ C |x−x0 |+C 2 |x − x0 |2 |x − x0 |3 +C 3 (Hk +) . 2 3! 308 / 327 Weiter im Beweis: Induktiv ergibt sich hk+` (x, z) ≤ l−1 X j=1 Cj |x − x0 |j |x − x0 |` + C ` (Hk + ) j! `! ≤ e C |x−x0 | + C ` (Hk + ) |x − x0 |` `! Für alle η > 0 existiert > 0, so dass e C |x−x0 | < η/2 für alle x ∈ B δ (x0 ). Für alle k ≥ N() existiert M, so dass ` 0| C ` (Hk + ) |x−x ≤ η/2 für alle ` ≥ M. `! Daraus folgt limj→∞ Hj = 0. Wir haben bewiesen, dass ψk glm. gegen ψ konvergiert und somit, dass ϕ stetig diffb. ist. 309 / 327 Weiter im Beweis: Wir zeigen durch Induktion, dass ϕ C k ist, wenn f C k ist. Für k = 0, 1 ist das schon bewiesen. Es bleibt der Induktionsschritt k − 1 → k. Sei f von d. Klasse C k und somit nach Ind.vor. ϕ von d. Klasse C k−1 . Rx Die Gleichung ∂ϕ ∂x (x, z) = y0 + x0 f (t, ϕ(t, z), z)dt zeigt, dass ∂ϕ ∂x (k − 1)-mal stetif diffb. ist, d.h. alle partiellen Ableitungen von ϕ der Ordnung k, die mindestens eine Ableitung nach x enthalten existieren und sind stetig. Es bleibt zu zeigen, dass ∂k ϕ ∂z k existiert und stetig ist. ∂ϕ ∂z erfüllt die DGL y 0 = A(x, z)y + b(x, z), wobei A und b von d. Klasse C k−1 sind. Also ist ∂ϕ ∂z nach Ind.vor. von der Klasse C k−1 . 310 / 327 Folgerung Sei Ω ⊂ R × Rn offen, f : Ω → Rn stetig und bez. y lokal Lipschitzstetig und (x0 , y0 ) ∈ Ω. Dann existiert ein offenes Intervall I 3 x0 und eine offene Umgebung U ⊂ Rn von y0 , so dass für alle z ∈ U die Lsg. ϕz der DGL y 0 = f (x, y ) mit der Anfangsbed. ϕz (x0 ) = z auf dem ganzen Intervall I definiert ist. Die Abbildung ϕ : I × U → Rn , (x, z) 7→ ϕz (x), ist stetig. ϕ : I × U → Rn ist k-mal stetig diffb., wenn f es ist. (Die Lsg. der DGL hängt also stetig bzw. k-mal stetig diffb. von den Anfangsbedingungen ab.) 311 / 327 Beweis (der Folgerung). Das Anfangswertproblem y 0 = f (x, y ), y (x0 ) = z geht durch die Substitution ỹ := y − z in ỹ 0 = f˜(x, ỹ , z) := f (x, ỹ + z), ỹ (x0 ) = 0 über. Auf diese parameterabhängige DGL können wir den vorhergehenden Satz anwenden. 312 / 327 Fourier-Reihen Sei V der Vektorraum der (2π-)periodische Funktionen f : R → C, so dass f |[0,2π] integrierbar ist. Die Funktionen ek (x) := exp(ikx) , k ∈ Z, bilden ein orthonormales System bez. der Hermiteschen Form Z 2π 1 f (x)g (x)dx, f , g ∈ V . (∗) hf , g i := 2π 0 (∗) ist positiv semi-definit, d.h. hf , f i ≥ 0 für alle f ∈ V . Auf dem Unterraum der stetigen Funktionen ist (∗) positiv definit und somit ein SKP. R 2π 1 −ikx dx ∈ C heißt k-ter ck := hf , ek i = 2π 0 f (t)e P Fourier-Koeffizient und Fn (f ) := nk=−n ck ek n-tes Fourier-Polynom von f . Die Reihe (Fn (f ))n=0,1,... heißt Fourier-Reihe von f . 313 / 327 Bemerkung. Es gilt n Fn (f ) = a0 X + (ak cos kx + bk sin kx), 2 k=1 wobei ak bk = ck + c−k 1 = π = i(ck − c−k ) = Z 2π f (x) cos kxdx 0 1 π Z 2π f (x) sin kxdx. 0 Wenn f reellwertig ist, dann ist c−k = c k und Fn (f ) ist reellwertig. 314 / 327 Satz (Fourier-Reihen) (i) Fn (f ) ist die beste Approximation an f ∈ V in dem Unterraum Vn := span{ek | − n ≤ k ≤ n}, d.h. p kf − Fn (f )k2 = inf g ∈Vn kf − g k2 , wobei kf k2 := hf , f i. (ii) Desweiteren gilt P kf − Fn (f )k22 = kf k22 − kFn (f )k22 = kf k22 − nk=−n |ck |2 . Beweis. (ii) kann manP direkt nachrechnen. Um (i) zu zeigen, berechnen wir für g = nk=−n dk ek ∈ Vn : kf − g k22 = kf k22 − = kf k22 − n X k=−n n X (d k ck + dk ck ) + n X |dk |2 k=−n |ck |2 + kFn (f ) − g k22 . k=−n 315 / 327 Folgerung Für die Fourier-Koeffizienten ck von f ∈ V gilt die Besselsche Ungleichung: ∞ X |ck |2 ≤ kf k22 . k=−∞ Gleichheit gilt genau dann, wenn die Fourier-Reihe Fn (f ) im quadratischen Mittel gegen f konvergiert. 316 / 327 Satz (i) Für alle f ∈ V gilt kf k22 = ∞ X |ck |2 k=−∞ (ii) und die Fourier-Reihe konvergiert im quadratischen Mittel gegen f , d.h. limn→∞ kf − Fn (f )k2 = 0. Beweis. Wg. des vorhergehenden Satzes sind (i) und (ii) äquivalent. Das nächste Lemma zeigt, dass der Satz für Treppenfunktionen gilt. 317 / 327 Lemma Sei f ∈ V so dass f |[0,2π] eine Treppenfunktion ist. Dann konvergiert Fn (f ) im quadratischen Mittel gegen f . Weiter im Beweis des Satzes: f |[0,2π] ist als Riemann-integrierbare Funktion beschränkt. Wir können o.B.d.A. annehmen, dass f reellwertig ist und |f | ≤ 1. Dann existieren −1 ≤ ϕ ≤ f ≤ ψ ≤ 1, R 2π zu > 0 Treppenfunktionen 1 2 so dass 2π (ψ(x) − ϕ(x))dx ≤ . 8 0 Mit (ψ − ϕ)2 ≤ 2(ψ − ϕ) folgt daraus kf − ϕk22 ≤ kψ − ϕk22 ≤ und somit kf − ϕk2 ≤ 2 . Wg. des Lemmas existiert N ∈ N, so dass kϕ − Fn (ϕ)k2 < alle n ≥ N. Mit g = f − ϕ gilt kg − Fn (g )k2 ≤ kg k2 ≤ 2 und somit kf − Fn (f )k2 ≤ kg − Fn (g )k2 + kϕ − Fn (ϕ)k2 < . 2 2 4 für 318 / 327 Beweis des Lemmas: Wir können annehmen, dass f |(0,a) = 1 und f |(a,2π) = 0, denn jede Treppenfunktion läßt sich als Linearkombination solcher Funktionen darstellen. a Als Fourier-Koeffizienten erhalten wir c0 = 2π und i −ikx a ck = e , k ∈ N. 2πk 0 Mit |ck |2 = 1−cos ka 2π 2 k 2 ∞ X k=−∞ (k 6= 0) erhalten wir |ck |2 = ∞ ∞ a2 1 X 1 1 X cos ka + − . 4π 2 π 2 k 2 π2 k2 k=1 k=1 319 / 327 Weiter im Beweis: Mit Hilfe der für alle x ∈ [0, 2π] gültigen Formel (∗) ∞ X cos kx k=1 k2 = x −π 2 2 − π2 12 erhalten wir P∞ 1 π2 k=1 k 2 = 6 und ∞ X k=−∞ |ck |2 = 1 a − π 2 π2 a a2 1 − ) − )= = kf k22 . + (( 2 2 4π 6 π 2 12 2π Also konvergiert Fn (f ) im quadr. Mittel gegen f . Zum Beweis stellen wir zuerst fest, dass die Reihe P voncos(∗) kx F (x) := ∞ k=1 k 2 absolut und glm. auf R konvergiert. P sin kx Behauptung: Die Reihe der Ableitungen − ∞ konvergiert k=1 k x−π für alle δ > 0 auf [δ, 2π − δ] glm. gegen 2 . 320 / 327 Weiter im Beweis: Daraus folgt F 0 (x) = x−π 2 und F (x) = (x−π)2 4 + c. Um die Konstante c zu bestimmen berechnen wir: 2π Z 2π π3 (x − π)3 + 2πc = F (x)dx = + 2πc. 12 0 6 0 P cos kx Gliedweise Integration der Reihe F (x) = ∞ k=1 k 2 ergibt R 2π π2 0 F (x)dx = 0, d.h. c = − 12 . Das beweist (∗). P sin kx Wir müssen noch die glm. Konvergenz von ∞ gegen k=1 k auf [δ, 2π − δ] zeigen. π−x 2 Dazu schätzen Pn wir zunächst Pn ikx ab: sn (x) := k=1 sin kx = Im k=1 e n X 1 − e inx 2 1 ikx ≤ . |sn (x)| ≤ e = e ix ≤ 1 − e ix |e ix/2 − e −ix/2 | sin δ/2 k=1 321 / 327 Weiter im Beweis: Aus |sn (x)| ≤ sin1δ/2 =: σ erhalten wir weiter Pm sin kx Pm sk (x)−sk−1 (x) = k k=n k=n k P sn−1 (x) sm (x) 1 1 = m + s (x) − − k k k+1 n k=n m+1 1 1 ≤ σ n1 − m+1 + m+1 + n1 = 2σ n . P∞ sin kx 2σ Also k=n k ≤ n , woraus die glm. Konvergenz der Reihe folgt. Wir müssen noch zeigen, dass ∞ X sin kx k=1 k = π−x 2 für alle x ∈ (0, 2π). 322 / 327 Weiter im Beweis: Rx Es gilt sinkkx = π cos kt dt und n X cos kt = k=1 n n 1 X ikt 1 X ikt 1 (e + e −ikt ) = e − 2 2 2 k=1 = k=−n e −int (1 e i(2n+1)t ) − 2(1 − e it ) − sin(n + 12 )t 1 1 = − . t 2 2 2 sin 2 Lemma Für jede stetig diffb. Funktion f : [a, b] → R gilt mit r ∈ R: Z lim |r |→∞ a b f (x) sin rx dx = 0. Beweis. partielle Integration. 323 / 327 Weiter im Beweis: Mit Hilfe des Lemmas erhalten wir schließlich: Z x ∞ X sin(n + 12 )t sin kx x −π π−x = lim dt − = . t n→∞ π k 2 2 2 sin 2 k=1 324 / 327 Satz Sei f ∈ V stetig und stückweise C 1 , d.h. es gibt eine Unterteilung 0 = t0 < t1 < · · · < tr = 2π, so dass fk := f |[tk−1 ,tk ] von der Klasse C 1 ist, k = 1, . . . , r . Dann konvergiert Fn (f ) gleichmäßig gegen f . Beweis. Sei ϕ die periodische Funktion mit ϕ|[tk−1 ,tk ) = fk0 . Die Fourier-Koeffizienten cn von f ergeben sich durch part. Integr. aus den Fourier-Koeff. γn von ϕ: tk Z tk Z i i tk f (x)e −inx dx = f (x)e −inx ϕ(x)e −inx dx. − n n tk−1 tk−1 tk−1 Wg. der Periodizität von f erhält man daraus cn = − ni γn (n 6= 0). 325 / 327 Weiter im Beweis: Desweiteren gilt nach der binomischen Formel |cn | = 1 1 |γn | ≤ ( 2 + |γn |2 ). n 2 n P P∞ 1 2 Aus ∞ n=1 n2 < ∞ und n=−∞ |γn | < ∞ (Besselsche-Ungl.) folgt nun die absolute und gleichmäßige Konvergenz der Fourier-Reihe Fn (f ) gegen eine stetige Grenzfunktion g . Andererseits konvergiert Fn (f ) im quadratischen Mittel gegen f . Das ist nur möglich, wenn f = g , denn beide Funktionen sind stetig. 326 / 327 Folgerung (Weierstraßscher Approximationssatz für periodische Funktionen) Jede stetige periodische Funktion f ∈ V läßt sich glm. durch trigonometrische Polynome approximieren. (Ein trigonometrisches P Polynom vom Grad ≤ n ist eine Linearkombination nk=−n γk e ikx .) Beweis. Jede stetige Funktion läßt sich glm. durch stückweise lineare Funktionen approximieren, die wiederum durch ihre Fourier-Reihe glm. approximiert werden. 327 / 327 C k -Abbildungen, 228 C k -Diffeomorphismus, 228 ψ = Φu, 273 k-linear, 25 (→ Zeichnung), 222 (Euklidisches) Skalarprodukt, 33 (Hermitesches) Skalarprodukt, 56 (offene) Überdeckung, 132, 143 (total) differenzierbar, 174, 189 Äquivalenzklasse, 8 Äquivalenzrelation, 8 ÜA, 93 ÜA:, 256 abgeschlossen, 124 Ableitung, 174, 189 Ableitung von f an der Stelle x in Richtung v , 152 Abschluss, 125 Abstand, 35 327 / 327 abstoßend, 166 adjungiert, 70 anziehend, 165, 166 Ball, 126 Banachraum, 87 Basiswechsel, 7 beschränkte Operatoren, 120 bez. y Lipschitzstetig, 259 bez. y lokal Lipschitzstetig, 259 bilineare, 26 Bilinearformen, 26 Cauchy-Folge, 87 darstellende Matrix, 32 diagonalisierbar, 13 Differenzial, 174, 189 Differenzialgleichung erster Ordnung, 253 differenzierbar, 174, 189 Divergenz, 161 327 / 327 Dreiecksungleichung, 39, 41 duale, 29 duale Basis, 27 Dualraum, 27 Einheitsvektor, 49 elektrische Potenzial, 164 elektrisches Feld, 166 entgegengesetzte, 10 Euklidische Metrik, 42 Euklidische Norm, 47 Euklidischer Vektorraum, 33 Flächen, 241 Fourier-Reihe, 313 gewöhnliche DGL n-ter Ordung, 280 gleich orientiert, 7 Gradient, 159 Graph, 242 Grenzwert, 43, 127 327 / 327 harmonische Funktionen, 162 Hauptachsen, 79 Hauptachsentransformation, 79 Hausdorffsch, 132, 143 Hermitesche, 70 Hermitesche Form, 55 Hermitescher Vektorraum, 56 Hessematrix, 212 Hilbertbasis, 109 Hilbertraum, 87 Homöomorphismus, 240 Hyperflächen, 241 im Punkt x ∈ X stetig, 43 Immersion, 228 in Richtung v differenzierbar, 152 indefinit, 213 induzierte Topologie, 239 Inneres, 125 327 / 327 isolierten, 198 Jordanblöcke, 277 k-mal partiell differenzierbar, 155 k-mal stetig differenzierbar, 155 k-ter Fourier-Koeffizient, 313 kanonische (Hermitesche) Skalarprodukt, 57 kanonische Hilbertbasis, 109 kanonische Skalarprodukt, 34 kompakt, 132, 143 konjugiert-linear, 55 Kontraktion, 265 konvergent, 43, 127 Kraft, 165 Kreuzprodukt, 167 Kugel, 126 Länge, 35 Lösung, 253, 257, 280 Lagrangemultiplikatoren, 250 327 / 327 Laplace-Operator, 162 Linearformen, 26 Lipschitzkonstanten, 259 lokale Extrema, 198 lokale Parametrisierung, 241 lokales Maximum, 198 lokales Minimum, 198 m-dimensionale C k -Untermannigfaltigkeit, 241 maximal, 115 Maximumsnorm, 47 Metrik, 41 multilinear, 25 multilineare Formen, 26 n-tes Fourier-Polynom, 313 negativ definit, 213 Newtonsche Gravitationsfeld, 165 Newtonsche Gravitationspotenzial, 164 nicht entartet, 31 327 / 327 Niveaumengen, 196 Norm, 39 normal, 81 normierter Vektorraum, 39 obere Schranke, 115 offen, 124 Operatornorm, 120 Ordnungsrelation, 115 Orientierung, 10 orientierungserhaltend, 10 orientierungsumkehrend, 10 orthogonal, 54 orthogonale Gruppe, 54 orthogonale Komplement, 49 orthogonale Projektion, 102 Orthonormalbasis, 49 Parallelepipeds, 170 Parallelogrammgleichung, 44 327 / 327 Parsevalsche Gleichung, 110, 118 partiell differenzierbar, 153, 161 partielle Ableitung, 153 positiv definit, 33, 56, 213 positiv semi-definit, 213 Potenzialgleichung, 162 Rand, 125 Rang, 228 Relation, 8 Resonanzkatastrophe, 293 Rotation, 171 schiefsymmetrisch, 31 selbstadjungiert, 70 senkrecht, 38 separabel, 101 Spatprodukt, 170 Spats, 170 Sphäre, 126 327 / 327 stetig, 43, 127 stetig in x, 127 Submersion, 228 symmetrisch, 31 symmetrische, 70 System von n gewöhnlichen DGLn erster Ordnung, 257 Tangentialvektor, 247 Topologie, 124 topologischer Raum, 124 total, 115 Trägheitssatz von Sylvester, 79 trigonometrisches Polynom, 327 Umgebung, 124 umgekehrte, 10 unitär, 62 unitäre, 56, 61 unitäre Gruppe, 62 Variation der Konstanten, 273 327 / 327 Vektorfeld, 161 Vektorprodukt, 167 Vervollständigung, 97 vollständig, 87 Volumen, 170 von der Klasse C k , 228 Winkel, 38 327 / 327