Analysis B Vorlesung an der Leibniz Universität Hannover Sommersemester 2011 Elmar Schrohe Institut für Analysis Leibniz Universität Hannover Welfengarten 1 30167 Hannover Inhaltsverzeichnis 9 Differentialrechnung im Rn 3 10 Kurven 16 11 Kurvenintegrale, Vektorfelder und Potentiale 18 12 Gewöhnliche Differentialgleichungen 21 13 Norm von Matrizen. Exponentialabbildung 30 14 Lineare Differentialgleichungen 34 15 Riemann-Integral 38 16 Integration über Flächen. Der Gaußsche Integralsatz 45 2 9 Differentialrechnung im Rn Normen Es seien (x1 , x2 , x3 ) und (y1 , y2 , y3 ) zwei Punkte in R3 . Dann ist ihr Abstand nach dem Satz des Pythagoras p (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 . p Insbesondere ist der Abstand des Punktes (x1 , x2 , x3 ) zum Ursprung (0, 0, 0) gerade x21 + x22 + x23 . 9.1 Definition. Es sei x = (x1 , . . . , xn ) ∈ Rn . Wir nennen q kxk = x21 + . . . + x2n die (euklidische) Norm von x. Der Abstand zweier Punkte x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) ist dann gerade kx − yk. Die euklidische Norm hat folgende Eigenschaften (N1) Es ist kxk ≥ 0 für jedes x. Ferner ist kxk = 0 ⇔ x = 0. (N2) kcxk = |c|kxk für x ∈ Rn und c ∈ R. (N3) kx + yk ≤ kxk + kyk für alle x, y. Allgemeiner: Eine Norm auf einem K-Vektorraum V (K = R oder C) ist eine Abbildung V ∋ v 7→ kvk ∈ R≥0 mit den Eigenschaften (N1), (N2), (N3). Für die Euklidische Norm gilt |xj | ≤ kxk ≤ |x1 | + . . . + |xn |, j = 1, . . . , n. (1) Das Skalarprodukt hx, yi der Vektoren x und y in Rn ist gegeben durch hx, yi = n X xj y j . j=1 Hier gilt: (SP1) hcx + dy, zi = chx, zi + dhy, zi, c, d ∈ R, x, y, z ∈ Rn . (SP2) hx, yi = hy, xi (SP3) hx, xi ist reell und ≥ 0; hx, xi = 0 ⇔ x = 0. Es gilt kxk = p hx, xi. Auch den Begriff des Skalarprodukts kann man auf K-Vektorräume verallgemeinern. Man fordert dann im Fall K = R die Eigenschaften (SP1), (SP2), (SP3). Für K = C ersetzt man (SP2) durch hx, yi = hy, xi (konjugiert komplex). Ein Beispiel ist dann gegeben durch hz, wi = X 3 zj wj . (2) Folgen in Rn 9.2 Grenzwerte. Es sei a ∈ Rn und (ak ) eine Folge in Rn , d.h. jedes ak ist ein n-Vektor ak = (ak1 , . . . , akn ). Wir schreiben lim ak = a oder ak → a, falls gilt: Zu jedem ε > 0 existiert ein n0 mit kak − ak ≤ ε für alle k ≥ n0 . 9.3 Satz. Mit obigen Bezeichnungen ist äquivalent (i) (ii) ak → a Für j = 1, . . . , n gilt akj → aj . In diesem Fall ist lim ak = (lim ak1 , . . . , lim akn ). Beweis. Folgt aus 9.1(1). ⊳ 9.4 Definition. Es sei U ⊆ Rn , r > 0 und x ∈ Rn . (a) (b) Mit B(x, r) = {y ∈ Rn : kx − yk < r} bezeichnen wir die offene Kugel mit Radius r um x. Wir nennen eine Teilmenge U von Rn offen, falls zu jedem x ∈ U ein ε > 0 existiert so dass B(x, ε) ⊆ U gilt. (Intuitiv: Wir können von x aus in jeder Richtung ein kleines Stück weitergehen, ohne U zu verlassen.) Beachte: Die offene Kugel B(x, r) ist offen. Partielle Ableitungen Im Folgenden sei U ⊆ Rn offen und f : U → Rm eine Funktion. Sie ordnet jedem x ∈ U ein m−Tupel f (x) = (f1 (x), . . . , fm (x)) zu. Durch x 7→ f1 (x), . . . , x 7→ fm (x) werden dann m Funktionen f1 , . . . , fm von U nach R definiert, die sogenannten Komponentenfunktionen von f . 9.5 Beispiel. Es sei f : R3 → R2 definiert durch f (x1 , x2 , x3 ) = (sin(x1 + x2 ), x1 + 2x3 ). Dann hat f die Komponentenfunktionen f1 , f2 : R3 → R gegeben durch f1 (x) = sin(x1 + x2 ) f2 (x) = x1 + 2x3 . Es ist eigentlich besser (aber oft unpraktisch), die Vektoren vertikal zu schreiben, also x1 sin(x1 + x2 ) f x2 = . x1 + 2x3 x3 4 (1) 9.6 Partielle Ableitung. Es sei x ∈ U und ej = (0, . . . , 0, 1, 0, . . . , 0) der j−te Einheitsvektor. Wir nennen f in x in die j-te Koordinatenrichtung differenzierbar“ oder nach xj partiell ” ” differenzierbar“, falls der Grenzwert f (x + hej ) − f (x) h f (x1 , . . . , xj−1 , xj + h, xj+1 , . . . , xn ) − f (x1 , . . . , xn ) = lim h→0 h ∂f (x) = ∂xj lim h→0 ( partielle Ableitung von f nach xj in x“) existiert. Man schreibt auch ∂xj f (x), manchmal sogar ” fxj (x). Ist f in jedem Punkt partiell nach xj differenzierbar, so heißt f auf U partiell nach xj differenzierbar. Ist f in alle Koordinatenrichtungen (j = 1, . . . , n) partiell differenzierbar, so heißt f partiell differenzierbar in x bzw. in U . Sind die partiellen Ableitungen stetig, so heißt f stetig partiell 2f differenzierbar. Ebenso definiert man k-fache partielle Differenzierbarkeit z.B. ∂x∂2 ∂x (x). 1 9.7 Satz. Genau dann ist f in x nach xj differenzierbar, wenn jede Komponentenfunktion fi , i = 1 . . . m, in x nach xj differenzierbar ist. In diesem Fall ist ∂f 1 ∂x. j ∂f . = . ∂xj ∂f m ∂xj Beweis. Folgt aus Satz 9.3. ⊳ 9.8 Bemerkung. Es sei fi eine Komponentenfunktion von f. Wählt man die xk , k 6= j fest und betrachtet die Funktion g(t) = fi (x1 , . . . , xj−1 , t, xj+1 , . . . , xn ) die für t nahe bei xj definiert ist, so gilt – falls der Grenzwert existiert – ∂fi (x) = g ′ (xj ). ∂xj Die partielle Ableitung einer Komponentenfunktion ist also eine gewöhnliche Ableitung bei festgehaltenen anderen Variablen. 9.9 Beispiel. Für die Funktion aus Beispiel 9.5 ist ∂f cos(x1 + x2 ) (x) = 1 ∂x1 ∂f cos(x1 + x2 ) (x) = 0 ∂x2 ∂f 0 (x) = . 2 ∂x3 5 Sofort sehen wir, dass die partiellen Ableitungen selbst wieder partiell differenzierbar sind (sogar beliebig oft). Wir haben z.B. ∂f ∂f ∂ ∂ (x) = 0 = (x). ∂x1 ∂x3 ∂x3 ∂x1 P 9.10 Beispiel. r : Rn → R, r(x) = ( nk=1 x2k )1/2 = kxk. Dann ist r auf Rn \ {0} stetig partiell differenzierbar, mit xj 1 X 2 −1/2 ∂r · 2xj = . = ( xk ) ∂xj 2 r 9.11 Gradient, Divergenz, Rotation, Laplaceoperator, Wärmeleitung, Wellen. (a) (b) Es sei f : U → R (m = 1!) partiell differenzierbar. Dann heißt ∂f ∂f (x) . . . (x) ∈ Rn grad f (x) = ∂x1 ∂xn der Gradient von f . Manchmal schreibt man auch ∇f (x) Nabla f“. Die Funktion grad f : ” U → R ordnet jedem Punkt x ∈ U ⊆ Rn den Vektor grad f (x) ∈ Rn zu. Ganz allgemein nennt man eine Funktion g : U ⊆ Rn → Rn ein Vektorfeld. Ist g : U ⊆ Rn → Rn (m = n!) ein partiell differenzierbares Vektorfeld, so heißt div g = Pn ∂gj j=1 ∂xj die Divergenz von g in x. Formal ist div g = h∇, gi, (c) wobei ∇ als der Vektor“ ( ∂x∂ 1 , . . . , ∂x∂ n ) interpretiert wird. ” Ist g : U ⊆ R3 → R3 ein partiell differenzierbares Vektorfeld, so heißt ∂g2 ∂g1 ∂g3 ∂g2 ∂g1 ∂g3 − , − , − rot g = ∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2 die Rotation von g in x (Englisch: curl g). Formal ist rot g = ∇ × g. (d) Für f : U → R (oder C) zweimal stetig partiell differenzierbar setzt man ∆f = n X ∂2f j=1 und nennt ∆ = (e) Pn ∂2 j=1 ∂x2j ∂x2j den Laplace-Operator. Wichtigster Operator der Math. Physik. Beachte: ∆ = div grad. Die Gleichung ∆f = 0 heißt Laplacegleichung; ihre Lösungen harmonische Funktionen. Die inhomogene Gleichung ∆f = g (bei gegebenem g und gesuchtem f heißt meist Potentialgleichung. Beispiel: ∆E = 4πρ (E elektrisches Potential, ρ Ladungsdichte) ist die Gleichung für das elektrische Feld bei gegebener Ladungsverteilung. 6 (f) Weiterhin sei I ⊆ R ein Intervall. Für Funktionen f : U × I → R heißt 1 ∂f − ∆x f = 0 k ∂t P die Wärmeleitungsgleichung; hier bedeutet ∆x = nj=1 ∂2 ∂x2j und k ≥ 0 ist die Leitfähigkeit. 1 ∂2f − ∆x f = 0 c2 ∂t2 ist die Wellengleichung; c ist die Ausbreitungsgeschwindigkeit. WARNUNG: Sind die Variablen x und t, und kommt ein ∆ vor, so versteht man die Gleichung meist so, dass ∆ nur bzgl. der x-Variablen wirkt. 9.12 Satz. (Satz von Schwarz). Ist f : U ⊆ Rn → Cm zweimal stetig partiell differenzierbar, so ist ∂xj ∂xk f (x) = ∂xk ∂xj f (x), x ∈ U ; man kann also die Reihenfolge der partiellen Ableitungen vertauschen. Mehrfache Anwendung des Satzes zeigt, dass man für eine ℓ-mal stetig partiell differenzierbare Funktionen die Reihenfolge für ℓ partielle Ableitungen vertauschen kann. 9.13 Richtungsableitung. Ist v ein beliebiger Vektor in Rn , so ist die partielle Ableitung von f nach v in x f (x + hv) − f (x) ∂f (x) = lim , h→0 ∂v h sofern der Limes existiert. 9.14 Schwäche der partiellen Ableitung. Auf D ⊆ R differenzierbare Funktionen sind stetig (Folgerung 6.3). Partiell differenzierbare Funktionen sind jedoch u.U. nicht stetig. Man führt daher einen stärkeren Ableitungsbegriff ein. Totale Differenzierbarkeit 9.15 Definition. Es sei U ⊂ Rn offen. Eine Funktion f : U ⊂ Rn → Rm heißt in x ∈ U total differenzierbar, falls eine (von x abhängige) lineare Abbildung A : Rn → Rm existiert, so dass für alle h mit khk < ε (ε wie in 9.4) gilt: f (x + h) = f (x) + Ah + ϕ(h), wobei ϕ : {h : khk < ε} → Rm eine Funktion ist mit ϕ(h) = 0. khk→0 khk lim (1) Die lineare Abbildung A ist die Ableitung von f in x. Schreibe A = f ′ (x). Man nennt f (total) differenzierbar auf U , falls f in jedem Punkt x ∈ U (total) differenzierbar ist. Klar: A ist gegeben durch Matrix in Matmn (R) “Jacobi-Matrix”. Wie sieht diese Matrix aus? 7 9.16 Satz. Für f : U → Rm und x ∈ U ist äquivalent (i) (ii) f total differenzierbar in x; alle Komponentenfunktionen fi , i = 1, . . . , m, sind total differenzierbar In diesem Fall ist f stetig. Ferner ist f in alle Koordinatenrichtungen partiell differenzierbar, und für die Jacobi-Matrix A = (aij ), die f ′ (x) darstellt, gilt aij = ∂fi (x). ∂xj Beweis. – ⊳ Nicht jede partiell differenzierbare Funktion ist auch total differenzierbar. Es gilt jedoch folgender Satz: 9.17 Satz. Folgendes ist äquivalent: (i) (ii) f ist auf U stetig total differenzierbar, d.h., f ist in jedem Punkt x ∈ U total differenzierbar, und die (matrixwertige) Funktion x 7→ f ′ (x) ist stetig. f ist auf U stetig partiell differenzierbar, d.h., f ist in jedem Punkt x ∈ U partiell diffe∂f (x) sind stetig. renzierbar, und die Funktionen x 7→ ∂x j 9.18 Satz (Kettenregel). Es seien U ⊆ Rn und V ⊆ Rk offen, f : U → Cm , g : V → Rn Abbildungen mit g(V ) ⊆ U . Ist g differenzierbar in x ∈ V und f differenzierbar in g(x) ∈ U , so ist f ◦ g : V → Cm differenzierbar in x, und es gilt (f ◦ g)′ (x) = f ′ (g(x)) ◦ g ′ (x), wobei ◦ auf der rechten Seite die Komposition von linearen Abbildungen/Matrizen bedeutet. Insbesondere ergibt sich die Formel n X ∂fi ∂gk ∂ (g(x)) (f ◦ g)i (x) = (x). ∂xj ∂xk ∂xj k=1 Beweis. Für y = g(x) schreibe f (y + h) = f (y) + Ah + ϕ(h) und g(x + h) = g(x) + Bh + ψ(h) mit A = f ′ (y), B = g′ (x). Dann ist (f ◦ g)(x + h) = f (g(x + h)) = f (g(x) + Bh + ψ(h)) = f ◦ g(x) + ABh + Aψ(h) + ϕ(Bh + ψ(h)). Zeige noch: Aψ(h) + ϕ(Bh + ψ(h)) = o(khk): Zunächst ist ψ(h) kAψ(h)k ψ(h) = A khk ≤ kAk khk → 0. khk Nun zu ϕ(Bh + ψ(h)). Für alle h 6= 0 mit Bh + ψ(h) = 0 ist nichts zu zeigen. Stets ist kBh + ψ(h)k ≤ kBkkhk + ψ(h) khk khk → 0. Es folgt: kϕ(Bh + ψ(h))k kBh + ψ(h)k kϕ(Bh + ψ(h))k ψ(h) kϕ(Bh + ψ(h))k = ≤ kBk + −→ 0. khk kBh + ψ(h)k khk kBh + ψ(h)k khk ⊳ 8 9.19 Folgerung. Es sei U ⊆ Rn offen, x ∈ U, v ∈ Rn und f : U → R(!) differenzierbar in x. Dann gilt ∂f (x) = hgrad f (x), vi. ∂v Nach der Cauchy-Schwarzschen Ungleichung ist stets |hgrad f (x), vi| ≤ kgrad f (x)k kvk, wobei Gleichheit nur bei linearer Abhängigkeit von grad f (x) und v gilt. Es folgt: Unter allen v mit kvk = 1 wird ∂f ∂v (x) maximal für das (eindeutig bestimmte) v, das in Richtung von grad f (x) zeigt. Der Gradient gibt daher die Richtung des steilsten Anstiegs von f an. Beweis. Definiere die Funktion g : R → Rn durch g(t) = x + tv. Sie ist differenzierbar in 0 mit g′ (0) = v. Für hinreichend kleines ε > 0 ist x + tv ∈ U für alle |t| < ε. Nach 9.18 ist f ◦ g differenzierbar in 0, und es gilt f (x + tv) − f (x) ∂f (x) = lim = (f ◦ g)′ (0) = f ′ (g(0))g ′ (0) = f ′ (x) ◦ v = hgrad f (x), vi. t→0 ∂v t 9.20 Die Tangentialfläche an den Funktionsgraphen. Es sei f : U → R total differenzierbar in x ∈ U . Der Graph von f ist die Menge Gf = {(y, f (y)) : y ∈ U } ⊆ Rn+1 . Die Identität f (x + h) = f (x) + f ′ (x)h + ϕ(h) können wir umschreiben (y = x + h) f (y) = f (x) + f ′ (x)(y − x) + ϕ(y − x). Da f Werte in R annimmt, kann man statt f ′ (x)(y − x) auch hgradf (x), y − xi schreiben. Dass ϕ(h)/khk gegen 0 konvergiert, besagt, dass f nahe x gut durch die affin-lineare Funktion l(y) = f (x) + hgradf (x), y − xi genähert werden kann. Den Graphen Gl = {(y, l(y)) : y ∈ Rn } ⊆ Rn+1 von l nennt man die n-dimensionale Tangentialfläche an den Graphen von u in x. 9.21 Satz (Hauptsatz der Differential- und Integralrechnung). Es sei U ⊆ Rn offen und f : U → Rm stetig differenzierbar. Ferner sei x ∈ U und h ∈ Rn so klein, dass x + th ∈ U für alle t ∈ [0, 1]. Dann gilt Z 1 f ′ (x + th) dt · h. (1) f (x + h) − f (x) = 0 Beachte die Kurzschreibweise: f ′ (x) = (∂x1 f (x), . . . , ∂xn f (x)), und h = (h1 , . . . , hn ). Beweis. Wir definieren die Funktion g : [0, 1] → Rm durch g(t) = f (x + th). Dann gilt nach der Kettenregel g′ (t) = f ′ (x + th)h. Folglich Z 1 Z 1 ′ f ′ (x + th) dt · h. g (t) dt = f (x + h) − f (x) = g(1) − g(0) = 0 0 ⊳ 9 9.22 Folgerung (Schrankensatz). Unter den Voraussetzungen von Satz 9.21 sei zusätzlich kf ′ (x + th)k ≤ M für alle 0 ≤ t ≤ 1. Dann folgt aus 9.21(1), dass kf (x + h) − f (x)k ≤ M khk. 9.23 Multi-Indizes. Es sei α = (α1 , . . . , αn ) ∈ Nn0 . Wir setzen |α| = α1 + α2 + . . . + αn : Länge des Multi-Index, α! = α1 ! · . . . · αn !. ∂xα f = ∂xα11 . . . ∂xαnn f , falls f |α|-mal stetig differenzierbar ist. Für x ∈ Rn setze xα = xα1 1 ·. . .·xαnn . 9.24 Satz (Taylorformel mit Restglied). Es sei f : U → Rm N -mal stetig differenzierbar. Dann gilt f (x + h) = N −1 X |α|=0 X NZ 1 ∂ α f (x) α h + (1 − t)N −1 ∂ α f (x + th) dt · hα . α! α! 0 |α|=N Beweis. Definiere g : [0, 1] → Rm durch g(t) = f (x + th). Nach der Taylorformel in R ist g(1) = N −1 X k=0 1 1 dk g(0) + k! dtk (N − 1)! Z 1 0 (1 − t)N −1 dN g(t) dt. dtN Dann folgt die Behauptung aus der leicht zu zeigenden Formel X k! dk ∂ α f (x + th)hα . g(t) = dtk α! |α|=k ⊳ 9.25 Definition. Es sei f : U → R zweimal stetig differenzierbar. Dann setzt man (Hess f )(x) = (∂xj ∂xk f (x))j,k=1,...,n Hessesche Matrix von f in x“: Symmetrische n × n-Matrix nach dem Satz von Schwarz. ” 9.26 Lemma. Es sei f : U → R zweimal stetig differenzierbar und x ∈ U . Dann gilt 1 f (x + h) = f (x) + hgrad f (x), hi + hHess f (x)h, hi + R3 (x, h), 2 (1) wobei R3 (x, h)/khk2 → 0 für h → 0. Beweis. Zunächst macht man sich klar, dass für reellwertige Funktionen (m = 1) gilt: X ∂ α f (x) hα = f (x) α! |α|=0 n X X ∂ α f (x) α ∂xj f (x)hj = hgradf (x), hi h = α! |α|=1 X ∂ α f (x) hα = α! |α|=2 j=1 1 hHess f (x)h, hi 2 Dann schätzt man den Fehler ab. ⊳ 10 9.27 Definition. Es sei U ⊆ Rn offen und f : U → R eine Funktion. Man nennt x ∈ U ein lokales Maximum für f , falls (1) f (x) ≥ f (y) für alle y in einer Umgebung von x Analog heißt x lokales Minimum, falls (2) f (x) ≤ f (y) für alle y in einer Umgebung von x. Extremum ist der Oberbegriff für Maximum oder Minimum. Man spricht von einem isolierten Maximum/Minimum/Extremum, falls Gleichheit in (1) bzw. (2) nur für x = y gilt. 9.28 Satz. Es sei U ⊆ Rn offen, f : U → R partiell differenzierbar und x lokales Extremum für f . Dann ist grad f (x) = 0. Beweis. Für j = 1, . . . , n betrachte g(t) = f (x+tej ). Da U offen ist, ist g für −ε < t < ε definiert. Die Funktion g ist differenzierbar nach der Kettenregel und hat in 0 ein lokales Extremum. Es folgt: ∂xj f (x) = g ′ (0) = 0. ⊳ 9.29 Definition. Es sei A selbstadjungierte Matrix. Dann ist hAx, xi = hx, Axi = hAx, xi, somit hAx, xi ∈ R. Man nennt A • positiv definit, falls hAx, xi > 0 ∀ x 6= 0 • negativ definit, falls hAx, xi < 0 ∀ x 6= 0 • indefinit, falls es sowohl ein x mit hAx, xi > 0 als auch ein y mit hAy, yi < 0 gibt. Beispiel: • A = Id positiv definit: hAx, xi = hx, xi = kxk2 > 0 ∀ x 6= 0 • A = −Id negativ definit: hAx, xi = h−x, xi = −kxk2 < 0 ∀ x 6= 0. 9.30 Definitheit und Eigenwerte. Eine selbstadjungierte Matrix ist diagonalisierbar mit reellen Eigenwerten nach einem Satz der Linearen Algebra. Dann gilt: • A positiv definit ⇔ alle Eigenwerte > 0. • A negativ definit ⇔ alle Eigenwerte < 0. • A indefinit ⇔ es gibt sowohl positive als auch negative Eigenwerte. 9.31 Hurwitz-Kriterium. Es sei A = (aij )i,j=1,...,n eine reelle, symmetrische n × n-Matrix. Dann gilt: A positiv definit ⇔ det (aij )1≤i,j≤k > 0, k = 1, . . . , n. 9.32 Satz. Es sei U ⊆ Rn offen, f : U → R zweimal stetig differenzierbar und x ∈ U mit grad f (x) = 0. 11 (a) (b) Ist (Hess f )(x) positiv/negativ definit, so hat f in x ein isoliertes Minimum/Maximum. Ist (Hess f )(x) indefinit, so hat f in x kein lokales Extremum. Beweis. Nach 9.26 ist 1 f (x + h) = f (x) + hgrad f (x), hi + hHess f (x)h, hi + R3 (x, h), 2 wobei lim R3 (x, h)/khk2 = 0. (1) h→0 Hier ist grad f (x) = 0. Ist Hess f (x) positiv definiert und λ > 0 der kleinste Eigenwert, so ist hHess f (x)h, hi ≥ λ khk2 . Andererseits existiert wegen (1) ein δ > 0 mit |R3 (x, h)| < λ khk2 , 4 falls khk < δ. Es folgt: f (x + h) > f (x) + λ khk2 > f (x), 4 khk < δ. Analog schließen wir für negativ definites Hess f (x). (b) Wähle eine Eigenvektor h+ zu einem positiven Eigenwert λ+ , und einen Eigenvektor h− zu einem negativen Eigenwert λ− , von Hess f (x) mit kh± k = 1. Dann ist hHess f (x)h+ , h+ i = λ+ kh+ k2 = λ+ und hHess f (x)h− , h− i = λ− . Für t → 0 betrachte f (x + th+ ) und f (x + th− ). Es gilt f (x + th± ) − f (x) = λ± t2 + o(t2 ). Für kleines t ist dieser Ausdruck positiv bei “+” und negativ bei “–”. ⊳ Lokale Invertierbarkeit und Lösen von Gleichungen 9.33 Definition. Eine Abbildung f : U → V zwischen zwei offenen Teilmengen U, V ⊂ Rn heißt (C 1 -)Diffeomorphismus, falls f bijektiv ist und sowohl f als auch die Umkehrabbildung f −1 stetig differenzierbar sind. 9.34 Lemma. Ist f : U → V ein Diffeomorphismus, so ist f ′ (x) invertierbar für jedes x ∈ U und (f −1 )′ (f (x)) = (f ′ (x))−1 . ⊳ Beweis. Die Identität f −1 (f (x)) = x liefert beim Ableiten: (f −1 )′ (f (x)) ◦ f ′ (x) = Id. 9.35 Frage. Wäre es sinnvoll, den Begiff des Diffeomorphismus f : U → V für U ⊆ Rn und V ⊆ Rk einzuführen? Antwort: Nein, denn wie oben wäre f ′ (x) invertierbar. Dies geht nur für k = n. ⊳ 12 9.36 Satz von der lokalen Invertierbarkeit. Es sei U ⊆ Rn offen und f : U → Rn stetig differenzierbar. Ferner sei a ∈ U und f ′ (a) invertierbar. Dann gibt es offene Umgebungen V (⊆ U ) von a und V ′ von f (a) in Rn mit folgenden Eigenschaften (i) (ii) f : V → V ′ ist bijektiv. Die Umkehrabbildung g = f −1 : V ′ → V ist ebenfalls differenzierbar, und (vgl. Satz 6.7) −1 g′ (f (a)) = f ′ (a) . (1) Die Einschränkung von f auf V ist also ein Diffeomorphismus (‘f ist lokal ein Diffeomorphismus’). Bemerkung: Zeigt man die Differenzierbarkeit von g, so folgt (1) sofort wie in 9.34. 9.37 Beispiel. Die Polarkoordinatenabbildung in R2 . Wir betrachten die Abbildung f : R>0 × R → R2 , Hier ist f ′ (r, ϕ) = f (r, ϕ) = (r cos ϕ, r sin ϕ) cos ϕ −r sin ϕ sin ϕ r cos ϕ . Die Matrix ist stets invertierbar, denn det f ′ (r, ϕ) = r > 0. Also ist für jeden Wert von (r, ϕ) ∈ R>0 × R die Abbildung f lokal invertierbar; es ist cos ϕ sin ϕ −1 ′ ′ −1 . (1) (f ) (f (r, ϕ)) = (f (r, ϕ)) = − sinr ϕ cosr ϕ p Setzt man x = f1 (r, ϕ) = r cos ϕ, y = f2 (r, ϕ) = r sin ϕ, so ist f −1 (r, ϕ) = (x, y), r = x2 + y 2 , cos ϕ = xr , sin ϕ = yr und (1) schreibt sich ! √ x √ y 2 2 2 2 x +y x +y (f −1 )′ (x, y) = . y x − x2 +y 2 x2 +y 2 Beachte: Die Abbildung f ist jedoch nicht injektiv (also nicht überall invertierbar), da für alle (r, ϕ) gilt: f (r, ϕ) = f (r, ϕ + 2π). 9.38 Implizite Funktionen. Viele Beziehungen zwischen Größen x und y in den Naturwissenschaften sind als explizite Funktionen gegeben, d.h. von der Form y = f (x). Manchmal hat man jedoch lediglich eine Beziehung der Form F (x1 , . . . , xn ) = 0, wobei F : U ⊆ Rn → Rm eine gegebene Funktion ist, m ≤ n, d.h. man hat m Gleichungen für die n Unbekannten x1 , . . . , xn . Frage: Kann man m der Unbekannten daraus bestimmen? D.h., kann man die Menge L = {x ∈ U : F (x) = 0} darstellen in der Form L = {(y, g(y)) : y ∈ U ′ } für ein geeignetes U ′ ⊆ Rn−m ? 9.39 Beispiel. Global geht das in der Regel nicht. Für F (x, y) = x − y 2 ist die Menge L = {(x, y) : F (x, y) = 0} eine (liegende) Parabel. Wir können x global als Funktion von y darstellen: L = {(x, y) : y ∈ R, x = y 2 } = {(y 2 , y) : y ∈ R}, aber es gibt keine Funktion g : U ′ → R mit L = {(x, g(x)) : x ∈ U ′ }, da wir zu x < 0 gar keine Lösung erhalten und zu x > 0 zwei: √ L = {(x, y) : y = ± x, x ≥ 0}. Aber lokal, in der Umgebung V = V1 × V2 eines Punktes (x0 , y0 ) √ mit x0 > 0 auf L können wir L als Graph darstellen, entweder durch L ∩ V = {(x, x) : x ∈ V1 } √ oder L ∩ V = {(x, − x) : x ∈ V1 }, je nachdem ob V2 ⊆ R>0 oder V2 ⊆ R<0 . 13 9.40 Satz (Satz über die implizite Funktion). Es sei U ⊆ Rk × Rm offen und F : U → Rm stetig differenzierbar. Für einen Punkt (a, b) ∈ U sei F (a, b) = 0 und die m × m-Matrix ∂F ∂y (a, b) k m invertierbar. Dann gibt es offene Umgebungen V1 ⊆ R von a und V2 ⊆ R von b sowie eine stetig differenzierbare Abbildung g : V1 → V2 mit F (x, g(x)) = 0. Ferner gilt: Ist (x, y) ∈ V1 × V2 mit F (x, y) = 0, so ist y = g(x) (d. h. die Gleichung ist eindeutig nach y auflösbar). Es gilt ∂g (x) = − ∂x −1 ∂F ∂F (x, g(x)) (x, g(x)). ∂y ∂x (1) 9.41 Beispiel. Wir betrachten die 2 Gleichungen mit 3 Unbekannten x2 + y 2 + (z − 1)2 = 9 2 2 2 x + y + (z + 1) = 9. (1) (2) Sie beschreiben die Schnittmenge zweier Kugeln mit Radius 3 um (0, 0, 1) bzw. (0, 0, −1). Aus (1) und (2) erhalten wir (Differenz) sofort z = 0 und dann x2 +y 2 = 8. Die Menge L = √ {(x, y, z) : F (x, y, z) = 0} ist also der Kreis um den Ursprung in der (x, y)-Ebene mit Radius 8. √ √ Lokal können wir√die Punkte aus L als Graph über x (für − 8 < x < 8) bzw. über y darstellen √ (für − 8 < y < 8); nie als Funktion von z. Was sagt der Satz von der impliziten Funktion? Hier ist 2 x + y 2 + (z − 1)2 − 9 F (x, y, z) = x2 + y 2 + (z + 1)2 − 9 und ′ F (x, y, z) = 2x 2y 2(z − 1) . 2x 2y 2(z + 1) Die erste und die zweite Spalte von F ′ sind linear abhängig. Die zweite und die dritte Spalte sind linear unabhängig, falls y 6= 0; die erste und dritte Spalte sind linear unabhängig, falls x 6= 0; Nach dem Satz √ können wir also lokal y und z als Funktion von x darstellen, sofern y 6= 0 (d.h. x 6= ± 8; das ist die Standard-Variante). Andererseits kommt es auf die Reihenfolge der Variablen nicht an. Wir können alternativ x und z als Funktion von y darstellen, sofern x 6= 0. 9.42 Satz (Extrema unter Nebenbedingungen). Sei U ⊆ Rn offen, g : U → Rk stetig differenzierbar, M = {x ∈ U : g(x) = 0} und a = (a1 , . . . , an ) ∈ M ein Punkt mit Rang(g ′ (a)) = k (also maximal). Ferner sei f : U → R eine stetig differenzierbare Funktion, die in a ein lokales Extremum unter der Nebenbedingung g(x) = 0 einnimmt. (Das heißt, es gibt eine Umgebung U von a derart, dass entweder f (a) ≤ f (x) ∀x ∈ M ∩ U oder f (a) ≥ f (x) ∀x ∈ M ∩ U .) Dann existiert λ = (λ1 , . . . , λk ) (die λk heißen Lagrangesche Multiplikatoren) so, dass grad f (a) = λ g′ (a). 14 9.43 Bemerkung. Wann sind wir sicher, dass f auf M ein Extremum hat? In Analysis A hatten wir gesehen, dass eine stetige Funktion auf einem Intervall [a, b], a, b ∈ R, ihr Maximum und ihr Minimum annimmt. Die Verallgemeinerung für höhere Dimensionen lautet: Eine stetige Funktion auf einer kompakten Menge nimmt ihr Maximum und ihr Minimum an. Dabei ist eine Teilmenge des Rn kompakt, wenn sie abgeschlossen und beschränkt ist. Abgeschlossen nennt man eine Menge, wenn ihr Komplement offen ist. Eine Nullstellenmenge einer stetigen Funktion wie in Satz 9.42 ist stets abgeschlossen. Ebenso ist eine Menge der Form {x ∈ Rn : h(x) ≤ 0} mit stetigem h abgeschlossen. Beschränkt heißt sie, wenn sie in einer großen Kugel B(0, R), R groß, enthalten ist. Unter den Voraussetzungen von Satz 9.42 ist also nur noch Beschränktheit nachzuprüfen. 9.44 Beispiel. f : R3 → R, f (x, y, z) = x + y + z, g : R3 → R, g(x, y, z) = (x2 + y 2 − 1, z). Klar: f, g sind stetig differenzierbar. Die Menge M = {(x, y, z) : g(x, y, z) = 0} ist gerade der Einheitskreis in der (x, y)-Ebene, insbesondere also beschränkt. Ferner 2x 2y 0 ′ g (x, y, z) = . 0 0 1 Nach Bemerkung 9.43 wissen wir, dass f auf M ein Maximum und ein Minimum hat. Auf M hat g ′ den Rang 2, da wegen x2 + y 2 = 1 stets x 6= 0 oder y 6= 0. Nach 9.42 existiert λ = (λ1 , λ2 ) mit grad f (a) = λ g′ (a) also (1, 1, 1) = (λ1 · 2x, λ1 · 2y, λ2 ). Es folgt 2xλ1 = 1 (1) 2yλ1 = 1 (2) λ2 = 1. (3) x2 + y 2 = 1 (4) z = 0. (5) Ferner ist wegen der Nebenbedingung √ Wegen (1) ist λ1 6= 0, (1) und (2) liefern dann x = y, (4) liefert dann x = y = ± 21 2, (5) √ √ √ √ liefert z = 0. Wir haben also zwei Kandidaten: a1 = ( 21 2, 12 2, 0) und a2 = (− 21 2, − 12 2, 0). √ √ Einsetzen liefert f (a1 ) = 2, f (a2 ) = − 2. Somit ist a1 das Maximum und a2 das Minmum von f unter der Nebenbedingung g. 15 10 Kurven Im Folgenden sei D ⊆ R ein Intervall. 10.1 Definition. (a) (b) (c) Eine stetige Abbildung f : D → Rn heißt auch Kurve in Rn . Ist f in t ∈ D differenzierbar, so heißt f ′ (t) ∈ Rn Tangentialvektor an die Kurve f in t. Ist f differenzierbar und f ′ (t0 ) = 0, so heißt t0 singulärer Punkt. Sind alle Punkte nichtsingulär, so heißt f reguläre Kurve. 10.2 Beispiele. (a) (b) (c) (d) Seien a, b > 0. Definiere f : [0, 2π] → R2 , f (t) = (a cos t, b sin t) Ellipse mit Halbachsen a und b. Tangentialvektor f ′ (t) = (−r sin t, r cos t). Regulär. Sei a ∈ Rn , v ∈ Rn \ {0}. Definiere f : R → Rn , f (t) = a + vt. Gerade durch a mit Richtungsvektor (=Tangentialvektor) v. Regulär. Sei r > 0, c ∈ R \ {0}. Definiere f : R → R3 , f (t) = (r cos t, r sin t, ct) Schraubenlinie. Regulär. Sei ϕ : D → R stetig differenzierbare Funktion. Definiere f : D → R2 durch f (t) = (t, ϕ(t)). Graph der Kurve. Regulär. 10.3 Schnittwinkel. Sind f : D1 → Rn , g : D2 → Rn zwei reguläre Kurven und ist f (t1 ) = g(t2 ) für geeignete t1 ∈ D1 , t2 ∈ D2 , so heißt die Zahl ϑ = arccos (f ′ (t1 ), g′ (t2 )) kf ′ (t1 )k kg ′ (t2 )k der Schnittwinkel von f und g im Punkt f (t1 ) = g(t2 ). 10.4 Rektifizierbarkeit, Länge. Es sei f : [a, b] → Rn eine Kurve und a = t0 < t1 < . . . < tN = b eine Partition von [a, b]. Dann ist Pol (f ; t0 , . . . , tN ) = N X j=1 kf (tj ) − f (tj−1 )k die Länge des Polygonzugs durch f (t0 ) . . . f (tk ). Man nennt f rektifizierbar mit Länge L = L(f ), falls gilt: Zu jedem ε > 0 existiert ein δ > 0, so daß für jede Partition a = t0 < . . . < tk = b der Feinheit < δ |L(f ) − Pol (f ; t0 , . . . , tN )| < ε. 10.5 Satz. Ist f : [a, b] → Rn stetig differenzierbar, so ist f rektifizierbar mit der Länge Z b kf ′ (t)k dt. L(f ) = a 16 Beweisidee. Man zeigt (relativ einfach), dass Z tj kf ′ (t)k dt ≤ 2 sup{kf ′ (tj ) − f ′ (t)k : t ∈ [tj−1 , tj ]}(tj − tj−1 ). kf (tj ) − f (tj−1 k − tj−1 Das supremum liegt dabei beliebig nahe an Null, falls die Feinheit der Zerlegung hinreichend klein ist. ⊳ 10.6 Beispiel. Seien r, α > 0. Betrachte f : [0, α] → R2 , f (t) = (r cos t, r sin t). Dann ist kf ′ (t)k = r für alle t nach 10.2(a), also Z α r dt = rα. L(f ) = 0 Speziell: α ist Bogenlänge im Einheitskreis von dem Punkt (1, 0) zu dem Punkt (cos α, sin α), bzw., komplex betrachtet, von 1 zu eiα . 10.7 Definition. Es sei f : [a, b] → Rn eine Kurve. Ist ϕ : [α, β] → [a, b] eine stetig differenzierbare Funktion und gilt ϕ : [α, β] → [a, b] −1 ϕ ist bijektiv : [a, b] → [α, β] ist stetig differenzierbar, so heißt ϕ Parametertransformation. Beachte: Weil ϕ und ϕ−1 stetig differenzierbar sind, ist ϕ′ (t) 6= 0 ∀t. Weil ϕ bijektiv ist, ist ϕ entweder monoton wachsend oder monoton fallend, also entweder ϕ′ > 0 und ϕ(α) = a, ϕ(β) = b (orientierungserhaltend) oder ϕ′ < 0 und ϕ(α) = b, ϕ(β) = a (orientierungsumkehrend). 10.8 Satz. Die Kurvenlänge ist von der Parametrisierung unabhängig, d. h., sind ϕ, f wie in 10.7 und F : [α, β] → Rn definiert durch F (t) = f (ϕ(t)), so gilt L(f ) = L(F ). Beweis. Nach der Kettenregel ist F ′ (t) = f ′ (ϕ(t)) ◦ ϕ′ (t), also für ϕ′ > 0: L(F ) = Z β α ′ kF (t)k dt = Z β α ′ ′ kf (t)kϕ (t) dt = Für ϕ′ < 0 analog. Z a b kf ′ (t)k dt = L(f ). ⊳ 10.9 Bemerkung. Tangentialvektor: Wegen (f ◦ ϕ)′ = (f ′ ◦ ϕ) · ϕ′ gilt: gleiche Richtung für orientierungserhaltendes ϕ, entgegengesetzte für orientierungsumkehrendes ϕ. Der Winkel zwischen zwei Kurven bleibt wegen obiger Identität gleich bei orientierungserhaltenden Parametertransformationen. 17 11 Kurvenintegrale, Vektorfelder und Potentiale 11.1 Definition/Erinnerung. (a) (b) Eine Funktion F : U ⊆ Rn → Rn heißt ein Vektorfeld. Eine Kurve γ : [a, b] → Rn heißt stückweise glatt, falls es eine Partition a = t0 < t1 . . . < tN = b von [a, b] gibt mit der Eigenschaft, dass γ|]tj−1 ,tj [ , j = 1, . . . , N , zu einer stetig differenzierbaren Funktion auf [tj−1 , tj ] fortsetzbar ist. 11.2 Definition. Es sei γ : [a, b] → Rn eine stückweise glatte Kurve mit Bild γ = Γ und F : Γ → Rn ein stetiges Vektorfeld. Wir definieren das Kurvenintegral von F über γ Z hF, dxi (1) γ durch Z γ hF, dxi = Dabei ist die Partition wie oben. k Z X j=1 tj tj−1 hF (γ(t)), γ ′ (t)i dt. 11.3 Bemerkung. R γ hF, dxi auch PR (a) Manchmal schreibt man statt (b) Motivation aus Mechanik, wo Arbeit gegen ein Kraftfeld entlang der Kurve geleistet wird. ~ Auf kleinen Stücken gilt W = F~ · dx γ Fi dxi . 11.4 Beispiel. In R2 sei F (x, y) = (1, 1) und γ : [0, π] → R2 gegeben durch γ(t) = (cos t, sin t). Dann ist Z π Z π Z − sin t + cos tdt = [cos t + sin t]|π0 = −2. h((1, 1), (− sin t, cos t)idt = hF, dxi = γ 0 0 R 11.5 Lemma und Bemerkung. Das Integral γ hF, dxi ist von der Kurvenparametrisierung unabhängig, solange die Orientierung erhalten bleibt. R R Man schreibt daher in (1) oft Γ statt γ und spricht von der orientierten Kurve Γ. Die Parametrisierung muss sich der Leser selbst suchen; eine geschickte Wahl spart viel Arbeit. Beweis. Ist ϕ : [c, d] → [a, b] bijektiv und differenzierbar mit ϕ(c) = a, ϕ(d) = b, so ist Z d Z d hF (γ(ϕ(s)), γ ′ (ϕ(s))iϕ′ (s) ds hF (γ · ϕ(s)), (γ ◦ ϕ)′ (s)i ds = c c Z b hF (γ(t)), γ ′ (t)i dt. = a Ändern wir die Orientierung (d.h. ϕ(c) = b, ϕ(d) = a), so kehrt sich das Vorzeichen um. ⊳ 11.6 Definition. Es sei U ⊆ Rn offen und F : U → Rn ein Vektorfeld. Man sagt, F habe das Potential oder auch die Stammfunktion V auf U , falls V : U → R eine partiell differenzierbare Funktion ist mit grad V = F . 18 11.7 Satz. Das Vektorfeld F : U → Rn habe das Potential V ∈ C 1 (U, R). Dann gilt für jede stückweise glatte Kurve γ : [a, b] → Rn mit Bild γ = Γ ⊆ U Z hF, dxi = V (γ(b)) − V (γ(a)) Γ (Potential am Endpunkt − Potential am Anfangspunkt). Beweis. O.B.d.A. γ glatt Z a Z b hF, dxi = Z = Z = b a b a b a hF (γ(t)), γ ′ (t)i dt hgrad V (γ(t)), γ ′ (t)i dt (V ◦ γ)′ (t) dt = V (γ(b)) − V (γ(a)). ⊳ 11.8 Folgerung. Hat F ein Potential V ∈ C 1 (U, R), so gilt für jede geschlossene, stückweise glatte Kurve, die in U verläuft, Z hF, dxi = 0. Γ R11.9 Beispiel. Das Vektorfeld F aus 11.4 hat das Potential V (x, y) = x + y. Es gilt also γ hF, dxi = V (γ(π)) − V (γ(0)) = V (−1, 0) − V (1, 0) = −2. Frage: Wann hat F ein Potential? 11.10 Notwendige Bedingung. Hat F ∈ C 1 (U, Rn ) ein Potential V ∈ C 2 (U, R), so ist ∂Fj ∂Fi (x) = (x) ∂xj ∂xi nach dem Satz von Schwarz, da ∂Fi ∂xj = ∂2V ∂xi ∂xj Integrabilitätsbedingung“ ” = ∂2V ∂xi ∂xj = ∂Fj ∂xi . 11.11 Beispiel. Die Integrabilitätsbedingung ist nicht hinreichend. Auf R2 \ {0} betrachte F (x, y) = (−y, x) . x2 + y 2 Eine kurze Rechnung zeigt: Dieses Vektorfeld ist stetig differenzierbar auf R2 \{0} und erfüllt die Integrabilitätsbedingung. Als Kurve wählen wir γ : [0, 2π] → Rn , γ(t) = (cos t, sin t). Γ = Bild γ ist eine geschlossene, glatte Kurve (der Einheitskreis), aber Z 2π Z Z (− sin t (− sin t) + cos t · cos t) dt = 2π. (F1 dx + F2 dy) = (−y dx + x dy) = γ 0 γ Daher kann F nach 11.8 kein Potential haben. 19 11.12 Definition. Wir nennen eine offene Teilmenge U von Rn ein Gebiet, falls sich je zwei Punkte aus U durch einen stückweise stetig differenzierbaren Weg in U verbinden lassen (‘wegzusammenhängend’). 11.13 Satz. Sei U ein Gebiet und V1 , V2 ∈ C 1 (U, R) mit grad V1 = grad V2 . Dann ist V1 − V2 = const. Genau dann liefern also zwei Potentiale dasselbe Gradientenfeld, wenn sie bis auf eine Konstante übereinstimmen. Beweis. Wähle einen festen Punkt y0 ∈ U . Nun sei y ein beliebiger Punkt in U , γ : [a, b] eine stückweise glatte Kurve von y0 nach y. Dann gilt nach 11.7 Z Z V1 (y) − V1 (y0 ) = hgrad V1 , dxi = hgrad V2 , dxi = V2 (y) − V2 (y0 ). γ γ Also V2 (y) − V1 (y) = V2 (y0 ) − V1 (y0 ) = const ∀y. 11.14 Satz. Es sei U ein Gebiet in Rn , F ein stetiges Vektorfeld auf U . Dann ist äquivalent R (i) Für jede stückweise glatte, geschlossene Kurve ist γ hF, dxi = 0. (ii) F besitzt ein Potential V . Man erhält V wie folgt: Man wählt einen festen Punkt x0 ∈ U . Zu x ∈ U wählt man einen stückweise stetig differenzierbaren Weg γx von x0 nach x und setzt Z hF, dxi. V (x) = γx wählt, Beweisidee. Nach 11.8 ist nur (i)⇒(ii) zu zeigen. Rechne nach, dass die Formel ein Potential definiert. Wegen (i) hängt es nicht von der Wahl des Wegs ab. ⊳ 11.15 Definition. U ⊆ Rn heißt sternförmig, falls es einen Punkt x0 ∈ U (den sogenannten Sternpunkt) gibt, so dass für jedes x ∈ U die Strecke {x0 + t(x − x0 ) : 0 ≤ t ≤ 1} ganz in U liegt. 11.16 Beispiel. (a) (b) (c) (d) Kugeln sind sternförmig. R2 \ {(x, 0) : x ≥ 0} ist sternförmig mit Sternpunkt (−1, 0). R2 \ {0} ist nicht sternförmig. (Zeichnung) 11.17 Lemma. Ist U offen und sternförmig und erfüllt F ∈ C 1 (U, Rn ) die Integrabilitätsbedingung, so hat F auf U eine Stammfunktion. 11.18 Bemerkung. Statt ‘sternförmig’ genügt, dass U Gebiet ist und man jede stetige geschlossene Kurve in U auf einen Punkt zusammenziehen kann (‘einfach zusammenhängend’). Beispiel: R3 \ {0} ist nicht sternförmig, aber einfach zusammenhängend. R2 \ {0} ist weder sternförmig noch einfach zusammenhängend. 20 12 Gewöhnliche Differentialgleichungen 12.1 Definition. (a) Eine gewöhnliche Differentialgleichung (im Gegensatz zur partiellen) ist eine Gleichung der Form F (t, x(t), . . . , x(k) (t)) = 0, t ∈ J, für eine gesuchte Funktion x : J → Rn , J Interval. Dabei ist F : U ⊆ J × Rn × . . . × Rn → Rm (b) (c) (d) eine Funktion, in die die Werte von x und seinen Ableitungen eingesetzt werden. F kann Werte in Rm annehmen, d.h., man hat m Gleichungen. Die Differentialgleichung (Dgl) heißt explizit, falls sie nach der höchsten Ableitung aufgelöst ist: x(k) = f (t, x(t), . . . , x(k−1) (t)). P Eine Dgl der Form kj=0 Aj (t)x(j) + f (t) = 0 heißt linear; weiterhin heißt siey homogen, falls f = 0 inhomogen, falls f 6= 0. Ist x(k) = f (t, x, . . . , x(k−1) ) eine Dgl, t0 ∈ J, so besteht die Anfangswertaufgabe (AWA) darin, eine Lösung x zu finden, deren erste k − 1 Ableitungen in t0 die vorgegebenen Anfangswerte x(t0 ) = c0 , . . . , x(k−1) (t0 ) = ck−1 annehmen. 12.2 Beispiel. Bewegung eines Massepunktes unter dem Einfluss der Schwerkraft: x′′ (t) = −g, Physik: t ∈ R. Es folgt für t0 ∈ R fest: x′ (t) − x′ (t0 ) = Z t t0 x′′ (s) ds = − Z t t0 g ds = −g(t − t0 ). Es folgt x′ (t) = −gt + c, c = gt0 + x′ (t0 ) und x(t) − x(t0 ) = Z t t0 ′ x (s) ds = − 1 x(t) = − gt2 + ct + d 2 Z t 1 (−gs + c) ds = − g(t2 − t20 ) + c(t − t0 ) 2 t0 mit 1 1 d = x(t0 ) + gt20 − ct0 = x(t0 ) + gt20 − gt20 − x′ (t0 )t0 . 2 2 Also hat die Lösung der Differentialgleichung die Form x(t) = − 21 gt2 + ct + d, wobei c und d sich aus den Startwerten x(t0 ) und x′ (t0 ) berechnen lassen. Zu jeder Wahl von x(t0 ) und x′ (t0 ) gibt es genau eine Lösung. 21 Einige Lösungsverfahren 12.3 Separation der Variablen/Trennung der Veränderlichen. Möglich für Differentialgleichungen der Form x′ = f (t)g(x), x(t0 ) = x0 , mit stetigen Funktionen f, g. Fall I: g(x0 ) = 0 ⇒ Mögliche Lösung ist x ≡ x0 . Fall II: g(x0 ) 6= 0 ⇒ Falls eine Lösung existiert, so ist auch g(x(t)) 6= 0 für t nahe t0 wegen Stetigkeit der Abbildung t 7→ g(x(t)). Dann gilt dort Z x(t) Z t Z t ′ dy x (s) ds = . (1) f (s) ds = g(x(s)) g(y) x(t0 ) t0 t0 Dies liefert eine implizite Gleichung der Form G(t, x) = 0. Auflösbar nach x? Z t Z x dy ∂ ∂G 1 (t, x) = 6= 0, f (s) ds − =− ∂x ∂x t0 g(y) g(x) x0 folglich: ja. 12.4 Bemerkung. Ist g(x0 ) = 0, so kann es u.U. vorkommen, dass man Lösungen der Form I und Lösungen der Form II oben zu einer Lösung zusammenstückeln kann. 12.5 Beispiel. x′ = xt , x(t0 ) = x0 6= 0. Wir verwenden die Methode der Trennung der Veränderlichen mit f (t) = t, g(x) = x1 . Damit lautet die Gleichung 12.3(1) Z t Z x s ds = y dy t0 x0 Integration liefert die implizite Gleichung 1 2 (t − t20 ) = 2 1 2 (x − x20 ) 2 Es folgt x2 − t2 = x20 − t20 = c und damit x = ± p c + t2 falls t2 ≥ −c (explizite Lösung) 12.6 Rückführung auf Separation der Variablen. (a) (b) x′ = f (at + bx + c). Setze u(t) = at + bx(t) + c. Dann folgt u′ = a + bx′ (t) = a + bf (u). Finde u, liefert x. x′ = f (x/t). Setze u = xt . Dann ist u′ = 1 ′ x 1 x′ t − x x − = (f (u) − u). = t2 t t t Finde u mit Separation der Variablen. 22 12.7 Lineare Differentialgleichung erster Ordnung. x′ + a(t)x = f (t) x(t0 ) = x0 (a) f ≡0: homogen, sonst inhomogen Homogene Differentialgleichung. Ist x0 = 0, so ist x(t) ≡ 0 eine Lösung. Ist hingegen x0 6= 0, so gilt (Stetigkeit) zumindest für t nahe t0 : x(t)/x0 > 0. Es folgt: Z t x = − a(s) ds, also ln x0 t0 − x(t) = x0 e (b) Rt t0 a(s) ds . Somit existiert die Lösung für alle t ∈ R, und x(t) 6= 0 ∀ t ∈ R. Inhomogene Differentialgleichung. Ansatz: Variation der Konstanten. Setze R − t a(s) ds . F (t) = e t0 Dann ist F (t) 6= 0 für jedes t, F ′ (t) + a(t)F (t) = 0 und F (t0 ) = 1 . Wir machen den Ansatz: x(t) = C(t)F (t). Damit x(t0 = x0 ist, muss C(t0 ) = x(t0 ) = x0 gelten. Ferner erhalten wir: f = x′ + ax = (CF )′ + aCF = C ′ F + CF ′ + aCF = C ′ F + C(F ′ + aF ) Somit ist C ′ (t) = Es folgt C(t) = und damit x(t) = Z t Z F ′ +aF =0 = C ′ F. Rt f (t) a(s) ds = f (t) e t0 . F (t) Rr t f (r) e t0 a(s) ds dr + C(t0 ). t0 Rr f (r) e t0 a(s) ds dr + x0 t0 − e Rt t0 a(s) ds 12.8 Bemerkung. Verzichtet man auf das Stellen einer Anfangsbedingung, so ist x′ + a(t)x = f (t) eine inhomogene lineare Gleichung für die Funktion x, und man erhält die Regel: Allgemeine Lösung der inhomogenen Gleichung = allgemeine Lösung der homogenen Gleichung + spezielle Lösung der inhomogenen Gleichung 12.9 Bernoullische Differentialgleichung. x′ + a(t)x + b(t)xr = 0, r ∈ R. Spezialfälle: • r=0 x′ + a(t)x + b(t) = 0 • r=1 x′ + (a(t) + b(t))x = 0 inhomogen linear. homogen linear. Also r 6= 0, 1. Wähle k = 1 − r, z := xk ⇒ x = z 1/k . Die Differentialgleichung wird dann zu 1 1/k−1 ′ z z + a(t)z 1/k + b(t)z r/k = 0. k Multiplikation mit kz k−1 k liefert die leicht lösbare inhomogen lineare Dgl z ′ + ka(t)z + kb(t) = 0. 23 Reduktion auf Systeme erster Ordnung 12.10 Lemma. Jede explizite Differentialgleichung k-ter Ordnung (ggf. mit Anfangswerten x(t0 ) = c1 , . . . xk−1 (t0 ) = ck ) ist äquivalent zu einem System von k Differentialgleichungen erster Ordnung (ggf. mit Anfangswert (x1 (t0 ), . . . , xk (t0 )) = (c1 , . . . , ck )). Die Standardform einer expliziten Differentialgleichung ist also x′ = f (t, x) (ggf. mit Anfangsbedingung x(t0 ) = x0 ) mit einer Funktion f : U ⊆ J × Rk → Rk und x0 ∈ Rk . Beweis. Es sei x(k) = g(t, x, . . . , x(k−1) ) eine explizite Differentialgleichung. Wir setzen x1 = x; x2 = x′ ; . . . xk = x(k−1) . Dann ist das Lösen von x(k) = g(t, x, . . . , x(k−1) ) mit den Anfangswerten x(t0 ) = c1 , . . . , x(k−1) (t0 ) = ck äquivalent zum Lösen von x′1 = x2 ; . . . x′k−1 = xk ; x′k = g(t, x1 , . . . , xk ) mit den Anfangswerten x1 (t0 ) = c0 , . . . , xk (t0 ) = ck−1 . Fasst man x1 , . . . , xk als Vektor x auf und c1 , . . . , ck als Vektor c, so lautet das letzte System x′ = f (t, x), x(t0 ) = c, mit f (t, x) = (x2 , . . . , xk , g(t, x1 , . . . , xk )) und c = (c0 , . . . , ck−1 ). ⊳ Visualisierung 12.11 Richtungsfeld. Eine Lösung der Differentialgleichung x′ = f (t, x), (t, x) ∈ U , hat in t0 die Steigung f (t0 , x(t0 )). An jedem Punkt (t, x) heften wir das ‘Steigungselement’, ein Geradenstückchen mit der Steigung f (t, x) an und erhalten so das sog. Richtungsfeld. Die Lösungen der Differentialgleichung sind genau diejenigen Kurven, die sich an das Richtungsfeld anschmiegen. Das folgende Diagramm zeigt das Richtungsfeld für x′ = 14 (−t − t2 + 4x) Richtungsfeld 3 y(x) 2 1 0 -3 -2 -1 0 1 2 x -1 24 3 Numerische Verfahren Es gibt eine Reihe von Verfahren, die die Lösung einer Differentialgleichung der Form x′ = f (t, x) liefern. (Bemerkung: Sie funktionieren nur dann richtig, wenn man sicher sein kann, dass eine eindeutig bestimmte Lösung existiert.) Am bekanntesten ist das folgende 12.12 Runge-Kutta-Verfahren. Man unterteilt das Intervall [t0 , t0 + a] in n gleiche Teile und setzt tk = t0 + kh, h = a/n. Bekannt ist der Startwert (t0 , x0 ). Nun geht man induktiv wie folgt vor: Ist (tk , xk ) gegeben, so setzt man yk1 = f (tk , xk ); h h yk2 = f (tk + , xk + yk1 ); 2 2 h h yk3 = f (tk + , xk + yk2 ); 2 2 yk4 = f (tk + h, xk + hyk3 ); 1 (yk1 + 2yk2 + 2yk3 + yk4 ) ; yk = 6 xk+1 = xk + hyk . Der Fehler ist dann von Ordung h4 (oder besser). Zur Erklärung: Man bestimmt xk+1 aus xk , indem man zu xk die Intervalllänge h, multipliziert mit einer gemittelten Steigung yk , addiert. In das Mittel gehen vier Größen ein: • yk1 ist die Steigung in tk ; • yk2 ist die geschätzte Steigung in tk + h2 , mittels x(tk + h2 ) ≈ x(tk ) + h2 x′ (tk ) ≈ xk + h2 f (tk , xk ). • yk3 ist ebenfalls geschätzte Steigung in tk + h2 , diesmal jedoch mittels x(tk + h2 ) ≈ x(tk ) + h2 yk2 . • yk4 ist die mittels x(tk + h) ≈ xk + hyk3 geschätzte Steigung in tk + h. Existenz- und Eindeutigkeitssätze 12.13 Satz. (Existenzsatz von Peano) Es sei (t0 , x0 ) ∈ R × Rn , a > 0, b > 0. Setze D = {(t, x) ∈ R × Rn : |t − t0 | ≤ a, kx − x0 k ≤ b}. Ist f = f (t, x) : D → Rn stetig, so hat die Anfangswertaufgabe x′ = f (t, x), x(t0 ) = x0 mindestens eine Lösung auf dem Intervall ]t0 − c, t0 + c[, wobei b } und A = sup{kf (t, x)k : (t, x) ∈ D}. A Beachte: Das sup existiert wegen Stetigkeit von f und Kompaktheit von D. c = min{a, 25 Ohne Beweis. 12.14 Satz. (Existenz und Eindeutigkeitssatz von Picard-Lindelöf ). Bezeichungen und Annahmen von Satz 12.13. Zusätzlich sei f lipschitzstetig in x in folgendem Sinn: Es gibt ein L ≥ 0 mit kf (t, x1 ) − f (t, x2 )k ≤ L kx1 − x2 k für alle (t, x1 ), (t, x2 ) ∈ D. Dann hat die Anfangswertaufgabe eine eindeutige Lösung auf dem Intervall ]t0 − d, t0 + d[, wobei d = min{a, Ab , L1 }. 12.15 Bemerkung. Die Bedingung aus 12.14(b) ist stets erfüllt, wenn die Funktion f auf einer Umgebung von D nach x stetig differenzierbar ist; wegen der Kompaktheit von D ist dann nämlich k∂x f (t, x)k beschränkt auf D und somit kf (t, x1 ) − f (t, x2 )k ≤ sup{k∂x f (t, x)k} kx1 − x2 k. Beweisidee von 12.14. Es sei J0 = [t0 − r, t0 + r] für ein 0 < r < d. Schritt 1 Trick: Wir integrieren und sehen, dass x genau dann die AWA x′ = f (t, x), x(t0 ) = x0 auf J0 löst, wenn x auf J0 stetig ist und Z t x(t) = x0 + f (s, x(s))ds, t ∈ J0 t0 gilt. Schritt 2 Wir definieren die Folge von Funktionen (φ0 , φ1 , . . .) wie folgt: φ0 ist die Funktion mit dem konstanten Wert x0 . Ist φk gegeben, so setzen wir Z t φk+1 = x0 + f (s, φk (s))ds, t ∈ J0 . t0 Man kann dann zeigen, dass diese Folge von Funktionen in dem Raum C([t0 , t0 + c]) gegen die Lösung der AWA konvergiert. ⊳ 12.16 Beispiel. Was schief gehen kann. (a) Verlust der Eindeutigkeit: Wir betrachten die Anfangswertaufgabe x′ = x2/3 , x(t0 ) = x0 auf R. Problem: x 7→ x2/3 nicht lipschitzstetig in 0. Ist z.B. x0 = 0, so sieht man mit Separation der Variablen, dass für jede Wahl von t1 und t2 mit t2 < t0 < t1 durch 1 ( 3 (t − t2 ))3 t < t2 xt1 ,t2 (t) = 0 t2 ≤ t ≤ t1 1 3 ( 3 (t − t1 )) t > t1 eine stetig differenzierbare (!) Funktion definieren, die die Differentialgleichung samt Anfangsbedingung erfüllt. Wir erhalten also unendlich viele Lösungen auf R. Für x0 6= 0 analog. 26 (b) Endliches Lösungsintervall. x′ = −x2 , x(t0 ) = x0 ist stetig auf R und lipschitzstetig auf jedem Teilintervall [−R, R]. Für x0 6= 0 liefert Separation der Variablen Z t Z x 1 dy = 1 ds, − 2 t0 x0 y also 1 x − 1 x0 = t − t0 bzw. x= 1 t − (t0 − 1 . x0 ) Die Lösung ist also für x0 6= 0 in einer Umgebung von t = t0 eindeutig bestimmt. Für t → t0 − x10 gilt |x(t)| → ∞, d. h. die Lösung explodiert“ bei Annäherung an t0 − x10 ( in ” ” endlicher Zeit“). Das folgende Lemma zeigt, dass man das Wachstum kontrollieren kann: 12.17 Lemma. (Gronwallsches Lemma) Es sei J ein Intervall, t0 ∈ J. Ferner sei g : J → R stetig mit g ≥ 0, und es gelte Z t g(t) ≤ A g(s)ds + B, t ∈ J t0 mit geeigneten A, B ≥ 0. Dann gilt für alle t ∈ J g(t) ≤ BeA|t−t0 | . Beweis. Zunächst sei t ≥ t0 . Wir betrachten die Funktion Z t G(t) = A g(s)ds + B. t0 Nach Annahme ist G′ (t) = Ag(t) ≤ AG(t). Die SdV-Technik liefert sofort: G(t) ≤ G(t0 )eA(t−t0 ) . Wegen g ≤ G folgt die Behauptung. Analog für t ≤ t0 . ⊳ 12.18 Definition. Es sei f : U ⊆ Rn+1 → Rn stetig, J, J˜ Intervalle (nicht notwendig offen) und x : J → Rn sowie x̃ : J → Rn in U verlaufende Lösungen der Differentialgleichung x′ = f (t, x). Man nennt x̃ Fortsetzung von x, falls J ⊆ J˜ und x̃|J = x. Eine Lösung heißt maximal, falls sie keine Fortsetzung auf ein echt größeres Intervall hat. 12.19 Definition. Es sei U ⊆ R × Rn offen. Wir sagen, f : U → Cm erfülle eine lokale Lipschitzbedingung bezüglich x, falls zu jedem (t, x) ∈ U eine Umgebung U0 und eine Konstante L existiert mit kf (t, x1 ) − f (t, x2 )k ≤ Lkx1 − x2 k, (t, x1 ), (t, x2 ) ∈ V. 27 12.20 Satz. Es sei U ⊆ R × Rn offen, (t0 , x0 ) ∈ U , f : U → Rn sei stetig und erfülle eine lokale Lipschitzbedingung bzgl. x. Dann existiert eine eindeutige maximale Lösung xmax der Anfangswertaufgabe x′ = f (t, x), x(t0 ) = x0 . Sie ist definiert auf einem offenen Intervall ]t− , t+ [. Nur dann ist t+ 6= +∞, wenn für x ր t+ die Lösungskurve (t, x(t)) an den Rand des Gebiets U stößt oder wenn limt ր t+ kxmax (t)k = +∞ ist. Analog für t− . Kurz: Die Lösungskurve t 7→ (t, xmax (t)) lässt sich solange fortsetzen, bis sie entweder explodiert oder an den Rand von U läuft. Oder: Die Lösungskurve verlässt (in jeder Richtung) jede kompakte Teilmenge von U . 12.21 Bemerkung. Verzichtet man auf die Lipschitzbedingung, so gilt – bis auf die Eindeutigkeit der Lösung – die Aussage des obigen Satzes ebenfalls. Kurvenscharen und Orthogonaltrajektorien 12.22 Kurvenscharen und Differentialgleichungen. Durch die Gleichung F (t, x, c) = 0 (1) sei eine Kurvenschar in R2 gegeben, die durch c parametrisiert ist, z.B. die Parabelschar x−ct2 = 0, c ∈ R. Gemeint: Für jedes c ist ein Kurve xc = xc (t) definiert, die (1) erfüllt, z.B. xc (t) = ct2 . Wir lösen nach c auf: x (2) c = f (x, t); im Beispiel: c = 2 für t 6= 0. t Ableiten nach t liefert die Differentialgleichung 0= d [f (x(t), t)] = ∂x f (x(t), t)x′ (t) + ∂t f (x(t), t); dt (3) ′ im Beispiel: 0 = xt2 − 2 tx3 bzw. x′ = 2x/t für t 6= 0. Jede Lösung von (2) erfüllt dann (3) und umgekehrt. 12.23 Beispiel. Hyperbelschar F (t, x, c) = t2 − x2 − c = 0. Liefert die Dgl 2t − 2xx′ = 0, also für x 6= 0 die Differentialgleichung x′ = t/x. 12.24 Orthogonaltrajektorien. Es seien F und f wie oben. Eine Kurve, die jede der Kurven der Schar orthogonal schneidet, heißt Orthogonaltrajektorie. Man findet eine solche Kurve (lokal) wie folgt. Wir beschreiben die Kurvenschar lokal durch die Differentialgleichung 12.22(3). Diese sei von der Form x′ = h(t, x). Die Kurve t 7→ (t, x(t)) hat die die Ableitung (1, x′ (t)) = (1, h(t, x)). Damit die Orthogonaltra1 ) haben. jektorie t 7→ (t, y(t)) darauf senkrecht steht, muss sie die Ableitung (1, y ′ ) = (1, − h(t,x) Wir erhalten daher als Differentialgleichung der Orthogonaltrajektorie y′ = − 1 . h(t, y) 28 12.25 Beispiel. (a) Die Orthogonaltrajektorie zu der Hyperbelschar aus 12.23 hat die Differentialgleichung x′ = −x/t. Für t0 6= 0, x0 6= 0 erhält man mit Separation der Variablen für t/t0 > 0 und x/x0 > 0: Z x dy x0 y x ⇒ ln x0 = − Z t t0 ds s t0 = ln t t 0 x0 ⇒ x(t) = . t (b) t . Separation Die Orthogonaltrajektorie zur Parabelschar aus 12.23 hat die Dgl x′ = − 2x der Variablen liefert für x0 , t0 6= 0 1 1 1 x(t)2 − x20 = (t20 − t2 ) bzw. x(t)2 + t2 = x20 + t20 (Ellipse). 2 2 2 12.26 Die Differentialgleichung x′′ = f (x). Motivation: Physik: Bewegung eines Teilchens unter Kraft f , die nicht von t abhängt. Sei f ∈ C(J, R), J ⊆ R Intervall, a ∈ J. Definiere Z x f (y) dy U :J →R U (x) = − a (Bedeutung: potentielle Energie). Dann haben wir die Differentialgleichung x′′ (t) = −U ′ (x(t)). Wir wissen nach Peano: Lokal existiert eine Lösung. Multipliziere mit x′ (t): ⇒ ⇒ x′′ (t)x′ (t) = −U ′ (x(t)) x′ (t) 1 ′ 2 ′ = −(U (x))′ (x ) 2 1 ′ 2 (x ) + U (x) = const = E 2 (Gesamt − Energie). (1) Speziell: Alle Bahnen laufen in Bereichen, wo U (x) ≤ E ist. Es gilt p x′ = ± 2(E − U (x)) (je nachdem, ob im Beobachtungsintervall x′ (t) ≥ 0 oder x′ (t) ≤ 0 ist). Separation der Variablen für Startwert x(t0 ) = x0 Z x 1 p dy = t − t0 . 2(E − U (y)) x0 Auflösen nach x liefert Lösung. Nette Beobachtung: Das Integral links liefert die Zeit, die das Teilchen braucht, um von x(t0 ) nach x(t) zu kommen. 29 13 Norm von Matrizen. Exponentialabbildung Norm von Matrizen Erinnerung. Es sei K = R oder C. Die Norm kzk eines Vektors z = (z1 , . . . , zn ) ∈ Kn ist definiert durch v uX u n |zj |2 . kzk = t j=1 Allgemein ist eine Norm auf einem K-Vektorraum X eine Abbildung x 7→ kxk mit (N1) kxk ≥ 0 für alle x ∈ X; kxk = 0 genau dann, wenn kxk = 0. (N2) kλxk = |λ| kxk, x ∈ X, λ ∈ K.. (N3) kx + yk ≤ kxk + kyk, x, y ∈ X. 13.1 Definition. Die Norm einer Matrix in Matmn (K) ist definiert durch: kAxk n : x ∈ K \ {0} . kAk := sup kxk Ohne Beweis: Das supremum ist stets < ∞. Es stimmt überein mit sup{kAxk : kxk ≤ 1} und sup{kAxk : kxk = 1}. Damit gilt automatisch: kAxk ≤ kAkkxk für alle x. 13.2 Lemma. (a) (b) (c) k · k ist Norm auf dem Vektorraum der m × n-Matrizen. Für A ∈ Matmk (K) und B ∈ Matkn (K) ist kABk ≤ kAk kBk Die Norm der Einheitsmatrix ist 1. Beweis. (a) (i) kAk ≥ 0, kAk = 0 ⇔ A = 0 klar ! (ii) k(λA)xk = |λ|kAxk, also kλAk = sup k(λA)xk/kxk = |λ| sup kAxk/kxk = |λ|kAk. (iii) k(A + B)xk ≤ kAxk + kBxk, daher kAxk kBxk kBxk kAxk k(A + B)xk ≤ sup + +sup = kAk+kBk. ≤ sup kA+Bk = sup kxk kxk kxk kxk kxk def (b) k(AB)xk = kA(Bx)k ≤ kAkkBxk ≤ kAkkBkkxk. (c) Klar. ⊳ 13.3 Satz. Der Vektorraum der m × n-Matrizen ist vollständig mit der obigen Norm, d.h. jede Cauchyfolge bezüglich der Norm aus 13.1 hat einen Grenzwert. Mit anderen Worten: Ist (Aj ) eine Folge von Matrizen mit kAj − Ak k → 0 für j, k → ∞, so existiert eine Matrix A mit kAj − Ak → 0. Dabei ist (Aj ) genau dann eine Cauchy-Folge, wenn an jeder Position (i, k) die Einträge eine Cauchy-Folge in K bilden. (ohne Beweis) Wir können nun mit n × n-Matrizen fast wie mit Zahlen operieren. 30 Exponentialfunktion von Operatoren 13.4 Satz. Es sei A ∈ Matnn (K). Wir setzen etA := ∞ k X t k=0 Dann gilt: (a) (b) (c) k! Ak , t ∈ R. Die Reihe für etA konvergiert für jedes t ∈ R absolut in Matnn (K), d.h. giert in R. Die Funktion t 7→ etA ist differenzierbar (also auch stetig) auf R, und (etA )′ = A etA = etA A. Ist B ∈ Matnn (K) mit AB = BA, so ist etA etB = et(A+B) für alle t. P k(tA)k k k! konver- Beweis. Dies ist eine Potenzreihe mit Koeffizienten in Matn (K). Ihr Konvergenzradius ist unendlich: Wegen 13.2(b) ist kAk k ≤ kAkk und somit q p lim k kAk k/k! ≤ kAk lim k 1/k! = 0. Wir erhalten sofort (a). (b) Wie in Kapitel 8: Potenzreihen sind (bel. oft) differenzierbar und können gliedweise abgeleitet werden ∞ X tk−1 k tA ′ A = AetA = etA A. (e ) = k k! k=1 (c) Vertauschen A und B, so kann man etA etB wie im Fall komplexer Zahlen mit dem Cauchyprodukt und dem binomischen Lehrsatz berechnen, s. 4.18(b) aus Analysis A. ⊳ 13.5 Frage. Wie berechnet man etA für ein A ∈ Matn (C)? Wichtigstes Hilfsmittel ist die Jordan-Zerlegung: Q 13.6 Erinnerung: Jordansche Normalform. Es sei A ∈ Matn (K) und fA = rj=1 (x− λj )nj mit paarweise verschiedenen λj das charakteristische Polynom. Dann gibt es Basen Bj von Kern (λj Id − A)nj so, dass für B = (B1 , . . . , Br ) gilt J1 .. . B AB = . Jr Dabei sind die Jj , j = 1, . . . , r obere Dreiecksmatrizen von folgender Gestalt: Jj1 .. Jj = . Jjkj wobei die Jjk (die sog. Jordan-Kästchen) quadratische Matrizen von der Form λj 1 .. . Jjk = .. . 1 λj 31 sind. Bis auf die Reihenfolge der Kästchen ist die Zerlegung eindeutig. Dann ist J = B AB = T −1 AT mit T = kanon. Basis (Id)B . Beachte: In T stehen die Basisvektoren von B als Spaltenvektoren. 13.7 Lemma. Sei A ∈ Matn (C). Wir bestimmen dann etJ mit folgenden Resultaten: (a) Seien J1 , . . . Jr quadratische Matrizen und J1 A= 0 Dann ist (b) (c) 0 1 0 . 0 .. exp t .. .. . . 1 0 ... 0 (d) e(T −1 AT )t = T −1 etA T . Jr 0 . eJr t 0 . . .. et(λId+B) = etλId etB = etλ IdetB = etλ etB , .. eJ1 t etA = 0 λ∈C = . 1 t t2 /2 . . . tk /k! .. .. . 0 1 t . .. . t2 /2 0 0 1 .. .. . t . 0 ... 1 Beweis. (a) (b) (c) Kästchensatz 13.4(c). Folgt weil 0 1 0 . 0 .. .. .. . . 1 0 ... 0 (d) et(T −1 AT ) = ∞ j X t j=0 j! 2 0 0 1 0 0 0 0 ... . = . . 1 .. .. . . 0 0 ... 0 (T −1 AT )j = ∞ j X t j=0 j! T −1 Aj T = T −1 etA T. ⊳ 32 13.8 Folgerung. Es sei B = {w1 , . . . , wn } eine Jordanbasis für A ∈ Matn (C) und J = die Jordan-Normalform. Dann ist etA = T eJt T −1 B AB mit T = kanon. Basis IdB = Spaltenmatrix (w1 , . . . , wn ). Dies ist bereits ein einfach zu berechnender Ausdruck. Es geht aber noch besser: Man berechnet leicht T etJ , weil für ein beliebiges k-Tupel von n-Vektoren gilt: 1 t t2 /2 . . . tk−1 /(k − 1)! .. .. 0 1 . . t tk−1 .. 2 = (v , tv + v , . . . , v1 + . . . + vk ) . (1) (v1 , . . . , vk ) 0 0 1 1 2 . t /2 1 {z } | (k − 1)! . {z } | .. n×k .. . t n×k 0 ... 1 | {z } k×k Man erhält dann T eJt , indem man als v1 , . . . , vk den zu einem Jordankästchen Jjl gehörigen Abschnitt aus der Basis B wählt und die Matrix auf der rechten Seite von (1) noch mit eλj t multipliziert. 33 14 Lineare Differentialgleichungen Im Folgenden sei • J ⊆ R ein offenes Intervall, • t0 ∈ J, x0 ∈ Kn , (K = R oder C) • A : J → Matn (Kn ) stetig, • f : J → Kn stetig. 14.1 Lemma. Unter den obigen Annahmen ist die Anfangswertaufgabe x′ − A(t)x = f, x(t0 ) = x0 auf ganz J eindeutig lösbar. Beweis. Wir wenden zunächst den Satz von Picard-Lindelöf an: A(t)x und f sind stetig in t, x. Lipschitzstetig in x? Ja, denn k(f (t) + A(t)x1 ) − (f (t) + A(t)x2 )k = kA(t)(x1 − x2 )k ≤ kA(t)k kx1 − x2 k. Also gibt es eine maximale Lösung, die wir bis zum Rand fortsetzen können, wenn sie nicht explodiert. Da kx′ (t)k ≤ kf (t)k + kA(t)kkxk ist, kann das nicht passieren (Gronwall). ⊳ 14.2 Lemma. (a) (b) Die Menge aller Lösungen von x′ − A(t)x = 0 bildet einen n-dimensionalen Vektorraum, NA . Ist u ∈ NA und u(t) = 0 für ein t ∈ J, so ist u(t) = 0 für alle t. Beweis. (a) Klar: Vektorraum. Nach 14.2 ist eine Lösung in NA durch den Vektor x(t0 ) ∈ Cn eindeutig bestimmt, also ist x 7→ x(t0 ) ein Isomorphismus von NA nach Cn und dim NA = dim Cn = n. (b) folgt aus 14.1. ⊳ 14.3 Definition. Eine Basis {x1 , . . . , xn } von NA nennen wir ein Fundamentalsystem für die Dgl x′ = A(t)x. Die daraus gebildete Matrix 1 x1 . . . xn1 .. Φ = ... . 1 xn . . . xnn heißt Fundamentalmatrix oder auch Fundamentalsystem. Im Allgemeinen ist ein FS nur schwer zu finden. 14.4 Satz. Es sei Φ ein Fundamentalsystem für x′ = A(t)x. (a) x(t) = Φ(t)Φ(t0 )−1 x0 ist die Lösung der AWA x′ = A(t)x, x(t0 ) = x0 . 34 (b) Die Lösung der inhomogenen Anfangswertaufgabe x′ = A(t)x + f , x(t0 ) = x0 ist Z t x(t) = Φ(t)Φ(t0 )−1 x0 + Φ(t)Φ(s)−1 f (s)ds t0 Z t −1 −1 = Φ(t) Φ(t0 ) x0 + Φ(s) f (s)ds . t0 Beweis. (a) Es ist x′ (t) = Φ′ (t)Φ(t0 )−1 x0 = A(t)Φ(t)Φ(t0 )−1 x0 = A(t)x(t) und x(t0 ) = x0 . (b) x′ (t) = A(t)Φ(t) [. . .] + Φ(t) 0 + Φ(t)−1 f (t) = A(t)x(t) + f (t); x(t0 ) = x0 . ⊳ Der Fall einer konstanten Matrix A Nun sei zusätzlich A konstant in t. 14.5 Lemma. etA ist in Fundamentalsystem für die Dgl x′ = Ax. Ein weiteres ist durch T etJ gegeben (Bezeichnungen von 13.8). Beweis. etA ist eine invertierbare Matrix für jedes t ∈ R. Ferner ist (etA )′ = AetA nach 13.4. Damit ist etA ein Fundamentalsystem. Aus etA = T etJ T −1 folgt T etJ = etA T . Damit sind auch die Spaltenvektoren von T etJ linear unabhängig. Da ′ T etJ = T JetJ = T (T −1 AT ) etJ = AT etJ ist, bilden sie also ein Fundamentalsystem. ⊳ 14.6 Explizit. Man löst die AWA x′ = Ax, x(t0 ) = x0 folgendermaßen: Man bestimmt T etJ nach 13.8. Nun berechnet man (z. B. mit Gauß-Algorithmus) die Lösung c von T c = x0 (d. h. c = T −1 x0 ). Dann ist x(t) = etA (et0 A )−1 x0 = e(t−t0 )A x0 = T e(t−t0 )J T −1 x0 = T e(t−t0 )J c. Auch die Lösung der inhomogenen Aufgabe vereinfacht sich: Z t J(t−t0 ) −1 x(t) = T e T x0 + T eJ(t−s) T −1 f (s)ds. t0 Wieder kann man T −1 x0 bzw. T −1 f (s) mit dem Gauß-Algorithmus bestimmen. 14.7 Reelle Lösungen. Ist A eine reelle Matrix, so ist man auch an reellen Lösungen von x′ = Ax interessiert. Da A reell ist, hat das charakteristische Polynom reelle Koeffizienten. Also ist für jedes λ ∈ C \R mit fA (λ) = 0 auch fA (λ) = 0. Es genügt dann, für alle reellen und jeweils einen der konjugiert komplex auftretenden Eigenwerte die Konstuktion aus 13.8 durchzuführen. Anschließend ersetzt man die zu den konjugiert komplexen Eigenwerten gehörigen Vektoren durch ihren Real- und ihren Imaginärteil und erhält damit ein reelles Fundamentalsystem. 35 Die lineare Differentialgleichung n-ter Ordnung Nun seien a0 , . . . , an−1 : J → K stetige Funktionen, f : J → K stetig. Wir betrachten die Differentialgleichung x(n) (t) + n−1 X aj (t)x(j) (t) = f (t) (1) j=0 mit den Anfangswerten x(t0 ) = x0 , . . . , x(n−1) (t0 ) = xn−1 . (2) Wir wandeln um in ein System, indem wir x1 = x, x2 = x′ , . . . , xn = x(n−1) setzen. Wir erhalten als äquivalentes System 0 1 ... 0 0 0 0 1 0 .. .. .. x′ = Ax + F mit A = und F = .. . . . . . 0 ... 0 1 f −a0 −a1 . . . −an−1 Anfangswert: X0 = (x0 , . . . , xn−1 ). Aus der bisherigen Theorie erhalten wir dann folgenden Satz: 14.8 Satz. (a) (b) Die AWA (1), (2) ist auf J eindeutig lösbar. Die Lösungen der homogenen Gleichung ((1) mit f = 0) bilden einen n-dimensionalen Vektorraum N . Als Fundamentalsystem bezeichnet man eine Basis von N . Die Matrix x1 ... xn x′1 x′n Φ = .. .. . . (n−1) x1 (c) (n−1) . . . xn heißt Fundamentalmatrix. Die allgemeine Lösung von (1) (ohne Berücksichtigung von Anfangswerten) ist gegeben durch Z t n n X X det Wj (s) ds, dj ∈ K beliebig. xj (t) dj xj (t) + x(t) = t0 det W (s) j=1 j=1 Dabei ist det W die sog. Wronski-Determinante. x1 ... xn x1 ... 0 ... xn .. .. .. .. .. W = und Wj = . . . . . . (n−1) (n−1) (n−1) (n−1) x1 . . . xn x1 . . . f . . . xn Die Lösung der AWA (1),(2) erhält man durch geeignete Wahl der dj . 36 Homogene lineare Differentialgleichungen mit konstanten Koeffizienten Nun seien a0P , . . . , an−1 ∈ K konstant. Wir können J = R wählen. Wir setzen zusätzlich an = 1 und nennen nj=0 aj λj das charakteristische Polynom für die homogene Differentialgleichung n X aj x(j) = 0 j=0 (es ist tatsächlich das charakteristische Polynom für die Matrix A vor 14.8). P Q 14.9 Satz. Es sei nk=0 aj λj = rj=0 (λ − λj )nj mit paarweise verschiedenen λj ∈ C. Dann bilden die Funktionen xjk (t) = tk eλj t , j = 1, . . . , r, k = 0, . . . , nj − 1 P ein Fundamentalsystem für die homogene Gleichung aj x(j) = 0. Sind alle aj reell, so erhält man ein reelles Fundamentalsystem, indem man für λj = α + iβ mit βj 6= 0 die Lösungen tk e(α+iβ)t und tk e(α+iβ)t durch tk eαt cos βt und tk eαt sin βt ersetzt. Die Lösungen der AWA erhält man als geeignete Linearkombination der xjk . 37 15 Riemann-Integral 15.1 Intervalle und Zerlegungen. Es seien a1 , . . . , an , b1 , . . . , bn ∈ R mit aj ≤ bj für j = 1, . . . , n. Wir nennen I = [a1 , b1 ] × . . . × [an , bn ] = {x ∈ Rn : aj ≤ x ≤ bj , j = 1, . . . , n} ein kompaktes n−dimensionales Intervall und I ◦ = ]a1 , b1 [× . . . ×]an , bn [= {x ∈ Rn : aj < x < bj , j = 1, . . . , n} sein Inneres. Mit |I| oder vol I bezeichnen wir das n−dimensionale Volumen |I| = (b1 − a1 ) · . . . · (bn − an ). Erinnerung. Eine Zerlegung Z eines Intervalls [a, b] in R ist eine endliche Punktmenge {t0 , . . . , tN } mit a = t0 < t1 < . . . tN = b. Die Feinheit |Z| dieser Zerlegung ist definiert durch |Z| = max{tk − tk−1 : k = 1, . . . , N }. Wir definieren nun die Zerlegung eines n−dimensionalen Intervalls I (wie oben) als ein Produkt Z = Z1 ×. . .×Zn wobei Zj eine Zerlegung von [aj , bj ] ist. Die Zerlegung Z liefert eine Unterteilung des Intervalls I in endlich viele Intervalle I1 , . . . , IK , die sich nur in den Seitenflächen schneiden. Es gilt: N K [ X I= Ik , Ij◦ ∩ Il◦ = ∅ (j 6= l), |I| = |Ik |. k=1 k=1 Die Feinheit |Z| von Z definiert man durch |Z| = max |Zj |. 15.2 Riemann-Integral. Es seien I, Z, Ij wie oben, s = (s1 , . . . , sK ) ∈ I1 × . . . × IK ein so genannter Zwischenvektor. Ist f : I → K (K = R oder C eine beschränkte Funktion, so nennen wir K X f (sk ) |Ik | S(f, Z, s) = k=1 die Riemannsche Zwischensumme zur Zerlegung Z mit Zwischenvektor s. Wir nennen f Riemann-integrierbar mit Riemann-Integral S, falls zu jedem ε > 0 ein δ > 0 existiert, so dass |S − S(f, Z, s)| < ε, falls |Z| < δ, s beliebig. In diesem Fall schreiben wir S= Z f dx = Z f (x1 , . . . , xn ) d(x1 , . . . , xn ). I I 15.3 Satz. Es seien f, g : I → K Riemann-integrierbar und c ∈ K. Dann sind f + g und cf Riemann-integrierbar, und Z Z Z Z Z cf dx = c f dx. f + g dx = f dx + g dx und I I I I Sind f und g reellwertig, und ist f ≤ g, so ist Z Z f dx ≤ g dx. I I 38 I Beweis. Klar. ⊳ 15.4 Nullmengen. Eine Teilmenge N ⊆ Rn heißt Nullmenge oder Menge vom Maß Null, falls man zu jedem ε > 0 höchstens abzählbar viele kompakte Intervalle I1 , I2 , . . . findet mit der Eigenschaft dass [ X N⊆ Ij und |Ij | < ε. 15.5 Lemma. (a) (b) (c) (d) Abzählbare Vereinigungen von Nullmengen sind Nullmengen. Teilmengen von Nullmengen sind Nullmengen. Ein Punkt in Rn ist eine Nullmenge. Eine Menge der Form {x ∈ Rn : xj = c} für ein festes j und c ∈ K ist eine Nullmenge. Beweis. (a) Es seien N1 , N2 , . . . Nullmengen und ε > 0 vorgelegt. Zu jedem Nj finden wir abzählbar (j) viele kompakte Intervalle Ik , k = 1, 2, . . . , mit Nj ⊆ Dann ist ∞ [ j=1 (b) (c) Nj ⊆ [ ∞ [ [ (j) Ik , X und k (j) Ik , k und j=1 k ∞ X X j=1 k (j) |Ik | < ε/2j+1 . (j) |Ik | < ∞ X ε/2j+1 = ε. j=1 Klar. Sei y ∈ Rn und δ > 0 mit 2n δn < ε. Dann ist y ∈ Iδ = [y1 − δ, y1 + δ] × . . . × [yn − δ, yn + δ] (d) und |Iδ | < ε. Analog. ⊳ 15.6 Definition. Wir sagen von einer Eigenschaft, sie gelte fast überall, falls sie außerhalb einer Nullmenge gilt. 15.7 Lebesguesches Integrabilitätskriterium. Eine beschränkte Funktion f : I → K ist genau dann Riemann-integrierbar, wenn sie fast überall stetig ist. 15.8 Folgerung. Stetige Funktionen sind Riemann-integrierbar. 39 15.9 Satz von Fubini. I1 ⊆ Rn1 und I2 ⊆ Rn2 seien kompakte Intervalle. Dann ist I = I1 × I2 kompaktes Intervall in Rn , n = n1 + n2 . Ist f : I → K Riemann-integrierbar und existiert für jedes y ∈ I2 das Integral Z f (x, y) dx, g(y) = I1 so ist g auf I2 Riemann-integrierbar, und es gilt: Z Z Z Z f (x, y) dy dx g(y) dy = f (x, y) d(x, y) = I2 I2 I I1 15.10 Folgerung. Ist I wie in 15.1 und f : I → K stetig, so gilt Z b1 Z bn Z f (x1 , . . . , xn ) dxn . . . dx1 . ... f (x) d(x1 , . . . , fn ) = I an a1 Ist f lediglich Riemann-integrierbar, so gilt diese Identität immer noch, sofern alle iterierten Integrale existieren. Beweisidee zu 15.9: Wir betrachten den einfachen Fall n1 = n2 = 1, n = 2. Zu [a1 , b1 ] wählen wir die Zerlegung a = t0 < t1 < t2 = b und zu [a2 , b2 ] die Zerlegung a2 = u0 < u1 < u2 = b2 Als Zwischenvektor wählen wir (x1 , y1 ), (x2 , y1 ), (x1 , y2 ), (x2 , y2 ). Dann berechnen wir die Zwischensumme zu dieser Zerlegung. Wir erhalten für diesen einfachen Fall sofort die Aussage des Satzes von Fubini aus dem Distributivgesetz. Im allgemeinen Fall genauso. ⊳ 15.11 Definition. (a) Es sei B ⊆ Rn und f : B → K eine Funktion. Wir definieren die Funktion fB : Rn → K durch f (x), x ∈ B, fB (x) = 0, sonst (b) Es sei B ⊆ Rn beschränkt und I ein beschränktes Intervall, das B enthält. Wir nennen f : B → K Riemann-integrierbar auf B, falls fB auf I Riemann-integrierbar ist. Man sieht mit dem Lebesgue-Kriterium, dass dies nicht von der Wahl von I abhängt. In diesem Fall setzen wir Z Z f (x) dx = fB (x) dx. I B (c) Eine beschränkte Menge B heißt Jordan-messbar, falls ihre charakteristische Funktion χB , definiert durch 1, x ∈ B, χB (x) = 0, sonst Riemann-integrierbar ist. In diesem Fall bezeichnen wir mit |B| oder auch vol B das Volumen Z |B| = χB dx. 15.12 Definition. Es sei B ⊆ Rn . Der Rand ∂B von B ist die Menge aller Punkte x ∈ Rn (nicht notwendig in B!), für die sich zu jedem ε > 0 Punkte x1 ∈ B und x2 ∈ / B finden lassen mit x1 , x2 ∈ B(x, ε). 40 15.13 Satz. Die beschränkte Menge J ist genau dann Jordan-messbar, falls ihr Rand eine Nullmenge ist. Beweis. B ist Jordan-messbar, wenn χB Riemann-integrierbar ist. Dies wiederum ist nach Lebesgue dazu äquivalent, dass sie fast überall stetig ist. Da die Unstetigkeitspunkte von χB gerade die Randpunkte von B sind, folgt die Behauptung. ⊳ 15.14 Satz. Genau dann ist die Funktion f : B → K auf der Jordan-messbaren Menge B Riemann-integrierbar, wenn sie auf B fast überall stetig ist. Beweis. Die Menge der Unstetigkeitspunkte von fB in Rn unterscheidet sich von der Menge der Unstetigkeitspunkte von f auf B höchstens durch die Nullmenge ∂B. ⊳ 15.15 Satz. Es seien f, g : B → K Riemann-integrierbar und c ∈ K. Dann sind f + g und cf Riemann-integrierbar, und Z Z Z Z Z f dx. cf dx = c g dx und f dx + f + g dx = B Es ist B B B B Z Z f dx ≤ |f | dx. B B Sind f und g reellwertig, und ist f ≤ g, so ist Z Z g dx. f dx ≤ B B Beweis. Klar. ⊳ 15.16 Lemma. Es seien A, B Jordan-messbar und f auf beiden Riemann-integrierbar. (a) (b) (c) Dann sind auch A ∪ B, A ∩ B und A \ B Jordan-messbar. R Es sei f : N → K Riemann-integrierbar und N eine Nullmenge. Dann ist N f dx = 0. Ist zusätzlich A ∩ B eine Nullmenge, so ist Z Z Z f dx. f dx + f dx = B A A∪B Beweis. (a) Die Mengen ∂(A ∪ B), ∂(A ∩ B) und ∂(A \ B) sind Teilmengen von ∂A ∪ ∂B, also nach 15.5/15.13 Nullmengen. (b) Es sei |f | ≤ C. Dann ist Z Z 15.15 f dx ≤ C dx ≤ C |N | = 0. N N (c) Folgt aus (a) und (b). ⊳ 15.17 Satz. Es sei B ⊆ Rn beschränkt und f : B → R Riemann-integrierbar mit f ≥ 0. Dann ist die Menge M (f ) = {(x, y) ∈ Rn+1 : x ∈ B, 0 ≤ y ≤ f (x)} eine Jordan-messbare Teilmenge des Rn , und |M (f )| = Z 41 f dx. B Beweis. Als Riemann-integrierbare Funktion ist f beschränkt: f ≤ C. Wähle ein kompaktes Intervall I mit B ⊆ I. Dann ist M (f ) ⊆ J = I × [0, C], insbesondere also beschränkt. Zeige nun dass M (f ) Jordan-messbar ist (weglassen). Dann schließt man: Z Z C Z Fubini χM (f ) (x, y) dy dx χM (f ) d(x, y) = |M (f )| = I 0 J ! Z Z Z Z fB (x) fB wie in 15.11 1 dy = I f (x) dx. fB (x) dx = dx = B I 0 ⊳ 15.18 Beispiel. Es sei M ⊆ R2 ein Normalbereich, d.h. eine Menge der Form M = {(x, y) ∈ R2 : x ∈ [a, b], f1 (x) ≤ y ≤ f2 (x)} mit zwei Riemann-integrierbaren Funktionen f1 ≤ f2 . Dann ist M Jordan-messbar. Ist g : M → K stetig, so ist Z g(x, y) d(x, y) = Z bZ a M f1 (x) g(x, y) dx dy. f2 (x) Beweis. O.d.B.A. sei 0 ≤ f1 ≤ f2 ≤ C. Da M = M (f2 ) \ M (f1 ) ist, folgt die Jordan-Messbarkeit aus 15.14. Mit I = [a, b] × [0, C] ist nach Definition: Z Z g d(x, y) = gM (x, y) d(x, y). I M Weil g stetig ist, existiert für jedes feste x ∈ [a, b] das Integral Z C gM (x, y) dy = 0 Z f2 (x) RC 0 gM (x, y) dy und g(x, y) dy f1 (x) Aus dem Satz von Fubini folgt dann die Behauptung. ⊳ 15.19 Substitutionsregel. Es sei U ⊆ Rn offen und ψ : U → Rn stetig differenzierbar und injektiv. Die Jacobi-Determinante det ψ ′ (x) sei für jedes x positiv (oder für jedes x negativ). Ist T ⊆ U Jordan-messbar, so ist ψ(T ) Jordan-messbar. Ist ferner f : ψ(T ) → K stetig, so ist f auch Riemann-integrierbar, und es gilt Z Z f (ψ(x)) | det ψ ′ (x)| dx. f (y) dy = ψ(T ) T (ohne Beweis) 42 15.20 Polarkoordinaten in R2 . Wir betrachten die Abbildung ψ : U = [0, ∞[ ×]0, 2π[ → R2 r cos ϕ ψ(r, ϕ) = . r sin ϕ Sie bildet U bijektiv auf die Menge R2 \ {(x, 0) : x ≥ 0} ab. Die Jacobi-Determinante ist cos ϕ −r sin ϕ ′ det ψ (r, ϕ) = det = r > 0. sin ϕ r cos ϕ Die Menge {(x, 0) : x ≥ 0} ist eine Nullmenge. Sie spielt für die Integration keine Rolle. Die Kreisscheibe vom Radius R, B(0, R) = {(x, y) : x2 + y 2 ≤ R2 } ist (bis auf eine Nullmenge) das Bild von {(r, ϕ) : 0 < r ≤ R; 0 < ϕ < 2π}. Also ist Z R Z 2π Z R Z 2πr dr = πR2 . 1 dx = r dϕ dr = vol B(0, R) = 0 B(0,R) 0 0 15.21 Polarkoordinaten in R3 (Kugelkoordinaten). Setze = [0, ∞[ ×]0, 2π[ × ]0, π[ → R3 r cos ϕ sin ϑ ψ(r, ϕ, ϑ) = r sin ϕ sin ϑ r cos ϑ ψ:U Dann ist und cos ϕ sin ϑ −r sin ϕ sin ϑ r cos ϕ cos ϑ ψ ′ (r, ϕ, ϑ) = sin ϕ sin ϑ r cos ϕ sin ϑ r sin ϕ cos ϑ cos ϑ 0 −r sin ϑ det ψ ′ (r, ϕ, ϑ) = −r 2 sin ϑ > 0. Das Bild von ψ ist R3 \ N , wobei N = {(x, y, z) : x ≥ 0, y = 0} eine Nullmenge ist. Es folgt für die Vollkugel vom Radius R, B(0, R) = {(x, y, z) : x2 + y 2 + z 2 ≤ R2 }: Z RZ 2πZ 0 Z 1 d(x, y, z) = r 2 sin ϑ dϑ dϕ dr |BR | = 0 BR = 2π (sin ϑ)|π0 Z R 0 r 2 dr = 0 π 4 π R3 . 3 15.22 Beispiel. Das Ellipsoid mit Halbachsen a, b und c (a, b, c > 0) ist x2 y 2 z 2 E = x ∈ R3 : 2 + 2 + 2 ≤ 1 . a b c 43 Durch die stetig differenzierbare Abbildung ψ(x, y, z) → (ax, by, cz) wird die Einheitskugel a 0 0 B(0, 1) bijektiv auf E abgebildet. Die Jacobi-Matrix ist 0 b 0. Also ist 0 0 c Z Z 4 abc d(x, y, z) = abc |B(0, 1)| = πabc. 1 d(u, v, w) = |E| = 3 B(0,1) E 44 16 Integration über Flächen. Der Gaußsche Integralsatz Der Gaußsche Satz in der Ebene 16.1 Orientierter Rand von Normalbereichen. Es sei [a, b] ein Intervall, und f1 und f2 seien stückweise stetig differenzierbare Funktionen auf [a, b] mit f1 ≤ f2 . Ferner sei M = {(x, y) ∈ R2 : x ∈ [a, b], f1 (x) ≤ y ≤ f2 (x)}. Der Rand von M besteht dann aus den beiden vertikalen Abschnitten in t = a zwischen f1 (a) und f2 (a) und in t = b zwischen f1 (b) und f2 (b) sowie den Graphen von f1 und f2 . Wir beschreiben ihn nun durch vier stückweise stetig differenzierbaren Kurven γ1 , γ2 , γ3 , γ4 , wobei γ1 : [a, b] → R2 ; γ1 (t) = (t, f1 (t)) 2 γ2 : [f1 (b), f2 (b)] → R ; γ2 (t) = (b, t) 2 γ3 : [a, b] → R ; γ3 (t) = (a + b − t, f2 (a + b − t)) γ4 (t) : [f1 (a), f2 (a)] → R2 ; γ4 (t) = (a, f1 (b) + f2 (b) − t) Die Kurve γ3 ist gerade die Kurve γ̃3 (t) = (t, f1 (t)), aber in umgekehrter Richtung durchlaufen. Ähnliches gilt für γ4 . Die Durchlaufrichtung der Kurven ist dann so, dass M stets zur Linken liegt (positiv orientiert). 16.2 Integral über Normalbereich. Bezeichnungen wie oben. Ferner sei Q stetig differenzierbare Funktion auf R2 . Dann ist nach Beispiel 15.18 ! Z b Z f2 (x) Z b Z ∂Q ∂Q Q(x, f2 (x)) − Q(x, f1 (x)) dx d(x, y) = dy dx = f1 (x) ∂y a a M ∂y Das letzte Integral können wir als Kurvenintegral auffassen. Wegen γ1′ (t) = (1, f1′ (t)) und γ3′ (t) = (−1, f1′ (a + b − t)) ist es in der Schreibweise von 11.2: Z Z Q dx. Q dx − − γ1 γ3 Wir benutzen die Schreibweise Z b Z Z Z hF (t), γ ′ (t)i dt F1 dx1 + . . . Fn dxn = hF, dxi = γ γ γ a Q für F : [a, b] → und (x = x1 , . . . , xn )) mit (x1 , x2 ) = (x, y) und F = . Weil γ2′ (t) = (0, 1) 0 und γ4 (t) = (0, −1) ist, sind die entsprechenden Integrale über γ2 und γ4 beide Null. Mit γ bezeichnen wir nun die aus γ1 , γ2 , γ3 und γ4 zusammengesetzte Kurve. Dann ist Z Z ∂Q d(x, y) = − Q(x, y) dx. M ∂y γ Rn 16.3 Normalbereiche in y-Richtung. Nun seien ϕ1 , ϕ2 : [a, b] → R2 stetig differenzierbar mit ϕ1 ≤ ϕ2 und M = {(x, y) : ϕ1 (y) ≤ x ≤ ϕ2 (y), a ≤ y ≤ b}. 45 Wir beschreiben den orientierten Rand durch δ1 : [ϕ1 (a), ϕ2 (a)] → R2 ; δ1 (t) = (t, a) 2 δ2 : [a, b] → R ; δ2 (t) = (ϕ2 (t), t) 2 δ3 : [ϕ1 (b), ϕ2 (b)] → R ; δ3 (t) = (ϕ1 (b) + ϕ2 (b) − t, b) δ4 (t) : [a, b] → R2 ; δ4 (t) = (ϕ1 (t), a + b − t) und bezeichnen mit δ die zusammengesetzte Kurve. Wieder sei G ⊆ R2 offen mit M ⊆ G, und P stetig differenzierbare Funktionen auf G. Dann ist nach Satz 15.18 ! Z b Z ϕ2 (y) Z ∂P ∂P d(x, y) = dx dy ϕ1 (y) ∂x a M ∂x Z Z Z Z b P dy = P dy P dy + P (ϕ2 (y), y) − P (ϕ1 (y), y) dy = = δ2 a δ4 δ Dabei gilt die letzte Identität, weil die Integrale über δ1 und δ3 Null sind. Beachte das im Vergleich zu 16.2 verschiedene Vorzeichen Der folgende Satz ist dann offensichtlich, wenn M sowohl bezüglich der x-Achse als auch bezüglich der y-Achse ein Normalbereich ist. Er gilt jedoch allgemeiner durch Zerlegung: 16.4 Satz von Gauß/Greensche Formel in der Ebene. Es sei M eine beschränkte offene Menge, deren Rand durch eine stückweise stetig differenzierbare Kurve γ positiv orientiert ist (d.h. M liegt beim Durchlaufen von γ stets zur Linken). Ferner seien Q und P stetig differenzierbar auf R2 . Dann ist Z Z ∂P ∂Q + d(x, y) = P dy − Q dx. ∂x ∂y γ Speziell ergibt sich: Z 1 d(x, y) = vol M = 2 M Z γ x dy − y dx. Integration über Flächen 16.5 Definition. Eine Teilmenge M von Rn heißt eine k-dimensionale Mannigfaltigkeit (k ≤ n), falls zu jedem Punkt m ∈ M eine Abbildung ψ : T ⊂ Rk → M existiert mit folgenden Eigenschaften: (i) Für eine (hinreichend kleine) offene Umgebung U von m in Rn gilt: M ∩ U = ψ(T ) (ii) Rang(ψ ′ (t)) = k (d.h. maximal) für jedes t ∈ T (iii) Sind ψ1 : T1 → Rn und ψ2 : T2 → Rn zwei solcher Abbildungen mit U = ψ1 (T1 )∩ψ2 (T2 ) 6= ∅, dann ist die Komposition ψ2−1 ψ1 : ψ1−1 (U ) → Rk stetig differenzierbar. 46 Bedingung (i) besagt. dass in der Nähe jedes Punktes m die Mannigfaltigkeit M durch k freie Parameter beschrieben wird. (ii) stellt sicher, dass die k Variablen tatsächlich unabhängige Richtungen liefern. Man hat viel Freiheit bei den obigen Wahlen. Bedingung (iii) sorgt dafür, dass alle, die denselben Bereich von M beschreiben, verträglich“ sind. ” Man nennt eine solche Abbildung eine lokale Kartenabbildung. Mannigfaltigkeiten der Dimension 2 nennt man Flächen. 16.6 Beispiel: Die Sphäre Sr vom Radius r in R3 . Dies ist eine Fläche. Wir betrachten die Abbildung = ]0, 2π[ × ]0, π[ → R3 r cos ϕ sin ϑ ψ1 (ϕ, ϑ) = r sin ϕ sin ϑ r cos ϑ ψ1 : T Ihr Bild enthält alle Punkte der Sphäre mit Ausnahme des Halbkreises {(x, y, z) ∈ Sr : x ≥ 0, y = 0}. Wir nehmen die Abbildung ] − π, π[×]0, π[→ R3 r cos ϕ sin ϑ ψ2 (ϕ, ϑ) = r sin ϕ sin ϑ r cos ϑ ψ2 : hinzu, und erhalten als Bild alle Punkte der Sphäre außer {(x, y, z) ∈ Sr : x ≤ 0, y = 0}. Die Kartenwechselabbildung ψ2−1 ψ1 ordnet hier (ϕ, θ) ∈ ]0, 2π[ × ]0, π[ das Paar (ϕ, θ) zu, falls 0 < ϕ < π und (ϕ − 2π, θ), falls π < ϕ < 2π. Nun fehlen uns nur noch der Nordpol und der Südpol. Dazu können wir in beiden Abbildungen θ von −π/2 bis π/2 laufen lassen. 16.7 Integration über Mannigfaltigkeiten. Es sei M eine Mannigfaltigkeit der Dimension k und f : M → K eine stetige Funktion. Ist ψ : T → M eine lokale Kartenabbildung, so definiert man das Integral von f über den Bildbereich von T unter ψ durch Z q f (ψ(t)) det(ψ ′ (t)T ψ ′ (t)) dt. ψ(T ) Dabei ist ψ ′ (t) ∈ Matnk (R) die Ableitung von ψ und ψ ′ (t)T ∈ Matkn (R) ihre Adjungierte. Es zeigt sich, dass das Produkt ψ ′ (t)T ψ ′ (t) eine invertierbare k × k-Matrix ist, deren Determinante überall positiv ist. Man kann ferner nachrechnen, dass das Ergebnis unabhängig von der Kartendarstellung ist. Die Matrix ψ ′ (t)T ψ ′ (t) wird als Maßtensor bezeichtnet, ihre Determinante als Gramsche Determinante. Das Integral einer stetigen Funktion f über ganz M erhält man, indem man die Mannigfaltigkeit durch mehrere Karten überdeckt, die Funktion entsprechend zerlegt und dann integriert. Dabei ist es so, dass Integrale über die Bilder von Nullmengen unter einer Kartenabbildung Null sind. 16.8 Beispiel. Wir betrachten die Sphäre Sr vom Radius r in R3 . Wir haben die Karte (vgl. 16.6) ]0, 2π[×]0, π[ → R3 r cos ϕ sin θ ψ(ϕ, θ) = r sin ϕ sin θ . r cos θ ψ : 47 Der Maßtensor bzw. die Gramsche Determinante sind 2 2 r sin θ 0 g(ϕ, θ) = bzw. det g(ϕ, θ) = r 4 sin2 θ. 0 r2 Das Bild von ψ ist die Sphäre ohne den Nullmeridian. Da er eine Nullmenge ist, spielt er für die Integration keine Rolle. Für f : Sr → C ist also Z 2π Z π Z f (ψ(ϕ, θ))r 2 sin θ dθ dϕ. f (x) dS(x) = 0 Sr 0 Insbesondere erhalten wir für die Oberfläche der Kugel vom Radius r Z 2π Z π Z 1 dx = r 2 sin θ dθ dϕ = 4πr 2 . vol(Sr ) = 0 Sr 0 16.9 Rotationsflächen. Es sei I ein Intervall in R und f : I → R>0 stetig differenzierbar und strikt positiv. Dann ist die Rotationsfläche des Graphen von f um die z−Achse M = {(x, y, z) ∈ R3 : z ∈ I, x2 + y 2 = f (z)} eine zweidimensionale Mannigfaltigkeit: Bis auf eine Nullmenge ist sie durch die Karte I × ]0, 2π[ → R3 f (t) cos ϕ ψ(t, ϕ) = f (t) sin ϕ t ψ gegeben. Hier ist : ′ f (t) cos ϕ −f (t) sin ϕ ψ ′ (t) = f ′ (t) sin ϕ f (t) cos ϕ 1 0 (Rang 2). und Maßtensor bzw. Gramsche Determinante sind von der Form 1 + f ′ (t)2 0 g(t, ϕ) = und det g(t, ϕ) = f (t)2 (1 + f ′ (t)2 ). 0 f (t)2 Das Volumen der Rotationsfläche ist daher – sofern das Integral existiert – Z Z 2π Z p p ′ 2 f (t) 1 + f (t) dt dϕ = 2π f (t) 1 + f ′ (t)2 dt. vol (M ) = 0 I I 16.10 Der Gaußsche Integralsatz in R3 . Es sei U eine offene und beschränkte Menge in R3 . Der Rand von U sei eine 2-dimensionale Mannigfaltigkeit ∂U = M . Der äußere Einheitsnormalenvektor. Es sei x0 ein Randpunkt von U . In einer Umgebung von x0 sei der Rand gegeben durch die Abbildung ψ : T ⊂ R2 → R3 mit ψ(t0 ) = x0 für ein t0 ∈ T . Die Spaltenvektoren von ψ ′ (t0 ) spannen nach Annahme (ii) in 16.5 einen zweidimensionalen Teilraum von R3 auf. Es gibt also einen eindimensionalen Unterraum von R3 aus dazu senkrecht stehenden Vektoren. Wir wählen einen davon aus, der Norm = 1 hat (es gibt genau zwei!) und 48 nennen ihn ν. Nun gelte: Für jedes hinreichend kleine ε > 0 liege der Punkt x + εν außerhalb von U und der Punkt x − εν in U . Mit anderen Worten: ν zeigt stets nach außen. Wir nennen ν, genauer ν(x), den äußeren Einheitsnormalenvektor in x. Wir nehmen an, dass wir diese Wahl auf dem Rand stetig treffen können. Divergenz von Vektorfeldern. Es sei F : V → R3 ein stetig differenzierbares Vektorfeld, das auf einer Umgebung V von U ∪ M definiert ist. Die Divergenz von F ist die Funktion divF (x) = 3 X ∂xj Fj (x). j=1 Mit hF, νi bezeichnen wir das Skalarprodukt des Vektors F (x) mit dem äußeren Einheitsnormalenvektor ν(x) in x. Der Satz von Gauß besagt nun, dass Z Z hF (x), ν(x)i dS(x). div F (x)dx = ∂U U 16.11 Archimedisches Prinzip. Ein fester Körper A sei eingetaucht in eine Flüssigkeit der konstanten Dichte c > 0, deren Oberfläche mit der Ebene x3 = 0 in R3 zusammenfalle. Die Physik sagt uns, dass im Punkt x ∈ ∂A die Flüssigkeit einen Druck der Stärke cx3 ν(x) ausübt, wobei ν die äußere Normale ist (man beachte, dass x3 negativ ist und der Druck nach innen gerichtet ist). Die Gesamtauftriebskraft ist Z cx3 ν(x) dS(x); F = ∂A für jede Komponente Fj von F gilt also nach Gauß Z Z ∂x3 dx. cx3 νj (x) dS(x) = c Fj = A ∂xj ∂A Damit ist F1 = F2 = 0, während F3 = c Z 1 dx = c vol(A) A ist. Der Körper erfährt also eine nach oben gerichtete Auftriebskraft, die gleich dem Gewicht der verdrängten Flüssigkeit ist. 49