KAPITEL 1 Mehrdimensionale Funktionen 1. Abstände und Normen Definition 1.1 (Norm). Sei V ein Vektorraum über einem Körper K mit K = R oder K = C. Eine Abbildung k · k : V → R nennt man Norm, falls die folgenden drei Bedingungen erfüllt sind: (i) Für x = 0 gilt kxk = 0 und für jedes x ∈ V \ {0} gilt kxk > 0. (ii) Für jedes x ∈ V und jedes λ ∈ R gilt kλxk = |λ| kxk. (iii) Für alle x, y ∈ V gilt kx + yk ≤ kxk + kyk (Dreiecksungleichung). p Beispiele: Die durch k · k2 : Rn → R, kxk2 := x21 + · · · + x2n definierte Abbildung nennt man euklidische Norm. Die durch k · k1 : Rn → R, kxk1 := |x1 | + · · · + |xn | definierte Abbildung nennt man 1-Norm. Die durch k · kmax : Rn → R, kxkmax := max{|x1 |, . . . , |xn |} definierte Abbildung nennt man Maximums-Norm. Bemerkung: Es sei k · k eine Norm auf einem Vektorraum V über K = R, C, so nennt man d(x, y) := kx − yk den Abstand von x zu y (bezüglich der Norm). Für einen Abstand (bezüglich einer Norm) ergibt sich für alle x, y, z ∈ V (i) d(x, y) = 0 genau dann wenn x = y; (ii) d(x, y) = d(y, x) und (iii) d(x, z) ≤ d(x, y) + d(y, z). Lemma 1.2 (Die Cauchy-Schwarzsche Ungleichung). Für alle x, y ∈ Rn gilt (x> y) ≤ kxk2 · kyk2 . Satz 1.3. Die euklidische Norm, die 1-Norm und die Maximums-Norm sind alles Normen auf Rn . 2. Topologische Eigenschaften Definition 1.4 (Topologische Begriffe). Es sei Rn versehen mit einer Norm k · k. a) Zu x ∈ Rn und > 0 nennen wir B (x) := {z ∈ Rn | kx − zk < } offene -Kugel um x. Im Spezialfall n = 1 ist B (x) =]x − , x + [. b) Es sei M eine Teilmenge von Rn . x ∈ M heißt innerer Punkt von M falls es ein > 0 gibt, so dass B (x) ⊂ M ist. Die Menge aller inneren Punkte heißt das Innere von M . Schreibweise: M 0 . c) M heißt offen, falls jeder Punkt innerer Punkt ist, d.h. falls A = Ao . d) x heißt Berührpunkt von M , wenn für jedes > 0 gilt B (x) ∩ M 6= ∅. Die Menge aller Berührpunkte heißt Abschluss von M . Schreibweise M . e) x heißt Randpunkt von M , falls x Berührpunkt von M und von Rn \ M ist. Die Menge aller Randpunkte von M heißt Rand von M . Schreibweise: ∂M . Es gilt ∂A = A \ Ao . f) M heißt abgeschlossen falls Rn \ M offen ist. Es gilt A ist abgeschlossen, genau dann wenn A = A. g) Eine Menge M ⊂ R heißt beschränkt bezüglich einer Norm k · k falls es eine Zahl R ∈ R gibt, so dass kxk ≤ R für jedes x ∈ M gilt. h) Eine Teilmenge M ⊂ Rn heißt kompakt, falls sie abgeschlossen und beschränkt ist. Bemerkung: a) Für alle x ∈ Rn gilt: kxkmax ≤ kxk2 ≤ kxk1 ≤ nkxkmax . b) Ist M beschränkt (offen, abgeschlossen, kompakt) bezüglich einer der Normen k · k1 , k · k2 oder k · kmax , so ist M bezüglich aller dieser Normen beschränkt (offen, abgeschlossen, kompakt). 3. Konvergenz und Divergenz Definition 1.5. Eine Abbildung a : N → Rn (bzw. a : N0 → Rn ) nennt man Folge. Statt a : N → Rn schreibt man meist (ak )k∈N und ak statt a(k). 1 Definition 1.6 (Konvergenz, Divergenz, Grenzwert einer Folge, vergleiche Analysis in einer Variable). Es sei (ak )k∈N eine Folge in Rn . Die Folge (ak )k∈N heißt konvergent falls ein a ∈ Rn mit folgender Eigenschaft existiert: Zu jedem > 0 gibt es ein N ∈ N, so dass für alle k > N die Ungleichung kak − ak < gilt. Der Wert a heißt in diesem Fall Grenzwert von (ak )k∈N . Wir schreiben auch k→∞ limk→∞ ak = a oder ak −→ a. Hat (an )n∈N eine konvergente Teilfolge, nennt man deren Grenzwert Häufungspunkt der Folge. Äquivalent dazu ist ein Häufungspunkt von (an )n∈N ein Punkt a ∈ Rn mit der Eigenschaft, dass es zu jedem > 0 unendlich viele n ∈ N mit ka − an k < gibt. Eine Folge heißt divergent falls sie nicht konvergent ist. Satz 1.7. Eine Folge (xk )k∈N mit xk ∈ Rn konvergiert bezüglich der euklidischen Norm, genau dann wenn Sie bezüglich der 1-Norm konvergiert und genau dann wenn sie bezüglich der Maximums-Norm konvergiert. Satz 1.8. Eine Folge (xk )k∈N mit xk ∈ Rn konvergiert genau dann wenn alle ihre Komponentenfolgen konvergieren. Definition 1.9 (Cauchy-Folge, vergleiche Analysis in einer Variable). Eine Folge (ak )k∈N heißt CauchyFolge falls es zu jedem > 0 ein N ∈ N gibt, so dass für alle k, m ≥ N die Abschätzung kak − am k < gilt. Satz 1.10 (Cauchy-Konvergenzkriterium, vergleiche Analysis in einer Variable). Eine Folge in Rn ist genau dann konvergent, wenn Sie eine Cauchy-Folge ist. Satz 1.11 (Bolzano-Weierstraß, vergleiche Analysis in einer Variable, Satz. 2.6). Jede beschränkte Folge hat eine konvergente Teilfolge. 4. Stetigkeit Definition 1.12 (Stetigkeit). Es sei M ⊂ Rn und f : M → Rm eine Funktion. f heißt stetig im Punkt x0 ∈ M , wenn zu jedem > 0 ein δ > 0 existiert, so dass für jedes y ∈ M mit ||x0 − y|| < δ auch ||f (x0 ) − f (y)|| < gilt. f heißt stetig auf M falls f für jedes x ∈ M stetig ist. Satz 1.13 (Folgenstetigkeit). Es sei M ⊂ Rn . Eine Funktion M → Rm ist genau dann stetig im Punkt a ∈ M wenn für alle Folgen (an )n∈N mit an ∈ M und an → a auch f (an ) → f (a) gilt. Satz 1.14. Eine Funktion f : M → Rm ist genau dann stetig in a ∈ M , wenn alle Komponentenfunktionen fj : M → R, x 7→ (f (x))j stetig sind. Satz 1.15 (Existenz von Maxima und Minima). Es sei K ⊂ Rn kompakt und f : K → R stetig. Dann gilt: a) f nimmt auf K ein absolutes Maximum und ein absolutes Minimum an. b) Ist K zusätzlich wegzusammenhängend, d.h. zu jedem Punktepaar x, y ∈ K gibt es eine stetige Funktion w : [0, 1] → R mit w(0) = x und w(1) = y, dann ist f (K) = [a, b] wobei a das absolute Minimum und b das absolute Maximum von f ist. Bemerkung: Es gilt sogar: Es sei f : Rn → Rm stetig. Dann gilt a) Ist M ⊂ Rm offen, dann ist auch f −1 (M ) offen. b) Ist M ⊂ Rm abgeschlossen, dann ist auch f −1 (M ) abgeschlossen. c) Ist K ⊂ Rn kompakt, dann ist auch f (K) kompakt. KAPITEL 2 Berechnung von Extrema 1. Partielle Ableitungen Definition 2.1 (partielle Ableitung). Sei U ⊂ Rn offen und ej der j-te Einheitsvektor. Eine Funktion f : U → R ist in x ∈ U partiell differenzierbar in der j-ten Komponente falls der Grenzwert f (x + hej ) − f (x) h→0 h lim ∂f existiert. Falls dieser Grenzwert existiert bezeichnet man diesen mit Dj f (x) oder mit ∂x f (x). Dieser j Grenzwert wird auch j-te partielle Ableitung von f in x genannt. f heißt in x partiell differenzierbar, falls f für jedes j = 1, . . . , n in x partiell differenzierbar in der j-ten Komponente ist. f heißt partiell differenzierbar, wenn es für alle x ∈ U partiell differenzierbar ist. f heißt stetig partiell differenzierbar in x bzw. in U , wenn f partiell differenzierbar in x bzw. in U ist und jede partielle Ableitung in x bzw. in U stetig ist. Definition 2.2 (zweifach partiell differenzierbar). Sei U ⊂ Rn offen und f : U → R. Ist f partiell differenzierbar und sind sämtliche partiellen Ableitungen Dj f , j = 1, . . . , n wieder partiell differenzierbar, so nennt man f zweifach partiell differenzierbar. Sind alle Abbildungen Di Dj f stetig, so nennt man f zweifach stetig differenzierbar. Satz 2.3 (Satz von Schwarz). Sei U offen und f : U → R zweifach stetig differenzierbar, so gilt Di Dj f (x) = Dj Di f (x) für alle i, j = 1, . . . , n und alle x ∈ U . 2. Totale Differenzierbarkeit Definition 2.4 (totale Differenzierbarkeit). Sei U ⊂ Rn offen und f : U → Rm . f heißt im Punkt x ∈ U total differenzierbar, falls es eine lineare Abbildung A : Rn → Rm , eine Umgebung V ⊂ U von x und eine Abbildung Rest : V → Rm gibt welche Rest(h) =0 h→0 khk f (x + h) = f (x) + Ah + Rest(h) für h ∈ V und lim erfüllen. Wir schreiben meist differenzierbar statt total differenzierbar. Achtung: A und Rest hängen von x ab. Die lineare Abbildung A wird Ableitung von f im Punkt x genannt. Satz 2.5. Sei U ⊂ Rn offen und f : U → Rm in x differenzierbar mit Ableitung a11 . . . a1n .. . A = ... . am1 . . . amn Dann gilt a) f ist stetig in x, b) Alle Komponentenfunktionen fi : U → R von f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn )) sind partiell differenzierbar und es gilt Dj fi (x1 , . . . , xn ) = aij . 3 Definition 2.6 (Gradient und Jacobi-Matrix). Die Ableitung in x einer differenzierbaren Funktion f : U → Rm mit U ⊂ Rn offen nennt man Jacobi-Matrix. Schreibweise: D1 f1 (x) . . . Dn f1 (x) .. .. Df (x) = . . D1 fm (x) . . . Dn fm (x) Im Fall m = 1 nennt man Df (x) den Gradienten von x. Schreibweise: grad f (x) = (D1 f (x), · · · , Dn f (x)) . Satz 2.7. Sei U ⊂ Rn offen und f : U → R in x partiell differenzierbar. Sämtliche partiellen Ableitungen Dj f , j = 1, . . . , n seien stetig in x. Dann ist f total differenzierbar und stetig in x. Satz 2.8 (Kettenregel). Es seien U ⊂ Rn und V ⊂ Rm offen. Für zwei Abbildungen f : U → Rm und g : V → Rk gelte f (U ) ⊂ V . Weiter sei f in x ∈ U und g in y = f (x) differenzierbar. Dann ist g ◦ f : U → Rk differenzierbar und es gilt D(g ◦ f )(x) = Dg(f (x)) Df (x). 3. Die zweite Ableitung (Hesse Matrix) Definition 2.9 (Hesse Matrix). Sei U ⊂ Rn offen und f : U → R zweimal partiell differenzierbar, so nennen wir die Matrix D1 D1 f (x) . . . Dn D1 f (x) .. .. Hf (x) = . . D1 Dn f (x) . . . Dn Dn f (x) die Hesse Matrix von f in x. Die Hesse Matrix ist also die Jacobimatrix des Gradienten und wird daher auch zweite Ableitung von f in x genannt. Satz 2.10 (Taylor Approximation zweiter Ordnung). Ist U ⊂ Rn offen und f : U → R zweimal stetig differenzierbar, dann gilt für jedes x ∈ U für h aus einer genügend kleinen Umgebung von x Rest(h) 1 = 0. f (x + h) = f (x) + Df (x) · h + h> Hf (x)h + Rest(h) mit lim h→0 khk2 2 4. Extremwerte Definition 2.11 (Maxima und Minima). Ist M ⊂ Rn und f : M → R. a) Ist x ∈ M derart, dass f (x) ≥ f (z) für alle z ∈ M gilt, so heißt f (x) (globales) Maximum von f . Ist x ∈ M derart, dass f (x) ≤ f (z) für alle z ∈ M gilt, so heißt f (x) (globales) Minimum von f . Ein globales Maximum (bzw. Minimum) nennt man isoliert (oder strikt) falls sogar f (x) > f (z) (bzw. f (x) < f (z)) für alle z ∈ M \ {x} gilt. b) Ist x ∈ M derart, dass es eine offene Menge U ⊂ M gibt, so dass x ∈ U ist und f (x) ≥ f (z) für alle z ∈ U gilt, so heißt f (x) (lokales) Maximum von f . Ist x ∈ M derart, dass es eine offene Menge U ⊂ M gibt, so dass x ∈ U ist und f (x) ≤ f (z) für alle z ∈ U gilt, so heißt f (x) (lokales) Minimum von f . Ein lokales Maximum (bzw. Minimum) nennt man isoliert (oder strikt) falls sogar f (x) > f (z) (bzw. f (x) < f (z)) für alle z ∈ U \ {x} gilt. Satz 2.12 (Notwendiges Kriterium für lokale Extrema). Sei U ⊂ Rn offen und f : U → R partiell differenzierbar. Hat f in x ein lokales Extremum (also ein lokales Minimum oder ein lokales Maximum) so ist grad f (x) = 0. Bemerkung: Die Punkte mit der Eigenschaft grad f (x) = 0 nennt man die kritischen Punkte von f . Definition 2.13. Sei A ∈ Rn×n symmetrisch. Man nennt A a) b) c) d) positiv definit, falls für alle x ∈ Rn \ {0} gilt: x> Ax > 0. positiv semidefinit, falls für alle x ∈ Rn \ {0} gilt: x> Ax ≥ 0. negativ definit, falls für alle x ∈ Rn \ {0} gilt: x> Ax < 0. negativ semidefinit, falls für alle x ∈ Rn \ {0} gilt: x> Ax ≤ 0. n > e) indefinit, falls es ein x1 ∈ Rn mit x> 1 Ax1 < 0 und ein x2 ∈ R mit x2 Ax2 > 0 gibt. Satz 2.14 (Hinreichendes Kriterium für lokale Extrema). Sei U ⊂ Rn offen und f : U → R zweimal stetig differenzierbar. Weiter sei x ein kritischer Punkt von f und Hf (x) die Hesse Matrix von f in x. Nach dem Satz von Schwarz ist Hf (x) symmetrisch. a) Ist Hf (x) positiv definit, d.h. h> Hf (x)h > 0 für alle h ∈ Rn \ {0}, so hat f in x ein isoliertes lokales Minimum. b) Ist Hf (x) symmetrisch negativ definit, d.h. h> Hf (x)h < 0 für alle h ∈ Rn \ {0} so hat f in x ein isoliertes lokales Maximum. c) Ist Hf (x) indefinit, d.h. h> Hf (x)h > 0 für ein h ∈ Rn und h̃> Hf (x)h̃ > 0 für ein h̃ ∈ Rn so hat f in x weder ein lokales Minimum noch ein lokales Maximum. Bemerkung: Aus positiver Semidefinitheit, d.h. h> Hf (x)h ≥ 0 für alle h ∈ Rn bzw. negativer Semidefinit, d.h. h> Hf (x)h ≤ 0 für alle h ∈ Rn , kann man nicht schließen, ob f ein lokales Minimum bzw. ein lokales Maximum ist. KAPITEL 3 Die Länge eines Weges Definition 3.1 (Kurve). Eine stetige Funktion w : I → Rm mit einem Intervall I ⊂ R nennt man 0 (t)) den Kurve oder Weg. Ist t im Inneren von I so nennt man den Vektor w0 (t) := (w10 (t), . . . , wm Tangentialvektor von w in t. Eine Kurve heißt singulär in t falls w0 (t) = 0, sonst nicht-singulär. Definition 3.2 (Länge). Es sei f : [a, b] → Rm eine Kurve. Wenn es ein L ∈ R mit der Eigenschaft: Für jedes > 0 gibt es ein δ > 0, so dass für jede Unterteilung a := t0 < t1 < · · · < tk := b mit tj − tj−1 < δ die Ungleichung k X L − < gilt, kf (t ) − f (t )k j j−1 2 j=1 so nennt man f → Rm rektifizierbar und L die Länge der Kurve. Satz 3.3. Ist w : [a, b] → Rm ein stetig differenzierbarer Weg (d.h. jede Komponentenfunktion wi : [a, b] → R, x 7→ wi (x) ist stetig differenzierbar) dann ist w rektifizierbar und die Länge von w ist Z bq Z b 0 0 (t)|2 dt. |w10 (t)|2 + |w20 (t)|2 + · · · + |wm kw (t)k2 dt = L= a a 6 KAPITEL 4 Lokale Invertierbarkeit Definition 4.1. Eine Abbildung f : U → Rn mit U ⊂ Rn heißt lokal invertierbar (lokal umkehrbar) in x ∈ U , falls es eine offene Menge V ⊂ U mit x ∈ V gibt, so dass die Abbildung f˜ : V → f (V ), x 7→ f (x) bijektiv ist. Satz 4.2. Ist U ⊂ Rn offen und f : U → Rn stetig differenzierbar dann gilt: Ist Df (x) invertierbar, so ist f in x lokal invertierbar. Für die lokale Umkehrfunktion f˜ : V → f (V ) gilt Df˜−1 (f (x)) = (Df (x))−1 . 7