Mehrdimensionale Funktionen

Werbung
KAPITEL 1
Mehrdimensionale Funktionen
1. Abstände und Normen
Definition 1.1 (Norm). Sei V ein Vektorraum über einem Körper K mit K = R oder K = C. Eine
Abbildung k · k : V → R nennt man Norm, falls die folgenden drei Bedingungen erfüllt sind: (i) Für
x = 0 gilt kxk = 0 und für jedes x ∈ V \ {0} gilt kxk > 0. (ii) Für jedes x ∈ V und jedes λ ∈ R gilt
kλxk = |λ| kxk. (iii) Für alle x, y ∈ V gilt kx + yk ≤ kxk + kyk (Dreiecksungleichung).
p
Beispiele: Die durch k · k2 : Rn → R, kxk2 := x21 + · · · + x2n definierte Abbildung nennt man
euklidische Norm. Die durch k · k1 : Rn → R, kxk1 := |x1 | + · · · + |xn | definierte Abbildung nennt
man 1-Norm. Die durch k · kmax : Rn → R, kxkmax := max{|x1 |, . . . , |xn |} definierte Abbildung nennt
man Maximums-Norm.
Bemerkung: Es sei k · k eine Norm auf einem Vektorraum V über K = R, C, so nennt man
d(x, y) := kx − yk den Abstand von x zu y (bezüglich der Norm).
Für einen Abstand (bezüglich einer Norm) ergibt sich für alle x, y, z ∈ V (i) d(x, y) = 0 genau dann
wenn x = y; (ii) d(x, y) = d(y, x) und (iii) d(x, z) ≤ d(x, y) + d(y, z).
Lemma 1.2 (Die Cauchy-Schwarzsche Ungleichung). Für alle x, y ∈ Rn gilt (x> y) ≤ kxk2 · kyk2 .
Satz 1.3. Die euklidische Norm, die 1-Norm und die Maximums-Norm sind alles Normen auf Rn .
2. Topologische Eigenschaften
Definition 1.4 (Topologische Begriffe). Es sei Rn versehen mit einer Norm k · k.
a) Zu x ∈ Rn und > 0 nennen wir B (x) := {z ∈ Rn | kx − zk < } offene -Kugel um x. Im
Spezialfall n = 1 ist B (x) =]x − , x + [.
b) Es sei M eine Teilmenge von Rn . x ∈ M heißt innerer Punkt von M falls es ein > 0
gibt, so dass B (x) ⊂ M ist. Die Menge aller inneren Punkte heißt das Innere von M .
Schreibweise: M 0 .
c) M heißt offen, falls jeder Punkt innerer Punkt ist, d.h. falls A = Ao .
d) x heißt Berührpunkt von M , wenn für jedes > 0 gilt B (x) ∩ M 6= ∅. Die Menge aller
Berührpunkte heißt Abschluss von M . Schreibweise M .
e) x heißt Randpunkt von M , falls x Berührpunkt von M und von Rn \ M ist. Die Menge aller
Randpunkte von M heißt Rand von M . Schreibweise: ∂M . Es gilt ∂A = A \ Ao .
f) M heißt abgeschlossen falls Rn \ M offen ist. Es gilt A ist abgeschlossen, genau dann wenn
A = A.
g) Eine Menge M ⊂ R heißt beschränkt bezüglich einer Norm k · k falls es eine Zahl R ∈ R
gibt, so dass kxk ≤ R für jedes x ∈ M gilt.
h) Eine Teilmenge M ⊂ Rn heißt kompakt, falls sie abgeschlossen und beschränkt ist.
Bemerkung:
a) Für alle x ∈ Rn gilt: kxkmax ≤ kxk2 ≤ kxk1 ≤ nkxkmax .
b) Ist M beschränkt (offen, abgeschlossen, kompakt) bezüglich einer der Normen k · k1 , k · k2 oder
k · kmax , so ist M bezüglich aller dieser Normen beschränkt (offen, abgeschlossen, kompakt).
3. Konvergenz und Divergenz
Definition 1.5. Eine Abbildung a : N → Rn (bzw. a : N0 → Rn ) nennt man Folge. Statt a : N → Rn
schreibt man meist (ak )k∈N und ak statt a(k).
1
Definition 1.6 (Konvergenz, Divergenz, Grenzwert einer Folge, vergleiche Analysis in einer Variable).
Es sei (ak )k∈N eine Folge in Rn . Die Folge (ak )k∈N heißt konvergent falls ein a ∈ Rn mit folgender
Eigenschaft existiert: Zu jedem > 0 gibt es ein N ∈ N, so dass für alle k > N die Ungleichung
kak − ak < gilt. Der Wert a heißt in diesem Fall Grenzwert von (ak )k∈N . Wir schreiben auch
k→∞
limk→∞ ak = a oder ak −→ a. Hat (an )n∈N eine konvergente Teilfolge, nennt man deren Grenzwert
Häufungspunkt der Folge. Äquivalent dazu ist ein Häufungspunkt von (an )n∈N ein Punkt a ∈ Rn mit
der Eigenschaft, dass es zu jedem > 0 unendlich viele n ∈ N mit ka − an k < gibt. Eine Folge heißt
divergent falls sie nicht konvergent ist.
Satz 1.7. Eine Folge (xk )k∈N mit xk ∈ Rn konvergiert bezüglich der euklidischen Norm, genau dann
wenn Sie bezüglich der 1-Norm konvergiert und genau dann wenn sie bezüglich der Maximums-Norm
konvergiert.
Satz 1.8. Eine Folge (xk )k∈N mit xk ∈ Rn konvergiert genau dann wenn alle ihre Komponentenfolgen
konvergieren.
Definition 1.9 (Cauchy-Folge, vergleiche Analysis in einer Variable). Eine Folge (ak )k∈N heißt CauchyFolge falls es zu jedem > 0 ein N ∈ N gibt, so dass für alle k, m ≥ N die Abschätzung kak − am k < gilt.
Satz 1.10 (Cauchy-Konvergenzkriterium, vergleiche Analysis in einer Variable). Eine Folge in Rn ist
genau dann konvergent, wenn Sie eine Cauchy-Folge ist.
Satz 1.11 (Bolzano-Weierstraß, vergleiche Analysis in einer Variable, Satz. 2.6). Jede beschränkte Folge
hat eine konvergente Teilfolge.
4. Stetigkeit
Definition 1.12 (Stetigkeit). Es sei M ⊂ Rn und f : M → Rm eine Funktion. f heißt stetig im
Punkt x0 ∈ M , wenn zu jedem > 0 ein δ > 0 existiert, so dass für jedes y ∈ M mit ||x0 − y|| < δ auch
||f (x0 ) − f (y)|| < gilt. f heißt stetig auf M falls f für jedes x ∈ M stetig ist.
Satz 1.13 (Folgenstetigkeit). Es sei M ⊂ Rn . Eine Funktion M → Rm ist genau dann stetig im Punkt
a ∈ M wenn für alle Folgen (an )n∈N mit an ∈ M und an → a auch f (an ) → f (a) gilt.
Satz 1.14. Eine Funktion f : M → Rm ist genau dann stetig in a ∈ M , wenn alle Komponentenfunktionen fj : M → R, x 7→ (f (x))j stetig sind.
Satz 1.15 (Existenz von Maxima und Minima). Es sei K ⊂ Rn kompakt und f : K → R stetig. Dann
gilt: a) f nimmt auf K ein absolutes Maximum und ein absolutes Minimum an. b) Ist K zusätzlich
wegzusammenhängend, d.h. zu jedem Punktepaar x, y ∈ K gibt es eine stetige Funktion w : [0, 1] → R
mit w(0) = x und w(1) = y, dann ist f (K) = [a, b] wobei a das absolute Minimum und b das absolute
Maximum von f ist.
Bemerkung: Es gilt sogar: Es sei f : Rn → Rm stetig. Dann gilt a) Ist M ⊂ Rm offen, dann ist
auch f −1 (M ) offen. b) Ist M ⊂ Rm abgeschlossen, dann ist auch f −1 (M ) abgeschlossen. c) Ist K ⊂ Rn
kompakt, dann ist auch f (K) kompakt.
KAPITEL 2
Berechnung von Extrema
1. Partielle Ableitungen
Definition 2.1 (partielle Ableitung). Sei U ⊂ Rn offen und ej der j-te Einheitsvektor. Eine Funktion
f : U → R ist in x ∈ U partiell differenzierbar in der j-ten Komponente falls der Grenzwert
f (x + hej ) − f (x)
h→0
h
lim
∂f
existiert. Falls dieser Grenzwert existiert bezeichnet man diesen mit Dj f (x) oder mit ∂x
f (x). Dieser
j
Grenzwert wird auch j-te partielle Ableitung von f in x genannt. f heißt in x partiell differenzierbar, falls f für jedes j = 1, . . . , n in x partiell differenzierbar in der j-ten Komponente ist. f heißt
partiell differenzierbar, wenn es für alle x ∈ U partiell differenzierbar ist. f heißt stetig partiell
differenzierbar in x bzw. in U , wenn f partiell differenzierbar in x bzw. in U ist und jede partielle
Ableitung in x bzw. in U stetig ist.
Definition 2.2 (zweifach partiell differenzierbar). Sei U ⊂ Rn offen und f : U → R. Ist f partiell differenzierbar und sind sämtliche partiellen Ableitungen Dj f , j = 1, . . . , n wieder partiell differenzierbar,
so nennt man f zweifach partiell differenzierbar. Sind alle Abbildungen Di Dj f stetig, so nennt man f
zweifach stetig differenzierbar.
Satz 2.3 (Satz von Schwarz). Sei U offen und f : U → R zweifach stetig differenzierbar, so gilt
Di Dj f (x) = Dj Di f (x) für alle i, j = 1, . . . , n und alle x ∈ U .
2. Totale Differenzierbarkeit
Definition 2.4 (totale Differenzierbarkeit). Sei U ⊂ Rn offen und f : U → Rm . f heißt im Punkt
x ∈ U total differenzierbar, falls es eine lineare Abbildung A : Rn → Rm , eine Umgebung V ⊂ U
von x und eine Abbildung Rest : V → Rm gibt welche
Rest(h)
=0
h→0
khk
f (x + h) = f (x) + Ah + Rest(h) für h ∈ V und lim
erfüllen. Wir schreiben meist differenzierbar statt total differenzierbar. Achtung: A und Rest hängen
von x ab. Die lineare Abbildung A wird Ableitung von f im Punkt x genannt.
Satz 2.5. Sei U ⊂ Rn offen und f : U → Rm in x differenzierbar mit Ableitung


a11 . . . a1n

..  .
A =  ...
. 
am1 . . . amn
Dann gilt
a) f ist stetig in x,
b) Alle Komponentenfunktionen fi
:
U
→
R von f (x1 , . . . , xn )
=
(f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn )) sind partiell differenzierbar und es gilt Dj fi (x1 , . . . , xn ) =
aij .
3
Definition 2.6 (Gradient und Jacobi-Matrix). Die Ableitung in x einer differenzierbaren Funktion
f : U → Rm mit U ⊂ Rn offen nennt man Jacobi-Matrix. Schreibweise:


D1 f1 (x) . . . Dn f1 (x)


..
..
Df (x) = 

.
.
D1 fm (x) . . . Dn fm (x)
Im Fall m = 1 nennt man Df (x) den Gradienten von x. Schreibweise:
grad f (x) = (D1 f (x), · · · , Dn f (x)) .
Satz 2.7. Sei U ⊂ Rn offen und f : U → R in x partiell differenzierbar. Sämtliche partiellen Ableitungen
Dj f , j = 1, . . . , n seien stetig in x. Dann ist f total differenzierbar und stetig in x.
Satz 2.8 (Kettenregel). Es seien U ⊂ Rn und V ⊂ Rm offen. Für zwei Abbildungen f : U → Rm
und g : V → Rk gelte f (U ) ⊂ V . Weiter sei f in x ∈ U und g in y = f (x) differenzierbar. Dann ist
g ◦ f : U → Rk differenzierbar und es gilt
D(g ◦ f )(x) = Dg(f (x)) Df (x).
3. Die zweite Ableitung (Hesse Matrix)
Definition 2.9 (Hesse Matrix). Sei U ⊂ Rn offen und f : U → R zweimal partiell differenzierbar, so
nennen wir die Matrix


D1 D1 f (x) . . . Dn D1 f (x)


..
..
Hf (x) = 

.
.
D1 Dn f (x) . . . Dn Dn f (x)
die Hesse Matrix von f in x. Die Hesse Matrix ist also die Jacobimatrix des Gradienten und wird daher
auch zweite Ableitung von f in x genannt.
Satz 2.10 (Taylor Approximation zweiter Ordnung). Ist U ⊂ Rn offen und f : U → R zweimal stetig
differenzierbar, dann gilt für jedes x ∈ U für h aus einer genügend kleinen Umgebung von x
Rest(h)
1
= 0.
f (x + h) = f (x) + Df (x) · h + h> Hf (x)h + Rest(h) mit lim
h→0 khk2
2
4. Extremwerte
Definition 2.11 (Maxima und Minima). Ist M ⊂ Rn und f : M → R.
a) Ist x ∈ M derart, dass f (x) ≥ f (z) für alle z ∈ M gilt, so heißt f (x) (globales) Maximum
von f . Ist x ∈ M derart, dass f (x) ≤ f (z) für alle z ∈ M gilt, so heißt f (x) (globales)
Minimum von f . Ein globales Maximum (bzw. Minimum) nennt man isoliert (oder strikt)
falls sogar f (x) > f (z) (bzw. f (x) < f (z)) für alle z ∈ M \ {x} gilt.
b) Ist x ∈ M derart, dass es eine offene Menge U ⊂ M gibt, so dass x ∈ U ist und f (x) ≥ f (z)
für alle z ∈ U gilt, so heißt f (x) (lokales) Maximum von f . Ist x ∈ M derart, dass es
eine offene Menge U ⊂ M gibt, so dass x ∈ U ist und f (x) ≤ f (z) für alle z ∈ U gilt, so
heißt f (x) (lokales) Minimum von f . Ein lokales Maximum (bzw. Minimum) nennt man
isoliert (oder strikt) falls sogar f (x) > f (z) (bzw. f (x) < f (z)) für alle z ∈ U \ {x} gilt.
Satz 2.12 (Notwendiges Kriterium für lokale Extrema). Sei U ⊂ Rn offen und f : U → R partiell
differenzierbar. Hat f in x ein lokales Extremum (also ein lokales Minimum oder ein lokales Maximum)
so ist grad f (x) = 0. Bemerkung: Die Punkte mit der Eigenschaft grad f (x) = 0 nennt man die
kritischen Punkte von f .
Definition 2.13. Sei A ∈ Rn×n symmetrisch. Man nennt A
a)
b)
c)
d)
positiv definit, falls für alle x ∈ Rn \ {0} gilt: x> Ax > 0.
positiv semidefinit, falls für alle x ∈ Rn \ {0} gilt: x> Ax ≥ 0.
negativ definit, falls für alle x ∈ Rn \ {0} gilt: x> Ax < 0.
negativ semidefinit, falls für alle x ∈ Rn \ {0} gilt: x> Ax ≤ 0.
n
>
e) indefinit, falls es ein x1 ∈ Rn mit x>
1 Ax1 < 0 und ein x2 ∈ R mit x2 Ax2 > 0 gibt.
Satz 2.14 (Hinreichendes Kriterium für lokale Extrema). Sei U ⊂ Rn offen und f : U → R zweimal
stetig differenzierbar. Weiter sei x ein kritischer Punkt von f und Hf (x) die Hesse Matrix von f in x.
Nach dem Satz von Schwarz ist Hf (x) symmetrisch.
a) Ist Hf (x) positiv definit, d.h. h> Hf (x)h > 0 für alle h ∈ Rn \ {0}, so hat f in x ein isoliertes
lokales Minimum.
b) Ist Hf (x) symmetrisch negativ definit, d.h. h> Hf (x)h < 0 für alle h ∈ Rn \ {0} so hat f in
x ein isoliertes lokales Maximum.
c) Ist Hf (x) indefinit, d.h. h> Hf (x)h > 0 für ein h ∈ Rn und h̃> Hf (x)h̃ > 0 für ein h̃ ∈ Rn
so hat f in x weder ein lokales Minimum noch ein lokales Maximum.
Bemerkung: Aus positiver Semidefinitheit, d.h. h> Hf (x)h ≥ 0 für alle h ∈ Rn bzw. negativer Semidefinit, d.h. h> Hf (x)h ≤ 0 für alle h ∈ Rn , kann man nicht schließen, ob f ein lokales Minimum bzw.
ein lokales Maximum ist.
KAPITEL 3
Die Länge eines Weges
Definition 3.1 (Kurve). Eine stetige Funktion w : I → Rm mit einem Intervall I ⊂ R nennt man
0 (t)) den
Kurve oder Weg. Ist t im Inneren von I so nennt man den Vektor w0 (t) := (w10 (t), . . . , wm
Tangentialvektor von w in t. Eine Kurve heißt singulär in t falls w0 (t) = 0, sonst nicht-singulär.
Definition 3.2 (Länge). Es sei f : [a, b] → Rm eine Kurve. Wenn es ein L ∈ R mit der Eigenschaft:
Für jedes > 0 gibt es ein δ > 0, so dass für jede Unterteilung a := t0 < t1 < · · · < tk := b mit
tj − tj−1 < δ die Ungleichung
k
X
L −
< gilt,
kf
(t
)
−
f
(t
)k
j
j−1
2
j=1
so nennt man f → Rm rektifizierbar und L die Länge der Kurve.
Satz 3.3. Ist w : [a, b] → Rm ein stetig differenzierbarer Weg (d.h. jede Komponentenfunktion wi :
[a, b] → R, x 7→ wi (x) ist stetig differenzierbar) dann ist w rektifizierbar und die Länge von w ist
Z bq
Z b
0
0 (t)|2 dt.
|w10 (t)|2 + |w20 (t)|2 + · · · + |wm
kw (t)k2 dt =
L=
a
a
6
KAPITEL 4
Lokale Invertierbarkeit
Definition 4.1. Eine Abbildung f : U → Rn mit U ⊂ Rn heißt lokal invertierbar (lokal umkehrbar)
in x ∈ U , falls es eine offene Menge V ⊂ U mit x ∈ V gibt, so dass die Abbildung f˜ : V → f (V ),
x 7→ f (x) bijektiv ist.
Satz 4.2. Ist U ⊂ Rn offen und f : U → Rn stetig differenzierbar dann gilt: Ist Df (x) invertierbar, so
ist f in x lokal invertierbar. Für die lokale Umkehrfunktion f˜ : V → f (V ) gilt Df˜−1 (f (x)) = (Df (x))−1 .
7
Herunterladen