Analysis Skriptum zur Vorlesung im Wintersemester 2012 Version

Analysis
Skriptum zur Vorlesung im Wintersemester 2012
Version 2.2 vom 28.1.2013
Bernhard Lamel
KAPITEL 1
Stetigkeit und Vollständigkeit
1. Wiederholung: Stetigkeit von (reellen) Funktionen
Sei X ⊂ R eine Menge, und f : X → R eine Funktion. Wir sagen, dass f stetig am Punkt x0 ∈ X ist, wenn
für jede Folge (xj )j∈N mit xj ∈ X für alle j ∈ N, welche xj → x0 (j → ∞) erfüllt, f (xj ) → f (x0 ) (j → ∞)
gilt. Es gibt natürlich noch viele andere Charakterisierungen von Stetigkeit:
Lemma 1. f : R ⊃ X → R ist stetig am Punkt x0 ∈ X genau dann, wenn für jedes ε > 0 ein δ = δ(ε) > 0
existiert sodass
|f (x) − f (x0 )| < ε, wenn x ∈ X und |x − x0 | < δ.
Beweis. Sei die Bedingung des Lemmas erfüllt, und (xj )j∈N eine beliebige Folge in X mit xj → x0 (j →
∞). Wir wollen zeigen, dass limj→∞ f (xj ) = f (x0 ) ist. Sei also ε > 0 beliebig; nach der Bedingung des
Lemmas können wir also ein δ > 0 wählen, sodass |f (x) − f (x0 )| < ε, wenn x ∈ X und |x − x0 | < δ. Da
limj→∞ xj = x0 , gibt es ein N = N (δ) sodass für alle j ≥ N |xj − x0 | < δ gilt. Konsequenterweise ist also
|f (xj ) − f (x0 )| < ε für j ≥ N . Das bedeutet aber, dass limj→∞ f (xj ) = f (x0 ) gilt.
Wenn nun andererseits die Bedingung des Lemmas nicht erfüllt ist, so gibt es ein ε0 > 0 sodass für jedes
δ > 0 ein xδ ∈ X existiert mit |xδ − x0 | < δ, aber |f (x) − f (x0 )| ≥ ε. Insbesondere können wir also für jedes
j ∈ N ein xj ∈ X finden, sodass |xj − x0 | < 1/j, aber |f (xj ) − f (x0 )| ≥ ε0 . Damit ist limj xj = x0 , aber
f (xj ) kann nicht gegen f (x0 ) konvergieren; also ist f nicht stetig im Punkt x0 .
Eine Umgebung von x0 ∈ R ist eine Menge U ⊂ R, welche für genügend kleine ε > 0 die Menge
Bε (x0 ) = {x : |x − x0 | < ε} (den ε-“Ball” um x0 ) enthält; eine Menge U ⊂ X ⊂ R ist eine (relative)
Umgebung von x0 ∈ X (in X) wenn es ein ε > 0 gibt, sodass Bε (x0 ) ∩ X ⊂ U
Wir können dann auch wie folgt formulieren:
Übungsaufgabe 1. a) Eine Funktion f : R ⊃ X → R ist stetig am Punkt x0 ∈ X genau dann, wenn es für
jede Umgebung V von f (x0 ) eine relative Umgebung U von x0 in X mit f (U ) ⊂ V gibt.
b) Eine Funktion f : R ⊃ X → R ist stetig am Punkt x0 ∈ X genau dann, wenn für jede Umgebung V von
f (x0 ) die Menge f −1 (V ) eine relative Umgebung von x0 in X ist.
Bemerkung 1. Wir werden später zwischen dem Stetigkeitsbegriff, den wir hier als Ausgangspunkt gewählt
haben, und der Charakterisierung in Lemma 1 unterscheiden müssen; wenn wir dies tun müssen, so werden
wir die naheliegende Bezeichnung “Folgenstetigkeit” dafür verwenden.
Eine Funktion f : R ⊃ X → R ist stetig auf X, wenn sie in jedem Punkt x0 ∈ X stetig ist. Auch hier
können wir eine weitere Charakterisierung geben: Wir sagen, eine Menge U ⊂ X ist offen, wenn sie mit
jedem Punkt x0 eine Umgebung dieses Punktes enthält, oder anders ausgedrückt, wenn sie Umgebung jedes
ihrer Punkte ist. F ⊂ X ist abgeschlossen, wenn F c ⊂ X offen ist.
Übungsaufgabe 2. f : R ⊃ X → R ist stetig auf X genau dann, wenn für jede offene Menge U ⊂ R f −1 (U )
offen in X ist. Kannst Du eine Charakterisierung der Stetigkeit mit Hilfe von abgeschlossenen Mengen geben?
Übungsaufgabe 3. Zeige, dass X ⊂ R genau dann abgeschlossen ist, wenn der Grenzwert jeder konvergenten Folge von Punkten in X selber zu X gehört.
Wir halten folgende Tatsach über offene Teilmengen von R fest:
3
Lemma 2. Sei U ⊂ R offen. Dann existiert eine abzählbare (oder endliche) Menge von offenen, paarweise
disjunkten Intervallen Ij = (aj , bj ), j ∈ J mit
[
U=
Ij .
j∈J
Beweis. Für x ∈ U definieren wir
a(x) = inf{a ∈ R : (a, x] ⊂ U },
b(x) = sup{b ∈ R : [x, b) ⊂ U },
wobei wir a(x) = −∞ bzw. b(x) = +∞ setzen, wenn die Menge nicht nach unten bzw. oben beschränkt ist.
Wir überprüfen dann, dass die Zerlegung
[
U=
(a(x), b(x))
x∈U
eine Partition von U ist. Indem wir aus jeder Äquivalenzklasse der so induzierten Äquivalenzrelation auf U
einen rationalen Repräsentanten xj , j ∈ J, wählen (dies ist möglich, da jedes offene Intervall auch rationale Zahlen enthält), sehen wir, dass höchstens abzählbar viele Äquivalenzklassen auftreten. Die gesuchte
Zerlegung ist nun durch
[
U=
(a(xj ), b(xj ))
j∈J
gegeben.
2. Wiederholung: Vollständigkeit
2.1. Die Supremumseigenschaft. Das Supremum sup X einer nach oben beschränkten nichtleeren
Menge ∅ 6= X ⊂ R ist die kleinste obere Schranke von X. Das heisst: x ≤ sup X für alle x ∈ X, und wenn
A ∈ R eine Zahl mit x ≤ A für alle x ∈ X ist, so ist sup X ≤ A. Eine äquivalente Formulierung ist, dass es
keine reelle Zahl B mit x ≤ B < sup X für alle x ∈ X gibt, oder positiv formuliert: Für alle ε > 0 gibt es ein
x ∈ X mit sup X − ε ≤ x ≤ sup X. Die Existenz des Supremums einer nach oben beschränkten Teilmenge
ist eine definierende Eigenschaft des Körpers der reellen Zahlen.
Übungsaufgabe 4. Zeige, dass es äquivalent ist, die Existenz des Infimums inf X jeder nach unten beschränkten Teilmenge X ⊂ R zu fordern, und gib eine ε–Charakterisierung des Infimums.
2.2. Vollständigkeit und Folgen. Die Supremumseigenschaft zeigt, dass monotone Folgen einen
Grenzwert haben:
Lemma 3. Sei (xj )j∈N eine monotone, nach oben beschränkte Folge von reellen Zahlen, i.e. x1 ≤ x2 ≤
· · · ≤ xj ≤ xj+1 ≤ · · · ≤ A für ein A ∈ R. Dann konvergiert (xj )j∈N , genauer gesagt,
lim xj = sup{xj : j ∈ N}.
j→∞
Übungsaufgabe 5. Beweise Lemma 3 und zeige, dass eine analoge Aussage für monoton fallende, nach
unten beschränkte Folgen gilt.
Wir erinnern daran, dass ein Häufungswert einer Folge (xj )j∈N ein Punkt mit der Eigenschaft ist, dass
jede Umgebung dieses Punktes unendlich viele der xj enthält. Besonders wichtig sind der grösste und der
kleinste Häufungswert einer Folge, der lim supj→∞ xj und lim inf j→∞ xj . Wir sagen, dass lim supj→∞ xj = x0
wenn es für alle ε > 0 und n ∈ N ein j ∈ N mit n ≤ j gibt, sodass |xj −x0 | < ε, und die Menge {j : xj > x0 +ε}
endlich ist.
Die Existenz des lim sup ist wiederum ein Ausdruck der Vollständigkeit:
Lemma 4. Sei (xj )j∈N eine beschränkte Folge. Dann gibt es den lim supj xj , genauer gesagt,
lim sup xj = lim (sup{xj : j ≥ k}) .
j→∞
k→∞
4
Beweis. Zunächst bemerken wir, dass die Existenz des Grenzwerts limk→∞ (sup{xj : j ≥ k}) aus Lemma 3 folgt, da hier der Grenzwert einer beschränkten monotonen Folge gebildet wird. Sei nun ε > 0 und
n ∈ N. Dann gibt es ein N ∈ N sodass für alle k ≥ N
|sup{xj : j ≥ k} − x0 | ≤ ε/2
ist. Insbesondere ist die Menge {j : xj > x0 +ε} ⊂ {1, . . . , N } und damit endlich. Sei nun k ≥ N . Wir können
ein j ≥ k wählen mit
sup{xj : j ≥ k} − ε ≤ xj ≤ sup{xj : j ≥ k}.
Damit ist |xj − x0 | ≤ |xj − sup{xj : j ≥ k}| + | sup{xj : j ≥ k} − x0 | ≤ ε.
Eine andere Folgerung aus der Vollständigkeit, die wir in allgemeineren Situationen als definierende
Eigenschaft wählen werden, ist die Cauchy-Eigenschaft. Wir sagen, eine Folge (xj )j∈N ist eine Cauchyfolge,
wenn für jedes ε > 0 ein N ∈ N existiert, sodass |xj − xk | ≤ ε, wenn j, k ≥ N .
Übungsaufgabe 6. Zeige, dass (xj ) genau dann eine Cauchfolge ist, wenn für jedes ε > 0 ein N ∈ N
existiert, sodass |xj − xN | ≤ ε, wenn j ≥ N .
Lemma 5. Sei (xj )j∈N eine Cauchfolge. Dann konvergiert xj , genauer gesagt, limj→∞ xj = lim supj→∞ xj .
Beweis. Sei ε > 0. Dann gibt es ein N ∈ N mit |xj − xk | < ε/2 für j, k ≥ N . Auf der anderen Seite
gibt es ein k mit k ≥ N und | lim supj→∞ xj − xk | < ε/2. Damit ist für j ≥ N
|xj − lim sup xj | ≤ |xj − xk | + |xk − lim sup xj | < ε.
j→∞
j→∞
P∞
Pk
Übungsaufgabe 7. Seien aj ≥ 0 mit
j=1 aj < ∞, i.e. die Folge der Partialsummen Sk =
j=1 aj
sei konvergent. Weiters sei eine Folge bj mit |bj | ≤ aj gegeben. Dann konvergiert auch die Summe der
Pk
P∞
Partialsummen j=1 bj , i.e. j=1 bj existiert.
Definition 1. Wir sagen, eine Menge X ⊂ R ist (folgen)kompakt, wenn jede Folge (xj ) von Punkten in X
eine gegen einen Punkt in X konvergente Teilfolge besitzt.
Lemma 6. X ⊂ R ist kompakt genau dann, wenn eine der folgenden Eigenschaften erfüllt ist:
Heine-Borel Eigenschaft: X ist beschränkt und abgeschlossen.
Überdeckungskompaktheit: Jede Überdeckung von X durch offene Mengen
S∞ Uα , α ∈ A enthält eine endliche
Teilüberdeckung, das heisst, es existieren α1 , . . . , αN mit X = j=1 Uαj .
Beweis. Nehmen wir an, X ist kompakt. Dann ist die Heine-Borel Eigenschaft erfüllt: Wenn X nicht
beschränkt ist, so gibt es eine Folge xj von Punkten in X mit |xj | > j; diese kann keine konvergente Teilfolge
beinhalten. Auf der anderen Seite folgt aus der Definition der Kompaktheit, dass jeder Punkt x, welcher
ein Grenzwert einer Folge in X ist, zu X gehören muss (jede Teilfolge einer konvergenten Folge ist ja selber
konvergent mit demselben Grenzwert). Damit ist X auch abgeschlossen.
Sei nun X beschränkt und abgeschlossen. Wenn (xj )j∈N eine Folge von Punkten in X ist, so gibt es den
lim supj→∞ xj := x0 . Nach Definition des lim sup gibt es eine Teilfolge von (xj ), welche gegen x0 konvergiert.
Da X abgeschlossen ist, ist x0 ∈ X, also ist X kompakt.
Sei nun wiederum X kompakt, und Uα (α ∈ A) eine offene Überdeckung von X; wir können annehmen,
dass A = N abzählbar ist (warum?). Falls (UnS
)n∈N keine endliche offene Teilüberdeckung enthält, so können
wir eine Folge von Punkten xj in X mit xj ∈
/ k≤j Uαk . Da X kompakt ist, konvergiert eine Teilfolge von xj
gegen x0 ∈ X. Dann existiert ein k0 mit x0 ∈ Uk0 . Damit ist xj ∈ Uk0 für j genügend gross, was für j ≥ k0
ein Widerspruch zur Definition der xj ist; also muss Un eine endliche Teilüberdeckung besitzen.
Falls jede offene Überdeckung X eine endliche Teilüberdeckung enthält, so ist X beschränkt und abgeschlossen: Dazu betrachten wir die Überdeckung von X durch die offenen Mengen Uj := X ∩ (−j, j),
um die Beschränktheit von X festzustellen. Wenn x ∈
/ X, so können wir X durch die Mengen Un =
X ∩ ([x − 1/n, x + 1/n]c ) überdecken. Da endlich viele dieser Mengen ausreichen, um X zu überdecken,
gibt es ein n ∈ N mit (x − 1/n, x + 1/n) ⊂ X c , also ist X c offen (es enthält eine Umgebung jedes seiner
Punkte) und damit X abgeschlossen.
5
2.3. Vollständigkeit und Werte stetiger Funktionen. Eine weitere wichtige Folgerung aus der
Vollständigkeit ist der Zwischenwertsatz:
Satz 1. Sei f : R ⊃ [a, b] → R stetig, mit f (a) ≤ y ≤ f (b). Dann gibt es ein c ∈ [a, b] mit f (c) = y.
Beweis. Sei X = {x ∈ [a, b] : f (x) < y}. Dann ist c := sup X ∈ [a, b]. Wir behaupten, dass f (c) = y ist.
Dies ist trivial zu überprüfen, wenn c = b; ist c = a, so gibt es eine Folge aj mit aj → a für j → ∞, und da
f (aj ) → f (a), folgt f (a) ≥ y, also f (a) = y.
Nehmen wir also im folgenden an, dass a < c < b ist. Dann betrachten wir zunächst die Folge cj = c−1/j
(für j ≥ k für ein k ∈ N ist cj ∈ [a, b]), und sehen, dass
f (c) = lim f (cj ) ≤ y.
j→∞
Auf der anderen Seite können wir eine Folge dj mit c < dj < c + 1/j betrachten, welche f (dj ) ≥ y erfüllt.
Damit sehen wir, dass
f (c) = lim f (dj ) ≥ y
j→∞
ist. Also folgt y = f (c) wie gewünscht.
Übungsaufgabe 8. Zeige, dass ein Polynom ungeraden Grades p(x) = ax2k+1 + . . . , a 6= 0, als Funktion
p : R → R aufgefasst, surjektiv ist.
Übungsaufgabe 9. Sei f : R ⊃ [a, b] → [a, b] stetig. Dann hat f einen Fixpunkt in [a, b], das heisst, es gibt
ein x ∈ [a, b] mit f (x) = x.
Auf einer kompakten Menge werden das Maximum und das Minimum der Werte angenommen:
Satz 2. Sei f : R ⊃ X → R stetig auf der kompakten Menge X. Dann existieren minx∈X f (x) und
maxx∈X f (x).
Beweis. Wir zeigen zunächst, dass f (X) beschränkt ist. Angenommen, das ist nicht der Fall: Dann gibt
es eine Folge yj = f (xj ) von Punkten in f (X) mit |yj | > j. Da X kompakt ist, können wir nun eine Teilfolge
der xj wählen, welche gegen x0 ∈ X konvergiert. Da f stetig auf X ist, erhalten wir einen Widerspruch.
Nun existiert also supx∈X f (x), und für jedes n ∈ N können wir ein xn ∈ X wählen sodass f (xn ) >
supx∈X f (x) − 1/n. Wir wählen nun eine Teilfolge xnk welche gegen x0 ∈ X konvergiert. Dann ist
1
= sup f (x).
sup f (x) ≥ f (x0 ) = lim f (xnk ) ≥ lim sup f (x) −
k→∞
k→∞ x∈X
n
x∈X
x∈X
3. Stetigkeit im Allgemeinen: Topologische Räume
Stetigkeit von Funktionen wird zweckmässigerweise mit Hilfe einer Topologie auf einem Raum behandelt.
Eine Topologie T auf einer Menge X ist eine Familie T von Teilmengen von X, welche abgeschlossen unter
beliebigen Vereinigungen und endlichen Durchschnitten ist, und ∅, X ∈ T erfüllt; die Elemente von T werden
als offene Mengen bezeichnet. Um die Eigenschaften nochmal genauer zu formulieren: ist Uα , α ∈ A, eine
Familie offener Teilmengen von X, so ist ∪α Uα offen, und mit zwei offenen Mengen U1 , U2 ist auch U1 ∩ U2 .
Ein topologischer Raum ist eine Menge mit einer Topologie.
Topologien sind sehr allgemeine Objekte; das heisst, dass man mit ihrer Hilfe grundlegende Eigenschaften stetiger Funktionen für sehr grosse Klassen von Objekten beschreiben kann. Diese Macht kommt mit
einem Preis: Man muss in Kauf nehmen, dass wichtige Eigenschaften (die für gewisse Objekte klarerweise
erfüllt sind) hier erst definiert werden müssen. Auch ist es oft umständlich, spezifische Eigenschaften in diesem allgemeinen Kontext zu definieren und zu untersuchen. Wir werden deswegen relativ rasch zu weniger
allgemeinen Räumen übergehen.
Beispiel 1. i) T = {X, ∅} ist eine Topologie auf jedem Raum X, die triviale Topologie.
ii) T = 2X , die Potenzmenge von X, ist auch eine Topologie auf X für jede Menge X, die diskrete Topologie.
iii) Ist Y ⊂ X, so erhält Y eine Topologie (die Teilraumtopologie) indem man TY = {V ∩ Y : V ∈ T} setzt.
iv) Die “gewöhnliche” Topologie auf R ist jene, die wir schon vorher erklärt haben: Eine Menge U ⊂ R ist
offen, wenn für jedes x ∈ U ein ε = ε(x) existiert, sodass (x − ε, x + ε) ⊂ U .
6
Die Elemente von T werden die offenen Mengen in X genannt. Eine Menge C ⊂ X ist abgeschlossen,
wenn C c offen ist. Die abgeschlossenen Mengen erfüllen die nach den Gesetzen von de Morgan “dualen”
Eigenschaften zu offenen Mengen, d.h. wenn Fα , α ∈ A, eine Familie abgeschlossener Mengen ist, so ist auch
∩α Fα abgeschlossen, und sind F1 , F2 abgeschlossen, so ist auch F1 ∪ F2 abgeschlossen.
Für eine beliebige Teilmenge Y ⊂ X gibt es eine grösste offene Menge Y o , das Innere von Y , welche in
Y enthalten ist, und eine kleinste abgeschlossene Menge Y , den Abschluss von Y , welche Y enthält; diese
sind als die Vereinigung aller in Y enthaltenen offenen Mengen bzw. den Durchschnitt aller Y enthaltenden
Mengen definiert.
Übungsaufgabe 10. Eine Menge D ⊂ X ist dicht in X, wenn für jede offene Menge U gilt, dass D ∩ U 6= ∅.
Zeige, dass D dicht in X ist genau dann, wenn D = X.
Bemerkung 2. Wir werden konsequent den topologischen Raum (X, T) mit der Menge X identifizieren,
und die Topologie nur explizit erwähnen, wenn wir mit zwei verschiedenen Topologien auf ein und derselben
Menge arbeiten.
Definition 2. Seien X, Y topologische Räume. Eine Abbildung f : X → Y ist stetig wenn für jede offene
Menge V ⊂ Y das Urbild f −1 (V ) ⊂ X offen ist. Eine bijektive stetige Abbildung, deren Umkehrabbildung
auch stetig ist, nennt man einen Homöomorphismus.
Übungsaufgabe 11. Seien X, Y, Z topologische Räume, f : X → Y und g : Y → Z stetig. Dann ist g ◦
f : X → Z stetig.
Übungsaufgabe 12. Die Abbildungen R2 → R, welche durch (x, y) 7→ x + y und (x, y) 7→ xy gegeben sind,
sind stetig. Die Abbildung R+ → R+ welche durch x 7→ x−1 gegeben ist, ist stetig.
Oft ist es bequemer, mit Umgebungen von Punkten zu hantieren. Eine Umgebung von x ∈ X ist eine
Menge U ⊂ X für welche eine offene Menge V mit x ∈ V ⊂ U existiert. Wenn wir die Menge der Umgebungen
von x ∈ X mit U(x) bezeichnen, so ist U(x) abgeschlossen unter beliebigen Vereinigungen und endlichen
Durchschnitten, und X ∈ U(x) für jedes x ∈ X. Eine Umgebungsbasis B(x) ist eine Teilmenge von U(x) mit
der Eigenschaft, dass für jedes V ∈ U(x) ein W ∈ B(x) existiert sodass W ⊂ V . Mit anderen Worten, wenn
eine Umgebungsbasis B(x) gegeben ist, so ist U(x) = {V : V ⊃ W ∈ B(x)}. Solche Systeme von Umgebungen
kann man auch verwenden, um eine Topologie zu definieren:
Übungsaufgabe 13. Für jedes x ∈ X sei eine Menge U(x) von Teilmengen von X gegeben, mit x ∈ U für
alle U ∈ U(x), und welche abgeschlossen unter beliebigen Vereinigungen und endlichen Durchschnitten ist,
und X ∈ U(x) sowie W ∈ U(x) für W ⊃ U ∈ U(x) erfüllt. Dann gibt es eine (und nur eine) Topologie auf X
für die U(x) die Menge der Umgebungen des Punktes x für alle x ∈ X ist. (Hinweis: Man muss definieren,
dass eine Menge offen ist, wenn sie eine Umgebung jedes ihrer Punkte ist).
Beispiel 2. Seien X, Y topologische Räume. Die Produkttopologie auf X × Y definiert man über Umgebungen, indem man die Umgebungen von (x, y) als Übermengen von Mengen der Form Ux × Vy definiert, wo Ux
eine Umgebung von x in X und Vy eine Umgebung von y in Y ist.
Mit Hilfe von Umgebungen können wir das Innere und den Abschluss einer Menge definieren: Für eine
beliebige Teilmeinge Y ⊂ X ist x ∈ Y ◦ genau dann, wenn es eine Umgebung U ⊂ U(x) gibt, welche noch ganz
in Y enthalten ist; das Komplement des Abschlusses Ȳ c ist gegeben durch Punkte, welche eine Umgebung
besitzen, die Y nicht trifft. Dazwischen liegen jene Punkte, für die jede Umgebung sowohl Y als auch Y c
trifft, also Punkte x ∈ X mit U ∩ Y 6= ∅ und U ∩ Y c 6= ∅ für alle U ∈ U(x). Solche Punkte sind der Rand
von Y , welcher gerne mit ∂Y bezeichnet wird.
Übungsaufgabe 14. Zeige, dass ∂Y = Ȳ \ Y ◦ .
Der Begriff der Umgebung erlaubt es uns, Stetigkeit an einer Stelle zu definieren:
Definition 3. Die Abbildung f : X → Y ist stetig am Punkt x ∈ X wenn für jede Umgebung V von f (x)
eine Umgebung U von x existiert sodass f (U ) ⊂ V .
Übungsaufgabe 15. Zeige, dass f : X → Y stetig ist genau dann, wenn f stetig am Punkt x ∈ X für alle
x ∈ X ist.
Wir hatten eine weitere Variante von Stetigkeit in Abschnitt 1 kennengelernt, die Folgenstetigkeit. Konvergenz von Folgen ist in topologischen Räumen wie erwartet definiert: Eine Folge (xj )j∈N in X konvergiert
7
gegen x0 wenn für jede Umgebung U von x0 ein N ∈ N existiert, sodass xj ∈ U für alle j ≥ N gilt. Eine Abbildung f : X → Y ist folgenstetig am Punkt x, wenn für jede Folge xj mit limj→∞ xj = x limj→∞ f (xj ) = f (x)
gilt.
Übungsaufgabe 16. Zeige, dass jede Abbildung, welche im Punkt x stetig ist, auch folgenstetig im Punkt
x ist.
Übungsaufgabe 17. Wir versehen N mit der diskreten Topologie und erklären eine Topologie auf dem
Raum N ∪ {∞} indem wir die Umgebungen von ∞ als Komplemente endlicher Mengen in N festlegen. Dann
konvergiert die Folge xj von Punkten im topologischen Raum X genau dann gegen x ∈ X, wenn die Funktion
f : N ∪ {∞} → X, f (j) = xj , f (∞) = x stetig ist.
Grenzwerte sind in allgemeinen topologischen Räumen nicht eindeutig. Eine Bedingung, welche die
Eindeutigkeit garantiert, ist die folgende:
Definition 4. Ein topologischer Raum X ist ein Hausdorffraum, wenn für je zwei verschiedene Punkte
x, y ∈ X Umgebungen von x und y existieren, welche sich nicht schneiden.
Übungsaufgabe 18. Eine Menge X mit der trivialen Topologie ist Hausdorff genau dann, wenn X nur
einen Punkt besitzt. Jede Menge X ist ein Hausdorffraum in der diskreten Topologie. R mit der üblichen
Topologie ist ein Hausdorffraum.
Definition 5. Ein topologischer Raum X erfüllt das erste Abzählbarkeitsaxiom, wenn jeder Punkt eine
abzählbare Umgebungsbasis besitzt.
Lemma 7. Wenn X das erste Abzählbarkeitsaxiom erfüllt, so ist jede folgenstetige Abbildung f : X → Y
stetig.
Beweis. Angenommen, f ist nicht stetig; dann gibt es einen Punkt y = f (x) ∈ Y und eine Umgebung U
von f (x) sodass f −1 (U ) keine Umgebung von x ist. Sei B(x) = {V1 , V2 , . . . } eine abzählbare Umgebungsbasis
von x mit V1 ⊃ V2 ⊃ . . . (warum gibt es soetwas?). Da f −1 (U ) keine Umgebung von x ist, gibt es für jedes
j einen Punkt xj ∈ Vj \ U . Dann konvergiert xj gegen x, aber f (xj ) ∈
/ U , somit kann f (xj ) nicht gegen x
konvergieren.
Für allgemeine topologische Räume wird die Kompaktheit durch die Überdeckungskompaktheit definiert:
Definition 6. Ein topologischer Raum X ist kompakt, wenn jede Überdeckung von X durch offene Mengen
eine endliche Teilüberdeckung enthält. Eine Teilmenge Y ⊂ X heisst kompakt, wenn sie kompakt in der
Teilraumtopologie ist.
Übungsaufgabe 19. Zeige, dass Y ⊂ X genau dann kompakt ist, wenn jede Überdeckung Uα , α ∈ A von
Y durch offene Mengen in X eine endliche Teilüberdeckung enthält.
Um kompakte Mengen durch Folgen zu charakterisieren, benötigen wir eine stärkere Bedingung als
das erste Abzählbarkeitsaxiom. Eine Menge B = {Uα : α ∈ A} offener Mengen in X heisst eine Basis der
Topologie von X, wenn jede offene Menge in X als Vereinigung von Mengen in B geschrieben werden kann.
Definition 7. X erfüllt das zweite Abzählbarkeitsaxiom, wenn X eine abzählbare Basis seiner Topologie
besitzt.
Übungsaufgabe 20. Zeige, dass ein Raum, welcher das zweite Abzählbarkeitsaxiom erfüllt, auch das erste
Abzählbarkeitsaxiom erfüllt.
Übungsaufgabe 21. X heisst separabel, wenn X eine abzählbare dichte Teilmenge besitzt. Zeige, dass ein
Raum welcher das zweite Abzählbarkeitsaxiom erfüllt, separabel ist. Gilt die Umkehrung?
Übungsaufgabe 22. X ist ein Lindelöfraum, wenn jede offene Überdeckung eine abzählbare Teilüberdeckung
enthält. Zeige, dass jeder Raum, welcher das zweite Abzählbarkeitsaxiom erfüllt, ein Lindelöfraum ist.
Lemma 8. Sei X ein topologischer Raum, welcher das zweite Abzählbarkeitsaxiom erfüllt. Dann ist
Y ⊂ X genau dann kompakt, wenn für jede Folge xj mit xj ∈ Y eine Teilfolge xjk existiert, welche gegen
ein y0 ∈ Y konvergiert.
8
Beweis. Angenommen, es gibt eine Folge xj in Y , welche keine konvergente Teilfolge enthält. Dann
kann sich diese Folge an keinem Punkt von Y häufen, das heisst, es gibt für jedes y ∈ Y eine offene
Menge Uy , welche nur endlich viele Punkte aus {xj } enthält (hier verwenden wir eigentlich nur das erste
Abzählbarkeitsaxiom). Da Uy eine endliche Teilüberdeckung hat, ist die Wertemenge von xj endlich, was ein
Widerspruch ist.
Erfülle nun Y die Bedingung im Lemma, und sei Uα , α ∈ A eine offene Überdeckung von Y . Da X
das zweite Abzählbarkeitsaxiom erfüllt, können wir annehmen, dass A = N abzählbar ist. Angenommen, die
Überdeckung Uj hat keine endliche Teilüberdeckung. Dann wählen wir eine Folge xj mit der Eigenschaft,
Sj
dass xj ∈ Y \ i=1 Ui . Sei y0 ein Grenzwert einer Teilfolge dieser Folge xj . Dann gibt es eine offene Menge
UN mit y0 ∈ UN ; nach der Konstruktion von xj ist aber xj ∈
/ UN für j ≥ N , ein Widerspruch.
4. Vollständigkeit im Allgemeinen: Metrische Räume
Um den Begriff der Vollständigkeit allgemeiner zu fassen, ist es von Vorteil nicht von allgemeinen topologischen Räumen auszugehen. Der Grund liegt darin, dass der Begriff der Cauchyfolge vorraussetzt, dass
die “Nähe” von Punkten an verschiedenen Stellen vergleichbar ist. Dies verlangt eine zusätzliche Struktur,
und metrische Räume eignen sich hervorragend dafür, den Vollständigkeitsbegriff zu erläutern.
Definition 8. Ein metrischer Raum ist eine Menge X zusammen mit einer Abbildung (der Metrik) d : X ×
X → [0, ∞), welche die folgenden Eigenschaften erfüllt:
i) d(x, y) = d(y, x);
ii) d(x, y) = 0 genau dann, wenn x = y;
iii) d(x, z) ≤ d(x, y) + d(y, z) (die Dreiecksungleichung).
Bemerkung 3. Wie schon zuvor beim topologischen Raum, werden wir nicht (X, d) für einen metrischen
Raum schreiben, sondern einfach X, wenn die Metrik klar ist.
Eine Metrik induziert eine Topologie auf X, indem wir als Basis dieser Topologie die offenen Bälle
Bε (x) = {y ∈ X : d(x, y) < ε} festsetzen.
Beispiel 3. Wir können auf jeder Menge X die diskrete Metrik definieren: d(x, x) = 0, d(x, y) = 1, wenn
y 6= x. Zeige, dass die diskrete Metrik die diskrete Topologie induziert.
Übungsaufgabe 23. Sei X ein metrischer Raum mit Metrik d. Zeige:
(1) Eine Folge xj konvergiert gegen x ∈ X genau dann, wenn d(xj , x) → 0 (j → ∞).
(2) Die Topologie auf X erfüllt das erste Abzählbarkeitsaxiom.
(3) X ist separabel genau dann, wenn X das zweite Abzählbarkeitsaxiom erfüllt.
(4) d : X 2 → [0, ∞) ist eine stetige Abbildung (X 2 wird hier mit der Produkttopologie versehen).
(5) Sei f : [0, ∞) → [0, ∞) eine strikt monoton wachsende, stetige, konkave Funktion (d.h. f ((1 − t)x +
ty) ≥ (1 − t)f (x) + tf (y)) mit f (0) = 0. Dann ist df (x, y) = f (d(x, y)) auch eine Metrik auf X,
und die Topologien, welche durch d und df induziert werden, sind gleich.
Ein topologischer Raum heisst metrisierbar, wenn eine Metrik existiert, welche die gegebene Topologie
induziert. Wegen des vorangehenden Beispiels ist so eine Metrik alles andere als eindeutig, im allgemeinen
definieren viele verschiedene Metriken dieselbe Topologie. Stetige Abbildungen zwischen metrischen Räumen
können durch die bekannte ε − δ-Definition charakterisiert werden:
Lemma 9. Seien (X, d), (Y, e) metrische Räume. Eine Abbildung f : X → Y ist stetig am Punkt x0 ∈ X
genau dann, wenn für jedes ε > 0 ein δ > 0 existiert sodass e(f (x), f (x0 )) < ε für alle x ∈ X mit d(x, x0 ) < δ
ist.
Beweis. Sei zunächst die ε − δ-Bedingung erfüllt. Wir müssen zeigen, dass jede offene Umgebung von
f (x0 ) ein Bild einer offenen Umgebung von x0 enthält. Wenn V ⊂ Y eine offene Umgebung von f (x0 ) ist,
so gibt es einen Ball Bε (f (x0 )) = {y ∈ Y : e(f (x0 ), y) < ε} ⊂ V . Nach Vorraussetzung gibt es ein δ > 0
sodass e(f (x0 ), f (x)) < ε, wenn d(x0 , x) < δ; das heisst aber, dass f (Bδ (x0 )) ⊂ V , und Bδ (x0 ) = {x ∈
X : d(x0 , x) < δ} ist definitionsgemäss eine offene Umgebung von x0 .
Für die Umkehrung sei ε > 0. Da Bε (f (x0 )) offen ist, gibt es eine offene Umgebung U von x0 mit
f (U ) ⊂ Bε (f (x0 )), und da U eine offene Umgebung von x0 ist, ein δ > 0 mit Bδ (x0 ) ⊂ U . Also ist
f (Bδ (x0 )) ⊂ Bε (f (x0 )).
9
Definition 9. Ein metrischer Raum X ist beschränkt, wenn das Bild von d beschränkt ist, also d(x, y) < R
für ein R > 0 und alle x, y ∈ X ist. X ist total beschränkt wenn für jedes r > 0 eine endliche Menge
{x1 , . . . , xn } ⊂ X existiert sodass
n
[
X⊂
Br (xj ).
j=1
Lemma 10. Ein total beschränkter Raum erfüllt das zweite Abzählbarkeitsaxiom.
Beweis. Wir müssen zeigen, dass die Topologie, welche durch die Metrik induziert wird, eine abzählbare
Basis besitzt. Für jedes N ∈ N können wir eine endliche Menge En ⊂ X wählen, sodass
[
B1/n (x)
X⊂
x∈En
ist. Wir behaupten, dass die Menge
B = B1/n (x) : x ∈ En , n ∈ N
eine Basis der Topologie von X ist. Sei x ∈ X beliebig, und U eine offene Umgebung von x. Es genügt zu
zeigen, dass es ein n ∈ N gibt und ein y ∈ En gibt, welches x ∈ B1/n (y) ⊂ U erfüllt. Wir können annehmen,
dass U = Bε (x) für ein ε > 0 ist. Sei n gross genug, dass 2/n < ε und y ∈ En sodass x ∈ B1/n (y). Dann
können wir für alle z ∈ B1/n (y) wie folgt abschätzen:
d(x, z) ≤ d(x, y) + d(y, z) ≤
1
1
+ < ε,
n n
und damit B1/n (y) ⊂ U .
Insbesondere ist nach Lemma 8 für einen metrischen Raum die Folgenkompaktheit mit der Kompaktheit
im Sinne von Definition 6 äquivalent. Wir werden nun Kompaktheit für metrische Räume im Sinn des Satzes
von Heine-Borel charakterisieren. Dazu benötigen wir eine Bedingung, die uns die Existenz von Grenzwerten
garantiert (wir erinnern an den Beweis von Lemma 6, wo wir die Existenz des lim sup verwendeten). Hier
tritt die Vollständigkeit wieder auf.
Definition 10. Eine Folge xn in X ist eine Cauchyfolge, wenn für jedes ε > 0 ein N = N (ε) ∈ N existiert,
sodass d(xn , xm ) < ε für alle n, m ≥ N ist.
Übungsaufgabe 24. Zeige, dass eine konvergente Folge eine Cauchyfolge ist.
Definition 11. Ein metrischer Raum X ist vollständig, wenn jede Cauchyfolge in X konvergiert.
Lemma 11. Ein metrischer Raum X ist kompakt genau dann, wenn er total beschränkt und vollständig
ist.
Beweis. Sei zunächst X kompakt. Dann ist X auch total beschränkt, und damit nach Lemma 10
folgenkompakt. Sei xj eine Cauchyfolge in X. Dann gibt es eine Teilfolge xjk , welche gegen x ∈ X konvergiert.
Wir behaupten, dass dann auch limj→∞ xj = x. Sei also ε > 0 beliebig. Dann gibt es ein N ∈ N sodass
d(xm , xn ) < ε für m, n ≥ N ist, und ein K ∈ N sodass d(xjk , x) < ε für k ≥ K. Ist nun n ≥ max(N, jK ), so
ist
d(xn , x) ≤ d(xn , xjK ) + d(xjK , x) ≤ 2ε;
also ist (xn ) konvergent und damit X vollständig.
Sei nun X total beschränkt und vollständig. Damit ist wiederum Folgenkompaktheit äquivalent zur
Kompaktheit, und es genügt zu zeigen, dass jede Folge in X eine konvergente Teilfolge besitzt. Sei also xn
eine Folge in X. Wir behaupten, dass es eine Teilfolge xnk gibt, welche Cauchy ist.
Für jedes 1/k gibt es endlich viele Bälle B1/k (y), y ∈ Ek welche X überdecken. Wir extrahieren nun
induktiv eine Folge aus xj wie folgt. In einem der Bälle B1 (y), y ∈ E1 , gibt liegen xj für unendlich viele
j. Wir definieren nun j1 durch alle diese j. Dann extrahieren wir aus der Teilfolge xj1 eine Teilfolge xj2 ,
welche alle in einem Ball vom Radius 1/2 liegt, und so weiter. Wir behaupten, dass die Diagonalfolge xjj
eine Cauchyfolge ist. Sei ε > 0 beliebig, und j ∈ N large enough so that j ≤ 2ε. Wenn k, `geqj ist, so ist
xkk , x`` ∈ B1/j (xjj ). Damit ist d(xkk , x`` ) ≤ ε, also ist xmm eine Cauchyfolge.
10
Wir können in einem metrischen Raum natürlich auch den Begriff der gleichmässsigen Stetigkeit definieren:
Definition 12. Seiein (X, d) und (Y, e) metrische Räume. Eine Abbildung f : X → Y ist gleichmässsig
stetig, wenn für jedes ε > 0 ein δ > 0 existiert, sodass e(f (x), f (y)) < ε wenn d(x, y) < δ.
Satz 3. Sei f : X → Y eine stetige Abbildung. Wenn X kompakt ist, so ist f gleichmässig stetig.
Beweis. Sei ε > 0 beliebig. Da f stetig ist, gibt es für jedes x ∈ X ein δ(x) sodass e(f (x), f (y)) < ε wenn
d(x, y) < 2δ(x). Die Bälle Bδ(x) (x) überdecken X, also existieren endlich viele xj sodass schon Bδ(xj ) (xj )
ganz X überdecken. Wenn wir nun δ = minj δ(xj ) > 0 wählen, so gilt für beliebige x, y ∈ X, dass aus
x ∈ Bδ(xj ) (xj ) auch y ∈ B2δ(xj ) (xj ), da d(y, xj ) ≤ d(y, x) + d(x, xj ) ≤ δ + δ(xj ) ≤ 2δ(xj ). Damit ist
e(f (x), f (y)) ≤ e(f (x), f (xj )) + e(f (xj ), f (y)) ≤ 2ε,
und damit f gleichmässig stetig.
In einem vollständigen metrischen Raum gilt der wichtige Banach’sche Fixpunktsatz.
Definition 13. Sei X ein metrischer Raum. Eine Abbildung f : X → X ist eine Kontraktion, wenn es ein
q < 1 gibt, sodass d(f (x), f (y)) < qd(x, y) für alle x, y ∈ X ist.
Bemerkung 4. Insbesondere ist jede Kontraktion (sogar gleichmässig) stetig.
Satz 4. Sei X ein vollständiger metrischer Raum, und f : X → X eine Kontraktion. Dann besitzt f
einen Fixpunkt: Es gibt ein x ∈ X mit f (x) = x.
Beweis. Sei x0 ∈ X beliebig. Wir definieren eine Folge xj durch xj+1 = f (xj ). Wenn xj konvergiert,
limj xj = x, so folgt aus der Stetigkeit von f dass x = f (x). Wir zeigen nun, dass xj eine Cauchyfolge ist:
d(xm , xn ) ≤
n−m+1
X
d(xm+j−1 , xm+j )
j=1
=
n−m+1
X
d(f (xm+j−2 ), f (xm+j−1 ))
j=1
≤
n−m+1
X
qd(xm+j−2 , xm+j−1 )
j=1
...
≤ q m + q m+1 + · · · + q n d(x1 , x0 )
qm
d(x1 , x0 ).
≤
1−q
Da q < 1 ist, strebt der letzte Teil dieser Ungleichungskette gegen 0, wenn m → ∞; also ist xj eine
Cauchyfolge.
11
KAPITEL 2
Differentialrechnung
1. Der Begriff der Differenzierbarkeit
Definition 14. Sei f : (a, b) → R eine reelle Funktion, x ∈ (a, b). Wir sagen, f ist differenzierbar im Punkt
x, wenn der Grenzwert der Differenzenquotienten
f (x + h) − f (x)
=: f 0 (x)
h
existiert. Der Grenzwert f 0 (x) wird als die Ableitung von f im Punkt x bezeichnet.
Ist f in jedem Punkt von (a, b) differenzierbar, so sagen wir, f ist auf (a, b) differenzierbar. Den Raum
der differenzierbaren Funktionen auf (a, b) bezeichnen wir mit D ((a, b)); für f ∈ D ((a, b)) ist die Ableitung
f 0 : (a, b) → R eine auf (a, b) definierte Funktion.
lim
h→0
Beispiel 4. Die Potenzfunkztionen x 7→ xn , n ∈ N sind in jedem Punkt x ∈ R differenzierbar, d.h. f (x) =
xn ∈ D (R):
n 1 X j n−j j
(x + h)n − xn
x
h = nxn−1 ,
= lim
lim
h→0 h
h→0
n
h
j=1
also f 0 (x) = nxn−1 .
Übungsaufgabe 25. Zeige, dass die Funktionen x 7→ x−n für n ∈ N differenzierbar auf R \ {0} sind, und
berechne ihre Ableitungen.
Eine einfache Umformulierung von Definition 14 ist die folgende: f : (a, b) → R ist differenzierbar in
x ∈ (a, b) genau dann, wenn es eine Zahl λ ∈ R sodass die durch
(1)
R(h) = f (x + h) − f (x) − λh,
für h ∈ (−δ, δ) für ein δ > 0 definierte Funktion R die Eigenschaft hat, dass
R(h)
= 0;
h→0
h
die Zahl λ ist eindeutig bestimmt, und λ = f 0 (x). Insbesondere ist limh→0 f (x + h) − f (x) = 0, also f stetig
im Punkt x. Diese wichtige Folgerung aus der Differenzierbarkeit formulieren wir auch:
lim
Lemma 12. Sei f : (a, b) → R differenzierbar im Punkt x ∈ (a, b). Dann ist f stetig im Punkt x.
Insbesondere ist D ((a, b)) ⊂ C ((a, b)).
Bemerkung 5. Wir bemerken noch einmal explizit, dass Differenzierbarkeit wesentlich stärker als Stetigkeit
ist. Eine Funktion f ist stetig im Punkt x ∈ (a, b), wenn limh→0 f (x+h)−f (x) = 0 ist. Wenn f differenzierbar
im Punkt x ist, so gilt sogar dass es ein C > 0 gibt sodass |f (x + h) − f (x)| < C|h| für kleine h ist: Da
lim R(h)
h = 0 in (1) ist, sehen wir, dass es ein δ > 0 gibt mit
R(h) h < 1.
Dann ist |f (x + h) − f (x)| ≤ (|λ| + 1)|h| für |h| < δ.
Ein explizites
Beispiel einer Funktionen, welche stetig im Punkt 0 aber nicht differenzierbar im Punkt 0
√
ist, ist x 7→ x.
√
Übungsaufgabe 26. Zeige die letzte Behauptung: x 7→ x ist nicht differenzierbar im Punkt 0.
13
Eine graphische Interpretation der Ableitung kann man wie folgt erhalten: Der Differenzenquotient
f (x + h) − f (x)
h
ist der Anstieg der Geraden, welche die Punkte (x, f (x)) und (x + h, f (x + h)) im Graphen von f verbindet.
Die Gerade durch (x, f (x)) mit Anstieg f 0 (x) ist also die Tangente an den Graphen von f im Punkt (x, f (x)).
Übungsaufgabe 27. Zeige, dass die Betragsfunktion x 7→ |x| auf R \ {0} differenzierbar ist und berechne
ihre Ableitung. Ist sie im Punkt 0 differenzierbar?
Oft ist es interessant, Ableitungen auch in Randpunkten von Intervallen zu betrachten; die dort gebildeten
Grenzwerte sind natürlich einseitig zu bilden. Wir können auch ein wenig allgemeiner definieren:
Definition 15. Sei f : X → R eine reelle Funktion, x ∈ X. Wir sagen, f ist differenzierbar im Punkt x,
wenn der Grenzwert der Differenzenquotienten
lim
h→0
x+h∈X
f (x + h) − f (x)
=: f 0 (x)
h
existiert. Der Grenzwert f 0 (x) wird als die Ableitung von f im Punkt x bezeichnet.
Ist f in jedem Punkt von X differenzierbar, so sagen wir, f ist auf X differenzierbar. Den Raum der
differenzierbaren Funktionen auf X bezeichnen wir mit D (X); für f ∈ D (X) ist die Ableitung f 0 : X → R
eine auf X definierte Funktion.
Diese Definition ist sehr allgemein; wir werden sie später nur in Spezialfällen (für kompakte Intervalle
X) genauer ausleuchten. Zuvor wollen wir einige Rechenregeln erkunden.
Lemma 13. Seien f, g im Punkt x ∈ X differenzierbar, und λ ∈ R. Dann sind auch die Funktionen
λf + g, f g, sowie f /g (letztere allerdings nur, falls g(x) 6= 0) im Punkt x differenzierbar, und für die
Ableitungen gilt:
(λf + g)0 (x) = λf 0 (x) + g 0 (x)
Summenregel
(f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x)
0
f 0 (x)g(x) − f (x)g 0 (x)
f
(x) =
g
g(x)2
Produktregel
Quotientenregel
Beweis. Die erste Behauptung des Lemmas wird als Übungsaufgabe dem Leser überlassen. Für die
Produktregel rechnen wir wie folgt:
f (x + h)g(x + h) − f (x + h)g(x) + f (x + h)g(x) − f (x)g(x)
f (x + h)g(x + h) − f (x)g(x)
=
h
h
g(x + h) − g(x)
f (x + h) − f (x)
= f (x + h)
+ g(x)
h
h
und lassen nun h → 0; nach Lemma 12 ist f stetig im Punkt x, und damit ist, nachdem die Limiten der
einzelnen Terme auf der rechten Seite der Gleichung alle existieren, auch f g im Punkt x differenzierbar, und
(f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x) wie behauptet.
Für die Quotientenregel ist es nun genug, zu zeigen dass für g(x) 6= 0 der Bruch 1/g im Punkt x
differenzierbar ist, und (1/g)0 (x) = −g 0 (x)/g(x)2 gilt. Wir berechnen nun
1
1
−
1
g(x) − g(x + h)
g(x + h) g(x)
=
h
g(x + h)g(x)
h
und sehen, dass nach Vorraussetzung der Grenzwert (wir verwenden wieder Lemma 12) für h → 0 der
Terme auf der rechten Seite der Gleichung existieren, und somit (1/g) differenzierbar im Punkt x mit der
behaupteten Ableitung ist.
Bemerkung 6. Die Menge D (X) ist also ein Ring, genauer gesagt, eine Algebra über R. Insbesondere folgt
aus der Differenzierbarkeit der Funktion x auf R, dass D (R) alle Polynomfunktionen enthält.
14
Übungsaufgabe 28. Die Ableitungen der Polynomfunktionen haben wir im Prinzip schon in Beispiel 4
berechnet. Zeige nochmals, diesmal unter Verwendung der Produktregel und mit Hilfe von Induktion, dass
die Ableitung von f (x) = xn durch f 0 (x) = nxn−1 für n ∈ N gegeben ist.
Die letzte wichtige Rechenregel ist die Kettenregel.
Lemma 14. Seien f, g gegeben, sodass die Zusammensetzung g ◦ f in einer Umgebung von x Sinn macht.
Ist nun f an der Stelle x differenzierbar, und g an der Stelle f (x) differenzierbar, so ist g ◦ f an der Stelle
x differenzierbar und es gilt
(g ◦ f )0 (x) = g 0 (f (x))f 0 (x).
Beweis. Die Kettenregel folgt, indem man
g(f (x + h)) − g(f (x)) f (x + h) − f (x)
g(f (x + h)) − g(f (x))
=
h
f (x + h) − f (x)
h
schreibt und den Grenzwert h → 0 bildet. Dabei muss natürlich das Problem, dass der Nenner des ersten
Bruchs durchaus 0 sein kann, berücksichtigt werden. Es ist deswegen von Vorteil, entweder die Umformulierung in (1) zu verwenden, oder aber eine Fallunterscheidung zu machen; wir wollen dies als Übungsaufgabe
rechnen.
2. Der Mittelwertsatz und Folgerungen
Seien x, y ∈ [a, b], und f eine Funktion auf [a, b]. Der Wert
f (x) − f (y)
x−y
ist kann als mittlere Änderungsrate von f zwischen x und y aufgefasst werden. Wenn nun y = x + h ist und
wir den Grenzwert für y → x (oder h → 0) dieses Differenzenquotienten betrachten, so macht es Sinn, die
Ableitung f 0 (x) als momentane Änderung von f im Punkt x aufzufassen. Der Mittelwertsatz erlaubt es uns,
diesen Zusammenhang zu präzisieren.
Satz 5 (Mittelwertsatz). Sei f ∈ C ([a, b]) ∩ D ((a, b)). Dann gibt es ein ξ ∈ (a, b) mit
f 0 (ξ) =
f (b) − f (a)
.
b−a
Beweis. Sei
g(x) = (b − a)f (x) + (a − x)f (b) + (x − b)f (a).
Dann ist g(a) = g(b) = 0, und nach Lemma 13, wieder stetig auf [a, b] und differenzierbar auf (a, b). Wir
behaupten, dass es einen Punkt ξ ∈ (a, b) gibt, für welchen g 0 (ξ) = 0 ist; für diesen Punkt ξ ist also
0 = (b − a)f 0 (ξ) + f (a) − f (b)
wie verlangt.
Wenn g(x) konstant auf [a, b] ist, so gibt es nichts zu zeigen. Ist g(x) nicht konstant auf [a, b], so
nehmen wir ohne Beschränkung der Allgemeinheit an, dass maxx∈[a,b] g(x) > 0. Sei ξ ein Punkt mit
g(ξ) = maxx∈[a,b] g(x). Dann ist auf der einen Seite, da g im Punkt ξ differenzierbar ist,
g 0 (ξ) = lim
h&0
und andererseits
g(ξ + h) − g(ξ)
≤ 0,
h
g(ξ + h) − g(ξ)
≥ 0,
h%0
h
g 0 (ξ) = lim
also g 0 (ξ) = 0 wie behauptet.
Die im Beweis dieses Satzes gemachte Beobachtung (wenn g ein Maximum an der Stelle ξ hat, so ist
g 0 (ξ) = 0) wollen wir festhalten:
Lemma 15. Sei g eine stetige Funktion auf X. Wenn g ein (lokales) Maximum an der Stelle ξ hat, und
an der Stelle ξ differenzierbar ist, so ist g 0 (ξ) = 0.
15
Die Umkehrung dieses Satzes stimmt nicht, wie das Beispiel der Funktion x 7→ x3 zeigt.
Korollar 1. Sei f ∈ C ([a, b]) ∩ D ((a, b)), und f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für x ∈ (a, b). Dann ist f
(strikt) monoton wachsend auf [a, b].
Beweis. Für beliebige x, y ∈ [a, b], x < y, gilt nach Theorem 5, dass
f (y) − f (x) = f 0 (ξ)(y − x) ≥ 0 bzw. > 0
nach Vorraussetzung, also ist f (strikt) monoton.
Nicht immer führt die Verwendung des Mittelwertsatzes zu optimalen Aussagen:
Korollar 2. Sei f ∈ C ([a, b]) ∩ D ((a, b)), f 0 ∈ C ((a, b)), und f 0 (x) > 0 für x ∈ [a, b]. Wir schreiben
c = f (a), d = f (b). Dann gibt es eine Funktion g ∈ C ([a, b]) ∩ D ((c, d)) welche f (g(y)) = y für y ∈ [c, d]
und g(f (x)) = x für x ∈ [a, b] erfüllt. Die Ableitung von g ist gegeben durch
1
g 0 (y) = 0
.
f (g(y))
Beweis. Da f strikt monoton wachsend und stetig ist, gilt dass die inverse Funktion g definiert, stetig,
und wiederum strikt monoton wachsend ist. Sei y ∈ (c, d), dann ist h = f (g(y + h)) − f (g(y)) = f 0 (ξh )(g(y +
h) − g(y)) und damit
1
g(y + h) − g(y)
= 0
;
h
f (ξh )
wenn wir h → 0 gehen lassen, folgt ξh → g(y), und damit (da f 0 stetig ist), dass g differenzierbar an der
Stelle y ist, mit der behaupteten Formel für die Ableitung.
Übungsaufgabe 29. Tatsächlich genügt es, anzunehmen, dass f an der Stelle x differenzierbar ist, dann gilt,
dass f −1 an der Stelle f (x) differenzierbar ist, und (f −1 )0 (f (x)) = 1/(f 0 (x)). Zeige diese Behauptung direkt
aus der Definition der Differenzierbarkeit und interpretiere die Aussage graphisch; genauer: Sei f : [a, b] →
[c, d] strikt monoton und stetig. Wenn f an der Stelle x differenzierbar ist, dann ist f −1 an der Stelle f (x)
differenzierbar.
Lemma 16. Sei f ∈ C ([a, b]) ∩ D ((a, b)). Angenommen f 0 (x) lässt sich stetig nach [a, b) (bzw. (a, b])
fortsetzen. Dann ist f auch in a (bzw. b) differenzierbar, und f 0 ist stetig auf [a, b) (bzw. (a, b]).
Beweis. Wir betrachten den Fall des linken Endpunkts; analoge Argumente geben das entsprechende
Resultat im rechten Endpunkt des Intervalls. Mit Hilfe des Mittelwertsatzes erhalten wir für jedes h ein
ξh ∈ (a, a + h) mit f (a + h) − f (a) = f 0 (ξh )h. Also ist
f (a + h) − f (a)
= lim f 0 (ξh );
h&0
h
der Grenzwert auf der rechten Seite existiert aber nach Vorraussetzung, da ξh → a für h & 0.
lim
h&0
Ableitungen von differenzierbaren Funktionen sind speziell (d.h. nicht jede Funktion tritt als Ableitung
auf); eine interessante Eigenschaft ist die Zwischenwerteigenschaft, welche Ableitungen erfüllen.
Korollar 3. Sei f ∈ D ((a, b)), c, d ∈ (a, b), f 0 (c) < y < f 0 (d). Dann gibt es ein ξ ∈ (c, d) mit
f (ξ) = y.
0
Beweis. Sei g(x) = f (x) − yx. Da g stetig ist, nimmt es zwischen c und d sein Minimum auf [c, d] an,
sagen wir, an der Stelle ξ. Nachdem g 0 (c) < 0 und g 0 (d) > 0 ist, muss dieser Punkt ξ ∈ (c, d) erfüllen. Nach
Lemma 15 folgt g 0 (ξ) = 0, also f 0 (ξ) = y.
Um Nullstellen von Funktionen zu finden, verwendet man oft Newtons Methode:
Korollar 4. Sei f ∈ C ([−a, a]) ∩ D ((−a, a)) mit stetiger Ableitung f 0 ∈ C ((−a, a)), f 0 (0) 6= 0, und
f (0) = 0. Dann gibt es ein ε > 0 sodass für jedes x0 ∈ [−ε, ε] die durch
xj+1 = xj −
f (xj )
f 0 (xj )
definierte Folge xj gegen die Nullstelle 0 von f konvergiert.
16
Beweis. Wir wählen ε so klein, dass für beliebige ξ, η ∈ [−ε, ε]
0
1 − f (ξ) < 1/2.
f 0 (η) 1
Wir definieren g(x) = x − ff0(x)
(x) und behaupten, dass |g(x)| ≤ 2 |x| ist. Tatsächlich ist (da f (0) = 0) nach
dem Mittelwertsatz für ein ξ zwischen 0 und x die Gleichung f (x) = xf 0 (ξ) erfüllt und damit
xf 0 (ξ) f 0 (ξ) 1
f (x) |g(x)| = x − 0
= x− 0
= |x| 1 − 0
< |x|.
f (x) f (x) f (x) 2
Damit ist |xn | ≤ (1/2)n |x0 |, also konvergiert xn → 0(n → ∞).
Übungsaufgabe 30. Zeige, dass man die Nullstelle 0 durch eine beliebige Zahl c ∈ [a, b] ersetzen kann;
formuliere das entsprechende Ergebnis selber.
Übungsaufgabe 31. Analysiere den Beweis–kann man die Methode auch durch g(x) = x − Cf (x) für ein
geeignetes C ∈ R ersetzen? (Newton’s Methode hat Vorteile, wenn f sogar 2-mal differenzierbar ist. Dazu
aber später mehr.)
Übungsaufgabe 32. Seien f, g ∈ D ((a, b)) ∩ C ([a, b]). Dann gibt es ein ξ ∈ (a, b) mit f 0 (ξ)(g(b) − g(a)) −
g 0 (ξ)(f (b) − f (a)) = 0.
3. Grenzwertsätze
Wir werden nun vor allem auf kompakten Intervallen [a, b] arbeiten.
Definition 16. Für jedes k ∈ N sagen wir, die Funktion f ist k-mal differenzierbar, wenn sie (k − 1)-mal
differenzierbar und die (k − 1)-te Ableitung f (k−1) erneut differenzierbar ist; die Ableitung von f (k−1) ist
die k-te Ableitung von f und wird mit f (k) bezeichnet. Der Raum der k-mal differenzierbaren Funktionen
wird mit Dk (X) bezeichnet. Ist die k-te Ableitung zusätzlich stetig auf X, so sagen wir, f ist k-mal stetig
differenzierbar und schreiben f ∈ C k (X). Der Raum der stetigen Funktionen auf X wird auch mit C 0 (X) =
C (X) bezeichnet.
Eine Funktion f , die k-mal differenzierbar für jedes k ∈ N ist, wird als glatt bezeichnet, und man schreibt
f ∈ C ∞ (X).
Übungsaufgabe 33. Zeige, dass Dk (X) und C k (X) Algebren über R sind, sowie die verallgemeinerte
Produktregel: Wenn f, g ∈ Dk (X), so ist die k-te Ableitung von f g gegeben durch
k X
j (j) (k−j)
(k)
f g
.
(f g) =
k
j=0
Für endliches k wird der Raum C k ([a, b]) wird mit Hilfe der Festsetzung
X
kf kk =
max |f (j) (x)|
j≤k
x∈[a,b]
zu einem normierten Raum. Die durch diese Norm induzierte Metrik d(f, g) = kf − gkk erzeugt die Topologie
der gleichmässigen Konvergenz in den ersten k Ableitungen (bzw. für k = 0 die Topologie der gleichmässigen
Konvergenz). Wir zeigen, dass C k ([a, b]) vollständig ist, d.h. C k ([a, b]) ist ein Banachraum:
C
Lemma 17. Der Raum C k ([a, b]) ist für jedes k ≥ 0, k ∈ N ein Banachraum. Die Abbildung D : C k ([a, b]) →
([a, b]) welche durch (Df )(x) = f 0 (x) definiert ist, ist stetig.
k−1
Beweis. Sei zunächst k = 0. Eine Folge stetiger Funktionen fn ∈ C ([a, b]) ist eine Cauchyfolge, wenn
für jedes ε > 0 ein N ∈ N existiert, sodass für alle m, n ≥ N
|fm (x) − fn (x)| < ε,
x ∈ [a, b]
gilt. Damit ist für jedes fixe x ∈ [a, b] die Folge fn (x) eine Cauchyfolge, und besitzt damit einen Grenzwert,
den wir mit f (x) bezeichnen. Wir behaupten, dass f eine stetige Funktion ist. Sei also ξ ∈ [a, b] fix, und
ε > 0. Wir wählen N sodass
|fm (x) − fn (x)| ≤ ε,
m, n ≥ N,
17
x ∈ [a, b]
gilt.
Lassen wir nun n → ∞, sehen wir, dass |fm (x) − f (x)| für jedes m ≥ N und x ∈ [a, b] gilt; insbesondere
gilt, dass fn → f für n → ∞, wenn wir nur zeigen können, dass f ∈ C (X). Wir wählen δ > 0 sodass
|fN (ξ) − fN (x)| < ε wenn |ξ − x| < δ. Es folgt, dass
|f (ξ) − f (x)| ≤ |f (ξ) − fN (ξ)| + |fN (ξ) − fN (x)| + |fN (x) − f (x)| < 3ε
wenn |ξ − x| < δ. Also ist f stetig im Punkt ξ, und nachdem ξ beliebig war, auf ganz [a, b].
Es genügt nun zu zeigen, dass wenn fn eine Folge differenzierbarer Funktionen ist, welche gleichmässig
auf [a, b] gegen eine stetige Funktion f konvergieren, und die Folge der Ableitungen fn0 gleichmässig gegen
eine stetige Funktion g konvergieren, auch f differenzierbar ist und f 0 = g gilt. Sei also x ∈ [a, b] beliebig.
Wir müssen den Grenzwert
f (x + h) − f (x)
h
für h → 0 berechnen und zeigen, dass dieser g(x) ist; mit anderen Worten, wir wollen zeigen, dass für ein
geeignetes c > 0 die Funktion

 f (x + h) − f (x)
h ∈ [−c, c] \ {0}
A(h) =
h
g(x)
h=0
stetig ist. Nach dem ersten Teil des Beweises ist es genug, zu zeigen, dass A(h) der gleichmässige Grenzwert
der stetigen Abbildungen

 fn (x + h) − fn (x)
h ∈ [−c, c] \ {0}
An (h) =
h
f 0 (x)
h=0
n
ist. Falls An gleichmässig konvergiert, limn→∞ An = A; es reicht also, wiederum weil wir schon wissen, dass
C ([−c, c]) vollständig ist, zu zeigen, dass An eine Cauchyfolge ist.
Sei also ε > 0 beliebig. Für jedes h und für jedes n existiert ein ξn,h mit |x − ξn,h | < |h| sodass
0
(t) − fn0 (t)| < ε
An (h) = fn0 (ξn,h ). Da die fn0 gleichmässig gegen g konvergieren, gibt es ein N ∈ N mit |fm
für alle t ∈ [a, b] und alle n, m ≥ N . Wir behaupten nun zunächst, dass es ein δ > 0 gibt, sodass für alle
0
0
(t)| < 3ε gilt. Da g gleichmässig
(s) − fm
m ≥ N und alle s, t ∈ [a, b] mit |s − t| < δ die Ungleichung |fm
stetig auf dem kompakten Intervall [a, b] ist, können wir ein δ wählen, sodass |g(s) − g(t)| < ε für |s − t| < δ,
s, t ∈ [a, b], und wie folgt abschätzen:
0
0
0
0
|fm
(s) − fm
(t)| ≤ |fm
(s) − g(s)| + |g(s) − g(t)| + |g(t) − fm
(t)| < 3ε.
Ist also |h| ≤ 2δ , so gilt
0
0
0
0
|An (h) − Am (h)| = |fm
(ξm,h ) − fn0 (ξn,h )| ≤ |fm
(ξm,h ) − fm
(ξn,h )| + |fm
(ξn,h ) − fn0 (ξn,h )| < 4ε,
da |ξm,h − ξn,h | < 2|h| ≤ δ ist. Auf der anderen Seite ist die Folge von Funktionen An , betrachtet auf dem
Intervall [−c, −δ] bzw. [c, δ], klarerweise gleichmässig konvergent (mit Grenzwert A); wir können also ein Ñ
wählen, sodass auch |An (h) − Am (h)| < 4ε, wenn h ∈ [−c, −δ] ∪ [c, δ] und n, m ≥ Ñ . Zusammengenommen
ist dann für n, m ≥ max(N, Ñ ) und für jedes h ∈ [−c, c]
|An (h) − Am (h)| < 4ε,
also An eine Cauchyfolge wie behauptet.
Übungsaufgabe 34. Ist die Konvergenz der abgeleiteten Funktionen eine notwendige Vorraussetzung für
die Differenzierbarkeit der Grenzfunktion? D.h. gibt es ein Beispiel einer Funktionenfolge fn , für welche fn0
nicht gleichmässig konvergiert, und f = limn fn tatsächlich nicht differenzierbar ist?
18
4. Implizite Funktionen
√
Oft haben wir Funktionen als die Lösung von Gleichungen gegeben; die Wurzelfunktion x ist zum
Beispiel als die Lösung y(x) der Gleichung y 2 = x gegeben. Der Satz über implizite Funktionen erlaubt
es uns, Gleichungen von der Form F (x, y) = 0 “nach y” aufzulösen, d.h. eine Funktion y(x) zu finden,
für die F (x, y(x)) = 0 gilt. Geometrisch interpretiert man das, indem man in der Nullstellenmenge von F
den Graphen einer Funktion von x sucht. Nicht immer erwartet man, dass Lösungen impliziter Gleichungen
wieder differenzierbar sind.
Übungsaufgabe 35. Zeige, dass die Gleichung y 2 = x2 eine Lösung besitzt, welche an der Stelle 0 nicht
differenzierbar ist.
Um allgemeine Aussagen über die Lösungen impliziter Gleichungen machen zu können, müssen wir
demnach Anforderungen an F stellen. Die Vorrausetzungen, welche wir hier verwenden wollen, um y(x) zu
finden, sind an die “partiellen” Ableitungen der Funktion F gestellt. Sei F (x, y) also eine Funktion von 2
reellen Variablen x, y, definiert auf dem Rechteck R = [a, b] × [c, d]. Wir sagen, F ist auf R partiell nach x
bzw. y differenzierbar, wenn der Grenzwert
F (x + h, y) − F (x, h)
∂F
F (x, y + k) − F (x, h)
∂F
(x, y) = Fx (x, y) = lim
bzw.
(x, y) = Fy (x, y) = lim
h→0
k→0
∂x
h
∂y
k
für jedes (x, y) ∈ R existiert. Die Funktion Fx (bzw. Fy ) ist die partiellen Ableitung von F nach x (bzw. y).
Satz 6. Sei F (x, y) auf einem Rechteck R = [−a, a] × [−b, b] definiert und stetig sowie F (0, 0) = 0.
Weiters existiere die partielle Ableitung Fy (x, y) auf R und es sei Fy stetig auf R sowie Fy (0, 0) 6= 0. Dann
gibt es ein ε > 0 und eine stetige Funktion y(x) auf (−ε, ε) sodass F (x, y(x)) = 0 ist.
Ist darüberhinaus auch Fx auf R stetig, so ist y differenzierbar, und es gilt
Fx (x, y(x))
y 0 (x) = −
.
Fy (x, y(x))
Beweis. Wir können oBdA annehmen, dass Fy (0, 0) > 0 ist. Da Fy stetig ist, ist auf einem möglicherweise
kleineren Rechteck Fy (x, y) > 0; wir ersetzen unser gegebenes Rechteck gegebenenfalls durch ein solches und
nehmen an, dass Fy > 0 auf R gilt. Für jedes x ∈ [−a, a] ist die Funktion y 7→ F (x, y) dann strikt monoton
steigend auf [−b, b]. Insbesondere gilt F (0, −b) < 0 und F (0, b) > 0; indem wir die Stetigkeit von F verwenden und uns falls notwendig wiederum auf ein kleineres Rechteck einschränken, können wir annehmen, dass
F (x, −b) < 0 und F (x, b) > 0 für x ∈ [−a, a] gilt.
Wir definieren nun für fixes x ∈ [−a, a] den Wert y(x) als die eindeutige Lösung der Gleichung F (x, y) = 0
welche nach Korollar 2 existiert, und zeigen, dass y stetig ist. Dazu genügt es zu zeigen, dass y(x) stetig
am Punkt 0 ist; die anderen Punkte können durch die Anwendung desselben Arguments erhalten werden.
Angenommen also, y(x) ist nicht stetig im Punkt 0. Da nach Vorraussetzung y(0) = 0 ist, gibt es deswegen
ein δ > 0 sodass |y(xj )| > δ für eine Folge xj mit xj → 0 für j → ∞. Die Folge (xj , y(xj )) ist dann eine Folge
im kompakten Rechteck R; durch Übergang zu einer konvergenten Teilfolge können wir also annehmen, dass
(0, y0 ) = limj→∞ (xj , y(xj )) ist, und |y0 | > δ > 0. Da F stetig ist, ist F (0, y0 ) = 0; nach Vorraussetzung ist
aber y = 0 die eindeutige Lösung von F (0, y) = 0, was einen Widerspruch darstellt.
Um die Differenzierbarkeit von y zu zeigen, bemerken wir zunächst, dass
F (x, y(x)) − F (x + h, y(x + h))
= 0,
lim
h→0
h
da f (x, y(x)) = f (x + h, y(x + h)) = 0, gilt. Die Differenz können wir mit Hilfe des Mittelwertsatzes als
F (x, y(x)) − F (x + h, y(x + h)) = (F (x, y(x)) − F (x + h, y(x))) + (F (x + h, y(x)) − F (x + h, y(x + h)))
= −Fx (ξh , y(x))h + Fy (x + h, ηh )(y(x) − y(x + h)),
wo |x − ξh | < |h| und |ηh − y(x)| < |y(x) − y(x + h)| ist. Damit gilt, dass
lim
h→0
y(x) − y(x + h)
Fx (ξh , y(x))
Fx (x, y(x))
= lim
=
,
h→0 Fy (x + h, ηh )
h
Fy (x, y(x))
da der Grenzwert auf der rechten Seite existiert; also ist y differenzierbar an der Stelle x mit der behaupteten
Formel für die Ableitung.
19
Übungsaufgabe 36. Im Beweis des Satzes haben wir Korollar 2 angewendet. Zeige, dass man eine lokale
Form dieses Korollars auch aus dem Satz über implizite Funktionen folgern kann: Wenn f (x) eine Funktion
ist, welche differenzierbar in einer Umgebung von 0 ist, und f 0 (0) > 0, dann gibt es ein ε > 0 und ein g,
welches auf [f (−ε), f (ε)] definiert ist und f ◦ g = g ◦ f = id erfüllt.
Übungsaufgabe 37. Die Funktionen xr , wo r eine rationale Zahl ist, sind an allen Stellen x 6= 0 differenzierbar. Finde auch eine Formel für die Ableitung.
REMINDER: vielleicht auch den Fixpunktsatz- Beweis??
5. Taylor’s Satz und Folgerungen
Differenzierbarkeit bedeutet, dass f (x + h) gut durch die affine Funktion f (x) + hf 0 (x) approximiert
wird, in dem Sinn, dass
R(x, h) = f (x + h) − f (x) − f 0 (x)h
die Eigenschaft hat, dass
R(x, h)
= 0.
h
Die genaue Geschwindigkeit, mit der R(x, h) gegen 0 geht, ist damit nicht bestimmt. Oft wünscht man sich,
dass der Restterm R(x, h) die Eigenschaft hat, dass sogar h−2 R(x, h) für h → 0 beschränkt bleibt. Dies ist
nicht immer der Fall, wie das Beispiel von xα für α < 2 (um x = 0) zeigt. Diese Funktion ist allerdings auch
nur 1-mal stetig differenzierbar; die zweite Ableitung ist in keiner Umgebung von 0 beschränkt und bei 0
nicht definiert. Höhere Differenzierbarkeit erlaubt es uns, die lineare Approximation zu verbessern.
Nach dem Mittelwertsatz ist (da R(x, 0) = 0)
lim
h→0
R(x, h) = hRh (x, k)
für ein k mit |k| < |h|. Nun ist Rh (x, h) = f 0 (x + h) − f 0 (x), also Rh (x, 0) = 0 und Rh2 (x, h) = f 00 (x + h).
Eine weitere Anwendung des Mittelwertsatzes zeigt, dass R(x, h) = hkf 00 (x + `) für ein ` mit |`| < |k|, was
zeigt, dass h−2 R(x, h) beschränkt ist (für h → 0). Wir formulieren eine Variante dieser letzten Beobachtung
als
Lemma 18. Sei R(h) ∈ C k ([a, b]) ∩ Dk+1 ((a, b)), a < 0 < b, und R(0) = R0 (0) = . . . R(k) (0) = 0. Dann
gibt es für jedes h ∈ [a, b] ein ξh mit |ξh | < |h| sodass
R(h) =
hk+1
R(k+1) (ξ).
(k + 1)!
Beweis. Wir definieren
f (t) = R(t) + R0 (t)(h − t) + R00 (t)
(h − t)2
(h − t)k
+ · · · + R(k) (t)
,
2!
k!
g(t) = (t − h)k+1 .
Nach Übungsaufgabe 32 gibt es ein ξ mit |ξ| < |h| sodass
0 = f 0 (ξ)(g(h) − g(0)) − g 0 (ξ)(f (h) − f (0))
(h − ξ)k
(−(−h)k+1 ) − (k + 1)(ξ − h)k R(h),
k!
was nach einer einfachen Umformung die Behauptung ergibt.
= R(k+1) (ξ)
Wir können nun unsere erste Form der Taylorentwicklung formulieren:
Satz 7. Sei f ∈ C k ([a, b]) ∩ Dk+1 ((a, b)), a < x < b. Dann gibt es für jedes h mit x + h ∈ (a, b) ein
ξ ∈ (x, x + h) sodass
f (x + h) = f (x) + f 0 (x)h +
f 00 (x) 2
f (k) (x) k f (k+1) (ξ) k+1
h + ··· +
h +
h
.
2!
k!
(k + 1)!
20
Beweis. Wir betrachten die Differenz
f 00 (x) 2
f (k) (x) k
h + ··· +
h − f (x + h).
2!
k!
Diese erfüllt die Vorraussetzungen von Lemma 18, und R(k+1) (h) = f (k+1) (x + h); das ergibt die angegebene
Form des Rests.
R(h) = f (x) + f 0 (x)h +
Für die erste Anwendung wiederholen wir die Definition eines lokalen Extremums:
Definition 17. Sei f eine Funktion, welche in einer Umgebung von x definiert ist. Dann hat f ein lokales
Maximum (Minimum) an der Stelle x wenn für genügend kleine h f (x + h) ≤ f (x) (bzw. f (x + h) ≥ f (x))
ist. Das Maximum ist strikt, wenn diese Ungleichungen für h 6= 0 strikte Ungleichungen sind.
Korollar 5. Sei f in einer Umgebung von x zweimal stetig differenzierbar, f 0 (x) = 0. Dann hat f ein
lokales Minimum an der Stelle x, wenn f 00 (x) > 0, und ein lokales Maximum, wenn f 00 (x) < 0.
Bemerkung 7. Wie das Beispiel von x3 bzw. x4 zeigt, kann falls f 00 (0) = 0 ist keine weitere Aussage ohne
weitere Vorraussetzungen möglich.
Beweis. Für kleine h > 0 ist
f 00 (ξ) 2
h
f (x + h) = f (x) +
2
(
> f (x), f 00 (ξ) > 0
< f (x), f 00 (ξ) < 0,
wobei ξ ∈ (x, x + h). Wenn h genügend klein gewählt ist, hat f 00 (ξ) dasselbe Vorzeichen wie f 00 (x).
Übungsaufgabe 38. Zeige die folgende Verallgemeinerung von Korollar 5: Sei f in einer Umgebung von x
k-mal stetig differenzierbar, f 0 (x) = · · · = f k−1 (x) = 0, und f (k) (x) 6= 0. Dann ist x kein lokales Extremum,
wenn k ungerade ist; wenn k gerade ist, so hat f ein lokales Minimum an der Stelle x, wenn f (k) (x) > 0,
und ein lokales Maximum, wenn f (k) (x) < 0.
Unser nächstes Korollar zeigt, dass die Konvergenz in der Newton-Methode besser als in Korollar 4
angegeben ist.
Korollar 6. Sei f in einer Umgebung von 0 zweimal stetig differenzierbar, f (0) = 0, und f 0 (0) 6= 0.
Dann gibt es eine Umgebung von 0 und eine Konstante M > 0 sodass die durch
f (x)
g(x) = x − 0
f (x)
definierte Funktion |g(x)| < M |x|2 erfüllt.
Beweis. Wir wenden Theorem 7 am Punkt x an und sehen, dass
f 00 (ξ) 2
0 = f (0) = f (x) + f 0 (x)(−x) +
x .
2
Also ist
f (x) f 00 (ξ) 2
|g(x)| = x − 0
=
|x| ≤ M |x|2
f (x) 2f 0 (x) wenn x (und damit auch ξ) nahe genügend an 0 sind.
Übungsaufgabe 39. Im Beweis des vorangehenden Satzes ist nicht besonders klar geworden, wie klein nun
die Umgebung zu wählen ist, in der eine quadratische Ungleichung gilt. Versuche eine genauere Beschreibung
einer solchen Umgebung zu geben.
Definition 18. Sei I ein (geschlossenes oder offenes) Intervall. Eine Funktion ϕ : I → R ist konvex (bzw.
konkav) auf I, wenn für alle a, b ∈ I mit a < b und alle λ, µ ∈ [0, 1] mit λ + µ = 1
f (λa + µb) ≤ λf (a) + µf (b) bzw. ≥ λf (a) + µf (b)
ist. ϕ ist strikt konvex bzw. strikt konkav, wenn die Ungleichung für λµ 6= 0 strikt ist.
Korollar 7. Sei ϕ : I → R zweimal stetig differenzierbar. Dann ist ϕ strikt konvex auf I, wenn ϕ00 auf
I positiv ist, und strikt konkav, wenn ϕ00 auf I negativ ist.
21
Beweis. Seien a, b ∈ I fix, a < b. Wir betrachten die Funktion f (t) : [0, 1] → R, welche durch
f (t) = ϕ((1 − t)a + tb) − (1 − t)ϕ(a) − tϕ(b)
definiert ist. Dann ist f (0) = f (1) = 0. Wenn f nun an einer Stelle von (0, 1) nichtnegativ ist, so muss es in
(a, b) eine Stelle eines lokalen Maximums geben. Es ist f 0 (t) = ϕ0 ((1 − t)a + tb)(b − a) − ϕ(a) − ϕ(b), und
f 00 (t) = ϕ00 ((1 − t)a + tb)(b − a)2 > 0. Also kann f nach Korollar 5 nur lokale Minima haben, und f ist auf
(0, 1) positiv.
Der Fall einer konkaven Funktion wird ganz analog behandelt.
Wenn eine Funktion ϕ : [a, b] → R strikt konvex (konkav) ist, so gibt es genau einen Punkt x ∈ [a, b],
wo ϕ ein lokales (und in diesem Fall auch globales) Minimum (Maximum) hat; das hat zwar mit Taylor’s
Formel nicht viel zu tun, ist aber ein wichtiges Kriterium, weswegen wir es an dieser Stelle notieren:
Lemma 19. Sei die Funktion ϕ : [a, b] → R strikt konvex und stetig. Dann gibt es genau einen Punkt
x ∈ [a, b] wo ϕ sein Minimum auf [a, b] annimmt.
Beweis. Die Existenz des Minimums wird wegen der Stetigkeit von ϕ garantiert. Angenommen, x0 6= x1
sind zwei Punkte wo ϕ(x0 ) = ϕ(x1 ) = minx∈[a,b] ϕ(x). Dann ist für λ, µ ∈ [0, 1] mit λ + µ = 1 wegen der
strikten Konvexität von ϕ
ϕ(λx0 + µx1 ) < λϕ(x0 ) + µϕ(x1 ) = min ϕ(x),
x∈[a,b]
was einen Widerspruch darstellt.
Bemerkung 8. Wir bemerken, dass die Eindeutigkeitsaussage auch erhalten bleibt, wenn man die Existenz
eines Minimums vorraussetzt (ohne dabei Stetigkeit zu verlangen).
22
KAPITEL 3
Das Riemannintegral
1. Die Definition des Riemannintegrals
Sei [a, b] ein kompaktes Intervall. Eine Unterteilung U von [a, b] ist ein geordnetes n+1-tupel von Punkten
U = (x0 , x1 , . . . , xn ),
wo a = x0 < x1 < · · · < xn−1 < xn = a,
ein Vektor von Zwischenpunkten ξ für U ist ein geordnetes n-tupel
xj ≤ ξj+1 ≤ xj+1 .
ξ = (ξ1 , . . . , ξn ),
Wird definieren δ(U ) = minj xj −xj−1 als die Feinheit von U . Die Riemansumme einer Funktion f : [a, b] → R
(bezüglich U und ξ) ist definiert durch
R(f, U, ξ) =
n
X
f (ξj )(xj − xj−1 ).
j=1
Definition 19. Die beschränkte Funktion f : [a, b] → R ist integrierbar (im Sinn von Riemann) wenn für
jede Folge von Unterteilungen U j und jede Folge von Zwischenpunkten ξ j für U j mit δ(U j ) → 0 (j → ∞) die
Folge der Riemannsummen R(f, U j , ξ j ) konvergiert. Der (gemeinsame) Grenzwert dieser Folgen wird dann
als das Riemannintegral von f über [a, b] bezeichnet und als
Z b
j j
lim R(f, U , ξ ) =
f (x) dx
j→∞
a
geschrieben; die Menge der im Sinne von Riemann integrierbaren Funktionen wird mit R([a, b]) bezeichnet.
Die Definition des Riemannintegrals mit Hilfe von Folgenlimiten hat den Vorteil, dass wir einfache Eigenschaften desselben mit Hilfe der Sätze über das Verhalten von Folgenlimiten nachweisen können; sie hat
den Nachteil, dass wir noch nicht viele Beispiele von Riemann-integrierbaren Funktionen angeben können.
Zunächst wollen wir die Abgeschlossenheit unter einfachen algebraischen Operationen sowie das Monotonieverhalten des Integrals besprechen.
Lemma 20. Seien f, g ∈ R([a, b]). Dann ist für jedes λ ∈ R auch f + λg ∈ R([a, b]), und es gilt
Z b
Z b
Z b
(f (x) + λg(x)) dx =
f (x) dx + λ
g(x) dx.
a
a
a
Ist für jedes x ∈ [a, b] die Ungleichung f (x) ≤ g(x) erfüllt, so gilt
Z b
Z b
f (x) dx ≤
g(x) dx.
a
a
Ist a ≤ c ≤ b und f ∈ R([a, b]), so sind die Einschränkungen von f auf [a, c] und auf [c, b] über die jeweiligen
Intervalle Riemann-integrierbar, und es gilt
Z b
Z c
Z b
f (x) dx.
f (x) dx =
f (x) dx +
a
c
a
Übungsaufgabe 40. Beweise Lemma 20.
Übungsaufgabe 41. Zeige, dass jede Riemann-integrierbare Funktion f beschränkt ist.
23
Es ist bequem, für a < b
Z
a
Z
f (x) dx = −
b
f (x) dx
a
b
zu definieren.
In Wirklichkeit kommt es beim Riemannintegral nur auf die Feinheit der betreffenden Unterteilungen
an, wie die nächsten Lemmata zeigen. Zunächst zeigen wir eine Art Cauchykriterium für die RiemannIntegrierbarkeit.
Lemma 21. Sei f beschränkt auf [a, b]. Dann ist f Riemann-integrierbar auf [a, b] genau dann, wenn für
jedes ε > 0 ein δ > 0 existiert, sodass für beliebige Unterteilungen U 1 , U 2 mit δ(U 1 ) < δ, δ(U 2 ) < δ und
beliebige Vektoren von Zwischenpunkten ξ für U 1 und η für U 2 die Ungleichung
|R(f, U 1 , ξ) − R(f, U 2 , η)| < ε
erfüllt ist.
Beweis. Ist die Bedingung des Lemmas erfüllt, so ist für jede Folge von Zerlegungen U k und Vektoren
von Zwischenpunkten ξ k für U k die Folge R(f, U k , ξ k ) eine Cauchyfolge, also konvergent, und damit f
Riemann integrierbar.
Wenn die Bedingung des Lemmas nicht erfüllt ist, so gibt es ein ε0 > 0 sodass für jedes k in N eine
Unterteilung U k und ein Vektor von Zwischenpunkten ξ k sowie eine Unterteilung V k und ein Vektor von
Zwischenpunkten η k existiert, welche
1
1
, δ(V k ) ≤ , |R(f, U k , ξ k ) − R(f, V k , η k )| ≥ ε0
k
k
erfüllen. Die Mischung dieser Zerlegungsfolgen und Zwischenpunkten, d.h. die Folge Wk von Zerlegungen
welche durch W2k = Uk und W2k+1 = Vk und die Folge von Zwischenpunkten ζk welche durch ζ2k = ξk und
ζ2k+1 = ηk gegeben ist erfüllt dann δ(Wk ) → 0, ist aber offensichtlich keine Cauchyfolge, konvergiert alo
nicht; damit ist f also nicht Riemann-integrierbar.
δ(U k ) ≤
Lemma 22. Sei f beschränkt auf [a, b]. Dann ist f Riemann-integrierbar auf [a, b] genau dann, wenn
es ein I ∈ R gibt, sodass für jedes ε > 0 ein δ > 0 existiert, welches die Eigenschaft hat, dass für jede
Unterteilung U mit δ(U ) < δ und jeden Vektor von Zwischenpunkten ξ für U die Ungleichung
|R(f, U, ξ) − I| < ε
erfüllt ist. In diesem Fall ist
Z
I=
b
f (x) dx.
a
Beweis. Wenn die Bedingung des Lemmas erfüllt ist, ist es einfach zu zeigen, dass f Riemann-integrierbar
Rb
ist. Ist auf der anderen Seite f Riemann integrierbar, so sei I = a f (x) dx, und ε > 0 beliebig. Wir wählen δ
mit Hilfe von Lemma 21. Sei nun U k eine Folge von Unterteilungen und ξ k eine Folge von Zwischenvektoren
mit δ(Uk ) → 0 für k → ∞, dann konvergiert nach Vorraussetzung R(f, U k , ξ k ) → I für k → ∞. Wir wählen
ein N sodass |R(f, U N , ξ N ) − I| < ε und δ(U N ) < δ. Dann ist für jede andere Zerlegung U und jeden Vektor
von Zwischenpunkten ξ mit δ(U ) < δ
|R(f, U, ξ) − I| ≤ R(f, U, ξ) − R(f, U N , ξ N ) + R(f, U N , ξ N ) − I < 2ε.
Wir haben noch immer keine Beispiele Riemann-integrierbarer Funktionen; dies wollen wir nun beheben.
Wir erinnern zunächst daran, dass die charakteristische Funktion einer Menge E ⊂ R durch
(
0 x∈
/E
χE (x) =
1 x∈E
definiert ist.
24
Definition 20. Wir sagen, eine Funktion t ist eine Treppenfunktion, wenn t eine Linearkombination endlich
vieler charakteristischer Funktionen von nach rechts halboffenen Intervallen ist; d.h. wenn es endlich viele
λj ∈ R und aj < bj ∈ R, j = 1, . . . , N , gibt sodass
t(x) =
N
X
λj χ[aj ,bj )
j=1
ist. Der Raum aller Treppenfunktionen bildet einen Vektorraum über R, den wir mit T (R) bezeichnen. Die
Einschränkungen von Funktionen in T (R) auf ein Intervall [a, b] (oder eine beliebige Teilmenge E von R)
wird mit T ([a, b]) (bzw. T (E)) bezeichnet.
Lemma 23. Jedes t ∈ T ([a, b]) ist Riemann-integrierbar. Wenn
t(x) =
N
X
λj χ[aj ,bj )
j=1
mit a ≤ aj < bj ≤ b für alle j = 1, . . . , N ist, so ist
Z b
N
X
t(x) dx =
λj (bj − aj ).
a
j=1
Beweis. Es genügt nach den Linearitätsaussagen von Lemma 20, den Fall N = 1 zu betrachten, also
t(x) = λχ[a1 ,b1 ) . Sei U eine Unterteilung von [a, b] und ξ ein Zwischenvektor für U , dann ist
n−1
X
|R(t, U, ξ) − λ(a1 − b1 )| = χ[a1 ,b1 ) (ξj )(xj+1 − xj ) − λ(a1 − b1 )
j=1
X
=
λ(xj − xj−1 ) − λ(a1 − b1 )
a≤ξj <b
≤ 2δ(U ).
Nach Lemma 22 ist also t(x) Riemann-integrierbar, mit dem gewünschten Integral.
1.1. Das Darboux-Integral. Ein anderer Zugang zum Integralbegriff ist mit Hilfe von Ober- und
Untersummen; hier wird nicht notwendigerweise mit Funktionswerten gewichtet:
Definition 21. Sei U eine Zerlegung von [a, b], und f eine beschränkte Funktion auf [a, b]. Dann sind
!
n
n X
X
R+ (f, U ) =
sup f (ξ) (xj − xj−1 ), R− (f, U ) =
inf
f (ξ) (xj − xj−1 )
j=1
ξ∈[xj−1 ,xj ]
j=1
ξ∈[xj−1 ,xj ]
die Riemannsche Ober- und Untersumme von f auf [a, b]. Wir bezeichnen mit
D+ (f ) = inf R+ (f, U ),
D− (f ) = inf R− (f, U )
U
U
das obere und untere Darbouxintegral von f .
Lemma 24. Sei f beschränkt auf [a, b]. Dann gilt D− (f ) ≤ D+ (f ), und D− (f ) = D+ (f ) genau dann,
wenn für jedes ε > 0 eine Unterteilung U existiert mit
R+ (f, U ) − R− (f, U ) < ε.
Beweis. Für jede Unterteilung U gilt offensichtlich R− (f, U ) ≤ R+ (f, U ). Seien nun U 1 und U 2 beliebige
Unterteilungen. Wir sagen, eine Unterteilung Ũ ist eine Verfeinerung von U , wenn sie alle Unterteilungspunkte von U enthält. Es ist
R− (f, U ) ≤ R− (f, Ũ ),
R+ (f, Ũ ) ≤ R+ (f, U )
für jede solche Verfeinerung Ũ . Wir wählen Ũ als gemeinsame Verfeinerung von U 1 und U 2 und erhalten so
R− (f, U 1 ) ≤ R− (f, Ũ ) ≤ R+ (f, Ũ ) ≤ R+ (f, U 2 ).
25
Nachdem U 1 und U 2 beliebig waren, können wir links zum Supremum und rechts zum Infimum übergehen
und erhalten D− (f ) ≤ D+ (f ).
Ist D− (f ) = D+ (f ) = I, so gibt es für jedes ε > 0 eine Unterteilung U 1 mit I − R− (f, U 1 ) < ε und eine
Unterteilung U 2 welche R+ (f, U ) − I < ε erfüllt. Damit ist für jede gemeinsame Verfeinerung Ũ von U 1 und
U2
R+ (f, Ũ ) − R− (f, Ũ ) ≤ R+ (f, U 1 ) − R− (f, U 2 ) < 2ε.
Die andere Richtung ist trivial.
Unser nächstes Lemma erlaubt es uns, eine Verbindung zwischen Darboux- und Riemannintegralen
herzustellen.
Lemma 25. Sei f beschränkt auf [a, b] und U eine Unterteilung von [a, b] mit R+ (f, U ) − R− (f, U ) < ε.
Dann gibt es ein δ > 0 sodass für jede Unterteilung V von [a, b] mit δ(V ) < δ, dann gilt |R(f, V, ξ) −
R− (f, U )| < 2ε und |R(f, V, ξ) − R+ (f, U )| < 2ε.
Beweis. Sei U = (x0 , x1 , . . . , xn ) und V = (y0 , y1 , . . . , ym ) Unterteilungen wie im Lemma. Wir zerlegen
X
X
R(f, V, ξ) − R− (f, U ) =
f (ξj )(yj+1 − yj ) −
inf
f (η)(xk+1 − xk )
j
=
n−1
X
k

X

k=0
xk ≤η≤xk+1

f (ξj )(yj+1 − yj ) −
ξj ∈[xk ,xk+1 )
inf
xk ≤η≤xk+1
f (η)(xk+1 − xk ) ,
wobei wir im Summanden für k = n − 1 statt [xn−1 , xn ) das abgeschlossene Intervall [xn−1 , xn ] verwenden
wollen.
Nach Anwendung der Dreiecksungleichung sehen wir also, dass wir
X
f
(ξ
)(y
−
y
)
−
inf
f
(η)(x
−
x
)
j
j+1
j
k+1
k xk ≤η≤xk+1
ξj ∈[xk ,xk+1 )
abschätzen müssen. Wir bezeichnen mit yJ das kleinste yj 6= xk , welches in der ersten Summe vorkommt,
und mit yK 6= xk+1 das grösste; es ist dann notwendigerweise |yJ − xk | ≤ δ(V ) und |yK − xk+1 | ≤ δ(V ). Wir
können also mit M > supx∈[a,b] |f (x)| wie folgt abschätzen:
K
X
f
(ξ
)(y
−
y
)
−
inf
f
(η)(x
−
x
)
j
j+1
j
k+1
k j=J
K−1
X
≤ 2M δ(V ) + f (ξJ )(yJ+1 − xk ) + f (ξK )(xk+1 − yK ) +
f (ξj )(yj+1 − yj ) − inf f (η)(xk+1 − xk )
j=J+1
≤ 2M δ(V ) + (sup f (η) − inf f (η))(xk+1 − xk ).
Summieren wir diese Abschätzung nun über k, so erhalten wir
|R(f, V, ξ) − R− (f, U )| ≤ 2nM δ(V ) + R+ (f, U ) − R− (f, U ).
Damit gilt die Aussage des Lemmas für die Untersumme, wenn wir δ > 0 so klein wählen, dass δ2nM < ε.
Die Aussage des Lemmas für die Obersumme wird ganz analog bewiesen.
Der Zusammenhang zwischen den Darbouxintegralen und der Riemann-Integrierbarkeit wird im folgenden Satz zusammengefasst.
Satz 8. Sei f beschränkt auf [a, b]. Dann ist f integrierbar im Sinne von Riemann genau dann, wenn
D+ (f ) = D− (f ), und in diesem Fall ist
Z b
D+ (f ) = D− (f ) =
f (x) dx.
a
26
Beweis. Sei zunächst D+ (f ) = D− (f ), und ε > 0 beliebig. Nach Lemma 24 gibt es eine Unterteilung
U mit R+ (f, U ) − R− (f, U ) < ε. Wir wählen nun δ > 0 wie in Lemma 25 und erhalten für beliebige
Unterteilungen V, W mit δ(V ) < δ und δ(W ) < δ und Zwischenvektoren ξ zu V sowie η zu W , dass
|R(f, V, ξ) − R(f, W, η)| ≤ |R(f, V, ξ) − R+ (f, U )| + R+ (f, U ) − R− (f, U ) + |R− (f, U ) − R(f, W, η)| < 5ε.
Nach Lemma 21 ist f also Riemann-integrierbar.
Sei nun ε > 0 wiederum beliebig, und δ > 0 so wie oben gewählt, aber auch mit der Eigenschaft, dass
für jede Unterteilung mit δ(V ) < δ
Z b
f (x) dx < ε
R(f, V, ξ) −
a
gilt. Dann ist
Z b
Z b
f (x) dx < 4ε.
f (x) dx ≤ |D+ (f ) − R− (f, U )| + |R− (f, U ) − R(f, V, ξ)| + R(f, V, ξ) −
D+ (f ) −
a
a
Nachdem ε > 0 beliebig war, gilt also Gleichheit.
Die Gegenrichtung ist eine einfache Folgerung aus der Charakterisierung in Lemma 24 und der Cauchyfolgencharakterisierung der Riemann-Integrierbarkeit in Lemma 21.
Zusammensetzungen von Funktionen werden im folgenden Lemma behandelt.
Lemma 26. Sei f ∈ R([a, b]), und g eine Funktion, für die g ◦ f definiert ist. Wenn es eine Konstante
C > 0 gibt, sodass |g(f (x)) − g(f (y))| ≤ C|f (x) − f (y)| ist, so ist auch g ◦ f ∈ R([a, b]).
Beweis. Wenn |g(f (x)) − g(f (y))| ≤ C|f (x) − f (y)| ist, so gilt für beliebige Mengen E, dass
sup g ◦ f (x) − inf g ◦ f (y) ≤ C sup f (x) − inf f (y) .
y∈E
x∈E
x∈E
y∈E
Damit ist also für jede Unterteilung U auch
R+ (g ◦ f, U ) − R− (g ◦ f, U ) ≤ C(R+ (f, U ) − R− (f, U )),
und eine Anwendung der Charakterisierung in Theorem 8 gemeinsam mit Lemma 24 ergibt die Behauptung.
2. Konvergenzsatz und Folgerungen
Sei fn eine Folge von Funktionen auf [a, b]. Wir erinnern daran, dass fn gleichmässig auf [a, b] gegen f
konvergiert, wenn es für jedes ε > 0 ein N ∈ N gibt, sodass
|fn (x) − f (x)| < ε
für alle n ≥ N ist. Das Riemann-Integral ist “stabil” unter gleichmässiger Konvergenz:
Satz 9. Sei fn eine Folge Riemann-integrierbarer Funktionen auf [a, b], welche gleichmässig gegen f
konvergiert. Dann ist auch f Riemann-integrierbar, und es gilt
Z b
Z b
f (x) dx = lim
fn (x) dx.
a
n→∞
a
Wenn man die Aussage von Theorem 9 als
Z b
Z
lim fn (x) dx = lim
a n→∞
n→∞
b
fn (x) dx
a
schreibt, und sich in Erinnerung ruft, dass das Riemann-Integral als ein Grenzwert definiert ist, so wird klar,
dass Theorem 9 eine Aussage über das Vertauschen von Grenzwertprozessen ist. Diese Vertauschbarkeit ist
niemals selbstverständlich, und bedarf in jedem Fall eines Beweises.
27
Beweis. Um zu zeigen, dass f Riemann-integrierbar ist, bedienen wir uns zunächst Lemma 21. Sei also
ε > 0. Wir wählen ein N ∈ N mit |fn (x) − f (x)| < ε für n ≥ N . Da fN Riemann-integrierbar ist, gibt es ein
δ > 0 sodass
|R(fN , U 1 , ξ 1 ) − R(fN , U 2 , ξ 2 )| < ε,
wenn U 1 und U 2 Unterteilungen von [a, b] mit δ(U j ) < δ sind. Dann ist
|R(f, U 1 , ξ 1 ) − R(f, U 2 , ξ 2 )| ≤ |R(f, U 1 , ξ 1 ) − R(fN , U 1 , ξ 1 )| + |R(fN , U 1 , ξ 1 ) − R(fN , U 2 , ξ 2 )|
+ |R(fN , U 2 , ξ 2 ) − R(f, U 2 , ξ 2 )|
≤ (b − a)ε + ε + (b − a)ε,
und damit also f Riemann-integrierbar.
Um die Aussage über den Wert des Integrals zu beweisen, sei wieder ε > 0, und N ∈ N so gewählt, dass
|fn (x) − f (x)| < ε für n ≥ N . Wir wählen für jedes n eine Unterteilung U n mit Zwischenvektor ξ n für welche
Z b
Z b
n n
n n
f dx < ε
fn dx < ε und R(f, U , ξ ) −
R(fn , U , ξ ) −
a
a
ist. Dann gilt
Z
Z
Z b
b
b
n n fn (x) dx −
f (x) dx ≤ fn dx − R(fn , U , ξ ) + |R(fn , U n , ξ n ) − R(f, U n , ξ n )|
a
a
a
Z b
+ R(f, U n , ξ n ) −
f dx
a
≤ ε + (b − a)ε + ε
= (2 + (b − a))ε
also gilt auch die Aussage über die Vertauschung der Grenzwerte.
Korollar 8. Sei f eine stetige Funktion auf [a, b]. Dann ist f über [a, b] Riemann-integrierbar.
Beweis. Da f stetig auf [a, b] ist, ist f nach Theorem 3 auch gleichmässig stetig. Für jedes n ∈ N gibt
es also ein k = k(n) ∈ N sodass
|f (x) − f (y)| <
Wir definieren die Treppenfunktion
j
tn (x) = f a + (b − a) ,
n
1
1
, wenn |x − y| < .
n
k
j
(b − a)
(b − a)
≤ x − a < (j + 1)
.
n
n
Dann ist |tn (x) − f (x)| < 1/n, also konvergiert tn gleichmässig auf [a, b] gegen f . Da tn nach Lemma 23
Riemann-integrierbar ist, folgt aus Theorem 9, dass auch f Riemann-integrierbar ist.
Korollar 9. Sei f : [a, b] × [c, d] → R stetig. Dann ist die Funktion
Z b
g : [c, d] → R, y 7→
f (x, y) dx
a
stetig auf [c, d].
Beweis. Sei y0 ∈ [c, d] beliebig. Dann konvergiert für jede Folge yn mit yn → y0 für n → ∞ die Folge
von Funktionen fn (x) = f (x, yn ) gleichmässig gegen f0 (x) = f (x, y0 ). Also ist nach Theorem 9
Z b
Z b
lim g(yn ) = lim
fn (x) dx =
f0 (x) dx = g(y0 )
n→∞
n→∞
a
a
und damit g im Punkt y0 stetig.
28
Korollar 10. Sei f : [a, b] × [c, d] → R, und für jedes fixe x ∈ [a, b] sei die Funktion y 7→ f (x, y)
differenzierbar auf [a, b]. Die Ableitung fy (x, y), die dann wiederum auf [a, b] × [c, d] definiert ist, sei auch
stetig. Dann ist die Funktion
Z b
g : [c, d] → R, y 7→
f (x, y) dx
a
differenzierbar auf [c, d], und es gilt
g 0 (y) =
Z
b
fy (x, y) dx.
a
Beweis. Sei y ∈ [c, d] fix, und hj eine beliebige Folge mit hj → 0 für j → ∞ und y + hj ∈ [c, d] für alle
j. Dann ist die Folge der Differenzenquotienten für g,
Z b
Z b
f (x, y + hn ) − f (x, y)
g(y + hn ) − g(y)
fn (x, y) dx
=
dx =
hn (y) =
hn
hn
a
a
durch Funktionen fn gegeben, die auf [a, b] gleichmässig gegen fy (x, y) konvergieren; dies wollen wir nun
nachweisen.
Nach dem Mittelwertsatz der Differentialrechnung können wir fn (x, y) = fy (x, ξn ) mit einem ξn welches
|y − ξn | ≤ |hn | erfüllt. Nun ist fy nach Vorraussetzung stetig auf dem kompakten Intervall, also gleichmässig
stetig; zu gegebenem ε > 0 können wir demnach ein δ > 0 wählen sodass |fy (x, y) − fy (x0 , y 0 )| < ε wenn
|x − x0 | < δ und |y − y 0 | < δ. Ist nun N ∈ N so gross gewählt, dass |hn | < δ für n ≥ N , so ist also
|fy (x, y) − fn (x, y)| = |fy (x, y) − fy (x, ξn )| < ε.
Satz 10. Sei f stetig auf [a, b]. Dann gibt es ein ξ ∈ [a, b] mit
Z b
1
f (ξ) =
f (x) dx.
b−a a
Beweis. Da [a, b] kompakt ist, gibt es x0 , x1 ∈ [a, b] mit f (x0 ) ≤ f (x) ≤ f (x1 ) für x ∈ [a, b]. Dann ist
Z b
(b − a)f (x0 ) ≤
f (x) dx ≤ (b − a)f (x1 ),
a
und da f stetig ist, gibt es ein ξ mit
Z
(b − a)f (ξ) =
b
f (x) dx.
a
3. Das Lebesgue-Kriterium
Die Charakterisierung der Riemann-Integrierbarkeit in Theorem 8 sagt aus, dass die Punkte an denen
f nicht stetig ist, d.h. jene Punkte x0 für welche ein ε0 > 0 existiert sodass für jede Umgebung U die
Ungleichung supx∈U f (x) − inf x∈U f (x) > ε0 erfüllt ist, nicht “allzu viele” sein können. Diese Beobachtung
wird im Kriterium von Lebesgue explizit gemacht. Zunächst benötigen wir den Begriff der Oszillation einer
Funktion.
Definition 22. Sei f : R ⊃ X → R eine Funktion, und E ⊂ X eine Menge. Dann bezeichnen wir mit
ω(f, E) = supx∈E f (x) − inf y∈E f (y) = supx,y∈E |f (x) − f (y)| die Oszillation von f auf E.
Für einen Punkt x ∈ X ist
ω(f, x) = inf ω(f, X ∩ U ),
x∈U
wo das Infimum über Umgebungen U von x geht, die Oszillation von f im Punkt x.
Lemma 27. f : R ⊃ X → R ist stetig im Punkt x ∈ X genau dann, wenn ω(f, x) = 0.
Übungsaufgabe 42. Beweise Lemma 27.
29
Die Definition von “nicht allzu viele” ist etwas umständlicher. Eine Teilmenge N ⊂ R ist eine Nullmenge,
wenn es für jedes ε > 0 eine abzählbare Familie Ik = (ak , bk ), k ∈ N, von offenen Intervallen mit
X
[
(bk − ak ) < ε und N ⊂
Ik
k∈N
k∈N
gibt.
Übungsaufgabe 43. Zeige, dass abzählbare Mengen Nullmengen sind.
Definition 23. Wir sagen, eine Eigenschaft P (x) ist fast überall erfüllt, wenn die Menge der Punkte, wo sie
nicht erfüllt ist, eine Nullmenge ist.
Satz 11. Sei f : [a, b] → R. Dann ist f integrierbar im Sinn von Riemann genau dann, wenn f beschränkt
auf [a, b] und fast überall stetig ist.
Bevor wir uns dem Beweis von Theorem 11 widmen können, benötigen wir einige Vorbereitungen.
Lemma 28. Sei Nk , k ∈ N, eine abzählbare Familie von Nullmengen. Dann ist N = ∪k∈N Nk eine
Nullmenge.
Beweis. Sei ε > 0 beliebig. Für jedes k gibt es dann eine abzählbare Familie von Intervallen Ijk = (akj , bkj )
mit
[
X
ε
Ijk ⊃ Nk ,
(bkj − akj ) ≤ k .
2
j∈N
Dann ist
Ijk ,
j∈N
j, k ∈ N, wieder eine abzählbare Familie von Intervallen, welche
[
[
X
X ε
Ijk ⊃
Nk = N,
(bkj − akj ) ≤
=ε
2k
j,k∈N
k∈N
j,k∈N
k∈N
erfüllt.
Lemma 29. Sei f : R ⊃ X → R eine Funktion, und ε > 0. Dann ist die Menge {x ∈ X : ω(f, x) ≥ ε}
abgeschlossen.
Beweis. Wenn y im Abschluss von E = {x ∈ X : ω(f, x) ≥ ε} liegt, so gibt es für jede Umgebung U
von y einen Punkt x ∈ U ∩ E. Damit ist
ω(f, y) = inf ω(f, V ∩ X) ≥ ω(f, U ∩ X) ≥ inf ω(f, W ∩ X) = ω(f, x) ≥ ε,
y∈V
x∈W
also y ∈ E, und E erweist sich als abgeschlossen.
Beweis von Theorem 11. Sei zunächst f Riemann-integrierbar. Dann ist f beschränkt nach Übungsaufgabe 41.
Wenn wir mit S die Menge der Unstetigkeitsstellen von f bezeichnen, so ist nach Lemma 27
[
1
S=
x ∈ [a, b] : ω(f, x) ≥
,
k
k∈N
und nach Lemma 28 genügt es zu zeigen, dass jede der Mengen
Sα = {x ∈ [a, b] : ω(f, x) ≥ α}
eine Nullmenge ist.
Sei also ε > 0 beliebig. Dann existiert eine Unterteilung U = (x0 , . . . , xn ) von [a, b] sodass R+ (f, U ) −
R− (f, U ) < ε. Seien Jk jene Intervalle Jk = [xjk , xjk +1 ] für welche Jk ∩ Sα 6= ∅. Dann ist
X
X
α
(xjk +1 − xjk ) ≤
ω(f, [xjk +1 − xjk ])(xjk +1 − xjk ) ≤ R+ (f, U ) − R− (f, U ) < ε.
k
Wir definieren
Dann gilt
k
Ik = xjk −
, xjk +1 +
= (ak , bk ).
2n
2n
[
X
1
Sα ⊂
Ik , und
(bk − ak ) ≤ ε 1 +
,
α
k
k
30
und nachdem ε > 0 beliebig war, erweist sich Sα als Nullmenge.
Sei nun andererseits S (wie oben definiert) eine Nullmenge, und ε > 0 beliebig. Dann ist Sε eine
Nullmenge, welche überdies eine abgeschlossene Teilmenge von [a, b] und damit kompakt ist. Überdecken
wir also Sε mit Intervallen Ik = (ak , bk ), so genügen schon endlich viele dieser Intervalle, von denen wir
überdies annehmen können, dass sie sich nicht überschneiden; nachdem Sε eine Nullmende ist, können wir
demenstprechend eine solche endliche Überdeckung mit
X
(bk − ak ) < ε
k
wählen. Das Komplement K von ∪Ik ist eine abgeschlossene Teilmenge von [a, b], also kompakt. Nachdem
jeder Punkt x ∈ K eine Umgebung besitzt, für welche die Oszillation von f auf dieser Umgebung kleiner als
ε ist, können wir eine Unterteilung U = (x0 , . . . , xn ) von [a, b] finden, welche die ak und bk an aneinanderfolgenden Stellen enthält und wo für jedes xj welches kein ak ist ω(f, [xj , xj+1 ]) < ε gilt.
Damit ist
n−1
X
R+ (f, U ) − R− (f, U ) =
ω(f, [xj , xj+1 ])(xj+1 − xj ) ≤ ε2 sup |f (x)| + (b − a)ε.
x∈[a,b]
j=0
Nachdem ε > 0 beliebig war, folgt die Riemann-Integrierbarkeit von f nun aus Theorem 8.
4. Hauptsätze und Folgerungen
Satz 12. Sei f stetig auf [a, b]. Dann ist die Funktion
Z
F : [a, b] → R,
F (x) =
x
f (t) dt
a
auf [a, b] differenzierbar, mit F 0 = f .
Beweis. Sei x ∈ [a, b] fix. Für jedes h gibt es nach Theorem 10 ein ξh mit |x − ξh | < h sodass
Z
1 x+h
f (t) dt
f (ξh ) =
h x
gilt. Somit ist
F (x + h) − F (x)
= lim f (ξh ) = f (x).
lim
h→0
h→0
h
Satz 13. Sei F : [a, b] → R stetig, und differenzierbar auf (a, b), mit F 0 = f . Wenn f Riemannintegrierbar ist, so gilt
Z b
f (x) dx = F (b) − F (a).
a
Beweis. Wir wählen die Unterteilungen U n = (x0 , x1 , . . . , xn ) von [a, b] welche durch xj = a + j(b−a)
n
gegeben ist. Nach dem Mittelwertsatz der Differentialrechnung gibt es ξjn mit xj ≤ ξjn ≤ xj+1 welche
F (xj+1 ) − F (xj ) = f (ξj )(xj+1 − xj ) erfüllen. Es folgt
Z b
f (x) dx = lim R(f, U n , ξ n )
a
n→∞
= lim
n→∞
= lim
n→∞
n−1
X
f (ξjn )(xj+1 − xj )
j=0
n−1
X
(F (xj+1 ) − F (xj ))
j=0
= F (b) − F (a).
31
Die Hauptsätze zeigen uns, in welchem Sinn die Integration und die Differentiation inverse Operationen
sind: Will man eine stetige Funktion f integrieren (oder, gleichwertig, die Fläche unter dem Graphen einer
stetigen Funktion bestimmen), so verwendet man eine Stammfunktion F , d.h. eine Funktion F mit der
Eigenschaft, dass ihre Ableitung F 0 mit der gegebenen Funktion f übereinstimmt. Stammfunktionen sind
immer nur bis auf Konstanten bestimmt; man bezeichnet eine Stammfunktion F auch gerne als unbestimmtes
Integral von f und schreibt
Z
F (x) = f (x) dx;
wie schon gesagt, ist diese Schreibweise nicht exakt, da mit F (x) auch F (x) + C für jedes C ∈ R auf der
linken Seite dieser Gleichung stehen kann. Weiters gibt uns Theorem 12 eine “grosse” Klasse von Funktionen
(d.h. stetige), welche Stammfunktion besitzen.
Die Rechenregeln der Differentialrechnung haben ihre Entsprechung in Regeln für die unbestimmte
Integration:
Lemma 30. Wenn f, g Stammfunktionen besitzen, und λ ∈ R beliebig ist, dann besitzt auch die Funktion
λf + g eine Stammfunktion, welche durch
Z
Z
Z
λf (x) + g(x) dx = λ f (x) dx + g(x) dx
gegeben ist.
Wenn f eine Stammfunktion F besitzt, und F g 0 eine Stammfunktion besitzt, so besitzt auch f g eine
Stammfunktion, welche durch
Z
Z
f (x)g(x) dx = F (x)g(x) − F (x)g 0 (x) dx
gegeben ist (partielle Integration).
Besitzt f (y) eine Stammfunktion F (y), und ist ϕ(x) differenzierbar, so besitzt auch f 0 (ϕ(x))ϕ0 (x) eine
Stammfunktion, welche durch
Z
f 0 (ϕ(x))ϕ0 (x) dx = F (ϕ(x))
gegeben ist (Substitutionsregel).
Mit Hilfe der Regeln in Lemma 30 kann man viele “elementare” Funktionen integrieren. Da wir an dieser
Stelle noch nicht auf die noch einzuführenden elementaren transzendenten Funktionen vorgreifen wollen,
wird eine genauere Behandlung von Techniken der Integration erst später erfolgen. Wir bemerken hier, dass
Lemma 30 mit Absicht etwas “unscharf” formuliert ist; sein Inhalt ist auch keine analytische Aussage über
das Integral, sondern formale Rechenregeln, welche aus den algebraischen Regeln für die Ableitung folgen. Es
macht deswegen keinen Sinn, sich im Rahmen dieses Lemmas die Fragen wo und wie sehr die entsprechenden
Funktionen differenzierbar sind zu stellen.
Übungsaufgabe 44. Beweise die Aussagen von Lemma 30.
Anders ist dies, wenn wir die entsprechenden Aussagen für bestimmte (d.h. Riemann) Integrale beweisen
wollen. Die Summenformel haben wir schon bewiesen; wie sieht es mit den entsprechenden Aussagen für die
partielle Integration und die Substitutionsregel aus?
Lemma 31. Seien F und g auf [a, b] stetig differenzierbar, mit F 0 = f . Dann gilt
Z
b
Z
f (x)g(x) dx = F (b)g(b) − F (a)g(a) −
a
b
F (x)g 0 (x) dx.
a
Beweis. Da F (x)g(x) stetig differenzierbar ist, gibt es nach dem Mittelwertsatz für beliebige x, y ∈ [a, b]
ein ξ(x, y) mit x < ξ < y sodass F (y)g(y) − F (x)g(x) = (f (ξ)g(ξ) + F (ξ)g 0 (ξ))(y − x). Für eine beliebige
32
Unterteilung U = (x0 , . . . , xn ) können wir demnach mit ξj = ξ(xj−1 , xj )
F (b)g(b) − F (a)g(a) =
=
n
X
j=1
n
X
F (xj )g(xj ) − F (xj−1 )g(xj−1 )
(f (ξj )g(ξj ) + F (ξj )g 0 (ξj ))(xj − xj−1 )
j=1
= R(f g + F g 0 , U, ξ)
schreiben. Da die beteiligten Funktionen alle stetig, also Riemann-integrierbar sind, folgt die Behauptung
wenn wir δ(U ) → 0 streben lassen.
Lemma 32. Sei ϕ : [a, b] → [ϕ(a), ϕ(b)] = [c, d] eine strikt monoton wachsende (bzw. monoton fallende)
stetig differenzierbare Funktion. Dann gilt
Z b
Z d
f (ϕ(x))ϕ0 (x) dx
f (y) dy =
a
c
für jede Riemann-integrierbare Funktion f auf [c, d].
Beweis. Nach Theorem 11 ist f (ϕ(x))ϕ0 (x) Riemann-integrierbar. Sei nun V = (y0 , . . . , yn ) eine Unterteilung von [c, d], und yj = ϕ(xj ). Dann ist ϕ−1 (V ) = (x0 , . . . , xn ) eine Unterteilung von [a, b]; wir wählen
für jedes j ein ξj mit xj−1 ≤ ξj ≤ xj mit ϕ(xj+1 ) − ϕ(xj ) = ϕ0 (ξj ), und schreiben ϕ(ξ) = (ϕ(ξ1 ), . . . ϕ(ξn ))
für diesen Zwischenvektor gilt
R(f, U, ϕ(ξ)) = R((f ◦ ϕ)ϕ0 , ϕ−1 (U ), ξ);
wegen der gleichmässigen Stetigkeit von ϕ auf [a, b] gilt δ(ϕ(U )) → 0 wenn δ(U ) → 0, und der Übergang
zum Grenzwert liefert die Behauptung.
Eine weitere wichtige Folgerung aus den Hauptsätzen ist folgende wichtige Eigenschaft von differenzierbaren Funktionen an Nullstellen.
Korollar 11. Sei f : [−ε, ε] → R stetig differenzierbar, mit f (0) = 0. Dann gibt es eine stetige Funktion
g : [−ε, ε] → R sodass f (x) = xg(x).
Beweis. Wir betrachten die Funktion ϕ(t) = f (tx). Dann ist f (x) = ϕ(1), ϕ(0) = 0, und
Z 1
Z 1
0
f (x) = f (x) − f (0) = ϕ(1) − ϕ(0) =
ϕ (t) dt = x
f 0 (tx) dt.
0
Die Funktion
0
1
Z
f 0 (tx) dt
g(x) =
0
ist stetig nach Korollar 9.
33
KAPITEL 4
Reell-analytische Funktionen
1. Formale Potenzreihen
Eine formale Potenzreihe f (x) im Entwicklungspunkt x0 ∈ R ist ein Ausdruck der Form
f (x) =
∞
X
fj (x − x0 )j ,
j=0
wo die fj komplexe Zahlen (die Koeffizienten der Reihe) sind. Obwohl wir uns dieser bequemen Schreibweise
bedienen wollen, betonen wir an dieser Stelle gleich, dass die Bezeichnung f (x) in keiner Weise bedeutet,
dass wir die Reihe auf der rechten Seite der Gleichung oben an irgendeiner Stelle x ∈ R auswerten können,
und wir keinerlei Recht haben, den Ausdruck als Funktion zu deuten; in diesem Sinn ist f (x) einfach eine
bequeme Schreibweise für die Koeffizientenfolge (fj )j∈N . Eine einzige Ausnahme zu dieser Regel ist die
Auswertung an der Entwicklungsstelle x0 , welche einfach den konstanten Term (d.h. den Term der Ordnung
0) der Potenzreihe reproduziert, f (x0 ) = f0 .
Formale Potenzreihen f (x) und g(x), gegeben durch
f (x) =
∞
X
fj (x − x0 )j ,
g(x) =
∞
X
gj (x − x0 )j ,
j=0
j=0
werden addiert und mit Skalaren λ ∈ R multipliziert, indem man diese Operationen auf die Koeffizienten
anwendet, d.h. wir definieren
∞
X
(f (x) + λg(x)) =
(fj + λgj )(x − x0 )j .
j=0
Die Multiplikation wird definiert, indem man Terme der richtigen Ordnung zusammenfasst, d.h.


X
X

f (x)g(x) =
fj g`  (x − x0 )k .
k∈N
j+`=k
Mit diesen Operationen wird der Raum der formalen Potenzreihen, welcher mit C[[x − x0 ]] bezeichnet wird,
zu einer Algebra mit Einselement f (x) = 1 (die formale Potenzreihe mit konstantem Glied 1) über R.
Übungsaufgabe 45. Zeige die letzte Behauptung!
Unsere formalen Potenzreihen haben zwar komplexe Koeffizienten, aber die Variable wird als “reelle
Veränderliche” aufgefasst werden (im Moment ist sie nur ein Buchstabe!). In diesem Sinn können und werden
wir eine formale Potenzreihe f ∈ C[[x]] in ihren Real- und Imaginärteil durch
X
X
f (x) = Re f (x) + i Im f (x) =
(Re fj )xj + i
(Im fj )xj ,
j
j
wo nun Re f, Im f ∈ R[[x]], zerlegen.
Will man zwei formale Potenzreihen g(y) ∈ C[[y−y0 ]] und f (x) ∈ C[[x−x0 ]] zu einer formalen Potenzreihe
g(f (x)) ∈ C[[x − x0 ]] zusammensetzen, so muss man im Allgemeinen verlangen, dass der konstante Term
f (x0 ) = y0 ist, und setzt in diesem Fall
X
g(f (x)) =
gk (f (x) − y0 )k .
k
35
Übungsaufgabe 46. Warum ist diese Definition erlaubt? Gibt es andere Fälle, in denen die Zusammensetzung erlaubt ist?
Wir werden im folgenden oft mit dem Entwicklungspunkt x0 = 0 arbeiten; dies ist keine besondere
Einschränkung, da ja für f (x) ∈ C[[x]] die Zusammensetzung f (x − x0 ) ∈ C[[x − x0 ]] definiert ist, und die
so definierte Abbildung f (x) 7→ f (x − x0 ) ein Algebraisomorphismus ist. Die Einheiten der Algebra C[[x]],
also die bezüglich der Multiplikation invertierbaren Elemente, sind leicht zu bestimmen:
Lemma 33. Die formale Potenzreihe f (x) ∈ C[[x]] ist eine Einheit genau dann, wenn f (0) 6= 0. Damit
gibt es ein eindeutig bestimmtes maximales Ideal m ⊂ C[[x]], welches durch
m = {f (x) : f (0) = 0}
gegeben ist.
Beweis. Die Notwendigkeit der Bedingung ist offensichtlich: Wenn es eine Potenzreihe g mit f (x)g(x) =
1 gibt, so ist f (0)g(0) = 1, also f (0) 6= 0. Sei nun f (0) 6= 0; ohne Beschränkung der Allgemeinheit können
wir annehmen, dass f (0) = 1 ist. Wir können also f (x) = 1 − h(x) mit h(0) = 0 schreiben.
Es ist uns schon bekannt (oder leicht zu sehen), dass die Potenzreihe
X
y j = G(y) ∈ C[[y]]
j∈N
die Eigenschaft hat, dass (1 − y)G(y) = 1 ist. Wir ersetzen nun y durch h(x) und sehen, dass f (x)G(h(x)) =
(1 − h(x))G(h(x)) = 1 ist. Die letzte Aussage des Lemmas folgt, da ein echtes Ideal keine Einheiten enthalten
kann, und die Menge der Elemente, welche nicht Einheiten sind, durch die Bedingung f (0) = 0 charakterisiert
wird, welche diese Menge als Ideal erkennbar macht.
Formale Ableitungen und Stammfunktionen sind einfach zu definieren; für eine formale Potenzreihe f (x)
ist die Ableitung definiert durch
∞
X
f 0 (x) =
jfj xj−1 .
j=0
0
Offensichtlich ist f (x) = 0 genau dann, wenn f (x) = r ∈ R eine konstante Potenzreihe ist. Eine formale
Stammfunktion F (x) zu f (x) ist durch
Z
∞
X
fj j+1
x
F (x) = f (x) dx =
j
+1
j=0
gegeben; diese spezielle Wahl zeichnet sich durch F (0) = 0 aus. Wir führen nun einige wichtige formale
Potenzreihen ein; diese kennen wir zwar auch als Funktionen, hier gehen wir aber zunächst rein formal vor.
Übungsaufgabe 47. Rechenregeln für Ableitungen (Produktregel, Quotientenregel, Kettenregel) und unbestimmte Integration gelten auch im formalen Sinn.
Lemma 34. Sei λ ∈ C. Dann gibt es für jedes y0 ∈ R genau eine formale Potenzreihe y(x) ∈ C[[x]],
welche die Differentialgleichung y 0 (x) = λy(x) mit der Anfangsbedingung y(0) = y0 erfüllt. Diese Potenzreihe
wird als Exponentialreihe bezeichnet und ist durch
y(x) = y0 eλx = y0
∞
X
(λx)j
j=0
j!
gegeben. Sie erfüllt die Funktionalgleichung
e(λ+µ)x = eλx eµx , λ, µ ∈ C.
P
Beweis. Der unbestimmte Ansatz y(x) = y0 + j>1 yj xj führt durch Koeffizientenvergleich zu der
Familie von Gleichungen
jyj = yj−1 , j ≥ 1,
welche eindeutig durch yj =
y0
j!
gelöst wird.
36
Die Funktionalgleichung überprüfen wir, indem wir beachten, dass sich die Ableitung der rechten Seite
f (x) = eλx eµx als f 0 (x) = λeλx eµx + µeλx eµx = (λ + µ)f (x) berechnet. Damit erfüllt f (x) die Differentialgleichung, welche nach dem ersten Teil durch e(λ+µ)x eindeutig gelöst wird.
Übungsaufgabe 48. Löse die Differentialgleichungen y 00 (x) = y(x) und y 00 (x) = −y(x) in C[[x]].
Beispiel 5. Der Real- und Imaginärteil der Reihe eix werden als cos(x) und sin(x) bezeichnet:
Re eix = cos(x) + i sin(x).
Diese Reihen sind also durch
cos(x) =
X (−1)k
(2k)!
k
x2k ,
sin(x) =
X (−1)k
x2k+1
(2k + 1)!
k
gegeben.
Lemma 35. Die formale Stammfunktion zu f (x) = (1 + x)−1 ∈ C[[x]], welche durch
∞
X
(−1)j+1
ln(1 + x) =
j=1
j
xj
gegeben ist, wird als die Logarithmusreihe bezeichnet, und erfüllt eln(1+x) = 1 + x und ln(ex ) = x.
Beweis. Da
X
1
=
(−1)j xj ,
1+x
j≥0
erhalten wir mit formaler Integration
Z
X (−1)j+1
1
dx =
xj .
1+x
j
j≥0
ln(1+x)
Die Zusammensetzung f (x) = e
ist wegen ln(1 + 0) = 0 wohldefiniert und erfüllt f (0) = 1, und
ln(1+x)
(x)
wir erhalten unter Verwendung der Differentialgleichung der Exponentialreihe und f 0 (x) = e 1+x = f1+x
.
Diese Differentialgleichung besitzt für die Anfangsbedingung f (0) = 1 die eindeutige Lösung f (x) = 1 + x.
Auf der anderen Seite ist die Zusammensetzung g(x) = ln(ex ) wegen e0 = 1 definiert (eigentlich steht
hier ln(1 + (ex − 1))), erfüllt g(0) = 0 und wir können wiederum g 0 (x) = e1x ex = 1 berechnen, also g(x) = x
wie behauptet.
2. Konvergente Potenzreihen
Eine formale Potenzreihe f (x) ∈ C[[x − x0 ]] ist konvergent, wenn es ein x1 6= x0 gibt sodass die Reihe
X
f (x1 ) =
fj (x1 − x0 )j
j
konvergiert. In diesem Fall definieren wir den Konvergenzradius von f als




X
R(f ) = sup |x1 − x0 | :
fj (x1 − x0 ) konvergiert ,


j
und R(f ) = 0 wenn es kein x1 6= x0 gibt sodass f (x1 ) konvergiert. Die Menge der konvergenten Potenzreihen
wird mit C{x − x0 } bezeichnet.
Lemma 36. Sei f ∈ C[[x − x0 ]], und K ⊂ (x0 − R(f ), x0 + R(f )) =: D(f ) kompakt. Dann konvergieren
die Partialsummen
k
X
Txk0 f =
fj (x − x0 )j
j=0
absolut und gleichmässig auf K. Die auf D(f ) als Grenzwert dieser Partialsummen definierte Funktion,
welche wir wiederum mit f bezeichnen, ist stetig.
37
Beweis. Wir können R(f ) > 0 annehmen. Da K kompakt ist, gibt es ein x1 ∈ D(f ) und ein q < 1 mit
q|x1 − x0 | > maxx∈K |x − x0 |. Weiters ist, da ja f (x1 ) konvergiert, die Folge fj (x1 − x0 )j eine Nullfolge, also
insbesondere beschränkt; wir wählen ein M > 0 mit |fj (x1 − x0 )j | ≤ M für alle j ∈ N. Dann ist für beliebige
x∈K
k
k
X
X
q `+1
.
|fj (x − x0 )j | ≤
M qj ≤
1−q
j=`+1
j=`+1
Also konvergieren die Partialsummen gleichmässig und absolut auf K. Die Stetigkeit der Grenzfunktion folgt
aus Lemma 17.
Wir können nun sehen, dass C{x} ⊂ C[[x]] eine Teilalgebra ist:
Lemma 37. Seien f, g ∈ C[[x]]. Dann gilt
R(f + λg) ≥ min(R(f ), R(g)),
R(f g) ≥ min(R(f ), R(g)).
Ist f (0) = 0, und R(f ), R(g) > 0, so ist auch R(g ◦ f ) > 0.
Übungsaufgabe 49. Beweise Lemma 37.
Die Berechnung des Konvergenzradius kann zum Beispiel mit Hilfe des Wurzel- oder des Quotientenkriteriums erfolgen:
Lemma 38 (Hadamardkriterium). Sei f (x) ∈ C[[x]]. Dann ist
1
,
R(f ) =
lim supj→∞ |fj |1/j
wo wir 1/∞ = 0 und 1/0 = ∞ vereinbaren.
Beweis. Wir schreiben zunächst S =
1
lim supj→∞ |fj |1/j
6= 0, ∞. Ist nun |x| < S, so schreiben wir |x| = qS
mit einem q < 1. Da S lim supj→∞ |fj |1/j = 1, ist für beliebiges ε > 0 die Ungleichung S j |fj | ≤ (1 + ε)j für
fast alle j erfüllt. Wir wählen ε so klein, dass q 0 = q(1 + ε) < 1 ist. Damit ist für fast alle j die Ungleichung
|fj ||x|j = |fj |q j S j ≤ (q 0 )j erfüllt; damit ist die Reihe f (x) für diese x konvergent. Ist auf der anderen Seite
1
|x| > S, also |x| = Sq mit einem q > 1, so ist für unendlich viele j die Ungleichung |fj |1/j > Sq
erfüllt, also
j
|fj ||x| > 1 für diese j; damit kann die Reihe f (x) für diese x nicht konvergieren, da ihre Glieder nicht gegen
0 gehen. Es folgt R(f ) = S.
Die Fälle S = 0 und S = ∞ werden ganz ähnlich behandelt.
Lemma 39. Sei f (x) ∈ C[[x]] mit |fj | > 0 für fast alle j. Dann ist
R(f ) = lim
j→∞
Beweis. Sei S = limj→∞
alle j ∈ N. Nun ist
|fj |
|fj+1 | ;
|fj |
.
|fj+1 |
wir nehemen ohne Beschränkung der Allgemeinheit an, dass fj 6= 0 für
|x|
|fj+1 ||x|j+1
=
;
j→∞
|fj ||x|j
S
also können wir das übliche Quotientenkriterium für |x| < S anwenden, um auf die Konvergenz zu schliessen,
und ehalten für |x| > S Divergenz.
lim
Übungsaufgabe 50. Berechne die Konvergenzradien von ex und ln(1 + x).
Manchmal ist es bequemer, mit Wachstumsbedingungen an die Koeffizienten einer konvergenten Reihe
zu arbeiten.
P
Lemma 40. Sei f ∈ C[[x]], f = j fj xj , und für s ≥ 0 definiere
Ms (f ) = sup |fj |sj .
j
Dann ist R(f ) = sup{s ≥ 0 : Ms (f ) < ∞}.
38
Aus dem Hadamardkriterium und der Tatsache, dass limn→∞ n1/n = 1 ist, können wir folgende Beobachtung herleiten:
Lemma 41. Ist f ∈ C[[x]] und F eine formale Stammfunktion von f , so ist R(f 0 ) = R(F ) = R(f ).
Insbesondere ist f ∈ C ∞ (D(f )).
Die letzte Behauptung folgt dabei direkt aus Lemma 36 und Lemma 17, da die Partialsummen (als
Polynome) glatt sind.
Das Verhalten einer Potenzreihe in den Randpunkten des Konvergenzintervalls D(f ) kann ganz unterschiedlich ausfallen. So ist die Reihe
X
1
=
xj
1−x
j
weder im linken noch im rechten Randpunkt konvergent; die Logarithmusreihe
X (−1)j+1 xj
ln(1 + x) =
j
j
konvergiert für x = 1 nach dem Leibnizkriterium (aber nicht absolut) und divergiert für x = −1 als harmonische Reihe; die Reihe
X xj
j2
j
konvergiert in beiden Randpunkten absolut. Eine befriedigende Antwort auf die sich hier aufdrängenden
Fragen kann erst im Rahmen der komplexen Analysis gegeben werden.
Wir wollen nun versuchen, (konvergente) Potenzreihen bezüglich der Zusammensetzung zu invertieren;
wir arbeiten der Einfachkeit halber wieder in C[[x]]. Seien f, g ∈ C[[x]] mit f (0) = g(0) = 0 gegeben, welche
f (g(x)) = x erfüllen. Wir sehen direkt, dass f 0 (0)g 0 (0) = 1 ist. Mit Hilfe einer nichtverschwindenden Ableitung können wir die Existenz einer inversen Potenzreihe nachweisen. Wir beweisen zunächst ein einfaches
Lemma, welches uns später zum Nachweis der Konvergenz der inversen Potenzreihe dienen wird.
Lemma 42. Sei N > 1. Dann gibt es eine Konstante E mit
X
(1 + `)N
< E.
(1 + j)N (1 + k)N
j+k=`
Beweis. Es ist
X
j+k=`
X
(1 + `)N
(1 + `)N
≤
2
(1 + j)N (1 + k)N
(1 + j)N (1 + (` − j))N
j≤`/2
≤2
X
j≤`/2
≤ 2N +1
(1 + `)N
(1 + `/2)N (1 + j)N
∞
X
j=0
1
=: E.
(1 + j)N
Lemma 43. Sei N > 1. Dann gibt es eine Konstante E, sodass die sodass für jedes m ∈ N der Koeffizienten dm von tm in
!`
X
X
k
ck t
=
dj tj
j
k
die Ungleichung
dm ≤
(M E)` sm
(1 + m)N
k
s
erfüllt, wenn für k ≤ m die Ungleichung ck < M (1+k)
N erfüllt ist.
39
Beweis. Wir beweisen die Gültigkeit der Ungleichung mit Induktion über `; für ` = 1 ist sie trivialerweise erfüllt. Wissen wir nun, dass für
!`−1
X
X
j
k
ej t =
ck t
j
k
die Abschätzung
(M E)`−1 sj
,
(1 + j)N
erfüllt ist, so folgt für den Koeffizienten dm , dass
X
dm =
ep cq
ej ≤
j ≤ m,
p+q=m
≤
X (M E)`−1 sp M sq
(1 + p)N (1 + q)N
p+q=m
≤
(1 + m)N
M (M E)`−1 sm X
(1 + m)N
(1 + p)N (1 + q)N
p+q=m
≤
(M E)` sm
.
(1 + m)N
0
Satz 14. Sei f (x) ∈ C[[x − x0 ]] mit f (x0 ) = y0 und f (x0 ) 6= 0 gegeben. Dann gibt es ein eindeutig
bestimmtes g(y) ∈ C[[y − y0 ]], welches f (g(y)) = y erfüllt; es gilt dann auch g(f (x)) = x. Ist f ∈ C{x − x0 },
so ist auch g ∈ C{y − y0 }.
Beweis. Zunächst bemerken wir, dass wir ohne Beschränkung der Allgemeinheit annehmen können,
dass x0 = y0 = 0: Ist f wie in den Vorraussetzungen, so betrachten wir ϕ(x) = f (x + x0 ) − y0 ∈ C[[x]];
ϕ(x) erfüllt ϕ(0) = 0 und ϕ0 (0) = f 0 (x0 ) 6= 0. Kennen wir den Satz für x0 = 0, so wissen wir, dass es ein
ψ ∈ C[[x]] mit ϕ(ψ(x)) = x gibt. Wir setzen g(y) = ψ(y − y0 ) + x0 , dann ist f (g(y)) = f (ψ(y − y0 ) + x0 ) =
ϕ(ψ(y − y0 )) + y0 =P
y − y0 + y0 = y.
Wir setzen g = j gj xj an. Die Gleichung f (g(x)) = x übersetzt sich in g0 = 0, f1 g1 = 1, und für j > 1
f1 gj + Pj (fk , gk : k < j) = 0,
wo Pj ein Polynom ist, genauer gesagt, der Koeffizient von tj in dem Ausdruck
!k
j
j−k
X
X
fk
g` t`
.
k=2
`=1
Wir sehen also, dass wir die gj induktiv eindeutig bestimmen können, was die Existenz einer formalen
Potenzreihe mit der gewünschten Eigenschaft zeigt.
Weiters erfüllt das konstruierte g die Vorraussetzungen des Satzes, es gibt also ein h(x) mit g(h(x)) = x;
dieses erweist sich aber wegen f (x) = f (g(h(x))) = h(x) als das gegebene f .
Für den Konvergenzbeweis wollen wir ohne Beschränkung der Allgemeinheit annehmen, dass f 0 (0) = 1
ist: falls f 0 (0) = λ, so erfüllt die Funktion ϕ = λ−1 f , dass ϕ0 (0) = 1. Wenn wir das Ergebnis für solche
Funktionen bewiesen haben, erhalten wir ein ψ mit ϕ(ψ(x)) = x. Setzen wir nun g(x) = ψ(λ−1 x), so ist
f (g(x)) = λϕ(ψ(λ−1 x)) = x.
Sei im folgenden N > 1 fix. Da f konvergent ist, können wir K, C > 0 mit |fj | ≤ CK j bestimmen.
Die Koeffizienten gj sind nun induktiv durch
gj = −Pj (fk , gk )
gegeben. Wir behaupten, dass es L, M > 0 gibt, sodass
|gj | ≤
M Lj
.
(1 + j)N
40
Indem wir L genügend gross wählen, können wir M beliebig klein machen, sodass die Abschätzung für j = 1
erfüllt ist. Angenommen, dies ist für j < m der Fall. Dann ist
|gm | ≤
m
X
k=2
CK k
m
X
Lm
Lm
(M E)k Lm
k
≤
,
C(KM
E)
≤
(1 + m)N
(1 + m)N
(1 + m)N
k=2
wenn wir L genügend gross wählen, sodass
∞
X
(KM E)k =
k=2
(KM E)2
1
<
1 − KM E
C
ist.
3. Reell-analytische Funktionen
Sei U ⊂ R offen. Eine Funktion ϕ : R ⊃ U → C heisst reell-analytisch auf U , wenn es für jedes x0 ∈ U
eine Potenzreihe f (x) ∈ C{x−x0 } gibt, welche R(f ) > 0 erfüllt und in einer Umgebung von x0 die Funktion f
darstellt, also f (x) = ϕ(x) für alle x in einer Umgebung von x0 . Die Menge der reell-analytischen Funktionen
auf U wird mit C ω (U ) bezeichnet.
Übungsaufgabe 51. Welche algebraische Struktur besitzt C ω (U )?
Nach Lemma 36 sind reell-analytische Funktionen insbesondere glatt. Eine glatte Funktion, welche reellanalytisch ist, muss P
an jeder Stelle ihres Funktionsbereichs durch ihre Taylorreihe an dieser Stelle gegeben
sein: Wenn ϕ(x) = j fj (x − x0 )j ist, so erhalten wir durch Differenzieren, dass j!fj = ϕ(j) (x0 ) für alle j
ist. Allgemein schreiben wir
Tx0 ϕ =
X ϕ(j)
j
j!
(x − x0 )j ∈ C[[x − x0 ]]
für die (formale) Taylorreihe von einer glatten Funktion ϕ, welche in einer Umgebung von x0 definiert ist.
Nicht alle glatten Funktionen sind reell-analytisch, und auch die Konvergenz der Taylorreihe einer glatten
Funktion ist keine Garantie dafür, dass diese Funktion reell-analytisch ist (also die Funktionswerte in einer
Umgebung eines Punktes x0 auch tatsächlich dem Grenzwert der Taylorreihe in diesem Punkt entsprechen).
Während wir also reell-analytische Funktionen mit ihren Taylorreihen identifizieren dürfen, ist dies für glatte
Funktionen im Allgemeinen falsch:
1
Übungsaufgabe 52. Zeige, dass die Funktione ϕ(x) = e− x2 glatt auf R ist, und ϕ(j) (0) = 0 für alle j gilt.
Eine grosse Klasse von Funktionen, welche reell-analytisch sind, ist durch konvergente Potenzreihen
gegeben.
Lemma 44. Sei f (x) ∈ C{x−x0 } eine konvergente Potenzreihe. Dann ist f (x) reell-analytisch auf D(f ).
Für die Ableitungen gelten die Cauchy-Abschätzungen: für jedes S < R(f ) gibt es ein M > 0 sodass für
jedes x mit |x − x0 | < S
|f (k) (x)| ≤
M k!
(S − |x − x0 |)k+1
gilt.
41
Beweis. Wir nehmen ohne Beschränkung der Allgemeinheit an, dass f ∈ C{x}, und schreiben R =
R(f ). Für ein beliebiges x0 mit |x0 | < R versuchen wir f (x) in eine Potenzreihe um x0 zu entwickeln:
X
f (x) =
fj xj
j
=
X
=
X
fj (x − x0 + x0 )j
j
fj
j
=
k
k=0
X
k
=
j X
j
!
x0j−k (x
k
− x0 )


∞
k
X
j

 (x − x0 )
k!
fj xj−k
0
k
k!
j=k
X
f (k) (x0 )
k
(x − x0 )k
.
k!
Nun müssen wir offensichtlich in irgend einer Form die Vertauschung der Summation rechtfertigen, was dann
auch zeigt, dass die Potenzreihe um x0 am Ende der Rechnung wiederum konvergiert.
Dazu beachten wir, dass nach Lemma 38 für ein beliebiges S < R die Folge |fj |S j beschränkt ist, sagen
wir durch M . Damit ist mit |x0 | = qS
X j
|f (k) (x0 )| = k!
fj x0j−k k
j
X
j
≤
k!
|fj |(qS)j−k
k
j
M X
(j(j − 1) . . . (j − k + 1))q j−k
Sk j
≤
M k!
S k (1 − q)k+1
M Sk!
.
=
(S − |x0 |)k+1
=
Die obige Doppelsumme
X
k


∞
X
(x − x0 )k
j
j−k

k!
fj x0 
k
k!
j=k
erweist sich mit Hilfe der Abschätzung ab der zweiten Zeile dieser Ungleichung als absolut konvergent; man
kann nämlich die Summation von beliebig vielen Absolutbeträgen ihrer Glieder für |x − x0 | < S − |x0 | durch
X
X M S|x − x0 |k
C
≤
|f (k) (x0 )||x − x0 |k ≤
x−x0 (S − |x0 |)k+1
1−
k
k
S−x0
mit einer von x unabhängigen Konstanten C abschätzen. Der Rest der Abschätzung liefert die behauptete
Cauchy-Ungleichung.
Übungsaufgabe 53. Gib ein Beispiel einer reell-analytischen Funktion auf R, welche nicht durch eine
Potenzreihe mit Konvergenzradius R = ∞ gegeben ist (hier ist es gut, sich Gedanken darüber zu machen,
welche reell-analytischen Funktionen Einheiten sind)!
Satz 15. Eine Funktion f ∈ C ∞ (U ) ist reell-analytisch auf U genau dann, wenn es für jede kompakte
Teilmenge K ⊂ U Konstanten C, r > 0 gibt, für die
sup |f (k) (x)| ≤ k!Crk ,
x∈K
42
k∈N
gilt.
Beweis. Um zu sehen, dass die Bedingung hinreichend ist, zeigen wir, dass jede glatte Funktion auf U
welche sie erfüllt in einer Umgebung jedes Punktes x0 ∈ U Grenzwert ihrer Taylorreihe ist. Nach Theorem 7
können wir mit
k
X
f (j) (x0 )
(x − x0 )j
Txk0 f (x) =
j!
j=1
die Abweichung von f von seiner Taylorreihe als
f (x) − Txk0 f (x) =
f (k+1) (ξ)
(x − x0 )(k+1)
(k + 1)!
mit einem ξ mit |ξ − x0 | < |x − x0 | schreiben. Wir wählen ein c > 0 mit [x0 − c, x0 + c] ⊂ U und erhalten
C, r > 0, für die dann
(k+1)
(ξ)|
f (x) − Txk f (x) = |f
|x − x0 |k+1 ≤ Crk+1 |x − x0 |k+1 → 0
0
(k + 1)!
für k → ∞ ist, solange |x − x0 | ≤ min{c, 1/2r}.
Die Notwendigkeit folgt aus einem Kompaktheitsargument und der Abschätzung aus Lemma 44.
Gleichungen zwischen reell-analytischen Funktionen auf offenen Intervallen kann man überprüfen, indem
man die entsprechenden Gleichungen für die Potenzreihendarstellungen an einem beliebigen Punkt überprüft.
Lemma 45. Wenn f, g ∈ C ω ((a, b)) die Eigenschaft haben, dass f (x) = g(x) auf einer nichtleeren offenen
Teilmenge U ⊂ (a, b) ist, dann ist f (x) = g(x) für alle x ∈ (a, b). Äquivalent dazu ist, dass für ein x0 ∈ (a, b)
die Ableitungen von f und g an der Stelle x0 übereinstimmen, also
f (k) (x0 ) = g (k) (x0 ),
k∈N
gilt.
Beweis. Wir wählen ein beliebiges x0 ∈ U ; für dieses gilt, nachdem wir beide Funktionen in ihre
Taylorreihe entwickeln können und diese gegen die jeweilige Funktion konvergieren, dass die Gleichheit
f (x) = g(x) in einer Umgebung von x0 genau dann gilt, wenn f (k) (x0 ) = g (k) (x0 ) ist. Wir betrachten nun
c = inf{y ∈ (a, b) : f (x) = g(x) für alle x ∈ [y, x0 ]}
und müssen zeigen, dass c = a ist. Dazu zeigen wir, dass für jedes y0 mit x0 > y0 > a und f (x) = g(x) für
x ∈ [y0 , x] ein ε > 0 existiert, sodass f (x) = g(x) auch für x ∈ (y0 − ε, y0 ] gilt. Daraus folgt c = a.
An der Stelle y0 können wir f und g in ihre Taylorreihen entwickeln. Nachdem f und g rechts von
y0 übereinstimmen, ist f (k) (y0 ) = g (k) (y0 ) für alle k ∈ N. Damit stimmen die durch ihre Taylorreihen
dargestellten Funktion f und g auf einer ε-Umgebung von y0 überein.
Dasselbe Argument zeigt, dass
d = sup{y ∈ (a, b) : f (x) = g(x) für alle x ∈ [x0 , y]}
notwendigerweise d = b erfüllt, und damit ist f (x) = g(x) für alle x ∈ (a, b).
Reell-analytische Funktionen sind unter der Bildung von inversen Funktionen abgeschlossen:
Satz 16. Sei f ∈ C ω (a, b), f : (a, b) → (c, d), mit f 0 (x) 6= 0 für x ∈ (a, b). Dann gibt es eine reellanalytische Funktion g : (c, d) → (a, b) mit f (g(x)) = x für x ∈ (c, d) und g(f (x)) = x für x ∈ (a, b).
Beweis. Da f 0 (x) auf (a, b) nicht verschwindet, ist f strikt monoton steigend oder fallend; wir können
ohne Beschränkung der Allgemeinheit das erstere annehmen. Damit gibt es eine (stetig differenzierbare)
inverse Funktion g(x) auf (c, d), welche sich aber nach Theorem 14 in jedem Punkt x0 ∈ (c, d) in eine
konvergente Potenzreihe entwickeln lässt, also reell-analytisch ist.
43
Beispiel 6. Die Exponentialfunktion exp : R → R+ ist die Lösung der Differentialgleichung y 0 = y, y(0) = 1,
und wir haben gesehen, dass sie durch die auf ganz R konvergente Potenzreihe ex gegeben ist; sie ist also nach
Lemma 44 eine reell-analytische Funktion auf R, welche darüberhinaus die Funktionalgleichung ea+b = ea eb
erfüllt. Ihre inverse Funktion wird als der Logarithmus ln x bezeichnet, und ist eine reell-analytische Funktion
auf R+ .
Um ln x in eine Potenzreihe zu entwickeln, ist es allerdings einfacher, die Ableitung von ln x implizit zu
berechnen, also die Gleichung
eln x = x
d
ln x = 1, also
zu differenzieren. Dies liefert eln x dx
1
d
ln x = .
dx
x
Die rechte Seite dieser Gleichung lässt sich mit Hilfe der geometrischen Reihe sehr leicht in eine Potenzreihe
entwickeln, und Integration liefert dann die gewünschte Reihe für ln x.
Die Funktionalgleichung des Logarithmus, ln ab = ln a + ln b, folgt aus der Funktionalgleichung der
Exponentialfunktion wegen ab = eln a eln b = eln a+ln b .
Beispiel 7. Nachdem wir nun die Logarithmusfunktion eingeführt haben, definieren wir für α ∈ R die
Potenzfunktionen
xα : R+ → R+ , : xα := eα ln x .
Die Funktionalgleichung der Exponentialfunktion zieht die wichtige Gleichung
xα+β = xα xβ ,
x ∈ R+ ,
α, β ∈ R
nach sich.
Übungsaufgabe 54. Berechne die Ableitung(en) der Potenzfunktion xα , und zeige (Entwicklung um den
Punkt 1), dass
∞ X
α j
x ,
(1 + x)α =
j
j=0
wobei
α
α(α − 1) . . . (α − j + 1)
=
j!
j
die verallgemeinerten Binomialkoeffizienten sind.
4. Trigonometrische Funktionen
Wir haben bereits die Reihen cos(x) und sin(x) eingeführt,
X (−1)k
X (−1)k
cos(x) =
x2k , sin(x) =
x2k+1 .
(2k)!
(2k + 1)!
k
k
Diese Potenzreihen haben unendlichen Konvergenzradius, stellen also reell-analytische Funktionen auf R dar.
Weiters gilt
cos2 (x) + sin2 (x) = (cos(x) + i sin(x))(cos(x) − i sin(x)) = eix e−ix = e0 = 1,
und wir wissen damit dass cos, sin : R → [−1, 1], weiters ist cos(0) = 1, sin(0) = 0. Es ist auch einfach
zu sehen, dass sin0 (x) = cos(x) und cos0 (x) = − sin(x) gilt. Wir bemerken auch, dass cos gerade ist (d.h.
cos(−x) = cos(x)) und sin ungerade (d.h. sin(−x) = − sin(x).
Lemma 46. Es gibt eine kleinste reelle positive Nullstelle ξ von cos; wir definieren π = 2ξ.
Beweis. Angenommen, cos(x) > 0 für alle positiven x; dann ist wegen cos00 (x) = − cos(x) die Funktion
cos strikt konkav auf R+ . Das ist ein Widerspruch zur Beschränktheit von cos(x).
Um die weiteren Nullstellen der trigonometrischen Funktionen zu finden, benötigen wir die Additionstheoreme.
44
Lemma 47. Für x, y ∈ R gilt
cos(x + y) = cos(x) cos(y) − sin(x) sin(y),
sin(x + y) = sin(x) cos(y) + cos(x) sin(y);
insbesondere gelten die Halbwinkelformeln
1 + cos(2x)
cos(x)2 =
,
2
Beweis. Es ist
cos(x + y) + i sin(x + y) = ei (x + y)
1 − cos(2x)
.
2
sin(x)2 =
= eix eiy
= (cos(x) + i sin(x))(cos(y) + i sin(y))
= cos(x) cos(y) − sin(x) sin(y) + i(sin(x) cos(y) + cos(x) sin(y));
die Formel folgt also aus Vergleich von Real- und Imaginärteilen.
Damit ist sin π = sin(π/2 + π/2) = 2 cos(π/2) sin(π/2) = 0 und auch sin(2π) = 0; an diesen Stellen ist
notwendigerweise cos(π) = −1 und cos(2π) = 1 (wir verwenden hier, dass sin2 (x) + cos2 (x) = 1 und die
Monotonieeigenschaften, die wegen cos0 (x) = − sin(x) gelten). Wir können nun auch die Periodizität der
trigonometrischen Funktionen nachweisen:
cos(x + 2π) = cos(x) cos(2π) + sin(x) sin(2π) = cos(x),
sin(x + 2π) = sin(x) cos(2π) + cos(x) sin(2π) = sin(x),
sin(x + π/2) = sin(x) cos(π/2) + cos(x) sin(π/2) = cos(x),
cos(x + π/2) = cos(x) cos(π/2) − sin(x) sin(π/2) = − sin(x).
Insgesamt ergibt sich damit folgendes Bild für die Nullstellen:
Lemma 48. Die Nullstellen von cos(x) sind durch
π
x = + nπ, n ∈ Z
2
gegeben, und jene von sin(x) durch
x = nπ, n ∈ Z.
An diesen Punkten gilt
π
cos (nπ) = (−1)n , sin
+ nπ = (−1)n .
2
Übungsaufgabe 55. Zeige, dass die in Lemma 48 angegebenen Nullstellen tatsächlich alle sind.
Der Tangens und der Cotangens,
tan(x) =
sin(x)
,
cos(x)
cot(x) =
cos(x)
,
sin(x)
sind dementsprechend reell-analytische Funktionen auf R \ {π/2 + nπ : n ∈ Z} beziehungsweise R \ {nπ : n ∈
Z}.
Die inversen Funktionen von sin und cos können jeweils für die Einschränkung auf Intervalle zwischen
zwei Nullstellen dieser Funktionen definiert werden; dies gibt die verschiedenen “Zweige” dieser Funktionen.
Standardmässig setzt man
arcsin : [−1, 1] → [−π/2, π/2],
arccos : [−1, 1] → [0, π],
welche nach Theorem 16 reell-analytisch auf (−1, 1) sind. Andere Wahlen des arcsin bzw. des arccos unterscheiden sich von den Hauptzweigen um ein Vielfaches von 2π.
Ähnlich verfährt man mit der Umkehrfunktion des Tangens; wegen limx→−π/2 tan(x) = −∞, limx→π/2 tan(x) =
+∞ ist tan : (−π/2, π/2) → R, weiters ist tan0 (x) = (cos(x))−2 6= 0 für x; nach Theorem 16 gibt es also die
Umkehrfunktion
arctan : R → (−π/2, π/2),
welche reell-analytisch auf R ist.
45
Die Ableitungen der Umkehrfunktionen berechnet man mit Hilfe von impliziter Differentiation und unter
Verwendung der trigonometrischen Formeln. So ist
sin(arcsin(x)) = x,
also nach Ableitung
cos(arcsin(x)) arcsin0 (x) = 1.
Nun ist aber cos2 (arcsin(x)) + x2 = 1, und damit (da cos auf (−π/2, π/2) positiv ist) cos(arcsin(x)) =
√
1 − x2 , also
1
.
arcsin0 (x) = √
1 − x2
−1
Übungsaufgabe 56. Zeige, dass arccos0 (x) = √1−x
.
2
Die Reihenentwicklung von arcsin erhält man nun aus der Entwicklung von
∞ X
1
−1/2
(1 − x2 )− 2 =
(−1)j x2j
j
j=0
durch Integration.
Eine ähnliche Strategie kann man für die Reihe des Arcustangens verwenden: Aus tan(arctan(x)) = x
folgt arctan0 (x) = cos2 (arctan(x)), also arctan0 (x) = (1 + x2 )−1 . Die Reihenentwicklung ergibt sich damit als
X (−1)j
x2j+1 .
arctan(x) =
2j + 1
j≥0
Wenn wir nun in diese Entwicklung x = 1 einsetzen, erhalten wir
π
1 1
= 1 − + − ....
4
3 5
Natürlich dürfen wir in die rechte Seite der Gleichung nicht einfach x = 1 einsetzen, da wir uns an keinem
inneren Punkt des Konvergenzintervalls der Reihe befinden. Wir können aber wie folgt argumentieren, um
zu sehen dass
X (−1)j
X (−1)j
lim
x2j+1 =
:
x→1+
2j + 1
2j + 1
j≥0
j≥0
Sei ε > 0, dann existiert ein gerades N mit
X
j
(−1)
1
2j+1 x
≤
<ε
2j + 1
4N + 1
j≥N
für alle x ∈ [1/2, 1]. Damit ergibt sich
X
j
X (−1)j X (−1)j 2j+1 X (−1)j (−1)
2j+1
x
−
x
−
≤ 2ε + 2j
+
1
2j
+
1
2j
+
1
j 2j + 1
j
j≤N
j≤N
Der letzte Summand kann nun für x ∈ [r0 , 1] auch kleiner als ε gemacht werden, und wir erhalten die
behauptete Aussage.
Um die trigonometrischen Funktionen ihrer üblichen geometrischen Interpretation zuzuführen, ist es von
Vorteil, das Konzept eines Wegs einzuführen. Ein Weg in R2 = C ist eine stetige Abbildung γ : [a, b] → R2 ,
wobei wir sagen, dass γ(t) = (x(t), y(t)) differenzierbar ist, wenn x und y differenzierbar sind, und wir
schreiben γ 0 (t) = (x0 (t), y 0 (t)). Wir nennen γ 0 (t) den Tangentialvektor an die Kurve γ im Punkt γ(t) und
sagen, dass γ regulär ist, wenn γ 0 (t) 6= 0 für alle t ∈ [a, b] gilt.
Die Funktion γ(t) = eit ist ein Weg in R, wobei wir t zunächst auf ein Intervall der Länge 2π einschränken
wollen. Wegen γ 0 (t) = ieit ist |γ(t)| = |γ 0 (t)| = 1; mit anderen Worten, γ(t) durchläuft den Einheitskreis mit
gleichförmiger Geschwindigkeit 1. Der Punkt γ(t) = (cos(t), sin(t)) ist damit der Punkt auf dem Einheitskreis,
der Bogenlänge t von (1, 0) auf der Kreislinie entfernt liegt.
Damit erkennt man cos(t) als die Länge der Ankathete und sin(t) als die Länge der Gegenkathete eines
Winkels t in einem rechtwinkligen Dreieck, dessen Hypothenuse Länge 1 besitzt. Der tan(t) wird erhalten,
46
indem man das Dreieck so streckt, dass die Länge der Ankathete 1 wird, und bezeichnet dann die Länge
der Gegenkathete. Die Länge der Hypothenuse im so enststandenen Dreieck ist der Sekans von t, sec(t) =
cos(t)−1 . Eine andere Interpretation ist, dass tan(t) die Länge der Strecke von (1, 0) zum Schnittpunkt
der Geraden, welche mit der x-Achse den Winkel t einschliesst, mit der Geraden x = 1 darstellt (für t ∈
(−π/2, π/2)).
Ähnliche Interpretationen besitzen der Cotangens
cos(t)
,
cot(t) =
sin(t)
wobei hier die Gegenkathete auf Länge 1 gebracht wird; der Cosecans csc(t) = sin(t)−1 entspricht nun der
Geraden y = 1.
Der Tangens und der Cotangens können mit Hilfe der Exponentialfunktion in folgender Form geschrieben
werden:
1 e2it − 1
e2it + 1
eit + e−it
1 eit − e−it
=
=
i
,
cot(t)
=
i
.
tan(t) =
i eit + e−it
i e2it + 1
eit − e−it
e2it − 1
Auch Tangens und Cotangens erfüllen Additionstheoreme. Diese kann man aus der elementaren Identität
a−1
+ b−1
(a − 1)(b + 1) + (b − 1)(a + 1)
ab − 1
=
= a+1a−1b+1
ab + 1
(a + 1)(b + 1) + (a − 1)(b − 1)
1 + a+1 b−1
b+1
ableiten, indem man a = e2it und b = e2is setzt, und so
tan(s) + tan(t)
tan(s + t) =
1 − tan(s) tan(t)
erhält.
√
Beispiel 8. Wir berechnen eine Stammfunktion von 1 − x2 auf dem Intervall (−1, 1). Mit Hilfe der Substitution x = sin(t) sehen wir, dass
Z p
Z
1 − x2 dx = cos(t)2 dt
Z
1 + cos(2t)
dt
=
2
.
t
sin(2t)
= +
2
4
p
1
=
arcsin(x) + x 1 − x2
2
Die Wahl eines Zweiges des arcsin (also die Addition einer Vielfachen von π) ändert nur den Wert der
Stammfunktion an einer Stelle; wir haben hier die Stammfunktion, welche an der Stelle 0 verschwindet,
angegeben.
47
KAPITEL 5
Elementare Fourierreihen
1. Definition, Motivation und Beispiele
Wir haben schon eine Methode kennengelernt, eine Funktion durch “elementare” Funktionen zu approximieren. Dabei haben wir, um eine Funktion ϕ durch Polynome zu approximieren, ein formales Objekt,
die Taylorreihe von ϕ betrachtet. Für reell-analytische Funktionen ist die Übereinstimmung von dieser Potenzreihe und der durch sie dargestellten Funktion gegeben, und wir können uns in Rechnungen auf die
Manipulation eines algebraischen Objekts beschränken.
Leider sind Ableitungen einerseits schwer zu berechnen, und andererseits ist es notwendig, dass Funktionen glatt sind um ihre Taylorreihe zu berechnen; damit die Taylorreihe dann auch tatsächlich die Funktion
darstellt, ist auch noch ein kontrolliertes Wachstum der Ableitungen dieser Funktion notwendig. Dies macht
es oft erstrebenswert, Funktionen auch auf andere Weise darzustellen.
Eine formale Fourierreihe ist ein Ausdruck der Form
∞
∞
X
a0 X
bj cos(jx),
aj cos(jx) +
+
2
j=1
j=1
wo aj , bj ∈ C. Eine Fourierreihen stellt, so sie konvergiert, eine Funktion dar, welche ϕ(x + 2π) = ϕ(x)
erfüllt–wir sagen, ϕ ist periodisch mit Periode 2π oder einfach, ϕ ist 2π-periodisch.
Für eine 2π-periodische Funktion genügt es, die Werte f (x) für a ≤ x < a + 2π zu kennen; genauer
gesagt, kommt f von einer Funktion auf dem Quotientenraum R/ ∼, wo x ∼ y durch y − x ∈ 2πZ definiert
wird. Dieser Raum ist der eindimensionale Torus–im folgenden wollen wir uns einfach auf Funktionen f
beschränken, die auf [−π, π] definiert sind, und Werte f (x) für x ∈
/ [−π, π] dadurch definiert werden, dass
f (x) = f (x + 2kπ) wo x + 2kπ ∈ [−π, π].
Oft ist es vorteilhaft, unter Verwendung von eix = cos(x) + i sin(x) die komplexe Darstellung der Fourierreihe
X
cj eijx
j∈Z
zu verwenden. Dabei ist 2c0 = a0 , und
cj =
1
(aj − ibj ),
2
j > 0,
cj =
1
(a−j + ib−j ),
2
j < 0.
Eine formale Fourierreihe ist reell, wenn aj , bj ∈ R oder äquivalent cj = c−j .
Wir erinnern an einen Satz über die Konvergenz von Funktionenreihen, den wir schon oft verwendet
haben, und nun auch allgemein formulieren wollen:
Satz 17. Sei X ein topologischer Raum, und fj stetige Funktionen auf X, welche
kfj k∞ = sup |fj (x)| ≤ εj
x∈X
erfüllen. Wenn
P
j
εj < ∞, dann ist
f (x) =
X
j
eine stetige Funktion auf X.
49
fj (x)
Beweis. Da die Folge der Partialsummen
gn (x) =
n
X
fj (x)
j=1
für fixes x ∈ X eine Cauchyfolge ist, gibt es die Grenzfunktion f (x) = limn→∞ gn (x)–mehr noch: für
jedes fixe ε > 0 können wir ein N wählen, sodass für n ≥ N sogar für jedes x ∈ X die Ungleichung
|f (x) − gn (x)| ≤ kf − gn k∞ < ε erfüllt ist.
Sei nun x0 ∈ X und ε > 0 beliebig. Wir müssen zeigen, dass es eine Umgebung U von X gibt, sodass
|f (y) − f (x0 )| < ε für alle y ∈ U gilt. Sei N so gewählt, dass kf − gN k < ε/3 ist. Da gN stetig ist (als Summe
endlich vieler stetiger Funktionen), gibt es eine Umgebung U von x0 mit |gN (y) − gN (x0 )| < ε/3. Insgesamt
können wir also
|f (y) − f (x0 )| ≤ |f (y) − gN (y)| + |gN (y) − gN (x0 )| + |gN (x0 ) − f (x0 )|
≤ kf − gN k∞ + ε/3 + kf − gN k∞
< ε/3 + ε/3 + ε/3 = ε
gilt.
Wir erinnern auch an die entsprechende Aussage für differenzierbare Funktionen, welche aus Lemma 17
folgt:
Satz 18. Seien fj ∈ C k ([a, b]) gegeben, und sei
(`) (`)
fj = max |fj (x)| ≤ εj ,
∞
Wenn
P
j
εj konvergiert, so ist
P
j
` ≤ k.
x∈[a,b]
fj ∈ C k ([a, b]).
Wir können nun ein Kriterium angeben, um die gleichmässige Konvergenz von einer formalen Fourierreihe
gegen eine stetige Grenzfunktion zu garantieren.
P
Satz 19. Sei j εj konvergent. Wenn die Koeffizienten der Fourierreihe
X
a0 X
+
aj cos(jx) +
bj sin(jx)
2
j
j
die Ungleichungen
|aj | ≤ εj ,
|bj | ≤ εj
erfüllt, so konvergieren die Partialsummen der Fourierreihe
X
X
SN (x) = a0 +
aj cos(jx) +
bj sin(jx)
j≤N
j≤N
gleichmässig gegen eine 2π-periodische
stetige Funktion f (x).
P
Allgemeiner ist, falls sogar j j k εj konvergiert, f ∈ C k (R).
Der Beweis erfolgt durch Überprüfen der Vorraussetzungen von Theorem 18 unter Beachtung der Tatsache, dass man sich auf das kompakte Intervall [−π, π] einschränken kann.
Bemerkung 9. Äquivalent zur Vorraussetzung in Theorem 19 ist, dass die Koeffizienten der komplexen
Darstellung der Fourierreihe die Abschätzung |cj | ≤ εj erfüllen. Die Partialsummen sind in dieser Form
durch
N
X
SN (x) =
cj eijx
j=−N
gegeben.
Wir fragen uns nun, wie man die Koeffizienten der stetigen Grenzfunktion einer (gleichmässig) konvergenten Fourierreihe aus der Grenzfunktion berechnen kann. Der Schlüssel dazu liegt in den folgenden
Identitäten:
50
Lemma 49. Es gelten die Orthogonalitätsrelationen
(
Z π
0
eimx e−inx dx =
2π
−π
m 6= n
,
m = n.
beziehungsweise
(
0
cos(mx) cos(nx) dx =
sin(mx) sin(nx) dx =
π
−π
−π
Z
π
Z
und
Z
π
m 6= n
m = n 6= 0,
π
cos(mx) sin(nx) dx = 0.
−π
Beweis. Wir beginnen mit der Aussage für die komplexe Exponentialfunktion. Es ist eimx e−inx = eijx ,
ijx
wo j = m − n ist. Falls j 6= 0, besitzt diese Funktion die Stammfunktion e j , und wir erhalten
π
Z π
1
1 ijπ
eijx imx −inx
e e
dx =
=
e − e−ijπ =
(−1)j − (−1)j = 0.
j −π
j
j
−π
Wir verwenden nun diese Aussage, um die reellen Orthogonalitätsrelationen herzuleiten. Wir haben
Z
Z π
1 π imx
(e
+ e−imx )(einx + e−inx ) dx
cos(mx) cos(nx) dx =
4 −π
−π
Z
1 π imx
(e
+ e−imx )(einx + e−inx ) dx
=
4 −π
Z
1 π i(m+n)x
=
(e
+ ei(n−m)x + ei(m−n)x + e−i(m+n)x ) dx
4 −π


m 6= n,
0
= π
m = n 6= 0,


2π m = n = 0.
Für die Aussage für die Sinusfunktion rechnet man ganz analog, unter Verwendung von 2i sin(x) = eix −
e−ix .
Wir können nun für eine gleichmässig konvergente Fourierreihe
X
cj eijx = f (x)
j
wie folgt rechnen:
Z
π
f (x)e−inx dx =
−π
Z
π
−π
XZ
j


X

cj eijx  e−inx dx
j
π
cj eijx e−inx dx
−π
= cj 2π.
Ähnlich sehen wir, dass wir aj und bj wie folgt berechnen können:
Z
Z
1 π
1 π
aj =
f (x) cos(jx) dx, bj =
f (x) cos(jx) dx.
π −π
π −π
Definition 24. Sei f ∈ R([−π, π]), dann definieren wir die Fourierkoeffizienten
Z π
1
cn (f ) =
f (x)e−inx dx,
2π −π
51
beziehungsweise
Z
Z
1 π
1 π
f (x) cos(nx) dx, bn (f ) =
f (x) sin(nx) dx.
π −π
π −π
Bevor wir einige Beispiele berechnen, bemerken wir folgende Vereinfachung:
an (f ) =
Lemma 50. Wenn f ∈ R([−π, π]) gerade ist (d.h. f (x) = f (−x)), so ist bj (f ) = 0 und
Z
2 π
aj (f ) =
f (x) cos(nx) dx
π 0
für alle j; wenn f ungerade ist (d.h. f (−x) = −f (x)), so ist aj (f ) = 0 für alle j und
Z
2 π
bj (f ) =
f (x) sin(nx) dx.
π 0
Beispiel 9. Wir berechnen die Fourierreihe der Dreiecksfunktion |x|. Da x 7→ |x| gerade ist, müssen wir nur
an berechnen; a0 = π folgt einfach, und für j > 0 haben wir
Z π
πaj (|x|) =
|x| cos(nx) dx
−π
Z π
x cos(nx) dx
2
0
Z π
x sin(nx)
sin(nx)
−
=2
n
n
0
cos(nπ)
1
=2
+ 2
n2
n
(−1)n + 1
.
=2
n2
Also ergibt sich die Fourierreihe als
π
4
cos(3x) cos(5x)
−
+
+ ... ,
cos(x) +
2
π
9
25
und diese konvergiert gleichmässig gegen |x| auf [−π, π]. Eine Auswertung für x = 0 liefert
X
1
π2
=
.
(2j + 1)2
8
j
Beispiel 10. Nun wollen wir die Fourierreihe der Rechteckfunktion sgn x berechnen. Diese ist ungerade, und
wir erhalten
Z
2
cos(nπ)
1
2(1 + (−1)n+1 )
2 π
bj (sgn x) =
sin(nx) dx =
−
+
=
.
π 0
π
n
n
πn
Die Fourierreihe ist damit
4
sin(3x) sin(5x)
sin(x) +
+
+ ...
π
3
5
Hier können wir die Konvergenz noch nicht garantieren. Falls die Summe konvergiert, so erhalten wir für
x = π/2
1 1
π
1 − + − ··· = .
3 5
4
Beispiel 11. Für die Sägezahnfunktion x (welche ungerade ist) erhalten wir
Z
2 π
bj (x) =
x sin(nx) dx
π 0
π Z π
2
x cos(nx) cos(nx)
=
−
+
dx
π
n
n
0
0
=
2(−1)n+1
.
n
52
Damit ergibt sich die Fourierreihe als
sin(2x) sin(3x)
2 sin(x) −
+
− ... .
2
3
2. Das Riemann-Lebesgue Lemma
Das nächste Lemma, das sogenannte Riemann-Lebesgue Lemma, zeigt uns, dass die Fourierkoeffizienten
einer integrierbaren Funktion eine Nullfolge bilden.
Lemma 51. Sei f ∈ R([−π, π]). Dann gilt
lim an (f ) = lim bn = 0.
n→∞
n→∞
Beweis. Wir zeigen die Behauptung für an . Zunächst zeigen wir, dass die Behauptung für beliebige Treppenfunktionen t(x) gilt; dazu genügt es zu zeigen, dass die Behauptung für eine charakteristische
Funktion eines Intervalls [a, b] ⊂ [−π, π] gilt:
Z
sin(nb) sin(na) b
≤ 2,
cos(nx) dx = −
π an χ[a,b] = a
n
n n
also ist an eine Nullfolge.
Sei nun ε > 0 beliebig. Dann gibt es eine Treppenfunktion t mit
Z
1 π
|t(x) − f (x)| dx ≤ ε,
π −π
und wir können wie folgt abschätzen:
Z π
1
|an (f )| = f (x) cos(nx) dx
π −π
Z π
1
≤
|f (x) − t(x)|| cos(nx)| dx + |an (t)|
π
−π
≤ ε + |an (t)|.
Da an (t) → 0 für n → ∞, gibt es ein N ∈ N sodass |an (t)| < ε für n ≥ N . Für diese n ist also |an (f )| < 2ε;
und damit ist an (f ) eine Nullfolge.
Für stetige Funktionen wollen wir einen etwas anderen Beweis geben, der eine Abschätzung liefert,
wie schnell die Fourierkoeffizienten gegen 0 gehen. Wenn f stetig auf [−π, π] ist, so ist mit Hilfe einer
Koordinatenwechsels
Z
π
f (x)e−inx dx
2πcn (f ) =
−π
Z π(1+1/n)
=
f (x − π/n)e−in(x−π/n) dx
−π(1+1/n)
Z π
f (x − π/n)e−inx dx,
=−
−π
wobei wir unsere Verabredung über die Periodizität verwendet haben, sowie die Formel eiπ = −1. Damit
ergibt sich
Z π
Z π
1
f (x)e−inx dx −
f (x − π/n)e−inx dx |cn (f )| = 4π
−π
−π
1
≤
sup |f (x) − f (x − π/n)| .
2 x∈[−π,π]
Der letzte Ausdruck geht für n → ∞ gegen 0, da f stetig auf dem kompakten Intervall [−π, π], also
gleichmässig stetig ist.
53
Der letzte Ausdruck in der Ungleichungskette gibt uns auch einen Anhaltspunkt, um das RiemannLebesgue Lemma zu quantifizieren, also die Geschwindigkeit der Konvergenz der Koeffizienten zu bestimmen.
Dazu definieren wir, dass eine stetige 2π-periodische Funktion f Hölder-stetig von der Ordnung α ist, wenn
|f (x) − f (y)| ≤ C|x − y|α
für alle x, y ∈ [−π, π] ist. Die Menge der Hölder-stetigen Funktionen wird mit C α ([−π, π]) bezeichnet; sie
wird mit der Festsetzung
|f (x) − f (y)|
kf kα = kf k∞ + sup
|x − y|α
x6=y
zu einem normierten Vektorraum (welcher sogar ein Banachraum ist). Allgemeiner definieren wir den Raum
C k,α ([−π, π]) als den Raum der Funktionen f ∈ C k ([−π, π]) mit f (k) ∈ C α ([−π, π]), und wird mit
kf kk,α =
k X
(`) f ∞
j=1
+ f (k) α
zu einem Banachraum.
Wir weisen die Vollständigkeit von C α ([−π, π]) nach. Sei also fn eine Cauchyfolge in C α ([−π, π]). Dann
ist fn eine Cauchyfolge in C([−π, π]), und damit gibt es eine stetige Funktion f , die der gleichmässige
Grenzwert der fn ist. Für diese erhalten wir für x 6= y
|f (x) − f (y)|
|fn (x) − fn (y)|
= lim
≤ lim sup kfn kα ,
α
n→∞
|x − y|
|x − y|α
n→∞
also f ∈ C α ([−π, π]). Nun müssen wir noch nachweisen, dass f auch der Grenzwert der fn in der C α ([−π, π])Norm ist:
|f (x) − fn (x) − f (y) + fn (y)|
|fm (x) − fn (x) − fm (y) + fn (y)|
= lim
≤ lim sup kfm − fn kα .
α
m→∞
|x − y|
|x − y|α
m→∞
Also ist kf − fn kα ≤ kf − fn k∞ + lim supm→∞ kfm − fn kα , und der letzte Ausdruck geht gegen 0 für n
gegen ∞, was zeigt, dass limn→∞ fn = f in C α ([−π, π]).
Dieselbe Rechnung wie oben zeigt für f ∈ C α ([−π, π]), dass
Z π
Z π
1
−inx
−inx
|cn (f )| = f (x)e
dx −
f (x − π/n)e
dx 4π
−π
−π
1
sup |f (x) − f (x − π/n)|
≤
2 x∈[−π,π]
≤ C|n|−α .
Die Konstante C hängt hier nur von kf kα ab. Eine Ungleichung für die an (f ) bzw. bn (f ) folgt nun, da
2cn = an + ibn , 2c−n = an − ibn , also
|an (f )| ≤ 2(|cn (f )| + |c−n (f )|) ≤ 2c|n|−α .
Im Falle einer Funktion f ∈ C k,α können wir zunächst k-mal partiell integrieren und erhalten
cn (f ) =
cn (f (k) )
;
nk
insgesamt haben wir damit folgendes gezeigt:
Lemma 52. Es gibt Konstanten C, K > 0, sodass für f ∈ C k,α ([−π, π]) die Ungleichungen
|cn (f )| ≤
|an (f )| ≤
C
|n|k+α ,
kf kk,α
K
nk+α ,
kf kk,α
|bn (f )| ≤
erfüllt sind.
54
n ∈ Z,
K
nk+α ,
kf kk,α
n ∈ N,
3. Die Bessel-Ungleichung
Eine andere Methode, das Grössenwachstum von Fourierkoeffizienten zu kontrollieren, ist mit Hilfe von
Integralen; der Ausgangspunkt ist die Ungleichung von Bessel. Wir erinnern an unsere Notation für die N -te
Partialsumme einer Fourierreihe:
N
X
SN f (x) =
cj (f )eijx .
j=−N
Wir berechnen
2
|f (x) − SN f (x)| = (f (x) − SN f (x)) (f (x) − SN f (x))
= |f (x)|2 − f (x)SN f (x) − f (x)SN f (x) + |SN f (x)|2 .
Wenn wir diese Gleichung integrieren, erhalten wir
1
2π
Z
N
X
π
|SN f (x)|2 dx =
−π
|cj (f )|2
j=−N
und
1
2π
Z
π
f (x)
−π
N
X
cj (f )e−ijx =
N
X
|cj (f )|2 .
j=−N
j=−N
Zusammengenommen erhalten wir
1
0≤
2π
Z
π
π
Z
1
|f (x) − SN f (x)| dx =
2π
−π
2
|f (x)|2 dx −
−π
N
X
|cj (f )|2
j=−N
Auch daraus folgt die Konvergenz der cj gegen 0!
Wir fassen die Bessel-Ungleichung zusammen:
Satz 20. Sei f ∈ R([a, b]). Dann gilt die folgende Gleichung:
1
2π
Z
π
1
|f (x) − SN f (x)| dx =
2π
−π
2
π
Z
|f (x)|2 dx −
−π
N
X
|cj (f )|2 ;
j=−N
insbesondere ist
∞
X
|cj (f )|2 ≤
j=−∞
π
1
2π
Z
1
2π
Z
|f (x)|2 dx.
−π
Die Gleichheit
∞
X
|cj (f )|2 ≤
j=−∞
π
|f (x)|2 dx
−π
gilt genau dann, wenn die Partialsummen SN f im quadratischen Mittel gegen f konvergieren, also
Z π
lim
|f (x) − SN f (x)|2 dx = 0
N →∞
−π
ist. Insbesondere gilt also Gleichheit, wenn f der gleichmässige Grenzwert der SN f ist, z.Bsp. wenn f selber
der gleichmässige Grenzwert einer (seiner) Fourierreihe ist, also unter den Vorraussetzungen von Theorem 19.
Noch können wir diese Konvergenz einer Fourierreihe gegen die Funktion, welche sie erzeugt, nicht beweisen–
sie gilt auch im allgemeinen nicht. Wir wollen uns nun auf einen Spezialfall konzentrieren.
55
4. Konvergenz von Fourierreihen
Wir betrachten zunächst die Partialsummen einer Fourierreihe etwas genauer. Es ist
SN f (x) =
N
X
cj (f )eijx
j=−N
=
N
X
1
2π
j=−N
1
=
2π
Z
1
=
2π
Z
1
=
2π
Z
Z
π
f (t)e−ij(t−x) dt
−π

π
−π
f (t) 
eij(x−t)  dt
j=−N

π
−π

N
X

N
X
f (x + t) 
eijt  dt
j=−N
π
f (x + t)DN (t) dt
−π
Die Funktion DN (t) heisst Dirichletkern und hat eine einfachere Darstellung wie folgt:
DN (t) =
N
X
eijt
j=−N
= e−iN t
2N
X
eijt
j=0
1 − ei(2N +1)t
1 − eit
−iN t
e
− ei(N +1)t
=
1 − eit
it
e− 2 e−iN t − ei(N +1)t
= − it
1 − eit
e 2
= e−iN t
1
=
1
e−i(N + 2 )t − ei(N + 2 )t
1
1
e−i 2 t − ei 2 t
sin(N + 21 t)
=
.
sin( 12 t)
Es gilt
Z
π
DN (t) = 2π
−π
, und damit erhalten wir folgende Darstellung der Abweichung einer Funktion von einer Partialsumme ihrer
Fourierreihe:
Z π
1
(f (x) − f (x + t))DN (t) dt.
f (x) − SN f (x) =
2π −π
Wir sehen also, dass die Konvergenz einer Fourierreihe einer Funktion gegen diese Funktion an einem gegebenen Punkt x damit in Verbindung gesetzt werden kann, wie die Funktion f (x) − f (x + t) sich am Punkt
t = 0 verhält. Genauer wollen wir das für Funktionen formulieren, welche eine Hölder-Bedingung erfüllen:
Satz 21. Sei f ∈ C α ([−π, π]). Dann konvergieren die Partialsummen der Fourierreihe von f gleichmässig
gegen f auf [−π, π].
56
KAPITEL 6
Mehrdimensionale Differentialrechnung
1. Lineare Algebra
Wir arbeiten in endlichVektorräumen über R, das heisst, in Vektorräumen welche isomorph zu
Rm = {(x1 , . . . , xm ) : xj ∈ R}
mit der üblichen komponentenweisen Addition und skalaren Multiplikation
(x1 , . . . , xm ) + (y1 , . . . ym ) = (x1 + y1 , . . . , xm + ym ),
λ(x1 , . . . , xm ) = (λx1 , . . . , λxm )
sind. Wir werden im folgenden diese Zeilenvektoren mit Spaltenvektoren nach Belieben identifizieren (eine
Begründung dafür kommt noch). Die Vektoren
ei = (0, . . . , |{z}
1 , . . . , 0),
i = 1, . . . , m,
jth spot
m
bilden eine Basis des R , die Standardbasis. Wenn wir verschiedene Vektorräume Rm und Rn betrachten,
werden wir dieselbe Notation für die Standardbasen in beiden Räumen verwenden (die Verwirrung, die
dadurch entsteht, ist der Überladung der Notation vorzuziehen).
Der Rm besitzt ein inneres Produkt, das Standardprodukt, definiert durch
X
hx, yi =
xj yj ,
j
und die damit verbundene euklidische Norm
2
kxk = hx, xi.
Eine Bemerkung ist, dass jede andere Norm mit der euklidischen Norm vergleichbar ist:
Lemma 53. Sei k·k1 eine Norm auf Rm . Dann gibt es eine Konstante C > 0 mit
1
kxk1 ≤ kxk ≤ C kxk1 .
C
Beweis. Sei kei k1 = λi > 0. Dann ist nach der Cauchy-Schwarzschen Ungleichung
m
sX sX
X
X
kxk1 = xj ej ≤
|xj |λj ≤
x2j
λ2j ≤ L kxk .
j=1
j
j
j
1
Insbesondere ist die Identität als Abbildung von Rm versehen mit der Topologie von k·k1 nach Rm versehen
mit der Topologie von k·k stetig. Damit ist die Einheitssphäre
S1 = {x : kxk1 = 1}
kompakt in Rm mit der Topologie von k·k. Damit ist
K = min kxk > 0
x∈S1
und
x
kxk
1
≥ K,
x ∈ Rm
also K kxk1 ≤ kxk. Wenn wir nun C = max L, K −1 wählen, ist die Behauptung des Lemmas erfüllt.
57
Insbesondere ist die durch eine beliebige Norm definierte Topologie auf Rm eindeutig bestimmt und
stimmt mit der Produkttopologie überein.
Eine Abbildung A : Rm → Rn heisst linear, wenn sie mit den linearen Operationen vertauscht, also
A(x + λy) = A(x) + λA(y)
für alle x, y ∈ Rm und λ ∈ R gilt. Der Raum der linearen Abbildungen von Rm nach Rn wird mit der
Festsetzung (A + λB)(x) = A(x) + λB(x) selber zu einem endlichdimensionalen R-Vektorraum L(Rm , Rn ).
Er wird mit dem Raum der n × m-Matrizen (n Zeilen, m Spalten) mit reellen Einträgen identifiziert, also
mit Rmn . Dabei entspricht die lineare Abbildung A der Matrix mit Einträgen
Ai,j = hei , Aej i,
oder in Worten: der Eintrag in der i-ten Zeile und j-ten Spalte der Matrix zu A ist die i-te Koordinate des
Bilds des j-ten Basisvektors unter A. Jede lineare Abbildung ist offensichtlich stetig.
2. Differenzierbarkeit
Sei f : Rm ⊃ Ω → Rn eine auf der offenen Menge Ω definiert. Wir sagen, f ist differenzierbar an der
Stelle x ∈ Ω, wenn es eine lineare Abbildung A ∈ L(Rm , Rn ) gibt, sodass für
R(h) = f (x + h) − f (x) − Ah
R(h)
=0
khk
gilt. Die lineare Abbildung A ist, falls sie existiert, durch diese Bedingung eindeutig bestimmt und wird die
Ableitung von f an der Stelle x genannt; wir schreiben dafür f 0 (x) ∈ L(Rm , Rn ). Wenn f an jeder Stelle
von Ω differenzierbar ist, so sagen wir, f ist auf Ω differenzierbar; die Menge der auf Ω differenzierbaren
Funktionen wird mit D (Ω) bezeichnet; es ist einfach zu sehen, dass D (Ω) ⊂ C(Ω). Die Ableitung ist dann
selber eine Funktion f 0 : Rm → L(Rm , Rn ) = Rmn ; ist sie wiederum auf Ω differenzierbar, so sagen wir,
f ist zweimal differenzierbar auf Ω, und bezeichnen die Ableitung mit f 00 ; induktiv definieren wir, dass f
k−1
k-mal differenzierbar ist, wenn f k − 1-mal differenzierbar ist und f (k−1) : Ω → Rm n wiederum auf Ω
differenzierbar ist.
Ist die k-te Ableitung von f stetig auf Ω, so sagen wir, f ist k-mal stetig differenzierbar auf Ω; die Menge
der k-mal stetig differenzierbaren Funktionen auf Ω wird mit C k (Ω) bezeichnet.
Ist K ⊂ Rm kompakt, so definieren wir C k (K) als die Menge aller Funktionen f auf K für welche es eine
offene Menge U ⊃ K und eine Funktion f˜ ∈ C k (U ) gibt, welche f˜|K = f erfüllt. Die Mengen C k (Ω) und
C k (K) sind Vektorräume; dies folgt aus folgendem Lemma, welches man wie im eindimensionalen beweist.
lim
h→0
Lemma 54. Sind f , g im Punkt x differenzierbar, und λ ∈ R so ist auch f +λg im Punkt x differenzierbar,
und d(f + λg)(x) = f 0 (x) + λg 0 (x).
Weiters haben wir die Kettenregel:
Lemma 55. Seien f : Rm ⊃ U → V ⊂ Rn , und g : V → R` . Wenn f im Punkt x ∈ U differenzierbar ist,
und g im Punt f (x), so ist g ◦ f im Punkt x differenzierbar, und (g ◦ f )0 (x) = g 0 (f (x)) ◦ f 0 (x).
Beweis. Es gilt
g(f (x + h)) − g(f (x)) = dg(f (x))(f (x + h) − f (x)) + R1 (f (x + h) − f (x))
= dg(f (x))(df (x)h) + dg(f (x))(R2 (h)) + R1 (f 0 (x)h + R2 (h))
= dg(f (x)) ◦ f 0 (x)(h) + R3 (h).
−1
Das Restglied R3 erfüllt khk
R3 (h) → 0 für h → 0.
Die Einträge der Matrix (Ai,j ), welche zu f 0 (x) gehört, können wie folgt bestimmt werden:
Ai,j = hei , Aej i = lim
h→0
fi (x + hej ) − fi (x)
∂fi
=:
(x) = fi,xj (x).
h
∂xj
58
Wenn die partiellen Ableitungen einer Funktion f : Rm ⊃ U → R auf U existieren, so stellen sie wiederum
Funktionen auf U dar, und so können iterierte partielle Ableitungen definiert werden. Diese sind, unter
sinnvollen Vorraussetzungen, von der Reihenfolge der Ableitung unabhängig.
Lemma 56. Sei U : R2 offen, und für f : U → R seien
∂2f
∂y∂x
∂2f
,
∂x∂y
definiert und stetig auf U . Dann gilt
∂2f
∂2f
(x, y) =
(x, y).
∂x∂y
∂y∂x
Beweis. Sei D(h, k) = f (x + h, y + k) − f (x, y). Dann ist
f (x + h, y + k) − f (x + h, y) − f (x, y + k) + f (x, y)
hk
fy (x + h, η) − fy (x, η)
=
k
= fx,y (ξ, η)
D(h, k) =
˜ η̃). Die Funktion
nach dem Mittelwertsatz, und mit einem symmetrischen Argument auch D(h, k) = fy,x (ξ,
D(h, k) ist damit stetig am Punkt 0, und durch Grenzübergang h, k → 0 erhalten wir die Behauptung.
Die Existenz partieller Ableitungen genügt nicht, um auf Differenzierbarkeit zu schliessen:
Beispiel 12. Die Funktion
(
f (x, y) =
xy
x2 +y 2
0
(x, y) 6= 0
(x, y) = (0, 0)
besitzt partielle Ableitungen fx (0, 0) = 0, fy (0, 0) = 0, ist aber nicht stetig im Punkt (0, 0).
Satz 22. Sei f : Rm ⊃ Ω → R so, dass die partiellen Ableitungen
fxj : Ω → R
definiert und stetig auf Ω sind. Dann ist f ∈ C 1 (Ω), und es gilt
m
X
f 0 (x)(h) =
fxk (x)hk .
k=1
Beweis. Sei x ∈ Ω beliebig. Dann ist
f (x + h) − f (x) = f (x1 + h1 , . . . , xm + hm ) − f (x1 , . . . , xm )
=
=
=
m
X
k=1
m
X
k=1
m
X
f (x1 + h1 , . . . , xk + hk , xk+1 , . . . , xm ) − f (x1 + h1 , . . . , xk−1 + hk−1 , xk , . . . xm )
fxk (x1 + h1 , . . . , ξk , xk+1 , . . . , xm )hk
fxk (ζk )hk
k=1
mit aus Theorem 5 bestimmten Zwischenpunkten ξk , welche |ξk − xk | < hk , k = 1, . . . , m erfüllen; wir
schreiben in der letzten Zeile
ζk = (x1 + h + 1, . . . , xk−1 + hk−1 , ξk , xk+1 , . . . xn ).
Damit erhalten wir
m
m
X
X
fxk (x)hk ≤
|fxk (x) − fxk (ζk )| |hk |.
f (x + h) − f (x) −
k=1
k=1
59
Nachdem die fxk stetig sind, gilt damit für das Restglied
m
|R(h)| X
|hk |
≤
|fxk (x) − fxk (ζk )|
khk
khk
k=1
≤
≤
max |fxk (x) − fxk (ζk )|
X |hk |
k=1,...,m
k
khk
max |fxk (x) − fxk (ζk )| → 0
k=1,...,m
(h → 0).
Also ist f differenzierbar an der Stelle x, die Ableitung f 0 (x) ist durch die behauptete Formel gegeben, und
damit nach Vorraussetzung stetig.
Eine Version des Mittelwertsatzes gilt auch in mehreren Dimensionen:
Satz 23. Sei f : Ω → R eine differenzierbare Funktion, x, y ∈ Ω mit der Eigenschaft, dass die Verbindungsstrecke [x, y] = {ty + (1 − t)x : t ∈ [0, 1]} noch ganz in Ω liegt. Dann gibt es ein ξ ∈ (x, y) =
{ty + (1 − t)x : t ∈ (0, 1)} mit der Eigenschaft, dass
f (y) − f (x) = f 0 (ξ)(y − x)
gilt.
Beweis. Wir wenden Theorem 5 auf die Funktion ϕ(t) = f (ty + (1 − t)x) an. Es ist
ϕ0 (t) = f 0 (ty + (1 − t)x)(y − x).
Damit gibt es ein s ∈ (0, 1) sodass ξ = sy + (1 − s)x
f (y) − f (x) = ϕ(1) − ϕ(0) = ϕ0 (s) = f 0 (ξ)(y − x)
erfüllt.
3. Taylorentwicklung
Um die Taylor’sche Formel im mehrdimensionalen anzuwenden, ist es notwendig, Multiindexnotation
einzuführen. Für α = (α1 , . . . αm ) ∈ Nm definieren wir
|α| = α1 + · · · + αm ,
α! = α1 ! . . . αm !
∂ α1
∂ αm
∂ |α| f
αm
1
=
.
.
.
f, xα = xα
1 . . . xm .
α
α
∂x
∂x1 1
∂xm αm
Das Taylorpolynom k-ter Ordnung von f an der Stelle x0 ist durch
X ∂ |α| f
(x0 )(x − x0 )α
Txk0 f (x) =
∂xα
|α|≤k
gegeben; in Bezug auf die Ableitungen von f kann man auch
Txk0 f (x) =
k
X
1 (j)
f (x0 )(h, . . . , h).
| {z }
j!
j=1
k-mal
Nachdem
(
α!
∂ |α| xβ =
∂xα x=0
0
α = β,
α 6= β,
gilt, ist für f ∈ C k (Ω) und x0 ∈ Ω die Funktion
R(x) = f (x) − Txk0 f (x)
selber wieder in C k (Ω) und erfüllt R(x0 ) = R0 (x0 ) = · · · = R(k) (x0 ) = 0.
Aus Theorem 7 folgt nun folgender Satz:
60
Satz 24. Sei f ∈ C k (Ω), sowie f ∈ D (k + 1)Ω. Wenn x, y ∈ Ω mit [x, y] ⊂ Ω gegeben sind, so gibt es
ein ξ ∈ (x, y) mit
f (k+1) (ξ)
(h, . . . , h).
f (y) − Txk f (y) =
(k + 1)! | {z }
k+1-mal
Die erste Ableitung f 0 (x) ist eine lineare Funktion, welche durch die Matrix
(fx1 (x), . . . , fxm (x)) ∈ L(Rm , R)
dargestellt wird. Schreiben wir f 0 (x)(h) = hv(x), hi, wo v(x) der entsprechende Spaltenvektor ist, so wird


fx1 (x)


v(x) =  ... 
fxm (x)
der Gradient von f an der Stelle x genannt und mit v(x) = ∇f (x) bezeichnet.
Die zweite Ableitung ist eine quadratische Form, gegeben durch
 2
 
2
∂ f
f
. . . ∂x∂1 ∂x
(x)
k1
∂x1 ∂x1 (x)
m

 . 
.
.
(2)
.
 . ;
..
..
..
f (x)(h, k) = (h1 , . . . hm ) 
.


∂2f
∂2f
k
m
∂xm ∂x1 (x) . . .
∂xm ∂xm (x)
die Matrix


Hf (x) = 

∂2f
∂x1 ∂x1 (x)
..
.
...
..
.
∂2f
∂xm ∂x1 (x)
...
∂2f
∂x1 ∂xm (x)

..
.

,

2
∂ f
(x)
∂xm ∂xm
welche nach Lemma 56 symmetrisch ist, wird als Hesse’sche Matrix (von f im Punkt x) bezeichnet. Wir
können also
m
X
∂2f
f (2) (x)(h, k) = ht Hf (x)k =
(x)hp kq
∂xp ∂xq
p,q=1
schreiben, und haben folgende kompakte Formel für die Taylorentwicklung bis zum Grad 2:
1
f (x + h) − f (x) = h∇f (x), hi + ht (Hf (x))h + R(h).
2
3
wo R die Ungleichung |R(h)| ≤ khk erfüllt (wenn f zumindest C 3 ist).
Eine m × m-Matrix A ist positiv semidefinit, wenn ht Ah ≥ 0 für alle h ∈ Rm ist, und positiv definit,
wenn ht Ah > 0 für alle h ∈ Rm ist; ähnlich definiert man negativ definit bzw. semidefinit. Wir erhalten
damit folgende hinreichende Bedingung zur Existenz eines lokalen Maximums/Minimums.
Satz 25. Sei f ∈ C 2 (Ω), und x0 ∈ Ω erfülle f 0 (x0 ) = 0. Dann besitzt f an der Stelle x0 ein lokales
Maximum, wenn Hf (x0 ) negativ semidefinit ist, und ein lokales Minimum, wenn Hf (x0 ) positiv semidefinit
ist. Das Extremum ist strikt, wenn Hf (x0 ) sogar definit ist.
Ähnlich wie im eindimensionalen muss man beachten, dass die Bedingung tatsächlich nur hinreichend
ist.
Beispiel 13. Die Funktion f (x, y, z) = x2 +y 2 +z 2 erfüllt Hf (x, y, z) = 2I für alle x, y, z. Da f 0 (x, y, z)(h1 , h2 , h3 ) =
2xh1 +2yh2 +2zh3 ist f 0 (0) = 0; f hat ein striktes lokales Minimum an der Stelle 0. Für g(x, y, z) = x2 +y 2 +z 4
ist


2 0 0
Hg(x, y, z) = 0 2 0  ,
0 0 2z
also Hg(0) nur positiv semidefinit; g besitzt aber trotzdem ein striktes Minimum an der Stelle 0.
61
Allgemeiner gilt, dass die k-te Ableitung f (k) einer k-mal stetig differenzierbaren Funktion durch eine
k-lineare symmetrische Form gegeben ist, welche mit Hilfe der partiellen Ableitungen als
X
fx`1 (x)...x`m h1`1 . . . hk`k , hj ∈ Rm , j = 1, . . . , k
f (k) (x)(h1 , . . . , hk ) =
1≤`j ≤m
1≤j≤k
gegeben ist. Damit ist
f (k) (x)(h, . . . , h) =
X k!
fxα (x)hα .
α!
|α|=k
4. Richtungsableitungen
Die Funktion f : Rm → R besitzt eine Richtungsableitung am Punkt x in Richtung v ∈ Rm , wo kvk = 1
ist, wenn die Funktion
t 7→ f (x + tv)
am Punkt 0 differenzierbar ist. Der Wert
∂f
f (x + tv) − f (x)
=
(x)
lim
t→0
t
∂v
wird die Richtungsableitung von f in Richtung v am Punkt x genannt.
Wenn f differenzierbar an der Stelle x ist, so besitzt f offensichtlich alle Richtungsableitungen, und diese
lassen sich mit Hilfe von
∂f
(x) = f 0 (x)(v) = h∇f (x), vi
∂v
berechnen.
Die Existenz von Richtungsableitungen lässt allerdings nicht auf Differenzierbarkeit schliessen; so hat
die Funktion
!
p
(x,
y)
f (x, y) = x2 + y 2 ψ p
x2 + y 2
sämtliche Richtungsableitungen am Punkt 0, da
f (tv)
= ψ(v);
lim
t→0
t
aber eine entsprechend unstetige Wahl von ψ gibt ein nicht differenzierbares f .
Die Cauchy-Schwarz Ungleichung besagt, dass
∂f
(x) ≤ k∇f (x)k kvk = k∇f (x)k .
∂v
Weiters ist
∂f
(x) < k∇f (x)k
∂v
wenn v nicht in Richtung von ∇f (x) ist. In diesem Sinn bezeichnet man den Gradienten von f als die
“Richtung des stärksten Anstiegs” von f .
5. Implizite Funktionen
p
q
Wir schreiben (x, y) ∈ R × R = R
m
für Koordinaten in Rm , i.e.
x = (x1 , . . . , xp ),
y = (y1 , . . . yq ).
Für eine Funktion f : Ω → Rq , welche f (x0 , y0 ) = 0 erfüllt, wollen wir die Gleichung f (x, y) = 0 nach y
auflösen, also eine Umgebung U von x0 bestimmen und eine Funktion y : U → Rq sodass f (x, y(x)) = 0 auf
U ist.
Die hinreichende Bedingung, welche wir angeben wollen, ist eine an die Ableitung f 0 (x0 , y0 ), welche wir
wie folgt zerlegen:
f 0 (x0 , y0 )(h, k) = fx (x0 , y0 )h + fy (x0 , y0 )k.
Wir können nun den Satz über implizite Funktionen formulieren:
62
Satz 26. Sei f ∈ C 1 (Ω), und an der Stelle (x0 , y0 ) seien die Bedingungen
det fy (x0 , y0 ) 6= 0
f (x0 , y0 ) = 0,
erfüllt. Dann gibt es eine Umgebung U von x0 und eine Funktion y ∈ C 1 (U ) mit f (x, y(x)) = 0, und es gilt
y 0 (x) = −fy (x, y)−1 fx (x, y).
Beweis. Wir zeigen zunächst die Existenz einer stetigen Lösungsfunktion. Dazu wollen wir ohne Beschränkung der Allgemeinheit annehmen, dass
x0 = y0 = 0,
fy (0, 0) = I
ist. Wir betrachten die Abbildung
A : ϕ 7→ (x 7→ ϕ(x) − f (x, ϕ(x)))
auf einem geeigneten Raum von Funktionen ϕ. Wir wählen dazu zunächst Umgebungen U von 0 in Rp und
V von 0 in Rq sodass
1
k(I − fy (x, y))kk ≤ kkk
2
für k ∈ Rq ist. Dann ist
Z
1
y − f (x, y) =
(I − fy (x, ty))ty dt
0
und nach Anwendung der Dreiecksungleichung
1
Z
ky − f (x, y)k ≤
0
1
kyk
t kyk dt =
.
2
4
Damit ist, solange U klein genug gewählt wird, und V zum Beispiel ein kleiner Ball ist, die Abbildung A auf
dem Raum stetiger Funktionen auf der kompakten Menge Ū mit Werten in V definiert, d.h. auf der Menge
Bε (0) = {ϕ ∈ C(Ū )q : kϕk∞ ≤ ε},
wobei
kϕk∞ = max kϕ(x)k ,
x∈U
da für beliebiges x ∈ U
1
1
kϕ(x)k ≤ kϕk∞
4
4
ist. Also ist die Abbildung A : Bε (0) → Bε (0) eine Kontraktion und besitzt nach Theorem 4 einen Fixpunkt
y(x) (Bε (0) ist als abgeschlossene Teilmenge eines vollständigen metrischen Raums wieder ein vollständiger
metrischer Raum). Diese Funktion y(x) erfüllt A(y)(x) = y(x) − f (x, y(x)) = y(x) für alle x ∈ Ū , also
f (x, y(x)) = 0.
Wir zeigen nun unter der Annahme, dass f ∈ C 1 (U × V ), dass y an einer beliebigen Stelle x0 differenzierbar ist. Wir können wieder annehmen, dass x0 = 0, und y(0) = 0. Dann ist für kleines h ∈ Rp die
Verbindungslinie von (0, 0) nach (h, y(h)) ganz in U × V liegt. Dann ist
kA(ϕ)(x)k = kϕ(x) − f (x, ϕ(x))k ≤
0 = f (h, y(h)) − f (0, 0) = fx (ξ)h + fy (ξ)y(h)
mit einem ξ ∈ ((0, 0), (h, y(h))). Also ist
R(h) = y(h) + fy (0, 0)−1 fx (0, 0)h = (fy (0, 0)−1 fx (0, 0) − fy (ξ)−1 fx (ξ))h = B(ξ)h.
Da B(0) = 0 ist gibt es für jedes ε > 0 ein δ > 0 sodass für jedes h mit khk < δ die Ungleichung
kB(ξ)hk ≤ ε khk ist. Für diese h ist also
kR(h)k
< ε,
khk
also ist y differenzierbar und die Ableitung durch die Formel
y 0 (x) = −fy (x, y(x))fx (x, y(x))
gegeben, was auch zeigt, dass y 0 stetig ist.
63
6. Lagrange Multiplikatoren
Sei ϕ : W → Rd eine differenzierbare Funktion. Wir sind daran interessiert, folgendes Extremwertproblem
zu lösen: Finde z ∈ W , für welche ϕ(z) unter der Nebenbedingung f (z) = 0 ein Extremum hat.
Angenommen, die Matrix fz hat konstanten Rang d auf W , dann können wir nach Umnumerierung der
Koordinaten W = U × V mit U ⊂ Rm−d , V ⊂ Rd schreiben, und mit entsprechenden Koordinaten (x, y) = z
annehmen, dass fy invertierbar auf W ist. Wir haben dann folgendes Problem: Sei ϕ : U × V → R eine
differenzierbare Funktion. Finde (x, y) ∈ U × V , für welche ϕ(x, y) unter der Nebenbedingung f (x, y) = 0
ein Extremum hat.
Wenn, wie angenommen, fy (x, y) invertierbar ist, so können wir in einer Umgebung von (x0 , y0 ) ∈ U × V
eine Umgebung W von x0 und eine differenzierbare Funktion y(x) finden, sodass die Lösungen f (x, y) = 0
mit x ∈ W und y nahe bei y0 von der Form y = y(x) sind.
Damit übersetzt sich die Lösung des Extremwertproblems in das Finden der Extremwerte von
ϕ(x, y(x))
übersetzen. Damit muss an der Stelle eines Extremums
ϕx (x, y(x)) + ϕy (x, y(x))y 0 (x) = ϕx (x, y(x)) + ϕy (x, y(x))(−fy (x, y(x)))−1 fx (x, y(x)) = 0
sein. Mit anderen Worten: An der Stelle eines Extremums erfüllt (ϕx , ϕy ) die Gleichung
I
(ϕx , ϕy )
= 0;
−fy−1 fx
die Matrix ist von Rang d, und (ϕx , ϕy ) ist in ihrem (Links-)Nullraum. Man überprüft auch, dass die Vektoren
(fj,x , fj,y ) für j = 1, . . . , d in ihrem Nullraum sind, und sie sind
P nach Vorraussetzung linear unabhängig.
Damit muss es also Konstanten λ1 , . . . , λd geben, welche ϕ0 = j λj fj0 erfüllen.
Wir betrachten an Stelle von ϕ nun die Funktion
Φ(z, Λ) = ϕ(z) −
d
X
λk fk (z) = ϕ(z) − f (z) · Λ,
k=1
welche auf W ×Rd definiert ist, und wir Λ = (λ1 , . . . , λd ) geschrieben haben. Dann ist Φ0 (z, Λ) durch folgende
Matrix gegeben:
Φ0 = (ϕz − fz Λ, f ).
0
Also ist Φ (z, Λ) = 0, wenn f (z) = 0 ist und es Konstanten Λ = (λ1 , . . . , λd gibt, welche
X
ϕ0 =
λj fj0
j
erfüllen. An einer Stelle, wo ϕ ein Extremum mit Nebendingung f = 0 hat, gilt also, dass die zugeordnete
Funktion Φ eine Nullstelle ihrer Ableitung hat, also Φ0 = 0 ist.
Beispiel 14. Wir finden das Extremum von ϕ(x, y) = xy unter der Nebenbedingung x + y = 1. Elementar
berechnen wir das, indem wir die Funktion ψ(x) = x(1 − x) betrachten und sehen, dass ψ ein Maximum an
der Stelle x = 1/2 annimmt.
Ohne diese Parametrisierung zu verwenden, können wir die Funktion Φ(x, y, λ) = xy + λ(x + y − 1)
betrachten. Dann müssen wir die Nullstellen von Φ0 bestimmen, also die Gleichungen
y + λ = 0,
x + λ = 0,
x+y =1
lösen. Dieses lineare Gleichungssystem hat die Lösungen x = y = 1/2, λ = −1/2.
Wir formulieren nochmals:
Satz 27. Wenn die Funktion ϕ : U → R ein Extremum an der Stelle z0 unter der Nebenbedingung
f (z) = 0 hat, wo f : U → Rd von vollen Rang auf U ist (d.h. die Matrix f 0 (z) hat Rang d für alle z ∈ U ),
dann gibt es ein Λ0 ∈ Rd , sodass die Funktion
Φ(z, Λ) = ϕ(z) + Λ · f (z)
0
Φ (z0 , Λ0 ) = 0 erfüllt.
64

Zugehörige Unterlagen

UE 7

Lösung zu Aufgabe 14: Durch die Aussagen der Frauen ist gegeben

Analysis Skriptum zur Vorlesung im Wintersemester 2012 Version

Zugehörige Unterlagen

Produkte

Unterstützung

Analysis Skriptum zur Vorlesung im Wintersemester 2012 Version

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können