Analysis I, II

Analysis I, II
Frank Müller
23. Juli 2009
Inhaltsverzeichnis
1 Zahlen, Folgen, Reihen
1
Zahlen und Körper . . . . . . . . . . .
2
Vollständige Induktion . . . . . . . . .
3
Die Definition der reellen Zahlen . . .
4
Folgen und Reihen . . . . . . . . . . .
5
Vollständigkeit reeller Zahlen . . . . .
6
Punktmengen in R . . . . . . . . . . .
7
Die komplexen Zahlen . . . . . . . . .
8
Konvergenzkriterien für Reihen (in C)
9
Potenzreihen . . . . . . . . . . . . . .
10 Der d-dimensionale reelle Raum Rd . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
14
19
29
35
42
49
55
66
69
2 Funktionen und Stetigkeit
1
Beispiele und Grenzwerte von Funktionen . . .
2
Der Stetigkeitsbegriff . . . . . . . . . . . . . . .
3
Kompakta und gleichmäßige Stetigkeit . . . . .
4
Funktionenfolgen und gleichmäßige Konvergenz
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
81
81
87
91
93
3 Differential- und Integralrechnung
1
Differenzierbarkeit . . . . . . . . . . . . . .
2
Lokale Extrema, Mittelwertsatz, Konvexität
3
Die elementaren Funktionen . . . . . . . . .
4
Das eindimensionale Riemannsche Integral .
5
Integration und Differentiation . . . . . . .
6
Uneigentliche Integrale . . . . . . . . . . . .
7
Die Taylorsche Formel . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
99
99
106
113
124
135
143
150
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Differentialrechnung
159
1
Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
2
Mittelwertsatz und Differentiale . . . . . . . . . . . . . . . . . . . . . 167
3
Partielle Ableitungen höherer Ordnung . . . . . . . . . . . . . . . . . 174
3
4
5
6
5 Das
1
2
3
4
5
6
Taylorformel und lokale Extrema . . . . . . . . . . . . . . . . . . . . 180
Inverse Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
Der Satz über implizite Funktionen . . . . . . . . . . . . . . . . . . . 192
n-dimensionale Riemannsche Integral
Das Integral über Quader . . . . . . . . . . . . .
Unstetigkeitsstellen und Heine-Borel . . . . . . .
Integration über quadrierbare Mengen . . . . . .
Die Transformationsformel für Testfunktionen . .
Uneigentliche Integrale & Transformationsformel
Anhang: Verwendetes und Weiterführendes . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
203
203
211
220
229
235
243
Kapitel 1
Zahlen, Folgen, Reihen
1
Zahlen und Körper
Grundlegend für alle Mathematik sind selbstverständlich die Zahlen. Und nach dem
deutschen Mathematiker Leopold Kronecker sind die einzig göttlichen Zahlen“ die
”
natürlichen Zahlen
N := {1, 2, 3, . . .}
oder zusammen mit dem Nullelement 0:
N0 := N ∪ {0} = {0, 1, 2, 3, . . .}.
Nehmen wir noch die negativen Zahlen hinzu, so erhalten wir die ganzen Zahlen:
Z := {x : x ∈ N0 oder − x ∈ N} = {0, ±1, ±2, ±3, . . .}.
(Hier sehen Sie übrigens die drei typischen Schreibweisen von Mengen: die aufzählende Schreibweise, die Definition als Vereinigung, Durchschnitt, Differenz, ... von anderen Mengen und die Definition durch Angabe der Eigenschaften ihrer Elemente.)
Je zwei Zahlen a, b ∈ Z lassen sich verknüpfen durch Addition a + b ∈ Z und
Multiplikation a · b = ab ∈ Z, wie wir sie aus der Schule kennen. Bezüglich der
Addition haben wir folgende Rechenregeln, die wir als gegeben annehmen wollen:
Axiome der Addition.
(A1) Kommutativität: Für alle a, b ∈ Z gilt a + b = b + a.
(A2) Assoziativität: Für alle a, b, c ∈ Z gilt (a + b) + c = a + (b + c).
(A3) Existenz der 0: Es existiert ein neutrales Element 0 ∈ Z, d.h. für alle a ∈ Z
gilt a + 0 = a.
(A4) Existenz des Negativen: Für alle a ∈ Z existiert ein −a ∈ Z, so dass a + (−a) =
0 richtig ist.
1
2
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Die Existenz des Negativen (A4) zeichnet die ganzen Zahlen gegenüber N0 aus.
Zusätzlich haben wir das folgende
Distributivgesetz.
(D) Für alle a, b, c ∈ Z gilt a · (b + c) = a · b + a · c.
Bemerkung: Man kann die natürlichen Zahlen mittels der Peanoschen Axiome zusammen mit der Addition und Multiplikation induktiv erklären und anschließend
durch die Lösung der Gleichungen n + x = 0 für n ∈ N formal auf die ganzen Zahlen
erweitern; siehe z.B. Rannachers Skript, Abschnitt 1.2.
Innerhalb der ganzen Zahlen können i.A. keine Gleichungen der Form
q · x = p für gegebene p ∈ Z, q ∈ N
(1.1)
gelöst werden. Hierzu erweitern wir Z auf die Menge der rationalen Zahlen
n
o
p
Q := x = : p ∈ Z, q ∈ N ,
q
wobei x = pq für die (eindeutige) Lösung der Gleichung (1.1) steht. Wir verzichten
auf die formal exakte Definition über Äquivalenzklassen und verweisen wieder auf
Rannachers Skript, Abschnitt 1.2. (Mit x = pq löst auch ap
aq für jedes a ∈ N die Gleichung (1.1); diese ungekürzten“Brüche müssten identifiziert werden.) Die Arbeit
”
mit Äquivalenzklassen werden wir später bei der Konstruktion der reellen Zahlen
üben. Man beachte noch, dass sich für q = 1 die Lösung von (1.1) zu x = p ∈ Z
ergibt, d.h. wir haben Z ⊂ Q.
Wir zeigen unten in Satz 1.1, dass in Q zusätzlich zu den Gesetzen (A1)–(A4)
und (D) (nun natürlich für a, b, c ∈ Q) auch die folgenden Regeln gelten:
Axiome der Multiplikation.
(M1) Kommutativität: Für alle a, b ∈ Q gilt a · b = b · a.
(M2) Assoziativität: Für alle a, b, c ∈ Q gilt (a · b) · c = a · (b · c).
(M3) Existenz der 1: Es existiert ein neutrales Element 1 ∈ Q \ {0}, d.h. für alle
a ∈ Q gilt a · 1 = a.
(M4) Existenz der Inversen: Für alle a ∈ Q \ {0} existiert ein a−1 ∈ Q, so dass
a · a−1 = 1 richtig ist.
Natürlich gelten (M1)–(M3) schon in Z, wesentlich ist also die Existenz der
Inversen (M4). In obigen Axiomen haben wir übrigens Addition und Multiplikation
wie folgt auf Q fortgesetzt: Für x1 = pq11 , x2 = pq22 ∈ Q setzen wir
x1 + x2 :=
p1 q2 + p2 q1
∈ Q,
q1 q2
x1 · x2 = x1 x2 :=
p1 p2
∈ Q.
q1 q2
(1.2)
1. ZAHLEN UND KÖRPER
3
Dies scheint Ihnen natürlich aus der Schule völlig klar (Regeln der Bruchrechnung),
ergibt sich aber erst aus der Definition der rationalen Zahlen und den gewünschten
Rechenregeln als einzig sinnvolle Wahl!
Definition 1.1: Ein Tripel (K, +, ·), kurz mit K bezeichnet, heißt Körper mit der
nichtleeren Grundmenge K und den Rechenoperationen +, ·, wenn mit a, b ∈ K auch
a + b ∈ K und a · b ∈ K gilt und die Körperaxiome (A1)–(A4), (M1)–(M4) und (D)
für beliebige Elemente aus K erfüllt sind.
Bemerkung: In einem Körper können wir noch Subtraktion und Division erklären:
a − b := a + (−b) ∈ K für a, b ∈ K,
a
:= a · b−1 ∈ K für a ∈ K, b ∈ K \ {0}.
b
Wie bereits oben behauptet haben wir den:
Satz 1.1: Die Menge Q der rationalen Zahlen ist (zusammen mit + und ·) ein
Körper.
Beweis: Für den Beweis dürfen wir die Rechenregeln (A1)–(A4), (M1)–(M3) und
(D) nur in Z anwenden; wir schreiben dafür (A1)Z usw.
1. Wir beginnen mit den Axiomen der Addition: (A3) ist offensichtlich. Ist x = pq
mit p ∈ Z, q ∈ N, so gilt (A4) mit dem Negativen −x := −p
q ∈ Q, denn wegen
(1.2) gilt dann
x + (−x) =
p −p
pq + (−p)q
+
=
q
q
q·q
(M 1)Z ,(D)Z
=
(p + (−p))q
q·q
(A4)Z
=
0 q
·
q q
(M 3)Z
=
0
,
q
d.h. q(x + (−x)) = 0 und daher x + (−x) = 0, da q · 0 = 0 für alle q ∈ Z richtig
ist (letzteres ergibt sich aus q · 0 + q · 0 = q(0 + 0) = q · 0 nach Subtraktion von
q · 0 auf beiden Seiten.)
(A1) können wir direkt nachrechnen: Mit x1 =
x1 + x2 =
p1 q2 + p2 q1
q1 q2
(A1)Z ,(M 1)Z
=
p1
q1 ,
x2 =
p2
q2
haben wir
p2 q1 + p1 q2
= x2 + x1 .
q2 q1
4
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Ist zusätzlich x3 =
(x1 + x2 ) + x3
p3
q3 ,
so finden wir schließlich
p1 q2 + p2 q1 p3
(p1 q2 + p2 q1 )q3 + p3 (q1 q2 )
+
=
q1 q2
q3
(q1 q2 )q3
((p1 q2 )q3 + (q1 p2 )q3 ) + p3 (q2 q1 )
(q1 q2 )q3
p1 (q2 q3 ) + (q1 (p2 q3 ) + (p3 q2 )q1 )
q1 (q2 q3 )
p1 (q2 q3 ) + (p2 q3 + p3 q2 )q1
q1 (q2 q3 )
p1 p2 q3 + p3 q2
+
= x1 + (x2 + x3 ),
q1
q2 q3
=
(D)Z ,(M 1)Z
=
(A2)Z ,(M 2)Z
=
(M 1)Z ,(D)Z
=
=
also (A2).
2. Die Axiome der Multiplikation: Die Gesetze (M1) und (M2) folgen in trivialer
Weise aus der Definition (1.2) und den entsprechenden Gesetzen in Z. Wegen
1 = 11 haben wir für x = pq :
x·1=
p·1
p 1
· =
q 1
q·1
also (M3). Die Inverse zu x =
(
−1
x
:=
p
q
(M 3)Z
=
p
= x,
q
6= 0 (d.h. p 6= 0) erklären wir zu
q
p,
−q
−p ,
falls p ∈ N
falls − p ∈ N
∈ Q.
(M 3)Z
Im ersten Fall ist dann offenbar x · x−1 = 1, wenn man noch pp = 1 für
beliebige p ∈ Z \ {0} beachtet. Im zweiten Fall benötigen wir noch die folgende
Beobachtung: Für beliebiges p ∈ Z gilt
p + (−1) · p
(M 3)Z ,(M 1)Z
=
(D)Z
1 · p + (−1) · p = (1 + (−1)) · p = 0 · p = 0,
also −p = (−1)p. Damit berechnen wir
x · x−1 =
also (M4).
p · ((−1) · q)
p −q
·
=
q −p
q · ((−1) · p)
(M 1)Z ,(M 2)Z
=
(−1)(pq)
= 1,
(−1)(pq)
1. ZAHLEN UND KÖRPER
5
3. Schließlich beweisen wir das Distributivgesetz (D) in Q: Mit x1 =
x3 = pq33 berechnen wir
x1 · (x2 + x3 )
=
=
(D)Z ,(M 2)Z
=
(M 2)Z ,(M 1)Z
=
=
p1
q1 ,
x2 =
p2
q2 ,
p1 p2 q3 + p3 q2 (D)Z p1 (p2 q3 ) + p1 (p3 q2 )
·
=
q1
q2 q3
q1 (q2 q3 )
(p1 (p2 q3 ) + p1 (p3 q2 ))q1
(q1 (q2 q3 ))q1
((p1 p2 )q3 )q1 + ((p1 p3 )q2 )q1
((q1 q2 )q3 )q1
(p1 p2 )(q1 q3 ) + (p1 p3 )(q1 q2 )
(q1 q2 )(q1 q3 )
p1 p2 p1 p3
+
= x1 · x2 + x1 · x3 .
q1 q2
q1 q3
Also ist Q ein Körper.
q.e.d.
Es stellt sich nun heraus, dass auch der Bereich der rationalen Zahlen i.A. nicht
ausreicht. Z.B. besitzt die einfache Gleichung
x2 = 2
keine Lösung in Q. Wäre nämlich x =
( pq )2
p2
q2
p
q
(1.3)
eine Lösung mit p ∈ Z, q ∈ N teilerfremd,
so müsste also
=
= 2 bzw. p2 = 2q 2 gelten. Damit wäre aber p2 und daher
auch p durch 2 teilbar, d.h. p = 2l mit einem l ∈ Z und folglich
q2 =
p2
= 2l2 .
2
Also wäre auch q 2 und somit q durch 2 teilbar, im Widerspruch zur Annahme, dass
p und q teilerfremd sind.
Bemerkung: Wir haben soeben ein wichtiges Beweisprinzip in der Mathematik benutzt, den indirekten Beweis oder Beweis durch Widerspruch: Um unter den Voraussetzungen (V) eine Aussage (A) zu beweisen, nimmt man an, dass (A) falsch ist und
zeigt, dass dann eine der Voraussetzungen (V) oder eine andere, bereits bewiesene
Aussage (B) nicht erfüllt sein kann. Hierbei benutzt man eine der Grundannahmen
der Mathematik: Eine Aussage (A) ist entweder wahr oder falsch.
√
Aus der Schule wissen wir, dass x =√ 2 ein guter Kandidat zur Lösung von (1.3)
ist. Nach dem eben Gesagten ist aber 2 keine rationale Zahl. Wir werden später
Q konstruktiv durch einen Abschlussprozess auf den Bereich der reellen Zahlen R
erweitern. R entspricht dann der gesamten Zahlengeraden.
Um schließlich auch Gleichungen wie
x2 + 1 = 0
6
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
lösen zu können, werden wir R zu den komplexen Zahlen C erweitern; diese kann
man sich in der Gaußschen Zahlenebene veranschaulichen. Insgesamt haben wir also
die Zahlenbereiche
N ⊂ Z ⊂ Q ⊂ R ⊂ C.
Die größten Bereiche Q, R, C haben die Eigenschaft, Körper im Sinne der Definition 1.1 zu sein; für Q haben wir dies bereits gezeigt, für R und C wird dies aus der
Konstruktion folgen. Hingegen sind N und Z keine Körper; beiden fehlt die Inverse,
d.h. (M4) ist verletzt, den naürlichen Zahlen fehlt auch das Negative und sogar das
Nullelement 0.
Ein Körper muss nach (A3) und (M3) mindestens zwei Elemente enthalten,
nämlich das Nullelement 0 und das Einselement 1. Umgekehrt kann man jede zweielementige Menge M = {x, y} durch geeignete Definition der Verknüpfungen zu
einem Körper machen:
+ x y
x x y
y y x
und
· x y
x x x
y x y
(1.4)
Hierbei wird x als Nullelement und y als Einselement interpretiert.
Wir werden nun einige Folgerungen der Körperaxiome angeben, deren Aussagen
Ihnen zum Teil offensichtlich erscheinen mögen. Allerdings gelten diese Rechenregeln in beliebigen Körpern, also z.B. auch für die komplexen Zahlen. Durch diese
Vorgehensweise ersparen wir uns später ermüdende Wiederholungen.
Satz 1.2: In einem Körper K gelten folgende Rechenregeln:
(a) Die Gleichung a + x = b besitzt für beliebig vorgegebene a, b ∈ K genau eine
Lösung x ∈ K. Insbesondere sind das Nullelement 0 und das negative Element
eindeutig bestimmt.
(b) Die Gleichung ax = b besitzt für beliebig vorgegebene a ∈ K \ {0}, b ∈ K genau
eine Lösung x ∈ K. Insbesondere sind das Einselement 1 und das inverse
Element eindeutig bestimmt.
(c) Für alle x ∈ K gilt x · 0 = 0 und (−1) · x = −x.
(d) Für alle x ∈ K gilt −(−x) = x und falls zusätzlich x 6= 0 auch (x−1 )−1 = x.
(e) Für alle x, y ∈ K \ {0} ist xy 6= 0 richtig.
(f ) Für alle x, y ∈ K ist −(x + y) = −x − y richtig und falls zusätzlich x, y 6= 0
gilt auch (xy)−1 = x−1 y −1 .
1. ZAHLEN UND KÖRPER
7
Beweis:
(a) Wir zeigen zunächst, dass x := b + (−a) = b − a die Gleichung a + x = b löst,
d.h. wir beweisen die Existenz einer Lösung:
a+x
=
a + (b − a)
(A4)
=
0+b
(A1)
=
(A1)
=
a + ((−a) + b)
(A3)
b+0
=
(A2)
=
(a + (−a)) + b
b.
Die Eindeutigkeit der Lösung ergibt sich wie folgt: Angenommen es gibt zwei
Lösungen x1 , x2 , d.h.
a + x1 = b = a + x2 .
Addieren wir von rechts auf beiden Seiten −a, so folgt
(a + x1 ) + (−a) = (a + x2 ) + (−a)
(A1),(A2)
=⇒
x1 + (a + (−a)) = x2 + (a + (−a))
(A4)
=⇒
x1 + 0 = x2 + 0
(A3)
=⇒
x1 = x2 ,
wie behauptet.
(b) Existenz: x := a−1 b ist Lösung, denn
ax = a(a−1 b)
(M 2)
=
(aa−1 )b
(M 4)
=
1·b
(M 1)
=
b·1
(M 3)
=
b.
Eindeutigkeit: Für zwei Lösungen x1 , x2 hätten wir ax1 = b = ax2 und nach
Multiplikation mit a−1 von rechts:
(ax1 )a−1 = (ax2 )a−1
(M 1),(M 2)
=⇒
x1 (aa1 ) = x2 (aa−1 )
(M 4)
=⇒
x1 · 1 = x2 · 1
(M 3)
=⇒
x1 = x2 .
(c) x · 0 = 0: Nach (A3) gilt 0 + 0 = 0 und folglich
(D)
x · 0 + x · 0 = x · (0 + 0) = x · 0.
Addition von −(x·0) auf beiden Seiten von rechts (und Ausnutzen der Axiome
(A2), (A4) und (A3)) liefert die Behauptung.
(−1) · x = −x: Es gilt
x + (−1) · x
(M 3),(M 1)
=
(D)
x · 1 + x · (−1) = x · (1 + (−1))
(A4)
=
x · 0 = 0.
Nach Addition von −x auf beiden Seiten von links folgt die Behauptung.
8
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(d) −(−x) = x: Per Definition ist −(−x) erklärt durch die Gleichung −x +
(−(−x)) = 0. Andererseits gilt auch
−x + x
(A1)
=
x + (−x)
(A4)
=
0.
Da aber die Lösung y ∈ K der Gleichung −x + y = 0 nach (a) eindeutig ist,
folgt x = −(−x).
(x−1 )−1 = x: Wegen x 6= 0 ist auch x−1 6= 0; wäre nämlich x−1 = 0, so hätten
wir
(c)
1 = x · x−1 = x · 0 = 0,
im Widerspruch zu (M3). Also ist (x−1 )−1 erklärt, nämlich als Lösung von
x−1 (x−1 )−1 = 1. Andererseits haben wir
x−1 x
(M 1)
=
xx−1
(M 4)
=
1.
Da aber die Gleichung x−1 y = 1 nach (b) eine eindeutige Lösung y ∈ K besitzt
folgt x = (x−1 )−1 .
(e) Beweis durch Widerspruch: Angenommen es gibt x, y ∈ K \ {0} mit xy = 0.
Nach Multiplikation mit y −1 (beachte y 6= 0) von rechts folgt
x
(M 3)
=
x·1
(M 4)
=
x(yy −1 )
(M 2)
=
(c)
(xy)y −1 = 0 · y −1 = 0,
also ein Widerspruch zur Annahme x 6= 0. Somit ist die Behauptung richtig.
(f) −(x + y) = −x − y: Per Definition ist (x + y) + (−(x + y)) = 0 richtig. Addieren
wir −x beidseitig von links, so folgt nach Ausnutzung von (A2) und (A3):
((−x) + x) + (y + (−(x + y))) = −x.
Verwenden wir noch (A1), (A4) und (A3), so ergibt sich y + (−(x + y)) = −x.
Nach (a) hat aber die Gleichung y + z = −x die eindeutige Lösung z = −x − y
und die Behauptung folgt.
(xy)−1 = x−1 y −1 : Aus der Definition haben wir (xy)(xy)−1 = 1 und nach
Multiplikation von x−1 von links und Verwendung von (M2), (M3) folgt
(x−1 x)(y(xy)−1 ) = x−1 .
Dies liefert wegen (M1), (M4) und (M3): y(xy)−1 = x−1 . Da aber nach (b)
die eindeutige Lösung von yz = x−1 durch z = y −1 x−1 = x−1 y −1 gegeben ist,
ergibt sich die Behauptung.
q.e.d.
1. ZAHLEN UND KÖRPER
9
Bemerkung: In Mehrfachsummen und Mehrfachprodukten lassen wir i.F. die Klammern meist weg, also a+b+c+. . . und a·b·c·. . . für a, b, c, . . . ∈ K, denn wegen (A2)
und (M2) spielt die Reihenfolge der Summierung bzw. Multiplikation keine Rolle.
Ebenso können wir in Mehrfachsummen und Mehrfachprodukten die Reihenfolge
der Summanden bzw. Faktoren beliebig vertauschen.
Für das in der Analysis wesentliche Rechnen mit Ungleichungen benötigen wir
noch eine Anordnung“, wir müssen also entscheiden können, ob ein Element eines
”
Körpers größer“ oder kleiner“ als ein anderes Element ist. Hierzu verwenden wir
”
”
die folgende
Definition 1.2: Wir nennen einen Körper K angeordnet, wenn gewisse Elemente
x ∈ K als positiv ausgezeichnet sind (in Zeichen: x > 0), wobei folgende Regeln
erfüllt seien:
Anordnungsaxiome
(O1) Für jedes x ∈ K gilt genau eine der drei Beziehungen
x > 0,
x = 0,
−x > 0.
Die x ∈ K mit −x > 0 heißen die negativen Elemente.
(O2) Für alle x, y ∈ K mit x > 0 und y > 0 gilt
x+y >0
und
xy > 0.
Bemerkungen:
1. (O1) ist das sogenannte Trichotomiegesetz, bei (O2) spricht man von der Abgeschlossenheit von >“ bezüglich der Addition und Multiplikation.
”
2. Der Körper Q der rationalen Zahlen ist natürlich angeordnet mittels
p
x > 0 :⇐⇒ x =
mit p, q ∈ N
q
Dann sind die x = pq mit −p, q ∈ N gerade die negativen Zahlen. Dies entspricht
unserer Vorstellung der Anordung von Q auf der Zahlengeraden (vgl. auch
Definition 1.3 unten).
3. Aus der Konstruktion von R wird folgen, dass auch die reellen Zahlen einen
angeordneten Körper bilden. Hingegen stellt sich C als nicht angeordneter
Körper heraus.
4. Auch der Körper ({x, y}, +, ·) mit den in (1.4) erklärten Relationen +, · kann
nicht angeordnet werden: Da x das Nullelement ist, müsste für y gelten: entweder y > x oder −y > x. Per Definition ist −y ∈ {x, y} Lösung von y+(−y) = x.
Nach (1.4) ist dann aber −y = y, Widerspruch!
10
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Definition 1.3: (Größer- und Kleinerrelation)
In einem angeordneten Körper definieren wir:
x > y :⇐⇒ x − y > 0,
x < y :⇐⇒ y > x,
x ≥ y :⇐⇒ x > y oder x = y,
x ≤ y :⇐⇒ x < y oder x = y.
Satz 1.3: In einem angeordneten Körper K gelten folgende Aussagen:
(a) Für je zwei Elemente x, y ∈ K gilt genau eine der Relationen
x < y,
x = y,
x > y.
(b) Transitivität: Für alle x, y, z ∈ K gilt: x < y und y < z implizieren x < z.
(c) Translationsinvarianz: Für alle x, y, a ∈ K gilt: Aus x < y folgt x + a < y + a.
(d) Skalierungsinvarianz: Für alle x, y, a ∈ K mit x < y und a > 0 gilt xa < ya.
(e) Spiegelung: Für alle x, y ∈ K mit x < y haben wir −x > −y.
(f ) Für alle x ∈ K \ {0} ist x2 > 0 richtig; insbesondere gilt 1 > 0.
(g) Für jedes x ∈ K mit x > 0 ist x−1 > 0 erfüllt.
(h) Für alle x, y ∈ K mit 0 < x < y gilt x−1 > y −1 .
Bemerkung: Wegen Satz 1.3 (a) sind in einem angeordneten Körper für je zwei Elemente x, y ∈ K das Minimum und Maximum wohl definiert:
(
(
x, falls x ≤ y
x, falls x ≥ y
min{x, y} :=
, max{x, y} :=
.
y, sonst
y, sonst
Beweis von Satz 1.3: Wir werden die Körperaxiome und deren Folgerungen aus
Satz 1.2 ohne Kommentar benutzen.
(a) Ist klar aus (O1) und Definition 1.3.
(b) Per Voraussetzung ist y − x > 0 und z − y > 0, so dass (O2) liefert
z − x = (y − x) + (z − y) > 0 bzw. x < z.
(c) Aus der Voraussetzung y − x > 0 folgt sofort
(y + a) − (x + a) = y − x > 0 bzw. x + a < y + a.
1. ZAHLEN UND KÖRPER
11
(d) Wegen y − x > 0 und a > 0 liefert (O2)
ya − xa = (y − x)a > 0
bzw. xa < ya,
wie behauptet.
(e) Es gilt (−x) − (−y) = y − x > 0 nach Voraussetzung, also −x > −y.
(f) Für x > 0 folgt x2 = x · x > 0 aus (O2).
Für x < 0 multiplizieren wir diese Ungleichung mit −x > 0 durch und erhalten
aus (d): −x2 < 0 bzw. x2 = −(−x2 ) > 0 nach Definition 1.3.
Schließlich beachten wir noch 1 = 1 · 1 > 0.
(g) Es sei x > 0 und angenommen es gilt x−1 < 0, d.h. −x−1 > 0. Aus (O2) folgt
dann aber
−1 = −xx−1 = x(−x−1 ) > 0 bzw. 1 < 0,
im Widerspruch zu (f).
(h) Wegen x > 0 und y > x erhalten wir aus (b) auch y > 0 und (O2) liefert
xy > 0: Aus (g) folgt also
x−1 y −1 = (xy)−1 > 0.
Wenden wir nun (d) mit a = x−1 y −1 auf die Ungleichung x < y an, so folgt
(d)
y −1 = x−1 y −1 x < x−1 y −1 y = x−1 ,
wie behauptet.
q.e.d.
Definition 1.4: Zu einem x ∈ K aus dem angeordneten Körper K erklären wir den
(Absolut-)Betrag als
(
x,
falls x ≥ 0
|x| :=
.
−x, sonst
Bemerkung: Offenbar sind
|x| = max{x, −x}
und
−|x| ≤ x ≤ |x|
für alle x ∈ K richtig.
Satz 1.4: Der Absolutbetrag hat folgende Eigenschaften:
(a) Für jedes x ∈ K gilt |x| ≥ 0 und |x| = 0 ⇐⇒ x = 0.
12
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(b) Multiplikativität: Für alle x, y ∈ K gilt |x · y| = |x| · |y|.
(c) Dreiecksungleichung: Für beliebige x, y ∈ K haben wir |x + y| ≤ |x| + |y|.
Beweis:
(a) |x| ≥ 0 ist klar nach Definitionen 1.2–1.4. Auch |x| = 0 ⇐⇒ x = 0 entnimmt
sofort der Definition 1.4.
(b) Falls x ≥ 0, y ≥ 0, so gilt xy ≥ 0 gemäß (O2) und folglich auch
|xy| = xy = |x| |y|.
Falls x < 0, y ≥ 0, so folgt xy ≤ 0 nach Satz 1.3 (d); also finden wir
|xy| = −(xy) = (−x)y = |x| |y|.
Entsprechend lässt sich der Fall x ≥ 0, y < 0 behandeln.
Gilt schließlich x < 0, y < 0, so folgt xy = (−x)(−y) > 0 (hier haben zusätzlich
zu Satz 1.3 (d) noch Satz 1.2 (c), (d) verwendet), also
|xy| = xy = (−x)(−y) = |x| |y|.
(c) Wegen x ≤ |x|, y ≤ |y| haben wir (nach Satz 1.3 (c)):
x + y ≤ |x| + y ≤ |x| + |y|.
Entsprechend folgt aus −x ≤ |x|, −y ≤ |y| auch
−(x + y) = −x − y ≤ |x| + |y|.
Insgesamt ergibt sich also
|x + y| = max{x + y, −(x + y)} ≤ |x| + |y|,
wie behauptet.
q.e.d.
Bemerkung: Einen Körper K, auf dem eine Abbildung | · | : K → K0 vermöge x 7→ |x|
mit den Eigenschaften (a)–(c) aus Satz 1.4 erklärt ist, nennt man bewerteten Körper ;
hierbei ist K0 ein (eventuell anderer) angeordneter Körper. Insbesondere sind also die
angeordneten Körper auch bewertet mit dem oben erklärten Absolutbetrag |·| : K →
K. Andererseits ist aber nicht jeder bewertete Körper auch angeordnet, wie z.B. die
komplexen Zahlen C. Für die folgenden Eigenschaften des Absolutbetrages benutzen
wir nur Satz 1.4 (a)–(c), so dass diese auch z.B. für den (später zu definierenden)
Absolutbetrag in C gültig bleiben.
1. ZAHLEN UND KÖRPER
13
Satz 1.5: (Rechnen in bewerteten Körpern)
(a) Für jedes x ∈ K ist | − x| = |x| richtig.
(b) Für jedes x ∈ K \ {0} ist |x−1 | = |x|−1 erfüllt.
¯
¯
(c) Für beliebige x, y ∈ K gilt |x − y| ≥ ¯|x| − |y|¯.
¯ x ¯ |x|
¯ ¯
(d) Für alle x, y ∈ K mit y 6= 0 gilt ¯ ¯ =
.
y
|y|
Beweis:
(a) Satz 1.4 (b) mit x = y = 1 liefert zunächst |1| = |1 · 1| = |1| · |1| bzw. 1 = |1|.
Setzen wir x = y = −1 ein, so folgt 1 = |1| = |(−1)(−1)| = | − 1|2 . Nach
Satz 1.4 (a) ist | − 1| > 0. Wegen
0 = | − 1|2 − 12 = (| − 1| − 1)(| − 1| + 1),
muss also | − 1| = 1 richtig sein. Für beliebige x ∈ K finden wir nun
| − x| = |(−1)x| = | − 1| |x| = 1 · |x| = |x|,
wie behauptet.
(b) Wegen xx−1 = 1 und |1| = 1 liefert Satz 1.4 (b):
|x| |x−1 | = |xx−1 | = |1| = 1.
Also ist |x−1 | das inverse Element zu |x|, d.h. |x|−1 = |x−1 |.
(c) Mit der Dreiecksungleichung berechnen wir
|x| = |(x − y) + y| ≤ |x − y| + |y| bzw. |x| − |y| ≤ |x − y|
und
(a)
|y| = |(y − x) + x| ≤ |x − y| + |x| bzw.
also
− (|x| − |y|) ≤ |x − y|,
¯
©
ª ¯
|x − y| ≥ max |x| − |y|, −(|x| − |y|) = ¯|x| − |y|¯.
(d) Mit der Relation (b) und Satz 1.4 (b) berechnen wir
¯x¯
|x|
¯ ¯
,
¯ ¯ = |xy −1 | = |x| |y −1 | = |x| |y|−1 =
y
|y|
wie behauptet.
q.e.d.
14
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beispiel: Im Körper R erklärt man das arithmetische bzw. geometrische Mittel zweier
Zahlen x, y ≥ 0 gemäß
1
mA (x, y) := (x + y),
2
mG (x, y) :=
√
xy.
Für diese gilt die Ungleichung mA (x, y) ≥ mG (x, y). In der Tat haben wir für a :=
√
√
x und b := y:
0 ≤ (a − b)2 = a2 − 2ab + b2
⇐⇒
1 2
(a + b2 ) ≥ ab,
2
also
1
√
(x + y) ≥ xy.
2
Gleichheit tritt übrigens genau dann auf, wenn x = y richtig ist. Das Rechnen in R,
insbesondere mit rationalen Potenzen, werden wir später genauer entwickeln.
Für den späteren Gebrauch bemerken wir noch, dass Q sogar ein archimedisch
angeordneter Körper ist, d.h. neben den Ordnungsaxiomen (O1) und (O2) gilt noch
folgendes:
Archimedisches Axiom.
(O3) Zu je zwei Elementen x, y ∈ Q mit x, y > 0 existiert eine natürliche Zahl
n ∈ N, so dass gilt
nx > y.
Zum Beweis von (O3) in Q seien x = pq , y = rs mit p, q, r, s ∈ N zwei beliebig
gewählte, positive rationale Zahlen. Wählen wir dann n := rq + 1 ∈ N, so folgt
p
p
r
p
nx = (rq + 1) = rp + = (ps) + ≥ y · 1 + x > y,
q
q
s
q
wie behauptet. Wir werden hieraus folgern, dass auch R archimedisch angeordnet
ist.
Bemerkung: Archimedes hat (O3) geometrisch formuliert: Hat man zwei Strecken
auf einer Geraden, so kann man, in dem man die kürzere hinreichend oft abträgt,
die längere übertreffen.
2
Vollständige Induktion
Wir lernen nun ein wichtiges Beweisprinzip kennen und anwenden, welches darauf
beruht, dass jede natürliche Zahl n ∈ N0 = N ∪ {0} einen eindeutig definierten
Nachfolger, nämlich n + 1 ∈ N, besitzt. Will man also eine Aussage A(n) für alle
2. VOLLSTÄNDIGE INDUKTION
15
n ≥ n0 mit einem n0 ∈ N0 beweisen (d.h. man möchte eigentlich unendlich viele
Aussagen A(n) in Abhängigkeit von n zeigen), dann geht man wie folgt vor:
Beweisprinzip der vollständigen Induktion.
Eine Aussage A(n) gilt für alle n ∈ N0 mit n ≥ n0 ∈ N0 , falls man folgendes beweisen
kann:
(IA) Induktionsanfang: Die Aussage A(n0 ) ist richtig.
(IS) Induktionsschritt: Für alle n ≥ n0 gilt: Ist A(n) richtig, so ist auch A(n + 1)
richtig.
Die Wirkungsweise ist klar: Sind (IA) und (IS) erfüllt und angenommen, A(n)
gilt nicht für ein n > n0 . Wegen (IS) ist dann auch A(n−1) falsch und dann A(n−2),
A(n − 3) usw. Nach n − n0 Schritten würde also folgen, dass auch A(n0 ) falsch ist,
im Widerspruch zu (IA).
Als erste Anwendung beweisen wir den
Satz 2.1: (Bernoullische Ungleichung)
Sei K ⊃ N ein angeordneter Körper und x ∈ K mit x ≥ −1 gewählt. Dann gilt für
alle n ∈ N0 die Ungleichung
(1 + x)n ≥ 1 + nx.
Bemerkung: Die n-te Potenz ist dabei für a ∈ K wie folgt induktiv erklärt:
a0 := 1,
an+1 := an · a
für n ∈ N.
Für a 6= 0 erhalten wir dann auch negative Potenzen:
a−n := (a−1 )n
für alle n ∈ N.
Rechenregeln: Für alle a, b ∈ K \ {0} und n, m ∈ Z gilt:
(i) an am = an+m .
(ii) (an )m = anm .
(iii) an bn = (ab)n .
Beweis von Satz 2.1: mittels vollständiger Induktion.
(IA) n = 0: Wir haben zu zeigen, dass A(0) gilt, also in unserem Fall
(1 + x)0 ≥ 1 + 0 · x.
Das ist offenbar richtig.
16
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(IS) n → n + 1: Es sei A(n) also (1 + x)n ≥ 1 + nx für ein n ∈ N0 richtig (genannt
Induktionsvoraussetzung (IV)). Zu zeigen ist A(n + 1), d.h.
(1 + x)n+1 ≥ 1 + (n + 1)x.
Hierzu berechnen wir m.H. der Induktionsvoraussetzung
(1 + x)n+1 = (1 + x)n (1 + x)
= 1 + nx + x +
(IV )
nx2
≥
(1 + nx)(1 + x)
≥ 1 + (n + 1)x,
d.h. A(n + 1) gilt. Also ist auch der Induktionsschritt (IS) erfüllt und nach
dem Prinzip der vollständigen Induktion gilt die Aussage für alle n ∈ N0 .
q.e.d.
Satz 2.2: Für jede natürliche Zahl n ∈ N gilt
1 + 2 + 3 + ... + n =
n(n + 1)
.
2
Bemerkung: Die Punkte deuten an, dass die Summation in der gleichen Weise fortgesetzt wird. Dies kann man m.H. von Summen- und Produktzeichen wie folgt kompakter schreiben:
Hat man viele, eventuell unendlich viele Variablen, so benutzt man statt a, b, c, . . .
sinnvoller die Bezeichnungen a1 , a2 , a3 , . . .. Die natürlichen Zahlen 1, 2, 3, . . . heißen
hierbei Indizes und dienen der Unterscheidung der Variablen ak , k ∈ N.
Für n ∈ N Variablen a1 , a2 , . . . , an setzen wir
n
X
k=1
n
Y
ak := a1 + a2 + . . . an
(Summe),
ak := a1 · a2 · . . . · an
(Produkt).
k=1
Hierbei kann man die Indexmenge 1, . . . , n natürlich auch durch andere (endliche)
Teilmengen von N oder allgemeiner von Z ersetzen. Die Formel in Satz 2.2 liest sich
nun (ak := k für k = 1, . . . , n):
n
X
k=
k=1
n(n + 1)
.
2
Beweis von Satz 2.2: mit vollständiger Induktion.
(IA) n = 1: Offenbar gilt
1
P
k=1
k = 1 und
1·(1+1)
2
= 1, d.h. A(1) ist korrekt.
2. VOLLSTÄNDIGE INDUKTION
17
n
P
(IS) n → n+1: Die Induktionsvorraussetzung
=
k=1
n(n+1)
2
gelte für ein n ∈ N. Für
den Beweis von (IS) berechnen wir m.H. der Induktionsvoraussetzung (IV):
n+1
X
k =
n
X
k=1
k + (n + 1)
(IV )
=
k=1
n(n + 1)
+ (n + 1)
2
n(n + 1) + 2(n + 1)
(n + 1)(n + 2)
=
,
2
2
d.h. es folgt A(n + 1). Somit gilt die Aussage für alle n ∈ N.
=
q.e.d.
Satz 2.3: (geometrische Reihe)
Für alle x ∈ K \ {1} im Körper K und alle n ∈ N gilt
n−1
X
1 − xn
.
1−x
xk =
k=0
Beweis (vollständige Induktion):
P
(IA) n = 1: Es gilt 0k=0 xk = x0 = 1 und
1−x1
1−x
= 1, also A(1).
(IS) n → n + 1: Die zu beweisende Relation gelte für festes n ∈ N (IV). Wir
berechnen dann
(n+1)−1
X
k
x
=
n
X
x
k
k=0
k=0
=
1−
xn
=
n−1
X
xk + xn
(IV )
=
k=0
xn (1
1 − xn
+ xn
1−x
+
− x)
1 − xn+1
=
,
1−x
1−x
wie behauptet.
q.e.d.
Definition 2.1: Wir erklären für n, k ∈ N0 die Binomialkoeffizienten
µ ¶
k
Y
n
n−j+1
n(n − 1) · . . . · (n − k + 1)
:=
=
.
k
j
1 · 2 · ... · k
j=1
Bemerkung: Offenbar gilt
µ ¶ (
n!
n
k!(n−k)! , falls k ≤ n
=
k
0,
falls k > n
mit der bekannten Fakultät:
0! := 1,
Insbesondere halten wir
¡n¢
0
= 1,
¡n¢
1
n! :=
n
Y
l.
l=1
= n und
¡n¢
k
=
¡
n
n−k
¢
für k ≤ n fest.
18
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Hilfssatz 2.1: Für alle natürlichen Zahlen k, n ∈ N gilt die Relation
µ ¶ µ
¶ µ
¶
n
n−1
n−1
=
+
.
k
k−1
k
(Veranschaulichung: Pascalsches Dreieck).
Beweis: Für k ≥ n ist nach obiger Bemerkung nichts zu zeigen. Sei also k < n. Dann
finden wir
µ
¶ µ
¶
n−1
n−1
(n − 1)!
(n − 1)!
+
+
=
(k − 1)!(n − k)! k!(n − k − 1)!
k−1
k
k(n − 1)! + (n − 1)!(n − k)
=
k!(n − k)!
µ ¶
n!
n
=
=
,
k!(n − k)!
k
wie behauptet.
q.e.d.
Satz 2.4: (Binomischer Lehrsatz)
Sei K Körper und n ∈ N0 beliebig. Dann gilt für alle a, b ∈ K die Identität
(a + b)n =
n µ ¶
X
n k n−k
a b
.
k
k=0
Beweis: durch vollständige Induktion über n.
(IA) n = 0: Wegen x0 = 1 für alle x ∈ K haben wir
0 µ ¶
X
0 k 0−k
a b
= 1 = (a + b)0 ,
k
k=0
d.h. (IA) gilt.
(IS) n → n + 1: (2.1) gelte für festes n ∈ N0 . Wir beachten
(a + b)n+1 = (a + b)n a + (a + b)n b
und formen die Terme getrennt um. Zunächst gilt
n µ ¶
n+1 µ ¶
X
n k n−k+1 X n k n−k+1
(a + b) b =
a b
=
a b
,
k
k
n
(IV )
k=0
k=0
(2.1)
3. DIE DEFINITION DER REELLEN ZAHLEN
19
¡ n ¢
wobei wir noch n+1
= 0 benutzt haben. Zur Behandlung des Terms (a + b)n a
verwenden wir noch die offensichtliche Beziehung
n
X
xk+1 =
k=0
n+1
X
xk
(Indexverschiebung)
k=1
für beliebige Summanden x1 , x2 , . . . , xn+1 ∈ K. Wir erhalten
¶
n µ ¶
n+1 µ
X
n k+1 n−k X
n
(a + b) a =
a b
=
ak bn−k+1 .
k
k−1
n
(IV )
k=0
k=1
Insgesamt ergibt sich also unter Beachtung von Hilfssatz 2.1:
(a + b)n+1
=
=
HS 2.1
=
=
n+1
Xµ
¶
n+1
X µn¶
n
ak bn−k+1 +
ak bn−k+1
k−1
k
k=1
k=0
µ ¶
n+1
X ·µ n ¶ µn¶¸
n 0 n+1
k n−k+1
+
a b
+
a b
k−1
k
0
k=1
µ
¶
n+1
X µn + 1¶
n + 1 0 n+1−0
k n+1−k
a b
+
a b
k
0
k=1
n+1
X µn + 1¶
ak bn+1−k ,
k
k=0
also Relation (2.1) für n + 1.
3
q.e.d.
Die Definition der reellen Zahlen
Wir haben die Notwendigkeit der Einführung der reellen Zahlen bereits erkannt, da
die Lösung von x2 −2 = 0 nicht rational ist, was übrigens schon in√
der Antike bekannt
war. Aus der Schule wissen wir, dass die positive Lösung x = 2 eine unendliche
Dezimalbruchdarstellung besitzt
√
2 = 1, 414213562 . . .
(bekannt sind die ersten 5 Millionen Nachkommastellen!) Wenn wir die Darstellung
an der n-ten Nachkommastelle abbrechen, haben wir
n
X
ak
xn :=
∈ Q für n = 1, 2, . . .
10k
k=0
mit Zahlen ak ∈ {0, 1, 2, . . . , 9} für alle k ∈ N0 (a0 = 1, a1 = 4, a2 = 1, . . . ).
(3.1)
20
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Definition 3.1: Eine Abbildung f : N → K vermöge n 7→ xn := f (n) heißt (Zahlenfolge {xn }n∈N (oder {xn }n , {xn }n=1,2,... ) im Körper K, kurz {xn }n∈N ⊂ K. Das
Element xn heißt n-tes Glied der Zahlenfolge. Für K = Q sprechen wir von rationalen (Zahlen-)Folgen.
Die Idee ist nun, die rationale Zahlenfolge
{xn }n∈N mit den in (3.1) erklärten
√
Gliedern mit der irrationalen Zahl 2 zu identifizieren. Dazu schätzen wir die
Streuung“ der Folge wie folgt ab: Für beliebiges N ∈ N seien m, n ≥ N und
”
o.B.d.A. n > m. Dann folgt
¯X
¯
¯ X
¯
m
X
¯ n ak
¯ n
ak ¯¯
ak ¯¯
¯
¯
−
|xn − xm |
=
= ¯
¯
10k
10k ¯
10k ¯
Satz 1.4 (c)
≤
l:=k−m−1
=
Satz 2.3
=
=
k=0
n
X
k=0
¯a ¯
¯ k ¯
¯ k¯ ≤
10
k=m+1
n−m−1
X ³
k=m+1
n
X
k=m+1
10
=
10k
n
³ 1 ´k−1
X
10
k=m+1
n−m−1
X ³
³ 1 ´m
1 ´l+m
1 ´l
=
10
10
10
l=0
l=0
1
³ 1 ´m 1 − ( )n−m
³ 1 ´m 1
10
≤
1
1
10
10
1 − 10
1 − 10
³ ´m
³ ´N
10 1
10 1
≤
.
9 10
9 10
(3.2)
Wir benötigen nun noch folgenden
Hilfssatz 3.1: Sei b ∈ Q positiv, so gilt:
(a) Ist b > 1, so existiert zu jedem K ∈ Q mit K > 0 ein n ∈ N mit der Eigenschaft
bn > K.
(b) Ist 0 < b < 1, so existiert zu jedem δ ∈ Q mit δ > 0 ein n ∈ N mit der
Eigenschaft bn < δ.
Beweis:
(a) Wegen b > 1 ist x := b − 1 > 0 richtig. Also ist die Bernoullische Ungleichung,
Satz 2.1, anwendbar: Für alle n ∈ N gilt
bn = (1 + x)n ≥ 1 + nx.
Nach dem Archimedischen Axiom (O3), welches ja in Q gilt, können wir nun
n ∈ N speziell so wählen, dass nx > K ausfällt. Dann folgt
bn ≥ 1 + nx > 1 + K > K.
3. DIE DEFINITION DER REELLEN ZAHLEN
21
(b) Wegen 0 < b < 1 ist b̂ := 1b > 1 richtig. Nach (a) existiert zu K̂ :=
mit
b̂n > K̂ ⇐⇒ bn = (b̂n )−1 < K̂ −1 = δ,
wie behauptet.
1
δ
ein n ∈ N
q.e.d.
Bemerkung: Der Beweis zeigt, dass die Aussage von Hilfssatz 3.1 richtig bleibt, wenn
wir Q durch einen beliebigen, archimedisch angeordneten Körper K ⊃ N ersetzen.
1
Wir wenden nun Hilfssatz 3.1 auf unsere Ungleichung (3.2) an mit b = 10
<1
9
und δ = 10 ε > 0 für beliebig gewähltes ε ∈ Q mit ε > 0. Es existiert also ein
N = N (ε) ∈ N mit
|xn − xm | ≤
10 ³ 1 ´N
10
< δ = ε für alle m, n ≥ N (ε).
9 10
9
(3.3)
Das bedeutet, die Streuung“ der Folge {xn }n wird für hinreichend große Glieder
”
beliebig klein.
Die Ungleichung (3.2) und damit auch (3.3) gilt übrigens für beliebige rationale
Folgen der Form (3.1) mit ak ∈ {0, 1, 2, . . . , 9}.
Definition 3.2: Eine rationale Zahlenfolge {xn }n heißt Cauchyfolge, wenn gilt: Zu
jedem ε ∈ Q mit ε > 0 existiert ein N = N (ε) ∈ N so, dass
|xn − xm | < ε
für alle m, n ≥ N (ε)
erfüllt ist.
Definition 3.3: Eine rationale Zahlenfolge {xn }n heißt Nullfolge, falls gilt: Zu jedem rationalen ε > 0 existiert ein N = N (ε) ∈ N so, dass
|xn | < ε
für alle n ≥ N (ε)
richtig ist. Man sagt auch, {xn }n konvergiert gegen 0.
Bemerkungen:
1. Jede Nullfolge ist auch Cauchyfolge: Wähle N = N (ε) ∈ N so, dass |xn | <
für alle n ≥ N (ε) gilt. Dann folgt für m, n ≥ N (ε):
|xn − xm | ≤ |xn | + |xm | <
ε
2
ε ε
+ = ε.
2 2
Die Umkehrung ist natürlich falsch, wie etwa das Beispiel {xn }n = {1 + ( 12 )n }n
zeigt.
22
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
2. Beispiel: { n1 }n ist Nullfolge. In der Tat existiert nach (O3) zu jedem rationalen
ε > 0 ein N = N (ε) ∈ N mit N ε > 1. Also folgt
¯1¯ 1
1
¯ ¯
< ε für alle n ≥ N (ε).
¯ ¯= ≤
n
n
N
Wir wollen nun die reellen Zahlen durch rationale Cauchyfolgen darstellen. Da
aber einige Folgen, wie wir sehen werden, die gleiche reelle Zahl darstellen, müssen
wir diese identifizieren im Sinne einer Äquivalenzrelation:
Definition 3.4: Eine Äquivalenzrelation auf einer beliebigen Menge M ist eine
Beziehung zwischen je zwei ihrer Elemente a, b ∈ M , in Zeichen a ∼ b, mit folgenden
Eigenschaften: Für jedes geordnete Paar (a, b) ∈ M × M steht fest, ob a ∼ b richtig
oder falsch ist, und es gelten:
(R) Reflexivität: Für alle a ∈ M gilt: a ∼ a.
(S) Symmetrie: Für alle a, b ∈ M gilt: a ∼ b =⇒ b ∼ a.
(T) Transitivität: Für alle a, b, c ∈ M gilt: a ∼ b und b ∼ c =⇒ a ∼ c.
Zwei Elemente a, b ∈ M nennen wir äquivalent, wenn a ∼ b gilt. Zu a ∈ M heißt
die Menge
©
ª
[a] := x ∈ M : x ∼ a
die zugehörige Äquivalenzklasse. Ein x ∈ [a] nennen wir dann Repräsentant der
Äquivalenzklasse [a].
Bemerkung: Jedes Element a ∈ M gehört zu genau einer Äquivalenzklasse. Wir
können also M als disjunkte Vereinigung ihrer Äquivalenzklassen darstellen:
[
M=
[a].
a∈M
Bevor wir auf der Menge aller rationalen Cauchyfolgen eine Äquivalenzrelation
erklären, geben wir noch ein paar einfache
Beispiele:
1. Die Gleichheitsrelation auf einem geordneten Körper K ist eine Äquivalenzrelation. Für je zwei Zahlen a, b ∈ K gilt nämlich entweder a = b oder a 6= b und
offenbar sind (R), (S) und (T) erfüllt.
2. Die Ungleichrelation (nicht reflexiv und transitiv), die Kleinerrelation (nicht
reflexiv und symmetrisch) und die Kleinergleichrelation (nicht symmetrisch)
sind z.B. keine Äquivalenzrelationen.
3. DIE DEFINITION DER REELLEN ZAHLEN
23
3. Auf der Menge G aller Geraden in der Ebene ist durch die Relation
g1 ∼ g2
:⇐⇒
g1 ist parallel zu g2
eine Äquivalenzrelation definiert. Die Äquivalenzklasse von g ∈ G sind die zu
g parallelen Geraden.
4. Für M = Z definiert
a∼b
:⇐⇒
a−b
∈Z
2
eine Äquivalenzrelation. Die zugehörigen Äquivalenzklassen sind die geraden
und die ungeraden Zahlen.
Satz 3.1: Auf der Menge F := {{xn }n ⊂ Q : {xn }n ist Cauchyfolge} der rationalen Cauchyfolgen ist durch
{xn }n ∼ {yn }n
:⇐⇒
{xn − yn }n ist Nullfolge
eine Äquivalenzrelation definiert. Zwei Folgen {xn }n , {yn }n sind also äquivalent,
wenn zu jedem rationalen ε > 0 ein N = N (ε) ∈ N existiert mit |xn − yn | < ε für
alle n ≥ N .
Beweis: Wir prüfen (R), (S) und (T) nach:
(R) Ist klar, denn {xn − xn }n = {0}n ist die konstante Nullfolge.
(S) Falls {xn }n ∼ {yn }n , dann existiert also zu jedem ε > 0 ein N (ε) ∈ N mit
|yn − xn | = |xn − yn | < ε für alle n ≥ N (ε).
Somit ist auch {yn − xn }n Nullfolge, d.h. {yn }n ∼ {xn }n .
(T) Seien {xn }n ∼ {yn }n und {yn }n ∼ {zn }n . Dann gibt es zu jedem rationalen
ε > 0 Zahlen N1 (ε), N2 (ε) ∈ N mit
ε
für alle n ≥ N1 (ε),
2
ε
|yn − zn | <
für alle n ≥ N2 (ε).
2
©
ª
Setzen wir nun N = N (ε) := max N1 (ε), N2 (ε) ∈ N, so folgt
|xn − yn | <
|xn − zn | ≤ |xn − yn | + |yn − zn | <
also {xn }n ∼ {zn }n , wie behauptet.
ε ε
+ = ε für alle n ≥ N (ε),
2 2
q.e.d.
24
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beispiel: Die Folgen {1 + ( 12 )n }n und {1}n sind z.B. äquivalent. Ebenso gilt { n1 }n ∼
{( 13 )n }n , da beide und somit auch ihre Differenz Nullfolgen sind.
Wir kommen nun zur zentralen
Definition 3.5: (Die reellen Zahlen)
Die Menge der reellen Zahlen R erklären wir als die Menge aller Äquivalenzklassen
rationaler Cauchyfolgen. Jede rationale Cauchyfolge {an }n definiert also genau eine
reelle Zahl α ∈ R durch
α := [an ] := [{an }n ].
Bemerkung: Wir nennen α ∈ R rational, falls ein Repräsentant {an }n von α existiert
mit an = pq (mit p ∈ Z, q ∈ N) für alle n ∈ N; sonst heißt α irrational.
Die konstanten rationalen Folgen sind also Repräsentanten der rationalen reellen Zahlen. In diesem Sinne gilt Q ⊂ R, wir schreiben kurz pq := [ pq ]. (Hier ist
übrigens auch die Äquivalenzklassenbildung enthalten, die wir bei der etwas laxen
Definition der rationalen Zahlen in § 1 unterschlagen haben: Ungekürzte“ rationale
”
p
Zahlen werden mit gekürzten“ identifiziert, denn { ap
aq }n mt a ∈ N und { q }n gehören
”
offenbar zur gleichen Äquivalenzklasse.)
Im folgenden zeigen wir über Definition 3.5, dass R ein archimedisch angeordneter
Körper ist, wobei wir natürlich noch die Rechenoperationen und den Begriff der
Positivität in R erklären müssen. Wir beginnen mit dem
Hilfssatz 3.2: Jede rationale Cauchyfolge {xn }n ist beschränkt, d.h. es existiert ein
rationales c > 0, so dass |xn | ≤ c für alle n ∈ N gilt.
Beweis: Gemäß Definition 3.2 gibt es speziell zu ε = 1 ein N ∈ N mit |xn − xm | < 1
für alle n, m ≥ N . Damit folgt insbesondere für m = N :
|xn | = |(xn − xN ) + xN | ≤ |xn − xN | + |xN | < |xN | + 1
für alle n ≥ N.
Setzen wir c := max{|x1 |, . . . , |xN −1 |, |xN | + 1}, so folgt die Behauptung.
q e.d.
Hilfssatz 3.3:
(a) Sind {an }n , {bn }n ⊂ Q Cauchyfolgen, so gilt dies auch für {an + bn }n und
{an · bn }n .
(b) Sind {xn }n , {yn }n ⊂ Q weitere Cauchyfolgen mit {an }n ∼ {xn }n und {bn }n ∼
{yn }n , dann folgt
{an + bn }n ∼ {xn + yn }n
und
{an · bn }n ∼ {xn · yn }n .
3. DIE DEFINITION DER REELLEN ZAHLEN
25
Beweis:
(a) Es existiert zu vorgegebenem δ > 0 ein N = N (δ) ∈ N, so dass
|an − am | < δ, |bn − bm | < δ
für alle m, n ≥ N (δ).
Wähle nun ε > 0 rational beliebig. Setzen wir N1 (ε) := N ( 2ε ), so folgt
|(an + bn ) − (am + bm )| ≤ |an − am | + |bn − bm | < ε für alle m, n ≥ N1 (ε),
also ist {an + bn }n Cauchyfolge.
Nach Hilfssatz 3.2 existiert ferner ein rationales c > 0 mit |an | ≤ c, |bn | ≤ c für
ε
alle n ∈ N. Setzen wir nun N2 (ε) := N ( 2c
), so folgt auch
|an bn − am bm | = |an (bn − bm ) + bm (an − am )|
≤ |an | |bn − bm | + |bm | |an − am |
³ε
ε´
+
= ε für alle m, n ≥ N2 (ε),
< c
2c 2c
d.h. {an bn }n ist Cauchyfolge.
(b) Zu zeigen ist, dass {(an + bn ) − (xn + yn )}n Nullfolge ist. Wegen |an − xn | < ε,
|bn − yn | < ε für beliebiges ε > 0 und alle n ≥ N (ε), erhalten wir
|(an + bn ) − (xn + yn )| ≤ |an − xn | + |xn − yn | < 2ε für alle n ≥ N (ε).
Da ε > 0 beliebig war, folgt die Behauptung (gehe über ε → 2ε ).
Um zu zeigen, dass auch {an bn − xn yn }n Nullfolge ist, beachten wir wieder
|an |, |yn | ≤ c für alle n ∈ N und mit geeignetem c > 0. Wir finden dann
|an bn − xn yn | = |an (bn − yn ) + yn (an − xn )|
≤ |an | |bn − yn | + |yn | |an − xn |
≤ 2εc für alle n ≥ N (ε),
wie behauptet.
q.e.d.
Bemerkung: Mit Hilfssatz 3.3 können wir bereits Addition und Multiplikation sowie
das Negative in R erklären; siehe Definition 3.7 unten. Um aber auch die Existenz der
Inversen zu sichern, benötigen wir noch einen weiteren Hilfssatz, für dessen Beweis
wir die folgende Definition benutzen:
Definition 3.6: Ist {xn }n ⊂ K eine Zahlenfolge und seien natürliche Zahlen 1 ≤
n1 < n2 < n3 < . . . gewählt (also {nk }k ⊂ N mit nk < nk+1 für alle k ∈ N). Dann
heißt
{xnk }k∈N = {xn1 , xn2 , xn3 , . . .}
Teilfolge von {xn }n .
26
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Hilfssatz 3.4: Es sei {xn }n ⊂ Q eine Cauchyfolge. Dann tritt genau einer der
folgenden Fälle ein:
(a) {xn }n ist Nullfolge.
(b) Typ A+ : Es existiert ein rationales δ > 0 und ein N ∈ N mit xn > δ für alle
n ≥ N.
(c) Typ A− : Es existiert ein rationales δ > 0 und ein N ∈ N mit −xn > δ für alle
n ≥ N.
Beweis: Wir zeigen, dass, falls (a) nicht gilt, genau einer der Fälle (b) oder (c)
eintreten muss. Sei also {xn }n keine Nullfolge. Dann gibt es also ein rationales δ > 0
und eine Teilfolge {xnk }k mit |xnk | ≥ 2δ für alle k ∈ N. Da {xn }n Cauchyfolge ist,
existiert andererseits ein N ∈ N mit |xn − xm | < δ für alle m, n ≥ N . Wählen wir
p ∈ N so groß, dass np ≥ N ist, so folgt speziell für m = np :
|xm − xnp | < δ
für alle m ≥ N.
Wir unterscheiden nun zwei Fälle:
(i) xnp ≥ 2δ: Dann folgt
xm = xnp + (xm − xnp ) ≥ 2δ − |xm − xnp | > 2δ − δ = δ
für alle m ≥ N,
also gehört {xn }n zum Typ A+ .
(ii) xnp ≤ −2δ: Dann haben wir
−xm = −xnp − (xm − xnp ) ≥ 2δ − |xm − xnp | > δ
für alle m ≥ N,
d.h. {xn }n gehört zum Typ A− .
q.e.d.
Die Definition der Inversen ergibt sich nun aus dem folgenden
Hilfssatz 3.5: Seien die Cauchyfolgen {xn }n , {yn }n ⊂ Q zueinander äquivalent und
keine Nullfolgen. Ferner gelte xn , yn 6= 0 für alle n ∈ N. Dann sind auch {x−1
n }n
−1
und {yn }n Cauchyfolgen, und es gilt
−1
{x−1
n }n ∼ {yn }n .
Beweis:
1. Nach Hilfssatz 3.4 existiert ein δ > 0, so dass |xn | > δ, |yn | > δ für alle n ∈ N
gilt. Damit folgt
¯ 1
1 ¯¯ ¯¯ xm − xn ¯¯
1
¯
−
¯
¯=¯
¯ < 2 |xn − xm | für alle m, n ≥ N.
xn xm
xn xm
δ
3. DIE DEFINITION DER REELLEN ZAHLEN
27
Da {xn }n Cauchyfolge ist, existiert zu beliebigem ε > 0 ein N̂ (ε) ≥ N , so dass
−1
|xn − xm | < εδ 2 richtig ist. Es folgt |x−1
n − xm | < ε für alle m, n ≥ N̂ (ε),
−1
d.h. {xn }n ist Cauchyfolge. Die entsprechenden Überlegungen zeigen, dass
auch {yn−1 }n Cauchyfolge ist.
2. Wegen
¯ 1
1 ¯¯ ¯¯ yn − xn ¯¯
1
¯
−
¯=¯
¯ < 2 |xn − yn | für alle n ≥ N,
¯
xn yn
x n yn
δ
−1
folgt aus der Nullfolgeneigenschaft von {xn − yn }n sofort {x−1
n }n ∼ {yn }n ,
wie behauptet.
q.e.d.
Bemerkung: Die Bedingung xn 6= 0 für alle Glieder einer Nicht-Nullfolge {xn }n
kann immer durch Übergang zu einer äquivalenten Folge {x̂n }n mittels eventueller
Addition von n1 zum n-ten Glied erreicht werden. Alternativ kann man das durch
Wegstreichen der (gemäß Hilfssatz 3.4) endlich vielen Glieder xn = 0 erreichen, denn:
Jede Teilfolge einer Cauchyfolge ist zu ihr äquivalent.
Definition 3.7: (Rechenoperationen in R)
• Für α = [an ] ∈ R, β = [bn ] ∈ R setzen wir
α + β := [an + bn ] ∈ R
α · β = αβ := [an bn ] ∈ R
(Summe),
(Produkt).
• Die neutralen Elemente der Addition und Multiplikation sind erklärt als
0 := [0] ∈ R,
1 := [1] ∈ R.
• Das Negative und das Inverse erklären wir wie folgt:
– Zu α = [an ] setzen wir −α := [−an ] ∈ R.
– Zu α = [an ] 6= 0 mit einem Repräsentanten {an }n , der an 6= 0 für alle
n ∈ N erfüllt, setzen wir α−1 := [a−1
n ].
Bemerkung: Wegen der Hilfssätze 3.3 und 3.5 sind alle Größen wohl definiert. Zum
Beispiel ist nach Hilfssatz 3.3 (a) mit {an }n und {bn }n auch {an bn }n eine rationale
Cauchyfolge, also [an bn ] ∈ R. Und nach Hilfssatz 3.3 (b) ist die Definition von αβ
unabhängig von der Wahl der Repräsentanten {an }n , {bn }n .
Definition 3.8: (Positivität in R)
Eine reelle Zahl α = [an ] heißt positiv, in Zeichen α > 0, falls {an }n zum Typ A+
aus Hilfssatz 3.4 gehört.
28
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Bemerkung: Man überzeugt sich leicht, dass auch Definition 3.8 von der Wahl des
jeweiligen Repräsentanten unabhängig ist.
Satz 3.2: (R, +, ·) mit den in Definition 3.5, 3.7 und 3.8 erklärten reellen Zahlen,
Rechenoperationen und Positivität ist ein archimedisch angeordneter Körper.
Beweis:
1. Dass R ein Körper ist, ist per Konstruktion offensichtlich. Z.B. ist 1 = [1] in
der Tat das neutrale Element der Multiplikation: Ist nämlich α = [an ], so folgt
{an · 1)}n ∼ {an }n , also gilt
α · 1 = [an · 1] = [an ] = α
für alle α ∈ R.
2. R ist auch angeordnet, denn nach Hilfssatz 3.4 und Definition 3.7 gilt für jede
reelle Zahl α genau eine der Beziehungen α > 0, α = 0 oder −α > 0, also
(O1). Und (O2) ist aus Definition 3.7 wieder offensichtlich.
Die in Definition 3.8 erklärte Positivität auf R impliziert also in der Tat eine
Ordnung. Mit ihr können wir wie in den Definitionen 1.3 und 1.4 die Größerbzw. Kleinerrelationen und den Betrag erklären.
3. Schließlich ist in R auch das Archimedische Axiom (O3) erfüllt: Sind nämlich
α = [ak ] > 0, β = [bk ] > 0 gewählt, so suchen wir n ∈ N mit nα > β.
Da α > 0 gilt, ist {ak }k vom Typ A+ , siehe Hilfssatz 3.4. Also gibt es ein
rationales δ > 0 und ein N ∈ N, so dass ak > δ für alle k ≥ N richtig
ist. Andererseits ist {bk }k nach Hilfssatz 3.2 beschränkt, d.h. es existiert ein
rationales c > 0 mit 0 < bk < c für alle k ≥ N .
Wir wählen nun n ∈ N mit n 2δ > c (beachte: Q ist archimedisch!) und berechnen
δ
δ
δ
δ
nak > nδ = n + n > c + n > bk + n
für alle k ≥ N.
2
2
2
2
Also ist die Folge {ck }k mit ck := nak − bk vom Typ A+ , d.h.
[n][ak ] − [bk ] = [nak − bk ] > 0
und somit ist nα − β > 0 bzw. nα > β, wie behauptet.
q.e.d.
4. FOLGEN UND REIHEN
4
29
Folgen und Reihen
Wir betrachten nun reelle Zahlenfolgen {xn }n ⊂ R, vgl. Definition 3.1. Analog zum
rationalen Fall erklären wir
Definition 4.1:
• Eine Folge {xn }n ⊂ R heißt Cauchyfolge, falls zu jedem (reellen) ε > 0 ein
N = N (ε) ∈ N existiert mit
|xn − xm | < ε
für alle m, n ≥ N (ε).
• Eine Folge {xn }n ⊂ R heißt Nullfolge, falls zu jedem ε > 0 ein N = N (ε) ∈ N
existiert mit
|xn | < ε für alle n ≥ N (ε).
Definition 4.2: Eine Folge {xn }n ⊂ R nennen wir konvergent gegen α ∈ R, wenn
{xn − α}n eine Nullfolge ist. Wir schreiben dann
lim xn = α
n→∞
oder
xn → α (n → ∞).
α heißt der Grenzwert der Folge {xn }n . Schließlich nennen wir eine Folge divergent,
wenn sie nicht konvergiert.
Bemerkungen:
1. ∞ ist das Symbol für den unendlich fernen Punkt oder einfach unendlich.
2. Offenbar gilt xn → α (n → ∞) genau dann, wenn |xn − α| → 0 (n → ∞).
3. Geometrische Deutung: Das Intervall (α − ε, α + ε) := {x ∈ R : |x − α| < ε}
für α ∈ R und ε > 0 enthält alle reellen Zahlen, die von α einen Abstand
kleiner ε haben. Wir nennen (α − ε, α + ε) eine ε-Umgebung von α. Eine Folge
konvergiert genau dann gegen α, wenn in jeder ε-Umgebung von α fast alle
Glieder der Folge liegen. Dabei bedeutet fast alle“, alle bis auf endlich viele
”
Ausnahmen.
4. Der Grenzwert einer Folge {xn }n ⊂ R ist eindeutig bestimmt. Gäbe es nämlich
α, β ∈ R mit xn → α und xn → β für n → ∞, dann finden wir zu beliebig
vorgegebenem ε > 0 ein N = N (ε) ∈ N mit |xn − α| < 2ε und |xn − β| < 2ε für
alle n ≥ N . Daher folgt insbesondere für n = N :
|α − β| ≤ |α − xN | + |β − xN | < ε.
Also muss α = β gelten.
30
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Aus der Konstruktion der reellen Zahlen folgt nun unmittelbar der
Hilfssatz 4.1: Ist {xn }n eine rationale Cauchyfolge und α := [xn ], so folgt xn →
α (n → ∞).
Beweis: Ist ε = [εn ] ∈ R mit ε > 0 beliebig, so haben wir zu zeigen, dass ein N (ε) > 0
existiert mit |xk − α| < ε für alle k ≥ N (ε).
Wegen ε > 0 gibt es per Definition ein δ > 0 und ein N̂ (ε) ∈ N, so dass εn > δ
für alle n ≥ N̂ (ε) gilt. Da nun {xn }n Cauchyfolge ist, gibt es ein N (ε) ≥ N̂ (ε), so
dass |xk − xn | < 2δ für alle k, n ≥ N (ε) gilt. Also ist {εn − |xk − xn |}n vom Typ A+
für jedes feste k ≥ N (ε). Und wegen |β| = [|yn |] für beliebiges β = [yn ] ∈ R erhalten
wir
¯
¯
£
¤
0 < εn − |xk − xn | = [εn ] − ¯[xk − xn ]¯ = ε − |xk − α|,
bzw. |xk − α| < ε für alle k ≥ N (ε).
q.e.d.
Wir werden übrigens in § 5 zeigen, dass auch jede reelle Cauchyfolge einen Grenzwert in R besitzt.
Beim Umgang mit Grenzwerten haben wir nun folgende Rechenregeln:
Satz 4.1: Seien {xn }n , {yn }n ⊂ R zwei Folgen mit xn → α, yn → β (n → ∞). Dann
gelten
(a) Es konvergieren auch {xn + yn }n und {xn yn }n mit
lim (xn + yn ) = α + β,
n→∞
lim (xn yn ) = αβ.
n→∞
(b) Falls zusätzlich β 6= 0 und yn 6= 0 für alle n ∈ N richtig ist, so konvergiert
auch { xynn }n mit
α
xn
= .
lim
n→∞ yn
β
(c) Gilt xn ≥ yn für alle n ≥ N mit einem N ∈ N, so ist auch α ≥ β erfüllt.
(d) Jede Teilfolge {xnk }k ⊂ {xn }n (vgl. Definition 3.6) konvergiert und es gilt
limk→∞ xnk = α.
Wir halten noch die folgende direkte Konsequenz aus Satz 4.1 (a) fest:
Folgerung 4.1: Konvergieren {xn }n , {yn }n ⊂ R und sind a, b ∈ R beliebig, so konvergiert auch {axn + byn }n mit
lim (axn + byn ) = a lim xn + b lim yn .
n→∞
n→∞
n→∞
4. FOLGEN UND REIHEN
31
Beweis von Satz 4.1: (a) ist offensichtlich, (c) und (d) sind Übungsaufgaben. Wir
zeigen (b): Wegen |β| > 0 gibt es ein N ∈ N mit |yn − β| < |β|
2 für alle n ≥ N . Wir
|β|
folgern |yn | ≥ |β| − |yn − β| > 2 > 0 und somit
¯x
¯
2
1
¯ n α¯
− ¯=
|βxn − αyn | ≤
|βxn − αyn | für n ≥ N.
¯
yn
β
|yn | |β|
|β|2
Nach (a) bzw. Folgerung 4.1 konvergiert βxn − αyn → βα − αβ = 0 (n → ∞), also
ist { xynn − αβ }n Nullfolge, wie behauptet.
q.e.d.
Beispiele:
1. Die konstante Folge {a}n = {a, a, a, . . .} für ein a ∈ R konvergiert trivialerweise
gegen a.
2. limn→∞
3n
n+1
= 3. Denn es gilt für beliebiges ε > 0:
¯ ¯ 3n − 3(n + 1) ¯
¯ 3n
3
¯ ¯
¯
¯
− 3¯ = ¯
< ε,
¯
¯=
n+1
n+1
n+1
falls n ≥ N (ε) mit N (ε) ≥ 3ε .
3. limn→∞ 2nn = 0. Mit vollständiger Induktion zeigt man nämlich 2n ≥ n2 für
alle n ≥ 4 (Übungsaufgabe). Es folgt 21n ≤ n12 bzw. 2nn ≤ n1 und somit
¯n
¯
n 1o
n
1
¯
¯
.
¯ n − 0¯ = n ≤ < ε für n ≥ N > max 3,
2
2
n
ε
4. Die Folge {xn }n = {(−1)n }n konvergiert nicht. Sonst müsste z.B. für ε = 1 ein
N ∈ N existieren mit |xn − α| < 1 für alle n ≥ N , wobei α ∈ R der Grenzwert
der Folge sei. Insbesondere für xn und xn+1 mit n ≥ N hätten wir dann den
Widerspruch
2 = |xn − xn+1 | ≤ |xn − α| + |xn+1 − α| < 2.
Also ist {(−1)n }n divergent.
5. limn→∞
5n3 +8n2
n3 −4
= 5. Wir kürzen
5 + 8 n1
5n3 + 8n2
=
.
n3 − 4
1 − n43
Da { n1 }n Nullfolge ist, konvergieren nach Satz 4.1 (a) und Folgerung 4.1 auch
{5 + 8 n1 }n und {1 − 4 n13 }n , nämlich gegen 5 bzw. 1. Satz 4.1 (b) liefert dann
lim (5 + 8 n1 )
5n3 + 8n2
5
n→∞
lim
=
= = 5.
4
3
n→∞ n − 4
1
lim (1 − n3 )
n→∞
32
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Bevor wir weitere Beispiele untersuchen benötigen wir noch die folgende
Definition 4.3: Eine Folge {xn }n ⊂ R heißt nach oben (bzw. unten) beschränkt,
falls ein c ∈ R existiert mit
xn ≤ c
(bzw. xn ≥ c)
für alle n ∈ N.
Falls sogar |xn | ≤ c für alle n ∈ N gilt, heißt die Folge beschränkt.
Bemerkung: Eine Folge ist genau dann beschränkt, wenn sie nach oben und unten
beschränkt ist.
Satz 4.2: Jede konvergente Folge {xn }n ⊂ R ist beschränkt.
Beweis: Zu ε = 1 existiert ein N ∈ N mit |xn − α| < 1 für alle n ≥ N , wobei
α = limn→∞ xn sei. Wir haben also
|xn | ≤ |xn − α| + |α| < 1 + |α| für alle n ≥ N.
Also ist {xn }n beschränkt mit c := max{1 + |α|, |x1 |, . . . , |xN −1 |} > 0.
q.e.d.
Bemerkung: Die Umkehrung des Satzes gilt natürlich nicht; z.B. ist {(−1)n }n offenbar beschränkt aber nach obigem Beispiel 4 nicht konvergent.
Beispiele:
1. Fibonacci-Zahlen: f1 := 0, f2 := 1 und rekursiv fn := fn−1 + fn−2 . Das gibt
{fn }n = {0, 1, 1, 2, 3, 5, 8, . . .}.
Die Folge {fn }n ist unbeschränkt: Durch vollständige Induktion zeigt man
nämlich fn ≥ n − 2 für alle n ∈ N, und {n − 2}n ist offensichtlich nicht
nach oben beschränkt. Nach Satz 4.2 ist die Folge der Fibonacci-Zahlen also
divergent.
2. Die Folge {xn }n für ein x ∈ R. Das Konvergenzverhalten hängt von x ab, wir
unterscheiden vier Fälle.
(i) Für |x| < 1 gilt limn→∞ xn = 0, da nach Hilfssatz 3.1 (b) – der nun
natürlich auch in R gilt – zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit
|x|N < ε und folglich
|xn − 0| = |x|n ≤ |x|N < ε für alle n ≥ N (ε).
(ii) Für x = 1 haben wir die konstante Folge {1n }n = {1}n mit limn→∞ 1n =
1.
(iii) Für x = −1 haben wir die divergente Folge {(−1)n }n .
4. FOLGEN UND REIHEN
33
(iv) Für |x| > 1 ist {xn }n unbeschränkt nach Hilfssatz 3.1 (a), also divergent.
Definition 4.4: (Bestimmte Divergenz)
Eine Folge {xn }n ⊂ R heißt bestimmt divergent gegen +∞ (bzw. gegen −∞), wenn
zu jedem c ∈ R ein N ∈ N existiert, so dass
xn > c
(bzw. xn < c)
für alle n ≥ N
richtig ist. Wir schreiben dann
lim xn = +∞
n→∞
(bzw. lim xn = −∞).
n→∞
Bemerkung: Offensichtlich divergiert {xn }n genau dann bestimmt gegen +∞, wenn
{−xn }n bestimmt gegen −∞ divergiert.
Beispiele:
1. Die Folge {n}n divergiert bestimmt gegen +∞. Das erklärt auch die Schreibweise limn→∞ , die nun eigentlich genauer limn→+∞ lauten müsste.
2. Nach obigem Beispiel divergiert die Folge der Fibonacci-Zahlen bestimmt gegen +∞.
3. Für b > 1 divergiert {bn }n bestimmt gegen +∞, vgl. Hilfssatz 3.1 (a).
4. Die Folge {(−1)n n}n ist divergent, aber nicht bestimmt divergent. Ist nämlich
(−1)n n > c für ein n ∈ N und ein c ≥ 12 , so folgt für das (n + 1)-te Glied der
Folge:
(−1)n+1 (n + 1) = −(−1)n n − (−1)n < −c + 1 ≤ c.
Bemerkung: Mit den Symbolen +∞, −∞ wird R zu der erweiterten Zahlengeraden
R := {−∞} ∪ R ∪ {+∞}, die wir gemäß−∞ < x < +∞ für alle x ∈ R anordnen
können. Allerdings können wir ±∞ nicht als reelle Zahlen auffassen, d.h. R ist kein
Körper, wie auch immer Addition und Multiplikation in R erklärt werden.
Satz 4.3:
(a) Es sei {xn }n ⊂ R bestimmt divergent gegen +∞ oder −∞. Dann gilt xn 6= 0
für alle n ≥ N mit einem N ∈ N, und {x−1
n }n≥N ist eine Nullfolge.
(b) Es sei {xn }n Nullfolge mit xn > 0 (bzw. xn < 0) für alle n ≥ N . Dann ist
{x−1
n }n≥N bestimmt divergent gegen +∞ (bzw. gegen −∞).
34
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis: Wir zeigen nur (a) und überlassen (b) zur Übung.
Sei {xn }n bestimmt divergent gegen +∞. Dann existiert zu beliebigem ε > 0 ein
N (ε) ∈ N mit xn > 1ε für alle n ≥ N (ε). Also folgt
−1
0 < x−1
n < ε bzw. |xn | < ε für alle n ≥ N (ε),
d.h. {x−1
n }n ist Nullfolge. Gilt schließlich limn→∞ xn = −∞, so gehen wir zur negativen Folge {−xn }n über.
q.e.d.
Definition 4.5: (Unendliche Reihen)
Sei {xk }k ⊂ R eine Folge, so erklären wir die zugehörigen Partialsummen
sn :=
n
X
xk = x1 + x2 + . . . + xn .
k=1
Die Folge {sn }n ⊂ R der Partialsummen heißt dann (unendliche) Reihe. Konvergiert
{sn }n , so sagen wir, dass die zugehörige Reihe konvergiert und schreiben für den
Grenzwert
¶
µX
n
∞
X
xk .
xk := lim sn = lim
k=1
n→∞
n→∞
k=1
Bemerkungen:
P
1. Etwas lax schreiben wir meist auch ∞
k=1 xk für die Folge der Partialsummen,
also als Symbol für die Reihe selbst (unabhängig von deren Konvergenz).
2. Eine Reihe ist also eine spezielle Folge, nämlich die von Partialsummen. Umgekehrt kann man jede Folge {yn }n auch durch eine Reihe darstellen, denn es
gilt
n
X
yn = y1 +
(yk − yk−1 )
(Teleskopsumme).
k=2
3. Aus Folgerung 4.1 angewendet
auf P
die Folge der Partialsummen ergibt sich
P∞
sofort:PKonvergieren k=1 xk und ∞
k=1 yk und sind a, b ∈ R, so konvergiert
auch ∞
(ax
+
by
),
und
es
gilt
k
k
k=1
∞
∞
∞
X
X
X
(axk + byk ) = a
xk + b
yk .
k=1
k=1
k=1
5. VOLLSTÄNDIGKEIT REELLER ZAHLEN
35
Beispiele:
1. Es gilt limn→∞
n
n+1
= limn→∞
rerseits
yk − yk−1 =
1
1
1+ n
= 1. Setzen wir yn =
n
n+1 ,
k
k−1
k 2 − (k 2 − 1)
1
−
=
=
k+1
k
k(k + 1)
k(k + 1)
so folgt ande-
für k ≥ 2
und somit
n
n
n
k=2
k=2
k=1
X
X
n
1 X
1
1
= yn = y1 +
=
.
(yk − yk−1 ) = +
n+1
2
k(k + 1)
k(k + 1)
Wir erhalten also
∞
X
k=1
n
X
1
n
1
= lim
= lim
= 1.
k(k + 1) n→∞
k(k + 1) n→∞ n + 1
k=1
2. Unendliche geometrische Reihe:
einem der obigen Beispiele:
∞
X
k=0
5
xk = lim
n→∞
n
X
∞
P
xk . Für |x| < 1 gilt nach Satz 2.3 und
k=0
¢
1 − xn+1
1 ¡
1
=
1 − x lim xn =
. (4.1)
n→∞ 1 − x
n→∞
1−x
1−x
xk = lim
k=0
Vollständigkeit reeller Zahlen
Wir widmen uns nun wieder dem Studium der reellen Zahlen. Insbesondere werden
wir die sogenannte Vollständigkeit“ von R beweisen, die der eigentliche Grund für
”
die Konstruktion von R war und die reellen Zahlen gegenüber den rationalen Zahlen
auszeichnet. Aus der Vollständigkeit folgt auch die Lösbarkeit der Gleichung xs = c
in R, wobei s ∈ N beliebig und c ∈ R positiv ist. Wir beginnen mit der
Definition 5.1: Eine Menge M ⊂ R heißt dicht in R, falls es zu jedem α ∈ R eine
Folge {an }n ⊂ M so gibt, dass lim an = α gilt.
n→∞
Bemerkung: Ist M ⊂ R dicht in R, so lässt sich jede reelle Zahl also beliebig gut
durch Elemente aus M approximieren. Natürlich liegt R selbst dicht in R. Erstes
Hauptziel des Paragraphen ist der folgende
Satz 5.1: Q liegt dicht in R.
Für den Beweis benötigen wir noch die anschließende einfache Folgerung des
Archimedischen Axioms:
36
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Hilfssatz 5.1: Zu jeder Zahl x ∈ R existiert genau ein ν ∈ Z, so dass ν ≤ x < ν + 1
richtig ist.
Beweis: Übungsaufgabe!
Beweis von Satz 5.1: Zu gegebenem x ∈ R konstruieren wir mittels vollständiger
Induktion eine Folge {xn }n ⊂ Q von Dezimalbrüchen
xn =
n
X
ak · 10−k ∈ Q mit a0 ∈ Z,
ak ∈ {0, 1, . . . , 9} für k ∈ N,
k=0
so dass xn → x (n → ∞) erfüllt ist.
1. Sei zunächst 0 ≤ x < 1 richtig. Wir behaupten, dass dann eine Folge {ak }k ⊂
{0, 1, . . . , 9} und eine Nullfolge {ξn }n ⊂ R so existieren, dass für alle n ∈ N
gilt
n
X
ak · 10−k + ξn und 0 ≤ ξn < 10−n .
(5.1)
x=
k=1
Offenbar folgt daraus die Behauptung mit a0 = 0.
(IA) n = 1. Wegen 0 ≤ x · 10 < 10 und Hilfssatz 5.1 existiert ein a1 ∈
{0, 1, 2, . . . , 9}, so dass a1 ≤ x·10 < a1 +1 richtig ist. Mit ξ1 := x−a1 ·10−1
haben wir dann
x = a1 · 10−1 + ξ1
und 0 ≤ ξ1 < 10−1 .
(IS) n → n + 1: Angenommen wir haben die Darstellung (5.1) für ein n ∈ N.
Dann ist 0 ≤ ξn ·10n+1 < 10 richtig und wieder nach Hilfssatz 5.1 existiert
ein an+1 ∈ {0, 1, . . . , 9} mit an+1 ≤ ξn · 10n+1 < an+1 + 1. Setzen wir noch
ξn+1 := ξn − an+1 · 10−(n+1) , so finden wir
(IV )
x =
n
X
k=1
ak 10−k + ξn =
n+1
X
ak · 10−k + ξn+1
k=1
und 0 ≤ ξn+1 < 10−(n+1) , wie behauptet.
2. Sei nun x ∈ R beliebig. Nach Hilfssatz 5.1 existiert ein ν ∈ Z mit ν ≤ x < ν +1.
Dann gilt für y :=
Px − ν natürlich 0 ≤ y < 1 und nach 1) existiert eine Folge
{yn }n mit yn = nk=1 ak · 10−k , ak ∈ {0, 1, . . . , 9}, so dass yn → y (n → ∞)
richtig ist. Also hat xn := ν + yn die gesuchte Form mit a0 := ν ∈ Z, und es
gilt xn → x (n → ∞), wie behauptet.
q.e.d.
5. VOLLSTÄNDIGKEIT REELLER ZAHLEN
37
Bemerkung: Der Beweis von Satz 5.1 bestätigt übrigens unsere Vorstellung, dass
sich jede reelle Zahl als (unendlicher) Dezimalbruch darstellen lässt. Wir haben hier
nämlich
∞
X
x = lim
ak · 10−k = a0 , a1 a2 a3 . . .
n→∞
k=0
gezeigt. Allerdings ist diese Darstellung nicht eindeutig, denn z.B. lässt sich die Zahl
1 sowohl als 1, 00000 . . . schreiben, als auch als
0, 999999 . . . =
∞
X
9 · 10−n = 9 ·
n=1
∞ ³
X
9
1 ´n
(4.1)
−9 =
1 − 9 = 1.
10
1
−
10
n=0
Das zentrale Ergebnis dieses Paragraphen (und eigentlich des gesamten Kapitels)
ist nun der folgende
Satz 5.2: (Cauchysches Konvergenzkriterium)
Eine Folge {xn }n ⊂ R ist genau dann konvergent, wenn {xn }n eine Cauchyfolge ist.
Definition 5.2: Ein bewerteter Körper K heißt vollständig, wenn jede Cauchyfolge
{xn }n ⊂ K einen Grenzwert x ∈ K besitzt.
Bemerkungen:
1. Obiger Satz enthält also die Aussage, dass R vollständig ist; genau das ist die
zusätzliche Eigenschaft von R gegenüber Q.
2. Wir haben Cauchyfolgen und Konvergenz bisher nur in R erklärt. Hierzu
benötigt man aber nur einen Abstandsbegriff“, der in bewerteten Körpern
”
erklärt ist; vgl. Satz 1.4 und die anschließende Bemerkung. Insbesondere ist
Definition 5.2 in C sinnvoll, vgl. § 7.
Beweis von Satz 5.2:
• ⇒“: Sei {xn }n konvergent mit Grenzwert x ∈ R. Dann existiert zu jedem
”
ε > 0 ein N = N (ε) ∈ N mit |xn − x| < 2ε für alle n ≥ N . Folglich haben wir
|xn − xm | ≤ |xn − x| + |xm − x| < ε für alle m, n ≥ N (ε),
d.h. {xn }n ist Cauchyfolge.
• ⇐“: Sei nun {xn }n Cauchyfolge. Dann existiert zu beliebigem ε > 0 ein
”
N = N (ε) ∈ N, so dass |xn − xm | < 4ε für alle m, n ≥ N (ε). Zu jedem xn ,
n ∈ N, existiert nach Satz 5.1 ein an ∈ Q mit |xn − an | < 2ε . Somit folgt
|an − am | ≤ |an − xn | + |xn − xm | + |xm − am | < ε für alle m, n ≥ N (ε).
38
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Also ist {an }n eine rationale Cauchyfolge und nach Hilfssatz 4.1 gilt an →
x (n → ∞) mit der reellen Zahl x := [an ]. Wählen wir N̂ (ε) ≥ N (ε) so groß,
dass |x − an | < 2ε für alle n ≥ N̂ (ε), so erhalten wir schließlich
|x − xn | ≤ |x − an | + |an − xn | <
ε ε
+ = ε für alle n ≥ N̂ (ε),
2 2
d.h. die Folge {xn }n konvergiert gegen x.
q.e.d.
So kompakt sich das Cauchysche Konvergenzkriterium auch formulieren lässt, so
ist es doch etwas unanschaulich. Genau umgekehrt verhält es sich mit dem folgenden,
praktischen Intervallschachtelungs-Prinzip: Zunächst benötigen wir aber noch die
Definition 5.3: (Intervalle reeller Zahlen)
Zu a, b ∈ R mit a < b erklären wir:
• offenes Intervall:
(a, b) := {x ∈ R : a < x < b}.
• abgeschlossenes Intervall:
[a, b] := {x ∈ R : a ≤ x ≤ b}.
• halboffene Intervalle:
(a, b] := {x ∈ R : a < x ≤ b},
[a, b) := {x ∈ R : a ≤ x < b}.
Bemerkungen:
1. Es kann auch a = −∞ und b = +∞ gewählt werden, wenn der jeweilige
Endpunkt nicht zum Intervall gehört.
2. Mit |I| = diam(I) := b − a > 0 bezeichnen wie den Durchmesser oder Länge
des abgeschlossenen Intervalls I = [a, b]. Offensichtlich gilt für beliebige x, x0 ∈
I = [a, b] dann |x − x0 | ≤ |I|.
Satz 5.3: (Intervallschachtelungsprinzip)
Es sei I1 ⊃ I2 ⊃ . . . ⊃ In ⊃ In+1 ⊃ . . . eine absteigende Folge von abgeschlossenen
Intervallen in R mit der Eigenschaft
lim |In | = 0.
n→∞
Dann gibt es genau eine reelle Zahl x mit x ∈ In für alle n ∈ N, d.h. {x} =
(5.2)
T
In .
n∈N
Bemerkung: Die Aussage scheint offensichtlich: Eine Folge von Intervallen, deren
Durchmesser gegen 0 geht, zieht sich auf einen Punkt zusammen. Jedoch wird die
Aussage in Q falsch, da der gemeinsame Punkt dann keine rationale Zahl sein muss.
5. VOLLSTÄNDIGKEIT REELLER ZAHLEN
39
Beweis von Satz 5.3: Schreiben wir In = [an , bn ], so besagt Formel (5.2), dass zu
jedem ε > 0 ein N = N (ε) ∈ N existiert mit 0 ≤ bn − an < ε für alle n ≥ N (ε). Sind
nun m, n ≥ N , so folgt am , an ∈ IN und somit
|an − am | ≤ |IN | = bN − aN < ε
für alle m, n ≥ N (ε),
d.h. {an }n ist eine Cauchyfolge. Nach Satz 5.2 existiert daher ein Punkt x ∈ R mit
limn→∞ an = x.
Nun gilt am ≤ an ≤ bm für beliebiges m ∈ N und alle n ≥ m. Gemäß Satz 4.1 (c)
liefert der Grenzübergang n → ∞ nun am ≤ x ≤Tbm bzw. x ∈ Im für alle m ∈ N.
Gäbe es schließlich ein weiteres Element x0 ∈ n∈N In , so hätten wir für beliebiges
ε > 0:
|x − x0 | ≤ bN − aN < ε
mit dem oben bestimmten N = N (ε). Also folgt x = x0 .
q.e.d.
Bemerkung: Die Konstruktion
zeigt, dass für eine Intervallschachtelung mit In =
T
[an , bn ] und {x} =
In gilt
n∈N
lim an = x = lim bn .
n→∞
n→∞
Satz 5.4: Sei c > 0 eine beliebige reelle Zahl. Dann besitzt die Gleichung xs = c für
jedes s ∈ N genau eine positive Lösung x ∈ R.
Beweis:
• Eindeutigkeit: Sind x1 , x2 ∈ R zwei positive Lösungen von xs1 = xs2 = c, so
folgt
s−1
X
0 = xs1 − xs2 = (x1 − x2 )
xj1 x2s−j−1 ,
j=0
also x1 = x2 .
• Existenz:
(i) Sei zunächst c ∈ (0, 1). Wir konstruieren induktiv eine Intervallschachtelung I1 ⊃ I2 ⊃ . . ., für die gilt:
³ 1 ´n−1
, asn ≤ c ≤ bsn für alle n ∈ N. (5.3)
In := [an , bn ], |In | =
2
Setzen wir I1 = [a1 , b1 ] := [0, 1], so gilt (5.3) offenbar für n = 1. Haben
wir die gesuchte Schachtelung bis zu einem n ∈ N konstruiert, so setzen
wir xn := 12 (an + bn ) ∈ In und erklären
(
[an , xn ], falls xsn ≥ c
.
In+1 = [an+1 , bn+1 ] :=
[xn , bn ], falls xsn < c
40
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Dann ist offenbar In+1 ⊂ In richtig, und wir haben |In+1 | = 12 ( 21 )n−1 =
( 12 )n sowie asn+1 ≤ c ≤ bsn+1 , also (5.3) für n + 1.
T
Nach Satz 5.3 existiert nun genau ein x ∈ n∈N In , d.h. an ≤ x ≤ bn und
somit asn ≤ xs ≤ bsn für alle n ∈ N. Nun liefert auch Jn := [asn , bsn ] eine
Intervallschachtelung, denn offenbar gilt Jn+1 ⊂ Jn für alle n ∈ N und
wir berechnen
s−1
³ 1 ´n−1
X
→ 0 (n → ∞).
|Jn | = bsn − asn = (bn − an )
ajn bs−j−1
≤
s
n
2
j=0
T
s
Da aber nun c, x ∈ n∈N Jn richtig ist, liefert Satz 5.3 xs = c.
(ii) Für c = 1 löst offenbar x = 1 die Gleichung xs = c. Für c > 1 ist
c̃ := c−1 ∈ (0, 1) erfüllt. Mit der in (i) konstruierten positiven Lösung x̃
der Gleichung x̃s = c̃, löst dann x := x̃−1 > 0 die Gleichung xs = c.
q.e.d.
Definition 5.4: Die in Satz 5.4 konstruierte eindeutige Lösung x > 0 von xs = c
√
heißt s-te Wurzel von c > 0, und wir schreiben s c. Ist q = rs ∈ Q (r ∈ Z, s ∈ N)
beliebig, so setzen wir für die q-te Potenz von c > 0:
√
r
cq = c s := ( s c)r .
Bemerkung: Für alle x, y > 0 und p, q ∈ Q gelten die Rechenregeln
xp y p = (xy)p ,
xp xq = xp+q ,
(xp )q = xpq .
Ebenfalls mittels Intervallschachtelung beweisen wir den fundamentalen
Satz 5.5: (Bolzano–Weierstraß)
Jede beschränkte Folge {xn }n ⊂ R besitzt eine konvergente Teilfolge.
Beweis: Da {xn }n beschränkt ist, existiert ein c > 0 mit −c ≤ xn ≤ c für alle n ∈ N.
Wir konstruieren nun eine Intervallschachtelung I1 ⊃ I2 ⊃ . . . mit den Eigenschaften
• Ik enthält unendlich viele Glieder der Folge {xn }n ,
• |Ik | = 2c · ( 12 )k−1 für alle k ∈ N.
Wir starten dazu mit I1 := [−c, c] und definieren im k-ten Schritt Ik+1 wie folgt: Ist
Ik = [ak , bk ], so setzen wir yk := 12 (ak + bk ) und erklären


 [ak , yk ], falls [ak , yk ] unendlich viele Glieder
von {xn }n enthält
Ik+1 = [ak+1 , bk+1 ] :=
.


[yk , bk ], sonst
Wir konstruieren nun eine Teilfolge {xnk }k mit xnk ∈ Ik für alle k ∈ N induktiv wie
folgt:
5. VOLLSTÄNDIGKEIT REELLER ZAHLEN
41
• Für k = 1 setzen wir n1 = 1, also xn1 = x1 ∈ I1 .
• Ist xnk ∈ Ik für ein k ∈ N, so existiert per Konstruktion ein nk+1 > nk mit
xnk+1 ∈ Ik+1 (da in Ik+1 wieder unendlich viele Glieder von {xn }n liegen).
Wir haben also ak ≤ xnk ≤ bk für alle k ∈ N. Nach Satz 5.3 und der anschließenden
Bemerkung liefert der Grenzübergang k → ∞:
x = lim ak ≤ lim xnk ≤ lim bk = x
k→∞
k→∞
k→∞
mit einem x ∈ R. Also konvergiert {xnk }k gegen x, wie behauptet.
q.e.d.
Definition 5.5: x ∈ R heißt Häufungswert einer Folge {xn }n , wenn es eine Teilfolge {xnk }k gibt mit lim xnk = x.
k→∞
Satz 5.5 besagt also: Jede beschränkte Folge hat einen Häufungswert.
Beispiele:
1. {(−1)n }n besitzt die Häufungswerte −1 und +1.
2. {n}n besitzt keine Häufungswerte, da jede Teilfolge unbeschränkt und damit
nach Satz 4.2 divergent ist.
3. Es gibt aber auch unbeschränkte Folgen mit Häufungswerten, z.B. hat {[1 +
(−1)n ]n}n den Häufungswert 0, da gilt x2k−1 = 0 für alle k ∈ N.
Definition 5.6: Eine Folge {xn }n ⊂ R heißt
(i) monoton wachsend (bzw. fallend), falls xn ≤ xn+1 (bzw. xn ≥ xn+1 ) für alle
n ∈ N gilt.
(ii) streng monoton wachsend (bzw. fallend), falls xn < xn+1 (bzw. xn > xn+1 )
für alle n ∈ N richtig ist.
Bemerkung: Die Sprechweise ist leider nicht eindeutig. In der Literatur wird häufig
z.B. für monoton wachsende Folge auch schwach monoton wachsende“ oder mo”
”
noton nicht fallende“ Folge geschrieben.
Satz 5.6: (Monotone Konvergenz)
Jede beschränkte monotone Folge {xn }n ⊂ R ist konvergent.
Beweis: Sei {xn }n monoton fallend. Da {xn }n beschränkt ist, existiert nach dem
Satz von Bolzano-Weierstraß eine konvergente Teilfolge {xnk }k . Aus der Relation
xnk ≥ xnl für alle k ≤ l erhalten wir nach Grenzübergang l → ∞ die Ungleichung
xnk ≥ x := lim xnl
l→∞
für alle k ∈ N.
42
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Zu beliebigem ε > 0 gibt es nun ein k0 = k0 (ε) ∈ N mit |xnk − x| < ε für alle
k ≥ k0 (ε). Wir setzen N = N (ε) := nk0 (ε). Für jedes n ≥ N existiert dann ein
k ≥ k0 mit nk ≤ n < nk+1 . Die Monotonie liefert nun
xnk ≥ xn ≥ xnk+1 ≥ x,
bzw. xnk − x ≥ xn − x ≥ 0. Zusammen mit der Konvergenz der Teilfolge {xnk }k
folgt
|xn − x| ≤ |xnk − x| < ε für alle n ≥ N (ε),
wie behauptet. Der Fall einer monoton wachsenden Folge {xn }n ergibt sich nun
durch Übergang zur monoton fallenden Folge {−xn }n .
q.e.d.
Bemerkung: Satz 5.6 liefert ein handliches Konvergenzkriterium. Z.B. ist jeder Dezimalbruch monoton wachsend.; vgl. Satz 5.1. Übrigens ist jede monoton wachsende
Folge nach unten beschränkt, nämlich durch x1 . Entsprechend ist jede monoton
fallende Folge nach oben durch x1 beschränkt.
6
Punktmengen in R
Ist M eine Menge mit endlich vielen Elementen, so kann man diese mittels 1, 2, . . . , n
durchnummerieren: M = {a1 , a2 , . . . , an } mit n = Anzahl der Elemente. Wir sagen,
M ist abzählbar. Um die Situation für unendliche Mengen zu untersuchen, erinnern
wir zunächst an den Begriff einer Bijektion oder bijektiven Abbildung f : M → N
zwischen zwei Mengen M, N :
• f ist surjektiv, falls zu jedem y ∈ N ein x ∈ M mit f (x) = y existiert,
d.h. f (M ) = N .
• f ist injektiv, falls für x1 , x2 ∈ M mit x1 6= x2 gilt f (x1 ) 6= f (x2 ).
• f ist bijektiv, wenn f surjektiv und injektiv ist.
Definition 6.1: Eine unendliche Menge M heißt (unendlich) abzählbar, wenn eine
Bijektion f : N → M existiert. Anderenfalls heißt M überabzählbar.
Bemerkungen:
1. Ist M unendlich abzählbar, so gibt es also eine Folge {xn }n , so dass M = {xn :
n ∈ N}. Wir schreiben auch kurz (und etwas unexakt) M = {xn }n .
2. Zwei Mengen M, N , für die eine Bijektion f : M → N existiert, heißen
gleichmächtig. Eine unendlich abzählbare Menge ist also gleichmächtig zu den
natürlichen Zahlen.
6. PUNKTMENGEN IN R
43
Beispiele:
1. Die Menge N der natürlichen Zahlen ist abzählbar mit der identischen Abbildung f : N → N, n 7→ n.
2. Die ganzen Zahlen Z sind abzählbar mit der Bijektion
( 1
falls n gerade ist
2 n,
f (n) :=
,
1
2 (1 − n), falls n ungerade ist
n ∈ N.
3. Sind M und N abzählbar, so ist auch M ∪ N abzählbar. Deutlich allgemeiner
gilt der folgende
Satz 6.1: Die Vereinigung abzählbar vieler abzählbarer Mengen Mn , n ∈ N, ist
abzählbar.
Beweis: Wir schreiben Mn = {xnm : m ∈ N} für n ∈ N. Die Elemente der Vereinigungsmenge
[
Mn = {xnm : m, n ∈ N}
n∈N
können wir wie folgt abzählen:
M1 :
M2 :
M3 :
M4 :
..
.
x11 →
.
x21
↓ %
x31
.
x41 →
..
.
x12
x13 → x14
.
x23
x24
.
%
x33
x34
%
x43
x44
..
..
.
.
...
%
x22
x32
x42
..
.
...
... ,
...
also mit der Abzählung y1 := x11 , y2 := x12 , y3 := x21 , y4 := x31 , . . . Eventuell
doppelt auftretende Elemente werden bei der Abzählung einfach übergangen.
q.e.d.
Folgerung 6.1: Die Menge der rationalen Zahlen ist abzählbar.
Beweis: Wir setzen Mn := { m
n : m ∈ Z} für n ∈ N. Da Z abzählbar ist, ist auch
Mn abzählbar für jedes n ∈ N. Und nach Satz 6.1 gilt dies auch für die Vereinigung
nm
o
[
Mn =
: m ∈ Z n ∈ N = Q,
n
n∈N
wie behauptet.
q.e.d.
Folgerung 6.1 besagt, dass die rationalen Zahlen gleichmächtig zu den natürlichen Zahlen sind. Diese Aussage wird für die reellen Zahlen falsch:
44
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Satz 6.2: Die Menge der reellen Zahlen ist überabzählbar.
Beweis (Cantorsches Diagonalverfahren): Wir zeigen, dass bereits die Menge (0, 1) =
{x ∈ R : 0 < x < 1} überabzählbar ist. Wäre nämlich (0, 1) abzählbar, so gäbe
es eine Folge {xn }n mit (0, 1) = {xn : n ∈ N}. Nach Satz 5.1 können wir jedes xn
∞
P
als Dezimalbruch darstellen: xn =
anm · 10−m mit anm ∈ {0, 1, . . . , 9} für alle
m=1
n, m ∈ N, also
x1 = 0, a11 a12 a13 a14 . . . ,
x2 = 0, a21 a22 a23 a24 . . . ,
x1 = 0, a31 a32 a33 a34 . . . ,
x1 = 0, a41 a42 a43 a44 . . .
Wir betrachten nun y =
∞
P
m=1
cm · 10−m ∈ (0, 1) mit
(
cm :=
amm + 2, falls amm ≤ 4,
amm − 2, falls amm > 4
.
Dann gilt also |cm − amm | = 2 für alle m ∈ N. Also unterscheidet sich y von xm an
der m-ten Nachkommastelle mindestens um 2, so dass folgt
|y − xm | ≥ 10−m
für alle m ∈ N
und insbesondere y 6∈ {xn : n ∈ N}. Also war die Annahme falsch, d.h. (0, 1) und
damit auch R sind überabzählbar.
q.e.d.
Folgerung 6.2: Die Menge der irrationalen Zahlen R \ Q ist überabzählbar.
Beweis: Anderenfalls wäre nach Folgerung 6.1 auch (R \ Q) ∪ Q = R abzählbar, im
Widerspruch zu Satz 6.2.
q.e.d.
Wir untersuchen nun Teilmengen von R genauer und beginnen mit der
Definition 6.2: Eine Menge M ⊂ R heißt nach oben (bzw. unten) beschränkt,
wenn ein c ∈ R existiert mit
x≤c
(bzw. x ≥ c)
für alle x ∈ M.
Man nennt dann c obere (bzw. untere) Schranke von M . Schließlich heißt die Menge
M beschränkt, wenn sie sowohl nach oben als auch nach unten beschränkt ist.
Bemerkungen:
6. PUNKTMENGEN IN R
45
1. M ist genau dann beschränkt, wenn ein c > 0 existiert mit |x| ≤ c für alle
x ∈ M.
2. Die einer beschränkten Folge {xn }n ⊂ R zugehörige {xn : n ∈ N} ist offenbar
beschränkt.
Definition 6.3:
(a) Ist M ⊂ R nach oben beschränkt, so heißt σ ∈ R kleinste obere Schranke oder
Supremum von M , i.Z. σ = sup M , falls folgendes gilt:
(i) σ ist obere Schranke von M , d.h. x ≤ σ für alle x ∈ M .
(ii) Für jede weitere obere Schranke σ̂ von M gilt σ ≤ σ̂.
(b) Entsprechend heißt τ ∈ R größte untere Schranke oder Infimum, i.Z. τ =
inf M , zu einer nach unten beschränkten Menge M ⊂ R, wenn gilt
(i) τ ist untere Schranke von M .
(ii) Für jede weitere untere Schranke τ̂ von M gilt τ ≥ τ̂ .
Aus der Definition ist sofort klar, dass Infimum und Supremum, wenn sie existieren, eindeutig bestimmt sind. Außerdem haben wir die folgende Charakterisierung
von Infimum und Supremum:
Hilfssatz 6.1: Sei M ⊂ R nach oben beschränkt. Dann gilt σ = sup M genau dann,
wenn σ obere Schranke ist und zu jedem ε > 0 ein x ∈ M existiert mit x ≥ σ − ε.
Entsprechend ist τ = inf M für eine nach unten beschränkte Menge M ⊂ R genau
dann richtig, wenn τ untere Schranke ist und zu jedem ε > 0 ein x ∈ M existiert
mit x ≤ τ + ε.
Beweis: Übungsaufgabe!
Satz 6.3: Jede nichtleere, nach oben (bzw. unten) beschränkte Menge M ⊂ R besitzt
ein Supremum (bzw. Infimum).
Beweis: Wir zeigen nur die Existenz des Supremums. Die des Infimums folgt dann
durch Übergang zur Menge −M := {x ∈ R : −x ∈ M }.
Zum Beweis betrachten wir wieder eine Intervallschachtelung: Wir konstruieren
Intervalle In = [xn , cn ] mit In+1 ⊂ In für alle n ∈ N, so dass gilt:
|In | ≤
³ 1 ´n−1
2
(c1 − x1 ),
xn ∈ M,
cn ist obere Schranke an M.
(6.1)
• n = 1: Da M nichtleer und nach oben beschränkt ist, existiert ein x1 ∈ M und
ein c1 mit x ≤ c1 für alle x ∈ M .
46
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
• n → n + 1: Sei In = [xn , cn ] konstruiert mit den Eigenschaften (6.1). Dann
setzen wir yn := 12 (xn + cn ) und erklären In+1 wie folgt:
(i) Falls M ∩ [yn , cn ] = ∅, dann ist yn obere Schranke an M und wir setzen
xn+1 := xn ∈ M , cn+1 := yn .
(ii) Falls M ∩ [yn , cn ] 6= ∅, so existiert ein xn+1 ≥ yn mit xn+1 ∈ M . Dann
setzen wir cn+1 := cn .
Offenbar ist dann (6.1) erfüllt für In+1 und wir haben In+1 ⊂ In .
Nach Satz 5.3 und der
T anschließenden Bemerkung konvergieren die Folgen {xn }n
und {cn }n gegen σ ∈ n∈N In . Wir zeigen noch σ = sup M :
Wegen x ≤ cn für alle x ∈ M und n ∈ N liefert Grenzübergang x ≤ σ für alle
x ∈ M , d.h. σ ist obere Schranke. Gäbe es eine obere Schranke σ̂ < σ, so wäre
σ − σ̂ > 0. Wegen limn→∞ xn = σ existiert nun ein N ∈ N mit |xN − σ| < σ − σ̂,
also erhalten wir
xN ≥ σ − |xN − σ| > σ − (σ − σ̂) = σ̂,
also einen Widerspruch zu xN ∈ M .
q.e.d.
Beispiele:
1. Sei [a, b) ein halboffenes Intervall mit a < b. Dann gilt
inf[a, b) = a,
sup[a, b) = b.
In der Tat ist a offenbar untere Schranke von [a, b) := {x ∈ R : a ≤ x < b}.
Und jede weitere untere Schranke a0 muss a0 ≤ a erfüllen, d.h. a = inf[a, b).
Andererseits ist offenbar b obere Schranke für [a, b). Und ist ε > 0 beliebig
gewählt, so setzen wir x := max{a, b − ε}. Dann ist x ∈ [a, b) und x ≥ b − ε
richtig, und nach Hilfssatz 6.1 gilt b = sup[a, b).
2. Für A := { n+1
: n ∈ N} ist inf A = 1 erfüllt, denn es gelten n+1
n
n > 1 für
n+1
=
1,
also
auch
≤
1
+
ε
für
beliebiges
ε > 0 und
alle n ∈ N und lim n+1
n
n→∞ n
hinreichend großes n ∈ N.
Bemerkungen:
1. Obige Beispiele zeigen, dass inf M zur Menge M dazu gehören kann oder nicht.
Wenn inf M ∈ M gilt, so schreiben wir auch min M := inf M für das Minimum
von M . Ebenso sprechen wir vom Maximum von M , falls sup M ∈ M gilt und
schreiben dann max M := sup M . Man beachte, dass für Mengen mit endlich
vielen Elementen immer min M = inf M und max M = sup M erfüllt sind.
6. PUNKTMENGEN IN R
47
2. Für nach oben bzw. nach unten unbeschränkte Mengen M ⊂ R schreiben wir
auch
sup M = +∞ bzw. inf M = −∞.
Wir wenden uns nun wieder reellen Folgen zu. In Definition 5.5 haben wir den
Begriff des Häufungswertes einer Folge {xn }n als Grenzwert einer Teilfolge {xnk }k
erklärt. Betrachtet man alle Häufungswerte einer Folge, wird man auf die folgenden
Begriffe geführt:
Definition 6.4: Sei {xn }n ⊂ R eine beschränkte Folge und bezeichne H die Menge
ihrer Häufungswerte. Wir setzen dann
lim inf xn := inf H
(Limes inferior),
n→∞
lim sup xn := sup H
n→∞
(Limes superior).
Bemerkung: Offenbar ist H beschränkt, wenn {xn }n beschränkt ist. Man beachte
noch
lim inf (−xn ) = − lim sup xn , lim sup(−xn ) = − lim inf xn .
n→∞
n→∞
n→∞
n→∞
Beispiel: Die Folge {xn }n = {(−1)n + n1 }n ist offenbar beschränkt und wir haben
die konvergenten Teilfolgen
x2k = 1 +
1
→ 1 (k → ∞),
2k
x2k−1 = −1 +
1
→ −1 (k → ∞).
2k − 1
Also gilt H = {−1, 1} und lim inf n→∞ xn = −1, lim supn→∞ xn = 1. Man beachte,
dass lim inf n→∞ xn und lim supn→∞ xn zu H gehören. Dies ist immer so:
Satz 6.4: lim inf n→∞ xn ist der kleinste, lim supn→∞ xn der größte Häufungswert
einer beschränkten Folge {xn }n ⊂ R, d.h.
lim inf xn = min H,
n→∞
lim sup xn = max H.
n→∞
Beweis: Wir haben zu zeigen, dass ξ := lim inf n→∞ xn = inf H ∈ H richtig ist,
also eine Teilfolge {xnk }k mit limk→∞ xnk = ξ existiert. Angenommen es gäbe keine
solche Teilfolge. Dann existiert also ein ε > 0 und ein N ∈ N, so dass
|ξ − xn | ≥ ε
für alle n ≥ N
(6.2)
erfüllt ist. Andererseits ist ξ = inf H, d.h. es gibt ein y ∈ H mit
ε
ξ≤y≤ξ+ .
2
(6.3)
48
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Zum Häufungspunkt y ∈ H existiert eine Teilfolge {xnk }k von {xn }n mit xnk →
y (k → ∞). Wir wählen nun k̂ so groß, dass nk̂ ≥ N und |xnk̂ − y| < 2ε gilt. Wegen
ξ ≤ y haben wir dann ξ−xnk̂ ≤ y−xnk̂ < 2ε und folglich liefert (6.2) sogar ξ ≤ xnk̂ −ε.
Aus (6.3) folgt schließlich
xnk̂ <
(6.3)
ε
+ y ≤ ξ + ε ≤ xnk̂ − ε + ε = xnk̂ ,
2
also der Widerspruch xnk̂ < xnk̂ . Somit muss doch lim inf n→∞ xn ∈ H gelten. Durch
Übergang zur Folge {−xn }n folgt schließlich noch lim supn→∞ xn ∈ H.
q.e.d.
Satz 6.5: (Charakterisierung von lim sup)
Sei {xn }n ⊂ R eine beschränkte Folge und η ∈ R. Dann ist η = lim supn→∞ xn
genau dann erfüllt, wenn gilt:
(i) η ist Häufungswert von {xn }n .
(ii) Für alle ε > 0 existiert ein N = N (ε) ∈ N, so dass gilt
xn < η + ε
für alle n ≥ N (ε).
Beweis:
• ⇒“: Sei also η = lim supn→∞ xn . Nach Satz 6.4 ist dann η ∈ H, also (i) erfüllt.
”
Wäre (ii) falsch, so gäbe es ein ε > 0 und eine Teilfolge {x0k }k = {xnk }k mit
x0k ≥ η + ε für alle k ∈ N.
(6.4)
Da {x0k }k beschränkt ist, existiert nach dem Satz von Bolzano–Weierstraß eine
weitere Teilfolge {x0kl }l ⊂ {x0k }k ⊂ {xn }n und ein ζ ∈ R mit x0kl → ζ (l → ∞).
Also ist ζ ∈ H und somit ζ ≤ η. Andererseits liefert aber (6.4) angewendet auf
{x0kl }l nach Grenzübergang l → ∞: ζ ≥ η + ε, Widerspruch!
• ⇒“: Seien nun (i) und (ii) erfüllt. Wäre η 6= lim supn→∞ xn = max H, so gäbe
”
es ein ζ ∈ H mit ζ > η. Wir setzen ε := ζ−η
2 . Für die Teilfolge {xnk }k mit
limk→∞ xnk = ζ existiert dann ein k̂ ∈ N, so dass nk̂ ≥ N (ε) und|xnk̂ − ζ| < ε
richtig ist. Aus (ii) für n = nk̂ erhalten wir dann
xnk̂ < η + ε = η +
ζ −η
= ζ − ε < xnk̂ ,
2
Widerspruch! Also ist η = max H, wie behauptet.
Wir halten noch die entsprechende Aussage für den Limes inferior fest:
q.e.d.
7. DIE KOMPLEXEN ZAHLEN
49
Satz 6.6: (Charakterisierung von lim inf)
Sei {xn }n eine beschränkte Folge und ξ ∈ R. Dann ist ξ = lim inf n→∞ xn genau
dann erfüllt, wenn gilt:
(i) ξ ist Häufungswert von {xn }n .
(ii) Für alle ε > 0 existiert ein N = N (ε) ∈ N, so dass gilt
xn > ξ − ε
für alle n ≥ N (ε).
Bemerkungen:
1. Ohne Beweis notieren wir die Identitäten
¡
¢
lim sup xn = lim sup{xk : k ≥ n} ,
n→∞
n→∞
¡
¢
lim inf xn = lim inf{xk : k ≥ n} .
n→∞
n→∞
Diese Darstellungen werden häufig auch als Definition von lim sup und lim inf
verwendet. Sie sind zwar etwas unanschaulich, haben aber den Vorteil, dass
sie auch für unbeschränkte Folgen Sinn machen: Ist {xn }n etwa nach oben
unbeschränkt, so ist sup{xk : k ≥ n} = +∞ für alle n ∈ N. Dann setzen wir
lim sup xn = +∞.
n→∞
Entsprechend ist für eine nach unten unbeschränkte Folge
lim inf xn = −∞.
n→∞
2. Als Übungsaufgabe zeige man: Eine Folge {xn }n ⊂ R ist genau dann konvergent gegen α ∈ R, wenn sie beschränkt ist und wenn gilt
lim inf xn = α = lim sup xn .
n→∞
7
n→∞
Die komplexen Zahlen
Ausgehend von der reellen Ebene R2 = R × R der geordneten Paare z = (x, y) ∈ R2 ,
wollen wir nun den Körper der komplexen Zahlen C definieren. Hierzu erklären wir
Addition und Multiplikation wie folgt: Für z1 = (x1 , y1 ), z2 = (x2 , y2 ) setzen wir
z1 + z2 := (x1 + x2 , y1 + y2 )
(komplexe Addition),
z1 · z2 = z1 z2 := (x1 x2 − y1 y2 , x1 y2 + x2 y1 )
(komplexe Multiplikation).
(7.1)
Geometrisch entspricht die Addition in C der Vektoraddition in R2 . Eine geometrische Deutung der komplexen Multiplikation folgt erst im nächsten Kapitel.
50
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Satz 7.1: (R2 , +, ·) ist ein Körper mit
Nullelement:
0 := (0, 0),
Einselement:
1 := (1, 0),
negativem Element: zu z = (x, y) setzen wir −z := (−x, −y),
¡ x
−y ¢
inversem Element:
zu z = (x, y) 6= 0 setzen wir z −1 := x2 +y
2 , x2 +y 2 .
Wir schreiben (C, +, ·) oder einfach C für den Körper der komplexen Zahlen.
Beweis:
1. Die Axiome (A1) und (A2) sind offensichtlich, indem man die entsprechenden
Gesetze für R komponentenweise benutzt. Ebenso folgt auch (A3) mit dem
oben erklärten Nullelement. Schließlich haben wir für z = (x, y):
(7.1)
z + (−z) =
¡
¢
x + (−x), y + (−y) = (0, 0) = 0,
also (A4).
2. (M1) ist wieder klar, da die komplexe Multiplikation symmetrisch bezüglich der
xk und yk ist. Zum Beweis von (M2) betrachten wir z1 = (x1 , y1 ), z2 = (x2 , y2 ),
z3 = (x3 , y3 ) und berechnen
(z1 z2 )z3 = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) · (x3 , y3 )
¢
¡
= (x1 x2 − y1 y2 )x3 − (x1 y2 + x2 y1 )y3 , (x1 x2 − y1 y2 )y3 + (x1 y2 + x2 y1 )x3
und
z1 (z2 z3 ) = (x1 , x2 ) · (x2 x3 − y2 y3 , x2 y3 + x3 y2 )
¡
¢
= x1 (x2 x3 − y2 y3 ) − y1 (x2 y3 + x3 y2 ), x1 (x2 y3 + x3 y2 ) + y1 (x2 x3 − y2 y3 ) .
Ein Vergleich der rechten Seiten zeigt (M2). Mit dem oben erklärten Einselement (1, 0) haben wir für beliebiges z = (x, y) ∈ C:
z · 1 = (x, y) · (1, 0) = (x · 1 − y · 0, x · 0 + y · 1) = (x, y) = z,
also (M3). Schließlich gilt auch (M4), denn wir berechnen mit der Inversen zu
z = (x, y):
³ x
−y ´
zz −1 = (x, y) ·
,
x2 + y 2 x2 + y 2
³
−y
−y
x ´
x
−
y
,
x
+
y
=
x 2
x + y2
x2 + y 2 x2 + y 2
x2 + y 2
= (1, 0) = 1.
7. DIE KOMPLEXEN ZAHLEN
51
3. Das Distributivgesetz lässt sich leicht als Übungsaufgabe nachrechnen.
q.e.d.
Bemerkungen:
1. Wir können wieder Subtraktion und Division erklären:
z1 − z2 := z1 + (−z2 ),
z1
:= z1 · z2−1 ,
z2
falls z2 6= 0.
2. Es gelten alle für beliebige Körper abgeleiteten Rechenregeln. Insbesondere
sind Null- und Einselement sowie negatives und inverses Element eindeutig
bestimmt.
Wir wollen nun den Körper R als Unterkörper von C identifizieren: Hierzu betrachten wir die Teilmenge
©
ª
CR := z = (x, y) ∈ C : y = 0 .
Für beliebige z1 = (x1 , 0), z2 = (x2 , 0) ∈ CR erhalten wir dann aus (7.1):
(x1 , 0) + (x2 , 0) = (x1 + x2 , 0),
(x1 , 0) · (x2 , 0) = (x1 · x2 , 0).
Also sind mit z1 , z2 ∈ CR auch z1 + z2 , z1 · z2 ∈ CR . Ferner gilt 0, 1 ∈ CR . Und mit
z ∈ CR ist offenbar auch −z ∈ CR und für z 6= 0 auch z −1 ∈ CR richtig. Also ist CR
ein Unterkörper von C, d.h. eine Teilmenge von C, die bez. der Rechenoperationen
in C einen Körper bildet.
Da außerdem die komplexe Addition und Multiplikation von Elementen aus CR
in der ersten Komponente den reellen Operationen entsprechen, können wir CR mit
R identifizieren durch den Körperisomorphismus:
i : R → CR ,
x 7→ (x, 0).
In diesem Sinne gilt also
R ⊂ C.
Geometrisch: In der komplexen Ebene C werden die Zahlen auf der x-Achse als
reelle Zahlen aufgefasst; man spricht daher von der reellen Achse. Die y-Achse heißt
imaginäre Achse.
Die wichigste komplexe Zahl ist die imaginäre Einheit
i := (0, 1).
52
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Sie hat die Eigenschaft
i2 = (0, 1) · (0, 1) = (−1, 0) = −1,
(7.2)
d.h. z = i ist Lösung der Gleichung
z 2 + 1 = 0.
Mit i berechnen wir für beliebige z = (x, y) ∈ C:
x + iy = (x, 0) + (0, 1)(y, 0) = (x, y) = z.
Die linke Seite dieser Gleichung werden wir i.F. als Schreibweise für die komplexe
Zahl z verwenden, also
z = x + iy, x, y ∈ R.
Dabei heißt x Realteil und y Imaginärteil von z, und wir schreiben
x = Re z,
y = Im z.
Zwei Zahlen z1 , z2 ∈ C stimmen genau dann überein, wenn sowohl ihr Real- als auch
ihr Imaginärteil übereinstimmen.
Wir bemerken, dass man mit komplexen Zahlen wie mit reellen rechnen kann,
wenn man (7.2) beachtet. Z.B. ist
z 2 = (x + iy)2 = x2 + 2ixy + (iy)2
(7.2)
= x2 + 2ixy + i2 y 2 = x2 + 2ixy − y 2
richtig, also
Re(z 2 ) = x2 − y 2 ,
Im(z 2 ) = 2xy.
Schießlich sei angemerkt, dass C nicht angeordnet werden kann: Gäbe es nämlich
den Begriff der Positivität, so dass (O1) und (O2) aus Definition 1.2 erfüllt sind, so
folgte daraus z.B. für i 6= 0 nach Satz 1.3 (f): i2 > 0. Wegen Formel (7.2) ist aber
i2 = −1 < 0, denn es gilt 1 = 12 > 0, Widerspruch! Wir werden aber gleich sehen,
dass wir C bewerten können.
Definition 7.1: Sei z = x + iy ∈ C, so heißt
z := x − iy
die konjugiert komplexe Zahl zu z. Mit
|z| :=
bezeichnen wir den Betrag von z.
p
x2 + y 2
7. DIE KOMPLEXEN ZAHLEN
53
Bemerkungen:
1. Die Konjugation z 7→ z entspricht geometrisch einer Spiegelung an der reellen
Achse. Es gelten die Rechenregeln
1
1
Re z = (z + z), Im z = (z − z)
(7.3)
2
2i
sowie
z = z, z1 + z2 = z1 + z2 , z1 · z2 = z1 · z2 .
(7.4)
2. Der Betrag |z| von z ∈ C entspricht geometrisch dem Abstand zum Nullpunkt
(gemessen in der euklidischen Metrik). Es gilt
|z|2 = z · z,
|z| = |z|.
(7.5)
Satz 7.2: Der Betrag in C hat folgende Eigenschaften:
(a) Es gilt |z| ≥ 0 für alle z ∈ C und |z| = 0 ⇔ z = 0.
(b) Für alle z1 , z2 ∈ C ist |z1 z2 | = |z1 | |z2 | erfüllt.
(c) Für alle z1 , z2 ∈ C ist |z1 + z2 | ≤ |z1 | + |z2 | richtig.
Also ist C ein bewerteter Körper im Sinne von § 1.
Bemerkung: Die geometrische Deutung der komplexen Addition als Vektoraddition
im R2 erklärt nun auch den Begriff Dreiecksungleichung für die Relation (c).
Beweis von Satz 7.2:
(a) |z|
p ≥ 0 für alle z ∈ C ist per Definition klar. Und wir bemerken |z| =
x2 + y 2 = 0 gdw. x2 + y 2 = 0 gdw. x = y = 0 gdw. z = 0.
(b) Für z1 , z2 ∈ C berechnen wir
p
(7.5) p
(7.4) p
|z1 z2 | =
|z1 z2 |2 =
(z1 z2 )(z1 z2 ) =
(z1 z2 )(z1 z2 )
p
p
(7.5)
(z1 z1 )(z2 z2 ) =
|z1 |2 |z2 |2 = |z1 | |z2 |,
=
wie behauptet.
(c) Wir beachten |z| ≥ |Re z| für beliebige z ∈ C. Damit erhalten wir
|z1 + z2 |2
(7.5)
=
(7.4),(7.5)
=
(7.3)
=
(b),(7.5)
≤
(z1 + z2 )(z1 + z2 )
(7.4)
=
z1 z1 + (z1 z2 + z2 z1 ) + z2 z2
|z1 |2 + (z1 z2 + z1 z2 ) + |z2 |2
|z1 |2 + 2Re(z1 z2 ) + |z2 |2
|z1 |2 + 2|z1 | |z2 | + |z2 |2 = (|z1 | + |z2 |)2 ,
und die Behauptung folgt.
q.e.d.
54
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Wir wollen nun Punktfolgen {zn }n im Körper C betrachten und erklären in
Analogie zu den Definitionen 4.1 und 4.2:
Definition 7.2: Eine Folge {zn }n ⊂ C heißt
• beschränkt, falls ein c > 0 existiert mit |zn | ≤ c für alle n ∈ N.
• Cauchyfolge, falls für alle ε > 0 ein N (ε) ∈ N existiert mit
|zn − zm | < ε
für alle m, n ≥ N (ε).
• konvergent gegen z ∈ C, falls für alle ε > 0 ein N (ε) ∈ N existiert mit
|zn − z| < ε
für alle n ≥ N (ε).
Wir schreiben lim zn = z oder zn → z (n → ∞).
n→∞
• Nullfolge, falls {zn }n gegen 0 konvergiert.
Bemerkung: Nennen wir {ζ ∈ C : |z −ζ| < ε} wieder eine ε-Umgebung von z ∈ C, so
konvergiert {zn }n genau dann gegen z, wenn in jeder (noch so kleinen) ε-Umgebung
von z fast alle Glieder der Folge liegen. In C ist eine ε-Umgebung von z, geometrisch
gesehen, eine (offene) Kreisscheibe um z vom Radius ε > 0; wir schreiben daher
auch
©
ª
Kε (z) := ζ ∈ C : |z − ζ| < ε .
Wir wollen nun zeigen, dass C auch vollständig ist. Zur Vorbereitung notieren
wir den folgenden
Hilfssatz 7.1: Eine Folge {zn }n ⊂ C ist genau dann konvergent (bzw. Cauchyfolge,
Nullfolge, beschränkt), wenn die reellen Folgen {Re(zn )}n und {Im(zn )}n konvergent
(bzw. Cauchyfolgen, Nullfolgen, beschränkt) sind. Für konvergente Folgen {zn }n gilt
lim zn = lim Re(zn ) + i lim Im(zn ).
n→∞
n→∞
n→∞
Beweis: Die Aussagen ergeben sich sofort aus den Relationen
|Re z| ≤ |z|,
|Im z| ≤ |z|,
die man leicht als Übungsaufgabe bestätigt.
|z| ≤ |Re z| + |Im z|,
q.e.d.
Satz 7.3: (Cauchysches Konvergenzkriterium in C)
Eine Folge {zn }n ⊂ C ist genau dann konvergent, wenn sie Cauchyfolge ist. Insbesondere ist C ein vollständiger (bewerteter) Körper.
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
55
Beweis: Aus Hilfssatz 7.1 und dem Cauchyschen Konvergenzkriterium in R folgern
wir:
{zn }n ist konvergent
HS 7.1
⇐⇒
{Re(zn )}n , {Im(zn )}n ⊂ R sind konvergent
Satz 5.2
⇐⇒
{Re(zn )}n , {Im(zn )}n ⊂ R sind Cauchyfolgen
HS 7.1
⇐⇒
{zn }n ist Cauchyfolge,
wie behauptet.
q.e.d.
Als Übung beweist man noch den folgenden
Satz 7.4: (Rechenregeln für komplexe Grenzwerte)
• Ist {zn }n ⊂ C eine konvergente Folge, so konvergiert auch {zn }n und es gilt
lim zn = lim zn .
n→∞
n→∞
• Ist {ζn }n ⊂ C eine weitere konvergente Folge, so konvergieren auch {zn + ζn }n
und {zn · ζn }n mit
lim (zn + ζn ) = lim zn + lim ζn ,
n→∞
n→∞
¢
¢ ¡
¡
lim (zn · ζn ) = lim zn · lim ζn .
n→∞
n→∞
n→∞
n→∞
• Gilt schließlich noch ζn 6= 0 für alle n ∈ N und limn→∞ ζn 6= 0, so konvergiert
auch { zζnn }n mit
³z ´
lim zn
n
lim
= n→∞ .
n→∞ ζn
lim ζn
n→∞
8
Konvergenzkriterien für Reihen (in C)
In § 4 haben wir Reihen in R definiert und den Begriff der Konvergenz einer Reihe
eingeführt. Mit dem in § 7 gegebenen Konvergenzbegriff P
für Folgen in C sagen wir
nun entsprechend: Ist {zk }k∈N ⊂ C, so heißt diePReihe ∞
k=1 zk konvergent, wenn
n
die Folge der Partialsummen
{s
}
mit
s
:=
z
,
n
∈ N, konvergiert. Wir
n
n
n
k
k=1
P∞
schreiben wieder
z
sowohl
für
die
Reihe
als
auch,
wenn
existent, für den
k=1 k
Grenzwert
µX
¶
n
∞
X
lim sn = lim
zk =:
zk ,
n→∞
n→∞
k=1
k=1
56
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
also den Wert der Reihe. Wenden wir Hilfssatz 7.1
Pnauf die Folge {sn }n der Partialsummen
P an, so folgt noch:
P∞ Die komplexe Reihe k=1 zk konvergiert genau dann,
wenn ∞
Re(z
)
und
k
k=1
k=1 Im(zk ) konvergieren, und es gilt
∞
X
zk =
k=1
∞
X
Re(zk ) + i
k=1
∞
X
Im(zk ).
k=1
P
Wenn die Reihe ∞
k=1 zk nicht konvergent ist, heißt sie divergent. Wenn zk =
xk ∈ R für alle k ∈ N und
lim sn = ±∞
n→∞
gilt, so heißt die Reihe bestimmt divergent (gegen ±∞).
P
Es sei schließlich angemerkt, dass wir natürlich auch Reihen der Form ∞
k=k0 zk
mit einem k0 ∈ N0 (oder sogar k0 ∈ Z) betrachten können (und
P werden). Falls
klar ist, über welche k summiert wird, schreiben wir auch kurz k zk für die Reihe
bzw. ihren Wert.
Im vorliegenden Paragraphen werden wir eine Anzahl wichtiger Konvergenzkriterien für Reihen kennenlernen, die wir (soweit sinnvoll) in C formulieren und die
als Spezialfall natürlich auch für reelle Reihen gelten. Wir beginnen mit dem
Satz 8.1: (Cauchysches
Konvergenzkriterium für Reihen)
P∞
z
in
C
konvergiert genau dann, wenn für beliebige ε > 0 ein
Eine Reihe
k=1 k
N = N (ε) ∈ N existiert, so dass gilt
¯ X
¯
¯ n
¯
¯
zk ¯¯ < ε
¯
für alle n > m ≥ N (ε).
(8.1)
k=m+1
Beweis: Wir bemerken
¯ n
¯ ¯ n
¯
m
X
¯ ¯ X
¯X
¯
zk ¯¯ = ¯¯
|sn − sm | = ¯¯
zk −
zk ¯¯ für alle n > m.
k=1
k=1
k=m+1
Also ist (8.1) äquivalent dazu, dass {sn }n eine Cauchyfolge bildet und somit
P nach
Satz 7.3 auch äquivalent zur Konvergenz der Folge {sn }n bzw. der Reihe k zk .
q.e.d.
P
Bemerkung: Satz 8.1 zeigt übrigens auch: Die Reihe ∞
konvergiert (bzw. dik=1 zk P
vergiert) genau dann, wenn für beliebige k0 ∈ N die Reihe ∞
k=k0 zk konvergiert
(bzw. divergiert). Die ersten endlich vielen Glieder beeinflussen das Konvergenzverhalten der Reihe also nicht (aber natürlich ihren Wert).
Das folgende Kriterium eignet sich eher zum Ausschluss der Konvergenz:
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
Satz 8.2: Wenn
P∞
k=1 zk
57
(zk ∈ C für alle k ∈ N) konvergiert, so muss gelten
lim zk = 0.
k→∞
P
Beweis: Sei k zk konvergent und ε > 0 beliebig gewählt. Nach Satz 8.1 existiert
dann ein N (ε) ∈ N mit |zn | < ε für alle n > N (ε) (wende (8.1) mit m = n − 1 an).
Also ist {zn }n Nullfolge.
q.e.d.
P
k
k
Zum Beispiel divergiert also die Reihe ∞
k=1 (−1) , da {(−1) }k keine Nullfolge ist. Wie wir am Beispiel der harmonischen Reihe jetzt sehen werden, ist das
Kriterium aus Satz 8.2 nicht hinreichend:
∞
P
1
Beispiel: Harmonische Reihe
k.
k=1
Zwar bildet { k1 }k eine Nullfolge, aber die Reihe ist nicht konvergent. In der Tat gilt
für beliebiges m ∈ N:
2m
2m
X
X
1
1
m
1
≥
=
= .
|s2m − sm | =
k
2m
2m
2
k=m+1
k=m+1
Also ist das Cauchysche Konvergenzkriterium (8.1) für ε <
1
2
nicht erfüllbar.
Für reelle Reihen mit nichtnegativen Einträgen gilt der folgende
P
Satz 8.3: Die Reihe ∞
k=1 xk mit xk ∈ R und xk ≥ 0 für alle k ∈ N konvergiert
genau dann, wenn die zugehörige Folge der Partialsummen beschränkt ist.
P∞
k=1 zk
Bemerkung: Falls die Folge der Partialsummen einer (komplexen) Reihe
beschränkt ist, sagen wir die Reihe ist beschränkt und schreiben
¯X
¯
¯ ∞ ¯
¯
zk ¯¯ < +∞.
¯
k=1
P
Beweis von Satz 8.3: Wegen xk ≥ 0 ist die Folge der Partialsummen sn = nk=1 xk
monoton wachsend. Satz 5.6 liefert also die Konvergenz der Reihe. Umgekehrt ist
natürlich jede konvergente Reihe auch beschränkt.
q.e.d.
Im Falle sogenannter alternierender Reihen haben wir die folgende bessere Aussage:
Satz 8.4: (Konvergenzkriterium von Leibniz)
Ist {xk }k ⊂ R ein monoton fallende Nullfolge, so konvergiert die Reihe
∞
P
(−1)k xk .
k=1
58
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Wir verzichten an dieser Stelle auf einen Beweis, da sich Satz 8.4 als Spezialfall
von Satz 9.3 ergeben wird.
Beispiel: Die Reihen
∞
X
(−1)k
k=1
( alternierende harmonische Reihe),
k
∞
X
(−1)k
2k + 1
( Leibnizreihe)
k=0
konvergieren offenbar nach Satz 8.4. Wir werden später berechnen
∞
X
(−1)k
k=1
k
= − log 2,
∞
X
(−1)k
π
= .
2k + 1
4
k=0
Definition
P∞ 8.1: Eine komplexe Reihe
Reihe k=1 |zk | konvergiert.
P∞
k=1 zk
heißt absolut konvergent, wenn die
Bemerkungen:
1. Jede absolut konvergente Reihe konvergiert auch im gewöhnlichen Sinn: Denn
nach der Dreiecksungleichung in C gilt
¯ X
¯
n
X
¯ n
¯
¯
¯
zk ¯ ≤
|zk | für alle n > m,
¯
k=m+1
k=m+1
und Satz 8.1 liefert die Behauptung.
2. Es gibt Reihen, die zwar im gewöhnlichen Sinn aber nicht absolut konvergieren,
z.B. die alternierende harmonische Reihe.
P∞
P
3. Sind ∞
k=1 ζk zwei
k=1 zk und
Pabsolut konvergente Reihen, so ist auch jede
(komplexe) Linearkombination ∞
k=1 (αzk + βζk ) mit α, β ∈ C absolut konvergent.
Eines der wichtigsten Konvergenzkriterien enthält nun der folgende
Satz 8.5: (Majorantenkriterium)
Zwei Folgen {zk }k ⊂ C und {µk }k ⊂ R mit
|zk | ≤ µk
für alle k ∈ N
P∞
P∞
seien gegeben. Dann
P gilt: Konvergiert die ReiheP k=1 µk , so konvergiert k=1 zk
absolut. Die Reihe k µk heißt Majorante von k zk .
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
59
Beweis: Zu beliebigem ε > 0 existiert nach Satz 8.1 ein N (ε) ∈ N mit
n
X
k=m+1
|zk | ≤
n
X
µk < ε für alle n > m ≥ N (ε).
k=m+1
Wiederum nach Satz 8.1 konvergiert also auch
lut.
P
k
|zk |, d.h.
P
k zk
konvergiert absoq.e.d.
Folgerung 8.1: (Minorantenkriterium)
Sind {xk }k , {µk }k ⊂ R gegeben mit
xk ≥ µk ≥ 0
für alle k ∈ N
P∞
P∞
P
und divergiert
k=1 µk , so divergiert auch
k=1 xk . Die Reihe
k µk heißt MinoP
rante von k xk .
P
P
Beweis: Wäre nämlich
k µk nach Satz 8.5 ebenfalls
k xk konvergent, so wäre
konvergent, Widerspruch!
q.e.d.
Beispiele:
P
k
1. Die Reihe ∞
k=0 z konvergiert absolut für |z| < 1 und divergiert für |z| > 1.
Ersteres folgt aus Satz 8.5, da
∞
X
k=0
(4.1)
|z|k =
1
1 − |z|
eine konvergente Majorante ist. Und letzteres aus Satz 8.2, da {z k }k keine
Nullfolge ist für |z| > 1.
P∞ 1
2. Die Reihe
k=1 kα konvergiert (absolut) für rationales α ≥ 2. Wir haben
nämlich
1
1
2
für alle k ∈ N,
0< α ≤ 2 ≤
k
k
k(k + 1)
P
2
also ist ∞
k=1 k(k+1) eine Majorante, die gemäß des vorletzten Beispiels in § 4
konvergiert mit
∞
∞
X
X
2
1
=2
= 2.
k(k + 1)
k(k + 1)
k=1
k=1
Sehr nützlich ist auch der folgende
Satz 8.6:
P (Quotientenkriterium)
Es sei ∞
k=1 zk eine komplexe Reihe mit zk 6= 0 für alle k ≥ k0 . Dann gilt:
60
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(a) Existiert ein q ∈ (0, 1) und ein k0 ∈ N mit
¯z
¯
¯ k+1 ¯
¯
¯ ≤ q < 1 für alle k ≥ k0 ,
zk
P
so konvergiert die Reihe ∞
k=1 zk absolut.
(b) Existiert ein k0 ∈ N, so dass gilt
¯z
¯
¯ k+1 ¯
¯
¯≥1
zk
für alle k ≥ k0 ,
dann divergiert die Reihe.
Beweis:
(a) Es gilt
¡
¢
|zk | ≤ |zk0 |q −k0 q k
für alle k ≥ k0 ,
wie man leicht P
mit vollständiger Induktion zeigt. Nach Satz 8.5 konvergiert
also die Reihe k zk absolut, da sie (ab dem k0 -ten Glied) die konvergente
Majorante
∞
∞
X
¡
¢
¡
¢X
|zk0 |q −k0 q k = |zk0 |q −k0
qk
k=k0
k=k0
besitzt.
(b) Offensichtlich gilt |zk | ≥ |zk0 | > P
0 für alle k ≥ k0 . Also bildet {zk }k keine
Nullfolge, nach Satz 8.2 ist somit k zk divergent.
q.e.d.
Bemerkung: Wir können in Satz 8.6 (a) die Voraussetzung nicht durch die schwächere
Bedingung
¯
¯z
¯ k+1 ¯
¯ < 1 für alle k ≥ k0
¯
zk
P
1
ersetzen, wie das Beispiel der divergenten harmonischen Reihe ∞
k=1 k zeigt.
Umgekehrt ist die
P dort1angegebene Bedingung aber auch keine notwendige Bedingung, denn z.B. ∞
k=1 k2 konvergiert wie oben gesehen, aber es gilt
¯z
¯
k2
¯ k+1 ¯
→ 1 (k → ∞).
¯
¯=
zk
(k + 1)2
Beispiele:
1. Die Reihe
P∞
k2
k=1 2k
konvergiert, denn mit xk :=
k2
2k
haben wir
¯x
¯
(k + 1)2
1³
1 ´2 8
¯ k+1 ¯ (k + 1)2 2k
=
=
1
+
≤ <1
¯
¯=
xk
2k+1 k 2
2k 2
2
k
9
Satz 8.6 (a) liefert die Behauptung.
für alle k ≥ 3.
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
2. Die Reihe
P∞
kk
k=1 k!
divergiert, denn mit xk =
kk
k!
61
gilt
¯x
¯
³ k + 1 ´k
¯ k+1 ¯ (k + 1)k+1 k!
=
≥ 1 für alle k ∈ N,
¯
¯=
xk
(k + 1)! k k
k
wir können also Satz 8.6 (b) anwenden.
3. Die komplexe Exponentialreihe
k
C. Mit zk := zk! gilt nämlich
P∞
zk
k=0 k!
konvergiert absolut für beliebiges z ∈
¯z
¯
|z|k+1 k!
|z|
1
¯ k+1 ¯
=
≤
¯
¯=
k
zk
(k + 1)! |z|
k+1
2
für alle k ≥ 2|z| − 1.
Als Übungsaufgabe beweise man noch den folgenden
Satz 8.7:
P (Wurzelkriterium)
Es sei ∞
k=1 zk eine komplexe Reihe. Dann gilt:
(a) Existiert ein q ∈ (0, 1) und ein k0 ∈ N mit
p
k
|zk | ≤ q < 1 für alle k ≥ k0 ,
so konvergiert
P∞
k=1 zk
absolut.
(b) Gilt
lim sup
k→∞
p
k
|zk | > 1,
so divergiert die Reihe.
Wir wenden uns nun dem Produkt von absolut konvergenten Reihen zu:
Satz 8.8:P(Cauchyscher
Produktsatz)
P∞
Es seien ∞
z
,
ζ
komplexe,
absolut konvergente Reihen. Setzen wir
l
k
k=1
l=1
cj :=
j
X
zk ζj−k+1
für j ∈ N,
k=1
P
so konvergiert auch die Reihe ∞
j=1 cj absolut, und es gilt die Cauchysche Produktformel
µX
¶µ X
¶ X
∞
∞
∞
zk
ζl =
cj .
k=1
l=1
j=1
62
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis:
1. Wir erklären die Partialsummen
rn :=
n
X
zk ,
sn :=
k=1
n
X
ζl ,
tn :=
n
X
cj .
j=1
l=1
Dann gilt
rn sn =
µX
n
¶µ X
¶ X
¶
n
n µX
n
n
X
zk
ζl =
zk ζl =:
zk ζl .
k=1
l=1
k=1
l=1
k,l=1
Diese Schreibweise für eine (endliche)Doppelsumme ist offenbar sinnvoll, da
die Reihenfolge der Summation irrelevant ist. Setzen wir
©
ª
Qn := (k, l) ∈ N × N : 1 ≤ k ≤ n, 1 ≤ l ≤ n ,
so haben wir
X
rn sn =
zk ζl .
(8.2)
(k,l)∈Qn
Die Definition der cj lässt sich auch schreiben als
cj =
X
zk ζl ,
k+l=j+1
k,l∈N
so dass sich für die n-te Partialsumme der cj ergibt
tn =
X
zk ζl ;
(8.3)
(k,l)∈Dn
hierbei haben wir noch
©
ª
Dn := (k, l) ∈ N × N : k + l ≤ n + 1
gesetzt. Da nun Dn ⊂ Qn für jedes n ∈ N richtig ist, haben wir insgesamt
X
rn sn − tn =
zk ζl für alle n ∈ N.
(8.4)
(k,l)∈Qn \Dn
2. Setzen wir noch
rn∗ :=
n
X
k=1
|zk |,
s∗n :=
n
X
l=1
|ζl |,
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
63
so finden wir wie in (8.2):
X
rn∗ s∗n =
|zk | |ζl |,
n ∈ N.
(8.5)
(k,l)∈Qn
Nun beachten wir Q2n \ D2n ⊂ Q2n \ Qn , da Qn ⊂ D2n für alle n ∈ N richtig
ist. Damit können wir abschätzen
¯
¯
X
X
¯
(8.4) ¯
|r2n s2n − t2n | = ¯¯
zk ζl ¯¯ ≤
|zk | |ζl |
(k,l)∈Q2n \D2n
≤
X
(k,l)∈Q2n \D2n
|zk | |ζl |
(8.5)
∗ ∗
= |r2n
s2n − rn∗ s∗n | → 0 (n → ∞),
(k,l)∈Q2n \Qn
P
P
da k |zk | und k |ζk | konvergieren, also auch das Produkt ihrer Partialsummen {rn∗ s∗n }n eine Cauchyfolge bildet. Ganz entsprechend folgt aus Q2n−1 \
D2n−1 ⊂ Q2n−1 \ Qn auch
∗
|r2n−1 s2n−1 − t2n−1 | ≤ |r2n−1
s∗2n−1 − rn∗ s∗n | → 0 (n → ∞).
Da schließlich |r2n s2n − r2n−1 s2n−1 | → 0 (n → ∞) gilt (denn {rn sn }n konvergiert), haben {t2n }n und {t2n−1 }n den gleichen Grenzwert, nämlich
lim tn = lim (rn sn ) = ( lim rn )( lim sn ),
n→∞
n→∞
n→∞
n→∞
wie behauptet.
3. Zum Beweis der absoluten Konvergenz von
t∗n :=
n
X
|cj |,
P
j cj
betrachten wir noch
n ∈ N.
j=1
Wie in (8.3) erhalten wir dann
X
X
(8.5)
0 ≤ t∗n ≤
|zk | |ζl | ≤
|zk | |ζl | = rn∗ s∗n ≤ K
(k,l)∈Dn
für alle n ∈ N
(k,l)∈Qn
P
P
mit K := ( k |zk |)( l |ζl |) < +∞. Also ist {t∗n }n beschränkt, monoton wachsend und nach Satz 5.6 somit auch konvergent.
q.e.d.
Schließlich untersuchen wir das Verhalten von Reihen unter Umordnungen.
P∞
P∞
Definition 8.2:
P∞Sei k=1 zk eine komplexe Reihe. Dann heißt k=1 ζk eine Umordnung von
k=1 zk , wenn es eine bijektive Abbildung σ : N → N gibt, so dass
gilt
ζn = zσ(n) für alle n ∈ N.
64
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Man nennt σ eine unendliche Permutation der Reihenglieder. Für endliche Summen ist die Reihenfolge der Summation bekanntlich irrelevant für das Ergebnis; jede
Umordnung einer endlichen Summe liefert also den gleichen Wert. Bei unendlichen
Reihen muss das nicht gelten:
P
Definition 8.3: Wir nennen eine komplexe konvergente Reihe ∞
k=1 zk unbedingt
konvergent, wenn jede ihrer Umordnungen ebenfalls konvergiert
und
den gleichen
P∞
Wert wie die ursprüngliche Reihe besitzt. Anderenfalls heißt k=1 zk bedingt konvergent.
Satz 8.9: (Dirichletscher Umordnungssatz)
Eine komplexe konvergente Reihe ist genau dann unbedingt konvergent, wenn sie
absolut konvergent ist.
Beweis: Wir zeigen nur, dass jede absolut konvergente Reihe auch unbedingt konvergent ist. P
Die umgekehrte Aussage folgt ausP
dem anschließenden Satz 8.10.
∞
z
absolut
konvergent,
d.h.
Sei also ∞
k=1 |zk | < +∞. Dann existiert nach
k=1 k
Satz 8.1 zu jedem ε > 0 ein N = N (ε) ∈ N , so dass
N
+p
X
k=N +1
|zk | <
ε
2
für alle p ∈ N
(8.6)
P
P
richtig ist. Ist nun ∞
k zk , so existiert ein
k=1 ζk eine beliebige Umordnung von
K ∈ N mit K ≥ N , so dass gilt
{z1 , . . . , zN } ⊂ {ζ1 , . . . , ζK }.
(8.7)
P
P
Es bezeichne nun sn := nk=1 zk bzw. tn := nk=1 ζk die n-ten Partialsummen der
beiden Reihen. Aus (8.6) und (8.7) folgt dann
|sn − tn | <
ε ε
+ = ε für alle n > K ≥ N,
2 2
da sich die Terme z1 , . . . , zN aufheben und die übrigen Terme in den Summen sn
bzw. tn jeweils durch (8.6) abgeschätzt werden
können. Es folgt also limn→∞ |sn −
P
tn | = 0. Bezeichnet nun s den Wert von k zk , so folgt
|tn − s| ≤ |tn − sn | + |sn − s| → 0 (n → ∞),
d.h. auch
P
k ζk
konvergiert gegen s, wie behauptet.
q.e.d.
Satz 8.10: (Riemannscher
Umordnungssatz)
P∞
Ist die reelle Reihe k=1 xk konvergent,
aber nicht absolut konvergent,
so gibt es zu
P
P∞
jedem t ∈ R eine Umordnung ∞
ξ
der
Reihe,
so
dass
t
=
ξ
gilt.
k=1 k
k=1 k
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
65
Bemerkungen:
P
P
1. Ist P
k zk eine komplexe, unbedingt konvergente Reihe, so sind auch
k Re(zk )
und k Im(zk ) unbedingt konvergent. Nach
P Satz 8.10 müssen die reellen Reihen absolut konvergent sein, also ist auch k zk absolut konvergent. Das vervollständigt den Beweis von Satz 8.9.
P
2. Man kann sogar Umordnungen k ξk einer beliebigen reellen
P konvergenten,
aber nicht absolut konvergenten Reihe konstruieren, so dass k ξk = ±∞ gilt
(Übungsaufgabe).
Beweis von Satz 8.10:
1. Zu {xk }k setzen wir
pk := max{0, xk },
qk := − min{0, xk },
k ∈ N.
Dann gilt
pk , qk ≥ 0,
Da
P
k
xk = pk − qk ,
|xk | = pk + qk
für alle k ∈ N.
xk konvergiert, muss |xk | → 0 (k → ∞) gelten und folglich auch
lim pk = lim qk = 0.
k→∞
Außerdem haben wir
Wäre nämlich z.B.
X
pk =
X
k
P
(8.8)
k→∞
qk = +∞.
(8.9)
k
pk < +∞, so konvergiert auch
X
X
X
X
xk .
pk −
(pk − xk ) =
qk =
k
k
P
k
k
P
k
Dann wäre aber auch
k ) konvergent, im Widerspruch
k (pk + q
k |xk | =
P
zur
k xk . Entsprechend zeigt man
P nicht absoluten Konvergenz der Reihe
q
=
+∞.
k k
2. Wir zerlegen nun die Folge {xk }k in die Teilfolgen der positiven Glieder {ak }k
und nichtpositiven Glieder {bk }k . Nach (8.8) und (8.9) bilden beide Nullfolgen
und es gilt
X
X
ak = +∞,
bk = −∞.
k
k
Nun wählen wir n1 als kleinste natürliche Zahl, so dass zu unserem vorgegebenen t ∈ R gilt
n1
X
ak > t.
k=1
66
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Dann wählen wir n2 als kleinste natürliche Zahl, so dass
n1
X
ak +
k=1
n2
X
bk < t
k=1
richtig ist. Danach bestimmen wir ein kleinstes n3 > n1 wiederum so, dass gilt
n1
X
ak +
k=1
n2
X
bk +
k=1
n3
X
ak > t.
k=n1 +1
Es ist klar, wie dieses Verfahren fortgesetzt und welche Umordnung der ursprünglichen Reihe dabei erstellt wird. Da n1 , n2 , n3 , . . . jeweils minimal gewählt waren, muss gelten
nX
1 −1
ak ≤ t,
k=1
n1
X
ak +
k=1
nX
2 −1
bk ≥ t, . . .
k=1
(ersteres nur, falls t ≥ 0 ist). Somit haben die zugehörigen Teilsummen höchstens einen Abstand von an1 , bn2 , an3 , bn4 , . . . zu t. Da aber sowohl {ak }k als
auch {bk }k Nullfolgen sind, konvergieren die Partialsummen der umgeordneten
Reihe gegen t, wie behauptet.
q.e.d.
9
Potenzreihen
Wir wollen nun noch spezielle komplexe Reihen betrachten, nämlich Reihen der
Form
∞
X
ak z k
P(z) =
k=0
mit den Koeffizienten
ak ∈ C (k ∈ N0 ) und der Variablen z ∈ C. Die Partialsummen
P
Pn (z) := nk=0 ak z k einer Potenzreihe sind für alle n ∈ N komplexe Polynome.
Wir kennen bereits zwei Beispiele von Potenzreihen, welche wohl auch die beiden
wichtigsten sind:
• Geometrische Reihe:
∞
P
k=0
• Exponentialreihe:
∞
P
k=0
zk
k! ,
z k , d.h. ak = 1 für alle k ∈ N0 .
d.h. ak =
1
k!
für alle k ∈ N0 .
Während letztere für alle z ∈ C absolut konvergiert, konvergiert die geometrische
Reihe absolut für |z| < 1 und divergiert für |z| > 1. I.A. hängt also das Konvergenzverhalten einer Potenzreihe von der Wahl der Variablen z ab. Genauer haben wir
den folgenden
9. POTENZREIHEN
67
Satz 9.1: (Cauchy-Hadamard)
p
P∞
k
k
Für eine Potenzreihe P(z) =
|ak | ∈
k=0 ak z setzen wir α := lim supk→∞
[0, +∞) ∪ {+∞}. Erklären wir dann

+∞, falls α = 0


α−1 , falls α ∈ (0, +∞) ,
R :=


0,
falls α = +∞
(9.1)
so konvergiert P(z) für |z| < R absolut und divergiert für |z| > R.
Bemerkung: Die in (9.1) erklärte Größe R ∈ [0, +∞)∪{+∞} heißt Konvergenzradius
der Reihe P(z). Die Kreisscheibe KR := {z ∈ C : |z| < R} nennen wir das
Konvergenzgebiet.
Beweis von Satz 9.1: Offenbar gilt |z| < R (bzw. |z| > R) genau dann, wenn |z|α <
(bzw. |z|α > 1) also
q
lim sup k |ak z k | < 1 (bzw. > 1)
k→∞
p
k
richtig ist. Wegen
Satz
6.5
ist
für
lim
sup
|ak z k | < 1 der
Fall (a) aus Satz 8.7
k→∞
p
P
k
k
k
|a
gültig, d.h.
a
z
konvergiert
absolut.
Im
Fall
lim
sup
k z | > 1 divergiert
k→∞
k k
P
P(z) = k ak z k nach Satz 8.7 (b).
q.e.d.
Als sehr praktisch erweist sich der folgende
P
k
Satz 9.2: Ist P(z) = ∞
k=0 ak z im Punkt z0 ∈ C \ {0} konvergent, so konvergiert
P(z) absolut für alle z ∈ C mit |z| < |z0 |.
P
Beweis: Da k ak z0k konvergiert, gilt limk→∞ |ak z0k | = 0. Insbesondere ist {|ak z0k |}k
beschränkt, es gibt also ein c > 0 mit |ak z0k | ≤ c für alle k ∈ N0 . Sei nun z ∈ C mit
|z| < |z0 | bzw. q := | zz0 | ∈ [0, 1) beliebig gewählt. Dann folgt
¯ z ¯k
¯ ¯
|ak z k | = |ak z0k | ¯ ¯ ≤ cq k für alle k ∈ N0 .
z0
P
P k
c
k
Wegen q ∈ [0, 1) konvergiert die Reihe
k cq = c
k q = 1−q und nach dem
Majorantenkriterium, Satz 8.5, konvergiert auch P(z) absolut für |z| < |z0 |, wie
behauptet.
q.e.d.
Wir wollen nun einen Satz beweisen, der u.a. Aussagen über das Konvergenzverhalten auf dem Rand des Konvergenzgebietes macht und außerdem das Konvergenzkriterium von Leibniz als Spezialfall enthält. Wir beginnen mit dem
68
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
P
Hilfssatz 9.1: Sei {zk }k∈N0 ⊂ C eine Folge, so dass ∞
ist, und sei
k=0 zk beschränkt P
{ak }k ⊂ R eine monoton fallende Nullfolge. Dann konvergiert die Reihe ∞
k=0 ak zk .
Pn
Beweis: Wir wollen Satz 8.1 anwenden, also den Ausdruck | k=m+1 ak zk | für hinreichend große P
m, n ∈ N0 mit n > m klein bekommen. Dazu setzen wir für festes
m ∈ N0 : sn := nk=m+1 zk für n > m. Mit vollständiger Induktion zeigt man dann
leicht die Relation
n
X
ak zk = sn an +
k=m+1
n−1
X
sk (ak − ak+1 )
für alle n > m.
k=m+1
Da {ak }k eine monoton fallende Nullfolge ist, gilt ak ≥ ak+1 ≥ 0 für alle k ∈ N0 .
Daher können wir abschätzen
¯ X
¯
n−1
X
¯ n
¯
¯
¯
a
z
≤
|s
|a
+
|sk |(ak − ak+1 )
n
n
k
k
¯
¯
k=m+1
k=m+1
¸
·
n−1
X
©
ª
(ak − ak+1 )
≤ max |sm+1 |, . . . , |sn | an +
k=m+1
©
ª
= am+1 · max |sm+1 |, . . . , |sn |
für n > m.
Da nun {ak }k Nullfolge ist, existiert zu jedem ε > 0 ein N (ε) ∈ N, so dass 0 ≤ ak < ε
für alle k ≥ N (ε) richtig ist. Ferner gibt es ein c > 0 mit |sn | ≤ c für alle n ∈ N,
denn {sn }n ist beschränkt nach Voraussetzung. Insgesamt folgt
¯ X
¯
¯ n
¯
¯
ak zk ¯¯ < cε für alle n > m ≥ N (ε),
¯
k=m+1
also nach Satz 8.1 die Konvergenz der Reihe.
q.e.d.
Satz 9.3: IstP
{ak }k∈N0 eine monoton fallende Nullfolge, so konvergiert die Potenzk
reihe P(z) = ∞
k=0 ak z für alle z ∈ C \ {1} mit |z| ≤ 1.
Beweis: Aus der Summenformel der geometrischen Reihe, Satz 2.3, erhalten wir für
beliebige z ∈ C \ {1} mit |z| ≤ 1:
¯
¯ n
¯ X k ¯ ¯¯ 1 − z n+1 ¯¯ 1 + |z|n+1
2
¯
z ¯¯ = ¯
≤
für alle n ∈ N.
¯≤
¯
1−z
|1 − z|
|1 − z|
Somit ist
P(z).
P
k=0
k
z k für solche z beschränkt, Hilfssatz 9.1 liefert also die Konvergenz von
q.e.d.
Bemerkung:
P∞ Setzen kwir in Satz 9.3 speziell z = −1 ein, so folgt die Konvergenz der
Reihe k=0 ak (−1) . Dies ist gerade die Aussage des Leibnizschen Konvergenzkriteriums, Satz 8.4.
10. DER D-DIMENSIONALE REELLE RAUM RD
69
Satz 9.4: (Cauchyscher
P∞ Produktsatz
P∞für Potenzreihen)
k
Sind die Potenzreihen k=0 ak z P
und k=0 bk z k für |z| < R absolut konvergent, so
k
gilt dies auch für die Potenzreihe ∞
k=0 ck z mit den Koeffizienten
ck :=
k
X
al bk−l ,
k ∈ N0 ,
l=0
und wir haben die Identität
µX
∞
k=0
ak z
k
¶µ X
∞
¶
bk z
k
k=0
=
µX
∞
¶
ck z .
k
k=0
Beweis: Dies ergibt sich nach einer Indexverschiebung k → k + 1 aus Satz 8.8, wenn
man noch
¶
µX
k
k
X
l
k−l
(al z )(bk−l z ) =
al bk−l z k = ck z k
l=0
l=0
beachtet.
q.e.d.
Bemerkung: Alle Resultate lassen sich direkt auf komplexe Potenzreihen der Form
Pz0 (z) :=
∞
X
ak (z − z0 )k
k=0
übertragen. Das Konvergenzgebiet von Pz0 (z) ist dann eine Kreisscheibe KR (z0 ) =
{z ∈ C : |z − z0 | < R} vom Radius R ∈ [0, +∞) ∪ {+∞} um den Entwicklungspunkt
z0 ∈ C. Die bisher betrachteten Potenzreihen P(z) sind also Spezialfälle von Pz0 (z)
mit z0 = 0.
10
Der d-dimensionale reelle Raum Rd
Für den Umgang mit Funktionen in den folgenden Kapiteln benötigen wir noch
einige topologische Begriffe. Da wir Funktionen sowohl in R als auch C (also für
Punkte aus R2 ) betrachten wollen, führen wir an dieser Stelle allgemeiner den ddimensionalen (reellen) Raum Rd mit d ∈ N ein:
(i) Wir betrachten die Menge aller d-Tupel x = (x1 , . . . , xd ) ∈ Rd := R × . . . × R,
wobei zwei Punkte x = (x1 , . . . , xd ), y = (y1 , . . . , yd ) ∈ Rd gleich heißen, wenn
ihre Koordinaten übereinstimmen, d.h. xk = yk für alle k = 1, . . . , d. Das
Element 0 = (0, . . . , 0) ∈ Rd heißt Nullpunkt oder Ursprung des Rd .
(ii) Sind x, y ∈ Rd beliebig, so erklären wir die Addition auf Rd gemäß
x + y := (x1 + y1 , . . . , xd + yd ) ∈ Rd .
70
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Ist ferner λ ∈ R gewählt, so definieren wir die skalare Multiplikation durch
λx := (λx1 , . . . , λxd ) ∈ Rd .
Bemerkungen:
1. Den R2 veranschaulichen wir uns wie üblich in der Ebene, den Punkten x =
(x1 , x2 ) ∈ R2 entsprechen die Vektoren ~x = (x1 , x2 ). Dann entspricht die Addition in R2 der Vektoraddition und die skalare Multiplikation der Skalierung
eines Vektors.
2. Die Addition in Rd , d ∈ N, genügt den Axiomen (A1)-(A4) aus § 1 mit dem
neutralen Element 0 = (0, . . . , 0) ∈ Rd und dem negativen Element −x :=
(−x1 , . . . , −xd ) ∈ Rd . Zusammen mit der skalaren Multiplikation spricht man
dann von einer Vektorraumstruktur, d.h. Rd ist ein Vektorraum.
3. Während man R1 und R2 mit einer Körperstruktur ausstatten kann, nämlich
mit der von R bzw. C, ist das für d ≥ 3 nicht mehr möglich. Trotzdem können
wir (wie in R und C) einen Abstandsbegriff erklären m.H. der folgenden
Definition 10.1: Seien x, y ∈ Rd , so erklären wir deren (euklidisches) Skalarprodukt oder auch inneres Produkt als
hx, yi = x · y :=
d
X
xj yj .
(10.1)
j=1
Die (euklidische) Länge oder den Betrag von x ∈ Rd definieren wir als
p
|x| := hx, xi =
µX
d
¶1
x2j
2
.
j=1
Schließlich heißt
µX
¶1
d
2
2
|x − y| =
(xj − yj )
j=1
der (euklidische) Abstand zweier Punkte x, y ∈ Rd .
Bemerkungen:
1. (Rd , h·, ·i) heißt euklidischer Vektorraum; wir schreiben kurz Rd und stellen
uns diesen mit dem euklidischen Abstandsbegrif ausgestattet vor. Es sei aber
angemerkt, dass es viele weitere Abstandsbegriffe im Rd gibt.
10. DER D-DIMENSIONALE REELLE RAUM RD
71
2. Das in (10.1) erklärte Skalarprodukt hat die Eigenschaften
hx, yi = hy, xi
(Symmetrie)
hλx + µy, zi = λhx, zi + µhy, zi
hx, xi ≥ 0,
(10.2)
(Bilinearität)
hx, xi = 0 ⇔ x = 0
(Positivität)
(10.3)
(10.4)
für beliebige x, y, z ∈ Rd und λ, µ ∈ R (Übungsaufgabe).
3. Im R2 entspricht der Betrag gerade dem in C erklärten Betrag, in R1 dem in
R erklärten Absolutbetrag.
Der Abstand | · | hat sehr ähnliche Eigenschaften wie der Betrag in R oder C
(das erklärt auch das verwendete Symbol):
Satz 10.1: Für alle x, y ∈ Rd und λ ∈ R gilt
(i) |x| ≥ 0 und |x| = 0 ⇔ x = 0.
(ii) |λx| = |λ| |x|.
(iii) |x + y| ≤ |x| + |y| ( Dreiecksungleichung).
Bemerkung: Also unterscheidet sich nur (ii) von der entsprechenden Eigenschaft
|xy| = |x| |y| des Betrages in R bzw. C. Dies ist im Rd i.A. falsch, es gilt aber der
berühmte
Satz 10.2: (Cauchy-Schwarzsche Ungleichung)
Sind x, y ∈ Rd beliebig, so gilt
|hx, yi| ≤ |x| |y|.
(10.5)
Gleichheit tritt genau dann ein, wenn x = ty oder y = tx mit einem t ∈ R gilt,
d.h. wenn x, y linear abhängig sind.
Beweis: Falls y = 0 gilt, ist nichts zu zeigen. Sei also y 6= 0. Dann folgt
(10.4)
0 ≤ |x + ty|2
(10.2),(10.3)
=
|x|2 + 2thx, yi + t2 |y|2
für alle t ∈ R.
Das ist bekanntlich genau dann der Fall, wenn hx, yi2 ≤ |x|2 |y|2 gilt, und nach
Wurzelziehen erhalten wir (10.5). Andererseits hat die Gleichung
0 = |x + ty|2 = |x|2 + 2thx, yi + t2 |y|2
bekanntlich genau dann eine Lösung t ∈ R, wenn hx, yi2 ≥ |x|2 |y|2 gilt. Wegen (10.5)
ist also |x + ty| = 0 für ein t ∈ R genau dann erfüllt, wenn hx, yi2 = |x|2 |y|2 richtig
ist, wie behauptet.
q.e.d.
72
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis von Satz 10.1: (i) entspricht (10.4), und (ii) folgt unmittelbar aus (10.2),
(10.3). Zum Beweis von (iii) berechnen wir
(10.5)
|x + y|2 = |x|2 + 2hx, yi + |y|2 ≤ |x|2 + 2|x| |y| + |y|2
= (|x| + |y|)2 ,
also nach Wurzelziehen die behauptete Dreiecksungleichung.
q.e.d.
Bemerkung: Aus der Dreiecksungleichung folgt wie in Satz 1.5 (c) noch die umgekehrte Dreiecksungleichung
¯
¯
|x − y| ≥ ¯|x| − |y|¯ für alle x, y ∈ Rd .
Mit Hilfe des Betrages im Rd können wir nun auch die Begriffe für Folgen in R
bzw. C auf den Rd übertragen:
Definition 10.2: Eine Folge {xn }n∈N ⊂ Rd mit den Gliedern xn = (xn1 , . . . , xnd ) ∈
Rd für n ∈ N heißt
• beschränkt, falls ein c > 0 existiert mit |xn | ≤ c für alle n ∈ N,
• Cauchyfolge, wenn für alle ε > 0 ein N (ε) ∈ N existiert mit |xn − xm | < ε für
alle m, n ≥ N (ε),
• konvergent gegen den Grenzwert x ∈ Rd , wenn es für alle ε > 0 ein N (ε) ∈ N
gibt mit |xn − x| < ε für alle n ≥ N (ε); Schreibweise limn→∞ xn = x oder
xn → x (n → ∞),
• Nullfolge, wenn {xn }n gegen 0 ∈ Rd konvergiert.
Ferner heißt y ∈ Rd Häufungswert von {xn }n , wenn eine Teilfolge {xnk }k ⊂ {xn }n
existiert mit limk→∞ xnk = y.
Z.B. ist also {xn }n ⊂ Rd gegen x ∈ Rd konvergent, wenn in jeder ε-Umgebung
Bε (x) := {y ∈ Rd : |y − x| < ε} fast alle Glieder der Folge liegen. Man beachte,
dass Bε (x) in R = R1 ein offenes Intervall, in R2 eine Kreisscheibe um x vom Radius
ε > 0 und in Rd für d ≥ 3 eine Kugel um x vom Radius ε > 0 ist.
Bemerkung: Zur Übung beweise man folgende Rechenregeln für Grenzwerte im Rd :
Sind {xn }n , {yn }n ⊂ Rd konvergente Folgen mit limn→∞ xn = x und limn→∞ yn = y,
so folgt
• Sind α, β ∈ R beliebig, so konvergiert auch {αxn + βyn }n mit αxn + βyn →
αx + βy (n → ∞).
10. DER D-DIMENSIONALE REELLE RAUM RD
73
• Es gilt hxn , yn i → hx, yi und |xn | → |x| für n → ∞.
• Ist {αn }n ⊂ R eine Folge mit αn → α (n → ∞), so gilt αn xn → αx (n → ∞).
Satz 10.3: (Cauchysches Konvergenzkriterium in Rd )
Eine Folge {xn }n ⊂ Rd ist genau dann konvergent, wenn {xn }n Cauchyfolge ist.
Der Beweis erfolgt genau wie der des Cauchyschen Konvergenzkriteriums in C,
Satz 7.3, in dem man die Aussage auf die Komponentenfolgen {xnj }n , j = 1, . . . , d,
zurückführt mittels des folgenden
Hilfssatz 10.1: Eine Folge {xn }n ⊂ Rd ist genau dann beschränkt (bzw. konvergent, Cauchyfolge, Nullfolge), wenn alle Komponentenfolgen {xnj }n ⊂ R, j =
1, . . . , d, beschränkt (bzw. konvergent, Cauchyfolgen, Nullfolgen) sind. Für konvergente Folgen {xn }n gilt
¢
¡
lim xn = lim xn1 , . . . , lim xnd .
n→∞
n→∞
n→∞
Beweis: Als Übungsaufgabe zeigt man: Ist y = (y1 , . . . , yd ) ∈ Rd beliebig, so gelten
die Ungleichungen
|yj | ≤ |y| für j = 1, . . . , d,
|y| ≤
d
X
|yk |.
k=1
Hieraus ergeben sich sofort die Behauptungen.
q.e.d.
Satz 10.4: (Bolzano-Weierstraß in Rd )
Jede beschränkte Folge {xn }n ⊂ Rd besitzt eine konvergente Teilfolge.
Beweis: Vollständige Induktion über die Raumdimension d ∈ N.
• d = 1: Das ist die Aussage von Satz 5.5.
• d → d + 1: Die Aussage sei für beschränkte Folgen {xn }n ⊂ Rd mit einem
d ∈ N erfüllt.
Sei nun {x̃n }n ⊂ Rd+1 beschränkt mit den Folgengliedern
x̃n = (x̃n1 , . . . x̃nd , x̃n,d+1 ) = (xn , ξn ) mit xn := (x̃n1 , . . . , x̃nd ), ξn := x̃n,d+1 .
Damit sind auch {xn }n ⊂ Rd und {ξn }n ⊂ R beschränkt. Nach Induktionsvoraussetzung existiert also eine konvergente Teilfolge {x0k }k = {xnk }k von {xn }n
mit limk→∞ x0k = x ∈ Rd . Die entsprechende Teilfolge {ξk0 }k = {ξnk }k ⊂ R
von {ξn }n muss zwar nicht konvergieren, ist aber sicher beschränkt. Also gibt
es nach Satz 5.5 eine weitere Teilfolge {ξk0 l }l ⊂ {ξk0 }k mit liml→∞ ξk0 l = ξ ∈ R.
74
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Die entsprechende Teilfolge {x0kl }l ⊂ {x0k }k konvergiert auch gegen x, so dass
schließlich für {x̃0kl }l gilt
lim x̃0kl = lim (x0kl , ξk0 l )
l→∞
l→∞
HS 10.1
=
(x, ξ),
wie behauptet.
q.e.d.
Bemerkung: Satz 10.4 für d = 2 liefert auch: Jede beschränkte Folge {xn }n ⊂ C
besitzt eine konvergente Teilfolge. Denn die Beträge in R2 und C stimmen überein.
Wir wollen nun Teilmengen M ⊂ Rd betrachten und beginnen mit der
Definition 10.3: Eine Teilmenge M ⊂ Rd nennen wir
• offen, wenn zu jedem x0 ∈ M ein r > 0 existiert, so dass gilt
Br (x0 ) = {x ∈ Rd : |x − x0 | < r} ⊂ M.
• abgeschlossen, wenn für jede konvergente Folge {xn }n ⊂ M gilt
x0 := lim xn ∈ M.
n→∞
Beispiele:
1. Intervalle in R:
• Das offene Intervall (a, b) = {x ∈ R : a < x < b} ist im Sinne von
Definition 10.3 offen.
Ist nämlich x0 ∈ (a, b) gewählt, so setzen wir r := min{x0 −a, b−x0 } > 0.
Für x ∈ Br (x0 ) folgt dann
x = x0 + (x − x0 ) ≥ x0 − |x − x0 | > x0 − r ≥ x0 − (x0 − a) = a,
also x > a und entsprechend x < b, also x ∈ (a, b) und somit Br (x0 ) ⊂
(a, b).
• Das abgeschlossene Intervall [a, b] = {x ∈ R : a ≤ x ≤ b} ist abgeschlossen im Sinne von Definition 10.3.
Ist nämlich {xn }n ⊂ [a, b] konvergent mit xn → x0 (n → ∞), so folgt
a ≤ xn ≤ b und nach Grenzübergang n → ∞ auch a ≤ x0 ≤ b, also
x0 ∈ [a, b].
• Das halboffene Intervall [a, b) ist weder offen noch abgeschlossen.
Denn die konvergente Folge {b + n1 }n≥N ⊂ [a, b) mit hinreichend großem
N ∈ N hat den Grenzwert limn→∞ (b + n1 ) = b 6∈ [a, b). Und für a ∈ [a, b)
gilt offenbar Br (a) 6⊂ [a, b) für alle r > 0.
10. DER D-DIMENSIONALE REELLE RAUM RD
75
2. Kugeln in Rd :
• BR (ξ) ⊂ Rd ist offen für beliebige R > 0, ξ ∈ Rd .
Ist nämlich x0 ∈ BR (ξ) beliebig, so ist r := R − |x0 − ξ| > 0. Für
x ∈ Br (x0 ) haben wir dann die Abschätzung
|x − ξ| ≤ |x − x0 | + |x0 − ξ| < r + |x0 − ξ| = R,
also x ∈ BR (ξ) und somit Br (x0 ) ⊂ BR (ξ).
Man bezeichnet daher BR (ξ) auch als offene Kugel im Rd .
• Im Gegensatz dazu ist B̂R (ξ) := {x ∈ Rd : |x − ξ| ≤ R} abgeschlossen
und heißt abgeschlossene Kugel im Rd .
Ist nämlich {xn }n ⊂ B̂R (ξ) mit xn → x0 (n → ∞) beliebig, so liefert
Grenzübergang n → ∞ in der Ungleichung |xn − ξ| ≤ R für alle n ∈ N:
¯
¯
R ≥ lim |xn − ξ| = ¯ lim (xn − ξ)¯ = |x0 − ξ|,
n→∞
n→∞
also x0 ∈ BR (ξ).
• Die Kugelschale S%,R (ξ) := BR (ξ) \ B% (ξ) = {x ∈ Rd : % ≤ |x − ξ| < R}
mit 0 < % < R ist weder offen noch abgeschlossen.
Für x0 ∈ S%,R (ξ) mit |x0 − ξ| = % gilt nämlich Br (x0 ) 6⊂ S%,R (ξ) für alle
ξ−x0
für hinreichend kleines ε ∈ (0, r) zwar
r > 0, da z.B. y := x0 + ε |ξ−x
0|
in Br (x0 ) aber nicht in S%,R (ξ) liegt, d.h. S%,R (ξ) ist nicht offen. Und
andererseits finden wir für konvergentes {xn }n ⊂ S%,R (ξ) mit |xn − ξ| =
R − n1 , n ≥ N , die Relation limn→∞ xn =: x0 6∈ S%,R (ξ), d.h. S%,R (ξ) ist
auch nicht abgeschlossen.
3. Q ist weder offen noch abgeschlossen.
4. Rd und ∅ sind die einzigen Teilmengen von Rd , die sowohl offen als auch abgeschlossen sind (Übungsaufgabe).
Wir erinnern an den Begriff der Komplementärmenge oder des Komplements
einer Menge M ⊂ Rd , nämlich
M c := Rd \ M = {x ∈ Rd : x 6∈ M }.
Satz 10.5: Eine Menge M ⊂ Rd ist genau dann offen, wenn ihr Komplement M c
abgeschlossen ist. Weiter ist M genau dann abgeschlossen, wenn M c offen ist.
Beweis: Es genügt, die erste Aussage zu beweisen. Die zweite folgt dann unmittelbar
aus der Relation (M c )c = M .
76
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
• ⇒“: Sei M ⊂ Rd offen. Wäre dann M c nicht abgeschlossen, so gäbe es eine
”
konvergente Folge {xn }n ⊂ M c mit xn → x0 6∈ M c (n → ∞). Das heißt aber
x0 ∈ M , und da M offen ist, gäbe es eine Kugel Br (x0 ) ⊂ M mit geeignetem
Radius r > 0. Da andererseits |xn − x0 | → 0 (n → ∞) gilt, müsste also
xn ∈ Br (x0 ) ⊂ M für hinreichend großes n ∈ N erfüllt sein, im Widerspruch
zu {xn }n ⊂ M c . Also ist M c abgeschlossen.
• ⇐“: Sei nun M c abgeschlossen. Wäre M nicht offen, so gäbe es ein x0 ∈ M
”
mit Br (x0 ) 6⊂ M für alle r > 0. Wählen wir insbesondere r = n1 , so gäbe es
also xn ∈ B 1 (x0 ) mit xn ∈ M c für alle n ∈ N. Für die so gewählte Folge
n
{xn }n ⊂ M c gälte dann aber |xn − x0 | < n1 → 0 (n → ∞). Und da M c
abgeschlossen ist, müsste x0 ∈ M c folgen, Widerspruch! Also ist M offen.
q.e.d.
Notation: Meist werden wir offene Mengen mit dem (ggf. indizierten) Symbol Ω ⊂
Rd und abgeschlossene Mengen mit A ⊂ Rd bezeichnen.
Satz 10.6:
(a) Sind Ω1 , . . . , Ωn ⊂ Rd offen, so gilt dies auch für
(b) Sind A1 , . . . , An ⊂ Rd abgeschlossen, so ist auch
n
T
j=1
n
S
j=1
Ωj .
Aj abgeschlossen.
(c) Sei J eine beliebige IndexmengeSund {Ωj }j∈J eine Familie offener Mengen.
Dann ist auch die Vereinigung
Ωj offen.
j∈J
(d) Ist {Aj }j∈J eine Familie abgeschlossener
Mengen mit beliebiger Indexmenge
T
J, so ist auch der Durchschnitt
Aj abgeschlossen.
j∈J
Beweis: Wegen Satz 10.5 und der allgemeinen Relationen
µ[
¶c
µ\
¶c
\
[
Mj =
Mjc ,
Mj =
Mjc
j∈J
j∈J
j∈J
j∈J
genügt es die (nahezu trivialen) Aussagen (a) und (c) zu beweisen (Übungsaufgabe).
q.e.d.
Definition 10.4: Sei M ⊂ Rd eine beliebige Menge. Dann heißt ein Punkt x0 ∈ Rd :
• innerer Punkt von M , wenn ein r > 0 mit Br (x0 ) ⊂ M existiert.
10. DER D-DIMENSIONALE REELLE RAUM RD
77
• Randpunkt von M , wenn zu jedem r > 0 Punkte y ∈ M und z ∈ M c mit
y, z ∈ Br (x0 ) existieren.
• Häufungspunkt von M , wenn zu jedem r > 0 ein x ∈ M \ {x0 } existiert mit
x ∈ Br (x0 ).
• isolierter Punkt von M , wenn x0 ∈ M gilt und x0 kein Häufungspunkt von M
ist.
Die Menge der inneren Punkte von M ⊂ Rd heißt das Innere von M ; wir schreiben
int M oder M̊ . Die Menge der Randpunkte heißt Rand von M und wird mit ∂M
bezeichnet. Schließlich heißt M := M ∪ ∂M der Abschluss von M .
Bemerkungen: Ein Punkt x0 ∈ Rd ist offenbar genau dann Häufungspunkt von
M ⊂ Rd , wenn eine Folge {xn }n ⊂ M \ {x0 } existiert mit xn → x0 (n → ∞).
Ferner ist x0 genau dann Randpunkt von M , wenn zwei Folgen {yn }n ⊂ M und
{zn }n ⊂ M c existieren mit yn → x0 , zn → x0 (n → ∞).
Satz 10.7: Für eine beliebige Menge M ⊂ Rd gelten die folgenden Aussagen:
(i) ∂M = ∂(M c ).
(ii) M ist genau dann offen, wenn M = int M gilt.
(iii) M = int M ∪ ∂M , ∂M = M \ int M .
(iv) Ist {xn }n ⊂ M konvergent, so gilt limn→∞ xn =: x0 ∈ M .
(v) M ist abgeschlossen ⇔ ∂M ⊂ M ⇔ M = M .
Beweis: (i) und (ii) sind aus den Definitionen sofort klar. Wir beweisen (iii)-(v):
(iii) Wir zeigen M \int M ⊂ ∂M . In der Tat: Ist x0 ∈ M \int M , so gilt Br (x0 ) 6⊂ M
für alle r > 0. D.h. für jedes r > 0 existieren y := x0 ∈ M , z ∈ M c mit
y, z ∈ Br (x0 ), also folgt x0 ∈ ∂M . Aus der Definition von M folgt nun
M = M ∪ ∂M = (M \ int M ) ∪ int M ∪ ∂M = int M ∪ ∂M
und damit auch ∂M = M \ int M , wie behauptet.
(iv) Sei {xn }n ⊂ M konvergent und x0 = limn→∞ xn . Falls x0 ∈ int M gilt, ist
nichts zu zeigen wegen int M ⊂ M ⊂ M . Sei also x0 6∈ int M , d.h. es gilt
Br (x0 ) 6⊂ M für alle r > 0. Also existiert zu jedem n ∈ N ein zn ∈ M c
mit |zn − x0 | < n1 , d.h. zn → x0 (n → ∞). Nach obiger Bemerkung folgt
x0 ∈ ∂M ⊂ M , also die Behauptung.
78
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(v) Zunächst ist ∂M ⊂ M ⇔ M = M wieder per Definition klar. Wir beweisen
die erste Äquivalenz:
⇒“: Sei M abgeschlossen und x0 ∈ ∂M gewählt. Dann existiert eine Folge
”
{xn }n ⊂ M mit xn → x0 (n → ∞). Und es folgt x0 ∈ M wegen der
Abgeschlossenheit von M , also ∂M ⊂ M .
⇐“: Sei umgekehrt ∂M ⊂ M . Und sei eine konvergente Folge {xn }n ⊂ M
”
gewählt. Nach (iv) gilt dann x0 := limn→∞ xn ∈ M = M ∪ ∂M = M ,
also ist M abgeschlossen.
q.e.d.
Beispiel: Für die offene Einheitskugel BR (ξ) im Rd gilt:
int BR (ξ) = BR (ξ),
BR (ξ) = {x ∈ Rd : |x − ξ| ≤ R} = B̂R (ξ),
∂BR (ξ) = {x ∈ Rd : |x − ξ| = R} =: SR (ξ).
Mit S d−1 := {x ∈ Rd : |x| = 1} bezeichnen wir die Einheitssphäre im Rd .
Definition 10.5: Eine Teilmenge M ⊂ Rd heißt
• beschränkt, falls ein R > 0 existiert mit M ⊂ BR (0); anderenfalls nennen wir
M unbeschränkt.
• kompakt, falls M beschränkt und abgeschlossen ist.
Bemerkung: Ist M nichtleer und beschränkt, so ist der Durchmesser
diam M := sup{|x − y| : x, y ∈ M }
wohl definiert, d.h. diam M ist endlich und eindeutig bestimmt.
Satz 10.8: Eine Teilmenge K ⊂ Rd ist genau dann kompakt, wenn jede Folge
{xn }n ⊂ K eine konvergente Teilfolge {xnl }l enthält mit lim xnl =: x0 ∈ K.
l→∞
Bemerkung: Eine Menge K nennt man folgenkompakt, wenn jede Folge {xn }n ⊂ K
eine Teilfolge {xnl }l enthält mit xnl → x0 ∈ K (l → ∞). Satz 10.8 besagt also,
dass für Teilmengen des Rd Kompaktheit und Folgenkompaktheit äquivalent sind.
Für Teilmengen aus unendlich dimensionalen“ Räumen gilt dies i.A. nicht mehr. In
”
solchen Räumen wird der Begriff der Kompaktheit abweichend von Definition 10.5,
nämlich durch die Heine-Borel-Eigenschaft“, erklärt. Im Rd ist auch diese Eigen”
schaft äquivalent zu unserer Definition; vgl. Analysis 2.
10. DER D-DIMENSIONALE REELLE RAUM RD
79
Beweis von Satz 10.8:
⇒“: Sei K beschränkt und abgeschlossen. Eine beliebige Folge {xn }n ⊂ K ist dann
”
beschränkt und nach Satz 10.4 existiert eine konvergente Teilfolge {xnl }l ⊂ K.
Da nun K abgeschlossen ist, gilt liml→∞ xnl =: x0 ∈ K.
⇐“: Nun sei K folgenkompakt. Dann ist K offenbar abgeschlossen (siehe Definiti”
on 10.3). Wäre K nicht beschränkt, so gäbe es zu jedem n ∈ N ein xn ∈ M
mit xn 6∈ Bn (0). Also gilt |xn | > n für alle n ∈ N, d.h. aus {xn }n können wir
keine konvergente Teilfolge auswählen, Widerspruch! Also ist K kompakt.
q.e.d.
Wir beschließen das Kapitel mit dem Begriff der dichten Teilmenge des Rd :
Definition 10.6: Eine Teilmenge S ⊂ M heißt dicht in M ⊂ Rd , wenn zu jedem
x0 ∈ M eine Folge {xn }n ⊂ S existiert mit xn → x0 (n → ∞).
Zum Beispiel liegt Qd dicht in Rd , denn zu beliebigem x0 = (x01 , . . . , x0d ) ∈ Rd
können wir nach Satz 5.1 Folgen {xnj }n ⊂ Q, j = 1, . . . , d, finden mit xnj → x0j (n →
∞) und folglich
Qd 3 xn := (xn1 , . . . , xnd ) → (x01 , . . . , x0d ) = x0
für n → ∞.
Kapitel 2
Funktionen und Stetigkeit
1
Beispiele und Grenzwerte von Funktionen
Definition 1.1:
• Es sei D ⊂ Rn (n ∈ N) eine beliebige, nichtleere Menge. Jedem Punkt x ∈ D
werde vermöge der Funktion f : D → Rd (d ∈ N) genau ein Wert y = f (x) ∈
Rd zugeordnet. Man schreibt auch x 7→ f (x) oder f = f (x) oder y = f (x)
für die Funktion. In Koordinaten haben wir d Funktionen f1 (x1 , . . . , xn ), . . . ,
fd (x1 , . . . , xn ), x = (x1 , . . . , xn ) ∈ D, mit
¡
¢
(y1 , . . . , yd ) = y = f (x) = f1 (x1 , . . . , xn ), . . . , fd (x1 , . . . , xn ) .
• Die Menge D ⊂ Rn heißt Definitionsbereich der Funktion f : D → Rd , die
Menge
W := {f (x) : x ∈ D} =: f (D)
ist der Wertebereich von f . Schließlich ist der Graph von f erklärt als
©
ª
graph f := (x, f (x)) : x ∈ D ⊂ Rn × Rd = Rn+d .
Bemerkungen:
1. Eine Funktion ist also eine Abbildung zwischen Teilmengen n- bzw. d-dimensionaler reeller Räume, nämlich f : D → W , D ⊂ Rn , W ⊂ Rd . Daher sprechen
wir gleichwertig von Funktionen und Abbildungen.
2. Gilt speziell n = 2 oder/und d = 2, so können wir D bzw. W mit einer
komplexen Struktur ausstatten, d.h. D ⊂ C bzw. W ⊂ C auffassen. So kann
z.B. jede Funktion f : D → R2 als Funktion f : D → C interpretiert werden.
In diesem Sinne sind Funktionen f : D → R also Spezialfälle von Funktionen
f : D → C.
81
82
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Definition 1.2: Eine Funktion f : D → Rd heißt beschränkt, wenn ein c > 0 so
existiert, dass gilt
|f (x)| ≤ c für alle x ∈ D.
Anderenfalls heißt die Funktion unbeschränkt.
Bemerkung: Eine Funktion f : D → Rd ist also genau dann beschränkt, wenn ihr
Wertebereich W = f (D) ⊂ Rd beschränkt ist.
Beispiele:
1. Für den Fall d = 1 lässt sich der Graph von f : D → R, also die Punkte
(x, f (x)) ∈ Rn+1 , x ∈ D, als Höhenfunktion über D ⊂ Rn veranschaulichen
(→ Berglandschaft). Alternativ (für n ≥ 2) kann man sich die Funktion durch
Niveaumengen veranschaulichen. Hierzu skizziert man
Γf (c) := {x ∈ D : f (x) = c},
die Niveuamenge zum Niveau c ∈ R.
Zum Beispiel skizziere man die Niveaumengen (hier Niveaulinien) für f =
(x1 , x2 ) := x21 − x22 , x = (x1 , x2 ) ∈ R2 . Man beachte, dass f unbeschränkt ist,
da Γ(c) 6= ∅ für alle c ∈ R gilt.
Konvention: Für n = 2, d = 1 schreibt man häufig x1 =: x, x2 =: y und
y =: z, also z = f (x, y).
2. Eine Funktion f : D → Rd , d ≥ 2, kann man als Vektorfeld interpretieren,
indem man an jeden Punkt x ∈ D ⊂ Rn den Vektor f (x) ∈ Rd anheftet“.
”
Diese Interpretation spielt vor allem in der Physik eine Rolle, etwa bei der
Beschreibung von Kraftfeldern.
3. Alternativ lässt sich f : D → Rd , d ≥ 2, für D ⊂ Rn mit n = 1 als Kurve und
für n = 2 als Fläche im Rd interpretieren. Ist allgemeiner 2 ≤ n < d, so spricht
man von einer n-dimensionalen Fläche im Rd . Dabei heißt m := d − n ∈ N die
Codimension der Fläche.
Speziell lässt sich für g : D → R mit D ⊂ Rn , n ≥ 2, der Graph von g als
n-dimensionale Fläche im Rn+1 interpretieren:
f (x) := (x, g(x)) : D → Rn+1 .
In diesem Fall ist also die Codimension m = (n + 1) − n = 1; man spricht dann
von einer Hyperfläche.
4. Jedes komplexe Polynom
f (z) = an z n + an−1 z n−1 + . . . + a1 z + a0
(a0 , . . . , an ∈ C)
1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN
83
ist eine Funktion f : C → C. Auch Potenzreihen
P(z) =
∞
X
ak z k
(al ∈ C für alle l ∈ N0 )
k=0
sind komplexe Funktionen P : KR (0) → C, wobei R ∈ [0, +∞) ∪ { ∞} den
Konvergenzradius der Reihe bezeichne. Alle nichtkonstanten Polynome sind
unbeschränkt!
5. Funktionen müssen keine geschlossene Darstellung besitzen. Beispiele sind die
Signumfunktion


 −1, x < 0
0,
x=0 : R→R
sgn(x) :=


+1, x > 0
oder die Dirichletsche Sprungfunktion
(
1, x ∈ Q
f (x) :=
: R → R.
0, x ∈ R \ Q
Beide Funktionen sind beschränkt.
Definition 1.3: Sei D ⊂ Rn und x0 ein Häufungspunkt von D. Zu der Funktion
f : D → Rd gäbe es ein a ∈ Rd , so dass für alle ε > 0 ein δ = δ(ε) > 0 existiere mit
der Eigenschaft
|f (x) − a| < ε
für alle x ∈ D mit 0 < |x − x0 | < δ.
Dann heißt a der Grenzwert oder Limes der Funktion f = f (x) im Punkt x0 und
wir schreiben
lim f (x) = a oder f (x) → a (x → x0 ).
x→x0
Man sagt auch: f (x) konvergiert gegen a, wenn x gegen x0 strebt.
Geometrisch: Es gilt limx→x0 f (x) = a genau dann, wenn für alle ε > 0 ein δ =
δ(ε) > 0 existiert, so dass f (x) ∈ Bε (a) für alle x ∈ Bδ0 (x0 ) ∩ D richtig ist. Hier
bezeichnet
Bδ0 (x0 ) := Bδ (x0 ) \ {x0 }
die punktierte Kugel.
Satz 1.1: Für f : D → Rd , x0 Häufungspunkt von D ⊂ Rn , gilt f (x) → a (x → x0 )
genau dann, wenn für jede Folge {xp }p ⊂ D \ {x0 } mit xp → x0 (p → ∞) die
Beziehung limp→∞ f (xp ) = a gilt.
84
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Beweis:
• ⇒“: Sei also limx→x0 f (x) = a erfüllt und {xp }p ⊂ D \ {x0 } eine Folge mit
”
xp → x0 (p → ∞). Zu beliebig vorgegebenem ε > 0 wählen wir δ = δ(ε) > 0
wie in Definition 1.3 und N = N (ε) ∈ N so, dass gilt
0 < |xp − x0 | < δ(ε) für alle p ≥ N (ε).
Dann folgt aus Definition 1.3
|f (xp ) − a| < ε
für alle p ≥ N (ε),
also limp→∞ f (xp ) = a.
• ⇐“: Sei nun limp→∞ f (xp ) = a richtig für jede Folge {xp }p ⊂ D \ {x0 }
”
mit limp→∞ xp = x0 . Angenommen es gilt nicht limx→x0 f (x) = a, d.h.: Es
gibt ein ε > 0, so dass für alle δ > 0 ein x ∈ D existiert mit 0 < |x −
x0 | < δ und |f (x) − a| ≥ ε. Wählen wir speziell δ = p1 , so finden wir also
xp ∈ D mit 0 < |xp − x0 | < p1 und |f (xp ) − a| ≥ ε > 0 für alle p ∈ N. Da
dann aber für die Folge {xp }p ⊂ D \ {x0 } gilt limp→∞ xp = x0 , müsste nach
Voraussetzung |f (xp ) − a| → 0 (p → ∞) erfüllt sein, Widerspruch! Also gilt
doch limx→x0 f (x) = a.
q.e.d.
Satz 1.2: (Rechenregeln für Funktionsgrenzwerte)
Seien Funktionen f, g : D → Rd erklärt mit limx→x0 f (x) = a, limx→x0 g(x) = b,
wobei x0 Häufungspunkt von D ⊂ Rn sei. Dann gelten die Rechenregeln:
lim [λf (x) + µg(x)] = λa + µb
x→x0
für alle λ, µ ∈ R,
lim hf (x), g(x)i = ha, bi
x→x0
und für d = 2, also f, g : D → C, auch
lim [λf (x) + µg(x)] = λa + µb
x→x0
für alle λ, µ ∈ C,
lim f (x)g(x) = ab,
x→x0
lim
x→x0
a
f (x)
= ,
g(x)
b
falls g 6= 0 in D und b 6= 0 ist.
Beweis: Mit Satz 1.1 ergeben sich die Aussagen sofort aus den entsprechenden Rechenregeln für Folgengrenzwerte. Zur Übung kann man die Aussagen auch direkt
über die ε-δ-Definition“ 1.1 beweisen.
”
Wir betrachten noch einige spezielle Grenzprozesse für Funktionen einer reellen
Veränderlichen:
1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN
85
Definition 1.4: Es seien D ⊂ R und f : D → Rd gegeben.
(i) Gilt (x0 , x0 + α) ⊂ D und gibt es ein a ∈ Rd , so dass für alle ε > 0 ein
δ = δ(ε) ∈ (0, α) existiert mit
|f (x) − a| < ε
für alle 0 < x − x0 < δ,
so heißt a der rechtsseitige Limes von f an der Stelle x0 ; wir schreiben dann
f (x0 +) := lim f (x) = a
x→x0 +
oder
f (x) → a (x → x0 +).
(ii) Gilt (x0 − α, x0 ) ⊂ D und gibt es ein a ∈ Rd , so dass für alle ε > 0 ein
δ = δ(ε) ∈ (0, α) existiert mit
|f (x) − a| < ε
für alle 0 < x0 − x < δ,
so heißt a der linksseitige Limes von f an der Stelle x0 ; wir schreiben dann
f (x0 −) := lim f (x) = a
x→x0 −
oder
f (x) → a (x → x0 −).
(iii) Gilt (β, +∞) ⊂ D, so sagen wir, f (x) konvergiert gegen b ∈ Rd für x → +∞,
wenn f ( 1t ) → b (t → 0+) gilt; wir schreiben dann
lim f (x) = b
x→+∞
oder
f (x) → b (x → +∞).
(iv) Ist schließlich (−∞, β) ⊂ D, so sagen wir, f (x) konvergiert gegen b ∈ Rd für
x → −∞, wenn f ( 1t ) → b (t → 0−) richtig ist; wir schreiben dann
lim f (x) = b
x→−∞
oder
f (x) → b (x → −∞).
Bemerkung: Ist f : D → Rd , D ⊂ R und (x0 − α, x0 + α) \ {x0 } ⊂ D, so besitzt f
in x0 genau dann den Grenzwert limx→x0 f (x) =: a, wenn gilt
lim f (x) = a = lim f (x).
x→x0 −
x→x0 +
86
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Beispiele:
1. Für die Signumfunktion sgn(x) : R → R gilt in x0 = 0:
lim sgn(x) = −1,
lim sgn(x) = +1.
x→x0 +
x→0−
Also besitzt sgn(x) in x0 = 0 keinen Grenzwert.
2. Für die Funktion f (x) := x1 : (0, +∞) → R gilt limx→+∞ f (x) = 0, denn wir
haben f ( 1t ) = t → 0 (t → 0+).
Definition 1.5: Wir sagen, eine Funktion f : D → R konvergiert gegen +∞
(bzw. −∞) für x → x0 (x0 Häufungspunkt von D ⊂ Rn ), wenn zu jedem c > 0
ein δ > 0 existiert mit
f (x) > c
für alle x ∈ Bδ0 (x0 ) ∩ D.
(bzw. f (x) < −c)
Wir schreiben
lim f (x) = ±∞
x→x0
oder
f (x) → ±∞ (x → x0 ).
Bemerkungen:
1. Man erweitert entsprechend für Funktionen f : D → R, D ⊂ R, die einseitigen
Grenzwerte aus Definition 1.4 auf Werte ±∞.
2. M.H. von Satz 4.3 aus Kap. 1 und Satz 1.1 sieht man leicht: Sei f : D → R,
D ⊂ Rn , x0 Häufungspunkt von D, mit f (x) > 0 nahe“ x0 . Dann gilt
”
1
= 0.
lim f (x) = +∞ ⇔
lim
x→x0
x→x0 f (x)
Entsprechendes gilt im Falle n = 1 für die einseitigen Grenzwerte.
Beispiele:
√
1. limx→0+ x = 0. Ist nämlich ε > 0 beliebig, so wählen wir δ = δ(ε) := ε2 > 0
√
und erhalten 0 < x < ε für 0 < x < δ(ε). Nach der letzten Bemerkung folgt
√
noch limx→+∞ x = +∞, denn
1
lim √
x→+∞
x
2. Wir wissen bereits
Satz 1.2:
1
x
Def. 1.4 (iii)
=
lim
t→0+
√
t = 0.
→ 0 (x → +∞). Somit liefern die Rechenregeln aus
7−
7x − 2
= lim
x→+∞ 3 +
x→+∞ 3x + 1
lim
2
x
1
x
7
= .
3
2. DER STETIGKEITSBEGRIFF
87
√
√
3. Für beliebiges a ∈ R gilt limx→+∞ ( x + a − x) = 0, denn für positives
x > −a folgt aus Beispiel 1
√
√ √
√
√
√
|( x + a − x)( x + a + x)|
√
0 ≤ | x + a − x| =
√
x+a+ x
|a|
|a|
= √
√ < √ → 0 (x → +∞).
x
x+a+ x
4. limx→+∞
x3 +1
x2 +1
= +∞. Denn wir haben
1+
x2 + 1
1
= lim
· lim
3
x→+∞ x + 1
x→+∞ x x→+∞ 1 +
lim
1
x2
1
x3
= 0 · 1 = 0,
also die Behauptung aus obiger Bemerkung.
2
Der Stetigkeitsbegriff
Definition 2.1: Seien D ⊂ Rn , x0 ∈ D und eine Funktion f : D → Rd gegeben.
Dann heißt f in x0 stetig, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert, so dass
gilt
|f (x) − f (x0 )| < ε für alle x ∈ D mit |x − x0 | < δ.
Anderenfalls heißt f in x0 unstetig.
Bemerkungen:
1. Ist x0 ∈ D isolierter Punkt von D, so ist offenbar jede Funktion f : D → Rd
in x0 stetig.
2. Die Stetigkeit ist eine lokale Eigenschaft“, d.h.: Ist f in x0 stetig und ändern
”
wir f in D \ Br (x0 ) für ein r > 0 beliebig ab, so bleibt die resultierende
Funktion in x0 stetig.
Satz 2.1: (Charakterisierung der Stetigkeit)
Sei f : D → Rd auf D ⊂ Rn erklärt und sei x0 ∈ D Häufungspunkt. Dann sind
folgende Aussagen äquivalent:
(i) f ist stetig in x0 .
(ii) Es gilt lim f (x) = f (x0 ).
x→x0
(iii) Für jede Folge {xp }p ⊂ D \{x0 } mit xp → x0 (p → ∞) gilt lim f (xp ) = f (x0 ).
p→∞
Beweis: Sofort aus den Definitionen 1.3 und 2.1 sowie Satz 1.1.
q.e.d.
88
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Satz 2.2: (Rechenregeln)
(a) Sind f, g : D → Rd stetig in x0 ∈ D, so gilt dies auch für das Skalarprodukt
hf, gi und jede Linearkombination λf + µg mit λ, µ ∈ R.
(b) Sind f, g : D → C stetig in x0 ∈ D, so gilt dies auch für jede Linearkombination λf + µg mit λ, µ ∈ C, das Produkt f g und, falls g 6= 0 in D, auch für den
Quotienten fg .
Beweis: Sofort aus Satz 1.2 und Satz 2.1.
q.e.d.
Beispiele:
P
1. Polynomfunktionen p(z) = nk=0 ak z k mit Koeffizienten a0 , . . . , an ∈ C sind
in jedem Punkt z0 ∈ C stetig nach Satz 2.2, da dies für die konstante f1 (z) :=
c ∈ C und die lineare Funktion f2 (z) := z erfüllt ist.
2. Die Dirichletsche Sprungfunktion
(
f (x) :=
1, x ∈ Q
0, x ∈ R \ Q
ist in keinem Punkt aus R stetig. Die Funktion
(
x, x ∈ Q
f (x) :=
0, x ∈ R \ Q
ist in x = 0 und nur dort stetig (→ Übungsaufgaben).
3. Die Signumfunktion


 −1, x < 0
0,
x=0
sgn(x) :=


1,
x>0
ist für alle x ∈ R \ {0} stetig und in x = 0 unstetig.
Satz 2.3: (Komposition stetiger Funktionen)
Seien Funktionen f : D → Rd und g : E → Rm gegeben mit D ⊂ Rn , E ⊂ Rd und
f (D) ⊂ E. Weiter seien f in x0 ∈ D und g in y0 = f (x0 ) ∈ E stetig. Dann ist auch
die Komposition h := g ◦ f : D → Rm in x0 stetig.
Beweis: Da für isolierte Punkte x0 ∈ D nichts zu zeigen ist, können wir annehmen,
dass x0 Häufungspunkt von D ist. Sei nun {xp }p ⊂ D \ {x0 } mit xp → x0 (p → ∞)
eine beliebige Folge. Nach Satz 2.1 gilt dann
lim f (xp ) = f (x0 ) = y0 .
p→∞
2. DER STETIGKEITSBEGRIFF
89
Somit folgt wiederum nach Satz 2.1
lim h(xp ) = lim g(f (xp )) = g(y0 ) = h(x0 ),
p→∞
p→∞
also die behauptete Stetigkeit von h = g ◦ f .
q.e.d.
Definition 2.2: Eine Funktion f : D → Rd , D ⊂ Rn , nennen wir stetig (auf D),
wenn f in allen Punkten x ∈ D stetig ist. Mit C 0 (D, Rd ) bezeichnen wir die Klasse
aller auf D stetigen Funktionen. Für d = 1 schreiben wir auch kurz C 0 (D) :=
C 0 (D, R) und für d = 2 auch C 0 (D, C) := C 0 (D, R2 ).
Bemerkung: Gemäß Satz 2.2 wird C 0 (D, Rd ) durch die Verknüpfungen
(f + g)(x) := f (x) + g(x),
(λf )(x) := λf (x)
für x ∈ D
zu einem (unendlich dimensionalen) Vektorraum.
Wir wollen nun die Umkehrfunktion zu einer injektiven Funktion f : D → Rd
mit D ⊂ Rn betrachten, d.h. die Funktion f −1 : W → Rn mit W := f (D), die durch
die Forderung
f (x) = y
⇔
f −1 (y) = x für x ∈ D, y ∈ W
eindeutig bestimmt ist.
Satz 2.4: (Stetigkeit der Umkehrfunktion)
Sei K ⊂ Rn kompakt und f : K → Rd sei stetig und injektiv mit Wertebereich
W := f (K). Dann ist auch die Umkehrfunktion f −1 : W → Rn von f stetig auf W .
Beweis: Sei y0 ∈ W beliebig gewählt und sei {yp }p ⊂ W mit yp → y0 (p → ∞). Zu
zeigen ist dann
xp := f −1 (yp ) → f −1 (y0 ) =: x0 (p → ∞).
Die Folge {xp }p ⊂ K ist beschränkt, da K beschränkt ist. Sei nun ξ ∈ Rn ein
beliebiger Häufungspunkt von {xp }p und {xpk }k eine Teilfolge mit xpk → ξ (k → ∞).
Da K abgeschlossen ist, gilt ξ ∈ K. Die Stetigkeit von f liefert also f (xpk ) →
f (ξ) (k → ∞). Andererseits wissen wir
f (xpk ) = f (f −1 (ypk )) = ypk → y0 (p → ∞),
also f (ξ) = y0 = f (x0 ), so dass die Injektivität von f liefert ξ = x0 für alle Häufungspunkte von {xp }p . Das bedeutet lim xp = x0 , wie behauptet.
p→∞
q.e.d.
Wir wollen uns nun der Frage nach der Existenz der Umkehrfunktion für reellwertige Funktionen einer reellen Veränderlichen widmen. Wir beginnen mit einem
Satz, der von unabhängigem Interesse ist:
90
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Satz 2.5: (Zwischenwertsatz von Bolzano-Weierstraß)
Sei f : [a, b] → R stetig mit f (a) 6= f (b). Dann existiert zu jedem Wert c zwischen
f (a) und f (b) mindestens ein ξ ∈ (a, b) mit f (ξ) = c.
Beweis: Wir können f (a) < c < f (b) annehmen; anderenfalls gehen wir zu −f und
−c über. Wir betrachten nun die Menge
M := {x ∈ [a, b] : f (x) < c},
die offenbar nichtleer und beschränkt ist. Setzen wir ξ := sup M , so gibt es eine
Folge {xp }p ⊂ M mit xp → ξ (p → ∞); vgl. Hilfssatz 6.1 aus Kap. 1. Die Stetigkeit
von f liefert also f (ξ) = limp→∞ f (xp ) ≤ c, und nach Voraussetzung folgt ξ < b.
Wäre nun f (ξ) < c, so gäbe es wegen der Stetigkeit von f ein δ ∈ (0, b − ξ), so
dass gilt
f (x) < c für alle x ∈ [ξ, ξ + δ),
im Widerspruch zur Wahl von ξ = sup M . Also folgt f (ξ) = c.
q.e.d.
Folgerung 2.1: Sei I ⊂ R ein beliebiges, nicht notwendig beschränktes Intervall
und f : I → R eine stetige Funktion. Dann ist auch f (I) ⊂ R ein Intervall.
Beweis: Wir setzen I ∗ = f (I) und
ξ := inf I ∗ ∈ R ∪ {−∞},
η := sup I ∗ ∈ R ∪ {+∞}.
Wir zeigen nun (ξ, η) ⊂ I ∗ : Ist nämlich y ∈ (ξ, η) beliebig, so gibt es gemäß Hilfssatz 6.1 aus Kap. 1 Zahlen a, b ∈ I mit
ξ ≤ f (a) < y < f (b) ≤ η.
Nach dem Zwischenwertsatz existiert nun ein x ∈ [a, b] ⊂ I mit f (x) = y, d.h. y ∈ I ∗ .
Wir erhalten, dass I ∗ eines der folgenden Intervalle sein muss:
(ξ, η),
[ξ, η),
(ξ, η] oder
[ξ, η].
Sonst gäbe es nämlich ein z ∈ I ∗ mit z < ξ oder z > η, im Widerspruch zur
Definition von ξ und η.
q.e.d.
Definition 2.3: Eine Funktion f : D → R, D ⊂ R, heißt monoton wachsend
(bzw. fallend), wenn
f (x) ≤ f (y)
(bzw. f (x) ≥ f (y))
für alle x, y ∈ D mit x < y
erfüllt ist. f heißt streng monoton wachsend (bzw. fallend), wenn gilt
f (x) < f (y)
(bzw. f (x) > f (y))
für alle x, y ∈ D mit x < y.
3. KOMPAKTA UND GLEICHMÄSSIGE STETIGKEIT
91
Satz 2.6: Sei I ⊂ R ein Intervall. Dann besitzt jede stetige, streng monotone Funktion f : I → R eine stetige, streng monotone Umkehrfunktion f −1 : I ∗ → R mit dem
Intervall I ∗ := f (I).
Beweis: Zunächst ist eine streng monotone Funktion offensichtlich injektiv. Also existiert die Umkehrfunktion f −1 : I ∗ → R, und nach Folgerung 2.1 ist I ∗ ein Intervall.
O.B.d.A. sei nun f streng monoton wachsend, sonst gehen wir zu −f über. Dann ist
auch f −1 streng monoton wachsend. Zu zeigen bleibt also die Stetigkeit von f −1 :
• Sei dazu zunächst y0 ∈ int I ∗ . Dann ist auch x0 := f −1 (y0 ) ∈ int I aufgrund
der Monotonie. Also existiert ein ε > 0 mit [x0 − ε, x0 + ε] ⊂ I, und nach
Satz 2.4 ist f −1 stetig auf f ([x0 − ε, x0 + ε]), also insbesondere in f (x0 ) = y0 .
• Sei nun y0 6∈ int I ∗ . Dann ist y0 ein Endpunkt von I ∗ , sagen wir der linke
Endpunkt. Somit muss, wieder wegen der Monotonie, auch x0 := f −1 (y0 ) linker
Endpunkt von I sein. Es gibt dann ein ε > 0, so dass gilt [x0 , x0 + ε] ⊂ I und
nach Satz 2.4 ist f −1 stetig auf f ([x0 , x0 + ε]) und insbesondere in f (x0 ) = y0 .
q.e.d.
3
Stetige Funktionen auf Kompakta, gleichmäßige Stetigkeit
Wir haben in Paragraph 2 gesehen, dass stetige, injektive Funktionen auf kompakten
Mengen eine stetige Umkehrfunktion besitzen. In diesem Paragrphen wollen wir weitere Eigenschaften kennenlernen, die Kompakta als Definitionsgebiete auszeichnen.
Wir beginnen mit dem
Satz 3.1: Ist K ⊂ Rn kompakt und f ∈ C 0 (K, Rd ), dann ist auch f (K) ⊂ Rd
kompakt.
Beweis: Sei {yp }p ⊂ f (K) eine beliebige Folge. Zu jedem yp gibt es (mindestens) ein
xp ∈ K mit f (xp ) = yp . Da K kompakt ist, können wir nach Kap. 1, Satz 10.8 aus
{xp }p ⊂ K eine konvergente Teilfolge {xpl }l auswählen mit liml→∞ xpl =: x0 ∈ K.
Die Stetigkeit von f ergibt nun
ypl = f (xpl ) → f (x0 ) =: y0 ∈ f (K)
für l → ∞.
Wiederum Satz 10.8 aus Kap. 1 liefert die behauptete Kompaktheit von f (K).
q.e.d.
Eines der wichtigsten Hilfsmittel der Analysis enthält der folgende
92
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Satz 3.2: (Weierstraßscher Hauptlehrsatz)
Sei K ⊂ Rn kompakt und nichtleer und sei f ∈ C 0 (K, R). Dann gibt es Punkte
x, x ∈ K, so dass gilt
f (x) ≤ f (x) ≤ f (x)
für alle x ∈ K.
(3.1)
Bemerkung: Relation (3.1) können wir auch schreiben als
f (x) = inf f (K) =: inf f (x) = inf f,
x∈K
K
f (x) = sup f (K) =: sup f (x) = sup f.
x∈K
K
Das heißt: Eine stetige, auf einem Kompaktum erklärte Funktion nimmt dort ihr
Infimum (=Minimum) bzw. Supremum (=Maximum) an. Die Aussage wird offenbar
falsch, wenn man eine der Voraussetzungen fallen lässt.
Beweis von Satz 3.2: Nach Satz 3.1 ist f (K) ⊂ R beschränkt und abgeschlossen.
Inbesondere existieren also
m := inf f ∈ R,
K
m := sup f ∈ R.
K
Nach Hilfssatz 6.1 aus Kap. 1 gibt es nun zwei Folgen {xp }p , {xp }p ⊂ K mit
f (xp ) → m, f (xp ) → m (p → ∞).
(3.2)
Da K kompakt ist, können wir andererseits konvergente Teilfolgen {xpl }l , {xpl }l
auswählen mit x := liml→∞ xpl ∈ K und x := liml→∞ xpl ∈ K. Die Stetigkeit von f
liefert dann
f (xpl ) → f (x), f (xpl ) → f (x) (l → ∞).
(3.3)
Ein Vergleich von (3.2) und (3.3) ergibt also
f (x) = m ≤ f (x) ≤ m = f (x) für alle x ∈ K,
wie behauptet.
q.e.d.
Für die Formulierung des dritten grundlegenden Resultats benötigen wir noch
die folgende Verschärfung des Stetigkeitsbegriffs:
Definition 3.1: Sei D ⊂ Rn und f : D → Rd gegeben. Dann heißt f gleichmäßig
stetig auf D, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert, so dass gilt
|f (x) − f (x0 )| < ε
für alle x, x0 ∈ D mit |x − x0 | < δ.
(3.4)
4. FUNKTIONENFOLGEN UND GLEICHMÄSSIGE KONVERGENZ
93
Bemerkung: Für eine stetige Funktion f ∈ C 0 (D, Rd ) gilt (3.4) ebenfalls, jedoch
mit einem i.A. von x, x0 ∈ D abhängigen δ = δ(ε, x, x0 ). Jede gleichmäßig stetige
Funktion ist also stetig. Die Umkehrung gilt jedoch nicht, wie etwa das Beispiel
f (x) := x1 , x ∈ (0, 1], zeigt: Angenommen es gäbe z.B. für ε = 1 ein δ > 0, so
dass |f (x) − f (x0 )| < 1 für alle x, x0 ∈ (0, 1] mit |x − x0 | < δ richtig ist. Speziell für
0 < x < min{δ, 12 } und x0 = 2x folgte dann aber |x−x0 | = x < δ und |f (x)−f (x0 )| =
1
1
| = 2x
> 1, Widerspruch!
| x1 − 2x
Satz 3.3: (Heine)
Ist K ⊂ Rn kompakt und f ∈ C 0 (K, Rd ), so ist f gleichmäßig stetig.
Beweis: Angenommen, f ist nicht gleichmäßig stetig. Dann gibt es also ein ε > 0,
so dass für alle δ > 0 Punkte x, x0 ∈ K mit |x − x0 | < δ existieren, für die gilt
|f (x) − f (x0 )| ≥ ε. Wählen wir insbesondere δ = p1 , p ∈ N, so finden wir also Folgen
{xp }p , {x0p }p ⊂ K mit
1
|xp − x0p | <
für alle p ∈ N
(3.5)
p
und
|f (xp ) − f (x0p )| ≥ ε für alle p ∈ N.
(3.6)
Da nun K kompakt ist, existiert nach Satz 10.8 aus Kap. 1 eine konvergente Teilfolge
{xpl }l ⊂ {xp }p mit liml→∞ xpl = x0 ∈ K. Für die entsprechende Teilfolge {x0pl }l
liefert (3.5) ebenfalls liml→∞ x0pl = x0 . Und aus der Stetigkeit von f und (3.6)
folgern wir
¯
¯
¯
¯
0 = |f (x0 ) − f (x0 )| = ¯ lim f (xpl ) − lim f (x0pl )¯ = lim |f (xpl ) − f (x0pl )| ≥ ε > 0,
l→∞
l→∞
l→∞
also einen Widerspruch!
q.e.d.
Bemerkung: Im obigen Beispiel f (x) =
nicht kompakt.
4
1
x,
x ∈ (0, 1], ist zwar f stetig aber (0, 1]
Funktionenfolgen und gleichmäßige Konvergenz
Wir betrachten nun Folgen {fn }n von Funktionen fn : D → Rd , die alle auf ein und
derselben nichtleeren Menge D ⊂ Rm erklärt seien.
Definition 4.1: Eine Funktionenfolge {fn }n mit fn : D → Rd , n ∈ N, heißt punktweise konvergent auf D ⊂ Rm , wenn die Punktfolge {fn (x)}n ⊂ Rd für jedes x ∈ D
konvergent ist. Die Grenzwerte
f (x) := lim fn (x),
n→∞
x ∈ D,
definieren dann eine Funktion f : D → Rd , den sogenannten punktweisen Limes der
Funktionenfolge {fn }n . Schreibweise: fn → f (n → ∞) auf D.
94
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Beispiele:
1. D = [0, 1] ⊂ R, fn (x) := xn . {fn }n konvergiert bekanntlich punktweise gegen
die Funktion
(
0, x ∈ [0, 1)
f (x) :=
.
1, x = 1
1
2. D = [0, +∞), gn (x) := x n . Dann konvergiert {gn }n punktweise gegen
(
1, x ∈ (0, +∞)
g(x) :=
.
0, x = 0
Die Beispiele zeigen, dass der punktweise Limes einer Folge stetiger Funktionen
nicht wieder stetig sein muss. Um beim Grenzübergang in der Klasse der stetigen
Funktionen zu bleiben, benötigen wir einen stärkeren Konvergenzbegriff, der auf
Weierstraß zurückgeht:
Definition 4.2: Eine Folge {fn }n von Funktionen fn : D → Rd mit D ⊂ Rm heißt
gleichmäßig konvergent gegen f : D → Rd , in Zeichen fn →
→ f (n → ∞) auf D,
wenn zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit
|fn (x) − f (x)| < ε
für alle x ∈ D und n ≥ N (ε).
(4.1)
Bemerkung: Formel (4.1) gilt natürlich auch für den punktweisen Limes einer Funktionenfolge, allerdings mit einem i.A. von x ∈ D abhängigen N = N (ε, x) ∈ N.
Satz 4.1: (Weierstraßscher Konvergenzsatz)
Die Folge {fn }n stetiger Funktionen fn : D → Rd konvergiere auf D ⊂ Rm gleichmäßig gegen f : D → Rd . Dann ist f stetig auf D.
Beweis: Nach Definition 4.2 gibt es zu beliebig gewähltem ε > 0 ein N = N (ε) ∈ N
mit
ε
|fN (x) − f (x)| <
für alle x ∈ D.
(4.2)
3
Sei nun x0 ∈ D gewählt. Da fN stetig ist, finden wir ein δ = δ(ε) > 0, so dass gilt
|fN (x) − fN (x0 )| <
ε
3
für alle x ∈ D mit |x − x0 | < δ.
Mit der Dreiecksungleichung erhalten wir nun aus (4.2) und (4.3)
|f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )|
ε ε ε
+ + = ε für alle x ∈ D mit |x − x0 | < δ,
<
3 3 3
(4.3)
4. FUNKTIONENFOLGEN UND GLEICHMÄSSIGE KONVERGENZ
wie behauptet.
95
q.e.d.
Der nächste Satz besagt insbesondere, dass der Raum der stetigen Funktionen“
”
im unten zu präzisierenden Sinne vollständig ist:
Satz 4.2: (Cauchys Konvergenzkriterium bei gleichmäßiger Konvergenz)
Sei {fn }n eine Folge von Funktionen fn : D → Rd , D ⊂ Rm . Dann konvergiert
{fn }n genau dann gleichmäßig (gegen ein f : D → Rd ), wenn zu jedem ε > 0 ein
N = N (ε) ∈ N existiert mit
|fn (x) − fk (x)| < ε
für alle x ∈ D und n, k ≥ N (ε).
(4.4)
Beweis:
• ⇒“: Sei fn →
→ f (n → ∞) auf D erfüllt. Dann existiert zu beliebigem ε > 0
”
ein N (ε) ∈ N mit |fn (x) − f (x)| < 2ε für alle x ∈ D und n ≥ N (ε). Mit der
Dreiecksungleichung folgt dann (4.4).
• ⇐“: Sei umgekehrt (4.4) erfüllt. Wegen der Vollständigkeit des Rd existiert
”
dann der punktweise Limes f (x) = limk→∞ fk (x), x ∈ D. Wenden wir (4.4)
auf 2ε statt ε an und gehen zur Grenze k → ∞ über, so folgt
|fn (x) − f (x)| = lim |fn (x) − fk (x)| ≤
k→∞
ε
< ε für alle x ∈ D, n ≥ N (ε),
2
also fn →
→ f (n → ∞) auf D.
Q.e.d.
Definition 4.3: Auf dem (Vektor)-Raum der stetigen, beschränkten Funktionen
Cb0 (D, Rd ) := {f ∈ C 0 (D, Rd ) : f ist beschränkt}
für nichtleeres D ⊂ Rm erklären wir die Supremumsnorm
kf kD := sup |f (x)| < +∞.
x∈D
Bemerkungen:
1. Falls D = K ⊂ Rm kompakt ist, ist nach Satz 3.2 jede Funktion f ∈ C 0 (K, Rd )
beschränkt.
2. Allgemein heißt eine Abbildung k · k : V → [0, +∞) eine Norm auf dem
(i.A. unendlich dimensionalen) Vektorraum V, wenn folgende Normeigenschaften erfüllt sind:
(a) kf k ≥ 0 für alle f ∈ V und kf k = 0 ⇔ f = 0.
(b) kλf k = |λ| kf k für alle f ∈ V und alle λ ∈ R.
96
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
(c) kf + gk ≤ kf k + kgk für alle f, g ∈ V.
Zum Beispiel ist also | · | : Rd → [0, +∞) eine Norm auf dem d-dimensionalen
Vektorraum Rd .
Als Übungsaufgabe prüft man nach, dass die Supremumsnorm tatsächlich eine
Norm mit den Eigenschaften (a)-(c) auf V = Cb0 (D, Rd ) ist.
3. Für eine Funktionenfolge {fn }n ⊂ Cb0 (D, Rd ) gilt
fn →
→ f (n → ∞) auf D
⇔
kfn − f kD → 0 (n → ∞).
Das ist sofort klar, wenn man noch f ∈ Cb0 (D, Rd ) für die Grenzfunktion
beachtet.
4. Satz 4.2 besagt noch: Eine Folge {fn }n ⊂ Cb0 (D, Rd ) konvergiert genau dann
gleichmäßig auf D, wenn zu jedem ε > 0 ein N (ε) ∈ N existiert mit
kfn − fk kD < ε für alle n, k ≥ N (ε).
(4.5)
Eine Funktionenfolge {fn }n mit der Eigenschaft (4.5) nennen wir Cauchyfolge
in Cb0 (D, Rd ). Wir haben also die
Folgerung 4.1: Der Vektorraum Cb0 (D, Rd ) der stetigen, beschränkten Funktionen
auf D ⊂ Rm ist vollständig bez. der Supremumsnorm, d.h. zu jeder Cauchyfolge
{fn }n ⊂ Cb0 (D, Rd ) existiert ein f ∈ Cb0 (D, Rd ) mit kfn − f kD → 0 (n → ∞).
Bemerkung: Damit ist Cb0 (D, Rd ) mit der Norm k · kD ein Beispiel eines Banachraums oder vollständigen normierten Raums. Banachräume werden vor allem in der
Funktionalanalysis genauer untersucht.
Wir wollen nun, analog zu komplexen Reihen, Funktionenreihen untersuchen:
Definition 4.4: Ist {fk }k eine Folge
fk : D → C, D ⊂ Rm , so heißt
P
P∞ von Funktionen
die zugehörige Funktionenreihe k=1 fk = k fk gleichmäßig konvergent, wenn die
Folge der Partialsummen
sn (x) :=
n
X
fk (x),
x ∈ D,
k=1
gleichmäßig konvergiert.
Bemerkungen:
1. P
Gilt {fk }k ⊂ C 0 (D, C), so ist auch {sn }n ⊂ C 0 (D, C). Konvergiert also
∞
k=1 fk gleichmäßig, so ist die Grenzfunktion (=Wert der Funktionenreihe)
eine stetige Funktion nach Satz 4.1.
4. FUNKTIONENFOLGEN UND GLEICHMÄSSIGE KONVERGENZ
97
2. Wir beschränken uns hier auf komplexwertige Funktionenreihen, da wir bisher nur komplexe Reihen betrachtet haben. Man kann die Aussagen leicht
auf Rd -wertige Funktionenreihen übertragen, indem man die entsprechenden
Ergebnisse aus Kap. 1, § 8 auf Reihen in Rd erweitert.
Satz 4.3: (Majorantenkriterium für Funktionenreihen)
Sei D ⊂ Rm und {fk }k eine Folge von Funktionen fk : D → C. Ferner sei {ck }k ⊂ R
eine Punktfolge mit der Eigenschaft
|fk (x)| ≤ ck
für alle x ∈ D.
(4.6)
P∞
Falls dann
k=1 ck konvergiert, so
k=1 fk gleichmäßig auf D. Die
P
P konvergiert
Reihe k ck heißt Majorante von k fk .
P∞
Beweis: Sei ε > 0 gewählt. Satz 8.1 aus Kap. 1 und (4.6) liefern zunächst
n
X
|fk (x)| ≤
k=m+1
n
X
ck < ε für alle x ∈ D und n > m ≥ N (ε)
k=m+1
mit geeignetem N (ε) ∈ N. Aus der Dreiecksungleichung folgt dann
¯ n
¯
n
X
¯ X
¯
¯
|sn (x) − sm (x)| = ¯
fk (x)¯¯ ≤
|fk (x)| < ε
k=m+1
k=m+1
für alle x ∈ D und n > m ≥ N (ε). Satz 4.2 liefert also die Behauptung.
q.e.d.
Als Folgerung halten wir das folgende wichtige Resultat fest:
P
k
Satz 4.4: Es seien {ak }k ⊂ C, R ∈ (0, +∞) ∪ {+∞} und P(z) := ∞
k=0 ak z eine
in KR (0) = {z ∈ C : |z| < R} konvergente Potenzreihe. Dann ist P : KR (0) → C
stetig.
Beweis: Sei z0 ∈ KR (0) beliebig, so folgt z0 ∈ KR0 (0) mit R0 := |z0 | < R. Nun ist
für D := KR0 (0) die Folge {ak z k }k ⊂ C 0 (D, C) durch {|akP
|R0k }k ⊂ R majorisiert im
Sinne von (4.6), und nach Satz 9.2 aus Kap. 1 konvergiert k |ak |R0k . Satz 4.3 liefert
also die gleichmäßige Konvergenz der Potenzreihe P auf D. Und nach Satz 4.1 ist P
stetig auf D = KR0 (0), also insbesondere auch im Punkt z0 . Da z0 ∈ KR (0) beliebig
war, folgt P ∈ C 0 (KR (0), C), wie behauptet.
q.e.d.
Folgerung 4.2: Die komplexe Exponentialfunktion
z
exp z = e :=
∞
X
zk
k=0
ist auf ganz C stetig.
k!
98
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Wir werden exp z genauer im nächsten Kapitel untersuchen und hieraus auch
die weiteren elementaren Funktionen wie Sinus, Cosinus, Hyperbelfunktionen, Logarithmus und allgemeine Potenz ableiten.
Kapitel 3
Differential- und
Integralrechnung in einer reellen
Veränderlichen
1
Differenzierbarkeit
Wir untersuchen Funktionen einer reellen Veränderlichen f : I → Rd für d ∈ N.
Hier und im Folgenden sei I ⊂ R ein (nicht notwendig beschränktes) Intervall. Wir
beginnen mit einem der wichtigsten Begriffe der Analysis überhaupt:
Definition 1.1: Eine Funktion f : I → Rd heißt differenzierbar an der Stelle t0 ∈ I,
falls der Grenzwert
f (t0 + h) − f (t0 )
f (t) − f (t0 )
= lim
t→t
h→0
h
t − t0
0
f 0 (t0 ) := lim
(1.1)
existiert. f 0 (t0 ) heißt (erste) Ableitung oder Differentialquotient von f an der Stelle
t0 . Alternativ schreiben wir auch
df
(t0 ),
dt
Df (t0 )
oder
f˙(t0 )
für die Ableitung. Falls t0 ein Randpunkt von I ist, so ist der Grenzwert h → 0 in
(1.1) als einseitiger Grenzwert h → 0+ bzw. h → 0− aufzufassen.
Die Funktion f : I → Rd heißt differenzierbar (auf I), wenn f in jedem Punkt
t0 ∈ I differenzierbar ist.
99
100
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Bemerkungen:
1. Geometrische Interpretationen:
(a) Der Differenzenquotient
∆h f (t0 ) :=
f (t0 + h) − f (t0 )
h
einer Funktionf : I → R ist die Steigung der Sekante an graph f durch
(t0 , f (t0 )) und (t0 + h, f (t0 + h)). Bei Grenzübergang h → 0 geht die
Sekante in die Tangente
©
ª
T := (t, y) ∈ R2 : y = f 0 (t0 )(t − t0 ) + f (t0 )
an graph f im Punkt (t0 , f (t0 )) über; f 0 (t0 ) ist die Steigung der Tangente.
(b) Für eine Kurve f : I → Rd im Rd sind ∆h f (t0 ) Sekantenvektoren in
Rd und f 0 (t0 ) wird als Tangentenvektor an die Kurve im Punkt f (t0 )
interpretiert (und abgetragen).
2. Zum Beispiel sind die Funktionen f (t) := t, g(t) := c mit einer Konstanten
c ∈ R für alle t ∈ R differenzierbar und es gilt
f 0 (t) = 1,
g 0 (t) = 0
für alle t ∈ R.
3. Falls f : I → Rd differenzierbar ist, so kann man die Zuordnung t 7→ f 0 (t)
wieder als Funktion f 0 : I → Rd interpretieren. Ist f 0 differenzierbar in t0 ∈ I,
so können wir f 00 (t0 ) := (f 0 )0 (t0 ) bilden, die zweite Ableitung von f an der
Stelle t0 , mit den alternativen Schreibweisen
f 00 (t0 ) =
d2 f
(t0 ) = D2 f (t0 ) = f¨(t0 ).
dt2
Ist f 0 auf ganz I differenzierbar, so fassen wir f 00 : I → Rd wiederum als
Funktion auf.
Falls allgemein die (n − 1)-te Ableitung f (n−1) : I → Rd für ein n ∈ N definiert
und in t0 ∈ I differenzierbar ist, wobei f (0) := f gesetzt wird, so erklären wir
die n-te Ableitung von f in t0 als f (n) (t0 ) := (f (n−1) )0 (t0 ). Wir schreiben dann
auch
dn f
f (n) (t0 ) = n (t0 ) = Dn f (t0 ).
dt
Wenn die n-te Ableitung f (n) auf ganz I existiert, so heißt f n-mal differenzierbar.
1. DIFFERENZIERBARKEIT
101
Satz 1.1: Ist f : I → Rd gegeben, so sind die folgenden Aussagen äquivalent:
(i) f ist in t0 ∈ I differenzierbar.
(ii) Es existiert ein a ∈ Rd und eine in t0 stetige Funktion ϕ : I → Rd mit
ϕ(t0 ) = 0, so dass gilt
f (t) = f (t0 ) + (t − t0 )a + (t − t0 )ϕ(t)
für alle t ∈ I.
(1.2)
Beweis:
• ⇒“: Sei f in t0 differenzierbar. Wir setzen dann a := f 0 (t0 ) und
”

 f (t) − f (t0 ) − a, falls t ∈ I \ {t }
0
t − t0
ϕ(t) :=
.

0,
für t = t0
Offenbar ist dann ϕ in t0 stetig mit ϕ(t0 ) = 0, und Umstellen liefert die
gesuchte Darstellung (1.2).
• ⇐“: Haben wir umgekehrt (1.2), so liefert Umstellen
”
f (t) − f (t0 )
= a + ϕ(t) → a (t → t0 ),
t − t0
also die Differenzierbarkeit von f in t0 .
q.e.d.
Bemerkung: Der Beweis zeigt, dass a eindeutig bestimmt ist und dass gilt a = f 0 (t0 ).
Die Darstellung (1.2) liefert also eine lineare Approximation von f durch
L(t) := f (t0 ) + (t − t0 )f 0 (t0 ),
t ∈ R.
Setzen wir noch ψ(t) := a + ϕ(t) füt t ∈ I, so haben wir die zu (1.2) äquivalente
Darstellung
f (t) = f (t0 ) + (t − t0 )ψ(t), t ∈ I,
(1.3)
wobei nun ψ : I → Rd in t0 stetig ist und ψ(t0 ) = f 0 (t0 ) erfüllt.
Folgerung 1.1: Eine in t0 ∈ I differenzierbare Funktion f : I → Rd ist in t0 stetig.
Beweis: Sofort aus Darstellung (1.2).
q.e.d.
Bemerkungen:
1. Die Umkehrung von Folgerung 1.1 gilt nicht, wie etwa das Beispiel f (t) := |t| im
Punkt t0 = 0 zeigt. Es gibt sogar stetige, nirgends differenzierbare Funktionen;
siehe S. Hildebrandt: Analysis 1 (Springer-Verlag), S. 192.
102
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
2. Eine Funktion f = (f1 , . . . , fd ) : I → Rd ist genau dann in t0 ∈ I differenzierbar, wenn alle Komponentenfunktionen f1 , . . . , fd in t0 differenzierbar sind;
dann gilt
¡
¢
f 0 (t0 ) = f10 (t0 ), . . . , fd0 (t0 ) .
3. Wie die Stetigkeit ist auch die Differenzierbarkeit (in einem Punkt) eine lokale
Eigenschaft.
Für komplexwertige Funktionen gelten folgende Rechenregeln:
Satz 1.2: Sind f, g : I → C in t0 ∈ I differenzierbar, so gilt dies auch für f + g,
f · g und, falls g 6= 0 auf I, auch für fg , und wir haben:
(λf + µg)0 (t0 ) = λf 0 (t0 ) + µg 0 (t0 )
für λ, µ ∈ C,
(f g)0 (t0 ) = f 0 (t0 )g(t0 ) + f (t0 )g 0 (t0 ) (Produktregel),
³ f ´0
f 0 (t0 )g(t0 ) − f (t0 )g 0 (t0 )
(t0 ) =
(Quotientenregel).
g
g(t0 )2
(1.4)
(1.5)
(1.6)
Beweis: Nach Satz 1.1 und der anschließenden Bemerkung haben wir die Darstellungen
f (t) = f (t0 ) + (t − t0 )ψ(t),
g(t) = g(t0 ) + (t − t0 )χ(t),
mit in t0 stetigen Funktionen ψ, χ : I → C, die ψ(t0 ) = f 0 (t0 ), χ(t0 ) = g 0 (t0 ) erfüllen.
Damit folgen
λf (t) + µg(t) = [λf (t0 ) + µg(t0 )] + (t − t0 )[λψ(t) + µχ(t)],
£
¤
f (t) · g(t) = [f (t0 )g(t0 )] + (t − t0 ) ψ(t)g(t0 ) + f (t0 )χ(t) + (t − t0 )ψ(t)χ(t) ,
f (t)
g(t)
=
f (t0 )
ψ(t)g(t0 ) − f (t0 )χ(t)
+ (t − t0 )
.
g(t0 )
g(t)g(t0 )
Wiederum Satz 1.1 liefert die Behauptung.
q.e.d.
Bemerkung: Eine (1.4) entsprechende Regel gilt natürlich auch für Funktionen f, g :
I → Rd , dann mit λ, µ ∈ R. Formel (1.5) ist für solche Funktionen durch die Relation
hf, gi0 (t0 ) = hf 0 (t0 ), g(t0 )i + hf (t0 ), g 0 (t0 )i
zu ersetzen (Übungsaufgabe).
(1.7)
1. DIFFERENZIERBARKEIT
103
Beispiele:
1.
d
n
dx (x )
= nxn−1 für n ∈ N0 und beliebiges x ∈ R.
Denn für n = 0, 1 ist die Aussage klar und durch Induktionsschluss n → n + 1
haben wir: Mit xn ist nach Satz 1.2 auch xn+1 = xn · x differenzierbar und es
gilt
d n+1
(x
)
dx
=
(IV )
=
2.
d
−n )
dx (x
d n
(x · x)
dx
(1.5)
(xn )0 x + xn x0
=
nxn−1 x + xn · 1 = (n + 1)xn .
= −nx−n−1 für n ∈ N und x ∈ R \ {0}.
Denn nach Beispiel 1 und Satz 1.2 ist x−n = x1n in R \ {0} differenzierbar, und
es gilt
d −n (1.6) (1)0 · xn − 1 · (xn )0
(x ) =
= −nx−n−1 .
dx
x2n
Insgesamt haben wir also
d ν
(x ) = νxν−1
dx
für alle ν ∈ Z
und x ∈ R \ {0}.
Definition 1.2: Für beliebige k ∈ N0 erklären wir den Vektorraum C k (I, Rd ) aller
k-mal stetig differenzierbaren Funktionen f : I → Rd , die auf I Ableitungen bis zur
k-ten Ordnung besitzen und für die f (k) : I → Rd stetig ist. Weiter erklären wir
\
C ∞ (I, Rd ) :=
C k (I, Rd ),
k∈N0
den Vektorraum der unendlich oft stetig differenzierbaren Funktionen.
Schließlich schreiben wir auch C k (I) bzw. C k (I, C) für die reell- bzw. komplexwertigen k-mal stetig differenzierbaren Funktionen (k ∈ N0 ∪ {∞}) auf I.
Bemerkung: Dass C k (I, Rd ) ein Vektorraum ist für alle k ∈ N0 ∪ {∞}, folgt aus
Satz 1.2. Nach Folgerung 1.1 sind alle Ableitungen f (= f (0) ), f 0 (= f (1) ), . . . , f (k)
einer Funktion f ∈ C k (I, Rd ) stetig auf I. Insbesondere folgt
C k (I, Rd ) ⊂ C l (I, Rd )
für l ≤ k.
Wir untersuchen nun die Komposition zweier differenzierbarer Funktionen:
Satz 1.3: (Kettenregel)
Seien I, J ⊂ R Intervalle und f : I → R, g : J → Rd zwei Funktionen mit f (I) ⊂ J.
Falls f in x0 ∈ I und g in y0 := f (x0 ) ∈ J differenzierbar sind, so ist auch die
Komposition h := g ◦ f : I → Rd in x0 differenzierbar, und es gilt
h0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).
(1.8)
104
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis: Aus Satz 1.1 und der anschließenden Bemerkung entnehmen wir
f (x) = f (x0 ) + (x − x0 )ψ(x),
g(y) = g(y0 ) + (y − y0 )χ(y)
mit in x0 bzw. y0 = f (x0 ) stetigen Funktionen ψ : I → R, χ : J → Rd , für die
ψ(x0 ) = f 0 (x0 ) bzw. χ(y0 ) = g 0 (y0 ) gilt. Es folgt also
¡
¢
g(f (x)) = g(f (x0 )) + f (x) − f (x0 ) χ(f (x))
£
¤
= g(f (x0 )) + (x − x0 )) χ(f (x))ψ(x) .
Und da die Funktion χ(f (x))ψ(x) nach Satz 2.3 aus Kap. 2 wieder stetig ist in x0 ,
ist h = g ◦ f nach Satz 1.1 differenzierbar und es gilt
¯
h0 (x0 ) = χ(f (x))ψ(x)¯x=x0 = g 0 (f (x0 ))f 0 (x0 ),
wie behauptet.
q.e.d.
Wir wenden uns nun wieder der Untersuchung der Umkehrfunktion einer injektiven Funktion f : I → R zu:
Satz 1.4: (Ableitung der Umkehrfunktion)
Sei f : I → R eine stetige Funktion, die das Intervall I ⊂ R bijektiv auf I ∗ := f (I)
abbilde. Ist dann f in x0 ∈ I differenzierbar und gilt f 0 (x0 ) 6= 0, so ist auch die
Umkehrfunktion g := f −1 : I ∗ → R in y0 := f (x0 ) differenzierbar und es gilt
g 0 (y0 ) =
1
.
f 0 (x0 )
(1.9)
Beweis: Da f streng monoton ist, ist I ∗ nach Satz 2.6 aus Kap. 2 wieder ein Intervall
und g = f −1 stetig auf I ∗ . Ist also {yn }n ⊂ I ∗ \{y0 } eine beliebige (nun existierende)
Folge mit limn→∞ yn = y0 , so gilt
lim g(yn ) = g(y0 ) = x0 .
n→∞
Setzen wir noch xn := g(yn ) ∈ I \ {x0 } für n ∈ N, so haben wir
h f (x ) − f (x ) i−1
g(yn ) − g(y0 )
xn − x0
n
0
=
=
,
yn − y0
f (xn ) − f (x0 )
xn − x0
n ∈ N.
(1.10)
Da f in x0 differenzierbar ist mit f 0 (x0 ) 6= 0, können wir in (1.10) zur Grenze n → ∞
übergehen und erhalten
g(yn ) − g(y0 )
1
= 0
.
n→∞
yn − y0
f (x0 )
lim
1. DIFFERENZIERBARKEIT
105
Nach Satz 1.1 aus Kap. 2 existiert also der Grenzwert limy→y0
es gilt (1.9).
g(y)−g(y0 )
y−y0
= g 0 (y0 ) und
q.e.d.
Beispiel: Die Funktion f (x) := xn , n ∈ N, bildet [0, +∞) bijektiv auf [0, +∞) ab
√
mit der Umkehrfunktion g(y) = f −1 (y) = n y. Für x > 0 gilt f 0 (x) = nxn−1 > 0, so
dass Satz 1.4 liefert
¡ √ ¢0
1 1
1
n
= y n −1 .
y =
√
n−1
n
n( y)
n
Für die Potenzfunktion f (x) := xq , x > 0, mit einem q = rs ∈ Q (r ∈ Z, s ∈ N) folgt
somit
£ √
¤h 1 1 −1 i
d √
f 0 (x) =
( s x)r = r( s x)r−1
xs
= qxq−1 .
dx
s
Wir beschließen den Paragraphen mit der Untersuchung einer Funktionenfolge
fn : I → Rd , n ∈ N. In § 5 (dort noch einmal als Satz 5.7 angegeben) werden wir
folgende Aussage beweisen:
Satz 1.5: Sei I = [a, b] und {fn }n eine Folge von Funktionen fn ∈ C 1 (I, Rd ) für
alle n ∈ N. Falls dann gilt
fn → f (n → ∞),
fn0 →
→ g (n → ∞)
auf I,
so folgt für den punktweisen Limes f ∈ C 1 (I, Rd ), und es gilt f 0 = g auf I.
Falls also {fn }n punktweise und die Ableitungen {fn0 }n gleichmäßig konvergieren
(auf einem kompakten Intervall), dann können wir Limesbildung und Differentiation
vertauschen (Vertauschung zweier Grenzprozesse! ):
´
´
³d
d³
fn (x) =
lim fn (x)
auf I.
n→∞ dx
dx n→∞
lim
Wir wenden Satz 1.5 nun auf Potenzreihen an:
P
k
Satz 1.6: Es sei f (x) := ∞
k=0 ak x , ak ∈ C, eine Potenzreihe mit Konvergenzradius R ∈ (0, +∞) ∪ {+∞}. Dann gehört f : (−R, R) → C zur Klasse C 1 ((−R, R), C)
und es gilt
∞
X
f 0 (x) =
kak xk−1 , x ∈ (−R, R).
k=1
Bemerkung: Die formal durch gliedweises Differenzieren der Reihe erhaltene Potenzreihe hat also den gleichen Konvergenzradius und stimmt mit der tatsächlichen
Ableitung der Reihe überein.
106
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis
von Satz 1.6: Wir zeigen, dass die formal differenzierte Reihe, also g(x) :=
P∞
k−1 , für jedes R ∈ (0, R) gleichmäßig auf [−R , R ] konvergiert: In der
0
0
0
k=1 kak x
P
k−1
die
Reihe
g(x)
in
[−R
,
R
]
und nach dem WurTat majorisiert ja ∞
ka
R
0
0
k
0
k=1
zelkriterium konvergiert letztere:
q
k
³ √
´ R
k p
0
k
k
k−1
lim sup k|ak |R0 = R0 · lim sup √
|a
|
=
< 1.
k
k
R
R0
k→∞
k→∞
Satz 4.3 aus Kap. 2 liefert also die P
gleichmäßige Konvergenz gn →
→ g (n → ∞) auf
[−R0 , R0 ], wobei wir noch gn (x) := nk=1 kak xk−1 für die n-te Partialsumme gesetzt
haben. Da natürlich fn → f (n → ∞) auf [−R0 , R0 ] richtig ist (sogar gleichmäßig
nach Satz 4.3 aus Kap. 2) und da fn0 = gn für alle n ∈ N gilt, liefert Satz 1.5 nun
f ∈ C 1 ([−R0 , R0 ], C) sowie
0
f (x) = g(x) =
∞
X
kak xk−1
auf [−R0 , R0 ].
k=1
Da schließlich R0 ∈ (0, R) beliebig war, folgt die Behauptung.
q.e.d.
P
k
Folgerung 1.2: Die Reihe f (x) = ∞
k=0 ak x (ak ∈ C für k ∈ N0 ) konvergiere auf
(−R, R) für ein R ∈ (0, +∞) ∪ {+∞}. Dann folgt f ∈ C ∞ ((−R, R), C) und für die
n-te Ableitung gilt
f (n) (x) =
∞
X
k(k − 1)(k − 2) . . . (k − n + 1)ak xk−n
auf (−R, R).
(1.11)
k=n
Beweis: Nach Satz 1.6 ist f ∈ C 1 ((−R, R), C) und f 0 ist wieder eine Potenzreihe.
Wenden wir Satz 1.6 sukzessive auf f 0 , f 00 , f 000 , . . . an, so folgt f ∈ C ∞ ((−R, R), C).
Formel (1.11) beweist man schließlich mit vollständiger Induktion.
q.e.d.
2
Lokale Extrema, Mittelwertsatz, Konvexität
Ein wichtiges Teilgebiet der Analysis ist die Behandlung von Extremwertaufgaben.
Hierfür grundlegend ist die
Definition 2.1: Es sei f : I → R auf dem Intervall I ⊂ R erklärt. Wir sagen, f
hat in x0 ∈ I ein lokales Minimum (bzw. lokales Maximum), wenn ein r > 0 so
existiert, dass gilt
f (x) ≥ f (x0 )
(bzw. f (x) ≤ f (x0 ))
für alle x ∈ I ∩ (x0 − r, x0 + r).
(2.1)
Gilt in (2.1) die strikte Ungleichung, so hat f in x0 ein striktes lokales Minimum
(bzw. Maximum). Falls schließlich (2.1) für alle x ∈ I gilt, sprechen wir von einem
globalen Minimum (bzw. globalen Maximum).
2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT
107
Bemerkung: Zusammenfassend heißen lokale Minima und Maxima auch lokale Extrema und x0 wird lokale Minimal-, Maximal- oder Extremalstelle genannt (entsprechend im globalen Fall). Als Synonym für lokal“ wird auch relativ verwendet, statt
”
global“ sagen wir auch absolut.
”
Satz 2.1: (Fermat)
Besitzt f : I → R in einem inneren Punkt x0 ∈ int I des Intervalls I ⊂ R ein lokales
Extremum und ist f in x0 differenzierbar, so folgt f 0 (x0 ) = 0.
Beweis: O.B.d.A. sei f in x0 minimal (sonst gehen wir zu −f über). Da x0 innerer
Punkt ist, gibt es ein ε > 0, so dass (x0 − ε, x0 + ε) ⊂ I gilt. Somit folgt
0 ≥ lim
x→x0 −
also f 0 (x0 ) = 0.
f (x) − f (x0 )
f (x) − f (x0 )
= f 0 (x0 ) = lim
≥ 0,
x→x0 +
x − x0
x − x0
q.e.d.
Bemerkungen:
1. Betrachte f (x) := x, I = [0, 1]. Dann ist x0 = 0 (sogar globales) Minimum,
aber es gilt f 0 (0) = 1. Also darf x0 in Satz 2.1 kein Randpunkt sein.
2. Die Bedingung f 0 (x0 ) = 0 ist nicht hinreichend für ein Extremum, wie etwa
das Beispiel f (x) := x3 , x ∈ (−1, 1), mit f 0 (0) = 0 zeigt.
Definition 2.2: Ist f : I → R im inneren Punkt x0 ∈ int I differenzierbar und gilt
f 0 (x0 ) = 0, so heißt x0 stationärer oder kritischer Punkt von f .
Bemerkung: Satz 2.1 besagt also: Jede innere lokale Extremalstelle von f ist stationär. Geometrisch bedeutet dies, dass die Tangente T = {(x, y) : y = f (x0 ) +
f 0 (x0 )(x − x0 )} an graph f im Punkt (x0 , f (x0 )) parallel zur x-Achse verläuft.
Satz 2.2: (Satz von Rolle)
Sei f : [a, b] → R stetig in [a, b] und differenzierbar in (a, b). Gilt zusätzlich f (a) =
f (b), so existiert ein ξ ∈ (a, b) mit der Eigenschaft f 0 (ξ) = 0.
Beweis: Falls f ≡ const gilt, folgt f 0 ≡ 0 auf [a, b]. Sei also f 6≡ const auf [a, b].
Dann existiert ein x0 ∈ (a, b) mit f (x0 ) 6= f (a), also o.B.d.A. f (x0 ) > f (a). Damit
folgt sup[a,b] f > f (a) = f (b). Nach dem Weierstraßschen Hauptlehrsatz, Satz 3.2
aus Kap. 2, nimmt also f ihr (globales) Maximum in einem inneren Punkt ξ ∈ (a, b)
an und nach Satz 2.1 gilt f 0 (ξ) = 0.
q.e.d.
Wir können nun den Satz von Rolle zum Beweis eines der meistgebrauchten
Sätze der Differential- und Intergalrechnung nutzen, nämlich von
108
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 2.3: (Mittelwertsatz)
Es sei f : [a, b] → R stetig in [a, b] und differenzierbar in (a, b). Dann gibt es ein
ξ ∈ (a, b), so dass gilt
f (b) − f (a) = f 0 (ξ)(b − a).
(2.2)
Bemerkung: Geometrisch heißt das, dass ein ξ ∈ (a, b) so existiert, dass die Tangente
an (ξ, f (ξ)) parallel zur Sekante durch (a, f (a)) und (b, f (b)) verläuft.
Satz 2.3 ergibt sich sofort als Spezialfall aus dem folgenden
Satz 2.4: (Allgemeiner Mittelwertsatz)
Gegeben seien zwei stetige Funktionen f, g : [a, b] → R, die differenzierbar auf (a, b)
seien. Weiter gelte g 0 6= 0 auf (a, b). Dann existiert ein ξ ∈ (a, b), so dass gilt
f (b) − f (a)
f 0 (ξ)
= 0 .
g(b) − g(a)
g (ξ)
Beweis: Nach dem Rolleschen Satz gilt g(a) 6= g(b). Wir betrachten die Hilfsfunktion
ϕ(x) := f (x) −
f (b) − f (a)
[g(x) − g(a)],
g(b) − g(a)
x ∈ [a, b].
Offenbar ist ϕ stetig in [a, b], differenzierbar in (a, b) und es gilt ϕ(a) = ϕ(b) = 0.
Wieder nach dem Rolleschen Satz existiert also ein ξ ∈ (a, b) mit
0 = ϕ0 (ξ) = f 0 (ξ) −
f (b) − f (a) 0
g (ξ),
g(b) − g(a)
also nach Umstellen die Behauptung.
q.e.d.
Folgerung 2.1: (Monotonieverhalten)
Ist f ∈ C 0 ([a, b]) differenzierbar in (a, b), so haben wir:
(i) Gilt f 0 (x) > 0 (bzw. f 0 (x) ≥ 0, f 0 (x) < 0, f 0 (x) ≤ 0) auf (a, b), so ist f
streng monoton wachsend (bzw. monoton wachsend, streng monoton fallend,
monoton fallend) auf [a, b].
(ii) Ist umgekehrt f monoton wachsend (bzw. monoton fallend) auf [a, b], so gilt
f 0 (x) ≥ 0 (bzw. f 0 (x) ≤ 0) auf (a, b).
(iii) Es gilt f 0 (x) ≡ 0 in (a, b) genau dann, wenn f (x) ≡ const auf [a, b] richtig ist.
Bemerkung: Strenge Monotonie impliziert nicht f 0 (x) > 0 bzw. f 0 (x) < 0 auf (a, b).
Beispiel: f (x) = x3 , x ∈ (−1, 1).
2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT
109
Beweis von Folgerung 2.1:
(i) Wir betrachten nur den Fall f 0 (x) > 0 auf (a, b). Seien x1 , x2 ∈ [a, b] mit
x1 < x2 gewählt. Nach Satz 2.3 existiert dann ein ξ ∈ (x1 , x2 ) mit
f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) > 0,
also f (x1 ) < f (x2 ), wie behauptet.
(ii) Sei f monoton wachsend (bzw. fallend). Dann gilt für beliebiges x0 ∈ (a, b)
und hinreichend kleines h 6= 0:
f (x0 + h) − f (x0 )
≥0
h
(bzw. ≤ 0).
Grenzübergang h → 0 liefert die Behauptung.
(iii) Ist f konstant, so verschwindet die Ableitung bekanntlich identisch. Sei umgekehrt f 0 (x) ≡ 0 auf (a, b) und x ∈ (a, b] beliebig gewählt. Nach dem Mittelwertsatz existiert dann ein ξ ∈ (a, x) mit
f (x) − f (a) = f 0 (ξ)(x − a) = 0,
also f (x) ≡ f (a) = const für alle x ∈ [a, b]. Damit ist alles gezeigt.
q.e.d.
Folgerung 2.2: Sei f ∈ C 0 ([a, b]) in (a, b) differenzierbar und x0 ∈ (a, b) sei kritischer Punkt von f . Dann gelten:
(i) Falls f 0 (x) < 0 (bzw. f 0 (x) > 0) in (a, x0 ) und f 0 (x) > 0 (bzw. f 0 (x) < 0) in
(x0 , b) richtig ist, so hat f in x0 ein striktes globales Minimum (bzw. Maximum).
(ii) Falls f 0 (x) < 0 oder f 0 (x) > 0 für alle x ∈ (a, b) \ {x0 } gilt, so ist x0 weder
Minimum noch Maximum von f .
Beweis: Folgerung 2.1 entnehmen wir
<
f 0 (x) <
> 0 für a < x < x0 ⇒ f (x0 ) > f (x) für a ≤ x < x0 ,
>
f 0 (x) <
> 0 für x0 < x < b ⇒ f (x0 ) < f (x) für x0 < x ≤ b.
Das liefert unmittelbar die Behauptungen.
q.e.d.
Beispiel: Unter allen Rechtecken gegebenem Umfangs hat das Quadrat den größten
Flächeninhalt.
110
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Denn: Es ist F = ab der Flächeninhalt des Rechtecks mit Seitenlängen a, b > 0. Und
U = 2(a + b) ist der fixierte Umfang. Setzen wir b = U2 − a in F ein, so erhalten wir
´
³U
−a ,
F = F (a) = a
2
h Ui
a ∈ 0,
.
2
Wegen F 0 (a) = 12 (U − 4a) ist a0 = U4 einziger kritischer Punkt für F . Außerdem
gilt F 0 (a) > 0 in (0, a0 ) und F 0 (a) < 0 in (a0 , U2 ). Also hat F nach Folgerung 2.2
in a0 = U4 ihr striktes globales Maximum über [0, U2 ]. Schließlich beachten wir noch
b0 := U2 − a0 = a0 , d.h. F wird für das Quadrat mit Seitenlänge a0 = U4 maximal.
Satz 2.5: (Hinreichende Extremalbedingung)
Es sei f ∈ C 1 (I, R) (I ⊂ R Intervall) und in x0 ∈ int I sei f zweimal differenzierbar
mit
f 0 (x0 ) = 0 und f 00 (x0 ) > 0 (bzw. f 00 (x0 ) < 0).
Dann besitzt f in x0 ein striktes relatives Minimum (bzw. Maximum).
Bemerkung: Die oben angegebene Bedingung ist nicht notwendig, wie das Beispiel
f (x) = x4 , x ∈ R, mit dem strikten Minimum x0 = 0 zeigt.
0
0
(x0 )
Beweis von Satz 2.5: Es gelte f 00 (x0 ) = limx→x0 f (x)−f
> 0 (der Fall f 00 (x0 ) < 0
x−x0
ergibt sich nach Übergang zu −f ). Dann existiert ein ε > 0, so dass [x0 −ε, x0 +ε] ⊂ I
und
f 0 (x) − f 0 (x0 )
> 0 für alle x ∈ (x0 − ε, x0 + ε) \ {x0 }
x − x0
erfüllt ist. Wegen f 0 (x0 ) = 0 bedeutet dies
f 0 (x) < 0 für alle x ∈ (x0 − ε, x0 ),
f 0 (x) > 0 für alle x ∈ (x0 , x0 + ε).
Nach Folgerung 2.2 hat f in x0 ein striktes Minimum auf [x0 − ε, x0 + ε], also ein
striktes lokales Minimum.
q.e.d.
Wir wollen noch eine Folgerung des allgemeinen Mittelwertsatzes angeben, die
sehr hilfreich bei der Berechnung von Grenzwerten ist:
Satz 2.6: (L’Hospitalsche Regel)
Es seien f, g : I → R zwei differenzierbare Funktionen auf dem Intervall I = (a, b).
Es gelte g 0 6= 0 auf I, und es existiere der Limes
f 0 (x)
=: c ∈ R.
x→a+ g 0 (x)
lim
2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT
111
Dann folgt:
(i) Falls limx→a+ f (x) = limx→a+ g(x) = 0 gilt, so ist g 6= 0 auf I richtig und es
gilt
f (x)
lim
= c.
x→a+ g(x)
(ii) Falls limx→a+ f (x) = ±∞, limx→a+ g(x) = ±∞ gilt, so existiert ein x0 ∈ (a, b)
mit g 6= 0 für x ∈ (a, x0 ] und es gilt
lim
x→a+
f (x)
= c.
g(x)
Analoge Aussagen haben wir für den Grenzwert x → b−.
Beweis:
(i) Zunächst können wir f und g stetig (zu 0) in den Punkt x = a fortsetzen.
Der Satz von Rolle liefert dann g 6= 0 auf (a, b), und nach dem allgemeinen
Mittelwertsatz gibt es zu jedem hinreichend kleinen h > 0 ein ϑ = ϑ(h) ∈ (0, 1)
mit der Eigenschaft
f (a + h) − f (a)
f 0 (a + ϑh)
f (a + h)
=
= 0
.
g(a + h)
g(a + h) − g(a)
g (a + ϑh)
Für h → 0+ (und somit a + ϑh → a+) erhalten wir die Existenz des Grenz(x)
wertes limx→a+ fg(x)
und die Relation
f (x)
f (a + h)
f 0 (a + ϑh)
= lim
= lim 0
= c,
x→a+ g(x)
h→0+ g(a + h)
h→0+ g (a + ϑh)
lim
wie behauptet.
(ii) Wir betrachten nur den Fall limx→a+ f (x) = limx→a+ g(x) = +∞. Wir wählen
x1 ∈ (a, x0 ] zunächst fest. Zu beliebigem x ∈ (a, x1 ) existiert dann nach dem
allgemeinen Mittelwertsatz ein ξ ∈ (x, x1 ) mit
f (x) − f (x1 )
f (x)
f 0 (ξ)
=
=
m(x),
0
g (ξ)
g(x) − g(x1 )
g(x)
wobei wir
m(x) :=
1−
1−
f (x1 )
f (x)
g(x1 )
g(x)
,
(2.3)
x ∈ (a, x1 ),
gesetzt haben. Für festgehaltenes x1 sehen wir limx→a+ m(x) = 1 und damit
1
auch limx→a+ m(x)
= 1.
112
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Wir wählen nun zu vorgegebenem ε > 0 zunächst x1 so nahe an a, dass gilt
¯ f 0 (t)
¯
¯
¯
− c¯ < ε für alle t ∈ (a, x1 ),
(2.4)
¯ 0
g (t)
also insbesondere für t = ξ ∈ (x, x1 ). Dann wählen wir δ > 0 so klein, dass gilt
a + δ ≤ x1 und
¯ 1
¯
¯
¯
− 1¯ < ε für alle x ∈ (a, a + δ).
(2.5)
¯
m(x)
Damit erhalten wir
¯ f (x)
¯
(2.3)
¯
¯
− c¯
=
¯
g(x)
(2.4),(2.5)
<
also limx→a+
f (x)
g(x)
¯ 1 f 0 (ξ)
¯
¯ ¯ 1
¯
1 ¯¯ f 0 (ξ)
¯
¯
¯ ¯
¯
− c¯ ≤
− c¯ + ¯
− 1¯ |c|
¯
¯
m(x) g 0 (ξ)
m(x) g 0 (ξ)
m(x)
ε(1 + ε + |c|) für alle x ∈ (a, a + δ),
= c, wie behauptet.
q.e.d.
Bemerkung: Satz 2.6 lässt sich noch erweitern: Einerseits gilt die entsprechende Aussage auch für c = ±∞, andererseits auch für a = −∞ bzw. b = +∞ (Übungsaufgabe).
Definition 2.3: Eine Funktion f : I → R, I ⊂ R Intervall, heißt konvex, wenn für
alle x1 , x2 ∈ I und alle λ ∈ (0, 1) gilt
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ).
(2.6)
Die Funktion f heißt konkav, wenn −f konvex ist. Gilt schließlich in (2.6) die strikte
Ungleichung für x1 6= x2 , so heißt f streng konvex; gilt dies für −f , so nennen wir
f streng konkav.
Satz 2.7: Sei I ⊂ R ein Intervall und f : I → R ∈ C 2 (I). Dann ist f genau dann
konvex, wenn f 00 (x) ≥ 0 für alle x ∈ I gilt.
Bemerkung: Es folgt sofort: f ist genau dann konkav, wenn f 00 (x) ≤ 0 auf I gilt.
Eine Verschärfung f streng konvex ⇔ f 00 > 0“ von Satz 2.7 gilt übrigens nicht, wie
”
das Beispiel f (x) = x4 , x ∈ R, zeigt.
Beweis von Satz 2.7:
• ⇐“: Sei zunächst f 00 (x) ≥ 0 in I erfüllt. Nach Folgerung 2.1 ist dann f 0 : I →
”
R monoton wachsend. Seien x1 , x2 ∈ I und λ ∈ (0, 1) gewählt, so können wir
o.B.d.A. x1 < x2 annehmen und setzen x := λx1 + (1 − λ)x2 ∈ (x1 , x2 ). Nach
dem Mittelwertsatz finden wir ξ1 ∈ (x1 , x) und ξ2 ∈ (x, x2 ) mit
f (x2 ) − f (x)
f (x) − f (x1 )
= f 0 (ξ1 ) ≤ f 0 (ξ2 ) =
.
x − x1
x2 − x
3. DIE ELEMENTAREN FUNKTIONEN
113
Beachten wir noch x − x1 = (1 − λ)(x2 − x1 ) und x2 − x = λ(x2 − x1 ), so folgt
f (x) − f (x1 )
f (x2 ) − f (x)
≤
1−λ
λ
und nach Umstellen schließlich (2.6), d.h. f ist konvex.
• ⇒“: Sei nun f : I → R konvex und wir nehmen an, dass nicht f 00 (x) ≥ 0
”
auf I gilt. Dann existiert ein x0 ∈ int I mit f 00 (x0 ) < 0. Wir erklären nun die
Hilfsfunktion
ϕ(x) := f (x) − f 0 (x0 )(x − x0 ), x ∈ I.
Offenbar gilt ϕ ∈ C 2 (I) und ϕ0 (x0 ) = 0, ϕ00 (x0 ) = f 00 (x0 ) < 0. Nach Satz 2.5
besitzt also ϕ in x0 ein striktes lokales Maximum, und insbesondere finden wir
ein h > 0, so dass [x0 − h, x0 + h] ⊂ I sowie
ϕ(x0 − h) < ϕ(x0 ),
ϕ(x0 + h) < ϕ(x0 )
erfüllt sind. Hieraus erhalten wir
¢ 1¡
¢
1¡
f (x0 ) = ϕ(x0 ) > ϕ(x0 − h) + ϕ(x0 + h) = f (x0 − h) + f (x0 + h) . (2.7)
2
2
Setzen wir schließlich x1 := x0 − h, x2 := x0 + h und λ =
x0 = λx1 + (1 − λ)x2 und (2.7) besagt
1
2,
so haben wir
f (λx1 + (1 − λ)x2 ) > λf (x1 ) + (1 − λ)f (x2 ),
was ein Widerspruch zur vorausgesetzten Konvexität von f ist. Also gilt doch
f 00 (x) ≥ 0 auf I.
q.e.d.
Der Beweis der Richtung ⇐“ in Satz 2.7 lässt sich offenbar so modifizieren, dass
”
man das nachstehende Ergebnis erhält:
Folgerung 2.3: Gilt f ∈ C 2 (I, R) und f 00 (x) > 0 (bzw. < 0) auf dem Intervall
I ⊂ R, so ist f streng konvex (bzw. konkav) auf I.
3
Die elementaren Funktionen
In Kap. 2, Folgerung 4.2 haben wir die komplexe Exponentialfunktion oder kurz eFunktion
∞
X
zk
, z ∈ C,
ez = exp z :=
k!
k=0
erklärt und als stetig auf ganz C erkannt. In diesem Paragraphen werden wir Eigenschaften von ez untersuchen und weitere sogenannte elementare Funktionen“ aus
”
ihr erklären.
114
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 3.1: (Funktionalgleichung der e-Funktion)
Für beliebige z1 , z2 ∈ C gilt die Identität
exp(z1 + z2 ) = exp z1 · exp z2 .
Beweis: Da die Exponentialreihe für beliebige z ∈ C absolut konvergiert, liefern die
Cauchysche Produktformel und der Binomische Satz:
¶µ X
¶
¶
∞
∞ µX
k
X
z1k
z2k
z1l z2k−l
=
k!
k!
l! (k − l)!
k=0
k=0
k=0
l=0
µ k µ ¶
¶
∞
∞
X
X
1 X k l k−l
(z1 + z2 )k
=
z1 z2
=
= exp(z1 + z2 ),
k!
k!
l
exp z1 · exp z2 =
µX
∞
k=0
l=0
k=0
wie behauptet.
q.e.d.
Definition 3.1: Die Zahl
∞
X
1
∈R
e := exp 1 =
k!
k=0
wird Eulersche Zahl genannt.
Bemerkung: Mit der Funktionalgleichung zeigt man leicht
³p´
p
e q = exp
für alle p ∈ Z, q ∈ N.
q
(3.1)
Dies erklärt auch die Schreibweise der Exponentialfunktion als Potenz.
Wir konzentrieren uns nun auf die Einschränkungen von exp z auf die reelle
bzw. imaginäre Achse:
Satz 3.2: Die reelle Exponentialfunktion ex = exp x :=
zur Klasse C ∞ (R) und es gilt
exp0 x =
d
exp x = exp x,
dx
P∞
xk
k=0 k! ,
x ∈ R, gehört
x ∈ R.
(3.2)
Beweis: Gemäß Kap. 1, § 8 ist die Exponentialreihe für alle x ∈ R konvergent. Nach
Folgerung 1.2 gilt also exp x ∈ C ∞ (R) und wir haben
(1.6)
exp0 x =
∞
∞
∞
X
X
X
1
1
xl
k xk−1 =
xk−1 =
= exp x,
k!
(k − 1)!
l!
k=1
wie behauptet.
k=1
l=0
q.e.d.
3. DIE ELEMENTAREN FUNKTIONEN
115
Satz 3.3: Die reelle Exponentialfunktion ex = exp x, x ∈ R, bildet R auf (0, +∞)
ab, ist streng monoton wachsend, streng konvex und erfüllt
lim exp x = 0,
x→−∞
exp 0 = 1,
lim exp x = +∞.
x→+∞
(3.3)
Beweis: Offensichtlich ist f (x) := ex , x ∈ R, reellwertig, da die definierende Reihe
nur reelle Koeffizienten besitzt. Insbesondere gilt e0 = 1. Ferner haben wir
exp x = 1 +
∞
X
xk
k=1
k!
> 0 für alle x ∈ [0, +∞)
und nach Satz 3.1 auch
exp x =
1
> 0 für alle x ∈ (−∞, 0),
exp(−x)
also insgesamt f (R) ⊂ (0, +∞). Zum Beweis von (3.3) beachten wir
lim exp x ≥ lim (1 + x) = +∞
x→+∞
x→+∞
und
lim exp x = lim
x→−∞
x→−∞
1
exp(−x)
ξ:=−x
=
lim
ξ→+∞
1
= 0.
exp ξ
Ist nun y ∈ (0, +∞) beliebig, so existieren also x1 < 0, x2 > 0 mit ex1 < y <
ex2 . Nach dem Zwischenwertsatz, Satz 2.7 aus Kap. 2, existiert ein x ∈ (x1 , x2 ) mit
f (x) = y, d.h. y ∈ f (R) und insgesamt f (R) = (0, +∞).
Schließlich gilt nach Satz 3.2: exp0 x = exp x > 0 für alle x ∈ R, also ist exp x
nach Folgerung 2.1 streng monoton wachsend. Und wiederum Satz 3.2 in Verbindung
mit Folgerung 2.3 liefert die strenge Konvexität wegen exp00 x = exp0 x = exp x > 0.
q.e.d.
Definition 3.2: Die Umkehrfunktion von exp x : R → R nennen wir (natürliche)
Logarithmusfunktion y = log x : (0, +∞) → R. Für x > 0 heißt y = log x Logarithmus von x.
Satz 3.4: Die Funktion log : (0, +∞) → R ist streng monoton, streng konkav,
beliebig oft differenzierbar und wir haben
log0 x =
1
d
log x =
dx
x
für alle x > 0.
(3.4)
Ferner gelten die Funktionalgleichung
log(x1 x2 ) = log x1 + log x2
für alle x1 , x2 > 0
(3.5)
sowie
lim log x = −∞,
x→0+
log 1 = 0,
log e = 1
lim log x = +∞.
x→+∞
(3.6)
116
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis: Zunächst gehört log x nach Satz 1.4 als Umkehrfunktion von x = exp y zur
Klasse C 1 ((0, +∞), R) und es gilt
log0 x =
1
1
1
=
=
exp0 (log x)
exp(log x)
x
für x > 0.
Wegen x1 ∈ C ∞ ((0, +∞), R) ist nun auch log x ∈ C ∞ ((0, +∞), R) richtig. Außerdem
ist log x offenbar streng monoton wachsend, und (3.4) liefert log00 x = − x12 < 0 für
alle x ∈ (0, +∞), d.h. nach Folgerung 2.3 ist log x streng konkav.
Zum Beweis von (3.5) seien x1 , x2 > 0 beliebig gewählt. Wir erhalten dann aus
Satz 3.1
exp(log x1 + log x2 ) = exp(log x1 ) · exp(log x2 ) = x1 x2 .
Nehmen wir auf beiden Seiten den Logarithmus, so folgt die Behauptung (3.5).
Schließlich ist natürlich log 1 = log(e0 ) = 0 und log e = log(e1 ) = 1 richtig. Und
die Grenzwerte in (3.6) ergeben sich direkt aus der Monotonie und der Relation
log((0, +∞)) = R. Damit ist alles gezeigt.
q.e.d.
Definition 3.3: Für beliebiges α ∈ R erklären wir die (allgemeine) Potenzfunktion
x 7→ xα , x ∈ (0, +∞), durch die Formel
xα := eα log x = exp(α log x).
Satz 3.5: Die allgemeine Potenzfunktion f (x) := xα erfüllt f ∈ C ∞ ((0, +∞), R)
und es gelten die Relationen
xα y α = (xy)α ,
xα xβ = xα+β ,
(xα )β = xαβ ,
α
log(x ) = α log x,
d α
(x ) = αxα−1
dx
(3.7)
(3.8)
(3.9)
für alle x, y > 0 und beliebige α, β ∈ R.
Beweis: Nach Satz 1.3 und der Produktregel ist f ∈ C ∞ ((0, +∞), R) als Komposition
zweier C ∞ -Funktionen. Die Relationen (3.7) ergeben sich leicht unter Benutzung der
Funktionalgleichungen für Exponential- und Logarithmusfunktion; z.B. berechnen
wir
xα y α = eα log x eα log y = eα(log x+log y) = eα log(xy) = (xy)α .
Formel (3.8) folgt sofort aus der Definition der Potenzfunktion durch Logarithmieren. Schließlich entnehmen wir der Kettenregel
d α
d α log x
d
1 (3.7)
(x ) =
(e
) = eα log x ·
(α log x) = xα α = αxα−1 ,
dx
dx
dx
x
wie behauptet.
q.e.d.
3. DIE ELEMENTAREN FUNKTIONEN
117
Bemerkung: Wir können auch die allgemeine Exponentialfunktion x 7→ cx = ex log c
für festes c > 0 betrachten. Es gilt f (x) := cx ∈ C ∞ (R, R) und
f 0 (x) = cx · log c,
x ∈ R.
Für c > 1 ist also f 0 > 0 und f : R → (0, +∞) bijektiv. Die zugehörige Umkehrfunktion heißt Logarithmus zur Basis c > 1 und wird mit logc : (0, +∞) → R bezeichnet.
Der Logarithmus zur Basis e > 1 ist der natürliche Logarithmus (→ Übungen).
Definition 3.4: Wir erklären die Cosinusfunktion cos : R → R und die Sinusfunktion sin : R → R gemäß
1
cos x := (eix + e−ix ) = Re (eix ),
2
1
sin x := (eix − e−ix ) = Im (eix ),
2i
x ∈ R.
Satz 3.6: Die Funktionen cos und sin gehören zur Klasse C ∞ (R, R) mit den Ableitungen
d
cos x = − sin x,
cos0 x =
dx
(3.10)
d
0
sin x =
sin x = cos x, x ∈ R.
dx
Es gilt die Eulersche Formel
eix = cos x + i sin x,
x ∈ R,
(3.11)
und die Additionstheoreme
cos(x1 + x2 ) = cos x1 cos x2 − sin x1 sin x2 ,
sin(x1 + x2 ) = cos x1 sin x2 + sin x1 cos x2 ,
x1 , x2 ∈ R.
(3.12)
Die Cosinusfunktion ist gerade, die Sinusfunktion ist ungerade, d.h.
cos(−x) = cos x,
sin(−x) = − sin x,
x ∈ R.
(3.13)
Schließlich haben wir die Potenzreihendarstellungen
cos x =
∞
X
(−1)l
l=0
(2l)!
x2l ,
sin x =
wobei beide Reihen absolut konvergieren.
∞
X
(−1)l
x2l+1 ,
(2l + 1)!
l=0
x ∈ R,
(3.14)
118
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis: cos, sin ∈ C ∞ (R, R) ist per Definition klar, da exp(±ix) ∈ C ∞ (R, C) gilt
d
gemäß Satz 1.6. Mit dx
(e±ix ) = ±ie±ix berechnen wir
1
1
cos0 x = (ieix − ie−ix ) = − (eix − e−ix ) = − sin x,
2
2i
1 ix
1 ix
0
ix
sin x = (ie + ie ) = (e + e−ix ) = cos x,
2i
2
also (3.10). Die Eulersche Formel (3.11) ist direkte Konsequenz der Definition von cos
und sin. Und die Funktionalgleichung der Exponentialfunktion liefert in Verbindung
mit der Eulerschen Formel:
cos(x1 + x2 ) + i sin(x1 + x2 ) = ei(x1 +x2 ) = eix1 eix2
= (cos x1 + i sin x1 )(cos x2 + i sin x2 )
= (cos x1 cos x2 − sin x1 sin x2 ) + i(cos x1 sin x2 + sin x1 cos x2 ).
Real- und Imaginärteil dieser Gleichung entsprechen gerade den Formeln (3.12).
Formel (3.13) entnimmt man wieder direkt der Definition von cos und sin. Zum
Beweis von (3.14) berechnen wir schließlich
cos x + i sin x = e
∞
X
1 k k
i x =
=
k!
ix
k=0
=
∞
X
l=0
=
1 2l 2l
i x +
(2l)!
∞
X
l=0
X
k
gerade
1 k k
i x +
k!
X
k
ungerade
1 k k
i x
k!
1
i2l+1 x2l+1
(2l + 1)!
∞
X
(−1)l
l=0
∞
X
(−1)l
2l
x +i
x2l+1 .
(2l)!
(2l + 1)!
l=0
Vergleich von Real-und Imaginärteil dieser Identität liefert (3.14). Damit ist alles
gezeigt.
q.e.d.
Bemerkung: Wegen eix = e−ix gilt |eix |2 = eix e−ix = 1 für alle x ∈ R. Der Eulerschen
Formel entnehmen wir daher die berühmte Relation
1 = cos2 x + sin2 x für alle x ∈ R.
Geometrisch stellt f (x) := eix , x ∈ R, eine gleichförmige Bewegung mit Geschwindigkeit 1 auf der Einheitskreislinie dar, denn es gilt
|f (x)| ≡ 1,
|f 0 (x)| = |ieix | ≡ 1.
Cosinus- und Sinusfunktion sind nach Definition die Projektionen dieser Kreisbewegung auf die reelle bzw. imaginäre Achse, weshalb man sie auch als Kreisfunktionen
bezeichnet.
3. DIE ELEMENTAREN FUNKTIONEN
119
Wir wollen nun die Nullstellen der Kreisfunktionen untersuchen und beginnen
mit dem
Satz 3.7: Die Gleichung cos x = 0 besitzt im Intervall [0, 2] genau eine Lösung.
Diese kleinste positive Nullstelle von cos bezeichnen wir mit π2 . Es gilt dann
h π´
π
cos x > 0 für alle x ∈ 0,
, cos = 0.
2
2
Beweis: Zunächst gilt per Definition cos 0 = Re (e0 ) = 1. Und aus der Reihendarstellung von cos ermitteln wir
x2 x4 x6 x8 x10 x12
cos x = 1 −
+
−
+
−
+
− +...
2!
4!
6!
8!
10!
12!
³
x2 x4 ´ x6 ³
x2 ´ x10 ³
x2 ´
=
1−
+
−
1−
−
1−
− ...
2!
4!
6!
7·8
10!
11 · 12
Für x = 2 erhalten wir also
1 26 ³
4 ´ 210 ³
4 ´
1
cos 2 = − −
1−
−
1−
− ... < − .
3
6!
7·8
10!
11 · 12
3
Nach dem Zwischenwertsatz, Satz 2.5 aus Kap. 2, existiert also ein ξ ∈ (0, 2) mit
cos ξ = 0. Weiter entnehmen wir der Reihendarstellung von sin:
x3 x5 x7 x9 x11
−
+
−
+
− +...
cos0 x = − sin x = −x +
3!
5!
7!
9!
11!
³
x2 ´ x5 ³
x2 ´ x9 ³
x2 ´
= −x 1 −
−
1−
−
1−
− ... < 0
2·3
5!
6·7
9!
10 · 11
für x ∈ (0, 2). Nach Folgerung 2.1 ist also cos in [0, 2] streng monoton fallend und
somit injektiv. Insbesondere ist also die Nullstelle ξ =: π2 eindeutig bestimmt, wie
behauptet.
q.e.d.
Folgerung 3.1: Die Sinusfunktion ist im Intervall [− π2 , π2 ] streng monoton wachsend und es gilt
³ π´
π
= −1, sin 0 = 0, sin = 1.
sin −
2
2
Die Cosinusfunktion ist im Intervall [0, π] streng monoton fallend und es gilt
cos 0 = 1,
cos
π
= 0,
2
cos π = −1.
Beweis: Da cos gerade ist, gilt nach Satz 3.7: sin0 x = cos x > 0 in (− π2 , π2 ), d.h. sin ist
in [− π2 , π2 ] streng monoton wachsend nach Folgerung 2.1. Ferner gilt sin 0 = Im (e0 ) =
0 und
³ π´
³ π´
³ π´
1 = cos2 ±
+ sin2 ±
= sin2 ±
,
2
2
2
120
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
also wegen der Monotonie sin(− π2 ) = −1, sin π2 = 1. Schließlich erhalten wir die
Aussagen über den Cosinus aus den Regeln der Phasenverschiebung
³π
´
³π
´
cos
− x = sin x, sin
− x = cos x, x ∈ R,
(3.15)
2
2
die man nun sofort aus den Additionstheoremen gewinnt.
q.e.d.
Satz 3.8: Die Funktionen cos und sin sind 2π-periodisch, d.h. es gilt
cos(x + 2π) = cos x,
sin(x + 2π) = sin x
für alle x ∈ R.
(3.16)
Ferner haben wir
cos(x + π) = − cos x,
sin(x + π) = − sin x
für alle x ∈ R.
Schließlich gilt für die Nullstellenmengen der Funktionen
o
nπ
+ kπ : k ∈ Z ,
{x ∈ R : cos x = 0} =
2
{x ∈ R : sin x = 0} = {kπ : k ∈ Z}
(3.17)
(3.18)
π
Beweis: Wir bemerken zunächst ei 2 = cos π2 + i sin π2 = i nach Folgerung 3.1. Damit
folgt
π
eiπ = (ei 2 )2 = i2 = −1, e2iπ = (eiπ )2 = (−1)2 = 1,
also
cos π = −1,
sin π = 0;
cos(2π) = 1,
sin(2π) = 0.
Die Aussagen (3.16) und (3.17) folgen nun wieder unmittelbar aus den Additionstheoremen (3.12). Ferner wissen wir bereits cos x > 0 für alle x ∈ (− π2 , π2 ) und
cos π2 = 0. Also folgt die Aussage (3.18) für den Cosinus aus Formel (3.17). Die
Nullstellenmenge des Sinus lässt sich daraus m.H. der Phasenverschiebung (3.15)
ablesen.
q.e.d.
Folgerung 3.2: Alle Lösungen der Gleichung eix = 1 haben die Form x = 2kπ mit
einem k ∈ Z.
Beweis: Wir beachten
x
sin
x¢
1 ¡ ix
e−i 2 ix
x
=
e 2 − e−i 2 =
(e − 1).
2
2i
2i
Also gilt eix = 1 ⇔ sin x2 = 0. Die Behauptung ergibt sich nun aus (3.18).
q.e.d.
3. DIE ELEMENTAREN FUNKTIONEN
121
Satz 3.9: (Polarkoordinaten)
Jede komplexe Zahl z ∈ C besitzt eine Darstellung
z = reiϕ = r(cos ϕ + i sin ϕ)
(3.19)
mit einem ϕ ∈ R und r = |z|. Für z 6= 0 ist die Darstellung (3.19) eindeutig, wenn
wir ϕ ∈ [0, 2π) fordern.
Beweis:
1. Für z = 0 ist r = |z| = 0 und (3.19) gilt mit beliebigem ϕ ∈ R. Sei also
z = x + iy 6= 0. Dann folgt r := |z| > 0 und ξ := xr , η := yr sind wohldefiniert.
Es gilt dann
z = r(ξ + iη), ξ 2 + η 2 = 1.
(3.20)
Insbesondere ist ξ ∈ [−1, 1] = [cos π, cos 0] erfüllt. Nach dem Zwischenwertsatz
existiert also ein α ∈ [0, π] mit cos α = ξ. Hieraus folgt noch
p
p
η = ± 1 − ξ 2 = ± 1 − cos2 α = ± sin α.
Man beachte sin α ≥ 0 wegen (3.18) und sin π2 = 1.
• 1. Fall: Für y ≥ 0 ist η ≥ 0, also η = sin α. Dann wählen wir ϕ :=
α ∈ [0, π] und erhalten ξ = cos ϕ, η = sin ϕ, also aus (3.20) die gesuchte
Darstellung (3.19).
• 2. Fall: Für y < 0 folgt α ∈ (0, π) und η = − sin α. Mit ϕ := 2π − α ∈
(π, 2π) erhalten wir dann aus den Symmetrieeigenschaften (3.13) und der
Periodizität (3.16):
ξ = cos α = cos(2π − ϕ) = cos ϕ,
η = − sin α = − sin(2π − ϕ) = sin ϕ,
also wieder (3.19).
2. Man beachte, dass der in Teil 1 des Beweises erklärte Winkel ϕ in [0, 2π) liegt.
Gäbe es ein weiteres ψ ∈ [0, 2π) mit z = reiψ , so folgte eiϕ = eiψ bzw. ei(ϕ−ψ) =
1. Folgerung 3.2 liefert also ϕ − ψ = 2kπ. Aus |ϕ − ψ| < 2π folgt nun k = 0
bzw. ϕ = ψ, wie behauptet.
q.e.d.
Bemerkungen:
1. ϕ ∈ [0, 2π) misst den Winkel zwischen der positiven reellen Achse und dem
Vektor z = (x, y), gemessen in mathematisch positivem Sinn. Er wird Argument von z genannt und mit ϕ = arg z bezeichnet.
122
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
2. Auch mit der Forderung ϕ ∈ [ϕ0 , ϕ0 + 2π) für beliebiges ϕ0 ∈ R ist ϕ eindeutig
festgelegt; vergleiche Teil 2 des obigen Beweises. Aufgrund der Periodizität von
cos und sin folgt dann ϕ = arg z + 2kπ mit einem (eindeutigen) k ∈ Z. ϕ misst
also wieder den Winkel zur positiven x-Achse, wobei nun zusätzlich k-mal um
den Ursprung gelaufen wird.
3. Die Polarkoordinatendarstellung erlaubt uns eine einfache Interpretation der
komplexen Multiplikation: Sind nämlich z1 = |z1 |eiϕ1 und z2 = |z2 |eiϕ2 mit
ϕ1 , ϕ2 ∈ [0, 2π) gegeben, so folgt aus der Funktionalgleichung der Exponentialfunktion:
z1 · z2 = |z1 | |z2 | ei(ϕ1 +ϕ2 ) .
Bei der Multiplikation werden also die Beträge multipliziert und die Argumente
(= Winkel) addiert.
Definition 3.5: Wir erklären die Funktionen
sin x
,
cos x
cos x
,
cot x :=
sin x
tan x :=
x 6=
π
+ kπ, k ∈ Z
2
x 6= kπ, k ∈ Z
( Tangens),
( Cotangens).
Satz 3.10: Tangens und Cotangens sind in ihren Definitionsgebieten beliebig oft
differenzierbar und es gelten
d
1
π
tan x = 1 + tan2 x =
, x 6= + kπ, k ∈ Z,
2
dx
cos x
2
d
1
cot0 x =
cot x = −(1 + cot2 x) = − 2 , x 6= kπ, k ∈ Z.
dx
sin x
tan0 x =
(3.21)
Ferner haben wir
tan(x + π) = tan x,
und
tan
³π
´
− x = cot x,
2
sowie die Additionstheoreme
tan x1 + tan x2
tan(x1 + x2 ) =
,
1 − tan x1 tan x2
cot(x1 + x2 ) =
cot(x + π) = cot x
cot
−1 + cot x1 cot x2
,
cot x1 + cot x2
³π
2
´
− x = tan x
x1 , x2 , x1 + x2 6=
π
+ kπ, k ∈ Z,
2
x1 , x2 , x1 + x2 6= kπ, k ∈ Z.
Schließlich ist tan in (− π2 , π2 ) streng monoton wachsend mit
lim
x→− π2 +
tan x = −∞,
tan 0 = 0,
lim tan x = +∞.
x→ π2 −
3. DIE ELEMENTAREN FUNKTIONEN
123
Und cot ist in (0, π) streng monoton fallend mit
³π ´
lim cot x = +∞, cot
= 0,
x→0+
2
lim cot x = −∞.
x→π−
Beweis: Direkt aus den Aussagen über die Cosinus-und Sinusfunktion.
q.e.d.
Aufgrund des Monotonieverhaltens von sin, cos, tan und cot können wir nun
auch die entsprechenden Umkehrfunktionen erklären, wenn wir uns auf geeignete
Monotonieintervalle beschränken: Wir wählen die Bereiche
π
π
y = sin x, − ≤ x ≤
⇒ −1 ≤ y ≤ 1,
2
2
y = cos x,
0 ≤ x ≤ π ⇒ −1 ≤ y ≤ 1,
y = tan x, −
y = cot x,
π
π
<x<
⇒ −∞ < y < +∞,
2
2
0 < x < π ⇒ −∞ < y < +∞.
Die zugehörigen Umkehrfunktionen heißen Arcus Sinus, Arcus Cosinus, Arcus Tangens bzw. Arcus Cotangens und werden mit
arcsin := sin−1 : [−1, 1] → R,
arccos := cos−1 : [−1, 1] → R,
arctan := tan−1 : R → R,
arccot := cot−1 : R → R
bezeichnet.
Satz 3.11: Es gelten arcsin, arccos ∈ C ∞ ((−1, 1)) und arctan, arccot ∈ C ∞ (R) und
wir haben
1
1
arcsin0 y = p
, arccos0 y = − p
, y ∈ (−1, 1),
2
1−y
1 − y2
(3.22)
1
1
0
0
,
arccot y = −
, y ∈ R.
arctan y =
1 + y2
1 + y2
Ferner gelten die Relationen
π
2
π
arctan y + arccoty =
2
arcsin y + arccos y =
für alle y ∈ [−1, 1],
(3.23)
für alle y ∈ R.
Beweis: Da die ersten Ableitungen von sin, tan auf (− π2 , π2 ) und von cos, cot auf
(0, π) nicht verschwinden, sind die Umkehrfunktionen in den angegebenen Bereichen
einmal differenzierbar nach Satz 1.4 und es gelten
1
1
1
p
=p
, |y| < 1,
=
sin (arcsin y)
1 − y2
1 − sin2 (arcsin y)
1
1
1
arctan0 y =
=
, y ∈ R.
=
0
2
tan (arctan y)
1 + y2
1 + tan (arctan y)
arcsin0 y =
0
124
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Entsprechend erhalten wir die ersten Ableitungen für arccos und arccot. Da die
1
Funktionen √ 1 2 , y ∈ (−1, 1), und 1+y
2 , y ∈ R, beliebig oft differenzierbar sind,
1−y
folgen die behaupteten Regularitätseigenschaften der Arcusfunktionen.
Zum Beweis der ersten Relation in (3.23) wenden wir arccos auf die Relation
y = sin x = cos( π2 − x), x ∈ [− π2 , π2 ], an:
arccos y =
π
π
− x = − arcsin y,
2
2
y ∈ [−1, 1].
Entsprechend wenden wir arccot auf y = tan x = cot( π2 − x), x ∈ R, an und erhalten
die zweite Relation in (3.23).
q.e.d.
Bemerkung: Ausgehend von der komplexen Exponentialfunktion können wir auch
die komplexe Cosinus- bzw. Sinusfunktion erklären:
1
cos z := (eiz + e−iz ),
2
sin z :=
1 iz
(e − e−iz ),
2i
z ∈ C.
Für z = x ∈ R erhalten wir dann die reellen Kreisfunktionen. Für z = −ix, x ∈ R,
erhalten wir die (reellen) Hyperbelfunktionen
1
cosh x := cos(−ix) = (ex + e−x )
2
1 x
sinh x := sin(−ix) = (e − e−x )
2
(Cosinus hyperbolicus),
(Sinus hyperbolicus).
Während (cos x, sin x) eine Parametrisierung der Einheitskreislinie liefert, ergibt
(cosh x, sinh x) eine Parametrisierung des rechten Astes der Hyperbel {(x, y) ∈ R2 :
x2 − y 2 = 1}. Wir verzichten hier auf eine Diskussion der Hyperbelfunktionen und
verweisen auf die Literatur und die Übungen.
4
Das eindimensionale Riemannsche Integral
Ist f : [a, b] → R eine positive Funktion, so möchte man das bestimmte Integral
Zb
f (x) dx
a
als Flächeninhalt des Stückes des R2 erklären, das von der x-Achse und der Funktion
f einerseits und den senkrechten Geraden durch (a, 0) bzw. (b, 0) andererseits beranRb
det wird. Die Idee hierbei ist, den Wert a f (x) dx durch den elementargeometrischen
Flächeninhalt von einbeschriebenen Rechtecken geeigneter Höhe zu approximieren.
Es scheint offensichtlich, dass der Flächeninhalt so immer besser approximiert wird,
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
125
wenn wir die Breite der Rechtecke verringern (und damit ihre Anzahl erhöhen), zumindest wenn dieses Verfahren konvergiert. Dieser Ansatz soll nun präzisiert werden.
Im Folgenden sei f : I → R immer eine beschränkte Funktion auf dem kompakten
Intervall I = [a, b] ⊂ R (−∞ < a < b < +∞).
Definition 4.1: Sei also I = [a, b] und f : I → R beschränkt.
• Es sei N ∈ N und Punkte x0 , x1 , . . . , xN ∈ I seien gewählt mit
a = x0 < x1 < . . . < xN = b.
Wir setzen Ij := [xj−1 , xj ] und ∆xj := xj − xj−1 = |Ij | für j = 1, . . . , N . Die
Menge {x0 , . . . , xN } nennen wir dann eine Zerlegung Z von I und die Punkte
x0 , . . . , xN heißen Teilpunkte von Z. Die Länge des größten Teilintervalls
∆(Z) := max{∆x1 , . . . , ∆xN }
(4.1)
wird als Feinheit der Zerlegung Z bezeichnet.
• Aus jedem Teilintervall Ij wählen wir ein ξj ∈ Ij und setzen ξ := (ξ1 , . . . , ξN ).
Dann nennen wir
SZ (f ) = SZ (f, ξ) :=
N
X
f (ξj )∆xj
(4.2)
j=1
eine Riemannsche Zwischensumme zu f .
• Mit den Abkürzungen
mj := inf Ij f = inf{f (x) : x ∈ Ij },
mj := supIj f = sup{f (x) : x ∈ Ij },
j = 1, . . . , N,
(4.3)
bilden wir die Untersumme
S Z (f ) :=
N
X
mj ∆xj
(4.4)
mj ∆xj
(4.5)
j=1
und die Obersumme
S Z (f ) :=
N
X
j=1
zu f .
126
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Bemerkung: Man beachte, dass wegen mj ≤ f (ξj ) ≤ mj stets
S Z (f ) ≤ SZ (f, ξ) ≤ S Z (f )
(4.6)
für jede Zerlegung von I und jede Riemannsche Zwischensumme erfüllt ist.
Definition 4.2:
• Eine Zerlegung Z ∗ von I heißt Verfeinerung der Zerlegung Z von I, wenn alle
Teilpunkte von Z auch Teilpunkte von Z ∗ sind.
• Eine gemeinsame Verfeinerung Z1 ∨ Z2 zweier Zerlegungen Z1 , Z2 von I ist
die Zerlegung von I, deren Teilpunkte gerade die Teilpunkte von Z1 und Z2
sind.
Bemerkung: Z1 ∨ Z2 ist also sowohl Verfeinerung von Z1 als auch von Z2 .
Hilfssatz 4.1:
(i) Ist Z ∗ Verfeinerung von Z, so gilt
S Z (f ) ≤ S Z ∗ (f ) ≤ S Z ∗ (f ) ≤ S Z (f ).
(ii) Sind Z1 , Z2 zwei beliebige Zerlegungen von I, so gilt
S Z1 (f ) ≤ S Z2 (f ).
Beweis:
(i) Seien Il∗ ein Teilintervall von Z ∗ und Ij ein Teilintervall von Z mit Il∗ ⊂ Ij .
Dann folgt
f ≥ inf f =: mj ,
m∗l := inf
∗
Ij
Il
m∗l := sup f ≤ sup f =: mj
Il∗
Ij
und somit
mj ∆xj = mj
X
l:Il∗ ⊂Ij
∆xl ≤
X
m∗l ∆xl ,
mj ∆xj ≥
l:Il∗ ⊂Ij
Durch Summierung über j erhalten wir also
(4.6)
S Z (f ) ≤ S Z ∗ (f ) ≤ S Z ∗ (f ) ≤ S Z (f ).
X
l:Il∗ ⊂Ij
m∗l ∆xl .
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
127
(ii) Wir wenden (i) auf die gemeinsame Verfeinerung Z1 ∨Z2 =: Z an und erhalten
S Z1 (f ) ≤ S Z (f ) ≤ S Z (f ) ≤ S Z2 (f ),
wie behauptet.
q.e.d.
Definition 4.3: Ist f : I → R beschränkt, I = [a, b], so erklären wir das Unterintegral I(f ) bzw. Oberintegral I(f ) von f als
ª
©
I(f ) := sup S Z (f ) : Z ist Zerlegung von I ,
©
ª
I(f ) := inf S Z (f ) : Z ist Zerlegung von I .
Bemerkung: Ist Z eine beliebige Zerlegung von I = [a, b] und f : I → R beschränkt,
so gilt nach Hilfssatz 4.1 (i):
−∞ < |I| inf f ≤ S Z (f ) ≤ S Z (f ) ≤ |I| sup f < +∞.
I
I
Also sind I(f ), I(f ) ∈ R wohl definiert. Hilfssatz 4.1 (ii) entnehmen wir noch durch
sup- bzw. inf-Bildung:
S Z (f ) ≤ I(f ) ≤ I(f ) ≤ S Z (f ) mit beliebiger Zerlegung Z von I.
(4.7)
Definition 4.4: Eine beschränkte Funktion f : I → R über dem Intervall I = [a, b]
heißt Riemann-integrierbar, wenn gilt I(f ) = I(f ). Wir setzen dann
I(f ) := I(f ) = I(f )
für das (bestimmte) Riemannsche Integral von f über [a, b]. Alternative Symbole
sind
Zb
Zb
Z
I(f ) = f (x) dx = f dx = f (x) dx.
a
a
I
Die Klasse aller Riemann-integrierbaren Funktionen auf I wird mit R(I) bezeichnet.
Bemerkung: Da wir weitere Integralbegriffe erst in der Analysis III kennenlernen
werden, sagen wir i.F. kurz integrierbar für Riemann-integrierbar und Integral für
Riemannsches Integral.
Satz 4.1: (Integrabilitätskriterium I)
Für eine beschränkte Funktion f : I → R, I = [a, b], gilt:
f ∈ R(I)
⇔
Für alle ε > 0 existiert eine Zerlegung Z
von Q mit S Z (f ) − S Z (f ) < ε.
128
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis:
• ⇐“: Aus (4.7) erhalten wir
”
0 ≤ I(f ) − I(f ) ≤ S Z (f ) − S Z (f ) < ε
für beliebiges ε > 0 und geeignete Zerlegung Z. Also folgt I(f ) = I(f )
bzw. f ∈ R(I).
• ⇒“: Nach Definition 4.3 existieren zu beliebig gewähltem ε > 0 Zerlegungen
”
Z und Z von I mit
ε
S Z (f ) > I(f ) − ,
2
ε
S Z (f ) < I(f ) + .
2
Setzen wir Z := Z ∨ Z, so liefert Hilfssatz 4.1 (i):
S Z (f ) − S Z (f ) ≤ S Z (f ) − S Z (f ) < I(f ) − I(f ) + ε
wie behauptet.
f ∈R(I)
=
ε,
q.e.d.
Satz 4.2: (Integrabilitätskriterium II)
Für eine beschränkte Funktion f : I → R, I = [a, b], gilt:
f ∈ R(I)
⇔
Für alle ε > 0 existiert ein δ = δ(ε), so dass gilt:
S Z (f ) − S Z (f ) < ε für alle Zerlegungen Z mit ∆(Z) < δ.
Beweis:
• ⇐“: Klar aus Satz 4.1.
”
• ⇒“: Sei also f ∈ R(I) und ε > 0 beliebig gewählt. Nach Satz 4.1 existiert
”
eine Zerlegung
©
ª
Z ∗ = x∗0 , x∗1 , . . . , x∗N : a = x∗0 < x∗1 < . . . < x∗N = b
mit der Eigenschaft
ε
S Z ∗ (f ) − S Z ∗ (f ) < .
(4.8)
2
Da ferner f beschränkt ist, gibt es ein c > 0 mit |f (x)| ≤ c für alle x ∈ I. Wir
setzen nun
ε
δ = δ(ε) :=
8cN
und betrachten eine beliebige Zerlegung Z von I mit ∆(Z) < δ. Für Z 0 :=
Z ∨ Z ∗ folgt dann aus Hilfssatz 4.1 (i) und (4.8):
ε
S Z 0 (f ) − S Z 0 (f ) ≤ S Z ∗ (f ) − S Z ∗ (f ) < .
2
(4.9)
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
129
Ferner unterscheiden sich die Ober- bzw. Untersummen von Z und Z 0 in
höchstens N Summanden, nämlich jenen, die zu Zerlegungsintervallen von Z
gehören, die einen Zerlegungspunkt von Z ∗ im Innern enthalten. Da schließlich
auch ∆(Z 0 ) < δ gilt, finden wir also
0 ≤ S Z (f ) − S Z 0 (f ) ≤ 2cN δ,
0 ≤ S Z 0 (f ) − S Z (f ) ≤ 2cN δ,
so dass (4.9) liefert
(4.9)
S Z (f ) − S Z (f ) ≤ S Z 0 (f ) − S Z 0 (f ) + 4cN δ <
ε ε
+ = ε,
2 2
wie behauptet.
q.e.d.
Folgerung 4.1: Es sei f ∈ R(I), {Zn }n eine beliebige Folge von Zerlegungen von
I = [a, b] mit ∆(Zn ) → (n → ∞) und {SZn (f )}n eine zugehörige Folge beliebiger
Riemannscher Zwischensummen. Dann gilt
Zb
f (x) dx = lim SZn (f ).
n→∞
(4.10)
a
Bemerkung: Eine Folge von Zerlegungen {Zn }n mit ∆(Zn ) → 0 (n → ∞) nennt man
ausgezeichnete Zerlegungsfolge. Es gilt auch die Umkehrung von Folgerung 4.1:
Konvergiert die Folge Riemannscher Zwischensummen {SZn (f )}n für jede ausgezeichnete Zerlegungsfolge {Zn }n und jede Wahl der Zwischenwerte, so ist f integrierbar und es gilt (4.10).
Beweis von Folgerung 4.1: Ist ε > 0 beliebig gewählt, so existiert nach Satz 4.2 ein
N = N (ε) ∈ N mit
S Zn (f ) − S Zn (f ) < ε für alle n ≥ N.
Wegen S Zn (f ) ≤ I(f ) ≤ S Zn (f ) und S Zn (f ) ≤ SZn (f ) ≤ S Zn (f ) für alle n ∈ N
folgt sofort
|I(f ) − SZn (f )| < ε für alle n ≥ N,
also die Behauptung.
q.e.d.
Satz 4.3: (Rechenregeln)
(i) Gilt f, g ∈ R(I), so auch αf + βg ∈ R(I) für alle α, β ∈ R mit
I(αf + βg) = αI(f ) + βI(g).
D.h. R(I) ist ein reeller Vektorraum.
130
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
(ii) Sind f, g ∈ R(I) und gilt f ≤ g auf I, so folgt
I(f ) ≤ I(g).
(iii) Mit f ∈ R(I) gilt auch |f | ∈ R(I) mit
|I(f )| ≤ I(|f |).
(iv) Sind f, g ∈ R(I), so auch f · g ∈ R(I) und es gilt
¡
¢
|I(f g)| ≤ sup |g| I(|f |).
I
(v) Gilt f, g ∈ R(I) sowie |g| ≥ c > 0 auf I mit einer Konstante c > 0, so folgt
auch fg ∈ R(I) mit
¯ ³ f ´¯ 1
¯
¯
¯ ≤ I(|f |).
¯I
g
c
Bemerkung: Zum Beweis der Aussagen benutzen wir folgende allgemeine Beobachtung, die man leicht als Übungsaufgabe beweist: Ist h : D → R beschränkt, D ⊂ Rm ,
so folgt
sup |h(x) − h(x0 )| = sup h − inf h.
(4.11)
x,x0 ∈D
D
D
Man nennt diesen Wert die Oszillation von h.
Beweis von Satz 4.3:
(i) Mit α, β ∈ R und h(x) := αf (x) + βg(x), x ∈ I, finden wir
|h(x) − h(x0 )| ≤ |α| |f (x) − f (x0 )| + |β| |g(x) − g(x0 )| für alle x, x0 ∈ I.
Zu einer beliebigen Zerlegung Z von I bilden wir in dieser Relation das Supremum über x, x0 ∈ Ij , wenden (4.11) auf den einzelnen Teilintervallen Ij an,
multiplizieren mit ∆xj und summieren über j. Dann folgt
£
¤
£
¤
S Z (h) − S Z (h) ≤ |α| S Z (f ) − S Z (f ) + |β| S Z (g) − S Z (g) .
Wegen f, g ∈ R(I) existiert somit nach Satz 4.2 ein δ = δ(ε) > 0, so dass
S Z (h) − S Z (h) < ε gilt für alle Zerlegungen Z mit ∆(Z) < δ. Wiederum
Satz 4.2 liefert also h = αf + βg ∈ R(I).
Ist nun Z eine beliebige Zerlegung, so gilt bei jeder Wahl der Zwischenwerte
für die Riemannschen Zwischensummen:
SZ (αf + βg) = αSZ (f ) + βSZ (g).
Wenden wir dies auf eine ausgezeichnete Zerlegungsfolge {Zn }n an, so liefert
Folgerung 4.1 nach Grenzübergang n → ∞ die behauptete Linearität des Integrals.
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
131
(ii) Nach (i) gilt h := g − f ∈ R(I). Wegen h ≥ 0 liefert Formel (4.7)
(i)
0 ≤ S Z (h) ≤ I(h) = I(g) − I(f ).
also die Behauptung.
(iii) Die umgekehrte Dreiecksungleichung liefert
¯
¯
¯|f (x)| − |f (x0 )|¯ ≤ |f (x) − f (x0 )| für alle x, x0 ∈ I.
Wie in (i) folgern wir hieraus m.H. von (4.11) und Satz 4.2:
S Z (|f |) − S Z (|f |) ≤ S Z (f ) − S Z (f ) < ε
für alle Zerlegungen Z mit ∆(Z) < δ, wobei ε > 0 beliebig und δ = δ(ε) > 0
geeignet gewählt sind. Satz 4.2 liefert also wieder |f | ∈ R(I). Ferner entnehmen
wir (ii):
I(f ) ≤ I(|f |),
(i)
−I(f ) = I(−f ) ≤ I(|f |)
bzw. |I(f )| ≤ I(|f |).
(iv) Hier erhalten wir (ähnlich wie in (i) und (iii)) die Integrierbarkeit von f · g für
f, g ∈ R(I) aus der Relation
|f (x)g(x) − f (x0 )g(x0 )| ≤ (sup |f |)|g(x) − g(x0 )| + (sup |g|)|f (x) − f (x0 )|
I
I
für alle x, x0 ∈ I. Aus (i)-(iii) und der Ungleichung
|f (x)g(x)| ≤ (sup |g|)|f (x)|,
x ∈ I,
I
folgt noch
³
´ (i)
|I(f g)| ≤ I(|f g|) ≤ I (sup |g|)|f | = (sup |g|)I(|f |).
(iii)
(ii)
I
I
(v) Wegen |g| ≥ c > 0 haben wir
¯ 1
1 ¯¯
1
¯
−
¯
¯ ≤ 2 |g(x) − g(x0 )| für alle x, x0 ∈ I,
0
g(x) g(x )
c
so dass wie oben
und wir finden
1
g
∈ R(I) folgt. Damit ist nach (iv) auch
f
g
∈ R(I) richtig,
¯ 1 ¯´
¯ ³ f ´¯ (iv) ³
1
¯ ¯
¯
¯
¯ ≤ sup ¯ ¯ I(|f |) ≤ I(|f |).
¯I
g
g
c
I
Damit ist alles gezeigt.
q.e.d.
132
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 4.4: Für I = [a, b] gilt C 0 (I) ⊂ R(I).
Beweis: Da I = [a, b] kompakt ist, ist jede Funktion f ∈ C 0 (I) gleichmäßig stetig
nach Satz 3.3 aus Kap. 2. Zu beliebigem ε > 0 existiert also ein δ = δ(ε) > 0, so dass
gilt
ε
|f (x) − f (x0 )| <
für alle x, x0 ∈ I mit |x − x0 | < δ.
b−a
Ist nun Z eine beliebige Zerlegung von I mit ∆(Z) < δ, so folgt
S Z (f ) − S Z (f )
=
N
X
£
¤
sup f − inf f ∆xj
j=1
(4.11)
=
µX
N
Ij
Ij
¶
sup |f (x) − f (x0 )| ∆xj
0
j=1 x,x ∈Ij
N
<
ε X
∆xj = ε
b−a
j=1
und somit f ∈ R(I) nach Satz 4.2.
q.e.d.
Bemerkung: Eine Funktion f : I → R, I = [a, b], heißt stückweise stetig auf I, wenn
eine Zerlegung
Z = {x0 , . . . , xN : a = x0 < x1 < . . . < xN = b}
von I so existiert, dass f in jedem Teilintervall Ij = (xj−1 , xj ) stetig ist und die
einseitigen Grenzwerte limξ→xj−1 + f (ξ), limξ→xj − f (ξ) existieren für j = 1, . . . , N .
Die Funktionen

limξ→xj−1 + f (ξ), x = xj−1


f (x),
x ∈ (xj−1 , xj )
ϕj (x) :=


limξ→xj − f (ξ),
x = xj
sind also stetig auf [xj−1 , xj ] für j = 1, . . . , N . Aus Satz 4.4 erhält man nun leicht
die
Folgerung 4.2: Jede stückweise stetige Funktion auf dem Intervall I = [a, b] ist
Riemann-integrierbar.
Satz 4.5: (Mittelwertsatz der Integralrechnung)
Es sei I = [a, b] und f ∈ C 0 (I) sowie p ∈ R(I) mit p ≥ 0 auf I seien gegeben. Dann
existiert ein ξ ∈ (a, b), so dass gilt
Zb
Zb
f (x)p(x) dx = f (ξ)
a
p(x) dx.
a
(4.12)
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
133
Bemerkung: Speziell für p(x) := 1, x ∈ [a, b], haben wir p ∈ R(I) und z.B. nach
Folgerung 4.1:
Zb
1 dx = lim SZn (1) = b − a
n→∞
a
für eine ausgezeichnete Zerlegungsfolge {Zn }n und beliebige Zwischenwerte. Satz 4.5
liefert also
Zb
Zb
1
− f (x) dx :=
f (x) dx = f (ξ).
b−a
a
a
Rb
Die Größe −a f (x) dx heißt Mittelwert von f über I und gibt die mittlere Höhe“
”
von f an.
Beweis von Satz 4.5: Mit m := inf I f , m := supI f haben wir mp(x) ≤ f (x)p(x) ≤
mp(x) für x ∈ I. Satz 4.3 (i), (ii) liefern also
Zb
Zb
p(x) dx ≤
m
a
Zb
f (x)p(x) dx ≤ m
a
p(x) dx.
a
Somit existiert ein µ ∈ [m, m] mit
Zb
Zb
p(x) dx.
f (x)p(x) dx = µ
a
(4.13)
a
Nach dem Weierstraßschen Hauptlehrsatz gibt es x1 , x2 ∈ [a, b] mit f (x1 ) = m,
f (x2 ) = m. Nach dem Zwischenwertsatz existiert nun ein ξ ∈ [a, b] mit f (ξ) = µ, so
dass (4.12) sofort aus (4.13) folgt. Als Übungsaufgabe zeige man noch, dass o.E. ξ ∈
(a, b) angenommen werden kann.
q.e.d.
Hilfssatz 4.2: Ist I = [a, b] ein kompaktes Intervall und f ∈ R(I), so gilt auch
f ∈ R(I 0 ) für jedes abgeschlossene Teilintervall I 0 ⊂ I.
Beweis: Wegen f ∈ R(I) existiert nach Satz 4.1 zu jedem ε > 0 eine Zerlegung Z
von I mit S Z (f ) − S Z (f ) < ε. Für die Verfeinerung Z ∗ von Z, die zusätzlich die
beiden Endpunkte von I 0 enthält, gilt dann nach Hilfssatz 4.1 (i):
S Z ∗ (f ) − S Z ∗ (f ) ≤ S Z (f ) − S Z (f ) < ε.
Die Teilzerlegung Z 0 von Z ∗ , die nur Teilpunkte in I 0 enthält, ist dann offenbar
Zerlegung von I 0 und es gilt
S Z 0 (f ) − S Z 0 (f ) ≤ S Z ∗ (f ) − S Z ∗ (f ) < ε,
so dass wiederum Satz 4.1 liefert: f ∈ R(I 0 ).
q.e.d.
134
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 4.6: (Additivität des Integrals)
Es sei I = [a, b] in endlich viele abgeschlossene Teilintervalle I1 , . . . , Iµ zerlegt, die
höchstens Randpunkte gemein haben, d.h.
I = I1 ∪ . . . ∪ Iµ ,
int Ij ∩ int Ik = ∅ für j 6= k.
Dann gilt für beliebige f ∈ R(I) die Relation
Z
f (x) dx =
µ Z
X
f (x) dx.
(4.14)
j=1 I
I
j
Beweis: Nach Hilfssatz 4.2 gilt zunächst f ∈ R(Ij ) für j = 1, . . . , µ, so dass alle
Integrale in (4.14) erklärt sind. Es sei nun {Zn }n eine ausgezeichnete Zerlegungsfolge, deren Elemente die Endpunkte aller Teilintervalle enthalten, und SZn (f ) seien
(j)
zugehörige Riemannsche Zwischensummen. Schreiben wir dann SZn (f ) für die Zwischensummen, die nur Teilpunkte aus Ij enthalten, so gilt offenbar
SZn (f ) =
µ
X
(j)
SZn (f ) für alle n ∈ N.
j=1
Grenzübergang n → ∞ und Folgerung 4.1 liefern die Behauptung.
q.e.d.
Definition 4.5: Ist f ∈ R(I), I = [a, b] und seien α, β ∈ I mit α > β gewählt.
Dann setzen wir
Zβ
Zα
f (x) dx = 0
Zα
f (x) dx := −
und
α
α
f (x) dx.
β
Satz 4.7: Ist f ∈ R(I) und sind α, β, γ ∈ I = [a, b] beliebig gewählt, so folgt
Zγ
Zβ
f (x) dx +
α
Zγ
f (x) dx.
f (x) dx =
β
(4.15)
α
Beweis: Nach Hilfssatz 4.2 und Definition 4.5 sind alle Integrale sinnvoll erklärt.
• Stimmen zwei der Zahlen α, β, γ überein, so ist die Aussage trivial.
• Falls α < β < γ gilt, so ist (4.15) ein Spezialfall von (4.14) wegen f ∈ R([α, γ]).
5. INTEGRATION UND DIFFERENTIATION
135
• Falls β < α < γ gilt, so haben wir f ∈ R([β, γ]) und
Zγ
(4.14)
f (x) dx =
β
Zγ
Zα
f (x) dx
f (x) dx +
Def. 4.5
=
Zβ
−
f (x) dx +
α
α
β
Zγ
f (x) dx,
α
also nach Umstellen wieder (4.15). Ganz entsprechend ergeben sich die übrigen
vier Fälle (β < γ < α, α < γ < β, γ < α < β, γ < β < α).
q.e.d.
Wir betrachten nun noch komplex- bzw. vektorwertige Funktionen:
Definition 4.6:
(i) Eine beschränkte Funktion f : I → C heißt integrierbar auf I = [a, b], wenn
Re f, Im f ∈ R(I) gilt. Wir setzen dann
Zb
Zb
f (x) dx :=
a
Zb
Re f (x) dx + i
a
Im f (x) dx
a
und schreiben f ∈ R(I, C).
(ii) Entsprechend heißt f = (f1 , . . . , fd ) : I → Rd integrierbar auf I = [a, b], wenn
fj ∈ R(I) für alle j = 1, . . . , d gilt. Wir schreiben dann f ∈ R(I, Rd ) und
setzen
µ Zb
¶
Zb
Zb
f (x) dx :=
f1 (x) dx, . . . , fd (x) dx .
a
a
a
Bemerkung: Mit diesen Definitionen lassen sich die Aussagen der Sätze 4.3 (außer
(ii), und (v) nur für f, g ∈ R(I, C)), 4.4, 4.6 und 4.7 direkt auf Funktionen in R(I, C)
bzw. R(I, Rd ) übertragen.
5
Integration und Differentiation
Definition 5.1: Sei I ⊂ R beliebig und f ∈ C 0 (I) gegeben. Dann heißt F ∈ C 1 (I)
Stammfunktion zu f , falls gilt
F 0 (x) = f (x)
für alle x ∈ I.
Satz 5.1: Ist c ∈ I = [a, b] beliebig und f ∈ C 0 (I). Dann ist
Zx
f (t) dt,
F (x) :=
c
eine Stammfunktion zu f .
x ∈ I,
136
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis: Für x ∈ I und h 6= 0 mit x + h ∈ I gilt
F (x + h) − F (x)
h
=
Def. 4.5
=
(4.15)
=
1
h
µ x+h
¶
Z
Zx
f (t) dt − f (t) dt
c
c
µ x+h
¶
Z
Zc
1
f (t) dt + f (t) dt
h
1
h
c
x+h
Z
(5.1)
x
f (t) dt.
x
Nach dem Mittelwertsatz der Integralrechnung existiert ein ξh ∈ I zwischen x und
x + h mit
x+h
Z
1
f (t) dt = f (ξh ).
(5.2)
h
x
Wegen |ξh − x| ≤ |h| → 0 (h → 0) und der Stetigkeit von f haben wir
¢
¡
lim f (ξh ) = f lim ξh = f (x).
h→0
h→0
Zusammen mit (5.1) und (5.2) finden wir also
lim
h→0
F (x + h) − F (x)
= lim f (ξh ) = f (x)
h→0
h
und somit F 0 ≡ f ∈ C 0 (I).
q.e.d.
Satz 5.2: Sei F ∈ C 1 (I) eine beliebige Stammfunktion von f ∈ C 0 (I), I ⊂ R
Intervall. Eine Funktion G ∈ C 1 (I) ist genau dann Stammfunktion von f , wenn
G − F ≡ const auf I gilt.
Beweis:
• ⇒“: Ist G Stammfunktion zu f , so folgt
”
(G − F )0 = G0 − F 0 = f − f = 0
auf I.
Nach Folgerung 2.1 (iii) ist also G − F ≡ const auf I.
• ⇐“: Ist umgekehrt G − F ≡ const auf I, so folgt
”
G0 = (F + const)0 = F 0 = f
d.h. G ist Stammfunktion.
auf I,
q.e.d.
5. INTEGRATION UND DIFFERENTIATION
137
Bemerkung: Ist also F ∈ C 1 (I) eine Stammfunktion von f (z.B: die in Satz 5.1
erklärte), so ist die Menge aller Stammfunktionen gegeben durch
{G ∈ C 1 (I) : G ≡ F + c, c ∈ R}.
Diese Menge wird unbestimmtes Intergral von f genannt und wir schreiben
Z
f (x) dx := {F + c : c ∈ R}
oder, wie allgemein gebräuchlich,
Z
f (x) dx = F (x) + c.
Zur Unterscheidung heißt daher
den Grenzen a und b).
Rb
a
f (x) dx auch bestimmtes Integral von f (zwischen
Satz 5.3: (Fundamentalsatz der Differential- und Integralrechnung)
Sei F ∈ C 1 (I) eine beliebige Stammfunktion von f ∈ C 0 (I), I = [a, b]. Dann gilt
Zb
¯b
f (x) dx = F (b) − F (a) =: F (x)¯a .
a
Rx
Beweis: Nach Satz 5.1 ist F0 (x) := a f (t) dt Stammfunktion von f , und nach
Satz 5.2 gilt F ≡ F0 + c auf I mit einer Konstanten c ∈ R. Wegen F0 (a) = 0
folgt also
Zb
f (x) dx = F0 (b) = F0 (b) − F0 (a) = F (b) − F (a),
a
wie behauptet.
q.e.d.
Beispiele:
1. Für α 6= −1 gilt
Z
xα dx =
α+1
xα+1
+ c,
α+1
d x
( α+1 ) = xα nach (3.9). D.h. F (x) =
denn dx
f (x) = xα auf (0, +∞). Satz 5.3 liefert also
Zb
für a, b > 0.
xα+1
α+1
ist Stammfunktion von
xα+1 ¯¯b
1
x dx =
(bα+1 − aα+1 )
¯ =
α+1 a α+1
α
a
x > 0,
138
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
2. Nach Formel (3.5) gilt
Z
also
Zb
a
1
dx = log x + c,
x
¯b
dx
b
= log x¯a = log
x
a
x > 0,
für a, b > 0.
3. Den Formeln (3.3) und (3.10) entnehmen wir
Z
exp x dx = exp x + c,
Z
cos x dx = sin x + c,
Z
sin x dx = − cos x + c,
x ∈ R.
Satz 5.4: (Partielle Integration)
Ist I = [a, b] und sind f, g ∈ C 1 (I, Rd ) gegeben, so gilt
Zb
¯b
hf 0 (x), g(x)i dx = hf (x), g(x)i¯a −
a
Zb
hf (x), g 0 (x)i dx.
(5.3)
a
Beweis: Die Produktformel (1.7) und Satz 5.3 liefern sofort
¯b
hf (x), g(x)i¯
a
Zb
=
a
d
hf (x), g(x)i dx
dx
Zb
Zb
0
=
hf (x), g 0 (x)i dx
hf (x), g(x)i dx +
a
a
und nach Umstellen die Behauptung (3.4).
q.e.d.
Bemerkung: Die zuweilen nützliche unbestimmte Version“ von (5.3) ist
”
Z
Z
hf 0 (x), g(x)i dx = hf (x), g(x)i − hf (x), g 0 (x)i dx.
(5.4)
Diese gewinnt man wieder sofort aus der Produktformel (1.7) und der Definition des
unbestimmten Integrals.
5. INTEGRATION UND DIFFERENTIATION
139
Beispiele:
π
π
Z2
Z2
sin2 x dx =
1.
0
cos2 x dx =
0
π
. Denn Satz 5.4 liefert
4
π
Z2
π
¯π
sin2 x dx = [− cos x · sin x]¯02 +
0
π
Z2
Z2
cos2 x dx =
0
π
2
(1 − sin x) dx =
0
bzw.
π
2
Z
2
=
0
π
2
Z
cos2 x dx
Z
sin2 x dx
dx −
0
0
π
π
Z2
sin2 x dx =
0
1
2
Z2
0
π
1 ¯π
dx = x¯02 = .
2
4
2. Für x > 0 haben wir nach (5.4):
Z
Z
log x dx =
Z
1 · log x dx = x log x −
x·
1
dx
x
= x log x − x + const,
also
Za
log x dx = a(log a − 1) + 1 für a > 0.
1
Satz 5.5: (Substitutions- oder Transformationsformel)
Es seien I, I ∗ ⊂ R zwei kompakte Intervalle, und f ∈ C 0 (I, Rd ) sowie ϕ ∈ C 1 (I ∗ , R)
mit ϕ(I ∗ ) ⊂ I seien gegeben. Dann gilt für beliebige α, β ∈ I ∗ :
ϕ(β)
Z
Zβ
f (ϕ(t))ϕ0 (t) dt.
f (x) dx =
ϕ(α)
(5.5)
α
Beweis: Es sei F ∈ C 1 (I, Rd ) eine Stammfunktion von f , d.h. F 0 ≡ f auf I. Für
g := F ◦ ϕ gilt dann g ∈ C 1 (I ∗ , Rd ) und der Kettenregel, Satz 1.3, entnehmen wir
g 0 (t) = F 0 (ϕ(t))ϕ0 (t) = f (ϕ(t))ϕ0 (t),
t ∈ I ∗.
140
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 5.3 liefert also für beliebige α, β ∈ I ∗ :
Zβ
Zβ
0
g 0 (t) dt = g(β) − g(α)
f (ϕ(t))ϕ (t) dt =
α
α
ϕ(β)
Z
= F (ϕ(β)) − F (ϕ(α)) =
f (x) dx,
ϕ(α)
wie behauptet.
q.e.d.
Beispiele:
1. Zu berechnen sei
Rr√
r2 − x2 dx, r > 0.
0
Wir betrachten die Transformation x = ϕ(t) = r sin t, t ∈ [0, π2 ]. Dann ist
ϕ(0) = 0, ϕ( π2 ) = r und ϕ0 (t) = r cos t. Formel (5.5) liefert also
π
π
Zr p
Z2 p
Z2
πr2
2
2
2
2
2
2
.
r − x dx =
r − r sin t · r cos t dt = r
cos2 t dt =
4
0
0
0
(→ Flächeninhalt der Kreisscheibe vom Radius r > 0 ist 4 ·
2. Zu berechnen ist
R1
0
πr2
4
= πr2 ).
(1 + t2 )α t dt, α ∈ R \ {−1}.
Wir beachten
1
d
h(t) := (1 + t2 )α t = (1 + t2 )α (1 + t2 ),
2
dt
t ∈ R.
Mit f (x) := xα , x > 0, und ϕ(t) := 1 + t2 , t ∈ R, haben wir also
1
h(t) = f (ϕ(t))ϕ0 (t),
2
t ∈ R.
Beachten wir noch ϕ(0) = 1, ϕ(1) = 2, so folgt schließlich
Z1
1
(1 + t ) t dt =
2
2 α
0
(5.5)
Z2
xα dx =
1
1 xα+1 ¯¯2 2α+1 − 1
,
¯ =
2α+1 1
α+1
α 6= −1.
5. INTEGRATION UND DIFFERENTIATION
141
Bemerkungen:
1. Die unbestimmte Form der Substitutionsregel (5.5), nämlich
Z
Z
f (x) dx = f (ϕ(t))ϕ0 (t) dt
(5.6)
ist häufig ebenfalls hilfreich. Ist F (x) eine Stammfunktion von f (x) und kennt
man eine Stammfunktion Ψ(t) von f (ϕ(t))ϕ0 (t), so bedeutet (5.6) gerade
F (x) = Ψ(t) + c mit x = ϕ(t).
Vorsicht: Möchte man, ähnlich wie in Bsp. 1 oben, eine Stammfunktion von f
mittels (5.6) bestimmen, so muss ϕ bijektiv sein: Kennt man nämlich Ψ, so
finden wir dann
F (x) = Ψ(ϕ−1 (x)) + c.
Beispiel:
Z
dx
2
r + x2
x=ϕ(t)=rt
Z
=
(3.22)
=
r dt
1
=
2
2
2
r +r t
r
1
arctan t + const
r
Z
dt
1 + t2
ϕ−1 (x)= xr
=
1
x
arctan + const.
r
r
2. Es gibt eine Vielzahl von Kunsgriffen zur Bestimmung von Integralen bzw.
Stammfunktionen, auf die wir nicht im Einzelnen eingehen können. Wir verweisen auf S. Hildebrandt: Analysis 1 (Springer-Verlag), Kap. 3, § 10 für einige
Beispiele, insbesondere die Integration rationaler Funktionen (→ Partialbruchzerlegung).
Wir betrachten nun wieder Funktionenfolgen und beginnen mit dem
Satz 5.6: Sei {fn }n eine Folge von Funktionen fn ∈ R(I, Rd ), I = [a, b], mit der
Eigenschaft fn →
→ f (n → ∞) auf I. Dann folgt f ∈ R(I, Rd ) und
Zb
Zb
f (x) dx = lim
fn (x) dx.
n→∞
a
(5.7)
a
Bemerkungen:
1. Satz 5.6 besagt, dass wir bei gleichmäßig konvergenten, integrierbaren Funktionenfolgen Integration und Grenzwertbildung vertauschen können, denn (5.7)
lässt sich schreiben als
Zb
Zb
fn (x) dx.
lim fn (x) dx = lim
n→∞
a
n→∞
a
Die Aussage wird falsch bei nur punktweise konvergenten Funktionenfolgen.
142
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
2. Satz 5.6 lässt sich natürlich wieder auf gleichmäßig konvergente Funktionenreihen übertragen.
Beweis von Satz 5.6: Es bezeichne g : I → R die j-te Komponente von f und
gn ∈ R(I) die j-te Komponente von fn für ein j ∈ {1, . . . , d}. Wir zeigen g ∈ R(I)
und
Zb
Zb
g(x) dx = lim
gn (x) dx.
(5.8)
n→∞
a
Rb
a
Die Definition von a f (x) dx als komponentenweises Integral liefert dann die Behauptung.
Sei also ε > 0 beliebig gewählt, so existiert ein N = N (ε) ∈ N mit
ε
|gn (x) − g(x)| <
für alle x ∈ I, n ≥ N.
(5.9)
3(b − a)
Speziell für n = N erhalten wir also
|g(x) − g(x0 )| < |gN (x) − gN (x0 )| +
2ε
3(b − a)
für alle x, x0 ∈ I.
(5.10)
Ist nun Z eine Zerlegung von I mit S Z (gN )−S Z (gN ) < 3ε , die nach Satz 4.1 existiert,
so liefern (5.10) und (4.11) die Relation
X
2ε
ε 2
S Z (g) − S Z (g) < S Z (gN ) − S Z (gN ) +
∆xj < + ε = ε.
3(b − a)
3 3
j
Wiederum nach Satz 4.1 ist somit g ∈ R(I) richtig, und Satz 4.3 sowie (5.9) liefern
¯ Zb
¯ ¯ Zb
¯
Zb
¯
¯ ¯ £
¤ ¯
¯ gn (x) dx − g(x) dx¯ = ¯
gn (x) − g(x) dx¯¯
¯
¯ ¯
a
a
Zb
≤
a
a
ε
|gn (x) − g(x)| dx <
3(b − a)
(5.9)
Zb
dx < ε für alle n ≥ N,
a
also (5.8) wie behauptet.
q.e.d.
Wir sind nun in der Lage, den ausgelassenen Beweis von Satz 1.5 nachzuliefern,
der uns erst die Differenzierbarkeit der elementaren Funktionen in § 3 sicherte. Zur
Erinnerung formulieren wir ihn noch einmal als
Satz 5.7: Sei I = [a, b] und {fn }n eine Folge von Funktionen fn ∈ C 1 (I, Rd ) für
alle n ∈ N. Falls dann gilt
fn → f (n → ∞),
fn0 →
→ g (n → ∞)
auf I,
so folgt für den punktweisen Limes f ∈ C 1 (I, Rd ), und es gilt f 0 = g auf I.
6. UNEIGENTLICHE INTEGRALE
143
Beweis: Da fn0 ∈ C 0 (I, Rd ) gilt, liefert der Weierstraßsche Konvergenzsatz, Satz 4.1
aus Kap. 2, für die Grenzfunktion g ∈ C 0 (I, Rd ). Und wegen C 0 (I, Rd ) ⊂ R(I, Rd )
haben wir nach Satz 5.6:
Zx
Zx
fn0 (t) dt
lim
n→∞
=
a
g(t) dt für alle x ∈ [a, b].
a
Andererseits entnehmen wir Satz 5.3 die Relation
Zx
fn0 (t) dt,
fn (x) = fn (a) +
x ∈ [a, b].
(5.11)
a
Grenzübergang n → ∞ liefert nun
Zx
f (x) = f (a) +
g(t) dt,
x ∈ [a, b].
a
Insbesondere ist also f ∈ C 1 (I, Rd ) nach Satz 5.1 und Differentiation liefert f 0 = g
auf I, wie behauptet.
q.e.d.
Bemerkung: Der Beweis zeigt, dass es genügt statt fn → f (n → ∞) auf I die
Konvergenz der Punkte {fn (a)}n zu fordern. Die Beziehung fn → f (n → ∞) auf I
folgt dann aus (5.11). Dabei kann a noch durch einen beliebigen Punkt c ∈ I ersetzt
werden.
Beispiel: Es gilt
³
x ´n
= ex für alle x ∈ R.
1+
n→∞
n
Mit fn (x) := n log(1 + nx ) und f (x) = x für |x| ≤ N und n > N gilt nämlich
fn (0) = 0 = f (0) sowie
1
fn0 (x) =
, f 0 (x) = 1.
1 + nx
Man rechnet leicht fn0 →
→ f 0 (n → ∞) auf [−N, N ] nach, so dass Satz 5.7 und die
anschließende Bemerkung auch fn → f (n → ∞) auf [−N, N ] liefern. Da schließlich
exp : R → R stetig ist, folgt
h
³
³
x ´i
x ´n
= exp lim n log 1 +
= exp x.
lim 1 +
n→∞
n→∞
n
n
lim
6
Uneigentliche Integrale
Bisher haben wir nur beschränkte Funktionen über kompakte Intervalle integriert.
Beide Einschränkungen sollen jetzt aufgeweicht werden:
144
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Fall I: Unbeschränktes Integrationsintervall
Sei I z.B. nach oben unbeschränkt, also I = [a, +∞). Ferner gelte f ∈ R([a, b]) für
jedes b ∈ [a, +∞), insbesondere sei also f auf [a, b] beschränkt für alle b ∈ [a, +∞).
Rb
Definition 6.1: Wenn limb→+∞ a f (x) dx existiert, so heißt dieser Grenzwert das
uneigentliche Integral von f über [a, +∞) und wir schreiben
+∞
Z
Zb
f (x) dx := lim
f (x) dx.
b→+∞
a
a
Wir sagenRdann, das uneigentliche Integral
R b existiert oder konvergiert, anderenfalls
+∞
sagen wir a f (x) dx divergiert. Falls a f (x) dx → ±∞ (b → +∞) gilt, sagen wir
R +∞
f (x) dx ist bestimmt divergent und schreiben
a
+∞
Z
f (x) dx = ±∞.
a
Schließlich heißt
R +∞
a
f (x) dx absolut konvergent, wenn
R +∞
a
|f (x)| dx konvergiert.
Bemerkungen
R +∞
1. Nach dem Cauchyschen Konvergenzkriterium ist a f (x) dx genau dann konvergent, wenn zu jedem ε > 0 ein ξ ≥ a existiert mit
¯ Zb0
¯ ¯ Zb0
¯
Zb
¯
¯ ¯
¯
¯ f (x) dx¯ = ¯ f (x) dx − f (x) dx¯ < ε für alle b, b0 > ξ.
¯
¯ ¯
¯
a
b
a
R +∞
2. Hieraus und aus Satz 4.3 (iii) folgt auch: Konvergiert a f (x) dx absolut, so
auch im gewöhnlichen Sinne. Die Umkehrung gilt i.A. nicht (siehe das u.a. Beispiel).
R +∞
3. Ist ϕ : [a, +∞) → R nichtnegativ, so existiert a ϕ(x) dx nach dem Satz über
monotone Konvergenz genau dann, wenn es ein c > 0 gibt mit der Eigenschaft
Zb
ϕ(x) dx ≤ c für alle b ∈ [a, +∞).
a
Anderenfalls ist
R +∞
a
ϕ(x) dx bestimmt divergent. Schreibweise
6. UNEIGENTLICHE INTEGRALE
145
+∞
Z
• Konvergenz:
ϕ(x) dx < +∞.
a
+∞
Z
• Divergenz:
ϕ(x) dx = +∞.
a
Satz 6.1: (Majorantenkriterium)
Sei f : [a, +∞) → R mit f ∈ R([a, b]) für alle b ∈ [a, +∞) gegeben. Falls dann die
Relation
|f (x)| ≤ ϕ(x) für alle x ∈ [a, +∞)
R +∞
gilt mit einer nichtnegativen Funktion ϕ : [0, +∞) → R, die a ϕ(x) dx < +∞
R +∞
erfüllt, dann konvergiert das Integral a f (x) dx absolut.
Beweis: Sofort klar aus
Zb
Zb
ϕ(x) dx für alle b ∈ [a, +∞)
|f (x)| dx ≤
a
a
und obigen Bemerkungen.
q.e.d.
Bemerkung: Die Formulierung und den Beweis eines entsprechenden Minorantenkriteriums überlassen wir dem Leser.
R +∞ sin x
Beispiel: Wir behaupten: 0
x dx ist konvergent, aber nicht absolut konvergent.
Denn:
• Wegen limx→0+ sinx x = 1 können wir sinx x als auf [0, +∞) stetige Funktion
auffassen. Für beliebige 0 < b < b0 berechnen wir mit partieller Integration
Zb0
0
Zb
sin x
cos x ¯¯b0
cos x
dx = −
dx.
¯ −
x
x b
x2
b
b
Es folgt also
¯
¯ Zb0
Zb0
¯ sin x ¯ 1
1
2 1
3
dx
¯
dx¯¯ ≤ + 0 +
< + = → 0 (b → +∞).
¯
2
x
b b
x
b
b
b
b
Somit ist
R +∞ sin x
0
x
b
+∞
R
0
sin x
x
dx =
π
2
dx konvergent nach obiger Bemerkung 1. Es gilt übrigens
(siehe S. Hildebrandt: Analysis 1 (Springer-Verlag), S. 319 ).
146
•
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
R +∞
0
| sinx x | dx ist nicht konvergent. Hierzu beachten wir
Zkπ¯
¯
¯ sin x ¯
¯
¯ dx
x
=
Zνπ ¯
k
k
¯
X
X
1
¯ sin x ¯
¯
¯ dx ≥
x
νπ
ν=1
(ν−1)π
Zπ
k
0
Period. X 1
=
νπ
ν=1
ν=1
sin x dx =
0
2
π
k
X
ν=1
Zνπ
| sin x| dx
(ν−1)π
1
→ +∞ (k → ∞),
ν
wie behauptet.
Ganz entsprechend erklärt man für eine Funktion f : (−∞, b] → R mit f ∈
R([a, b]) für alle a ∈ (−∞, b] das uneigentliche Integral
Zb
Zb
f (x) dx,
f (x) dx := lim
a→−∞
a
−∞
falls der Grenzwert existiert. Obige Aussagen lassen sich direkt übertragen.
Sei nun f : R → R eine Funktion mit f ∈ R(I) für alle kompakten Intervalle I ⊂
R.
Falls
dannRfür ein a ∈ R (und damit für alle a ∈ R) die uneigentlichen Integrale
Ra
+∞
f
(x)
dx, a f (x) dx existieren, so erklären wir das uneigentliche Integral
−∞
+∞
+∞
Z
Za
Z
f (x) dx :=
f (x) dx +
f (x) dx.
−∞
(6.1)
a
−∞
Man rechnet leicht nach, dass diese Definition von der Wahl von a ∈ R unabhängig
ist.
R +∞
Vorsicht: Die naheliegende Definition des uneigentlichen Integrals −∞ f (x) dx als
Grenzwert
ZR
lim
f (x) dx
R→+∞
−R
liefert i.A. nicht das gleiche Ergebnis: Dieser sogenannte CauchyscheR Hauptwert kann
+∞
existieren, ohne dass das in (6.1) erklärte uneigentliche Integral −∞ f (x) dx existiert. Betrachte z.B. f (x) := x: Offenbar gilt
ZR
x dx =
−R
x2 ¯¯R
= 0,
¯
2 −R
6. UNEIGENTLICHE INTEGRALE
147
aber
ZR
x dx =
R2 a2
−
→ +∞ (R → +∞),
2
2
x dx =
a2 R 2
−
→ −∞ (R → +∞).
2
2
a
Za
−R
Beispiele:
1. Wegen arctan0 x =
1
,
1+x2
Za
0
Z0
−a
Wegen arctan a →
folgt
+∞
Z
−∞
π
2
x ∈ R, haben wir für beliebige a > 0:
dx
1 + x2
¯a
= arctan x¯0 = arctan a,
dx
1 + x2
= − arctan(−a) = arctan a.
(a → +∞) konvergieren also
dx
=
1 + x2
+∞
Z
0
dx
+
1 + x2
Z0
−∞
R +∞
0
dx
,
1+x2
R0
dx
−∞ 1+x2
und es
dx
π π
= + = π.
2
1+x
2
2
2
2. Für beliebige x ∈ R erhält man ex ≥ 1 + x2 > 0 aus der Reihendarstellung
2
1
der e-Funktion. Also folgt 0 < e−x ≤ 1+x
2 . Und nach Beispiel 1 und dem MaR +∞ −x2
R0
2
jorantenkriterium konvergieren 0 e
dx, −∞ e−x dx. Also existiert auch
das Integral
+∞
Z
¡ √
2
e−x dx = π ).
−∞
Fall II: Unbeschränkte Funktionen
Sei nun f : [a, b) → R, −∞ < a < b < +∞, gegeben und auf jedem kompakten
Teilintervall von [a, b) integrierbar.
Definition 6.2: Wenn der Grenzwert
Zξ
Zb
f (x) dx := lim
f (x) dx
ξ→b−
a
a
148
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
existiert, bezeichnen wir ihn als das uneigentliche Integral von f über [a, b). Das
Rb
Rb
Integral a f (x) dx heißt absolut konvergent, wenn a |f (x)| dx existiert.
Rb
Ganz entsprechend erklären wir das uneigentliche Integral a f (x) dx einer FunkRb
tion f : (a, b] → R durch den rechtsseitigen Grenzwert limξ→a+ ξ f (x) dx. Ist f nur
auf (a, b) erklärt, müssen beide Grenzwerte betrachtet werden.
Wie in Fall I zieht absolute Konvergenz wieder gewöhnliche Konvergenz nach
sich, und wir haben den Satz 6.1 entsprechenden
Satz 6.2: (Majorantenkriterium)
Für f : [a, b) → R gelte f ∈ R(I) für alle kompakten Intervalle I ⊂ [a, b). Existiert
Rb
dann eine nichtnegative Funktion ϕ : [a, b) → R mit a ϕ(x) dx < +∞ so, dass gilt
|f (x)| ≤ ϕ(x)
dann konvergiert
Rb
a
für alle x ∈ [a, b),
f (x) dx absolut.
Beispiele:
1. Für α ∈ (0, 1) gilt
Z1
R1
dx
0 xα
1
1−α ,
=
denn wir haben
1
dx
x1−α ¯¯1
1
(1 − ξ 1−α ) →
(ξ → 0+).
=
¯ =
α
x
1−α ξ
1−α
1−α
ξ
2. Es gilt
R1
0
√ dx
1−x2
Zξ
0
= π2 , denn
¯ξ
dx
π
√
= arcsin x¯0 = arcsin ξ → (ξ → 1−).
2
2
1−x
Bemerkung: Ist f : [a, b] \ {c} → R mit einem c ∈ (a, b) gegeben, d.h. f hat in einem
inneren Punkt eine singuläre Stelle“, so setzen wir
”
Zb
Zc
Zb
f (x) dx := f (x) dx + f (x) dx,
a
a
c
Rc
Rb
wenn die uneigentlichen Integrale a f (x) dx, c f (x) dx existieren. Auch hier gibt
es ein Hauptwertphänomen“: Der Grenzwert
”
µ Zc−ε
¶
Zb
lim
f (x) dx +
f (x) dx
(6.2)
ε→0+
a
c+ε
6. UNEIGENTLICHE INTEGRALE
149
Rb
kann existieren, ohne dass a f (x) dx existiert.
R1
Beispiel: −1 dx
x existiert nicht, wohl aber der Grenzwert (6.2).
Wir wollen schließlich noch ein interessantes Kriterium für Reihenkonvergenz
angeben:
Satz 6.3: (Riemannsches Integralkriterium)
Sei f : [1, +∞) → R eine monoton fallende, nichtnegative P
Funktion mit f ∈ R(I) für
alle kompakten I ⊂ [1, +∞). Dann konvergiert die Reihe ∞
n=1 an mit den Gliedern
R +∞
an := f (n) genau dann, wenn das uneigentliche Integral 1 f (x) dx konvergiert.
Beweis: Betrachten wir zu N ∈ N die äquidistante Zerlegung Z = {x0 , x1 , . . . , xN } :=
{1, 2, . . . , N + 1}, so hat f die Untersumme
S Z (f ) =
N
N
N
X
X
X
(inf f )∆xj =
f (xj ) · 1 =
aj+1
Ij
j=1
und die Obersumme
S Z (f ) =
j=1
j=1
N
N
X
X
(sup f )∆xj =
aj .
j=1
Ij
j=1
Es folgt somit
N
+1
X
N
Z+1
aj ≤
j=2
f (x) dx ≤
N
X
aj .
j=1
1
R +∞
P +1
Falls also 1 f (x) dx existiert, ist { N
j=2 aj }N beschränkt und die Konvergenz der
Rb
P
Reihe folgt aus der Monotonie. Falls umgekehrt ∞
j=1 aj konvergiert, ist 1 f (x) dx
R +∞
gleichmäßig beschränkt für alle b ≥ 1 und es folgt die Existenz von 1 f (x) dx.
q.e.d.
Beispiel: Für α > 1 berechnen wir
+∞
Z
1
dx
x1−α ¯¯b
1
=
lim
.
¯ =
α
b→+∞ 1 − α 1
x
α−1
Nach Satz 6.3 konvergiert somit die Reihe
∞
X
1
nα
n=1
für alle α > 1.
150
7
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Die Taylorsche Formel
Die Taylorformel liefert eine Polynomapproximation einer vorgegebenen, hinreichend
glatten Funktion zusammen mit einer Abschätzung des Fehlerterms.
Pn
k
Motivation: Es sei f (x) =
k=0 ak x , x ∈ R, ein Polynom n-ten Grades mit
a0 , . . . , an ∈ C. Dann können wir f mittels der Binomischen Formel um ein beliebiges x0 ∈ R entwickeln:
k µ ¶
X
k
k
k
x = ((x − x0 ) + x0 ) =
(x − x0 )l xk−l
0 ,
l
l=0
also nach Einsetzen
f (x) =
n
X
ck (x − x0 )k ,
x ∈ R,
(7.1)
k=0
mit (i.A. von x0 abhängigen) Koeffizienten c0 , . . . , cn ∈ C. Für die Ableitungen im
Punkt x0 folgt dann
f (k) (x0 ) = k! ck , k = 0, . . . , n.
Wir können also (7.1) schreiben als
f (x) =
n
X
f (k) (x0 )
k=0
k!
(x − x0 )k ,
x ∈ R.
Für eine beliebige Funktion f ∈ C n (I) auf einem Intervall I ⊂ R erklären wir
nun das n-te Taylorpolynom pn (x) an der Stelle x0 ∈ I:
pn (x) :=
n
X
f (k) (x0 )
k=0
k!
(x − x0 )k ,
x ∈ I.
(7.2)
Ist f ein Polynom n-ten Grades, so stimmen f und pn überein. I.a. ist dies nicht der
Fall und wir nennen
Rn (x) := f (x) − pn (x), x ∈ I
(7.3)
das n-te Restglied. Offenbar gilt dann die Taylorsche Formel
f (x) = pn (x) + Rn (x),
x ∈ I,
(7.4)
die wir jetzt durch Untersuchung des Restglieds mit Sinn erfüllen wollen.
Satz 7.1: Sei f ∈ C n+1 (I) und x0 ∈ I gewählt. Dann gilt die Identität (7.4) mit
dem Taylorpolynom pn , und für das Restglied Rn haben wir die Darstellung
1
Rn (x) =
n!
Zx
(x − t)n f (n+1) (t) dt.
x0
(7.5)
7. DIE TAYLORSCHE FORMEL
151
Beweis: Vollständige Induktion über n:
• n = 0: Der Fundamentalsatz der Differential- und Integralrechnung, Satz 5.3,
liefert
Zx
f (x) = f (x0 ) + f 0 (t) dt für alle x ∈ I,
x0
also die Behauptung.
• n → n + 1: Dann haben wir
(IV)
=
Rn (x)
1
n!
Zx
Zx
n (n+1)
(x − t) f
f (n+1) (t)
(t) dt = −
x0
x0
d h (x − t)n+1 i
dt
dt (n + 1)!
Zx
h
(x − t)n+1 i¯¯x
(x − t)n+1
Part. Int.
(n+1)
=
− f
(t)
dt
¯ + f (n+2) (t)
(n + 1)! x0
(n + 1)!
x0
1
f (n+1) (x0 )
(x − x0 )n+1 +
(n + 1)!
(n + 1)!
=
Zx
(x − t)n+1 f (n+2) (t) dt,
x0
also
1
f (x) = pn (x) + Rn (x) = pn+1 (x) +
(n + 1)!
(IV )
Zx
(x − t)n+1 f (n+2) (t) dt,
x0
wie behauptet.
q.e.d.
Satz 7.2: (Lagrange Restgliedformel)
Unter den Voraussetzungen von Satz 7.1 gibt es zu jedem x ∈ I ein ϑ ∈ (0, 1), so
dass das Restglied geschrieben werden kann als
Rn (x) =
f (n+1) (x0 + ϑ(x − x0 ))
(x − x0 )n+1 ,
(n + 1)!
x ∈ I.
(7.6)
Beweis: Sei o.B.d.A. x > x0 (für x = x0 ist nichts zu zeigen). Nach dem Mittelwertsatz der Integralrechnung, Satz 4.5, gibt es ein ξ ∈ (x0 , x), so dass gilt:
Rn (x)
(7.5)
Zx
=
x0
=
(x − t)n (n+1)
f
(t) dt = f (n+1) (ξ)
n!
−f (n+1) (ξ)
t)n+1 ¯x
(x −
¯
¯ =
(n + 1)! x0
Zx
x0
f (n+1) (ξ)
(n + 1)!
(x − t)n
dt
n!
(x − x0 )n+1 .
152
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Die Behauptung folgt mit ϑ :=
ξ−x0
x−x0
∈ (0, 1).
q.e.d.
Wir wollen eine sehr gebräuchliche, qualitative Schreibweise für das Ergebnis von
Satz 7.2 einführen, die auf E. Landau zurückgeht: Hierzu sei M ⊂ Rn eine beliebige
Menge, x0 ∈ M und ψ : M → R eine Funktion mit ψ(x) 6= 0 für x ∈ (M ∩ Br (x0 )) \
{x0 } mit einem r > 0.
Definition 7.1:
(i) Eine Funktion f : M → Rd heißt von der Ordnung groß O von ψ(x) für
”
x → x0“, wenn gilt
¯
¯
¯ f (x) ¯
¯
¯
¯ ψ(x) ¯ ≤ const für alle x ∈ (M ∩ Bε (x0 )) \ {x0 }
mit einem ε ∈ (0, r). Wir schreiben dann
f (x) = O(ψ(x))
für x → x0 .
(ii) f heißt von der Ordnung klein o von ψ(x) für x → x0“, wenn sogar
”
lim
x→x0
f (x)
= 0.
ψ(x)
erfüllt ist. Dann schreiben wir
f (x) = o(ψ(x))
für x → x0 .
Offenbar impliziert f = o(ψ(x)) die Relation f = O(ψ(x)) für x → x0 . Aus der
Darstellung (7.6) erhalten wir nun die
Folgerung 7.1: (Qualitative Taylorformel)
Ist f ∈ C n (I) und x0 ∈ I gewählt, so gilt
f (x) = pn (x) + o(|x − x0 |n )
für x → x0 .
(7.7)
Beweis: Wir wenden Satz 7.2 mit n − 1 an und erhalten
f (n) (x0 + ϑ(x − x0 ))
(x − x0 )n
n!
f (n) (x0 + ϑ(x − x0 )) − f (n) (x)
(x − x0 )n
= pn (x) +
n!
f (x) = pn−1 (x) +
für x ∈ I
mit einem ϑ = ϑ(x) ∈ (0, 1). Wegen f (n) (x0 + ϑ(x − x0 )) → f (n) (x) für x → x0
ergibt sich also die Behauptung (7.7).
7. DIE TAYLORSCHE FORMEL
153
Beispiel: Für x > −1 betrachten wir f (x) := (1 + x)α , α ∈ R \ {0}. Es folgt dann
induktiv
f (k) (x) = α(α − 1) . . . (α − k + 1)(1 + x)α−k
für beliebiges k ∈ N, und mit der Abkürzung
µ ¶
n
Y
α
α−l+1
:=
(allgemeiner Binomialkoeffizient)
k
l
l=1
erhalten wir die Relation
f
(k)
µ ¶
α
(x) = k!
(1 + x)α−k , x > −1, k ∈ N.
k
Einsetzen in die Taylorformel liefert also bei Entwicklung um x0 = 0:
n µ ¶
X
α k
α
(1 + x) =
x + Rn (x), x > −1,
k
(7.8)
k=0
und Satz 7.1 entnehmen wir
µ
¶ Zx
α
Rn (x) = (n + 1)
(x − t)n (1 + t)α−n−1 dt,
n+1
x > −1.
(7.9)
0
Für eine Funktion f ∈ C ∞ (I) liegt es nahe, durch den Grenzübergang n → ∞
zur Reihendarstellung
f (x) =
∞
X
f (k) (x0 )
k!
k=0
(x − x0 )k ,
x ∈ I,
(7.10)
überzugehen. Die rechte Seite in (7.10) heißt die Taylorreihe von f in x0 , falls sie
existiert. Relation (7.10) ergibt sich aus der Taylorformel (7.4), wenn gilt
lim Rn (x) = 0 für alle x ∈ I.
n→∞
Beispiel: Die Funktion
(
f (x) :=
(7.11)
exp(− x12 ), x 6= 0,
0,
x=0
gehört zur Klasse C ∞ (R) und erfüllt f (k) (0) = 0 für alle k ∈ N0 . Für die Taylorreihe
bei x0 = 0 gilt also
∞
X
f (k) (0)
k=0
k!
xk = 0 6= f (x)
für x 6= 0.
Relation (7.10) gilt also nicht für jedes f ∈ C ∞ (R).
154
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Definition 7.2: Eine Funktion f ∈ C ∞ (I) heißt reellanalytisch, wenn es zu jedem
x0 ∈ I ein δ > 0 so gibt, dass die Taylorreihe in I ∩ (x0 − δ, x0 + δ) konvergiert und
dort mit f übereinstimmt, d.h. (7.10) gilt in I ∩ (x0 − δ, x0 + δ).
Wir geben nun zwei hinreichende Bedingungen an, die gewährleisten, dass eine
Funktion f ∈ C ∞ (I) reellanalytisch ist:
Satz 7.3: Es sei f ∈ C ∞ (I) gegeben.
(i) Existieren M, r > 0 mit der Eigenschaft
|f (n) (x)| ≤ n!M r−n
für alle x ∈ I, n ∈ N,
dann gilt (7.10) in I ∩ (x0 − δ, x0 + δ) für alle x0 ∈ I und δ ∈ (0, r). Also ist
f reellanalytisch.
(ii) Existieren M, Q > 0 mit der Eigenschaft
|f (n) (x)| ≤ M Qn
für alle x ∈ I, n ∈ N,
so gilt (7.10) mit beliebigem x0 ∈ I auf ganz I, und f ist reellanalytisch.
Beweis:
(i) Für x ∈ I ∩ (x0 − δ, x0 + δ) gilt (7.11), denn
¯ (n+1) ¡
¢¯
³ δ ´n+1
x0 + ϑ(x − x0 ) ¯
(7.6) ¯f
n+1
|x − x0 |
≤M
|Rn (x)| =
→ 0 (n → ∞).
(n + 1)!
r
Also folgt (7.10) für x ∈ I ∩ (x0 − δ, x0 + δ) aus der Taylorformel (7.4).
(ii) Hier schätzen wir ausgehend von (7.6) ab:
|Rn (x)| ≤ M
(Q|x − x0 |)n+1
→ 0 (n → ∞) für alle x ∈ I,
(n + 1)!
bn
= 0 für jedes b ∈ R.
n→∞ n!
q.e.d.
denn es gilt lim
Bemerkung: Ist f ∈ C ∞ (I) auf I = (−r, r) definiert durch die Potenzreihe
f (x) :=
∞
X
ak xk ,
k=0
1 (k)
(0).
k! f
so folgt ak =
nämlich gesehen
f (n) (x) =
Dies entnehmen wir sofort Folgerung 1.2. Dort haben wir
∞
X
k(k − 1) . . . (k − n + 1)ak xk−n
auf (−r, r).
k=n
Ist also eine Funktion f ∈ C ∞ (I) durch eine Potenzreihe (um x0 = 0) gegeben,
so stimmt diese notwendig mit ihrer Taylorreihe (um x0 = 0) überein; siehe das
folgende Beispiel 1.
7. DIE TAYLORSCHE FORMEL
155
Beispiele:
1. Durch
∞
X
xk
k=0
k!
∞
X
x2k+1
(−1)k
,
(2k + 1)!
,
∞
X
k=0
(−1)k
k=0
x2k
,
(2k)!
x ∈ R,
sind die Taylorreihen um x0 = 0 von exp, sin bzw. cos gegeben.
2. Wir betrachten wieder die Funktion f (x) = (1+x)α . Man kann zeigen, dass das
zugehörige Restglied (7.9) für |x| < 1 gegen 0 konvergiert (siehe z.B. O. Foster:
Analysis 1, Vieweg-Verlag, § 22). Also haben wir die Darstellung
∞ µ ¶
X
α k
α
(1 + x) =
x , x ∈ (−1, 1).
k
k=0
Die Taylorreihe auf der rechten Seite heißt Binomialreihe.
Für α = N ∈ N
¡ ¢
bricht die Reihe an der N -ten Stelle ab wegen Nk = 0 für k > N . Dann erhält
man den bekannten Binomische Satz.
3. Die Logarithmus-Reihe: Wir betrachten f (x) := log(1 + x), x > −1, und
beachten
∞
X
1
(−1)k xk für x ∈ (−1, 1).
f 0 (x) =
=
1+x
k=0
Satz 5.3 liefert also
Zx
dt
=
1+t
f (x) =
0
P
¸
Zx · X
∞
k k
(−1) t dt für x ∈ (−1, 1).
k=0
0
Da k (−1)k tk für t ∈ [−r, r] mit beliebigem r ∈ (0, 1) gleichmäßig konvergiert,
liefert Satz 5.6:
¸
¸
·X
Zx · X
Zx
n
n
k k
log(1 + x) =
lim
(−1) t dt = lim
(−1)k tk dt
n→∞
0
=
=
lim
n→∞
∞
X
k=0
·X
n
0
Zx
(−1)k
k=0
(−1)k
n→∞
k=0
k=0
¸
k
t dt
0
xk+1
k+1
= −
∞
X
(−1)k
k=1
k
xk
für x ∈ [−r, r].
Da r ∈ (0, 1) beliebig war, haben wir also
log(1 + x) = −
∞
X
(−1)k
k=1
k
xk ,
x ∈ (−1, 1).
(7.12)
Wir wollen zeigen, dass (7.12) auch für x = 1 richtig bleibt m.H. des folgenden
156
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 7.4: (Abelscher Stetigkeitssatz)
Sei {ak }k=0,1,2,... ⊂ R eine Zahlenfolge, für die
∞
X
ak = lim
x→1−
k=0
∞
X
∞
P
k=0
ak konvergiere. Dann folgt
ak xk .
k=0
Also können wir in (7.12) zur Grenze x → 1− übergehen, denn die alter∞
P
(−1)k
konvergiert bekanntlich. Wir erhalten
nierende harmonische Reihe
k
k=1
dann die bereits in Kap. 1, § 8 angekündigte Summenformel der alternierenden
harmonischen Reihe
∞
X
(−1)k
k
k=1
= − lim log(1 + x) = − log 2.
x→1−
Beweis von Satz 7.4: Setzen wir sk :=
vollständiger Induktion:
n
X
k
P
l=0
ak xk = sn xn + (1 − x)
al , k ∈ N0 , so folgt leicht mit
n−1
X
sk xk ,
n ∈ N.
(7.13)
k=0
k=0
P∞
k
Für |x| < 1 konvergiert die Potenzreihe f (x) :=
k=0 ak x absolut nach
n
Satz 9.2 aus Kap. 1. Da auch sn x → 0 (n → ∞) gilt, können wir in (7.13) zur
Grenze n → ∞ übergehen und erhalten:
¶
µX
∞
n
X
k
sk xk , |x| < 1.
ak x = (1 − x)
f (x) = lim
n→∞
Wir setzen noch s :=
k=0
k=0
∞
P
k=0
ak . Wir wählen ε > 0 beliebig und haben zu zeigen,
dass ein δ = δ(ε) > 0 existiert mit
|f (x) − s| < ε für alle x ∈ (1 − δ, 1).
Zunächst gibt es ein N = N (ε) ∈ N mit der Eigenschaft
|sk − s| <
ε
2
für alle k > N.
Beachten wir
∞
X
k=0
xk =
1
1−x
bzw.
(1 − x)
∞
X
k=0
xk = 1,
7. DIE TAYLORSCHE FORMEL
157
so folgt
¯
¯
∞
∞
X
X
¯
¯ ε
ε
k
¯(1 − x)
¯
(s
−
s)x
<
(1
−
x)
xk = ,
k
¯
¯ 2
2
k=N +1
x ∈ [0, 1).
k=0
Wählen wir nun δ = δ(ε) > 0 so klein, dass
δ
N
X
ε
2
|sk − s| <
k=0
ausfällt, so erhalten wir schließlich
¯
¯
¯
¯
∞
∞
∞
X
X
X
¯
¯
¯
¯
k
k
k
|f (x) − s| = ¯¯(1 − x)
sk x − (1 − x)
sx ¯¯ = ¯¯(1 − x)
(sk − s)x ¯¯
k=0
≤ (1 − x)
N
X
k=0
k=0
k=0
¯
¯
∞
X
¯
¯ ε ε
k¯
¯
|sk − s| + ¯(1 − x)
(sk − s)x ¯ < + = ε
2 2
k=N +1
für alle x ∈ (1 − δ, 1), wie behauptet.
q.e.d.
4. Die Arcus-Tangens-Reihe: Als Übungsaufgabe zeigt man analog zu Beispiel 3:
∞
X
(−1)k 2k+1
x
arctan x =
2k + 1
für x ∈ (−1, 1).
k=0
k
P
Da k (−1)
2k+1 nach dem Leibnizkriterium konvergiert, liefert der Abelsche Stetigkeitssatz also die ebenfalls in Kap. 1, § 8 angekündigte Summenformel für
die Leibnizreihe:
∞
X
(−1)k
π
= lim arctan x = arctan 1 = .
2k + 1 x→1−
4
k=0
Kapitel 4
Differentialrechnung für
Funktionen mehrerer
Veränderlicher
1
Partielle Ableitungen
Wir haben bereits Funktionen
¡
¢
f = f (x) = f1 (x1 , . . . , xn ), . . . , fd (x1 , . . . , xn ) : Ω → Rd
auf einer Menge Ω ⊂ Rn für n, d ∈ N kennengelernt und auf Stetigkeitseigenschaften untersucht. Um auch Wachstums- und Krümmungsverhalten solcher Funktionen
mehrerer Veränderlicher beschreiben zu können, benötigen wir einen Ableitungsbegriff:
Definition 1.1: Sei f : Ω → Rd gegeben (Ω ⊂ Rn sei immer offen) und x0 ∈ Ω
gewählt. Zu ε > 0 mit Bε (x0 ) ⊂ Ω und j ∈ {1, . . . , n} erklären wir die Funktion
ϕj (t) := f (x01 , . . . , x0j−1 , t, x0j+1 , . . . , x0n ),
t ∈ (x0j − ε, x0j + ε).
Wenn dann ϕj an der Stelle t = x0j differenzierbar ist, so heißt f in x0 partiell
differenzierbar nach xj und wir schreiben
Dj f (x0 ) := ϕ0j (x0j ).
Bemerkungen:
1. Alternative Schreibweisen sind
Dj f =
∂f
∂
f=
= fxj .
∂xj
∂xj
159
160
KAPITEL 4. DIFFERENTIALRECHNUNG
2. Ist f in x0 ∈ Ω nach xj differenzierbar, so gilt offenbar
(j)
Dj f (x0 ) = lim ∆t f (x0 )
t→0
mit dem j-ten Differenzenquotienten: Ist ej der j-te Einheitsvektor, so ist
(j)
∆t f (x0 ) erklärt als
(j)
¢
1¡
f (x0 + tej ) − f (x0 )
t
¢
1¡
=
f (x01 , . . . , x0j−1 , x0j + t, x0j+1 , . . . , x0n ) − f (x01 , . . . , x0j , . . . , x0n )
t
∆t f (x0 ) :=
für t ∈ (−ε, 0) ∪ (0, ε).
3. Eine Funktion f = (f1 , . . . , fd ) : Ω → Rd ist genau dann in x0 ∈ Ω nach xj
differenzierbar, wenn f1 , . . . , fd dort nach xj differenzierbar sind. Es gilt dann
¡
¢
Dj f (x0 ) = Dj f1 (x0 ), . . . , Dj fd (x0 ) .
Definition 1.2: Falls für f : Ω → Rd die partiellen Ableitungen D1 f (x), . . . , Dn f (x)
für alle x ∈ Ω ⊂ Rn eistieren und stetig sind, so heißt f (einmal) stetig differenzierbar und wir schreiben f ∈ C 1 (Ω, Rd ). Für d = 1 schreiben wir kurz C 1 (Ω) :=
C 1 (Ω, R) und für d = 2 identifizieren wir wieder C 1 (Ω, C) := C 1 (Ω, R2 ).
Satz 1.1: Jede Funktion f ∈ C 1 (Ω, Rd ) ist stetig in Ω, d.h. wir haben die Inklusion
C 1 (Ω, Rd ) ⊂ C 0 (Ω, Rd ).
Beweis: Indem wir jede Komponente einzeln betrachten, genügt es den Fall d = 1
zu untersuchen.
Sei nun x0 ∈ Ω beliebig gewählt, so gibt es ein ε > 0 mit Bε (x0 ) ⊂ Ω. Zu
beliebigem x ∈ Bε (x0 ) schreiben wir Ij für die abgeschlossen Intervalle zwischen x0j
und xj mit j = 1, . . . , n (also Ij = [x0j , xj ] für x0j ≤ xj , sonst Ij = [xj , x0j ]). Die
Funktionen
ϕ1 (t) := f (t, x02 , . . . , x0n ),
ϕ2 (t) :=
..
.
t ∈ I1 ,
f (x1 , t, x03 , . . . , x0n ),
ϕn (t) := f (x1 , . . . , xn−1 , t),
t ∈ I2 ,
t ∈ In ,
sind nun differenzierbar in Ij und damit dort auch stetig nach Folgerung 1.1 aus
Kap. 3. Außerdem gilt
f (x0 ) − f (x) = ϕ1 (x01 ) − ϕn (xn )
= [ϕ1 (x01 ) − ϕ1 (x1 )] + [ϕ2 (x02 ) − ϕ2 (x2 )] + . . .+ [ϕn (x0n ) − ϕn (xn )].
(1.1)
1. PARTIELLE ABLEITUNGEN
161
Nach dem Mittelwertsatz, Satz 2.3 in Kap. 3, gibt es zu jedem j ∈ {1, . . . , n} ein
ξj ∈ int Ij mit der Eigenschaft
ϕj (x0j ) − ϕj (xj ) = ϕ0 (ξj )(x0j − xj ) =
¢
∂ ¡
f x1 , . . . , xj−1 , ξj , x0j+1 , . . . , x0n (x0j − xj ),
∂xj
so dass Einsetzen in (1.1) liefert
f (x0 ) − f (x) =
n
X
¢
∂ ¡
f x1 , . . . , xj−1 , ξj , x0j+1 , . . . , x0n (x0j − xj ).
∂xj
(1.2)
j=1
Schließlich bemerken wir noch, dass ein M ≥ 0 existiert mit
¯ ∂
¯
¯
¯
f (y)¯ ≤ M
¯
∂xj
für alle y ∈ Bε (x0 ), j = 1, . . . , n,
∂f
∂f
da die partiellen Ableitungen ∂x
, . . . , ∂x
in Ω stetig und damit in der kompakten
n
1
0
Teilmenge Bε (x ) ⊂ Ω beschränkt sind. Aus Formel (1.2) erhalten wir also:
0
|f (x ) − f (x)| ≤ M
n
X
|x0j − xj | → 0 (x → x0 ),
j=1
d.h. f ist stetig in Ω.
q.e.d.
Bemerkung: Produkt-, Quotienten- und Linearitätsregel übertragen sich sofort auf
die partiellen Ableitungen; insbesondere ist C 1 (Ω, Rd ) ein linearer Raum. Die Kettenregel erhält folgendes Gesicht:
Satz 1.2: (Kettenregel)
Seien m, n, d ∈ N, offene Mengen Ω ⊂ Rn , Θ ⊂ Rm und Funktionen f = f (x) ∈
C 1 (Ω, Rm ) und g = g(y) ∈ C 1 (Θ, Rd ) mit f (Ω) ⊂ Θ gegeben. Dann gehört auch die
Funktion h := g ◦ f : Ω → Rd zur Klasse C 1 (Ω, Rd ) und es gilt
m
X ∂g
∂fl
∂h
(x) =
(f (x))
(x)
∂xj
∂yl
∂xj
für alle x ∈ Ω, j = 1, . . . , n.
(1.3)
l=1
Beweis: Können wir zeigen, dass h in jedem Punkt x ∈ Ω nach x1 , . . . , xn partiell
differenzierbar ist und dass (1.3) gilt, so folgt auch sofort h ∈ C 1 (Ω, Rd ). Außerdem
können wir uns (wie im Beweis von Satz 1.1) wieder auf den Fall d = 1 beschränken,
in dem wir jede Komponente h1 , . . . , hd von h getrennt betrachten.
Wir wählen x0 ∈ Ω fest und setzen y 0 := f (x0 ) ∈ Θ. Dann gibt es ε, δ > 0 mit
Bε (x0 ) ⊂ Ω, Bδ (y 0 ) ⊂ Θ. Und da f ∈ C 1 (Ω, Rm ) nach Satz 1.1 stetig ist, können
wir ε > 0 so klein wählen, dass f (Bε (x0 )) ⊂ Bδ (y 0 ) erfüllt ist.
162
KAPITEL 4. DIFFERENTIALRECHNUNG
Für beliebiges j ∈ {1, . . . , n} sei s ∈ R mit |s| < ε gewählt und
x := x0 + sej = (x01 , . . . , x0j−1 , x0j + s, x0j+1 , . . . , x0n )
gesetzt. Mit y := f (x) ∈ Bδ (y0 ) erklären wir
0
ϕ1 (t) := g(t, y20 , . . . , ym
),
t ∈ I1 ,
0
g(y1 , t, y30 , . . . , ym
),
t ∈ I2 ,
ϕm (t) := g(y1 , . . . , ym−1 , t),
t ∈ Im ,
ϕ2 (t) :=
..
.
wobei Il das abgeschlossene Intervall zwischen yl0 und yl bezeichne für l = 1, . . . , m.
Wie im Beweis von Satz 1.1 sehen wir
h(x0 ) − h(x) = g(y 0 ) − g(y) =
m
X
£
ϕl (yl0 ) − ϕl (yl )
¤
l=1
m
X
∂
0
0
g(y1 , . . . , yl−1 , ξl , yl+1
, . . . , ym
)(yl0 − yl )
=
∂yl
=
l=1
m
X
l=1
¢¡
¢
∂ ¡
g f1 (x), . . . , fl−1 (x), ξl , fl+1 (x0 ), . . . , fm (x0 ) fl (x0 ) − fl (x) ,
∂yl
wobei die Zwischenstellen ξl zwischen yl0 und yl liegen, d.h. es gilt insbesondere
|ξl − yl0 | ≤ |yl − yl0 | → 0 (y → y 0 ) für l = 1, . . . , m. Nach Division durch s ∈
(−ε, ε) \ {0} und Multiplikation mit −1 folgt nun
0
∆(j)
s h(x ) =
m
X
¢
∂ ¡
0
g f1 (x), . . . , fl−1 (x), ξl , fl+1 (x0 ), . . . , fm (x0 ) ∆(j)
s fl (x ). (1.4)
∂yl
l=1
Für s → 0 folgt y = f (x) → f (x0 ) = y 0 und daher auch ξl → fl (x0 ). Somit existiert
der Grenzwert für s → 0 auf der rechten Seite von (1.4) und folglich auch auf der
linken Seite. Es folgt
m
X ∂g
∂fl 0
∂h 0
(x ) =
(f (x0 ))
(x )
∂xj
∂yl
∂xj
l=1
für beliebiges x0 , also die Behauptung.
q.e.d.
Bezeichnungen:
1. Für f ∈ C 1 (Ω), Ω ⊂ Rn , erklären wir den Gradienten grad f : Ω → Rn ∈
C 0 (Ω, Rn ) als das Vektorfeld
¡
¢
grad f (x) := D1 f (x), . . . , Dn f (x) .
1. PARTIELLE ABLEITUNGEN
163
Mit dem formal eingeführten Nabla-Operator oder Nabla-Vektor
∇ := (D1 , . . . , Dn )
haben wir dann
grad f = ∇f.
Formal ist also grad f das Produkt aus dem Vektor ∇ und der skalaren Funktion f .
Wenn in Satz 1.2 d = 1 gilt, d.h. g und h skalare Funktionen sind, liest sich
(1.3) als
D
E
∂h
∂f
(x) = ∇g(f (x)),
(x) , x ∈ Ω,
∂xj
∂xj
wobei ∇g = grad g als Gradient bez. y aufzufassen ist.
2. Für f = (f1 , . . . , fn ) ∈ C 1 (Ω, Rn ), Ω ⊂ Rn , erklären wir die Divergenz div f :
Ω → R ∈ C 0 (Ω) gemäß
div f (x) := D1 f1 (x) + . . . + Dn fn (x) =
n
X
Dj fj (x).
j=1
Mit Hilfe des Nabla-Operators können wir div f formal auch als Skalarprodukt
zwischen den Vektoren ∇ und f schreiben:
div f = h∇, f i.
Falls n = 3 gilt, erklären wir auch die Rotation rot f : Ω → R3 ∈ C 0 (Ω, R3 )
gemäß
¢
¡
rot f := D2 f3 − D3 f2 , D3 f1 − D1 f3 , D1 f2 − D2 f1 = ∇ × f.
3. Für eine Funktion f = (f1 , . . . , fd ) ∈ C 1 (Ω, Rd ) erklären wir die Jacobimatrix
oder Funktionalmatrix

 

D1 f1 (x) . . . Dn f1 (x)
grad f1 (x)

 

..
..
..
..
Df (x) := 
=
.
.
.
.
.
D1 fd (x) . . . Dn fd (x)
grad fd (x)
Insbesondere für d = 1 haben wir also Df = grad f = ∇f .
Für beliebiges d ∈ N lässt sich nun Formel (1.3) zusammenfassen zu
Dh(x) = Dg(f (x)) ◦ Df (x),
x ∈ Ω.
(1.5)
164
KAPITEL 4. DIFFERENTIALRECHNUNG
Dabei beziehen sich die Ableitungen bei h und f auf x und bei g auf y ∈ Θ ⊃
f (Ω), weshalb man auch manchmal zur Verdeutlichung
Dx h(x) = Dy g(f (x)) ◦ Dx f (x)
schreibt. Exakter wäre für Dg(f (x)) eigentlich eine Schreibweise
Dg(f (x)) = ((Dg) ◦ f )(x),
d.h. man berechnet zunächst die Jacobimatrix von g und setzt dann f ein. Im
Gegensatz dazu ist
Dh(x) = (D(g ◦ f ))(x)
zu berechnen, in dem man zunächst g ◦ f bildet und vom Ergebnis die Jacobimatrix bestimmt. Die kurze Schreibweise in (1.5) ist aber gebräuchlich, da sie
deutlich leichter zu lesen ist.
4. Schließlich ist für f ∈ C 1 (Ω, Rn ) die der quadratischen Matrix Df zugeordnete
Determinante, die sogenannte Jacobi- oder Funktionaldeterminante
¯
¯
¯D1 f1 (x) . . . Dn f1 (x)¯
¯
¯
¯
¯
..
..
..
Jf := det(Df ) = ¯
¯,
.
.
.
¯
¯
¯D1 fd (x) . . . Dn fd (x)¯
von immenser Bedeutung. Falls in Satz 1.2 gerade m = n = d gilt, also Df , Dg
und Dh quadratische Matrizen sind, entnehmen wir (1.5) und der Produktregel
für Determinanten:
Jh (x) = Jg (f (x))Jf (x),
x ∈ Ω.
(1.6)
Bevor wir einige Beispiele angeben, wollen wir noch eine direkte Folgerung der
Kettenregel für invertierbare C 1 -Abbildungen notieren. Hierzu benötigen wir noch
die
Definition 1.3: Zu zwei offenen Mengen Ω, Θ ⊂ Rn heißt eine Abbildung f : Ω →
Rn ein Diffeomorphismus (der Klasse C 1 ) von Ω auf Θ, wenn gilt
• f bildet Ω bijektiv auf Θ ab.
• f ∈ C 1 (Ω, Rn ) und f −1 ∈ C 1 (Θ, Rn ).
Bemerkung: Ein Diffeomorphismus liefert also eine 1-1-Zuordnung der Punkte von
Ω und Θ, die zusammen mit ihrer Inversen stetig differenzierbar ist. Wenn f Diffeomorphismus von Ω auf Θ ist, so ist f −1 offenbar Diffeomorphismus von Θ auf Ω.
Diffeomorphismen werden auch als Transformationen bezeichnet und spielen eine
zentrale Rolle in der Analysis.
1. PARTIELLE ABLEITUNGEN
165
Folgerung 1.1: Ist f : Ω → Rn ein Diffeomorphismus von Ω ⊂ Rn auf Θ = f (Ω),
so ist Df invertierbar auf Ω und es gelten
Df −1 (f (x)) = (Df (x))−1 ,
Jf −1 (f (x)) =
1
,
Jf (x)
x ∈ Ω.
Beweis: Wir setzen g := f −1 : Θ → Rn und beachten h(x) := (g ◦ f )(x) ≡ x
auf Ω. Wegen Dh(x) = E (E ⊂ Mat(n, n) ist die Einheitsmatrix), liefert also die
Kettenregel (1.5):
E = Dg(f (x)) ◦ Df (x) in Ω,
d.h. Df (x) ist invertierbar mit der Inversen Dg(f (x)), wie behauptet. Die zweite
Relation ergibt sich nun sofort aus det E = 1 und Formel (1.6).
q.e.d.
Beispiele:
p
1. Die Abstandsfunktion r : Rn → R erklärt durch r(x) := |x| = x21 + . . . , x2n
gehört zur Klasse C 1 (Rn \ {0}) ∩ C 0 (Rn ). Für die Ableitung nach xj erhalten
wir nämlich
xj
1
∂
r(x) = p 2
· 2xj =
∂xj
|x|
2 x1 + . . . + x2n
bzw.
∇r(x) = grad r(x) =
x
|x|
für x 6= 0.
2. (Polarkoordinaten): Für beliebiges z ∈ C haben wir eine Darstellung z = reiϕ
mit r = |z| ≥ 0, ϕ ∈ R. In Real- und Imaginärteil zerlegt, heißt das
x = r cos ϕ =: f (r, ϕ),
y = r sin ϕ =: g(r, ϕ).
f und g sind aus C 1 ((0, +∞) × R). Für die Abbildung h := (f, g) : (0, +∞) ×
R → R2 folgt
µ
¶ µ
¶
fr (r, ϕ) fϕ (r, ϕ)
cos ϕ −r sin ϕ
Dh(r, ϕ) =
=
,
gr (r, ϕ) gϕ (r, ϕ)
sin ϕ r cos ϕ
und für die Jacobideterminante erhalten wir
Jh (r, ϕ) = r(cos2 ϕ + sin2 ϕ) = r > 0.
Die Umkehrung von Folgerung 1.1 gilt also nicht.
Bisher haben wir nur Ableitungen entlang der Koordinatenlinien erklärt, nämlich
die partiellen Ableitungen. Nun sollen Ableitungen in beliebige Richtungen betrachtet werden:
166
KAPITEL 4. DIFFERENTIALRECHNUNG
Definition 1.4: Sei f : Ω → R gegeben und x ∈ Ω ⊂ Rn gewählt. Zu beliebigem
a ∈ Rn mit |a| = 1 erklären wir dann die Richtungsableitung von f an der Stelle x
in Richtung a gemäß
¤
∂f
1£
(x) := lim f (x + ta) − f (x) ,
t→0 t
∂a
falls dieser Grenzwert existiert.
Bemerkungen:
1. Mit dem j-ten Einheitsvektor a = ej haben wir
∂f
(j)
(x) = lim ∆t f (x) = Dj f (x).
t→0
∂ej
Partielle Ableitungen sind also spezielle Richtungsableitungen.
2. Existiert für ein a ∈ S n−1 := {ξ ∈ Rn : |ξ| = 1} die Richtungsableitung
∂f
∂f
∂a (x), so existiert auch ∂(−a) (x) und es gilt
∂f
∂f
(x) = − (x).
∂(−a)
∂a
Satz 1.3: Ist f ∈ C 1 (Ω), so existiert
ren a ∈ S n−1 , und es gilt
∂f
∂a (x)
für alle x ∈ Ω und alle Richtungsvekton
X
∂f
(x) = h∇f (x), ai =
Dj f (x)aj .
∂a
j=1
Beweis: Zu festem x ∈ Ω existiert ein ε > 0 mit Bε (x) ⊂ Ω. Wir betrachten dann
ϕ(t) := f (x + ta), t ∈ (−ε, ε), und folgern aus Satz 1.2: ϕ ∈ C 1 ((−ε, ε)) sowie
ϕ0 (t) = h∇f (x + ta), ai,
t ∈ (−ε, ε).
Insbesondere für t = 0 erhalten wir
ϕ(t) − ϕ(0)
∂f
(x) = lim
= ϕ0 (0) = h∇f (x), ai,
t→0
∂a
t
wie behauptet.
q.e.d.
Bemerkung: Die Richtungsableitung ∂f
∂a (x) beschreibt den Anstieg der Funktion f in
x, eingeschränkt auf das Segment {x+ta : t ∈ (−ε, ε)} mit kleinem ε > 0 und einem
a ∈ S n−1 . Dieser ist i.a. für jede Richtung a unterschiedlich groß. Die geometrische
Bedeutung von grad f enthält nun die nachstehende
2. MITTELWERTSATZ UND DIFFERENTIALE
167
Folgerung 1.2: Sei f ∈ C 1 (Ω) und x ∈ Ω mit ∇f (x) 6= 0 gewählt. Mit ν :=
|∇f (x)|−1 ∇f (x) gilt dann
∂f
∂f
∂f
(x) <
(x) <
(x)
∂(−ν)
∂a
∂ν
für alle a ∈ S n−1 \ {±ν}.
D.h. ∇f (x) zeigt in die Richtung des größten, −∇f (x) in die Richtung des kleinsten
Anstiegs von f in x.
Bemerkung: Falls hingegen ∇f (x) = 0 in einem Punkt x ∈ Ω gilt, verschwinden
nach Satz 1.3 dort alle Richtungsableitungen.
Beweis von Folgerung 1.2: Nach Satz 1.3 und der Cauchy-Schwarzschen Ungleichung,
Satz 10.2 in Kap. 1, haben wir
¯ ∂f
¯ ¯
¯
¯
¯
¯ (x)¯ = ¯h∇f (x), ai¯ ≤ |∇f (x)| |a| = |∇f (x)|,
∂a
∇f (x)
und Gleichheit tritt genau dann ein, wenn ∇f (x) = λa gilt, d.h. a = ± |∇f
(x)| = ±ν
richtig ist. Wegen
D
∂f
∇f (x) E
Satz 1.3
(x)
=
∇f (x), ±
= ±|∇f (x)|
∂(±ν)
|∇f (x)|
folgt also
∂f
∂f
∂f
(x) = −|∇f (x)| <
(x) < |∇f (x)| =
(x) für alle a ∈ S n−1 \ {±ν},
∂(−ν)
∂a
∂ν
wie behauptet.
q.e.d.
Bemerkung: Der Begriff der Richtungsableitung lässt sich offenbar direkt auf Abbildungen f : Ω → Rd erweitern. Satz 1.3 bleibt gültig, allerdings mit der Darstellung
∂f
(x) = Df (x)a,
∂a
wobei man ∂f
∂a und a als Spaltenvektoren auffasst. Die geometrische Interpretation
aus Folgerung 1.2 verliert aber ihren Sinn.
2
Mittelwertsatz und Differentiale
Als erstes beweisen wir ein Analogon zum Mittelwertsatz der Differentialrechnung
für Funktionen mehrerer Veränderlicher:
168
KAPITEL 4. DIFFERENTIALRECHNUNG
Satz 2.1: (Mittelwertsatz)
Es sei Ω ⊂ Rn offen, f ∈ C 1 (Ω) eine skalare Funktion und zwei verschiedene Punkte
x, y ∈ Ω seien gewählt. Für die Verbindungsstrecke
©
ª
[x, y] := λx + (1 − λ)y : λ ∈ [0, 1]
zwischen x und y gelte [x, y] ⊂ Ω. Dann gibt es ein z ∈ (x, y) := [x, y] \ {x, y} mit
der Eigenschaft
n
X
∂f
f (y) − f (x) = h∇f (z), y − xi =
(z)(yj − xj ).
∂xj
j=1
Beweis: Wir betrachten die Funktion
¡
¢
ϕ(t) := f x + t(y − x) ,
t ∈ [0, 1].
Nach Satz 1.2 gilt ϕ ∈ C 1 ([0, 1]) und

®
ϕ0 (t) = ∇f (x + t(y − x)), y − x für alle t ∈ (0, 1).
Andererseits liefert der Mittelwertsatz für Funktionen einer Veränderlichen
ϕ(1) − ϕ(0) = ϕ0 (ξ)
mit einem ξ ∈ (0, 1). Setzen wir z := x + ξ(y − x) ∈ (x, y), so folgt also
f (y) − f (x) = ϕ(1) − ϕ(0) = ϕ0 (ξ) = h∇f (z), y − xi,
wie behauptet.
q.e.d.
Für vektorwertige Funktionen erhalten wir eine Art integrale Version“, die
”
häufig sehr hilfreich ist:
Satz 2.2: (Hadamards Lemma)
Sind f ∈ C 1 (Ω, Rd ) und x, y ∈ Ω mit x 6= y und [x, y] ⊂ Ω gewählt, so folgt
f (y) − f (x) = A ◦ (y − x).
Dabei seien f (y) − f (x), y − x als Spaltenvektoren aufzufassen und die Matrix
Z1
A :=
Df (x + t(y − x)) dt
0
wurde erklärt.
2. MITTELWERTSATZ UND DIFFERENTIALE
169
Beweis: Wie im Beweis von Satz 2.1 betrachten wir
¡
¢
ϕ(t) := f x + t(y − x) ∈ C 1 ([0, 1], Rd ).
Für die l-te Komponente gilt dann nach dem Fundamentalsatz der Differential- und
Integralrechnung, Satz 5.3 in Kap. 3:
Z1
ϕ0l (t) dt
fl (y) − fl (x) = ϕl (1) − ϕl (0) =
0
¿ Z1
=
À
∇fl (x + t(y − x)) dt, y − x ,
l = 1, . . . , d,
0
was gleichbedeutend zur Behauptung ist.
q.e.d.
Für eine Funktion f : I → Rd ∈ C 1 (I, Rd ) auf einem Intervall I ⊂ R gilt
bekanntlich
f 0 ≡ 0 ⇐⇒ f ≡ const auf I.
Um eine Entsprechung für Funktionen mehrerer Veränderlicher zu erhalten, benötigen wir noch die grundlegende
Definition 2.1:
(i) Eine Menge M ⊂ Rn heißt (bogenweise) zusammenhängend,wenn für je zwei
Punkte x, y ∈ M ein stetiger Weg ϕ ∈ C 0 ([0, 1], Rn ) existiert mit
ϕ([0, 1]) ⊂ M,
ϕ(0) = x,
ϕ(1) = y.
(ii) Eine offene, zusammenhängende Menge im Rn heißt Gebiet und wird i.d.R.
mit G bezeichnet.
Satz 2.3: Für eine Funktion f ∈ C 1 (G, Rd ) auf einem Gebiet G ⊂ Rn gilt
Df ≡ 0 ⇐⇒ f ≡ const
in G.
Beweis: Falls f konstant ist in G, verschwinden offenbar alle Ableitungen, d.h. Df ≡
0 in G. Der Beweis der Umkehrung erfolgt in zwei Schritten:
1. Lokale Konstanz: Sei x ∈ G fixiert. Dann existiert ein ε > 0 mit Bε (x) ⊂
G. Zu beliebigem y ∈ Bε (x) gilt dann [x, y] ⊂ Bε (x) ⊂ G, und nach dem
Hadamardschen Lemma folgt
µ Z1
f (y) − f (x) =
0
also f ≡ const in Bε (x).
¶
Df (x + t(y − x)) dt ◦ (y − x) = 0,
170
KAPITEL 4. DIFFERENTIALRECHNUNG
2. Globale Konstanz: Mit einer Kontinuitätsmethode“ zeigen wir nun, dass f
”
tatsächlich in ganz G konstant ist: Sei wieder x ∈ G fixiert. Zu beliebigem
y ∈ G betrachten wir den Verbindungsweg ϕ ∈ C 0 ([0, 1]) zwischen x = ϕ(0)
und y = ϕ(1) sowie die stetige Funktion
F (t) := f (ϕ(t)),
t ∈ [0, 1].
Wir wählen t∗ ∈ [0, 1] maximal, so dass gilt
F (t) = F (0)
für alle t ∈ [0, t∗ ],
d.h. F ist auf [0, t∗ ] konstant mit größtmöglichem t∗ . Wäre nun t∗ < 1. Dann
gibt es ein δ > 0, so dass ϕ(t) ∈ Bε (ϕ(t∗ )) ⊂ Ω mit geeignetem ε > 0 und
für alle t ∈ (t∗ − δ, t∗ + δ) gilt, denn ϕ ist stetig. Gemäß Teil 1 ist dann aber
F ≡ const auf (t∗ − δ, t∗ + δ), im Widerspruch zur Wahl von t∗ . Also muss
doch t∗ = 1 richtig sein und es folgt
f (x) = f (ϕ(0)) = F (0) = F (1) = f (ϕ(1)) = f (y),
d.h. f ≡ f (x) = const in G.
q.e.d.
Wir wollen noch einen weiteren Ableitungsbegriff einführen, der geometrisch motiviert ist:
Definition 2.2: Sei Ω ⊂ Rn offen und x ∈ Ω gewählt. Eine Funktion f : Ω → Rd
heißt in x ∈ Ω (total) differenzierbar, wenn eine lineare Abbildung L : Rn → Rd so
existiert, dass gilt
f (x + h) = f (x) + L(h) + R(h)
für alle h ∈ Ω0 := {h̃ ∈ Rn : x + h̃ ∈ Ω}. (2.1)
Hierbei gelte für das Restglied R = R(h) : Ω0 → Rd die Relation
R(h) = o(|h|)
für h → 0,
R(h)
= 0.
h→0 |h|
d.h. lim
(2.2)
Bemerkungen:
1. Wir können Formel (2.1) mit (2.2) äquivalent schreiben als
f (x + h) = f (x) + L(h) + |h|ε(h)
mit ε = ε(h) : Ω0 → Rd ,
indem wir setzen
½
ε(h) :=
für alle h ∈ Ω0
ε(h) = o(1) für h → 0,
(2.3)
|h|−1 R(h), h 6= 0
.
0,
h=0
Eine Formel (2.3) entsprechende Darstellung haben wir in Satz 1.1 in Kap. 3
für differenzierbare Funktionen einer Veränderlichen gefunden und als äquivalent zur Differenzierbarkeit erkannt. Wie wir unten sehen werden, ist diese
Äquivalenz für Funktionen mehrerer Veränderlicher i.a. nicht gegeben.
2. MITTELWERTSATZ UND DIFFERENTIALE
171
2. Aus (2.1), (2.2) folgt sofort
lim f (x + h) = f (x),
h→0
d.h. eine in x ∈ Ω total differenzierbare Funktion ist dort auch stetig.
3. Die lineare Abbildung L : Rn → Rd ist durch (2.1), (2.2) bzw. die äquivalente
Relation (2.3) eindeutig bestimmt: Gäbe es nämlich ein weiteres L̃ : Rn → Rd
und eine Funktion ε̃ : Ω0 → Rd mit ε̃(h) = o(1) für h → 0, so dass
f (x + h) = f (x) + L̃(h) + |h|ε̃(h)
für alle h ∈ Ω0
gilt, dann liefert Vergleich mit (2.3):
¡
¢
L(h) − L̃(h) = |h| ε̃(h) − ε(h) für alle h ∈ Ω0 .
Wir zeigen L(ej ) = L̃(ej ) für alle j = 1, . . . , n mit den j-ten Einheitsvektoren;
die Behauptung folgt dann aus der Linearität: Setze L0 := L−L̃ und ε0 := ε̃−ε.
Dann erhalten wir
L0 (h) = |h|ε0 (h) mit ε0 (h) = o(1) für h → 0.
Zu hinreichend kleinem λ > 0 ist h := λej ∈ Ω0 erfüllt, und es folgt
λL0 (ej ) = L0 (λej ) = |λej |ε0 (λej ) = λε0 (λej )
bzw.
L0 (ej ) = ε0 (λej ) → 0 (λ → 0),
also L0 (ej ) = 0 bzw. L(ej ) = L̃(ej ).
Diese Eindeutigkeit rechtfertigt nun die folgende
Definition 2.3:
(i) Zur in x ∈ Ω total differenzierbaren Abbildung f : Ω → Rd heißt die eindeutig
bestimmte Abbildung L : Rn → Rd aus (2.1) (totales) Differential df (x) von f
an der Stelle x ∈ Ω. Wir schreiben
df (x)(h) = df (x, h) := L(h),
h ∈ Rn .
(ii) Ist f für alle x ∈ Ω total differenzierbar, so heißt f einfach differenzierbar und
df : Ω × Rn → Rd ist das zugehörige Differential.
Der Zusammenhang zwischen totaler und partieller Differenzierbarkeit ist enthalten im folgenden
172
KAPITEL 4. DIFFERENTIALRECHNUNG
Satz 2.4: Ist f : Ω → Rd in x ∈ Ω total differenzierbar, so existieren alle partiellen
Ableitungen D1 f (x), . . . , Dn f (x), und es gilt
df (x, h) =
n
X
Dj f (x)hj = Df (x)h
für alle h = (h1 , . . . , hn ) ∈ Rn .
(2.4)
j=1
Speziell für d = 1 haben wir also
df (x, h) = h∇f (x), hi
für alle h ∈ Rn .
Beweis: Ist ej der j-te Einheitsvektor, so setzen wir h = tej ∈ Ω0 für t ∈ (−ε, ε) mit
hinreichend kleinem ε > 0 in (2.1) ein und erhalten aus (2.2):
¯ f (x + te ) − f (x)
¯ ¯ R(te ) ¯
¯
¯ ¯
j
j ¯
(j)
|∆t f (x) − L(ej )| = ¯
− L(ej )¯ = ¯
¯ → 0 (t → 0),
t
t
d.h. wir haben Dj f (x) = L(ej ) = df (x, ej ). Die Linearität von L = df liefert Formel
(2.4).
q.e.d.
Für f ∈ C 1 (Ω) und h ∈ S n−1 = {ξ ∈ Rn : |ξ| = 1} stimmt die rechte Seite in (2.4) mit der Richtungsableitung von f im Punkt x in Richtung h überein.
Allgemeiner und in Analogie zu Satz 2.4 finden wir den
Satz 2.5: Ist f : Ω → Rd in x ∈ Ω differenzierbar, so existieren alle Richtungsn−1 , und es gilt
ableitungen ∂f
∂a (x) für a ∈ S
df (x, a) =
∂f
(x).
∂a
Beweis: Zu festem a ∈ S n−1 setzen wir h = ta ∈ Ω0 , t ∈ (−ε, ε), in (2.1) ein und
folgern aus (2.2):
∂f
(x) = L(a) = df (x, a),
∂a
wie behauptet.
q.e.d.
Geometrische Interpretation: Ist f : Ω → R in x0 ∈ Ω differenzierbar, so erklären wir die affin-lineare Funktion
ϕ(x) := f (x0 ) + df (x0 , x − x0 ) = f (x0 ) + h∇f (x0 ), x − x0 i,
x ∈ Rn .
Der Graph T := graph ϕ beschreibt eine Hyperebene im Rn+1 – d.h. einen n-dimensionalen affinen Unterraum –, die durch f (x0 ) und senkrecht zum Vektor
¡
¢
ν := − ∇f (x0 ), 1
2. MITTELWERTSATZ UND DIFFERENTIALE
173
verläuft. Dabei ist ϕ und damit T durch die Forderung
f (x) − ϕ(x) = o(|x − x0 |) für x → x0
eindeutig festgelegt; T approximiert also graph f von erster Ordnung, entsprechend
der Tangente bei differenzierbaren Funktionen einer Veränderlichen. T heißt daher
die Tangentialebene an f im Punkt x0 . Ferner wird der senkrechte Vektor ν als
Normalenvektor von f in x0 bezeichnet.
In §4 werden wir Approximationen höherer Ordnung durch Taylorpolynome gewinnen.
Die Umkehrung der Sätze 2.4 und 2.5 gilt nicht: Eine Funktion, die in einem
Punkt alle Richtungsableitungen besitzt (und damit auch insbesondere alle partiellen
Ableitungen), muss dort nicht total differenzierbar, ja nicht einmal stetig sein:
Beispiel: Sei f : R2 → R erklärt als

2
 2xy
, für (x, y) 6= (0, 0)
f (x, y) :=
.
x2 + y 4

0,
für (x, y) = (0, 0)
Wir wollen zeigen, dass
¢
∂f
1¡
f (ta1 , ta2 )
(0, 0) = lim f (ta1 , ta2 ) − f (0, 0) = lim
t→0 t
t→0
∂a
t
für alle a = (a1 , a2 ) ∈ S 1 existiert.
• Für a = (0, ±1) haben wir f (0, ±t) = 0 für alle t ∈ R \ {0} und folglich
∂f
∂a (0, 0) = 0.
• Für a 6= (0, ±1) erhalten wir
2t3 a1 a22
a22
∂f
(0, 0) = lim 3 2
=
2
.
t→0 t (a1 + t2 a4
∂a
a1
2)
4
Aber wegen f (y 2 , y) = y42y+y4 = 1 für alle y ∈ R und f (0, 0) = 0 ist f in (0, 0)
unstetig und damit auch nicht total differenzierbar.
Wir können aber unter einer stärkeren Voraussetzung aus der partiellen die totale
Differenzierbarkeit folgern:
Satz 2.6: Gehört f : Ω → Rd zur Klasse C 1 (Ω, Rd ), so ist f total differenzierbar in
Ω.
174
KAPITEL 4. DIFFERENTIALRECHNUNG
Beweis: Zu x ∈ Ω wählen wir r > 0 mit Br (x) ⊂ Ω. Für h ∈ Rn mit |h| < r liefert
dann Hadamards Lemma, Satz 2.2:
µ Z1
f (x + h) = f (x) +
¶
Df (x + th) dt h
0
= f (x) + Df (x)h + R(h)
mit
µ Z1
R(h) :=
£
¶
¤
Df (x + th) − Df (x) dt h.
0
Wir haben noch zu zeigen, dass R = R(h) die Relation (2.2) erfüllt: Da Df stetig ist,
existiert zu vorgegebenem ε > 0 ein δ = δ(ε) ∈ (0, r), so dass |Dj f (y) − Dj f (x)| < nε
für alle y ∈ Bδ (x) und j = 1, . . . , n gilt. Somit folgt für alle h ∈ Rn mit |h| < δ:
Z1
n
¯ R(h) ¯ X
¯
|hj | ¯¯
ε
¯
¯
Dj f (x + th) − Dj f (x)¯ dt < n = ε,
¯
¯≤
|h|
|h|
n
j=1
0
d.h. R(h) = o(|h|) für h → 0, wie behauptet.
3
q.e.d.
Partielle Ableitungen höherer Ordnung, der Satz von
Schwarz
Sei f : Ω → Rd auf der offenen Menge Ω ⊂ Rn erklärt. Wenn die partielle Ableitung
∂f
= fxj auf ganz Ω existiert für ein j ∈ {1, . . . , n}, können wir Dj f :
Dj f = ∂x
j
Ω → Rd wieder als Funktion auf Ω auffassen. Wenn diese in Ω nach xk partiell
differenzierbar ist für ein k ∈ {1, . . . , n}, so nennen wir Dk (Dj f ) =: Dk Dj f eine
zweite partielle Ableitung von f und schreiben auch
Dk Dj f =
∂2f
= fxj xk .
∂xj ∂xk
Entsprechend erklären wir die dritte und induktiv die s-te partielle Ableitung oder
Ableitung s-ter Ordnung
Djs (Djs−1 . . . Dj2 Dj1 f ) =: Djs Djs−1 . . . Dj2 Dj1 f =
∂sf
= fxj1 ...xjs ,
∂xjs . . . ∂xj1
wobei j1 , . . . , js ∈ {1, . . . , n} Indizes sind. So wie wir in der Jacobimatrix Df =
∂fl
( ∂x
)j=1,...,n alle Ableitungen erster Ordnung zusammengefasst haben, schreiben wir
j
l=1,...,d
D2 f :=
³ ∂2f ´
l
∂xj ∂xk j,k=1,...,n
l=1...,d
und allgemeiner Ds f =
³
´
∂ s fl
.
s =1,...,n
∂xj1 . . . ∂xjs j1 ,...,j
l=1...,d
3. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG
175
Wir nennen Df , D2 f und Ds f auch die erste, zweite, und s-te Ableitung von f .
s
Wir können Ds f : Ω → Rd·n als Abbildung von Ω in den Euklidischen Raum der
Dimension d · ns auffassen. Schließlich schreiben wir noch D0 f := f für die nullte
Ableitung von f .
Definition 3.1: Für s ∈ N0 erklären wir den Raum der s-mal stetig differenzierbaren Funktionen C s (Ω, Rd ) als den Vektorraum der Funktionen f : Ω → Rd , deren
s
Ableitungen Df, . . . , Ds f auf Ω existieren und für die Ds f : Ω → Rd·n stetig ist.
Der Raum der unendlich oft differenzierbaren Funktionen ist dann gegeben durch
\
C ∞ (Ω, Rd ) :=
C s (Ω, Rd ).
s∈N0
Bemerkung: Gemäß Satz 1.1 sind alle Ableitungen einer Funktion f ∈ C s (Ω, Rd ) bis
zur s-ten Ordnung stetig.
Am Beispiel der zweiten partiellen Ableitungen wollen wir uns zunächst überlegen, dass es i.A. auf die Reihenfolge ankommt, d.h.: Ist f : Ω → Rd gegeben und
existieren Dj Dk f und Dk Dj f für gewisse j 6= k, so ist i.A. nicht Dj Dk f = Dk Dj f .
Beispiel: Wir betrachten
(
f (x, y) :=
xy(x2 −y 2 )
,
x2 +y 2
(x, y) 6= (0, 0)
0,
(x, y) = (0, 0)
.
Für (x, y) 6= (0, 0) existieren offenbar die partiellen Ableitungen erster und zweiter
Ordnung, und es gilt
fx (x, y) =
x4 y + 4x2 y 3 − y 5
,
(x2 + y 2 )2
Ferner haben wir
fx (0, 0) = lim
t→0
fy (x, y) =
x5 − 4x3 y 2 − xy 4
.
(x2 + y 2 )2
f (t, 0)
= 0 = fy (0, 0).
t
Also ist f in R2 einmal partiell differenzierbar. Im Nullpunkt berechnen wir
−t
fx (0, t)
= lim
= −1,
t→0 t
t
fy (t, 0)
t
fyx (0, 0) = lim
= lim = 1.
t→0
t→0 t
t
fxy (0, 0) = lim
t→0
Wir wollen nun Voraussetzungen angeben, unter denen die Reihenfolge der zweiten Ableitungen einer Funktion vertauschbar ist, und beginnen mit dem
176
KAPITEL 4. DIFFERENTIALRECHNUNG
Hilfssatz 3.1: Es sei Bδ := Bδ (0, 0) ⊂ R2 eine Kreisscheibe vom Radius δ > 0 und
ϕ = ϕ(y, z) : Bδ → Rd sei gegeben. Für ϕ sollen die partiellen Ableitungen ϕy , ϕz
und ϕyz in Bδ existieren. Dann gibt es zu beliebigen h, k 6= 0 mit (h, k) ∈ Bδ einen
Punkt (ξ, η) ∈ Bδ , so dass gilt
ϕyz (ξ, η) =
ϕ(h, k) − ϕ(h, 0) − ϕ(0, k) + ϕ(0, 0)
.
hk
(3.1)
Bemerkung: Die rechte Seite in (3.1) kann als Differenzenquotient zweiter Ordnung
im Punkt (0, 0) aufgefasst werden.
Beweis von Hilfssatz 3.1: Wir nennen I das abgeschlossene Intervall zwischen 0 und
h und erklären die Funktion
u(y) := ϕ(y, k) − ϕ(y, 0) für y ∈ I.
Dann ist ϕ differenzierbar auf I. Zweimalige Anwendung des Mittelwertsatzes in
einer Veränderlichen liefert
ϕ(h, k) − ϕ(h, 0) − ϕ(0, k) + ϕ(0, 0) = u(h) − u(0) = hu0 (ξ)
£
¤
= h ϕy (ξ, k) − ϕy (ξ, 0)
= hk ϕyz (ξ, η),
da auch v(z) := ϕy (ξ, z) auf dem abgeschlossenen Intervall J zwischen 0 und k
differenzierbar ist mit v 0 (z) = ϕyz (ξ, z); dabei ist ξ ∈ I, η ∈ J, also (ξ, η) ∈ Bδ .
q.e.d.
Satz 3.1: (H.A. Schwarz)
Es seien Ω ⊂ Rn und f : Ω → Rd gegeben. Für ein x0 ∈ Ω sollen die partiellen
Ableitungen Di f , Dj f und Dj Di f in einer Kugel Br (x0 ) ⊂ Ω existieren und Di Dj f
sei stetig in x0 . Dann existiert auch Di Dj f (x0 ) und es gilt
Di Dj f (x0 ) = Dj Di f (x0 ).
Beweis: Wir betrachten die Funktion
ϕ(y, z) := f (x0 + yei + zej ) für (y, z) ∈ Br := Br (0, 0).
Dann existieren ϕy , ϕz und ϕyz in Br , und ϕyz ist stetig in (0, 0). Wegen Letzterem
können wir zu vorgegebenem ε > 0 noch δ = δ(ε) > 0 so klein wählen, dass
|ϕyz (y, z) − ϕyz (0, 0)| < ε für alle (y, z) ∈ Bδ
(3.2)
3. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG
177
erfüllt ist. Wir wenden nun Hilfssatz 3.1 an: Zu beliebigem (h, k) ∈ Bδ ergeben (3.1)
und (3.2)
¯ 1 ³ ϕ(h, k) − ϕ(h, 0) ϕ(0, k) − ϕ(0, 0) ´
¯
¯
¯
−
− ϕyz (0, 0)¯
¯
h
k
k
¯ ϕ(h, k) − ϕ(h, 0) − ϕ(0, k) − ϕ(0, 0)
¯
¯
¯
=¯
− ϕyz (0, 0)¯
hk
= |ϕyz (ξ, η) − ϕyz (0, 0)| < ε
mit einem (ξ, η) ∈ Bδ . Grenzübergang k → 0 liefert also
¯1£
¯
¤
¯
¯
¯ ϕz (h, 0) − ϕz (0, 0) − ϕyz (0, 0)¯ ≤ ε für h ∈ (−δ, δ).
h
Lassen wir nun h → 0 laufen, so folgt
|ϕzy (0, 0) − ϕyz (0, 0)| ≤ ε.
Und da ε > 0 beliebig gewählt war, erhalten wir
Di Dj f (x0 ) = ϕzy (0, 0) = ϕyz (0, 0) = Dj Di f (x0 ),
wie behauptet.
q.e.d.
Bemerkung: Insbesondere können also bei einer Funktion f ∈ C 2 (Ω, Rd ) die Ableitungen – genauer die Reihenfolge der Ableitungen – vertauscht werden. Entsprechendes gilt auch für die höheren Ableitungen einer Funktion f ∈ C s (Ω, Rd ) mit
s > 2, wie man durch vollständige Induktion leicht sieht. Dies rechtfertigt auch die
folgende
Notation (Multiindizes):
Zu einem sogenannten Multiindex α := (α1 , . . . , αn ) ∈ Nn0 , d.h. αj ∈ N0 für alle
j = 1, . . . , n, erklären wir dessen Länge |α| gemäß
|α| := α1 + . . . + αn .
(Man beachte, dass |α| nicht die Euklidische Länge des Vektors α ist.) Dann schreiben wir für ein f ∈ C |α| (Ω, Rd ) abkürzend
α
Dj j f := (Dj )αj f := Dj Dj . . . Dj f
|
{z
}
αj -mal
und
Dα f := (D1 )α1 (D2 )α2 . . . (Dn )αn f = D1α1 D2α2 . . . Dnαn f.
178
KAPITEL 4. DIFFERENTIALRECHNUNG
Das bedeutet, f wird αj -mal nach xj abgeleitet, wobei die Reihenfolge der Differentiation eben nach Satz 3.1 keine Rolle spielt.
Beispiel: Für eine Funktion f : Ω → R ∈ C 2 (Ω), Ω ⊂ Rn , erklärt man den LaplaceOperator
∆f (x) := D12 f (x) + . . . + Dn2 f (x) =
n
X
fxk xk (x),
x ∈ Ω.
k=1
Dieser ordnet jeder Funktion f ∈ C 2 (Ω) eine Funktion ∆f ∈ C 0 (Ω) zu, weshalb
man auch ∆ : C 2 (Ω) → C 0 (Ω) schreibt. Der Laplace-Operator ist (wie der NablaOperator ∇ : C 1 (Ω) → C 0 (Ω, Rn )) ein Beispiel eines – und zwar eines wichtigen! –
Differentialoperators. Die zugehörige Gleichung
∆f (x) = 0
für alle x ∈ Ω
heißt Laplacegleichung und eine Lösung f nennt man harmonische Funktion. Die Laplacegleichung ist eine der wichtigsten partiellen Differentialgleichungen; dies sind
Gleichungen zwischen Funktionen mehrerer Veränderlicher und ihren partiellen Ableitungen. Im Gegensatz hierzu werden Gleichungen zwischen Funktionen einer Variablen und ihren gewöhnlichen Ableitungen als gewöhnliche Differentialgleichungen
bezeichnet.
Wir bemerken noch
∆f = spur Hf ,
wobei
Hf (x) := (fxj xk (x))j,k=1,...,n ,
x ∈ Ω,
die (symmetrische) Hessematrix der zweiten Ableitungen bezeichnet.
Wir wollen noch den Begriff des Differentials df verallgemeinern und gehen dazu
von der Darstellung (2.4) aus: Ist f ∈ C 1 (Ω, Rd ), so gilt
df (x)(h) =
n
X
Dj f (x)hj
für x ∈ Ω, h = (h1 , . . . , hn ) ∈ Rn .
j=1
Ist nun f ∈ C s (Ω, Rd ) für ein s > 1, so erklären wir das k-te Differential oder das
Differential der Ordnung k ∈ {1, . . . , s} gemäß
k
1
k
d f (x)(h , . . . , h ) :=
n
X
Dj1 . . . Djk f (x) h1j1 · . . . · hkjk
j1 ,...,jk =1
l
für x ∈ Ω und h =
(hl1 , . . . , hln )
∈ Rn mit l = 1, . . . , k.
3. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG
179
Ist speziell h1 = h2 = . . . hk =: h, so schreiben wir abkürzend
k
k
d f (x)(h) := d f (h, . . . , h) =
für x ∈ Ω und h =
n
X
Dj1 . . . Djk f (x) hj1 · . . . · hjk
j1 ,...,jk =1
(h1 , . . . , hn ) ∈ Rn .
(3.3)
Offenbar gilt d1 f (x)(h) = df (x)(h). Wir setzen schließlich noch
d0 f (x)(h) := f (x) für x ∈ Ω, h ∈ Rn .
Beispiel: Für k = 2, h := h1 ∈ Rn , g := h2 ∈ Rn haben wir
2
d f (x)(h, g) =
n
X
Di Dj f (x)hi gj .
(3.4)
i,j=1
Insbesondere für h = ei , g = ej , also i-ter bzw. j-ter Einheitsvektor, folgt
d2 f (x)(ei , ej ) = Di Dj f (x) = fxi xj (x).
Allgemeiner gilt: Ist hl = eil der il -te Einheitsvektor für l = 1, . . . , k, so folgt
dk f (x)(ei1 , . . . , eil ) = fxi1 ...xik (x).
Abschließend erklären wir noch partielle Ableitungen (und damit auch Differentiale) auf allgemeineren, für die Anwendung wichtigen Mengen:
Definition 3.2: Es sei Ω ⊂ Rn offen (und wie immer nichtleer) und Γ ⊂ ∂Ω eine
nichtleere Teilmenge des Randes ∂Ω von Ω. Eine Funktion f : Ω → Rd gehört dann
zur Klasse C s (Ω ∪ Γ, Rd ) für ein s ∈ N, wenn f ∈ C s (Ω, Rd ) gilt und wenn die
Grenzwerte
lim
Ω3x→x0
Dα f (x)
für alle x0 ∈ Γ und alle α ∈ Nn0 mit 0 ≤ |α| ≤ s
existieren.
Bemerkungen:
1. Man überlegt sich leicht als Übungsaufgabe, dass für ein f ∈ C s (Ω ∪ Γ, Rd )
alle Ableitungen Dα f , 0 ≤ |α| ≤ s, durch die Setzung
Dα f (x0 ) :=
lim
Ω3x→x0
Dα f (x) für x0 ∈ Γ ⊂ ∂Ω
stetig auf Ω ∪ Γ fortgesetzt werden können.
2. Insbesondere sind durch Definition 3.2 mit Γ = ∂Ω auch die Räume C s (Ω, Rd )
erklärt.
180
4
KAPITEL 4. DIFFERENTIALRECHNUNG
Taylorformel und lokale Extrema
Wir wollen nun ein Analogon zur Taylorformel für Funktionen einer Veränderlichen
angeben. Seien dazu Ω ⊂ Rn offen und f ∈ C s+1 (Ω) mit einem s ∈ N0 . Weiter sei
x0 ∈ Ω gewählt und für ein x ∈ Ω gelte
©
ª
[x0 , x] = x0 + t(x − x0 ) : t ∈ [0, 1] ⊂ Ω.
Mit h := x − x0 gehört dann die Funktion
φ(t) := f (x0 + th),
t ∈ [0, 1],
zur Klasse C s+1 ([0, 1]), und es gilt
φ(k) (t)
=
n
X
Dj1 . . . Djk f (x0 + th)hj1 . . . hjk
j1 ,...,jk =1
(3.3)
=
dk f (x0 + th)(h),
(4.1)
k ∈ {1, . . . , s + 1}.
Satz 7.2 aus Kap. 3 liefert nun den
Satz 4.1: Seien f ∈ C s+1 (Ω) und x0 , x ∈ Ω mit [x0 , x] ⊂ Ω gewählt. Dann gilt die
Taylorformel
f (x) = ps (x) + Rs (x)
mit dem s-ten Taylorpolynom zum Entwicklungspunkt x0
s
X
1 k
d f (x0 )(x − x0 )
ps (x) :=
k!
k=0
und dem s-ten Restglied
Rs (x) =
1
ds+1 f (y)(x − x0 )
(s + 1)!
mit einer Zwischenstelle y = x0 + ϑ(x − x0 ) ∈ (x0 , x) := [x0 , x] \ {x0 , x} für ein
ϑ ∈ (0, 1).
Beweis: Wir entwickeln φ um t = 0 und entnehmen den Formeln (7.4), (7.2) und
(7.6) aus Kap. 3:
s
X
φ(k) (0) k φ(s+1) (ϑt) s+1
φ(t) =
t +
t
k!
(s + 1)!
k=0
mit einem ϑ ∈ (0, 1) und beliebigem t ∈ [0, 1]. Insbesondere für t = 1 folgt also mit
y := x0 + ϑ(x − x0 ) = x0 + ϑh aus (4.1):
f (x) =
s
X
1 k
1
d f (x0 )(x − x0 ) +
ds+1 (y)(x − x0 ),
k!
(s + 1)!
k=0
4. TAYLORFORMEL UND LOKALE EXTREMA
wie behauptet.
181
q.e.d.
Bemerkungen:
1. Insbesondere für s = 1 haben wir mit h := x − x0 (vgl. Formel (3.4)):
1
f (x) = d0 f (x0 )(h) + d1 f (x0 )(h) + d2 f (y)(h)
2
n
n
X
1 X
fxi xj (x0 + ϑh)hi hj
= f (x0 ) +
fxj (x0 )hj +
2
i,j=1
j=1
®
1
= f (x0 ) + h∇f (x0 ), hi + h, Hf (x0 + ϑh)h .
2
(4.2)
mit der Hessematrix Hf = (fxi xj )i,j=1,...,n .
2. Analog zu Folgerung 7.1 in Kap. 3 können wir aus Satz 4.1 qualitativ schließen:
Gilt f ∈ C s (Ω) und ist x0 ∈ Ω gewählt, so folgt
f (x) = ps (x) + o(|x − x0 |s ) für x → x0 .
(4.3)
Zum Beweis wenden wir Satz 4.1 mit s − 1 statt s an: Für x ∈ Br (x0 ) ⊂ Ω
schreiben wir
¤
1£ s
d f (y)(x − x0 ) − ds f (x0 )(x − x0 ) .
f (x) = ps−1 (x) + Rs−1 (x) = ps (x) +
s!
Mit h = x − x0 folgt die Behauptung aus
|ds f (y)(h) − ds f (x0 )(h)|
|h|s
≤
n
X
¯
¯
¯Dj . . . Djs f (y) − Dj . . . Djs f (x0 )¯
1
1
j1 ,...,js =1
→ 0 (x → x0 ).
Wir betrachten nun Extremwertaufgaben zur Bestimmung von Minima und Maxima einer Funktion mit n ∈ N Veränderlichen. In Analogie zu Definition 2.1 aus
Kap. 3 benutzen wir die
Definition 4.1: Sei Ω ⊂ Rn offen und f : Ω → R erklärt. Dann besitzt f in x0 ∈ Ω
ein lokales Minimum (bzw. lokales Maximum), wenn ein r > 0 so existiert, dass
Br (x0 ) ⊂ Ω und
f (x0 ) ≤ f (x)
(bzw. f (x0 ) ≥ f (x) )
für alle x ∈ Br (x0 )
(4.4)
erfüllt ist. Gilt in (4.4) die strikte Ungleichung für x 6= x0 , so hat f in x0 ein
striktes lokales Minimum (bzw. Maximum). Falls schließlich (4.4) für alle x ∈ Ω
erfüllt ist, sprechen wir von einem globalen Minimum (bzw. globalen Maximum)
und bei strikter Ungleichung für x 6= x0 von einem strikten globalen Minimum
(bzw. Maximum).
182
KAPITEL 4. DIFFERENTIALRECHNUNG
Als Synonym für lokal bzw. global benutzen wir auch relativ bzw. absolut. Und
wir sprechen allgemein von Extrema, wenn wir Minima und Maxima untersuchen.
Der entsprechende Punkt x0 ∈ Ω heißt Minimal-,Maximal- oder Extremalstelle oder
auch Minimierer bzw. Maximierer. Schließlich sprechen wir statt von strikten auch
von isolierten Extrema.
Satz 4.2: (Notwendige Bedingung 1. Ordnung)
Eine Funktion f ∈ C 1 (Ω) besitze in x0 ∈ Ω ein lokales Extremum. Dann gilt
∇f (x0 ) = 0.
Bemerkung: Ein Punkt x0 ∈ Ω heißt kritischer Punkt von f ∈ C 1 (Ω), falls ∇f (x0 ) =
0 gilt. Satz 4.2 besagt also: Lokale Extremstellen in Ω sind notwendig kritische Punkte.
Beweis von Satz 4.2: Sei r > 0 mit Br (x0 ) ⊂ Ω und Eigenschaft (4.4) gewählt. Für
j ∈ {1, . . . , n} besitzen dann die Funktionen
ϕj (t) := f (x01 , . . . , x0j−1 , t, x0j+1 , . . . x0n ),
t ∈ (x0j − r, x0j + r),
in x0j ebenfalls lokale Extrema. Wegen ϕj ∈ C 1 ((x0j − r, x0j + r)) liefert also Fermats
Satz
fxj (x0 ) = ϕ0j (x0j ) = 0, j = 1, . . . , n,
wie behauptet.
q.e.d.
Als Anwendung betrachten wir nun reelle, symmetrische n × n-Matrizen A =
(ajk )j,k=1,...,n . Ein Vektor ξ ∈ Rn \ {0} heißt Eigenvektor von A zum Eigenwert
λ ∈ R, wenn gilt
Aξ = λξ.
(ξ als Spaltenvektor interpretiert). Durch Normierung kann man o.B.d.A. ξ ∈ S n−1
annehmen.
Satz 4.3: Für jede reelle, symmetrische Matrix A = (ajk )j,k=1,...,n ist
λ :=
hη, Aηi
2
η∈Rn \{0} |η|
sup
ein Eigenwert.
Beweis: Wir betrachten die Funktion
f (η) :=
hη, Aηi
,
|η|2
η ∈ Rn \ {0},
4. TAYLORFORMEL UND LOKALE EXTREMA
und berechnen
∇f (η) =
¢
2 ¡
Aη − f (η)η .
2
|η|
183
(4.5)
Wir bemerken weiter, dass f entlang der Strahlen {λη : λ > 0} für jedes η ∈ Rn \{0}
konstant ist:
hη, Aηi
hλη, A(λη)i
=
= f (η),
(4.6)
f (λη) =
2
|λη|
|η|2
d.h. f ist positiv homogen vom Grad 0 auf Rn \ {0}. Auf der kompakten Menge
S n−1 ⊂ Rn \ {0} nimmt nun f in einem Punkt ξ ∈ S n−1 ihr Maximum an nach dem
Weierstraßschen Hauptlehrsatz. Sei ε > 0 beliebig und η ∈ Rn \ {0} gewählt mit
f (η) ≥ λ − ε (beachte die Definition λ = supη∈Rn \{0} f (η)). Aus (4.6) folgt dann
(4.6)
λ − ε ≤ f (η) = f
³η ´
≤ f (ξ) ≤ λ,
|η|
also f (ξ) = λ. Somit ist ξ ∈ S n−1 (globaler) Maximalpunkt von f auf Rn \ {0} und
Satz 4.2 liefert ∇f (ξ) = 0. Formel (4.5) entnehmen wir schließlich
Aξ = f (ξ)ξ = λξ,
wie behauptet.
q.e.d.
Bemerkung: Wir schreiben λ1 := λ für den in Satz 4.3 konstruierten Eigenwert und
ξ1 ∈ S n−1 für den zugehörigen normierten Eigenvektor. Indem man anschließend das
Maximierungsproblem λ2 := supη∈U \{0} f (η) auf dem Unterraum U := {η ∈ Rn :
hη, ξ1 i = 0} senkrecht zu ξ1 betrachtet, den man durch Wahl einer Orthonormalbasis
mit dem Rn−1 identifiziert, entnimmt man Satz 4.3 die Existenz eines Eigenvektors
ξ2 ∈ S n−1 ∩ U zum Eigenwert λ2 ≤ λ1 , für den dann gilt
Aξ2 = λ2 ξ2 ,
hξ2 , ξ1 i = 0.
Durch Fortsetzung des Verfahrens erhalten wir die
Folgerung 4.1: Zu jeder reellen, symmetrischen n × n-Matrix A = (ajk )j,k=1,...,n
existieren n Eigenvektoren ξ1 , . . . , ξn und n Eigenwerte λ1 ≥ λ2 ≥ . . . ≥ λn ,
d.h. Aξj = λj ξj für j = 1, . . . , n. Die Eigenvektoren {ξ1 , . . . , ξn } bilden eine Orthonormalbasis des Rn , d.h.
(
1, falls j = k
hξj , ξk i = δjk :=
.
0, falls j 6= k
Bemerkung: Offenbar ist λ genau dann Eigenwert von A, wenn das homogene lineare
Gleichungssytem
(A − λE)ξ = 0
184
KAPITEL 4. DIFFERENTIALRECHNUNG
mit der Einheitsmatrix E eine nichttriviale Lösung ξ ∈ Rn \ {0} besitzt, was bekanntlich äquivalent zur Forderung
det(A − λE) = 0
ist. Die linke Seite ist ein Polynom n-ten Grades in λ, das charakteristische Polynom,
welches also nach Folgerung 4.1 für symmetrisches A ausschließlich reelle Nullstellen
besitzt.
Die Rolle der zweiten Ableitung bei Extremwertaufgaben für Funktionen einer
Veränderlichen übernimmt nun die Hessematrix Hf . Für das Folgende benötigen wir
noch die
Definition 4.2: Eine reelle, symmetrische n × n-Matrix A heißt positiv definit
(i.Z. A > 0), wenn gilt
hη, Aηi > 0
für alle η ∈ Rn \ {0}.
A heißt positiv semidefinit (i.Z. A ≥ 0), wenn gilt
hη, Aηi ≥ 0
für alle η ∈ Rn .
Ferner nennen wir A negativ definit bzw. negativ semidefinit (i.Z. A < 0 bzw. A ≤
0), falls −A > 0 bzw. −A ≥ 0 erfüllt ist. Schließlich heißt A indefinit, wenn hη, Aηi
sowohl positive als auch negative Werte annimmt.
Aus dieser Definition und Folgerung 4.1 erhalten wir nun die
Folgerung 4.2: Ist A eine reelle, symmetrische n × n-Matrix und sind λ1 ≥ . . . ≥
λn ihre zugehörigen Eigenwerte, so gilt
A > 0 (≥ 0) ⇐⇒ λn > 0 (≥ 0),
(4.7)
A < 0 (≤ 0) ⇐⇒ λ1 < 0 (≤ 0),
(4.8)
A indefinit ⇐⇒ λn < 0 und λ1 > 0.
(4.9)
Beweis: Es bezeichne ξj ∈ S n−1 den zu λj gehörigen Eigenvektor. Dann können wir
jedes η ∈ Rn schreiben als
η=
n
X
cj ξj
mit cj := hη, ξj i,
j=1
denn {ξ1 , . . . , ξn } bilden eine Orthonormalbasis des Rn . Es folgt
hη, Aηi =
=
=
n
X
cj ck hξj , Aξk i
j,k=1
Pn
j,k=1 cj ck λk hξj , ξk i
Pn
2
j=1 λj cj
= λ1 c21 + . . . + λn c2n .
(4.10)
4. TAYLORFORMEL UND LOKALE EXTREMA
185
Ist nun A > 0, so wählen wir in (4.10) speziell η = ξn . Dann folgt hξn , Aξn i = λn > 0.
Gilt umgekehrt λn > 0, so entnehmen wir (4.10) für beliebiges η ∈ Rn \ {0}:
hη, Aηi ≥ λn
n
X
c21 = λn |η|2 > 0.
k=1
Entsprechend sieht man A ≥ 0 ⇔ λn ≥ 0. Die Aussagen (4.6) folgen aus (4.5), da
λj genau dann Eigenwert von A ist, wenn −λj Eigenwert von −A ist. Ist schließlich
A indefinit und η ∈ Rn \ {0} mit hη, Aηi > 0 gewählt, so folgt wiederum aus (4.10):
0 < hη, Aηi ≤ λ1 |η|2 ,
also λ1 > 0. Entsprechend sieht man λn < 0 durch Wahl eines η ∈ Rn \ {0} mit
hη, Aηi < 0. Sind schließlich umgekehrt λn < 0 und λ1 > 0, so folgt hξn , Aξn i =
λn < 0 und hξ1 , Aξ1 i = λ1 > 0, d.h. A ist indefinit. Damit ist alles gezeigt.
q.e.d.
µ
¶
a b
Beispiel (n = 2): Ist A =
eine reelle, symmetrische 2 × 2-Matrix, so ist
b c
λ ∈ R genau dann Eigenwert von A, wenn gilt
0 = det(A − λE) = λ2 − (a + c)λ + ac − b2 .
Es folgt
λ1 + λ2 = a + c,
λ1 λ2 = ac − b2 = det A,
z.B. aus der p-q-Formel“. Wir entnehmen also Folgerung 4.2 die
”
µ
¶
a b
Folgerung 4.3: Für eine reelle Matrix A =
gilt:
b c
A > 0 ⇐⇒ det A > 0 und a > 0,
A < 0 ⇐⇒ det A > 0 und a < 0,
A ≥ 0 oder A ≤ 0 ⇐⇒ det A ≥ 0,
A indefinit ⇐⇒ det A < 0.
Satz 4.4: (Notwendige Bedingung 2. Ordnung)
Eine Funktion f ∈ C 2 (Ω) nehme in x0 ∈ Ω ⊂ Rn ihr Minimum (bzw. Maximum)
an. Dann gilt für die Hessematrix
¡
¢
Hf (x0 ) = fxj xk (x0 ) j,k=1,...,n ≥ 0
(bzw. Hf (x0 ) ≤ 0).
186
KAPITEL 4. DIFFERENTIALRECHNUNG
Beweis: Nach Satz 4.2 wissen wir ∇f (x0 ) = 0. Sei nun x0 Minimalpunkt, so existiert
ein r > 0 mit Br (x0 ) ⊂ Ω und f (x) ≥ f (x0 ) für alle x ∈ Br (x0 ). Die Taylorentwicklung in (4.2) liefert also mit h := x − x0 :
1
0 ≤ f (x) − f (x0 ) = hh, Hf (x0 + ϑh)hi für alle h ∈ Rn : |h| < r
2
für ein ϑ = ϑ(h) ∈ (0, 1). Ist nun ξ ∈ Rn beliebig, so setzen wir h := tξ mit
hinreichend kleinem t > 0 und erhalten
0 ≤ lim hξ, Hf (x0 + ϑtξ)ξi = hξ, Hf (x0 )ξi,
t→0+
also Hf (x0 ) ≥ 0. Entsprechend zeigt man Hf (x0 ) ≤ 0 für Maximierer.
q.e.d.
Satz 4.5: Es sei f ∈ C 2 (Ω), x0 ∈ Ω kritischer Punkt und in Br (x0 ) ⊂ Ω gelte
Hf ≥ 0 (bzw. Hf ≤ 0). Dann ist x0 lokaler Minimierer (bzw. Maximierer) von f .
Beweis: Wie im Beweis von Satz 4.4 entnehmen wir Formel (4.2)
1
f (x) − f (x0 ) = hh, Hf (x0 + ϑh)hi für alle h ∈ Rn : |h| < r
2
mit ϑ = ϑ(h) ∈ (0, 1). Die Voraussetzung liefert also f (x) ≥ f (x0 ) (bzw. f (x) ≤
f (x0 )) für alle x ∈ Br (x0 ), wie behauptet.
q.e.d.
Satz 4.6: (Hinreichende Bedingung)
Sei x0 ∈ Ω kritischer Punkt der Funktion f ∈ C 2 (Ω) und es gelte Hf (x0 ) > 0
(bzw. Hf (x0 ) < 0). Dann besitzt f in x0 ein lokales Minimum (bzw. Maximum).
Bemerkung: Für den Beweis ist es hilfreich einer Matrix A = (aij )i,j ihre Euklidische
Länge zuzuordnen:
µ X ¶1
2
|A| :=
a2ij .
i,j
Dann gilt für beliebige A ∈ Matn,m (R) und y ∈ Rm :
|Ay| ≤ |A| |y|.
(4.11)
Beweis von Satz 4.6: Wir zeigen, dass ein r > 0 existiert mit Br (x0 ) ⊂ Ω und Hf ≥ 0
(bzw. Hf ≤ 0) in Br (x0 ); die Behauptung folgt dann aus Satz 4.5.
Sei also Hf (x0 ) > 0. Nach Folgerung 4.2 gilt dann λn > 0 für den kleinsten
Eigenwert von Hf (x0 ). Und aus Formel (4.10) erhalten wir wieder
hη, Hf (x0 )ηi ≥ λn
n
X
k=1
c2k = λn |η|2
für alle η ∈ Rn
5. INVERSE ABBILDUNGEN
187
und folglich
hη, Hf (x)ηi
=
≥
(4.11)
 ¡
¢ ®
hη, Hf (x0 )ηi + η, Hf (x) − Hf (x0 ) η
¯¡
¢ ¯
λn |η|2 − |η| ¯ Hf (x) − Hf (x0 ) η ¯
¡
¢
λn − |Hf (x) − Hf (x0 )| |η|2
für alle η ∈ Rn , x ∈ Ω.
(4.12)
2
0
Wegen f ∈ C (Ω) existiert ein r > 0 mit Br (x ) ⊂ Ω und
≥
|Hf (x) − Hf (x0 )| ≤ λn
für alle x ∈ Br (x0 ).
Einsetzen in (4.12) ergibt also
hη, Hf (x)ηi ≥ (λn − λn )|η|2 = 0 für alle η ∈ Rn , x ∈ Br (x0 ),
d.h. Hf ≥ 0 in Br (x0 ). Der Fall Hf (x0 ) < 0 wird entsprechend behandelt.
q.e.d.
Bemerkung: Man überlegt sich leicht, dass die hinreichende Bedingung in Satz 4.6
sogar ein striktes lokales Extremum liefert. Hierzu zeigt man, dass ein r > 0 existiert
mit Br (x0 ) ⊂ Ω und Hf > 0 (bzw. Hf < 0) in Br (x0 ). Wie im Beweis von Satz 4.5
sieht man dann, dass daraus f (x) > f (x0 ) (bzw. f (x) < f (x0 )) für alle x ∈ Br (x0 ) \
{x0 } folgt.
5
Inverse Abbildungen
Ziel dieses Paragraphen ist der Beweis des folgenden
Satz 5.1: (Umkehrsatz)
Sei Ω ⊂ Rn offen und f : Ω → Rn ∈ C 1 (Ω, Rn ) gegeben. Falls dann für ein x0 ∈ Ω
gilt
Jf (x0 ) = det Df (x0 ) 6= 0,
so gibt es eine Umgebung U = U (x0 ) ⊂ Ω von x0 , so dass U ∗ := f (U ) offen ist und
f |U einen C 1 -Diffeomorphismus von U auf U ∗ liefert.
Wir erinnern daran, dass eine Umgebung U = U (x0 ) eines Punktes x0 eine offene
Menge ist, die x0 enthält, und f |U die Einschränkung einer Funktion f : Ω → Rd
auf eine Teilmenge U ⊂ Ω bezeichnet.
Obiger Satz 5.1 kann als lokale Umkehrung von Folgerung 1.1 interpretiert werden
und ist von grundlegender Bedeutung für die gesamte Analysis (weshalb er auch
Fundamentalsatz über die inverse Abbildung genannt wird). Er besagt, dass das
nichtlineare Gleichungssystem
f (x) = y,
x ∈ Ω,
188
KAPITEL 4. DIFFERENTIALRECHNUNG
zumindest lokal um ein x0 ∈ Ω nach x eindeutig aufgelöst werden kann, wenn die
quadratische Matrix Df (x0 ) invertierbar ist; man vergleiche auch mit den entsprechenden Aussagen über lineare Gleichungssysteme aus der Linearen Algebra.
Wir werden Satz 5.1 durch Lokalisierung gewinnen aus dem folgenden
Satz 5.2: Bildet f ∈ C 1 (Ω, Rn ) die offene Menge Ω ⊂ Rn bijektiv auf Ω∗ = f (Ω)
ab und gilt Jf 6= 0 auf Ω, so ist Ω∗ offen und f ein C 1 -Diffeomorphismus von Ω auf
Ω∗ .
Für eine übersichtliche Darstellung des Beweises ist es sinnvoll an dieser Stelle
folgende wichtige Bezeichnungen einzuführen:
Definition 5.1:
(i) Eine Abbildung f : Ω → Rn heißt offen, wenn das Bild f (Ω0 ) jeder offenen
Teilmenge Ω0 von Ω wieder offen ist.
(ii) f : Ω → Rn heißt Lipschitzstetig, wenn eine Konstante L ≥ 0 existiert, so
dass gilt
|f (x) − f (y)| ≤ L|x − y| für alle x, y ∈ Ω.
L ist die zugehörige Lipschitzkonstante.
(iii) f : Ω → Rn ∈ C 1 (Ω, Rn ) heißt regulär in x0 ∈ Ω, wenn Jf (x0 ) 6= 0 gilt. f
heißt einfach regulär, wenn f in jedem Punkt x0 von Ω regulär ist.
Bemerkungen:
1. Die Definitionen (i) und (ii) machen natürlich auch Sinn, wenn Bild– und
Urbilddimension nicht übereinstimmen.
2. Eine Abbildung f : Ω → Rn ist genau dann offen, wenn es zu jedem x0 ∈ Ω
eine Kugel Bδ (x0 ) ⊂ Ω so gibt, dass zu jedem r ∈ (0, δ) ein % > 0 existiert mit
¡
¢
¡
¢
B% f (x0 ) ⊂ f Br (x0 ) .
3. Jede Lipschitzstetige Abbildung ist auch stetig.
4. Mit den Bezeichnungen aus Definition 5.1 besagt nun Satz 5.2:
Jede injektive, reguläre Abbildung f ∈ C 1 (Ω, Rn ) ist ein C 1 -Diffeomorphismus
von Ω auf f (Ω) und außerdem offen.
Wir beginnen den Beweis von Satz 5.2 mit dem folgenden
5. INVERSE ABBILDUNGEN
189
Hilfssatz 5.1: Die Abbildung f ∈ C 1 (Ω, Rn ) sei in x0 ∈ Ω regulär. Dann gibt es
eine offene Umgebung U = Bδ (x0 ) ⊂ Ω von x0 , auf der f injektiv ist, d.h. f |U ist
invertierbar. Die Inverse g := (f |U )−1 ist dann Lipschitzstetig.
Beweis: Wir betrachten die Funktion
ψ(x) := f (x) − f (x0 ) − Df (x0 ) ◦ (x − x0 ),
x ∈ Ω.
Dann gilt ψ ∈ C 1 (Ω, Rn ) und Dψ(x0 ) = 0. In einer Kugel BR (x0 ) ⊂ Ω liefert
Hadamards Lemma
ψ(x) − ψ(x0 ) = A ◦ (x − x0 ),
mit
Z1
A :=
x, x0 ∈ BR (x0 ),
(5.1)
¡
¢
Dψ x0 + t(x − x0 ) dt.
0
Wegen Dψ(x0 ) = 0 und der Stetigkeit von Dψ existiert zu beliebigem µ > 0 ein
δ ∈ (0, R) mit der Eigenschaft
|Dψ(x)| ≤ µ für alle x ∈ Bδ (x0 ),
(5.2)
so dass |A| ≤ µ für beliebige x, x0 ∈ Bδ (x0 ) folgt, und (5.1) liefert
|ψ(x) − ψ(x0 )| ≤ |A| |x − x0 | ≤ µ|x − x0 | für alle x, x0 ∈ Bδ (x0 ).
Der Definition von ψ entnehmen wir
ψ(x) − ψ(x0 ) = f (x) − f (x0 ) − Df (x0 )(x − x0 )
und somit
|f (x) − f (x0 )| = |ψ(x) − ψ(x0 ) + Df (x0 ) ◦ (x − x0 )|
≥ |Df (x0 ) ◦ (x − x0 )| − µ|x − x0 | für alle x, x0 ∈ Bδ (x0 ).
(5.3)
Wegen Jf (x0 ) 6= 0 ist Df (x0 ) invertierbar. Wir erhalten
|x − x0 | = |Df (x0 )−1 ◦ Df (x0 )(x − x0 )| ≤ |Df (x0 )−1 | |Df (x0 ) ◦ (x − x0 )|
bzw.
|Df (x0 ) ◦ (x − x0 )| ≥ |Df (x0 )−1 |−1 |x − x0 |.
Wählen wir in (5.2) speziell µ :=
in (5.3) ein, so folgt schließlich
1
2|Df (x0 )−1 |
> 0 und setzen die letzte Abschätzung
|f (x) − f (x0 )| ≥ µ|x − x0 | für alle x, x0 ∈ Bδ (x0 ).
(5.4)
Also ist f |Bδ (x0 ) bijektiv auf V := f (Bδ (x0 )), und für die Inverse g = g(y) : V → Rn
gilt
|g(y) − g(y 0 )| ≤ µ−1 |y − y 0 | für alle y, y 0 ∈ V,
d.h. g ist Lipschitzstetig mit L = µ−1 .
q.e.d.
190
KAPITEL 4. DIFFERENTIALRECHNUNG
Hilfssatz 5.2: Ist f ∈ C 1 (Ω, Rn ) regulär, so ist f auch offen.
Beweis: Wir fixieren x0 ∈ Ω und wählen δ > 0 mit Bδ (x0 ) ⊂ Ω wie im Beweis
von Hilfssatz 5.1, so dass (5.4) erfüllt ist. Zu beliebigem r ∈ (0, δ) setzen wir dann
% := µr
2 > 0 und wollen zeigen, dass
¡
¢
¡
¢
B% f (x0 ) ⊂ f Br (x0 )
gilt. Dann ist f nach obiger Bemerkung 1 offen.
Sei also y ∈ B% (f (x0 )) beliebig. Wir haben zu zeigen, dass dann ein ξ ∈ Br (x0 )
mit f (ξ) = y existiert. Hierzu erklären wir die Funktion
F (x) := |f (x) − y|2 ,
x ∈ Br (x0 ).
Offenbar gilt F ∈ C 1 (Br (x0 )). Nach dem Weierstraßschen Hauptlehrsatz existiert
also ein ξ ∈ Br (x0 ) mit
F (ξ) = inf F.
Br (x0 )
Wir zeigen ξ ∈ Br (x0 ), d.h. ξ ist innerer Punkt. Wäre nämlich ξ ∈ ∂Br (x0 ), so folgte
|f (ξ) − y|
≥
(5.4)
≥
|f (ξ) − f (x0 )| − |f (x0 ) − y|
µ|ξ − x0 | − |f (x0 ) − y| > µr − % = %,
also F (ξ) = |f (ξ) − y|2 > %2 im Widerspruch zu F (x0 ) < %2 . Nun gilt für die innere
Minimalstelle ξ ∈ Br (x0 ) notwendig
∇F (ξ) = 2Df (ξ) ◦ (f (ξ) − y) = 0.
Da aber Df in Ω invertierbar ist, muss somit f (ξ) − y = 0 bzw. f (ξ) = y gelten, wie
behauptet.
q.e.d.
Wir kommen nun zum
Beweis von Satz 5.2: Sei also f ∈ C 1 (Ω, Rn ) regulär und injektiv mit Bild f (Ω) = Ω∗ .
Nach Hilfssatz 5.2 ist dann Ω∗ offen und es bleibt g := f −1 : Ω∗ → Rn ∈ C 1 (Ω∗ , Rn )
nachzuweisen. Hierzu fixieren wir y0 ∈ Ω∗ beliebig und zeigen, dass für alle k ∈ Rn
mit y0 + k ∈ Ω∗ die Darstellung
g(y0 + k) = g(y0 ) + A ◦ k + R(k) mit R(k) = o(|k|) für k → 0
(5.5)
gilt, wobei A := Df (x0 )−1 mit x0 := g(y0 ) ∈ Ω erfüllt ist. Dann ist also g in y0 total
differenzierbar und es gilt Dg(y0 ) = Df (x0 )−1 ; insbesondere ist g also auch stetig
in y0 . Und da y0 ∈ Ω∗ beliebig gewählt war, folgt
Dg(y) = Df (g(y))−1
für alle y ∈ Ω∗ .
5. INVERSE ABBILDUNGEN
191
Schließlich ist auch Df stetig auf Ω = g(Ω∗ ) und somit g ∈ C 1 (Ω, Rn ).
Zu zeigen bleibt (5.5): Hierzu setzen wir
h := g(y0 + k) − g(y0 ) = g(y0 + k) − x0
und beachten x0 + h = g(y0 + k) ∈ Ω. Wegen f ∈ C 1 (Ω, Rn ) gilt dann nach Satz 2.6:
f (x0 + h) = f (x0 ) + Df (x0 )h + R̃(h)
mit einem R̃(h) = o(|h|) für h → 0. Umstellen liefert sofort (5.5) mit
¡
¢
R(k) := −A−1 R̃(h) = −Df (x0 )−1 R̃ g(y0 + k) − x0 .
Wir zeigen schließlich noch R(k) = o(|k|) für k → 0. Dazu bemerken wir, dass nach
Hilfssatz 5.1 ein ε > 0 mit Bε (y0 ) ⊂ Ω∗ so existiert, dass
|g(y) − g(y 0 )| ≤ L|y − y 0 | für alle y, y 0 ∈ Bε (y0 )
erfüllt ist mit einer Lipschitzkonstanten L > 0. Folglich erhalten wir
|h| = |g(y0 + k) − g(y0 )| ≤ L|k| für alle k ∈ Rn mit |k| < ε.
Somit ergibt sich
¯ R̃(h) ¯
¯ R(k) ¯
|R̃(h)|
¯
¯
¯
¯
≤ |A−1 |L¯
¯
¯ ≤ |A−1 |
¯ → 0 (k → 0),
|k|
|k|
|h|
wie behauptet. Damit ist alles bewiesen.
q.e.d.
Beweis des Umkehrsatzes: Nach Hilfssatz 5.1 gibt es eine Umgebung Bδ (x0 ) ⊂ Ω
von x0 ∈ Ω, auf der f injektiv ist. Da Jf stetig ist und Jf (x0 ) 6= 0 gilt, können
wir ε ∈ (0, δ) so wählen, dass Jf 6= 0 in U := Bε (x0 ) erfüllt ist. Dann ist also
f |U regulär und injektiv, und nach Satz 5.2 ist U ∗ := f (U ) offen und f |U ein C 1 Diffeomorphismus von U auf U ∗ .
q.e.d.
Im nächsten Paragraphen werden wir eine Anwendung des Umkehrsatzes auf
implizit definierte Funktionen“ und, darauf aufbauend, auf Extremwertaufgaben
”
mit Nebenbedingungen kennenlernen. Wir beschließen diesen Paragraphen mit der
einfachen
Folgerung 5.1: Sei Ω ⊂ Rn offen und für s ≥ 1 sei f ∈ C s (Ω, Rn ) regulär und
injektiv mit dem Bild Ω∗ = f (Ω). Dann folgt f −1 ∈ C s (Ω∗ , Rn ).
Beweis: Nach Satz 5.2 ist f zunächst ein C 1 -Diffeomorphismus. Folgerung 1.1 entnehmen wir dann (siehe auch den Beweis von Satz 5.2):
¡
¢−1
Df −1 (y) = Df f −1 (y)
für alle y ∈ Ω∗ .
Durch sukzessives Differenzieren ergibt sich daraus f −1 ∈ C s (Ω∗ , Rn ).
q.e.d.
192
KAPITEL 4. DIFFERENTIALRECHNUNG
Definition 5.2: Eine injektive Abbildung f : Ω → Rn ∈ C s (Ω, Rn ) heißt C s -Diffeomorphismus von Ω ⊂ Rn auf f (Ω) für ein s ∈ N, wenn auch f −1 : f (Ω) → Rn zur
Klasse C s (f (Ω), Rn ) gehört.
Bemerkung: Korollar 5.1 zeigt also insbesondere, dass unter den Voraussetzungen
von Satz 5.1 die Einschränkung f |U ein C s -Diffeomorphismus von U auf f (U ) ist,
falls zusätzlich f ∈ C s (Ω, Rn ) vorausgesetzt wird.
6
Der Satz über implizite Funktionen, Mannigfaltigkeiten im Rn und Extrema mit Nebenbedingungen
Wir betrachten zunächst allgemein das folgende Problem: Es sei f = f (x) : Ω →
Rd ∈ C 1 (Ω, Rd ) gegeben auf der offenen Menge Ω ⊂ Rn , wobei n = m + d mit
einem m ∈ N gelte. Wir zerlegen x = (x1 , . . . , xn ) in die ersten m Komponenten
(x1 , . . . , xm ) =: (y1 , . . . , ym ) = y und die letzten d Komponenten (xm+1 , . . . , xn ) =:
(z1 , . . . , zd ) = z, d.h. wir haben
f = f (y, z) = f (y1 , . . . , ym , z1 , . . . , zd ),
(y, z) ∈ Ω.
Die Frage ist nun: Unter welchen Voraussetzungen lässt sich die Lösung der Gleichung
f (y, z) = 0 für (y, z) ∈ Ω
(6.1)
zumindest lokal (eindeutig) in der Form z = ϕ(y) darstellen. Genauer: Wann existiert
zu einem (y 0 , z 0 ) ∈ Ω mit f (y 0 , z 0 ) = 0 eine Umgebung U = U (y 0 ) und eine Funktion
ϕ = ϕ(y) : U → Rd , so dass sich alle Lösungen von (6.1) in einer Umgebung
W = W (y 0 , z 0 ) ⊂ Ω in der Form (y, ϕ(y)), y ∈ U , darstellen lassen. Dann gilt also
f (y, ϕ(y)) = 0,
y ∈ U.
(6.2)
Man sagt, Gleichung (6.1) sei dann lokal nach z aufgelöst und die Lösung z = ϕ(y)
ist durch die Gleichung (6.1) implizit definiert.
Beispiel: Wir betrachten die Funktion f = f (y, z) := y 2 + z 2 − 1, (y, z) ∈ R2
(d.h. m = d = 1, n = 2). Die Gleichung f = 0 beschreibt natürlich den Einheitskreis.
Ist nun (y 0 , z 0 ) ein Punkt auf dem Einheitskreis, d.h. f (y 0 , z 0 ) = 0, so lässt sich die
Gleichung f = 0 lokal um (y 0 , z 0 ) nach z auflösen, falls y 0 ∈ (−1, 1) gilt. Dann haben
wir
( p
y 2 − 1,
falls z 0 > 0
p
z = ϕ(y) =
− y 2 − 1, falls z 0 < 0
und (6.2) gilt für y ∈ U = (−1, 1). Für y 0 = ±1 existiert keine Umgebung U = U (y 0 ),
so dass f lokal nach z aufgelöst werden kann. Wir bemerken
(
6= 0, für y 0 ∈ (−1, 1)
fz (y 0 , z 0 ) = 2z 0
= 0, für y 0 = ±1
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
193
Wir können also f = 0 lokal um (y 0 , z 0 ) nach z auflösen, falls fz (y 0 , z 0 ) 6= 0 gilt.
Diese Bedingung bzw. ihr höherdimensionales Analogon wird sich auch allgemein
als hinreichend erweisen:
Satz 6.1: (Satz über implizite Funktionen)
Für s ∈ N sei f = f (y, z) = f (y1 , . . . , ym , z1 , . . . , zd ) : Ω → Rd ∈ C s (Ω, Rd ) auf der
offenen Menge Ω ⊂ Rn mit n = m + d gegeben. Für einen Punkt (y 0 , z 0 ) ∈ Ω gelte
f (y 0 , z 0 ) = 0,
wobei wir
det Dz f (y 0 , z 0 ) 6= 0,

f1z1
 ..
Dz f :=  .
fdz1

. . . f1zd
.. 
..
.
. 
. . . fdzd
gesetzt haben. Dann gibt es eine Umgebung U = U (y 0 ) ⊂ Rm und eine Umgebung
W = W (y 0 , z 0 ) ⊂ Ω so, dass die Gleichung f (y, z) = 0 für jedes y ∈ U genau eine
Lösung (y, z) ∈ W besitzt. Die so erklärte Funktion z = ϕ(y) : U → Rd gehört
dann zur Klasse C s (U, Rd ) und die Lösungsmenge der Gleichung f = 0 in W hat
die Darstellung
©
(y, ϕ(y)) : y ∈ U } = graph ϕ.
Beweis: Wir erweitern f = f (y, z) zur Abbildung F = F (y, z) := (y, f (y, z)) ∈
C s (Ω, Rn ). Wir haben also die Zuordnung
¡
¢
Rn ⊃ Ω 3 (y, z) 7→ (y, ζ) := y, f (y, z) ∈ Rn .
(6.3)
Schreiben wir noch

f1y1
 ..
Dy f :=  .
fdy1
so folgt für die Jacobimatrix von F :
Ã
DF (y, z) =

. . . f1ym
..  ,
..
.
. 
. . . fdym
!
E
O
,
Dy f (y, z) Dz f (y, z)
wobei E die m × m–Einheitsmatrix und O die m × d–Nullmatrix ist. Es folgt also
JF (y, z) = det DF (y, z) = det Dz f (y, z)
und insbesondere JF (y 0 , z 0 ) 6= 0. Nach dem Umkehrsatz, Satz 5.1, und Folgerung 5.1
gibt es nun eine Umgebung W = W (y 0 , z 0 ) ⊂ Ω, so dass F |W ein C s -Diffeomorphismus auf die offene Menge W ∗ := F (W ) ist. Die Umkehrabbildung F −1 : W ∗ →
Rn ∈ C s (W ∗ , Rn ) gibt uns also eine Zuordnung
¡
¢
W ∗ 3 (y, ζ) 7→ (y, z) =: y, g(y, ζ) ∈ Rn
(6.4)
194
KAPITEL 4. DIFFERENTIALRECHNUNG
mit einer Funktion g = g(y, ζ) ∈ C s (W ∗ , Rd ). Formeln (6.3) und (6.4) zeigen insbesondere
f (y, z) = 0 ⇔ z = g(y, 0) für (y, z) ∈ W.
Setzen wir also U = {y ∈ Rn : (y, 0) ∈ W ∗ } und ϕ(y) := g(y, 0) ∈ C s (U, Rd ), so ist
alles gezeigt.
q.e.d.
Bemerkung: Aus der Relation f (y, ϕ(y)) = 0 für y ∈ U folgt noch mit der Kettenregel
0 = Dy f (y, ϕ(y)) + Dz f (y, ϕ(y)) ◦ Dϕ(y)
bzw.
Dϕ(y) = −Dz f (y, ϕ(y))−1 ◦ Dy f (y, ϕ(y)),
y ∈ U,
(6.5)
wenn wir U = U (y 0 ) hinreichend klein wählen.
Wir wollen noch eine geometrische Interpretation des Satzes über implizite Funktionen anfügen. Hierzu benötigen wir die
Definition 6.1: (Gleichungsdefinierte Mannigfaltigkeiten)
Für s ∈ N sei f = f (x) : Ω → Rd ∈ C s (Ω, Rd ) gegeben auf der offenen Menge
Ω ⊂ Rn mit m := n − d ∈ N. Dann heißt die Menge
©
ª
M := x ∈ Ω : f (x) = 0 ⊂ Rn
eine m-dimensionale (gleichungsdefinierte) Mannigfaltigkeit der Klasse C s , falls
M 6= ∅ und
rang Df (x) = d für alle x ∈ M
erfüllt sind; m ist die Dimension, d = n − m die Kodimension von M .
Bemerkung: Wir werden i.F. kurz von Mannigfaltigkeiten statt von gleichungsdefinierten Mannigfaltigkeiten sprechen. Mannigfaltigkeiten sind die natürlichen zu
untersuchenden Objekte in der Differentialgeometrie“; mit ihnen lassen sich insbe”
sondere Kurven und Flächen im R3 beschreiben.
Beispiel: Ist Θ ⊂ Rm offen und ϕ = ϕ(y) : Θ → Rd ∈ C s (Θ, Rd ) eine beliebige
Funktion. Setzen wir dann n := m + d, Ω := Θ × Rd ⊂ Rn und
f (x) := z − ϕ(y),
x := (y, z) ∈ Ω,
so ist M := {x ∈ Ω : f (x) = 0} = graph ϕ ⊂ Rn eine m-dimensionale Mannigfaltigkeit der Klasse C s , denn es gilt fzj = ej , j = 1, . . . , d, und folglich rang Df = d
auf M . Jeder Graph einer Funktion der Klasse C s ist also eine Mannigfaltigkeit der
Klasse C s . Umgekehrt liefert Satz 6.1 die nachstehende
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
195
Folgerung 6.1: Jede m-dimensionale Mannigfaltigkeit M ⊂ Rn der Klasse C s ,
m < n, lässt sich lokal eindeutig als Graph einer Abbildung ϕ : U → Rd ∈ C s (U, Rd )
mit d = n − m und U ⊂ Rm schreiben.
Beweis: Sei x0 ∈ M gewählt, insbesondere gilt also
f (x0 ) = 0
und
rang Df (x0 ) = d.
Durch eventuelle Umbezeichnung der Koordinaten können wir o.B.d.A. annehmen:
¡
¢
det Dm+1 f (x0 ), . . . , Dn f (x0 ) 6= 0.
Schreiben wir wieder x = (y, z) = (y1 , . . . , ym , z1 , . . . , zd ), so folgt
f (y 0 , z 0 ) = 0,
det Dz f (y 0 , z 0 ) 6= 0.
Also können wir Satz 6.1 anwenden: Wir finden Umgebungen W = W (x0 ) ⊂ Ω und
U = U (y 0 ) ⊂ Rm sowie eine Funktion ϕ = ϕ(y) ∈ C s (U, Rd ), so dass gilt
M ∩ W = {(y, ϕ(y)) : y ∈ U },
wie behauptet.
q.e.d.
Beispiel: Seien Ω ⊂ R3 und fc (x, y, z) := x2 + y 2 − z 2 − c mit einer Konstante c ∈ R;
also gilt d = 1, n = 3 und somit m = n − d = 2. Wir berechnen
∇fc (x, y, z) = 2(x, y, −z) im R3 .
Also ist Mc := {(x, y, z) ∈ Rr : fc (x, y, z) = 0} genau dann 2-dimensionale Mannigfaltigkeit (der Klasse C ∞ ), wenn c 6= 0 gilt, da genau dann ∇fc 6= 0 (d.h.
p rang Dfc =
rang ∇fc = 1) auf Mc gilt. Für c = 0 ist M0 = {(x, y, z) : z = ± x2 + y 2 } ein
Kegel. Um den Ursprung (0, 0, 0) mit ∇f0 (0, 0, 0) = 0 lässt sich keine Umgebung als
Graph über einer der Koordinatenebenen darstellen; (0, 0, 0) heißt singulärer Punkt
von M0 .
Definition 6.2: (Tangential- und Normalraum)
Es sei M ⊂ Rn eine m-dimensionale Mannigfaltigkeit der Klasse C 1 mit Kodimension d := n − m ∈ N.
(i) Ein Vektor v ∈ Rn heißt Tangentialvektor von M im Punkt x ∈ M , wenn eine
Kurve c : (−δ, δ) → Rn ∈ C 1 ((−δ, δ), Rn ) mit
¡
¢
c(0) = x, ċ(0) = v und c (−δ, δ) ⊂ M
(6.6)
existiert. Die Menge aller solcher Vektoren heißt Tangentialraum Tx M von M
im Punkt x.
196
KAPITEL 4. DIFFERENTIALRECHNUNG
(ii) Das orthogonale Komplement
©
ª
Tx⊥ M := ξ ∈ Rn : hξ, vi = 0 für alle v ∈ Tx M
heißt Normalraum von M in x; seine Elemente heißen Normalenvektoren von
M in x.
Tx M (siehe Beweis von Satz 6.2 (i) unten) und Tx⊥ M sind für jedes x ∈ M lineare
Unterräume des Rn mit
Tx M ⊕ Tx⊥ M = Rn .
Es gilt nun der
Satz 6.2: Die m-dimensionale Mannigfaltigkeit M ⊂ Rn mit Kodimension d =
n − m ∈ N sei gegeben durch M = {x ∈ Ω : f (x) = 0} mit einem f = (f1 , . . . , fd ) ∈
C 1 (Ω, Rd ). Dann gelten für alle x ∈ M :
(i) dim Tx M = m, dim Tx⊥ M = d.
(ii) Tx⊥ M = span{∇f1 (x), . . . , ∇fd (x)}.
¡
¢
(iii) Tx M = {v ∈ Rn : Df (x)v = 0}, d.h. Tx M = Kern df (x) .
Beweis:
(i) Wir zeigen dim Tx M = m; dann folgt offenbar sofort dim Tx⊥ M = n − m = d.
Sei x0 ∈ M fixiert. Wir zerlegen wieder x = (y, z) = (y1 , . . . , ym , z1 , . . . , zd ),
wobei o.B.d.A. det Dz f (y 0 , z 0 ) 6= 0 gelte. Wie in Folgerung 6.1 finden wir dann
die lokale Graphendarstellung
©
ª
M ∩ W = (y, ϕ(y)) : y ∈ U
mit Umgebungen W = W (x0 ) ⊂ Ω, U = U (y 0 ) ⊂ Rm und einer Funktion
ϕ ∈ C 1 (U, Rd ).
Sei nun c ∈ C 1 ((−δ, δ), Rn ) eine Kurve mit der Eigenschaft (6.6) für x = x0 ∈
M und v ∈ Tx0 M . Mit c := (c1 , . . . , cm ) ∈ C 1 ((−δ, δ), Rm ) haben wir dann für
hinreichend kleines δ > 0 die Darstellung
¡
¢
c(t) = c(t), ϕ(c(t)) , t ∈ (−δ, δ),
(6.7)
und folglich
¡
¢
v = ċ(0) = ċ(0), Dϕ(y 0 ) ◦ ċ(0) .
(6.8)
Umgekehrt definiert natürlich jede Kurve (6.7) einen Tangentialvektor v ∈
Tx0 M durch (6.8).
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
197
Wählen wir speziell c(t) = y 0 +tej mit dem j-ten Einheitsvektor, j = 1, . . . , m,
so erhalten wir die m linear unabhängigen Tangentialvektoren
¡
¢
vj := ej , Dϕ(y 0 )ej , j = 1, . . . , m,
also dim Tx0 M ≥ m. Ist schließlich v ∈ Tx0 M ein beliebiger Tangentialvektor,
so haben wir die Darstellung (6.8) und mit αj := hċ(0), ej i folgt
v =
=
µX
m
j=1
m
X
m
´¶
³X
α j ej
αj ej , Dϕ(y )
0
j=1
m
X
¡
¢
αj ej , Dϕ(y 0 )ej =
αj v j ,
j=1
j=1
also v ∈ span{v1 , . . . , vm } und insbesondere dim Tx0 M = m.
(ii) Ist c = c(t) ∈ C 1 ((−δ, δ), Rn ) eine beliebige Kurve mit der Eigenschaft (6.6)
für x ∈ M und v ∈ Tx M , so folgt für jede Komponentenfunktion fk von f :
0=
¯
d
¯
fk (c(t))¯
= h∇fk (x), vi,
dt
t=0
k = 1, . . . , d.
Also gilt ∇f1 (x), . . . , ∇fd (x) ∈ Tx⊥ M . Wegen rang Df (x) = d sind die Vektoren ∇f1 (x), . . . , ∇fd (x) linear unabhängig, und wegen dim Tx⊥ M = d folgt
schließlich span{∇f1 (x), . . . , ∇fd (x)} = Tx⊥ M .
(iii) Für v ∈ Tx M gilt nach (ii) h∇fk (x), vi = 0 für k = 1, . . . , d bzw. Df (x)v = 0.
Ist umgekehrt v ∈ Rn mit Df (x)v = 0 gewählt, so folgt wiederum nach (ii)
v ∈ (Tx⊥ M )⊥ = Tx M . Somit gilt Tx M = {v ∈ Rn : Df (x)v = 0} und alles ist
gezeigt.
q.e.d.
Beispiel: Die Einheitssphäre S n−1 = {x ∈ Rn : |x| = 1} ⊂ Rn ist eine (n − 1)dimensionale Mannigfaltigkeit der Klasse C ∞ . Für f (x) := |x|2 − 1 ∈ C ∞ (Rn ) gilt
nämlich S n−1 = {x ∈ Rn : f (x) = 0} und wir haben ∇f (x) = 2x 6= 0 für alle
x ∈ S n−1 . Aus Satz 6.2 folgt nun
©
ª
Tx S n−1 = v ∈ Rn : hx, vi = 0 ,
Tx⊥ S n−1 = span{x} für x ∈ S n−1 .
Wir wollen nun abschließend unser Wissen auf Extremwertaufgaben anwenden,
die Nebenbedingungen unterliegen, und beginnen mit der folgenden Verallgemeinerung von Definition 4.1 auf beliebige Mengen M ⊂ Rn :
198
KAPITEL 4. DIFFERENTIALRECHNUNG
Definition 6.3: Sei M ⊂ Rn beliebig und φ : M → R gegeben. Dann heißt x0 ∈ M
lokale Minimalstelle (bzw. Maximalstelle) von φ, wenn es eine Kugel Br (x0 ) ⊂ Rn
so gibt, dass
φ(x0 ) ≤ φ(x)
(bzw. φ(x0 ) ≥ φ(x))
für alle x ∈ M ∩ Br (x0 )
(6.9)
erfüllt ist. φ hat dann in x0 ein lokales Minimum (bzw. Maximum) oder, allgemein,
ein lokales Extremum. Bei strikter Ungleichung (für x 6= x0 ) sprechen wir wieder
von strikten lokalen Extrema.
Satz 6.3: (Extrema mit Nebenbedingungen)
Es sei φ : Ω → R ∈ C 1 (Ω) auf der offenen Menge Ω ⊂ Rn gegeben. Weiter sei durch
©
ª
M = x ∈ Ω : f (x) = 0
für eine Funktion f = (f1 , . . . , fd ) ∈ C 1 (Ω, Rd ) eine m-dimensionale Mannigfaltigkeit mit m := n − d ∈ N erklärt. Schließlich besitze die Einschränkung φ|M : M → R
in x0 ∈ M ein lokales Extremum. Dann gibt es reelle Zahlen λ1 , . . . , λd , so dass gilt
∇φ(x0 ) + λ1 ∇f1 (x0 ) + . . . + λd ∇fd (x0 ) = 0,
(6.10)
d.h. x0 ∈ M ⊂ Ω ist kritischer Punkt der Funktion
ψ(x) := φ(x) + λ1 f1 (x) + . . . + λd fd (x),
x ∈ Ω.
(6.11)
Bemerkungen:
1. Wegen Satz 6.2 (ii) besagt Satz 6.3: Notwendig für eine Extremalstelle x0 ∈ M
von φ|M ist, dass der Vektor ∇φ(x0 ) Normalenvektor von M im Punkt x0 ist.
2. Die Zahlen λ1 , . . . , λd heißen Langrange Multiplikatoren.
Beweis von Satz ¡6.3: Sei¢v ∈ Tx0 M beliebig und c ∈ C 1 ((−δ, δ), Rn ) mit c(0) = x0 ,
ċ(0) = v und c (−δ, δ) ⊂ M gewählt. Der Satz von Fermat liefert dann nach
Einsetzen in φ:
¢¯¯
d ¡
= h∇φ(x0 ), vi.
0 = φ c(t) ¯
dt
t=0
Also ist ∇φ(x0 ) ∈ Tx⊥0 M richtig. Nach Satz 6.2 (ii) gibt es daher Zahlen µ1 , . . . , µd ∈
R mit
d
X
∇φ(x0 ) =
µk ∇fk (x0 ),
k=1
und (6.10) folgt mit λk := −µk für k = 1, . . . , d.
q.e.d.
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
199
Bemerkung: In Satz 6.3 treten n + d Unbekannte x01 , . . . , x0n , λ1 , . . . , λd ∈ R auf, die
aus den n + d Gleichungen
d
X ∂fk
∂φ 0
(x ) +
λk
(x0 ) = 0,
∂xj
∂xj
j = 1, . . . , n,
k=1
fk (x0 ) = 0,
k = 1, . . . , d,
zu bestimmen sind. Häufig ist es sinnvoll, zunächst alle kritischen Punkte x0 ∈ Ω
der Funktion ψ = φ + λ1 f1 + . . . + λd fd mit beliebigen λ1 , . . . , λd ∈ R zu bestimmen
und anschließend jene auszuwählen, die zusätzlich die Bindungsgleichungen f1 (x0 ) =
. . . = fd (x0 ) = 0 erfüllen.
Beispiel (Youngsche Ungleichung): Wir setzen Ω := {(x, y) ∈ R2 : x > 0, y > 0}.
Zu p, q > 1 mit p1 + 1q = 1 erklären wir
φ(x, y) := xy,
xp y q
+ ,
f (x, y) :=
p
q
(x, y) ∈ Ω.
Zu beliebigem c > 0 betrachten wir nun
©
ª
Mc := (x, y) ∈ Ω : f (x, y) − c = 0 .
Wegen ∇(f (x, y) − c) = ∇f (x, y) = (xp−1 , y q−1 ) 6= 0 für (x, y) ∈ Mc ist Mc ⊂ R2
für jedes c > 0 eine 1-dimensionale Mannigfaltigkeit. Auf der kompakten Menge
Mc = {(x, y) ∈ Ω : f (x, y) = c} nimmt φ|Mc in einem Punkt (x0 , y0 ) ∈ Mc ihr
Maximum an. Wegen φ = 0 auf Mc \ Mc folgt (x0 , y0 ) ∈ Mc . Nach Satz 6.3 existiert
also ein λ ∈ R mit
∇φ(x0 , y0 ) + λ∇f (x0 , y0 ) = 0
bzw.
y0 + λxp−1
= 0,
0
bzw.
x0 + λy0q−1 = 0
−λxp0 = x0 y0 = −λy0q .
Daraus folgt xp0 = y0q und somit
f (x0 , y0 ) =
³1 1´
xp0 y0q
+
=
+
xp = xp0 = y0q = c.
p
q
p q 0
1
1
Einsetzen in φ liefert φ(x0 , y0 ) = x0 y0 = c p c q = c bzw.
φ(x, y) ≤ c = f (x, y) für alle (x, y) ∈ Mc .
Da schließlich c > 0 beliebig war, folgt φ ≤ f auf Ω, also die Youngsche Ungleichung
xy ≤
xp y q
+
p
q
für alle x, y ≥ 0.
200
KAPITEL 4. DIFFERENTIALRECHNUNG
Satz 6.4: (Hinreichende Bedingung unter Nebenbedingungen)
Es sei φ ∈ C 2 (Ω), Ω ⊂ Rn , und f = (f1 , . . . , fd ) ∈ C 2 (Ω, Rd ) definiere die m = n−ddimensionale Mannigfaltigkeit M = {x ∈ Ω : f (x) = 0} der Klasse C 2 . Schließlich
seien x0 ∈ M und λ1 , . . . , λn ∈ R so gewählt, dass die Funktion
ψ(x) := φ(x) + λ1 f1 (x) + . . . + λd fd (x),
x ∈ Ω,
in x0 einen kritischen Punkt hat. Gilt dann
hv, Hψ (x0 )vi > 0 (bzw. < 0)
für alle v ∈ Tx0 M \ {0},
(6.12)
so besitzt φ|M in x0 ein striktes lokales Minimum (bzw. Maximum).
Beweis: Sei x0 ∈ M wie beschrieben gewählt und hv, Hψ (x0 )vi > 0 für alle v ∈
Tx0 M erfüllt. Nach Folgerung 6.1 gibt es dann (nach eventueller Umbezeichnung der
Koordinaten) Umgebungen W = W (x0 ) ⊂ Rn und U = Bε (y 0 ) ⊂ Rm sowie eine
Funktion ϕ ∈ C 2 (U, Rd ), so dass x0 = (y 0 , ϕ(y 0 )) und M ∩ W = {(y, ϕ(y)) : y ∈ U }
gilt. Die Abbildung g(y) := (y, ϕ(y)) bildet also U bijektiv auf M ∩ W ab.
Wir betrachten nun die Funktion χ := ψ ◦ g ∈ C 2 (U ). Wir haben dann die
qualitative Taylorformel (4.3):
1
χ(y) − χ(y 0 ) = h∇χ(y 0 ), hi + hh, Hχ (y 0 )hi + o(|h|2 )
2
(6.13)
mit h := y − y 0 ∈ Rm . Nach Voraussetzung gilt
∇χ(y 0 ) = Dg(y 0 ) ◦ ∇x ψ(g(y 0 )) = Dg(y 0 ) ◦ ∇ψ(x0 ) = 0
(6.14)
und man rechnet leicht nach

®
hh, Hχ (y 0 )hi = Dg(y 0 )h, Hψ (x0 ) ◦ Dg(y 0 )h .
(6.15)
Nun ist Dg(y 0 )h = (h, Dϕ(y 0 )h) ∈ Tx0 M für beliebiges h ∈ Rn richtig (vgl. Beweis von Satz 6.2 (i)). Da hv, Hψ (x0 )vi auf der kompakten Menge S n−1 ∩ Tx0 M ihr
positives Minimum µ > 0 annimmt, folgt
Dv
v E 2
, Hψ (x0 )
|v| ≥ µ|v|2 für alle v ∈ Tx0 M
hv, Hψ (x0 )vi =
|v|
|v|
und aus (6.15) insbesondere noch
hh, Hχ (y 0 )hi ≥ µ|Dg(y 0 )h|2 ≥ µ|h|2
für h = y − y 0 .
Setzen wir nun (6.14) und (6.16) in (6.13) ein, so folgt
φ(x) − φ(x0 ) = χ(y) − χ(y 0 ) ≥
¯ µ
µ 2 ¯¯
|h| − o(|h|2 )¯ ≥ |h|2
2
4
(6.16)
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
201
für h = y − y 0 und beliebiges y ∈ Bε (y 0 ) mit hinreichend kleinem ε > 0. Wir haben
also insbesondere φ(x) > φ(x0 ) für alle x ∈ M ∩ W \ {x0 }, wie behauptet. Der Fall
eines lokalen Maximums wird entsprechend behandelt.
q.e.d.
Durch eine naheliegende Modifikation des Beweises von Satz 6.4 erhält man noch
den
Satz 6.5: (Notwendige Bedingung 2. Ordnung unter Nebenbedingungen)
Es seien φ ∈ C 2 (Ω), f = (f1 , . . . , fd ) ∈ C 2 (Ω, Rd ) und M ⊂ Ω wie in Satz 6.4
erklärt. Falls dann φ|M in x0 ein lokales Minimum (bzw. Maximum) besitzt, so gilt
hv, Hψ (x0 )vi ≥ 0 (bzw. ≤ 0)
für ψ(x) =
d
P
k=1
für alle v ∈ Tx0 M
(6.17)
λk φk (x) mit den wie in Satz 6.3 gewählten Lagrangeschen Parametern
λ1 , . . . , λd ∈ R.
Kapitel 5
Das n-dimensionale
Riemannsche Integral
Wir wollen nun Funktionen f : M → Rd für Mengen M ⊂ Rn integrieren. Die
geometrische Idee für den Fall d = 1 und nichtnegatives, beschränktes f ist zunächst
wie im Eindimensionalen: Die Bestimmung des Volumens des zylindrischen Körpers
im Rn+1 mit Grundfläche M × {0}, Deckelfläche graph f = {(x, f (x) : x ∈ M } und
Mantelfläche {(x, y) ∈ Rn+1 : x ∈ ∂M, y ∈ [0, f (x)]} Hierzu werden wir zunächst
die Konstruktion des eindimensionalen Integrals über abgeschlossene Intervalle I =
[a, b] direkt auf Integrale über abgeschlossene Quader Q = [a1 , b1 ] × . . . × [an , bn ]
übertragen. Dann werden wir das Integral auf sogenannte quadrierbare Mengen M
verallgemeinern, die wir in Quader einsperren. Zentrales Ergebnis dieses Kapitels
ist die Transformationsformel. Am Ende werden wir noch kurz Kurventintegrale
behandeln.
1
Das Integral über Quader
Sind Ij = [aj , bj ] ⊂ R abgeschlossene Intervalle für j = 1, . . . , n, so nennen wir
©
ª
Q := I1 × . . . × In = (x1 , . . . , xn ) ∈ Rn : xj ∈ [aj , bj ], j = 1, . . . , n
einen Quader im Rn . Mit
|Q| :=
n
Y
|Ij | =
j=1
n
Y
(bj − aj )
j=1
bezeichnen wir den Inhalt von Q. In Analogie zu Definition 4.1 aus Kapitel 3 erklären
wir nun:
Definition 1.1: Sei Q ⊂ Rn ein Quader und f : Q → R beschränkt.
203
204
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
• Es seien Z (j) Zerlegungen von Ij für j = 1, . . . , n mit
a = xj,0 < xj,1 < . . . < xj,Nj = b.
Dann heißt Z := Z (1) × . . . × Z (n) Zerlegung von Q. Wir schreiben Ij,αj =
[xj,αj −1 , xj,αj ] mit αj ∈ {1, . . . , Nj }, j = 1, . . . , n, für das αj -te Teilintervall
der Zerlegung Z (j) und erklären die Teilquader
Qα := I1,α1 × . . . × In,αn ,
α ∈ (α1 , . . . , αn ) ∈ A,
wobei A die Menge der auftretenden Multiindizes angibt:
©
ª
A = α = (α1 , . . . , αn ) : 1 ≤ αj ≤ Nj , j = 1, . . . n .
Wir setzen schließlich
∆(Z) := max{∆Z (1) , . . . , ∆Z (n) }
für die Feinheit der Zerlegung Z.
• Aus jedem Teilquader Qα wählen wir ξα ∈ Qα , α ∈ A. Dann nennen wir
X
SZ (f ) :=
f (ξα )|Qα |
α∈A
eine Riemannsche Zwischensumme von f (zur Zerlegung Z).
• Mit den Abkürzungen
mα := inf f,
Qα
mα := sup f
Qα
bilden wir die Untersumme
S Z (f ) :=
X
mα |Qα |
α∈A
und die Obersumme
S Z (f ) :=
X
mα |Qα |
α∈A
von f (zur Zerlegung Z).
Bemerkungen:
1. Es gibt genau N1 · N2 · . . . · Nn Teilquader Qα die sich nach Konstruktion
offenbar nicht überlappen und für die gilt
X
|Q| =
|Qα |.
(1.1)
α∈A
1. DAS INTEGRAL ÜBER QUADER
205
2. Offenbar gilt
S Z (f ) ≤ SZ (f ) ≤ S Z (f )
für jede Riemannsche Zwischensumme.
Definition 1.2:
(1)
(n)
• Eine Zerlegung Z∗ = Z∗ ×. . .×Z∗ von Q heißt Verfeinerung einer Zerlegung
(j)
Z = Z (1) × Z (n) von Q, wenn Z∗ Verfeinerung von Z (j) ist für alle j =
1, . . . , n.
• Eine gemeinsame Verfeinerung Z ∨ Z∗ von Z und Z∗ ist erklärt als
(1)
(n)
Z ∨ Z∗ := (Z (1) ∨ Z∗ ) × . . . × (Z (n) ∨ Z∗ ).
Völlig analog zu Hilfssatz 4.1 in Kap. 3 beweist man den
Hilfssatz 1.1:
(i) Ist Z∗ Verfeinerung der Zerlegung Z von Q, so gilt
S Z (f ) ≤ S Z∗ (f ) ≤ S Z∗ (f ) ≤ S Z (f ).
(ii) Sind Z1 , Z2 zwei beliebige Zerlegungen von Q, so gilt
S Z1 (f ) ≤ S Z2 (f ).
Definition 1.3: Ist f : Q → R beschränkt, so erklären wir das Unterintegral I(f )
und Oberintegral I(f ) von f als
©
ª
I(f ) = I Q (f ) := sup S Z (f ) : Z ist Zerlegung von Q ,
©
ª
I(f ) = I Q (f ) := inf S Z (f ) : Z ist Zerlegung von Q .
Bemerkung: Für jede beschränkte Funktion f : Q → R und jede Zerlegung Z von
Q gilt nach Hilfssatz 1.1 (i):
−∞ < |Q| inf f ≤ S Z (f ) ≤ S Z (f ) ≤ |Q| sup f < +∞.
Q
Q
Also sind I(f ), I(f ) ∈ R wohl definiert und Hilfssatz 1.1 (ii) entnehmen wir noch
S Z (f ) ≤ I(f ) ≤ I(f ) ≤ S Z (f )
für alle Zerlegungen Z von Q.
(1.2)
206
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Definition 1.4: Eine beschränkte Funktion f : Q → R heißt (Riemann)-integrierbar auf dem Quader Q ⊂ Rn , wenn I(f ) = I(f ) erfüllt ist. Wir setzen dann
I(f ) := I(f ) = I(f )
für das (Riemannsche) Integral von f auf Q und schreiben auch
Z
Z
Z
I(f ) = f (x) dx = f dx1 . . . dxn = f dV,
Q
Q
Q
wobei dV = dx = dx1 . . . dxn das Volumenelement bezeichnet. Die Klasse aller
Riemann-integrierbaren Funktionen auf Q bezeichen wir mit R(Q).
Beispiel: f (x) := c, x ∈ Q ⊂ Rn , mit einer Konstante c ∈ R. Wegen
S Z (f ) =
X
(1.1)
c|Qα | = c|Q|,
S Z (f ) = c|Q|
α∈A
für beliebige Zerlegungen Z von Q in Teilquader Qα , α ∈ A, folgt f ∈ R(Q) und
Z
c dx = c|Q|.
Q
Exakt wie Satz 4.1 in Kap. 3 beweist man nun den
Satz 1.1: (Integrabilitätskriterium I)
Für eine beschränkte Funktion f : Q → R gilt
f ∈ R(Q)
⇔
Für alle ε > 0 existiert eine Zerlegung Z
von Q mit S Z (f ) − S Z (f ) < ε.
Ein wenig anpassen muss man den Beweis von Satz 4.2 aus Kap. 3, um das folgende zentrale Ergebnis zu erhalten:
Satz 1.2: (Integrabilitätskriterium II)
Für eine beschränkte Funktion f : Q → R gilt
f ∈ R(Q)
⇔
Für alle ε > 0 existiert ein δ = δ(ε), so dass gilt:
S Z (f ) − S Z (f ) < ε für alle Zerlegungen Z mit ∆(Z) < δ.
Wiederum durch wörtliches Übertragen von Folgerung 4.1 aus Kap. 3 erhalten
wir die
1. DAS INTEGRAL ÜBER QUADER
207
Folgerung 1.1: Sei f ∈ R(Q) und {Zp }p eine ausgezeichnete Zerlegungsfolge von
Q, d.h. ∆(Zp ) → 0 (p → ∞). Ist dann {SZp (f )}p eine zugehörige Folge beliebiger
Riemannscher Zwischensummen, so gilt
Z
f (x) dx = lim SZp (f ).
p→∞
Q
Bemerkung: Verknüpung von Satz 1.2 und Folgerung 1.1 zeigt sofort: Ist f ∈ R(Q)
und {Zp }p eine ausgezeichnete Zerlegungsfolge von Q, so folgt
Z
lim S Zp (f ) = lim S Zp (f ) = f (x) dx.
p→∞
p→∞
Q
Mit Hilfe der obigen Integrabilitätskriterien (insbesondere Satz 1.2) lassen sich
viele Ergebnisse der Integration über Intervalle direkt auf Integrale über Quader Q
übertragen. Wir verzichten daher auf die Beweise der folgenden beiden Sätze:
Satz 1.3: (Rechenregeln; vgl. Satz 4.3 in Kap. 3)
(i) Gilt f, g ∈ R(Q), so auch αf + βg ∈ R(Q) für beliebige α, β ∈ R, und es gilt
I(αf + βg) = αI(f ) + βI(g);
R(Q) ist also ein reeller Vektorraum.
(ii) Sind f, g ∈ R(Q) mit f ≤ g auf Q gegeben, so folgt
I(f ) ≤ I(g).
(iii) Mit f ∈ R(Q) ist auch |f | ∈ R(Q) richtig mit
|I(f )| ≤ I(|f |).
(iv) Sind f, g ∈ R(Q), so auch f · g ∈ R(Q) und es gilt
¡
¢
|I(f g)| ≤ sup |g| · I(|f |).
Q
(v) Gilt f, g ∈ R(Q) sowie |g| ≥ c > 0 auf Q mit einer Konstanten c > 0, so folgt
auch fg ∈ R(Q) mit
¯ ³ f ´¯ 1
¯
¯
¯ ≤ I(|f |).
¯I
g
c
208
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Satz 1.4: (vgl. Satz 4.4 in Kap. 3) Es gilt C 0 (Q) ⊂ R(Q).
Bemerkungen:
1. Für Funktionen f = (f1 , . . . , fd ) : Q → Rd auf einem Quader Q ⊂ Rn mit
fj ∈ R(Q), j = 1, . . . , n, erklären wir das Integral wieder komponentenweise:
µZ
¶
Z
Z
n
n
n
f d x :=
f1 d x, . . . , fd d x .
Q
Q
Q
Wir schreiben R(Q, Rd ) für die Klasse der integrierbaren Rd -wertigen Funktionen. Entsprechend ist R(Q, C) die Klasse der komplexwertigen integrierbaren
Funktionen mit
Z
Z
Z
f dx := Re f dx + i Im f dx.
Q
Q
Q
Die Rechenregeln, Satz 1.3 (i), (iii), (iv) (in (iv) entspricht das Produkt natürlich hf, gi für f, g ∈ R(Q, Rd )) und Satz 1.4 lassen sich wieder sofort übertragen.
2. Eine Funktion f : Q → Rd heißt integrierbar über Q0 ⊂ Q, wenn f |Q0 ∈
R(Q0 , Rd ) gilt. Man überlegt sich leicht R(Q, Rd ) ⊂ R(Q0 , Rd ) für alle Quader
Q0 ⊂ Q; wir schreiben
Z
Z
f dx :=
Q0
f |Q0 dx.
Q0
Wir wollen nun Integrale über Quader im Rn auf Integrale über niederdimensionale Quader zurückführen. Sei dazu f = f (x, y) : Q × R → R ∈ R(Q × R) für
Quader Q ⊂ Rq , R ⊂ Rr mit q + r = n vorgelegt. Für festes x ∈ Q schreiben wir
dann
(1.3)
ϕ(x) := I R (f (x, ·)), ϕ(x) := I R (f (x, ·)), x ∈ Q,
für das Unter- bzw. Oberintegral von f (x, ·) : R → R, welche nicht übereinstimmen
müssen. Wir bemerken, dass ϕ, ϕ : Q → R wieder beschränkt sind und gemäß (1.2)
ϕ ≤ ϕ auf Q erfüllen. Es gilt nun der
Satz 1.5: (Iterierte Integration)
Für beliebiges f = f (x, y) : Q × R → R ∈ R(Q × R) sind die in (1.3) erklärten
Funktionen ϕ, ϕ : Q → R integrierbar über Q und es gilt
Z
Z
f (x, y) dx dy =
Q×R
Z
ϕ(x) dx =
Q
ϕ(x) dx.
Q
1. DAS INTEGRAL ÜBER QUADER
209
Beweis: Wir betrachten Zerlegungen ZQ von Q in Teilquader Qα , α ∈ A, und ZR
von R in Teilquader Rβ , β ∈ B. Dann ist ZT := ZQ × ZR eine Zerlegung von
T := Q × R mit Teilquadern Tαβ := Qα × Rβ , (α, β) ∈ A × B. Umgekehrt lässt sich
so jede Zerlegung von T durch Zerlegungen von Q und R darstellen. Wir bemerken
noch
©
ª
∆(ZT ) ≥ max ∆(ZQ ), ∆(ZR ) .
(1.4)
Nun erklären wir die Größen
mαβ := inf f,
Tαβ
mαβ := sup f,
(α, β) ∈ A × B.
Tαβ
Für beliebiges x ∈ Qα mit einem α ∈ A folgt dann
X
X¡
¢
mαβ |Rβ | ≤
inf f (x, y) |Rβ | ≤ I R (f (x, ·)) = ϕ(x)
β∈B
β∈B
und entsprechend
X
y∈Rβ
mαβ |Rβ | ≥ ϕ(x) ≥ ϕ(x).
β∈B
Insbesondere können wir zum Infimum bzw. Supremum bez. x ∈ Q übergehen und
erhalten
X
X
mαβ |Rβ | ≤ inf ϕ ≤ sup ϕ ≤
mαβ |Rβ |.
(1.5)
Qα
β∈B
Qα
β∈B
Die gleiche Relation gilt offenbar für ϕ. Multiplizieren wir (1.5) mit |Qα | und summieren über α ∈ A, so folgt
S ZT (f ) ≤ S ZQ (ϕ) ≤ S ZQ (ϕ) ≤ S ZT (f ),
(1.6)
und wiederum gilt die gleiche Relation auch für ϕ. Da nun f über T = Q × R
integrierbar ist, existiert nach Satz 1.1 zu beliebigem ε > 0 eine Zerlegung ZT von
T mit
S ZT (f ) − S ZT (f ) < ε.
Für die zugehörige Zerlegung ZQ von Q folgt also aus (1.6):
S ZQ (ϕ) − S ZQ (ϕ) < ε,
und wiederum nach Satz 1.1 ist ϕ und entsprechend ϕ integrierbar. Wählen wir
schließlich in (1.6) eine ausgezeichnete Zerlegungsfolge {ZT,p }p mit ∆(ZT,p ) →
0 (p → +∞), so ist wegen (1.4) auch die zugehörige Folge {ZQ,p }p ausgezeichnet
und Folgerung 1.1 bzw. die anschließende Bemerkung liefern
Z
Z
f (x, y) dx dy = lim S ZT,p (f ) = lim S ZQ,p (ϕ) = ϕ(x) dx.
p→∞
Q×R
p→∞
Q
210
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Entsprechend folgt aus der (1.6) entsprechenden Relation für ϕ noch
Z
Z
f (x, y) dx dy = ϕ(x) dx.
Q
Q×R
Damit ist alles gezeigt.
q.e.d.
Bemerkungen:
1. Offensichtlich überträgt sich die Aussage von Satz 1.5 sofort auf vektor-bzw.
komplexwertige Funktionen, wobei dann die Definition von ϕ und ϕ komponentweise zu verstehen ist.
2. ϕ und ϕ stimmen genau dann in Q überein, wenn f (x, ·) : R → R für jedes
x ∈ Q integrierbar ist. Da nach Satz 1.4 jede stetige Funktion integrierbar ist,
erhalten wir sofort den folgenden
Satz 1.6: (Iterierte Integration stetiger Funktionen)
Ist f = f (x, y) : Q × R → Rd ∈ C 0 (Q × R, Rd ) gegeben, so ist f (x, ·) : R → Rd für
jedes x ∈ Q über R integrabel und es gilt
¶
Z
Z µZ
f (x, y) dx dy =
f (x, y) dy dx.
(1.7)
Q×R
Q
R
Bemerkungen:
1. Durch Umbezeichnung x ↔ y, also Vertauschen der Koordinaten, entnimmt
man (1.7):
¶
¶
Z µZ
Z
Z µZ
f (x, y) dy dx =
f (x, y) dx dy =
f (x, y) dx dy.
(1.8)
Q
R
Q×R
R
Q
Auf die Reihenfolge der Integration kommt es also nicht an!
2. Ist Q = I1 × . . . × In ⊂ Rn ein Quader und f : Q → Rd ∈ C 0 (Q, Rd ), so folgt
aus Satz 1.6
¶ ¶
¶
Z
Z µZ µ µZ
f dx1 . . . dxn =
...
f dxn . . . dx2 dx1 .
(1.9)
Q
I1
I2
In
Wir können also jedes Integral einer stetigen Funktion auf einem Quader im Rn
durch sukzessives eindimensionales Integrieren auswerten. Wie in (1.8) spielt
die Reihenfolge der Integration dabei keine Rolle.
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
211
Beispiele:
1. Sei f (x, y) = xy, Q = [0, 2] × [0, 1]. Dann gilt
Z
f dx dy
Z2 µ Z1
(1.9)
=
0
Q
¶
xy dy dx
(1.8)
Z1 µ Z2
=
0
0
¶
xy dx dy
0
¶
Z1 µ Z2
Z1
y x dx dy =
2y dy = 1.
=
0
0
0
2
2. Sei f (x, y) = xyex y , Q ∈ [0, 1] × [0, 1]. Dann gilt
Z1 µ Z1
Z
f dx dy =
xye
0
Q
Z1
=
0
2
x2 y
0
¶
¶
Z1 µ Z1
∂ h 1 x2 y i
e
dx dy
dx dy =
∂x 2
0
0
1 y
1
(e − 1) dy = (e − 2).
2
2
Unstetigkeitsstellen integrierbarer Funktionen
und der Satz von Heine-Borel
Wir wollen nun untersuchen, wie groß“ die Menge der Unstetigkeitsstellen einer
”
Funktion f : Q → R (oder auch Rd , C) werden darf, damit f noch integrierbar
bleibt. Dies ist entscheidend für die Integration über allgemeinere Mengen des Rn ,
siehe § 3. Wir benötigen zunächst die
Definition 2.1:
(i) Eine Menge M ⊂ Rn hat den Inhalt Null (i.Z. |M | = 0), wenn es zu jedem
ε > 0 Quader Q1 , . . . , QN mit einem N = N (ε) ∈ N so gibt, dass gilt
M⊂
N
[
j=1
Q̊j ,
N
X
|Qj | < ε.
j=1
(ii) M hat das Maß Null (i.Z. meas M = 0), falls zu jedem ε > 0 höchstens
abzählbar viele Quader Q1 , Q2 , . . . so existieren, dass gilt
[
X
M⊂
Q̊j ,
|Qj | < ε.
j
M heißt dann Nullmenge.
j
212
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkungen:
1. Mengen vom Inhalt Null besitzen also zu jedem ε > 0 eine endliche Überdeckung durch offene Quader mit Gesamtinhalt < ε (vgl. Definition 2.2 unten). Hingegen sind für Mengen vom Maß Null auch solche Überdeckungen
mit abzählbar unendlich vielen Quadern zulässig. Jede Menge vom Inhalt Null
ist also auch Nullmenge; die Umkehrung gilt nicht!
2. Offenbar hat jede Teilmenge einer Menge mit Inhalt Null (bzw. Maß Null)
ebenfalls den Inhalt Null (bzw. Maß Null).
Hilfssatz 2.1:
(i) Die Vereinigung endlich vieler Mengen vom Inhalt Null hat ebenfalls den Inhalt
Null.
(ii) Die Vereinigung höchstens abzählbar vieler Nullmengen ist wieder Nullmenge
Beweis:
(i) Ist klar.
S
(ii) Seien M1 , M2 , . . . ⊂ Rn mit meas Mk = 0 für alle k gegeben und M = k Mk .
Zu beliebigem ε > 0 und jedem k existieren dann höchstens abzählbar viele
Quader Qk1 , Qk2 , . . . mit
Mk ⊂
[
Q̊kj
und
X
j
|Qkj | < 2−k ε.
j
Die Menge der auftretenden Indizes (j, k) ist Teilmenge von N × N und somit
höchstens abzählbar. Es gilt nun
M=
[
k
sowie
X
(j,k)
wie behauptet.
|Qkj | < ε
X
k
Mk ⊂
[
Q̊kj
(j,k)
2−k ≤ ε
∞ ³ ´
X
1 k
k=1
2
= ε,
q.e.d.
Hilfssatz 2.2: Ist K ⊂ Rn kompakt und ϕ ∈ C 0 (K), so ist graph ϕ ⊂ Rn+1 eine
Menge vom Inhalt Null.
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
213
Beweis: Da K kompakt ist, gibt es einen Würfel W = [−r, r]×. . .×[−r, r] mit |W | =
(2r)n , r > 0, so dass K ⊂ W gilt. Zu beliebigem ε > 0 wählen wir η = η(ε) > 0 mit
2n+1 η|W | < ε.
Da ϕ auf K gleichmäßig stetig ist, existiert weiter ein δ = δ(ε) > 0, so dass
|ϕ(x) − ϕ(x0 )| < η
für alle x, x0 ∈ K : |x − x0 | < δ
S
erfüllt ist. Schließlich wählen wir eine äquidistante Zerlegung W = α∈A W̃α von W
mit diam W̃α < δ für alle α ∈ A (A ⊂ Nn ist eine endliche Indexmenge). Sind dann
ξα ∈ Qα , α ∈ A0 := {α ∈ A : W̃α ∩ K 6= ∅} beliebig gewählt, so erklären wir
¡
¢
Q̃α := W̃α × ϕ(ξα ) − η, ϕ(ξα ) + η ⊂ Rn+1 , α ∈ A0 .
Damit gilt offenbar
graph ϕ ⊂
[
Q̃α .
α∈A0
Ersetzen wir noch W̃α durch den gleichzentrierten Würfel Wα mit doppelter Kantenlänge, so folgt für
£
¤
Qα := Wα × ϕ(ξα ) − η, ϕ(ξα ) + η , α ∈ A0 ,
dann Q̃α ⊂ Q̊α und somit
graph ϕ ⊂
[
Q̃α ⊂
α∈A0
[
Q̊α .
α∈A0
Wegen |Qα | = 2n |Q̃α | erhalten wir noch
X
X
X
(1.1)
|Qα | =
2n |Q̃α | = 2n (2η)
|W̃α | = 2n+1 η|W | < ε,
α∈A0
α∈A0
α∈A0
wie behauptet.
q.e.d.
Als nächstes werden wir zeigen, dass jede kompakte Nullmenge den Inhalt Null
hat. Hierzu beweisen wir einen zentralen Satz der Analysis, für den wir noch die
folgenden Begriffe erklären:
Definition 2.2: Es sei J eine beliebige, nicht notwendig abzählbare Indexmenge.
Eine Familie F = {Ωj }j∈J offener Mengen Ωj ⊂ Rn heißt dann offene Überdeckung
einer Menge M ⊂ Rn , wenn gilt
[
M⊂
Ωj .
j∈J
Die Überdeckung heißt endlich, wenn sie nur endlich viele Mengen Ωj enthält, d.h. J
ist endliche Indexmenge.
214
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkungen:
1. S
Jede Menge M 6= ∅ hat eine triviale offene Überdeckung, nämlich M ⊂
x∈M Br (x) mit beliebigem Radius r = r(x) > 0.
2. Ist M offen, so ist {M } eine endliche offene Überdeckung von M .
3. Jede beschränkte Menge M , d.h. |x| < R für alle x ∈ M mit einem R > 0,
besitzt die endliche offene Überdeckung {BR (0)}.
Satz 2.1: Eine Menge K ⊂ Rn ist genau dann kompakt, wenn sich aus jeder offenen
Überdeckung von K eine endliche Überdeckung von K auswählen lässt.
Insbesondere haben wir also die
Folgerung 2.1: Eine kompakte Menge K ⊂ Rn ist genau dann Nullmenge, wenn
K den Inhalt Null hat.
Beweis von Satz 2.1:
• ⇐“: Zunächst lasse sich aus jeder offenen Überdeckung von K eine endli”
che Überdeckung von K auswählen. Wir zeigen, dass dann K kompakt, also
abgeschlossen und beschränkt ist.
(a) Beschränktheit: Offenbar ist F = {BN (0) : N ∈ N} eine offene Überdeckung von K mit B1 (0) ⊂ B2 (0) ⊂ . . . Nach Voraussetzung existieren
Zahlen N1 < N2 < . . . < Np , p ∈ N, mit K ⊂ BN1 (0) ∪ . . . ∪ BNp (0) =
BNp (0), d.h. K ist beschränkt.
(b) Abgeschlossenheit: Angenommen, K ist nicht abgeschlossen, d.h. K 6= K.
Dann existiert also ein x0 ∈ K \ K und eine Folge {xk }k ⊂ K mit xk →
x0 (k → ∞).
Nun ist F = {ΩN : N ∈ N} mit ΩN := {x ∈ Rn : |x − x0 | > N1 }
eine offene Überdeckung von K mit Ω1 ⊂ Ω2 ⊂ . . . Nach Voraussetzung
existieren also wieder Zahlen N1 < . . . < Np , p ∈ N, mit K ⊂ ΩN1 ∪ . . . ∪
ΩNp = ΩNp . Für alle x ∈ K folgt also x ∈ ΩNp bzw. |x − x0 | > N1p , im
Widerspruch zu |xk − x0 | → 0 (k → ∞) mit der oben gewählten Folge
{xk }k ⊂ K. Also ist K doch abgeschlossen.
• ⇒“: Sei nun K ⊂ Rn kompakt. Angenommen, es gibt eine offene Überdeckung
”
F von K, aus der sich keine endliche Überdeckung auswählen lässt. Mittels
einer Würfelschachtelung führen wir dies zum Widerspruch.
(a) Da K beschränkt ist, existiert ein abgeschlossener Würfel W ⊂ Rn mit
K ⊂ W . Wir zerlegen W in N := 2n Teilwürfel W1∗ , . . . , WN∗ , indem
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
215
wir die Seiten halbieren, d.h. es gilt |Wj∗ | = 2−n |W |. Offenbar ist F
auch Überdeckung der Mengen Wj∗ ∩ K, und nach Annahme existiert
mindestens ein j1 ∈ {1, . . . , N }, so dass keine endliche Überdeckung von
Wj1 ∩ K aus F ausgewählt werden kann. Wir schreiben W1 := Wj∗1 .
(b) Nun zerlegen wir W1 in N = 2n Teilwürfel W1∗∗ , . . . , WN∗∗ , indem wir
wieder die Seiten halbieren. Dann gilt |Wj∗∗ | = 2−n |W1 | = 2−2n |W |. F
überdeckt wieder alle Wj∗∗ ∩ K und nach (a) existiert mindestens ein
j2 ∈ {1, . . . , N }, so dass Wj∗∗
∩ K nicht durch eine endliche Unterfamilie
2
von F überdeckt werden kann. Wir setzen dann W2 := Wj∗∗
.
2
(c) Fortsetzung des Verfahrens liefert eine Folge W1 ⊃ W2 ⊃ W3 ⊃ . . . mit
|Wl | = 2−ln |W | und folgender Eigenschaft:
Für alle l ∈ N ist F offene Überdeckung von Wl ∩ K, aus der keine endliche Überdeckung von Wl ∩ K ausgewählt werden kann.
(*)
Insbesondere gilt also liml→∞ |Wl | = 0 und damit auch
diam Wl → 0 (l → ∞).
(2.1)
Nun ist wegen (*) Wl ∩ K 6= ∅ für alle l ∈ N. Also existieren xl ∈ Wl ∩ K
und wegen (2.1) bildet {xl }l ⊂ K eine Cauchyfolge: Zu beliebigem ε > 0
existiert nämlich ein N (ε) ∈ N mit diam Wl < ε für alle l ≥ N (ε). Sind
dann k, l ≥ N (ε) gewählt und gilt o.B.d.A. k ≥ l, so folgt xk ∈ Wk ⊂ Wl
und damit
|xk − xl | ≤ diam Wl < ε für alle k, l ≥ N (ε).
Es existiert also ein x0 mit liml→∞ xl = x0 , und da K abgeschlossen ist,
gilt x0 ∈ K. Somit gibt es ein Ω ∈ F mit x0 ∈ Ω. Und da Ω offen ist,
finden wir ein % > 0 mit B% (x0 ) ⊂ Ω.
Schließlich existiert wegen (2.1) und liml→∞ xl = x0 ein l0 ∈ N mit Wl ⊂
B% (x0 ) für alle l ≥ l0 und damit insbesondere
Wl0 ∩ K ⊂ Ω ∈ F.
Also haben wir Wl0 ∩ K durch die endliche Teilüberdeckung {Ω} von F
überdeckt, im Widerspruch zu (*). Somit war die Annahme falsch, und
der Satz ist bewiesen.
q.e.d.
Bemerkung: Die Richtung ⇒“ in Satz 2.1 ist der berühmte Satz von Heine-Borel.
”
Die angegebene äquivalente Eigenschaft wird als Heine-Borel-Eigenschaft bezeichnet. Sie wird insbesondere in unendlich-dimensionalen Räumen als Definition für
Kompaktheit verwendet.
216
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Definition 2.3: Eine kompakte Menge K ⊂ Rn heißt dünn, wenn zu jedem x0 ∈
K eine Kugel Br (x0 ), eine kompakte Menge Z ⊂ Rn−1 und eine stetige Funktion
ϕ = ϕ(y) : Z → R mit y = (x1 , . . . , xj−1 , xj+1 , . . . , xn ) so existieren, dass gilt
©
ª
K ∩ Br (x0 ) = (x1 , . . . , xn ) ∈ Rn : xj = ϕ(y), y ∈ Z .
Eine dünne Menge im Rn ist also ein Kompaktum, das sich lokal als Graph
einer stetigen Funktion über einer der Hyperebenen {x ∈ Rn : xj = 0} darstellen
lässt. Z.B. ist nach Folgerung 6.1 aus Kap. 4 jede beschränkte (n − 1)-dimensionale
Mannigfaltigkeit der Klasse C 1 eine dünne Menge.
Folgerung 2.2: Eine dünne Menge K ⊂ Rn hat den Inhalt Null.
Beweis: Nach dem Satz von Heine-Borel können wir aus der Überdeckung {Br (x) :
x ∈ K} mit den in Definition 2.3 angegebenen Radien r = r(x) > 0 endlich viele
Kugeln Br1 (x1 ), . . . , Brp (xp ) auswählen, die K überdecken. Nach Hilfssatz 2.2 haben
K ∩ Brl (xl ) den Inhalt Null für alle l = 1, . . . , p. Und nach Hilfssatz 2.1 (i) gilt dies
auch für
p
[
©
ª
K⊂
K ∩ Brl (xl ) ,
l=1
wie behauptet.
q.e.d.
Bemerkungen:
1. Insbesondere hat also der Rand ∂Q jedes Quaders Q ⊂ Rn den Inhalt Null.
2. Durch nahezu wörtliches Übertragen des Beweises von Hilfssatz 2.2 sieht man,
dass auch m-dimensionale Graphen graph ϕ ⊂ Rn+m von Funktionen ϕ ∈
C 0 (K, Rm ) über Kompakta K ⊂ Rn den Inhalt Null haben (als Teilmengen
des Rn+m ). Folgerung 6.1 aus Kap. 4 und der Beweis von Folgerung 2.2 zeigen
dann:
Jede beschränkte C 1 -Mannigfaltigkeit hat den Inhalt Null.
Wie angekündigt, wollen wir nun die Unstetigkeitsstellen integrierbarer Funktionen f ∈ R(Q) untersuchen. Für eine beliebige Menge M ⊂ Q und eine beschränkte
Funktion f : Q → R erklären wir hierzu die Oszillation von f auf M gemäß
osc f := sup f − inf f = sup |f (x) − f (x0 )|
M
M
M
und setzen
³
σf (x) := lim
r→0+
x,x0 ∈M
´
osc f ,
Q∩Br (x)
x ∈ Q.
(2.2)
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
217
Wir bemerken, dass oscQ∩Br (x) f nichtnegativ und monoton wachsend in r ist, d.h.
σf : Q → R ist wohldefiniert und nichtnegativ. Ist ferner U = U (x) eine offene
Umgebung von x ∈ Q, so gilt Q ∩ Br (x) ⊂ Q ∩ U für hinreichend kleines r > 0 und
folglich
σf (x) ≤ osc f für alle x ∈ Q und U = U (x) ⊂ Rn .
(2.3)
Q∩U
Ist nun f in x ∈ Q stetig, so gilt offenbar σf (x) = 0. Und x ∈ Q heißt Unstetigkeitsstelle von f , falls σf (x) > 0 richtig ist. Wir schreiben
©
ª
S(f ) := x ∈ Q : σf (x) > 0
für die Menge aller Unstetigkeitsstellen und beginnen mit dem
Hilfssatz 2.3: Zu beschränktem f : Q → R erklären wir σf : Q → R wie in (2.2)
und setzen
©
ª
Q(ε) := x ∈ Q : σf (x) ≥ ε .
Dann ist S(f ) genau dann Nullmenge, wenn Q(ε) für alle ε > 0 den Inhalt Null hat.
Beweis:
• ⇒“: Ist S(f ) Nullmenge, so ist für jedes ε > 0 auch Q(ε) ⊂ S(f ) Nullmenge.
”
Da Q(ε) kompakt ist (Übungsaufgabe! ), hat Q(ε) nach Folgerung 2.1 für alle
ε > 0 den Inhalt Null.
• ⇐“: Gilt andererseits |Q(ε)| = 0 für alle ε > 0, so insbesondere auch |Q( k1 )| =
”
0 für k ∈ N. Nun gilt die Relation
³1´
Q
.
k
(2.4)
Nach Hilfssatz 2.1 (ii) ist damit S(f ) Nullmenge.
q.e.d.
S(f ) =
∞
[
k=1
Wir kommen nun zum zentralen
Satz 2.2: Eine beschränkte Funktion f : Q → R ist genau dann integrierbar, wenn
die Menge S(f ) ihrer Unstetigkeitsstellen eine Nullmenge ist.
Beweis:
• ⇒“: Es gelte f ∈ R(Q). Nach Satz 1.1 existiert dann zu jedem ε > 0 und
”
jedem k ∈ N eine Zerlegung Z von Q in Teilquader Qα , α ∈ A, mit
S Z (f ) − S Z (f ) <
ε
.
2k
218
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Wie in Hilfssatz 2.3 betrachten wir Q( k1 ) = {x ∈ Q : σf (x) ≥ k1 } mit der in
(2.2) erklärten Funktion σf : Q → R und setzen
n
³1´
o
A(k) := α ∈ A : Q̊α ∩ Q
6= ∅ .
k
Offenbar ist dann
¸ · [
¸
³1´ · [
⊂
Q̊α ∪
Q
∂Qα
k
(2.5)
α∈A
α∈A(k)
richtig. Für x ∈ Q̊α ∩ Q( k1 ) mit einem α ∈ A(k) gilt
(2.3)
1
≤ σf (x) ≤ osc f
Qα
k
und somit
X
¢
1 X
ε
(osc f |Qα | ≤ S Z (f ) − S Z (f ) <
|Qα | ≤
Qα
k
2k
α∈A(k)
α∈A(k)
bzw.
X
α∈A(k)
ε
|Qα | < .
2
(2.6)
Ferner haben wir oben bemerkt,
S dass |∂Qα | = 0 für jedes α ∈ A gilt und nach
Hilfssatz 2.1 (i) somit auch | α∈A ∂Qα | = 0. Also gibt es Quader Q01 , . . . , Q0p ,
p ∈ N, mit
p
p
[
[
X
ε
(2.7)
∂Qα ⊂
Q̊0j ,
|Q0j | < .
2
α∈A
j=1
j=1
Aus (2.5)-(2.7) erhalten wir nun
¸ ·[
¸
p
³1´ · [
Q
⊂
Q̊α ∪
Q̊0j ,
k
α∈A(k)
j=1
X
α∈A(k)
|Qα | +
p
X
|Q0j | < ε,
j=1
d.h. |Q( k1 )| = 0 für alle k ∈ N. Formel (2.4) und Hilfssatz 2.1 (ii) liefern also
meas S(f ) = 0.
• ⇐“: Sei nun S(f ) Nullmenge. Nach Hilfssatz 2.3 ist dann |Q(ε)|
Sp = 0 für
”
beliebiges ε > 0 richtig. Also existiert eine endliche
Überdeckung
j=1 Q̊j von
Pp
Q(ε) durch p ∈ N Quader mit Inhaltssumme j=1 |Qj | < ε.
Wir betrachten nun die kompakte Menge Q̂ := Q \ (Q̊1 ∪ . . . ∪ Q̊p ). Nach
Konstruktion gilt σf (x) < ε für jedes x ∈ Q̂. Also gibt es zu jedem x ∈ Q̂
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
219
einen Würfel Wx mit Mittelpunkt x, so dass oscQ∩Wx f < ε erfüllt ist. Nun
S
liefert x∈Q̂ W̊x eine offene Überdeckung von Q̂, aus der wir nach dem Satz
von Heine-Borel endlich viele Würfel Wx1 , . . . , Wxr mit W̊x1 ∪ . . . ∪ W̊xp ⊃ Q̂
auswählen können.
Insgesamt ist also erst recht Q1 , . . . , Qp , Wx1 , . . . , Wxr eine Überdeckung von
Q durch Quader. Wir ordnen nun eine Zerlegung Z von Q in Teilquader Q∗α ,
α ∈ A, so zu, dass die Indexmenge gemäß A = A0 ∪ A00 in zwei disjunkte
Teilmengen zerfällt, für die gilt:
•
S
α∈A0
Q∗α ⊂
p
S
j=1
Qj und folglich
P
α∈A0
|Q∗α | ≤
p
P
j=1
|Qj | < ε.
• Für jedes α ∈ A00 gilt Q∗α ⊂ Wxk ∩ Q mit einem k = k(α) ∈ {1, . . . , r}
und folglich osc
f < ε.
∗
Qα
Für die zu Z gehörigen Ober- und Untersummen erhalten wir dann:
S Z ∗ (f ) − S Z ∗ (f ) =
X ¡
X¡
¢ ∗
¢
osc
f
|Q
|
+
osc
f |Q∗α |
α
∗
∗
Qα
α∈A0
α∈A00
Qα
X
¡
¢X ∗
≤ 2 sup |f |
|Qα | + ε
|Q∗α |
Q
α∈A0
¡
¢
≤ ε 2 sup |f | + |Q| .
α∈A00
Q
Da ε > 0 beliebig gewählt war, ist also f nach Satz 1.1 integrierbar.
q.e.d.
Bemerkung: Wir können das Ergebnis von Satz 2.2 direkt auf vektor- bzw. komplexwertige Funktionen verallgemeinern. Ist etwa f : Q → Rd beschränkt, so gilt
f ∈ R(Q, Rd )
⇐⇒
Satz 2.2
⇐⇒
HS 2.1 (ii)
⇐⇒
f1 , . . . , fd ∈ R(Q)
meas S(f1 ) = . . . = meas S(fd ) = 0
meas S(f ) = 0,
wobei f = (f1 , . . . , fd ) in x ∈ Q genau dann unstetig ist, wenn mindestens eine der
d
S
S(fk ).
Komponenten fk in x unstetig ist, d.h. S(f ) =
k=1
220
3
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Integration über quadrierbare Mengen
Wir wollen nun allgemeinere Mengen M ⊂ Rn als Integrationsbereiche wählen, indem wir das Riemann-Integral auf charakteristische Funktionen“ χM spezialisieren:
”
Definition 3.1: Eine beschränkte Menge M ⊂ Rn heißt quadrierbar (oder Jordanmessbar), wenn ihre charakteristische Funktion
(
1, für x ∈ M,
: Rn → R
χM (x) :=
n
0, für x ∈ R \ M
auf einem Quader Q ⊂ Rn mit M ⊂ Q̊ integrierbar ist. Den Wert
Z
|M | := v(M ) := χM (x) dx
(3.1)
Q
nennen wir den (n-dimensionalen) Inhalt von M (oder Volumen oder Jordansches
Maß von M ).
Bemerkungen:
1. Obige Definition ist von der Wahl des Quaders Q ⊂ Rn mit M ⊂ Q̊ unabhängig.
2. Jeder Quader Q = [a1 , b1 ] × . . . × [an , bn ] ist quadrierbar mit
v(Q) =
n
Y
(bj − aj ) = |Q|.
j=1
Die ursprüngliche Definition des Inhalts eines Quaders stimmt also mit der in
(3.1) überein.
3. Jede Menge M vom Inhalt Null ist quadrierbar mit v(M ) = 0; auch hier
stimmt also v(M ) mit der ursprünglichen Definition von |M | überein.
Aus Satz 2.2 erhalten wir nun sofort den
Satz 3.1: (Quadrierbarkeitskriterium I)
Eine beschränkte Menge ist genau dann quadrierbar, wenn ihr Rand ∂M Nullmenge
ist (⇔ |∂M | = 0).
Beweis: Offenbar gilt S(χM ) = ∂M . Wählen wir also Q ⊂ Rn mit M ⊂ Q̊, so ist
χM nach Satz 2.2 genau dann auf Q integrierbar,wenn ∂M eine Nullmenge ist. Da
∂M kompakt ist, ist dies nach Folgerung 2.1 äquivalent zu |∂M | = 0.
q.e.d.
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
221
Folgerung 3.1: Sind M, N ⊂ Rn quadrierbar, so sind auch M ∪ N , M ∩ N und
M \ N quadrierbar.
Beweis: Offenbar sind M ∪ N , M ∩ N und M \ N beschränkt, da M, N beschränkt
sind. Und wegen
∂(M ∪ N ), ∂(M ∩ N ), ∂(M \ N ) ⊂ ∂M ∪ ∂N
folgt die Behauptung sofort aus Hilfssatz 2.1 (i) und Satz 3.1.
q.e.d
Satz 3.2: (Quadrierbarkeitskriterium II)
Ist M ⊂ Rn und ∂M eine dünne Menge im Sinne von Definition 2.3, so ist M
quadrierbar.
Beweis: Nach Folgerung 2.2 gilt |∂M | = 0 für die dünne Menge ∂M und nach Satz 3.1
ist M quadrierbar.
q.e.d.
Zum Beispiel ist also der Kreisring R(a, b) := {x ∈ Rn : a < |x| < b} mit
0 < a < b < +∞ eine quadrierbare Menge, da ∂R(a, b) aus den beiden disjunkten
(n − 1)-dimensionalen C 1 -Mannigfaltigkeiten ∂Ba (0), ∂Bb (0) besteht. Beachtet man
noch Folgerung 3.1 und die zweite Bemerkung im Anschluss an Folgerung 2.2, so ist
allgemeiner jeder Durchschnitt und jede (nicht notwendig disjunkte) Vereinigung
endlich vieler Mengen quadrierbar, deren Ränder C 1 -Mannigfaltigkeiten sind.
Sei nun M ⊂ Rn eine beliebige beschränkte Menge und f : M → Rd ebenfalls
beschränkt. Wir erklären die kanonische Fortsetzung f M : Rn → Rd von f gemäß
(
f (x), für x ∈ M
f M (x) :=
.
0,
für x ∈ Rn \ M
Die kanonische Fortsetzung der Funktion g(x) := 1, x ∈ M , ist also gerade die
charakteristische Funktion von M .
Definition 3.2: Sei M ⊂ Rn quadrierbar und f : M → Rd beschränkt. Dann
heißt f (Riemann)-integrierbar auf M , i.Z. f ∈ R(M, Rd ), wenn die kanonische
Fortsetzung f M auf einem Quader Q ⊂ Rn mit M ⊂ Q̊ integrierbar ist. Wir erklären
dann das (Riemannsche) Integral von f auf M gemäß
Z
Z
Z
Z
f dV = f dx1 . . . dxn = f dx := f M dx.
M
Bemerkungen:
M
M
Q
222
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
1. Die Definition ist wieder unabhängig von der Wahl des Quaders Q ⊂ Rn mit
M ⊂ Q̊.
2. Insbesondere ist die Funktion f (x) ≡ 1 nach obiger Definition auf jeder quadrierbaren Menge M integrierbar mit
Z
1 dx = |M |.
M
Satz 3.3: (Lebesguesches Integrabilitätskriterium)
Sei M ⊂ Rn quadrierbar und f : M → Rd beschränkt. Dann gilt
f ∈ R(M, Rd )
⇐⇒
meas S(f |M̊ ) = 0.
Beweis: Wir betrachten wieder die kanonische Fortsetzung f M : Rn → Rd , für deren
Unstetigkeitsstellen offenbar gilt
S(f |M̊ ) ⊂ S(f M ) ⊂ S(f |M̊ ) ∪ ∂M.
Ist Q ⊂ Rn ein Quader mit M ⊂ Q̊, so folgt
f ∈ R(M, Rd )
Def. 3.2
⇐⇒
Satz 2.2
⇐⇒
Satz 3.1
⇐⇒
f M ∈ R(Q, Rd )
S(f M ) ist Nullmenge
S(f |M̊ ) ist Nullmenge,
wie behauptet.
q.e.d.
Folgerung 3.2: Jede beschränkte Funktion f : M → Rd ∈ C 0 (M, Rd ) auf der
quadrierbaren Menge M ⊂ Rn ist integrierbar.
Durch Definition 3.2 lassen sich die Rechenregeln aus Satz 1.3 und der anschließenden Bemerkung übertragen:
Satz 3.4: (Rechenregeln) Sei M ⊂ Rn quadrierbar.
(i) Für f, g ∈ R(M, Rd ) und α, β ∈ R gilt αf + βg ∈ R(M, Rd ) und
Z
Z
Z
£
¤
αf (x) + βg(x) dx = α f (x) dx + β g(x) dx.
M
M
M
(ii) Für d = 1: Sind f, g ∈ R(M, R) =: R(M ) mit f ≤ g auf M gegeben, so folgt
Z
Z
f dx ≤ g dx.
M
M
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
223
(iii) Für jedes f ∈ R(M, Rd ) gilt auch |f | ∈ R(M ) und
¯Z
¯ Z
¯
¯
¯ f dx¯ ≤ |f | dx.
¯
¯
M
M
(iv) Gilt f, g ∈ R(M, Rd ), so folgt hf, gi ∈ R(M ) und
¯Z
¯
Z
¯
¯ ¡
¢
¯ hf, gi dx¯ ≤ sup |g|
|f | dx.
¯
¯
M
M
M
(v) Für d = 1: Gilt f, g ∈ R(M ) und |g| ≥ c > 0 auf M mit einer Konstante
c > 0, so folgt fg ∈ R(M ) und
¯Z
¯
Z
¯ f ¯ 1
¯
¯
¯ g dx¯ ≤ c |f | dx.
M
M
Beweis: Die Aussagen gelten nach Satz 1.3 für die kanonischen Fortsetzungen fM , gM ,
woraus die Behauptungen (i)-(iv) direkt folgen. Zum Beweis von (v) setzen wir
(
g(x), für x ∈ M
ĝ(x) :=
.
c,
für x ∈ Rn \ M
Dann gilt ĝ = g M + c(1 − χM ). Für beliebigen Quader Q ⊂ Rn mit M ⊂ Q̊ ist also
ĝ ∈ R(Q) nach Satz 1.3. Und da auch f M ∈ R(Q) und |ĝ| ≥ c auf Q gilt, folgt aus
Satz 1.3 (v):
³f ´
f
f
= M ∈ R(Q), d.h.
∈ R(M ).
g M
ĝ
g
Schließlich berechnen wir noch
¯Z
¯
¯
¯
¯Z ³ ´
¯Z
¯ f ¯
¯
¯
¯
¯
f
¯
¯
¯
¯ = ¯ f M dx¯
dx
=
dx
¯ g ¯
¯
¯
¯
¯
g M
ĝ
M
Q
Satz 1.3 (v)
≤
1
c
Z
|f M | dx
Q
wie behauptet.
Q
|f M |=|f |M
=
1
c
Z
|f | dx,
M
q.e.d.
Folgerung 3.3: Ist M ⊂ Rn quadrierbare Nullmenge, so ist jedes beschränkte f :
M → Rd integrierbar auf M und es gilt
Z
f dx = 0.
M
224
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkung: Insbesondere gilt dies für jede Menge vom Inhalt Null, da diese, wie
oben bemerkt, quadrierbar sind. Nach Satz 3.1 gilt die Aussage von Folgerung 3.3
dann für den Rand ∂M jeder quadrierbaren Menge M ⊂ Rn .
Beweis von Folgerung 3.3: Da M quadrierbar ist, ist ∂M und somit auch das Kompaktum M = M ∪ ∂M Nullmenge. Also gilt |M | = 0 nach Folgerung 2.1. Ferner
ist für beliebiges f : M → Rd die Menge S(f |M̊ ) ⊂ M Nullmenge. Also ist f nach
Satz 3.3 integrierbar und Satz 3.4 (iv) liefert:
¯Z
¯
Z
¯
¯ ¡
¢
¡
¢
¯ f dx¯ ≤ sup |f |
1 dx = sup |f | |M | = 0,
¯
¯
M
M
M
M
wie behauptet.
q.e.d.
Definition 3.3: Sei f : M → Rd auf einer Menge M ⊂ Rn erklärt und sei M 0 ⊂ M
quadrierbar. Dann heißt f auf M 0 integrierbar, i.Z. f ∈ R(M 0 , Rd ), wenn f |M 0 ∈
R(M 0 , Rd ) gilt, und wir setzen
Z
Z
f dx :=
f |M 0 dx.
M0
M0
Hilfssatz 3.1: Ist M ⊂ Rn quadrierbar, so gilt für jede quadrierbare Teilmenge
M0 ⊂ M:
R(M, Rd ) ⊂ R(M 0 , Rd ).
Beweis: Es sei Q ⊂ Rn mit M ⊂ Q̊ und damit auch M 0 ⊂ Q̊ gewählt. Wir bemerken
für die kanonischen Fortsetzungen von f ∈ R(M, Rd ) bez. M und M 0 :
f M 0 (x) = χM 0 (x)f M (x).
Wegen χM 0 ∈ R(Q) und f M ∈ R(Q, Rd ) gilt nach Satz 3.4 (iv) f M 0 ∈ R(Q, Rd )
bzw. f |M 0 ∈ R(M 0 , Rd ), wie behauptet.
q.e.d.
Hilfssatz 3.2: Seien M1 , M2 ⊂ Rn quadrierbar mit M1 ∩M2 = ∅, und eine Funktion
f : M1 ∪ M2 → Rd sei gegeben. Gilt dann f ∈ R(Mj , Rd ) für j = 1, 2, so folgt
f ∈ R(M1 ∪ M2 , Rd ) und
Z
Z
Z
f dx =
f dx +
f dx.
M1 ∪M2
M1
M2
Beweis: Nach Folgerung 3.1 ist M1 ∪M2 quadrierbar. Für die kanonische Fortsetzung
f M1 ∪M2 von f haben wir
f M1 ∪M2 = χM1 ∪M2 f M1 ∪M2 = χM1 f M1 ∪M2 + χM2 f M1 ∪M2 =: f1 + f2 .
(3.2)
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
225
Dann ist offenbar
fj := χMj f M1 ∪M2 = (f |Mj )M ,
j
j = 1, 2,
(3.3)
richtig, und nach Satz 3.4 folgt f ∈ R(M1 ∪ M2 ). Ist nun ein Quader Q ⊂ Rn mit
M ⊂ Q̊ gewählt, so liefert die Linearität des Integrals noch
Z
Z
f dx
f M1 ∪M2 dx
=
M1 ∪M2
(3.2)
=
Q
(3.3)
Z
f1 dx +
Q
Z
=
Z
Z
Q
Z
f |M1 dx +
M1
f2 dx
f |M2 dx =
M2
Z
f dx +
M1
wie behauptet.
f dx,
M2
q.e.d.
Bemerkung: Wendet man Hilfssatz 3.2 speziell auf charakteristische Funktionen an,
so erhält man verschiede Inhalts-Beziehungen zwischen quadrierbaren Mengen. Sind
z.B. M, N ⊂ Rn quadrierbar mit M ⊂ N , so folgt |M | ≤ |N | (→ Übungsaufgabe).
Folgerung 3.4: Sei M ⊂ Rn quadrierbar und für ein beschränktes f : M → Rd
gelte f (x) = 0 für alle x ∈ M \ E mit einer quadrierbaren Nullmenge E ⊂ M . Dann
folgt f ∈ R(M, Rd ) und
Z
f dx = 0.
M
Beweis: Nach Folgerung 3.1 ist M \ E quadrierbar. Gemäß Folgerung 3.3 ist f auf
E integrierbar. Und da f M \E ≡ 0 auf Rn gilt, ist f auch auf M \ E integrierbar.
Wegen M = M \ E ∪ E liefert Hilfssatz 3.2 also f ∈ R(M, Rd ) sowie
Z
Z
f dx =
M
Z
f dx +
f dx = 0 + 0 = 0,
E
M \E
wie behauptet.
q.e.d.
Hilfssatz 3.3: Sei M ⊂ Rn quadrierbar und f : M → Rd beschränkt. Dann ist
auch M̊ quadrierbar, und aus f ∈ R(M̊ , Rd ) folgt f ∈ R(M, Rd ) sowie
Z
Z
f dx =
M̊
f dx.
M
(3.4)
226
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkung: Dabei fassen wir die linke Seite in (3.4) für den Fall M̊ = ∅ als Null auf,
d.h.
Z
f dx := 0.
∅
Wegen M = M \ M̊ ⊂ ∂M ist dann nach Folgerung 3.3 (siehe auch die anschließende
Bemerkung) Relation (3.4) erfüllt.
Beweis von Hilfssatz 3.3: Sei also o.B.d.A. M̊ 6= ∅. Wegen
∂ M̊ = M̊ \ M̊ ⊂ M \ M̊ = ∂M
ist ∂ M̊ Nullmenge und M̊ somit quadrierbar nach Satz 3.1. Weiter gilt M = M̊ ∪(M \
M̊ ) mit der Menge M \ M̊ ⊂ ∂M vom Inhalt Null (vgl. Satz 3.1). Nach Folgerung 3.3
gilt also f ∈ R(M \ M̊ , Rd ) und
Z
f (x) dx = 0,
M \M̊
so dass Hilfssatz 3.2 liefert f ∈ R(M, Rd ) und
Z
Z
Z
Z
f dx =
f dx + f dx = f dx,
M
M̊
M̊
M \M̊
wie behauptet.
q.e.d.
Satz 3.5:S(Additivität des Integrals)
Sei M = pl=1 Ml mit quadrierbaren Mengen M1 , . . . , Mp ⊂ Rn , die M̊l ∩ M̊k = ∅
für l 6= k erfüllen. Ist dann f : M → Rd beschränkt und über M̊l integrierbar für
alle l = 1, . . . , p, so folgt f ∈ R(M, Rd ) und
Z
p Z
X
f dx =
f dx.
l=1 M
M
l
Beweis: Zunächst ist f nach Hilfssatz 3.2 über M̊1 ∪ . . . ∪ M̊p und nach Hilfssatz 3.3
auch über Ml integrierbar, und es gilt
Z
p Z
p Z
X
X
f dx =
f dx =
f dx.
(3.5)
l=1
M̊1 ∪...∪M̊p
M̊l
l=1 M
l
Ferner haben wir die Relation
M=
p
[
l=1
M̊l ∪ N
mit N ⊂
p
[
l=1
∂Ml ,
(3.6)
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
227
und nach Satz 3.1 ist N eine Menge vom Inhalt Null und damit quadrierbare Nullmenge. Nach Folgerung 3.3 ist also f ∈ R(N, Rd ) mit
Z
f (x) dx = 0
N
richtig, so dass Hilfssatz 3.2 und Formel (3.6) liefern f ∈ R(M, Rd ) und
Z
Z
f dx =
M
Z
f dx +
f dx =
N
M̊1 ∪...∪M̊p
(3.5)
p Z
X
f dx,
l=1 M
l
wie behauptet.
q.e.d.
Wir kommen nun zu einer Verallgemeinerung von Satz 1.6. Dazu benötigen wir
noch die
Definition 3.4: Eine Menge M ⊂ Rn heißt Normalbereich (bez. der xj -Achse),
wenn es eine quadrierbare, kompakte Menge K ⊂ Rn−1 und Funktionen ψ, χ : K →
R ∈ C 0 (K) mit ψ ≤ χ auf K so gibt, dass M die folgende Form hat:
©
ª
M = x ∈ Rn : y := (x1 , . . . , xj−1 , xj+1 , . . . , xn ) ∈ K, ψ(y) ≤ xj ≤ χ(y) . (3.7)
Bemerkung: Normalbereiche sind kompakt. Und nach Hilfssatz 2.2 hat ∂M den Inhalt Null, d.h. jeder Normalbereich ist quadrierbar.
Satz 3.6: (Cavalierisches Prinzip oder Satz von Fubini)
Es sei M ⊂ Rn Normalbereich der Form (3.7) und f ∈ C 0 (M, Rd ) sei gegeben. Dann
gilt
¶
Z
Z µ χ(y)
Z
f dxj dy.
f dx =
M
K
ψ(y)
Beweis: O.B.d.A. sei d = 1 und j = n. Nach Folgerung 3.1 ist f auf M integrierbar,
d.h. die kanonische Fortsetzung f M : Rn → Rd ist auf jedem Quader Q ⊂ Rn mit
M = M ⊂ Q̊ integrierbar. Ist Q ⊂ Rn−1 ein beliebiger Quader mit K = K ⊂ Q̊ und
I := [a, b] mit
−∞ < a < inf ψ ≤ sup χ < b < +∞
K
K
erklärt, so gilt dies insbesondere für Q := Q × I. Nach Satz 1.5 ist also
Z
Z
Z
Z
f dx = f M dx = ϕ(y) dy = ϕ(y) dy
M
Q
Q
Q
(3.8)
228
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
richtig, wobei wir noch
¡
¢
ϕ(y) := I I f M (y, ·) ,
¡
¢
ϕ(y) := I I f M (y, ·) ,
y ∈ Q,
gesetzt haben. Nun ist für jedes y ∈ K die Funktion f M (y, ·) : I → Rd stückweise
stetig und damit integrierbar nach Folgerung 4.2 aus Kap. 3. Der dortige Satz 4.6
zeigt noch
χ(y)
Z
Z
ϕ(y) = ϕ(y) =
f (y, xn ) dxn
f M (y, xn ) dxn =
I
für y ∈ K.
ψ(y)
Für y ∈ Q \ K gilt andererseits f M (y, xn ) ≡ 0 auf I, also
Z
ϕ(y) = ϕ(y) = f M (y, xn ) dxn = 0 für y ∈ Q \ K.
I
Einsetzen in (3.8) bringt somit
Z
Z
Z
ϕ(y) dy +
f dx =
M
K
¶
Z µ χ(y)
Z
ϕ(y) dy =
f dxn dy,
Q
Q\K
ψ(y)
wie behauptet.
q.e.d.
Beispiel: Gesucht ist |BR (0)| für die Kugel BR (0) ⊂ R3 mit Radius R > 0. Wir
können schreiben
p
p
©
ª
BR (0) = (x, y, z) : (x, y) ∈ KR (0), − R2 − x2 − y 2 ≤ z ≤ R2 − x2 − y 2
mit der abgeschlossen Kreisscheibe
©
ª
KR (0) := (x, y) : x2 + y 2 ≤ R2
p
p
ª
©
=
(x, y) : −R ≤ x ≤ R, − R2 − x2 ≤ y ≤ R2 − x2 .
Satz 3.6 zeigt also
Z
|BR (0)| = |BR (0)| =
= 2
KR (0)
√
R2Z−x2 −y 2
µ
1 dx dy dz =
BR (0)
Z p
Z
KR (0)
−
ZR µ
√
√
R2 −x2 −y 2
R
Z2 −x2
R2 − x2 − y 2 dx dy = 2
R
¶
1 dz dx dy
√
− R2 −x2
p
¶
R2 − x2 − y 2 dy dx.
4. DIE TRANSFORMATIONSFORMEL FÜR TESTFUNKTIONEN
229
Für beliebiges % > 0 gilt nun (substituiere y = % cos t, t ∈ [0, π]):
Z% p
i%
h %2
π%2
y yp 2
=
%2 − y 2 dy = −
arccos +
% − y2
.
2
% 2
2
−%
−%
Einsetzen mit % =
√
R2 − x2 liefert schließlich
ZR
|BR (0)| = π
h
x3 iR
4πR3
(R2 − x2 ) dx = π R2 x −
=
.
3 −R
3
−R
Bemerkung: Ist M ⊂ Rn darstellbar als Vereinigung M = M1 ∪ . . . ∪ Mp endlich
vieler Normalbereiche mit M̊l ∩ M̊k = ∅ für l 6= k, d.h. kann man M in p ∈ N
0
Normalbereiche
zerschneiden“, so kann man mit Satz 3.6 für
R
R jedes f ∈ C (M )
”
zunächst Ml f dx, l = 1, . . . , p, berechnen und anschließend M f dx mit Satz 3.5
bestimmen.
Zum Abschluss geben wir noch die Verallgemeinerung von Satz 5.6 aus Kap. 3
auf Funktionen mehrerer Veränderlicher an:
Satz 3.7: Sei M ⊂ Rn quadrierbar und die Folge fk : M → Rd ∈ R(M, Rd ), k ∈ N,
konvergiere gleichmäßig gegen eine Funktion f : M → Rd . Dann folgt f ∈ R(M, Rd )
und
µZ
¶
Z
Z ³
´
f (x) dx =
lim fk (x) dx = lim
fk (x) dx .
k→∞
M
M
k→∞
M
Beweis: Übungsaufgabe.
4
Die Transformationsformel für Testfunktionen
Wir wollen zunächst den Begriff Testfunktion“ erklären:
”
Definition 4.1:
• Ist M ⊂ Rn beliebig und f : M → Rd gegeben. Dann heißt die Menge
supp f := {x ∈ M : f (x) 6= 0}
der Träger oder Support von f .
• Ist Ω ⊂ Rn offen, so heißt M ⊂ Ω kompakt enthalten in Ω, i.Z. M ⊂⊂ Ω,
wenn M kompakt ist und M ⊂ Ω erfüllt.
230
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
• Ist Ω ⊂ Rn offen und s ∈ N0 ∪ {∞} beliebig, so bezeichnet
©
ª
Ccs (Ω, Rd ) := f ∈ C s (Ω, Rd ) : supp f ⊂⊂ Ω
die Menge der s-mal stetig differenzierbaren Funktionen mit kompaktem Träger in Ω. Ein solches f ∈ Ccs (Ω) nennen wir auch kurz Testfunktion.
Bemerkung: Wir können uns eine Funktion f ∈ Ccs (Ω, Rd ) immer auf ganz Rn erklärt
denken, indem wir f zu 0 auf Rn \ Ω fortsetzen. Dann ist offenbar f ∈ C s (Rn , Rd )
und supp f ⊂⊂ Ω richtig.
Ziel dieses Paragraphen ist der folgende
Satz 4.1: Seien Ω, Ω∗ ⊂ Rn offene, quadrierbare Mengen und φ = φ(x) : Ω → Rn
ein C 1 -Diffeomorphismus von Ω auf Ω∗ = φ(Ω). Dann gilt für beliebiges f ∈ Cc0 (Ω∗ )
die Identität
Z
Z
f (y) dy = f (φ(x))|Jφ (x)| dx.
(4.1)
Ω∗
Ω
Bemerkung: Satz 4.1 ist ein Spezialfall der allgemeinen Transformationsformel für
stetige Testfunktionen f ∈ Cc0 (Ω∗ ). Den allgemeinen Fall für offene, nicht notwendig
quadrierbare Mengen Ω, Ω∗ und f ∈ C 0 (Ω∗ ) werden wir in § 5 durch Approximation
erhalten.
Der Beweis von Satz 4.1 beruht auf zwei zentralen Ideen:
1. Lokalisierung.
2. Induktion über die Raumdimension.
Die Lokalisierung basiert auf dem folgenden wichtigen Werkzeug:
Definition 4.2: (Zerlegung der Eins)
Sei M ⊂ Rn nichtleer. Eine Zerlegung der Eins auf M ist eine Familie {ηα }α∈I
von Funktionen ηα ∈ Cc∞ (Rn ) mit höchstens abzählbarer Indexmenge I und den
folgenden Eigenschaften:
(i) Für alle α ∈ I gilt 0 ≤ ηα ≤ 1 auf Rn .
(ii) Für jedes x ∈ Rn existieren höchstens endlich viele α ∈ I mit ηα (x) 6= 0.
P
P
(iii) Es gilt
ηα (x) ≡ 1 für alle x ∈ M sowie 0 ≤
ηα ≤ 1 auf Rn .
α∈I
α∈I
Hilfssatz 4.1: Sei K ⊂ Rn kompakt und F = {Ox : x ∈ K} eine beliebige offene
Überdeckung. Dann gibt es eine endliche Zerlegung der Eins {ηα }α=1,...,p auf K mit
der zusätzlichen Eigenschaft ηα ∈ Cc∞ (Oxα ) für xα ∈ K, α = 1, . . . , p.
4. DIE TRANSFORMATIONSFORMEL FÜR TESTFUNKTIONEN
231
Beweis: Da Ox offen ist, existiert zu jedem x ∈ K ein r(x) ∈ (0, 1) mit
B(x) := Br(x) (x) ⊂⊂ Ox .
Ferner gibt es eine Kugel B := BR (0) mit
[
B(x) ⊂⊂ B.
x∈K
Und zu jedem x ∈ B \ K finden wir eine Kugel B(x) = Br(x) (x) ⊂ Rn \ K. Aus
der so gewonnen offenen Überdeckung F̂ := {B(x) : x ∈ B} der kompakten Kugel
B können wir nach dem Satz von Heine-Borel endlich viele Kugeln Bα := B(xα ),
α = 1, . . . , N , auswählen, die B überdecken. Diese sortieren wir so, dass
(
K,
für α = 1, . . . , p
xα ∈
B \ K, für α = p + 1, . . . , N
mit einem p < N richtig ist. Nach Konstruktion gilt dann Bα ∩ K = ∅ für α =
p + 1, . . . , N .
Mit dem Radius rα := r(xα ) > 0 der Kugel Bα setzen wir
¡
¢
ξα (x) := ψ rα2 − |x − xα |2 , x ∈ Rn ,
mit der Funktion
(
ψ(t) :=
1
e− t , für t > 0
∈ C ∞ (R).
0,
für t ≤ 0
Dann gilt ξα ∈ Cc∞ (Rn ) für alle α = 1, . . . , N und wir bemerken
ξα (x) > 0 ⇔ x ∈ Bα
für alle α = 1, . . . , N.
Insbesondere haben wir also supp ξα = Bα ⊂⊂ B ∩ Oxα für α = 1, . . . , p und ξα = 0
auf K für α = p + 1, . . . , N .
Schließlich setzen wir noch
ξ(x) :=
N
X
ξα (x),
x ∈ Rn ,
α=1
und beachten ξ > 0 auf B. Für
(
ξα (x)
ξ(x) , für x ∈ B
ηα (x) :=
∈ Cc∞ (Oxα ),
0,
für x ∈ Rn \ B
α = 1, . . . , p,
sind dann die Eigenschaften (i)-(iii) aus Definition 4.2 erfüllt.
q.e.d.
232
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Folgerung 4.1: Ist Ω ⊂ Rn offen und K ⊂ Ω kompakt, so existiert ein η ∈ Cc∞ (Ω)
mit η ≡ 1 auf K und η(Ω) ⊂ [0, 1].
Beweis: Zu jedem x ∈ K gibt es ein r(x) > 0 mit B(x) := Br(x) (x) ⊂ Ω. Nach
Hilfssatz 4.1 können wir zur Überdeckung F = {B(x) : x ∈ K} eine endliche
Zerlegung
der Eins {ηα }α=1,...,p mit ηα ∈ Cc∞ (B(xα )) finden. Folglich leistet η :=
Pp
α=1 ηα das Gewünschte.
q.e.d.
Hilfssatz 4.2: (Lokalisierung)
Es seien Ω, Ω∗ ⊂ Rn und φ = φ(x) : Ω → Rn wie in Satz 4.1. Dann gilt Formel (4.1)
genau dann für alle f ∈ Cc0 (Ω∗ ), wenn zu jedem y 0 ∈ Ω∗ ein % = %(y 0 ) > 0 mit
B% (y 0 ) ⊂ Ω∗ so existiert, dass Formel (4.1) für alle f ∈ Cc0 (B% (y 0 )) erfüllt ist.
Beweis:
• ⇒“: Klar, wegen Cc0 (B% (y 0 )) ⊂ Cc0 (Ω∗ ) für B% (y 0 ) ⊂ Ω∗ .
”
• ⇐“: Sei also f ∈ Cc0 (Ω∗ ) gewählt, d.h. K := supp f ⊂ Ω∗ ist kompakt. Dann
”
existiert nach Hilfssatz 4.1 eine endliche Zerlegung der Eins {ηα }α=1,...,p auf
K mit ηα ∈ Cc∞ (B%(xα ) (xα )) für α = 1, . . . , p, wobei %(xα ) > 0 wie in der
Voraussetzung gewählt seien. Es folgt nun mit gα := f ηα ∈ Cc0 (B%(xα ) (xα )):
Z
Z
f (y) dy −
Ω∗
f (φ(x))|Jφ (x)| dx
Ω
=
Z ·X
p
Ω∗
=
α=1
p µZ
X
α=1
¸
¸
Z ·X
p
ηα (y) f (y) dy −
ηα (φ(x)) f (φ(x))|Jφ (x)| dx
Ω∗
nach Voraussetzung.
Ω
Z
gα (y) dy −
α=1
¶
gα (φ(x))|Jφ (x)| dx = 0,
Ω
q.e.d.
Beweis von Satz 4.1: Wegen Hilfssatz 4.2 genügt es, die Aussage für f ∈ Cc0 (B% (y 0 ))
mit beliebigem y 0 ∈ Ω und geeignetem Radius % = %(y 0 ) > 0 mit B% (y 0 ) ⊂ Ω∗
zu zeigen. Wie schon angedeutet, benutzen wir eine vollständige Induktion über die
Raumdimension n ∈ N:
1. n = 1 : Zu y 0 ∈ Ω∗ ⊂ R wählen wir % > 0 mit [y 0 − %, y 0 + %] ⊂ Ω∗ . Setzen wir
a := φ−1 (y 0 − %), b := φ−1 (y 0 + %), so können wir o.B.d.A. a < b annehmen.
4. DIE TRANSFORMATIONSFORMEL FÜR TESTFUNKTIONEN
233
Dann folgt [a, b] ⊂ Ω und für beliebiges f ∈ Cc0 ((y 0 − %, y 0 + %)) berechnen wir
mit der Transformationsformel in einer Veränderlichen, Satz 5.5 in Kap. 3:
yZ0 +%
Z
f (y) dy
=
Ω∗
Zb
a
y 0 −%
φ0 >0
f (φ(x))φ0 (x) dx
f (y) dy =
Z
=
f (φ(x))|Jφ (x)| dx.
Ω
2. n → n + 1 :
(a) Wir fixieren wieder y 0 ∈ Ω∗ ⊂ Rn+1 und schreiben y = (τ, ζ) mit τ ∈ R,
ζ = (ζ1 , . . . , ζn ) ∈ Rn . Ferner schreiben wir
φ = φ(x) = (γ(x), ψ(x)) : Ω → Rn+1 ,
Ω ⊂ Rn+1 ,
wobei γ ∈ C 1 (Ω) die erste und ψ = (ψ1 , . . . , ψn ) ∈ C 1 (Ω, Rn ) die letzten
n Komponenten von φ bezeichnen.
Zu beliebigem y = (τ, ζ) ∈ Ω∗ betrachten wir nun
©
ª
Mζ := x ∈ Ω : ψ(x) − ζ = 0 .
Offenbar ist Mζ nicht leer, und wegen rg Dψ = n ist Mζ eine 1-dimensionale Mannigfaltigkeit der Klasse C 1 . In einer hinreichend kleinen Umgebung von x0 := φ−1 (y 0 ) ∈ Mζ 0 können wir also o.B.d.A. annehmen,
dass die Vektoren D2 ψ(x), . . . , Dn+1 ψ(x) linear unabhängig sind. Wir
schreiben x = (t, z) mit t ∈ R, z = (z1 , . . . , zn ) ∈ Rn . Nach Folgerung 6.1 aus Kap. 4 lässt sich dann Mζ lokal (um x0 ) als Graph über der
t-Achse schreiben. Wählen wir also r > 0 hinreichend klein und schreiben
W ⊂ Rn für den um ζ 0 zentrierten Würfel der Kantenlänge 2r, so gibt
es zu jedem ζ ∈ W eine Funktion g = g(t, ζ) : I → Rn ∈ C 1 (I, Rn ) mit
I := [t0 − r, t0 + r], so dass
Mζ ∩ U =
©¡
¢
ª
t, g(t, ζ) : t ∈ I
mit einer (von ζ unabhängigen) offenen Umgebung U = U (x0 ) ⊂ Ω gilt.
Man überlegt sich noch leicht, dass g auch glatt von ζ abhängt, d.h. g ∈
C 1 (I × W, Rn ) erfüllt ist.
(b) Wir erklären nun die Funktion
¡
¢
h(t, ζ) := t, g(t, ζ) ,
(t, ζ) ∈ I × W,
234
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
und setzen σ(t, ζ) := γ ◦h(t, ζ) ∈ C 1 (I ×W ). Dann gilt nach Konstruktion
¡
¢ ¡
¢
φ◦h(t, ζ) = γ ◦h(t, ζ), ψ(t, g(t, ζ)) = σ(t, ζ), ζ , (t, ζ) ∈ I ×W, (4.2)
und folglich
!
σt (t, ζ) 0
∇ζ σ(t, ζ) E
Ã
Dφ◦h (t, ζ) =
sowie
Jφ◦h (t, ζ) = σt (t, ζ),
(t, ζ) ∈ I × W.
(4.3)
Wir behaupten nun σt 6= 0 auf I × W . In der Tat gilt nach Konstruktion
ψ(t, g(t, ζ)) = ζ und folglich Dz ψ(h(t, ζ)) ◦ Dζ g(t, ζ) = E auf I × W . Also
muss
Jh (t, ζ) = det Dζ g(t, ζ) 6= 0, (t, ζ) ∈ I × W,
(4.4)
gelten, und wegen Jφ 6= 0 auf Ω folgt aus (4.3) und (4.4) die Behauptung
σt 6= 0 auf I × W . Wir können noch o.B.d.A. σt > 0 annehmen, also
|Jφ◦h (t, ζ)| = σt (t, ζ) > 0,
(t, ζ) ∈ I × W.
(4.5)
(c) Wegen (4.4) ist für fixiertes t ∈ I die Abbildung g(t, ·) : W → Rn ein C 1 Diffeomorphismus (Kantenlänge 2r > 0 von W hinreichend klein). Wir
setzen für das Bild
©
ª
Ω∗ (t) := z ∈ Rn : z = g(t, ζ), ζ ∈ W , t ∈ I,
und beachten
©
ª ©¡
¢
ª
V := (t, z) : t ∈ I, z ∈ Ω∗ (t) = t, g(t, ζ) : (t, ζ) ∈ I × W ⊂ Rn+1 .
Die Mengen Ω∗ (t) ⊂ Rn sind quadrierbar, da das Bild der quadrierbaren,
kompakten Menge W unter einem C 1 -Diffeomorphismus wieder quadrierbar ist (→ S. Hildebrandt: Analysis 2, Lemma 1 in § 5.2). Wir können nun
% > 0 so klein wählen, dass
φ−1 (B% (y 0 )) ⊂ V
bzw. B% (y 0 ) ⊂ φ(V )
(4.6)
erfüllt ist. Hierzu sei % ∈ (0, r] so klein, dass φ−1 (B% (y 0 )) ⊂ U gilt mit der
in (a) angegebenen Umgebung U = U (x0 ) ⊂ Ω and der Kantenlänge 2r
von W . Ist dann x ∈ φ−1 (B% (y 0 )) beliebig, so existiert also ein y ∈ B% (y 0 )
mit x = φ−1 (y) bzw. (τ, ζ) = y = φ(x) = (γ(x), ψ(x)). Insbesondere
haben wir also ζ = ψ(x) mit einem ζ ∈ B% (ζ 0 ) ⊂ W , d.h. x ∈ Mζ ∩U ⊂ V
nach (a). Wir bemerken noch, dass aus (4.2) folgt
©¡
¢
ª
B% (y 0 ) ⊂ φ(V ) = σ(t, ζ), ζ : (t, ζ) ∈ I × W
(4.7)
und dass σ(·, ζ) : I → R gemäß (b) für jedes feste ζ ∈ W ein Diffeomorphismus ist.
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
235
(d) Ist nun f ∈ Cc0 (B% (y 0 )) beliebig gewählt, so können wir mit der Induktionsvoraussetzung und der Substitutionsformel berechnen:
Z
f (φ(x))|Jφ (x)| dx
Ω
(4.6)
Z µ Z
¶
f (φ(t, z))|Jφ (t, z)| dz dt
=
I
(IV)
Ω∗ (t)
Z µZ
=
(4.2),(4.4)
I
W
I
W
Z µZ
=
(4.5)
=
¶
¡
¢
f σ(t, ζ), ζ |Jφ◦h (t, ζ)| dζ dt
¶
Z µ tZ0 +r
¡
¢
f σ(t, ζ), ζ σt (t, ζ) dt dζ
W
Subst.-formel
¶
¡
¢
f φ(t, g(t, ζ)) |Jφ (t, g(t, ζ))| | det Dζ g(t, ζ)| dζ dt
t0 −r
Z µ
0 +r,ζ)
σ(tZ
=
W
(4.7)
¶
f (τ, ζ) dτ
dζ
σ(t0 −r,ζ)
Z
=
f (y) dy,
Ω∗
wie behauptet.
5
q.e.d.
Uneigentliche Integrale und die allgemeine Transformationsformel
Durch einen Ausschöpfungsprozess erklären wir nun, ähnlich wie im Eindimensionalen, das uneigentliche Integral über beliebige offene, nicht notwendig beschränkte
Teilmengen Ω ⊂ Rn und beginnen mit der
Definition 5.1: Es seien Ω ⊂ Rn offen und Mj ⊂⊂ Ω, j ∈ N, gewählt. Dann
heißt {Mj }j∈N eine Ausshöpfung von Ω, wenn für jedes Kompaktum K ⊂ Ω ein
j0 = j0 (K) ∈ N existiert mit
K ⊂ Mj
für alle j ≥ j0 .
Wir schreiben dann Mj → Ω (j → ∞). Sind die Mengen Mj quadrierbar, so heißt
{Mj }j quadrierbare Ausschöpfung.
236
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Hilfssatz 5.1: Sind A, K ⊂ Rn nichtleer, A abgeschlossen, K kompakt und gilt
A ∩ K = ∅. Dann folgt für die Distanz zwischen A und K:
©
ª
dist (A, K) := inf |x − y| : x ∈ A, y ∈ K > 0.
Beweis: Wäre dist (A, K) = 0, so existierten Folgen {xl }l ⊂ A und {yl }l ⊂ K mit
|xl − yl | <
1
l
für l ∈ N.
(5.1)
Da K kompakt ist, können wir nach Satz 10.8 aus Kap. 1 eine konvergente Teilfolge {ylk }k auswählen mit ξ := limk→∞ ylk ∈ K. Aus (5.1) folgt dann auch xlk →
ξ (k → ∞), d.h. ξ ist Häufungspunkt der abgschlossenen Menge A, also ξ ∈ A ∩ K,
Widerspruch!
q.e.d.
Hilfssatz 5.2: (Ausschöpfungslemma)
Zu jeder offenen Menge Ω ⊂ Rn existiert eine quadrierbare Ausschöpfung {Mj }j
von Ω.
Beweis: Zu jedem j ∈ N betrachten wir eine äquidistante Zerlegung Zj des Würfels
Wj := [−j, j] × . . . × [−j, j] ⊂ Rn in Teilwürfel Wjα , α ∈ Aj , mit diam Wjα ≤ 1j für
alle α ∈ Aj . Die Mengen
[
Mj :=
Wjα , j ∈ N,
α∈Aj :Wjα ⊂Ω
sind dann kompakte quadrierbare Mengen mit Mj = M j ⊂ Ω.
Ist K ⊂ Ω eine beliebige kompakte Teilmenge, so existiert ein j1 = j1 (K) ∈ N
mit K ⊂ Wj für alle j ≥ j1 . Nach Hilfssatz 5.1 gilt weiter
d := dist(Rn \ Ω, K) > 0.
Wählen wir j0 ≥ j1 mit
1
j0
< d, so folgt
diam Wjα ≤
1
< d für alle j ≥ j0 , α ∈ Aj .
j
Ist nun x ∈ K beliebig gewählt, so existiert zu jedem j ≥ j0 ein α ∈ Aj mit x ∈ Wjα .
Für alle y ∈ Wjα folgt dann |y−x| < d, also y ∈ Ω, d.h. Wjα ⊂ Ω. Folglich ist x ∈ Mj ,
d.h. K ⊂ Mj für alle j ≥ j0 , wie behauptet.
q.e.d.
Definition 5.2: Sei Ω ⊂ Rn offen und f ∈ C 0 (Ω, RdR) gegeben. Wenn dann für jede
quadrierbare Ausschöpfung {Mj }j von Ω die Folge Mj f dx konvergiert, so setzen
wir
Z
Z
f (x) dx := lim
f (x) dx
(5.2)
Ω
j→∞
Mj
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
237
für das uneigentliche Integral von f über
R Ω. Wir sagen dann auch, f ist integrierbar
über Ω oder das uneigentliche Integral Ω f dx existiert bzw. konvergiert.
Bemerkungen:
1. Die Definition des uneigentlichen Integrals in (5.2) ist unabhängig von der
gewählten Ausschöpfung {Mj }j . Ist nämlich {Mj0 }j eine weitere quadrierbare Ausschöpfung von Ω, so ist offenbar auch die gemischte Folge {M̃j }j :=
{M1 , M10 , M2 , MR20 , . . .} quadrierbare Ausschöpfung von Ω. Also existiert der
Grenzwert lim M̃j f dx und es gilt insbesondere
j→∞
Z
lim
j→∞
Mj
Z
f (x) dx = lim
j→∞
M̃j
Z
f (x) dx = lim
j→∞
Mj0
f (x) dx.
2. Falls Ω selbst quadrierbar und f : Ω → Rd beschränkt ist, so stimmtRdas in
(5.2) erklärte uneigentliche Integral mit dem Riemannschen Integral Ω f dx
aus Definition 3.2 überein. Man kann dann nämlich zu vorgegebenem ε > 0
ein quadrierbares Kompaktum K ⊂ Ω so konstruieren, dass |Ω \ K| < ε gilt
(→ Übungsaufgabe). Für eine quadrierbare Ausschöpfung folgt dann Mj ⊃ K
und folglich |Ω \ Mj | ≤ |Ω \ K| < ε für j ≥ j0 (ε). Dies liefert
¯Z
¯
¯ Z
¯
Z
¯
¯ HS 3.2 ¯
¯ ¡
¢
¡
¢
¯ f dx − f dx¯ = ¯
f dx¯¯ ≤ sup |f | |Ω \ Mj | = sup |f | ε
¯
¯
¯
Ω
Mj
Ω
Ω\Mj
Ω
für j ≥ j0 (ε).
R
Definition 5.3: Das uneigentliche Integral R Ω f dx einer Funktion f ∈ C 0 (Ω, Rd )
heißt absolut
R konvergent, wenn das Integral Ω |f (x)| dx konvergiert. Wir schreiben
dann auch Ω |f (x)| dx < +∞
R
Hilfssatz 5.3: Falls das uneigentliche Integral Ω f dx absolut konvergiert, so konvergiert es auch im gewöhnlichen Sinn.
Beweis: Ist {M̃j }j eine beliebige quadrierbare Ausschöpfung von Ω, so setzen wir
Mj :=
j
[
M̃k ,
j ∈ N.
k=1
DannR ist auch {Mj }j quadrierbare Ausschöpfung und es gilt M1 ⊂ M2 ⊂ M3 ⊂ . . ..
Da { Mj |f | dx}j nach Voraussetzung konvergiert, existiert zu jedem ε > 0 ein N =
N (ε) mit
¯
¯Z
Z
¯
¯
¯ |f | dx −
|f | dx¯¯ < ε für alle j, k ≥ N.
¯
Mj
Mk
238
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Ist o.B.d.A. j ≥ k, so folgt daraus
¯Z
¯
¯ Z
Z
¯
¯ HS 3.2 ¯
¯
¯
¯ f dx −
f
dx
=
¯
¯
¯
Mj
Mk
Mj \Mk
HS 3.2
=
R
Mj
Z
|f | dx
Mj \Mk
¯Z
¯
Z
¯
¯
¯ |f | dx −
¯ < ε für j, k ≥ N,
|f
|
dx
¯
¯
Mj
d.h. auch {
¯
¯
f dx¯¯ ≤
Mk
f dx}j ist Cauchyfolge, also konvergent.
q.e.d.
Hilfssatz 5.4: (Charakterisierung
absoluter Konvergenz)
R
0
d
Für beliebiges f ∈ C (Ω, R ) ist Ω f dx genau dann absolut konvergent, wenn eine
Konstante c ∈ [0, +∞) so existiert, dass gilt
Z
|f (x)| dx ≤ c für alle quadrierbaren M ⊂⊂ Ω.
(5.3)
M
Beweis:
R
R
• ⇒“: Sei Ω |f | dx konvergent, so setzen wir c := Ω |f | dx. Ist dann M ⊂⊂ Ω
”
quadrierbar und {Mj }j quadrierbare Ausschöpfung von Ω, so folgt M ⊂ M ⊂
Mj für alle j ≥ j0 (M ) und folglich
Z
Z
|f | dx ≤
|f | dx für alle j ≥ j0 .
M
Mj
Grenzübergang j → ∞ liefert (5.3).
• ⇐“: Ist andererseits (5.3) erfüllt, so gilt dies insbesondere für die Elemente
”
Mj ⊂⊂ Ω einer Ausschöpfung {M
R j }j von Ω mit M1 ⊂ M2 ⊂ . . . (siehe Beweis
von Hilfssatz 5.3). Die Folge { Mj |f | dx}j ist dann monoton wachsend und
nach oben durch c beschränkt, also auch konvergent.
q.e.d.
Bemerkung: Man kann nun die meisten Rechenregeln aus Satz 3.4 leicht auf
R uneigentliche Integrale
übertragen, soweit letztere existieren. Aber Vorsicht: Mit RΩ f dx
R
muss nicht Ω |f | dx existieren, so dass Satz 3.4 (iii) nur dann richtig ist, wenn Ω f dx
absolut konvergiert. Entsprechendes gilt für die Abschätzungen in (iv) und (v).
Haben wir eine Folge fj : Ω → Rd stetiger Funktionen, für die das uneigentliche Integral über Ω existiert, so fragen wir wieder nach der Vertauschbarkeit von
Grenzwertbildung und Integration. Der dafür angemessene Konvergenzbegriff ist der
folgende:
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
239
Definition 5.4: Eine Folge fj : Ω → Rd ∈ C 0 (Ω, Rd ), j = 1, 2, . . ., heißt kompakt gleichmäßig konvergent, wenn für jede kompakte Teilmenge K ⊂ Ω die Einschränkungen {fj |K }j gleichmäßig konvergieren.
Bemerkung: Insbesondere existiert dann eine Grenzfunktion f (x) := limj→∞ fj (x),
x ∈ Ω, und nach dem Weierstraßschen Konvergenzsatz gilt f ∈ C 0 (Ω, Rd ).
Satz 5.1: Seien Ω ⊂ Rn offen und fj ∈ C 0 (Ω, Rd ), j = 1, 2, . . ., kompakt gleichmäßig konvergent gegen f ∈ C 0 (Ω, Rd ). Weiter existiere Reine integrable Majorante für
{fj }j , d.h. es gibt ein nichtnegatives F ∈ C 0 (Ω) mit Ω F dx < +∞, so dass gilt
|fj (x)| ≤ F (x)
für alle x ∈ Ω und j ∈ N.
(5.4)
R
RDann existieren auch die uneigentlichen Integrale Ω fj dx für j = 1, 2, . . . und
Ω f dx, und es gilt
µZ
¶
Z
Z ³
´
f (x) dx =
lim fj (x) dx = lim
fj (x) dx .
(5.5)
j→∞
Ω
j→∞
Ω
Ω
Beweis: Zunächst existiert nach Hilfssatz 5.4 und Formel (5.4) ein c ∈ [0, +∞), so
dass für beliebiges quadrierbares M ⊂⊂ Ω gilt
Z
Z
|fj (x)| dx ≤ F (x) dx ≤ c.
M
M
R
Wieder
R nach Hilfssatz 5.4 sind also Ω |fj | dx existent und nach Hilfssatz 5.3 erst
recht Ω fj dx. Ferner
entnehmen
R
R wir (5.4) auch |f | ≤ F auf Ω, so dass aus dem
gleichen Grund Ω |f | dx und Ω f dx existieren. Nun wählen wir zu vorgegebenem
ε > 0 ein Element M ⊂⊂ Ω einer quadrierbaren Ausschöpfung so groß, dass gilt
¯ Z
¯ ¯Z
¯
Z
¯
¯ ¯
¯
¯
¯
¯
¯ < ε.
F
(x)
dx
=
F
(x)
dx
−
F
(x)
dx
¯
¯ ¯
¯
Ω
Ω\M
M
(Man übertrage hierzu Hilfssatz 3.2 auf uneigentliche Integrale!) Dann folgt aus der
Monotonie des Integrals auch
Z
Z
|f (x)| dx < ε.
(5.6)
|fj (x)| dx < ε für j = 1, 2, . . . ,
Ω\M
Ω\M
Da andererseits fj →
→ f auf M gilt, entnehmen wir Satz 3.7:
¯
¯Z
Z
¯
¯
¯ fj (x) dx − f (x) dx¯ < ε für alle j ≥ j0 (ε).
¯
¯
M
M
(5.7)
240
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Kombination von (5.6) und (5.7) liefert nun
¯Z
¯
¯Z
¯
Z
Z
Z
¯
¯
¯
¯
¯ fj dx − f dx¯ ≤
|fj | dx +
|f | dx + ¯¯ (fj − f ) dx¯¯ < 3ε
¯
¯
Ω
Ω
Ω\M
M
Ω\M
für j ≥ j0 (ε), also die behauptete Relation (5.5).
q.e.d.
Wir wollen nun die allgemeine Transformationsformel beweisen. Zur Vorbereitung benötigen wir noch den einfachen
Hilfssatz 5.5: Zu jeder offenen Menge Ω ⊂ Rn und f ∈ Cc0 (Ω) existiert eine
R qua0
drierbare offene Menge Θ ⊂ Ω mit f ∈ Cc (Θ). Das uneigentliche Integral Ω f dx
existiert, und es gilt
Z
Z
f dx =
Ω
f dx.
Θ
Bemerkung: Die Transformationsformel für Testfunktionen, Satz 4.1, gilt also für
beliebige offene, nicht notwendig quadrierbare Mengen Ω, Ω∗ ⊂ Rn .
Beweis von Hilfssatz 5.5: Wir setzen K := supp f ⊂⊂ Ω. Dann existiert ein Kompaktum K 0 ⊂ Ω mit K ⊂ K̊ 0 (man verwende den Satz von Heine-Borel). Sei
nun M ⊂⊂ Ω ein Element einer nach Hilfssatz 5.2 existierenden, quadrierbaren
Ausschöpfung von Ω mit M ⊃ K 0 . Wir setzen Θ := M̊ . Nach Hilfssatz 3.3 ist Θ quadrierbar und wir haben nach Konstruktion Θ ⊃ K̊ 0 ⊃ K = supp f , d.h. f ∈ Cc0 (Θ).
Ist schließlich {Mj }j eine beliebige quadrierbare Ausschöpfung von Ω, so existiert
ein j0 = j0 (Θ) mit Θ ⊂ Θ ⊂ Mj für alle j ≥ j0 . Es folgt
Z
Z
Z
Z
f dx =
f dx + f dx = f dx für j ≥ j0 ,
R
d.h. {
es gilt
Mj
Mj
Θ
Mj \Θ
Θ
f dx}j konvergiert für beliebige quadrierbare Ausschöpfungen {Mj }j , und
Z
Ω
Z
Z
f dx := lim
j→∞
Mj
f dx =
f dx,
Θ
wie behauptet.
q.e.d.
Unser wichtigstes Ergebnis dieses Kapitels ist nun der folgende
Satz 5.2: (Transformationsformel)
n
1
Es seien Ω, Ω∗ ⊂ Rn offene Mengen und φ = φ(x) : Ω →
R R ein C -Diffeomorphis∗
0
∗
mus von Ω auf Ω = φ(Ω). Ist dann f ∈ C (Ω ) mit Ω∗ |f | dy < +∞ gewählt, so
gilt
Z
Z
f (y) dy =
Ω∗
f (φ(x))|Jφ (x)| dx.
Ω
(5.8)
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
241
Bemerkungen:
1. Wir erinnern daran, dass φ ∈ C 1 (Ω, Rn ) genau dann C 1 -Diffeomorphismus ist,
wenn φ bijektiv auf sein Bild ist und Jφ 6= 0 auf Ω gilt (Folgerung 1.1 und
Satz 5.2 aus Kap. 4).
2. Durch komponentenweise Betrachtung überträgt sich (5.8) offenbar sofort auf
komplex- bzw. vektorwertige Funktionen f .
R
3. Es genügt (5.8) für f ∈ C 0 (Ω∗ ) mit f ≥ 0 in Ω∗ und Ω∗ f dy < +∞ zu zeigen.
Hierzu zerlegen wir ein beliebiges, nicht notwendig nichtnegatives f gemäß
1
mit f ± := (|f | ± f )
2
+
in seinen Positivanteil f und seinen Negativanteil f − . Dann folgt offenbar
f ± ≥ 0 und |f | = f + + f − auf Ω∗ . Gilt also (5.8) für f + und f − , so aufgrund
der Linearität des Integrals auch für f .
f = f+ − f−
Beweis von Satz 5.2: Sei also o.B.d.A. f ≥ 0 in Ω∗ . Ist {Mj }j eine quadrierbare
Ausschöpfung von Ω, so zeigt man leicht, dass dann {Mj∗ }j mit Mj∗ := φ(Mj ) die
offene Menge Ω∗ = φ(Ω) ausschöpft (→ Übungsaufgabe) und auch Mj∗ quadrierbar
sind (→ S. Hildebrandt: Analysis 2, Lemma 1 in § 5.2). Zu jedem Mj∗ ⊂⊂ Ω∗ existiert
nach Folgerung 4.1 eine Funktion ηj∗ ∈ Cc∞ (Ω∗ ) mit ηj∗ ≡ 1 auf Mj∗ und ηj∗ (Ω∗ ) ⊂
[0, 1]. Folglich gilt auch ηj := ηj∗ ◦ φ : Ω → R ∈ Cc1 (Ω), ηj ≡ 1 auf Mj und ηj (Ω) ⊂
[0, 1].
Wir betrachten nun die Funktionen fj := f ηj∗ : Ω∗ → R ∈ Cc0 (Ω∗ ). Nach Satz 4.1
und Hilfssatz 5.5 gilt dann die Transformationsformel
Z
Z
fj (y) dy = fj (φ(x))|Jφ (x)| dx.
(5.9)
Ω∗
Ω
Ferner konvergiert
{fj }j kompakt gleichmäßig gegen f auf Ω∗ , und es gilt 0 ≤ fj ≤ f
R
∗
auf Ω sowie Ω∗ f dy < +∞. Satz 5.1 liefert also
Z
Z
lim
fj (y) dy = f (y) dy.
(5.10)
j→∞
Ω∗
Ω∗
Andererseits konvergiert auch {(fj ◦ φ)|Jφ |}j kompakt gleichmäßig gegen (f ◦ φ)|Jφ |
auf Ω. Und für beliebiges quadrierbares M ⊂⊂ Ω existiert ein j0 ∈ N mit Mj ⊃ M
für alle j ≥ j0 , so dass für solch ein j folgt
Z
Z
fj =f ηj
0 ≤
f (φ(x))|Jφ (x)| dx =
fj (φ(x))|Jφ (x)| dx
M
M
Z
≤
fj (φ(x))|Jφ (x)| dx
Ω
(5.9)
Z
=
Z
fj (y) dy ≤
Ω∗
f (y) dy =: c < +∞.
Ω∗
242
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
R
Die Konstante c = Ω∗ f dy ist unabhängig
von der Wahl von M , so dass nach
R
Hilfssatz 5.4 das uneigentliche Integral M (f ◦ φ)|Jφ | dx existiert. Wiederum nach
Satz 5.1 haben wir also
Z
Z
lim
fj (φ(x))|Jφ (x)| dx = f (φ(x))|Jφ (x)| dx.
(5.11)
j→∞
Ω
Ω
Kombination von (5.9), (5.10) und (5.11) liefert die behauptete Formel (5.8).
q.e.d.
Beispiele:
R
1. Polarkoordinaten: Es sei f ∈ C 0 (KR ) mit KR |f | dy < +∞ auf der Kreisscheibe KR := {y ∈ R2 : |y| < R} gegeben. Dann gilt
ZR µ Z2π
Z
f (y) dy =
f (r cos θ, r sin θ)r dθ dr.
0
KR
¶
(5.12)
0
In der Tat ist die Abbildung φ = φ(r, θ) := (r cos θ, r sin θ) ein C 1 -Diffeomorphismus von der offenen Menge Ω := (0, R) × (0, 2π) auf die offene Menge
Ω∗ = φ(Ω) = {y = (y1 , y2 ) : 0 < |y| < R, y 6= (a, 0) mit a ≥ 0} = KR \ [0, R),
für den gilt Jφ (r, θ) = r. Die Transformationsformel (5.8) liefert also
ZR µ Z2π
Z
f (y) dy =
f (r cos θ, r sin θ)r dθ dr.
0
KR \[0,R)
¶
0
Und da [0, R) := [0, R)×{0} ⊂ R2 für jedes
R > 0 eine quadrierbare Nullmenge
R
ist, existiert nach Folgerung 3.3 auch [0,R) f dy = 0, so dass (5.12) folgt.
Ist speziell f radialsymmetrisch, d.h. f (y) = g(|y|) mit einem g = g(r) ∈
C 0 ([0, R)), so folgt aus (5.12):
ZR µ Z2π
Z
f (y) dy =
g(r)r dr = 2π
0
KR
ZR
0
g(r)r dr.
(5.13)
0
Noch spezieller, für f ≡ 1 auf KR , erhalten wir somit
Z
|KR | =
ZR
r dr = πR2 .
1 dx = 2π
KR
0
Allgemein gilt: Quadrierbare Nullmengen (insbesondere also Mengen vom Inhalt Null) können bei der Integration ignoriert“ werden.
”
6. ANHANG: VERWENDETES UND WEITERFÜHRENDES
243
2. Gaußsches Fehlerintegral: Wir wollen zeigen
+∞
Z
√
2
e−x dx = π.
(5.14)
−∞
In Kap. 3, § 6 haben wir bereits gesehen dass dieses Gaußsche Fehlerintegral
existiert. Zur Berechnung setzen wir WR := [−R, R] × [−R, R] für beliebiges
R > 0 und beachten
Z
e
−(y12 +y22 )
dy1 dy2
Satz 1.6
· ZR
=
WR
e
−x2
¸2
dx
HS 5.4
≤ c < +∞
(5.15)
−R
mit einer von R > 0 unabhängigen Konstanten c ∈ [0, +∞). Ist M ⊂⊂ R2 quadrierbar, so existiert ein R > 0 mit M ⊂ WR , so dass (5.15) und Hilfssatz 5.4
liefern
Z
Z
e
−(y12 +y22 )
dy1 dy2 = lim
j→∞
Wj
R2
e
−(y12 +y22 )
+∞
·Z
¸2
−x2
dy1 dy2 =
e
dx < +∞.
−∞
(5.16)
Nun ist auch {Kj }j mit den Kreisscheiben Kj = {y = (y1 , y2 ) : |y| < j} eine
quadrierbare Ausschöpfung von R2 . Formeln (5.13) und (5.16) liefert also
+∞
·
¸1
·Z
¸1
Z
Z
2
2
−(y12 +y22 )
−x2
−(y12 +y22 )
=
lim
e
dy1 dy2
e
dx =
e
dy1 dy2
−∞
j→∞
Kj
R2
·
=
¸1
Zj
π lim
e
j→∞
−r2
(2r) dr
0
2
·
¸1
Zj
2
√
d −r2
= π − lim
(e ) dr
j→∞
dr
i1
¡
√ h
√
2¢ 2
=
π lim 1 − e−j
= π.
0
j→∞
6
Anhang: Verwendetes und Weiterführendes
(A1) Jede Menge M ⊂ Rn mit Inhalt Null ist quadrierbar, und es gilt
Z
v(M ) := χM (x) dx = 0.
M
244
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Denn: Zu beliebigem M ⊂ Rn mit Inhalt Null existieren für jedes ε > 0 Quader
Q1 , . . . , Qp , p = p(ε) ∈ N, mit
M ⊂ Q̊1 ∪ . . . ∪ Q̊p ,
p
X
|Qj | < ε.
j=1
Wir wählen Q ⊂ Rn mit Q1 ∪ . . . ∪ Qp ⊂ Q̊. Dann wählen wir eine Zerlegung
Z von Q in Teilquader Qα , α ∈ A, deren Zerlegungskanten alle Kanten der Qj
enthalten. Die Menge A der Indizes zerfällt dann gemäß A = A0 ∪ A00 in zwei
disjunkte Teilmengen A0 , A00 mit folgenden Eigenschaften
•
S
α∈A0
Qα =
p
S
j=1
P
Qj und folglich
α∈A0
|Qα | ≤
p
P
j=1
|Qj |.
• Qα ∩ M = ∅ für alle α ∈ A00 .
Für die Oszillation von χM ergibt sich daraus
(
≤ 1, für α ∈ A0
osc χM
.
Qα
= 0, für α ∈ A00
Folglich finden wir
X¡
X¡
¢
¢
oscQα χM |Qα | +
oscQα χM |Qα |
S Z (χM ) − S Z (χM ) =
α∈A0
X
≤
α∈A0
|Qα | ≤
α∈A0
p
X
|Qj | < ε.
j=1
Somit ist χM integrabel über Q, d.h. M ist quadrierbar. Außerdem haben wir
0 ≤ S Z (χM ) =
X¡
α∈A0
p
X
¢
sup χM |Qα | ≤
|Qj | < ε.
Qα
j=1
Wählen wir noch eine ausgezeichnete Zerlegungsfolge {Zp }p und setzen Zp0 :=
Zp ∨ Z, so ist auch {Zp0 }p ausgezeichnete Zerlegungsfolge. Nach Hilfssatz 1.1 (i)
gilt somit
0 ≤ S Zp0 (χM ) ≤ S Z (χM ) < ε,
also nach Grenzübergang p → ∞:
Z
0 ≤ lim S Zp0 (χM ) =
χM dx < ε.
p→∞
Q
Da ε > 0 beliebig war, haben wir die Behauptung.
6. ANHANG: VERWENDETES UND WEITERFÜHRENDES
245
(A2) Wenn M ⊂ Rn Nullmenge ist, so folgt M̊ = ∅.
Denn: Wie in der Vorlesung bemerkt, ist jeder Quader Q = [a1 , b1 ] × . . . ×
[an , bn ] ⊂ Rn quadrierbar mit
v(Q) = |Q| =
n
Y
(bj − aj ).
j=1
Wäre nun M̊ 6= ∅, so existierte ein Würfel Wx ⊂ M̊ zentriert um x mit
Kantenlänge ε > 0. Für das Volumen von Wx gilt dann aber v(Wx ) = εn > 0.
Nach (A1) ist also Wx keine Menge mit Inhalt Null und, da kompakt, auch
keine Nullmenge, im Widerspruch zu Wx ⊂ M̊ ⊂ M .
(A3) Sind M ⊂ Rm , N ⊂ Rn quadrierbar, so ist auch M × N ⊂ Rm+n quadrierbar.
Denn: Man überlegt sich leicht (M × N )c = (M c × Rn ) ∪ (Rm × N c ), woraus
folgt
∂(M × N ) = (∂M × N ) ∪ (M × ∂N ).
Wir zeigen nun, dass |∂(M × N )| = 0 gilt; nach Satz 3.1 ist dann M × N
quadrierbar.
Da M und N kompakt sind, gibt es Quader QM ⊂ Rm , QN ⊂ Rn mit M ⊂
Q̊M , N ⊂ Q̊N . Nach Voraussetzung existieren weiter Quader Q1 , . . . , Qr ⊂ Rm ,
Qr+1 , . . . , Qp ⊂ Rn zu beliebigen ε > 0 mit
∂M ⊂ Q̊1 ∪ . . . ∪ Q̊r ,
r
X
|Qj | < ε,
j=1
∂N ⊂ Q̊r+1 ∪ . . . ∪ Q̊p ,
p
X
|Qj | < ε.
j=r+1
Mit den Quadern
Q0j
(
:=
Qj × QN , für j = 1, . . . , r
⊂ Rm+n
QM × Qj , für j = r + 1, . . . , p
gilt dann offenbar
∂(M × N ) ⊂
µ[
r
¶
Q̊0j
∪
µ [
p
j=1
j=r+1
¶
Q̊0j
=
µ[
p
Q̊0j
¶
,
j=1
und wir haben
p
p
r
X
X
X
¡
¢
|Q0j | =
|Qj | |QN | +
|QM | |Qj | < ε |QN | + |QM | .
j=1
j=1
j=r+1
Da ε > 0 beliebig war, ist also ∂(M × N ) Menge mit Inhalt Null.
246
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
(A4) Sind M ⊂ Rm , N ⊂ Rn quadrierbar und f = f (x, y) ∈ C 0 (M × N, Rd )
beschränkt, so folgt
¶
¶
Z
Z µZ
Z µZ
f (x, y) dx dy =
f dy dx =
f dx dy.
M ×N
M
N
N
M
Folgerung: |M × N | = |M | |N |.
Denn: Nach (A3) ist zunächst M ×N quadrierbar, und nach Folgerung 3.1 auch
f ∈ R(M × N, Rd ) richtig. Sei o.B.d.A. d = 1. Wir wählen Quader Q ⊂ Rm ,
R ⊂ Rn mit M ⊂ Q̊, N ⊂ R̊. Setzen wir noch g := f M ×N ∈ R(Q × R) und
ϕ(x) := I R (g(x, ·)),
so gilt nach Satz 1.5:
Z
ϕ(x) := I R (g(x, ·)),
Z
f dx dy =
Q×R
x ∈ Q,
Z
ϕ(x) dx =
Q
ϕ(x) dx.
Q
Nun beachten wir
(
g(x, ·) =
Somit erhalten wir
Z
f dx dy =
Q×R
f (x, ·)N , für x ∈ M
.
0,
für x ∈ Q \ M
Z
Z
ϕ(x) dx +
Q\M
ϕ(x) dx
Q\M
Z µZ
=
¶
Z µZ
f (x, y)N dy dx =
M
R
Die zweite Relation folgt durch Vertauschen x ↔ y.
¶
f dy dx.
M
N