Analysis I, II (2012–13)

Werbung
Analysis I, II (2012–13)
Frank Müller
22. Juli 2013
Dieses Skript umfasst den Stoff der Vorlesungen Analysis I und II gehalten im
Wintersemester 2012/13 und im Sommersemester 2013. Die kleingedruckten
Passagen enthalten zusätzliche Informationen (den Stoff der in früheren Semestern
angebotenen Ergänzungen). Die Vorlesung wird im Wintersemester 2013/14
fortgesetzt.
Inhaltsverzeichnis
1 Zahlen, Folgen, Reihen
1
Zahlen und Körper . . . . . . . . . . . .
2
Vollständige Induktion . . . . . . . . . .
3
Die Definition der reellen Zahlen . . . .
4
Folgen und Reihen . . . . . . . . . . . .
5
Vollständigkeit reeller Zahlen . . . . . .
6
Punktmengen in R . . . . . . . . . . . .
7
Die komplexen Zahlen . . . . . . . . . .
8
Konvergenzkriterien für Reihen (in C) .
9
Potenzreihen . . . . . . . . . . . . . . .
10 Der d-dimensionale Raum und metrische
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Räume
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
13
18
27
34
40
47
53
63
67
2 Funktionen und Stetigkeit
1
Beispiele und Grenzwerte von Funktionen . . .
2
Der Stetigkeitsbegriff . . . . . . . . . . . . . . .
3
Kompakta und gleichmäßige Stetigkeit . . . . .
4
Funktionenfolgen und gleichmäßige Konvergenz
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
81
81
88
92
94
3 Differential- und Integralrechnung
1
Differenzierbarkeit . . . . . . . . . . . . . .
2
Lokale Extrema, Mittelwertsatz, Konvexität
3
Die elementaren Funktionen . . . . . . . . .
4
Das eindimensionale Riemannsche Integral .
5
Integration und Differentiation . . . . . . .
6
Uneigentliche Integrale . . . . . . . . . . . .
7
Die Taylorsche Formel . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
99
99
106
113
124
135
143
149
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Differentialrechnung
157
1
Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
2
Mittelwertsatz und Differentiale . . . . . . . . . . . . . . . . . . . . . 165
3
Partielle Ableitungen höherer Ordnung . . . . . . . . . . . . . . . . . 172
3
4
5
6
5 Das
1
2
3
4
5
6
Taylorformel und lokale Extrema . . . . . . . . . . . . . . . . . . . . 177
Inverse Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Der Satz über implizite Funktionen . . . . . . . . . . . . . . . . . . . 189
n-dimensionale Riemannsche Integral
Das Integral über Quader . . . . . . . . . . . . .
Unstetigkeitsstellen und Heine-Borel . . . . . . .
Integration über quadrierbare Mengen . . . . . .
Die Transformationsformel für Testfunktionen . .
Uneigentliche Integrale & Transformationsformel
Anhang: Verwendetes und Weiterführendes . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
199
199
207
216
225
231
239
Kapitel 1
Zahlen, Folgen, Reihen
1
Zahlen und Körper
Grundlegend für alle Mathematik sind selbstverständlich die Zahlen. Und nach dem
deutschen Mathematiker Leopold Kronecker sind die einzig göttlichen Zahlen“ die
”
natürlichen Zahlen
N := {1, 2, 3, . . .}
oder zusammen mit dem Nullelement 0:
N0 := N ∪ {0} = {0, 1, 2, 3, . . .}.
Nehmen wir noch die negativen Zahlen hinzu, so erhalten wir die ganzen Zahlen:
Z := {x : x ∈ N0 oder − x ∈ N} = {0, ±1, ±2, ±3, . . .}.
(Hier sehen Sie übrigens die drei typischen Schreibweisen von Mengen: die aufzählende Schreibweise, die Definition als Vereinigung, Durchschnitt, Differenz, ... von anderen Mengen und die Definition durch Angabe der Eigenschaften ihrer Elemente.)
Je zwei Zahlen a, b ∈ Z lassen sich verknüpfen durch Addition a + b ∈ Z und
Multiplikation a · b = ab ∈ Z, wie wir sie aus der Schule kennen. Bezüglich der
Addition von ganzen Zahlen haben wir folgende Rechenregeln, die wir als gegeben
annehmen wollen:
Axiome der Addition.
(A1) Kommutativität: Für alle a, b ∈ Z gilt a + b = b + a.
(A2) Assoziativität: Für alle a, b, c ∈ Z gilt (a + b) + c = a + (b + c).
(A3) Existenz des Nullelements 0: Es existiert ein neutrales Element 0 ∈ Z, d.h. für
alle a ∈ Z gilt a + 0 = a.
(A4) Existenz des Negativen: Für alle a ∈ Z existiert ein −a ∈ Z, so dass a + (−a) =
0 richtig ist.
1
2
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Die Existenz des Negativen (A4) zeichnet die ganzen Zahlen gegenüber N0 aus.
Zusätzlich haben wir das folgende
Distributivgesetz.
(D) Für alle a, b, c ∈ Z gilt a · (b + c) = a · b + a · c.
Bemerkung: Man kann die natürlichen Zahlen mittels der Peanoschen Axiome zusammen mit der Addition und Multiplikation induktiv erklären und anschließend
durch die Lösung der Gleichungen n + x = 0 für n ∈ N formal auf die ganzen Zahlen
erweitern; siehe z.B. Rannachers Skript, Abschnitt 1.2.
Innerhalb der ganzen Zahlen können i.A. keine Gleichungen der Form
q·x=p
für gegebene p ∈ Z, q ∈ N
(1.1)
gelöst werden. Hierzu erweitern wir Z auf die Menge der rationalen Zahlen
{
}
p
Q := x = : p ∈ Z, q ∈ N ,
q
wobei x = pq für die (eindeutige) Lösung der Gleichung (1.1) steht. Wir verzichten
auf die formal exakte Definition über Äquivalenzklassen und verweisen wieder auf
Rannachers Skript, Abschnitt 1.2. (Mit x = pq löst auch ap
aq für jedes a ∈ N die Gleichung (1.1); diese ungekürzten“ Brüche müssten identifiziert werden.) Die Arbeit
”
mit Äquivalenzklassen werden wir später bei der Konstruktion der reellen Zahlen
üben. Man beachte noch, dass sich für q = 1 die Lösung von (1.1) zu x = p ∈ Z
ergibt, d.h. wir haben Z ⊂ Q.
Wir zeigen unten in Satz 1.1, dass in Q zusätzlich zu den Gesetzen (A1)–(A4)
und (D) (nun natürlich für a, b, c ∈ Q) auch die folgenden Regeln gelten:
Axiome der Multiplikation.
(M1) Kommutativität: Für alle a, b ∈ Q gilt a · b = b · a.
(M2) Assoziativität: Für alle a, b, c ∈ Q gilt (a · b) · c = a · (b · c).
(M3) Existenz des Einselements 1: Es existiert ein neutrales Element 1 ∈ Q \ {0},
d.h. für alle a ∈ Q gilt a · 1 = a.
(M4) Existenz der Inversen: Für alle a ∈ Q \ {0} existiert ein a−1 ∈ Q, so dass
a · a−1 = 1 richtig ist.
Natürlich gelten (M1)–(M3) schon in Z, wesentlich ist also die Existenz der
Inversen (M4). In obigen Axiomen haben wir übrigens Addition und Multiplikation
wie folgt auf Q fortgesetzt: Für x1 = pq11 , x2 = pq22 ∈ Q setzen wir
x1 + x2 :=
p 1 q2 + p 2 q1
∈ Q,
q1 q2
x1 · x2 = x1 x2 :=
p1 p2
∈ Q.
q1 q2
(1.2)
1. ZAHLEN UND KÖRPER
3
Dies scheint Ihnen natürlich aus der Schule völlig klar (Regeln der Bruchrechnung),
ergibt sich aber erst aus der Definition der rationalen Zahlen und den gewünschten
Rechenregeln als einzig sinnvolle Wahl!
Definition 1.1: Ein Tripel (K, +, ·) heißt Körper mit der nichtleeren Grundmenge
K und den Rechenoperationen +, ·, wenn mit a, b ∈ K auch a+b ∈ K und a·b ∈ K gilt
und die Körperaxiome (A1)–(A4), (M1)–(M4) und (D) für beliebige Elemente aus
K erfüllt sind. Wenn klar ist, welche Rechenoperationen benutzt werden, schreiben
wir auch einfach K für den betrachten Körper.
Bemerkung: In einem Körper können wir noch Subtraktion und Division erklären:
a − b := a + (−b) ∈ K für a, b ∈ K,
a
:= a · b−1 ∈ K für a ∈ K, b ∈ K \ {0}.
b
Wie bereits oben behauptet haben wir den:
Satz 1.1: Die Menge Q der rationalen Zahlen ist (zusammen mit + und ·) ein
Körper.
Beweis: Für den Beweis dürfen wir die Rechenregeln (A1)–(A4), (M1)–(M3) und (D) nur in Z
anwenden, wo wir diese ja als bekannt vorausgesetzt haben; wir schreiben dafür (A1)Z usw.
1. Wir beginnen mit den Axiomen der Addition: (A1) können wir direkt nachrechnen: Mit
x1 = pq11 , x2 = pq22 haben wir wegen (A1)Z , (M1)Z und der Definition (1.2):
x1 + x2 =
Ist zusätzlich x3 =
p3
,
q3
(x1 + x2 ) + x3
p1 q2 + p2 q1
q1 q2
(A1)Z ,(M 1)Z
=
p 2 q1 + p 1 q2
= x2 + x1 .
q2 q1
so finden wir weiter
=
(D)Z ,(M 1)Z
=
(A2)Z ,(M 2)Z
=
(M 1)Z ,(D)Z
=
=
(p1 q2 + p2 q1 )q3 + p3 (q1 q2 )
p1 q2 + p2 q1
p3
+
=
q1 q2
q3
(q1 q2 )q3
((p1 q2 )q3 + (q1 p2 )q3 ) + p3 (q2 q1 )
(q1 q2 )q3
p1 (q2 q3 ) + (q1 (p2 q3 ) + (p3 q2 )q1 )
q1 (q2 q3 )
p1 (q2 q3 ) + (p2 q3 + p3 q2 )q1
q1 (q2 q3 )
p1
p2 q3 + p3 q2
+
= x1 + (x2 + x3 ),
q1
q2 q3
also (A2). Zum Beweis von (A3) und (A4) sei zunächst q ∈ N beliebig. Dann gilt nach (A3)Z
und (D)Z :
q · 0 = q · (0 + 0) = q · 0 + q · 0,
also q · 0 = 0 nach Subtraktion von q · 0 auf beiden Seiten unter Beachtung von (A2)Z und
(A4)Z . Folglich löst x = 0 die Gleichung (1.1) mit p = 0, d.h. wir haben nach der Definition
der rationalen Zahlen:
0
für alle q ∈ N.
0=
q
4
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Sei nun x =
p
q
mit p ∈ Z, q ∈ N beliebig. Dann erhalten wir mit (1.2):
x+0=
p
0
p·1+q·0
+ =
q
1
q·1
(M 3)Z
=
p+0
q
also (A3). Schließlich folgern wir mit dem Negativen −x :=
x + (−x) =
−p
pq + (−p)q
p
+
=
q
q
q·q
(M 1)Z ,(D)Z
=
(A3)Z
=
−p
q
(p + (−p))q
q·q
p
= x,
q
∈ Q von x noch:
(A4)Z
=
0 q
·
q q
0
= 0,
q
(M 3)Z
=
d.h. (A4) ist erfüllt.
2. Die Axiome der Multiplikation: Die Gesetze (M1) und (M2) folgen in einfacher Weise aus der
Definition (1.2) und den entsprechenden Gesetzen in Z, ganz analog zum Beweis von (A1),
(A2) in Teil 1. Wegen 1 = 11 haben wir für x = pq :
x·1=
p
q
also (M3). Das Inverse zu x =
x−1
p·1
p 1
· =
q 1
q·1
(M 3)Z
=
p
= x,
q
̸= 0 (d.h. p ̸= 0) erklären wir zu
{ q
,
falls p ∈ N
p
:=
∈ Q.
−q
, falls − p ∈ N
−p
(M 3)
Im ersten Fall ist dann offenbar x · x−1 = 1, wenn man noch pp = Z 1 für beliebige p ∈ N
beachtet. Im zweiten Fall benötigen wir noch die folgende Beobachtung: Für beliebiges p ∈ Z
gilt
p + (−1) · p
(M 3)Z ,(M 1)Z
=
(D)
p · 1 + p · (−1) = Z p · (1 + (−1)) = p · 0 = 0,
also −p = (−1)p. Damit berechnen wir
x · x−1 =
p −q
·
q −p
(M 1)Z
=
p · ((−1) · q)
(−p) · q
(M 1)Z ,(M 2)Z
=
(−p) · q
= 1,
(−p) · q
also (M4).
3. Schließlich beweisen wir das Distributivgesetz (D) in Q: Mit x1 =
berechnen wir
x1 · (x2 + x3 )
=
(M 3)
=
(D)Z ,(M 2)Z
=
(M 2)Z ,(M 1)Z
=
=
p1
,
q1
x2 =
p2
,
q2
x3 =
p3
q3
p1 p2 q3 + p3 q2 (D)Z p1 (p2 q3 ) + p1 (p3 q2 )
·
=
q1
q2 q3
q1 (q2 q3 )
(p1 (p2 q3 ) + p1 (p3 q2 ))q1
(q1 (q2 q3 ))q1
((p1 p2 )q3 )q1 + ((p1 p3 )q2 )q1
((q1 q2 )q3 )q1
(p1 p2 )(q1 q3 ) + (p1 p3 )(q1 q2 )
(q1 q2 )(q1 q3 )
p1 p2
p1 p3
+
= x1 · x2 + x1 · x3 .
q1 q2
q1 q3
Also ist Q ein Körper.
q.e.d.
Es stellt sich nun heraus, dass auch der Bereich der rationalen Zahlen i.A. nicht
ausreicht. Z.B. besitzt die einfache Gleichung
x2 = 2
(1.3)
1. ZAHLEN UND KÖRPER
5
keine Lösung in Q. Wäre nämlich x =
( pq )2
p
q
eine Lösung mit p ∈ Z, q ∈ N teilerfremd,
p2
q2
so müsste also
=
= 2 bzw. p2 = 2q 2 gelten. Damit wäre aber p2 und daher
auch p durch 2 teilbar, d.h. p = 2l mit einem l ∈ Z und folglich
q2 =
p2
= 2l2 .
2
Also wäre auch q 2 und somit q durch 2 teilbar, im Widerspruch zur Annahme, dass
p und q teilerfremd sind.
Bemerkung: Wir haben soeben ein wichtiges Beweisprinzip in der Mathematik benutzt, den indirekten Beweis oder Beweis durch Widerspruch: Um unter den Voraussetzungen (V) eine Aussage (A) zu beweisen, nimmt man an, dass (A) falsch ist und
zeigt, dass dann eine der Voraussetzungen (V) oder eine andere, bereits bewiesene
Aussage (B) nicht erfüllt sein kann. Hierbei benutzt man eine der Grundannahmen
der Mathematik: Eine Aussage (A) ist entweder wahr oder falsch.
√
Aus der Schule wissen wir, dass x =√ 2 ein guter Kandidat zur Lösung von (1.3)
ist. Nach dem eben Gesagten ist aber 2 keine rationale Zahl. Wir werden später
Q konstruktiv durch einen Abschlussprozess auf den Bereich der reellen Zahlen R
erweitern. R entspricht dann der gesamten Zahlengeraden.
Um schließlich auch Gleichungen wie
x2 + 1 = 0
lösen zu können, werden wir R zu den komplexen Zahlen C erweitern; diese kann
man sich in der Gaußschen Zahlenebene veranschaulichen. Insgesamt haben wir also
die Zahlenbereiche
N ⊂ Z ⊂ Q ⊂ R ⊂ C.
Die größten Bereiche Q, R, C haben die Eigenschaft, Körper im Sinne der Definition 1.1 zu sein; für Q haben wir dies bereits gezeigt, für R und C wird dies aus der
Konstruktion folgen. Hingegen sind N und Z keine Körper; beiden fehlt die Inverse,
d.h. (M4) ist verletzt, den natürlichen Zahlen fehlt auch das Negative und sogar das
Nullelement 0.
Ein Körper muss nach (A3) und (M3) mindestens zwei Elemente enthalten,
nämlich das Nullelement 0 und das Einselement 1. Umgekehrt kann man jede zweielementige Menge M = {x, y} durch geeignete Definition der Verknüpfungen zu
einem Körper machen:
+ x y
x x y
y y x
und
· x y
x x x
y x y
(1.4)
6
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Hierbei wird x als Nullelement und y als Einselement interpretiert.
Wir werden nun einige Folgerungen der Körperaxiome angeben, deren Aussagen
Ihnen zum Teil offensichtlich erscheinen mögen. Allerdings gelten diese Rechenregeln in beliebigen Körpern, also z.B. auch für die komplexen Zahlen. Durch diese
Vorgehensweise ersparen wir uns später ermüdende Wiederholungen.
Satz 1.2: In einem Körper (K, +, ·) gelten folgende Rechenregeln:
(a) Die Gleichung a + x = b besitzt für beliebig vorgegebene a, b ∈ K genau eine
Lösung x ∈ K. Insbesondere sind das Nullelement 0 und das negative Element
eindeutig bestimmt.
(b) Die Gleichung ax = b besitzt für beliebig vorgegebene a ∈ K \ {0}, b ∈ K genau
eine Lösung x ∈ K. Insbesondere sind das Einselement 1 und das inverse
Element eindeutig bestimmt.
(c) Für alle x ∈ K gilt x · 0 = 0 und (−1) · x = −x.
(d) Für alle x ∈ K gilt −(−x) = x und falls zusätzlich x ̸= 0 auch (x−1 )−1 = x.
(e) Für alle x, y ∈ K \ {0} ist xy ̸= 0 richtig.
(f ) Für alle x, y ∈ K ist −(x + y) = −x − y richtig und falls zusätzlich x, y ̸= 0
gilt auch (xy)−1 = x−1 y −1 .
Beweis:
(a) Wir zeigen zunächst, dass x := b + (−a) = b − a die Gleichung a + x = b löst,
d.h. wir beweisen die Existenz einer Lösung:
a+x
a + (b − a)
=
(A4)
=
0+b
(A1)
=
(A1)
=
b+0
a + ((−a) + b)
(A3)
=
(A2)
=
(a + (−a)) + b
b.
Die Eindeutigkeit der Lösung ergibt sich wie folgt: Angenommen es gibt zwei
Lösungen x1 , x2 , d.h.
a + x1 = b = a + x2 .
Addieren wir von rechts auf beiden Seiten −a, so folgt
(a + x1 ) + (−a) = (a + x2 ) + (−a)
(A1),(A2)
=⇒
(A4)
=⇒
(A3)
=⇒
wie behauptet.
x1 + (a + (−a)) = x2 + (a + (−a))
x1 + 0 = x2 + 0
x1 = x2 ,
1. ZAHLEN UND KÖRPER
7
(b) Existenz: x := a−1 b ist Lösung, denn
ax = a(a−1 b)
(M 2)
=
(aa−1 )b
(M 4)
=
1·b
(M 1)
=
b·1
(M 3)
=
b.
Eindeutigkeit: Für zwei Lösungen x1 , x2 hätten wir ax1 = b = ax2 und nach Multiplikation
mit a−1 von rechts:
(ax1 )a−1 = (ax2 )a−1
(M 1),(M 2)
x1 (aa−1 ) = x2 (aa−1 )
(M 4)
x1 · 1 = x2 · 1
=⇒
=⇒
(M 3)
=⇒
x1 = x2 .
(c) x · 0 = 0: Nach (A3) gilt 0 + 0 = 0 und folglich
(D)
x · 0 + x · 0 = x · (0 + 0) = x · 0.
Addition von −(x·0) auf beiden Seiten von rechts (und Ausnutzen der Axiome
(A2), (A4) und (A3)) liefert die Behauptung.
(−1) · x = −x: Es gilt
x + (−1) · x
(M 3),(M 1)
=
(D)
x · 1 + x · (−1) = x · (1 + (−1))
(A4)
=
x · 0 = 0.
Die Eindeutigkeit des Negativen – siehe (a) – liefert die Behauptung.
(d) −(−x) = x: Per Definition ist −(−x) erklärt durch die Gleichung −x + (−(−x)) = 0. Andererseits gilt auch
−x + x
(A1)
=
x + (−x)
(A4)
=
0.
Da aber die Lösung y ∈ K der Gleichung −x + y = 0 nach (a) eindeutig ist, folgt x = −(−x).
(x−1 )−1 = x: Wegen x ̸= 0 ist auch x−1 ̸= 0; wäre nämlich x−1 = 0, so hätten wir
1 = x · x−1 = x · 0 = 0,
(c)
im Widerspruch zu (M3). Also ist (x−1 )−1 erklärt, nämlich als Lösung von x−1 (x−1 )−1 = 1.
Andererseits haben wir
(M 1)
(M 4)
x−1 x = xx−1 = 1.
Da aber die Gleichung x−1 y = 1 nach (b) eine eindeutige Lösung y ∈ K besitzt folgt x =
(x−1 )−1 .
(e) Beweis durch Widerspruch: Angenommen, es gibt x, y ∈ K \ {0} mit xy = 0.
Nach Multiplikation mit y −1 (beachte y ̸= 0) von rechts folgt
x
(M 3)
=
x·1
(M 4)
=
x(yy −1 )
(M 2)
=
(c)
(xy)y −1 = 0 · y −1 = 0,
also ein Widerspruch zur Voraussetzung x ̸= 0. Somit ist die Behauptung
richtig.
8
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(f) −(x + y) = −x − y: Per Definition ist (x + y) + (−(x + y)) = 0 richtig. Andererseits berechnen
wir m.H. von (A1)-(A4):
(x + y) + (−x − y)
=
x + (y + (−y − x)) = x + ((y + (−y)) − x)
=
x + (0 − x) = x + ((−x) + 0) = x + (−x) = 0.
Da wieder nach (a) die Gleichung (x+y)+z = 0 eindeutig lösbar ist, folgt −(x+y) = −x−y.
(xy)−1 = x−1 y −1 : Da sowohl z = (xy)−1 als auch z = x−1 y −1 die Gleichung (xy)z = 1 lösen
– letzteres sieht man analog zur obigen Rechnung unter Benutzung von (M1)-(M4) – liefert
die Eindeutigkeitsaussage in (b) sofort (xy)−1 = x−1 y −1 .
q.e.d.
Bemerkung: In Mehrfachsummen und Mehrfachprodukten lassen wir i.F. die Klammern meist weg, also a+b+c+. . . und a·b·c·. . . für a, b, c, . . . ∈ K, denn wegen (A2)
und (M2) spielt die Reihenfolge der Summierung bzw. Multiplikation keine Rolle.
Ebenso können wir in Mehrfachsummen und Mehrfachprodukten die Reihenfolge
der Summanden bzw. Faktoren beliebig vertauschen.
Für das in der Analysis wesentliche Rechnen mit Ungleichungen benötigen wir
noch eine Anordnung“, wir müssen also entscheiden können, ob ein Element eines
”
Körpers größer“ oder kleiner“ als ein anderes Element ist. Hierzu verwenden wir
”
”
die folgende
Definition 1.2: Wir nennen einen Körper K angeordnet, wenn gewisse Elemente
x ∈ K als positiv ausgezeichnet sind (in Zeichen: x > 0), wobei folgende Regeln
erfüllt seien:
Anordnungsaxiome
(O1) Für jedes x ∈ K gilt genau eine der drei Beziehungen
x > 0,
−x > 0.
x = 0,
Die x ∈ K mit −x > 0 heißen die negativen Elemente.
(O2) Für alle x, y ∈ K mit x > 0 und y > 0 gilt
x+y >0
und
xy > 0.
Bemerkungen:
1. (O1) ist das sogenannte Trichotomiegesetz, bei (O2) spricht man von der Abgeschlossenheit von >“ bezüglich der Addition und Multiplikation.
”
2. Der Körper Q der rationalen Zahlen ist natürlich angeordnet mittels
x>0
:⇐⇒
x=
p
mit p, q ∈ N
q
1. ZAHLEN UND KÖRPER
9
Dann sind die x = pq mit −p, q ∈ N gerade die negativen Zahlen. Dies entspricht
unserer Vorstellung der Anordung von Q auf der Zahlengeraden (vgl. auch
Definition 1.3 unten).
3. Aus der Konstruktion von R wird folgen, dass auch die reellen Zahlen einen
angeordneten Körper bilden. Hingegen stellt sich C als nicht angeordneter
Körper heraus.
4. Auch der Körper ({x, y}, +, ·) mit den in (1.4) erklärten Relationen +, · kann
nicht angeordnet werden: Da x das Nullelement ist, müsste für y entweder y >
x oder −y > x gelten. Per Definition ist −y ∈ {x, y} Lösung von y + (−y) = x.
Nach (1.4) ist dann aber −y = y, Widerspruch!
Definition 1.3: (Größer- und Kleinerrelation)
In einem angeordneten Körper definieren wir:
x > y :⇐⇒ x − y > 0,
x < y :⇐⇒ y > x
⇐⇒
y − x > 0,
x ≥ y :⇐⇒ x > y oder x = y,
x ≤ y :⇐⇒ x < y oder x = y.
Satz 1.3: In einem angeordneten Körper K gelten folgende Aussagen:
(a) Für je zwei Elemente x, y ∈ K gilt genau eine der Relationen
x < y,
x = y,
x > y.
(b) Transitivität: Für alle x, y, z ∈ K gilt: x < y und y < z implizieren x < z.
(c) Translationsinvarianz: Für alle x, y, a ∈ K gilt: Aus x < y folgt x + a < y + a.
(d) Skalierungsinvarianz: Für alle x, y, a ∈ K mit x < y und a > 0 gilt xa < ya.
(e) Spiegelung: Für alle x, y ∈ K mit x < y haben wir −x > −y.
(f ) Für alle x ∈ K \ {0} ist x2 > 0 richtig; insbesondere gilt 1 > 0.
(g) Für jedes x ∈ K mit x > 0 ist x−1 > 0 erfüllt.
(h) Für alle x, y ∈ K mit 0 < x < y gilt x−1 > y −1 .
Bemerkung: Wegen Satz 1.3 (a) sind in einem angeordneten Körper für je zwei Elemente x, y ∈ K das Minimum und Maximum wohl definiert:
{
{
x, falls x ≤ y
x, falls x ≥ y
min{x, y} :=
, max{x, y} :=
.
y, sonst
y, sonst
10
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis von Satz 1.3: Wir werden die Körperaxiome und deren Folgerungen aus
Satz 1.2 ohne Kommentar benutzen.
(a) Wende (O1) auf x − y an und benutze Definition 1.3.
(b) Per Voraussetzung ist y − x > 0 und z − y > 0, so dass (O2) liefert
z − x = (y − x) + (z − y) > 0 bzw.
x < z.
(c) Aus der Voraussetzung y − x > 0 folgt sofort
(y + a) − (x + a) = y − x > 0 bzw.
x + a < y + a.
(d) Wegen y − x > 0 und a > 0 liefert (O2)
ya − xa = (y − x)a > 0
bzw.
xa < ya,
wie behauptet.
(e) Es gilt (−x) − (−y) = y − x > 0 nach Voraussetzung, also −x > −y.
(f) Für x > 0 folgt x2 = x · x > 0 aus (O2).
Für x < 0 multiplizieren wir diese Ungleichung mit −x > 0 durch und erhalten
aus (d): −x2 < 0 bzw. x2 = −(−x2 ) > 0 nach Definition 1.3.
Schließlich beachten wir noch 1 = 1 · 1 > 0.
(g) Es sei x > 0 und angenommen es gilt x−1 < 0, d.h. −x−1 > 0. Aus (O2) folgt dann aber
−1 = −xx−1 = x(−x−1 ) > 0
bzw.
1 < 0,
im Widerspruch zu (f).
(h) Wegen x > 0 und y > x erhalten wir aus (b) auch y > 0 und (O2) liefert xy > 0: Aus (g)
folgt also
x−1 y −1 = (xy)−1 > 0.
Wenden wir nun (d) mit a = x−1 y −1 auf die Ungleichung x < y an, so folgt
(d)
y −1 = x−1 y −1 x < x−1 y −1 y = x−1 ,
wie behauptet.
q.e.d.
Wie bereits angemerkt, gibt es Körper, die nicht angeordnet werden können,
wie etwa die komplexen Zahlen C. Manchmal kann man aber zumindest einen Ab”
standsbegriff“ einführen, die Elemente also in einem gewissen Sinne bewerten“:
”
Definition 1.4: Ein Körper K heißt bewerteter Körper, wenn eine Abbildung | · | :
K → K existiert, die jedem Element x ∈ K eindeutig ein Element |x| ∈ K zuordnet
und für die folgende Regeln gelten:
1. ZAHLEN UND KÖRPER
11
(a) Positivität: Für jedes x ∈ K gilt |x| ≥ 0 und |x| = 0 ⇐⇒ x = 0.
(b) Multiplikativität: Für alle x, y ∈ K gilt |x · y| = |x| · |y|.
(c) Dreiecksungleichung: Für beliebige x, y ∈ K haben wir |x + y| ≤ |x| + |y|.
Die Abbildung | · | : K → K nennt man dann auch Betragsfunktion.
Wir werden später sehen, dass C ein bewerteter Körper ist. Bevor wir Rechenregeln in bewerteten Körpern ableiten wollen, zeigen wir, dass jeder angeordnete
Körper auch bewertet ist; dies gilt also insbesondere für Q und später auch für R:
Satz 1.4: Zu einem x ∈ K aus dem angeordneten Körper K erklären wir den
(Absolut-)Betrag als
{
x,
falls x ≥ 0
|x| :=
.
(1.5)
−x, sonst
Dann ist K mit der Betragsfunktion aus (1.5) ein bewerteter Körper.
Bemerkung: Für den in (1.5) erklärten Absolutbetrag gilt
|x| = max{x, −x}
für alle x ∈ K
und folglich
−|x| ≤ x ≤ |x| für alle x ∈ K;
dies folgt sofort aus Satz 1.3 (b) und (e) .
Beweis von Satz 1.4: Wir haben die drei Eigenschaften (a)-(c) aus Definition 1.4
nachzuprüfen (die Regeln aus Satz 1.2 benutzen wir kommentarlos).
(a) Sowohl |x| ≥ 0 für alle x ∈ K als auch die Äquivalenz |x| = 0 ⇐⇒ x = 0
entnimmt man sofort der Definition des Betrages und Definition 1.3.
(b) Falls x ≥ 0, y ≥ 0, so gilt xy ≥ 0 gemäß (O2) und folglich auch
|xy| = xy = |x| |y|.
Falls x < 0, y ≥ 0, so folgt xy ≤ 0 nach Satz 1.3 (d); also finden wir
|xy| = −(xy) = (−x)y = |x| |y|.
Entsprechend lässt sich der Fall x ≥ 0, y < 0 behandeln.
Gelte schließlich x < 0, y < 0, also −x > 0, −y > 0. Dann liefert (O2):
xy = −(−x)y = (−x)(−y) > 0.
Also haben wir auch in diesem Fall
|xy| = xy = (−x)(−y) = |x| |y|.
12
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(c) Wegen x ≤ |x|, y ≤ |y| haben wir nach Satz 1.3 (c):
x + y ≤ |x| + y ≤ |x| + |y|.
Entsprechend folgt aus −x ≤ |x|, −y ≤ |y| auch
−(x + y) = −x − y ≤ |x| + |y|.
Insgesamt ergibt sich also
|x + y| = max{x + y, −(x + y)} ≤ |x| + |y|,
wie behauptet.
q.e.d.
Satz 1.5: (Rechnen in bewerteten Körpern)
Sei K ein bewerteter Körper mit Betragsfunktion | · | : K → K.
(a) Für jedes x ∈ K ist | − x| = |x| richtig.
(b) Für jedes x ∈ K \ {0} ist |x−1 | = |x|−1 erfüllt.
(c) Für beliebige x, y ∈ K gilt |x − y| ≥ |x| − |y|.
x |x|
.
(d) Für alle x, y ∈ K mit y ̸= 0 gilt =
y
|y|
Beweis:
(a) Die Multiplikativität liefert für x = y = 1 zunächst |1| = |1 · 1| = |1| · |1|
bzw. 1 = |1|. Setzen wir x = y = −1 ein, so folgt 1 = |1| = |(−1)(−1)| = |−1|2 .
Wegen der Positivität ist | − 1| > 0 richtig. Aufgrund von
0 = | − 1|2 − 12 = (| − 1| − 1)(| − 1| + 1),
muss also | − 1| = 1 gelten. Für beliebige x ∈ K finden wir nun
| − x| = |(−1)x| = | − 1| |x| = 1 · |x| = |x|,
wie behauptet.
(b) Wegen xx−1 = 1 und |1| = 1 liefert die Multiplikativität:
|x| |x−1 | = |xx−1 | = |1| = 1.
Also ist |x−1 | das inverse Element zu |x|, d.h. |x|−1 = |x−1 |.
(c) Mit der Dreiecksungleichung berechnen wir
|x| = |(x − y) + y| ≤ |x − y| + |y|
bzw.
|x| − |y| ≤ |x − y|
und
(a)
|y| = |(y − x) + x| ≤ |x − y| + |x|
also
bzw.
− (|x| − |y|) ≤ |x − y|,
{
} |x − y| ≥ max |x| − |y|, −(|x| − |y|) = |x| − |y|.
2. VOLLSTÄNDIGE INDUKTION
13
(d) Mit der Relation (b) und der Multiplikativität berechnen wir
|x|
x
−1
−1
−1
,
= |xy | = |x| |y | = |x| |y| =
y
|y|
wie behauptet.
q.e.d.
Beispiel: Im Körper R erklärt man das arithmetische bzw. geometrische Mittel zweier Zahlen x, y ≥ 0
gemäß
√
1
mA (x, y) := (x + y), mG (x, y) := xy.
2
√
√
Für diese gilt die Ungleichung mA (x, y) ≥ mG (x, y). In der Tat haben wir für a := x und b := y:
0 ≤ (a − b)2 = a2 − 2ab + b2
⇐⇒
1 2
(a + b2 ) ≥ ab,
2
also
√
1
(x + y) ≥ xy.
2
Gleichheit tritt übrigens genau dann auf, wenn x = y richtig ist. Das Rechnen in R, insbesondere
mit rationalen Potenzen, werden wir später genauer entwickeln.
Für den späteren Gebrauch bemerken wir noch, dass Q sogar ein archimedisch
angeordneter Körper ist, d.h. neben den Ordnungsaxiomen (O1) und (O2) gilt noch
Folgendes:
Archimedisches Axiom.
(O3) Zu je zwei Elementen x, y ∈ Q mit x, y > 0 existiert eine natürliche Zahl
n ∈ N, so dass gilt
nx > y.
Zum Beweis von (O3) in Q seien x = pq , y = rs mit p, q, r, s ∈ N zwei beliebig
gewählte, positive rationale Zahlen. Wählen wir dann n := rq + 1 ∈ N, so folgt
nx = (rq + 1)
p
p
r
p
= rp + = (ps) + ≥ y · 1 + x > y,
q
q
s
q
wie behauptet. Wir werden hieraus folgern, dass auch R archimedisch angeordnet
ist.
Bemerkung: Archimedes hat (O3) geometrisch formuliert: Hat man zwei Strecken
auf einer Geraden, so kann man, in dem man die kürzere hinreichend oft abträgt,
die längere übertreffen.
2
Vollständige Induktion
Wir lernen nun ein wichtiges Beweisprinzip kennen und anwenden, welches darauf
beruht, dass jede Zahl n ∈ N0 = N ∪ {0} einen eindeutig definierten Nachfolger,
14
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
nämlich n + 1 ∈ N, besitzt. Will man jetzt eine Aussage A(n) für alle n ≥ n0 mit
einem n0 ∈ N0 beweisen (d.h. man möchte eigentlich unendlich viele Aussagen A(n)
in Abhängigkeit von n zeigen), dann geht man wie folgt vor:
Beweisprinzip der vollständigen Induktion.
Eine Aussage A(n) gilt für alle n ∈ N0 mit n ≥ n0 ∈ N0 , falls man folgendes beweisen
kann:
(IA) Induktionsanfang: Die Aussage A(n0 ) ist richtig.
(IS) Induktionsschritt: Für alle n ≥ n0 gilt: Wenn A(n) richtig ist, so ist auch
A(n + 1) richtig.
Die Wirkungsweise ist klar: Sind (IA) und (IS) erfüllt und angenommen, es
existiert ein n > n0 , für das A(n) nicht gilt. Wegen (IS) ist dann auch A(n − 1)
falsch und dann A(n − 2), A(n − 3) usw. Nach n − n0 Schritten würde also folgen,
dass auch A(n0 ) falsch ist, im Widerspruch zu (IA).
Als erste Anwendung beweisen wir den
Satz 2.1: (Bernoullische Ungleichung)
Sei K ⊃ N ein angeordneter Körper und x ∈ K mit x ≥ −1 sei gewählt. Dann gilt
für alle n ∈ N0 die Ungleichung
(1 + x)n ≥ 1 + nx.
Bemerkung: Die n-te Potenz ist dabei für a ∈ K wie folgt induktiv erklärt:
a0 := 1,
an+1 := an · a
für n ∈ N.
Für a ̸= 0 erhalten wir dann auch negative Potenzen:
a−n := (a−1 )n
für alle n ∈ N.
Rechenregeln: Für alle a, b ∈ K \ {0} und n, m ∈ Z gilt:
(i) an am = an+m .
(ii) (an )m = anm .
(iii) an bn = (ab)n .
Beweis von Satz 2.1: mittels vollständiger Induktion.
(IA) n = 0: Wir haben zu zeigen, dass A(0) gilt, also in unserem Fall
(1 + x)0 ≥ 1 + 0 · x.
Das ist offenbar richtig.
2. VOLLSTÄNDIGE INDUKTION
15
(IS) n → n + 1: Es sei A(n), also (1 + x)n ≥ 1 + nx, für ein n ∈ N0 richtig (genannt
Induktionsvoraussetzung (IV)). Zu zeigen ist A(n + 1), d.h.
(1 + x)n+1 ≥ 1 + (n + 1)x.
Hierzu berechnen wir m.H. der Induktionsvoraussetzung (beachte 1 + x > 0):
(1 + x)n+1 = (1 + x)n (1 + x)
(IV )
≥
(1 + nx)(1 + x)
= 1 + nx + x + nx2 ≥ 1 + (n + 1)x,
d.h. A(n + 1) gilt. Also ist auch der Induktionsschritt (IS) erfüllt und nach
dem Prinzip der vollständigen Induktion gilt die Aussage für alle n ∈ N0 .
q.e.d.
Satz 2.2: Für jede natürliche Zahl n ∈ N gilt
1 + 2 + 3 + ... + n =
n(n + 1)
.
2
Bemerkung: Die Punkte deuten an, dass die Summation in der gleichen Weise fortgesetzt wird. Dies kann man m.H. von Summen- und Produktzeichen wie folgt kompakter schreiben:
Hat man viele, eventuell unendlich viele Variablen, so benutzt man statt a, b, c, . . .
sinnvoller die Bezeichnungen a1 , a2 , a3 , . . .. Die natürlichen Zahlen 1, 2, 3, . . . heißen
hierbei Indizes und dienen der Unterscheidung der Variablen ak , k ∈ N.
Für n ∈ N Variablen a1 , a2 , . . . , an setzen wir
n
∑
k=1
n
∏
ak := a1 + a2 + . . . + an
ak := a1 · a2 · . . . · an
(Summe),
(Produkt).
k=1
Hierbei kann man die Indexmenge 1, . . . , n natürlich auch durch andere (endliche)
Teilmengen von N oder allgemeiner von Z ersetzen. Die Formel in Satz 2.2 liest sich
nun (ak := k für k = 1, . . . , n):
n
∑
k=
k=1
n(n + 1)
.
2
Beweis von Satz 2.2: mit vollständiger Induktion.
(IA) n = 1: Offenbar gilt
1
∑
k=1
k = 1 und
1·(1+1)
2
= 1, d.h. A(1) ist korrekt.
16
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
n
∑
(IS) n → n+ 1: Die Induktionsvorraussetzung
=
k=1
n(n+1)
2
gelte für ein n ∈ N. Für
den Beweis von (IS) berechnen wir m.H. der Induktionsvoraussetzung (IV):
n+1
∑
k =
n
∑
k=1
k + (n + 1)
(IV )
=
k=1
n(n + 1)
+ (n + 1)
2
n(n + 1) + 2(n + 1)
(n + 1)(n + 2)
=
,
2
2
d.h. es folgt A(n + 1). Somit gilt die Aussage für alle n ∈ N.
=
q.e.d.
Satz 2.3: (geometrische Reihe)
Für alle x ∈ K \ {1} im Körper K und alle n ∈ N gilt
n−1
∑
1 − xn
.
1−x
xk =
k=0
Beweis (vollständige Induktion):
∑
(IA) n = 1: Es gilt 0k=0 xk = x0 = 1 und
1−x1
1−x
= 1, also A(1).
(IS) n → n + 1: Die zu beweisende Relation gelte für festes n ∈ N (IV). Wir
berechnen dann
∑
(n+1)−1
xk =
n
∑
xk =
k=0
k=0
=
1−
xn
n−1
∑
xk + xn
(IV )
=
k=0
xn (1
1 − xn
+ xn
1−x
+
− x)
1 − xn+1
=
,
1−x
1−x
wie behauptet.
q.e.d.
Definition 2.1: Wir erklären für n, k ∈ N0 die Binomialkoeffizienten
( )
k
∏
n−j+1
n(n − 1) · . . . · (n − k + 1)
n
:=
=
.
k
j
1 · 2 · ... · k
j=1
Bemerkung: Offenbar gilt
( ) {
n!
n
k!(n−k)! , falls k ≤ n
=
k
0,
falls k > n
mit der bekannten Fakultät:
0! := 1,
Insbesondere halten wir
(n )
0
= 1,
(n )
1
n! :=
n
∏
l.
l=1
= n und
(n )
k
=
(
n
n−k
)
für k ≤ n fest.
2. VOLLSTÄNDIGE INDUKTION
17
Hilfssatz 2.1: Für alle natürlichen Zahlen k, n ∈ N gilt die Relation
( ) (
) (
)
n
n−1
n−1
=
+
.
k
k−1
k
(Veranschaulichung: Pascalsches Dreieck).
Beweis: Für k ≥ n ist nach obiger Bemerkung nichts zu zeigen. Sei also k < n. Dann
finden wir
(
) (
)
n−1
n−1
(n − 1)!
(n − 1)!
+
=
+
k−1
k
(k − 1)!(n − k)! k!(n − k − 1)!
k(n − 1)! + (n − 1)!(n − k)
=
k!(n − k)!
( )
n!
n
=
=
,
k!(n − k)!
k
wie behauptet.
q.e.d.
Satz 2.4: (Binomischer Lehrsatz)
Sei K Körper und n ∈ N0 beliebig. Dann gilt für alle a, b ∈ K die Identität
n ( )
∑
n k n−k
a b
.
(a + b) =
k
n
(2.1)
k=0
Beweis: durch vollständige Induktion über n.
(IA) n = 0: Wegen x0 = 1 für alle x ∈ K haben wir
( )
0
∑
0 k 0−k
a b
= 1 = (a + b)0 ,
k
k=0
d.h. (IA) gilt.
(IS) n → n + 1: (2.1) gelte für festes n ∈ N0 . Wir beachten
(a + b)n+1 = (a + b)n a + (a + b)n b
und formen die Terme getrennt um. Zunächst gilt
( )
( )
n+1
n
∑
n k n−k+1 ∑ n k n−k+1
n (IV )
(a + b) b =
a b
=
a b
,
k
k
k=0
(
k=0
)
n
n+1
wobei wir noch
= 0 benutzt haben. Zur Behandlung des Terms (a + b)n a verwenden
wir noch die offensichtliche Beziehung
n
∑
k=0
xk+1 =
n+1
∑
k=1
xk
(Indexverschiebung)
18
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
für beliebige Summanden x1 , x2 , . . . , xn+1 ∈ K. Wir erhalten
( )
(
)
n+1
n
∑
n k+1 n−k ∑
n
n (IV )
(a + b) a =
a
b
=
ak bn−k+1 .
k
k−1
k=0
k=1
Insgesamt ergibt sich also unter Beachtung von Hilfssatz 2.1:
(
)
( )
n+1
n+1
∑ n k n−k+1
∑
n
k n−k+1
n+1
a b
+
a b
(a + b)
=
k−1
k
k=0
k=1
(
) ( )]
( )
n+1
∑[
n
n
n 0 n+1
k n−k+1
=
+
a b
+
a b
k−1
k
0
k=1
(
)
(
)
n+1
∑ n + 1 k n+1−k
n + 1 0 n+1−0
HS 2.1
=
a b
+
a b
k
0
k=1
(
)
n+1
∑ n + 1 k n+1−k
=
a b
,
k
k=0
also Relation (2.1) für n + 1.
3
q.e.d.
Die Definition der reellen Zahlen
Wir haben die Notwendigkeit der Einführung der reellen Zahlen bereits erkannt, da
die Lösung von x2 −2 = 0 nicht rational ist, was übrigens schon in√
der Antike bekannt
war. Aus der Schule wissen wir, dass die positive Lösung x = 2 eine unendliche
Dezimalbruchdarstellung besitzt
√
2 = 1, 414213562 . . .
(bekannt sind ungefähr die ersten 5 Millionen Nachkommastellen!) Wenn wir die
Darstellung an der n-ten Nachkommastelle abbrechen, haben wir
xn :=
n
∑
ak
∈ Q für n = 1, 2, . . .
10k
(3.1)
k=0
mit Zahlen ak ∈ {0, 1, 2, . . . , 9} für alle k ∈ N0 (a0 = 1, a1 = 4, a2 = 1, . . . ).
Definition 3.1: Eine Abbildung f : N → K vermöge n 7→ xn := f (n) heißt
Zahlenfolge {xn }n∈N (oder {xn }n , {xn }n=1,2,... ) im Körper K. Wir schreiben kurz
{xn }n∈N ⊂ K. Das Element xn heißt n-tes Glied der Zahlenfolge. Für K = Q sprechen wir von rationalen (Zahlen-)Folgen.
Die Idee ist nun, die rationale Zahlenfolge
{xn }n∈N mit den in (3.1) erklärten
√
Gliedern mit der irrationalen Zahl 2 zu identifizieren. Dazu schätzen wir die
3. DIE DEFINITION DER REELLEN ZAHLEN
19
Streuung“ der Folge wie folgt ab: Für beliebiges N ∈ N seien m, n ≥ N und
”
o.B.d.A. n > m. Dann folgt
|xn − xm |
=
Def. 1.4 (c)
≤
l:=k−m−1
=
Satz 2.3
=
=
∑
∑
m
∑
n ak
n
ak ak −
= 10k
10k 10k k=0
n
∑
k=0
a k k ≤
10
k=m+1
n−m−1
∑ (
k=m+1
n
∑
k=m+1
10
=
10k
n
( 1 )k−1
∑
10
k=m+1
n−m−1
∑ (
( 1 )m
1 )l
1 )l+m
=
10
10
10
l=0
l=0
( 1 )m 1 − ( 1 )n−m
( 1 )m 1
10
≤
1
1
10
10
1 − 10
1 − 10
( )m
( )N
10 1
10 1
≤
.
9 10
9 10
(3.2)
Wir benötigen nun noch folgenden
Hilfssatz 3.1: Sei b ∈ Q positiv, so gilt:
(a) Ist b > 1, so existiert zu jedem K ∈ Q mit K > 0 ein n ∈ N mit der Eigenschaft
bn > K.
(b) Ist 0 < b < 1, so existiert zu jedem δ ∈ Q mit δ > 0 ein n ∈ N mit der
Eigenschaft bn < δ.
Beweis:
(a) Wegen b > 1 ist x := b − 1 > 0 richtig. Also ist die Bernoullische Ungleichung,
Satz 2.1, anwendbar: Für alle n ∈ N gilt
bn = (1 + x)n ≥ 1 + nx.
Nach dem Archimedischen Axiom (O3), welches ja in Q gilt, können wir nun
n ∈ N speziell so wählen, dass nx > K ausfällt. Dann folgt
bn ≥ 1 + nx > 1 + K > K.
(b) Wegen 0 < b < 1 ist b̂ := 1b > 1 richtig. Nach (a) existiert zu K̂ :=
mit
b̂n > K̂ ⇐⇒ bn = (b̂n )−1 < K̂ −1 = δ,
wie behauptet.
1
δ
ein n ∈ N
q.e.d.
20
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Bemerkung: Der Beweis zeigt, dass die Aussage von Hilfssatz 3.1 richtig bleibt, wenn
wir Q durch einen beliebigen, archimedisch angeordneten Körper K ⊃ N ersetzen.
1
<1
Wir wenden nun Hilfssatz 3.1 auf unsere Ungleichung (3.2) an mit b = 10
9
und δ = 10 ε > 0 für beliebig gewähltes ε ∈ Q mit ε > 0. Es existiert also ein
N = N (ε) ∈ N mit
|xn − xm | ≤
10 ( 1 )N
10
< δ = ε für alle m, n ≥ N (ε).
9 10
9
(3.3)
Das bedeutet, die Streuung“ der Folge {xn }n wird für hinreichend große Glieder
”
beliebig klein.
Die Ungleichung (3.2) und damit auch (3.3) gilt übrigens für beliebige rationale
Folgen der Form (3.1) mit ak ∈ {0, 1, 2, . . . , 9}.
Definition 3.2: Eine rationale Zahlenfolge {xn }n heißt Cauchyfolge, wenn gilt: Zu
jedem ε ∈ Q mit ε > 0 existiert ein N = N (ε) ∈ N so, dass
|xn − xm | < ε
für alle m, n ≥ N (ε)
erfüllt ist.
Definition 3.3: Eine rationale Zahlenfolge {xn }n heißt Nullfolge, falls gilt: Zu jedem rationalen ε > 0 existiert ein N = N (ε) ∈ N so, dass
|xn | < ε
für alle n ≥ N (ε)
richtig ist. Man sagt auch, {xn }n konvergiert gegen 0.
Bemerkungen:
1. Jede Nullfolge ist auch Cauchyfolge: Wähle N = N (ε) ∈ N so, dass |xn | <
für alle n ≥ N (ε) gilt. Dann folgt für m, n ≥ N (ε):
|xn − xm | ≤ |xn | + |xm | <
ε
2
ε ε
+ = ε.
2 2
Die Umkehrung ist natürlich falsch, wie etwa das Beispiel {xn }n = {1 + ( 12 )n }n
zeigt.
2. Beispiel: { n1 }n ist Nullfolge. In der Tat existiert nach (O3) zu jedem rationalen
ε > 0 ein N = N (ε) ∈ N mit N ε > 1. Also folgt
1 1
1
<ε
= ≤
n
n
N
für alle n ≥ N (ε).
3. DIE DEFINITION DER REELLEN ZAHLEN
21
Wir wollen nun die reellen Zahlen durch rationale Cauchyfolgen darstellen. Da
aber einige Folgen, wie wir sehen werden, die gleiche reelle Zahl darstellen, müssen
wir diese identifizieren im Sinne einer Äquivalenzrelation:
Definition 3.4: Eine Äquivalenzrelation auf einer beliebigen Menge M ist eine
Beziehung zwischen je zwei ihrer Elemente a, b ∈ M , in Zeichen a ∼ b, mit folgenden
Eigenschaften: Für jedes geordnete Paar (a, b) ∈ M × M steht fest, ob a ∼ b richtig
oder falsch ist, und es gelten:
(R) Reflexivität: Für alle a ∈ M gilt: a ∼ a.
(S) Symmetrie: Für alle a, b ∈ M gilt: a ∼ b =⇒ b ∼ a.
(T) Transitivität: Für alle a, b, c ∈ M gilt: a ∼ b und b ∼ c =⇒ a ∼ c.
Zwei Elemente a, b ∈ M nennen wir äquivalent, wenn a ∼ b gilt. Zu a ∈ M heißt
die Menge
{
}
[a] := x ∈ M : x ∼ a
die zugehörige Äquivalenzklasse. Ein x ∈ [a] nennen wir dann Repräsentant der
Äquivalenzklasse [a].
Bemerkung: Jedes Element a ∈ M gehört zu genau einer Äquivalenzklasse. Wir
können also M als disjunkte Vereinigung ihrer Äquivalenzklassen darstellen:
∪
M=
[a].
a∈M
Bevor wir auf der Menge aller rationalen Cauchyfolgen eine Äquivalenzrelation
erklären, geben wir noch ein paar einfache
Beispiele:
1. Die Gleichheitsrelation auf einem geordneten Körper K ist eine Äquivalenzrelation. Für je zwei Zahlen a, b ∈ K gilt nämlich entweder a = b oder a ̸= b und
offenbar sind (R), (S) und (T) erfüllt.
2. Die Ungleichrelation (nicht reflexiv und transitiv), die Kleinerrelation (nicht reflexiv und
symmetrisch) und die Kleinergleichrelation (nicht symmetrisch) sind z.B. keine Äquivalenzrelationen.
3. Auf der Menge G aller Geraden in der Ebene ist durch die Relation
g1 ∼ g2
:⇐⇒
g1 ist parallel zu g2
eine Äquivalenzrelation definiert. Die Äquivalenzklasse von g ∈ G sind die zu g parallelen
Geraden.
22
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
4. Für M = Z definiert
a−b
∈Z
2
eine Äquivalenzrelation. Die zugehörigen Äquivalenzklassen sind die geraden und die ungea∼b
:⇐⇒
raden Zahlen.
Satz 3.1: Auf der Menge F := {{xn }n ⊂ Q : {xn }n ist Cauchyfolge} der rationalen Cauchyfolgen ist durch
{xn }n ∼ {yn }n
:⇐⇒
{xn − yn }n ist Nullfolge
eine Äquivalenzrelation definiert. Zwei Folgen {xn }n , {yn }n sind also äquivalent,
wenn zu jedem rationalen ε > 0 ein N = N (ε) ∈ N existiert mit |xn − yn | < ε für
alle n ≥ N .
Beweis: Wir prüfen (R), (S) und (T) nach:
(R) Ist klar, denn {xn − xn }n = {0}n ist die konstante Nullfolge.
(S) Falls {xn }n ∼ {yn }n , dann existiert also zu jedem rationalen ε > 0 ein N (ε) ∈
N mit
|yn − xn | = |xn − yn | < ε für alle n ≥ N (ε).
Somit ist auch {yn − xn }n Nullfolge, d.h. {yn }n ∼ {xn }n .
(T) Seien {xn }n ∼ {yn }n und {yn }n ∼ {zn }n . Dann gibt es zu jedem rationalen
ε > 0 Zahlen N1 (ε), N2 (ε) ∈ N mit
ε
für alle n ≥ N1 (ε),
|xn − yn | <
2
ε
|yn − zn | <
für alle n ≥ N2 (ε).
2
{
}
Setzen wir nun N = N (ε) := max N1 (ε), N2 (ε) ∈ N, so folgt
|xn − zn | ≤ |xn − yn | + |yn − zn | <
ε ε
+ = ε für alle n ≥ N (ε),
2 2
also {xn }n ∼ {zn }n , wie behauptet.
{1 + ( 12 )n }n
und {1}n sind z.B. äquivalent. Ebenso gilt
Beispiel: Die Folgen
1 n
{( 3 ) }n , da beide und somit auch ihre Differenz Nullfolgen sind.
q.e.d.
{ n1 }n
∼
Wir kommen nun zur zentralen
Definition 3.5: (Die reellen Zahlen)
Die Menge der reellen Zahlen R erklären wir als die Menge aller Äquivalenzklassen
rationaler Cauchyfolgen im Sinne von Satz 3.1. Jede rationale Cauchyfolge {an }n
definiert also genau eine reelle Zahl α ∈ R durch
α := [an ] := [{an }n ].
3. DIE DEFINITION DER REELLEN ZAHLEN
23
Bemerkung: Wir nennen α ∈ R rational, falls ein Repräsentant {an }n von α existiert
mit an = pq (mit p ∈ Z, q ∈ N) für alle n ∈ N; sonst heißt α irrational.
Die konstanten rationalen Folgen sind also Repräsentanten der rationalen reellen
Zahlen. In diesem Sinne gilt Q ⊂ R, wir schreiben kurz pq := [ pq ]. (Hier ist übrigens
auch die Äquivalenzklassenbildung enthalten, die wir bei der etwas laxen Definition
der rationalen Zahlen in § 1 unterschlagen haben: Ungekürzte“ rationale Zahlen
”
werden mit gekürzten“ identifiziert, denn { ap
}n mit a ∈ N und { pq }n gehören
aq
”
offenbar zur gleichen Äquivalenzklasse.)
Im Folgenden zeigen wir über Definition 3.5, dass R ein archimedisch angeordneter Körper ist, wobei wir natürlich noch die Rechenoperationen und den Begriff
der Positivität in R erklären müssen. Wir beginnen mit dem
Hilfssatz 3.2: Jede rationale Cauchyfolge {xn }n ist beschränkt, d.h. es existiert
ein rationales c > 0, so dass |xn | ≤ c für alle n ∈ N gilt.
Beweis: Gemäß Definition 3.2 gibt es speziell zu ε = 1 ein N ∈ N mit |xn − xm | < 1
für alle n, m ≥ N . Damit folgt insbesondere für m = N :
|xn | = |(xn − xN ) + xN | ≤ |xn − xN | + |xN | < |xN | + 1
für alle n ≥ N.
Setzen wir c := max{|x1 |, . . . , |xN −1 |, |xN | + 1}, so folgt die Behauptung.
q e.d.
Hilfssatz 3.3:
(a) Sind {an }n , {bn }n ⊂ Q Cauchyfolgen, so gilt dies auch für {an + bn }n und
{an · bn }n .
(b) Sind {xn }n , {yn }n ⊂ Q weitere Cauchyfolgen mit {an }n ∼ {xn }n und {bn }n ∼
{yn }n , dann folgt
{an + bn }n ∼ {xn + yn }n
und
{an · bn }n ∼ {xn · yn }n .
Beweis:
(a) Es existiert zu vorgegebenem δ > 0 ein N = N (δ) ∈ N, so dass
|an − am | < δ, |bn − bm | < δ
für alle m, n ≥ N (δ).
Wähle nun ε > 0 rational beliebig. Setzen wir N1 (ε) := N ( 2ε ), so folgt
|(an + bn ) − (am + bm )| ≤ |an − am | + |bn − bm | < ε
also ist {an + bn }n Cauchyfolge.
für alle m, n ≥ N1 (ε),
24
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Nach Hilfssatz 3.2 existiert ferner ein rationales c > 0 mit |an | ≤ c, |bn | ≤ c für alle n ∈ N.
ε
Setzen wir nun N2 (ε) := N ( 2c
), so folgt auch
|an bn − am bm |
=
|an (bn − bm ) + bm (an − am )|
≤
|an | |bn − bm | + |bm | |an − am |
(ε
ε)
c
+
= ε für alle m, n ≥ N2 (ε),
2c
2c
<
d.h. {an bn }n ist Cauchyfolge.
(b) Für den Beweis der ersten Aussage ist zu zeigen, dass {(an + bn ) − (xn + yn )}n
Nullfolge ist. Wegen |an − xn | < ε, |bn − yn | < ε für beliebiges ε > 0 und alle
n ≥ N (ε), erhalten wir
|(an + bn ) − (xn + yn )| ≤ |an − xn | + |bn − yn | < 2ε
für alle n ≥ N (ε).
Da ε > 0 beliebig war, folgt die Behauptung (gehe über ε → 2ε ).
Um zu zeigen, dass auch {an bn − xn yn }n Nullfolge ist, beachten wir wieder
|an |, |yn | ≤ c für alle n ∈ N und mit geeignetem c > 0 gemäß Hilfssatz 3.2. Wir
finden dann
|an bn − xn yn | = |an (bn − yn ) + yn (an − xn )|
≤ |an | |bn − yn | + |yn | |an − xn |
< 2εc
wie behauptet.
für alle n ≥ N (ε),
q.e.d.
Bemerkung: Mit Hilfssatz 3.3 können wir bereits Addition und Multiplikation sowie
das Negative in R erklären; siehe Definition 3.7 unten. Um aber auch die Existenz
der Inversen zu sichern, benötigen wir noch zwei weitere Hilfssätze, für deren Beweis
wir die folgende Definition nutzen:
Definition 3.6: Ist {xn }n ⊂ K eine Zahlenfolge und seien unendlich viele natürliche Zahlen 1 ≤ n1 < n2 < n3 < . . . gewählt (also {nk }k ⊂ N mit nk < nk+1 für alle
k ∈ N). Dann heißt
{xnk }k∈N = {xn1 , xn2 , xn3 , . . .}
Teilfolge von {xn }n .
Hilfssatz 3.4: Es sei {xn }n ⊂ Q eine Cauchyfolge. Dann tritt genau einer der
folgenden Fälle ein:
(a) {xn }n ist Nullfolge.
(b) Typ A+ : Es existiert ein rationales δ > 0 und ein N ∈ N mit xn > δ für alle
n ≥ N.
3. DIE DEFINITION DER REELLEN ZAHLEN
25
(c) Typ A− : Es existiert ein rationales δ > 0 und ein N ∈ N mit −xn > δ für alle
n ≥ N.
Beweis: Wir zeigen, dass, falls (a) nicht gilt, genau einer der Fälle (b) oder (c)
eintreten muss. Sei also {xn }n keine Nullfolge. Dann gibt es also ein rationales δ > 0
und eine Teilfolge {xnk }k mit |xnk | ≥ 2δ für alle k ∈ N. Da {xn }n Cauchyfolge ist,
existiert andererseits ein N ∈ N mit |xn − xm | < δ für alle m, n ≥ N . Wählen wir
p ∈ N so groß, dass np ≥ N ist, so folgt speziell für m = np :
|xn − xnp | < δ
für alle n ≥ N.
Wir unterscheiden nun zwei Fälle:
(i) xnp ≥ 2δ: Dann folgt
xn = xnp + (xn − xnp ) ≥ 2δ − |xn − xnp | > 2δ − δ = δ
für alle n ≥ N,
also gehört {xn }n zum Typ A+ .
(ii) xnp ≤ −2δ: Dann haben wir
−xn = −xnp − (xn − xnp ) ≥ 2δ − |xn − xnp | > δ
für alle n ≥ N,
d.h. {xn }n gehört zum Typ A− .
q.e.d.
Die Definition der Inversen ergibt sich nun aus dem folgenden
Hilfssatz 3.5: Seien die Cauchyfolgen {xn }n , {yn }n ⊂ Q zueinander äquivalent und
keine Nullfolgen. Ferner gelte xn , yn ̸= 0 für alle n ∈ N. Dann sind auch {x−1
n }n
−1
und {yn }n Cauchyfolgen, und es gilt
−1
{x−1
n }n ∼ {yn }n .
Beweis:
1. Nach Hilfssatz 3.4 existiert ein δ > 0, so dass |xn | > δ, |yn | > δ für alle n ∈ N gilt. Damit
folgt:
1 xm − xn 1
1
−
=
< 2 |xn − xm | für alle m, n ∈ N.
xn
xm
xn xm
δ
Da {xn }n Cauchyfolge ist, existiert zu beliebigem ε > 0 ein N̂ (ε) ∈ N, so dass |xn −xm | < εδ 2
−1
−1
richtig ist. Es folgt |x−1
n − xm | < ε für alle m, n ≥ N̂ (ε), d.h. {xn }n ist Cauchyfolge. Die
entsprechenden Überlegungen zeigen, dass auch {yn−1 }n Cauchyfolge ist.
2. Wegen
1 yn − xn 1
1
−
=
< 2 |xn − yn |
xn
yn
xn yn
δ
für alle n ∈ N
−1
folgt aus der Nullfolgeneigenschaft von {xn − yn }n sofort {x−1
n }n ∼ {yn }n , wie behauptet.
q.e.d.
26
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Bemerkung: Die Bedingung xn ̸= 0 für alle Glieder einer Nicht-Nullfolge {xn }n
kann immer durch Übergang zu einer äquivalenten Folge {x̂n }n mittels eventueller
Addition von n1 zum n-ten Glied erreicht werden. Alternativ kann man das durch
Wegstreichen der (gemäß Hilfssatz 3.4) endlich vielen Glieder xn = 0 erreichen, denn:
Jede Teilfolge einer Cauchyfolge ist zu ihr äquivalent.
Definition 3.7: (Rechenoperationen in R)
• Für α = [an ] ∈ R, β = [bn ] ∈ R setzen wir
α + β := [an + bn ] ∈ R
(Summe),
α · β = αβ := [an bn ] ∈ R
(Produkt).
• Die neutralen Elemente der Addition und Multiplikation sind erklärt als
0 := [0] ∈ R,
1 := [1] ∈ R.
• Das Negative und das Inverse erklären wir wie folgt:
– Zu α = [an ] setzen wir −α := [−an ] ∈ R.
– Zu α = [an ] ̸= 0 mit einem Repräsentanten {an }n , der an ̸= 0 für alle
n ∈ N erfüllt, setzen wir α−1 := [a−1
n ].
Bemerkung: Wegen der Hilfssätze 3.3 und 3.5 sind alle Größen wohl definiert. Zum
Beispiel ist nach Hilfssatz 3.3 (a) mit {an }n und {bn }n auch {an bn }n eine rationale
Cauchyfolge, also [an bn ] ∈ R. Und nach Hilfssatz 3.3 (b) ist die Definition von αβ
unabhängig von der Wahl der Repräsentanten {an }n , {bn }n .
Definition 3.8: (Positivität in R)
Eine reelle Zahl α = [an ] heißt positiv, in Zeichen α > 0, falls {an }n zum Typ A+
aus Hilfssatz 3.4 gehört.
Bemerkung: Da für ein weiteres Element {bn }n der Äquivalenzklasse [an ] die Folge {an − bn }n Nullfolge ist, ist auch Definition 3.8 unabhängig von der Wahl des
Repräsentanten.
Satz 3.2: (R, +, ·) mit den in Definition 3.5, 3.7 und 3.8 erklärten reellen Zahlen,
Rechenoperationen und Positivität ist ein archimedisch angeordneter Körper.
Beweis:
1. Dass R ein Körper ist, folgt per Konstruktion aus der Tatsache, dass Q ein
Körper ist. Z.B. ist 1 = [1] in der Tat das neutrale Element der Multiplikation:
Ist nämlich α = [an ], so folgt {an · 1}n ∼ {an }n , also gilt
α · 1 = [an · 1] = [an ] = α
für alle α ∈ R.
4. FOLGEN UND REIHEN
27
2. R ist auch angeordnet, denn nach Hilfssatz 3.4 und Definitionen 3.7, 3.8 gilt
für jede reelle Zahl α genau eine der Beziehungen α > 0, α = 0 oder −α > 0,
also (O1). Und (O2) ist aus Definition 3.7 wieder offensichtlich.
Die in Definition 3.8 erklärte Positivität auf R impliziert also in der Tat eine
Ordnung. Mit ihr können wir wie in den Definitionen 1.3 und 1.4 die Größerbzw. Kleinerrelationen und den Betrag erklären.
3. Schließlich ist in R auch das Archimedische Axiom (O3) erfüllt: Sind nämlich
α = [ak ] > 0, β = [bk ] > 0 gewählt, so suchen wir n ∈ N mit nα > β.
Da α > 0 gilt, ist {ak }k vom Typ A+ , siehe Hilfssatz 3.4. Also gibt es ein
rationales δ > 0 und ein N ∈ N, so dass ak > δ für alle k ≥ N richtig
ist. Andererseits ist {bk }k nach Hilfssatz 3.2 beschränkt, d.h. es existiert ein
rationales c > 0 mit 0 < bk < c für alle k ≥ N .
Wir wählen nun n ∈ N mit nδ > c (beachte: Q ist archimedisch!) und berechnen
nak > nδ = c + (nδ − c) > bk + (nδ − c) für alle k ≥ N.
Wegen nδ − c > 0 ist also die Folge {ck }k mit ck := nak − bk vom Typ A+ ,
d.h.
[n][ak ] − [bk ] = [nak − bk ] > 0
und somit ist nα − β > 0 bzw. nα > β, wie behauptet.
4
q.e.d.
Folgen und Reihen
Wir betrachten nun reelle Zahlenfolgen {xn }n ⊂ R, vgl. Definition 3.1. Analog zum
rationalen Fall erklären wir
Definition 4.1:
• Eine Folge {xn }n ⊂ R heißt Cauchyfolge, falls zu jedem (reellen) ε > 0 ein
N = N (ε) ∈ N existiert mit
|xn − xm | < ε
für alle m, n ≥ N (ε).
• Eine Folge {xn }n ⊂ R heißt Nullfolge, falls zu jedem ε > 0 ein N = N (ε) ∈ N
existiert mit
|xn | < ε für alle n ≥ N (ε).
Definition 4.2: Eine Folge {xn }n ⊂ R nennen wir konvergent gegen α ∈ R, wenn
{xn − α}n eine Nullfolge ist. Wir schreiben dann
lim xn = α
n→∞
oder
xn → α (n → ∞).
α heißt der Grenzwert der Folge {xn }n . Schließlich nennen wir eine Folge divergent,
wenn sie nicht konvergiert.
28
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Bemerkungen:
1. ∞ ist das Symbol für den unendlich fernen Punkt oder einfach Unendlich.
2. Offenbar gilt xn → α (n → ∞) genau dann, wenn |xn − α| → 0 (n → ∞).
3. Geometrische Deutung: Das Intervall (α − ε, α + ε) := {x ∈ R : |x − α| < ε}
für α ∈ R und ε > 0 enthält alle reellen Zahlen, die von α einen Abstand
kleiner ε haben. Wir nennen (α − ε, α + ε) eine ε-Umgebung von α. Eine Folge
konvergiert genau dann gegen α, wenn in jeder ε-Umgebung von α fast alle
Glieder der Folge liegen. Dabei bedeutet fast alle“, alle bis auf endlich viele
”
Ausnahmen.
4. Der Grenzwert einer Folge {xn }n ⊂ R ist eindeutig bestimmt. Gäbe es nämlich
α, β ∈ R mit xn → α und xn → β für n → ∞, dann finden wir zu beliebig
vorgegebenem ε > 0 ein N = N (ε) ∈ N mit |xn − α| < 2ε und |xn − β| < 2ε für
alle n ≥ N . Daher folgt insbesondere für n = N :
|α − β| ≤ |α − xN | + |β − xN | < ε.
Also muss α = β gelten.
Aus der Konstruktion der reellen Zahlen folgt nun unmittelbar der
Hilfssatz 4.1: Ist {xn }n eine rationale Cauchyfolge und α := [xn ], so folgt xn →
α (n → ∞).
Beweis: Ist ε = [εn ] ∈ R mit ε > 0 beliebig, so haben wir zu zeigen, dass ein N (ε) > 0 existiert mit
|xk − α| < ε für alle k ≥ N (ε).
Wegen ε > 0 gibt es per Definition ein δ > 0 und ein N̂ (ε) ∈ N, so dass εn > δ für alle
n ≥ N̂ (ε) gilt. Da nun {xn }n Cauchyfolge ist, gibt es ein N (ε) ≥ N̂ (ε), so dass |xk − xn | < 2δ für
alle k, n ≥ N (ε) gilt. Also ist {εn − |xk − xn |}n vom Typ A+ für jedes feste k ≥ N (ε). Und wegen
|β| = [|yn |] für beliebiges β = [yn ] ∈ R erhalten wir
[
]
0 < εn − |xk − xn | = [εn ] − [xk − xn ] = ε − |xk − α|,
bzw. |xk − α| < ε für alle k ≥ N (ε).
q.e.d.
Wir werden übrigens in § 5 zeigen, dass auch jede reelle Cauchyfolge einen Grenzwert in R besitzt.
Beim Umgang mit Grenzwerten haben wir nun folgende Rechenregeln:
Satz 4.1: Seien {xn }n , {yn }n ⊂ R zwei Folgen mit xn → α, yn → β (n → ∞). Dann
gelten
(a) Es konvergieren auch {xn + yn }n und {xn yn }n mit
lim (xn + yn ) = α + β,
n→∞
lim (xn yn ) = αβ.
n→∞
4. FOLGEN UND REIHEN
29
(b) Falls zusätzlich β ̸= 0 und yn ̸= 0 für alle n ∈ N richtig ist, so konvergiert
auch { xynn }n mit
xn
α
lim
= .
n→∞ yn
β
(c) Gilt xn ≥ yn für alle n ≥ N mit einem N ∈ N, so ist auch α ≥ β erfüllt.
(d) Jede Teilfolge {xnk }k ⊂ {xn }n (vgl. Definition 3.6) konvergiert und es gilt
limk→∞ xnk = α.
Wir halten noch die folgende direkte Konsequenz aus Satz 4.1 (a) fest:
Folgerung 4.1: Konvergieren {xn }n , {yn }n ⊂ R und sind a, b ∈ R beliebig, so konvergiert auch {axn + byn }n mit
lim (axn + byn ) = a lim xn + b lim yn .
n→∞
n→∞
n→∞
Beweis von Satz 4.1: (a) folgt analog zu den entsprechenden Aussagen über rationale
Cauchyfolgen, Hilfssatz 3.3 (a), aus der Dreiecksungleichung und der Beschränktheit
konvergenter Folgen (siehe Satz 4.2 unten). Die Beweise von (c) und (d) sind Übungsaufgaben. Wir zeigen (b): Wegen |β| > 0 gibt es ein N ∈ N mit |yn − β| < |β|
2 für
|β|
alle n ≥ N . Wir folgern |yn | ≥ |β| − |yn − β| > 2 > 0 und somit
x
1
2
n α
− =
|βxn − αyn | ≤
|βxn − αyn | für n ≥ N.
yn
β
|yn | |β|
|β|2
Nach (a) bzw. Folgerung 4.1 konvergiert βxn − αyn → βα − αβ = 0 (n → ∞), also
ist { xynn − αβ }n Nullfolge, wie behauptet.
q.e.d.
Beispiele:
1. Die konstante Folge {a}n = {a, a, a, . . .} für ein a ∈ R konvergiert trivialerweise
gegen a.
2. limn→∞
3n
n+1
= 3. Denn es gilt für beliebiges ε > 0:
3
3n
3n − 3(n + 1) − 3 = < ε,
=
n+1
n+1
n+1
falls n ≥ N (ε) mit N (ε) ≥ 3ε .
3. limn→∞ 2nn = 0. Mit vollständiger Induktion zeigt man nämlich 2n ≥ n2 für alle n ≥ 4
(Übungsaufgabe). Es folgt 21n ≤ n12 bzw. 2nn ≤ n1 und somit
n
1
n
n − 0 = n ≤ < ε
2
2
n
{ 1}
für n ≥ N > max 3,
.
ε
30
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
4. Die Folge {xn }n = {(−1)n }n konvergiert nicht. Sonst müsste z.B. für ε = 1 ein
N ∈ N existieren mit |xn − α| < 1 für alle n ≥ N , wobei α ∈ R der Grenzwert
der Folge sei. Insbesondere für xn und xn+1 mit n ≥ N hätten wir dann den
Widerspruch
2 = |xn − xn+1 | ≤ |xn − α| + |xn+1 − α| < 2.
Also ist {(−1)n }n divergent.
5. limn→∞
5n3 +8n2
n3 −4
= 5. Wir kürzen
5 + 8 n1
5n3 + 8n2
=
.
n3 − 4
1 − n43
Da { n1 }n Nullfolge ist, konvergieren nach Satz 4.1 (a) und Folgerung 4.1 auch
{5 + 8 n1 }n und {1 − 4 n13 }n , nämlich gegen 5 bzw. 1. Satz 4.1 (b) liefert dann
lim (5 + 8 n1 )
5
5n3 + 8n2
n→∞
=
= = 5.
lim
4
n→∞ n3 − 4
1
lim (1 − n3 )
n→∞
Bevor wir weitere Beispiele untersuchen, benötigen wir noch die folgende
Definition 4.3: Eine Folge {xn }n ⊂ R heißt nach oben (bzw. unten) beschränkt,
falls ein c ∈ R existiert mit
xn ≤ c
(bzw. xn ≥ c)
für alle n ∈ N.
Falls sogar |xn | ≤ c für alle n ∈ N gilt, heißt die Folge beschränkt.
Bemerkung: Eine Folge ist genau dann beschränkt, wenn sie nach oben und unten
beschränkt ist.
Satz 4.2: Jede konvergente Folge {xn }n ⊂ R ist beschränkt.
Beweis: Zu ε = 1 existiert ein N ∈ N mit |xn − α| < 1 für alle n ≥ N , wobei
α = limn→∞ xn sei. Wir haben also
|xn | ≤ |xn − α| + |α| < 1 + |α|
für alle n ≥ N.
Also ist {xn }n beschränkt mit c := max{1 + |α|, |x1 |, . . . , |xN −1 |}.
q.e.d.
Bemerkung: Die Umkehrung des Satzes gilt natürlich nicht; z.B. ist {(−1)n }n offenbar beschränkt aber nach obigem Beispiel 4 nicht konvergent.
4. FOLGEN UND REIHEN
31
Beispiele:
1. Fibonacci-Zahlen: f1 := 0, f2 := 1 und rekursiv fn := fn−1 + fn−2 . Das gibt {fn }n =
{0, 1, 1, 2, 3, 5, 8, . . .}.
Die Folge {fn }n ist unbeschränkt: Durch vollständige Induktion zeigt man nämlich fn ≥ n−2
für alle n ∈ N, und {n − 2}n ist offensichtlich nicht nach oben beschränkt. Nach Satz 4.2 ist
die Folge der Fibonacci-Zahlen also divergent.
2. Die Folge {xn }n für ein x ∈ R. Das Konvergenzverhalten hängt von x ab, wir
unterscheiden vier Fälle.
(i) Für |x| < 1 gilt limn→∞ xn = 0, da nach Hilfssatz 3.1 (b) – der nun
natürlich auch in R gilt – zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit
|x|N < ε und folglich
|xn − 0| = |x|n ≤ |x|N < ε
für alle n ≥ N (ε).
(ii) Für x = 1 haben wir die konstante Folge {1n }n = {1}n mit limn→∞ 1n =
1.
(iii) Für x = −1 haben wir die divergente Folge {(−1)n }n .
(iv) Für |x| > 1 ist {xn }n unbeschränkt nach Hilfssatz 3.1 (a), also divergent
gemäß Satz 4.2.
Definition 4.4: (Bestimmte Divergenz)
Eine Folge {xn }n ⊂ R heißt bestimmt divergent gegen +∞ (bzw. gegen −∞), wenn
zu jedem c ∈ R ein N ∈ N existiert, so dass
xn > c
(bzw. xn < c)
für alle n ≥ N
richtig ist. Wir schreiben dann
lim xn = +∞
n→∞
(bzw. lim xn = −∞).
n→∞
Bemerkung: Offensichtlich divergiert {xn }n genau dann bestimmt gegen +∞, wenn
{−xn }n bestimmt gegen −∞ divergiert.
Beispiele:
1. Die Folge {n}n divergiert bestimmt gegen +∞. Das erklärt auch die Schreibweise limn→∞ , die nun eigentlich genauer limn→+∞ lauten müsste.
2. Nach obigem Beispiel divergiert die Folge der Fibonacci-Zahlen bestimmt gegen +∞.
3. Für b > 1 divergiert {bn }n bestimmt gegen +∞, vgl. Hilfssatz 3.1 (a).
32
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
4. Die Folge {(−1)n n}n ist divergent, aber nicht bestimmt divergent. Ist nämlich (−1)n n > c
für ein n ∈ N und ein c ≥ 21 , so folgt für das (n + 1)-te Glied der Folge:
(−1)n+1 (n + 1) = −(−1)n n − (−1)n < −c + 1 ≤ c.
Satz 4.3:
(a) Es sei {xn }n ⊂ R bestimmt divergent gegen +∞ oder −∞. Dann gilt xn ̸= 0
für alle n ≥ n0 mit einem n0 ∈ N, und {xn−1 }n≥n0 ist eine Nullfolge.
(b) Es sei {xn }n Nullfolge mit xn > 0 (bzw. xn < 0) für alle n ≥ N . Dann ist
{x−1
n }n≥N bestimmt divergent gegen +∞ (bzw. gegen −∞).
Beweis: Wir zeigen nur (a) und überlassen (b) zur Übung.
Sei {xn }n bestimmt divergent gegen +∞. Dann existiert zu beliebigem ε > 0 ein
N (ε) ∈ N mit xn > 1ε für alle n ≥ N (ε). Insbesondere folgt xn > 0 für n ≥ n0 :=
N (1). Weiter finden wir
0 < x−1
n <ε
bzw.
|x−1
n |<ε
für alle n ≥ N (ε),
d.h. {x−1
n }n≥n0 ist Nullfolge. Gilt schließlich limn→∞ xn = −∞, so gehen wir zur
negativen Folge {−xn }n über.
q.e.d.
Bemerkung: Mit den Symbolen +∞, −∞ wird R zu der erweiterten Zahlengeraden
R := {−∞} ∪ R ∪ {+∞}, die wir gemäß −∞ < x < +∞ für alle x ∈ R anordnen
können. Allerdings ist R kein Körper, wie auch immer Addition und Multiplikation
in R erklärt werden.
Definition 4.5: (Unendliche Reihen)
Sei {xk }k ⊂ R eine Folge, so erklären wir die zugehörigen Partialsummen
sn :=
n
∑
xk = x1 + x2 + . . . + xn .
k=1
Die Folge {sn }n ⊂ R der Partialsummen heißt dann (unendliche) Reihe. Konvergiert
{sn }n , so sagen wir, dass die zugehörige Reihe konvergiert und schreiben für den
Grenzwert
(∑
)
∞
n
∑
xk := lim sn = lim
xk .
k=1
n→∞
n→∞
k=1
4. FOLGEN UND REIHEN
33
Bemerkungen:
∑
1. Etwas lax schreiben wir meist auch ∞
k=1 xk für die Folge der Partialsummen,
also als Symbol für die Reihe selbst (unabhängig von deren Konvergenz).
2. Eine Reihe ist also eine spezielle Folge, nämlich die von Partialsummen. Umgekehrt kann man jede Folge {yn }n auch durch eine Reihe darstellen, denn es
gilt
n
∑
yn = y1 +
(yk − yk−1 )
(Teleskopsumme).
k=2
auf ∑
die Folge der Partialsummen ergibt sich
3. Aus Folgerung 4.1 angewendet
∑∞
sofort:∑Konvergieren k=1 xk und ∞
k=1 yk und sind a, b ∈ R, so konvergiert
auch ∞
(ax
+
by
),
und
es
gilt
k
k
k=1
∞
∑
(axk + byk ) = a
∞
∑
xk + b
yk .
k=1
k=1
k=1
∞
∑
Beispiele:
1. Es gilt limn→∞
n
n+1
= limn→∞
yk − yk−1 =
1
1
1+ n
= 1. Setzen wir yn =
n
,
n+1
so folgt andererseits
k 2 − (k2 − 1)
k
k−1
1
−
=
=
k+1
k
k(k + 1)
k(k + 1)
für k ≥ 2
und somit
∑
∑
n
1 ∑
1
1
= yn = y1 +
(yk − yk−1 ) = +
=
.
n+1
2
k(k + 1)
k(k + 1)
n
n
n
k=2
k=2
k=1
Wir erhalten also
∞
∑
k=1
∑
1
1
n
= lim
= lim
= 1.
n→∞
n→∞ n + 1
k(k + 1)
k(k + 1)
n
k=1
2. Unendliche geometrische Reihe:
∞
∑
xk . Für |x| < 1 gilt nach Satz 2.3 und
k=0
einem der obigen Beispiele:
∞
∑
k=0
k
x = lim
n→∞
n
∑
k=0
)
1 − xn+1
1 (
1
=
1 − x lim xn =
. (4.1)
n→∞ 1 − x
n→∞
1−x
1−x
xk = lim
34
5
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Vollständigkeit reeller Zahlen
Wir widmen uns nun wieder dem Studium der reellen Zahlen. Insbesondere werden
wir die sogenannte Vollständigkeit“ von R beweisen, die der eigentliche Grund für
”
die Konstruktion von R war und die reellen Zahlen gegenüber den rationalen Zahlen
auszeichnet. Aus der Vollständigkeit folgt auch die Lösbarkeit der Gleichung xs = c
in R, wobei s ∈ N beliebig und c ∈ R positiv ist. Wir beginnen mit der
Definition 5.1: Eine Menge M ⊂ R heißt dicht in R, falls es zu jedem x ∈ R eine
Folge {xn }n ⊂ M so gibt, dass lim xn = x gilt.
n→∞
Bemerkung: Ist M ⊂ R dicht in R, so lässt sich jede reelle Zahl also beliebig gut
durch Elemente aus M approximieren. Natürlich liegt R selbst dicht in R. Erstes
Hauptziel des Paragraphen ist der folgende
Satz 5.1: Q liegt dicht in R.
Für den Beweis benötigen wir noch die anschließende einfache Folgerung des
Archimedischen Axioms:
Hilfssatz 5.1: Zu jeder Zahl x ∈ R existiert genau ein ν ∈ Z, so dass ν ≤ x < ν + 1
richtig ist.
Beweis: Übungsaufgabe!
Beweis von Satz 5.1: Zu gegebenem x ∈ R konstruieren wir mittels vollständiger
Induktion eine Folge {xn }n ⊂ Q von Dezimalbrüchen
xn =
n
∑
ak · 10−k ∈ Q mit a0 ∈ Z,
ak ∈ {0, 1, . . . , 9}
für k ∈ N,
k=0
so dass xn → x (n → ∞) erfüllt ist.
1. Sei zunächst 0 ≤ x < 1 richtig. Wir behaupten, dass dann eine Folge {ak }k ⊂
{0, 1, . . . , 9} und eine Nullfolge {ξn }n ⊂ R so existieren, dass für alle n ∈ N
gilt
n
∑
x=
ak · 10−k + ξn und 0 ≤ ξn < 10−n .
(5.1)
k=1
Offenbar folgt daraus die Behauptung mit a0 = 0.
(IA) n = 1. Wegen 0 ≤ x · 10 < 10 und Hilfssatz 5.1 existiert ein a1 ∈
{0, 1, 2, . . . , 9}, so dass a1 ≤ x·10 < a1 +1 richtig ist. Mit ξ1 := x−a1 ·10−1
haben wir dann
x = a1 · 10−1 + ξ1
und 0 ≤ ξ1 < 10−1 .
5. VOLLSTÄNDIGKEIT REELLER ZAHLEN
35
(IS) n → n + 1: Angenommen wir haben die Darstellung (5.1) für ein n ∈ N.
Dann ist 0 ≤ ξn ·10n+1 < 10 richtig und wieder nach Hilfssatz 5.1 existiert
ein an+1 ∈ {0, 1, . . . , 9} mit an+1 ≤ ξn · 10n+1 < an+1 + 1. Setzen wir noch
ξn+1 := ξn − an+1 · 10−(n+1) , so finden wir
(IV )
x =
n
∑
ak 10−k + ξn =
k=1
n+1
∑
ak · 10−k + ξn+1
k=1
und 0 ≤ ξn+1 < 10−(n+1) , wie behauptet.
2. Sei nun x ∈ R beliebig. Nach Hilfssatz 5.1 existiert ein ν ∈ Z mit ν ≤ x < ν +1.
Dann gilt für y :=
∑x − ν natürlich 0 ≤ y < 1 und nach 1) existiert eine Folge
{yn }n mit yn = nk=1 ak · 10−k , ak ∈ {0, 1, . . . , 9}, so dass yn → y (n → ∞)
richtig ist. Also hat xn := ν + yn die gesuchte Form mit a0 := ν ∈ Z, und es
gilt xn → x (n → ∞), wie behauptet.
q.e.d.
Bemerkung: Der Beweis von Satz 5.1 bestätigt übrigens unsere Vorstellung, dass
sich jede reelle Zahl als (unendlicher) Dezimalbruch darstellen lässt. Wir haben hier
nämlich
∞
∑
ak · 10−k = a0 , a1 a2 a3 . . .
x = lim
n→∞
k=0
gezeigt. Allerdings ist diese Darstellung nicht eindeutig, denn z.B. lässt sich die Zahl
1 sowohl als 1, 00000 . . . schreiben, als auch als
0, 999999 . . . =
∞
∑
n=1
9 · 10−n = 9 ·
∞ (
∑
1 )n
9
(4.1)
−9 =
1 − 9 = 1.
10
1
−
10
n=0
Das zentrale Ergebnis dieses Paragraphen (und eigentlich des gesamten Kapitels)
ist nun der folgende
Satz 5.2: (Cauchysches Konvergenzkriterium)
Eine Folge {xn }n ⊂ R ist genau dann konvergent, wenn {xn }n eine Cauchyfolge ist.
Definition 5.2: Ein bewerteter Körper K heißt vollständig, wenn jede Cauchyfolge
{xn }n ⊂ K einen Grenzwert x ∈ K besitzt.
Bemerkungen:
1. Obiger Satz enthält also die Aussage, dass R vollständig ist; genau das ist die
zusätzliche Eigenschaft von R gegenüber Q.
36
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
2. Wir haben Cauchyfolgen und Konvergenz bisher nur in R erklärt. Hierzu
benötigt man aber nur einen Abstandsbegriff“, der in bewerteten Körpern
”
erklärt ist; vgl. Satz 1.4 und die anschließende Bemerkung. Insbesondere ist
Definition 5.2 in C sinnvoll, vgl. § 7.
Beweis von Satz 5.2:
• ⇒“: Sei {xn }n konvergent mit Grenzwert x ∈ R. Dann existiert zu jedem
”
ε > 0 ein N = N (ε) ∈ N mit |xn − x| < 2ε für alle n ≥ N . Folglich haben wir
|xn − xm | ≤ |xn − x| + |xm − x| < ε
für alle m, n ≥ N (ε),
d.h. {xn }n ist Cauchyfolge.
• ⇐“: Sei nun {xn }n Cauchyfolge. Dann existiert zu beliebigem ε > 0 ein
”
N = N (ε) ∈ N, so dass |xn − xm | < 2ε für alle m, n ≥ N (ε). Zu jedem xn ,
n ∈ N, existiert nach Satz 5.1 ein an ∈ Q mit |xn − an | < 4ε . Somit folgt
|an − am | ≤ |an − xn | + |xn − xm | + |xm − am | < ε
für alle m, n ≥ N (ε).
Also ist {an }n eine rationale Cauchyfolge und nach Hilfssatz 4.1 gilt an →
x (n → ∞) mit der reellen Zahl x := [an ]. Wählen wir noch N̂ (ε) ∈ N so groß,
dass |x − an | < 3ε
4 für alle n ≥ N̂ (ε), so erhalten wir schließlich
|x − xn | ≤ |x − an | + |an − xn | <
3ε ε
+ =ε
4
4
für alle n ≥ N̂ (ε),
d.h. die Folge {xn }n konvergiert gegen x.
q.e.d.
So kompakt sich das Cauchysche Konvergenzkriterium auch formulieren lässt, so
ist es doch etwas unanschaulich. Genau umgekehrt verhält es sich mit dem folgenden,
praktischen Intervallschachtelungs-Prinzip: Zunächst benötigen wir aber noch die
Definition 5.3: (Intervalle reeller Zahlen)
Zu a, b ∈ R erklären wir:
• offenes Intervall:
(a, b) := {x ∈ R : a < x < b}.
• abgeschlossenes Intervall:
[a, b] := {x ∈ R : a ≤ x ≤ b}.
• halboffene Intervalle:
(a, b] := {x ∈ R : a < x ≤ b},
[a, b) := {x ∈ R : a ≤ x < b}.
Die Punkte a und b heißen Endpunkte des Intervalls.
5. VOLLSTÄNDIGKEIT REELLER ZAHLEN
37
Bemerkungen:
1. Für a > b sind alle angegebenen Intervalle leer. Für a = b sind offene und
halboffene Intervalle leer, während das abgeschlossene Intervall [a, a] nur den
Punkt a enthält.
2. Es kann auch a = −∞ und b = +∞ gewählt werden, wenn der jeweilige
Endpunkt nicht zum Intervall gehört.
3. Mit |I| = diam(I) := b − a ≥ 0 bezeichnen wie den Durchmesser oder Länge
eines nichtleeren Intervalls I mit den Endpunkten a ≤ b. Offensichtlich gilt für
beliebige x, x′ ∈ I dann |x − x′ | ≤ |I|.
Satz 5.3: (Intervallschachtelungsprinzip)
Es sei I1 ⊃ I2 ⊃ . . . ⊃ In ⊃ In+1 ⊃ . . . eine absteigende Folge von nichtleeren
abgeschlossenen Intervallen in R mit der Eigenschaft
lim |In | = 0.
(5.2)
∩
Dann gibt es genau eine reelle Zahl x mit x ∈ In für alle n ∈ N, d.h. {x} =
In .
n→∞
n∈N
Bemerkung: Die Aussage scheint offensichtlich: Eine Folge von ineinander liegenden
Intervallen, deren Durchmesser gegen 0 geht, zieht sich auf einen Punkt zusammen.
Jedoch wird die Aussage in Q falsch, da der gemeinsame Punkt dann keine rationale
Zahl sein muss.
Beweis von Satz 5.3: Schreiben wir In = [an , bn ], so besagt Formel (5.2), dass zu
jedem ε > 0 ein N = N (ε) ∈ N existiert mit 0 ≤ bn − an < ε für alle n ≥ N (ε). Sind
nun m, n ≥ N , so folgt am , an ∈ IN und somit
|an − am | ≤ |IN | = bN − aN < ε
für alle m, n ≥ N (ε),
d.h. {an }n ist eine Cauchyfolge. Nach Satz 5.2 existiert daher ein Punkt x ∈ R mit
limn→∞ an = x.
Nun gilt am ≤ an ≤ bm für beliebiges m ∈ N und alle n ≥ m. Gemäß Satz 4.1 (c)
liefert der Grenzübergang n → ∞ nun am ≤ x ≤∩bm bzw. x ∈ Im für alle m ∈ N.
Gäbe es schließlich ein weiteres Element x′ ∈ n∈N In , so hätten wir für beliebiges
ε > 0:
|x − x′ | ≤ bN − aN < ε
mit dem oben bestimmten N = N (ε). Also folgt x = x′ .
q.e.d.
Bemerkung: Die Konstruktion
zeigt, dass für eine Intervallschachtelung mit In =
∩
[an , bn ] und {x} =
In gilt
n∈N
lim an = x = lim bn .
n→∞
n→∞
38
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Satz 5.4: Sei c > 0 eine beliebige reelle Zahl. Dann besitzt die Gleichung xs = c für
jedes s ∈ N genau eine positive Lösung x ∈ R.
Beweis:
• Eindeutigkeit: Sind x1 , x2 ∈ R zwei positive Lösungen von xs1 = xs2 = c, so folgt aus der
Summenformel der geometrischen Reihe:
0 = xs1 − xs2 = (x1 − x2 )
s−1
∑
xj1 x2s−j−1 ,
j=0
also x1 = x2 .
• Existenz:
(i) Sei zunächst c ∈ (0, 1). Wir konstruieren induktiv eine Intervallschachtelung I1 ⊃ I2 ⊃
. . ., für die gilt:
( 1 )n−1
In := [an , bn ], |In | =
, asn ≤ c ≤ bsn für alle n ∈ N.
(5.3)
2
Setzen wir I1 = [a1 , b1 ] := [0, 1], so gilt (5.3) offenbar für n = 1. Haben wir die gesuchte
Schachtelung bis zu einem n ∈ N konstruiert, so setzen wir xn := 21 (an + bn ) ∈ In und
erklären
{
[an , xn ], falls xsn ≥ c
In+1 = [an+1 , bn+1 ] :=
.
[xn , bn ], falls xsn < c
Dann ist offenbar In+1 ⊂ In richtig, und wir haben |In+1 | = 21 ( 12 )n−1 = ( 21 )n sowie
asn+1 ≤ c ≤ bsn+1 , also (5.3) für n + 1.
∩
Nach Satz 5.3 existiert nun genau ein x ∈ n∈N In , d.h. an ≤ x ≤ bn und somit
s
s
s
an ≤ x ≤ bn für alle n ∈ N. Nun liefert auch Jn := [asn , bsn ] eine Intervallschachtelung,
denn offenbar gilt Jn+1 ⊂ Jn für alle n ∈ N und wir berechnen
|Jn | = bsn − asn = (bn − an )
Da aber nun c, xs ∈
∩
n∈N
( 1 )n−1
→ 0 (n → ∞).
ajn bs−j−1
≤s
n
2
j=0
s−1
∑
Jn richtig ist, liefert Satz 5.3: xs = c.
(ii) Für c = 1 löst offenbar x = 1 die Gleichung xs = c. Für c > 1 ist c̃ := c−1 ∈ (0, 1)
erfüllt. Mit der in (i) konstruierten positiven Lösung x̃ der Gleichung x̃s = c̃ löst dann
x := x̃−1 > 0 die Gleichung xs = c.
q.e.d.
Definition 5.4: Die in Satz 5.4 konstruierte eindeutige Lösung x > 0 von xs = c
√
heißt s-te Wurzel von c > 0, und wir schreiben s c. Ist q = rs ∈ Q (r ∈ Z, s ∈ N)
beliebig, so setzen wir für die q-te Potenz von c > 0:
√
r
cq = c s := ( s c)r .
Bemerkung: Für alle x, y > 0 und p, q ∈ Q gelten die Rechenregeln
xp y p = (xy)p ,
xp xq = xp+q ,
(xp )q = xpq .
Ebenfalls mittels Intervallschachtelung beweisen wir den fundamentalen
5. VOLLSTÄNDIGKEIT REELLER ZAHLEN
39
Satz 5.5: (Bolzano–Weierstraß)
Jede beschränkte Folge {xn }n ⊂ R besitzt eine konvergente Teilfolge.
Beweis: Da {xn }n beschränkt ist, existiert ein c > 0 mit −c ≤ xn ≤ c für alle n ∈ N.
Wir konstruieren nun eine Intervallschachtelung I1 ⊃ I2 ⊃ . . . mit den Eigenschaften
• Ik enthält unendlich viele Glieder der Folge {xn }n ,
• |Ik | = 2c · ( 12 )k−1 für alle k ∈ N.
Wir starten dazu mit I1 := [−c, c] und definieren im k-ten Schritt Ik+1 wie folgt: Ist
Ik = [ak , bk ], so setzen wir yk := 12 (ak + bk ) und erklären


 [ak , yk ], falls [ak , yk ] unendlich viele Glieder
von {xn }n enthält
Ik+1 = [ak+1 , bk+1 ] :=
.


[yk , bk ], sonst
Wir konstruieren nun eine Teilfolge {xnk }k mit xnk ∈ Ik für alle k ∈ N induktiv wie
folgt:
• Für k = 1 setzen wir n1 = 1, also xn1 = x1 ∈ I1 .
• Ist xnk ∈ Ik für ein k ∈ N, so existiert per Konstruktion ein nk+1 > nk mit
xnk+1 ∈ Ik+1 (da in Ik+1 wieder unendlich viele Glieder von {xn }n liegen).
Wir haben also ak ≤ xnk ≤ bk für alle k ∈ N. Nach Satz 5.3 und der anschließenden
Bemerkung liefert der Grenzübergang k → ∞:
x = lim ak ≤ lim xnk ≤ lim bk = x
k→∞
k→∞
k→∞
mit einem x ∈ R. Also konvergiert {xnk }k gegen x, wie behauptet.
q.e.d.
Definition 5.5: x ∈ R heißt Häufungswert einer Folge {xn }n , wenn es eine Teilfolge {xnk }k gibt mit lim xnk = x.
k→∞
Satz 5.5 besagt also: Jede beschränkte Folge hat einen Häufungswert.
Beispiele:
1. {(−1)n }n besitzt die Häufungswerte −1 und +1.
2. {n}n besitzt keine Häufungswerte, da jede Teilfolge unbeschränkt und damit
nach Satz 4.2 divergent ist.
3. Es gibt aber auch unbeschränkte Folgen mit Häufungswerten, z.B. hat {[1 +
(−1)n ]n}n den Häufungswert 0, da gilt x2k−1 = 0 für alle k ∈ N.
40
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Definition 5.6: Eine Folge {xn }n ⊂ R heißt
(i) monoton wachsend (bzw. fallend), falls xn ≤ xn+1 (bzw. xn ≥ xn+1 ) für alle
n ∈ N gilt.
(ii) streng monoton wachsend (bzw. fallend), falls xn < xn+1 (bzw. xn > xn+1 )
für alle n ∈ N richtig ist.
Bemerkung: Die Sprechweise ist leider nicht eindeutig. In der Literatur wird häufig
z.B. für monoton wachsende Folge auch schwach monoton wachsende“ oder mo”
”
noton nicht fallende“ Folge geschrieben.
Satz 5.6: (Monotone Konvergenz)
Jede beschränkte monotone Folge {xn }n ⊂ R ist konvergent.
Beweis: Sei {xn }n monoton fallend. Da {xn }n beschränkt ist, existiert nach dem Satz von BolzanoWeierstraß eine konvergente Teilfolge {xnk }k . Aus der Relation xnk ≥ xnl für alle k ≤ l erhalten
wir nach Grenzübergang l → ∞ die Ungleichung
xnk ≥ x := lim xnl
l→∞
für alle k ∈ N.
Zu beliebigem ε > 0 gibt es nun ein k0 = k0 (ε) ∈ N mit |xnk − x| < ε für alle k ≥ k0 (ε). Wir setzen
N = N (ε) := nk0 (ε). Für jedes n ≥ N existiert dann ein k ≥ k0 mit nk ≤ n < nk+1 . Die Monotonie
liefert nun
xnk ≥ xn ≥ xnk+1 ≥ x,
bzw. xnk − x ≥ xn − x ≥ 0. Zusammen mit der Konvergenz der Teilfolge {xnk }k folgt
|xn − x| ≤ |xnk − x| < ε
für alle n ≥ N (ε),
wie behauptet. Der Fall einer monoton wachsenden Folge {xn }n ergibt sich nun durch Übergang
zur monoton fallenden Folge {−xn }n .
q.e.d.
Bemerkung: Satz 5.6 liefert ein handliches Konvergenzkriterium. Z.B. ist jeder Dezimalbruch monoton wachsend.; vgl. Satz 5.1. Übrigens ist jede monoton wachsende
Folge nach unten beschränkt, nämlich durch x1 . Entsprechend ist jede monoton
fallende Folge nach oben durch x1 beschränkt.
6
Punktmengen in R
Ist M eine Menge mit endlich vielen Elementen, so kann man diese mittels 1, 2, . . . , n
durchnummerieren: M = {a1 , a2 , . . . , an } mit n = Anzahl der Elemente. Wir sagen,
M ist abzählbar. Um die Situation für unendliche Mengen zu untersuchen, erinnern
wir zunächst an den Begriff einer Bijektion oder bijektiven Abbildung f : M → N
zwischen zwei Mengen M, N :
• f ist surjektiv, falls zu jedem y ∈ N ein x ∈ M mit f (x) = y existiert,
d.h. f (M ) = N .
6. PUNKTMENGEN IN R
41
• f ist injektiv, falls für x1 , x2 ∈ M mit x1 ̸= x2 gilt f (x1 ) ̸= f (x2 ).
• f ist bijektiv, wenn f surjektiv und injektiv ist.
Definition 6.1: Eine unendliche Menge M heißt (unendlich) abzählbar, wenn eine
Bijektion f : N → M existiert. Anderenfalls heißt M überabzählbar.
Bemerkungen:
1. Ist M unendlich abzählbar, so gibt es also eine Folge {xn }n , so dass M = {xn :
n ∈ N}. Wir schreiben auch kurz (und etwas unexakt) M = {xn }n .
2. Zwei Mengen M, N , für die eine Bijektion f : M → N existiert, heißen
gleichmächtig. Eine unendlich abzählbare Menge ist also gleichmächtig zu den
natürlichen Zahlen.
Beispiele:
1. Die Menge N der natürlichen Zahlen ist abzählbar mit der identischen Abbildung f : N → N, n 7→ n.
2. Die ganzen Zahlen Z sind abzählbar mit der Bijektion
{ 1
falls n gerade ist
2 n,
,
f (n) :=
1
(1
−
n),
falls
n
ungerade
ist
2
n ∈ N.
3. Sind M und N abzählbar, so ist auch M ∪ N abzählbar. Deutlich allgemeiner
gilt der folgende
Satz 6.1: Die Vereinigung abzählbar vieler abzählbarer Mengen Mn , n ∈ N, ist
abzählbar.
Beweis: Wir schreiben Mn = {xnm : m ∈ N} für n ∈ N. Die Elemente der Vereinigungsmenge
∪
Mn = {xnm : m, n ∈ N}
n∈N
können wir wie folgt abzählen:
M1 :
M2 :
M3 :
M4 :
..
.
x11 →
↙
x21
↓ ↗
x31
↙
x41
↓
x12
x22
x32
x42
.
↗ ..
x13 → x14
↗
↙
x23
x24
↙
↗
x33
x34
↗
x43
x44
..
..
.
.
...
↗
...
... ,
...
42
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
also mit der Abzählung y1 := x11 , y2 := x12 , y3 := x21 , y4 := x31 , . . . Eventuell
doppelt auftretende Elemente werden bei der Abzählung einfach übergangen.
q.e.d.
Folgerung 6.1: Die Menge der rationalen Zahlen ist abzählbar.
Beweis: Wir setzen Mn := { m
n : m ∈ Z} für n ∈ N. Da Z abzählbar ist, ist auch
Mn abzählbar für jedes n ∈ N. Und nach Satz 6.1 gilt dies auch für die Vereinigung
{m
}
∪
Mn =
: m ∈ Z, n ∈ N = Q,
n
n∈N
wie behauptet.
q.e.d.
Folgerung 6.1 besagt, dass die rationalen Zahlen gleichmächtig zu den natürlichen Zahlen sind. Diese Aussage wird für die reellen Zahlen falsch:
Satz 6.2: Die Menge der reellen Zahlen ist überabzählbar.
Beweis (Cantorsches Diagonalverfahren): Wir zeigen, dass bereits die Menge (0, 1) = {x ∈ R : 0 <
x < 1} überabzählbar ist. Wäre nämlich (0, 1) abzählbar, so gäbe es eine Folge {xn }n mit (0, 1) =
∞
∑
{xn : n ∈ N}. Nach Satz 5.1 können wir jedes xn als Dezimalbruch darstellen: xn =
anm · 10−m
m=1
mit anm ∈ {0, 1, . . . , 9} für alle n, m ∈ N, also
x1 = 0, a11 a12 a13 a14 . . . ,
x2 = 0, a21 a22 a23 a24 . . . ,
x3 = 0, a31 a32 a33 a34 . . . ,
x4 = 0, a41 a42 a43 a44 . . .
Wir betrachten nun y =
∞
∑
cm · 10−m ∈ (0, 1) mit
m=1
{
cm :=
amm + 2,
falls amm ≤ 4,
amm − 2,
falls amm > 4
.
Dann gilt also |cm − amm | = 2 für alle m ∈ N. Also unterscheidet sich y von xm an der m-ten
Nachkommastelle mindestens um 2, so dass folgt
|y − xm | ≥ 10−m
für alle m ∈ N
und insbesondere y ̸∈ {xn : n ∈ N}. Also war die Annahme falsch, d.h. (0, 1) und damit auch R
sind überabzählbar.
q.e.d.
Folgerung 6.2: Die Menge der irrationalen Zahlen R \ Q ist überabzählbar.
Beweis: Anderenfalls wäre nach Folgerung 6.1 auch (R \ Q) ∪ Q = R abzählbar, im
Widerspruch zu Satz 6.2.
q.e.d.
Wir untersuchen nun Teilmengen von R genauer und beginnen mit der
6. PUNKTMENGEN IN R
43
Definition 6.2: Eine Menge M ⊂ R heißt nach oben (bzw. unten) beschränkt,
wenn ein c ∈ R existiert mit
x≤c
(bzw. x ≥ c)
für alle x ∈ M.
Man nennt dann c obere (bzw. untere) Schranke von M . Schließlich heißt die Menge
M beschränkt, wenn sie sowohl nach oben als auch nach unten beschränkt ist.
Bemerkungen:
1. M ist genau dann beschränkt, wenn ein c > 0 existiert mit |x| ≤ c für alle
x ∈ M.
2. Die zu einer beschränkten Folge {xn }n ⊂ R gehörige Menge {xn : n ∈ N} ist
offenbar beschränkt.
Definition 6.3:
(a) Ist M ⊂ R nach oben beschränkt, so heißt σ ∈ R kleinste obere Schranke oder
Supremum von M , i.Z. σ = sup M , falls folgendes gilt:
(i) σ ist obere Schranke von M , d.h. x ≤ σ für alle x ∈ M .
(ii) Für jede weitere obere Schranke σ̂ von M gilt σ ≤ σ̂.
(b) Entsprechend heißt τ ∈ R größte untere Schranke oder Infimum, i.Z. τ =
inf M , zu einer nach unten beschränkten Menge M ⊂ R, wenn gilt
(i) τ ist untere Schranke von M .
(ii) Für jede weitere untere Schranke τ̂ von M gilt τ ≥ τ̂ .
Aus der Definition ist sofort klar, dass Infimum und Supremum, wenn sie existieren, eindeutig bestimmt sind. Außerdem haben wir die folgende Charakterisierung
von Infimum und Supremum:
Hilfssatz 6.1: Sei M ⊂ R nach oben beschränkt. Dann gilt σ = sup M genau dann,
wenn σ obere Schranke ist und zu jedem ε > 0 ein x ∈ M existiert mit x ≥ σ − ε.
Entsprechend ist τ = inf M für eine nach unten beschränkte Menge M ⊂ R genau
dann richtig, wenn τ untere Schranke ist und zu jedem ε > 0 ein x ∈ M existiert
mit x ≤ τ + ε.
Beweis: Übungsaufgabe!
Satz 6.3: Jede nichtleere, nach oben (bzw. unten) beschränkte Menge M ⊂ R besitzt
ein Supremum (bzw. Infimum).
44
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis: Wir zeigen nur die Existenz des Supremums. Die des Infimums folgt dann
durch Übergang zur Menge −M := {x ∈ R : −x ∈ M }.
Zum Beweis betrachten wir wieder eine Intervallschachtelung: Wir konstruieren
Intervalle In = [xn , cn ] mit In+1 ⊂ In für alle n ∈ N, so dass gilt:
|In | ≤
( 1 )n−1
2
(c1 − x1 ),
xn ∈ M,
cn ist obere Schranke an M.
(6.1)
• n = 1: Da M nichtleer und nach oben beschränkt ist, existiert ein x1 ∈ M und
ein c1 mit x ≤ c1 für alle x ∈ M .
• n → n + 1: Sei In = [xn , cn ] konstruiert mit den Eigenschaften (6.1). Dann
setzen wir yn := 12 (xn + cn ) und erklären In+1 wie folgt:
(i) Falls M ∩ [yn , cn ] = ∅, dann ist yn obere Schranke an M und wir setzen
xn+1 := xn ∈ M , cn+1 := yn .
(ii) Falls M ∩ [yn , cn ] ̸= ∅, so existiert ein xn+1 ≥ yn mit xn+1 ∈ M . Dann
setzen wir cn+1 := cn .
Offenbar ist dann (6.1) erfüllt für In+1 und wir haben In+1 ⊂ In .
Nach Satz 5.3 und der
∩ anschließenden Bemerkung konvergieren die Folgen {xn }n
und {cn }n gegen σ ∈ n∈N In . Wir zeigen noch σ = sup M :
Wegen x ≤ cn für alle x ∈ M und n ∈ N liefert Grenzübergang x ≤ σ für alle
x ∈ M , d.h. σ ist obere Schranke. Gäbe es eine obere Schranke σ̂ < σ, so wäre
σ − σ̂ > 0. Wegen limn→∞ xn = σ existierte dann ein N ∈ N mit |xN − σ| < σ − σ̂
und folglich
xN ≥ σ − |xN − σ| > σ − (σ − σ̂) = σ̂,
im Widerspruch zu xN ∈ M .
q.e.d.
Beispiele:
1. Sei [a, b) ein halboffenes Intervall mit a < b. Dann gilt
inf[a, b) = a,
sup[a, b) = b.
In der Tat ist a offenbar untere Schranke von [a, b) := {x ∈ R : a ≤ x < b}. Und jede weitere
untere Schranke a′ muss a′ ≤ a erfüllen, d.h. a = inf[a, b).
Andererseits ist offenbar b obere Schranke für [a, b). Und ist ε > 0 beliebig gewählt, so setzen
wir x := max{a, b − ε}. Dann ist x ∈ [a, b) und x ≥ b − ε richtig, und nach Hilfssatz 6.1 gilt
b = sup[a, b).
: n ∈ N} ist inf A = 1 erfüllt, denn es gelten n+1
> 1 für alle n ∈ N und
2. Für A := { n+1
n
n
n+1
≤
1
+
ε
für
beliebiges
ε
>
0
und
hinreichend
großes n ∈ N.
lim n = 1, also auch n+1
n
n→∞
6. PUNKTMENGEN IN R
45
Bemerkungen:
1. Obige Beispiele zeigen, dass inf M zur Menge M dazu gehören kann oder nicht.
Wenn inf M ∈ M gilt, so schreiben wir auch min M := inf M für das Minimum
von M . Ebenso sprechen wir vom Maximum von M , falls sup M ∈ M gilt und
schreiben dann max M := sup M . Man beachte, dass für Mengen mit endlich
vielen Elementen immer min M = inf M und max M = sup M erfüllt sind.
2. Für nach oben bzw. nach unten unbeschränkte Mengen M ⊂ R schreiben wir
auch
sup M = +∞ bzw. inf M = −∞.
Wir wenden uns nun wieder reellen Folgen zu. In Definition 5.5 haben wir den
Begriff des Häufungswertes einer Folge {xn }n als Grenzwert einer Teilfolge {xnk }k
erklärt. Betrachtet man alle Häufungswerte einer Folge, wird man auf die folgenden
Begriffe geführt:
Definition 6.4: Sei {xn }n ⊂ R eine beschränkte Folge und bezeichne H die Menge
ihrer Häufungswerte. Wir setzen dann
lim inf xn := inf H
(Limes inferior),
n→∞
lim sup xn := sup H
(Limes superior).
n→∞
Bemerkung: Offenbar ist H beschränkt, wenn {xn }n beschränkt ist. Man beachte
noch
lim inf (−xn ) = − lim sup xn , lim sup(−xn ) = − lim inf xn .
n→∞
n→∞
n→∞
n→∞
Beispiel: Die Folge {xn }n = {(−1)n + n1 }n ist offenbar beschränkt und wir haben
die konvergenten Teilfolgen
x2k = 1 +
1
→ 1 (k → ∞),
2k
x2k−1 = −1 +
1
→ −1 (k → ∞).
2k − 1
Also gilt H = {−1, 1} und lim inf n→∞ xn = −1, lim supn→∞ xn = 1. Man beachte,
dass lim inf n→∞ xn und lim supn→∞ xn zu H gehören. Dies ist immer so:
Satz 6.4: lim inf n→∞ xn ist der kleinste, lim supn→∞ xn der größte Häufungswert
einer beschränkten Folge {xn }n ⊂ R, d.h.
lim inf xn = min H,
n→∞
lim sup xn = max H.
n→∞
46
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis: Wir haben zu zeigen, dass ξ := lim inf n→∞ xn = inf H ∈ H richtig ist, also eine Teilfolge
{xnk }k mit limk→∞ xnk = ξ existiert. Angenommen es gäbe keine solche Teilfolge. Dann existiert
also ein ε > 0 und ein N ∈ N, so dass
|ξ − xn | ≥ ε
für alle n ≥ N
erfüllt ist. Andererseits ist ξ = inf H, nach Hilfssatz 6.1 gibt es also ein y ∈ H mit
ε
ξ≤y≤ξ+ .
2
(6.2)
(6.3)
Zum Häufungswert y ∈ H existiert eine Teilfolge {xnk }k von {xn }n mit xnk → y (k → ∞).
Wir wählen nun k̂ so groß, dass nk̂ ≥ N und |xnk̂ − y| < 2ε gilt. Wegen ξ ≤ y haben wir dann
ξ − xnk̂ ≤ y − xnk̂ < 2ε und folglich liefert (6.2) sogar ξ ≤ xnk̂ − ε. Aus (6.3) folgt schließlich
xnk̂ <
(6.3)
ε
+ y ≤ ξ + ε ≤ xnk̂ − ε + ε = xnk̂ ,
2
also der Widerspruch xnk̂ < xnk̂ . Somit muss doch lim inf n→∞ xn ∈ H gelten. Durch Übergang zur
Folge {−xn }n folgt schließlich noch lim supn→∞ xn ∈ H.
q.e.d.
Satz 6.5: (Charakterisierung von lim sup)
Sei {xn }n ⊂ R eine beschränkte Folge und η ∈ R. Dann ist η = lim supn→∞ xn
genau dann erfüllt, wenn gilt:
(i) η ist Häufungswert von {xn }n .
(ii) Für alle ε > 0 existiert ein N = N (ε) ∈ N, so dass gilt
xn < η + ε
für alle n ≥ N (ε).
Beweis:
• ⇒“: Sei also η = lim supn→∞ xn . Nach Satz 6.4 ist dann η ∈ H, also (i) erfüllt.
”
Wäre (ii) falsch, so gäbe es ein ε > 0 und eine Teilfolge {x′k }k = {xnk }k mit
x′k ≥ η + ε für alle k ∈ N.
(6.4)
Da {x′k }k beschränkt ist, existiert nach dem Satz von Bolzano–Weierstraß eine
weitere Teilfolge {x′kl }l ⊂ {x′k }k ⊂ {xn }n und ein ζ ∈ R mit x′kl → ζ (l → ∞).
Also ist ζ ∈ H und somit ζ ≤ η. Andererseits liefert aber (6.4) angewendet auf
{x′kl }l nach Grenzübergang l → ∞: ζ ≥ η + ε, Widerspruch!
• ⇒“: Seien nun (i) und (ii) erfüllt. Wäre η ̸= lim supn→∞ xn = max H, so gäbe
”
es ein ζ ∈ H mit ζ > η. Wir setzen ε := ζ−η
2 . Für die Teilfolge {xnk }k mit
limk→∞ xnk = ζ existiert dann ein k̂ ∈ N, so dass nk̂ ≥ N (ε) und |xnk̂ − ζ| < ε
richtig ist. Aus (ii) für n = nk̂ erhalten wir dann
xnk̂ < η + ε = η +
ζ −η
ζ −η
=ζ−
= ζ − ε < xnk̂ ,
2
2
Widerspruch! Also ist η = max H, wie behauptet.
q.e.d.
7. DIE KOMPLEXEN ZAHLEN
47
Wir halten noch die entsprechende Aussage für den Limes inferior fest:
Satz 6.6: (Charakterisierung von lim inf)
Sei {xn }n eine beschränkte Folge und ξ ∈ R. Dann ist ξ = lim inf n→∞ xn genau
dann erfüllt, wenn gilt:
(i) ξ ist Häufungswert von {xn }n .
(ii) Für alle ε > 0 existiert ein N = N (ε) ∈ N, so dass gilt
xn > ξ − ε
für alle n ≥ N (ε).
Bemerkungen:
1. Ohne Beweis notieren wir die Identitäten
(
)
lim sup xn = lim sup{xk : k ≥ n} ,
n→∞
n→∞
)
(
lim inf xn = lim inf{xk : k ≥ n} .
n→∞
n→∞
Diese Darstellungen werden häufig auch als Definition von lim sup und lim inf
verwendet. Sie sind zwar etwas unanschaulich, haben aber den Vorteil, dass
sie auch für unbeschränkte Folgen Sinn machen: Ist {xn }n etwa nach oben
unbeschränkt, so ist sup{xk : k ≥ n} = +∞ für alle n ∈ N. Dann setzen wir
lim sup xn = +∞.
n→∞
Entsprechend ist für eine nach unten unbeschränkte Folge
lim inf xn = −∞.
n→∞
2. Als Übungsaufgabe zeige man: Eine Folge {xn }n ⊂ R ist genau dann konvergent gegen α ∈ R, wenn sie beschränkt ist und wenn gilt
lim inf xn = α = lim sup xn .
n→∞
7
n→∞
Die komplexen Zahlen
Ausgehend von der reellen Ebene R2 = R × R der geordneten Paare z = (x, y) ∈ R2 ,
wollen wir nun den Körper der komplexen Zahlen C definieren. Hierzu erklären wir
Addition und Multiplikation wie folgt: Für z1 = (x1 , y1 ), z2 = (x2 , y2 ) setzen wir
z1 + z2 := (x1 + x2 , y1 + y2 )
(komplexe Addition),
z1 · z2 = z1 z2 := (x1 x2 − y1 y2 , x1 y2 + x2 y1 )
(komplexe Multiplikation).
(7.1)
Geometrisch entspricht die Addition in C der Vektoraddition in R2 . Eine geometrische Deutung der komplexen Multiplikation folgt erst im 3. Kapitel.
48
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Satz 7.1: (R2 , +, ·) ist ein Körper mit
Nullelement:
0 := (0, 0),
Einselement:
1 := (1, 0),
negativem Element: zu z = (x, y) setzen wir −z := (−x, −y),
( x
−y )
inversem Element:
zu z = (x, y) ̸= 0 setzen wir z −1 := x2 +y
2 , x2 +y 2 .
Wir schreiben (C, +, ·) oder einfach C für den Körper der komplexen Zahlen.
Beweis:
1. Die Axiome (A1) und (A2) sind offensichtlich, indem man die entsprechenden Gesetze für
R komponentenweise benutzt. Ebenso folgt auch (A3) mit dem oben erklärten Nullelement.
Schließlich haben wir für z = (x, y):
(7.1)
z + (−z) =
(
)
x + (−x), y + (−y) = (0, 0) = 0,
also (A4).
2. (M1) ist wieder klar, da die komplexe Multiplikation symmetrisch bezüglich der Vertauschungen x1 ↔ x2 und y1 ↔ y2 ist. Zum Beweis von (M2) betrachten wir z1 = (x1 , y1 ),
z2 = (x2 , y2 ), z3 = (x3 , y3 ) und berechnen
(z1 z2 )z3 = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) · (x3 , y3 )
(
)
= (x1 x2 − y1 y2 )x3 − (x1 y2 + x2 y1 )y3 , (x1 x2 − y1 y2 )y3 + (x1 y2 + x2 y1 )x3
und
z1 (z2 z3 ) = (x1 , y1 ) · (x2 x3 − y2 y3 , x2 y3 + x3 y2 )
(
)
= x1 (x2 x3 − y2 y3 ) − y1 (x2 y3 + x3 y2 ), x1 (x2 y3 + x3 y2 ) + y1 (x2 x3 − y2 y3 ) .
Ein Vergleich der rechten Seiten zeigt (M2). Mit dem oben erklärten Einselement (1, 0) haben
wir für beliebiges z = (x, y) ∈ C:
z · 1 = (x, y) · (1, 0) = (x · 1 − y · 0, x · 0 + y · 1) = (x, y) = z,
also (M3). Schließlich gilt auch (M4), denn wir berechnen mit der Inversen zu z = (x, y) ̸= 0:
( x
−y )
zz −1 = (x, y) ·
,
x2 + y 2 x2 + y 2
(
x
−y
−y
x )
=
x 2
−y 2
,x 2
+y 2
2
2
2
x +y
x +y
x +y
x + y2
= (1, 0) = 1.
3. Das Distributivgesetz lässt sich leicht als Übungsaufgabe nachrechnen.
Bemerkungen:
1. Wir können wieder Subtraktion und Division erklären:
z1 − z2 := z1 + (−z2 ),
z1
:= z1 · z2−1 ,
z2
falls z2 ̸= 0.
q.e.d.
7. DIE KOMPLEXEN ZAHLEN
49
2. Es gelten alle für beliebige Körper abgeleiteten Rechenregeln. Insbesondere
sind Null- und Einselement sowie negatives und inverses Element eindeutig
bestimmt.
Wir wollen nun den Körper R als Unterkörper von C identifizieren: Hierzu betrachten wir die Teilmenge
{
}
CR := z = (x, y) ∈ C : y = 0 .
Für beliebige z1 = (x1 , 0), z2 = (x2 , 0) ∈ CR erhalten wir dann aus (7.1):
(x1 , 0) + (x2 , 0) = (x1 + x2 , 0),
(x1 , 0) · (x2 , 0) = (x1 · x2 , 0).
Also sind mit z1 , z2 ∈ CR auch z1 + z2 , z1 · z2 ∈ CR . Ferner gilt 0, 1 ∈ CR . Und mit
z ∈ CR ist offenbar auch −z ∈ CR und für z ̸= 0 auch z −1 ∈ CR richtig. Also ist CR
ein Unterkörper von C, d.h. eine Teilmenge von C, die bez. der Rechenoperationen
in C einen Körper bildet.
Da außerdem die komplexe Addition und Multiplikation von Elementen aus CR
in der ersten Komponente den reellen Operationen entsprechen, können wir CR mit
R identifizieren durch den Körperisomorphismus:
i : R → CR ,
x 7→ (x, 0).
In diesem Sinne gilt also
R ⊂ C.
Geometrisch: In der komplexen Ebene C werden die Zahlen auf der x-Achse als
reelle Zahlen aufgefasst; man spricht daher von der reellen Achse. Die y-Achse heißt
imaginäre Achse.
Die wichigste komplexe Zahl ist die imaginäre Einheit
i := (0, 1).
Sie hat die Eigenschaft
i2 = (0, 1) · (0, 1) = (−1, 0) = −1,
d.h. z = i ist Lösung der Gleichung
z 2 + 1 = 0.
Mit i berechnen wir für beliebige z = (x, y) ∈ C:
x + iy = (x, 0) + (0, 1)(y, 0) = (x, y) = z.
(7.2)
50
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Die linke Seite dieser Gleichung werden wir i.F. als Schreibweise für die komplexe
Zahl z verwenden, also
z = x + iy, x, y ∈ R.
Dabei heißt x Realteil und y Imaginärteil von z, und wir schreiben
x = Re z,
y = Im z.
Zwei Zahlen z1 , z2 ∈ C stimmen genau dann überein, wenn sowohl ihr Real- als auch
ihr Imaginärteil übereinstimmen.
Wir bemerken, dass man mit komplexen Zahlen wie mit reellen rechnen kann,
wenn man (7.2) beachtet. Z.B. ist
z 2 = (x + iy)2 = x2 + 2ixy + (iy)2
(7.2)
= x2 + 2ixy + i2 y 2 = x2 + 2ixy − y 2
richtig, also
Re(z 2 ) = x2 − y 2 ,
Im(z 2 ) = 2xy.
Schließlich sei angemerkt, dass C nicht angeordnet werden kann: Gäbe es nämlich
den Begriff der Positivität, so dass (O1) und (O2) aus Definition 1.2 erfüllt sind, so
folgte daraus z.B. für i ̸= 0 nach Satz 1.3 (f): i2 > 0. Wegen Formel (7.2) ist aber
i2 = −1 < 0, denn es gilt 1 = 12 > 0, Widerspruch! Wir werden aber gleich sehen,
dass wir C bewerten können.
Definition 7.1: Sei z = x + iy ∈ C, so heißt
z := x − iy
die konjugiert komplexe Zahl zu z; Sprechweisen: z konjugiert“ oder z quer“. Mit
”
”
√
|z| := x2 + y 2
bezeichnen wir den Betrag von z.
Bemerkungen:
1. Die Konjugation z 7→ z entspricht geometrisch einer Spiegelung an der reellen
Achse. Es gelten die Rechenregeln
1
Re z = (z + z),
2
Im z =
1
(z − z)
2i
(7.3)
sowie
z = z,
z1 + z2 = z1 + z2 ,
z1 · z2 = z1 · z2 .
(7.4)
7. DIE KOMPLEXEN ZAHLEN
51
2. Der Betrag |z| von z ∈ C entspricht geometrisch dem Abstand zum Nullpunkt
(gemessen in der euklidischen Metrik). Es gilt
|z|2 = z · z,
|z| = |z|.
(7.5)
Satz 7.2: Der Betrag in C hat folgende Eigenschaften:
(a) Es gilt |z| ≥ 0 für alle z ∈ C und |z| = 0 ⇔ z = 0.
(b) Für alle z1 , z2 ∈ C ist |z1 z2 | = |z1 | |z2 | erfüllt.
(c) Für alle z1 , z2 ∈ C ist |z1 + z2 | ≤ |z1 | + |z2 | richtig.
Also ist C ein bewerteter Körper im Sinne von § 1.
Bemerkung: Die geometrische Deutung der komplexen Addition als Vektoraddition
im R2 erklärt nun auch den Begriff Dreiecksungleichung für die Relation (c).
Beweis von Satz 7.2:
(a) |z|
√ ≥ 0 für alle z ∈ C ist per Definition klar. Und wir bemerken |z| =
x2 + y 2 = 0 gdw. x2 + y 2 = 0 gdw. x = y = 0 gdw. z = 0.
(b) Für z1 , z2 ∈ C berechnen wir
√
(7.4) √
(z1 z2 )(z1 z2 ) =
(z1 z2 )(z1 z2 )
√
(7.5) √
(z1 z1 )(z2 z2 ) =
|z1 |2 |z2 |2 = |z1 | |z2 |,
=
|z1 z2 | =
|z1 z2 |2
(7.5)
=
√
wie behauptet.
(c) Wir beachten |z| ≥ |Re z| für beliebige z ∈ C. Damit erhalten wir
|z1 + z2 |2
(7.5)
=
(7.4),(7.5)
=
(7.3)
=
(b),(7.5)
≤
(z1 + z2 )(z1 + z2 )
(7.4)
=
z1 z1 + (z1 z2 + z2 z1 ) + z2 z2
|z1 |2 + (z1 z2 + z1 z2 ) + |z2 |2
|z1 |2 + 2Re(z1 z2 ) + |z2 |2
|z1 |2 + 2|z1 | |z2 | + |z2 |2 = (|z1 | + |z2 |)2 ,
und die Behauptung folgt.
q.e.d.
Wir wollen nun Punktfolgen {zn }n im Körper C betrachten und erklären in
Analogie zu den Definitionen 4.1-4.3:
52
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Definition 7.2: Eine Folge {zn }n ⊂ C heißt
• beschränkt, falls ein c > 0 existiert mit |zn | ≤ c für alle n ∈ N.
• Cauchyfolge, falls für alle ε > 0 ein N (ε) ∈ N existiert mit
|zn − zm | < ε
für alle m, n ≥ N (ε).
• konvergent gegen z ∈ C, falls für alle ε > 0 ein N (ε) ∈ N existiert mit
|zn − z| < ε
für alle n ≥ N (ε).
Wir schreiben lim zn = z oder zn → z (n → ∞).
n→∞
• Nullfolge, falls {zn }n gegen 0 konvergiert.
Bemerkung: Nennen wir {ζ ∈ C : |z −ζ| < ε} wieder eine ε-Umgebung von z ∈ C, so
konvergiert {zn }n genau dann gegen z, wenn in jeder (noch so kleinen) ε-Umgebung
von z fast alle Glieder der Folge liegen. In C ist eine ε-Umgebung von z, geometrisch
gesehen, eine (offene) Kreisscheibe um z vom Radius ε > 0; wir schreiben daher
auch
{
}
Kε (z) := ζ ∈ C : |z − ζ| < ε .
Wir wollen nun zeigen, dass C auch vollständig ist. Zur Vorbereitung notieren
wir den folgenden
Hilfssatz 7.1: Eine Folge {zn }n ⊂ C ist genau dann konvergent (bzw. Cauchyfolge,
Nullfolge, beschränkt), wenn die reellen Folgen {Re(zn )}n und {Im(zn )}n konvergent
(bzw. Cauchyfolgen, Nullfolgen, beschränkt) sind. Für konvergente Folgen {zn }n gilt
lim zn = lim Re(zn ) + i lim Im(zn ).
n→∞
n→∞
n→∞
Beweis: Die Aussagen ergeben sich sofort aus den Relationen
|Re z| ≤ |z|,
|Im z| ≤ |z|,
die man leicht als Übungsaufgabe bestätigt.
|z| ≤ |Re z| + |Im z|,
q.e.d.
Satz 7.3: (Cauchysches Konvergenzkriterium in C)
Eine Folge {zn }n ⊂ C ist genau dann konvergent, wenn sie Cauchyfolge ist. Insbesondere ist C ein vollständiger (bewerteter) Körper.
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
53
Beweis: Aus Hilfssatz 7.1 und dem Cauchyschen Konvergenzkriterium in R folgern
wir:
{zn }n ist konvergent
HS 7.1
⇐⇒
{Re(zn )}n , {Im(zn )}n ⊂ R sind konvergent
Satz 5.2
⇐⇒
{Re(zn )}n , {Im(zn )}n ⊂ R sind Cauchyfolgen
HS 7.1
⇐⇒
{zn }n ist Cauchyfolge,
wie behauptet.
q.e.d.
Als Übung beweist man noch den folgenden
Satz 7.4: (Rechenregeln für komplexe Grenzwerte)
• Ist {zn }n ⊂ C eine konvergente Folge, so konvergiert auch {zn }n und es gilt
lim zn = lim zn .
n→∞
n→∞
• Ist {ζn }n ⊂ C eine weitere konvergente Folge, so konvergieren auch {zn + ζn }n
und {zn · ζn }n mit
lim (zn + ζn ) = lim zn + lim ζn ,
n→∞
n→∞
)
) (
(
lim (zn · ζn ) = lim zn · lim ζn .
n→∞
n→∞
n→∞
n→∞
• Gilt schließlich noch ζn ̸= 0 für alle n ∈ N und limn→∞ ζn ̸= 0, so konvergiert
auch { zζnn }n mit
(z )
lim zn
n
lim
= n→∞ .
n→∞ ζn
lim ζn
n→∞
8
Konvergenzkriterien für Reihen (in C)
In § 4 haben wir Reihen in R definiert und den Begriff der Konvergenz einer Reihe
eingeführt. Mit dem in § 7 gegebenen Konvergenzbegriff ∑
für Folgen in C sagen wir
nun entsprechend: Ist {zk }k∈N ⊂ C, so heißt die∑Reihe ∞
k=1 zk konvergent, wenn
n
die Folge der Partialsummen
{s
}
mit
s
:=
z
,
n
∈ N, konvergiert. Wir
n
n
n
k
k=1
∑∞
schreiben wieder
z
sowohl
für
die
Reihe
als
auch,
wenn
existent, für den
k=1 k
Grenzwert
(∑
)
n
∞
∑
lim sn = lim
zk =:
zk ,
n→∞
n→∞
k=1
k=1
54
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
also den Wert oder die Summe der Reihe. Wenden wir Hilfssatz
7.1 auf die Folge
∑∞
{sn }n der Partialsummen
an, so folgt ∑
noch: Die komplexe Reihe k=1 zk konvergiert
∑
∞
genau dann, wenn ∞
Re(z
)
und
k
k=1
k=1 Im(zk ) konvergieren, und es gilt
∞
∑
zk =
k=1
∞
∑
Re(zk ) + i
k=1
∞
∑
Im(zk ).
k=1
∑
Wenn die Reihe ∞
k=1 zk nicht konvergent ist, heißt sie divergent. Wenn zk =
xk ∈ R für alle k ∈ N und
lim sn = ±∞
n→∞
gilt, so heißt die Reihe bestimmt divergent (gegen ±∞).
∑
Es sei schließlich angemerkt, dass wir natürlich auch Reihen der Form ∞
k=k0 zk
mit einem k0 ∈ N0 (oder sogar k0 ∈ Z) betrachten können (und
∑ werden). Falls
klar ist, über welche k summiert wird, schreiben wir auch kurz k zk für die Reihe
bzw. ihren Wert.
Im vorliegenden Paragraphen werden wir eine Anzahl wichtiger Konvergenzkriterien für Reihen kennenlernen, die wir (soweit sinnvoll) in C formulieren und die
als Spezialfall natürlich auch für reelle Reihen gelten. Wir beginnen mit dem
Konvergenzkriterium für Reihen)
Satz 8.1: (Cauchysches
∑∞
Eine Reihe
z
in
C
konvergiert genau dann, wenn für beliebige ε > 0 ein
k=1 k
N = N (ε) ∈ N existiert, so dass gilt
∑
n
zk < ε
für alle n > m ≥ N (ε).
(8.1)
k=m+1
Beweis: Wir bemerken
∑
∑
m
∑
n
n
|sn − sm | = zk −
zk = zk für alle n > m.
k=1
k=1
k=m+1
Also ist (8.1) äquivalent dazu, dass {sn }n eine Cauchyfolge bildet und somit
∑ nach
Satz 7.3 auch äquivalent zur Konvergenz der Folge {sn }n bzw. der Reihe k zk .
q.e.d.
∑
Bemerkung: Satz 8.1 zeigt übrigens auch: Die Reihe ∞
konvergiert (bzw. dik=1 zk ∑
∞
vergiert) genau dann, wenn für beliebige k0 ∈ N die Reihe
k=k0 zk konvergiert
(bzw. divergiert). Die ersten endlich vielen Glieder beeinflussen das Konvergenzverhalten der Reihe also nicht (aber natürlich ihren Wert).
Das folgende Kriterium eignet sich eher zum Ausschluss der Konvergenz:
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
Satz 8.2: Wenn
∑∞
k=1 zk
55
(zk ∈ C für alle k ∈ N) konvergiert, so muss gelten
lim zk = 0.
k→∞
∑
Beweis: Sei k zk konvergent und ε > 0 beliebig gewählt. Nach Satz 8.1 existiert
dann ein N (ε) ∈ N mit |zn | < ε für alle n > N (ε) (wende (8.1) mit m = n − 1 an).
Also ist {zn }n Nullfolge.
q.e.d.
∑
k
k
Zum Beispiel divergiert also die Reihe ∞
k=1 (−1) , da {(−1) }k keine Nullfolge ist. Wie wir am Beispiel der harmonischen Reihe jetzt sehen werden, ist das
Kriterium aus Satz 8.2 nicht hinreichend:
Beispiel: Harmonische Reihe
∞
∑
k=1
1
k.
Zwar bildet { k1 }k eine Nullfolge, aber die Reihe ist nicht konvergent. In der Tat gilt
für beliebiges m ∈ N:
∑
2m
∑
2m 1 1
m
1
≥
=
= .
k
2m
2m
2
k=m+1
k=m+1
Also ist das Cauchysche Konvergenzkriterium (8.1) für ε <
1
2
nicht erfüllbar.
Für reelle Reihen mit nichtnegativen Einträgen gilt der folgende
∑
Satz 8.3: Die Reihe ∞
k=1 xk mit xk ∈ R und xk ≥ 0 für alle k ∈ N konvergiert
genau dann, wenn die zugehörige Folge der Partialsummen beschränkt ist.
Bemerkung: Falls die Folge der Partialsummen einer (komplexen) Reihe
beschränkt ist, sagen wir die Reihe ist beschränkt und schreiben
∑∞
k=1 zk
∞ ∑ zk < +∞.
k=1
Die Folge
Reihe.
∑∞
k=1 (−1)
k
ist ein Beispiel einer beschränkten, aber nicht konvergenten
∑
Beweis von Satz 8.3: Wegen xk ≥ 0 ist die Folge der Partialsummen sn = nk=1 xk
monoton wachsend. Satz 5.6 über die monotone Konvergenz liefert also die Konvergenz der Reihe, wenn wir ihre Beschränktheit voraussetzen. Umgekehrt ist natürlich
jede konvergente Reihe auch beschränkt.
q.e.d.
56
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Im Falle sogenannter alternierender Reihen haben wir die folgende Aussage:
Satz 8.4: (Konvergenzkriterium von Leibniz)
Ist {xk }k ⊂ R eine monoton fallende Nullfolge, so konvergiert die Reihe
∞
∑
(−1)k xk .
k=1
Wir verzichten an dieser Stelle auf einen Beweis, da sich Satz 8.4 als Spezialfall
von Satz 9.3 ergeben wird.
Beispiel: Die Reihen
∞
∑
(−1)k
k=1
∞
∑
k=0
( alternierende harmonische Reihe),
k
(−1)k
2k + 1
( Leibnizreihe)
konvergieren offenbar nach Satz 8.4. Wir werden später berechnen
∞
∑
(−1)k
k=1
k
= − log 2,
∞
∑
(−1)k
π
= .
2k + 1
4
k=0
Definition
8.1: Eine komplexe Reihe
∑
Reihe ∞
k=1 |zk | konvergiert.
∑∞
k=1 zk
heißt absolut konvergent, wenn die
Bemerkungen:
1. Jede absolut konvergente Reihe konvergiert auch im gewöhnlichen Sinn: Denn
nach der Dreiecksungleichung in C gilt
n
n
∑
∑
|zk |
z
≤
k
k=m+1
für alle n > m,
k=m+1
und Satz 8.1 liefert die Behauptung.
2. Es gibt Reihen, die zwar im gewöhnlichen Sinn aber nicht absolut konvergieren,
z.B. die alternierende harmonische Reihe.
∑
∑∞
3. Sind ∞
absolut konvergente Reihen, so ist auch jede
k=1 zk und
k=1 ζk zwei∑
(komplexe) Linearkombination ∞
k=1 (αzk + βζk ) mit α, β ∈ C absolut konvergent; dies folgt aus Satz 7.4 angewendet auf die Folge der Partialsummen.
Entsprechendes gilt natürlich auch für Linearkombinationen konvergenter Reihen.
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
57
Eines der wichtigsten Konvergenzkriterien enthält nun der folgende
Satz 8.5: (Majorantenkriterium)
Zwei Folgen {zk }k ⊂ C und {µk }k ⊂ R mit
|zk | ≤ µk
für alle k ∈ N
∑∞
∑∞
seien gegeben. Dann
gilt:
Konvergiert
die
Reihe
µ
,
so
konvergiert
k
k=1
k=1 zk
∑
∑
absolut. Die Reihe k µk heißt Majorante von k zk .
Beweis: Zu beliebigem ε > 0 existiert nach Satz 8.1 ein N (ε) ∈ N mit
n
∑
n
∑
|zk | ≤
k=m+1
für alle n > m ≥ N (ε).
µk < ε
k=m+1
Wiederum nach Satz 8.1 konvergiert also auch
lut.
∑
k
|zk |, d.h.
∑
k zk
konvergiert absoq.e.d.
Folgerung 8.1: (Minorantenkriterium)
Sind {xk }k , {µk }k ⊂ R gegeben mit
xk ≥ µk ≥ 0
für alle k ∈ N
∑∞
∑
und divergiert
k=1 µk , so divergiert auch
k=1 xk . Die Reihe
k µk heißt Mino∑
rante von k xk .
∑
∑
Beweis: Wäre nämlich
k xk konvergent, so wäre
k µk nach Satz 8.5 ebenfalls
konvergent, Widerspruch!
q.e.d.
∑∞
Beispiele:
∑
k
1. Die Reihe ∞
k=0 z konvergiert absolut für |z| < 1 und divergiert für |z| > 1.
Ersteres folgt aus Satz 8.5, da
∞
∑
(4.1)
|z|k =
k=0
1
1 − |z|
eine konvergente Majorante ist. Und letzteres aus Satz 8.2, da {z k }k keine
Nullfolge ist für |z| > 1.
2. Die Reihe
∑∞
1
k=1 kα
konvergiert (absolut) für rationales α ≥ 2. Wir haben nämlich
0<
also ist
mit
∑∞
2
k=1 k(k+1)
1
1
2
≤ 2 ≤
kα
k
k(k + 1)
für alle k ∈ N,
eine Majorante, die gemäß des vorletzten Beispiels in § 4 konvergiert
∞
∑
k=1
∑
2
1
=2
= 2.
k(k + 1)
k(k + 1)
∞
k=1
58
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Sehr nützlich ist auch der folgende
Satz 8.6:
∑∞(Quotientenkriterium)
Es sei k=1 zk eine komplexe Reihe mit zk ̸= 0 für alle k ∈ N. Dann gilt:
(a) Existiert ein q ∈ (0, 1) und ein k0 ∈ N mit
z
k+1 ≤ q < 1 für alle k ≥ k0 ,
zk
∑
so konvergiert die Reihe ∞
k=1 zk absolut.
(b) Existiert ein k0 ∈ N, so dass gilt
z
k+1 ≥1
zk
für alle k ≥ k0 ,
dann divergiert die Reihe.
Beweis:
(a) Es gilt
(
)
|zk | ≤ |zk0 |q −k0 q k
für alle k ≥ k0 ,
wie man leicht ∑
mit vollständiger Induktion zeigt. Nach Satz 8.5 konvergiert
also die Reihe k zk absolut, da sie (ab dem k0 -ten Glied) die konvergente
Majorante
∞
∞
∑
(
)
(
)∑
|zk0 |q −k0 q k = |zk0 |q −k0
qk
k=k0
k=k0
besitzt.
(b) Offensichtlich gilt |zk | ≥ |zk0 | > ∑
0 für alle k ≥ k0 . Also bildet {zk }k keine
Nullfolge, nach Satz 8.2 ist somit k zk divergent.
q.e.d.
Bemerkung: Wir können in Satz 8.6 (a) die Voraussetzung nicht durch die schwächere
Bedingung
z
k+1 < 1 für alle k ≥ k0
zk
∑
1
ersetzen, wie das Beispiel der divergenten harmonischen Reihe ∞
k=1 k zeigt.
Umgekehrt ist die
∑ dort1angegebene Bedingung aber auch keine notwendige Bedingung, denn z.B. ∞
k=1 k2 konvergiert wie oben gesehen, aber es gilt
z
k2
k+1 → 1 (k → ∞).
=
zk
(k + 1)2
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
59
Beispiele:
1. Die Reihe
∑∞
k2
k=1 2k
konvergiert, denn mit xk :=
k2
2k
haben wir
x
(k + 1)2
1(
1 )2 8
k+1 (k + 1)2 2k
=
=
1
+
≤ <1
=
xk
2k+1 k 2
2k 2
2
k
9
Satz 8.6 (a) liefert die Behauptung.
∑
kk
2. Die Reihe ∞
k=1 k! divergiert, denn mit xk =
kk
k!
für alle k ≥ 3.
gilt
x
( k + 1 )k
k+1 (k + 1)k+1 k!
=
≥ 1 für alle k ∈ N,
=
xk
(k + 1)! k k
k
wir können also Satz 8.6 (b) anwenden.
∑
zk
3. Die komplexe Exponentialreihe ∞
k=0 k! konvergiert absolut für beliebiges z ∈
k
C. Mit zk := zk! gilt nämlich
z
|z|k+1 k!
1
|z|
k+1 ≤
=
=
k
zk
(k + 1)! |z|
k+1
2
für alle k ≥ 2|z| − 1.
Als Übungsaufgabe beweise man noch den folgenden
Satz 8.7:
∑∞(Wurzelkriterium)
Es sei k=1 zk eine komplexe Reihe. Dann gilt:
(a) Existiert ein q ∈ (0, 1) und ein k0 ∈ N mit
√
k
|zk | ≤ q < 1 für alle k ≥ k0 ,
∑
so konvergiert ∞
k=1 zk absolut.
(b) Gilt
lim sup
√
k
|zk | > 1,
k→∞
so divergiert die Reihe.
Wir wenden uns nun dem Produkt von absolut konvergenten Reihen zu:
Satz 8.8:∑(Cauchyscher
Produktsatz)
∑∞
Es seien ∞
z
,
ζ
komplexe,
absolut konvergente Reihen. Setzen wir
k=1 k
l=1 l
cj :=
j
∑
k=1
zk ζj−k+1
für j ∈ N,
60
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
∑
so konvergiert auch die Reihe ∞
j=1 cj absolut, und es gilt die Cauchysche Produktformel
(∑
)( ∑
) ∑
∞
∞
∞
zk
ζl =
cj .
k=1
j=1
l=1
Beweis:
1. Wir erklären die Partialsummen
n
∑
zk ,
rn :=
sn :=
rn sn =
(∑
n
zk
ζl ,
tn :=
n
∑
cj .
j=1
l=1
k=1
Dann gilt
n
∑
) ∑
)
)( ∑
n
n (∑
n
n
∑
ζl =
zk ζl =:
zk ζl .
k=1
l=1
k=1
k,l=1
l=1
Diese Schreibweise für eine (endliche)Doppelsumme ist offenbar sinnvoll, da die Reihenfolge
der Summation irrelevant ist. Setzen wir
{
}
Qn := (k, l) ∈ N × N : 1 ≤ k ≤ n, 1 ≤ l ≤ n ,
so haben wir
∑
rn sn =
zk ζl .
(8.2)
(k,l)∈Qn
Die Definition der cj lässt sich auch schreiben als
∑
cj =
zk ζl ,
k+l=j+1
k,l∈N
so dass sich für die n-te Partialsumme der cj ergibt
∑
tn =
zk ζl ;
(8.3)
(k,l)∈Dn
hierbei haben wir noch
{
}
Dn := (k, l) ∈ N × N : k + l ≤ n + 1
gesetzt. Da nun Dn ⊂ Qn für jedes n ∈ N richtig ist, haben wir insgesamt
∑
rn sn − tn =
zk ζl für alle n ∈ N.
(8.4)
(k,l)∈Qn \Dn
2. Setzen wir noch
rn∗ :=
n
∑
|zk |,
s∗n :=
k=1
so finden wir wie in (8.2):
rn∗ s∗n =
n
∑
|ζl |,
l=1
∑
|zk | |ζl |,
n ∈ N.
(8.5)
(k,l)∈Qn
Nun beachten wir Q2n \ D2n ⊂ Q2n \ Qn , da Qn ⊂ D2n für alle n ∈ N richtig ist. Damit
können wir abschätzen
∑
∑
(8.4)
≤
|r2n s2n − t2n |
=
z
ζ
|zk | |ζl |
k
l
(k,l)∈Q2n \D2n
≤
∑
(k,l)∈Q2n \Qn
|zk | |ζl |
(k,l)∈Q2n \D2n
∗
= |r2n
s∗2n − rn∗ s∗n | → 0 (n → ∞),
(8.5)
8. KONVERGENZKRITERIEN FÜR REIHEN (IN C)
61
∑
∑
da k |zk | und k |ζk | konvergieren, also auch das Produkt ihrer Partialsummen {rn∗ s∗n }n
eine Cauchyfolge bildet. Ganz entsprechend folgt aus Q2n−1 \ D2n−1 ⊂ Q2n−1 \ Qn auch
∗
|r2n−1 s2n−1 − t2n−1 | ≤ |r2n−1
s∗2n−1 − rn∗ s∗n | → 0 (n → ∞).
Da schließlich |r2n s2n − r2n−1 s2n−1 | → 0 (n → ∞) gilt (denn {rn sn }n konvergiert), haben
{t2n }n und {t2n−1 }n den gleichen Grenzwert, nämlich
lim tn = lim (rn sn ) = ( lim rn )( lim sn ),
n→∞
n→∞
n→∞
wie behauptet.
3. Zum Beweis der absoluten Konvergenz von
t∗n :=
∑
n
∑
j
n→∞
cj betrachten wir noch
|cj |,
n ∈ N.
j=1
Wie in (8.3) erhalten wir dann
0 ≤ t∗n ≤
∑
(k,l)∈Dn
|zk | |ζl | ≤
∑
|zk | |ζl | = rn∗ s∗n ≤ K
(8.5)
für alle n ∈ N
(k,l)∈Qn
∑
∑
mit K := ( k |zk |)( l |ζl |) < +∞. Also ist {t∗n }n beschränkt, monoton wachsend und nach
Satz 5.6 somit auch konvergent.
q.e.d.
Schließlich untersuchen wir das Verhalten von Reihen unter Umordnungen.
∑∞
∑∞
Definition 8.2:
∑∞Sei k=1 zk eine komplexe Reihe. Dann heißt k=1 ζk eine Umordnung von
k=1 zk , wenn es eine bijektive Abbildung σ : N → N gibt, so dass
gilt
ζn = zσ(n) für alle n ∈ N.
σ heißt unendliche Permutation der Reihenglieder.
Für endliche Summen ist die Reihenfolge der Summation bekanntlich irrelevant
für das Ergebnis; jede Umordnung einer endlichen Summe liefert also den gleichen
Wert. Bei unendlichen Reihen muss das nicht gelten:
∑
Definition 8.3: Wir nennen eine komplexe konvergente Reihe ∞
k=1 zk unbedingt
konvergent, wenn jede ihrer Umordnungen ebenfalls konvergiert
und
den gleichen
∑∞
Wert wie die ursprüngliche Reihe besitzt. Anderenfalls heißt k=1 zk bedingt konvergent.
Satz 8.9: (Dirichletscher Umordnungssatz)
Eine komplexe konvergente Reihe ist genau dann unbedingt konvergent, wenn sie
absolut konvergent ist.
62
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis: Wir zeigen nur, dass jede absolut konvergente Reihe auch unbedingt konvergent ist. Die
umgekehrte Aussage
folgt aus dem anschließenden
∑∞
∑∞Satz 8.10.
Sei also
k=1 zk absolut konvergent, d.h.
k=1 |zk | < +∞. Dann existiert nach Satz 8.1 zu
jedem ε > 0 ein N = N (ε) ∈ N , so dass
∑
N +p
|zk | <
k=N +1
richtig ist. Ist nun
so dass gilt
∑∞
k=1
ε
2
für alle p ∈ N
ζk eine beliebige Umordnung von
∑
k
(8.6)
zk , so existiert ein K ∈ N mit K ≥ N ,
{z1 , . . . , zN } ⊂ {ζ1 , . . . , ζK }.
(8.7)
∑n
Es bezeichne sn := k=1 zk bzw. tn := k=1 ζk die n-ten Partialsummen der beiden Reihen. Aus
(8.6) und (8.7) folgt dann
∑n
|sn − tn | <
ε
ε
+ =ε
2
2
für alle n > K ≥ N,
da sich die Terme z1 , . . . , zN aufheben und die übrigen Terme in den Summen sn bzw. tn jeweils
durch (8.6)
∑abgeschätzt werden können. Es folgt also limn→∞ |sn − tn | = 0. Bezeichnet nun s den
Wert von k zk , so folgt
|tn − s| ≤ |tn − sn | + |sn − s| → 0 (n → ∞),
d.h. auch
∑
k
ζk konvergiert gegen s, wie behauptet.
q.e.d.
Satz 8.10: (Riemannscher
Umordnungssatz)
∑
x
konvergent,
aber nicht absolut konvergent,
so gibt es zu
Ist die reelle Reihe ∞
k=1 k ∑
∑∞
∞
jedem t ∈ R eine Umordnung k=1 ξk der Reihe, so dass t = k=1 ξk gilt.
Bemerkungen:
∑
∑
1. Ist ∑
k Re(zk )
k zk eine komplexe, unbedingt konvergente Reihe, so sind auch
Satz
8.10
müssen
die
reellen
Reiund k Im(zk ) unbedingt konvergent. Nach
∑
hen absolut konvergent sein, also ist auch k zk absolut konvergent. Das vervollständigt den Beweis von Satz 8.9.
∑
2. Man kann sogar Umordnungen k ξk einer beliebigen reellen
∑ konvergenten,
aber nicht absolut konvergenten Reihe konstruieren, so dass k ξk = ±∞ gilt
(Übungsaufgabe).
Beweis von Satz 8.10:
1. Zu {xk }k setzen wir
pk := max{0, xk },
qk := − min{0, xk },
k ∈ N.
Dann gilt
Da
pk , qk ≥ 0,
∑
k
xk = pk − qk ,
|xk | = pk + qk
für alle k ∈ N.
xk konvergiert, muss |xk | → 0 (k → ∞) gelten und folglich auch
lim pk = lim qk = 0.
k→∞
k→∞
(8.8)
9. POTENZREIHEN
63
Außerdem haben wir
Wäre nämlich z.B.
∑
pk =
∑
k
∑
k
qk = +∞.
(8.9)
k
pk < +∞, so konvergiert auch
∑
∑
∑
∑
qk =
(pk − xk ) =
pk −
xk .
k
k
k
k
∑
∑
Dann wäre aber auch ∑
im Widerspruch zur nicht absoluten
k |xk | =
k (pk +qk ) konvergent,∑
Konvergenz der Reihe k xk . Entsprechend zeigt man k qk = +∞.
2. Wir zerlegen nun die Folge {xk }k in die Teilfolgen der positiven Glieder {ak }k und nichtpositiven Glieder {bk }k . Nach (8.8) und (8.9) bilden beide Nullfolgen und es gilt
∑
∑
ak = +∞,
bk = −∞.
k
k
Nun wählen wir n1 als kleinste natürliche Zahl, so dass zu unserem vorgegebenen t ∈ R gilt
n1
∑
ak > t.
k=1
Dann wählen wir n2 als kleinste natürliche Zahl, so dass
n1
∑
ak +
n2
∑
bk < t
k=1
k=1
richtig ist. Danach bestimmen wir ein kleinstes n3 > n1 wiederum so, dass gilt
n1
∑
ak +
k=1
n2
∑
bk +
n3
∑
ak > t.
k=n1 +1
k=1
Es ist klar, wie dieses Verfahren fortgesetzt und welche Umordnung der ursprünglichen Reihe
dabei erstellt wird. Da n1 , n2 , n3 , . . . jeweils minimal gewählt waren, muss gelten
n1 −1
∑
k=1
ak ≤ t,
n1
∑
n2 −1
ak +
k=1
∑
bk ≥ t, . . .
k=1
(ersteres nur, falls t ≥ 0 ist). Somit haben die zugehörigen Teilsummen höchstens einen
Abstand von an1 , bn2 , an3 , bn4 , . . . zu t. Da aber sowohl {ak }k als auch {bk }k Nullfolgen sind,
konvergieren die Partialsummen der umgeordneten Reihe gegen t, wie behauptet.
q.e.d.
9
Potenzreihen
Wir wollen nun noch spezielle komplexe Reihen betrachten, nämlich Reihen der
Form
∞
∑
P(z) =
ak z k
k=0
mit den Koeffizienten
ak ∈ C (k ∈ N0 ) und der Variablen z ∈ C. Die Partialsummen
∑
Pn (z) := nk=0 ak z k einer Potenzreihe sind für alle n ∈ N komplexe Polynome.
Wir kennen bereits zwei Beispiele von Potenzreihen, welche wohl auch die beiden
wichtigsten sind:
64
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
∞
∑
• Geometrische Reihe:
z k , d.h. ak = 1 für alle k ∈ N0 .
k=0
∞
∑
• Exponentialreihe:
k=0
zk
k! ,
d.h. ak =
1
k!
für alle k ∈ N0 .
Während letztere für alle z ∈ C absolut konvergiert, konvergiert die geometrische
Reihe absolut für |z| < 1 und divergiert für |z| > 1. I.A. hängt also das Konvergenzverhalten einer Potenzreihe von der Wahl der Variablen z ab. Genauer haben wir
den folgenden
Satz 9.1: (Cauchy-Hadamard)
√
∑∞
k
k
|ak | ∈
Für eine Potenzreihe P(z) =
k=0 ak z setzen wir α := lim supk→∞
[0, +∞) ∪ {+∞}. Erklären wir dann

+∞, falls α = 0


α−1 , falls α ∈ (0, +∞) ,
R :=


0,
falls α = +∞
(9.1)
so konvergiert P(z) für |z| < R absolut und divergiert für |z| > R.
Bemerkungen:
1. Die in (9.1) erklärte Größe R ∈ [0, +∞) ∪ {+∞} heißt Konvergenzradius der
Reihe P(z). Die Kreisscheibe KR := {z ∈ C : |z| < R} nennen wir das
Konvergenzgebiet.
2. Wir setzen folgende Regeln für das Rechnen mit +∞ fest:
1
= +∞,
0
1
,
+∞
(+∞) · x = +∞
für x ∈ R mit x > 0.
Dann liest sich (9.1) also R = α1 .
Beweis von Satz 9.1: Offenbar gilt |z| < R (bzw. |z| > R) genau dann, wenn |z|α < 1
(bzw. |z|α > 1) also
√
lim sup
k
|ak z k | < 1
k→∞
(bzw. > 1)
√
richtig ist. Wegen
Satz 6.5 ist für lim supk→∞ k |ak z k | < 1 der
Fall (a) aus Satz 8.7
√
∑
k
k konvergiert absolut. Im Fall lim sup
k
gültig, d.h.
a
z
|a
k z | > 1 divergiert
k→∞
k k
∑
k
P(z) = k ak z nach Satz 8.7 (b).
q.e.d.
Als sehr praktisch erweist sich der folgende
9. POTENZREIHEN
65
∑
k
Satz 9.2: Ist P(z) = ∞
k=0 ak z im Punkt z0 ∈ C \ {0} konvergent, so konvergiert
P(z) absolut für alle z ∈ C mit |z| < |z0 |.
∑
Beweis: Da k ak z0k konvergiert, gilt limk→∞ |ak z0k | = 0. Insbesondere ist {|ak z0k |}k
beschränkt, es gibt also ein c > 0 mit |ak z0k | ≤ c für alle k ∈ N0 . Sei nun z ∈ C mit
|z| < |z0 | bzw. q := | zz0 | ∈ [0, 1) beliebig gewählt. Dann folgt
z k
|ak z | =
≤ cq k für alle k ∈ N0 .
z0
∑
∑ k
c
k
Wegen q ∈ [0, 1) konvergiert die Reihe
k cq = c
k q = 1−q und nach dem
Majorantenkriterium, Satz 8.5, konvergiert auch P(z) absolut für |z| < |z0 |, wie
behauptet.
q.e.d.
|ak z0k | k
Wir wollen nun einen Satz beweisen, der u.a. Aussagen über das Konvergenzverhalten auf dem Rand des Konvergenzgebietes macht und außerdem das Konvergenzkriterium von Leibniz als Spezialfall enthält. Wir beginnen mit dem
∑
ist, und sei
Hilfssatz 9.1: Sei {zk }k∈N0 ⊂ C eine Folge, so dass ∞
k=0 zk beschränkt ∑
{ak }k ⊂ R eine monoton fallende Nullfolge. Dann konvergiert die Reihe ∞
k=0 ak zk .
∑
Beweis: Wir wollen Satz 8.1 anwenden, also den Ausdruck | n
große
k=m+1 ak zk | für hinreichend
∑
m, n ∈ N0 mit n > m klein bekommen. Dazu setzen wir für festes m ∈ N0 : sn := n
z
k=m+1 k für
n > m. Mit vollständiger Induktion zeigt man dann leicht die Relation
n
∑
ak zk = sn an +
k=m+1
n−1
∑
sk (ak − ak+1 )
für alle n > m.
k=m+1
Da {ak }k eine monoton fallende Nullfolge ist, gilt ak ≥ ak+1 ≥ 0 für alle k ∈ N0 . Daher können wir
abschätzen
n
n−1
∑
∑
≤ |sn |an +
a
z
|sk |(ak − ak+1 )
k k
k=m+1
k=m+1
≤
[
]
n−1
∑
{
}
max |sm+1 |, . . . , |sn | an +
(ak − ak+1 )
=
{
}
am+1 · max |sm+1 |, . . . , |sn |
k=m+1
für n > m.
Da nun {ak }k Nullfolge ist, existiert zu jedem ε > 0 ein N (ε) ∈ N, so dass 0 ≤ ak < ε für alle
k ≥ N (ε) richtig ist. Ferner gibt es ein c > 0 mit |sn | ≤ c für alle n ∈ N, denn {sn }n ist beschränkt
nach Voraussetzung. Insgesamt folgt
∑
n
a
z
für alle n > m ≥ N (ε),
k k < cε
k=m+1
also nach Satz 8.1 die Konvergenz der Reihe.
q.e.d.
Satz 9.3: Ist∑
{ak }k∈N0 eine monoton fallende Nullfolge, so konvergiert die Potenzk
reihe P(z) = ∞
k=0 ak z für alle z ∈ C \ {1} mit |z| ≤ 1.
66
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Beweis: Aus der Summenformel der geometrischen Reihe, Satz 2.3, erhalten wir für
beliebige z ∈ C \ {1} mit |z| ≤ 1:
∑
n k 1 − z n+1 1 + |z|n+1
2
z = ≤
≤
1−z
|1 − z|
|1 − z|
für alle n ∈ N.
k=0
Somit ist
P(z).
∑
k
z k für solche z beschränkt, Hilfssatz 9.1 liefert also die Konvergenz von
q.e.d.
Bemerkung:
Setzen wir in Satz 9.3 speziell z = −1 ein, so folgt die Konvergenz der
∑
k
Reihe ∞
a
k=0 k (−1) . Dies ist gerade die Aussage des Leibnizschen Konvergenzkriteriums, Satz 8.4.
Satz 9.4: (Cauchyscher
∑∞ Produktsatz
∑∞für Potenzreihen)
k
Sind die Potenzreihen k=0 ak z ∑
und k=0 bk z k für |z| < R absolut konvergent, so
k
gilt dies auch für die Potenzreihe ∞
k=0 ck z mit den Koeffizienten
ck :=
k
∑
al bk−l ,
k ∈ N0 ,
l=0
und wir haben die Identität
(∑
∞
k=0
ak z k
)( ∑
∞
)
bk z k
=
(∑
∞
)
ck z k .
k=0
k=0
Beweis: Dies ergibt sich nach einer Indexverschiebung k → k + 1 aus Satz 8.8, wenn
man noch
)
(∑
k
k
∑
l
k−l
(al z )(bk−l z ) =
al bk−l z k = ck z k
l=0
l=0
beachtet.
q.e.d.
Bemerkung: Alle Resultate lassen sich direkt auf komplexe Potenzreihen der Form
Pz0 (z) :=
∞
∑
ak (z − z0 )k
k=0
übertragen. Das Konvergenzgebiet von Pz0 (z) ist dann eine Kreisscheibe KR (z0 ) =
{z ∈ C : |z − z0 | < R} vom Radius R ∈ [0, +∞) ∪ {+∞} um den Entwicklungspunkt
z0 ∈ C. Die bisher betrachteten Potenzreihen P(z) sind also Spezialfälle von Pz0 (z)
mit z0 = 0.
10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME
10
67
Der d-dimensionale reelle Raum Rd und metrische
Räume
Für den Umgang mit Funktionen in den folgenden Kapiteln benötigen wir noch
einige topologische Begriffe. Da wir Funktionen sowohl in R als auch C (also für
Punkte aus R2 ) betrachten wollen, führen wir an dieser Stelle allgemeiner den ddimensionalen (reellen) Raum Rd mit d ∈ N ein:
(i) Wir betrachten die Menge aller d-Tupel x = (x1 , . . . , xd ) ∈ Rd := R × . . . × R,
wobei zwei Punkte x = (x1 , . . . , xd ), y = (y1 , . . . , yd ) ∈ Rd gleich heißen, wenn
ihre Koordinaten übereinstimmen, d.h. xk = yk für alle k = 1, . . . , d. Das
Element 0 = (0, . . . , 0) ∈ Rd heißt Nullpunkt oder Ursprung des Rd .
(ii) Sind x, y ∈ Rd beliebig, so erklären wir die Addition auf Rd gemäß
x + y := (x1 + y1 , . . . , xd + yd ) ∈ Rd .
Ist ferner λ ∈ R gewählt, so definieren wir die skalare Multiplikation durch
λx := (λx1 , . . . , λxd ) ∈ Rd .
Bemerkungen:
1. Den R2 veranschaulichen wir uns wie üblich in der Ebene, den Punkten x =
(x1 , x2 ) ∈ R2 entsprechen die Vektoren ⃗x = (x1 , x2 ). Dann entspricht die Addition in R2 der Vektoraddition und die skalare Multiplikation der Skalierung
eines Vektors.
2. Die Addition in Rd , d ∈ N, genügt den Axiomen (A1)-(A4) aus § 1 mit dem
neutralen Element 0 = (0, . . . , 0) ∈ Rd und dem negativen Element −x :=
(−x1 , . . . , −xd ) ∈ Rd . Zusammen mit der skalaren Multiplikation spricht man
dann von einer Vektorraumstruktur, d.h. Rd ist ein (reeller) Vektorraum. Hierzu
müssen – was bei uns offenbar der Fall ist – zusätzlich folgende Axiome erfüllt
sein:
(S1) λ(µx) = (λµ)x für alle λ, µ ∈ R, x ∈ Rd ,
(S2) λ(x + y) = λx + λy, (λ + µ)x = λx + µx für alle λ, µ ∈ R, x, y ∈ Rd ,
(S3) 1 · x = x für alle x ∈ Rd .
3. Während man R1 und R2 mit einer Körperstruktur ausstatten kann, nämlich
mit der von R bzw. C, ist das für d ≥ 3 nicht mehr möglich. Trotzdem können
wir (wie in R und C) einen Abstandsbegriff erklären m.H. der folgenden
68
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Definition 10.1: Seien x, y ∈ Rd , so erklären wir deren (euklidisches) Skalarprodukt oder auch inneres Produkt als
⟨x, y⟩ = x · y :=
d
∑
x j yj .
(10.1)
j=1
Die (euklidische) Länge oder den Betrag von x ∈ Rd definieren wir als
|x| :=
√
⟨x, x⟩ =
(∑
d
)1
2
x2j
.
j=1
Schließlich heißt
|x − y| =
(∑
d
)1
(xj − yj )
2
2
j=1
der (euklidische) Abstand zweier Punkte x, y ∈ Rd .
Bemerkungen:
1. (Rd , ⟨·, ·⟩) heißt euklidischer Vektorraum; wir schreiben kurz Rd und stellen
uns diesen mit dem euklidischen Abstandsbegrif ausgestattet vor. Es sei aber
angemerkt, dass es viele weitere Abstandsbegriffe im Rd gibt.
2. Das in (10.1) erklärte Skalarprodukt hat die Eigenschaften
⟨x, y⟩ = ⟨y, x⟩
(Symmetrie)
⟨λx + µy, z⟩ = λ⟨x, z⟩ + µ⟨y, z⟩
⟨x, x⟩ ≥ 0,
⟨x, x⟩ = 0 ⇔ x = 0
(10.2)
(Bilinearität)
(Positivität)
(10.3)
(10.4)
für beliebige x, y, z ∈ Rd und λ, µ ∈ R (Übungsaufgabe).
3. Im R2 entspricht der Betrag gerade dem in C erklärten Betrag, in R1 dem in
R erklärten Absolutbetrag.
Der Abstand | · | hat sehr ähnliche Eigenschaften wie der Betrag in R oder C
(das erklärt auch das verwendete Symbol):
Satz 10.1: Für alle x, y ∈ Rd und λ ∈ R gilt
(i) |x| ≥ 0 und |x| = 0 ⇔ x = 0.
(ii) |λx| = |λ| |x|.
(iii) |x + y| ≤ |x| + |y| ( Dreiecksungleichung).
10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME
69
Bemerkung: Also unterscheidet sich nur (ii) von der entsprechenden Eigenschaft
|xy| = |x| |y| des Betrages in R bzw. C. Dies ist im Rd i.A. falsch, es gilt aber der
berühmte
Satz 10.2: (Cauchy-Schwarzsche Ungleichung)
Sind x, y ∈ Rd beliebig, so gilt
|⟨x, y⟩| ≤ |x| |y|.
(10.5)
Gleichheit tritt genau dann ein, wenn x = ty oder y = tx mit einem t ∈ R gilt,
d.h. wenn x, y linear abhängig sind.
Beweis: Falls y = 0 gilt, ist nichts zu zeigen. Sei also y ̸= 0. Dann folgt
(10.4)
0 ≤ |x + ty|2
(10.2),(10.3)
=
|x|2 + 2t⟨x, y⟩ + t2 |y|2
für alle t ∈ R.
Das ist bekanntlich genau dann der Fall, wenn ⟨x, y⟩2 ≤ |x|2 |y|2 gilt, und nach
Wurzelziehen erhalten wir (10.5). Andererseits hat die Gleichung
0 = |x + ty|2 = |x|2 + 2t⟨x, y⟩ + t2 |y|2
bekanntlich genau dann eine Lösung t ∈ R, wenn ⟨x, y⟩2 ≥ |x|2 |y|2 gilt. Wegen (10.5)
ist also |x + ty| = 0 für ein t ∈ R genau dann erfüllt, wenn ⟨x, y⟩2 = |x|2 |y|2 richtig
ist, wie behauptet.
q.e.d.
Beweis von Satz 10.1: (i) entspricht (10.4), und (ii) folgt unmittelbar aus (10.2),
(10.3). Zum Beweis von (iii) berechnen wir
(10.5)
|x + y|2 = |x|2 + 2⟨x, y⟩ + |y|2 ≤ |x|2 + 2|x| |y| + |y|2
= (|x| + |y|)2 ,
also nach Wurzelziehen die behauptete Dreiecksungleichung.
q.e.d.
Bemerkung: Aus der Dreiecksungleichung folgt wie in Satz 1.5 (c) noch die umgekehrte Dreiecksungleichung
|x − y| ≥ |x| − |y| für alle x, y ∈ Rd .
Mit Hilfe des Betrages im Rd können wir nun auch die Begriffe für Folgen in R
bzw. C auf den Rd übertragen:
Definition 10.2: Eine Folge {xn }n∈N ⊂ Rd mit den Gliedern xn = (xn1 , . . . , xnd ) ∈
Rd für n ∈ N heißt
70
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
• beschränkt, falls ein c > 0 existiert mit |xn | ≤ c für alle n ∈ N,
• Cauchyfolge, wenn für alle ε > 0 ein N (ε) ∈ N existiert mit |xn − xm | < ε für
alle m, n ≥ N (ε),
• konvergent gegen den Grenzwert x ∈ Rd , wenn es für alle ε > 0 ein N (ε) ∈ N
gibt mit |xn − x| < ε für alle n ≥ N (ε); Schreibweise limn→∞ xn = x oder
xn → x (n → ∞),
• Nullfolge, wenn {xn }n gegen 0 ∈ Rd konvergiert.
Ferner heißt y ∈ Rd Häufungswert von {xn }n , wenn eine Teilfolge {xnk }k ⊂ {xn }n
existiert mit limk→∞ xnk = y.
Z.B. ist also {xn }n ⊂ Rd gegen x ∈ Rd konvergent, wenn in jeder ε-Umgebung
Bε (x) := {y ∈ Rd : |y − x| < ε} fast alle Glieder der Folge liegen. Man beachte,
dass Bε (x) in R = R1 ein offenes Intervall, in R2 eine Kreisscheibe um x vom Radius
ε > 0 und in Rd für d ≥ 3 eine Kugel um x vom Radius ε > 0 ist.
Bemerkung: Zur Übung beweise man folgende Rechenregeln für Grenzwerte im Rd :
Sind {xn }n , {yn }n ⊂ Rd konvergente Folgen mit limn→∞ xn = x und limn→∞ yn = y,
so folgt
• Sind α, β ∈ R beliebig, so konvergiert auch {αxn + βyn }n mit αxn + βyn →
αx + βy (n → ∞).
• Es gilt ⟨xn , yn ⟩ → ⟨x, y⟩ und |xn | → |x| für n → ∞.
• Ist {αn }n ⊂ R eine Folge mit αn → α (n → ∞), so gilt αn xn → αx (n → ∞).
Satz 10.3: (Cauchysches Konvergenzkriterium in Rd )
Eine Folge {xn }n ⊂ Rd ist genau dann konvergent, wenn {xn }n Cauchyfolge ist.
Der Beweis erfolgt genau wie der des Cauchyschen Konvergenzkriteriums in C,
Satz 7.3, in dem man die Aussage auf die Komponentenfolgen {xnj }n , j = 1, . . . , d,
zurückführt mittels des folgenden
Hilfssatz 10.1: Eine Folge {xn }n ⊂ Rd ist genau dann beschränkt (bzw. konvergent, Cauchyfolge, Nullfolge), wenn alle Komponentenfolgen {xnj }n ⊂ R, j =
1, . . . , d, beschränkt (bzw. konvergent, Cauchyfolgen, Nullfolgen) sind. Für konvergente Folgen {xn }n gilt
lim xn =
n→∞
(
)
lim xn1 , . . . , lim xnd .
n→∞
n→∞
10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME
71
Beweis: Als Übungsaufgabe zeigt man: Ist y = (y1 , . . . , yd ) ∈ Rd beliebig, so gelten
die Ungleichungen
|yj | ≤ |y|
für j = 1, . . . , d,
|y| ≤
d
∑
|yk |.
k=1
Hieraus ergeben sich sofort die Behauptungen.
q.e.d.
Satz 10.4: (Bolzano-Weierstraß in Rd )
Jede beschränkte Folge {xn }n ⊂ Rd besitzt eine konvergente Teilfolge.
Beweis: Vollständige Induktion über die Raumdimension d ∈ N.
• d = 1: Das ist die Aussage von Satz 5.5.
• d → d + 1: Die Aussage sei für beschränkte Folgen {xn }n ⊂ Rd mit einem
d ∈ N erfüllt.
Sei nun {x̃n }n ⊂ Rd+1 beschränkt mit den Folgengliedern
x̃n = (x̃n1 , . . . x̃nd , x̃n,d+1 ) = (xn , ξn ) mit xn := (x̃n1 , . . . , x̃nd ), ξn := x̃n,d+1 .
Damit sind auch {xn }n ⊂ Rd und {ξn }n ⊂ R beschränkt. Nach Induktionsvoraussetzung existiert also eine konvergente Teilfolge {x′k }k = {xnk }k von {xn }n
mit limk→∞ x′k = x ∈ Rd . Die entsprechende Teilfolge {ξk′ }k = {ξnk }k ⊂ R
von {ξn }n muss zwar nicht konvergieren, ist aber sicher beschränkt. Also gibt
es nach Satz 5.5 eine weitere Teilfolge {ξk′ l }l ⊂ {ξk′ }k mit liml→∞ ξk′ l = ξ ∈ R.
Die entsprechende Teilfolge {x′kl }l ⊂ {x′k }k konvergiert auch gegen x, so dass
schließlich für {x̃′kl }l gilt
lim x̃′kl = lim (x′kl , ξk′ l )
l→∞
l→∞
HS 10.1
=
(x, ξ),
wie behauptet.
q.e.d.
Bemerkung: Satz 10.4 für d = 2 liefert auch: Jede beschränkte Folge {xn }n ⊂ C
besitzt eine konvergente Teilfolge. Denn die Beträge in R2 und C stimmen überein.
Wir wollen nun Teilmengen M ⊂ Rd betrachten und beginnen mit der
Definition 10.3: Eine Teilmenge M ⊂ Rd nennen wir
• offen, wenn zu jedem x0 ∈ M ein r > 0 existiert, so dass gilt
Br (x0 ) = {x ∈ Rd : |x − x0 | < r} ⊂ M.
72
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
• abgeschlossen, wenn für jede konvergente Folge {xn }n ⊂ M gilt
x0 := lim xn ∈ M.
n→∞
Beispiele:
1. Intervalle in R:
• Das offene Intervall (a, b) = {x ∈ R : a < x < b} ist im Sinne von Definition 10.3
offen.
Ist nämlich x0 ∈ (a, b) gewählt, so setzen wir r := min{x0 − a, b − x0 } > 0. Für
x ∈ Br (x0 ) folgt dann
x = x0 + (x − x0 ) ≥ x0 − |x − x0 | > x0 − r ≥ x0 − (x0 − a) = a,
also x > a und entsprechend x < b, also x ∈ (a, b) und somit Br (x0 ) ⊂ (a, b).
• Das abgeschlossene Intervall [a, b] = {x ∈ R : a ≤ x ≤ b} ist abgeschlossen im Sinne
von Definition 10.3.
Ist nämlich {xn }n ⊂ [a, b] konvergent mit xn → x0 (n → ∞), so folgt a ≤ xn ≤ b und
nach Grenzübergang n → ∞ auch a ≤ x0 ≤ b, also x0 ∈ [a, b].
• Das halboffene Intervall [a, b) ist weder offen noch abgeschlossen.
Denn die konvergente Folge {b − n1 }n≥N ⊂ [a, b) mit hinreichend großem
N ∈ N hat den Grenzwert limn→∞ (b − n1 ) = b ̸∈ [a, b). Und für a ∈ [a, b)
gilt offenbar Br (a) ̸⊂ [a, b) für alle r > 0.
2. Kugeln in Rd :
• BR (ξ) ⊂ Rd ist offen für beliebige R > 0, ξ ∈ Rd .
Ist nämlich x0 ∈ BR (ξ) beliebig, so ist r := R − |x0 − ξ| > 0. Für
x ∈ Br (x0 ) haben wir dann die Abschätzung
|x − ξ| ≤ |x − x0 | + |x0 − ξ| < r + |x0 − ξ| = R,
also x ∈ BR (ξ) und somit Br (x0 ) ⊂ BR (ξ).
Man bezeichnet daher BR (ξ) auch als offene Kugel im Rd .
• Im Gegensatz dazu ist B̂R (ξ) := {x ∈ Rd : |x − ξ| ≤ R} abgeschlossen
und heißt abgeschlossene Kugel im Rd .
Ist nämlich {xn }n ⊂ B̂R (ξ) mit xn → x0 (n → ∞) beliebig, so liefert
Grenzübergang n → ∞ in der Ungleichung |xn − ξ| ≤ R für alle n ∈ N:
R ≥ lim |xn − ξ| = lim (xn − ξ) = |x0 − ξ|,
n→∞
also x0 ∈ B̂R (ξ).
n→∞
10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME
73
• Die Kugelschale Sϱ,R (ξ) := BR (ξ) \ Bϱ (ξ) = {x ∈ Rd : ϱ ≤ |x − ξ| < R} mit 0 < ϱ < R
ist weder offen noch abgeschlossen.
Für x0 ∈ Sϱ,R (ξ) mit |x0 − ξ| = ϱ gilt nämlich Br (x0 ) ̸⊂ Sϱ,R (ξ) für alle r > 0, da
ξ−x0
z.B. y := x0 + ε |ξ−x
für hinreichend kleines ε ∈ (0, r) zwar in Br (x0 ) aber nicht in
0|
Sϱ,R (ξ) liegt, d.h. Sϱ,R (ξ) ist nicht offen. Und andererseits finden wir für konvergentes
{xn }n ⊂ Sϱ,R (ξ) mit |xn −ξ| = R− n1 , n ≥ N , die Relation limn→∞ xn =: x0 ̸∈ Sϱ,R (ξ),
d.h. Sϱ,R (ξ) ist auch nicht abgeschlossen.
3. Q ist weder offen noch abgeschlossen.
4. Rd und ∅ sind die einzigen Teilmengen von Rd , die sowohl offen als auch abgeschlossen sind.
Wir erinnern an den Begriff der Komplementärmenge oder des Komplements
einer Menge M ⊂ Rd , nämlich
M c := Rd \ M = {x ∈ Rd : x ̸∈ M }.
Satz 10.5: Eine Menge M ⊂ Rd ist genau dann offen, wenn ihr Komplement M c
abgeschlossen ist. Weiter ist M genau dann abgeschlossen, wenn M c offen ist.
Beweis: Es genügt, die erste Aussage zu beweisen. Die zweite folgt dann unmittelbar
aus der Relation (M c )c = M .
• ⇒“: Sei M ⊂ Rd offen. Wäre dann M c nicht abgeschlossen, so gäbe es eine
”
konvergente Folge {xn }n ⊂ M c mit xn → x0 ̸∈ M c (n → ∞). Das heißt aber
x0 ∈ M , und da M offen ist, gäbe es eine Kugel Br (x0 ) ⊂ M mit geeignetem
Radius r > 0. Da andererseits |xn − x0 | → 0 (n → ∞) gilt, müsste aber
xn ∈ Br (x0 ) ⊂ M für hinreichend großes n ∈ N erfüllt sein, im Widerspruch
zu {xn }n ⊂ M c . Also ist M c abgeschlossen.
• ⇐“: Sei nun M c abgeschlossen. Wäre M nicht offen, so gäbe es ein x0 ∈ M
”
mit Br (x0 ) ̸⊂ M für alle r > 0. Wählen wir insbesondere r = n1 , so gäbe es
also xn ∈ B 1 (x0 ) mit xn ∈ M c für alle n ∈ N. Für die so gewählte Folge
n
{xn }n ⊂ M c gölte dann aber |xn − x0 | < n1 → 0 (n → ∞). Und da M c
abgeschlossen ist, müsste x0 ∈ M c folgen, Widerspruch! Also ist M offen.
q.e.d.
Notation: Meist werden wir offene Mengen mit dem (ggf. indizierten) Symbol Ω ⊂
Rd und abgeschlossene Mengen mit A ⊂ Rd bezeichnen.
Satz 10.6:
(a) Sind Ω1 , . . . , Ωn ⊂ Rd offen, so gilt dies auch für
n
∩
j=1
Ωj .
74
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
(b) Sind A1 , . . . , An ⊂ Rd abgeschlossen, so ist auch
n
∪
Aj abgeschlossen.
j=1
(c) Sei J eine beliebige Indexmenge∪und {Ωj }j∈J eine Familie offener Mengen.
Dann ist auch die Vereinigung
Ωj := {x ∈ Rd : x ∈ Ωj für ein j ∈ J}
j∈J
offen.
(d) Ist {Aj }j∈J eine Familie abgeschlossener
Mengen mit beliebiger Indexmenge
∩
J, so ist auch der Durchschnitt
Aj := {x ∈ Rd : x ∈ Aj für alle j ∈ J}
j∈J
abgeschlossen.
Beweis: Wegen Satz 10.5 und der allgemeinen Relationen
(∪
j∈J
)c
Mj
=
∩
j∈J
Mjc ,
(∩
j∈J
)c
Mj
=
∪
Mjc
j∈J
genügt es die (nahezu trivialen) Aussagen (a) und (c) zu beweisen (Übungsaufgabe).
q.e.d.
Definition 10.4: Sei M ⊂ Rd eine beliebige Menge. Dann heißt ein Punkt x0 ∈ Rd :
• innerer Punkt von M , wenn ein r > 0 mit Br (x0 ) ⊂ M existiert.
• Randpunkt von M , wenn zu jedem r > 0 Punkte y ∈ M und z ∈ M c mit
y, z ∈ Br (x0 ) existieren.
• Häufungspunkt von M , wenn zu jedem r > 0 ein x ∈ M \ {x0 } existiert mit
x ∈ Br (x0 ).
• isolierter Punkt von M , wenn x0 ∈ M gilt und x0 kein Häufungspunkt von M
ist.
Die Menge der inneren Punkte von M ⊂ Rd heißt das Innere von M ; wir schreiben
int M oder M̊ . Die Menge der Randpunkte heißt Rand von M und wird mit ∂M
bezeichnet. Schließlich heißt M := M ∪ ∂M der Abschluss von M .
Bemerkungen: Ein Punkt x0 ∈ Rd ist offenbar genau dann Häufungspunkt von
M ⊂ Rd , wenn eine Folge {xn }n ⊂ M \ {x0 } existiert mit xn → x0 (n → ∞).
Ferner ist x0 genau dann Randpunkt von M , wenn zwei Folgen {yn }n ⊂ M und
{zn }n ⊂ M c existieren mit yn → x0 , zn → x0 (n → ∞).
10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME
75
Satz 10.7: Für eine beliebige Menge M ⊂ Rd gelten die folgenden Aussagen:
(i) ∂M = ∂(M c ).
(ii) M ist genau dann offen, wenn M = int M gilt.
(iii) M = int M ∪ ∂M , ∂M = M \ int M .
(iv) Ist {xn }n ⊂ M konvergent, so gilt limn→∞ xn =: x0 ∈ M .
(v) M ist abgeschlossen ⇔ ∂M ⊂ M ⇔ M = M .
Beweis: (i) und (ii) sind aus den Definitionen sofort klar. Wir beweisen (iii)-(v):
(iii) Wir zeigen M \ int M ⊂ ∂M . In der Tat: Ist x0 ∈ M \ int M , so gilt Br (x0 ) ̸⊂ M für alle
r > 0. D.h. für jedes r > 0 existieren y := x0 ∈ M , z ∈ M c mit y, z ∈ Br (x0 ), also folgt
x0 ∈ ∂M . Aus der Definition von M folgt nun
M = M ∪ ∂M = (M \ int M ) ∪ int M ∪ ∂M = int M ∪ ∂M
und damit auch ∂M = M \ int M , wie behauptet.
(iv) Sei {xn }n ⊂ M konvergent und x0 = limn→∞ xn . Falls x0 ∈ int M gilt, ist nichts zu zeigen
wegen int M ⊂ M ⊂ M . Sei also x0 ̸∈ int M , d.h. es gilt Br (x0 ) ̸⊂ M für alle r > 0. Also
existiert zu jedem n ∈ N ein zn ∈ M c mit |zn − x0 | < n1 , d.h. zn → x0 (n → ∞). Nach obiger
Bemerkung folgt x0 ∈ ∂M ⊂ M , also die Behauptung.
(v) Zunächst ist ∂M ⊂ M ⇔ M = M wieder per Definition klar. Wir beweisen die erste
Äquivalenz:
⇒“: Sei M abgeschlossen und x0 ∈ ∂M gewählt. Dann existiert eine Folge {xn }n ⊂ M mit
”
xn → x0 (n → ∞). Und es folgt x0 ∈ M wegen der Abgeschlossenheit von M , also
∂M ⊂ M .
⇐“: Sei umgekehrt ∂M ⊂ M . Und sei eine konvergente Folge {xn }n ⊂ M gewählt. Nach
”
(iv) gilt dann x0 := limn→∞ xn ∈ M = M ∪ ∂M = M , also ist M abgeschlossen.
q.e.d.
Beispiel: Für die offene Kugel BR (ξ) im Rd gilt:
int BR (ξ) = BR (ξ),
BR (ξ) = {x ∈ Rd : |x − ξ| ≤ R} = B̂R (ξ),
∂BR (ξ) = {x ∈ Rd : |x − ξ| = R} =: SR (ξ).
Mit S d−1 := {x ∈ Rd : |x| = 1} = S1 (0) bezeichnen wir die Einheitssphäre im Rd .
Definition 10.5: Eine Teilmenge M ⊂ Rd heißt
• beschränkt, falls ein R > 0 existiert mit M ⊂ BR (0); anderenfalls nennen wir
M unbeschränkt.
• kompakt, falls M beschränkt und abgeschlossen ist.
76
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Bemerkung: Ist M nichtleer und beschränkt, so ist der Durchmesser
diam M := sup{|x − y| : x, y ∈ M }
wohl definiert, d.h. diam M ist endlich und eindeutig bestimmt.
Satz 10.8: Eine Teilmenge K ⊂ Rd ist genau dann kompakt, wenn jede Folge
{xn }n ⊂ K eine konvergente Teilfolge {xnl }l enthält mit lim xnl =: x0 ∈ K.
l→∞
Bemerkung: Eine Menge K nennt man folgenkompakt, wenn jede Folge {xn }n ⊂ K
eine Teilfolge {xnl }l enthält mit xnl → x0 ∈ K (l → ∞). Satz 10.8 besagt also, dass
für Teilmengen des Rd Kompaktheit und Folgenkompaktheit äquivalent sind. Für
Teilmengen aus unendlich dimensionalen“ (metrischen) Räumen gilt dies i.A. nicht
”
mehr, siehe aber Satz 10.10 unten. In solchen Räumen wird der Begriff der Kompaktheit abweichend von Definition 10.5, nämlich durch die Heine-Borel-Eigenschaft“,
”
erklärt. Im Rd ist auch diese Eigenschaft äquivalent zu unserer Definition; vgl. Analysis 2.
Beweis von Satz 10.8:
⇒“: Sei K beschränkt und abgeschlossen. Eine beliebige Folge {xn }n ⊂ K ist dann
”
beschränkt und nach Satz 10.4 existiert eine konvergente Teilfolge {xnl }l ⊂ K.
Da nun K abgeschlossen ist, gilt liml→∞ xnl =: x0 ∈ K.
⇐“: Nun sei K folgenkompakt. Dann ist K offenbar abgeschlossen. Wäre K nicht
”
beschränkt, so gäbe es zu jedem n ∈ N ein xn ∈ M mit xn ̸∈ Bn (0). Somit gilt
|xn | > n für alle n ∈ N, d.h. aus {xn }n können wir keine konvergente Teilfolge
auswählen, Widerspruch! Also ist K kompakt.
q.e.d.
Definition 10.6: Eine Teilmenge S ⊂ M heißt dicht in M ⊂ Rd , wenn zu jedem
x0 ∈ M eine Folge {xn }n ⊂ S existiert mit xn → x0 (n → ∞).
Zum Beispiel liegt Qd dicht in Rd , denn zu beliebigem x0 = (x01 , . . . , x0d ) ∈ Rd
können wir nach Satz 5.1 Folgen {xnj }n ⊂ Q, j = 1, . . . , d, finden mit xnj → x0j (n →
∞) und folglich
Qd ∋ xn := (xn1 , . . . , xnd ) → (x01 , . . . , x0d ) = x0
für n → ∞.
Abschließend wollen wir den Begriff des metrischen Raumes angeben und kurz
diskutieren:
Definition 10.7: Sei X eine beliebige Menge und zu je zwei Punkten x, y ∈ X
existiere eine reelle Zahl d(x, y) mit den folgenden Eigenschaften:
10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME
77
(a) d(x, y) > 0 für alle x, y ∈ X mit x ̸= y; d(x, x) = 0 für alle x ∈ X.
(b) d(x, y) = d(y, x) für alle x, y ∈ X.
(c) Dreiecksungleichung: d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X.
Dann nennen wir (X, d) einen metrischen Raum und die Abbildung d = d(x, y) :
X × X → R die Metrik oder den Abstand auf X.
Beispiele:
1. Jede Teilmenge X ⊂ Rd ist ein metrischer Raum mit der Metrik
d(x, y) := |x − y|,
x, y ∈ X,
wie sofort aus Satz 10.1 folgt.
2. Sei X ein beliebiger linearer Vektorraum über R und es existiere eine Abbildung ∥ · ∥ : X → R, genannt Norm auf X, mit folgenden Eigenschaften:
(a) ∥x∥ ≥ 0 für alle x ∈ X; ∥x∥ = 0 ⇔ x = 0.
(b) ∥λx∥ = |λ| ∥x∥ für alle x ∈ X, λ ∈ R.
(c) Dreiecksungleichung: ∥x + y∥ ≤ ∥x∥ + ∥y∥ für alle x, y ∈ X.
Dann nennt man X, oder genauer (X, ∥ · ∥), einen normierten Vektorraum;
z.B. ist also der euklidische Raum Rd mit der euklidischen Länge ∥ · ∥ := | · |
ein normierter Vektorraum. Aus (a)-(c) folgt wie in Beispiel 1 wieder, dass jede
Teilmenge Y ⊂ X eines normierten Vektorraumes auch metrischer Raum ist
mit der Metrik
d(x, y) := ∥x − y∥, x, y ∈ Y.
Wir werden später Funktionenräume“ als Beispiele normierter Vektorräume
”
kennenlernen. Diese sind, anders als der Rd , i.A. unendlich dimensional.
3. Wir können jede beliebige Menge X zu einem metrischen Raum machen mit
der diskreten Metrik
{
1, falls x ̸= y
d(x, y) :=
, x, y ∈ X.
0, falls x = y
Die Beispiele 1 und 2 zeigen also, dass man Mengen mit verschiedenen Metriken ausstatten kann; die folgenden topologischen Begriffe hängen dann ganz
wesentlich von der gewählten Metrik ab.
78
KAPITEL 1. ZAHLEN, FOLGEN, REIHEN
Die Begriffe Konvergenz und Cauchyfolge für Folgen {xn }n ⊂ Rd aus Definition 10.2 lassen sich nun sofort auf Folgen {xn }n ⊂ X aus einem metrischen
Raum (X, d) übertragen, indem man den Abstand |x − y| durch d(x, y) ersetzt;
z.B. heißt {xn }n ⊂ X konvergent (bzgl. d) gegen x ∈ X, wenn zu jedem ε > 0 ein
N = N (ε) ∈ N existiert mit
d(xn , x) < ε für alle n ≥ N.
x heißt dann wieder Grenzwert oder Limes der Folge und wir schreiben xn → x (n →
∞) oder x = limn→∞ xn . Man rechnet leicht nach, dass wieder jede konvergente Folge
in (X, d) auch Cauchyfolge ist. Die Umkehrung gilt jedoch i.A. nicht, sondern nur
in vollständigen metrischen Räumen, vgl. Definition 5.2.
Die topologischen Begriffe Offenheit und Abgeschlossenheit, innerer Punkt, Randpunkt, Häufungspunkt und isolierter Punkt sowie Inneres, Rand und Abschluss aus
den Definitionen 10.3, 10.4 übertragen sich nun wörtlich auf Teilmengen metrischer
Räume, wenn wir noch die r-Umgebung oder r-Kugel um x0 ∈ X gemäß
Br (x0 ) := {x ∈ X : d(x, x0 ) < r}
erklären. Bezeichnet M c := X \ M das Komplement einer Teilmenge M ⊂ X, so
haben wir
Satz 10.9: Mit den oben erklärten Begriffen bleiben die Aussagen der Sätze 10.510.7 in jedem metrischen Raum (X, d) richtig.
Beweis: Durch wörtliches Übertragen der Beweise.
q.e.d.
Der Begriff der Beschränktheit einer Menge aus Definition 10.5 macht in einem
metrischen Raum (X, d) wenig Sinn, da X kein ausgezeichnetes Element 0 enthalten muss. Wir nutzen daher den Begriff des Durchmessers, vgl. die Bemerkung im
Anschluss an Definition 10.5:
Definition 10.8: Ist (X, d) metrischer Raum, so erklären wir den Durchmesser von
M ⊂ X gemäß
diam M := sup{d(x, y) : x, y ∈ M },
diam ∅ := 0.
Gilt diam M < +∞, so heißt M beschränkt, sonst unbeschränkt.
Wie bereits im Anschluss an Satz 10.8 bemerkt, gilt dieser in metrischen Räumen
i.A. nicht mehr. Erklären wir den Begriff Folgenkompaktheit wieder analog zum Rd ,
so haben wir jedoch den
Satz 10.10: Jede folgenkompakte Teilmenge M eines metrischen Raumes (X, d) ist
abgeschlossen und beschränkt.
10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME
79
Beweis:
• Abgeschlossenheit: Ist {xn }n ⊂ M konvergent gegen x0 ∈ X, so konvergiert auch jede Teilfolge {xnk }k ⊂ {xn }n gegen x0 . Die Folgenkompaktheit liefert also x0 ∈ M .
• Beschränktheit: Wäre M unbeschränkt, also sup{d(x, y) : x, y ∈ M } = +∞ erfüllt, so gäbe
es Punkte xn , yn ∈ M mit d(xn , yn ) ≥ n für alle n ∈ N. Zu beliebigem x0 ∈ M können wir
dann zu einer Teilfolge {zk′ }k ⊂ M von {xn }n oder {yn }n übergehen mit d(zk′ , x0 ) ≥ k für alle
k ∈ N. Dann enthält aber {zk′ }k offenbar keine in M konvergente Teilfolge, im Widerspruch
zur Folgenkompaktheit.
q.e.d.
Kapitel 2
Funktionen und Stetigkeit
1
Beispiele und Grenzwerte von Funktionen
Definition 1.1:
• Es sei D ⊂ Rn (n ∈ N) eine beliebige, nichtleere Menge. Jedem Punkt x ∈ D
werde vermöge der Funktion f : D → Rd (d ∈ N) genau ein Wert y = f (x) ∈
Rd zugeordnet. Man schreibt auch x 7→ f (x) oder f = f (x) oder y = f (x)
für die Funktion. In Koordinaten haben wir d Funktionen f1 (x1 , . . . , xn ), . . . ,
fd (x1 , . . . , xn ), x = (x1 , . . . , xn ) ∈ D, mit
(
)
(y1 , . . . , yd ) = y = f (x) = f1 (x1 , . . . , xn ), . . . , fd (x1 , . . . , xn ) .
• Die Menge D ⊂ Rn heißt Definitionsbereich der Funktion f : D → Rd , die
Menge
W := {f (x) : x ∈ D} =: f (D)
ist der Wertebereich von f . Schließlich ist der Graph von f erklärt als
{
}
graph f := (x, f (x)) : x ∈ D ⊂ Rn × Rd = Rn+d .
Bemerkungen:
1. Eine Funktion ist also eine Abbildung zwischen Teilmengen n- bzw. d-dimensionaler reeller Räume, nämlich f : D → W , D ⊂ Rn , W ⊂ Rd . Daher sprechen
wir gleichwertig von Funktionen und Abbildungen.
2. Gilt speziell n = 2 oder/und d = 2, so können wir D bzw. W mit einer
komplexen Struktur ausstatten, d.h. D ⊂ C bzw. W ⊂ C auffassen. So kann
z.B. jede Funktion f : D → R2 als Funktion f : D → C interpretiert werden.
In diesem Sinne sind Funktionen f : D → R also Spezialfälle von Funktionen
f : D → C.
81
82
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
3. Analog können wir natürlich Funktionen zwischen metrischen Räumen erklären: Seien (X, d), (Y, δ) zwei metrische Räume und D ⊂ X eine nichtleere Teilmenge. Dann ordnet f : D → Y jedem x ∈ D einen eindeutigen Wert y = f (x) ∈ Y zu. Die Begriffe Definitionsbereich, Wertebereich
und Graph übertragen sich wörtlich; eine komponentenweise Darstellung ist
natürlich i.A. nicht möglich.
Definition 1.2: Eine Funktion f : D → Rd heißt beschränkt, wenn ein c ∈ R so
existiert, dass gilt
|f (x)| ≤ c für alle x ∈ D.
Anderenfalls heißt die Funktion unbeschränkt.
Bemerkung: Eine Funktion f : D → Rd ist also genau dann beschränkt, wenn ihr
Wertebereich W = f (D) ⊂ Rd beschränkt ist. Letztere Eigenschaft definiert auch
beschränkte Funktionen zwischen metrischen Räumen.
Beispiele:
1. Für den Fall d = 1 lässt sich der Graph von f : D → R, also die Punkte
(x, f (x)) ∈ Rn+1 , x ∈ D, als Höhenfunktion über D ⊂ Rn veranschaulichen
(→ Berglandschaft). Alternativ (für n ≥ 2) kann man sich die Funktion durch
Niveaumengen veranschaulichen. Hierzu skizziert man
Γf (c) := {x ∈ D : f (x) = c},
die Niveaumenge zum Niveau c ∈ R.
Zum Beispiel skizziere man die Niveaumengen (hier Niveaulinien) für f =
(x1 , x2 ) := x21 − x22 , x = (x1 , x2 ) ∈ R2 . Man beachte, dass f unbeschränkt ist,
da Γ(c) ̸= ∅ für alle c ∈ R gilt.
Konvention: Für n = 2, d = 1 schreibt man häufig x1 =: x, x2 =: y und
y =: z, also z = f (x, y).
2. Eine Funktion f : D → Rd , d ≥ 2, kann man als Vektorfeld interpretieren,
indem man an jeden Punkt x ∈ D ⊂ Rn den Vektor f (x) ∈ Rd anheftet“.
”
Diese Interpretation spielt vor allem in der Physik eine Rolle, etwa bei der
Beschreibung von Kraftfeldern.
3. Weiter lässt sich f : D → Rd , d ≥ 2, für D ⊂ Rn mit n = 1 als Kurve und für
n = 2 als Fläche im Rd interpretieren. Ist allgemeiner 2 ≤ n < d, so spricht
man von einer n-dimensionalen Fläche im Rd . Dabei heißt m := d − n ∈ N die
Codimension der Fläche.
1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN
83
Speziell lässt sich für g : D → R mit D ⊂ Rn , n ≥ 2, der Graph von g als
n-dimensionale Fläche im Rn+1 interpretieren:
f (x) := (x, g(x)) : D → Rn+1 .
In diesem Fall ist also die Codimension m = (n + 1) − n = 1; man spricht dann
von einer Hyperfläche.
4. Jedes komplexe Polynom
f (z) = an z n + an−1 z n−1 + . . . + a1 z + a0
(a0 , . . . , an ∈ C)
ist eine Funktion f : C → C. Auch Potenzreihen
P(z) =
∞
∑
ak z k
(al ∈ C für alle l ∈ N0 )
k=0
sind komplexe Funktionen P : KR (0) → C, wobei R ∈ [0, +∞) ∪ {+∞} den
Konvergenzradius der Reihe bezeichne. Alle nichtkonstanten Polynome sind
unbeschränkt!
5. Funktionen müssen keine geschlossene Darstellung besitzen. Beispiele sind die
Signumfunktion


 −1, x < 0
0,
x=0 : R→R
sgn(x) :=


+1, x > 0
oder die Dirichletsche Sprungfunktion
{
1, x ∈ Q
: R → R.
f (x) :=
0, x ∈ R \ Q
Beide Funktionen sind beschränkt.
6. Die wohl wichtigsten Beispiele von Funktionen auf metrischen Räumen sind
durch Integrale gegeben. Z.B. werden wir insbesondere für stetige Funktionen
f : [a, b] → R, −∞ < a < b < +∞, das Riemann-Integral erklären:
∫b
I(f ) :=
f (x) dx.
a
Es wird sich zeigen, dass der Raum C 0 ([a, b]) der auf [a, b] stetigen, reellwertigen Funktionen ein normierter und damit ein metrischer Raum ist. Also stellt
I : C 0 ([a, b]) → R eine Funktion auf C 0 ([a, b]) dar. Reellwertige Funktionen
auf metrischen Räumen nennt man Funktionale.
84
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Definition 1.3: Sei D ⊂ Rn und x0 ein Häufungspunkt von D. Zu der Funktion
f : D → Rd gäbe es ein a ∈ Rd , so dass für alle ε > 0 ein δ = δ(ε) > 0 existiere mit
der Eigenschaft
|f (x) − a| < ε
für alle x ∈ D mit 0 < |x − x0 | < δ.
(1.1)
Dann heißt a der Grenzwert oder Limes der Funktion f = f (x) im Punkt x0 und
wir schreiben
lim f (x) = a oder f (x) → a (x → x0 ).
x→x0
Man sagt auch: f (x) konvergiert gegen a, wenn x gegen x0 strebt.
Geometrisch: Es gilt limx→x0 f (x) = a genau dann, wenn für alle ε > 0 ein δ =
δ(ε) > 0 existiert, so dass f (x) ∈ Bε (a) für alle x ∈ Bδ′ (x0 ) ∩ D richtig ist. Hier
bezeichnet
Bδ′ (x0 ) := Bδ (x0 ) \ {x0 }
die punktierte Kugel.
Satz 1.1: Für f : D → Rd , x0 Häufungspunkt von D ⊂ Rn , gilt f (x) → a (x → x0 )
genau dann, wenn für jede Folge {xp }p ⊂ D \ {x0 } mit xp → x0 (p → ∞) die
Beziehung limp→∞ f (xp ) = a gilt.
Beweis:
• ⇒“: Sei also limx→x0 f (x) = a erfüllt und {xp }p ⊂ D \ {x0 } eine Folge mit
”
xp → x0 (p → ∞). Zu beliebig vorgegebenem ε > 0 wählen wir δ = δ(ε) > 0
wie in Definition 1.3 und N = N (ε) ∈ N so, dass gilt
0 < |xp − x0 | < δ(ε)
für alle p ≥ N (ε).
Dann folgt aus Formel 1.1
|f (xp ) − a| < ε
für alle p ≥ N (ε),
also limp→∞ f (xp ) = a.
• ⇐“: Sei nun limp→∞ f (xp ) = a richtig für jede Folge {xp }p ⊂ D \ {x0 }
”
mit limp→∞ xp = x0 . Angenommen es gilt nicht limx→x0 f (x) = a, d.h.: Es
gibt ein ε > 0, so dass für alle δ > 0 ein x ∈ D existiert mit 0 < |x −
x0 | < δ und |f (x) − a| ≥ ε. Wählen wir speziell δ = p1 , so finden wir also
xp ∈ D mit 0 < |xp − x0 | < p1 und |f (xp ) − a| ≥ ε > 0 für alle p ∈ N. Da
dann aber für die Folge {xp }p ⊂ D \ {x0 } gilt limp→∞ xp = x0 , müsste nach
Voraussetzung |f (xp ) − a| → 0 (p → ∞) erfüllt sein, Widerspruch! Also gilt
doch limx→x0 f (x) = a.
q.e.d.
1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN
85
Satz 1.2: (Rechenregeln für Funktionsgrenzwerte)
Seien Funktionen f, g : D → Rd erklärt mit limx→x0 f (x) = a, limx→x0 g(x) = b,
wobei x0 Häufungspunkt von D ⊂ Rn sei. Dann gelten die Rechenregeln:
lim [λf (x) + µg(x)] = λa + µb
x→x0
für alle λ, µ ∈ R,
lim ⟨f (x), g(x)⟩ = ⟨a, b⟩
x→x0
und für d = 2, also f, g : D → C, auch
lim [λf (x) + µg(x)] = λa + µb
x→x0
für alle λ, µ ∈ C,
lim f (x)g(x) = ab,
x→x0
lim
x→x0
f (x)
a
= ,
g(x)
b
falls g ̸= 0 in D und b ̸= 0 ist.
Beweis: Mit Satz 1.1 ergeben sich die Aussagen sofort aus den entsprechenden Rechenregeln für Folgengrenzwerte. Zur Übung kann man die Aussagen auch direkt
über die ε-δ-Definition“ 1.1 beweisen.
”
q.e.d.
Bemerkung: Die Definition und Schreibweise von Grenzwerten aus Definition 1.3
überträgt sich wieder auf Funktionen f : D → Y , D ⊂ X, zwischen metrischen
Räumen (X, d), (Y, δ), indem man |x − x0 | durch d(x, x0 ) und |f (x) − a| durch
δ(f (x), a) ersetzt. Die geometrische Deutung bleibt also wörtlich erhalten. Auch
Satz 1.1 bleibt natürlich richtig. Hingegen machen die Rechenregeln aus Satz 1.2 nur
für Y = Rd bzw. Y = C Sinn, die Linearität auch in normierten Räumen Y .
Wir betrachten noch einige spezielle Grenzprozesse für Funktionen einer reellen
Veränderlichen:
Definition 1.4: Es seien D ⊂ R und f : D → Rd gegeben.
(i) Gilt (x0 , x0 + α) ⊂ D und gibt es ein a ∈ Rd , so dass für alle ε > 0 ein
δ = δ(ε) ∈ (0, α) existiert mit
|f (x) − a| < ε
für alle x0 < x < x0 + δ,
so heißt a der rechtsseitige Limes von f an der Stelle x0 ; wir schreiben dann
f (x0 +) := lim f (x) = a
x→x0 +
oder
f (x) → a (x → x0 +).
(ii) Gilt (x0 − α, x0 ) ⊂ D und gibt es ein a ∈ Rd , so dass für alle ε > 0 ein
δ = δ(ε) ∈ (0, α) existiert mit
|f (x) − a| < ε
für alle x0 − δ < x < x0 ,
86
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
so heißt a der linksseitige Limes von f an der Stelle x0 ; wir schreiben dann
f (x0 −) := lim f (x) = a
oder
x→x0 −
f (x) → a (x → x0 −).
(iii) Gilt (β, +∞) ⊂ D, so sagen wir, f (x) konvergiert gegen b ∈ Rd für x → +∞,
wenn f ( 1t ) → b (t → 0+) gilt; wir schreiben dann
lim f (x) = b
x→+∞
oder
f (x) → b (x → +∞).
(iv) Ist schließlich (−∞, β) ⊂ D, so sagen wir, f (x) konvergiert gegen b ∈ Rd für
x → −∞, wenn f ( 1t ) → b (t → 0−) richtig ist; wir schreiben dann
lim f (x) = b
x→−∞
oder
f (x) → b (x → −∞).
Bemerkung: Ist f : D → Rd , D ⊂ R und (x0 − α, x0 + α) \ {x0 } ⊂ D, so besitzt f
in x0 genau dann den Grenzwert limx→x0 f (x) =: a, wenn gilt
lim f (x) = a = lim f (x).
x→x0 −
x→x0 +
Beispiele:
1. Für die Signumfunktion sgn(x) : R → R gilt in x0 = 0:
lim sgn(x) = −1,
x→0−
lim sgn(x) = +1.
x→0+
Also besitzt sgn(x) in x0 = 0 keinen Grenzwert.
2. Für die Funktion f (x) := x1 : (0, +∞) → R gilt limx→+∞ f (x) = 0, denn wir
haben f ( 1t ) = t → 0 (t → 0+).
Definition 1.5: Sei D ⊂ Rn und x0 ∈ D Häufungspunkt. Wir sagen, eine Funktion
f : D → R konvergiert gegen +∞ (bzw. −∞) für x → x0 , wenn zu jedem c > 0 ein
δ > 0 existiert mit
f (x) > c
(bzw. f (x) < −c)
für alle x ∈ Bδ′ (x0 ) ∩ D.
Wir schreiben
lim f (x) = ±∞
x→x0
oder
f (x) → ±∞ (x → x0 ).
1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN
87
Bemerkungen:
1. Man erweitert entsprechend für Funktionen f : D → R, D ⊂ R, die einseitigen
Grenzwerte aus Definition 1.4 auf Werte ±∞. Auch die Verallgemeinerung der
Definitionen 1.4 bzw. 1.5 auf metrische Räume im Bild- bzw. Urbildbereich ist
offensichtlich.
2. Wie in Satz 4.3 aus Kap. 1 sieht man leicht: Sei f : D → R, D ⊂ Rn , x0
Häufungspunkt von D, mit f (x) > 0 nahe“ x0 . Dann gilt
”
⇔
lim f (x) = +∞
x→x0
lim
x→x0
1
= 0.
f (x)
Entsprechendes gilt im Falle n = 1 für die einseitigen Grenzwerte.
Beispiele:
√
1. limx→0+ x = 0. Ist nämlich ε > 0 beliebig, so wählen wir δ = δ(ε) := ε2 > 0
√
und erhalten 0 < x < ε für 0 < x < δ(ε). Nach der letzten Bemerkung folgt
√
noch limx→+∞ x = +∞, denn
1
lim √
x→+∞
x
2. Wir wissen bereits
Satz 1.2:
Def. 1.4 (iii)
=
lim
t→0+
√
t = 0.
→ 0 (x → +∞). Somit liefern die Rechenregeln aus
1
x
7−
7x − 2
= lim
x→+∞ 3x + 1
x→+∞ 3 +
lim
2
x
1
x
7
= .
3
√
√
3. Für beliebiges a ∈ R gilt limx→+∞ ( x + a − x) = 0, denn für positives x > −a folgt aus
Beispiel 1
√
√ √
√
√
√
|( x + a − x)( x + a + x)|
√
0 ≤ | x + a − x| =
√
x+a+ x
|a|
|a|
= √
√ < √ → 0 (x → +∞).
x
x+a+ x
4. limx→+∞
x3 +1
x2 +1
= +∞. Denn wir haben
lim
x→+∞
1+
1
x2 + 1
= lim
· lim
x→+∞ x x→+∞ 1 +
x3 + 1
also die Behauptung aus obiger Bemerkung.
1
x2
1
x3
= 0 · 1 = 0,
88
2
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Der Stetigkeitsbegriff
Definition 2.1: Seien D ⊂ Rn , x0 ∈ D und eine Funktion f : D → Rd gegeben.
Dann heißt f in x0 stetig, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert, so dass
gilt
|f (x) − f (x0 )| < ε für alle x ∈ D mit |x − x0 | < δ.
Anderenfalls heißt f in x0 unstetig.
Bemerkungen:
1. Ist x0 ∈ D isolierter Punkt von D, so ist offenbar jede Funktion f : D → Rd
in x0 stetig.
2. Die Stetigkeit ist eine lokale Eigenschaft“, d.h.: Ist f in x0 stetig (bzw. un”
stetig) und ändern wir f in D \ Br (x0 ) für ein r > 0 beliebig ab, so bleibt die
resultierende Funktion in x0 stetig (bzw. unstetig).
3. Definition 2.1 überträgt sich wörtlich auf Funktionen f : D → Y , D ⊂ X,
zwischen metrischen Räumen (X, d), (Y, δ), wenn man |f (x) − f (x0 )| durch
δ(f (x), f (x0 )) und |x − x0 | durch d(x, x0 ) ersetzt. Auch der folgende Satz
bleibt richtig:
Satz 2.1: (Charakterisierung der Stetigkeit)
Sei f : D → Rd auf D ⊂ Rn erklärt und sei x0 ∈ D Häufungspunkt. Dann sind
folgende Aussagen äquivalent:
(i) f ist stetig in x0 .
(ii) Es gilt lim f (x) = f (x0 ).
x→x0
(iii) Für jede Folge {xp }p ⊂ D mit xp → x0 (p → ∞) gilt lim f (xp ) = f (x0 ).
p→∞
Beweis: Sofort aus den Definitionen 1.3 und 2.1 sowie Satz 1.1. In (iii) kann die
Forderung xp ̸= x0 aus Satz 1.1 offenbar fallen gelassen werden.
q.e.d.
Satz 2.2: (Rechenregeln)
(a) Sind f, g : D → Rd stetig in x0 ∈ D, so gilt dies auch für das Skalarprodukt
⟨f, g⟩ und jede Linearkombination λf + µg mit λ, µ ∈ R.
(b) Sind f, g : D → C stetig in x0 ∈ D, so gilt dies auch für jede Linearkombination λf + µg mit λ, µ ∈ C, das Produkt f g und, falls g ̸= 0 in D, auch für den
Quotienten fg .
Beweis: Sofort aus Satz 1.2 und Satz 2.1.
q.e.d.
2. DER STETIGKEITSBEGRIFF
89
Beispiele:
∑
1. Polynomfunktionen p(z) = nk=0 ak z k mit Koeffizienten a0 , . . . , an ∈ C sind
in jedem Punkt z0 ∈ C stetig nach Satz 2.2, da dies für die konstante f1 (z) :=
c ∈ C und die lineare Funktion f2 (z) := z erfüllt ist.
2. Die Dirichletsche Sprungfunktion
f (x) :=
{
1, x ∈ Q
0, x ∈ R \ Q
ist in keinem Punkt aus R stetig. Die Funktion
{
x, x ∈ Q
f (x) :=
0, x ∈ R \ Q
ist in x = 0 und nur dort stetig (→ Übungsaufgaben).
3. Die Signumfunktion


 −1, x < 0
0,
x=0
sgn(x) :=


1,
x>0
ist für alle x ∈ R \ {0} stetig und in x = 0 unstetig.
Satz 2.3: (Komposition stetiger Funktionen)
Seien Funktionen f : D → Rd und g : E → Rm gegeben mit D ⊂ Rn , E ⊂ Rd und
f (D) ⊂ E. Weiter seien f in x0 ∈ D und g in y0 = f (x0 ) ∈ E stetig. Dann ist auch
die Komposition h := g ◦ f : D → Rm in x0 stetig.
Beweis: Da für isolierte Punkte x0 ∈ D nichts zu zeigen ist, können wir annehmen,
dass x0 Häufungspunkt von D ist. Sei nun {xp }p ⊂ D \ {x0 } mit xp → x0 (p → ∞)
eine beliebige Folge. Nach Satz 2.1 gilt dann
lim f (xp ) = f (x0 ) = y0 .
p→∞
Somit folgt wiederum nach Satz 2.1
lim h(xp ) = lim g(f (xp )) = g(y0 ) = h(x0 ),
p→∞
p→∞
also die behauptete Stetigkeit von h = g ◦ f .
q.e.d.
Definition 2.2: Eine Funktion f : D → Rd , D ⊂ Rn , nennen wir stetig (auf D),
wenn f in allen Punkten x ∈ D stetig ist. Mit C 0 (D, Rd ) bezeichnen wir die Klasse
aller auf D stetigen Funktionen. Für d = 1 schreiben wir auch kurz C 0 (D) :=
C 0 (D, R) und für d = 2 auch C 0 (D, C) := C 0 (D, R2 ).
90
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Bemerkung: Gemäß Satz 2.2 wird C 0 (D, Rd ) durch die Verknüpfungen
(f + g)(x) := f (x) + g(x),
(λf )(x) := λf (x)
für x ∈ D
zu einem (unendlich dimensionalen) Vektorraum.
Wir wollen nun die Umkehrfunktion zu einer injektiven Funktion f : D → Rd
mit D ⊂ Rn betrachten, d.h. die Funktion f −1 : W → Rn mit W := f (D), die durch
die Forderung
f (x) = y
⇔
f −1 (y) = x für x ∈ D, y ∈ W
eindeutig bestimmt ist.
Satz 2.4: (Stetigkeit der Umkehrfunktion)
Sei K ⊂ Rn kompakt und f : K → Rd sei stetig und injektiv mit Wertebereich
W := f (K). Dann ist auch die Umkehrfunktion f −1 : W → Rn von f stetig auf W .
Beweis: Sei y0 ∈ W beliebig gewählt und sei {yp }p ⊂ W mit yp → y0 (p → ∞). Zu
zeigen ist dann
xp := f −1 (yp ) → f −1 (y0 ) =: x0 (p → ∞).
Die Folge {xp }p ⊂ K ist beschränkt, da K beschränkt ist. Sei nun ξ ∈ Rn ein
beliebiger Häufungspunkt von {xp }p und {xpk }k eine Teilfolge mit xpk → ξ (k → ∞).
Da K abgeschlossen ist, gilt ξ ∈ K. Die Stetigkeit von f liefert also f (xpk ) →
f (ξ) (k → ∞). Andererseits wissen wir
f (xpk ) = f (f −1 (ypk )) = ypk → y0 (k → ∞),
also f (ξ) = y0 = f (x0 ), so dass die Injektivität von f liefert ξ = x0 für alle Häufungspunkte von {xp }p . Das bedeutet lim xp = x0 , wie behauptet.
p→∞
q.e.d.
Bemerkung: Auch die Sätze 2.3 und 2.4 bleiben für Funktionen zwischen metrischen
Räumen richtig, wenn man in Satz 2.4 noch kompakt“ durch folgenkompakt“ er”
”
setzt; vgl. Kap. 1, § 10.
Wir wollen uns nun der Frage nach der Existenz einer stetigen Umkehrfunktion
für reellwertige Funktionen einer reellen Veränderlichen widmen. Wir beginnen mit
einem Satz, der von unabhängigem Interesse ist:
Satz 2.5: (Zwischenwertsatz von Bolzano-Weierstraß)
Sei f : [a, b] → R stetig mit f (a) ̸= f (b). Dann existiert zu jedem Wert c zwischen
f (a) und f (b) mindestens ein ξ ∈ (a, b) mit f (ξ) = c.
2. DER STETIGKEITSBEGRIFF
91
Beweis: Wir können f (a) < c < f (b) annehmen; anderenfalls gehen wir zu −f und
−c über. Wir betrachten nun die Menge
M := {x ∈ [a, b] : f (x) < c},
die offenbar nichtleer und beschränkt ist. Setzen wir ξ := sup M , so gibt es eine
Folge {xp }p ⊂ M mit xp → ξ (p → ∞); vgl. Hilfssatz 6.1 aus Kap. 1. Die Stetigkeit
von f liefert also f (ξ) = limp→∞ f (xp ) ≤ c, und nach Voraussetzung folgt ξ < b.
Wäre nun f (ξ) < c, so gäbe es wegen der Stetigkeit von f ein δ ∈ (0, b − ξ), so
dass gilt
f (x) < c für alle x ∈ [ξ, ξ + δ),
im Widerspruch zur Wahl von ξ = sup M . Also folgt f (ξ) = c.
q.e.d.
Folgerung 2.1: Sei I ⊂ R ein beliebiges, nicht notwendig beschränktes Intervall
und f : I → R eine stetige Funktion. Dann ist auch f (I) ⊂ R ein Intervall.
Beweis: Wir setzen I ∗ = f (I) und
ξ := inf I ∗ ∈ R ∪ {−∞},
η := sup I ∗ ∈ R ∪ {+∞}.
Wir zeigen nun (ξ, η) ⊂ I ∗ : Ist nämlich y ∈ (ξ, η) beliebig, so gibt es gemäß Hilfssatz 6.1 aus Kap. 1
Zahlen a, b ∈ I mit
ξ ≤ f (a) < y < f (b) ≤ η.
Nach dem Zwischenwertsatz existiert nun ein x ∈ (a, b) ⊂ I mit f (x) = y, d.h. y ∈ I ∗ .
Wir erhalten, dass I ∗ eines der folgenden Intervalle sein muss:
(ξ, η),
[ξ, η),
(ξ, η]
oder
[ξ, η].
∗
Sonst gäbe es nämlich ein z ∈ I mit z < ξ oder z > η, im Widerspruch zur Definition von ξ und η.
q.e.d.
Definition 2.3: Eine Funktion f : D → R, D ⊂ R, heißt monoton wachsend
(bzw. fallend), wenn
f (x) ≤ f (y)
(bzw. f (x) ≥ f (y))
für alle x, y ∈ D mit x < y
erfüllt ist. f heißt streng monoton wachsend (bzw. fallend), wenn gilt
f (x) < f (y)
(bzw. f (x) > f (y))
für alle x, y ∈ D mit x < y.
Satz 2.6: Sei I ⊂ R ein nichtleeres Intervall. Dann besitzt jede stetige, streng monotone Funktion f : I → R eine stetige, streng monotone Umkehrfunktion f −1 :
I ∗ → R mit dem Intervall I ∗ := f (I).
Beweis: Zunächst ist eine streng monotone Funktion offensichtlich injektiv. Also existiert die Umkehrfunktion f −1 : I ∗ → R, und nach Folgerung 2.1 ist I ∗ ein Intervall. O.B.d.A. sei nun f streng
monoton wachsend, sonst gehen wir zu −f über. Dann ist auch f −1 streng monoton wachsend. Zu
zeigen bleibt also die Stetigkeit von f −1 :
92
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
• Sei dazu zunächst y0 ∈ int I ∗ . Dann ist auch x0 := f −1 (y0 ) ∈ int I aufgrund der Monotonie.
Also existiert ein ε > 0 mit [x0 − ε, x0 + ε] ⊂ I, und nach Satz 2.4 ist f −1 stetig auf
f ([x0 − ε, x0 + ε]), also insbesondere in f (x0 ) = y0 .
• Sei nun y0 ̸∈ int I ∗ . Dann ist y0 ein Endpunkt von I ∗ , sagen wir der linke Endpunkt. Somit
muss, wieder wegen der Monotonie, auch x0 := f −1 (y0 ) linker Endpunkt von I sein. Es gibt
dann ein ε > 0, so dass gilt [x0 , x0 + ε] ⊂ I und nach Satz 2.4 ist f −1 stetig auf f ([x0 , x0 + ε])
und insbesondere in f (x0 ) = y0 .
q.e.d.
3
Stetige Funktionen auf Kompakta, gleichmäßige Stetigkeit
Wir haben in Paragraph 2 gesehen, dass stetige, injektive Funktionen auf kompakten
Teilmengen des Rn eine stetige Umkehrfunktion besitzen. In diesem Paragraphen
wollen wir weitere Eigenschaften kennenlernen, die Kompakta als Definitionsgebiete
auszeichnen. Wir beginnen mit dem
Satz 3.1: Ist K ⊂ Rn kompakt und f ∈ C 0 (K, Rd ), dann ist auch f (K) ⊂ Rd
kompakt.
Beweis: Sei {yp }p ⊂ f (K) eine beliebige Folge. Zu jedem yp gibt es (mindestens) ein
xp ∈ K mit f (xp ) = yp . Da K kompakt ist, können wir nach Kap. 1, Satz 10.8 aus
{xp }p ⊂ K eine konvergente Teilfolge {xpl }l auswählen mit liml→∞ xpl =: x0 ∈ K.
Die Stetigkeit von f ergibt nun
ypl = f (xpl ) → f (x0 ) =: y0 ∈ f (K)
für l → ∞.
Wiederum Satz 10.8 aus Kap. 1 liefert die behauptete Kompaktheit von f (K).
q.e.d.
Eines der wichtigsten Hilfsmittel der Analysis enthält der folgende
Satz 3.2: (Weierstraßscher Hauptlehrsatz)
Sei K ⊂ Rn kompakt und nichtleer und sei f ∈ C 0 (K, R). Dann gibt es Punkte
x, x ∈ K, so dass gilt
f (x) ≤ f (x) ≤ f (x)
für alle x ∈ K.
Bemerkung: Relation (3.1) können wir auch schreiben als
f (x) = inf f (K) =: inf f (x) = inf f,
x∈K
K
f (x) = sup f (K) =: sup f (x) = sup f.
x∈K
K
(3.1)
3. KOMPAKTA UND GLEICHMÄSSIGE STETIGKEIT
93
Das heißt: Eine stetige, auf einem Kompaktum erklärte Funktion nimmt dort ihr
Infimum (=Minimum) bzw. Supremum (=Maximum) an. Die Aussage wird offenbar
falsch, wenn man eine der Voraussetzungen fallen lässt.
Beweis von Satz 3.2: Nach Satz 3.1 ist f (K) ⊂ R beschränkt und abgeschlossen.
Inbesondere existieren also
m := inf f ∈ R,
K
m := sup f ∈ R.
K
Nach Hilfssatz 6.1 aus Kap. 1 gibt es nun zwei Folgen {xp }p , {xp }p ⊂ K mit
f (xp ) → m, f (xp ) → m (p → ∞).
(3.2)
Da K kompakt ist, können wir andererseits konvergente Teilfolgen {xpl }l , {xpl }l
auswählen mit x := liml→∞ xpl ∈ K und x := liml→∞ xpl ∈ K. Die Stetigkeit von f
liefert dann
(3.3)
f (xpl ) → f (x), f (xpl ) → f (x) (l → ∞).
Ein Vergleich von (3.2) und (3.3) ergibt also
f (x) = m ≤ f (x) ≤ m = f (x) für alle x ∈ K,
wie behauptet.
q.e.d.
Für die Formulierung des dritten grundlegenden Resultats benötigen wir noch
die folgende Verschärfung des Stetigkeitsbegriffs:
Definition 3.1: Sei D ⊂ Rn und f : D → Rd gegeben. Dann heißt f gleichmäßig
stetig auf D, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert, so dass gilt
|f (x) − f (x′ )| < ε
für alle x, x′ ∈ D mit |x − x′ | < δ.
(3.4)
Bemerkung: Für eine stetige Funktion f ∈ C 0 (D, Rd ) gilt (3.4) ebenfalls, jedoch
mit einem i.A. von x, x′ ∈ D abhängigen δ = δ(ε, x, x′ ). Jede gleichmäßig stetige
Funktion ist also stetig. Die Umkehrung gilt jedoch nicht, wie etwa das Beispiel
f (x) := x1 , x ∈ (0, 1], zeigt: Angenommen es gäbe z.B. für ε = 1 ein δ > 0, so
dass |f (x) − f (x′ )| < 1 für alle x, x′ ∈ (0, 1] mit |x − x′ | < δ richtig ist. Speziell für
0 < x < min{δ, 12 } und x′ = 2x folgte dann aber |x−x′ | = x < δ und |f (x)−f (x′ )| =
1
1
| x1 − 2x
| = 2x
> 1, Widerspruch!
Satz 3.3: (Heine)
Ist K ⊂ Rn kompakt und f ∈ C 0 (K, Rd ), so ist f gleichmäßig stetig.
94
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Beweis: Angenommen, f ist nicht gleichmäßig stetig. Dann gibt es also ein ε > 0,
so dass für alle δ > 0 Punkte x, x′ ∈ K mit |x − x′ | < δ existieren, für die gilt
|f (x) − f (x′ )| ≥ ε. Wählen wir insbesondere δ = p1 , p ∈ N, so finden wir also Folgen
{xp }p , {x′p }p ⊂ K mit
1
für alle p ∈ N
(3.5)
|xp − x′p | <
p
und
|f (xp ) − f (x′p )| ≥ ε
für alle p ∈ N.
(3.6)
Da nun K kompakt ist, existiert nach Satz 10.8 aus Kap. 1 eine konvergente Teilfolge
{xpl }l ⊂ {xp }p mit liml→∞ xpl = x0 ∈ K. Für die entsprechende Teilfolge {x′pl }l ⊂
{x′p }p liefert (3.5) ebenfalls liml→∞ x′pl = x0 . Und aus der Stetigkeit von f und (3.6)
folgern wir
0 = |f (x0 ) − f (x0 )| = lim f (xpl ) − lim f (x′pl ) = lim |f (xpl ) − f (x′pl )| ≥ ε > 0,
l→∞
l→∞
l→∞
also einen Widerspruch!
q.e.d.
Bemerkungen:
1. Im obigen Beispiel f (x) =
kompakt.
1
x,
x ∈ (0, 1], ist zwar f stetig aber (0, 1] nicht
2. Die drei Sätze dieses Paragraphen bleiben für Funktionen auf kompakten Teilmengen metrischer Räume richtig, wenn man den Kompaktheitsbegriff nach
Heine-Borel benutzt. Für den Beweis verwendet man, dass dieser in metrischen
Räumen äquivalent zur Folgenkompaktheit ist.
4
Funktionenfolgen und gleichmäßige Konvergenz
Wir betrachten nun Folgen {fn }n von Funktionen fn : D → Rd , die alle auf ein und
derselben nichtleeren Menge D ⊂ Rm erklärt seien.
Definition 4.1: Eine Funktionenfolge {fn }n mit fn : D → Rd , n ∈ N, heißt punktweise konvergent auf D ⊂ Rm , wenn die Punktfolge {fn (x)}n ⊂ Rd für jedes x ∈ D
konvergent ist. Die Grenzwerte
f (x) := lim fn (x),
n→∞
x ∈ D,
definieren dann eine Funktion f : D → Rd , den sogenannten punktweisen Limes der
Funktionenfolge {fn }n . Schreibweise: fn → f (n → ∞) auf D.
4. FUNKTIONENFOLGEN UND GLEICHMÄSSIGE KONVERGENZ
95
Beispiele:
1. D = [0, 1] ⊂ R, fn (x) := xn . {fn }n konvergiert bekanntlich punktweise gegen
die Funktion
{
0, x ∈ [0, 1)
.
f (x) :=
1, x = 1
1
2. D = [0, +∞), gn (x) := x n . Dann konvergiert {gn }n punktweise gegen
{
1, x ∈ (0, +∞)
g(x) :=
.
0, x = 0
Die Beispiele zeigen, dass der punktweise Limes einer Folge stetiger Funktionen
nicht wieder stetig sein muss. Um beim Grenzübergang in der Klasse der stetigen
Funktionen zu bleiben, benötigen wir einen stärkeren Konvergenzbegriff, der auf
Weierstraß zurückgeht:
Definition 4.2: Eine Folge {fn }n von Funktionen fn : D → Rd mit D ⊂ Rm heißt
gleichmäßig konvergent gegen f : D → Rd , in Zeichen fn →
→ f (n → ∞) auf D,
wenn zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit
|fn (x) − f (x)| < ε
für alle x ∈ D und n ≥ N (ε).
(4.1)
Bemerkung: Formel (4.1) gilt natürlich auch für den punktweisen Limes einer Funktionenfolge, allerdings mit einem i.A. von x ∈ D abhängigen N = N (ε, x) ∈ N.
Satz 4.1: (Weierstraßscher Konvergenzsatz)
Die Folge {fn }n stetiger Funktionen fn : D → Rd konvergiere auf D ⊂ Rm gleichmäßig gegen f : D → Rd . Dann ist f stetig auf D.
Beweis: Nach Definition 4.2 gibt es zu beliebig gewähltem ε > 0 ein N = N (ε) ∈ N
mit
ε
für alle x ∈ D.
(4.2)
|fN (x) − f (x)| <
3
Sei nun x0 ∈ D gewählt. Da fN stetig ist, finden wir ein δ = δ(ε) > 0, so dass gilt
|fN (x) − fN (x0 )| <
ε
3
für alle x ∈ D mit |x − x0 | < δ.
Mit der Dreiecksungleichung erhalten wir nun aus (4.2) und (4.3)
|f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )|
ε ε ε
<
+ + = ε für alle x ∈ D mit |x − x0 | < δ,
3 3 3
(4.3)
96
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
wie behauptet.
q.e.d.
Der nächste Satz besagt insbesondere, dass der Raum der stetigen Funktionen“
”
im unten zu präzisierenden Sinne vollständig ist:
Satz 4.2: (Cauchys Konvergenzkriterium bei gleichmäßiger Konvergenz)
Sei {fn }n eine Folge von Funktionen fn : D → Rd , D ⊂ Rm . Dann konvergiert
{fn }n genau dann gleichmäßig (gegen ein f : D → Rd ), wenn zu jedem ε > 0 ein
N = N (ε) ∈ N existiert mit
|fn (x) − fk (x)| < ε
für alle x ∈ D und n, k ≥ N (ε).
(4.4)
Beweis:
• ⇒“: Sei fn →
→ f (n → ∞) auf D erfüllt. Dann existiert zu beliebigem ε > 0
”
ein N (ε) ∈ N mit |fn (x) − f (x)| < 2ε für alle x ∈ D und n ≥ N (ε). Mit der
Dreiecksungleichung folgt dann (4.4).
• ⇐“: Sei umgekehrt (4.4) erfüllt. Wegen der Vollständigkeit des Rd existiert
”
dann der punktweise Limes f (x) = limk→∞ fk (x), x ∈ D. Wenden wir (4.4)
auf 2ε statt ε an und gehen zur Grenze k → ∞ über, so folgt
|fn (x) − f (x)| = lim |fn (x) − fk (x)| ≤
k→∞
ε
< ε für alle x ∈ D, n ≥ N (ε),
2
also fn →
→ f (n → ∞) auf D.
Q.e.d.
Definition 4.3: Auf dem (Vektor)-Raum der stetigen, beschränkten Funktionen
Cb0 (D, Rd ) := {f ∈ C 0 (D, Rd ) : f ist beschränkt}
für nichtleeres D ⊂ Rm erklären wir die Supremumsnorm
∥f ∥D := sup |f (x)| < +∞.
x∈D
Bemerkungen:
1. Falls D = K ⊂ Rm kompakt ist, ist nach Satz 3.2 jede Funktion f ∈ C 0 (K, Rd )
beschränkt.
2. Als Übungsaufgabe prüft man nach, dass die Supremumsnorm tatsächlich eine
Norm mit den Eigenschaften (a)-(c) auf V = Cb0 (D, Rd ) ist; vgl. Kap. 1, § 10.
Also ist (V, ∥ · ∥D ) ein normierter und damit auch ein metrischer Raum.
3. Für Funktionenfolgen {fn }n ⊂ V = Cb0 (D, Rd ) gilt:
4. FUNKTIONENFOLGEN UND GLEICHMÄSSIGE KONVERGENZ
• fn →
→ f ∈ V (n → ∞) auf D
⇔
97
∥fn − f ∥D → 0 (n → ∞).
• Eigenschaft (4.4) ist äquivalent zu ∥fn − fk ∥D < ε für alle n, k ≥ N (ε).
Wir erhalten die
Folgerung 4.1: Der Vektorraum V = Cb0 (D, Rd ) der stetigen, beschränkten Funktionen auf D ⊂ Rm ist vollständig bez. der Supremumsnorm, d.h. (V, ∥ · ∥D ) ist ein
vollständiger normierter Raum oder Banachraum.
Beweis: Sofort aus den Sätzen 4.1 und 4.2.
q.e.d.
Wir wollen nun, analog zu komplexen Reihen, Funktionenreihen untersuchen:
Definition 4.4: Ist {fk }k eine Folge
fk : D → C, D ⊂ Rm , so heißt
∑
∑∞ von Funktionen
die zugehörige Funktionenreihe k=1 fk = k fk gleichmäßig konvergent, wenn die
Folge der Partialsummen
sn (x) :=
n
∑
fk (x),
x ∈ D,
k=1
gleichmäßig konvergiert.
Bemerkungen:
Gilt {fk }k ⊂ C 0 (D, C), so ist auch {sn }n ⊂ C 0 (D, C). Konvergiert also
1. ∑
∞
k=1 fk gleichmäßig, so ist die Grenzfunktion (=Wert der Funktionenreihe)
eine stetige Funktion nach Satz 4.1.
2. Wir beschränken uns hier auf komplexwertige Funktionenreihen, da wir bisher nur komplexe Reihen betrachtet haben. Man kann die Aussagen leicht
auf Rd -wertige Funktionenreihen übertragen, indem man die entsprechenden
Ergebnisse aus Kap. 1, § 8 auf Reihen in Rd erweitert.
Satz 4.3: (Majorantenkriterium für Funktionenreihen)
Sei D ⊂ Rm und {fk }k eine Folge von Funktionen fk : D → C. Ferner sei {ck }k ⊂ R
eine Punktfolge mit der Eigenschaft
|fk (x)| ≤ ck
für alle x ∈ D.
(4.5)
∑∞
∑∞
Falls dann
k=1 ck konvergiert, so
k=1 fk gleichmäßig auf D. Die
∑
∑ konvergiert
Reihe k ck heißt Majorante von k fk .
98
KAPITEL 2. FUNKTIONEN UND STETIGKEIT
Beweis: Sei ε > 0 gewählt. Satz 8.1 aus Kap. 1 und (4.5) liefern zunächst
n
∑
|fk (x)| ≤
k=m+1
n
∑
ck < ε
für alle x ∈ D und n > m ≥ N (ε)
k=m+1
mit geeignetem N (ε) ∈ N. Aus der Dreiecksungleichung folgt dann
∑
n
∑
n
|fk (x)| < ε
fk (x) ≤
|sn (x) − sm (x)| = k=m+1
k=m+1
für alle x ∈ D und n > m ≥ N (ε). Satz 4.2 liefert also die Behauptung.
q.e.d.
Als Folgerung halten wir das folgende wichtige Resultat fest:
∑
k
Satz 4.4: Es seien {ak }k ⊂ C, R ∈ (0, +∞) ∪ {+∞} und P(z) := ∞
k=0 ak z eine
in KR (0) = {z ∈ C : |z| < R} konvergente Potenzreihe. Dann ist P : KR (0) → C
stetig.
Beweis: Sei z0 ∈ KR (0) beliebig, so folgt z0 ∈ KR0 (0) mit R0 := 12 (|z0 | + R) < R.
k
Nun ist für D := KR0 (0) die Folge {ak z k }k ⊂ C 0 (D, C) durch {|ak |R
∑0 }k ⊂ kR
majorisiert im Sinne von (4.5), und nach Satz 9.2 aus Kap. 1 konvergiert k |ak |R0 .
Satz 4.3 liefert also die gleichmäßige Konvergenz der Potenzreihe P auf D. Und nach
Satz 4.1 ist P stetig auf D, also insbesondere auch im Punkt z0 ∈ D. Da z0 ∈ KR (0)
beliebig war, folgt P ∈ C 0 (KR (0), C), wie behauptet.
q.e.d.
Folgerung 4.2: Die komplexe Exponentialfunktion
exp z = ez :=
∞
∑
zk
k=0
k!
ist auf ganz C stetig.
Wir werden exp z genauer im nächsten Kapitel untersuchen und hieraus auch
die weiteren elementaren Funktionen wie Sinus, Cosinus, Hyperbelfunktionen, Logarithmus und allgemeine Potenz ableiten.
Kapitel 3
Differential- und
Integralrechnung in einer reellen
Veränderlichen
1
Differenzierbarkeit
Wir untersuchen Funktionen einer reellen Veränderlichen f : I → Rd für d ∈ N.
Hier und im Folgenden sei I ⊂ R ein (nicht notwendig beschränktes) Intervall. Wir
beginnen mit einem der wichtigsten Begriffe der Analysis überhaupt:
Definition 1.1: Eine Funktion f : I → Rd heißt differenzierbar an der Stelle t0 ∈ I,
falls der Grenzwert
f (t0 + h) − f (t0 )
f (t) − f (t0 )
= lim
t→t
h→0
h
t − t0
0
f ′ (t0 ) := lim
(1.1)
existiert. f ′ (t0 ) heißt (erste) Ableitung oder Differentialquotient von f an der Stelle
t0 . Alternativ schreiben wir auch
df
(t0 ),
dt
Df (t0 )
oder
f˙(t0 )
für die Ableitung. Falls t0 ein Randpunkt von I ist, so ist der Grenzwert h → 0 in
(1.1) als einseitiger Grenzwert h → 0+ bzw. h → 0− aufzufassen.
Die Funktion f : I → Rd heißt differenzierbar (auf I), wenn f in jedem Punkt
t0 ∈ I differenzierbar ist.
99
100
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Bemerkungen:
1. Geometrische Interpretationen:
(a) Der Differenzenquotient
∆h f (t0 ) :=
f (t0 + h) − f (t0 )
h
einer Funktionf : I → R ist die Steigung der Sekante an graph f durch
(t0 , f (t0 )) und (t0 + h, f (t0 + h)). Bei Grenzübergang h → 0 geht die
Sekante in die Tangente
{
}
T := (t, y) ∈ R2 : y = f ′ (t0 )(t − t0 ) + f (t0 )
an graph f im Punkt (t0 , f (t0 )) über; f ′ (t0 ) ist die Steigung der Tangente.
(b) Für eine Kurve f : I → Rd im Rd sind ∆h f (t0 ) Sekantenvektoren in
Rd und f ′ (t0 ) wird als Tangentenvektor an die Kurve im Punkt f (t0 )
interpretiert (und abgetragen).
2. Zum Beispiel sind die Funktionen f (t) := t, g(t) := c mit einer Konstanten
c ∈ R für alle t ∈ R differenzierbar und es gilt
f ′ (t) = 1,
g ′ (t) = 0
für alle t ∈ R.
3. Falls f : I → Rd differenzierbar ist, so kann man die Zuordnung t 7→ f ′ (t)
wieder als Funktion f ′ : I → Rd interpretieren. Ist f ′ differenzierbar in t0 ∈ I,
so können wir f ′′ (t0 ) := (f ′ )′ (t0 ) bilden, die zweite Ableitung von f an der
Stelle t0 , mit den alternativen Schreibweisen
f ′′ (t0 ) =
d2 f
(t0 ) = D2 f (t0 ) = f¨(t0 ).
dt2
Ist f ′ auf ganz I differenzierbar, so fassen wir f ′′ : I → Rd wiederum als
Funktion auf.
Falls allgemein die (n − 1)-te Ableitung f (n−1) : I → Rd für ein n ∈ N definiert
und in t0 ∈ I differenzierbar ist, wobei f (0) := f gesetzt wird, so erklären wir
die n-te Ableitung von f in t0 als f (n) (t0 ) := (f (n−1) )′ (t0 ). Wir schreiben dann
auch
dn f
f (n) (t0 ) = n (t0 ) = Dn f (t0 ).
dt
Wenn die n-te Ableitung f (n) auf ganz I existiert, so heißt f n-mal differenzierbar.
1. DIFFERENZIERBARKEIT
101
Satz 1.1: Ist f : I → Rd gegeben, so sind die folgenden Aussagen äquivalent:
(i) f ist in t0 ∈ I differenzierbar.
(ii) Es existiert ein a ∈ Rd und eine in t0 stetige Funktion φ : I → Rd mit
φ(t0 ) = 0, so dass gilt
f (t) = f (t0 ) + (t − t0 )a + (t − t0 )φ(t)
für alle t ∈ I.
(1.2)
Beweis:
• ⇒“: Sei f in t0 differenzierbar. Wir setzen dann a := f ′ (t0 ) und
”

 f (t) − f (t0 ) − a, falls t ∈ I \ {t }
0
t − t0
φ(t) :=
.

0,
für t = t0
Offenbar ist dann φ in t0 stetig mit φ(t0 ) = 0, und Umstellen liefert die
gesuchte Darstellung (1.2).
• ⇐“: Haben wir umgekehrt (1.2), so liefert Umstellen für t ̸= t0 :
”
f (t) − f (t0 )
= a + φ(t) → a (t → t0 ),
t − t0
also die Differenzierbarkeit von f in t0 .
q.e.d.
Bemerkung: Der Beweis zeigt, dass a eindeutig bestimmt ist und dass gilt a = f ′ (t0 ).
Die Darstellung (1.2) liefert also eine lineare Approximation von f durch
L(t) := f (t0 ) + (t − t0 )f ′ (t0 ),
t ∈ R.
Setzen wir noch ψ(t) := a + φ(t) für t ∈ I, so haben wir die zu (1.2) äquivalente
Darstellung
f (t) = f (t0 ) + (t − t0 )ψ(t), t ∈ I,
(1.3)
wobei nun ψ : I → Rd in t0 stetig ist und ψ(t0 ) = f ′ (t0 ) erfüllt.
Folgerung 1.1: Eine in t0 ∈ I differenzierbare Funktion f : I → Rd ist in t0 stetig.
Beweis: Sofort aus Darstellung (1.2) oder (1.3).
q.e.d.
Bemerkungen:
1. Die Umkehrung von Folgerung 1.1 gilt nicht, wie etwa das Beispiel f (t) := |t| im
Punkt t0 = 0 zeigt. Es gibt sogar stetige, nirgends differenzierbare Funktionen;
siehe S. Hildebrandt: Analysis 1 (Springer-Verlag), S. 192.
102
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
2. Eine Funktion f = (f1 , . . . , fd ) : I → Rd ist genau dann in t0 ∈ I differenzierbar, wenn alle Komponentenfunktionen f1 , . . . , fd in t0 differenzierbar sind;
dann gilt
(
)
f ′ (t0 ) = f1′ (t0 ), . . . , fd′ (t0 ) .
3. Wie die Stetigkeit ist auch die Differenzierbarkeit (in einem Punkt) eine lokale
Eigenschaft.
Für komplexwertige Funktionen gelten folgende Rechenregeln:
Satz 1.2: Sind f, g : I → C in t0 ∈ I differenzierbar, so gilt dies auch für λf + µg
mit beliebigen λ, µ ∈ C, f · g und, falls g ̸= 0 auf I, auch für fg , und wir haben:
(λf + µg)′ (t0 ) = λf ′ (t0 ) + µg ′ (t0 )
für λ, µ ∈ C,
(f g)′ (t0 ) = f ′ (t0 )g(t0 ) + f (t0 )g ′ (t0 ) (Produktregel),
( f )′
f ′ (t0 )g(t0 ) − f (t0 )g ′ (t0 )
(t0 ) =
(Quotientenregel).
g
g(t0 )2
(1.4)
(1.5)
(1.6)
Beweis: Nach Satz 1.1 und der anschließenden Bemerkung haben wir die Darstellungen
f (t) = f (t0 ) + (t − t0 )ψ(t),
g(t) = g(t0 ) + (t − t0 )χ(t),
mit in t0 stetigen Funktionen ψ, χ : I → C, die ψ(t0 ) = f ′ (t0 ), χ(t0 ) = g ′ (t0 ) erfüllen.
Damit folgen
λf (t) + µg(t) = [λf (t0 ) + µg(t0 )] + (t − t0 )[λψ(t) + µχ(t)],
[
]
f (t) · g(t) = [f (t0 )g(t0 )] + (t − t0 ) ψ(t)g(t0 ) + f (t0 )χ(t) + (t − t0 )ψ(t)χ(t) ,
f (t)
g(t)
=
f (t0 )
ψ(t)g(t0 ) − f (t0 )χ(t)
+ (t − t0 )
.
g(t0 )
g(t)g(t0 )
Wiederum Satz 1.1 liefert die Behauptung.
q.e.d.
Bemerkung: Eine (1.4) entsprechende Regel gilt natürlich auch für Funktionen f, g :
I → Rd , dann mit λ, µ ∈ R. Formel (1.5) ist für solche Funktionen durch die Relation
⟨f, g⟩′ (t0 ) = ⟨f ′ (t0 ), g(t0 )⟩ + ⟨f (t0 ), g ′ (t0 )⟩
zu ersetzen (Übungsaufgabe).
(1.7)
1. DIFFERENZIERBARKEIT
103
Beispiele:
1.
= nxn−1 für n ∈ N0 und beliebiges x ∈ R.
Denn für n = 0, 1 ist die Aussage klar und durch Induktionsschluss n → n + 1 haben wir:
Mit xn ist nach Satz 1.2 auch xn+1 = xn · x differenzierbar und es gilt
d
(xn )
dx
d n+1
(x
)
dx
=
(IV )
=
2.
d n
(x · x)
dx
(1.5)
=
(xn )′ x + xn x′
nxn−1 x + xn · 1 = (n + 1)xn .
d
(x−n )
dx
= −nx−n−1 für n ∈ N und x ∈ R \ {0}.
Denn nach Beispiel 1 und Satz 1.2 ist x−n = x1n in R \ {0} differenzierbar, und es gilt
d −n (1.6) (1)′ · xn − 1 · (xn )′
(x ) =
= −nx−n−1 .
dx
x2n
Insgesamt haben wir also
d ν
(x ) = νxν−1
dx
für alle ν ∈ Z
und x ∈ R \ {0}.
Definition 1.2: Für beliebige k ∈ N0 erklären wir den Vektorraum C k (I, Rd ) aller
k-mal stetig differenzierbaren Funktionen f : I → Rd , die auf I Ableitungen bis zur
k-ten Ordnung besitzen und für die f (k) : I → Rd stetig ist. Weiter erklären wir
C ∞ (I, Rd ) :=
∩
C k (I, Rd ),
k∈N0
den Vektorraum der unendlich oft stetig differenzierbaren Funktionen.
Schließlich schreiben wir auch C k (I) bzw. C k (I, C) für die reell- bzw. komplexwertigen k-mal stetig differenzierbaren Funktionen (k ∈ N0 ∪ {∞}) auf I.
Bemerkung: Dass C k (I, Rd ) ein Vektorraum ist für alle k ∈ N0 ∪ {∞}, folgt aus
Satz 1.2. Nach Folgerung 1.1 sind alle Ableitungen f (= f (0) ), f ′ (= f (1) ), . . . , f (k)
einer Funktion f ∈ C k (I, Rd ) stetig auf I. Insbesondere folgt
C k (I, Rd ) ⊂ C l (I, Rd ) für l ≤ k.
Wir untersuchen nun die Komposition zweier differenzierbarer Funktionen:
Satz 1.3: (Kettenregel)
Seien I, J ⊂ R Intervalle und f : I → R, g : J → Rd zwei Funktionen mit f (I) ⊂ J.
Falls f in x0 ∈ I und g in y0 := f (x0 ) ∈ J differenzierbar sind, so ist auch die
Komposition h := g ◦ f : I → Rd in x0 differenzierbar, und es gilt
h′ (x0 ) = g ′ (f (x0 ))f ′ (x0 ).
(1.8)
104
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis: Aus Satz 1.1 und der anschließenden Bemerkung entnehmen wir
f (x) = f (x0 ) + (x − x0 )ψ(x),
g(y) = g(y0 ) + (y − y0 )χ(y)
mit in x0 bzw. y0 = f (x0 ) stetigen Funktionen ψ : I → R, χ : J → Rd , für die ψ(x0 ) = f ′ (x0 )
bzw. χ(y0 ) = g ′ (y0 ) gilt. Es folgt also
(
)
g(f (x)) = g(f (x0 )) + f (x) − f (x0 ) χ(f (x))
[
]
= g(f (x0 )) + (x − x0 )) χ(f (x))ψ(x) .
Und da die Funktion χ(f (x))ψ(x) nach Satz 2.3 aus Kap. 2 wieder stetig ist in x0 , ist h = g ◦ f nach
Satz 1.1 differenzierbar und es gilt
h′ (x0 ) = χ(f (x))ψ(x)x=x = g ′ (f (x0 ))f ′ (x0 ),
0
wie behauptet.
q.e.d.
Wir wenden uns nun wieder der Untersuchung der Umkehrfunktion einer injektiven Funktion f : I → R zu:
Satz 1.4: (Ableitung der Umkehrfunktion)
Sei f : I → R eine stetige Funktion, die das Intervall I ⊂ R bijektiv auf I ∗ := f (I)
abbilde. Ist dann f in x0 ∈ I differenzierbar und gilt f ′ (x0 ) ̸= 0, so ist auch die
Umkehrfunktion g := f −1 : I ∗ → R in y0 := f (x0 ) differenzierbar und es gilt
g ′ (y0 ) =
1
f ′ (x0 )
.
(1.9)
Beweis: Da f streng monoton ist, ist I ∗ nach Satz 2.6 aus Kap. 2 wieder ein Intervall
und g = f −1 stetig auf I ∗ . Ist also {yn }n ⊂ I ∗ \{y0 } eine beliebige (nun existierende)
Folge mit limn→∞ yn = y0 , so gilt
lim g(yn ) = g(y0 ) = x0 .
n→∞
Setzen wir noch xn := g(yn ) ∈ I \ {x0 } für n ∈ N, so haben wir
[ f (x ) − f (x ) ]−1
g(yn ) − g(y0 )
xn − x0
n
0
=
=
,
yn − y0
f (xn ) − f (x0 )
xn − x0
n ∈ N.
(1.10)
Da f in x0 differenzierbar ist mit f ′ (x0 ) ̸= 0, können wir in (1.10) zur Grenze n → ∞
übergehen und erhalten
lim
n→∞
g(yn ) − g(y0 )
1
= ′
.
yn − y0
f (x0 )
Nach Satz 1.1 aus Kap. 2 existiert also der Grenzwert limy→y0
es gilt (1.9).
g(y)−g(y0 )
y−y0
= g ′ (y0 ) und
q.e.d.
1. DIFFERENZIERBARKEIT
105
Beispiel: Die Funktion f (x) := xn , n ∈ N, bildet [0, +∞) bijektiv auf [0, +∞) ab
√
mit der Umkehrfunktion g(y) = f −1 (y) = n y. Für x > 0 gilt f ′ (x) = nxn−1 > 0, so
dass Satz 1.4 liefert
( √ )′
1
1 1
n
y =
= y n −1 .
√
n−1
n
n( y)
n
Für die Potenzfunktion f (x) := xq , x > 0, mit einem q = rs ∈ Q (r ∈ Z, s ∈ N) folgt
somit nach der Kettenregel:
[ √
][ 1 1 −1 ]
d √
f ′ (x) =
( s x)r = r( s x)r−1
xs
= qxq−1 .
dx
s
Wir beschließen den Paragraphen mit der Untersuchung einer Funktionenfolge
fn : I → Rd , n ∈ N. In § 5 (dort noch einmal als Satz 5.7 angegeben) werden wir
folgende Aussage beweisen:
Satz 1.5: Sei I = [a, b] und {fn }n eine Folge von Funktionen fn ∈ C 1 (I, Rd ) für
alle n ∈ N. Falls dann gilt
fn → f (n → ∞),
fn′ →
→ g (n → ∞)
auf I,
so folgt für den punktweisen Limes f ∈ C 1 (I, Rd ), und es gilt f ′ = g auf I.
Falls also {fn }n punktweise und die Ableitungen {fn′ }n gleichmäßig konvergieren
(auf einem kompakten Intervall), dann können wir Limesbildung und Differentiation
vertauschen (Vertauschung zweier Grenzprozesse! ):
)
)
(d
d(
fn (x) =
lim
lim fn (x)
auf I.
n→∞ dx
dx n→∞
Wir wenden Satz 1.5 nun auf Potenzreihen an:
∑
k
Satz 1.6: Es sei f (x) := ∞
k=0 ak x , ak ∈ C, eine Potenzreihe mit Konvergenzradius R ∈ (0, +∞) ∪ {+∞}. Dann gehört f : (−R, R) → C zur Klasse C 1 ((−R, R), C)
und es gilt
∞
∑
kak xk−1 , x ∈ (−R, R).
f ′ (x) =
k=1
Bemerkung: Die formal durch gliedweises Differenzieren der Reihe erhaltene Potenzreihe hat also den gleichen Konvergenzradius und stimmt mit der tatsächlichen
Ableitung der Reihe überein.
∑∞
k−1
Beweis von Satz 1.6: Wir zeigen, dass die formal differenzierte Reihe, also g(x) := ∑
, für
k=1 kak x
∞
jedes R0 ∈ (0, R) gleichmäßig auf [−R0 , R0 ] konvergiert: In der Tat majorisiert ja k=1 k|ak |R0k−1
die Reihe g(x) in [−R0 , R0 ] und nach dem Wurzelkriterium konvergiert letztere:
√
k
)
( √
k √
R0
k
k
|ak | =
< 1.
lim sup k|ak |R0k−1 = R0 · lim sup √
k
R
R0
k→∞
k→∞
106
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
→ g (n → ∞) auf [−R0 , R0 ], wobei
Satz 4.3 aus Kap. 2 liefert
gleichmäßige Konvergenz gn →
∑n also die
k−1
wir noch gn (x) :=
ka
x
für
die
n-te
Partialsumme
gesetzt
haben. Da natürlich fn →
k
k=1
f (n → ∞) auf [−R0 , R0 ] richtig ist (sogar gleichmäßig nach Satz 4.3 aus Kap. 2) und da fn′ = gn
für alle n ∈ N gilt, liefert Satz 1.5 nun f ∈ C 1 ([−R0 , R0 ], C) sowie
f ′ (x) = g(x) =
∞
∑
kak xk−1
auf [−R0 , R0 ].
k=1
Da schließlich R0 ∈ (0, R) beliebig war, folgt die Behauptung.
q.e.d.
∑
k
Folgerung 1.2: Die Reihe f (x) = ∞
k=0 ak x (ak ∈ C für k ∈ N0 ) konvergiere auf
(−R, R) für ein R ∈ (0, +∞) ∪ {+∞}. Dann folgt f ∈ C ∞ ((−R, R), C) und für die
n-te Ableitung gilt
f (n) (x) =
∞
∑
k(k − 1)(k − 2) . . . (k − n + 1)ak xk−n
auf (−R, R).
(1.11)
k=n
Beweis: Nach Satz 1.6 ist f ∈ C 1 ((−R, R), C) und f ′ ist wieder eine (auf R eingeschränkte) Potenzreihe mit Konvergenzradius R > 0. Wenden wir Satz 1.6 sukzessive auf f ′ , f ′′ , f ′′′ , . . . an, so folgt f ∈ C ∞ ((−R, R), C). Formel (1.11) beweist man
schließlich mit vollständiger Induktion.
q.e.d.
2
Lokale Extrema, Mittelwertsatz, Konvexität
Ein wichtiges Teilgebiet der Analysis ist die Behandlung von Extremwertaufgaben.
Hierfür grundlegend ist die
Definition 2.1: Es sei f : I → R auf dem Intervall I ⊂ R erklärt. Wir sagen, f
hat in x0 ∈ I ein lokales Minimum (bzw. lokales Maximum), wenn ein r > 0 so
existiert, dass gilt
f (x) ≥ f (x0 )
(bzw. f (x) ≤ f (x0 ))
für alle x ∈ I ∩ (x0 − r, x0 + r).
(2.1)
Gilt in (2.1) die strikte Ungleichung für x ̸= x0 , so hat f in x0 ein striktes lokales
Minimum (bzw. Maximum). Falls schließlich (2.1) für alle x ∈ I gilt, sprechen wir
von einem globalen Minimum (bzw. globalen Maximum).
Bemerkung: Zusammenfassend heißen lokale Minima und Maxima auch lokale Extrema und x0 wird lokale Minimal-, Maximal- oder Extremalstelle genannt (entsprechend im globalen Fall). Als Synonym für lokal“ wird auch relativ verwendet, statt
”
global“ sagen wir auch absolut.
”
Satz 2.1: (Fermat; notwendige Extremalbedingung 1. Ordnung)
Besitzt f : I → R in einem inneren Punkt x0 ∈ int I des Intervalls I ⊂ R ein lokales
Extremum und ist f in x0 differenzierbar, so folgt f ′ (x0 ) = 0.
2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT
107
Beweis: O.B.d.A. sei f in x0 minimal (sonst gehen wir zu −f über). Da x0 innerer
Punkt ist, gibt es ein ε > 0, so dass (x0 − ε, x0 + ε) ⊂ I gilt. Somit folgt
f (x) − f (x0 )
f (x) − f (x0 )
= f ′ (x0 ) = lim
≥ 0,
x→x0 −
x→x0 +
x − x0
x − x0
0 ≥ lim
also f ′ (x0 ) = 0.
q.e.d.
Bemerkungen:
1. Betrachte f (x) := x, I = [0, 1]. Dann ist x0 = 0 (sogar globales) Minimum,
aber es gilt f ′ (0) = 1. Also darf x0 in Satz 2.1 kein Randpunkt sein.
2. Die Bedingung f ′ (x0 ) = 0 ist nicht hinreichend für ein Extremum, wie etwa
das Beispiel f (x) := x3 , x ∈ (−1, 1), mit f ′ (0) = 0 zeigt.
Definition 2.2: Ist f : I → R im inneren Punkt x0 ∈ int I differenzierbar und gilt
f ′ (x0 ) = 0, so heißt x0 stationärer oder kritischer Punkt von f .
Bemerkung: Satz 2.1 besagt also: Jede innere lokale Extremalstelle von f ist stationär. Geometrisch bedeutet dies, dass die Tangente T = {(x, y) : y = f (x0 ) +
f ′ (x0 )(x − x0 )} an graph f im Punkt (x0 , f (x0 )) parallel zur x-Achse verläuft.
Satz 2.2: (Satz von Rolle)
Sei f : [a, b] → R stetig in [a, b] und differenzierbar in (a, b). Gilt zusätzlich f (a) =
f (b), so existiert ein ξ ∈ (a, b) mit der Eigenschaft f ′ (ξ) = 0.
Beweis: Falls f ≡ const gilt, folgt f ′ ≡ 0 auf [a, b]. Sei also f ̸≡ const auf [a, b].
Dann existiert ein x0 ∈ (a, b) mit f (x0 ) ̸= f (a), also o.B.d.A. f (x0 ) > f (a). Damit
folgt sup[a,b] f > f (a) = f (b). Nach dem Weierstraßschen Hauptlehrsatz, Satz 3.2
aus Kap. 2, nimmt also f ihr (globales) Maximum in einem inneren Punkt ξ ∈ (a, b)
an und nach Satz 2.1 gilt f ′ (ξ) = 0.
q.e.d.
Wir können nun den Satz von Rolle zum Beweis eines der meistgebrauchten
Sätze der Differential- und Intergalrechnung nutzen, nämlich von
Satz 2.3: (Mittelwertsatz)
Es sei f : [a, b] → R stetig in [a, b] und differenzierbar in (a, b). Dann gibt es ein
ξ ∈ (a, b), so dass gilt
f (b) − f (a) = f ′ (ξ)(b − a).
(2.2)
Bemerkung: Geometrisch heißt das, dass ein ξ ∈ (a, b) so existiert, dass die Tangente
an (ξ, f (ξ)) parallel zur Sekante durch (a, f (a)) und (b, f (b)) verläuft.
Satz 2.3 ergibt sich sofort als Spezialfall aus dem folgenden
108
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 2.4: (Allgemeiner Mittelwertsatz)
Gegeben seien zwei stetige Funktionen f, g : [a, b] → R, die differenzierbar auf (a, b)
seien. Weiter gelte g ′ ̸= 0 auf (a, b). Dann existiert ein ξ ∈ (a, b), so dass gilt
f (b) − f (a)
f ′ (ξ)
= ′ .
g(b) − g(a)
g (ξ)
Beweis: Nach dem Rolleschen Satz gilt g(a) ̸= g(b). Wir betrachten die Hilfsfunktion
φ(x) := f (x) −
f (b) − f (a)
[g(x) − g(a)],
g(b) − g(a)
x ∈ [a, b].
Offenbar ist φ stetig in [a, b], differenzierbar in (a, b) und es gilt φ(a) = φ(b) = f (a).
Wieder nach dem Rolleschen Satz existiert somit ein ξ ∈ (a, b) mit
0 = φ′ (ξ) = f ′ (ξ) −
f (b) − f (a) ′
g (ξ),
g(b) − g(a)
also nach Umstellen die Behauptung.
q.e.d.
Folgerung 2.1: (Monotonieverhalten)
Ist f ∈ C 0 ([a, b]) differenzierbar in (a, b), so haben wir:
(i) Gilt f ′ (x) > 0 (bzw. f ′ (x) ≥ 0, f ′ (x) < 0, f ′ (x) ≤ 0) auf (a, b), so ist f
streng monoton wachsend (bzw. monoton wachsend, streng monoton fallend,
monoton fallend) auf [a, b].
(ii) Ist umgekehrt f monoton wachsend (bzw. monoton fallend) auf [a, b], so gilt
f ′ (x) ≥ 0 (bzw. f ′ (x) ≤ 0) auf (a, b).
(iii) Es gilt f ′ (x) ≡ 0 in (a, b) genau dann, wenn f (x) ≡ const auf [a, b] richtig ist.
Bemerkung: Strenge Monotonie impliziert nicht f ′ (x) > 0 bzw. f ′ (x) < 0 auf (a, b).
Beispiel: f (x) = x3 , x ∈ (−1, 1).
Beweis von Folgerung 2.1:
(i) Wir betrachten nur den Fall f ′ (x) > 0 auf (a, b); die anderen Aussagen folgen
analog. Seien x1 , x2 ∈ [a, b] mit x1 < x2 gewählt. Nach Satz 2.3 existiert dann
ein ξ ∈ (x1 , x2 ) mit
f (x2 ) − f (x1 ) = f ′ (ξ)(x2 − x1 ) > 0,
also f (x1 ) < f (x2 ), wie behauptet.
2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT
109
(ii) Sei f monoton wachsend (bzw. fallend). Dann gilt für beliebiges x0 ∈ (a, b)
und hinreichend kleines h ̸= 0:
f (x0 + h) − f (x0 )
≥0
h
(bzw. ≤ 0).
Grenzübergang h → 0 liefert die Behauptung.
(iii) Ist f konstant, so verschwindet die Ableitung bekanntlich identisch. Ist umgekehrt f ′ (x) ≡ 0 auf (a, b), so ist f nach (i) sowohl monoton wachsend als auch
fallend auf [a, b] und somit konstant.
q.e.d.
Folgerung 2.2: Sei f ∈ C 0 ([a, b]) in (a, b) differenzierbar und x0 ∈ (a, b) sei kritischer Punkt von f . Dann gelten:
(i) Falls f ′ (x) < 0 (bzw. f ′ (x) > 0) in (a, x0 ) und f ′ (x) > 0 (bzw. f ′ (x) < 0) in
(x0 , b) richtig ist, so hat f in x0 ein striktes globales Minimum (bzw. Maximum).
(ii) Falls f ′ (x) < 0 oder f ′ (x) > 0 für alle x ∈ (a, b) \ {x0 } gilt, so ist x0 weder
Minimum noch Maximum von f .
Beweis: Folgerung 2.1 (i) entnehmen wir
<
f ′ (x) <
> 0 für a < x < x0 ⇒ f (x0 ) > f (x) für a ≤ x < x0 ,
>
f ′ (x) <
> 0 für x0 < x < b ⇒ f (x0 ) < f (x) für x0 < x ≤ b.
Das liefert unmittelbar die Behauptungen.
q.e.d.
Beispiel: Unter allen Rechtecken gegebenem Umfangs hat das Quadrat den größten Flächeninhalt.
Denn: Es ist F = ab der Flächeninhalt des Rechtecks mit Seitenlängen a, b > 0. Und U = 2(a + b)
ist der fixierte Umfang. Setzen wir b = U2 − a in F ein, so erhalten wir
(U
)
F = F (a) = a
−a ,
2
Wegen F ′ (a) =
′
− 4a) ist a0 =
1
(U
2
in (0, a0 ) und F (a) < 0 in
Maximum über [0,
U
2
(a0 , U2
U
4
[ U]
a ∈ 0,
.
2
einziger kritischer Punkt für F . Außerdem gilt F ′ (a) > 0
). Also hat F nach Folgerung 2.2 in a0 =
]. Schließlich beachten wir noch b0 :=
mit Seitenlänge a0 =
U
4
U
2
U
4
ihr striktes globales
−a0 = a0 , d.h. F wird für das Quadrat
maximal.
Satz 2.5: (Hinreichende Extremalbedingung)
Es sei f ∈ C 1 (I, R) (I ⊂ R Intervall) und in x0 ∈ int I sei f zweimal differenzierbar
mit
f ′ (x0 ) = 0 und f ′′ (x0 ) > 0 (bzw. f ′′ (x0 ) < 0).
Dann besitzt f in x0 ein striktes relatives Minimum (bzw. Maximum).
110
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Bemerkung: Die oben angegebene Bedingung ist nicht notwendig, wie das Beispiel
f (x) = x4 , x ∈ R, mit dem strikten Minimum x0 = 0 zeigt.
′
′
(x0 )
Beweis von Satz 2.5: Es gelte f ′′ (x0 ) = limx→x0 f (x)−f
> 0 (der Fall f ′′ (x0 ) < 0
x−x0
ergibt sich nach Übergang zu −f ). Dann existiert ein ε > 0, so dass [x0 −ε, x0 +ε] ⊂ I
und
f ′ (x) − f ′ (x0 )
> 0 für alle x ∈ (x0 − ε, x0 + ε) \ {x0 }
x − x0
erfüllt ist. Wegen f ′ (x0 ) = 0 bedeutet dies
f ′ (x) < 0 für alle x ∈ (x0 − ε, x0 ),
f ′ (x) > 0 für alle x ∈ (x0 , x0 + ε).
Nach Folgerung 2.2 hat f in x0 ein striktes Minimum auf [x0 − ε, x0 + ε], also ein
striktes lokales Minimum.
q.e.d.
Folgerung 2.3: (Notwendige Extremalbedingung 2. Ordnung)
Sei f ∈ C 1 (I, R) auf dem Intervall I ⊂ R gegeben und sei x0 ∈ Int I eine relative
Minimalstelle (bzw. Maximalstelle) von f . Dann gilt f ′′ (x0 ) ≥ 0 (bzw. f ′′ (x0 ) ≤ 0).
Beweis: Ist x0 relative Minimalstelle und gölte f ′′ (x0 ) < 0, so wäre x0 nach Satz 2.5
auch strikte relative Maximalstelle, Widerspruch! Also muss doch f ′′ (x0 ) ≥ 0 gelten.
Entsprechend folgt die Aussage für Maximalstellen.
q.e.d.
Wir wollen noch eine Folgerung des allgemeinen Mittelwertsatzes angeben, die
sehr hilfreich bei der Berechnung von Grenzwerten ist:
Satz 2.6: (L’Hospitalsche Regel)
Es seien f, g : I → R zwei differenzierbare Funktionen auf dem Intervall I = (a, b).
Es gelte g ′ ̸= 0 auf I, und es existiere der Limes
f ′ (x)
=: c ∈ R.
x→a+ g ′ (x)
lim
Dann folgt:
(i) Falls limx→a+ f (x) = limx→a+ g(x) = 0 gilt, so ist g ̸= 0 auf I richtig und es
gilt
f (x)
lim
= c.
x→a+ g(x)
(ii) Falls limx→a+ f (x) = ±∞, limx→a+ g(x) = ±∞ gilt, so existiert ein x0 ∈ (a, b)
mit g ̸= 0 für x ∈ (a, x0 ] und es gilt
lim
x→a+
f (x)
= c.
g(x)
2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT
111
Analoge Aussagen haben wir für den Grenzwert x → b−.
Beweis:
(i) Zunächst können wir f und g stetig (zu 0) in den Punkt x = a fortsetzen. Der Satz von Rolle
liefert dann g ̸= 0 auf (a, b), und nach dem allgemeinen Mittelwertsatz gibt es zu jedem
hinreichend kleinen h > 0 ein ϑ = ϑ(h) ∈ (0, 1) mit der Eigenschaft
f (a + h) − f (a)
f ′ (a + ϑh)
f (a + h)
=
= ′
.
g(a + h)
g(a + h) − g(a)
g (a + ϑh)
Für h → 0+ (und somit a+ϑh → a+) erhalten wir die Existenz des Grenzwertes limx→a+
und die Relation
f (a + h)
f ′ (a + ϑh)
f (x)
lim
= lim
= lim ′
= c,
x→a+ g(x)
h→0+ g(a + h)
h→0+ g (a + ϑh)
f (x)
g(x)
wie behauptet.
(ii) Wir fixieren zunächst x1 ∈ (a, x0 ] beliebig. Zu beliebigem x ∈ (a, x1 ) existiert dann nach
dem allgemeinen Mittelwertsatz ein ξ ∈ (x, x1 ) mit
f ′ (ξ)
f (x) − f (x1 )
f (x)
=
=
m(x),
g ′ (ξ)
g(x) − g(x1 )
g(x)
wobei wir
m(x) :=
1−
1−
f (x1 )
f (x)
g(x1 )
g(x)
,
(2.3)
x ∈ (a, x1 ),
gesetzt haben. Für festgehaltenes x1 sehen wir m(x) → 1 und damit auch
x → a+.
Wir wählen nun zu vorgegebenem ε > 0 zunächst x1 so nahe an a, dass gilt
′
f (t)
− c < ε für alle t ∈ (a, x1 ),
′
g (t)
1
m(x)
→ 1 für
(2.4)
also insbesondere für t = ξ ∈ (x, x1 ). Dann wählen wir δ > 0 so klein, dass gilt a + δ ≤ x1
und
1
− 1 < ε für alle x ∈ (a, a + δ).
(2.5)
m(x)
Damit erhalten wir
′
(2.3)
1 f ′ (ξ)
f (x)
1 f (ξ)
1
− c
=
−
c
≤
−
c
+
−
1
|c|
g(x)
m(x) g ′ (ξ)
m(x) g ′ (ξ)
m(x)
(2.4),(2.5)
<
also
(x)
limx→a+ fg(x)
ε(1 + ε + |c|)
für alle x ∈ (a, a + δ),
= c, wie behauptet.
q.e.d.
Bemerkung: Satz 2.6 lässt sich noch erweitern: Einerseits gilt die entsprechende Aussage auch für c = ±∞, andererseits auch für a = −∞ bzw. b = +∞ (Übungsaufgabe).
Definition 2.3: Eine Funktion f : I → R, I ⊂ R Intervall, heißt konvex, wenn für
alle x1 , x2 ∈ I und alle λ ∈ (0, 1) gilt
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ).
(2.6)
Die Funktion f heißt konkav, wenn −f konvex ist. Gilt schließlich in (2.6) die strikte
Ungleichung für x1 ̸= x2 , so heißt f streng konvex; gilt dies für −f , so nennen wir
f streng konkav.
112
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 2.7: Sei I ⊂ R ein Intervall und f : I → R ∈ C 2 (I). Dann ist f genau dann
konvex, wenn f ′′ (x) ≥ 0 für alle x ∈ I gilt.
Bemerkung: Es folgt sofort: f ∈ C 2 (I) ist genau dann konkav, wenn f ′′ (x) ≤ 0 auf
I gilt. Eine Verschärfung f ∈ C 2 (I) streng konvex ⇔ f ′′ > 0“ von Satz 2.7 gilt
”
übrigens nicht, wie das Beispiel f (x) = x4 , x ∈ R, zeigt; siehe aber Folgerung 2.4
unten.
Beweis von Satz 2.7:
•
⇐“: Sei zunächst f ′′ (x) ≥ 0 in I erfüllt. Nach Folgerung 2.1 ist dann f ′ : I → R monoton
”
wachsend. Seien x1 , x2 ∈ I und λ ∈ (0, 1) gewählt, so können wir o.B.d.A. x1 < x2 annehmen
und setzen x := λx1 + (1 − λ)x2 ∈ (x1 , x2 ). Nach dem Mittelwertsatz finden wir ξ1 ∈ (x1 , x)
und ξ2 ∈ (x, x2 ) mit
f (x2 ) − f (x)
f (x) − f (x1 )
= f ′ (ξ1 ) ≤ f ′ (ξ2 ) =
.
x − x1
x2 − x
Beachten wir noch x − x1 = (1 − λ)(x2 − x1 ) und x2 − x = λ(x2 − x1 ), so folgt
f (x) − f (x1 )
f (x2 ) − f (x)
≤
1−λ
λ
und nach Umstellen schließlich (2.6), d.h. f ist konvex.
•
⇒“: Sei nun f : I → R konvex und wir nehmen an, dass nicht f ′′ (x) ≥ 0 auf I gilt. Dann
”
existiert ein x0 ∈ int I mit f ′′ (x0 ) < 0. Wir erklären nun die Hilfsfunktion
φ(x) := f (x) − f ′ (x0 )(x − x0 ),
x ∈ I.
Offenbar gilt φ ∈ C 2 (I) und φ′ (x0 ) = 0, φ′′ (x0 ) = f ′′ (x0 ) < 0. Nach Satz 2.5 besitzt
also φ in x0 ein striktes lokales Maximum, und insbesondere finden wir ein h > 0, so dass
[x0 − h, x0 + h] ⊂ I sowie
φ(x0 − h) < φ(x0 ),
φ(x0 + h) < φ(x0 )
erfüllt sind. Hieraus erhalten wir
f (x0 ) = φ(x0 ) >
)
)
1(
1(
φ(x0 − h) + φ(x0 + h) =
f (x0 − h) + f (x0 + h) .
2
2
(2.7)
Setzen wir schließlich x1 := x0 −h, x2 := x0 +h und λ = 12 , so haben wir x0 = λx1 +(1−λ)x2
und (2.7) besagt
f (λx1 + (1 − λ)x2 ) > λf (x1 ) + (1 − λ)f (x2 ),
was ein Widerspruch zur vorausgesetzten Konvexität von f ist. Also gilt doch f ′′ (x) ≥ 0 auf
I.
q.e.d.
Der Beweis der Richtung ⇐“ in Satz 2.7 lässt sich offenbar so modifizieren, dass
”
man das nachstehende Ergebnis erhält:
Folgerung 2.4: Gilt f ∈ C 2 (I, R) und f ′′ (x) > 0 (bzw. < 0) auf dem Intervall
I ⊂ R, so ist f streng konvex (bzw. streng konkav) auf I.
3. DIE ELEMENTAREN FUNKTIONEN
3
113
Die elementaren Funktionen
In Kap. 2, Folgerung 4.2 haben wir die komplexe Exponentialfunktion oder kurz eFunktion
∞
∑
zk
ez = exp z :=
, z ∈ C,
k!
k=0
erklärt und als stetig auf ganz C erkannt. In diesem Paragraphen werden wir Eigenschaften von ez untersuchen und weitere sogenannte elementare Funktionen“ aus
”
ihr erklären.
Satz 3.1: (Funktionalgleichung der e-Funktion)
Für beliebige z1 , z2 ∈ C gilt die Identität
exp(z1 + z2 ) = exp z1 · exp z2 .
Beweis: Da die Exponentialreihe für beliebige z ∈ C absolut konvergiert, liefern die
Cauchysche Produktformel und der Binomische Satz:
exp z1 · exp z2
)( ∑
)
)
∞
∞ (∑
k
∑
z1k
z2k
z1l z2k−l
=
=
k!
k!
l! (k − l)!
k=0
k=0
k=0
l=0
)
( k ( )
∞
∞
∑
∑
1 ∑ k l k−l
(z1 + z2 )k
z1 z2
=
=
= exp(z1 + z2 ),
l
k!
k!
(∑
∞
k=0
l=0
k=0
wie behauptet.
q.e.d.
Definition 3.1: Die Zahl
e := exp 1 =
∞
∑
1
∈R
k!
k=0
wird Eulersche Zahl genannt.
Bemerkung: Mit der Funktionalgleichung zeigt man leicht
(p)
p
e q = exp
für alle p ∈ Z, q ∈ N.
q
(3.1)
Dies erklärt auch die Schreibweise der Exponentialfunktion als Potenz.
Wir konzentrieren uns nun auf die Einschränkungen von exp z auf die reelle
bzw. imaginäre Achse:
114
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Satz 3.2: Die reelle Exponentialfunktion ex = exp x :=
zur Klasse C ∞ (R) und es gilt
exp′ x =
d
exp x = exp x,
dx
∑∞
xk
k=0 k! ,
x ∈ R, gehört
x ∈ R.
(3.2)
Beweis: Gemäß Kap. 1, § 8 ist die Exponentialreihe für alle x ∈ R konvergent. Nach
Folgerung 1.2 gilt also exp ∈ C ∞ (R) und wir haben
(1.6)
exp′ x =
∞
∞
∞
∑
∑
∑
1
1
xl
k xk−1 =
xk−1 =
= exp x,
k!
(k − 1)!
l!
k=1
k=1
l=0
wie behauptet.
q.e.d.
Satz 3.3: Die reelle Exponentialfunktion ex = exp x, x ∈ R, bildet R auf (0, +∞)
ab, ist streng monoton wachsend, streng konvex und erfüllt
lim exp x = 0,
x→−∞
exp 0 = 1,
lim exp x = +∞.
x→+∞
(3.3)
Beweis: Offensichtlich ist f (x) := ex , x ∈ R, reellwertig, da die definierende Reihe nur reelle Koeffizienten besitzt. Insbesondere gilt e0 = 1. Ferner haben wir
exp x = 1 +
∞
∑
xk
>0
k!
für alle x ∈ [0, +∞)
k=1
und nach Satz 3.1 auch
exp x =
1
>0
exp(−x)
für alle x ∈ (−∞, 0),
also insgesamt f (R) ⊂ (0, +∞). Zum Beweis von (3.3) beachten wir
lim exp x ≥ lim (1 + x) = +∞
x→+∞
und
lim exp x = lim
x→−∞
x→−∞
x→+∞
1
exp(−x)
ξ:=−x
=
lim
ξ→+∞
1
= 0.
exp ξ
Ist nun y ∈ (0, +∞) beliebig, so existieren also x1 < 0, x2 > 0 mit ex1 < y < ex2 . Nach dem
Zwischenwertsatz, Satz 2.7 aus Kap. 2, existiert ein x ∈ (x1 , x2 ) mit f (x) = y, d.h. y ∈ f (R) und
insgesamt f (R) = (0, +∞).
Schließlich gilt nach Satz 3.2: exp′ x = exp x > 0 für alle x ∈ R, also ist exp x nach Folgerung 2.1
streng monoton wachsend. Und wiederum Satz 3.2 in Verbindung mit Folgerung 2.4 liefert die strenge
Konvexität wegen exp′′ x = exp′ x = exp x > 0.
q.e.d.
Definition 3.2: Die Umkehrfunktion von exp : R → R nennen wir (natürliche)
Logarithmusfunktion log : (0, +∞) → R. Für x > 0 heißt y = log x Logarithmus
von x.
3. DIE ELEMENTAREN FUNKTIONEN
115
Satz 3.4: Die Funktion log : (0, +∞) → R ist streng monoton, streng konkav,
beliebig oft differenzierbar und wir haben
log′ x =
d
1
log x =
dx
x
für alle x > 0.
(3.4)
Ferner gelten die Funktionalgleichung
log(x1 x2 ) = log x1 + log x2
für alle x1 , x2 > 0
(3.5)
sowie
lim log x = −∞,
x→0+
log 1 = 0,
log e = 1,
lim log x = +∞.
x→+∞
(3.6)
Beweis: Zunächst gehört log x nach Satz 1.4 als Umkehrfunktion von x = exp y zur
Klasse C 1 ((0, +∞), R) und es gilt
log′ x =
1
1
1
=
=
exp′ (log x)
exp(log x)
x
für x > 0.
Wegen x1 ∈ C ∞ ((0, +∞), R) ist nun auch log x ∈ C ∞ ((0, +∞), R) richtig. Außerdem
ist log x offenbar streng monoton wachsend, und (3.4) liefert log′′ x = − x12 < 0 für
alle x ∈ (0, +∞), d.h. nach Folgerung 2.4 ist log x streng konkav.
Zum Beweis von (3.5) seien x1 , x2 > 0 beliebig gewählt. Wir erhalten dann aus
Satz 3.1
exp(log x1 + log x2 ) = exp(log x1 ) · exp(log x2 ) = x1 x2 .
Nehmen wir auf beiden Seiten den Logarithmus, so folgt die Behauptung (3.5).
Schließlich ist natürlich log 1 = log(e0 ) = 0 und log e = log(e1 ) = 1 richtig. Und
die Grenzwerte in (3.6) ergeben sich direkt aus der Monotonie und der Relation
log((0, +∞)) = R. Damit ist alles gezeigt.
q.e.d.
Definition 3.3: Für beliebiges α ∈ R erklären wir die (allgemeine) Potenzfunktion
x 7→ xα , x ∈ (0, +∞), durch die Formel
xα := eα log x = exp(α log x).
Satz 3.5: Die allgemeine Potenzfunktion f (x) := xα erfüllt f ∈ C ∞ ((0, +∞), R)
und es gelten die Relationen
xα y α = (xy)α ,
xα xβ = xα+β ,
α
log(x ) = α log x,
d α
(x ) = αxα−1
dx
für alle x, y > 0 und beliebige α, β ∈ R.
(xα )β = xαβ ,
(3.7)
(3.8)
(3.9)
116
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis: Nach Ketten- und Produktregel ist f ∈ C ∞ ((0, +∞), R) als Komposition zweier C ∞ Funktionen. Die Relationen (3.7) ergeben sich leicht unter Benutzung der Funktionalgleichungen
für Exponential- und Logarithmusfunktion; z.B. berechnen wir
xα y α = eα log x eα log y = eα(log x+log y) = eα log(xy) = (xy)α .
Formel (3.8) folgt sofort aus der Definition der Potenzfunktion durch Logarithmieren. Schließlich
entnehmen wir der Kettenregel
d α
d α log x
d
1 (3.7)
(x ) =
(e
) = eα log x ·
(α log x) = xα α
= αxα−1 ,
dx
dx
dx
x
wie behauptet.
q.e.d.
Bemerkung: Wir können auch die allgemeine Exponentialfunktion x 7→ cx = ex log c
für festes c > 0 betrachten. Es gilt f (x) := cx ∈ C ∞ (R, R) und
f ′ (x) = cx · log c,
x ∈ R.
Für c > 1 ist also f ′ > 0 und f : R → (0, +∞) bijektiv. Die zugehörige Umkehrfunktion heißt Logarithmus zur Basis c > 1 und wird mit logc : (0, +∞) → R bezeichnet.
Der Logarithmus zur Basis e > 1 ist der natürliche Logarithmus (→ Übungen).
Definition 3.4: Wir erklären die Cosinusfunktion cos : R → R und die Sinusfunktion sin : R → R gemäß
1
cos x := (eix + e−ix ) = Re (eix ),
2
1
sin x := (eix − e−ix ) = Im (eix ),
2i
x ∈ R.
Satz 3.6: Die Funktionen cos und sin gehören zur Klasse C ∞ (R, R) mit den Ableitungen
d
cos′ x =
cos x = − sin x,
dx
(3.10)
d
′
sin x =
sin x = cos x, x ∈ R.
dx
Es gilt die Eulersche Formel
eix = cos x + i sin x,
x ∈ R,
(3.11)
und die Additionstheoreme
cos(x1 + x2 ) = cos x1 cos x2 − sin x1 sin x2 ,
sin(x1 + x2 ) = cos x1 sin x2 + sin x1 cos x2 ,
x1 , x2 ∈ R.
(3.12)
Die Cosinusfunktion ist gerade, die Sinusfunktion ist ungerade, d.h.
cos(−x) = cos x,
sin(−x) = − sin x,
x ∈ R.
(3.13)
3. DIE ELEMENTAREN FUNKTIONEN
117
Schließlich haben wir die Potenzreihendarstellungen
cos x =
∞
∑
(−1)l
l=0
(2l)!
x2l ,
sin x =
∞
∑
(−1)l
x2l+1 ,
(2l + 1)!
x ∈ R,
(3.14)
l=0
wobei beide Reihen absolut konvergieren.
Beweis: cos, sin ∈ C ∞ (R, R) ist per Definition klar, da exp(±ix) ∈ C ∞ (R, C) gilt
d
gemäß Satz 1.6. Mit dx
(e±ix ) = ±ie±ix berechnen wir
1
1
cos′ x = (ieix − ie−ix ) = − (eix − e−ix ) = − sin x,
2
2i
1 ix
1 ix
′
ix
sin x = (ie + ie ) = (e + e−ix ) = cos x,
2i
2
also (3.10).
Die Eulersche Formel (3.11) ist direkte Konsequenz der Definition von cos und sin. Und die Funktionalgleichung der Exponentialfunktion liefert in Verbindung mit der Eulerschen Formel:
cos(x1 + x2 ) + i sin(x1 + x2 ) = ei(x1 +x2 ) = eix1 eix2
= (cos x1 + i sin x1 )(cos x2 + i sin x2 )
= (cos x1 cos x2 − sin x1 sin x2 ) + i(cos x1 sin x2 + sin x1 cos x2 ).
Real- und Imaginärteil dieser Gleichung entsprechen gerade den Formeln (3.12). Formel (3.13)
entnimmt man wieder direkt der Definition von cos und sin. Zum Beweis von (3.14) berechnen wir
schließlich
cos x + i sin x
=
eix =
∞
∑
1 k k
i x =
k!
k=0
=
∞
∑
l=0
=
1 2l 2l
i x +
(2l)!
∑
k
∞
∑
l=0
gerade
∑
1 k k
i x +
k!
k
ungerade
1 k k
i x
k!
1
i2l+1 x2l+1
(2l + 1)!
∞
∞
∑
∑
(−1)l 2l
(−1)l
x +i
x2l+1 .
(2l)!
(2l + 1)!
l=0
l=0
Vergleich von Real-und Imaginärteil dieser Identität liefert (3.14). Damit ist alles gezeigt.
q.e.d.
Bemerkung: Wegen eix = e−ix gilt |eix |2 = eix e−ix = 1 für alle x ∈ R. Der Eulerschen
Formel entnehmen wir daher die berühmte Relation
1 = cos2 x + sin2 x
für alle x ∈ R.
Geometrisch stellt f (x) := eix , x ∈ R, eine gleichförmige Bewegung mit Geschwindigkeit 1 auf der Einheitskreislinie dar, denn es gilt
|f (x)| ≡ 1,
|f ′ (x)| = |ieix | ≡ 1.
118
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Cosinus- und Sinusfunktion sind nach Definition die Projektionen dieser Kreisbewegung auf die reelle bzw. imaginäre Achse, weshalb man sie auch als Kreisfunktionen
bezeichnet.
Wir wollen nun die Nullstellen der Kreisfunktionen untersuchen und beginnen
mit dem
Satz 3.7: Die Gleichung cos x = 0 besitzt im Intervall [0, 2] genau eine Lösung.
Diese kleinste positive Nullstelle von cos bezeichnen wir mit π2 . Es gilt dann
cos x > 0
[ π)
für alle x ∈ 0,
,
2
cos
π
= 0.
2
Beweis: Zunächst gilt per Definition cos 0 = Re (e0 ) = 1. Und aus der Reihendarstellung von cos
ermitteln wir
cos x
=
=
x2
x4
x6
x8
x10
x12
+
−
+
−
+
− +...
2!
4!
6!
8!
10!
12!
)
(
)
(
x4
x6
x2
x10 (
x2 )
x2
+
−
1−
−
1−
− ...
1−
2!
4!
6!
7·8
10!
11 · 12
1−
Für x = 2 erhalten wir also
cos 2 = −
1
26 (
4 ) 210 (
4 )
1
−
1−
−
1−
− ... < − .
3
6!
7·8
10!
11 · 12
3
Nach dem Zwischenwertsatz, Satz 2.5 aus Kap. 2, existiert also ein ξ ∈ (0, 2) mit cos ξ = 0. Weiter
entnehmen wir der Reihendarstellung von sin:
cos′ x
=
=
x3
x5
x7
x9
x11
−
+
−
+
− +...
3!
5!
7!
9!
11!
(
2 )
5(
2 )
9(
x
x
x
x
x2 )
−x 1 −
−
1−
−
1−
− ... < 0
2·3
5!
6·7
9!
10 · 11
− sin x = −x +
für x ∈ (0, 2). Nach Folgerung 2.1 ist also cos in [0, 2] streng monoton fallend und somit injektiv.
Insbesondere ist die Nullstelle ξ =: π2 eindeutig bestimmt und der Satz damit bewiesen.
q.e.d.
Folgerung 3.1: Die Sinusfunktion ist im Intervall [− π2 , π2 ] streng monoton wachsend und es gilt
( π)
π
sin −
= −1, sin 0 = 0, sin = 1.
2
2
Die Cosinusfunktion ist im Intervall [0, π] streng monoton fallend und es gilt
cos 0 = 1,
cos
π
= 0,
2
cos π = −1.
Beweis: Da cos gerade ist, gilt nach Satz 3.7: sin′ x = cos x > 0 in (− π2 , π2 ), d.h. sin ist in [− π2 , π2 ]
streng monoton wachsend nach Folgerung 2.1. Ferner gilt sin 0 = Im (e0 ) = 0 und
( π)
( π)
( π)
+ sin2 ±
= sin2 ±
,
1 = cos2 ±
2
2
2
3. DIE ELEMENTAREN FUNKTIONEN
119
also wegen der Monotonie sin(− π2 ) = −1, sin π2 = 1. Schließlich erhalten wir die Aussagen über den
Cosinus aus den Regeln der Phasenverschiebung
(π
)
(π
)
cos
− x = sin x, sin
− x = cos x, x ∈ R,
(3.15)
2
2
die man nun sofort aus den Additionstheoremen gewinnt.
q.e.d.
Satz 3.8: Die Funktionen cos und sin sind 2π-periodisch, d.h. es gilt
cos(x + 2π) = cos x,
für alle x ∈ R.
sin(x + 2π) = sin x
(3.16)
Ferner haben wir
cos(x + π) = − cos x,
sin(x + π) = − sin x
für alle x ∈ R.
Schließlich gilt für die Nullstellenmengen der Funktionen
}
{π
+ kπ : k ∈ Z ,
{x ∈ R : cos x = 0} =
2
{x ∈ R : sin x = 0} = {kπ : k ∈ Z}.
π
Beweis: Wir bemerken zunächst ei 2 = cos
iπ
2
eiπ = (e
π
2
+ i sin
)2 = i2 = −1,
π
2
(3.17)
(3.18)
= i nach Folgerung 3.1. Damit folgt
e2iπ = (eiπ )2 = (−1)2 = 1,
also
cos π = −1,
sin π = 0;
cos(2π) = 1,
sin(2π) = 0.
Die Aussagen (3.16) und (3.17) folgen nun wieder unmittelbar aus den Additionstheoremen (3.12).
Ferner wissen wir bereits cos x > 0 für alle x ∈ (− π2 , π2 ) und cos π2 = 0. Also folgt die Aussage
(3.18) für den Cosinus aus Formel (3.17). Die Nullstellenmenge des Sinus lässt sich daraus m.H. der
Phasenverschiebung (3.15) ablesen.
q.e.d.
Folgerung 3.2: Alle Lösungen der Gleichung eix = 1 haben die Form x = 2kπ mit
einem k ∈ Z.
Beweis: Wir beachten
x)
x
1 ( ix
e−i 2 ix
sin =
e 2 − e−i 2 =
(e − 1).
2
2i
2i
x
Also gilt eix = 1 ⇔ sin x2 = 0. Die Behauptung ergibt sich nun aus (3.18).
q.e.d.
Satz 3.9: (Polarkoordinaten)
Jede komplexe Zahl z ∈ C besitzt eine Darstellung
z = reiφ = r(cos φ + i sin φ)
(3.19)
mit einem φ ∈ R und r = |z|. Für z ̸= 0 ist die Darstellung (3.19) eindeutig, wenn
wir φ ∈ [0, 2π) fordern.
120
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis:
1. Für z = 0 ist r = |z| = 0 und (3.19) gilt mit beliebigem φ ∈ R. Sei also
z = x + iy ̸= 0. Dann folgt r := |z| > 0 und ξ := xr , η := yr sind wohldefiniert.
Es gilt dann
z = r(ξ + iη), ξ 2 + η 2 = 1.
(3.20)
Insbesondere ist ξ ∈ [−1, 1] = [cos π, cos 0] erfüllt. Nach dem Zwischenwertsatz
existiert also ein α ∈ [0, π] mit cos α = ξ. Hieraus folgt noch
√
√
η = ± 1 − ξ 2 = ± 1 − cos2 α = ± sin α.
Man beachte sin α ≥ 0 wegen (3.18) und sin π2 = 1.
• 1. Fall: Für y ≥ 0 ist η ≥ 0, also η = sin α. Dann wählen wir φ :=
α ∈ [0, π] und erhalten ξ = cos φ, η = sin φ, also aus (3.20) die gesuchte
Darstellung (3.19).
• 2. Fall: Für y < 0 folgt α ∈ (0, π) und η = − sin α. Mit φ := 2π − α ∈
(π, 2π) erhalten wir dann aus den Symmetrieeigenschaften (3.13) und der
Periodizität (3.16):
ξ = cos α = cos(2π − φ) = cos φ,
η = − sin α = − sin(2π − φ) = sin φ,
also wieder (3.19).
2. Man beachte, dass der in Teil 1 des Beweises erklärte Winkel φ in [0, 2π) liegt.
Gäbe es ein weiteres ψ ∈ [0, 2π) mit z = reiψ , so folgte eiφ = eiψ bzw. ei(φ−ψ) =
1. Folgerung 3.2 liefert also φ − ψ = 2kπ. Aus |φ − ψ| < 2π folgt nun k = 0
bzw. φ = ψ, wie behauptet.
q.e.d.
Bemerkungen:
1. φ ∈ [0, 2π) misst den Winkel zwischen der positiven reellen Achse und dem
Vektor z = (x, y), gemessen in mathematisch positivem Sinn. Er wird Argument von z genannt und mit φ = arg z bezeichnet. Seine Berechnung gelingt
mit Hilfe der Arcus-Funktionen; siehe Bemerkung 1 im Anschluss an Satz 3.11
unten.
2. Auch mit der Forderung φ ∈ [φ0 , φ0 + 2π) für beliebiges φ0 ∈ R ist φ eindeutig
festgelegt; vergleiche Teil 2 des obigen Beweises. Aufgrund der Periodizität von
cos und sin folgt dann φ = arg z + 2kπ mit einem (eindeutigen) k ∈ Z. φ misst
also wieder den Winkel zur positiven x-Achse, wobei nun zusätzlich k-mal um
den Ursprung gelaufen wird. Analog führt auch die Forderung φ ∈ (φ0 , φ0 +2π]
zu einer eindeutigen Festlegung von φ.
3. DIE ELEMENTAREN FUNKTIONEN
121
3. Die Polarkoordinatendarstellung erlaubt uns eine einfache Interpretation der
komplexen Multiplikation: Sind nämlich z1 = |z1 |eiφ1 und z2 = |z2 |eiφ2 mit
φ1 , φ2 ∈ [0, 2π) gegeben, so folgt aus der Funktionalgleichung der Exponentialfunktion:
z1 · z2 = |z1 | |z2 | ei(φ1 +φ2 ) .
Bei der Multiplikation werden also die Beträge multipliziert und die Argumente
(= Winkel) addiert.
Definition 3.5: Wir erklären die Funktionen
sin x
,
cos x
cos x
cot x :=
,
sin x
tan x :=
x ̸=
π
+ kπ, k ∈ Z
2
x ̸= kπ, k ∈ Z
( Tangens),
( Cotangens).
Satz 3.10: Tangens und Cotangens sind in ihren Definitionsgebieten beliebig oft
differenzierbar und es gelten
d
1
π
tan x = 1 + tan2 x =
, x ̸= + kπ, k ∈ Z,
dx
cos2 x
2
d
1
cot′ x =
cot x = −(1 + cot2 x) = − 2 , x ̸= kπ, k ∈ Z.
dx
sin x
tan′ x =
(3.21)
Ferner haben wir
tan(x + π) = tan x,
und
tan
(π
)
− x = cot x,
2
sowie die Additionstheoreme
cot(x + π) = cot x
cot
tan(x1 + x2 ) =
tan x1 + tan x2
,
1 − tan x1 tan x2
cot(x1 + x2 ) =
−1 + cot x1 cot x2
,
cot x1 + cot x2
(π
2
)
− x = tan x
x1 , x2 , x1 + x2 ̸=
π
+ kπ, k ∈ Z,
2
x1 , x2 , x1 + x2 ̸= kπ, k ∈ Z.
Schließlich ist tan in (− π2 , π2 ) streng monoton wachsend mit
lim
x→− π2 +
tan x = −∞,
tan 0 = 0,
Und cot ist in (0, π) streng monoton fallend mit
(π )
lim cot x = +∞, cot
= 0,
x→0+
2
lim tan x = +∞.
x→ π2 −
lim cot x = −∞.
x→π−
122
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis: Direkt aus den Aussagen über die Cosinus-und Sinusfunktion.
q.e.d.
Aufgrund des Monotonieverhaltens von sin, cos, tan und cot können wir nun
auch die entsprechenden Umkehrfunktionen erklären, wenn wir uns auf geeignete
Monotonieintervalle beschränken: Wir wählen die Bereiche
π
π
y = sin x, − ≤ x ≤
⇒ −1 ≤ y ≤ 1,
2
2
y = cos x,
0 ≤ x ≤ π ⇒ −1 ≤ y ≤ 1,
y = tan x, −
y = cot x,
π
π
<x<
⇒ −∞ < y < +∞,
2
2
0 < x < π ⇒ −∞ < y < +∞.
Die zugehörigen Umkehrfunktionen heißen Arcus Sinus, Arcus Cosinus, Arcus Tangens bzw. Arcus Cotangens und werden mit
arcsin := sin−1 : [−1, 1] → R,
arccos := cos−1 : [−1, 1] → R,
arctan := tan−1 : R → R,
arccot := cot−1 : R → R
bezeichnet.
Satz 3.11: Es gelten arcsin, arccos ∈ C ∞ ((−1, 1)) und arctan, arccot ∈ C ∞ (R) und
wir haben
arcsin′ y = √
1
1−
1
′
arctan y =
,
1 + y2
y2
, arccos′ y = − √
1
, y ∈ (−1, 1),
1 − y2
1
arccot′ y = −
, y ∈ R.
1 + y2
(3.22)
Ferner gelten die Relationen
π
2
π
arctan y + arccoty =
2
arcsin y + arccos y =
für alle y ∈ [−1, 1],
für alle y ∈ R.
(3.23)
Beweis: Da die ersten Ableitungen von sin, tan auf (− π2 , π2 ) und von cos, cot auf (0, π) nicht verschwinden, sind die Umkehrfunktionen in den angegebenen Bereichen einmal differenzierbar nach
Satz 1.4 und es gelten
1
1
1
= √
= √
, |y| < 1,
sin′ (arcsin y)
1 − y2
1 − sin2 (arcsin y)
1
1
1
arctan′ y =
=
=
, y ∈ R.
tan′ (arctan y)
1 + tan2 (arctan y)
1 + y2
arcsin′ y =
Entsprechend erhalten wir die ersten Ableitungen für arccos und arccot. Da die Funktionen √
1
1−y 2
,
y ∈ (−1, 1), und
y ∈ R, beliebig oft differenzierbar sind, folgen die behaupteten Regularitätseigenschaften der Arcusfunktionen.
1
,
1+y 2
3. DIE ELEMENTAREN FUNKTIONEN
123
Zum Beweis der ersten Relation in (3.23) wenden wir arccos auf die Relation y = sin x =
cos( π2 − x), x ∈ [− π2 , π2 ], an:
arccos y =
π
π
− x = − arcsin y,
2
2
y ∈ [−1, 1].
Entsprechend wenden wir arccot auf y = tan x = cot( π2 − x), x ∈ R, an und erhalten die zweite
Relation in (3.23).
q.e.d.
Bemerkungen:
1. Die Konstruktion im Beweis von Satz 3.9 und die
zeigen, dass sich das Argument arg z einer Zahl
bestimmen lässt:
(x)


,
falls y
 arccos
|z|
(x)
arg z =

 2π − arccos
, falls y
|z|
obige Definition von arccos
z = x + iy ̸= 0 wie folgt
≥0
∈ [0, 2π).
<0
2. Ausgehend von der komplexen Exponentialfunktion können wir auch die komplexe Cosinus- bzw. Sinusfunktion erklären:
1
cos z := (eiz + e−iz ),
2
sin z :=
1 iz
(e − e−iz ),
2i
z ∈ C.
Für z = x ∈ R erhalten wir dann die reellen Kreisfunktionen. Für z = −ix,
x ∈ R, erhalten wir die (reellen) Hyperbelfunktionen
1
cosh x := cos(−ix) = (ex + e−x )
2
1 x
sinh x := sin(−ix) = (e − e−x )
2
(Cosinus hyperbolicus),
(Sinus hyperbolicus).
Während (cos x, sin x) eine Parametrisierung der Einheitskreislinie liefert, ergibt (cosh x, sinh x) eine Parametrisierung des rechten Astes der Hyperbel
{(x, y) ∈ R2 : x2 − y 2 = 1}. Wir verzichten hier auf eine Diskussion der
Hyperbelfunktionen und verweisen auf die Literatur und die Übungen.
124
4
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Das eindimensionale Riemannsche Integral
Ist f : [a, b] → R eine positive Funktion, so möchte man das bestimmte Integral
∫b
f (x) dx
a
als Flächeninhalt des Stückes des R2 erklären, das von der x-Achse und der Funktion
f einerseits und den senkrechten Geraden durch (a, 0) bzw. (b, 0) andererseits beran∫b
det wird. Die Idee hierbei ist, den Wert a f (x) dx durch den elementargeometrischen
Flächeninhalt von einbeschriebenen Rechtecken geeigneter Höhe zu approximieren.
Es scheint offensichtlich, dass der Flächeninhalt so immer besser approximiert wird,
wenn wir die Breite der Rechtecke verringern (und damit ihre Anzahl erhöhen), zumindest wenn dieses Verfahren konvergiert. Dieser Ansatz soll nun präzisiert werden.
Im Folgenden sei f : I → R immer eine beschränkte Funktion auf dem kompakten
Intervall I = [a, b] ⊂ R (−∞ < a < b < +∞).
Definition 4.1: Sei also I = [a, b] und f : I → R beschränkt.
• Es sei N ∈ N und Punkte x0 , x1 , . . . , xN ∈ I seien gewählt mit
a = x0 < x1 < . . . < xN = b.
Wir setzen Ij := [xj−1 , xj ] und ∆xj := xj − xj−1 = |Ij | für j = 1, . . . , N . Die
Menge {x0 , . . . , xN } nennen wir dann eine Zerlegung Z von I und die Punkte
x0 , . . . , xN heißen Teilpunkte von Z. Die Länge des größten Teilintervalls
∆(Z) := max{∆x1 , . . . , ∆xN }
(4.1)
wird als Feinheit der Zerlegung Z bezeichnet.
• Mit den Abkürzungen
mj := inf Ij f = inf{f (x) : x ∈ Ij },
mj := supIj f = sup{f (x) : x ∈ Ij },
j = 1, . . . , N,
(4.2)
bilden wir die Untersumme
S Z (f ) :=
N
∑
mj ∆xj
(4.3)
mj ∆xj
(4.4)
j=1
und die Obersumme
S Z (f ) :=
N
∑
j=1
zu f .
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
125
• Aus jedem Teilintervall Ij wählen wir ein ξj ∈ Ij und setzen ξ := (ξ1 , . . . , ξN ).
Dann nennen wir
SZ (f ) = SZ (f, ξ) :=
N
∑
f (ξj )∆xj
(4.5)
j=1
eine Riemannsche Zwischensumme zu f .
Bemerkung: Man beachte, dass wegen mj ≤ f (ξj ) ≤ mj stets
S Z (f ) ≤ SZ (f, ξ) ≤ S Z (f )
(4.6)
für jede Zerlegung von I und jede Riemannsche Zwischensumme erfüllt ist. Ferner
können wir zu jeder Zerlegung Z und jedem ε > 0 Zwischenwerte ξ j , ξ j ∈ Ij (j =
1, . . . , N ) so angeben, dass gilt
SZ (f, ξ) < S Z (f ) + ε,
SZ (f, ξ) > S Z (f ) − ε.
(4.7)
Definition 4.2:
• Eine Zerlegung Z ∗ von I heißt Verfeinerung der Zerlegung Z von I, wenn alle
Teilpunkte von Z auch Teilpunkte von Z ∗ sind.
• Eine gemeinsame Verfeinerung Z1 ∨ Z2 zweier Zerlegungen Z1 , Z2 von I ist
die Zerlegung von I, deren Teilpunkte gerade die Teilpunkte von Z1 und Z2
sind.
Bemerkung: Z1 ∨ Z2 ist also sowohl Verfeinerung von Z1 als auch von Z2 .
Hilfssatz 4.1:
(i) Ist Z ∗ Verfeinerung von Z, so gilt
S Z (f ) ≤ S Z ∗ (f ) ≤ S Z ∗ (f ) ≤ S Z (f ).
(ii) Sind Z1 , Z2 zwei beliebige Zerlegungen von I, so gilt
S Z1 (f ) ≤ S Z2 (f ).
Beweis:
(i) Seien Il∗ ein Teilintervall von Z ∗ und Ij ein Teilintervall von Z mit Il∗ ⊂ Ij .
Dann folgt
m∗l := inf
f ≥ inf f =: mj ,
∗
Il
Ij
m∗l := sup f ≤ sup f =: mj
Il∗
Ij
126
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
und somit
mj ∆xj = mj
∑
∆x∗l ≤
∑
m∗l ∆x∗l ,
mj ∆xj ≥
l:Il∗ ⊂Ij
l:Il∗ ⊂Ij
∑
m∗l ∆x∗l .
l:Il∗ ⊂Ij
Durch Summierung über j erhalten wir also
(4.6)
S Z (f ) ≤ S Z ∗ (f ) ≤ S Z ∗ (f ) ≤ S Z (f ).
(ii) Wir wenden (i) auf die gemeinsame Verfeinerung Z1 ∨Z2 =: Z an und erhalten
S Z1 (f ) ≤ S Z (f ) ≤ S Z (f ) ≤ S Z2 (f ),
wie behauptet.
q.e.d.
Definition 4.3: Ist f : I → R beschränkt, I = [a, b], so erklären wir das Unterintegral I(f ) bzw. Oberintegral I(f ) von f als
}
{
I(f ) := sup S Z (f ) : Z ist Zerlegung von I ,
{
}
I(f ) := inf S Z (f ) : Z ist Zerlegung von I .
Bemerkung: Ist Z eine beliebige Zerlegung von I = [a, b] und f : I → R beschränkt,
so gilt nach Hilfssatz 4.1 (i):
−∞ < |I| inf f ≤ S Z (f ) ≤ S Z (f ) ≤ |I| sup f < +∞.
I
I
Also sind I(f ), I(f ) ∈ R wohl definiert. Hilfssatz 4.1 (ii) entnehmen wir noch durch
sup- bzw. inf-Bildung:
S Z (f ) ≤ I(f ) ≤ I(f ) ≤ S Z (f )
mit beliebiger Zerlegung Z von I.
(4.8)
Definition 4.4: Eine beschränkte Funktion f : I → R über dem Intervall I = [a, b]
heißt Riemann-integrierbar, wenn gilt I(f ) = I(f ). Wir setzen dann
I(f ) := I(f ) = I(f )
für das (bestimmte) Riemannsche Integral von f über [a, b]. Alternative Symbole
sind
∫
∫b
∫b
I(f ) = f (x) dx = f dx = f (x) dx.
a
a
I
Die Klasse aller Riemann-integrierbaren Funktionen auf I wird mit R(I) bezeichnet.
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
127
Bemerkung: Da wir weitere Integralbegriffe erst in der Analysis III kennenlernen
werden, sagen wir i.F. kurz integrierbar für Riemann-integrierbar und Integral für
Riemannsches Integral.
Satz 4.1: (Integrabilitätskriterium I)
Für eine beschränkte Funktion f : I → R, I = [a, b], gilt:
f ∈ R(I)
⇔
Für alle ε > 0 existiert eine Zerlegung Z
von I mit S Z (f ) − S Z (f ) < ε.
Beweis:
• ⇐“: Aus (4.8) erhalten wir
”
0 ≤ I(f ) − I(f ) ≤ S Z (f ) − S Z (f ) < ε
für beliebiges ε > 0 und geeignete Zerlegung Z. Also folgt I(f ) = I(f )
bzw. f ∈ R(I).
• ⇒“: Nach Definition 4.3 existieren zu beliebig gewähltem ε > 0 Zerlegungen
”
Z und Z von I mit
ε
S Z (f ) > I(f ) − ,
2
ε
S Z (f ) < I(f ) + .
2
Setzen wir Z := Z ∨ Z, so liefert Hilfssatz 4.1 (i):
S Z (f ) − S Z (f ) ≤ S Z (f ) − S Z (f ) < I(f ) − I(f ) + ε
wie behauptet.
f ∈R(I)
=
ε,
q.e.d.
Satz 4.2: (Integrabilitätskriterium II)
Für eine beschränkte Funktion f : I → R, I = [a, b], gilt:
f ∈ R(I)
⇔
Für alle ε > 0 existiert ein δ = δ(ε), so dass gilt:
S Z (f ) − S Z (f ) < ε für alle Zerlegungen Z mit ∆(Z) < δ.
Beweis:
• ⇐“: Klar aus Satz 4.1.
”
• ⇒“: Sei also f ∈ R(I) und ε > 0 beliebig gewählt. Nach Satz 4.1 existiert
”
eine Zerlegung
{
}
Z ∗ = x∗0 , x∗1 , . . . , x∗N : a = x∗0 < x∗1 < . . . < x∗N = b
128
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
mit der Eigenschaft
ε
S Z ∗ (f ) − S Z ∗ (f ) < .
(4.9)
2
Da ferner f beschränkt ist, gibt es ein c > 0 mit |f (x)| ≤ c für alle x ∈ I. Wir
setzen nun
ε
δ = δ(ε) :=
16 cN
und betrachten eine beliebige Zerlegung Z von I mit ∆(Z) < δ. Für Z ′ :=
Z ∨ Z ∗ folgt dann aus Hilfssatz 4.1 (i) und (4.9):
ε
S Z ′ (f ) − S Z ′ (f ) ≤ S Z ∗ (f ) − S Z ∗ (f ) < .
2
(4.10)
Ferner unterscheiden sich die Ober- bzw. Untersummen von Z und Z ′ in jeweils
höchstens 2N Summanden, nämlich jenen, die zu Zerlegungsintervallen von Z
gehören, die einen Zerlegungspunkt von Z ∗ im Innern enthalten. Da schließlich
auch ∆(Z ′ ) < δ gilt, finden wir also
0 ≤ S Z (f ) − S Z ′ (f ) ≤ 4N cδ,
0 ≤ S Z ′ (f ) − S Z (f ) ≤ 4N cδ,
so dass (4.10) liefert
(4.10)
S Z (f ) − S Z (f ) ≤ S Z ′ (f ) − S Z ′ (f ) + 8cN δ <
wie behauptet.
ε ε
+ = ε,
2 2
q.e.d.
Folgerung 4.1: Es sei f ∈ R(I), {Zn }n eine beliebige Folge von Zerlegungen von
I = [a, b] mit ∆(Zn ) → 0 (n → ∞) und {SZn (f )}n eine zugehörige Folge beliebiger
Riemannscher Zwischensummen. Dann gilt
∫b
f (x) dx = lim SZn (f ).
n→∞
(4.11)
a
Bemerkung: Eine Folge von Zerlegungen {Zn }n mit ∆(Zn ) → 0 (n → ∞) nennt man
ausgezeichnete Zerlegungsfolge. Es gilt auch die Umkehrung von Folgerung 4.1:
Konvergiert die Folge Riemannscher Zwischensummen {SZn (f )}n für jede ausgezeichnete Zerlegungsfolge {Zn }n und jede Wahl der Zwischenwerte, so ist f integrierbar und es gilt (4.11).
Beweis von Folgerung 4.1: Ist ε > 0 beliebig gewählt, so existiert nach Satz 4.2 ein
N = N (ε) ∈ N mit
S Zn (f ) − S Zn (f ) < ε
für alle n ≥ N.
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
129
Wegen S Zn (f ) ≤ I(f ) ≤ S Zn (f ) und S Zn (f ) ≤ SZn (f ) ≤ S Zn (f ) für alle n ∈ N
folgt sofort
|I(f ) − SZn (f )| ≤ S Zn (f ) − S Zn (f ) < ε
für alle n ≥ N,
also die Behauptung.
q.e.d.
Satz 4.3: (Rechenregeln)
(i) Gilt f, g ∈ R(I), so auch αf + βg ∈ R(I) für alle α, β ∈ R mit
I(αf + βg) = αI(f ) + βI(g).
D.h. R(I) ist ein reeller Vektorraum.
(ii) Sind f, g ∈ R(I) und gilt f ≤ g auf I, so folgt
I(f ) ≤ I(g).
(iii) Mit f ∈ R(I) gilt auch |f | ∈ R(I) mit
|I(f )| ≤ I(|f |).
(iv) Sind f, g ∈ R(I), so auch f · g ∈ R(I) und es gilt
(
)
|I(f g)| ≤ sup |g| I(|f |).
I
(v) Gilt f, g ∈ R(I) sowie |g| ≥ c > 0 auf I mit einer Konstante c > 0, so folgt
auch fg ∈ R(I) mit
( f ) 1
≤ I(|f |).
I
g
c
Bemerkung: Zum Beweis der Aussagen benutzen wir folgende allgemeine Beobachtung, die man leicht als Übungsaufgabe beweist: Ist h : D → R beschränkt, D ⊂ Rm ,
so folgt
sup |h(x) − h(x′ )| = sup h − inf h.
x,x′ ∈D
Man nennt diesen Wert die Oszillation von h.
D
D
(4.12)
130
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis von Satz 4.3:
(i) Mit α, β ∈ R und h(x) := αf (x) + βg(x), x ∈ I, finden wir
|h(x) − h(x′ )| ≤ |α| |f (x) − f (x′ )| + |β| |g(x) − g(x′ )|
für alle x, x′ ∈ I.
Zu einer beliebigen Zerlegung Z von I bilden wir in dieser Relation das Supremum über x, x′ ∈ Ij , wenden (4.12) auf den einzelnen Teilintervallen Ij an,
multiplizieren mit ∆xj und summieren über j. Dann folgt
[
]
[
]
S Z (h) − S Z (h) ≤ |α| S Z (f ) − S Z (f ) + |β| S Z (g) − S Z (g) .
Wegen f, g ∈ R(I) existiert somit nach Satz 4.2 ein δ = δ(ε) > 0, so dass
S Z (h) − S Z (h) < ε gilt für alle Zerlegungen Z mit ∆(Z) < δ. Wiederum
Satz 4.2 liefert also h = αf + βg ∈ R(I).
Ist nun Z eine beliebige Zerlegung, so gilt bei jeder Wahl der Zwischenwerte
für die Riemannschen Zwischensummen:
SZ (αf + βg) = αSZ (f ) + βSZ (g).
Wenden wir dies auf eine ausgezeichnete Zerlegungsfolge {Zn }n an, so liefert
Folgerung 4.1 nach Grenzübergang n → ∞ die behauptete Linearität des Integrals.
(ii) Nach (i) gilt h := g − f ∈ R(I). Wegen h ≥ 0 liefert Formel (4.8)
(i)
0 ≤ S Z (h) ≤ I(h) = I(g) − I(f ).
also die Behauptung.
(iii) Die umgekehrte Dreiecksungleichung liefert
|f (x)| − |f (x′ )| ≤ |f (x) − f (x′ )|
für alle x, x′ ∈ I.
Wie in (i) folgern wir hieraus m.H. von (4.12) und Satz 4.2:
S Z (|f |) − S Z (|f |) ≤ S Z (f ) − S Z (f ) < ε
für alle Zerlegungen Z mit ∆(Z) < δ, wobei ε > 0 beliebig und δ = δ(ε) > 0 geeignet gewählt
sind. Satz 4.2 liefert also |f | ∈ R(I). Ferner entnehmen wir (ii):
I(f ) ≤ I(|f |),
(i)
−I(f ) = I(−f ) ≤ I(|f |)
bzw. |I(f )| ≤ I(|f |).
(iv) Hier erhalten wir (ähnlich wie in (i) und (iii)) die Integrierbarkeit von f · g für f, g ∈ R(I)
aus der Relation
|f (x)g(x) − f (x′ )g(x′ )| ≤ (sup |f |)|g(x) − g(x′ )| + (sup |g|)|f (x) − f (x′ )|
I
I
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
131
für alle x, x′ ∈ I. Aus (i)-(iii) und der Ungleichung
|f (x)g(x)| ≤ (sup |g|)|f (x)|,
x ∈ I,
I
folgt noch
) (i)
(iii)
(ii) (
|I(f g)| ≤ I(|f g|) ≤ I (sup |g|)|f | = (sup |g|)I(|f |).
I
I
(v) Wegen |g| ≥ c > 0 haben wir
1 1
1
′
−
≤ 2 |g(x) − g(x )|
g(x)
g(x′ )
c
so dass wie oben
1
g
für alle x, x′ ∈ I,
∈ R(I) folgt. Damit ist nach (iv) auch
f
g
∈ R(I) richtig, und wir finden
( ) (iv) (
)
1
f 1
I
≤ sup I(|f |) ≤ I(|f |).
g
g
c
I
Damit ist alles gezeigt.
q.e.d.
Satz 4.4: (Schwarzsche Ungleichung)
Für beliebige f, g ∈ R([a, b]) gilt
∫b
( ∫b
)1
) 1 ( ∫b
2
2
2
2
f (x)g(x) dx ≤
.
|g(x)|
dx
|f
(x)|
dx
a
a
a
Beweis: Dieser verläuft analog zum Beweis der Cauchy-Schwarzschen Ungleichung
im Rd , Satz 10.2 aus Kap. 1, wenn wir
∫b
⟨f, g⟩ :=
f (x)g(x) dx und ∥f ∥ :=
a
√
( ∫b
⟨f, f ⟩ =
)1
2
|f (x)| dx
2
a
setzen (ersetze im dortigen Beweis | · | durch ∥ · ∥ und nutze die Linearität des
Integrals).
q.e.d.
Satz 4.5: Für I = [a, b] gilt C 0 (I) ⊂ R(I).
Beweis: Da I = [a, b] kompakt ist, ist jede Funktion f ∈ C 0 (I) gleichmäßig stetig
nach Satz 3.3 aus Kap. 2. Zu beliebigem ε > 0 existiert also ein δ = δ(ε) > 0, so dass
gilt
ε
|f (x) − f (x′ )| <
für alle x, x′ ∈ I mit |x − x′ | < δ.
b−a
132
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Ist nun Z eine beliebige Zerlegung von I mit ∆(Z) < δ, so folgt
S Z (f ) − S Z (f )
=
N
∑
[
j=1
(4.12)
=
]
sup f − inf f ∆xj
(∑
N
Ij
Ij
)
sup |f (x) − f (x )| ∆xj
′
′
j=1 x,x ∈Ij
ε ∑
∆xj = ε
b−a
N
<
j=1
und somit f ∈ R(I) nach Satz 4.2.
q.e.d.
Bemerkung: Eine Funktion f : I → R, I = [a, b], heißt stückweise stetig auf I, wenn
eine Zerlegung
Z = {x0 , . . . , xN : a = x0 < x1 < . . . < xN = b}
von I so existiert, dass f in jedem Teilintervall Ij = (xj−1 , xj ) stetig ist und die
einseitigen Grenzwerte limξ→xj−1 + f (ξ), limξ→xj − f (ξ) existieren für j = 1, . . . , N .
Die Funktionen

limξ→xj−1 + f (ξ), x = xj−1


f (x),
x ∈ (xj−1 , xj )
φj (x) :=


limξ→xj − f (ξ),
x = xj
sind also stetig auf [xj−1 , xj ] für j = 1, . . . , N . Aus Satz 4.5 erhält man nun leicht
die
Folgerung 4.2: Jede stückweise stetige Funktion auf dem Intervall I = [a, b] ist
Riemann-integrierbar.
Satz 4.6: (Mittelwertsatz der Integralrechnung)
Es sei I = [a, b] und f ∈ C 0 (I) sowie p ∈ R(I) mit p ≥ 0 auf I seien gegeben. Dann
existiert ein ξ ∈ (a, b), so dass gilt
∫b
∫b
p(x) dx.
f (x)p(x) dx = f (ξ)
(4.13)
a
a
Bemerkung: Speziell für p(x) := 1, x ∈ [a, b], haben wir p ∈ R(I) und z.B. nach
Folgerung 4.1:
∫b
1 dx = lim SZn (1) = b − a
n→∞
a
4. DAS EINDIMENSIONALE RIEMANNSCHE INTEGRAL
133
für eine ausgezeichnete Zerlegungsfolge {Zn }n und beliebige Zwischenwerte. Satz 4.6
liefert also
∫b
∫b
1
− f (x) dx :=
f (x) dx = f (ξ).
b−a
a
a
∫b
Die Größe −a f (x) dx heißt Mittelwert von f über I und gibt die mittlere Höhe“
”
von f an.
Beweis von Satz 4.6: Mit m := inf I f , m := supI f haben wir mp(x) ≤ f (x)p(x) ≤
mp(x) für x ∈ I. Satz 4.3 (i), (ii) liefern also
∫b
∫b
p(x) dx ≤
m
a
∫b
f (x)p(x) dx ≤ m
a
p(x) dx.
a
Somit existiert ein µ ∈ [m, m] mit
∫b
∫b
f (x)p(x) dx = µ
a
p(x) dx.
(4.14)
a
Nach dem Weierstraßschen Hauptlehrsatz gibt es x1 , x2 ∈ [a, b] mit f (x1 ) = m,
f (x2 ) = m. Nach dem Zwischenwertsatz existiert nun ein ξ ∈ [a, b] mit f (ξ) = µ, so
dass (4.13) sofort aus (4.14) folgt. Als Übungsaufgabe zeigt man noch, dass o.E. ξ ∈
(a, b) angenommen werden kann.
q.e.d.
Hilfssatz 4.2: Ist I = [a, b] ein kompaktes Intervall und f ∈ R(I), so gilt auch
f ∈ R(I ′ ) für jedes abgeschlossene Teilintervall I ′ ⊂ I.
Beweis: Wegen f ∈ R(I) existiert nach Satz 4.1 zu jedem ε > 0 eine Zerlegung Z von I mit
S Z (f ) − S Z (f ) < ε. Für die Verfeinerung Z ∗ von Z, die zusätzlich die beiden Endpunkte von I ′
enthält, gilt dann nach Hilfssatz 4.1 (i):
S Z ∗ (f ) − S Z ∗ (f ) ≤ S Z (f ) − S Z (f ) < ε.
Die Teilzerlegung Z ′ von Z ∗ , die nur Teilpunkte in I ′ enthält, ist dann offenbar Zerlegung von I ′
und es gilt
S Z ′ (f ) − S Z ′ (f ) ≤ S Z ∗ (f ) − S Z ∗ (f ) < ε,
so dass wiederum Satz 4.1 liefert: f ∈ R(I ′ ).
q.e.d.
Satz 4.7: (Additivität des Integrals)
Es sei I = [a, b] in endlich viele abgeschlossene Teilintervalle I1 , . . . , Iµ zerlegt, die
höchstens Randpunkte gemein haben, d.h.
I = I1 ∪ . . . ∪ Iµ ,
int Ij ∩ int Ik = ∅ für j ̸= k.
134
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Dann gilt für beliebige f ∈ R(I) die Relation
∫
f (x) dx =
µ ∫
∑
f (x) dx.
(4.15)
j=1 I
I
j
Beweis: Nach Hilfssatz 4.2 gilt zunächst f ∈ R(Ij ) für j = 1, . . . , µ, so dass alle
Integrale in (4.15) erklärt sind. Es sei nun {Zn }n eine ausgezeichnete Zerlegungsfolge, deren Elemente die Endpunkte aller Teilintervalle enthalten, und SZn (f ) seien
(j)
zugehörige Riemannsche Zwischensummen. Schreiben wir dann SZn (f ) für die Zwischensummen, die nur Teilpunkte aus Ij enthalten, so gilt offenbar
SZn (f ) =
µ
∑
(j)
SZn (f )
für alle n ∈ N.
j=1
Grenzübergang n → ∞ und Folgerung 4.1 liefern die Behauptung.
q.e.d.
Definition 4.5: Ist f ∈ R(I), I = [a, b] und seien α, β ∈ I mit α < β gewählt.
Dann setzen wir
∫α
∫α
f (x) dx = 0
∫β
f (x) dx := −
und
α
f (x) dx.
α
β
Satz 4.8: Ist f ∈ R(I) und sind α, β, γ ∈ I = [a, b] beliebig gewählt, so folgt
∫γ
∫γ
∫β
α
f (x) dx.
f (x) dx =
f (x) dx +
(4.16)
α
β
Beweis: Nach Hilfssatz 4.2 und Definition 4.5 sind alle Integrale sinnvoll erklärt.
• Stimmen mindestens zwei der Zahlen α, β, γ überein, so ist die Aussage trivial.
• Falls α < β < γ gilt, so ist (4.16) ein Spezialfall von (4.15) wegen f ∈ R([α, γ]).
• Falls β < α < γ gilt, so haben wir f ∈ R([β, γ]) und
∫γ
(4.15)
∫α
f (x) dx =
β
∫γ
f (x) dx +
β
f (x) dx
α
Def. 4.5
=
∫β
−
∫γ
f (x) dx,
f (x) dx +
α
α
also nach Umstellen wieder (4.16). Ganz entsprechend ergeben sich die übrigen vier Fälle
(β < γ < α, α < γ < β, γ < α < β, γ < β < α).
q.e.d.
Wir betrachten nun noch komplex- bzw. vektorwertige Funktionen:
5. INTEGRATION UND DIFFERENTIATION
135
Definition 4.6:
(i) Eine beschränkte Funktion f : I → C heißt integrierbar auf I = [a, b], wenn
Re f, Im f ∈ R(I) gilt. Wir setzen dann
∫b
∫b
f (x) dx :=
a
∫b
Re f (x) dx + i
a
Im f (x) dx
a
und schreiben f ∈ R(I, C).
(ii) Entsprechend heißt f = (f1 , . . . , fd ) : I → Rd integrierbar auf I = [a, b], wenn
fl ∈ R(I) für alle l = 1, . . . , d gilt. Wir schreiben dann f ∈ R(I, Rd ) und
setzen
( ∫b
)
∫b
∫b
f (x) dx :=
f1 (x) dx, . . . , fd (x) dx .
a
a
a
Bemerkung: Mit diesen Definitionen lassen sich die Aussagen der Sätze 4.3 (außer
(ii), und (v) nur für f, g ∈ R(I, C)), 4.5, 4.7 und 4.8 direkt auf Funktionen
∫ in R(I, C)
d
bzw. R(I, R ) übertragen. In der Schwarzschen Ungleichung ist dabei I f (x)g(x) dx
∫
∫
durch I f (x)g(x) dx bzw. I ⟨f (x), g(x)⟩ dx zu ersetzen.
5
Integration und Differentiation
Definition 5.1: Sei I ⊂ R ein beliebiges Intervall und f ∈ C 0 (I) gegeben. Dann
heißt F ∈ C 1 (I) Stammfunktion zu f , falls gilt
F ′ (x) = f (x)
für alle x ∈ I.
Satz 5.1: Seien I ⊂ R ein Intervall, c ∈ I beliebig und f ∈ C 0 (I). Dann ist
∫x
F (x) := f (t) dt, x ∈ I,
c
eine Stammfunktion zu f .
Beweis: Für x ∈ I und h ̸= 0 mit x + h ∈ I gilt
F (x + h) − F (x)
h
=
1
h
)
( x+h
∫x
∫
f (t) dt − f (t) dt
c
c
Def. 4.4
=
(4.16)
=
)
( x+h
∫c
∫
1
f (t) dt + f (t) dt
h
1
h
c
x+h
∫
f (t) dt.
x
x
(5.1)
136
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Nach dem Mittelwertsatz der Integralrechnung existiert ein ξh ∈ I zwischen x und
x + h mit
x+h
∫
1
f (t) dt = f (ξh ).
(5.2)
h
x
Wegen |ξh − x| ≤ |h| → 0 (h → 0) und der Stetigkeit von f haben wir
(
)
lim f (ξh ) = f lim ξh = f (x).
h→0
h→0
Zusammen mit (5.1) und (5.2) finden wir also
lim
h→0
F (x + h) − F (x)
= lim f (ξh ) = f (x)
h→0
h
und somit F ′ ≡ f ∈ C 0 (I).
q.e.d.
Satz 5.2: Sei F ∈ C 1 (I) eine beliebige Stammfunktion von f ∈ C 0 (I), I ⊂ R
Intervall. Eine Funktion G ∈ C 1 (I) ist genau dann Stammfunktion von f , wenn
G − F ≡ const auf I gilt.
Beweis:
• ⇒“: Ist G Stammfunktion zu f , so folgt
”
(G − F )′ = G′ − F ′ = f − f = 0
auf I.
Nach Folgerung 2.1 (iii) ist also G − F ≡ const auf I.
• ⇐“: Ist umgekehrt G − F ≡ const auf I, so folgt
”
G′ = (F + const)′ = F ′ = f auf I,
d.h. G ist Stammfunktion.
q.e.d.
Bemerkung: Ist also F ∈ C 1 (I) eine Stammfunktion von f (z.B: die in Satz 5.1
erklärte), so ist die Menge aller Stammfunktionen gegeben durch
{G ∈ C 1 (I) : G ≡ F + c, c ∈ R}.
Diese Menge wird unbestimmtes Integral von f genannt und wir schreiben
∫
f (x) dx := {F + c : c ∈ R}
oder, wie allgemein gebräuchlich,
∫
f (x) dx = F (x) + c.
Zur Unterscheidung heißt daher
den Grenzen a und b).
∫b
a
f (x) dx auch bestimmtes Integral von f (zwischen
5. INTEGRATION UND DIFFERENTIATION
137
Satz 5.3: (Fundamentalsatz der Differential- und Integralrechnung)
Sei F ∈ C 1 (I) eine beliebige Stammfunktion von f ∈ C 0 (I), I = [a, b]. Dann gilt
∫b
b
f (x) dx = F (b) − F (a) =: F (x)a .
a
∫x
Beweis: Nach Satz 5.1 ist F0 (x) := a f (t) dt Stammfunktion von f , und nach
Satz 5.2 gilt F ≡ F0 + c auf I mit einer Konstanten c ∈ R. Wegen F0 (a) = 0
folgt also
∫b
f (x) dx = F0 (b) = F0 (b) − F0 (a) = F (b) − F (a),
a
wie behauptet.
q.e.d.
Beispiele:
1. Für α ̸= −1 gilt
∫
xα dx =
xα+1
+ c,
α+1
x > 0,
α+1
d x
denn dx
( α+1 ) = xα nach (3.9). D.h. F (x) =
f (x) = xα auf (0, +∞). Satz 5.3 liefert also
∫b
xα dx =
xα+1
α+1
ist Stammfunktion von
xα+1 b
1
(bα+1 − aα+1 )
=
α+1 a α+1
a
für a, b > 0.
2. Nach Formel (3.5) gilt
also
∫
∫b
1
dx = log x + c,
x
b
dx
b
= log xa = log
x
a
x > 0,
für a, b > 0.
a
3. Den Formeln (3.3) und (3.10) entnehmen wir
∫
exp x dx = exp x + c,
∫
cos x dx = sin x + c,
∫
sin x dx = − cos x + c,
x ∈ R.
138
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
4. Formel (3.21) entnehmen wir
∫
dx
dx = tan x + c,
cos2 x
und somit
∫φ
π
+ kπ,
2
x ̸=
φ
dx
= tan x0 = tan φ
cos2 x
für φ ∈
(
k ∈ Z,
−
π π)
,
.
2 2
0
Satz 5.4: (Partielle Integration)
Ist I = [a, b] und sind f, g ∈ C 1 (I, Rd ) gegeben, so gilt
∫b
b
⟨f (x), g(x)⟩ dx = ⟨f (x), g(x)⟩a −
′
a
∫b
⟨f (x), g ′ (x)⟩ dx.
(5.3)
a
Beweis: Die Produktformel (1.7) und Satz 5.3 liefern sofort
∫b
b
⟨f (x), g(x)⟩a =
d
⟨f (x), g(x)⟩ dx
dx
a
∫b
∫b
′
⟨f (x), g(x)⟩ dx +
=
a
⟨f (x), g ′ (x)⟩ dx
a
und nach Umstellen die Behauptung (5.3).
q.e.d.
Bemerkung: Die zuweilen nützliche unbestimmte Version“ von (5.3) ist
”
∫
∫
′
⟨f (x), g(x)⟩ dx = ⟨f (x), g(x)⟩ − ⟨f (x), g ′ (x)⟩ dx.
(5.4)
Diese gewinnt man wieder sofort aus der Produktformel (1.7) und der Definition des
unbestimmten Integrals.
Beispiele:
π
π
∫2
∫2
sin2 x dx =
1.
0
cos2 x dx =
π
. Denn Satz 5.4 liefert
4
0
π
π
∫2
π
sin2 x dx = [− cos x · sin x]02 +
0
π
∫2
∫2
cos2 x dx =
0
π
2
(1 − sin x) dx =
0
π
2
∫
∫
dx −
2
=
0
π
2
∫
0
cos2 x dx
sin2 x dx
0
5. INTEGRATION UND DIFFERENTIATION
bzw.
π
139
π
∫2
sin2 x dx =
1
2
0
∫2
1 π
π
dx = x02 = .
2
4
0
2. Für x > 0 haben wir nach (5.4):
∫
∫
∫
1
log x dx =
1 · log x dx = x log x − x · dx
x
= x log x − x + const,
also
∫a
log x dx = a(log a − 1) + 1
für a > 0.
1
3. Für a, b ∈ R berechnen wir
∫
eax sin(bx) dx =
=
so dass folgt
1
− eax cos(bx) +
b
1 ax
− e cos(bx) +
b
∫
eax sin(bx) dx =
∫
a
eax cos(bx) dx
b
∫
a ax
a2
e
sin(bx)
−
eax sin(bx) dx,
b2
b2
[
]
1
eax a sin(bx) − b cos(bx) + const.
a2 + b2
Satz 5.5: (Substitutions- oder Transformationsformel)
Es seien I, I ∗ ⊂ R zwei Intervalle, und f ∈ C 0 (I, Rd ) sowie φ ∈ C 1 (I ∗ , R) mit
φ(I ∗ ) ⊂ I seien gegeben. Dann gilt für beliebige α, β ∈ I ∗ :
φ(β)
∫
∫β
f (x) dx =
f (φ(t))φ′ (t) dt.
(5.5)
α
φ(α)
Beweis: Es sei F ∈ C 1 (I, Rd ) eine Stammfunktion von f , d.h. F ′ ≡ f auf I. Für
g := F ◦ φ gilt dann g ∈ C 1 (I ∗ , Rd ) und der Kettenregel, Satz 1.3, entnehmen wir
g ′ (t) = F ′ (φ(t))φ′ (t) = f (φ(t))φ′ (t),
t ∈ I ∗.
Satz 5.3 liefert also für beliebige α, β ∈ I ∗ :
∫β
′
∫β
f (φ(t))φ (t) dt =
α
g ′ (t) dt = g(β) − g(α)
α
φ(β)
∫
= F (φ(β)) − F (φ(α)) =
f (x) dx,
φ(α)
140
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
wie behauptet.
q.e.d.
Beispiele:
1. Zu berechnen sei
∫r√
r2 − x2 dx, r > 0.
0
Wir betrachten die Transformation x = φ(t) = r sin t, t ∈ [0, π2 ]. Dann ist
φ(0) = 0, φ( π2 ) = r und φ′ (t) = r cos t. Formel (5.5) liefert also
∫r √
π
r2 − x2 dx =
0
∫2 √
π
∫2
r2 − r2 sin2 t · r cos t dt = r2
0
cos2 t dt =
0
πr2
4
(→ Flächeninhalt der Kreisscheibe vom Radius r > 0 ist 4 ·
2. Zu berechnen ist
∫1
0
πr2
.
4
= πr2 ).
(1 + t2 )α t dt, α ∈ R \ {−1}.
Wir beachten
1
d
(1 + t2 )α (1 + t2 ), t ∈ R.
2
dt
Mit f (x) := xα , x > 0, und φ(t) := 1 + t2 , t ∈ R, haben wir also
h(t) := (1 + t2 )α t =
1
f (φ(t))φ′ (t), t ∈ R.
2
Beachten wir noch φ(0) = 1, φ(1) = 2, so folgt schließlich
h(t) =
∫1
1
(1 + t ) t dt =
2
2 α
(5.5)
0
∫2
xα dx =
2α+1 − 1
1 xα+1 2
,
=
2α+1 1
α+1
α ̸= −1.
1
Bemerkungen:
1. Die unbestimmte Form der Substitutionsregel (5.5), nämlich
∫
∫
f (x) dx = f (φ(t))φ′ (t) dt
(5.6)
ist häufig ebenfalls hilfreich. Ist F (x) eine Stammfunktion von f (x) und kennt
man eine Stammfunktion Ψ(t) von f (φ(t))φ′ (t), so bedeutet (5.6) gerade
F (x) = Ψ(t) + c mit x = φ(t).
Vorsicht: Möchte man, ähnlich wie in Bsp. 1 oben, eine Stammfunktion von f
mittels (5.6) bestimmen, so muss φ bijektiv sein: Kennt man nämlich Ψ, so
finden wir dann
F (x) = Ψ(φ−1 (x)) + c.
Beispiel:
∫
dx
2
r + x2
x=φ(t)=rt
=
(3.22)
=
∫
1
r dt
=
2
2
2
r +r t
r
1
arctan t + const
r
∫
dt
1 + t2
φ−1 (x)= xr
=
1
x
arctan + const.
r
r
5. INTEGRATION UND DIFFERENTIATION
141
2. Es gibt eine Vielzahl von Kunsgriffen zur Bestimmung von Integralen bzw.
Stammfunktionen, auf die wir nicht im Einzelnen eingehen können. Wir verweisen auf S. Hildebrandt: Analysis 1 (Springer-Verlag), Kap. 3, § 10 für einige
Beispiele, insbesondere die Integration rationaler Funktionen (→ Partialbruchzerlegung).
Wir betrachten nun wieder Funktionenfolgen und beginnen mit dem
Satz 5.6: Sei {fn }n eine Folge von Funktionen fn ∈ R(I, Rd ), I = [a, b], mit der
Eigenschaft fn →
→ f (n → ∞) auf I. Dann folgt f ∈ R(I, Rd ) und
∫b
∫b
f (x) dx = lim
fn (x) dx.
n→∞
a
(5.7)
a
Bemerkungen:
1. Satz 5.6 besagt, dass wir bei gleichmäßig konvergenten, integrierbaren Funktionenfolgen Integration und Grenzwertbildung vertauschen können, denn (5.7)
lässt sich schreiben als
∫b
∫b
lim fn (x) dx = lim
n→∞
fn (x) dx.
n→∞
a
a
Die Aussage wird falsch bei nur punktweise konvergenten Funktionenfolgen.
2. Satz 5.6 lässt sich natürlich wieder auf gleichmäßig konvergente Funktionenreihen übertragen.
Beweis von Satz 5.6: Es bezeichne g : I → R die j-te Komponente von f und
gn ∈ R(I) die j-te Komponente von fn für ein j ∈ {1, . . . , d}. Wir zeigen g ∈ R(I)
und
∫b
∫b
g(x) dx = lim
gn (x) dx.
(5.8)
n→∞
∫b
a
a
Die Definition von a f (x) dx als komponentenweises Integral liefert dann die Behauptung.
Sei also ε > 0 beliebig gewählt, so existiert ein N = N (ε) ∈ N mit
ε
|gn (x) − g(x)| <
für alle x ∈ I, n ≥ N.
(5.9)
3(b − a)
Speziell für n = N erhalten wir also
|g(x) − g(x′ )| < |gN (x) − gN (x′ )| +
2ε
3(b − a)
für alle x, x′ ∈ I.
(5.10)
142
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Ist nun Z eine Zerlegung von I mit S Z (gN )−S Z (gN ) < 3ε , die nach Satz 4.1 existiert,
so liefern (5.10) und (4.12) die Relation
S Z (g) − S Z (g) ≤ S Z (gN ) − S Z (gN ) +
∑
2ε
ε 2
∆xj < + ε = ε.
3(b − a)
3 3
j
Wiederum nach Satz 4.1 ist somit g ∈ R(I) richtig, und Satz 4.3 sowie (5.9) liefern
∫b
∫b
∫b
[
] gn (x) dx − g(x) dx = gn (x) − g(x) dx
a
a
∫b
a
ε
|gn (x) − g(x)| dx <
3(b − a)
(5.9)
≤
a
∫b
dx < ε
für alle n ≥ N,
a
also (5.8) wie behauptet.
q.e.d.
Wir sind nun in der Lage, den ausgelassenen Beweis von Satz 1.5 nachzuliefern,
der uns erst die Differenzierbarkeit der elementaren Funktionen in § 3 sicherte. Zur
Erinnerung formulieren wir ihn noch einmal als
Satz 5.7: Sei I = [a, b] und {fn }n eine Folge von Funktionen fn ∈ C 1 (I, Rd ) für
alle n ∈ N. Falls dann gilt
fn′ →
→ g (n → ∞)
fn → f (n → ∞),
auf I,
so folgt für den punktweisen Limes f ∈ C 1 (I, Rd ), und es gilt f ′ = g auf I.
Beweis: Da fn′ ∈ C 0 (I, Rd ) gilt, liefert der Weierstraßsche Konvergenzsatz, Satz 4.1
aus Kap. 2, für die Grenzfunktion g ∈ C 0 (I, Rd ). Und wegen C 0 (I, Rd ) ⊂ R(I, Rd )
haben wir nach Satz 5.6:
∫x
lim
n→∞
fn′ (t) dt
∫x
=
a
g(t) dt
für alle x ∈ [a, b].
a
Andererseits entnehmen wir Satz 5.3 die Relation
∫x
fn (x) = fn (a) +
fn′ (t) dt,
x ∈ [a, b].
a
Grenzübergang n → ∞ liefert nun
∫x
g(t) dt,
f (x) = f (a) +
a
x ∈ [a, b].
(5.11)
6. UNEIGENTLICHE INTEGRALE
143
Insbesondere ist also f ∈ C 1 (I, Rd ) nach Satz 5.1 und Differentiation liefert f ′ = g
auf I, wie behauptet.
q.e.d.
Bemerkung: Der Beweis zeigt, dass es genügt statt fn → f (n → ∞) auf I die
Konvergenz der Punkte {fn (a)}n zu fordern. Die Beziehung fn → f (n → ∞) auf I
folgt dann aus (5.11). Dabei kann a noch durch einen beliebigen Punkt c ∈ I ersetzt
werden.
Beispiel: Es gilt
(
x )n
= exp x für alle x ∈ R.
n→∞
n
Zum Beweis betrachten wir die Folge fn (x) := n log(1 + nx ), x ∈ [−N, N ], für beliebiges N ∈ N und
für alle n > N . Dann gilt fn (0) = 0 und man zeigt leicht
lim
1+
fn′ (x) =
1
1+
x
n
→
→ 1 (n → ∞)
auf [−N, N ].
Nach Satz 5.7 und der anschließenden Bemerkung folgt
f (x)
:=
lim fn (x)
n→∞
(5.11)
=
∫x [
lim fn (0) +
n→∞
]
lim fn′ (t) dt
n→∞
0
∫x
=
0+
1 dt = x,
x ∈ [−N, N ].
0
Da schließlich exp : R → R stetig ist und N ∈ N beliebig war, erhalten wir
(
(
)
(
)
x )n
lim 1 +
= lim exp fn (x) = exp lim fn (x) = exp x für alle x ∈ R.
n→∞
n→∞
n→∞
n
6
Uneigentliche Integrale
Bisher haben wir nur beschränkte Funktionen über kompakte Intervalle integriert.
Beide Einschränkungen sollen jetzt aufgeweicht werden:
Fall I: Unbeschränktes Integrationsintervall
Sei I z.B. nach oben unbeschränkt, also I = [a, +∞). Ferner gelte f ∈ R([a, b]) für
jedes b ∈ [a, +∞), insbesondere sei also f auf [a, b] beschränkt für alle b ∈ [a, +∞).
∫b
Definition 6.1: Wenn limb→+∞ a f (x) dx existiert, so heißt dieser Grenzwert das
uneigentliche Integral von f über [a, +∞) und wir schreiben
+∞
∫b
∫
f (x) dx.
f (x) dx := lim
b→+∞
a
a
144
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Wir sagen∫dann, das uneigentliche Integral
∫ b existiert oder konvergiert, anderenfalls
+∞
sagen wir a f (x) dx divergiert. Falls a f (x) dx → ±∞ (b → +∞) gilt, sagen wir
∫ +∞
f (x) dx ist bestimmt divergent und schreiben
a
+∞
∫
f (x) dx = ±∞.
Schließlich heißt
∫ +∞
a
a
f (x) dx absolut konvergent, wenn
∫ +∞
a
|f (x)| dx konvergiert.
Bemerkungen:
∫ +∞
1. Nach dem Cauchyschen Konvergenzkriterium ist a f (x) dx genau dann konvergent, wenn zu jedem ε > 0 ein ξ ≥ a existiert mit
∫b′
∫b′
∫b
f (x) dx = f (x) dx − f (x) dx < ε
a
b
für alle b, b′ > ξ.
a
∫ +∞
2. Hieraus und aus Satz 4.3 (iii) folgt auch: Konvergiert a f (x) dx absolut, so
auch im gewöhnlichen Sinne. Die Umkehrung gilt i.A. nicht (siehe das u.a. Beispiel).
∫ +∞
3. Ist φ : [a, +∞) → R nichtnegativ, so existiert a φ(x) dx nach dem Satz über
monotone Konvergenz genau dann, wenn es ein c > 0 gibt mit der Eigenschaft
∫b
φ(x) dx ≤ c für alle b ∈ [a, +∞).
a
Anderenfalls ist
∫ +∞
a
φ(x) dx bestimmt divergent. Schreibweise
+∞
∫
φ(x) dx < +∞.
• Konvergenz:
a
+∞
∫
• Divergenz:
φ(x) dx = +∞.
a
Satz 6.1: (Majorantenkriterium)
Sei f : [a, +∞) → R mit f ∈ R([a, b]) für alle b ∈ [a, +∞) gegeben. Falls dann die
Relation
|f (x)| ≤ φ(x) für alle x ∈ [a, +∞)
∫ +∞
gilt mit einer nichtnegativen Funktion φ : [0, +∞) → R, die a φ(x) dx < +∞
∫ +∞
erfüllt, dann konvergiert das Integral a f (x) dx absolut.
6. UNEIGENTLICHE INTEGRALE
145
Beweis: Sofort klar aus
∫b
∫b
|f (x)| dx ≤
a
φ(x) dx für alle b ∈ [a, +∞)
a
und obigen Bemerkungen.
q.e.d.
Bemerkung: Die Formulierung und den Beweis eines entsprechenden Minorantenkriteriums überlassen wir dem Leser.
∫ +∞ sin x
Beispiel: Wir behaupten: 0
x dx ist konvergent, aber nicht absolut konvergent.
Denn:
• Wegen limx→0+ sinx x = 1 können wir sinx x als auf [0, +∞) stetige Funktion
auffassen. Für beliebige 0 < b < b′ berechnen wir mit partieller Integration
∫b′
′
∫b
sin x
cos x b′
cos x
dx = −
dx.
−
x
x b
x2
b
b
Es folgt also
∫b′
∫b′
sin x 1
1
dx
2 1
3
dx ≤ + ′ +
< + = → 0 (b → +∞).
2
x
b b
x
b
b
b
b
Somit ist
∫ +∞ sin x
0
•
∫ +∞
0
x
b
+∞
∫
0
sin x
x
dx =
π
2
dx konvergent nach obiger Bemerkung 1. Es gilt übrigens
(siehe S. Hildebrandt: Analysis 1 (Springer-Verlag), S. 319 ).
| sinx x | dx ist nicht konvergent. Hierzu beachten wir
∫kπ
sin x dx
x
=
∫νπ k
k
∑
∑
1
sin x dx ≥
x
νπ
ν=1
(ν−1)π
∫π
k
0
Period. ∑ 1
=
νπ
ν=1
ν=1
sin x dx =
∫νπ
| sin x| dx
(ν−1)π
k
2∑1
→ +∞ (k → ∞),
π
ν
ν=1
0
wie behauptet.
Ganz entsprechend erklärt man für eine Funktion f : (−∞, b] → R mit f ∈
R([a, b]) für alle a ∈ (−∞, b] das uneigentliche Integral
∫b
∫b
f (x) dx := lim
f (x) dx,
a→−∞
−∞
a
146
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
falls der Grenzwert existiert. Obige Aussagen lassen sich direkt übertragen.
Sei nun f : R → R eine Funktion mit f ∈ R(I) für alle kompakten Intervalle I ⊂
R.
Falls
dann∫für ein a ∈ R (und damit für alle a ∈ R) die uneigentlichen Integrale
∫a
+∞
f (x) dx existieren, so erklären wir das uneigentliche Integral
−∞ f (x) dx, a
+∞
+∞
∫
∫a
∫
f (x) dx :=
f (x) dx +
f (x) dx.
−∞
−∞
(6.1)
a
Man rechnet leicht nach, dass diese Definition von der Wahl von a ∈ R unabhängig
ist.
∫ +∞
Vorsicht: Die naheliegende Definition des uneigentlichen Integrals −∞ f (x) dx als
Grenzwert
∫R
f (x) dx
lim
R→+∞
−R
liefert i.A. nicht das gleiche Ergebnis: Dieser sogenannte Cauchysche∫ Hauptwert kann
+∞
existieren, ohne dass das in (6.1) erklärte uneigentliche Integral −∞ f (x) dx existiert. Betrachte z.B. f (x) := x: Offenbar gilt
∫R
x dx =
−R
x2 R
= 0,
2 −R
aber
∫R
x dx =
R2 a2
−
→ +∞ (R → +∞),
2
2
x dx =
a2 R 2
−
→ −∞ (R → +∞).
2
2
a
∫a
−R
Beispiele:
1. Wegen arctan′ x =
1
,
1+x2
x ∈ R, haben wir für beliebige a > 0:
∫a
dx
1 + x2
=
a
arctan x0 = arctan a,
dx
1 + x2
=
− arctan(−a) = arctan a.
0
∫0
−a
6. UNEIGENTLICHE INTEGRALE
Wegen arctan a →
π
2
147
(a → +∞) konvergieren also
+∞
∫
−∞
dx
=
1 + x2
+∞
∫
dx
+
1 + x2
0
∫0
−∞
∫ +∞
0
dx
,
1+x2
∫0
dx
−∞ 1+x2
und es folgt
π
π
dx
= + = π.
1 + x2
2
2
2
2. Für beliebige x ∈ R erhält man ex ≥ 1 + x2 > 0 aus der Reihendarstellung der e-Funktion.
2
1
Also folgt 0 < e−x ≤ 1+x
2 . Und nach Beispiel 1 und dem Majorantenkriterium konvergieren
∫ +∞ −x2
∫0
2
−x
e
dx, −∞ e
dx. Also existiert auch das Integral
0
+∞
∫
( √
2
e−x dx = π ).
−∞
Fall II: Unbeschränkte Funktionen
Sei nun f : [a, b) → R, −∞ < a < b < +∞, gegeben und auf jedem kompakten
Teilintervall von [a, b) integrierbar.
Definition 6.2: Wenn der Grenzwert
∫b
∫ξ
f (x) dx := lim
f (x) dx
ξ→b−
a
a
existiert, bezeichnen wir ihn als das uneigentliche Integral von f über [a, b). Das
∫b
∫b
Integral a f (x) dx heißt absolut konvergent, wenn a |f (x)| dx existiert.
∫b
Ganz entsprechend erklären wir das uneigentliche Integral a f (x) dx einer Funk∫b
tion f : (a, b] → R durch den rechtsseitigen Grenzwert limξ→a+ ξ f (x) dx. Ist f nur
auf (a, b) erklärt, müssen beide Grenzwerte betrachtet werden.
Wie in Fall I zieht absolute Konvergenz wieder gewöhnliche Konvergenz nach
sich, und wir haben den Satz 6.1 entsprechenden
Satz 6.2: (Majorantenkriterium)
Für f : [a, b) → R gelte f ∈ R(I) für alle kompakten Intervalle I ⊂ [a, b). Existiert
∫b
dann eine nichtnegative Funktion φ : [a, b) → R mit a φ(x) dx < +∞ so, dass gilt
|f (x)| ≤ φ(x)
dann konvergiert
∫b
a
f (x) dx absolut.
für alle x ∈ [a, b),
148
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beispiele:
∫1
1. Für α ∈ (0, 1) gilt
∫1
ξ
2. Es gilt
∫1
0
dx
0 xα
1
1−α ,
=
denn wir haben
dx
x1−α 1
1
1
=
(1 − ξ 1−α ) →
(ξ → 0+).
=
α
x
1−α ξ
1−α
1−α
√ dx
1−x2
= π2 , denn
∫ξ
√
0
ξ
dx
π
= arcsin x0 = arcsin ξ → (ξ → 1−).
2
2
1−x
Bemerkung: Ist f : [a, b] \ {c} → R mit einem c ∈ (a, b) gegeben, d.h. f hat in einem
inneren Punkt eine singuläre Stelle“, so setzen wir
”
∫b
∫c
f (x) dx :=
a
∫b
f (x) dx +
a
f (x) dx,
c
∫c
∫b
wenn die uneigentlichen Integrale a f (x) dx, c f (x) dx existieren. Auch hier gibt
es ein Hauptwertphänomen“: Der Grenzwert
”
( ∫c−ε
)
∫b
lim
f (x) dx +
f (x) dx
(6.2)
ε→0+
a
c+ε
∫b
kann existieren, ohne dass a f (x) dx existiert.
∫1
Beispiel: −1 dx
x existiert nicht, wohl aber der Grenzwert (6.2).
Wir wollen schließlich noch ein interessantes Kriterium für Reihenkonvergenz angeben:
Satz 6.3 : (Riemannsches Integralkriterium)
Sei f : [1, +∞) → R eine monoton fallende,
∑nichtnegative Funktion mit f ∈ R(I) für alle kompakten
I ⊂ [1, +∞). Dann konvergiert die Reihe ∞
n=1 an mit den Gliedern an := f (n) genau dann, wenn
∫ +∞
das uneigentliche Integral 1 f (x) dx konvergiert.
Beweis: Betrachten wir zu N ∈ N die äquidistante Zerlegung Z = {x0 , x1 , . . . , xN } := {1, 2, . . . , N +
1}, so hat f die Untersumme
S Z (f ) =
N
∑
j=1
(inf f )∆xj =
Ij
N
∑
j=1
f (xj ) · 1 =
N
∑
j=1
aj+1
7. DIE TAYLORSCHE FORMEL
und die Obersumme
S Z (f ) =
149
N
N
∑
∑
(sup f )∆xj =
aj .
j=1
Es folgt somit
N
+1
∑
j=1
N
∫+1
aj ≤
f (x) dx ≤
j=2
∫ +∞
Ij
N
∑
aj .
j=1
1
∑ +1
f (x) dx existiert, ist { N
aj }N beschränkt und die Konvergenz der Reihe folgt
∫b
∑∞j=2
aus der Monotonie. Falls umgekehrt j=1 aj konvergiert, ist 1 f (x) dx gleichmäßig beschränkt für
∫ +∞
alle b ≥ 1 und es folgt die Existenz von 1 f (x) dx.
q.e.d.
Falls also
1
Beispiel: Für α > 1 berechnen wir
+∞
∫
1
1
dx
x1−α b
= lim
.
=
α
b→+∞ 1 − α 1
x
α−1
Nach Satz 6.3 konvergiert somit die Reihe
∞
∑
1
α
n
n=1
7
für alle α > 1.
Die Taylorsche Formel
Die Taylorformel liefert eine Polynomapproximation einer vorgegebenen, hinreichend
glatten Funktion zusammen mit einer Abschätzung des Fehlerterms.
∑n
k
Motivation: Es sei f (x) =
k=0 ak x , x ∈ R, ein Polynom n-ten Grades mit
a0 , . . . , an ∈ C. Dann können wir f mittels der Binomischen Formel um ein beliebiges x0 ∈ R entwickeln:
k ( )
∑
k
k
k
x = ((x − x0 ) + x0 ) =
(x − x0 )l xk−l
0 ,
l
l=0
also nach Einsetzen
f (x) =
n
∑
ck (x − x0 )k ,
x ∈ R,
(7.1)
k=0
mit (i.A. von x0 abhängigen) Koeffizienten c0 , . . . , cn ∈ C. Für die Ableitungen im
Punkt x0 folgt dann
f (k) (x0 ) = k! ck , k = 0, . . . , n.
Wir können also (7.1) schreiben als
f (x) =
n
∑
f (k) (x0 )
k=0
k!
(x − x0 )k ,
x ∈ R.
150
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Für eine beliebige Funktion f ∈ C n (I) auf einem Intervall I ⊂ R erklären wir
nun das n-te Taylorpolynom pn (x) an der Stelle x0 ∈ I:
pn (x) :=
n
∑
f (k) (x0 )
k=0
k!
(x − x0 )k ,
x ∈ I.
(7.2)
Ist f ein Polynom n-ten Grades, so stimmen f und pn überein. I.a. ist dies nicht der
Fall und wir nennen
Rn (x) := f (x) − pn (x), x ∈ I,
(7.3)
das n-te Restglied. Offenbar gilt dann die Taylorsche Formel
f (x) = pn (x) + Rn (x),
x ∈ I,
(7.4)
die wir jetzt durch Untersuchung des Restglieds mit Sinn erfüllen wollen.
Satz 7.1: Sei f ∈ C n+1 (I) und x0 ∈ I gewählt. Dann gilt die Identität (7.4) mit
dem Taylorpolynom pn , und für das Restglied Rn haben wir die Darstellung
1
Rn (x) =
n!
∫x
(x − t)n f (n+1) (t) dt.
(7.5)
x0
Beweis: Vollständige Induktion über n:
• n = 0: Der Fundamentalsatz der Differential- und Integralrechnung, Satz 5.3,
liefert
∫x
f (x) = f (x0 ) + f ′ (t) dt für alle x ∈ I,
x0
also die Behauptung.
• n → n + 1: Dann haben wir
Rn (x)
(IV)
=
1
n!
∫x
∫x
(x − t) f
n (n+1)
(t) dt = −
x0
[
(x − t)n+1 ]x
Part. Int.
=
− f (n+1) (t)
+
(n + 1)! x0
f (n+1) (t)
d [ (x − t)n+1 ]
dt
dt (n + 1)!
x0
∫x
f (n+2) (t)
(x − t)n+1
dt
(n + 1)!
x0
=
f (n+1) (x0 )
1
(x − x0 )n+1 +
(n + 1)!
(n + 1)!
∫x
(x − t)n+1 f (n+2) (t) dt,
x0
7. DIE TAYLORSCHE FORMEL
151
also
1
f (x) = pn (x) + Rn (x) = pn+1 (x) +
(n + 1)!
(IV )
∫x
(x − t)n+1 f (n+2) (t) dt,
x0
wie behauptet.
q.e.d.
Satz 7.2: (Lagrange Restgliedformel)
Unter den Voraussetzungen von Satz 7.1 gibt es zu jedem x ∈ I ein ϑ ∈ (0, 1), so
dass das Restglied geschrieben werden kann als
Rn (x) =
f (n+1) (x0 + ϑ(x − x0 ))
(x − x0 )n+1 ,
(n + 1)!
x ∈ I.
(7.6)
Beweis: Für x = x0 ist nichts zu zeigen, sei x > x0 . Nach dem Mittelwertsatz der
Integralrechnung, Satz 4.6, gibt es ein ξ ∈ (x0 , x), so dass gilt:
Rn (x)
(7.5)
∫x
=
x0
=
∫x
(x − t)n (n+1)
f
(t) dt = f (n+1) (ξ)
n!
−f (n+1) (ξ)
t)n+1 x
(x − t)n
dt
n!
x0
(x −
=
(n + 1)! x0
f (n+1) (ξ)
(n + 1)!
(x − x0 )n+1 .
ξ−x0
Die Behauptung folgt mit ϑ := x−x
∈ (0, 1). Im Falle x < x0 verwendete man
0
zunächst Definition 4.5 und verfahre anschließend wie oben.
q.e.d.
Wir wollen eine sehr gebräuchliche, qualitative Schreibweise für das Ergebnis von
Satz 7.2 einführen, die auf E. Landau zurückgeht: Hierzu sei M ⊂ Rn eine beliebige
Menge, x0 ∈ M und ψ : M → R eine Funktion mit ψ(x) ̸= 0 für x ∈ (M ∩ Br (x0 )) \
{x0 } mit einem r > 0.
Definition 7.1:
(i) Eine Funktion f : M → Rd hat die Ordnung groß O von ψ(x) für x → x0“,
”
wenn gilt
f (x) ψ(x) ≤ const für alle x ∈ (M ∩ Bε (x0 )) \ {x0 }
mit einem ε ∈ (0, r). Wir schreiben dann
f (x) = O(ψ(x))
für x → x0 .
152
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
(ii) f hat die Ordnung klein o von ψ(x) für x → x0“, wenn sogar
”
f (x)
lim
= 0.
x→x0 ψ(x)
erfüllt ist. Dann schreiben wir
f (x) = o(ψ(x))
für x → x0 .
Bemerkung: Offenbar impliziert f (x) = o(ψ(x)) die Relation f (x) = O(ψ(x)) für
x → x0 . Aus der Darstellung (7.6) erhalten wir nun die
Folgerung 7.1: (Qualitative Taylorformel)
Ist f ∈ C n (I) und x0 ∈ I gewählt, so gilt
f (x) = pn (x) + o(|x − x0 |n )
für x → x0 .
(7.7)
Beweis: Wir wenden Satz 7.2 mit n − 1 an und erhalten
f (n) (x0 + ϑ(x − x0 ))
(x − x0 )n
n!
f (n) (x0 + ϑ(x − x0 )) − f (n) (x0 )
(x − x0 )n
= pn (x) +
n!
f (x) = pn−1 (x) +
für x ∈ I
mit einem ϑ = ϑ(x) ∈ (0, 1). Wegen f (n) (x0 + ϑ(x − x0 )) → f (n) (x0 ) für x → x0
ergibt sich also die Behauptung (7.7).
q.e.d.
Beispiel: Für x > −1 betrachten wir f (x) := (1 + x)α , α ∈ R \ {0}. Es folgt dann induktiv
f (k) (x) = α(α − 1) . . . (α − k + 1)(1 + x)α−k
für beliebiges k ∈ N, und mit der Abkürzung
( )
k
∏
α
α−l+1
:=
(allgemeiner Binomialkoeffizient)
k
l
l=1
erhalten wir die Relation
f (k) (x) = k!
( )
α
(1 + x)α−k , x > −1, k ∈ N.
k
Einsetzen in die Taylorformel liefert also bei Entwicklung um x0 = 0:
( )
n
∑
α k
α
x + Rn (x), x > −1, n ∈ N,
(1 + x) =
k
(7.8)
k=0
und Satz 7.1 entnehmen wir
(
α
Rn (x) = (n + 1)
n+1
) ∫x
(x − t)n (1 + t)α−n−1 dt,
0
x > −1,
n ∈ N.
(7.9)
7. DIE TAYLORSCHE FORMEL
153
Für eine Funktion f ∈ C ∞ (I) liegt es nahe, durch den Grenzübergang n → ∞
zur Reihendarstellung
f (x) =
∞
∑
f (k) (x0 )
k!
k=0
(x − x0 )k ,
x ∈ I,
(7.10)
überzugehen. Die rechte Seite in (7.10) heißt die Taylorreihe von f in x0 , falls sie
konvergiert. Relation (7.10) ergibt sich aus der Taylorformel (7.4), wenn gilt
lim Rn (x) = 0
n→∞
Beispiel: Die Funktion
{
f (x) :=
für alle x ∈ I.
(7.11)
exp(− x12 ), x ̸= 0,
0,
x=0
gehört zur Klasse C ∞ (R) und erfüllt f (k) (0) = 0 für alle k ∈ N0 . Für die Taylorreihe
bei x0 = 0 gilt also
∞
∑
f (k) (0)
k=0
k!
xk = 0 ̸= f (x)
für x ̸= 0.
Relation (7.10) gilt also nicht für jedes f ∈ C ∞ (R).
Definition 7.2: Eine Funktion f ∈ C ∞ (I) heißt reellanalytisch, wenn es zu jedem
x0 ∈ I ein δ > 0 so gibt, dass die Taylorreihe in I ∩ (x0 − δ, x0 + δ) konvergiert und
dort mit f übereinstimmt, d.h. (7.10) gilt in I ∩ (x0 − δ, x0 + δ).
Wir geben nun zwei hinreichende Bedingungen an, die gewährleisten, dass eine
Funktion f ∈ C ∞ (I) reellanalytisch ist:
Satz 7.3: Es sei f ∈ C ∞ (I) gegeben.
(i) Existieren M, r > 0 mit der Eigenschaft
|f (n) (x)| ≤ n!M r−n
für alle x ∈ I, n ∈ N,
dann gilt (7.10) in I ∩ (x0 − δ, x0 + δ) für alle x0 ∈ I und δ ∈ (0, r). Also ist
f reellanalytisch.
(ii) Existieren M, Q > 0 mit der Eigenschaft
|f (n) (x)| ≤ M Qn
für alle x ∈ I, n ∈ N,
so gilt (7.10) mit beliebigem x0 ∈ I auf ganz I, und f ist reellanalytisch.
154
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Beweis:
(i) Für x ∈ I ∩ (x0 − δ, x0 + δ) gilt (7.11), denn
(n+1) (
)
( δ )n+1
x0 + ϑ(x − x0 ) (7.6) f
|Rn (x)| =
|x − x0 |n+1 ≤ M
→ 0 (n → ∞).
(n + 1)!
r
Also folgt (7.10) für x ∈ I ∩ (x0 − δ, x0 + δ) aus der Taylorformel (7.4).
(ii) Hier schätzen wir ausgehend von (7.6) ab:
|Rn (x)| ≤ M
denn es gilt lim
n→∞
(Q|x − x0 |)n+1
→ 0 (n → ∞)
(n + 1)!
für alle x ∈ I,
bn
= 0 für jedes b ∈ R.
n!
q.e.d.
Bemerkung: Ist f ∈ C ∞ (I) auf I = (−r, r) definiert durch die Potenzreihe
f (x) :=
∞
∑
ak xk ,
k=0
1 (k)
so folgt ak = k!
f (0). Dies entnehmen wir sofort Folgerung 1.2. Dort haben wir
nämlich gesehen
f
(n)
(x) =
∞
∑
k(k − 1) . . . (k − n + 1)ak xk−n
auf (−r, r).
k=n
Ist also eine Funktion f ∈ C ∞ (I) durch eine Potenzreihe (um x0 = 0) gegeben,
so stimmt diese notwendig mit ihrer Taylorreihe (um x0 = 0) überein; siehe das
folgende Beispiel 1.
Beispiele:
1. Durch
∞
∑
xk
k=0
k!
,
∞
∑
k=0
x2k+1
(−1)
,
(2k + 1)!
k
∞
∑
k=0
(−1)k
x2k
,
(2k)!
x ∈ R,
sind die Taylorreihen um x0 = 0 von exp, sin bzw. cos gegeben.
2. Wir betrachten wieder die Funktion f (x) = (1 + x)α . Man kann zeigen, dass das zugehörige
Restglied (7.9) für |x| < 1 gegen 0 konvergiert (siehe z.B. O. Foster: Analysis 1, ViewegVerlag, § 22). Also haben wir die Darstellung
( )
∞
∑
α k
α
(1 + x) =
x , x ∈ (−1, 1).
k
k=0
Die Taylorreihe auf der rechten
( ) Seite heißt Binomialreihe. Für α = N ∈ N bricht die Reihe an
der N -ten Stelle ab wegen N
= 0 für k > N . Dann erhält man den bekannten Binomischen
k
Satz.
7. DIE TAYLORSCHE FORMEL
155
3. Die Logarithmus-Reihe: Wir betrachten f (x) := log(1 + x), x > −1, und beachten
∑
1
=
(−1)k xk
1+x
∞
f ′ (x) =
für x ∈ (−1, 1).
k=0
Satz 5.3 liefert also
∫x
f (x) =
dt
=
1+t
]
∫x [ ∑
∞
k k
(−1) t dt
für x ∈ (−1, 1).
k=0
0
0
∑
k k
Da
für t ∈ [−r, r] mit beliebigem r ∈ (0, 1) gleichmäßig konvergiert, liefert
k (−1) t
Satz 5.6:
∫x
log(1 + x)
lim
=
n→∞
0
=
=
[∑
]
]
∫x [ ∑
n
n
(−1)k tk dt = lim
(−1)k tk dt
n→∞
k=0
0
k=0
[∑
]
∫x
n
k
lim
(−1)
tk dt
n→∞
k=0
0
∞
∞
∑
∑
(−1)k k
xk+1
= −
x
(−1)k
k+1
k
k=0
für x ∈ [−r, r].
k=1
Da r ∈ (0, 1) beliebig war, haben wir also
log(1 + x) = −
∞
∑
(−1)k k
x ,
k
x ∈ (−1, 1).
(7.12)
k=1
Wir wollen zeigen, dass (7.12) auch für x = 1 richtig bleibt m.H. des folgenden
Satz 7.4 : (Abelscher Stetigkeitssatz)
Sei {ak }k=0,1,2,... ⊂ R eine Zahlenfolge, für die
∞
∑
ak konvergiere. Dann folgt
k=0
∞
∑
ak = lim
x→1−
k=0
∞
∑
ak xk .
k=0
Also können wir in (7.12) zur Grenze x → 1− übergehen, denn die alternierende harmoni∞
∑
(−1)k
sche Reihe
konvergiert bekanntlich. Wir erhalten dann die bereits in Kap. 1, § 8
k
k=1
angekündigte Summenformel der alternierenden harmonischen Reihe
∞
∑
(−1)k
= − lim log(1 + x) = − log 2.
x→1−
k
k=1
Beweis von Satz 7.4: Setzen wir sk :=
k
∑
al , k ∈ N0 , so folgt leicht mit vollständiger Induk-
l=0
tion:
n
∑
k=0
ak xk = sn xn + (1 − x)
n−1
∑
k=0
sk xk ,
n ∈ N.
(7.13)
156
KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG
∑
k
Für |x| < 1 konvergiert die Potenzreihe f (x) := ∞
k=0 ak x absolut nach Satz 9.2 aus Kap. 1.
n
Da auch sn x → 0 (n → ∞) gilt, können wir in (7.13) zur Grenze n → ∞ übergehen und
erhalten:
(∑
)
n
∞
∑
k
f (x) = lim
ak x
= (1 − x)
sk xk , |x| < 1.
n→∞
Wir setzen noch s :=
∞
∑
k=0
k=0
ak . Wir wählen ε > 0 beliebig und haben zu zeigen, dass ein
k=0
δ = δ(ε) > 0 existiert mit
|f (x) − s| < ε
für alle x ∈ (1 − δ, 1).
Zunächst gibt es ein N = N (ε) ∈ N mit der Eigenschaft
|sk − s| <
Beachten wir
∞
∑
xk =
k=0
so folgt
1
1−x
ε
2
für alle k > N.
bzw.
(1 − x)
∞
∑
xk = 1,
k=0
∞
∞
∑
∑
ε
ε
k
(1 − x)
(s
−
s)x
<
(1
−
x)
xk = ,
k
2
2
k=N +1
x ∈ [0, 1).
k=0
Wählen wir nun δ = δ(ε) > 0 so klein, dass
δ
N
∑
|sk − s| <
k=0
ε
2
ausfällt, so erhalten wir schließlich
∞
∞
∞
∑
∑
∑
|f (x) − s| = (1 − x)
sk xk − (1 − x)
sxk = (1 − x)
(sk − s)xk k=0
≤
(1 − x)
N
∑
k=0
k=0
k=0
∞
∑
ε
ε
|sk − s| + (1 − x)
(sk − s)xk < + = ε
2
2
k=N +1
für alle x ∈ (1 − δ, 1), wie behauptet.
q.e.d.
4. Die Arcus-Tangens-Reihe: Als Übungsaufgabe zeigt man analog zu Beispiel 3:
arctan x =
∞
∑
(−1)k 2k+1
x
2k + 1
für x ∈ (−1, 1).
k=0
k
∑
Da k (−1)
nach dem Leibnizkriterium konvergiert, liefert der Abelsche Stetigkeitssatz also
2k+1
die ebenfalls in Kap. 1, § 8 angekündigte Summenformel für die Leibnizreihe:
∞
∑
(−1)k
π
= lim arctan x = arctan 1 = .
x→1−
2k + 1
4
k=0
Kapitel 4
Differentialrechnung für
Funktionen mehrerer
Veränderlicher
1
Partielle Ableitungen
Wir haben bereits Funktionen
(
)
f = f (x) = f1 (x1 , . . . , xn ), . . . , fd (x1 , . . . , xn ) : Ω → Rd
auf einer Menge Ω ⊂ Rn für n, d ∈ N kennengelernt und auf Stetigkeitseigenschaften untersucht. Um auch Wachstums- und Krümmungsverhalten solcher Funktionen
mehrerer Veränderlicher beschreiben zu können, benötigen wir einen Ableitungsbegriff. Im Folgenden sei Ω ⊂ Rn immer offen.
Definition 1.1: Sei f : Ω → Rd gegeben und x0 ∈ Ω gewählt. Zu ε > 0 mit Bε (x0 ) ⊂
Ω und j ∈ {1, . . . , n} erklären wir die Funktion
φj (t) := f (x01 , . . . , x0j−1 , t, x0j+1 , . . . , x0n ),
t ∈ (x0j − ε, x0j + ε).
Wenn dann φj an der Stelle t = x0j differenzierbar ist, so heißt f in x0 partiell
differenzierbar nach xj und wir schreiben
Dj f (x0 ) := φ′j (x0j ).
Bemerkungen:
1. Alternative Schreibweisen sind
Dj f =
∂
∂f
f=
= fxj .
∂xj
∂xj
157
158
KAPITEL 4. DIFFERENTIALRECHNUNG
2. Ist f in x0 ∈ Ω nach xj differenzierbar, so gilt offenbar
(j)
Dj f (x0 ) = lim ∆t f (x0 )
t→0
mit dem j-ten Differenzenquotienten: Ist ej der j-te Standardeinheitsvektor,
(j)
so ist ∆t f (x0 ) erklärt als
(j)
)
1(
f (x0 + tej ) − f (x0 )
t
)
1(
f (x01 , . . . , x0j−1 , x0j + t, x0j+1 , . . . , x0n ) − f (x01 , . . . , x0j , . . . , x0n )
=
t
∆t f (x0 ) :=
für t ∈ (−ε, 0) ∪ (0, ε).
3. Eine Funktion f = (f1 , . . . , fd ) : Ω → Rd ist genau dann in x0 ∈ Ω nach xj
differenzierbar, wenn f1 , . . . , fd dort nach xj differenzierbar sind. Es gilt dann
(
)
Dj f (x0 ) = Dj f1 (x0 ), . . . , Dj fd (x0 ) .
Definition 1.2: Falls für f : Ω → Rd die partiellen Ableitungen D1 f (x), . . . , Dn f (x)
für alle x ∈ Ω ⊂ Rn existieren und stetig sind, so heißt f (einmal) stetig differenzierbar und wir schreiben f ∈ C 1 (Ω, Rd ). Für d = 1 schreiben wir kurz C 1 (Ω) :=
C 1 (Ω, R) und für d = 2 identifizieren wir wieder C 1 (Ω, C) := C 1 (Ω, R2 ).
Satz 1.1: Jede Funktion f ∈ C 1 (Ω, Rd ) ist stetig in Ω, d.h. wir haben die Inklusion
C 1 (Ω, Rd ) ⊂ C 0 (Ω, Rd ).
Beweis: Indem wir jede Komponente einzeln betrachten, genügt es den Fall d = 1
zu untersuchen.
Sei nun x0 ∈ Ω beliebig gewählt, so gibt es ein ε > 0 mit Bε (x0 ) ⊂ Ω. Zu
beliebigem x ∈ Bε (x0 ) schreiben wir Ij für die abgeschlossen Intervalle zwischen x0j
und xj mit j = 1, . . . , n (also Ij = [x0j , xj ] für x0j ≤ xj , sonst Ij = [xj , x0j ]). Die
Funktionen
φ1 (t) := f (t, x02 , . . . , x0n ),
φ2 (t) :=
..
.
t ∈ I1 ,
f (x1 , t, x03 , . . . , x0n ),
φn (t) := f (x1 , . . . , xn−1 , t),
t ∈ I2 ,
t ∈ In ,
1. PARTIELLE ABLEITUNGEN
159
sind nun differenzierbar in Ij und damit dort auch stetig nach Folgerung 1.1 aus
Kap. 3. Außerdem gilt
f (x0 ) − f (x) = φ1 (x01 ) − φn (xn )
= [φ1 (x01 ) − φ1 (x1 )] + [φ2 (x02 ) − φ2 (x2 )] + . . .+ [φn (x0n ) − φn (xn )]
=
n
∑
[φj (x0j ) − φj (xj )].
j=1
(1.1)
Nach dem Mittelwertsatz, Satz 2.3 in Kap. 3, gibt es zu jedem j ∈ {1, . . . , n} ein
ξj ∈ int Ij mit der Eigenschaft
φj (x0j ) − φj (xj ) = φ′j (ξj )(x0j − xj ) =
)
∂ (
f x1 , . . . , xj−1 , ξj , x0j+1 , . . . , x0n (x0j − xj ),
∂xj
so dass Einsetzen in (1.1) liefert
f (x0 ) − f (x) =
n
∑
)
∂ (
f x1 , . . . , xj−1 , ξj , x0j+1 , . . . , x0n (x0j − xj ).
∂xj
(1.2)
j=1
Schließlich bemerken wir noch, dass ein M ≥ 0 existiert mit
∂
f (y) ≤ M für alle y ∈ Bε (x0 ), j = 1, . . . , n,
∂xj
∂f
∂f
da die partiellen Ableitungen ∂x
, . . . , ∂x
in Ω stetig und damit in der kompakten
n
1
0
Teilmenge Bε (x ) ⊂ Ω beschränkt sind. Aus Formel (1.2) erhalten wir also:
|f (x0 ) − f (x)| ≤ M
n
∑
|x0j − xj | → 0 (x → x0 ),
j=1
d.h. f ist stetig in Ω.
q.e.d.
Bemerkung: Produkt-, Quotienten- und Linearitätsregel für differenzierbare Funktionen einer Veränderlichen übertragen sich sofort auf die partiellen Ableitungen;
insbesondere ist C 1 (Ω, Rd ) ein linearer Raum. Die Kettenregel erhält folgendes Gesicht:
Satz 1.2: (Kettenregel)
Seien m, n, d ∈ N, offene Mengen Ω ⊂ Rn , Θ ⊂ Rm und Funktionen f = f (x) ∈
C 1 (Ω, Rm ) und g = g(y) ∈ C 1 (Θ, Rd ) mit f (Ω) ⊂ Θ gegeben. Dann gehört auch die
Funktion h := g ◦ f : Ω → Rd zur Klasse C 1 (Ω, Rd ) und es gilt
∑ ∂g
∂h
∂fl
(x) =
(f (x))
(x)
∂xj
∂yl
∂xj
m
l=1
für alle x ∈ Ω, j = 1, . . . , n.
(1.3)
160
KAPITEL 4. DIFFERENTIALRECHNUNG
Beweis: Können wir zeigen, dass h in jedem Punkt x ∈ Ω nach x1 , . . . , xn partiell differenzierbar ist
und dass (1.3) gilt, so folgt auch sofort h ∈ C 1 (Ω, Rd ). Außerdem können wir uns (wie im Beweis
von Satz 1.1) wieder auf den Fall d = 1 beschränken, in dem wir jede Komponente h1 , . . . , hd von h
getrennt betrachten.
Wir wählen x0 ∈ Ω fest und setzen y 0 := f (x0 ) ∈ Θ. Dann gibt es ε, δ > 0 mit Bε (x0 ) ⊂ Ω,
Bδ (y 0 ) ⊂ Θ. Und da f ∈ C 1 (Ω, Rm ) nach Satz 1.1 stetig ist, können wir ε > 0 so klein wählen, dass
f (Bε (x0 )) ⊂ Bδ (y 0 ) erfüllt ist.
Für beliebiges j ∈ {1, . . . , n} sei s ∈ R mit |s| < ε gewählt und
x := x0 + sej = (x01 , . . . , x0j−1 , x0j + s, x0j+1 , . . . , x0n )
gesetzt; ej ist wieder der j-te Standardeinheitsvektor. Mit y := f (x) ∈ Bδ (y0 ) erklären wir
0
),
φ1 (t) := g(t, y20 , . . . , ym
t ∈ I1 ,
0
),
φ2 (t) := g(y1 , t, y30 , . . . , ym
..
.
t ∈ I2 ,
φm (t) := g(y1 , . . . , ym−1 , t),
t ∈ Im ,
yl0
wobei Il das abgeschlossene Intervall zwischen
und yl bezeichne für l = 1, . . . , m. Wie im Beweis
von Satz 1.1 sehen wir
m
∑
[
]
h(x0 ) − h(x) = g(y 0 ) − g(y) =
φl (yl0 ) − φl (yl )
l=1
m
∑
∂
0
0
=
g(y1 , . . . , yl−1 , ξl , yl+1
, . . . , ym
)(yl0 − yl )
∂yl
l=1
m
∑
)(
)
∂ (
=
g f1 (x), . . . , fl−1 (x), ξl , fl+1 (x0 ), . . . , fm (x0 ) fl (x0 ) − fl (x) ,
∂yl
l=1
wobei die Zwischenstellen ξl zwischen yl0 und yl liegen, d.h. es gilt insbesondere |ξl −yl0 | ≤ |yl −yl0 | →
0 (y → y 0 ) für l = 1, . . . , m. Nach Division durch s ∈ (−ε, ε) \ {0} und Multiplikation mit −1 folgt
nun
m
∑
)
∂ (
0
∆s(j) h(x0 ) =
g f1 (x), . . . , fl−1 (x), ξl , fl+1 (x0 ), . . . , fm (x0 ) ∆(j)
(1.4)
s fl (x ).
∂yl
l=1
(j)
∂fl
(x0 ).
Für s → 0 gilt y = f (x) → f (x0 ) = y 0 , also auch ξl → fl (x0 ), und natürlich ∆s fl (x0 ) → ∂x
j
Somit existiert der Grenzwert für s → 0 auf der rechten Seite von (1.4) und folglich auch auf der
linken Seite. Es folgt
m
∑
∂h 0
∂g
∂fl 0
(x ) =
(f (x0 ))
(x )
∂xj
∂yl
∂xj
l=1
für beliebiges x0 , also die Behauptung.
q.e.d.
Bezeichnungen:
1. Für f ∈ C 1 (Ω), Ω ⊂ Rn , erklären wir den Gradienten grad f : Ω → Rn ∈
C 0 (Ω, Rn ) als das Vektorfeld
(
)
grad f (x) := D1 f (x), . . . , Dn f (x) .
Mit dem formal eingeführten Nabla-Operator oder Nabla-Vektor
∇ := (D1 , . . . , Dn )
1. PARTIELLE ABLEITUNGEN
161
haben wir dann
grad f = ∇f.
Formal ist also grad f das Produkt aus dem Vektor ∇ und der skalaren Funktion f .
Wenn in Satz 1.2 d = 1 gilt, d.h. g und h skalare Funktionen sind, liest sich
(1.3) als
⟨
⟩
∂h
∂f
(x) = ∇g(f (x)),
(x) , x ∈ Ω,
∂xj
∂xj
wobei ∇g = grad g als Gradient bez. y aufzufassen ist.
2. Für f = (f1 , . . . , fn ) ∈ C 1 (Ω, Rn ), Ω ⊂ Rn , erklären wir die Divergenz div f :
Ω → R ∈ C 0 (Ω) gemäß
div f (x) := D1 f1 (x) + . . . + Dn fn (x) =
n
∑
Dj fj (x).
j=1
Mit Hilfe des Nabla-Operators können wir div f formal auch als Skalarprodukt
zwischen den Vektoren ∇ und f schreiben:
div f = ⟨∇, f ⟩.
Falls n = 3 gilt, erklären wir auch die Rotation rot f : Ω → R3 ∈ C 0 (Ω, R3 )
gemäß
)
(
rot f := D2 f3 − D3 f2 , D3 f1 − D1 f3 , D1 f2 − D2 f1 = ∇ × f.
3. Für eine Funktion f = (f1 , . . . , fd ) ∈ C 1 (Ω, Rd ) erklären wir die Jacobimatrix
oder Funktionalmatrix

 

D1 f1 (x) . . . Dn f1 (x)
grad f1 (x)

 

..
..
..
..
Df (x) := 
=
.
.
.
.
.
D1 fd (x) . . . Dn fd (x)
grad fd (x)
Insbesondere für d = 1 haben wir also Df = grad f = ∇f .
Für beliebiges d ∈ N lässt sich nun Formel (1.3) zusammenfassen zu
Dh(x) = Dg(f (x)) ◦ Df (x),
x ∈ Ω.
(1.5)
Dabei beziehen sich die Ableitungen bei h und f auf x und bei g auf y ∈ Θ ⊃
f (Ω), weshalb man auch manchmal zur Verdeutlichung
Dx h(x) = Dy g(f (x)) ◦ Dx f (x)
162
KAPITEL 4. DIFFERENTIALRECHNUNG
schreibt. Exakter wäre für Dg(f (x)) eigentlich eine Schreibweise
Dg(f (x)) = ((Dg) ◦ f )(x),
d.h. man berechnet zunächst die Jacobimatrix von g und setzt dann f ein. Im
Gegensatz dazu ist
Dh(x) = (D(g ◦ f ))(x)
zu berechnen, in dem man zunächst g ◦ f bildet und vom Ergebnis die Jacobimatrix bestimmt. Die kurze Schreibweise in (1.5) ist aber gebräuchlich, da sie
deutlich leichter zu lesen ist.
4. Schließlich ist für f ∈ C 1 (Ω, Rn ) die der quadratischen Matrix Df zugeordnete
Determinante, die sogenannte Jacobi- oder Funktionaldeterminante
D1 f1 (x) . . . Dn f1 (x)
.
.
.
.
.
.
Jf := det(Df ) = ,
.
.
.
D1 fd (x) . . . Dn fd (x)
von immenser Bedeutung. Falls in Satz 1.2 gerade m = n = d gilt, also Df , Dg
und Dh quadratische Matrizen sind, entnehmen wir (1.5) und der Produktregel
für Determinanten:
Jh (x) = Jg (f (x))Jf (x),
x ∈ Ω.
(1.6)
Bevor wir einige Beispiele angeben, wollen wir noch eine direkte Folgerung der
Kettenregel für invertierbare C 1 -Abbildungen notieren. Hierzu benötigen wir noch
die
Definition 1.3: Zu zwei offenen Mengen Ω, Θ ⊂ Rn heißt eine Abbildung f : Ω →
Rn ein Diffeomorphismus (der Klasse C 1 ) von Ω auf Θ, wenn gilt
• f bildet Ω bijektiv auf Θ ab.
• f ∈ C 1 (Ω, Rn ) und f −1 ∈ C 1 (Θ, Rn ).
Wir schreiben dann auch f : Ω → Θ.
Bemerkung: Ein Diffeomorphismus liefert also eine 1-1-Zuordnung der Punkte von
Ω und Θ, die zusammen mit ihrer Inversen stetig differenzierbar ist. Wenn f Diffeomorphismus von Ω auf Θ ist, so ist f −1 offenbar Diffeomorphismus von Θ auf Ω.
Diffeomorphismen werden auch als Transformationen bezeichnet und spielen eine
zentrale Rolle in der Analysis.
1. PARTIELLE ABLEITUNGEN
163
Folgerung 1.1: Ist f : Ω → Θ ein Diffeomorphismus von Ω ⊂ Rn auf Θ ⊂ Rn , so
ist Df invertierbar auf Ω und es gelten
Df −1 (f (x)) = (Df (x))−1 ,
Jf −1 (f (x)) =
1
,
Jf (x)
x ∈ Ω.
Beweis: Wir setzen g := f −1 : Θ → Ω und beachten h(x) := (g ◦ f )(x) ≡ x auf Ω.
Wegen Dh(x) = E (E ⊂ Mat(n, n) ist die Einheitsmatrix) liefert also die Kettenregel
(1.5):
E = Dg(f (x)) ◦ Df (x) in Ω,
d.h. Df (x) ist invertierbar mit der Inversen Dg(f (x)), wie behauptet. Die zweite
Relation ergibt sich nun sofort aus det E = 1 und Formel (1.6).
q.e.d.
Beispiele:
√
1. Die Abstandsfunktion r : Rn → R erklärt durch r(x) := |x| = x21 + . . . + x2n
gehört zur Klasse C 1 (Rn \ {0}) ∩ C 0 (Rn ). Für die Ableitung nach xj erhalten
wir
xj
1
∂
r(x) = √ 2
· 2xj =
2
∂xj
|x|
2 x1 + . . . + xn
bzw.
∇r(x) = grad r(x) =
x
|x|
für x ̸= 0.
2. (Polarkoordinaten): Für beliebiges z ∈ C haben wir eine Darstellung z = reiφ
mit r = |z| ≥ 0, φ ∈ R. In Real- und Imaginärteil zerlegt, heißt das
x = r cos φ =: f (r, φ),
y = r sin φ =: g(r, φ).
f und g sind aus C 1 ((0, +∞) × R). Für die Abbildung h := (f, g) : (0, +∞) ×
R → R2 folgt
(
) (
)
fr (r, φ) fφ (r, φ)
cos φ −r sin φ
Dh(r, φ) =
=
,
gr (r, φ) gφ (r, φ)
sin φ r cos φ
und für die Jacobideterminante erhalten wir
Jh (r, φ) = r(cos2 φ + sin2 φ) = r > 0.
Die Umkehrung“ von Folgerung 1.1 gilt also nicht, vgl. jedoch den Umkehrs”
atz, Satz 5.1, unten.
Bisher haben wir nur Ableitungen entlang der Koordinatenlinien erklärt, nämlich
die partiellen Ableitungen. Nun sollen Ableitungen in beliebige Richtungen betrachtet werden:
164
KAPITEL 4. DIFFERENTIALRECHNUNG
Definition 1.4: Sei f : Ω → R gegeben und x ∈ Ω ⊂ Rn gewählt. Zu beliebigem
a ∈ Rn mit |a| = 1 erklären wir dann die Richtungsableitung von f an der Stelle x
in Richtung a gemäß
]
∂f
1[
(x) := lim f (x + ta) − f (x) ,
t→0 t
∂a
falls dieser Grenzwert existiert.
Bemerkungen:
1. Mit dem j-ten Standardeinheitsvektor a = ej haben wir
∂f
(j)
(x) = lim ∆t f (x) = Dj f (x).
t→0
∂ej
Partielle Ableitungen sind also spezielle Richtungsableitungen.
2. Existiert für ein a ∈ S n−1 := {ξ ∈ Rn : |ξ| = 1} die Richtungsableitung
∂f
∂f
∂a (x), so existiert auch ∂(−a) (x) und es gilt
∂f
∂f
(x) = − (x).
∂(−a)
∂a
Satz 1.3: Ist f ∈ C 1 (Ω), so existiert
ren a ∈ S n−1 , und es gilt
∂f
∂a (x)
für alle x ∈ Ω und alle Richtungsvekto-
∑
∂f
(x) = ⟨∇f (x), a⟩ =
Dj f (x)aj .
∂a
n
j=1
Beweis: Zu festem x ∈ Ω existiert ein ε > 0 mit Bε (x) ⊂ Ω. Wir betrachten dann
φ(t) := f (x + ta), t ∈ (−ε, ε), und folgern aus Satz 1.2: φ ∈ C 1 ((−ε, ε)) sowie
φ′ (t) = ⟨∇f (x + ta), a⟩,
t ∈ (−ε, ε).
Insbesondere für t = 0 erhalten wir
φ(t) − φ(0)
∂f
(x) = lim
= φ′ (0) = ⟨∇f (x), a⟩,
t→0
∂a
t
wie behauptet.
q.e.d.
Bemerkung: Die Richtungsableitung ∂f
∂a (x) beschreibt den Anstieg der Funktion f in
x, eingeschränkt auf das Segment {x+ta : t ∈ (−ε, ε)} mit kleinem ε > 0 und einem
a ∈ S n−1 . Dieser ist i.a. für jede Richtung a unterschiedlich groß. Die geometrische
Bedeutung von grad f enthält nun die nachstehende
2. MITTELWERTSATZ UND DIFFERENTIALE
165
Folgerung 1.2: Sei f ∈ C 1 (Ω) und x ∈ Ω mit ∇f (x) ̸= 0 gewählt. Mit ν :=
|∇f (x)|−1 ∇f (x) gilt dann
∂f
∂f
∂f
(x) <
(x) <
(x)
∂(−ν)
∂a
∂ν
für alle a ∈ S n−1 \ {±ν}.
D.h. ∇f (x) zeigt in die Richtung des größten, −∇f (x) in die Richtung des kleinsten
Anstiegs von f in x.
Bemerkung: Falls hingegen ∇f (x) = 0 in einem Punkt x ∈ Ω gilt, verschwinden
nach Satz 1.3 dort alle Richtungsableitungen.
Beweis von Folgerung 1.2: Nach Satz 1.3 und der Cauchy-Schwarzschen Ungleichung, Satz 10.2 in
Kap. 1, haben wir
∂f
(x) = ⟨∇f (x), a⟩ ≤ |∇f (x)| |a| = |∇f (x)|,
∂a
∇f (x)
= ±ν richtig ist.
und Gleichheit tritt genau dann ein, wenn ∇f (x) = λa gilt, d.h. a = ± |∇f
(x)|
Folglich haben wir
−|∇f (x)| <
Beachten wir noch
∂f
(x) < |∇f (x)|
∂a
für alle a ∈ S n−1 \ {±ν}.
⟨
∇f (x) ⟩
∂f
Satz 1.3
(x)
=
∇f (x), ±
= ±|∇f (x)|,
∂(±ν)
|∇f (x)|
so folgt die Behauptung.
q.e.d.
Bemerkung: Der Begriff der Richtungsableitung lässt sich offenbar direkt auf Abbildungen f : Ω → Rd erweitern. Satz 1.3 bleibt gültig, allerdings mit der Darstellung
∂f
(x) = Df (x)a,
∂a
wobei man ∂f
∂a und a als Spaltenvektoren auffasst. Die geometrische Interpretation
aus Folgerung 1.2 verliert aber ihren Sinn.
2
Mittelwertsatz und Differentiale
Als erstes beweisen wir ein Analogon zum Mittelwertsatz der Differentialrechnung
für Funktionen mehrerer Veränderlicher:
Satz 2.1: (Mittelwertsatz)
Es sei Ω ⊂ Rn offen, f ∈ C 1 (Ω) eine skalare Funktion und zwei verschiedene Punkte
x, y ∈ Ω seien gewählt. Für die Verbindungsstrecke
{
}
[x, y] := λx + (1 − λ)y : λ ∈ [0, 1]
166
KAPITEL 4. DIFFERENTIALRECHNUNG
zwischen x und y gelte [x, y] ⊂ Ω. Dann gibt es ein z ∈ (x, y) := [x, y] \ {x, y} mit
der Eigenschaft
f (y) − f (x) = ⟨∇f (z), y − x⟩ =
n
∑
∂f
(z)(yj − xj ).
∂xj
j=1
Beweis: Wir betrachten die Funktion
(
)
φ(t) := f x + t(y − x) ,
t ∈ [0, 1].
Nach Satz 1.2 gilt φ ∈ C 1 ((0, 1)) ∩ C 0 ([0, 1]) und
⟨
⟩
φ′ (t) = ∇f (x + t(y − x)), y − x für alle t ∈ (0, 1).
Andererseits liefert der Mittelwertsatz für Funktionen einer Veränderlichen
φ(1) − φ(0) = φ′ (ξ)
mit einem ξ ∈ (0, 1). Setzen wir z := x + ξ(y − x) ∈ (x, y), so folgt also
f (y) − f (x) = φ(1) − φ(0) = φ′ (ξ) = ⟨∇f (z), y − x⟩,
wie behauptet.
q.e.d.
Für vektorwertige Funktionen erhalten wir eine Art integrale Version“, die
”
häufig sehr hilfreich ist:
Satz 2.2: (Hadamards Lemma)
Sind f ∈ C 1 (Ω, Rd ) und x, y ∈ Ω mit x ̸= y und [x, y] ⊂ Ω gewählt, so folgt
f (y) − f (x) = A ◦ (y − x).
Dabei sind f (y) − f (x), y − x als Spaltenvektoren aufzufassen und die Matrix
∫1
Df (x + t(y − x)) dt
A :=
0
wurde erklärt.
Beweis: Wie im Beweis von Satz 2.1 betrachten wir
(
)
φ(t) := f x + t(y − x) ∈ C 1 ((0, 1), Rd ) ∩ C 0 ([0, 1], Rd ).
2. MITTELWERTSATZ UND DIFFERENTIALE
167
Für die l-te Komponente gilt dann nach dem Fundamentalsatz der Differential- und Integralrechnung, Satz 5.3 in Kap. 3:
∫1
fl (y) − fl (x)
=
φl (1) − φl (0) =
φ′l (t) dt
0
⟨ ∫1
=
⟩
∇fl (x + t(y − x)) dt, y − x ,
l = 1, . . . , d,
0
was gleichbedeutend zur Behauptung ist.
q.e.d.
Für eine Funktion f : I → Rd ∈ C 1 (I, Rd ) auf einem Intervall I ⊂ R gilt
bekanntlich
f ′ ≡ 0 ⇐⇒ f ≡ const auf I.
Um eine Entsprechung für Funktionen mehrerer Veränderlicher zu erhalten, benötigen wir noch die grundlegende
Definition 2.1:
(i) Eine Menge M ⊂ Rn heißt (bogenweise) zusammenhängend, wenn für je zwei
Punkte x, y ∈ M ein stetiger Weg φ ∈ C 0 ([0, 1], Rn ) existiert mit
φ([0, 1]) ⊂ M,
φ(0) = x,
φ(1) = y.
(ii) Eine offene, zusammenhängende Menge im Rn heißt Gebiet und wird i.d.R.
mit G bezeichnet.
Satz 2.3: Für eine Funktion f ∈ C 1 (G, Rd ) auf einem Gebiet G ⊂ Rn gilt
Df ≡ 0 ⇐⇒ f ≡ const
in G.
Beweis: Falls f konstant ist in G, verschwinden offenbar alle partiellen Ableitungen,
d.h. Df ≡ 0 in G. Der Beweis der Umkehrung erfolgt in zwei Schritten:
1. Lokale Konstanz: Sei x ∈ G fixiert und sei ein ε > 0 mit Bε (x) ⊂ G gewählt.
Zu beliebigem y ∈ Bε (x) gilt dann [x, y] ⊂ Bε (x) ⊂ G, und nach dem Hadamardschen Lemma folgt
( ∫1
f (y) − f (x) =
0
also f ≡ const in Bε (x).
)
Df (x + t(y − x)) dt ◦ (y − x) = 0,
168
KAPITEL 4. DIFFERENTIALRECHNUNG
2. Globale Konstanz: Mit einer Kontinuitätsmethode“ zeigen wir nun, dass f
”
tatsächlich in ganz G konstant ist: Sei wieder x ∈ G fixiert. Zu beliebigem y ∈
G betrachten wir den Verbindungsweg φ ∈ C 0 ([0, 1], Rn ) zwischen x = φ(0)
und y = φ(1) sowie die stetige Funktion
F (t) := f (φ(t)),
t ∈ [0, 1].
Wir wählen t∗ ∈ [0, 1] maximal, so dass gilt
F (t) = F (0) für alle t ∈ [0, t∗ ],
d.h. F ist auf [0, t∗ ] konstant mit größtmöglichem t∗ . Wäre nun t∗ < 1. Dann
gibt es ein δ > 0, so dass φ(t) ∈ Bε (φ(t∗ )) ⊂ G mit geeignetem ε > 0 und für
alle t ∈ [t∗ , t∗ + δ) gilt, denn φ ist stetig. Gemäß Teil 1 ist dann aber F ≡ const
auf [t∗ , t∗ + δ), im Widerspruch zur Wahl von t∗ . Also muss doch t∗ = 1 richtig
sein und es folgt insbesondere
f (x) = f (φ(0)) = F (0) = F (1) = f (φ(1)) = f (y),
d.h. f ≡ f (x) = const in G.
q.e.d.
Wir wollen noch einen weiteren Ableitungsbegriff einführen, der geometrisch motiviert ist:
Definition 2.2: Sei Ω ⊂ Rn offen und x ∈ Ω gewählt. Eine Funktion f : Ω → Rd
heißt in x ∈ Ω total differenzierbar, wenn eine lineare Abbildung L : Rn → Rd so
existiert, dass gilt
f (x + h) = f (x) + L(h) + R(h)
für alle h ∈ Ω0 := {h̃ ∈ Rn : x + h̃ ∈ Ω}. (2.1)
Hierbei gelte für das Restglied R = R(h) : Ω0 → Rd die Relation
R(h) = o(|h|)
für h → 0,
R(h)
= 0.
h→0 |h|
d.h. lim
(2.2)
Bemerkungen:
1. Wir können Formel (2.1) mit (2.2) äquivalent schreiben als
f (x + h) = f (x) + L(h) + |h|ε(h)
mit ε = ε(h) : Ω0 → Rd ,
{
indem wir setzen
ε(h) :=
für alle h ∈ Ω0
ε(h) = o(1) für h → 0,
(2.3)
|h|−1 R(h), h ̸= 0
.
0,
h=0
Eine Formel (2.3) entsprechende Darstellung haben wir in Satz 1.1 in Kap. 3 für
Funktionen einer Veränderlichen als äquivalent zur Differenzierbarkeit erkannt.
Wir werden unten sehen, dass die totale Differenzierbarkeit einer Funktion
mehrerer Veränderlicher nicht äquivalent zur partiellen Differenzierbarkeit ist.
2. MITTELWERTSATZ UND DIFFERENTIALE
169
2. Aus (2.1), (2.2) (oder auch (2.3) folgt sofort
lim f (x + h) = f (x),
h→0
d.h. eine in x ∈ Ω total differenzierbare Funktion ist dort auch stetig.
3. Die lineare Abbildung L : Rn → Rd ist durch (2.1), (2.2) bzw. die äquivalente
Relation (2.3) eindeutig bestimmt.
Denn: Gäbe es nämlich ein weiteres L̃ : Rn → Rd und eine Funktion ε̃ : Ω0 → Rd mit
ε̃(h) = o(1) für h → 0, so dass
f (x + h) = f (x) + L̃(h) + |h|ε̃(h)
für alle h ∈ Ω0
gilt, dann liefert Vergleich mit (2.3):
(
)
L(h) − L̃(h) = |h| ε̃(h) − ε(h)
für alle h ∈ Ω0 .
Wir zeigen L(ej ) = L̃(ej ) für alle j = 1, . . . , n mit den j-ten Einheitsvektoren; die Behauptung folgt dann aus der Linearität: Setze L0 := L − L̃ und ε0 := ε̃ − ε. Dann erhalten
wir
L0 (h) = |h|ε0 (h) mit ε0 (h) = o(1) für h → 0.
Zu hinreichend kleinem λ > 0 ist h := λej ∈ Ω0 erfüllt, und es folgt
λL0 (ej ) = L0 (λej ) = |λej |ε0 (λej ) = λε0 (λej )
bzw.
L0 (ej ) = ε0 (λej ) → 0 (λ → 0),
also L0 (ej ) = 0 bzw. L(ej ) = L̃(ej ).
Diese Eindeutigkeit rechtfertigt nun die folgende
Definition 2.3:
(i) Zur in x ∈ Ω total differenzierbaren Abbildung f : Ω → Rd heißt die eindeutig
bestimmte Abbildung L : Rn → Rd aus (2.1) (totales) Differential df (x) von f
an der Stelle x ∈ Ω. Wir schreiben
df (x)(h) = df (x, h) := L(h),
h ∈ Rn .
(ii) Ist f für alle x ∈ Ω total differenzierbar, so heißt f einfach differenzierbar und
df : Ω × Rn → Rd ist das zugehörige Differential.
Der Zusammenhang zwischen totaler und partieller Differenzierbarkeit ist enthalten im folgenden
Satz 2.4: Ist f : Ω → Rd in x ∈ Ω total differenzierbar, so existieren alle partiellen
Ableitungen D1 f (x), . . . , Dn f (x), und es gilt
df (x, h) =
n
∑
j=1
Dj f (x)hj = Df (x)h
für alle h = (h1 , . . . , hn ) ∈ Rn .
(2.4)
170
KAPITEL 4. DIFFERENTIALRECHNUNG
Speziell für d = 1 haben wir also
df (x, h) = ⟨∇f (x), h⟩
für alle h ∈ Rn .
Beweis: Ist ej der j-te Einheitsvektor, so setzen wir h = tej ∈ Ω0 für t ∈ (−ε, ε) mit
hinreichend kleinem ε > 0 in (2.1) ein und erhalten aus (2.2):
(j)
|∆t f (x)
f (x + te ) − f (x)
R(te ) j
j − L(ej )| = − L(ej ) = → 0 (t → 0),
t
t
d.h. wir haben Dj f (x) = L(ej ) = df (x, ej ). Die Linearität von L = df liefert Formel
(2.4).
q.e.d.
Für f ∈ C 1 (Ω) und h ∈ S n−1 = {ξ ∈ Rn : |ξ| = 1} stimmt die rechte Seite in (2.4) mit der Richtungsableitung von f im Punkt x in Richtung h überein.
Allgemeiner und in Analogie zu Satz 2.4 finden wir den
Satz 2.5: Ist f : Ω → Rd in x ∈ Ω total differenzierbar, so existieren alle Richn−1 , und es gilt
tungsableitungen ∂f
∂a (x) für a ∈ S
df (x, a) =
∂f
(x).
∂a
Beweis: Zu festem a ∈ S n−1 setzen wir h = ta ∈ Ω0 , t ∈ (−ε, ε), in (2.1) ein und
folgern aus (2.2):
∂f
(x) = L(a) = df (x, a),
∂a
wie behauptet.
q.e.d.
Geometrische Interpretation: Ist f : Ω → R in x0 ∈ Ω total differenzierbar, so
erklären wir die affin-lineare Funktion
φ(x) := f (x0 ) + df (x0 , x − x0 ) = f (x0 ) + ⟨∇f (x0 ), x − x0 ⟩,
x ∈ Rn .
Der Graph T := graph φ beschreibt eine Hyperebene im Rn+1 – d.h. einen n-dimensionalen affinen Unterraum –, die durch (x0 , f (x0 )) und senkrecht zum Vektor
(
)
ν := − ∇f (x0 ), 1
verläuft. Dabei ist φ und damit T durch die Forderung
f (x) − φ(x) = o(|x − x0 |) für x → x0
eindeutig festgelegt; T approximiert also graph f nahe x0 von erster Ordnung, entsprechend der Tangente bei differenzierbaren Funktionen einer Veränderlichen. T
2. MITTELWERTSATZ UND DIFFERENTIALE
171
heißt daher die Tangentialebene an f (genauer an graph f ) im Punkt x0 . Ferner
wird der senkrechte Vektor ν als Normalenvektor von f in x0 bezeichnet.
In §4 werden wir Approximationen höherer Ordnung durch Taylorpolynome gewinnen.
Die Umkehrung der Sätze 2.4 und 2.5 gilt nicht: Eine Funktion, die in einem
Punkt alle Richtungsableitungen besitzt (und damit auch insbesondere alle partiellen
Ableitungen), muss dort nicht total differenzierbar, ja nicht einmal stetig sein:
Beispiel: Sei f : R2 → R erklärt als

2
 2xy
, für (x, y) ̸= (0, 0)
.
f (x, y) :=
x2 + y 4

0,
für (x, y) = (0, 0)
Wir wollen zeigen, dass
)
1(
f (ta1 , ta2 )
∂f
(0, 0) = lim f (ta1 , ta2 ) − f (0, 0) = lim
t→0 t
t→0
∂a
t
für alle a = (a1 , a2 ) ∈ S 1 existiert.
• Für a = (0, ±1) haben wir f (0, ±t) = 0 für alle t ∈ R \ {0} und folglich
∂f
∂a (0, 0) = 0.
• Für a ̸= (0, ±1) und somit a1 ̸= 0 erhalten wir
2t3 a1 a22
∂f
a22
(0, 0) = lim 3 2
.
=
2
t→0 t (a1 + t2 a4
∂a
a1
2)
4
Aber wegen f (y 2 , y) = y42y+y4 = 1 für alle y ∈ R und f (0, 0) = 0 ist f in (0, 0)
unstetig und damit auch nicht total differenzierbar.
Wir können aber unter einer stärkeren Voraussetzung aus der partiellen die totale
Differenzierbarkeit folgern:
Satz 2.6: Gehört f : Ω → Rd zur Klasse C 1 (Ω, Rd ), so ist f total differenzierbar in
Ω.
Beweis: Zu x ∈ Ω wählen wir r > 0 mit Br (x) ⊂ Ω. Für h ∈ Rn mit |h| < r liefert dann Hadamards
Lemma, Satz 2.2:
( ∫1
f (x + h) = f (x) +
0
)
Df (x + th) dt h = f (x) + Df (x)h + R(h)
172
KAPITEL 4. DIFFERENTIALRECHNUNG
mit
( ∫1
R(h) :=
[
)
]
Df (x + th) − Df (x) dt h.
0
Wir haben noch zu zeigen, dass R = R(h) die Relation (2.2) erfüllt: Da Df stetig ist, existiert zu
vorgegebenem ε > 0 ein δ = δ(ε) ∈ (0, r), so dass |Dj f (y) − Dj f (x)| < nε für alle y ∈ Bδ (x) und
j = 1, . . . , n gilt. Somit folgt für alle h ∈ Rn mit |h| < δ:
∫1
n
R(h) ∑ |hj |
Dj f (x + th) − Dj f (x) dt < n ε = ε,
≤
|h|
|h|
n
j=1
0
d.h. R(h) = o(|h|) für h → 0, wie behauptet.
3
q.e.d.
Partielle Ableitungen höherer Ordnung, der Satz von
Schwarz
Sei f : Ω → Rd auf der offenen Menge Ω ⊂ Rn erklärt. Wenn die partielle Ableitung
∂f
= fxj auf ganz Ω existiert für ein j ∈ {1, . . . , n}, können wir Dj f :
Dj f = ∂x
j
Ω → Rd wieder als Funktion auf Ω auffassen. Wenn diese in Ω nach xk partiell
differenzierbar ist für ein k ∈ {1, . . . , n}, so nennen wir Dk (Dj f ) =: Dk Dj f eine
zweite partielle Ableitung von f und schreiben auch
Dk Dj f =
∂2f
= fxj xk .
∂xj ∂xk
Entsprechend erklären wir die dritte und induktiv die s-te partielle Ableitung oder
Ableitung s-ter Ordnung
Djs (Djs−1 . . . Dj2 Dj1 f ) =: Djs Djs−1 . . . Dj2 Dj1 f =
∂sf
= fxj1 ...xjs ,
∂xj1 . . . ∂xjs
wobei j1 , . . . , js ∈ {1, . . . , n} Indizes sind. So wie wir in der Jacobimatrix Df =
∂fl
( ∂x
)j=1,...,n alle Ableitungen erster Ordnung zusammengefasst haben, schreiben wir
j
l=1,...,d
D2 f :=
( ∂2f )
l
∂xj ∂xk j,k=1,...,n
l=1...,d
und allgemeiner
Ds f =
(
)
∂ s fl
,
s =1,...,n
∂xj1 . . . ∂xjs j1 ,...,j
l=1...,d
wenn alle diese Ableitungen existieren. Wir nennen dann Df , D2 f und Ds f auch die
s
erste, zweite und s-te Ableitung von f . Wir können Ds f : Ω → Rd·n als Abbildung
von Ω in den Euklidischen Raum der Dimension d·ns auffassen. Schließlich schreiben
wir noch D0 f := f für die nullte Ableitung von f .
Definition 3.1: Für s ∈ N0 erklären wir den Raum der s-mal stetig differenzierbaren Funktionen C s (Ω, Rd ) als den Vektorraum der Funktionen f : Ω → Rd , deren
3. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG
173
s
Ableitungen Df, . . . , Ds f auf Ω existieren und für die Ds f : Ω → Rd·n stetig ist.
Der Raum der unendlich oft differenzierbaren Funktionen ist dann gegeben durch
∩
C ∞ (Ω, Rd ) :=
C s (Ω, Rd ).
s∈N0
Bemerkung: Gemäß Satz 1.1 sind alle Ableitungen einer Funktion f ∈ C s (Ω, Rd ) bis
zur s-ten Ordnung stetig.
Am Beispiel der zweiten partiellen Ableitungen wollen wir uns zunächst überlegen, dass es i.A. auf die Reihenfolge ankommt, d.h.: Ist f : Ω → Rd gegeben und
existieren Dj Dk f und Dk Dj f für gewisse j ̸= k, so ist i.A. nicht Dj Dk f = Dk Dj f .
Beispiel: Wir betrachten
{
f (x, y) :=
xy(x2 −y 2 )
,
x2 +y 2
(x, y) ̸= (0, 0)
0,
(x, y) = (0, 0)
.
Für (x, y) ̸= (0, 0) existieren offenbar die partiellen Ableitungen erster und zweiter Ordnung, und
es gilt
x4 y + 4x2 y 3 − y 5
x5 − 4x3 y 2 − xy 4
fx (x, y) =
, fy (x, y) =
.
(x2 + y 2 )2
(x2 + y 2 )2
Ferner haben wir
f (t, 0)
= 0 = fy (0, 0).
t
Also ist f in R2 einmal partiell differenzierbar. Im Nullpunkt berechnen wir
fx (0, 0) = lim
t→0
fx (0, t)
−t
= lim
= −1,
t→0 t
t
fy (t, 0)
t
fyx (0, 0) = lim
= lim = 1.
t→0
t→0 t
t
fxy (0, 0) = lim
t→0
Wir wollen nun Voraussetzungen angeben, unter denen die Reihenfolge der zweiten Ableitungen einer Funktion vertauschbar ist, und beginnen mit dem
Hilfssatz 3.1: Es sei Bδ := Bδ (0, 0) ⊂ R2 die Kreisscheibe vom Radius δ > 0 um
den Nullpunkt und φ = φ(y, z) : Bδ → R sei gegeben. Für φ sollen die partiellen
Ableitungen φy , φz und φyz in Bδ existieren. Dann gibt es zu beliebigen h, k ̸= 0 mit
(h, k) ∈ Bδ einen Punkt (ξ, η) ∈ Bδ , so dass gilt
φyz (ξ, η) =
φ(h, k) − φ(h, 0) − φ(0, k) + φ(0, 0)
.
hk
(3.1)
Bemerkung: Die rechte Seite in (3.1) kann als Differenzenquotient zweiter Ordnung
im Punkt (0, 0) aufgefasst werden.
174
KAPITEL 4. DIFFERENTIALRECHNUNG
Beweis von Hilfssatz 3.1: Wir nennen I das abgeschlossene Intervall zwischen 0 und h und erklären
die Funktion
u(y) := φ(y, k) − φ(y, 0) für y ∈ I.
Dann ist φ differenzierbar auf I. Zweimalige Anwendung des Mittelwertsatzes in einer Veränderlichen liefert
φ(h, k) − φ(h, 0) − φ(0, k) + φ(0, 0)
=
u(h) − u(0) = hu′ (ξ)
[
]
h φy (ξ, k) − φy (ξ, 0)
=
hk φyz (ξ, η),
=
da auch v(z) := φy (ξ, z) auf dem abgeschlossenen Intervall J zwischen 0 und k differenzierbar ist
mit v ′ (z) = φyz (ξ, z); dabei ist ξ ∈ I, η ∈ J, also (ξ, η) ∈ Bδ .
q.e.d.
Satz 3.1: (H.A. Schwarz)
Es seien Ω ⊂ Rn und f : Ω → Rd gegeben. Für ein x0 ∈ Ω sollen die partiellen
Ableitungen Di f , Dj f und Dj Di f in einer Kugel Br (x0 ) ⊂ Ω existieren und Dj Di f
sei stetig in x0 . Dann existiert auch Di Dj f (x0 ) und es gilt
Di Dj f (x0 ) = Dj Di f (x0 ).
Beweis: Durch komponentenweises Rechnen können wir o.B.d.A. d = 1 annehmen.
Wir betrachten die Funktion
φ(y, z) := f (x0 + yei + zej )
für (y, z) ∈ Br := Br (0, 0).
Dann existieren φy , φz und φyz in Br , und φyz ist stetig in (0, 0). Wegen Letzterem
können wir zu vorgegebenem ε > 0 noch δ = δ(ε) > 0 so klein wählen, dass
|φyz (y, z) − φyz (0, 0)| < ε
für alle (y, z) ∈ Bδ
(3.2)
erfüllt ist. Wir wenden nun Hilfssatz 3.1 an: Zu beliebigem (h, k) ∈ Bδ mit h, k ̸= 0
ergeben (3.1) und (3.2)
1 ( φ(h, k) − φ(h, 0) φ(0, k) − φ(0, 0) )
−
− φyz (0, 0)
h
k
k
φ(h, k) − φ(h, 0) − φ(0, k) − φ(0, 0)
=
− φyz (0, 0)
hk
= |φyz (ξ, η) − φyz (0, 0)| < ε
mit einem (ξ, η) ∈ Bδ . Grenzübergang k → 0 liefert also
1[
]
φz (h, 0) − φz (0, 0) − φyz (0, 0) ≤ ε für h ∈ (−δ, δ) \ {0}.
h
Lassen wir nun h → 0 laufen, so folgt
|φzy (0, 0) − φyz (0, 0)| ≤ ε.
3. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG
175
Und da ε > 0 beliebig gewählt war, erhalten wir
Di Dj f (x0 ) = φzy (0, 0) = φyz (0, 0) = Dj Di f (x0 ),
wie behauptet.
q.e.d.
Bemerkung: Insbesondere können also bei einer Funktion f ∈ C 2 (Ω, Rd ) die Ableitungen – genauer die Reihenfolge der Ableitungen – vertauscht werden. Entsprechendes gilt auch für die höheren Ableitungen einer Funktion f ∈ C s (Ω, Rd ) mit
s > 2, wie man durch vollständige Induktion leicht sieht. Dies rechtfertigt auch die
folgende
Notation (Multiindizes):
Zu einem sogenannten Multiindex α := (α1 , . . . , αn ) ∈ Nn0 , d.h. αj ∈ N0 für alle
j = 1, . . . , n, erklären wir dessen Länge |α| gemäß
|α| := α1 + . . . + αn .
(Man beachte, dass |α| nicht die Euklidische Länge des Vektors α ist.) Dann schreiben wir für ein f ∈ C |α| (Ω, Rd ) abkürzend
α
Dj j f := (Dj )αj f := Dj Dj . . . Dj f
{z
}
|
αj -mal
und
Dα f := (D1 )α1 (D2 )α2 . . . (Dn )αn f = D1α1 D2α2 . . . Dnαn f.
Das bedeutet, f wird αj -mal nach xj abgeleitet, wobei die Reihenfolge der Differentiation eben nach Satz 3.1 keine Rolle spielt.
Beispiel: Für eine Funktion f : Ω → R ∈ C 2 (Ω), Ω ⊂ Rn , erklärt man den LaplaceOperator
∆f (x) :=
D12 f (x)
+ ... +
Dn2 f (x)
=
n
∑
fxk xk (x),
x ∈ Ω.
k=1
Dieser ordnet jeder Funktion f ∈ C 2 (Ω) eine Funktion ∆f ∈ C 0 (Ω) zu, weshalb
man auch ∆ : C 2 (Ω) → C 0 (Ω) schreibt. Der Laplace-Operator ist (wie der NablaOperator ∇ : C 1 (Ω) → C 0 (Ω, Rn )) ein Beispiel eines – und zwar eines wichtigen! –
Differentialoperators. Die zugehörige Gleichung
∆f (x) = 0
für alle x ∈ Ω
heißt Laplacegleichung und eine Lösung f nennt man harmonische Funktion. Die Laplacegleichung ist eine der wichtigsten partiellen Differentialgleichungen; dies sind
176
KAPITEL 4. DIFFERENTIALRECHNUNG
Gleichungen zwischen Funktionen mehrerer Veränderlicher und ihren partiellen Ableitungen. Im Gegensatz hierzu werden Gleichungen zwischen Funktionen einer Variablen und ihren gewöhnlichen Ableitungen als gewöhnliche Differentialgleichungen
bezeichnet.
Wir bemerken noch
∆f = spur Hf ,
wobei
Hf (x) := (fxj xk (x))j,k=1,...,n ,
x ∈ Ω,
die (symmetrische) Hessematrix der zweiten Ableitungen bezeichnet.
Wir wollen noch den Begriff des Differentials df verallgemeinern und gehen dazu
von der Darstellung (2.4) aus: Ist f ∈ C 1 (Ω, Rd ), so gilt
df (x)(h) =
n
∑
Dj f (x)hj
für x ∈ Ω, h = (h1 , . . . , hn ) ∈ Rn .
j=1
Ist nun f ∈ C s (Ω, Rd ) für ein s > 1, so erklären wir das k-te Differential oder das
Differential der Ordnung k ∈ {1, . . . , s} gemäß
n
∑
dk f (x)(h1 , . . . , hk ) :=
Dj1 . . . Djk f (x) h1j1 · . . . · hkjk
j1 ,...,jk =1
für x ∈ Ω und h =
l
(hl1 , . . . , hln )
∈ Rn mit l = 1, . . . , k.
Ist speziell h1 = h2 = . . . hk =: h, so schreiben wir abkürzend
dk f (x)(h) := dk f (h, . . . , h) =
für x ∈ Ω und h =
n
∑
Dj1 . . . Djk f (x) hj1 · . . . · hjk
j1 ,...,jk =1
(h1 , . . . , hn ) ∈ Rn .
(3.3)
Offenbar gilt d1 f (x)(h) = df (x)(h). Wir setzen schließlich noch
d0 f (x)(h) := f (x) für x ∈ Ω, h ∈ Rn .
Beispiel: Für k = 2, h := h1 ∈ Rn , g := h2 ∈ Rn haben wir
2
d f (x)(h, g) =
n
∑
Di Dj f (x)hi gj .
i,j=1
Insbesondere für h = ei , g = ej , also i-ter bzw. j-ter Einheitsvektor, folgt
d2 f (x)(ei , ej ) = Di Dj f (x) = fxi xj (x).
(3.4)
4. TAYLORFORMEL UND LOKALE EXTREMA
177
Allgemeiner gilt: Ist hl = eil der il -te Einheitsvektor für l = 1, . . . , k, so folgt
dk f (x)(ei1 , . . . , eil ) = fxi1 ...xik (x).
Abschließend erklären wir noch partielle Ableitungen (und damit auch Differentiale) auf allgemeineren, für die Anwendung wichtigen Mengen:
Definition 3.2: Es sei Ω ⊂ Rn offen (und wie immer nichtleer) und Γ ⊂ ∂Ω eine
nichtleere Teilmenge des Randes ∂Ω von Ω. Eine Funktion f : Ω → Rd gehört dann
zur Klasse C s (Ω ∪ Γ, Rd ) für ein s ∈ N, wenn f ∈ C s (Ω, Rd ) gilt und wenn die
Grenzwerte
lim
Ω∋x→x0
Dα f (x)
für alle x0 ∈ Γ und alle α ∈ Nn0 mit 0 ≤ |α| ≤ s
existieren.
Bemerkungen:
1. Offenbar können für ein für ein f ∈ C s (Ω ∪ Γ, Rd ) alle Ableitungen Dα f ,
0 ≤ |α| ≤ s, durch die Setzung
Dα f (x0 ) :=
lim
Ω∋x→x0
Dα f (x) für x0 ∈ Γ ⊂ ∂Ω
stetig auf Ω ∪ Γ fortgesetzt werden können.
2. Insbesondere sind durch Definition 3.2 mit Γ = ∂Ω auch die Räume C s (Ω, Rd )
erklärt.
4
Taylorformel und lokale Extrema
Wir wollen nun ein Analogon zur Taylorformel für Funktionen einer Veränderlichen
angeben. Seien dazu Ω ⊂ Rn offen und f ∈ C s+1 (Ω) mit einem s ∈ N0 . Weiter sei
x0 ∈ Ω gewählt und für ein x ∈ Ω gelte
{
}
[x0 , x] = x0 + t(x − x0 ) : t ∈ [0, 1] ⊂ Ω.
Mit h := x − x0 gehört dann die Funktion
ϕ(t) := f (x0 + th),
t ∈ [0, 1],
zur Klasse C s+1 ([0, 1]), und es gilt
ϕ(k) (t)
=
n
∑
Dj1 . . . Djk f (x0 + th)hj1 . . . hjk
j1 ,...,jk =1
(3.3)
=
dk f (x0 + th)(h),
Satz 7.2 aus Kap. 3 liefert nun den
k ∈ {1, . . . , s + 1}, t ∈ [0, 1].
(4.1)
178
KAPITEL 4. DIFFERENTIALRECHNUNG
Satz 4.1: Seien f ∈ C s+1 (Ω) und x0 , x ∈ Ω mit [x0 , x] ⊂ Ω gewählt. Dann gilt die
Taylorformel
f (x) = ps (x) + Rs (x)
mit dem s-ten Taylorpolynom zum Entwicklungspunkt x0
s
∑
1 k
ps (x) :=
d f (x0 )(x − x0 )
k!
k=0
und dem s-ten Restglied
Rs (x) =
1
ds+1 f (y)(x − x0 )
(s + 1)!
mit einer Zwischenstelle y = x0 + ϑ(x − x0 ) ∈ (x0 , x) := [x0 , x] \ {x0 , x} für ein
ϑ ∈ (0, 1).
Beweis: Wir entwickeln ϕ um t = 0 und entnehmen den Formeln (7.4), (7.2) und
(7.6) aus Kap. 3:
s
∑
ϕ(k) (0) k ϕ(s+1) (ϑt) s+1
t +
t
ϕ(t) =
k!
(s + 1)!
k=0
mit beliebigem t ∈ [0, 1] und geeignetem ϑ = ϑ(t) ∈ (0, 1). Insbesondere für t = 1
folgt also mit y := x0 + ϑ(x − x0 ) = x0 + ϑh aus (4.1):
f (x) =
s
∑
1 k
1
d f (x0 )(x − x0 ) +
ds+1 (y)(x − x0 ),
k!
(s + 1)!
k=0
wie behauptet.
q.e.d.
Bemerkungen:
1. Insbesondere für s = 1 haben wir mit h := x − x0 (vgl. Formel (3.4)):
1
f (x) = d0 f (x0 )(h) + d1 f (x0 )(h) + d2 f (y)(h)
2
n
n
∑
1 ∑
= f (x0 ) +
fxj (x0 )hj +
fxi xj (x0 + ϑh)hi hj
2
j=1
i,j=1
⟩
1⟨
= f (x0 ) + ⟨∇f (x0 ), h⟩ + h, Hf (x0 + ϑh)h .
2
mit der Hessematrix Hf = (fxi xj )i,j=1,...,n .
(4.2)
4. TAYLORFORMEL UND LOKALE EXTREMA
179
2. Analog zu Folgerung 7.1 in Kap. 3 können wir aus Satz 4.1 qualitativ schließen:
Gilt f ∈ C s (Ω) und ist x0 ∈ Ω gewählt, so folgt
f (x) = ps (x) + o(|x − x0 |s ) für x → x0 .
(4.3)
Zum Beweis wenden wir Satz 4.1 mit s − 1 statt s an: Für x ∈ Br (x0 ) ⊂ Ω
schreiben wir
f (x) = ps−1 (x) + Rs−1 (x) = ps (x) +
]
1[ s
d f (y)(x − x0 ) − ds f (x0 )(x − x0 ) .
s!
Mit h = x − x0 folgt die Behauptung aus
|ds f (y)(h) − ds f (x0 )(h)|
|h|s
≤
n
∑
Dj . . . Djs f (y) − Dj . . . Djs f (x0 )
1
1
j1 ,...,js =1
→ 0 (x → x0 ).
Wir betrachten nun Extremwertaufgaben zur Bestimmung von Minima und Maxima einer Funktion mit n ∈ N Veränderlichen. In Analogie zu Definition 2.1 aus
Kap. 3 benutzen wir die
Definition 4.1: Sei Ω ⊂ Rn offen und f : Ω → R erklärt. Dann besitzt f in x0 ∈ Ω
ein lokales Minimum (bzw. lokales Maximum), wenn ein r > 0 so existiert, dass
Br (x0 ) ⊂ Ω und
f (x0 ) ≤ f (x)
(bzw. f (x0 ) ≥ f (x) )
für alle x ∈ Br (x0 )
(4.4)
erfüllt ist. Gilt in (4.4) die strikte Ungleichung für x ̸= x0 , so hat f in x0 ein
striktes lokales Minimum (bzw. Maximum). Falls schließlich (4.4) für alle x ∈ Ω
erfüllt ist, sprechen wir von einem globalen Minimum (bzw. globalen Maximum)
und bei strikter Ungleichung für x ̸= x0 von einem strikten globalen Minimum
(bzw. Maximum).
Als Synonym für lokal bzw. global benutzen wir auch relativ bzw. absolut. Und
wir sprechen allgemein von Extrema, wenn wir Minima und Maxima untersuchen.
Der entsprechende Punkt x0 ∈ Ω heißt Minimal-,Maximal- oder Extremalstelle oder
auch Minimierer bzw. Maximierer. Schließlich sprechen wir statt von strikten auch
von isolierten Extrema.
Satz 4.2: (Notwendige Bedingung 1. Ordnung)
Eine Funktion f ∈ C 1 (Ω) besitze in x0 ∈ Ω ein lokales Extremum. Dann gilt
∇f (x0 ) = 0.
180
KAPITEL 4. DIFFERENTIALRECHNUNG
Bemerkung: Ein Punkt x0 ∈ Ω heißt kritischer Punkt von f ∈ C 1 (Ω), falls ∇f (x0 ) =
0 gilt. Satz 4.2 besagt also: Lokale Extremstellen in Ω sind notwendig kritische Punkte.
Beweis von Satz 4.2: Sei r > 0 mit Br (x0 ) ⊂ Ω und Eigenschaft (4.4) gewählt. Für
j ∈ {1, . . . , n} besitzen dann die Funktionen
φj (t) := f (x01 , . . . , x0j−1 , t, x0j+1 , . . . x0n ),
t ∈ (x0j − r, x0j + r),
in x0j ebenfalls lokale Extrema. Wegen φj ∈ C 1 ((x0j − r, x0j + r)) liefert also Fermats
Satz
fxj (x0 ) = φ′j (x0j ) = 0, j = 1, . . . , n,
wie behauptet.
q.e.d.
Als Anwendung betrachten wir nun reelle, symmetrische n × n-Matrizen A =
(ajk )j,k=1,...,n . Ein Vektor ξ ∈ Rn \ {0} heißt Eigenvektor von A zum Eigenwert
λ ∈ R, wenn gilt
Aξ = λξ.
(ξ als Spaltenvektor interpretiert). Durch Normierung kann man o.B.d.A. ξ ∈ S n−1
annehmen.
Satz 4.3: Für jede reelle, symmetrische Matrix A = (ajk )j,k=1,...,n ist
λ :=
⟨η, Aη⟩
2
η∈Rn \{0} |η|
sup
ein Eigenwert.
Beweis: Wir betrachten die Funktion
f (η) :=
⟨η, Aη⟩
,
|η|2
und berechnen
∇f (η) =
η ∈ Rn \ {0},
)
2 (
Aη − f (η)η .
2
|η|
(4.5)
Wir bemerken weiter, dass f entlang der Strahlen {λη : λ > 0} für jedes η ∈ Rn \ {0} konstant ist:
f (λη) =
⟨λη, A(λη)⟩
⟨η, Aη⟩
=
= f (η),
|λη|2
|η|2
(4.6)
d.h. f ist positiv homogen vom Grad 0 auf Rn \{0}. Auf der kompakten Menge S n−1 ⊂ Rn \{0} nimmt
nun f in einem Punkt ξ ∈ S n−1 ihr Maximum an nach dem Weierstraßschen Hauptlehrsatz. Sei ε > 0
beliebig und η ∈ Rn \ {0} gewählt mit f (η) ≥ λ − ε (beachte die Definition λ = supη∈Rn \{0} f (η)).
Aus (4.6) folgt dann
( η )
(4.6)
≤ f (ξ) ≤ λ,
λ − ε ≤ f (η) = f
|η|
4. TAYLORFORMEL UND LOKALE EXTREMA
181
also f (ξ) = λ, da ε > 0 beliebig war. Somit ist ξ ∈ S n−1 (globaler) Maximalpunkt von f auf Rn \{0}
und Satz 4.2 liefert ∇f (ξ) = 0. Formel (4.5) entnehmen wir schließlich
Aξ = f (ξ)ξ = λξ,
wie behauptet.
q.e.d.
Bemerkung: Wir schreiben λ1 := λ für den in Satz 4.3 konstruierten Eigenwert und
ξ1 ∈ S n−1 für den zugehörigen normierten Eigenvektor. Indem man anschließend das
Maximierungsproblem λ2 := supη∈U \{0} f (η) auf dem Unterraum U := {η ∈ Rn :
⟨η, ξ1 ⟩ = 0} senkrecht zu ξ1 betrachtet, den man durch Wahl einer Orthonormalbasis
mit dem Rn−1 identifiziert, entnimmt man Satz 4.3 die Existenz eines Eigenvektors
ξ2 ∈ S n−1 ∩ U zum Eigenwert λ2 ≤ λ1 , für den dann gilt
Aξ2 = λ2 ξ2 ,
⟨ξ2 , ξ1 ⟩ = 0.
Durch Fortsetzung des Verfahrens erhalten wir die
Folgerung 4.1: Zu jeder reellen, symmetrischen n × n-Matrix A = (ajk )j,k=1,...,n
existieren n Eigenvektoren ξ1 , . . . , ξn und n Eigenwerte λ1 ≥ λ2 ≥ . . . ≥ λn mit
Aξj = λj ξj für j = 1, . . . , n. Die Eigenvektoren {ξ1 , . . . , ξn } bilden eine Orthonormalbasis des Rn , d.h.
{
1, falls j = k
⟨ξj , ξk ⟩ = δjk :=
.
0, falls j ̸= k
Bemerkung: Offenbar ist λ genau dann Eigenwert von A, wenn das homogene lineare
Gleichungssystem
(A − λE)ξ = 0
mit der Einheitsmatrix E eine nichttriviale Lösung ξ ∈ Rn \ {0} besitzt, was bekanntlich äquivalent zur Forderung
det(A − λE) = 0
ist. Die linke Seite ist ein Polynom n-ten Grades in λ, das charakteristische Polynom,
welches also nach Folgerung 4.1 für symmetrisches A ausschließlich reelle Nullstellen
besitzt.
Die Rolle der zweiten Ableitung bei Extremwertaufgaben für Funktionen einer
Veränderlichen übernimmt nun die Hessematrix Hf . Für das Folgende benötigen wir
noch die
Definition 4.2: Eine reelle, symmetrische n × n-Matrix A heißt positiv definit
(i.Z. A > 0), wenn gilt
⟨η, Aη⟩ > 0
für alle η ∈ Rn \ {0}.
182
KAPITEL 4. DIFFERENTIALRECHNUNG
A heißt positiv semidefinit (i.Z. A ≥ 0), wenn gilt
⟨η, Aη⟩ ≥ 0
für alle η ∈ Rn .
Ferner nennen wir A negativ definit bzw. negativ semidefinit (i.Z. A < 0 bzw. A ≤
0), falls −A > 0 bzw. −A ≥ 0 erfüllt ist. Schließlich heißt A indefinit, wenn ⟨η, Aη⟩
sowohl positive als auch negative Werte annimmt.
Aus dieser Definition und Folgerung 4.1 erhalten wir nun die
Folgerung 4.2: Ist A eine reelle, symmetrische n × n-Matrix und sind λ1 ≥ . . . ≥
λn ihre zugehörigen Eigenwerte, so gilt
A > 0 (≥ 0) ⇐⇒ λn > 0 (≥ 0),
(4.7)
A < 0 (≤ 0) ⇐⇒ λ1 < 0 (≤ 0),
(4.8)
A indefinit ⇐⇒ λn < 0 und λ1 > 0.
(4.9)
Beweis: Es bezeichne ξj ∈ S n−1 den zu λj gehörigen Eigenvektor. Dann können wir jedes η ∈ Rn
schreiben als
n
∑
η=
cj ξj mit cj := ⟨η, ξj ⟩,
j=1
denn {ξ1 , . . . , ξn } bilden eine Orthonormalbasis des Rn . Es folgt
⟨η, Aη⟩
=
=
=
n
∑
j,k=1
n
∑
cj ck ⟨ξj , Aξk ⟩
cj ck λk ⟨ξj , ξk ⟩
(4.10)
j,k=1
n
∑
λj c2j = λ1 c21 + . . . + λn c2n .
j=1
Ist nun A > 0, so wählen wir in (4.10) speziell η = ξn . Dann folgt ⟨ξn , Aξn ⟩ = λn > 0. Gilt
umgekehrt λn > 0, so entnehmen wir (4.10) für beliebiges η ∈ Rn \ {0}:
⟨η, Aη⟩ ≥ λn
n
∑
c21 = λn |η|2 > 0.
k=1
Entsprechend sieht man A ≥ 0 ⇔ λn ≥ 0. Die Aussagen (4.8) folgen aus (4.7), da λj genau dann
Eigenwert von A ist, wenn −λj Eigenwert von −A ist. Ist schließlich A indefinit und η ∈ Rn \ {0}
mit ⟨η, Aη⟩ > 0 gewählt, so folgt wiederum aus (4.10):
0 < ⟨η, Aη⟩ ≤ λ1 |η|2 ,
also λ1 > 0. Entsprechend sieht man λn < 0 durch Wahl eines η ∈ Rn \ {0} mit ⟨η, Aη⟩ < 0. Sind
umgekehrt λn < 0 und λ1 > 0, so folgt ⟨ξn , Aξn ⟩ = λn < 0 und ⟨ξ1 , Aξ1 ⟩ = λ1 > 0, d.h. A ist
indefinit. Damit ist alles gezeigt.
q.e.d.
4. TAYLORFORMEL UND LOKALE EXTREMA
183
(
)
a b
eine reelle, symmetrische 2 × 2-Matrix, so ist
b c
λ ∈ R genau dann Eigenwert von A, wenn gilt
Beispiel (n = 2): Ist A =
0 = det(A − λE) = λ2 − (a + c)λ + ac − b2 .
Es folgt
λ1 + λ2 = a + c,
λ1 λ2 = ac − b2 = det A,
z.B. aus der p-q-Formel“. Wir entnehmen also Folgerung 4.2 die
”
(
)
a b
Folgerung 4.3: Für eine reelle Matrix A =
gilt:
b c
A > 0 ⇐⇒ det A > 0 und a > 0,
A < 0 ⇐⇒ det A > 0 und a < 0,
A ≥ 0 oder A ≤ 0 ⇐⇒ det A ≥ 0,
A indefinit ⇐⇒ det A < 0.
Satz 4.4: (Notwendige Bedingung 2. Ordnung)
Eine Funktion f ∈ C 2 (Ω) nehme in x0 ∈ Ω ⊂ Rn ihr Minimum (bzw. Maximum)
an. Dann gilt für die Hessematrix
(
)
Hf (x0 ) = fxj xk (x0 ) j,k=1,...,n ≥ 0
(bzw. Hf (x0 ) ≤ 0).
Beweis: Nach Satz 4.2 wissen wir ∇f (x0 ) = 0. Sei nun x0 Minimalpunkt, so existiert
ein r > 0 mit Br (x0 ) ⊂ Ω und f (x) ≥ f (x0 ) für alle x ∈ Br (x0 ). Die Taylorentwicklung in (4.2) liefert also mit h := x − x0 :
1
0 ≤ f (x) − f (x0 ) = ⟨h, Hf (x0 + ϑh)h⟩ für alle h ∈ Rn : |h| < r
2
für ein ϑ = ϑ(h) ∈ (0, 1). Ist nun η ∈ Rn beliebig, so setzen wir h := tη mit
hinreichend kleinem t > 0 und erhalten
0 ≤ lim ⟨η, Hf (x0 + ϑtη)η⟩ = ⟨η, Hf (x0 )η⟩,
t→0+
also Hf (x0 ) ≥ 0. Entsprechend zeigt man Hf (x0 ) ≤ 0 für Maximierer.
q.e.d.
Satz 4.5: Es sei f ∈ C 2 (Ω), x0 ∈ Ω kritischer Punkt und in Br (x0 ) ⊂ Ω gelte Hf ≥
0 (bzw. Hf > 0, Hf ≤ 0, Hf < 0). Dann ist x0 lokaler Minimierer (bzw. strikter
lokaler Minimierer, lokaler Maximierer, strikter lokaler Maximierer) von f .
184
KAPITEL 4. DIFFERENTIALRECHNUNG
Beweis: Wie im Beweis von Satz 4.4 entnehmen wir Formel (4.2):
1
f (x) − f (x0 ) = ⟨h, Hf (x0 + ϑh)h⟩ für alle h ∈ Rn : |h| < r
2
mit ϑ = ϑ(h) ∈ (0, 1). Aus Hf ≥ 0 in Br (x0 ) folgt also f (x) ≥ f (x0 ) für alle
x ∈ Br (x0 ), d.h. x0 ist lokaler Minimierer von f . Analog ergeben sich die übrigen
Aussagen.
q.e.d.
Satz 4.6: (Hinreichende Bedingung)
Sei x0 ∈ Ω kritischer Punkt der Funktion f ∈ C 2 (Ω) und es gelte Hf (x0 ) > 0
(bzw. Hf (x0 ) < 0). Dann besitzt f in x0 ein striktes lokales Minimum (bzw. Maximum).
Bemerkung: Für den Beweis ist es hilfreich einer reellen Matrix A = (aij )i,j ihre
Euklidische Länge zuzuordnen:
|A| :=
(∑
)1
a2ij
2
.
i,j
Dann gilt für beliebige A ∈ Matn,m (R) und y ∈ Rm :
|Ay| ≤ |A| |y|.
(4.11)
Beweis von Satz 4.6: Wir zeigen, dass ein r > 0 existiert mit Br (x0 ) ⊂ Ω und Hf > 0 (bzw. Hf < 0)
in Br (x0 ); die Behauptung folgt dann aus Satz 4.5.
Sei also Hf (x0 ) > 0. Nach Folgerung 4.2 gilt dann λn > 0 für den kleinsten Eigenwert von
Hf (x0 ). Und aus Formel (4.10) erhalten wir wieder
⟨η, Hf (x0 )η⟩ ≥ λn
n
∑
c2k = λn |η|2
für alle η ∈ Rn
k=1
und folglich
⟨η, Hf (x)η⟩
⟨ (
) ⟩
⟨η, Hf (x0 )η⟩ + η, Hf (x) − Hf (x0 ) η
(
) λn |η|2 − |η| Hf (x) − Hf (x0 ) η =
≥
(4.11)
≥
(
)
λn − |Hf (x) − Hf (x0 )| |η|2
(4.12)
für alle η ∈ Rn , x ∈ Ω.
Wegen f ∈ C 2 (Ω) existiert ein r > 0 mit Br (x0 ) ⊂ Ω und
|Hf (x) − Hf (x0 )| ≤
λn
2
für alle x ∈ Br (x0 ).
Einsetzen in (4.12) ergibt also
⟨η, Hf (x)η⟩ ≥
λn 2
|η| > 0
2
für alle η ∈ Rn \ {0}, x ∈ Br (x0 ),
d.h. Hf > 0 in Br (x0 ). Der Fall Hf (x0 ) < 0 wird entsprechend behandelt.
q.e.d.
5. INVERSE ABBILDUNGEN
5
185
Inverse Abbildungen
Ziel dieses Paragraphen ist der Beweis des folgenden
Satz 5.1: (Umkehrsatz)
Sei Ω ⊂ Rn offen und f : Ω → Rn ∈ C 1 (Ω, Rn ) gegeben. Falls dann für ein x0 ∈ Ω
gilt
Jf (x0 ) = det Df (x0 ) ̸= 0,
so gibt es eine Umgebung U = U (x0 ) ⊂ Ω von x0 , so dass U ∗ := f (U ) offen ist und
f |U einen C 1 -Diffeomorphismus von U auf U ∗ liefert.
Wir erinnern daran, dass eine (offene) Umgebung U = U (x0 ) eines Punktes x0
eine offene Menge ist, die x0 enthält, und f |U die Einschränkung einer Funktion
f : Ω → Rd auf eine Teilmenge U ⊂ Ω bezeichnet.
Obiger Satz 5.1 kann als lokale Umkehrung von Folgerung 1.1 interpretiert werden
und ist von grundlegender Bedeutung für die gesamte Analysis (weshalb er auch
Fundamentalsatz über die inverse Abbildung genannt wird). Er besagt, dass das
nichtlineare Gleichungssystem
f (x) = y,
x ∈ Ω,
zumindest lokal um ein x0 ∈ Ω nach x eindeutig aufgelöst werden kann, wenn die
quadratische Matrix Df (x0 ) invertierbar ist; man vergleiche auch mit den entsprechenden Aussagen über lineare Gleichungssysteme aus der Linearen Algebra.
Wir werden Satz 5.1 durch Lokalisierung gewinnen aus dem folgenden
Satz 5.2: Bildet f ∈ C 1 (Ω, Rn ) die offene Menge Ω ⊂ Rn bijektiv auf Ω∗ = f (Ω)
ab und gilt Jf ̸= 0 auf Ω, so ist Ω∗ offen und f ein C 1 -Diffeomorphismus von Ω auf
Ω∗ .
Für eine übersichtliche Darstellung des Beweises ist es sinnvoll, an dieser Stelle
folgende wichtige Bezeichnungen einzuführen:
Definition 5.1:
(i) Eine Abbildung f : Ω → Rn heißt offen, wenn das Bild f (Ω′ ) jeder offenen
Teilmenge Ω′ von Ω wieder offen ist.
(ii) f : Ω → Rn heißt Lipschitzstetig, wenn eine Konstante L ≥ 0 existiert, so
dass gilt
|f (x) − f (y)| ≤ L|x − y| für alle x, y ∈ Ω.
L ist die zugehörige Lipschitzkonstante.
186
KAPITEL 4. DIFFERENTIALRECHNUNG
(iii) f : Ω → Rn ∈ C 1 (Ω, Rn ) heißt regulär in x0 ∈ Ω, wenn Jf (x0 ) ̸= 0 gilt. f
heißt regulär (in Ω), wenn f in jedem Punkt x0 von Ω regulär ist.
Bemerkungen:
1. Die Definitionen (i) und (ii) machen natürlich auch Sinn, wenn Bild– und
Urbilddimension nicht übereinstimmen.
2. Eine Abbildung f : Ω → Rn ist genau dann offen, wenn es zu jedem x0 ∈ Ω
eine Kugel Bδ (x0 ) ⊂ Ω so gibt, dass zu jedem r ∈ (0, δ) ein ϱ > 0 existiert mit
(
)
(
)
Bϱ f (x0 ) ⊂ f Br (x0 ) .
3. Jede Lipschitzstetige Abbildung ist auch stetig.
4. Mit den Bezeichnungen aus Definition 5.1 besagt nun Satz 5.2:
Jede injektive, reguläre Abbildung f ∈ C 1 (Ω, Rn ) ist ein C 1 -Diffeomorphismus
von Ω auf f (Ω) und außerdem offen.
Wir beginnen den Beweis von Satz 5.2 mit dem folgenden
Hilfssatz 5.1: Die Abbildung f ∈ C 1 (Ω, Rn ) sei in x0 ∈ Ω regulär. Dann gibt es
eine offene Umgebung U = Bδ (x0 ) ⊂ Ω von x0 , auf der f injektiv ist, d.h. f |U ist
invertierbar. Die Inverse g := (f |U )−1 ist dann Lipschitzstetig.
Beweis: Wir betrachten die Funktion
ψ(x) := f (x) − f (x0 ) − Df (x0 ) ◦ (x − x0 ),
x ∈ Ω.
Dann gilt ψ ∈ C 1 (Ω, Rn ) und Dψ(x0 ) = 0. In einer Kugel BR (x0 ) ⊂ Ω liefert
Hadamards Lemma
ψ(x) − ψ(x′ ) = A ◦ (x − x′ ),
mit
∫1
A :=
x, x′ ∈ BR (x0 ),
(5.1)
(
)
Dψ x′ + t(x − x′ ) dt.
0
Wegen Dψ(x0 ) = 0 und der Stetigkeit von Dψ existiert zu beliebigem µ > 0 ein
δ ∈ (0, R) mit der Eigenschaft
|Dψ(x)| ≤ µ
für alle x ∈ Bδ (x0 ),
so dass |A| ≤ µ für beliebige x, x′ ∈ Bδ (x0 ) folgt, und (5.1) liefert
|ψ(x) − ψ(x′ )| ≤ |A| |x − x′ | ≤ µ|x − x′ |
für alle x, x′ ∈ Bδ (x0 ).
(5.2)
5. INVERSE ABBILDUNGEN
187
Der Definition von ψ entnehmen wir
ψ(x) − ψ(x′ ) = f (x) − f (x′ ) − Df (x0 )(x − x′ )
und somit
|f (x) − f (x′ )| = |ψ(x) − ψ(x′ ) + Df (x0 ) ◦ (x − x′ )|
≥ |Df (x0 ) ◦ (x − x′ )| − µ|x − x′ |
für alle x, x′ ∈ Bδ (x0 ).
(5.3)
Wegen Jf (x0 ) ̸= 0 ist Df (x0 ) invertierbar. Wir erhalten
|x − x′ | = |Df (x0 )−1 ◦ Df (x0 )(x − x′ )| ≤ |Df (x0 )−1 | |Df (x0 ) ◦ (x − x′ )|
bzw.
|Df (x0 ) ◦ (x − x′ )| ≥
Wählen wir in (5.2) speziell µ :=
in (5.3) ein, so folgt schließlich
1
2|Df (x0 )−1 |
|f (x) − f (x′ )| ≥ µ|x − x′ |
|x − x′ |
.
|Df (x0 )−1 |
> 0 und setzen die letzte Abschätzung
für alle x, x′ ∈ Bδ (x0 ).
(5.4)
Also ist f |Bδ (x0 ) bijektiv mit Bild V := f (Bδ (x0 )), und für die Inverse g = g(y) :
V → Rn gilt
|g(y) − g(y ′ )| ≤ µ−1 |y − y ′ | für alle y, y ′ ∈ V,
d.h. g ist Lipschitzstetig mit L = µ−1 .
q.e.d.
Hilfssatz 5.2: Ist f ∈ C 1 (Ω, Rn ) regulär, so ist f auch offen.
Beweis: Wir fixieren x0 ∈ Ω und wählen δ > 0 mit Bδ (x0 ) ⊂ Ω wie im Beweis von Hilfssatz 5.1, so
dass (5.4) erfüllt ist. Zu beliebigem r ∈ (0, δ) setzen wir dann ϱ := µr
> 0 und wollen zeigen, dass
2
(
)
(
)
Bϱ f (x0 ) ⊂ f Br (x0 )
gilt. Dann ist f nach obiger Bemerkung 1 offen.
Sei also y ∈ Bϱ (f (x0 )) beliebig. Wir haben zu zeigen, dass dann ein ξ ∈ Br (x0 ) mit f (ξ) = y
existiert. Hierzu erklären wir die Funktion
F (x) := |f (x) − y|2 ,
x ∈ Br (x0 ).
Offenbar gilt F ∈ C 1 (Br (x0 )). Nach dem Weierstraßschen Hauptlehrsatz existiert also ein ξ ∈
Br (x0 ) mit
F (ξ) = inf F.
Br (x0 )
Wir zeigen ξ ∈ Br (x0 ), d.h. ξ ist innerer Punkt. Wäre nämlich ξ ∈ ∂Br (x0 ), so folgte
|f (ξ) − y|
≥
(5.4)
≥
|f (ξ) − f (x0 )| − |f (x0 ) − y|
µ|ξ − x0 | − |f (x0 ) − y| > µr − ϱ = ϱ,
188
KAPITEL 4. DIFFERENTIALRECHNUNG
also F (ξ) = |f (ξ) − y|2 > ϱ2 im Widerspruch zu F (x0 ) < ϱ2 . Nun gilt für die innere Minimalstelle
ξ ∈ Br (x0 ) notwendig
∇F (ξ) = 2Df (ξ) ◦ (f (ξ) − y) = 0.
Da aber Df in Ω invertierbar ist, muss somit f (ξ) − y = 0 bzw. f (ξ) = y gelten, wie behauptet.
q.e.d.
Wir kommen nun zum
Beweis von Satz 5.2: Sei also f ∈ C 1 (Ω, Rn ) regulär und injektiv mit Bild f (Ω) = Ω∗ .
Nach Hilfssatz 5.2 ist dann Ω∗ offen und es bleibt g := f −1 : Ω∗ → Rn ∈ C 1 (Ω∗ , Rn )
nachzuweisen. Hierzu fixieren wir y 0 ∈ Ω∗ beliebig und zeigen, dass für alle k ∈ Rn
mit y 0 + k ∈ Ω∗ die Darstellung
g(y 0 + k) = g(y 0 ) + A ◦ k + R(k)
mit R(k) = o(|k|) für k → 0
(5.5)
gilt, wobei A := Df (x0 )−1 mit x0 := g(y 0 ) ∈ Ω erfüllt ist. Dann ist also g in y 0 total
differenzierbar und es gilt Dg(y 0 ) = Df (x0 )−1 ; insbesondere ist g also auch stetig
in y 0 . Und da y 0 ∈ Ω∗ beliebig gewählt war, folgt
Dg(y) = Df (g(y))−1
für alle y ∈ Ω∗ .
Schließlich ist auch (Df )−1 stetig auf Ω = g(Ω∗ ) und somit g ∈ C 1 (Ω, Rn ).
Zu zeigen bleibt (5.5): Hierzu setzen wir
h := g(y 0 + k) − g(y 0 ) = g(y 0 + k) − x0
und beachten x0 + h = g(y 0 + k) ∈ Ω. Wegen f ∈ C 1 (Ω, Rn ) gilt dann nach Satz 2.6:
f (x0 + h) = f (x0 ) + Df (x0 )h + R̃(h)
mit einem R̃(h) = o(|h|) für h → 0. Umstellen liefert sofort (5.5) mit
(
)
R(k) := −AR̃(h) = −Df (x0 )−1 R̃ g(y 0 + k) − x0 .
Wir zeigen schließlich noch R(k) = o(|k|) für k → 0. Dazu bemerken wir, dass nach
Hilfssatz 5.1 ein ε > 0 mit Bε (y 0 ) ⊂ Ω∗ so existiert, dass
|g(y) − g(y ′ )| ≤ L|y − y ′ |
für alle y, y ′ ∈ Bε (y 0 )
erfüllt ist mit einer Lipschitzkonstanten L > 0. Folglich erhalten wir
|h| = |g(y 0 + k) − g(y 0 )| ≤ L|k|
für alle k ∈ Rn mit |k| < ε.
Somit ergibt sich
R(k) R̃(h) |R̃(h)|
≤ |A|L
≤ |A|
→ 0 (k → 0),
|k|
|k|
|h|
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
189
wie behauptet. Damit ist alles bewiesen.
q.e.d.
Beweis des Umkehrsatzes: Nach Hilfssatz 5.1 gibt es eine Umgebung Bδ (x0 ) ⊂ Ω
von x0 ∈ Ω, auf der f injektiv ist. Da Jf stetig ist und Jf (x0 ) ̸= 0 gilt, können
wir ε ∈ (0, δ) so wählen, dass Jf ̸= 0 in U := Bε (x0 ) erfüllt ist. Dann ist also
f |U regulär und injektiv, und nach Satz 5.2 ist U ∗ := f (U ) offen und f |U ein C 1 Diffeomorphismus von U auf U ∗ .
q.e.d.
Im nächsten Paragraphen werden wir eine Anwendung des Umkehrsatzes auf
implizit definierte Funktionen“ und, darauf aufbauend, auf Extremwertaufgaben
”
mit Nebenbedingungen kennenlernen. Wir beschließen diesen Paragraphen mit der
einfachen
Folgerung 5.1: Sei Ω ⊂ Rn offen und für s ≥ 1 sei f ∈ C s (Ω, Rn ) regulär und
injektiv mit dem Bild Ω∗ = f (Ω). Dann folgt f −1 ∈ C s (Ω∗ , Rn ).
Beweis: Nach Satz 5.2 ist f zunächst ein C 1 -Diffeomorphismus. Folgerung 1.1 entnehmen wir dann (siehe auch den Beweis von Satz 5.2):
(
)−1
Df −1 (y) = Df f −1 (y)
für alle y ∈ Ω∗ .
Durch sukzessives Differenzieren ergibt sich daraus f −1 ∈ C s (Ω∗ , Rn ).
q.e.d.
Definition 5.2: Eine injektive Abbildung f : Ω → Rn ∈ C s (Ω, Rn ) heißt C s -Diffeomorphismus von Ω ⊂ Rn auf f (Ω) für ein s ∈ N, wenn auch f −1 : f (Ω) → Rn zur
Klasse C s (f (Ω), Rn ) gehört.
Bemerkung: Folgerung 5.1 zeigt also insbesondere, dass unter den Voraussetzungen
von Satz 5.1 die Einschränkung f |U ein C s -Diffeomorphismus von U auf f (U ) ist,
falls zusätzlich f ∈ C s (Ω, Rn ) vorausgesetzt wird.
6
Der Satz über implizite Funktionen, Mannigfaltigkeiten im Rn und Extrema mit Nebenbedingungen
Wir betrachten zunächst allgemein das folgende Problem: Es seien n, d ∈ N und
f = f (x) : Ω → Rd ∈ C 1 (Ω, Rd ) gegeben auf der offenen Menge Ω ⊂ Rn , wobei
n = m + d mit einem m ∈ N gelte. Wir zerlegen x = (x1 , . . . , xn ) in die ersten
m Komponenten (x1 , . . . , xm ) =: (y1 , . . . , ym ) = y und die letzten d Komponenten
(xm+1 , . . . , xn ) =: (z1 , . . . , zd ) = z, d.h. wir haben
f = f (y, z) = f (y1 , . . . , ym , z1 , . . . , zd ),
(y, z) ∈ Ω.
190
KAPITEL 4. DIFFERENTIALRECHNUNG
Die Frage ist nun: Unter welchen Voraussetzungen lässt sich die Lösung der Gleichung
f (y, z) = 0 für (y, z) ∈ Ω
(6.1)
zumindest lokal (eindeutig) in der Form z = φ(y) darstellen. Genauer: Wann existiert
zu einem (y 0 , z 0 ) ∈ Ω mit f (y 0 , z 0 ) = 0 eine Umgebung U = U (y 0 ) ⊂ Rm und eine
Funktion φ = φ(y) : U → Rd , so dass sich alle Lösungen von (6.1) in einer Umgebung
W = W (y 0 , z 0 ) ⊂ Ω in der Form (y, φ(y)), y ∈ U , darstellen lassen. Dann gilt also
f (y, φ(y)) = 0,
y ∈ U.
(6.2)
Man sagt, Gleichung (6.1) sei dann lokal nach z aufgelöst und die Funktion z = φ(y)
ist durch die Gleichung (6.1) implizit definiert.
Beispiel: Wir betrachten die Funktion f = f (y, z) := y 2 + z 2 − 1, (y, z) ∈ R2
(d.h. m = d = 1, n = 2). Die Gleichung f = 0 beschreibt natürlich den Einheitskreis.
Ist nun (y 0 , z 0 ) ein Punkt auf dem Einheitskreis, d.h. f (y 0 , z 0 ) = 0, so lässt sich die
Gleichung f = 0 lokal um (y 0 , z 0 ) nach z auflösen, falls y 0 ∈ (−1, 1) gilt. Dann haben
wir
{ √
1 − y2,
falls z 0 > 0
√
z = φ(y) =
− 1 − y 2 , falls z 0 < 0
und (6.2) gilt für y ∈ U = (−1, 1). Für y 0 = ±1 existiert keine Umgebung U = U (y 0 ),
so dass f lokal nach z aufgelöst werden kann. Wir bemerken
{
̸= 0, für y 0 ∈ (−1, 1)
0 0
0
fz (y , z ) = 2z
= 0, für y 0 = ±1
Wir können also f = 0 lokal um (y 0 , z 0 ) nach z auflösen, falls fz (y 0 , z 0 ) ̸= 0 gilt.
Diese Bedingung bzw. ihr höherdimensionales Analogon wird sich auch allgemein
als hinreichend erweisen:
Satz 6.1: (Satz über implizite Funktionen)
Für s ∈ N sei f = f (y, z) = f (y1 , . . . , ym , z1 , . . . , zd ) : Ω → Rd ∈ C s (Ω, Rd ) auf der
offenen Menge Ω ⊂ Rn mit n = m + d gegeben. Für einen Punkt (y 0 , z 0 ) ∈ Ω gelte
f (y 0 , z 0 ) = 0,
wobei wir

det Dz f (y 0 , z 0 ) ̸= 0,
f1z1
 ..
Dz f :=  .
fdz1

. . . f1zd
.. 
..
.
. 
. . . fdzd
gesetzt haben. Dann gibt es eine Umgebung U = U (y 0 ) ⊂ Rm und eine Umgebung
W = W (y 0 , z 0 ) ⊂ Ω so, dass die Gleichung f (y, z) = 0 für jedes y ∈ U genau eine
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
191
Lösung (y, z) ∈ W besitzt. Die so erklärte Funktion z = φ(y) : U → Rd gehört
dann zur Klasse C s (U, Rd ) und die Lösungsmenge der Gleichung f = 0 in W hat
die Darstellung
{
(y, φ(y)) : y ∈ U } = graph φ.
Beweis: Wir erweitern f = f (y, z) zur Abbildung F = F (y, z) := (y, f (y, z)) ∈
C s (Ω, Rn ). Wir haben also die Zuordnung
(
)
F : Ω ⊂ Rn → Rn , (y, z) 7→ (y, ζ) := y, f (y, z) .
(6.3)

Schreiben wir noch
f1y1
 ..
Dy f :=  .
fdy1
so folgt für die Jacobimatrix von F :
(
DF (y, z) =

. . . f1ym
..  ,
..
.
. 
. . . fdym
)
E
O
,
Dy f (y, z) Dz f (y, z)
wobei E die m × m–Einheitsmatrix und O die m × d–Nullmatrix ist. Es folgt also
JF (y, z) = det DF (y, z) = det Dz f (y, z)
und insbesondere JF (y 0 , z 0 ) ̸= 0. Nach dem Umkehrsatz, Satz 5.1, und Folgerung 5.1
gibt es nun eine Umgebung W = W (y 0 , z 0 ) ⊂ Ω, so dass F |W ein C s -Diffeomorphismus auf die offene Menge W ∗ := F (W ) ist. Die Umkehrabbildung F −1 : W ∗ →
Rn ∈ C s (W ∗ , Rn ) gibt uns also eine Zuordnung
(
)
W ∗ ∋ (y, ζ) 7→ (y, z) =: y, g(y, ζ) ∈ Rn
(6.4)
mit einer Funktion g = g(y, ζ) ∈ C s (W ∗ , Rd ). Formeln (6.3) und (6.4) zeigen insbesondere
f (y, z) = 0 ⇔ z = g(y, 0) für (y, z) ∈ W.
Setzen wir also U = {y ∈ Rn : (y, 0) ∈ W } und φ(y) := g(y, 0) ∈ C s (U, Rd ), so ist
alles gezeigt.
q.e.d.
Bemerkung: Aus der Relation f (y, φ(y)) = 0 für y ∈ U folgt noch mit der Kettenregel
0 = Dy f (y, φ(y)) + Dz f (y, φ(y)) ◦ Dφ(y)
bzw.
wenn wir U =
Dφ(y) = −Dz f (y, φ(y))−1 ◦ Dy f (y, φ(y)),
U (y 0 )
y ∈ U,
(6.5)
hinreichend klein wählen.
Wir wollen noch eine geometrische Interpretation des Satzes über implizite Funktionen anfügen. Hierzu benötigen wir die
192
KAPITEL 4. DIFFERENTIALRECHNUNG
Definition 6.1: (Gleichungsdefinierte Mannigfaltigkeiten)
Sei Ω ⊂ Rn offen und sei d ∈ N gegeben mit m := n − d ∈ N. Eine Menge M ⊂ Ω
heißt m-dimensionale (gleichungsdefinierte) Mannigfaltigkeit der Klasse C s , s ∈ N,
wenn eine Funktion f = f (x) : Ω → Rd ∈ C s (Ω, Rd ) mit der Eigenschaft
rang Df (x) = d
so existiert, dass gilt
für alle x ∈ Ω mit f (x) = 0
{
}
M = x ∈ Ω : f (x) = 0 ⊂ Rn .
m ist die Dimension, d = n − m die Kodimension von M .
Bemerkung: Die Bedingung rang Df = d muss also auf M gelten. Wir werden
i.F. kurz von Mannigfaltigkeiten statt von gleichungsdefinierten Mannigfaltigkeiten
sprechen. Mannigfaltigkeiten sind die natürlichen zu untersuchenden Objekte in der
Differentialgeometrie“; mit ihnen lassen sich insbesondere Kurven und Flächen im
”3
R beschreiben (siehe obiges Beispiel der Kreislinie).
Beispiel: Ist Θ ⊂ Rm offen und φ = φ(y) : Θ → Rd ∈ C s (Θ, Rd ) eine beliebige
Funktion. Setzen wir dann n := m + d, Ω := Θ × Rd ⊂ Rn und
f (x) := z − φ(y),
x := (y, z) ∈ Ω,
so ist M := {x ∈ Ω : f (x) = 0} = graph φ ⊂ Rn eine m-dimensionale Mannigfaltigkeit der Klasse C s , denn es gilt fzj = ej , j = 1, . . . , d, und folglich rang Df = d
auf M . Jeder Graph einer Funktion der Klasse C s ist also eine Mannigfaltigkeit der
Klasse C s . Umgekehrt liefert Satz 6.1 die nachstehende
Folgerung 6.1: Jede m-dimensionale Mannigfaltigkeit M ⊂ Rn der Klasse C s ,
m < n, lässt sich lokal als Graph einer Funktion φ : U → Rd ∈ C s (U, Rd ) mit
d = n − m und U ⊂ Rm schreiben.
Beweis: Sei x0 ∈ M gewählt, insbesondere gilt also
f (x0 ) = 0 und rang Df (x0 ) = d.
Durch eventuelle Umbezeichnung der Koordinaten können wir o.B.d.A. annehmen:
(
)
det Dm+1 f (x0 ), . . . , Dn f (x0 ) ̸= 0.
Schreiben wir wieder x = (y, z) = (y1 , . . . , ym , z1 , . . . , zd ), so folgt
f (y 0 , z 0 ) = 0,
det Dz f (y 0 , z 0 ) ̸= 0.
Also können wir Satz 6.1 anwenden: Wir finden Umgebungen W = W (x0 ) ⊂ Ω und
U = U (y 0 ) ⊂ Rm sowie eine Funktion φ = φ(y) ∈ C s (U, Rd ), so dass gilt
M ∩ W = {(y, φ(y)) : y ∈ U } = graph φ,
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
wie behauptet.
193
q.e.d.
Beispiel: Seien Ω = R3 und fc (x, y, z) := x2 + y 2 − z 2 − c mit einer Konstante c ∈ R;
also gilt d = 1, n = 3 und somit m = n − d = 2. Wir berechnen
∇fc (x, y, z) = 2(x, y, −z).
Also ist Mc := {(x, y, z) ∈ R3 : fc (x, y, z) = 0} genau dann 2-dimensionale Mannigfaltigkeit (der Klasse C ∞ ), wenn c ̸= 0 gilt, da genau dann ∇fc ̸= 0 (d.h.
√ rang Dfc =
rang ∇fc = 1) auf Mc gilt. Für c = 0 ist M0 = {(x, y, z) : z = ± x2 + y 2 } ein
Kegel. Um den Ursprung (0, 0, 0) mit ∇f0 (0, 0, 0) = 0 lässt sich keine Umgebung als
Graph über einer der Koordinatenebenen darstellen; (0, 0, 0) heißt singulärer Punkt
von M0 .
Definition 6.2: (Tangential- und Normalraum)
Es sei M ⊂ Rn eine m-dimensionale Mannigfaltigkeit der Klasse C 1 mit Kodimension d := n − m ∈ N.
(i) Ein Vektor v ∈ Rn heißt Tangentialvektor von M im Punkt x ∈ M , wenn eine
Kurve c : (−δ, δ) → Rn ∈ C 1 ((−δ, δ), Rn ) mit
(
)
c(0) = x, ċ(0) = v und c (−δ, δ) ⊂ M
(6.6)
existiert. Die Menge aller solcher Vektoren heißt Tangentialraum Tx M von M
im Punkt x.
(ii) Das orthogonale Komplement
{
}
Tx⊥ M := ξ ∈ Rn : ⟨ξ, v⟩ = 0 für alle v ∈ Tx M
heißt Normalraum von M in x; seine Elemente heißen Normalenvektoren von
M in x.
Tx M (siehe Satz 6.2 (i) unten) und Tx⊥ M sind für jedes x ∈ M lineare Unterräume
des Rn mit
Tx M ⊕ Tx⊥ M = Rn .
Es gilt nun der
Satz 6.2: Die m-dimensionale Mannigfaltigkeit M ⊂ Rn mit Kodimension d =
n − m ∈ N sei gegeben durch M = {x ∈ Ω : f (x) = 0} mit einem f = (f1 , . . . , fd ) ∈
C 1 (Ω, Rd ). Dann gelten für alle x ∈ M :
(i) Tx M ist linearer Unterraum des Rn und dim Tx M = m, dim Tx⊥ M = d.
(ii) Tx⊥ M = span{∇f1 (x), . . . , ∇fd (x)}.
194
KAPITEL 4. DIFFERENTIALRECHNUNG
(
)
(iii) Tx M = {v ∈ Rn : Df (x)v = 0}, d.h. Tx M = Kern df (x) .
Beweis:
(i) Wir zeigen, dass Tx M linear ist und dim Tx M = m gilt; dann folgt sofort dim Tx⊥ M =
n − m = d.
Sei x0 ∈ M fixiert. Wir zerlegen wieder x = (y, z) = (y1 , . . . , ym , z1 , . . . , zd ), wobei o.B.d.A.
det Dz f (y 0 , z 0 ) ̸= 0 gelte. Wie in Folgerung 6.1 finden wir dann die lokale Graphendarstellung
{
}
M ∩ W = (y, φ(y)) : y ∈ U
mit Umgebungen W = W (x0 ) ⊂ Ω, U = U (y 0 ) ⊂ Rm und einer Funktion φ ∈ C 1 (U, Rd ).
Sei nun c ∈ C 1 ((−δ, δ), Rn ) eine Kurve mit der Eigenschaft (6.6) für x = x0 ∈ M und
v ∈ Tx0 M . Mit c := (c1 , . . . , cm ) ∈ C 1 ((−δ, δ), Rm ) haben wir dann für hinreichend kleines
δ > 0 die Darstellung
(
)
c(t) = c(t), φ(c(t)) , t ∈ (−δ, δ),
(6.7)
und folglich
(
)
v = ċ(0) = ċ(0), Dφ(y 0 ) ◦ ċ(0) .
(6.8)
Umgekehrt definiert natürlich jede Kurve (6.7) einen Tangentialvektor v ∈ Tx0 M durch (6.8).
Wählen wir speziell c(t) = y 0 + tej mit dem j-ten Einheitsvektor, j = 1, . . . , m, so erhalten
wir die m linear unabhängigen Tangentialvektoren
(
)
vj := ej , Dφ(y 0 )ej , j = 1, . . . , m.
Wir behaupten nun Tx0 M = span{v1 , . . . , vm }. Denn nach Obigem gehört ein v ∈ Rn genau
dann zu Tx0 M , wenn (6.8) für eine geeignete Kurve c = (c, φ ◦ c) : (−δ, δ) → Rn gilt. Dies
ist aber äquivalent zu
v=
m
∑
j=1
ċj (0)(ej , Dφ(y 0 )ej ) =
m
∑
ċj (0)vj ,
j=1
d.h. v ∈ span{v1 , . . . , vm }. Also ist Tx0 M linear und es gilt dim Tx0 M = m.
(ii) Ist c = c(t) ∈ C 1 ((−δ, δ), Rn ) eine beliebige Kurve mit der Eigenschaft (6.6)
für x ∈ M und v ∈ Tx M , so folgt für jede Komponentenfunktion fk von f :
0=
d
fk (c(t))
= ⟨∇fk (x), v⟩,
dt
t=0
k = 1, . . . , d.
Also gilt ∇f1 (x), . . . , ∇fd (x) ∈ Tx⊥ M . Wegen rang Df (x) = d sind die Vektoren ∇f1 (x), . . . , ∇fd (x) linear unabhängig, und wegen dim Tx⊥ M = d folgt
schließlich span{∇f1 (x), . . . , ∇fd (x)} = Tx⊥ M .
(iii) Für v ∈ Tx M gilt nach (ii) ⟨∇fk (x), v⟩ = 0 für k = 1, . . . , d bzw. Df (x)v = 0.
Ist umgekehrt v ∈ Rn mit Df (x)v = 0 gewählt, so folgt wiederum nach (ii)
v ∈ (Tx⊥ M )⊥ = Tx M . Somit gilt Tx M = {v ∈ Rn : Df (x)v = 0} und alles ist
gezeigt.
q.e.d.
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
195
Beispiel: Die Einheitssphäre S n−1 = {x ∈ Rn : |x| = 1} ⊂ Rn ist eine (n − 1)dimensionale Mannigfaltigkeit der Klasse C ∞ . Für f (x) := |x|2 − 1 ∈ C ∞ (Rn ) gilt
nämlich S n−1 = {x ∈ Rn : f (x) = 0} und wir haben ∇f (x) = 2x ̸= 0 für alle
x ∈ S n−1 . Aus Satz 6.2 folgt nun
Tx S n−1 =
{
}
v ∈ Rn : ⟨x, v⟩ = 0 ,
Tx⊥ S n−1 = span{x} für x ∈ S n−1 .
Wir wollen nun abschließend unser Wissen auf Extremwertaufgaben anwenden,
die Nebenbedingungen unterliegen, und beginnen mit der folgenden Verallgemeinerung von Definition 4.1 auf beliebige Mengen M ⊂ Rn :
Definition 6.3: Sei M ⊂ Rn beliebig und ϕ : M → R gegeben. Dann heißt x0 ∈ M
lokale Minimalstelle (bzw. Maximalstelle) von ϕ, wenn es eine Kugel Br (x0 ) ⊂ Rn
so gibt, dass
ϕ(x0 ) ≤ ϕ(x)
(bzw. ϕ(x0 ) ≥ ϕ(x))
für alle x ∈ M ∩ Br (x0 )
(6.9)
erfüllt ist. ϕ hat dann in x0 ein lokales Minimum (bzw. Maximum) oder, allgemein,
ein lokales Extremum. Bei strikter Ungleichung (für x ̸= x0 ) sprechen wir wieder
von strikten lokalen Extrema.
Satz 6.3: (Extrema mit Nebenbedingungen, Lagrangesche Multiplikatoren) Es sei ϕ : Ω → R ∈ C 1 (Ω) auf der offenen Menge Ω ⊂ Rn gegeben. Weiter sei
durch
{
}
M = x ∈ Ω : f (x) = 0
für eine Funktion f = (f1 , . . . , fd ) ∈ C 1 (Ω, Rd ) eine m-dimensionale Mannigfaltigkeit mit m := n − d ∈ N erklärt. Schließlich besitze die Einschränkung ϕ|M : M → R
in x0 ∈ M ein lokales Extremum. Dann gibt es reelle Zahlen λ1 , . . . , λd , so dass gilt
∇ϕ(x0 ) + λ1 ∇f1 (x0 ) + . . . + λd ∇fd (x0 ) = 0,
(6.10)
d.h. x0 ∈ M ⊂ Ω ist kritischer Punkt der Funktion
ψ(x) := ϕ(x) + λ1 f1 (x) + . . . + λd fd (x),
x ∈ Ω.
(6.11)
Die Zahlen λ1 , . . . , λd heißen Langrange Multiplikatoren.
Bemerkung: Wegen Satz 6.2 (ii) besagt Satz 6.3: Notwendig für eine Extremalstelle
x0 ∈ M von ϕ|M ist, dass der Vektor ∇ϕ(x0 ) Normalenvektor von M im Punkt x0
ist.
196
KAPITEL 4. DIFFERENTIALRECHNUNG
Beweis von Satz (6.3: Sei)v ∈ Tx0 M beliebig und c ∈ C 1 ((−δ, δ), Rn ) mit c(0) = x0 ,
ċ(0) = v und c (−δ, δ) ⊂ M gewählt. Der Satz von Fermat liefert dann nach
Einsetzen in ϕ:
)
d (
0 = ϕ c(t) = ⟨∇ϕ(x0 ), v⟩.
dt
t=0
Also ist ∇ϕ(x0 ) ∈ Tx⊥0 M richtig. Nach Satz 6.2 (ii) gibt es daher Zahlen µ1 , . . . , µd ∈
R mit
d
∑
∇ϕ(x0 ) =
µk ∇fk (x0 ),
k=1
und (6.10) folgt mit λk := −µk für k = 1, . . . , d.
q.e.d.
Bemerkung: In Satz 6.3 treten n + d Unbekannte x01 , . . . , x0n , λ1 , . . . , λd ∈ R auf, die
aus den n + d Gleichungen
∑ ∂fk
∂ϕ 0
(x ) +
λk
(x0 ) = 0,
∂xj
∂xj
d
j = 1, . . . , n,
k=1
fk (x0 ) = 0,
k = 1, . . . , d,
zu bestimmen sind. Häufig ist es sinnvoll, zunächst alle kritischen Punkte x0 ∈ Ω
der Funktion ψ = ϕ + λ1 f1 + . . . + λd fd mit beliebigen λ1 , . . . , λd ∈ R zu bestimmen
und anschließend jene auszuwählen, die zusätzlich die Bindungsgleichungen f1 (x0 ) =
. . . = fd (x0 ) = 0 erfüllen.
Beispiel (Youngsche Ungleichung): Wir setzen Ω := {(x, y) ∈ R2 : x > 0, y > 0}. Zu p, q > 1 mit
1
+ 1q = 1 erklären wir
p
ϕ(x, y) := xy,
xp
yq
f (x, y) :=
+ ,
p
q
(x, y) ∈ Ω.
Zu beliebigem c > 0 betrachten wir nun
{
}
Mc := (x, y) ∈ Ω : f (x, y) − c = 0 .
Wegen ∇(f (x, y) − c) = ∇f (x, y) = (xp−1 , y q−1 ) ̸= 0 für (x, y) ∈ Mc ist Mc ⊂ R2 für jedes c > 0
eine 1-dimensionale Mannigfaltigkeit. Auf der kompakten Menge Mc = {(x, y) ∈ Ω : f (x, y) = c}
nimmt ϕ|Mc in einem Punkt (x0 , y0 ) ∈ Mc ihr Maximum an. Wegen ϕ = 0 auf Mc \ Mc folgt
(x0 , y0 ) ∈ Mc . Nach Satz 6.3 existiert also ein λ ∈ R mit
∇ϕ(x0 , y0 ) + λ∇f (x0 , y0 ) = 0
bzw.
y0 + λxp−1
= 0,
0
x0 + λy0q−1 = 0
bzw.
−λxp0 = x0 y0 = −λy0q .
Daraus folgt xp0 = y0q und somit
f (x0 , y0 ) =
(1
yq
xp0
1) p
+ 0 =
+
x = xp0 = y0q = c.
p
q
p
q 0
6. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
1
197
1
Einsetzen in ϕ liefert ϕ(x0 , y0 ) = x0 y0 = c p c q = c bzw.
ϕ(x, y) ≤ c = f (x, y)
für alle (x, y) ∈ Mc .
Da schließlich c > 0 beliebig war, folgt ϕ ≤ f auf Ω, also die Youngsche Ungleichung
xy ≤
xp
yq
+
p
q
für alle x, y ≥ 0.
Satz 6.4 : (Hinreichende Bedingung unter Nebenbedingungen)
Es sei ϕ ∈ C 2 (Ω), Ω ⊂ Rn , und f = (f1 , . . . , fd ) ∈ C 2 (Ω, Rd ) definiere die m = n − d-dimensionale
Mannigfaltigkeit M = {x ∈ Ω : f (x) = 0} der Klasse C 2 . Weiter seien x0 ∈ M und λ1 , . . . , λd ∈ R
so gewählt, dass die Funktion
ψ(x) := ϕ(x) + λ1 f1 (x) + . . . + λd fd (x),
x ∈ Ω,
0
in x einen kritischen Punkt hat. Gilt dann
⟨v, Hψ (x0 )v⟩ > 0 (bzw. < 0)
für alle v ∈ Tx0 M \ {0},
(6.12)
0
so besitzt ϕ|M in x ein striktes lokales Minimum (bzw. Maximum).
Beweis: Sei x0 ∈ M wie beschrieben gewählt und ⟨v, Hψ (x0 )v⟩ > 0 für alle v ∈ Tx0 M erfüllt.
Nach Folgerung 6.1 gibt es dann (nach eventueller Umbezeichnung der Koordinaten) Umgebungen
W = W (x0 ) ⊂ Rn und U = Bε (y 0 ) ⊂ Rm sowie eine Funktion φ ∈ C 2 (U, Rd ), so dass x0 =
(y 0 , φ(y 0 )) und M ∩ W = {(y, φ(y)) : y ∈ U } gilt. Die Abbildung g(y) := (y, φ(y)) bildet also U
bijektiv auf M ∩ W ab.
Wir betrachten nun die Funktion χ := ψ ◦ g ∈ C 2 (U ). Wir haben dann die qualitative Taylorformel (4.3):
1
χ(y) − χ(y 0 ) = ⟨∇χ(y 0 ), h⟩ + ⟨h, Hχ (y 0 )h⟩ + o(|h|2 )
(6.13)
2
mit h := y − y 0 ∈ Rm . Nach Voraussetzung gilt
∇χ(y 0 ) = Dg(y 0 ) ◦ ∇x ψ(g(y 0 )) = Dg(y 0 ) ◦ ∇ψ(x0 ) = 0
(6.14)
und man rechnet leicht nach
⟨
⟩
⟨h, Hχ (y 0 )h⟩ = Dg(y 0 )h, Hψ (x0 ) ◦ Dg(y 0 )h .
(6.15)
Nun ist Dg(y 0 )h = (h, Dφ(y 0 )h) ∈ Tx0 M für beliebiges h ∈ Rm richtig (vgl. Beweis von Satz 6.2 (i)).
Da ⟨v, Hψ (x0 )v⟩ auf der kompakten Menge S n−1 ∩ Tx0 M ihr positives Minimum µ > 0 annimmt,
folgt
⟨ v
v ⟩ 2
⟨v, Hψ (x0 )v⟩ =
, Hψ (x0 )
|v| ≥ µ|v|2 für alle v ∈ Tx0 M
|v|
|v|
und aus (6.15) insbesondere noch
⟨h, Hχ (y 0 )h⟩ ≥ µ|Dg(y 0 )h|2 ≥ µ|h|2
für h = y − y 0 .
(6.16)
Setzen wir nun (6.14) und (6.16) in (6.13) ein, so folgt
ϕ(x) − ϕ(x0 ) = χ(y) − χ(y 0 ) ≥
µ 2 µ
|h| − o(|h|2 ) ≥ |h|2
2
4
für h = y−y 0 und beliebiges y ∈ Bε (y 0 ) mit hinreichend kleinem ε > 0. Wir haben also insbesondere
ϕ(x) > ϕ(x0 ) für alle x ∈ M ∩ W \ {x0 }, wie behauptet. Der Fall eines lokalen Maximums wird
entsprechend behandelt.
q.e.d.
Durch eine naheliegende Modifikation des Beweises von Satz 6.4 erhält man noch den
198
KAPITEL 4. DIFFERENTIALRECHNUNG
Satz 6.5 : (Notwendige Bedingung 2. Ordnung unter Nebenbedingungen)
Es seien ϕ ∈ C 2 (Ω), f = (f1 , . . . , fd ) ∈ C 2 (Ω, Rd ) und M ⊂ Ω wie in Satz 6.4 erklärt. Falls dann
ϕ|M in x0 ein lokales Minimum (bzw. Maximum) besitzt, so gilt
⟨v, Hψ (x0 )v⟩ ≥ 0 (bzw. ≤ 0)
für ψ(x) = ϕ(x)+
d
∑
für alle v ∈ Tx0 M
(6.17)
λk fk (x); dabei sind λ1 , . . . , λd ∈ R die wie in Satz 6.3 gewählten Lagrangeschen
k=1
Parameter.
Beweis: Angenommen, für einen lokalen Maximierer x0 existiert ein v ∈ Tx0 M ∩ S n−1 mit der
Eigenschaft ⟨v, Hψ (x0 )v⟩ = µ > 0. Wir erinnern an die lokale Graphendarstellung um x0 und
verwenden die Bezeichnungen aus dem Beweis von Satz 6.4. Formel (6.13) gilt dann für alle h ∈
Bε (0) ⊂ Rm mit hinreichend kleinem ε > 0 und mit y = y 0 +h. Ist c = (c, φ◦c) = g◦c : (−δ, δ) → Rn
eine Kurve mit v = ċ(0) - vgl. Beweis von Satz 6.2 (i) - so wenden wir (6.13) speziell auf h = ϱċ(0)
mit ϱ ∈ (0, ϱ0 ) für hinreichend kleines ϱ0 > 0 an. Beachten wir noch (6.14) und (6.15), so erhalten
wir mit xϱ := g(y 0 + ϱċ(0)):
(
)
ϱ2
ϱ2 µ
ϕ(xϱ ) − ϕ(x0 ) = χ y 0 + ϱċ(0) − χ(y 0 ) =
⟨v, Hψ (x0 )v⟩ + o(ϱ2 ) ≥
>0
2
4
für alle ϱ ∈ (0, ϱ1 ), ϱ1 ≤ ϱ0 geeignet. Wegen xϱ → x0 (ϱ → 0) steht dies im Widerspruch zur lokalen
Maximaleigenschaft von x0 . Analog erfolgt der Beweis für lokale Minimierer.
q.e.d.
Kapitel 5
Das n-dimensionale
Riemannsche Integral
Wir wollen nun Funktionen f : M → Rd für Mengen M ⊂ Rn integrieren. Die
geometrische Idee für den Fall d = 1 und nichtnegatives, beschränktes f ist zunächst
wie im Eindimensionalen: Die Bestimmung des Volumens des zylindrischen Körpers
im Rn+1 mit Grundfläche M × {0}, Deckelfläche graph f = {(x, f (x) : x ∈ M } und
Mantelfläche {(x, y) ∈ Rn+1 : x ∈ ∂M, y ∈ [0, f (x)]} Hierzu werden wir zunächst
die Konstruktion des eindimensionalen Integrals über abgeschlossene Intervalle I =
[a, b] direkt auf Integrale über abgeschlossene Quader Q = [a1 , b1 ] × . . . × [an , bn ]
übertragen. Dann werden wir das Integral auf sogenannte quadrierbare Mengen M
verallgemeinern, die wir in Quader einsperren. Zentrales Ergebnis dieses Kapitels ist
die Transformationsformel.
1
Das Integral über Quader
Sind Ij = [aj , bj ] ⊂ R abgeschlossene Intervalle für j = 1, . . . , n, so nennen wir
{
}
Q := I1 × . . . × In = (x1 , . . . , xn ) ∈ Rn : xj ∈ [aj , bj ], j = 1, . . . , n
einen Quader im Rn . Mit
|Q| :=
n
∏
|Ij | =
j=1
n
∏
(bj − aj )
j=1
bezeichnen wir den Inhalt von Q. In Analogie zu Definition 4.1 aus Kapitel 3 erklären
wir nun:
199
200
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Definition 1.1: Sei Q ⊂ Rn ein Quader und f : Q → R beschränkt.
• Es seien Z (j) Zerlegungen von Ij für j = 1, . . . , n mit
aj = xj,0 < xj,1 < . . . < xj,Nj = bj .
Dann heißt Z := Z (1) × . . . × Z (n) Zerlegung von Q. Wir schreiben Ij,αj =
[xj,αj −1 , xj,αj ] mit αj ∈ {1, . . . , Nj }, j = 1, . . . , n, für das αj -te Teilintervall
der Zerlegung Z (j) und erklären die Teilquader
Qα := I1,α1 × . . . × In,αn ,
α = (α1 , . . . , αn ) ∈ A,
wobei A die Menge der auftretenden Multiindizes angibt:
{
}
A = α = (α1 , . . . , αn ) ∈ Nn : 1 ≤ αj ≤ Nj , j = 1, . . . n .
Wir setzen schließlich
∆(Z) := max{∆Z (1) , . . . , ∆Z (n) }
für die Feinheit der Zerlegung Z.
• Mit den Abkürzungen
mα := inf f,
Qα
mα := sup f
Qα
bilden wir die Untersumme
S Z (f ) :=
∑
mα |Qα |
α∈A
und die Obersumme
S Z (f ) :=
∑
mα |Qα |
α∈A
von f (zur Zerlegung Z).
• Aus jedem Teilquader Qα wählen wir ξα ∈ Qα , α ∈ A. Dann nennen wir
SZ (f ) :=
∑
f (ξα )|Qα |
α∈A
eine Riemannsche Zwischensumme von f (zur Zerlegung Z).
1. DAS INTEGRAL ÜBER QUADER
201
Bemerkungen:
1. Es gibt genau N1 · N2 · . . . · Nn Teilquader Qα die sich nach Konstruktion
offenbar nicht überlappen und für die gilt
|Q| =
∑
|Qα |.
(1.1)
α∈A
2. Offenbar gilt
S Z (f ) ≤ SZ (f ) ≤ S Z (f )
für jede Riemannsche Zwischensumme.
Definition 1.2:
(1)
(n)
• Eine Zerlegung Z∗ = Z∗ ×. . .×Z∗ von Q heißt Verfeinerung einer Zerlegung
(j)
Z = Z (1) × . . . × Z (n) von Q, wenn Z∗ Verfeinerung von Z (j) ist für alle
j = 1, . . . , n.
• Eine gemeinsame Verfeinerung Z ∨ Z∗ von Z und Z∗ ist erklärt als
(1)
(n)
Z ∨ Z∗ := (Z (1) ∨ Z∗ ) × . . . × (Z (n) ∨ Z∗ ).
Völlig analog zu Hilfssatz 4.1 in Kap. 3 beweist man den
Hilfssatz 1.1:
(i) Ist Z∗ Verfeinerung der Zerlegung Z von Q, so gilt
S Z (f ) ≤ S Z∗ (f ) ≤ S Z∗ (f ) ≤ S Z (f ).
(ii) Sind Z1 , Z2 zwei beliebige Zerlegungen von Q, so gilt
S Z1 (f ) ≤ S Z2 (f ).
Definition 1.3: Ist f : Q → R beschränkt, so erklären wir das Unterintegral I(f )
und Oberintegral I(f ) von f als
{
}
I(f ) = I Q (f ) := sup S Z (f ) : Z ist Zerlegung von Q ,
{
}
I(f ) = I Q (f ) := inf S Z (f ) : Z ist Zerlegung von Q .
202
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkung: Für jede beschränkte Funktion f : Q → R und jede Zerlegung Z von
Q gilt nach Hilfssatz 1.1 (i):
−∞ < |Q| inf f ≤ S Z (f ) ≤ S Z (f ) ≤ |Q| sup f < +∞.
Q
Q
Also sind I(f ), I(f ) ∈ R wohl definiert und Hilfssatz 1.1 (ii) entnehmen wir noch
S Z (f ) ≤ I(f ) ≤ I(f ) ≤ S Z (f )
(1.2)
für alle Zerlegungen Z von Q.
Definition 1.4: Eine beschränkte Funktion f : Q → R heißt (Riemann)-integrierbar auf dem Quader Q ⊂ Rn , wenn I(f ) = I(f ) erfüllt ist. Wir setzen dann
I(f ) := I(f ) = I(f )
für das (Riemannsche) Integral von f auf Q und schreiben auch
∫
∫
∫
I(f ) = f (x) dx = f dx1 . . . dxn = f dV,
Q
Q
Q
wobei dV = dx = dx1 . . . dxn das Volumenelement bezeichnet. Die Klasse aller
Riemann-integrierbaren Funktionen auf Q bezeichen wir mit R(Q).
Beispiel: f (x) := c, x ∈ Q ⊂ Rn , mit einer Konstante c ∈ R. Wegen
S Z (f ) =
∑
(1.1)
c|Qα | = c|Q|,
S Z (f ) = c|Q|
α∈A
für beliebige Zerlegungen Z von Q in Teilquader Qα , α ∈ A, folgt f ∈ R(Q) und
∫
c dx = c|Q|.
Q
Exakt wie Satz 4.1 in Kap. 3 beweist man nun den
Satz 1.1: (Integrabilitätskriterium I)
Für eine beschränkte Funktion f : Q → R gilt
f ∈ R(Q)
⇔
Für alle ε > 0 existiert eine Zerlegung Z
von Q mit S Z (f ) − S Z (f ) < ε.
Ein wenig anpassen muss man den Beweis von Satz 4.2 aus Kap. 3, um das folgende Ergebnis zu erhalten:
1. DAS INTEGRAL ÜBER QUADER
203
Satz 1.2: (Integrabilitätskriterium II)
Für eine beschränkte Funktion f : Q → R gilt
f ∈ R(Q)
⇔
Für alle ε > 0 existiert ein δ = δ(ε), so dass gilt:
S Z (f ) − S Z (f ) < ε für alle Zerlegungen Z mit ∆(Z) < δ.
Wiederum durch wörtliches Übertragen von Folgerung 4.1 aus Kap. 3 erhalten
wir die
Folgerung 1.1: Sei f ∈ R(Q) und {Zp }p eine ausgezeichnete Zerlegungsfolge von
Q, d.h. ∆(Zp ) → 0 (p → ∞). Ist dann {SZp (f )}p eine zugehörige Folge beliebiger
Riemannscher Zwischensummen, so gilt
∫
f (x) dx = lim SZp (f ).
p→∞
Q
Bemerkung: Verknüpfung von Satz 1.2 und Folgerung 1.1 zeigt sofort: Ist f ∈ R(Q)
und {Zp }p eine ausgezeichnete Zerlegungsfolge von Q, so folgt
∫
lim S Zp (f ) = lim S Zp (f ) = f (x) dx.
p→∞
p→∞
Q
Mit Hilfe der obigen Integrabilitätskriterien lassen sich viele Ergebnisse der Integration über Intervalle direkt auf Integrale über Quader Q übertragen. Wir verzichten daher auf die Beweise der folgenden beiden Sätze:
Satz 1.3: (Rechenregeln; vgl. Satz 4.3 in Kap. 3)
(i) Gilt f, g ∈ R(Q), so auch αf + βg ∈ R(Q) für beliebige α, β ∈ R, und es gilt
I(αf + βg) = αI(f ) + βI(g);
R(Q) ist also ein reeller Vektorraum.
(ii) Sind f, g ∈ R(Q) mit f ≤ g auf Q gegeben, so folgt
I(f ) ≤ I(g).
(iii) Mit f ∈ R(Q) ist auch |f | ∈ R(Q) richtig mit
|I(f )| ≤ I(|f |).
204
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
(iv) Sind f, g ∈ R(Q), so auch f · g ∈ R(Q) und es gilt
(
)
|I(f g)| ≤ sup |g| · I(|f |).
Q
(v) Gilt f, g ∈ R(Q) sowie |g| ≥ c > 0 auf Q mit einer Konstanten c > 0, so folgt
auch fg ∈ R(Q) mit
( f ) 1
I
≤ I(|f |).
g
c
Satz 1.4: (vgl. Satz 4.5 in Kap. 3) Es gilt C 0 (Q) ⊂ R(Q).
Bemerkungen:
1. Für Funktionen f = (f1 , . . . , fd ) : Q → Rd auf einem Quader Q ⊂ Rn mit
fj ∈ R(Q), j = 1, . . . , d, erklären wir das Integral wieder komponentenweise:
)
(∫
∫
∫
f1 dx, . . . , fd dx .
f dx :=
Q
Q
Q
Wir schreiben R(Q, Rd ) für die Klasse der integrierbaren Rd -wertigen Funktionen. Entsprechend ist R(Q, C) die Klasse der komplexwertigen integrierbaren
Funktionen mit
∫
∫
∫
f dx := Re f dx + i Im f dx.
Q
Q
Q
Die Rechenregeln, Satz 1.3 (i), (iii), (iv) (in (iv) entspricht das Produkt natürlich ⟨f, g⟩ für f, g ∈ R(Q, Rd )) und Satz 1.4 lassen sich wieder sofort übertragen.
2. Eine Funktion f : Q → Rd heißt integrierbar über Q′ ⊂ Q, wenn f |Q′ ∈
R(Q′ , Rd ) gilt. Man überlegt sich leicht R(Q, Rd ) ⊂ R(Q′ , Rd ) für alle Quader
Q′ ⊂ Q; wir schreiben
∫
∫
f |Q′ dx.
f dx :=
Q′
Q′
Wir wollen nun Integrale über Quader im Rn auf Integrale über niederdimensionale Quader zurückführen. Sei dazu f = f (x, y) : Q × R → R ∈ R(Q × R) für
Quader Q ⊂ Rq , R ⊂ Rr mit q + r = n vorgelegt. Für festes x ∈ Q schreiben wir
dann
φ(x) := I R (f (x, ·)), φ(x) := I R (f (x, ·)), x ∈ Q,
(1.3)
für das Unter- bzw. Oberintegral von f (x, ·) : R → R, welche nicht übereinstimmen
müssen. Wir bemerken, dass φ, φ : Q → R wieder beschränkt sind und gemäß (1.2)
φ ≤ φ auf Q erfüllen. Es gilt nun der
1. DAS INTEGRAL ÜBER QUADER
205
Satz 1.5: (Iterierte Integration)
Für beliebiges f = f (x, y) : Q × R → R ∈ R(Q × R) sind die in (1.3) erklärten
Funktionen φ, φ : Q → R integrierbar über Q und es gilt
∫
∫
∫
f (x, y) dx dy = φ(x) dx = φ(x) dx.
Q×R
Q
Q
Beweis: Wir betrachten Zerlegungen ZQ von Q in Teilquader Qα , α ∈ A, und ZR
von R in Teilquader Rβ , β ∈ B. Dann ist ZT := ZQ × ZR eine Zerlegung von
T := Q × R mit Teilquadern Tαβ := Qα × Rβ , (α, β) ∈ A × B. Umgekehrt lässt sich
so jede Zerlegung von T durch Zerlegungen von Q und R darstellen. Wir bemerken
noch
{
}
∆(ZT ) = max ∆(ZQ ), ∆(ZR ) .
(1.4)
Nun erklären wir die Größen
mαβ := inf f,
Tαβ
mαβ := sup f,
(α, β) ∈ A × B.
Tαβ
Für beliebiges x ∈ Qα mit einem α ∈ A folgt dann
∑
∑(
)
mαβ |Rβ | ≤
inf f (x, y) |Rβ | ≤ I R (f (x, ·)) = φ(x)
β∈B
β∈B
und entsprechend
∑
y∈Rβ
mαβ |Rβ | ≥ φ(x) ≥ φ(x).
β∈B
Insbesondere können wir zum Infimum bzw. Supremum bez. x ∈ Qα übergehen und
erhalten
∑
∑
mαβ |Rβ | ≤ inf φ ≤ sup φ ≤
mαβ |Rβ |.
(1.5)
β∈B
Qα
Qα
β∈B
Die gleiche Relation gilt offenbar für φ. Multiplizieren wir (1.5) mit |Qα | und summieren über α ∈ A, so folgt (beachte |Tαβ | = |Qα | |Rβ |):
S ZT (f ) ≤ S ZQ (φ) ≤ S ZQ (φ) ≤ S ZT (f ),
(1.6)
und wiederum gilt die gleiche Relation auch für φ. Da nun f über T = Q × R
integrierbar ist, existiert nach Satz 1.1 zu beliebigem ε > 0 eine Zerlegung ZT von
T mit
S ZT (f ) − S ZT (f ) < ε.
Für die zugehörige Zerlegung ZQ von Q folgt also aus (1.6):
S ZQ (φ) − S ZQ (φ) < ε,
206
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
und wiederum nach Satz 1.1 ist φ und entsprechend φ integrierbar. Wählen wir
schließlich in (1.6) eine ausgezeichnete Zerlegungsfolge {ZT,p }p mit ∆(ZT,p ) →
0 (p → +∞), so ist wegen (1.4) auch die zugehörige Folge {ZQ,p }p ausgezeichnet
und Folgerung 1.1 bzw. die anschließende Bemerkung liefern
∫
∫
f (x, y) dx dy = lim S ZT,p (f ) = lim S ZQ,p (φ) = φ(x) dx.
p→∞
p→∞
Q×R
Q
Entsprechend folgt aus der (1.6) entsprechenden Relation für φ noch
∫
∫
f (x, y) dx dy = φ(x) dx.
Q×R
Q
Damit ist alles gezeigt.
q.e.d.
Bemerkungen:
1. Offensichtlich überträgt sich die Aussage von Satz 1.5 sofort auf vektor-bzw.
komplexwertige Funktionen, wobei dann die Definition von φ und φ komponentweise zu verstehen ist.
2. φ und φ stimmen genau dann in Q überein, wenn f (x, ·) : R → R für jedes
x ∈ Q integrierbar ist; dann ist φ(x) = IR (f (x, ·)) = φ(x) auf Q richtig. Da
nach Satz 1.4 jede stetige Funktion integrierbar ist, erhalten wir sofort den
folgenden
Satz 1.6: (Iterierte Integration stetiger Funktionen)
Ist f = f (x, y) : Q × R → Rd ∈ C 0 (Q × R, Rd ) gegeben, so ist f (x, ·) : R → Rd für
jedes x ∈ Q über R integrabel und es gilt
)
∫
∫ (∫
f (x, y) dx dy =
f (x, y) dy dx.
(1.7)
Q×R
Q
R
Bemerkungen:
1. Durch Umbezeichnung x ↔ y, also Vertauschen der Koordinaten, entnimmt
man (1.7):
)
)
∫ (∫
∫
∫ (∫
f (x, y) dy dx =
f (x, y) dx dy =
f (x, y) dx dy.
(1.8)
Q
R
Q×R
R
Q
Auf die Reihenfolge der Integration kommt es also nicht an!
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
207
2. Ist Q = I1 × . . . × In ⊂ Rn ein Quader und f : Q → Rd ∈ C 0 (Q, Rd ), so folgt
aus Satz 1.6
∫ (∫ (
∫
f dx1 . . . dxn =
Q
(∫
...
I1
I2
)
)
)
f dxn . . . dx2 dx1 .
(1.9)
In
Wir können also jedes Integral einer stetigen Funktion auf einem Quader im Rn
durch sukzessives eindimensionales Integrieren auswerten. Wie in (1.8) spielt
die Reihenfolge der Integration dabei keine Rolle.
Beispiele:
1. Sei f (x, y) = xy, Q = [0, 2] × [0, 1]. Dann gilt
∫
f dx dy
∫2 ( ∫1
(1.9)
=
0
Q
)
xy dy dx
(1.8)
∫1 ( ∫2
=
0
0
)
xy dx dy
0
)
∫1 ( ∫2
∫1
y x dx dy =
2y dy = 1.
=
0
0
0
2
2. Sei f (x, y) = xyex y , Q ∈ [0, 1] × [0, 1]. Dann gilt
∫1 ( ∫1
∫
xye
f dx dy =
0
Q
∫1
=
0
x2 y
)
)
∫1 ( ∫1
∂ [ 1 x2 y ]
dx dy =
e
dx dy
∂x 2
0
0
1 y
1
(e − 1) dy = (e − 2).
2
2
0
2
Unstetigkeitsstellen integrierbarer Funktionen
und der Satz von Heine-Borel
Wir wollen nun untersuchen, wie groß“ die Menge der Unstetigkeitsstellen einer
”
Funktion f : Q → R (oder auch Rd , C) werden darf, damit f noch integrierbar
bleibt. Dies ist entscheidend für die Integration über allgemeinere Mengen des Rn ,
siehe § 3. Wir benötigen zunächst die
208
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Definition 2.1:
(i) Eine Menge M ⊂ Rn hat den Inhalt Null (i.Z. |M | = 0), wenn es zu jedem
ε > 0 Quader Q1 , . . . , QN mit einem N = N (ε) ∈ N so gibt, dass gilt
M⊂
N
∪
Q̊j ,
N
∑
|Qj | < ε.
j=1
j=1
(ii) M hat das Maß Null (i.Z. meas M = 0), falls zu jedem ε > 0 höchstens
abzählbar viele Quader Q1 , Q2 , . . . so existieren, dass gilt
M⊂
∞
∪
j=1
Q̊j ,
∞
∑
|Qj | < ε.
j=1
M heißt dann Nullmenge.
Bemerkungen:
1. Mengen vom Inhalt Null besitzen also zu jedem ε > 0 eine endliche Überdeckung durch offene Quader mit Gesamtinhalt < ε (vgl. Definition 2.2 unten). Hingegen sind für Mengen vom Maß Null auch solche Überdeckungen
mit abzählbar unendlich vielen Quadern zulässig. Jede Menge vom Inhalt Null
ist also auch Nullmenge; die Umkehrung gilt nicht!
2. Offenbar hat jede Teilmenge einer Menge mit Inhalt Null (bzw. Maß Null)
ebenfalls den Inhalt Null (bzw. Maß Null).
Hilfssatz 2.1:
(i) Die Vereinigung endlich vieler Mengen vom Inhalt Null hat ebenfalls den Inhalt
Null.
(ii) Die Vereinigung höchstens abzählbar vieler Nullmengen ist wieder Nullmenge
Beweis:
(i) Ist klar.
∪
(ii) Seien M1 , M2 , . . . ⊂ Rn mit meas Mk = 0 für alle k gegeben und M = k Mk .
Zu beliebigem ε > 0 und jedem k existieren dann höchstens abzählbar viele
Quader Qk1 , Qk2 , . . . mit
∪
∑
Mk ⊂
Q̊kj und
|Qkj | < 2−k ε.
j
j
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
209
Die Menge der auftretenden Indizes (j, k) ist Teilmenge von N × N und somit
höchstens abzählbar. Es gilt nun
∪
∪
M=
Mk ⊂
Q̊kj
k
sowie
∑
|Qkj | < ε
(j,k)
∑
2−k ≤ ε
k
(j,k)
∞ ( )
∑
1 k
k=1
2
= ε,
wie behauptet.
q.e.d.
Hilfssatz 2.2: Ist K ⊂ Rn kompakt und φ ∈ C 0 (K), so ist graph φ ⊂ Rn+1 eine
Menge vom Inhalt Null.
Beweis: Da K kompakt ist, gibt es einen Würfel W = [−r, r] × . . . × [−r, r] mit |W | = (2r)n , r > 0,
so dass K ⊂ W gilt. Zu beliebigem ε > 0 wählen wir η = η(ε) > 0 mit
2n+1 η|W | < ε.
Da φ auf K gleichmäßig stetig ist, existiert weiter ein δ = δ(ε) > 0, so dass
|φ(x) − φ(x′ )| < η
für alle x, x′ ∈ K : |x − x′ | < δ
∪
erfüllt ist. Schließlich wählen wir eine äquidistante Zerlegung W = α∈A W̃α von W mit diam W̃α <
δ für alle α ∈ A (A ⊂ Nn ist eine endliche Indexmenge). Sind dann ξα ∈ W̃α , α ∈ A′ := {α ∈ A :
W̃α ∩ K ̸= ∅} beliebig gewählt, so erklären wir
(
)
Q̃α := W̃α × φ(ξα ) − η, φ(ξα ) + η ⊂ Rn+1 , α ∈ A′ .
Damit gilt offenbar
graph φ ⊂
∪
Q̃α .
α∈A′
Ersetzen wir noch W̃α durch den gleichzentrierten Würfel Wα mit doppelter Kantenlänge, so folgt
für
[
]
Qα := Wα × φ(ξα ) − η, φ(ξα ) + η , α ∈ A′ ,
dann Q̃α ⊂ Q̊α und somit
graph φ ⊂
∪
∪
Q̃α ⊂
α∈A′
Q̊α .
α∈A′
Wegen |Qα | = 2n |Q̃α | erhalten wir noch
∑
α∈A′
wie behauptet.
|Qα | =
∑
α∈A′
2n |Q̃α | = 2n (2η)
∑
(1.1)
|W̃α | = 2n+1 η|W | < ε,
α∈A′
q.e.d.
Als nächstes werden wir zeigen, dass jede kompakte Nullmenge den Inhalt Null
hat. Hierzu beweisen wir einen zentralen Satz der Analysis, für den wir noch die
folgenden Begriffe erklären:
210
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Definition 2.2: Es sei J eine beliebige, nicht notwendig abzählbare Indexmenge.
Eine Familie F = {Ωj }j∈J offener Mengen Ωj ⊂ Rn heißt dann offene Überdeckung
einer Menge M ⊂ Rn , wenn gilt
M⊂
∪
Ωj .
j∈J
Die Überdeckung heißt endlich, wenn sie nur endlich viele Mengen Ωj enthält, d.h. J
ist endliche Indexmenge.
Bemerkungen:
1. Jede
Menge M ̸= ∅ hat eine triviale offene Überdeckung, nämlich M ⊂
∪
x∈M Br (x) mit beliebigem Radius r = r(x) > 0.
2. Ist M offen, so ist {M } eine endliche offene Überdeckung von M .
3. Jede beschränkte Menge M , d.h. |x| < R für alle x ∈ M mit einem R > 0,
besitzt die endliche offene Überdeckung {BR (0)}.
Satz 2.1: (Heine-Borel)
Eine Menge K ⊂ Rn ist genau dann kompakt, wenn sich aus jeder offenen Überdeckung von K eine endliche Überdeckung von K auswählen lässt.
Bemerkung: Die Richtung ⇒“ in Satz 2.1 ist der berühmte Satz von Heine-Borel.
”
Die angegebene äquivalente Eigenschaft wird als Heine-Borel-Eigenschaft bezeichnet. Sie wird insbesondere in unendlich-dimensionalen Räumen als Definition für
Kompaktheit verwendet.
Wir halten noch die schon angekündigte Folgerung aus Satz 2.1 fest:
Folgerung 2.1: Eine kompakte Menge K ⊂ Rn ist genau dann Nullmenge, wenn
K den Inhalt Null hat.
Beweis von Satz 2.1:
• ⇐“: Zunächst habe K die Heine-Borel-Eigenschaft. Wir zeigen, dass dann K
”
kompakt, also abgeschlossen und beschränkt ist.
(a) Beschränktheit: Offenbar ist F = {BN (0) : N ∈ N} eine offene Überdeckung von K mit B1 (0) ⊂ B2 (0) ⊂ . . . Nach Voraussetzung existieren
Zahlen N1 < N2 < . . . < Np , p ∈ N, mit K ⊂ BN1 (0) ∪ . . . ∪ BNp (0) =
BNp (0), d.h. K ist beschränkt.
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
211
(b) Abgeschlossenheit: Angenommen, K ist nicht abgeschlossen, d.h. K ̸= K.
Dann existiert also ein x0 ∈ K \ K und eine Folge {xk }k ⊂ K mit xk →
x0 (k → ∞).
Nun ist F = {ΩN : N ∈ N} mit ΩN := {x ∈ Rn : |x − x0 | > N1 }
eine offene Überdeckung von K mit Ω1 ⊂ Ω2 ⊂ . . . Nach Voraussetzung
existieren also wieder Zahlen N1 < . . . < Np , p ∈ N, mit K ⊂ ΩN1 ∪ . . . ∪
ΩNp = ΩNp . Für alle x ∈ K folgt also x ∈ ΩNp bzw. |x − x0 | > N1p , im
Widerspruch zu |xk − x0 | → 0 (k → ∞) mit der oben gewählten Folge
{xk }k ⊂ K. Also ist K doch abgeschlossen.
• ⇒“: Sei nun K ⊂ Rn kompakt. Angenommen, es gibt eine offene Überdeckung
”
F von K, aus der sich keine endliche Überdeckung auswählen lässt. Mittels
einer Würfelschachtelung führen wir dies zum Widerspruch.
(a) Da K beschränkt ist, existiert ein abgeschlossener Würfel W ⊂ Rn mit
K ⊂ W . Wir zerlegen W in N := 2n Teilwürfel W1∗ , . . . , WN∗ , indem
wir die Seiten halbieren, d.h. es gilt |Wj∗ | = 2−n |W |. Offenbar ist F
auch Überdeckung der Mengen Wj∗ ∩ K. Nach Annahme existiert nun
mindestens ein j1 ∈ {1, . . . , N }, so dass keine endliche Überdeckung von
Wj∗1 ∩ K aus F ausgewählt werden kann. Wir schreiben W1 := Wj∗1 .
(b) Nun zerlegen wir W1 in N = 2n Teilwürfel W1∗∗ , . . . , WN∗∗ , indem wir
wieder die Seiten halbieren. Dann gilt |Wj∗∗ | = 2−n |W1 | = 2−2n |W |. F
überdeckt wieder alle Wj∗∗ ∩ K und nach (a) existiert mindestens ein
j2 ∈ {1, . . . , N }, so dass Wj∗∗
∩ K nicht durch eine endliche Unterfamilie
2
von F überdeckt werden kann. Wir setzen dann W2 := Wj∗∗
.
2
(c) Fortsetzung des Verfahrens liefert eine Folge W1 ⊃ W2 ⊃ W3 ⊃ . . . mit
|Wl | = 2−ln |W | und folgender Eigenschaft:
Für alle l ∈ N ist F offene Überdeckung von Wl ∩ K,
aus der keine endliche Überdeckung von Wl ∩ K ausgewählt werden kann.
Insbesondere gilt also liml→∞ |Wl | = 0 und damit auch
√ √
diam Wl = n n |Wl | → 0 (l → ∞).
(*)
(2.1)
Nun ist wegen (*) Wl ∩ K ̸= ∅ für alle l ∈ N. Also existieren xl ∈ Wl ∩ K
und wegen (2.1) bildet {xl }l ⊂ K eine Cauchyfolge: Zu beliebigem ε > 0
existiert nämlich ein N = N (ε) ∈ N mit diam Wl < ε für alle l ≥ N . Sind
dann k, l ≥ N gewählt, so folgt xk , xl ∈ WN und damit
|xk − xl | ≤ diam WN < ε
für alle k, l ≥ N.
212
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Da Rn vollständig ist, existiert ein x0 mit liml→∞ xl = x0 . Und da K
abgeschlossen ist, gilt x0 ∈ K. Somit gibt es ein Ω ∈ F mit x0 ∈ Ω. Und
da Ω offen ist, finden wir ein ϱ > 0 mit Bϱ (x0 ) ⊂ Ω.
Schließlich existiert wegen (2.1) und liml→∞ xl = x0 ein l0 ∈ N mit Wl ⊂
Bϱ (x0 ) für alle l ≥ l0 und damit insbesondere
Wl0 ∩ K ⊂ Bϱ (x0 ) ⊂ Ω ∈ F.
Also haben wir Wl0 ∩ K durch die endliche Teilüberdeckung {Ω} von F
überdeckt, im Widerspruch zu (*). Somit war die Annahme falsch, und
der Satz ist bewiesen.
q.e.d.
Definition 2.3: Eine kompakte Menge K ⊂ Rn heißt dünn, wenn zu jedem x0 ∈
K eine Kugel Br (x0 ), eine kompakte Menge Z ⊂ Rn−1 und eine stetige Funktion
φ = φ(y) : Z → R mit y = (x1 , . . . , xj−1 , xj+1 , . . . , xn ) so existieren, dass gilt
{
}
K ∩ Br (x0 ) = (x1 , . . . , xn ) ∈ Rn : xj = φ(y), y ∈ Z .
Eine dünne Menge im Rn ist also ein Kompaktum, das sich lokal als Graph
einer stetigen Funktion über einer der Hyperebenen {x ∈ Rn : xj = 0} darstellen
lässt. Z.B. ist nach Folgerung 6.1 aus Kap. 4 jede beschränkte (n − 1)-dimensionale
Mannigfaltigkeit der Klasse C 1 eine dünne Menge.
Folgerung 2.2: Eine dünne Menge K ⊂ Rn hat den Inhalt Null.
Beweis: Nach dem Satz von Heine-Borel können wir aus der Überdeckung {Br (x) : x ∈ K} mit
den in Definition 2.3 angegebenen Radien r = r(x) > 0 endlich viele Kugeln Br1 (x1 ), . . . , Brp (xp )
auswählen, die K überdecken. Nach Hilfssatz 2.2 haben K ∩ Brl (xl ) den Inhalt Null für alle l =
1, . . . , p. Und nach Hilfssatz 2.1 (i) gilt dies auch für
K⊂
p
∪
{
}
K ∩ Brl (xl ) ,
l=1
wie behauptet.
q.e.d.
Bemerkungen:
1. Insbesondere hat also der Rand ∂Q jedes Quaders Q ⊂ Rn den Inhalt Null, da
jede berandende Seite eines Quaders dünn ist.
2. Durch nahezu wörtliches Übertragen des Beweises von Hilfssatz 2.2 sieht man,
dass auch m-dimensionale Graphen graph φ ⊂ Rn+m von Funktionen φ ∈
C 0 (K, Rm ) über Kompakta K ⊂ Rn den Inhalt Null haben (als Teilmengen
des Rn+m ). Folgerung 6.1 aus Kap. 4 und der Beweis von Folgerung 2.2 zeigen
dann:
Jede beschränkte C 1 -Mannigfaltigkeit hat den Inhalt Null.
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
213
Wie angekündigt, wollen wir nun die Unstetigkeitsstellen integrierbarer Funktionen f ∈ R(Q) untersuchen, wobei Q ⊂ Rn wie immer einen (abgeschlossenen,
achsenparallelen) Quader bezeichne. Für eine beliebige Menge M ⊂ Q und eine
beschränkte Funktion f : Q → R erklären wir hierzu die Oszillation von f auf M
gemäß
osc f := sup f − inf f = sup |f (x) − f (x′ )|
M
M
M
(
und setzen
σf (x) := lim
r→0+
x,x′ ∈M
)
osc f ,
Q∩Br (x)
x ∈ Q.
(2.2)
Wir bemerken, dass oscQ∩Br (x) f nichtnegativ und monoton wachsend in r ist, d.h.
σf : Q → R ist wohldefiniert und nichtnegativ. Ist ferner U = U (x) eine offene
Umgebung von x ∈ Q, so gilt Q ∩ Br (x) ⊂ Q ∩ U für hinreichend kleines r > 0 und
folglich
σf (x) ≤ osc f für alle x ∈ Q und U = U (x) ⊂ Rn .
(2.3)
Q∩U
Ist nun f in x ∈ Q stetig, so gilt offenbar σf (x) = 0. Und x ∈ Q heißt Unstetigkeitsstelle von f , falls σf (x) > 0 richtig ist. Wir schreiben
{
}
S(f ) := x ∈ Q : σf (x) > 0
für die Menge aller Unstetigkeitsstellen und beginnen mit dem
Hilfssatz 2.3: Zu beschränktem f : Q → R erklären wir σf : Q → R wie in (2.2)
und setzen
{
}
Q(ε) := x ∈ Q : σf (x) ≥ ε .
Dann ist S(f ) genau dann Nullmenge, wenn Q(ε) für alle ε > 0 den Inhalt Null hat.
Beweis:
•
⇒“: Ist S(f ) Nullmenge, so ist für jedes ε > 0 auch Q(ε) ⊂ S(f ) Nullmenge. Da Q(ε)
”
kompakt ist (Übungsaufgabe! ), hat Q(ε) nach Folgerung 2.1 für alle ε > 0 den Inhalt Null.
•
⇐“: Gilt andererseits |Q(ε)| = 0 für alle ε > 0, so insbesondere auch |Q( k1 )| = 0 für k ∈ N.
”
Nun gilt die Relation
∞
(1)
∪
S(f ) =
Q
.
(2.4)
k
k=1
Nach Hilfssatz 2.1 (ii) ist damit S(f ) Nullmenge.
q.e.d.
Wir kommen nun zum zentralen
Satz 2.2: Eine beschränkte Funktion f : Q → R ist genau dann integrierbar, wenn
die Menge S(f ) ihrer Unstetigkeitsstellen eine Nullmenge ist.
Beweis:
214
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
• ⇒“: Es gelte f ∈ R(Q). Nach Satz 1.1 existiert dann zu jedem ε > 0 und
”
jedem k ∈ N eine Zerlegung Z von Q in Teilquader Qα , α ∈ A, mit
S Z (f ) − S Z (f ) <
ε
.
2k
Wie in Hilfssatz 2.3 betrachten wir Q( k1 ) = {x ∈ Q : σf (x) ≥ k1 } mit der in
(2.2) erklärten Funktion σf : Q → R und setzen
{
(1)
}
A(k) := α ∈ A : Q̊α ∩ Q
̸= ∅ .
k
Offenbar ist dann
] [ ∪
]
(1) [ ∪
Q
⊂
Q̊α ∪
∂Qα
k
(2.5)
α∈A
α∈A(k)
richtig. Für x ∈ Q̊α ∩ Q( k1 ) mit einem α ∈ A(k) gilt
(2.3)
1
≤ σf (x) ≤ osc f
Qα
k
und somit
∑
)
1 ∑
ε
|Qα | ≤
(osc f |Qα | ≤ S Z (f ) − S Z (f ) <
Qα
k
2k
α∈A(k)
α∈A(k)
bzw.
∑
α∈A(k)
ε
|Qα | < .
2
(2.6)
Ferner haben wir oben bemerkt,
∪ dass |∂Qα | = 0 für jedes α ∈ A gilt und nach
Hilfssatz 2.1 (i) somit auch | α∈A ∂Qα | = 0. Also gibt es Quader Q′1 , . . . , Q′p ,
p ∈ N, mit
p
p
∪
∪
∑
ε
(2.7)
∂Qα ⊂
Q̊′j ,
|Q′j | < .
2
α∈A
j=1
j=1
Aus (2.5)-(2.7) erhalten wir nun
] [∪
]
p
(1) [ ∪
′
⊂
Q̊α ∪
Q̊j ,
Q
k
α∈A(k)
j=1
∑
α∈A(k)
|Qα | +
p
∑
|Q′j | < ε,
j=1
d.h. |Q( k1 )| = 0 für alle k ∈ N. Formel (2.4) und Hilfssatz 2.1 (ii) liefern also
meas S(f ) = 0.
2. UNSTETIGKEITSSTELLEN UND HEINE-BOREL
215
• ⇐“: Sei nun S(f ) Nullmenge. Nach Hilfssatz 2.3 ist dann |Q(ε)|
∪p = 0 für
”
beliebiges ε > 0 richtig. Also existiert eine endliche
Überdeckung j=1 Q̊j von
∑
Q(ε) durch p ∈ N Quader mit Inhaltssumme pj=1 |Qj | < ε.
Wir betrachten nun die kompakte Menge Q̂ := Q \ (Q̊1 ∪ . . . ∪ Q̊p ). Nach
Konstruktion gilt σf (x) < ε für jedes x ∈ Q̂. Also gibt es zu jedem x ∈ Q̂
einen Würfel Wx mit Mittelpunkt x, so dass oscQ∩Wx f < ε erfüllt ist. Nun
∪
liefert x∈Q̂ W̊x eine offene Überdeckung von Q̂, aus der wir nach dem Satz
von Heine-Borel endlich viele Würfel Wx1 , . . . , Wxr mit W̊x1 ∪ . . . ∪ W̊xr ⊃ Q̂
auswählen können.
Insgesamt ist also Q1 , . . . , Qp , Wx1 , . . . , Wxr eine Überdeckung von Q durch
Quader. Wir ordnen nun eine Zerlegung Z von Q in Teilquader Q∗α , α ∈ A,
so zu, dass die Indexmenge gemäß A = A′ ∪ A′′ in zwei disjunkte Teilmengen
zerfällt, für die gilt:
•
∪
α∈A′
Q∗α ⊂
p
∪
Qj und folglich
j=1
∑
α∈A′
p
∑
|Q∗α | ≤
|Qj | < ε.
j=1
• Für jedes α ∈ A′′ gilt Q∗α ⊂ Wxk ∩ Q mit einem k = k(α) ∈ {1, . . . , r}
und folglich osc
f < ε.
∗
Qα
Für die zu Z gehörigen Ober- und Untersummen erhalten wir dann:
∑ (
∑(
)
) ∗
osc
f |Q∗α |
osc
f
|Q
|
+
S Z ∗ (f ) − S Z ∗ (f ) =
α
∗
∗
Qα
α∈A′
α∈A′′
Qα
∑
(
)∑ ∗
< 2 sup |f |
|Qα | + ε
|Q∗α |
Q
α∈A′
(
)
≤ ε 2 sup |f | + |Q| .
α∈A′′
Q
Da ε > 0 beliebig gewählt war, ist also f nach Satz 1.1 integrierbar.
q.e.d.
Bemerkung: Wir können das Ergebnis von Satz 2.2 direkt auf vektor- bzw. komplexwertige Funktionen verallgemeinern. Ist etwa f : Q → Rd beschränkt, so gilt
f ∈ R(Q, Rd )
⇐⇒
Satz 2.2
⇐⇒
HS 2.1 (ii)
⇐⇒
f1 , . . . , fd ∈ R(Q)
meas S(f1 ) = . . . = meas S(fd ) = 0
meas S(f ) = 0,
wobei f = (f1 , . . . , fd ) in x ∈ Q genau dann unstetig ist, wenn mindestens eine der
d
∪
S(fk ).
Komponenten fk in x unstetig ist, d.h. S(f ) =
k=1
216
3
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Integration über quadrierbare Mengen
Wir wollen nun allgemeinere Mengen M ⊂ Rn als Integrationsbereiche wählen, indem wir das Riemann-Integral auf charakteristische Funktionen“ χM spezialisieren:
”
Definition 3.1: Eine beschränkte Menge M ⊂ Rn heißt quadrierbar (oder Jordanmessbar, Jordanmenge), wenn ihre charakteristische Funktion
{
1, für x ∈ M,
χM (x) :=
: Rn → R
0, für x ∈ Rn \ M
auf einem Quader Q ⊂ Rn mit M ⊂ Q̊ integrierbar ist. Den Wert
∫
|M | := v(M ) := χM (x) dx
(3.1)
Q
nennen wir den (n-dimensionalen) Inhalt von M (oder Volumen oder Jordansches
Maß von M ).
Bemerkungen:
1. Obige Definition ist von der Wahl des Quaders Q ⊂ Rn mit M ⊂ Q̊ unabhängig.
2. Jeder Quader Q = [a1 , b1 ] × . . . × [an , bn ] ist quadrierbar mit
v(Q) =
n
∏
(bj − aj ) = |Q|.
j=1
Die ursprüngliche Definition des Inhalts eines Quaders stimmt also mit der in
(3.1) überein.
3. Jede Menge M vom Inhalt Null ist quadrierbar mit v(M ) = 0 (siehe Anhang
(A1)); auch hier stimmt also v(M ) mit der ursprünglichen Definition von |M |
überein.
Aus Satz 2.2 erhalten wir nun sofort den
Satz 3.1: (Quadrierbarkeitskriterium I)
Eine beschränkte Menge ist genau dann quadrierbar, wenn ihr Rand ∂M Nullmenge
ist (⇔ |∂M | = 0).
Beweis: Offenbar gilt S(χM ) = ∂M , da Rn \ ∂M offen ist. Wählen wir also Q ⊂ Rn
mit M ⊂ Q̊, so ist χM nach Satz 2.2 genau dann auf Q integrierbar,wenn ∂M
eine Nullmenge ist. Da ∂M kompakt ist, ist dies nach Folgerung 2.1 äquivalent zu
|∂M | = 0.
q.e.d.
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
217
Folgerung 3.1: Sind M, N ⊂ Rn quadrierbar, so sind auch M ∪ N , M ∩ N und
M \ N quadrierbar.
Beweis: Offenbar sind M ∪ N , M ∩ N und M \ N beschränkt, da M, N beschränkt
sind. Und wegen
∂(M ∪ N ), ∂(M ∩ N ), ∂(M \ N ) ⊂ ∂M ∪ ∂N
folgt die Behauptung sofort aus Hilfssatz 2.1 (i) und Satz 3.1.
q.e.d
Satz 3.2: (Quadrierbarkeitskriterium II)
Ist M ⊂ Rn beschränkt und ∂M eine dünne Menge im Sinne von Definition 2.3, so
ist M quadrierbar.
Beweis: Nach Folgerung 2.2 gilt |∂M | = 0 für die dünne Menge ∂M und nach Satz 3.1
ist M quadrierbar.
q.e.d.
Zum Beispiel ist also der Kreisring R(a, b) := {x ∈ Rn : a < |x| < b} mit
0 < a < b < +∞ eine quadrierbare Menge, da ∂R(a, b) aus den beiden disjunkten (n − 1)-dimensionalen C 1 -Mannigfaltigkeiten ∂Ba (0), ∂Bb (0) besteht. Beachtet
man noch Folgerung 3.1 und die zweite Bemerkung im Anschluss an Folgerung 2.2,
so ist allgemeiner jeder Durchschnitt und jede Vereinigung endlich vieler Mengen
quadrierbar, deren Ränder C 1 -Mannigfaltigkeiten sind.
Sei nun M ⊂ Rn eine beliebige beschränkte Menge und f : M → Rd ebenfalls
beschränkt. Wir erklären die kanonische Fortsetzung f M : Rn → Rd von f gemäß
{
f M (x) :=
f (x), für x ∈ M
0,
für x ∈ Rn \ M
.
Die kanonische Fortsetzung der Funktion f (x) ≡ 1, x ∈ M , ist also gerade die
charakteristische Funktion von M .
Definition 3.2: Sei M ⊂ Rn quadrierbar und f : M → Rd beschränkt. Dann
heißt f (Riemann)-integrierbar auf M , i.Z. f ∈ R(M, Rd ), wenn die kanonische
Fortsetzung f M auf einem Quader Q ⊂ Rn mit M ⊂ Q̊ integrierbar ist. Wir erklären
dann das (Riemannsche) Integral von f auf M gemäß
∫
∫
∫
∫
f dV = f dx1 . . . dxn = f dx := f M dx.
M
M
M
Q
218
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkungen:
1. Die Definition ist wieder unabhängig von der Wahl des Quaders Q ⊂ Rn mit
M ⊂ Q̊.
2. Insbesondere ist die Funktion f (x) ≡ 1 nach obiger Definition auf jeder quadrierbaren Menge M integrierbar mit
∫
1 dx = |M |.
M
Satz 3.3: (Lebesguesches Integrabilitätskriterium)
Sei M ⊂ Rn quadrierbar und f : M → Rd beschränkt. Dann gilt
f ∈ R(M, Rd )
⇐⇒
meas S(f |M̊ ) = 0.
Beweis: Wir betrachten wieder die kanonische Fortsetzung f M : Rn → Rd , für deren
Unstetigkeitsstellen offenbar gilt
S(f |M̊ ) ⊂ S(f M ) ⊂ S(f |M̊ ) ∪ ∂M.
Ist Q ⊂ Rn ein Quader mit M ⊂ Q̊, so folgt
f ∈ R(M, Rd )
Def. 3.2
f M ∈ R(Q, Rd )
Satz 2.2
S(f M ) ist Nullmenge
Satz 3.1
S(f |M̊ ) ist Nullmenge,
⇐⇒
⇐⇒
⇐⇒
wie behauptet.
q.e.d.
Folgerung 3.2: Jede beschränkte Funktion f : M → Rd ∈ C 0 (M, Rd ) auf der
quadrierbaren Menge M ⊂ Rn ist integrierbar.
Durch Definition 3.2 lassen sich die Rechenregeln aus Satz 1.3 und der anschließenden Bemerkung übertragen:
Satz 3.4: (Rechenregeln) Sei M ⊂ Rn quadrierbar.
(i) Für f, g ∈ R(M, Rd ) und α, β ∈ R gilt αf + βg ∈ R(M, Rd ) und
∫
∫
∫
[
]
αf (x) + βg(x) dx = α f (x) dx + β g(x) dx.
M
M
M
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
219
(ii) Für d = 1: Sind f, g ∈ R(M, R) =: R(M ) mit f ≤ g auf M gegeben, so folgt
∫
∫
f dx ≤
M
g dx.
M
(iii) Für jedes f ∈ R(M, Rd ) gilt auch |f | ∈ R(M ) und
∫
∫
f dx ≤ |f | dx.
M
M
(iv) Gilt f, g ∈ R(M, Rd ), so folgt ⟨f, g⟩ ∈ R(M ) und
∫
∫
(
)
⟨f, g⟩ dx ≤ sup |g|
|f | dx.
M
M
M
(v) Für d = 1: Gilt f, g ∈ R(M ) und |g| ≥ c > 0 auf M mit einer Konstante
c > 0, so folgt fg ∈ R(M ) und
∫
∫
f 1
g dx ≤ c |f | dx.
M
M
Beweis: Die Aussagen gelten nach Satz 1.3 für die kanonischen Fortsetzungen fM , gM , woraus die
Behauptungen (i)-(iv) direkt folgen. Zum Beweis von (v) setzen wir
{
g(x), für x ∈ M
ĝ(x) :=
.
c,
für x ∈ Rn \ M
Dann gilt ĝ = g M + c(1 − χM ). Für beliebigen Quader Q ⊂ Rn mit M ⊂ Q̊ ist also ĝ ∈ R(Q) nach
Satz 1.3. Und da auch f M ∈ R(Q) und |ĝ| ≥ c auf Q gilt, folgt aus Satz 1.3 (v):
(f )
g
Schließlich berechnen wir noch
∫
f
dx
g =
M
fM
∈ R(Q),
ĝ
=
f
∈ R(M ).
g
∫ ( )
∫
fM
f
= dx
dx
g M ĝ
Q
M
Satz 1.3 (v)
≤
1
c
Q
∫
|f M | dx
Q
wie behauptet.
d.h.
|f M |=|f |M
=
1
c
∫
|f | dx,
M
q.e.d.
220
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Folgerung 3.3: Ist M ⊂ Rn quadrierbare Nullmenge, so ist jedes beschränkte f :
M → Rd integrierbar auf M und es gilt
∫
f dx = 0.
M
Bemerkung: Insbesondere gilt dies für jede Menge vom Inhalt Null, da diese, wie
oben bemerkt, quadrierbar sind. Nach Satz 3.1 gilt die Aussage von Folgerung 3.3
dann für den Rand ∂M jeder quadrierbaren Menge M ⊂ Rn .
Beweis von Folgerung 3.3: Da M quadrierbar ist, ist ∂M und somit auch das Kompaktum M = M ∪ ∂M Nullmenge. Also gilt |M | = 0 nach Folgerung 2.1. Ferner
ist für beliebiges f : M → Rd die Menge S(f |M̊ ) ⊂ M Nullmenge. Also ist f nach
Satz 3.3 integrierbar und Satz 3.4 (iv) liefert:
∫
∫
(
)
(
)
f dx ≤ sup |f |
1 dx = sup |f | |M | = 0,
M
M
M
M
wie behauptet.
q.e.d.
Definition 3.3: Sei f : M → Rd auf einer Menge M ⊂ Rn erklärt und sei M ′ ⊂ M
quadrierbar. Dann heißt f auf M ′ integrierbar, i.Z. f ∈ R(M ′ , Rd ), wenn f |M ′ ∈
R(M ′ , Rd ) gilt, und wir setzen
∫
∫
f dx :=
f |M ′ dx.
M′
M′
Hilfssatz 3.1: Ist M ⊂ Rn quadrierbar, so gilt für jede quadrierbare Teilmenge
M′ ⊂ M:
R(M, Rd ) ⊂ R(M ′ , Rd ).
Beweis: Es sei Q ⊂ Rn mit M ⊂ Q̊ und damit auch M ′ ⊂ Q̊ gewählt. Wir bemerken
für die kanonischen Fortsetzungen von f ∈ R(M, Rd ) bez. M und M ′ :
f M ′ (x) = χM ′ (x)f M (x).
Wegen χM ′ ∈ R(Q) und f M ∈ R(Q, Rd ) gilt nach Satz 3.4 (iv) f M ′ ∈ R(Q, Rd )
bzw. f |M ′ ∈ R(M ′ , Rd ), wie behauptet.
q.e.d.
Hilfssatz 3.2: Seien M1 , M2 ⊂ Rn quadrierbar mit M1 ∩M2 = ∅, und eine Funktion
f : M1 ∪ M2 → Rd sei gegeben. Gilt dann f ∈ R(Mj , Rd ) für j = 1, 2, so folgt
f ∈ R(M1 ∪ M2 , Rd ) und
∫
∫
∫
f dx =
f dx +
f dx.
M1 ∪M2
M1
M2
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
221
Beweis: Nach Folgerung 3.1 ist M1 ∪ M2 quadrierbar. Für die kanonische Fortsetzung f M1 ∪M2 von
f haben wir
f M1 ∪M2 = χM1 ∪M2 f M1 ∪M2 = χM1 f M1 ∪M2 + χM2 f M1 ∪M2 =: f1 + f2 .
(3.2)
Dann ist offenbar
fj := χMj f M1 ∪M2 = (f |Mj )M ,
j
j = 1, 2,
(3.3)
richtig, und nach Satz 3.4 (i) folgt f ∈ R(M1 ∪ M2 ) und für beliebige Quader Q ⊂ Rn mit M ⊂ Q̊
erhalten wir
∫
∫
∫
∫
(3.2)
f dx
=
f M1 ∪M2 dx =
f1 dx + f2 dx
M1 ∪M2
Q
Q
∫
(3.3)
∫
f |M1 dx +
=
M1
Q
∫
f |M2 dx =
M2
∫
f dx +
M1
wie behauptet.
f dx,
M2
q.e.d.
Bemerkung: Wendet man Hilfssatz 3.2 speziell auf charakteristische Funktionen an,
so erhält man verschiede Inhalts-Beziehungen zwischen quadrierbaren Mengen. Sind
z.B. M, N ⊂ Rn quadrierbar mit M ⊂ N , so folgt |M | ≤ |N | (→ Übungsaufgabe).
Folgerung 3.4: Sei M ⊂ Rn quadrierbar und für ein beschränktes f : M → Rd
gelte f (x) = 0 für alle x ∈ M \ E mit einer quadrierbaren Nullmenge E ⊂ M . Dann
folgt f ∈ R(M, Rd ) und
∫
f dx = 0.
M
Beweis: Nach Folgerung 3.1 ist M \ E quadrierbar. Gemäß Folgerung 3.3 ist f auf
E integrierbar. Und da f M \E ≡ 0 auf Rn gilt, ist f auch auf M \ E integrierbar.
Wegen M = M \ E ∪ E liefert Hilfssatz 3.2 also f ∈ R(M, Rd ) sowie
∫
∫
f dx =
M
∫
f dx = 0 + 0 = 0,
f dx +
M \E
E
wie behauptet.
q.e.d.
Hilfssatz 3.3: Sei M ⊂ Rn quadrierbar und f : M → Rd beschränkt. Dann ist
auch M̊ quadrierbar, und aus f ∈ R(M̊ , Rd ) folgt f ∈ R(M, Rd ) sowie
∫
∫
f dx =
M̊
f dx.
M
(3.4)
222
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkung: Dabei fassen wir die linke Seite in (3.4) für den Fall M̊ = ∅ als Null auf,
d.h.
∫
f dx := 0.
∅
Wegen M = M \ M̊ ⊂ ∂M ist dann nach Folgerung 3.3 (siehe auch die daran
anschließende Bemerkung) Relation (3.4) erfüllt.
Beweis von Hilfssatz 3.3: Sei also o.B.d.A. M̊ ̸= ∅. Wegen
∂ M̊ = M̊ \ M̊ ⊂ M \ M̊ = ∂M
ist ∂ M̊ Nullmenge und M̊ somit quadrierbar nach Satz 3.1. Weiter gilt M = M̊ ∪ (M \ M̊ ) mit der
Menge M \ M̊ ⊂ ∂M vom Inhalt Null (vgl. Satz 3.1). Nach Folgerung 3.3 gilt also f ∈ R(M \ M̊ , Rd )
und
∫
f (x) dx = 0,
M \M̊
so dass Hilfssatz 3.2 liefert f ∈ R(M, Rd ) und
∫
∫
∫
∫
f dx =
f dx + f dx = f dx,
M
M \M̊
M̊
M̊
wie behauptet.
q.e.d.
Satz 3.5:∪(Additivität des Integrals)
Sei M = pl=1 Ml mit quadrierbaren Mengen M1 , . . . , Mp ⊂ Rn , die M̊l ∩ M̊k = ∅
für l ̸= k erfüllen. Ist dann f : M → Rd beschränkt und über M̊l integrierbar für
alle l = 1, . . . , p, so folgt f ∈ R(M, Rd ) und
∫
f dx =
p ∫
∑
l=1 M
M
f dx =
p ∫
∑
l=1
l
f dx.
M̊l
Beweis: Zunächst ist f nach Hilfssatz 3.2 über M̊1 ∪ . . . ∪ M̊p und nach Hilfssatz 3.3
auch über Ml integrierbar, und es gilt
∫
f dx =
p ∫
∑
l=1
M̊1 ∪...∪M̊p
f dx =
M̊l
p ∫
∑
f dx.
(3.5)
l=1 M
l
Ferner haben wir die Relation
M=
p
∪
l=1
M̊l ∪ N
mit N ⊂
p
∪
l=1
∂Ml ,
(3.6)
3. INTEGRATION ÜBER QUADRIERBARE MENGEN
223
und nach Satz 3.1 ist N eine Menge vom Inhalt Null und damit quadrierbare Nullmenge. Nach Folgerung 3.3 ist also f ∈ R(N, Rd ) mit
∫
f (x) dx = 0
N
richtig, so dass Hilfssatz 3.2 und Formeln (3.5), (3.6) liefern f ∈ R(M, Rd ) und
∫
∫
∫
f dx =
M
f dx +
(3.5)
f dx =
l=1 M
N
M̊1 ∪...∪M̊p
p ∫
∑
f dx =
p ∫
∑
l=1
l
wie behauptet.
f dx,
M̊l
q.e.d.
Wir kommen nun zu einer Verallgemeinerung von Satz 1.6. Dazu benötigen wir
noch die
Definition 3.4: Eine Menge M ⊂ Rn heißt Normalbereich (bez. der xj -Achse),
wenn es eine quadrierbare, kompakte Menge K ⊂ Rn−1 und Funktionen ψ, χ : K →
R ∈ C 0 (K) mit ψ ≤ χ auf K so gibt, dass M die folgende Form hat:
{
}
M = x ∈ Rn : y := (x1 , . . . , xj−1 , xj+1 , . . . , xn ) ∈ K, ψ(y) ≤ xj ≤ χ(y) . (3.7)
Bemerkung: Normalbereiche sind kompakt. Und nach Hilfssatz 2.2 hat ∂M den Inhalt Null, d.h. jeder Normalbereich ist quadrierbar.
Satz 3.6: (Cavalierisches Prinzip oder Satz von Fubini)
Es sei M ⊂ Rn Normalbereich der Form (3.7) und f ∈ C 0 (M, Rd ) sei gegeben. Dann
gilt
)
∫
∫ ( χ(y)
∫
f dx =
f dxj dy.
K
M
ψ(y)
Beweis: O.B.d.A. sei d = 1 und j = n. Nach Folgerung 3.2 ist f auf M integrierbar, d.h. die
kanonische Fortsetzung f M : Rn → Rd ist auf jedem Quader Q ⊂ Rn mit M = M ⊂ Q̊ integrierbar.
Ist Q ⊂ Rn−1 ein beliebiger Quader mit K = K ⊂ Q̊ und I := [a, b] mit
−∞ < a < inf ψ ≤ sup χ < b < +∞
K
K
erklärt, so gilt dies insbesondere für Q := Q × I. Nach Satz 1.5 ist also
∫
∫
∫
∫
f dx = f M dx = φ(y) dy = φ(y) dy
M
Q
Q
Q
richtig, wobei wir noch
(
)
φ(y) := I I f M (y, ·) ,
(
)
φ(y) := I I f M (y, ·) ,
y ∈ Q,
(3.8)
224
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
gesetzt haben. Nun ist für jedes y ∈ K die Funktion f M (y, ·) : I → Rd stückweise stetig und damit
integrierbar nach Folgerung 4.2 aus Kap. 3. Der dortige Satz 4.7 zeigt noch
∫
χ(y)
∫
φ(y) = φ(y) =
f M (y, xn ) dxn =
I
f (y, xn ) dxn
für y ∈ K.
ψ(y)
Für y ∈ Q \ K gilt andererseits f M (y, xn ) ≡ 0 auf I, also
∫
φ(y) = φ(y) = f M (y, xn ) dxn = 0
für y ∈ Q \ K.
I
Einsetzen in (3.8) bringt somit
∫
∫
∫
f dx =
φ(y) dy +
K
M
)
∫ ( χ(y)
∫
φ(y) dy =
f dxn dy,
K
Q\K
ψ(y)
wie behauptet.
q.e.d.
Beispiel: Gesucht ist |BR (0)| für die Kugel BR (0) ⊂ R3 mit Radius R > 0. Wir können schreiben
√
√
{
}
BR (0) = (x, y, z) : (x, y) ∈ KR (0), − R2 − x2 − y 2 ≤ z ≤ R2 − x2 − y 2
mit der abgeschlossen Kreisscheibe
{
}
KR (0) :=
(x, y) : x2 + y 2 ≤ R2
√
√
{
}
=
(x, y) : −R ≤ x ≤ R, − R2 − x2 ≤ y ≤ R2 − x2 .
Satz 3.6 zeigt also
∫
|BR (0)|
∫
|BR (0)| =
=
1 dx dy dz =
KR (0)
BR (0)
=
2
∫ √
√
(
−
√
∫R (
−
R2
x2
−
y2
dx dy = 2
R
KR (0)
√
√
−
R2 −x2 −y 2
∫
)
1 dz dx dy
R2 −x2 −y 2
R2 −x2
∫
)
√
R2 − x2 − y 2 dy dx.
R2 −x2
Für beliebiges ϱ > 0 gilt nun (substituiere y = ϱ cos t, t ∈ [0, π]):
∫ϱ √
[ ϱ2
]ϱ
y
y√ 2
πϱ2
arccos +
=
.
ϱ2 − y 2 dy = −
ϱ − y2
2
ϱ
2
2
−ϱ
−ϱ
Einsetzen mit ϱ =
√
R2 − x2 liefert schließlich
∫R
|BR (0)| = π
−R
[
4πR3
x3 ]R
=
.
(R2 − x2 ) dx = π R2 x −
3 −R
3
4. DIE TRANSFORMATIONSFORMEL FÜR TESTFUNKTIONEN
225
Bemerkung: Ist M ⊂ Rn darstellbar als Vereinigung M = M1 ∪ . . . ∪ Mp endlich
vieler Normalbereiche mit M̊l ∩ M̊k = ∅ für l ̸= k, d.h. kann man M in p ∈ N
0
Normalbereiche
zerschneiden“, so kann man mit Satz 3.6 für
∫
∫ jedes f ∈ C (M )
”
zunächst Ml f dx, l = 1, . . . , p, berechnen und anschließend M f dx mit Satz 3.5
bestimmen.
Zum Abschluss geben wir noch die Verallgemeinerung von Satz 5.6 aus Kap. 3
auf Funktionen mehrerer Veränderlicher an:
Satz 3.7: Sei M ⊂ Rn quadrierbar und die Folge fk : M → Rd ∈ R(M, Rd ), k ∈ N,
konvergiere gleichmäßig gegen eine Funktion f : M → Rd . Dann folgt f ∈ R(M, Rd )
und
(∫
)
∫
∫ (
)
f (x) dx =
lim fk (x) dx = lim
fk (x) dx .
k→∞
M
k→∞
M
M
Beweis: Übungsaufgabe.
4
Die Transformationsformel für Testfunktionen
Wir wollen zunächst den Begriff Testfunktion“ erklären:
”
Definition 4.1:
• Ist M ⊂ Rn beliebig und f : M → Rd gegeben. Dann heißt die Menge
supp f := {x ∈ M : f (x) ̸= 0}
der Träger oder Support von f .
• Ist Θ ⊂ Rn beliebig, so heißt M ⊂ Θ kompakt enthalten in Θ, i.Z. M ⊂⊂ Θ,
wenn M kompakt ist und M ⊂ Θ erfüllt.
• Ist Ω ⊂ Rn offen und s ∈ N0 ∪ {∞}, d ∈ N beliebig, so bezeichnet
{
}
Ccs (Ω, Rd ) := f ∈ C s (Ω, Rd ) : supp f ⊂⊂ Ω
die Menge der s-mal stetig differenzierbaren, Rd -wertigen Funktionen mit kompaktem Träger in Ω. Ein solches f ∈ Ccs (Ω, Rd ) nennen wir auch kurz Testfunktion.
Bemerkung: Wir können uns eine Funktion f ∈ Ccs (Ω, Rd ) immer auf ganz Rn erklärt
denken, indem wir f zu 0 auf Rn \ Ω fortsetzen. Dann ist offenbar f ∈ C s (Rn , Rd )
und supp f ⊂⊂ Ω richtig.
Ziel dieses Paragraphen ist der folgende
226
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Satz 4.1: (Transformationsformel für Testfunktionen)
Seien Ω, Ω∗ ⊂ Rn offene, quadrierbare Mengen und ϕ = ϕ(x) : Ω → Ω∗ ein C 1 Diffeomorphismus von Ω auf Ω∗ . Dann gilt für beliebiges f ∈ Cc0 (Ω∗ ) die Identität
∫
∫
(4.1)
f (y) dy = f (ϕ(x))|Jϕ (x)| dx.
Ω∗
Ω
Bemerkung: Satz 4.1 ist ein Spezialfall der allgemeinen Transformationsformel. Das
entsprechende Resultat für offene, nicht notwendig quadrierbare Mengen Ω, Ω∗ und
f ∈ C 0 (Ω∗ ) werden wir in § 5 durch Approximation erhalten.
Der Beweis von Satz 4.1 beruht auf zwei zentralen Ideen:
1. Lokalisierung.
2. Induktion über die Raumdimension.
Die Lokalisierung basiert auf dem folgenden wichtigen Werkzeug:
Definition 4.2: (Zerlegung der Eins)
Sei M ⊂ Rn nichtleer. Eine Zerlegung der Eins (auf M ) ist eine Familie {ηα }α∈I
von Funktionen ηα ∈ Cc∞ (Rn ) mit höchstens abzählbarer Indexmenge I und den
folgenden Eigenschaften:
(i) Für alle α ∈ I gilt 0 ≤ ηα ≤ 1 auf Rn .
(ii) Für jedes x ∈ Rn existieren höchstens endlich viele α ∈ I mit ηα (x) ̸= 0.
∑
∑
ηα (x) ≡ 1 für alle x ∈ M sowie 0 ≤
ηα ≤ 1 auf Rn .
(iii) Es gilt
α∈I
α∈I
Hilfssatz 4.1: Sei K ⊂ Rn kompakt und F = {Ox : x ∈ K} eine beliebige offene
Überdeckung, wobei Ox eine offene Umgebung von x ∈ K bezeichne. Dann gibt es
eine endliche Zerlegung der Eins {ηα }α=1,...,p auf K mit der zusätzlichen Eigenschaft
ηα ∈ Cc∞ (Oxα ) für xα ∈ K, α = 1, . . . , p.
Beweis: Da Ox offen ist, existiert zu jedem x ∈ K ein r(x) ∈ (0, 1) mit B(x) := Br(x) (x) ⊂⊂ Ox .
Ferner gibt es eine Kugel B := BR (0) mit
∪
B(x) ⊂⊂ B.
x∈K
Und zu jedem x ∈ B \ K finden wir eine Kugel B(x) = Br(x) (x) ⊂ Rn \ K. Aus der so gewonnen
offenen Überdeckung F̂ := {B(x) : x ∈ B} der kompakten Kugel B können wir nach dem Satz
von Heine-Borel endlich viele Kugeln Bα := B(xα ), α = 1, . . . , N , auswählen, die B überdecken.
Diese sortieren wir so, dass
{
K,
für α = 1, . . . , p
xα ∈
B \ K, für α = p + 1, . . . , N
4. DIE TRANSFORMATIONSFORMEL FÜR TESTFUNKTIONEN
227
mit einem p < N richtig ist. Nach Konstruktion gilt dann Bα ∩ K = ∅ für α = p + 1, . . . , N .
Mit dem Radius rα := r(xα ) > 0 der Kugel Bα setzen wir
( 2
)
ξα (x) := ψ rα
− |x − xα |2 , x ∈ Rn ,
{
mit der Funktion
ψ(t) :=
1
e− t ,
0,
für t > 0
∈ C ∞ (R).
für t ≤ 0
Dann gilt ξα ∈ Cc∞ (Rn ) für alle α = 1, . . . , N und wir bemerken
ξα (x) > 0 ⇔ x ∈ Bα
für alle α = 1, . . . , N.
Insbesondere haben wir also supp ξα = Bα ⊂ B ∩ Oxα für α = 1, . . . , p und ξα = 0 auf K für
α = p + 1, . . . , N . Schließlich setzen wir noch
ξ(x) :=
N
∑
ξα (x),
x ∈ Rn ,
α=1
und beachten ξ > 0 auf B. Für
{
ηα (x) :=
ξα (x)
,
ξ(x)
0,
für x ∈ B
für x ∈ Rn \ B
∈ Cc∞ (Oxα ),
α = 1, . . . , p,
sind dann die Eigenschaften (i)-(iii) aus Definition 4.2 erfüllt.
q.e.d.
Folgerung 4.1: Ist Ω ⊂ Rn offen und K ⊂ Ω kompakt, so existiert ein η ∈ Cc∞ (Ω)
mit η ≡ 1 auf K und 0 ≤ η ≤ 1 auf Ω.
Beweis: Zu jedem x ∈ K gibt es ein r(x) > 0 mit B(x) := Br(x) (x) ⊂ Ω. Nach
Hilfssatz 4.1 können wir zur Überdeckung F = {B(x) : x ∈ K} eine endliche
∞
Zerlegung
∑p der Eins {ηα }α=1,...,p auf K mit ηα ∈ Cc (B(xα )) finden. Folglich leistet
η := α=1 ηα das Gewünschte.
q.e.d.
Hilfssatz 4.2: (Lokalisierung)
Es seien Ω, Ω∗ ⊂ Rn und ϕ = ϕ(x) : Ω → Ω∗ wie in Satz 4.1. Dann gilt Formel (4.1)
genau dann für alle f ∈ Cc0 (Ω∗ ), wenn zu jedem y 0 ∈ Ω∗ ein ϱ = ϱ(y 0 ) > 0 mit
Bϱ (y 0 ) ⊂ Ω∗ so existiert, dass Formel (4.1) für alle f ∈ Cc0 (Bϱ (y 0 )) erfüllt ist.
Beweis:
• ⇒“: Klar, wegen Cc0 (Bϱ (y 0 )) ⊂ Cc0 (Ω∗ ) für Bϱ (y 0 ) ⊂ Ω∗ .
”
• ⇐“: Sei also f ∈ Cc0 (Ω∗ ) gewählt, d.h. K := supp f ⊂ Ω∗ ist kompakt. Dann
”
existiert nach Hilfssatz 4.1 eine endliche Zerlegung der Eins {ηα }α=1,...,p auf
K mit ηα ∈ Cc∞ (Bϱ(xα ) (xα )) für α = 1, . . . , p, wobei ϱ(xα ) > 0 wie in der
228
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Voraussetzung gewählt seien. Es folgt nun mit gα := f ηα ∈ Cc0 (Bϱ(xα ) (xα )):
∫
∫
f (y) dy − f (ϕ(x))|Jϕ (x)| dx
Ω∗
Ω
=
∫ [∑
p
α=1
Ω∗
=
]
]
∫ [∑
p
ηα (y) f (y) dy −
ηα (ϕ(x)) f (ϕ(x))|Jϕ (x)| dx
p (∫
∑
α=1
Ω
α=1
)
∫
gα (y) dy −
Ω∗
gα (ϕ(x))|Jϕ (x)| dx
= 0,
Ω
nach Voraussetzung.
q.e.d.
Beweis von Satz 4.1: Wegen Hilfssatz 4.2 genügt es, die Aussage für f ∈ Cc0 (Bϱ (y 0 ))
mit beliebigem y 0 ∈ Ω∗ und geeignetem Radius ϱ = ϱ(y 0 ) > 0 mit Bϱ (y 0 ) ⊂ Ω∗
zu zeigen. Wie schon angedeutet, benutzen wir eine vollständige Induktion über die
Raumdimension n ∈ N:
1. n = 1 : Zu y 0 ∈ Ω∗ ⊂ R wählen wir ϱ > 0 mit [y 0 − ϱ, y 0 + ϱ] ⊂ Ω∗ . Setzen wir
a := ϕ−1 (y 0 − ϱ), b := ϕ−1 (y 0 + ϱ), so können wir o.B.d.A. a < b annehmen.
Dann folgt [a, b] ⊂ Ω und für beliebiges f ∈ Cc0 ((y 0 − ϱ, y 0 + ϱ)) berechnen wir
mit der Transformationsformel in einer Veränderlichen, Satz 5.5 in Kap. 3:
∫
y∫0 +ϱ
f (y) dy =
Ω∗
∫b
f (y) dy =
y 0 −ϱ
a
ϕ′ >0
f (ϕ(x))ϕ′ (x) dx =
∫
f (ϕ(x))|Jϕ (x)| dx.
Ω
2. n → n + 1 :
(a) Wir fixieren wieder y 0 ∈ Ω∗ ⊂ Rn+1 und schreiben y = (τ, ζ) mit τ ∈ R,
ζ = (ζ1 , . . . , ζn ) ∈ Rn , speziell also y 0 = (τ 0 , ζ 0 ) ∈ Ω∗ . Ferner schreiben
wir
ϕ = ϕ(x) = (γ(x), ψ(x)) : Ω → Ω∗ , Ω ⊂ Rn+1 ,
wobei γ ∈ C 1 (Ω) die erste und ψ = (ψ1 , . . . , ψn ) ∈ C 1 (Ω, Rn ) die letzten n Komponenten von ϕ bezeichnen. Zu beliebigem y = (τ, ζ) ∈ Ω∗
betrachten wir nun
{
}
Mζ := x ∈ Ω : ψ(x) − ζ = 0 .
Offenbar ist Mζ nicht leer, und wegen rg Dψ = n ist Mζ eine 1-dimensionale Mannigfaltigkeit der Klasse C 1 . In einer hinreichend kleinen Umgebung von x0 := ϕ−1 (y 0 ) ∈ Mζ 0 können wir also o.B.d.A. annehmen,
4. DIE TRANSFORMATIONSFORMEL FÜR TESTFUNKTIONEN
229
dass die Vektoren D2 ψ(x), . . . , Dn+1 ψ(x) linear unabhängig sind. Wir
schreiben x = (t, z) mit t ∈ R, z = (z1 , . . . , zn ) ∈ Rn . Nach Folgerung 6.1 aus Kap. 4 lässt sich dann Mζ lokal (um x0 ) als Graph über der
t-Achse schreiben. Wählen wir also r > 0 hinreichend klein und schreiben
W ⊂ Rn für den um ζ 0 zentrierten Würfel der Kantenlänge 2r, so gibt
es zu jedem ζ ∈ W eine Funktion g = g(t, ζ) : I → Rn ∈ C 1 (I, Rn ) mit
I := [t0 − r, t0 + r], so dass
Mζ ∩ U =
{(
)
}
t, g(t, ζ) : t ∈ I
mit einer (von ζ unabhängigen) offenen Umgebung U = U (x0 ) ⊂ Ω gilt.
Man überlegt sich noch leicht, dass g auch glatt von ζ abhängt, d.h. g ∈
C 1 (I × W, Rn ) erfüllt ist.
(b) Wir erklären nun die Funktion
(
)
h(t, ζ) := t, g(t, ζ) ,
(t, ζ) ∈ I × W,
und setzen σ(t, ζ) := γ ◦h(t, ζ) ∈ C 1 (I ×W ). Dann gilt nach Konstruktion
(
) (
)
ϕ◦h(t, ζ) = γ ◦h(t, ζ), ψ(t, g(t, ζ)) = σ(t, ζ), ζ ,
und folglich
(t, ζ) ∈ I ×W, (4.2)
(
Dϕ◦h (t, ζ) =
)
σt (t, ζ) 0
∇ζ σ(t, ζ) E
sowie
Jϕ◦h (t, ζ) = σt (t, ζ),
(t, ζ) ∈ I × W.
(4.3)
Wir behaupten nun σt ̸= 0 auf I × W . In der Tat gilt nach Konstruktion
ψ(t, g(t, ζ)) = ζ und folglich Dz ψ(h(t, ζ)) ◦ Dζ g(t, ζ) = E auf I × W . Also
muss
Jh (t, ζ) = det Dζ g(t, ζ) ̸= 0, (t, ζ) ∈ I × W,
(4.4)
gelten, und wegen Jϕ ̸= 0 auf Ω folgt aus (4.3) und (4.4) die Behauptung
σt ̸= 0 auf I × W . Wir können noch o.B.d.A. σt > 0 annehmen, also
|Jϕ◦h (t, ζ)| = σt (t, ζ) > 0,
(t, ζ) ∈ I × W.
(4.5)
(c) Wegen (4.4) ist für fixiertes t ∈ I die Abbildung g(t, ·) : W → Rn ein C 1 Diffeomorphismus (Kantenlänge 2r > 0 von W hinreichend klein). Wir
setzen für das Bild
{
}
Ω(t) := z ∈ Rn : z = g(t, ζ), ζ ∈ W ,
t ∈ I,
230
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
und beachten
V
{
}
(t, z) : t ∈ I, z ∈ Ω(t)
{(
)
}
t, g(t, ζ) : (t, ζ) ∈ I × W
∪
Mζ ∩ U
:=
=
=
(4.6)
ζ∈W
mit der in (a) erklärten Umgebung U = U (x0 ) ∈ Ω. Die Mengen Ω(t) ⊂
Rn sind quadrierbar, da das Bild der quadrierbaren, kompakten Menge W unter einem C 1 -Diffeomorphismus wieder quadrierbar ist (siehe
S. Hildebrandt: Analysis 2, Lemma 1 in § 5.2).
Wir können nun ϱ > 0 so klein wählen, dass ϕ−1 (Bϱ (y 0 )) ⊂ V erfüllt ist.
Aus (4.2) folgt dann
{(
)
}
Bϱ (y 0 ) ⊂ ϕ(V ) = σ(t, ζ), ζ : (t, ζ) ∈ I × W
(4.7)
und dass σ(·, ζ) : I → R gemäß (b) für jedes feste ζ ∈ W ein Diffeomorphismus ist.
(d) Ist nun f ∈ Cc0 (Bϱ (y 0 )) beliebig gewählt, so gilt wegen (4.7) f ◦ϕ ∈ Cc0 (V ).
Mit der Induktionsvoraussetzung und der Substitutionsformel berechnen
wir somit:
∫
∫
f (ϕ(x))|Jϕ (x)| dx =
f (ϕ(x))|Jϕ (x)| dx
Ω
(4.6)
V
∫ (∫
)
f (ϕ(t, z))|Jϕ (t, z)| dz dt
=
I
(IV)
Ω(t)
∫ (∫
=
I
(4.2),(4.4)
W
∫ (∫
I
=
W
t0 −r
∫ (
)
0 +r,ζ)
σ(t∫
=
f (τ, ζ) dτ
W
(4.7)
)
)
)
∫ ( t∫0 +r
(
)
f σ(t, ζ), ζ σt (t, ζ) dt dζ
W
Subst.-formel
(
f σ(t, ζ), ζ |Jϕ◦h (t, ζ)| dζ dt
=
(4.5)
)
)
f ϕ(t, g(t, ζ)) |Jϕ (t, g(t, ζ))| | det Dζ g(t, ζ)| dζ dt
(
∫
σ(t0 −r,ζ)
∫
f (τ, ζ) dτ dζ =
=
ϕ(V )
dζ
f (y) dy,
Ω∗
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
wie behauptet.
5
231
q.e.d.
Uneigentliche Integrale und die allgemeine Transformationsformel
Durch einen Ausschöpfungsprozess erklären wir nun, ähnlich wie im Eindimensionalen, das uneigentliche Integral über beliebige offene, nicht notwendig beschränkte
Teilmengen Ω ⊂ Rn und beginnen mit der
Definition 5.1: Es seien Ω ⊂ Rn offen und Mj ⊂⊂ Ω, j ∈ N, gewählt. Dann
heißt {Mj }j∈N eine Ausschöpfung von Ω, wenn für jedes Kompaktum K ⊂ Ω ein
j0 = j0 (K) ∈ N existiert mit
K ⊂ Mj
für alle j ≥ j0 .
Wir schreiben dann Mj → Ω (j → ∞). Sind die Mengen Mj quadrierbar, so heißt
{Mj }j quadrierbare Ausschöpfung.
Hilfssatz 5.1: Seien A, K ⊂ Rn nichtleer, A abgeschlossen, K kompakt und es gelte
A ∩ K = ∅. Dann folgt für die Distanz zwischen A und K:
{
}
dist (A, K) := inf |x − y| : x ∈ A, y ∈ K > 0.
Beweis: Wäre dist (A, K) = 0, so existierten Folgen {xl }l ⊂ A und {yl }l ⊂ K mit
|xl − yl | <
1
l
für l ∈ N.
(5.1)
Da K kompakt ist, können wir nach Satz 10.8 aus Kap. 1 eine konvergente Teilfolge {ylk }k auswählen
mit ξ := limk→∞ ylk ∈ K. Aus (5.1) folgt dann auch xlk → ξ (k → ∞), d.h. ξ ist Häufungspunkt
der abgeschlossenen Menge A, also ξ ∈ A ∩ K, Widerspruch!
q.e.d.
Hilfssatz 5.2: (Ausschöpfungslemma)
Zu jeder offenen Menge Ω ⊂ Rn existiert eine quadrierbare Ausschöpfung {Mj }j
von Ω.
Beweis: Zu jedem j ∈ N betrachten wir eine äquidistante Zerlegung Zj des Würfels
Wj := [−j, j] × . . . × [−j, j] ⊂ Rn in Teilwürfel Wjα , α ∈ Aj , mit diam Wjα ≤ 1j für
alle α ∈ Aj . Die Mengen
Mj :=
∪
Wjα ,
j ∈ N,
α∈Aj :Wjα ⊂Ω
sind dann kompakte quadrierbare Mengen mit Mj = M j ⊂ Ω.
232
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Ist K ⊂ Ω eine beliebige kompakte Teilmenge, so existiert ein j1 = j1 (K) ∈ N
mit K ⊂ Wj für alle j ≥ j1 . Nach Hilfssatz 5.1 gilt weiter
d := dist(Rn \ Ω, K) > 0.
Wählen wir j0 ≥ j1 mit
1
j0
< d, so folgt
diam Wjα ≤
1
<d
j
für alle j ≥ j0 , α ∈ Aj .
Ist nun x ∈ K beliebig gewählt, so existiert zu jedem j ≥ j0 ein α ∈ Aj mit x ∈ Wjα .
Für alle y ∈ Wjα folgt dann |y−x| < d, also y ∈ Ω, d.h. Wjα ⊂ Ω. Folglich ist x ∈ Mj ,
d.h. K ⊂ Mj für alle j ≥ j0 , wie behauptet.
q.e.d.
Definition 5.2: Sei Ω ⊂ Rn offen und f ∈ C 0 (Ω, Rd∫) gegeben. Wenn dann für jede
quadrierbare Ausschöpfung {Mj }j von Ω die Folge Mj f dx konvergiert, so setzen
wir
∫
∫
f (x) dx := lim
f (x) dx
(5.2)
j→∞
Mj
Ω
für das uneigentliche Integral von f über
∫ Ω. Wir sagen dann auch, f ist integrierbar
über Ω oder das uneigentliche Integral Ω f dx existiert bzw. konvergiert.
Bemerkungen:
1. Die Definition des uneigentlichen Integrals in (5.2) ist sinnvoll da unabhängig
von der gewählten Ausschöpfung {Mj }j .
Denn: Ist {Mj′ }j eine weitere quadrierbare Ausschöpfung von Ω, so ist offenbar auch die
′
′
gemischte Folge {M̃j }j := {M
∫ 1 , M1 , M2 , M2 , . . .} quadrierbare Ausschöpfung von Ω. Also
existiert der Grenzwert lim M̃ f dx und es gilt insbesondere
j→∞
j
∫
lim
j→∞
Mj
∫
f (x) dx = lim
j→∞
∫
f (x) dx = lim
j→∞
Mj′
M̃j
f (x) dx.
2. Falls Ω selbst quadrierbar und f ∈ C 0 (Ω, Rd ) beschränkt ist, so stimmt∫ das in
(5.2) erklärte uneigentliche Integral mit dem Riemannschen Integral Ω f dx
aus Definition 3.2 überein.
Denn: Man kann dann zu vorgegebenem ε > 0 ein quadrierbares Kompaktum K ⊂ Ω so
konstruieren, dass |Ω \ K| < ε gilt (→ Übungsaufgabe). Für eine quadrierbare Ausschöpfung
folgt dann Mj ⊃ K und folglich |Ω \ Mj | ≤ |Ω \ K| < ε für j ≥ j0 (ε). Dies liefert
∫
∫
∫
(
HS 3.2 )
(
)
≤ sup |f | |Ω \ Mj | ≤ sup |f | ε
f dx −
= f
dx
f
dx
Ω
Ω
für j ≥ j0 (ε).
Mj
Ω\Mj
Ω
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
233
∫
Definition 5.3: Das uneigentliche Integral ∫ Ω f dx einer Funktion f ∈ C 0 (Ω, Rd )
heißt absolut
∫ konvergent, wenn das Integral Ω |f (x)| dx konvergiert. Wir schreiben
dann auch Ω |f (x)| dx < +∞.
∫
Hilfssatz 5.3: Falls das uneigentliche Integral
vergiert es auch im gewöhnlichen Sinn.
Ωf
dx absolut konvergiert, so kon-
Beweis: Sei {Mk∗ }k eine quadrierbare Ausschöpfung von Ω. Setzen wir
M̃l :=
l
∪
Mk∗ ,
l ∈ N,
k=1
so ist auch
∫ {M̃l }l quadrierbare Ausschöpfung von Ω und es gilt M̃1 ⊂ M̃2 ⊂ . . .. Nach Voraussetzung
ist also { M̃ |f | dx}l konvergent und daher auch Cauchyfolge. Ist ε > 0 beliebig gewählt, so existiert
l
somit ein L = L(ε) ∈ N, so dass
∫
∫
∫
ε
|f | dx <
|f | dx −
|f | dx =
für alle l ≥ L.
(5.3)
2
M̃l \M̃L
M̃L
M̃l
Sei nun {Mj }j eine beliebige quadrierbare Ausschöpfung von Ω. Dann existiert ein J = J(ε) ∈ N,
so dass gilt
M̃L ⊂⊂ Mj für alle j ≥ J.
Sind nun j, j ′ ≥ J beliebig, so existiert andererseits ein K = K(ε) ≥ L, so dass gilt
Mj , Mj ′ ⊂⊂ M̃K .
Verwendung von (5.3) liefert dann
∫
∫
f
dx
−
f
dx
=
Mj′
Mj
f dx −
Mj \M̃L
Mj ′ \M̃L
∫
∫
≤
|f | dx +
Mj \M̃L
2
|f | dx
Mj ′ \M̃L
∫
≤
f dx
∫
∫
|f | dx
(5.3)
<
ε
für alle j, j ′ ≥ J.
M̃K \M̃L
Folglich ist {
∫
Mj
f dx}j Cauchyfolge und somit konvergent.
q.e.d.
Hilfssatz 5.4: (Charakterisierung
absoluter Konvergenz)
∫
0
d
Für beliebiges f ∈ C (Ω, R ) ist Ω f dx genau dann absolut konvergent, wenn eine
Konstante c ∈ [0, +∞) so existiert, dass gilt
∫
|f (x)| dx ≤ c für alle quadrierbaren M ⊂⊂ Ω.
(5.4)
M
234
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Beweis:
•
∫
∫
⇒“: Sei Ω |f | dx konvergent, so setzen wir c := Ω |f | dx. Ist dann M ⊂⊂ Ω quadrierbar
”
und {Mj }j quadrierbare Ausschöpfung von Ω, so folgt M ⊂ M ⊂ Mj für alle j ≥ j0 (M ) und
folglich
∫
∫
|f | dx ≤
M
|f | dx
für alle j ≥ j0 .
Mj
Grenzübergang j → ∞ liefert (5.4).
•
⇐“: Ist andererseits (5.4) erfüllt, so gilt dies insbesondere für die Elemente Mj ⊂⊂ Ω
”
einer Ausschöpfung
{Mj }j von Ω mit M1 ⊂ M2 ⊂ . . . (siehe Beweis von Hilfssatz 5.3). Die
∫
Folge { M |f | dx}j ist dann monoton wachsend und nach oben durch c beschränkt, also auch
j
konvergent.
q.e.d.
Bemerkung: Man kann nun die meisten Rechenregeln aus Satz 3.4 leicht auf uneigentliche Integrale
stetiger Funktionen
übertragen, soweit letztere existieren. Aber
∫
∫
Vorsicht: Mit Ω f∫ dx muss nicht Ω |f | dx existieren, so dass Satz 3.4 (iii) nur dann
richtig
∫ ist, wenn Ω f dx absolut konvergiert. Entsprechend gelten (iv) und (v) nur,
falls Ω f dx absolut konvergiert, und in (iv) muss zusätzlich g in Ω beschränkt sein.
Haben wir eine Folge fj : Ω → Rd stetiger Funktionen, für die das uneigentliche Integral über Ω existiert, so fragen wir wieder nach der Vertauschbarkeit von
Grenzwertbildung und Integration. Der dafür angemessene Konvergenzbegriff ist der
folgende:
Definition 5.4: Eine Folge fj : Ω → Rd ∈ C 0 (Ω, Rd ), j = 1, 2, . . ., heißt kompakt gleichmäßig konvergent, wenn für jede kompakte Teilmenge K ⊂ Ω die Einschränkungen {fj |K }j gleichmäßig konvergieren.
Bemerkung: Insbesondere existiert dann eine Grenzfunktion f (x) := limj→∞ fj (x),
x ∈ Ω, und nach dem Weierstraßschen Konvergenzsatz gilt f ∈ C 0 (Ω, Rd ).
Satz 5.1: Seien Ω ⊂ Rn offen und fj ∈ C 0 (Ω, Rd ), j = 1, 2, . . ., kompakt gleichmäßig konvergent gegen f ∈ C 0 (Ω, Rd ). Weiter existiere ∫eine integrable Majorante für
{fj }j , d.h. es gibt ein nichtnegatives F ∈ C 0 (Ω) mit Ω F dx < +∞, so dass gilt
|fj (x)| ≤ F (x)
für alle x ∈ Ω und j ∈ N.
∫Dann konvergieren auch die uneigentlichen Integrale
Ω f dx (sogar absolut), und es gilt
∫
∫ (
f (x) dx =
Ω
Ω fj
dx für j = 1, 2, . . . und
(∫
)
)
lim fj (x) dx = lim
fj (x) dx .
j→∞
Ω
∫
j→∞
Ω
(5.5)
(5.6)
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
235
Beweis: Zunächst existiert nach Hilfssatz 5.4 und Formel (5.5) ein c ∈ [0, +∞), so
dass für beliebiges quadrierbares M ⊂⊂ Ω gilt
∫
∫
|fj (x)| dx ≤ F (x) dx ≤ c.
M
M
∫
Wieder
∫ nach Hilfssatz 5.4 sind also Ω |fj | dx existent und nach Hilfssatz 5.3 erst
recht Ω fj dx. Ferner
entnehmen
∫
∫ wir (5.5) auch |f | ≤ F auf Ω, so dass aus dem
gleichen Grund Ω |f | dx und Ω f dx existieren. Nun wählen wir zu vorgegebenem
ε > 0 ein Element M ⊂⊂ Ω einer quadrierbaren Ausschöpfung so groß, dass gilt
∫
∫
∫
F (x) dx = F (x) dx − F (x) dx < ε.
Ω
Ω\M
M
(Man übertrage hierzu Hilfssatz 3.2 auf uneigentliche Integrale!) Dann folgt aus der
Monotonie des Integrals auch
∫
∫
|fj (x)| dx < ε für j = 1, 2, . . . ,
|f (x)| dx < ε.
(5.7)
Ω\M
Ω\M
Da andererseits fj →
→ f auf M gilt, entnehmen wir Satz 3.7:
∫
∫
fj (x) dx − f (x) dx < ε für alle j ≥ j0 (ε).
M
(5.8)
M
Kombination von (5.7) und (5.8) liefert nun
∫
∫
∫
∫
∫
fj dx − f dx ≤
|fj | dx +
|f | dx + (fj − f ) dx < 3ε
Ω
Ω
Ω\M
Ω\M
für j ≥ j0 (ε), also die behauptete Relation (5.6).
M
q.e.d.
Wir wollen nun die allgemeine Transformationsformel beweisen. Zur Vorbereitung benötigen wir noch den einfachen
Hilfssatz 5.5: Zu jeder offenen Menge Ω ⊂ Rn und f ∈ Cc0 (Ω) existiert eine
∫ qua0
drierbare offene Menge Θ ⊂ Ω mit f ∈ Cc (Θ). Das uneigentliche Integral Ω f dx
existiert, und es gilt
∫
∫
f dx =
Ω
f dx.
Θ
236
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Bemerkung: Die Transformationsformel für Testfunktionen, Satz 4.1, gilt also für
beliebige offene, nicht notwendig quadrierbare Mengen Ω, Ω∗ ⊂ Rn .
Beweis von Hilfssatz 5.5: Wir setzen K := supp f ⊂⊂ Ω. Dann existiert ein Kompaktum K ′ ⊂ Ω
mit K ⊂ K̊ ′ (man verwende den Satz von Heine-Borel und Hilfssatz 5.1). Sei nun M ⊂⊂ Ω ein
Element einer nach Hilfssatz 5.2 existierenden, quadrierbaren Ausschöpfung von Ω mit M ⊃ K ′ .
Wir setzen Θ := M̊ . Nach Hilfssatz 3.3 ist Θ quadrierbar und wir haben nach Konstruktion Θ ⊃
K̊ ′ ⊃ K = supp f , d.h. f ∈ Cc0 (Θ).
Ist schließlich {Mj }j eine beliebige quadrierbare Ausschöpfung von Ω, so existiert ein j0 = j0 (Θ)
mit Θ ⊂ Θ ⊂ Mj für alle j ≥ j0 . Es folgt
∫
∫
∫
∫
f dx =
f dx + f dx = f dx für j ≥ j0 ,
Mj \Θ
Mj
d.h. {
∫
Mj
Θ
Θ
f dx}j konvergiert trivial für beliebige quadrierbare Ausschöpfungen {Mj }j , und es gilt
∫
∫
f dx := lim
Ω
j→∞
Mj
∫
f dx =
f dx,
Θ
wie behauptet.
q.e.d.
Unser wichtigstes Ergebnis dieses Kapitels ist nun der folgende
Satz 5.2: (Transformationsformel)
Es seien Ω, Ω∗ ⊂ Rn offene Mengen und ϕ = ∫ϕ(x) : Ω → Ω∗ ein C 1 -Diffeomorphismus von Ω auf Ω∗ . Ist dann f ∈ C 0 (Ω∗ ) mit Ω∗ |f | dy < +∞ gewählt, so gilt
∫
∫
(5.9)
f (y) dy = f (ϕ(x))|Jϕ (x)| dx.
Ω∗
Ω
Bemerkungen:
1. Wir erinnern daran, dass ϕ ∈ C 1 (Ω, Rn ) genau dann C 1 -Diffeomorphismus ist,
wenn ϕ bijektiv auf sein Bild ist und Jϕ ̸= 0 auf Ω gilt (Folgerung 1.1 und
Satz 5.2 aus Kap. 4).
2. Durch komponentenweise Betrachtung überträgt sich (5.9) offenbar sofort auf
komplex- bzw. vektorwertige Funktionen f .
∫
3. Es genügt, (5.9) für f ∈ C 0 (Ω∗ ) mit f ≥ 0 in Ω∗ und Ω∗ f dy < +∞ zu zeigen.
Hierzu zerlegen wir ein beliebiges, nicht notwendig nichtnegatives f gemäß
f = f+ − f−
1
mit f ± := (|f | ± f )
2
in seinen Positivanteil f + und seinen Negativanteil f − . Dann folgt offenbar
f ± ≥ 0 und |f | = f + + f − auf Ω∗ . Gilt also (5.9) für f + und f − , so aufgrund
der Linearität des Integrals auch für f .
5. UNEIGENTLICHE INTEGRALE & TRANSFORMATIONSFORMEL
237
Beweis von Satz 5.2: Sei also o.B.d.A. f ≥ 0 in Ω∗ . Ist {Mj }j eine quadrierbare
Ausschöpfung von Ω, so zeigt man leicht, dass dann {Mj∗ }j mit Mj∗ := ϕ(Mj ) die
offene Menge Ω∗ = ϕ(Ω) ausschöpft (→ Übungsaufgabe) und auch Mj∗ quadrierbar
sind (→ S. Hildebrandt: Analysis 2, Lemma 1 in § 5.2). Zu jedem Mj∗ ⊂⊂ Ω∗ existiert
nach Folgerung 4.1 eine Funktion ηj∗ ∈ Cc∞ (Ω∗ ) mit ηj∗ ≡ 1 auf Mj∗ und ηj∗ (Ω∗ ) ⊂
[0, 1]. Folglich gilt auch ηj := ηj∗ ◦ ϕ : Ω → R ∈ Cc1 (Ω), ηj ≡ 1 auf Mj und ηj (Ω) ⊂
[0, 1].
Wir betrachten nun die Funktionen fj := f ηj∗ : Ω∗ → R ∈ Cc0 (Ω∗ ). Nach Satz 4.1
und Hilfssatz 5.5 gilt dann die Transformationsformel
∫
∫
fj (y) dy = fj (ϕ(x))|Jϕ (x)| dx.
(5.10)
Ω∗
Ω
Ferner konvergiert
{fj }j kompakt gleichmäßig gegen f auf Ω∗ , und es gilt 0 ≤ fj ≤ f
∫
∗
auf Ω sowie Ω∗ f dy < +∞. Satz 5.1 liefert also
∫
∫
lim
fj (y) dy = f (y) dy.
(5.11)
j→∞
Ω∗
Ω∗
Andererseits konvergiert auch {(fj ◦ ϕ)|Jϕ |}j kompakt gleichmäßig gegen (f ◦ ϕ)|Jϕ |
auf Ω. Und für beliebiges quadrierbares M ⊂⊂ Ω existiert ein j0 ∈ N mit Mj ⊃ M
für alle j ≥ j0 , so dass für solch ein j folgt
∫
∫
fj =f ηj
fj (ϕ(x))|Jϕ (x)| dx
f (ϕ(x))|Jϕ (x)| dx =
0 ≤
M
M
∫
≤
fj (ϕ(x))|Jϕ (x)| dx
Ω
(5.10)
∫
∫
fj (y) dy ≤
=
Ω∗
∫
f (y) dy =: c < +∞.
Ω∗
Die Konstante c = Ω∗ f dy ist unabhängig
von der Wahl von M , so dass nach
∫
Hilfssatz 5.4 das uneigentliche Integral Ω (f ◦ ϕ)|Jϕ | dx existiert. Wiederum nach
Satz 5.1 haben wir also
∫
∫
lim
fj (ϕ(x))|Jϕ (x)| dx = f (ϕ(x))|Jϕ (x)| dx.
(5.12)
j→∞
Ω
Ω
Kombination von (5.10), (5.11) und (5.12) liefert die behauptete Formel (5.9).
q.e.d.
Beispiele:
∫
1. Polarkoordinaten: Es sei f ∈ C 0 (KR ) mit KR |f | dy < +∞ auf der Kreisscheibe KR := {y ∈ R2 : |y| < R} gegeben. Dann gilt
∫R ( ∫2π
∫
f (y) dy =
KR
)
f (r cos θ, r sin θ)r dθ dr.
0
0
(5.13)
238
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
In der Tat ist die Abbildung ϕ = ϕ(r, θ) := (r cos θ, r sin θ) ein C 1 -Diffeomorphismus von der offenen Menge Ω := (0, R) × (0, 2π) auf die offene Menge
Ω∗ = ϕ(Ω) = {y = (y1 , y2 ) : 0 < |y| < R, y ̸= (a, 0) mit a ≥ 0} = KR \ [0, R),
für den gilt Jϕ (r, θ) = r. Die Transformationsformel (5.9) liefert also
∫R ( ∫2π
∫
f (y) dy =
KR \[0,R)
0
)
f (r cos θ, r sin θ)r dθ dr.
0
Und da [0, R) := [0, R)×{0} ⊂ R2 für jedes
R > 0 eine quadrierbare Nullmenge
∫
ist, existiert nach Folgerung 3.3 auch [0,R) f dy = 0, so dass (5.13) folgt.
Ist speziell f radialsymmetrisch, d.h. f (y) = g(|y|) mit einem g = g(r) ∈
C 0 ([0, R)), so folgt aus (5.13):
)
∫R ( ∫2π
∫
f (y) dy =
g(r)r dθ dr = 2π
0
KR
∫R
0
g(r)r dr.
(5.14)
0
Noch spezieller, für f ≡ 1 auf KR , erhalten wir somit
∫R
∫
|KR | =
r dr = πR2 .
1 dx = 2π
0
KR
Allgemein gilt: Quadrierbare Nullmengen (insbesondere also Mengen vom Inhalt Null, z.B. die Ränder quadrierbarer Mengen) können bei der Integration
ignoriert“ werden.
”
2. Gaußsches Fehlerintegral: Wir wollen zeigen
+∞
∫
√
2
e−x dx = π.
(5.15)
−∞
In Kap. 3, § 6 haben wir bereits gesehen, dass dieses Gaußsche Fehlerintegral existiert. Zur
Berechnung setzen wir WR := [−R, R] × [−R, R] für beliebiges R > 0 und beachten
∫
2
2
e−(y1 +y2 ) dy1 dy2
Satz 1.6
[ ∫R
=
2
e−x dx
]2
HS 5.4
≤
c < +∞
(5.16)
−R
WR
mit einer von R > 0 unabhängigen Konstanten c ∈ [0, +∞). Ist M ⊂⊂ R2 quadrierbar, so
existiert ein R > 0 mit M ⊂ WR , so dass nach (5.16) und Hilfssatz 5.4 das uneigentliche
2
2
Integral von e−(y1 +y2 ) über R2 existiert. Da {Wj }j=1,2,... quadrierbare Ausschöpfung des R2
ist, erhalten wir
∫
R2
2
2
e−(y1 +y2 ) dy1 dy2 = lim
∫
j→∞
Wj
2
2
e−(y1 +y2 ) dy1 dy2 =
+∞
[∫
]2
2
e−x dx < +∞.
−∞
(5.17)
6. ANHANG: VERWENDETES UND WEITERFÜHRENDES
239
Nun ist auch {Kj }j=1,2,... mit den Kreisscheiben Kj = {y = (y1 , y2 ) :
quadrierbare Ausschöpfung von R2 . Formeln (5.14) und (5.17) liefern also
+∞
∫
2
e−x dx
[∫
=
−∞
e
2
2
−(y1
+y2
)
]1
[
2
dy1 dy2
=
R2
=
∫
lim
j→∞
Kj
e
2
2
−(y1
+y2
)
6
]1
2
dy1 dy2
[
]1
]1
[
∫j
∫j
2
2
√
d −r2
−r 2
π lim
e
(2r) dr
= π − lim
(e
) dr
j→∞
j→∞
dr
0
=
|y| < j} eine
0
]1
(
√ [
√
2) 2
π lim 1 − e−j
= π.
j→∞
Anhang: Verwendetes und Weiterführendes
(A1) Jede Menge M ⊂ Rn mit Inhalt Null ist quadrierbar, und es gilt
∫
v(M ) := χM (x) dx = 0.
M
Denn: Zu beliebigem M ⊂ Rn mit Inhalt Null existieren für jedes ε > 0 Quader
Q1 , . . . , Qp , p = p(ε) ∈ N, mit
M ⊂ Q̊1 ∪ . . . ∪ Q̊p ,
p
∑
|Qj | < ε.
j=1
Wir wählen Q ⊂ Rn mit Q1 ∪ . . . ∪ Qp ⊂ Q̊. Dann wählen wir eine Zerlegung
Z von Q in Teilquader Qα , α ∈ A, deren Zerlegungskanten alle Kanten der Qj
enthalten. Die Menge A der Indizes zerfällt dann gemäß A = A′ ∪ A′′ in zwei
disjunkte Teilmengen A′ , A′′ mit folgenden Eigenschaften
•
∪
α∈A′
Qα =
p
∪
Qj und folglich
j=1
∑
α∈A′
|Qα | ≤
p
∑
|Qj |.
j=1
• Qα ∩ M = ∅ für alle α ∈ A′′ .
Für die Oszillation von χM ergibt sich daraus
{
≤ 1, für α ∈ A′
osc χM
.
Qα
= 0, für α ∈ A′′
Folglich finden wir
S Z (χM ) − S Z (χM ) =
≤
∑(
∑(
)
)
oscQα χM |Qα | +
oscQα χM |Qα |
α∈A′
∑
α∈A′
α∈A′
|Qα | ≤
p
∑
j=1
|Qj | < ε.
240
KAPITEL 5. DAS N -DIMENSIONALE RIEMANNSCHE INTEGRAL
Somit ist χM integrabel über Q, d.h. M ist quadrierbar. Außerdem haben wir
0 ≤ S Z (χM ) =
∑(
p
∑
)
sup χM |Qα | ≤
|Qj | < ε.
α∈A′
Qα
j=1
Wählen wir noch eine ausgezeichnete Zerlegungsfolge {Zp }p und setzen Zp′ :=
Zp ∨ Z, so ist auch {Zp′ }p ausgezeichnete Zerlegungsfolge. Nach Hilfssatz 1.1 (i)
gilt somit
0 ≤ S Zp′ (χM ) ≤ S Z (χM ) < ε,
also nach Grenzübergang p → ∞:
∫
0 ≤ lim S Zp′ (χM ) =
χM dx < ε.
p→∞
Q
Da ε > 0 beliebig war, haben wir die Behauptung.
(A2) Wenn M ⊂ Rn Nullmenge ist, so folgt M̊ = ∅.
Denn: Wie in der Vorlesung bemerkt, ist jeder Quader Q = [a1 , b1 ] × . . . ×
[an , bn ] ⊂ Rn quadrierbar mit
v(Q) = |Q| =
n
∏
(bj − aj ).
j=1
Wäre nun M̊ ̸= ∅, so existierte ein Würfel Wx ⊂ M̊ zentriert um x mit
Kantenlänge ε > 0. Für das Volumen von Wx gilt dann aber v(Wx ) = εn > 0.
Nach (A1) ist also Wx keine Menge mit Inhalt Null und, da kompakt, auch
keine Nullmenge, im Widerspruch zu Wx ⊂ M̊ ⊂ M .
(A3) Sind M ⊂ Rm , N ⊂ Rn quadrierbar, so ist auch M × N ⊂ Rm+n quadrierbar.
Denn: Man überlegt sich leicht (M × N )c = (M c × Rn ) ∪ (Rm × N c ), woraus
folgt
∂(M × N ) = (∂M × N ) ∪ (M × ∂N ).
Wir zeigen nun, dass |∂(M × N )| = 0 gilt; nach Satz 3.1 ist dann M × N
quadrierbar.
Da M und N kompakt sind, gibt es Quader QM ⊂ Rm , QN ⊂ Rn mit M ⊂
Q̊M , N ⊂ Q̊N . Nach Voraussetzung existieren weiter Quader Q1 , . . . , Qr ⊂ Rm ,
Qr+1 , . . . , Qp ⊂ Rn zu beliebigen ε > 0 mit
∂M ⊂ Q̊1 ∪ . . . ∪ Q̊r ,
r
∑
|Qj | < ε,
j=1
∂N ⊂ Q̊r+1 ∪ . . . ∪ Q̊p ,
p
∑
j=r+1
|Qj | < ε.
6. ANHANG: VERWENDETES UND WEITERFÜHRENDES
Mit den Quadern
{
Q′j :=
241
Qj × QN , für j = 1, . . . , r
⊂ Rm+n
QM × Qj , für j = r + 1, . . . , p
gilt dann offenbar
∂(M × N ) ⊂
(∪
r
Q̊′j
)
∪
( ∪
p
Q̊′j
)
=
(∪
p
)
,
j=1
j=r+1
j=1
Q̊′j
und wir haben
p
p
r
∑
∑
∑
(
)
|Q′j | =
|Qj | |QN | +
|QM | |Qj | < ε |QN | + |QM | .
j=1
j=r+1
j=1
Da ε > 0 beliebig war, ist also ∂(M × N ) Menge mit Inhalt Null.
(A4) Sind M ⊂ Rm , N ⊂ Rn quadrierbar und f = f (x, y) ∈ C 0 (M × N, Rd )
beschränkt, so folgt
)
)
∫ (∫
∫ (∫
∫
f dx dy.
f dy dx =
f (x, y) dx dy =
M ×N
M
N
N
M
Folgerung: |M × N | = |M | |N |.
Denn: Nach (A3) ist zunächst M ×N quadrierbar, und nach Folgerung 3.1 auch
f ∈ R(M × N, Rd ) richtig. Sei o.B.d.A. d = 1. Wir wählen Quader Q ⊂ Rm ,
R ⊂ Rn mit M ⊂ Q̊, N ⊂ R̊. Setzen wir noch g := f M ×N ∈ R(Q × R) und
φ(x) := I R (g(x, ·)),
so gilt nach Satz 1.5:
∫
φ(x) := I R (g(x, ·)),
∫
Q
Q×R
Nun beachten wir
{
g(x, ·) =
Somit erhalten wir
∫
f dx dy =
Q×R
∫
φ(x) dx =
f dx dy =
x ∈ Q,
φ(x) dx.
Q
f (x, ·)N , für x ∈ M
.
0,
für x ∈ Q \ M
∫
∫
φ(x) dx +
Q\M
φ(x) dx
Q\M
∫ (∫
=
)
∫ (∫
f (x, y)N dy dx =
M
R
Die zweite Relation folgt durch Vertauschen x ↔ y.
)
f dy dx.
M
N
Herunterladen