Analysis 1 - Institut für Mathematik

Werbung
ANALYSIS I
Christian Kanzow
Julius–Maximilians–Universität Würzburg
Institut für Mathematik
Am Hubland
97074 Würzburg
e-mail: [email protected]
URL: http://www.mathematik.uni-wuerzburg.de/˜kanzow
Vorlesungsskript
Stand: 8. Februar 2011
Inhaltsverzeichnis
1 Körper und Zahlen
1.1 Mengen . . . . . . . . . . . . . . . . . .
1.2 Das Prinzip der vollständigen Induktion
1.3 Körper . . . . . . . . . . . . . . . . . . .
1.4 Geordnete Körper . . . . . . . . . . . . .
1.5 Reelle Zahlen . . . . . . . . . . . . . . .
1.6 Komplexe Zahlen . . . . . . . . . . . . .
2 Funktionen
2.1 Funktionen . . . . . . . .
2.2 Monotone Funktionen . .
2.3 Polynome . . . . . . . . .
2.4 Rationale Funktionen . . .
2.5 Abzählbarkeit von Mengen
.
.
.
.
.
3 Folgen und Reihen
3.1 Folgen . . . . . . . . . . . .
3.2 Cauchy–Folgen . . . . . . .
3.3 Unendliche Reihen . . . . .
3.4 Absolut konvergente Reihen
3.5 Multiplikation von Reihen .
3.6 Potenzreihen . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Metrische Räume und Stetigkeit
4.1 Metrische und normierte Räume . . . . .
4.2 Folgen in metrischen Räumen . . . . . .
4.3 Offene und abgeschlossene Mengen . . .
4.4 Stetige Funktionen . . . . . . . . . . . .
4.5 Grenzwerte von Funktionen . . . . . . .
4.6 Kompakte Mengen . . . . . . . . . . . .
4.7 Der Approximationssatz von Weierstraß
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
14
22
27
32
.
.
.
.
.
39
39
45
46
50
54
.
.
.
.
.
.
59
59
67
74
80
88
91
.
.
.
.
.
.
.
99
99
104
109
114
122
126
135
5 Spezielle Funktionen
5.1 Exponentialfunktion . . . . . . . . . . . . . . .
5.2 Natürlicher Logarithmus und allgemeine Potenz
5.3 Sinus und Cosinus . . . . . . . . . . . . . . . . .
5.4 Trigonometrische Umkehrfunktionen . . . . . .
5.5 Polarkoordinaten . . . . . . . . . . . . . . . . .
5.6 Der Fundamentalsatz der Algebra . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
141
141
146
150
157
160
162
6 Differentialrechnung
6.1 Die Ableitung einer Funktion . . . . . .
6.2 Rechenregeln . . . . . . . . . . . . . . .
6.3 Mittelwertsätze . . . . . . . . . . . . . .
6.4 Die Regeln von L’Hospital . . . . . . . .
6.5 Konvexe Funktionen . . . . . . . . . . .
6.6 Wichtige Ungleichungen und ℓp –Normen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
167
167
175
182
187
191
195
7 Das
7.1
7.2
7.3
7.4
7.5
7.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
201
201
205
211
216
224
234
Riemann–Integral
Unter– und Obersummen . . .
Riemann–Integral . . . . . . .
Riemannsche Summen . . . .
Rechenregeln . . . . . . . . .
Differentiation und Integration
Die Lp –Normen . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Kapitel 1
Körper und Zahlen
1.1
1.2
1.3
1.4
1.5
1.6
1.1
Mengen
Das Prinzip der vollständigen Induktion
Körper
Geordneter Körper
Reelle Zahlen
Komplexe Zahlen
Mengen
Dieser Abschnitt gibt eine kurze Einführung in die Grundbegriffe der Mengenlehre. Dabei
verzichten wir auf eine exakte (nicht ganz unkritische) Definition des Mengenbegriffs und
gehen davon aus, dass intuitiv klar ist, was unter einer Menge zu verstehen ist. Beispiele sind etwa die Menge aller Einwohner Würzburgs oder die Menge aller Mathematik–
Studierenden an der Universität Würzburg oder die Menge aller unter deutscher Flagge
fahrenden Handelsschiffe.
Von besonderer Bedeutung sind die folgenden Mengen von Zahlen, die deshalb ein
eigenes Symbol erhalten: Die Menge der
• natürlichen Zahlen N := {1, 2, 3, . . .},
• natürlichen Zahlen mit Null N0 := {0, 1, 2, . . .},
• ganzen Zahlen Z := {0, ±1, ±2, ±3, . . .},
• rationalen Zahlen Q := pq p, q ∈ Z, q 6= 0 ,
• reellen Zahlen R.
Im Gegensatz zu den natürlichen, ganzen und rationalen Zahlen haben wir die Menge der
reellen Zahlen R in der obigen Aufzählung nicht formal definiert. Wir werden dies später
nachholen (siehe Abschnitt 1.5) und zunächst davon ausgehen, dass die reellen Zahlen, mit
denen wir im täglichen Leben stets rechnen, bekannt sind.
1
2
KAPITEL 1. KÖRPER UND ZAHLEN
Sei nun M eine beliebige Menge. Wir schreiben x ∈ M, wenn x ein Element der Menge
M ist. Hingegen bedeutet x ∈
/ M, dass x kein Element der Menge M ist. Beispielsweise ist
−1 ∈ Z und −1 ∈
/ N. Die aufzählende Charakterisierung
M = x, y, z, . . .
einer Menge M bedeutet, dass M aus den Elementen x, y, z, . . . besteht. Diese Beschreibung
einer Menge haben wir weiter oben bereits für N, N0 und Z verwendet. Oft wird auch die
beschreibende Charakterisierung
M = x x hat die Eigenschaft E
einer Menge M benutzt, wonach M gerade die Menge aller Elemente x ist, welche die
Eigenschaft E besitzen. Auf diese Weise haben wir beispielsweise die Menge Q eingeführt.
Definition 1.1 Seien M1 und M2 zwei beliebige Mengen.
(a) M1 ist Teilmenge von M2 (Schreibweise: M1 ⊆ M2 ), wenn jedes Element von M1
auch ein Element von M2 ist.
(b) M1 und M2 heißen gleich (Schreibweise: M1 = M2 ), wenn sowohl M1 ⊆ M2 als auch
M2 ⊆ M1 gelten, M1 und M2 also dieselben Elemente enthalten; anderenfalls sind
M1 und M2 ungleich oder verschieden (Schreibweise: M1 6= M2 ).
(c) M1 heißt echte Teilmenge von M2 (Schreibweise: M1 $ M2 ), wenn M1 ⊆ M2 und
M1 6= M2 gelten.
(d) Ist M1 keine Teilmenge von M2 , so schreiben wir M1 * M2 .
Aus der Definition 1.1 ergeben sich unmittelbar die folgenden Eigenschaften:
• Für jede Menge M ist M ⊆ M (Reflexivität).
• Für drei Mengen M1 , M2 , M3 mit M1 ⊆ M2 und M2 ⊆ M3 gilt M1 ⊆ M3 (Transitivität).
Wir führen als Nächstes die wichtigsten Mengenoperationen ein.
Definition 1.2 Seien M1 und M2 zwei beliebige Mengen.
(a) Die Vereinigung von M1 und M2 ist
M1 ∪ M2 := x x ∈ M1 oder x ∈ M2 .
(b) Der Durchschnitt von M1 und M2 ist
M1 ∩ M2 := x x ∈ M1 und x ∈ M2 .
Christian Kanzow, Universität Würzburg, WS 2010/11
1.1. MENGEN
3
(c) Die Differenz von M1 und M2 ist
M1 \M2 := x x ∈ M1 , x ∈
/ M2 .
Gilt hierbei M2 ⊆ M1 , so wird M1 \M2 auch als das Komplement von M2 in M1
bezeichnet (Schreibweise: CM1 (M2 )).
Eine Illustration der gerade eingeführten Begriffe findet man in der Abbildung 1.1.
M1 und M2 :
M1
M2
Vereinigung M1 ∪ M2 :
M1
M2
Durchschnitt M1 ∩ M2 :
M1
M2
Differenz M1 \ M2 :
M1
M2
Abbildung 1.1: Vereinigung, Durchschnitt und Komplement von zwei Mengen M1 und M2
Manchmal tritt der Fall auf, dass eine Menge kein Element besitzt. Diese Menge bezeichnen wir als leere Menge und schreiben hierfür ∅. Beispielsweise ist M\M = ∅ für jede
beliebige Menge M. Ebenso gilt
M1 ∩ M2 = ∅ für M1 := {1, 2, 3} und M2 := {5, 6, 7}.
Für die Vereinigung und den Durchschnitt von Mengen gelten die folgenden Rechenregeln.
Satz 1.3 ( Rechenregeln für Vereinigung und Durchschnitt von Mengen )
Seien M1 , M2 , M3 beliebige Mengen. Dann gelten
Christian Kanzow, Universität Würzburg, WS 2010/11
4
KAPITEL 1. KÖRPER UND ZAHLEN
(a) die Kommutativgesetze
M1 ∪ M2 = M2 ∪ M1
und
M1 ∩ M2 = M2 ∩ M1 .
und
M1 ∩ (M2 ∩ M3 ) = (M1 ∩ M2 ) ∩ M3 .
(b) die Assoziativgesetze
M1 ∪ (M2 ∪ M3 ) = (M1 ∪ M2 ) ∪ M3
(c) die Distributivgesetze
M1 ∩ (M2 ∪ M3 ) = (M1 ∩ M2 ) ∪ (M1 ∩ M3 ) und
M1 ∪ (M2 ∩ M3 ) = (M1 ∪ M2 ) ∩ (M1 ∪ M3 ).
Beweis: Wir beweisen hier nur eines der Distributivgesetze. Der Nachweis der übrigen
Behauptungen kann auf analoge Weise geschehen. Es gilt
x ∈ M1 ∩ (M2 ∪ M3 )
⇐⇒ x ∈ M1 und x ∈ M2 ∪ M3
⇐⇒ x ∈ M1 und (x ∈ M2 oder x ∈ M3 )
⇐⇒ (x ∈ M1 und x ∈ M2 ) oder (x ∈ M1 und x ∈ M3 )
⇐⇒ x ∈ M1 ∩ M2 oder x ∈ M1 ∩ M3
⇐⇒ x ∈ (M1 ∩ M2 ) ∪ (M1 ∩ M3 ).
Also haben wir M1 ∩ (M2 ∪ M3 ) = (M1 ∩ M2 ) ∪ (M1 ∩ M3 ).
2
Aufgrund der Assoziativgesetze können wir einfach
M1 ∪ M2 ∪ M3
und M1 ∩ M2 ∩ M3
(1.1)
für die Vereinigung und den Durchschnitt von drei Mengen schreiben. Ebenso können auch
die Vereinigung und der Durchschnitt von beliebig vielen Mengen genommen werden. Sind
Mi für jedes i aus einer so genannten Indexmenge I beliebige Mengen, so setzen wir
[
Mi := x x ∈ Mi für mindestens ein i ∈ I
i∈I
für die Vereinigung und
\
i∈I
Mi := x x ∈ M für alle i ∈ I
für den Durchschnitt dieser Mengen. Speziell für I = {1, 2, 3} erhalten wir auf diese Weise
wieder die beiden Mengen (1.1).
Eine wichtige Regel für die Komplementbildung von Vereinigungen und Durchschnitten
ist in dem nachstehenden Satz enthalten.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.2. DAS PRINZIP DER VOLLSTÄNDIGEN INDUKTION
5
Satz 1.4 ( Regeln von De Morgan )
Seien M eine Menge und Mi ⊆ M für alle i aus einer Indexmenge I. Dann gelten:
T
S
(a) Es ist CM
i∈I Mi =
i∈I CM (Mi ).
S
T
(b) Es ist CM
i∈I Mi =
i∈I CM (Mi ).
Beweis: Wir beweisen hier lediglich die Aussage (a). Teil (b) kann entsprechend
verifiziert
S
werden. Zunächst bemerken wir, dass aus Mi ⊆ M für alle i ∈ I auch i∈I Mi ⊆ M folgt,
weshalb wir insbesondere das Komplement dieser Vereinigungsmenge in M betrachten
dürfen. Aufgrund der Äquivalenzen
[ x ∈ CM
Mi
i∈I
⇐⇒ x ∈ M\
⇐⇒ x ∈ M
[
Mi
i∈I
und x ∈
/
[
Mi
i∈I
⇐⇒ x ∈ M und x ∈
/ Mi für alle i ∈ I
⇐⇒ x ∈ CM (Mi ) für alle i ∈ I
\
⇐⇒ x ∈
CM (Mi )
i∈I
gilt die Behauptung (a).
2
Die Abbildung 1.2 veranschaulicht die Aussage (a) des Satzes 1.4 für den Spezialfall von
zwei Mengen M1 und M1 .
1.2
Das Prinzip der vollständigen Induktion
Die vollständige Induktion ist ein sehr wichtiges Hilfsmittel, das häufig bei folgendem
Problem angewandt wird: Es sei n0 ∈ Z eine ganze (oft eine natürliche) Zahl und A(n) für
jede ganze Zahl n ≥ n0 eine Aussage. Es soll bewiesen werden, dass die Aussage A(n) für
alle n ≥ n0 wahr ist. Dazu benutzt man das folgende Prinzip der vollständigen Induktion:
• Induktionsanfang: Man zeigt, dass die Aussage A(n0 ) richtig ist.
• Induktionsschritt: Man verifiziert für ein beliebiges n ≥ n0 , dass mit A(n) auch die
Aussage A(n + 1) wahr ist.
Im Induktionsschritt wird die Gültigkeit von A(n) oft als Induktionsvoraussetzung bezeichnet.
Christian Kanzow, Universität Würzburg, WS 2010/11
6
KAPITEL 1. KÖRPER UND ZAHLEN
CM (M1 ∪ M2 ):
M
M1
M2
CM (M1 ):
M
M1
M2
CM (M2 ):
M
M1
M2
Abbildung 1.2: Veranschaulichung der ersten Regel von De Morgan
Hat man sowohl den Induktionsanfang als auch den Induktionsschritt bewiesen, so gilt
die Aussage A(n) offenbar für alle n ≥ n0 , denn zunächst ist A(n0 ) aufgrund des Induktionsanfangs richtig. Anwendung des Induktionsschrittes mit n = n0 liefert anschließend
die Gültigkeit der Aussage A(n0 + 1). Erneute Anwendung des Induktionsschrittes mit
n = n0 + 1 ergibt dann, dass die Aussage A(n0 + 2) gilt. Wiederholte Verwendung des
Induktionsschrittes zeigt, dass auch die Aussagen A(n0 + 3), A(n0 + 4), . . . wahr sind.
Wir illustrieren das Prinzip der vollständigen Induktion in diesem Abschnitt an mehreren Beispielen. Dabei benutzen wir insbesondere die Notation
n
X
ak := am + am+1 + . . . + an
k=m
für die Summe von gewissen Zahlen am , am+1 , . . . , an , wobei wir im Fall n < m von der
Konvention
n
X
ak := 0 für n < m (leere Summe)
k=m
Gebrauch machen. Ebenso schreiben wir
n
Y
k=m
ak := am · am+1 · . . . · an
Christian Kanzow, Universität Würzburg, WS 2010/11
1.2. DAS PRINZIP DER VOLLSTÄNDIGEN INDUKTION
7
für das Produkt der Zahlen am , am+1 , . . . , an , wobei auch hier die Konvention
n
Y
ak := 1 für n < m (leeres Produkt)
k=m
gelte.
Unser erstes Resultat gibt einen geschlossenen Ausdruck für die Summe der ersten n
natürlichen Zahlen an.
Satz 1.5 Für alle n ∈ N gilt
n
X
k=
k=1
n(n + 1)
.
2
(1.2)
Beweis: Der Beweis erfolgt durch vollständige Induktion nach n. Betrachten wir den
Induktionsanfang n = 1, so gilt einerseits
1
X
k=1
k=1
und andererseits auch
1(1 + 1)
= 1,
2
so dass die Aussage für n = 1 bewiesen ist. Die Behauptung (1.2) möge nun für ein n ≥ 1
gelten (Induktionsvoraussetzung). Zu zeigen ist dann die Gültigkeit für n + 1 (Induktionsschluss), also die Gleichheit
n+1
X
(n + 1)(n + 2)
k=
.
2
k=1
Unter Verwendung der Induktionsvoraussetzung sieht man dies wie folgt ein:
!
n
n+1
X
X
n(n + 1)
(n + 1)(n + 2)
k + (n + 1) =
+ (n + 1) =
.
k=
2
2
k=1
k=1
Damit ist alles bewiesen.
2
Bevor wir zu unserem nächsten Resultat kommen, betrachten wir als Motivation eine Menge, die aus drei Elementen bestehen möge, etwa
X = {x1 , x2 , x3 }.
Nun kann man die Elemente natürlich auch in einer anderen Reihenfolge anordnen, nämlich
X = {x1 , x3 , x2 } oder
X = {x2 , x1 , x3 } oder
Christian Kanzow, Universität Würzburg, WS 2010/11
8
KAPITEL 1. KÖRPER UND ZAHLEN
X = {x2 , x3 , x1 } oder
X = {x3 , x1 , x2 } oder
X = {x3 , x2 , x1 }.
Damit haben wir sechs verschiedene Anordnungen der Menge X gefunden, und dabei handelt es sich offenbar auch um alle denkbaren Anordnungen. Schreiben wir
n! :=
n
Y
k
(sprich: n Fakultät)
k=1
für die so genannte Fakultät einer Zahl n ∈ N (gemäß Konvention zum leeren Produkt ist
insbesondere 0! = 1), so hat die 3–elementige Menge X also 3! = 1 · 2 · 3 = 6 verschiedene
Anordnungen. Diese Beobachtung lässt sich auf allgemeine n übertragen.
Satz 1.6 Die Anzahl der verschiedenen Anordnungen einer n–elementigen Menge X =
{x1 , x2 , . . . , xn } ist gleich n!.
Beweis: Der Beweis erfolgt wieder durch vollständige Induktion nach n. Für n = 1 ist
n! = 1 per Definition der Fakultät. Ferner besitzt eine einelementige Menge offenbar auch
nur eine mögliche Anordnung ihrer Elemente. Damit ist der Induktionsanfang bewiesen.
Der Satz möge nun für n–elementige Mengen gelten (dies ist wieder die Induktionsvoraussetzung). Wir betrachten dann eine beliebige (n+1)–elementige Menge {x1 , . . . , xn , xn+1 }.
Analog zu dem obigen Beispiel mit drei Elementen zerfallen die möglichen Anordnungen
unserer (n + 1)–elementigen Menge in die folgenden Klassen Kk , k = 1, 2, . . . , n + 1: Die
Anordnungen der Klasse Kk haben das Element xk an erster Stelle, wobei die übrigen n Elemente in beliebiger Reihenfolge auftreten können. Nach Induktionsvoraussetzung besteht
jede Klasse Kk somit aus n! verschiedenen Anordnungen. Die Gesamtzahl aller Anordnungen von {x1 , . . . , xn+1 } ist also gleich (n + 1)n! = (n + 1)!.
2
Für zwei natürliche Zahlen n, k ∈ N0 mit k ≤ n heißt
n!
n
n · (n − 1) · . . . · (n − k + 1)
:=
=
(sprich: n über k)
k
k!(n − k)!
1 · 2 · ...· k
der Binomialkoeffizient von n über k (für k > n wird nk := 0 gesetzt). Einige elementare
Eigenschaften des Binomialkoeffizienten sind in der nachstehenden Bemerkung zusammengefasst.
Bemerkung 1.7 (a) Wegen 0! = 1 ist
n!
n
n!
n
=
=
= 1 und
=1
0
0!n!
n!0!
n
für alle n ∈ N0 .
Christian Kanzow, Universität Würzburg, WS 2010/11
1.2. DAS PRINZIP DER VOLLSTÄNDIGEN INDUKTION
9
(b) Aus der Definition des Binomialkoeffizienten folgt sofort die Symmetrie–Eigenschaft
n
n
=
n−k
k
für alle n ∈ N0 und alle k ∈ {0, 1, . . . , n}.
(c) Es gilt die Rekursionsformel
n+1
k
=
n
n
∀1 ≤ k ≤ n,
+
k
k−1
die sich unmittelbar mittels vollständiger Induktion verifizieren lässt.
3
Die in Bemerkung 1.7 (c) genannte Rekursionsformel für die Binomialkoeffizienten
erlaubt
n
die sukzessive Berechnung dieser Zahlen: Sind die Werte von k für ein n ∈ N0 und alle
1 ≤ k ≤ n bekannt, so lassen sich unter Berücksichtigung der Randwerte“ n0 = nn = 1
”
aus Bemerkung 1.7 (a) alle Binomialkoeffizienten n+1
für
1
≤
k
k ≤ n + 1 berechnen durch
n
n
Summation der beiden vorhergehenden Werte k−1 und k . Man kann sich diese Rekursionsformel leicht merken, indem man die Binomialkoeffizienten in Form des so genannten
Pascalschen Dreiecks anordnet:
..
.
5
0
1
0 2
0 3
0 4
0 0
0 5
1
..
.
2
2 2
1 3
1 4
1 1
1 5
2
..
.
3
2 4
2 5
3
..
.
3
3 4
3 5
4
..
.
4
4 5
5
..
.
Numerisch erhält man im Pascalschen Dreieck folgende Werte:
Christian Kanzow, Universität Würzburg, WS 2010/11
10
KAPITEL 1. KÖRPER UND ZAHLEN
1
1
1
ց
1
1
ւ
2
3
3
ց
1
4
ց
..
.
1
1
1
ւ
6
4
1
ւ
5
..
.
10
..
.
10
..
.
5
..
.
1
..
.
Die hiermit eingeführten Binomialkoeffizienten treten in verschiedenen Zusammenhängen
auf, so beispielsweise bei der Fragestellung, wie viele k–elementige Teilmengen man aus einer n–elementigen Menge auswählen kann. Dabei sollen verschiedene Anordnungen einer
k–elementigen Teilmenge nicht gesondert gezählt werden. Betrachten wir beispielsweise
wieder eine dreielementige Teilmenge
X = {x1 , x2 , x3 },
so besitzt diese offenbar die folgenden drei zweielementigen Teilmengen:
{x1 , x2 },
{x2 , x3 } und {x1 , x3 }.
Mit n = 3 und k = 2 sind dies genau 32 Stück. Dieses Beispiel gilt ebenfalls allgemeiner.
Satz 1.8 Die Anzahl der k–elementigen Teilmengen einer n–elementigen
Menge ist (ohne
n
Berücksichtigung der Anordnung der Elemente) gegeben durch k .
Beweis: Wir betrachten zunächst alle möglichen Kombinationen von k Elementen mit
Berücksichtigung der Anordnung. Dann haben wir zur Auswahl des ersten Elements n
Möglichkeiten, danach bleiben zur Auswahl des zweiten Elements noch n − 1 Möglichkeiten usw., bis man zur Auswahl des k-ten Elements noch n − k + 1 Möglichkeiten hat.
Die Gesamtzahl der möglichen Kombinationen von k Elementen mit Berücksichtigung der
Anordnung beträgt somit
n · (n − 1) · . . . · (n − k + 1).
Legen wir auf die Anordnung keinen Wert, so fallen alle Kombinationen zusammen, bei
denen es sich nur um Umordnungen der Elemente handelt. Wegen Satz 1.6 sind dies genau
k!. Die Zahl der k–elementigen Teilmengen einer n–elementigen Menge beträgt somit
n · (n − 1) · . . . · (n − k + 1)
n!
n
,
=
=
k
k!
k!(n − k)!
was zu beweisen war.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
1.2. DAS PRINZIP DER VOLLSTÄNDIGEN INDUKTION
11
Die Anzahl der 6–elementigen Teilmengen von 49 Elementen beträgt somit
49 · 48 · 47 · 46 · 45 · 44
49
=
= 13.983.816.
6
1·2·3·4·5·6
Die Chance, beim Lotto 6 aus 49“ die richtige Kombination zu erraten, ist also etwa 1:14
”
Millionen.
Die bereits im Satz 1.8 aufgetretenen Binominalkoeffizienten verdanken ihrem Namen
der Tatsache, dass sie im binomischen Lehrsatz als Koeffizienten auftreten, den wir in dem
folgenden Resultat formulieren.
Satz 1.9 ( Binomischer Lehrsatz )
Für beliebige x, y ∈ Q und jedes n ∈ N0 gilt
n X
n n−k k
x y .
(x + y) =
k
n
k=0
Beweis: Wir beweisen zunächst den Spezialfall
n X
n n
n 2
n
n
n k
n
x .
x + ...+
x+
+
x =
(1 + x) =
n
2
1
0
k
k=0
(1.3)
Für n = 0 ist (1.3) offenbar richtig (Induktionsanfang). Die Gleichheit (1.3) gelte nun für
ein beliebiges n (Induktionsvoraussetzung). Multiplizieren wir (1.3) mit x, so folgt
n n+1
n 2
n
n
x .
x + ...+
x+
x(1 + x) =
n
1
0
Addiert man diese Gleichung zu (1.3), so folgt
(1 + x)n+1 = (1 + x)(1 + x)n
= (1 + x)n + x(1 + x)n
n
n
n
n
x2 +
+
x+
+
= 1+
2
1
1
0
n
n
xn + xn+1 .
+
...+
n
n−1
Zusammen mit den Beziehungen aus der Bemerkung 1.7 ergibt sich hieraus unmittelbar
die Gültigkeit von (1.3) für n + 1.
Zum Nachweis der eigentlichen Behauptung ersetzen wir x durch x/y (falls y 6= 0 gilt,
sonst ist die Aussage trivial wegen 00 = 1) und multiplizieren die entstehende Gleichung
(1.3) anschließend mit y n .
2
Christian Kanzow, Universität Würzburg, WS 2010/11
12
KAPITEL 1. KÖRPER UND ZAHLEN
Im Satz 1.9 waren x und y beliebige rationale Zahlen. Der Beweis ist identisch, wenn
man x, y aus der Menge der reellen Zahlen R oder sogar aus der Menge der komplexen
Zahlen C wählt. Der einzige Grund, warum das Resultat nur für x, y ∈ Q formuliert wurde,
liegt darin, dass uns die rationalen Zahlen bereits bekannt sind, die reellen und komplexen
Zahlen jedoch erst noch eingeführt werden und von daher im Moment nicht zur Verfügung
stehen.
Aufgrund des binomischen Lehrsatzes lauten die ersten Potenzen von (x + y)n für
n = 0, 1, 2, 3, 4, 5 somit (man verwende hierbei die numerischen Werte aus dem Pascalschen
Dreieck):
(x + y)0
(x + y)1
(x + y)2
(x + y)3
(x + y)4
(x + y)5
=1
=x+y
= x2 + 2xy + y 2
= x3 + 3x2 y + 3xy 2 + y 3
= x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4
= x5 + 5x4 y + 10x3 y 2 + 10x2 y 3 + 5xy 4 + y 5.
Als einfache Konsequenz aus dem binomischen Lehrsatz erhalten wir das nachstehende
Resultat, bei dem wir mit
2M := {N | N ⊆ M}
die so genannte Potenzmenge von M bezeichnen. Die Potenzmenge ist also gerade die
Menge aller Teilmengen von M (inklusive der leeren Menge sowie der Menge M selbst).
Satz 1.10 ( Mächtigkeit der Potenzmenge )
Sei X eine beliebige Menge mit n Elementen. Dann besitzt X genau 2n Teilmengen, es gilt
also |2X | = 2n .
Beweis: Offenbar gilt
Menge aller Teilmengen von X
= Menge aller Teilmengen von X mit 0 Elementen
+Menge aller Teilmengen von X mit 1 Element
+Menge aller Teilmengen von X mit 2 Elementen
..
..
..
.
.
.
+Menge aller Teilmengen von X mit n Elementen.
Wegen Satz 1.8 ist die Anzahl der k–elementigen Teilmengen von X gegeben durch
Damit folgt
n X
n
X
= 2n ,
|2 | =
k
k=0
n
k
.
wobei sich die zweite Gleichheit aus dem binomischen Lehrsatz 1.9 mit x = y = 1 ergibt.
2
Christian Kanzow, Universität Würzburg, WS 2010/11
1.2. DAS PRINZIP DER VOLLSTÄNDIGEN INDUKTION
13
Das vorige Resultat motiviert nachträgliche die Verwendung der Schreibweise 2M für die
Potenzmenge einer gegebenen Menge M.
Zum Abschluss dieses Abschnitts beweisen wir noch das folgende Resultat.
Satz 1.11 ( Geometrische Summenformel )
Für jedes x 6= 1 und jede natürliche Zahl n ∈ N0 gilt
n
X
xk =
k=0
1 − xn+1
.
1−x
Beweis: Der Beweis erfolgt wieder durch vollständige Induktion. Für n = 0 ist
0
X
1 − x0+1
x =1=
.
1−x
k=0
k
Die Aussage gelte jetzt für ein beliebiges n ∈ N0 . Dann folgt
!
n+1
n
X
X
1 − xn+1
1 − x(n+1)+1
xk =
xk + xn+1 =
+ xn+1 =
,
1
−
x
1
−
x
k=0
k=0
womit der Induktionsschritt bewiesen ist.
2
Die Gültigkeit von Satz 1.11 lässt sich auch anders einsehen: Um die Behauptung
1 + x + x2 + . . . + xn =
1 − xn+1
1−x
zu verifizieren, multipliziert man diese Gleichung mit 1 − x und beachtet, dass sich auf der
linken Seite dann fast alle Terme wegheben. Der Satz 1.11 besitzt eine wichtige Rolle in
der Zinsrechnung, wofür wir an dieser Stelle kurz ein Beipiel angeben wollen.
Beispiel 1.12 Auf ein Konto wird am Anfang eines jeden Jahres ein Betrag von 5.000 e
eingezahlt. Die Verzinsung beträgt 4.5% pro Jahr, als Laufzeit werden 5 Jahre gewählt.
Am Ende des ersten Jahres beträgt das Guthaben dann
5.000e + 0, 045 ∗ 5.000e = 1, 045 ∗ 5.000e = 5.225, 00e.
Im zweiten Jahre werden diese 5.225,00 e wiederum mit 4.5% verzinst, außerdem die neu
eingezahlten 5.000 e. Zum Ende des zweiten Jahres verfügt man somit über ein Guthaben
von
1, 045 ∗ 5.225, 00e + 1, 045 ∗ 5.000e = 1, 0452 ∗ 5.000e + 1, 045 ∗ 5.000e = 10.685, 12e.
Christian Kanzow, Universität Würzburg, WS 2010/11
14
KAPITEL 1. KÖRPER UND ZAHLEN
Im dritten Jahr wird wiederum dieser Betrag verzinst sowie zusätzlich die neu eingezahlten
5.000 e. Am Ende des dritten Jahres beträgt das Guthaben somit
1, 045 ∗ 10.685, 12e + 1, 045 ∗ 5.000e
= 1, 0453 ∗ 5.000e + 1, 0452 ∗ 5.000e + 1, 045 ∗ 5.000e
= 16.390, 96e.
So fortfahrend, erhält man am Ende der Laufzeit offenbar einen Betrag von
1, 0455 ∗ 5.000e + 1, 0454 ∗ 5.000e + 1, 0453 ∗ 5.000e + 1.0452 ∗ 5.000e + 1.045 ∗ 5.000e
= 28.584, 46e
(die Endbeträge sind jeweils gerundet). Im Hinblick auf den Satz 1.11 können wir die obige
Formel auch viel schneller berechnen:
1, 0455 ∗ 5.000e + 1, 0454 ∗ 5.000e + 1, 0453 ∗ 5.000e + 1.0452 ∗ 5.000e + 1.045 ∗ 5.000e
= 1, 045 ∗ 1, 0454 + 1, 0453 + 1, 0452 + 1, 045 + 1 ∗ 5.000e
1 − 1, 0455
= 1, 045 ∗
∗ 5.000e
1 − 1, 045
= 28.584, 46e.
3
1.3
Körper
Die Menge der rationalen Zahlen Q sowie die später noch einzuführenden Mengen der reellen Zahlen R und komplexen Zahlen C haben allesamt die gemeinsame Struktureigenschaft,
dass es sich um einen Körper handelt. Aus diesem Grund führen wir in diesem Abschnitt
den Begriff des Körpers formal ein und untersuchen anschließend eine Reihe von Eigenschaften, die allen Körpern gemein ist.
Definition 1.13 Ein Körper ist eine nichtleere Menge K, auf der zwei Operationen +
(als Addition bezeichnet) und · (als Multiplikation bezeichnet) definiert sind, so dass die
folgenden Eigenschaften gelten:
(A) Axiome der Addition:
(A1) Für alle x, y ∈ K ist auch x + y ∈ K (Abgeschlossenheit der Addition).
(A2) Für alle x, y ∈ K ist x + y = y + x (Kommutativgesetz der Addition).
(A3) Für alle x, y, z ∈ K ist (x + y) + z = x + (y + z) (Assoziativgesetz der Addition).
(A4) Es gibt ein Element 0 ∈ K mit 0 + x = x für alle x ∈ K (Existenz eines
Nullelements).
Christian Kanzow, Universität Würzburg, WS 2010/11
1.3. KÖRPER
15
(A5) Zu jedem x ∈ K existiert ein Element −x ∈ K mit x + (−x) = 0 (Existenz
eines negativen Elements).
(M) Axiome der Multiplikation:
(M1) Für alle x, y ∈ K ist auch x · y ∈ K (Abgeschlossenheit der Multiplikation).
(M2) Für alle x, y ∈ K ist x · y = y · x (Kommutativgesetz der Multiplikation).
(M3) Für alle x, y, z ∈ K ist (x· y) · z = x· (y · z) (Assoziativgesetz der Multiplikation).
(M4) Es gibt ein Element 1 ∈ K mit 1 6= 0 und 1 · x = x für alle x ∈ K (Existenz
eines Einselements).
(M5) Zu jedem x ∈ K mit x 6= 0 gibt es ein Element x−1 ∈ K mit x · x−1 = 1 für alle
x ∈ K (Existenz eines inversen Elements).
(D) Distributivgesetz:
Für alle x, y, z ∈ K gilt x · (y + z) = x · y + x · z.
Die Eigenschaften (A1)–(A5) besagen, dass die Menge K bezüglich der Addition eine kommutative (oder abelsche) Gruppe bildet (ohne das Kommutativgesetz (A2) würde man
nur von einer Gruppe sprechen). Entsprechend bedeuten die Axiome (M1)–(M5), dass
K ∗ := K \ {0} auch bezüglich der Multiplikation eine kommutative Gruppe darstellt.
Statt x·y für zwei Elemente x, y eines Körpers K schreiben wir im Folgenden oft nur xy.
Ebenso werden wir für das nach (M5) existierende Element statt x−1 häufig x1 schreiben,
wie man dies beispielsweise von den rationalen Zahlen her gewöhnt ist.
Beispiel 1.14 (a) Die Mengen N und Z der natürlichen und ganzen Zahlen, jeweils
versehen mit der üblichen Addition und Multiplikation, bilden keinen Körper, da
beispielsweise die Eigenschaft (M5) verletzt ist.
(b) Die Menge der rationalen Zahlen
p
Q = x x = , p, q ∈ Z, q 6= 0 ,
q
versehen mit der Addition
p1 p2
p1 q2 + p2 q1
+
:=
q1
q2
q1 q2
und der Multiplikation
p1 p2
p1 p2
·
:=
,
q1 q2
q1 q2
bildet offenbar einen Körper, den Körper der rationalen Zahlen. Man beachte, dass
die Darstellung der Elemente aus Q nicht eindeutig ist. Beispielsweise gilt 32 = 64 .
Allgemein sind zwei rationale Zahlen gleich, also
p2
p1
= ,
q1
q2
wenn p1 q2 = p2 q1 gilt.
Christian Kanzow, Universität Würzburg, WS 2010/11
16
KAPITEL 1. KÖRPER UND ZAHLEN
(c) Die zweielementige Menge K := {0, 1} mit den Rechenvorschriften
+ 0 1
0 0 1
1 1 0
und
· 0 1
0 0 0
1 0 1
bildet einen Körper, wie man unmittelbar durch Verifikation aller Körperaxiome einsieht (das negative Element von 1 ist beispielsweise die 1).
3
Wir formulieren zunächst einige Konsequenzen aus den Axiomen der Addition.
Satz 1.15 ( Eigenschaften der Addition )
Aus den Axiomen der Addition folgen:
(a) Die Zahl 0 ist eindeutig bestimmt.
(b) Das negative Element einer Zahl x ∈ K ist eindeutig bestimmt.
(c) Es gilt −0 = 0.
(d) Die Gleichung a+x = b (mit a, b ∈ K) hat eine eindeutig bestimmte Lösung x = b−a
in K, wobei wir b − a := b + (−a) gesetzt haben.
(e) Für jedes Element x ∈ K ist −(−x) = x.
(f ) Für alle x, y ∈ K ist −(x + y) = −x − y
:= (−x) + (−y) .
Beweis: Zum Beweis der Aussagen (a)–(f) benutzen wir ausschließlich die Eigenschaften
(A1)–(A5). Insbesondere gelten die Aussagen (a)–(f) daher in jeder Menge, auf welcher
eine Addition mit den Eigenschaften (A1)–(A5) definiert ist (das heißt, die Aussagen gelten
letztlich in jeder kommutativen Gruppe).
(a) Sei 0′ ∈ K ein weiteres Element mit 0′ + x = x für alle x ∈ K . Dann gilt insbesondere
0′ + 0 = 0. Andererseits ist 0 + 0′ = 0′ nach (A4). Aus dem Kommutativgesetz (A2) folgt
daher
0 = 0′ + 0 = 0 + 0′ = 0′
und somit die behauptete Eindeutigkeit des Nullelements.
(b) Sei x ∈ K beliebig gegeben. Wegen (A5) existiert ein Element −x ∈ K mit x+(−x) = 0.
Sei x′ ∈ K ein weiteres Element mit x + x′ = 0. Addition von −x auf beiden Seiten liefert
(−x) + (x + x′ ) = (−x) + 0.
Das Assoziativgesetz (A3) und die Eigenschaft (A4) ergeben daher
(−x) + x + x′ = −x.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.3. KÖRPER
17
Mit (A2) und (A5) erhalten wir somit
x′ = 0 + x′ = (−x) + x + x′ = −x,
was zu zeigen war.
(c) Nach (A4) ist 0 + 0 = 0. Hingegen gilt 0 + (−0) = 0 nach (A5). Wegen (b) ist das
negative Element von 0 aber eindeutig bestimmt, so dass wir unmittelbar 0 = −0 erhalten.
(d) Wir zeigen zunächst, dass x = b − a := b + (−a) die Gleichung a + x = b löst. Unter
Verwendung der Axiome der Addition folgt nämlich
a+x
=
=
(A2)
=
(A3)
=
(A5)
=
(A4)
=
a + (b − a)
a + b + (−a)
a + (−a) + b
a + (−a) + b
0+b
b.
Damit ist noch die Eindeutigkeit der Lösung zu zeigen. Sei y ∈ K ein beliebiges Element
mit a + y = b. Addition von −a auf beiden Seiten ergibt
(−a) + (a + y) = (−a) + b,
also
(−a) + a + y = b + (−a)
nach (A2) und (A3). Nun ist aber
(A4)
(A5)
y = 0+y =
(−a) + a + y = b + (−a) = b − a = x
und damit auch die Eindeutigkeit bewiesen.
(e) Sei x ∈ K beliebig gegeben. Wegen (A5) existiert dann ein Element −xmit x+(−x) = 0.
Die Definition des negativen Elements liefert außerdem (−x) + − (−x) = 0. Zusammen
mit (A2) folgt
(−x) + x = 0 = (−x) + − (−x) .
Aus Teil (b) ergibt sich daher x = −(−x) wegen der Eindeutigkeit des negativen Elements.
(f) Die Definition des negativen Elements von x + y liefert
(x
+
y)
+
−
(x
+
y)
= 0.
Addition von −x auf beiden Seiten ergibt y + − (x + y) = −x wegen (A3) und (A5).
Andererseits hat die Gleichung y + z = −x nach Teil (d) die eindeutig bestimmte Lösung
z = −x − y. Daher folgt −(x + y) = −x − y.
2
Entsprechende Folgerungen lassen sich aus den Axiomen der Multiplikation herleiten.
Christian Kanzow, Universität Würzburg, WS 2010/11
18
KAPITEL 1. KÖRPER UND ZAHLEN
Satz 1.16 ( Eigenschaften der Multiplikation )
Aus den Axiomen der Multiplikation folgen:
(a) Die Zahl 1 ist eindeutig bestimmt.
(b) Das inverse Element einer Zahl x ∈ K mit x 6= 0 ist eindeutig bestimmt.
(c) Die Gleichung ax = b (mit a, b ∈ K, a 6= 0) hat eine eindeutig bestimmte Lösung
x = ab in K, wobei wir ab := a−1 b gesetzt haben.
Beweis: Die Teile (a) und (b) lassen sich in Analogie zu den entsprechenden Aussagen
des Satzes 1.15 beweisen, so dass wir hier nur die Behauptung (c) verifizieren. Seien dazu
a, b ∈ K mit a 6= 0 beliebig gegeben. Wir zeigen zunächst, dass x = a−1 b die Gleichung
ax = b löst. Dies folgt aus
(M 3)
(M 5)
(M 4)
a(a−1 b) = (aa−1 )b = 1 · b = b.
Zum Beweis der Eindeutigkeit sei y ∈ K ein beliebiges Element mit ay = b. Multiplikation
mit a−1 von links liefert a−1 (ay) = a−1 b. Nun ist aber a−1 (ay) = (a−1 a)y = 1 · y = y und
daher y = a−1 b = x.
2
Die Aussage (b) des Satzes 1.16 macht klar, warum es zum Nullelement kein inverses Element geben kann. Ansonsten beachte man, dass der Beweis des Satzes 1.16 ausschließlich
die Axiome (M1)–(M5) der Multiplikation verwendet. Daher gelten alle Aussagen des Satzes 1.16 in einer beliebigen Menge, auf welcher eine Multiplikation mit den Eigenschaften
(M1)–(M5) definiert ist.
Wir notieren als Nächstes eine Reihe von Folgerungen, die sich insbesondere durch
Anwendung des Distributivgesetzes ergeben.
Satz 1.17 ( Rechenregeln in Körpern )
Sei K ein Körper. Dann gelten die folgenden Aussagen:
(a) Für alle x, y, z ∈ K ist (x + y)z = xz + yz.
(b) Für alle x ∈ K ist x · 0 = 0.
(c) Für x, y ∈ K ist xy = 0 genau dann, wenn x = 0 oder y = 0.
(d) Für alle x, y ∈ K ist (−x)y = −(xy).
(e) Für alle x ∈ K ist (−1)x = −x.
(f ) Für alle x, y ∈ K ist (−x)(−y) = xy.
(g) Für alle x ∈ K mit x 6= 0 ist (x−1 )−1 = x.
(h) Für alle x, y ∈ K mit x 6= 0 und y 6= 0 ist (xy)−1 = x−1 y −1.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.3. KÖRPER
19
Beweis: (a) Unter Verwendung des Distributivgesetzes und des Kommutativgesetzes der
Multiplikation folgt
(x + y)z = z(x + y) = zx + zy = xz + yz
für alle x, y, z ∈ K.
(b) Wegen 0 = 0 + 0 nach (A4) folgt aus dem Distributivgesetz
x · 0 + x · 0 = x · (0 + 0) = x · 0.
Andererseits ist x · 0 + 0 = x · 0 wiederum nach (A4). Wegen Teil (d) des Satzes 1.15
erhalten wir hieraus x · 0 = 0.
(c) Zum Beweis der behaupteten Äquivalenz müssen wir zwei Richtungen zeigen, nämlich
einmal, dass aus xy = 0 tatsächlich x = 0 oder y = 0 folgt, und einmal, dass umgekehrt
aus x = 0 oder y = 0 bereits xy = 0 folgt.
Sei zunächst xy = 0. Gilt dann x = 0, so sind wir fertig. Sei daher x 6= 0 vorausgesetzt.
Wegen Teil (c) des Satzes 1.16 ist die eindeutig bestimmte Lösung der Gleichung xy = 0
dann gegeben durch y = x−1 · 0. Mit Teil (b) folgt somit y = 0. Also ist wenigstens eine
der beiden Zahlen x oder y gleich 0.
Gilt umgekehrt x = 0 oder y = 0, so folgt die Behauptung xy = 0 unmittelbar aus der
Aussage (b) (evtl. unter Berücksichtigung des Kommutativgesetzes der Multiplikation).
(d) Seien x, y ∈ K beliebig gegeben. Dann ist einerseits
(A5)
0·y =
also
(b)
(a)
x + (−x) y = xy + (−x)y,
(M 2)
0 = y · 0 = 0 · y = xy + (−x)y.
Andererseits ist xy + − (xy) = 0. Aus der Eindeutigkeit des negativen Elements gemäß
Satz 1.15 (b) folgt daher (−x)y = −(xy).
(e) Setzt man y = 1 in Teil (d) und berücksichtigt die Eigenschaft (M4), so folgt (−1)x =
−(1 · x) = −x.
(f) Seien x, y ∈ K beliebig. Nach Teil (d) gilt
(−x)(−y) = − x(−y) .
Andererseits folgt aus Teil (d) auch
x(−y) = −(xy).
Zusammen ergibt dies
(−x)(−y) = − − (xy) .
Die Behauptung folgt daher aus dem Teil (e) des Satzes 1.15.
Christian Kanzow, Universität Würzburg, WS 2010/11
20
KAPITEL 1. KÖRPER UND ZAHLEN
(g), (h) Der Nachweis der Aussagen (g) und (h) kann analog zu den Teilen (e) und (f) des
Satzes 1.15 erfolgen.
2
Die Addition von mehr als zwei Elementen eines Körpers K wird durch Klammerung auf
die Addition von jeweils zwei Summanden zurückgeführt:
x1 + x2 + . . . + xn := . . . (x1 + x2 ) + x3 + . . . + xn
für beliebige x1 , x2 , . . . , xn ∈ K. Man beweist jedoch durch wiederholte Anwendung des Assoziativgesetzes der Addition, dass jede andere Klammerung zum selben Resultat führt (allgemeines Assoziativgesetz der Addition). Entsprechendes gilt für das Produkt x1 ·x2 ·. . .·xn
für beliebige Elemente x1 , x2 , . . . , xn ∈ K (allgemeines Assoziativgesetz der Multiplikation).
Sei nun (i1 , . . . , in ) eine Permutation (d.h. Umordnung) der Zahlen (1, . . . , n). Durch
wiederholte Anwendung der Kommutativgesetze für die Addition und die Multiplikation
folgert man sofort die Gültigkeit der beiden Identitäten
x1 + x2 + . . . + xn = xi1 + xi2 + . . . + xin
und
x1 · x2 · . . . · xn = xi1 · xi2 · . . . · xin ,
die als allgemeines Kommutativgesetz der Addition und allgemeines Kommutativgesetz der
Multiplikation bezeichnet werden. Aus dem allgemeinen Kommutativgesetz der Addition
folgt beispielsweise wiederum
n X
m
X
aij =
i=1 j=1
m X
n
X
aij
j=1 i=1
für beliebige Elemente aij ∈ K, denn auf beiden Seiten stehen offenbar dieselben (insgesamt
nm) Summanden, die lediglich in anderer Reihenfolge auftreten. Ebenso zeigt man auch
die Gültigkeit des allgemeinen Distributivgesetzes
! m !
m
n X
n
X
X
X
xi yj
xi
yj =
i=1
j=1
i=1 j=1
für beliebige xi , yj ∈ K.
In einem beliebigen Körper K definieren wir noch die Vielfachen
n · x := 0 für x ∈ K, n = 0,
n · x := x
| +x+
{z. . . + x} für x ∈ K, n ∈ N,
n-mal
−n · x := −x
− . . . − x}
| − x {z
n-mal
für x ∈ K, n ∈ N
Christian Kanzow, Universität Würzburg, WS 2010/11
1.3. KÖRPER
21
sowie die Potenzen
x0 := 1 für x ∈ K, insbesondere also 00 := 1,
xn := x
· . . . · x} für x ∈ K, n ∈ N,
| · x {z
−n
x
n-mal
−1 n
:= (x )
für x ∈ K, x 6= 0, n ∈ N.
Einige Rechenregeln für Potenzen sind in dem nachstehenden Resultat zusammengefasst.
Entsprechende Ergebnisse gelten auch für die Vielfachen von Elementen eines Körpers.
Satz 1.18 ( Potenz–Rechenregeln in Körpern )
Sei K ein Körper. Dann gelten:
(a) xn xm = xn+m für alle x ∈ K und alle n, m ∈ Z (evtl. x 6= 0).
(b) (xn )m = xnm für alle x ∈ K und alle n, m ∈ Z (evtl. x 6= 0).
(c) xn y n = (xy)n für alle x, y ∈ K und alle n ∈ Z (evtl. x 6= 0, y 6= 0).
Die Zusätze x 6= 0 oder y 6= 0 sind hierbei nur dann relevant, wenn x oder y mit einer
negativen Potenz auftritt.
Beweis: Wir beweisen hier nur die Aussage (c). Die Teile (a) und (b) können aber auf
analoge Weise verifiziert werden.
Sei zunächst n ≥ 0. Wir zeigen Teil (c) durch vollständige Induktion nach n. Für n = 0
ist die Behauptung offenbar richtig. Für ein beliebiges n ≥ 0 gelte daher xn y n = (xy)n .
Dann folgt
xn+1 y n+1 = xn xy n y = xn y n xy = (xy)n (xy) = (xy)n+1 ,
so dass die Aussage (c) für alle n ∈ N0 bewiesen ist.
Sei nun n < 0 und m := −n > 0 (sowie x 6= 0, y 6= 0). Dann ist
xn y n = x−m y −m = (x−1 )m (y −1 )m .
Wegen m > 0 ergibt sich aus dem gerade betrachteten Fall aber
(x−1 )m (y −1 )m = (x−1 y −1)m
und daher unter Verwendung von Teil (h) des Satzes 1.17 sofort
xn y n = (x−1 y −1 )m = (xy)−1
womit Teil (c) auch schon bewiesen ist.
m
= (xy)−m ,
Christian Kanzow, Universität Würzburg, WS 2010/11
2
22
1.4
KAPITEL 1. KÖRPER UND ZAHLEN
Geordnete Körper
Wir beginnen diesen Abschnitt gleich mit der zentralen Definition.
Definition 1.19 Ein Körper K heißt geordnet (oder angeordnet), wenn eine Beziehung
> 0 (sprich: größer Null) definiert ist mit den folgenden Eigenschaften:
(O1) für jedes x ∈ K gilt genau eine der Beziehungen x = 0 oder x > 0 oder −x > 0.
(O2) Für alle x, y ∈ K mit x > 0 und y > 0 gilt x + y > 0.
(O3) Für alle x, y ∈ K mit x > 0 und y > 0 gilt xy > 0.
In einem geordneten Körper K bezeichnen wir die Elemente x ∈ K mit x > 0 als positiv
und die Elemente x ∈ K mit −x > 0 als negativ .
Zur bequemeren Schreibweise führen wir noch die folgenden Notationen ein.
Definition 1.20 Seien K ein geordneter Körper und x, y ∈ K. Dann schreiben wir
(a) x > y (sprich: x größer y), wenn x − y > 0 gilt.
(b) x ≥ y (sprich: x größer oder gleich y), wenn x > y oder x = y gilt.
(c) x < y (sprich: x kleiner y), wenn y > x gilt.
(d) x ≤ y (sprich: x kleiner oder gleich y), wenn y ≥ x gilt.
Als unmittelbare Konsequenz der Ordnungsaxiome (O1)–(O3) und der gerade eingeführten
Schreibweisen erhalten wir das nachstehende Resultat.
Satz 1.21 ( Rechenregeln in geordneten Körpern )
Seien K ein geordneter Körper und x, y, z ∈ K gegeben. Dann gelten:
(a) Es ist genau eine der Beziehungen x = y oder x < y oder x > y erfüllt.
(b) Aus x < y und y < z folgt auch x < z.
(c) Aus x < y folgt auch x + z < y + z.
(d) Aus x < y und z > 0 folgt auch xz < yz.
(e) Aus x < y und z < 0 folgt xz > yz.
(f ) Für jedes x ∈ K mit x 6= 0 ist x2 > 0.
(g) Ist x > 0 (bzw. x < 0), so ist auch x−1 > 0 (bzw. x−1 < 0).
(h) Aus 0 < x < y folgt x−1 > y −1 .
(i) Es gilt 1 > 0.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.4. GEORDNETE KÖRPER
23
Beweis: (a) Für das Element y − x ∈ K gilt nach (O1) genau eine der Beziehungen
y − x = 0 oder y − x > 0 oder y − x < 0.
Die Behauptung folgt daher aus der Definition 1.20.
(b) Aus x < y und y < z folgt y − x > 0 und z − y > 0 gemäß Definition 1.20. Mit (O2)
ergibt sich hieraus
z − x = (z − y) + (y − x) > 0,
also gerade x < z.
(c) Aus x < y folgt (y + z) − (x + z) = y − x > 0. Dies impliziert x + z < y + z und damit
die Aussage (c).
(d) Aus x < y folgt y − x > 0. Wegen z > 0 ergibt sich aus (O3) und dem Distributivgesetz
daher
yz − xz = (y − x)z > 0.
Folglich ist xz < yz.
(e) Nach Voraussetzung ist y − x > 0 und −z > 0. Aus (O3) folgt daher
zx − zy = −zy − (−z)x = (−z)(y − x) > 0.
Hieraus ergibt sich gerade die Behauptung xz > yz.
(f) Sei x ∈ K mit x 6= 0 gegeben. Wegen (O1) gilt dann x > 0 oder −x > 0. Ist x > 0, so
folgt x2 = x · x > 0 direkt aus (O2). Im Fall −x > 0 hingegen folgt aus Satz 1.17 (f) und
(O2) ebenfalls x2 = x · x = (−x) · (−x) > 0.
(g) Gemäß Definition der Potenzen ist x−1 = x(x−1 )2 . Dabei ist für x 6= 0 stets (x−1 )2 > 0
wegen Teil (f). Deshalb folgt die Behauptung durch Multiplikation der Ungleichung x > 0
(bzw. x < 0) mit (x−1 )2 > 0 aus der schon bewiesenen Aussage (d).
(h) Da x und y beide positiv sind, folgt xy > 0 aus (O3) und daher wegen (g) und
den Rechenregeln für Potenzen unmittelbar x−1 y −1 = (xy)−1 > 0. Multipliziert man die
Ungleichung x < y daher mit x−1 y −1 , so folgt
y −1 = x(x−1 y −1 ) < y(x−1 y −1) = x−1
wegen Teil (d).
(i) Dies folgt wegen 1 = 12 sofort aus dem Teil (f), denn gemäß Definition eines Körpers
ist das Einselement 1 von dem Nullelement 0 verschieden.
2
Wir kennen bislang zwar noch nicht viele Körper, wollen im folgenden Beispiel (das teilweise
etwas vorausgreift) aber kurz darauf eingehen, welche Körper geordnet sind.
Christian Kanzow, Universität Würzburg, WS 2010/11
24
KAPITEL 1. KÖRPER UND ZAHLEN
Beispiel 1.22 (a) Der aus dem Beispiel 1.14 (c) bekannte Körper mit den beiden Elementen 0 (als Nullelement) und 1 (als Einselement) ist nicht geordnet. Wäre er
nämlich geordnet, so würde wegen Satz 1.21 (i) zwangsläufig 1 > 0 gelten. Wegen
Satz 1.21 (c) und der Definition der Addition in dem gegebenen Körper wäre dann
auch 0 = 1 + 1 > 0 + 1 = 1 im Widerspruch zu 1 > 0 und Satz 1.21 (a).
(b) Der Körper Q der rationalen Zahlen ist geordnet, wenn man die > 0 Beziehung durch
x>0
:⇐⇒
pq > 0
(1.4)
definiert, wobei x = pq eine gegebene rationale Zahl bezeichnet. Man verifiziert sehr
leicht, dass die drei Ordnungsaxiome (O1)–(O3) erfüllt sind. Wir wollen dies exemplarisch für (O2) einmal nachrechnen. Seien also x > 0 und y > 0 gegeben, etwa
x=
p1
p2
, y=
q1
q2
mit p1 q1 > 0 und p2 q2 > 0.
Per Definition der Addition in Q ist dann
x+y =
p1 q2 + p2 q1
.
q1 q2
Dabei gilt
(p1 q2 + p2 q1 )(q1 q2 ) = (p1 q1 )q22 + (p2 q2 )q12 > 0
wegen p1 q1 > 0, p2 q2 > 0 nach Voraussetzung und q12 > 0, q22 > 0 nach Satz 1.21 (f).
Im Hinblick auf (1.4) ist daher x + y > 0 und damit (O2) gültig.
(c) Der eigentlich bekannte und später noch formal einzuführende Körper R der reellen
Zahlen ist angeordnet. Anschaulich ist dies klar, wenn man R mit der üblichen Zahlengeraden identifiziert. Später wird R per Definition als ein angeordneter Körper
eingeführt.
(d) Der vielleicht noch nicht bekannte Körper C der komplexen Zahlen (siehe Abschnitt
1.6) ist nicht geordnet, denn es gilt dort i2 = −1 für die imaginäre Einheit i, was
jedoch der Eigenschaft (f) aus dem Satz 1.21 widerspricht.
3
In einem geordneten Körper kann man den Begriff des (absoluten) Betrags einführen.
Definition 1.23 Sei K ein geordneter Körper. Dann heißt
x,
falls x ≥ 0,
|x| :=
−x, falls x < 0
der absolute Betrag des Elements x ∈ K.
Für den Betrag eines Elements gelten eine Reihe von Eigenschaften, die wir in dem nächsten
Resultat zusammenfassen.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.4. GEORDNETE KÖRPER
25
Satz 1.24 ( Rechenregeln des absoluten Betrags )
Sei K ein geordneter Körper. Dann gelten:
(a) Es ist |x| ≥ 0 für alle x ∈ K.
(b) Es ist |x| = 0 genau dann, wenn x = 0 gilt.
(c) Es ist |x| = | − x| für alle x ∈ K.
(d) Es ist x ≤ |x| und −x ≤ |x| für alle x ∈ K.
(e) Es ist |x · y| = |x| · |y| für alle x, y ∈ K.
(f ) Es ist |x + y| ≤ |x| + |y| für alle x, y ∈ K (Dreiecksungleichung).
(g) Es ist |x + y| ≥ |x| − |y| für alle x, y ∈ K (inverse Dreiecksungleichung).
Beweis: Die Aussagen (a) und (b) folgen sofort aus der Definition des Betrages. Zum
Nachweis von (c) unterscheiden wir die beiden Fälle x ≥ 0 und x < 0. Für x ≥ 0 ist
|x| = x und | − x| = −(−x), also |x| = x = | − x|. Analog gilt für x < 0 gemäß Definition
des Betrags einerseits |x| = −x und andererseits | − x| = −x, also ebenfalls |x| = | − x|.
Die Behauptung (d) kann ebenso bewiesen werden, indem man die Fälle x ≥ 0 und x < 0
betrachtet. Durch Abarbeitung der vier Fälle
x ≥ 0, y ≥ 0 oder x ≥ 0, y < 0 oder x < 0, y ≥ 0 oder x < 0, y < 0
verifiziert man auch die Gleichheit in der Aussage (e).
Zum Nachweis der Dreiecksungleichung: Gilt x + y ≥ 0, so folgt aus der Definition des
Betrags sowie dem schon bewiesenen Teil (d) sofort
|x + y| = x + y ≤ |x| + |y|.
Für x + y < 0 erhalten wir durch eine analoge Argumentation
|x + y| = −x − y ≤ |x| + |y|,
womit die Aussage (f) bewiesen ist.
Hieraus wiederum folgert man Teil (g), indem man die Dreiecksungleichung auf die
Elemente u := x + y und v := −y anwendet, wonach |u + v| ≤ |u| + |v| gilt, was sich per
Definition von u und v schreiben lässt als
|x| = |x + y − y| = |u + v| ≤ |u| + |v| = |x + y| + | − y| = |x + y| + |y|,
woraus man |x| − |y| ≤ |x + y| erhält. Durch Vertauschung von x und y folgt hieraus
− |x| − |y| ≤ |x + y|.
Insgesamt ergibt sich daher die Behauptung (g).
Christian Kanzow, Universität Würzburg, WS 2010/11
2
26
KAPITEL 1. KÖRPER UND ZAHLEN
Induktiv folgt aus dem Satz 1.24 (f) auch die Gültigkeit der verallgemeinerten Dreiecksungleichung
|x1 + . . . + xn | ≤ |x1 | + . . . + |xn |
für je endlich viele Elemente x1 , . . . , xn eines geordneten Körpers K. Wir werden diese
verallgemeinerte Dreiecksungleichung später noch häufig verwenden.
Sind x, y Elemente eines beliebigen geordneten Körpers K mit 0 < x < y, so stellt sich
oft die Frage, ob es eine Zahl n ∈ N gibt mit nx ≥ y. Entgegen der Anschauung folgt dies
nicht aus den Axiomen eines geordneten Körpers. Wir führen daher die folgende Definition
ein.
Definition 1.25 Ein geordneter Körper K heißt archimedisch, wenn zu je zwei Elementen
x, y ∈ K mit x > 0 stets ein (im Allgemeinen von x und y abhängiges) n ∈ N existiert mit
nx ≥ y.
Aus der Definition eines archimedisch geordneten Körpers erhalten wir sofort die nachstehenden Eigenschaften.
Lemma 1.26 ( Eigenschaften eines archimedisch geordneten Körpers )
Sei K ein archimedisch geordneter Körper. Dann gelten:
(a) Zu jedem y ∈ K existiert ein n ∈ N mit n ≥ y.
(b) Zu jedem ε ∈ K mit ε > 0 existiert ein n ∈ N mit
1
n
≤ ε.
Beweis: (a) Wähle x = 1 in der Definition eines archimedisch geordneten Körpers.
(b) Setze y :=
1
ε
> 0. Anwendung von Teil (a) liefert dann die Existenz eines n ∈ N mit
n ≥ y ⇐⇒ n ≥
1
1
⇐⇒ ε ≥ ,
ε
n
was zu zeigen war.
2
Wir zeigen in unserem nächsten Resultat, dass der Körper der rationalen Zahlen archimedisch geordnet ist.
Satz 1.27 Der Körper Q der rationalen Zahlen ist archimedisch geordnet.
Beweis: Seien x, y ∈ Q mit x > 0 beliebig gegeben. Ohne Einschränkung können wir
0 < x < y voraussetzen, denn sonst würde n := 1 bereits das Gewünschte leisten. Dann
existieren natürliche Zahlen p1 , q1 , p2 , q2 ∈ N mit
x=
p1
q1
und y =
p2
.
q2
Christian Kanzow, Universität Würzburg, WS 2010/11
1.5. REELLE ZAHLEN
27
Mit p := p1 q2 , q := q1 p2 und r := q1 q2 gilt ferner
x=
p
r
q
und y = .
r
Nun gilt p ≥ 1 und r ≥ 1, da es sich bei p und r jeweils um ein Produkt von zwei natürlichen
Zahlen handelt. Aus p ≥ 1 folgt zunächst pq ≥ q. Ebenso erhalten wir aus r ≥ 1 auch
qr ≥ q bzw. q ≥ qr . Wählen wir nun n := r · q ∈ N, so folgt
n·x=r·q·
p
q
= p · q ≥ q ≥ = y,
r
r
was zu zeigen war.
1.5
2
Reelle Zahlen
Wir geben in diesem Abschnitt eine axiomatische Einführung der reellen Zahlen. Dazu
beginnen wir als Motivation mit einem Resultat, wonach der Körper Q der rationalen
Zahlen unvollständig“ ist in dem Sinne, dass die Zahl 2 sich nicht als Quadrat einer
”
rationalen Zahl darstellen lässt. Anders ausgedrückt: Die Quadratwurzel aus 2 (die aus der
Schule sicherlich bekannt ist) ist keine rationale Zahl.
Lemma 1.28 Es gibt keine Zahl x ∈ Q mit x2 = 2.
Beweis: Der Beweis ist ein typisches Beispiel für einen Widerspruchsbeweis, bei dem es
sich um eine sehr beliebte Beweistechnik handelt: Man nimmt an, die Aussage gilt nicht,
und führt diese Annahme dann zu einem Widerspruch, so dass die Aussage doch gelten
muss.
Wir nehmen also an, dass es eine rationale Zahl x ∈ Q gibt mit x2 = 2. Dann können
wir x = pq mit gewissen Zahlen p, q ∈ Z, q 6= 0, schreiben. Nun ist die Darstellung einer
rationalen Zahl zwar nicht eindeutig, durch geeignetes Kürzen können wir allerdings stets
erreichen, dass p und q teilerfremd sind, also keinen gemeinsamen (von Eins verschiedenen)
Teiler haben. Aus x2 = 2 folgt nun
p2 = 2q 2 .
(1.5)
Also ist p2 durch 2 teilbar und somit eine gerade Zahl. Dann ist aber p selbst eine gerade
Zahl (denn wäre p ungerade, so wäre p2 offenbar auch ungerade). Also ist p2 durch 4 teilbar. Dann ist auch die rechte Seite in (1.5) durch 4 teilbar, also q 2 gerade. Somit ist auch
q gerade. Also sind sowohl p als auch q durch 2 teilbar im Widerspruch dazu, dass beide
Zahlen als teilerfremd vorausgesetzt waren. Daher existiert keine rationale Zahl x ∈ Q mit
x2 = 2.
2
Der Körper Q hat noch weitere Defizite, wie wir noch sehen werden. Dazu führen wir
zunächst den folgenden Begriff ein.
Christian Kanzow, Universität Würzburg, WS 2010/11
28
KAPITEL 1. KÖRPER UND ZAHLEN
Definition 1.29 Sei K ein geordneter Körper und M ⊆ K eine gegebene Teilmenge. Ein
Element s ∈ K heißt Supremum von M, wenn s die kleinste obere Schranke für M ist,
d.h., wenn die beiden folgenden Eigenschaften gelten:
(a) Es ist x ≤ s für alle x ∈ M.
(b) Es gibt kein s′ ∈ K mit s′ < s und x ≤ s′ für alle x ∈ M.
Das Element s wird als sup M bezeichnet. Entsprechend definiert man das Infimum von M
als größte untere Schranke von M und bezeichnet diese mit inf M.
Sofern existent, ist das Supremum einer Menge wegen der Eigenschaft (b) offenbar eindeutig
bestimmt. Gleiches gilt für das Infimum. Wir bringen zunächst einige Beispiele.
Beispiel 1.30 (a) Wir betrachten den angeordneten Körper K = Q der rationalen Zahlen sowie die Teilmenge M := {x ∈ Q | x2 < 2}. Dann besitzt M offenbar kein
Supremum, denn dazu müsste offenbar ein x ∈ Q mit x2 = 2 existieren, was nach
Lemma 1.28 nicht sein kann. Jedes x ∈ Q mit x2 > 2 hingegen kommt nicht als
Supremum in Frage, da zwar die Eigenschaft (a) aus Definition 1.29 erfüllt ist, nicht
jedoch die Eigenschaft (b), denn zu x mit x2 > 2 existiert stets ein y < x mit y 2 > 2
(vergleiche Satz 1.34).
(b) Existiert das Supremum s = sup M einer Teilmenge M eines geordneten Körpers
K, so kann s zu M gehören oder auch nicht. Als Beispiel betrachten wir wieder den
Körper K = Q sowie die beiden Teilmengen
M1 := {x ∈ Q | x < 0} und M2 := {x ∈ Q | x ≤ 0}.
Dann gilt
sup M1 = 0 und
sup M2 = 0,
und im ersten Fall gehört das Supremum nicht zu M1 , während es im zweiten Fall
ein Element von M2 ist.
(c) Seien K = Q und
1
1 1 1
M :=
n ∈ N = 1, , , , . . . .
n
2 3 4
Dann ist sup M = 1 und inf M = 0, wobei sup M zu M gehört und inf M kein
Element von M ist.
3
Sei K ein geordneter Körper und M ⊆ K eine nach oben beschränkte Teilmenge, d.h., es
existiert ein β ∈ K mit x ≤ β für alle x ∈ M. Für solche Mengen soll stets ein Supremum
in K existieren. Wir führen dafür den nachstehenden Begriff ein.
Definition 1.31 Ein geordneter Körper K heißt vollständig, wenn jede nichtleere und
nach oben beschränkte Teilmenge M ⊆ K ein Supremum in K besitzt.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.5. REELLE ZAHLEN
29
Das Beispiel 1.30 (a) zeigt, dass der Körper Q nicht vollständig ist. Durch Erweiterung
von Q erhält man jedoch einen vollständigen Körper, denn es gilt der folgende Satz, auf
dessen länglichen Beweis wir an dieser Stelle verzichten. Der interessierte Leser sei hierzu
beispielsweise auf [11, Theorem 1.19] verwiesen.
Satz 1.32 ( Existenz und Eindeutigkeit der reellen Zahlen )
Es gibt (im Wesentlichen genau) einen geordneten Körper, der vollständig ist. Wir bezeichnen diesen mit R und nennen ihn den Körper der reellen Zahlen. Dieser umfasst
insbesondere den Körper Q.
Wir können an dieser Stelle auch vielen Lehrbüchern der Analysis folgen und den axiomatischen Standpunkt vertreten, bei dem man den Satz 1.32 als Definition der reellen Zahlen
auffasst: R ist ein vollständiger geordneter Körper. Die bislang bewiesenen Eigenschaften
eines vollständig geordneten Körpers (also von R) besagen letztlich, dass man in der Menge
der reellen Zahlen so rechnen darf, wie man es vorher schon (etwa aus der Schule) gewohnt
war.
Wir zeigen als Nächstes, dass der Körper R der reellen Zahlen automatisch archimedisch
geordnet ist.
Satz 1.33 Der Körper R ist archimedisch geordnet.
Beweis: Seien x, y ∈ R mit 0 < x < y beliebig gegeben. Definiere die Menge
M := n · x n ∈ N ⊆ R.
Wenn es kein n ∈ N mit n · x ≥ y gibt, so ist y eine obere Schranke von M, die Menge
M also nach oben beschränkt. Da R per Definition vollständig ist, existiert das Supremum
s := sup M in R. Wegen x > 0 ist s − x < s und daher s − x keine obere Schranke für die Menge M. Also existiert ein m ∈ N mit s − x < mx. Dies impliziert jedoch
s < (m + 1)x ∈ M im Widerspruch dazu, dass s eine obere Schranke von M ist.
2
Wir zeigen in dem nachfolgenden Resultat, dass zwischen zwei Elementen aus R stets eine
rationale Zahl liegt.
Satz 1.34 Die Menge der rationalen Zahlen Q liegt dicht in R in dem Sinne, dass zu je
zwei Zahlen x, y ∈ R mit x < y stets ein r ∈ Q mit x < r < y existiert.
Beweis: Wegen x < y ist y − x > 0. Wegen Satz 1.33 ist R archimedisch geordnet.
Aufgrund des Lemmas 1.26 existiert daher ein n ∈ N mit
n(y − x) > 1.
Sei ferner m die kleinste Zahl aus Z mit m > nx, so dass insbesondere nx ≥ m − 1 gilt.
Dann folgt
m−1 1
1
+ < x + (y − x) = y.
x< m=
n
n
n
Christian Kanzow, Universität Würzburg, WS 2010/11
30
Also hat r :=
KAPITEL 1. KÖRPER UND ZAHLEN
m
n
∈ Q die gewünschte Eigenschaft.
2
Als Ergänzung zum Satz 1.34 sei erwähnt, dass zwischen zwei reellen Zahlen x, y ∈ R mit
x < y auch stets eine irrationale Zahl liegt, also ein s ∈ R \ Q existiert mit x < s < y. Dies
wird etwa im Beispiel 2.25 (b) gezeigt.
Wir zeigen in dem folgenden Resultat, dass das im Lemma 1.28 aufgetretene Problem
im Körper der reellen Zahlen nicht mehr existiert.
Satz 1.35 ( Definition von Wurzeln )
Für jedes x ∈ R mit x > 0 und jedes√n ∈ N gibt es genau eine positive reelle Zahl y ∈ R mit
y n = x. Wir schreiben hierfür y = n x oder y = x1/n und nennen y die n-te Wurzel von x.
Speziell für n = 2 und n = 3 sprechen wir auch von
und Kubikwurzel
√ der Quadratwurzel
√
von x, wobei wir für die Quadratwurzel meistens x statt 2 x schreiben.
Beweis: Die Eindeutigkeit ist klar, da aus 0 < y1 < y2 auch 0 < y1n < y2n folgt. Zum
Nachweis der Existenz definieren wir die Menge
M := t ∈ R t > 0 und tn < x .
Die Menge M ist nichtleer, denn speziell für
t :=
x
1+x
ist 0 < t < 1 und daher tn < t < x. Ferner ist M nach oben beschränkt und besitzt zum
Beispiel die Zahl 1 + x als obere Schranke. Ist nämlich t ∈ M und wäre t ≥ 1 + x, so wäre
t ≥ 1 und t ≥ x und daher tn ≥ t ≥ x im Widerspruch zu t ∈ M.
Da R vollständig ist, existiert somit das Supremum
y := sup M
in R. Wir wollen jetzt zeigen, dass y n = x gilt. Zu diesem Zweck führen wir jede der beiden
Ungleichungen y n < x und y n > x zu einem Widerspruch, so dass die Behauptung y n = x
aus den Anordnungsaxiomen bzw. dem Satz 1.21 (a) folgt.
Dazu benötigen wir die für alle 0 < a < b gültige Ungleichung
bn − an < (b − a)nbn−1 ,
(1.6)
die sich unmittelbar aus der Identität bn − an = (b − a)(bn−1 + bn−2 a + . . . + an−1 ) ergibt.
Wir nehmen zunächst an, dass y n < x gilt. Wähle dann ein h mit 0 < h < 1 und
h<
x − yn
.
n(y + 1)n−1
Speziell für a := y und b := y + h folgt dann aus (1.6)
(y + h)n − y n < hn(y + h)n−1 < hn(y + 1)n−1 < x − y n .
Christian Kanzow, Universität Würzburg, WS 2010/11
1.5. REELLE ZAHLEN
31
Daher ist (y + h)n < x und somit y + h ∈ M. Wegen h > 0 widerspricht dies jedoch der
Definition von y = sup M.
Wir nehmen jetzt an, dass y n > x gilt. Setze dann
yn − x
z :=
.
ny n−1
Hieraus folgt 0 < z < y. Ist t ≥ y − z, so ergibt sich mit (1.6)
y n − tn ≤ y n − (y − z)n < zny n−1 = y n − x
und daher tn > x, also t 6∈ M. Folglich ist y − z eine obere Schranke von M (Kontraposition). Wegen y − z < y steht dies jedoch erneut im Widerspruch zur Definition von y als
kleinste obere Schranke von M.
2
Die übliche Schreibweise für reelle Zahlen besteht in der Form einer (im Allgemeinen) nicht
abbrechenden Dezimalzahl. Beispielsweise gilt
√
2 = 1.4142 . . . .
Wir werden diese Dezimaldarstellung zwar kaum verwenden, aber doch auf den Zusammenhang mit den reellen Zahlen R kurz eingehen. Sei dazu x ∈ R beliebig gegeben und ohne
Einschränkung x > 0. Wähle dann die größte Zahl n0 ∈ N0 mit n0 ≤ x (diese existiert,
da R archimedisch geordnet ist). Induktiv fahren wir fort, indem wir zu bereits bekannten
Werten n0 , n1 , . . . , nk−1 ein nk ∈ N0 als größte Zahl bestimmen, so dass noch
n2
nk
n1
+ 2 + ...+ k ≤ x
n0 +
10 10
10
gilt. Mit M bezeichnen wir dann die Menge aller solcher Zahlen für k = 0, 1, 2, . . .. Setzen
wir x := sup M, so lautet die Dezimaldarstellung von x offenbar
x = n0 .n1 n2 n3 . . . .
(1.7)
Umgekehrt kann man zu einer solchen (unendlichen) Dezimaldarstellung die zugehörige
Menge M definieren, die offenbar nach oben beschränkt ist, so dass x := sup M existiert und
diese Zahl gerade die Dezimaldarstellung (1.7) besitzt. Auf ähnliche Weise wie eine solche
Dezimaldarstellung (mit der Basis 10) lässt sich beispielsweise auch die Binärdarstellung
(mit der Basis 2) einer gegebenen Zahl bestimmen.
Manchmal ist es sinnvoll, den Körper R um die beiden Symbole +∞ und −∞ zu
erweitern. Um die Ordnung in R zu erhalten, definieren wir
−∞ < x < +∞ für alle x ∈ R.
Die so erweiterte Menge bildet keinen Körper mehr, für viele Rechnungen sind jedoch die
nachstehenden Konventionen nützlich:
x + ∞ := +∞ und x − ∞ := −∞ ∀x ∈ R,
x
x
:= 0 und −∞
:= 0 ∀x ∈ R,
+∞
x · (+∞) := +∞ und x · (−∞) := −∞ ∀x ∈ R, x > 0,
x · (+∞) := −∞ und x · (−∞) := +∞ ∀x ∈ R, x < 0.
Christian Kanzow, Universität Würzburg, WS 2010/11
32
KAPITEL 1. KÖRPER UND ZAHLEN
Man beachte hierbei, dass ein Ausdruck der Gestalt 0 · (+∞) oder 0 · (−∞) nicht definiert
ist! Gleiches gilt für Ausdrücke der Form (+∞) + (−∞) und (−∞) + (+∞).
Die reellen Zahlen werden meist durch die reelle Achse veranschaulicht. Gewissen Teilmengen dieser reellen Achse, also der reellen Zahlen, kommt eine besondere Bedeutung zu,
nämlich den (eigentlichen) Intervallen:
[a, b]
(a, b)
(a, b]
[a, b)
:=
:=
:=
:=
{x ∈ R | a ≤ x ≤ b},
{x ∈ R | a < x < b},
{x ∈ R | a < x ≤ b},
{x ∈ R | a ≤ x < b}.
Hierbei wird stets davon ausgegangen, dass a, b ∈ R mit a < b gegeben sind. Lässt man
auch an mindestens einem Ende dieser Intervalle eine unendliche Grenze zu, so erhält man
die uneigentlichen Intervalle
(−∞, b)
(−∞, b]
[a, +∞)
(a, +∞)
:=
:=
:=
:=
{x ∈ R | x < b},
{x ∈ R | x ≤ b},
{x ∈ R | x ≥ a},
{x ∈ R | x > a}.
In keinem dieser Fälle gehört −∞ oder +∞ zu einem der uneigentlichen Intervalle. Prinzipiell könnte man auch noch das uneigentliche Intervall (−∞, +∞) definieren, das ist aber
nichts anderes als R selbst.
1.6
Komplexe Zahlen
Wir geben in diesem Abschnitt eine Einführung in die Menge der komplexen Zahlen, aus
der durch Einführung einer geeigneten Addition und einer geeigneten Multiplikation ein
Körper wird.
Definition 1.36 Eine komplexe Zahl ist ein geordnetes Paar der Gestalt z = (x, y) mit
x, y ∈ R. Dabei sprechen wir von einem geordneten Paar, weil (x, y) und (y, x) für x 6= y als
verschieden betrachtet werden. Die Menge aller komplexen Zahlen wird mit C bezeichnet.
Sind z, w ∈ C zwei komplexe Zahlen, etwa z = (x, y) und w = (u, v) mit x, y, u, v ∈ R, so
definieren wir eine Addition durch
z + w = (x, y) + (u, v) := (x + u, y + v)
(1.8)
und eine Multiplikation durch
z · w = (x, y) · (u, v) := (xu − yv, xv + yu).
Christian Kanzow, Universität Würzburg, WS 2010/11
(1.9)
1.6. KOMPLEXE ZAHLEN
33
z+w
w
z
0
Abbildung 1.3: Veranschaulichung der Addition zweier komplexer Zahlen
Die Addition zweier komplexer Zahlen wird in der Abbildung 1.3 veranschaulicht. Eine
entsprechende geometrische Deutung der Multiplikation von zwei komplexen Zahlen folgt
erst später, wenn wir im Abschnitt 5.5 die Darstellung einer komplexen Zahl in Form ihrer
Polarkoordinaten einführen.
Mit Hilfe dieser Vorschriften wird C zu einem Körper.
Satz 1.37 ( C ist ein Körper )
Die Menge C der komplexen Zahlen wird mit der Addition (1.8) und der Multiplikation
(1.9) zu einem Körper mit dem Nullelement (0, 0) sowie dem Einselement (1, 0).
Beweis: Die Behauptung folgt unmittelbar durch Verifikation der Körperaxiome (A1)–
(A5), (M1)–(M5) und (D) aus der Definition 1.13. Wir überlassen dies weitgehend dem
Leser und begnügen uns stattdessen mit einigen Erläuterungen. In (A5) wähle man bei
gegebenem z = (x, y) ∈ C das Element −z := (−x, −y) als zugehöriges negatives Element.
In (M5) sei z = (x, y) ∈ C mit z 6= 0 gegeben, was gleichbedeutend ist mit (x, y) 6= (0, 0),
so dass mindestens eine der beiden reellen Zahlen x oder y von Null verschieden ist. Also
gilt x2 + y 2 > 0 wegen Satz 1.21 (f). Daher existiert die komplexe Zahl
1
x
−y
:=
,
.
z
x2 + y 2 x2 + y 2
Eine elementare Rechnung zeigt nun, dass es sich hierbei um das inverse Element von z
handelt.
2
Sind z1 , z2 ∈ C zwei komplexe Zahlen der Form z1 = (x1 , 0), z2 = (x2 , 0) mit x1 , x2 ∈ R, so
folgt aus den Rechenvorschriften (1.8) und (1.9) unmittelbar
(x1 , 0) + (x2 , 0) = (x1 + x2 , 0) und (x1 , 0) · (x2 , 0) = (x1 x2 , 0).
Die komplexen Zahlen der Form z = (x, 0) haben daher dieselben arithmetischen Eigenschaften wie die zugehörigen reellen Zahlen x. Aus diesem Grund können wir die komplexe
Christian Kanzow, Universität Würzburg, WS 2010/11
34
KAPITEL 1. KÖRPER UND ZAHLEN
Zahl z = (x, 0) mit der reellen Zahl x identifizieren und R somit als eine Teilmenge von C
auffassen.
Definieren wir noch die so genannte imaginäre Einheit
i := (0, 1),
so erhalten wir für die komplexe Zahl z = (x, y) mit x, y ∈ R die gebräuchliche Schreibweise
z = (x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0) = x + iy.
Man bezeichnet x auch als Realteil von z und y als Imaginärteil von z und schreibt hierfür
Re(z) und Im(z). Zwei komplexe Zahlen z, w ∈ C sind genau dann gleich, wenn Re(z) =
Re(w) und Im(z) = Im(w) gelten.
Die imaginäre Einheit i besitzt die interessante Eigenschaft
i2 = (0, 1) · (0, 1) = (−1, 0) = −1,
so dass i und −i (komplexe) Lösungen der quadratischen Gleichung z 2 = −1 sind. Im
Hinblick auf den Satz 1.21 (f) handelt es sich bei C daher um keinen geordneten Körper.
Definition 1.38 Sei z = (x, y) = x + iy eine komplexe Zahl mit x, y ∈ R. Dann heißt
z := x − iy
die konjugiert–komplexe Zahl von z.
Die Abbildung 1.4 veranschaulicht den Begriff der konjugiert–komplexen Zahl in der Gaußschen Zahlenebene.
−z̄
y
z = x + iy
x
−z
z̄
Abbildung 1.4: Veranschaulichung der konjugiert–komplexen Zahl in der Gaußschen Zahlenebene
Für konjugiert–komplexe Zahlen gelten die nachfolgenden Rechenregeln.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.6. KOMPLEXE ZAHLEN
35
Satz 1.39 ( Rechenregeln für konjugiert–komplexe Zahlen )
Es gelten die folgenden Aussagen:
(a) z + w = z + w für alle z, w ∈ C.
(b) zw = z w für alle z, w ∈ C.
(c) z = z für alle z ∈ C.
(d) z + z = 2Re(z) und z − z = 2iIm(z) für alle z ∈ C.
(e) zz ist reell und positiv für alle z ∈ C mit z 6= 0.
Beweis: Die Aussagen sind allesamt elementar beweisbar. Wir betrachten deshalb nur
den Teil (e). Sei z ∈ C mit z 6= 0 beliebig gegeben. Schreiben wir z = (x, y) = x + iy, so
folgt
zz = x2 + y 2
und daher unmittelbar die Behauptung aus dem Satz 1.21 (f).
2
Da es sich bei zz stets um eine reelle und nichtnegative Zahl handelt, ist der nachfolgend
eingeführte Begriff wohldefiniert, vergleiche den Satz 1.35.
Definition 1.40 Für jedes z ∈ C heißt
|z| :=
√
zz
der (absolute) Betrag von z.
Speziell für eine komplexe Zahl der Gestalt z = (x, 0) mit x ∈ R folgt aus dieser Definition
√
|z| := x2 = |x|,
wobei |x| den Betrag von x ∈ R im Sinne einer reellen Zahl bezeichnet. Daher ist die
Definition des Betrages einer komplexen Zahl konsistent mit der schon vorher eingeführten Betragsdefinition für den geordneten Körper R. Einige Eigenschaften des komplexen
Betrages sind in dem folgenden Resultat zusammengefasst.
Satz 1.41 ( Eigenschaften des komplexen Betrages )
Es gelten die folgenden Aussagen:
(a) Es ist |z| ≥ 0 für alle z ∈ C.
(b) Genau dann ist |z| = 0, wenn z = 0 gilt.
(c) Es ist |z| = |z| für alle z ∈ C.
(d) Es ist |zw| = |z| · |w| für alle z, w ∈ C.
Christian Kanzow, Universität Würzburg, WS 2010/11
36
KAPITEL 1. KÖRPER UND ZAHLEN
(e) Es ist |Re(z)| ≤ |z| und |Im(z)| ≤ |z| für alle z ∈ C.
(f ) Es ist |z + w| ≤ |z| + |w| für alle z, w ∈ C (Dreiecksungleichung).
(g) Es ist |z| − |w| ≤ |z + w| für alle z, w ∈ C (inverse Dreiecksungleichung).
Beweis: Die Aussagen (a), (b) und (c) lassen sich sofort verifizieren. Schreiben wir z =
(x, y) = x + iy mit x, y ∈ R, so folgt
√
p
√
|Re(z)| = |x| = x2 ≤ x2 + y 2 = zz = |z|
und, analog, |Im(z)| ≤ |z|. Seien nun z, w ∈ C beliebig gegeben. Dann gilt
|zw|2 = (zw)(zw) = zwz w = (zz)(ww) = |z|2 · |w|2.
Die Eindeutigkeit der Quadratwurzel liefert die Behauptung (d). Die Dreiecksungleichung
folgt aus
|z + w|2 =
=
=
=
(e)
(z + w)(z + w)
(z + w)(z + w)
zz + zw + wz + ww
|z|2 + 2Re(zw) + |w|2
≤ |z|2 + 2|z| · |w| + |w|2
2
= |z| + |w| .
Durch ziehen der Quadratwurzel folgt dann Teil (f). Die Aussage (g) wiederum kann man
wie im Beweis des Satzes 1.24 aus dem Teil (f) herleiten.
2
Zur Veranschaulichung komplexer Zahlen dient die so genannte Gaußsche Zahlenebene.
Die Addition zweier komplexer Zahlen wird dann die gewöhnliche Vektoraddition. Eine
anschauliche Deutung der Multiplikation von komplexen Zahlen werden wir erst später
geben können, wenn wir die Polarkoordinaten–Darstellung einer komplexen Zahl eingeführt
haben, siehe den Abschnitt 5.5.
Christian Kanzow, Universität Würzburg, WS 2010/11
1.6. KOMPLEXE ZAHLEN
|z| =
iy
p
37
x2 + y 2
z = x + iy
z+w
w
|w|
|
z+
|z|
w|
z
x
Abbildung 1.5: Interpretation des Betrags |z| als Länge des Vektors z (linkes Bild) und
geometrische Deutung der Dreiecksungleichung (rechtes Bild) aus dem Satz 1.41 (f)
Christian Kanzow, Universität Würzburg, WS 2010/11
38
KAPITEL 1. KÖRPER UND ZAHLEN
Christian Kanzow, Universität Würzburg, WS 2010/11
Kapitel 2
Funktionen
2.1
2.2
2.3
2.4
2.5
Funktionen
Monotone Funktionen
Polynome
Rationale Funktionen
Abzählbarkeit von Mengen
2.1
Funktionen
Der Begriff der Funktion oder Abbildung ist von zentraler Bedeutung für die gesamte
Mathematik. Wir führen ihn in der nachstehenden Definition ein.
Definition 2.1 Seien X, Y zwei gegebene Mengen.
(a) Eine Vorschrift f , die jedem Element x ∈ X genau ein Element y = f (x) ∈ Y
zuordnet, heißt Funktion oder Abbildung von X nach Y . Wir schreiben hierfür f :
X → Y.
(b) Für eine Funktion f : X → Y heißen X der Definitionsbereich, Y der Wertebereich
und f (X) := {f (x) | x ∈ X} der Bildbereich von f .
(c) Zwei Funktionen f1 : X → Y und f2 : X → Y mit demselben Definitionsbereich
heißen gleich, wenn f1 (x) = f2 (x) für alle x ∈ X gilt.
(d) Die Menge Graph(f ) := (x, f (x)) | x ∈ X heißt der Graph von einer Funktion
f : X →Y.
Als Warnung sei an dieser Stelle erwähnt, dass in der Literatur zwischen dem Bildbereich und dem Wertebereich einer Funktion manchmal nicht unterschieden wird. Bei der
Angabe einer Funktion hat man stets den Definitionsbereich und den Wertebereich mit
aufzuführen (sofern diese nicht aus dem jeweiligen Zusammenhang klar sind), während
man den Bildbereich gegebenenfalls erst bestimmen muss.
Wir geben als Nächstes einige Beispiele von Funktionen an.
39
40
KAPITEL 2. FUNKTIONEN
Beispiel 2.2 (a) Für ein c ∈ R bezeichnet man die Abbildung f : R → R mit f (x) :=
c als eine konstante Funktion. Definitions– und Wertebereich sind jeweils R, der
Bildbereich besteht nur aus dem einen Element {c}.
(b) Die Abbildung f : R → R mit f (x) := x wird als Identität bezeichnet. Definitions–,
Werte– und Bildbereich ist ganz R,
(c) Die Betragsfunktion ist definiert durch f : R → R, f (x) := |x|. Der Definitionsbereich
ist R, der Wertebereich R, der Bildbereich hingegen nur R+ := {x ∈ R | x ≥ 0}.
√
(d) Die Quadratwurzel ist definiert durch f : R+ → R, f (x) := x. Der Definitionsbereich ist R+ , der Wertebereich ist R. Wegen Satz 1.35 ist der Bildbereich gegeben
durch R+ .
(e) Unter einem Polynom vom Grad n in R versteht man eine Abbildung der Gestalt
f : R → R, f (x) := an xn + an−1 xn−1 + . . . + a1 x + a0
mit gewissen Koeffizienten a0 , a1 , . . . , an−1 , an ∈ R, wobei für den so genannten Leitkoeffizienten an 6= 0 gelte. Der Definitionsbereich ist R, ebenso der Wertebereich. Der
Bildbereich hängt vom konkreten Aussehen des Polynoms p ab. Für f (x) := x3 ist
der Bildbereich der gesamte R, für f (x) := x4 hingegen ist der Bildbereich lediglich
R+ .
(f) Seien
p(x) := an xn + . . . + a1 x + a0 und
q(x) := bm xm + . . . + b1 x + b0
zwei Polynome vom Grad n und m sowie X := {x ∈ R | q(x) 6= 0}. Dann bezeichnet
man die durch
p(x)
r : X → R, r(x) :=
q(x)
definierte Abbildung als eine rationale Funktion. Der Definitionsbereich von r besteht also gerade aus allen reellen Zahlen mit Ausnahme der Nullstellen von q, der
Wertebereich hingegen ist R.
(g) Seien a < b zwei reelle Zahlen. Eine Abbildung f : [a, b] → R heißt Treppenfunktion,
wenn es eine Unterteilung
a = t0 < t1 < . . . < tn−1 < tn = b
des Intervalls [a, b] := {x ∈ R | a ≤ x ≤ b} und Konstanten c1 , c2 , . . . , cn ∈ R gibt mit
f (x) = ck für alle x ∈ (tk−1 , tk ) := {x ∈ R | tk−1 < x < tk } (1 ≤ k ≤ n).
Die Funktionswerte f (tk ) in den Teilpunkten tk sind hierbei beliebig (aber endliche
Werte aus R).
Christian Kanzow, Universität Würzburg, WS 2010/11
2.1. FUNKTIONEN
a = t0
t1
t2
t3
41
b = t4
Abbildung 2.1: Beispiel einer Treppenfunktion
(h) Die Abbildung f : R → R mit
f (x) :=
0,
1,
falls x ∈ Q,
falls x ∈
/Q
ist etwas unangenehm und lässt sich graphisch nicht leicht veranschaulichen, da Q
nach Satz 1.34 dicht in R liegt. Der Definitionsbereich dieser Funktion ist wieder ganz
R, der Bildbereich hingegen besteht nur aus den beiden Punkten 0 und 1.
3
Funktionen werden oft mit dem Symbol f bezeichnet. Liegen mehrere Abbildungen vor,
nummeriert man sie häufig in der Gestalt f1 , f2 , . . .. Treten nur zwei Funktionen auf, nennt
man diese häufig f und g, bei drei Funktionen wählt man gerne die Buchstaben f, g und h.
Polynome hingegen tragen im Allgemeinen die Namen p oder q, rationale Funktionen dagegen die Bezeichnung r. Auch die entsprechenden Großbuchstaben werden gerne benutzt.
In der folgenden Definition führen wir die Verknüpfung zweier Abbildungen ein.
Definition 2.3 Gegeben seien drei Mengen X1 , X2 und X3 sowie zwei Abbildungen f1 :
X1 → X2 und f2 : X2 → X3 . Unter dem Kompositum (oder Verknüpfung oder Hintereinanderschaltung) von f1 und f2 verstehen wir die Funktion f : X1 → X3 , welche durch
f := f2 ◦ f1
mit (f2 ◦ f1 )(x) := f2 (f1 (x)) für alle x ∈ X1
definiert ist.
Man beachte, dass man zwei Funktionen f1 und f2 natürlich nur dann miteinander verknüpfen kann, wenn der Bildbereich von f1 im Definitionsbereich von f2 liegt, da anderenfalls die Funktion f2 im Punkte f1 (x) eventuell nicht erklärt ist.
Unser nächstes Resultat besagt, dass das Kompositum von Abbildungen stets assoziativ
ist.
Christian Kanzow, Universität Würzburg, WS 2010/11
42
KAPITEL 2. FUNKTIONEN
Satz 2.4 Seien X1 , X2 , X3 , X4 gewisse Mengen und f1 : X1 → X2 , f2 : X2 → X3 und
f3 : X3 → X4 gegebene Funktionen. Dann gilt
f3 ◦ (f2 ◦ f1 ) (x) = (f3 ◦ f2 ) ◦ f1 (x) für alle x ∈ X1 ,
d.h., die beiden Abbildungen f3 ◦ (f2 ◦ f1 ) und (f3 ◦ f2 ) ◦ f1 sind gleich.
Beweis: Gemäß Definition 2.3 gilt einerseits
f3 ◦ (f2 ◦ f1 ) (x) = f3 (f2 ◦ f1 ) (x) = f3 f2 (f1 (x))
und andererseits
(f3 ◦ f2 ) ◦ f1 (x) = (f3 ◦ f2 )(f1 (x)) = f3 f2 (f1 (x))
für alle x ∈ X1 , womit die Behauptung auch schon bewiesen ist.
2
Eine Abbildung f : X → Y zwischen zwei Mengen X und Y war dadurch definiert, das
jedem Element x ∈ X auf eindeutige Weise ein Wert y = f (x) ∈ Y zugeordnet wurde.
Umgekehrt kann es aber vorkommen, dass es zu einem y ∈ Y entweder überhaupt kein
x ∈ X mit f (x) = y gibt oder sogar zwei (bzw. mehr) verschiedene Elemente x1 , x2 ∈ X
existieren mit f (x1 ) = y und f (x2 ) = y. Will man diese Fälle ausschließen, so gelangt man
zu den Begriffen einer surjektiven und einer injektiven Abbildung.
Definition 2.5 Seien X, Y zwei beliebige Mengen und f : X → Y eine gegebene Funktion.
(a) f heißt surjektiv, wenn f (X) = Y ist, es also zu jedem y ∈ Y mindestens ein Element
x ∈ X mit f (x) = y gibt.
(b) f heißt injektiv, wenn für alle x1 , x2 ∈ X mit f (x1 ) = f (x2 ) stets x1 = x2 folgt.
(c) f heißt bijektiv, wenn f sowohl surjektiv als auch injektiv ist.
Als Beispiel betrachten wir die einfache Abbildung
f : R → R, x 7→ f (x) := x2 .
Diese Abbildung ist weder surjektiv noch injektiv, denn wegen f (x) ≥ 0 für alle x ∈ R ist
der Bildbereich f (R) = R+ von R verschieden, außerdem gilt f (x) = x2 = (−x)2 = f (−x).
Hingegen ist die Abbildung
f : R → R+ , x 7→ f (x) := x2
offenbar surjektiv, allerdings nach wie vor nicht injektiv. Dagegen ist
f : R+ → R+ , x 7→ f (x) := x2
Christian Kanzow, Universität Würzburg, WS 2010/11
(2.1)
2.1. FUNKTIONEN
43
ganz offensichtlich sowohl surjektiv als auch injektiv, also bijektiv. Diese Ausführungen
verdeutlichen noch einmal, warum man bei der Angabe einer Funktion f : X → Y stets
den Definitionsbereich X und die Menge Y mit erwähnen sollte. Später werden wir hierauf
allerdings manchmal verzichten, wenn die Mengen X und Y aus dem Zusammenhang klar
sind.
Sei nun f : X → Y eine injektive Abbildung. Betrachten wir f : X → f (X) dann nur
als Funktion von X auf ihrem Bildbereich f (X) ⊆ Y , so ist f per Definition auch surjektiv
und damit bijektiv. Also existiert zu jedem Element y ∈ f (X) genau ein Element x ∈ X mit
f (x) = y. Auf diese Weise erhalten wir also eine Vorschrift, die jedem Element y ∈ f (X)
auf eindeutige Weise ein x ∈ X zuordnet. Diese Vorschrift wird als Umkehrabbildung
von f bezeichnet und als f −1 geschrieben. Wir führen diese jetzt allgemein für bijektive
Abbildungen ein.
Definition 2.6 Seien X, Y zwei Mengen und f : X → Y eine bijektive Abbildung. Dann
heißt die Abbildung
f −1 : Y → X, y 7→ f −1 (y) := x,
falls f (x) = y,
die Umkehrfunktion von f .
Zum Beispiel besitzt die als bijektiv erkannte Abbildung f aus (2.1) die Umkehrfunktion
√
f −1 : R+ → R+ , x 7→ f −1 (x) := x.
Speziell für eine bijektive Abbildung f : D → R mit Definitionsbereich D ⊆ R besitzt die
Umkehrfunktion eine einfache geometrische Interpretation: Zunächst ist
Graph(f ) = (x, f (x)) | x ∈ D
Schreiben wir y := f (x) für x ∈ D, so erhalten wir als Graphen der Umkehrfunktion den
Ausdruck
Graph(f −1 ) = (y, f −1(y)) | y ∈ f (D)
= (f (x), x) | x ∈ D .
Anschaulich ergibt sich der Graph der Umkehrfunktion somit aus dem Graphen der Ausgangsfunktion f durch Spiegelung an der Winkelhalbierenden. Die Abbildung 2.2 veranschaulicht diesen Sachverhalt. Die gerade Linie ist die Winkelhalbierende. Durch Spielgelung der Abbildung
f (x) = x2 an dieser Winkelhalbierenden erhält man die Wurzelfunktion
√
−1
f (x) = x als Umkehrfunktion (und umgekehrt).
Für die Umkehrfunktion gelten die nachstehend zusammengefassten Eigenschaften.
Satz 2.7 ( Eigenschaften der Umkehrfunktion )
Seien X, Y zwei Mengen und f : X → Y eine bijektive Abbildung mit der Umkehrfunktion
f −1 : Y → X. Dann gelten:
Christian Kanzow, Universität Würzburg, WS 2010/11
44
KAPITEL 2. FUNKTIONEN
4.0
3.5
3.0
2.5
2.0
1.5
1.0
0.5
0.0
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
Abbildung 2.2: Veranschaulichung der Umkehrfunktion.
(a) Es ist f −1 f (x) = x für alle x ∈ X.
(b) Es ist f f −1 (y) = y für alle y ∈ Y .
(c) f −1 ist bijektiv mit (f −1 )−1 (x) = f (x) für alle x ∈ X, d.h., die Umkehrfunktion von
f −1 ist wieder die Abbildung f .
Beweis: (a) Sei x ∈ X beliebig. Setze y := f (x). Dann ist f −1 f (x) = f −1 (y) = x.
(b) Sei y ∈ Y beliebig und setze x := f −1 (y), also f (x) = y. Dann ist f f −1 (y) = f (x) = y.
(c) Sei x ∈ X beliebig. Setze y := f (x). Mit g := f −1 ist dann (f −1 )−1 (x) = g −1(x) = y =
f (x) aufgrund der Definition der Umkehrfunktion.
2
Das Symbol f −1 wird oft auch in einem anderen Zusammenhang verwendet. Bezeichnet
f : X → Y nämlich eine nicht notwendig bijektive Abbildung, so versteht man für ein
gegebenes y ∈ Y unter der Menge f −1 (y) := {x ∈ X | f (x) = y} das Urbild von y unter
der Abbildung f . Im Falle einer bijektiven Abbildung ist dieses Urbild einelementig und
ergibt gerade das Element im vorher definierten Sinne. Etwas allgemeiner definiert man
für eine Menge M ⊆ Y das Urbild von M unter der Abbildung f als f −1 (M) := {x ∈ X |
f (x) ∈ M}.
Abschließend sei noch erwähnt, dass man für zwei Abbildungen f1 , f2 : X → Y die
Summe, das Produkt und den Quotienten definiert durch
(f1 + f2 )(x) := f1 (x) + f2 (x),
(f1 · f2 )(x) := f1 (x) · f2 (x),
f f1 (x)
1
(x) :=
f2
f2 (x)
für alle x ∈ X, wobei natürlich f2 (x) 6= 0 im Falle des Quotienten gelten muss.
Christian Kanzow, Universität Würzburg, WS 2010/11
2.2. MONOTONE FUNKTIONEN
2.2
45
Monotone Funktionen
Die Klasse der (streng) monotonen Funktionen ist von einiger Bedeutung und wird in der
nachstehenden Definition eingeführt.
Definition 2.8 Sei D ⊆ R gegeben. Eine Funktion f : D → R heißt
(a) monoton wachsend, wenn f (x1 ) ≤ f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt.
(b) monoton fallend, wenn f (x1 ) ≥ f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt.
(c) streng monoton wachsend, wenn f (x1 ) < f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt.
(d) streng monoton fallend, wenn f (x1 ) > f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt.
Häufig werden wir nur von einer monotonen Funktion sprechen, wenn diese entweder monoton wachsend oder monoton fallend ist, es aber vom Zusammenhang her nicht weiter
wichtig ist, ob diese Funktion nun wächst oder fällt. Ebenso verwenden wir den Begriff
einer streng monotonen Funktion, wenn die Funktion streng monoton wächst oder streng
monoton fällt.
Die Abbildung 2.3 enthält den Graphen dreier Funktionen, von denen eine in dem
angegebenen Intervall [−1, 3] strikt monoton wachsend ist, eine andere monoton (aber
nicht strikt monoton) wächst und eine dritte Funktion strikt monoton fällt.
3
2
1
1
-1
2
3
-1
-2
Abbildung 2.3: Der Graph einiger (strikt) monotoner Funktionen im Intervall [−1, +3].
Wir zeigen als Nächstes, dass eine streng monotone Funktion stets injektiv ist.
Satz 2.9 Seien D ⊆ R und f : D → R streng monoton (wachsend oder fallend). Dann ist
f injektiv.
Christian Kanzow, Universität Würzburg, WS 2010/11
46
KAPITEL 2. FUNKTIONEN
Beweis: Ohne Beschränkung der Allgemeinheit gehen wir davon aus, dass f streng monoton wächst. Seien dann x1 , x2 ∈ D zwei gegebene Punkte mit f (x1 ) = f (x2 ). Wäre x1 < x2 ,
so folgte f (x1 ) < f (x2 ) wegen der strengen Monotonie von f . Wäre hingegen x1 > x2 , so
wäre f (x1 ) > f (x2 ), und zwar ebenfalls wegen der strengen Monotonie von f . Also muss
x1 = x2 sein, so dass f tatsächlich injektiv ist.
2
Eine streng monotone Funktion f : D → R muss natürlich nicht bijektiv sein. Beispielsweise ist die Abbildung f : [0, ∞) → R, f (x) := x2 , streng monoton steigend, nimmt aber
keine negativen Werte an. Allerdings ist eine injektive Funktion auf ihrem Bildbereich
natürlich bijektiv. Eine streng monotone Funktion f : D → R, aufgefasst als Abbildung
f : D → f (D) mit f (D) := {y ∈ R | ∃x ∈ D : y = f (x)} besitzt daher stets eine
Umkehrfunktion f −1 : f (D) → D. Für diese gilt das nachstehende Resultat.
Satz 2.10 ( Monotonie der Umkehrfunktion )
Seien D ⊆ R und f : D → R streng monoton wachsend (fallend) mit Bildbereich f (D) :=
{y ∈ R | ∃x ∈ D : y = f (x)}. Dann ist die Umkehrfunktion f −1 : f (D) → D ebenfalls
streng monoton wachsend (fallend).
Beweis: Die Existenz der Umkehrfunktion wurde schon im Vorwege begründet. Seien
nun y1 , y2 ∈ f (D) mit y1 < y2 beliebig gegeben. Dann existieren eindeutig bestimmte Elemente x1 , x2 ∈ D mit f (x1 ) = y1 und f (x2 ) = y2 . Setzen wir f ohne Einschränkung als
streng monoton wachsend voraus, so müssen wir x1 < x2 zeigen. Wäre x1 ≥ x2 , so würde
y1 = f (x1 ) ≥ f (x2 ) = y2 gelten im Widerspruch zu y1 < y2 . Damit ist bereits alles gezeigt.
2
Wir betrachten noch ein einfaches Beispiel.
Beispiel 2.11 Sei k ∈ N beliebig gegeben (wobei letztlich nur der Fall k ≥ 2 von Interesse
ist). Die Funktion f : R+ → R, x 7→ xk , ist offenbar streng monoton wachsend
und bildet
√
−1
k
R+ auf R+ ab. Die zugehörige Umkehrfunktion f
: R+ → R+ , x 7→ x, ist daher
ebenfalls streng monoton wachsend und wird als k-te Wurzel bezeichnet.
Ist k ∈ N ungerade, so ist die Funktion f : R → R, x 7→ xk , sogar bijektiv als Abbildung
√
von R in R. In diesem Fall kann die k-te Wurzel daher als Funktion f −1 : R → R, x 7→ k x,
auf ganz R definiert werden.
3
2.3
Polynome
Bei den Polynomen handelt es sich um spezielle Abbildungen, denen in der Analysis eine
besondere Bedeutung zukommt. Wir widmen ihnen daher einen eigenen Abschnitt. Dazu
bezeichnen wir mit K im Folgenden stets den reellen oder komplexen Körper. Wir haben
also
K = R oder K = C.
Christian Kanzow, Universität Würzburg, WS 2010/11
2.3. POLYNOME
47
In der Analysis bezeichnet man eine Funktion der Gestalt
p(x) := an xn + an−1 xn−1 + . . . + a1 x + a0
(2.2)
als ein Polynom, wobei a0 , a1 , . . . , an ∈ K gewisse Koeffizienten sind, vergleiche Beispiel
2.2 (e). Speziell für K = R spricht man von einem reellen Polynom. Die Menge aller
solchen Polynome wird mit K[x] bezeichnet. Ist der so genannte Leitkoeffizient an von Null
verschieden, so handelt es sich bei der Abbildung (2.2) um ein Polynom vom Grad n. Dem
Nullpolynom p ≡ 0 wird hierbei kein Grad zugeordnet.
In der Definition (2.2) haben wir den Definitionsbereich des Polynoms nicht mit angegeben. In der Analysis wird dies im Allgemeinen R oder C sein, so dass die Unbekannte x
eine reelle oder komplexe Zahl repräsentiert. In der Algebra werden für x aber häufig auch
andere Objekte eingesetzt wie beispielsweise Matrizen.
Bevor wir zu dem ersten Resultat dieses Abschnittes gelangen, wollen wir als Motivation
zunächst an die aus der Schule (hoffentlich) bekannte Polynomdivision erinnern, die auch
unter dem Namen Euklidischer Algorithmus in allgemeineren Zusammenhängen auftritt.
Die Aufgabe besteht darin, ein gegebenes Polynom p durch ein anderes Polynon q (von
meist kleinerem Grad) zu dividieren. Das Ergebnis sollte ein weiteres Polynom s sein, ggf.
bleibt als Rest“ r übrig, bei dem es sich ebenfalls um ein Polynom handelt, welches sich
”
nicht mehr durch q teilen lässt. Wir suchen also Polynome s und r mit
r(x)
p(x)
= s(x) +
q(x)
q(x)
⇐⇒
p(x) = s(x)q(x) + r(x).
(2.3)
Zunächst also das angekündigte einfache Beispiel.
Beispiel 2.12 ( Polynomdivision )
Gegeben seien die beiden Polynome
p(x) := 4x5 − x4 + 2x3 + x2 − 1 und
q(x) := x2 + 1.
Polynomdivision liefert
(+4x5 −x4 +2x3 +x2 −1) :
−4x3
−4x5
4
−x −2x3
+x2
+x4
−2x3 +2x2
+2x
+2x3
2 +2x
+2x
−2x2
+2x
(x2 + 1) = 4x3 − x2 − 2x + 2
−1
−2
−3
Wir erhalten damit die gewünschte Zerlegung (2.3) mit s(x) := 4x3 − x2 − 2x + 2 und dem
Restpolynom r(x) := 2x − 3.
3
Christian Kanzow, Universität Würzburg, WS 2010/11
48
KAPITEL 2. FUNKTIONEN
Ein erstes wichtiges Resultat für Polynome ist in dem nachfolgenden Resultat enthalten.
Satz 2.13 ( Division mit Rest )
Seien g ein von Null verschiedenes Polynom. Dann gibt es zu jedem Polynom f eindeutig
bestimmte Polynome q und r mit
f = qg + r,
(2.4)
wobei r ≡ 0 oder Grad r < Grad g gilt.
Beweis: Seien
f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0
mit an 6= 0
g(x) = bm xm + bm−1 xm−1 + . . . + b1 x + b0
mit bm 6= 0
und
die beiden gegebenen Polynome.
Wir beweisen zunächst die Existenz einer Zerlegung der Gestalt (2.4). Gilt bereits
Grad f < Grad g, so sind wir wegen f = 0 · g + f fertig, indem wir q ≡ 0 und r ≡ f
setzen. Sei daher n ≥ m vorausgesetzt. Subtrahieren wir von f das Polynom bamn xn−m g(x),
so erhält man mit
an n−m
x
g(x)
f1 (x) := f (x) −
bm
ein Polynom f1 mit f1 ≡ 0 oder n1 := Grad f1 < n. Ist nun n1 < m, so sind wir fertig,
indem wir q := bamn xn−m und r := f1 setzen. Gilt dagegen n1 ≥ m, so fahren wir auf
diese Weise fort und subtrahieren von f1 nochmals ein geeignetes Vielfaches von g, um ein
Polynom f2 mit f2 ≡ 0 oder n2 := Grad f2 < n1 zu erhalten. Nach endlich vielen Schritten
bricht dieser Prozess ab und wir gelangen zu einer Darstellung der Gestalt (2.4).
Zum Nachweis der Eindeutigkeit der Zerlegung (2.4) nehmen wir an, dass wir eine
weitere Darstellung f = q ′ g + r ′ mit q ′ 6= q (für q ′ = q wäre zwangsläufig auch r ′ = r)
haben, wobei r ′ ≡ 0 oder Grad r ′ < Grad g gilt. Dann folgt (q ′ − q)g = r − r ′ und somit
der Widerspruch
Grad(g) ≤ Grad (q ′ − q)g = Grad(r − r ′ ) < Grad(g),
|
{z
}
≥1 wegen q ′ 6=q
womit alles bewiesen ist.
2
Sei nun
p(x) = a0 + a1 x + . . . + an xn
mit an 6= 0
ein Polynom vom Grad n. Sei ferner x1 eine Nullstelle von p, also p(x1 ) = 0. Dann lässt
sich der Faktor x − x1 von p abdividieren. Genauer gilt wegen
xk − xk1 = (x − x1 ) (xk−1 + xk−2 x1 + . . . + xx1k−2 + x1k−1 ) = (x − x1 )qk (x)
{z
}
|
=:qk (x)
Christian Kanzow, Universität Würzburg, WS 2010/11
2.3. POLYNOME
49
für alle k ≥ 2 nämlich
p(x) = p(x) − p(x1 )
= a1 (x − x1 ) + a2 (x2 − x21 ) + . . . + an (xn − xn1 )
= (x − x1 ) a1 + a2 q2 (x) + . . . + an qn (x)
|
{z
}
=:b0 +b1 x+...+bn−2 xn−2 +bn−1 xn−1
=:p1 (x)
= (x − x1 )p1 (x),
wobei das Polynom p1 wegen bn−1 = an 6= 0 den Grad n − 1 besitzt. Ist jetzt noch
Grad p1 ≥ 1 und x1 eine Nullstelle von p1 , so lässt sich x − x1 auch von p1 abdividieren,
und man erhält die Gleichung p(x) = (x − x1 )2 p2 (x) mit einem Polynom p2 vom Grad
n − 2. Indem man so fortfährt, gelangt man schließlich zu einer Darstellung
p(x) = (x − x1 )n1 pn1 (x)
mit einem Polynom pn1 vom Grade n−n1 , für welches pn1 (x1 ) 6= 0 ist. Besitzt das ursprüngliche Polynom p eine weitere Nullstelle x2 6= x1 , so ist x2 natürlich auch eine Nullstelle von
pn1 . Also kann man eine möglichst hohe Potenz des Linearfaktors x − x2 abspalten. So
fortfahrend, gelangt man zu dem nachstehenden Resultat.
Satz 2.14 Ein Polynom p vom Grad n ≥ 1 besitzt höchstens m ≤ n verschiedene Nullstellen x1 , x2 , . . . , xm , mit deren Hilfe es sich schreiben lässt als
p(x) = (x − x1 )n1 · . . . · (x − xm )nm q(x)
mit einem Polynom q vom Grad n − (n1 + . . . + nm ), das seinerseits keine Nullstellen mehr
besitzt.
Als unmittelbare Konsequenz aus dem Satz 2.14 notieren wir ein wichtiges Resultat über
die Gleichheit zweier Polynome.
Satz 2.15 ( Identitätssatz für Polynome )
Stimmen zwei Polynome
p(x) = an xn + . . . + a1 x + a0
und q(x) = bn xn + . . . + b2 x + b0
an n + 1 verschiedenen Stellen überein, so gilt ak = bk für alle k = 0, 1, . . . , n und daher
p(x) = q(x) für alle x ∈ K.
Beweis: Aus ak = bk für alle k = 0, 1, . . . , n folgt natürlich p(x) = q(x) für alle x ∈ K, so
dass nur noch die Gleichheit aller Koeffizienten bewiesen werden muss. Der Beweis geschieht
durch Widerspruch. Angenommen, es gibt einen (größten) Index m ∈ {0, 1, . . . , n} mit
am 6= bm und ak = bk für alle k = m + 1, . . . , n. Das Differenzpolynom
r(x) := p(x) − q(x) =
m
X
(ak − bk )xk
k=0
Christian Kanzow, Universität Würzburg, WS 2010/11
50
KAPITEL 2. FUNKTIONEN
hat dann den Grad m und besitzt n + 1 > m Nullstellen. Im Fall m ≥ 1 liefert dies einen
Widerspruch zum Satz 2.14, und im Fall m = 0 (konstantes Polynom 6= 0) ist dies sowieso
nicht möglich.
2
Den Satz 2.14 kann man verschärfen, indem man komplexe Nullstellen zulässt. Dann besitzt
jedes (reelle oder komplexe) Polynom vom Grad n genau n Nullstellen, die allerdings auch
bei reellen Polynomen komplex sein können. Dies ist die Aussage des folgenden Satzes, den
wir allerdings erst zu einem späteren Zeitpunkt beweisen werden, siehe Satz 5.26.
Satz 2.16 ( Fundamentalsatz der Algebra )
Jedes Polynom p ∈ K[x] vom Grad n ≥ 1 hat eine Darstellung
p(x) = a(x − x1 )n1 · . . . · (x − xs )ns
mit einem Faktor a ∈ K und (eventuell komplexen) paarweise verschiedenen Nullstellen
xi ∈ C, wobei xi eine ni -fache Nullstelle von p ist und n1 + . . . + ns = n gilt.
Für reelle Polynome können wir aus dem Satz 2.16 eine interessante Beobachtung herleiten.
Sei dazu
p(x) = an xn + . . . + a1 x + a0
mit ai ∈ R für alle i = 0, 1, . . . , n
ein beliebiges reelles Polynom. Ist z ∈ C dann ein Nullstelle dieses reellen Polynoms p, so
folgt aus
n
n
n
X
X
X
k
k
ak z =
ak z =
ak z k = p(z) = 0 = 0,
p(z) =
k=0
k=0
k=0
dass die konjugiert–komplexe Zahl ebenfalls eine Nullstelle von p ist. Die nicht reellen Nullstellen treten also in Paaren konjugiert–komplexer Nullstellen auf. Durch Multiplikation
der zugehörigen Linearfaktoren x − z und x − z erhalten wir ein reelles Polynom zweiten
Grades:
(x − z)(x − z) = x2 − 2Re(z)x + zz.
Daher kann jedes reelle Polynom als Produkt von reellen Polynomen vom Grad 1 (für die
reellen Nullstellen) und vom Grad 2 (für die konjugiert–komplexen Nullstellen) dargestellt
werden.
2.4
Rationale Funktionen
Unter einer rationalen Funktion verstehen wir den Quotienten aus zwei Polynomen, also
R(x) =
p(x)
q(x)
Christian Kanzow, Universität Würzburg, WS 2010/11
(2.5)
2.4. RATIONALE FUNKTIONEN
51
für gewisse Polynome p, q ∈ K[x], wobei K ∈ {R, C} wieder den Körper der reellen oder
komplexen Zahlen bezeichnet. Nun ist die Darstellung einer rationalen Funktion nicht
eindeutig, beispielsweise ist
x−1
R(x) = 2
x −1
eine rationale Funktion, deren Definitionsbereich zunächst nur die Menge K\{±1} ist,
da wir für x = 1 und x = −1 durch Null dividieren würden. Andererseits besitzt das
Nennerpolynom wegen
x2 − 1 = (x + 1)(x − 1)
einen gemeinsamen Faktor mit dem Zählerpolynom, so dass wir nach Kürzung dieses Faktors
1
R(x) =
x+1
erhalten, wobei der Definitionsbereich jetzt K\{−1} lautet.
Wir können im Folgenden deshalb davon ausgehen, dass in der Darstellung (2.5) alle
gemeinsamen Teilerpolynome von p und q bereits gekürzt sind. Der vollständige Definitionsbereich der rationalen Funktion (2.5) besteht dann aus der Menge aller x ∈ K, für die
das (gekürzte) Nennerpolynom keine Nullstelle hat.
Ein z ∈ K heißt n-facher Pol der rationalen Funktion (2.5), wenn p(z) 6= 0 ist und z
eine Nullstelle von q der Vielfachheit n ist. Wegen Satz 2.14 existiert dann ein Polynom h
mit h(z) 6= 0 und
p(x)
p(x)
=
.
(2.6)
R(x) =
q(x)
(x − z)n h(x)
Die rationale Funktion
1
(x − z)n
heißt dann Partialbruch. Für einen solchen Partialbruch gibt es auch eine additive Zerlegung, die wir in dem folgenden Resultat beschreiben.
Lemma 2.17 ( Zerlegung einer rationalen Funktion )
Sei z ein n-facher Pol der rationalen Funktion R. Dann gibt es genau eine Zerlegung
R(x) = H(x) + R0 (x)
mit den folgenden Eigenschaften:
(a) R0 ist eine rationale Funktion, die in z keinen Pol mehr hat.
(b) der so genannte Hauptteil H ist von der Gestalt
H(x) =
an
an−1
a1
+
+ ...+
n
n−1
(x − z)
(x − z)
x−z
mit an 6= 0.
Christian Kanzow, Universität Würzburg, WS 2010/11
52
KAPITEL 2. FUNKTIONEN
Beweis: Wir beginnen zunächst mit einer Vorbetrachtung: Da z nach Voraussetzung ein
n-facher Pol von R ist, haben wir für die rationale Funktion R eine Darstellung der Form
(2.6). Hieraus folgt
p(x) p(z)
p(x)h(z) − p(z)h(x)
(x − z)P (x)
−
=
=
h(x) h(z)
h(x)h(z)
h(x)
mit einem Polynom P , dessen Existenz daraus folgt, dass das Zählerpolynom Q(x) :=
p(x)h(z) − p(z)h(x) in x = z offenbar eine Nullstelle hat. Damit erhalten wir aus (2.6)
1
(x − z)n
1
=
(x − z)n
an
=
(x − z)n
R(x) =
p(x)
h(x)
p(z) (x − z)P (x)
·
+
h(z)
h(x)
P (x)
p(z)
+
mit an :=
.
n−1
(x − z) h(x)
h(z)
·
(2.7)
Wir kommen nun zum eigentlichen Beweis und zeigen zunächst die Existenz der gewünschten Zerlegung. Dies erfolgt durch Induktion nach n. Im Fall n = 1 ist (2.7) bereits die
gesuchte Zerlegung, da R0 := P/h wegen h(z) 6= 0 keinen Pol in z hat.
In der Induktionsannahme können wir deshalb davon ausgehen, dass die Aussage für
alle rationalen Funktionen richtig ist, die in x = z höchstens einen (n − 1)-fachen Pol
haben. Für den Induktionsschluss von (n − 1) auf n betrachten wir nun die Zerlegung (2.7)
und setzen hierzu
P (x)
.
Rn−1 (x) :=
(x − z)n−1 h(x)
Auf die Funktion Rn−1 können wir dann die Induktionsannahme anwenden, da diese in
z keinen Pol oder höchstens einen (n − 1)-fachen Pol hat. Im erstgenannten Fall wählen
wir einfach R0 := Rn−1 , ihm zweitgenannten Fall zerlege man Rn−1 dagegen gemäß Induktionsannahme. Zusammenfassend ergibt sich eine Darstellung von R der gewünschten
Gestalt.
Zum Nachweis der Eindeutigkeitsaussage nehmen wir an, dass wir zwei Zerlegungen
der Gestalt
n
n
X
X
ak
bk
+ R0 (x) =
+ S0 (x)
(2.8)
k
k
(x
−
z)
(x
−
z)
k=1
k=1
haben. Multiplikation beider Seiten mit (x − z)n und anschließendes Einsetzen von x = z
bn
an
liefert dann an = bn . Nach Entfernen von (x−z)
n = (x−z)n auf beiden Seiten der Identität
(2.8) zeigt man auf analoge Weise an−1 = bn−1 . So fortfahrend erhält man auch die Eindeutigkeitsaussage.
2
Das Lemma 2.17 können wir natürlich auf jede Polstelle anwenden. Betrachte dazu die
rationale Funktion R aus (2.5). Wegen des Fundamentalsatzes der Algebra lässt sich das
Nennerpolynom schreiben als
q(x) = (x − z1 )n1 · (x − z2 )n2 · . . . · (x − zs )ns
Christian Kanzow, Universität Würzburg, WS 2010/11
2.4. RATIONALE FUNKTIONEN
53
für gewisse Nullstellen z1 , . . . , zs von q mit den Vielfachheiten n1 , . . . , ns (der in q eventuell auftretende konstante Faktor kann als Teil des Zählerpolynoms p genommen werden).
Da gemeinsame Teilpolynome von p und q bereits rausgekürzt sind, handelt es sich bei
z1 , . . . , zs dann um keine Nullstellen des Zählerpolynoms p. Folglich sind die zi Polstellen
der rationalen Funktion R mit der Vielfachheit ni (i = 1, . . . , s). Anwendung des Lemmas
2.17 auf diese Polstellen liefert gewisse Hauptteile H1 , . . . , Hs von R und somit insgesamt
eine Darstellung der Form
R(x) = H1 (x) + . . . + Hs (x) + Q(x).
Dabei handelt es sich bei Q um eine rationale Funktion ohne irgendwelche Pole. Nach dem
Fundamentalsatz der Algebra ist Q somit der Quotient aus einem Polynom und einer Konstanten, folglich ein Polynom. Man bezeichnet Q als den Polynom–Anteil von R. Insgesamt
haben wir damit das folgende Resultat bewiesen.
Satz 2.18 ( Partialbruchzerlegung )
Jede rationale Funktion ist die Summe ihrer Hauptteile und ihres Polynom–Anteils.
Die Partialbruchzerlegung wird später eine wichtige Rolle bei der Integration von rationalen
Funktionen spielen. Dabei ist es wichtig, dass man die Partialbruchzerlegung einer rationalen Funktion auch konkret durchführen kann. Den Polynom–Anteil erhält man hierbei aus
der Division mit Rest, die Partialbrüche aus der Linearfaktorzerlegung der verbleibenden
rationalen Funktion, die Koeffizienten der Hauptteile schließlich durch einen Koeffizientenvergleich. Wir illustrieren das allgemeine Vorgehen kurz an einem Beispiel.
Beispiel 2.19 Wir betrachten die rationale Funktion
R(x) :=
x+1
.
x(x − 1)2
(2.9)
Hier ist der Grad des Zählerpolynoms bereits kleiner als der des Nennerpolynoms, so dass
wir keinen Polynom–Anteil erhalten. Das Nennerpolynom ist außerdem schon in seine
Linearfaktoren zerlegt mit den beiden Nullstellen z1 := 0 und z2 := 1 mit den zugehörigen
Vielfachheiten n1 := 1 und n2 := 2. Der Ansatz für die Partialbruchzerlegung lautet somit
R(x) :=
a
b2
b1
+
+
x − 0 (x − 1)2 x − 1
(2.10)
für gewisse a, b2 , b1 ∈ R. Zur Bestimmung von a, b1 und b2 multiplizieren wir die beiden
Darstellungen (2.9) und (2.10) jeweils mit dem Nennerpolynom x(x − 1)2 und erhalten
somit die Identität
x + 1 = x(x − 1)2 R(x) = a(x − 1)2 + b2 x + b1 x(x − 1).
Sortieren nach den Potenzen von x ergibt die Gleichheit
x + 1 = ax2 − 2ax + a + b2 x + b1 x2 − b1 x = (a + b1 )x2 + (b2 − b1 − 2a)x + a.
Christian Kanzow, Universität Würzburg, WS 2010/11
54
KAPITEL 2. FUNKTIONEN
Wegen Satz 2.15 können wir jetzt einen Koeffizientenvergleich durchführen und erhalten
auf diese Weise das lineare Gleichungssystem
a + b1 = 0, b2 − b1 − 2a = 1, a = 1.
Dieses hat offenbar die eindeutig bestimmte Lösung a = 1, b1 = −1, b2 = 2, so dass wir für
R die Partialbruchzerlegung
R(x) =
1
2
1
+
−
2
x (x − 1)
x−1
erhalten.
2.5
3
Abzählbarkeit von Mengen
Wir untersuchen in diesem Abschnitt die so genannte Mächtigkeit von Mengen. Dazu ist
die nachstehende Definition von zentraler Bedeutung.
Definition 2.20 Eine nichtleere Menge A heißt (höchstens) abzählbar, wenn eine surjektive Abbildung f : N0 → A existiert. Eine nichtleere Menge heißt überabzählbar, wenn sie
nicht abzählbar ist.
Wir geben als Nächstes einige Beispiele von (höchstens) abzählbaren Mengen an.
Beispiel 2.21 (a) Jede endliche Menge A = {a0 , a1 , . . . , am } ist (höchstens) abzählbar.
Dazu definiere man beispielsweise f : N0 → A durch
an ,
falls 0 ≤ n ≤ m,
f (n) :=
am ,
falls n > m.
Offenbar ist f dann surjektiv (allerdings nicht bijektiv).
(b) Die Menge A := N0 der natürlichen Zahlen (mit Null) ist abzählbar, denn die identische Abbildung f : N0 → N0 , f (n) := n, ist natürlich surjektiv (und selbstverständlich auch injektiv).
(c) Die Menge A := Z der ganzen Zahlen ist ebenfalls abzählbar. Um dies einzusehen,
werde f : N0 → Z definiert durch
f (0) := 0, f (1) := +1, f (2) := −1, f (3) := +2, f (4) := −2, . . .
Allgemein gilt also f (0) := 0, f (2n − 1) := n und f (2n) = −n für alle n ∈ N. Die so
definierte Abbildung f ist offenbar surjektiv (sogar bijektiv).
3
Teilmengen von abzählbaren Mengen sind offenbar wieder (höchstens) abzählbar. Wegen
Beispiel 2.21 (b) ist damit die Menge N der natürlichen Zahlen (ohne Null) abzählbar.
Ein manchmal sehr nützliches Resultat über die Abzählbarkeit von Mengen ist in dem
nächsten Satz enthalten.
Christian Kanzow, Universität Würzburg, WS 2010/11
2.5. ABZÄHLBARKEIT VON MENGEN
55
Satz 2.22 Die Vereinigung (höchstens) abzählbar vieler abzählbarer Mengen ist wieder
abzählbar.
Beweis: Seien Mn (n ∈ N0 ) die abzählbaren Mengen. Wir bezeichnen die Elemente von
Mn mit xnm , m ∈ N0 , also
Mn = xnm m ∈ N0 } = {xn0 , xn1 , xn2 , . . .
(n ∈ N0 ).
Die Elemente der Vereinigungsmenge
M :=
[
Mn
n∈N0
schreiben wir in Form eines quadratisch unendlichen Schemas:
M0 : x00 −→
ւ
M1 : x10
↓
ր
M2 : x20
ւ
M3 : x30
↓
ր
..
.
x40
x01
x11
x21
x31
x02 −→ x03
ւ
x12
x13
ւ
ր
x22
x23
ր
x32
x33
ր
···
ր
···
···
···
···
Die durch die Pfeile angedeutete Abbildung
f (0) := x00 , f (1) := x01 , f (2) := x10 , f (3) := x20 , f (4) := x11 , . . .
liefert offenbar eine Bijektion von N0 in die Vereinigungsmenge M. Also ist M abzählbar. 2
Eine unmittelbare Folgerung des Satzes 2.22 ist die Abzählbarkeit der rationalen Zahlen.
Korollar 2.23 Die Menge Q aller rationalen Zahlen ist abzählbar.
Beweis: Für jedes n ∈ N sind die beiden Mengen
An :=
k k
k ∈ N0
und Bn := − k ∈ N0
n
n
offenbar abzählbar. Nach Satz 2.22 ist dann auch
k k ∈ Z = An ∪ Bn
Cn :=
n
abzählbar für jedes n ∈ N. Erneut wegen Satz 2.22 ist somit Q =
Menge.
S
n∈N
Cn eine abzählbare
2
Wir beweisen als Nächstes, dass die Menge der reellen Zahlen hingegen nicht abzählbar ist.
Christian Kanzow, Universität Würzburg, WS 2010/11
56
KAPITEL 2. FUNKTIONEN
Satz 2.24 Die Menge R aller reellen Zahlen ist überabzählbar.
Beweis: Zum Beweis verwenden wir das so genannte Cantorsche Diagonalverfahren. Dazu
beweisen wir, dass das offene Intervall (0, 1) überabzählbar ist, was die eigentliche Behauptung offenbar impliziert. Angenommen, (0, 1) ist abzählbar. Dann existieren reelle Zahlen
{xn }n∈N0 mit (0, 1) = {xn | n ∈ N0 } (hierbei ist xn = f (n) für eine geeignete surjektive
Abbildung f : N0 → (0, 1) gesetzt worden). Die Dezimalbruchentwicklungen der Zahlen xn
seien
x1 = 0.a11 a12 a13 . . .
x2 = 0.a21 a22 a23 . . .
x3 = 0.a31 a32 a33 . . .
..
..
.
.
Wir definieren nun eine Zahl c ∈ (0, 1) durch die Dezimalbruchentwicklung
c = 0.c1 c2 c3 . . . ,
wobei
ck :=
5,
4,
falls akk =
6 5,
falls akk = 5.
Insbesondere gilt ck 6= akk für alle k ∈ N. Nach Annahme existiert ein n ∈ N mit
c = xn . Daraus folgt aber cn = ann im Widerspruch zur Konstruktion von c. Also ist
(0, 1) überabzählbar.
2
Zwei Mengen M1 und M2 haben die gleiche Mächtigkeit, wenn es eine bijektive Abbildung
f : M1 → M2 gibt. Offenbar hat eine endliche Menge dann niemals die gleiche Mächtigkeit
wie die Menge N0 . Hingegen hat N0 wegen Beispiel 2.21 (c) die gleiche Mächtigkeit wie
die Menge der ganzen Zahlen Z, obwohl N0 eine echte Teilmenge von Z ist. Dagegen folgt
aus dem Satz 2.24, dass weder N noch Z die gleiche Mächtigkeit wie die reellen Zahlen R
haben können. Es seien noch einige weitere Beispiele erwähnt.
x
ist offenbar bijektiv.
Beispiel 2.25 (a) Die Abbildung f : (0, 1) → R, f (x) := 1−|x|
Also hat das Intervall (0, 1) die gleiche Mächtigkeit wie R und ist daher ebenfalls
überabzählbar.
(b) In Verallgemeinerung von Beispiel (a) hat auch jedes Intervall (a, b) die gleiche
Mächtigkeit wie R und ist daher überabzählbar, denn die Abbildung h(x) := g(f (x))
mit f wie in (a) und
t−a
g : (a, b) → (0, 1), g(t) :=
b−a
ist als Kompositum von bijektiven Abbildungen wieder bijektiv. Hieraus folgt beispielsweise die Aussage, dass zwischen zwei reellen Zahlen x, y ∈ R mit x < y stets
Christian Kanzow, Universität Würzburg, WS 2010/11
2.5. ABZÄHLBARKEIT VON MENGEN
57
eine irrationale Zahl liegt, denn sonst bestünde das gesamte Intervall (x, y) aus rationalen Zahlen, so dass Q insbesondere überabzählbar wäre im Widerspruch zum
Korollar 2.23.
(c) Die Menge R \ Q der irrationalen Zahlen ist überabzählbar. Denn anderenfalls wäre
R = Q ∪ (R \ Q) ebenfalls abzählbar wegen Satz 2.22, so dass wir einen Widerspruch
zum Satz 2.24 erhalten.
(d) Eine Zahl x ∈ R heißt algebraisch, wenn sie Nullstelle eines Polynoms
p(x) := an xn + . . . + a1 x + a0
mit Koeffizienten a0 , a1 , . . . , an ∈ Q (wir könnten sogar a0 , a1 , . . . , an ∈ Z fordern)
ist. Wegen Satz 2.14 hat jedes solche Polynom höchstens n Nullstellen. Sei
An := x x ist Nullstelle eines Polynoms p ∈ Q[x] vom Grad n .
Aufgrund des Satzes 2.22 ist jedes An und damit auch die Menge aller algebraischen
Zahlen A := A1 ∪ A2 ∪ A3 ∪ . . . abzählbar.
(e) Sei A wieder die Menge aller algebraischen Zahlen. Die Elemente von T := R \
A bezeichnet man dann als transzendente Zahlen. Wegen (d) und Satz 2.24 ist T
überabzählbar.
3
Christian Kanzow, Universität Würzburg, WS 2010/11
58
KAPITEL 2. FUNKTIONEN
Christian Kanzow, Universität Würzburg, WS 2010/11
Kapitel 3
Folgen und Reihen
3.1
3.2
3.3
3.4
3.5
3.6
3.1
Folgen
Cauchy–Folgen
Unendliche Reihen
Absolut konvergente Reihen
Multiplikation von Reihen
Potenzreihen
Folgen
In diesem gesamten Abschnitt bezeichnen wir mit K wieder die Menge der reellen oder der
komplexen Zahlen. Unter einer Folge in K versteht man eine Abbildung f : N → K. Zu
jedem n ∈ N existiert also ein an ∈ K mit f (n) = an . Für eine solche Folge benutzt man
deshalb meistens die Schreibweise
{an }n∈N
oder {a1 , a2 , a3 , . . .}.
Die an heißen dann die Folgenglieder der Folge {an }. Oft beginnt die Indizierung der
Folgenglieder nicht mit 1, sondern mit einer beliebigen Zahl n0 ∈ Z. Man schreibt dann
{an }n≥n0
oder {an0 , an0 +1 , an0 +2 , . . .}.
Für K = R spricht man von einer reellen Folge, für K = C von einer komplexen Folge.
Beispiel 3.1 (a) Sei an = a für alle n ∈ N mit einem a ∈ K. Man erhält die konstante
Folge {a, a, a, a, . . .}.
(b) Sei an =
1
n
für alle n ∈ N. Man erhält die so genannte harmonische Folge {1, 21 , 31 , 41 , . . .}.
(c) Sei an = (−1)n für alle n ∈ N. Damit ergibt sich die Folge {−1, 1, −1, 1, −1, . . .},
deren Folgenglieder ein alternierendes Vorzeichen besitzen.
(d) Für an =
n
n+1
(n ∈ N) erhalten wir die Folge { 21 , 32 , 43 , 54 , . . .}.
59
60
KAPITEL 3. FOLGEN UND REIHEN
(e) Für a1 := 1, a2 := 1 und an+1 := an + an−1 für alle n ≥ 2 erhalten wir rekursiv die
Folge {1, 1, 2, 3, 5, 8, 13, 21, . . .} der so genannten Fibonacci–Zahlen.
(f) Sei q ∈ K beliebig und an := q n (n ∈ N). Dies ergibt die Folge der Potenzen
{q, q 2, q 3 , q 4 , . . .}.
√ √
√
(g) Für an := n n erhalten wir die Folge {1, 2, 3 3, . . .}.
3
Wir definieren als Nächstes den Begriff der Konvergenz einer Folge.
Definition 3.2 Eine Folge {an } heißt konvergent gegen ein a ∈ K, wenn es zu jedem
ε > 0 eine (im Allgemeinen von ε abhängige) Zahl N ∈ N gibt mit
|an − a| < ε für alle n ≥ N.
(3.1)
Die Zahl a heißt dann Grenzwert oder Limes der Folge {an }, und man schreibt
lim an = a
n→∞
oder an → a für n → ∞.
Eine Folge {an } mit limn→∞ an = 0 heißt Nullfolge.
In (3.1) hätte man das <“–Zeichen auch durch das ≤“–Zeichen ersetzen können. Man
”
”
überlege sich in Ruhe, dass dies an der Definition letztlich nichts ändert.
An dieser Stelle ist es sehr sinnvoll, eine in der Mathematik übliche Schreibweise einzuführen. Wir benutzen insbesondere die Abkürzungen
∀
∃
für für alle“ (so genannter All–Quantor“),
”
”
für es gibt“ oder es existiert“ (so genannter Existenz–Quantor“).
”
”
”
Damit lässt sich die Konvergenz einer Folge {an } gegen ein a ∈ K kurz wie folgt formulieren:
∀ε > 0 ∃N ∈ N : |an − a| < ε ∀n ≥ N.
Der hierin vorkommende Doppelpunkt wird oft als so dass gilt“ gelesen. Alternativ könnte
”
man den letzten All–Quantor auch vor die Ungleichung stellen:
∀ε > 0 ∃N ∈ N ∀n ≥ N : |an − a| < ε.
(3.2)
Die Verwendung von Quantoren ist am Anfang sicherlich etwas gewöhnungsbedürftig und
wird in den meisten Büchern nicht im Übermaß benutzt. In Vorlesungen und persönlichen Gesprächen mit Kollegen sind sie jedoch absoluter Standard und erlauben eine im
Allgemeinen sehr viel kürzere Formulierung des jeweiligen Gegenstandes.
Die Verwendung von Quantoren bietet außerdem den Vorteil, dass man eine Aussage
sehr leicht negieren kann, indem man All–Quantoren durch Existenz–Quantoren und umgekehrt ersetzt. Dass eine Folge {an } nicht gegen ein a konvergiert, lässt sich also schreiben
als
∃ε > 0 ∀N ∈ N ∃n ≥ N : |an − a| ≥ ε,
Christian Kanzow, Universität Würzburg, WS 2010/11
3.1. FOLGEN
61
vergleiche (3.2). Will man diesen Sachverhalt in Worte fassen, so wird dies schon deutlich
länger: Die Folge {an } konvergiert nicht gegen a ∈ K, wenn ein ε > 0 existiert, so dass es
für alle N ∈ N ein n ≥ N gibt mit |an − a| ≥ ε.
Der Grenzwert einer konvergenten Folge ist, sofern er denn existiert, notwendig eindeutig bestimmt.
Satz 3.3 ( Eindeutigkeit des Grenzwertes )
Die Folge {an }n∈N konvergiere sowohl gegen a ∈ K als auch gegen a′ ∈ K. Dann gilt a = a′ .
Beweis: Angenommen, es ist a 6= a′ . Dann ist ε := 12 |a − a′ | eine positive Zahl. Wegen
limn→∞ an = a existiert ein N1 ∈ N mit |an − a| < ε für alle n ≥ N1 . Andererseits gibt
es wegen limn→∞ an = a′ auch ein N2 ∈ N mit |an − a′ | < ε für alle n ≥ N2 . Für alle
n ≥ N := max{N1 , N2 } gilt dann sowohl |an − a| < ε als auch |an − a′ | < ε. Hieraus folgt
|a − a′ | = (a − an ) + (an − a′ ) ≤ |an − a| + |an − a′ | < 2ε = |a − a′ |,
also |a − a′ | < |a − a′ |. Dieser Widerspruch zeigt, dass doch a = a′ sein muss.
2
Eine nicht konvergente Folge heißt divergent. Wir untersuchen als Nächstes die Konvergenz
bzw. Divergenz der Folgen aus dem Beispiel 3.1.
Beispiel 3.4 (a) Die durch an = a für alle n ∈ N definierte konstante Folge {a, a, a, . . .}
ist konvergent mit limn→∞ an = a. Um dies einzusehen, haben wir per Definition ein
N ∈ N zu finden mit |an − a| < ε für alle n ≥ N. In diesem Fall können wir hierzu
jedes N ∈ N wählen (insbesondere ist N hier von dem vorgegebenen ε unabhängig)
und erhalten |an − a| = |a − a| = 0 < ε für alle n ≥ N, was zu zeigen war.
(b) Die harmonische Folge { n1 }n∈N ist konvergent mit limn→∞ n1 = 0. Sei nämlich ε > 0
beliebig. Wähle dann ein (dieses Mal tatsächlich von ε abhängiges) N ∈ N mit N > 1ε
(ein solches N existiert, da R archimedisch geordnet ist). Dann folgt
also limn→∞
1
n
= 0.
1
− 0 = 1 ≤ 1 < ε für alle n ≥ N,
n
n
N
(c) Die Folge {a1 , a2 , a3 , . . .} mit an = (−1)n divergiert. Der Beweis erfolgt durch Widerspruch. Angenommen, die Folge {an } konvergiert gegen ein a. Per Definition gibt es
zu ε = 1 dann ein N ∈ N mit
|an − a| < ε = 1 für alle n ≥ N.
Für alle n ≥ N gilt dann nach der Dreiecksungleichung
2 = |an+1 − an |
= (an+1 − a) + (a − an )
Christian Kanzow, Universität Würzburg, WS 2010/11
62
KAPITEL 3. FOLGEN UND REIHEN
≤ |an+1 − a| + |a − an |
< 1+1
= 2.
Dieser Widerspruch zeigt, dass die Folge gegen kein a konvergieren kann und somit
divergiert.
n
(d) Die Folge {an } mit an = n+1
konvergiert gegen den Grenzwert a = 1. Sei dazu ε > 0
beliebig. Wähle ein N ∈ N mit N > 1ε . Dann folgt
n
1
1
1
− 1 =
≤ ≤
< ε für alle n ≥ N,
n+1
n+1
n
N
also an → 1 für n → ∞.
(e) Die Folge der Fibonacci–Zahlen {an } ist divergent, denn mittels vollständiger Induktion bestätigt man leicht, dass an ≥ n für alle n ∈ N mit n ≥ 5 gilt, so dass die Folge
{an } nicht beschränkt ist und somit nicht konvergent sein kann, wie wir im Anschluss
an dieses Beispiel noch sehen werden.
(f) Das Konvergenzverhalten der Folge {q n }n∈N hängt vom Wert von q ∈ K ab. Für
|q| < 1 konvergiert diese Folge mit limn→∞ q n = 0, für |q| > 1 hingegen divergiert die
Folge. Wir verifizieren hier nur die Aussage für |q| < 1. Da für q = 0 nichts zu zeigen
ist, können wir q 6= 0 voraussetzen. Dann ist
1
=1+x
|q|
für ein x > 0. Nun wenden wir die für alle x ≥ −1 und alle n ∈ N gültige Bernoullische
Ungleichung
(1 + x)n ≥ 1 + nx
an (Beweis durch vollständige Induktion nach n) und erhalten
0 ≤ |q|n =
Wegen
1
n
1
1
1 1
≤
≤
· .
(1 + x)n
1 + nx
n x
→ 0 nach (b) folgt hieraus unmittelbar q n → 0 für n → ∞.
√
√
(g) Wir behaupten, dass limn→∞ n n = 1 gilt. Setzen wir xn := n n − 1, so haben wir zu
zeigen, dass {xn } eine Nullfolge ist. Aus dem binomischen Lehrsatz 1.9 folgt wegen
xn ≥ 0 zunächst
n(n − 1) 2
n 2
n
xn ,
xn = 1 +
n = (1 + xn ) ≥ 1 +
2
2
Christian Kanzow, Universität Würzburg, WS 2010/11
3.1. FOLGEN
also n − 1
ein N ∈ N
x2n und damit
≥ n(n−1)
2
mit N > ε22 , so folgt
xn ≤
q
2
.
n
√
n n − 1 = |xn | ≤
für alle n ≥ N.
63
Wählen wir zu beliebigem ε > 0 daher
r
2
≤
n
r
2
<ε
N
3
Wir führen als Nächstes den Begriff einer beschränkten Folge ein.
Definition 3.5 Eine Folge {an }n∈N mit an ∈ K für alle n ∈ N heißt beschränkt, wenn
ein K ∈ R existiert mit |an | ≤ K für alle n ∈ N. Eine nicht beschränkte Folge heißt
unbeschränkt.
Als Beispiel einer unbeschränkten Folge haben wir bereits die Folge der Fibonacci–Zahlen
kennen gelernt. Wir zeigen jetzt, dass eine konvergente Folge stets beschränkt ist.
Satz 3.6 ( Beschränktheit konvergenter Folgen )
Jede konvergente Folge {an } ist beschränkt.
Beweis: Sei limn→∞ an = a für ein a ∈ K. Zu ε = 1 existiert dann ein N ∈ N mit
|an − a| < ε = 1 für alle n ≥ N.
Hieraus folgt mit der Dreiecksungleichung
|an | = |a + (an − a)| ≤ |a| + |an − a| ≤ |a| + 1
für alle n ≥ N. Damit folgt
|an | ≤ K
für alle n ∈ N
mit der Konstanten K := max{|a1 |, |a2 |, . . . , |aN −1 |, |a| + 1}.
2
Wegen Satz 3.6 kann eine unbeschränkte Folge nicht konvergent sein. Man sagt auch, dass
die Beschränktheit einer Folge ein notwendiges Kriterium für ihre Konvergenz darstellt. Es
handelt sich hierbei jedoch nicht um ein hinreichendes Kriterium, denn eine beschränkte
Folge muss nicht konvergent sein, wie das Beispiel 3.4 (c) zeigt. Wir werden in Kürze allerdings auf diese Problematik zurückkommen und zeigen, dass in gewissen Fällen beschränkte
Folgen tatsächlich konvergent sind.
Wir zeigen als Nächstes, dass auch die Summe, die Differenz, das Produkt und (sofern
wohldefiniert) der Quotient von konvergenten Folgen wieder konvergente Folgen bilden.
Satz 3.7 ( Rechenregeln für konvergente Folgen I )
Seien {an }n∈N , {bn }n∈N zwei konvergente Folgen in K mit an → a und bn → b für gewisse
Grenzwerte a, b ∈ K. Dann gelten:
Christian Kanzow, Universität Würzburg, WS 2010/11
64
KAPITEL 3. FOLGEN UND REIHEN
(a) an + bn → a + b für n → ∞.
(b) an − bn → a − b für n → ∞.
(c) an · bn → a · b für n → ∞.
(d) Ist b 6= 0, so sind fast alle bn 6= 0, und es gilt
an
bn
→
a
b
für n → ∞.
Beweis: (a) Sei ε > 0 beliebig gegeben. Wegen der Konvergenz der Folgen {an } und {bn }
existieren dann N1 , N2 ∈ N mit
|an − a| <
ε
für alle n ≥ N1
2
und |bn − b| <
ε
für alle n ≥ N2 .
2
Dann gilt für alle n ≥ N := max{N1 , N2 }
(an + bn ) − (a + b) ≤ |an − a| + |bn − b| < ε + ε = ε,
2 2
woraus per Definition limn→∞ (an + bn ) = a + b folgt.
(b) Die Folge {−bn } = {(−1) · bn } konvergiert wegen Beispiel 3.4 (a) und dem gleich noch
zu beweisenden Teil (c) gegen den Grenzwert −b. Daher folgt die Behauptung unmittelbar
aus der Aussage (a).
(c) Wegen Satz 3.6 ist die Folge {an } beschränkt. Also existiert ein K > 0 mit |an | ≤ K für
alle n ∈ N. Durch eventuelle Vergrößerung von K kann außerdem angenommen werden,
dass auch |b| ≤ K ist. Wegen an → a und bn → b existieren Zahlen N1 , N2 ∈ N mit
|an − a| <
ε
für alle n ≥ N1
2K
und |bn − b| <
ε
für alle n ≥ N2 ,
2K
wobei ε > 0 beliebig vorgegeben ist. Für alle n ≥ N := max{N1 , N2 } folgt daher
|an bn − ab| = an (bn − b) + (an − a)b
≤ |an | · |bn − b| + |an − a| · |b|
ε
ε
< K
+
K
2K 2K
= ε
und somit an bn → ab für n → ∞.
(d) Wegen bn → b für n → ∞ existiert zu η := 21 |b| > 0 eine Zahl N ′ ∈ N mit |bn − b| < η
für alle n ≥ N ′ . Mit |bn | ≥ |b| − |bn − b| folgt dann
1
|bn | > |b| > 0 für alle n ≥ N ′
2
Christian Kanzow, Universität Würzburg, WS 2010/11
3.1. FOLGEN
65
und somit insbesondere bn 6= 0 für alle n ≥ N ′ . Sei nun ε > 0 beliebig gegeben. Aus bn → b
folgt die Existenz eines N ∈ N mit
1
|b − bn | < ε|b|2
2
für alle n ≥ N,
wobei wir ohne Einschränkung n ≥ N ′ wählen können. Dann folgt
2
1
1
− = |bn − b| < ε|b| = 1 |b| ε < |bn | ε = ε für alle n ≥ N.
bn
b
|bn | |b|
2|bn | |b|
2 |bn |
|bn |
Also konvergiert die Folge { b1n } gegen den Grenzwert 1b . Die Aussage (d) ergibt sich somit
aus dem Teil (c).
2
Die Aussagen des Satzes 3.7 lassen sich recht einprägsam auch schreiben als
lim an ± lim bn =
n→∞
n→∞
lim an lim bn =
n→∞
n→∞
limn→∞ an
=
limn→∞ bn
lim (an ± bn ),
n→∞
lim (an bn ),
n→∞
an
.
n→∞ bn
lim
Wir formulieren noch ein weiteres einfaches Resultat über Folgen, aus dem sich insbesondere ergibt, dass der Grenzwert einer reellen Folge stets reell ist.
Satz 3.8 ( Rechenregeln für konvergente Folgen II )
Sei {an } eine beliebige Folge in K mit limn→∞ an = a. Dann gelten
|an | → |a|,
an → a,
Re(an ) → Re(a),
Im(an ) → Im(a).
Insbesondere folgt hieraus
lim an = lim Re(an ) + i lim Im(an ).
n→∞
n→∞
n→∞
Beweis: Wegen an → a für n → ∞ existiert zu jedem ε > 0 ein N ∈ N mit |an − a| < ε
für alle n ≥ N. Mit der inversen Dreiecksungleichung folgt daher
|an | − |a| ≤ |an − a| < ε für alle n ≥ N
Also gilt |an | → |a| für n → ∞. Die restlichen Aussagen können analog bewiesen werden. 2
In dem verbleibenden Teil dieses Abschnitts wollen wir Folgen und ihre Grenzwerte der
Größe nach vergleichen. Da es sich bei C um keinen geordneten Körper handelt, werden
wir deshalb nur reelle Folgen betrachten.
Christian Kanzow, Universität Würzburg, WS 2010/11
66
KAPITEL 3. FOLGEN UND REIHEN
Satz 3.9 Seien {an } und {bn } zwei reelle Folgen mit an → a, bn → b und an ≤ bn für fast
alle n ∈ N (d.h., für alle n ∈ N mit der Ausnahme von höchstens endlich vielen n ∈ N).
Dann ist auch a ≤ b.
Beweis: Nach Voraussetzung existieren zu jedem ε > 0 Zahlen N1 , N2 ∈ N mit
|an − a| < ε für alle n ≥ N1
und |bn − b| < ε für alle n ≥ N2 .
Hieraus ergibt sich
a − b = a − an + an − bn +bn − b ≤ |a − an | + |b − bn | < ε + ε = 2ε.
| {z }
≤0
Da ε > 0 beliebig gewählt werden konnte, ist dies nur für a ≤ b möglich (denn wäre a > b,
2
so erhielten wir für ε := 41 (a − b) > 0 den Widerspruch 0 < a − b < 2ε = 21 (a − b)).
Eine Variante des Satzes 3.9 ist in dem folgenden Resultat enthalten, das in den letzten
Jahren eine recht moderne Bezeichnung bekommen hat.
Satz 3.10 ( Sandwich–Theorem )
Seien {an }, {bn } und {cn } drei reelle Folgen mit an ≤ cn ≤ bn für fast alle n ∈ N derart,
dass {an } und {bn } konvergent sind mit limn→∞ an = limn→∞ bn . Dann ist die Folge {cn }
ebenfalls konvergent mit Grenzwert limn→∞ cn = limn→∞ an .
Beweis: Der Beweis folgt durch Anwendung des Satzes 3.9 und sei in seinen Einzelheiten
dem Leser überlassen.
2
Wir wissen bereits aus dem Satz 3.6, dass eine konvergente Folge stets beschränkt ist.
Die Umkehrung dieser Aussage gilt im Allgemeinen nicht, wie das Beispiel der Folge
{−1, +1, −1, +1, . . .} zeigt. In gewissen Fällen lässt sich jedoch auch die Umkehrung beweisen. Dazu benötigen wir den Begriff einer monotonen Folge.
Definition 3.11 Eine Folge {an } reeller Zahlen heißt
(a) monoton wachsend, wenn an ≤ an+1 für alle n ∈ N gilt.
(b) monoton fallend, wenn an ≥ an+1 für alle n ∈ N gilt.
(c) monoton, wenn sie monoton wachsend oder monoton fallend ist.
Für monotone Folgen gilt nun die schon angekündigte Umkehrung.
Satz 3.12 ( Hauptsatz über monotone Folgen )
(a) Jede monoton wachsende und (nach oben) beschränkte Folge {an } konvergiert, und
zwar gegen a := sup A, wobei A := {an | n ∈ N}.
Christian Kanzow, Universität Würzburg, WS 2010/11
3.2. CAUCHY–FOLGEN
67
(b) Jede monoton fallende und (nach unten) beschränkte Folge {an } konvergiert, und
zwar gegen a := inf A, wobei A := {an | n ∈ N}.
Beweis: Wir beweisen hier nur die Aussage (a). Teil (b) kann auf die Behauptung (a)
zurückgeführt werden, indem man auf die monoton wachsende Folge {−an } übergeht.
Da a := sup A die kleinste obere Schranke für A ist, existiert zu jedem ε > 0 ein aN
mit a − ε < aN . Die Monotonie von {an } impliziert daher
a − ε < aN ≤ an ≤ a für alle n ≥ N.
Insbesondere haben wir |an − a| < ε für alle n ≥ N und somit an → a für n → ∞.
2
Wir wollen zum Abschluss den Begriff einer divergenten Folge in R noch etwas präzisieren.
Definition 3.13 Eine Folge {an } in R heißt
(a) bestimmt divergent (oder uneigentlich konvergent) gegen +∞, wenn es zu jedem
K ∈ R ein N ∈ N gibt mit an > K für alle n ∈ N mit n ≥ N.
(b) bestimmt divergent (oder uneigentlich konvergent) gegen −∞, wenn es zu jedem
K ∈ R ein N ∈ N gibt mit an < K für alle n ∈ N mit n ≥ N.
Im Falle einer uneigentlich konvergenten Folge schreiben wir auch limn→∞ an = +∞ bzw.
limn→∞ an = −∞ und nennen +∞ bzw. −∞ den uneigentlichen Grenzwert der Folge {an }.
Beispielsweise ist die Folge {an } mit an := n für alle n ∈ N bestimmt divergent gegen den
uneigentlichen Grenzwert +∞. Hingegen ist die Folge {an } mit an := (−1)n für alle n ∈ N
zwar divergent, aber nicht uneigentlich konvergent gegen +∞ oder −∞.
3.2
Cauchy–Folgen
Wir beginnen mit der Definition einer Cauchy–Folge, die in der Analysis von zentraler
Bedeutung ist.
Definition 3.14 Eine Folge {an } in K heißt Cauchy–Folge, wenn es zu jedem ε > 0 ein
N ∈ N gibt mit
|an − am | < ε für alle n, m ∈ N mit n, m ≥ N.
Mit Hilfe des All– und Existenzquantors lässt sich die Definition 3.14 auch wie folgt schreiben:
{an } ist eine Cauchy–Folge :⇐⇒ ∀ε > 0 ∃N ∈ N ∀n, m ≥ N : |an − am | < ε.
Dabei bedeutet der Doppelpunkt vor dem Äquivalenzzeichen, dass der auf dieser Seite
stehende Begriff durch den auf der anderen Seite stehenden Ausdruck definiert wird.
Wir zeigen zunächst, dass jede konvergente Folge stets eine Cauchy–Folge ist.
Christian Kanzow, Universität Würzburg, WS 2010/11
68
KAPITEL 3. FOLGEN UND REIHEN
Satz 3.15 ( Konvergente Folgen sind Cauchy–Folgen )
Sei {an } eine konvergente Folge in K. Dann ist {an } auch eine Cauchy–Folge.
Beweis: Nach Voraussetzung existiert der Grenzwert a = limn→∞ an . Also existiert zu
jedem ε > 0 ein N ∈ N mit |an − a| < 2ε für alle n ≥ N. Dies impliziert
|an − am | ≤ |an − a| + |a − am | <
ε ε
+ = ε für alle n, m ≥ N.
2 2
Also ist {an } eine Cauchy–Folge.
2
Das Ziel dieses Abschnitts besteht letztlich darin zu zeigen, dass in K ∈ {R, C} umgekehrt
jede Cauchy–Folge auch konvergiert. Dies ist allerdings keineswegs selbstverständlich und
hängt schließlich eng zusammen mit der Vollständigkeit von R (bzw. C). Um die Problematik zu verdeutlichen, betrachten wir das folgende Resultat.
Satz 3.16 Sei a > 0 eine beliebige reelle Zahl. Mit einem Startwert x0 > 0 definieren wir
eine Folge {xn } rekursiv durch die Vorschrift
a
1
xn +
für alle n = 0, 1, 2, . . . .
(3.3)
xn+1 :=
2
xn
Dann konvergiert die Folge {xn } gegen die Quadratwurzel von a.
Beweis: Durch Induktion zeigt man sehr leicht, dass xn > 0 gilt für alle n ∈ N0 . Insbesondere ist die Folge {xn } durch (3.3) somit wohldefiniert. Wegen
x2n
1
−a=
4
xn−1 +
ist außerdem
xn ≥
√
a
xn−1
2
1
−a=
4
xn−1 −
a
xn−1
2
≥0
a für alle n = 1, 2, 3 . . . .
Hieraus folgt außerdem
xn − xn+1 =
1
(x2 − a) ≥ 0,
2xn n
so dass die Folge {xn } ab n = 1 monoton fällt. Wegen Satz 3.12 besitzt sie deshalb einen
Grenzwert x. Diesen erhalten wir, wenn wir in der Vorschrift (3.3) den Grenzübergang
n → ∞ durchführen:
a
1
x= x+ .
2
x
2
Auflösen dieser Gleichung nach x liefert x = a und somit die Behauptung.
2
Die im Satz 3.16 angegebene Rekursion (3.3) zur Berechnung der Quadratwurzel von a > 0
hat übrigens einen erheblichen praktischen Nutzen. Tippt man auf einem Taschenrechner
Christian Kanzow, Universität Würzburg, WS 2010/11
3.2. CAUCHY–FOLGEN
69
auf die Wurzeltaste, so liefert dieser (fast) sofort eine Näherung für die gesuchte Quadratwurzel. Aber der Taschenrechner (oder auch Computer) ist beliebig blöd und muss
diese Quadratwurzel erst berechnen. Eine Möglichkeit hierzu besteht in der Ausführung
der Vorschrift (3.3) mit zum Beispiel dem Startwert x0 := a. Das Verfahren konvergiert
dann außerordentlich schnell und benötigt nur sehr wenige Iterationen, um eine hervorragende Approximation der gesuchten Quadratwurzel zu berechnen. Später (in Analysis II)
werden wir sehen, dass die Vorschrift (3.3) gerade das Newton–Verfahren zur Lösung der
quadratischen Gleichung x2 − a = 0 darstellt. Dort werden wir auch begründen, warum
das Verfahren (3.3) so schnell konvergiert.
Der Satz 3.16 erlaubt ferner eine interessante theoretische Interpretation: Wählen wir
den Startwert x0 aus der Menge der rationalen Zahlen Q, so folgt aus der Rekursionsvorschrift (3.3) unmittelbar, dass die gesamte Folge {xn } in Q liegt. Hingegen gilt dies nicht
notwendig
für den Grenzwert. Für a = 2 beispielsweise konvergiert die Folge {xn } gegen
√
2, und dabei handelt es sich wegen Lemma 1.28 um keine rationale Zahl. Zusammenfassend haben wir also eine Folge {xn } in Q, bei der es sich um eine Cauchy–Folge handelt
(denn sie konvergiert in R und ist somit insbesondere eine Cauchy–Folge), die aber keinen
Grenzwert in Q besitzt! In der Menge der rationalen Zahlen Q gilt die Umkehrung des
Satzes 3.15 somit nicht: Eine Cauchy–Folge in Q ist im Allgemeinen nicht konvergent.
Dieser unerwünschte Effekt kann in K = R und K = C nicht auftreten. Dazu betrachten
wir zunächst den Fall K = R. Unter einem abgeschlossenen Intervall verstehen wir im
Folgenden eine Menge der Gestalt
I := [a, b] := x ∈ R a ≤ x ≤ b .
Eine Intervallschachtelung ist eine Folge von abgeschlossenen Intervallen I1 , I2 , I3 , . . . mit
den beiden folgenden Eigenschaften:
• In+1 ⊆ In für alle n = 1, 2, 3, . . ..
• Es gilt |In | → 0 für n → ∞.
Dabei bezeichnet |I| die durch |I| := b − a definierte Länge eines Intervalls I = [a, b].
Für eine Intervallschachtelung lässt sich nun das folgende Resultat als Konsequenz des
Vollständigkeitsaxioms von R herleiten.
Satz 3.17 ( Prinzip der Intervallschachtelung )
Zu jeder Intervallschachtelung in R gibt es genau eine reelle Zahl, die all ihren Intervallen
angehört (also im Durchschnitt aller dieser Intervalle liegt).
Beweis: Wir müssen in diesem Beweis zwei Dinge zeigen: Zum einen die Existenz eines
Elementes, das im Durchschnitt aller Intervalle liegt, und zum anderen die Eindeutigkeit
dieses Elementes.
Wir beginnen mit dem Nachweis der Existenz. Sei In = [an , bn ] dazu eine beliebige
Intervallschachtelung. Dann ist die Menge A := {a1 , a2 , . . .} nach oben beschränkt. Obere
Schranken sind beispielsweise alle bn . Nach Definition 1.31 und Satz 1.32 (R ist vollständig)
Christian Kanzow, Universität Würzburg, WS 2010/11
70
KAPITEL 3. FOLGEN UND REIHEN
existiert die kleinste obere Schranke s := sup A, für die dann notwendig an ≤ s ≤ bn für
alle n ∈ N gilt. Also ist s ∈ In für alle n ∈ N.
Wir beweisen als Nächstes die Eindeutigkeit des Elementes s. Sei dazu s̄ ein zweites Element mit s̄ ∈ In für alle n ∈ N. Dann sind s, s̄ ∈ In für alle n ∈ N und daher
|s − s̄| ≤ |In | → 0 für n → ∞. Somit gilt zwangsläufig s = s̄.
2
Sei nun {an } eine Folge in K und {nk } eine streng monoton steigende Folge natürlicher
Zahlen. Dann heißt die durch
k 7→ ank , k ∈ N,
definierte Folge {ank }k∈N eine Teilfolge von {an }. Ferner bezeichnen wir einen Punkt a∗ ∈ K
als einen Häufungspunkt der Folge {an }, wenn zu jedem ε > 0 unendlich viele Folgenglieder an mit |an − a∗ | < ε existieren. Eine konvergente Folge hat beispielsweise genau einen Häufungspunkt, nämlich ihren Grenzwert. Hingegen hat die beschränkte Folge
{−1, +1, −1, +1, . . .} genau die beiden Häufungspunkte +1 und −1.
Das folgende Resultat klärt den Zusammenhang zwischen Teilfolgen und Häufungspunkten.
Lemma 3.18 ( Charakterisierung von Häufungspunkten )
Genau dann ist a∗ ein Häufungspunkt einer Folge {an } in K, wenn a∗ Grenzwert einer
konvergenten Teilfolge {ank } von {an } ist.
Beweis: Sei a∗ zunächst Grenzwert einer konvergenten Teilfolge {ank } von {an }. Zu
jedem ε > 0 existiert dann ein k0 ∈ N mit |ank − a∗ | < ε für alle k ≥ k0 , so dass a∗ ein
Häufungspunkt von {an } ist.
Sei umgekehrt a∗ Häufungspunkt der Folge {an }. Dann existiert zu ε = 1 ein n1 ∈ N
mit |an1 − a∗ | < 1. Anschließend gibt es zu ε = 21 ein n2 > n1 mit |an2 − a∗ | < 21 . So
fortfahrend erhalten wir zu jedem ε = k1 ein nk ∈ N mit nk > nk−1 und |ank − a∗ | < k1 .
Damit konvergiert die so konstruierte Teilfolge {ank } gegen a∗ .
2
Wir zeigen jetzt, dass jede beschränkte Folge in K mindestens einen Häufungspunkt in K
besitzt.
Satz 3.19 ( Satz von Bolzano–Weierstraß — Version 1 )
Jede beschränkte Folge {an } in K besitzt mindestens einen Häufungspunkt.
Beweis: Wir betrachten zunächst den Fall K = R. Zu der dann reellen Folge {an } definieren wir rekursiv eine Intervallschachtelung {[Ak , Bk ]} derart, dass für jedes k ∈ N
gilt:
• an ∈ [Ak , Bk ] für unendlich viele n ∈ N.
Wir beginnen mit einem Intervall [A1 , B1 ], welches alle an enthält. Ein solches Intervall
existiert aufgrund der vorausgesetzten Beschränktheit von {an }. Nehmen wir an, dass wir
bereits ein Intervall [Ak , Bk ] mit der gewünschten Eigenschaft haben. Sei dann Mk :=
Christian Kanzow, Universität Würzburg, WS 2010/11
3.2. CAUCHY–FOLGEN
71
1
(Ak
2
+ Bk ) der Mittelpunkt des Intervalls [Ak , Bk ]. Dann enthält mindestens eines der
beiden Teilintervalle [Ak , Mk ] und [Mk , Bk ] unendlich viele Folgenglieder von {an }. Wir
setzen daher
[Ak , Mk ], falls an ∈ [Ak , Mk ] für unendlich viele n ∈ N,
[Ak+1 , Bk+1] :=
[Mk , Bk ], anderenfalls.
Dadurch ist offenbar eine Intervallschachtelung definiert. Der Satz 3.17 garantiert jetzt,
dass es genau ein a∗ ∈ R gibt, das in allen Intervallen [Ak , Bk ] liegt.
Sei nun ε > 0 beliebig gegeben. Wegen |[Ak , Bk ]| = Bk − Ak → 0 existiert dann ein
k ∈ N mit |[Ak , Bk ]| < ε. Per Konstruktion liegen unendlich viele Folgenglieder an in dem
Intervall [Ak , Bk ]. Für alle diese Folgenglieder gilt offenbar
|an − a∗ | ≤ Bk − Ak < ε,
so dass a∗ in der Tat ein Häufungspunkt von {an } ist.
Sei nun K = C die Menge der komplexen Zahlen und {an } somit eine Folge komplexer
Zahlen. Wir schreiben dann an = bn + icn mit bn , cn ∈ R. Mit {an } sind dann auch die beiden reellen Folgen {bn } und {cn } beschränkt, vergleiche Satz 1.41 (e). Durch Anwendung
des ersten Beweisteils auf die Folge {bn } erhalten wir wegen Lemma 3.18 die Existenz einer
konvergenten Teilfolge {bnk } von {bn }. Mit {cn } ist natürlich auch die zugehörige Teilfolge
{cnk } beschränkt und besitzt ebenfalls aufgrund des ersten Beweisteils und dem Lemma
3.18 eine weitere konvergente Teilfolge, etwa {cnkl }. Die Teilfolge {ankl } von {an } ist daher
konvergent in C, so dass die Behauptung aus dem Lemma 3.18 folgt.
2
Im Hinblick auf das Lemma 3.18 lässt sich der Satz von Bolzano–Weierstraß auch wie folgt
formulieren.
Satz 3.20 ( Satz von Bolzano–Weierstraß — Version 2 )
Jede beschränkte Folge {an } in K besitzt eine konvergente Teilfolge {ank }.
Nach dem Satz 3.19 von Bolzano–Weierstraß besitzt jede beschränkte Folge {xn } in K
mindestens einen Häufungspunkt. Sei H die Menge aller Häufungspunkte von {xn }. Speziell
für K = R existieren wegen der Vollständigkeit der reellen Zahlen die beiden Werte
ξ := inf H
und η := sup H.
Wir nennen ξ den Limes inferior und η den Limes superior von {xn }. Hierbei werden die
Schreibweisen
ξ = lim inf xn oder ξ = limn→∞ xn
n→∞
und
η = lim sup xn
n→∞
oder η = limn→∞ xn
verwendet. Man verifiziert relativ leicht die folgenden Aussagen über den Limes inferior
und den Limes superior:
Christian Kanzow, Universität Würzburg, WS 2010/11
72
KAPITEL 3. FOLGEN UND REIHEN
• Es ist stets lim inf n→∞ xn ≤ lim supn→∞ xn .
• Die beschränkte Folge {xn } konvergiert genau dann, wenn lim inf n→∞ xn = lim supn→∞ xn
gilt.
• Ist {xn } konvergent, so gilt limn→∞ xn = lim inf n→∞ xn = lim supn→∞ xn .
• Es ist lim inf n→∞ xn der kleinste und lim supn→∞ xn der größte Häufungspunkt von
H (d.h., ξ und η liegen in H).
• Äquivalente Definitionen des Limes inferior und Limes superior sind
lim inf xn := lim inf{xk | k ≥ n} und
n→∞
n→∞
lim sup xn := lim sup{xk | k ≥ n} .
n→∞
n→∞
Diese Definitionen haben den Vorteil, dass sie auch für unbeschränkte Folgen sinnvoll
sind, da jetzt auch die uneigentlichen Limites +∞ und −∞ vorkommen können.
Auf den letzten der obigen Punkte soll hier noch formal eingegangen werden.
Lemma 3.21 Seien {xn } ⊆ R eine gegebene Folge und der Limes inferior bzw. der Limes
superior definiert durch
lim inf xn := lim inf{xk | k ≥ n} und
n→∞
n→∞
lim sup xn := lim sup{xk | k ≥ n} .
n→∞
n→∞
Dann gelten die folgenden Aussagen:
(a) lim inf n→∞ xn und lim supn→∞ xn existieren stets in R ∪ {±∞}.
(b) Ist die Folge {xn } beschränkt, so ist der Limes inferior (superior) der kleinste (größte)
Häufungspunkt von {xn }.
Beweis: (a) Wir beweisen die Aussage nur für den Limes superior. Setze dazu yn :=
sup{xk | k ≥ n} für n ∈ N. Dann ist die Folge {yn } monoton fallend (und z.B. durch x1 nach
unten beschränkt) oder + ∞. Daher existiert der Grenzwert limn→∞ yn stets im eigentlichen
oder uneigentlichen Sinn. Gemäß Definition ist limn→∞ yn = limn→∞ sup{xk | k ≥ n}
aber gerade der Limes superior von {xn }.
(b) Wir verifizieren auch hier nur die Aussage für den Limes superior. Sei also {xn } eine
beschränkte Folge, so dass aufgrund des Satzes 3.19 von Bolzano–Weierstraß die Menge der
Häufungspunkte nichtleer ist. Nach Teil (a) existiert x̄ := lim supn→∞ xn . Im Beweis von
Teil (a) wurde außerdem gezeigt, dass die dort definierte Folge {yn } gegen x̄ konvergiert
(und zwar im eigentlichen Sinn, da {xn } hier als beschränkt vorausgesetzt wurde). Gemäß
Definition von yn existiert stets ein zugehöriges nk ∈ N mit yn − xnk < n1 , so dass die
Christian Kanzow, Universität Würzburg, WS 2010/11
3.2. CAUCHY–FOLGEN
73
Teilfolge {xnk } ebenfalls gegen x̄ konvergiert. Aufgrund des Lemmas 3.18 ist x̄ somit ein
Häufungspunkt von {xn }. Wir haben daher nur noch zu zeigen, dass x̄ auch der größte
Häufungspunkt von {xn } ist. Sei dazu x̃ ein weiterer Häufungspunkt. Erneut wegen Lemma
3.18 gibt es dann eine Teilfolge {xnk } von {xn } mit limk→∞ xnk = x̃. Dann ist
ynk = sup{xl | l ≥ nk } ≥ xnk .
Da die Teilfolge {ynk } ebenfalls gegen den Grenzwert x̄ der Gesamtfolge {yn } konvergiert,
erhalten wir hieraus unter Verwendung von Satz 3.9 sofort
x̄ = lim ynk ≥ lim xnk = x̃.
k→∞
k→∞
Folglich ist x̄ in der Tat der größte Häufungspunkt der Folge {xn }.
2
Wir kommen nun zu der angekündigten Umkehrung des Satzes 3.15.
Satz 3.22 ( Konvergenzkriterium von Cauchy )
Jede Cauchy–Folge {an } in K ist konvergent.
Beweis: Wir zeigen zuerst, dass die Cauchy–Folge {an } beschränkt ist. Zunächst gibt es
zu ε = 1 ein N ∈ N mit |an − am | < 1 für alle n, m ≥ N. Speziell für m = N folgt hieraus
unter Verwendung der inversen Dreiecksungleichung |an | ≤ |aN | + 1 für alle n ≥ N. Also
ist
|an | ≤ K := max |a1 |, |a2 |, . . . , |aN −1 |, |aN | + 1
für alle n ∈ N, und die Folge {an } somit beschränkt.
Nach dem Satz 3.19 von Bolzano–Weierstraß besitzt {an } daher eine konvergente Teilfolge {ank }. Sei a der Grenzwert dieser Teilfolge. Wir zeigen jetzt, dass bereits die gesamte
Folge {an } gegen a konvergiert. Sei dazu ε > 0 beliebig gegeben. Da {an } eine Cauchy–
Folge ist, existiert ein N ′ ∈ N mit |an − am | < 2ε für alle n, m ≥ N ′ . Ferner gibt es ein
nk ≥ N ′ mit |ank − a| < 2ε . Für n ≥ N ′ folgt daher
|an − a| ≤ |an − ank | + |ank − a| < ε.
Dies beweist die Konvergenz der gesamten Folge {an } gegen a.
2
Wir beschließen diesen Abschnitt mit einigen Bemerkungen zum beweistechnischen Vorgehen. Die Idee dieses Abschnitts bestand im Prinzip in der Verifikation der folgenden
Implikationen in dem archimedisch geordneten Körper R:
Supremumseigenschaft (Vollständigkeit von R)
⇓
Prinzip der Intervallschachtelung
⇓
Satz von Bolzano–Weierstraß
⇓
Konvergenzkriterium von Cauchy.
Christian Kanzow, Universität Würzburg, WS 2010/11
74
KAPITEL 3. FOLGEN UND REIHEN
Nun kann man aus dem Konvergenzkriterium von Cauchy und dem Prinzip von Archimedes
(siehe Definition 1.25) wiederum die Supremumseigenschaft von R herleiten, vergleiche
[3]. Damit sind alle diese Prinzipien in einem (archimedisch) geordneten Körper letztlich
äquivalent zu der Vollständigkeit von R. Alternativ lassen sich die reellen Zahlen auch
durch Folgen rationaler Zahlen herleiten, siehe [4] für die Einzelheiten.
Der Satz von Bolzano–Weierstraß und das Konvergenzkriterium von Cauchy gelten sogar in C, während sich die Supremumseigenschaft und das Prinzip der Intervallschachtelung
in C gar nicht formulieren lassen, da C kein geordneter Körper ist.
3.3
Unendliche Reihen
Sei {an }n∈N eine Folge von Zahlen aus K. Dann heißt
sn :=
n
X
ak ,
k=0
n ∈ N0
die n-te Partialsumme und die Folge {sn } wird als (unendliche) Reihe bezeichnet. Hierfür
schreiben wir auch
∞
X
ak .
(3.4)
k=0
Die Reihe (3.4) heißt konvergent, wenn die zugehörige Folge {sn } der Partialsummen konvergiert. In diesem Fall bezeichnet man den Grenzwert der Reihe ebenfalls mit dem Symbol
(3.4). Dieses hat somit zwei Bedeutungen:
P
• die Folge { nk=0 ak }n∈N der Partialsummen
P
• im Fall der Konvergenz den Grenzwert limn→∞ nk=0 ak .
Statt (3.4) benutzt man auch die Schreibweise
a0 + a1 + a2 + a3 + . . .
für die unendliche Reihe (3.4). Etwas allgemeiner wird auch jeder Ausdruck der Gestalt
∞
X
ak
k=k0
mit einem beliebigen k0 ∈ N oder sogar k0 ∈ Z als eine (unendliche) Reihe bezeichnet. Die
Summation muss also nicht bei k = 0 beginnen. Man beachte in diesem Zusammenhang
allerdings, dass die Hinzunahme oder Wegnahme von endlich vielen Summanden nichts an
der Konvergenz der Reihe (also der Folge ihrer Partialsummen) ändert, sehr wohl jedoch
den Grenzwert. Konvergiert die Reihe
∞
X
ak
k=1
Christian Kanzow, Universität Würzburg, WS 2010/11
3.3. UNENDLICHE REIHEN
75
beispielsweise gegen einen Grenzwert a und ist a0 = 1, so konvergiert die Reihe
∞
X
ak
k=0
offenbar gegen den Grenzwert a + 1.
Wir betrachten zunächst einige Beispiele.
P
1
Beispiel 3.23 (a) Wir untersuchen die Reihe ∞
k=1 k(k+1) . Hier ist die n-te Partialsumme gegeben durch
n
X
1
n
sn =
=
,
k(k
+
1)
n
+
1
k=1
wie man leicht durch vollständige Induktion nach n beweist. Wegen limn→∞ sn = 1
(vergleiche Beispiel 3.4 (d)) konvergiert diese Reihe, und es gilt
∞
X
k=1
1
= 1.
k(k + 1)
Man beachte übrigens, dass die Summation in dieser Reihe bei k = 1 beginnt. Für
1
auch gar nicht definiert.
k = 0 wäre der Ausdruck k(k+1)
(b) Die harmonische Reihe
P∞
1
k=1 k
divergiert, denn für beliebiges k ∈ N und n ≥ 2k gilt
1 1
1
+ + ...+
2 3
n
1
1
1
1
1 1
1
+
+ ...+
+
+ ...+
+ ...+ k
≥ 1+ +
2
3 4
5
8
2k−1 + 1
2
1
1
1
1
≥ 1 + + 2 · + 4 · + . . . + 2k−1 · k
2
4
8
2
k
= 1+ .
2
sn = 1 +
Also gilt sn → ∞ für n → ∞.
3
Eine besonders wichtige Reihe wird in dem folgenden Resultat besprochen.
Satz 3.24 ( Geometrische Reihe )
P
k
Sei x ∈ K mit |x| < 1 beliebig gegeben. Dann konvergiert die geometrische Reihe ∞
k=0 x
und besitzt den Grenzwert
∞
X
1
.
xk =
1
−
x
k=0
Christian Kanzow, Universität Würzburg, WS 2010/11
76
KAPITEL 3. FOLGEN UND REIHEN
Beweis: Für die zugehörigen Partialsummen gilt wegen Satz 1.11 (der offenbar auch für
komplexe Zahlen gilt und deshalb hier benutzt werden darf)
sn =
n
X
k=0
xk =
1 − xn+1
.
1−x
Nach Beispiel 3.4 (f) ist aber xn+1 → 0 für n → ∞ wegen |x| < 1. Also folgt limn→∞ sn =
1
.
2
1−x
Man beachte, dass der Satz 3.24 nicht nur die Konvergenz der geometrischen Reihe garantiert, sondern gleichzeitig auch eine einfache Formel für den Grenzwert liefert. Dies wird
sich häufig noch als sehr nützlich erweisen. So folgt für x = 12 zum Beispiel
∞ k
X
1
1 1 1
1
= 1 + + + + ... =
= 2,
(3.5)
2
2 4 8
1 − 12
k=0
während man für x = − 21 den Wert
k
∞ X
2
1
1 1 1
1
= 1 − + − ± ... =
−
1 =
2
2 4 8
3
1 − (− 2 )
k=0
erhält. Hätten Sie das vorher gewusst? Philosophen bringen gerne die Geschichte vom Wettrennen zwischen Hase und Igel. Der Igel bekommt einen gewissen Vorsprung, beispielsweise
von einem Meter. Sobald der schneller laufende Hase diesen ersten Meter zurückgelegt hat,
ist der Igel bereits etwas weiter. Hat der Hase auch diese Stelle erreicht, ist der Igel erneut
ein Stück weiter usw. Es scheint also so zu sein, dass der Igel immer vor dem Hasen ist
und somit das Wettrennen gewinnt.
Dies widerspricht natürlich jeder Anschauung! Die Lösung liegt in der geometrischen
Reihe. Nehmen wir an, der Hase laufe doppelt so schnell wie der Igel. Sobald der Hase
den einen Meter Vorsprung aufgeholt hat, befindet sich der Igel noch 50 Zentimeter vor
ihm. Läuft der Hase diese 50 Zentimeter, beträgt der Vorsprung des Igels nur noch 25
Zentimeter usw. Wegen (3.5) wird der Hase den Igel bereits nach zwei Metern eingeholt
haben. Das entspricht genau unserer Vorstellung. Der Irrtum der Philosophen liegt letztlich
darin begründet, dass man durch Summation von unendlich vielen positiven Zahlen sehr
wohl einen endlichen Wert erhalten kann.
Wir zeigen als Nächstes, dass Summen und Vielfache von konvergenten Reihen ebenfalls
konvergieren.
Satz 3.25 ( Rechenregeln für konvergente Reihen )
P
P∞
Seien ∞
k=0 ak und
k=0 bk zwei konvergente Reihen in K und λ ∈ K beliebig gegeben.
Dann sind auch die Reihen
∞
X
k=0
(ak + bk ),
∞
X
k=0
(ak − bk )
und
∞
X
(λak )
k=0
Christian Kanzow, Universität Würzburg, WS 2010/11
3.3. UNENDLICHE REIHEN
77
konvergent, und für ihre Grenzwerte gelten
∞
X
k=0
(ak ± bk ) =
∞
X
k=0
ak ±
∞
X
bk
und
k=0
∞
X
(λak ) = λ
k=0
∞
X
ak .
k=0
P
P
Beweis: Seien cn := nk=0 ak und dn := nk=0 bk die n-ten Partialsummen der beiden
gegebenen Reihen. Dann ist
n
X
(ak + bk ) =
k=0
n
X
ak +
k=0
n
X
bk = cn + dn
k=0
für alle n ∈ N. Aus dem Satz 3.7 folgt daher
∞
X
(ak + bk ) = lim (cn + dn ) = lim cn + lim dn =
n→∞
k=0
n→∞
n→∞
∞
X
ak +
k=0
∞
X
bk ,
k=0
da es sich sowohl bei {cn } als auch bei {dn } um konvergente Folgen handelt. Die verbleibenden Aussagen können analog bewiesen werden.
2
Man beachte, dass sich für das Produkt zweier konvergenter Reihen kein so einfaches Resultat beweisen lässt. Wir kommen hierauf später im Abschnitt 3.5 zurück.
Anwendung
Satzes 3.25
wir die Konvergenz der Reihe
P∞Als2k kleine
P∞ des
P∞untersuchen
+3
1
1
.
Da
sowohl
als
auch
konvergente
geometrische Reihen sind,
k=0 4k
k=0 2k
k=0 4k
folgt dann
X
∞
∞ ∞
∞
X
X
1
1
2k + 3 X 1
3
1
1
=
=
+
+
3
=
+
3
1
1 = 6.
k
k
k
k
k
4
2
4
2
4
1
−
1
−
2
4
k=0
k=0
k=0
k=0
Wir übertragen jetzt das Cauchy–Kriterium auf die Konvergenz von Reihen.
Satz 3.26 ( Konvergenzkriterium von Cauchy )
P
Die Reihe ∞
k=0 ak mit ak ∈ K für alle k ∈ N0 ist genau dann konvergent, wenn es zu
jedem ε > 0 ein N ∈ N gibt, so dass für alle n > m ≥ N die Ungleichung
|am+1 + . . . + an | < ε
gilt.
P
Beweis: Sei sn := nk=0 ak die n-te Partialsumme der gegebenen Reihe. Wegen Satz 3.22,
wonach in K die konvergenten Folgen genau die Cauchy–Folgen sind, gilt dann:
Die Reihe
∞
X
ak konvergiert.
k=0
⇐⇒ Die Folge der Partialsummen {sn } konvergiert.
Christian Kanzow, Universität Würzburg, WS 2010/11
78
KAPITEL 3. FOLGEN UND REIHEN
⇐⇒ Die Folge der Partialsummen {sn } ist eine Cauchy–Folge.
⇐⇒ Für alle ε > 0 existiert ein N ∈ N mit
|sn − sm | < ε
für alle n, m ≥ N mit (ohne Einschränkung) n > m.
Wegen
sn − sm =
n
X
k=0
ak −
m
X
ak = am+1 + . . . + an
k=0
folgt aus den obigen Äquivalenzen gerade die Behauptung.
2
Aus dem Satz 3.26 ergibt sich beispielsweise sofort, dass die Änderung von endlich vielen Summanden einer Reihe nichts an der Konvergenz oder Divergenz der Reihe ändert
(wohl aber ihren Grenzwert, sofern die Reihe konvergiert). Als weitere Folgerung aus dem
Cauchy–Kriterium notieren wir das nachstehende Resultat, welches sich offenbar aus dem
Satz 3.26 ergibt, indem man dort speziell n = m + 1 wählt.
P
Korollar 3.27 Ist ∞
k=0 ak eine konvergente Reihe in K, so gilt limk→∞ ak = 0.
Man beachte, dass das notwendige Konvergenzkriterium
aus dem Korollar 3.27 nicht hinP
1
reichend ist, denn die harmonische Reihe ∞
genügt
zwar
der Bedingung limk→∞ ak =
k=1 k
1
limk→∞ k = 0, ist aber dennoch divergent. Letzteres wollen wir noch einmal als Anwendung
des Cauchy–Kriteriums verifizieren. Dazu wählen wir speziell die Indizes n und 2n. Dann
folgt
2n
X
1
1
1
1
1
=
+ ...+
≥n·
= ,
s2n − sn =
k
n+1
2n
2n
2
k=n+1
so dass die Folge der Partialsummen {sn } keine Cauchy–Folge sein kann und die harmonische Reihe somit divergiert.
Als eine weitere Konsequenz des Konvergenzkriteriums von Cauchy erhalten wir unser nächstes Korollar, wonach die Reihenreste“ von konvergenten Reihen beliebig klein
”
werden.
P
Korollar 3.28PIst ∞
k=0 ak eine konvergente Reihe in K, so gilt limn→∞ rn = 0 für die
Reste“ rn := ∞
k=n+1 ak .
”
Beweis: Wegen Satz 3.26 existiert ein N ∈ N mit
|am+1 + . . . + an | < ε
für alle n, m ≥ N mit n > m. Speziell für n → ∞ folgt hieraus
∞
X
ak ≤ ε
k=m+1
Christian Kanzow, Universität Würzburg, WS 2010/11
3.3. UNENDLICHE REIHEN
und daher limm→∞ rm = 0.
79
2
Für eine (reelle) Reihe mit nichtnegativen Gliedern gilt das nachstehende Konvergenzkriterium.
P
Satz 3.29 Eine Reihe ∞
k=0 ak mit ak ≥ 0 für alle k ∈ N0 konvergiert genau dann, wenn
die Reihe (also die Folge der Partialsummen) beschränkt ist.
Beweis: Wegen ak ≥ 0 für alle k ∈ N0 ist die Folge der Partialsummen {sn } mit
sn = a0 + a1 + . . . + an
monoton wachsend. Die Behauptung folgt daher sofort aus dem Hauptsatz 3.12 über monotone Folgen.
2
P
Da die Abänderung von endlich vielen Gliedern ak einer Reihe ∞
k=0 ak deren Konvergenz
nicht ändert, bleibt die Aussage des Satzes 3.29 erhalten, wenn nur ak ≥ 0 für alle k ≥ N
mit einem hinreichend großen N ∈ N gilt.
Für Reihen mit einem abwechselnden Vorzeichen der Reihenglieder ak gilt folgendes
Resultat.
Satz 3.30 ( Leibniz–Kriterium für alternierende Reihen )
Sei {ak } eine monoton fallende P
Nullfolge in R (insbesondere gelte also ak ≥ P
0 für alle k ∈
∞
k
k
N). Dann konvergiert die Reihe k=0(−1) ak , und für ihren Grenzwert s := ∞
k=0 (−1) ak
gilt die Abschätzung
n
X
(−1)k ak ≤ an+1
s −
k=0
für alle n ∈ N.
Beweis: Wir betrachten die beiden Partialsummen
s2k =
2k
X
(−1)n an
und s2k+1 =
2k+1
X
(−1)n an
n=0
n=0
und klammern diese in der Gestalt
s2k = a0 − (a1 − a2 ) − (a3 − a4 ) − . . . − (a2k−1 − a2k ),
s2k+1 = (a0 − a1 ) + (a2 − a3 ) + . . . + (a2k − a2k+1 ).
Aus an ≥ an+1 für alle n ∈ N folgt dann
s2k ≥ s2k+2 ,
s2k−1 ≤ s2k+1 ,
0 ≤ s2k+1 ≤ s2k ≤ a0 .
Christian Kanzow, Universität Würzburg, WS 2010/11
80
KAPITEL 3. FOLGEN UND REIHEN
Die Folge {s2k } ist somit monoton fallend und nach unten beschränkt, während die Folge
{s2k+1 } monoton steigt und nach oben beschränkt ist. Nach dem Hauptsatz 3.12 über
monotone Folgen konvergieren daher sowohl {s2k } als auch {s2k+1 }. Wegen
|s2k+1 − s2k | = a2k+1 → 0
besitzen sie außerdem denselben Grenzwert s. Hieraus folgert man sehr leicht, dass die
gesamte
Folge {sn } der Partialsummen (und per Definition daher die unendliche Reihe
P∞
k
k=0 (−1) ak ) gegen s konvergiert.
Zum Beweis der Abschätzung erinnern wir nochmals daran, dass {s2n } monoton fallend
und {s2n+1 } monoton wachsend gegen den gemeinsamen Grenzwert s konvergieren. Also
gilt s2n+1 ≤ s ≤ s2n für alle n ∈ N. Hieraus folgt einerseits
|s − s2n+1 | = s − s2n+1 ≤ s2n+2 − s2n+1 = a2n+2
und andererseits
|s − s2n | = s2n − s ≤ s2n − s2n+1 = a2n+1 ,
womit alles bewiesen ist.
2
Aus dem Satz 3.30 folgt beispielsweise sofort die Konvergenz der alternierenden harmonischen Reihe
∞
X
1 1 1 1
1
(−1)k+1 = 1 − + − + ∓ . . .
k
2 3 4 5
k=1
Ebenso erhält man die Konvergenz der Leibniz–Reihe
∞
X
(−1)k
k=0
1 1 1 1
1
= 1 − + − + ∓ ...
2k + 1
3 5 7 9
Hingegen lässt sich aus dem Leibniz–Kriterium nicht direkt der Grenzwert bestimmen.
Man erhält lediglich Abschätzungen für den Grenzwert s, indem man (evtl. mühsam) die
Partialsummen berechnet und dann mittels des nächsten Reihengliedes an+1 vergleichen
kann, wie dicht die Partialsummen bereits an s liegen.
3.4
Absolut konvergente Reihen
Wir definieren jetzt einen etwas stärkeren Konvergenzbegriff für unendliche Reihen.
Definition
3.31 Eine Reihe
P∞
k=0 |ak | konvergiert.
P∞
k=0
ak in K heißt absolut konvergent, wenn die Reihe
Jede absolut konvergente Reihe ist insbesondere konvergent, was wir in dem folgenden
Resultat notieren.
Christian Kanzow, Universität Würzburg, WS 2010/11
3.4. ABSOLUT KONVERGENTE REIHEN
81
Satz 3.32 ( Absolut konvergente Reihen sind konvergent )
P
Ist die Reihe ∞
k=0 ak in K absolut konvergent, so konvergiert sie auch, und es gilt
∞
∞
X
X
|ak |.
ak ≤
k=0
P∞
k=0
Beweis: Sei k=0 ak absolut konvergent. Wähle n > m. Aus der verallgemeinerten Dreiecksungleichung folgt dann
n
n
X
X
|ak |.
ak ≤
k=m+1
k=m+1
Daher ergibt sich die Behauptung aus dem Konvergenzkriterium 3.26 von Cauchy.
2
Die Umkehrung des Satzes 3.32 gilt im Allgemeinen
wir wissen bereits, dass
Pnicht, denn
k+1 1
(−1)
beispielsweise die alternierende harmonische Reihe ∞
konvergiert, dass diese
k=1
k
aber
absolut konvergieren kann, da wir sonst die Konvergenz der harmonischen Reihe
P∞ nicht
1
erhalten
würden.
k=1 k
Ein wichtiges Hilfsmittel für den Nachweis der absoluten Konvergenz einer Reihe ist
das nachstehende Majorantenkriterium.
Satz 3.33 ( Majorantenkriterium )
P
Seien ∞
k=0 ck eine konvergente Reihe mit lauter nichtnegativen Reihengliedern ck und
P {ak }
eine Folge in K mit |ak | ≤ ck für alle k ∈ N hinreichend groß. Dann ist die Reihe ∞
k=0 ak
absolut konvergent.
Beweis: Sei ε > 0 beliebig gegeben. Nach Voraussetzung und dem Konvergenzkriterium
3.26 von Cauchy existiert dann ein N ∈ N mit
n
X
ck < ε für alle n ≥ m ≥ N.
k=m
Daher ist
n
X
ck < ε für alle n ≥ m ≥ N.
ck = |ak | ≤
k=m
k=m
k=m
P∞
P
Also konvergiert die Reihe k=0 |ak | wegen Satz 3.26, d.h., die Reihe ∞
k=0 ak ist absolut
konvergent.
2
n
X
n
X
P
1
Als Anwendung des Satzes 3.33 beweisen wir die (absolute) Konvergenz der Reihe ∞
k=1 k n
für alle n ≥
verwenden wir die uns aus dem Beispiel 3.23 bekannte
Tatsache, dass
P2. Dazu
P∞
1
2
die Reihe ∞
konvergiert.
Wegen
Satz
3.25
ist
dann
auch
k=1 k(k+1)
k=1 k(k+1) konvergent.
Wegen
1
2
1
≤
≤
für alle n ≥ 2 und alle k ≥ 1
kn
k2
k(k + 1)
Christian Kanzow, Universität Würzburg, WS 2010/11
82
KAPITEL 3. FOLGEN UND REIHEN
ergibt
aus dem Majorantenkriterium unmittelbar die (absolute) Konvergenz der Reihe
P∞ sich
1
k=1 k n für jedes n ≥ 2.
Aus dem Majorantenkriterium ergibt sich sehr leicht ein hinreichendes Kriterium für
die Divergenz einer unendlichen Reihe.
Korollar
P∞3.34 ( Minorantenkriterium )
Seien k=0 dk eine divergente Reihe mit nichtnegativen Reihengliedern dk und {a
Pk∞} eine
Folge in K mit |ak | ≥ dk für alle k ∈ N hinreichend groß. Dann ist die Reihe k=0 |ak |
ebenfalls divergent.
P
Beweis: Angenommen,
die Reihe ∞
k=0 |ak | ist konvergent. Wegen Satz 3.33 ist dann auch
P∞
die Reihe k=0 dk (absolut) konvergent im Widerspruch zu unserer Voraussetzung.
2
Durch geschickte Anwendung des Majorantenkriteriums in Kombination mit einer geometrischen Reihe erhalten wir das folgende hinreichende Kriterium für die absolute Konvergenz einer Reihe.
Satz 3.35
p
P ( Wurzelkriterium )
k
Seien ∞
gegebene
Reihe
in
K
und
α
:=
lim
sup
|ak | der größte Häufungsk→∞
k=0 ak eine
p
k
punkt der Folge { |ak |}k∈N . Dann gelten:
P
(a) Ist α < 1, so konvergiert ∞
k=0 ak absolut.
P
(b) Ist α > 1, so divergiert die Reihe ∞
k=0 ak .
Beweis: (a) Wegen p
α < 1 existiert eine Zahl q ∈ R mit α < q < 1. Da α der größte
Häufungspunkt von { k |ak |}k∈N ist, sind fast alle Folgenglieder kleiner als q. Also existiert
ein N ∈ N mit
p
k
|ak | ≤ q für alle k ≥ N.
Dann ist
P∞
|ak | ≤ q k
für alle k ≥ N.
Die geometrische Reihe k=0 q k konvergiert aber nach Satz 3.24. Somit folgt die Behauptung aus dem Majorantenkriterium.
p
daher
(b) Wegen α > 1 gibt es unendlich viele k ∈ N mit k |ak | > 1. Für alle diese k ist
P∞
|ak | > 1. Also ist {|ak |}k∈N keine Nullfolge. Wegen Korollar 3.27 kann die Reihe k=0 ak
somit nicht konvergieren.
2
Der Limes superior α im Satz 3.35 magpin einigen Fällen schwer berechenbar sein. Oft
existiert aber sogar der Limes der Folge { k |ak |}, was das Leben manchmal sehr vereinfacht.
Häufig kann man
die Berechnung von α ganz vermeiden. Findet man nämlich eine Zahl
p
k
q ∈ (0, 1) mit |ak | ≤ q für fast alle k ∈ N, so liefert der Satz 3.35 sofort die p
absolute
P∞
Konvergenz der Reihe k=0 ak , denn in diesem Fall gilt natürlich α = lim supn→∞ k |ak | ≤
Christian Kanzow, Universität Würzburg, WS 2010/11
3.4. ABSOLUT KONVERGENTE REIHEN
83
p
q. Ist dagegen k |aP
k | ≥ 1 für unendlich viele k ∈ N, so kann {ak } keine Nullfolge sein,
weshalb die Reihe ∞
k=0 ak divergiert. Wir betrachten als Nächstes einige Beispiele.
Beispiel 3.36 (a) Im Fall α = 1 ist im Satz 3.35 keine Aussage möglich, da sowohl
Konvergenz als auch Divergenz vorliegen kann. Für die divergente harmonische Reihe
P
∞ 1
k=1 k gilt beispielsweise
α = lim sup
k→∞
r
k
1
1
=1
= lim √
k
k k→∞ k
P
k+1 1
nach Beispiel 3.4 (g). Für die alternierende harmonische Reihe ∞
erhalk=1 (−1)
k
ten wir ebenfalls α = 1, und in diesem Fall liegt Konvergenz vor.
(b) Die Reihe
P∞
k2
k=0 2k
ist (absolut) konvergent wegen Satz 3.35, denn es gilt
k→∞
k→∞
wobei wir den Grenzwert
3.4 (g) ergibt.
(c) Die Reihe
√
k
p
lim k |ak | = lim
P∞
1
k=0 k k
√
k
k2
1
= < 1,
2
2
k 2 → 1 benutzt haben, der sich sofort aus dem Beispiel
ist ebenfalls konvergent nach dem Wurzelkriterium, denn es gilt
lim
k→∞
p
k
1
= 0.
k→∞ k
|ak | = lim
(d) Die Reihe
∞
X
1 1
1
1
1
1
1
1
ak := 1 + 1 + + 2 + 2 + 3 + 3 + 4 + 4 + . . .
2 3 2
3
2
3
2
3
k=0
ist konvergent aufgrund des Wurzelkriteriums. Um dies zu verifizieren, müssen wir
im Satz 3.35 tatsächlich den Limes superior berechnen. Es gilt
α = lim sup
k→∞
p
k
|ak | = lim
k→∞
p
2k
|a2k | = lim
k→∞
r
2k
1
1
=√ ,
k
2
2
wovon man sich nach kurzer Überlegung leicht überzeugt.
3
Als weitere Folgerung aus dem Majorantenkriterium sowie der Konvergenz einer gewissen
geometrischen Reihe erhalten wir unser nächstes Kriterium für die absolute Konvergenz
einer Reihe.
Christian Kanzow, Universität Würzburg, WS 2010/11
84
KAPITEL 3. FOLGEN UND REIHEN
Satz 3.37 ( Quotientenkriterium )
P
Seien ∞
k=0 ak eine Reihe in K sowie
α := lim sup
k→∞
|ak+1 |
|ak |
und
α := lim inf
k→∞
|a
|ak+1|
|ak |
|
}, wobei ak 6= 0 für alle k ∈ N
der größte bzw. kleinste Häufungspunkt der Folge { |ak+1
k|
vorausgesetzt sei. Dann gelten:
P
(a) Ist α < 1, so konvergiert die Reihe ∞
k=0 ak absolut.
P
(b) Ist α > 1, so divergiert die Reihe ∞
k=0 ak .
Beweis: (a) Wegen α < 1 existieren ein q ∈ R mit α < q < 1 und ein N ∈ N mit
Für beliebiges k > N folgt nun
|ak+1 |
≤q
|ak |
für alle k ≥ N.
|aN +1 |
|aN |
|ak | |ak−1 |
·
·...·
· |aN | ≤ q k−N · |aN | = N · q k =: c · q k .
|ak−1| |ak−2 |
|aN |
q
P
k
Dabei ist c := |aqNN | > 0 eine von k unabhängige Konstante. Nun ist ∞
k=0 q eine konvergente
P∞
geometrische Reihe. Wegen Satz 3.25 konvergiert daher auch die Reihe k=0 cq k . Also ist
P
∞
k=0 ak absolut konvergent nach dem Majorantenkriterium.
|ak | =
(b) Wegen α > 1 existiert ein N ∈ N mit
|ak+1 |
≥1
|ak |
für alle k ≥ N. Hieraus folgt für alle k > N
|ak+1 | ≥ |ak | ≥ . . . ≥ |aN | > 0.
Also ist {ak } keine Nullfolge. Wegen Korollar 3.27 kann die Reihe
konvergieren.
P∞
k=0
ak daher nicht
2
In manchen Fällen existiert sogar der Grenzwert
|ak+1 |
k→∞ |ak |
lim
und ist dann natürlich gleich dem Limes superior α und dem Limes inferior α im Quotientenkriterium. Ansonsten lässt sich das Quotientenkriterium sicherlich dann anwenden,
wenn eine Zahl q ∈ (0, 1) existiert mit
|ak+1 |
≤q
|ak |
Christian Kanzow, Universität Würzburg, WS 2010/11
3.4. ABSOLUT KONVERGENTE REIHEN
85
für fast alle k ∈ N, denn dies impliziert offenbar
α = lim sup
k→∞
|ak+1 |
< 1.
|ak |
Wir behandeln kurz einige Beispiele zum Quotientenkriterium.
Beispiel 3.38
(a) Die so genannte Exponentialreihe
∞
X
xk
k=0
k!
= 1+x+
x2 x3
+
+ ...
2!
3!
konvergiert für alle x ∈ K, denn aus dem Quotientenkriterium folgt
xk+1
k!
x
ak+1
=
· k =
→ 0 für k → ∞.
ak
(k + 1)! x
k+1
Setzen wir speziell x = 1, so heißt
∞
X
1
1
1
= 1 + 1 + + + . . . ≈ 2, 718281828459
e :=
k!
2! 3!
k=0
die Eulersche Zahl .
(b) Die gerade eingeführte Eulersche Zahl ist auch Grenzwert der Folge {an } mit an :=
(1 + n1 )n , wie wir später noch sehen werden (vergleiche Lemma 6.11). Benutzen wir
diese Tatsache bereits P
an dieser Stelle, so folgt aus dem Quotientenkriterium die
k!
Konvergenz der Reihe ∞
k=1 k k , denn es gilt
(k + 1)! k k
(k + 1) · k k
ak+1
=
·
=
=
ak
(k + 1)k+1 k!
(k + 1) · (k + 1)k
k
k+1
k
=
1
1
1 k →
e
(1 + k )
|
für k → ∞, also α = lim supk→∞ |a|ak+1
< 1.
k|
(c) Gilt im Quotientenkriterium α ≥ 1 oder α ≤ 1, so ist keine Aussage über die Konvergenz oder Divergenz der Reihe möglich. Beispielsweise gilt für die beiden schon
bekannten Reihen
∞
∞
X
X
1
1
und
2
k
k
k=1
k=1
offenbar α = α = limk→∞
Reihe divergiert.
|ak+1 |
|ak |
= 1, aber die erste Reihe konvergiert und die zweite
Christian Kanzow, Universität Würzburg, WS 2010/11
86
KAPITEL 3. FOLGEN UND REIHEN
(d) Betrachten wir noch einmal die Reihe
1+1+
1 1
1
1
1
1
1
1
+ + 2 + 2 + 3 + 3 + 4 + 4 + ...,
2 3 2
3
2
3
2
3
so gilt
k
2
= 2 lim
= 0 und
k→∞ 3
k+1
2
k
1
3
2k = lim 1 = lim
= +∞.
k→∞
k→∞ 2
3k
ak+1
α = lim inf
= lim
k→∞
k→∞
ak
α = lim sup
k→∞
ak+1
ak
1
3k
1
Mittels des Quotientenkriteriums ist daher keine Aussage über die Konvergenz oder
Divergenz dieser Reihe möglich, während aus dem Wurzelkriterium die Konvergenz
folgte.
3
P∞
Sei jetztP k=0 ak eine beliebige Reihe. Ist τ : N → N eine bijektive Abbildung, so nennen wir ∞
k=0 aτ (k) eine Umordnung der gegebenen Reihe. Sie besteht also aus denselben
Summanden, nur in einer anderen Reihenfolge. Anders als bei endlichen Summen ist es bei
konvergenten Reihen nicht ohne weiteres klar, dass sie bei Umordnung wieder konvergieren und möglichst denselben Grenzwert haben. Tatsächlich ist dies im Allgemeinen nicht
richtig. Als Beispiel betrachten wir die (nach Leibniz) konvergente Reihe
1−
1 1 1 1 1 1
+ − + − + ∓...
2 3 4 5 6 7
(3.6)
sowie ihre Umordnung
1
1
1 1 1 1 1 1
− + + − + +
− ± ...,
(3.7)
3 2 5 7 4 9 11 6
bei der zwei positive Terme jeweils von einem negativen Summanden gefolgt werden. Bezeichnet s den Grenzwert der alternierenden harmonischen Reihe (3.6), so gilt
1+
s < 1−
5
1 1
+ = ,
2 3
6
denn in den verbleibenden Summanden wird (man fasse sie paarweise zusammen) stets
mehr abgezogen als hinzuaddiert. Wegen
1
1
1
+
−
> 0 für alle k ≥ 1
4k − 3 4k − 1 2k
gilt für die Partialsummen sn der umgeordneten Reihe in (3.7) jedoch s3 < s6 < s9 < . . .,
woraus sich
5
lim sup sn > s3 =
6
n→∞
ergibt, so dass die Reihe aus (3.7) sicherlich nicht gegen s konvergiert.
Wir zeigen nun, dass dieses Phänomen bei absolut konvergenten Reihen (zu denen jene
aus (3.6) nicht gehört) nicht auftreten kann.
Christian Kanzow, Universität Würzburg, WS 2010/11
3.4. ABSOLUT KONVERGENTE REIHEN
87
Satz 3.39 ( Umordnungssatz )
P
Sei ∞
k=0 ak eine absolut konvergente Reihe. Dann konvergiert auch jede Umordnung dieser
Reihe, und zwar gegen denselben Grenzwert.
Beweis: Sei τ : N → N eine die Umordnung beschreibende
bijektive Abbildung. Sei ferner
P
a
.
s der Grenzwert der (absolut) konvergenten Reihe ∞
k=0 k Dann haben wir
lim
m→∞
m
X
aτ (k) = s
k=0
zu zeigen. Sei dazu ε > 0 beliebig gegeben. Nach Voraussetzung ist die Reihe
konvergent. Wegen Korollar 3.28 existiert dann ein n0 ∈ N mit
∞
X
k=n0
P∞
k=0
|ak |
ε
|ak | < .
2
Mit Satz 3.32 folgt hieraus
∞
∞
nX
0 −1
X
X
ε
|ak | < .
ak ≤
ak = s −
2
k=n
k=n
k=0
0
0
Wähle N ∈ N jetzt hinreichend groß, so dass
{0, 1, . . . , n0 − 1} ⊆ {τ (0), τ (1), . . . , τ (N)}
gilt. Dann heben sich in der Differenz
N
X
k=0
aτ (k) −
nX
0 −1
ak
k=0
alle Summanden ak mit k ∈ {0, 1, . . . , n0 − 1} gegenseitig auf. Aus diesem Grunde folgt für
alle m ≥ N die Abschätzung
n −1
m
m
nX
0
0 −1
X
X
X
ak − s
aτ (k) −
ak + aτ (k) − s ≤ k=0
k=0
≤
∞
X
k=n0
k=0
|ak | +
k=0
ε
2
< ε,
also
P∞
k=0 aτ (k)
= s.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
88
3.5
KAPITEL 3. FOLGEN UND REIHEN
Multiplikation von Reihen
Stellen wir uns die Aufgabe, zwei endliche Summen
Am := a0 + a1 + . . . + am
Bn := b0 + b1 + . . . + bn
und
miteinander zu multiplizieren, wobei ai , bj ∈ K gegebene Zahlen sind, so haben wir zuerst
alle Produkte
a0 b0 a0 b1 · · · a0 bn
a1 b0 a1 b1 . . . a1 bn
..
..
..
..
.
.
.
.
am b0 am b1 · · · am bn
zu bilden und anschließend in einer (wegen des in K geltenden Kommutativgesetzes) beliebigen Reihenfolge zu addieren. Sortieren wir diese insgesamt ℓ := (m + 1)(n + 1) Produkte
in irgendeiner Reihenfolge
c0 , c1 , . . . , cℓ−1 ,
so ist
ℓ−1
X
k=0
ck = Am · Bn .
Wir verallgemeinern jetzt die Problemstellung und betrachten zwei konvergente Reihen
A=
∞
X
ai
und B =
i=0
∞
X
bj
(3.8)
j=0
mit gewissen Zahlen ai , bj ∈ K. Wollen wir diese beiden Reihen miteinander multiplizieren,
so haben wir in Analogie zu den obigen Ausführungen wieder alle Produkte
a0 b0 a0 b1 a0 b2
a1 b0 a1 b1 a1 b2
a2 b0 a2 b1 a2 b2
..
..
..
.
.
.
···
···
···
..
.
zu bilden und anschließend geeignet aufzudatieren. Dazu ordnen wir diese unendlich vielen
Produkte wieder in irgendeiner Reihenfolge zu einer Folge
c0 , c1 , c2 , . . .
und müssen uns anschließend die beiden folgenden Fragen stellen, die im Falle von endlichen
Summen gar nicht auftraten:
P
• konvergiert die Produktreihe“ ∞
k=0 ck ?
”
Christian Kanzow, Universität Würzburg, WS 2010/11
3.5. MULTIPLIKATION VON REIHEN
• Wenn ja, gilt dann
P∞
k=0 ck
89
= A · B?
Wir wissen bereits, dass bei einer konvergenten Reihe, die jedoch nicht absolut konvergiert,
die Umordnung der Summanden eine große Auswirkung auf die Konvergenz einer solchen
Reihe haben kann. Insofern kann es sein,Pdass nur für gewisse Anordnungen der Produkte
und von diesen Anordnungen
zu einer Folge {ck } die zugehörige Reihe ∞
k=0 ck konvergiert,
P∞
vielleicht nur für einige die Grenzwertbeziehung k=0 ck = A · B gilt.
Wir zeigen im folgenden Satz nun, dass im Falle der absoluten Konvergenz der beiden Reihen aus (3.8) die Produktreihe konvergiert und das Resultat von der Anordnung
unabhängig ist.
P
P∞
Satz 3.40 Sind A = ∞
i=0 ai und B =
j=0 bj zwei absolut konvergente Reihen, so gilt
bei jeder Anordnung von {ck } (mit ck wie oben definiert):
∞
X
k=0
ck = A · B.
Insbesondere ist die Produktreihe also konvergent.
Beweis: Sei {ck } eine beliebige Anordnung der Produkte ai bj und
Cn := c0 + c1 + . . . + cn
die n-te Partialsumme. Ferner bezeichnen wir mit p den höchsten auftretenden Index von
ai oder bj in Cn . Dann gilt
! p
!
! ∞
!
p
∞
n
X
X
X
X
X
|ck | ≤
|ai |
|bj | ≤
|ai |
|bj | < ∞
k=0
i=0
j=0
i=0
j=0
P
P∞
wegen der P
vorausgesetzten absoluten Konvergenz der beiden Reihen ∞
i=0 ai und
j=0 bj .
∞
Die Reihe k=0 ck ist daher absolut konvergent. Wegen Satz 3.39 liefern daher alle Anordnungen denselben Grenzwert, den wir mit C bezeichnen wollen.
Damit bleibt nur noch zu zeigen, dass die Grenzwertbeziehung
∞
X
k=0
ck = A · B
für eine spezielle Anordnung der ck gilt. Zu diesem Zweck betrachten wir die folgende
quadratische Anordnung:
a0 b0
a1 b0
a0 b1
↑
→ a1 b1
a2 b0 → a2 b1
a0 b2
↑
a1 b2
↑
→ a2 b2
a3 b0 → a3 b1 → a3 b2
..
..
..
.
.
.
a0 b3
↑
a1 b3
↑
a2 b3
↑
→ a3 b3
..
.
···
···
···
···
..
.
Christian Kanzow, Universität Würzburg, WS 2010/11
90
KAPITEL 3. FOLGEN UND REIHEN
Wir haben also
c0 = a0 b0 , c1 = a1 b0 , c2 = a1 b1 , c3 = a0 b1 , c4 = a2 b0 , . . .
Für die zugehörigen Partialsummen gilt dann einerseits (man vergleiche hierzu das quadratische Schema, das zu Beginn dieses Abschnittes für endliche Summen aufgestellt wurde)
c0 + c1 + . . . + c(n+1)2 −1 = (a0 + a1 + . . . + an )(b0 + b1 + . . . + bn )
n
n
X
X
=
ai
bj
i=0
j=0
→ A·B
und andererseits
c0 + c1 + . . . + c(n+1)2 −1 → C
aufgrund des schon beweisenen Teils. Die Eindeutigkeit des Grenzwertes liefert C = A · B,
womit der Beweis vollständig erbracht ist.
2
Die vielleicht populärste Anordnung entlang der Diagonalen geht auf Cauchy zurück:
a0 b0
a1 b0
a2 b0
a0 b1
ր
ր
a1 b1
a2 b1
a0 b2
ր
a1 b2
a0 b3 · · · a0 bn . . .
ր
ր
ր
ր
a3 b0
..
.
ր
an b0
..
.
Setzen wir
dn := an b0 + an−1 b1 + . . . + a0 bn =
n
X
an−i bi
i=0
für die Summe in einer Diagonalen, so heißt
∞
X
n=0
dn =
∞
n
X
X
n=0
i=0
an−i bi
!
(3.9)
P∞
P∞
das Cauchy–Produkt der beiden Reihen
a
und
i
i=0
P∞ j=0 bj . Nach Satz 3.40 ist dieses
P∞
konvergent, sofern die beiden Reihen i=0 ai und j=0 bj absolut konvergieren.
Christian Kanzow, Universität Würzburg, WS 2010/11
3.6. POTENZREIHEN
3.6
91
Potenzreihen
Viele wichtige Funktionen werden über so genannte Potenzreihen definiert, die wir aus
diesem Grunde in der nachstehenden Definition einführen wollen. Dabei soll K weiterhin
als Abkürzung für R oder C stehen.
Definition 3.41 Ist {an } ⊆ K eine gegebene Folge und z0 ∈ K ein gegebener Punkt, so
heißt
∞
X
P (z) :=
an (z − z0 )n
(3.10)
n=0
Potenzreihe mit Entwicklungspunkt z0 .
Als Entwicklungspunkt tritt häufig der Nullpunkt auf, so dass wir
P (z) =
∞
X
an z n
n=0
als Potenzreihe erhalten. Ansonsten stellt jede Potenzreihe für ein festes z ∈ K eine gewöhnliche Reihe dar, die in diesem Punkt z konvergieren kann oder auch nicht. Konvergiert die
Potenzreihe P (z) aus (3.10) für alle z ∈ D mit einer gewissen Menge D ⊆ K, so erhalten
wir durch die Zuordnung
P : D → K, z 7→ P (z)
eine wohldefinierte Abbildung. Wir haben daher die Menge D näher zu bestimmen. Im
Entwicklungspunkt z = z0 gilt stets
P (z0 ) = a0 ,
insbesondere liegt also Konvergenz vor. Für z 6= z0 ist die Situation weitaus weniger klar
und soll im Folgenden näher untersucht werden. Ein erstes wichtiges Resultat in dieser
Richtung ist in dem nachstehenden Satz enthalten.
P
n
Satz 3.42 Gegeben sei eine Potenzreihe P (z) = ∞
n=0 an (z − z0 ) . Dann gelten:
(a) Konvergiert die Reihe an einer Stelle z1 6= z0 , so konvergiert sie absolut für alle z ∈ K
mit |z − z0 | < |z1 − z0 |.
(b) Divergiert die Reihe an einer Stelle z2 , so divergiert sie für alle z ∈ K mit |z − z0 | >
|z2 − z0 |.
Beweis: (a) Sei P an einer Stelle z1 6= z0 konvergentPund z ∈ K ein beliebiger Punkt mit
n
|z − z0 | < |z1 − z0 |. Aus der Konvergenz von P (z1 ) = ∞
0 ) folgt mit dem Satz
n=0 an (z1 − z
3.27 sofort limn→∞ an (z1 − z0 )n = 0. Also existiert ein M > 0 mit an (z1 − z0 )n ≤ M für
alle n ∈ N. Hieraus folgt
n
z − z0 n
n
n
≤ M · z − z0 = M · q n .
an (z − z0 ) = an (z1 − z0 ) · z1 − z0 z −z
| 1 {z 0}
=:q
Christian Kanzow, Universität Würzburg, WS 2010/11
92
KAPITEL 3. FOLGEN UND REIHEN
P
n
MajoWegen q < 1 ist die Reihe M ∞
n=0 q konvergent und stellt somit eine konvergente
P∞
rante für die Potenzreihe P im Punkt z dar. Wegen Satz 3.33 ist P (z) := n=0 an (z − z0 )n
daher absolut konvergent.
(b) Die Potenzreihe P divergiere in einem Punkt z2 ∈ K. Ist z ∈ K dann ein weiterer
Punkt mit |z − z0 | > |z2 − z0 | und würde die Potenzreihe P in diesem Punkt konvergieren,
so müsste sie nach Teil (a) auch in dem Punkt z2 (absolut) konvergieren, was aber einen
Widerspruch zu unserer Voraussetzung darstellt. Also ist P (z) divergent.
2
Die geometrische Deutung des Satzes 3.42 lautet wie folgt: Konvergiert die gegebene Reihe
an einer Stelle z1 6= z0 , so konvergiert sie (sogar absolut) auch in allen Punkten z, deren
Abstand zum Entwicklungspunkt z0 kleiner ist als der Abstand von z1 zun z0 . Divergiert
die Reihe hingegen in einem Punkt z2 , so divergiert sie auch in jedem Punkt z, dessen
Abstand zum Entwicklungspunkt z0 größer ist als der Abstand von z2 zu z0 .
Wir betrachten als kleines Beispiel zum Satz 3.42 die Potenzreihe
∞
X
zn
P (z) :=
n+1
n=0
(3.11)
mit Entwicklungspunkt z0 = 0. Nach dem Leibniz–Kriterium ist diese Reihe in z = −1
konvergent. Nach dem Satz 3.42 konvergiert sie daher (sogar absolut) für alle z ∈ K mit
|z| < 1. Für jedes z ∈ K mit |z| > 1 hingegen divergiert sie, denn gäbe es ein z1 ∈ K mit
|z1 | > 1, so dass die Potenzreihe P in z1 konvergieren würde, so müsste sie erneut wegen
Satz 3.42 auch in z = 1 konvergieren, was aber nicht sein kann, da
P (1) = 1 +
1 1 1
+ + + ...
2 3 4
die harmonische Reihe ist, welche bekanntlich divergiert.
Mit Hilfe des Satzes 3.42 erhalten wir jetzt ein entscheidendes Ergebnis über das Konvergenzverhalten einer Potenzreihe.
Satz 3.43 ( Konvergenzradius einer Potenzreihe )
P
n
Für jede Potenzreihe P (z) := ∞
n=0 an (z − z0 ) existiert eine eindeutig bestimmte Zahl R
mit 0 ≤ R ≤ +∞, so dass die beiden folgenden Aussagen gelten:
(a) Für alle z ∈ K mit |z − z0 | < R ist die Potenzreihe P (z) absolut konvergent.
(b) Für alle z ∈ K mit |z − z0 | > R ist die Potenzreihe P (z) divergent.
Die Zahl R heißt Konvergenzradius der Potenzreihe P .
Beweis: Wir setzen
∞
X
an (z − z0 )n konvergiert .
R := sup r ∈ R r = |z − z0 |,
n=0
Christian Kanzow, Universität Würzburg, WS 2010/11
3.6. POTENZREIHEN
93
Dann können die drei Fälle R = 0, R ∈ (0, ∞) und R = +∞ eintreten. Für R = 0 konvergiert die Potenzreihe nur im Entwicklungspunkt z0 und für R = +∞ in allen z ∈ K, so
dass lediglich der Fall R ∈ (0, ∞) zu untersuchen bleibt. Betrachte zunächst den Fall (a),
wo ein z ∈ K mit |z − z0 | < R vorliegt. Dann existiert ein z1 mit |z − z0 | < |z1 − z0 | < R.
Nach Definition von R konvergiert die Potenzreihe P in z1 . Wegen Satz 3.42 ist sie daher
sogar absolut konvergent in z. Im Fall (b) hingegen liegt ein z ∈ K vor mit |z − z0 | > R,
so dass die Divergenz der Potenzreihe P in diesem Punkt z unmittelbar aus der Definition
von R folgt.
2
Anschaulich besagt der Satz 3.43 (vergleiche die Abbildung 3.1), dass man jeder Potenzreihe
eine eindeutig bestimmte Zahl R ∈ [0, +∞] zuordnen kann derart, dass die Potenzreihe
innerhalb des Kreises vom Radius R um den Entwicklungspunkt z0 konvergiert (sogar
absolut) und außerhalb dieses Kreises divergiert. Man beachte allerdings, dass der Satz
3.43 in dem interessanten Fall R ∈ (0, ∞) nichts über die Konvergenz oder Divergenz der
Potenzreihe P auf dem Rande dieses Kreises aussagt, also in solchen Punkten z ∈ K mit
|z −z0 | = R. Tatsächlich kann für solche z sowohl Konvergenz als auch Divergenz vorliegen.
Das Beispiel der Potenzreihe (3.11) verdeutlicht dies: Aus der zugehörigen Diskussion folgt,
dass diese Potenzreihe den Konvergenzradius R = 1 besitzt. In dem Randpunkt z = −1
des Konvergenzkreises konvergierte die Potenzreihe (allerdings nicht absolut), während in
dem Randpunkt z = 1 Divergenz vorlag.
Potenzreihe divergent
R
z0
Potenzreihe konvergent
Rand: keine Konvergenzaussage
Abbildung 3.1: Das Konvergenzgebiet einer Potenzreihe
Wir geben als Nächstes zwei Kriterien zur Bestimmung des Konvergenzradius einer
Potenzreihe an. Beide Kriterien bestimmen den Konvergenzradius ausschließlich aus den
Eigenschaften der Folge {an }.
Satz 3.44 ( Cauchy–Hadamard )
P
n
Der Konvergenzradius R einer Potenzreihe P (z) := ∞
n=0 an (z − z0 ) ist gegeben durch
R=
1
L
mit L := lim sup
n→∞
p
n
|an |,
Christian Kanzow, Universität Würzburg, WS 2010/11
94
KAPITEL 3. FOLGEN UND REIHEN
wobei wir in diesem Zusammenhang
1
0
:= ∞ und
1
∞
:= 0 setzen.
Beweis: Wir betrachten zunächst den Fall 0 < L < ∞ und wählen ein beliebiges z ∈ K.
Dann ist
p
p
L∗ := lim sup n |an (z − z0 )n | = |z − z0 | · lim sup n |an | = |z − z0 | · L
n→∞
n→∞
und daher
∗
L
< 1, falls |z − z0 | < 1/L,
> 1, falls |z − z0 | > 1/L.
Die Potenzreihe P (z) konvergiert daher für |z − z0 | < 1/L und divergiert im Fall |z − z0 | >
1/L aufgrund des Wurzelkriteriums aus dem Satz 3.35.
In den verbleibenden Fällen L = 0 und L = ∞ ist L∗ = 0 und L∗ = ∞ für alle z 6= z0 .
Die Potenzreihe P (z) konvergiert daher für alle z ∈ K oder für kein z 6= z0 .
2
Ein zweites Kriterium zur Bestimmung des Konvergenzradius einer Potenzreihe ist in dem
folgenden Satz enthalten.
Satz 3.45 ( Euler )
P
n
Der Konvergenzradius R einer Potenzreihe P (z) := ∞
n=0 an (z − z0 ) ist gegeben durch
an+1 1
,
mit L := lim R=
n→∞
L
an sofern dieser Grenzwert existiert. Dabei setzen wir in diesem Zusammenhang wieder
1
+∞ und ∞
:= 0.
1
0
:=
Beweis: Der Beweis kann analog zu dem des Satzes 3.44 von Cauchy–Hadamard erfolgen,
indem man an Stelle des Wurzelkriteriums das Quotientenkriterium aus dem Satz 3.37
verwendet. Die Einzelheiten seien dem Leser überlassen.
2
Das Kriterium von Euler ist oft einfacher zu handhaben als jenes von Cauchy–Hadamard.
Allerdings ist das Euler–Kriterium nicht immer anwendbar, da der dort angegebene Grenzwert nicht existieren muss, während der Satz 3.44 stets den gewünschten Konvergenzradius
p
liefert, wenngleich die Berechnung der dort auftretenden Größe L = lim supn→∞ n |an | in
konkreten Fällen Schwierigkeiten bereiten mag.
Wir betrachten einige Beispiele.
Beispiel 3.46
0, denn
(a) Die Potenzreihe P (z) :=
L := lim sup
n→∞
p
n
P∞
n=0
nn z n hat den Konvergenzradius R =
|an | = lim sup n = +∞,
n→∞
so dass die Behauptung aus dem Kriterium von Cauchy–Hadamard folgt.
Christian Kanzow, Universität Würzburg, WS 2010/11
3.6. POTENZREIHEN
95
P
zn
(b) Die Potenzreihe P (z) := ∞
n=0 n! hat den Konvergenzradius R = +∞ wegen
an+1 n!
1
= lim
= lim
= 0,
lim n→∞ (n + 1)!
n→∞ n + 1
n→∞
an
so dass die Behauptung aus dem Kriterium von Euler folgt. Diese Potenzreihe wird
uns später in Form der Exponentialfunktion wieder begegnen.
P
n
(c) Die Potenzreihe P (z) := ∞
n=0 z hat den Konvergenzradius R = 1 wegen
an+1 = lim 1 = 1.
lim n→∞
an n→∞ 1
Sie divergiert für alle Randpunkte z mit |z| = 1, da {z n } dann keine Nullfolge bildet
und somit das notwendige Konvergenzkriterium aus dem Korollar 3.27 nicht erfüllt
ist.
P
zn
(d) Die Potenzreihe P (z) := ∞
n=1 n2 besitzt den Konvergenzradius R = 1, denn mit
dem Kriterium von Cauchy–Hadamard gilt R = 1/L mit
r
p
1
n
= 1.
L = lim sup n |an | = lim sup
n2
n→∞
n→∞
DiePotenzreihe
konvergiert außerdem
allen Randpunkten z mit |z| = 1, denn dort
P∞ in
zn 1
1
ist n2 = n2 , so dass die Reihe n=1 n2 eine konvergente Majorante darstellt.
(e) Die beiden Potenzreihen
P (z) :=
∞
X
n=0
an (z − z0 )n
und P (z) :=
∞
X
n=1
nan (z − z0 )n−1
haben denselben Konvergenzradius. Dies folgt aus dem Kriterium von Cauchy–Hadamard. Bezeichnen wir die Konvergenzradien von P und P nämlich mit R = L1 und
√
R = L1 , so folgt aus dem Satz 3.44 wegen limn→∞ n n = 1 nämlich
p
p
L = lim sup n n|an | = lim sup n |an | = L.
n→∞
n→∞
Formal erhält man die Potenzreihe P übrigens aus der Potenzreihe P , indem man
dort alle Summanden einzeln differenziert.
3
Wir wollen noch den Identitätssatz 2.15 für Polynome auf Potenzreihen erweitern. Als
Hilfsmittel benötigen wir dazu das nachstehende Lemma.
P
n
Lemma 3.47 Sei P (z) = ∞
n=0 an (z − z0 ) eine Potenzreihe mit einem positiven Konvergenzradius R > 0. Dann existiert zu jedem 0 < r < R eine Konstante c > 0 mit
Rk (z) ≤ c|z − z0 |k für alle z ∈ K mit |z − z0 | ≤ r,
P
n
wobei Rk den Rest“ Rk (z) = ∞
n=k an (z − z0 ) bezeichnet.
”
Christian Kanzow, Universität Würzburg, WS 2010/11
96
KAPITEL 3. FOLGEN UND REIHEN
P
n
Beweis: Nach Voraussetzung konvergiert die Reihe P (z) = ∞
n=0 an (z − z0 ) für alle z
mit |z − z0 | < R (sogar absolut). Für beliebig gegebenes r ∈ (0, R) ist
c :=
∞
X
n=k
|an |r
n−k
∞
1 X
= k
|an |r n > 0
r n=k
daher eine wohldefinierte reelle Zahl. Mit dieser erhalten wir sofort
∞
∞
X
X
Rk (z) ≤
|an | · |z − z0 |n−k ≤ c · |z − z0 |k
|an | |z − z0 |n = |z − z0 |k
n=k
n=k
für alle z ∈ K mit |z − z0 | ≤ r.
2
Wir können damit das folgende Resultat beweisen.
Satz 3.48 ( Identitätssatz für Potenzreihen )
Gegeben seien zwei Potenzreihen
P1 (z) =
∞
X
n=0
an (z − z0 )
n
und P2 (z) =
∞
X
n=0
bn (z − z0 )n
mit positiven Konvergenzradien R1 > 0 und R2 > 0. Existiert dann eine Folge {zi } ⊆ K
mit limi→∞ zi = z0 und zi 6= z0 für alle i ∈ N und ist
P1 (zi ) = P2 (zi ) für alle i ∈ N,
so gilt bereits an = bn für alle n ∈ N0 , d.h., die beiden Potenzreihen stimmen überein.
Beweis: Setzen wir R := min{R1 , R2 } > 0, so konvergiert die Potenzreihe
P (z) := P1 (z) − P2 (z) =
∞
X
n=0
n
(an − bn )(z − z0 ) =
| {z }
=:cn
∞
X
n=0
cn (z − z0 )n
zumindest für alle z ∈ K mit |z − z0 | < R. Wir haben zu zeigen, dass cn = 0 für alle n ∈ N0
gilt. Angenommen, dies ist nicht der Fall. Dann existiert ein kleinster Index k ∈ N0 mit
ck 6= 0. Somit ist
∞
X
P (z) =
cn (z − z0 )n .
n=k
Setzen wir
Pe(z) =
P (z)
= ck + ck+1(z − z0 ) + ck+2 (z − z0 )2 + . . . ,
(z − z0 )k
so folgt aus P (zi ) = P1 (zi ) − P2 (zi ) = 0 für alle i ∈ N sofort Pe(zi ) = 0 für alle i ∈ N.
Andererseits folgt aus dem Lemma 3.47 durch Anwendung auf die Potenzreihe Pe unmittelbar Pe(zi ) → ck für i → ∞. Die Eindeutigkeit des Grenzwertes impliziert somit ck = 0
Christian Kanzow, Universität Würzburg, WS 2010/11
3.6. POTENZREIHEN
97
im Widerspruch zur Wahl von ck 6= 0.
2
Wir geben noch eine kleine Anwendung des Identitätssatzes auf gerade und ungerade Funktionen. Dabei nennen wir eine Abbildung f : R → R gerade, wenn f (x) = f (−x) für alle
x ∈ R gilt; sie heißt ungerade, wenn −f (x) = f (−x) für alle x ∈ R ist. Anschaulich bedeutet dies, dass eine gerade Funktion symmetrisch zur y-Achse und eine ungerade Funktion
symmetrisch zum Ursprung ist, vergleiche die Abbildung 3.2.
2.0
1.5
1.0
0.5
-3
-2
1
-1
2
3
-0.5
-1.0
-1.5
-2.0
Abbildung 3.2: Beispiel einer geraden bzw. ungeraden Funktion.
Nehmen wir an, dass sich f als Potenzreihe mit Entwicklungspunkt x0 = 0 schreiben lässt. Dann folgt aus dem Identitätssatz für Potenzreihen durch Koeffizientenvergleich
einerseits
f ist gerade ⇐⇒ f (x) = f (−x) für alle x ∈ R
∞
∞
X
X
n
⇐⇒
an x =
an (−1)n xn für alle x ∈ R
n=0
n=0
⇐⇒ a2n+1 = 0 für alle n ∈ N0
und andererseits
f ist ungerade ⇐⇒ −f (x) = f (−x) für alle x ∈ R
∞
∞
X
X
⇐⇒
−an xn =
an (−1)n xn für alle x ∈ R
n=0
n=0
⇐⇒ a2n = 0 für alle n ∈ N0 .
Bei einer als Potenzreihe formulierbaren geraden Funktion treten also nur gerade Potenzen
auf, bei einer ebensolchen ungeraden Funktion hingegen nur ungerade Potenzen.
Christian Kanzow, Universität Würzburg, WS 2010/11
98
KAPITEL 3. FOLGEN UND REIHEN
Christian Kanzow, Universität Würzburg, WS 2010/11
Kapitel 4
Metrische Räume und Stetigkeit
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.1
Metrische und normierte Räume
Folgen in metrischen Räumen
Offene und abgeschlossene Mengen
Stetige Funktionen
Grenzwerte von Funktionen
Kompakte Mengen
Der Approximationssatz von Weierstraß
Metrische und normierte Räume
Wir beginnen mit der Definition eines metrischen Raumes, der in diesem Kapitel von
zentraler Bedeutung ist.
Definition 4.1 Seien X eine nichtleere Menge und d : X × X → R eine Abbildung mit
den folgenden Eigenschaften:
(a) d(x, y) = 0 ⇐⇒ x = y;
(b) d(x, y) ≥ 0 ∀x, y ∈ X;
(c) d(x, y) = d(y, x) ∀x, y ∈ X (Symmetrie);
(d) d(x, z) ≤ d(x, y) + d(y, z) ∀x, y, z ∈ X (Dreiecksungleichung).
Dann heißt d Metrik auf X, und (X, d) wird als metrischer Raum bezeichnet.
In einem metrischen Raum (X, d) ist die Größe d(x, y) ein Maß für den Abstand (d =
Distanz) zwischen zwei Punkten x, y ∈ X. Dass dieser Abstandsbegriff allerdings recht
allgemein sein kann, wird aus den nachfolgenden Beispielen klar.
99
100
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Beispiel 4.2
(a) Seien X eine nichtleere Menge und
0, falls x = y,
d(x, y) :=
1, falls x 6= y.
Dann ist d eine Metrik auf X, die so genannte diskrete Metrik ; der metrische Raum
(X, d) heißt auch diskreter Raum.
(b) (X, d) mit X = K (K = R oder K = C) und dem üblichen Abstand d(x, y) :=
|x − y| ist ein metrischer Raum. Dies folgt unmittelbar aus den Eigenschaften der
Betragsfunktion.
(c) Ist (X, d) ein metrischer Raum und Y ⊆ X eine beliebige Teilmenge, so wird auch
Y zu einem metrischen Raum durch die von X induzierte Metrik dY (x, y) := d(x, y)
für x, y ∈ Y . Teilmengen von metrischen Räumen seien im Folgenden stets mit der
induzierten Metrik versehen (sofern nicht explizit etwas anderes gesagt wird).
(d) In der Codierungstheorie versteht man unter einem n-stelligen Binärwort ein Tupel
x = (x1 , . . . , xn ) mit xi ∈ {0, 1} für alle i = 1, . . . , n, wobei man z.B. statt x =
(1, 0, 1, 1) meist nur x = 1011 schreibt. Die so genannte Hamming–Distanz
d(x, y) := {i | xi 6= yi },
für zwei Binärwörter x = (x1 , . . . , xn ), y = (y1, . . . , yn ) zählt also die Anzahl der
Komponenten, in denen sich x und y unterscheiden. Man verifiziert sehr leicht, dass
hierdurch eine Metrik definiert ist.
3
Zahlreiche weitere Beispiele von (sehr wichtigen) metrischen Räumen werden wir in den
nächsten Kapiteln noch kennen lernen.
Wir notieren als Nächstes eine einfache Konsequenz aus der Definition eines metrischen
Raumes, die uns später noch als technisches Hilfsmittel von Nutzen sein wird.
Lemma 4.3 ( Vierecksungleichung )
Sei (X, d) ein metrischer Raum. Dann gilt
d(x, y) − d(u, v) ≤ d(x, u) + d(y, v)
für alle x, y, u, v ∈ X.
Beweis: Seien x, y, u, v ∈ X. Aus der Dreiecksungleichung für metrische Räume folgt
dann
d(u, v) ≤ d(u, x) + d(x, y) + d(y, v)
und daher
d(u, v) − d(x, y) ≤ d(x, u) + d(y, v).
Entsprechend zeigt man die Ungleichung
d(x, y) − d(u, v) ≤ d(x, u) + d(y, v).
Christian Kanzow, Universität Würzburg, WS 2010/11
4.1. METRISCHE UND NORMIERTE RÄUME
Zusammen folgt die Behauptung.
101
2
Spezielle metrische Räume erhält man mittels der so genannten normierten Räume. Diese
wollen wir als Nächstes einführen. Dafür benötigen wir allerdings den Begriff eines Vektorraumes.
Definition 4.4 Sei K ein beliebiger Körper. Dann heißt eine nichtleere Menge V ein
K–Vektorraum (oder Vektorraum über K), wenn es eine Verknüpfung + (als Addition
bezeichnet) und eine Verknüpfung · (als Skalarmultiplikation bezeichnet) gibt derart, dass
die folgenden Eigenschaften erfüllt sind:
(A) Axiome der Addition:
(A1) Für alle v, w ∈ V ist v + w ∈ V (Abgeschlossenheit der Addition).
(A2) Für alle v, w ∈ V ist v + w = w + v (Kommutativgesetz).
(A3) Für alle u, v, w ∈ V ist u + (v + w) = (u + v) + w (Assoziativgesetz).
(A4) Es gibt ein Element 0 ∈ V mit 0 + v = v für alle v ∈ V (Existenz eines
Nullelements).
(A5) Für alle v ∈ V existiert ein Element −v ∈ V mit v + (−v) = 0 (Existenz eines
inversen Elements).
(S) Axiome der Skalarmultiplikation:
(S1) Für alle λ ∈ K und alle v ∈ V ist λ · v ∈ V (Abgeschlossenheit der Skalarmultiplikation).
(S2) Es gilt λ · (v + w) = λ · v + λ · w für alle λ ∈ K und alle v, w ∈ V .
(S3) Es gilt (λ + µ) · v = λ · v + µ · v für alle λ, µ ∈ K und alle v ∈ V .
(S4) Es gilt (λµ) · v = λ · (µ · v) für alle λ, µ ∈ K und alle v ∈ V .
(S5) Es gilt 1 · v = v für alle v ∈ V , wobei 1 das Einselement in dem Körper K
bezeichnet.
Wir werden meist nur Vektorräume über dem Körper K = K betrachten, wobei K wieder
als Abkürzung für den Körper der reellen Zahlen R oder den Körper der komplexen Zahlen
C steht. Sofern der jeweilige Körper aus dem Zusammenhang klar ist, sprechen wir auch
nur von einem Vektorraum statt von einem K–Vektorraum.
Ist nun V ein K–Vektorraum und U ⊆ V eine Teilmenge, so nennen wir U einen Unterraum (oder Untervektorraum oder Teilraum) von V , wenn U mit der durch V vererbten
Addition + und Skalarmultiplikation · selbst ein Vektorraum ist.
Nach diesen Vorbereitungen kommen wir nun zu dem Begriff eines normierten Raumes.
Definition 4.5 Seien X ein K–Vektorraum und k · k : X → R eine Abbildung mit den
folgenden Eigenschaften:
Christian Kanzow, Universität Würzburg, WS 2010/11
102
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
(a) kxk = 0 ⇐⇒ x = 0;
(b) kxk ≥ 0 für alle x ∈ X;
(c) kαxk = |α| kxk für alle α ∈ K und alle x ∈ X (Homogenität);
(d) kx + yk ≤ kxk + kyk für alle x, y ∈ X (Dreiecksungleichung).
Dann heißt k · k eine Norm auf X, und (X, k · k) wird als normierter Raum bezeichnet.
Genügt k · k nur den Eigenschaften (b)–(d), so spricht man von einer Halbnorm auf X.
Aus der Dreiecksungleichung in der Definition 4.5 (d) erhält man induktiv sofort die Gültigkeit der verallgemeinerten Dreieicksungleichung
kx1 + . . . + xn k ≤ kx1 k + . . . + kxn k
für je endlich viele Elemente x1 , . . . , xn eines normierten Raumes (X, k · k). Außerdem gilt
in einem normierten Raum (X, k · k) auch die inverse Dreiecksungleichung
kxk − kyk ≤ kx − yk ∀x, y ∈ X,
(4.1)
denn aus der Dreiecksungleichung folgt einerseits
kxk ≤ kx − yk + kyk =⇒ kxk − kyk ≤ kx − yk,
und andererseits gilt
kyk ≤ ky − xk + kxk =⇒ kyk − kxk ≤ ky − xk.
Beide Ungleichungen zusammen ergeben gerade (4.1).
Ist (X, k · k) ein normierter Raum und setzen wir
d(x, y) := kx − yk für x, y ∈ X,
(4.2)
so genügt die Abbildung d : X × X → R offenbar allen Eigenschaften einer Metrik.
Jeder normierte Raum wird mittels der obigen Zuordnung somit zu einem metrischen
Raum. Sofern wir einen normierten Raum vorliegen haben, fassen wir diesen stets vermöge
der Vorschrift (4.2) als einen metrischen Raum auf. Daher gelten alle Aussagen in einem
metrischen Raum automatisch auch in normierten Räumen. Die Vierecksungleichung aus
dem Lemma 4.3 lautet in einem normierten Raum X beispielsweise wie folgt:
kx − yk − ku − vk ≤ kx − uk + ky − vk
für alle x, y, u, v ∈ X.
Wir geben als Nächstes einige Beispiele von Vektorräumen und normierten Räumen an.
Weitere (sehr wichtige) Beispiele werden später noch folgen.
Christian Kanzow, Universität Würzburg, WS 2010/11
4.1. METRISCHE UND NORMIERTE RÄUME
103
Beispiel 4.6 (a) Der Körper K ist ein normierter (und daher auch metrischer) Raum
über K mit der üblichen Addition und der üblichen Multiplikation in K als Skalarmultiplikation, wenn man als Norm den Betrag wählt, also kxk := |x| für alle x ∈ K
setzt.
(b) Die Menge
Kn := K × · · · × K := x x = (x1 , . . . , xn ) mit xi ∈ K für alle i = 1, . . . , n
wird mit der komponentenweisen Addition
x + y := (x1 + y1 , . . . , xn + yn ) für alle x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Kn
und der komponentenweisen Skalarmultiplikation
λx := (λx1 , . . . , λxn ) für alle λ ∈ K und alle x = (x1 , . . . , xn ) ∈ Kn
offenbar zu einem K–Vektorraum. Dieser lässt sich auf verschiedene Weisen zu einem
normierten (und daher auch metrischen) Raum machen. Beliebt ist beispielsweise die
so genannte Euklidische Norm
p
kxk := kxk2 := |x1 |2 + . . . + |xn |2 für x ∈ Kn ,
wobei wir erst später zeigen werden, dass es sich hierbei tatsächlich um eine Norm
handelt.
(c) Auf dem gerade eingeführten Vektorraum Kn können auch andere Normen definiert
werden. Beispielsweise verifiziert man relativ leicht, dass die so genannte Maximumnorm
kxk := kxk∞ := max |x1 |, . . . , |xn |
ebenfalls eine Norm auf dem Raum Kn definiert. Diese ist von der Euklidischen Norm
offenbar verschieden, allerdings gilt
√
kxk∞ ≤ kxk2 ≤ nkxk∞
für alle x ∈ Kn , wie man sofort einsieht.
(d) Die Menge aller konvergenten Folgen in K bildet ebenfalls einen (allerdings unendlich–
dimensionalen) K–Vektorraum, wenn man die Addition und die Skalarmultiplikation
wieder komponentenweise definiert, also
{xn } + {yn } := {xn + yn } und λ{xn } := {λxn }
für alle Folgen {xn }, {yn } in K und alle λ ∈ K. Dieser Vektorraum lässt sich auch
zu einem normierten Raum machen, worauf wir an dieser Stelle aber nicht weiter
eingehen wollen.
Christian Kanzow, Universität Würzburg, WS 2010/11
104
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
(e) Die wohl wichtigsten Beispiele von normierten und metrischen Räumen sind so genannte Funktionenräume, beispielsweise die Menge aller stetigen Abbildungen f :
[a, b] → R, die Menge aller differenzierbaren Abbildungen f : [a, b] → R oder die
Menge aller integrierbaren Abbildungen f : [a, b] → Rn . Da wir die hierzu nötigen
Begriffe noch nicht zur Verfügung haben, gehen wir an dieser Stelle nicht weiter darauf ein. Es sei allerdings erwähnt, dass diese Funktionenräume später noch eine große
Rolle spielen werden.
3
4.2
Folgen in metrischen Räumen
Wir verallgemeinern in diesem Abschnitt den Begriff einer Folge und beweisen einige Aussagen aus dem Kapitel 3 in beliebigen metrischen Räumen statt nur im Raum K.
Zunächst erinnern wir daran, dass bislang jede Abbildung der Gestalt f : N → K als
eine Folge (in K) bezeichnet wurde und hierfür statt f (n) stets an geschrieben wurde.
Allgemeiner bezeichnen wir von nun an jede Funktion f : N → X mit einer beliebigen
Menge X als eine Folge (in X) und schreiben weiterhin an statt f (n). Die Folgenglieder
an = f (n) sind also nicht mehr notwendig irgendwelche Zahlen in K, sondern können
beliebige andere Objekte sein. Wir betrachten kurz zwei Beispiele.
Beispiel 4.7 (a) Betrachte die Abbildung die Abbildung f (n) := xn für n ∈ N. Hier
wird jeder natürlichen Zahl n ∈ N die Funktion xn zugeordnet, die einzelnen Folgenglieder an = f (n) = xn sind also Funktionen.
(b) Durch die Abbildung f (n) := {x ∈ R | x ∈ [−n, +n]} wird jeder natürlichen Zahl
n ∈ N ein Intervall in R zugeordnet.
3
Sei nun f : N → X eine beliebige Folge in X, wofür wir wieder {an } oder {a1 , a2 , a3 , . . .}
schreiben mit an := f (n). Bezeichnet {nk } dann eine streng monoton steigende Folge
natürlicher Zahlen, so nennen wir die durch k 7→ ank definierte Folge {ank } wieder eine
Teilfolge von {an }. Beispielsweise ist die Folge der Funktionen 1, x2 , x4 , x6 , . . . eine Teilfolge
der im Beispiel 4.7 (a) angegebenen Folge.
Wir betrachten nun Folgen in einem metrischen Raum X. Dann steht uns ein Abstandsbegriff zur Verfügung, so dass wir konvergente Folgen, Cauchy–Folgen etc. auch in
beliebigen metrischen Räumen definieren können.
Definition 4.8 Seien (X, d) ein metrischer Raum und {xn } ⊆ X eine gegebene Folge.
(a) {xn } heißt Cauchy–Folge in X, wenn für alle ε > 0 ein N ∈ N existiert mit
d(xm , xn ) ≤ ε für alle m, n ∈ N mit m, n ≥ N.
(b) {xn } heißt konvergent gegen einen Grenzwert x ∈ X, wenn für alle ε > 0 ein N ∈ N
existiert mit d(xn , x) ≤ ε für alle n ≥ N; Schreibweisen: {xn } → x, xn → x, lim xn =
n→∞
x oder lim xn = x.
Christian Kanzow, Universität Würzburg, WS 2010/11
4.2. FOLGEN IN METRISCHEN RÄUMEN
105
(c) Ein Punkt x ∈ X heißt Häufungspunkt der Folge {xn }, wenn es eine Teilfolge {xnk }
von {xn } gibt mit lim xnk = x.
k→∞
Gemäß Definition ist eine Folge {xn } in einem metrischen Raum (X, d) also genau dann
konvergent bzw. eine Cauchy–Folge, wenn die Folge der reellen Zahlen {d(x, xn )} konvergiert bzw. die Folge der reellen Zahlen {d(xm , xn )} eine Cauchy–Folge ist. Speziell in dem
metrischen Raum X := K mit der durch den Betrag induzierten Metrik stimmen die in der
Definition 4.8 eingeführten Begriffe mit den bislang bekannten Definitionen in K offenbar
überein.
Wir werden im Folgenden einige der uns bereits in K bekannten Aussagen über Folgen
auf allgemeine metrische Räume verallgemeinern. Dabei nennen wir eine Folge {xn } in
einem metrischen Raum (X, d) beschränkt, wenn ein x ∈ X und eine Konstante r > 0
existieren mit d(xn , x) < r für alle n ∈ N, also alle xn in einer hinreichend großen Kugel
vom Radius r > 0 um einen Punkt x ∈ X liegen.
Satz 4.9 ( Eigenschaften von konvergenten Folgen )
Sei (X, d) ein metrischer Raum. Dann gelten:
(a) Der Grenzwert einer konvergenten Folge ist eindeutig bestimmt.
(b) Jede konvergente Folge ist eine Cauchy–Folge.
(c) Jede konvergente Folge ist beschränkt.
(d) Jede Teilfolge einer konvergenten Folge ist konvergent und besitzt denselben Grenzwert.
(e) Besitzt eine Cauchy–Folge einen Häufungspunkt, so konvergiert bereits die gesamte
Folge gegen diesen Häufungspunkt.
Beweis: Der Beweis verläuft im Prinzip analog zu denen der entsprechenden Aussagen
in K. Um den Umgang mit metrischen Räumen etwas einzuüben, wollen wir dennoch die
Beweise komplett durchführen.
(a) Seien {xn } → x und {xn } → x′ für zwei Grenzwerte x, x′ ∈ X. Angenommen, diese sind
verschieden. Dann ist ε := d(x, x′ ) > 0. Aus der vorausgesetzten Konvergenz gegen x bzw.
x′ folgt außerdem die Existenz von gewissen Zahlen N1 , N2 ∈ N mit d(xn , x) < ε für alle
n ≥ N1 sowie d(xn , x′ ) < ε für alle n ≥ N2 . Damit ergibt sich aus der Dreiecksungleichung
unmittelbar
0 < d(x, x′ ) ≤ d(x, xn ) + d(xn , x′ ) < 2ε = d(x, x′ )
für alle n ≥ N := max{N1 , N2 }, was natürlich nicht sein kann.
(b) Nach Voraussetzung existiert ein x ∈ X mit xn → x für n → ∞. Also gibt es zu jedem
ε > 0 ein N ∈ N mit d(xn , x) < 2ε für alle n ≥ N. Dies impliziert
d(xn , xm ) ≤ d(xn , x) + d(x, xm ) <
ε ε
+ = ε für alle n, m ≥ N.
2 2
Christian Kanzow, Universität Würzburg, WS 2010/11
106
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Folglich ist {xn } eine Cauchy–Folge.
(c) Sei {xn } → x für ein x ∈ X. Zu ε = 1 existiert dann ein N ∈ N mit d(xn , x) < ε = 1
für alle n ≥ N. Hieraus folgt
d(xn , x) ≤ r := max{1, d(x1 , x), . . . , d(xN −1 , x)} für alle n ∈ N
und damit die Beschränktheit von {xn }.
(d) Diese Aussage ergibt sich unmittelbar aus der Definition einer Teilfolge.
(e) Sei ε > 0 beliebig gegeben. Da {xn } eine Cauchy–Folge ist, gibt es ein N1 ∈ N mit
d(xn , xm ) <
ε
2
für alle n, m ≥ N1 .
Ferner existiert nach Voraussetzung ein Häufungspunkt x ∈ X von {xn }. Also gibt es ein
N2 ∈ N und eine Teilfolge {xnk } mit
d(xnk , x) <
ε
2
für alle k ≥ N2 .
Für alle n ≥ N := max{N1 , N2 } folgt dann wegen nk ≥ k die Abschätzung
d(xn , x) ≤ d(xn , xnk ) + d(xnk , x) <
ε ε
+ =ε
2 2
und damit die Konvergenz der gesamten Folge {xn } gegen x.
2
Wegen Satz 4.9 ist jede konvergente Folge in einem metrischen Raum eine Cauchy–Folge.
Die Umkehrung dieser Aussage ist im Allgemeinen nicht richtig (Gegenbeispiel: X =
1
(0, 1), d(x, y) = |x − y| und xn := n+1
für n ∈ N) und gibt Anlass zu der folgenden
Definition.
Definition 4.10 Ein metrischer Raum (X, d) heißt vollständig, wenn jede Cauchy–Folge
in X konvergiert. Ein vollständiger normierter Raum heißt auch Banach–Raum.
Der Begriff der Vollständigkeit taucht hier bereits zum zweiten Mal auf: In der Definition
1.31 wurde ein angeordneter Körper als vollständig bezeichnet, wenn er die Supremumseigenschaft besitzt. Hier hingegen wird ein metrischer Raum als vollständig bezeichnet, wenn
jede Cauchy–Folge bereits konvergiert. Nun bildet die Menge der reellen Zahlen R aber sowohl einen angeordneten Körper (siehe Satz 1.32 als auch einen metrischen Raum (siehe
Beipiel 4.6 (a)). Daher ist die Vollständigkeit von R doppelt definiert. Die Ausführungen
am Ende des Abschnitts 3.2 zeigen aber, dass die Supremumseigenschaft in einem (archimedisch) geordneten Körper äquivalent war zur Konvergenz von Cauchy–Folgen. Aus
diesem Grunde stimmen beide Definitionen der Vollständigkeit für R überein.
Wir wollen als Nächstes die Vollständigkeit des Raumes Kn beweisen. Dazu ist das
nachstehende Resultat recht nützlich.
Christian Kanzow, Universität Würzburg, WS 2010/11
4.2. FOLGEN IN METRISCHEN RÄUMEN
107
Satz 4.11 ( Charakterisierung konvergenter Folgen im Kn )
Betrachte den normierten Raum Kn , versehen mit der Maximumnorm aus dem Beispiel
4.6 (c). Dann ist eine Folge {xk } ⊆ Kn genau dann konvergent gegen einen Grenzwert
x = (x1 , . . . , xn ) ∈ Kn , wenn alle Komponentenfolgen {xk,i } gegen xi konvergieren (i =
1, . . . , n). Dabei haben wir xk = (xk,1 , . . . , xk,n ) ∈ Kn geschrieben.
Beweis: Es gelte zunächst limk→∞ xk = x. Dann existiert zu jedem ε > 0 ein N ∈ N mit
kxk − xk∞ < ε für alle k ≥ N. Aus der Definition der Maximumnorm folgt dann für alle
Komponenten i = 1, . . . , n die Ungleichung
|xk,i − xi | ≤ kxk − xk∞ < ε für alle k ≥ N.
Somit gilt xk,i → xi für alle i = 1, . . . , n.
Sei umgekehrt xk,i → xi für alle i = 1, . . . , n vorausgesetzt. Zu beliebigem ε > 0
existieren dann gewisse Zahlen Ni ∈ N mit
|xk,i − xi | < ε für alle k ≥ Ni
und für alle i = 1, . . . , n. Setzen wir N := max{N1 , . . . , Nn } so folgt hieraus unmittelbar
kxk − xk∞ = max |xk,i − xi | < ε für alle k ≥ N.
i=1,...,n
Also gilt limk→∞ xk = x.
2
Als Konsequenz des Satzes 4.11 erhalten wir nun ein sehr wichtiges Beispiel für einen
Banach–Raum.
Satz 4.12 ( Vollständigkeit des Kn )
Der normierte Raum Kn , versehen mit der Maximumnorm aus dem Beispiel 4.6 (c), ist
ein Banach–Raum.
Beweis: Sei {xk } eine Cauchy–Folge in Kn . Schreiben wir für das k-te Folgenglied wieder
xk = (xk,1 , . . . , xk,n ) ∈ Kn , so folgt aus der Definition der Maximumnorm sofort
|xk,i − xm,i | ≤ kxk − xm k∞
für alle k, m ∈ N
und für alle i = 1, . . . , n. Also sind alle Komponentenfolgen {xk,i } Cauchy–Folgen in K.
Wegen Satz 3.22 sind alle Komponentenfolgen {xk,i } dann bereits konvergent. Wegen Satz
4.11 ist die Folge {xk } somit konvergent in Kn . Also ist Kn ein Banach–Raum.
2
Als weitere Konsequenz des Satzes 4.11 erhalten wir die nachstehende Verallgemeinerung
des Satzes von Bolzano–Weierstraß.
Satz 4.13 ( Satz von Bolzano–Weierstraß — Version 3 )
In dem normierten Raum Kn , versehen mit der Maximumnorm aus dem Beispiel 4.6 (c),
besitzt jede beschränkte Folge eine konvergente Teilfolge.
Christian Kanzow, Universität Würzburg, WS 2010/11
108
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Beweis: Sei {xk } eine beschränkte Folge in Kn . Der Beweis geschieht wieder durch Zurückführung auf die einzelnen Komponentenfolgen {xk,i }, wobei wir erneut xk = (xk,1 , . . . , xk,n ) ∈
Kn schreiben. Wegen |xk,i| ≤ kxk k∞ sind mit {xk } auch alle Komponentenfolgen {xk,1 }, . . . , {xk,n }
beschränkt in K. Insbesondere ist also {xk,1} beschränkt und besitzt nach dem Satz 3.20 von
Bolzano–Weierstraß damit eine konvergente Teilfolge. Dann ist auch die zugehörige Teilfolge von {xk,2 } beschränkt und besitzt damit ebenfalls eine konvergente (Teil–) Teilfolge.
Auf dieser neuen Teilfolge betrachten wir jetzt {xk,3 }, fahren mit unserer Argumentation so
fort und erhalten schließlich eine Teilfolge von {xk,n } die ebenfalls konvergiert. Auf dieser
letzten Teilfolge sind nun aber alle Komponentenfolgen {xk,i} konvergent. Wegen Satz 4.11
konvergiert dann auch die entsprechende Teilfolge von {xk }.
2
In den drei vorhergehenden Sätzen haben wir den Kn stets mit der Maximumnorm versehen. Es wird sich allerdings recht bald herausstellen, dass die Aussagen dieser Sätze auch
dann richtig sind, wenn wir den Kn mit irgendeiner anderen Norm versehen (zum Beispiel
der Euklidischen Norm). Dies folgt letztlich aus der Tatsache, dass im Kn alle Normen
äquivalent sind, siehe Satz 4.53 und die anschließenden Ausführungen.
Wir beweisen zum Abschluss dieses Abschnittes noch einige elementare Eigenschaften
von normierten Räumen.
Lemma 4.14 ( Rechenregeln für konvergente Folgen )
Sei (X, k · k) ein normierter Raum. Dann gelten:
(a) Aus xn → x und yn → y folgt xn + yn → x + y.
(b) Aus αn → α in K und xn → x folgt αn xn → αx.
(c) Aus xn → x folgt kxn k → kxk.
Beweis: Die Behauptung (a) folgt aus der Dreiecksungleichung wegen
k(xn + yn ) − (x + y)k ≤ kxn − xk + kyn − yk → 0
für n → ∞. Die Aussage (b) folgt aus
kαn xn − αxk ≤ kαn xn − αn xk + kαn x − αxk
= |αn | kxn − xk + |αn − α| kxk
→ 0
für n → ∞, da {αn } (als konvergente Folge) beschränkt ist. Schließlich ergibt sich die
Behauptung (c) aus
kxn k − kxk ≤ kxn − xk → 0
für n → ∞, wobei wir die inverse Dreiecksungleichung (4.1) benutzt haben.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
4.3. OFFENE UND ABGESCHLOSSENE MENGEN
4.3
109
Offene und abgeschlossene Mengen
Wir führen als Nächstes die offenen und abgeschlossenen Kugeln in einem metrischen Raum
ein. Die Namensgebung wird dadurch gerechtfertigt, dass es sich im Spezialfall des euklidischen Raumes (vergleiche das Beispiel 4.6 (b)) anschaulich tatsächlich um Kugeln handelt.
Definition 4.15 Seien (X, d) ein metrischer Raum, x ∈ X und ε > 0.
(a) Die Menge
Kε (x) := {y ∈ X | d(x, y) < ε}
heißt offene Kugel um x mit dem Radius ε > 0.
(b) Die Menge
K ε (x) := {y ∈ X | d(x, y) ≤ ε}
heißt abgeschlossene Kugel um x mit dem Radius ε > 0.
Will man den zu Grunde liegenden metrischen Raum hervorheben (der aus dem jeweiligen
Zusammenhang aber meist klar ist), so spricht man auch von offenen bzw. abgeschlossenen
Kugeln in X statt nur von offenen bzw. abgeschlossenen Kugeln.
Mit Hilfe der offenen Kugeln führen wir jetzt die zentralen Begriffe der offenen und
abgeschlossenen Mengen ein.
Definition 4.16 Seien (X, d) ein metrischer Raum und M ⊆ X eine gegebene Teilmenge.
(a) Ein x ∈ M heißt innerer Punkt von M (und M Umgebung von x), wenn es eine
offene Kugel Kε (x) gibt mit Kε (x) ⊆ M.
(b) M heißt offen, wenn alle x ∈ M innere Punkte von M sind.
(c) M heißt abgeschlossen, wenn das Komplement X \ M offen ist.
Man verifiziert sehr leicht, dass eine offene Kugel Kε (x) tatsächlich eine offene Menge im
Sinne der Definition 4.16 (b) ist; ebenso zeigt man ohne größere Probleme, dass es sich bei
einer abgeschlossenen Kugel K ε (x) um eine abgeschlossene Menge im Sinne der Definition
4.16 (c) handelt.
Abgeschlossene Mengen werden häufig aber auch anders definiert, weshalb wir hier die
nachstehende Charakterisierung abgeschlossener Mengen angeben.
Lemma 4.17 ( Charakterisierung abgeschlossener Mengen )
Seien (X, d) ein metrischer Raum und M ⊆ X eine gegebene Teilmenge. Dann sind äquivalent:
(a) M ist abgeschlossen.
(b) M enthält alle Häufungspunkte von Folgen in M, d.h.,
M = {x ∈ X | ∃{xn } ⊆ M : lim d(xn , x) = 0}.
n→∞
Christian Kanzow, Universität Würzburg, WS 2010/11
110
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Beweis: (a) =⇒ (b): Sei M abgeschlossen. Gemäß Definition ist das Komplement X \ M
dann offen. Sei nun x ∈ X ein Häufungspunkt von M. Dann existiert eine Folge {xn } ⊆ M
mit limn→∞ d(xn , x) = 0. Also ist Kε (x) ∩ M 6= ∅ für alle ε > 0. Somit kann x kein innerer
Punkt von X \ M sein. Da X \ M aber offen ist und damit alle Elemente von X \ M innere
Punkte sind, gehört x dann nicht zur Menge X \ M. Folglich ist x ∈ M.
(b) =⇒ (a): Die Menge M enthalte alle Häufungspunkte von Folgen aus M. Wir zeigen,
dass X \ M eine offene Menge ist. Sei dazu x ∈ X \ M beliebig gegeben. Nach Voraussetzung ist x dann kein Häufungspunkt von M. Also existiert ein ε > 0 mit Kε (x) ∩ M = ∅.
Dies impliziert Kε (x) ⊆ X \ M. Daher ist X \ M offen, also M selbst abgeschlossen. 2
Weiterhin gelten die folgenden beiden Resultate über offene und abgeschlossene Mengen,
die bereits aus der Grundvorlesung Analysis bekannt sein sollten.
Satz 4.18 Sei (X, d) ein metrischer Raum. Dann gelten:
(a) ∅ und X sind offen.
(b) Der Durchschnitt endlich vieler offener Mengen ist offen.
(c) Die Vereinigung beliebig vieler offener Mengen ist offen.
Beweis: (a) Der gesamte Raum X ist offen, da X Umgebung eines jeden Punktes x ∈ X
ist. Die leere Menge ∅ ist offen, da es keinen Punkt x ∈ ∅ gibt, zu dem es eine Kugel
Kε (x) ⊆ ∅ geben müsste.
T
(b) Seien O1 , . . . , On endlich viele offene Mengen und O := ni=1 Oi deren Durchschnitt.
Sei x ∈ O beliebig. Dann ist x ∈ Oi für alle i = 1, . . . , n. Da die Oi nach Voraussetzung
offen sind, existieren εi > 0 mit Kεi (x) ⊆ Oi für alle i = 1, . . . , n. Für ε := min{ε1 , . . . , εn }
gilt dann Kε (x) ⊆ Kεi (x) ⊆ Oi für alle i = 1, . . . , n und daher auch Kε (x) ⊆ O. Also ist O
eine offene Menge.
S
(c) Seien Oi (i ∈ I) offene Mengen und O := i∈I Oi deren Vereinigung. Sei x ∈ O beliebig
gegeben. Dann ist x ∈ Oi für (mindestens) ein i ∈ I. Da Oi nach Voraussetzung offen ist,
existiert per Definition ein ε > 0 mit Kε (x) ⊆ Oi . Dann ist erst recht Kε (x) ⊆ O und O
somit offen.
2
Die im Satz 4.18 genannten Eigenschaften (a), (b) und (c) werden häufig zur Definition
einer Topologie bzw. eines topologischen Raumes benutzt. Wir werden im Rahmen dieses
Skriptes aber nicht weiter auf diese Begriffe eingehen.
Man beachte übrigens, dass der Durchschnitt von beliebig vielen offenen Mengen nicht
mehr offen zu sein braucht. Beispielsweise besteht der Durchschnitt der offenen Intervalle
(−1/n, 1 + 1/n) für n ∈ N gerade aus dem abgeschlossenen Intervall [0, 1].
Durch Komplementbildung erhält man aus dem Satz 4.18 das folgende Resultat.
Christian Kanzow, Universität Würzburg, WS 2010/11
4.3. OFFENE UND ABGESCHLOSSENE MENGEN
111
Satz 4.19 Sei (X, d) ein metrischer Raum. Dann gelten:
(a) ∅ und X sind abgeschlossen.
(b) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen.
(c) Der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen.
Beweis: (a) Wegen X \ X = ∅ und X \ ∅ = X ergibt sich die Behauptung (a) unmittelbar
aus der Definition einer abgeschlossenen Menge sowie Satz 4.18 (a).
S
(b) Seien A1 , . . . , An endlich viele abgeschlossene Mengen und A := ni=1 Ai deren Vereinigung. Da die Komplemente X \ Ai offen sind, ist aufgrund des Satzes 4.18 (b) auch die
Schnittmenge
n
\
X \ Ai
i=1
offen. Nach der Regel von De Morgan gilt aber
X\
so dass X \
S
n
i=1
n
[
i=1
Ai =
n
\
i=1
X \ Ai ,
S
Ai offen und daher A := ni=1 Ai abgeschlossen ist.
T
(c) Seien Ai (i ∈ I) beliebig viele abgeschlossene Mengen und A := i∈I Ai deren Durchschnitt. Da alle Komplemente X \Ai dann offen sind, ist auch deren Vereinigung eine offene
Menge. Nach der Regel von De Morgan ist dann auch
\ [
X \ Ai
X\
Ai =
eine offene Menge und somit A :=
T
i∈I
i∈I
i∈I
Ai abgeschlossen.
2
Man beachte auch hier, dass die Vereinigung beliebig vieler abgeschlossener Mengen nicht
notwendig abgeschlossen ist. Beispielsweise besteht die Vereinigung der abgeschlossenen
Mengen [1/n, +∞) über alle n ∈ N gerade aus dem offenen Intervall (0, +∞). – Die Sätze
4.18 und 4.19 rechtfertigen insbesondere die folgende Definition.
Definition 4.20 Seien (X, d) ein metrischer Raum und M ⊆ X eine gegebene Teilmenge.
(a) Die Menge
cl(M) := M :=
\
{A | A abgeschlossen mit M ⊆ A}
heißt Abschluss (engl.: closure) von M.
Christian Kanzow, Universität Würzburg, WS 2010/11
112
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
(b) Die Menge
int(M) := M̊ :=
[
{O | O offen mit O ⊆ M}
heißt Inneres (engl.: interior) von M.
(c) Die Menge
bd(M) := ∂M
:= {x ∈ X | ∀ε > 0 : Kε (x) ∩ M 6= ∅ und Kε (x) ∩ X \ M 6= ∅}
heißt Rand (engl.: boundary) von M.
(d) Ein Element x ∈ X heißt Häufungspunkt der Menge M, wenn es eine Folge {xn } ⊆
M gibt mit limn→∞ xn = x und xn 6= x für alle n ∈ N.
Der Abschluss einer Menge M besteht also gerade aus dem Durchschnitt aller abgeschlossenen Mengen, die M enthalten. Das Innere einer Menge M hingegen ist die Vereinigung
aller offenen Mengen, die in M enthalten sind. Wegen Satz 4.19 (c) ist der Abschluss M
von M tatsächlich eine abgeschlossene Menge. Es ist offenbar die kleinste abgeschlossene
Menge, die M enthält. Analog ist das Innere M̊ von M wegen Satz 4.18 (c) eine offene
Menge; es handelt sich um die größte offene Teilmenge von M. Der Abschluss M lässt sich
auch wie folgt beschreiben.
Lemma 4.21 Seien (X, d) ein metrischer Raum, M ⊆ X eine gegebene Teilmenge und
x ∈ X gegeben. Dann sind äquivalent:
(a) x ∈ M .
(b) Es gibt eine Folge {xn } ⊆ M mit limn→∞ d(xn , x) = 0.
Beweis: Da M eine abgeschlossene Menge ist, gilt
x ∈ X | ∃{xn } ⊆ M : lim d(xn , x) = 0
n→∞
⊆ x ∈ X | ∃{xn } ⊆ M : lim d(xn , x) = 0
n→∞
= M,
wobei sich die letzte Gleichheit aus dem Lemma 4.17 ergibt.
Zum Nachweis der anderen Inklusion sei {xn } ⊆ M mit xn → x gegeben. Gemäß
Definition des Abschlusses M existiert zu jedem n ∈ N dann ein yn ∈ M mit d(xn , yn ) ≤ n1 .
Aus der Dreiecksungleichung folgt daher
d(x, yn ) ≤ d(x, xn ) + d(xn , yn ) → 0
für n → ∞. Also ist auch {yn } ⊆ M eine gegen x konvergente Folge. Mit Lemma 4.17 folgt
die Behauptung.
2
Christian Kanzow, Universität Würzburg, WS 2010/11
4.3. OFFENE UND ABGESCHLOSSENE MENGEN
113
Für die Mengen M̊ , M und M gelten trivialerweise die Inklusionen
M̊ ⊆ M ⊆ M .
Darüber hinaus sind die folgenden Eigenschaften erfüllt.
Lemma 4.22 Seien (X, d) ein metrischer Raum und M ⊆ X eine gegebene Teilmenge.
Dann gelten:
(a) M ist genau dann offen, wenn M̊ = M gilt.
(b) M ist genau dann abgeschlossen, wenn M = M gilt.
(c) ∂M ist stets abgeschlossen, und es gilt die Beziehung
∂M = M\M̊ .
Beweis: (a) Ist M offen und x ∈ M, so existiert ein ε > 0 mit Kε (x) ⊆ M. Also ist x
ein innerer Punkt von M, d.h. x ∈ M̊ . Somit gilt M ⊆ M̊ für jede offene Menge M. Die
umgekehrte Inklusion ist aufgrund der Vorbetrachtungen aber klar, so dass insgesamt M =
M̊ folgt. – Gilt umgekehrt M = M̊ , so ist M offen, da das Innere M̊ gemäß Vorbemerkung
stets eine offene Menge ist.
(b) Per Definition ist M die kleinste abgeschlossene Menge, die M enthält. Ist M selbst
abgeschlossen, so gilt dann natürlich M = M . Umgekehrt folgt aus M = M unmittelbar,
dass M abgeschlossen ist, da der Abschluss M gemäß Vorbetrachtung eine abgeschlossene
Menge ist.
(c) Wir zeigen zunächst die Gültigkeit von ∂M = M \M̊.
Sei dazu x ∈ ∂M gegeben. Dann ist Kε (x) ∩ M 6= ∅ und Kε (x) ∩ (X \ M) 6= ∅ für alle
ε > 0. Insbesondere gilt K1/n (x)∩M 6= ∅ für alle n ∈ N. Also existiert eine Folge {xn } ⊆ M
mit limn→∞ d(xn , x) = 0. Wegen Lemma 4.17 ist dann x ∈ M . Andererseits ist x 6∈ M̊, denn
sonst gäbe es ein ε > 0 mit Kε (x) ⊆ M im Widerspruch zu Kε (x) ∩ (X \ M) 6= ∅ für alle
ε > 0. Also ist x ∈ M \ M̊ . Da x ∈ ∂M beliebig gewählt war, folgt hieraus ∂M ⊆ M \ M̊ .
Zum Nachweis der umgekehrten Inklusion sei x ∈ M \ M̊ beliebig gegeben. Wegen
x 6∈ M̊ ist x kein innerer Punkt von M, also gilt Kε (x) ∩ (X \ M) 6= ∅ für alle ε > 0.
Andererseits ist x ∈ M . Gemäß Lemma 4.21 existiert daher eine Folge {xn } ⊆ M mit
limn→∞ d(xn , x) = 0, so dass auch Kε (x) ∩ M 6= ∅ für alle ε > 0 ist. Zusammen zeigt dies
x ∈ ∂M und damit die Beziehung M \ M̊⊆ ∂M.
Wegen ∂M = M \ M̊ = M ∩ X \ M̊ folgt mit Satz 4.19 dann auch die Abgeschlossenheit von ∂M, denn M ist per Definition abgeschlossen und X \ M̊ ist abgeschlossen als
Komplement einer offenen Menge.
2
Christian Kanzow, Universität Würzburg, WS 2010/11
114
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Wir beenden diesen Abschnitt noch mit einer Warnung: In einem metrischen Raum ist der
Abschluss Kε (x) der offenen Kugel Kε (x) im Allgemeinen nicht gleich der abgeschlossenen
Kugel K ε (x). Zwar gilt stets die Inklusion Kε (x) ⊆ K ε (x) (denn Kε (x) ist ja die kleinste
abgeschlossene Menge, die Kε (x) enthält), jedoch kann diese Inklusion durchaus echt sein.
Um dies einzusehen, betrachten wir noch einmal den diskreten Raum (X, d) aus dem
Beispiel 4.2 (a): Für x ∈ X und ε = 1 gilt dort
K1 (x) = {y ∈ X | d(x, y) < 1} = {x}
und daher auch K1 (x) = {x}. Für die abgeschlossene Kugel hingegen folgt
K 1 (x) = {y ∈ X | d(x, y) ≤ 1} = X,
und dies unterscheidet sich offenbar von K1 (x) = {x}, sobald die Menge X mindestens
zwei Elemente enthält.
4.4
Stetige Funktionen
Zwecks Definition einer stetigen Funktion beginnen wir mit dem folgenden Resultat.
Satz 4.23 Seien (X1 , d1 ) und (X2 , d2 ) metrische Räume, f : X1 → X2 eine gegebene
Abbildung sowie x ∈ X1 . Dann sind die folgenden Aussagen äquivalent:
(a) Für jede Folge {xn } ⊆ X1 mit {xn } → x gilt f (xn ) → f (x).
(b) Zu jedem ε > 0 existiert ein δ > 0 mit d2 (f (y), f (x)) < ε für alle y ∈ X1 mit
d1 (y, x) < δ.
Beweis: (a) =⇒ (b): Es gelte f (xn ) → f (x) für jede Folge {xn } ⊆ X1 mit xn → x.
Angenommen, die Aussage (b) sei nicht erfüllt. Dann existiert ein spezielles ε > 0, so
dass es für jedes δ > 0 ein y ∈ X1 gibt mit d1 (x, y) < δ und d2 (f (x), f (y)) ≥ ε. Für
δ = 1/n mit n ∈ N erhalten wir auf diese Weise eine Folge {xn } mit d1 (x, xn ) < 1/n und
d2 (f (x), f (xn )) ≥ ε für alle n ∈ N. Die Folge {xn } konvergiert also gegen x, ohne dass dies
für die zugehörigen Funktionswerte gilt, was im Widerspruch zur Voraussetzung (a) steht.
(b) =⇒ (a): Es gelte jetzt die Eigenschaft (b). Sei {xn } ⊆ X1 eine beliebige Folge mit xn →
x. Zu beliebigem ε > 0 existiert nach Voraussetzung (b) ein δ > 0 mit d2 (f (x), f (xn )) < ε
für alle xn mit d1 (x, xn ) < δ. Wegen xn → x gilt aber d1 (x, xn ) < δ für alle n ≥ N mit
einem hinreichend großen N ∈ N. Also ist d2 (f (x), f (xn )) < ε für alle n ≥ N. Da ε > 0
beliebig gewählt war, folgt hieraus limn→∞ f (xn ) = f (x).
2
Die beiden (äquivalenten) Aussagen des vorigen Satzes sollen durch die nachstehenden
Abbildungen 4.1 und 4.2 geometrisch erläutert werden. Als metrischer Raum tritt hier der
Raum R2 (versehen mit der euklidischen Norm) auf, der Definitionsbereich der betrachteten
Christian Kanzow, Universität Würzburg, WS 2010/11
4.4. STETIGE FUNKTIONEN
115
Funktion f wird mit D(f ) bezeichnet, das im Satz 4.23 (b) auftretende δ hat den Namen
δε , da es im Allgemeinen von dem gegebenen ε abhängt, und Uδε (x0 ) bezeichnet eine
Kugelumgebung um den Punkt x0 mit dem Radius δε .
f
X
Y
D(f )
xn
Uε f (x0 )
f (x0 )
x0
Uδε (x0 )
f (xn )
Abbildung 4.1: Geometrische Interpretation von Satz 4.23 (a)
X
f
D(f )
Y
Uδε (x0 ) ∩ D(f )
x0
f Uδε (x0 ) ∩ D(f )
Uε f (x0 )
f (x0 )
Abbildung 4.2: Geometrische Interpretation von Satz 4.23 (b)
Der Satz 4.23 ist Grundlage für die nachfolgende Definition einer stetigen Abbildung.
Definition 4.24 Seien (X1 , d1 ) und (X2 , d2 ) metrische Räume sowie f : X1 → X2 eine
gegebene Abbildung.
(a) f heißt stetig im Punkte x ∈ X1 , wenn eine der äquivalenten Bedingungen (a) oder
(b) des Satzes 4.23 erfüllt ist.
(b) f heißt stetig in X1 , wenn f in jedem Punkt dieser Menge stetig ist.
Die Bedingungen (a) und (b) aus dem Satz 4.23 werden auch als Folgen–Kriterium bzw.
ε–δ–Kriterium für die Stetigkeit bezeichnet. Letzteres wird in der Abbildung 4.3 veranschaulicht. Es soll an dieser Stelle explizit hervorgehoben werden, dass die Wahl von δ
in dem ε–δ–Kriterium im Allgemeinen sowohl von dem gegebenen ε als auch von dem
betrachteten Punkt x abhängt, weshalb manchmal auch δ = δ(ε, x) geschrieben wird.
Christian Kanzow, Universität Würzburg, WS 2010/11
116
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
2δε –Streifen um x0
f (x)
f (x0 ) + ε
2ε–Streifen um f (x0 )
f (x0 )
f (x0 ) − ε
x
x0 − δε
x0
x0 + δε
Abbildung 4.3: Veranschaulichung des ε–δ–Kriteriums der Stetigkeit
Mittels der Quantor–Schreibweise lässt sich die Stetigkeit von f in einem Punkt x
wieder sehr kurz definieren. Das Folgen–Kriterium lautet dann:
f stetig in x ∈ X1 :⇐⇒ ∀{xn } ⊆ X1 : xn → x =⇒ f (xn ) → f (x) .
Das ε–δ–Kriterium hingegen lässt sich wie folgt schreiben:
f stetig in x ∈ X1 :⇐⇒ ∀ε > 0∃δ > 0 : d1 (x, y) < δ =⇒ d2 f (x), f (y) < ε .
Dem Leser sei dringend empfohlen, sich beide Formulierungen der Stetigkeit zu verinnerlichen.
Das Folgen–Kriterium lässt sich sehr einprägsam offenbar auch wie folgt formulieren:
Eine Funktion f ist genau dann stetig in einem Punkt x ∈ X1 , wenn für alle gegen x
konvergenten Folgen {xn } ⊆ X1 gilt:
lim f (xn ) = f ( lim xn ).
n→∞
n→∞
Die Stetigkeit einer Funktion besagt also, dass man den Limes mit der Funktion vertauschen
darf.
Für das ε–δ–Kriterium der Stetigkeit wollen wir hier noch kurz die Formulierung für
den Spezialfall des Raumes K (versehen mit dem üblichen Absolutbetrag) angeben. Sei
also f : D → K eine gegebene Funktion mit dem Definitionsbereich D ⊆ K. Dann heißt f
stetig in x ∈ K, wenn es für alle ε > 0 ein (im Allgemeinen sowohl von x als auch von ε
abhängiges) δ > 0 gibt derart, dass f (y)−f (x) < ε für alle y ∈ D mit |x−y| < δ gilt (ε–δ–
Kriterium). Diese Definition wird durch die Abbildung 4.4 veranschaulicht. Die Abbildung
4.5 zeigt hingegen eine unstetige Funktion, welche das ε–δ–Kriterium nicht erfüllt.
Christian Kanzow, Universität Würzburg, WS 2010/11
4.4. STETIGE FUNKTIONEN
ε
ε
117
f
f (x0 )
x
δ δ
x0
Abbildung 4.4: Beispiel einer stetigen Funktion
f
ε
ε
f (x0 )
x
x0
Abbildung 4.5: Beispiel einer unstetigen Funktion
Wir geben als Nächstes einige Beispiele von stetigen Funktionen an.
Beispiel 4.25 (a) Die Funktion f (x) = c für eine Konstante c ∈ K ist auf ganz K
stetig. Wir verifizieren diese Aussage mittels des Folgen–Kriteriums. Sei dazu x ∈
K ein beliebiger Punkt und {xn } irgendeine gegen x konvergente Folge. Dann gilt
f (xn ) = c → c = f (x) für n → ∞. Also ist f stetig in x.
(b) Wir betrachten die Funktion f (x) := x. Diese ist ebenfalls stetig auf ganz K. Dies
soll nun mittels des ε–δ–Kriteriums verifiziert werden. Seien dazu x ∈ K und ε > 0
beliebig gegeben. Setze dann δ := ε > 0. Dann gilt für alle y ∈ K mit |x − y| < δ die
Ungleichung
f (x) − f (y) = |x − y| < δ = ε,
was zu zeigen war. (In diesem Fall hängt δ also nicht von dem speziellen Punkt x,
Christian Kanzow, Universität Würzburg, WS 2010/11
118
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
wohl aber von ε ab).
(c) Die Funktion f (x) := x2 ist ebenfalls auf ganz K stetig. Um dies einzusehen, benutzen
wir wieder das ε–δ–Kriterium. Seien dazu x ∈ K und ε > 0 beliebig gegeben. Wir
haben nun ein geeignetes δ > 0 zu finden, so dass die Implikation
|x − y| < δ =⇒ |x2 − y 2 | = f (x) − f (y) < ε
(4.3)
gilt. Nun ist
|x2 − y 2| = |x + y| · |x − y| < ε
für alle jene y ∈ K, die den beiden Ungleichungen
|x + y| ≤ |x − y| + 2|x| < 2|x| + 1 und |x − y| <
ε
2|x| + 1
genügen. Setzen wir daher
δ := min 1,
ε
2|x| + 1
,
so ist (4.3) offenbar erfüllt und f somit stetig in x. Da x beliebig gewählt war, folgt
hieraus die Stetigkeit von f auf ganz K. (In diesem Fall hängt die Wahl von δ > 0
also sowohl von dem betrachteten Punkt x als auch von dem gewählten ε ab.)
(d) Die Funktion f : R → R mit
f (x) :=
1
0
für x ∈ Q,
für x ∈
/Q
ist in keinem Punkt des Definitionsbereiches D = R stetig. Sei nämlich x ∈ R
beliebig gewählt. Dann gibt es wegen Satz 1.34 in jeder noch so kleinen Umgebung
von x sowohl rationale als auch irrationale Zahlen. Insbesondere existiert stets ein
y ∈ R mit |f (x) − f (y)| = 1. Somit gibt es beispielsweise zu ε = 21 kein δ > 0 derart,
dass die Forderung der Stetigkeit von f in x erfüllt wäre.
(e) Seien (X, k · k) ein normierter Raum und f : X → R gegeben durch f (x) := kxk.
Dann ist f stetig in jedem Punkt x ∈ X. Dies folgt sofort aus dem Folgen–Kriterium
der Stetigkeit und dem Lemma 4.14 (c).
3
Die Stetigkeit einer Funktion f : X1 → X2 kann natürlich auch auf Teilmengen M ⊆ X1
definiert werden, indem man M selbst als metrischen Raum betrachtet gemäß Beispiel 4.2
(c). Auch das nachfolgende Stetigkeitskriterium ließe sich auf diese Weise für Teilmengen
metrischer Räume formulieren.
Satz 4.26 ( Charakterisierung der Stetigkeit )
Seien (X1 , d1 ) und (X2 , d2 ) metrische Räume und f : X1 → X2 eine gegebene Abbildung.
Dann sind äquivalent:
Christian Kanzow, Universität Würzburg, WS 2010/11
4.4. STETIGE FUNKTIONEN
119
(a) f ist stetig auf X1 .
(b) Für alle offenen O ⊆ X2 ist das Urbild f −1 (O) offen in X1 .
(c) Für alle abgeschlossenen A ⊆ X2 ist das Urbild f −1 (A) abgeschlossen in X1 .
Beweis: (a) =⇒ (b): Sei f stetig auf X1 und O ⊆ X2 eine offene Menge. Wir haben zu
zeigen, dass jedes Element von f −1 (O) ein innerer Punkt ist. Sei dazu x ∈ f −1 (O) beliebig
gegeben. Dann ist f (x) ∈ O. Da O offen ist, existiert ein ε > 0 mit Kε (f (x)) ⊆ O, also
y ∈ O für alle y mit d2 (f (x), y) < ε. Aus der vorausgesetzten Stetigkeit von f in x ergibt
sich die Existenz eines δ > 0 mit d2 (f (x), f (z)) < ε für alle z mit d1 (x, z) < δ. Also gilt
f (z) ∈ O und somit z ∈ f −1 (O) für alle z mit d1 (x, z) < δ. Folglich ist Kδ (x) ⊆ f −1 (O)
und f −1 (O) somit eine offene Menge.
(b) =⇒ (a): Sei x ∈ X1 beliebig gegeben. Wir zeigen die Stetigkeit von f in x unter
Verwendung des ε–δ–Kriteriums aus dem Satz 4.23 (b). Sei dazu ε > 0 und betrachte
die offene Kugel Kε (f (x)). Nach Voraussetzung (b) ist das Urbild f −1 (Kε (f (x))) dann
eine offene Menge in X1 . Wegen x ∈ f −1
(Kε (f (x))) existiert daher ein δ > 0 mit Kδ (x) ⊆
−1
f (Kε (f (x))). Dies impliziert f Kδ (x) ⊆ Kε (f (x)). Mit anderen Worten: Für alle y ∈ X1
mit d1 (x, y) < δ gilt d2 (f (x), f (y)) < ε. Somit ist f stetig in x. Da x ∈ X1 beliebig gewählt
war, folgt die Behauptung (a).
(b) =⇒ (c): Sei A ⊆ X2 eine abgeschlossene Menge. Dann ist X2 \ A offen. Wegen Teil (b)
ist auch das Urbild f −1 (X2 \ A) offen. Aufgrund der leicht nachprüfbaren Identität
f −1 (X2 \ A) = X1 \ f −1 (A)
ist dann auch X1 \ f −1 (A) offen. Also ist f −1 (A) abgeschlossen in X1 .
(c) =⇒ (b): Sei O ⊆ X2 eine offene Menge. Dann ist X2 \ O abgeschlossen. Nach Voraussetzung (c) ist dar Urbild f −1 (X2 \ O) ebenfalls abgeschlossen. Aus der Identität
f −1 (X2 \ O) = X1 \ f −1 (O)
folgt die Abgeschlossenheit von X1 \ f −1 (O). Also ist f −1 (O) selbst eine offene Menge in
X1 .
2
Ganze Klassen stetiger Funktionen erhält man aus dem folgenden Resultat.
Satz 4.27 ( Summe, Produkt etc. stetiger Funktionen sind stetig )
Seien (X, d) ein metrischer Raum, λ ∈ K, sowie f, g : X → K zwei in einem Punkt x ∈ X
stetige Funktionen. Dann sind auch die Funktionen
f + g : X → K,
λf : X → K und
f ·g :X →K
Christian Kanzow, Universität Würzburg, WS 2010/11
120
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
stetig in x. Gilt überdies g(x) 6= 0, so ist
f
: X ′ → K mit X ′ := {y ∈ X | g(y) 6= 0}
g
ebenfalls stetig in x.
Beweis: Wir verwenden das Folgen–Kriterium der Stetigkeit. Sei {xn } ⊆ X dazu eine
beliebige gegen x konvergente Folge. Dann haben wir zu zeigen:
lim (f + g)(xn ) = (f + g)(x),
n→∞
lim (λf )(xn ) = (λf )(x),
n→∞
lim (f · g)(xn ) = (f · g)(x),
f f
(xn ) =
(x).
lim
n→∞ g
g
n→∞
Nach Voraussetzung ist aber limn→∞ f (xn ) = f (x) und limn→∞ g(xn ) = g(x). Die Behauptung folgt daher aus den entsprechenden Rechenregeln für Folgen, vergleiche Satz 3.7. 2
Da die konstanten Funktionen f : D → K, f (x) = c (c ∈ K) sowie die Identität f : D →
K, f (x) = x stetig sind, folgt durch wiederholte Anwendung des Satzes 4.27 sofort die
Stetigkeit aller Polynome und aller rationalen Funktionen (auf ihrem Definitionsbereich).
Satz 4.28 ( Kompositum stetiger Funktionen ist stetig )
Seien (Xi , di ) für i = 1, 2, 3 metrische Räume, f : X1 → X2 stetig in einem Punkt x ∈ X1
und g : X2 → X3 stetig in y := f (x). Dann ist das Kompositum g ◦ f : X1 → X3 stetig in
x.
Beweis: Zum Beweis benutzen wir erneut das Folgen–Kriterium der Stetigkeit. Sei also
{xn } ⊆ X1 eine beliebige gegen x konvergente Folge. Nach Voraussetzung ist f in x stetig,
also gilt f (xn ) → f (x). Damit ist yn := f (xn ) eine gegen y = f (x) konvergente Folge in
X2 . Nun ist g aber stetig
in y, so dass g(yn ) → g(y)
in X3 gilt. Insgesamt haben wir daher
(g ◦ f )(xn ) = g f (xn ) = g(yn ) → g(y) = g f (x) = (g ◦ f )(x), was die Stetigkeit von g ◦ f
in x beweist.
2
Offenbar sind die auf einer Teilmenge D ⊆ K definierten Funktionen
¯
|·|
Re
Im
:
:
:
:
D
D
D
D
→ K,
→ K,
→ K,
→ K,
x 7→ x,
x 7→ |x|,
x 7→ Re(x),
x 7→ Im(x)
Christian Kanzow, Universität Würzburg, WS 2010/11
4.4. STETIGE FUNKTIONEN
121
allesamt stetig, denn bezeichnet g eine dieser Funktionen, so gilt
g(xn ) − g(x) ≤ |xn − x| → 0
für jede gegen ein x ∈ D konvergente Folge {xn } ⊆ D. Also sind wegen Satz 4.28 auch die
Abbildungen
f
|f |
Ref
Imf
:
:
:
:
D
D
D
D
→ K, x 7→ f (x),
→ R, x 7→ |f (x)|,
→ R, x 7→ Re(f (x)),
→ R, x 7→ Im(f (x))
stetig auf ihrem jeweiligen Definitionsbereich.
Der nachstehende Satz ist von zentraler Bedeutung in der Analysis. Er gilt ausschließlich
für reellwertige Funktionen auf Intervallen der Gestalt
[a, b] := {x ∈ R | a ≤ x ≤ b}
mit gegebenen a, b ∈ R.
Satz 4.29 ( Zwischenwertsatz )
Sei f : [a, b] → R stetig. Dann existiert zu jedem Wert γ zwischen f (a) und f (b) mindestens
ein c ∈ [a, b] mit f (c) = γ.
Beweis: Für γ = f (a) bzw. γ = f (b) braucht man nur c = a bzw. c = b zu wählen. Wir
behandeln im Folgenden daher nur den Fall f (a) < γ < f (b) (analog für f (b) < γ < f (a)).
Die Menge
M := {x ∈ [a, b] | f (x) ≤ γ}
ist nichtleer und nach oben beschränkt. Sie besitzt daher ein Supremum c aufgrund der
Vollständigkeit von R. Wir zeigen nun, dass f (c) = γ gilt.
Da c die kleinste obere Schranke von M ist, existiert eine Folge von Punkten xn ∈ M
mit xn → c. Wegen f (xn ) ≤ γ impliziert das Folgen–Kriterium der Stetigkeit daher
f (c) = lim f (xn ) ≤ γ.
n→∞
Dies liefert insbesondere c 6= b, also c < b. Folglich gibt es eine Folge {yn } von Punkten
yn ∈ [c, b] mit yn → c. Wegen f (yn ) ≥ γ erhalten wir aus dem Satz 4.23 somit
f (c) = lim f (yn ) ≥ γ.
n→∞
Zusammen ergibt sich gerade f (c) = γ.
2
Der Zwischenwertsatz ist für unstetige Funktionen im Allgemeinen nicht richtig. Ebenso
muss er selbst für stetige Abbildungen nicht richtig sein, wenn der Definitionsbereich kein
Intervall ist. Der Leser mag sich hierfür selbst geeignete Gegenbeispiele konstruieren. Zur
Illustration des Zwischenwertsatzes verweisen wir ansonsten auf die Abbildung 4.6.
Christian Kanzow, Universität Würzburg, WS 2010/11
122
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
f (b)
f
γ
f (a)
x
a
c
b
Abbildung 4.6: Veranschaulichung des Zwischenwertsatzes
4.5
Grenzwerte von Funktionen
Für Funktionen f und Punkte x soll in diesem Abschnitt die Bedeutung des Grenzwertes
limy→x f (x) erklärt werden. Dabei wird nicht verlangt, dass x zum Definitonsbereich von f
gehört. Sollte dies doch der Fall sein, so ist der Funktionswert f (x) völlig irrelevant für den
fraglichen Grenzwert. Vielmehr sind nur die Werte f (y) für y in der Nähe von x ausschlaggebend. Dazu muss es solche Punkte natürlich geben, also x zumindest ein Häufungspunkt
des Definitionsbereichs von f sein. Die formale Definition für den Grenzwert einer Funktion
lautet daher wie folgt.
Definition 4.30 Seien X1 und X2 metrische Räume, D ⊆ X1 , f : D → X2 und x ∈ X1
ein Häufungspunkt von D. Dann schreiben wir
lim f (y) = b oder f (y) → b für y → x
y→x
und nennen
b den Grenzwert von f für y → x, wenn es zu jedem ε > 0 ein δ > 0 gibt mit
d2 f (y), b < ε für alle y ∈ D mit y 6= x und d1 (x, y) < δ.
Eine Charakterisierung des gerade eingeführten Begriffs ist in dem folgenden Resultat
enthalten.
Satz 4.31 ( Charakterisierung von Grenzwerten )
Seien X1 und X2 metrische Räume, D ⊆ X1 , f : D → X2 und x ∈ X1 ein Häufungspunkt
von D. Dann gilt limy→x f (y) = b genau dann, wenn limn→∞ f (xn ) = b für alle Folgen
{xn } ⊆ X1 mit limn→∞ xn = x und xn 6= x für alle n ∈ N ist.
Beweis: Der Beweis ist völlig analog zu dem des Satzes 4.23, mit dem die Stetigkeit einer
Funktion definiert wurde. Unsere Definition des Grenzwertes limy→x f (y) entspricht dabei
der ε–δ–Definition der Stetigkeit, während die hier angegebene Charakterisierung letztlich
dem Folgen–Kriterium der Stetigkeit entspricht.
2
Wir betrachten als Nächstes einige Beispiele.
Christian Kanzow, Universität Würzburg, WS 2010/11
4.5. GRENZWERTE VON FUNKTIONEN
Beispiel 4.32
123
(a) Betrachte die Funktion f : [−1, +1] → R mit
0, falls x 6= 0,
f (x) :=
1, falls x = 0
und hier speziell den Punkt x = 0, der offenbar zum Definitionsbereich D := [−1, +1]
von f gehört. Dann ist limy→0 f (y) = 0, insbesondere ist dieser Grenzwert verschieden
von dem Funktionswert f (0) = 1.
(b) Betrachte die Funktion f : D → R mit
x2 − 1
f (x) :=
x−1
und dem Definitionsbereich D := {x ∈ R | x 6= 1}.
Wegen x2 − 1 = (x + 1)(x − 1) ist dann limy→1 f (y) = limy→1 (y + 1) = 2. Der Punkt
x = 1 liegt in diesem Beispiel zwar nicht in dem Definitionsbereich von f , jedoch
lässt sich f durch die Festsetzung f (1) := 2 stetig in x = 1 ergänzen.
(c) Betrachte die Signum–Funktion f : R → R mit

 +1, falls x > 0,
f (x) := sgn(x) :=
0,
falls x = 0,

−1, falls x < 0.
In x = 0 existiert der Grenzwert limy→0 f (y) nicht, denn für eine beliebige Nullfolge
{xn } ⊆ (0, +∞) gilt limn→∞ f (xn ) = 1, während wir für jede Nullfolge {xn } ⊆
(−∞, 0) den hiervon verschiedenen Grenzwert limn→∞ f (xn ) = −1 erhalten.
3
Der Zusammenhang zwischen dem Grenzwert einer Funktion und der Stetigkeit dieser
Funktion wird durch das nächste Resultat geklärt. Da dieses völlig offensichtlich ist, verzichten wir an dieser Stelle auf einen formalen Beweis.
Satz 4.33 Seien X1 und X2 metrische Räume, D ⊆ X1 , f : D → X2 und x ∈ D ein
Häufungspunkt von D. Dann ist f genau dann stetig in x, wenn limy→x f (y) = f (x) gilt.
Man beachte, dass wir im Satz 4.33 (im Gegensatz zur Definition 4.30 und dem Satz 4.31)
voraussetzen, dass der betrachtete Punkt x zum Definitionsbereich D von f gehört. Dies
ist natürlich nötig, da wir anderenfalls nicht von der Stetigkeit der Funktion f in diesem
Punkt sprechen könnten.
Für reelle Funktionen geben wir als Nächstes noch die Definition von einseitigen (links–
oder rechtsseitigen) Grenzwerten.
Definition 4.34 Seien X ein metrischer Raum, D ⊆ R, f : D → X und x ∈ D ein
Häufungspunkt von D. Dann schreiben wir
lim f (y) = b oder f (y) → b für y → x+
y→x+
Christian Kanzow, Universität Würzburg, WS 2010/11
124
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
und nennen b den rechtsseitigen
Grenzwert von f für y → x+, wenn es zu jedem ε > 0 ein
δ > 0 gibt mit d f (y), b < ε für alle y ∈ D mit y ∈ (x, x + δ) (insbesondere sollen solche
y existieren). Entsprechend schreiben wir
lim f (y) = b oder f (y) → b für y → x−
y→x−
und nennen b den linksseitigen
Grenzwert von f für y → x−, wenn es zu jedem ε > 0 ein
δ > 0 gibt mit d f (y), b < ε für alle y ∈ D mit y ∈ (x − δ, x) (insbesondere sollen solche
y wieder existieren).
Die beiden gerade eingeführten einseitigen Grenzwerte lassen sich wieder durch geeignete
Folgen–Kriteria charakterisieren. Beispielsweise gilt
lim f (y) = b
y→x+
genau dann, wenn limn→∞ f (xn ) = b für alle Folgen {xn } ⊆ D mit limn→∞ xn = x und
xn > x für alle n ∈ N ist (insbesondere sollen derartige Folgen existieren).
Wir betrachten wieder einige Beispiele.
Beispiel 4.35 (a) Existiert der Grenzwert limy→x f (y), so existieren auch die beiden
einseitigen Grenzwerte limy→x+ f (y) und limy→x− f (y), und es gilt die Beziehung
limy→x+ f (y) = limy→x f (y) = limy→x− f (y).
(b) Die Umkehrung von (a) gilt ebenfalls: Existieren die beiden einseitigen Grenzwerte limy→x+ f (y) und limy→x− f (y) und gilt dabei limy→x+ f (y) = limy→x− f (y), so
existiert auch der Grenzwert limy→x f (y), und für diesen gelten die Gleichheiten
limy→x f (y) = limy→x+ f (y) = limy→x− f (y).
(c) Die Aussage (b) wird falsch, wenn zwar die beiden einseitigen Grenzwerte limy→x+ f (y)
und limy→x− f (y) existieren, ihre Werte jedoch verschieden sind. Betrachte hierzu
die Signum–Funktion aus dem Beispiel 4.32 (c). Hier gilt limy→0+ f (y) = 1 und
limy→0− f (y) = −1, der Grenzwert limy→x f (y) existierte jedoch nicht.
(d) Man bestätigt sehr leicht die Gültigkeit der einseitigen Grenzwerte
1
= +∞ für ungerade n ∈ N,
x→0+ xn
1
lim n = −∞ für ungerade n ∈ N,
x→0− x
lim
wobei hier unendliche“ Grenzwerte auftreten, die wir formal erst gleich einführen
”
werden.
3
In Verallgemeinerung des letzten Beispiels und der bisherigen Definitionen lassen sich auch
die uneigentlichen Grenzwerte
lim f (y) und
y→+∞
lim f (y)
y→−∞
Christian Kanzow, Universität Würzburg, WS 2010/11
4.5. GRENZWERTE VON FUNKTIONEN
125
einführen. Wir tun dies im Folgenden nur für den Fall y → +∞, denn für y → −∞ kann
alles analog erfolgen.
Definition 4.36 Seien X ein metrischer Raum und f : [a, +∞) → X eine gegebene
Funktion. Dann schreiben wir
lim f (y) = b oder f (y) → b für y → +∞
y→+∞
und nennen b den (uneigentlichen) Grenzwert von f für y → +∞, wenn es zu jedem ε > 0
ein ξ ∈ [a, +∞) gibt mit d f (y), b < ε für alle y ≥ ξ.
Anschaulich besagt die obige Definition, dass limy→+∞ f (y) = b genau dann gilt, wenn
der Funktionswert f (y) für alle hinreichend großen y sich um nicht mehr als ε von dem
Grenzwert b unterscheidet. Unter Verwendung von Folgen lässt sich die Definition 4.36
auch wie folgt formulieren: Es gilt limy→+∞ f (y) = b genau dann, wenn limn→+∞ f (xn ) = b
für alle Folgen {xn } ⊆ [a, +∞) mit limn→∞ xn = +∞ erfüllt ist. Daher ist auch nicht verwunderlich, dass das folgende Cauchy–Kriterium gilt, dessen Beweis dem Leser als Übung
überlassen bleibt.
Satz 4.37 ( Cauchy–Kriterium für uneigentliche Grenzwerte )
Sei f : [a, +∞) → R eine gegebene Funktion. Dann existiert limy→+∞ f (y) genau dann,
wenn es zu jedem ε > 0 ein ξ ∈ [a, +∞) gibt mit |f (x) − f (y)| < ε für alle x, y ≥ ξ.
Die Verallgemeinerung der Definition 4.36 auf Ausdrücke der Gestalt
lim f (y) = b,
y→−∞
lim f (y) = ±∞ und
y→+∞
lim f (y) = ±∞
y→−∞
sollte klar sein. Als kleine Anwendung hiervon betrachten wir das folgende Beispiel.
Beispiel 4.38 Sei p : R → R ein Polynom
p(x) = an xn + . . . + a1 x + a0
ungeraden Grades mit an > 0. Für x → ±∞ dominiert die höchste Potenz offenbar das
Grenzwertverhalten von p. Wegen n ungerade haben wir somit
lim p(x) = +∞ und
x→+∞
lim p(x) = −∞.
x→−∞
Also existieren a, b ⊆ R mit a < b und p(a) < 0 < p(b). Da p stetig ist, besitzt das Polynom
p aufgrund des Zwischenwertsatzes 4.29 daher eine Nullstelle ξ ∈ (a, b). Analog verifiziert
man diese Aussage auch im Fall an < 0. Wir haben also gezeigt, dass jedes reelle Polynom
(also ak ∈ R) ungeraden Grades mindestens eine Nullstelle in R besitzt.
3
Christian Kanzow, Universität Würzburg, WS 2010/11
126
4.6
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Kompakte Mengen
Wir beschäftigen uns in diesem Abschnitt mit den so genannten kompakten Mengen eines
metrischen Raumes. Zu diesem Zweck beginnen wir mit der Definition von verschiedenen Kompaktheitsbegriffen, deren Verhältnis zueinander in den nachfolgenden Resultaten
diskutiert wird.
Definition 4.39 Eine Teilmenge M eines metrischen Raumes (X, d) heißt
(a) überdeckungskompakt, wenn jede offene Überdeckung von M eine endliche Teilüberdeckung enthält, d.h.,
M⊆
[
i∈I
Oi , Oi ⊆ X offen =⇒ ∃i1 , . . . , ik ∈ I : M ⊆
k
[
Oij ;
j=1
(b) folgenkompakt, wenn jede Folge in M eine in M konvergente Teilfolge besitzt, d.h.,
{xn } ⊆ M =⇒ ∃ Teilfolge {xnk } ∃x ∈ M : lim xnk = x;
k→∞
(c) präkompakt, wenn M für jedes ε > 0 eine endliche Überdeckung mit ε–Kugeln besitzt,
d.h.,
m
[
∀ε > 0 ∃x1 , . . . , xm ∈ M : M ⊆
Kε (xi );
i=1
die Zahl m hängt hierbei im Allgemeinen von dem gegebenen ε ab.
Wir werden in unserem nachfolgenden Resultat sehen, dass es in einem metrischen Raum
keinen Unterschied zwischen einer überdeckungskompakten und einer folgenkompakten
Teilmenge gibt. Hingegen ist das offene Intervall (0, 1) beispielsweise präkompakt in dem
metrischen Raum (R, | · |), nicht jedoch überdeckungs– oder folgenkompakt (da beispielsweise nicht abgeschlossen, vergleiche Lemma 4.43 weiter unten).
Satz 4.40 Für eine Teilmenge M eines metrischen Raumes (X, d) sind die folgenden Aussagen äquivalent:
(a) M ist überdeckungskompakt.
(b) M ist folgenkompakt.
(c) M ist präkompakt und vollständig (bezüglich der induzierten Metrik d).
Beweis: (a) =⇒ (b): Sei M überdeckungskompakt. Angenommen, M ist nicht folgenkompakt. Dann existiert eine Folge {xn } ⊆ M, die keinen Häufungspunkt in M besitzt.
Zu jedem y ∈ M gibt es dann ein εy > 0, so dass die Menge
Ny := {n ∈ N | xn ∈ Kεy (y)}
Christian Kanzow, Universität Würzburg, WS 2010/11
4.6. KOMPAKTE MENGEN
127
endlich ist. Da die Kugeln Kεy (y) für y ∈ M eine offene Überdeckung von M bilden, gibt
es aufgrund der Voraussetzung (a) endlich viele Punkte y1 , . . . , yk ∈ M mit
M⊆
Dann wäre aber N =
liefert.
Sk
i=1
k
[
Kεyi (yi ).
i=1
Nyi eine endliche Menge, was den gewünschten Widerspruch
(b) =⇒ (c): Wir verifizieren zunächst die Vollständigkeit des metrischen Raumes (M, d): Sei
{xn } dazu eine Cauchy–Folge in M. Nach Voraussetzung (b) besitzt diese einen Häufungspunkt x ∈ M. Wegen Satz 4.9 (e) konvergiert dann bereits die gesamte Folge {xn } gegen
x. Also ist (M, d) vollständig.
Als Nächstes beweisen wir, dass M präkompakt ist. Angenommen, dies ist nicht der
Fall. Dann existiert ein ε > 0, so dass M keine endliche Überdeckung mit
S ε–Kugeln besitzt.
Induktiv findet man daher eine Folge {xn } ⊆ M mit xn+1 ∈ M \ ni=1 Kε (xi ) für alle
n ∈ N. Die so konstruierte Folge {xn } besitzt offenbar keinen Häufungspunkt in M, im
Widerspruch zur vorausgesetzten Folgenkompaktheit von M.
S
(c) =⇒ (a): Sei M ⊆ i∈I Oi eine Überdeckung von M mit offenen Mengen Oi ⊆ X.
Angenommen, M lässt sich nicht durch endlich viele der Oi überdecken. Nun ist M aber
(1)
(1)
(1)
präkompakt. Zu ε = 21 gibt es daher endlich viele Punkte x1 , x2 , . . . , xm1 ∈ M derart,
(1)
dass die zugehörigen Kugeln K 1 (xi )(i = 1, . . . , m1 ) die Menge M überdecken. Mindestens
2
eine dieser Kugeln kann dann nicht durch endlich viele der Oi überdeckt werden, da wir
sonst schon eine endliche Auswahl der Oi gefunden hätten, die ganz M überdecken würden.
(1)
Diese eine Kugel sei K 1 (xi ) für ein i ∈ {1, . . . , m1 }. Wir bezeichnen den zugehörigen
(1)
xi
2
Mittelpunkt
von nun an einfach mit x1 .
(2)
(2)
(2)
Da M präkompakt ist, gibt es aber auch zu ε = ( 21 )2 endlich viele Punkte x1 , x2 , . . . , xm2 ∈
M, so dass
m2
[
(2)
M⊆
K( 1 )2 (xi )
2
i=1
gilt. Für mindestens einen dieser Punkte, nennen wir ihn x2 , ist dann
K( 1 )2 (x2 ) ∩ K( 1 )1 (x1 ) 6= ∅,
2
2
und K( 1 )2 (x2 ) wird nicht durch endlich viele der Oi überdeckt (würden nämlich alle diese
2
Kugeln, die einen nichtleeren Schnitt mit K 1 (x1 ) haben, durch endlich viele Oi überdeckt
2
werden, so würde dies auch für K 1 (x1 ) selbst gelten). Induktiv konstruiert man auf diese
2
Weise eine Folge {xn } ⊆ M mit
K( 1 )n+1 (xn+1 ) ∩ K( 1 )n (xn ) 6= ∅,
2
2
Christian Kanzow, Universität Würzburg, WS 2010/11
(4.4)
128
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
so dass keine der Kugeln K( 1 )n (xn ) durch endlich viele der offenen Mengen Oi überdeckt
2
wird. Sei x̄n ein nach (4.4) existierender Punkt aus der Schnittmenge K( 1 )n+1 (xn+1 ) ∩
2
K( 1 )n (xn ). Dann ist
2
d(xn+1 , xn ) ≤ d(xn+1 , x̄n ) + d(x̄n , xn )
n+1 n
1
1
+
≤
2
2
n−1
1
≤
2
für alle n ∈ N und daher
∞
X
d(xn+1 , xn ) < +∞
n=1
aufgrund der Konvergenz der geometrischen Reihe. Hieraus folgt aber unmittelbar, dass es
sich bei {xn } um eine Cauchy–Folge handelt (die Reihenreste werden beliebig klein).
Nun ist M nach VoraussetzungSaber auch vollständig. Daher konvergiert die Folge {xn }
gegen ein x∗ ∈ M. Wegen M ⊆ i∈I Oi existiert ein Index i0 ∈ I mit x∗ ∈ Oi0 . Da Oi0
offen ist, gibt es ein r > 0 mit K2r (x∗ ) ⊆ Oi0 . Andererseits ist aber d(xn , x∗ ) < r für alle
n ∈ N hinreichend groß und somit
K( 1 )n (xn ) ⊆ K2r (x∗ ) ⊆ Oi0
2
für alle diese n ∈ N, sofern noch ( 21 )n ≤ r gilt, denn aus der Dreiecksungleichung folgt
dann für alle x ∈ K( 1 )n (xn ) sofort
2
n
1
+ r ≤ r + r = 2r
d(x, x∗ ) ≤ d(x, xn ) + d(xn , x∗ ) <
2
und daher x ∈ K2r (x∗ ). Die Inklusion K( 1 )n (xn ) ⊆ Oi0 steht jedoch im Widerspruch dazu,
2
2
dass K( 1 )n (xn ) per Konstruktion nicht durch endlich viele der Oi überdeckt wird.
2
Das vorstehende Resultat motiviert die folgende Definition.
Definition 4.41 Eine Teilmenge M ⊆ X eines metrischen Raumes (X, d) heißt kompakt,
wenn M eine der drei äquivalenten Bedingungen (a), (b) oder (c) aus dem Satz 4.40 genügt.
Wir beweisen im Folgenden einige wichtige Eigenschaften kompakter Mengen. Dazu beginnen wir mit dem folgenden Resultat, wonach abgeschlossene Teilmengen von kompakten
Mengen in jedem metrischen Raum wieder kompakt sind.
Lemma 4.42 ( Abgeschlossene Teilmengen kompakter Mengen sind kompakt )
Seien (X, d) ein metrischer Raum, M ⊆ X eine kompakte Menge und A ⊆ M abgeschlossen. Dann ist A bereits kompakt.
Christian Kanzow, Universität Würzburg, WS 2010/11
4.6. KOMPAKTE MENGEN
129
Beweis: Wir beweisen die Folgen–Kompaktheit von A. Sei also {xn } eine beliebige Folge
in A. Dann ist {xn } insbesondere eine Folge in der kompakten Menge M und besitzt daher
eine in M konvergente Teilfolge {xnk } → x für ein x ∈ M. Nun ist A nach Voraussetzung
aber abgeschlossen und daher bereits x ∈ A wegen Lemma 4.17. Also ist A kompakt. 2
Zur Formulierung der nächsten Eigenschaft nennen wir eine Teilmenge M ⊆ X eines
metrischen Raumes (X, d) beschränkt, wenn es ein x ∈ X und eine Konstante r > 0 gibt mit
d(x, y) < r für alle y ∈ M, d.h., wenn M ⊆ Kr (x) gilt, also M in einer hinreichend großen
Kugel enthalten ist. Diese Definition ist offenbar konsistent mit jener einer beschränkten
Folge (siehe die Ausführungen vor dem Satz 4.9), wenn man eine solche Folge als Teilmenge
eines metrischen Raumes auffasst.
Lemma 4.43 ( Kompakte Mengen sind beschränkt und abgeschlossen )
Seien (X, d) ein metrischer Raum und M ⊆ X eine kompakte Teilmenge. Dann ist M
beschränkt und abgeschlossen.
Beweis: Wäre die Menge M nicht abgeschlossen, so gäbe es wegen Lemma 4.17 eine
Folge {xn } ⊆ M mit xn → x für ein x ∈ X \ M. Dann würde aber auch jede Teilfolge
von {xn } gegen x konvergieren. Wegen Satz 4.40 (b) müsste dann aber x ∈ M gelten im
Widerspruch zu unserer Annahme.
Wäre die Menge M unbeschränkt, so gäbe es ein x ∈ X sowie eine Folge {xn } ⊆ M
mit d(x, xn ) → ∞. Dann gilt auch d(xn , y) → ∞ für alle y ∈ X wegen
d(xn , y) ≥ d(xn , x) − d(y, x).
Also besitzt {xn } keine konvergente Teilfolge, im Widerspruch zur vorausgesetzten Kompaktheit von M.
2
Im Kn gilt auch die Umkehrung des Lemmas 4.43.
Satz 4.44 ( Heine–Borel )
Sei M eine Teilmenge des (mit der Maximumnorm versehenen) Raumes Kn . Dann sind
die beiden folgenden Aussagen äquivalent:
(a) M ist kompakt.
(b) M ist beschränkt und abgeschlossen.
Beweis: Die Implikation (a) =⇒ (b) gilt aufgrund des Lemmas 4.43. Zum Beweis der Umkehrung sei {xn } ⊆ M eine beliebige Folge. Da M ⊆ Kn beschränkt ist, besitzt die Folge
{xn } aufgrund eines Satzes 4.13 von Bolzano–Weierstraß eine konvergente Teilfolge. Der
Grenzwert dieser konvergenten Teilfolge liegt wegen der vorausgesetzten Abgeschlossenheit
von M dann wieder in der Menge M, vergleiche Lemma 4.17. Nach dem Folgen–Kriterium
aus dem Satz 4.40 (b) ist M daher kompakt.
2
Christian Kanzow, Universität Würzburg, WS 2010/11
130
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Man beachte, dass das im Beweis des Satzes 4.44 benutzte Resultat von Bolzano–Weierstraß
lediglich im Kn (bzw. in allen endlich–dimensionalen Vektorräumen) gilt, nicht jedoch in
unendlich–dimensionalen Räumen. Ferner sei an dieser Stelle auch erwähnt, dass es im
Prinzip keine Rolle spielt, dass wir den Raum Kn mit der Maximumnorm versehen haben.
Aber auch dies werden wir erst etwas später einsehen, siehe den Satz 4.53.
Mittels des Satzes 4.44 von Heine–Borel sind wir jetzt auch in der Lage, bequem einige
Beispiele von kompakten und nicht kompakten Mengen angeben zu können.
Beispiel 4.45 (a) Jedes Intervall [a, b] ist eine abgeschlossene und beschränkte Menge
in R. Nach dem Satz von Heine–Borel ist daher jedes solche Intervall kompakt.
(b) In dem metrischen Raum Kn , versehen mit der durch die (z.B.) Maximumnorm induzierten Metrik d∞ (x, y) := kx − yk∞, sind die abgeschlossenen Kugeln
K ε (x) := {y ∈ X | d∞(x, y) ≤ ε}
kompakt, denn es handelt sich hierbei (wie schon vorher bemerkt) um abgeschlossene
Mengen, die per Konstruktion auch beschränkt sind. Die Behauptung folgt daher
aus dem Satz 4.44 von Heine–Borel. — Als Warnung sei allerdings erwähnt, dass
die abgeschlossenen Kugeln K ε (x) in einem beliebigen metrischen Raum (X, d) zwar
abgeschlossen und beschränkt sind, aber nicht notwendig kompakt, da der Satz 4.44
von Heine–Borel nicht in beliebigen metrischen Räumen gilt.
(c) Seien (X, d) ein metrischer Raum und M ⊆ X eine kompakte Menge. Dann ist der
Rand ∂M von M ebenfalls eine kompakte Teilmenge von X, denn wegen Lemma
4.22 ist ∂M = M \M̊ ⊆ M = M eine abgeschlossene Teilmenge von M und daher
kompakt wegen Lemma 4.42.
Wir beschäftigen uns als Nächstes mit stetigen Funktionen auf kompakten Mengen. Unser
erstes derartiges Resultat besagt, dass stetige Bilder kompakter Mengen wieder kompakt
sind.
Satz 4.46 ( Stetige Bilder kompakter Mengen sind kompakt )
Seien (X1 , d1 ), (X2 , d2 ) metrische Räume, M ⊆ X1 kompakt und f : M → X2 stetig. Dann
ist die Bildmenge f (M) ebenfalls kompakt in X2 .
Beweis: Sei {yn } eine beliebige Folge in f (M). Dann existiert eine Folge {xn } ⊆ M mit
yn = f (xn ) für alle n ∈ N. Da M nach Voraussetzung kompakt ist, besitzt {xn } eine in M
konvergente Teilfolge {xnk }. Es existiert also ein x ∈ M mit limk→∞ xnk = x. Da f auf M
stetig ist, erhalten wir hieraus
lim ynk = lim f (xnk ) = f (x).
k→∞
k→∞
Also besitzt die Folge {yn } eine Teilfolge {ynk }, die gegen das Element y := f (x) aus f (M)
konvergiert. Folglich ist f (M) kompakt.
2
Christian Kanzow, Universität Würzburg, WS 2010/11
4.6. KOMPAKTE MENGEN
131
Als Konsequenz aus dem obigen Resultat erhalten wir den nachstehenden Satz, wonach eine
reellwertige stetige Funktion auf einer kompakten Menge stets ihr Minimum und Maximum
annimmt.
Satz 4.47 Seien (X, d) ein metrischer Raum, M ⊆ X eine nichtleere kompakte Teilmenge
und f : M → R stetig. Dann existieren x∗ ∈ M und x∗ ∈ M mit
f (x∗ ) = inf f (x) und
x∈M
f (x∗ ) = sup f (x),
x∈M
d.h., f nimmt auf M sein Infimum und sein Supremum an.
Beweis: Wegen Satz 4.46 ist f (M) eine kompakte Teilmenge von R. Daher ist f (M) nach
Lemma 4.43 beschränkt und abgeschlossen.
Wir beweisen jetzt die Aussage über das Infimum (die über das Supremum kann analog
verifiziert werden). Als beschränkte Teilmenge von R ist f∗ := inf x∈M f (x) endlich. Gemäß
Definition des Infimums existiert außerdem eine Folge {xn } ⊆ M mit f (xn ) → f∗ . Da M
kompakt ist, gibt es eine Teilfolge {xnk } ⊆ M und ein x∗ ∈ M mit limk→∞ xnk = x∗ . Dann
ist natürlich auch f (xnk ) → f∗ . Andererseits ist f stetig, also f (xnk ) → f (x∗ ) für k → ∞.
Aus der Eindeutigkeit des Grenzwertes folgt sofort f (x∗ ) = f∗ , womit die Behauptung für
das Infimum bewiesen ist.
2
Wir führen als Nächstes noch den Begriff einer gleichmäßig stetigen Funktion ein.
Definition 4.48 Seien (X1 , d1 ) und (X2 , d2 ) metrische Räume. Eine auf einer Teilmenge
M ⊆ X1 definierte Funktion f : M → X2 heißt gleichmäßig stetig auf M, wenn es zu
jedem ε > 0 ein δ > 0 gibt mit d2 (f (x), f (y)) < ε für alle x, y ∈ M mit d1 (x, y) < δ.
In der Kurzschreibweise mittels des All– und Existenzquantors lässt sich die Definition 4.48
auch wie folgt schreiben:
f ist gleichmäßig stetig auf M :⇐⇒ ∀ε > 0∃δ > 0 : d1 (x, y) < δ =⇒ d2 f (x), f (y) < ε .
Handelt es sich bei den metrischen Räumen (X1 , d1 ) und (X2 , d2 ) speziell um den Raum
(K, | · |), so lautet die zugehörige Definition offenbar:
f ist gleichmäßig stetig auf M :⇐⇒ ∀ε > 0∃δ > 0 : |x − y| < δ =⇒ f (x) − f (y) < ε .
Wir betrachten zunächst ein einfaches Beispiel.
Beispiel 4.49 Betrachte die Funktion
f : [a, b] → R, f (x) := x2 .
Christian Kanzow, Universität Würzburg, WS 2010/11
132
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Wir wollen mittels der Definition 4.48 einsehen, dass es sich hierbei um eine gleichmäßig
stetige Funktion handelt. Sei dazu ε > 0 beliebig gegeben. Wir suchen dann ein (gegebenenfalls von ε > 0, nicht jedoch von x, y abhängiges) δ > 0 derart, dass die folgende
Implikation gilt:
|x − y| < δ für x, y ∈ [a, b] =⇒ f (x) − f (y) < ε.
Um eine Idee für eine geeignete Wahl von δ > 0 zu bekommen, schreiben wir
f (x) − f (y) = |x2 − y 2 | = |x + y| · |x − y|.
Wir müssen also nur den Term |x + y| klein bekommen. Nun gilt
|x| ≤ max{|a|, |b|} =: M
für alle x ∈ [a, b],
also
|x + y| ≤ |x| + |y| ≤ 2M
für alle x, y ∈ [a, b].
Wählen wir daher
ε
,
2M
so gilt für alle x, y ∈ [a, b] mit |x − y| < δ die gewünschte Abschätzung
f (x) − f (y) ≤ 2M · |x − y| < 2M · δ = ε.
δ :=
Also ist f in der Tat gleichmäßig stetig auf dem Intervall [a, b]. Man beachte allerdings,
dass die obige Argumentation zusammenbricht, wenn man als Definitionsbereich von f ein
uneigentliches Intervall zugelassen hätte. Tatsächlich ist f zwar stetig in allen Punkten
x ∈ R, aber nicht gleichmäßig stetig auf beispielsweise der gesamten reellen Achse R. 3
Im Gegensatz zur Definition einer stetigen Funktion hängt die Wahl des δ > 0 bei einer
gleichmäßig stetigen Funktion zwar von der Größe ε > 0 ab, nicht jedoch von dem betreffenden Punkt x. Damit ist jede gleichmäßig stetige Funktion insbesondere stetig, während
die Umkehrung im Allgemeinen nicht gilt. Jedoch lässt sich das folgende Kriterium als
Verallgemeinerung des Beispiels 4.49 beweisen.
Satz 4.50 ( Kriterium für gleichmäßige Stetigkeit )
Seien (X1 , d1 ) und (X2 , d2 ) metrische Räume, M ⊆ X1 eine kompakte Teilmenge und
f : M → X2 eine stetige Funktion. Dann ist f gleichmäßig stetig auf M.
Beweis: Angenommen, f ist nicht gleichmäßig stetig auf M. Dann existiert ein ε > 0,
so dass für alle δ > 0 stets zwei (von δ abhängige) Punkte x, y ∈ M existieren mit
d1 (x, y) < δ und d2 (f (x), f (y)) ≥ ε. Insbesondere gibt es zu jedem δ = 1/n Punkte
xn , yn ∈ M mit d1 (xn , yn ) < 1/n und d2 (f (xn ), f (yn ) ≥ ε für alle n ∈ N. Da M nach
Voraussetzung kompakt ist, besitzt die Folge {xn } ⊆ M eine konvergente Teilfolge, etwa
{xnk } → x für ein x ∈ M. Wegen d1 (xn , yn ) → 0 für n → ∞ konvergiert dann auch die
zugehörige Teilfolge {ynk } von {yn } gegen den Punkt x. Aus der Stetigkeit von f folgt
Christian Kanzow, Universität Würzburg, WS 2010/11
4.6. KOMPAKTE MENGEN
133
daher sowohl f (xnk ) → f (x) als auch f (ynk ) → f (x) für k → ∞ im Widerspruch zu
d2 (f (xnk ), f (ynk )) ≥ ε für alle k ∈ N.
2
Der Satz 4.50 besagt also, dass eine auf einer kompakten Menge stetige Funktion dort
automatisch gleichmäßig stetig ist.
Wir beschäftigen uns als Nächstes mit der Stetigkeit von Umkehrfunktionen.
Satz 4.51 ( Stetigkeit der Umkehrfunktion )
Seien (X, dX ) und (Y, dY ) metrische Räume, M ⊆ X eine kompakte Teilmenge und f :
M → Y eine stetige und injektive Abbildung. Dann ist die auf dem Bildbereich f (M) :=
{y | ∃x ∈ X : y = f (x)} definierte Umkehrfunktion f −1 : f (M) → X ebenfalls stetig.
Beweis: Sei {yn } ⊆ f (M) eine beliebige gegen ein y ∈ f (M) konvergente Folge. Setze
g := f −1 und xn := g(yn), x := g(y). Nach dem Folgen–Kriterium der Stetigkeit haben wir
dann xn → x in X zu zeigen. Angenommen, dies ist nicht der Fall. Wegen {xn } ⊆ M und
M kompakt existiert dann eine Teilfolge {xnk } und ein Element x 6= x mit {xnk } → x für
k → ∞. Da f nach Voraussetzung stetig ist, impliziert dies ynk := f (xnk ) → f (x). Nun ist
f aber auch injektiv, so dass aus x 6= x auch
f (x) 6= f (x) = f g(y) = y
folgt. Damit besitzt die Teilfolge {ynk } von {yn } die beiden verschiedenen Grenzwerte y
2
und f (x), was wegen Satz 4.9 nicht sein kann.
In einem später noch wichtig werdenden Spezialfall können wir im Satz 4.51 auf die Kompaktheitsvoraussetzung verzichten.
Satz 4.52 Sei f : I → R eine auf einem (eigentlichen oder uneigentlichen) Intervall I ⊆ R
definierte Funktion, die stetig und streng monoton (fallend oder wachsend) sei. Dann ist
die Umkehrfunktion f −1 : f (I) → R ebenfalls stetig und streng monoton (fallend oder
wachsend).
Beweis: Die strenge Monotonie der Umkehrfunktion g := f −1 folgt sofort aus dem Satz
2.10. Zu zeigen bleibt somit nur noch die Aussage über die Stetigkeit. Setze dazu I ∗ := f (I).
Wegen des Zwischenwertatzes ist I ∗ ein (eventuell uneigentliches) Intervall, das alle Punkte
zwischen
ξ := inf{f (x) | x ∈ I} und η := sup{f (x) | x ∈ I}
umfasst. Die strenge Monotonie von f impliziert hierbei ξ < η. Also können wir zwei
Folgen von Punkten αj , βj ∈ I ∗ mit ξ < αj < βj < η und αj → ξ, βj → η finden.
Setzen wir f von nun an ohne Einschränkung als monoton wachsend voraus (der Beweis
verläuft analog im Falle einer monoton fallenden Funktion), so gibt es Punkte aj , bj ∈ I
mit aj < bj , αj = f (aj ) und βj = f (bj ). Jedes Intervall [α, β] in I ∗ ist bijektives Bild eines
Intervalles [a, b] in I unter f . Wegen Satz 4.51 ist die Abbildung f −1 |[α,β] stetig. Also ist
Christian Kanzow, Universität Würzburg, WS 2010/11
134
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
f −1 in jedem Punkt x ∈ I ∗ stetig, denn wir können aufgrund der obigen Ausführungen
stets ein kompaktes Intervall [α, β] ⊆ I ∗ finden mit x ∈ [α, β], so dass f −1 sogar auf dem
gesamten Intervall [α, β], insbesondere also in dem Punkt x, stetig ist.
2
Im Beispiel 4.6 haben wir bereits gesehen, dass man den Vektorraum Kn (mindestens) mit
zwei verschiedenen Normen versehen kann, und zwar haben wir dort die euklidische Norm
p
kxk2 := |x1 |2 + . . . + |xn |2 für x ∈ Kn ,
und die Maximumnorm
kxk := kxk∞ := max |x1 |, . . . , |xn |
definiert. Im Abschnitt 6.6 werden wir noch beliebig viele weitere Normen im Kn einführen.
Nun wäre es natürlich denkbar, dass eine Folge {xn } bezüglich der einen Norm konvergiert
und bezüglich der anderen nicht. Tatsächlich kann so ein Fall auftreten, wenn wir in einem
unendlich–dimensionalen Vektorraum sind. In dem endlich–dimensionalen Raum Kn ist
dies aber nicht möglich, wie wir als Nächstes zeigen wollen.
Sei dazu X ein beliebiger K–Vektorraum. Sind dann k · ka , k · kb : X → R zwei verschiedene Normen, so heißen diese äquivalent, wenn es zwei Konstanten c2 ≥ c1 > 0 gibt
mit
c1 kxka ≤ kxkb ≤ c2 kxka ∀x ∈ X.
Die beiden Konstanten c1 und c2 dürfen dabei natürlich von der Wahl der Normen k · ka
und k · kb abhängen, nicht jedoch von dem Vektor x ∈ X. Sind zwei Normen äquivalent,
so ist eine bezüglich k · ka konvergente Folge offenbar auch bezüglich k · kb konvergent und
umgekehrt. Damit stimmen auch die Begriffe der offenen und abgeschlossenen Mengen
bezüglich zweier äquivalenter Normen überein.
Wir betrachten jetzt den Raum X := Kn und zeigen, dass jede Norm auf diesen Raum
äquivalent ist zur Maximumnorm.
Satz 4.53 ( Äquivalenz aller Normen im Kn )
Sei k · k eine beliebige Norm auf dem Kn und k · k∞ die Maximumnorm auf dem Kn . Dann
sind k · k und k · k∞ äquivalent.
Beweis: Die Menge S := {x ∈ Kn | kxk∞ = 1} ist wegen Beispiel 4.45 (c), (d) kompakt.
Da jede Norm insbesondere eine stetige Abbildung ist (dies folgt beispielsweise aus der
inversen Dreiecksungleichung), existieren wegen Satz 4.47 daher die Konstanten
c1 := min kxk > 0 und c2 := max kxk > 0.
x∈S
Für beliebiges x 6= 0 ist dann y :=
c1 ≤ kyk ≤ c2
x∈S
x
kxk∞
ein Element von S und daher
⇐⇒
c1 kxk∞ ≤ kxk ≤ c2 kxk∞ ,
Christian Kanzow, Universität Würzburg, WS 2010/11
4.7. DER APPROXIMATIONSSATZ VON WEIERSTRASS
woraus die Behauptung folgt.
135
2
Aus dem Satz 4.53 ergibt sich sofort, dass je zwei Normen im Kn äquivalent sind. Diese
Aussage gilt allgemeiner in jedem endlich–dimensionalen Vektorraum X.
Als unmittelbare Konsequenz des Satzes 4.53 notieren wir noch das folgende Resultat.
Korollar 4.54 Sei {xk } ⊆ Rn eine gegebene Folge. Dann konvergiert diese Folge genau
dann gegen ein x∗ ∈ Rn , wenn jede Komponentenfolge {xki } ⊆ R gegen x∗i konvergiert
(i = 1, . . . , n).
Beweis: Sei zunächst vorausgesetzt, dass die Folge der Vektoren {xk } gegen x∗ konvergiert.
Wegen des Satzes 4.53 ist dabei egal, bezüglich welcher Norm wir hierbei die Konvergenz
betrachten. Wählen wir etwa die Maximumnorm k · k∞ , so gilt
|xki − x∗i | ≤ kxk − x∗ k∞ → 0 für k → ∞.
Also konvergiert jede Folge {xki } gegen x∗i (i = 1, . . . , n).
Gilt umgekehrt |xki − x∗i | → 0 für k → ∞ und alle Komponenten i ∈ {1, . . . , n}, so folgt
unmittelbar
kxk − x∗ k∞ = max |xki − x∗i | → 0 für k → ∞
i=1,...,n
und damit auch die Konvergenz der Folge von Vektoren {xk } gegen x∗ .
4.7
2
Der Approximationssatz von Weierstraß
Wir beginnen zunächst mit einer grundlegenden Definition.
Definition 4.55 Sei (X, d) ein metrischer Raum.
(a) Eine Teilmenge M ⊆ X liegt dicht in X, wenn M = X gilt.
(b) Der metrische Raum X heißt separabel, wenn es eine höchstens abzählbare Teilmenge
M ⊆ X gibt mit M = X.
Ein metrischer Raum (X, d) ist also separabel, wenn es höchstens abzählbar viele Elemente
x1 , x2 , x3 , . . . ∈ X gibt, die bezüglich der Metrik d dicht in X liegen. Wir erwähnen an dieser
Stelle einige einfache Beispiele.
Beispiel 4.56 (a) Die Menge der rationalen Zahlen Q liegt bekanntlich dicht in dem
metrischen Raum (R, | · |). Da Q abzählbar ist, handelt es sich bei (R, | · |) um einen
separablen Raum. Ebenso ist auch der euklidische Raum Rn separabel, denn Qn liegt
dicht in Rn und ist ebenfalls abzählbar.
Christian Kanzow, Universität Würzburg, WS 2010/11
136
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
(b) Die Menge der Zahlen Q + iQ := {x + iy | x, y ∈ Q} ist abzählbar und liegt dicht in
C, also ist (C, | · |) separabel. Aus ähnlichem Grund folgt auch die Separabilität von
Cn .
(c) Seien (X, d) ein metrischer Raum sowie M ⊆ N ⊆ X Teilmengen derart, dass M
dicht in N und N dicht in X liegen. Dann liegt M auch dicht in X, denn nach
Voraussetzung gelten M = N und N = X und somit M = M = N = X.
(d) Betrachte die Menge
C([a, b]) := f : [a, b] → R f stetig
aller stetigen Funktionen auf dem Intervall [a, b], versehen mit der Metrik
d∞ (f, g) := kf − gk∞ := max f (x) − g(x)
für f, g, ∈ C([a, b])
x∈[a,b]
(dass es sich hierbei um eine Metrik handelt, sieht man sofort ein). Nach dem Approximationssatz von Weierstraß, für den wir gleich einen Beweis liefern werden, liegt die
Menge aller Polynome dicht in C([a, b]). Andererseits ist die Menge aller Polynome
mit rationalen Koeffizienten dicht in der Menge aller Polynome. Da die Menge aller
Polynome mit rationalen Koeffizienten abzählbar ist, folgt aus dem Beispiel (c) die
Separabilität von C([a, b]).
3
Als Nachtrag zum Beispiel 4.56 (d) wollen wir an dieser Stelle den dort benutzten Approximationssatz von Weierstraß beweisen. Hierzu benötigen wir einige einfache Identitäten,
die wir deshalb gesondert in dem folgenden Hilfsresultat zur Verfügung stellen. In dessen
Beweis gehen wir ausnahmsweise mal davon aus, dass die elementaren Rechenregeln zur
Ableitung von Polynomen bekannt sind, formal wird der Ableitungsbegriff (auch Differentiation genannt) erst im Kapitel 6 eingeführt werden.
Lemma 4.57 Seien n ∈ N und
n k
x (1 − x)n−k
bk (x) :=
k
für k = 0, 1, . . . , n und x ∈ R.
Dann gelten die beiden folgenden Gleichungen für alle n ∈ N und alle x ∈ R:
Pn
(a)
k=0 bk (x) = 1.
Pn
2
(b)
k=0 bk (x)(nx − k) = nx(1 − x).
Beweis: Aufgrund des binomischen Lehrsatzes gilt bekanntlich
n
(x + y) =
n X
n
k=0
k
xk y n−k
∀x, y ∈ R,
Christian Kanzow, Universität Würzburg, WS 2010/11
(4.5)
4.7. DER APPROXIMATIONSSATZ VON WEIERSTRASS
137
woraus man speziell für y = 1 − x die Formel
n
X
bk (x) = 1
(4.6)
k=0
erhält, so dass die Aussage (a) hiermit bereits bewiesen ist. Differentiation von (4.5) nach
x und anschließende Multiplikation mit x liefert
n X
n
n−1
kxk y n−k ∀x, y ∈ R.
nx(x + y)
=
k
k=0
Differenziert man (4.5) hingegen zweimal nach x und multipliziert das Ergebnis dann mit
x2 , so ergibt sich
n X
n
2
n−2
k(k − 1)xk y n−k ∀x, y ∈ R.
n(n − 1)x (x + y)
=
k
k=0
Speziell für y = 1 − x lauten die letzten beiden Formeln wie folgt:
nx =
n
X
bk (x)k
und
(4.7)
k=0
n(n − 1)x2 =
n
X
k=0
bk (x)k(k − 1) ∀x ∈ R.
Summation dieser beiden Gleichungen liefert
2
nx + n(n − 1)x =
n
X
bk (x)k 2 .
(4.8)
k=0
Unter Verwendung von (4.6), (4.7) und (4.8) ergibt sich wegen Teil (a) nun
n
X
k=0
=
bk (x)(nx − k)2
n
X
k=0
bk (x)(n2 x2 − 2nkx + k 2 )
2 2
= nx
n
X
k=0
bk (x) −2nx
| {z }
=1
= nx(1 − x),
n
X
k=0
|
bk (x)k +
{z
=nx
}
n
X
k=0
|
(4.9)
bk (x)k
{z
2
}
=nx+n(n−1)x2
womit auch die Formel (b) bewiesen ist.
2
Mit Hilfe des Lemmas 4.57 können wir jetzt einen relativ kurzen Beweis des Approximationssatzes von Weierstraß angeben.
Christian Kanzow, Universität Würzburg, WS 2010/11
138
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Satz 4.58 ( Approximationssatz von Weierstraß )
Sei C([a, b]) der Raum der stetigen Funktionen auf dem kompakten Intervall [a, b], versehen
mit der Metrik d = d∞ aus dem Beispiel 4.56 (d). Dann liegt die Menge aller Polynome
(mit reellen Koeffizienten) dicht in C([a, b]).
Beweis: Wir beweisen die Aussage nur für den Spezialfall [a, b] = [0, 1]. Der allgemeine Fall
kann hierauf mittels der Transformation x = a + t(b − a) zurückgeführt werden (beachte,
dass diese Transformation das Intervall [0, 1] bijektiv auf [a, b] abbildet).
Seien f ∈ C([a, b]) und ε > 0 beliebig gegeben. Wir werden zeigen, dass es ein Polynom p
mit d(f, p) ≤ 2ε gibt, woraus dann die Behauptung folgt. Der Beweis ist dabei konstruktiv,
da wir das Polynom p im Prinzip explizit angeben werden. Definiere zu diesem Zweck das
(von f abhängige) so genannte n-te Bernstein–Polynom durch
Bn (x) :=
n
k X
bk (x) (n ∈ N),
f
n
k=0
wobei bk (x) wie im Lemma 4.57 definiert sei. Mit (4.6) folgt dann
n X
k
f (x) − Bn (x) = f (x) − f
bk (x)
n
k=0
n X
k ≤
f (x) − f n bk (x),
k=0
da bk (x) für alle x ∈ [0, 1] sowieso nichtnegativ ist. Da f auf dem kompakten Intervall [0, 1]
nach Satz 4.50 sogar gleichmäßig stetig ist, existiert ein δ > 0 mit
k
k
f (x) − f
≤ ε für alle x ∈ [0, 1] mit x − < δ.
n n
Für jedes x ∈ [0, 1] mit |x − nk | ≥ δ hingegen gilt mit der Konstanten
c := max f (t)
t∈[a,b]
stets
2 .
f (x) − f k ≤ 2c ≤ 2c x − k
δ2.
n n
Für beliebige x ∈ [0, 1] gilt somit die Abschätzung
2 .
k
k
f (x) − f
≤ ε + 2c x −
δ2.
n
n
Zusammen mit Lemma 4.57 folgt daher
2 .
n
X
k
f (x) − Bn (x) ≤
δ2
ε + 2c x −
n
k=0
!
bk (x)
Christian Kanzow, Universität Würzburg, WS 2010/11
4.7. DER APPROXIMATIONSSATZ VON WEIERSTRASS
139
2
n k
2c X
x−
bk (x)
= ε
bk (x) + 2
δ
n
k=0
k=0
n
X
n
2
2c X
nx − k bk (x)
= ε+ 2 2
δ n k=0
= ε + 2cx(1 − x)/(δ 2 n).
Nun ist 2cx(1 − x)/(δ 2 n) ≤ ε für alle x ∈ [0, 1] und alle n ∈ N hinreichend groß und daher
d(f, Bn ) ≤ 2ε
für alle diese n ∈ N.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
140
KAPITEL 4. METRISCHE RÄUME UND STETIGKEIT
Christian Kanzow, Universität Würzburg, WS 2010/11
Kapitel 5
Spezielle Funktionen
5.1
5.2
5.3
5.4
5.5
5.6
5.1
Exponentialfunktion
Natürlicher Logarithmus und allgemeine Potenz
Sinus und Cosinus
Trigonometrische Umkehrfunktionen
Polarkoordinaten
Der Fundamentalsatz der Algebra
Exponentialfunktion
Im Folgenden bezeichnet K wieder den Körper R der reellen oder den Körper C der komplexen Zahlen. Die Exponentialfunktion exp : K → K ist dann definiert durch die Potenzreihe
exp(z) :=
∞
X
zk
k=0
k!
=1+z+
z2 z3
+
+ ...,
2!
3!
die wegen Beispiel 3.38 für alle z ∈ K absolut konvergiert. Für K = R spricht man von der
reellen Exponentialfunktion, für K = C von der komplexen Exponentialfunktion.
Eine ganz wichtige Eigenschaft der Exponentialfunktion ist das folgende Additionstheorem.
Satz 5.1 ( Additionstheorem der Exponentialfunktion )
Es gilt exp(z) · exp(w) = exp(z + w) für alle z, w ∈ K.
Beweis: Wir wenden den Satz 3.40 über das Produkt zweier absolut konvergenter Reihen
an, und zwar auf die beiden absolut konvergenten Reihen
exp(z) =
∞
X
zk
k=0
k!
und
exp(w) =
∞
X
wk
k=0
141
k!
.
142
KAPITEL 5. SPEZIELLE FUNKTIONEN
Dazu multiplizieren wir beide Reihen im Sinne des Cauchy–Produktes aus (3.9). Unter
Verwendung des binomischen Lehrsatzes 1.9 ist zunächst
n
n X
z n−k
1
wk
1 X n n−k k
cn :=
z w = (z + w)n ∀n ∈ N0 .
·
=
(n − k)! k!
n! k=0 k
n!
k=0
Gemeinsam mit der Definition des Cauchy–Produktes folgt hieraus bereits exp(z + w) =
exp(z) · exp(w).
2
Aufgrund des Additionstheorems 5.1 gilt beispielsweise
exp(z) · exp(−z) = exp(z − z) = exp(0) = 1 ∀z ∈ K
und daher
exp(z) 6= 0 und
exp(−z) =
1
exp(z)
∀z ∈ K.
(5.1)
Wir beweisen als Nächstes die Stetigkeit der Exponentialfunktion.
Satz 5.2 ( Stetigkeit der Exponentialfunktion )
Die Exponentialfunktion exp : K → K ist stetig auf ganz K.
Beweis: Wir zeigen zunächst, dass die Ungleichung
exp(z) − 1 ≤ 2|z| für alle z ∈ K mit |z| ≤ 1
(5.2)
gilt. Sei dazu z ∈ K mit |z| ≤ 1 beliebig gegeben. Aus der Definition der Exponentialfunktion folgt dann
z2 z3
exp(z) − 1 = z +
+
+ ...
2!
3!
und daher
∞
X
|z|k
exp(z) − 1 ≤
k!
k=1
|z| |z|2
|z|k
= |z| 1 +
+
+ ...+
+ ...
2!
3!
(k + 1)!
1
1
1
≤ |z| 1 + + + . . . +
+ ...
2! 3!
(k + 1)!
!
2
k
1
1
1
+ ...+
+ ...
≤ |z| 1 + +
2
2
2
∞ k
X
1
= |z|
2
k=0
= 2|z|
Christian Kanzow, Universität Würzburg, WS 2010/11
5.1. EXPONENTIALFUNKTION
143
aufgrund der Konvergenz der geometrischen Reihe.
Sei nun z ∈ K ein beliebiger Punkt und {zn } ⊆ K eine gegen z konvergente Folge. Dann
ist |zn − z| ≤ 1 für alle n ∈ N hinreichend groß. Aus diesem Grunde erhalten wir aus (5.2)
exp(zn − z) − 1 ≤ 2|zn − z| → 0 für alle n → ∞.
Das Additionstheorem impliziert somit
lim exp(zn ) = lim exp(z) · exp(zn − z) = exp(z),
n→∞
n→∞
was die Stetigkeit der Exponentialfunktion beweist.
2
Zur Motivation einer gebräuchlichen Schreibweise benötigen wir das folgende Resultat.
Lemma 5.3 Für jede rationale Zahl r ∈ Q gilt exp(r) = er , wobei e := exp(1) die Eulersche Zahl bezeichnet, vergleiche Beispiel 3.38 (a).
Beweis: Für r = n ∈ N0 gilt aufgrund des Additionstheorems zunächst
exp(n) = exp(n · 1) = (exp(1))n = en .
Für r =
Für r =
1
n
m
n
mit n ∈ N enthält man auf analoge Weise:
n
1
1
= exp(1) = e
= exp n ·
exp
n
n
=⇒
1
1
exp
= en .
n
mit m, n ∈ N folgt hieraus
m
m
m
1
1
exp
= exp m ·
= exp
= en.
n
n
n
Für r = − m
mit m, n ∈ N ergibt sich deshalb
n
m m −1
m
m −1
= e− n
exp −
= exp
= en
n
n
unter Verwendung der Formel (5.1).
2
Das Lemma 5.3 motiviert die übliche Schreibweise
ez := exp(z) ∀z ∈ K
für die Exponentialfunktion. Das Additionstheorem lautet dann
ez+w = ez ew
∀z, w ∈ K
und wird somit zu einer einfachen Potenzrechenregel.
In dem verbleibenden Teil dieses Abschnitts untersuchen wir einige weitere Eigenschaften der reellen Exponentialfunktion.
Christian Kanzow, Universität Würzburg, WS 2010/11
144
KAPITEL 5. SPEZIELLE FUNKTIONEN
Satz 5.4 ( Eigenschaften der reellen Exponentialfunktion )
(a) Für alle x ∈ R ist ex reell und positiv.
(b) Die Abbildung exp : R → R ist streng monoton wachsend.
(c) Die Abbildung exp : R → (0, +∞) ist bijektiv.
Beweis: (a) Aus der Definition der Exponentialfunktion folgt sofort exp(x) ∈ R für alle
x ∈ R. Ferner wissen wir bereits, dass exp(x) 6= 0 für alle x ∈ R gilt, vergleiche (5.1). Unter
Verwendung des Additionstheorems folgt dann
x x x 2
exp(x) = exp
= exp
+
>0
2 2
2
und damit die Aussage (a).
(b) Wegen
h2
+ . . . > 1 für alle h > 0
2!
folgt unter Verwendung von Teil (a) unmittelbar
eh = 1 + h +
ex+h − ex = ex (eh − 1) > 0 für alle h > 0.
Also die Abbildung x 7→ exp(x) streng monoton wachsend.
(c) Wegen Teil (b) und Satz 2.9 ist die Abbildung exp : R → R+ zumindest injektiv. Wir
haben nur noch zu zeigen, dass es zu jedem y > 0 mindestens ein x ∈ R mit ex = y gibt.
Dabei verwenden wir die bereits im Satz 5.2 bewiesene Stetigkeit der Exponentialfunktion,
die uns insbesondere die Anwendung des Zwischenwertsatzes 4.29 erlaubt.
Wegen exp(x) ≥ x + 1 für alle x ≥ 0 aufgrund der Reihendarstellung der Exponentialfunktion ist exp(x) → ∞ für x → ∞. Mit (5.1) folgt hieraus wiederum exp(x) → 0 für
x → −∞. Wegen der Stetigkeit der Exponentialfunktion ergibt sich die Behauptung daher
aus dem Zwischenwertsatz.
2
Das Wachstum der reellen Exponentialfunktion für x → +∞ und x → −∞ wird in dem
folgenden Resultat untersucht.
Satz 5.5 ( Wachstumsverhalten der reellen Exponentialfunktion )
Betrachte die reelle Exponentialfunktion exp : R → R. Dann gelten
ex
= +∞
x→+∞ xn
lim
und
lim xn ex = 0
x→−∞
für jede (noch so große) natürliche Zahl n ∈ N0 .
Christian Kanzow, Universität Würzburg, WS 2010/11
5.1. EXPONENTIALFUNKTION
145
Beweis: Aus der Definition der Exponentialfunktion folgt sofort
ex >
xn+1
(n + 1)!
für alle x > 0, also
xn
(n + 1)!
<
.
x
e
x
Da n ∈ N0 fest ist, folgt hieraus unter Verwendung des Sandwich–Theorems 3.9 sofort
0<
xn
→ 0 für x → +∞.
ex
Durch Bildung des Kehrwertes folgt hieraus die erste Behauptung. Die zweite Behauptung
1
. Damit ergibt sich
lässt sich auf die erste Aussage zurückführen: Wegen (5.1) ist ex = e−x
dann
ξn
ξn
xn ξ:=−x
lim xn ex = lim −x = lim (−1)n ξ = (−1)n lim ξ = 0,
x→−∞
x→−∞ e
ξ→+∞
ξ→+∞ e
e
also gerade die zweite Behauptung.
2
Der Satz 5.5 lässt sich geometrisch (etwas lax) wie folgt formulieren: Die Exponentialfunktion geht für x → +∞ schneller gegen unendlich als jede noch so große Potenz xn .
Außerdem geht ex für x → −∞ schneller gegen Null als jede Potenz xn gegen (plus oder
minus) unendlich divergiert.
Den Graphen der reellen Exponentialfunktion findet der Leser in der Abbildung 5.1
dargestellt. Bereits ab x = −4 lässt sich der Graph kaum noch von der x-Achse unterscheiden (zumindest nicht in der gewählten Auflösung), während er für x > 2 noch sehr viel
steiler ansteigen würde.
7
6
5
4
3
2
1
-4
-3
-2
-1
1
2
Abbildung 5.1: Der Graph der (reellen) Exponentialfunktion für x ∈ [−4, 2].
Christian Kanzow, Universität Würzburg, WS 2010/11
146
5.2
KAPITEL 5. SPEZIELLE FUNKTIONEN
Natürlicher Logarithmus und allgemeine Potenz
Wegen Satz 5.4 ist die reelle Exponentialfunktion exp : R → (0, +∞) bijektiv und streng
monoton wachsend. Nach Satz 2.10 besitzt diese daher eine ebenfalls streng monotone
wachsende Umkehrfunktion
ln : (0, +∞) → R,
die als natürlicher Logarithmus bezeichnet wird. Definitionsgemäß gelten somit
ln(exp(x)) = x für alle x ∈ R und
exp(ln(x)) = x für alle x ∈ (0, +∞).
Aus dem Additionstheorem der Exponentialfunktion ergibt sich sofort die entsprechende
Funktionalgleichung für den natürlichen Logarithmus.
Satz 5.6 ( Additionstheorem des natürlichen Logarithmus )
Für alle x, y ∈ R++ := (0, ∞) gilt ln(xy) = ln(x) + ln(y).
Beweis: Aus dem Additionstheorem der Exponentialfunktion folgt
exp ln(xy) = xy = exp ln(x) exp ln(y) = exp ln(x) + ln(y)
für alle x, y ∈ R++ . Wendet man daher auf beiden Seiten den natürlichen Logarithmus an,
so folgt die Behauptung.
2
Einige weitere Eigenschaften des natürlichen Logarithmus sind in dem nachstehenden Resultat zusammengefasst.
Satz 5.7 ( Eigenschaften des natürlichen Logarithmus )
Der natürliche Logarithmus ln : R++ → R ist eine stetige und streng monoton wachsende
Funktion mit
lim ln x = +∞ und lim ln x = −∞.
x→+∞
x→0+
Beweis: Der natürliche Logarithmus ist als Umkehrfunktion der streng monoton wachsenden Exponentialfunktion aufgrund des Satzes 2.10 selbst streng monoton wachsend. Die
Stetigkeit der Exponentialfunktion (siehe Satz 5.2) liefert im Hinblick auf den Satz 4.52
dann auch die Stetigkeit des natürlichen Logarithmus.
Die beiden (uneigentlichen) Grenzwerte ergeben sich wie folgt: Sei K ∈ R beliebig
vorgegeben. Da ln streng monoton wächst, gilt ln(x) > K für alle x > exp(K). Also ist
limn→+∞ ln(x) = +∞. Daraus folgt auch der zweite Grenzwert wegen
1
= lim ln(1) − ln(y) = − lim ln(y) = −∞,
lim ln(x) = lim ln
y→∞ | {z }
x→0+
y→∞
y→∞
y
=0
wobei wir das Additionstheorem des natürlichen Logarithmus verwendet haben.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
5.2. NATÜRLICHER LOGARITHMUS UND ALLGEMEINE POTENZ
147
Die Abbildung 5.2 zeigt den Graphen des natürlichen Logarithmus in Intervall (0, 5]. Für
x → +∞ wächst der natürliche Logarithmus nur sehr langsam, bleibt wegen Satz 5.7 aber
nicht beschränkt.
1
1
2
3
4
5
-1
-2
Abbildung 5.2: Der Graph des natürlichen Logarithmus für x ∈ (0, 5].
Wir wollen mittels der Exponentialfunktion und des natürlichen Logarithmus die bisherige Definition einer Potenz nun verallgemeinern. Dazu sei daran erinnert, dass wir für
eine natürliche Zahl n ∈ N und ein gegebenes a ∈ R bislang die Potenz an definiert haben
durch
an := a
| · a ·{z. . . · a} .
n−mal
p
q
Für eine rationale Zahl r ∈ Q, etwa r = mit p, q ∈ N (eventuell mit negativem Vorzeichen), und beliebiges a > 0 ist die Potenz an entsprechend definiert durch
p
ar := a q :=
√
q
ap .
Wir wollen diese Definition nun sinnvoll erweitern auf den Fall ax für a > 0 und beliebiges
x ∈ R. Zu diesem Zweck führen wir den nachstehenden Begriff ein.
Definition 5.8 Sei a > 0 beliebig gegeben. Dann wird die Abbildung
expa : R → R, expa (x) := exp x ln(a)
als Exponentialfunktion zur Basis a bezeichnet.
Für a = e = exp(1) stimmt die Exponentialfunktion zur Basis a offenbar mit der üblichen
Exponentialfunktion überein. Einige Eigenschaften der Exponentialfunktion zur Basis a
sind in dem nachstehenden Resultat zusammengefasst.
Satz 5.9 ( Eigenschaften der Exponentialfunktion zur Basis a )
Die Funktion expa : R → R hat die folgenden Eigenschaften:
Christian Kanzow, Universität Würzburg, WS 2010/11
148
KAPITEL 5. SPEZIELLE FUNKTIONEN
(a) Sie ist stetig auf ganz R.
(b) Es gilt das Additionstheorem expa (x + y) = expa (x) expa (y) für alle x, y ∈ R.
(c) Es ist expa (n) = an für alle n ∈ Z.
√
(d) Es ist expa ( pq ) = q ap für alle p ∈ Z und alle q ∈ N.
Beweis: (a) Die Exponentialfunktion zur Basis a ist als Komposition der beiden als stetig
bekannten Abbildungen x 7→ x ln(a) und y 7→ exp(y) selbst stetig, vergleiche den Satz 4.28.
(b) Diese Aussage ergibt sich unmittelbar aus dem Additionstheorem der Exponentialfunktion:
expa (x + y) = exp (x + y) ln(a)
= exp x ln(a) + y ln(a)
= exp x ln(a) exp y ln(a)
= expa (x) expa (y)
für alle x, y ∈ R.
(c) Wegen exp(0) = 1 ist auch expa (0) = 1 und daher
expa (−x) =
1
expa (x)
für alle x ∈ R,
indem man speziell y = −x in Teil (b) setzt. Durch vollständige Induktion zeigt man
zunächst unter Benutzung von Teil (b)
n
expa (nx) = expa (x)
für alle n ∈ N und alle x ∈ R.
1
Da expa (1) = exp ln(a) = a und expa (−1) = exp(− ln(a)) = exp(ln(a))
= a1 , folgt hieraus
mit x = 1 bzw. x = −1 sofort
expa (n) = an
und
expa (−n) = a−n ,
womit Teil (c) vollständig bewiesen ist.
(d) Mit der Aussage (c) ergibt sich für alle p ∈ Z und alle q ∈ N
p
p q
ap = expa (p) = expa q ·
= expa ( ) ,
q
q
woraus man unmittelbar die Behauptung (d) erhält.
Wir verwenden im Folgenden die üblichere Schreibweise
ax := expa (x) = exp x ln(a) für alle a > 0 und x ∈ R.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
5.2. NATÜRLICHER LOGARITHMUS UND ALLGEMEINE POTENZ
149
Wegen Satz 5.9 ist diese Notation konsistent mit den bisher definierten Potenzen mit
ganzzahligen oder rationalen Exponenten.
Als unmittelbare Folgerung aus dem Satz 5.9 erhalten wir noch die nachstehende interessante Eigenschaft.
Korollar 5.10 Für alle a > 0 ist limn→∞
√
n
a = 1.
Beweis: Aus der Stetigkeit der Funktion expa gemäß Satz 5.9 folgt:
√
1
1
n
lim a = lim expa
= expa lim
= expa (0) = 1,
n→∞
n→∞ n
n→∞
n
was zu zeigen war.
2
Weitere Eigenschaften der allgemeinen Potenz ax sind im folgenden Resultat enthalten.
Satz 5.11 ( Rechenregeln der allgemeinen Potenz )
Für alle a, b > 0 und alle x, y ∈ R gelten:
(a) Es ist (ax )y = axy .
(b) Es ist ax bx = (ab)x .
(c) Es ist ( a1 )x = a−x .
Beweis: Wir beweisen hier nur die Aussage (a), da sich die Teile (b) und (c) auf ähnliche
Weise verifizieren lassen. Wegen ax = exp x ln(a) (gemäß Definition der allgemeinen
Potenz) ist ln(ax ) = x ln(a) und daher
(ax )y = exp y ln(ax ) = exp yx ln(a) = axy
für alle a > 0 und alle x, y ∈ R.
2
Zusammen mit ax+y = ax ay (dies ist das Additionstheorem aus dem Satz 5.9) haben wir
somit die wichtigsten Rechenregeln für die allgemeine Potenz zur Verfügung, die wir von
nun an oft anwenden werden, ohne dabei stets auf die entsprechenden Sätze explizit zu
verweisen.
Aus den Eigenschaften der Exponentialfunktion expa lässt sich relativ leicht die nachstehende Bemerkung herleiten, die sonst aber nicht weiter benötigt wird.
Bemerkung 5.12 Die Abbildung expa : R → R++ hat R++ als Bildbereich für jedes
a 6= 1. Für a > 1 ist sie dabei streng monoton wachsend, für 0 < a < 1 ist sie dagegen
streng monoton fallend. Für jedes a > 0 mit a 6= 1 besitzt sie deshalb eine Umkehrfunktion,
die als Logarithmus zur Basis a bezeichnet wird und für die man loga : R++ → R schreibt.
Speziell für a = e erhalten wir wieder den natürlichen Logarithmus.
Christian Kanzow, Universität Würzburg, WS 2010/11
150
5.3
KAPITEL 5. SPEZIELLE FUNKTIONEN
Sinus und Cosinus
Die Exponentialfunktion exp : K → K war durch die für alle z ∈ K absolut konvergente
Potenzreihe
∞
X
zk
z
exp(z) := e :=
k!
k=0
definiert. Mittels dieser Exponentialreihe definieren wir jetzt den Cosinus und Sinus.
Definition 5.13 Die durch die beiden Vorschriften
cos(z) :=
1 iz
e + e−iz
2
und
sin(z) :=
1 iz
e − e−iz
2i
definierten Funktionen cos : K → K und sin : K → K heißen Cosinus und Sinus. Die
hiermit definierten Funktionen
tan(z) :=
sin(z)
cos(z)
und
cot(z) :=
cos(z)
sin(z)
heißen Tangens und Cotangens und sind natürlich nur für solche Werte z ∈ K definiert,
in denen der jeweilige Nenner von Null verschieden ist.
Aus der Definition 5.13 und der bereits bewiesenen Stetigkeit der Exponentialfunktion
erhalten wir mit bekannten Resultaten über stetige Funktionen sofort die Stetigkeit des
Cosinus und des Sinus auf K und damit wiederum die Stetigkeit des Tangens und Cotangens
auf den jeweiligen Definitionsbereichen.
Mittels des Additionstheorems für die Exponentialfunktion bekommen wir entsprechende Additionstheoreme für den Cosinus und den Sinus.
Satz 5.14 ( Additionstheoreme für Cosinus und Sinus )
Es gelten die Additionstheoreme
cos(z + w) = cos(z) cos(w) − sin(z) sin(w) und
sin(z + w) = sin(z) cos(w) + cos(z) sin(w)
für alle z, w ∈ K.
Beweis: Die beiden Additionstheoreme lassen sich sofort verifizieren, indem man jeweils
die Definition von cos und sin einsetzt und das Additionstheorem eiz eiw = ei(z+w) der Exponentialfunktion ausnutzt.
2
Ebenfalls aus der Definition der Exponentialfunktion ergeben sich die folgenden Potenzreihendarstellungen von cos und sin.
Christian Kanzow, Universität Würzburg, WS 2010/11
5.3. SINUS UND COSINUS
151
Satz 5.15 ( Potenzreihenentwicklungen von Sinus und Cosinus )
Die Funktionen Sinus und Cosinus besitzen die beiden Potenzreihendarstellungen
sin(z) =
∞
X
(−1)k
k=0
und
cos(z) =
∞
X
z 2k+1
z3 z5 z7
=z−
+
−
+ ...
(2k + 1)!
3!
5!
7!
(−1)k
k=0
für alle z ∈ K.
z 2k
z2 z4 z6
=1−
+
−
+ ...
(2k)!
2!
4!
6!
Beweis: Die beiden konvergenten Reihen eiz und e−iz dürfen aufgrund des Satzes 3.25
gliedweise addiert bzw. subtrahiert werden. Eine elementare Rechnung liefert dann die beiden Reihendarstellungen von sin und cos.
2
Wir betrachten den Sinus und den Cosinus im Folgenden vorwiegend für reelle Argumente.
Wegen Satz 1.39 gilt für alle x ∈ R
1
1 ix
e + e−ix = eix + eix = Re(eix ) und
2
2
1 ix
1 ix
−ix
sin(x) =
e −e
=
e − eix = Im(eix ).
2i
2i
cos(x) =
Hieraus erhalten wir nochmals die Stetigkeit von Cosinus und Sinus, vergleiche die Ausführungen im Anschluss an den Satz 4.28. Außerdem bekommen wir unmittelbar die so genannte
Eulersche Formel
eix = cos(x) + i sin(x) für alle x ∈ R.
Ferner ist |eix |2 = eix e−ix = e0 = 1 für alle x ∈ R, woraus sich sofort
cos2 (x) + sin2 (x) = 1 für alle x ∈ R
ergibt. Unmittelbar aus der Definition folgt noch
cos(−x) = cos(x) und
sin(−x) = − sin(x) für alle x ∈ R,
so dass der Cosinus eine gerade Funktion und der Sinus eine ungerade Funktion ist. Wir
fassen diese Beobachtungen in dem folgenden Resultat zusammen.
Satz 5.16 ( Eigenschaften der reellen Sinus– und Cosinus–Funktion )
Für alle x ∈ R gelten die folgenden Eigenschaften:
(a) Die Funktionen cos und sin sind stetig auf ganz R.
(b) Es ist cos(x) = Re(eix ) und sin(x) = Im(eix ), insbesondere gilt die Eulersche Formel
eix = cos(x) + i sin(x) für alle x ∈ R.
Christian Kanzow, Universität Würzburg, WS 2010/11
152
KAPITEL 5. SPEZIELLE FUNKTIONEN
(c) Der Cosinus ist eine gerade und der Sinus eine ungerade Funktion, also cos(−x) =
cos(x) und sin(−x) = − sin(x) für alle x ∈ R.
(d) Es ist cos2 (x) + sin2 (x) = 1.
Die Aussage (d) des Satzes 5.16 lässt, gemeinsam mit der Definition der Tangens–Funktion
und einem aus der Schule bekannten Strahlensatz, die geometrische Interpretation aus der
Abbildung 5.3 zu.
i
eix
tan x
sin x
1
cos x
Abbildung 5.3: Geometrische Interpretation von Sinus, Cosinus und Tangens am Einheitskreis
Aus den Additionstheoremen vom Sinus und Cosinus lassen sich beliebig viele trigonometrische Identitäten herleiten. Wir geben hier zur Illustration nur die nachstehenden
Gleichungen an.
Satz 5.17 Für alle x, y ∈ R gelten
x+y
sin(x) − sin(y) = 2 cos
2
und
cos(x) − cos(y) = −2 sin
x+y
2
sin
sin
x−y
2
x−y
2
.
Beweis: Wir setzen
x−y
x+y
und v :=
.
2
2
Dann ist x = u + v und y = u − v. Aus dem Satz 5.14 folgt daher
u :=
sin(x) − sin(y) = sin(u + v) − sin(u − v)
Christian Kanzow, Universität Würzburg, WS 2010/11
5.3. SINUS UND COSINUS
153
sin(u) cos(v) + cos(u) sin(v)
− sin(u) cos(−v) + cos(u) sin(−v)
= 2 cos(u) sin(v)
x+y
x−y
= 2 cos
sin
,
2
2
=
wobei wir ausgenutzt haben, dass der Cosinus eine gerade und der Sinus eine ungerade
Funktion ist. Damit ist die erste Formel bewiesen. Der Nachweis der zweiten Identität gelingt auf ähnliche Weise und bleibt dem Leser überlassen.
2
Der folgende Satz enthalt nun insbesondere die Definition der Zahl Kreiszahl π.
Satz 5.18 ( Definition von π )
π
Der Cosinus
hat im Intervall
[0, 2] genau eine Nullstelle. Diese bezeichnet man mit 2 . Es
π
π
ist cos 2 = 0 und sin 2 = 1.
Beweis: Der Beweis gliedert sich in mehrere Schritte.
Schritt 1: Es gilt cos(2) ≤ − 31 .
Aus der Potenzreihendarstellung des Cosinus folgt
cos(x) ≤ 1 −
x2 x4
+
2
24
für alle x ∈ (0, 2],
denn die Potenzreihe ist (für jedes feste x ∈ (0, 2]) eine alternierende Reihe mit einer
x2k
, so dass die
ab k = 1 streng monoton fallenden Nullfolge an Reihengliedern ak := (2k)!
Abschätzung wie im Beweis des Leibniz–Kriteriums folgt. Speziell für x = 2 ergibt sich die
erste Zwischenbehauptung.
Schritt 2: Es ist sin(x) > 0 für alle x ∈ (0, 2].
Aus der Potenzreihendarstellung des Sinus erhält man wie im vorigen Beweisschritt die für
alle x ∈ (0, 2] gültige Abschätzung
sin(x) > x −
x3
.
6
Der rechts stehende Ausdruck ist aber für alle x ∈ (0, 2] positiv, womit auch die zweite
Zwischenbehauptung bewiesen ist.
Schritt 3: Der Cosinus ist im Intervall [0, 2] streng monoton fallend.
Seien dazu 0 ≤ x < y ≤ 2 beliebig gegeben. Wegen Satz 5.17 gilt dann
y−x
y+x
sin
.
cos(y) − cos(x) = −2 sin
2
2
Der rechts stehende Ausdruck ist wegen Schritt 2 aber negativ. Dies beweist auch die
Zwischenbehauptung 3.
Christian Kanzow, Universität Würzburg, WS 2010/11
154
KAPITEL 5. SPEZIELLE FUNKTIONEN
Schritt 4: Der Cosinus hat genau eine Nullstelle in [0, 2].
Aus der Potenzreihendarstellung folgt cos(0) = 1 > 0. Wegen Schritt 1 ist aber cos(2) ≤
− 31 < 0. Da der Cosinus wegen Satz 5.16 stetig ist, folgt die Existenz einer Nullstelle in
dem Intervall (0, 2) unmittelbar aus dem Zwischenwertsatz. Wegen Schritt 3 kann es dabei
höchstens eine und damit genau eine solche Nullstelle geben.
Schritt 5: Es ist sin π2 = 1.
π
2 π
Gemäß Definition
ist
eine
Nullstelle
des
Cosinus.
Aus
dem
Satz
5.16
folgt
daher
sin
=
2
2
π
π
1, also sin 2 = ±1. Wegen Schritt 2 ist dabei zwangsläufig sin 2 = 1.
2
Für die Exponentialfunktion folgt mit der Zahl π die nachstehende Tabelle:
x
1
π
2
eix
i
π
3
π
2
2π
−1 −i
1
Aufgrund der Eulerschen Formel gilt nämlich
π π iπ/2
e
= cos
+ i sin
= i.
2
2
Die weiteren Werte ergeben sich dann aus einπ/2 = in für alle n ∈ N.
Mittels der Eulerschen Formel eix = cos x + i sin x und Vergleich von Real– und Imaginärteil erhalten wir aus der obigen Tabelle die folgenden Werte für cos(x) und sin(x):
x
cos(x)
sin(x)
1
π
2
0
1
π
−1
0
3
π
2
0
−1
2π
1
0
Wir wollen im Folgenden zeigen, dass die Exponentialfunktion und die beiden trigonometrischen Funktionen cos und sin periodisch sind. Dabei nennen wir eine Funktion f : K → K
periodisch mit der Periode p ∈ K, wenn
f (x + p) = f (x) für alle x ∈ K
gilt.
Satz 5.19 ( Periodizität von exp, cos und sin )
(a) Für alle z ∈ K gilt
ez+πi/2 = iez ,
ez+πi = −ez ,
ez+2πi = ez .
Die Exponentialfunktion hat also die imaginäre Periode 2πi.
Christian Kanzow, Universität Würzburg, WS 2010/11
5.3. SINUS UND COSINUS
(b) Für alle z ∈ K gilt
π
cos z +
= − sin(z),
2
155
cos(z + π) = − cos(z),
cos(z + 2π) = cos(z).
Der Cosinus hat also die reelle Periode 2π.
(c) Für alle z ∈ K gilt
π
sin z +
= cos(z),
2
sin(z + π) = − sin(z),
sin(z + 2π) = sin(z).
Der Sinus hat also die reelle Periode 2π.
Beweis: (a) Wir wissen bereits, dass eiπ/2 = i, eπi = −1 und e2πi = 1 gelten. Die Behauptungen folgen daher alle aus dem Additionstheorem der Exponentialfunktion.
(b) Die Behauptungen folgen allesamt aus der Definition des Cosinus und den bereits
bekannten Eigenschaften der Exponentialfunktion. Beispielsweise gilt
1 i(z+ π )
π
−i(z+ π2 )
2 + e
=
e
cos z +
2
2
π
1 iz i π
=
e e 2 + e−iz e−i 2
2
3
1 iz i π
=
e |{z}
e 2 +e−iz |{z}
ei 2 π
2
=i
=−i
1 iz
e − e−iz
= −
2i
= − sin(z)
für alle z ∈ K. Die anderen Gleichungen lassen sich ebenso verifizieren.
(c) In Analogie zum Teil (b) ergeben sich die Behauptungen sofort aus der Definition des
Sinus und den Eigenschaften der Exponentialfunktion.
2
Wir wollen schließlich noch zeigen, dass die im Satz 5.19 angegebenen Perioden nicht
verkleinert werden können. Dazu ist es sinnvoll, die Nullstellen der betreffenden Funktionen
genau zu kennen. Im Fall der trigonometrischen Funktionen liefert das folgende Resultat
die gewünschte Antwort.
Satz 5.20 ( Nullstellen von cos und sin )
(a) Der Cosinus hat auf R genau die Nullstellen
π
2
+ kπ mit k ∈ Z.
(b) Der Sinus hat auf R genau die Nullstellen kπ mit k ∈ Z.
(c) 2π ist die kleinste positive Periode von Cosinus und Sinus.
Christian Kanzow, Universität Würzburg, WS 2010/11
156
KAPITEL 5. SPEZIELLE FUNKTIONEN
Beweis: (a) Gemäß Definition ist π2 die einzige Nullstelle des Cosinus im Intervall [0, 2],
insbesondere also im Intervall [0, π2 ]. Da der Cosinus wegen Satz 5.16 (e) eine gerade Funktion ist, handelt es sich bei π2 sogar um die einzige Nullstelle im Intervall (− π2 , + π2 ]. Wegen
cos(x + π) = − cos(x) sind daher π2 und π2 + π die einzigen Nullstellen in (− π2 , π2 + π]. Dieses
Intervall hat die Länge der Periode 2π. Alle weiteren Nullstellen des Cosinus enthält man
somit aus π2 und π2 + π durch Addition von ganzzahligen Vielfachen k2π, k ∈ Z.
(b) Die Nullstellen des Sinus entstehen wegen sin(x) = − cos(x + π2 ) (verwende das Additionstheorem des Cosinus) aus den Nullstellen des Sinus durch eine Verschiebung um
π
.
2
(c) Wäre p mit 0 < p < 2π eine Periode etwa des Cosinus, so müsste wegen der Nullstellenverteilung p = π gelten. Wegen cos(0) = 1 und cos π = −1 ist π aber keine Periode. 2
Schließlich haben wir noch das folgende Resultat.
Korollar 5.21
ist.
(a) Genau dann ist ez = 1, wenn z ein ganzzahliges Vielfaches von 2πi
(b) Cosinus und Sinus haben auch in C nur die im Satz 5.20 angegebenen Nullstellen.
Beweis: (a) Die Rückrichtung ergibt sich sofort aus e2kπi = (e2πi )k = 1k = 1 für alle
k ∈ Z. Sei umgekehrt ez = 1 und schreibe z = x + iy für x, y ∈ R. Dann gilt
1 = |ez | = ex |eiy | = ex .
Die Bijektivität der reellen Exponentialfunktion liefert somit x = 0. Daher erhält man
unter Verwendung der Eulerschen Formel
1 = ez = eiy = cos(y) + i sin(y).
Durch Vergleich von Real– und Imaginärteil folgt hieraus
cos(y) = 1 und
sin(y) = 0.
Wegen Satz 5.20 ergibt sich aus sin(y) = 0 sofort y = kπ für ein beliebiges k ∈ Z. Unter
Verwendung von cos(y) = 1 folgt schließlich, dass nur die geraden Zahlen aus Z in Frage
kommen, denn für ungerades
k = 2m + 1 ergäbe sich aufgrund der 2π–Periodizität von cos
unmittelbar cos (2m + 1)π = cos(π) = −1.
(b) Wir beweisen die Aussage nur für den Sinus, da er für den Cosinus analog verläuft. Die
Behauptung folgt aus den Äquivalenzen
sin(z) = 0 ⇐⇒ eiz = e−iz ⇐⇒ e2iz = 1 ⇐⇒ z = kπ
mit k ∈ Z,
wobei wir den Teil (a) verwendet haben.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
5.4. TRIGONOMETRISCHE UMKEHRFUNKTIONEN
157
1.0
0.5
1
2
3
4
5
6
-0.5
-1.0
Abbildung 5.4: Der Graph der reellen Sinus–Funktion für x ∈ [0, 2π].
1.0
0.5
1
2
3
4
5
6
-0.5
-1.0
Abbildung 5.5: Der Graph der reellen Cosinus–Funktion für x ∈ [0, 2π].
Das Aussehen der beiden reellen sin– und cos–Funktionen für ein Periodenintervall [0, 2π]
findet man in den Abbildungen 5.4 und 5.5.
π Aus den obigen
Resultaten folgt außerdem, dass der Tangens für alle z ∈ K mit z 6∈
+ kπ | k ∈ Z definiert ist. Der Graph der reellen Tangens–Funktion findet sich in der
2
Abbildung 5.6.
5.4
Trigonometrische Umkehrfunktionen
Wir wollen in diesem Abschnitt die Umkehrfunktionen der Abbildungen cos, sin und tan
definieren und untersuchen. Zu diesem Zweck benötigen wir das nachstehende Resultat.
Satz 5.22 ( Monotonie–Eigenschaften von cos, sin und tan )
(a) Der Cosinus ist im Intervall [0, π] streng monoton fallend und bildet dieses Intervall
bijektiv auf [−1, 1] ab.
(b) Der Sinus ist im Intervall [− π2 , + π2 ] streng monoton wachsend und bildet dieses Intervall bijektiv auf [−1, +1] ab.
Christian Kanzow, Universität Würzburg, WS 2010/11
158
KAPITEL 5. SPEZIELLE FUNKTIONEN
6
4
2
-4
2
-2
4
-2
-4
-6
Abbildung 5.6: Der Graph der reellen Tangens–Funktion für x ∈ [− 23 π, + 23 π].
(c) Der Tangens ist im Intervall (− π2 , + π2 ) streng monoton wachsend und bildet dieses
Intervall bijektiv auf R ab.
Beweis: (a) Im Beweis des Satzes 5.18 haben wir gesehen, dass der Cosinus auf [0, 2] streng
monoton fallend ist. Insbesondere ist der Cosinus somit auf [0, π2 ] streng monoton fallend.
Nun ist aber cos(x) = − cos(π − x). Daher ist der Cosinus auch auf dem Intervall [ π2 , π]
streng monoton fallend. Wegen Satz 2.9 ist der Cosinus daher eine injektive Abbildung
auf dem Intervall [0, π]. Folglich ist der Cosinus bijektiv als Abbildung von [0, π] auf den
Bildbereich [cos(π), cos(0)] = [−1, +1].
(b) Wegen sin(x) = cos( π2 − x) folgt aus dem Teil (a), dass der Sinus auf dem Intervall
[− π2 , π2 ] streng monoton wächst. Aus dem Satz 2.9 folgt daher die Injektivität des Sinus
auf dem Intervall [− π2 , π2 ]. Also ist der Sinus eine bijektive Abbildung von [− π2 , π2 ] in den
Bildbereich [sin(− π2 ), sin( π2 )] = [−1, +1].
(c) Seien 0 ≤ x1 < x2 <
Hieraus folgt
π
2
gegeben. Dann ist sin(x1 ) < sin(x2 ) und cos(x1 ) > cos(x2 ) > 0.
tan(x1 ) =
sin(x2 )
sin(x1 )
<
= tan(x2 ).
cos(x1 )
cos(x2 )
Also ist der Tangens auf dem Intervall [0, π2 ) streng monoton wachsend. Wegen tan(−x) =
− tan(x) wächst der Tangens auch in (− π2 , 0]. Also ist der Tangens auf dem gesamten
Intervall (− π2 , + π2 ) streng monoton wachsend. Außerdem gilt limx→ π2 − tan(x) = +∞ und
limx→ −π + tan(x) = −∞, wie man leicht bestätigt. Aus Stetigkeitsgründen folgt mit dem
2
Zwischenwertsatz daher die Behauptung.
2
Wegen der Sätze 5.22 und 2.9 besitzen die Funktionen Sinus, Cosinus und Tangens auf
ihren jeweiligen Bildbereichen eine Umkehrfunktion. Diese erhalten einen eigenen Namen.
Definition 5.23 (a) Die Umkehrfunktion arccos : [−1, +1] → R des Cosinus heißt
Arcus–Cosinus.
Christian Kanzow, Universität Würzburg, WS 2010/11
5.4. TRIGONOMETRISCHE UMKEHRFUNKTIONEN
159
(b) Die Umkehrfunktion arcsin: [−1, +1] → R des Sinus heißt Arcus–Sinus.
(c) Die Umkehrfunktion arctan: R → R des Tangens heißt Arcus–Tangens.
Die in der Definition 5.23 angegebenen Umkehrfunktionen bezeichnet man manchmal auch
als Hauptzweige von arccos, arcsin und arctan. Die so genannten Nebenzweige erhält man
mittels der folgenden Beobachtung: In Verallgemeinerung des Satzes 5.22 gelten die folgenden Aussagen für alle k ∈ Z:
(a) cos bildet das Intervall [kπ, (k + 1)π] bijektiv auf [−1, +1] ab.
(b) sin bildet das Intervall [− π2 + kπ, π2 + kπ] bijektiv auf [−1, +1] ab.
(c) tan bildet das Intervall (− π2 + kπ, π2 + kπ) bijektiv auf R ab.
Die zugehörigen Umkehrfunktionen
arccosk : [−1, +1] → R,
arcsink : [−1, +1] → R,
arctank : R → R
sind für k 6= 0 dann die Nebenzweige von arccos, arcsin und arctan (für k = 0 ergeben
sich die Hauptzweige dieser Funktionen). Der graphische Verlauf des Arcus–Tangens ist
beispielhaft in der Abbildung 5.7 angegeben. Gemäß Definition ist hierbei klar, dass der
Arcus–Tangens für x → −∞ die horizontale Asymptote y ≡ − π2 und für x → +∞ die
horizontale Asymptote y ≡ + π2 besitzt.
1.0
0.5
-6
-4
2
-2
4
6
-0.5
-1.0
Abbildung 5.7: Der Graph der reellen Arcus–Tangens–Funktion für x ∈ [−7, +7].
Wir beenden diesen Abschnitt mit zwei kleinen Anwendungen des Tangens und seiner
Umkehrfunktion. Diese treten beispielsweise im Straßenverkehr auf, wenn man ein Verkehrsschild mit einer Steigungsangabe von etwa 12% sieht.
Dies bedeutet gerade, dass man auf 100 Metern Länge 12 Meter Höhe gewinnt. Der
Steigungswinkel α (im Bogenmaß) ergibt sich daher gerade aus
tan(α) =
12
= 0.12
100
⇐⇒
α = arctan(0.12).
Christian Kanzow, Universität Würzburg, WS 2010/11
160
KAPITEL 5. SPEZIELLE FUNKTIONEN
12
α
100
In Grad umgerechnet entspricht dies etwa einem Wert von 6.843◦.
Die Bahn benutzt für ihre Gleispläne ebenfalls den Tangens. Für Weichen finden sich
etwa Angaben der folgenden Gestalt:
Die Zahl 49 bezieht sich auf das verwendete Schienenprofil, die 190 bezeichnet den Radius (190 Meter) des abzweigenden Gleises, die Angabe 1 : 9 schließlich den Abzweigwinkel.
Genau genommen besagt die Angabe 1 : 9, dass das abzweigende Gleis von dem gradlinig
weiter verlaufenden Hauptgleis nach 9 Metern (gemessen am Hauptgleis) einen Abstand
von 1 Meter aufweist (gemessen von Gleismitte zu Gleismitte). Als Abzweigwinkel α ergibt
sich somit
1
1
.
⇐⇒ α = arctan
tan(α) =
9
9
Die Modellbahnindustrie folgt hier übrigens nicht dem Vorbild, sondern gibt für ihre Weichen gleich den Abzweigwinkel in Grad an.
5.5
Polarkoordinaten
Wir führen in diesem Abschnitt eine andere Darstellung von komplexen Zahlen ein, die
für manche Untersuchungen von Vorteil ist und insbesondere eine einfache geometrische
Interpretation für die Multiplikation von zwei komplexen Zahlen erlaubt.
Christian Kanzow, Universität Würzburg, WS 2010/11
5.5. POLARKOORDINATEN
161
Satz 5.24 ( Polarkoordinaten komplexer Zahlen )
Jedes z ∈ C besitzt eine Darstellung
z = reiϕ
mit r := |z| und einem ϕ ∈ R,
wobei ϕ im Fall z 6= 0 bis auf ein ganzzahliges Vielfaches von 2π eindeutig bestimmt ist
und im Fall z = 0 beliebig sein kann.
Beweis: Für z = 0 ist offenbar nichts zu zeigen. Sei daher z 6= 0. Setze dann r := |z| und
ζ := zr , so dass |ζ| = 1 gilt. Die komplette Zahl ζ besitzt nun eine Darstellung der Gestalt
ζ = ξ + iη mit ξ, η ∈ R. Wegen |ζ| = 1 ist ξ 2 + η 2 = 1 und deshalb |ξ| ≤ 1. Daher ist
α := arccos ξ
definiert. Aus ξ = cos(α) folgt mit sin(x)2 + cos(x)2 = 1 deshalb
p
sin(α) = ± 1 − ξ 2 = ±η.
Wir setzen jetzt
ϕ :=
α,
falls sin(α) = η,
−α, falls sin(α) = −η.
In jedem Fall ist dann
eiϕ = cos(ϕ) + i sin(ϕ) = ξ + iη = ζ,
da der Cosinus eine gerade und der Sinus eine ungerade Funktion sind. Damit gilt z = reiϕ ,
womit zumindest die Existenz der behaupteten Darstellung bewiesen ist.
Haben wir noch eine zweite Darstellung z = reiψ mit r = |z| wie vorher und einem
beliebigen ψ ∈ R, so gilt ei(ϕ−ψ) = 1. Wegen Korollar 5.21 impliziert dies unmittelbar
(ϕ − ψ) = 2kπ für ein k ∈ Z.
2
Ein Paar (r, ϕ) mit z = reiϕ bezeichnet man als Polarkoordinaten von z. Die Zahl ϕ selbst
heißt auch Argument von z. Anschaulich ist r die Länge des Vektors z und ϕ beschreibt
den Winkel (im Bogenmaß) zwischen der positiven reellen Achse und dem Ortsvektor z in
der komplexen Zahlenebene.
Als kleine Anwendung der Polarkoordinaten geben wir hier die schon im Abschnitt 1.6
angekündigte geometrische Interpretation für die Multiplikation zweier komplexer Zahlen:
Seien dazu z1 , z2 ∈ C beliebig gegeben. Wegen Satz 5.24 existieren dann (im Wesentlichen
eindeutig bestimmte) Polarkoordinaten (r1 , ϕ1 ) und (r2 , ϕ2 ) mit
z1 = r1 eϕ1
und z2 = r2 eϕ2 .
Multiplikation ergibt unter Ausnutzung des Additionstheorems für die Exponentialfunktion
dann
z1 z2 = r1 r2 eϕ1 +ϕ2 .
Christian Kanzow, Universität Würzburg, WS 2010/11
162
KAPITEL 5. SPEZIELLE FUNKTIONEN
z·w
|z| · |w|
w
|w|
α+β
β
0
|z|
z
α
1
Abbildung 5.8: Veranschaulichung der Multiplikation zweier komplexer Zahlen
Man erhält also das Produkt zweier komplexer Zahlen, indem man die Beträge multipliziert
und ihre Argumente addiert, vergleiche hierzu die Abbildung 5.8.
Als weitere Folgerung aus der Darstellung einer komplexen Zahl mittels Polarkoordinaten ergibt sich das nachstehende Resultat.
Satz 5.25 ( Einheitswurzeln )
Die Gleichung z n = 1 (n ∈ N) besitzt genau die Lösungen
ζk := ek2πi/n , k = 1, . . . , n.
Beweis: Wegen Satz 2.14 besitzt das Polynom z n − 1 höchstens n Nullstellen in C. Man
verifiziert nun sehr leicht, dass die ζk tatsächlich für alle k = 1, . . . , n Nullstellen dieses
Polynoms sind. Damit ist auch schon alles bewiesen.
2
Die im Satz 5.25 definierten Zahlen ζ1 , . . . , ζn heißen n-te Einheitswurzeln. Anschaulich
bilden sie die Ecken eines regelmäßigen n-Ecks vom Radius Eins um den Nullpunkt. Für
n = 3 und n = 5 ist dies in der Abbildung 5.9 dargestellt.
5.6
Der Fundamentalsatz der Algebra
Wir beweisen in diesem Abschnitt den schon früher erwähnten Fundamentalsatz der Algebra, wonach jedes (reelle oder komplexe) Polynom vom Grad n genau n Nullstellen
im Körper der komplexen Zahlen C besitzt. Dabei haben auch reelle Polynome eventuell
(konjugiert–) komplexe Nullstellen, wie das Beispiel p(x) := x2 + 1 mit den beiden Nullstellen +i und −i zeigt. Da jedes reelle Polynom insbesondere ein komplexes Polynom ist,
beweisen wir den Fundamentalsatz der Algebra von vornherein nur für komplexe Polynome.
Außerdem genügt es zu zeigen, dass jedes nicht konstante Polynom mindestens eine Nullstelle besitzt. Die eigentlichen Behauptung des Fundamentalsatz der Algebra folgt dann
Christian Kanzow, Universität Würzburg, WS 2010/11
5.6. DER FUNDAMENTALSATZ DER ALGEBRA
ζ1
1
1
163
ζ1
ζ2
−1
1
−1
1
ζ3
ζ2
−1
−1
ζ4
Abbildung 5.9: Veranschaulichung der dritten und fünften Einheitswurzeln
aus unseren Ausführungen im Abschnitt 2.3, wonach wir diese Nullstelle abspalten können
und als Rest ein Polynom erhalten, dessen Grad um eine Einheit niedriger ist als der Grad
des gegebenen Polynoms. Sofern dieses nicht konstant ist, hat es dann ebenfalls eine Nullstelle, die wiederum abgespalten werden kann usw. Zum Beweis des Fundamentalsatzes der
Algebra genügt es also, die nachstehende (äquivalente) Formulierung zu zeigen.
Satz 5.26 ( Fundamentalsatz der Algebra )
Jedes komplexe Polynom positiven Grades besitzt mindestens eine Nullstelle in C.
Beweis: Gegeben sei das Polynom
p(z) = a0 + a1 z + . . . + an z n
mit ak ∈ C ∀k = 0, 1, . . . , n
und an 6= 0, also Grad(p) = n. Wir zeigen zunächst, dass |p(z)| → ∞ für |z| → ∞ gilt. Zu
diesem Zweck setzen wir bn−k := an−k /an für k = 1, . . . , n und schreiben
1
1
1
n
p(z) = an z 1 + bn−1 + bn−2 2 + . . . + b0 n = an z n g(z)
z
z
z
mit der für z 6= 0 definierten Funktion
1
1
1
g(z) := 1 + bn−1 + bn−2 2 + . . . + b0 n .
z
z
z
Setzen wir
β := 1 + |bn−1 | + |bn−2 | + . . . + |b0 |,
so gilt für alle z ∈ C mit |z| ≥ β ≥ 1 offenbar
1
1
β
1
≤
.
h(z) := bn−1 + . . . + b0 n ≤ |bn−1 | + . . . + |b0 |
z
z
|z|
|z|
Christian Kanzow, Universität Würzburg, WS 2010/11
164
KAPITEL 5. SPEZIELLE FUNKTIONEN
Für alle z ∈ C mit |z| ≥ 2β ist daher
h(z) ≤
und somit
β
1
≤
|z|
2
1
|g(z)| ≥ 1 − h(z) ≥ .
2
Damit folgt also
1
|p(z)| = |an | · |z|n · |g(z)| ≥ |an | · |z|n
2
für alle z ∈ C mit |z| ≥ 2β. Dies zeigt aber die Gültigkeit von |p(z)| → ∞ für |z| → ∞
(beachte an 6= 0).
Wegen |p(z)| ≥ 0 für alle z ∈ C existiert aufgrund der Vollständigkeit der reellen Zahlen
das Infimum
µ := inf |p(z)| z ∈ C .
Wegen |p(z)| → ∞ für |z| → ∞ existiert ein r > 0 mit |p(z)| ≥ µ für alle z ∈ Cmit
|z| > r. Also
ist µ sogar das Infimum der Einschränkung von |p| auf den Kreis K := z ∈
C |z| ≤ r , d.h.
µ := inf |p(z)| z ∈ C = inf |p(z)| z ∈ K .
Nun nimmt die stetige Funktion |p| auf der kompakten Menge K aber ihr Infimum an.
Folglich existiert ein ζ ∈ K mit
|p(ζ)| = µ.
Wir wollen nun zeigen, dass dieses ζ eine Nullstelle von p ist. Dazu haben wir zu beweisen,
dass µ = 0 gilt. Per Definition ist µ ≥ 0. Wir führen einen Widerspruchsbeweis und nehmen
an, dass µ > 0 gilt. Dann ist das transformierte Polynom
q(z) :=
p(z + ζ)
p(ζ)
wohldefiniert, vom Grad n mit q(0) = 1 und |q(z)| ≥ 1 für alle z ∈ C (per Konstruktion
von ζ). Wir schreiben q in der Gestalt
q(z) = c0 + c1 z + . . . + cn z n .
Wegen q(0) = 1 ist c0 = 1 und wegen Grad(q) = n ist cn 6= 0. Einige der anderen
Koeffizienten ck , k ∈ {1, . . . , n − 1}, hingegen können Null sein. Sei m ∈ {1, . . . , n} der
kleinste Index mit cm 6= 0. Dann haben wir
q(z) = 1 + cm z m + cm+1 z m+1 + . . . + cn z n .
(5.3)
Die Zahl −|cm |/cm hat den Betrag Eins und besitzt in Polarkoordinaten daher eine Darstellung der Gestalt
|cm |
= eiϕ .
−
cm
Christian Kanzow, Universität Würzburg, WS 2010/11
5.6. DER FUNDAMENTALSATZ DER ALGEBRA
165
Definieren wir noch ψ := ϕ/m, so folgt
cm eimψ = cm eiϕ = −|cm |.
Wir betrachten nun spezielle z ∈ C von der Gestalt z = ρeiψ (mit dem gerade eingeführten
Winkel ψ und einer noch beliebigen Länge ρ > 0). Einsetzen in (5.3) liefert wegen |eiα | = 1
für alle α ∈ R dann
q(ρeiψ ) ≤ 1 + cm ρm eimψ + |cm+1 |ρm+1 + . . . + |cn |ρn
= |1 − |cm |ρm | + |cm+1 |ρm+1 + . . . + |cn |ρn .
Für alle ρ > 0 mit ρm < 1/|cm | ist 1 − |cm |ρm > 0 und daher
q(ρeiψ ) ≤ 1 − |cm |ρm + |cm+1 |ρm+1 + . . . + |cn |ρn
= 1 − ρm |cm | − |cm+1 |ρ − . . . − |cn |ρn−m .
Der in Klammern stehende Ausdruck ist für hinreichend kleine ρ > 0 aber positiv. Für die
zugehörigen z = ρeiψ gilt damit
|q(z)| = |q(ρeiψ )| < 1
im Widerspruch zu |q(z)| ≥ 1 für alle z ∈ C per Konstruktion von q. Also ist doch µ = 0
und ζ somit eine Nullstelle des Polynoms p.
2
Christian Kanzow, Universität Würzburg, WS 2010/11
166
KAPITEL 5. SPEZIELLE FUNKTIONEN
Christian Kanzow, Universität Würzburg, WS 2010/11
Kapitel 6
Differentialrechnung
6.1
6.2
6.3
6.4
6.5
6.6
6.1
Die Ableitung einer Funktion
Rechenregeln
Mittelwertsätze
Die Regeln von L’Hospital
Konvexe Funktionen
Wichtige Ungleichungen und ℓp –Normen
Die Ableitung einer Funktion
Wir beginnen mit der für dieses Kapitel zentralen Definition.
Definition 6.1 Seien D ⊆ R und f : D → R eine gegebene Funktion. Dann heißt f in
einem Punkt x ∈ D differenzierbar, wenn x ein Häufungspunkt der Menge D ist und der
Grenzwert
f (ξ) − f (x)
f ′ (x) := lim
(6.1)
ξ→x
ξ−x
ξ∈D\{x}
existiert (in R); in diesem Fall wird f ′ (x) als die Ableitung von f in x bezeichnet. Die
Funktion f heißt differenzierbar auf D, wenn sie in jedem Punkt x ∈ D differenzierbar ist.
Wegen der großen Bedeutung des Begriffs der Differenzierbarkeit erinnern wir an dieser
Stelle noch einmal daran, was das Symbol (6.1) bedeutet: Die Funktion f ist demnach
differenzierbar in x ∈ D, wenn für alle Folgen {xn } ⊆ D mit xn 6= x für alle n ∈ N und
xn → x der Grenzwert
f (xn ) − f (x)
lim
(6.2)
n→∞
xn − x
existiert und dieser Grenzwert übereinstimmt mit jenem Grenzwert, den man für eine
beliebige Folge {ξn } ⊆ D\{x} mit ξn → x erhalten würde. Demnach ist die Funktion f
in einem Punkt x nicht differenzierbar, wenn wir entweder eine Folge {xn } ⊆ D\{x} mit
xn → x finden können, so dass der Grenzwert (6.2) nicht existiert, oder wenn zwei gegen
167
168
KAPITEL 6. DIFFERENTIALRECHNUNG
x konvergente Folgen {xn }, {ξn } ⊆ D\{x} existieren, so dass die zugehörigen Grenzwerte
(6.2) existieren, aber verschieden sind, also
f (xn ) − f (x)
f (ξn ) − f (x)
6= lim
n→∞
n→∞
xn − x
ξn − x
lim
gilt. Dass überhaupt eine Folge {xn } ⊆ D mit xn → x existiert, liegt letztlich daran,
dass x nach Voraussetzung ein Häufungspunkt von D ist. In den meisten Fällen wird der
Definitionsbereich D der Funktion f später ein (eigentliches oder uneigentliches) Intervall
sein. Dann sind alle Punkte des Intervalles natürlich Häufungspunkte. Handelt es sich bei x
dabei um einen Randpunkt eines Intervalles, also beispielsweise x = a im Fall D = [a, b], so
nennt man den Ausdruck (6.1) auch den rechtsseitige Ableitung und schreibt hierfür f+′ (x),
da nur Folgen ξ betrachtet werden können, die von rechts gegen x konvergieren. Entsprechend nennt man den Ausdruck (6.1) die linksseitige Ableitung und schreibt dafür f−′ (x),
wenn etwa x = b im Fall D = [a, b] gilt. Die rechtsseitigen und linksseitigen Ableitungen
werden beide auch als einseitige Ableitungen bezeichnet.
Eine Funktion f : D → R auf einem kompakten Intervall D = [a, b] ist somit genau
dann differenzierbar auf D, wenn f in jedem Punkt x ∈ (a, b) differenzierbar ist und in den
beiden Randpunkten x = a und x = b die jeweiligen einseitigen Ableitungen existieren.
Das Problem der einseitigen Ableitungen existiert nicht, wenn der Definitionsbereich D
etwa ein offenes (eigentliches oder uneigentliches) Intervall ist. Trotzdem kann man auch
in einem solchen Fall einseitige Ableitungen definieren, was z.B. bei der Betragsfunktion
f (x) := |x| sinnvoll ist.
Ersetzt man ξ durch x + h, so lässt sich (6.1) offenbar äquivalent schreiben als
f ′ (x) = lim
h→0,h6=0
x+h∈D
f (x + h) − f (x)
.
h
(6.3)
Im Folgenden werden wir für die Limes–Ausdrücke in (6.1) und (6.3) meist nur
f (ξ) − f (x)
ξ→x
ξ−x
f ′ (x) = lim
f (x + h) − f (x)
h→0
h
und f ′ (x) = lim
df
(x) (sprich: df nach dx).
schreiben. Statt f ′ (x) schreibt man oft auch Df (x) oder dx
Zur geometrischen Interpretation der Ableitung betrachten wir zunächst den so genannten Differenzenquotienten
f (ξ) − f (x)
,
ξ−x
vergleiche die Abbildung
6.1. Dieser liefert die Steigung der Geraden durch die beiden
Punkte x, f (x) und ξ, f (ξ) , die auch als Sekante bezeichnet
wird. Beim Grenzübergang
ξ → x geht diese Sekante in die Tangente im Punkt x, f (x) über. Also ist f ′ (x) (sofern
existent) die Steigung der Tangente im Punkt x, f (x) . Da wir die Abbildung f ′ (x) somit
als Grenzwert der Differenzenquotienten erhalten, nennt man f ′ (x) manchmal auch den
Differentialquotienten von f in x.
Wir betrachten als Nächstes einige Beispiele.
Christian Kanzow, Universität Würzburg, WS 2010/11
6.1. DIE ABLEITUNG EINER FUNKTION
169
f
f (x + h)
Sekante
f (x + h) − f (x)
f (x)
x
h
x+h
Abbildung 6.1: Veranschaulichung des Differenzenquotienten
Beispiel 6.2 (a) Die konstante Funktion f : R → R, f (x) := c für ein c ∈ R, ist in allen
Punkten x ∈ R differenzierbar mit der Ableitung
f (ξ) − f (x)
c−c
0
= lim
= lim
= 0.
ξ→x
ξ→x ξ − x
ξ→x ξ − x
ξ−x
f ′ (x) = lim
(b) Die Funktion f : R → R mit f (x) := cx ist ebenfalls in allen Punkten x ∈ R
differenzierbar mit der Ableitung
cξ − cx
f (ξ) − f (x)
= lim
= lim c = c.
ξ→x ξ − x
ξ→x
ξ→x
ξ−x
f ′ (x) = lim
(c) Die Abbildung f : R → R, f (x) := x2 , ist auf ganz R differenzierbar und besitzt den
Differentialquotienten
f (x + h) − f (x)
h→0
h
2
(x + h) − x2
= lim
h→0
h
x2 + 2x + h2 − x2
= lim
h→0
h
= lim (2x + h)
f ′ (x) = lim
h→0
= 2x.
(d) Die Abbildung f : R\{0} → R, f (x) := x1 , ist in allen Punkten x 6= 0 differenzierbar
mit
f (x + h) − f (x)
h→0
h
f ′ (x) = lim
Christian Kanzow, Universität Würzburg, WS 2010/11
170
KAPITEL 6. DIFFERENTIALRECHNUNG
=
=
=
=
1
1
1
lim
−
h→0 h
x+h x
x − (x + h)
lim
h→0 h(x + h)x
−1
lim
h→0 (x + h)x
1
− 2.
x
(e) Die Exponentialfunktion exp : R → R ist in jedem Punkt x ∈ R differenzierbar, denn
unter Verwendung des Additionstheorems folgt
exp(x + h) − exp(x)
h→0
h
exp(x) exp(h) − exp(x)
= lim
h→0
h
exp(h) − 1
= exp(x) lim
h→0
h
= exp(x).
exp′ (x) = lim
Dabei haben wir benutzt, dass
exp(h) − 1
h
h2
=1+ +
+ . . . → 1 für h → 0
h
2!
3!
aufgrund der Reihenentwicklung der Exponentialfunktion gilt.
(f) Der Sinus sin : R → R und der Cosinus cos : R → R sind in allen Punkten x ∈ R
differenzierbar. Verwenden wir nämlich die beiden sich aus den Reihenentwicklungen
vom Sinus und Cosinus ergebenden Grenzwerte
sin(h)
= 1 und
h→0
h
lim
cos(h) − 1
= 0,
h→0
h
lim
so folgt aus den Additionstheoremen des Sinus und Cosinus unmittelbar
sin(x + h) − sin(x)
h→0
h
sin(x) cos(h) + cos(x) sin(h) − sin(x)
= lim
h→0
h
cos(h) − 1
sin(h)
= sin(x) lim
+ cos(x) lim
h→0
h→0
h
h
= cos(x)
sin′ (x) = lim
sowie
cos(x + h) − cos(x)
h→0
h
cos′ (x) = lim
Christian Kanzow, Universität Würzburg, WS 2010/11
6.1. DIE ABLEITUNG EINER FUNKTION
171
cos(x) cos(h) − sin(x) sin(h) − cos(x)
h→0
h
cos(h) − 1
sin(h)
= cos(x) lim
− sin(x) lim
h→0
h→0
h
h
= − sin(x).
= lim
(g) Die Funktion f : [0, ∞) → R, f (x) :=
mit
√
x ist in jedem Punkt x > 0 differenzierbar
f (x + h) − f (x)
h→0
h
√
√
x+h− x
lim
h→0
√ h
√ √
√
( x + h − x)( x + h + x)
√
lim
√
h→0
h( x + h + x)
x+h−x
lim √
√
h→0 h( x + h +
x)
1
lim √
√
h→0
x+h+ x
1
√ .
2 x
f ′ (x) = lim
=
=
=
=
=
Hingegen ist die Wurzelfunktion in x = 0 nicht differenzierbar, denn der (einseitige)
Grenzwert
√
h
1
f (0 + h) − f (0)
= lim+
= lim+ √ = +∞
lim+
h→0
h→0
h→0
h
h
h
existiert nur im uneigentlichen Sinne.
(h) Die Funktion f : R → R, f (x) := |x|, ist im Nullpunkt x = 0 nicht differenzierbar,
denn für die spezielle Folge hn := n1 → 0 gilt
f (0 + hn ) − f (0)
lim
= lim
n→∞
n→∞
hn
1
n
1
n
= lim 1 = 1,
n→∞
während wir für die Folge hn := − n1 → 0 den hiervon verschiedenen Grenzwert
1
f (0 + hn ) − f (0)
= lim n1 = lim (−1) = −1
n→∞
n→∞ −
n→∞
hn
n
lim
erhalten.
3
Wir präsentieren in dem folgenden Resultat noch eine Charakterisierung für die Differenzierbarkeit einer Funktion f , die uns später helfen wird, den Ableitungsbegriff auf Funktionen mit mehreren Variablen zu verallgemeinern.
Christian Kanzow, Universität Würzburg, WS 2010/11
172
KAPITEL 6. DIFFERENTIALRECHNUNG
Satz 6.3 ( Charakterisierung differenzierbarer Funktionen )
Sei f : D → R eine gegebene Funktion und x ∈ D ein Häufungspunkt der Menge D. Dann
sind die folgenden Aussagen äquivalent:
(a) f ist differenzierbar in x mit Ableitung a = f ′ (x).
(b) Es gibt eine in x stetige Funktion q : D → R mit
f (ξ) = f (x) + q(ξ)(ξ − x)
für alle ξ ∈ D.
In diesem Fall ist f ′ (x) = q(x).
(c) Es gibt ein a ∈ R und eine in x stetige Funktion ϕ mit ϕ(x) = 0 (also ϕ(ξ) → 0 für
ξ → x) und
f (ξ) = f (x) + a(ξ − x) + ϕ(ξ)(ξ − x)
für alle ξ ∈ D.
In diesem Fall ist f ′ (x) = a.
(d) Es gibt ein a ∈ R mit
f (ξ) − f (x) − a(ξ − x)
= 0.
ξ→x
ξ−x
lim
In diesem Fall ist f ′ (x) = a.
Beweis: Wir führen einen Ringbeweis (a) =⇒ (b) =⇒ (c) =⇒ (d) =⇒ (a), womit dann
die Äquivalenz aller vier Aussagen bewiesen ist.
(a) =⇒ (b): Sei f differenzierbar in x mit Ableitung a = f ′ (x). Wir definieren dann
q : D → R durch q(ξ) :=
f (ξ)−f (x)
,
ξ−x
′
f (x),
falls ξ 6= x,
falls ξ = x.
Gemäß Definition der Differenzierbarkeit ist q stetig in x, und es gilt q(ξ)(ξ − x) =
f (ξ) − f (x) für alle ξ ∈ D.
(b) =⇒ (c): Nach Voraussetzung (b) können wir mit a := f ′ (x)
f (ξ) = f (x) + a(ξ − x) + q(ξ) − a (ξ − x) für alle ξ ∈ D
schreiben. Mit ϕ(ξ) := q(ξ) − a für ξ ∈ D folgt dann ϕ(x) = q(x) − a = f ′ (x) − f ′ (x) = 0
und daher auch
lim ϕ(ξ) = q(x) − a = ϕ(x)
ξ→x
aufgrund der Stetigkeit von q in x. Damit ist auch die Stetigkeit von ϕ in x nachgewiesen.
Christian Kanzow, Universität Würzburg, WS 2010/11
6.1. DIE ABLEITUNG EINER FUNKTION
173
(c) =⇒ (d): Nach Voraussetzung (c) gilt mit a = f ′ (x):
f (ξ) − f (x) − a(ξ − x)
ϕ(ξ)(ξ − x)
=
= ϕ(ξ) für alle ξ ∈ D, ξ 6= x.
ξ−x
ξ−x
Hieraus folgt
f (ξ) − f (x) − a(ξ − x)
= lim ϕ(ξ) = ϕ(x) = 0
ξ→x
ξ→x
ξ−x
lim
aufgrund der Stetigkeit von ϕ in x.
(d) =⇒ (a): Nach Teil (d) gilt
a(ξ − x)
f (ξ) − f (x)
= lim
= a = f ′ (x),
ξ→x ξ − x
ξ→x
ξ−x
lim
so dass f im Punkte x in der Tat differenzierbar ist.
2
Achtung: Der Satz 6.3 besagt lediglich, dass die stetige Funktion q in dem Punkt ξ = x den
Wert f ′ (x) annimmt. In anderen Punkten ξ 6= x wird im Allgemeinen q(ξ) 6= f ′ (ξ) sein.
Dies ist schon deshalb der Fall, weil die Ableitung von f in ξ 6= x gar nicht existieren muss.
Aber auch im Falle der Existenz von f ′ (ξ) ist dieser Wert von q(ξ) meist verschieden.
Wir notieren noch eine einfache Folgerung aus dem Satz 6.3.
Korollar 6.4 ( Stetigkeit differenzierbarer Funktionen )
Sei f : D → R eine gegebene Funktion. Ist f differenzierbar in einem Punkt x ∈ D, so ist
f auch stetig in x.
Beweis: Sei {xn } ⊆ D eine beliebige Folge mit xn → x. Zu zeigen ist die Gültigkeit von
f (xn ) → f (x). Nun ist f in x differenzierbar. Nach Satz 6.3 existiert somit eine in x stetige
Funktion q : D → R mit
f (ξ) = f (x) + q(ξ)(ξ − x) für alle ξ ∈ D.
Speziell für ξ = xn folgt daher
f (xn ) = f (x) + q(xn )(xn − x) → f (x) + q(x)(x − x) = f (x),
was zu zeigen war.
2
Wir wollen als Nächstes noch Ableitungen höherer Ordnung einführen. Sei f : D → R dazu
eine differenzierbare Funktion. Dann existiert die Ableitung f ′ (x) in jedem Punkt x ∈ D.
Auf diese Weise wird also eine Funktion
f ′ : D → R, x 7−→ f ′ (x)
Christian Kanzow, Universität Würzburg, WS 2010/11
174
KAPITEL 6. DIFFERENTIALRECHNUNG
definiert. Ist diese Funktion f ′ in einem Punkt x ∈ D selbst differenzierbar, so nennen wir
f ′′ (x) := (f ′ )′ (x) die zweite Ableitung von f in x. Ist die Funktion f ′ in jedem Punkt x ∈ D
differenzierbar, so definieren wir analog
f ′′ : D → R, x 7−→ f ′′ (x) mit f ′′ (x) := (f ′ )′ (x)
und nennen f zweimal differenzierbar. Allgemein definiert man rekursiv die n–te Ableitung
f (n) von f als Ableitung von f (n−1) , falls f (n−1) differenzierbar ist. Statt f (n) schreibt man
dn
(n)
für alle n ∈ N0 , so heißt f beliebig
oft auch D n f oder dx
n f . Existiert die n–te Ableitung f
oft differenzierbar . Für n = 1, 2, 3 schreibt man statt f (n) meistens f ′ , f ′′ und f ′′′ .
Definition 6.5 Eine Funktion f : D → R heißt stetig differenzierbar, wenn f auf D
differenzierbar ist und die Abbildung f ′ stetig ist. Entsprechend heißt f : D → R n–mal
stetig differenzierbar, wenn die Ableitungen f ′ , f ′′ , . . . , f (n) existieren und stetig sind.
Für die gerade definierten Begriffe hat sich eine eigene Schreibweise eingebürgert: Sei dazu
D ein beliebiger Definitionsbereich (etwa ein eigentliches oder uneigentliches Intervall).
Dann setzen wir
C(D) := C 0 (D) := {f : D → R | f stetig auf D},
C n (D) := {f : D → R | f n-mal stetig differenzierbar auf D} ∀n ∈ N
C ∞ (D) := {f : D → R | f beliebig oft differenzierbar auf D}.
Wir wollen durch das folgende Beispiel kurz andeuten, dass die Menge der stetig differenzierbaren Funktionen eine echte Teilmenge der differenzierbaren Funktionen darstellt.
Beispiel 6.6 Wir betrachten die Funktion f : R → R, die durch
2
x sin( x1 ) für x 6= 0,
f (x) :=
0
für x = 0
definiert ist. Wir behaupten zunächst, dass diese auf dem gesamten Definitionsbereich
differenzierbar ist. Für jedes x 6= 0 ist dies klar, und aus den üblichen (aus der Schule
bekannten bzw. gleich zu beweisenden) Differentiationsregeln folgt
1
1
′
f (x) = 2x sin
− cos
für x 6= 0.
(6.4)
x
x
Im Nullpunkt hingegen folgt die Differenzierbarkeit aus der Definition des Differentialquotienten:
1
f (h) − f (0)
′
= 0,
(6.5)
= lim h · sin
f (0) = lim
h→0
h→0
h−0
h
denn sin h1 ist dem Betrag nach durch Eins beschränkt. Wir zeigen nun, dass die Funktion f hingegen nicht stetig differenzierbar ist. Wäre dies nämlich der Fall, so müsste f ′
insbesondere im Nullpunkt stetig sein, wegen (6.5) somit
f ′ (x) → 0 für x → 0
gelten. Aus (6.4) folgt aber sofort, dass der Grenzwert f ′ (x) für x → 0 im Allgemeinen gar
nicht existiert.
3
Christian Kanzow, Universität Würzburg, WS 2010/11
6.2. RECHENREGELN
6.2
175
Rechenregeln
Die Definition der Differenzierbarkeit wird nur selten benutzt, um explizit die Ableitung
einer Funktion auszurechnen. Tatsächlich kennt man die Ableitungen von einigen wichtigen Funktionen. Daraus ergeben sich dann die Ableitungen komplizierter Abbildungen
durch geeignete Anwendung von gewissen Rechenregeln, die wir in diesem Abschnitt zur
Verfügung stellen wollen.
Satz 6.7 ( Rechenregeln für differenzierbare Funktionen )
Seien f, g : D → R zwei Funktionen und λ ∈ R gegeben. Sind f und g in einem Punkt
x ∈ D differenzierbar, so gelten:
(a) f + g : D → R ist in x differenzierbar mit (f + g)′(x) = f ′ (x) + g ′ (x).
(b) λf : D → R ist in x differenzierbar mit (λf )′ (x) = λf ′ (x).
(c) f · g : D → R ist in x differenzierbar mit (f · g)′(x) = f ′ (x)g(x) + f (x)g ′ (x) (Produktregel).
(d)
f
g
: D → R ist in x differenzierbar mit
′
f ′ (x)g(x) − f (x)g ′ (x)
f
(x) =
g
g(x)2
(Quotientenregel),
sofern g(x) 6= 0 gilt.
Beweis: (a) Aus der Definition der Differenzierbarkeit und den bekannten Sätzen über
die Konvergenz von Folgen ergibt sich unmittelbar
(f + g)(ξ) − (f + g)(x)
ξ→x
ξ−x
f (ξ) + g(ξ) − f (x) − g(x)
= lim
ξ→x
ξ−x
f (ξ) − f (x)
g(ξ) − g(x)
= lim
+ lim
ξ→x
ξ→x
ξ−x
ξ−x
′
′
= f (x) + g (x),
(f + g)′(x) = lim
denn nach Voraussetzung existieren die beiden Grenzwerte für f ′ (x) und g ′ (x).
(b) In weitgehender Analogie zum Teil (a) ergibt sich
(λf )(ξ) − (λf )(x)
ξ→x
ξ−x
λf (ξ) − λf (x)
= lim
ξ→x
ξ−x
(λf )′(x) = lim
Christian Kanzow, Universität Würzburg, WS 2010/11
176
KAPITEL 6. DIFFERENTIALRECHNUNG
f (ξ) − f (x)
ξ→x
ξ−x
′
= λf (x)
= λ lim
aufgrund der vorausgesetzten Existenz von f ′ (x).
(c) Da f und g in x differenzierbar sind, ergibt sich
(f · g)(x + h) − (f · g)(x)
h→0
h
f (x + h)g(x + h) − f (x)g(x)
lim
h→0
h
1
lim
f (x + h) g(x + h) − g(x) + f (x + h) − f (x) g(x)
h→0 h
f (x + h) − f (x)
g(x + h) − g(x)
+ lim
g(x)
lim f (x + h)
h→0
h→0
h
h
g(x + h) − g(x)
f (x + h) − f (x)
lim f (x + h) lim
+ lim
lim g(x)
h→0
h→0
h→0
h→0
h
h
f (x)g ′(x) + f ′ (x)g(x),
(f · g)′(x) = lim
=
=
=
=
=
wobei wir insbesondere die Stetigkeit von f in x ausgenutzt haben, vergleiche Korollar 6.4.
(d) Wegen g(x) 6= 0 und der Stetigkeit von g im Punkte x ist auch g(x + h) 6= 0 für alle h
mit |h| hinreichend klein. Hieraus folgt zunächst für den Spezialfall f ≡ 1:
′
1
1
1
1
(x) = lim
−
h→0 h
g
g(x + h) g(x)
1
g(x) − g(x + h)
= lim
h→0 g(x + h) · g(x)
h
1
g(x) − g(x + h)
= lim
lim
h→0 g(x + h)g(x) h→0
h
1
− g ′ (x)
=
2
g(x)
g ′ (x)
= −
.
g(x)2
Durch Anwendung der Produktregel erhalten wir hieraus
′
′
−g ′ (x)
f ′ (x)g(x) − f (x)g ′(x)
1
1
f
+ f (x)
=
(x) = f ·
(x) = f ′ (x)
g
g
g(x)
g(x)2
g(x)2
und daher gerade die Gültigkeit der Quotientenregel.
2
Die Aussagen (a) und (b) des Satzes 6.7 besagen, dass es sich bei der Differentiation um
eine lineare Abbildung handelt. Wir betrachten als Nächstes einige Beispiele.
Christian Kanzow, Universität Würzburg, WS 2010/11
6.2. RECHENREGELN
177
Beispiel 6.8 (a) Für f (x) := xn (n ∈ N) gilt f ′ (x) = nxn−1 . Der Beweis erfolgt durch
Induktion nach n. Für n = 1 gilt die Behauptung gemäß Beispiel 6.2 (b), so dass
der Induktionsanfang richtig ist. Die Aussage gelte nun für ein beliebiges n. Wir
betrachten f (x) = xn+1 = x · xn und wenden die Produktregel an:
f ′ (x) = 1 · xn + x · nxn−1 = (n + 1)xn ,
womit der Induktionsschritt n → n + 1 ebenfalls bewiesen ist.
(b) Für f (x) := x1n (n ∈ N) gilt f ′ (x) = −nx−n−1 = x−n
n+1 , wobei natürlich x 6= 0 vorausgesetzt werden muss. Dies folgt durch Anwendung von Teil (a) und der Quotientenregel:
′
1
0 · xn − 1 · (nxn−1 )
′
f (x) =
= −nx−n−1 .
=
xn
(xn )2
Wegen (a) und (b) gilt übrigens
d n
(x ) = nxn−1
dx
für alle n ∈ Z,
wobei wir für n < 0 nur Punkte x 6= 0 betrachten dürfen.
(c) Für die Funktion tan x =
tan′ (x) =
sin x
cos x
erhalten wir aus der Quotientenregel
cos2 (x) + sin2 (x)
1
sin′ (x) cos(x) − sin(x) cos′ (x)
=
=
,
cos2 (x)
cos2 (x)
cos2 (x)
wobei wir bekannte Tatsachen über sin und cos verwendet haben.
3
Wir zeigen in unserem nächsten Resultat, dass mit f auch die Umkehrfunktion f −1 (sofern
existent) differenzierbar ist und geben in diesem Zusammenhang auch eine Formel für die
Ableitung der Umkehrfunktion an.
Satz 6.9 ( Ableitung der Umkehrfunktion )
Seien f : [a, b] → R eine stetige und streng monotone Funktion sowie ϕ := f −1 : D → R
die Umkehrfunktion, wobei wir D := f ([a, b]) gesetzt haben. Ist f im Punkt x ∈ [a, b]
differenzierbar mit f ′ (x) 6= 0, so ist ϕ im Punkt y := f (x) differenzierbar, und es gilt
′
f −1 (y) = ϕ′ (y) =
1
f ′ (x)
=
f′
1
1
=
.
′
−1
ϕ(y)
f f (y)
Beweis: Sei {ηn } ⊆ D\{y} eine beliebige Folge mit limn→∞ ηn = y. Wir setzen ξn :=
ϕ(ηn ). Da ϕ nach Satz 4.51 stetig ist, gilt limn→∞ ξn = ϕ(y) = x. Außerdem ist ξn 6= x für
alle n ∈ N aufgrund der Bijektivität von ϕ : D → [a, b]. Nun folgt
ϕ′ (y) =
lim
n→∞
ϕ(ηn ) − ϕ(y)
ηn − y
Christian Kanzow, Universität Würzburg, WS 2010/11
178
KAPITEL 6. DIFFERENTIALRECHNUNG
ξn − x
n→∞ f (ξn ) − f (x)
1
= lim f (ξn )−f (x)
=
lim
n→∞
ξn −x
1
=
,
′
f (x)
woraus sich die Behauptung unmittelbar ergibt.
2
Der Satz 6.9 gilt auch dann, wenn f statt auf dem kompakten Intervall [a, b] auf einem
uneigentlichen Intervall, insbesondere also auf ganz R, definiert ist. Dies folgt unmittelbar
aus dem zugehörigen Beweis, wenn man dort statt des Satzes 4.51 den Satz 4.52 zu Hilfe
nimmt.
Wir betrachten einige Beispiele zur Ableitung von Umkehrfunktionen.
Beispiel 6.10 (a) Der natürliche Logarithmus ln : (0, +∞) → R ist die Umkehrfunktion
der Exponentialfunktion exp : R → R. Aufgrund des Satzes 6.9 folgt daher (wir
schreiben hier x statt y)
1
ln′ (x) =
exp′ (ln(x))
=
1
1
= .
exp(ln(x))
x
(b) arcsin : [−1, 1] → R ist die Umkehrfunktion von sin : [− π2 , π2 ] → R. Für diese ergibt
sich aus dem Satz 6.9
arcsin′ (x) =
1
1
=
sin (arcsin(x))
cos(arcsin(x))
′
für alle x ∈p(−1, +1). Setze y√:= arcsin(x). Dann ist sin y = x und cos(arcsin(x)) =
cos(y) = + 1 − sin2 (y) = + 1 − x2 wegen y ∈ [− π2 , + π2 ]. Also haben wir
1
d arcsin(x)
=√
dx
1 − x2
für alle x ∈ (−1, +1).
(c) arctan : R → R ist die Umkehrfunktion von tan : − π2 , + π2 → R. Daher folgt
arctan′ (x) =
1
= cos2 (arctan(x))
tan (arctan(x))
′
wegen Beispiel 6.8 (c). Setzen wir y := arctan(x), so folgt
1 − cos2 (y)
1
sin2 (y)
=
=
− 1,
x = tan (y) =
cos2 (y)
cos2 (y)
cos2 (y)
2
2
Christian Kanzow, Universität Würzburg, WS 2010/11
6.2. RECHENREGELN
also
cos2 (arctan(x)) = cos2 (y) =
179
1
.
1 + x2
Zusammen ergibt sich die Ableitung
d arctan(x)
1
=
dx
1 + x2
für die Funktion arctan.
3
Wir betrachten als Konsequenz des obigen Beispiels einen interessanten Zusammenhang
mit der Exponentialfunktion.
Lemma 6.11 Für alle x ∈ R gilt limn→∞ (1+ nx )n = ex , insbesondere ist limn→∞ (1+ n1 )n =
e.
Beweis: Für x = 0 folgt die Behauptung unmittelbar aus der Reihenentwicklung der
Exponentialfunktion, so dass wir im Folgenden x 6= 0 voraussetzen und daher durch x
dividieren dürfen.
Wegen Beispiel 6.10 (a) ist der natürliche Logarithmus differenzierbar mit ln′ (1) = 1.
Unter Verwendung von ln(1) = 0 folgt daher
n
x x = lim x ln 1 +
lim n ln 1 +
n→∞
n→∞
n
x
n
ln(1 + nx ) − ln(1)
= x lim
x
n→∞
n
′
= x · ln (1)
= x.
Die Definition der allgemeinen Potenz und die Stetigkeit der Exponentialfunktion implizieren deshalb
x x n
= lim exp n ln 1 +
lim 1 +
n→∞
n→∞
n
n x = exp lim n ln 1 +
n→∞
n
= exp(x),
was zu beweisen war.
2
Die Exponentialfunktion tritt auf ganz natürliche Weise in der Zinseszinsrechnung auf. Wir
illustrieren dies in dem nachstehenden Beispiel.
Beispiel 6.12 ( Kontinuierliche Verzinsung )
Sie legen zum Zeitpunkt t = 0 einen festen Betrag K0 > 0 für eine gewisse Laufzeit
T > 0 an und erhalten hierfür aufgrund eines Zinssatzes am Ende der Laufzeit mehr Geld
Christian Kanzow, Universität Würzburg, WS 2010/11
180
KAPITEL 6. DIFFERENTIALRECHNUNG
zurück. Der Zinssatz wird Ihnen meist in Form eines jährlichen Zinssatzes angeboten. In
der Finanzwelt wird häufig jedoch anders vorgegangen: Man unterteilt die gesamte Laufzeit
T > 0 in insgesamt n kleine Laufzeiten der Länge ∆t (so dass natürlich T = n· ∆t gilt) und
erhält für die Laufzeit ∆t einen Zinssatz r > 0. Zur Zeit t1 = ∆t erhöht sich das Kapital
somit auf
K1 = K0 (1 + r∆t).
Nach der Laufzeit t2 = 2∆t bekommen sie nicht nur auf das Anfangskapital K0 , sondern
auch auf die schon eingenommenen Zinsen weitere Zinsen ausgezahlt, so dass sich ihr
Vermögen auf
K2 = K0 (1 + r∆t)(1 + r∆t)
beläuft. So fortfahrend, erhalten sie am Ende der Laufzeit tn = n · ∆t = T das Kapital
Kn = K0 (1 + r∆t)n = K0 1 + r
T n
.
n
Für n → ∞, also für ∆t → 0 (weshalb man von kontinuierlicher Verzinsung spricht)
konvergiert der Ausdruck Kn gegen K0 erT aufgrund des Lemmas 6.11.
3
Will man die Ableitung einer Funktion berechnen, die aus der Komposition von zwei (oder
mehr) Abbildungen entsteht, so benötigt man die nachstehende Kettenregel.
Satz 6.13 ( Kettenregel )
Seien f : [a, b] → R und g : [c, d] → R zwei gegebene Funktionen mit f ([a, b]) ⊆ [c, d]. Die
Funktion f sei in x ∈ [a, b] differenzierbar und g sei in y := f (x) ∈ [c, d] differenzierbar.
Dann ist die zusammengesetzte Funktion
g ◦ f : [a, b] → R
in x differenzierbar, und es gilt
(g ◦ f )′ (x) = g ′ f (x) · f ′ (x).
Beweis: Nach Voraussetzung ist f in x differenzierbar. Wegen Satz 6.3 existiert daher
eine in x stetige Funktion q mit
f (ξ) = f (x) + q(ξ)(ξ − x) ∀ξ ∈ [a, b] und f ′ (x) = q(x).
Ferner ist g nach Voraussetzung in y = f (x) differenzierbar. Ebenfalls nach Satz 6.3 gibt
es deshalb eine in y stetige Funktion r mit
g(η) = g(y) + r(η)(η − y) ∀η ∈ [c, d] und g ′ (y) = r(y).
Hieraus folgt mit η := f (ξ)
(g ◦ f )(ξ) = g f (ξ)
Christian Kanzow, Universität Würzburg, WS 2010/11
6.2. RECHENREGELN
=
=
=
=
=
181
g(η)
g(y) + r(η)(η − y)
g f (x) + r f (ξ) f (ξ) − f (x)
(g ◦ f )(x) + (r ◦ f )(ξ)q(ξ)(ξ − x)
(g ◦ f )(x) + s(ξ)(ξ − x)
mit der aufgrund der Sätze 4.27 und 4.28 in x stetigen Funktion
s(ξ) := (r ◦ f )(ξ) · q(ξ).
Speziell für ξ = x gilt hierbei s(x) = r f (x) ·q(x) = g ′ f (x) ·f ′ (x). Erneut wegen Satz
′ 6.3
′
′
ist g◦f daher in x differenzierbar und besitzt dort die Ableitung (g◦f ) (x) = g f (x) f (x).
2
Mittels der Kettenregel lässt sich die Formel für die Ableitung der Umkehrfunktion sehr
leicht herleiten: Durch beidseitige Differentiation der Identität
f ◦ f −1 (y) = y ⇐⇒ f f −1 (y) = y
ergibt sich mittels der Kettenregel nämlich
′
f ′ f −1 (y) f −1 (y) = 1,
also gerade die schon bekannte Darstellung
′
f −1 (y) =
1
f ′ f −1 (y)
.
Man beachte allerdings, dass sich aus diesem Zugang nicht die Differenzierbarkeit der
Umkehrfunktion ergibt.
Es folgen einige Beispiele zur Kettenregel.
Beispiel 6.14
(a) Sei f : R → R differenzierbar und g : R → R definiert durch
g(x) := f (ax + b) (a, b ∈ R).
Dann gilt g ′ (x) = af ′ (ax + b).
(b) Seien α ∈ R und f : (0, +∞) → R definiert durch
f (x) := xα := exp α ln(x) .
Aus der Kettenregel ergibt sich dann
α
d
α
dxα
α ln(x) = exp α ln(x)
= exp′ α ln(x)
= xα · = αxα−1 .
dx
dx
x
x
Für ganzzahlige Exponenten erhalten wir somit insbesondere die Darstellungen aus
dem Beispiel 6.8 (a), (b).
Christian Kanzow, Universität Würzburg, WS 2010/11
182
KAPITEL 6. DIFFERENTIALRECHNUNG
(c) Wir zeigen hier, wie sich die Quotientenregel auch aus der Kettenregel herleiten lässt.
Sei dazu g : [a, b] → R eine in x ∈ [a, b] differenzierbare Funktion mit g(x) 6= 0. Wir
setzen f : R\{0} → R, f (x) := x1 . Dann gilt
1
= f ◦ g.
g
Nach Beispiel 6.8 (b) ist f ′ (x) = − x12 . Hieraus folgt
′
′
1
−g ′ (x)
1
′
g
(x)
=
.
(x) = f ◦ g (x) = f ′ (g(x) g ′(x) = −
g
g(x)2
g(x)2
Aus diesem Spezialfall ergibt sich nun die allgemeine Quotientenregel, vergleiche den
Beweis des Satzes 6.7 (d).
3
6.3
Mittelwertsätze
Dieser Abschnitt behandelt mit den so genannten Mittelwertsätzen einige Anwendungen
der Differentialrechnung. Insbesondere wird sich zeigen, dass man mittels der Eigenschaften
der Ableitung zum Teil auf das Verhalten der Funktion Rückschlüsse ziehen kann.
Sei f : [a, b] → R zunächst eine beliebige Funktion. Ein Punkt ξ ∈ [a, b] heißt dann ein
lokales Minimum von f , wenn es ein ε > 0 gibt mit der Eigenschaft
f (ξ) ≤ f (x) für alle x ∈ [a, b] mit |x − ξ| < ε.
Hingegen heißt ξ ∈ [a, b] ein lokales Maximum von f , wenn ein ε > 0 existiert mit
f (ξ) ≥ f (x) für alle x ∈ [a, b] mit |x − ξ| < ε.
Wir nennen ξ ein lokales Extremum von f , wenn ξ ein lokales Minimum oder ein lokales Maximum ist. Die Abbildung 6.2 illustriert die Begriffe eines lokalen Minimums bzw.
Maximums.
Ein notwendiges Kriterium für das Vorliegen eines lokalen Extremums ist in dem folgenden Resultat enthalten.
Satz 6.15 ( Notwendige Bedingung für ein lokales Extremum )
Die Funktion f : [a, b] → R besitze im Punkt ξ ∈ (a, b) ein lokales Extremum und sei in ξ
differenzierbar. Dann ist f ′ (ξ) = 0.
Beweis: Ohne Einschränkung der Allgemeinheit können wir davon ausgehen, dass es sich
bei ξ um ein lokales Maximum handelt. Dann existiert ein ε > 0 mit
f (x) ≤ f (ξ) für alle x ∈ [ξ − ε, ξ + ε] ∩ [a, b].
Für alle diese x mit der zusätzlichen Eigenschaft x > ξ gilt dann
f (x) − f (ξ)
≤ 0,
x−ξ
Christian Kanzow, Universität Würzburg, WS 2010/11
6.3. MITTELWERTSÄTZE
183
ξ1 = lokales Minimum von f
f
ξ1
ξ2 = lokales Maximum von f
ξ2
Abbildung 6.2: Veranschaulichung von lokalen Extrema
während wir für alle diese x mit der Eigenschaft x < ξ die Ungleichung
f (x) − f (ξ)
≥0
x−ξ
erhalten. Durch Grenzübergang x → ξ bekommen wir aus der vorausgesetzten Differenzierbarkeit von f in ξ somit einerseits
f ′ (ξ) = lim+
f (x) − f (ξ)
≤0
x−ξ
f ′ (ξ) = lim−
f (x) − f (ξ)
≥ 0,
x−ξ
x→ξ
und andererseits
x→ξ
so dass letztlich nur f ′ (ξ) = 0 übrig bleibt.
2
Man beachte, dass im Satz 6.15 das lokale Extremum ξ im Inneren des Intervalls [a, b]
liegen musste. Sofern es sich bei dem lokalen Extremum um einen Randpunkt von [a, b]
handelt, ist die Aussage des Satzes 6.15 im Allgemeinen nicht mehr richtig. Beispielsweise
hat die differenzierbare Funktion f : [0, 1] → R, f (x) := x ein lokales Minimum in x = 0
und ein lokales Maximum in x = 1, aber an keiner dieser Stelle verschwindet die Ableitung.
Wir formulieren als Nächstes einen Spezialfall des nachfolgenden Mittelwertsatzes.
Satz 6.16 ( Satz von Rolle )
Sei f : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Gilt f (a) = f (b), so existiert
ein ξ ∈ (a, b) mit f ′ (ξ) = 0.
Beweis: Falls f eine konstante Funktion ist, so ist die Behauptung natürlich richtig. Anderenfalls gibt es ein x ∈ (a, b) mit f (x) > f (a) oder f (x) < f (a). Dann wird das Maximum
oder Minimum von f auf [a, b] in einem Punkt ξ ∈ (a, b) angenommen (die Existenz eines
solchen Extremwertes folgt hierbei aus dem Satz 4.47, für dessen Anwendung wir auch die
Christian Kanzow, Universität Würzburg, WS 2010/11
184
KAPITEL 6. DIFFERENTIALRECHNUNG
Stetigkeit von f auf [a, b] benötigen). Wegen Satz 6.15 gilt dabei f ′ (ξ) = 0.
2
Man beachte, dass der Satz 6.16 seine Gültigkeit im Allgemeinen verliert, wenn f auf
[a, b] zwar stetig ist, aber die Ableitung von f nicht mehr auf dem gesamten Intervall
(a, b) existiert. Dazu betrachte man die Betragsfunktion f (x) := |x| auf dem Intervall
[a, b] := [−1, 1]. Offenbar existiert kein ξ ∈ (−1, 1) mit f ′ (ξ) = 0.
f ′ (ξ) = 0
f
f (a) = f (b)
a
ξ
b
Abbildung 6.3: Illustration des Satzes von Rolle
In dem Spezialfall f (a) = f (b) = 0 besagt der Satz von Rolle insbesondere, dass zwischen zwei Nullstellen einer differenzierbaren Funktion stets eine Nullstelle der Ableitung
liegt. – Als einfache Konsequenz des Satzes von Rolle erhalten wir jetzt einen ersten Mittelwertsatz.
Satz 6.17 ( Mittelwertsatz )
Sei f : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Dann existiert ein ξ ∈ (a, b)
mit
f (b) − f (a)
= f ′ (ξ).
b−a
Beweis: Wir definieren eine Hilfsfunktion F : [a, b] → R durch
F (x) := f (x) −
f (b) − f (a)
(x − a).
b−a
Offenbar ist F stetig auf [a, b] sowie differenzierbar auf (a, b). Ferner gilt F (a) = f (a) =
F (b), so dass wir den Satz 6.16 von Rolle anwenden können: Es existiert ein ξ ∈ (a, b) mit
F ′ (ξ) = 0. Wegen
f (b) − f (b)
F ′ (ξ) = f ′ (ξ) −
b−a
folgt hieraus die Behauptung.
2
Christian Kanzow, Universität Würzburg, WS 2010/11
6.3. MITTELWERTSÄTZE
185
Geometrisch
bedeutetder Mittelwertsatz, dass die Steigung der Sekante durch die Punkte
a, f (a) und b, f (b) gleich der
Steigung der Tangente an den Graphen von f an einer
gewissen Zwischenstelle ξ, f (ξ) ist, vergleiche hierzu die Abbildung 6.4.
f
a
ξ
b
Abbildung 6.4: Geometrische Deutung des Mittelwertsatzes
Als Folgerung aus dem Mittelwertsatz erhalten wir das nachstehende Kriterium für die
Monotonie einer Funktion.
Satz 6.18 ( Monotonie–Kriterien bei differenzierbaren Funktionen )
Sei f : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Dann gelten die folgenden
Aussagen:
(a) Ist f ′ (x) > 0 für alle x ∈ (a, b), so ist f streng monoton wachsend auf [a, b].
(b) Ist f ′ (x) < 0 für alle x ∈ (a, b), so ist f streng monoton fallend auf [a, b].
(c) Genau dann ist f ′ (x) ≥ 0 für alle x ∈ (a, b), wenn f auf (a, b) monoton wächst.
(d) Genau dann ist f ′ (x) ≤ 0 für alle x ∈ (a, b), wenn f auf (a, b) monoton fällt.
Beweis: Für beliebige x1 , x2 ∈ [a, b] mit x1 < x2 existiert nach dem Mittelwertsatz 6.17
ein Zwischenpunkt ξ ∈ (x1 , x2 ) mit
f (x2 ) − f (x1 ) = (x2 − x1 )f ′ (ξ).
Hieraus ergeben sich unmittelbar die Aussagen (a) und (b) sowie die entsprechende Richtung in den Behauptungen (c) und (d). Die Umkehrungen in (c) und (d) folgen aus der
Definition des Differentialquotienten: Ist f beispielsweise monoton wachsend, so ergibt sich
für ein beliebiges x ∈ (a, b) wegen der Differenzierbarkeit von f in x sofort
f (ξ) − f (x)
f (ξ) − f (x)
= lim+
≥ 0.
ξ→x
ξ→x
ξ−x
ξ−x
f ′ (x) = lim
Analog verifiziert man die Rückrichtung für Teil (d).
Christian Kanzow, Universität Würzburg, WS 2010/11
2
186
KAPITEL 6. DIFFERENTIALRECHNUNG
Man beachte, dass die Umkehrungen der Aussagen (a) und (b) im Satz 6.18 im Allgemeinen
nicht gelten, beispielsweise ist die Funktion f (x) := x3 auf jedem Intervall [a, b] streng
monoton wachsend, jedoch gilt f ′ (0) = 0, die Ableitung ist also nicht strikt positiv.
Aus dem Satz 6.18 erhalten wir sofort das nachstehende Korollar.
Korollar 6.19 Sei f : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b) mit f ′ (x) = 0
für alle x ∈ (a, b). Dann ist f konstant auf [a, b].
Beweis: Wegen f ′ (x) = 0 für alle x ∈ (a, b) ist f aufgrund des Satzes 6.18 sowohl monoton
fallend als auch monoton wachsend auf (a, b). Also ist f konstant auf (a, b). Aus der Stetigkeit von f folgt dann bereits, dass f auf dem abgeschlossenen Intervall [a, b] konstant ist. 2
Als weitere Folgerung aus dem Mittelwertsatz formulieren wir das nachstehende Resultat.
Satz 6.20 ( Lipschitz–Stetigkeit stetig differenzierbarer Funktionen )
Sei f : [a, b] → R stetig differenzierbar auf [a, b]. Dann existiert eine Konstante L ≥ 0 mit
f (x1 ) − f (x2 ) ≤ L|x1 − x2 | für alle x1 , x2 ∈ [a, b].
(6.6)
Beweis: Sei x1 , x2 ∈ [a, b] beliebig gegeben. Dann existiert wegen Satz 6.17 ein Zwischenpunkt ξ = ξx1 ,x2 ∈ (a, b) mit
f (x1 ) − f (x2 ) = f ′ (ξ)(x1 − x2 ).
(6.7)
Da f ′ nach Voraussetzung noch stetig ist auf dem kompakten Intervall [a, b], existiert wegen
Satz 4.47 das Maximum
L := max f ′ (ξ).
ξ∈[a,b]
Mit (6.7) ergibt sich somit
f (x1 ) − f (x2 ) = f ′ (ξx1 ,x2 ) · |x1 − x2 |
≤ max f ′ (ξ) · |x1 − x2 |
ξ∈[a,b]
= L|x1 − x2 |
für alle x1 , x2 ∈ [a, b].
2
Eine Funktion f mit der Eigenschaft (6.6) wird als Lipschitz–stetig auf [a, b] bezeichnet,
die Konstante L ≥ 0 heißt auch Lipschitz–Konstante von f auf [a, b].
Für manche Zwecke benötigt man eine Verallgemeinerung des Mittelwertsatzes, die wir
in dem folgenden Resultat angeben.
Christian Kanzow, Universität Würzburg, WS 2010/11
6.4. DIE REGELN VON L’HOSPITAL
187
Satz 6.21 ( Verallgemeinerter Mittelwertsatz )
Seien f, g : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Sei ferner g ′(x) 6= 0
für alle x ∈ (a, b). Dann ist g(a) 6= g(b), und es gibt ein ξ ∈ (a, b) mit
f (b) − f (a)
f ′ (ξ)
= ′ .
g(b) − g(a)
g (ξ)
Beweis: Wäre g(a) = g(b), so gäbe es nach dem Satz 6.16 von Rolle einen Zwischenpunkt
ξ ∈ (a, b) mit g ′ (ξ) = 0, was nach Voraussetzung aber nicht sein kann. Daher ist g(a) 6= g(b)
und der in der Behauptung auftretende Nenner somit von Null verschieden.
In Analogie zum Beweis des Mittelwertsatzes 6.17 definieren wir eine Hilfsfunktion
F : [a, b] → R durch
F (x) := f (x) −
f (b) − f (a)
g(x) − g(a) .
g(b) − g(a)
Dann ist F (b) = F (a). Nach dem Satz 6.16 gibt es somit ein ξ ∈ (a, b) mit F ′ (ξ) = 0.
Wegen
f (b) − f (a) ′
g (ξ)
F ′(ξ) = f ′ (ξ) −
g(b) − g(a)
folgt sofort die Behauptung.
2
Der Spezialfall g(x) = x für alle x ∈ [a, b] zeigt übrigens, dass es sich beim Satz 6.21
tatsächlich um eine Verallgemeinerung des Mittelwertsatzes 6.17 handelt. Ansonsten sei
hier betont, dass im Satz 6.21 im Zähler und Nenner ein– und derselbe Zwischenpunkt
ξ auftritt. Würde man den Mittelwertsatz selbst zum einen auf die Funktion f und zum
anderen auf die Funktion g anwenden, erhielte man hier zwei eventuell verschiedene Zwischenpunkte ξ und ζ.
6.4
Die Regeln von L’Hospital
Sind f, g : (a, b] → R zwei gegebene Funktionen derart, dass die beiden Grenzwerte
limx→a+ f (x) und limx→a+ g(x) existieren und der zweite Grenzwert von Null verschieden
ist, so erhalten wir aus dem Satz 4.27 sofort den Grenzwert
lim+
x→a
limx→a+ f (x)
f (x)
.
=
g(x)
limx→a+ g(x)
Gilt dagegen limx→a+ g(x) = 0, so ist die Situation komplizierter. Falls limx→a+ f (x) 6= 0
(x)
keinen (eigentlichen) Grenzwert an der Stelle a. Damit bleibt zu klären,
ist, so hat fg(x)
was im Fall limx→a+ f (x) = 0 und limx→a+ g(x) = 0 passiert. Diese Frage wird durch
die nachstehende Regel von L’Hospital beantwortet, die wir als wichtige und nützliche
Anwendung des verallgemeinerten Mittelwertsatzes erhalten.
Christian Kanzow, Universität Würzburg, WS 2010/11
188
KAPITEL 6. DIFFERENTIALRECHNUNG
Satz 6.22 ( Regel von L’Hospital — Fall
0
0
)
(a) Seien f, g : (a, b] → R differenzierbar und g ′ (x) 6= 0 für alle x ∈ (a, b). Gilt dann
lim f (x) = 0
x→a+
und
und existiert der Grenzwert
lim+
f ′ (x)
,
g ′ (x)
lim+
f (x)
,
g(x)
x→a
so existiert auch der Grenzwert
x→a
und es gilt
lim+
x→a
lim g(x) = 0
x→a+
(6.8)
f ′ (x)
f (x)
= lim+ ′ .
g(x) x→a g (x)
(b) Seien f, g : [a, +∞) → R differenzierbar und g ′ (x) 6= 0 für alle x ∈ (a, +∞). Gilt
dann
lim f (x) = 0 und
lim g(x) = 0
x→+∞
x→+∞
und existiert der Grenzwert
f ′ (x)
,
x→+∞ g ′ (x)
lim
so existiert auch der Grenzwert
f (x)
,
x→+∞ g(x)
lim
und es gilt
f (x)
f ′ (x)
= lim ′ .
x→+∞ g(x)
x→+∞ g (x)
lim
Beweis: (a) Wegen (6.8) können wir f und g als stetige Funktionen in a mit f (a) = 0
und g(a) = 0 auffassen. Nach dem verallgemeinerten Mittelwertsatz 6.21 gibt es zu jedem
x ∈ (a, b) daher einen (von x abhängigen) Zwischenpunkt ξ = ξx mit
f (x)
f (x) − f (a)
f ′ (ξ)
=
= ′ .
g(x)
g(x) − g(a)
g (ξ)
Wegen ξ → a+ für x → a+ folgt hieraus die Behauptung.
(b) Der Fall x → +∞ kann durch die Transformation y = x1 auf den Fall y → 0+ zurückgeführt werden, der durch den Teil (a) abgedeckt ist. Aus der Kettenregel der Differentialrechnung folgt dann
f (x)
lim
x→+∞ g(x)
=
lim
y→0+
f ( y1 )
g( y1 )
Christian Kanzow, Universität Würzburg, WS 2010/11
6.4. DIE REGELN VON L’HOSPITAL
(a)
=
lim+
y→0
=
lim
y→0+
=
lim
y→0+
189
d
f ( y1 )
dy
d
g( y1 )
dy
− y12 f ′ ( y1 )
− y12 g ′ ( y1 )
f ′ ( y1 )
g ′ ( y1 )
′
f (x)
,
x→+∞ g ′ (x)
=
lim
womit Teil (b) vollständig bewiesen ist.
2
Analog zum Satz 6.22 beweist man entsprechende Aussagen auch für den Fall
lim f (x) = 0 und
x→b−
lim g(x) = 0
x→b−
sowie für den Fall
lim f (x) = 0 und
x→−∞
lim g(x) = 0.
x→−∞
Wir formulieren als Nächstes eine weitere Variante der Regel von L’Hospital, bei der für
zwei Funktionen f, g : (a, b] → R die beiden einzelnen Grenzwerte uneigentlich sind, etwa limx→a+ f (x) = +∞ und limx→a+ g(x) = +∞, so dass man über den Grenzwert des
(x)
a priori nichts aussagen kann.
zugehörigen Quotienten limx→a+ fg(x)
Satz 6.23 ( Regel von L’Hospital — Fall
∞
∞
)
(a) Seien f, g : (a, b] differenzierbar und g ′ (x) 6= 0 für alle x ∈ (a, b). Gilt dann
lim f (x) = +∞ und
x→a+
und existiert der Grenzwert
lim+
f ′ (x)
,
g ′ (x)
lim+
f (x)
,
g(x)
x→a
so existiert auch der Grenzwert
x→a
und es gilt
lim+
x→a
lim g(x) = +∞
x→a+
f (x)
f ′ (x)
= lim+ ′ .
g(x) x→a g (x)
(b) Seien f, g : [a, +∞) → R differenzierbar und g ′ (x) 6= 0 für alle x ∈ (a, +∞). Gilt
dann
lim f (x) = +∞ und
lim g(x) = +∞
x→+∞
x→+∞
Christian Kanzow, Universität Würzburg, WS 2010/11
190
KAPITEL 6. DIFFERENTIALRECHNUNG
und existiert der Grenzwert
f ′ (x)
,
x→+∞ g ′ (x)
lim
so existiert auch der Grenzwert
f (x)
,
x→+∞ g(x)
lim
und es gilt
f (x)
f ′ (x)
= lim ′ .
x→+∞ g(x)
x→+∞ g (x)
lim
Beweis: (a) Nach Voraussetzung existiert der Grenzwert
α := lim
x→a+
f ′ (x)
.
g ′ (x)
Zu jedem ε > 0 existiert daher ein δ1 > 0 mit
′
f (t)
< ε für alle t ∈ (a, a + δ1 ).
−
α
g ′ (t)
Zu beliebigen x, y ∈ (a, a + δ1 ) mit (ohne Einschränkung) x < y existiert nach dem verallgemeinerten Mittelwertsatz (angewandt auf das Intervall [x, y], auf dem f und g stetig
und differenzierbar sind) ein Zwischenpunkt ξ ∈ (x, y) mit
f (y) − f (x)
f ′ (ξ)
= ′ ,
g(y) − g(x)
g (ξ)
wobei die Nenner wegen g(x) → +∞ für x → a+ sowie g ′(x) 6= 0 für alle x und der sich
hieraus ergebenden Monotonie von g von Null verschieden sind. Für alle x, y ∈ (a, a + δ1 )
mit x 6= y folgt somit
f (x) − f (y)
g(x) − g(y) − α < ε.
Nun ist
g(y)
f (x)
f (x) − f (y) 1 − g(x)
=
·
.
g(x)
g(x) − g(y) 1 − f (y)
f (x)
Hält man y fest und lässt x → a+ gehen, so konvergiert der zweite Faktor gegen 1 wegen
limx→a+ g(x) = limx→a+ f (x) = +∞. Also existiert ein δ2 > 0 mit
f (x) f (x) − f (y) g(x) − g(x) − g(y) < ε für alle x ∈ (a, a + δ2 ).
Für δ := min{δ1 , δ2 } und alle x ∈ (a, a + δ) gilt daher
f (x)
< 2ε.
−
α
g(x)
Christian Kanzow, Universität Würzburg, WS 2010/11
6.5. KONVEXE FUNKTIONEN
Also ist
lim+
x→a
191
f (x)
f ′ (x)
= α = lim+ ′ ,
x→a g (x)
g(x)
was zu zeigen war.
(b) Diese Aussage kann mittels der Substitution y =
auf den Fall (a) zurückgeführt werden.
1
x
wie im Beweis des Satzes 6.22 (b)
2
Aus dem Beweis des Satzes 6.23 folgt übrigens relativ leicht, dass die Aussagen auch dann
gelten, wenn die Grenzwerte der vorkommenden Quotienten lediglich im uneigentlichen
Sinne existieren. Ebenso lassen sich entsprechende Aussagen in den Fällen
lim f (x) = +∞ und
x→b−
lim g(x) = +∞
x→b−
sowie
lim f (x) = +∞ und
x→−∞
lim g(x) = +∞
x→−∞
beweisen. Auch die Möglichkeiten f (x) → −∞ oder g(x) → −∞ können mit dem Satz
6.23 abgedeckt werden, indem man zu den Funktionen −f bzw. −g übergeht.
Wir betrachten kurz einige Beispiele zu den Regeln von L’Hospital.
Beispiel 6.24
(a) Es ist
lim x ln(x) = lim+
x→0+
(b) Es ist
ln(x)
x→0
1
x
= lim+
x→0
1
x
− x12
= lim+ −x = 0.
x→0
1
1
x
= lim
=
= 1.
x→0 cos(x)
x→0 sin(x)
cos(0)
lim
(c) Es ist
1
1
1 − cos( x2 )
sin( x2 )
cos( x2 )
1
2
4
lim
= lim
= lim
= .
x→0 1 − cos(x)
x→0 sin(x)
x→0 cos(x)
4
Hier mussten wir die Regel von L’Hospital also zweimal hintereinander anwenden.3
6.5
Konvexe Funktionen
Wir untersuchen in diesem Abschnitt die Klasse der konvexen Funktionen und leiten mit
deren Hilfe eine Reihe von wichtigen Ungleichungen her.
Definition 6.25 Seien I ⊆ R ein beliebiges Intervall und f : I → R eine gegebene Funktion. Dann heißt f konvex auf I, wenn für alle x, y ∈ I und alle λ ∈ (0, 1)
f λx + (1 − λ)y ≤ λf (x) + (1 − λ)f (y)
gilt. f heißt dagegen konkav, wenn −f konvex ist.
Christian Kanzow, Universität Würzburg, WS 2010/11
192
KAPITEL 6. DIFFERENTIALRECHNUNG
Anschaulich besagt die obige Definition, dass f eine konvexe Funktion ist, wenn der Graph
von f in jedem Intervall [x, y] ⊆ I (mit x< y) unterhalb (bzw. nicht oberhalb) der Sekante
durch die Punkte x, f (x) und y, f (y) liegt, vergleiche hierzu die Abbildung ??.
f
Sekante
x
y
λx + (1 − λ)y λ ∈ [0, 1]
Abbildung 6.5: Veranschaulichung einer konvexen Funktion:
Der Graph
von f verläuft
unterhalb einer jeden Sekante durch die Punkte x, f (x) und y, f (y)
Eine einfache Verallgemeinerung der obigen Definition ist in dem nachstehenden Resultat enthalten.
Lemma 6.26 ( Ungleichung von Jensen )
Seien I ⊆ R ein Intervall und f : I → R eine gegebene Funktion. Dann ist f genau dann
konvex auf I, wenn
f (λ1 x1 + . . . + λr xr ) ≤ λ1 f (x1 ) + . . . + λr f (xr )
(6.9)
Pr
für beliebige λ1 , . . . , λr ≥ 0 mit
i=1 λi = 1 und alle x1 , . . . , xr ∈ I gilt, wobei r ∈ N
ebenfalls beliebig sein darf.
Beweis: Aus der Gültigkeit von (6.9) folgt für r = 2 sofort die Konvexität von f . Sei
f umgekehrt als konvex vorausgesetzt. Wir beweisen (6.9) durch Induktion nach r. Für
r = 1 ist nichts zu zeigen. Die Ungleichung (6.9) gelte daher für ein beliebigesPr ∈ N. Für
den Induktionsschluss r 7−→ r + 1 seien nichtnegative Zahlen λ1 , . . . , λr+1 mit r+1
i=1 λi = 1
sowie x1 , . . . , xr+1 ∈ I gegeben. Wir setzen dann
λ := λ1 + . . . + λr
und x :=
λ1
λr
x1 + . . . + xr ,
λ
λ
wobei wir ohne Einschränkung davon ausgehen können, dass λ > 0 ist, da sonst λr+1 = 1
und somit nichts zu zeigen wäre. Dann folgt x ∈ I und daher
f (λ1 x1 + . . . + λr xr + λr+1 xr+1 ) = f (λx + λr+1 xr+1 )
Christian Kanzow, Universität Würzburg, WS 2010/11
6.5. KONVEXE FUNKTIONEN
193
≤ λf (x) + λr+1 f (xr+1 )
r
X
λi
≤ λ
f (xi ) + λr+1 f (xr+1 )
λ
i=1
= λ1 f (x1 ) + . . . + λr f (xr ) + λr+1 f (xr+1 ),
wobei sich die erste Ungleichung aus der Konvexität von f und die zweite Ungleichung
aus der Induktionsvoraussetzung ergeben,
Pr denn die Zahlen µi := λi /λ genügen den beiden
2
Bedingungen µi ≥ 0 (i = 1, . . . , r) und i=1 µi = 1.
Eine zum Lemma 6.26 entsprechende Ungleichung gilt natürlich auch für konkave Funktionen. Für eine differenzierbare konvexe Funktion gilt die folgende Charakterisierung, die
ebenfalls ein Analogen für konkave Abbildungen besitzt.
Satz 6.27 ( Charakterisierung differenzierbarer konvexer Funktionen )
Sei f : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Dann ist f genau dann
konvex auf [a, b], wenn die Ableitung f ′ auf (a, b) monoton wächst.
Beweis: Sei f ′ zunächst monoton wachsend auf (a, b). Seien x1 , x2 ∈ [a, b] sowie λ ∈ (0, 1)
beliebig gegeben, wobei wir ohne Einschränkung x1 < x2 voraussetzen können. Dann ist
x := λx1 +(1−λ)x2 ∈ (x1 , x2 ), und nach dem Mittelwertsatz 6.17 existieren Zwischenstellen
ξ1 ∈ (x1 , x) und ξ2 ∈ (x, x2 ) mit
f (x) − f (x1 )
f (x2 ) − f (x)
= f ′ (ξ1 ) ≤ f ′ (ξ2 ) =
x − x1
x2 − x
wegen ξ1 ≤ ξ2 . Aus x − x1 = (1 − λ)(x2 − x1 ) und x2 − x = λ(x2 − x1 ) folgt deshalb
f (x2 ) − f (x)
f (x) − f (x1 )
≤
1−λ
λ
und daher
f (x) ≤ λf (x1 ) + (1 − λ)f (x2 ),
was gemäß Definition von x gerade bedeutet, dass f konvex ist.
Sei f umgekehrt als konvex vorausgesetzt. Seien ferner x1 < x2 beliebig gegeben. Dann
gilt für jedes x mit x1 < x < x2 offenbar
f (x) ≤
x2 − x
x − x1
f (x1 ) +
f (x2 ),
x2 − x1
x2 − x1
denn das gegebene x lässt sich mit λ :=
λ)x2 schreiben. Hieraus folgt
x2 −x
x2 −x1
∈ (0, 1) gerade in der Gestalt x = λx1 + (1 −
(x − x1 ) f (x2 ) − f (x1 )
f (x) − f (x1 ) ≤
x2 − x1
Christian Kanzow, Universität Würzburg, WS 2010/11
194
KAPITEL 6. DIFFERENTIALRECHNUNG
und daher
f (x2 ) − f (x1 )
f (x) − f (x1 )
≤
.
x − x1
x2 − x1
(6.10)
Analog folgert man die Gültigkeit von
f (x2 ) − f (x1 )
f (x2 ) − f (x)
≤
.
x2 − x1
x2 − x
(6.11)
Durch den Grenzübergang x → x1 in (6.10) bzw. x → x2 in (6.11) ergibt sich dann
f ′ (x1 ) = lim
x→x1
f (x2 ) − f (x1 )
f (x2 ) − f (x)
f (x) − f (x1 )
≤
≤ lim
= f ′ (x2 ),
x→x
x − x1
x2 − x1
2
x2 − x
so dass f ′ in der Tat monoton wächst.
2
Die zweite Ableitung kann ebenfalls benutzt werden, um die Konvexität einer Funktion zu
charakterisieren. Es gilt nämlich das nachfolgende Resultat.
Satz 6.28 ( Charakterisierung zweimal differenzierbarer konvexer Funktionen )
Sei f : [a, b] → R stetig auf [a, b] und zweimal differenzierbar auf (a, b). Dann ist f genau
dann konvex auf [a, b], wenn f ′′ (x) ≥ 0 für alle x ∈ (a, b) gilt.
Beweis: Nach Satz 6.27 ist f genau dann konvex auf [a, b], wenn die erste Ableitung f ′
auf (a, b) monoton wächst. Diese Monotonie von f ′ wiederum ist nach Satz 6.18 äquivalent
dazu, dass die Ableitung dieser Funktion, also f ′′ , nichtnegativ auf (a, b) ist.
2
Aus den beiden vorangehenden Resultaten erhält man eine ganze Reihe von Beispielen
konvexer und konkaver Funktionen.
Beispiel 6.29 (a) Jede affine Funktion f : R → R mit f (x) := ax + b mit gegebenen
a, b ∈ R ist konvex, denn f ′′ (x) = 0 für alle x ∈ R, so dass die Behauptung sofort
aus dem Satz 6.28 folgt.
(b) Die Funktion f : R → R, f (x) := x2 , ist konvex auf dem R, denn f ′ (x) = 2x ist
offenbar monoton wachsend, so dass die Behauptung aus dem Satz 6.27 folgt.
(c) Die Exponentialfunktion exp : R → R ist ebenfalls konvex, denn exp′ (x) = exp(x),
und die Exponentialfunktion ist wegen Satz 5.4 monoton wachsend.
(d) Der natürliche Logarithmus ln : (0, ∞) → R ist konkav, denn f ′′ (x) = − x12 ≤ 0 für
alle x ∈ (0, ∞) bedeutet nach Satz 6.28, dass die Funktion −f konvex und damit f
selbst konkav ist.
3
Christian Kanzow, Universität Würzburg, WS 2010/11
6.6. WICHTIGE UNGLEICHUNGEN UND ℓP –NORMEN
6.6
195
Wichtige Ungleichungen und ℓp–Normen
Als relativ einfache Anwendung der Theorie konvexer Funktionen beweisen wir jetzt noch
einige fundamentale Ungleichungen. Aus diesen erhalten wir insbesondere verschiedene
Normen in dem K–Vektorraum Kn , von denen wir zwei schon im Beispiel 4.6 eingeführt
hatten. Insbesondere werden wir hier zeigen, dass die Euklidische Norm aus dem Beispiel 4.6
(b) tatsächlich eine Norm ist. Als wichtiges Hilfsmittel benötigen wir dazu das nachstehende
Resultat.
Satz 6.30 ( Ungleichung zwischen arithmetischem und geometrischem Mittel )
Für beliebige x1 , . . . , xr > 0 sowie λ1 , . . . , λr > 0 mit λ1 + . . . + λr = 1 gilt
xλ1 1 · xλ2 2 · . . . · xrλr ≤ λ1 x1 + λ2 x2 + . . . + λr xr .
Beweis: Betrachte die Funktion f (x) := − ln(x). Wegen Beispiel 6.29 (d) ist diese konvex
auf ihrem Definitionsbereich (0, +∞). Also gilt
ln(λ1 x1 + . . . + λr xr ) ≥ λ1 ln(x1 ) + . . . + λr ln(xr )
nach der Ungleichung von Jensen aus dem Lemma 6.26. Anwendung der monoton wachsenden Exponentialfunktion ergibt unter Beachtung des zugehörigen Additionstheorems
sowie der Definition der allgemeinen Potenz gerade die Behauptung.
2
Speziell für λ1 := . . . := λr :=
√
r
1
r
folgt aus dem Satz 6.30 die Gültigkeit der Ungleichung
x1 · x2 · . . . · xr ≤
x1 + x2 + . . . + xr
,
r
die ihrerseits ebenfalls als Ungleichung zwischen dem arithmetischen und dem geometrischen Mittel bezeichnet wird. In Abgrenzung hiervon spricht man beim Satz 6.30 deshalb
auch manchmal von der Ungleichung zwischen dem gewichteten arithmetischen und dem
gewichteten geometrischen Mittel .
Wir definieren auf dem Raum Kn = (x1 , . . . , xn ) xi ∈ K für alle xi ∈ K als Nächstes
gewisse Normen, und zwar die so genannten ℓp –Normen
kzkp :=
n
X
i=1
|zi |p
! p1
für 1 ≤ p < ∞
sowie die ℓ∞ –Norm
kzk∞ := max |zi |,
i=1,...,n
wobei die Namensgebung natürlich noch gerechtfertigt werden muss, da wir bislang noch
nicht wissen, dass es sich tatsächlich um Normen auf dem Vektorraum Kn handelt. Tatsächlich sieht man dies relativ leicht für k · k1 und k · k∞ ein, so dass wir im Folgenden nur den
Christian Kanzow, Universität Würzburg, WS 2010/11
196
KAPITEL 6. DIFFERENTIALRECHNUNG
Fall 1 < p < ∞ näher untersuchen werden. Dieser beinhaltet für p = 2 insbesondere die
sehr wichtige Euklidische Norm
v
u n
uX
kzk2 = t
|zi |2 .
i=1
Als Vorbereitung beweisen wir zunächst die nachstehende Ungleichung.
Satz 6.31 ( Höldersche Ungleichung )
Seien p, q ∈ (1, ∞) zwei Zahlen mit 1p +
n
X
i=1
1
q
= 1. Dann gilt
|zi wi| ≤ kzkp kwkq
für alle z, w ∈ Kn .
Beweis: Für z = 0 oder w = 0 ist die Behauptung offenbar richtig, so dass wir z 6= 0 und
w 6= 0 annehmen können. Die Ungleichung zwischen dem arithmetischen und geometrischen
Mittel aus dem Satz 6.30, angewandt auf
1
1
|zi |p
r = 2, λ1 = , λ2 = , x1 =
p
q
kzkpp
|wi|q
und x2 =
,
kwkqq
liefert unmittelbar
1 |zi |p
1 |wi|q
|zi wi |
= xλ1 1 xλ2 2 ≤ λ1 x1 + λ2 x2 =
+
kzkp kwkq
p kzkpp q kwkqq
(die Anwendung des Satzes 6.30 setzt zi 6= 0, wi 6= 0 voraus, aber die gerade hergeleitete
Ungleichung gilt ganz offensichtlich auch, wenn zi = 0 oder wi = 0 gilt). Durch Summation
ergibt sich
n
n
n
X
1
1 1
1 1 X p 1 1 X
|zi wi | ≤
|zi | +
|wi|q = + = 1
p
q
kzkp kwkq i=1
p kzkp i=1
q kwkq i=1
p q
| {z }
| {z }
=kzkpp
=kwkqq
und damit die Behauptung.
2
Ein oft benutzter Spezialfall der Hölderschen Ungleichung ist in dem nachstehenden Korollar enthalten.
Korollar 6.32 ( Cauchy–Schwarzsche Ungleichung )
Für alle z, w ∈ Kn gilt die Ungleichung
|z T w| ≤ kzk2 · kwk2 ,
Christian Kanzow, Universität Würzburg, WS 2010/11
6.6. WICHTIGE UNGLEICHUNGEN UND ℓP –NORMEN
wobei wir zur Abkürzung
T
z w :=
n
X
197
z i wi
i=1
gesetzt haben.
Beweis: Aus der Dreiecksungleichung in K sowie der Hölderschen Ungleichung aus dem
Satz 6.31 folgt für p = q = 2 sofort
n
n
n
X
X
X
z i wi ≤
|z i wi | =
|zi wi | ≤ kzk2 kwk2
|z T w| = i=1
i=1
i=1
für alle z, w ∈ Kn , wobei wir ausgenutzt haben, dass aus den bekannten Rechenregeln für
den Betrag und die konjugiert–komplexen Zahlen
|z i wi | = |z i | · |wi| = |zi | · |wi| = |zi wi| für alle i = 1, . . . , n
gilt.
2
Aus der Hölderschen Ungleichung folgt außerdem das nachstehende Resultat.
Satz 6.33 ( Minkowskische Ungleichung )
Sei p ∈ (1, ∞) gegeben. Dann gilt
kz + wkp ≤ kzkp + kwkp
für alle z, w ∈ Kn .
Beweis: Wir definieren zunächst einen Vektor s := (s1 , . . . , sn )T ∈ Kn durch
si := |zi + wi |p−1
und wählen q ∈ (1, ∞) derart, dass
p
durch q := p−1
). Dann ist
1
p
+
1
q
= 1 gilt (dieses q ist offenbar eindeutig gegeben
sqi = |zi + wi |q(p−1) = |zi + wi|p
und damit
kskq = kz + wkp/q
p .
Durch Anwendung der Dreiecksungleichung in K sowie zweimalige Benutzung der Hölderschen Ungleichung aus dem Satz 6.31 folgt daher
n
X
i=1
|zi + wi | · |si| ≤
n
X
i=1
|zi | · |si | +
n
X
i=1
|wi | · |si |
Christian Kanzow, Universität Würzburg, WS 2010/11
198
KAPITEL 6. DIFFERENTIALRECHNUNG
=
n
X
i=1
Die Definition von s impliziert somit
Wegen p −
p
q
|zi si | +
n
X
i=1
|wisi |
≤ kzkp · kskq + kwkp · kskq
= kzkp + kwkp · kskq .
kz + wkpp ≤ kzkp + kwkp kz + wkp/q
p .
= 1 liefert dies gerade die Behauptung.
2
Aus der Minkowskischen Ungleichung erhalten wir jetzt das folgende Korollar.
Korollar 6.34 Die ℓp –Normen sind für alle 1 ≤ p ≤ ∞ Normen auf dem Kn .
Beweis: Mit Ausnahme der Dreiecksungleichung lassen sich alle definierenden Eigenschaften einer Norm sehr leicht überprüfen. Die Dreiecksungleichung hingegen ist gerade
die Minkowskische Ungleichung aus dem Satz 6.33, wobei dort nur der Fall 1 < p < ∞
betrachtet wurde. Die Gültigkeit der Dreiecksungleichung in den beiden Grenzfällen p = 1
und p = ∞ lässt sich aber elementar verifizieren.
2
Über das Korollar 6.34 hinaus gilt sogar das nachstehende Resultat.
Satz 6.35 ( Vollständigkeit des Kn )
Der normierte Raum Kn ist mit jeder der ℓp –Normen (1 ≤ p ≤ +∞)) ein Banach–Raum.
Beweis: Wir betrachten zunächst den Spezialfall p = ∞, für den wir das Resultat bereits
im Satz 4.12 bewiesen haben. Dennoch soll hier ein alternativer Beweis angegeben werden.
Sei also {zn } eine Cauchy–Folge in dem normierten Raum (Kn , k · k∞ ). Analog zum
Beweis des Satzes 3.22 zeigt man, dass die Folge {zn } dann beschränkt ist. Nach dem
Satz 4.13 von Bolzano–Weierstraß besitzt {zn } dann eine gegen einen Häufungspunkt z
konvergente Teilfolge. Wegen Satz 4.9 konvergiert dann bereits die gesamte Folge {zn }
gegen z. Also ist jede Cauchy–Folge in (Kn , k · k∞ ) konvergent und dieser Raum somit
vollständig.
Die Vollständigkeit aller anderen Räume (Kn , k · kp ) mit 1 ≤ p < ∞ ergibt sich nun aus
dem Satz 4.53, wonach jede dieser Normen äquivalent ist zu der Norm k · k∞ .
2
Die Mengen
K1 (0) := x ∈ Rn | kxkp ≤ 1
werden als Einheitskreise bezüglich der ℓp –Norm bezeichnet. Dass es sich hierbei im Allgemeinen keineswegs um Kreis im üblichen Sinne handelt, wird durch die Abbildung 6.6
illustriert.
Christian Kanzow, Universität Würzburg, WS 2010/11
6.6. WICHTIGE UNGLEICHUNGEN UND ℓP –NORMEN
1
Einheitskreis in der l∞ –Norm
Einheitskreis in der l2 –Norm
Einheitskreis in der l1 –Norm
1
−1
−1
Abbildung 6.6: Die Einheits kreise“ in der l1 −, l2 − und l∞ –Norm im R2
”
Christian Kanzow, Universität Würzburg, WS 2010/11
199
200
KAPITEL 6. DIFFERENTIALRECHNUNG
Christian Kanzow, Universität Würzburg, WS 2010/11
Kapitel 7
Das Riemann–Integral
7.1
7.2
7.3
7.4
7.5
7.6
7.1
Unter– und Obersummen
Riemann–Integral
Riemannsche Summen
Rechenregeln
Differentiation und Integration
Die Lp –Normen
Unter– und Obersummen
Unter einer Partition oder Zerlegung eines Intervalls [a, b] verstehen wir eine endliche Menge P = {x0 , x1 , . . . , xn } mit der Eigenschaft
a = x0 < x1 < . . . < xn = b,
vergleiche die Abbildung 7.1.
= I1
...
= I2 = I3
= In
R
a
= x0
b
x1
x2
x3
. . . xn−1
= xn
Abbildung 7.1: Beispiel einer Partition des Intervalls [a, b]
Als Feinheit einer solchen Zerlegung bezeichnen wir den Ausdruck
δ(P ) := max |xk − xk−1 |,
k=1,...,n
d.h., δ(P ) ist die Länge des größten Teilintervalls Ik := [xk−1 , xk ], k = 1, . . . , n.
201
202
KAPITEL 7. DAS RIEMANN–INTEGRAL
Definition 7.1 Sei f : [a, b] → R eine beschränkte Funktion und P = {x0 , x1 , . . . , xn }
eine Partition von [a, b] in die Teilintervalle Ik := [xk−1 , xk ] für k = 1, . . . , n. Setze
mk (f ) := inf f (x)
x∈Ik
und
Mk (f ) := sup f (x).
x∈Ik
Dann heißen
UP (f ) :=
X
P
OP (f ) :=
X
P
mk (f )(xk − xk−1 ) :=
Mk (f )(xk − xk−1 ) :=
n
X
k=1
n
X
k=1
mk (f )(xk − xk−1 )
und
Mk (f )(xk − xk−1 )
die Untersumme und die Obersumme von f zur Partition P .
Zu einer beschränkten Funktion f : [a, b] → R und einer gegebenen Partition P =
{x0 , x1 , . . . , xn } von [a, b] bezeichne mk (f ) und Mk (f ) für alle k = 1, . . . , n stets die Begriffe
aus der Definition 7.1. Ferner setzen wir
m(f ) := inf f (x) und M(f ) := sup f (x)
x∈[a,b]
x∈[a,b]
und erlauben uns, von diesen Bezeichnungen im Folgenden ebenfalls freien Gebrauch zu
machen, ohne diese explizit zu wiederholen. Die Abbildung 7.2 illustriert die Begriffe der
Ober– und Untersumme.
f
OP (f )
UP (f )
a
= x0 x1
x
x2
x3
b
= x4
Abbildung 7.2: Veranschaulichung einer Ober– und Untersumme
Lemma 7.2 Seien f : [a, b] → R beschränkt und P eine beliebige Partition von [a, b].
Dann gilt
m(f )(b − a) ≤ UP (f ) ≤ OP (f ) ≤ M(f )(b − a).
Christian Kanzow, Universität Würzburg, WS 2010/11
7.1. UNTER– UND OBERSUMMEN
203
Beweis: Per Definition gilt m(f ) ≤ mk (f ) ≤ Mk (f ) ≤ M(f ) für alle k = 1, 2, . . . , n.
Multiplikation mit xk − xk−1 > 0 ergibt
m(f )(xk − xk−1 ) ≤ mk (f )(xk − xk−1 ) ≤ Mk (f )(xk − xk−1 ) ≤ M(f )(xk − xk−1 ).
Summation über alle k = 1, 2, . . . , n liefert daher die Behauptung wegen
b − a.
Pn
k=1
xk − xk−1 =
2
Im Folgenden bezeichnen wir eine Partition P ′ = {x′0 , x′1 , . . . , x′n′ } von [a, b] als eine Verfeinerung von einer Partition P = {x0 , x1 , . . . , xn }, wenn {x0 , x1 , . . . , xn } ⊆ {x′0 , x′1 , . . . , x′n′ }
gilt. Offenbar ist dann δ(P ′ ) ≤ δ(P ).
Lemma 7.3 Seien f : [a, b] → R beschränkt und P, P ′ zwei Zerlegungen von [a, b] derart,
dass P ′ eine Verfeinerung von P ist. Dann gilt OP ′ (f ) ≤ OP (f ) und UP ′ (f ) ≥ UP (f ).
Beweis: Wir beweisen die Aussage nur für die Obersummen, da sie sich für die Untersummen analog verifizieren lässt. Sei P = {x0 , x1 , . . . , xn } die gegebene Partition. Dann
entsteht P ′ durch Hinzunahme von endlich vielen Punkten zu P . Wir nehmen jetzt an,
dass P ′ aus P durch Hinzunahme nur eines Punktes x entstehe, der in dem Teilintervall
[xr−1 , xr ] liegen möge. Der allgemeine Fall kann dann bewiesen werden, indem man die
nachstehenden Argumente endlich viele Male wiederholt.
Gemäß Definition ist
n
X
OP (f ) =
Mk (f )(xk − xk−1 ).
k=1
Mit Ausnahme des Summanden k = r stimmt diese Formel auch für die Obersumme OP ′ (f )
der Partition P ′ , so dass wir nur diesen einen Summanden zu betrachten brauchen. Es ist
auf dem Teilintervall [xr−1 , xr ] = [xr−1 , x] ∪ [x, xr ] aber
sup
x∈[xr−1 ,x]
f (x)(x − xr−1 ) + sup f (x)(xr − x)
x∈[x,xr ]
≤
x∈[xr−1 ,xr ]
=
sup
sup
x∈[xr−1 ,xr ]
f (x)(x − xr−1 ) +
sup
x∈[xr−1 ,xr ]
f (x)(xr − x)
f (x) (x − xr−1 ) + (xr − x)
= Mr (f )(xr − xr−1 )
und daher OP ′ (f ) ≤ OP (f ).
2
Als Konsequenz des Lemmas 7.3 erhalten wir sofort das nachstehende Resultat.
Lemma 7.4 Seien f : [a, b] → R beschränkt und P1 , P2 zwei Partitionen von [a, b]. Dann
gilt UP1 (f ) ≤ OP2 (f ).
Christian Kanzow, Universität Würzburg, WS 2010/11
204
KAPITEL 7. DAS RIEMANN–INTEGRAL
Beweis: Die Partition P := P1 ∪ P2 ist ganz offensichtlich eine Verfeinerung sowohl von
P1 als auch von P2 . Daher erhalten wir aus den Lemmata 7.2 und 7.3 unmittelbar
UP1 (f ) ≤ UP (f ) ≤ OP (f ) ≤ OP2 (f ),
womit auch schon alles bewiesen ist.
2
Wir definieren jetzt die unteren und oberen Riemann–Integrale unter Verwendung der
Unter– und Obersummen.
Definition 7.5 Sei f : [a, b] → R eine beschränkte Funktion. Dann heißen
Zb
a
Zb
a
f (x)dx := sup UP (f ) P ist eine Partition von [a, b]
und
f (x)dx := inf OP (f ) P ist eine Partition von [a, b]
das untere und obere Riemann–Integral von f auf [a, b].
Das untere und obere Riemann–Integral wird in der Literatur manchmal auch als unteres und oberes Darboux–Integral oder Riemann–Darboux–Integral bezeichnet. Man beachte
hierbei, dass beide Integrale im Falle von beschränkten Funktionen endliche Werte liefern
und daher wohldefiniert sind. Im Falle des unteren Riemann–Integrals folgt dies beispielsweise aus der Tatsache, dass eine beliebige Obersumme OP (f ) wegen Lemma 7.4 stets eine
obere Schranke für alle möglichen Untersummen darstellt und wir daher das Supremum
über eine offenbar nichtleere und nach oben beschränkte Menge nehmen müssen. Ein solches Supremum existiert in der Menge der reellen Zahlen aber stets (siehe Definition 1.31
und Satz 1.32).
Bemerkung 7.6 Seien f, g : [a, b] → R zwei beschränkte Funktionen mit f (x) ≤ g(x) für
alle x ∈ [a, b]. Für jede Partition P des Intervalls [a, b] gelten dann offenbar UP (f ) ≤ UP (g)
und OP (f ) ≤ OP (g). Dies impliziert wiederum die Monotonie–Eigenschaften
Zb
a
f (x)dx ≤
Zb
g(x)dx und
a
Zb
f (x)dx ≤
a
Zb
g(x)dx
a
des unteren und oberen Riemann–Integrals.
Mittels unserer Vorbetrachtungen gelangen wir sofort zu dem folgenden Resultat.
Lemma 7.7 Sei f : [a, b] → R beschränkt. Dann gilt
Zb
a
f (x)dx ≤
Zb
f (x)dx.
a
Christian Kanzow, Universität Würzburg, WS 2010/11
7.2. RIEMANN–INTEGRAL
205
Beweis: Für beliebige Partitionen P1 , P2 von [a, b] gilt UP1 (f ) ≤ OP2 (f ) nach Lemma 7.4.
Halten wir P2 vorübergehend fest, so folgt
sup UP1 (f ) ≤ OP2 (f ).
P1
Da P2 hierbei eine beliebige Partition sein kann, impliziert dies
sup UP1 (f ) ≤ inf OP2 (f ).
P2
P1
Aus der Definition des unteren und oberen Riemann–Integrals folgt somit die Behauptung.
2
7.2
Riemann–Integral
Wir führen in diesem Abschnitt den Begriff des Riemann–Integrals ein und beweisen einige
der wichtigsten Eigenschaften von Riemann–integrierbaren Funktionen.
Definition 7.8 Ist f : [a, b] → R eine beschränkte Funktion mit
Zb
f (x)dx =
Zb
f (x)dx,
a
a
so heißt f (Riemann–) integrierbar und der gemeinsame Wert
Zb
f (x)dx :=
a
Zb
f (x)dx
a
=
Zb
a
f (x)dx ,
das (bestimmte Riemann–) Integral von f auf [a, b].
Ist f : [a, b] → R eine integrierbare Funktion mit f (x) ≥ 0 für alle x ∈ [a, b], so lässt sich
das Integral
Z b
f (x)dx
(7.1)
a
als Fläche zwischen der x-Achse und dem Graphen von f deuten. Dies folgt unmittelbar aus
der Definition des Integrals und der Herleitung der Unter– und Obersummen im vorigen
Abschnitt, vergleiche hierzu auch die Abbildung 7.3.
Statt der Schreibweise (7.1) werden wir häufig auch
Z b
Z b
f (t)dt oder
f (ξ)dξ
a
a
schreiben. Wir sind also nicht an den Buchstaben x für die Integrationsvariable in (7.1)
gebunden.
Christian Kanzow, Universität Würzburg, WS 2010/11
206
KAPITEL 7. DAS RIEMANN–INTEGRAL
f
Rb
a
f (x)dx
x
a
b
Abbildung 7.3: Interpretation des Riemann–Integrals als Fläche
Beispiel 7.9 (a) Wir betrachten die konstante Funktion f : [a, b] → R, f (x) := 1 für
alle x ∈ [a, b]. Offenbar gilt
OP (f ) = b − a und UP (f ) = b − a
für jede Partition P von [a, b]. Hieraus ergibt sich
Zb
f (x)dx = b − a und
Zb
f (x)dx = b − a.
a
a
Folglich ist f integrierbar mit
Z
b
a
f (x)dx = b − a.
(b) Wir betrachten die durch
f (x) :=
1, falls x ∈ Q,
0, falls x 6∈ Q
definierte Funktion f : [a, b] → R. Für jede Partition P von [a, b] gilt dann
OP (f ) = b − a und UP (f ) = 0
wegen Satz 1.34. Also ist
Zb
f (x)dx = 0 < b − a =
a
Z
b
f (x)dx
a
und f somit nicht integrierbar auf [a, b].
Christian Kanzow, Universität Würzburg, WS 2010/11
3
7.2. RIEMANN–INTEGRAL
207
Wir betrachten im Folgenden einige Kriterien für die Integrierbarkeit von Funktionen.
Dabei stellt das nachstehende Resultat vielleicht das Kriterium schlechthin für die Integrierbarkeit einer beschränkten Funktion dar. Es ist für die praktische Berechnung des
Integrals zwar nicht besonders geeignet, wird im Laufe unserer theoretischen Untersuchungen allerdings noch häufig die Integrierbarkeit gewisser Funktionen liefern und stellt somit
ein wichtiges beweistheoretisches Hilfsmittel dar.
Satz 7.10 ( Integrabilitätskriterium von Riemann )
Sei f : [a, b] → R eine beschränkte Funktion. Dann ist f genau dann auf [a, b] integrierbar,
wenn es zu jedem ε > 0 eine Partition P von [a, b] gibt mit
OP (f ) − UP (f ) < ε.
(7.2)
Beweis: Sei zunächst die Bedingung (7.2) für ein beliebiges ε > 0 erfüllt. Per Definition
des unteren und oberen Riemann–Integrals gilt stets
0≤
Zb
f (x)dx −
a
Zb
f (x)dx ≤ OP (f ) − UP (f )
a
für jede Partition P von [a, b]. Nach Voraussetzung (7.2) existiert aber eine spezielle Partition P mit
OP (f ) − UP (f ) < ε.
Hierfür gilt somit
0≤
Zb
a
f (x)dx −
Zb
f (x)dx < ε.
a
Da ε > 0 beliebig war, folgt die Integrierbarkeit von f auf [a, b].
Sei f umgekehrt als integrierbar vorausgesetzt und ε > 0. Dann ist
Zb
a
Zb
a
f (x)dx = sup UP (f ) P ist eine Partition von [a, b]
f (x)dx = inf OP (f ) P ist eine Partition von [a, b] .
Also existieren Partitionen P1 und P2 mit
Z b
Z b
ε
ε
OP1 (f ) <
f (x)dx +
und UP2 (f ) >
f (x)dx − .
2
2
a
a
Für die verfeinerte Partition P := P1 ∪ P2 von [a, b] ergibt sich somit
OP (f ) − UP (f ) ≤ OP1 (f ) − UP2 (f ) < ε
Christian Kanzow, Universität Würzburg, WS 2010/11
und
208
KAPITEL 7. DAS RIEMANN–INTEGRAL
wegen Lemma 7.3.
2
Mit Hilfe des Satzes 7.10 sind wir nun in der Lage, für zwei wichtige Klassen von Funktionen
die Integrierbarkeit zu beweisen.
Satz 7.11 ( Integrierbarkeit monotoner Funktionen )
Sei f : [a, b] → R eine beschränkte und monotone Funktion. Dann ist f integrierbar auf
[a, b].
Beweis: Sei f monoton wachsend (für monoton fallende Funktionen verläuft der Beweis
analog). Für jede Partition P von [a, b] gilt dann
P
OP (f ) − UP (f ) =
P Mk (f ) − mk (f ) (xk − xk−1 )
P
=
P f (xk ) − f (xk−1 ) (xk − xk−1 )
(7.3)
P
≤ δ(P ) · P f (xk ) − f (xk−1 )
= δ(P ) f (b) − f (a) ,
wobei die Monotonie von f in die zweite Gleichung (und die Ungleichung) eingeht und die
letzte Identität aus der Tatsache folgt, dass
X
f (xk ) − f (xk−1)
P
eine Teleskopsumme ist, bei der sich mit Ausnahme des ersten und letzten Summanden
alle anderen Terme gegeneinander aufheben. Gilt nun f (a) = f (b), so ist f eine konstante
Funktion und daher natürlich integrierbar, vergleiche das Beispiel 7.9 (a). Sei daher f (a) <
f (b) und ε > 0 beliebig gegeben. Wir wählen dann eine Partition P von [a, b] mit der
Feinheit
ε
.
δ(P ) <
f (b) − f (a)
Aus (7.3) folgt dann OP (f ) − UP (f ) < ε. Folglich ist f integrierbar aufgrund des Satzes
7.10.
2
Die vielleicht wichtigste Klasse von integrierbaren Funktionen sind die stetigen Abbildungen. Dieses Resultat ist in dem folgenden Satz enthalten.
Satz 7.12 ( Integrierbarkeit stetiger Funktionen )
Sei f : [a, b] → R eine stetige Funktion. Dann ist f integrierbar auf [a, b].
Beweis: Als stetige Funktion auf dem kompakten Intervall [a, b] ist f wegen Satz 4.47
zunächst beschränkt. Außerdem ist f gleichmäßig stetig auf [a, b] wegen Satz 4.50. Zu
jedem ε > 0 existiert daher ein δ > 0 mit
f (ξ1 ) − f (ξ2 ) < ε für alle ξ1 , ξ2 ∈ [a, b] mit |ξ1 − ξ2 | < δ.
b−a
Christian Kanzow, Universität Würzburg, WS 2010/11
7.2. RIEMANN–INTEGRAL
209
Wir wählen jetzt eine Partition P = {x0 , x1 , . . . , xn } von [a, b] mit der Feinheit δ(P ) < δ.
Nach Satz 4.47 existieren zu jedem k ∈ {1, . . . , n} Zwischenpunkte ξ k ∈ [xk−1 , xk ] und
ξ k ∈ [xk−1 , xk ] mit Mk (f ) = f (ξ k ) und mk (f ) = f (ξ k ). Dann folgt
X
Mk (f ) − mk (f ) (xk − xk−1 )
OP (f ) − UP (f ) =
P
=
n
X
k=1
f (ξ k ) − f (ξ k ) (xk − xk−1 )
n
ε X
(xk − xk−1 )
<
b − a k−1
= ε.
Die Integrierbarkeit von f auf [a, b] folgt daher erneut aus dem Satz 7.10.
2
Als Verallgemeinerung des Satzes 7.12 erwähnen wir an dieser Stelle noch ein weiteres und
manchmal sehr nützliches hinreichendes (nicht notwendiges) Kriterium für die Riemann–
Integrierbarkeit einer gegebenen Funktion, das sich später als Spezialfall des Integrabilitätskriteriums von Lebesgue herausstellen wird und das wir erst im nächsten Kapitel beweisen
werden.
Satz 7.13 ( Hinreichendes Kriterium für Integrierbarkeit )
Sei f : [a, b] → R eine beschränkte Funktion. Ist f mit Ausnahme von höchstens abzählbar
vielen Stellen in [a, b] stetig, so ist f Riemann–integrierbar auf [a, b].
Wir zeigen in dem folgenden Resultat, dass unter gewissen Voraussetzungen auch das Kompositum zweier Funktionen wieder Riemann–integrierbar ist. Die Situation ist allerdings
etwas komplizierter, als man zunächst vielleicht vermuten würde, denn wir werden anschließend noch sehen, dass die Zusammensetzung zweier Riemann–integrierbarer Funktionen im
Allgemeinen nicht Riemann–integrierbar ist, so dass man etwas stärkere Voraussetzungen
benötigt. Natürlich ist das Kompositum zweier stetiger Abbildungen Riemann–integrierbar
(da stetig). Tatsächlich gilt das folgende Resultat.
Satz 7.14 ( Integrierbarkeit des Kompositums )
Seien f : [a, b] → R und g : [c, d] → R zwei gegebene Funktionen mit f ([a, b]) ⊆ [c, d]. Ist
f Riemann–integrierbar auf [a, b] und g stetig auf [c, d], so ist das Kompositum h := g ◦ f
Riemann–integrierbar auf [a, b].
Beweis: Wegen Satz 4.50 ist die auf dem kompakten Intervall [c, d] stetige Funktion g
dort sogar gleichmäßig stetig. Also existiert zu beliebigem ε > 0 ein δ > 0 mit
g(s) − g(t) < ε für alle s, t ∈ [c, d] mit |s − t| < δ.
(7.4)
Nach Voraussetzung ist f auf [a, b] Riemann–integrierbar. Aufgrund des Satzes 7.10 gibt
es deshalb eine Partition P = {x0 , x1 , . . . , xm } von [a, b] in Teilintervalle Ik := [xk−1 , xk ]
Christian Kanzow, Universität Würzburg, WS 2010/11
210
KAPITEL 7. DAS RIEMANN–INTEGRAL
mit
OP (f ) − UP (f ) < δ 2 .
(7.5)
Ohne Einschränkung der Allgemeinheit können wir dabei voraussetzen, dass
δ<ε
(7.6)
gilt. Seien nun
mk := inf f (x),
x∈Ik
Mk := sup f (x)
x∈Ik
sowie
Mk∗ := sup h(x).
m∗k := inf h(x),
x∈Ik
x∈Ik
Wir definieren dann die beiden Indexmengen
A := k ∈ {1, . . . , m} Mk − mk < δ
und
B := k ∈ {1, . . . , m} Mk − mk ≥ δ = {1, . . . , m}\A.
Wegen (7.4) gilt dann
Mk∗ − m∗k ≤ ε für alle k ∈ A.
Hingegen haben wir
Mk∗ − m∗k ≤ 2c für alle k ∈ B mit der Konstanten c := sup h(t).
t∈[a,b]
Aus (7.5) und der Definition der Indexmenge B folgt außerdem
δ
X
k∈B
|Ik | ≤
X
k∈B
(Mk − mk )|Ik | ≤
so dass wir wegen (7.6)
m
X
k=1
X
k∈B
erhalten. Insgesamt folgt damit
OP (h) − UP (h) =
=
k=1
=
|Ik | < δ ≤ ε
m
X
k=1
m
X
X
k∈A
+
(Mk − mk )|Ik | = OP (f ) − UP (f ) < δ 2 ,
sup h(x) − inf h(x) |Ik |
x∈Ik
x∈Ik
sup g f (x) − inf g f (x) |Ik |
x∈Ik
x∈Ik
sup g f (x) − inf g f (x) |Ik |
x∈Ik
X
k∈B
x∈Ik
sup g f (x) − inf g f (x) |Ik |
x∈Ik
x∈Ik
Christian Kanzow, Universität Würzburg, WS 2010/11
7.3. RIEMANNSCHE SUMMEN
≤
X
k∈A
ε|Ik | +
X
k∈B
≤ ε(b − a) + 2c
211
2c|Ik |
X
k∈B
|Ik |
≤ (b − a + 2c)ε.
Da ε > 0 beliebig war, folgt die Integrierbarkeit von h auf [a, b] aus dem Riemannschen
Integrabilitätskriterium.
2
Korollar 7.15 Seien f : [a, b] → R beschränkt und integrierbar mit |f (x)| ≥ γ für alle
x ∈ [a, b] mit einer Konstanten γ > 0. Dann ist auch f1 integrierbar.
Beweis: Setze c := inf x∈[a,b] f (x), d := supx∈[a,b] f (x) sowie g(t) := 1/t für t ∈ [c, d]. Dann
ist g wohldefiniert und stetig auf [c, d] sowie h := g ◦ f gerade gleich der Abbildung 1/f .
Da diese nach Voraussetzung beschränkt ist, folgt die Behauptung unmittelbar aus dem
Satz 7.14.
2
Das folgende Beispiel zeigt, dass das Kompositum zweier Riemann–integrierbarer Funktionen im Allgemeinen nicht integrierbar ist.
Beispiel 7.16 Betrachte die beiden Funktionen f, g : [0, 1] → R mit
0, falls x irrational,
f (x) :=
1
, falls x = pq mit p, q ∈ N teilerfremd
q
und
g(t) :=
0, falls t = 0,
1, falls t ∈ (0, 1].
Man sieht sofort ein, dass keine der beiden Abbildungen stetig ist. Allerdings sind sowohl
f als auch g Riemann–integrierbar auf [0, 1]. Im Falle der Funktion g ist dies sehr leicht
einzusehen, bei f ist dies eine Konsequenz aus dem Satz 7.13 sowie der Tatsache, dass f
mit Ausnahme von abzählbar vielen Punkten (nämlich den rationalen Zahlen in [0, 1]) mit
der Nullfunktion übereinstimmt. Für das Kompositum erhalten wir nun
0, falls f (x) = 0, also falls x irrational,
h(x) := g f (x) =
1, falls x rational.
Diese Funktion ist wegen Beispiel 7.9 (b) jedoch nicht integrierbar.
7.3
3
Riemannsche Summen
Zur Berechnung des Integrals einer beschränkten Funktion müssen wir bislang explizit
alle Ober– oder Untersummen ausrechnen. Dies ist nicht besonders praktikabel. In einigen
Fällen kann dies mit Hilfe so genannter Riemannscher Summen vereinfacht werden.
Christian Kanzow, Universität Würzburg, WS 2010/11
212
KAPITEL 7. DAS RIEMANN–INTEGRAL
Definition 7.17 Seien f : [a, b] → R beschränkt, P = {x0 , x1 , . . . , xn } eine Partition
von [a, b] und ξ = {ξ1 , . . . , ξn } eine Menge von Zwischenpunkten in dem Sinne, dass ξk ∈
[xk−1 , xk ] für alle k = 1, . . . , n gilt. Dann heißt
SP (f, ξ) :=
X
P
f (ξk )(xk − xk−1 ) :=
n
X
k=1
f (ξk )(xk − xk−1 )
eine Riemannsche Summe von f zur Partition P .
f
a ξ1
= x0
ξ2
x1
ξ3
x2
ξ4
x3
ξ5 b
x4 = x5
x
Abbildung 7.4: Veranschaulichung einer Riemannschen Summe
Die Abbildung 7.4 veranschaulicht den Begriff einer Riemannschen Summe. Man beachte,
dass es unendlich viele Riemannsche Summen zu einer Partition P des Intervalls [a, b] gibt,
da man Freiheiten in der Wahl der Zwischenpunkte ξk ∈ [xk−1 , xk ] hat. Ferner sei an dieser
Stelle noch bemerkt, dass eine Ober– oder Untersumme im Allgemeinen keine Riemannsche
Summe darstellt, da das Supremum in Mk (f ) bzw. das Infimum in mk (f ) auf dem Intervall
[xk−1 , xk ] nicht angenommen werden muss.
Lemma 7.18 Seien f : [a, b] → R beschränkt, P = {x0 , x1 , . . . , xn } eine Partition von
[a, b] und ξk ∈ [xk−1 , xk ] beliebige Zwischenpunkte. Dann gilt
UP (f ) ≤ SP (f, ξ) ≤ OP (f ).
Beweis: Per Definition gilt mk (f ) ≤ f (ξk ) ≤ Mk (f ) für alle k = 1, . . . , n. Multipliziert
man diese Ungleichung mit xk − xk−1 und addiert sie anschließend für k = 1, . . . , n auf, so
folgt die Behauptung.
2
Sei f : [a, b] → R beschränkt. Existiert dann eine Zahl I ∈ R und gibt es zu jedem ε > 0
ein δ > 0, so dass für alle Partitionen P von [a, b] (in gewisse Teilintervalle Ik ) mit der
Christian Kanzow, Universität Würzburg, WS 2010/11
7.3. RIEMANNSCHE SUMMEN
213
Feinheit δ(P ) < δ sowie bei beliebiger Wahl ξk ∈ Ik der Zwischenpunkte die Ungleichung
SP (f, ξ) − I < ε
gilt, so schreiben wir
I = lim SP (f, ξ)
δ(P )→0
und sagen, dass die Riemannschen Summen gegen I konvergieren.
Der nachstehende Satz besagt nun, dass man hiermit eine vollständige Charakterisierung der Riemann–Integrierbarkeit erhält.
Satz 7.19 ( Charakterisierung der Riemann–Integrierbarkeit )
Sei f : [a, b] → R eine beschränkte Funktion. Dann gelten:
(a) Ist f integrierbar auf [a, b], so existiert limδ(P )→0 SP (f, ξ), und es gilt
Z b
lim SP (f, ξ) =
f (x)dx.
δ(P )→0
a
(b) Existiert limδ(P )→0 SP (f, ξ), so ist f integrierbar auf [a, b], und es gilt
Z
b
f (x)dx = lim SP (f, ξ).
δ(P )→0
a
Beweis: Die Aussage (a) folgt unmittelbar aus dem Lemma 7.18. Zum Nachweis von (b)
sei ε > 0 beliebig gegeben und I := limδ(P )→0 SP (f, ξ) der nach Voraussetzung existierende
Limes. Dann gibt es ein δ > 0, so dass
I−
ε
ε
< SP (f, ξ) < I +
2
2
für alle Partitionen P mit δ(P ) < δ und alle zugehörigen Zwischenpunkte ξ gilt. Wir
betrachten nun eine feste Partition P = {x0 , x1 , . . . , xn } von [a, b] mit δ(P ) < δ. In jedem
Teilintervall [xk−1 , xk ] wählen wir dann einen Zwischenpunkt ξk derart aus, dass
f (ξk ) > Mk (f ) −
ε
2(b − a)
gilt (was nach Definition von Mk (f ) offenbar möglich ist). Für diese Wahl der Zwischenpunkte ergibt sich dann
I+
ε
> SP (f, ξ)
2
X
=
f (ξk )(xk − xk−1 )
P
>
X
P
Mk (f )(xk − xk−1 ) −
X
ε
(xk − xk−1 )
2(b − a) P
Christian Kanzow, Universität Würzburg, WS 2010/11
214
KAPITEL 7. DAS RIEMANN–INTEGRAL
ε
2
= OP (f ) −
Zb
≥
ε
f (x)dx − .
2
a
Also gilt
I>
Zb
a
f (x)dx − ε.
Ebenso beweist man die Gültigkeit der Ungleichung
I<
Zb
f (x)dx + ε,
a
indem man die Zwischenpunkte ζk so wählt, dass
f (ζk ) < mk (f ) +
ε
2(b − a)
gilt. Zusammen folgt dann
Zb
f (x)dx − ε < I <
Zb
f (x)dx + ε.
Zb
f (x).
a
a
Da ε > 0 beliebig gewählt war, impliziert dies
Zb
f (x) ≤ I ≤
a
a
Wegen Lemma 7.7 gilt aber
Zb
f (x) ≤
a
Zb
f (x)dx.
b
Also folgt
I=
Zb
a
f (x)dx =
Zb
a
f (x)dx =
Zb
f (x)dx
a
und damit die Behauptung (b).
Christian Kanzow, Universität Würzburg, WS 2010/11
2
7.3. RIEMANNSCHE SUMMEN
215
Bislang ist der Nachweis der Konvergenz von Riemannschen Summen noch sehr aufwendig,
da man bei vorgegebenem ε > 0 alle Partitionen und für jede feste Partition auch noch jede
Wahl der Zwischenpunkte in Betracht ziehen muss. Der nächste Satz besagt jedoch, dass
es im Falle einer integrierbaren Funktion genügt, eine einfache Folge von Riemannschen
Summen zu betrachten.
Satz 7.20 Seien f : [a, b] → R eine beschränkte und integrierbare Funktion, {P (n) } eine
Folge von Partitionen des Intervalls [a, b] mit δ(P (n) ) → 0 für n → ∞ und {ξ (n) } eine feste
Wahl von Zwischenpunkten zur Partition P (n) . Dann ist
Z
b
f (x)dx = lim SP (n) (f, ξ (n) ).
n→∞
a
Beweis: Wegen Satz 7.19 existiert zu jedem ε > 0 ein δ > 0 derart, dass für alle Partitionen
δ(P ) < δ die Ungleichung
Z b
SP (f, ξ) −
f (x)dx < ε
a
gilt, und zwar bei beliebiger Wahl der Zwischenpunkte ξ. Wegen δ(P (n) ) → 0 existiert ein
N ∈ N mit δ(P (n) ) < δ für alle n ∈ N mit n ≥ N. Für jedes n ≥ N ist daher
Z b
SP (n) (f, ξ) −
f (x)dx < ε,
a
woraus sich die Behauptung unmittelbar ergibt.
2
Zum Abschluss betrachten wir noch ein Beispiel zur Berechnung des Integrals einer gegebenen Funktion mittels Riemannscher Summen.
Beispiel 7.21 Wir wollen das Integral
Z
0
1
(x2 − x)dx
berechnen. Da die Funktion f (x) := x2 − x auf [0, 1] stetig ist, handelt es sich wegen Satz
7.12 insbesondere um eine integrierbare Funktion. Daher können wir den Satz 7.20 anwenden. Wir betrachten dazu die Folge {P (n) } von äquidistanten Partitionen des Intervalls
[0, 1] mit
k
(n)
∀k = 0, 1, . . . , n (n ∈ N).
xk :=
n
Dann ist offensichtlich δ(P (n) ) =
(n)
1
n
ξk :=
→ 0 für n → ∞. Ferner wählen wir die Zwischenpunkte
k
n
∀k = 1, . . . , n (n ∈ N).
Christian Kanzow, Universität Würzburg, WS 2010/11
216
KAPITEL 7. DAS RIEMANN–INTEGRAL
(n)
Die ξk sind also gerade die rechten Endpunkte der einzelnen Teilintervalle
mit folgt
X
(n)
(n)
(n)
SP (n) (f, ξ (n) ) =
f (ξk )(xk − xk−1 )
=
=
=
k−1
n
, nk . Hier-
P (n)
n 2
X
k
k
k k−1
−
−
2
n
n
n
n
k=1
n k
1 X k2
−
n k=1 n2 n
n
n
1 X
1 X 2
k − 2
k
n3
n
k=1
k=1
1 n(n + 1)(2n + 1)
1 n(n + 1)
− 2
3
n
6
n
2
1
2 1
− =− ,
→
6 2
6
wobei wir beim Grenzübergang den Satz 1.5 und die ebenfalls leicht durch Induktion
beweisbare Formel
n
X
n(n + 1)(2n + 1)
k2 =
6
k=1
R1 2
benutzt haben. Wegen Satz 7.20 gilt daher 0 (x − x)dx = − 61 .
3
=
7.4
Rechenregeln
Wir stellen in diesem Abschnitt eine Reihe von Rechenregeln für das Riemann–Integral zur
Verfügung. Dabei haben wir den Ausdruck
Z b
f (x)dx
a
bislang nur für beschränkte Funktionen auf einem Intervall [a, b] mit a < b definiert. Um
in unseren weiteren Untersuchungen auf Fallunterscheidungen verzichten zu können, geben
wir diesem Ausdruck auch im Fall a ≥ b einen Sinn.
Definition 7.22 Für a = b setzen wir
Z b
f (x)dx := 0,
a
sofern f (a) ∈ R existiert. Für a > b definieren wir
Z b
Z a
f (x)dx := −
f (x)dx,
a
b
sofern f eine auf dem Intervall [b, a] (beschränkte und) integrierbare Funktion ist.
Christian Kanzow, Universität Würzburg, WS 2010/11
7.4. RECHENREGELN
217
Wir werden in den nachstehenden Beweisen häufiger verwenden, dass für eine beschränkte
Funktion h auf einem Intervall I offenbar die folgenden Gleichheiten gelten:
supx∈I h(x) − inf x∈I h(x) = sup h(x) − h(y) x, y ∈ I
(7.7)
= sup h(x) − h(y) x, y ∈ I .
Beispielsweise erhalten wir hieraus die Linearität des Integrals.
Satz 7.23 ( Linearität des Integrals )
Seien f, g : [a, b] → R beschränkte und integrierbare Funktionen sowie α, β ∈ R beliebig
gegeben. Dann ist auch αf + βg integrierbar mit
Z b
Z b
Z b
αf + βg (x)dx = α
f (x)dx + β
g(x)dx.
(7.8)
a
a
a
Beweis: Setze h := αf + βg und sei ε > 0 beliebig gegeben. Da f und g beide integrierbar
sind, existieren wegen Satz 7.10 Partitionen P1 und P2 des Intervalls [a, b] mit
OP1 (f ) − UP1 (f ) <
ε
2(1 + |α| + |β|)
und OP2 (g) − UP2 (g) <
ε
.
2(1 + |α| + |β|)
Aus der Definition von h folgt zunächst
h(x) − h(y) ≤ |α| f (x) − f (y) + |β| g(x) − g(y) für alle x, y ∈ [a, b].
Mit der verfeinerten Partition P := P1 ∪ P2 von [a, b] in gewisse Teilintervalle Ik =
[xk−1 , xk ], k = 1, . . . , n, ergibt sich unter Verwendung von (7.7) dann
OP (h) − UP (h)
n
X
Mk (h) − mk (h) (xk − xk−1 )
=
k=1
=
n
X
k=1
≤ |α|
= |α|
sup h(x) − h(y)(xk − xk−1 )
x,y∈Ik
n
X
k=1
n
X
n
X
sup g(x) − g(y)
sup f (x) − f (y) + |β|
x,y∈Ik
k=1
x,y∈Ik
n
X
Mk (g) − mk (g) (xk − xk−1 )
Mk (f ) − mk (f ) (xk − xk−1 ) + |β|
k=1
k=1
= |α| OP (f ) − UP (f ) + |β| OP (g) − UP (g)
ε ε
<
+
2 2
= ε.
Also ist h nach Satz 7.10 integrierbar.
Christian Kanzow, Universität Würzburg, WS 2010/11
218
KAPITEL 7. DAS RIEMANN–INTEGRAL
Die Darstellung (7.8) schließlich ergibt sich unmittelbar aus dem Satz 7.20, denn für
die Zwischensumme gilt offenbar SP (αf + βg, ξ) = αSP (f, ξ) + βSP (g, ξ).
2
Aufgrund des vorhergehenden Resultates ist die Abbildung
Z b
f 7→
f (x)dx
a
linear. Wir beweisen als Nächstes eine Monotonie–Eigenschaft des Integrals.
Lemma 7.24 ( Monotonie des Integrals )
Seien f, g : [a, b] → R integrierbar mit f (x) ≤ g(x) für alle x ∈ [a, b]. Dann gilt
Z
b
a
f (x)dx ≤
Z
b
g(x)dx.
a
Beweis: Die Funktion h := g − f ist wegen des Satzes 7.23 integrierbar auf [a, b]. Sei nun
P = {x0 , x1 , . . . , xn } eine beliebige Partition von [a, b]. Aus h(x) ≥ 0 für alle x ∈ [a, b] folgt
dann mk (h) ≥ 0 für alle k = 0, 1, . . . , n und daher
X
UP (h) =
mk (h)(xk − xk−1 ) ≥ 0,
P
was wiederum
Zb
h(x)dx = sup UP (h) ≥ 0
P
a
impliziert. Da h aber integrierbar ist, folgt hieraus
0≤
Zb
h(x)dx =
a
Zb
h(x)dx =
a
Zb
a
g(x)dx −
Zb
f (x)dx.
a
Dies liefert die Behauptung.
2
Anschaulich ist die Aussage des Lemmas 7.24 in der Abbildung 7.5 wiedergegeben: Dort
finden sich zwei Abbildungen (mit ausschließlich positiven Funktionswerten), von denen
die eine oberhalb der anderen liegt, so dass die zugehörige Fläche unterhalb des Graphen
auch entsprechend größer ist. Genau dies wird letztlich auch nur durch das Lemma 7.24
ausgedrückt.
Aus dem Lemma 7.24 erhalten wir insbesondere die Gültigkeit von
Z b
f (x)dx ≥ 0
a
Christian Kanzow, Universität Würzburg, WS 2010/11
7.4. RECHENREGELN
219
g
f
x
a
b
Abbildung 7.5: Veranschaulichung der Monotonie des Integrals
für jede integrierbare Funktion f : [a, b] → R mit der Eigenschaft f (x) ≥ 0 für alle x ∈ [a, b]
(man vergleiche f hierzu mit der Nullfunktion).
Für eine gegebene Funktion f : [a, b] → R benutzen wir im Folgenden die Bezeichnungen
+
f , f − : [a, b] → R für die Abbildungen
f (x), falls f (x) ≥ 0,
+
f (x) :=
0,
falls f (x) < 0
und
−
f (x) :=
−f (x), falls f (x) < 0,
0,
falls f (x) ≥ 0,
vergleiche hierzu die Abbildung 7.6.
f+
f−
f
x
f
x
Abbildung 7.6: Beispiel einer Funktion f und der zugehörigen Abbildungen f + und f −
Aus diesen Definitionen folgt unmittelbar
f (x) = f + (x) − f − (x) und |f (x)| = f + (x) + f − (x) für alle x ∈ [a, b].
Wir beweisen zunächst das folgende Hilfsresultat.
Lemma 7.25 Sei f : [a, b] → R eine beschränkte Funktion. Dann ist f genau dann integrierbar auf [a, b], wenn f + und f − auf [a, b] integrierbar sind.
Christian Kanzow, Universität Würzburg, WS 2010/11
220
KAPITEL 7. DAS RIEMANN–INTEGRAL
Beweis: Die Integrierbarkeit von f + und f − impliziert wegen Satz 7.23 und der oben
erwähnten Beziehung f = f + − f − unmittelbar die Integrierbarkeit von f (man beachte
hierzu, dass mit f natürlich auch f + und f − integrierbar sind). Daher ist nur die andere
Richtung zu beweisen.
Wir verifizieren die Aussage nur für f + , da der Beweis für f − analog verläuft. Sei dazu
P eine beliebige Partition von [a, b]. Wir setzen
+
Mk+ := sup f + (x) und m+
k := inf f (x).
x∈Ik
x∈Ik
Dann können die folgenden Möglichkeiten eintreten:
(a) Mk ≥ 0, mk ≥ 0: Dann ist Mk+ = Mk und m+
k = mk .
(b) Mk ≥ 0, mk < 0: Dann ist Mk+ = Mk und m+
k = 0.
(c) Mk < 0, mk < 0: Dann ist Mk+ = 0 und m+
k = 0.
In allen drei Fällen ergibt sich
Mk+ − m+
k ≤ Mk − mk .
Nach Multiplikation mit (xk −xk−1 ) und anschließendem Aufsummieren erhalten wir daher
OP (f + ) − UP (f + ) ≤ OP (f ) − UP (f ).
Da f als integrierbar vorausgesetzt war, folgt hieraus wegen Satz 7.10 unmittelbar die Integrierbarkeit von f + .
2
Als Konsequenz des Lemmas 7.25 erhalten wir das nachstehende Resultat.
Satz 7.26 ( Dreiecksungleichung für Integrale )
Sei f : [a, b] → R integrierbar. Dann ist |f | ebenfalls auf [a, b] integrierbar, und es gilt
Z b
Z b
f (x)dx ≤
|f (x)|dx.
a
a
Beweis: Wegen |f | = f + + f − folgt die Integrierbarkeit der Funktion |f | auf [a, b] aus
dem Satz 7.23 und dem Lemma 7.25. Ferner gilt
Z b
Z b
Z b
+
f (x)dx =
f (x)dx +
f − (x)dx.
a
a
a
Dies impliziert einerseits
Z b
Z b
Z b
Z b
+
−
f (x)dx ≥
f (x)dx −
f (x)dx =
f (x)dx
a
a
a
a
Christian Kanzow, Universität Würzburg, WS 2010/11
7.4. RECHENREGELN
und andererseits
Z
b
a
f (x)dx ≥ −
Z
b
+
f (x)dx +
a
Z
b
−
f (x)dx = −
a
221
Z
b
f (x)dx
a
wegen Lemma 7.24. Zusammen ergibt sich gerade die Behauptung.
2
Wir zeigen jetzt, dass mit zwei integrierbaren Funktionen auch deren Produkt integrierbar
ist.
Satz 7.27 Seien f, g : [a, b] → R integrierbare Funktionen. Dann ist auch f · g integrierbar
auf [a, b].
Beweis: Als integrierbare Funktionen sind f und g beschränkt. Also existieren die Konstanten
α := sup f (ξ) und β := sup g(ξ).
ξ∈[a,b]
ξ∈[a,b]
Ferner gibt es wegen Satz 7.10 Partitionen P1 und P2 von [a, b] mit
OP1 (f ) − UP1 (f ) <
ε
2(1 + α + β)
und OP2 (g) − UP2 (g) <
ε
.
2(1 + α + β)
Setzen wir h := f · g, so gilt
h(x) − h(y) ≤ f (x) g(x) − g(y) + g(y) f (x) − f (y)
≤ αg(x) − g(y) + β f (x) − f (y)
für alle x, y ∈ [a, b]. Mit der verfeinerten Partition P := P1 ∪ P2 von [a, b] in gewisse
Teilintervalle Ik = [xk−1 , xk ], k = 1, . . . , n, ergibt sich unter Verwendung von (7.7) dann
OP (h) − UP (h)
n
X
Mk (h) − mk (h) (xk − xk−1 )
=
k=1
=
n
X
sup h(x) − h(y)(xk − xk−1 )
x,y∈Ik
k=1
n
X
≤ α
= α
k=1
n
X
k=1
n
X
sup f (x) − f (y)(xk − xk−1 )
sup g(x) − g(y) (xk − xk−1 ) + β
x,y∈Ik
Mk (g) − mk (g) (xk − xk−1 ) + β
k=1
n
X
k=1
= α OP (g) − UP (g) + β OP (f ) − UP (f )
ε ε
<
+
2 2
x,y∈Ik
Mk (f ) − mk (f ) (xk − xk−1 )
Christian Kanzow, Universität Würzburg, WS 2010/11
222
KAPITEL 7. DAS RIEMANN–INTEGRAL
= ε.
Die Behauptung folgt somit aus dem Satz 7.10.
2
Korollar 7.28 Seien f, g : [a, b] → R integrierbar und |g(x)| ≥ c für alle x ∈ [a, b] mit
einer Konstanten c > 0. Dann ist auch f /g integrierbar auf [a, b].
Beweis: Wegen Korollar 7.15 ist 1/g integrierbar, also ist auch f /g = f · 1/g integrierbar
nach Satz 7.27.
2
Wir zeigen jetzt, dass eine auf einem Intervall [a, b] integrierbare Funktion automatisch
auch auf jeden Teilintervall [c, d] ⊆ [a, b] integrierbar ist.
Satz 7.29 Sei f : [a, b] → R integrierbar. Dann ist f auch auf jedem Teilintervall [c, d] ⊆
[a, b] integrierbar.
Beweis: Da f auf [a, b] integrierbar ist, existiert zu jedem ε > 0 wegen Satz 7.10 eine
Partition P ′ von [a, b] mit
OP ′ (f ) − UP ′ (f ) < ε.
Wir betrachten dann die Verfeinerung P ′′ := P ∪ {c, d}, für die wegen Lemma 7.3 dann
erst recht
OP ′′ (f ) − UP ′′ (f ) < ε
gilt. Sei nun P := P ′′ ∩ [c, d] die Restriktion der Partition P ′′ auf das Teilintervall [c, d].
Dann gilt mit g := f |[c,d] die Abschätzung
X
Mk (g) − mk (g) (xk − xk−1 )
OP (g) − UP (g) =
P
=
X
P
≤
X
P ′′
Mk (f ) − mk (f ) (xk − xk−1 )
Mk (f ) − mk (f ) (xk − xk−1 )
= OP ′′ (f ) − UP ′′ (f )
< ε,
wobei die erste Ungleichung einfach aus der Tatsache folgt, dass eventuell weitere nichtnegative Summanden hinzukommen. Die Behauptung folgt daher aus dem Satz 7.10.
2
Wir beweisen jetzt noch eine wichtige Additionseigenschaft des Riemann–Integrals bezüglich
der Integrationsintervalle.
Satz 7.30 Sei P = {x0 , x1 , . . . , xn } eine beliebige Partition des Intervalls [a, b]. Dann
gelten:
Christian Kanzow, Universität Würzburg, WS 2010/11
7.4. RECHENREGELN
223
(a) Ist f : [a, b] → R integrierbar, so ist f auf jedem der Teilintervalle [xk−1 , xk ] integrierbar, und es gilt
Z b
n Z xk
X
f (x)dx =
f (x)dx.
a
k=1
xk−1
(b) Ist f auf jedem der Teilintervalle [xk−1 , xk ] integrierbar, so auch auf [a, b], und es gilt
Z
b
f (x)dx =
a
n Z
X
k=1
xk
f (x)dx.
xk−1
Beweis: Der Beweis ist weitgehend analog zu dem des Satzes 7.29 und sei daher dem
Leser als Übungsaufgabe überlassen.
2
Eine interessante Folgerung aus dem obigen Resultat ist der nächste Satz.
Satz 7.31 Seien f : [a, b] → R integrierbar und [an , bn ] ⊆ [a, b] gegeben mit an → a und
bn → b. Dann ist
Z b
Z bn
f (x)dx.
f (x)dx = lim
n→∞
a
an
Beweis: Als integrierbare Funktion ist f insbesondere beschränkt auf [a, b], etwa
f (x) ≤ M für alle x ∈ [a, b]
mit einer Konstanten M > 0. Wegen Satz 7.30 ist
Z b
Z bn
Z b
Z an
f (x)dx,
f (x)dx +
f (x)dx +
f (x)dx =
a
a
bn
an
wobei wir ohne Einschränkung an < bn für alle n ∈ N vorausgesetzt haben. Mit
Z an
Z an
f (x)dx
f (x)dx ≤
a
Za an
Mdx
≤
a
Z an
1dx
= M
a
= M(an − a)
→ 0 für n → ∞
und, analog,
Z b
f (x)dx ≤ M(b − bn ) → 0 für n → ∞
bn
Christian Kanzow, Universität Würzburg, WS 2010/11
224
KAPITEL 7. DAS RIEMANN–INTEGRAL
folgt dann die Behauptung.
2
Aus dem Satz 7.31 folgt beispielsweise sofort, dass die Werte f (a) und f (b) weder auf die
Integrierbarkeit von f noch auf den Wert des Integrals
Z b
f (x)dx
a
einen Einfluss haben (solange f integrierbar und insbesondere beschränkt ist). Aufgrund
des Satzes 7.30 folgt hieraus wiederum, dass man f an endlich vielen Stellen abändern darf,
ohne damit die Integrierbarkeit von f oder den Wert des Integrals zu beeinflussen.
7.5
Differentiation und Integration
Wir beweisen in diesem Abschnitt einige der fundamentalen Resultate über das Riemann–
Integral, mit deren Hilfe sich diverse Integrale auch leicht berechnen lassen. Insbesondere
ergibt sich hierbei ein interessanter Zusammenhang zwischen der Differentiation und Integration. Zu diesem Zweck beginnen wir mit dem folgenden Resultat.
Satz 7.32 ( Verallgemeinerter Mittelwertsatz der Integralrechnung )
Seien f, g : [a, b] → R stetige Funktionen und g ≥ 0. Dann existiert ein ξ ∈ [a, b] mit
Z b
Z b
f (x)g(x)dx = f (ξ)
g(x)dx.
a
a
Beweis: Wir setzen
und M := max f (x) x ∈ [a, b]
m := min f (x) x ∈ [a, b]
(Minimum und Maximum werden hierbei wegen Satz 4.47 angenommen). Dann ist mg ≤
f · g ≤ Mg wegen g ≥ 0 und daher
Z b
Z b
Z b
Z b
Z b
m
g(x)dx =
(mg)(x)dx ≤
(f g)(x)dx ≤
(Mg)(x)dx = M
g(x)dx
a
a
a
a
a
wegen Lemma 7.24. Also ist
Z b
Z b
f (x)g(x)dx = µ
g(x)dx für ein µ ∈ [m, M].
a
a
Nach dem Zwischenwertsatz 4.29 gibt es ein ξ ∈ [a, b] mit f (ξ) = µ. Daraus folgt die
Behauptung.
2
Der Satz 7.32 gilt natürlich auch dann, wenn g(x) ≤ 0 für alle x ∈ [a, b] ist. Dies folgt sofort
aus dem obigen Resultat, indem man dort g durch −g ersetzt. Wesentlich für die Aussage
Christian Kanzow, Universität Würzburg, WS 2010/11
7.5. DIFFERENTIATION UND INTEGRATION
225
des Satzes 7.32 ist also nur, dass g auf dem Intervall [a, b] ein einheitliches Vorzeichen
besitzt.
Speziell für die Funktion g ≡ 1 erhalten wir hieraus das nachstehende Korollar, für
dessen geometrische Deutung wir auf die Abbildung 7.7 verweisen.
f (x)
f (ξ)
f (ξ) · (b − a)
ξ
a
b
Abbildung 7.7: Geometrische Deutung des Mittelwertsatzes der Integralrechung
Korollar 7.33 ( Mittelwertsatz der Integralrechnung )
Sei f : [a, b] → R eine stetige Funktion. Dann existiert ein ξ ∈ [a, b] mit
Z b
f (x)dx = f (ξ)(b − a).
a
Bislang haben wir Funktionen immer über ein festes (abgeschlossenes) Intervall integriert.
Jetzt betrachten wir eine Integrationsgrenze als Variable und erhalten auf diese Weise eine
neue Funktion.
Satz 7.34 Seien I ⊆ R ein Intervall, f : I → R eine stetige Funktion und a ∈ I. Für
x ∈ I setze
Z x
F (x) :=
f (t)dt.
a
Dann ist die Funktion F : I → R differenzierbar, und es gilt F ′ = f .
Beweis: Für jedes h 6= 0 ist
1
F (x + h) − F (x)
=
h
h
Z
x+h
a
f (t)dt −
Z
x
a
Z
1 x+h
f (t)dt
f (t)dt =
h x
wegen Satz 7.30. Nach dem Mittelwertsatz der Integralrechnung existiert zu jedem solchen
h 6= 0 ein Zwischenpunkt ξh ∈ [x, x + h] (bzw. ξh ∈ [x + h, x], falls h < 0) mit
Z x+h
f (t)dt = hf (ξh ).
x
Christian Kanzow, Universität Würzburg, WS 2010/11
226
KAPITEL 7. DAS RIEMANN–INTEGRAL
Nun ist ξh → x für h → 0 und daher f (ξh ) → f (x) für h → 0 aufgrund der Stetigkeit von
f . Damit erhalten wir
Z
F (x + h) − F (x)
1
1 x+h
′
F (x) = lim
f (t)dt = lim hf (ξh ) = f (x).
= lim
h→0
h→0 h
h→0 h x
h
Damit ist alles bewiesen.
2
Die im Satz 7.34 definierte Abbildung F ist eine so genannte Stammfunktion von f im
Sinne der nachstehenden Definition.
Definition 7.35 Sei I ⊆ R ein beliebiges Intervall. Eine differenzierbare Funktion F :
I → R heißt Stammfunktion von einer Abbildung f : I → R, wenn Funktion F ′ = f gilt.
Der Begriff der Stammfunktion wird in der Abbildung 7.8 interpretiert: Sie beschreibt die
Fläche unterhalb des Graphen von f zwischen dem Anfangspunkt a und dem aktuellen
Punkt x.
f
F (x)
x
a
x
b
Abbildung 7.8: Interpretation der Stammfunktion als Fläche von a nach x mit variablem
x
Wegen Satz 7.34 hat jede stetige Funktion mindestens eine Stammfunktion. Mit Ausnahme einer additiven Konstante, die beim Differenzieren ja wegfällt, ist die Stammfunktion auch eindeutig bestimmt. Dies ist der Inhalt des folgenden Satzes.
Satz 7.36 Seien I ⊆ R ein beliebiges Intervall und F : I → R eine Stammfunktion von
f : I → R. Dann gelten:
(a) Die Funktion F + c ist für jede Konstante c ∈ R ebenfalls eine Stammfunktion von
f.
(b) Ist G : I → R eine weitere Stammfunktion von f , so gibt es eine Konstante c ∈ R
mit G = F + c.
Christian Kanzow, Universität Würzburg, WS 2010/11
7.5. DIFFERENTIATION UND INTEGRATION
227
Beweis: (a) Offenbar ist mit F auch F + c differenzierbar, und es gilt
(F + c)′ = F ′ = f,
womit Teil (a) bereits bewiesen ist.
(b) Da F und G Stammfunktionen von f sind, gilt F ′ = f = G′ . Also ist (F − G)′ = 0
und F − G somit eine konstante Funktion wegen Korollar 6.19.
2
Die Menge aller Stammfunktionen von f : I → R wird als das unbestimmte Integral von f
bezeichnet. Man schreibt hierfür
Z
f (x)dx.
Ist F eine beliebige Stammfunktion, so gilt wegen Satz 7.36 also
Z
f (x)dx = F + c c ∈ R .
Mittels einer Stammfunktion lässt sich das Integral einer gegebenen Abbildung sehr leicht
berechnen.
Satz 7.37 ( Hauptsatz der Differential– und Integralrechnung )
Seien I ⊆ R ein Intervall, f : I → R eine stetige Funktion und F eine beliebige Stammfunktion von f . Dann gilt
Z b
b
f (x)dx = F (b) − F (a) =: F (x)
a
a
für alle a, b ∈ I.
Beweis: Für x ∈ I definieren wir
F0 (x) :=
Z
x
f (t)dt.
a
Dann ist F0 : I → R wegen Satz 7.34 eine (spezielle) Stammfunktion von f mit
Z b
F0 (a) = 0 und F0 (b) =
f (t)dt.
a
Für die beliebige Stammfunktion F gilt somit F − F0 = c für eine Konstante c ∈ R,
vergleiche Satz 7.36. Deshalb ist
Z b
F (b) − F (a) = F0 (b) − F0 (a) = F0 (b) =
f (t)dt,
a
womit alles bewiesen ist.
Christian Kanzow, Universität Würzburg, WS 2010/11
2
228
KAPITEL 7. DAS RIEMANN–INTEGRAL
Der Satz 7.37 ist das zentrale Ergebnis zur Berechnung konkreter Integrale. Man benötigt
danach nur eine Stammfunktion und hat von dieser lediglich die Differenz der Funktionswerte zwischen den beiden Endpunkten des Intervalls [a, b] zu bilden. Insbesondere spielt
es überhaupt keine Rolle, welche Werte die Stammfunktion im Inneren des Intervalls [a, b]
annimmt. Wir illustrieren die Nützlichkeit dieses Resultates an einigen Beispielen.
Beispiel 7.38
(a) Für jedes s ∈ R mit s 6= −1 ist
Z
xs+1 b
x dx =
,
s+1 a
b
s
a
s+1
denn xs+1 ist offenbar eine Stammfunktion der allgemeinen Potenz xs . Der hier nicht
betrachtete Fall s = −1 wird im Teil (b) diskutiert.
(b) Für jedes a, b > 0 ist
Z
b
a
wegen
d
dx
ln(x) =
1
.
x
Für a, b < 0 gilt hingegen
Z
b
a
d
ln(−x) =
denn dx
dass man
1
x
b
1
dx = ln(x)
a
x
b
1
dx = ln(−x) ,
a
x
für x < 0. Man kann die beiden Fälle auch so zusammenfassen,
Z
a
b
b
1
dx = ln |x| a
x
schreibt, sofern x = 0 nicht in dem Integrationsintervall [a, b] liegt.
(c) Es ist
Z
b
a
b
exp(x)dx = exp(x) .
a
3
Wegen Satz 7.34 ist die Integration letztlich die Umkehrung der Differentiation. Das der
Kettenregel entsprechende Resultat in der Integration ist die nachfolgende Substitutionsregel.
Satz 7.39 ( Substitutionsregel )
Seien I ⊆ R ein Intervall, f : I → R stetig und g : [a, b] → R stetig differenzierbar mit
g([a, b]) ⊆ I. Dann ist
Z b
Z g(b)
′
f g(t) g (t)dt =
f (x)dx.
a
g(a)
Christian Kanzow, Universität Würzburg, WS 2010/11
7.5. DIFFERENTIATION UND INTEGRATION
229
Beweis: Sei F : I → R eine wegen Satz 7.34 existierende Stammfunktion von f . Für die
zusammengesetzte Funktion F ◦ g : [a, b] → R gilt nach der Kettenregel dann
(F ◦ g)′ (t) = F ′ g(t) g ′(t) = f g(t) g ′(t).
Also ist F ◦ g eine Stammfunktion der Abbildung t 7−→ f g(t) g ′ (t). Aus dem Hauptsatz
7.37 folgt daher
Z
b
a
Z
b
′
f g(t) g (t)dt = (F ◦ g)(t) = F g(b) − F g(a) =
a
g(b)
f (x)dx,
g(a)
was zu zeigen war.
2
Unter Verwendung der symbolischen Schreibweise
dg(t) := g ′ (t)dt
lautet die Substitutionsregel
Z
b
f g(t) dg(t) =
a
Z
g(b)
f (x)dx.
g(a)
In dieser Form ist sie besonders einfach zu merken, denn man hat einfach x durch g(t) zu
ersetzen. Läuft t von a nach b, so läuft x = g(t) von g(a) nach g(b).
Ansonsten gibt es für die Substitutionsregel im Prinzip zwei Lesarten, man kann sie
entweder von links nach rechts oder von rechts nach links anwenden. Liegt ein Integral
explizit in der Form
Z b
f (g(t))g ′(t)dt
a
vor, so können wir die Substitutionsregel von links nach rechts anwenden. Dies ist beispielsweise bei dem Integral
Z
1
(1 + t2 )2 2tdt
0
2
der Fall. Setzt man nämlich f (x) := x und g(t) := 1+t2 , so folgt aus der Substitutionsregel
unmittelbar
Z 1
Z 1
Z g(1)
Z 2
1 2 7
2 2
′
(1 + t ) 2tdt =
f (g(t))g (t)dt =
f (x)dx =
x2 dx = x3 1 = .
3
3
0
0
g(0)
1
Die andere Lesart von rechts nach links wird meist auf der Schule beigebracht. Dabei liegt
ein Integral der Gestalt
Z β
f (x)dx
α
Christian Kanzow, Universität Würzburg, WS 2010/11
230
KAPITEL 7. DAS RIEMANN–INTEGRAL
mit gewissen Grenzen α, β ∈ R vor, das schwer zu berechnen scheint. Man versucht dann
mittels geeigneter Substitution x = g(t), dieses Integral umzuformulieren, so dass die
Substitutionsregel anwendbar ist, wobei g(a) = α und g(b) = β gelten muss. Betrachten
wir beispielsweise das Integral
Z r√
r 2 − x2 dx
0
√
für ein gegebenes r > 0. Hier ist also f (x) = r 2 − x2 . Mit der Substitution x = g(t) :=
r sin t für t ∈ [0, π/2] ist dann g(0) = 0, g(π/2) = r und daher aufgrund der Substitutionsregel
Z r√
Z g(π/2)
2
2
r − x dx =
f (x)dx
0
g(0)
=
Z
π/2
f (g(t))g ′(t)dt
0
=
Z
π/2
0
=
Z
π/2
q
r 2 − r 2 sin2 (t)r cos(t)dt
r 2 cos2 (t)dt
0
πr 2
=
,
4
wobei man die letzte Gleichheit aus der im Anschluss folgenden Regel der partiellen Integration herleiten kann, vergleiche Beispiel 7.42 (c).
Wir geben jetzt eine Reihe weiterer Beispiele zur Substitutionsregel.
Beispiel 7.40
(a) Mittels der Substitution g(t) = t + c folgt
Z b
Z b
Z g(b)
Z
′
f (t + c)dt =
f g(t) g (t)dt =
f (x)dx =
a
a
g(a)
b+c
f (x)dx.
a+c
(b) Für c 6= 0 erhält man mit der Substitution g(t) = ct
Z
Z
Z
Z b
′
1 g(b)
1 bc
1 b
f g(t) g (t)dt =
f (x)dx =
f (x)dx.
f (ct)dt =
c a
c g(a)
c ac
a
(c) Sei g : [a, b] → R eine stetig differenzierbare Funktion mit g(t) 6= 0 für alle t ∈ [a, b].
Mit Beispiel 7.38 (b) folgt dann (man setze f (x) := x1 in der Substitutionsregel)
Z
a
b
g ′ (t)
dt =
g(t)
=
Z
a
Z
b
f g(t) g ′(t)dt
g(b)
f (x)dx
g(a)
Christian Kanzow, Universität Würzburg, WS 2010/11
7.5. DIFFERENTIATION UND INTEGRATION
Z
231
g(b)
1
dx
g(a) x
g(b)
= ln |x| g(a)
b
= ln g(t) .
=
a
(d) Aus Beispiel (c) folgt mit g(t) = cos(t) für jedes Intervall [a, b] ⊆ (− π2 , + π2 )
Z b
Z b
Z b
b
sin t
− sin t
tan tdt =
dt = −
dt = − ln cos(t) .
cos t
a
a
a cos t
a
(e) Die Integration von rationalen Funktionen gelingt im Allgemeinen mittels der so genannten Partialbruchzerlegung, bei der man die rationale Funktion wie im Abschnitt
2.4 in Hauptteil und Polynomanteil zerlegt und anschließend die entstehenden Summanden (oft unter Verwendung der Substitutionsregel) einzeln integriert. Zur Illustration betrachten wir das Beispiel
Z b
1
dx, wobei − 1, 1 ∈
/ [a, b].
2
a 1−x
Partialbruchzerlegung von f (x) :=
1
1−x2
=
1
(1−x)(1+x)
liefert
1 1
1 1
1
=
+
.
2
1−x
21−x 21+x
Damit folgt
Z
b
a
Z
Z
1 b 1
1 b 1
1
dx =
dx +
dx
1 − x2
2 a 1−x
2 a 1+x
Z
Z
1 b 1
1 b 1
dx −
dx
=
2 a x+1
2 a x−1
b
1
=
ln |x + 1| − ln |x − 1| a
2 b
1 x + 1 ln
=
2 x − 1 a
wobei wir das Additionstheorem des natürlichen Logarithmus verwendet haben. 3
Die nachstehend formulierte Regel der partiellen Integration ist das Gegenstück zur Produktregel aus der Differentialrechnung.
Satz 7.41 ( Partielle Integration )
Seien f, g : [a, b] → R zwei stetig differenzierbare Funktionen. Dann gilt
Z b
b Z b
′
f ′ (x)g(x)dx.
f (x)g (x)dx = f (x)g(x) −
a
a
a
Christian Kanzow, Universität Würzburg, WS 2010/11
232
KAPITEL 7. DAS RIEMANN–INTEGRAL
Beweis: Die Abbildung F := f · g ist nach Voraussetzung stetig differenzierbar. Aus der
Produktregel folgt
F ′ (x) = f ′ (x)g(x) + f (x)g ′ (x).
Der Hauptsatz 7.37 liefert daher
Z b
Z b
b
b
′
f (x)g(x)dx +
f (x)g ′(x)dx = F (x) = f (x)g(x) ,
a
a
a
a
woraus die Behauptung unmittelbar folgt.
2
Wir illustrieren die Regel der partiellen Integration an einigen Beispielen.
Rb
Beispiel 7.42 (a) Seien a, b > 0. Zur Berechnung von a ln(x)dx setzen wir f (x) :=
ln(x), g(x) := x. Dann folgt
Z b
Z b
ln(x)dx =
f (x)g ′(x)dx
a
a
b Z b
f ′ (x)g(x)dx
= f (x)g(x) −
a
a
b Z b
1dx
= x ln(x) −
a
a
b
= x ln(x) − 1 .
a
Rb
(b) Zur Bestimmung von a arctan(x)dx setzen wir f (x) := arctan(x), g(x) := x. Damit
1
d
arctan(x) = 1+x
erhalten wir wegen dx
2 (vergleiche Beispiel 6.10 (c))
Z
b
arctan(x)dx =
a
=
=
=
=
=
Z
b
f (x)g ′ (x)dx
a
b Z b
f ′ (x)g(x)dx
f (x)g(x) −
a
a
b Z b x
dx
x · arctan(x) −
2
a
a 1+x
b 1 Z b2 1
x · arctan(x) −
dt
2 a2 1 + t
a
b2
b 1
x · arctan(x) − ln(1 + t)
2
a2
a
b 1
b
x · arctan(x) − ln(1 + x2 ) ,
a
a
2
wobei wir neben der Regel der partiellen Integration auch die Substitution t = x2
verwendet haben.
Christian Kanzow, Universität Würzburg, WS 2010/11
7.5. DIFFERENTIATION UND INTEGRATION
233
(c) Als Ergänzung zu den Ausführungen vor dem Beispiel 7.40 wollen wir hier das unbestimmte Integral
Z
cos2 (x)dx
berechnen. Durch partielle Integration sowie unter Ausnutzung der bekannten Identität sin2 (x) + cos2 (x) = 1 ergibt sich
Z
Z
2
cos (x)dy =
cos(x) cos(x) dx
| {z } | {z }
=:f (x) =:g ′ (x)
= cos(x) sin(x) +
Z
sin2 (x)dx
Z
1 − cos2 (x) dx
Z
Z
2
= cos(x) sin(x) − cos (x)dx + 1dx.
= cos(x) sin(x) +
Dies liefert die Formel
Z
1
1
cos (x)dx = cos(x) sin(x) +
2
2
2
Z
1dx.
Speziell für das Beispiel vor 7.40 erhalten wir damit
Z π
Z π
2
2
2
2
2
r cos (t)dt = r
cos2 (t)
0
0
π r 2 Z π2
r2
2
=
1dx
cos(t) sin(t) +
0
2
2 0
r2π
=
4
also das gewünschte Ergebnis.
(d) In Verallgemeinerung des vorigen Beispiels wollen wir hier eine Rekursionsformel für
das unbestimmte Integral
Z
Im := sinm (x)dx
herleiten, wir suchen also eine Stammfunktion für sinm (x). Offenbar ist
Z
Z
0
I0 = sin (x)dx = x und I1 = sin xdx = − cos x.
Für m ≥ 2 folgt durch partielle Integration
Z
Im = − sinm−1 (x) cos(x)′ dx
Christian Kanzow, Universität Würzburg, WS 2010/11
234
KAPITEL 7. DAS RIEMANN–INTEGRAL
= − cos(x) sin
m−1
(x) + (m − 1)
Z
cos2 (x) sinm−2 (x)dx
Z
1 − sin2 (x) sinm−2 (x)dx
Z
Z
m−1
m−2
= − cos(x) sin
(x) + (m − 1) sin
(x)dx − (m − 1) sinm (x)dx
= − cos(x) sin
m−1
(x) + (m − 1)
= − cos(x) sinm−1 (x) + (m − 1)Im−2 − (m − 1)Im .
Diese Gleichung kann man nach Im auflösen und erhält
Im = −
m−1
1
cos(x) sinm−1 (x) +
Im−2
m
m
für jedes m ≥ 2.
7.6
3
Die Lp–Normen
Im Abschnitt 6.6 haben wir gesehen, dass man den Raum Kn mittels der lp –Normen
Pn
1/p
( i=1 |zi |p ) , falls p ∈ [1, +∞)
kzkp :=
maxi=1,...,n |zi |, falls p = +∞
zu einem normierten Raum machen kann, wobei K wieder für R oder C steht. Wir wollen
in diesem Abschnitt analog vorgehen und den Raum
C([a, b]) := f : [a, b] → R f ist stetig
der auf dem kompakten Intervall [a, b] stetigen Funktionen normieren. Dazu ersetzen wir
in der Definition von kzkp im Wesentlichen nur die Summe durch ein Integral und erhalten
somit die so genannten Lp -Normen
( R
1/p
b
p
|f (x)| dx
, falls p ∈ [1, +∞),
a
kf kLp :=
(7.9)
maxx∈[a,b] |f (x)|,
falls p = +∞
als Kandidaten für geeignete Normen auf C([a, b]). Der Rest dieses Abschnitts besteht vor
allem darin, die Norm–Eigenschaften für diese Vorschriften zu verifizieren. Für p = 1 und
p = +∞ ist dies relativ einfach, für p ∈ (1, +∞) ist der Aufwand hingegen etwas größer
und bedarf daher einiger Vorbereitungen. Wir beginnen unsere Ausführungen mit dem
folgenden Resultat.
Lemma 7.43 Sei p ∈ [1, +∞] beliebig gegeben. Dann gilt
kf kLp = 0 ⇐⇒ f ≡ 0
für jedes f ∈ C([a, b]).
Christian Kanzow, Universität Würzburg, WS 2010/11
(7.10)
7.6. DIE LP –NORMEN
235
Beweis: Aus f ≡ 0 folgt offensichtlich kf kLp = 0 für jedes p ∈ [1, +∞]. Sei also umgekehrt
f eine stetige Funktion mit kf kLp = 0. Für p = +∞ ergibt sich dann sofort f ≡ 0, so
dass wir im Folgenden p ∈ [1, +∞) voraussetzen dürfen. Angenommen, f ist nicht die
Nullfunktion. Dann existiert ein ξ ∈ (a, b) mit f (ξ) 6= 0 (zunächst existiert nur ein ξ ∈ [a, b]
mit f (ξ) 6= 0, gilt dabei ξ = a oder ξ = b, so können wir den Punkt ξ etwas nach rechts
bzw. links verschieben und erhalten dann aus Stetigkeitsgründen ein ξ aus dem offenen
Intervall (a, b) mit der Eigenschaft f (ξ) 6= 0).
Setze nun ε := |f (ξ)|/2 > 0. Da f stetig ist, existiert ein zugehöriges δ > 0 mit
f (x) − f (ξ) < ε für alle x ∈ [a, b] mit |x − ξ| < δ.
Wegen ξ ∈ (a, b) können wir dabei voraussetzen, dass δ > 0 bereits so klein gewählt ist,
dass jedes x ∈ R mit |x − ξ| < δ automatisch in dem Intervall [a, b] liegt. Dann folgt
zunächst
f (x) ≥ f (ξ) − f (x) − f (ξ) > f (ξ) − ε = 1 f (ξ)
2
für alle x ∈ R mit |x − ξ| < δ und daher
kf kLp =
≥
≥
Z
b
a
Z
1/p
f (x)p dx
ξ+δ
ξ−δ
Z
ξ+δ
ξ−δ
1/p
p
f (x) dx
!1/p
!
f (ξ) p
dx
2
1 f (ξ) · (2δ)1/p
2
> 0
=
aufgrund der Monotonie des Integrals. Dies widerspricht jedoch unserer Voraussetzung
2
kf kLp = 0.
Der obige Beweis benutzt ganz entscheidend die Stetigkeit der Funktion f . In der Tat
dürfte jetzt auch klar sein, warum wir (zumindest zu diesem Zeitpunkt) die Lp -Normen
auf dem Raum der stetigen statt beispielsweise der Riemann–integrierbaren Funktionen
einführen (was vielleicht naheliegender wäre): Für Riemann–integrierbare Funktionen gilt
die Äquivalenz (7.10) nämlich nicht. Beispielsweise könnten wir die Nullfunktion an endlich
vielen Stellen des Intervalls [a, b] abändern und würden immer noch kf kLp = 0 erhalten.
Somit kann die Vorschrift kf kLp keine Norm auf dem Raum der Riemann–integrierbaren
Funktionen liefern!
Wir kehren damit wieder zurück zum Raum der stetigen Funktionen. Die nachstehenden
Ausführungen entsprechen fast wörtlich denen des Abschnitts 6.6.
Christian Kanzow, Universität Würzburg, WS 2010/11
236
KAPITEL 7. DAS RIEMANN–INTEGRAL
Satz 7.44 ( Höldersche Ungleichung für Integrale )
Seien p, q ∈ (1, +∞) zwei Zahlen mit 1p + 1q = 1. Dann gilt
Z b
Z b
f (x)g(x)dx ≤ kf kLp · kgkLq
f (x)g(x)dx ≤
a
a
für alle f, g ∈ C([a, b]).
Beweis: Die erste Ungleichung ist gerade die schon aus dem Lemma 7.24 bekannt Monotonie des Integrals. Wir haben daher nur die zweite Ungleichung zu verifizieren. Dies
gelingt im Prinzip völlig analog zum Beweis des entsprechenden Satzes 6.31.
Wir können kf kLp 6= 0 und kgkLq 6= 0 voraussetzen, da die Behauptung anderenfalls
trivialerweise erfüllt ist, vergleiche das Lemma 7.43. Dann können wir die Ungleichung
zwischen dem arithmetischen und geometrischen Mittel aus dem Satz 6.30 anwenden mit
1
|f (x)|p
|g(x)|q
1
und
x
:=
r := 2, λ1 := , λ2 := , x1 :=
2
p
q
kf kpLp
kgkqLq
für ein festes (aber beliebiges) x ∈ [a, b]. Dies liefert
|f (x)| |g(x)|
1 |f (x)|p 1 |g(x)|q
·
= xλ1 1 · xλ2 2 ≤ λ1 x1 + λ2 x2 =
+
.
kf kLp kgkLq
p kf kpLp
q kgkqLq
Durch Integration von a nach b erhalten wir hieraus
Z b
1
f (x) · g(x)dx
kf kLp · kgkLq a
Z b
Z b
1
1
1
1
p
·
|f (x)| dx + ·
|g(x)|q dx
≤
p
q
p kf kLp a
q kgkLq a
|
|
{z
}
{z
}
=kf kpLp
=kgkqLq
1 1
+
p q
= 1,
=
wobei wir die Linearität des Integrals, die Dreiecksungleichung und die Monotonie des Integrals verwendet haben. Multiplikation der obigen Ungleichungskette mit kf kLp · kgkLq > 0
liefert nun die Behauptung.
2
Als wichtigen Spezialfall der Hölderschen Ungleichung erhalten wir im Fall p = q = 2 das
nachstehende Korollar.
Korollar 7.45 ( Cauchy–Schwarzsche Ungleichung für Integrale )
Für alle f, g ∈ C([a, b]) gilt die Ungleichung
Z b
Z b
Z b
1/2 Z b
1/2
2
2
f (x)g(x)dx ≤
f (x)g(x) dx ≤ kf kL2 ·kgkL2 =
f (x) dx
g(x) dx
.
a
a
a
Christian Kanzow, Universität Würzburg, WS 2010/11
a
7.6. DIE LP –NORMEN
237
Aus der Hölderschen Ungleichung erhalten wir außerdem das folgende Resultat.
Satz 7.46 ( Minkowskische Ungleichung für Integrale )
Sei p ∈ (1, +∞) gegeben. Dann gilt
kf + gkLp ≤ kf kLp + kgkLp
für alle f, g ∈ C([a, b]).
Beweis: Die Behauptung verifiziert man analog zum Beweis der Minkowskischen Ungleichung für ℓp –Normen, siehe Satz 6.33. Der Vollständigkeit halber soll der Beweis dennoch
durchgeführt werden.
p
Wir wählen q := p−1
, so dass 1p + 1q = 1 bzw. 1q = 1 − 1p = p−1
gilt. Dann folgt
p
k|f |
p−1
kLq
Z
Z b
1/q
(p−1)q 1/q b
p/q
p
=
f (x)
dx
=
|f (x)| dx
= kf kLp = kf kp−1
Lp .
a
(7.11)
a
Hieraus erhält man durch zweimalige Anwendung der Hölderschen Ungleichung
Z b
p
f (x) + g(x)p dx
kf + gkLp =
a
Z b
f (x) + g(x)p−1 · f (x) + g(x)dx
=
a
Z b
f (x) + g(x)p−1 f (x) + g(x) dx
≤
a
Z b
Z b
p−1 f (x) + g(x)p−1 · g(x)dx
=
f (x) + g(x)
· f (x) dx +
a
a
(nach Hölder)
≤ k|f + g|p−1kLq kf kLp + kgkLp
= kf + gkp−1
Lp kf kLp + kgkLp
für alle f, g ∈ C([a, b]), wobei die letzte Gleichheit aus (7.11) folgt. Division durch kf +gkp−1
Lp
liefert die Behauptung.
2
Nach diesen Vorbereitungen können wir nun das Hauptresultat dieses Abschnitts beweisen.
Satz 7.47 Die Lp -Normen aus (7.9) sind für alle 1 ≤ p ≤ +∞ Normen auf dem C([a, b]).
Beweis: Die Eigenschaft kf kLp ≥ 0 für alle 1 ≤ p ≤ +∞ und alle f ∈ C([a, b]) folgt
sofort aus der Monotonie des Integrals und der Definition der Lp -Normen in (7.9). Wegen
Lemma 7.43 gilt auch die Äquivalenz (7.10). Die Gültigkeit von kαf kLp = |α| · kf kLp für
alle f ∈ C([a, b]) und jedes α ∈ R ist ebenfalls eine unmittelbare Konsequenz der Definition
(7.9). Damit bleibt nur noch die Dreiecksungleichung zu verifizieren. Für p ∈ (1, +∞) ist
das aber gerade die Minkowskische Ungleichung aus dem Satz 7.46. Für p ∈ {1, +∞}
Christian Kanzow, Universität Würzburg, WS 2010/11
238
KAPITEL 7. DAS RIEMANN–INTEGRAL
hingegen kann man die Gültigkeit der Dreiecksungleichung direkt verifizieren. So folgt sie
für p = 1 aus
Z b
f (x) + g(x)dx
kf + gkL1 =
a
Z b
f (x) + g(x) dx
≤
a
Z b
Z b
g(x)dx
=
f (x) dx +
a
a
= kf kL1 + kgkL1 ,
während man für p = +∞
max f (x) + g(x)
x∈[a,b]
≤ max f (x) + g(x)
x∈[a,b]
≤ max f (x) + max g(x)
kf + gkL∞ =
x∈[a,b]
x∈[a,b]
= kf kL∞ + kgkL∞
erhält.
2
Häufig werden wir für die Lp –Norm einer stetigen Funktion f statt kf kLp auch nur kf kp
schreiben. Im Gegensatz zu dem mit den lp –Normen versehenen Raum Kn ist der Raum
C([a, b]) mit keiner der Lp –Normen (p < ∞) vollständig, also kein Banach–Raum. Dieser
Nachteil wird später die Einführung des Lebesgue–Integrals motivieren.
Bemerkung 7.48 (a) Sei
R([a, b]) := f : [a, b] → R | f ist Riemann–integrierbar
die Menge aller auf dem Intervall [a, b] Riemann–integrierbaren Funktionen. Dann lassen
sich die Ausdrücke kf kLp für jedes p ∈ [1, ∞) analog zu den obigen Ausführungen definieren. Es gelten auch fast alle Resultate aus diesem Abschnitt, lediglich die Richtung
kf kLp = 0 =⇒ f ≡ 0
aus dem Lemma 7.43 ist im Allgemeinen falsch (man denke an eine Funktion f , die lediglich
mit Ausnahme eines einzelnen Punktes gleich Null ist). Anders formuliert: Die Vorschrift
kf kLp definiert auf dem Vektorraum R([a, b]) keine Norm, sondern nur eine Halbnorm!
(b) Sei
B([a, b]) := f : [a, b] → R | f ist beschränkt
Christian Kanzow, Universität Würzburg, WS 2010/11
7.6. DIE LP –NORMEN
239
die Menge der auf [a, b] beschränkten Funktionen. Mit f, g ∈ B([a, b]) und α ∈ R sind
offenbar auch αf und f + g beschränkte Funktionen, also ist B([a, b]) ein Vektorraum, der
offenbar sowohl die Menge C([a, b]) aller auf [a, b] stetigen Funktionen als auch die Menge
R([a, b]) der auf [a, b] Riemann–integrierbaren Funktionen umfasst. In Verallgemeinerung
der bisherigen Definition können wir den Ausdruck
kf kL∞ := kf k∞ := sup |f (x)|
x∈[a,b]
nun auch für ein beliebiges (nicht notwendig stetiges oder Riemann–integrierbares) f ∈
B([a, b]) definieren. Man sieht relativ leicht ein, dass hierdurch ebenfalls eine Norm auf dem
Raum B([a, b]) definiert wird, die so genannte Supremumsnorm, mit welcher die Menge der
auf [a, b] beschränkten Funktionen also einen normierten Raum bildet. — Die Lp –Normen
für p < ∞ hingegen lassen sich nicht auf die Klasse B([a, b]) verallgemeinern, denn hierzu
wird explizit die Integrierbarkeit gewisser Abbildungen benötigt, die Beschränktheit alleine
reicht sicherlich nicht aus.
(c) Die Bemerkung (b) lässt sich noch weiter verallgemeinern: Sei X eine beliebige nichtleere
Menge und
B(X) := f : X → R | f ist beschränkt
die Menge der auf X beschränkten Funktionen. Die Menge B(X) ist ganz offensichtlich
wieder ein Vektorraum, der mittels der ebenfalls als Supremumsnorm bezeichneten Vorschrift
kf k∞ := sup |f (x)|
x∈X
zu einem normierten Raum wird. Diese Aussage lässt sich analog zu den vorigen Ausführungen beweisen, im Prinzip besteht dabei kein Unterschied, da die wesentlichen Abschätzungen nur den Betrag |f (x)| verwenden und damit wie zuvor in der Menge der reellen Zahlen
R verlaufen.
Christian Kanzow, Universität Würzburg, WS 2010/11
240
KAPITEL 7. DAS RIEMANN–INTEGRAL
Christian Kanzow, Universität Würzburg, WS 2010/11
Literaturverzeichnis
[1] M. Barner und F. Flohr: Analysis I. Walter De Gruyter, Berlin, 1974.
[2] E. Behrends: Analysis, Band 1. Vieweg–Verlag, Wiesbaden, 2. Auflage 2004.
[3] H.-D. Ebbinghaus, H. Hermes, F. Hirzebruch, M. Koecher, K. Mainzer,
A. Prestel und R. Remmert: Zahlen. Springer–Verlag, Berlin, 1983.
[4] K. Endl und W. Luh: Analysis I. Aula–Verlag, Wiesbaden, 8. Auflage 1986.
[5] O. Forster: Analysis 1. Vieweg–Verlag, Braunschweig, 4. Auflage 1983.
[6] O. Forster: Analysis 2. Vieweg–Verlag, Braunschweig, 5. Auflage 1984.
[7] H. Heuser: Lehrbuch der Analysis, Teil 1. Teubner–Verlag, Stuttgart, 4. Auflage
1986.
[8] S. Hildebrandt: Analysis 1. Springer–Verlag, Berlin, 2002.
[9] G. Köhler: Analysis. Heldermann Verlag, Lemgo, 2006.
[10] K. Königsberger: Analysis 1. Springer–Verlag, Berlin, 1990.
[11] W. Rudin: Principles of Mathematical Analysis. McGraw-Hill, Singapur, 3. Auflage
1976.
241
Herunterladen