Analysis 1

Analysis 1
August 2010
Michael Kaltenbäck
Inhaltsverzeichnis
1
Mengen und Abbildungen
1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Die reellen Zahlen
2.1 Algebraische Struktur der reellen Zahlen
2.2 Ordnungsstruktur der reellen Zahlen . .
2.3 Die natürlichen Zahlen . . . . . . . . .
2.4 Der Ring der ganzen Zahlen . . . . . .
2.5 Der Körper Q . . . . . . . . . . . . . .
2.6 Archimedisch angeordnete Körper . . .
2.7 Das Vollständigkeitsaxiom . . . . . . .
2.8 Die komplexen Zahlen . . . . . . . . .
3
1
1
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
11
16
26
34
39
40
46
Der Grenzwert
3.1 Metrische Räume . . . . . . . . . . . . . . .
3.2 Der Grenzwert in metrischen Räumen . . . .
3.3 Folgen reeller und komplexer Zahlen . . . . .
3.4 Existenz von Grenzwerten . . . . . . . . . .
3.5 Konvergenz in weiteren metrischen Räumen .
3.6 Konvergenz gegen unendlich . . . . . . . . .
3.7 Unendliche Reihen . . . . . . . . . . . . . .
3.8 Konvergenzkriterien . . . . . . . . . . . . . .
3.9 Umordnungen von Reihen und Doppelreihen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
49
54
59
62
65
68
72
77
82
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
Die Konstruktion der reellen Zahlen
5
Geometrie metrischer Räume
5.1 ǫ-Kugeln, offene und abgeschlossene Mengen . . . . . . . . . . . . .
5.2 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Folgen und Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
99
104
109
6
Reelle und komplexe Funktionen
6.1 Stetigkeit . . . . . . . . . .
6.2 Der Zwischenwertsatz . . .
6.3 Gleichmäßige Stetigkeit . . .
6.4 Unstetigkeitsstellen . . . . .
6.5 Monotone Funktionen . . . .
6.6 Gleichmäßige Konvergenz .
117
117
122
124
127
129
131
.
.
.
.
.
.
93
.
.
.
.
.
.
.
.
.
.
.
.
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
ii
6.7
6.8
6.9
6.10
Reell- und komplexwertige Folgen und Reihen
Die Exponentialfunktion . . . . . . . . . . . .
Fundamentalsatz der Algebra . . . . . . . . . .
Weitere wichtige elementare Funktionen . . . .
7 Differentialrechnung
7.1 Begriff der Ableitung . .
7.2 Mittelwertsätze . . . . .
7.3 Der Taylorsche Lehrsatz
7.4 Stammfunktion . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
138
144
152
154
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
159
159
165
174
182
Literaturverzeichnis
191
Index
192
Kapitel 1
Mengen und Abbildungen
1.1 Mengen
Die Objekte der modernen Mathematik sind die Mengen. Obwohl die Logik einen
axiomatischen Zugang zur Mengenlehre bietet, wollen wir uns auf den vom Schöpfer
der Mengenlehre (Georg CANTOR) geprägten Mengenbegriff stützen:
1.1.1 Definition. Eine Menge ist eine Zusammenfassung von bestimmten, wohlunterschiedenen Objekten unserer Anschauung zu einem Ganzen. Die Objekte heißen
Elemente der Menge.
Ist x ein solches Element von M, so schreiben wir x ∈ M. Im Falle, dass x nicht
zu M gehört, schreiben wir x < M. Möglichkeiten Mengen darzustellen sind die
aufzählende Schreibweise:
M = {a, b, c, d, e}, oder M = {1, 2, . . . }
und die beschreibende Schreibweise:
M = {x : x ist ungerade ganze Zahl}.
1.1.2 Definition. Sind A, B Mengen, so sagt man A ist gleich B (A = B), wenn sie die
selben Elemente enthalten. Man sagt A ist eine Teilmenge von B (A ⊆ B), falls jedes
Element von A auch ein Element von B ist. In diesem Fall bezeichnet man auch B als
Obermenge von A (B ⊇ A).
Will man zum Ausdruck bringen, dass dabei A mit B nicht übereinstimmt, so
schreibt man A ( B.
Schreibweisen wie A , B, A ) B, o.ä. sind dann selbsterklärend. Einer bestimmten
Menge werden wir oft begegnen, nämlich der leeren Menge ∅, also der Menge, die
keine Elemente enthält.
Man beachte zum Beispiel, dass die Menge {a, b, c} gleich der Menge {c, a, b, a} ist,
und dass z.B. die Menge {1, 3, 5, . . . } mit
{x : x ist ungerade natürliche Zahl}
übereinstimmt.
Hat man zwei oder mehrere Mengen, so kann man diese in verschiedener Weise
miteinander verknüpfen.
1
KAPITEL 1. MENGEN UND ABBILDUNGEN
2
1.1.3 Definition. Seien A und B zwei Mengen:
Die Menge A ∪ B = {x : x ∈ A oder x ∈ B} heißt die Vereinigungsmenge von A
und B. Für A ∪ B sagt man kurz auch A vereinigt B.
Die Menge A ∩ B = {x : x ∈ A und x ∈ B} heißt die Schnittmenge von A und B.
Man sagt kurz auch A geschnitten B.
Die Menge B \ A = {x : x ∈ B und x < A} ist die Differenz von B und A. Man
sagt kurz auch B ohne A.
Betrachtet man Teilmengen A einer fixen Grundmenge M, so schreiben wir auch
Ac für M \ A und nennen es das Komplement von A in M, kurz A Komplement.
A × B := {(x, y) : x ∈ A, y ∈ B} das kartesische Produkt der Mengen A und B.
Das ist also die Menge, deren Elemente die geordneten Paare sind, deren erste
Komponente zu A und deren zweite Komponente zu B gehört1 . Für A×A schreibt
man auch A2 .
Auch Durchschnitt und Vereinigung von mehr als zwei Mengen kann man analog
definieren. Ist Mi , i ∈ I, eine Familie von Mengen, durchindiziert mit der Indexmenge
I, so ist
\
Mi := {x : x ∈ Mi für alle i ∈ I},
[
i∈I
i∈I
Mi := {x : es gibt ein i ∈ I mit x ∈ Mi }.
Das kartesische Produkt endlich vieler Mengen ist analog wie jenes für zwei Mengen
erklärt. Zum Beispiel ist
A × B × C := {(x, y, z) : x ∈ A, y ∈ B, z ∈ C}.
Für A × A × A schreibt man A3 , u.s.w.
1.1.4 Beispiel.
Einfache Beispiele für Durchschnitts- bzw. Vereinigungsbildung wären:
{1, 2, 3} ∩ {−1, 0, 1} = {1}, {a, b, 7} ∩ {3, 4, x} = ∅,
{2, 3, 4, 5} ∪ {4, 5, 6, 7} = {2, 3, 4, 5, 6, 7}, {a, b, c} ∪ ∅ = {a, b, c}.
Ist M2 = {x ∈ Z : es gibt ein y ∈ Z, sodass x = 2y}, so wäre Z \ M2 gerade die
Menge der ungeraden ganzen Zahlen.
Weiters ist
{1, 2, 3, 4} \ {4, 5, 6, 7} = {1, 2, 3}, {a, b, c} \ ∅ = {a, b, c}.
Bezeichnet man mit 2N die Menge der geraden natürlichen Zahlen, so ist das
kartesische Produkt N × 2N die Menge
N × 2N = {(1, 2), (1, 4), . . ., (2, 2), (2, 4), . . ., (3, 2), (3, 4), . . .}.
1 Anm.:
Ist x , y, so ist (x, y) , (y, x).
1.1. MENGEN
3
1.1.5 Definition. Ist M eine Menge, so bezeichnet man mit P(M) die Menge aller
Teilmengen von M,
P(M) = {A : A ⊆ M}.
Diese Menge heißt die Potenzmenge von M. Sie ist also die Menge, deren Elemente
alle Teilmengen von M sind.
1.1.6 Beispiel. Ist M = {1, 2, 3}, dann ist die Potenzmenge P(M) gleich
P(M) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}.
Die Potenzmenge der Menge N ist schon viel zu groß um sie noch in irgendeiner
aufzählenden Weise anschreiben zu können. Sie enthält ja neben Mengen des Typs
{1, 2, 3}, {4, 6, 7, 8, 1004} usw. auch noch unendliche Mengen wie zum Beispiel 2N oder
{n ∈ N : n ≥ 27} und viele mehr.
1.1.7 Bemerkung. Für das Verknüpfen von Mengen gelten diverse Rechenregeln. Es
gilt zum Beispiel das Distributivgesetz für drei Mengen A, B, C:
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
(1.1)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
Um z.B. (1.1) nachzuweisen beachte man, dass zwei Mengen übereinstimmen, wenn
ein beliebiges Element x genau dann in der einen Menge ist, wenn es auch in der
anderen Menge ist:
Ein x liegt in A ∩ (B ∪ C)
genau dann, wenn
x ∈ A und x ∈ B ∪ C.
Das ist gleichbedeutend mit:
x ∈ A, und x liegt zumindest in einer der Mengen B bzw. C.
Diese Aussage ist aber äquivalent zu:
Zumindest eine der Aussagen - x ∈ A und x ∈ B - oder - x ∈ A und x ∈ C - trifft zu.
Nun ist das dasselbe, wie:
x ∈ A ∩ B oder x ∈ A ∩ C.
Schließlich gilt das genau dann, wenn
x ∈ (A ∩ B) ∪ (A ∩ C).
Den an einem kleinen Abriss des axiomatischen Zugangs zur Mengenlehre interessierten Leser möchte ich hier an die Vorlesung Lineare Algebra verweisen.
KAPITEL 1. MENGEN UND ABBILDUNGEN
4
1.2 Funktionen
1.2.1 Definition. Seien M und N Mengen. Eine Teilmenge f ⊆ M × N heißt eine
Funktion von M nach N, wenn gilt
(i) Für alle x ∈ M gibt es ein y ∈ N : (x, y) ∈ f ,
(ii) Sind (x, y1 ) ∈ f und (x, y2 ) ∈ f , so folgt y1 = y2 .
Die Bedingung (i) besagt, dass jedem x (mindestens) ein Funktionswert y zugeordnet wird, man sagt auch f ist überall definiert.
Die Bedingung (ii) besagt, dass einem x höchstens ein Funktionswert zugeordnet
wird. Man sagt auch f sei wohldefiniert.
Insgesamt hat man also: Eine Funktion von M nach N ist eine (wie auch immer
geartete) Vorschrift, durch die jedem Element x aus der Menge M in eindeutiger Weise
ein Element y aus der Menge N zugeordnet wird. Man schreibt y = f (x) und bezeichnet y als den Funktionswert von f an der Stelle x. Anstelle des Namens Funktion“
”
gebraucht man auch den Namen Abbildung.
Klarerweise stimmen zwei Funktionen f und g von M nach N überein, also f = g,
genau dann, wenn f (x) = g(x) für alle x ∈ M.
Sieht man eine Funktion eher als Abbildungsvorschrift, dann unterscheidet man
- obwohl mathematisch das Gleiche - die Funktion als Abbildungsvorschrift und die
Funktion als Teilmenge von M × N, und man bezeichnet diese Teilmenge von M × N
auch als Graph graph f von f .
Da für eine Funktion der einem Wert zugeordnete Funktionswert ja eindeutig bestimmt ist, schreibt man eine Funktion f von M nach N auch oft an als
(
M →
N
f :
.
x 7→ f (x)
1.2.2 Definition. Ist M eine Menge, so heißt die Abbildung
(
M → M
idM :
x 7→ x
die identische Abbildung auf der Menge M. Daher id M : M → M mit id M (x) = x.
1.2.3 Beispiel. Sei M die Menge aller Wörter in einem Wörterbuch. N = {1, 2, . . . } sei
die Menge der natürlichen Zahlen. Sei nun f jene Funktion auf M, die jedem Wort die
Anzahl seiner Buchstaben zuweist. Also z.B.
f (’gehen’) = 5.
1.2.4 Beispiel. Wir haben im Abschnitt über Familien von Mengen Mi , i ∈ I, gesprochen, ohne genau zu sagen, was das bedeutet. Das ist nämlich die Funktion i 7→ Mi von
der Indexmenge I in die Potenzmenge P(M), wobei M eine hinreichend große Menge
ist, die alle Mengen Mi enthält, z.B. M = ∪i∈I Mi .
1.2.5 Bemerkung. In manchen Zusammenhängen betrachtet man auch Funktionen, die
nicht überall definiert sind. Das sind Teilmengen von f ⊆ M × N, die nur die Eigenschaft (ii) aus Definition 1.2.1 haben, d.h. dass es zu jedem Wert x ∈ M höchstens einen
1.2. FUNKTIONEN
5
Funktionswert (d.h. keinen oder genau einen) y ∈ N gibt. Man muss dann zusätzlich
den Definitionsbereich dom f (vom englischen Wort domain) der Funktion angeben:
dom f = {x ∈ M : es gibt ein y ∈ N, sodass (x, y) ∈ f }.
Der Wertebereich ran f (vom englischen Wort range) einer Funktion f ist die Menge
ran f = {y ∈ N : es gibt ein x ∈ M, sodass (x, y) ∈ f }.
Betrachte zum Beispiel
f := {(x, y) ∈ N2 : x = 2y}.
(1.2)
Offenbar ist dieses f eine nur auf der Menge der geraden Zahlen definierte Funktion.
1.2.6 Definition. Sei f eine Funktion von M nach N und sei A ⊆ M. Die Funktion, die
jedem x ∈ A den Funktionswert f (x) zuweist, heißt Einschränkung von f auf A und
wird mit f |A bezeichnet. Also
f |A = {(x, y) ∈ f : x ∈ A}.
Ist umgekehrt g eine Funktion von A nach N und M ⊇ A, so heißt eine Funktion
f : M → N Fortsetzung von g, falls g = f |A .
1.2.7 Definition. Für eine Teilmenge A von M bezeichne
f (A) = {y ∈ N : es gibt ein x ∈ A, sodass f (x) = y},
das Bild der Menge A unter der Abbildung f . Klarerweise ist ran f = f (M).
Ist y ∈ N, und ist x ∈ M, sodass y = f (x), so bezeichnet man x als ein Urbild von
y. Das vollständige Urbild einer Teilmenge B von N ist die Menge
f −1 (B) := {x ∈ M : f (x) ∈ B}.
1.2.8 Bemerkung. Ist f : M → N eine Funktion, und ist B ⊆ N mit f (M) ⊆ B, so kann
man f auch als Funktion von M nach B betrachten.
1.2.9 Beispiel. Betrachte zum Beispiel die Funktion n 7→ 2n von N in N. Natürlich
kann man auch n 7→ 2n als Funktion von N in die Menge aller geraden natürlichen
Zahlen betrachten.
Folgende Begriffsbildung ist auf den ersten Blick nicht allzu kompliziert. Sie spielt
aber in der Mathematik eine ganz wichtige Rolle.
1.2.10 Definition. Sei f : M → N eine Funktion. f heißt
injektiv, wenn gilt
f (x1 ) = f (x2 ) ⇒ x1 = x2 ,
d.h. zu jedem Wert y ∈ N gibt es höchstens ein Urbild. Äquivalent dazu ist, dass
aus x1 , x2 folgt, dass f (x1 ) , f (x2 ).
surjektiv, wenn es zu jedem y ∈ N ein x ∈ M gibt, sodass f (x) = y, oder äquivalent ausgedrückt: für alle y ∈ N : f −1 ({y}) , ∅. D.h. also, dass jedes Element von
N wirklich als Funktionswert von f auftritt: ran f = N.
Eine Funktion, die sowohl injektiv als auch surjektiv ist, bezeichnet man als bijektiv.
KAPITEL 1. MENGEN UND ABBILDUNGEN
6
1.2.11 Bemerkung. Man beachte, dass die Eigenschaft surjektiv, und somit auch bijektiv, zu sein, ganz wesentlich vom betrachteten Bildbereich der Funktion f abhängt.
Denn ist etwa f : M → N eine beliebige Funktion, und betrachtet man f als
Funktion von M nach f (M) und nicht nach N, so ist f : M → f (M) immer surjektiv.
Vergleiche auch Bemerkung 1.2.8.
1.2.12 Beispiel. Folgende drei Beispiele zeigen insbesondere, dass keine der beiden
Eigenschaften injektiv und surjektiv zu sein, die jeweils andere impliziert.
Sei A die Menge aller in Österreich amtlich registrierten Staatsbürger, und sei f
jene Funktion, die einer Person aus A ihre Sozialversicherungsnummer zuordnet.
Dann ist f : A → N keine surjektive (es gibt ja nur endlich viele Österreicher),
aber sehr wohl eine injektive Funktion, da zwei verschiedene Personen auch zwei
verschiedene Sozialversicherungsnummern haben.
Die Funktion g : A → N, die jeder Person ihre Körpergröße in Zentimeter (gerundet) zuordnet, ist weder injektiv noch surjektiv.
Sei h : N → N die Funktion, die einer Zahl (dargestellt im Dezimalsystem) ihre
Ziffernsumme zuordnet. Diese Funktion ist nicht injektiv (h(11) = 2 = h(2)),
aber sie ist surjektiv, denn ist n ∈ N, so gilt sicherlich
h(11
. . .}
1) = n.
| {z
n Stellen
1.2.13 Lemma. Sei f eine Funktion von M nach N. Ist f bijektiv, so ist
f −1 = {(y, x) ∈ N × M : (x, y) ∈ f }
eine Funktion von N nach M.
Beweis. Ist y ∈ N, dann existiert ein x ∈ M mit y = f (x), da f surjektiv ist. Also ist
die Forderung (i) von Definition 1.2.1 für f −1 erfüllt. Um auch (ii) nachzuprüfen, sei
(y, x1 ), (y, x2 ) ∈ f −1 . Dann sind (x1 , y), (x2 , y) ∈ f und wegen der Injektivität von f
folgt x1 = x2 .
❑
1.2.14 Bemerkung. Man sieht am obigen Beweis, dass die Inverse f −1 einer injektiven
Funktion f eine nicht notwendig überall definierte Funktion ist. Ihr Definitionsbereich
ist gerade ran f . Ist dagegen f nicht injektiv, so ist f −1 nicht einmal mehr eine nicht
überall definierte Funktion.
Durch unmittelbares Nachprüfen der Definition sieht man, dass die Zusammensetzung von Funktionen wieder eine Funktion ist.
1.2.15 Definition. Seien f : M → N und g : N → P Funktionen. Dann bezeichne g ◦ f
jene Funktion von M nach P, die durch
(g ◦ f )(x) = g( f (x)), x ∈ M,
definiert ist. Man bezeichnet g ◦ f oft auch als die zusammengesetzte Funktion oder als
die Hintereinanderausführung von f und g.
1.2. FUNKTIONEN
7
1.2.16 Bemerkung. Man kann g ◦ f auch als
{(x, z) : ∃y ∈ N, (x, y) ∈ f, (y, z) ∈ g}
(1.3)
schreiben.
Ist f eine Abbildung von M nach N, so gilt immer f = f ◦ id M = idN ◦ f .
Das Hintereinanderausführen ist assoziativ: Sind f : M → N, g : N → P und h : P →
Q Funktionen so gilt (x ∈ M)
((h ◦ g) ◦ f )(x) = (h ◦ g)( f (x)) = h(g( f (x))) =
h((g ◦ f )(x)) = (h ◦ (g ◦ f ))(x).
Also gilt (h ◦ g) ◦ f = h ◦ (g ◦ f ). Als Konsequenz schreiben wir auch h ◦ g ◦ f dafür.
1.2.17 Bemerkung. Sind f und g nicht mehr überall definiert, so muss man bei der
Komposition darauf achten, dass die Definitionsbereiche so zusammenpassen, dass der
Bildbereich von f im Definitionsbereich von g enthalten ist.
1.2.18 Satz. Eine Funktion f : M → N ist genau dann bijektiv, wenn es eine Funktion
g : N → M gibt mit
g ◦ f = id M , f ◦ g = idN .
In diesem Fall gilt g = f −1 .
Ist h : N → P ebenfalls bijektiv, so gilt weiters
(h ◦ f )−1 = f −1 ◦ h−1 .
Beweis. Sei zunächst f bijektiv. Offenbar gilt
( f −1 ◦ f )(x) = x, x ∈ M,
und
( f ◦ f −1 )(y) = y, y ∈ N.
Also hat die Funktion g = f −1 alle im Satz geforderten Eigenschaften.
Sei nun die Existenz einer Funktion g mit den genannten Eigenschaften vorausgesetzt. Ist y ∈ N, so setze x = g(y), dann gilt f (x) = f (g(y)) = idN (y) = y. D.h. f ist
surjektiv. Ist f (x1 ) = f (x2 ), so folgt
x1 = g( f (x1 )) = g( f (x2 )) = x2 .
Also ist f auch injektiv. Schließlich:
g = id M ◦g = ( f −1 ◦ f ) ◦ g = f −1 ◦ ( f ◦ g) = f −1 ◦ idN = f −1 .
Die Funktion e := f −1 ◦ h−1 erfüllt wegen der Assoziativität der Hintereinanderausführung
e ◦ (h ◦ f ) = f −1 ◦ (h−1 ◦ h) ◦ f = f −1 ◦ idN ◦ f = f −1 ◦ f = id M ,
sowie
(h ◦ f ) ◦ e = h ◦ ( f ◦ f −1 ) ◦ h−1 = h ◦ idN ◦h−1 = h ◦ h−1 = idP .
Nach dem ersten Teil des Satzes gilt e = (h ◦ f )−1 .
❑
8
KAPITEL 1. MENGEN UND ABBILDUNGEN
Kapitel 2
Die reellen Zahlen
Die reellen Zahlen sind eine Menge, die uns anschaulich schon aus der Schule bekannt
ist. Wir wollen im Folgenden die charakteristischen Eigenschaften der reellen Zahlen
sammeln, von denen wir dann sehen werden, dass diese die reellen Zahlen (bis auf
isomorphe Kopien) eindeutig bestimmen. Dass es die reellen Zahlen (also eine Menge mit den charakteristischen Eigenschaften) unter der Annahme der Gültigkeit der
Mengenlehre überhaupt gibt, werden wir auch später sehen.
2.1 Algebraische Struktur der reellen Zahlen
Zuerst wollen wir uns den Operationen + und ·, also der algebraischen Struktur, zuwenden. Die reellen Zahlen mit diesen Operationen sind ein so genannter Körper:
2.1.1 Definition. Sei K eine nichtleere Menge, und es seien Abbildungen (Verknüpfungen)
+ : K × K → K (Addition)
und
· : K × K → K (Multiplikation)
gegeben. Das Tripel hK, +, ·i heißt Körper, falls folgende Gesetze gelten. Wir schreiben
dabei x + y für +(x, y) und x · y für ·(x, y).
(A1) Die Addition ist assoziativ:
(x + y) + z = x + (y + z), x, y, z ∈ K.
(A2) Es existiert ein neutrales Element 0 ∈ K bezüglich +:
x + 0 = x, x ∈ K.
(A3) Jedes Element x ∈ K besitzt ein Inverses −x ∈ K bezüglich +:
x + (−x) = 0.
(A4) Die Addition ist kommutativ:
x + y = y + x, x, y ∈ K.
9
KAPITEL 2. DIE REELLEN ZAHLEN
10
(M1) Die Multiplikation ist assoziativ:
(x · y) · z = x · (y · z), x, y, z ∈ K.
(M2) Es existiert ein neutrales Element 1 ∈ K \ {0} bezüglich ·:
x · 1 = x, x ∈ K \ {0}.
(M3) Jedes von 0 verschiedene Element x besitzt ein Inverses bezüglich ·:
x · x−1 = 1.
(M4) Die Multiplikation ist kommutativ:
x · y = y · x, x, y ∈ K.
(D) Es gilt das Distributivgesetz:
x · (y + z) = (x · y) + (x · z), x, y, z ∈ K.
2.1.2 Bemerkung. Da hK, +i und hK \ {0}, ·i Gruppen sind, folgt, dass die jeweiligen
neutralen Elemente 0 bzw. 1 eindeutig bestimmt sind: Wäre etwa 0̃ ein weiters neutrales
Element bezüglich +, so folgte aus (A2) und (A4), dass
0 = 0̃ + 0 = 0̃.
Dasselbe gilt für die Inversen −a und a−1 . Wäre etwa ã ein weiteres additiv Inverses zu
a, also a + ã = 0, so folgte
ã = ã + (a + (−a)) = (ã + a) +(−a) = 0 + (−a) = −a.
| {z } | {z }
=0
=0
Somit ist x 7→ −x eine - wie aus untenstehenden Rechenregeln folgt - bijektive Funktion von K auf sich selbst und x 7→ x−1 eine bijektive Funktion von K \ {0} auf sich
selbst. Siehe dazu die Lineare Algebra Vorlesung.
2.1.3 Beispiel. Man betrachte die Menge K = {≬, ⋔}. Die Verknüpfungen + und · seien
gemäß folgender Verknüpfungstafeln definiert.
+
≬
⋔
≬
≬
⋔
⋔
⋔
≬
·
≬
⋔
≬
≬
≬
⋔
≬
⋔
Man erkennt unschwer, dass alle Anforderungen an einen Körper, d.h. Axiome
(A1) − (A4), (M1) − (M4), (D), erfüllt sind, wobei ≬ des neutrale 0 Element bezüglich
+ und ⋔ des neutrale Element 1 bezüglich · ist.
Es sei noch bemerkt, dass jeder Körper mindestens zwei Elemente hat, und somit
der hier vorgestellte Körper kleinst möglich ist.
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
11
Wir werden xy für x · y und, falls y , 0, für xy−1 oft yx schreiben. Um Klammern
zu sparen, wollen wir auch übereinkommen, dass Punkt- vor Strichrechnung kommt
(xy + xz = (xy) + (xz)). Schließlich werden wir für x + (−y) bzw. (−x) + y auch x − y
bzw. −x + y schreiben.
Aus obigen Gesetzen für einen Körper leitet man in elementarer Weise folgende
Rechenregeln her:
2.1.4 Lemma. Es gelten folgende Rechenregeln:
(i) Die Inverse von der Inversen ist die Zahl selbst: −(−x) = x, x ∈ K und (x−1 )−1 =
x, x ∈ K \ {0}.
(ii) −(x + y) = (−x) + (−y), x, y ∈ K.
(iii) x, y , 0 ⇒ x · y , 0 und (xy)−1 = x−1 y−1 , sowie (−x)−1 = −(x−1 ). Insbesondere
(−1)(−1) = 1.
(iv) x · 0 = 0, x(−y) = −xy, (−x)(−y) = xy, x(y − z) = xy − xz.
(v)
ac
bd
=
ac
bd .
Beweis. Exemplarisch wollen wir −(x + y) = (−x) + (−y) nachweisen: Es gilt wegen
dem Kommutativgesetz und Assoziativgesetz
(x + y) + ((−x) + (−y)) = ((x + y) + (−x)) + (−y) = ((y + x) + (−x)) + (−y) =
(y + (x + (−x))) + (−y) = ((y + 0) + (−y)) = y + (−y) = 0.
Also ist (−x) + (−y) eine additiv Inverse von x + y. Wegen Bemerkung 2.1.2 ist diese
additiv Inverse aber eindeutig. Also (−x) + (−y) = −(x + y).
❑
Schließlich wollen wir noch einige Schreibweisen festlegen: Ist A Teilmenge unseres Körpers K, so sei
−A = {−a : a ∈ A}.
Also ist −A das Bild von A unter der Abbildung −.
Sind A, B ⊆ K, so sei
A + B = {a + b : a ∈ A, b ∈ B}.
Somit ist A + B das Bild von A × B(⊆ K × K) unter der Abbildung +.
Entsprechend seien A−1 , A − B, etc. definiert.
2.2 Ordnungsstruktur der reellen Zahlen
Eine weitere wichtige Eigenschaft der reellen Zahlen, wie aus der Schule bekannt,
ist die, dass man je zwei Zahlen x und y der Größe nach vergleichen kann. Dabei ist
bekannterweise x < y genau dann, wenn y − x eine positive reelle Zahle ist. Um diesen
Sachverhalt mathematisch zu fassen, definieren wir
2.2.1 Definition. Sei hK, +, ·i ein Körper und sei P ⊆ K. Dann heißt K (streng genommen hK, +, ·, Pi) ein angeordneter Körper, wenn gilt
KAPITEL 2. DIE REELLEN ZAHLEN
12
1
˙ ∪(−P),
˙
(P1) Es gilt K = P∪{0}
wobei P, −P disjunkt sind (ihr Schnitt ist die leere
Menge), und beide 0 nicht enthalten.
(P2) x, y ∈ P ⇒ x + y ∈ P.
(P3) x, y ∈ P ⇒ xy ∈ P
Die Menge P heißt die Menge der positiven Zahlen.
Seien x, y ∈ K. Wir sagen, dass
x kleiner als y ist, in Zeichen x < y, wenn y − x ∈ P.
x größer als y ist, in Zeichen x > y, wenn x − y ∈ P.
x kleiner oder gleich y ist, in Zeichen x ≤ y, wenn x < y ∨ x = y.
x größer oder gleich y ist, in Zeichen x ≥ y, wenn x > y ∨ x = y.
2.2.2 Lemma. In einem angeordneten Körper K gelten für beliebige a, b, x, y, z ∈ K
folgende Regeln:
(i) x ≤ x (Reflexivität).
(ii) (x ≤ y ∧ y ≤ x) ⇒ x = y (Antisymmetrie).
(iii) (x ≤ y ∧ y ≤ z) ⇒ x ≤ z (Transitivität).
(iv) x ≤ y ∨ y ≤ x (Totalität).
(v) (x ≤ y ∧ a ≤ b) ⇒ x + a ≤ y + b.
(vi) x ≤ y ⇒ −x ≥ −y.
(vii) (z > 0 ∧ x ≤ y) ⇒ xz ≤ yz und (z < 0 ∧ x ≤ y) ⇒ xz ≥ yz.
(viii) x , 0 ⇒ x2 > 0. Insbesondere: 1 > 0.
(ix) x > 0 ⇒ x−1 > 0 und x < 0 ⇒ x−1 < 0.
(x) 0 < x ≤ y ⇒ ( yx ≤ 1 ≤
y
x
∧ x−1 ≥ y−1 ).
(xi) (0 < x ≤ y ∧ 0 < a ≤ b) ⇒ xa ≤ yb.
(xii) x < y ⇒ x <
x+y
2
< y, wobei 2 := 1 + 1.
Beweis. Wir beweisen exemplarisch (ii), (iii), (viii) und (xii):
(ii): (x ≤ y ∧ y ≤ x) ist per Definitionem dasselbe, wie y − x ∈ P ∪ {0} ∧ x − y ∈ P ∪ {0}.
Also y − x ∈ (P ∪ {0}) ∩ (−P ∪ {0}) = {0}, und damit x = y.
(iii): (x ≤ y ∧ y ≤ z) ⇔ (y − x ∈ P ∪ {0} ∧ z − y ∈ P ∪ {0}). Aus (P2) folgt
z − x = (z − y) + (y − x) ∈ P ∪ {0}, also x ≤ z.
(viii): Aus x , 0 folgt x ∈ P ∪ −P. Ist x ∈ P, so folgt wegen (P3), dass x2 = xx ∈ P
und damit x2 > 0. Ist x ∈ −P, so folgt −x ∈ P und wieder wegen (P3), dass x2 = xx =
(−x)(−x) ∈ P.
1 Der
Punkt über ∪ soll die Disjunktheit der Mengen anzeigen.
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
13
(xii): Aus x < y und (v) folgt x + x < x + y < y + y. Nun ist wegen dem Distributivgesetz
x + x = x(1 + 1) und y + y = y(1 + 1). Da wegen (P2), 1 + 1 ∈ P, folgt aus (vii), dass
x < x+y
2 < y.
❑
2.2.3 Bemerkung. Die Eigenschaften (i)−(iii) besagen genau, dass ≤ eine Halbordnung
auf K ist. Eigenschaft (iv) bedeutet dann, dass diese Halbordnung sogar eine Totalordnung ist.
Man kann also einen angeordneten Körper als Gerade veranschaulichen, wobei eine
Zahl x genau dann links von einer anderen Zahl y liegt, wenn sie kleiner ist:
0
x
K
y
Abbildung 2.1: Zahlengerade
2.2.4 Definition. Sei K eine Menge und ≤ eine Totalordnung darauf.
Sind x, y ∈ K, so sei max(x, y) das Maximum von x und y. Also max(x, y) = x,
falls x ≥ y, und max(x, y) = y falls y ≥ x. Entsprechend definiert man das
Minimum min(x, y) zweier Zahlen.
Ist A ⊆ K, und gibt es ein a0 ∈ A, sodass a ≤ a0 (a0 ≤ a) für alle a ∈ A, so nennt
man a0 das Maximum (Minimum) von A, und schreibt a0 = max A (a0 = min A).
Zum Maximum (Minimum) sagt man auch größtes (kleinstes) Element.
Ist A ⊆ K, so heißt A nach oben beschränkt, falls es ein x ∈ K gibt, sodass
A ≤ x, sodass also a ≤ x für alle a ∈ A. Jedes x ∈ K mit A ≤ x heißt dabei obere
Schranke von A. Entsprechend heißt eine Teilmenge A nach unten beschränkt,
wenn es eine untere Schranke in K hat, wenn also x ≤ A für ein x ∈ K. Eine nach
oben und nach unten beschränkte Teilmenge heißt beschränkt.
Sei A ⊆ K eine nach oben (unten) beschränkte Teilmenge. Hat die Menge {x ∈
K : A ≤ x} ({x ∈ K : x ≤ A}) aller oberen (unteren) Schranken von A ein
Minimum (Maximum), so heißt dieses Supremum (Infimum) von A und wird mit
sup A (inf A) bezeichnet.
Die Tatsache, dass eine Menge A ⊆ K nicht nach oben (nicht unten) beschränkt
ist wollen wir mit sup A = +∞ (inf A = −∞) zum Ausdruck bringen.
obere Schranken von M
M
sup M
Abbildung 2.2: Supremum der Menge M
KAPITEL 2. DIE REELLEN ZAHLEN
14
2.2.5 Bemerkung. Man sieht leicht, dass jedes Maximum (Minimum) einer Teilmenge
auch Supremum (Infimum) dieser Teilmenge ist. Die Umkehrung gilt im Allgemeinen
nicht.
Es kann auch vorkommen, dass eine beschränkte Teilmenge von K weder ein Supremum, noch ein Infimum hat.
2.2.6 Bemerkung. Wenn das Supremum einer Teilmenge A existiert, so gilt gemäß der
Definition A ≤ sup A, und sup A ≤ x für alle oberen Schranken x von A.
Ist umgekehrt y ∈ K mit A ≤ y und y ≤ x für alle oberen Schranken x von A,
so folgt aus A ≤ y, dass y eine obere Schranke von A ist, und aus der zweiten Voraussetzung, dass y das Minimum der oberen Schranken von A ist. Also ist y = sup A.
Entsprechendes lässt sich für das Infimum sagen.
2.2.7 Lemma. Ist A ⊆ B ⊆ K, so gilt
(i) {x ∈ K : A ≤ x} ⊇ {x ∈ K : B ≤ x} und {x ∈ K : x ≤ A} ⊇ {x ∈ K : x ≤ B}.
(ii) Haben A und B ein Maximum (Minimum), so folgt max A ≤ max B
(min A ≥ min B).
(iii) Haben A und B ein Supremum (Infimum), so folgt sup A ≤ sup B (inf A ≥ inf B).
Beweis.
(i) t ∈ {x ∈ K : B ≤ x} bedingt b ≤ t für alle b ∈ B. Wegen A ⊆ B gilt auch a ≤ t für
alle a ∈ A, und daher t ∈ {x ∈ K : A ≤ x}. Die zweite Mengeninklusion beweist
man genauso.
(ii) Das Maximum von B erfüllt definitionsgemäß max B ≥ b für alle b ∈ B, und damit insbesondere max B ≥ a für alle a ∈ A. Wegen max A ∈ A folgt insbesondere
max B ≥ max A. Analog zeigt man min A ≥ min B.
(iii) Definitionsgemäß haben wir sup A = min{x ∈ K : A ≤ x} und
sup B = min{x ∈ K : B ≤ x}. Nach (i) ist {x ∈ K : B ≤ x} ⊆ {x ∈ K : A ≤ x} und
daher nach (ii)
sup A = min{x ∈ K : A ≤ x} ≤ min{x ∈ K : B ≤ x} = sup B.
❑
Ist K ein angeordneter Körper, so gelten für die oben eingeführten Begriffe einfache
Rechenregeln:
(i) Aus x ≤ A ⇔ −x ≥ −A folgt, dass A ⊆ K genau dann nach oben (unten)
beschränkt ist, wenn −A nach unten (oben) beschränkt ist.
(ii) min(−A) = − max A, max(−A) = − min A,
(iii) inf(−A) = − sup(A), sup(−A) = − inf(A).
Diese Gleichheiten gelten in dem Sinn, dass die linke Seite des Gleichheitszeichen
genau dann existiert, wenn die rechte existiert.
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
15
2.2.8 Beispiel. Seien a, b ∈ K. Dann definiert man die Intervalle
(a, b) := {x ∈ K : a < x < b}, (a, b] := {x ∈ K : a < x ≤ b},
und entsprechend
[a, b] := {x ∈ K : a ≤ x ≤ b}, [a, b) := {x ∈ K : a ≤ x < b}.
Außerdem setzt man (+∞, −∞ sind hier nur formale Ausdrücke)
(−∞, b) := {x ∈ K : x < b}, (−∞, b] := {x ∈ K : x ≤ b},
(a, +∞) := {x ∈ K : a < x}, [a, +∞) := {x ∈ K : a ≤ x}.
Ist a < b, so sind die Mengen (a, b), [a, b], (a, +∞) z.B. nach unten beschränkt.
Nach oben beschränkt sind dagegen nur die ersten beiden. Die Mengen (a, b), (a, b]
haben das Supremum b, aber nur für die Menge (a, b] ist b ein Maximum.
Um etwa einzusehen, dass b = sup(a, b) argumentiert man folgendermaßen:
Zunächst ist wegen der Definition von Intervallen x ≤ b für alle x ∈ (a, b), also
(a, b) ≤ b.
Angenommen es gäbe eine obere Schranke y von (a, b) mit y < b. Im Falle y ≤ a
wäre y ≤ a < a+b
2 < b (vgl. Lemma 2.2.2, (xii)), womit aber y keine obere Schranke
sein kann, da a+b
2 ∈ (a, b).
Im Falle a < y wäre a < y < y+b
2 < b, womit wiederum y keine obere Schranke sein
∈
(a,
b).
kann, da y+b
2
Also ist b tatsächlich die kleinste obere Schranke von (a, b), sup(a, b) = b.
2.2.9 Beispiel. Dem Begriff der rationalen Zahlen vorgreifend seien K die rationalen
Zahlen und sei
M = {x ∈ K : x2 < 2}.
Dann hat diese Menge weder Maximum noch Supremum, obwohl sie nach oben beschränkt ist. Siehe dazu Satz 2.7.5.
Wir wollen noch zwei elementare Funktionen auf einem angeordneten Körper betrachten:
2.2.10 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Die Signumfunktion sgn
sei jene Funktion von K nach K, sodass für x ∈ K


1



0
sgn(x) = 


 −1
,
,
,
x∈P
x=0 .
x ∈ −P
Für x , 0 heißt sgn(x) auch das Vorzeichen von x.
Die Betragsfunktion |.| : K → K ist definiert durch
(
x , x ∈ P ∪ {0}
|x| =
.
−x , x ∈ −P
Sind x, y ∈ K, so bezeichnet man |x − y| auch als den Abstand von x und y.
2.2.11 Lemma. Für x, y ∈ K gilt:
KAPITEL 2. DIE REELLEN ZAHLEN
16
(i) |x| = sgn(x)x.
(ii) |xy| = |x||y|.
(iii) |x + y| ≤ |x| + |y| (Dreiecksungleichung).
(iv) |x + y| ≥ ||x| − |y|| (Dreiecksungleichung nach unten).
(v) max(x, y) =
x+y+|x−y|
,
2
min(x, y) =
x+y−|x−y|
.
2
Beweis. (i) und (ii) folgen ganz leicht, wenn wir die Fälle x > 0, x = 0, x < 0 unterscheiden.
Die Dreiecksungleichung folgt unmittelbar, wenn eine der Zahlen x oder y Null ist.
Sonst unterscheiden wir folgende zwei Fälle:
sgn(x) = sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| + |y|)| = |x| + |y|
sgn(x) = − sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| − |y|)| = ||x| − |y|| ≤ |x| + |y|
Letztere Ungleichung gilt, da sowohl |x| − |y| ≤ |x| + |y|, als auch −(|x| − |y|) = |y| − |x| ≤
|x| + |y|.
Um die Dreiecksungleichung nach unten einzusehen, bemerke
|x| = |(x + y) + (−y)| ≤ |x + y| + |y|,
(2.1)
also |x| − |y| ≤ |x + y|. Analog folgt
|y| ≤ |x + y| + |x|,
also auch |y| − |x| ≤ |x + y|.
Mit einer ähnlichen Fallunterscheidung beweist man die Aussage (v).
❑
2.3 Die natürlichen Zahlen
Von den bisher vorgestellten Objekten (Körper, angeordneter Körper) ist noch nicht
bekannt, ob es sie überhaupt gibt. Um solche Objekte zu konstruieren, wenden wir uns
zunächst den natürlichen Zahlen zu.
Die natürlichen Zahlen sind uns als Objekt des Alltages wohlvertraut, aber ihre
Existenz als mathematisches Objekt ist keine Trivialität. Trotzdem wollen wir diese
voraussetzen. In der Tat folgt sie aus den Axiomen der Mengenlehre.
2.3.1 Definition. Die natürlichen Zahlen sind eine Menge N, in der ein Element 1 ∈
N ausgezeichnet ist,2 und auf der eine Funktion (Nachfolgerabbildung) ′ : N → N
definiert ist, sodass gilt
(S1)
′
ist injektiv.
(S2) Es gibt kein n ∈ N mit n′ = 1.
(S3) Ist M ⊆ N, 1 ∈ M und m′ ∈ M für alle m ∈ M, so ist M = N.
2 Die Bezeichnung 1 hat zumindest zum gegenwärtigen Zeitpunkt nichts mit der gleichlautenden Bezeichnung für das multiplikative neutrale Element in einem Körper zu tun.
2.3. DIE NATÜRLICHEN ZAHLEN
17
Für n′ wollen wir auch n + 1 schreiben.
2.3.2 Bemerkung. Wir wollen anmerken, dass wir weder die Abbildungen +, ·, die
N × N nach N abbilden, noch die Möglichkeit zwei natürliche Zahlen der Größe nach
zu ordnen, zur Verfügung haben. Obige Festlegung, dass n′ = n + 1 ist nur symbolisch
zu verstehen.
Ehe wir uns an die Definition von Addition und Multiplikation machen, wollen wir
P
uns die Möglichkeit schaffen, Ausdrücke, wie nx, xn , nk=1 c(k) für n ∈ N zu definieren,
wenn z.B. x und c(k) für k ∈ N Elemente eines Körpers sind.
Alle diese Ausdrücke haben gemein, dass sie Funktionen n 7→ φ(n) auf N sind,
wobei φ(1) bekannt ist, und wobei φ(n′ ) bekannt ist, wenn φ(n) es ist. Im Falle von
′
n 7→ xn ist etwa x1 = x und xn = xn · x.
Um einzusehen, warum solche Funktionen eindeutig definiert sind, zeigen wir folgenden Satz:
2.3.3 Satz (Rekursionssatz). Sei A eine Menge, a ∈ A, g : A → A (Rekursionsfunktion).
Dann existiert genau eine Abbildung φ : N → A mit φ(1) = a und φ(n′ ) = g(φ(n)).
Beweis. Betrachte alle Teilmengen H ⊆ N × A mit den Eigenschaften
(i) (1, a) ∈ H
(ii) Ist (n, b) ∈ H, so gilt auch (n′ , g(b)) ∈ H.
Solche Teilmengen existieren, da z.B. N × A die Eigenschaften (i) und (ii). Sei D der
Durchschnitt aller solchen Teilmengen:
\
D :=
H
H erfüllt (i) und (ii)
Da (1, a) ∈ H für alle H, die (i) und (ii) erfüllen, ist auch (1, a) ∈ D. Ist (n, b) ∈ D, so
gilt (n, b) ∈ H für alle (i) und (ii) erfüllenden H. Nach (ii) folgt (n′ , g(b)) ∈ H für alle
solchen H, und somit (n′ , g(b)) ∈ D.
Somit hat D auch die Eigenschaften (i) und (ii), und ist damit die kleinste Teilmenge
mit diesen Eigenschaften.
Wir behaupten, dass D eine Funktion von N nach A ist, also, dass es zu jedem n ∈ N
genau ein b ∈ A gibt, sodass (n, b) ∈ D. Dazu sei3
M = {n ∈ N : ∃! b ∈ A, (n, b) ∈ D}.
Nun ist 1 ∈ M, da einerseits (1, a) ∈ D. Gäbe es andererseits ein weiteres c ∈ A, c , a
mit (1, c) ∈ D, so betrachte D \ {(1, c)}. Klarerweise hat D \ {(1, c)} die Eigenschaft (i).
Wegen (S 2) bleibt auch die Eigenschaft (ii) erhalten. Ein Widerspruch dazu, dass D
kleinstmöglich ist.
Ist nun n ∈ M, so gibt es genau ein b ∈ A mit (n, b) ∈ D. Also ist auch (n′ , g(b)) ∈ D.
Wäre noch (n′ , c) ∈ D mit c , g(b), so kann man wieder D \ {(n′ , c)} betrachten. Weil
n′ , 1, erfüllt D \ {(n′ , c)} Eigenschaft (i).
Aus (k, d) ∈ D \ {(n′ , c)} ⊆ D folgt (k′ , g(d)) ∈ D. Ist k , n, so folgt wegen (S 1)
daher auch (k′ , g(d)) , (n′ , c). Ist n = k, so muss wegen n ∈ M die Gleichheit d = b
gelten. Es folgt (k′ , g(d)) = (n′ , g(b)) , (n′ , c). In jedem Fall gilt also (k′ , g(d)) ∈
3 ∃!
steht für: Es gibt genau ein
KAPITEL 2. DIE REELLEN ZAHLEN
18
D \ {(n′ , c)}, und D \ {(n′ , c)} erfüllt auch (ii). In analoger Weise wie oben erhalten wir
einen Widerspruch.
Man kann also D auffassen als Abbildung φ : N → A. Die Eigenschaft (i) bedeutet
φ(1) = a, (ii) besagt φ(n′ ) = g(φ(n)).
Wäre φ̃ eine weitere Funktion mit φ̃(1) = a und mit φ̃(n′ ) = g(φ̃(n)), und betrachtet
man φ̃ als Teilmenge D̃ von N × A, so erfüllt D̃ Eigenschaften (i), (ii). Weil wir schon
wissen, dass D die kleinste solche Menge ist, folgt D ⊆ D̃. Da aber beide Funktionen
sind, muss D = D̃ bzw. φ = φ̃.
❑
2.3.4 Bemerkung. Satz 2.3.3 rechtfertigt rekursive Definitionen:
Zum Beispiel die Funktion n 7→ xn , wobei x in einem Körper K liegt. Dafür
nehmen wir A = K, a = x und g : K → K, y 7→ yx. Nach Satz 2.3.3 ist dann xn
für alle n ∈ N eindeutig definiert.
Genauso kann man n 7→ nx definieren.
Q
Um n 7→ nk=1 c(k) zu definieren, wenn c : N → K ist, wenden wir Satz 2.3.3
mit A = N × K, a = (1, c(1)) und g : N × K → N × K, (n, x) 7→ (n′ , x · c(n′ )) an,
Q
und definieren nk=1 c(k) als die zweite Komponente von φ(n).
P
Genauso kann man n 7→ nk=1 c(k), n 7→ maxnk=1 c(k) und ähnliche Ausdrücke
definieren.
Für
n
P
k=1
c(k) schreiben wir auch c(1) + · · · + c(n). Entsprechend setzen wir
c(1) · · · · · c(n) :=
n
Y
k=1
n
c(k) und max c(k) = max(c(1), . . . , c(n)).
k=1
Als weitere Anwendung des Rekursionssatzes erhalten wir, dass die natürlichen
Zahlen im Wesentlichen eindeutig sind.
2.3.5 Korollar (Eindeutigkeitssatz). Seien N und Ñ Mengen mit ausgezeichneten Elementen 1 ∈ N und 1̃ ∈ Ñ und Abbildungen ′ : N → N, ˜ : Ñ → Ñ, sodass für beide
die Axiome (S1), (S2) und (S3) gelten. Dann gibt es eine eindeutige bijektive Abbildung
g = ϕ(n′ ), n ∈ N.
ϕ : N → Ñ mit ϕ(1) = 1̃ und ϕ(n)
Beweis. Wendet man den Rekursionssatz an auf A = Ñ, a = 1̃, und g = ˜, so folgt, dass
g = ϕ(n′ ), n ∈ N.
genau eine Abbildung ϕ : N → Ñ existiert mit ϕ(1) = 1̃ und ϕ(n)
Durch Vertauschung der Rollen von N und Ñ erhält man eine Abbildung ψ : Ñ → N
mit ψ(1̃) = 1 und ψ(x)′ = ψ( x̃), x ∈ Ñ.
Betrachte die Abbildung Φ = ψ ◦ ϕ : N → N. Es gilt Φ(1) = 1 und
g = (ψ ◦ ϕ)(n′ ).
Φ(n)′ = (ψ(ϕ(n)))′ = ψ(ϕ(n))
Die identische Abbildung idN hat die selben Eigenschaften, also folgt nach der
Eindeutigkeitsaussage des Rekursionssatzes Φ = idN . Analog zeigt man ϕ ◦ ψ = idÑ ,
also ist ϕ bijektiv und es gilt ϕ−1 = ψ.
❑
2.3. DIE NATÜRLICHEN ZAHLEN
19
Wenn wir uns den Beweis des Rekursionssatzes nochmals anschauen, so haben wir
gezeigt, dass D eine Funktion auf N ist, es also zu jedem n ∈ N genau ein b ∈ A gibt
mit (n, b) ∈ D, indem wir die Menge M aller in diesem Sinne guten“n ∈ N hernehmen
”
und davon zeigen, dass sie die Voraussetzungen von (S 3) erfüllen.
Diese Vorgangsweise kann man auf alle Aussagen A(n) ausdehnen, die für alle
natürliche Zahlen n gelten sollen. Das führt zum so genannten:
Prinzip der vollständigen Induktion: Für jedes n ∈ N sei A(n) eine Aussage über die
natürliche Zahl n. Gilt
(i) Induktionsanfang: Die Aussage A(1) ist wahr.
(ii) Induktionsschritt: Für jedes n ∈ N ist wahr, dass aus der Gültigkeit von A(n) die
Gültigkeit von A(n′ ) folgt.
Dann ist die Aussage A(n) für jede natürliche Zahl n richtig.
Um das einzusehen, betrachte man die Menge M aller n ∈ N, für die A(n) richtig
ist. Ist nun A(1) richtig, so ist 1 ∈ M, und aus A(n) ⇒ A(n′ ) sehen wir, dass mit m ∈ M
auch m′ ∈ M. Nach Axiom (S 3) ist M = N. Also ist A(n) für jede natürliche Zahl n
richtig.
Als Anwendung der Beweismethode der vollständigen Induktion bringen wir die
später verwendete Bernoullische Ungleichung.
2.3.6 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, und bezeichnen wir das multiplikative neutrale Element mit 1K , so folgt für x ∈ K, x ≥ −1K , und n ∈ N, dass
(1K + x)n ≥ 1K + nx .
Beweis. Induktionsanfang: Ist n = 1, so besagt die Bernoullische Ungleichung (1K +
x)n = 1K + x ≥ 1K + x, was offenbar stimmt.
Induktionsschritt: Angenommen sie sei nun für n ∈ N richtig. Dann folgt wegen 1K +
x ≥ 0, dass
′
(1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 ≥ 1K + n′ x .
❑
Eine andere unmittelbare Anwendung des Beweisprinzipes der vollständigen InP
duktion ist die Verifikation der offensichtlich für Ausdrücke wie nk=1 c(k) geltenden
Rechenregeln. Zum Beispiel das Distributivgesetz
a
n
X
k=1
c(k) =
n
X
(ac(k)).
k=1
P
P
Induktionsanfang: Ist n = 1, so gilt a 1k=1 c(k) = ac(1) = 1k=1 (ac(k)).
Induktionsschritt: Angenommen die Rechenregel gilt für n, so rechnen wir:
a
n′
X
k=1

 n

 n

X

X
′



c(k) = a( c(k) + c(n )) = a  c(k) + ac(n′ ) =
k=1
k=1
KAPITEL 2. DIE REELLEN ZAHLEN
20
n
X
(ac(k)) + ac(n′ ) =
k=1
n′
X
(ac(k)).
k=1
Entsprechend zeigt man auch andere Rechenregeln für solche induktiv definierten Ausdrücke.
Wir kommen nun zur Diskussion der algebraischen Operationen Addition und Multiplikation, sowie der Ordnungsrelation auf N. Ihre Existenz und ihre Eigenschaften
müssen wir nun mit mathematischer Strenge herleiten, d.h. sie alleine aus den Axiomen
(S 1),(S 2),(S 3) mittels logischer Schlüsse zeigen. Hauptinstrument dabei wird wieder
der Rekursionssatz Satz 2.3.3 sein.
2.3.7 Definition. Wir definieren für jedes m ∈ N Abbildungen +m : N → N und
·m : N → N rekursiv:
+m (1) := m′ und +m (n′ ) = (+m (n))′ ,
·m (1) := m und ·m (n′ ) = +m (·m (n)).
Weiters definieren wir Relationen < und ≤ auf N durch
n < m : ⇐⇒ (∃t ∈ N : +t (n) = m),
n ≤ m : ⇐⇒ (n = m) oder (n < m).
Sind m, n ∈ N, so schreibt man
+m (n) =: m + n, ·m (n) =: m · n,
und spricht von der Addition bzw. Multiplikation auf N.
2.3.8 Satz.
Für jedes m ∈ N sind die Abbildungen +m und ·m injektiv, wobei +m (n) , m für
alle n ∈ N.
Die Addition im Bereich N der natürlichen Zahlen erfüllt die Gesetze
Für alle a, b, c ∈ N gilt (a + b) + c = a + (b + c). (Assoziativität)
Für alle a, b ∈ N gilt a + b = b + a. (Kommutativität)
sowie die Kürzungsregel
Sind n, m, k ∈ N und gilt k + m = k + n, so folgt m = n.
Die Multiplikation ist ebenfalls assoziativ, kommutativ und erfüllt die Kürzungsregel. Zusätzlich gilt noch
Für jedes a ∈ N ist a · 1 = 1 · a = a. (Existenz des neutralen Elementes)
Die Addition hängt mit der Multiplikation zusammen über das Distributivgesetz
Für a, b, c ∈ N gilt stets (b + c) · a = (b · a) + (c · a).
Die Relation ≤ ist eine Totalordnung mit 1 als kleinstes Element, und es gilt
m < n ⇐⇒ m ≤ n und m , n. Zudem gelten folgende Verträglichkeiten mit
den Operationen + und ·:
2.3. DIE NATÜRLICHEN ZAHLEN
21
Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a + c < b + c (a + c ≤ b + c).
Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a · c < b · c (a · c ≤ b · c).
Es gilt weiters
Sind n, m, l ∈ N mit n + l < m + l (n + l ≤ m + l) oder n · l < m · l (n · l ≤ m · l),
so folgt n < m (n ≤ m).
Sind n, m ∈ N, n < m, so gibt es ein eindeutiges t ∈ N, sodass m = n + t.
Wir setzen in diesem Falle
m − n := t.
(2.2)
Sind m, n, t ∈ N, t < n < m, so folgt n − t < m − t.
Sind l, m, n ∈ N, n + m < l, so folgt n < l − m und
l − (m + n) = (l − m) − n.
(2.3)
Beweis.
Zur Assoziativität von +:
Seien k, m ∈ N fest gewählt, wir führen Induktion nach n durch.
Induktionsanfang: (k + m) + 1 = +k (m)′ = +k (m′ ) = k + (m + 1).
Induktionsschritt: Nach Induktionsvoraussetzung gilt (k + m) + n = k + (m + n).
Es folgt
(k + m) + (n′ ) = +k+m (n′ ) = +k+m (n)′ = ((k + m) + n)′ =
= (k + (m + n))′ = +k (m + n)′ = +k ((m + n)′ ) = k + (m + n′ ),
wobei letztere Gleichheit wegen des schon gezeigten Induktionsanfangs folgt.
Zur Kommutativität von +:
Wir zeigen ∀m, n ∈ N : m + n = n + m mittels Induktion nach m.
Induktionsanfang (m = 1): Wir zeigen ∀n ∈ N : 1 + n = n + 1 mittels Induktion
nach n. Der Fall n = 1 ist klar, denn 1 + 1 = 1 + 1. Für den Induktionsschritt
n → n′ gehen wir aus von der Induktionsvoraussetzung 1 + n = n + 1. Daraus
folgt
n′ + 1 = n′′ = (n + 1)′ = (1 + n)′ = 1 + n′ .
Induktionsschritt (m → m′ ): Wir zeigen
(∀n ∈ N : m + n = n + m) =⇒ (∀n ∈ N : m′ + n = n + m′ ).
Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1.
Nach der bereits bewiesenen Aussage (Induktionsanfang (m = 1)) ∀l ∈ N :
1 + l = l + 1, gilt m′ + 1 = 1 + m′ .
Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ + n =
n + m′ und wir erhalten
∗
m′ + n′ = (m′ + n)′ = (n + m′ )′ = (n + m)′′ = (m + n)′′ =
∗
= (m + n′ )′ = (n′ + m)′ = n′ + m′ .
An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m 7→ m′ ) benützt worden.
KAPITEL 2. DIE REELLEN ZAHLEN
22
Zur Injektivität von +m und der Tatsache, dass +m (n) , m, für alle n ∈ N:
Für m = 1 ist +m (n) = n′ . Nach (S 1) ist +1 injektiv und nach (S 2) gilt +1 (n) , 1.
Sei nun m ∈ N und +m injektiv und erfülle +m (n) , m für alle n ∈ N.
Es folgt +m′ (n) = m′ + n = m + (n + 1) = +m (n′ ). Also ist +m′ die Zusammensetzung der injektiven Abbildungen (n 7→ n′ ) und +m und somit selbst injektiv.
Aus m + 1 = m′ = +m′ (n) = (m + n) + 1 folgt wegen der Injektivität von +1 , dass
m = m + n = +m (n) im Widerspruch zur Induktionsvoraussetzung.
Die Kürzungsregeln für + folgt sofort aus der Injektivität von +k .
Es gilt a · 1 = 1 · a = a, a ∈ N:
Unmittelbar aus der Definition 2.3.7 folgt a · 1 = ·a (1) = a. Die zweite Gleichheit
zeigen wir mittels Induktion nach a:
Induktionsanfang (a = 1): 1 · a = 1 · 1 = 1 = a.
Induktionsschritt (a → a′ ): Wir nehmen also 1 · a = a an und schließen
1 · (a′ ) = ·1 (a′ ) = +1 (·1 (a)) = +1 (1 · a) = 1 + a = a′ .
Zur Kommutativität von ·:
Wir zeigen ∀m, n ∈ N : m · n = n · m mittels Induktion nach m.
Induktionsanfang (m = 1): Nach dem letzten Punkt gilt ∀n ∈ N : 1 · n = n = n · 1.
Induktionsschritt (m → m′ ): Wir zeigen
(∀n ∈ N : m · n = n · m) =⇒ (∀n ∈ N : m′ · n = n · m′ ).
Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1.
Wieder nach dem letzten Punkt gilt (m′ ) · 1 = m′ = 1 · m′ .
Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ · n = n · m′
und wir erhalten
m′ · n′ = m′ + (m′ · n) = m′ + (n · m′ ) = (m + 1) + (n + (n · m)) =
∗
(n + 1) + (m + (n · m)) = (n + 1) + (m + (m · n)) =
∗
n′ + (m · n′ ) = n′ + (n′ · m) = n′ · m′ .
An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m 7→ m′ ) benützt worden.
Zum Distributivgesetz:
Vollständige Induktion nach a:
Induktionsanfang (a = 1): Da 1 bezüglich · ein neutrales Element ist, folgt
(b + c) · 1 = b + c = (b · 1) + (c · 1).
Induktionsschritt:
∗
(b + c) · (a + 1) = (b + c) + ((b + c) · a) = (b + c) + ((b · a) + (c · a)) =
(b + (b · a)) + (c + (c · a)) = (b · (a + 1)) + (c · (a + 1)).
An der mit ∗ gekennzeichneten Stelle ist die Induktionsvoraussetzung eingegangen.
2.3. DIE NATÜRLICHEN ZAHLEN
23
Zur Assoziativität von ·:
Wir zeigen a · (b · c) = (a · b) · c mittels Induktion nach b.
Induktionsanfang: a · (1 · c) = a · c = (a · 1) · c.
Induktionsschritt: Nach Induktionsvoraussetzung gilt also (a · b) · c = a · (b · c).
Mittels Distributivgesetz folgt
(a · (b + 1)) · c = ((a · b) + (a · 1)) · c = ((a · b) · c) + ((a · 1) · c) =
(a · (b · c)) + (a · (1 · c)) = a · ((b · c) + (1 · c)) = a · ((b + 1) · c).
Zur Totalität von ≤ und zur Tatsache 1 ≤ n, n ∈ N:
Wir wollen zeigen, dass je zwei n, m ∈ N bezüglich ≤ vergleichbar sind, was wir
mittels Induktion nach m beweisen werden.
Für m = 1 zeigt man, leicht mittels Induktion nach n, dass immer n = 1, oder
∃t ∈ N, n = 1 + t, also immer 1 ≤ n.
Gelte die Vergleichbarkeit von m mit allen n ∈ N. Um sie für m′ zu zeigen,
machen wir eine Fallunterscheidung: Ist m = n, so folgt n + 1 = m′ also n ≤ m′ .
Aus n < m folgt m = n + t für ein t ∈ N, und daher m′ = n + (t + 1), also n < m′ .
Ist n = m + 1, so folgt m′ = n.
Ist schließlich m < n, n , m + 1, so gilt n = m + t mit t , 1. Aus der schon
bewiesenen Vergleichbarkeit mit 1 folgt, dass 1 < t, und somit t = 1 + s, s ∈ N.
Aus der Assoziativität folgt n = m′ + s, also m′ < n.
Die Reflexivität von ≤ ist klar.
m < n ⇐⇒ ( m ≤ n und m , n ), folgt unmittelbar aus der Definition und
der Tatsache, dass aus m < n, dh. n = m + k mit einem k ∈ N, aus m = n der
Widerspruch m = m + k = +m (k) folgt.
Zur Transitivität von < und damit ≤:
Sei k, l, m ∈ N und k ≤ l, l ≤ m. Ist k = l oder l = m, so sieht man sofort, dass
k ≤ m.
Im Fall k < l, l < m gibt es i, j ∈ N mit k + i = l, l + j = m. Es folgt k + (i + j) = m
und daher k < m.
Die Antisymmetrie von ≤ folgt, da aus n ≤ m und m ≤ n im Falle m , n wegen
dem vorletzten Punkt und wegen der Transitivität von < folgt, dass n < n, was
dem vorletzten Punkt widersprucht.
Zur Verträglichkeit von < mit + und ·:
Sei n < m und k ∈ N. Somit ist n + t = m mit t ∈ N, und es gilt
m + k = (n + t) + k = n + (t + k) = n + (k + t) = (n + k) + t,
sowie
m · k = (n + t) · k = (n · k) + (t · k).
Also folgt n + k < m + k und n · k < m · k.
KAPITEL 2. DIE REELLEN ZAHLEN
24
Die Injektivität von ·k bzw. - was das selbe ist - die Kürzungsregel für · folgt nun
aus den gezeigten Eigenschaften von ≤:
Seien k, m, n ∈ N mit m , n. Wegen der Totalität gilt m < n oder n < m, was mit
der Verträglichkeit von < mit · bedingt, dass k · m < k · n oder k · n < k · m und
somit k · m , k · n.
Zum Kürzen in Ungleichungen:
Aus n + l < m + l folgt definitionsgemäß m + l = (n + l) + k für ein k ∈ N. Gemäß
der Kürzungsregel für + folgt m = n + k und somit n < m.
Sei nun n ·l < m·l. Wäre m ≤ n, so folgte aus dem letzten Punkt der Widerspruch
m · l ≤ n · l. Wegen der Totalität muss n < m.
Zur Wohldefiniertheit von m − n:
Sei also n < m. Definitionsgemäß ist m = n + t für ein t ∈ N. Ist nun m = n + s für
eine weitere Zahl s ∈ N, so folgt aus der Kürzungsregel für + und n + t = n + s,
dass s = t. Also ist die m − n := t eindeutig dadurch definiert, dass n + t = m.
Zur Verträglichkeit von < mit −:
Ist t < n < m, so folgt n = t + s und m = n + l für s, l ∈ N, und weiters
m = t + (l + s). Somit ist m − t = l + s und n − t = s, und daher n − t < m − t.
Zu (2.3):
Die Ungleichung m + n < l bedeutet l = (m + n) + k für ein eindeutiges k ∈ N.
Definitionsgemäß ist daher k = l − (m + n). Andererseits gilt wegen m < m + n < l
auch l = m + s, s ∈ N.
Wegen der Kürzungsregel für + folgt s = n + k, und somit n < s = l − m.
Außerdem ist k = s − n = (l − m) − n.
❑
2.3.9 Bemerkung. Ist Ñ eine Kopie von N wie in Korollar 2.3.5, und werden die Operationen + und ·, sowie ≤ auf Ñ genauso definiert wie auf N, so sieht man leicht, dass
die nach Korollar 2.3.5 existierende Abbildung ϕ : N → Ñ mit den Operationen und ≤
verträglich ist:
ϕ(n + m) = ϕ(n) + ϕ(m), ϕ(n · m) = ϕ(n) · ϕ(m),
n ≤ m ⇔ ϕ(n) ≤ ϕ(m).
Folgende Eigenschaft der natürlichen Zahlen werden wir oft verwenden.
2.3.10 Satz. Ist ∅ , T ⊆ N, so hat T ein Minimum.
Beweis. Wir nehmen das Gegenteil an. Sei
M = {n ∈ N : ∀m ∈ T : n < m}.
Es ist nun 1 ∈ M, da ja sonst 1 das Minimum von T wäre.
Ist n ∈ M, und m ∈ T , so gilt n < m. Daraus schließen wir n + 1 ≤ m.
Wäre n + 1 = m0 für ein m0 ∈ T , so hätte T das Minimum m0 . Wir nehmen aber an,
dass es ein solches nicht gibt.
2.3. DIE NATÜRLICHEN ZAHLEN
25
Also gilt immer n + 1 < m, m ∈ T , bzw. n + 1 ∈ M. Somit folgt M = N. Ist
m ∈ T ⊆ N, so folgt m ∈ M und daher der Widerspruch m < m.
❑
Diese Eigenschaft der natürlichen Zahlen können wir hernehmen, um folgende Varianten des Prinzips der vollständigen Induktion zu rechtfertigen. Zum Beispiel ist es
oft bequemer die folgende Version zu benützen:
2.3.11 Bemerkung. Sei A(n), n ∈ N, eine Aussage über die natürliche Zahl n. Gilt
(i) Die Aussage A(1) ist wahr.
(ii) Es gelte für jedes n ∈ N, n > 1: Ist die Aussage A(m) wahr für alle m < n, so ist
auch A(n) wahr.
Dann ist die Aussage A(n) für alle n ∈ N wahr. Denn wäre die Menge der n ∈ N, für die
A(n) falsch ist, nicht leer, so hätte sie ein Minimum n. Wegen (i) ist aber n > 1, wegen
(ii) ist A(n) wahr, was offensichtlich ein Widerspruch ist.
Oft ist eine Aussage auch erst ab einer gewissen Zahl n0 richtig.
2.3.12 Bemerkung. Gilt
(i) Die Aussage A(n0 ) ist wahr.
(ii) Ist A(n) wahr für ein n ≥ n0 , dann ist A(n + 1) wahr.
oder gilt
(i) Die Aussage A(n0 ) ist wahr.
(ii) Ist n > n0 und ist A(m) wahr für alle m mit n0 ≤ m < n, dann ist A(n) wahr.
Dann ist die Aussage A(n) für alle n ≥ n0 richtig.
2.3.13 Bemerkung. Mit fast dem selben Beweis wie in Lemma 2.3.6 jedoch mit einer
Induktion bei 2 startend zeigt man, dass für x ≥ −1K und x , 0 sowie n ≥ 2 sogar
(1K + x)n > 1K + nx .
Induktionsanfang: Ist n = 2, so gilt wegen x2 > 0, dass (1K + x)2 = 1K + 2x + x2 > 1K + 2x.
Induktionsschritt: Angenommen die Ungleichung ist für n ∈ N richtig. Dann folgt wegen 1K + x ≥ 0 und nx2 > 0, dass
′
(1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 > 1K + n′ x .
Klarerweise haben unendliche Teilmengen von N kein Maximum. Aber wie intuitiv
klar ist, hat jede endliche Teilmenge einer total geordneten Menge ein Maximum und
ein Minimum. Um das exakt nachzuweisen, benötigen wir die genaue Definition von
Endlichkeit.
2.3.14 Definition. Eine nichtleere Menge M heißt endlich, wenn es ein k ∈ N und eine
bijektive Funktion f : {n ∈ N : n ≤ k} → M gibt. Die Zahl k ist dann die Mächtigkeit
von M 4 . Man sagt auch, dass M genau k Elemente hat. Die leere Menge nennen wir
auch endlich, und ihre Mächtigkeit sei Null.
2.3.15 Bemerkung. Man zeigt elementar durch vollständige Induktion nach der
Mächtigkeit der endlichen Menge M, dass alle ihre Teilmengen auch endlich sind.
4 Damit die Mächtigkeit wohldefiniert ist, muss man noch zeigen, dass es im Fall k , k keine bijektive
1
2
Funktion von {n ∈ N : n ≤ k1 } auf {n ∈ N : n ≤ k2 } gibt.
KAPITEL 2. DIE REELLEN ZAHLEN
26
Mit vollständiger Induktion nach der Mächtigkeit einer endlichen Teilmenge beweist man:
2.3.16 Lemma. Jede endliche nichtleere Teilmenge M einer total geordneten Menge hT, ≤i hat ein Minimum und ein Maximum, das wir mit min(M) bzw. mit max(M)
bezeichnen.
Insbesondere gilt diese Aussage für endliche Teilmengen von angeordneten
Körpern und von N.
Beweis. Hat M nur ein Element, d.h. M = {m}, so ist klarerweise m das Maximum von
M.
Angenommen alle M̃ ⊆ T mit n Elementen haben ein Maximum. Hat nun M ⊆ T
genau n + 1 Elemente und ist m1 ∈ M, so hat M \ {m1 } genau n Elemente und laut
Induktionsvoraussetzung ein Maximum m2 ∈ M \ {m1 }. Da hT, ≤i eine Totalordnung
ist, gilt m1 ≤ m2 oder m1 ≥ m2 . Im ersten Fall ist dann m2 das Maximum von M und
im zweiten ist m1 das Maximum von M.
❑
Eine immer wieder verwendete Tatsache ist im folgenden Lemma vermerkt.
2.3.17 Lemma. Sei M ⊆ N nicht endlich. Dann gibt es eine streng monoton wachsende
Bijektion φ von N auf M. Für eine solche gilt immer φ(n) ≥ n.
Beweis. Sei g : M → M definiert durch g(s) = min{m ∈ M : m > s}, und sei
a = min M. Man beachte, dass g(s) für alle s ∈ M definiert ist, da {m ∈ M : m > s}
voraussetzungsgemäß niemals leer ist.
Nach dem Rekursionssatz gibt es eine eindeutige Abbildung φ : N → M mit φ(1) =
a = min M und so, dass φ(n + 1) = g(φ(n)) = min{m ∈ M : m > φ(n)}.
Offensichtlich gilt φ(n + 1) > φ(n). Daraus folgt durch vollständige Induktion, dass
φ(l) > φ(n), wenn l > n. Also ist φ streng monoton wachsende und somit auch injektiv.
Durch vollständige Induktion zeigt man auch leicht, dass φ(n) ≥ n für alle n ∈ N.
Wäre ein m1 ∈ M nicht im Bild von φ, so ist klarerweise m1 > min M = φ(1).
Angenommen m1 > φ(n). Dann ist m1 ∈ {m ∈ M : m > φ(n)} und wegen m1 ,
φ(n + 1) = min{m ∈ M : m > φ(n)} muss m1 > φ(n + 1).
Es folgt, dass φ(n) < m1 für alle n ∈ N, was aber φ(m1 ) ≥ m1 widerspricht.
❑
2.4 Der Ring der ganzen Zahlen
Im Bereich der natürlichen Zahlen haben wir zuletzt Operationen + und · definiert. Ist
m < n, so haben wir auch n − m ∈ N definiert. Wir wollen nun aus den natürlichen Zahlen die ganzen Zahlen Z konstruieren, und die Operationen + und · auf Z so fortsetzen,
dass wir einen Ring hZ, +, ·i erhalten. Die Menge Z zu definieren, ist kein Problem:
2.4.1 Definition. Seien N1 und N2 zwei disjunkte Kopien der natürliche Zahlen, und
sei 0 ein Element, das in keiner dieser Mengen enthalten ist5 . Wir definieren
˙ ∪N
˙ 2.
Z := N1 ∪{0}
5 Man
kann z.B. für N j einfach die Menge N × { j} hernehmen, und für 0 das Element (1, 3)
2.4. DER RING DER GANZEN ZAHLEN
27
Ist ϕ : N1 → N2 eine bijektive Abbildung wie in Korollar 2.3.5, so definieren wir eine
Abbildung − : Z → Z


ϕ(n) , n ∈ N1



0 , n=0
−n = 


 ϕ−1 (n) , n ∈ N
2
Schreiben wir nun N für N1 , so können wir Z als
˙ ∪N
˙
−N∪{0}
anschreiben. Man erkennt unschwer, dass − eine Bijektion ist, die mit sich selber zusammengesetzt die Identität ergibt, also eine Involution ist.
Nun definieren wir die Operationen auf Z in der Art und Weise, wie wir sie der
Anschauung nach erwarten.
2.4.2 Definition. Für n ∈ N setzen wir sgn(n) := 1, sgn(−n) := −1, sgn(0) = 0 sowie
|n| := n, | − n| := n und |0| := 0. Weiters sei + : Z × Z → Z definiert durch


p + q , p, q ∈ N





−(|p| + |q|) , −p, −q ∈ N





p − |q| , p, −q ∈ N, p > −q






−(|q|
− p) , p, −q ∈ N, p < −q



−(|p|
− q) , −p, q ∈ N, − p > q ,
p + q := 




q − |p| , −p, q ∈ N, − p < q





0 , q = −p






p
, q=0




q , p=0
und · : Z × Z → Z durch


|p| · |q| ,



−(|p|
· |q|) ,
p · q := 



0 ,
q, p , 0, sgn(q) = sgn(p)
q, p , 0, sgn(q) = − sgn(p) .
q=0∨ p=0
2.4.3 Satz. hZ, +, ·i ist ein kommutativer Integritätsring mit Einselement. Es gilt also:
Die Addition ist kommutativ und assoziativ, 0 ist ein bzgl. + neutrales Element
und −p ist das zu p ∈ Z bzgl. + inverse Element. Also gelten (A1)-(A4).
Die Multiplikation ist kommutativ und assoziativ, und 1 ist ein bzgl. · neutrales
Element. Also gelten (M1),(M2),(M4).
Es gilt das Distributivgesetz.
Aus p , 0 ∧ q , 0 folgt pq , 0 (Integritätseigenschaft).
Beweis. Seien p, q ∈ Z. Zunächst folgen p + q = q + p und p · q = q · p unmittelbar aus
der Definition und eben der Tatsache, dass diese Operationen auf N kommutativ sind.
Ebenfalls unmittelbar aus der Definition sieht man, dass p + 0 = p und p · 1 = p.
Also ist 0 ein bezüglich + und 1 ein bezüglich · neutrales Element. Genauso elementar
verifiziert man p + (−p) = 0 und p · q , 0, wenn p und q beide , 0.
Es bleibt die Assoziativität und das Distributivgesetz nachzuprüfen. Das ist in
der Tat mühsam und durch zahlreiche Fallunterscheidungen zu bewerkstelligen. Wir
wollen daher nur r + (q + p) = (r + q) + p im exemplarischen Fall r, q ∈ N, − p ∈ N
KAPITEL 2. DIE REELLEN ZAHLEN
28
betrachten:
Ist |p| > r + q, so folgt (r + q) + p = −(|p| − (r + q)), und nach (2.3) ist dieser
Ausdruck gleich −((|p| − q) − r). Wegen |p| − q > r und |p| > q folgt definitionsgemäß
−((|p| − q) − r) = r + (−(|p| − q)) = r + (p + q).
Im Falle |p| = r + q gilt einerseits (r + q) + p = 0 und andererseits wegen |p| > q
und |p| − q = r (siehe (2.2)), dass r + (q + p) = r + (−(|p| − q)) = 0.
Sei nun |p| < r + q. Dann folgt (r + q) + p = (r + q) − |p| =: k ∈ N. Also ist k jene
Zahl, sodass |p| + k = r + q.
Ist q > |p|, so gilt andererseits r + (q + p) = r + (q − |p|), und wegen den bekannten
Rechenregeln auf N, |p| + (r + (q − |p|)) = r + q, also k = r + (q + p).
Wenn q = |p|, so folgt r+(q+ p) = r, und ebenfalls |p|+r = r+q, d. h. k = r+(q+ p).
Ist schließlich q < |p|, so folgt r + (q + p) = r + (−(|p| − q)). Da |p| < r + q folgt
r > |p| − q, und somit r + (−(|p| − q)) = r − (|p| − q) =: l ∈ N. Das ist also jene Zahl,
sodass (|p| − q) + l = r. Addiert man hier q und verwendet die Assoziativität von + auf
N, so folgt |p| + l = r + q, also l = k.
❑
2.4.4 Bemerkung. In Integritätsringen gilt die Kürzungsregel:
m , 0, xm = ym ⇒ y = x,
denn xm − ym = (x − y)m = 0 ⇒ x − y = 0.
Sind p, q ∈ Z, so werden wir im Folgenden wie schon zuvor für p + (−q) den
Ausdruck p − q verwenden.
Wir benötigen noch eine Totalordnung auf Z, welche ≤ auf N erweitert.
2.4.5 Definition. Wir definieren für p, q ∈ Z
q < p ⇔ p − q ∈ N und q ≤ p ⇔ q < p ∨ q = p.
(2.4)
Man sieht leicht ein, dass mit ≤ eine Totalordnung auf Z definiert ist, die ≤ auf N
erweitert, und die mit den Operationen + und · verträglich ist.
2.4.6 Bemerkung. Wenn man sich an die Definition eines angeordneten Körpers in
Definition 2.2.1 erinnert, so haben wir die Existenz einer Teilmenge P ⊆ K verlangt,
die (P1) - (P3) erfüllt. Genau diese Situation haben wir hier mit P = N, nur, dass Z
kein Körper, sondern ein Ring ist.
Die von uns definierte Totalordnung ≤ auf Z erfüllt nun auch alle Eigenschaften,
die für die entsprechende Totalordnung auf einem angeordneten Körper gelten (vgl.
Lemma 2.2.2). Ausgenommen sind nur die Eigenschaften, die sich auf die multiplikativ
Inverse beziehen.
2.4.7 Bemerkung. Die ganzen Zahlen sind eindeutig in dem Sinn, dass wenn Z̃ neben Z
eine weitere Menge versehen mit einer Involution −̃ : Z̃ → Z̃, mit Operationen +̃, ˜· und
einer Relation ≤˜ ist, sodass Z̃ eine Kopie Ñ der natürlichen Zahlen enthält, Z̃ geschrieben werden kann als die disjunkte Vereinigung von −Ñ, {0} und Ñ, die Operationen +̃
und ˜· wie in Definition 2.4.2 durch die entsprechenden Operationen auf Ñ (siehe Bemerkung 2.3.9) definiert sind, und sodass ≤˜ wie in (2.4) definiert ist, es eine eindeutige
Bijektion φ : Z → Z̃ gibt, sodass
φ(−p) = −φ(p), φ(1) = 1̃, φ(n + 1) = φ(n)+̃1̃, p ∈ Z, n ∈ N.
2.4. DER RING DER GANZEN ZAHLEN
29
Um das zu zeige, setzt man einfach die Bijektion ϕ aus Korollar 2.3.5 zu einer Bijektion
φ von Z auf Z̃ gemäß der Forderung φ(−p) = −φ(p) fort. Die erhaltene Bijektion Z → Z̃
ist mit +, ·, − und ≤ verträglich. Siehe dazu auch Bemerkung 2.3.9.
Wir haben im Abschnitt über die natürlichen Zahlen für eine Zahl x aus einem
Körper ihre Potenzen xn , n ∈ N definiert (siehe Bemerkung 2.3.4). Das wollen wir auf
Z ausdehnen:
2.4.8 Definition. Sei hK, +, ·i ein Körper. Für eine ganze Zahl p und eine Zahl x ∈
K, x , 0 definieren wir
 p

,
p ∈N

 x

1
,
p
=0 .
xp = 


 1 , −p ∈ N
−p
x
2.4.9 Bemerkung. Dafür gelten die aus der Schule bekannten Rechenregeln (x ∈ K \
{0}, p, q ∈ Z):
1
x p xq = x p+q , (x p )q = x pq , x−p = p .
(2.5)
x
Den Beweis für diese Rechenregeln führt man durch vollständige Induktion für
p, q ∈ N, und dann durch Fallunterscheidung für den allgemeinen Fall p, q ∈ Z.
2.4.10 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, so gilt für n ∈ N und x, y ≥ 0
x < y ⇔ xn < yn ,
und für x, y > 0
x < y ⇔ x−n > y−n .
Beweis. Zunächst zeigt man leicht durch vollständige Induktion und mit Hilfe von
(P3), dass aus 0 < t immer 0 < tn folgt.
Ist x < y, so folgt im Falle x = 0 daher xn = 0 < yn . Ist 0 < x < y, so zeigt man
n
x < yn durch vollständige Induktion:
Für n = 1 ist xn < yn offensichltich. Gilt xn < yn , so folgt aus Lemma 2.2.2 und der
rekursiven Definition von xn (siehe Bemerkung 2.3.4)
xn+1 = xn · x < yn · x < yn · y = yn+1 .
Ist umgekehrt xn < yn , so muss x < y, da sonst y ≤ x, und aus dem eben bewiesenem
yn ≤ xn folgte.
Die letzte Behauptung folgt sofort aus x < y ⇔ x−1 > y−1 für alle x, y > 0.
❑
n
Also ist x 7→ x eine streng monoton wachsende Funktion und somit injektive
Funktion von P ∪ {0} nach P ∪ {0}. Wir werden später sehen, dass diese Funktionen in
vollständig angeordneten Körpern auch surjekiv sind.
Für p ∈ Z, p < 0 ist x 7→ x p eine streng monoton fallende Funktion und somit eine
injektive Funktion von P nach P.
Wir wollen nun nachweisen, dass das Dividieren mit Rest, wie in der Schule kennengelernt, auf gutem mathematischen
Fundament steht.
2.4.11 Satz. Sind m ∈ N, n ∈ Z, so gibt es eindeutige Zahlen l ∈ Z und r ∈ {0, . . . , m − 1}6 , sodass n = ml + r. Dabei ist
n ≥ 0 genau dann, wenn l ≥ 0.
6 {0, . . . , m
− 1} steht für {k ∈ N ∪ {0} : 0 ≤ k < m}
KAPITEL 2. DIE REELLEN ZAHLEN
30
Beweis. Sei zunächst n ∈ N ∪ {0} beliebig. Da die Menge aller l ∈ N ∪ {0} mit m · l + m > n nicht leer ist (n ist sicher in dieser
Menge), hat sie ein Minimum (Variante von Satz 2.3.10). Ist l = 0, so muss n ∈ {0, . . . , m − 1}, und ist l > 0, so folgt wegen
der Minimalität ml = m(l − 1) + m ≤ n < ml + m. Also muss immer n = ml + r für ein l ∈ N ∪ {0} und ein r ∈ {0, . . . , m − 1}.
Ist nun auch n = ml̂ + r̂ für lˆ ∈ N∪{0} und r̂ ∈ {0, . . . , m−1}, so folgt ml̂ +m > n und wegen der Minimalitätseigenschaft
von l auch lˆ ≥ l. Andererseits gilt ml̂ ≤ n, weshalb nicht l̂ > l sein kann, da sonst n ≥ ml̂ = ml + m(l̂ − l) ≥ ml + m wäre.
Somit gibt es eindeutige l ∈ N ∪ {0} und r ∈ {0, . . . , m − 1}, sodass n = ml + r.
Für n < 0 ist −n − 1 ≥ 0 und somit gibt es eindeutige s ∈ N ∪ {0}, t ∈ {0, . . . , m − 1}, sodass
−n − 1 = sm + t = (s + 1)m + (t − m), und daher sodass −n = (s + 1)m + (t − m + 1), bzw. n = −(s + 1)m + (−t + m − 1). Setzen wir
l = −(s+1) und r = −t+m−1, so sehen wir, dass n = ml+r für ein eindeutiges l < 0 und ein eindeutiges r ∈ {0, . . . , m−1}.
❑
2.4.12 Bemerkung. Die geraden (ungeraden) Zahlen sind genau alle ganzen Zahlen der Form 2k (2k + 1) für ein k ∈ Z. Aus
Satz 2.4.11 folgt insbesondere, dass jede gegebene ganze Zahl gerade oder ungerade ist, wobei aus der Eindeutigkeitsaussage
˙
in Satz 2.4.11 folgt, dass sie nicht gleichzeitig gerade und ungerade sein kann. Also gilt Z = 2Z∪(2Z
+ 1).
Entsprechendes gilt, wenn man 2 durch eine andere natürliche Zahl m ersetzt, nur, dass dann
˙
˙
Z = mZ∪(mZ
+ 1)∪˙ . . . ∪(mZ
+ m − 1).
2.4.13 Definition. Eine Zahl q ∈ N teilt eine Zahl p ∈ N, falls es ein m ∈ N gibt, sodass mq = p. Wir schreiben q|p dafür.
Außerdem setzen wir p : q := m7 .
Eine Zahl p ∈ N \ {1} heißt Primzahl, wenn p nur von 1 und p geteilt wird. Die Menge aller Primzahlen sei P.
2.4.14 Bemerkung.
Falls q|p, so folgt aus mq = p und 1 ≤ m, dass q ≤ p, wobei q = p genau dann, wenn m = 1.
Um zu sehen, ob eine Zahl p eine Primzahl ist, genügt es somit zu überprüfen, dass q 6 |p für alle q ∈ N, 1 < q < p.
Man sieht sofort, dass 2, 3, 5, . . . Primzahlen sind.
Ist n ∈ N \ {1} und M = {r ∈ N \ {1} : r|n}, so ist M nicht leer, da zumindest n ∈ M. Gilt M = {n}, so ist n
definitionsgemäß eine Primzahl. Anderenfalls sei m das kleinste Element von M und k so, dass km = n. Nun ist
m eine Primzahl, da sonst m = pq mit 1 < p, q < m, und weiter p(qk) = n. Es wäre p ∈ M im Widerspruch zur
Minimalität von m.
Insbesondere wird jede Zahl in N \ {1} von einer Primzahl geteilt.
2.4.15 Lemma. Seien a, b ∈ N und p ∈ P. Gilt p|(ab), so folgt p|a ∨ p|b.
Beweis. Sei T ⊆ P die Menge aller Primzahlen, sodass die Aussage falsch ist für gewisse a, b ∈ N. Wir bringen die Annahme
T , ∅ auf einen Widerspruch.
Sei also T , ∅ und p die kleinste Zahl in T (siehe Satz 2.3.10). Somit gibt es a, b ∈ N mit p 6 |a ∧ p 6 |b, aber p|(ab),
bzw. pn = ab für ein n ∈ N. Daher ist
S = {n ∈ N : ∃a, b ∈ N : p 6 |a ∧ p 6 |b ∧ pn = ab},
die Menge aller solchen n nicht leer. Somit hat auch diese Menge ein Minimum s. Seien c, d ∈ N, sodass p 6 |c, p 6 |d und
ps = cd. Aus den ersten beiden Tatsachen folgt c, d , p, c, d , 1, und daraus zusammen mit der Tatsache, dass p eine
Primzahl ist, folgt s > 1.
Nun muss c < p sein, da sonst c − p ∈ N und damit p(s − d) = (c − p)d, was s − d ∈ N implizieren und somit der
Minimalität von s widersprechen würde. Genauso gilt d < p.
Daraus schließen wir wegen ps = cd auf s < p. Gemäß Bemerkung 2.4.14 gibt es eine Primzahl p′ ≤ s < p, sodass
p′ |s, d.h. s = p′ s′ für ein s′ ∈ N, s′ < s. Somit folgt p′ (ps′ ) = cd, also p′ |(cd). Wegen der Minimalität von p muss p′ |c oder
p′ |d. O.B.d.A. sei c = c′ p′ , c′ ∈ N, womit
p′ (ps′ ) = p′ (c′ d) und daraus ps′ = c′ d
folgt. Nun widerspricht das aber ebenfalls der Minimalität von s.
❑
2.4.16 Satz. Ist n ∈ N \ {1}, so gibt es eindeutige Primzahlen p1 , . . . , pm ∈ P und Exponenten e1 , . . . , em ∈ N, sodass
e
n = p11 · . . . pemm .
Diese Zerlegung heißt Primfaktorzerlegung.
7 Da
wir in Z kürzen dürfen, ist p : q eindeutig definiert.
(2.6)
2.4. DER RING DER GANZEN ZAHLEN
31
Beweis. Wir zeigen zuerst die Existenz einer solche Zerlegung. Für n = 2 ist diese klar.
Angenommen für ein n > 2 gibt es zu allen k < n, k ≥ 2 eine solche Zerlegung. Nach Bemerkung 2.4.14 gibt es eine
Primzahl p ≤ n mit p|n. Ist n = p, so haben wir unsere Zerlegung. Ist p < n, so folgt n = (n : p)p, wobei nach Voraussetzung
n : p (< n) eine solche Zerlegung hat. Somit hat auch n eine solche Zerlegung.
Nach einer Variante des Prinzipes der vollständigen Induktion gibt es eine Primfaktorzerlegung für alle n ∈ N \ {1}.
Die Eindeutigkeit ist für n = 2 wieder klar, da alle Produkte der Form (2.6) einen Wert > 2 ergeben, außer für m = 1
und e1 = 1, p1 = 2.
Angenommen mit einem n > 2 ist die Primfaktorzerlegung eindeutig für alle k < n, k ≥ 2, und angenommen
f
f
e
q11 · . . . ql l = n = p11 · . . . pemm ,
e
mit l, m ∈ N und e1 , . . . , em , f1 , . . . , fl ∈ N sowie p1 , . . . , pm , q1 , . . . , ql ∈ P. Insbesondere gilt q1 |p11 · . . . pemm . Nach Lemma
2.4.15 muss q1 |p j und daher q1 = p j für ein j ∈ {1, . . . , m}. Durch Umnummerierung können wir q1 = p1 annehmen. Es
folgt
f
f −1
e −1
q11 · . . . ql l = n : q1 = p11 · . . . pemm .
Ist n : q1 = 1, so muss n = p1 = q1 und l = 1 = m, e1 = 1 = f1 . Sonst folgt wegen 1 < n : q1 < n aus unserer Annahme,
dass auch l = m und e j = f j sowie p j = q j , j = 1, . . . , l.
❑
Eine alternative Konstruktion von Z
Bis zum Ende dieses Abschnittes wird ein anderer Zugang wie oben zu den ganzen Zahlen vorgestellt. Der Vorteil
dieser etwas aufwendigeren Methode ist, dass die Beweise der Rechengesetze struktureller sind.
Sei ∼⊆ (N × N)2 die Relation
(x, n) ∼ (y, m) : ⇐⇒ x + m = y + n .
2.4.17 Lemma. Die Relation ∼ ist eine Äquivalenzrelation.
Beweis. Die Reflexivität und Symmetrie ist klar. Um zu zeigen, dass ∼ transitiv ist, seien (x, n) ∼ (y, m) und (y, m) ∼ (z, k)
gegeben. Dann gilt x + m = y + n und y + k = z + m. Es folgt
(x + k) + m = (x + m) + k = (y + n) + k = (y + k) + n = (z + m) + n = (z + n) + m ,
und wegen der Kürzungsregel in N daher x + k = z + n, d.h. (x, n) ∼ (z, k).
❑
2.4.18 Definition. Wir bezeichnen mit Z die Faktormenge (N × N)/∼ und sprechen von dem Ring der ganzen Zahlen.
Auf Z definieren wir algebraische Operationen +“ und ·“. Die Vorgangsweise dazu ist zunächst Addition und Multi”
”
plikation auf N × N zu definieren, und diese dann auf Z zu übertragen.
+:
(
(
(N × N)2
((x, n), (y, m))
·:
(N × N)2
((x, n), (y, m))
→
7→
→
7→
N×N
(x + y, n + m)
N×N
(xy + nm, xm + ny)
Die Motivation für diese Definition erhalten wir aus der formalen Rechnung
(x − n) + (y − m) = (x + y) − (n + m) ,
(x − n) · (y − m) = xy − ny − xm + nm = (xy + nm) − (xm + ny) .
2.4.19 Lemma. Die Operationen + und · auf N × N sind kommutativ, assoziativ und es gilt das Distributivgesetz.
Beweis. Seien (x, n), (y, m) ∈ N × N. Dann ist
(x, n) + (y, m) = (x + y, n + m) = (y + x, m + n) = (y, m) + (x, n) ,
(x, n) · (y, m) = (xy + nm, xm + ny) = (yx + mn, yn + mx) = (y, m) · (x, n) .
Sei zusätzlich (z, k) ∈ N × N. Dann gilt
(x, n) + (y, m) + (z, k) = (x + y, n + m) + (z, k) = (x + y) + z, (n + m) + k =
= x + (y + z), n + (m + k) = (x, n) + (y, m) + (z, k) .
Die Gültigkeit der Assoziativität der Multiplikation sowie des Distributivgesetzes rechnet man in genau der gleichen Weise
(nur deutlich mühsamer) nach.
❑
Um diese Operationen auf Z übertragen zu können benötigen die Verträglichkeit mit der Relation ∼.
KAPITEL 2. DIE REELLEN ZAHLEN
32
2.4.20 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt, dass auch
(x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gegeben. Dann gilt
(x + y) + (n̂ + m̂) = (x + n̂) + (y + m̂) = ( x̂ + n) + (ŷ + m) = ( x̂ + ŷ) + (n + m) ,
und wir sehen, dass (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂).
Um die Aussage für · zu zeigen, betrachten wir zuerst (x, n) ∼ ( x̂, n̂) und ein (y, m). Dann gilt
(xy + nm) + ( x̂m + n̂y) = (x + n̂)y + ( x̂ + n)m =
= ( x̂ + n)y + (x + n̂)m = ( x̂y + n̂m) + (xm + ny) ,
und wir erhalten (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Wegen der Kommutativität von · folgt auch, dass für (x, n) und (y, m) ∼ (ŷ, m̂)
stets (x, n) · (y, m) ∼ (x, n) · (ŷ, m̂) gilt. Insgesamt erhalten wir, dass für (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gilt
(x, n) · (y, m) ∼ ( x̂, n̂) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
❑
2.4.21 Definition. Auf Z seien zwei algebraische Operationen +“ und ·“ definiert durch: Sind a, b ∈ Z, so wähle
”
”
(x, n), (y, m) ∈ N × N mit [(x, n)]∼ = a und [(y, m)]∼ = b, und setze
a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ .
Dass durch diese Vorschrift tatsächlich zwei Funktionen definiert werden (Wohldefiniertheit), verdanken wir gerade
der Verträglichkeitsaussage Lemma 2.4.20.
Im nächsten Schritt definieren wir eine Relation ≤ auf Z. Dazu sei
(x, n) ≤ (y, m) : ⇐⇒ x + m ≤ y + n,
(x, n), (y, m) ∈ N × N .
Diese Relation ist mit der Relation ∼ verträglich, und sie ist schon fast eine Halbordnung:
2.4.22 Lemma. Die Relation ≤ auf N × N ist reflexiv, transitiv und total ((x, n) ≤ (y, m) ∨ (y, m) ≤ (x, n)).
Ist (x, n) ≤ (y, m) und (y, m) ≤ (x, n), so folgt (x, n) ∼ (y, m). Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt
(x, n) ≤ (y, m) ⇐⇒ ( x̂, n̂) ≤ (ŷ, m̂) .
Beweis. Die Reflexivität folgt unmittelbar aus der Definition. Sei (x, n) ≤ (y, m) und (y, m) ≤ (z, k). Dann gilt x + m ≤ y + n
und y + k ≤ z + m, und wir erhalten
(x + k) + m = (x + m) + k ≤ (y + n) + k = (y + k) + n ≤ (z + m) + n = (z + n) + m .
Daraus folgt nun x + k ≤ z + n, d.h. (x, n) ≤ (z, k). Die Totalität folgt aus der Tatsache, dass ≤ eine Totalordnung auf N ist.
Sei (x, n) ≤ (y, m) und (y, m) ≤ (x, n), dann gilt also x + m ≤ y + n und y + m ≤ x + n. Wir erhalten x + m = y + n, d.h.
(x, n) ∼ (y, m). Die letzte Aussage folgt wieder unmittelbar aus der Definition.
❑
Überträgt man nun die Relation ≤ in naheliegender Weise auf die Faktormenge Z, was nach dem letzten Lemma
möglich ist, so erhält man eine Totalordnung.
2.4.23 Definition. Seien a, b ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ . Dann schreiben wir a ≤ b, wenn gilt (x, n) ≤ (y, m).
2.4.24 Satz. Die Addition und Multiplikation auf Z sind kommutativ, assoziativ und es gilt das Distributivgesetz. Das
Element 0 := [(1, 1)]∼ bzw. 1 := [(2, 1)]∼ ist neutrales Element bezüglich + bzw. ·. Jedes Element besitzt ein additives
Inverses. Für · gilt die Kürzungsregel, d.h. ist a, b, c ∈ Z, c , 0, und ist a · c = b · c, so folgt a = b.
Die Relation ≤ ist eine Totalordnung. Für alle a, b, c ∈ Z, a ≤ b, gilt auch a + c ≤ b + c und, sofern c ≥ 0 ist, auch
a · c ≤ b · c. Umgekehrt, ist c > 0 und a · c ≤ b · c, so folgt a ≤ b.
Die natürlichen Zahlen N sind in Z eingebettet durch
φ:
(
N
x
→
7→
Diese Einbettung erhält Addition, Multiplikation und Ordnung.
Z
[(x + 1, 1)]∼
2.4. DER RING DER GANZEN ZAHLEN
33
Beweis. Die Gültigkeit von Assoziativität, Kommutativität sowie Distributivität folgt wegen Lemma 2.4.19.
Sei a = [(x, n)]∼ ∈ Z. Dann gilt
a + 0 = [(x, n)]∼ + [(1, 1)]∼ = [(x + 1, n + 1)]∼ = [(x, n)]∼ = a ,
sowie
a · 1 = [(x, n)]∼ · [(2, 1)]∼ = [(2x + n, x + 2n)]∼ = [(x, n)]∼ = a ,
also ist 0 neutrales Element der Addition und 1 neutrales Element der Multiplikation. Setze â := [(n, x)]∼ , dann gilt
a + â = [(x, n)]∼ + [(n, x)]∼ = [(x + n, n + x)]∼ = [(1, 1)]∼ = 0 ,
also hat a ein additives Inverses, nämlich â.
Wegen Lemma 2.4.22 ist ≤ auf Z eine Totalordnung. Seien a, b, c ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ , c = [(z, k)]∼ . Dann
gilt
a + c ≤ b + c ⇐⇒ (x + z, n + k) ≤ (y + z, m + k) ⇐⇒ x + z + m + k ≤ y + z + n + k
⇐⇒ x + m ≤ y + n ⇐⇒ a ≤ b .
Sei nun angenommen, dass a < b, d.h. dass x+m < y+n, und dass c ≥ 0, d.h. z ≥ k. Dann gibt es t ∈ N mit y+n = (x+m)+t.
Wegen z ≥ k folgt tz ≥ tk und daher auch (y + n)z = (x + m)z + tz ≥ (x + m)z + tk und schließlich
(x + m)k + (y + n)z ≥ (x + m)z + tk + (x + m)k = (x + m)z + (y + n)k .
Also haben wir (xk + nz) + (yz + mk) ≥ (xz + nk) + (yk + mz), und das heißt gerade a · c ≤ b · c.
Sei umgekehrt a · c ≤ b · c, d.h. nach obiger Rechnung (x + m)k + (y + n)z ≥ (x + m)z + (y + n)k, und c > 0, d.h. z > k.
Angenommen es wäre a > b, d.h. x + m > y + n. Dann gibt es t ∈ N mit (y + n) + t = x + m. Damit erhalten wir
tk + (y + n)(k + z) ≥ tz + (y + n)(z + k)
und daraus tk ≥ tz und schließlich k ≥ z, ein Widerspruch. Also gilt a ≤ b. Die Kürzungsregel für · folgt aus der gerade
bewiesenen für ≤.
Betrachte die Abbildung φ. Angenommen (x + 1, 1) ∼ (y + 1, 1), dann folgt x + 2 = y + 2, also x = y. D.h. φ ist injektiv.
Es gilt
φ(x) + φ(y) = [((x + 1) + (y + 1), 1 + 1)]∼ = [((x + y) + 1, 1)]∼ = φ(x + y) ,
φ(x) · φ(y) = ((x + 1)(y + 1) + 1, (x + 1) + (y + 1)) ∼ =
= (xy + x + y + 1 + 1, x + y + 1 + 1) ∼ = [(xy + 1, 1)]∼ = φ(xy) ,
φ(x) ≤ φ(y) ⇐⇒ (x + 1) + 1 ≤ (y + 1) + 1 ⇐⇒ x ≤ y .
❑
Folgendes Resultat liefert insbesondere, dass die hier konstruierten ganzen Zahlen eine Kopie der ganzen Zahlen aus
der Vorlesung sind.
2.4.25 Proposition. Versteht man die natürlichen Zahlen via φ eingebettet in Z wie in Satz 2.4.24, so gilt
˙ ∪N,
˙
Z = −N∪{0}
wobei diese drei Mengen disjunkt sind. Dabei gilt p ∈ N ⇔ p > 0 und p ∈ −N ⇔ p < 0.
Definieren wir sgn(x) = 0, wenn x = 0, sgn(x) = 1, wenn x ∈ N, und sgn(x) = −1, wenn x ∈ −N, und setzen
|p| = sgn(p)p, so gilt für p, q ∈ Z
und

p+q





−(|p| + |q|)





p − |q|







 −(|q| − p)
−(|p| − q)
p+q=




q − |p|





0





p



q


|p| · |q|



p·q =
 −(|p| · |q|)


0
,
,
,
,
,
,
,
,
,
,
,
,
p, q ∈ N
−p, −q ∈ N
p, −q ∈ N, p > −q
p, −q ∈ N, p < −q
−p, q ∈ N, − p > q
−p, q ∈ N, − p < q
q = −p
q=0
p=0
,
q, p , 0, sgn(q) = sgn(p)
q, p , 0, sgn(p) = − sgn(p)
q=0∨ p =0
Schließlich gilt p < q ⇔ q − p ∈ N und p ≤ q ⇔ (p = q ∨ p < q).
.
KAPITEL 2. DIE REELLEN ZAHLEN
34
Beweis. Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ > 0 = [(1, 1)]∼ , so gilt x + 1 > n + 1. Damit ist x − n ∈ N, und wegen (x − n + 1, 1) ∼ (x, n)
folgt φ(x − n) = [(x, n)]∼ . Umgekehrt ist für y ∈ N φ(y) = [(y + 1, 1)]∼ > [(1, 1)]∼ = 0.
Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ < 0 = [(1, 1)]∼ , so folgt aus den Rechenregeln von Satz 2.4.24 0 > −[(x, n)]∼ = [(n, x)]∼ .
Aus dem schon bewiesenem folgt −[(x, n)]∼ = −φ(n − x), wobei n − x ∈ N. Umgekehrt ist für y ∈ N −φ(y) = [(1, y + 1)]∼ <
[(1, 1)]∼ = 0.
Also kann man N mit p ∈ Z : p > 0 und −N mit p ∈ Z : p < 0 identifizieren.
˙ ∪N,
˙
Z = −N∪{0}
folgt nun aus der Tatsache, dass ≤ eine Totalordnung ist.
Die restlichen Aussagen folgen aus der Definition von |.|, sgn(.) und der Tatsache, dass p < q ⇔ 0 < q − p, siehe Satz
2.4.24.
❑
2.5 Der Körper Q
Oben haben wir den kommutativen Integritätsring hZ, +, ·i konstruiert. Diesen werden
wir nun zu einem angeordneten Körper, dem Körper der rationalen Zahlen erweitern,
und damit sehen, dass es zumindest einen angeordneten Körper gibt.
Der Grundgedanke der folgenden Konstruktion entspringt der Tatsache, dass in
einem Körper qp11 = qp22 genau dann, wenn p1 q2 = p2 q1 .
Sei ∼⊆ (Z × N)2 die Relation
(x, n) ∼ (y, m) : ⇐⇒ xm = yn .
2.5.1 Lemma. Die Relation ∼ ist eine Äquivalenzrelation.
Beweis. Die Reflexivität und Symmetrie sind offensichtlich. Sei nun (x, n) ∼ (y, m) und
(y, m) ∼ (z, k) dann gilt also xm = yn und yk = zm. Es folgt
(xk)m = (xm)k = (yn)k = (yk)n = (zm)n = (zn)m ,
und da hZ, +, ·i ein Integritätsring ist, gilt die Kürzungsregel und wir erhalten xk = zn,
d.h. (x, n) ∼ (z, k).
❑
2.5.2 Definition. Wir bezeichnen mit Q die Menge (Z × N)/∼ aller Äquivalenzklassen.
Q heißt der Körper der rationalen Zahlen.
Auf Q definieren wir algebraische Operationen +“ und ·“. Dazu definieren wir
”
”
wieder zunächst Addition und Multiplikation auf Z × N, und übertragen diese dann
durch Faktorisieren auf Q.
(
(Z × N)2 → Z × N
+:
((x, n), (y, m)) 7→ (xm + yn, nm)
(
(Z × N)2 → Z × N
·:
((x, n), (y, m)) 7→ (xy, nm)
Unsere Motivation für diese Definition ergibt sich aus einer formalen (!) Rechnung.
x y
xm yn
xm + yn x y
xy
+ =
+
=
,
· =
.
n m nm mn
nm
n m nm
2.5.3 Lemma. Für die Verknüpfungen +, · gilt das Kommutativ-, Assoziativ- und Distributivgesetz.
2.5. DER KÖRPER Q
35
Beweis. Die Gesetze gelten, da man sie leicht auf die Gültigkeit dieser Gesetze auf Z
zurückführt. Zum Beispiel gilt das Assoziativgesetz wegen
((x, n) + (y, m)) + (z, k) = (xm + yn, nm) + (z, k) = ((xm + yn)k + z(nm), (nm)k) =
(x(mk) + (yk + zm)n, n(mk)) = (x, n) + ((y, m) + (z, k)).
❑
Um Q anordnen zu können, definieren wir noch
(
(Z × N) → Z
sgn :
.
(x, n) 7→ sgn(x)
Um obige Operationen und die Vorzeichenfunktion auf Q übertragen zu können,
benötigen wir das folgende Resultat.
2.5.4 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt sgn((x, n)) = sgn(( x̂, n̂))
und
(x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben. Zunächst folgt aus xn̂ = x̂n und
n, n̂ ∈ N, dass sgn((x, n)) = sgn(x) = sgn( x̂) = sgn(( x̂, n̂)). Weiters gilt
(xm + yn)n̂m = xmn̂m + ynn̂m =
= (xn̂ − x̂n) mm + x̂nmm + ynn̂m = ( x̂m + yn̂)nm ,
| {z }
=0
also (x, n) + (y, m) ∼ ( x̂, n̂) + (y, m). Wegen der Kommutativität folgt auch, dass für
(x, n) und (y, m) ∼ (ŷ, m̂) stets (x, n) + (y, m) ∼ (x, n) + (ŷ, m̂). Setzt man diese beiden
Erkenntnisse zusammen, so folgt, dass für (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂)
(x, n) + (y, m) ∼ ( x̂, n̂) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂) .
Bei der Multiplikation geht man analog vor. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben.
Dann gilt
xyn̂m = (xn̂ − x̂n) ym + x̂nym = x̂ynm ,
| {z }
=0
also (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Die gleiche Argumentation wie bei + liefert das
gewünschte Ergebnis.
❑
2.5.5 Definition. Auf Q seien zwei algebraische Operationen +“ und ·“ definiert
”
”
durch: Sind a, b ∈ Q, so wähle (x, n), (y, m) ∈ Z × N mit [(x, n)]∼ = a und [(y, m)]∼ = b,
und setze sgn(a) := sgn((x, n)) sowie
a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ .
Wegen Lemma 2.5.4 hängen sgn(a), a + b und a · b nicht von den gewählten Repräsentanten (x, n) bzw. (y, m) ab.
2.5.6 Satz. Setzt man nun P = {a ∈ Q : sgn(a) = 1}, so ist hQ, +, ·, Pi ist ein angeordneter Körper.
KAPITEL 2. DIE REELLEN ZAHLEN
36
Dabei ist [(0, 1)]∼ das neutrale Element bzgl. +,
[(1, 1)]∼ das neutrale Element bezüglich ·.
Zu [(x, n)]∼ ∈ Q ist [(−x, n)]∼ das additiv Inverse, und
zu [(x, n)]∼ ∈ Q \ {0} ist [(sgn(x)n, |x|)]∼ das multiplikativ Inverse.
Außerdem gilt
[(x, n)]∼ ≤ [(y, m)]∼ ⇔ xm ≤ ny.
(2.7)
Die ganzen Zahlen Z sind in Q eingebettet durch
(
Z → Q
φ:
x 7→ [(x, 1)]∼
Diese Einbettung erhält Addition, Multiplikation und Ordnung.
Schließlich hat Q die Eigenschaft, dass die Teilmenge φ(N) von Q keine obere
Schranke hat.
Beweis. Die Gültigkeit der Rechenregeln wie Kommutativität, Assoziativität und Distributivität ergibt sich aus den entsprechenden Regeln für + und · auf Z × N.
Für a = [(x, n)]∼ ∈ Q gilt
a + [(0, 1)]∼ = [(x + 0, n · 1)]∼ = a, a · 1 = [(x · 1, n · 1)]∼ = a .
Weiters hat man für b := [(−x, n)]∼
a + b = [(xn − xn, nn)]∼ = [(0, nn)]∼ = [(0, 1)]∼ = 0 .
Sei nun a , 0, d.h. (x, n) / (0, 1) oder äquivalent x , 0. Mit c := [(sgn(x)n, |x|)]∼ folgt
ac = [(sgn(x)xn, n|x|)]∼ = [(1, 1)]∼.
Wegen sgn([(−x, n)]∼) = sgn(−x) = − sgn([(x, n)]∼) und sgn([(x, n)]∼) = 0 ⇔ x =
0 ⇔ [(x, n)]∼ = [(0, 1)]∼ gilt für a ∈ Q
a∈P
⇔ sgn(a) = 1
a ∈ {0} ⇔ sgn(a) = 0
a ∈ −P ⇔ sgn(a) = −1
Daraus folgt sofort
˙ ∪˙ − P,
Q = P∪{0}
wobei das eine Vereinigung paarweiser disjunkter Mengen ist.
Aus sgn([(x, n)]∼ + [(y, m)]∼) = sgn(xm + yn) und sgn([(x, n)]∼ · [(y, m)]∼) = sgn(xy)
erhalten wir a, b ∈ P ⇒ a + b, a · b ∈ P. Somit ist hQ, +, ·, Pi ein angeordneter Körper,
und wir haben damit eine Totalordnung ≤ auf Q. (2.7) folgt aus
[(y, m)]∼ − [(x, n)]∼ = [(yn − xm, mn)]∼ ∈ {0} ∪ P ⇔ sgn(yn − xm) ≥ 0 ⇔ xm ≤ yn.
Betrachte nun die Abbildung φ : Z → Q. Diese ist injektiv, denn (x, 1) ∼ (y, 1)
genau dann wenn x = y. Dass sie die algebraischen Operationen erhält, rechnet man
leicht nach. Die Verträglichkeit mit der Ordnung gilt, da wegen (2.7)
x ≤ y ⇔ x · 1 ≤ y · 1 ⇔ [(x, 1)]∼ ≤ [(y, 1)]∼ ⇔ φ(x) ≤ φ(y).
2.5. DER KÖRPER Q
37
Angenommen [(x, n)]∼ ist eine obere Schranke von φ(N), also mn ≤ x für alle
m ∈ N. Das ist aber offensichtlich falsch, wenn x ≤ 1 und man zum Beispiel m = 2
setzt. Ist x > 1, so erhält man mit m = x2 den Widerspruch x ≤ xn ≤ 1.
❑
x
n
Wir werden im Folgenden für die rationale Zahl [(x, n)]∼ stets das Symbol schreiben. Dieses Symbol drückt tatsächlich die Division von x durch n aus, denn man hat
[(x, 1)]∼ = [(x, n)]∼ · [(n, 1)]∼
Wir sehen insbesondere, dass jede rationale Zahl der Quotient von zwei ganzen Zahlen
ist.
Nun wollen wir zeigen, dass jeder angeordnete Körper die rationalen Zahlen, und
damit insbesondere auch die ganzen Zahlen, enthält.
2.5.7 Proposition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann gibt es eine eindeutige Abbildung φ : Q → K, die nicht identisch gleich 0 ist, und welche mit der Addition
und Multiplikation verträglich ist. Diese Abbildung ist dann injektiv und auch mit der
Ordnung verträglich.
Beweis.
Für n ∈ N und x ∈ K haben wir im Abschnitt über die natürlichen Zahlen eine
Funktion n 7→ nx von N nach K rekursiv durch 1x = x und (n′ )x = nx+x definiert
(siehe Bemerkung 2.3.4). Nun nehmen wir für x ∈ K das multiplikativ neutrale
Element 1K von K, und bezeichnen mit φ : N → K die entsprechende Funktion
n 7→ n1K , welche offensichtlicherweise φ(1) = 1K und φ(n + 1) = φ(n) + 1K
erfüllt.
Mit vollständiger Induktion (nach m) zeigt man leicht, dass φ(n+m) = φ(n)+φ(m)
und φ(n · m) = φ(n) · φ(m) für alle n, m ∈ N.
Wegen 1K ∈ P (siehe Lemma 2.2.2) sieht man ebenfalls mit vollständiger Induktion, dass φ(n) ∈ P für alle n ∈ N. Insbesondere gilt immer φ(n) , 0K .
Nun setzen wir φ auf Z dadurch fort, dass wir φ(0) = 0K und φ(−n) = −φ(n), n ∈
N setzen. Man beweist durch Fallunterscheidungen mit der in Definition 2.4.2
angegebenen Form von + und · auf Z auf elementare Art und Weise, dass diese
Fortsetzung die Addition und Multiplikation erhält.
Wegen (p, q ∈ Z)
p < q ⇔ q − p ∈ N ⇔ φ(q − p) = φ(q) − φ(p) ∈ P ⇔ φ(p) < φ(q)
ist φ auch mit der Ordnung verträglich.
Da ganz Q von den Quotienten
φ durch die Vorschrift
x
n
mit x ∈ Z, n ∈ N, ausgeschöpft wird, lässt sich
φ
x
n
:=
φ(x)
φ(n)
zu einer Abbildung von Q nach K fortsetzen. Man beachte hier, dass aus nx = n̂x̂
φ( x̂)
φ(x)
= φ(n̂)
. Also ist diese
folgt, dass xn̂ = x̂n und daher φ(x)φ(n̂) = φ( x̂)φ(n) bzw. φ(n)
Abbildung wohldefiniert.
KAPITEL 2. DIE REELLEN ZAHLEN
38
Diese Fortsetzung erhält ebenfalls die Addition und Multiplikation, denn für
x y
n , m ∈ Q gilt
xm + yn φ(xm + yn)
x y =φ
=
=
φ +
n m
nm
φ(nm)
y
x
φ(x)φ(m) + φ(y)φ(n) φ(x) φ(y)
+φ
,
=
+
=φ
φ(n)φ(m)
φ(n) φ(m)
n
m
φ
x
xy φ(xy)
y
=φ
=
=
n m
nm
φ(nm)
·
x y φ(x)φ(y)
φ(x) φ(y)
·φ
.
=
·
=φ
φ(n)φ(m) φ(n) φ(m)
n
m
Sie erhält auch die Ordnung, denn es gilt
x
y
φ(x)
φ(y)
<
⇐⇒ xm < yn ⇐⇒ φ(x)φ(m) < φ(y)φ(n) ⇐⇒
<
.
n m
φ(n) φ(m)
Es folgt insbesondere, dass φ injektiv ist.
Zur Eindeutigkeit von φ: Ist φ̃ eine weitere mit Addition und Multiplikation verträgliche Abbildung, sodass φ̃(x) , 0 für zumindest ein x ∈ Q, so folgt aus
φ̃(x)φ̃(1) = φ̃(x1) = φ̃(x), dass φ̃(1) = 1K , und aus φ̃(0) + φ̃(0) = φ̃(0 + 0) = φ̃(0),
dass φ̃(0) = 0K .
Durch vollständige Induktion folgt nun φ̃(n) = φ(n) für n ∈ N. Aus φ̃(−n)+φ̃(n) =
φ̃(0) = 0K = φ(−n) + φ(n) folgt φ̃(p) = φ(p), p ∈ Z. Schließlich folgt aus
φ̃( np )φ̃(n) = φ̃(p) = φ(p) = φ( np )φ(n), dass φ̃ = φ.
❑
Das letzte Resultat zeigt uns, dass die rationalen Zahlen in einem gewissen Sinn
der kleinste angeordnete Körper ist.
Wenn wir im Folgenden von den natürlichen (ganzen, rationalen) Zahlen als Teilmenge eines angeordneten Körpers sprechen, so wollen wir darunter die gemäß Proposition 2.5.7 existierende isomorphe Kopie φ(N) = {n1k : n ∈ N}, φ(Z), bzw. φ(Q)
verstehen und nicht mehr z.B. zwischen n und n · 1K unterscheiden.
2.5.8 Bemerkung. Die am Beginn vom Beweis von Proposition 2.5.7 konstruierte Einbettung φ der natürlichen Zahlen in
einen angeordneten Körper lässt sich auch auf beliebigen Körpern K durchführen.
Dabei kann es passieren, dass φ(n) = 0K für ein n ∈ N. Das kleinste derartige n ist dann eine Primzahl und heißt die
Charakteristik des Körpers K.
Ist hingegen immer φ(n) , 0K , so sagt man, dass K von Charakteristik Null ist. Insbesondere sind angeordnete Körper
von Charakteristik Null. Man sieht leicht ein, dass dann φ injektiv ist, und man denselben Beweis wie den von Proposition
2.5.7 hernehmen kann, um zu zeigen, dass sich Q injektiv in jeden Körper der Charakteristik Null einbetten lässt.
2.5.9 Bemerkung. Die angegebene Art und Weise, aus Z die rationalen Zahlen zu konstruieren, lässt sich auf beliebige
kommutative Integritätsringe R ausdehnen. Dazu betrachtet man R × (R \ {0}) und die Äquivalenzrelation ∼ mit (x, a) ∼
(y, b) ⇔ xb = ya darauf.
Die in diesem Abschnitt gebrachten Ergebnisse (samt Beweise) gelten sinngemäß auch in dieser allgemeineren Situation, wobei man hier i.A. keine sgn-Funktion hat, und wobei das multiplikativ Inverse zu [(x, n)]∼ genau [(n, x)]∼ ist.
(R × (R \ {0}))/∼ ist dann ein Körper (Quotientenkörper von R), aber i.A. kein angeordneter Körper.
Wendet man diese Konstruktion auf Z an, so erhält man wieder Q.
2.6. ARCHIMEDISCH ANGEORDNETE KÖRPER
39
2.6 Archimedisch angeordnete Körper
2.6.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K archimedisch
angeordnet, wenn N als Teilmenge von K nicht nach oben beschränkt ist.
In Satz 2.5.6 haben wir gesehen, dass die rationalen Zahlen archimedisch angeordnet sind. Wir werden auch sehen, dass die reellen Zahlen archimedisch angeordnet
sind.
2.6.2 Beispiel. Die Eigenschaft, dass hK, +, ·, Pi ein archimedisch angeordneter Körper
ist, ermöglicht es uns etwa das Infimum von Mengen wie
(
1
:n∈N
M=
n
)
zu berechnen. Der Vermutung nach ist inf M = 0.
Um das zu beweisen, sei zunächst bemerkt, dass 0 offensichtlich eine untere
Schranke von M ist. Wäre ǫ > 0 eine weitere untere Schranke von M, d.h. 0 < ǫ <
1
1
n , n ∈ N, so folgte n < ǫ , was aber der Eigenschaft von K, archimedisch angeordnet
zu sein, widerspricht.
In archimedisch angeordneten Körpern gilt der folgende für die später zu entwickelnde Konvergenztheorie wichtige
2.6.3 Satz. Sei hK, +, ·, Pi ein archimedisch angeordneter Körper. Sind x, y ∈ K, x < y,
dann existiert p ∈ Q mit x 0 und damit
1
1
auch y−x
> 0. Da K archimedisch angeordnet ist, gibt es ein n ∈ N mit n > y−x
und
daher n(y − x) > 1.
Nach Satz 2.3.10 hat {k ∈ N : k > nx} ein Minimum, und somit gibt es eine kleinste
natürliche Zahl m ∈ N, sodass m > nx. Ist m > 1, so folgt aus der Wahl von m, dass
m − 1 ≤ nx. Ist m = 1, so folgt gemäß unserer Voraussetzung m − 1 = 0 ≤ nx. Also gilt
immer m − 1 ≤ nx < m. Kombiniert man diese Ungleichung mit n(y − x) > 1, so folgt
nx < m ≤ nx + 1 < ny ,
und damit x < mn < y.
Ist schließlich x < 0, so können wir ein k ∈ N wählen mit k ≥ |x| (N ist nicht
nach oben beschränkt). Es folgt 0 ≤ x + k < y + k, und nach dem eben bewiesenen
x + k < mn < y + k. Nun ist mn − k eine rationale Zahl mit x < mn − k < y.
❑
2.6.4 Bemerkung. Da man obigen Satz induktiv immer wieder anwenden kann, sieht
man, dass zwischen zwei Zahlen sogar unendlich viele rationale Zahlen liegen.
Ist Q ( K, so kann man mit einer linearen Transformation sogar zeigen, dass es
eine nicht rationale Zahl zwischen 0 und 1 gibt, und weiters unter Verwendung von
Satz 2.6.3, dass es zwischen zwei Zahlen von K auch eine nicht rationale Zahl gibt.
8 Diese
Aussage nennt man auch die Dichteeigenschaft von Q in K.
40
KAPITEL 2. DIE REELLEN ZAHLEN
2.7 Das Vollständigkeitsaxiom
Wie wir später sehen werden, ist die Vollständigkeit die Eigenschaft der reellen Zahlen,
die sie unverwechselbar von anderen angeordneten Körpern unterscheidet.
2.7.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K vollständig
angeordnet, wenn jede nach oben beschränkte Menge ein Supremum hat. Diese Eigenschaft nennen wir (S ).
Wie schon im vorhergehenden Abschnitt erwähnt, gilt
2.7.2 Lemma. Ist hK, +, ·, Pi ein vollständig angeordneter Körper, so ist er archimedisch angeordnet.
Beweis. Wäre nämlich N nach oben beschränkt, so existierte
η = sup N.
Sei n beliebig in N. Mit n gehört aber auch n + 1 zu N. Also gilt n + 1 ≤ η, und somit
n ≤ η − 1. Daher ist η − 1 eine obere Schranke von N, aber selber kleiner als die
kleinste obere Schranke von N. Das ist ein Widerspruch, und wir kommen zu dem
Schluss, dass N nicht nach oben beschränkt sein kann.
❑
Nun gilt folgender wichtige Satz, dessen Beweis wir später (am Ende dieses Abschnittes oder in Kapitel 4) bringen werden.
2.7.3 Satz. Es gibt einen vollständig angeordneten Körper hL, +, ·, L+ i.
Ist hK, +, ·, Pi ein weiterer vollständig angeordneter Körper, so gibt es einen Isomorphismus φ : L → K, also eine Bijektion, sodass φ mit den Operationen verträglich
ist und sodass φ(L+ ) = P.
Wenn wir ab jetzt von den reellen Zahlen sprechen, dann sei immer ein
vollständig angeordneter Körper hL, +, ·, L+ i gemeint. Wir schreiben im Folgenden immer hR, +, ·, R+ i dafür. Wegen Satz 2.7.3 ist hR, +, ·, R+ i bis auf Kopien eindeutig.
2.7.4 Bemerkung. Zusammenfassend sei nochmals betont, dass die reellen Zahlen
R ein vollständig angeordneter Körper sind, der die Körperaxiome (A1)-(A4), (M1)(M4), (D), die Axiome eines angeordneten Körpers (P1)-(P3) und (S ) erfüllt.
Alle bis hierher gezeigten Rechenregeln und Eigenschaften von R lassen sich alle aus diesen Axiomen herleiten, bzw. haben wir hergeleitet. Auch die im Folgenden
aufgebaute Analysis setzt nur auf diese Axiome auf.
Die Vollständigkeit von R garantiert, dass es n-te Wurzeln von nichtnegativen Zahlen gibt.
2.7.5 Satz. Sei x ∈ R, x ≥ 0, und n ∈ N. Dann existiert genau eine Zahl y ∈ R, y ≥ 0,
sodass yn = x.
Beweis. Im Fall n = 1 ist die Aussage trivial. Sei also n ≥ 2.
Wir zeigen zuerst die Eindeutigkeit. Seien y1 , y2 ≥ 0, und sei z.B. y1 < y2 . Dann
folgt auch yn1 < yn2 (mit vollständiger Induktion zu zeigen) und daher können nicht
beide der Gleichung yn = x genügen.
Zur Existenz: Ist x = 0, so ist klarerweise yn = x für y = 0. Im Fall x > 0 sei
E := {t ∈ R : t > 0, tn < x}.
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
41
x
Diese Menge ist nicht leer, denn z.B. t0 = 1+x
∈ E, da aus 0 < t0 < 1 und t0 < x folgt,
n
n
dass t0 < t0 < x, und somit t0 < x.
Setzt man t1 := 1 + x, dann ist t1 > 1, also auch t1n > t1 . Weiters ist t1 > x. Ist nun
t ≥ t1 , so erhalten wir tn ≥ t1n > x, d.h. t < E. Also ist E nach oben beschränkt, da ja t1
eine obere Schranke ist.
x
∈ E ist sicher
Da R vollständig angeordnet ist, existiert y := sup E. Wegen 0 < 1+x
n
y > 0. Wir zeigen im Folgenden, dass y = x, und zwar indem wir die beiden anderen
Möglichkeiten yn < x und yn > x ausschließen.
Dazu machen wir die folgende Bemerkung. Für beliebige Elemente a, b ∈ R gilt
(die mit vollständiger Induktion zu beweisende Gleichung)
bn − an = (b − a)(bn−1 + bn−2 a + . . . + ban−2 + an−1 ) .
(2.8)
Also erhalten wir für 0 < a 0. Setze in obiger Abschätzung a = y
und b = y + ǫ. Dann folgt
(y + ǫ)n − yn < ǫn(y + ǫ)n−1 < ǫn(y + 1)n−1 < x − yn .
Also ist (y + ǫ)n < x und daher y + ǫ ∈ E. Ein Widerspruch, denn y ist eine obere
Schranke von E.
Wäre yn > x, so setze man
yn − x
δ := n−1 .
ny
Dann ist 0 < δ < ny < y. Für jedes t ≥ y − δ folgt wieder unter Verwendung obiger
Abschätzung, diesmal mit b = y, a = (y − δ),
yn − tn ≤ yn − (y − δ)n < δnyn−1 = yn − x .
Also tn > x, und daher t < E. Wir sehen, dass y − δ eine obere Schranke von E ist, ein
Widerspruch, denn y ist die kleinste obere Schranke von E.
❑
Die nach obigem √
Satz eindeutig bestimmte Zahl y ≥ 0, die n-te Wurzel von x,
1
schreibt man auch als n x oder x n .
2.7.6 Bemerkung. Man betrachte die Funktion
( +
R ∪ {0} → R+ ∪ {0}
.
y
7→
yn
Gemäß Bemerkung 2.4.9 ist diese Funktion streng monoton wachsend und daher injektiv.
√
Zu gegebenem x ist y = n x so, dass yn = x. Also ist y 7→ yn auch surjektiv als
Funktion von√R+ ∪ {0} nach R+ ∪ {0}. Sie ist also bijektiv und ihre Umkehrfunktion√ist
genau x 7→ n x. Wegen y1 < y2 ⇔ yn1 < yn2 (siehe Bemerkung 2.4.9) ist auch x 7→ n x
streng monoton wachsend.
KAPITEL 2. DIE REELLEN ZAHLEN
42
2.7.7 Bemerkung. Nun sehen wir auch, dass R nicht nur aus rationalen Zahlen bestehen
kann, also Q ( R gilt. Wäre nämlich
√
p
2 = ∈ Q,
q
(2.9)
so kann man p, q teilerfremd wählen, d.h. es gibt kein k ∈ N \ {1}, das p und q teil9 .
Insbesondere ist nur höchstens eine der Zahlen p oder q gerade. Ausquadrieren und mit
q2 Multiplizieren in (2.9) ergibt: 2q2 = p2 . Da eine Zahl genau dann gerade ist, wenn
ihr Quadrat es ist, folgt dass p gerade und damit q ungerade ist. Schreibt man p = 2m,
so folgt 2q2 = 4m2 , und damit q2 = 2m2 . Wir erhalten daraus den Widerspruch, dass
auch q gerade sein müsste.
Wenn man nicht verwenden will, dass jede natürliche Zahl eine eindeutige Primfaktorzerlegung hat, so können wir die
oben verwendeten Tatsachen aus der elementaren Zahlentheorie folgendermaßen verifizieren.
Die Tatsache, dass man einen Bruch qp mit p, q > 0 teilerfremd schreiben kann, sieht man, indem man die Menge aller
p̂ ∈ N betrachtet, sodass es ein q̂ ∈ N gibt mit q̂p̂ = qp . Nach Satz 2.3.10 gibt es ein kleinstes p̂ in dieser Menge, das nun
keinen gemeinsamen Teiler mit q̂ haben kann, da sonst p̂ nicht die Minimalitätseigenschaft hätte.
Um zu sehen, dass eine ganze Zahl p genau dann gerade ist, wenn p2 gerade ist, so an Bemerkung 2.4.12 erinnert, wo
wir insbesondere gesehen haben, dass eine Zahl der Form 2k + 1 nicht gerade ist.
Ist nun p gerade, d.h. p = 2s, s ∈ Z, so auch p2 = 2s·2s = 2(2s2 ). Sei umgekehrt p ungerade. Wir nehmen p > 0 an, da
wir sonst −p betrachten können. Da p nicht gerade ist, folgt p = 2m + 1, und damit ist p2 = 4m2 + 4m + 1 = 2(2m2 + 2m) + 1
auch nicht gerade.
2.7.8 Definition. Ist x > 0 und r ∈ Q, so stellen wir r in der Form r =
N dar, und definieren
√ p
xr = q x .
p
q
mit p ∈ Z, q ∈
Da die Darstellung einer rationalen Zahl als Bruch nicht eindeutig ist, müssen wir
nachweisen, dass die Definition von xr nicht von der Wahl von p, q abhängt. Dazu
brauchen wir
q
2.7.9 Lemma. Ist x > 0 und q ∈ N, so gilt q 1x = √q1x und
√q
√
( q x) p = x p .
q
Beweis. q 1x = √q1x folgt aus ( √q1x )q = ( √q1x)q =
q
q 1
1
q
x die eindeutige Lösung y von y = x ist.
1
x
(2.10)
und der Tatsache, dass nach Satz 2.7.5
√q
trivialerweise richtig, da ja 1 = 1. Sonst folgt (2.10)√aus
√q Istp pq = 0,√qso qistp (2.10)
q
(( x) ) = (( x) ) = x p (siehe (2.5)) und aus der Tatsache, dass nach Satz 2.7.5 x p
q
p
die eindeutige Lösung y von y = x ist.
❑
Ist jetzt r =
p
q
=
m
n,
so folgt wegen pn = qm
√ p
√ pn √ qm
√ q
( q x ) n = q x = q x = ( q x ) m = xm .
Zieht man links und rechts die n-te Wurzel, so gilt wegen (2.10)
√q
9 Eine
p
x =
√n
m
x ,
ganze Zahl k , 0 teilt eine ganze Zahl n, wenn es ein m ∈ Z gibt, sodass km = n.
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
43
und damit ist xr wohldefiniert. Außerdem gelten die (mit einer Beweisführung ähnlich
wie der von Lemma 2.7.9 zu zeigenden) Rechenregeln (r, s ∈ Q, x > 0)
xr+s = xr x s , (xr ) s = xrs , x−r =
1
.
xr
Ohne Beweis sei noch das Lemma vom iterierten Supremum erwähnt.
2.7.10 Lemma. Seien M, N zwei nichtleere Mengen und f : M × N → R eine beschränkte Funktion, d.h. ∃C ∈ R+ : ∀(m, n) ∈ M × N ⇒ | f ((m, n))| ≤ C. Dann
gilt
sup{sup{ f (m, n) : m ∈ M} : n ∈ N} = sup{ f (m, n) : (m, n) ∈ M × N} =
sup{sup{ f (m, n) : n ∈ N} : m ∈ M}.
Eine entsprechende Aussage gilt fürs Infimum.
Die Existenz und Eindeutigkeit der reellen Zahlen
Am Ende dieses Abschnitts werden wir beweisen, dass ein vollständig angeordneter Körper tatsächlich existiert, und
dass alle solche immer Kopien von einander sind.
Eine andere Art und Weise, das zu tun, findet sich in Kapitel 4.
Um diese, anspruchsvolle, Konstruktion zu motivieren denken wir uns eine Gerade gezeichnet, gemeinsam mit einer
Einheitsstrecke. Auf dieser Geraden denken wir uns die rationalen Zahlen durch fortgesetztes unterteilen der Einheitsstrecke
aufgetragen. Obwohl es -anschaulich- beliebig nahe an jedem Punkt eine rationale Zahl gibt, gibt es nach dem vorher
Gesagten Punkte, welche nicht rational sind.
Unsere Konstruktion beruht nun auf der folgenden Bemerkung, die R.Dedekind10 gemacht hat: Zerfallen alle Punkte
der Geraden in zwei Klassen von der Art, dass jeder Punkt der ersten Klasse links von jedem Punkt der zweiten Klasse liegt,
so existiert ein und nur ein Punkt, welcher diese Einteilung aller Punkte in zwei Klassen, diese Zerschneidung der Geraden
in zwei Stücke, hervorbringt.
Man kann also einen Punkt P der Geraden identifizieren mit der Menge aller Punkte die links von ihm liegen. Da man
nun aber mit den rationalen Punkten beliebig nahe an den Punkt P herankommt, genügt es, alle rationalen Punkte die links
von P liegen zu kennen um P selbst eindeutig zu rekonstruieren.
2.7.11 Satz. Es gibt einen vollständig angeordneten Körper. Dieser ist bis auf Isomorphie eindeutig bestimmt.
Beweis. Der Beweis dieses Satzes ist relativ lang und wird in mehreren Schritten geführt von denen wir auch nicht alle im
Detail ausführen werden.
Schritt 1: Eine Teilmenge α von Q heißt ein Dedekindscher Schnitt, wenn sie die folgenden drei Eigenschaften besitzt:
(I)
(II)
(III)
α , ∅, α , Q.
Ist p ∈ α, dann ist auch das rationale Intervall (−∞, p] ⊆ α.
Ist p ∈ α, so existiert ein ǫ ∈ Q, ǫ > 0, sodass p + ǫ ∈ α (und wegen (II) sogar (−∞, p + ǫ] ⊆ α).
Die Menge aller Dedekindschen Schnitte bezeichnen wir mit K.
Dieser Begriff modelliert die Anschauung der Menge aller (rationalen) Punkte die links von dem Punkt (der
”
Geraden) liegen“.
Die Eigenschaft (III) besagt, dass α kein größtes Element hat. Aus der Eigenschaft (II) erhält man unmittelbar die
folgenden beiden Aussagen:
(i)
(ii)
Ist p ∈ α und q < α, dann ist p < q.
Ist r < α und s > r, so ist s < α.
Schritt 2: Wir definieren eine Relation ≤“ auf K durch
”
α ≤ β : ⇐⇒ α ⊆ β, α, β ∈ K ,
Diese Relation ist offenbar eine Halbordnung. Wir zeigen, dass sie sogar eine Totalordnung ist. Seien α, β ∈ K und
sei angenommen, dass α β, d.h. α * β. Dann existiert also p ∈ α mit p < β. Es folgt, dass für alle q > p ebenfalls
q < β, und dass aus q < p folgt q ∈ α. Ist also q ∈ β, so muss q < p sein und daher zu α gehören. D.h. es gilt β ≤ α.
Für α ( β schreiben wir auch α < β.
10 Richard
Dedekind. 6.10.1831 Braunschweig - 12.2.1916 Braunschweig
KAPITEL 2. DIE REELLEN ZAHLEN
44
Schritt 3: In diesem Schritt zeigen wir, dass K mit der Ordnung ≤ die Supremumseigenschaft besitzt. Sei A ⊆ K eine
nichtleere und nach oben beschränkte Teilmenge von K. Setze
γ :=
[
α.
α∈A
Wir zeigen, dass γ ∈ K. Da A nichtleer ist, existiert α0 ∈ A. Nun ist α0 nichtleer und α0 ⊆ γ, also ist auch γ , ∅.
Da A nach oben beschränkt ist, existiert β ∈ K mit α ⊆ β für alle α ∈ A. Daher ist auch γ ⊆ β. Da β , Q, ist auch
γ , Q. Also erfüllt γ die Eigenschaft (I). Ist p ∈ γ, so existiert α ∈ A mit p ∈ α. Also folgt (−∞, p] ⊆ α ⊆ γ.
Weiters existiert ein rationales ǫ > 0 mit r + ǫ ∈ α ⊆ γ. Wir sehen also, dass γ die Eigenschaften (II) und (III) hat.
Es bleibt γ = sup A zu zeigen. Die Tatsache α ≤ γ, ∀α ∈ A ist klar. Ist β ∈ K mit β ≥ α, α ∈ A, d.h. β ⊇ α, α ∈ A,
so folgt da γ die Vereinigung aller α ∈ A ist, dass β ⊇ γ. Also ist γ tatsächlich die kleinste obere Schranke von A.
Schritt 4: Wir definieren eine Addition auf K. Für α, β ∈ K setze
Weiters setze 0∗ := {p ∈ Q : p < 0}.
α + β := r + s : r ∈ α, s ∈ β .
Als erstes zeigen wir, dass α + β ∈ K. Da α , ∅ und β , ∅, folgt auch α + β , ∅. Wähle r′ < α und s′ < β, dann ist
r′ > r, r ∈ α, und s′ > s, s ∈ β. Also erhalten wir r′ + s′ > r + s, r ∈ α, s ∈ β. Damit kann r′ + s′ nicht zu α + β
gehören. Wir sehen, dass α + β die Eigenschaft (I) besitzt. Sei nun p ∈ α + β gegeben, und schreibe p = r + s mit
gewissen r ∈ α, s ∈ β. Für q 0 mit r + ǫ ∈ α, dann folgt r + s + ǫ ∈ α + β, also gilt
auch (III).
Die Addition ist kommutativ:
α + β = {r + s : r ∈ α, s ∈ β} = {s + r : r ∈ α, s ∈ β} = β + α .
Sie ist assoziativ, denn
α + (β + γ) = r + u : r ∈ α, u ∈ (β + γ) =
= r + (s + t) : r ∈ α, s ∈ β, t ∈ γ = (r + s) + t : r ∈ α, s ∈ β, t ∈ γ =
= v + t : v ∈ (α + β), t ∈ γ = (α + β) + γ .
Nun identifizieren wir 0∗ als das neutrale Element bezüglich der Addition: Ist r ∈ α und s ∈ 0∗ , so folgt r + s < r,
also r + s ∈ α. D.h. α + 0∗ ≤ α.
Sei umgekehrt p ∈ α, und wähle ein rationales ǫ > 0 mit p + ǫ ∈ α. Dann gilt p = p + ǫ + (−ǫ) ∈ α + 0∗ .
Es bleibt zu zeigen, dass jedes Element von K ein additives Inverses besitzt. Sei also α ∈ K gegeben. Setze
β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < −α .
Als erstes zeigen wir, dass β ∈ K. Sei s < α und setze p := −s − 1, dann ist p + 1 = −s < −α, also p ∈ β, d.h.
β , ∅. Ist q ∈ α, so ist −q < β (da sonst q − ǫ < α, und somit q < α) und damit β , Q. Es gilt also (I). Sei nun p ∈ β
gegeben. Wähle ǫ > 0, sodass −p − ǫ < α. Ist q < p, so gilt −q − ǫ > −p − ǫ und daher −q − ǫ < α, d.h. q ∈ β. Es
gilt also (II). Mit t := p + 2ǫ ist t > p und −t − 2ǫ = −p − ǫ < α, d.h. t ∈ β. Also gilt (III).
Ist r ∈ α und s ∈ β, so ist −s < α und daher r < −s. Daher ist r + s < 0, bzw, r + s ∈ 0∗ . Wir sehen, dass α + β ≤ 0∗ .
Umgekehrt sei v ∈ 0∗ . Setze w := − 2v > 0. Sei q < α, Dann gibt es, da Q archimedisch angeordnet ist, ein n1 ∈ N
mit n1 w > q und daher n1 w < α. Sei q ∈ α, dann gibt es auch ein n2 ∈ N mit n2 w > −q, und daher mit −n2 w ∈ α.
Es existiert also n ∈ Z mit nw ∈ α aber (n + 1)w < α. Setze p := −(n + 2)w. Dann ist p ∈ β, denn −p − w < α. Wir
haben also
v = nw + p ∈ α + β .
Schritt 5: Die Addition ist mit der Ordnung verträglich. Ist nämlich α ≤ β, d.h. α ⊆ β, und ist γ ∈ K, so folgt α+ γ ⊆ β + γ.
Addieren von −γ zeigt, dass in der Tat α ≤ β ⇔ α + γ ≤ β + γ.
Daraus folgt unmittelbar α < β ⇔ β − α ∈ P := {γ ∈ K : γ > 0}, und die Tatsache, dass mit α, β ∈ P auch
α + β > α + 0∗ > 0∗ und somit α + β ∈ P.
Schritt 6: Wir definieren eine Multiplikation auf K. Seien zunächst α, β > 0. Dann setze
α · β := p ∈ Q : ∃r ∈ α, s ∈ β, r, s > 0 : p ≤ rs .
Man zeigt genauso wie in Schritt 4, dass α· β tatsächlich ein Element von K ist, dass die Multiplikation kommutativ
und assoziativ ist, und dass das Distributivgesetz gilt.
Weiters definieren wir
1∗ := {p ∈ Q : p < 1} .
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
45
Wieder sieht man analog wie in den vorherigen Beweisschritten, dass 1∗ neutrales Element bezüglich der Multiplikation ist, und dass jedes Element α > 0 ein multiplikatives Inverses
1
β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < { : q ∈ α, q > 0}
q
besitzt.
Um nun die Multiplikation auch für Elemente α < 0 zu definieren, setze


(−α) · (−β)






(−α) · β
α · β := 


α · (−β)




0∗
,
,
,
,
α < 0∗ , β < 0∗
α < 0∗ , β > 0∗
α > 0∗ , β < 0∗
α = 0∗ oder β = 0∗
Der Beweis der Rechengesetze folgt aus den bereits bekannten Regeln für die Multiplikation von positiven Zahlen
durch Fallunterscheidungen.
Um α, β ∈ P ⇒ α · β ∈ P einzusehen, wähle man a ∈ α \ 0∗ , b ∈ β \ 0∗ . Also a, b ≥ 0. Wegen (III) können wir
sogar a, b > 0 annehmen. Es folgt a · b ∈ α · β \ 0∗ und somit α, β ∈ P.
Wir haben also bewiesen, dass hK, +, ·, Pi ein vollständig angeordneter Körper ist.
Schritt 7: Wie jeder angeordnete Körper enthält K eine Kopie von Q, daher eine mit den Operationen und mit ≤
Verträgliche Injektion φ : Q → K, vgl. Proposition 2.5.7. Da φ(1) = 1∗ , folgt mit vollständiger Induktion
φ(n) = {p ∈ Q : p < n}.
Außerdem zeigt man, dass für r, s ∈ Q und αr = {p ∈ Q : p < r}, αs = {p ∈ Q : p < s} gilt, dass
αr + αs = {p ∈ Q : p < r + s}, − αr = {p ∈ Q : p < −r},
αr · αs = {p ∈ Q : p < rs}, α−1
r = {p ∈ Q : p <
1
}.
r
Für r > 0 sieht man die letzte Tatsache z.B. folgendermaßen.
1
1
1
: q ∈ Q, 0 < q < r} = p ∈ Q : ∃ ǫ > 0 : p + ǫ ≤
= {p ∈ Q : p < }.
α−1
r = p ∈ Q : ∃ǫ > 0 : p + ǫ < {
q
r
r
Da φ( nx ) = sgn(x) φ(|x|)
φ(n) für x ∈ Z, n ∈ N, folgt somit φ(r) = αr , r ∈ Q.
Schritt 8: Wir zeigen, dass jeder vollständig angeordnete Körper L isomorph zu dem oben konstruierten Körper K ist.
Beachte, dass L und K als angeordnete Körper den Körper der rationalen Zahlen enthalten. Definiere
ω:
(
L
x
→
7
→
K
{p ∈ Q : p < x}
,
ψ:
(
K
α
→
7→
L
sup α
Die Abbildung ω ist wohldefiniert, denn {p ∈ Q : p < x} ist, wie man unmittelbar überprüft, ein Dedekindscher
Schnitt. Auch ψ ist wohldefiniert, denn α ist eine nichtleere und beschränkte Teilmenge von Q ⊆ L und besitzt
daher in L ein Supremum.
Außerdem sind diese beiden Abbildungen streng monoton wachsend, und für p ∈ Q gilt ω(p) = α p und ψ(α p ) =
sup α p = p.
Aus Lemma 2.7.12 folgt, dass ω und ψ mit den Operationen verträglich sind. Wendet man Lemma 2.7.12 nun auch
auf ω ◦ ψ und ψ ◦ ω an, so folgt aus der Eindeutigkeitsaussage, dass ω ◦ ψ = id K und ψ ◦ ω = idL . Also sind ω und
ψ zueinander inverse Bijektionen, welche mit Addition, Multiplikation und Ordnung verträglich sind. Daher sind
L und K als angeordnete Körper isomorph.
❑
2.7.12 Lemma. Seien K1 und K2 zwei vollständig angeordnete Körper, und bezeichne Q1 bzw. Q2 die gemäß Proposition
2.5.7 existierende Kopie von Q, welche in K1 bzw. K2 enthalten ist. Seien φ j : Q → K j , j = 1, 2, die entsprechenden
Einbettungen.
Ist ω : K1 → K2 streng monton wachsend und so, dass ω(φ1 (p)) = φ2 (p) für alle p ∈ Q, dann ist ω mit +, · verträglich.
Weiters muss jede weitere streng monton wachsend Abbildung ω̃ : K1 → K2 mit ω̃(φ1 (p)) = φ2 (p), p ∈ Q schon mit ω
übereinstimmen.
KAPITEL 2. DIE REELLEN ZAHLEN
46
Beweis. Zunächst beweisen wir die letzte Aussage. Angenommen es gäbe ein x ∈ K1 , sodass φ1 (x) , φ2 (x). O.B.d.A. sei
ω(x) < ω̃(x). Nach Satz 2.6.3 gibt es ein p ∈ Q mit ω(x) < φ2 (p) < ω̃(x).
Nun muss x < φ1 (p), da widrigenfalls φ1 (p) ≤ x und daher ω(φ1 (p)) = φ2 (p) ≤ ω(x). Andererseits muss aber
φ1 (p) < x, da sonst x ≤ φ1 (p) und daher ω̃(x) ≤ φ2 (p) = ω̃(φ1 (p)). Beides kann aber nicht gleichzeitig gelten. Somit muss
ω = ω̃.
Zur Verträglichkeit mit + halte man zunächst ein p ∈ Q fest, und betrachte
ωp :
(
K1
x
→
7→
K2
ω(x + φ1 (p)) − φ2 (p)
.
Wegen den Eigenschaften von φ1 , φ2 aus Proposition 2.5.7 folgt ω p (φ1 (q)) = ω(φ1 (q + p)) − φ2 (p) = φ2 (q) für alle q ∈ Q.
Außerdem ist ω p offensichtlicherweise streng monoton wachsend.
Nach obiger Eindeutigkeitsaussage folgt ω = ω p bzw. ω(x + φ1 (p)) = ω(x) + φ2 (p) = ω(x) + ω(φ1 (p)) für alle x ∈ K1
und wegen der Beliebigkeit von p auch für alle p ∈ Q.
Nun betrachte man für ein festes y ∈ K1 die Abbildung ωy (x) = ω(x + y) − ω(y). Wegen dem eben gezeigten erfüllt
diese ωy (φ1 (q)) = φ2 (q), q ∈ Q, und sie ist ebenfalls streng monoton wachsend. Also folgt ωy = ω, bzw. ω(x + y) =
ω(x) + ω(y), x, y ∈ K1 .
ω(x·φ1 (p))
Indem man zunächst x 7→ φ (p)
für festes p ∈ Q \ {0} und dann x 7→ ω(x·y)
ω(y) für festes y ∈ K1 \ {0} betrachtet, folgt
1
wie oben auch die Verträglichkeit mit ·.
❑
2.8 Die komplexen Zahlen
Betrachtet man die quadratische Gleichung x2 + 1 =
√ 0, und sucht die Lösungen davon,
indem man formal rechnet, so erhält man x1,2 = ± −1, also eigentlich kein Ergebnis.
Das stimmt mit der Tatsache überein, dass die Gleichung x2 + 1 = 0 keine reellen
Lösungen hat. Aus vielen Gründen wäre es trotzdem wünschenswert mit Wurzeln√aus
negativen Zahlen rechnen zu können, denn dann wären selbstverständlich x1,2 = ± −1
Lösungen der Gleichung.
Wir formalisieren nun das Konzept der Wurzel aus einer negativen Zahl.
2.8.1 Definition. Die Menge der komplexen Zahlen C wird definiert als die Menge der
Paare reeller Zahlen, C := R2 = R × R. Wir schreiben eine komplexe Zahl (a, b) ∈ C
an als a + ib. Hierbei ist i ein formales Symbol, die sogenannte imaginäre Einheit.
Ist z = a + ib ∈ C, so heißt a der Realteil und b der Imaginärteil von z. Man schreibt
auch a = Re z und b = Im z.
Für zwei komplexe Zahlen a + ib und c + id definieren wir eine Addition und eine
Multiplikation wie folgt:
(a + ib) + (c + id) := (a + c) + i(b + d),
(2.11)
(a + ib) · (c + id) := (ac − bd) + i(bc + ad).
(2.12)
Wir wollen die triviale aber nützliche Tatsache bemerken, dass zwei komplexe Zahlen genau dann übereinstimmen, wenn ihre Realteile und ihre Imaginärteile übereinstimmen.
√
Die imaginäre Einheit modelliert die Zahl“ −1. Tatsächlich gilt nach Definition
”
der Multiplikation von komplexen Zahlen i2 = −1.
2.8.2 Satz. Die komplexen Zahlen hC, +, ·i sind ein Körper, wobei 0 + i0 das neutrale
Element bezüglich +, 1 + i0 das neutrale Element bezüglich ·, (−a) + i(−b) die additiv
Inverse zu a + ib, und
−b
a
+i 2
(2.13)
a2 + b2
a + b2
die multiplikativ Inverse zu a + ib , 0 + i0 ist.
2.8. DIE KOMPLEXEN ZAHLEN
47
Beweis. Wir müssen die Körperaxiome aus Definition 2.1.1 nachweisen. Die Kommutativität von + und · (Axiome (A4),(M4)) sieht man unmittelbar aus der Definition in
(2.11) und (2.12). Genauso schnell überzeugt man sich von der Gültigkeit der Assoziativität von + ((A1)). Wegen
((a + ib) · (c + id)) · (x + iy) = ((ac − bd) + i(bc + ad)) · (x + iy) =
(acx − bdx − bcy − ady) + i(bcx + adx + acy − bdy) =
= (a + ib) · ((cx − dy) + i(cy + dx)) = (a + ib) · ((c + id) · (x + iy))
gilt (M1). Ganz leicht sieht man, dass 0 + i0 das additiv neutrale Element von C ist
((A2)), und dass (−a) + i(−b) das zu a + ib additiv inverse Element ist ((A3)).
Genauso elementar sieht man, dass 1 + i0 das multiplikativ neutrale Element ist
((M2)), und dass die in (2.13) angegebene komplexe Zahl das zu a + ib multiplikativ
inverse Element ist ((M3)). Schließlich gilt (D), da in R das Distributivgesetz gilt und
da
(x + iy) · ((a + ib) + (c + id)) = (x + iy) · ((a + c) + i(b + d)) =
(xa + xc − yb − yd) + i(xb + xd + ya + yc) =
((xa − yb) + i(xb + ya)) + ((xc − yd) + i(xd + yc)) = (x + iy) · (a + ib) + (x + iy) · (c + id).
❑
Die reellen Zahlen sind in C eingebettet vermöge der Abbildung a 7→ a + i · 0.
Offenbar ist diese Einbettung ein Körperhomomorphismus (verträglich mit den Verknüpfungen +, ·). Insbesondere sehen wir, dass C ein R-Vektorraum ist, die dafür nötigen Rechengesetze gelten, da sie einfach Spezialfälle der Rechenregeln des Körpers C
sind. Eine Basis von C als R-Vektorraum lässt sich leicht angeben, nämlich {1, i}. Denn
(nach Definition) lässt sich jede komplexe Zahl in eindeutiger Weise anschreiben als
Linearkombination a · 1 + b · i mit den reellen Koeffizienten a, b. Wir sehen also, dass
die Dimension von C als R-Vektorraum gleich 2 ist.
Statt a + i0 schreibt man üblicherweise a und statt 0 + ib auch ib.
Graphisch lassen sich die Zahlen aus C als Punkte in der Ebene veranschaulichen,
man spricht auch von der Gausschen Zahlenebene11. Dabei ist
√
(2.14)
|z| := a2 + b2 (≥ 0)
die Länge des Vektors von (0, 0) nach (a, b). Wir nennen |z| auch den Betrag von z.
Nicht ganz zufällig wird der Betrag auf den komplexen Zahlen gleich wie die Betragsfunktion auf einem bewerteten Körper bezeichnet. Es gelten nämlich vergleichbare Regeln (z, w ∈ C):
(i) | Re z| ≤ |z|, | Im z| ≤ |z|
(ii) |zw| = |z||w|.
(iii) |z + w| ≤ |z| + |w|.
(iv) |z + w| ≥ ||z| − |w||.
11 Carl-Friedrich
Gauß. 30.4.1777 Braunschweig - 23.2.1855 Göttingen
KAPITEL 2. DIE REELLEN ZAHLEN
48
Im
C
z = a + ib
ib
|z|
0
|z| = |z|
b
Re
z = a − ib
−ib
Abbildung 2.3: Zahlenebene
(i) und (ii) lassen sich dabei elementar nachprüfen. Die Dreiecksungleichung folgt
durch Ausquadrieren, und die Dreiecksungleichung nach unten beweist man genauso,
wie bei den angeordneten Körpern (siehe (2.1)).
Eine weiters Begriffsbildung im Zusammenhang mit den komplexen Zahlen ist die
der konjugiert komplexen Zahl z zu einer komplexen Zahl z = a + ib:
z := a − ib .
Offenbar gilt |z| = |z|, |z|2 = zz, und z−1 = |z|z2 wenn z , 0. Der Übergang von z zu
seiner konjugierten z̄ entspricht bei der graphischen Veranschaulichung der komplexen
Zahlen genau dem Spiegeln an der reellen Achse.
Kapitel 3
Der Grenzwert
Schon sehr bald hat sich in der Mathematik herausgestellt, dass eine rein algebraische
Betrachtungsweise der reellen Zahlen nicht immer das geeignete Instrument zur Modellierung der in den Naturwissenschaften auftretenden Phänomene ist. Probleme wie
unendlich oft immer kleiner werdende Größen zusammenzählen“ oder einer gewis”
”
sen Zahl immer näher kommen“, lassen sich mit den bisher rein algebraischen Methoden nicht betrachten.
Man denke zum Beispiel an die Approximation der Zahl 2π, indem man einem
Kreis mit Radius eins regelmäßige n-Ecke einschreibt, von diesen den Umfang berechnet, und dann n immer größer werden lässt.
Das führt zu dem Begriff des Grenzwertes einer Folge von Zahlen. Dazu wollen
wir das einer Zahl immer näher Kommen“bzw. Konvergieren mathematisch exaktifi”
zieren:
Eine Folge x1 , x2 , x3 , . . . von reellen Zahlen heißt konvergent gegen eine reelle Zahl
x, falls es zu jedem beliebig kleinen Abstand ǫ > 0 einen Folgenindex N gibt, sodass
ab diesem Index alle Folgenglieder einen Abstand von x kleiner als ǫ haben; sodass
also
|xn − x| < ǫ,
für alle n ≥ N.
Wir wollen nun aber Konvergenzbetrachtungen nicht nur für Folgen von reellen
Zahlen betrachten, sondern auch z.B. für Folgen von komplexen Zahlen oder für Folgen
von Punkten im Raum. Wie man aus der Definition der Konvergenz erahnen kann,
benötigt man dazu lediglich einen Abstandsbegriff auf dem betrachteten Objekt. Wir
führen dazu den Begriff des metrischen Raumes ein.
3.1 Metrische Räume
Um zu sagen, wann ein Punkt x nahe“ bei einem anderen Punkt y liegt, müssen wir in
”
irgendeiner Weise den Abstand von x zu y messen können. Betrachten wir zum Beispiel
die Menge X aller Punkte der Ebene. Dann ist es naheliegend, als Abstand zwischen x
und y die Länge l x,y der Strecke, die die beiden Punkte verbindet, zu nehmen. Man sieht,
dass die folgenden Regeln gelten: Stets ist l x,y ≥ 0, denn Längen sind immer positiv.
Dabei gilt =“ genau dann, wenn x = y, denn eine Strecke hat dann und nur dann Länge
”
0, wenn Anfangs- und Endpunkt gleich sind. Es ist stets l x,y = ly,x , denn vertauscht
man Anfangs- und Endpunkt so bleibt die Länge der Strecke erhalten. Schwieriger
49
KAPITEL 3. DER GRENZWERT
50
einzusehen, aber anschaulich doch klar, ist die Gültigkeit der Dreiecksungleichung:
In jedem Dreieck ist die Länge einer Seite höchstens so groß, wie die Summe der
Längen der anderen Seiten. D.h. für je drei Punkte (die Eckpunkte des Dreiecks) gilt
l x,z ≤ l x,y + ly,z .
Es sind genau diese drei Eigenschaften, die es ausmachen, dass die Länge der
”
Verbindungsstrecke“ ein vernünftiger Abstandsbegriff ist.
3.1.1 Definition. Sei X eine Menge, d : X × X → R eine Funktion. Dann heißt d eine
Metrik auf X, und hX, di ein metrischer Raum, wenn gilt
(M1) Für alle x, y ∈ X ist d(x, y) ≥ 0. Es gilt d(x, y) = 0 genau dann, wenn x = y.
(M2) Für alle x, y ∈ X gilt d(x, y) = d(y, x).
(M3) Sind x, y, z ∈ X, so gilt die Dreiecksungleichung:
d(x, z) ≤ d(x, y) + d(y, z) .
3.1.2 Bemerkung. Man kann allgemeiner auch Metriken d betrachten, die X × X nicht
nach R, sondern nach K abbilden, wobei hK, +, ·, Pi ein archimedisch angeordneter
Körper ist. Wir werden darauf im Kapitel 4 zurück kommen.
3.1.3 Beispiel.
Ist X = R und d(x, y) = |x − y| für x, y ∈ R, so sieht man sofort, dass (M1) und
(M2) erfüllt sind. (M3) folgt aus der Dreiecksungleichung für den Betrag (siehe
Lemma 2.2.11):
|x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z|, x, y, z ∈ R.
(3.1)
Ist X = C R2 und d(z, w) = |z − w| für z, w ∈ C, wobei |.| hier der komplexe
Betrag ist, so erfüllt d offensichtlich (M2)
p und d(z, w) ≥ 0. Schreibt man z = a+ib
und w = c + id, so gilt d(z, w) = (a − c)2 + (b − d) = 0 genau dann, wenn
a − c = 0 und b − d = 0, also z = w. Somit ist (M1) erfüllt. (M3) folgt aus der
Dreiecksungleichung für den komplexe Betrag ähnlich wie in (3.1).
Um eine Metrik auf X := R p zu definieren, setzen wir
d2 (x, y) :=
p
X
j=1
12
(x j − y j )2 , x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ X .
Man spricht von der euklidischen Metrik auf Rn . Die Gültigkeit von (M1) und
(M2) ist aus der Definition offensichtlich. Die Dreiecksungleichung (M3) folgt
hingegen aus dem unten folgenden Lemma 3.1.4.
Im Falle p = 1, also X = R, gilt d2 (x, y) = |x − y|, und damit ist der Abstand
zweier Zahlen bzgl. der euklidischen Metrik nichts anderes als der Betrag der
Differenz dieser Zahlen.
Die euklidische Metrik auf R2 hat eine analoge Interpretation mit Hilfe des Betrages einer
√ komplexen Zahl. Für z = a + ib ∈ C haben wir den Betrag definiert
als |z| = a2 + b2 . Daraus sieht man, dass die euklidische Metrik auf R2 gerade
d2 (z, w) = |z − w|, z = a + ib, w = c + id ∈ C ,
3.1. METRISCHE RÄUME
51
ist, wobei wir hier die komplexen Zahlen in der Gausschen Zahlenebene, also als
Elemente von R2 interpretieren.
(M3) folgt in den Fällen p = 1, 2 wie schon oben gezeigt, aus der bereits bewiesenen Dreiecksungleichung für die Betragsfunktion
3.1.4 Lemma. Seien p ∈ N, a1 , . . . , a p , b1 , . . . , b p ∈ R. Dann gilt (Schwarzsche Ungleichung1)
 p
2
 p
  p

X

X 2  X

2
 ai bi  ≤  ai  · 
bi  ,
i=1
i=1
i=1
2
und (Minkowskische Ungleichung )
 p
1  p
 12
 p
 12
X  2 X

X

 (ai + bi )2  ≤  a2i  +  b2i  .
i=1
i=1
i=1
Beweis. Wir verwenden die Bezeichnungen a := (a1 , . . . , a p ), b := (b1 , . . . , b p ) ∈ R p
und definieren3
p
X
(a, b) :=
ai bi .
i=1
p
Für Zahlen λ, µ ∈ R und a, b ∈ R setzen wir
λa + µb := (λa1 + µb1 , . . . , λa p + µb p ) .
Offenbar gilt für a, b, c ∈ R p
(λa + µb, c) =
p
X
(λai + µbi )ci =
i=1
p
X
i=1
λai ci +
p
X
µbi ci = λ(a, c) + µ(b, c) .
i=1
Man spricht von der Linearität von (., .) in der vorderen Komponente. Wegen (a, b) =
(b, a) ist (., .) auch in der hinteren Komponente linear (vgl. den Begriff des Skalarproduktes auf einem Vektorraum in der Linearen Algebra).
Um die Schwarzsche Ungleichung zu zeigen, gehen wir von der trivialen Bemerkung aus, dass für jedes p-Tupel x = (x1 , . . . , x p ) ∈ R p gilt
(x, x) =
p
X
i=1
x2i ≥ 0.
Für alle t ∈ R gilt nun
0 ≤ (a + tb, a + tb) = (a, a) + 2t(a, b) + t2 (b, b).
(a,b)
in obiger Ungleichung ein, und erhält
Ist (b, b) , 0, so setze man t = − (b,b)
0 ≤ (a, a) −
1 Hermann
(a, b)2
.
(b, b)
Amandus Schwarz. 25.1.1843 Hermsdorf (Sobiecin, Polen) - 30.11.1921 Berlin
Minkowski. 22.6.1864 Alexoten (bei Kaunas, Litauen) - 12.1.1909 Göttingen
3 Also ist (., .) eine Abbildung von R p × R p nach R.
2 Hermann
(3.2)
KAPITEL 3. DER GRENZWERT
52
Daraus folgt unmittelbar die Schwarzsche Ungleichung.
Im Falle (b, b) = 0 folgt b = (0, . . . , 0), und damit auch (a, b) = 0. Es gilt also auch
in diesem Fall die Schwarzsche Ungleichung.
Die Minkowskische Ungleichung folgt wegen (ai + bi )2 = ai · (ai + bi ) + bi (ai + bi )
aus
p
p
p
p
p
X
X
X
X
X
2
(ai + bi ) =
ai (ai + bi ) +
bi (ai + bi ) ≤ ai · (ai + bi ) + bi · (ai + bi )
i=1
i=1
i=1
i=1
i=1
 p
1
X 2  2
≤  ai 
i=1
 p
1
 21  p
X  2
X




·  (ai + bi )2  +  b2i 
i=1
i=1
 p
 21
X

·  (ai + bi )2  =
i=1

 12  p
 12
1   p
p
X
X  2  X










2
2
2







=  ai  +  bi   ·  (ai + bi )  .
i=1
i=1
i=1
❑
Beispiele von Metriken gibt es viele, und sie treten in verschiedensten Zusammenhängen auf.
3.1.5 Beispiel.
(i) Sei noch einmal X := R2 und setze
d1 (x, y) := |x1 − y1 | + |x2 − y2 |, x = (x1 , x2 ), y = (y1 , y2 ) ∈ R2 .
Dann ist d1 eine Metrik: Die Gültigkeit von (M1) und (M2) ist wieder aus der
Definition offensichtlich. Um die Dreiecksungleichung einzusehen, seien x, y, z ∈
R gegeben. Dann folgt mit Hilfe der Dreiecksungleichung für |.|,
d1 (x, z) = |x1 − z1 | + |x2 − z2 | ≤ |x1 − y1 | + |y1 − z1 | + |x2 − y2 | + |y2 − z2 | =
= |x1 − y1 | + |x2 − y2 | + |y1 − z1 | + |y2 − z2 | = d1 (x, y) + d1 (y, z) .
Diese Metrik ist offenbar nicht gleich der euklidischen
Metrik, denn zum Beispiel
√
ist d1 ((0, 0), (2, 1)) = 3 aber d2 ((0, 0), (2, 1)) = 5.
Anschaulich interpretiert bezeichnet man d1 manchmal als New York-Metrik“.
”
Denn stellt man sich in der Ebene einen Stadtplan mit lauter rechtwinkeligen Straßen vor (wie in New York), dann misst d1 (x, y) gerade die Länge des Fußweges
von der Kreuzung x zur Kreuzung y.
Ganz analog definiert man eine Metrik am R p :
d1 (x, y) =
p
X
j=1
|x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p .
Der Nachweis von (M1)-(M3) geht genauso wie im oben betrachteten Fall p = 2.
(ii) Ist wieder X = R p , so definieren wir nun die Metrik
d∞ (x, y) := max |x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p .
j=1,...,p
3.1. METRISCHE RÄUME
53
(M1),(M2) sind klar. Die Dreiecksungleichung folgt aus der Tatsache, dass für
alle nichtnegativen Zahlen
max{a1 + b1 , . . . , a p + b p } ≤ max{a1 , . . . , a p } + max{b1 , . . . , b p } .
Auch diese Metrik unterscheidet sich tatsächlich von den schon eingeführten Metriken d1 und d2 , da etwa im Falle p = 2 gilt, dass d∞ ((0, 0), (2, 1)) = 2.
(iii) Eine hauptsächlich aus theoretischer Sicht wichtige Metrik ist die diskrete Metrik.
Sie findet man auf jeder nichtleeren Menge X, indem man
(
0 , x=y
d(x, y) =
1 , x,y
setzt.
(iv)
Betrachte die ganzen Zahlen X := Z und halte eine Primzahl p fest. Setze
 1


 pn(p)
d(p) (x, y) := 

0
, x , y, x − y = ±
, x=y
Q
q prim
qn(q)
Q
Dabei ist ± q prim qn(q) die eindeutige Primfaktorzerlegung von x − y. Dann ist d(p) eine Metrik auf Z. Denn (M1)
ist nach Definition erfüllt, (M2) ist ebenfalls richtig, denn vertauscht man x und y, so ändert sich bei der Differenz
x − y nur das Vorzeichen, nicht jedoch die Primfaktoren und ihre Potenzen. Die Dreiecksungleichung ist wieder
schwieriger einzusehen. Wir zeigen, dass in diesem Fall sogar die stärkere Ungleichung
d(p) (x, z) ≤ max{d(p) (x, y), d(p) (y, z)}, x, y, z ∈ Z ,
gilt. Diese Ungleichung impliziert tatsächlich sofort die Dreiecksungleichung, denn für je zwei Zahlen a, b ≥ 0 ist
stets max(a, b) ≤ a + b.
Schreibe
x−z = ±
Y
q prim
sodass also
d(p) (x, z) =
qn1 (q) , x − y = ±
Y
q prim
qn2 (q) , y − z = ±
Y
qn3 (q) ,
q prim
1
1
1
, d(p) (x, y) = n (p) , d(p) (y, z) = n (p) .
pn1 (p)
p2
p3
Betrachte den Fall, dass d(p) (x, y) ≥ d(p) (y, z), d.h. n2 (p) ≤ n3 (p). Wegen n2 (p) ≤ n3 (p) teilt pn2 (p) sowohl x − y als
auch y − z, und daher auch (x − y) + (y − z) = x − z. Es folgt n2 (p) ≤ n1 (p), und somit d(p) (x, y) ≥ d(p) (x, z).
Der Fall d(p) (x, y) ≤ d(p) (y, z) wird genauso behandelt.
Auf Z haben wir natürlich auch die euklidische Metrik d2 (x, y) = |x − y|, denn Z ist ja eine Teilmenge von R. Diese
ist verschieden von der Metrik d(p) , denn zum Beispiel ist d(p) (0, p) =
1
p,
wogegen d2 (0, p) = p.
3.1.6 Bemerkung. Auf R stimmen die Metriken d1 , d2 , d∞ alle überein.
3.1.7 Bemerkung. Die oben kennengelernten Metriken d2 , d1 , d∞ auf dem R p sind allesamt von Normen erzeugte Metriken.
Eine Norm k.k auf R p ist eine Funktion von R p → R mit folgenden drei Eigenschaften x, y ∈ R p , λ ∈ R:
(i) kxk ≥ 0, wobei kxk = 0 ⇔ x = 0.
(ii) kλxk = |λ| · kxk.
(iii) kx + yk ≤ kxk + kyk.
Es gilt nun d(x, y) = kx − ykq
2 , d1 (x, y) = kx − yk1 , d∞ (x, y) = kx − yk∞ , wobei diese
Pp
Pp
2
drei Normen durch kxk2 :=
j=1 |x j | , kxk1 :=
j=1 |x j |, kxk∞ = max{|x1 |, . . . , |x p |}
definiert sind.
KAPITEL 3. DER GRENZWERT
54
3.2 Der Grenzwert in metrischen Räumen
Wir kommen nun zurück zu dem am Anfang des Kapitels motivierten Begriff der Konvergenz einer Folge.
3.2.1 Definition. Eine Folge in einer Menge X ist aus mathematischer Sicht nichts
anderes als eine Funktion
y : N → X,
wobei der Funktionswert y(n) von y an der Stelle n meist als yn geschrieben wird.
Für die Folge y als solche schreiben wir meist (yn )n∈N . Folgen werden auch oft als
y1 , y2 , y3 , . . . angeschrieben.
3.2.2 Definition. Sei hX, di ein metrischer Raum, (xn )n∈N eine Folge in X, und x ein
Element von X. Dann heißt (xn )n∈N konvergent gegen x, wenn gilt 4
∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N .
(3.3)
In diesem Fall schreibt man limn→∞ xn = x.
xN
x1
xN ′
x
ǫ′
ǫ
Ist (xn )n∈N eine Folge, und gibt es ein Element x ∈ X, sodass limn→∞ xn = x, so sagt
man die Folge (xn )n∈N ist konvergent. Ist
eine Folge nicht konvergent, so sagt man
sie ist divergent.
Man verwendet auch andere Schreibweisen für limn→∞ xn = x, wie zum Beispiel
n→∞
(xn )n∈N → x, n → ∞, oder x −→ x, oder
auch nur xn → x.
3.2.3 Bemerkung. Wegen |d(x, xn ) − 0| = d(x, xn ) folgt, dass eine Folge (xn )n∈N in
einem metrischen Raum hX, di genau dann gegen ein x ∈ X konvergiert, wenn die
Folge (d(x, xn ))n∈N in R (versehen mit der euklidischen Metrik) gegen 0 konvergiert.
Folgen müssen nicht immer mit dem Index 1 anfangen. Ist k eine feste ganze Zahl,
so setzen wir Z≥k := {n ∈ Z : n ≥ k}. Eine Abbildung x : Z≥k → X nennen wir ebenfalls
Folge, wobei ihre Konvergenz in analoger Weise wie in Definition 3.2.2 definiert ist.
3.2.4 Beispiel.
(i) Sei hX, di ein beliebiger metrischer Raum, und sei x ∈ X. Betrachte die konstante
Folge x1 = x2 = x3 = . . . = x. Dann gilt limi→∞ xi = x.
Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N
finden, sodass d(xi , x) < ǫ für alle i ≥ N. Wähle N := 1, dann gilt
d(xi , x) = d(x, x) = 0 < ǫ, i ≥ N .
Dieses Beispiel ist natürlich in gewissem Sinne trivial, denn die Folgenglieder xi
sind ja schon alle gleich dem Grenzwert x, kommen diesem also natürlich beliebig
nahe.
4 Kürzer
lässt sich folgendermaßen schreiben: ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : ∀n ≥ N ⇒ d(xn , x) < ǫ.
3.2. DER GRENZWERT IN METRISCHEN RÄUMEN
55
(ii) Sei X = R und d = d2 die euklidische Metrik d2 (x, y) = |x − y|. Dann gilt
lim j→∞ 1j = 0.
Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N
finden, sodass | 1j − 0| = 1j < ǫ gilt, wenn nur j ≥ N. Dazu benützen wir die
Tatsache, dass N als Teilmenge von R nicht nach oben beschränkt ist: Wähle
N ∈ N mit 1ǫ < N. Für alle j ∈ N mit j ≥ N gilt 1j ≤ N1 < ǫ.
(iii) Aus dem letzten Beispiel schließen wir lim j→∞ (1+ 1j ) = 1, da |(1+ 1j )−1| =
(vgl. Bemerkung 3.2.3).
1
j
→0
Die Vorgangsweise aus Beispiel 3.2.4, (ii), kommt öfters vor. Darum wollen wir sie
explizit formulieren.
3.2.5 Korollar. Sei hX, di ein metrischer Raum, xi , x ∈ X, i ∈ N. Dann gilt xi → x
genau dann, wenn
1
für alle i ≥ N .
(3.4)
M
Die jeweiligen Bedingungen (3.3) und (3.4) sind äquivalent zu den entsprechenden
Bedingungen, wenn man in diesen Beziehungen < durch ≤ ersetzt.
∀M ∈ N ∃N ∈ N : d(xi , x) <
Beweis. Gilt (3.4) und ist ǫ > 0, so gibt es wegen Lemma 2.7.2 ein M ∈ N, sodass
1
1
M < ǫ. Wegen (3.4) gibt es ein N ∈ N, sodass d(xi , x) < M < ǫ für i ≥ N. Also haben
wir (3.3) nachgewiesen.
Gilt umgekehrt (3.3), so folgt (3.4) sofort, da ja M1 spezielle ǫ > 0 sind.
Dass aus den jeweiligen Bedingungen die Bedingungen mit ≤ statt < folgt ist klar,
da aus < ja ≤ folgt.
Zur Umkehrung: Man wende die Bedingungen mit ≤ statt < auf 2ǫ an. Man erhält
dann ... ≤ 2ǫ < ǫ.
❑
3.2.6 Beispiel.
Jede Zahl x ∈ R ist Limes einer Folge (rn )n∈N bestehend aus rationalen Zahlen.
Um das einzusehen, wähle gemäß Satz 2.6.3 für jedes n ∈ N eine Zahl rn ∈ Q
so, dass x < rn < x + 1n . Nach unserer Wahl ist (3.4) erfüllt. Also limn→∞ rn = x.
Genauso gibt eine Folge irrationaler Zahlen größer x, die gegen x konvergiert.
Arbeitet man mit größerer mathematischen Strenge, so muss man obiges Argument folgendermaßen präzisieren.
Nach Satz 2.6.3 ist die Menge Mn der r ∈ Q mit x < r < x +
1
n
nicht leer. Nun sei ρ einfach eine nach dem
Auswahlaxiom existierende Funktion von N nach ∪n∈N Mn , sodass ρ(n) ∈ Mn . Nun setze einfach rn = ρ(n).
Mit einer etwas feineren Argumentation kann man (rn )n∈N sogar streng monoton
fallend (rn1 > rn2 wenn n1 < n2 ) wählen. Dazu definiert man rn induktiv so, dass
x < rn < min(x + 1n , rn−1 ). Genauso kann man eine streng monoton wachsende
Folge aus Q konstruieren, die gegen x konvergiert.
Lässt man auch hier mehr Strenge walten, so benötigt man zur Existenz der Folge (rn )n∈N den Rekursionssatz:
Für jedes y > x und jedes n ∈ N ist die Menge Q ∩ (x, min(y, n1 )) nicht leer. Sei ̺ : N × (x, +∞) → Q eine
Auswahlfunktion, sodass ̺(n, y) ∈ Q ∩ (x, min(y, 1n )). Nun sei a := (1, r1 ) ∈ N × ((x, +∞) ∩ Q) =: A und g : A → A
definiert durch g(n, y) = (n + 1, ̺(n, y)). Nach dem Rekursionssatz gibt es eine Funktion φ : N → A mit φ(1) = a
und φ(n + 1) = g(φ(n)). Ist für n ∈ N nun rn die zweite Komponente von φ(n), so hat (rn )n∈N die geforderten
Eigenschaften.
KAPITEL 3. DER GRENZWERT
56
Sei F ⊆ R nach oben beschränkt und x := sup F. Nun wähle gemäß der Definition des Supremums ein xn ∈ (x− 1n , x] , ∅ für jedes n ∈ N. Also gibt es eine Folge
(xn )n∈N , in F, die gegen sup F konvergiert. Man kann ähnlich wie oben (xn )n∈N
sogar monoton wachsend wählen.
Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum.
3.2.7 Beispiel. Es gibt viele Folgen, die nicht konvergieren. Zum Beispiel betrachte die
Folge zn := in in C, wobei wir wie immer, wenn wir nichts anderes explizit sagen, C
mit der euklidischen Metrik versehen. Dann hat (zn )n∈N das Aussehen
i, −1, −i, 1, i, −1, −i, 1, . . . ,
und ist divergent. Denn angenommen es wäre zn → z für ein gewisses z ∈ C, so wähle
man N ∈ N, sodass |zn − z| < 12 , n ≥ N. Ist nun n0 ≥ N durch 4 teilbar, so folgt der
Widerspruch
2 = |1 − (−1)| = |zn0 − zn0 +2 | ≤ |zn0 − z| + |z − zn0 +2 | <
1 1
+ = 1.
2 2
3.2.8 Definition. Eine Teilfolge einer gegebenen Folge (xn )n∈N ist (xn( j) ) j∈N , wobei n :
N → N eine streng monoton wachsende Funktion ist. Also n(1) < n(2) < n(3) < . . . .
Klarerweise ist eine solche Funktion n immer injektiv, und es gilt n( j) ≥ j.
Folgende elementare Sachverhalte von großer Bedeutung und werden in Beweisen
immer wieder Verwendung finden.
3.2.9 Satz. Sei hX, di ein metrischer Raum und sei (xn )n∈N eine Folge von Elementen
von X.
(i) Die Folge (xn )n∈N hat höchstens einen Grenzwert.
(ii) (xn )n∈N konvergiert gegen x ∈ X genau dann, wenn es ein k ∈ N gibt, sodass
(xn )n∈Z≥k gegen x ∈ X konvergiert. Es kommt also nicht auf endlich viele Folgenglieder an, ob und wohin eine Folge konvergiert.
(iii) Ist limn→∞ xn = x und k ∈ N, so konvergieren auch (xn+k )n∈N und (xn−k )n∈Z≥k+1
gegen x.
(iv) Ist limn→∞ xn = x, so konvergiert auch jede Teilfolge (xn( j) ) j∈N gegen x.
Beweis. Wir zeigen zunächst (i). Es gelte xn → x und xn → y, und angenommen x , y,
also d(x, y) > 0. Wähle N1 ∈ N, sodass d(xn , x) < d(x,y)
3 , n ≥ N1 , und N2 ∈ N, sodass
d(xn , y) < d(x,y)
,
n
≥
N
.
Dann
folgt
für
N
:=
max{N
,
N2 } der Widerspruch
2
1
3
d(x, y) ≤ d(x, xN ) + d(xN , y) <
d(x, y) d(x, y) 2d(x, y)
+
=
< d(x, y) ,
3
3
3
Wir zeigen auch noch (iv). Die restlichen Aussagen sind noch elementarer nachzuweisen. Sei also (xn( j) ) j∈N eine Teilfolge der gegen x konvergenten Folge (xn )n∈N . Ist ǫ > 0,
so gibt es ein N ∈ N, sodass d(xn , x) < ǫ, wenn nur n ≥ N.
Ist nun i0 ∈ N so groß, dass n(i0 ) ≥ N (z.B. i0 = N), so folgt für i ≥ i0 auch
n(i) ≥ N und somit d(xn(i) , x) < ǫ. Also lim j→∞ xn( j) = x.
❑
3.2. DER GRENZWERT IN METRISCHEN RÄUMEN
57
3.2.10 Beispiel.
(i) Ist p ∈ N, so gilt limn→∞ n1p = 0. Das folgt unmittelbar aus Satz 3.2.9 und der
ist.
Tatsache, dass diese Folge eine Teilfolge von n1
n∈N
Genauso gilt
limn→∞ √p1n
mit 1n < ǫ p ,
es ein N ∈ N
1
√
< ǫ für n ≥ N.
p
n
= 0. Ist nämlich ǫ > 0, so auch ǫ p > 0. Da
1
n
→ 0, gibt
wenn n ≥ N. Aus der Monotonie der p-ten Wurzel folgt
(ii) Sei q ∈ R, 0 ≤ q < 1, und betrachte die Folge (qn )n∈N . Dann gilt limn→∞ qn = 0.
Um das einzusehen, können wir q > 0 voraussetzen, da sonst die betreffliche
Folge identisch gleich Null ist. Wir verwenden zum Beweis die Bernoullische
Ungleichung aus Lemma 2.3.6. Setzt man in der Bernoullischen Ungleichung
x = q1 − 1 > 0, so erhält man
1
q
!n
!
1
−1 .
≥1+n
q
Da R archimedisch angeordnet ist, gibt es zu jedem ǫ > 0 eine Zahl N ∈ N mit
1 + N( q1 − 1) > 1ǫ und damit auch ( 1q )N > 1ǫ , also qN < ǫ. Es folgt d(0, qn ) = qn ≤
qN < ǫ für alle n ≥ N.
(iii) Sei z ∈ C, |z| < 1. Betrachte die Folge
S n :=
n
X
zk = 1 + z + z2 + . . . + zn .
k=0
1
Dann gilt limn→∞ S n = 1−z
. Das ist die sogenannte geometrische Reihe. Zum
Beweis: Es gilt (vgl. (2.8))
1n − zn = (1 − z)(1n−1 + 1n−2 z + . . . + 1zn−2 + zn−1 ) = (1 − z)(1 + z + . . . + zn−1 ) ,
und wir erhalten
S n−1 =
1
zn
−
.
1−z 1−z
(3.5)
Sei nun ǫ > 0 gegeben. Wähle N ∈ N mit |z|n < ǫ, n ≥ N (vgl. (ii)), dann folgt
S n−1 −
ǫ
1 |z|n
=
<
, n≥ N.
1−z
|1 − z| |1 − z|
Startet man nun anstelle von ǫ mit der ebenfalls positiven Zahl |1 − z| · ǫ, so erhält
1
man am Ende der Ungleichungskette nur ǫ. Also gilt S n−1 → 1−z
und wegen Satz
1
3.2.9 auch S n → 1−z .
Weil die im letzten Beispiel verwendete Vorgehensweise oftmals Anwendung findet, wollen wir hier auch explizit bemerken, dass xn → x genau dann, wenn
∀ǫ > 0 ∃N ∈ N d(xn , x) < K · ǫ, für alle n ≥ N,
wobei K irgendeine feste positive reelle Zahl ist.
(3.6)
KAPITEL 3. DER GRENZWERT
58
3.2.11 Bemerkung. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di und x ∈ X.
Angenommen diese Folge konvergiert nicht gegen x. Dann zeigt man leicht, dass
sie eine Teilfolge (xn(i) )i∈N hat, sodass d(xn(i) , x) ≥ ǫ für ein gewisses ǫ > 0 und alle
i ∈ N.
Ist nun (xn(i( j)) ) j∈N eine beliebige Teilfolge von (xn(i) )i∈N , so kann diese wegen
d(xn(i( j)) , x) ≥ ǫ sicherlich auch nicht gegen x konvergieren.
Somit haben wir gezeigt, dass wenn jede Teilfolge von (xn )n∈N wiederum eine Teilfolge hat, die gegen x konvergiert, so muss schon (xn )n∈N gegen x konvergieren.
Wegen Satz 3.2.9, (iv), gilt auch die Umkehrung.
3.2.12 Lemma. Sei hX, di ein metrischer Raum und seien (xn )n∈N , (yn )n∈N Folgen von
Elementen von X, sodass limn→∞ xn = x und limn→∞ yn = y. Dann folgt
lim d(xn , yn ) = d(x, y).
n→∞
Beweis. Zunächst wollen wir folgende Ungleichung beweisen:
d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , a2 ) + d(b1 , b2 ), a1 , a2 , b1 , b2 ∈ X .
(3.7)
Aus der Dreiecksungleichung folgt d(a1 , b1 ) − d(a2 , b1 ) ≤ d(a1 , a2 ) sowie d(a2 , b1 ) −
d(a1 , b1 ) ≤ d(a1 , a2 ). Also gilt
d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , b1 ) − d(a2 , b1 ) + d(a2 , b1 ) − d(a2 , b2 ) ≤
d(a1 , a2 ) + d(b1 , b2 ) .
Sei nun ǫ > 0 und N ∈ N so groß, dass d(xn , x), d(yn , y) < 2ǫ , wenn n ≥ N. Aus (3.7)
folgt
|d(xn , yn ) − d(x, y)| ≤ d(xn , x) + d(yn , y) < ǫ
für alle n ≥ N.
❑
Ein weiterer Begriff, der im Zusammenhang mit konvergenten Folgen auftritt, ist
der der Beschränktheit.
3.2.13 Definition. Sei hX, di ein metrischer Raum, und sei Y ⊆ X. Dann heißt Y beschränkt, wenn es eine Zahl M > 0 und einen Punkt x0 ∈ X gibt, sodass
d(y, x0 ) ≤ M, y ∈ Y .
Eine Folge (xn )n∈N heißt beschränkt, wenn die Bildmenge {xn : n ∈ N} beschränkt ist.
Allgemeiner heißt eine Funktion f : E → X beschränkt, wenn die Bildmenge f (E)
beschränkt ist.
Die Menge Y ist also beschränkt, wenn sie ganz in einem gewissen Kreis (Mittelpunkt x0 , Radius M) liegt.
3.2.14 Bemerkung. Y ist beschränkt genau dann, wenn es zu jedem Punkt x ∈ X eine
Zahl M x > 0 gibt mit d(y, x) ≤ M x , y ∈ Y. Denn, ist x ∈ X gegeben, so setze M x :=
M + d(x, x0 ). Dann gilt für jedes y ∈ Y
d(y, x) ≤ d(y, x0 ) + d(x0 , x) ≤ M + d(x, x0 ) = M x .
3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN
59
Mit Hilfe dieser Tatsache sieht man auch, dass Y ⊆ C (Y ⊆ R) versehen mit der
euklidischen Metrik genau dann beschränkt ist, wenn für ein gewisses M > 0 gilt, dass
∀x ∈ Y : |x| (= d(x, 0)) ≤ M.
Im Falle Y ⊆ R stimmt daher diese Definition von Beschränktheit mit der von Definition 2.2.4 überein.
3.2.15 Proposition. Jede konvergente Folge (xn )n∈N ist beschränkt.
Beweis. Wähle N ∈ N mit d(xn , x) < 1 für n ≥ N. Setzt man
M := 1 + max{d(x1 , x), . . . , d(xN−1 , x)} ,
so erhält man d(xn , x) ≤ M für jedes n ∈ N.
❑
3.2.16 Bemerkung. Die Umkehrung gilt nicht (außer der Raum X besteht aus nur einem Element), da für x, y ∈ X, x , y,
die Folge x, y, x, y, x, y, x, . . . zwar beschränkt, aber nicht konvergent ist.
3.2.17 Bemerkung. Insbesondere gibt es zu jeder konvergenten reell- bzw. komplexwertigen Folge (xn )n∈N ein Konstante M > 0, sodass |xn | ≤ M, n ∈ N.
3.2.18 Beispiel. Man betrachte die Folge (S n )n∈N aus Beispiel 3.2.10, (iii), für den Fall
|z| = 1 aber z , 1. Aus (3.5) sehen wir, dass
Sn =
1 − zn+1
.
1−z
n+1
|
2
= |1−z|
, und (S n )n∈N ist damit beschränkt. Sie ist aber nicht
Also ist |S n | ≤ 1+|z
|1−z|
konvergent, denn, wie man aus den Ergebnissen im nächsten Abschnitt sieht, wäre
dann auch (zn )n∈N konvergent. Das ist aber nicht der Fall. Man setze z.B. z = i oder
z = −1.
3.3 Folgen reeller und komplexer Zahlen
Wir wollen uns hier zunächst mit dem metrischen Raum hR, di beschäftigen, und folgendes einfaches, aber sehr nützliches Lemma bringen.
3.3.1 Lemma. Seien (xn )n∈N , (yn )n∈N zwei konvergente Folgen reeller Zahlen mit den
Grenzwerten x und y. Dann gilt:
(i) Ist c ∈ R mit x < c (c < x), so gibt es ein N ∈ N, sodass xn < c (c < xn ) für alle
n ≥ N.
(ii) Ist x < y, so gibt es ein N ∈ N, sodass xn < yn für alle n ≥ N.
(iii) Gilt ab einem gewissen N ∈ N die Ungleichung xn ≤ yn , so folgt x ≤ y.
Beweis.
(ii) Setzt man ǫ = y−x
2 , so folgt aus der Konvergenz die Existenz eines N ∈ N, sodass
und
|yn − y| < y−x
|xn − x| < y−x
2
2 für n ≥ N. Somit gilt
−(yn − y) − (x − xn ) ≤ |yn − y| + |x − xn | < (y − x).
Also
yn − xn = (y − x) + (yn − y) + (x − xn ) > 0.
KAPITEL 3. DER GRENZWERT
60
(i) Folgt aus (ii), wenn wir (yn )n∈N ((xn )n∈N ) als die identische Folge (c)n∈N wählen.
(iii) Wäre x > y, so würde aus (ii) folgen, dass xn > yn für alle n ≥ k mit einem
hinreichend großen k ∈ N. Das widerspricht der Annahme.
❑
Der nächste Satz dient häufig als Werkzeug zur Berechnung von Grenzwerten.
3.3.2 Satz (Einschluss-Satz). Seien (xn )n∈N , (yn )n∈N und (an )n∈N reelle Folgen mit xn ≤
an ≤ yn für alle bis auf endlich viele n ∈ N. Gilt
lim xn = lim yn ,
n→∞
n→∞
so existiert auch der Grenzwert limn→∞ an und ist gleich dem gemeinsamen Grenzwert
von (xn )n∈N und (yn )n∈N .
Beweis. Setze a := limn→∞ xn . Zu ǫ > 0 wähle N ∈ N mit |xn − a|, |yn − a| < ǫ und
xn ≤ an ≤ yn für n ≥ N. Für solche n folgt
−ǫ < xn − a ≤ an − a ≤ yn − a < ǫ,
d.h. |an − a| < ǫ.
❑
3.3.3 Beispiel. Als ganz einfache Beispiel betrachte man die Folge
sieht leicht, dass
1
1
0≤ 2
≤ , für n ≥ 3.
n − 3n + 3 n
Also folgt mit Satz 3.3.2, dass limn→∞
1
n2 −3n+3
1
.
n2 −3n+3 n∈N
Man
= 0.
Wir haben auf R und C algebraische Operationen und die Betragsfunktion. Im
nächsten Satz wollen wir zeigen, dass diese mit dem Grenzwertbegriff verträglich sind.
3.3.4 Satz (Rechenregeln für Folgen). Seien (zn )n∈N und (wn )n∈N konvergente Folgen
komplexer Zahlen, limn→∞ zn =: z, limn→∞ wn =: w, und sei λ ∈ C. Dann gilt für k ∈ N
(i) limn→∞ |zn | = |z|, limn→∞ z̄n = z̄.
(ii) limn→∞ (zn + wn ) = z + w, limn→∞ (−zn ) = −z.
(iii) Ist z = 0, also zn → 0, n → ∞, und ist (un )n∈N eine beschränkte Folge in C, dann
gilt limn→∞ (zn · un ) = 0.
(iv) limn→∞ (λzn ) = λz und limn→∞ (zn · wn ) = z · w.
(v) limn→∞ zkn = zk .
(vi) Falls z , 0 ist, gilt limn→∞
1
zn
= 1z .
√
√
(vii) Ist zn ∈ R und zn ≥ 0, so folgt limn→∞ k zn = k z.
Diese Aussagen gelten auch, wenn die Folgen bzw. der Skalar λ aus R sind.
3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN
61
3.3.5 Bemerkung. Bis auf den letzten Punkt werden wir Satz 3.3.4 für komplexe Folgen
beweisen. Fast derselbe Beweis funktioniert für reellwertige Folgen.
Man kann aber die Rechenregeln für reellwertige Folgen auch aus denen für komplexwertige Folgen herleiten, da, wie wir gleich zeigen wollen, eine Folge (xn )n∈N in R
genau dann konvergiert, wenn (xn +i0)n∈N in C konvergiert. Dabei ist limn→∞ (xn +i0) =
(limn→∞ xn ) + i0.
Ist (xn )n∈N eine reellwertige Folge, welche gegen ein x ∈ R konvergiert, so konvergiert (xn + i0)n∈N gegen x + i0, da ja |(xn + i0) − (x + i0)| = |xn − x| → 0 (vgl. Bemerkung
3.2.3).
Konvergiert umgekehrt für eine reellwertige Folge (xn )n∈N die Folge (xn + i0)n∈N in
C gegen x + iy ∈ C, so muss wegen
0 ≤ max(|xn − x|, |0 − y|) ≤ |(xn + i0) − (x + iy)| → 0, n → ∞,
gemeinsam mit Satz 3.3.2 folgen, dass xn → x und |y| → 0, d.h. y = 0.
Beweis. (Satz 3.3.4)
(i) Zu ǫ > 0 wähle N ∈ N, sodass |zn −z| < ǫ für n ≥ N. Mit der Dreiecksungleichung
nach unten erhält man
|zn | − |z| ≤ |zn − z| < ǫ, |z̄n − z̄| = |zn − z| < ǫ.
Man kann limn→∞ |zn | = |z| auch als Spezialfall von Lemma 3.2.12 sehen: |zn | =
d(zn , 0) → d(z, 0) = |z|.
(ii) Sei ǫ > 0 gegeben. Wähle N so, dass |zn − z| <
n ≥ N. Es gilt für solche n
ǫ
2
und auch |wn − w| <
|(zn + wn ) − (z + w)| = |(zn − z) + (wn − w)| ≤ |zn − z| + |wn − w| <
ǫ
2
für alle
ǫ ǫ
+ = ǫ.
2 2
Also ist (zn + wn )n∈N konvergent und der Grenzwert ist gleich z + w. Weiters gilt
für n so groß, dass |zn − z| < ǫ:
|(−zn ) − (−z)| = | − (zn − z)| = |zn − z| < ǫ,
also konvergiert (−zn )n∈N gegen −z.
(iii) Ist C > 0 so, dass |un | ≤ C, n ∈ N, und ist ǫ > 0, so gibt es wegen zn → 0 ein
N ∈ N, sodass |zn | < Cǫ , n ≥ N. Es folgt |zn ·un | < ǫ für alle n ≥ N, also zn ·un → 0.
(iv) Sei N so groß, dass für n ≥ N gilt |zn − z| < ǫ. Dann gilt
|λzn − λz| = |λ| · |zn − z| < λ · ǫ.
Gemäß (3.6) folgt daher λzn → λz.
Um zn wn → zw nachzuweisen, wollen wir zunächst bemerken, dass nach Bemerkung 3.2.17 konvergente Folgen beschränkt sind. Nach (ii) konvergiert (zn − z)
gegen Null, und mit (iii) daher auch (zn − z)wn → 0, n → ∞. Der schon bewiesene Teil von (iv) gibt nun zusammen mit (ii)
n→∞
zn wn = (zn − z)wn + zwn −→ 0 + zw.
KAPITEL 3. DER GRENZWERT
62
(v) Das folgt durch vollständige Induktion nach k aus (iv).
(vi) Sei nun z , 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z für hinreichend
großes n, dass |zn | > |z|2 . Es folgt die Abschätzung
1 − 1 = |z − zn | ≤ |z − z | · 2 ,
n
zn z |z| · |zn |
|z|2
und damit wird die Differenz
1
zn
−
1
z
für große n beliebig klein.
(vii) Sei zunächst z > 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z die Existenz von
N ∈ N, sodass für n ≥ N sicher zn > 2z > 0 und |zn − z| < ǫ. Gemäß (2.8) gilt für
solche n, da klarerweise auch z > 2z ,
√
√
|zn − z|
| k zn − k z| = √ k−1 √ k−2 √
≤
√
√
√
k
| kz + kz
zn + . . . + k zn k−2 k z + k zn k−1 |
|
pk z k−1
pk z k−2 pk z
|zn − z|
+ 2
2 +...+
√k
√k
Gemäß (3.6) folgt zn → z.
2
pk z k−2 pk z
2
2
ǫ
pk z k−1 < pk z k−1 .
+ 2 | k 2
Ist z = 0, so sei ǫ > 0 vorgegeben. Ist nun N ∈ N so, dass zn = |zn − 0| < ǫ k für
n ≥ N, dann folgt aus der Monotonie der Wurzelfunktion (vgl. Bemerkung 2.7.6)
√
√
√
| k zn − 0| = k zn < ǫ. Also k zn → 0.
❑
3.3.6 Beispiel.
√
(i) Die Folge xn = n n konvergiert gegen 1: Setze an := xn − 1, dann ist an ≥ 0 und
(1 + an )n = n. Nach dem Binomischen Lehrsatz gilt
!
n
X
n(n − 1) 2
n k n−k
an .
n = (an + 1)n =
an 1 ≥ 1 +
2
k
k=0
2(n−1)
Damit folgt a2n ≤ n(n−1)
= 2n → 0. Daraus folgt nach Satz 3.3.4, (vii), dass an → 0
und damit xn → 1 für n → ∞.
√
den Fall q > 1. Dann
(ii) Ist q > 0 fest, so gilt limn→∞ n q = 1. Betrachte zunächst
√
√
√
√n
gilt stets q ≥ 1. Für n hinreichend groß gilt n q ≤ n n. Also folgt n q → 1. Der
Fall q = 1 ist klar. Im Fall 0 < q < 1 betrachte √n1q .
3.4 Existenz von Grenzwerten
Bisher haben wir zwar gesehen, was aus der Konvergenz einer oder mehrerer Folgen
folgt. Die Problem, ob eine gegebene Folge konvergiert oder nicht haben wir jedoch
nicht betrachtet.
Wir wollen als erstes eine Methode angeben um auf Konvergenz einer reellen Zahlenfolge zu schließen. Diese Eigenschaft ist von herausragender Bedeutung.
Tatsächlich spiegelt sie genau die definierende Eigenschaft von R vollständig angeordnet zu sein wieder.
3.4. EXISTENZ VON GRENZWERTEN
63
3.4.1 Definition. Eine Folge (an )n∈N in R heißt monoton, wenn entweder
a1 ≤ a2 ≤ a3 ≤ . . . (monoton wachsend)
oder
a1 ≥ a2 ≥ a3 ≥ . . . (monoton fallend)
gilt.
3.4.2 Satz. Sei (xn )n∈N eine monoton wachsende und nach oben beschränkte Folge.
Dann konvergiert (xn )n∈N gegen sup{xn : n ∈ N}. Entsprechend konvergiert eine monoton fallende und nach unten beschränkte Folge (xn )n∈N gegen inf{xn : n ∈ N}.
Beweis. Sei (xn )n∈N monoton wachsend und nach oben beschränkt. Definiere x :=
sup{xn : n ∈ N}. Wir zeigen, dass limn→∞ xn = x. Sei ǫ > 0. Da x − ǫ < x, kann
x − ǫ keine obere Schranke der Menge {xn : n ∈ N} sein. Es gibt also ein N ∈ N mit
xN > x − ǫ. Wegen der Monotonie folgt auch xn > x − ǫ für alle n ≥ N. Da stets x ≥ xn
gilt, erhält man für n ≥ N
0 ≤ x − xn < ǫ,
also |xn − x| < ǫ.
Ist die Folge (xn )n∈N monoton fallend und nach unten beschränkt, so setze
x := inf{xn : n ∈ N} und schließe in analoger Art und Weise.
❑
3.4.3 Beispiel.
Man betrachte die Folge 1n
. Aus Beispiel 2.6.2 wissen wir, dass inf{ 1n : n ∈
n∈N
N} = 0. Also folgt aus obigem Satz, dass limn→∞ n1 = 0. Das haben wir aber auch
schon in Beispiel 3.2.4, (ii), festgestellt.
Die Bedingung in Satz 3.4.2 ist hinreichend
n für Konvergenz, aber nicht notwendig. Betrachte zum Beispiel die Folge (−1)
.
n
n∈N
Um in allgemeinen metrischen Räumen Folgen auf Konvergenz zu untersuchen,
führt man den Begriff der Cauchy-Folge ein.
3.4.4 Definition. Sei hX, di ein metrischer Raum, und sei (xn )n∈N eine Folge von Elementen von X. Diese Folge heißt Cauchy-Folge5, , falls
∀ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle n, m ≥ N.
Ähnlich wie in Proposition 3.2.15 gilt.
3.4.5 Proposition. Sei (xn )n∈N eine Cauchy-Folge. Dann ist {xn : n ∈ N} beschränkt.
Beweis. Wähle N ∈ N mit d(xn , xm ) < 1 für n, m ≥ N. Setzt man
M := 1 + max{d(x1 , xN ), . . . , d(xN−1 , xN )} ,
so erhält man, dass d(xn , xN ) ≤ M für jedes n ∈ N.
❑
Aus dem nächsten Resultat erkennt man einen Zusammenhang zum Begriff der
Konvergenz.
5 Augustin
Louis Cauchy. 21.8.1789 Paris - 22.5.1857 Sceaux (bei Paris)
64
KAPITEL 3. DER GRENZWERT
3.4.6 Proposition. Ist die Folge (xn )n∈N konvergent, so ist sie eine Cauchy-Folge.
Beweis. Sei ǫ > 0 gegeben. Aus der Definition der Konvergenz folgt die Existenz
einer Zahl N ∈ N mit der Eigenschaft, dass d(xn , x) < 2ǫ , n ≥ N. Hier bezeichnet
x den Grenzwert der Folge (xn )n∈N , der zwar nach Voraussetzung existiert, über den
sonst aber nichts bekannt zu sein braucht. Dann gilt nach der Dreiecksungleichung für
n, m ≥ N
ǫ ǫ
d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < + = ǫ.
2 2
❑
Also ist jede konvergente Folge eine Cauchy-Folge. Würde nun umgekehrt jede
Cauchy-Folge konvergieren, so könnten wir die Konvergenz einer Folge nachweisen,
ohne ihren Grenzwert explizit in der Hand zu haben. Leider ist dies bei vielen metrischen Räumen nicht der Fall.
3.4.7 Definition. Ein metrischer Raum hX, di heißt vollständig, wenn jede CauchyFolge von Elementen aus X in X einen Grenzwert besitzt.
3.4.8 Beispiel. Die rationalen Zahlen sind nicht vollständig. Dazu betrachte man z.B.
eine
√ Folge (rn )n∈N bestehend aus rationalen Zahlen wie in Beispiel 3.2.6, die gegen
2 ∈ R \ Q konvergiert.
Diese ist eine Cauchy-Folge in R und daher auch in Q. Sie konvergiert
aber nicht
√
in Q. Denn würde sie das tun, so würde sie in R einerseits gegen 2 und andererseits gegen einen Grenzwert in Q konvergieren. Das widerspricht der Eindeutigkeit des
Grenzwertes in R.
3.4.9 Lemma. Sei (xn )n∈N eine Cauchy-Folge in einem metrischen Raum hX, di, die
eine konvergente Teilfolge hat. Dann ist (xn )n∈N konvergent.
Proof. Sei (xn(k) )k∈N die konvergente Teilfolge mit limk→∞ xn(k) = x. Ist ǫ > 0 gegeben, so wähle N1 so groß, dass d(xn , xm ) < ǫ für n, m ≥ N1 . Wähle N2 so groß, dass
d(xn(k) , x) < ǫ für k ≥ N2 . Setze N := max{N1 , N2 }. Wählt man nun k ≥ N, so folgt
n(k) ≥ k ≥ N, und man erhält für n ≥ N:
d(xn , x) ≤ d(xn , xn(k) ) + d(xn(k) , x) < ǫ + ǫ = 2ǫ.
Das wichtigste Beispiel für einen vollständige metrischen Raum sind die reellen
Zahlen:
3.4.10 Satz (Cauchysches Konvergenzkriterium). Sei (xn )n∈N eine Cauchy-Folge reeller Zahlen. Dann existiert eine reelle Zahl x, sodass (xn )n∈N gegen x konvergiert.
Beweis. Jede Folge (an )n∈N hat eine monotone Teilfolge (an(k) )k∈N .
Wir sagen die Folge (an )n∈N besitzt beim Index k eine Spitze, falls ak ≥ an für
alle n ≥ k. Wenn es unendlich viele Spitzen gibt, bilden sie eine monoton fallende
Teilfolge6 .
Gibt es keine oder nur endlich viele Spitzen, so kann man einen Index k finden,
sodass ab diesem Index keine Spitzen mehr auftreten. Setze n(1) = k + 1. Da n(1) keine
6 Genau genommen muss man eine monoton wachsende Abbildung n : N → N, die als Bild genau die
Menge aller Spitzen hat, konstruieren. Das lässt sich mit Hilfe des Rekursionssatzes bewerkstelligen.
3.5. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN
65
Spitze ist, existiert n(2) > n(1) mit an(2) > an(1) . Wieder kann n(2) keine Spitze sein,
und daher muss n(3) existieren mit an(3) > an(2) . Verfährt man induktiv so weiter, erhält
man eine monoton wachsende Teilfolge7 .
Sei nun (xn )n∈N eine Cauchy-Folge. Dann ist (xn )n∈N beschränkt. Nach dem eben
gezeigten kann man eine monotone Teilfolge wählen, welche natürlich ebenfalls
beschränkt ist. Nach Satz 3.4.2 ist diese Teilfolge konvergent, und nach Lemma 3.4.9
daher auch die Folge (xn )n∈N selbst konvergent.
❑
3.4.11 Beispiel.
Der metrische Raum X = [0, 1] versehen mit der euklidischen Metrik ist auch
vollständig, denn ist (xn )n∈N eine Cauchy-Folge in X, so ist sie das auch in R.
Wegen Satz 3.4.10 gilt limn→∞ xn = x für ein x ∈ R.
Da immer 0 ≤ xn ≤ 1 folgt aus Lemma 3.3.1, (iii), dass auch x ∈ X. Also hat
jede Cauchy-Folge in X einen Grenzwert in X.
Ist dagegen etwa X = (0, 1] versehen mit der euklidischen Metrik, so ist n1
n∈N
eine
Cauchy-Folge in X. Sie hat aber in X keinen Grenzwert, denn sonst würde
1
n n∈N auch in R gegen diesen Grenzwert x ∈ X ⊆ R und andererseits gegen 0
streben. Wegen 0 < X muss x , 0 im Widerspruch zu Satz 3.2.9, (i).
3.5 Konvergenz in weiteren metrischen Räumen
Wir betrachten zunächst als Menge R p (p ∈ N) und versehen diesen mit den drei
schon vorgestellten Metriken d1 , d2 , d∞ . Wie bereits bemerkt, unterscheiden sich diese
Metriken voneinander.
Der Unterschied ist aber nicht allzu groß. In der Tat werden wir sehen, dass wenn
eine Folge bezüglich einer der Metriken konvergiert, dann auch bezüglicher der anderen konvergiert.
Der Grund dafür liegt in der Ungleichungskette
max {|xk |} ≤
k=1,...,p
p
X
k=1
|xk |2
12
≤
p
X
k=1
|xk | ≤ p · max {|xk |} .
k=1,...,p
(3.8)
Das zweite ≤“ sieht man durch quadrieren. Das erste und dritte ist klar.
”
Es sei aber hier auch darauf hingewiesen, dass es auf ein und der selben Menge Metriken d, d̃ geben kann, sodass eine gewissen Folge (xn )n∈N in dieser Menge bezüglich
d konvergiert, aber bezüglich d̃ divergiert.
3.5.1 Proposition. Sei (xn )n∈N eine Folge von Punkten xn = (xn,1 , . . . , xn,p ) ∈ R p , und
y = (y1 , . . . , y p ) ∈ R p . Dann impliziert limn→∞ xn = y bezüglich einer der Metriken d1 ,
d2 , d∞ auch limn→∞ xn = y bezüglich der anderen zwei Metriken aus d1 , d2 , d∞ .
Die Konvergenz von (xn )n∈N gegen y bezüglich einer und daher aller dieser Metriken ist wiederum äquivalent zur komponentenweisen Konvergenz 8
lim xn,k = yk für alle k = 1, . . . , p .
n→∞
7 Dass
man so verfahren kann, wird durch den Rekursionssatz gewährleistet.
Konvergenz versteht sich in R bezüglich der euklidischen Metrik.
8 Diese
(3.9)
KAPITEL 3. DER GRENZWERT
66
Beweis. Aus Ungleichung (3.8) schließen wir
d∞ (xn , x) ≤ d2 (xn , x) ≤ d1 (xn , x) ≤ p · d∞ (xn , x).
Ist nun limn→∞ xn = y bezüglich d∞ , so gibt es zu ǫ > 0 ein N ∈ N, sodass d∞ (xn , x) <
ǫ, n ≥ N. Nach der letzten Ungleichung bedingt das d1 (xn , x) < p · ǫ, n ≥ N, woraus
limn→∞ xn = y bezüglich d1 folgt (siehe (3.6)).
Fast genauso schließt man daraus auf die Konvergenz bezüglich d2 , und daraus
wiederum auf die bezüglich d∞ .
Sei nun limn→∞ xn = y bezüglich bezüglich einer dieser Metriken und daher insbesondere bezüglich d∞ . Ist ǫ > 0 gegeben, so gibt es ein N ∈ N, sodass
max {|xn,k − yk |} = d∞ (xn , y) < ǫ, n ≥ N .
k=1,...,p
Insbesondere gilt für jedes k = 1, . . . , p, dass |xn,k − yk | < ǫ, n ≥ N, und somit
limn→∞ xn,k = yk .
Sei umgekehrt (3.9) vorausgesetzt und ǫ > 0 gegeben. Wähle N1 , . . . , N p , sodass
für k = 1, . . . , p folgt |xn,k − yk | < ǫ, n ≥ Nk . Setzt man N := max{N1 , . . . , N p }, so folgt
d∞ (xn , y) = max {|xn,k − yk |} < ǫ .
k=1,...,p
Also gilt xn → y bezüglich d∞ .
❑
3.5.2 Beispiel. Man betrachte die Folge (xn )n∈N im R3 gegeben durch


n
X
1 
1 
n
xn = · (−1) , 2 − 3n,
.
n
2k 
k=0
P
Wegen | n1 · (−1)n | = 1n → 0 und 1n · nk=0 21k ≤ n2 → 0 konvergieren die erste und die
dritte Komponente gegen 0.
Die zweite konvergiert wegen n1 (2 − 3n) = 2n − 3 gegen −3. Also konvergiert unsere
Folge bezüglich d1 , d2 , d∞ gegen (0, −3, 0).
Die nächste Aussage setzt inhaltlich die Bemerkung 3.3.5 fort.
3.5.3 Korollar. Sei (zn )i∈N eine Folge komplexer Zahlen und z ∈ C. Dann gilt
limn→∞ zn = z genau dann, wenn
lim Re(zn ) = Re z und lim Im(zn ) = Im z .
n→∞
n→∞
Beweis. Das ist gerade die Aussage von Proposition 3.5.1 für den R2 und die
euklidische Metrik.
❑
3.5.4 Korollar. Der Raum R p versehen mit einer der Metriken d1 , d2 , d∞ ist
vollständig. Insbesondere sind die komplexen Zahlen vollständig.
Beweis. Zunächst sei bemerkt, dass wenn eine Folge (xn )n∈N von Punkten des R p eine
Cauchy-Folge bezüglich einer der Metriken d1 , d2 , d∞ ist, so ist sie das bezüglich aller
dieser Metriken. Das folgt aus (3.8) ganz ähnlich der entsprechenden Aussage über die
Konvergenz wie am Anfang des Beweises von Proposition 3.5.1.
3.5. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN
67
Sei nun (xn )n∈N eine Cauchy-Folge von Punkten des R p (bzgl. d1 , d2 , d∞), xn =
(xn,1 , . . . , xn,p ). Dann gibt es zu jedem vorgegebenen ǫ > 0 eine Zahl N ∈ N mit
d∞ (xn , xm ) < ǫ für n, m ≥ N. Es folgt für jedes k ∈ {1, . . . , p}
|xn,k − xm,k | ≤ d∞ (xn , xm ) < ǫ, n, m ≥ N ,
d.h. jede der Folgen (xn,k )n∈N , k = 1, . . . , p, ist eine Cauchy-Folge reeller Zahlen. Daher
existieren y1 , . . . , y p ∈ R mit
lim xi,k = yk , k = 1, . . . , p .
i→∞
Wegen Proposition 3.5.1 folgt limn→∞ xn = y mit y = (y1 , . . . , y p ).
❑
3.5.5 Bemerkung. Die in Satz 3.3.4 hergeleiteten Rechenregeln gelten zum Teil auch
in R p , wenn R p mit der euklidischen Metrik und mit den Verknüpfungen +“ und
”
skalares Multiplizieren“ wie aus der Linearen Algebra bekannt versehen wird. Sind
”
also (xn )n∈N , (yn )n∈N Folgen in R p , die gegen x bzw. y konvergieren, und ist (λn )n∈N
eine gegen ein λ ∈ R konvergente Folge in R, so gilt
(i) limn→∞ (xn + yn ) = x + y.
(ii) limn→∞ λn xn = λx.
(iii) limn→∞ (xn , yn ) = (x, y) (∈ R) (vgl. (3.2)).
Das folgt aus Proposition 3.5.1, da man die jeweiligen Konvergenzen auf die Komponenten von R p zurückführen kann. Eine andere Möglichkeit, diese Behauptungen zu
p
beweisen, besteht darin, den euklidischen
qPAbstand d2 (x, y) zweier Punkte x, y ∈ R als
p
2
kx − yk2 zu schreiben, wobei kxk2 =
k=1 |xk | , und im Beweis von Satz 3.3.4 den
Betrag durch k.k ersetzt. Siehe Bemerkung 3.1.7.
Dass es auf ein und derselben Menge zwei Metriken geben kann, sodass die Konvergenz einer Folge bezüglich der einen Metrik nicht die Konvergenz bezüglich der
anderen bedingt, zeigt folgendes Beispiel.
3.5.6 Beispiel. Man betrachte R einerseits versehen mit der Euklidischen Metrik d2 , also die von |.| induzierte Metrik, und andererseits mit der diskreten Metrik d aus Beispiel
3.1.5, (iii).
Außerdem betrachte man die Folge n1 n∈N , welche bekannterweise gegen 0 konvergiert. Bezüglich d tut sie das nicht, da ja immer d(0, 1n ) = 1, n ∈ N.
Man zeigt unschwer, dass eine Folge (xn )n∈N bezüglich d genau dann gegen x konvergiert, wenn xn = x ab einem Index n0 .
3.5.7 Beispiel. Sei p eine feste Primzahl. Die Folge (pn )n∈N ist bezüglich der Metrik d(p) auf Z gegen 0 konvergent, bezüglich
der euklidischen Metrik d2 auf Z jedoch divergent. Um das einzusehen, sei ǫ > 0 gegeben. Wählt man N ∈ N mit p1N < ǫ,
so gilt für alle n ≥ N
1
1
d(p) (pn , 0) = n ≤ N < ǫ .
p
p
Angenommen es existiere x ∈ Z, sodass pn → x bezüglich d2 . Wähle N ∈ N, sodass d2 (pn , x) < 1, n ≥ N. Dann folgt mit
der Bernoullischen Ungleichung
1 + n(p − 1) ≤ pn = d2 (pn , 0) ≤ d2 (pn , x) + d2 (x, 0) < 1 + |x|, n ≥ N ,
und weiter, dass n(p − 1) ≤ |x|, n ≥ N, was der Tatsache widerspricht, dass R archimedisch angeordnet ist.
Tatsächlich sind in hZ, d2 i nur die ab einem Index konstanten Folgen konvergent. Denn ist xi → x, und wählt man
N ∈ N mit |xi − x| < 21 , i ≥ N, so folgt xi = x, i ≥ N, da zwei verschiedene ganze Zahlen sicher einen Abstand von
mindestens 1 haben.
KAPITEL 3. DER GRENZWERT
68
3.6 Konvergenz gegen unendlich
Betrachte die Folge reeller Zahlen xn = n, n ∈ N. Ist diese konvergent? Nein, denn
sie ist ja nicht einmal beschränkt. Trotzdem zeigt sie ein doch recht determiniertes
Verhalten. Sie strebt gegen unendlich“. Wir wollen jetzt genau definieren, was es heißt,
”
dass eine Folge (xn )n∈N in R gegen +∞ strebt (xn → +∞):
∀M > 0 ∃N ∈ N : xn > M für n ≥ N .
(3.10)
Diese Bedingung besagt, dass jede vorgegebene Schranke ab einem Index überschritten
wird. Entsprechend sagen wir, dass eine Folge (xn ) in R gegen −∞ strebt (xn → −∞),
wenn
∀M < 0 ∃N ∈ N : xn < M für n ≥ N .
(3.11)
Folgen, die im obigen Sinne gegen +∞ oder −∞ streben, heißen auch bestimmt divergent.
3.6.1 Bemerkung. Ist (xn )n∈N in R und x ∈ R oder x = ±∞, so kann man x = limn→∞ xn
einheitlich folgendermaßen schreiben:
(∀ξ ∈ R, ξ < x ∃N ∈ N : ∀n ≥ N ⇒ xn > ξ) ∧
(∀η ∈ R, η > x ∃N ∈ N : ∀n ≥ N ⇒ xn < η).
Für diese Konvergenzbegriffe gelten ähnliche Regeln, wie bei der Konvergenz gegen Zahlen.
3.6.2 Satz. Seien (xn )n∈N und (yn )n∈N Folgen, sodass limn→∞ xn = +∞. Es gelten folgende Aussagen
(i) Ist yn ≥ C für ein gewisses C ∈ R und für alle n ∈ N, n ≥ K mit einem gewissen
K ∈ N, d.h. die Menge {yn : n ∈ N, n ≥ K} ist nach unten beschränkt, dann gilt
auch
lim (xn + yn ) = +∞.
n→∞
(ii) limn→∞ (−xn ) = −∞.
(iii) Ist yn ≥ C für ein gewisses C > 0 und für alle n ∈ N, n ≥ K mit einem gewissen
K ∈ N, so gilt limn→∞ xn yn = +∞.
(iv) Ist xn ≤ yn , für alle n ∈ N, n ≥ K für einen gewissen Index K ∈ N, so folgt
limn→∞ yn = +∞.
(v) Seien alle bis auf endlich viele, d.h. alle ab einem Index K ∈ N, yn positiv (negativ). Dann gilt limn→∞ yn = +∞ (−∞) genau dann, wenn limn→∞ y1n = 0.
(vi) Sei (yn )n∈N monoton wachsend (fallend). Ist (yn )n∈N beschränkt, so ist diese Folge
konvergent gegen eine reelle Zahl. Ist (yn )n∈N unbeschränkt, so konvergiert sie
gegen +∞ (−∞).
Analoge Aussagen gelten im Fall limn→∞ xn = −∞.
Beweis.
3.6. KONVERGENZ GEGEN UNENDLICH
69
(i) Sei M > 0 gegeben. Wählt man N so groß, dass xn ≥ M − C, n ≥ N, und sodass
N ≥ K, so folgt für n ≥ N auch
xn + yn ≥ (M − C) + C = M,
also ist (xn + yn ) → +∞.
(ii) Folgt unmittelbar aus xn > M ⇔ −xn < −M.
(iii) Wähle N so, dass xn ≥
auch
M
C
für n ≥ N und sodass N ≥ K. Dann folgt für n ≥ N
xn yn ≥
M
· C = M,
C
d.h. xn yn → +∞.
(iv) Ist xn ≥ M, so erst recht yn ≥ M.
(v) Nun nehmen wir zuerst an, dass x1n → 0. Ist M vorgegeben, so wähle N ≥ K so
groß, dass für n ≥ N gilt x1n < M1 . Es folgt xn ≥ M.
Gilt xn → +∞, und ist ǫ > 0, so wähle N so groß, dass für n ≥ N gilt xn > 1ǫ .
Daraus ersieht man | x1n | = x1n < ǫ.
(vi) Ist (yn )n∈N beschränkt, so folgt die Aussage aus Satz 3.4.2. Im Fall der Unbeschränktheit gibt es eben wegen dieser zu jedem M > 0 ein N ∈ N, sodass
yN > M. Wegen der Monotonie folgt dann auch yn > M, n ≥ N
❑
3.6.3 Beispiel. Sei q ∈ R und betrachte die Folge qn , n ∈ N. Dann gilt



+∞






1
lim qn = 


n→∞
0





∄
,
,
,
,
q>1
q=1
−1 < q < 1
q ≤ −1
Dabei haben wir den Fall 0 ≤ q < 1 schon in Beispiel 3.2.10 behandelt. Der Fall
q = 1 ist klar. Für q > 1 folgt aus 0 < 1q < 1 durch Anwendung von Satz 3.6.2,
dass qn → +∞. Ist −1 < q < 0, so beachte |qn | = |q|n → 0. Ist q ≤ −1, so hat man
qn ≥ 1 für n gerade und qn ≤ −1 für n ungerade. Insbesondere ist der Abstand zweier
aufeinanderfolgender Folgenglieder ≥ 2, und wir sehen, dass qn keine Cauchy-Folge
und erst recht keine konvergente Folge sein kann. Konvergenz gegen +∞ oder −∞
kann aber auch nicht stattfinden, denn dann müssten ja die Folgenglieder insbesondere
ab einem Index alle das gleiche Vorzeichen haben.
3.6.4 Beispiel. Seien p, q ∈ R[x], p, q , 0, zwei Polynome. Betrachte die Folge
xn :=
p(n)
, n ∈ N, q(n) , 0 .
q(n)
KAPITEL 3. DER GRENZWERT
70
R
−∞
+∞
Abbildung 3.1: Veranschaulichung von R
Beachte hier, dass q(n) für höchstens endlich viele Werte von n verschwinden kann,
also ist ab einem gewissen Index sicher stets q(n) , 0. Schreibe p und q als p(x) =
am xm + . . . + a0 , q(x) = bk xk + . . . + b0 , mit am , bk , 0 an. Dann gilt



0
, m<k




am


, m=k
 bk
lim xn = 


n→∞
+∞
, m > k, abmk > 0





−∞ , m > k, am < 0
bk
Um dieses einzusehen, betrachte zuerst den Fall, dass m ≤ k, und schreibe
xn =
am nm + am−1 nm−1 + . . . + a0 am nm−k + am−1 nm−1−k + . . . + a0 n−k
=
.
bk nk + bk−1 nk−1 + . . . + b0
bk + bk−1 n−1 + . . . + b0 n−k
Dann konvergiert der Nenner dieses Bruches gegen bk , 0. Ist m < k, so konvergiert
der Zähler gegen 0, insgesamt also xn → 0. Ist m = k, so strebt der Zähler gegen am
und wieder folgt unsere Behauptung.
Ist m > k, so schreiben wir xn als
nm−k
am + am−1 n−1 + . . . + a0 n−m
.
bk + bk−1 n−1 + . . . + b0 n−k
Also gilt xn = nm−k yn , wobei yn → abmk . Nach Lemma 3.3.1 hat yn für hinreichend große
Indizes dasselbe Vorzeichen, wie abmk . Da x1n → 0 folgt aus Satz 3.6.2 das behauptete
Konvergenzverhalten für xn .
Am Ende diese Kapitels wollen wir eine Möglichkeit vorstellen, wie man die eingeführte Konvergenz gegen ±∞ als
herkömmliche Konvergenz in einem metrischen Raum auffassen kann.
Als erstes müssen wir ±∞ als Elemente unseres Raumes anerkennen, denn eine Folge von Elementen eines Raumes X
kann gegen ein Element von X konvergieren aber nicht gegen irgendetwas. Betrachte also die Menge R = R ∪ {+∞, −∞},
wobei +∞ und −∞ zwei verschiedene formale Elemente sind, die nicht in R liegen.
Nun versehen wir die Menge R in naheliegender Weise mit einer Relation:
x ≤ y : ⇐⇒ (x ≤ y, x, y ∈ R) oder x = −∞ oder y = +∞ .
Diese Relation ist offensichtlicherweise eine Totalordnung, die die Supremumseigenschaft hat. Somit lässt sich R folgendermaßen veranschaulichen.
x
3.6.5 Lemma. Die Funktion φ : R → (−1, 1), wobei φ(x) = 1+|x|
, bildet R bijektiv auf das offene Intervall (−1, 1) ab. Ihre
y
−1
−1
Inverse φ : (−1, 1) → R ist gegeben durch φ (y) = 1−|y| .
Schließlich sind φ und ihre Inverse φ−1 streng monoton wachsend.
Beweis. Als erstes wollen wir festhalten, dass für x ∈ R stets |φ(x)| < 1, d.h. φ(x) ∈ (−1, 1) gilt, und dass φ(x) das gleiche
Vorzeichen wie x hat.
y
Ist ψ : (−1, 1) → R definiert durch ψ(y) = 1−|y|
, so folgt
φ ◦ ψ(y) =
1
und
ψ ◦ φ(x) =
1
y
1−|y|
|y|
+ 1−|y|
=
y
= y,
(1 − |y|) + |y|
x
1+|x|
|x|
− 1+|x|
=
x
= x.
(1 + |x|) − |x|
3.6. KONVERGENZ GEGEN UNENDLICH
71
Somit ist nach Satz 1.2.18 die Abbildung φ bijektiv und ψ ist die Inverse von φ.
Zur behaupteten Monotonieeigenschaft: Sind x1 , x2 ∈ R mit x1 = 0 ∨ x2 = 0 ∨ sgn(x1 ) = sgn(x2 ), so gilt dann wegen
x1 |x2 | = |x1 |x2
x1 < x2 ⇔ x1 (1 + |x2 |) = x1 + x1 |x2 | < x2 + x2 |x1 | = x2 (1 + |x1 |) ⇔ φ(x1 ) < φ(x2 ).
Da x und φ(x) dasselbe Vorzeichen haben, folgt für den verbleibenden Fall, dass x1 , x2 , 0, sgn(x1 ) = − sgn(x2 ), wobei
o.B.d.A. x1 < x2 , dass sowohl x1 < 0 < x2 als auch φ(x1 ) < 0 < φ(x2 ).
❑
Nun setzten wir φ fort zu einer Abbildung R → [−1, 1], indem wir
 x




 1+|x|
φ(x) := 
1



−1
definieren.
, x∈R
, x = +∞
, x = −∞
+∞
φ
R
[−1, 1]
φ−1
−∞
Abbildung 3.2: Die Abbildung φ
Offensichtlicher ist diese Fortsetzung, die wir ebenfalls φ nennen wollen, auch bijektiv und streng monoton wachsend,
wobei
 y

, −1 < y < 1



 1−|y|
−1
φ (y) := 
.
+∞
, y=1



−∞ , y = −1
Wir definieren nun eine Metrik auf R, indem wir die euklidische Metrik mittels φ nach R übertragen.
3.6.6 Definition. Definiere eine Abbildung d : R × R → R als
d(x, y) := φ(x) − φ(y) .
3.6.7 Lemma. Die Abbildung d ist eine Metrik.
Dabei konvergiert eine Folge (xn )n∈N in R gegen ein x ∈ R bezüglich d genau dann, wenn die Folge (φ(xn ))n∈N in
[−1, 1] gegen φ(x) ∈ [−1, 1] bezüglich der euklidischen Metrik d2 konvergiert.
Beweis. Da die Abbildung (a, b) 7→ |a − b| eine Metrik ist und φ injektiv, folgen die verlangten Eigenschaften (M1)-(M3)
von d: Setze a := φ(x), b := φ(y), dann gilt
(M1):
d(x, y) = |a − b| ≥ 0, und d(x, y) = 0 genau dann, wenn a = b. Da φ injektiv ist, ist dieses äquivalent dazu das x = y.
(M2):
d(x, y) := |a − b| = |b − a| = d(y, x)
(M3):
Sei zusätzlich z ∈ R und setze c := φ(z). Dann ist
d(x, z) = |a − c| ≤ |a − b| + |b − c| = d(x, y) + d(y, z) .
Die Aussage über die Konvergenz folgt leicht aus Bemerkung 3.2.3, da
xn → x (bzgl. d) ⇔ d(xn , x) = d2 (φ(xn ) → 0 ⇔ φ(xn ) → φ(x) (bzgl. d2 ).
KAPITEL 3. DER GRENZWERT
72
❑
Wir wissen jetzt also, was es bedeutet, dass eine Folge reeller Zahlen in hR, di gegen +∞ bzw. −∞ konvergiert. Haben
wir unser Modell nun richtig in dem Sinne gebaut, dass dieser Begriff von Konvergenz gegen ±∞ tatsächlich mit dem
eingangs eingeführten Begriff von Konvergenz gegen ±∞ übereinstimmt?
3.6.8 Proposition. Sei (xn )n∈N eine Folge reeller Zahlen. Dann gilt limn→∞ xn = +∞ im Sinne einer Konvergenz im metrischen Raum hR, di genau dann, wenn (3.10) gilt. Analog gilt limn→∞ xn = −∞ in hR, di genau dann, wenn (3.11) gilt.
Bleibt die Folge weg von ±∞, so bleibt unser alter Konvergenzbegriff reeller Zahlen erhalten: Sei x ∈ R, dann gilt
limn→∞ xn = x in hR, di genau dann, wenn limn→∞ xn = x in R bezüglich der euklidischen Metrik d2 .
Beweis. Sei nun vorausgesetzt, dass xn → +∞ in hR, di, und sei M > 0 gegeben. Setze ǫ := 1 − φ(M) > 0, und wähle N ∈ N
mit d(xn , +∞) < ǫ, n ≥ N. Dann ist
1 − φ(xn ) = |φ(xn ) − 1| = d(xn , +∞) < ǫ = 1 − φ(M) ,
und daher φ(M) < φ(xn ), also xn > M.
Gelte umgekehrt (3.10), und sei 0 < ǫ < 1 gegeben. Setze M := φ−1 (1 − ǫ) > 0, und wähle N ∈ N so, dass xn > M für
n ≥ N. Dann folgt
d(xn , +∞) = |φ(xn ) − 1| = 1 − φ(xn ) < 1 − φ(M) = ǫ, n ≥ N .
Wir sehen, dass xn → +∞ in hR, di äquivalent zu (3.10) ist. Die Behauptung für xn → −∞ sieht man genauso.
Sei nun x ∈ R, und xn → x in R bezüglich d2 . Dann folgt, wegen unserer Rechenregeln für Folgen, Satz 3.3.4, dass
auch φ(xn ) → φ(x). Wegen Lemma 3.6.7 erhalten wir xn → x in hR, di.
Gelte nun xn → x in hR, di, d.h. φ(xn ) → φ(x) in R (Lemma 3.6.7). Die Abbildung φ−1 ist von der gleichen Gestalt
wie φ, und wir schließen wieder wegen unserer Rechenregeln für Folgen, dass xn = φ−1 (φ(xn )) → φ−1 (φ(x)) = x in R
bezüglich d2 .
❑
Wir haben nun unser Zahlensystem etwas erweitert, um den Begriff des Strebens gegen unendlich“ als Konvergenz in
”
metrischen Räumen interpretieren zu können. Wir haben dabei jedoch auch sehr viel verloren, nämlich unsere algebraischen
Operationen + und ·. Gemäß Satz 3.6.2 macht es zwar Sinn
x + (+∞) = +∞, −(+∞) = −∞, y(+∞) = +∞,
1
= 0, usw.
±∞
für x, y ∈ R, y > 0 zu setzen, damit die Operationen mit den Grenzwertregeln verträglich bleiben. Aber wie sollte man z.B.
+∞ + (−∞) oder 0 · (+∞) definieren?
Als einfachstes Beispiel betrachte man[!ht] xn = 2n, yn = n. Es gilt xn , yn → +∞. Es gilt aber xn − yn = n → +∞, was
auf (+∞) − (+∞) = +∞“ deuten würde, wogegen yn − xn = −n → −∞, also (+∞) − (+∞) = −∞“.
”
”
3.7 Unendliche Reihen
Wir sind schon einmal einer Folge (S n )n∈N begegnet, die von der speziellen Gestalt
P
S n = nk=0 ak mit gewissen Zahlen ak war, nämlich der geometrischen Reihe S n =
1
1 + z + . . .+ zn mit |z| < 1. Wir haben gezeigt, dass diese Folge gegen den Grenzwert 1−z
Pn k
konvergiert. Das heißt also, dass für große Werte von n die Summe k=0 z den Wert
1
1−z beliebig gut approximiert. Es ist also naheliegend zu schreiben
X
1
=
zk .
1 − z k=0
∞
3.7.1 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen.
Allgemeiner kann (ak )k∈N auch eine Folge von Elementen eines metrischen Raumes sein, auf dem man eine Verknüpfung + hat; zum Beispiel Vektoren des R p ).
Bezeichne mit S n , n ∈ N die n-te Partialsumme
S n := a1 + a2 + . . . + an .
Die Folge (S n )n∈N heißt dann die unendliche Reihe mit den Summanden ak .
3.7. UNENDLICHE REIHEN
73
Hat die Folge (S n )n∈N einen Grenzwert, so sagen wir die Reihe sei konvergent. In
diesem Fall nennen wir ihren Grenzwert lim S n die Summe der (unendlichen) Reihe
n→∞
und benützen die Schreibweise
∞
X
ak := lim S n .
n→∞
k=1
Falls der Grenzwert lim S n nicht existiert heißt die Reihe divergent.
n→∞
Um die Notation zu vereinfachen, benützt man die Schreibweise
∞
P
Reihe (S n )n∈N selbst, und sagt dann
Ausdrücke, wie etwa
∞
P
∞
P
ak auch für die
k=1
ak sei konvergent oder divergent.
k=1
ak haben eine analoge Interpretation durch Grenzwerte
k=6
von Partialsummen.
3.7.2 Bemerkung.
(i) Gilt lim S n = +∞ bzw. = −∞ so heißt die Reihe konvergent gegen +∞ bzw. −∞
n→∞
(man sagt auch bestimmt divergent gegen +∞ bzw. −∞) und schreibt
∞
X
ak = +∞ bzw.
k=1
∞
X
k=1
ak = −∞.
(ii) Eine unendliche Reihe ist per definitionem die Folge ihrer Partialsummen, d.h. die Theorie der Reihen ist ein Spezialfall jener der Folgen. Umgekehrt kann man auch jede Folge als Folge der Partialsummen einer Reihe auffassen:
Ist (cn )n∈N irgendeine Folge, so setze
a1 := c1 , a2 := c2 − c1 , a3 := c3 − c2 , . . . , ak := ck − ck−1 , . . . .
Dann gilt cn =
n
P
ak .
k=1
Auf Grund der Definition einer unendlichen Reihe als Limes ihrer Partialsummen
können wir Aussagen über Folgen sofort auf Reihen übertragen.
3.7.3 Korollar. Sind
∞
P
ak , und
bk konvergent, so ist auch
∞  ∞ 
∞
X
X  X 
(ak + bk ) =  ak  +  bk  .
k=1
P∞
∞
P
(ak + bk ) konvergent.
k=1
k=1
k=1
Es gilt
∞
P
k=1
k=1
und λ eine feste (reelle oder komplexe) Zahl, so sind auch
k=1 ak konvergent
P∞
ā
und
(λa
)
konvergent.
Es gilt
k
k=1 k
k=1
Ist
P∞
∞
X
āk =
k=1
∞
X
k=1
ak ,
∞
∞
X
X
(λak ) = λ ·
ak .
k=1
Beweis. Für die entsprechenden Partialsummen S n =
n
P
k=1
n
P
k=1
(ak + bk ) gilt S n + T n = Un .
k=1
ak , T n =
n
P
k=1
bk und Un =
KAPITEL 3. DER GRENZWERT
74
Weiters gilt für Vn =
n
P
(λak ) und Wn =
n
P
āk sicher Vn = λS n und Wn = S̄ n . Also
k=1
k=1
folgen auch diese Rechenregeln aus den entsprechenden Regeln für Folgen.
❑
Beim letzten Beweis haben wir die Rechengesetze wie Kommutativität, Distributivität u.ä. für endliche Summen benützt. Das Verhalten dieser Rechenregeln bei unendlichen Reihen ist wesentlich komplizierter, vgl. u.a. Beispiel 3.9.1.
3.7.4 Fakta.
1. Man beachte, dass man endlich viele Reihenglieder beliebig abändern kann, ohne das Konvergenzverhalten zu stören. Das gilt deshalb, weil sich dabei die neue
Folge der Partialsummen ab einem gewissen Index von der alten nur um eine
additive Konstante unterscheidet. Natürlich verändert sich dabei die Summe der
Reihe.
P
2. Hat man eine konvergente Reihe ∞j=1 a j gegeben, so dürfen beliebig Klammern
”
gesetzt werden“, ohne das Konvergenzverhalten der Reihe zu verändern, was exakt formuliert bedeutet, dass für jede streng monoton wachsende Folge (k(n))n∈N
natürlicher Zahlen gilt, dass
∞
X
aj =
j=1
∞
X
An ,
n=1
wobei A1 = a1 + · · · + ak(1) und An = ak(n−1)+1 + · · · + ak(n) für n ≥ 2.
Dieser Sachverhalt folgt aus der einfachen Beobachtung, dass die Folge der ParP
tialsummen unserer neuen Reihe ∞
A genau die Teilfolge (S k(n) )n∈N der Folge
P∞n=1 n
(S k )k∈N der Partialsummen von j=1 a j ist (vgl. Satz 3.2.9, (iv)).
P
Die Umkehrung gilt hier nicht. Es kann nämlich vorkommen, dass ∞
n=1 An konP∞
vergiert, aber k=1 ak nicht. Man betrachte nur die Reihe 1 − 1 + 1 − 1 + . . . und
klammere immer zwei aufeinanderfolgende Summanden ein.
3. Sind
∞
P
k=1
ak und
∞
P
bk zwei konvergente Reihen mit reellen Summanden, sodass
k=1
ak ≤ bk für alle k ∈ N, so gilt für die Partialsummen klarerweise auch
n
P
k=1
n
P
k=1
ak ≤
bk für alle n ∈ N. Aus Lemma 3.3.1 erhalten wir dann für die Grenzwerte
dieser zwei Folgen von Partialsummen
∞
X
k=1
ak ≤
∞
X
bk .
k=1
Ist nun zusätzlich sogar al < bl für zumindest ein l ∈ N, so folgt al + δ ≤ bl für
n
n
P
P
ein hinreichend kleines δ > 0. Somit gilt für n ≥ l, dass δ +
ak ≤
bk . Für
k=1
n → ∞ folgt wieder aus Lemma 3.3.1, dass
∞
X
k=1
ak < δ +
∞
X
k=1
ak ≤
∞
X
k=1
bk .
k=1
3.7. UNENDLICHE REIHEN
75
3.7.5 Beispiel.
∞
P
Betrachte die Reihe
k=1
S n :=
1
k(k+1) .
n
X
k=1
Die Reihe
∞
P
k=1
1
k(k+1)
Wegen
1
k(k+1)
=
1
k
−
1
k+1
gilt (Teleskopreihe)
!
n
X
1
1
1
1
=1−
=
−
.
k(k + 1) k=1 k k + 1
n+1
konvergiert also gegen lim S n = 1.
n→∞
Lässt man die ersten drei Terme weg, d.h. ersetzt sie durch 0, so gilt für die
entsprechenden Partialsummen S n′ stets (n ≥ 3)
!
1
1
1
1
1
3
′
Sn = Sn −
−
−
= 1−
− → .
1·2 2·3 3·4
n+1
4
4
D.h. die Reihe
∞
P
k=4
1
k(k+1)
ist ebenfalls konvergent. Ihre Summe ist
Fasst man immer zwei Summanden der Reihe
die Reihe
∞
P
k=1
∞
P
k=1
2
(2k−1)(2k+1) ,
1
k(k+1)
1
4
.
zusammen, so erhält man
welche nach Fakta 3.7.4, 2, ebenfalls die Summe 1 hat.
3.7.6 Bemerkung. Aus dem entsprechenden Resultat für Folgen erhält man, dass eiP
ne Reihe ∞
bestehend aus komplexen Zahlen genau dann konvergiert, wenn die
n=1 z
Pn
P∞
reellen Reihen ∞
n=1 Re zn und n=1 Im zn beide konvergieren. In diesem Fall gilt
∞
X
zn = (
n=1
∞
X
Re zn ) + i(
n=1
∞
X
Im zn ).
n=1
Da jede konvergente Folge auch Cauchy-Folge ist, erhält man unmittelbar eine einfache notwendige Bedingung für die Konvergenz einer Reihe.
3.7.7 Proposition. Ist
∞
P
ak konvergent, so folgt limk→∞ ak = 0.
k=1
Beweis. Betrachte die Reihe
∞
P
k=1
bk , wobei b1 = 0 und bk+1 = ak für k ∈ N. Sind (S n )n∈N
und (T n )n∈N die Folgen der Partialsummen von
∞
P
k=1
S n − Tn =
n
X
k=1
ak −
n
X
ak bzw.
∞
P
bk , so folgt
k=1
ak−1 = an .
k=2
Wegen T n+1 = S n folgt aus Satz 3.2.9, dass (T n )n∈N gegen den gleichen Grenzwert,
wie (S n )n∈N konvergiert. Somit erhalten wir S n − T n = an → 0.
❑
Wie wir aus Beispiel 3.7.9 sehen werden, ist diese notwendige Bedingung bei weitem nicht hinreichend.
∞
P
ak eine Reihe mit reellen nichtnegativen Summanden, d.h. ak ∈
3.7.8 Satz. Sei
R, ak ≥ 0.
k=1
KAPITEL 3. DER GRENZWERT
76
(i) Die Reihe ist genau dann konvergent, wenn die Folge (S n )n∈N der Partialsummen
n
∞
P
P
beschränkt ist9 . In diesem Fall ist auch ak ≤
ak für alle n ∈ N. Anderenfalls
k=1
k=1
ist sie bestimmt gegen +∞ divergent.
(ii) Ist
∞
P
k=1
bk eine divergente Reihe nichtnegativer reeller Zahlen mit ak ≥ bk , k ∈ N,
so ist auch
∞
P
ak divergent (Minorantenkriterium).
k=1
(iii) Ist
∞
P
k=1
bk eine konvergente Reihe nichtnegativer reeller Zahlen mit ak ≤ bk , k ∈ N,
so ist auch
∞
P
ak konvergent (Majorantenkriterium), und
k=1
∞
P
k=1
ak ≤
∞
P
bk .
k=1
Beweis. Wegen der Voraussetzung ak ≥ 0 ist (S n )n∈N monoton wachsend. Somit folgt
(i) aus Satz 3.6.2, (vi). Die behauptete Ungleichung gilt, da im Falle der Konvergenz
der monoton wachsenden Folge (S n )n∈N der Grenzwert gemäß Satz 3.4.2 nichts anderes
als sup{S n : n ∈ N} ist.
∞
P
bk , so ist auch
Ist nun bk ≥ 0 und (T n )n∈N der Folge Partialsummen der Reihe
k=1
diese monoton wachsend.
Ist diese divergent, und ak ≥ bk , so gilt sicherlich S n ≥ T n . Also kann die Folge
(S n )n∈N nicht beschränkt sein.
∞
P
Ist dagegen
bk konvergent, und ak ≤ bk , so ist S n ≤ T n , und mit (T n )n∈N ist auch
k=1
die Folge (S n )n∈N ist nach oben beschränkt. Die behauptete Ungleichung folgt aus
Fakta 3.7.4, 3.
❑
3.7.9 Beispiel. Betrachte die harmonische Reihe
∞
X
1
k=1
k
.
Diese Reihe ist nicht konvergent (sie ist bestimmt divergent gegen +∞). Betrachtet
man nämlich die Folge der Partialsummen, S n = 1 + 21 + · · · + n1 , so ist diese monoton
wachsend. Für die Existenz des Limes ist es also notwendig und hinreichend, dass diese
Folge beschränkt ist (vgl. Satz 3.7.8, (i)). Nun gilt jedoch
S 2l = 1 +
1+
1 1 1 1 1 1 1 1
1
+ + + + + + + +...+ l ≥
2 3 4 5 6 7 8 9
2
1
1 1 1 1 1 1 1 1
1
+ + + + + + + +...+ l = 1+l · ,
2 |
4 {z4} |
8 8 {z8 8} 16
2
2
= 21
= 12
d.h. S 2l kann für l → ∞ nicht beschränkt bleiben.
3.7.10 Beispiel. Durch Vergleich mit der harmonischen Reihe ist nach dem Minoran∞
P
1
10
tenkriterium die Reihe
kα für α < 1 divergent .
k=1
9 Da
(S n ) monoton wachsend ist, ist sie genau dann beschränkt, wenn irgendeine Teilfolge davon beschränkt ist.
10 Bemerke, dass wir kα erst für rationales α definiert haben.
3.8. KONVERGENZKRITERIEN
77
3.7.11 Korollar (Cauchysches Konvergenzkriterium). Die Reihe
∞
P
ak ist genau dann
k=1
konvergent, wenn gilt
n
X
ak < ǫ, n > m ≥ N.
∀ǫ > 0 ∃N ∈ N : k=m+1 Beweis. Für die Partialsummen S n =
n
P
k=1
ak gilt S n − S m =
(3.12)
Pn
k=m+1 ak .
Also ist
(3.12) nichts anderes als das Cauchysches Konvergenzkriterium für die Folge der
Partialsummen.
❑
Wir werden später weitere Konvergenzkriterien kennenlernen. Diesen Abschnitt
beenden wir mit einer weiteren Begriffsbildung, die sich aus folgender Überlegung
motivieren lässt.
Will man mit Hilfe des Cauchyschen Konvergenzkriteriums
eine Reihe auf Kon
n
P
vergenz überprüfen, so muss man den Ausdruck a abschätzen. Verwendet man
k=m+1 k die Dreiecksungleichung, so erhält man
n
n
n
X
X
X
ak ≤
(3.13)
|ak | .
| ak |= k=m+1 k=m+1
k=m+1 Kennt man also eine hinreichend gute Abschätzung für den entsprechenden Ausdruck
P
der Reihe ∞
k=1 |ak |, so ist man fertig.
3.7.12 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Die Reihe
P∞
P∞
k=1 ak heißt absolut konvergent, wenn die Reihe der Beträge k=1 |ak | konvergiert.
Aus (3.13) und dem Cauchyschen Konvergenzkriterium erhalten wir sofort
3.7.13 Lemma. Jede absolut konvergente Reihe ist auch konvergent.
3.7.14 Bemerkung. Die Umkehrung gilt jedoch im Allgemeinen nicht. Zum Beispiel
P
k+1 1
ist die alternierende harmonische Reihe ∞
k=1 (−1)
k konvergent, wie man aus dem
Leibnizschen Konvergenzkriterium weiter unten erkennt.
P 1
Die Reihe der Beträge ∞
k=1 k ist die harmonische Reihe, also divergent.
3.7.15 Definition. Reihen, die konvergent, aber nicht absolut konvergent sind, heißen
auch bedingt konvergent.
3.8 Konvergenzkriterien
Wir wollen das Majorantenkriterium ausnützen, um durch Vergleich mit der geometrischen Reihe zwei oft einsetzbare hinreichende Bedingungen für die absolute Konvergenz einer Reihe herzuleiten.
3.8.1 Satz. Sei
∞
P
k=1
ak eine Reihe mit reellen oder komplexen Summanden. Dann gilt:
KAPITEL 3. DER GRENZWERT
78
(i) Wurzelkriterium: Gibt es eine feste Zahl q, 0 < q < 1, sodass ab einem Index k0
die Ungleichung
pk
|ak | ≤ q, k ≥ k0 ,
∞
P
so ist die Reihe
ak absolut konvergent. Gibt es eine Teilfolge (ak(l) )l∈N mit
k=1
pk
|ak(l) | ≥ 1, so ist sie divergent.
(ii) Quotientenkriterium: Gibt es eine Zahl q, 0 < q < 1, sodass ab einem Index k0
alle ak , 0 sind, und sodass
|ak+1 |
≤ q, k ≥ k0 ,
|ak |
so ist die Reihe
∞
P
ak absolut konvergent. Gibt es einen Index k0 , sodass ak , 0
k=1
und
|ak+1 |
|ak |
≥ 1 für k ≥ k0 , so ist sie divergent.
Beweis.
(i) Aus
∞
√k
P
|ak | ≤ q < 1 folgt |ak | ≤ qk . Da die Reihe
qk konvergiert, zeigt das
Majorantenkriterium, dass
∞
P
k=k0
k=k0
|ak |, und damit auch
∞
P
k=1
|ak | konvergiert.
√
Ist dagegen k |ak | ≥ 1 für unendlich viele Indizes k, so kann (|ak |)k∈N und damit
(ak )k∈N keine Nullfolge sein. Daher ist die Reihe divergent.
(ii) Es existiere q < 1, sodass für hinreichend große k ∈ N, d.h. für alle k ≥ k0 mit
einem geeigneten k0 , |ak+1 | ≤ q|ak | gilt. Dann folgt durch ein induktives Argument
|al | ≤ ql
|ak0 |
, l ≥ k0 ,
q k0
q
√
|a |
und wir erhalten l |al | ≤ q · l qkk00 . Da der zweite Faktor mit l → ∞ gegen 1 strebt,
können wir das Wurzelkriterium anwenden.
|
Aus |a|ak+1
≥ 1 für k ≥ k0 folgt |ak+1 | ≥ |ak |. Also kann (|ak |)k∈N keine Nullfolge
k|
sein, da sie ab dem Index k0 monoton wächst.
❑
Diese Bedingungen werden oft in der folgenden Form angewandt.
3.8.2 Korollar. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Ist
pk
|ak+1 |
< 1 bzw. lim |ak | < 1 ,
k→∞
k→∞ |ak |
lim
so ist die Reihe
Reihe divergent.
P∞
k=1
ak absolut konvergent. Ist dieser Limes dagegen > 1, so ist die
Beweis. Existiert der eine oder andere Limes η und ist η < 1, so folgt η < 1+η
2 < 1.
√k
1+η
1+η
|ak+1 |
Aus Lemma 3.3.1 sieht man, dass |ak | < 2 =: q bzw. |ak | < 2 =: q ab einem
3.8. KONVERGENZKRITERIEN
79
gewissen k0 . Im Falle η > 1 schließt man analog.
❑
Es sei darauf hingewiesen, dass es vorkommen kann, dass für eine Reihe Korollar 3.8.2 nicht anwendbar ist, weil der entsprechende Limes nicht existiert, Satz 3.8.1
jedoch schon anwendbar ist.
3.8.3 Beispiel.
P zn
(i) Betrachte die Reihe ∞
n=0 n! , wobei n! := 1 · 2 · 3 · . . . · n die Zahl n-faktorielle
bezeichnet und z ∈ C. Diese Reihe ist konvergent, denn es gilt
n+1 z 1· 2· ...·n
|z|
=
(n+1)!
|z| =
→ 0.
zn 1 · 2 · . . . · n · (n + 1)
n+1
n!
(ii) Betrachte die Reihe
P∞
1
n=1 (3+(−1)n )n .
s
n
Die Folge der n-ten Wurzeln
1
1
=
(3 + (−1)n )n (3 + (−1)n )
hat zwar keinen Grenzwert, aber ihre Glieder sind alle ≤ 21 . Somit kann man
zwar nicht Korollar 3.8.2 anwenden, aber das Wurzelkriterium aus Satz 3.8.1.
Der Grenzwert der Reihe lässt sich mit Hilfe der hergeleiteten Regeln für Reihen
berechnen:
! X
∞
∞
∞
∞
X
X
X
1
1
1
1
1
=
=
+
+
=
n )n
2k−1
2k
2k−1
2k
(3
+
(−1)
2
4
2
4
k=1
k=1
k=1
n=1

∞
∞
X
 1
1 X 1
2
+
= 2 
k
k
4
16
1−
k=1
k=1
1
4
 
 
− 1 + 

1

− 1 .
1
1 − 16
(iii) Bezeichne mit τ(n) die Anzahl der Teiler der natürlichen Zahl n. Wir betrachten
P
n
die Reihe ∞
n=1 τ(n)x wobei x > 0 ist. Wegen τ(n) ≤ n gilt
pn
pn
√
τ(n)xn = x · τ(n) ≤ x · n n → x .
Ist also x < 1, so ist die Reihe konvergent. Für x ≥ 1 ist sie sicher divergent, denn
dann bilden die Summanden keine Nullfolge.
Wir haben im Beweis von Satz 3.8.1 gesehen, dass das Quotientenkriterium
schwächer als das Wurzelkriterium ist. Das eben betrachtete Beispiel ist gerade
eines wo uns das Wurzelkriterium zum Ziel führt, das Quotientenkriterium aber
versagen würde. Denn ist n > 2 eine Primzahl, dann gilt τ(n) = 2. Weiters ist n
sicher ungerade, und damit kann n + 1 keine Primzahl sein, also gilt τ(n + 1) ≥ 3.
Wir erhalten damit
τ(n + 1)xn+1 3
≥ · x.
τ(n)xn
2
Für x ≥ 32 ist daher der Quotient ≥ 1. Da es unendlich viele Primzahlen gibt,
können wir also das Quotientenkriterium nicht anwenden.
Die nun präsentierten Kriterien basieren auf folgendem auch später verwendeten
Lemma.
KAPITEL 3. DER GRENZWERT
80
3.8.4 Lemma. Seien a1 , . . . , am und b1 , . . . , bm komplexe oder reelle Zahlen, so gilt
m
X
n=1
an bn = am βm −
wobei die βn die Partialsummen
n
P
m−1
X
(an+1 − an )βn ,
n=1
b j = βn bezeichnen.
j=1
Beweis.
m−1
X
n=1
m
X
n=2
(an+1 − an )βn =
an βn−1 −
m−1
X
n=1
m−1
X
n=1
an+1 βn −
an βn = am βm−1 −
am βm − am bm −
m−1
X
n=2
m−1
X
n=2
m−1
X
an βn =
n=1
an (βn − βn−1 ) − a1 β1 =
an bn − a1 b1 = am βm −
m
X
an bn .
n=1
❑
3.8.5 Satz (Dirichletsches11 Kriterium). Sei (an )n∈N eine monotone Nullfolge reeller
Zahlen und sei (bn )n∈N eine Folge reeller oder komplexer Zahlen. Gilt für eine Zahl
M>0
N
X
bn ≤ M, N ∈ N,
n=1 so ist die Reihe
∞
P
an bn konvergent.
n=1
Beweis. Sei N so groß, dass |an | < ǫ für n ≥ N. Dann folgt für k, m ≥ N, k < m aus
Lemma 3.8.4 und der Dreiecksungleichung

m
m
m−1 
n
X
X
X
X



an bn ≤ am
bi +
bi  .
|an+1 − an | n=k+1
n=k+1
i=k+1 i=k+1
P
P
P
Da | ni=k+1 bi | ≤ | ki=1 bi | + | ni=1 bi | ≤ 2M, schätzen wir diesen Ausdruck weiter nach
oben durch
m−1
X
2M|am | + 2M
|an+1 − an |
n=k+1
ab. Voraussetzungsgemäß haben die Ausdrücke der Form (an+1 − an ) niemals verschiedenes Vorzeichen. Also gilt


m−1
m−1
X

X


2M |am | +
|an+1 − an | = 2M |am | + (an+1 − an ) ≤
n=k+1
n=k+1
2M (|am | + |am | + |ak+1 |) ≤ 2M · 3ǫ.
∞
P
Nach dem Cauchyschen Kriterium ist die Reihe
an bn konvergent.
n=1
11 Johann
Peter Gustav Lejeune Dirichlet. 13.2.1805 Düren (bei Aachen) - 5.5.1859 Göttingen
❑
3.8. KONVERGENZKRITERIEN
81
3.8.6 Korollar (Leibniz12Kriterium). Sei
∞
P
(−1)n an eine alternierende Reihe, d.h.
n=1
an ≥ 0, n ∈ N. Ist (ak )k∈N monoton fallend und gilt lim an = 0, so konvergiert
n→∞
∞
P
(−1)nan .
n=1
Beweis. Setze im Dirichletschen Kriterium bn = (−1)n .
❑
∞
P
3.8.7 Beispiel. Für α > 1 ist die Reihe
k=1
1
kα
konvergent13.
m+1
Da m+1
m → 1, kann man m ∈ N so wählen, dass m ≤ α. Nach dem Majorantenkriterium genügt es, die Behauptung für den Exponenten m+1
m zu zeigen.
∞
P
Betrachte die nach dem Leibnizschen Kriterium konvergente Reihe (−1)k+1 11 .
km
k=1
Fassen wir immer je zwei Summanden zusammen, so konvergiert nach Fakta 3.7.4, 2,
auch die Reihe
!
∞
X
1
1
−
.
1
1
m
(2k) m
k=1 (2k − 1)
Nun ist
1
(2k − 1)
1
m
−
(2k)
1
1
1
=
1
m
(2k) m − (2k − 1) m
1
m
(2k − 1) (2k)
(2k) − (2k − 1)
1
m
=
1
1
1
(2k − 1) m (2k) m
·
≥
1
1
m−2
m−1
(2k − 1) m + . . . + (2k) m (2k − 1) m + (2k − 1) m
1
1
1
=
· m+1
≥
2
m−1
m+1
(2k) m m(2k) m
m2 m k m
∞
P
1
Nach dem Majorantenkriterium folgt somit, dass auch die Reihe
m+1 konvergiert.
·
(2k)
m−1
m
+ (2k)
m−2
m
k=1 k
3.8.8 Korollar (Abelsches14 Kriterium). Sei die Reihe
Folge. Dann ist die Reihe
∞
P
∞
P
m
bn konvergent, und sei (an )n∈N eine monotone und beschränkte
n=1
an bn konvergent.
n=1
Beweis. Die Folge (an )n∈N ist konvergent, an → a. Es gilt
N
X
an bn =
n=1
N
X
n=1
(an − a)bn + a
N
X
bn .
n=1
Für N → ∞ existiert für jeden der beiden Summanden auf der P
rechten Seite der Grenzwert, denn die Reihe
konvergiert nach dem Dirichletschen Kriterium und die Reihe ∞
n=1 bn nach Voraussetzung.
P∞
n=1 (an
− a)bn
❑
3.8.9 Satz (Kriterium von Raabe15 ). Sei (an )n∈N eine Folge reeller oder komplexer Zahlen. Gibt es eine Zahl β > 1, sodass
ab einem Index k0 alle ak , 0 sind, und
|ak+1 |
β
≤ 1 − , k ≥ k0 ,
|ak |
k
so ist die Reihe
∞
P
ak absolut konvergent.
k=1
Ist ab einem gewissen Index k0 jedoch
konvergent.
12 Gottfried
|ak+1 |
|ak |
≥ 1 − 1k , so ist sie nicht absolut konvergent, also höchstens bedingt
Wilhelm Leibniz. 1.7.1646 Leipzig - 14.11.1716 Hannover
dass wir kα erst für rationales α definiert haben.
14
Niels Henrik Abel. 5.8.1802 Finnö (Norwegen) - 6.4.1829 Froland (Norwegen)
15 Josef Ludwig Raabe. 1801 - 1859
13 Bemerke,
KAPITEL 3. DER GRENZWERT
82
Beweis. Für k ≥ k0 gilt wegen unserer Voraussetzung k|ak+1 | ≤ k|ak | − β|ak | und daher
(β − 1)|ak | ≤ (k − 1)|ak | − k|ak+1 |.
(3.14)
Wegen β > 1 ist (k−1)|ak | > k|ak+1 | > 0. Somit ist die Folge ((k−1)|ak |)k∈Z≥2 monoton und beschränkt, und daher konvergent.
Daraus ergibt sich die Konvergenz der Folge (in k)
k
X
n=2
((n − 1)|an | − n|an+1 |) = |a2 | − k|ak+1 |
von Partialsummen. Wegen (3.14) konvergiert die Reihe
|ak+1 |
|ak |
1
k
P∞
n=1
|an |.
≥ 1 − für k ≥ k0 (> 1), so folgt k|ak+1 | ≥ (k − 1)|ak | ≥ (k0 − 1)|ak0 | := α > 0. Also ist |ak+1 | ≥
Gilt nun
P
nach dem Minorantenkriterium kann ∞
n=1 |an | nicht konvergieren.
Wir wollen noch anmerken, dass man die Konvergenz von
( n1α )n∈N
α
k,
und
❑
für α ∈ N, n ≥ 2, mit dem Kriterium von Raabe
und der Bernouillsche Ungleichung zeigen kann.
3.9 Umordnungen von Reihen und Doppelreihen
Wir haben in Fakta 3.7.4 gesehen, dass die Konvergenz einer Reihe nicht verloren
geht, und der Grenzwert unverändert bleibt, wenn man beliebig Klammern setzt. Es
ist aber wesentlich, dass man die Summationsreihenfolge beibehält. Denn wie man am
P
folgenden Beispiel sieht, kann man für manche Reihen ∞
n=1 xn eine Bijektion σ : N →
P∞
P∞
N finden, sodass n=1 xσ(n) , n=1 xn . Diese neue Reihe heißt Umordnung der Reihe
P∞
n=1 xn .
PN
Das ist ein wesentlicher Unterschied zu endlichen Summen. Denn ist k=1
ak eine
endliche Summe, so können wir die Summanden beliebig umordnen ohne, dass sich
die Summe verändert. Anders ausgedrückt: Ist σ eine Permutation von {1, . . . , N}, d.h.
PN
PN
eine Bijektion von {1, . . . , N} auf sich, dann gilt k=1
ak = k=1
aσ(k) .
3.9.1 Beispiel. Betrachte die alternierende harmonische Reihe
S =1−
1 1 1 1 1
+ − + − + ....
2 3 4 5 6
Ordnen wir die Summanden in einer anderen Reihenfolge an 16 , z.B. als
1
1
1 1 1 1 1 1
1
1
1
− + −
− +... =
1− − + − − + −
2
4
3
6
8
5
10
12
7
14
16
|{z}
| {z }
| {z }
| {z }
= 12
=
= 16
1
= 10
1
= 14
1 1 1 1
1 1 1 1 1
1
1
1
1
1
− + − +
−
+
−
+... = 1− + − + − +... ,
2 4 6 8 10 12 14 16
2
2 3 4 5 6
so erhalten wir genau S2 . Die Summe einer Reihe kann also von der Reihenfolge der
Summanden abhängen. Tatsächlich kann man eine konvergente aber nicht absolut konvergente Reihe stets so umordnen, dass jede beliebige Summe einschließlich ±∞, oder
gar eine divergente Reihe, herauskommt, vgl. Satz 3.9.4.
Eine der herausragenden Eigenschaften von absolut konvergenten Reihen ist die,
dass bei Ihnen ein solches Verhalten nicht auftreten kann. Also hängt die Summe nicht
von der Ordnung der natürlichen Zahlen ab. Um das einzusehen, führen wir im folgenden Lemma eine neue Art von Grenzwertbegriff ein.
16 Die entsprechende Bijektion σ : N → N ist für k ∈ N durch σ(3k−2) = 2k−1, σ(3k−1) = 4k−2, σ(3k) =
4k bestimmt.
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
83
P
3.9.2 Lemma. Sei ∞
k=1 ak eine Reihe reeller oder komplexer Zahlen. Dann sind folgende Aussagen äquivalent:
(i) Die Reihe ist absolut konvergent.
P
(ii) Es gibt ein C > 0, sodass j∈M |a j | ≤ C für alle endlichen Teilmengen M von N.
P
(iii) Es gibt ein C > 0, sodass | j∈M a j | ≤ C für alle endlichen Teilmengen M von N.
(iv) Es gibt ein s ∈ R, sodass
X
∀ǫ > 0 ∃M0 ⊆ N, M0 endlich : a j − s < ǫ,
(3.15)
j∈M
für alle endlichen M, M0 ⊆ M ⊆ N.
Sind diese Bedingungen erfüllt, so ist die Zahl s aus (iv) genau die Summe der Reihe
P∞
k=1 ak .
Beweis. Ehe wir die Äquivalenzen zeigen, sei darauf hingewiesen, dass die Zahl s
in (iv) eindeutig
ist. Würde nämlich (iv) für s und ein s′ , s gelten, dann folgt mit
|s−s′ |
ǫ := 3 und M = M0 ∪ M0′ der Widerspruch (vgl. Satz 3.2.9)
X
X
|s − s′ | ≤ a j − s + a j − s′ < 2ǫ < |s − s′ |.
j∈M
j∈M
P
P
(i) ⇔ (ii): Für endliche Teilmengen M ⊆ N gilt klarerweise j∈M |a j | ≤ max(M)
|a j |.
j=1
Somit ist (ii) äquivalent zur Beschränktheit der Folge der Partialsummen der
P
Reihe ∞j=1 |a j |. Die Äquivalenz zu (i) folgt nun aus Satz 3.7.8, (i).
(i) ⇒ (iv): Sei ǫ > 0 gegeben. Wegen der absoluten Konvergenz gibt es ein N ∈ N,
sodass für n > m ≥ N
n
X
| ak |< ǫ.
k=m+1
Setze M0 = {1, . . . , N}. Ist M eine endliche Teilmenge von N, die M0 enthält, so
sind alle j ∈ M \ M0 größer als N. Also gilt für beliebiges m > N
max(M)
m
m
m
X
X
X
X
X
X
a j −
|a j | +
a j ≤
|a j | < 2ǫ.
a j = a j −
j=N+1
j∈M
j=N+1 j=N+1
j=1
j∈M
j>N
P
Strebt nun m gegen ∞, so folgt (siehe Lemma 3.3.1) | j∈M a j − s| ≤ 2ǫ. Da ǫ > 0
beliebig war folgt (3.15).
(iv) ⇒ (iii): Sei ǫ > 0 fest und M0 wie in (3.15). Für ein beliebiges endliches M ⊆ N
folgt aus (3.15) wegen (M0 \ M) ∪ M = M0 ∪ M ⊇ M0
X X
X
X
a j = a j +
aj − s + s −
a j ≤
j∈M j∈M
j∈M0 \M
j∈M0 \M X
X
X
a j − s + |s| +
|a j |.
|a j | ≤ ǫ + |s| +
j∈M0 ∪M
j∈M0
j∈M0 \M
KAPITEL 3. DER GRENZWERT
84
P
P
(iii) ⇒ (ii): Da |a j | ≤ | Re a j | + | Im a j |, genügt es, j∈M | Re a j |, j∈M | Im a j | ≤ 2C
nachzuweisen. Dazu setzt man M1 = {n ∈ M : Re an ≥ 0} und M2 = {n ∈ M :
Re an < 0}. Es folgt




X
X
X
 X 
 X 



Re an = Re 
Re an −
| Re an | =
an  − Re 
an  ≤
n∈M
n∈M2
n∈M1
n∈M1
n∈M2
X X an ≤ 2C.
an + n∈M1 n∈M2 P
Entsprechend schließt man für n∈M | Im an |.
❑
P
3.9.3 Satz. Die Reihe ∞
k=1 bk mit reellenPoder komplexen Summanden sei absolut konvergent. Dann ist auch jede Umordnung ∞
k=1 bσ(k) absolut konvergent und hat die gleiche Summe s.
P
Beweis. Wir wenden Lemma 3.9.2, (iv), auf s := ∞
k=1 bk an. Also gilt (3.15) mit
a j = b j . Diese Bedingung ist aber invariant unter jeder Bijektion σ : N → N. In
der Tat, ist ǫ > 0 und M0 so, dass (3.15) gilt, und ist σ−1 (M0 ) ⊆ M, so folgt wegen
M0 ⊆ σ(M)
X
X
X
bσ( j) − s = bσ( j) − s = bk − s < ǫ.
j∈M
σ( j)∈σ(M)
k∈σ(M)
Also gilt (3.15) auch mit a j = bσ( j) . Nach Lemma 3.9.2 konvergiert auch die umgeordP
nete Reihe ∞
n=1 bσ(n) gegen s.
❑
Der Grenzwertbegriff, dem wir in (3.15) begegnet sind, und die Konvergenz von
Folgen sind Spezialfälle eines allgemeineren Konzeptes, das wir am Ende von Kapitel
5 diskutieren werden.
Nun wollen wir Satz 3.9.3 umkehren.
3.9.4 Satz. Sei die Reihe
∞
P
ak reeller Zahlen konvergent mit der Summe S , aber nicht
k=1
absolut konvergent. Dann gibt es zu jeder vorgegebenen Zahl S ′ ∈ R ∪ {±∞} eine
∞
∞
P
P
Umordnung (bk )k∈N , bk = aσ(k) , mit
bk = S ′ . Weiters gibt es Umordnungen bk die
k=1
k=1
divergieren (aber nicht bestimmt divergieren).
Beweis. Bezeichne mit a+k := max(ak , 0), a−k := min(ak , 0), d.h. die Folgen der positiven
bzw. negativen Terme ak . Wir überlegen zuerst, dass
∞
X
k=1
a+k = +∞,
∞
X
k=1
a−k = −∞
(3.16)
gelten muss. Zunächst sind die Partialsummen dieser Reihen monotone Folgen, haben
also einen Grenzwert in R ∪ {±∞}. Angenommen einer der beiden wäre endlich, z.B.
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
∞
P
k=1
85
a+k = S + < ∞. Dann folgt
N
X
a−k =
k=1
und somit
N
X
k=1
N
X
k=1
| ak |=
ak −
N
X
k=1
N
X
k=1
a+k
N→∞
a+k −→ S − := S − S + > −∞.
−
N
X
k=1
N→∞
a−k −→ S + − S − < ∞,
∞
P
ak nicht absolut konvergiert.
P
′
Sei nun S ∈ R gegeben. Wir konstruieren eine Umordnung ∞
k=1 bk , die gegen S
+ + +
+
konvergiert. Zuerst addiert man Summanden a1 , a2 , a3 , . . . , an1 , bis man das erste Mal
> S ′ ist, dann Summanden a−1 , a−2 , . . . , a−l1 bis die Gesamtsumme das erste mal wieder
< S ′ ist. Dann a+n1 +1 , a+n1 +2 , . . . , a+n2 bis man das erste Mal wieder > S ′ ist. So verfährt
man weiter. Wegen (3.16) ist das stets möglich.
∞
P
ak . Ist S n′ eine Partialsumme,
Man erhält in dieser Weise eine Umordnung von
im Widerspruch zur Voraussetzung, dass
k=1
′
k=1
so ist S n′ − S ′ beschränkt nach oben durch das letzte aufgetretene a+k und nach unten
durch das letzte aufgetretene a−k . Wegen lim ak = 0 gilt auch
k→∞
lim (S n′ − S ′ ) = 0.
n→∞
In analoger Weise verfährt man, wenn man eine Umordnung konstruieren möchte, die
bestimmt divergiert gegen +∞ oder −∞, oder nicht einmal bestimmt divergiert.
❑
3.9.5 Bemerkung. Obiger Beweis verwendet bei der Definition der Umordnung implizit den Rekursionssatz. Die Tatsache, dass die dadurch definierte Funktion bijektiv auf
N ist und dass sie das gewünschte leistet, bedarf eigentlich eines strengeren Beweises.
Für den interessierten Leser bringen wir anschließend einen wasserdichten Beweis.
Wir zeigen wie oben, dass (3.16) zutrifft. Nun sei
M1 := {n ∈ N : an ≥ 0}, M2 := {n ∈ N : an < 0}.
˙ 2 . Wäre M1 endlich, so hätten wir a+n = 0 für n > max(M1 ), was aber (3.16)
Offensichtlicherweise gilt N = M1 ∪M
widerspricht. Also ist M1 und mit einer ganz ähnlichen Argumentation auch M2 unendlich.
Nun sei Fn die Menge aller Funktionen f : {1, . . . , n} → N, die folgende beiden Bedingungen erfüllen:
(i) 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M1 ⇒ f (i) < f ( j) und 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M2 ⇒ f (i) < f ( j).
(ii) f (i) ∈ M1 ⇒ {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) und f (i) ∈ M2 ⇒ {1, . . . , f (i)} ∩ M2 ⊆ f ({1, . . . , i}).
Fn ist nicht leer, da - wie man sich leicht überzeugt - die Funktion f (1) = min(M1 ), f (2) = min(M1 \ { f (1)}), . . . , f (n) =
min(M1 \ { f (1), .S. . , f (n − 1)}) in dieser Menge liegt.
n∈N Fn (⊆ N × N) und definiere g : F → F folgendermaßen: Sei f ∈ F , also f ∈ Fn für ein n ∈ N. Falls
Pn Setze F =
′
j=1 a f ( j) < S , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass
g( f )(n + 1) = min(M1 \ f ({1, . . . , n})).
Diese Fortsetzung liegt tatsächlich in Fn+1 ⊆ F . Um das zu sehen, sei 1 ≤ i < j ≤ n + 1, sodass beide Zahlen g( f )(i), g( f )( j)
gleichzeitig entweder in M1 oder in M2 liegen. Ist j ≤ n, dann folgt f (i) = g( f )(i), f ( j) = g( f )( j) ∈ M1 (M2 ) und daher
g( f )(i) = f (i) < f ( j) = g( f )( j).
Falls j = n+1, dann ist g( f )(n+1) = min(M1 \ f ({1, . . . , n})) ∈ M1 . Wegen i ∈ {1, . . . , n} muss auch g( f )(i) = f (i) ∈ M1 .
Falls g( f )(n + 1) ≤ f (i), so wäre nach (ii), g( f )(n + 1) = f (k) für ein k ≤ i ≤ n, und damit g( f )(n + 1) = f (k) <
M1 \ f ({1, . . . , n}), was aber nicht sein kann. Also gilt g( f )(n + 1) > f (i) und g( f ) erfüllt (i).
KAPITEL 3. DER GRENZWERT
86
Um (ii) zu zeigen, sei g( f )(i) ∈ M1 (M2 ) für ein i ∈ {1, . . . , n + 1}. Falls i ≤ n, so folgt
{1, . . . , g( f )(i)} ∩ M1 = {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) = g( f )({1, . . . , i}).
Dasselbe gilt für M2 . Sei nun i = n + 1. Dann ist g( f )(n + 1) ∈ M1 . Ist k ∈ M1 mit k < g( f )(n + 1), so muss k in f ({1, . . . , n})
sein, da wir sonst P
den Widerspruch g( f )(n + 1) = min(M1 \ f ({1, . . . , n})) ≤ k bekämen.
Ist dagegen nj=1 a f ( j) ≥ S ′ , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass g( f )(n + 1) = min(M2 \
f ({1, . . . , n})). Man zeigt genauso wie oben, dass auch in diesem Fall g( f ) ∈ Fn+1 ⊆ F .
Ist nun noch a ∈ F1 definiert durch a(1) = 1, so gibt es nach dem Rekursionssatz (Satz 2.3.3) eine Abbildung
φ : N → F , sodass φ(1) = a und φ(n + 1) = g(φ(n)). Wir setzen
[
φ(n).
σ=
n∈N
Durch vollständige Induktion zeigt man leicht, dass φ(n) ∈ Fn und dass φ(m) eine Fortsetzung von φ(n) für alle m, n ∈
N, m > n ist. Man sieht daher sofort, dass σ : N → N eine Funktion ist, wobei σ|{1,...,n} = φ(n).
Weiters ist σ injektiv, da für i < j ∈ N, unter der zusätzlichen Voraussetzung σ(i), σ( j) ∈ M1 (M2 ) nach (i) die Relation
σ(i) = φ(N)(i) < φ(N)( j) = σ( j) mit irgendeinem N ≥ i, j folgt. Ist σ(i) ∈ M1 ∧ σ( j) ∈ M2 bzw. σ(i) ∈ M2 ∧ σ( j) ∈ M1 , so
muss auch σ(i) , σ( j), da M1 ∩ M2 = ∅.
σ ist sogar surjektiv. Dazu sei k ∈ N. Wir nehmen an, dass k ∈ M1 . Wäre k < σ(N), so folgt aus σ( j) ∈ M1 wegen
σ( j) = φ( j)( j) und (ii), dass σ( j) < k. Also gilt {k, k + 1, . . . } ∩ σ(N) ⊆ M2 . Da σ injectiv ist, muss dieser Schnitt unendlich
viele Zahlen enthalten. Wegen (ii) ist mit m ∈ σ(N), m > k, auch {k, k + 1, . . . , m} ⊆ σ(N), und somit
{k, k + 1, . . . } = {k, k + 1, . . . } ∩ σ(N) ⊆ M2 .
Somit hätten wir den Widerspruch, dass M1 endlich ist. Entsprechend führt auch k ∈ M2 und k < σ(N) auf einen Widerspruch.
P
′
Nun gilt es noch zu zeigen, dass ∞
j=1 aσ( j) = S . Dazu sei ǫ > 0, und wähle k1 ∈ M1 (k2P∈ M2 ) so, dass |ak | < ǫ
für alle k ≥ k1 (k ≥ k2 ). Das ist möglich, da die Folge der Summanden der konvergenten Reihe ∞
j=1 a j ja eine Nullfolge
bildet. Sei N die kleinste Zahl in N, sodass σ(N) > k1 , σ(N) > k2 und sodass σ(N) ∈ M1 ∧ σ(N + 1) ∈ M2 oder σ(N) ∈
M2 ∧ σ(N + 1) ∈ M1 .
Für ein k ≥ N+1 sei m ∈ {N, . . . , k−1} die größte Zahl mit σ(m) ∈ M1 ∧σ(m+1) ∈ M2 oder σ(m) ∈ M2 ∧σ(m+1) ∈ M1 .
Im ersten Fall muss dann σ(m + 1), . . . , σ(k) ∈ M2 und im zweiten σ(m + 1), . . . , σ(k) ∈ M1 . Wegen g(σ|{1,...,l} ) = σ|{1,...,l+1}
muss im ersten Fall
m−1
m
k−1
m−1
X
X
X
X
aσ( j) + aσ(m) .
aσ( j) =
aσ( j) ≤
aσ( j) < S ′ ≤
m−1
X
j=1
j=1
j=1
und im zweiten
aσ( j) + aσ(m) =
m
X
j=1
j=1
In jedem Fall gilt
aσ( j) ≤
k−1
X
j=1
j=1
aσ( j) < S ′ ≤
m−1
X
aσ( j) .
j=1
k
X
aσ( j) − S ′ ≤ |aσ (k)| + |aσ(m) | < 2ǫ.
j=1
3.9.6 Bemerkung. Für komplexwertige Reihen gilt Satz 3.9.4 nicht.
Als nächstes wollen wir uns mit dem Distributivgesetz befassen. Für zwei endliche
Summen gilt ja
 n   m 
n,m
X
X  X 
 ai  ·  b j  =
ai b j .


i=1
Möchte man das Produkt
∞
P
i=1
!
ai ·
j=1
∞
P
b j von zwei Reihen ausrechnen, so muss man
j=1
also alle Einzelprodukte aufsummieren:
a1 b1
+
a2 b1
+
a3 b1
+
..
.
+
+
+
i=1, j=1
!
a1 b2
+
a2 b2
+
a3 b2
+
..
.
+
+
+
a1 b3
+
a2 b3
+
a3 b3
+
..
.
+ ...
+ ...
+ ...
(3.17)
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
87
Wie wir gesehen haben, ist es nicht unwesentlich, in welcher Reihenfolge man das
tut.
Die Problematik (3.17) aufzusummieren führt zu so genannten Doppelreihe. Es gilt
also gegebene Zahlen ai j , i, j ∈ N,
a11
a21
a31
..
.
a12
a22
a32
..
.
a13
a23
a33
..
.
...
...
...
..
.
in einer vernünftigen Art und Weise aufzusummieren. Eine Möglichkeit, das zu tun,
P
wären zuerst die Zeilen aufzusummieren, si = ∞j=1 ai j , und dann die Spalten:
∞

∞ X
X


 ai j  ;
S1 =
i=1
eine andere, zuerst die Spalten, v j =
P∞
i=1
S2 =
j=1
ai j , und dann die Zeilen



 ai j  .
∞ 
∞
X
X
j=1
Mann könnte auch längs der Diagonalen
i=1


∞ X
X



S3 =
ai j  ,
(3.18)
k=2 i+ j=k
oder überhaupt auf irgend eine andere Weise aufsummieren. Dass dabei aber viel
schiefgehen kann, zeigt das folgende Beispiel.
3.9.7 Beispiel. Betrachte man
1
+
0
+
0
+
0
+
..
.
−
+
+
+
1
+
1
+
0
+
0
+
..
.
+
−
+
+
0
+
1
+
1
+
0
+
..
.
+
+
−
+
0
+
0
+
1
+
1
+
..
.
+
... =
0
+
... =
0
+
... =
0
−
... =
0
..
.
=
1\0
=
=
=
=
1 + 0 + 0 + 0 + ... =
P∞ P∞
P P∞
d.h. ∞
j=1
i=1 ai j = 1. Summiert man längs der Diagonalen, so
i=1
j=1 ai j = 0,
erhält man
1 − 1 + 1 − 1 + 1 − 1 ± ...,
diese Summe ist also nicht einmal konvergent.
P
3.9.8 Definition. Eine Reihe ∞
k=1 bk heißt eine lineare Anordnung der Doppelreihe
P∞
17
i, j=1 ai j , falls bk = aτ(k) mit einer Bijektion τ : N → N × N .
17 Bekanntlich sind N und N × N gleich mächtig, was bedeutet, dass es solche linearen Anordnungen
tatsächlich gibt.
KAPITEL 3. DER GRENZWERT
88
3.9.9 Bemerkung. Von den drei oben genannten Summationsmethoden entspricht nur
die Summation längs der Diagonalen eine lineare Anordnung. Die dazugehörige Bijektion kann man folgendermaßen veranschaulichen:
i= 1
2
3
4
..
.
j=
1
•τ(1)
•τ(3)
•τ(6)
•τ(10)
..
.
2
•τ(2)
•τ(5)
•τ(9)
·
..
.
3
•τ(4)
•τ(8)
·
·
..
.
4
•τ(7)
·
·
·
..
.
···
···
···
···
···
Die Summe aus (3.18) ist dann nichts anderes als
 k(k+1)


∞ 
2
 X
X


a
 ,
τ(l) 


k(k−1)
k=1
l=
P∞
und stimmt wegen Fakta 3.7.4, 2, mit
2
l=1
+1
aτ(l) überein.
Um τ wasserdicht zu definieren, sei ψ : N × N → N × N mit ψ(i, j) = (i + j, i). Man sieht sofort, dass ψ injektiv ist.
Außerdem ist i + 1 ≤ i + j. Also liegt ψ(i, j) in D := {(d, p) ∈ N × N : p + 1 ≤ d}. Ist andererseits (d, p) in dieser Menge, so
ist ψ(p, d − p) = (d, p). Also ist ψ : N × N → D bijektiv.
+ p. Sei (d1 , p1 ) , (d2 , p2 ), wobei oBdA. d1 ≤ d2 . Ist d1 < d2 ,
Nun sei φ : D → N definiert durch φ(d, p) = (d−1)(d−2)
2
so gilt wegen p1 ≤ d1 − 1
(d1 − 1)(d1 − 2)
(d1 − 1)(d1 − 2)
d1 (d1 − 1)
(d2 − 1)(d2 − 2)
(d2 − 1)(d2 − 2)
+ p1 ≤
+ d1 − 1 =
≤
<
+ p2 ,
2
2
2
2
2
und somit φ(d1 , p1 ) , φ(d2 , p2 ). Ist d1 = d2 , so muss p1 , p2 und somit auch φ(d1 , p1 ) , φ(d2 , p2 ). Also ist φ injektiv. Sei
. Setzen wir p = n − (d−1)(d−2)
, so muss 1 ≤ p ≤ d − 1, da
umgekehrt n ∈ N und d ∈ N, d ≥ 2 maximal, sodass n > (d−1)(d−2)
2
2
im Falle p > d − 1
(d − 1)(d − 2)
d(d − 1)
(d − 1)(d − 2)
>d−1+
=
n= p+
2
2
2
folgen würde. Das widerspricht aber der Maximalität von d. Also ist φ : D → N bijektiv. Nun sei τ die Inverse von
φ ◦ ψ : N × N → N. Also ist τ : N → N × N bijektiv, wobei
τ−1 (i, j) =
(i + j − 1)(i + j − 2)
+ i.
2
3.9.10 Satz.
P
(i) Sei die Doppelreihe ∞
i,P
j=1 ai j reeller oder komplexer Zahlen gegeben. Ist eine
lineare Anordnung von ∞
i, j=1 ai j absolut konvergent, so auch alle anderen, und
alle haben die selbe Summe S .
(ii) Die absolute Konvergenz ist genau dann der Fall, wenn für ein C > 0 und allen
n∈N
n X
n
X
| ai j |≤ C
(3.19)
i=1 j=1
(iii) Die absolute Konvergenz
ist genau
dann der Fall, wenn sowohl
P P
j ∈ N also auch ∞j=1 ∞
|a
|
i=1 i j konvergiert. Dabei gilt

∞ 
∞
X
X

 ai j 
S =
j=1
i=1
P∞
i=1
|ai j | für alle
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
(iv) Die absolute Konvergenz ist genau dann der Fall, wenn sowohl
P P∞
i ∈ N also auch ∞
i=1
j=1 |ai j | konvergiert. Dabei gilt

∞
∞ X
X


 ai j 
S =
i=1
89
P∞
j=1
|ai j | für alle
j=1
Beweis.
(i) Da für zwei lineare Anordnungen τ1 , τ2 die Funktion τ−1
2 ◦ τ1 eine Bijektion auf
N ist, sind zwei lineare Anordnungen Umordnungen voneinander, und die erste
Behauptung folgt aus Satz 3.9.3.
(ii) Da jede endliche M ⊆ N × N für hinreichend großes n ∈ N in einem Quadrat
{1, . . . , n} × {1, . . . , n} enthalten ist, ist die Bedingung (3.19) äquivalent zu:
X
| ai j |≤ C
(3.20)
(i, j)∈M
für alle endlichen Teilmengen M ⊆ N × N.
Ist nun τ : N → N × N eine lineare Anordnung, so ist letztere Bedingung äquivalent zur Bedingung aus Lemma 3.9.2, (ii), wobei an = aτ(n) . Aus Lemma 3.9.2
P
folgt, dass (3.19) äquivalent zur absoluten Konvergenz von ∞
n=1 an ist.
P
Pn
P∞ P∞
(iii) Ist C := j=1 i=1 |ai j | < +∞ und n ∈ N, so folgt wegen i=1 |ai j | ≤ ∞
i=1 |ai j |
sicherlich (siehe Lemma 3.3.1)


n
∞ 
n
n 
X

X
 X
X
 |ai j | ≤ C.
 |ai j | ≤
j=1
i=1
j=1
i=1
Somit gilt (3.19).
Nehmen wir umgekehrt (3.19) an, so haben wir schon gesehen, dass dann (3.20)
gilt. Setzen wir speziell M = {1, . . . , k} × { j}, so folgt
k
X
i=1
Also sind alle Reihen
P∞
i=1
| ai j |≤ C, k ∈ N.
ai j absolut konvergent.
Aus der absoluten Konvergenz folgt wegen Lemma 3.9.2 die Bedingung (3.15).
Überträgt man nun diese mit einer lineare Anordnung τ : N → N × N auf unsere
Doppelreihe, so ist (3.15) äquivalent zu
X
∀ǫ > 0 ∃M0 ⊆ N × N, M0 endlich : a(i, j) − S < ǫ,
(i, j)∈M
für alle endlichen M, M0 ⊆ M ⊆ N × N.
Wie oben schon bemerkt, findet man zu einem endlichen M0 ⊆ N × N ein n0 ∈ N,
sodass M0 ⊆ {1, . . . , n0 } × {1, . . . , n0 }. Ist m ≥ n ≥ n0 , so ist sicher auch M0 ⊆
{1, . . . , m} × {1, . . . , n} =: Qm , und es gilt daher
n X
m
X
X
a(i, j) − S = a(i, j) − S < ǫ.
j=1 i=1
(i, j)∈Qm
KAPITEL 3. DER GRENZWERT
90
Lässt man nun bei festgehaltenem n die Zahl m gegen unendlich streben, so folgt
mit Lemma 3.3.1


n X
∞
X

 ai j  − S ≤ ǫ.


j=1
i=1
Somit haben wir aber gezeigt, dass
∞

n X
X


lim
 ai j  = S .
n→∞
j=1
i=1
Wendet man diese Argumentation
auf |a(i, j) | anstatt a(i, j) an, so folgt auch die
P∞ P∞
Konvergenz von j=1 i=1 |ai j | .
(iv) Man argumentiert wie im letzten Punkt.
❑
3.9.11 Bemerkung. Aus (iii) und (iv) von Satz 3.9.10 folgt insbesondere:
lim lim
u→∞ v→∞
u X
v
X
ai j = lim lim
v→∞ u→∞
i=1 j=1
u X
v
X
ai j .
i=1 j=1
P
P∞
3.9.12 Korollar. Seien die beiden Reihen ∞
i=1 ai und
j=1 b j absolut konvergent, und
sei
∞  ∞ 
X  X 
S =  ai  ·  b j  .
i=1
j=1
P
Dann ist jede lineare Anordnung der Doppelreihe ∞
i, j=1 ai b j absolut konvergent und
alle haben die Summe S . Weiters gilt
m−1

∞

∞

∞ X
∞ X
∞ X
X
 X
 X






 ai bm−i  =
 ai b j  =
S =
 ai b j  ,
m=2
i=1
i=1
j=1
j=1
i=1
wobei alle auftretenden Reihen absolut konvergieren.
P
P∞
Beweis. Sei ∞
j=1 |b j | = D, dann folgt
i=1 |ai | = C,
n X
m
X
i=1 j=1
|ai b j | =
n
X
i=1
m
X
|ai | ·
|b j | ≤ C · D ,
j=1
also sind nach Satz 3.9.10 alle linearen Anordnungen sowie die iterierten Reihen absolut konvergent und haben die gleiche Summe S ′ .
Diese kann man auch berechnen als
S ′ = lim lim
n→∞ m→∞
lim
n→∞
n X
m
X
ai b j = lim lim
n→∞ m→∞
i=1 j=1
m
n
i
X
h X
bj =
ai ·
i=1
j=1
∞
∞
∞
n
X
i X
X
h X
bj = S .
ai ·
bj =
ai ·
i=1
j=1
i=1
j=1
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
91
Ist schließlich τ : N → N × N die spezielle Bijektion aus Bemerkung 3.9.9, so folgt
wegen Fakta 3.7.4, 2, mit αi j = ai b j
S′ =
∞
X
l=1
da für l =
k(k−1)
2
ατ(l)
 k(k+1)
∞ 
2
 X
X

=

k=1 l= k(k−1) +1
2

m−1

 X
∞ X



 ai bm−i  ,
ατ(l)  =
 m=2 i=1
+ 1, . . . , k(k+1)
und τ(l) = (i, j) gerade i + j = k + 1.
2
❑
3.9.13 Beispiel. Definiere eine Funktion exp : C → C durch
exp(z) :=
∞
X
zn
, z ∈ C.
n!
n=0
Zunächst müssen wir diese Definition rechtfertigen, also zeigen, dass diese Reihe konvergiert. Für jedes feste z ∈ C gilt
n+1 z
(n+1)!
z
= 0.
lim zn = lim
n→∞ (n + 1)
n→∞ n!
P zn
Nach dem Quotientenkriterium ist die Reihe ∞
n=0 n! für jedes feste z ∈ C absolut
konvergent.
Wir wollen für zwei Zahlen z, w ∈ C das Produkt exp(z) exp(w) ausrechnen. Dazu verwenden wir Summation längs der Diagonalen. Wir erhalten aus Korollar 3.9.12
(unter Beachtung einer Indexverschiebung)
exp(z) · exp(w) =
∞ X
k
X
k=0
j=0
zk− j w j .
(k − j)! j!
Nach dem Binomischen Lehrsatz gilt
k
X
j=0
zk− j w j
1
= (z + w)k ,
(k − j)! j!
k!
und wir erhalten
∞
X
1
(z + w)k = exp(z + w) .
exp(z) exp(w) =
k!
k=0
Die Funktion exp heißt auch die Eulersche18 Exponentialfunktion. Sie ist eine der wichtigsten Funktionen, die es in der Mathematik gibt. Wir werden sie zum Beispiel auch
dafür benützen um Funktionen wie sin z oder cos z zu definieren, vgl. den Abschnitt
über elementare Funktionen.
3.9.14 Bemerkung. In analoger Weise kann man dreifach, vierfach, usw. Summen betrachten. Mit der entsprechend angepassten Definition von linearer Anordnung gelten
dabei ganz ähnliche Aussagen wie für Doppelsummen.
18 Leonhard
Euler. 15.4.1707 Basel - 18.9.1783 St.Petersburg
92
KAPITEL 3. DER GRENZWERT
Kapitel 4
Die Konstruktion der reellen
Zahlen
Wir wollen in diesem Kapitel die am Anfang verschobene Konstruktion der reellen
Zahlen nachholen und zeigen, dass diese eindeutig dadurch charakterisiert sind, dass R
ein vollständig angeordneter Körper ist.
Wir wollen uns als erstes mit einer Bemerkung beschäftigen, die uns zeigt, dass
die reellen Zahlen im Sinne der Theorie metrischer Räume ganz natürlich aus den
rationalen Zahlen entstehen. Dafür noch eine Definition:
4.1.1 Definition.
(i) Seien hY, dY i und hX, dX i metrische Räume. Eine Abbildung φ : Y → X heißt
isometrisch, wenn
dX (φ(a), φ(b)) = dY (a, b), a, b ∈ Y .
(ii) Seien hY, dY i und hX, dX i metrische Räume. Dann sagen wir hY, dY i ist isometrisch
in hX, dX i enthalten, wenn Y ⊆ X und
dY (a, b) = dX (a, b), a, b ∈ Y .
(iii) Sei hX, di ein metrischer Raum und sei Y ⊆ X. Dann heißt Y dicht in hX, di,
wenn es zu jedem Punkt x ∈ X eine Folge (yn )n∈N von Punkten aus Y gibt, mit
limn→∞ yn = x bezüglich der Metrik d.
4.1.2 Bemerkung. Hat man die reellen Zahlen als vollständig angeordneten Körper zur
Verfügung (was ja noch nicht der Fall ist), so wissen wir von Beispiel 3.2.6, dass Q
eine dichte Teilmenge von R (bezüglich der euklidischen Metrik) ist.
Wir sehen, dass die reellen Zahlen versehen mit der euklidischen Metrik ein
vollständiger metrischer Raum sind, der hQ, di (d(x, y) = |x − y|) isometrisch und dicht
enthält.
Es ist also jede reelle Zahl der Grenzwert einer Cauchy-Folge rationaler Zahlen.
Umgekehrt ist, wegen dem Cauchyschen Konvergenzkriterium, jede Cauchy-Folge rationaler Zahlen konvergent gegen eine gewisse reelle Zahl.
Da Metriken Werte in R haben, benötigt man die reellen Zahlen, um von CauchyFolgen sprechen zu können. Wenn wir aber den Begriff des metrischen Raumes hX, di
93
94
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
leicht dadurch verändern, dass wir annehmen, dass d nur Werte in Q hat, so kann man
dem Begriff der Cauchy-Folge auch Sinn geben, wenn man nur Q zur Verfügung hat.
Ein solcher metrischer Raum ist klarerweise hQ, di, wobei d(x, y) = |x − y|, siehe dazu
Bemerkung 3.1.2.
Eine Folge (xn )n∈N in einem solchen Raum X heißt dann konvergent gegen x ∈ X,
wenn
∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N ,
und sie heißt Cauchy-Folge, wenn
∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle m, n ≥ N .
Wir werden nun einen vollständig angeordneten Körper konstruieren, der aus rationalen Cauchy-Folgen besteht, wobei wir klarerweise Cauchy-Folgen, die sich nur um
eine Nullfolge unterscheiden, als gleich anzusehen haben.
(i) Sei X die Menge aller rationalen Cauchy-Folgen, und sei ∼⊆ X × X die Relation
(rn )n∈N ∼ (sn )n∈N : ⇐⇒ lim (rn − sn ) = 0.
n→∞
Diese Relation ist eine Äquivalenzrelation: Dabei ist Reflexivität und Symmetrie
klar, um die Transitivität nachzuweisen, seien (rn )n∈N ∼ (sn )n∈N und (sn )n∈N ∼
(tn )n∈N gegeben. Es ist limn→∞ (rn − sn ) = limn→∞ (sn − tn ) = 0, und somit gilt für
die Summe dieser Folgen limn→∞ (rn − tn ) = 0. Also ist (rn )n∈N ∼ (tn )n∈N .
Es sei bemerkt, dass wir die Rechenregeln für Folgen in Q-wertigen metrischen
Räumen nicht hergeleitet haben, obwohl wir sie hier und im Folgenden des öfteren verwenden. Das zu tun ist aber nur eine Abschreibübung für die Ergebnisse
aus Proposition 3.2.15, Lemma 3.3.1 und Satz 3.3.4 indem wir immer dann, wenn
von R als Bildmenge der Metrik die Rede ist, diese durch Q ersetzen.
(ii) Unser Ziel soll sein, X/∼ zu einem vollständig angeordneten Körper zu machen.
Dazu brauchen wir Operationen, die wir zunächst auf X definieren:
(rn )n∈N + (sn )n∈N := (rn + sn )n∈N ,
−(rn )n∈N := (−rn )n∈N ,
(rn )n∈N · (sn )n∈N := (rn · sn )n∈N .
Mit (rn )n∈N , (sn )n∈N sind auch (rn )n∈N + (sn )n∈N , −(rn )n∈N und (rn )n∈N · (sn )n∈N
Cauchy-Folgen. Um das z.B. für die Multiplikation zu zeigen, sei C ∈ Q, C > 0,
sodass |rn |, |sn | ≤ C, n ∈ N (siehe Proposition 3.4.5), und rechne
|rn sn − rm sm | ≤ |rn sn − rn sm | + |rn sm − rm sm | ≤ C|sn − sm | + C|rn − rm |.
Dieser Ausdruck ist kleiner als ǫ, wenn man N so groß wählt, dass
ǫ
|sn − sm |, |rn − rm | < 2C
für m, n ≥ N.
(iii) Da die Verknüpfungen + und · gliedweise definiert sind, folgt aus den Rechenregeln auf Q, dass für + und · das Kommutativgesetz, das Assoziativgesetz und das
Distributivgesetz gelten. Klarerweise gilt auch
(rn )n∈N + (0)n∈N = (rn )n∈N , − (rn )n∈N + (rn )n∈N = (0)n∈N ,
(rn )n∈N · (1)n∈N = (rn )n∈N .
Wir können aber X nicht zu einem Körper machen, denn ist (rn )n∈N , (0)n∈N , so
können wir noch lange nicht ein multiplikativ Inverses dazu finden.
95
(iv) Die Äquivalenzrelation ∼ lässt sich nun mit Hilfe obiger Verknüpfungen charakterisieren:
(rn )n∈N ∼ (sn )n∈N ⇔ (rn )n∈N + (−(sn )n∈N ) ist Nullfolge,
und
(rn )n∈N ist Nullfolge ⇔ (rn )n∈N ∼ (0)n∈N .
Daraus sieht man leicht, dass obige Verknüpfungen mit den Operationen verträglich sind: Sind (rn )n∈N ∼ (rn′ )n∈N und (sn )n∈N ∼ (s′n )n∈N , so folgt
(rn )n∈N + (sn )n∈N ∼ (rn′ )n∈N + (s′n )n∈N , −(rn )n∈N ∼ −(rn′ )n∈N sowie (rn )n∈N · (sn )n∈N ∼
(rn′ )n∈N · (s′n )n∈N . Letztere Relation folgt etwa aus
(rn )n∈N · (sn )n∈N + (−(rn′ )n∈N · (s′n )n∈N ) =
rn (sn − s′n ) + s′n (rn − rn′ )
da mit (sn −
sind.
s′n )n∈N
und
(rn − rn′ )n∈N
n∈N
auch rn (sn −
∼ (0)n∈N ,
s′n ) + s′n (rn
− rn′ )
n∈N
Nullfolgen
(v) Setzt man1
P = {(rn )n∈N ∈ X : ∃δ ∈ Q, δ > 0, rn > δ für fast alle n ∈ N},
so gilt folgende Aussage: Ist (rn )n∈N ∈ X so gehört diese Folge zu genau einer der
folgenden Teilmengen: P, [(0)n∈N ]∼ , − P. Ist (rn )n∈N ∼ (rn′ )n∈N , so gehört (rn′ )n∈N
zur selben Teilmenge.
Beweis. Da nicht gleichzeitig rn > δ und −rn > δ für fast alle n ∈ N sein kann,
folgt P∩−P = ∅. Ist (rn )n∈N ∼ (0)n∈N , so ist sie eine Nullfolge. Also unterschreitet
|rn | jedes vorgegebene δ > 0, wenn n hinreichend groß ist, und (rn )n∈N kann damit
weder in P noch in −P liegen.
Seien (rn )n∈N , (rn′ )n∈N ∈ X äquivalent, aber beide nicht äquivalent zu (0)n∈N . Also
sind beide keine Nullfolgen. Für (rn )n∈N bedeutet das:
∃δ > 0 : |rn | ≥ δ für alle n in einer unendlichen Teilmenge M von N.
Sei N ∈ N, sodass |rn − rm |, |rn′ − rn | ≤ 4δ , m, n ≥ N. Ist nun m ∈ M, m, n ≥ N, so
folgt
δ
|rn′ | ≥ |rm | − |rn′ − rn | − |rn − rm | ≥ .
2
Wegen |rn′ − rm | ≤ 2δ und |rm | ≥ δ haben rn′ und rm dasselbe Vorzeichen. Also gilt
für fast alle n ∈ N, dass |rn′ | ≥ 2δ und dass sgn(rn′ ) = sgn(rm ) für unendlich viele
m ∈ M.
Da (rn )n∈N ∼ (rn )n∈N , erhält man mit dieser Argumentation genauso für fast alle
n, m ∈ N, dass |rn | ≥ 2δ und sgn(rn ) = sgn(rm ).
Also liegen (rn )n∈N und (rn′ )n∈N gemeinsam in P bzw. −P je nach dem Vorzeichen
von rm .
❑
1 Fast
alle bedeutet hier ’alle bis auf endlich viele’.
96
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
(vi) Man sieht auch ganz leicht, dass aus (rn )n∈N , (sn )n∈N ∈ P folgt, dass (rn )n∈N +
(sn )n∈N , (rn )n∈N · (sn )n∈N ∈ P.
(vii) Nun betrachten wir X/ ∼ und definieren:
[(rn )n∈N ]∼ + [(sn )n∈N ]∼ := [(rn )n∈N + (sn )n∈N ]∼ ,
[(rn )n∈N ]∼ · [(sn )n∈N ]∼ := [(rn )n∈N · (sn )n∈N ]∼ ,
−[(rn )n∈N ]∼ = [−(rn )n∈N ]∼ ,
P/ ∼ = {[(rn )n∈N ]∼ : (rn )n∈N ∈ P}.
Aus (iv) wissen wir, dass die Verknüpfungen damit wohldefiniert sind und aus
(v), dass P/ ∼, [(0)n∈N]∼ , −P/ ∼ paarweise disjunkte Mengen sind, deren Vereinigung X/ ∼ ist.
Nun übertragen sich das Kommutativgesetz, das Assoziativgesetz und das Distributivgesetz für + und ·. Die Restklasse [(0)n∈N ]∼ ist das additiv neutrale Element,
und [(1)n∈N ]∼ ist das multiplikativ neutrale Element. Weiters ist −[(rn )n∈N ]∼ das
additiv Inverse von [(rn )n∈N ]∼ .
Was X/ ∼ noch fehlt ein Körper zu sein, ist die Existenz einer multiplikativ Inversen. Dazu sei [(rn )n∈N ]∼ , [(0)n∈N ]∼ .
Nach (v) wissen wir, dass |rn | > δ für ein rationales δ > 0 und alle n ∈ N, n ≥ N.
Also gilt für m, n ≥ N
1 − 1 ≤ |rn − rm | ,
rn rm δ
und wir sehen, dass (qn )n∈N mit qn = r1n für n ≥ N, und qn = 0 für n < N, eine
Cauchy-Folge ist, und dass [(rn )n∈N ]∼ · [(qn )n∈N ]∼ = [(1)n∈N ]∼ .
Schließlich ist hX/ ∼, +, ·, P/ ∼i wegen (vi) sogar ein angeordneter Körper. Wir
bemerken noch, dass wegen (v) für die Ordnung ≤ auf X/ ∼ gilt, dass
[(rn )n∈N ]∼ < [(sn )n∈N ]∼ ⇔ rn ≤ sn + δ, n ≥ N
für ein δ > 0 und ein N ∈ N. Insbesondere gilt rn ≤ sn , n ≥ N ⇒ [(rn )n∈N ]∼ ≤
[(sn )n∈N ]∼ .
(viii) Da für zwei verschiedene rationale Zahlen r, s die konstante Folge (r − s)n∈N niemals eine Nullfolge ist und damit [(r)n∈N ]∼ und [(s)n∈N ]∼ zwei verschiedene Elemente in X/∼ sind, ist klar, dass man vermöge der Abbildung r 7→ [(r, r, . . . )]∼
die rationalen Zahlen als Teilmenge von X/∼ wiederfinden kann. Diese Identifizierung ist verknüpfungstreu, und auch die Ordnung ≤ bleibt erhalten.
(ix) hX/ ∼, +, ·, P/ ∼i ist ein archimedisch angeordneter Körper: Wenn [(rn )n∈N ]∼ ∈
X/ ∼, dann ist (rn )n∈N eine Cauchy-Folge und daher beschränkt. Da Q archimedisch angeordnet ist, gibt es ein N ∈ N, sodass rn ≤ N, n ∈ N. Das bedingt aber
[(rn )n∈N ]∼ ≤ [(N)]∼ .
(x) Nun wollen wir zeigen, dass unser Körper vollständig angeordnet ist. Dazu sei
A ⊆ X/ ∼ eine nach oben beschränkte, nicht leere Menge. Also gilt A < [(N)]∼
für ein N ∈ N.
97
Für j ∈ N sei 2− j Z die Menge aller rationalen Zahlen der Form qp mit p ∈ Z und
q = 2 j . Man sieht leicht, dass 2− j Z ⊆ 2− j−1 Z und dass der Abstand von zwei
verschiedenen Zahlen aus 2− j Z immer ein Vielfaches von 2− j ist.
Nun sei D j := {r ∈ 2− j Z : ∀a ∈ A : [(r)n∈N ]∼ > a}. Wegen N ∈ D j sind diese
Mengen nicht leer, und es gilt D j ⊆ D j+1 . Daraus folgt für x j := min D j , dass
x j+1 ≤ x j . Es sei bemerkt, dass D j eine Minimum hat, da die Zähler p von r ∈ D j
die Ungleichung p ≥ 2 j M erfüllen müssen, wobei M ∈ Z mit [(M)]∼ ≤ a0 für
irgendein festes a0 ∈ A.
Für die x j gilt nun x j − x j+1 ≤ 2− j−1 . Wäre diese Differenz nämlich größer, so
wäre sie zumindest 22− j−1 , da die Abstände zwischen Elementen von D j+1 ja
Vielfache von 2− j−1 sind. Das würde aber [(x j − 2− j )n∈N ]∼ ≥ [(x j+1 )n∈N ]∼ > A
implizieren, was der Wahl von x j als kleinstes Element in 2− j Z mit [(x j )n∈N ]∼ > A
widerspricht.
Die Folge (xn )n∈N ist eine Cauchyfolge, denn ist ǫ > 0 und n0 ∈ N so, dass
2−n0 < ǫ, und sind n > l ≥ n0 , so folgt
|xl − xn | = xl − xn =
n
X
(xk−1 − xk ) ≤
k=l+1
n
X
2−k <
k=l+1
∞
X
2−k = 2−l ,
(4.1)
k=l+1
wobei dieser Ausdruck ist aber kleiner oder gleich 2−n0 und daher kleiner ǫ ist.
Nun gilt [(xn )n∈N ]∼ = sup A. Um das zu einzusehen, wollen wir zunächst zeigen,
dass [(xn )n∈N ]∼ eine obere Schranke von A ist.
Angenommen wir hätten a > [(xn )n∈N ]∼ für ein a = [(an )n∈N ] ∈ A. Dann gäbe
es ein δ > 0 und ein n1 ∈ N, sodass an ≥ xn + δ, n ≥ n1 . Nun wähle man ein
natürliches l ≥ n1 so groß, dass 2−l ≤ δ. Für n > l folgt mit (4.1)
xl = xn + (xl − xn ) < xn + 2−l ≤ an ,
und somit [(xl )n∈N ]∼ ≤ a, was aber xl ∈ Dl widerspricht.
Ist b = [(bn )n∈N ] eine obere Schranke von A, d.h. A ≤ b, und wäre b < [(xn )n∈N ]∼ ,
so wäre
bn ≤ xn − δ,
für alle n größer gleich einem n2 ∈ N.
Ist l ≥ n2 mit 2−l ≤ δ, so folgt aus der Monotonie der xn für n > l
bn ≤ xn − 2−l ≤ xl+1 − 2−l ,
und daher bn + 2−l−1 ≤ xl+1 − 2−l−1 , n > l. Damit haben wir A ≤ b < [(xl+1 −
2−l−1 )n∈N ]∼ bzw. xl+1 − 2−l−1 ∈ Dl+1 . Das widerspricht aber der Minimalität von
xl+1 .
Also können wir uns nun sicher sein, dass es vollständig angeordnete Körper gibt.
Es bleibt zu zeigen, dass diese bis auf Kopien eindeutig sind.
4.1.3 Satz. Ist hK, +, ·, Pi ein vollständig angeordneter Körper und hX/ ∼, +, ·, P/ ∼i
der soeben konstruierte Körper, dann gibt es eine Bijektion φ̃ : X/ ∼ → K, die
verknüpfungstreu und ordnungstreu ist.
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
98
Beweis. Nach Proposition 2.5.7 gibt es eine verknüpfungs- und ordnungstreue injektive
Abbildung φ : Q → K. Insbesondere sind die Bilder von Nullfolgen bzw. CauchyFolgen wieder Nullfolgen bzw. Cauchy-Folgen.
Ist [(rn )n∈N ]∼ ∈ X/ ∼, so definieren wir
φ̃([(rn )n∈N ]∼ ) := lim φ(rn ).
n→∞
Man beachte, dass der Grenzwert existiert, da K ja ein vollständig angeordneter Körper
ist (vgl. Satz 3.4.10), und dass der Grenzwert nicht von der Wahl des Repräsentanten
(rn )n∈N der Restklasse [(rn )n∈N ]∼ abhängt: Ist nämlich (rn )n∈N ∼ (sn )n∈N , so folgt
lim φ(rn ) = lim φ(sn ) + lim φ(rn − sn ) = lim φ(sn ).
n→∞
n→∞
n→∞
n→∞
φ̃ ist injektiv, da
[(rn )n∈N ]∼ = [(sn )n∈N ]∼ ⇔ lim (rn − sn ) = 0 ⇔ lim φ(rn ) = lim φ(sn ).
n→∞
n→∞
n→∞
Die Surjektivität folgt aus der Tatsache, dass jede Zahl aus K durch eine Folge rationaler Zahlen approximiert werden kann (siehe Beispiel 3.2.6).
Die Verträglichkeit mit + folgt aus (siehe Satz 3.3.4)
φ̃([(rn )n∈N ]∼ + [(sn )n∈N ]∼ ) = lim φ(rn + sn ) =
n→∞
lim φ(rn ) + lim φ(sn ) = φ̃([(rn )n∈N ]∼ ) + φ̃([(sn )n∈N ]∼ ),
n→∞
n→∞
und die für · zeigt man genauso. Um die Verträglichkeit mit der Ordnung zu zeigen sei
bemerkt, dass (siehe Lemma 3.3.1) φ̃([(rn )n∈N ]∼ ) ∈ P ⇔ limn→∞ φ(rn ) > 0 ⇔ ∃δ >
0, φ(rn ) > δ für alle n ≥ N. Das heißt aber genau [(rn )n∈N ]∼ ∈ P/ ∼.
❑
Somit haben wir die Existenz und die Eindeutigkeit eines vollständig angeordneten
Körpers und damit auch Satz 2.7.3 bewiesen.
4.1.4 Bemerkung. Die in diesem Abschnitt angegebene Vorgangsweise aus Q die reellen Zahlen zu konstruieren lässt sich auch anwenden um zu zeigen, dass es zu jedem
metrischen Raum hX, di einen vollständigen metrischen Raum hX̂, d̂i gibt, sodass hX, di
isometrisch und dicht in hX̂, d̂i enthalten ist.
In der Tat nimmt man auch hier die Menge X aller Cauchy-Folgen in hX, di, betrachtet genauso die Äquivalenzrelation ∼, die zwei Folgen identifiziert, falls deren
Differenz eine Nullfolge ist, und beweist, dass X/ ∼ versehen mit einer geeigneten
Metrik der gesuchte metrische Raum ist.
Kapitel 5
Geometrie metrischer Räume
5.1 ǫ-Kugeln, offene und abgeschlossene Mengen
Als erstes wollen wir uns dem anschaulich leicht verständlichen Begriff der Kugel in
metrischen Räumen zuwenden.
5.1.1 Definition. Sei hX, di ein metrischer Raum und x ∈ X. Dann heißt die Menge
Uǫ (x) := {y ∈ X : d(y, x) < ǫ} die offene ǫ-Kugel um den Punkt x, und die Menge
Kǫ (x) := {y ∈ X : d(y, x) ≤ ǫ} die abgeschlossene ǫ-Kugel um den Punkt x.
5.1.2 Beispiel.
(i) Man betrachte R versehen mit der euklidischen Metrik. Für x ∈ R ist dann
Uǫ (x) = (x − ǫ, x + ǫ) und Kǫ (x) = [x − ǫ, x + ǫ].
(ii) Sei X eine Menge, und sei diese mit der diskreten Metrik aus Beispiel 3.1.5 versehen. Ist ǫ ≤ 1, so gilt dann in diesem Raum Uǫ (x) = {x}. Falls ǫ > 1, so gilt
Uǫ (x) = X.
(iii) Betrachte R2 , und versehe diese Menge einerseits mit der Metrik, d1 , der euklidischen Metrik d2 und mit d∞ (siehe Beispiel 3.1.5). Die ǫ-Kugeln Uǫ1 (0) bzgl. d1
sowie Uǫ (0) bzgl. d2 bzw. Uǫ∞ (0) bzgl. d∞ lassen sich folgendermaßen darstellen.
Uǫ1 (0)
Uǫ∞ (0)
Uǫ (0)
ǫ
ǫ
ǫ
ǫ
ǫ
ǫ
Abbildung 5.1: ǫ-Umgebungen von 0
5.1.3 Bemerkung. Die Konvergenz einer Folge (xn )n∈N in metrischen Räumen lässt sich
durch obige Mengen folgendermaßen formulieren:
x = lim xn ⇔ ∀ǫ > 0 ∃N ∈ N : {xn : n ≥ N} ⊆ Uǫ (x).
n→∞
99
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
100
Da Uǫ (x) ⊆ Kǫ (x) ⊆ U2ǫ (x), können wir hier genauso Kǫ (x) anstatt Uǫ (x) schreiben.
Diese Sichtweise des Grenzwertbegriffes gewinnt zum Beispiel dann an Bedeutung, wenn man den Konvergenzbegriff bezüglich verschiedener Metriken vergleichen
will.
Wir betrachten zum Beispiel die Metriken d und d∞ aus Beispiel 5.1.2, (iii). Wegen
(3.8) gilt Uǫ (x) ⊆ Uǫ∞ (x) ⊆ U2ǫ (x). Nimmt man nun obiges Konvergenzkriterium her,
so folgt unmittelbar aus dieser Relation, dass eine Folge genau dann bzgl. d konvergiert,
wenn sie es bzgl. d∞ tut. Siehe Proposition 3.5.1.
5.1.4 Definition. Sei hX, di ein metrischer Raum. Eine Teilmenge O von X heißt offen,
wenn es zu jedem Punkt x ∈ O eine ǫ-Kugel gibt mit Uǫ (x) ⊆ O.
ǫ
x
ǫ ′′
x′′
ǫ
′
x′
O
Abbildung 5.2: Offene Mengen
5.1.5 Beispiel.
In (R, d) sind z.B. die Mengen (a, b) und R \ {0} offen. Denn ist etwa x ∈ (a, b),
b−x
so folgt für ǫ = min( x−a
2 , 2 ), dass U ǫ (x) = (x − ǫ, x + ǫ) ⊆ (a, b).
Man sieht sofort, dass in jedem metrischen Raum hX, di die Mengen ∅ und X
immer offen sind.
Ist hX, di ein metrischer Raum, so ist jede Kugel Uǫ (x) für beliebige x ∈ X, ǫ > 0
offen. In der Tat gilt für y ∈ Uǫ (x) definitionsgemäß d(x, y) < ǫ. Wählt man
δ = ǫ − d(x, y), so folgt für z ∈ Uδ (y) aus d(y, z) < δ, dass d(x, z) ≤ d(x, y) +
d(y, z) < d(x, y) + ǫ − d(x, y) = ǫ, und somit z ∈ Uǫ (x).
5.1.6 Proposition. Sei hX, di ein metrischer Raum. Dann gilt
Ist n ∈ N und sind O1 , . . . , On offene Teilmengen von X, so ist auch
Tn
i=1
Oi offen.
Ist I eine beliebige Indexmenge, und sind Oi offene Teilmengen von X, so auch
S
i∈I Oi .
5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN
101
Beweis. Seien O1 , . . . , On offen und x ∈ O1 ∩ . . . ∩ On . Definitionsgemäß gibt es
ǫ1 , . . . , ǫn > 0 mit Uǫi (x) ⊆ Oi , i = 1, . . . , n. Es folgt
Umin{ǫ1 ,...,ǫn } (x) = Uǫ1 (x) ∩ . . . ∩ Uǫn (x) ⊆ O1 ∩ . . . ∩ On .
Damit ist O1 ∩ . . . ∩ On offen.
S
Seien Oi , i ∈ I, offen, und x ∈ i∈I Oi . Dann existiert ein i ∈ I mit x ∈ Oi , und
S
daher ein ǫ > 0 mit Uǫ (x) ⊆ Oi . Insgesamt folgt Uǫ (x) ⊆ i∈I Oi .
❑
5.1.7 Definition. Sei hX, di ein metrischer Raum, E ⊆ X und x ∈ X.
Man nennt x einen Häufungspunkt von E, wenn jede ǫ-Kugel um x einen Punkt
aus E \ {x} enthält, bzw. wenn
∀ǫ > 0 ∃y ∈ E, x , y : d(x, y) < ǫ.
Wenn x ∈ E kein Häufungspunkt ist, so nennen wir ihn isolierten Punkt von E.
Das ist also ein Punkt aus E, sodass
∃ǫ > 0, Uǫ (x) ∩ E = {x}.
Wir sagen eine Menge A ⊆ X ist abgeschlossen, wenn jeder Häufungspunkt von
A schon in A enthalten ist.
5.1.8 Bemerkung. In jeder ǫ-Kugel Uǫ (x) um einen Häufungspunkt x von E liegen
sogar unendlich viele Punkte von E \{x}. Denn angenommen es wären nur endlich viele
x1 , . . . , xn , so erhielten wir mit δ := min{ǫ, d(x, x1 ), . . . , d(x, xn )} > 0 den Widerspruch
Uδ (x) ∩ E \ {x} = ∅.
5.1.9 Bemerkung. Sei E ⊆ X. Für ein x ∈ X tritt genau einer der folgenden Fälle ein:
(i) x ist isolierter Punkt von E.
(ii) x ∈ E und x ist Häufungspunkt von E.
(iii) x < E und x ist Häufungspunkt von E.
(iv) x < E und x ist nicht Häufungspunkt von E.
5.1.10 Definition. Die Menge aller x, die (i), (ii) oder (iii) erfüllen, wollen wir mit
c(E) (Abschluss der Menge E) bezeichnen.
5.1.11 Bemerkung. Klarerweise ist E ⊆ c(E), und x ∈ c(E) ⇔
∀ǫ > 0 ∃y ∈ E : d(x, y) < ǫ ⇔ ∀ǫ > 0 : E ∩ Uǫ (x) , ∅.
Außerdem ist E abgeschlossen genau dann, wenn c(E) = E.
Schließlich kann man einfach zeigen, dass c(c(E)) = c(E), also dass c(E) immer
abgeschlossen ist.
5.1.12 Beispiel.
Sei E = [0, 1) ∪ {2} als Teilmenge von R. Dann ist 1 ein Häufungspunkt von E,
da jede ǫ-Kugel (1 − ǫ, 1 + ǫ) um 1 sicherlich Punkte aus E enthält. Da 1 nicht
zu E gehört, ist E nicht abgeschlossen. Man weist auch leicht nach, dass [0, 1]
genau die Menge aller Häufungspunkte von E ist, und dass 2 ein isolierter Punkt
ist. Also ist c(E) = [0, 1] ∪ {2}
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
102
Ist hX, di ein beliebiger metrischer Raum, und E ⊆ X eine endliche Teilmenge,
so hat E keine Häufungspunkte, besteht daher nur aus isolierten Punkten und ist
daher immer abgeschlossen.
Ist hX, di ein beliebiger metrischer Raum, so sind auch ∅ und X abgeschlossen,
genauso wie jede abgeschlossene Kugel Kǫ (x). Ist nämlich y Häufungspunkt von
Kǫ (x), so gibt es zu jedem n ∈ N ein yn ∈ Kǫ (x) mit d(yn , y) < n1 . Also d(x, y) ≤
d(x, yn ) + d(yn , y) < ǫ + 1n , und, da die rechte Seite gegen ǫ konvergiert, folgt
d(x, y) ≤ ǫ (siehe Lemma 3.3.1). Somit ist y ∈ Kǫ (x).
Die im vorigen Beispiel gewählte Vorgangsweise lässt sich zu folgendem Ergebnis
ausbauen.
5.1.13 Lemma. Ein Punkt x ist ein Häufungspunkt einer Menge E genau dann, wenn
es eine Folge (xn )n∈N von Punkten xn ∈ E \ {x} gibt mit xn → x.
Ein Punkt x liegt genau dann in c(E), wenn es eine Folge (xn )n∈N von Punkten
xn ∈ E gibt mit xn → x.
Beweis. Ist x Häufungspunkt von E, so gibt es zu jedem n ∈ N ein xn ∈ E \ {x} mit
d(x, xn ) < 1n , also xn → x.
Ist x isolierter Punkt von E, so konvergiert die identische Folge x = xn , n ∈ N gegen
x. Diese Folge ist klarerweise aus E.
Sei nun umgekehrt x = limn→∞ xn für eine Folge aus E. Ist für ein n ∈ N, xn = x,
so folgt trivialerweise x = xn ∈ E ⊆ c(E).
Im Fall xn , x für alle n ∈ N ist die Folge (xn )n∈N sicher in E \ {x} enthalten, und
zu jedem ǫ > 0 gibt es ein N ∈ N, sodass ∅ , {xn : n ≥ N} ⊆ Uǫ (x). Jedes Element der
Menge auf der linken Seite ist in Uǫ (x) ∩ E \ {x} enthalten. x ist somit Häufungspunkt
von E.
❑
5.1.14 Beispiel. Ist F ⊆ R abgeschlossen und nach oben beschränkt, so sei x := sup F.
Nach Beispiel 3.2.6 gibt es in F eine Folge, die gegen sup F konvergiert. Die Abgeschlossenheit von F impliziert sup F ∈ F, d.h. sup F = max F.
Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum.
5.1.15 Bemerkung. In Definition 4.1.1 haben wir definiert, was es heißt, dass eine
Teilmenge E ⊆ X dicht in X ist. Wegen Lemma 5.1.13 ist das äquivalent zu c(E) = X.
5.1.16 Proposition. Sei hX, di ein metrischer Raum und sei A ⊆ X. Dann sind äquivalent:
(i) Ac (= X \ A) ist offen.
(ii) A ist abgeschlossen.
(iii) Ist (xn )n∈N eine Folge von Punkten aus A und ist (xn )n∈N konvergent, so liegt auch
ihr Grenzwert in A.
Beweis.
(i) ⇒ (ii): Sei Ac offen, und sei x ein Häufungspunkt von A. Wäre x < A, so folgt
aus Ac offen, dass Uǫ (x) ⊆ Ac für ein ǫ > 0, und daher Uǫ (x) ∩ A = ∅. Ein
Widerspruch, denn jede Umgebung von x muss mit A nichtleeren Schnitt haben.
Also muss x ∈ A.
5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN
103
(ii) ⇒ (i): Sei x ∈ Ac . Da A abgeschlossen ist, ist x kein Häufungspunkt von A. Also
gibt es ein ǫ > 0 mit Uǫ (x)∩A = Uǫ (x)∩A\{x} = ∅. Das ist aber gleichbedeutend
mit Uǫ (x) ⊆ Ac . Also ist Ac offen.
(ii) ⇔ (iii): Folgt unmittelbar aus der Tatsache, dass A abgeschlossen ist genau dann,
wenn c(A) = A, und aus Lemma 5.1.13.
❑
Diese einfache Charakterisierung von abgeschlossenen Mengen gibt uns unmittelbar das folgende Korollar von Proposition 5.1.6.
5.1.17 Korollar. Sei hX, di ein metrischer Raum. Dann gilt
S
Sind n ∈ N und A1 , . . . , An abgeschlossen, so auch ni=1 Ai .
Ist I eine beliebige Indexmenge, und sind alle Mengen Ai , i ∈ I, abgeschlossen,
T
so folgt, dass auch i∈I Ai abgeschlossen ist.
Beweis. Es gilt
n
[
i=1
Ai
c
=
n
[
\
\ (Ai )c .
(Aci ),
Ai c =
i=1
i∈I
i∈I
❑
5.1.18 Beispiel.
Korollar 5.1.17gestattet uns z.B. die Teilmenge T = {z ∈ C : |z| = 1} (Einheitskreislinie) als abgeschlossene Teilmenge von C zu identifizieren. In der Tat ist
T = K1 (0) ∩ (U1 (0))c , und damit Durchschnitt von abgeschlossenen Mengen.
Man betrachte M = {z ∈ C : Re z ≥ 0} als Teilmenge von C. Ist (zn )n∈N eine
Folge aus M, die gegen z ∈ C konvergiert, so muss nach Proposition 3.5.1 die
Folge (Re zn )n∈N in R gegen Re z konvergieren. Wegen Lemma 3.3.1 folgt aus
Re zn ≥ 0, n ∈ N, dass auch Re z ≥ 0 und damit z ∈ M. Nach Proposition 5.1.16
ist M abgeschlossen.
Die Teilmenge {z ∈ C : 0 ≤ Re z ≤ 1} von C lässt sich als Durchschnitt von
{z ∈ C : Re z ≥ 0} und {z ∈ C : Re z ≤ 1} schreiben. Nach dem vorhergehenden
Beispiel ist die erste Menge abgeschlossen. Entsprechendes gilt für die zweite
Menge. Also ist {z ∈ C : 0 ≤ Re z ≤ 1} der Durchschnitt von abgeschlossenen
Mengen und damit selber abgeschlossen.
Das Quadrat {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]} ist der Durchschnitt der
abgeschlossenen Mengen {z ∈ C : 0 ≤ Re z ≤ 1} und {z ∈ C : 0 ≤ Im z ≤ 1}, und
daher auch abgeschlossen.
Da die Menge {z ∈ C : Re z ≥ 0} abgeschlossen ist, folgt, dass ihr Komplement
M := {z ∈ C : Re z > 0} in C offen ist. Das kann man auch direkt nachweisen:
Ist z ∈ M beliebig, so wähle ǫ = Re z > 0. Ist w ∈ Uǫ (z), so folgt wegen
Re z − Re w ≤ | Re z − Re w| ≤ |z − w| und damit Re w > Re z − ǫ = 0, dass auch
w ∈ M, und daher Uǫ (z) ⊆ M.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
104
Das offene Quadrat M = {z ∈ C : Re z ∈ (0, 1), Im z ∈ (0, 1)} lässt sich als
Durchschnitt von endlich vielen offenen Mengen schreiben:
M = {z ∈ C : Re z > 0}∩{z ∈ C : Re z < 1}∩{z ∈ C : Im z > 0}∩{z ∈ C : Im z < 1}.
Sie ist daher selber offen.
5.2 Kompaktheit
Wir wollen nun auch Häufungspunkte für Folgen einführen.
5.2.1 Definition. Sei hX, di ein metrischer Raum. Dann heißt ein x ∈ X Häufungspunkt
einer Folge (xn )n∈N , falls es eine gegen x konvergente Teilfolge von (xn )n∈N gibt.
5.2.2 Lemma. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di.
(i) Konvergiert (xn )n∈N gegen x, so ist x der einzige Häufungspunkt (siehe Satz 3.2.9).
(ii) Ist (xn( j) ) j∈N eine Teilfolge von (xn )n∈N , so ist die Menge aller Häufungspunkte
von (xn( j) ) j∈N eine Teilmenge von der Menge aller Häufungspunkte von (xn )n∈N .
(iii) x ist Häufungspunkt der Folge (xn )n∈N genau dann, wenn für jedes N ∈ N der
Punkt x in c({xn : n ≥ N}) liegt.
Beweis.
(i) Das folgt unmittelbar aus Satz 3.2.9, da Teilfolgen konvergenter Folgen auch gegen den Grenzwert der Folge streben.
(ii) Da jede Teilfolge von (xn( j) ) j∈N erst recht eine Teilfolge von (xn )n∈N ist, muss jeder
Häufungspunkt von (xn( j) ) j∈N auch einer von (xn )n∈N sein.
(iii) Sei zunächst x Häufungspunkt der Folge (xn )n∈N . Also x = lim j→∞ xn( j) . Wir
halten N fest und wählen J ∈ N, sodass n(J) ≥ N. Dann ist (xn( j+J) ) j∈N eine Folge
in {xn : n ≥ N}, die gegen x konvergiert. Nach Lemma 5.1.13 ist x ∈ c({xn : n ≥
N}).
Ist umgekehrt x ∈ c({xn : n ≥ N}) für alle N ∈ N, so sei n(1) ∈ N so, dass
d(x, xn(1) ) < 1. Angenommen wir haben n(1) < · · · < n(k) gewählt, so sei n(k +
1
1) ∈ N, n(k + 1) > n(k) so, dass d(x, xn(k+1) ) < k+1
. So ein n(k + 1) existiert, da
x ∈ c({xn : n ≥ n(k) + 1}). Wir haben somit eine Teilfolge konstruiert, die gegen x
konvergiert. x ist somit Häufungspunkt der Folge (xn )n∈N .
❑
Folgender Satz ist ein sehr oft verwendetes Mittel in der Analysis.
5.2.3 Satz (Bolzano1-Weierstraß2 ). Sei (xn )n∈N eine beschränkte Folge in R p (versehen
mit der euklidischen Metrik). Dann hat (xn )n∈N einen Häufungspunkt.
1 Bernard
2 Karl
Bolzano. 5.10.1781 Prag - 18.12.1848 Prag
Theodor Wilhelm Weierstraß. 31.10.1815 Ostenfelde (Westfalen) - 19.12.1897 Berlin
5.2. KOMPAKTHEIT
105
Wir wollen uns diesem Satz zuerst im Falle p = 1 zuwenden. Betrachte also eine
reelle Folge (xn )n∈N , die beschränkt ist, d.h. |xn | ≤ C, n ∈ N. Für N ∈ N sei
yN := sup{xn : n ≥ N}.
Da R vollständig angeordnet ist, existieren diese Zahlen yN , und wegen
{xn : n ≥ N + 1} ⊆ {xn : n ≥ N} ist die Folge (yN )N∈N monoton fallend. Außerdem gilt
immer −C ≤ yN ≤ C. Also können wir Satz 3.4.2 anwenden und sehen, dass limN→∞ yN
existiert und mit inf{yN : N ∈ N} übereinstimmt.
5.2.4 Definition. Wir nennen diesen Grenzwert Limes Superior der Folge (xn )n∈N und
schreiben dafür
lim sup xn := inf sup xn = lim sup xn .
n→∞
N∈N n≥N
N∈N n≥N
Entsprechend existiert der Limes Inferior
lim inf xn := sup inf xn = lim inf xn .
n→∞
N∈N n≥N
N∈N n≥N
Ist (xn )n∈N nicht beschränkt, so kann man lim supn→∞ xn und lim inf n→∞ xn genauso
definieren, wobei diese dann Werte in R ∪ {−∞, +∞} annehmen.
5.2.5 Proposition. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen. Dann ist
lim supn→∞ xn ( lim inf n→∞ xn ) der größte (kleinste) Häufungspunkt von (xn )n∈N .
Insbesondere hat jede beschränkte Folge reeller Zahlen mindestens einen
Häufungspunkt.
Beweis. Wir zeigen die Behauptung für den Limes Superior. Den Fall des Limes Inferior behandelt man analog.
Um nachzuweisen, dass x = lim supn→∞ xn ein Häufungspunkt ist, bemühen wir
Lemma 5.2.2 und zeigen x ∈ c({xn : n ≥ k}) für jedes k ∈ N.
Ist ǫ > 0, so gibt es wegen der Konvergenz yN → x ein N0 ∈ N, sodass yN ∈
(x − ǫ, x + ǫ), N ≥ N0 . Wähle N ≥ max(N0 , k) beliebig. Da yN = sup{xn : n ≥ N} die
kleinste obere Schranke ist, gibt es xn , n ≥ N, sodass x − ǫ < xn ≤ yN < x + ǫ. Also
haben wir
xn ∈ (x − ǫ, x + ǫ) ∩ {xn : n ≥ k} , ∅,
und nach Bemerkung 5.1.9 ist x ∈ c({xn : n ≥ k}).
Ist schließlich y ein beliebiger Häufungspunkt von (xn )n∈N , so gibt es eine Teilfolge
(xn( j) ) j∈N , die gegen y konvergiert. Es folgt
yn( j) = sup{xk : k ≥ n( j)} ≥ xn( j)
für alle j ∈ N. Also y = lim j→∞ xn( j) ≤ lim j→∞ yn( j) = x.
❑
5.2.6 Fakta.
1. Aus lim supn→∞ xn = limN∈N supn≥N xn zusammen mit Satz 2.6.3 und Lemma
3.3.1 zeigt man, dass lim supn→∞ xn < ξ genau dann, wenn es ein q < ξ gibt,
sodass xn ≤ q für alle bis auf endlich viele n ∈ N. Entsprechendes gilt für
lim inf n→∞ xn .
2. Ähnlich zeigt man, dass lim supn→∞ xn > ξ genau dann, wenn es ein q > ξ gibt,
sodass xn ≥ q für unendlich viele n ∈ N. Entsprechendes gilt für lim inf n→∞ xn .
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
106
3. In der Tat ist lim supn→∞ xn jene eindeutige Zahl x, für die gilt:
Für jedes ǫ > 0 gibt es nur für endlich viele n ∈ N, die der Ungleichung xn ≥ x+ǫ
genügen, wogegen für unendlich viele n ∈ N die Ungleichung xn ≥ x − ǫ gilt.
Auch hier gilt entsprechendes für lim inf n→∞ xn .
4. Satz 3.8.1 lässt sich nun mit Hilfe von Limes Superior und Limes Inferior folgendermaßen formulieren, wobei die Divergenzkriterien schwächer als die in Satz
3.8.1 sind:
√
|
Falls lim supk→∞ k |ak | < 1 bzw. lim supk→∞ |a|ak+1
< 1, so konvergiert die Reihe
k|
∞
P
ak absolut.
k=1
√
Gilt lim supk→∞ k |ak | > 1 bzw. lim inf k→∞
|ak+1 |
|ak |
> 1, so divergieren diese Reihen.
5. Weiters folgt aus den Rechenregeln für Suprema und Infima, dass
lim supn→∞ (−xn ) = − lim inf n→∞ xn .
5.2.7 Beispiel. Man betrachte die Folge xn = (−1)n(1 + 1n ), n ∈ N in R. Die Teilfolge
1
1
konvergiert für k → ∞ gegen 1, und die Teilfolge x2k−1 = −1 − 2k−1
x2k = 1 + 2k
konvergiert für k → ∞ gegen −1.
Also sind −1 und 1 Häufungspunkte unserer Folge. Angenommen x ∈ R wäre ein
weiterer Häufungspunkt. Dann gäbe es eine Teilfolge (xn( j) ) j∈N , die gegen x konvergierte. Nun sei
J1 = { j ∈ N : n( j) ist ungerade} und J2 = { j ∈ N : n( j) ist gerade}.
˙ 2 , und somit ist zumindest eine dieser Mengen unendlich.
Klarerweise ist N = J1 ∪J
Ist J1 unendlich, so gibt es eine streng monoton wachsende Bijektion j : N →
J1 (vgl. Lemma 2.3.17). Also ist (xn( j(k)) )k∈N eine Teilfolge von (xn( j) ) j∈N und somit
ebenfalls gegen x konvergent. Andererseits konvergiert aber
xn( j(k)) = −1 −
1
n( j(k))
wegen n( j(k)) ≥ k gegen −1. Also muss x = −1. Ist J2 unendlich, so folgt analog
x = 1. Jedenfalls haben wir gezeigt, dass −1, 1 die einzigen Häufungspunkte sind. Aus
Proposition 5.2.5 folgt schließlich
lim inf xn = −1, lim sup xn = 1.
n→∞
n→∞
5.2.8 Korollar. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen. Dann sind folgende
drei Punkte äquivalent.
(i) (xn )n∈N ist konvergent.
(ii) (xn )n∈N hat nur einen Häufungspunkt.
(iii) lim inf n→∞ xn = lim supn→∞ xn .
Gilt (i)-(iii), so stimmt Grenzwert, einziger Häufungspunkt, sowie Limes Inferior und
Limes Superior überein.
Beweis.
5.2. KOMPAKTHEIT
107
(ii) ⇔ (iii): Folgt unmittelbar aus Proposition 5.2.5.
(i) ⇒ (ii): Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt
unserer Folge.
(iii) ⇒ (i): Die Voraussetzung x = lim inf n→∞ xn = lim supn→∞ xn bedeutet, dass x =
limN→∞ yN = limN→∞ zN , wobei yN = sup{xn : n ≥ N} und zN = inf{xn : n ≥ N}.
Also gibt es zu gegebenen ǫ > 0 einen Index N ∈ N, sodass y j , z j ∈ (x − ǫ, x + ǫ)
für alle j ≥ N. Wegen zN ≤ xn ≤ yN , n ≥ N folgt mit j = N
x − ǫ < zN ≤ xn ≤ yN < x + ǫ,
für alle n ≥ N. Also limn→∞ xn = x.
❑
Wir kommen nun zum Beweis des Satzes von Bolzano-Weierstrass.
Beweis. (von Satz 5.2.3) Für Folgen in R folgt der Satz aus Proposition 5.2.5.
Sei (xn )n∈N eine beschränkte Folge in R p , wobei xn = (xn,1 , . . . , xn,p ). Wegen (3.8)
gilt für k = 1, . . . , p
|xn,k | ≤ d2 (xn , 0),
und daher ist jede der Folgen (xn,k )n∈N beschränkt.
Da wir den Satz im Fall p = 1 schon gezeigt haben, gibt es eine konvergente
Teilfolge (xn( j1 ),1 ) j1 ∈N von (xn,1 )n∈N .
Nun betrachte (xn( j1 ),2 ) j1 ∈N . Dies ist wieder eine beschränkte Folge und hat daher
ihrerseits eine konvergente Teilfolge (xn( j1 ( j2 )),2 ) j2 ∈N . Man beachte, dass (xn( j1 ( j2 )),1 ) j2 ∈N
als Teilfolge der konvergenten Folge (xn( j1 ),1 ) j1 ∈N auch konvergiert.
Setzen wir diese Konstruktion fort, so erhalten wir eine Teilfolge (xn( j1 (...( j p )... )) ) j p ∈N
von (xn )n∈N , sodass (xn( j1 (...( j p )... )),k ) j p ∈N für jedes k = 1, . . . , p konvergiert. Nach
Proposition 3.5.1 konvergiert daher auch (xn( j1 (...( j p )... )) ) j p ∈N .
❑
Der Satz von Bolzano-Weierstrass legt folgende Begriffsbildung nahe.
5.2.9 Definition. Sei hX, di ein metrischer Raum, und sei K ⊆ X mit der Eigenschaft,
dass jede Folge (xn )n∈N aus K einen Häufungspunkt in K hat. Dann heißt K kompakt.
5.2.10 Beispiel.
Man betrachte R. Die Teilmenge N von R ist nicht kompakt, da die Folge (n)n∈N
keine konvergente Teilfolge besitzt.
Das Intervall (0, 1] ist auch nicht kompakt, da die Folge ( n1 )n∈N gegen 0 konvergiert und somit in (0, 1] keinen Häufungspunkt besitzt.
Ist K ⊆ R p eine abgeschlossene und beschränkte Menge, so hat nach Satz 5.2.3
jede Folge einen Häufungspunkt, der nach Proposition 5.1.16 zu K gehört.
Insbesondere sind alle abgeschlossenen Intervalle [a, b] in R und allgemeier alle
abgeschlossenen Kugeln Kr (x) in R p kompakt.
Wir sammeln einige elementare Eigenschaften von kompakten Teilmengen.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
108
5.2.11 Proposition. Sei hX, di ein metrischer Raum. Dann gilt:
(i) Ist K ⊆ X kompakt, dann ist K abgeschlossen.
(ii) Ist K ⊆ X kompakt, und F ⊆ X abgeschlossen, sodass F ⊆ K, dann ist auch F
kompakt.
(iii) Kompakte Teilmengen sind beschränkt.
Beweis.
(i) Wir verwenden Proposition 5.1.16. Sei x = limn→∞ xn für eine Folge aus K. Nun
gibt es definitionsgemäß eine gegen ein y ∈ K konvergente Teilfolge von (xn )n∈N .
Andererseits konvergieren Teilfolgen von gegen x konvergenten Folgen ebenfalls
gegen x. Nun sind aber Grenzwerte eindeutig. Also gilt x = y ∈ K.
(ii) Sei F ⊆ K abgeschlossen. Ist (xn )n∈N eine Folge aus F, so ist sie trivialerweise
auch eine Folge aus K. Also gilt x = lim j→∞ xn( j) für eine Teilfolge (xn( j) ) j∈N und
ein x ∈ K. Nun ist aber F abgeschlossen, und somit folgt aus Proposition 5.1.16,
dass x ∈ F. Also enthält jede Folge in F eine gegen einen Punkt in F konvergente
Teilfolge.
(iii) Sei y ∈ X. Wäre K nicht beschränkt, so wäre auch {d(y, x) : x ∈ K} ⊆ R nicht
beschränkt. Also könnten wir zu jedem n ∈ N ein xn ∈ K finden, sodass d(y, xn ) ≥
n.
Aus der Kompaktheit folgt die Existenz einer konvergenten Teilfolge xn( j) →
x, j → ∞. Aus Lemma 3.2.12 folgt d(y, xn( j) ) → d(y, x). Das widerspricht aber
d(y, xn( j) ) ≥ n( j), j ∈ N.
❑
5.2.12 Korollar. Sei (xn )n∈N eine Folge in einer kompakten Teilmenge eines metrischen Raumes hX, di. Dann konvergiert
(xn )n∈N genau dann, wenn (xn )n∈N nur einen Häufungspunkt hat.
Beweis. Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt unserer Folge.
Ist x der einzige Häufungspunkt unserer Folge, und wäre (xn )n∈N nicht gegen x konvergent, so gäbe es ein ǫ > 0, sodass
∀N ∈ N ∃n ≥ N, d(xn , x) ≥ ǫ.
Daraus definieren wir induktiv eine Teilfolge (xn(k) )k∈N . Sei n(1) ∈ N so, dass d(xn(1) , x) ≥ ǫ. Ist n(k) ∈ N definiert, so sei
n(k + 1) die kleinste Zahl in N, sodass n(k + 1) ≥ n(k) + 1 und d(xn(k+1) , x) ≥ ǫ.
Nun hat diese Folge wegen der Kompaktheit mindestens einen Häufungspunkt y ∈ K. Da (xn(k) )k∈N eine Teilfolge von
(xn )n∈N ist, muss y auch Häufungspunkt von (xn )n∈N und damit gleich x sein. Da y Häufungspunkt ist, gibt es eine Teilfolge
(xn(k( j)) ) j∈N von (xn(k) )k∈N , die gegen y konvergiert. Wegen d(x, y) = limn→∞ d(x, xn(k( j)) ) ≥ ǫ folgt aber y , x. Also muss
xn → x, n → ∞.
❑
Aus Proposition 5.2.11 und Beispiel 5.2.10 erhalten wir folgendes
5.2.13 Korollar. Eine Teilmenge K von R p ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist.
5.2.14 Bemerkung. Diese Charakterisierung von Kompaktheit gilt nicht in allen metrischen Räumen.
5.3. FOLGEN UND NETZE
109
5.3 Folgen und Netze
Bei der Motivation des Grenzwertbegriffes für Folgen haben wir gesagt eine Folge
(xi )i∈N solle konvergent gegen x heißen, wenn für alle hinreichend großen Indizes das
Folgenglied xi beliebig nahe an x herankommt.
Für den weiteren Aufbau der Analysis verwenden wir ähnliche Grenzwertbegriffe
z.B. für Funktionen f : (a, b) → R. Dabei soll f (t) konvergent für t → b gegen x
heißen, wenn f (t) beliebig nahe an x herankommt, sobald t nur hinreichend nahe an b
zu liegen kommt.
Um nicht jedesmal eine neue Konvergenztheorie aufbauen zu müssen, wollen wir
einen abstrakten Grenzwertbegriff einführen, von dem alle von uns benötigten Grenzwertbegriffe Spezialfälle sind. Was bei den Folgen die natürlichen Zahlen waren, ist
bei unserem allgemeinen Konzept nun die gerichtete Menge
5.3.1 Definition. Sei I eine nicht leere Menge, und sei eine Relation auf I. Dann
heißt (I, ) eine gerichtete Menge, wenn folgender drei Bedingungen genügt.
Reflexivität:
∀i ∈ I : i i
Transitivität:
∀i, j, k ∈ I : i j ∧ j k ⇒ i k
Richtungseigenschaft:
∀i, j ∈ I ∃k ∈ I : i k ∧ j k.
(5.1)
5.3.2 Beispiel.
(i) Neben (N, ≤) ist jede Totalordnung eine gerichtete Menge. Also etwa
((0, +∞), ≤), ((a, b), ≥), ((a, b), ≤), wobei a, b ∈ R, a < b.
Die Eigenschaft (5.1) wird bei einer Totalordnung zum Beispiel vom Maximum
zweier Elemente erfüllt.
(ii) Sei a, b, c ∈ R, a < b < c. Setze I := [a, b) ∪ (b, c] und definiere eine Relation auf I durch
x y : ⇐⇒ |y − b| ≤ |x − b| .
Dann ist reflexiv, transitiv, und je zwei Punkte sind vergleichbar. Also ist hI, i
eine gerichtete Menge. Man beachte, dass nicht antisymmetrisch und somit
keine Halbordnung ist.
(iii) Die gerichtete Menge aus dem letzten Beispiel ist ein Spezialfall des folgenden
Konzeptes.
Sei hX, dX i ein metrischer Raum, D ⊆ X und z ein Häufungspunkt von D. Auf
D \ {z} definieren wir :
x y : ⇐⇒ dX (y, z) ≤ dX (x, z)
Mit dieser Relation wird D\{z} zu einer gerichteten Menge, wobei - salopp gesagt
- ein Punkt bezüglich der Relation weiter oben als ein anderer ist, wenn er näher
an z liegt.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
110
(iv) Wir nennen eine endliche Teilmenge Z eines Intervalls [a, b] eine Zerlegung dieses Intervalls, wenn a, b ∈ Z. Die Menge aller solchen Zerlegungen wird mit Z
bezeichnet. Versieht man Z mit der Relation ⊆, so erhalten wir eine gerichtete
Menge.
n(R)
(v) Wir nennen das Paar R = ((ξ j )n(R)
j=0 ; (η j ) j=1 ) eine Riemann-Zerlegung eines Intervalls [a, b], falls
a = ξ0 < ξ1 < · · · < ξn(R) = b; η j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R),
und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Zerlegung.
Weiters sei R1 R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Zerlegungen, dann ist (R, ) eine gerichtete Menge. In diesem Beispiel ist sicher nicht
antisymmetrisch.
Dieser gerichteten Menge und der aus dem letzten Beispiel werden wir bei der
Einführung das Integrals wieder begegnen.
(vi) Sei I = N × N und (n1 , m1 ) (n2 , m2 ) :⇔ n1 ≤ n2 ∧ m1 ≤ m2 . Dann ist (I, ) eine
gerichtete Menge. Diese gerichtete Menge dient für Konvergenzbetrachtungen
bei Doppelfolgen.
(vii) Sind allgemeiner I und J gerichtete Mengen versehen mit Relationen I bzw. J ,
dann ist (I × J, ) ebenfalls eine gerichtete Menge, wenn wir (i1 , j1 ) (i2 , j2 ) :⇔
i1 I i2 ∧ j1 J j2 definieren.
5.3.3 Definition. In Analogie zu den Folgen nennen wir eine Abbildung x : I → X ein
Netz bzw. eine Moore-Smith-Folge in der Menge X über der gerichteten Menge (I, ),
und schreiben diese als (xi )i∈I .
Entsprechend Definition 3.2.2 sagen wir, dass ein Netz (xi )i∈I in einen metrischen
Raum hX, di gegen einen Punkt x ∈ X konvergiert, falls
∀ǫ > 0 ∃i0 ∈ I : d(xi , x) < ǫ, i i0 .
(5.2)
In diesem Falle schreiben wir x = lim xi .
i∈I
5.3.4 Beispiel.
(i) Wie bei den Folgen sieht man, dass konstante Netze xi = x, i ∈ I, immer gegen x
konvergieren.
(ii) Als konkreteres Beispiel betrachte man die gerichtete Menge ([−1, 0) ∪ (0, 1], ),
wobei x y ⇔ |y| ≤ |x|, und f (t) = t2 . Dann konvergiert das Netz ( f (t))t∈[−1,0)∪(0,1]
gegen Null:
p
Zu gegebenen ǫ > 0 sei t0 := 2ǫ . Ist t t0 , so folgt |0 − f (t)| = |t2 | ≤ |t02 | =
pǫ 2
2 < ǫ.
(iii) Sei M eine Menge und E die Menge aller endlichen Teilmengen von M. Setzt
man A B :⇔ A ⊆ B, so ist (E, ) eine gerichtete Menge: Die Reflexivität und
Transitivität sind klar, da die Mengeninklusion diese Eigenschaften hat.
Sind A, B ∈ E, so folgt A ∪ B ∈ E und A, B ⊆ A ∪ B. Also ist (5.1) erfüllt.
Im Falle M = N sind wir dieser gerichteten Menge schon begegnet. Ist nämlich
P∞
P
A∈E ein
n=1 an eine absolut konvergente Reihe mit der Summe s, so ist ( n∈A an )P
Netz, und in Lemma 3.9.2, (iv), haben wir nichts anderes als s = lim n∈A an
A∈E
hergeleitet.
5.3. FOLGEN UND NETZE
111
Nun gelten viele der für Folgen hergeleiteten Ergebnisse auch für Netze. Die Beweise sind im Wesentlichen die selben, wie für Folgen.
Der Grenzwert ist eindeutig:
Ist (xi )i∈I ein Netz, und sei angenommen, dass xi → x und xi → y mit x , y.
> 0. Dann gibt es wegen xi → x einen Index i1 , sodass für alle
Setze ǫ := d(x,y)
3
i ∈ I mit i1 i gilt d(xi , x) < ǫ. Wegen xi → y gibt es auch i2 ∈ I, sodass für alle
i ∈ I mit i2 i gilt d(xi , y) < ǫ. Ist nun i ∈ I so, dass wir beide Abschätzungen
zur Verfügung haben, also so, dass i1 i und i2 i, dann erhalten wir den
Widerspruch
d(x, y)
.
d(x, y) ≤ d(x, xi ) + d(xi , y) < 2
3
Die Tatsache, dass es bei Folgen auf endlich viele Glieder nicht ankommt hat
auch eine Verallgemeinerung für Netze. Ist nämlich k ∈ I, so ist auch (Ik , ) mit
Ik = {i ∈ I : k i} eine gerichtete Menge und
lim xi = lim xi ,
i∈I
i∈Ik
(5.3)
wobei der rechte Grenzwert genau dann existiert, wenn der linke existiert.
Im Allgemeinen sind konvergente Netze nicht beschränkt. Aber da ein gegen ein
x konvergentes Netz {xi : i i0 } ⊆ Uǫ (x) für ein i0 ∈ I erfüllt, ist zumindest das
Netz (xi )i∈Ii0 beschränkt.
Eine separate Betrachtung verdient das Analogon von Teilfolgen.
5.3.5 Definition. Sind (I, I ) und (J, J ) zwei gerichtete Mengen, ist X eine Menge
und (xi )i∈I ein Netz in X, so heißt (xi( j) ) j∈J eine Teilnetz von (xi )i∈I , wenn i : J → I
derart ist, dass
∀i ∈ I ∃k ∈ J : ∀ j J k ⇒ i( j) I i.
Ist (J, J ) = (N, ≤), so heißt (xi( j) ) j∈J = (xi(n) )n∈N eine Teilfolge 3 .
5.3.6 Bemerkung. Ist x = limi∈I xi , und ǫ > 0, so gibt es ein i0 ∈ I, sodass d(x, xi ) < ǫ
wenn i I i0 . Ist nun j0 ∈ J, sodass i( j) I i0 für alle j J j0 , so folgt d(x, xi( j) ) < ǫ
wenn j J j0 . Also gilt
x = lim xi ⇒ x = lim xi( j) .
(5.4)
i∈I
j∈J
Wie wir im nächsten Kapitel sehen werden, ist es oft wünschenswert die Konvergenz von Netzen auf die von Folgen zurück zu führen. Das geht nicht immer, aber in
vielen Fällen.
5.3.7 Definition. Wir sagen, dass eine gerichtete Menge (I, ) Teilfolgen gestattet,
wenn es eine abzählbare Teilmenge J von I gibt, sodass ∀i ∈ I∃ j ∈ J : i j.
Wie wir im folgenden Lemma 5.3.8 sehen werden, bedeutet diese Eigenschaft, dass
man hinreichend viele Teilfolgen konstruieren kann, damit man von der Konvergenz
von Teilfolgen auf die Konvergenz eines gegebenen Netzes schließen kann.
5.3.8 Lemma. Sei (Y, dY ) ein metrischer Raum und (I, ) eine gerichtete Menge, die
Teilfolgen gestattet. Ist (yi )i∈I ein Netz in Y, so gilt y = limi∈I yi genau dann, wenn
limn→∞ yi(n) = y für jede Teilfolge von (yi )i∈I .
3 Im
Gegensatz zu Teilfolgen von Folgen verlangen wir hier nicht, dass i : N → I monoton ist.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
112
Beweis. Ist y = limi∈I yi , und ist (yi(n) )n∈N eine Teilfolge, so folgt limn→∞ yi(n) = y
wegen (5.4).
Konvergiert (yi )i∈I nicht gegen y, so gibt es ein ǫ > 0, sodass
∀i ∈ I ∃k ∈ I, k i : d(yk , y) ≥ ǫ.
(5.5)
Daraus konstruieren wir eine Teilfolge, die nicht gegen y konvergiert. Dazu sei j : N →
J bijektiv, wobei J wie in Definition 5.3.7 ist.
Sei i1 ∈ I, i1 j(1) mit d(yi1 , y) ≥ ǫ (siehe (5.5)). Sind i1 · · · im ∈ I definiert,
so sei i ∈ I, i im , i j(m + 1). Gemäß (5.5) gibt es ein im+1 i, sodass d(yim+1 , y) ≥ ǫ.
Wegen im j(m), m ∈ N, gibt es zu jedem i ∈ I ein m0 ∈ N, sodass j(m0 ) i,
und daher im im0 j(m0 ) für alle m ≥ m0 . Also ist (yin )n∈N eine Teilfolge, sodass
d(yin , y) ≥ ǫ, und die daher nicht gegen y konvergiert.
❑
Nun zählen wir Sätze, Rechenregeln, etc. auf, die wir für Folgen hergeleitet haben,
und die sich auf Netze mit praktischen den selben Beweisen übertragen lassen:
Sind (xi )i∈I und (yi )i∈I konvergente Netze, oder nur eine Konstante, in R, und gilt
xi ≤ yi für alle i, die k für ein k ∈ I sind, so folgt
lim xi ≤ lim yi .
i∈I
(5.6)
i∈I
Ist umgekehrt limi∈I xi < limi∈I yi , so gilt xi < yi für alle i k mit einem gewissen
k ∈ I.
Man betrachte zwei konvergente Netze (zi )i∈I , (wi )i∈I über derselben gerichteten
Menge (I, ) in R oder in C. Dann folgt
lim(zi + wi ) = (lim zi ) + (lim wi ), lim −zi = − lim zi ..
i∈I
i∈I
i∈I
i∈I
i∈I
(5.7)
Dasselbe gilt für die Multiplikation. Um das zu zeigen muss man eine Spur anders vorgehen, als im Beweis von Satz 3.3.4, da Netze i.A. nicht beschränkt sind:
Sei ǫ > 0 oBdA. so, dass ǫ ≤ 1. Seien i1 , i2 so groß, dass i i1 ⇒ |zi − z| < ǫ und
i i2 ⇒ |wi − w| < ǫ. Insbesondere gilt für solche i auch |wi | ≤ |w| + ǫ ≤ |w| + 1.
Gemäß Definition 5.3.1 gibt es ein i0 i1 , i2 . Für i i0 folgt
|zi wi − zw| = |(zi − z)wi + z(wi − w)| ≤ |zi − z| · |wi | + |z| · |wi − w|
< ǫ|wi | + |z|ǫ ≤ (|w| + 1 + |z|)ǫ.
In Analogie zu (3.6) folgt daraus zi wi → zw, i ∈ I.
Ist (zi )i∈I ein Netz in R oder C, sodass zi , 0, i ∈ I, und limi∈I zi = z , 0. Dann
folgt limi∈I z1i = 1z .
Ist (xi )i∈I ein monoton wachsendes Netz in R: i j ⇒ xi ≤ x j und ist {xi : i ∈ I}
beschränkt, so folgt
lim xi = sup{xi : i ∈ I}.
(5.8)
i∈I
Entsprechendes gilt für monoton fallende Netze.
5.3. FOLGEN UND NETZE
113
Seien (xi )i∈I , (yi )i∈I und (ai )i∈I Netze in R über derselben gerichteten Menge,
sodass xi ≤ ai ≤ yi für alle i i0 mit einem gewissen i0 ∈ I. Gilt
lim xi = lim yi ,
i∈I
i∈I
so existiert auch der Grenzwert limi∈I ai und stimmt mit dem gemeinsamen
Grenzwert von (xi )i∈I und (yi )i∈I überein.
Man betrachte zwei Netze (xi )i∈I , (yi )i∈I über derselben gerichteten Menge (I, )
in einem metrischen Raum hX, di, die gegen x bzw. y konvergieren. Dann gilt
lim d(xi , yi ) = d(x, y).
i∈I
(5.9)
Sei (xi )i∈I ein Netz von Punkten xi = (xi,1 , . . . , xi,p ) ∈ R p , und y = (y1 , . . . , y p ) ∈
R p . Dann gilt limi∈I xi = y bezüglich einer der Metriken d1 , d2 oder d∞ genau
dann, wenn
lim xi,k = yk für alle k = 1, . . . , p .
(5.10)
i∈I
Sei hX, dX i ein metrischer Raum, D ⊆ X, z ein Häufungspunkt von D und auf
D \ {z} definiert als x y : ⇐⇒ dX (x, z) ≥ dX (y, z) wie in Beispiel 5.3.2, (iii).
5.3.9 Lemma. Die gerichtete Menge (D \ {z}, ) gestattet Teilfolgen.
Ist hY, dY i ein weiterer metrischer Raum und f : D → Y eine Abbildung, so gilt
limt∈D\{z} f (t) = y genau dann, wenn
∀ǫ > 0 ∃δ > 0 : dY ( f (t), y) < ǫ, ∀t ∈ D \ {z}, dX (t, z) < δ.
(5.11)
Außerdem gilt limt∈D\{z} f (t) = y genau dann, wenn limn→∞ f (tn ) = y für alle gegen z
konvergente Folgen (tn )n∈N aus D \ {z}.
Beweis. Laut Definition der Konvergenz eines Netzes gilt limt∈D\{z} f (t) = y genau
dann, wenn
∀ǫ > 0 ∃t0 ∈ D \ {z} : dY ( f (t), y) < ǫ, ∀t ∈ D \ {z}, dX (t, z) ≤ dX (t0 , z).
(5.12)
Um daraus (5.11) abzuleiten, setzen wir bei gegebenen ǫ > 0, δ = dX (t0 , z), wobei t0
wie in (5.12) ist. Nun folgt für t ∈ D \ {z}, dX (t, z) < δ = dX (t0 , z) wegen (5.12), dass
dY ( f (t), y) < ǫ.
Für die Umkehrung sei ǫ > 0 und δ > 0 wie in (5.11). Da z ein Häufungspunkt von
D ist, gibt es ein t0 ∈ D \ {z} ∩ Uδ (z). Ist nun t ∈ D \ {z}, dX (t, z) ≤ dX (t0 , z) < δ, so folgt
dY ( f (t), y) < ǫ.
Ist (tn )n∈N irgendeine Folge aus D \ {z} mit tn → z für n → ∞ - nach Lemma
5.1.13 gibt es eine solche - so ist J = {tn : n ∈ N} eine abzählbare Teilmenge von
D \ {z} mit der Eigenschaft, dass bei gegebenen t ∈ D \ {z} sicherlich tn t, d.h.
dX (tn , z) ≤ dX (t, z) (> 0), wenn n nur hinreichend groß ist. Also gestattet (D \ {z}, )
Teilfolgen (vgl. Definition 5.3.7).
Die letzte Aussage folgt aus Lemma 5.3.8 wenn wir zeigen können, dass ( f (tn ))n∈N
genau dann eine Teilfolge von ( f (t))t∈D\{z} ist, wenn tn → z.
Zunächst sei ( f (tn ))n∈N eine Teilfolge im Sinne von Definition 5.3.5. Zu gegebenen
δ > 0 gibt es ein t0 ∈ D \ {z} mit dX (t, z) < δ, weil z Häufungspunkt von D ist.
Gemäß Definition 5.3.5 gibt es ein n0 ∈ N, sodass tn t, wenn nur n ≥ n0 . Also folgt
dX (tn , z) ≤ dX (t, z) = δ, n ≥ n0 , und weil δ > 0 beliebig war, tn → z, n → ∞.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
114
Ist umgekehrt tn → z, n → ∞, und ist t ∈ D \ {z}, so gibt wegen tn → z ein n0 ∈ N,
sodass dX (tn , z) ≤ dX (t, z) (> 0) für alle n ≥ n0 . Das bedeutet aber tn t für n ≥ n0 .
Somit ist ( f (tn ))n∈N eine Teilfolge im Sinne von Definition 5.3.5.
❑
5.3.10 Definition. Konvergiert obiges Netz, so schreiben wir für den Grenzwert auch
lim f (t) := lim f (t),
t→z
(5.13)
t∈D\{z}
und nennen ihn Grenzwert der Funktion f für t → z.
5.3.11 Beispiel. Als Beispiel wollen wir
lim
t→0
1−
√
1 − t2
t2
√
2
berechnen, wobei das als der Limes limt∈(−1,1)\{0} 1− t21−t mit der gerichteten Menge
((−1, 1) \ {0}, ) wie im vorigen
√ verstehen ist.
√ Beispiel zu
Aus 1 − (1 − t2 ) = (1 − 1 − t2 )(1 + 1 − t2 ) folgt wegen der für Netze gültigen
Rechenregeln
√
1 − 1 − t2
1 − (1 − t2 )
=
lim
= lim
√
2
t→0
t→0 t2 (1 +
t
1 − t2 )
= lim
t→0
1
1
=
.
√
√
2
1+ 1−t
1 + limt→0 1 − t2
p
Nun ist aber wegen der für Folgen gültigen Rechenregeln limn→∞ √ 1 − tn2 = 1 für jede
gegen 0 konvergente Folge (tn )n∈N . Aus Lemma 5.3.9 folgt limt→0 1 − t2 = 1, und der
zu berechnende Grenzwert ist 12 .
5.3.12 Bemerkung. Ist t0 ∈ D \ {z}, so wissen wir aus (5.3), dass ( f (t))t∈D\{z} genau
dann konvergiert, wenn das Netz ( f (t))t∈D\{z}, tt0 = ( f (t))t∈D∩Kδ (z)\{z} mit δ = dX (z, t0 )
konvergiert. Das bedeutet, dass der Grenzwert (5.13) eigentlich nur von f auf einer
beliebig kleinen δ-Kugel um z abhängt.
√
2
5.3.13 Beispiel. Auf Beispiel 5.3.11 angewandt bedeutet das, dass auch 1− t21−t gegen
1
2 für t → 0 konvergiert, wenn man nicht t ∈ (−1, 1) \ {0} sondern zum Beispiel t ∈
(− 81 , 81 ) \ {0} laufen lässt.
5.3.14 Fakta.
1. Die Schreibweise limt→0 f (t) = x aus Definition 5.3.10 besagt, dass der Funktionswert f (t) beliebig nahe an x herankommt, wenn das Argument t nur hinreichend nahe an 0 ist. Oft ist man in der Situation, dass diese Annäherung nur von
einer Seite stattfindet.
√
Man betrachte etwa die Funktion t 7→ t für t → 0. Für negative Werte von
t macht dieser Ausdruck gar keinen Sinn (zumindest wenn wir reelle Wurzeln
suchen).
Hat man also a, b ∈ R, a < b, und eine Funktion f (t), t ∈ [a, b), so setzt man
D := [a, b) und definiert s t :⇔ |s − b| ≥ |t − b|. Wegen der Gestalt unserer
Menge D gilt x y ⇐⇒ x ≤ y. Dann ist limt∈D f (t) = x äquivalent zu
∀ǫ > 0 ∃δ > 0 : dY ( f (t), x) < ǫ, ∀t ∈ [a, b), b − t < δ .
5.3. FOLGEN UND NETZE
115
Man schreibt dafür auch limt→b− f (t) = x und spricht von dem linksseitigen
Grenzwert.
Die gerichtete Menge ([a, b), ) gestattet ebenfalls Teilfolgen, wobei ( f (tn ))n∈N
genau dann eine Teilfolge von ( f (t))t∈[a,b) ist, wenn (tn )n∈N eine gegen b konvergente Folge aus [a, b) ist. Also gilt limt→b− f (t) = x genau dann, wenn
limn→∞ f (tn ) = x für alle gegen b konvergente Folgen (tn )n∈N aus [a, b).
2. Analog definiert man den rechtsseitigen Grenzwert limt→a+ f (t) = x, wenn f
eine Funktion auf D := (a, b] ist. Dann ist limt∈D f (t) = x äquivalent zu
∀ǫ > 0 ∃δ > 0 : dY ( f (t), x) < ǫ, ∀t ∈ (a, b], t − a < δ .
Diese Konvergenz lässt sich auch dadurch charakterisieren, dass limn→∞ f (tn ) =
x für alle gegen a konvergente Folgen (tn )n∈N aus (a, b].
3. Sind a, b, c ∈ R, a < b < c, und ist f : [a, b) ∪ (b, c] → Y eine Funktion. Nun
gilt
y = lim f (t) ⇔ y = lim f (t) und y = lim f (t).
(5.14)
t→b
t→b−
t→b+
Um das einzusehen sei zunächst y = limt→b f (t). Also konvergiert das Netz
( f (t))t∈[a,b)∪(b,c] gegen y. Da alle drei Mengen [a, b) ∪ (b, c], [a, b) und (b, c] so
gerichtet sind, dass t1 t2 ⇔ d2 (t1 , b) ≥ d2 (t2 , b), sind ( f (t))t∈[a,b) und ( f (t))t∈(b,c]
Teilnetze von ( f (t))t∈[a,b)∪(b,c] , und konvergieren daher ebenfalls gegen y (vgl.
Bemerkung 5.3.6).
Sei nun umgekehrt limt→b− f (t) = y = limt→b+ f (t) und ǫ > 0. Es gibt somit
ein s1 ∈ [a, b) und ein t1 ∈ (b, c], sodass s ∈ [a, b), d2 (s, b) ≤ d2 (s1 , b) ⇒
dY ( f (s), y) < ǫ und t ∈ (b, c], d2 (t, b) ≤ d2 (t1 , b) ⇒ dY ( f (t), y) < ǫ.
Setze τ1 = s1 , wenn d2 (s1 , b) ≤ d2 (t1 , b), und τ1 = t1 , wenn d2 (t1 , b) < d2 (s1 , b).
Ist τ ∈ [a, b) ∪(b, c] mit d2 (τ, b) ≤ d2 (τ1 , b) = min(d2 (s1 , b), d2(t1 , b)), so folgt im
Falle τ ∈ [a, b) wegen d2 (τ, b) ≤ d2 (s1 , b), dass dY ( f (τ), y) < ǫ. Genauso folgt im
Falle τ ∈ (b, c] wegen d2 (τ, b) ≤ d2 (t1 , b), dass dY ( f (τ), y) < ǫ. Also konvergiert
( f (t))t∈[a,b)∪(b,c] gegen y
4. Ist f z.B. eine auf (a, +∞) definierte Funktion, und versieht man (a, +∞) mit der
Relation ≤, so erhält man ebenfalls eine gerichtete Menge. Für den möglichen
Grenzwert x := limt∈(a,+∞) f (t) schreibt man auch limt→+∞ f (t).
Die hier zugrunde liegende gerichtete Menge gestattet auch Teilfolgen, wobei
( f (tn ))n∈N genau dann eine solche ist, wenn tn → +∞ für n → ∞.
Entsprechend gibt es Grenzwerte für t → −∞.
5.3.15 Beispiel. Sei f : (1, +∞) → R, z.B. f (t) = t−3 . Um limt→+∞ f (t) auszurechnen ist es oft zielführend, das Netz ( f (t))t∈(1,+∞) als Teilnetz (g( 1t ))t∈(1,+∞) des Netzes
(g(s)) s∈(0,1) zu betrachten, wobei g(s) = f ( 1s ). Die Menge (0, 1) ist dabei so gerichtet,
dass s1 s2 :⇔ s1 ≥ s2 .
Dass (g( 1t ))t∈(1,+∞) ein Teilnetze von (g(s)) s∈(0,1) ist, gilt, da zu vorgegebenen s ∈
(0, 1) es ein t0 ∈ (1, +∞) gibt - z.B. t0 = 1s - sodass t ≥ t0 ⇒ 1t ≤ s (vgl. Definition
5.3.5). Man sieht damit, dass etwa
lim t−3 = lim s3 = 0.
t→+∞
s→0+
Statt der Funktion t 7→ 1t kann man Entsprechendes mit anderen bijektiven und monotonen Funktionen von einem Intervall auf ein anderes machen.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
116
5.3.16 Beispiel. Man betrachte die Menge I = C\{0} gerichtet durch z w ⇔ |z| ≤ |w|.
Für limz∈I f (z) = a schreibt man dann auch lim|z|→∞ f (z) = a.
Zum Beispiel sieht man leicht ein, dass lim|z|→∞ 1z = 0 und mit den Rechenregeln
(a0 , . . . , an ∈ C)
lim an + an−1 z−1 + . . . + a0 z−n = an .
|z|→∞
5.3.17 Bemerkung. Genauso wie für Folgen kann man definieren, was es heißt, dass
ein reellwertiges Netz (xi )i∈I gegen ±∞ konvergiert:
∀M > 0 ∃i0 ∈ I : ±xi > M für alle i i0 .
Es gelten sinngemäß die Aussagen in Satz 3.6.2 auch für Netze.
5.3.18 Beispiel. Ist I wie in Beispiel 5.3.16, so gilt für a0 , . . . , an ∈ C, an , 0,
lim |an zn + an−1 zn−1 + . . . + a0 | = lim |zn | · |an + an−1 z−1 + . . . + a0 z−n | = +∞.
|z|→∞
|z|→∞
Kapitel 6
Reelle und komplexe
Funktionen
6.1 Stetigkeit
Sei f eine Funktion und sei x ein Punkt ihres Definitionsbereiches. Sagen wir dass diese Funktion stetig an der Stelle x ist, so verstehen wir darunter anschaulich, dass der
Funktionswert f (t) sich beliebig wenig von f (x) unterscheidet, wenn nur t hinreichend
nahe bei x ist. Wir sehen, dass man diesem Begriff Sinn geben kann, wenn man verlangt, dass Definitionsbereich und Wertebereich der betrachteten Funktion metrische
Räume sind.
6.1.1 Definition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei f :
D → Y eine Funktion. Weiters sei x ∈ D. Dann heißt f stetig an der Stelle x, wenn gilt
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ ,
oder äquivalent
∀ǫ > 0 ∃δ > 0 : f (Uδ (x) ∩ D) ⊆ Uǫ ( f (x)) ,
Ist f an jeder Stelle x ihres Definitionsbereiches D stetig, so heißt f stetig auf D.
f (x) + ǫ
f (x)
f (x) − ǫ
x−δ
x
x+δ
Abbildung 6.1: ǫ-δ Kriterium für f : I (⊆ R) → R
117
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
118
6.1.2 Beispiel.
Sei f : X → Y eine konstante Funktion, d.h. f (x) := y0 , x ∈ X. Dann ist f stetig,
denn ist x ∈ X und ǫ > 0, so wähle etwa δ = 1. Für alle t ∈ X mit dX (t, x) < δ gilt
sicher
dY ( f (t), f (x)) = dY (y0 , y0 ) = 0 < ǫ .
Die identische Abbildung, f (x) := idX (x) = x, x ∈ X, ist stetig. Um das einzusehen seien x ∈ X und ǫ > 0 gegeben. Mit δ = ǫ folgt für alle t ∈ X, dX (t, x) < δ,
dass
dX ( f (t), f (x)) = dX (t, x) < δ = ǫ .
Allgemeiner gilt, dass jede isometrische1 Abbildung f : X → Y stetig ist, da zu
x ∈ X und ǫ > 0 mit δ = ǫ wieder für alle t ∈ X, dX (t, x) < δ
dY ( f (t), f (x)) = dX (t, x) < δ = ǫ .
Die Abbildung z 7→ z̄ als Funktion auf C ist isometrisch und daher stetig.
Sei f : C → R die Funktion z 7→ |z|. Dann ist f stetig. Denn bei gegebenen
z ∈ C und ǫ > 0 wähle δ := ǫ. Für alle w ∈ C mit |w − z| < δ gilt wegen der
Dreiecksungleichung nach unten
| f (w) − f (z)| = |w| − |z| ≤ |w − z| < δ = ǫ .
p
Sei π j : R p → R, j = 1, . . . , p die Funktion (xi )i=1
7→ x j . Diese ist überall stetig,
p
p
p
denn bei gegebenen (xi )i=1 ∈ R und ǫ > 0 wähle δ = ǫ. Für alle (ti )i=1
∈ R p mit
p
p
d2 ((xi )i=1 , (ti )i=1 ) < δ gilt
p
p
|x j − t j | ≤ d2 ((xi )i=1
, (ti )i=1
) < ǫ.
Sei f : R → R die Funktion f (x) := [x]. Dabei bezeichnet [x] die größte ganze
Zahl, die ≤ x ist, und sie wird als Gaußklammer bezeichnet. Diese Funktion ist
stetig an jeder Stelle x ∈ R \ Z, und nicht stetig an jeder Stelle x ∈ Z:
Ist x ∈ R \ Z, und ist ǫ > 0 gegeben, so wähle δ > 0, sodass das Intervall
(x − δ, x + δ) keine ganze Zahl enthält. Dann ist f auf (x − δ, x + δ) konstant, und
somit gilt
| f (t) − f (x)| = 0 < ǫ, falls |t − x| < δ .
Ist dagegen x ∈ Z, so enthält das Intervall (x − δ, x + δ) für jedes δ > 0 sowohl
Zahlen t, die größer als x sind, als auch Zahlen t, die kleiner als x sind. Nun ist
aber für t− < x und t+ > x sicher f (t− ) < f (t+ ) und daher, da ja beide Werte
ganze Zahlen sind, | f (t− ) − f (t+ )| ≥ 1. Wir können also für kein ǫ mit 0 < ǫ ≤ 1
ein δ finden, das der geforderten Bedingung genügt.
6.1.3 Fakta. Seien hX, dX i und hY, dY i metrische Räume, x ∈ D ⊆ X, und sei f : D → Y
eine Funktion.
1. Unmittelbar aus der Definition der Stetigkeit folgt, dass die Stetigkeit bei x eine
lokale Eigenschaft ist, d.h. f ist bei x stetig genau dann, wenn es ein ρ > 0 gibt,
sodass f |Uρ (x)∩D stetig bei x ist.
1 Isometrisch
bedeutet dY ( f (x), f (y)) = dX (x, y).
6.1. STETIGKEIT
119
2. Ist x ein isolierter Punkt von D, dann ist f immer stetig bei x. Ist nämlich δ > 0
so, dass Uδ (x)∩D = {x}, so folgt f (Uδ (x)∩D) = { f (x)} ⊆ Uǫ ( f (x)) für beliebiges
ǫ > 0.
3. Ist f : D → Y stetig auf D, so sicherlich auch f |C auf jeder Teilmenge C ⊆ D.
Also sind Einschränkungen stetiger Abbildungen wieder stetig.
Nun wollen wir die Stetigkeit an einer Stelle mit Hilfe verschiedener Grenzwertbegriffe charakterisieren.
6.1.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D →
Y eine Funktion. Ist x ∈ D ein fester Punkt, dann sind äquivalent:
(i) f ist stetig an der Stelle x.
(ii) Ist x kein isolierter Punkt, so gilt limt→x f (t) = f (x), wobei wir diesen Limes
verstehen als Limes des Netzes ( f (t))t∈D\{x} , wo D \ {x} mit der Relation
t u : ⇐⇒ dX (u, x) ≤ dX (t, x)
zu einer gerichteten Menge wird, vgl. Definition 5.3.10.
(iii) Für jede Folge (tn )n∈N aus D \ {x} mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x).
(iv) Für jede Folge (tn )n∈N aus D mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x).
(v) Für jedes Netz (ti )i∈I aus D mit limi∈I ti = x gilt limi∈I f (ti ) = f (x).
Beweis.
(i) ⇐⇒ (ii): Im Falle, dass x ein isolierter Punkt von D ist, wissen wir schon, dass f
bei x stetig ist.
Sei also x nicht isolierter Punkt von D. Die Stetigkeit von f an der Stelle x
bedeutet nach Definition
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ .
Die Beziehung limt→x f (t) = f (x) bedeutet gemäß Definition 5.3.10,
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D \ {x} mit dX (t, x) < δ .
(6.1)
Also sind diese beiden Aussagen äquivalent.
(ii) ⇐⇒ (iii): Das haben wir schon in Lemma 5.3.9 gesehen.
(v) ⇒ (iv) ⇒ (iii): (iv) ist Spezialfall von (v) und genauso (iii) von (iv).
(i) ⇒ (v): Sei ǫ > 0, dann gibt es ein δ > 0 mit f (Uδ (x)) ⊆ Uǫ ( f (x)). Sei nun i0 ∈ I mit
xi ∈ Uδ (x), i i0 . Für diese i folgt f (xi ) ∈ Uǫ ( f (x)), und daraus die behauptete
Grenzwertbeziehung.
❑
Ein immer wieder verwendete Eigenschaft der Stetigkeit folgt unmittelbar aus Proposition 6.1.4, (iii):
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
120
6.1.5 Korollar. Sind f, g : D → Y beide stetig und gilt f (x) = g(x) für alle x in einer
Teilmenge E ⊆ D, so gilt auch f (x) = g(x) für alle x ∈ c(E) ∩ D.
Insbesondere stimmen zwei stetige f und g auf D überein, wenn sie das nur auf
einer dichten Teilmenge E von D tun.
Beweis. Zu x ∈ D ∩ c(E) gibt es eine Folge (xn )n∈N in E ⊆ D, sodass xn → x. Wegen
f (xn ) = g(xn ) und aus der Stetigkeit beider Funktionen folgt
f (x) = lim f (xn ) = lim g(xn ) = g(x).
n→∞
n→∞
❑
Viele stetige Funktionen lassen sich mit Hilfe des nächsten Lemmas als solche
identifizieren.
6.1.6 Lemma. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, E ⊆ Y und f :
D → Y und g : E → Z mit f (D) ⊆ E. Ist f bei x ∈ D und g bei f (x) stetig ist, so ist
g ◦ f : D → Z bei x stetig.
Beweis. Zu ǫ > 0 gibt es wegen der Stetigkeit von g ein δ′ > 0, sodass g(Uδ′ ( f (x)) ∩
E) ⊆ Uǫ (g( f (x))), und wegen der Stetigkeit von f ein δ > 0, sodass f (Uδ (x) ∩ D) ⊆
Uδ′ ( f (x)). Setzt man das zusammen und beachtet, dass auch f (Uδ (x) ∩ D) ⊆ f (D) ⊆ E,
so erhält man
(g ◦ f )(Uδ (x) ∩ D) ⊆ g(Uδ′ ( f (x)) ∩ E) ⊆ Uǫ (g( f (x))).
❑
6.1.7 Beispiel. Aus unseren Rechenregeln für Folgen (Satz 3.3.4) folgern wir mit Hilfe
der Folgencharakterisierung der Stetigkeit (Proposition 6.1.4, (iv)), dass die algebraischen Operationen
(
(
R2 → R
R → R
+:
−:
(x, y) 7→ x + y
x 7→ −x
·:
(
R2 → R
(x, y) 7→ x · y
.−1 :
(
R \ {0} → R \ {0}
x 7→ 1x
stetig sind. Genauso sind die algebraischen Operationen auf C stetig. Hier sind
R, R2 , C, C2 (≃ R4 ) alle der euklidischen Metrik d2 versehen2.
6.1.8 Korollar. Sei hX, di ein metrischer Raum, D ⊆ X, und seien f, g : D → R stetige
Funktionen.
Dann ist auch die Abbildung x 7→ ( f (x), g(x)) von D nach R2 stetig.
Ebenso sind die Abbildungen
x 7→ − f (x), x 7→ f (x) + g(x), x 7→ f (x)g(x)
von D nach R stetig.
2 Diese
Feststellung gilt auch, wenn man d1 oder d∞ hernimmt (vgl. Proposition 3.5.1).
6.1. STETIGKEIT
121
Ist f (x) , 0, x ∈ D, so ist auch x 7→
1
f (x)
von D nach R stetig.
Die selben Aussagen sind wahr, wenn wir R durch C ersetzen.
Beweis. Ist x = limn→∞ xn mit x, xn ∈ D, n ∈ N, so folgt f (xn ) → f (x) und g(xn ) →
g(x). Nach Proposition 3.5.1 folgt ( f (xn ), g(xn )) → ( f (x), g(x)) in R2 . Also ist x 7→
( f (x), g(x)) stetig auf D.
Die anderen Funktionen sind Zusammensetzungen von stetigen Funktionen. Zum
Beispiel ist x 7→ f (x)g(x) die Zusammensetzung von x 7→ ( f (x), g(x)) und (u, v) 7→ uv
(siehe Beispiel 6.1.7).
❑
Eine wiederholte Anwendung von Korollar 6.1.8 ergibt:
p(x)
mit gewissen Polynomen
6.1.9 Beispiel. Sei f eine rationale Funktion, d.h. f (x) = q(x)
p und q mit reellen bzw. komplexen Koeffizienten. Dann ist
f : {x ∈ R bzw. C : q(x) , 0} → R bzw. C
stetig.
Anmerkung: Wem diese Tatsache trivial vorkommt, der versuche zu Fuß“, d.h.
”
durch explizite Angabe einer Zahl δ zu vorgegebenen ǫ und x, zu überprüfen, dass die
Funktion
x3 + x + 1
f (x) =
x2 + 1
auf ihrem Definitionsbereich R stetig ist.
Die folgende mengentheoretisch orientierte Charakterisierung der Stetigkeit einer
Funktion spielt eine wichtige Rolle.
6.1.10 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : X → Y
eine Funktion. Dann sind äquivalent:
(i) f ist stetig.
(ii) Für jede in hY, dY i offene Menge B ist das vollständige Urbild f −1 (B) := {x ∈ X :
f (x) ∈ B} offen in hX, dX i.
(iii) Für jede in hY, dY i abgeschlossene Menge F ist das vollständige Urbild f −1 (F) :=
{x ∈ X : f (x) ∈ F} abgeschlossen in hX, dX i.
Beweis.
(i) ⇒ (ii): Sei B ⊆ Y offen, und sei x ∈ f −1 (B). Da B offen ist und f (x) ∈ B, folgt
Uǫ ( f (x)) ⊆ B für ein ǫ > 0. Wegen der Stetigkeit existiert δ > 0 mit f (Uδ (x)) ⊆
Uǫ ( f (x)) ⊆ B, d.h. mit Uδ (x) ⊆ f −1 (B). Also enthält f −1 (B) mit jedem Punkt
eine ganze δ-Kugel, d.h. f −1 (B) ist offen.
(ii) ⇒ (i): Sei ǫ > 0 und x ∈ X gegeben. Die Menge Uǫ ( f (x)) ist offen, also ist
auch f −1 (Uǫ ( f (x))) offen. Wegen x ∈ f −1 (Uǫ ( f (x))) existiert ein δ > 0, sodass
Uδ (x) ⊆ f −1 (Uǫ ( f (x))). Das heißt aber gerade f (Uδ (x)) ⊆ Uǫ ( f (x)).
(ii) ⇔ (iii): Das folgt sofort aus Proposition 5.1.16 und der Tatsache, dass f −1 (M c ) =
f −1 (M)c .
122
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
❑
6.1.11 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y
eine stetige Funktion. Ist K ⊆ D kompakt, so ist auch f (K) ⊆ Y kompakt.
Beweis. Sei (yn )n∈N eine Teilfolge in f (K), und sei xn ∈ K, sodass f (xn ) = yn . Wegen
der Kompaktheit von K gibt es eine gegen ein x ∈ K konvergente Teilfolge (xn(k) )k∈N
von (xn )n∈N . Aus der Stetigkeit folgt
f (x) = lim f (xn(k) ) = lim yn(k) .
k→∞
k→∞
Also hat (yn )n∈N eine konvergente Teilfolge mit Grenzwert aus f (K). Also ist f (K)
kompakt.
❑
6.1.12 Korollar. Sei f : D → R stetig, und sei K ⊆ D kompakt. Dann ist f auf K
beschränkt und nimmt ein Maximum und ein Minimum an, d.h. es gibt Punkte x+ , x− ∈
K mit
f (x+ ) = max f (x), f (x− ) = min f (x) .
x∈K
x∈K
Insbesondere nimmt jede auf einem reellen Intervall [a, b] definierte und stetige reellwertige Funktion ein Maximum und ein Minimum an.
Beweis. Nach Proposition 6.1.11 ist f (K) ⊆ R kompakt, und wegen Proposition 5.2.11 damit beschränkt und abgeschlossen. Wegen Beispiel 5.1.14 ist
sup f (K) = max f (K) = f (x+ ) für irgendein x+ ∈ K. Genauso zeigt man die Aussage
für das Minimum.
❑
6.1.13 Proposition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X kompakt.
Ist f : D → Y stetig und injektiv, so ist es auch f −1 : ran( f ) → D.
Beweis. Wäre f −1 bei einem y nicht stetig, so gäbe es eine Folge (yn )n∈N in ran f mit
yn → y, aber xn = f −1 (yn ) 6→ f −1 (y). Es gibt dann eine Teilfolge (xn(m) )m∈N und ein
ǫ > 0, sodass (vgl. Bemerkung 3.2.11)
dX ( f −1 (y), xn(m) ) ≥ ǫ, m ∈ N.
Wegen der Kompaktheit hat aber (xn(m) )m∈N seinerseits eine Teilfolge (xn(m(l)) )l∈N mit
xn(m(l)) → x, l → ∞ für ein x in D. Nun ist aber wegen dX ( f −1 (y), xn(m(l)) ) ≥ ǫ auch
dX ( f −1 (y), x) ≥ ǫ und somit x , f −1 (y). Die Injektivität impliziert f (x) , y. Im Widerspruch dazu gilt
f (x) = lim f (xn(m(l)) ) = lim yn(m(l)) = y.
l→∞
l→∞
❑
6.2 Der Zwischenwertsatz
Sei I ⊆ R ein Intervall. Die Anschauung von Stetigkeit legt nahe, dass mit I auch f (I)
ein Intervall ist.
6.2. DER ZWISCHENWERTSATZ
123
6.2.1 Bemerkung. Man überlegt sich leicht, dass I ⊆ R genau dann ein Intervall ist,
d.h. genau dann eine der Formen (a, b ∈ R, a < b,)
∅, (a, b), [a, b], (a, b], [a, b), (a, +∞), (−∞, a), [a, +∞), (−∞, a], R,
hat, wenn für I gilt
∀x, y ∈ I, x < y ⇒ [x, y] ⊆ I.
Um zu rechtfertigen, dass f (I) wieder ein Intervall ist, werden wir eine weitere
charakteristische Eigenschaft von Intervallen herleiten.
6.2.2 Definition. Dazu nennen wir eine Teilmenge E eines metrischen Raumes zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen
schreiben kann. Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅.
6.2.3 Proposition. Sei I ⊆ R. Dann ist I genau dann ein Intervall, wenn I zusammenhängend ist.
Beweis. Ist I = ∅, so ist I (vgl. Bemerkung 6.2.1) ein Intervall, und I ist auch zusammenhängend, wie man sofort überprüft. Also sei I , ∅.
Angenommen es existieren x, y ∈ I, x < y, sodass [x, y] * I. Wähle z ∈ [x, y] \ I
und setze
A := (−∞, z] ∩ I, B := [z, +∞) ∩ I.
Dann sind A und B disjunkt, und jeder Häufungspunkt t von A ist in (−∞, z], da diese
Menge ja abgeschlossen ist. Wegen z < I folgt t < B und damit c(A) ∩ B = ∅. Genauso
sieht man A ∩ c(B) = ∅. Also ist I nicht zusammenhängend.
Sei umgekehrt I nicht zusammenhängend. Dann können wir I als A ∪ B mit nichtleeren A, B schreiben, wobei c(A) ∩ B = A ∩ c(B) = ∅. Wähle x ∈ A und y ∈ B, und sei
o.B.d.A. angenommen, dass x < y.
Man betrachte t = sup(A ∩ [x, y]). Insbesondere ist x ≤ t ≤ y. Weiters folgt aus
t ∈ c(A ∩ [x, y]) ⊆ c(A) (siehe Beispiel 3.2.6), dass t < B, und somit x ≤ t < y.
Wir wollen nun [x, y] * I zeigen, was im Fall t < A, sofort aus t ∈ [x, y] \ (A ∪ B) =
[x, y] \ I folgt.
Im Fall t ∈ A, folgt aus t < c(B) die Existenz einer ǫ-Kugel (t − ǫ, t + ǫ), sodass
(t − ǫ, t + ǫ) ∩ B = ∅,
wobei wir ǫ > 0 noch dazu so klein wählen, dass t + ǫ < y.
Somit ist t + 2ǫ < B, und wegen x < t + 2ǫ < y und t = sup(A ∩ [x, y]) kann t +
auch nicht in A liegen. Also t + 2ǫ ∈ [x, y] \ (A ∪ B) = [x, y] \ I und daher [x, y] * I.
ǫ
2
❑
6.2.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D →
Y eine stetige Funktion. Ist E ⊆ D zusammenhängend, so auch f (E).
Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A∪B mit
A, B , ∅ und c(A)∩B = A∩c(B) = ∅. Für die nichtleeren Mengen E∩ f −1 (A), E∩ f −1 (B)
folgt
E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅.
Jedes x ∈ c E ∩ f −1 (A) ∩ E ∩ f −1 (B) ist insbesondere Häufungspunkt von E ∩ f −1 (A).
Somit gibt es eine gegen x konvergente Folge (xn )n∈N in E ∩ f −1 (A) \ {x}. Es folgt
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
124
limn→∞ f (xn ) = f (x), und somit f (x) ∈ c f (E ∩ f −1 (A)) ⊆ c(A). Andererseits ist
−1
f (x) ∈ f E ∩ f (B) ⊆ B im Widerspruch zu c(A) ∩ B = ∅.
Also kann nur c E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅. Entsprechend gilt
−1
−1
c E ∩ f (B) ∩ E ∩ f (A) = ∅, und E wäre somit nicht zusammenhängend,
was unserer Annahme widerspricht.
❑
6.2.5 Beispiel. Wir werden später sehen, dass die Einheitskreislinie T = {z ∈ C :
|z| = 1} als das Bild von [0, 2π) unter der stetigen Abbildung x 7→ exp(ix) geschrieben
werden kann. Nach Proposition 6.2.4 identifizieren wir damit T als zusammenhängend.
6.2.6 Korollar (Zwischenwertsatz). Sei I ⊆ D ein Intervall und f : I → R stetig. Dann
ist auch f (I) ein Intervall. Ist insbesondere c ∈ R mit
(−∞ ≤) inf f (I) < c < sup f (I) (≤ +∞),
so existiert ein Punkt x ∈ I mit f (x) = c.
Insbesondere gilt: Ist f stetig auf [a, b] und c eine Zahl zwischen f (a) und f (b), dh.
f (a) < c < f (b) oder f (b) < c < f (a), so existiert ein Punkt x ∈ (a, b) mit f (x) = c.
Beweis. Mit I ist nach Proposition 6.2.4 auch f (I) ⊆ R zusammenhängend,
und somit nach Proposition 6.2.3 ein Intervall. Wählt man α, β ∈ f (I) mit
inf x∈I f (x) < α < c < β < sup x∈I f (x), dann enthält f (I) das ganze Intervall
[α, β] (siehe Bemerkung 6.2.1). Also gibt es ein x ∈ I mit f (x) = c.
❑
sup f (I)
f (I)
f (x) = c
inf f (I)
x
I
Abbildung 6.2: Veranschaulichung des Zwischenwertsatzes
6.3 Gleichmäßige Stetigkeit
Die Definition der Stetigkeit einer Funktion f : D → Y lautet, in logischen Formeln
angeschrieben,
∀x ∈ D ∀ǫ > 0 ∃δ > 0 : ∀t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ .
(6.2)
6.3. GLEICHMÄSSIGE STETIGKEIT
125
Die Zahl δ, die es zu jedem ǫ geben muss, hängt im Allgemeinen nicht nur von ǫ,
sondern auch von der Stelle x ab.
6.3.1 Beispiel. Betrachte die Funktion f (x) = x−1 : R+ → R+ . Ist x ∈ R und ǫ > 0
gegeben, so berechnet man:
1
δ
1
−
=
.
x x + δ (x + δ)x
2
ǫx
Damit dieser Ausdruck ≤ ǫ ist, darf δ höchstens 1−ǫ
x sein. Man sieht, dass diese größt
mögliche Wahl von δ immer kleiner wird, je kleiner x wird, und tatsächlich für x → 0
ebenfalls gegen 0 strebt. Man kann in diesem Beispiel also tatsächlich zu gegebenem ǫ
kein δ finden das von x unabhängig ist.
Sollte eine Funktion nun so beschaffen sein, dass dieses Phänomen nicht auftritt,
sollte also zu gegebenem ǫ stets ein δ existieren, welches für alle x funktioniert, so
nennt man die Funktion gleichmäßig stetig.
6.3.2 Definition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y eine
Funktion. Dann heißt f gleichmäßig stetig, wenn gilt
∀ǫ > 0 ∃δ > 0 ∀x, t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ .
Vergleicht man diese Definition mit der Formel (6.2), so sieht man, dass man hier
den Allquantor ∀x ∈ X und den Existenzquantor ∃δ > 0 vertauscht hat. Dies wird also
nicht den gleichen, sondern einen stärkeren Begriff liefern.
Ist f gleichmäßig stetig, so ist f auch stetig. Wie wir am obigen Beispiel sehen, gilt
die Umkehrung nicht. Interessant in diesem Zusammenhang ist nun der folgende Satz.
6.3.3 Satz. Seien hX, dX i und hY, dY i metrische Räume, und D ⊆ X kompakt. Dann ist
jede stetige Funktion f : D → Y sogar gleichmäßig stetig.
Beweis. Nehme man das Gegenteil an. Dann gibt es ein ǫ > 0, sodass es für alle n ∈ N
Punkte xn , yn ∈ D gibt, sodass dX (xn , yn ) < 1n und dY ( f (xn ), f (yn )) ≥ ǫ.
Die Folgen (xn )n∈N (yn )n∈N haben wegen der Kompaktheit von D Häufungspunkte
x bzw. y. Somit gilt
x = lim xn(k) , y = lim yn(k)
k→∞
k→∞
für Teilfolgen (xn(k) )k∈N und (yn(k) )k∈N . Aus dX (xn(k) , yn(k) ) <
3.2.12, dass
dX (x, y) = lim dX (xn(k) , yn(k) ) = 0,
1
n(k)
folgt mit Lemma
k→∞
also x = y und somit f (x) = f (y). Andererseits folgt aus der Stetigkeit zusammen mit
Lemma 3.3.1 der offensichtliche Widerspruch
dY ( f (x), f (y)) = dY ( lim f (xn(k) ), lim f (yn(k) )) = lim dY ( f (xn(k) ), f (yn(k) )) ≥ ǫ.
k→∞
k→∞
k→∞
❑
6.3.4 Beispiel. Sei E ⊆ R nicht kompakt. Dann gilt:
(i) Es gibt eine auf E stetige Funktion die nicht beschränkt ist.
(ii) Es gibt eine auf E stetige und beschränkte Funktion, die kein Maximum hat.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
126
(iii) Ist E beschränkt, so gibt es eine auf E stetige, aber nicht gleichmäßig stetige
Funktion.
Wir betrachten zuerst den Fall, dass E einen Häufungspunkt x0 hat, der nicht zu E
gehört (dieser Fall tritt sicher immer dann ein, wenn E beschränkt ist, denn dann würde
1
aus abgeschlossen kompakt folgen). Die Funktion x 7→ x−x
ist stetig auf E, aber nicht
0
1
beschränkt. Sie ist auch nicht gleichmäßig stetig. Die Funktion f (x) = 1+(x−x
2 ist
0)
stetig auf E und beschränkt (0 < f (x) < 1). Offenbar gilt lim x→x0 f (x0 ) = 1, also
supx∈E f (x) = 1.
Betrachte nun den Fall, dass E nicht beschränkt ist. (i) folgt mit f (x) = x, (ii) mit
x2
f (x) = 1+x
2.
In (iii) kann man die Forderung, dass E beschränkt ist, nicht ganz weglassen. Zum
Beispiel betrachte E = Z. Dann ist jede Funktion auf E gleichmäßig stetig, denn man
kann stets irgendein δ < 1 wählen, z.B. also δ = 21 ).
6.3.5 Satz. Seien hX, dX i und hY, dY i metrische Räume, wobei hY, dY i sogar vollständig ist. Weiters sei D ⊆ X und f : D → Y
gleichmäßig stetig.
Dann existiert eine eindeutige gleichmäßig stetige Fortsetzung F : c(D) → Y.
Beweis.
Sei (xn )n∈N eine Cauchy-Folge von Punkten aus D. Zu ǫ > 0 wähle δ > 0 so, dass
dY f (y), f (z) < ǫ für dX (y, z) < δ .
(6.3)
Weiters wähle N ∈ N so, dass dX (xn , xm ) < δ für alle n, m ≥ N. Dann folgt
dY f (xn ), f (xm ) < ǫ, n, m ≥ N,
d.h. ( f (xn ))n∈N ist eine Cauchy-Folge in Y. Somit existiert der Limes limn→∞ f (xn ).
Sei x ∈ X, und seien (xn )n∈N und (yn )n∈N zwei Folgen von Punkten in D mit xn → x sowie yn → x. Ist ǫ > 0
gegeben und δ > 0 wie in (6.3), so wähle N ∈ N mit
dX (xn , x) <
δ
δ
, dX (yn , x) < , n ≥ N.
2
2
Insbesondere gilt dX (xn , yn ) ≤ dX (xn , x) + dX (yn , x) < δ für alle n ≥ N. Es folgt dY ( f (xn ), f (yn )) < ǫ, n ≥ N, und
daher
dY lim f (xn ), lim f (yn ) ≤ ǫ.
n→∞
n→∞
Da ǫ > 0 beliebig war, folgt limn→∞ f (xn ) = limn→∞ f (yn ).
Zu jedem Sx ∈ c(D) gibt es definitionsgemäß eine Folge (xn )n∈N mit xn → x. Definiere
F(x) := lim f (xn ).
n→∞
Wegen der obigen Punkte ist F eine wohldefinierte Funktion von X nach Y.
Ist x ∈ D, so betrachte die konstante Folge xn := x. Dann gilt sicher xn → x und f (xn ) → f (x), also F(x) = f (x).
Somit ist F eine Fortsetzung von f .
Es bleibt zu zeigen, dass F gleichmäßig stetig ist. Sei dazu ǫ > 0 gegeben. Wähle δ > 0 so, dass dY ( f (x), f (y)) <
für x, y ∈ D mit dX (x, y) < δ.
ǫ
3
Seien nun x, y ∈ c(D) mit dX (x, y) < 3δ . Wähle xn , yn ∈ D mit xn → x, yn → y und N ∈ N mit
dX (xn , x) <
δ
δ
ǫ
ǫ
, dX (yn , y) < , dY (F(x), f (xn )) < , dY (F(y), f (yn )) < , n ≥ N .
3
3
3
3
Dann gilt dX (xn , yn ) < δ und daher dY ( f (xn ), f (yn )) < 3ǫ . Somit erhalten wir dY (F(x), F(y)) < ǫ.
Die Eindeutigkeit folgt sofort aus Korollar 6.1.5.
❑
6.4. UNSTETIGKEITSSTELLEN
127
6.4 Unstetigkeitsstellen
Sei,hY, dY i ein metrischer Raum, und sei f : (a, b) → Y mit a, b ∈ R, a < b. Weiters
sei x ∈ (a, b).
f ist gemäß Proposition 6.1.4 genau dann bei x stetig, wenn f (x) = limt→x f (t).
In (5.14) haben wir gesehen, dass f (x) = limt→x f (t) genau dann, wenn die Grenzwerte f (x−) := limt→x− f (t) und f (x+) := limt→x+ f (t) existieren und beide mit f (x)
übereinstimmen.
6.4.1 Bemerkung. Gilt zumindest f (x) = f (x−) ( f (x) = f (x+)), so spricht man von
Linksstetigkeit bzw. linksseitiger Stetigkeit (Rechtsstetigkeit bzw. rechtsseitiger Stetigkeit) der Funktion f bei x. Klarerweise ist f bei x stetig, wenn f bei x sowohl links- als
auch rechtsstetig ist.
Ist f nicht stetig, so unterscheidet man folgende Fälle.
6.4.2 Definition. Sei f unstetig bei x.
Man sagt, f habe eine Unstetigkeit 1. Art bei x, falls f (x−) := limt→x− f (t) und
f (x+) := limt→x+ f (t) existieren, aber nicht beide gleich f (x) sind.
Für Unstetigkeiten 1. Art gibt es zwei Möglichkeiten. Entweder f (x−) , f (x+),
in welchem Fall man von einer Sprungstelle spricht, oder f (x−) = f (x+) , f (x).
Dann spricht man von einer hebbaren Unstetigkeit.
Liegt keine Unstetigkeit 1. Art vor, so spricht man von einer Unstetigkeit 2. Art.
Den Begriff hebbar“hat man deswegen gewählt, weil man dann f an der Stelle x
”
so abändern kann, dass die neue Funktion bei x stetig ist.
6.4.3 Beispiel.
Betrachte die Funktion



1 , x rational
f (x) = 

0 , x irrational
Diese Funktion hat an jeder Stelle x eine Unstetigkeit 2.Art.
Sei



 x , x rational
g(x) = 

0 , x irrational
g ist stetig bei 0, hat aber an jeder Stelle x , 0 eine Unstetigkeit 2.Art. Es
gibt nämlich eine Folge (rn )n∈N aus Q ∩ (x, +∞) und eine Folge (xn )n∈N aus
R \ Q ∩ (x, +∞), die beide gegen x konvergieren (vgl. Beispiel 3.2.6). Nun ist
aber f (xn ) = 0 → 0 und f (rn ) = rn → x für n → ∞. Nach (5.14) kann somit limt→x+ f (t) nicht existieren. Ähnlich zeigt man, dass auch limt→x− f (t) nicht
extistiert.
Sei
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
128
h



x+2




h(x) = 
−x − 2




x + 2
2
, x ∈ (−3, −2)
, x ∈ [−2, 0)
, x ∈ [0, 1)
1
−3
−2
0
−1
1
−1
−2
Dann ist h stetig auf (−3, 1) \ {0} und hat bei 0 eine Sprungstelle.
Wir setzen den Begriff der Sinusfunktion (aus der Schule) voraus. Sei
f



sin 1x
f (x) = 

0
, x>0
, x≤0
0
1
π
Dann ist f stetig auf R \ {0} und hat eine Unstetigkeit 2.Art bei 0.
Es können also im Allgemeinen alle möglichen Varianten von Unstetigkeiten auftreten.
Thematisch dazu passend wollen wir uns der Fortsetzbarkeit von stetigen Funktionen auf um einen Punkt größere Mengen zuwenden.
6.4.4 Bemerkung. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei
f : D → Y eine stetige Funktion. Sei weiters x ∈ X \ D.
Wir fragen uns, ob wir eine Fortsetzung f˜ : D ∪ {x} → Y von f finden können, die
die Eigenschaft stetig zu sein beibehält.
Wenn x kein Häufungspunkt von D ist, so sieht man leicht, dass x ein isolierter
Punkt von D ∪ {x} ist, und daher jede Fortsetzung f˜ stetig ist.
Sei also x ein Häufungspunkt von D. Gibt es eine stetige Fortsetzung f˜, so muss
nach Proposition 6.1.4 f˜(x) = limt→x f (t). Existiert umgekehrt limt→x f (t), so setze
man


limt→x f (t) , s = x
˜f (s) = 
.


 f (s)
, s∈D
Klarerweise ist f˜ eine Fortsetzung von f . Wegen Proposition 6.1.4, (ii), ist f˜ bei x
stetig. Andererseits ist wegen Fakta 6.1.3 mit f auch f˜ bei allen t ∈ D stetig. Also ist f˜
eine auf D ∪ {x} stetige Fortsetzung.
6.5. MONOTONE FUNKTIONEN
129
6.4.5 Beispiel. Seien a, b, c ∈ R, c ≤ 0, D = (−∞, 0)∪(0, +∞) und f : D → R definiert
b
durch f (x) = a für x < 0 und f (x) = x−c
für x > 0. Dann gilt lim x→0− f (t) = a und



−b
, b , 0, c < 0



 c
lim f (t) = 
sgn(b) · ∞ , b , 0, c = 0 .


x→0+


0
, b=0
Aus Bemerkung 6.4.4 wissen wir, dass sich f genau dann zu einer Funktion f˜ : R →
R fortsetzen lässt, wenn limt→0 f (t) existiert. Nach (5.14) existiert dieser Grenzwert
genau dann, wenn a = b = 0 oder b , 0, c , 0, a = − bc . Dabei muss f˜(0) = 0 bzw.
f˜(0) = a = − bc .
6.5 Monotone Funktionen
6.5.1 Definition. Man sagt, dass für ein Intervall I ⊆ R, eine Funktion f : I → R
monoton wachsend ist, falls
x < y ⇒ f (x) ≤ f (y) .
Gilt sogar x < y ⇒ f (x) < f (y), so sagt man f sei streng monoton wachsend.
Analog sagt man, f sei monoton fallend, falls x < y ⇒ f (x) ≥ f (y). Sollte x < y
sogar f (x) > f (y) implizieren, so spricht von einer streng monoton fallenden Funktion.
Klarerweise ist eine streng monotone Funktion stets injektiv. Nun kommen wir zur
Diskussion der Unstetigkeitsstellen monotoner Funktionen.
6.5.2 Proposition. Sei f monoton wachsend auf einem reellen Intervall I, wobei a, b ∈
R ∪ {−∞, +∞}, a < b die Intervallränder bezeichnet.
Dann existieren für jeden Punkt x ∈ (a, b) sowohl f (x−) := lim s→x− f (s) als auch
f (x+) := limt→x+ f (t), wobei3
sup f (s) = f (x−) ≤ f (x) ≤ f (x+) = inf f (t).
(6.4)
x<t<b
a<s<x
Ist x = a ∈ I (x = b ∈ I), so gilt die rechte (linke) Seite von (6.4). Weiters gilt für x < y
immer f (x+) < f (y−).
Analoge Aussagen gelten für monoton fallende Funktionen.
Beweis. Wir beschränken uns auf x ∈ (a, b). Der Fall der Intervallränder betrachtet
man in analoger Weise.
Der Beweis folgt unmittelbar aus (5.8), da die Grenzwerte in (6.4) ja Grenzwerte
monotoner und beschränkter Netze sind.
Die Ungleichung in (6.4) folgt leicht aus der Tatsache, dass jeder Punkt aus { f (s) :
s ∈ (a, x)} kleiner oder gleich f (x) und f (x) kleiner oder gleich jedem Punkt aus { f (t) :
t ∈ (x, b)} ist.
Der zweite Teil der Behauptung folgt aus
lim f (t) = inf f (t) = inf f (t), lim f (s) = sup f (s) = sup f (s).
t→x+
x<t<b
x<t<y
t→y−
a<s<y
x<s<y
❑
3 Insbesondere
können in (a, b) nur Unstetigkeitsstellen 1.Art auftreten.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
130
f
f (x3 +)
f (x3 +)
f (x3 −)
= f (x2 −)
f (x2 )
= f (x2 +)
x1
x2
x3
f (x1 +)
f (x1 ) = f (x1 −)
Abbildung 6.3: Veranschaulichung monotoner Funktionen
6.5.3 Korollar. Sei I ⊆ R ein Intervall, f : I → R eine monoton wachsende Funktion
und J = f (I).
Das Bild ist genau dann ein Intervall, wenn f stetig ist.
Ist f streng monoton wachsend, so ist f −1 : J → I auch streng monoton wachsend. Dabei enthält I genau dann seinen linken (rechten) Intervallrand, wenn J
das tut.
Ist f streng monoton wachsend und stetig, so ist auch f −1 : J → I streng monoton wachsend und stetig.
Eine entsprechende Aussage gilt für streng monoton fallende Funktionen.
Beweis.
Ist f stetig, so ist wegen Korollar 6.2.6 auch f (I) ein Intervall.
Angenommen f ist nicht stetig an einem x ∈ I, das zunächst nicht ein Intervallrand von I sei. Wegen (6.4) muss lim s→x− f (s) < limt→x+ f (t). Es folgt
f (τ) ≤ lim f (s) = f (x−), τ < x und f (τ) ≥ lim f (t) = f (x+), τ > x .
s→x−
Also kann f keine Werte im Inter
vall f (x−), f (x+) bis auf unter
Umständen einen - nämlich f (x) annehmen.
t→x+
f (x+)
f (x)
f (x−)
6.6. GLEICHMÄSSIGE KONVERGENZ
131
Ist x der linke Intervallrand von I, so muss nach (6.4) f (x) < limt→x+ f (t). Somit
folgt ( f (x), limt→x+ f (t)) ∩ J = ∅. Entsprechend argumentiert man im Fall des
rechten Randes. Jedenfalls ist J kein Intervall.
Wegen der Strengen Monotonie ist f injektiv. Man sieht sofort, dass auch f −1 :
J → I auch streng monoton wachsend ist.
Enthält I seinen linken Rand4 a, so folgt aus der Monotonie, dass f (a) ≤ f (t), t ∈
I, und somit dass J auch seinen linken Rand enthält.
Enthält J = f (I) seinen linken Rand f (c) für ein c ∈ I, und wäre t ∈ I, t < c, so
folgt aus der strengen Monotonie der Widerspruch f (t) < f (c). Also ist c ∈ I der
linke Rand von I.
Ist f stetig, so ist J ein Intervall und die streng monoton wachsende Funktion
f −1 : J → I hat als Bild genau das Intervall I. Nach dem ersten Punkt muss
daher auch f −1 stetig sein.
❑
Wir werden später dieses Korollar verwenden, um z.B. zu zeigen, dass der Logarithmus eine stetige Funktion ist.
Thematisch zu obigem Ergebnis passt das nächste Lemma, das aus dem Zwischenwertsatz folgt.
6.5.4 Lemma. Seien I, J ⊆ R zwei Intervalle und f : I → J stetig und bijektiv. Dann
ist f streng monoton wachsend oder fallend.
Beweis. Wäre f weder streng monoton wachsend noch streng monoton fallend, so gibt
es x1 < x2 aus I mit f (x1 ) ≥ f (x2 ) und x3 < x4 aus I mit f (x3 ) ≤ f (x4 ). Weil f injektiv
ist, muss sogar f (x1 ) > f (x2 ) und f (x3 ) < f (x4 ). Daraus folgt, dass {x1 , x2 , x3 , x4 }
zumindest drei Elemente hat.
Durch Fallunterscheidungen je nachdem, wie diese Punkte angeordnet sind, findet
man immer a f (c)
oder f (a) > f (b), f (b) < f (c). Man beachte, dass dabei wegen der Injektivität alle drei
Werte f (a), f (b), f (c) untereinander verschieden sein müssen.
Im ersten Fall ist entweder f (a) ∈ ( f (c), f (b)) oder f (c) ∈ ( f (a), f (b)). Aus Korollar 6.2.6 folgt daher f (a) = f (t) für ein t ∈ (b, c) bzw. f (c) = f (t) für ein t ∈ (a, b), was
jedenfalls der Injektivität widerspricht.
Im zweiten Fall argumentiert man entsprechend.
❑
6.6 Gleichmäßige Konvergenz
P
n
Wir haben schon gesehen, dass z.B. die geometrische Reihe ∞
n=0 z für jedes z ∈ C,
|z| < 1, konvergiert. Betrachtet man diese Reihe nicht nur für ein festes vorgegebenes z,
sondern für alle z, so hat man eine Reihe, deren Summanden Funktionen (von z) sind,
1
).
und deren Summe ebenfalls eine Funktion von z ist (nämlich 1−z
4I
ist daher von der Form [a, b], [a, b), [a, +∞) mit b ∈ R, b > a.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
132
Betrachten wir also eine Folge ( fn )n∈N von Funktionen, die definiert ist, zum Beispiel, auf einer Menge E ⊆ R und die, zum Beispiel, reelle Werte annimmt. Wir würden
gerne erklären, was es bedeutet, dass diese Folge gegen eine Funktion f konvergiert.
Um einen vernünftigen“ Grenzwertbegriff zu bekommen, müssen wir jetzt eine
”
Metrik definieren, und zwar eine Metrik auf einer Menge von Funktionen f : E →
R. Aber man kann in diesem konkreten Fall auch naiver an die Sache herangehen.
Ist ( fn )n∈N , fn : E → R, eine Folge von Funktionen, dann ist für jedes feste x ∈ E
sicher ( fn (x))n∈N eine Folge von Zahlen, und für diese wissen wir, was es bedeutet zu
konvergieren. Man kann also definieren:
6.6.1 Definition. Sei E eine Menge und hY, dY i ein metrischer Raum. Eine Folge
( fn )n∈N , fn : E → Y, heißt punktweise konvergent gegen die Funktion f : E → Y,
wenn für jedes feste x ∈ E gilt limn→∞ fn (x) = f (x).
Entsprechend definiert man die punktweise Konvergenz von Netzen von Funktionen.
Es entsteht die Frage, ob sich Eigenschaften wie etwa die fundamentale Eigenschaft
der Stetigkeit der Funktionen fn auf die Grenzfunktion f übertragen. Die folgenden
Beispiele illustrieren, dass in dieser Angelegenheit etwas schiefgehen kann.
6.6.2 Beispiel.
Betrachte die Funktionen gn : [0, 1] → R, definiert durch gn (x) := xn , n ∈ N.
Bekannterweise gilt


0 , x ∈ [0, 1)

.
lim gn (x) = 

1 , x = 1
n→∞
Jede der Funktionen gn ist eine stetige Funktionen auf [0, 1], nicht jedoch die
Grenzfunktion.
Betrachte die Funktionen fn : R → R, definiert durch fn (x) :=
für jedes x , 0
∞
X
x2
n=0
x2
.
(1+x2 )n
Dann ist
(1 + x2 )n
eine konvergente geometrische Reihe. Ihre Summe ist 1 + x2 , x , 0.
Für x = 0 sind alle Summanden = 0, also auch ihre Summe. Man erhält

∞

X

1 + x2 x , 0
fn (x) = 

0
x=0
n=0
Alle Funktionen fn , und damit auch alle Partialsummen obiger Reihe sind stetige
Funktionen von x ∈ R, nicht jedoch die Grenzfunktion.
Die punktweise Konvergenz von Funktionen ist also nicht stark genug um etwa die
Eigenschaft der Stetigkeit zu erhalten.
6.6.3 Definition. Sei E eine Menge und hY, dY i ein metrischer Raum. Wir bezeichnen
mit B(E, Y) die Menge aller beschränkten Funktionen f : E → Y, d.h.
B(E, Y) := f : E → Y : ∃R > 0, y0 ∈ Y : ∀x ∈ E ⇒ dY ( f (x), y0 ) ≤ R .
6.6. GLEICHMÄSSIGE KONVERGENZ
133
Man definiert nun die Abbildung
(
B(E, Y) × B(E, Y) → R
d∞ :
( f, g) 7→ supx∈E dY ( f (x), g(x))
und spricht von der Supremumsmetrik.
f
g
Für reellwertige Funktionen
f, g : E → R = Y
ist dY (x, y) = |x − y|
und daher
d∞ ( f, g) = sup x∈E | f (x) − g(x)|.
d∞ ( f, g)
| f − g|
E
6.6.4 Lemma. Die Supremumsmetrik d∞ ist eine Metrik auf der Menge B(E, Y).
Beweis. Es gilt d∞ ( f, f ) = supx∈E dY ( f (x), f (x)) = sup x∈E 0 = 0. Ist umgekehrt
d∞ ( f, g) = sup x∈E dY ( f (x), g(x)) = 0, so folgt dY ( f (x), g(x)) = 0 für jedes x ∈ E,
und daher f (x) = g(x), x ∈ E. Also f = g.
Aus dY ( f (x), g(x)) = dY (g(x), f (x)) folgt d∞ ( f, g) = d∞ (g, f ). Ist h eine weitere
Funktion, so gilt für festes x ∈ E
dY ( f (x), g(x)) ≤ dY ( f (x), h(x)) + dY (h(x), g(x)) ,
und daher auch
dY ( f (x), g(x)) ≤ sup dY ( f (x), h(x)) + sup dY (h(x), g(x)) = d∞ ( f, h) + d∞ (h, g) .
x∈E
x∈E
Da diese Beziehung für jedes x ∈ E gilt, folgt auch d∞ ( f, g) = supx∈E dY ( f (x), g(x)) ≤
d∞ ( f, h) + d∞ (h, g).
❑
6.6.5 Definition. Eine Folge ( fn )n∈N von Funktionen aus B(E, Y) heißt gleichmäßig
gegen f , wenn limn→∞ fn = f bezüglich d∞ , d.h. wenn
∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) ≤ ǫ, n ≥ N,
(6.5)
oder äquivalent dazu ∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) < ǫ, n ≥ N.
Entsprechend definiert man die gleichmäßige Konvergenz von Netzen von Funktionen.
134
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
f
fn , n ≥ N
f +ǫ
f −ǫ
E
Abbildung 6.4: Veranschaulichung der gleichmäßigen Konvergenz
6.6.6 Bemerkung. Ist f ∈ B(E, Y) und g irgendeine Funktion von E → Y mit der
Eigenschaft, dass supt∈E dY ( f (t), g(t)) < ∞, so folgt aus der Dreiecksungleichung, dass
auch g eine beschränkte Funktion ist.
Ist daher ( fn )n∈N eine Folge aus B(E, Y), und gilt supt∈E dY ( fn (t), g(t)) → 0, so folgt
g ∈ B(E, Y) und fn → g gleichmäßig.
Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz liegt darin
begründet, dass man ein N finden muss, das für alle x ∈ E funktioniert.
In der Tat gilt d∞ ( fn , f ) ≤ ǫ ⇔ ∀x ∈ E ⇒ dY ( fn (x), f (x)) ≤ ǫ, und somit ist (6.5)
äquivalent zu
∀ǫ > 0 ∃N ∈ N ∀x ∈ E : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N ,
wogegen punktweise Konvergenz bedeutet
∀x ∈ E ∀ǫ > 0 ∃N ∈ N : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N .
Insbesondere sehen wir, dass jede gleichmäßig konvergente Folge auch punktweise
konvergiert und zwar zur gleichen Grenzfunktion.
6.6.7 Beispiel. Betrachte nochmals die reellwertigen Funktionen gn (x) := xn , n ∈ N
nun defniert für x ∈ [0, 1), vgl. Beispiel 6.6.2. Wir wissen schon, dass gn punktweise gegen die Nullfunktion auf [0, 1) konvergiert. Dabei gilt wegen xn < 1 für
x ∈ [0, 1), n ∈ N, und wegen lim x→1− xn = 1, dass
d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = 1.
x∈[0,1)
x∈[0,1)
Also d∞ (gn , 0) 6→ 0 für n → ∞, d.h. (gn )n∈N konvergiert nicht gleichmäßig gegen die
Nullfunktion.
6.6.8 Beispiel. Sei η ∈ (0, 1) fest, und betrachtet die Funktionenfolge gn (x) = xn ,
n ∈ N, auf dem Intervall [0, η]. Klarerweise konvergiert auch diese eingeschränkte
Funktionenfolge punktweise gegen die Nullfunktion auf [0, η]. Nun folgt aber wegen
d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = ηn ,
x∈[0,η]
x∈[0,η]
6.6. GLEICHMÄSSIGE KONVERGENZ
135
gn (x)
1
n=1
n=3
n=7
n = 13
1
2
0
1
2
η
1
x
Abbildung 6.5: Graph der Funktionen gn für ausgewählte n ∈ N
dass d∞ (gn , 0) → 0 für n → ∞. Also konvergiert gn sogar gleichmäßig gegen die
Nullfunktion.
1
2
6.6.9 Beispiel. Man untersuche die Funktionenfolge fn (x) := nxe− 2 nx , x ∈ [0, ∞),
n ∈ N, auf gleichmäßige Konvergenz. Dabei greifen wir der Definition der Funktion
x 7→ e x für x ∈ R weiter hinten vor. Wir verwenden auch die Tatsache, dass ye−y → 0
für y → +∞. Weiters verwenden wir die Differentialrechnung zur Bestimmung
von Extrema. Da dieses Beispiel nur zum besseren Verständnis des Begriffes der
gleichmäßigen Konvergenz dient und später nicht verwendet wird, sind diese Vorgriffe
gerechtfertigt.
Zunächst sei bemerkt, dass für alle n ∈ N die Funktion fn (x) stetig ist und fn (x) ≥ 0
für x ∈ [0, ∞). Eine getrennte Untersuchung der Fälle x , 0 und x = 0 liefert punktweise Konvergenz fn (x) → f (x) ≡ 0 für n → ∞. Um ( fn )n∈N auf gleichmäßige Konvergenz
gegen die Funktion f (x) ≡ 0 zu untersuchen betrachtet man die Supremumsmetrik
d∞ ( fn , 0) = sup dR ( fn (x), 0) = sup | fn (x)|.
x∈[0,∞)
x∈[0,∞)
Da für jedes n ∈ N die Funktion fn (x) nicht negativ ist, fn (0) = 0 und lim x→∞ fn (x) = 0
gilt, folgt, dass fn (x) sogar ein Maximum in [0, ∞) annimmt. Um das Maximum zu
berechnen, ist Satz 7.2.2 hilfreich. Für jedes n ∈ N ist fn (x) beliebig oft differenzierbar,
und setzt man die erste Ableitung gleich Null, so erhält man
1
1
1
±1
2
2
2
fn′ (x) = ne− 2 nx − n2 x2 e− 2 nx = e− 2 nx (n − n2 x2 ) = 0 ⇔ x = √ .
n
Also ist x = √1n die einzige Nullstelle der ersten Ableitung, die in [0, ∞) enthalten ist.
Wegen lim x→∞ fn (x) = 0 folgt daher, dass das Maximum der Funktion fn (x) an der
Stelle x = √1n liegt. Somit ergibt sich für die Supremumsmetrik
1 1
n
d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn √ = √ e− 2 .
x∈[0,∞)
n
n
x∈[0,∞)
Daraus folgt d∞ ( fn , 0) 6→ 0 für n → ∞, d.h. ( fn )n∈N konvergiert nicht gleichmäßig
gegen die Nullfunktion.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
136
fn (x)
7
n=1
n=5
6
n = 20
5
n = 120
4
3
2
1
0
1
1
2
3
2
2
5
2
3
x
7
2
Abbildung 6.6: Graph der Funktionen fn für ausgewählte n ∈ N
1
2
6.6.10 Beispiel. Sei η > 0 und betrachtet man die Funktionenfolge fn (x) := nxe− 2 nx ,
n ∈ N, auf dem Intervall [η, ∞). Aus dem vorigen Beispiel wissen wir bereits, dass die
Funktion fn (x) für x > √1n monoton fallend ist. Wegen
1
∀δ > 0 ∃n0 ∈ N : δ > √ ∀n ≥ n0
n
gibt es ein n0 ∈ N, sodass √1n < [η, ∞) für alle n ≥ n0 . Daher ergibt sich für n ≥ n0 in
diesem Fall für die Supremumsmetrik
1
2
d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn (η) = nηe− 2 nη .
x∈[η,∞)
x∈[η,∞)
Also folgt d∞ ( fn , 0) → 0 für n → ∞, d.h. ( fn )n∈N konvergiert gleichmäßig gegen die
Nullfunktion.
Gleichmäßige Konvergenz sichert nun (wie wir auch später immer wieder feststellen werden), dass sich Grenzübergänge brav“ verhalten.
”
6.6.11 Lemma. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer
Raum, E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N. Weiters sei (xk )k∈N eine Folge in E.
Ist die Folge ( fn )n∈N auf E gleichmäßig konvergent gegen f , und existiert für jedes
n ∈ N der Grenzwert
lim fn (xk ) = An ,
k→∞
dann konvergiert die Folge (An )n∈N und zwar gegen limk→∞ f (xk ). Also gilt
lim lim fn (xk ) = lim lim fn (xk ).
k→∞ n→∞
n→∞ k→∞
Beweis. Sei ǫ > 0 gegeben. Da ( fn )n∈N → f bezüglich d∞ , ist ( fn )n∈N in B(E, Y) eine
Cauchy-Folge. Es existiert also ein N ∈ N, sodass für n, m ≥ N und alle t ∈ E gilt
dY ( fn (t), fm (t)) ≤ ǫ.
6.6. GLEICHMÄSSIGE KONVERGENZ
137
Hält man n und m fest und lässt man t die Folge (xk )k∈N durchlaufen, so folgt mit
Lemma 3.2.12 und Lemma 3.3.1 die Beziehung dY (An , Am ) ≤ ǫ. Damit ist (An )n∈N eine
Cauchy-Folge in Y und daher konvergent, limn→∞ An =: A. Nun gilt
dY ( f (xk ), A) ≤ dY ( f (xk ), fn (xk )) + dY ( fn (xk ), An ) + dY (An , A).
Wähle n so groß, dass für alle t ∈ E und insbesondere für alle t = xk
dY ( f (t), fn (t)) < ǫ und dY (An , A) < ǫ.
Für dieses n existiert ein k0 ∈ N, sodass aus k ≥ k0 die Ungleichung dY ( fn (xk ), An ) < ǫ
folgt. Insgesamt erhalten wir
dY ( f (xk ), A) < 3ǫ, k ≥ k0 .
❑
6.6.12 Bemerkung. Wir werden später eine Verallgemeinerung dieses Lemmas für Netze zeigen. Der Beweis davon wird im Wesentlich derselbe sein.
6.6.13 Korollar. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer
Raum, E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N, sodass ( fn )n∈N auf E gleichmäßig gegen
f konvergiert.
Sind die Funktionen fn alle stetig bei einem x ∈ E, so ist es auch f . Sind alle fn auf
ganz E stetig, so ist es auch f .
k→∞
Beweis. Sei x ∈ E und sei (xk )k∈N eine Folge mit xk −→ x. Aus Lemma 6.6.11 folgt
lim f (xk ) = lim lim fn (xk ) = lim lim fn (xk ) = lim fn (x) = f (x).
k→∞
k→∞ n→∞
n→∞ k→∞
n→∞
Nach Proposition 6.1.4 ist f bei x stetig.
❑
6.6.14 Bemerkung. Nach Lemma 5.1.13 erhält man, dass die Menge C(E, Y) aller beschränkten und stetigen Funktionen von E → Y, eine abgeschlossene Teilmenge von
B(E, Y) versehen mit der Metrik d∞ ist. Dabei ist E Teilmenge eines metrischen Raumes.
6.6.15 Satz (Cauchy-Kriterium). Ist E eine Menge und hY, dY i ein vollständig metrischer Raum, so ist hB(E, Y), d∞i ebenfalls ein vollständig metrischer Raum.
Somit konvergiert eine Folge ( fn )n∈N von Funktionen aus B(E, Y) genau dann
gleichmäßig, wenn es zu jedem ǫ > 0 ein N ∈ N gibt, sodass für alle n, m ≥ N und
beliebiges x ∈ E gilt
dY ( fn (x), fm (x)) ≤ ǫ.
(6.6)
Beweis. Klarerweise ist eine konvergente Folge ( fn )n∈N von Funktionen aus B(E, Y)
eine Cauchy-Folge. Diese Tatsache gilt ja in allen metrischen Räumen.
Sei nun umgekehrt die Cauchy-Bedingung erfüllt. Man beachte, dass (6.6) für alle
x ∈ E zu d∞ ( fn , fm ) ≤ ǫ äquivalent ist.
Es folgt, dass insbesondere für jedes einzelne x die Folge ( fn (x))n∈N eine CauchyFolge in Y und daher konvergent ist. Also existiert der Grenzwert limn→∞ fn (x) punktweise auf E. Wir setzen
f (x) := lim fn (x).
n→∞
138
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
Wir müssen nun noch zeigen, dass f beschränkt ist und dass die Konvergenz sogar
gleichmäßig stattfindet.
Sei ǫ > 0 gegeben und wähle N ∈ N so, dass dY ( fn (x), fm (x)) ≤ ǫ für alle n, m ≥ N
und alle x ∈ E. Hält man x fest und lässt m → ∞ streben, so folgt für n ≥ N
dY ( fn (x), f (x)) ≤ ǫ.
Da x beliebig, war folgt d∞ ( fn , f ) ≤ ǫ, n ≥ N, d.h. fn → f gleichmäßig und mit
Bemerkung 6.6.6 ist f beschränkt.
❑
6.7 Reell- und komplexwertige Folgen und Reihen
6.7.1 Definition. Ist Y = R oder Y = C, dann setzt man für f : E → Y
k f k∞ := sup | f (x)|,
x∈E
und spricht von der Supremumsnorm.
d∞ ( f, g) lässt sich dann als k f − gk∞ schreiben. Klarerweise ist k f k∞ = d∞ ( f, 0),
wobei 0 hier die konstante Nullfunktion ist. Unmittelbar überprüft man, dass ( f, g ∈
B(E, Y))
k f k∞ ≥ 0 und k f k∞ = 0 ⇔ f = 0,
kλ · f k∞ = |λ| · k f k∞ für λ ∈ R bzw. λ ∈ C,
k f + gk∞ ≤ k f k∞ + kgk∞ ,
k f · gk∞ ≤ k f k∞ · kgk∞ .
6.7.2 Korollar. Sind ( fn )n∈N , (gn )n∈N Folgen von Funktionen aus B(E, R) bzw. B(E, C),
die gleichmäßig gegen f bzw. g konvergieren, so gilt
lim fn + gn = f + g, lim fn · gn = f · g,
n→∞
n→∞
und zwar gleichmäßig. Insbesondere gilt limn→∞ λ · fn = λ · f für alle λ ∈ R bzw. λ ∈ C.
Beweis. Wir beweisen exemplarisch nur die zweite Aussage. Es gilt
d∞ ( fn gn , f g) = k fn gn − f gk∞ ≤ kgn k∞ · k fn − f k∞ + k f k∞ · kgn − gk∞ .
Als konvergente Folge ist (gn )n∈N beschränkt, d.h. kgn k∞ = d∞ (gn , 0) ≤ C, n ∈ N.
Somit konvergiert d∞ ( fn gn , f g) gegen Null.
❑
P
6.7.3 Definition. Für n ∈ N sei fn : E → R (C). Man sagt, die Reihe ∞
n=1 fn konverP∞
giert punktweise, wenn für jedes x ∈ E die Reihe n=1 fn (x) in R (C) konvergiert.
P∞
Ist fn ∈ B(E,
PR) (∈ B(E,
C)), n ∈ N, so heißt n=1 fn gleichmäßig konvergent,
N
wenn die Folge n=1
fn (.)
von Partialsummen gleichmäßig konvergiert.
N∈N
P∞
Die Reihe n=1 fn konvergiert absolut als Funktionenreihe, wenn die Reihe
P∞
n=1 k fn k∞ konvergiert.
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
139
P
Klarerweis impliziert die absolute Konvergenz von ∞
n=1 fn als Funktionenreihe die
P∞
absolute Konvergenz von n=1 fn (x) für jedes x ∈ E. Wir haben aber auch folgendes
Ergebnis.
6.7.4 Korollar (Weierstraß Kriterium). Sei ( fn )n∈N eine Folge von beschränkten reellP
bzw. komplexwertigen Funktionen auf einer Menge E. Ist ∞
n=1 fn absolut konvergent
als Funktionenreihe, so ist diese Funktionenreihe auch gleichmäßig konvergent.
P∞
und somit auch gleichmäßig konvergent,
n=1 fn ist sicher dann absolut konvergent,P
wenn es Mn ∈ R, Mn ≥ 0, n ∈ N gibt, für die ∞
n=1 Mn konvergiert, und sodass
k fn k∞ ≤ Mn , n ∈ N.
Beweis. Nach dem Majorantenkriterium (vgl. Satz 3.7.8) folgt aus der Konvergenz von
P∞
P∞
n=1 Mn die von
n=1 k fn k∞ .
P
N
Ist nun letztere Reihe konvergent, so ist die Folge n=1
k fn k∞
von PartialsumN∈N
men eine Cauchy-Folge in R. Es gibt somit zu ǫ > 0 ein N ∈ N, sodass für k, m ≥ N
P
gilt m
n=k+1 k fn k∞ ≤ ǫ. Für solche m, k folgt auch
m
m
X
X
fn ≤
k fn k∞ ≤ ǫ, .
n=k+1 n=k+1
P
∞
N
fn
eine Cauchy-Folge in B(E, R) (∈ B(E, C)), und nach Satz 6.6.15
Also ist n=1
N∈N P
konvergent. Somit ist ∞
n=1 fn gleichmäßig konvergent.
❑
P∞
6.7.5
P Bemerkung. Man sagt eine Funktionenreihe n=1 fn konvergiert absolut und gleichmäßig, wenn die Funktionenreihe ∞
Man sieht unschwer ähnlich wie im Beweis von Korollar
n=1 | fn (.)| gleichmäßig konvergiert.
P 6.7.4, dass daraus die
P∞
gleichmäßige Konvergenz von n=1 fn folgt. Außerdem folgt aus der absoluten Konvergenz von ∞
n=1 fn ihre absolut und
gleichmäßige Konvergenz. Somit liegt dieser Konvergenzbegriff zwischen der gleichmäßigen Konvergenz und der absoluten
Konvergenz.
Die meisten Konvergenzkriterien für Reihen kann man so anpassen, dass sie auch
für Reihen von Funktionen anwendbar sind. Wir wollen das hier aber nicht weiter
ausführen.
Ein bedeutendes Beispiel für Reihen von Funktionen sind die sogenannten Potenzreihen.
6.7.6 Definition. Sind an ∈ C oder auch nur an ∈ R für n ∈ N ∪ {0}, und ist z ∈ C, so
nennt man die komplexwertige Reihe
∞
X
an zn
n=0
eine Potenzreihen5.
Als Konvergenzradius wollen wir die Zahl R ∈ [0, +∞] mit


∞


X




n
|z|
:
z
∈
C,
R = sup 
a
z
ist
konvergent

n




n=0
bezeichnen6.
5
Dabei ist es zunächst unerheblich, ob sie jetzt konvergiert oder nicht.
für z = 0 die Reihe immer absolut konvergiert, ist diese Menge nicht leer.
6 Da
(6.7)
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
140
6.7.7 Beispiel. sind solchen Reihen schon begegnet, z.B. sind die geometrische Reihe
P∞ n
P∞ zn
n=0 z und die Exponentialreihe n=0 n! Potenzreihen.
Erstere konvergiert genau für |z| < 1 und hat somit Konvergenzradius 1. Die Exponentialreihe konvergiert für alle z ∈ C und hat somit Konvergenzradius +∞.
P
n
6.7.8 Satz. Sei ∞
n=0 an z eine Potenzreihe und R ihr Konvergenzradius.
P
n
(i) Für jedes z ∈ C mit |z| > R ist ∞
n=0 an z divergent.
P
n
(ii) Für jedes z ∈ C mit |z| < R ist ∞
n=0 an z sogar absolut konvergent. Insbesondere
ist


∞


X




n
|z|
:
z
∈
C,
.
(6.8)
R = sup 
a
z
ist
absolut
konvergent

n




n=0
P∞
(iii) Für jedes r ∈ [0, R) ist n=0 an zn auf dem abgeschlossenen Kreis Kr (0) = {z ∈ C :
|z| ≤ r} absolut und gleichmäßig konvergent. Die Funktion
z 7→
∞
X
n=0
an zn , z ∈ Kr (0),
ist dabei eine stetige und beschränkte Funktion auf Kr (0).
Im
C
r
Re
−R
R
Abbildung 6.7: Konvergenzradius
(iv) Auf UR (0) = {z ∈ C : |z| < R} ist z 7→
P∞
n=0
an zn eine stetige Funktion7.
(v) Der Konvergenzradius lässt sich auch durch die Koeffizienten an bestimmen. Es
gilt
1
1
1
≤R=
.
≤
√n
|
|
lim supn→∞ | aan+1
lim
inf
| aan+1
lim
sup
|a
|
n→∞
n
n→∞
n
n
Beweis.
7 Im
Allgemeinen ist sie aber nicht mehr beschränkt
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
141
(i) Folgt sofort aus (6.7).
(ii) Folgt aus dem nächsten Punkt.
P
n
(iii) Nach (6.7) gibt es ein komplexes z0 mit r < |z0 | ≤ R, sodass ∞
n=0 an z0 konvergiert.
n
Somit ist die Summandenfolge eine Nullfolge; insbesondere |an z0 | ≤ C, n ∈ N
für ein C > 0. Für |z| ≤ r < |z0 | rechnet man
n
n
r
z
|an zn | = |an zn0 | · ≤ C · .
z0
z0
n
P
∞
r
r
Wegen z0 < 1 konvergiert n=0 C z0 .
PN
Die Partialsummen n=0
an zn , N ∈ N, sind Polynome und damit stetig. Da Kr (0)
kompakt ist (vgl. Beispiel 5.2.10), sind diese Partialsummen auf Kr (0) beschränkt.
Aus dem Weierstraßschen Kriterium (Korollar 6.7.4) folgt die absolute und somit
gleichmäßige Konvergenz unserer Potenzreihe auf Kr (0) gegen eine beschränkte
Funktion. Nach Korollar 6.6.13 ist die Grenzfunktion sogar stetig.
P
(iv) Betrachtet man z 7→ nn=0 an zn auf UR (0), so ist auch dies eine stetige Funktion.
In der Tat ist die Stetigkeit eine lokale Eigenschaft (siehe Fakta 6.1.3), und man
kann zu jedem komplexen z mit |z| < R ein δ > 0 und ein r ∈ [0, R) finden, sodass
Uδ (z) ⊆ Kr (0).
(v) Wäre
1 a lim supn→∞ n+1
an > R so wähle z ∈ C mit
1
> |z| > R.
lim supn→∞ aan+1
n
Wegen (i) divergiert die Potenzreihe. Andererseits folgt
an+1 zn+1 an+1 < 1.
lim sup =
|z|
·
lim
sup
an n n→∞ an z
n→∞
Nach dem Quotientenkriterium (vgl. Fakta 5.2.6 und Satz 3.8.1) ist unsere Potenzreihe aber konvergent. Also muss
1
≤ R.
lim supn→∞ aan+1
n
Analog zeigt man mit dem Wurzelkriterium, dass
Wäre
1 a lim inf n→∞ n+1
an 1 √
lim supn→∞ n |an |
≤ R.
< R, so wähle wieder z ∈ C mit
1
< |z| < R.
lim inf n→∞ aan+1
n
Wegen (ii) konvergiert
die
Potenzreihe. Andererseits sieht man ähnlich wie oben,
an+1 zn+1 dass lim inf n→∞ an zn > 1, und mit dem Quotientenkriterium (vgl. Fakta 5.2.6
und Satz 3.8.1) folgt die Divergenz der Potenzreihe. Also muss auch
1
≥ R.
lim inf n→∞ aan+1
n
Analog zeigt man mit dem Wurzelkriterium, dass
1 √
lim supn→∞ n |an |
≥ R.
142
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
❑
6.7.9 Beispiel. Das Konvergenzverhalten einer Potenzreihe ist durch den obigen Satz
relativ gut abgeklärt. Einzig über die Punkte mit |z| = R, wo R der Konvergenzradius
ist, hat man keine Aussage. Es können hier tatsächlich auch alle Fälle eintreten.
P ∞ zn
P
n P∞ zn
Betrachte die Potenzreihen ∞
. Alle haben Konvergenzn=0 z ,
n=0 n und
n2
P
Pn=0
∞ zn
n
radius 1. Jedoch ist ∞
z
für
|z|
=
1
divergent,
n=0
n=0 n2 absolut konvergent, und
P∞ zn
n=0 n (nicht absolut) konvergent außer bei z = 1, wo sie divergiert.
6.7.10 Korollar. Sei f (z) :=
R > 0.
P∞
n=0
an zn eine Potenzreihe und ihr Konvergenzradius sei
Verschwinden nicht alle an , so gibt es ein δ ∈ (0, R), sodass f (z) , 0 für z ∈
Uδ (0) \ {0}.
P
n
Sei ∞
n=0 bn z eine weitere Potenzreihen mit Konvergenzradien R̃ > 0. Gibt
es eine Menge E ⊆ Umin(R,R̃) (0), die Null als Häufungspunkt hat, und sodass
P∞
P∞
n
n
n=0 an z =
n=0 bn z für alle z ∈ E, so folgt an = bn , n ∈ N ∪ {0} und damit
R = R̃.
Beweis. Sei n0 ∈ N ∪ {0} der erste Index, sodass an0 , 0. Wegen den Rechenregeln
P
P∞
n
n
für Reihen konvergiert ∞
n=0 an z genau dann, wenn g(z) =
n=0 an+n0 z es tut, wobei
im Fall der Konvergenz zn0 g(z) = f (z). Letztere ist also auch eine Potenzreihe mit
Konvergenzradius R.
Wegen g(0) = an0 , 0 und wegen der Stetigkeit von g auf UR (0) gibt es ein δ ∈
(0, R), sodass |g(z) − g(0)| < |an0 | und somit g(z) , 0 für z ∈ Uδ (0). Also ist auch
f (z) , 0 für z ∈ Uδ (0) \ {0}.
Um die zweite Aussage zu zeigen betrachte man die Potenzreihe
P
n
h(z) = ∞
n=0 (an − bn )z , die zumindest für |z| < min(R, R̃) konvergiert, und damit einen
Konvergenzradius ≥ min(R, R̃) hat. Nach Voraussetzung und den Rechenregeln für
Reihen folgt h(z) = 0, z ∈ E. Da 0 ein Häufungspunkt von E ist, widerspricht das aber
der ersten Aussage, außer an − bn = 0, n ∈ N.
❑
6.7.11 Bemerkung. Ist |z| < R, so folgt aus Korollar 3.7.3
∞
X
an (z̄)n =
n=0
∞
X
ān zn .
(6.9)
n=0
P
n
Wir sehen insbesondere, dass wenn alle an reell sind und z = x ∈ R, auch ∞
n=0 an x ∈
R.
P
n
Ist umgekehrt ∞
n=0 an x ∈ R für alle x ∈ R, |x| < R, so folgt aus (6.9), dass die
Potenzreihen (beide mit Konvergenzradius R)
∞
X
n=0
an zn ,
∞
X
ān zn
n=0
für z ∈ R ∩ UR (0) übereinstimmen. Aus Korollar 6.7.10 folgt an = ān , also an ∈ R.
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
143
6.7.12 Bemerkung. Üblicherweise werden auch Reihen der Form
∞
X
n=0
an (z − z0 )n
(6.10)
für ein festes z0 als Potenzreihen bezeichnet. Die hergeleiteten Aussagen für Potenzreihen stimmen sinngemäß offensichtlich auch für solche Reihen. Dabei ist z.B. der
Bereich der Konvergenz UR (z0 ) mit entsprechend definierten Konvergenzradius.
Funktionen f : D → C mit offenem D ⊆ C heißen analytisch in einem Punkt
z0 ∈ D, falls es eine offene Kugel Ur (z0 ) ⊆ D mit r > 0 und eine Potenzreihe der
Form (6.10) gibt, sodass r kleiner oder gleich dem Konvergenzradius der Reihe ist und
sodass f (z) für alle z ∈ Ur (z0 ) mit dem Grenzwert der Reihe (6.10) übereinstimmt, f
also lokal um z0 als Grenzwert einer Potenzreihe dargestellt werden kann.
Ist f um jedes z0 ∈ D analytisch, so heißt f analytisch.
6.7.13 Satz. Sei P(z) =
Ist die Zahlenreihe s :=
P∞
j=0
P∞
a j z j eine Potenzreihe, R ihr Konvergenzradius mit 0 < R < ∞. Weiters sei z0 ∈ C mit |z0 | = R.
j
j=0 a j z0 konvergent, so gilt
lim P(tz0 ) = s.
(6.11)
t→1−
Beweis. Sei |z| < R und
sn :=
n
X
j
a j z0 , s := lim sn .
n→∞
j=0
Laut Voraussetzung existiert der Grenzwert s. Aus Lemma 3.8.4 folgt
n
X
a jz j =
j=0
!
!
!
!
n
n−1
X
X
z j
z j+1
z n
z j
(a j z0j )
sj (
=
sn −
−
)=
z0
z0
z0
z0
j=0
j=0
z
z0
Wegen
z
z0
n
!n
sn + 1 −
! n−1
!j
z
z X
sj
.
z0 j=0
z0
sn → 0 konvergiert die Reihe auf der rechten Seite, und wir erhalten
P(z) =
∞
X
j=0
Andererseits ist folgt aus
P∞
j=0
ζj =
1
1−ζ
a jz j = 1 −
! ∞
!j
z
z X
sj
, |z| < R.
z0 j=0
z0
, |ζ| < 1
s= 1−
! ∞
!
z j
z X
s
.
z0 j=0 z0
Für |z| < R und N ∈ N folgt
! !
N
∞
z X
z j z j
z X
|P(z) − s| ≤ 1 − |s − s j |
|s − s j |
+ 1 − z0 j=0
z0
z0 j=N+1
z0
Ist nun ǫ > 0 und N fest und so groß, dass |s − s j | < ǫ, j > N, so ist das kleiner oder gleich
!j
X
1 − z N
z0
z
1 − z .
|s − s j |
+ǫ
z0 j=0
z0
1 − z (6.12)
z0
Ist z = tz0 , t ∈ (0, 1), so sieht man, dass es ein t0 ∈ (0, 1) gibt, sodass für t > t0 dieser Ausdruck kleiner oder gleich 2ǫ ist.
Da ǫ > 0 beliebig war, gilt (6.11).
❑
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
144
Im
C
α
Re
α
Abbildung 6.8: Winkelraum Nα
6.7.14 Bemerkung. Mit einer etwas feiner Argumentationsweise läßt sich (6.11) folgendermaßen verallgemeinern.
Nähert sich z nichttangentiell dem Punkt z0 an, so konvergiert P(z) gegen s. Das bedeutet: Ist Nα , 0 < α < π der
Winkelraum
Nα = {reiβ ∈ C : r > 0, β ∈ [−α, α]},
so gilt
lim
τ∈Nα , τ→0
P((1 − τ)z0 ) = s.
(6.13)
Um das einzusehen, bemerke man zunächst, dass für τ = reiβ ∈ Nα mit r = |τ| ≤ cos α (für die Funktion cos siehe den
nächsten Abschnitt)
|τ|(1 + |1 − τ|)
2
2
2
|τ|
=
≤
≤
.
≤
1 − |1 − τ|
2 cos β − r
2 cos α − r
cos α
1 − |(1 − τ)|2
Nun folgt man dem Beweis von Satz 6.7.13 bis (6.12). Dann folgt mit z = (1 − τ)z0 , |τ| ≤ cos α, τ ∈ Nα
!j
N
z X
z
2
|s − s j |
|P(z) − s| ≤ 1 − .
+ǫ
z0 j=0
z0
cos α
Für |τ| → 0 konvergiert der erste Summand gegen Null. Also gibt es ein t0 ∈ (0, cos α), sodass |P(z) − s| ≤ ǫ cos3 α , wenn nur
|τ| ≤ t0 , τ ∈ Nα .
Da ǫ beliebig war, folgt (6.13).
6.8 Die Exponentialfunktion
Wir wollen jetzt einige der sogenannten elementaren Funktionen betrachten. Grundlage
für alle diese ist die Exponentialfunktion
exp(z) =
∞
X
zn
, z ∈ C.
n!
n=0
(6.14)
Wir haben schon gesehen, dass diese Reihe für alle z ∈ C konvergiert. Sie ist also eine
Potenzreihe mit Konvergenzradius +∞. Insbesondere ist exp : C → C stetig.
Weitere wichtige elementare Funktionen sind sin und cos.
6.8.1 Definition. Für z ∈ C seien
cos z =
exp(iz) − exp(−iz)
exp(iz) + exp(−iz)
, sin z =
,
2
2i
die sogenannten trigonometrischen Funktionen Cosinus und Sinus.
Als Zusammensetzung von stetigen Funktionen sind cos : C → C und sin : C → C
auf C stetig (siehe Lemma 6.1.6 und Korollar 6.1.8).
6.8. DIE EXPONENTIALFUNKTION
145
6.8.2 Lemma. Für alle z ∈ C gilt
cos z =
∞
∞
X
X
z2k
z2k+1
(−1)k
, sin z =
.
(−1)k
(2k)!
(2k + 1)!
k=0
k=0
Also sind cos und sin Grenzfunktionen obiger Potenzreihe mit Konvergenzradius +∞.
Beweis. Für gerade n = 2k gilt in + (−i)n = 2i2k = 2(−1)k , und für ungerade n = 2k + 1
gilt in + (−i)n = 0. Aus den Rechenregeln für Reihen folgt somit
z2k
exp(iz) + exp(−iz) X in + (−i)n zn X
=
=
.
(−1)k
2
2
n! k=0
(2k)!
n=0
∞
∞
Analog leitet man die Potenzreihenentwicklung für sin her.
❑
6.8.3 Satz. Sei z, w ∈ C und x, y ∈ R. Dann gilt
(i) exp(z) , 0, exp(z + w) = exp(z) exp(w) und exp(−z) =
(exp z)n = exp(zn), n ∈ Z.
1
exp(z) .
Schließlich ist
(ii) exp(iz) = cos z + i sin z. Allgemeiner gilt die Formel von de Moivre:
(cos z + i sin z)n = cos(nz) + i sin(nz), n ∈ Z.
(iii) exp(z̄) = exp(z), cos(z̄) = cos(z), sin(z̄) = sin(z).
Insbesondere sind exp |R , cos |R , sin |R Funktionen, die R nach R abbilden.
(iv) cos y = Re exp(iy), sin y = Im exp(iy) und exp(x + iy) = exp(x)(cos y + i sin y),
wobei exp(x) ∈ R.
Im
i exp(x) sin y
( x)
exp
i
exp(iy) =
cos y + i sin y
i sin y
0
−1
exp(x + iy) =
exp(x)(cos y + i sin y)
cos y 1
exp(x) cos y
Re
−i
Abbildung 6.9: Darstellung der Lage von exp(x + iy)
(v) Die Funktion exp eingeschränkt auf die reelle Achse ist eine streng monoton
wachsende bijektive Funktion von R auf R+ mit exp(0) = 1. Insbesondere gilt
lim exp(x) = +∞, lim exp(x) = 0.
x→+∞
x→−∞
(6.15)
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
146
(vi) | exp(z)| = exp(Re z). Insbesondere gilt | exp(z)| = 1 ⇔ Re z = 0 und
(cos y)2 + (sin y)2 = 1.
(vii) cos(−z) = cos z und sin(−z) = − sin z.
(viii) Es gelten die Summensätze für Sinus und Cosinus
cos(z + w) = cos z cos w − sin z sin w, sin(z + w) = sin z cos w + cos z sin w .
Beweis.
(i) exp(z + w) = exp(z) exp(w) haben wir in Beispiel 3.9.13 gesehen. Die beiden
nächsten Aussagen folgen aus exp(−z) · exp(z) = exp(0) = 1. Schließlich folgt
(exp z)n = exp(zn), n ∈ N, durch vollständige Induktion, und für n ∈ Z wegen
1
.
exp(−zn) = exp(zn)
(ii) exp(iz) = cos z + i sin z folgt leicht durch Nachrechnen, und daraus
(cos z + i sin z)n = (exp iz)n = exp(inz) = cos(nz) + i sin(nz).
(iii) Da die Koeffizienten in den Potenzreihenentwicklungen reell sind, folgt die Aussage sofort aus Bemerkung 6.7.11.
(iv) Folgt aus (i) und (ii), da nach dem letzten Punkt exp(x), cos y, sin y ∈ R.
(v) Für x > 0 folgt aus der Tatsache, dass alle Koeffizienten in der Potenzreihe (6.14)
von exp strikt positiv sind, immer exp(x) > 1 + x > 1. Klarerweise ist exp(0) = 1.
1
Für x < 0 folgt aus (i), dass exp(x)
= exp(−x) > 1 − x > 1 und somit exp(x) ∈
1
(0, 1), exp(x) < 1−x .
Aus diesen Abschätzungen schließen wir sofort auf (6.15). Aus x < y ergibt sich
wegen
exp(y) = exp(x + (y − x)) = exp(x) · exp(y − x) > exp(x)
die Tatsache, dass exp(x) streng monoton wachsende ist.
Nun ist exp(x) : R → R+ stetig. Somit muss wegen Korollar 6.5.3 exp(R) ein
offenes Intervall sein, das wegen (6.15) aber nur (0, +∞) = R+ sein kann.
(vi) Aus
| exp(z)|2 = exp(z)exp(z) = exp(z) exp(z) = exp(z + z) = exp(2 Re z) = exp(Re z)2
und aus der Tatsache, dass | exp(z)| und exp(Re z) positive reelle Zahlen sind,
folgt | exp(z)| = exp(Re z). Weiters gilt (cos y)2 + (sin y)2 = | cos y + i sin y|2 =
| exp(iy)|2 = exp(0) = 1.
(vii) Folgt aus der jeweiligen Potenzreihenentwicklung, da nur gerade bzw. nur ungerade Potenzen vorkommen.
(viii) Man setze die Definition von sin und cos ein und rechne die Gleichheit nach.
❑
+
Wie wir unter anderem gerade gesehen haben, ist exp : R → R eine Bijektion.
6.8. DIE EXPONENTIALFUNKTION
147
y
4
3
y = exp(x)
2
1
−3
−2
−1
1
0
2
x
3
−1
Abbildung 6.10: Funktionsgraphen der reellen Exponentialfunktion
y
y = ln(x)
3
2
1
−1
0
1
2
3
4
5
6
x
−1
−2
−3
Abbildung 6.11: Logarithmus naturalis
6.8.4 Definition. Mit ln : R+ → R wollen wir die Inverse von exp : R → R+ bezeichnen und sprechen vom natürlichen Logarithmus bzw. vom Logarithmus naturalis.
Aus Satz 6.8.3, Korollar 6.5.3 und durch elementares Nachrechnen folgt sofort
6.8.5 Korollar. Die Funktion ln : R+ → R ist eine stetige und streng monoton wachsende Bijektion. Es gilt
lim ln x = −∞, lim ln x = +∞ ,
x→0+
x→+∞
sowie
ln(xy) = ln x + ln y, x, y > 0, ln(xn ) = n ln x, x > 0, n ∈ Z .
Beachte, dass wir den Logarithmus nur für reelle Werte definiert haben. Dies ist
kein Zufall, will man den Logarithmus auch für komplexe Werte definieren, trifft man
auf Schwierigkeiten ganz essentieller Natur (vgl. Vorlesung zur Komplexen Analysis).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
148
Wir können nun mit Hilfe der Exponentialfunktion die bisher nur für rationale b
definierte Ausdrücke ab auch für beliebige b ∈ R definieren.
6.8.6 Korollar. Für a ∈ R+ und b ∈ Q gilt ab = exp(b ln a).
Setzen wir ab durch exp(b ln a) auf ganz (a, b) ∈ R+ × R fort, so gilt (a, a1, a2 ∈
R+ , b, b1 , b2 ∈ R)
ab1 +b2 = ab1 · ab2 , (a1 a2 )b = ab1 · ab2 .
Beweis. Ist b = qp ∈ Q mit p ∈ Z, q ∈ N, so ist exp(b ln a) nach Satz 6.8.3 eine positive
reelle Zahl mit der Eigenschaft, dass
(exp(b ln a))q = exp(bq ln a) = exp(p ln a) = exp(ln a p ) = a p . .
√q
Also ist exp(b ln a) = a p .
Die Funktionalgleichungen folgen aus denen von exp und ln.
❑
6.8.7 Bemerkung.
Als Zusammensetzung der stetigen Funktionen exp, ln und ·, ist (a, b) 7→ ab auf
(a, b) ∈ R+ × R stetig (vgl. Beispiel 6.1.7).
Die Funktion exp kann nun selbst mit dieser Notation als allgemeine Potenz
angeschrieben werden. Sei dazu e := exp(1), die Eulersche Zahl. Dann gilt nach
der Definition der allgemeinen Potenz
e x = exp(x ln e) = exp x ln exp(1) = exp(x) .
| {z }
=1
6.8.8 Bemerkung. Wir haben schon festgestellt, und auch demonstriert, dass die Eulersche Exponentialfunktion eine ganz zentrale Rolle spielt. Daher wird auch die reelle
Zahl e ein interessantes Objekt sein. Dazu wollen wir hier bemerken, dass man die
P
1
Eulersche Zahl e, neben ihrer Definition als e := exp(1) = ∞
n=0 n! auch in vielfacher
Weise anders charakterisieren kann. Zum Beispiel kann man zeigen, dass
e = lim 1 +
n→∞
z
1 n
bzw. ez = lim 1 + n ,
n→∞
n
n
gilt.
Diese Formel gibt auch Anlass zu alternativen Definitionen der Funktion exp(x),
nämlich als e x . Dafür muss man allerdings die allgemeine Potenz zuerst (ohne Verwendung
von exp) definieren. Dies kann man so machen, dass man von der Funktion
√q
a p : R+ ×Q → R+ ausgeht, und diese mittels stetiger Fortsetzung“ zu einer Funktion
”
R+ × R → R+ macht.
Wie aus der Schule bekannt, ist einer der wichtigsten Naturkonstanten die Zahl
π. Mit Hilfe der Funktion cos kann man nun die Existenz dieser Zahl mit all ihren
wichtigen Eigenschaften herleiten.
6.8.9 Lemma.
Für t ∈ [0, 2] und n ∈ N gilt
tn
n!
≥
tn+2
(n+2)! .
Die Funktion cos : R → R hat eine kleinste positive Nullstelle x0 , die im Intervall
(0, 2) liegt.
6.8. DIE EXPONENTIALFUNKTION
149
Für x0 gilt sin x0 = 1.
Beweis.
Durch Umformen ist die zu beweisende Ungleichung äquivalent zu
(n + 2)(n + 1) ≥ t2 , und somit richtig.
Wir betrachten die Potenzreihenentwicklung von cos in Lemma 6.8.2 und stellen
sofort cos 0 = 1 fest. Da man in Reihen Klammern setzen darf, folgt aus dem
letzten Punkt
!
∞
22 24
24l+4
1
22 24 X 24l+2
≤1−
+
−
−
+
=− .
cos 2 = 1 −
2
4! l=1 (4l + 2)! (4l + 4)!
2
4!
3
Nach dem Zwischenwertsatz Korollar 6.2.6 hat t 7→ cos t im Intervall (0, 2) sicher eine Nullstelle x.
Nun ist nach Proposition 6.1.10 die Menge {t ∈ R : cos t , 0} = cos−1 (R \ {0})
als Urbild einer offenen Menge unter einer stetigen Funktion selber offen. Somit
ist ihr Komplement N = {t ∈ R : cos t = 0} und daher auch N ∩ [0, +∞) abgeschlossen. In Beispiel 5.1.14 haben wir gesehen, dass N ∩ [0, +∞) ein Minimum
hat, welches wegen cos 0 = 1 sicher nicht 0 ist. Also gibt es eine kleinste positive
Nullstelle x0 von t 7→ cos t.
Aus Satz 6.8.3 folgt wissen wir (cos x0 )2 + (sin x0 )2 = 1, und daher (sin x0 )2 = 1.
Nun ist aber wegen dem ersten Punkt
sin x0 =
und somit sin x0 = 1.

∞ 
X
x4l+3

 x4l+1
0
 ≥ 0,
 0
−
(4l + 1)! (4l + 3)!
l=0
❑
6.8.10 Definition. Die Zahl π sei jene positive reelle Zahl, sodass
tive Nullstelle von cos : R → R ist.
π
2
y
die kleinste posi-
y = sin(x)
y = cos(x)
1
−2π
− 3π
2
−π
− π2
0
−1
π
2
π
3π
2
2π
Abbildung 6.12: Funktionsgraphen des reellen Sinus und Cosinus
x
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
150
6.8.11 Satz.
(i) exp(±i π2 ) = ±i, exp(±iπ) = −1, exp(±2iπ) = 1.
(ii) cos(± π2 ) = 0, cos(±π) = −1, cos(±2π) = 1,
sin(± π2 ) = ±1, sin(±π) = 0, sin(±2π) = 0.
(iii) exp(z + 2kπi) = exp(z), sin(z + 2kπ) = sin(z), cos(z + 2kπ) = cos(z), z ∈ C, k ∈ Z. .
(iv) exp(z) = 1 ⇐⇒ ∃k ∈ Z : z = 2kπi (⇔ z ∈ 2πiZ).
(v) cos z = 0 ⇔ ∃k ∈ Z : z =
π
2
+ πk, und sin z = 0 ⇔ ∃k ∈ Z : z = πk.
(vi) Es gilt exp(C) = C \ {0}, wobei exp(z) = exp(ζ) ⇔ z − ζ ∈ 2πiZ.
Beweis.
(i) Wegen Satz 6.8.3 und Lemma 6.8.9 gilt exp(i π2 ) = cos π2 + i sin π2 = i. Der Rest
folgt aus Satz 6.8.3, (i).
(ii) Folgt aus (i), indem man Real- und Imaginärteil betrachtet.
(iii) exp(z + 2kπi) = exp(z) · exp(2πi)k = exp(z). Daraus folgen durch Einsetzen von
Definition 6.8.1 die restlichen Aussagen.
(iv) Sei exp(z) = 1 gegeben. Aus Satz 6.8.3 wissen wir, dass damit Re z = 0.
Klarerweise ist y = η + 2lπi für ein l ∈ Z und η ∈ [0, 2π). Aus (iii) folgt
exp(iη) = exp(iy) = 1.
Angenommen η , 0. Schreibe
η
η
η
exp(i ) = cos + i sin =: u + iv mit u, v ∈ R .
4
4
4
Dabei ist wegen 0 < η4 < π2 , und der Definition von π2 , sicherlich u , 0. Im Fall
v = 0 wäre exp(i η4 ) = u = ±1 und somit
exp(i π2 )
i
π η
exp(i( − )) =
= ±i..
η =
2 4
±1
exp( 4 )
Also ist x1 = π2 − 4η eine Nullstelle von cos t mit x1 ∈ (0, π2 ) im Widerspruch zur
Definition von π2 . Also muss v , 0. Klarerweise gilt auch
1 = exp(iη) = (u + iv)4 = u4 − 6u2 v2 + v4 + i 4uv(u2 − v2 ) .
Die rechte Zahl ist genau dann reell, wenn u2 − v2 = 0. Wegen u2 + v2 = 1 ist das
äquivalent zu u2 = v2 = 12 . Dann ist aber u4 − 6u2 v2 + v4 = −1 , 1.
(v) Es ist cos z = 0 genau dann, wenn exp(iz) = − exp(−iz) = exp(iπ − iz), also
wenn exp(2iz − iπ) = 1. Dieses tritt genau dann ein, wenn 2iz−iπ
2πi ∈ Z, d.h. wenn
z ∈ π2 + πZ. Analog bestimmt man die Nullstellen des Sinus.
(vi) Sei w ∈ C, w , 0, gegeben. Da exp(x) eine Bijektion von R auf R+ ist, gibt es ein
w
x ∈ R mit exp(x) = |w|. Schreibe exp
x = u + iv mit u, v ∈ R.
Klarerweise ist u2 + v2 = 1. Insbesondere gilt u ∈ [−1, 1]. Wegen cos 0 = 1
und cos π = −1 gibt es nach dem Zwischenwertsatz (Korollar 6.2.6) gibt es eine
t ∈ [0, π] mit u = cos t.
6.8. DIE EXPONENTIALFUNKTION
151
Aus u2 + v2 = 1 = (cos t)2 + (sin t)2 folgt v2 = (sin t)2 . Ist v = sin t, so setze y = t.
Sonst muss v = − sin t, und dann setze man y = −t. In jedem Falle ist cos y = u
und sin y = v und somit
w = exp(x)(cos y + i sin y) = exp(x + iy).
Ist exp(z) = exp(ζ), so folgt 1 = exp(z − ζ), also z − ζ ∈ 2πiZ.
❑
Jede komplexe Zahl w , 0 lässt sich gemäß Satz 6.8.11 als exp(z) schreiben. Wählt
man z so, dass 0 ≤ Im z < 2π, so ist nach Satz 6.8.11, (v), z eindeutig bestimmt. Also
ist exp : R × [0, 2π) → C \ {0} bijektiv.
Im w
Im z
exp(1 + 12 πi) = ie
−1 +2πi
2πi
1 +2πi
−1 +23 πi
3
2 πi
1 +23 πi
exp(z) = w
exp( 21 πi) = i
√1 (1
2
exp(1 + πi) = −e
e = exp(1)
0
−1 +πi
πi
1 +πi
−1 +21 πi
1
2 πi
1 +21 πi
+ i) = exp( 41 πi)
exp(πi) = −1
1 = exp(0) = exp(2πi)
Re w
exp( 32 πi) = −i
1
4 πi
−1
0
1
exp(1 + 32 πi) = −ie
Re z
Abbildung 6.13: Exponentialfunktion als Abbildung von C auf C \ {0}
6.8.12 Definition. Setzt man r = exp(Re z) und t = Im z, so erhält man
w = r(cos t + i sin t).
Also ist (r, t) 7→ w eine Bijektion von T : R+ × [0, 2π) → C \ {0}. (r, t) heißen dabei die
Polarkoordinaten von w.
6.8.13 Bemerkung.
Wegen Satz 6.8.11, (iii), kann dabei auch das Intervall [0, 2π) durch irgendein
halboffenes Intervall der Länge 2π, z.B. (−π, π], ersetzen.
Offensichtlich ist T : R+ × [0, 2π) → C \ {0} als Zusammensetzung von
stetigen Funktionen selbst stetig. Die Umkehrung ist nicht stetig: Es gilt
limn→∞ exp(−i n1 ) = 1, aber
1
1
lim T −1 (exp(−i )) = lim (1, 2π − ) = (1, 2π) , (1, 0) = T −1 (1).
n→∞
n
n
n→∞
Nimmt man statt [0, 2π) z.B. das Intervall [a, a + 2π), so treten entsprechende
Probleme beim Winkel a auf.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
152
Nimmt man den kritischen Winkel aus, so sind die Polarkoordinaten in beide Richtungen stetig.
6.8.14 Proposition. Die Abbildung
T : R+ × (a, a + 2π) → C \ {r exp(ia) : r ∈ [0, +∞)}
ist bijektiv, und T und T −1 sind stetig.
Beweis. Es bleibt die Stetigkeit von T −1 : D := C \ {r exp(ia) : r ∈ [0, +∞)} → R+ × (a, a + 2π) zu zeigen. Dazu sei
limn→∞ zn = z ∈ D für eine Folge aus D. Somit können wir
zn = rn exp(iαn ), n ∈ N, z = r exp(iα),
mit rn , r ∈ (0, +∞) und αn , α ∈ (a, a + 2π) schreiben. Wegen rn = |zn |, r = |z| folgt rn → r.
Ist (αn(k) )k∈N eine Teilfolge, so hat diese wegen der Kompaktheit von [a, a + 2π] eine gegen ein β ∈ [a, a + 2π]
konvergente Teilfolge (αn(k(l)) )l∈N . Somit wäre wegen der Stetigkeit von T
exp(iβ) = lim exp(iαn(k(l)) ) = lim
l→∞
l→∞
zn(k(l))
z
= = exp(iα),
rn(k(l))
r
und nach Satz 6.8.11 β − α ∈ 2πZ. Also folgt α = β und nach Bemerkung 3.2.11 gilt αn → α.
❑
6.8.15 Bemerkung. Wir sehen nun auch, dass es für n ∈ N immer n viele n-te Wurzeln
einer jeder Zahl w ∈ C \ {0} gibt:
Ist w = r(cos t + i sin t), (r, t) ∈ R+ × [0, 2π), so sind ( j = 0, . . . , n − 1)
!
√n
t + 2 jπ
t + 2 jπ
+ i sin
η j = r · cos
n
n
komplexe Zahlen, die wegen der Formel von de Moivre alle ηnj = w erfüllen.
6.9 Fundamentalsatz der Algebra
Als Anwendung der bisher entwickelten Stetigkeitstheorie wollen wir den Fundamentalsatz der Algebra beweisen. Zunächst benötigen wir ein Lemma.
6.9.1 Lemma. Ist f (z) = an zn + . . . + a0 , an , 0 ein komplexes Polynom, so hat | f (z)|
ein Minimum, d.h. es gibt eine Zahl c ∈ C mit | f (c)| ≤ | f (z)| für alle z ∈ C.
Beweis. Wir haben in Beispiel 5.3.18 gesehen, dass lim|z|→∞ |an zn + . . . + a0 | = +∞.
Insbesondere gibt es eine Zahl R > 0, sodass | f (z)| ≥ |a0 | = | f (0)|, z ∈ C mit |z| > R.
Die Kreisscheibe K := {z ∈ C : |z| ≤ R} ist kompakt, und | f (z)| ist, als Zusammensetzung der stetigen Funktionen f und |.|, stetig auf K. Daher wird ein Minimum
angenommen, minz∈K | f (z)| = | f (c)| (≤ | f (0)|). Unsere Wahl von R sichert, dass
| f (c)| = minz∈C | f (z)|.
❑
6.9.2 Satz (Fundamentalsatz der Algebra). Sei p(z) = a0 + · · · + an zn ein komplexes Polynom vom Grad n. Dann existieren n (nicht notwendig verschiedene) Zahlen
z1 , . . . , zn ∈ C, sodass
n
Y
(z − zk ).
(6.16)
p(z) = an
k=1
Beweis.
6.9. FUNDAMENTALSATZ DER ALGEBRA
153
Sei h(z) ein Polynom der Form h(z) = 1 + bzk + zk g(z) mit k ∈ N, b ∈ C \ {0}
und einem Polynom g, wobei g(0) = 0. Wir zeigen die Existenz eines u ∈ C mit
|h(u)| < 1.
Dazu wählen wir eine k-te Wurzel von − b1 (vgl. Bemerkung 6.8.15), d.h. eine
Zahl d ∈ C mit bd k = −1. Für t ∈ (0, 1] gilt
|h(td)| ≤ |1 − tk | + |tk dk g(td)| = 1 − tk + tk |dk g(td)|.
Da |dk g(td)| = 0 für t = 0, folgt aus der Stetigkeit dieses Ausdruckes bei 0, dass
|dk g(td)| ≤ 12 für t ∈ (0, δ) mit einem δ > 0. Für jedes solche t gilt |h(td)| ≤
1 − 12 tk < 1.
Nun zeigen wir, dass jedes nichtkonstante Polynom f (z) eine Nullstelle in C hat.
Nach Lemma 6.9.1 gibt es ein c ∈ C, sodass | f (c)| = minz∈C | f (z)| (siehe Lemma
6.9.1). Wäre f (c) , 0, so betrachte
h(z) :=
f (z + c)
= 1 + bk zk + bk+1 zk+1 + . . . + bn zn , bk , 0.
f (c)
Nach dem ersten Beweisschritt existiert ein u ∈ C mit |h(u)| < 1 und daher
| f (u + c)| = |h(u)| · | f (c)| < | f (c)|
im Widerspruch zu | f (c)| = minz∈C | f (z)|.
Wir zeigen nun (6.16) durch Induktion nach dem Grad von p(z). Ist der Grad
eins, also p(z) = a1 z + a0 mit a1 , 0, so ist p(z) = a1 (z − (− aa10 )).
Stimme nun (6.16) für alle Polynome vom Grad kleiner als n, sei p(z) vom Grad
n. Nach dem vorigen Beweisschritt hat p eine Nullstelle z1 . Mittels Polynomdivision und Einsetzen von z = z1 erhält man p(z) = s(z)(z − z1 ). Das Polynom
s hat den gleichen Führungskoeffizienten wie p, und lässt sich nach Induktionsvoraussetzung in der angegebenen Weise faktorisieren.
❑
6.9.3 Bemerkung. Funktionen f : R → C der Bauart
f (t) =
N
X
cn exp(itn),
n=−N
für ein N ∈ N und cn ∈ C, n = 0, . . . , N nennt man trigonometrische Polynome.
Man sieht sofort, dass f (t) = exp(iNt) · p(exp(it)), wobei p : C \ {0} → C
p(z) =
2N
X
cn−N zn .
n=0
Also ist f stetig und 2π-periodisch. Weiters stimmen zwei trigonometrische Polynome überein, wenn das ihre Koeffizienten
tun. Ist nämlich
M
N
X
X
dn exp(itn),
cn exp(itn) =
n=−N
n=−M
PN
wobei o.B.d.A. N ≥ M, so folgt n=−N
(cn − dn ) exp(itn) = 0, wobei wir b j = 0, M < j ≤ N setzten. Es folgt
P
n
q(exp(it)) = 0, t ∈ R, mit q(z) = 2N
n=0 (cn−N − dn−N )z . Also hat das Polynom q(z) unendlich viele Nullstellen und ist
damit das Nullpolynom, d.h. cn = dn , n = −N, . . . , N.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
154
Schließlich lässt sich jedes trigonometrische Polynom wegen
N
X
cn exp(itn) =
n=−N
N
X
cn (cos nt + i sin nt) = c0 +
n=−N
N
X
(cn + c−n ) cos nt +
N
X
bn sin nt,
n=1
in der Form
a0 +
N
X
an cos nt +
N
X
n=1
(cn − ic−n ) sin nt,
(6.17)
n=1
n=1
schreiben. Umgekehrt lässt sich jede Funktion der Bauart (6.17) schreiben als
a0 +
N
X
an
n=1
N
−1
N
X
X
exp(int) + exp(−int) X exp(int) − exp(−int)
a−n + ib−n
an − ibn
bn
+
=
exp(itn) + a0 +
exp(itn).
2
2i
2
2
n=−N
n=1
n=1
Somit ist (6.17) eine zweite Art trigonometrische Polynome darzustellen, wobei die Koeffizienten in (6.17) ebenfalls eindeutig sind.
6.10 Weitere wichtige elementare Funktionen
Die Funktion
π
sin x
tan : R \ { + πn : n ∈ Z} → R, tan(x) =
,
2
cos x
wird als Tangens und
cot : R \ {πn : n ∈ Z} → R, cot(x) =
cos x
,
sin x
als Cotangens bezeichnet.
y
y = tan(x)
y = cot(x)
− 3π
2
−2π
−π
3π
2
π
2
− π2
0
π
2π
x
Abbildung 6.14: Tangens und Cotangens
Betrachtet man tan eingeschränkt auf (− π2 , π2 ), so zeigt man elementar, dass tan dieses Intervall bijektiv auf R abbildet. Entsprechend bildet cot das Intervall (0, π) bijektiv
auf R ab. Die jeweiligen Umkehrfunktionen heißen arctan (Arcustangens) bzw. arccot
(Arcuscotangens).
Man kann auch sin auf das Intervall [− π2 , π2 ] einschränken, und erhält eine Bijektion
von [− 2π , π2 ] auf [−1, 1]. Die Umkehrfunktion davon heißt arcsin (Arcussinus). Entsprechend bildet cos das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion davon
heißt arccos (Arcuscosinus).
6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN
155
y
y = arctan(x)
y = arccot(x)
π
π
2
−π
−2π
π
0
2π
x
− π2
Abbildung 6.15: Arcustangens und Arcuscotangens
y
y = arcsin(x)
y = arccos(x)
π
π
2
−2
−1
0
1
2
x
− π2
Abbildung 6.16: Arcussinus und Arcuscosinus
Ähnlich wie sin und cos sind Sinus Hyperbolicus sinh und Cosinus Hyperbolicus
cosh defininiert:
cosh z :=
exp(z) + exp(−z)
exp(z) − exp(−z)
, sinh z :=
, z ∈ C.
2
2
Die Werte von cosh z und sinh z liegen im allgemeinen in C. Für reelle z = x liegen
cosh x und sinh x offensichtlich in R.
Da sinh : R → R bijektiv ist, hat er eine Inverse die mit areasinh (Areasinus Hyperbolicus) bezeichnet wird. Die Funktion cosh eingeschränkt auf [0, +∞) bildet dieses
Intervall bijektiv auf [1, +∞) ab. Die entsprechende Umkehrfunktion von [1, +∞) auf
[0, +∞) heißt areacosh (Areacosinus Hyperbolicus).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
156
y
4
3
y = sinh(x)
y = cosh(x)
2
1
−3
−2
−1
−1
0
1
2
x
3
−2
−3
−4
Abbildung 6.17: Sinus Hyperbolicus und Cosinus Hyperbolicus
y
y = areasinh(x)
y = areacosh(x)
3
2
1
−6
−5
−4
−3
−2
−1
−1
0
1
2
3
4
5
6
x
−2
−3
Abbildung 6.18: Areasinus Hyperbolicus und Areacosinus Hyperbolicus
sinh x
Schließlich ist tanh : R → R definiert durch tanh x = cosh
x , und coth : R \ {0} → R
x
durch coth x = cosh
.
sinh x
Dabei bildet tanh die reellen Zahlen bijektiv auf (−1, 1) und coth die Menge R \ {0}
bijektiv auf R \ [−1, 1]. Die entsprechenden Umkehrfunktion heißen areatanh (Areatangens Hyperbolicus) und areacoth (Areacotangens Hyperbolicus).
6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN
157
y
y = tanh(x)
y = coth(x)
1
−2
−1
1
0
x
2
−1
Abbildung 6.19: Tangens Hyperbolicus und Cotangens Hyperbolicus
y
y = areatanh(x)
y = areacoth(x)
2
1
−6
−4
−2
0
2
4
6
x
−1
−2
Abbildung 6.20: Areatangens Hyperbolicus und Areacotangens Hyperbolicus
158
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
Kapitel 7
Differentialrechnung
Bewegt sich etwa ein Punkt, und bezeichnet s(t) den zum Zeitpunkt t zurückgelegten
Weg, so erhält man die Geschwindigkeit zum Zeitpunkt t, indem man
s(t + h) − s(t)
h
betrachtet, und h immer kleiner macht. Um derlei Betrachtungen, die in den Naturwissenschaften eine wichtige Rolle spielen, einen mathematisch exakten Hintergrund zu
geben, wollen wir den Begriff der Ableitung einführen.
7.1 Begriff der Ableitung
7.1.1 Definition. Sei f : (a, b) → R (C) und sei x ∈ (a, b). Dann heißt f differenzierbar
im Punkt x, falls der Grenzwert
lim
t→x
f (t) − f (x)
∈ R (C)
t−x
existiert. Dieser heißt dann die Ableitung von f an der Stelle x, und man schreibt dafür
f ′ (x) oder ddtf (x).
Ist f zumindest auf [a, b) definiert1 , und existiert
lim
t→a+
f (t) − f (a)
∈ R (C),
t−a
so spricht man von rechtsseitiger Differenzierbarkeit im Punkt a und schreibt f ′ (a)+
dafür.
Entsprechend definiert man die linksseitige Differenzierbarkeit im Punkt b und die
linksseitige Ableitung f ′ (b)− .
Anschaulich ist die Ableitung f ′ (x) gerade die Steigung der Tangente (in der folgenden Grafik als durchgehende Gerade gezeichnet) am Punkt (x, f (x)). Diese Steigung der Tangente erhält man als Grenzwert der Steigungen der Verbindungsgeraden
von (x, f (x)) und (t, f (t)) (als strichlierte Gerade gezeichnet) für t → x.
7.1.2 Fakta.
1 Klarerweise
könnte f sogar auf einer noch größeren Menge definiert sein.
159
KAPITEL 7. DIFFERENTIALRECHNUNG
160
f
Steigung =
f (t)− f (x)
t−x
Steigung = f ′ (x)
t′′
x
t′
t
Abbildung 7.1: Ableitung als Grenzwert der Differenzenquotienten
1. Wie in Fakta 5.3.14 bemerkt, existiert ein Grenzwert limt→x h(t) genau dann,
wenn die beiden einseitigen Grenzwerte limt→x− h(t) und limt→x+ h(t) existieren
und übereinstimmen.
Also ist f bei x ∈ (a, b) genau dann differenzierbar, wenn f bei x links- und
rechtsseitig differenzierbar ist und f ′ (x)− und f ′ (x)+ übereinstimmen. In diesem
Fall ist f ′ (x)− = f ′ (x) = f ′ (x)+ .
2. Da nach Lemma 5.3.8 genau dann y = limt→x h(t), wenn für jede gegen x konvergente Folge (tn )n∈N mit tn , x, n ∈ N, folgt, dass h(tn ) → y, ist f bei x genau
dann differenzierbar mit Ableitung f ′ (x), wenn für jede solche Folge
f ′ (x) = lim
n→∞
f (tn ) − f (x)
.
tn − x
Entsprechend lassen sich die einseitigen Ableitungen charakterisieren.
3. Entweder aus der letzten Behauptung oder aus (5.3) folgt, dass die Ableitung
f ′ (x) im Falle ihrer Existenz nur vom Aussehen von f lokal bei x, also von
f |(x−δ,x+δ) für jedes δ > 0, abhängt.
4. Wegen (5.10) ist eine Funktion f : (a, b) → C genau dann differenzierbar bei
x ∈ (a, b), wenn Re f, Im f : (a, b) → R es sind, wobei
f ′ (x) = (Re f )′ (x) + i(Im f )′ (x).
(7.1)
Analog kann man die Differenzierbarkeit von R p -wertigen Funktionen f auf (a, b) definieren. Dabei wird es sich herausstellen, dass dass solche Funktionen genau dann
differenzierbar sind, wenn alle Komponentenfunktionen π j ◦ f : (a, b) → R differenzierbar sind. Siehe die Analysis 2 Vorlesung.
7.1. BEGRIFF DER ABLEITUNG
161
7.1.3 Bemerkung. Ist f definiert auf einer offenen Teilmenge der komplexen Zahlen
f (w)
und bildet wieder in C hinein ab, so kann man analog f ′ (w) := limz→w f (z)−
bez−w
trachten. Existiert dieser Grenzwert, so heißt f in w komplex differenzierbar. Wir wollen das hier aber nicht weiter verfolgen, denn dies führt zur Theorie der komplexen
Analysis, die in einer eigenen Vorlesung behandelt wird.
7.1.4 Beispiel.
(i) Für jedes λ ∈ R (C) ist die konstante Funktion f (t) = λ, t ∈ (−∞, +∞), an jeder
Stelle x differenzierbar, und ihre Ableitung im Punkt x ist gleich 0.
(ii) Die reellwertige Funktion t 7→ f (t) = tn , n ∈ N für t ∈ (−∞, +∞) ist auch an
jedem Punkt x differenzierbar mit der Ableitung
lim
t→x
(t − x)(tn−1 + tn−2 x + . . . + txn−2 + tn−1 )
t n − xn
= lim
= nxn−1 .
t→x
t−x
t−x
(iii) Die stetige Funktion



t sin 1t ,
f (t) = 

0,
t,0
t=0
(7.2)
ist im Punkt x = 0 nicht differenzierbar. Denn es gilt
t sin 1t − 0
f (t) − f (0)
1
=
= sin .
t−0
t−0
t
P
n
(iv) Sei f (z) = ∞
n=0 an z eine Potenzreihe mit Konvergenzradius R > 0. Für f |(−R,R) :
(−R, R) → C gilt
∞
X
f (t) − f (0)
= lim
an tn−1 .
lim
t→0
t→0
t
n=1
P
n
Diese Potenzreihe rechts konvergiert genau dann, wenn ∞
n=0 an t es tut und hat
somit auch Konvergenzradius R. Sie ist daher stetig in t. Also ist obiger Limes
gleich a1 . Später werden wir f ′ (x) für alle x ∈ (−R, R) berechnen.
(v) Für ein festes w ∈ C gilt
lim
t→x
exp(w(t − x)) − 1
exp(wt) − exp(wx)
= exp(wx) lim
=
t→x
t−x
t−x
exp(wτ) − 1
= w exp(wx),
τ
wobei die letzte Gleichheit aus (iv) folgt, da der Koeffizient a1 in der Potenzreihe
P wn n
exp(wτ) = ∞
n=0 n! τ eben w ist.
exp(wx) lim
τ→0
Setzt man w = 1, so folgt exp′ (x) = exp(x).
(vi) Als weitere Anwendung der Rechnung im letzten Beispiel berechnen wir
Im exp(it) − Im exp(ix)
sin(it) − sin(ix)
= lim
=
t→x
t−x
t−x
!
exp(it) − exp(ix)
= Im(i exp(ix)) = Re(exp(ix)) = cos(x).
Im lim
t→x
t−x
sin′ (x) = lim
t→x
Dabei haben wir die Stetigkeit von z 7→ Im z verwendet. Genauso erhält man
cos′ (x) = − sin(x).
KAPITEL 7. DIFFERENTIALRECHNUNG
162
(vii) Für t ∈ R betrachte die Funktion f
t2



t2 sin 1t ,
f (t) = 

0 ,
t,0
t=0
f (t)
−t2
Die Funktion f ist an der Stelle x = 0 differenzierbar mit Ableitung 0, denn es
gilt
f (t) − f (0)
1
= t sin → 0 für t → 0.
t−0
t
An einer Stelle x , 0 ist f differenzierbar und es gilt wie wir später sehen werden
f ′ (x) = 2x sin
1
1
− cos .
x
x
7.1.5 Lemma. Ist f im Punkt x differenzierbar, so ist sie dort stetig.
Beweis. Aus limt→x
f (t)− f (x)
t−x
= α folgt
#
"
f (t) − f (x)
(t − x) = α · 0 = 0.
lim f (t) − f (x) = lim
t→x
t→x
t−x
❑
7.1.6 Bemerkung. Wie man am Beispiel der Funktion f aus (7.2) sieht, gilt die Umkehrung von Lemma 7.1.5 nicht.
7.1.7 Satz. Seien f, g : (a, b) → R (C) beide differenzierbar im Punkt x ∈ (a, b),
und α, β ∈ R (C). Dann sind auch α f + βg, f g und (falls g(x) , 0) gf an der Stelle x
differenzierbar, und es gilt
(α f + βg)′ (x) = α f ′ (x) + βg′ (x),
( f g)′ (x) = f ′ (x)g(x) + f (x)g′ (x) (Produktregel),
′
′
f (x)g′ (x)
(Quotientenregel).
gf (x) = f (x)g(x)−
g(x)2
Entsprechende Regeln gelten auch für einseitige Ableitungen.
Beweis.
lim
t→x
(α f + βg)(t) − (α f + βg)(x)
f (t) − f (x)
g(t) − g(x)
= α lim
+ β lim
.
t→x
t→x
t−x
t−x
t−x
Da f nach Lemma 7.1.5 bei x stetig ist, folgt aus den Rechenregeln für Grenzwerte
(vgl. Abschnitt 5.3)
!
!
f (t) − f (x)
g(t) − g(x)
f (t)g(t) − f (x)g(x)
+ lim
= lim f (t)
g(x) =
lim
t→x
t→x
t→x
t−x
t−x
t−x
7.1. BEGRIFF DER ABLEITUNG
163
f (t) − f (x)
g(t) − g(x)
+ g(x) lim
= f (x)g′ (x) + f ′ (x)g(x).
t→x
t→x
t→x
t−x
t−x
Die letzte Quotientenregel folgt ebenfalls aus der Stetigkeit und den Rechenregeln für
Grenzwerte indem man in
f (x)
f (t)
"
#
f (t) − f (x)
1
g(t) − g(x)
g(t) − g(x)
g(x)
.
=
− f (x)
t−x
g(t)g(x)
t−x
t−x
lim f (t) · lim
t → x streben lässt.
❑
7.1.8 Beispiel. Wir haben schon gesehen, dass f (t) = tn für alle n ∈ N differenzierbar
ist mit f ′ (x) = nxn−1 . Um das auch für n ∈ −N zu zeigen verwende man die Quotientenregel:
!′
1
(x|n| )′
n ′
(x ) = |n| = − 2|n| = nx|n|−1−2|n| = nxn−1 .
x
x
Weiters ist eine rationale Funktion in jedem Punkt, wo der Nenner nicht verschwindet,
differenzierbar.
7.1.9 Satz (Kettenregel). Sei f : (a, b) → R reellwertig und g : (c, d) → R (C), sodass
f (a, b) ⊆ (c, d), und x ∈ (a, b).
Ist f bei x und g bei f (x) differenzierbar, so ist g ◦ f bei x differenzierbar, wobei
(g ◦ f )′ (x) = g′ ( f (x)) · f ′ (x).
Beweis. Es zu zeigen, dass
(g ◦ f )(tn ) − (g ◦ f )(x)
→ g′ ( f (x)) · f ′ (x)
tn − x
(7.3)
für jede gegen x konvergente Folge (tn )n∈N aus (a, b) \ {x}. Wir unterscheiden dabei für
die Menge M = {n ∈ N : f (tn ) = f (x)} zwei Fälle.
Ist M endlich, so folgt für n ≥ max(M)
(g ◦ f )(tn ) − (g ◦ f )(x) g( f (tn )) − g( f (x)) f (tn ) − f (x)
=
·
→ g′ ( f (x)) · f ′ (x).
tn − x
f (tn ) − f (x)
tn − x
Ist dagegen M unendlich, so gilt für diese unendlich vielen n ∈ M, f (tntn)−−xf (x) = 0 und
g( f (tn )) = g( f (x)). Somit gilt f ′ (x) = 0 und
( g( f (tn ))−g( f (x)) f (tn )− f (x)
(g ◦ f )(tn ) − (g ◦ f )(x)
· tn −x , n < M
f (tn )− f (x)
.
=
tn − x
0,
n∈M
Wegen der Stetigkeit von f bei x gilt f (tn ) → f (x). Damit ist obiger Differenzenquotient beliebig nahe bei 0, wenn nur n hinreichend groß ist. Es folgt (7.3).
❑
7.1.10 Bemerkung. Es gelten diverse einseitige Varianten von Satz 7.1.9, deren
Beweise fast gleich verlaufen:
Ist f : (a, b) → (c, d], g : (c, d] → R (C), x ∈ (a, b), f (x) = d sowie f bei x differenzierbar und g bei f (x) = d linksseitig differenzierbar, so folgt (g ◦ f )′ (x) = g′ ( f (x))− · f ′ (x).
KAPITEL 7. DIFFERENTIALRECHNUNG
164
Ist f : [a, b) → (c, d), g : (c, d) → R (C), sowie f bei a rechtsseitig differenzierbar und
g bei f (a) differenzierbar, so folgt (g ◦ f )′ (a)+ = g′ ( f (a)) · f ′ (a)+ .
usw. .
7.1.11 Beispiel. Sei f (x) = x2 sin 1x , x , 0 wie in Beispiel 7.1.4, (vii). Durch Anwendung der Produkt und der Kettenregel ergibt sich (x , 0)
!′
!
!′
1
1
1
1
1
1
1
f ′ (x) = (x2 )′ sin + x2 sin
= 2x · sin + x2 · cos
= 2x · sin − cos .
·
x
x
x
x
x
x
x
7.1.12 Satz. Sei f : (a, b) → (c, d) bijektiv und streng monoton, und bezeichne mit
g : (c, d) → (a, b) ihre Umkehrfunktion. Ist f an einer Stelle x differenzierbar und gilt
f ′ (x) , 0, so ist g an der Stelle f (x) differenzierbar, und es gilt
g′ ( f (x)) =
1
.
f ′ (x)
Beweis. Wegen Korollar 6.5.3 sind f und g beide stetig. Ist daher (tn )N eine gegen f (x)
konvergente Folge aus (c, d) \ { f (x)}, so ist g(tn ) N eine gegen x = g( f (x)) konvergente
Folge aus (a, b) \ {x}. Mit τn := g(tn ) folgt
lim
n→∞
g(tn ) − x
1
1
g(tn ) − g( f (x))
= lim
= ′ .
=
f
(τ
)−
f
(x)
n
n→∞
tn − f (x)
f (x)
f g(tn ) − f (x) limn→∞
τn −x
❑
Auch bei obigem Satz gelten entsprechende Aussagen für einseitige Ableitungen,
wenn f und damit auch g an einem/beiden der Ränder definiert ist.
7.1.13 Beispiel. Betrachte die Funktion exp(t) : R → R+ . Diese ist stetig und bijektiv.
Ihre Umkehrfunktion ist ln(u) : R+ → R. Es folgt (y = exp(x))
ln′ (y) = ln′ ( f (x)) =
1
1
1
1
=
=
= .
exp′ (x) exp(x) exp(ln(y)) y
7.1.14 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem
Intervall I ⊆ R. Ist f an allen x ∈ I differenzierbar, wobei im Falle, dass x der linke
bzw. rechte Intervallrand von I ist und dieser in I liegt, die rechts- bzw. linksseitige
Differenzierbarkeit gemeint ist, so nennt man die Funktion
(
I → R (C)
′
f :
x 7→ f ′ (x)
Ableitung von f auf I. Ist x der linke bzw. rechte Intervallrand von I und liegt dieser in
I, so ist unter f ′ (x) die rechts- bzw. linksseitige Ableitung an der Stelle x zu verstehen.
Einer Funktion f wird also eine weitere Funktion zugeordnet, die die aus f abgeleitete Funktion f ′ genannt wird. Ihr Wert an einer Stelle x ist gerade der Limes
des Differenzenquotienten von f bei x. Diese Sichtweise erklärt auch die Schreibweise
f ′ (x) aus Definition 7.1.1. Die Schreibweise ddtf (x) erklärt sich aus der Interpretation
der Ableitung als Grenzfall des Zuwachses von f dividiert durch den Zuwachs von t.
Es ist also sinnvoll von Eigenschaften der Funktion f ′ , wie zum Beispiel Stetigkeit oder auch wieder Differenzierbarkeit zu sprechen. Wie wir in Beispiel 7.1.4, (vii),
gesehen haben, muss die Ableitung f ′ nicht notwendigerweise stetig sein.
7.2. MITTELWERTSÄTZE
165
7.1.15 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem
Intervall I ⊆ R, sodass die Ableitung f ′ von f auf ganz I existiert. Ist die Ableitung f ′
an einer Stelle x differenzierbar, so bezeichnet man ( f ′ )′ (x) mit f ′′ (x) und spricht von
der zweiten Ableitung von f an der Stelle x. Im Falle, dass x Intervallrand ist, so sei
wieder die entsprechende einseitige Ableitung gemeint.
Allgemeiner definiert man höhere Ableitungen rekursiv durch
f (n) (x) := ( f (n−1) )′ (x), n ∈ N,
wann immer f (n−1) auf I definiert ist und bei x differenzierbar ist. Man sagt dann, dass
f bei x n-mal differenzierbar ist.
Existiert f (n) an allen Stellen x ∈ I und ist f (n) stetig auf (a, b), so spricht man von
einer n-mal stetig differenzierbaren Funktion. Die Menge aller n-mal stetig differenzierbaren Funktionen auf I wird mit Cn (I) bezeichnet.
Mit f ∈ C∞ (I) wollen wir zum Ausdruck bringen, dass f auf I beliebig oft differenzierbar ist.
Aus der Produktregel erhält man mittels vollständiger Induktion die oft nützliche
Formel
!
n
X
n (k) (n−k)
(n)
( f g) =
f g
.
k
k=0
7.1.16 Beispiel.
Sei f (x) = x3 − 2x. Dann gilt
f ′ (x) = 3x2 − 2, f ′′ (x) = 6x, f ′′′ (x) = 6, f ′′′′ (x) = 0, f (5) (x) = 0, . . .
Man sieht genauso, dass jedes Polynom p beliebig oft differenzierbar ist und
wenn n der Grad von p ist, p(n+1) (x) = p(n+2) (x) = . . . = 0 gilt.
Sei f die Funktion



 x2
f (x) = 

−x2
, x≥0
, x≤0
Die Ableitung von f ist f ′ (x) = |x|. Die zweite Ableitung existiert also an der
Stelle x = 0 nicht.
7.2 Mittelwertsätze
7.2.1 Definition. Sei hX, dX i ein metrischer Raum, E ⊆ X und sei f : E → R. Man
sagt f hat ein lokales Maximum in einem Punkt x ∈ E, falls
∃ δ > 0 : f (x) ≥ f (t) für t ∈ E ∩ Uδ (x).
Analog definiert man ein lokales Minimum. Will man sich nicht festlegen, ob x ein
Minimum oder Maximum ist, so spricht man zusammenfassend von einem lokalen
Extremum.
Man beachte den Unterschied zum Begriff des Maximums. Das ist eine Stelle x ∈
E, sodass für jedes t ∈ E gilt f (x) ≥ f (t), also nicht nur lokal bei x sondern global.
Man spricht dann von einem absoluten Maximum. Analog für absolute Minima bzw.
zusammenfassend absolute Extrema. Natürlich ist ein absolutes Extremum stets auch
ein lokales.
KAPITEL 7. DIFFERENTIALRECHNUNG
166
7.2.2 Satz. Sei f : [a, b] → R. Hat f an einer Stelle x ∈ (a, b) ein lokales Extremum
und ist f bei x differenzierbar, so muss f ′ (x) = 0.
Beweis. Wir nehmen an, dass x ein lokales Maximum ist. Den Fall eines lokalen Minimums behandelt man analog.
Wähle δ > 0 wie in Definition 7.2.1. Es gilt also f (x) ≥ f (t) für alle |t − x| < δ. Im
Falle t > x gilt somit
f (t) − f (x)
≤ 0,
t−x
und daher f ′ (x) = limt→x+
f (t)− f (x)
t−x
≤ 0. Ist jedoch t < x, so impliziert f (x) ≥ f (t)
f (t) − f (x)
≥ 0.
t−x
Also muss auch f ′ (x) = limt→x−
f (t)− f (x)
t−x
≥ 0.
❑
Geometrisch bedeutet Satz 7.2.2, dass an
einem lokalen Extremum die Tangente
an die Kurve y = f (x), falls eine solche
existiert, waagrecht liegen muss.
7.2.3 Korollar (Satz von Rolle). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar.
Gilt f (a) = f (b) = 0, so gibt es ein ζ ∈ (a, b), sodass f ′ (ζ) = 0.
Beweis. Aus Korollar 6.1.12 wissen wir, dass f auf [a, b] ein Maximum und ein Minimum besitzt. Also gibt es x− , x+ ∈ [a, b], sodass
f (x− ) ≤ f (t) ≤ f (x+ ), für alle t ∈ [a, b].
Sind beide x− und x+ Randpunkte, d.h. x− , x+ ∈ {a, b}, so muss f (t) = 0 für alle
t ∈ [a, b] und daher f ′ (t) = 0 für alle t ∈ (a, b) sein.
Ist x− in (a, b) enthalten, so muss nach Satz 7.2.2 f ′ (x− ) = 0. Im Falle x+ ∈ (a, b)
schließt man genauso.
❑
a
ζ
b
Abbildung 7.2: Satz von Rolle
7.2. MITTELWERTSÄTZE
167
7.2.4 Korollar. Sei f : [a, b] → R stetig und n-mal differenzierbar auf (a, b). Weiters
habe f mindestens n + 1 Nullstellen in [a, b]. Dann existiert ξ ∈ (a, b) mit f (n) (ξ) = 0.
Beweis. Der Fall n = 1 folgt sofort aus Korollar 7.2.3. Angenommen der Satz gelte für
n − 1. Wir zeigen ihn für n.
Nach Korollar 7.2.3 liegt zwischen je zwei Nullstellen von f mindestens eine
Nullstelle von f ′ . Also hat f ′ mindestens n Nullstellen. Nach Induktionsvoraussetzung
existiert ein ξ mit f (n) (ξ) = ( f ′ )(n−1) (ξ) = 0.
❑
7.2.5 Satz (Mittelwertsatz). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar.
Dann existiert ein Punkt ζ ∈ (a, b) mit
f (b) − f (a)
= f ′ (ζ).
b−a
Beweis. Betrachte die Funktion F : [a, b] → R
F(t) := f (t) − f (a) −
f (b) − f (a)
(t − a).
b−a
Dann ist F auf [a, b] stetig (vgl. Korollar 6.1.8) und auf (a, b) differenzierbar (vgl.
Beispiel 7.1.4, (i), (ii) und Satz 7.1.7), wobei F(a) = F(b) = 0 und für x ∈ (a, b)
F ′ (x) = f ′ (x) −
f (b) − f (a)
.
b−a
Wenden wir Korollar 7.2.3 an, so folgt sofort die Behauptung.
❑
f (b)
f (a)
a
ζ
b
Abbildung 7.3: Mittelwertsatz
7.2.6 Bemerkung. Satz 7.2.5, welcher auch 1. Mittelwertsatz der Differentialrechnung
genannt wird, besagt, dass man (falls durchwegs Tangenten existieren) stets eine Tangente findet, welche parallel zur Sekante durch die Punkte (a, f (a)) und (b, f (b)) liegt.
Die Stelle ζ aus Satz 7.2.5, an der die Steigung der Kurve gleich der mittleren
Steigung im Intervall [a, b] ist, ist nicht eindeutig bestimmt.
KAPITEL 7. DIFFERENTIALRECHNUNG
168
Obwohl man es auf den ersten Blick nicht sieht, so hat der Mittelwertsatz doch
weitreichende Folgerungen.
7.2.7 Korollar. Sei I ⊆ R ein Intervall und f : I → R stetig. Sind a, b die Intervallränder von I, so sei f auf (a, b) differenzierbar. Dann gilt:
Ist f ′ (x) ≥ 0 (> 0), für alle x ∈ (a, b), so ist f (streng) monoton wachsend.
Ist f ′ (x) ≤ 0 (< 0), für alle x ∈ (a, b), so ist f (streng) monoton fallend.
Ist f ′ (x) = 0, für alle x ∈ (a, b), so ist f konstant.
Bezüglich der Umkehrung gilt nur, dass, wenn f monoton wachsend (fallend) ist,
für ihre Ableitung immer f ′ (x) ≥ 0 (≤ 0) gilt.
Beweis. Seien x1 , x2 ∈ I, x1 < x2 . Dann existiert eine Stelle x ∈ (x1 , x2 ) mit
f (x2 ) − f (x1 ) = (x2 − x1 ) f ′ (x).
Daraus folgt unmittelbar das behauptete Monotonieverhalten.
Ist umgekehrt f monoton wachsend (fallend), so gilt für den Differenzenquotient
für alle x, t ∈ (a, b)
f (t) − f (x)
≥ 0 (≤ 0).
t−x
Für t → x folgt f ′ (x) ≥ 0 (≤ 0).
❑
7.2.8 Beispiel. Dass aus der strengen Monotonie einer Funktion f nicht notwendigerweise f ′ (x) > 0 bzw. f ′ (x) < 0 für alle x folgt, sieht man anhand eines einfachen
Beispiels.
Die Funktion f (x) = x3 ist auf R streng monoton wachsend. Ihre Ableitung f ′ (x) =
3x2 ist nur ≥ 0, aber nicht > 0 für alle x ∈ R.
7.2.9 Bemerkung. Der Schluss f ′ (x) ≡ 0 ⇒ f ≡ c für ein festes c gilt auch für komplexwertige Funktionen. Das sieht man leicht, indem man f in Real- und Imaginärteil
aufspaltet (vgl. (7.1)).
7.2.10 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b. Weiters sei
f : I → R (C) stetig und auf (a, b) differenzierbar.
Ist a ∈ I und existiert limt→a+ f ′ (t), so ist f bei a rechtsseitig differenzierbar, sodass
limt→a+ f ′ (t) = f ′ (a)+ . Entsprechendes gilt für t → b−, wenn b ∈ I.
Somit gilt f ∈ C1 (I) genau dann, wenn f ∈ C1 (a, b) und aus a ∈ I die Existenz des
Grenzwertes limt→a+ f ′ (t) und aus b ∈ I die von limt→b− f ′ (t) folgt.
Beweis. Ist f reellwertig, so gibt es zu jedem t ∈ (a, b) ein x ∈ (a, t), sodass
f (a)
somit gegen f ′ (a)+ .
f ′ (x). Für t → a+ konvergiert f (t)−
t−a
Ist f komplexwertig, so betrachte man Real- und Imaginärteil.
f (t)− f (a)
t−a
=
❑
′
Obwohl die Ableitung f einer auf einem Intervall (a, b) differenzierbaren Funktion
nicht notwendig stetig sein muss, so gilt trotzdem stets die Zwischenwerteigenschaft.
7.2.11 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b und f : I →
R differenzierbar. Sind x1 , x2 ∈ I und c ∈ R mit f ′ (x1 ) < c < f ′ (x2 ), dann existiert eine
Stelle x , x1 , x2 zwischen x1 und x2 mit f ′ (x) = c.
7.2. MITTELWERTSÄTZE
169
Ist f ′ (x) , 0 für alle x ∈ I, so gilt entweder immer f ′ (x) > 0, x ∈ I, oder immer f ′ (x) < 0, x ∈ I. Sie sind daher entweder streng monoton wachsend oder streng
monoton fallend.
Beweis. Wir nehmen zunächst x1 < x2 an. Betrachte die Funktion g : I → R, g(t) =
f (t) − ct. Für ihre Ableitung gilt
g′ (x1 ) = f ′ (x1 ) − c < 0, g′ (x2 ) = f ′ (x2 ) − c > 0.
Sei x ∈ [x1 , x2 ] eine Stelle, an der g ihr Minimum annimmt. Wegen 0 = g′ (x) =
f ′ (x) − c, genügt es x , x1 , x2 zu zeigen. Wegen g′ (x1 ) < 0 existiert ein δ > 0 mit
g(t) − g(x1 )
< 0, x1 < t < x1 + δ.
t − x1
Also muss g(t) < g(x1 ) für solche Werte von t. Der Punkt x1 scheidet als Kandidat für
das Minimum also aus. Wegen g′ (x2 ) > 0 folgt die Existenz eines δ > 0, sodass
g(t) − g(x2 )
> 0, x2 − δ < t < x2 .
t − x2
Also ist g(t) < g(x2 ) für solche t, und der Punkt x2 kommt daher auch nicht in Frage.
Den Fall x1 > x2 führt man durch die Betrachtung von − f auf obigen Fall zurück.
Die letzte Aussage folgt sofort aus der eben bewiesenen Zwischenwerteigenschaft.
❑
7.2.12 Korollar. Sei f differenzierbar auf (a, b). Dann hat f ′ keine Sprungstelle in (a, b).
Beweis. An einer Sprungstelle existieren f ′ (x+) := limt→x+ f ′ (t) und f ′ (x−) := limt→x− f ′ (t), es sind jedoch nicht beide
gleich f ′ (x). Angenommen es ist f ′ (x+) < f ′ (x), also f ′ (x+) + ǫ ≤ f ′ (x) für ein ǫ > 0. Also gilt
f ′ (t) +
ǫ
≤ f ′ (x), für alle t ∈ (x, t0 ],
2
für ein t0 > x. Also nimmt f ′ (t) für x < t < t0 keine Werte in ( f ′ (x) − 2ǫ , f ′ (x))
obiger Zwischenwerteigenschaft.
⊆ ( f ′ (t0 ), f ′ (x)) an. Das widerspricht
❑
Wir benötigen im Folgenden eine Verallgemeinerung von Satz 7.2.5.
7.2.13 Satz (Verallgemeinerter Mittelwertsatz). Seien f, g : [a, b] → R stetig und
differenzierbar auf (a, b). Weiters gelte g′ (t) , 0 für alle t ∈ (a, b). Dann existiert eine
Stelle ζ ∈ (a, b) mit
f (b) − f (a)
f ′ (ζ)
= ′ .
(7.4)
g(b) − g(a)
g (ζ)
Beweis. Zunächst existiert nach Satz 7.2.5 ein x ∈ (a, b) mit g(b) − g(a) = g′ (x)(b − a),
woraus wir g(b) − g(a) , 0 schließen. Somit ist die Funktion F : [a, b] → R,
F(t) = f (t) − f (a) −
f (b) − f (a)
(g(t) − g(a)),
g(b) − g(a)
wohldefiniert, stetig und auf (a, b) differenzierbar, wobei
F ′ (t) = f ′ (t) −
f (b) − f (a) ′
g (t).
g(b) − g(a)
Weiters gilt F(a) = F(b) = 0. Somit gibt es nach Korollar 7.2.3 ein ζ ∈ (a, b) mit
F ′ (ζ) = 0, und daher (7.4).
❑
KAPITEL 7. DIFFERENTIALRECHNUNG
170
Beachte, dass man für g(t) = t gerade den Mittelwertsatz erhält. Satz 7.2.13 heißt
auch 2. Mittelwertsatz der Differentialrechnung. Wir werden ihn verwenden, um eine
sehr nützliche Methode herzuleiten, Limiten zu berechnen.
7.2.14 Korollar (Regel von de L’Hospital2 ). Seien f, g : (a, b) → R differenzierbar
auf (a, b), wobei a, b, ∈ R ∪ {±∞}, −∞ ≤ a < b ≤ +∞. Für x ∈ (a, b) hinreichend nahe
bei a gelte g′ (x) , 0, und
lim f (x) = lim g(x) = 0,
(7.5)
lim g(x) = +∞.
(7.6)
x→a+
x→a+
oder
x→a+
Dann gilt
lim
x→a+
f ′ (x)
f (x)
= A ⇒ lim
= A,
x→a+ g(x)
g′ (x)
(7.7)
mit A ∈ R ∪ {±∞}.
Die analoge Aussage ist richtig, wenn man überall x → a+ durch x → b− oder in
(7.6) +∞ durch −∞ ersetzt.
Beweis. Da die Grenzwerte in (7.7) nur von den Funktionswerten lokal bei x abhängen
(vgl. (5.3)), können wir b nötigenfalls kleiner machen, sodass g′ (x) , 0 auf ganz (a, b).
Damit kann g auf (a, b) höchstens eine Nullstelle haben, da sonst nach Korollar 7.2.3
g′ (ζ) = 0 für ein ζ ∈ (a, b). Machen wir b nötigenfalls nochmals kleiner, so können wir
auch g(x) , 0 auf ganz (a, b) annehmen.
Gilt (7.6), so muss wegen dem Zwischenwertsatz, Korollar 6.2.6, insbesondere
g(x) > 0 für alle x ∈ (a, b) gelten. Außerdem hat nach Korollar 7.2.11 g′ (x) immer
das selbe Vorzeichen. Wegen (7.6) gibt es aber sicher a < s < t g(t).
Mit dem Mittelwertsatz Satz 7.2.5 folgt daraus g′ (x) < 0 für ein und daher für alle
x ∈ (a, b). Also ist g unter der Voraussetzung (7.6) auf ganz (a, b) streng monoton
fallend.
′
(t)
Sei α ∈ R, α > A, und wähle r ∈ R mit A < r < α. Wegen limt→a+ gf ′ (t)
= A
existiert ein c ∈ (a, b) mit
f ′ (t)
< r für t ∈ (a, c).
g′ (t)
Sind dann x, y ∈ (a, c), x < y beliebig, so folgt aus Satz 7.2.5
f ′ (t)
f (x) − f (y)
= ′
< r,
g(x) − g(y)
g (t)
(7.8)
für ein t ∈ (x, y) ⊆ (a, c).
Ist die Bedingung (7.5) erfüllt, so lässt man in obiger Beziehung x gegen a streben
und erhält
f (y)
≤ r < α für y ∈ (a, c).
g(y)
Ist nun Bedingung (7.6) ist erfüllt, so halte man y in (7.8) fest. Da g auf (a, b) streng
monoton fällt und g(x) > 0, folgt
!
f (x)
f (y)
f ′ (t) g(x) − g(y) f (y)
g(y)
+
=
+
<r 1−
, x ∈ (a, c).
g(x) g′ (t)
g(x)
g(x)
g(x)
g(x)
2 Guillaume
Francois L’Hospital, Marquis de Saint-Mesme, geb.1661 Paris, gest.3.2.1704 Paris
7.2. MITTELWERTSÄTZE
171
Lässt man hier x → a+ streben, so konvergiert die rechte Seite gegen r (> α). Also
folgt die Existenz eines d ∈ (a, c), sodass
f (x)
< α, a < x < d.
g(x)
Wir haben also unter jeder der Voraussetzungen (7.6) und (7.7) nachgewiesen, dass für
ein gewisses ρ ∈ (a, b)
f (t)
< α, wenn nur t ∈ (a, ρ).
g(t)
Wendet man das auf − f und −A statt f und A an, so sieht man, dass es auch zu jedem
β ∈ R, β < A ein ρ ∈ (a, b) gibt, sodass
f (t)
> β, wenn nur t ∈ (a, ρ).
g(t)
Somit folgt lim x→a+
f (x)
g(x)
= A (vgl. Bemerkung 3.6.1).
❑
7.2.15 Bemerkung. Indem man eine Funktion f : [a, b] → C in Real- und Imaginärteil
zerlegt, folgt sofort die Gültigkeit der Regel von de L’Hospital auch wenn f komplexwertig ist (vgl. (7.1)). Die Funktion g muss aber reellwertig sein.
7.2.16 Bemerkung. Oft findet man mit dem folgenden Spezialfall der Regel von de
L’Hospital: Seien f, g differenzierbar auf einem Intervall (c, d), sei x ∈ (c, d), f (x) =
g(x) = 0 und g′ (x) , 0. Dann gilt
lim
t→x
f (t)
f ′ (x)
= ′ .
g(t) g (x)
In manchen wichtigen Beispielen benötigt man jedoch die allgemeine Version der Regel von de L’Hospital, wie etwa für den ersten Grenzwert in Beispiel 7.2.17.
7.2.17 Beispiel.
(i)
1
x
x→0+ − 12
x
lim x ln x = lim
x→0+
(ii)
= 0.
sin x
cos x
(sin x)′
= lim
= lim
= 1.
′
x→0+ x
x→0+ 1
x→0+
x
lim
Genauso sieht man lim x→0−
sin x
x
= 1.
(iii) Man betrachte den Grenzwert
1
1
− 2
lim
2
x→0 (sin x)
x
!
Dieser Ausdruck ist von der Form ∞ − ∞. Wir rechnen
!
1
x2 − (sin x)2
1
=
−
.
(sin x)2 x2
(x sin x)2
(7.9)
KAPITEL 7. DIFFERENTIALRECHNUNG
172
Für x → 0 ist dieser Ausdruck von der Form 00 . Also stimmt der Grenzwert in
(7.9) nach der Regel von de L’Hospital mit
lim
x→0
2x − 2 sin x cos x
2x − sin(2x)
= lim
2x(sin x)2 + 2x2 sin x cos x x→0 2x(sin x)2 + x2 sin(2x)
überein. Wenden wir die Regel von de L’Hospital nochmals an, so erhalten wir
lim
x→0
2 − 2 cos(2x)
1 − cos(2x)
= lim
.
2(sin x)2 + 4x sin(2x) + 2x2 cos(2x) x→0 (sin x)2 + 2x sin(2x) + x2 cos(2x)
Dieser Ausdruck ist wieder von der Form 00 . Wir müssten die Regel von de
L’Hospital noch zweimal anwenden, um zu einem Ergebnis zu kommen. Etwas
einfach ist es, diesen Grenzwert als
x2
1 − cos(2x)
· lim
=
2
2
x→0 (sin x) + 2x sin(2x) + x2 cos(2x)
x→0
x
lim
lim
x→0
1 − cos(2x)
1
· lim x→0 sin x 2
sin(2x)
x2
+ 4 2x + cos(2x)
x
zu schreiben. Zweimal de L’Hospital liefert lim x→0
limx→0 sinx x = 1 gilt
lim x→0
sin x
x
Also ist (7.9) genau 13 .
2
1
=
+ 4 sin(2x)
2x + cos(2x)
1−cos(2x)
x2
= 2, und wegen
1
1
= .
1+4+1 6
(iv) Eine andere Möglichkeit den Grenzwert (7.9) zu berechnen, besteht darin, die
Potenzreihenentwicklung von sin x um 0 zu verwenden:
!
!
sin x
1 − ( sinx x )2
1
1
sin x 1 − x
·
=
−
=
1
+
=
x
(sin x)2 x2
(sin x)2
(sin x)2
P∞ (−1)n x2n
!
! P∞ (−1)n−1 x2n
sin x 1 − n=0 (2n+1)!
sin x
n=1 (2n+1)!
· P
· P
1+
= 1+
.
2
n
2n+1
x
x
∞ (−1) x
∞ (−1)n x2n+1 2
n=0
n=0
(2n+1)!
(2n+1)!
Oben und unten durch x2 dividieren ergibt
! P∞ (−1)n x2n
sin x
n=0 (2n+3)!
· P
1+
.
x
∞ (−1)n x2n 2
n=0 (2n+1)!
Man beachte, dass alle hier auftretenden Potenzreihen Konvergenzradius +∞ haben. Somit stehen in Zähler und Nenner stetige Funktionen in x (vgl. Satz 6.7.8).
Für x → 0 konvergiert die Potenzreihen gegen den nullten Summanden. Also
1
erhalten wir für den Grenzwert (7.9) abermals 2 3!1 = 13 .
7.2. MITTELWERTSÄTZE
173
(v) Sei w ∈ C mit einem Realteil, der kleiner als Null ist. Wir wollen zeigen, dass der
Grenzwert limt→+∞ t exp(wt) in C die komplexe Zahl 0 ist. Entweder wir betrachten dazu Real- und Imaginärteil des Grenzwertes gesondert, oder - was einfacher
ist - wir betrachten den Betrag von t exp(wt) für t > 0 (vgl. Satz 6.8.3):
|t exp(wt)| = t exp(t Re w) =
t
.
exp t(− Re w)
Wegen − Re w > 0 ist der Grenzwert davon für t → +∞ von der Form +∞
+∞ . Somit
stimmt nach Korollar 7.2.14 dieser Grenzwert überein mit (siehe (6.15))
exp(t Re w)
1
t′
= 0.
= lim
= lim
t→+∞
t→+∞ − Re w · exp t(− Re w)
t→+∞ exp t(− Re w) ′
− Re w
lim
Das Folgende bringen wir hier der Vollständigkeit halber, da es sich aus dem Mittelwertsatz ableitet. Wir werden diese
Problematik später (nach der Integrationstheorie) ausführlicher behandeln.
Sei ( fn )n∈N eine Folge von reellwertigen Funktionen, welche gegen eine Funktion f konvergiert. Überträgt sich diese
Eigenschaft auf die abgeleiteten Funktionen?
7.2.18 Beispiel. Sei fn (x) =
sin√ nx
n
für x ∈ R. Dann gilt
lim fn (x) = 0,
n→∞
und das sogar gleichmäßig auf ganz R. Man berechnet
fn′ (x) =
√
n cos nx,
also gilt z.B. limn→∞ fn′ (0) = +∞.
7.2.19 Satz. Sei ( fn )n∈N eine Folge von reellwertigen Funktionen, definiert und stetig auf [a, b] und differenzierbar auf
(a, b).
Es existiere ein Punkt x0 ∈ [a, b], sodass ( fn (x0 ))n∈N konvergiert. Ist dann die Folge ( fn′ )n∈N gleichmäßig konvergent
auf (a, b), so ist auch die Folge ( fn )n∈N gleichmäßig konvergent auf [a, b], und es gilt
d
d
lim fn (x) = lim
fn (x), x ∈ (a, b).
n→∞ dx
dx n→∞
Beweis. Sei ǫ > 0 gegeben. Wähle N ∈ N, sodass für n, m ≥ N stets
| fn (x0 ) − fm (x0 )| < ǫ,
und
| fn′ (t) − fm′ (t)| < ǫ, t ∈ (a, b).
Nach dem Mittelwertsatz gilt (x ∈ [a, b])
fn (x) − fm (x) = fn (x) − fm (x) − fn (x0 ) + fm (x0 ) + fn (x0 ) − fm (x0 ) =
= (x − x0 ) fn′ (t) − fm′ (t) + [ fn (x0 ) − fm (x0 )],
mit einer geeigneten Zwischenstelle t. Es folgt
| fn (x) − fm (x)| < (b − a)ǫ + ǫ.
Also konvergiert ( fn )n∈N gleichmäßig auf [a, b] gegen f = limn→∞ fn .
Sei nun x ∈ (a, b) festgehalten. Setze
φn (t) :=
f (t) − f (x)
fn (t) − fn (x)
, φ(t) :=
,
t−x
t−x
dann gilt für n fest aber beliebig
lim φn (t) = fn′ (x).
t→x
Weiters ist
fn (t) − fm (t) − fn (x) + fm (x)
= fn′ (s) − fm′ (s)
t−x
mit einer geeigneten Stelle s zwischen t und x. Da ( fn′ ) gleichmäßig konvergiert, existiert auch der Limes limn→∞ φn (t)
gleichmäßig für t ∈ [a, b] \ {x}. Man erhält daher
φn (t) − φm (t) =
lim lim φn (t) = lim lim φn (t).
t→x n→∞
Die linke Seite ist gleich f ′ (x), die rechte ist limn→∞ fn′ (x).
n→∞ t→x
❑
KAPITEL 7. DIFFERENTIALRECHNUNG
174
P
n
7.2.20 Beispiel. Sei f (x) = ∞
n=0 an (x − x0 ) eine um −x0 verschobene Potenzreihe mit positivem Konvergenzradius R.
Dann gilt für jedes x mit |x − x0 | < R
f ′ (x) =
∞
∞
X
d X
nan (x − x0 )n−1 .
an (x − x0 )n =
dx n=0
n=1
Denn die rechte Reihe hat den Konvergenzradius
1
1
=
= R.
√
√
√
lim supn→∞ n |nan+1 |
limn→∞ n n · lim supn→∞ n |an+1 |
Allgemein gilt für N ∈ N
f (N) (x) =
∞
X
nan (x − x0 )n−N .
n=N
7.3 Der Taylorsche Lehrsatz
Sei
P∞
n=0
an zn eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die Funktion
f : (−R, R) → C, f (t) =
∞
X
an tn .
n=0
Wir haben schon gesehen, dass diese Funktion bei t = 0 differenzierbar mit f ′ (0) = a1 ist.
Im Beweis von Lemma 7.3.2 benötigen folgendes Lemma.
7.3.1 Lemma. Sind (xn )n∈N , (yn )n∈N , (ξn )n∈N drei Folgen in R mit yn ≥ 0, xn > 0, ξn > 0, n ∈ N, sodass xn → x > 0 und
ξn → 1, so folgt
lim sup xn yξnn = x lim sup yn .
n→∞
n→∞
Beweis. Um das einzusehen, zeigen wir, dass t ∈ R genau dann Häufungspunkt von (xn yξnn )n∈N ist, wenn xt Häufungspunkt von (yn )n∈N ist. Dann ist insbesondere der größte Häufungspunkt t von (xn yξnn )n∈N von der Form xτ für den größten
Häufungspunkt τ von (yn )n∈N , also genau die gewünschte Gleichheit.
Ist τ Häufungspunkt von (yn )n∈N , also yn(k) → τ, k → ∞ für eine Teilfolge (yn(k) )k∈N , so folgt im Falle τ > 0 aus der
ξ
n(k)
Stetigkeit von (a, b) 7→ ab für (a, b) ∈ R+ × R (vgl. Bemerkung 6.8.7), dass yn(k)
→ τ1 = τ, k → ∞, und mit Satz 3.3.4
ξn(k)
xn(k) yn(k)
weiter dass
→ xτ.
Im Fall τ = 0 gilt für k ∈ N hinreichend groß sicherlich ξn(k) ≤ 2 und xn(k) ≤ x + 1. Für solche k folgt dann
ξ
ξ
n(k)
n(k)
0 ≤ xn(k) yn(k)
≤ (x + 1)y2n(k) , und wegen dem Einschluss-Satz, Satz 3.3.2, konvergiert (xn(k) yn(k)
)k∈N gegen 0 = xτ.
Ist umgekehrt t ein Häufungspunkt von (xn yξnn )n∈N , so wenden wir das gerade gezeigte auf die Folgen ( x1n )n∈N ,
(yξnn )n∈N und (1)n∈N an, und erhalten, dass xt Häufungspunkt von (yξnn )n∈N ist. Nun wenden wir das oben gezeigte auf die
Folgen (1)n∈N , (yξnn )n∈N und ( ξ1n )n∈N an, und sehen, dass xt Häufungspunkt von (yn )n∈N ist.
❑
P
P∞
n
n
7.3.2 Lemma. Die Potenzreihe ∞
n=0 (n + 1)an+1 z hat den selben Konvergenzradius R, wie n=0 an z .
Die Funktion f ist auf (−R, R) differenzierbar und hat die Ableitung
f ′ (x) =
∞
X
(n + 1)an+1 xn .
n=0
Sie ist sogar beliebig oft differenzierbar mit (l ∈ N)
∞
X
f (l) (x) =
n=0
(n + l) · · · (n + 1)an+l xn ,
(7.10)
wobei auch diese Potenzreihe Konvergenzradius R hat. Insbesondere gilt
f (l) (0) = l!al .
Beweis. Der Konvergenzradius von
und wegen
√
n
|an+1 | =
√
n+1
|an+1 |
P∞
n+1
n
lim supn→∞
n=0 (n+1)an+1 z
n
ist nach Satz 6.7.8
√
n
1√
. Wegen n
lim supn→∞ n |(n+1)an+1 |
+ 1 → 1, n → ∞,
folgt mit Lemma 7.3.1
1
√
n
|(n + 1)an+1 |
=
limn→∞
√
n
1
n + 1 · lim supn→∞
√
n+1
|an+1 |
= R.
(7.11)
7.3. DER TAYLORSCHE LEHRSATZ
175
Sei nun x ∈ (−R, R) und r ∈ (0, R) so, dass |x| < r. Ist (tk )k∈N eine gegen x konvergente Folge aus [−r, r] \ {x}, so gilt
lim
k→∞
Nun ist für |x|, |t| ≤ r
N
X
t n − xn
f (tk ) − f (x)
an k
= lim lim
.
k→∞ N→∞
tk − x
tk − x
n=1
(7.12)
n
n−1
n
X
a t − x ≤ |a | ·
|t| j · |x|n−1− j ≤ n|an ||r|n−1 .
n
n t−x j=0
Da
innerhalb ihres Konvergenzradius sogar absolut konvergieren, konvergiert wegen (7.11) die Reihe
P∞ Potenzreihen
n−1
. Nach dem Weierstraß Kriterium, Korollar 6.7.4, konvergiert die Funktionenfolge
n=1 n|an ||r|

 N
X tn − xn 

 an

t−x 
n=1
N∈N
in der Variable t gleichmäßig auf [−r, r] \ {0}. Nach Lemma 6.6.11 stimmt (7.12) überein mit
lim lim
N→∞ k→∞
N
X
n=1
an
∞
N
X
X
tkn − xn
nan xn−1 .
nan xn−1 =
= lim
N→∞
tk − x
n=1
n=1
Die Verallgemeinerung in (7.10) folgt nun leicht durch vollständige Induktion.
❑
P∞
1
7.3.3 Beispiel. Für x ∈ (−1, 1) ist die Funktion x 7→ ln(1 − x) beliebig oft differenzierbar. Da ln(1 − x)′ = − 1−x
=−
P
P∞
xn
nach Lemma 7.3.2 mit der Ableitung von x 7→ − ∞
n=1 n , x ∈ (−1, 1) übereinstimmt, und da ln(1 − x) und − n=1
x = 0 beide den Wert Null annehmen, folgt aus Korollar 7.2.7, dass
ln(1 − x) = −
n
n=1 x
xn
n für
∞
X
xn
für alle x ∈ (−1, 1).
n
n=1
Da diese Reihe auch für x = −1 (bedingt) konvergiert, folgt aus Satz 6.7.13, dass −
P∞
n=1
(−1)n
n
= ln(2).
Wir sehen insbesondere, dass Grenzfunktionen von Potenzreihen beliebig oft ableitbar sind. Ist etwa jede unendlich
oft differenzierbare Funktion Grenzfunktion einer Potenzreihe, und wie könnte man diese angeben? Das ist eine der
Fragestellungen, die auf den Taylorschen Lehrsatz führen.
Eine andere Motivation des Taylorschen Lehrsatz ergibt sich aus folgenden Interpolationsüberlegungen. Die Gerade,
die eine Kurve in einem Punkt am besten approximiert ist die Tangente (falls sie existiert). Approximiert man die Kurve mit
einem Polynom höheren Grades, so kann man hoffen, dass die Approximation genauer wird.
Wir haben die Tangente gefunden (eigentlich definiert) als die Grenzlage von Sekanten durch die Punkte (x, f (x)) und
(x + △x, f (x + △x)). Da eine Gerade durch zwei Punkte eindeutig bestimmt ist, sind diese Sekanten wohldefinierte Objekte.
Ein Polynom vom Grade ≤ n ist eindeutig festgelegt durch die Vorgabe der Werte y0 , . . . , yn an n + 1 verschiedenen
Stellen x0 , . . . , xn :
n
Y
X
x − xj
.
yk ·
p(x) =
x − xj
j∈{0,...,n}\{k} k
k=0
Die Eindeutigkeit folgt aus der Tatsache, dass ein Polynom vom Grad ≤ n höchstens n Nullstellen hat.
Betrachten wir nun n + 1 Punkte der Kurve f mit den x-Koordinaten x, x + △x, . . . , x + n△x, und legen ein Polynom p
durch diese Punkte.
Für große Schrittweiten △x wird das erhaltene Polynom nicht viel mit der Kurve zu tun haben, lässt man jedoch △x → 0
streben, so hofft man auf eine gute Approximation.
7.3.4 Satz (Newtonsche Interpolationsformel). Seien x, △x und Werte y0 , . . . , yn gegeben. Das Polynom, welches durch die
Punkte (x, y0 ), (x + △x, y1 ), . . . , (x + n△x, yn ) geht, ist gleich
p(x) = y0 +
... +
(x − x0 ) △y0 (x − x0 )(x − x1 ) △2 y0
+
+ ···
1!
△x
2!
△x2
(x − x0 )(x − x1 ) . . . (x − xn−1 ) △n y0
,
n!
△xn
wobei wir x j = x + j△x gesetzt haben und △ j y0 die j-te Differenz bezeichnet. Diese ist rekursiv definiert als
△yi = yi+1 − yi , △2 yi = △yi+1 − △yi , . . . .
KAPITEL 7. DIFFERENTIALRECHNUNG
176
Beweis. Offenbar gilt p(x0 ) = y0 . Man erhält p(x1 ) = y0 + (x1 − x0 )
p(x j ) = y0 + (x j − x0 )
... +
△y0
△x
= y0 + △x
△y0
△x
= y0 + (y1 − y0 ) = y1 . Allgemein gilt
(x j − x0 )(x j − x1 ) △2 y0
△y0
+
+ ...
△x
2
△x2
(x j − x0 ) · · · (x j − x j−1 ) △ j y0
=
j!
△x j
△y0
j△x( j − 1)△x △2 y0
j!△x j △ j y0
+
=
+ ··· +
△x
2
j!
△x j
△x2
!
!
!
!
j
j
j
j
=
y0 + △y0 + △2 y0 + · · · + △ j y0 .
0
1
2
j
= y0 + j△x
Wir zeigen nun mittels Induktion die folgende Behauptung: Für je j + 1 Werte y0 , . . . , y j gilt die Formel
yj =
!
j
X
j l
△ y0 .
l
l=0
Der Induktionsanfang j = 0 ist offensichtlich richtig. Sei die Formel also bereits gezeigt für je j Werte. Dann folgt
!
j−1 !
j
X
X
j l
j l
△ y0 + △ j y0 =
△ y0 = y0 +
l
l
l=1
l=0
= y0 +
= y0 +
!
!#
j−1 "
X
j−1
j−1
+
△l y0 + (△ j−1 y1 − △ j−1 y0 ) =
l−1
l
l=1
!
!
j−1
j−1
X
X
j − 1 l−1
j−1 l
(△ y1 − △l−1 y0 ) +
△ y0 + (△ j−1 y1 − △ j−1 y0 ) =
l−1
l
l=1
l=1
 j−2

X j − 1!

= 
△l y1 + △ j−1 y1  −
l
l=0
|
{z
}
=y j
 j−2
 

!
j−1
X
X j − 1!
 
j − 1 l 
− 
△l y0 + △ j−1 y0  + y0 +
△ y0  = y j
l
l
l=0
l=1
Ist f an der Stelle x differenzierbar, so gilt lim△x→0
△y0
△x
= lim△x→0
f (x+△x)− f (x)
△x
❑
= f ′ (x). Allgemein gilt:
7.3.5 Lemma. Sei f : [a, b] → R stetig und n-mal stetig differenzierbar auf (a, b). Ist x ∈ (a, b), so gilt (y j = f (x + j△x))
lim
△x→0
(x−x ) △y
(x−x )···(x−x
△n y0
= f (n) (x).
△xn
) △n y
0
n−1
0
Beweis. Sei p(x) = y0 + 1! 0 △x0 + . . . +
n!
△xn . Die Funktion h(x) := f (x) − p(x) hat die n + 1 Nullstellen
x0 , · · · , xn (∈ (a, b) für △x hinreichend klein). Mit Korollar 7.2.4 folgt die Existenz von ξ ∈ (x0 , xn ) mit h(n) (ξ) = 0. Nun gilt
0 = h(n) (ξ) = f (n) (ξ) − p(n) (ξ) = f (n) (ξ) −
Für △x → 0 folgt wegen der Stetigkeit von f (n) auch
△n y0
△xn
△n y0
.
△xn
→ f (n) (x).
❑
Man erhält also als Grenzfall des in einem Punkt x0 approximierenden Polynoms gerade
p(x) = f (x0 ) + (x − x0 ) f ′ (x0 ) +
(x − x0 ) (n)
(x − x0 )2 ′′
f (x0 ) + · · · +
f (x0 ).
2
n!
Wählt man den Grad von p immer größer, so wird (hoffentlich) p(x) die Kurve f (x) immer besser annähern.
Wir wollen im folgenden eine gegebene Funktion f auf einem reellen Intervall I
durch Polynome approximieren. Für hinreichend oft differenzierbare f werden wir das
durch das sogenannte Taylorpolynom zu bewerkstelligen suchen.
7.3. DER TAYLORSCHE LEHRSATZ
177
7.3.6 Definition. Sei n ∈ N, I ⊆ R ein Intervall und f : I → R (C) liege in Cn (I)3 Ist
y ∈ I fest, so nennt man das Polynom (in der Variablen x)
T n (x) =
n
X
(x − y)k (k)
f (y),
k!
k=0
das n-te Taylorsche Polynom an der Anschlussstelle y. Die Fehlerfunktion Rn (x) :=
f (x) − T n (x) nennt man das n-te Restglied.
Dass T n (x) eine gute Wahl ist, um ein reellwertiges f zu approximieren, folgt aus
dem nun folgenden Satz, welcher eine Art Verfeinerung des Mittelwertsatzes ist.
7.3.7 Satz (Taylorscher Lehrsatz). Sei I ⊆ R ein Intervall, und sei n ∈ N ∪ {0}. Weiters
sei f : I → R mit f ∈ Cn (I) und so, dass f (n) am Inneren von I - also auf I ohne seine
Randpunkte - differenzierbar ist, bzw. äquivalent dazu, dass f auf dem Inneren von I
sicher n + 1-mal differenzierbar ist.
Zu x, y ∈ I, x , y, gibt es immer ein ξ ∈ (min(x, y), max(x, y)), sodass sich das n-te
Restglied Rn (x) = f (x) − T n (x) schreiben lässt als (Lagrange Form des Restgliedes)
Rn (x) =
(x − y)n+1 (n+1)
f
(ξ).
(n + 1)!
Beweis. Seien F, G : [min(x, y), max(x, y)] → R definiert durch
F(t) = f (x) −
n
X
(x − t)k
k=0
k!
· f (k) (t), G(t) = (x − t)n+1 .
Voraussetzungsgemäß sind beide stetig auf [min(x, y), max(x, y)] und differenzierbar auf (min(x, y), max(x, y)), wobei G′ (t) = −(n + 1)(x − t)n , 0 für t ∈
(min(x, y), max(x, y)) und
F ′ (t) = −
n
n
X
X
(x − t)n (n+1)
k(x − t)k−1 (k)
(x − t)k (k+1)
f
(t) +
f (t) = −
f
(t).
k!
k!
n!
k=1
k=0
Nach dem verallgemeinerten Mittelwertsatz, Satz 7.2.13, gibt es ein ξ
(min(x, y), max(x, y)), sodass
∈
n
(n+1)
(ξ)
− (x−ξ)
Rn (x)
f (n+1) (ξ)
F(y) − F(x) F ′ (ξ)
n! f
=
=
=
.
=
(n + 1)!
(x − y)n+1 G(y) − G(x) G′ (ξ) −(n + 1)(x − ξ)n
❑
p
7.3.8 Bemerkung. Wählt man im obigen Beweis G(t) = (x−t) für ein festes aber beliebiges p ∈ N, so erhält man mit derselben Argumentation ein ξ ∈ (min(x, y), max(x, y)),
sodass
f (n+1) (ξ)
Rn (x) =
(x − y) p (x − ξ)n−p+1 .
n!p
Stellt man ξ durch ξ = θx + (1 − θ)y für ein θ ∈ (0, 1) dar, so erhält man die Schlömilchsche Form
f (n+1) (ξ)
Rn (x) =
(x − y)n+1 (1 − θ)n−p+1 .
n!p
des Restgliedes. Für p = n + 1 erhält man die Lagrange Form und für p = 1 die
sogenannte Cauchysche Form des Restgliedes.
3 Siehe
Definition 7.1.14 und Definition 7.1.15.
KAPITEL 7. DIFFERENTIALRECHNUNG
178
7.3.9 Fakta. Sei f : I → R (C) wie in Definition 7.3.6.
1. Man sieht unmittelbar durch Nachrechnen, dass T n (x) ein Polynom höchstens
n-ten Grades ist, sodass
T n (y) = f (y), T n′ (y) = f ′ (y), . . . , T n(n) (y) = f (n) (y).
(7.13)
Die höheren Ableitungen von T n verschwinden identisch, da es ein Polynom
höchstens n-ten Grades ist.
2. Ist p(x) ein weiteres Polynom höchstens n-ten Grades mit (7.13) (T n ersetzt durch
p), so verschwinden die Ableitungen 0-ten bis n-ten Grades von q(x) = p(x) −
T n (x) an der Stelle y.
Wenden wir Satz 7.3.7 auf die reellen Funktionen Re q(x) und Im q(x) oder auch
nur q(x), falls diese reell ist, an, so folgt wegen q(n+1) ≡ 0, dass q(x) = 0. Also
definiert die Eigenschaft (7.13) das Polynom T n (x) eindeutig.
3. Ist f selber ein Polynom vom Grad m, so muss insbesondere f (x) = T n (x) für
n ≥ m.
4. Für reellwertige Funktionen f gibt Satz 7.3.7 im Falle der Differenzierbarkeit von f (n) am Inneren von I eine Möglichkeit, das Restglied Rn (x) durch
(x−y)n+1 (n+1)
(ξ) auszudrücken. Das Problem dabei ist, dass man von ξ nur weiß,
(n+1)! f
dass es zwischen x und y liegt. Nichtsdestotrotz kann man manchmal f (n+1) so
gut abschätzen, dass man sicher sagen kann, dass Rn (x) klein wird; vgl. auch
Bemerkung 7.3.8.
5. Ist f beliebig oft differenzierbar, so kann man für jedes n ∈ N ∪ {0} das Taylorpolynom T n (x) an der Anschlussstelle y betrachten. Man erhält schließlich die
Taylorreihe von f an der Anschlussstelle y:
T (x) :=
∞
X
f (n) (y)
(x − y)n .
n!
n=0
Das ist eine Potenzreihe mit Konvergenzradius R ∈ [0, +∞]. Hier können alle
Fälle auftreten.
6. Ist R > 0, so konvergiert die Potenzreihe insbesondere auf (y − R, y + R). Nun
kann T (x) auf (y − R, y + R) ∩ I mit der Ausgangsfunktion f (x) übereinstimmen;
sie muss es aber nicht.
Klarerweise ist T (x) = f (x), x ∈ (y − R, y + R) ∩ I genau dann, wenn Rn (x) → 0
auf x ∈ (y − R, y + R) ∩ I.
P
n
7. Sei ∞
n=0 an z eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die
Funktion
∞
X
f : (y − R, y + R) → C, f (t) =
an (t − y)n .
n=0
Wir werden in Proposition 8.7.5 sehen (bzw. haben in Lemma 7.3.2 gesehen),
dass f (l) (y) = l! · al , l ∈ N ∪ {0}. Die Taylorreihe von f an der Anschlussstelle y
P
n
ist somit genau ∞
n=0 an (t − y) , und konvergiert daher auf (y − r, y + R).
Das Restglied Rn (x) konvergiert klarerweise gegen 0.
7.3. DER TAYLORSCHE LEHRSATZ
179
7.3.10 Beispiel. Sei n ∈ N ∪ {0}, I ⊆ R ein Intervall, und f : I → R so, dass f ∈ Cn (I)
und dass f auf dem Inneren des Intervalls I sogar (n + 1)-mal differenzierbar ist. Gilt
nun f (n+1) (ξ) = 0 für alle ξ im Inneren von I, so folgt Rn (x) = 0 und daher f (x) = T n (x)
für alle x ∈ I. Kurz zusammengefasst bedeutet das, dass genau die Polynome vom Grad
≤ n alle möglichen Lösungen der Differentialgleichung
f (n+1) (ξ) = 0,
sind. Indem man f in Real- und Imaginärteil zerlegt, folgt diese Tatsache auch für
komplexwertige f .
7.3.11 Beispiel.
Sei f (t) = et . Dann gilt f (n) (t) = et , also f (n) (0) = 1. Wir erhalten
ex =
wobei Rn (x) =
xn+1 ξ
(n+1)! e
x
n
X
xk
+ Rn (x),
k!
k=0
mit ξ ∈ (0, x).
Da e die Grenzfunktion einer Potenzreihe ist, - so wurde sie ja eingeführt muss Rn (x) → 0, vgl. Fakta 7.3.9, 7. Man kann dieses Grenzverhalten aber auch
unschwer durch eine elementare Abschätzung von Rn (x) erhalten.
Betrachte die Funktion
f (t) =
∞
X
cos(2k t)
.
k!
k=1
Differenziert man diese Reihe gliedweise, so erhält man
∞
∞
X
−2k sin(2k t) X −22k cos(2k t)
,
,...
k!
k!
k=1
k=1
P (2k )l
Da ∞
für jedes l ∈ N konvergiert, sind sämtliche dieser Reihen
k=1 k!
gleichmäßig konvergent auf R. Wie wir später in Korollar 8.7.4 sehen werden
(oder man verwende Satz 7.2.19), ist die Funktion f daher in jedem Punkt beliebig oft differenzierbar, und ihre Ableitungen werden durch obige Reihen dargestellt. Es gilt daher
f ′ (0) = f ′′′ (0) = . . . = f (2k+1) (0) = . . . = 0,
und
f (2n) (0) = (−1)n
∞
X
22nk
n
= (−1)n (e4 − 1).
k!
k=1
Die Taylorreihe von f bei 0 ist also gleich
n
∞
X
(−1)n (e4 − 1) 2n
x .
(2n)!
n=0
Wendet man das Quotientenkriterium an, so erhält man (an =
n
(−1)n (e4 −1)
(2n)!
an+1 (e4n 2 + 1)(e4n + 1) 2
=
x −→ ∞, x , 0.
an
(2n + 2)(2n + 1)
Diese Reihe ist für kein x (außer im Trivialfall x = 0) konvergent.
x2n ) .
KAPITEL 7. DIFFERENTIALRECHNUNG
180
Sei
1
 1


e− x ,
f (x) = 

0,
f
x>0
x≤0
1
2
0
1
2
3
4
Klarerweise ist f auf (−∞, 0] beliebig oft ableitbar mit f (n) (x) = 0, x ≤ 0.
Auf (0, +∞) gilt f ′ (x) =
(n ∈ N ∪ {0})
1 − 1x
e ,
x2
f
(n)
und durch vollständige Induktion sieht man, dass
(x) = pn
!
1 −1
e x , x > 0.
x
für Polynome pn (x) vom Grad 2n. Nun gilt mit Hilfe der Regel von de L’Hospital
Korollar 7.2.14
lim f (n) (x) = lim
x→0+
y→+∞
p′ (y)
p(2n) (y)
pn (y)
= lim n y = · · · = lim n y = 0,
y
y→+∞ e
y→+∞
e
e
da p(2n)
n (y) eine Konstante ist.
Wir sehen insbesondere, dass f auf [0, +∞) stetig ist, und dass wegen
limt→0+ f ′ (t) = 0 nach Korollar 7.2.10 f ′ (0)+ = 0. Wegen f ′ (0)− = 0 ist f
auch bei 0 differenzierbar mit f ′ (0), und somit f ∈ C1 (R).
Wiederholte Anwendung dieses Argumentes auf f ′ , f ′′ usw. zeigt, dass f auf R
beliebig oft differenzierbar ist, wobei f (n) (0) = 0, n ≥ 0.
Insbesondere ist das Taylorpolynom T n (x) stets identisch Null. Also ist f ein
Beispiel für eine C∞ -Funktion, deren Taylorreihe bei der Anschlussstelle 0 auf
ganz R konvergiert, aber nicht mit f übereinstimmt.
Wir haben gesehen, dass für eine differenzierbare Funktion f , welche an einer Stelle x ein lokales Extremum besitzt, f ′ (x) = 0 gelten muss, dass jedoch die Umkehrung im Allgemeinen nicht gilt (Beispiel: f (t) = t3 an der Stelle x = 0). Aus dem
Taylorschen Satz erhält man unmittelbar eine hinreichende Bedingung für ein lokales
Extremum.
7.3.12 Korollar. Für n ∈ N sei f : (c, d) → R eine zumindest n-mal stetig differenzierbare Funktion, x ∈ (c, d), und gelte
f ′ (x) = f ′′ (x) = . . . = f (n−1) (x) = 0, f (n) (x) , 0.
Ist n gerade, so liegt ein lokales Extremum vor, und zwar ein lokales Minimum falls
f (n) (x) > 0 und ein lokales Maximum falls f (n) (x) < 0. Ist n ungerade, so liegt kein
lokales Extremum vor.
7.3. DER TAYLORSCHE LEHRSATZ
181
Beweis. Nach der Taylorschen Formel gilt für t ∈ (c, d) mit einer geeigneten Zwischenstelle ξ zwischen t und x
f (t) = f (x) +
(t − x)n (n)
f (ξ).
n!
Ist z.B. f (n) (x) > 0, so gilt für ξ in einer hinreichend kleinen Umgebung (x − δ, x + δ)
von x ebenfalls f (n) (ξ) > 0. Da ξ zwischen t und x liegt, folgt aus t ∈ (x − δ, x + δ), dass
für gerades n
(t − x)n (n)
f (ξ) > 0.
n!
Somit folgt f (t) > f (x), und x ist ein lokales Minimum. Ist n ungerade, so hat (t − x)n
für t < x ein anderes Vorzeichen als für t > x. Also ist x kein lokales Extremum. Die
anderen Fälle beweist man genauso.
❑
7.3.13 Beispiel. Mit den bisher gesammelten Ergebnissen lassen sich sogenannte
Kurvendiskussionen von Funktionen durchführen.
f
4
Man betrachte z.B. die
Funktion f (x) = x x auf
(0, +∞).
3
2
1
0
1
e
1
2
Zunächst ist diese Funktion stetig und beliebig oft differenzierbar.
Klarerweise ist sie immer positiv, hat also keine Nullstellen.
Um die lokalen Extrema zu finden, betrachte
f ′ (x) = x x (1 + ln x), f ′′ (x) = x x−1 + x x (1 + ln x).
Die einzige Nullstelle von f ′ (x) ist 1e . Da f ′′ ( 1e ) > 0 folgt aus Korollar 7.3.12,
dass diese Stelle ein lokales Minimum ist.
Für 0 < x < 1e ist f ′ (x) < 0 also dort monoton fallend, und für 1e < x ist
f ′ (x) > 0, also dort monoton wachsend, vgl. Korollar 7.2.7. Insbesondere ist 1e
ein absolutes Minimum von f auf (0, +∞).
Schließlich erhält man mit de l’Hospital lim x→0+ f (x) = 1 und wegen x x ≥
e x , x ≥ e die Beziehung lim x→+∞ f (x) = +∞.
7.3.14 Beispiel. Wir wollen zeigen, dass die Gleichung
(1 − ln x)2 = x(3 − 2 ln x)
KAPITEL 7. DIFFERENTIALRECHNUNG
182
in (0, +∞) genau zwei Lösungen hat. Dazu betrachten wir die Funktion
f : (0, +∞) → R,
f (x) = (1 − ln x)2 − x(3 − 2 ln x).
Für diese gilt es zu zeigen, dass f genau zwei Nullstellen hat. Setzt man x = 1, so folgt
f (1) = −2 < 0. Andererseits folgt wegen limx→0+ x(3 − 2 ln x) = 0
lim f (x) = +∞.
x→0+
Wegen f (x) ≥ x(2 ln x − 3) ≥ x für x ≥ exp(2) folgt auch
lim f (x) = +∞.
x→+∞
Insbesondere gibt es ξ, η ∈ R mit 0 < ξ < 1 < η < +∞, sodass f (ξ) > 0, f (η) > 0.
Nach dem Zwischenwertsatz muss es einen Punkt α ∈ (ξ, 1) und einen Punkt β ∈ (1, η)
geben, sodass f (α) = 0 = f (β). Also hat f mindestens zwei Nullstellen.
Um zu zeigen, dass es nicht mehr sein können, berechnen wir
1
1
ln x − 1 2 4 − 2 ln x + 2x
f ′ (x) = 2(ln x − 1) + 2 ln x − 1, f ′′ (x) = 2 2 − 2
+ =
.
x
x
x
x2
x2
Für x ∈ (0, 1] ist ln x ≤ 0 und somit f ′′ (x) > 0. Für x ∈ (1, +∞) gilt wegen x > ln x
auch f ′′ (x) > 0. Also hat f ′′ keine Nullstelle. Nach dem Satz von Rolle kann f ′
höchstens eine und weiter f höchstens zwei Nullstellen haben (vgl. Korollar 7.2.4).
Der Vollständigkeit halber wollen wir f noch weiter diskutieren. Wegen f ′′ (x) > 0
muss f ′ streng monoton wachsen. Außerdem gilt wegen f ′ (x) ≤ − 1x für x ∈ (0, 1)
lim f ′ (x) = −∞,
x→0+
und wegen f ′ (x) ≥ 2 ln x − 1 für x > e
lim f ′ (x) = +∞.
x→+∞
Aus dem Zwischenwertsatz folgt, dass f ′ mindestens eine Nullstelle hat. Insgesamt hat
f ′ genau eine Nullstelle x0 . Wegen f ′′ (x0 ) > 0 muss x0 ein lokales Minimum sein.
Wegen der Monotonie von f ′ gilt
f ′ (s) < f ′ (x0 ) = 0 < f ′ (t) für 0 < s < x0 < t < +∞.
Also ist f auf (0, x0 ) monoton fallend und auf (x0 , +∞) monoton wachsend. Deswegen
muss x0 sogar ein globales Minimum sein.
7.4 Stammfunktion
Bei der Integration von Funktionen wird es wichtig sein, zu einer gegebenen Funktion
f : [a, b] → R (C) - falls möglich - eine Funktion F : [a, b] → R (C) zu finden, sodass
F′ = f .
7.4.1 Definition. Sei I ⊆ R ein Intervall und f : I → R (C). Wir nennen eine Funktion
F : I → R (C) eine Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I.
Hat ein f mindestens eine Stammfunktion, so heißt die Gesamtheit
aller StammR
funktionen von f das unbestimmte Integral von f und wird durch f bezeichnet.
7.4. STAMMFUNKTION
183
7.4.2 Bemerkung. Mit F ist offensichtlicherweise auch F + c für jedes c ∈ R (C) eine
Stammfunktion von f .
Sind umgekehrt F1 , F2 zwei Stammfunktionen der selben Funktion f , so gilt (F1 −
F2 )′ ≡ 0 auf I. Nach Korollar 7.2.7 bzw. Bemerkung 7.2.9 ist F1 − F2 eine Konstante.
Somit gibt es bis auf additive Konstanten eine eindeutige Stammfunktion F, und
Z
f = {F + c : c ∈ R (C)}.
Zum Aufsuchen von Stammfunktionen gegebener Funktionen ist folgendes Resultat sehr hilfreich.
7.4.3 Lemma. Seien I, J ⊆ R Intervalle und f, g : I → R (C), sowie α, β ∈ R (C).
Weiters sei h : J → I differenzierbar.
(i) Haben f und g Stammfunktionen, so auch α f + βg, wobei
Z
Z
Z
(α f + βg) = α
f +β g
.
(ii) Sind f und g differenzierbar auf I, sodass f ′ g eine Stammfunktion hat, dann hat
auch f g′ eine solche, und
Z
Z
f ′g = f g −
f g′ , Regel von der Partiellen Integration.
(7.14)
(iii) Mit f hat auch ( f ◦ h) · h′ : J → R (C) eine Stammfunktion, wobei
Z
Z !
(( f ◦ h) · h′ ) =
f ◦ h, Substitutionsregel)
Diese drei Beziehungen sind so zu verstehen, dass wenn
funktion steht, die Gleichheit bis auf eine Konstante gilt.
R
· · · für jeweils eine Stamm-
Beweis.
(i) Sind F und G Stammfunktionen von f und g, so folgt (αF + βG)′ = αF ′ + βG′ =
α f + βg. Also ist αF + βG eine Stammfunktion von α f + βg.
(ii) Ist H Stammfunktionen von f ′ g, so folgt aus der Produktregel ( f g − H)′ = ( f ′ g +
f g′ ) − f ′ g = f g′ . Somit ist f g − H Stammfunktionen von f g′ , und es gilt (7.14).
(iii) Ist F Stammfunktionen von f , so folgt aus der Kettenregel in Satz 7.1.9 bzw.
Bemerkung 7.1.10, dass (F ◦ h)′ = ( f ◦ h) · h′ . Also ist F ◦ h Stammfunktion von
( f ◦ h) · h′ .
❑
KAPITEL 7. DIFFERENTIALRECHNUNG
184
7.4.4 Bemerkung. Zur Substitutionsregel gibt es folgende Merkregel:
Seien I, J ⊆ R wieder Intervalle, f : I → R (C), und h : J → I differenzierbar.
Schreiben wir x = h(t) mit t ∈ J und formal dx = h′ (t) dt, so erhält man aus
Z !
Z
f (x) =:
f (x)dx
durch Ersetzen von x durch h(t) und dx durch h′ (t) dt
Z
Z
′
f (h(t)) · h (t) dt := (( f ◦ h) · h′ ).
Wie gesagt ist das eine Merkregel, die sich beim Bestimmen konkreter Stammfunktionen aber als durchaus praktikabel und übersichtlich herausgestellt hat, siehe etwa
Beispiel 7.4.8.
7.4.5 Beispiel. Man kann die Substitutionsregel verwenden, um einfache Differentialgleichungen der Form
y′ (t) · f (y(t)) = g(t), t ∈ I,
(7.15)
zu lösen. Hier sind I, J ⊆ R Intervalle und f : F → R sowie g : I → R stetige
Funktionen.
Angenommen man hat eine Funktion y : I → J ⊆ R, welche (7.15) erfüllt. Hat
f eine Stammfunktion F, so ist nach der Substitutionsregel die Funktion F ◦ y eine
Stammfunktion von t 7→ y′ (t) · f (y(t)) und daher auch von g.
Kennt man andererseits eine Stammfunktion G von g explizit, so folgt F ◦ y =
G + c für eine Konstante c ∈ R. Also hat man eine implizite Beschreibung von y(t). In
manchen Fällen lässt sich diese Gleichung nach y auflösen, wodurch man y(t) explizite
beschreiben kann.
Diese hier beschriebene Methode nennt man auch Trennung der Variablen .
7.4.6 Beispiel. Man betrachte die Differentialgleichung
y′ (t) = y(t), t ∈ R.
Eine reellwertige Lösung y dieser Differentialgleichung ist y ≡ 0. Angenommen y ist
eine weitere reellwertige Lösung mit y(t0 ) < 0 für ein t0 ∈ R. Wegen der Stetigkeit gilt
y(t) < 0 für alle t ∈ (t0 − ǫ, t0 + ǫ) =: I.
Ist f : I → (−∞, 0) die Funktion f (η) = η1 , so gilt für t ∈ I,
y′ (t) ·
1
= y′ (t) · f (y(t)) = 1.
y(t)
Eine Stammfunktion von f ist F(η) = ln(−η), also ist t 7→ ln(−y(t)) eine Stammfunkti1
auf I. Von 1 ist t 7→ t eine Stammfunktion. Es folgt ln(−y(t)) = t+c, t ∈
on von y′ (t)· y(t)
I, und weiter y(t) = −ec · et . Also muss y(t) = d · et , t ∈ I für ein reelles d ∈ (−∞, 0).
Man beachte, dass wir von der Gültigkeit von y′ (t) = y(t) auf y(t) = d · et , t ∈ I
geschlossen haben, wir uns also zunächst nicht sicher sein können, dass diese Funktion
tatsächlich y′ (t) = y(t) löst. Durch Einsetzen zeigt man aber sofort, dass tatsächlich
y(t) = d · et , t ∈ R, eine Lösung ist.
7.4. STAMMFUNKTION
185
Wir werden nun einige Funktionstypen auflisten und angeben, wie man die unbestimmten Integrale von diesen bestimmt.
(i) Ist Rf (x) = xn , n ∈ N ∪ {0} auf R, so ist F(x) =
1 n+1
x + c.
ist xn = n+1
1 n+1
n+1 x
eine Stammfunktion. Also
(ii) Ist f (x) = x−n , n ∈ N, n > 1 auf (−∞, 0) oder (0, +∞), so ist F(x) =
eine Stammfunktion.
1
−n+1
−n+1 x
(iii) Ist f (x) = x−1 , auf (−∞, 0) oder (0, +∞), so ist F(x) = ln |x|, x , 0 eine Stammfunktion.
(iv) Um die Stammfunktion von ln x, x > 0 zu ermitteln, wenden wir die Partielle
Integration an:
Z
Z
Z
1
ln(x) = (x′ ) ln(x) = x ln(x) −
x = x(ln(x) − 1) + c.
x
R
sinh x = cosh x + c, cosh x = sinh x + c.
R
R
(vi) sin x = − cos x + c, cos x = sin x + c.
(v)
R
e x = e x + c,
R
(vii) Sei n ∈ N, n ≥ 2. Mit partieller Integration sieht man
Z
Z
Z
n
n−1
n−1
cos t = (cos t) · (cos t) = (cos t)(sin t) + (n − 1) (cosn−2 t)(sin t)2 =
(cosn−1 t)(sin t) + (n − 1)
Z
(cosn−2 t) − (n − 1)
Z
(cosn t).
Also erhält man die Rekursionsgleichung
Z
Z
n−1
1
(cosn−2 t).
cosn t = (cosn−1 t)(sin t) +
n
n
(viii) Mit Hilfe von (i) und der Substitutionsregel folgt (k ∈ N, k > 1)
Z
Z
a
a
a
= a ln |x − b| + c,
=
+ c,
(x − b)
(x − b)k (−k + 1)(x − b)k−1
wobei man diese Funktionen auf einem Intervall betrachtet, das b nicht enthält.
R 1
sin
(ix) 1+x2 = arctan x + c. (Umkehrfunktion von tan = cos
: (− 2π , π2 ) → R).
R x
2
′
(x) Um 1+x
2 zu ermitteln, wende man die Substitutionsregel auf h(x) = x , h (x) =
1
2x und f (y) = 1+y an:
Z
x
1
=
2
2
1+x
Z
2x
1
=
2
2
1+x
Z
R
=
(xi) Ganz ähnlich sieht man
x
(1+x2 )k
1
1+y
!
=
y=x2
1
1
2(1−k) (1+x2 )k−1
1
1
(ln |1 + y|)y=x2 = ln |1 + x2 |.
2
2
für k ∈ N, k > 1.
KAPITEL 7. DIFFERENTIALRECHNUNG
186
(xii)
R
1
,
(1+x2 )k
k ∈ N, k > 1 lässt sich rekursiv berechnen, indem man
t = arctan x ∈ (− π2 , π2 ) substituiert
Z
Z
Z
Z
1
1
1
1
=
·
=
=
cos2k−2 t =
(1 + x2 )k
(1 + x2 )k−1 (1 + x2 )
(tan2 t + 1)k−1
Z
1
2k − 3
2k−2
(cos
t) · (tan t) +
(cos2k−4 t) =
2k − 2
2k − 2
Z
1
1
x
2k − 3
·
+
.
2k − 2 (1 + x2 )k−1 2k − 2
(1 + x2 )k−1
(xiii) Ist nun allgemein f (x) =
(D := q −
2
p
4
x+d
,
(x2 +px+q)k
> 0), so schreibe
f (x) =
Um
R
und hat x2 + px + q keine reellen Nullstellen
(x + 2p ) + (d − 2p )
((x + 2p )2 + q −
f (x) zu berechnen, substituiere
Z
1
f (x) = k
D
Z
√
Dy −
Dy +
p
2
√
p2 k
4 )
.
= x(y):
D(d − 2p )
(1 + y2 )k
.
Dieses Integral lässt sich mit Hilfe der oben behandelten Funktionen lösen.
(xiv) Zu guter letzt noch Stammfunktion von C-wertigen Funktionen (w ∈ C):
Z
Z
1
eix = −ieix + c,
ewx = ewx + c,
w
Z
Z
1 wx x wx
1
x
e = e − 2 ewx + c.
xewx = ewx −
w
w
w
w
P(x)
, wobei
Um die Stammfunktion einer beliebigen rationalen Funktion R(x) = Q(x)
P(x) und Q(x) zwei reelle Polynome sind, zu ermitteln, werden wir diese in eine Summe von Funktionen entwickeln, deren Stammfunktionen wir eben kennengelernt haben.
Als erstes folgt aus dem Euklidischen Algorithmus, dass
P(x) = S (x)Q(x) + T (x),
wobei S (x) und T (x) reelle Polynome sind, und wobei der Grad von T (x) kleiner als
der von Q(x) ist.
R
R T (x)
T (x)
Das Integral von R(x) = S (x) + Q(x)
ist daher S (x) + Q(x)
. Das erste Integral
T (x)
weiter zerlegen.
errechnet man leicht mit Hilfe von (i). Für das zweite müssen wir Q(x)
Dazu betrachten wir zuerst die auftretenden Polynome als komplexe Polynome.
Das hat den Vorteil, dass sich jedes komplexe Polynom bis auf eine Konstante als
Produkt von Faktoren (z − z j ) schreiben lässt.
7.4.7 Satz. Seien T (z), Q(z) zwei komplexe Polynome, sodass der Grad n von Q(z)
größer als der von T (z) ist. Schreiben wir Q(z) = an zn + · · · + a0 (an ∈ C \ {0}) als
Q(z) = an (z − z1 )ν1 · · · · · (z − zm )νm ,
7.4. STAMMFUNKTION
187
wobei zi , z j wenn i , j und wobei ν1 + · · · + νm = n, so gibt es eindeutige Zahlen
a jk ∈ C, sodass (z < {z1 , . . . , zm })
ν
j
m
T (z) X X a jk
=
.
Q(z)
(z − z j )k
j=1 k=1
Beweis. Unser Problem ist äquivalent zur Existenz und Eindeutigkeit von Zahlen a jk ,
sodass (z ∈ C)
νj
m X
m
X
Y
1
T (z) =
a jk (z − z j )ν j −k
(z − zl )νl .
(7.16)
an
j=1 k=1
l=1,l, j
Betrachte den Vektorraum Cn [z] aller komplexen Polynome vom Grad kleiner n. Dieser
hat Dimension n. Kann man nun zeigen, dass die n Stück Polynome
(z − z j )ν j −k
m
Y
(z − zl )νl , j = 1, . . . , m, k = 1, . . . , ν j ,
l=1,l, j
linear unabhängig in Cn [z] sind, so bilden sie sogar eine Basis, und unser Satz folgt
sofort aus der Linearen Algebra.
Wäre
m
Y
X
λ jk (z − z j )ν j −k
(z − zl )νl = 0,
j=1,...,m,k=1,...,ν j
l=1,l, j
und setzt man z = z1 , . . . , zm , so erhält man λ1ν1 = · · · = λmνm = 0. Nun kann man
Qm
j=1; ν j >1 (z − z j ) durchdividieren und erhält
X
j=1,...,m;k=1,...,ν j −1
λ jk (z − z j )ν j −1−k
m
Y
(z − zl )νl −1 = 0.
l=1,l, j
Wiederholt man obige Argumentation, so folgt λ j(ν j −1) = 0 für alle j ∈ {1, . . . , m}, ν j >
1, usw. bis man schließlich λ jk = 0 für alle j = 1, . . . , m, k = 1, . . . , ν j erhält.
❑
Aus (7.16) sehen wir auch, wie man die Zahlen a jk gewinnen kann. In der Tat, kann
man alle auftretenden Polynome ausmultiplizieren, und vergleicht dann die Koeffizienten, die bei jedem zk links und rechts vom Gleichheitszeichen stehen. Diese müssen
übereinstimmen, und so erhält man n Gleichungen für n Unbekannte.
Etwas weniger Arbeit hat man, wenn man den eben gebrachten Beweisgedanken
einfließen lässt. Man kann nämlich in (7.16) nacheinander z = z1 , . . . , zm setzen und
erhält so a jν j ganz leicht.
Wir kehren zu unseren reellen Polynomen T (x) und Q(x) zurück. Wenn wir auf
diese Satz 7.4.7 anwenden, hat das den Nachteil, dass man eine Partialbruchzerlegung
mit möglicherweise nicht nur reellen Komponenten erhält.
Um das wieder zu reparieren, schließt man zuerst aus Q(z̄) = Q(z) (Q(z) hat ja
reelle Koeffizienten), dass mit z j auch z̄ j eine Nullstelle von Q(z) ist, und dass diese die
gleiche Vielfachheit ν j haben.
Somit sind die Nullstellen von Q(z) von der Form x1 , . . . , x p , z1 , . . . zq , z̄1 , . . . z̄q , wobei x j ∈ R und z j ∈ C+ := {z ∈ C : Im z > 0}. Die Partialbruchzerlegung aus Satz 7.4.7
lässt sich nun schreiben als
!
µj
q X
p νj
X
c jk
b jk
T (z) X X a jk
+
+
.
=
Q(z)
(z − x j )k j=1 k=1 (z − z j )k (z − z̄ j )k
j=1 k=1
KAPITEL 7. DIFFERENTIALRECHNUNG
188
T (z)
T (z̄)
= Q(z)
, folgt aus der Eindeutigkeit der komplexen PartialbruchzerleDa aber auch Q(z̄)
gung a jk ∈ R und c jk = b̄ jk , und man erhält
!
!
b jk
c jk
b j (z − z̄ j )k + b̄ j (z − z j )k
=
,
+
(z − z j )k (z − z̄ j )k
(z2 − 2z Re(z j ) + |z j |2 )k
wobei das Polynom im Zähler ebenfalls reell ist. Summiert man nun über k auf, und
bringt die Summe auf gemeinsamen Nenner, so erhält man eine Funktion der Form
(z2
T j (x)
,
+ B j z + C j )µ j
wobei T j (x) ein reelles Polynom mit Grad kleiner 2µ j ist, und B j = −2 Re(z j ), C j =
|z j |2 . Durch wiederholte Anwendung des Euklidischen Algorithmus kann man dieses
Polynom als
µj
X
(d jk z + e jk )(z2 + B jz + C j )µ j −k
k=1
anschreiben. Somit folgt die Zerlegung
ν
µ
j
j
XX
d jk z + e jk
T (z) X X a jk
=
+
,
k
2 + B z + C )k
Q(z)
(z
−
x
)
(z
j
j
j
j=1 k=1
j=1 k=1
p
q
(7.17)
welche nur reellen Zahlen beinhaltet. Dabei haben die z2 + B j z + C j klarerweise keine
reellen Nullstellen.
Zur Praktischen Berechnung der Koeffizienten a jk in (7.17) multipliziert man Q(z)
links und rechts, und führt einen Koeffizientenvergleich durch. Durch Einsatzen von
z = x j lassen sich die a jν j auch schneller berechnen.
R T (x)
Um Q(x)
zu berechnen, genügt es nun die einzelnen Summanden in der Partialbruchzerlegung zu integrieren, und diese dann zu summieren.
R
7.4.8 Beispiel. Wir wollen das Integral tan x dx auf einem Intervall I berechnen, wobei keine Nullstelle von cos x enthalten darf:
Z
Z
Z
sin x
1
i −
tan x dx =
dx =h
dt =
cos x
t
t=cos x
dt=− sin xdx
= − ln |t| + C = − ln | cos x| + C .
Diese Methode beruht darauf, dass unser Integrand von der Gestalt f (t(x)) t′ (x) ist, und
noch dazu mit einer sehr einfachen Funktion f . Daher können wir die Substitutionsregel unmittelbar anwenden und die entstehende Funktion leicht integrieren.
R
7.4.9 Beispiel. Wir wollen das Integral x2 sin x dx auf einem beliebigen Intervall berechnen. Wir verwenden partielle Integration:
Z
Z
Z
2
2
2
x sin x dx = x (− cos x) − 2x(− cos x) dx = −x cos x + 2 x cos x dx =
2
= −x cos x + 2 x sin x −
Z
sin x dx = −x2 cos x + 2x sin x + 2 cos x + C
7.4. STAMMFUNKTION
189
Mit dieser Methode kann man zum Beispiel alle Integrale von der Form
Z
Z
Z
x
P(x)e dx,
P(x) sin x dx,
P(x) cos x dx ,
mit einem Polynom P berechnen.
7.4.10 Beispiel (Integration von R(e x )). Hat man eine Funktion f der Gestalt f (x) =
R(e x ), wobei R eine rationale Funktion ist, so kann man deren Integral stets mit Hilfe
der Substitution t = e x auf das Integral einer rationalen Funktion bringen. Denn es gilt,
mit t = e x ,
Z
Z
1
x
R(t) dt
R(e ) dx =h t=ex i
t
x
dt=e dx
dx= 1t dt
R 2x −1
7.4.11 Beispiel. Wir wollen das Integral eex +2
dx auf R berechnen. Zunächst gilt
Z
Z 2x
Z 2
x 2
(e ) − 1
e −1
t −1 1
i
dx
=
dx
=h
· dt
x
x
x
t=e
e +2
e +2
t+2 t
1
dx= t dt
Man beachte, dass nach der Substitution t(x) = t in (0, +∞) liegt; also immer positiv ist.
Nun haben wir ein Integral einer rationalen Funktion auf (0, +∞) zu berechnen. Dazu
schreiben wir
t2 − 1
t2 − 1 1
t2 + 2t − 2t − 1
2t + 1
· = 2
=
=1−
t+2 t
t(t + 2)
t + 2t
t2 + 2t
und versuchen nun den zweiten Summanden in Partialbrüche zu zerlegen:
2t + 1
A
B
(A + B)t + 2A
= +
=
t(t + 2)
t
t+2
t(t + 2)
Koeffizientenvergleich führt auf A =
1
2
und B = 32 . Also haben wir
t2 − 1 1
1
3
· =1− −
t+2 t
2t 2(t + 2)
und daher
Z
1
3
t2 − 1 1
· dt = t − ln t − ln(t + 2) =
t+2 t
2
2
x 3
= e x − − ln(e x + 2)
2 2
7.4.12 Beispiel (Integration von R(sin x, cos x)). Hat man eine Funktion f der Gestalt
f (x) = R(sin x, cos x), wobei R eine rationale Funktion ist, so kann man deren Integral
stets mit Hilfe der Substitution t = tan 2x auf das Integral einer rationalen Funktion
bringen. Denn es gilt, mit t = tan 2x ,
x
sin x = 2 sin
2 tan 2
x
x
cos =
2
2 1 + tan2
x
2
=
2t
1 + t2
x
1 − t2
x
x 1 − tan2 2
=
− sin2 =
2
2 1 + tan2 2x
1 + t2
dt
1
x
2
= (1 + tan2 ) also dx =
dt
dx 2
2
1 + t2
cos x = cos2
190
KAPITEL 7. DIFFERENTIALRECHNUNG
Literaturverzeichnis
[EL] K.Endl,W.Luh: Analysis I-III, Aula Verlag, Wiesbaden 1986.
[F] G.M.Fichtenholz: Differential- und Integralrechnung I-III, Deutscher Verlag der
Wissenschaften, Berlin 1964.
[H] H.Heuser: Lehrbuch der Analysis 1,2, Teubner Verlag, Stuttgart 1989.
[L] S.Lang: A first course in calculus, Springer Verlag, Heidelberg 1986.
[R] W.Rudin: Principles of Mathematical Analysis, McGraw-Hill, New York 1953,
third edition 1976.
[W] W.Walter: Analysis 1, Springer Verlag, Heidelberg, New York Tokoyo.
191
Index
ǫ-Kugel, 99
C∞ (I), 165
Cn (I), 165
überall definiert, 4
Abbildung, 4
identische, 4
Abel Kriterium, 81
Ableitung
einer Funktion, 164
höhere, 165
im Punkt x, 159
linksseitige, 159
rechtsseitige, 159
Abschluss, 101
absolut konvergent, 77
Addition, 9, 20
alternierende harmonische Reihe, 77
analytisch, 143
analytisch in einem Punkt, 143
Anschlussstelle, 177
Antisymmetrie, 12
Arcuscosinus, 154
Funktionsgraph, 155
Arcuscotangens, 154
Funktionsgraph, 155
Arcussinus, 154
Funktionsgraph, 155
Arcustangens, 154
Funktionsgraph, 155
Areacosinus Hyperbolicus, 155
Funktionsgraph, 156
Areacotangens Hyperbolicus, 156
Funktionsgraph, 157
Areasinus Hyperbolicus, 155
Funktionsgraph, 156
Areatangens Hyperbolicus, 156
Funktionsgraph, 157
Assoziativität, 7, 20
Auswahlaxiom, 55
Bernoullische Ungleichung, 19
beschränkt, 13
nach oben, 13
nach unten, 13
beschränkte
Folge, 58
Menge, 58
Betrag
komplexer Zahlen, 47
bijektiv, 5
Cauchy-Folge, 63
Cauchy-Kriterium, 137
Cauchysches Konvergenzkriterium
Folgen, 64
Reihen, 77
Cauchysches Restglied, 177
Charakteristik, 38
Cosinus, 144
Funktionsgraph, 149
Cosinus Hyperbolicus, 155
Funktionsgraph, 156
Cotangens, 154
Funktionsgraph, 154
Cotangens Hyperbolicus
Funktionsgraph, 157
Dedekindscher Schnitt, 43
Definitionsbereich, 5
dicht, 93
Dichteeigenschaft, 39
Differentialgleichung, 179, 184
Differentialgleichungen
Trennung der Variablen, 184
Differenz, 2
differenzierbar
n-mal, 165
im Punkt x, 159
rechtsseitig, 159
stetig, 165
Dirichlet Kriterium, 80
192
INDEX
diskrete Metrik, 53
Distributivgesetz, 3
Distributivität, 20
divergent, 54, 73
bestimmt, 68
Dividieren mit Rest, 29
Doppelreihe, 87
Dreiecksungleichung, 16, 50
Dreiecksungleichung nach unten, 16
Einheitskreislinie, 103, 124
Einschränkung, 5
Elemente, 1
endlich, 25
Euklidischer Algorithmus, 186, 188
Eulersche Exponentialfunktion, 91
Eulersche Zahl, 148
Existenz des neutralen Elementes, 20
Exponentialfunktion, 91, 144
Funktionsgraph, 147
Extremum
absolutes, 165
lokales, 165
faktorielle, 79
Folge, 54
Cauchy-Folge, 63
monoton fallende, 63
monoton wachsende, 63
monotone, 63
Rechenregeln für, 60
streng monoton fallend, 55
Formel von de Moivre, 145
Fortsetzung, 5
Funktion, 4
beschränkte, 58, 132
bijektive, 5
Einschränkung, 5
Fortsetzung, 5
injektive, 5
monoton fallende, 129
monoton wachsende, 129
stetige, 117
streng monoton fallende, 29, 129
streng monoton wachsende, 29, 129
surjektive, 5
unstetige, 127
zusammengesetzte, 6
Funktionen
trigonometrische, 144
193
Funktionswert, 4
Gaußklammer, 118
Gaussche Zahlenebene, 47
gerichtete Menge, 109
Graph, 4
Grenzwert
einer Funktion, 114
einseitige, 115
linksseitiger, 115
rechtsseitiger, 115
Häufungspunkt
einer Folge, 104
einer Menge, 101
harmonische Reihe, 76
hebbare Unstetigkeit, 127
Hintereinanderausführung, 6
imaginäre Einheit, 46
Imaginärteil, 46
Induktions
-anfang, 19
-prinzip, 19
-schritt, 19
Varianten d., 25
Infimum, 13
injektiv, 5
Integral
unbestimmtes, 182
Intervall, 123
Involution, 27
isolierter Punkt, 101
Isometrie, 93
isometrisch, 93
isometrisch enthalten, 93
Körper
angeordneter, 11
archimedisch angeordneter, 39
vollständig angeordneter, 40
Kürzungsregel, 20
kartesisches Produkt, 2
Kommutativität, 20
kompakt, 107
Komplement, 2
komplex differenzierbar, 161
konjugiert komplexen, 48
konvergent, 54, 73
absolut, 77
INDEX
194
bedingt, 77
gegen ±∞, 68
gegen x, 54
gleichmäßig, 133
punktweise, 132
Konvergenz
gleichmäßige einer Funktionenfolge,
133
absolute einer Funktionenreihe, 138
absolute und gleichmäßige einer
Funktionenreihe, 139
einer Folge, 54
eines Netzes, 110
gleichmäßige einer Funktionenreihe,
138
komponentenweise, 65
punktweise einer Funktionenfolge,
132
punktweise einer Funktionenreihe,
138
Konvergenzradius, 139
Kurvendiskussionen, 181
Lagranges Restglied, 177
leere Menge, 1
Leibniz Kriterium, 81
Lemma vom iterierten Supremum, 43
Limes Inferior, 105
Limes Superior, 105
linksstetig, 127
Logarithmus
natürlicher, 147
naturalis, 147
Logarithmus naturalis
Funktionsgraph, 147
lokale Eigenschaft, 118
Mächtigkeit, 25
Majorantenkriterium, 76
Maximum, 13
absolutes, 165
lokales, 165
Menge, 1
abgeschlossene, 101
Bild, 5
Differenz-, 2
Distributivgesetz-, 3
leere, 1
Ober-, 1
offene, 100
Potenz-, 3
Schnitt-, 2
Teil-, 1
Vereinigungs-, 2
zusammenhängende, 123
Mengen
getrennte, 123
Mengengleichheit, 1
Metrik, 50
euklidische, 50
Supremums-, 133
metrischer Raum
vollständiger, 64
Minimum, 13
absolutes, 165
lokales, 165
Minkowskische Ungleichung, 51
Minorantenkriterium, 76
Mittel
arithmetisches, 12
Mittelwertsatz, 167
monoton fallend, 63, 129
monoton wachsend, 63, 129
Moore-Smith-Folge, 110
Multiplikation, 9, 20
Nachfolgerabbildung, 16
natürliche Zahlen, 16
Netz, 110
Norm, 53
obere Schranke, 13
Obermenge, 1
Partialbruchzerlegung
komplexe, 186
reelle, 188
Partialsumme, 72
Permutation, 82
Pi, 149
Polarkoordinaten, 151
Polynom
trigonometrisches, 153
Potenzmenge, 3
Potenzreihe, 143
Potenzreihen, 139
Primfaktorzerlegung, 30
Primzahl, 30
Produktregel, 162
Quotientenkörper, 38
INDEX
Quotientenkriterium, 78
Quotientenregel, 162
Raabe Kriterium, 81
Raum
metrischer, 50
Realteil, 46
rechtsstetig, 127
Reflexivität, 12
Regel von de L’Hospital, 170
Regel von der Partiellen Integration, 183
Reihe, 72
alternierende harmonische, 77
bestimmt divergente, 73
divergente, 73
geometrische, 57
harmonische, 76
konvergent gegen ±∞, 73
konvergente, 73
lineare Anordnung, 87
Potenzreihen, 139
Rechenregeln für, 73
Summe der, 73
Teleskop-, 75
Umordnung, 82
Riemann-Zerlegung, 110
195
Sprungstelle, 127
Stammfunktion, 182
stetig, 117
an der Stelle x, 117
gleichmäßig, 125
linksseitig, 127
rechtsseitig, 127
streng monoton fallend, 129
streng monoton wachsend, 129
Substitutionsregel, 183
Summensätze, 146
Supremum, 13
Supremumsnorm, 138
surjektiv, 5
Tangens, 154
Funktionsgraph, 154
Tangens Hyperbolicus
Funktionsgraph, 157
Taylorreihe, 178
Taylorsche Polynom, 177
Teilfolge, 56
Teilfolgen
gestattet, 111
Teilmenge, 1
Teilnetz, 111
Totalität, 12
Satz
Transitivität, 12
1. Mittelwertsatz der Differenzial- Trennung der Variablen, 184
rechnung, 167
2. Mittelwertsatz der Differenzial- Unstetigkeit
rechnung, 169
1. Art, 127
Cauchysches Konvergenzkriterium,
2. Art, 127
64, 77
hebbare, 127
Eindeutigkeits-, 18
Sprungstelle, 127
Einschluss-, 60
untere Schranke, 13
Fundamentalsatz der Algebra, 152
Urbild, 5
Leibniz Kriterium, 81
vollständiges, 5
Rekursions-, 17
Taylorscher Lehrsatz, 177
Vereinigungsmenge, 2
von Bolzano-Weierstraß, 104
Verknüpfung, 9
von Rolle, 166
vollständige Induktion, 19
Zwischenwertsatz, 124
Weierstraß Kriterium, 139
Schlömilchsches Restglied, 177
Wertebereich, 5
Schnittmenge, 2
wohldefiniert, 4
Schwarzsche Ungleichung, 51
Wurzel
Sinus, 144
einer komplexen Zahl, 152
Funktionsgraph, 149
einer reellen Zahl ≥ 0, 41
Sinus Hyperbolicus, 155
Wurzelkriterium, 78
Funktionsgraph, 156
196
Zahl
komplexe, 46
rationale, 34
Zahlen
natürliche, 16
positive, 12
Zerlegung, 110
INDEX

Zugehörige Unterlagen

Folgende Aussagen sind äquivalent in R : Vollständigkeit: In R

Blatt 6

Blatt 5

Konvergenzkriterien

Analysis 1

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können