Analysis 1

Werbung
Analysis 1
August 2010
Michael Kaltenbäck
Inhaltsverzeichnis
1
Mengen und Abbildungen
1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Die reellen Zahlen
2.1 Algebraische Struktur der reellen Zahlen
2.2 Ordnungsstruktur der reellen Zahlen . .
2.3 Die natürlichen Zahlen . . . . . . . . .
2.4 Der Ring der ganzen Zahlen . . . . . .
2.5 Der Körper Q . . . . . . . . . . . . . .
2.6 Archimedisch angeordnete Körper . . .
2.7 Das Vollständigkeitsaxiom . . . . . . .
2.8 Die komplexen Zahlen . . . . . . . . .
3
1
1
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
11
16
26
34
39
40
46
Der Grenzwert
3.1 Metrische Räume . . . . . . . . . . . . . . .
3.2 Der Grenzwert in metrischen Räumen . . . .
3.3 Folgen reeller und komplexer Zahlen . . . . .
3.4 Existenz von Grenzwerten . . . . . . . . . .
3.5 Konvergenz in weiteren metrischen Räumen .
3.6 Konvergenz gegen unendlich . . . . . . . . .
3.7 Unendliche Reihen . . . . . . . . . . . . . .
3.8 Konvergenzkriterien . . . . . . . . . . . . . .
3.9 Umordnungen von Reihen und Doppelreihen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
49
54
59
62
65
68
72
77
82
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
Die Konstruktion der reellen Zahlen
5
Geometrie metrischer Räume
5.1 ǫ-Kugeln, offene und abgeschlossene Mengen . . . . . . . . . . . . .
5.2 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Folgen und Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
99
104
109
6
Reelle und komplexe Funktionen
6.1 Stetigkeit . . . . . . . . . .
6.2 Der Zwischenwertsatz . . .
6.3 Gleichmäßige Stetigkeit . . .
6.4 Unstetigkeitsstellen . . . . .
6.5 Monotone Funktionen . . . .
6.6 Gleichmäßige Konvergenz .
117
117
122
124
127
129
131
.
.
.
.
.
.
93
.
.
.
.
.
.
.
.
.
.
.
.
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
ii
6.7
6.8
6.9
6.10
Reell- und komplexwertige Folgen und Reihen
Die Exponentialfunktion . . . . . . . . . . . .
Fundamentalsatz der Algebra . . . . . . . . . .
Weitere wichtige elementare Funktionen . . . .
7 Differentialrechnung
7.1 Begriff der Ableitung . .
7.2 Mittelwertsätze . . . . .
7.3 Der Taylorsche Lehrsatz
7.4 Stammfunktion . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
138
144
152
154
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
159
159
165
174
182
Literaturverzeichnis
191
Index
192
Kapitel 1
Mengen und Abbildungen
1.1 Mengen
Die Objekte der modernen Mathematik sind die Mengen. Obwohl die Logik einen
axiomatischen Zugang zur Mengenlehre bietet, wollen wir uns auf den vom Schöpfer
der Mengenlehre (Georg CANTOR) geprägten Mengenbegriff stützen:
1.1.1 Definition. Eine Menge ist eine Zusammenfassung von bestimmten, wohlunterschiedenen Objekten unserer Anschauung zu einem Ganzen. Die Objekte heißen
Elemente der Menge.
Ist x ein solches Element von M, so schreiben wir x ∈ M. Im Falle, dass x nicht
zu M gehört, schreiben wir x < M. Möglichkeiten Mengen darzustellen sind die
aufzählende Schreibweise:
M = {a, b, c, d, e}, oder M = {1, 2, . . . }
und die beschreibende Schreibweise:
M = {x : x ist ungerade ganze Zahl}.
1.1.2 Definition. Sind A, B Mengen, so sagt man A ist gleich B (A = B), wenn sie die
selben Elemente enthalten. Man sagt A ist eine Teilmenge von B (A ⊆ B), falls jedes
Element von A auch ein Element von B ist. In diesem Fall bezeichnet man auch B als
Obermenge von A (B ⊇ A).
Will man zum Ausdruck bringen, dass dabei A mit B nicht übereinstimmt, so
schreibt man A ( B.
Schreibweisen wie A , B, A ) B, o.ä. sind dann selbsterklärend. Einer bestimmten
Menge werden wir oft begegnen, nämlich der leeren Menge ∅, also der Menge, die
keine Elemente enthält.
Man beachte zum Beispiel, dass die Menge {a, b, c} gleich der Menge {c, a, b, a} ist,
und dass z.B. die Menge {1, 3, 5, . . . } mit
{x : x ist ungerade natürliche Zahl}
übereinstimmt.
Hat man zwei oder mehrere Mengen, so kann man diese in verschiedener Weise
miteinander verknüpfen.
1
KAPITEL 1. MENGEN UND ABBILDUNGEN
2
1.1.3 Definition. Seien A und B zwei Mengen:
Die Menge A ∪ B = {x : x ∈ A oder x ∈ B} heißt die Vereinigungsmenge von A
und B. Für A ∪ B sagt man kurz auch A vereinigt B.
Die Menge A ∩ B = {x : x ∈ A und x ∈ B} heißt die Schnittmenge von A und B.
Man sagt kurz auch A geschnitten B.
Die Menge B \ A = {x : x ∈ B und x < A} ist die Differenz von B und A. Man
sagt kurz auch B ohne A.
Betrachtet man Teilmengen A einer fixen Grundmenge M, so schreiben wir auch
Ac für M \ A und nennen es das Komplement von A in M, kurz A Komplement.
A × B := {(x, y) : x ∈ A, y ∈ B} das kartesische Produkt der Mengen A und B.
Das ist also die Menge, deren Elemente die geordneten Paare sind, deren erste
Komponente zu A und deren zweite Komponente zu B gehört1 . Für A×A schreibt
man auch A2 .
Auch Durchschnitt und Vereinigung von mehr als zwei Mengen kann man analog
definieren. Ist Mi , i ∈ I, eine Familie von Mengen, durchindiziert mit der Indexmenge
I, so ist
\
Mi := {x : x ∈ Mi für alle i ∈ I},
[
i∈I
i∈I
Mi := {x : es gibt ein i ∈ I mit x ∈ Mi }.
Das kartesische Produkt endlich vieler Mengen ist analog wie jenes für zwei Mengen
erklärt. Zum Beispiel ist
A × B × C := {(x, y, z) : x ∈ A, y ∈ B, z ∈ C}.
Für A × A × A schreibt man A3 , u.s.w.
1.1.4 Beispiel.
Einfache Beispiele für Durchschnitts- bzw. Vereinigungsbildung wären:
{1, 2, 3} ∩ {−1, 0, 1} = {1}, {a, b, 7} ∩ {3, 4, x} = ∅,
{2, 3, 4, 5} ∪ {4, 5, 6, 7} = {2, 3, 4, 5, 6, 7}, {a, b, c} ∪ ∅ = {a, b, c}.
Ist M2 = {x ∈ Z : es gibt ein y ∈ Z, sodass x = 2y}, so wäre Z \ M2 gerade die
Menge der ungeraden ganzen Zahlen.
Weiters ist
{1, 2, 3, 4} \ {4, 5, 6, 7} = {1, 2, 3}, {a, b, c} \ ∅ = {a, b, c}.
Bezeichnet man mit 2N die Menge der geraden natürlichen Zahlen, so ist das
kartesische Produkt N × 2N die Menge
N × 2N = {(1, 2), (1, 4), . . ., (2, 2), (2, 4), . . ., (3, 2), (3, 4), . . .}.
1 Anm.:
Ist x , y, so ist (x, y) , (y, x).
1.1. MENGEN
3
1.1.5 Definition. Ist M eine Menge, so bezeichnet man mit P(M) die Menge aller
Teilmengen von M,
P(M) = {A : A ⊆ M}.
Diese Menge heißt die Potenzmenge von M. Sie ist also die Menge, deren Elemente
alle Teilmengen von M sind.
1.1.6 Beispiel. Ist M = {1, 2, 3}, dann ist die Potenzmenge P(M) gleich
P(M) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}.
Die Potenzmenge der Menge N ist schon viel zu groß um sie noch in irgendeiner
aufzählenden Weise anschreiben zu können. Sie enthält ja neben Mengen des Typs
{1, 2, 3}, {4, 6, 7, 8, 1004} usw. auch noch unendliche Mengen wie zum Beispiel 2N oder
{n ∈ N : n ≥ 27} und viele mehr.
1.1.7 Bemerkung. Für das Verknüpfen von Mengen gelten diverse Rechenregeln. Es
gilt zum Beispiel das Distributivgesetz für drei Mengen A, B, C:
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
(1.1)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
Um z.B. (1.1) nachzuweisen beachte man, dass zwei Mengen übereinstimmen, wenn
ein beliebiges Element x genau dann in der einen Menge ist, wenn es auch in der
anderen Menge ist:
Ein x liegt in A ∩ (B ∪ C)
genau dann, wenn
x ∈ A und x ∈ B ∪ C.
Das ist gleichbedeutend mit:
x ∈ A, und x liegt zumindest in einer der Mengen B bzw. C.
Diese Aussage ist aber äquivalent zu:
Zumindest eine der Aussagen - x ∈ A und x ∈ B - oder - x ∈ A und x ∈ C - trifft zu.
Nun ist das dasselbe, wie:
x ∈ A ∩ B oder x ∈ A ∩ C.
Schließlich gilt das genau dann, wenn
x ∈ (A ∩ B) ∪ (A ∩ C).
Den an einem kleinen Abriss des axiomatischen Zugangs zur Mengenlehre interessierten Leser möchte ich hier an die Vorlesung Lineare Algebra verweisen.
KAPITEL 1. MENGEN UND ABBILDUNGEN
4
1.2 Funktionen
1.2.1 Definition. Seien M und N Mengen. Eine Teilmenge f ⊆ M × N heißt eine
Funktion von M nach N, wenn gilt
(i) Für alle x ∈ M gibt es ein y ∈ N : (x, y) ∈ f ,
(ii) Sind (x, y1 ) ∈ f und (x, y2 ) ∈ f , so folgt y1 = y2 .
Die Bedingung (i) besagt, dass jedem x (mindestens) ein Funktionswert y zugeordnet wird, man sagt auch f ist überall definiert.
Die Bedingung (ii) besagt, dass einem x höchstens ein Funktionswert zugeordnet
wird. Man sagt auch f sei wohldefiniert.
Insgesamt hat man also: Eine Funktion von M nach N ist eine (wie auch immer
geartete) Vorschrift, durch die jedem Element x aus der Menge M in eindeutiger Weise
ein Element y aus der Menge N zugeordnet wird. Man schreibt y = f (x) und bezeichnet y als den Funktionswert von f an der Stelle x. Anstelle des Namens Funktion“
”
gebraucht man auch den Namen Abbildung.
Klarerweise stimmen zwei Funktionen f und g von M nach N überein, also f = g,
genau dann, wenn f (x) = g(x) für alle x ∈ M.
Sieht man eine Funktion eher als Abbildungsvorschrift, dann unterscheidet man
- obwohl mathematisch das Gleiche - die Funktion als Abbildungsvorschrift und die
Funktion als Teilmenge von M × N, und man bezeichnet diese Teilmenge von M × N
auch als Graph graph f von f .
Da für eine Funktion der einem Wert zugeordnete Funktionswert ja eindeutig bestimmt ist, schreibt man eine Funktion f von M nach N auch oft an als
(
M →
N
f :
.
x 7→ f (x)
1.2.2 Definition. Ist M eine Menge, so heißt die Abbildung
(
M → M
idM :
x 7→ x
die identische Abbildung auf der Menge M. Daher id M : M → M mit id M (x) = x.
1.2.3 Beispiel. Sei M die Menge aller Wörter in einem Wörterbuch. N = {1, 2, . . . } sei
die Menge der natürlichen Zahlen. Sei nun f jene Funktion auf M, die jedem Wort die
Anzahl seiner Buchstaben zuweist. Also z.B.
f (’gehen’) = 5.
1.2.4 Beispiel. Wir haben im Abschnitt über Familien von Mengen Mi , i ∈ I, gesprochen, ohne genau zu sagen, was das bedeutet. Das ist nämlich die Funktion i 7→ Mi von
der Indexmenge I in die Potenzmenge P(M), wobei M eine hinreichend große Menge
ist, die alle Mengen Mi enthält, z.B. M = ∪i∈I Mi .
1.2.5 Bemerkung. In manchen Zusammenhängen betrachtet man auch Funktionen, die
nicht überall definiert sind. Das sind Teilmengen von f ⊆ M × N, die nur die Eigenschaft (ii) aus Definition 1.2.1 haben, d.h. dass es zu jedem Wert x ∈ M höchstens einen
1.2. FUNKTIONEN
5
Funktionswert (d.h. keinen oder genau einen) y ∈ N gibt. Man muss dann zusätzlich
den Definitionsbereich dom f (vom englischen Wort domain) der Funktion angeben:
dom f = {x ∈ M : es gibt ein y ∈ N, sodass (x, y) ∈ f }.
Der Wertebereich ran f (vom englischen Wort range) einer Funktion f ist die Menge
ran f = {y ∈ N : es gibt ein x ∈ M, sodass (x, y) ∈ f }.
Betrachte zum Beispiel
f := {(x, y) ∈ N2 : x = 2y}.
(1.2)
Offenbar ist dieses f eine nur auf der Menge der geraden Zahlen definierte Funktion.
1.2.6 Definition. Sei f eine Funktion von M nach N und sei A ⊆ M. Die Funktion, die
jedem x ∈ A den Funktionswert f (x) zuweist, heißt Einschränkung von f auf A und
wird mit f |A bezeichnet. Also
f |A = {(x, y) ∈ f : x ∈ A}.
Ist umgekehrt g eine Funktion von A nach N und M ⊇ A, so heißt eine Funktion
f : M → N Fortsetzung von g, falls g = f |A .
1.2.7 Definition. Für eine Teilmenge A von M bezeichne
f (A) = {y ∈ N : es gibt ein x ∈ A, sodass f (x) = y},
das Bild der Menge A unter der Abbildung f . Klarerweise ist ran f = f (M).
Ist y ∈ N, und ist x ∈ M, sodass y = f (x), so bezeichnet man x als ein Urbild von
y. Das vollständige Urbild einer Teilmenge B von N ist die Menge
f −1 (B) := {x ∈ M : f (x) ∈ B}.
1.2.8 Bemerkung. Ist f : M → N eine Funktion, und ist B ⊆ N mit f (M) ⊆ B, so kann
man f auch als Funktion von M nach B betrachten.
1.2.9 Beispiel. Betrachte zum Beispiel die Funktion n 7→ 2n von N in N. Natürlich
kann man auch n 7→ 2n als Funktion von N in die Menge aller geraden natürlichen
Zahlen betrachten.
Folgende Begriffsbildung ist auf den ersten Blick nicht allzu kompliziert. Sie spielt
aber in der Mathematik eine ganz wichtige Rolle.
1.2.10 Definition. Sei f : M → N eine Funktion. f heißt
injektiv, wenn gilt
f (x1 ) = f (x2 ) ⇒ x1 = x2 ,
d.h. zu jedem Wert y ∈ N gibt es höchstens ein Urbild. Äquivalent dazu ist, dass
aus x1 , x2 folgt, dass f (x1 ) , f (x2 ).
surjektiv, wenn es zu jedem y ∈ N ein x ∈ M gibt, sodass f (x) = y, oder äquivalent ausgedrückt: für alle y ∈ N : f −1 ({y}) , ∅. D.h. also, dass jedes Element von
N wirklich als Funktionswert von f auftritt: ran f = N.
Eine Funktion, die sowohl injektiv als auch surjektiv ist, bezeichnet man als bijektiv.
KAPITEL 1. MENGEN UND ABBILDUNGEN
6
1.2.11 Bemerkung. Man beachte, dass die Eigenschaft surjektiv, und somit auch bijektiv, zu sein, ganz wesentlich vom betrachteten Bildbereich der Funktion f abhängt.
Denn ist etwa f : M → N eine beliebige Funktion, und betrachtet man f als
Funktion von M nach f (M) und nicht nach N, so ist f : M → f (M) immer surjektiv.
Vergleiche auch Bemerkung 1.2.8.
1.2.12 Beispiel. Folgende drei Beispiele zeigen insbesondere, dass keine der beiden
Eigenschaften injektiv und surjektiv zu sein, die jeweils andere impliziert.
Sei A die Menge aller in Österreich amtlich registrierten Staatsbürger, und sei f
jene Funktion, die einer Person aus A ihre Sozialversicherungsnummer zuordnet.
Dann ist f : A → N keine surjektive (es gibt ja nur endlich viele Österreicher),
aber sehr wohl eine injektive Funktion, da zwei verschiedene Personen auch zwei
verschiedene Sozialversicherungsnummern haben.
Die Funktion g : A → N, die jeder Person ihre Körpergröße in Zentimeter (gerundet) zuordnet, ist weder injektiv noch surjektiv.
Sei h : N → N die Funktion, die einer Zahl (dargestellt im Dezimalsystem) ihre
Ziffernsumme zuordnet. Diese Funktion ist nicht injektiv (h(11) = 2 = h(2)),
aber sie ist surjektiv, denn ist n ∈ N, so gilt sicherlich
h(11
. . .}
1) = n.
| {z
n Stellen
1.2.13 Lemma. Sei f eine Funktion von M nach N. Ist f bijektiv, so ist
f −1 = {(y, x) ∈ N × M : (x, y) ∈ f }
eine Funktion von N nach M.
Beweis. Ist y ∈ N, dann existiert ein x ∈ M mit y = f (x), da f surjektiv ist. Also ist
die Forderung (i) von Definition 1.2.1 für f −1 erfüllt. Um auch (ii) nachzuprüfen, sei
(y, x1 ), (y, x2 ) ∈ f −1 . Dann sind (x1 , y), (x2 , y) ∈ f und wegen der Injektivität von f
folgt x1 = x2 .
❑
1.2.14 Bemerkung. Man sieht am obigen Beweis, dass die Inverse f −1 einer injektiven
Funktion f eine nicht notwendig überall definierte Funktion ist. Ihr Definitionsbereich
ist gerade ran f . Ist dagegen f nicht injektiv, so ist f −1 nicht einmal mehr eine nicht
überall definierte Funktion.
Durch unmittelbares Nachprüfen der Definition sieht man, dass die Zusammensetzung von Funktionen wieder eine Funktion ist.
1.2.15 Definition. Seien f : M → N und g : N → P Funktionen. Dann bezeichne g ◦ f
jene Funktion von M nach P, die durch
(g ◦ f )(x) = g( f (x)), x ∈ M,
definiert ist. Man bezeichnet g ◦ f oft auch als die zusammengesetzte Funktion oder als
die Hintereinanderausführung von f und g.
1.2. FUNKTIONEN
7
1.2.16 Bemerkung. Man kann g ◦ f auch als
{(x, z) : ∃y ∈ N, (x, y) ∈ f, (y, z) ∈ g}
(1.3)
schreiben.
Ist f eine Abbildung von M nach N, so gilt immer f = f ◦ id M = idN ◦ f .
Das Hintereinanderausführen ist assoziativ: Sind f : M → N, g : N → P und h : P →
Q Funktionen so gilt (x ∈ M)
((h ◦ g) ◦ f )(x) = (h ◦ g)( f (x)) = h(g( f (x))) =
h((g ◦ f )(x)) = (h ◦ (g ◦ f ))(x).
Also gilt (h ◦ g) ◦ f = h ◦ (g ◦ f ). Als Konsequenz schreiben wir auch h ◦ g ◦ f dafür.
1.2.17 Bemerkung. Sind f und g nicht mehr überall definiert, so muss man bei der
Komposition darauf achten, dass die Definitionsbereiche so zusammenpassen, dass der
Bildbereich von f im Definitionsbereich von g enthalten ist.
1.2.18 Satz. Eine Funktion f : M → N ist genau dann bijektiv, wenn es eine Funktion
g : N → M gibt mit
g ◦ f = id M , f ◦ g = idN .
In diesem Fall gilt g = f −1 .
Ist h : N → P ebenfalls bijektiv, so gilt weiters
(h ◦ f )−1 = f −1 ◦ h−1 .
Beweis. Sei zunächst f bijektiv. Offenbar gilt
( f −1 ◦ f )(x) = x, x ∈ M,
und
( f ◦ f −1 )(y) = y, y ∈ N.
Also hat die Funktion g = f −1 alle im Satz geforderten Eigenschaften.
Sei nun die Existenz einer Funktion g mit den genannten Eigenschaften vorausgesetzt. Ist y ∈ N, so setze x = g(y), dann gilt f (x) = f (g(y)) = idN (y) = y. D.h. f ist
surjektiv. Ist f (x1 ) = f (x2 ), so folgt
x1 = g( f (x1 )) = g( f (x2 )) = x2 .
Also ist f auch injektiv. Schließlich:
g = id M ◦g = ( f −1 ◦ f ) ◦ g = f −1 ◦ ( f ◦ g) = f −1 ◦ idN = f −1 .
Die Funktion e := f −1 ◦ h−1 erfüllt wegen der Assoziativität der Hintereinanderausführung
e ◦ (h ◦ f ) = f −1 ◦ (h−1 ◦ h) ◦ f = f −1 ◦ idN ◦ f = f −1 ◦ f = id M ,
sowie
(h ◦ f ) ◦ e = h ◦ ( f ◦ f −1 ) ◦ h−1 = h ◦ idN ◦h−1 = h ◦ h−1 = idP .
Nach dem ersten Teil des Satzes gilt e = (h ◦ f )−1 .
❑
8
KAPITEL 1. MENGEN UND ABBILDUNGEN
Kapitel 2
Die reellen Zahlen
Die reellen Zahlen sind eine Menge, die uns anschaulich schon aus der Schule bekannt
ist. Wir wollen im Folgenden die charakteristischen Eigenschaften der reellen Zahlen
sammeln, von denen wir dann sehen werden, dass diese die reellen Zahlen (bis auf
isomorphe Kopien) eindeutig bestimmen. Dass es die reellen Zahlen (also eine Menge mit den charakteristischen Eigenschaften) unter der Annahme der Gültigkeit der
Mengenlehre überhaupt gibt, werden wir auch später sehen.
2.1 Algebraische Struktur der reellen Zahlen
Zuerst wollen wir uns den Operationen + und ·, also der algebraischen Struktur, zuwenden. Die reellen Zahlen mit diesen Operationen sind ein so genannter Körper:
2.1.1 Definition. Sei K eine nichtleere Menge, und es seien Abbildungen (Verknüpfungen)
+ : K × K → K (Addition)
und
· : K × K → K (Multiplikation)
gegeben. Das Tripel hK, +, ·i heißt Körper, falls folgende Gesetze gelten. Wir schreiben
dabei x + y für +(x, y) und x · y für ·(x, y).
(A1) Die Addition ist assoziativ:
(x + y) + z = x + (y + z), x, y, z ∈ K.
(A2) Es existiert ein neutrales Element 0 ∈ K bezüglich +:
x + 0 = x, x ∈ K.
(A3) Jedes Element x ∈ K besitzt ein Inverses −x ∈ K bezüglich +:
x + (−x) = 0.
(A4) Die Addition ist kommutativ:
x + y = y + x, x, y ∈ K.
9
KAPITEL 2. DIE REELLEN ZAHLEN
10
(M1) Die Multiplikation ist assoziativ:
(x · y) · z = x · (y · z), x, y, z ∈ K.
(M2) Es existiert ein neutrales Element 1 ∈ K \ {0} bezüglich ·:
x · 1 = x, x ∈ K \ {0}.
(M3) Jedes von 0 verschiedene Element x besitzt ein Inverses bezüglich ·:
x · x−1 = 1.
(M4) Die Multiplikation ist kommutativ:
x · y = y · x, x, y ∈ K.
(D) Es gilt das Distributivgesetz:
x · (y + z) = (x · y) + (x · z), x, y, z ∈ K.
2.1.2 Bemerkung. Da hK, +i und hK \ {0}, ·i Gruppen sind, folgt, dass die jeweiligen
neutralen Elemente 0 bzw. 1 eindeutig bestimmt sind: Wäre etwa 0̃ ein weiters neutrales
Element bezüglich +, so folgte aus (A2) und (A4), dass
0 = 0̃ + 0 = 0̃.
Dasselbe gilt für die Inversen −a und a−1 . Wäre etwa ã ein weiteres additiv Inverses zu
a, also a + ã = 0, so folgte
ã = ã + (a + (−a)) = (ã + a) +(−a) = 0 + (−a) = −a.
| {z } | {z }
=0
=0
Somit ist x 7→ −x eine - wie aus untenstehenden Rechenregeln folgt - bijektive Funktion von K auf sich selbst und x 7→ x−1 eine bijektive Funktion von K \ {0} auf sich
selbst. Siehe dazu die Lineare Algebra Vorlesung.
2.1.3 Beispiel. Man betrachte die Menge K = {≬, ⋔}. Die Verknüpfungen + und · seien
gemäß folgender Verknüpfungstafeln definiert.
+
≬
⋔
≬
≬
⋔
⋔
⋔
≬
·
≬
⋔
≬
≬
≬
⋔
≬
⋔
Man erkennt unschwer, dass alle Anforderungen an einen Körper, d.h. Axiome
(A1) − (A4), (M1) − (M4), (D), erfüllt sind, wobei ≬ des neutrale 0 Element bezüglich
+ und ⋔ des neutrale Element 1 bezüglich · ist.
Es sei noch bemerkt, dass jeder Körper mindestens zwei Elemente hat, und somit
der hier vorgestellte Körper kleinst möglich ist.
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
11
Wir werden xy für x · y und, falls y , 0, für xy−1 oft yx schreiben. Um Klammern
zu sparen, wollen wir auch übereinkommen, dass Punkt- vor Strichrechnung kommt
(xy + xz = (xy) + (xz)). Schließlich werden wir für x + (−y) bzw. (−x) + y auch x − y
bzw. −x + y schreiben.
Aus obigen Gesetzen für einen Körper leitet man in elementarer Weise folgende
Rechenregeln her:
2.1.4 Lemma. Es gelten folgende Rechenregeln:
(i) Die Inverse von der Inversen ist die Zahl selbst: −(−x) = x, x ∈ K und (x−1 )−1 =
x, x ∈ K \ {0}.
(ii) −(x + y) = (−x) + (−y), x, y ∈ K.
(iii) x, y , 0 ⇒ x · y , 0 und (xy)−1 = x−1 y−1 , sowie (−x)−1 = −(x−1 ). Insbesondere
(−1)(−1) = 1.
(iv) x · 0 = 0, x(−y) = −xy, (−x)(−y) = xy, x(y − z) = xy − xz.
(v)
ac
bd
=
ac
bd .
Beweis. Exemplarisch wollen wir −(x + y) = (−x) + (−y) nachweisen: Es gilt wegen
dem Kommutativgesetz und Assoziativgesetz
(x + y) + ((−x) + (−y)) = ((x + y) + (−x)) + (−y) = ((y + x) + (−x)) + (−y) =
(y + (x + (−x))) + (−y) = ((y + 0) + (−y)) = y + (−y) = 0.
Also ist (−x) + (−y) eine additiv Inverse von x + y. Wegen Bemerkung 2.1.2 ist diese
additiv Inverse aber eindeutig. Also (−x) + (−y) = −(x + y).
❑
Schließlich wollen wir noch einige Schreibweisen festlegen: Ist A Teilmenge unseres Körpers K, so sei
−A = {−a : a ∈ A}.
Also ist −A das Bild von A unter der Abbildung −.
Sind A, B ⊆ K, so sei
A + B = {a + b : a ∈ A, b ∈ B}.
Somit ist A + B das Bild von A × B(⊆ K × K) unter der Abbildung +.
Entsprechend seien A−1 , A − B, etc. definiert.
2.2 Ordnungsstruktur der reellen Zahlen
Eine weitere wichtige Eigenschaft der reellen Zahlen, wie aus der Schule bekannt,
ist die, dass man je zwei Zahlen x und y der Größe nach vergleichen kann. Dabei ist
bekannterweise x < y genau dann, wenn y − x eine positive reelle Zahle ist. Um diesen
Sachverhalt mathematisch zu fassen, definieren wir
2.2.1 Definition. Sei hK, +, ·i ein Körper und sei P ⊆ K. Dann heißt K (streng genommen hK, +, ·, Pi) ein angeordneter Körper, wenn gilt
KAPITEL 2. DIE REELLEN ZAHLEN
12
1
˙ ∪(−P),
˙
(P1) Es gilt K = P∪{0}
wobei P, −P disjunkt sind (ihr Schnitt ist die leere
Menge), und beide 0 nicht enthalten.
(P2) x, y ∈ P ⇒ x + y ∈ P.
(P3) x, y ∈ P ⇒ xy ∈ P
Die Menge P heißt die Menge der positiven Zahlen.
Seien x, y ∈ K. Wir sagen, dass
x kleiner als y ist, in Zeichen x < y, wenn y − x ∈ P.
x größer als y ist, in Zeichen x > y, wenn x − y ∈ P.
x kleiner oder gleich y ist, in Zeichen x ≤ y, wenn x < y ∨ x = y.
x größer oder gleich y ist, in Zeichen x ≥ y, wenn x > y ∨ x = y.
2.2.2 Lemma. In einem angeordneten Körper K gelten für beliebige a, b, x, y, z ∈ K
folgende Regeln:
(i) x ≤ x (Reflexivität).
(ii) (x ≤ y ∧ y ≤ x) ⇒ x = y (Antisymmetrie).
(iii) (x ≤ y ∧ y ≤ z) ⇒ x ≤ z (Transitivität).
(iv) x ≤ y ∨ y ≤ x (Totalität).
(v) (x ≤ y ∧ a ≤ b) ⇒ x + a ≤ y + b.
(vi) x ≤ y ⇒ −x ≥ −y.
(vii) (z > 0 ∧ x ≤ y) ⇒ xz ≤ yz und (z < 0 ∧ x ≤ y) ⇒ xz ≥ yz.
(viii) x , 0 ⇒ x2 > 0. Insbesondere: 1 > 0.
(ix) x > 0 ⇒ x−1 > 0 und x < 0 ⇒ x−1 < 0.
(x) 0 < x ≤ y ⇒ ( yx ≤ 1 ≤
y
x
∧ x−1 ≥ y−1 ).
(xi) (0 < x ≤ y ∧ 0 < a ≤ b) ⇒ xa ≤ yb.
(xii) x < y ⇒ x <
x+y
2
< y, wobei 2 := 1 + 1.
Beweis. Wir beweisen exemplarisch (ii), (iii), (viii) und (xii):
(ii): (x ≤ y ∧ y ≤ x) ist per Definitionem dasselbe, wie y − x ∈ P ∪ {0} ∧ x − y ∈ P ∪ {0}.
Also y − x ∈ (P ∪ {0}) ∩ (−P ∪ {0}) = {0}, und damit x = y.
(iii): (x ≤ y ∧ y ≤ z) ⇔ (y − x ∈ P ∪ {0} ∧ z − y ∈ P ∪ {0}). Aus (P2) folgt
z − x = (z − y) + (y − x) ∈ P ∪ {0}, also x ≤ z.
(viii): Aus x , 0 folgt x ∈ P ∪ −P. Ist x ∈ P, so folgt wegen (P3), dass x2 = xx ∈ P
und damit x2 > 0. Ist x ∈ −P, so folgt −x ∈ P und wieder wegen (P3), dass x2 = xx =
(−x)(−x) ∈ P.
1 Der
Punkt über ∪ soll die Disjunktheit der Mengen anzeigen.
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
13
(xii): Aus x < y und (v) folgt x + x < x + y < y + y. Nun ist wegen dem Distributivgesetz
x + x = x(1 + 1) und y + y = y(1 + 1). Da wegen (P2), 1 + 1 ∈ P, folgt aus (vii), dass
x < x+y
2 < y.
❑
2.2.3 Bemerkung. Die Eigenschaften (i)−(iii) besagen genau, dass ≤ eine Halbordnung
auf K ist. Eigenschaft (iv) bedeutet dann, dass diese Halbordnung sogar eine Totalordnung ist.
Man kann also einen angeordneten Körper als Gerade veranschaulichen, wobei eine
Zahl x genau dann links von einer anderen Zahl y liegt, wenn sie kleiner ist:
0
x
K
y
Abbildung 2.1: Zahlengerade
2.2.4 Definition. Sei K eine Menge und ≤ eine Totalordnung darauf.
Sind x, y ∈ K, so sei max(x, y) das Maximum von x und y. Also max(x, y) = x,
falls x ≥ y, und max(x, y) = y falls y ≥ x. Entsprechend definiert man das
Minimum min(x, y) zweier Zahlen.
Ist A ⊆ K, und gibt es ein a0 ∈ A, sodass a ≤ a0 (a0 ≤ a) für alle a ∈ A, so nennt
man a0 das Maximum (Minimum) von A, und schreibt a0 = max A (a0 = min A).
Zum Maximum (Minimum) sagt man auch größtes (kleinstes) Element.
Ist A ⊆ K, so heißt A nach oben beschränkt, falls es ein x ∈ K gibt, sodass
A ≤ x, sodass also a ≤ x für alle a ∈ A. Jedes x ∈ K mit A ≤ x heißt dabei obere
Schranke von A. Entsprechend heißt eine Teilmenge A nach unten beschränkt,
wenn es eine untere Schranke in K hat, wenn also x ≤ A für ein x ∈ K. Eine nach
oben und nach unten beschränkte Teilmenge heißt beschränkt.
Sei A ⊆ K eine nach oben (unten) beschränkte Teilmenge. Hat die Menge {x ∈
K : A ≤ x} ({x ∈ K : x ≤ A}) aller oberen (unteren) Schranken von A ein
Minimum (Maximum), so heißt dieses Supremum (Infimum) von A und wird mit
sup A (inf A) bezeichnet.
Die Tatsache, dass eine Menge A ⊆ K nicht nach oben (nicht unten) beschränkt
ist wollen wir mit sup A = +∞ (inf A = −∞) zum Ausdruck bringen.
obere Schranken von M
M
sup M
Abbildung 2.2: Supremum der Menge M
KAPITEL 2. DIE REELLEN ZAHLEN
14
2.2.5 Bemerkung. Man sieht leicht, dass jedes Maximum (Minimum) einer Teilmenge
auch Supremum (Infimum) dieser Teilmenge ist. Die Umkehrung gilt im Allgemeinen
nicht.
Es kann auch vorkommen, dass eine beschränkte Teilmenge von K weder ein Supremum, noch ein Infimum hat.
2.2.6 Bemerkung. Wenn das Supremum einer Teilmenge A existiert, so gilt gemäß der
Definition A ≤ sup A, und sup A ≤ x für alle oberen Schranken x von A.
Ist umgekehrt y ∈ K mit A ≤ y und y ≤ x für alle oberen Schranken x von A,
so folgt aus A ≤ y, dass y eine obere Schranke von A ist, und aus der zweiten Voraussetzung, dass y das Minimum der oberen Schranken von A ist. Also ist y = sup A.
Entsprechendes lässt sich für das Infimum sagen.
2.2.7 Lemma. Ist A ⊆ B ⊆ K, so gilt
(i) {x ∈ K : A ≤ x} ⊇ {x ∈ K : B ≤ x} und {x ∈ K : x ≤ A} ⊇ {x ∈ K : x ≤ B}.
(ii) Haben A und B ein Maximum (Minimum), so folgt max A ≤ max B
(min A ≥ min B).
(iii) Haben A und B ein Supremum (Infimum), so folgt sup A ≤ sup B (inf A ≥ inf B).
Beweis.
(i) t ∈ {x ∈ K : B ≤ x} bedingt b ≤ t für alle b ∈ B. Wegen A ⊆ B gilt auch a ≤ t für
alle a ∈ A, und daher t ∈ {x ∈ K : A ≤ x}. Die zweite Mengeninklusion beweist
man genauso.
(ii) Das Maximum von B erfüllt definitionsgemäß max B ≥ b für alle b ∈ B, und damit insbesondere max B ≥ a für alle a ∈ A. Wegen max A ∈ A folgt insbesondere
max B ≥ max A. Analog zeigt man min A ≥ min B.
(iii) Definitionsgemäß haben wir sup A = min{x ∈ K : A ≤ x} und
sup B = min{x ∈ K : B ≤ x}. Nach (i) ist {x ∈ K : B ≤ x} ⊆ {x ∈ K : A ≤ x} und
daher nach (ii)
sup A = min{x ∈ K : A ≤ x} ≤ min{x ∈ K : B ≤ x} = sup B.
❑
Ist K ein angeordneter Körper, so gelten für die oben eingeführten Begriffe einfache
Rechenregeln:
(i) Aus x ≤ A ⇔ −x ≥ −A folgt, dass A ⊆ K genau dann nach oben (unten)
beschränkt ist, wenn −A nach unten (oben) beschränkt ist.
(ii) min(−A) = − max A, max(−A) = − min A,
(iii) inf(−A) = − sup(A), sup(−A) = − inf(A).
Diese Gleichheiten gelten in dem Sinn, dass die linke Seite des Gleichheitszeichen
genau dann existiert, wenn die rechte existiert.
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
15
2.2.8 Beispiel. Seien a, b ∈ K. Dann definiert man die Intervalle
(a, b) := {x ∈ K : a < x < b}, (a, b] := {x ∈ K : a < x ≤ b},
und entsprechend
[a, b] := {x ∈ K : a ≤ x ≤ b}, [a, b) := {x ∈ K : a ≤ x < b}.
Außerdem setzt man (+∞, −∞ sind hier nur formale Ausdrücke)
(−∞, b) := {x ∈ K : x < b}, (−∞, b] := {x ∈ K : x ≤ b},
(a, +∞) := {x ∈ K : a < x}, [a, +∞) := {x ∈ K : a ≤ x}.
Ist a < b, so sind die Mengen (a, b), [a, b], (a, +∞) z.B. nach unten beschränkt.
Nach oben beschränkt sind dagegen nur die ersten beiden. Die Mengen (a, b), (a, b]
haben das Supremum b, aber nur für die Menge (a, b] ist b ein Maximum.
Um etwa einzusehen, dass b = sup(a, b) argumentiert man folgendermaßen:
Zunächst ist wegen der Definition von Intervallen x ≤ b für alle x ∈ (a, b), also
(a, b) ≤ b.
Angenommen es gäbe eine obere Schranke y von (a, b) mit y < b. Im Falle y ≤ a
wäre y ≤ a < a+b
2 < b (vgl. Lemma 2.2.2, (xii)), womit aber y keine obere Schranke
sein kann, da a+b
2 ∈ (a, b).
Im Falle a < y wäre a < y < y+b
2 < b, womit wiederum y keine obere Schranke sein
∈
(a,
b).
kann, da y+b
2
Also ist b tatsächlich die kleinste obere Schranke von (a, b), sup(a, b) = b.
2.2.9 Beispiel. Dem Begriff der rationalen Zahlen vorgreifend seien K die rationalen
Zahlen und sei
M = {x ∈ K : x2 < 2}.
Dann hat diese Menge weder Maximum noch Supremum, obwohl sie nach oben beschränkt ist. Siehe dazu Satz 2.7.5.
Wir wollen noch zwei elementare Funktionen auf einem angeordneten Körper betrachten:
2.2.10 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Die Signumfunktion sgn
sei jene Funktion von K nach K, sodass für x ∈ K


1



0
sgn(x) = 


 −1
,
,
,
x∈P
x=0 .
x ∈ −P
Für x , 0 heißt sgn(x) auch das Vorzeichen von x.
Die Betragsfunktion |.| : K → K ist definiert durch
(
x , x ∈ P ∪ {0}
|x| =
.
−x , x ∈ −P
Sind x, y ∈ K, so bezeichnet man |x − y| auch als den Abstand von x und y.
2.2.11 Lemma. Für x, y ∈ K gilt:
KAPITEL 2. DIE REELLEN ZAHLEN
16
(i) |x| = sgn(x)x.
(ii) |xy| = |x||y|.
(iii) |x + y| ≤ |x| + |y| (Dreiecksungleichung).
(iv) |x + y| ≥ ||x| − |y|| (Dreiecksungleichung nach unten).
(v) max(x, y) =
x+y+|x−y|
,
2
min(x, y) =
x+y−|x−y|
.
2
Beweis. (i) und (ii) folgen ganz leicht, wenn wir die Fälle x > 0, x = 0, x < 0 unterscheiden.
Die Dreiecksungleichung folgt unmittelbar, wenn eine der Zahlen x oder y Null ist.
Sonst unterscheiden wir folgende zwei Fälle:
sgn(x) = sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| + |y|)| = |x| + |y|
sgn(x) = − sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| − |y|)| = ||x| − |y|| ≤ |x| + |y|
Letztere Ungleichung gilt, da sowohl |x| − |y| ≤ |x| + |y|, als auch −(|x| − |y|) = |y| − |x| ≤
|x| + |y|.
Um die Dreiecksungleichung nach unten einzusehen, bemerke
|x| = |(x + y) + (−y)| ≤ |x + y| + |y|,
(2.1)
also |x| − |y| ≤ |x + y|. Analog folgt
|y| ≤ |x + y| + |x|,
also auch |y| − |x| ≤ |x + y|.
Mit einer ähnlichen Fallunterscheidung beweist man die Aussage (v).
❑
2.3 Die natürlichen Zahlen
Von den bisher vorgestellten Objekten (Körper, angeordneter Körper) ist noch nicht
bekannt, ob es sie überhaupt gibt. Um solche Objekte zu konstruieren, wenden wir uns
zunächst den natürlichen Zahlen zu.
Die natürlichen Zahlen sind uns als Objekt des Alltages wohlvertraut, aber ihre
Existenz als mathematisches Objekt ist keine Trivialität. Trotzdem wollen wir diese
voraussetzen. In der Tat folgt sie aus den Axiomen der Mengenlehre.
2.3.1 Definition. Die natürlichen Zahlen sind eine Menge N, in der ein Element 1 ∈
N ausgezeichnet ist,2 und auf der eine Funktion (Nachfolgerabbildung) ′ : N → N
definiert ist, sodass gilt
(S1)
′
ist injektiv.
(S2) Es gibt kein n ∈ N mit n′ = 1.
(S3) Ist M ⊆ N, 1 ∈ M und m′ ∈ M für alle m ∈ M, so ist M = N.
2 Die Bezeichnung 1 hat zumindest zum gegenwärtigen Zeitpunkt nichts mit der gleichlautenden Bezeichnung für das multiplikative neutrale Element in einem Körper zu tun.
2.3. DIE NATÜRLICHEN ZAHLEN
17
Für n′ wollen wir auch n + 1 schreiben.
2.3.2 Bemerkung. Wir wollen anmerken, dass wir weder die Abbildungen +, ·, die
N × N nach N abbilden, noch die Möglichkeit zwei natürliche Zahlen der Größe nach
zu ordnen, zur Verfügung haben. Obige Festlegung, dass n′ = n + 1 ist nur symbolisch
zu verstehen.
Ehe wir uns an die Definition von Addition und Multiplikation machen, wollen wir
P
uns die Möglichkeit schaffen, Ausdrücke, wie nx, xn , nk=1 c(k) für n ∈ N zu definieren,
wenn z.B. x und c(k) für k ∈ N Elemente eines Körpers sind.
Alle diese Ausdrücke haben gemein, dass sie Funktionen n 7→ φ(n) auf N sind,
wobei φ(1) bekannt ist, und wobei φ(n′ ) bekannt ist, wenn φ(n) es ist. Im Falle von
′
n 7→ xn ist etwa x1 = x und xn = xn · x.
Um einzusehen, warum solche Funktionen eindeutig definiert sind, zeigen wir folgenden Satz:
2.3.3 Satz (Rekursionssatz). Sei A eine Menge, a ∈ A, g : A → A (Rekursionsfunktion).
Dann existiert genau eine Abbildung φ : N → A mit φ(1) = a und φ(n′ ) = g(φ(n)).
Beweis. Betrachte alle Teilmengen H ⊆ N × A mit den Eigenschaften
(i) (1, a) ∈ H
(ii) Ist (n, b) ∈ H, so gilt auch (n′ , g(b)) ∈ H.
Solche Teilmengen existieren, da z.B. N × A die Eigenschaften (i) und (ii). Sei D der
Durchschnitt aller solchen Teilmengen:
\
D :=
H
H erfüllt (i) und (ii)
Da (1, a) ∈ H für alle H, die (i) und (ii) erfüllen, ist auch (1, a) ∈ D. Ist (n, b) ∈ D, so
gilt (n, b) ∈ H für alle (i) und (ii) erfüllenden H. Nach (ii) folgt (n′ , g(b)) ∈ H für alle
solchen H, und somit (n′ , g(b)) ∈ D.
Somit hat D auch die Eigenschaften (i) und (ii), und ist damit die kleinste Teilmenge
mit diesen Eigenschaften.
Wir behaupten, dass D eine Funktion von N nach A ist, also, dass es zu jedem n ∈ N
genau ein b ∈ A gibt, sodass (n, b) ∈ D. Dazu sei3
M = {n ∈ N : ∃! b ∈ A, (n, b) ∈ D}.
Nun ist 1 ∈ M, da einerseits (1, a) ∈ D. Gäbe es andererseits ein weiteres c ∈ A, c , a
mit (1, c) ∈ D, so betrachte D \ {(1, c)}. Klarerweise hat D \ {(1, c)} die Eigenschaft (i).
Wegen (S 2) bleibt auch die Eigenschaft (ii) erhalten. Ein Widerspruch dazu, dass D
kleinstmöglich ist.
Ist nun n ∈ M, so gibt es genau ein b ∈ A mit (n, b) ∈ D. Also ist auch (n′ , g(b)) ∈ D.
Wäre noch (n′ , c) ∈ D mit c , g(b), so kann man wieder D \ {(n′ , c)} betrachten. Weil
n′ , 1, erfüllt D \ {(n′ , c)} Eigenschaft (i).
Aus (k, d) ∈ D \ {(n′ , c)} ⊆ D folgt (k′ , g(d)) ∈ D. Ist k , n, so folgt wegen (S 1)
daher auch (k′ , g(d)) , (n′ , c). Ist n = k, so muss wegen n ∈ M die Gleichheit d = b
gelten. Es folgt (k′ , g(d)) = (n′ , g(b)) , (n′ , c). In jedem Fall gilt also (k′ , g(d)) ∈
3 ∃!
steht für: Es gibt genau ein
KAPITEL 2. DIE REELLEN ZAHLEN
18
D \ {(n′ , c)}, und D \ {(n′ , c)} erfüllt auch (ii). In analoger Weise wie oben erhalten wir
einen Widerspruch.
Man kann also D auffassen als Abbildung φ : N → A. Die Eigenschaft (i) bedeutet
φ(1) = a, (ii) besagt φ(n′ ) = g(φ(n)).
Wäre φ̃ eine weitere Funktion mit φ̃(1) = a und mit φ̃(n′ ) = g(φ̃(n)), und betrachtet
man φ̃ als Teilmenge D̃ von N × A, so erfüllt D̃ Eigenschaften (i), (ii). Weil wir schon
wissen, dass D die kleinste solche Menge ist, folgt D ⊆ D̃. Da aber beide Funktionen
sind, muss D = D̃ bzw. φ = φ̃.
❑
2.3.4 Bemerkung. Satz 2.3.3 rechtfertigt rekursive Definitionen:
Zum Beispiel die Funktion n 7→ xn , wobei x in einem Körper K liegt. Dafür
nehmen wir A = K, a = x und g : K → K, y 7→ yx. Nach Satz 2.3.3 ist dann xn
für alle n ∈ N eindeutig definiert.
Genauso kann man n 7→ nx definieren.
Q
Um n 7→ nk=1 c(k) zu definieren, wenn c : N → K ist, wenden wir Satz 2.3.3
mit A = N × K, a = (1, c(1)) und g : N × K → N × K, (n, x) 7→ (n′ , x · c(n′ )) an,
Q
und definieren nk=1 c(k) als die zweite Komponente von φ(n).
P
Genauso kann man n 7→ nk=1 c(k), n 7→ maxnk=1 c(k) und ähnliche Ausdrücke
definieren.
Für
n
P
k=1
c(k) schreiben wir auch c(1) + · · · + c(n). Entsprechend setzen wir
c(1) · · · · · c(n) :=
n
Y
k=1
n
c(k) und max c(k) = max(c(1), . . . , c(n)).
k=1
Als weitere Anwendung des Rekursionssatzes erhalten wir, dass die natürlichen
Zahlen im Wesentlichen eindeutig sind.
2.3.5 Korollar (Eindeutigkeitssatz). Seien N und Ñ Mengen mit ausgezeichneten Elementen 1 ∈ N und 1̃ ∈ Ñ und Abbildungen ′ : N → N, ˜ : Ñ → Ñ, sodass für beide
die Axiome (S1), (S2) und (S3) gelten. Dann gibt es eine eindeutige bijektive Abbildung
g = ϕ(n′ ), n ∈ N.
ϕ : N → Ñ mit ϕ(1) = 1̃ und ϕ(n)
Beweis. Wendet man den Rekursionssatz an auf A = Ñ, a = 1̃, und g = ˜, so folgt, dass
g = ϕ(n′ ), n ∈ N.
genau eine Abbildung ϕ : N → Ñ existiert mit ϕ(1) = 1̃ und ϕ(n)
Durch Vertauschung der Rollen von N und Ñ erhält man eine Abbildung ψ : Ñ → N
mit ψ(1̃) = 1 und ψ(x)′ = ψ( x̃), x ∈ Ñ.
Betrachte die Abbildung Φ = ψ ◦ ϕ : N → N. Es gilt Φ(1) = 1 und
g = (ψ ◦ ϕ)(n′ ).
Φ(n)′ = (ψ(ϕ(n)))′ = ψ(ϕ(n))
Die identische Abbildung idN hat die selben Eigenschaften, also folgt nach der
Eindeutigkeitsaussage des Rekursionssatzes Φ = idN . Analog zeigt man ϕ ◦ ψ = idÑ ,
also ist ϕ bijektiv und es gilt ϕ−1 = ψ.
❑
2.3. DIE NATÜRLICHEN ZAHLEN
19
Wenn wir uns den Beweis des Rekursionssatzes nochmals anschauen, so haben wir
gezeigt, dass D eine Funktion auf N ist, es also zu jedem n ∈ N genau ein b ∈ A gibt
mit (n, b) ∈ D, indem wir die Menge M aller in diesem Sinne guten“n ∈ N hernehmen
”
und davon zeigen, dass sie die Voraussetzungen von (S 3) erfüllen.
Diese Vorgangsweise kann man auf alle Aussagen A(n) ausdehnen, die für alle
natürliche Zahlen n gelten sollen. Das führt zum so genannten:
Prinzip der vollständigen Induktion: Für jedes n ∈ N sei A(n) eine Aussage über die
natürliche Zahl n. Gilt
(i) Induktionsanfang: Die Aussage A(1) ist wahr.
(ii) Induktionsschritt: Für jedes n ∈ N ist wahr, dass aus der Gültigkeit von A(n) die
Gültigkeit von A(n′ ) folgt.
Dann ist die Aussage A(n) für jede natürliche Zahl n richtig.
Um das einzusehen, betrachte man die Menge M aller n ∈ N, für die A(n) richtig
ist. Ist nun A(1) richtig, so ist 1 ∈ M, und aus A(n) ⇒ A(n′ ) sehen wir, dass mit m ∈ M
auch m′ ∈ M. Nach Axiom (S 3) ist M = N. Also ist A(n) für jede natürliche Zahl n
richtig.
Als Anwendung der Beweismethode der vollständigen Induktion bringen wir die
später verwendete Bernoullische Ungleichung.
2.3.6 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, und bezeichnen wir das multiplikative neutrale Element mit 1K , so folgt für x ∈ K, x ≥ −1K , und n ∈ N, dass
(1K + x)n ≥ 1K + nx .
Beweis. Induktionsanfang: Ist n = 1, so besagt die Bernoullische Ungleichung (1K +
x)n = 1K + x ≥ 1K + x, was offenbar stimmt.
Induktionsschritt: Angenommen sie sei nun für n ∈ N richtig. Dann folgt wegen 1K +
x ≥ 0, dass
′
(1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 ≥ 1K + n′ x .
❑
Eine andere unmittelbare Anwendung des Beweisprinzipes der vollständigen InP
duktion ist die Verifikation der offensichtlich für Ausdrücke wie nk=1 c(k) geltenden
Rechenregeln. Zum Beispiel das Distributivgesetz
a
n
X
k=1
c(k) =
n
X
(ac(k)).
k=1
P
P
Induktionsanfang: Ist n = 1, so gilt a 1k=1 c(k) = ac(1) = 1k=1 (ac(k)).
Induktionsschritt: Angenommen die Rechenregel gilt für n, so rechnen wir:
a
n′
X
k=1

 n

 n

X

X
′



c(k) = a( c(k) + c(n )) = a  c(k) + ac(n′ ) =
k=1
k=1
KAPITEL 2. DIE REELLEN ZAHLEN
20
n
X
(ac(k)) + ac(n′ ) =
k=1
n′
X
(ac(k)).
k=1
Entsprechend zeigt man auch andere Rechenregeln für solche induktiv definierten Ausdrücke.
Wir kommen nun zur Diskussion der algebraischen Operationen Addition und Multiplikation, sowie der Ordnungsrelation auf N. Ihre Existenz und ihre Eigenschaften
müssen wir nun mit mathematischer Strenge herleiten, d.h. sie alleine aus den Axiomen
(S 1),(S 2),(S 3) mittels logischer Schlüsse zeigen. Hauptinstrument dabei wird wieder
der Rekursionssatz Satz 2.3.3 sein.
2.3.7 Definition. Wir definieren für jedes m ∈ N Abbildungen +m : N → N und
·m : N → N rekursiv:
+m (1) := m′ und +m (n′ ) = (+m (n))′ ,
·m (1) := m und ·m (n′ ) = +m (·m (n)).
Weiters definieren wir Relationen < und ≤ auf N durch
n < m : ⇐⇒ (∃t ∈ N : +t (n) = m),
n ≤ m : ⇐⇒ (n = m) oder (n < m).
Sind m, n ∈ N, so schreibt man
+m (n) =: m + n, ·m (n) =: m · n,
und spricht von der Addition bzw. Multiplikation auf N.
2.3.8 Satz.
Für jedes m ∈ N sind die Abbildungen +m und ·m injektiv, wobei +m (n) , m für
alle n ∈ N.
Die Addition im Bereich N der natürlichen Zahlen erfüllt die Gesetze
Für alle a, b, c ∈ N gilt (a + b) + c = a + (b + c). (Assoziativität)
Für alle a, b ∈ N gilt a + b = b + a. (Kommutativität)
sowie die Kürzungsregel
Sind n, m, k ∈ N und gilt k + m = k + n, so folgt m = n.
Die Multiplikation ist ebenfalls assoziativ, kommutativ und erfüllt die Kürzungsregel. Zusätzlich gilt noch
Für jedes a ∈ N ist a · 1 = 1 · a = a. (Existenz des neutralen Elementes)
Die Addition hängt mit der Multiplikation zusammen über das Distributivgesetz
Für a, b, c ∈ N gilt stets (b + c) · a = (b · a) + (c · a).
Die Relation ≤ ist eine Totalordnung mit 1 als kleinstes Element, und es gilt
m < n ⇐⇒ m ≤ n und m , n. Zudem gelten folgende Verträglichkeiten mit
den Operationen + und ·:
2.3. DIE NATÜRLICHEN ZAHLEN
21
Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a + c < b + c (a + c ≤ b + c).
Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a · c < b · c (a · c ≤ b · c).
Es gilt weiters
Sind n, m, l ∈ N mit n + l < m + l (n + l ≤ m + l) oder n · l < m · l (n · l ≤ m · l),
so folgt n < m (n ≤ m).
Sind n, m ∈ N, n < m, so gibt es ein eindeutiges t ∈ N, sodass m = n + t.
Wir setzen in diesem Falle
m − n := t.
(2.2)
Sind m, n, t ∈ N, t < n < m, so folgt n − t < m − t.
Sind l, m, n ∈ N, n + m < l, so folgt n < l − m und
l − (m + n) = (l − m) − n.
(2.3)
Beweis.
Zur Assoziativität von +:
Seien k, m ∈ N fest gewählt, wir führen Induktion nach n durch.
Induktionsanfang: (k + m) + 1 = +k (m)′ = +k (m′ ) = k + (m + 1).
Induktionsschritt: Nach Induktionsvoraussetzung gilt (k + m) + n = k + (m + n).
Es folgt
(k + m) + (n′ ) = +k+m (n′ ) = +k+m (n)′ = ((k + m) + n)′ =
= (k + (m + n))′ = +k (m + n)′ = +k ((m + n)′ ) = k + (m + n′ ),
wobei letztere Gleichheit wegen des schon gezeigten Induktionsanfangs folgt.
Zur Kommutativität von +:
Wir zeigen ∀m, n ∈ N : m + n = n + m mittels Induktion nach m.
Induktionsanfang (m = 1): Wir zeigen ∀n ∈ N : 1 + n = n + 1 mittels Induktion
nach n. Der Fall n = 1 ist klar, denn 1 + 1 = 1 + 1. Für den Induktionsschritt
n → n′ gehen wir aus von der Induktionsvoraussetzung 1 + n = n + 1. Daraus
folgt
n′ + 1 = n′′ = (n + 1)′ = (1 + n)′ = 1 + n′ .
Induktionsschritt (m → m′ ): Wir zeigen
(∀n ∈ N : m + n = n + m) =⇒ (∀n ∈ N : m′ + n = n + m′ ).
Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1.
Nach der bereits bewiesenen Aussage (Induktionsanfang (m = 1)) ∀l ∈ N :
1 + l = l + 1, gilt m′ + 1 = 1 + m′ .
Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ + n =
n + m′ und wir erhalten
∗
m′ + n′ = (m′ + n)′ = (n + m′ )′ = (n + m)′′ = (m + n)′′ =
∗
= (m + n′ )′ = (n′ + m)′ = n′ + m′ .
An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m 7→ m′ ) benützt worden.
KAPITEL 2. DIE REELLEN ZAHLEN
22
Zur Injektivität von +m und der Tatsache, dass +m (n) , m, für alle n ∈ N:
Für m = 1 ist +m (n) = n′ . Nach (S 1) ist +1 injektiv und nach (S 2) gilt +1 (n) , 1.
Sei nun m ∈ N und +m injektiv und erfülle +m (n) , m für alle n ∈ N.
Es folgt +m′ (n) = m′ + n = m + (n + 1) = +m (n′ ). Also ist +m′ die Zusammensetzung der injektiven Abbildungen (n 7→ n′ ) und +m und somit selbst injektiv.
Aus m + 1 = m′ = +m′ (n) = (m + n) + 1 folgt wegen der Injektivität von +1 , dass
m = m + n = +m (n) im Widerspruch zur Induktionsvoraussetzung.
Die Kürzungsregeln für + folgt sofort aus der Injektivität von +k .
Es gilt a · 1 = 1 · a = a, a ∈ N:
Unmittelbar aus der Definition 2.3.7 folgt a · 1 = ·a (1) = a. Die zweite Gleichheit
zeigen wir mittels Induktion nach a:
Induktionsanfang (a = 1): 1 · a = 1 · 1 = 1 = a.
Induktionsschritt (a → a′ ): Wir nehmen also 1 · a = a an und schließen
1 · (a′ ) = ·1 (a′ ) = +1 (·1 (a)) = +1 (1 · a) = 1 + a = a′ .
Zur Kommutativität von ·:
Wir zeigen ∀m, n ∈ N : m · n = n · m mittels Induktion nach m.
Induktionsanfang (m = 1): Nach dem letzten Punkt gilt ∀n ∈ N : 1 · n = n = n · 1.
Induktionsschritt (m → m′ ): Wir zeigen
(∀n ∈ N : m · n = n · m) =⇒ (∀n ∈ N : m′ · n = n · m′ ).
Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1.
Wieder nach dem letzten Punkt gilt (m′ ) · 1 = m′ = 1 · m′ .
Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ · n = n · m′
und wir erhalten
m′ · n′ = m′ + (m′ · n) = m′ + (n · m′ ) = (m + 1) + (n + (n · m)) =
∗
(n + 1) + (m + (n · m)) = (n + 1) + (m + (m · n)) =
∗
n′ + (m · n′ ) = n′ + (n′ · m) = n′ · m′ .
An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m 7→ m′ ) benützt worden.
Zum Distributivgesetz:
Vollständige Induktion nach a:
Induktionsanfang (a = 1): Da 1 bezüglich · ein neutrales Element ist, folgt
(b + c) · 1 = b + c = (b · 1) + (c · 1).
Induktionsschritt:
∗
(b + c) · (a + 1) = (b + c) + ((b + c) · a) = (b + c) + ((b · a) + (c · a)) =
(b + (b · a)) + (c + (c · a)) = (b · (a + 1)) + (c · (a + 1)).
An der mit ∗ gekennzeichneten Stelle ist die Induktionsvoraussetzung eingegangen.
2.3. DIE NATÜRLICHEN ZAHLEN
23
Zur Assoziativität von ·:
Wir zeigen a · (b · c) = (a · b) · c mittels Induktion nach b.
Induktionsanfang: a · (1 · c) = a · c = (a · 1) · c.
Induktionsschritt: Nach Induktionsvoraussetzung gilt also (a · b) · c = a · (b · c).
Mittels Distributivgesetz folgt
(a · (b + 1)) · c = ((a · b) + (a · 1)) · c = ((a · b) · c) + ((a · 1) · c) =
(a · (b · c)) + (a · (1 · c)) = a · ((b · c) + (1 · c)) = a · ((b + 1) · c).
Zur Totalität von ≤ und zur Tatsache 1 ≤ n, n ∈ N:
Wir wollen zeigen, dass je zwei n, m ∈ N bezüglich ≤ vergleichbar sind, was wir
mittels Induktion nach m beweisen werden.
Für m = 1 zeigt man, leicht mittels Induktion nach n, dass immer n = 1, oder
∃t ∈ N, n = 1 + t, also immer 1 ≤ n.
Gelte die Vergleichbarkeit von m mit allen n ∈ N. Um sie für m′ zu zeigen,
machen wir eine Fallunterscheidung: Ist m = n, so folgt n + 1 = m′ also n ≤ m′ .
Aus n < m folgt m = n + t für ein t ∈ N, und daher m′ = n + (t + 1), also n < m′ .
Ist n = m + 1, so folgt m′ = n.
Ist schließlich m < n, n , m + 1, so gilt n = m + t mit t , 1. Aus der schon
bewiesenen Vergleichbarkeit mit 1 folgt, dass 1 < t, und somit t = 1 + s, s ∈ N.
Aus der Assoziativität folgt n = m′ + s, also m′ < n.
Die Reflexivität von ≤ ist klar.
m < n ⇐⇒ ( m ≤ n und m , n ), folgt unmittelbar aus der Definition und
der Tatsache, dass aus m < n, dh. n = m + k mit einem k ∈ N, aus m = n der
Widerspruch m = m + k = +m (k) folgt.
Zur Transitivität von < und damit ≤:
Sei k, l, m ∈ N und k ≤ l, l ≤ m. Ist k = l oder l = m, so sieht man sofort, dass
k ≤ m.
Im Fall k < l, l < m gibt es i, j ∈ N mit k + i = l, l + j = m. Es folgt k + (i + j) = m
und daher k < m.
Die Antisymmetrie von ≤ folgt, da aus n ≤ m und m ≤ n im Falle m , n wegen
dem vorletzten Punkt und wegen der Transitivität von < folgt, dass n < n, was
dem vorletzten Punkt widersprucht.
Zur Verträglichkeit von < mit + und ·:
Sei n < m und k ∈ N. Somit ist n + t = m mit t ∈ N, und es gilt
m + k = (n + t) + k = n + (t + k) = n + (k + t) = (n + k) + t,
sowie
m · k = (n + t) · k = (n · k) + (t · k).
Also folgt n + k < m + k und n · k < m · k.
KAPITEL 2. DIE REELLEN ZAHLEN
24
Die Injektivität von ·k bzw. - was das selbe ist - die Kürzungsregel für · folgt nun
aus den gezeigten Eigenschaften von ≤:
Seien k, m, n ∈ N mit m , n. Wegen der Totalität gilt m < n oder n < m, was mit
der Verträglichkeit von < mit · bedingt, dass k · m < k · n oder k · n < k · m und
somit k · m , k · n.
Zum Kürzen in Ungleichungen:
Aus n + l < m + l folgt definitionsgemäß m + l = (n + l) + k für ein k ∈ N. Gemäß
der Kürzungsregel für + folgt m = n + k und somit n < m.
Sei nun n ·l < m·l. Wäre m ≤ n, so folgte aus dem letzten Punkt der Widerspruch
m · l ≤ n · l. Wegen der Totalität muss n < m.
Zur Wohldefiniertheit von m − n:
Sei also n < m. Definitionsgemäß ist m = n + t für ein t ∈ N. Ist nun m = n + s für
eine weitere Zahl s ∈ N, so folgt aus der Kürzungsregel für + und n + t = n + s,
dass s = t. Also ist die m − n := t eindeutig dadurch definiert, dass n + t = m.
Zur Verträglichkeit von < mit −:
Ist t < n < m, so folgt n = t + s und m = n + l für s, l ∈ N, und weiters
m = t + (l + s). Somit ist m − t = l + s und n − t = s, und daher n − t < m − t.
Zu (2.3):
Die Ungleichung m + n < l bedeutet l = (m + n) + k für ein eindeutiges k ∈ N.
Definitionsgemäß ist daher k = l − (m + n). Andererseits gilt wegen m < m + n < l
auch l = m + s, s ∈ N.
Wegen der Kürzungsregel für + folgt s = n + k, und somit n < s = l − m.
Außerdem ist k = s − n = (l − m) − n.
❑
2.3.9 Bemerkung. Ist Ñ eine Kopie von N wie in Korollar 2.3.5, und werden die Operationen + und ·, sowie ≤ auf Ñ genauso definiert wie auf N, so sieht man leicht, dass
die nach Korollar 2.3.5 existierende Abbildung ϕ : N → Ñ mit den Operationen und ≤
verträglich ist:
ϕ(n + m) = ϕ(n) + ϕ(m), ϕ(n · m) = ϕ(n) · ϕ(m),
n ≤ m ⇔ ϕ(n) ≤ ϕ(m).
Folgende Eigenschaft der natürlichen Zahlen werden wir oft verwenden.
2.3.10 Satz. Ist ∅ , T ⊆ N, so hat T ein Minimum.
Beweis. Wir nehmen das Gegenteil an. Sei
M = {n ∈ N : ∀m ∈ T : n < m}.
Es ist nun 1 ∈ M, da ja sonst 1 das Minimum von T wäre.
Ist n ∈ M, und m ∈ T , so gilt n < m. Daraus schließen wir n + 1 ≤ m.
Wäre n + 1 = m0 für ein m0 ∈ T , so hätte T das Minimum m0 . Wir nehmen aber an,
dass es ein solches nicht gibt.
2.3. DIE NATÜRLICHEN ZAHLEN
25
Also gilt immer n + 1 < m, m ∈ T , bzw. n + 1 ∈ M. Somit folgt M = N. Ist
m ∈ T ⊆ N, so folgt m ∈ M und daher der Widerspruch m < m.
❑
Diese Eigenschaft der natürlichen Zahlen können wir hernehmen, um folgende Varianten des Prinzips der vollständigen Induktion zu rechtfertigen. Zum Beispiel ist es
oft bequemer die folgende Version zu benützen:
2.3.11 Bemerkung. Sei A(n), n ∈ N, eine Aussage über die natürliche Zahl n. Gilt
(i) Die Aussage A(1) ist wahr.
(ii) Es gelte für jedes n ∈ N, n > 1: Ist die Aussage A(m) wahr für alle m < n, so ist
auch A(n) wahr.
Dann ist die Aussage A(n) für alle n ∈ N wahr. Denn wäre die Menge der n ∈ N, für die
A(n) falsch ist, nicht leer, so hätte sie ein Minimum n. Wegen (i) ist aber n > 1, wegen
(ii) ist A(n) wahr, was offensichtlich ein Widerspruch ist.
Oft ist eine Aussage auch erst ab einer gewissen Zahl n0 richtig.
2.3.12 Bemerkung. Gilt
(i) Die Aussage A(n0 ) ist wahr.
(ii) Ist A(n) wahr für ein n ≥ n0 , dann ist A(n + 1) wahr.
oder gilt
(i) Die Aussage A(n0 ) ist wahr.
(ii) Ist n > n0 und ist A(m) wahr für alle m mit n0 ≤ m < n, dann ist A(n) wahr.
Dann ist die Aussage A(n) für alle n ≥ n0 richtig.
2.3.13 Bemerkung. Mit fast dem selben Beweis wie in Lemma 2.3.6 jedoch mit einer
Induktion bei 2 startend zeigt man, dass für x ≥ −1K und x , 0 sowie n ≥ 2 sogar
(1K + x)n > 1K + nx .
Induktionsanfang: Ist n = 2, so gilt wegen x2 > 0, dass (1K + x)2 = 1K + 2x + x2 > 1K + 2x.
Induktionsschritt: Angenommen die Ungleichung ist für n ∈ N richtig. Dann folgt wegen 1K + x ≥ 0 und nx2 > 0, dass
′
(1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 > 1K + n′ x .
Klarerweise haben unendliche Teilmengen von N kein Maximum. Aber wie intuitiv
klar ist, hat jede endliche Teilmenge einer total geordneten Menge ein Maximum und
ein Minimum. Um das exakt nachzuweisen, benötigen wir die genaue Definition von
Endlichkeit.
2.3.14 Definition. Eine nichtleere Menge M heißt endlich, wenn es ein k ∈ N und eine
bijektive Funktion f : {n ∈ N : n ≤ k} → M gibt. Die Zahl k ist dann die Mächtigkeit
von M 4 . Man sagt auch, dass M genau k Elemente hat. Die leere Menge nennen wir
auch endlich, und ihre Mächtigkeit sei Null.
2.3.15 Bemerkung. Man zeigt elementar durch vollständige Induktion nach der
Mächtigkeit der endlichen Menge M, dass alle ihre Teilmengen auch endlich sind.
4 Damit die Mächtigkeit wohldefiniert ist, muss man noch zeigen, dass es im Fall k , k keine bijektive
1
2
Funktion von {n ∈ N : n ≤ k1 } auf {n ∈ N : n ≤ k2 } gibt.
KAPITEL 2. DIE REELLEN ZAHLEN
26
Mit vollständiger Induktion nach der Mächtigkeit einer endlichen Teilmenge beweist man:
2.3.16 Lemma. Jede endliche nichtleere Teilmenge M einer total geordneten Menge hT, ≤i hat ein Minimum und ein Maximum, das wir mit min(M) bzw. mit max(M)
bezeichnen.
Insbesondere gilt diese Aussage für endliche Teilmengen von angeordneten
Körpern und von N.
Beweis. Hat M nur ein Element, d.h. M = {m}, so ist klarerweise m das Maximum von
M.
Angenommen alle M̃ ⊆ T mit n Elementen haben ein Maximum. Hat nun M ⊆ T
genau n + 1 Elemente und ist m1 ∈ M, so hat M \ {m1 } genau n Elemente und laut
Induktionsvoraussetzung ein Maximum m2 ∈ M \ {m1 }. Da hT, ≤i eine Totalordnung
ist, gilt m1 ≤ m2 oder m1 ≥ m2 . Im ersten Fall ist dann m2 das Maximum von M und
im zweiten ist m1 das Maximum von M.
❑
Eine immer wieder verwendete Tatsache ist im folgenden Lemma vermerkt.
2.3.17 Lemma. Sei M ⊆ N nicht endlich. Dann gibt es eine streng monoton wachsende
Bijektion φ von N auf M. Für eine solche gilt immer φ(n) ≥ n.
Beweis. Sei g : M → M definiert durch g(s) = min{m ∈ M : m > s}, und sei
a = min M. Man beachte, dass g(s) für alle s ∈ M definiert ist, da {m ∈ M : m > s}
voraussetzungsgemäß niemals leer ist.
Nach dem Rekursionssatz gibt es eine eindeutige Abbildung φ : N → M mit φ(1) =
a = min M und so, dass φ(n + 1) = g(φ(n)) = min{m ∈ M : m > φ(n)}.
Offensichtlich gilt φ(n + 1) > φ(n). Daraus folgt durch vollständige Induktion, dass
φ(l) > φ(n), wenn l > n. Also ist φ streng monoton wachsende und somit auch injektiv.
Durch vollständige Induktion zeigt man auch leicht, dass φ(n) ≥ n für alle n ∈ N.
Wäre ein m1 ∈ M nicht im Bild von φ, so ist klarerweise m1 > min M = φ(1).
Angenommen m1 > φ(n). Dann ist m1 ∈ {m ∈ M : m > φ(n)} und wegen m1 ,
φ(n + 1) = min{m ∈ M : m > φ(n)} muss m1 > φ(n + 1).
Es folgt, dass φ(n) < m1 für alle n ∈ N, was aber φ(m1 ) ≥ m1 widerspricht.
❑
2.4 Der Ring der ganzen Zahlen
Im Bereich der natürlichen Zahlen haben wir zuletzt Operationen + und · definiert. Ist
m < n, so haben wir auch n − m ∈ N definiert. Wir wollen nun aus den natürlichen Zahlen die ganzen Zahlen Z konstruieren, und die Operationen + und · auf Z so fortsetzen,
dass wir einen Ring hZ, +, ·i erhalten. Die Menge Z zu definieren, ist kein Problem:
2.4.1 Definition. Seien N1 und N2 zwei disjunkte Kopien der natürliche Zahlen, und
sei 0 ein Element, das in keiner dieser Mengen enthalten ist5 . Wir definieren
˙ ∪N
˙ 2.
Z := N1 ∪{0}
5 Man
kann z.B. für N j einfach die Menge N × { j} hernehmen, und für 0 das Element (1, 3)
2.4. DER RING DER GANZEN ZAHLEN
27
Ist ϕ : N1 → N2 eine bijektive Abbildung wie in Korollar 2.3.5, so definieren wir eine
Abbildung − : Z → Z


ϕ(n) , n ∈ N1



0 , n=0
−n = 


 ϕ−1 (n) , n ∈ N
2
Schreiben wir nun N für N1 , so können wir Z als
˙ ∪N
˙
−N∪{0}
anschreiben. Man erkennt unschwer, dass − eine Bijektion ist, die mit sich selber zusammengesetzt die Identität ergibt, also eine Involution ist.
Nun definieren wir die Operationen auf Z in der Art und Weise, wie wir sie der
Anschauung nach erwarten.
2.4.2 Definition. Für n ∈ N setzen wir sgn(n) := 1, sgn(−n) := −1, sgn(0) = 0 sowie
|n| := n, | − n| := n und |0| := 0. Weiters sei + : Z × Z → Z definiert durch


p + q , p, q ∈ N





−(|p| + |q|) , −p, −q ∈ N





p − |q| , p, −q ∈ N, p > −q






−(|q|
− p) , p, −q ∈ N, p < −q



−(|p|
− q) , −p, q ∈ N, − p > q ,
p + q := 




q − |p| , −p, q ∈ N, − p < q





0 , q = −p






p
, q=0




q , p=0
und · : Z × Z → Z durch


|p| · |q| ,



−(|p|
· |q|) ,
p · q := 



0 ,
q, p , 0, sgn(q) = sgn(p)
q, p , 0, sgn(q) = − sgn(p) .
q=0∨ p=0
2.4.3 Satz. hZ, +, ·i ist ein kommutativer Integritätsring mit Einselement. Es gilt also:
Die Addition ist kommutativ und assoziativ, 0 ist ein bzgl. + neutrales Element
und −p ist das zu p ∈ Z bzgl. + inverse Element. Also gelten (A1)-(A4).
Die Multiplikation ist kommutativ und assoziativ, und 1 ist ein bzgl. · neutrales
Element. Also gelten (M1),(M2),(M4).
Es gilt das Distributivgesetz.
Aus p , 0 ∧ q , 0 folgt pq , 0 (Integritätseigenschaft).
Beweis. Seien p, q ∈ Z. Zunächst folgen p + q = q + p und p · q = q · p unmittelbar aus
der Definition und eben der Tatsache, dass diese Operationen auf N kommutativ sind.
Ebenfalls unmittelbar aus der Definition sieht man, dass p + 0 = p und p · 1 = p.
Also ist 0 ein bezüglich + und 1 ein bezüglich · neutrales Element. Genauso elementar
verifiziert man p + (−p) = 0 und p · q , 0, wenn p und q beide , 0.
Es bleibt die Assoziativität und das Distributivgesetz nachzuprüfen. Das ist in
der Tat mühsam und durch zahlreiche Fallunterscheidungen zu bewerkstelligen. Wir
wollen daher nur r + (q + p) = (r + q) + p im exemplarischen Fall r, q ∈ N, − p ∈ N
KAPITEL 2. DIE REELLEN ZAHLEN
28
betrachten:
Ist |p| > r + q, so folgt (r + q) + p = −(|p| − (r + q)), und nach (2.3) ist dieser
Ausdruck gleich −((|p| − q) − r). Wegen |p| − q > r und |p| > q folgt definitionsgemäß
−((|p| − q) − r) = r + (−(|p| − q)) = r + (p + q).
Im Falle |p| = r + q gilt einerseits (r + q) + p = 0 und andererseits wegen |p| > q
und |p| − q = r (siehe (2.2)), dass r + (q + p) = r + (−(|p| − q)) = 0.
Sei nun |p| < r + q. Dann folgt (r + q) + p = (r + q) − |p| =: k ∈ N. Also ist k jene
Zahl, sodass |p| + k = r + q.
Ist q > |p|, so gilt andererseits r + (q + p) = r + (q − |p|), und wegen den bekannten
Rechenregeln auf N, |p| + (r + (q − |p|)) = r + q, also k = r + (q + p).
Wenn q = |p|, so folgt r+(q+ p) = r, und ebenfalls |p|+r = r+q, d. h. k = r+(q+ p).
Ist schließlich q < |p|, so folgt r + (q + p) = r + (−(|p| − q)). Da |p| < r + q folgt
r > |p| − q, und somit r + (−(|p| − q)) = r − (|p| − q) =: l ∈ N. Das ist also jene Zahl,
sodass (|p| − q) + l = r. Addiert man hier q und verwendet die Assoziativität von + auf
N, so folgt |p| + l = r + q, also l = k.
❑
2.4.4 Bemerkung. In Integritätsringen gilt die Kürzungsregel:
m , 0, xm = ym ⇒ y = x,
denn xm − ym = (x − y)m = 0 ⇒ x − y = 0.
Sind p, q ∈ Z, so werden wir im Folgenden wie schon zuvor für p + (−q) den
Ausdruck p − q verwenden.
Wir benötigen noch eine Totalordnung auf Z, welche ≤ auf N erweitert.
2.4.5 Definition. Wir definieren für p, q ∈ Z
q < p ⇔ p − q ∈ N und q ≤ p ⇔ q < p ∨ q = p.
(2.4)
Man sieht leicht ein, dass mit ≤ eine Totalordnung auf Z definiert ist, die ≤ auf N
erweitert, und die mit den Operationen + und · verträglich ist.
2.4.6 Bemerkung. Wenn man sich an die Definition eines angeordneten Körpers in
Definition 2.2.1 erinnert, so haben wir die Existenz einer Teilmenge P ⊆ K verlangt,
die (P1) - (P3) erfüllt. Genau diese Situation haben wir hier mit P = N, nur, dass Z
kein Körper, sondern ein Ring ist.
Die von uns definierte Totalordnung ≤ auf Z erfüllt nun auch alle Eigenschaften,
die für die entsprechende Totalordnung auf einem angeordneten Körper gelten (vgl.
Lemma 2.2.2). Ausgenommen sind nur die Eigenschaften, die sich auf die multiplikativ
Inverse beziehen.
2.4.7 Bemerkung. Die ganzen Zahlen sind eindeutig in dem Sinn, dass wenn Z̃ neben Z
eine weitere Menge versehen mit einer Involution −̃ : Z̃ → Z̃, mit Operationen +̃, ˜· und
einer Relation ≤˜ ist, sodass Z̃ eine Kopie Ñ der natürlichen Zahlen enthält, Z̃ geschrieben werden kann als die disjunkte Vereinigung von −Ñ, {0} und Ñ, die Operationen +̃
und ˜· wie in Definition 2.4.2 durch die entsprechenden Operationen auf Ñ (siehe Bemerkung 2.3.9) definiert sind, und sodass ≤˜ wie in (2.4) definiert ist, es eine eindeutige
Bijektion φ : Z → Z̃ gibt, sodass
φ(−p) = −φ(p), φ(1) = 1̃, φ(n + 1) = φ(n)+̃1̃, p ∈ Z, n ∈ N.
2.4. DER RING DER GANZEN ZAHLEN
29
Um das zu zeige, setzt man einfach die Bijektion ϕ aus Korollar 2.3.5 zu einer Bijektion
φ von Z auf Z̃ gemäß der Forderung φ(−p) = −φ(p) fort. Die erhaltene Bijektion Z → Z̃
ist mit +, ·, − und ≤ verträglich. Siehe dazu auch Bemerkung 2.3.9.
Wir haben im Abschnitt über die natürlichen Zahlen für eine Zahl x aus einem
Körper ihre Potenzen xn , n ∈ N definiert (siehe Bemerkung 2.3.4). Das wollen wir auf
Z ausdehnen:
2.4.8 Definition. Sei hK, +, ·i ein Körper. Für eine ganze Zahl p und eine Zahl x ∈
K, x , 0 definieren wir
 p

,
p ∈N

 x

1
,
p
=0 .
xp = 


 1 , −p ∈ N
−p
x
2.4.9 Bemerkung. Dafür gelten die aus der Schule bekannten Rechenregeln (x ∈ K \
{0}, p, q ∈ Z):
1
x p xq = x p+q , (x p )q = x pq , x−p = p .
(2.5)
x
Den Beweis für diese Rechenregeln führt man durch vollständige Induktion für
p, q ∈ N, und dann durch Fallunterscheidung für den allgemeinen Fall p, q ∈ Z.
2.4.10 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, so gilt für n ∈ N und x, y ≥ 0
x < y ⇔ xn < yn ,
und für x, y > 0
x < y ⇔ x−n > y−n .
Beweis. Zunächst zeigt man leicht durch vollständige Induktion und mit Hilfe von
(P3), dass aus 0 < t immer 0 < tn folgt.
Ist x < y, so folgt im Falle x = 0 daher xn = 0 < yn . Ist 0 < x < y, so zeigt man
n
x < yn durch vollständige Induktion:
Für n = 1 ist xn < yn offensichltich. Gilt xn < yn , so folgt aus Lemma 2.2.2 und der
rekursiven Definition von xn (siehe Bemerkung 2.3.4)
xn+1 = xn · x < yn · x < yn · y = yn+1 .
Ist umgekehrt xn < yn , so muss x < y, da sonst y ≤ x, und aus dem eben bewiesenem
yn ≤ xn folgte.
Die letzte Behauptung folgt sofort aus x < y ⇔ x−1 > y−1 für alle x, y > 0.
❑
n
Also ist x 7→ x eine streng monoton wachsende Funktion und somit injektive
Funktion von P ∪ {0} nach P ∪ {0}. Wir werden später sehen, dass diese Funktionen in
vollständig angeordneten Körpern auch surjekiv sind.
Für p ∈ Z, p < 0 ist x 7→ x p eine streng monoton fallende Funktion und somit eine
injektive Funktion von P nach P.
Wir wollen nun nachweisen, dass das Dividieren mit Rest, wie in der Schule kennengelernt, auf gutem mathematischen
Fundament steht.
2.4.11 Satz. Sind m ∈ N, n ∈ Z, so gibt es eindeutige Zahlen l ∈ Z und r ∈ {0, . . . , m − 1}6 , sodass n = ml + r. Dabei ist
n ≥ 0 genau dann, wenn l ≥ 0.
6 {0, . . . , m
− 1} steht für {k ∈ N ∪ {0} : 0 ≤ k < m}
KAPITEL 2. DIE REELLEN ZAHLEN
30
Beweis. Sei zunächst n ∈ N ∪ {0} beliebig. Da die Menge aller l ∈ N ∪ {0} mit m · l + m > n nicht leer ist (n ist sicher in dieser
Menge), hat sie ein Minimum (Variante von Satz 2.3.10). Ist l = 0, so muss n ∈ {0, . . . , m − 1}, und ist l > 0, so folgt wegen
der Minimalität ml = m(l − 1) + m ≤ n < ml + m. Also muss immer n = ml + r für ein l ∈ N ∪ {0} und ein r ∈ {0, . . . , m − 1}.
Ist nun auch n = ml̂ + r̂ für lˆ ∈ N∪{0} und r̂ ∈ {0, . . . , m−1}, so folgt ml̂ +m > n und wegen der Minimalitätseigenschaft
von l auch lˆ ≥ l. Andererseits gilt ml̂ ≤ n, weshalb nicht l̂ > l sein kann, da sonst n ≥ ml̂ = ml + m(l̂ − l) ≥ ml + m wäre.
Somit gibt es eindeutige l ∈ N ∪ {0} und r ∈ {0, . . . , m − 1}, sodass n = ml + r.
Für n < 0 ist −n − 1 ≥ 0 und somit gibt es eindeutige s ∈ N ∪ {0}, t ∈ {0, . . . , m − 1}, sodass
−n − 1 = sm + t = (s + 1)m + (t − m), und daher sodass −n = (s + 1)m + (t − m + 1), bzw. n = −(s + 1)m + (−t + m − 1). Setzen wir
l = −(s+1) und r = −t+m−1, so sehen wir, dass n = ml+r für ein eindeutiges l < 0 und ein eindeutiges r ∈ {0, . . . , m−1}.
❑
2.4.12 Bemerkung. Die geraden (ungeraden) Zahlen sind genau alle ganzen Zahlen der Form 2k (2k + 1) für ein k ∈ Z. Aus
Satz 2.4.11 folgt insbesondere, dass jede gegebene ganze Zahl gerade oder ungerade ist, wobei aus der Eindeutigkeitsaussage
˙
in Satz 2.4.11 folgt, dass sie nicht gleichzeitig gerade und ungerade sein kann. Also gilt Z = 2Z∪(2Z
+ 1).
Entsprechendes gilt, wenn man 2 durch eine andere natürliche Zahl m ersetzt, nur, dass dann
˙
˙
Z = mZ∪(mZ
+ 1)∪˙ . . . ∪(mZ
+ m − 1).
2.4.13 Definition. Eine Zahl q ∈ N teilt eine Zahl p ∈ N, falls es ein m ∈ N gibt, sodass mq = p. Wir schreiben q|p dafür.
Außerdem setzen wir p : q := m7 .
Eine Zahl p ∈ N \ {1} heißt Primzahl, wenn p nur von 1 und p geteilt wird. Die Menge aller Primzahlen sei P.
2.4.14 Bemerkung.
Falls q|p, so folgt aus mq = p und 1 ≤ m, dass q ≤ p, wobei q = p genau dann, wenn m = 1.
Um zu sehen, ob eine Zahl p eine Primzahl ist, genügt es somit zu überprüfen, dass q 6 |p für alle q ∈ N, 1 < q < p.
Man sieht sofort, dass 2, 3, 5, . . . Primzahlen sind.
Ist n ∈ N \ {1} und M = {r ∈ N \ {1} : r|n}, so ist M nicht leer, da zumindest n ∈ M. Gilt M = {n}, so ist n
definitionsgemäß eine Primzahl. Anderenfalls sei m das kleinste Element von M und k so, dass km = n. Nun ist
m eine Primzahl, da sonst m = pq mit 1 < p, q < m, und weiter p(qk) = n. Es wäre p ∈ M im Widerspruch zur
Minimalität von m.
Insbesondere wird jede Zahl in N \ {1} von einer Primzahl geteilt.
2.4.15 Lemma. Seien a, b ∈ N und p ∈ P. Gilt p|(ab), so folgt p|a ∨ p|b.
Beweis. Sei T ⊆ P die Menge aller Primzahlen, sodass die Aussage falsch ist für gewisse a, b ∈ N. Wir bringen die Annahme
T , ∅ auf einen Widerspruch.
Sei also T , ∅ und p die kleinste Zahl in T (siehe Satz 2.3.10). Somit gibt es a, b ∈ N mit p 6 |a ∧ p 6 |b, aber p|(ab),
bzw. pn = ab für ein n ∈ N. Daher ist
S = {n ∈ N : ∃a, b ∈ N : p 6 |a ∧ p 6 |b ∧ pn = ab},
die Menge aller solchen n nicht leer. Somit hat auch diese Menge ein Minimum s. Seien c, d ∈ N, sodass p 6 |c, p 6 |d und
ps = cd. Aus den ersten beiden Tatsachen folgt c, d , p, c, d , 1, und daraus zusammen mit der Tatsache, dass p eine
Primzahl ist, folgt s > 1.
Nun muss c < p sein, da sonst c − p ∈ N und damit p(s − d) = (c − p)d, was s − d ∈ N implizieren und somit der
Minimalität von s widersprechen würde. Genauso gilt d < p.
Daraus schließen wir wegen ps = cd auf s < p. Gemäß Bemerkung 2.4.14 gibt es eine Primzahl p′ ≤ s < p, sodass
p′ |s, d.h. s = p′ s′ für ein s′ ∈ N, s′ < s. Somit folgt p′ (ps′ ) = cd, also p′ |(cd). Wegen der Minimalität von p muss p′ |c oder
p′ |d. O.B.d.A. sei c = c′ p′ , c′ ∈ N, womit
p′ (ps′ ) = p′ (c′ d) und daraus ps′ = c′ d
folgt. Nun widerspricht das aber ebenfalls der Minimalität von s.
❑
2.4.16 Satz. Ist n ∈ N \ {1}, so gibt es eindeutige Primzahlen p1 , . . . , pm ∈ P und Exponenten e1 , . . . , em ∈ N, sodass
e
n = p11 · . . . pemm .
Diese Zerlegung heißt Primfaktorzerlegung.
7 Da
wir in Z kürzen dürfen, ist p : q eindeutig definiert.
(2.6)
2.4. DER RING DER GANZEN ZAHLEN
31
Beweis. Wir zeigen zuerst die Existenz einer solche Zerlegung. Für n = 2 ist diese klar.
Angenommen für ein n > 2 gibt es zu allen k < n, k ≥ 2 eine solche Zerlegung. Nach Bemerkung 2.4.14 gibt es eine
Primzahl p ≤ n mit p|n. Ist n = p, so haben wir unsere Zerlegung. Ist p < n, so folgt n = (n : p)p, wobei nach Voraussetzung
n : p (< n) eine solche Zerlegung hat. Somit hat auch n eine solche Zerlegung.
Nach einer Variante des Prinzipes der vollständigen Induktion gibt es eine Primfaktorzerlegung für alle n ∈ N \ {1}.
Die Eindeutigkeit ist für n = 2 wieder klar, da alle Produkte der Form (2.6) einen Wert > 2 ergeben, außer für m = 1
und e1 = 1, p1 = 2.
Angenommen mit einem n > 2 ist die Primfaktorzerlegung eindeutig für alle k < n, k ≥ 2, und angenommen
f
f
e
q11 · . . . ql l = n = p11 · . . . pemm ,
e
mit l, m ∈ N und e1 , . . . , em , f1 , . . . , fl ∈ N sowie p1 , . . . , pm , q1 , . . . , ql ∈ P. Insbesondere gilt q1 |p11 · . . . pemm . Nach Lemma
2.4.15 muss q1 |p j und daher q1 = p j für ein j ∈ {1, . . . , m}. Durch Umnummerierung können wir q1 = p1 annehmen. Es
folgt
f
f −1
e −1
q11 · . . . ql l = n : q1 = p11 · . . . pemm .
Ist n : q1 = 1, so muss n = p1 = q1 und l = 1 = m, e1 = 1 = f1 . Sonst folgt wegen 1 < n : q1 < n aus unserer Annahme,
dass auch l = m und e j = f j sowie p j = q j , j = 1, . . . , l.
❑
Eine alternative Konstruktion von Z
Bis zum Ende dieses Abschnittes wird ein anderer Zugang wie oben zu den ganzen Zahlen vorgestellt. Der Vorteil
dieser etwas aufwendigeren Methode ist, dass die Beweise der Rechengesetze struktureller sind.
Sei ∼⊆ (N × N)2 die Relation
(x, n) ∼ (y, m) : ⇐⇒ x + m = y + n .
2.4.17 Lemma. Die Relation ∼ ist eine Äquivalenzrelation.
Beweis. Die Reflexivität und Symmetrie ist klar. Um zu zeigen, dass ∼ transitiv ist, seien (x, n) ∼ (y, m) und (y, m) ∼ (z, k)
gegeben. Dann gilt x + m = y + n und y + k = z + m. Es folgt
(x + k) + m = (x + m) + k = (y + n) + k = (y + k) + n = (z + m) + n = (z + n) + m ,
und wegen der Kürzungsregel in N daher x + k = z + n, d.h. (x, n) ∼ (z, k).
❑
2.4.18 Definition. Wir bezeichnen mit Z die Faktormenge (N × N)/∼ und sprechen von dem Ring der ganzen Zahlen.
Auf Z definieren wir algebraische Operationen +“ und ·“. Die Vorgangsweise dazu ist zunächst Addition und Multi”
”
plikation auf N × N zu definieren, und diese dann auf Z zu übertragen.
+:
(
(
(N × N)2
((x, n), (y, m))
·:
(N × N)2
((x, n), (y, m))
→
7→
→
7→
N×N
(x + y, n + m)
N×N
(xy + nm, xm + ny)
Die Motivation für diese Definition erhalten wir aus der formalen Rechnung
(x − n) + (y − m) = (x + y) − (n + m) ,
(x − n) · (y − m) = xy − ny − xm + nm = (xy + nm) − (xm + ny) .
2.4.19 Lemma. Die Operationen + und · auf N × N sind kommutativ, assoziativ und es gilt das Distributivgesetz.
Beweis. Seien (x, n), (y, m) ∈ N × N. Dann ist
(x, n) + (y, m) = (x + y, n + m) = (y + x, m + n) = (y, m) + (x, n) ,
(x, n) · (y, m) = (xy + nm, xm + ny) = (yx + mn, yn + mx) = (y, m) · (x, n) .
Sei zusätzlich (z, k) ∈ N × N. Dann gilt
(x, n) + (y, m) + (z, k) = (x + y, n + m) + (z, k) = (x + y) + z, (n + m) + k =
= x + (y + z), n + (m + k) = (x, n) + (y, m) + (z, k) .
Die Gültigkeit der Assoziativität der Multiplikation sowie des Distributivgesetzes rechnet man in genau der gleichen Weise
(nur deutlich mühsamer) nach.
❑
Um diese Operationen auf Z übertragen zu können benötigen die Verträglichkeit mit der Relation ∼.
KAPITEL 2. DIE REELLEN ZAHLEN
32
2.4.20 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt, dass auch
(x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gegeben. Dann gilt
(x + y) + (n̂ + m̂) = (x + n̂) + (y + m̂) = ( x̂ + n) + (ŷ + m) = ( x̂ + ŷ) + (n + m) ,
und wir sehen, dass (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂).
Um die Aussage für · zu zeigen, betrachten wir zuerst (x, n) ∼ ( x̂, n̂) und ein (y, m). Dann gilt
(xy + nm) + ( x̂m + n̂y) = (x + n̂)y + ( x̂ + n)m =
= ( x̂ + n)y + (x + n̂)m = ( x̂y + n̂m) + (xm + ny) ,
und wir erhalten (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Wegen der Kommutativität von · folgt auch, dass für (x, n) und (y, m) ∼ (ŷ, m̂)
stets (x, n) · (y, m) ∼ (x, n) · (ŷ, m̂) gilt. Insgesamt erhalten wir, dass für (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gilt
(x, n) · (y, m) ∼ ( x̂, n̂) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
❑
2.4.21 Definition. Auf Z seien zwei algebraische Operationen +“ und ·“ definiert durch: Sind a, b ∈ Z, so wähle
”
”
(x, n), (y, m) ∈ N × N mit [(x, n)]∼ = a und [(y, m)]∼ = b, und setze
a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ .
Dass durch diese Vorschrift tatsächlich zwei Funktionen definiert werden (Wohldefiniertheit), verdanken wir gerade
der Verträglichkeitsaussage Lemma 2.4.20.
Im nächsten Schritt definieren wir eine Relation ≤ auf Z. Dazu sei
(x, n) ≤ (y, m) : ⇐⇒ x + m ≤ y + n,
(x, n), (y, m) ∈ N × N .
Diese Relation ist mit der Relation ∼ verträglich, und sie ist schon fast eine Halbordnung:
2.4.22 Lemma. Die Relation ≤ auf N × N ist reflexiv, transitiv und total ((x, n) ≤ (y, m) ∨ (y, m) ≤ (x, n)).
Ist (x, n) ≤ (y, m) und (y, m) ≤ (x, n), so folgt (x, n) ∼ (y, m). Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt
(x, n) ≤ (y, m) ⇐⇒ ( x̂, n̂) ≤ (ŷ, m̂) .
Beweis. Die Reflexivität folgt unmittelbar aus der Definition. Sei (x, n) ≤ (y, m) und (y, m) ≤ (z, k). Dann gilt x + m ≤ y + n
und y + k ≤ z + m, und wir erhalten
(x + k) + m = (x + m) + k ≤ (y + n) + k = (y + k) + n ≤ (z + m) + n = (z + n) + m .
Daraus folgt nun x + k ≤ z + n, d.h. (x, n) ≤ (z, k). Die Totalität folgt aus der Tatsache, dass ≤ eine Totalordnung auf N ist.
Sei (x, n) ≤ (y, m) und (y, m) ≤ (x, n), dann gilt also x + m ≤ y + n und y + m ≤ x + n. Wir erhalten x + m = y + n, d.h.
(x, n) ∼ (y, m). Die letzte Aussage folgt wieder unmittelbar aus der Definition.
❑
Überträgt man nun die Relation ≤ in naheliegender Weise auf die Faktormenge Z, was nach dem letzten Lemma
möglich ist, so erhält man eine Totalordnung.
2.4.23 Definition. Seien a, b ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ . Dann schreiben wir a ≤ b, wenn gilt (x, n) ≤ (y, m).
2.4.24 Satz. Die Addition und Multiplikation auf Z sind kommutativ, assoziativ und es gilt das Distributivgesetz. Das
Element 0 := [(1, 1)]∼ bzw. 1 := [(2, 1)]∼ ist neutrales Element bezüglich + bzw. ·. Jedes Element besitzt ein additives
Inverses. Für · gilt die Kürzungsregel, d.h. ist a, b, c ∈ Z, c , 0, und ist a · c = b · c, so folgt a = b.
Die Relation ≤ ist eine Totalordnung. Für alle a, b, c ∈ Z, a ≤ b, gilt auch a + c ≤ b + c und, sofern c ≥ 0 ist, auch
a · c ≤ b · c. Umgekehrt, ist c > 0 und a · c ≤ b · c, so folgt a ≤ b.
Die natürlichen Zahlen N sind in Z eingebettet durch
φ:
(
N
x
→
7→
Diese Einbettung erhält Addition, Multiplikation und Ordnung.
Z
[(x + 1, 1)]∼
2.4. DER RING DER GANZEN ZAHLEN
33
Beweis. Die Gültigkeit von Assoziativität, Kommutativität sowie Distributivität folgt wegen Lemma 2.4.19.
Sei a = [(x, n)]∼ ∈ Z. Dann gilt
a + 0 = [(x, n)]∼ + [(1, 1)]∼ = [(x + 1, n + 1)]∼ = [(x, n)]∼ = a ,
sowie
a · 1 = [(x, n)]∼ · [(2, 1)]∼ = [(2x + n, x + 2n)]∼ = [(x, n)]∼ = a ,
also ist 0 neutrales Element der Addition und 1 neutrales Element der Multiplikation. Setze â := [(n, x)]∼ , dann gilt
a + â = [(x, n)]∼ + [(n, x)]∼ = [(x + n, n + x)]∼ = [(1, 1)]∼ = 0 ,
also hat a ein additives Inverses, nämlich â.
Wegen Lemma 2.4.22 ist ≤ auf Z eine Totalordnung. Seien a, b, c ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ , c = [(z, k)]∼ . Dann
gilt
a + c ≤ b + c ⇐⇒ (x + z, n + k) ≤ (y + z, m + k) ⇐⇒ x + z + m + k ≤ y + z + n + k
⇐⇒ x + m ≤ y + n ⇐⇒ a ≤ b .
Sei nun angenommen, dass a < b, d.h. dass x+m < y+n, und dass c ≥ 0, d.h. z ≥ k. Dann gibt es t ∈ N mit y+n = (x+m)+t.
Wegen z ≥ k folgt tz ≥ tk und daher auch (y + n)z = (x + m)z + tz ≥ (x + m)z + tk und schließlich
(x + m)k + (y + n)z ≥ (x + m)z + tk + (x + m)k = (x + m)z + (y + n)k .
Also haben wir (xk + nz) + (yz + mk) ≥ (xz + nk) + (yk + mz), und das heißt gerade a · c ≤ b · c.
Sei umgekehrt a · c ≤ b · c, d.h. nach obiger Rechnung (x + m)k + (y + n)z ≥ (x + m)z + (y + n)k, und c > 0, d.h. z > k.
Angenommen es wäre a > b, d.h. x + m > y + n. Dann gibt es t ∈ N mit (y + n) + t = x + m. Damit erhalten wir
tk + (y + n)(k + z) ≥ tz + (y + n)(z + k)
und daraus tk ≥ tz und schließlich k ≥ z, ein Widerspruch. Also gilt a ≤ b. Die Kürzungsregel für · folgt aus der gerade
bewiesenen für ≤.
Betrachte die Abbildung φ. Angenommen (x + 1, 1) ∼ (y + 1, 1), dann folgt x + 2 = y + 2, also x = y. D.h. φ ist injektiv.
Es gilt
φ(x) + φ(y) = [((x + 1) + (y + 1), 1 + 1)]∼ = [((x + y) + 1, 1)]∼ = φ(x + y) ,
φ(x) · φ(y) = ((x + 1)(y + 1) + 1, (x + 1) + (y + 1)) ∼ =
= (xy + x + y + 1 + 1, x + y + 1 + 1) ∼ = [(xy + 1, 1)]∼ = φ(xy) ,
φ(x) ≤ φ(y) ⇐⇒ (x + 1) + 1 ≤ (y + 1) + 1 ⇐⇒ x ≤ y .
❑
Folgendes Resultat liefert insbesondere, dass die hier konstruierten ganzen Zahlen eine Kopie der ganzen Zahlen aus
der Vorlesung sind.
2.4.25 Proposition. Versteht man die natürlichen Zahlen via φ eingebettet in Z wie in Satz 2.4.24, so gilt
˙ ∪N,
˙
Z = −N∪{0}
wobei diese drei Mengen disjunkt sind. Dabei gilt p ∈ N ⇔ p > 0 und p ∈ −N ⇔ p < 0.
Definieren wir sgn(x) = 0, wenn x = 0, sgn(x) = 1, wenn x ∈ N, und sgn(x) = −1, wenn x ∈ −N, und setzen
|p| = sgn(p)p, so gilt für p, q ∈ Z
und

p+q





−(|p| + |q|)





p − |q|







 −(|q| − p)
−(|p| − q)
p+q=




q − |p|





0





p



q


|p| · |q|



p·q =
 −(|p| · |q|)


0
,
,
,
,
,
,
,
,
,
,
,
,
p, q ∈ N
−p, −q ∈ N
p, −q ∈ N, p > −q
p, −q ∈ N, p < −q
−p, q ∈ N, − p > q
−p, q ∈ N, − p < q
q = −p
q=0
p=0
,
q, p , 0, sgn(q) = sgn(p)
q, p , 0, sgn(p) = − sgn(p)
q=0∨ p =0
Schließlich gilt p < q ⇔ q − p ∈ N und p ≤ q ⇔ (p = q ∨ p < q).
.
KAPITEL 2. DIE REELLEN ZAHLEN
34
Beweis. Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ > 0 = [(1, 1)]∼ , so gilt x + 1 > n + 1. Damit ist x − n ∈ N, und wegen (x − n + 1, 1) ∼ (x, n)
folgt φ(x − n) = [(x, n)]∼ . Umgekehrt ist für y ∈ N φ(y) = [(y + 1, 1)]∼ > [(1, 1)]∼ = 0.
Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ < 0 = [(1, 1)]∼ , so folgt aus den Rechenregeln von Satz 2.4.24 0 > −[(x, n)]∼ = [(n, x)]∼ .
Aus dem schon bewiesenem folgt −[(x, n)]∼ = −φ(n − x), wobei n − x ∈ N. Umgekehrt ist für y ∈ N −φ(y) = [(1, y + 1)]∼ <
[(1, 1)]∼ = 0.
Also kann man N mit p ∈ Z : p > 0 und −N mit p ∈ Z : p < 0 identifizieren.
˙ ∪N,
˙
Z = −N∪{0}
folgt nun aus der Tatsache, dass ≤ eine Totalordnung ist.
Die restlichen Aussagen folgen aus der Definition von |.|, sgn(.) und der Tatsache, dass p < q ⇔ 0 < q − p, siehe Satz
2.4.24.
❑
2.5 Der Körper Q
Oben haben wir den kommutativen Integritätsring hZ, +, ·i konstruiert. Diesen werden
wir nun zu einem angeordneten Körper, dem Körper der rationalen Zahlen erweitern,
und damit sehen, dass es zumindest einen angeordneten Körper gibt.
Der Grundgedanke der folgenden Konstruktion entspringt der Tatsache, dass in
einem Körper qp11 = qp22 genau dann, wenn p1 q2 = p2 q1 .
Sei ∼⊆ (Z × N)2 die Relation
(x, n) ∼ (y, m) : ⇐⇒ xm = yn .
2.5.1 Lemma. Die Relation ∼ ist eine Äquivalenzrelation.
Beweis. Die Reflexivität und Symmetrie sind offensichtlich. Sei nun (x, n) ∼ (y, m) und
(y, m) ∼ (z, k) dann gilt also xm = yn und yk = zm. Es folgt
(xk)m = (xm)k = (yn)k = (yk)n = (zm)n = (zn)m ,
und da hZ, +, ·i ein Integritätsring ist, gilt die Kürzungsregel und wir erhalten xk = zn,
d.h. (x, n) ∼ (z, k).
❑
2.5.2 Definition. Wir bezeichnen mit Q die Menge (Z × N)/∼ aller Äquivalenzklassen.
Q heißt der Körper der rationalen Zahlen.
Auf Q definieren wir algebraische Operationen +“ und ·“. Dazu definieren wir
”
”
wieder zunächst Addition und Multiplikation auf Z × N, und übertragen diese dann
durch Faktorisieren auf Q.
(
(Z × N)2 → Z × N
+:
((x, n), (y, m)) 7→ (xm + yn, nm)
(
(Z × N)2 → Z × N
·:
((x, n), (y, m)) 7→ (xy, nm)
Unsere Motivation für diese Definition ergibt sich aus einer formalen (!) Rechnung.
x y
xm yn
xm + yn x y
xy
+ =
+
=
,
· =
.
n m nm mn
nm
n m nm
2.5.3 Lemma. Für die Verknüpfungen +, · gilt das Kommutativ-, Assoziativ- und Distributivgesetz.
2.5. DER KÖRPER Q
35
Beweis. Die Gesetze gelten, da man sie leicht auf die Gültigkeit dieser Gesetze auf Z
zurückführt. Zum Beispiel gilt das Assoziativgesetz wegen
((x, n) + (y, m)) + (z, k) = (xm + yn, nm) + (z, k) = ((xm + yn)k + z(nm), (nm)k) =
(x(mk) + (yk + zm)n, n(mk)) = (x, n) + ((y, m) + (z, k)).
❑
Um Q anordnen zu können, definieren wir noch
(
(Z × N) → Z
sgn :
.
(x, n) 7→ sgn(x)
Um obige Operationen und die Vorzeichenfunktion auf Q übertragen zu können,
benötigen wir das folgende Resultat.
2.5.4 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt sgn((x, n)) = sgn(( x̂, n̂))
und
(x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben. Zunächst folgt aus xn̂ = x̂n und
n, n̂ ∈ N, dass sgn((x, n)) = sgn(x) = sgn( x̂) = sgn(( x̂, n̂)). Weiters gilt
(xm + yn)n̂m = xmn̂m + ynn̂m =
= (xn̂ − x̂n) mm + x̂nmm + ynn̂m = ( x̂m + yn̂)nm ,
| {z }
=0
also (x, n) + (y, m) ∼ ( x̂, n̂) + (y, m). Wegen der Kommutativität folgt auch, dass für
(x, n) und (y, m) ∼ (ŷ, m̂) stets (x, n) + (y, m) ∼ (x, n) + (ŷ, m̂). Setzt man diese beiden
Erkenntnisse zusammen, so folgt, dass für (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂)
(x, n) + (y, m) ∼ ( x̂, n̂) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂) .
Bei der Multiplikation geht man analog vor. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben.
Dann gilt
xyn̂m = (xn̂ − x̂n) ym + x̂nym = x̂ynm ,
| {z }
=0
also (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Die gleiche Argumentation wie bei + liefert das
gewünschte Ergebnis.
❑
2.5.5 Definition. Auf Q seien zwei algebraische Operationen +“ und ·“ definiert
”
”
durch: Sind a, b ∈ Q, so wähle (x, n), (y, m) ∈ Z × N mit [(x, n)]∼ = a und [(y, m)]∼ = b,
und setze sgn(a) := sgn((x, n)) sowie
a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ .
Wegen Lemma 2.5.4 hängen sgn(a), a + b und a · b nicht von den gewählten Repräsentanten (x, n) bzw. (y, m) ab.
2.5.6 Satz. Setzt man nun P = {a ∈ Q : sgn(a) = 1}, so ist hQ, +, ·, Pi ist ein angeordneter Körper.
KAPITEL 2. DIE REELLEN ZAHLEN
36
Dabei ist [(0, 1)]∼ das neutrale Element bzgl. +,
[(1, 1)]∼ das neutrale Element bezüglich ·.
Zu [(x, n)]∼ ∈ Q ist [(−x, n)]∼ das additiv Inverse, und
zu [(x, n)]∼ ∈ Q \ {0} ist [(sgn(x)n, |x|)]∼ das multiplikativ Inverse.
Außerdem gilt
[(x, n)]∼ ≤ [(y, m)]∼ ⇔ xm ≤ ny.
(2.7)
Die ganzen Zahlen Z sind in Q eingebettet durch
(
Z → Q
φ:
x 7→ [(x, 1)]∼
Diese Einbettung erhält Addition, Multiplikation und Ordnung.
Schließlich hat Q die Eigenschaft, dass die Teilmenge φ(N) von Q keine obere
Schranke hat.
Beweis. Die Gültigkeit der Rechenregeln wie Kommutativität, Assoziativität und Distributivität ergibt sich aus den entsprechenden Regeln für + und · auf Z × N.
Für a = [(x, n)]∼ ∈ Q gilt
a + [(0, 1)]∼ = [(x + 0, n · 1)]∼ = a, a · 1 = [(x · 1, n · 1)]∼ = a .
Weiters hat man für b := [(−x, n)]∼
a + b = [(xn − xn, nn)]∼ = [(0, nn)]∼ = [(0, 1)]∼ = 0 .
Sei nun a , 0, d.h. (x, n) / (0, 1) oder äquivalent x , 0. Mit c := [(sgn(x)n, |x|)]∼ folgt
ac = [(sgn(x)xn, n|x|)]∼ = [(1, 1)]∼.
Wegen sgn([(−x, n)]∼) = sgn(−x) = − sgn([(x, n)]∼) und sgn([(x, n)]∼) = 0 ⇔ x =
0 ⇔ [(x, n)]∼ = [(0, 1)]∼ gilt für a ∈ Q
a∈P
⇔ sgn(a) = 1
a ∈ {0} ⇔ sgn(a) = 0
a ∈ −P ⇔ sgn(a) = −1
Daraus folgt sofort
˙ ∪˙ − P,
Q = P∪{0}
wobei das eine Vereinigung paarweiser disjunkter Mengen ist.
Aus sgn([(x, n)]∼ + [(y, m)]∼) = sgn(xm + yn) und sgn([(x, n)]∼ · [(y, m)]∼) = sgn(xy)
erhalten wir a, b ∈ P ⇒ a + b, a · b ∈ P. Somit ist hQ, +, ·, Pi ein angeordneter Körper,
und wir haben damit eine Totalordnung ≤ auf Q. (2.7) folgt aus
[(y, m)]∼ − [(x, n)]∼ = [(yn − xm, mn)]∼ ∈ {0} ∪ P ⇔ sgn(yn − xm) ≥ 0 ⇔ xm ≤ yn.
Betrachte nun die Abbildung φ : Z → Q. Diese ist injektiv, denn (x, 1) ∼ (y, 1)
genau dann wenn x = y. Dass sie die algebraischen Operationen erhält, rechnet man
leicht nach. Die Verträglichkeit mit der Ordnung gilt, da wegen (2.7)
x ≤ y ⇔ x · 1 ≤ y · 1 ⇔ [(x, 1)]∼ ≤ [(y, 1)]∼ ⇔ φ(x) ≤ φ(y).
2.5. DER KÖRPER Q
37
Angenommen [(x, n)]∼ ist eine obere Schranke von φ(N), also mn ≤ x für alle
m ∈ N. Das ist aber offensichtlich falsch, wenn x ≤ 1 und man zum Beispiel m = 2
setzt. Ist x > 1, so erhält man mit m = x2 den Widerspruch x ≤ xn ≤ 1.
❑
x
n
Wir werden im Folgenden für die rationale Zahl [(x, n)]∼ stets das Symbol schreiben. Dieses Symbol drückt tatsächlich die Division von x durch n aus, denn man hat
[(x, 1)]∼ = [(x, n)]∼ · [(n, 1)]∼
Wir sehen insbesondere, dass jede rationale Zahl der Quotient von zwei ganzen Zahlen
ist.
Nun wollen wir zeigen, dass jeder angeordnete Körper die rationalen Zahlen, und
damit insbesondere auch die ganzen Zahlen, enthält.
2.5.7 Proposition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann gibt es eine eindeutige Abbildung φ : Q → K, die nicht identisch gleich 0 ist, und welche mit der Addition
und Multiplikation verträglich ist. Diese Abbildung ist dann injektiv und auch mit der
Ordnung verträglich.
Beweis.
Für n ∈ N und x ∈ K haben wir im Abschnitt über die natürlichen Zahlen eine
Funktion n 7→ nx von N nach K rekursiv durch 1x = x und (n′ )x = nx+x definiert
(siehe Bemerkung 2.3.4). Nun nehmen wir für x ∈ K das multiplikativ neutrale
Element 1K von K, und bezeichnen mit φ : N → K die entsprechende Funktion
n 7→ n1K , welche offensichtlicherweise φ(1) = 1K und φ(n + 1) = φ(n) + 1K
erfüllt.
Mit vollständiger Induktion (nach m) zeigt man leicht, dass φ(n+m) = φ(n)+φ(m)
und φ(n · m) = φ(n) · φ(m) für alle n, m ∈ N.
Wegen 1K ∈ P (siehe Lemma 2.2.2) sieht man ebenfalls mit vollständiger Induktion, dass φ(n) ∈ P für alle n ∈ N. Insbesondere gilt immer φ(n) , 0K .
Nun setzen wir φ auf Z dadurch fort, dass wir φ(0) = 0K und φ(−n) = −φ(n), n ∈
N setzen. Man beweist durch Fallunterscheidungen mit der in Definition 2.4.2
angegebenen Form von + und · auf Z auf elementare Art und Weise, dass diese
Fortsetzung die Addition und Multiplikation erhält.
Wegen (p, q ∈ Z)
p < q ⇔ q − p ∈ N ⇔ φ(q − p) = φ(q) − φ(p) ∈ P ⇔ φ(p) < φ(q)
ist φ auch mit der Ordnung verträglich.
Da ganz Q von den Quotienten
φ durch die Vorschrift
x
n
mit x ∈ Z, n ∈ N, ausgeschöpft wird, lässt sich
φ
x
n
:=
φ(x)
φ(n)
zu einer Abbildung von Q nach K fortsetzen. Man beachte hier, dass aus nx = n̂x̂
φ( x̂)
φ(x)
= φ(n̂)
. Also ist diese
folgt, dass xn̂ = x̂n und daher φ(x)φ(n̂) = φ( x̂)φ(n) bzw. φ(n)
Abbildung wohldefiniert.
KAPITEL 2. DIE REELLEN ZAHLEN
38
Diese Fortsetzung erhält ebenfalls die Addition und Multiplikation, denn für
x y
n , m ∈ Q gilt
xm + yn φ(xm + yn)
x y =φ
=
=
φ +
n m
nm
φ(nm)
y
x
φ(x)φ(m) + φ(y)φ(n) φ(x) φ(y)
+φ
,
=
+
=φ
φ(n)φ(m)
φ(n) φ(m)
n
m
φ
x
xy φ(xy)
y
=φ
=
=
n m
nm
φ(nm)
·
x y φ(x)φ(y)
φ(x) φ(y)
·φ
.
=
·
=φ
φ(n)φ(m) φ(n) φ(m)
n
m
Sie erhält auch die Ordnung, denn es gilt
x
y
φ(x)
φ(y)
<
⇐⇒ xm < yn ⇐⇒ φ(x)φ(m) < φ(y)φ(n) ⇐⇒
<
.
n m
φ(n) φ(m)
Es folgt insbesondere, dass φ injektiv ist.
Zur Eindeutigkeit von φ: Ist φ̃ eine weitere mit Addition und Multiplikation verträgliche Abbildung, sodass φ̃(x) , 0 für zumindest ein x ∈ Q, so folgt aus
φ̃(x)φ̃(1) = φ̃(x1) = φ̃(x), dass φ̃(1) = 1K , und aus φ̃(0) + φ̃(0) = φ̃(0 + 0) = φ̃(0),
dass φ̃(0) = 0K .
Durch vollständige Induktion folgt nun φ̃(n) = φ(n) für n ∈ N. Aus φ̃(−n)+φ̃(n) =
φ̃(0) = 0K = φ(−n) + φ(n) folgt φ̃(p) = φ(p), p ∈ Z. Schließlich folgt aus
φ̃( np )φ̃(n) = φ̃(p) = φ(p) = φ( np )φ(n), dass φ̃ = φ.
❑
Das letzte Resultat zeigt uns, dass die rationalen Zahlen in einem gewissen Sinn
der kleinste angeordnete Körper ist.
Wenn wir im Folgenden von den natürlichen (ganzen, rationalen) Zahlen als Teilmenge eines angeordneten Körpers sprechen, so wollen wir darunter die gemäß Proposition 2.5.7 existierende isomorphe Kopie φ(N) = {n1k : n ∈ N}, φ(Z), bzw. φ(Q)
verstehen und nicht mehr z.B. zwischen n und n · 1K unterscheiden.
2.5.8 Bemerkung. Die am Beginn vom Beweis von Proposition 2.5.7 konstruierte Einbettung φ der natürlichen Zahlen in
einen angeordneten Körper lässt sich auch auf beliebigen Körpern K durchführen.
Dabei kann es passieren, dass φ(n) = 0K für ein n ∈ N. Das kleinste derartige n ist dann eine Primzahl und heißt die
Charakteristik des Körpers K.
Ist hingegen immer φ(n) , 0K , so sagt man, dass K von Charakteristik Null ist. Insbesondere sind angeordnete Körper
von Charakteristik Null. Man sieht leicht ein, dass dann φ injektiv ist, und man denselben Beweis wie den von Proposition
2.5.7 hernehmen kann, um zu zeigen, dass sich Q injektiv in jeden Körper der Charakteristik Null einbetten lässt.
2.5.9 Bemerkung. Die angegebene Art und Weise, aus Z die rationalen Zahlen zu konstruieren, lässt sich auf beliebige
kommutative Integritätsringe R ausdehnen. Dazu betrachtet man R × (R \ {0}) und die Äquivalenzrelation ∼ mit (x, a) ∼
(y, b) ⇔ xb = ya darauf.
Die in diesem Abschnitt gebrachten Ergebnisse (samt Beweise) gelten sinngemäß auch in dieser allgemeineren Situation, wobei man hier i.A. keine sgn-Funktion hat, und wobei das multiplikativ Inverse zu [(x, n)]∼ genau [(n, x)]∼ ist.
(R × (R \ {0}))/∼ ist dann ein Körper (Quotientenkörper von R), aber i.A. kein angeordneter Körper.
Wendet man diese Konstruktion auf Z an, so erhält man wieder Q.
2.6. ARCHIMEDISCH ANGEORDNETE KÖRPER
39
2.6 Archimedisch angeordnete Körper
2.6.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K archimedisch
angeordnet, wenn N als Teilmenge von K nicht nach oben beschränkt ist.
In Satz 2.5.6 haben wir gesehen, dass die rationalen Zahlen archimedisch angeordnet sind. Wir werden auch sehen, dass die reellen Zahlen archimedisch angeordnet
sind.
2.6.2 Beispiel. Die Eigenschaft, dass hK, +, ·, Pi ein archimedisch angeordneter Körper
ist, ermöglicht es uns etwa das Infimum von Mengen wie
(
1
:n∈N
M=
n
)
zu berechnen. Der Vermutung nach ist inf M = 0.
Um das zu beweisen, sei zunächst bemerkt, dass 0 offensichtlich eine untere
Schranke von M ist. Wäre ǫ > 0 eine weitere untere Schranke von M, d.h. 0 < ǫ <
1
1
n , n ∈ N, so folgte n < ǫ , was aber der Eigenschaft von K, archimedisch angeordnet
zu sein, widerspricht.
In archimedisch angeordneten Körpern gilt der folgende für die später zu entwickelnde Konvergenztheorie wichtige
2.6.3 Satz. Sei hK, +, ·, Pi ein archimedisch angeordneter Körper. Sind x, y ∈ K, x < y,
dann existiert p ∈ Q mit x < p < y 8 .
Beweis. Seien zunächst x, y ∈ K mit 0 ≤ x < y gegeben. Dann ist y − x > 0 und damit
1
1
auch y−x
> 0. Da K archimedisch angeordnet ist, gibt es ein n ∈ N mit n > y−x
und
daher n(y − x) > 1.
Nach Satz 2.3.10 hat {k ∈ N : k > nx} ein Minimum, und somit gibt es eine kleinste
natürliche Zahl m ∈ N, sodass m > nx. Ist m > 1, so folgt aus der Wahl von m, dass
m − 1 ≤ nx. Ist m = 1, so folgt gemäß unserer Voraussetzung m − 1 = 0 ≤ nx. Also gilt
immer m − 1 ≤ nx < m. Kombiniert man diese Ungleichung mit n(y − x) > 1, so folgt
nx < m ≤ nx + 1 < ny ,
und damit x < mn < y.
Ist schließlich x < 0, so können wir ein k ∈ N wählen mit k ≥ |x| (N ist nicht
nach oben beschränkt). Es folgt 0 ≤ x + k < y + k, und nach dem eben bewiesenen
x + k < mn < y + k. Nun ist mn − k eine rationale Zahl mit x < mn − k < y.
❑
2.6.4 Bemerkung. Da man obigen Satz induktiv immer wieder anwenden kann, sieht
man, dass zwischen zwei Zahlen sogar unendlich viele rationale Zahlen liegen.
Ist Q ( K, so kann man mit einer linearen Transformation sogar zeigen, dass es
eine nicht rationale Zahl zwischen 0 und 1 gibt, und weiters unter Verwendung von
Satz 2.6.3, dass es zwischen zwei Zahlen von K auch eine nicht rationale Zahl gibt.
8 Diese
Aussage nennt man auch die Dichteeigenschaft von Q in K.
40
KAPITEL 2. DIE REELLEN ZAHLEN
2.7 Das Vollständigkeitsaxiom
Wie wir später sehen werden, ist die Vollständigkeit die Eigenschaft der reellen Zahlen,
die sie unverwechselbar von anderen angeordneten Körpern unterscheidet.
2.7.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K vollständig
angeordnet, wenn jede nach oben beschränkte Menge ein Supremum hat. Diese Eigenschaft nennen wir (S ).
Wie schon im vorhergehenden Abschnitt erwähnt, gilt
2.7.2 Lemma. Ist hK, +, ·, Pi ein vollständig angeordneter Körper, so ist er archimedisch angeordnet.
Beweis. Wäre nämlich N nach oben beschränkt, so existierte
η = sup N.
Sei n beliebig in N. Mit n gehört aber auch n + 1 zu N. Also gilt n + 1 ≤ η, und somit
n ≤ η − 1. Daher ist η − 1 eine obere Schranke von N, aber selber kleiner als die
kleinste obere Schranke von N. Das ist ein Widerspruch, und wir kommen zu dem
Schluss, dass N nicht nach oben beschränkt sein kann.
❑
Nun gilt folgender wichtige Satz, dessen Beweis wir später (am Ende dieses Abschnittes oder in Kapitel 4) bringen werden.
2.7.3 Satz. Es gibt einen vollständig angeordneten Körper hL, +, ·, L+ i.
Ist hK, +, ·, Pi ein weiterer vollständig angeordneter Körper, so gibt es einen Isomorphismus φ : L → K, also eine Bijektion, sodass φ mit den Operationen verträglich
ist und sodass φ(L+ ) = P.
Wenn wir ab jetzt von den reellen Zahlen sprechen, dann sei immer ein
vollständig angeordneter Körper hL, +, ·, L+ i gemeint. Wir schreiben im Folgenden immer hR, +, ·, R+ i dafür. Wegen Satz 2.7.3 ist hR, +, ·, R+ i bis auf Kopien eindeutig.
2.7.4 Bemerkung. Zusammenfassend sei nochmals betont, dass die reellen Zahlen
R ein vollständig angeordneter Körper sind, der die Körperaxiome (A1)-(A4), (M1)(M4), (D), die Axiome eines angeordneten Körpers (P1)-(P3) und (S ) erfüllt.
Alle bis hierher gezeigten Rechenregeln und Eigenschaften von R lassen sich alle aus diesen Axiomen herleiten, bzw. haben wir hergeleitet. Auch die im Folgenden
aufgebaute Analysis setzt nur auf diese Axiome auf.
Die Vollständigkeit von R garantiert, dass es n-te Wurzeln von nichtnegativen Zahlen gibt.
2.7.5 Satz. Sei x ∈ R, x ≥ 0, und n ∈ N. Dann existiert genau eine Zahl y ∈ R, y ≥ 0,
sodass yn = x.
Beweis. Im Fall n = 1 ist die Aussage trivial. Sei also n ≥ 2.
Wir zeigen zuerst die Eindeutigkeit. Seien y1 , y2 ≥ 0, und sei z.B. y1 < y2 . Dann
folgt auch yn1 < yn2 (mit vollständiger Induktion zu zeigen) und daher können nicht
beide der Gleichung yn = x genügen.
Zur Existenz: Ist x = 0, so ist klarerweise yn = x für y = 0. Im Fall x > 0 sei
E := {t ∈ R : t > 0, tn < x}.
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
41
x
Diese Menge ist nicht leer, denn z.B. t0 = 1+x
∈ E, da aus 0 < t0 < 1 und t0 < x folgt,
n
n
dass t0 < t0 < x, und somit t0 < x.
Setzt man t1 := 1 + x, dann ist t1 > 1, also auch t1n > t1 . Weiters ist t1 > x. Ist nun
t ≥ t1 , so erhalten wir tn ≥ t1n > x, d.h. t < E. Also ist E nach oben beschränkt, da ja t1
eine obere Schranke ist.
x
∈ E ist sicher
Da R vollständig angeordnet ist, existiert y := sup E. Wegen 0 < 1+x
n
y > 0. Wir zeigen im Folgenden, dass y = x, und zwar indem wir die beiden anderen
Möglichkeiten yn < x und yn > x ausschließen.
Dazu machen wir die folgende Bemerkung. Für beliebige Elemente a, b ∈ R gilt
(die mit vollständiger Induktion zu beweisende Gleichung)
bn − an = (b − a)(bn−1 + bn−2 a + . . . + ban−2 + an−1 ) .
(2.8)
Also erhalten wir für 0 < a < b die Abschätzung
bn − an < (b − a)nbn−1 .
Angenommen yn < x, so wähle ein ǫ ∈ Q mit
!
x − yn
0 < ǫ < min
,1 .
n(y + 1)n−1
Dies ist wegen Satz 2.6.3 möglich, da ja x − yn > 0. Setze in obiger Abschätzung a = y
und b = y + ǫ. Dann folgt
(y + ǫ)n − yn < ǫn(y + ǫ)n−1 < ǫn(y + 1)n−1 < x − yn .
Also ist (y + ǫ)n < x und daher y + ǫ ∈ E. Ein Widerspruch, denn y ist eine obere
Schranke von E.
Wäre yn > x, so setze man
yn − x
δ := n−1 .
ny
Dann ist 0 < δ < ny < y. Für jedes t ≥ y − δ folgt wieder unter Verwendung obiger
Abschätzung, diesmal mit b = y, a = (y − δ),
yn − tn ≤ yn − (y − δ)n < δnyn−1 = yn − x .
Also tn > x, und daher t < E. Wir sehen, dass y − δ eine obere Schranke von E ist, ein
Widerspruch, denn y ist die kleinste obere Schranke von E.
❑
Die nach obigem √
Satz eindeutig bestimmte Zahl y ≥ 0, die n-te Wurzel von x,
1
schreibt man auch als n x oder x n .
2.7.6 Bemerkung. Man betrachte die Funktion
( +
R ∪ {0} → R+ ∪ {0}
.
y
7→
yn
Gemäß Bemerkung 2.4.9 ist diese Funktion streng monoton wachsend und daher injektiv.
√
Zu gegebenem x ist y = n x so, dass yn = x. Also ist y 7→ yn auch surjektiv als
Funktion von√R+ ∪ {0} nach R+ ∪ {0}. Sie ist also bijektiv und ihre Umkehrfunktion√ist
genau x 7→ n x. Wegen y1 < y2 ⇔ yn1 < yn2 (siehe Bemerkung 2.4.9) ist auch x 7→ n x
streng monoton wachsend.
KAPITEL 2. DIE REELLEN ZAHLEN
42
2.7.7 Bemerkung. Nun sehen wir auch, dass R nicht nur aus rationalen Zahlen bestehen
kann, also Q ( R gilt. Wäre nämlich
√
p
2 = ∈ Q,
q
(2.9)
so kann man p, q teilerfremd wählen, d.h. es gibt kein k ∈ N \ {1}, das p und q teil9 .
Insbesondere ist nur höchstens eine der Zahlen p oder q gerade. Ausquadrieren und mit
q2 Multiplizieren in (2.9) ergibt: 2q2 = p2 . Da eine Zahl genau dann gerade ist, wenn
ihr Quadrat es ist, folgt dass p gerade und damit q ungerade ist. Schreibt man p = 2m,
so folgt 2q2 = 4m2 , und damit q2 = 2m2 . Wir erhalten daraus den Widerspruch, dass
auch q gerade sein müsste.
Wenn man nicht verwenden will, dass jede natürliche Zahl eine eindeutige Primfaktorzerlegung hat, so können wir die
oben verwendeten Tatsachen aus der elementaren Zahlentheorie folgendermaßen verifizieren.
Die Tatsache, dass man einen Bruch qp mit p, q > 0 teilerfremd schreiben kann, sieht man, indem man die Menge aller
p̂ ∈ N betrachtet, sodass es ein q̂ ∈ N gibt mit q̂p̂ = qp . Nach Satz 2.3.10 gibt es ein kleinstes p̂ in dieser Menge, das nun
keinen gemeinsamen Teiler mit q̂ haben kann, da sonst p̂ nicht die Minimalitätseigenschaft hätte.
Um zu sehen, dass eine ganze Zahl p genau dann gerade ist, wenn p2 gerade ist, so an Bemerkung 2.4.12 erinnert, wo
wir insbesondere gesehen haben, dass eine Zahl der Form 2k + 1 nicht gerade ist.
Ist nun p gerade, d.h. p = 2s, s ∈ Z, so auch p2 = 2s·2s = 2(2s2 ). Sei umgekehrt p ungerade. Wir nehmen p > 0 an, da
wir sonst −p betrachten können. Da p nicht gerade ist, folgt p = 2m + 1, und damit ist p2 = 4m2 + 4m + 1 = 2(2m2 + 2m) + 1
auch nicht gerade.
2.7.8 Definition. Ist x > 0 und r ∈ Q, so stellen wir r in der Form r =
N dar, und definieren
√ p
xr = q x .
p
q
mit p ∈ Z, q ∈
Da die Darstellung einer rationalen Zahl als Bruch nicht eindeutig ist, müssen wir
nachweisen, dass die Definition von xr nicht von der Wahl von p, q abhängt. Dazu
brauchen wir
q
2.7.9 Lemma. Ist x > 0 und q ∈ N, so gilt q 1x = √q1x und
√q
√
( q x) p = x p .
q
Beweis. q 1x = √q1x folgt aus ( √q1x )q = ( √q1x)q =
q
q 1
1
q
x die eindeutige Lösung y von y = x ist.
1
x
(2.10)
und der Tatsache, dass nach Satz 2.7.5
√q
trivialerweise richtig, da ja 1 = 1. Sonst folgt (2.10)√aus
√q Istp pq = 0,√qso qistp (2.10)
q
(( x) ) = (( x) ) = x p (siehe (2.5)) und aus der Tatsache, dass nach Satz 2.7.5 x p
q
p
die eindeutige Lösung y von y = x ist.
❑
Ist jetzt r =
p
q
=
m
n,
so folgt wegen pn = qm
√ p
√ pn √ qm
√ q
( q x ) n = q x = q x = ( q x ) m = xm .
Zieht man links und rechts die n-te Wurzel, so gilt wegen (2.10)
√q
9 Eine
p
x =
√n
m
x ,
ganze Zahl k , 0 teilt eine ganze Zahl n, wenn es ein m ∈ Z gibt, sodass km = n.
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
43
und damit ist xr wohldefiniert. Außerdem gelten die (mit einer Beweisführung ähnlich
wie der von Lemma 2.7.9 zu zeigenden) Rechenregeln (r, s ∈ Q, x > 0)
xr+s = xr x s , (xr ) s = xrs , x−r =
1
.
xr
Ohne Beweis sei noch das Lemma vom iterierten Supremum erwähnt.
2.7.10 Lemma. Seien M, N zwei nichtleere Mengen und f : M × N → R eine beschränkte Funktion, d.h. ∃C ∈ R+ : ∀(m, n) ∈ M × N ⇒ | f ((m, n))| ≤ C. Dann
gilt
sup{sup{ f (m, n) : m ∈ M} : n ∈ N} = sup{ f (m, n) : (m, n) ∈ M × N} =
sup{sup{ f (m, n) : n ∈ N} : m ∈ M}.
Eine entsprechende Aussage gilt fürs Infimum.
Die Existenz und Eindeutigkeit der reellen Zahlen
Am Ende dieses Abschnitts werden wir beweisen, dass ein vollständig angeordneter Körper tatsächlich existiert, und
dass alle solche immer Kopien von einander sind.
Eine andere Art und Weise, das zu tun, findet sich in Kapitel 4.
Um diese, anspruchsvolle, Konstruktion zu motivieren denken wir uns eine Gerade gezeichnet, gemeinsam mit einer
Einheitsstrecke. Auf dieser Geraden denken wir uns die rationalen Zahlen durch fortgesetztes unterteilen der Einheitsstrecke
aufgetragen. Obwohl es -anschaulich- beliebig nahe an jedem Punkt eine rationale Zahl gibt, gibt es nach dem vorher
Gesagten Punkte, welche nicht rational sind.
Unsere Konstruktion beruht nun auf der folgenden Bemerkung, die R.Dedekind10 gemacht hat: Zerfallen alle Punkte
der Geraden in zwei Klassen von der Art, dass jeder Punkt der ersten Klasse links von jedem Punkt der zweiten Klasse liegt,
so existiert ein und nur ein Punkt, welcher diese Einteilung aller Punkte in zwei Klassen, diese Zerschneidung der Geraden
in zwei Stücke, hervorbringt.
Man kann also einen Punkt P der Geraden identifizieren mit der Menge aller Punkte die links von ihm liegen. Da man
nun aber mit den rationalen Punkten beliebig nahe an den Punkt P herankommt, genügt es, alle rationalen Punkte die links
von P liegen zu kennen um P selbst eindeutig zu rekonstruieren.
2.7.11 Satz. Es gibt einen vollständig angeordneten Körper. Dieser ist bis auf Isomorphie eindeutig bestimmt.
Beweis. Der Beweis dieses Satzes ist relativ lang und wird in mehreren Schritten geführt von denen wir auch nicht alle im
Detail ausführen werden.
Schritt 1: Eine Teilmenge α von Q heißt ein Dedekindscher Schnitt, wenn sie die folgenden drei Eigenschaften besitzt:
(I)
(II)
(III)
α , ∅, α , Q.
Ist p ∈ α, dann ist auch das rationale Intervall (−∞, p] ⊆ α.
Ist p ∈ α, so existiert ein ǫ ∈ Q, ǫ > 0, sodass p + ǫ ∈ α (und wegen (II) sogar (−∞, p + ǫ] ⊆ α).
Die Menge aller Dedekindschen Schnitte bezeichnen wir mit K.
Dieser Begriff modelliert die Anschauung der Menge aller (rationalen) Punkte die links von dem Punkt (der
”
Geraden) liegen“.
Die Eigenschaft (III) besagt, dass α kein größtes Element hat. Aus der Eigenschaft (II) erhält man unmittelbar die
folgenden beiden Aussagen:
(i)
(ii)
Ist p ∈ α und q < α, dann ist p < q.
Ist r < α und s > r, so ist s < α.
Schritt 2: Wir definieren eine Relation ≤“ auf K durch
”
α ≤ β : ⇐⇒ α ⊆ β, α, β ∈ K ,
Diese Relation ist offenbar eine Halbordnung. Wir zeigen, dass sie sogar eine Totalordnung ist. Seien α, β ∈ K und
sei angenommen, dass α β, d.h. α * β. Dann existiert also p ∈ α mit p < β. Es folgt, dass für alle q > p ebenfalls
q < β, und dass aus q < p folgt q ∈ α. Ist also q ∈ β, so muss q < p sein und daher zu α gehören. D.h. es gilt β ≤ α.
Für α ( β schreiben wir auch α < β.
10 Richard
Dedekind. 6.10.1831 Braunschweig - 12.2.1916 Braunschweig
KAPITEL 2. DIE REELLEN ZAHLEN
44
Schritt 3: In diesem Schritt zeigen wir, dass K mit der Ordnung ≤ die Supremumseigenschaft besitzt. Sei A ⊆ K eine
nichtleere und nach oben beschränkte Teilmenge von K. Setze
γ :=
[
α.
α∈A
Wir zeigen, dass γ ∈ K. Da A nichtleer ist, existiert α0 ∈ A. Nun ist α0 nichtleer und α0 ⊆ γ, also ist auch γ , ∅.
Da A nach oben beschränkt ist, existiert β ∈ K mit α ⊆ β für alle α ∈ A. Daher ist auch γ ⊆ β. Da β , Q, ist auch
γ , Q. Also erfüllt γ die Eigenschaft (I). Ist p ∈ γ, so existiert α ∈ A mit p ∈ α. Also folgt (−∞, p] ⊆ α ⊆ γ.
Weiters existiert ein rationales ǫ > 0 mit r + ǫ ∈ α ⊆ γ. Wir sehen also, dass γ die Eigenschaften (II) und (III) hat.
Es bleibt γ = sup A zu zeigen. Die Tatsache α ≤ γ, ∀α ∈ A ist klar. Ist β ∈ K mit β ≥ α, α ∈ A, d.h. β ⊇ α, α ∈ A,
so folgt da γ die Vereinigung aller α ∈ A ist, dass β ⊇ γ. Also ist γ tatsächlich die kleinste obere Schranke von A.
Schritt 4: Wir definieren eine Addition auf K. Für α, β ∈ K setze
Weiters setze 0∗ := {p ∈ Q : p < 0}.
α + β := r + s : r ∈ α, s ∈ β .
Als erstes zeigen wir, dass α + β ∈ K. Da α , ∅ und β , ∅, folgt auch α + β , ∅. Wähle r′ < α und s′ < β, dann ist
r′ > r, r ∈ α, und s′ > s, s ∈ β. Also erhalten wir r′ + s′ > r + s, r ∈ α, s ∈ β. Damit kann r′ + s′ nicht zu α + β
gehören. Wir sehen, dass α + β die Eigenschaft (I) besitzt. Sei nun p ∈ α + β gegeben, und schreibe p = r + s mit
gewissen r ∈ α, s ∈ β. Für q < p folgt q − s < r und daher q − s ∈ α. Also q = (q − s) + s ∈ α + β, und wir sehen,
dass (II) gilt. Zu p = r + s ∈ α + β wähle ein rationales ǫ > 0 mit r + ǫ ∈ α, dann folgt r + s + ǫ ∈ α + β, also gilt
auch (III).
Die Addition ist kommutativ:
α + β = {r + s : r ∈ α, s ∈ β} = {s + r : r ∈ α, s ∈ β} = β + α .
Sie ist assoziativ, denn
α + (β + γ) = r + u : r ∈ α, u ∈ (β + γ) =
= r + (s + t) : r ∈ α, s ∈ β, t ∈ γ = (r + s) + t : r ∈ α, s ∈ β, t ∈ γ =
= v + t : v ∈ (α + β), t ∈ γ = (α + β) + γ .
Nun identifizieren wir 0∗ als das neutrale Element bezüglich der Addition: Ist r ∈ α und s ∈ 0∗ , so folgt r + s < r,
also r + s ∈ α. D.h. α + 0∗ ≤ α.
Sei umgekehrt p ∈ α, und wähle ein rationales ǫ > 0 mit p + ǫ ∈ α. Dann gilt p = p + ǫ + (−ǫ) ∈ α + 0∗ .
Es bleibt zu zeigen, dass jedes Element von K ein additives Inverses besitzt. Sei also α ∈ K gegeben. Setze
β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < −α .
Als erstes zeigen wir, dass β ∈ K. Sei s < α und setze p := −s − 1, dann ist p + 1 = −s < −α, also p ∈ β, d.h.
β , ∅. Ist q ∈ α, so ist −q < β (da sonst q − ǫ < α, und somit q < α) und damit β , Q. Es gilt also (I). Sei nun p ∈ β
gegeben. Wähle ǫ > 0, sodass −p − ǫ < α. Ist q < p, so gilt −q − ǫ > −p − ǫ und daher −q − ǫ < α, d.h. q ∈ β. Es
gilt also (II). Mit t := p + 2ǫ ist t > p und −t − 2ǫ = −p − ǫ < α, d.h. t ∈ β. Also gilt (III).
Ist r ∈ α und s ∈ β, so ist −s < α und daher r < −s. Daher ist r + s < 0, bzw, r + s ∈ 0∗ . Wir sehen, dass α + β ≤ 0∗ .
Umgekehrt sei v ∈ 0∗ . Setze w := − 2v > 0. Sei q < α, Dann gibt es, da Q archimedisch angeordnet ist, ein n1 ∈ N
mit n1 w > q und daher n1 w < α. Sei q ∈ α, dann gibt es auch ein n2 ∈ N mit n2 w > −q, und daher mit −n2 w ∈ α.
Es existiert also n ∈ Z mit nw ∈ α aber (n + 1)w < α. Setze p := −(n + 2)w. Dann ist p ∈ β, denn −p − w < α. Wir
haben also
v = nw + p ∈ α + β .
Schritt 5: Die Addition ist mit der Ordnung verträglich. Ist nämlich α ≤ β, d.h. α ⊆ β, und ist γ ∈ K, so folgt α+ γ ⊆ β + γ.
Addieren von −γ zeigt, dass in der Tat α ≤ β ⇔ α + γ ≤ β + γ.
Daraus folgt unmittelbar α < β ⇔ β − α ∈ P := {γ ∈ K : γ > 0}, und die Tatsache, dass mit α, β ∈ P auch
α + β > α + 0∗ > 0∗ und somit α + β ∈ P.
Schritt 6: Wir definieren eine Multiplikation auf K. Seien zunächst α, β > 0. Dann setze
α · β := p ∈ Q : ∃r ∈ α, s ∈ β, r, s > 0 : p ≤ rs .
Man zeigt genauso wie in Schritt 4, dass α· β tatsächlich ein Element von K ist, dass die Multiplikation kommutativ
und assoziativ ist, und dass das Distributivgesetz gilt.
Weiters definieren wir
1∗ := {p ∈ Q : p < 1} .
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
45
Wieder sieht man analog wie in den vorherigen Beweisschritten, dass 1∗ neutrales Element bezüglich der Multiplikation ist, und dass jedes Element α > 0 ein multiplikatives Inverses
1
β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < { : q ∈ α, q > 0}
q
besitzt.
Um nun die Multiplikation auch für Elemente α < 0 zu definieren, setze


(−α) · (−β)






(−α) · β
α · β := 


α · (−β)




0∗
,
,
,
,
α < 0∗ , β < 0∗
α < 0∗ , β > 0∗
α > 0∗ , β < 0∗
α = 0∗ oder β = 0∗
Der Beweis der Rechengesetze folgt aus den bereits bekannten Regeln für die Multiplikation von positiven Zahlen
durch Fallunterscheidungen.
Um α, β ∈ P ⇒ α · β ∈ P einzusehen, wähle man a ∈ α \ 0∗ , b ∈ β \ 0∗ . Also a, b ≥ 0. Wegen (III) können wir
sogar a, b > 0 annehmen. Es folgt a · b ∈ α · β \ 0∗ und somit α, β ∈ P.
Wir haben also bewiesen, dass hK, +, ·, Pi ein vollständig angeordneter Körper ist.
Schritt 7: Wie jeder angeordnete Körper enthält K eine Kopie von Q, daher eine mit den Operationen und mit ≤
Verträgliche Injektion φ : Q → K, vgl. Proposition 2.5.7. Da φ(1) = 1∗ , folgt mit vollständiger Induktion
φ(n) = {p ∈ Q : p < n}.
Außerdem zeigt man, dass für r, s ∈ Q und αr = {p ∈ Q : p < r}, αs = {p ∈ Q : p < s} gilt, dass
αr + αs = {p ∈ Q : p < r + s}, − αr = {p ∈ Q : p < −r},
αr · αs = {p ∈ Q : p < rs}, α−1
r = {p ∈ Q : p <
1
}.
r
Für r > 0 sieht man die letzte Tatsache z.B. folgendermaßen.
1
1
1
: q ∈ Q, 0 < q < r} = p ∈ Q : ∃ ǫ > 0 : p + ǫ ≤
= {p ∈ Q : p < }.
α−1
r = p ∈ Q : ∃ǫ > 0 : p + ǫ < {
q
r
r
Da φ( nx ) = sgn(x) φ(|x|)
φ(n) für x ∈ Z, n ∈ N, folgt somit φ(r) = αr , r ∈ Q.
Schritt 8: Wir zeigen, dass jeder vollständig angeordnete Körper L isomorph zu dem oben konstruierten Körper K ist.
Beachte, dass L und K als angeordnete Körper den Körper der rationalen Zahlen enthalten. Definiere
ω:
(
L
x
→
7
→
K
{p ∈ Q : p < x}
,
ψ:
(
K
α
→
7→
L
sup α
Die Abbildung ω ist wohldefiniert, denn {p ∈ Q : p < x} ist, wie man unmittelbar überprüft, ein Dedekindscher
Schnitt. Auch ψ ist wohldefiniert, denn α ist eine nichtleere und beschränkte Teilmenge von Q ⊆ L und besitzt
daher in L ein Supremum.
Außerdem sind diese beiden Abbildungen streng monoton wachsend, und für p ∈ Q gilt ω(p) = α p und ψ(α p ) =
sup α p = p.
Aus Lemma 2.7.12 folgt, dass ω und ψ mit den Operationen verträglich sind. Wendet man Lemma 2.7.12 nun auch
auf ω ◦ ψ und ψ ◦ ω an, so folgt aus der Eindeutigkeitsaussage, dass ω ◦ ψ = id K und ψ ◦ ω = idL . Also sind ω und
ψ zueinander inverse Bijektionen, welche mit Addition, Multiplikation und Ordnung verträglich sind. Daher sind
L und K als angeordnete Körper isomorph.
❑
2.7.12 Lemma. Seien K1 und K2 zwei vollständig angeordnete Körper, und bezeichne Q1 bzw. Q2 die gemäß Proposition
2.5.7 existierende Kopie von Q, welche in K1 bzw. K2 enthalten ist. Seien φ j : Q → K j , j = 1, 2, die entsprechenden
Einbettungen.
Ist ω : K1 → K2 streng monton wachsend und so, dass ω(φ1 (p)) = φ2 (p) für alle p ∈ Q, dann ist ω mit +, · verträglich.
Weiters muss jede weitere streng monton wachsend Abbildung ω̃ : K1 → K2 mit ω̃(φ1 (p)) = φ2 (p), p ∈ Q schon mit ω
übereinstimmen.
KAPITEL 2. DIE REELLEN ZAHLEN
46
Beweis. Zunächst beweisen wir die letzte Aussage. Angenommen es gäbe ein x ∈ K1 , sodass φ1 (x) , φ2 (x). O.B.d.A. sei
ω(x) < ω̃(x). Nach Satz 2.6.3 gibt es ein p ∈ Q mit ω(x) < φ2 (p) < ω̃(x).
Nun muss x < φ1 (p), da widrigenfalls φ1 (p) ≤ x und daher ω(φ1 (p)) = φ2 (p) ≤ ω(x). Andererseits muss aber
φ1 (p) < x, da sonst x ≤ φ1 (p) und daher ω̃(x) ≤ φ2 (p) = ω̃(φ1 (p)). Beides kann aber nicht gleichzeitig gelten. Somit muss
ω = ω̃.
Zur Verträglichkeit mit + halte man zunächst ein p ∈ Q fest, und betrachte
ωp :
(
K1
x
→
7→
K2
ω(x + φ1 (p)) − φ2 (p)
.
Wegen den Eigenschaften von φ1 , φ2 aus Proposition 2.5.7 folgt ω p (φ1 (q)) = ω(φ1 (q + p)) − φ2 (p) = φ2 (q) für alle q ∈ Q.
Außerdem ist ω p offensichtlicherweise streng monoton wachsend.
Nach obiger Eindeutigkeitsaussage folgt ω = ω p bzw. ω(x + φ1 (p)) = ω(x) + φ2 (p) = ω(x) + ω(φ1 (p)) für alle x ∈ K1
und wegen der Beliebigkeit von p auch für alle p ∈ Q.
Nun betrachte man für ein festes y ∈ K1 die Abbildung ωy (x) = ω(x + y) − ω(y). Wegen dem eben gezeigten erfüllt
diese ωy (φ1 (q)) = φ2 (q), q ∈ Q, und sie ist ebenfalls streng monoton wachsend. Also folgt ωy = ω, bzw. ω(x + y) =
ω(x) + ω(y), x, y ∈ K1 .
ω(x·φ1 (p))
Indem man zunächst x 7→ φ (p)
für festes p ∈ Q \ {0} und dann x 7→ ω(x·y)
ω(y) für festes y ∈ K1 \ {0} betrachtet, folgt
1
wie oben auch die Verträglichkeit mit ·.
❑
2.8 Die komplexen Zahlen
Betrachtet man die quadratische Gleichung x2 + 1 =
√ 0, und sucht die Lösungen davon,
indem man formal rechnet, so erhält man x1,2 = ± −1, also eigentlich kein Ergebnis.
Das stimmt mit der Tatsache überein, dass die Gleichung x2 + 1 = 0 keine reellen
Lösungen hat. Aus vielen Gründen wäre es trotzdem wünschenswert mit Wurzeln√aus
negativen Zahlen rechnen zu können, denn dann wären selbstverständlich x1,2 = ± −1
Lösungen der Gleichung.
Wir formalisieren nun das Konzept der Wurzel aus einer negativen Zahl.
2.8.1 Definition. Die Menge der komplexen Zahlen C wird definiert als die Menge der
Paare reeller Zahlen, C := R2 = R × R. Wir schreiben eine komplexe Zahl (a, b) ∈ C
an als a + ib. Hierbei ist i ein formales Symbol, die sogenannte imaginäre Einheit.
Ist z = a + ib ∈ C, so heißt a der Realteil und b der Imaginärteil von z. Man schreibt
auch a = Re z und b = Im z.
Für zwei komplexe Zahlen a + ib und c + id definieren wir eine Addition und eine
Multiplikation wie folgt:
(a + ib) + (c + id) := (a + c) + i(b + d),
(2.11)
(a + ib) · (c + id) := (ac − bd) + i(bc + ad).
(2.12)
Wir wollen die triviale aber nützliche Tatsache bemerken, dass zwei komplexe Zahlen genau dann übereinstimmen, wenn ihre Realteile und ihre Imaginärteile übereinstimmen.
√
Die imaginäre Einheit modelliert die Zahl“ −1. Tatsächlich gilt nach Definition
”
der Multiplikation von komplexen Zahlen i2 = −1.
2.8.2 Satz. Die komplexen Zahlen hC, +, ·i sind ein Körper, wobei 0 + i0 das neutrale
Element bezüglich +, 1 + i0 das neutrale Element bezüglich ·, (−a) + i(−b) die additiv
Inverse zu a + ib, und
−b
a
+i 2
(2.13)
a2 + b2
a + b2
die multiplikativ Inverse zu a + ib , 0 + i0 ist.
2.8. DIE KOMPLEXEN ZAHLEN
47
Beweis. Wir müssen die Körperaxiome aus Definition 2.1.1 nachweisen. Die Kommutativität von + und · (Axiome (A4),(M4)) sieht man unmittelbar aus der Definition in
(2.11) und (2.12). Genauso schnell überzeugt man sich von der Gültigkeit der Assoziativität von + ((A1)). Wegen
((a + ib) · (c + id)) · (x + iy) = ((ac − bd) + i(bc + ad)) · (x + iy) =
(acx − bdx − bcy − ady) + i(bcx + adx + acy − bdy) =
= (a + ib) · ((cx − dy) + i(cy + dx)) = (a + ib) · ((c + id) · (x + iy))
gilt (M1). Ganz leicht sieht man, dass 0 + i0 das additiv neutrale Element von C ist
((A2)), und dass (−a) + i(−b) das zu a + ib additiv inverse Element ist ((A3)).
Genauso elementar sieht man, dass 1 + i0 das multiplikativ neutrale Element ist
((M2)), und dass die in (2.13) angegebene komplexe Zahl das zu a + ib multiplikativ
inverse Element ist ((M3)). Schließlich gilt (D), da in R das Distributivgesetz gilt und
da
(x + iy) · ((a + ib) + (c + id)) = (x + iy) · ((a + c) + i(b + d)) =
(xa + xc − yb − yd) + i(xb + xd + ya + yc) =
((xa − yb) + i(xb + ya)) + ((xc − yd) + i(xd + yc)) = (x + iy) · (a + ib) + (x + iy) · (c + id).
❑
Die reellen Zahlen sind in C eingebettet vermöge der Abbildung a 7→ a + i · 0.
Offenbar ist diese Einbettung ein Körperhomomorphismus (verträglich mit den Verknüpfungen +, ·). Insbesondere sehen wir, dass C ein R-Vektorraum ist, die dafür nötigen Rechengesetze gelten, da sie einfach Spezialfälle der Rechenregeln des Körpers C
sind. Eine Basis von C als R-Vektorraum lässt sich leicht angeben, nämlich {1, i}. Denn
(nach Definition) lässt sich jede komplexe Zahl in eindeutiger Weise anschreiben als
Linearkombination a · 1 + b · i mit den reellen Koeffizienten a, b. Wir sehen also, dass
die Dimension von C als R-Vektorraum gleich 2 ist.
Statt a + i0 schreibt man üblicherweise a und statt 0 + ib auch ib.
Graphisch lassen sich die Zahlen aus C als Punkte in der Ebene veranschaulichen,
man spricht auch von der Gausschen Zahlenebene11. Dabei ist
√
(2.14)
|z| := a2 + b2 (≥ 0)
die Länge des Vektors von (0, 0) nach (a, b). Wir nennen |z| auch den Betrag von z.
Nicht ganz zufällig wird der Betrag auf den komplexen Zahlen gleich wie die Betragsfunktion auf einem bewerteten Körper bezeichnet. Es gelten nämlich vergleichbare Regeln (z, w ∈ C):
(i) | Re z| ≤ |z|, | Im z| ≤ |z|
(ii) |zw| = |z||w|.
(iii) |z + w| ≤ |z| + |w|.
(iv) |z + w| ≥ ||z| − |w||.
11 Carl-Friedrich
Gauß. 30.4.1777 Braunschweig - 23.2.1855 Göttingen
KAPITEL 2. DIE REELLEN ZAHLEN
48
Im
C
z = a + ib
ib
|z|
0
|z| = |z|
b
Re
z = a − ib
−ib
Abbildung 2.3: Zahlenebene
(i) und (ii) lassen sich dabei elementar nachprüfen. Die Dreiecksungleichung folgt
durch Ausquadrieren, und die Dreiecksungleichung nach unten beweist man genauso,
wie bei den angeordneten Körpern (siehe (2.1)).
Eine weiters Begriffsbildung im Zusammenhang mit den komplexen Zahlen ist die
der konjugiert komplexen Zahl z zu einer komplexen Zahl z = a + ib:
z := a − ib .
Offenbar gilt |z| = |z|, |z|2 = zz, und z−1 = |z|z2 wenn z , 0. Der Übergang von z zu
seiner konjugierten z̄ entspricht bei der graphischen Veranschaulichung der komplexen
Zahlen genau dem Spiegeln an der reellen Achse.
Kapitel 3
Der Grenzwert
Schon sehr bald hat sich in der Mathematik herausgestellt, dass eine rein algebraische
Betrachtungsweise der reellen Zahlen nicht immer das geeignete Instrument zur Modellierung der in den Naturwissenschaften auftretenden Phänomene ist. Probleme wie
unendlich oft immer kleiner werdende Größen zusammenzählen“ oder einer gewis”
”
sen Zahl immer näher kommen“, lassen sich mit den bisher rein algebraischen Methoden nicht betrachten.
Man denke zum Beispiel an die Approximation der Zahl 2π, indem man einem
Kreis mit Radius eins regelmäßige n-Ecke einschreibt, von diesen den Umfang berechnet, und dann n immer größer werden lässt.
Das führt zu dem Begriff des Grenzwertes einer Folge von Zahlen. Dazu wollen
wir das einer Zahl immer näher Kommen“bzw. Konvergieren mathematisch exaktifi”
zieren:
Eine Folge x1 , x2 , x3 , . . . von reellen Zahlen heißt konvergent gegen eine reelle Zahl
x, falls es zu jedem beliebig kleinen Abstand ǫ > 0 einen Folgenindex N gibt, sodass
ab diesem Index alle Folgenglieder einen Abstand von x kleiner als ǫ haben; sodass
also
|xn − x| < ǫ,
für alle n ≥ N.
Wir wollen nun aber Konvergenzbetrachtungen nicht nur für Folgen von reellen
Zahlen betrachten, sondern auch z.B. für Folgen von komplexen Zahlen oder für Folgen
von Punkten im Raum. Wie man aus der Definition der Konvergenz erahnen kann,
benötigt man dazu lediglich einen Abstandsbegriff auf dem betrachteten Objekt. Wir
führen dazu den Begriff des metrischen Raumes ein.
3.1 Metrische Räume
Um zu sagen, wann ein Punkt x nahe“ bei einem anderen Punkt y liegt, müssen wir in
”
irgendeiner Weise den Abstand von x zu y messen können. Betrachten wir zum Beispiel
die Menge X aller Punkte der Ebene. Dann ist es naheliegend, als Abstand zwischen x
und y die Länge l x,y der Strecke, die die beiden Punkte verbindet, zu nehmen. Man sieht,
dass die folgenden Regeln gelten: Stets ist l x,y ≥ 0, denn Längen sind immer positiv.
Dabei gilt =“ genau dann, wenn x = y, denn eine Strecke hat dann und nur dann Länge
”
0, wenn Anfangs- und Endpunkt gleich sind. Es ist stets l x,y = ly,x , denn vertauscht
man Anfangs- und Endpunkt so bleibt die Länge der Strecke erhalten. Schwieriger
49
KAPITEL 3. DER GRENZWERT
50
einzusehen, aber anschaulich doch klar, ist die Gültigkeit der Dreiecksungleichung:
In jedem Dreieck ist die Länge einer Seite höchstens so groß, wie die Summe der
Längen der anderen Seiten. D.h. für je drei Punkte (die Eckpunkte des Dreiecks) gilt
l x,z ≤ l x,y + ly,z .
Es sind genau diese drei Eigenschaften, die es ausmachen, dass die Länge der
”
Verbindungsstrecke“ ein vernünftiger Abstandsbegriff ist.
3.1.1 Definition. Sei X eine Menge, d : X × X → R eine Funktion. Dann heißt d eine
Metrik auf X, und hX, di ein metrischer Raum, wenn gilt
(M1) Für alle x, y ∈ X ist d(x, y) ≥ 0. Es gilt d(x, y) = 0 genau dann, wenn x = y.
(M2) Für alle x, y ∈ X gilt d(x, y) = d(y, x).
(M3) Sind x, y, z ∈ X, so gilt die Dreiecksungleichung:
d(x, z) ≤ d(x, y) + d(y, z) .
3.1.2 Bemerkung. Man kann allgemeiner auch Metriken d betrachten, die X × X nicht
nach R, sondern nach K abbilden, wobei hK, +, ·, Pi ein archimedisch angeordneter
Körper ist. Wir werden darauf im Kapitel 4 zurück kommen.
3.1.3 Beispiel.
Ist X = R und d(x, y) = |x − y| für x, y ∈ R, so sieht man sofort, dass (M1) und
(M2) erfüllt sind. (M3) folgt aus der Dreiecksungleichung für den Betrag (siehe
Lemma 2.2.11):
|x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z|, x, y, z ∈ R.
(3.1)
Ist X = C R2 und d(z, w) = |z − w| für z, w ∈ C, wobei |.| hier der komplexe
Betrag ist, so erfüllt d offensichtlich (M2)
p und d(z, w) ≥ 0. Schreibt man z = a+ib
und w = c + id, so gilt d(z, w) = (a − c)2 + (b − d) = 0 genau dann, wenn
a − c = 0 und b − d = 0, also z = w. Somit ist (M1) erfüllt. (M3) folgt aus der
Dreiecksungleichung für den komplexe Betrag ähnlich wie in (3.1).
Um eine Metrik auf X := R p zu definieren, setzen wir
d2 (x, y) :=
p
X
j=1
12
(x j − y j )2 , x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ X .
Man spricht von der euklidischen Metrik auf Rn . Die Gültigkeit von (M1) und
(M2) ist aus der Definition offensichtlich. Die Dreiecksungleichung (M3) folgt
hingegen aus dem unten folgenden Lemma 3.1.4.
Im Falle p = 1, also X = R, gilt d2 (x, y) = |x − y|, und damit ist der Abstand
zweier Zahlen bzgl. der euklidischen Metrik nichts anderes als der Betrag der
Differenz dieser Zahlen.
Die euklidische Metrik auf R2 hat eine analoge Interpretation mit Hilfe des Betrages einer
√ komplexen Zahl. Für z = a + ib ∈ C haben wir den Betrag definiert
als |z| = a2 + b2 . Daraus sieht man, dass die euklidische Metrik auf R2 gerade
d2 (z, w) = |z − w|, z = a + ib, w = c + id ∈ C ,
3.1. METRISCHE RÄUME
51
ist, wobei wir hier die komplexen Zahlen in der Gausschen Zahlenebene, also als
Elemente von R2 interpretieren.
(M3) folgt in den Fällen p = 1, 2 wie schon oben gezeigt, aus der bereits bewiesenen Dreiecksungleichung für die Betragsfunktion
3.1.4 Lemma. Seien p ∈ N, a1 , . . . , a p , b1 , . . . , b p ∈ R. Dann gilt (Schwarzsche Ungleichung1)
 p
2
 p
  p

X

X 2  X

2
 ai bi  ≤  ai  · 
bi  ,
i=1
i=1
i=1
2
und (Minkowskische Ungleichung )
 p
1  p
 12
 p
 12
X  2 X

X

 (ai + bi )2  ≤  a2i  +  b2i  .
i=1
i=1
i=1
Beweis. Wir verwenden die Bezeichnungen a := (a1 , . . . , a p ), b := (b1 , . . . , b p ) ∈ R p
und definieren3
p
X
(a, b) :=
ai bi .
i=1
p
Für Zahlen λ, µ ∈ R und a, b ∈ R setzen wir
λa + µb := (λa1 + µb1 , . . . , λa p + µb p ) .
Offenbar gilt für a, b, c ∈ R p
(λa + µb, c) =
p
X
(λai + µbi )ci =
i=1
p
X
i=1
λai ci +
p
X
µbi ci = λ(a, c) + µ(b, c) .
i=1
Man spricht von der Linearität von (., .) in der vorderen Komponente. Wegen (a, b) =
(b, a) ist (., .) auch in der hinteren Komponente linear (vgl. den Begriff des Skalarproduktes auf einem Vektorraum in der Linearen Algebra).
Um die Schwarzsche Ungleichung zu zeigen, gehen wir von der trivialen Bemerkung aus, dass für jedes p-Tupel x = (x1 , . . . , x p ) ∈ R p gilt
(x, x) =
p
X
i=1
x2i ≥ 0.
Für alle t ∈ R gilt nun
0 ≤ (a + tb, a + tb) = (a, a) + 2t(a, b) + t2 (b, b).
(a,b)
in obiger Ungleichung ein, und erhält
Ist (b, b) , 0, so setze man t = − (b,b)
0 ≤ (a, a) −
1 Hermann
(a, b)2
.
(b, b)
Amandus Schwarz. 25.1.1843 Hermsdorf (Sobiecin, Polen) - 30.11.1921 Berlin
Minkowski. 22.6.1864 Alexoten (bei Kaunas, Litauen) - 12.1.1909 Göttingen
3 Also ist (., .) eine Abbildung von R p × R p nach R.
2 Hermann
(3.2)
KAPITEL 3. DER GRENZWERT
52
Daraus folgt unmittelbar die Schwarzsche Ungleichung.
Im Falle (b, b) = 0 folgt b = (0, . . . , 0), und damit auch (a, b) = 0. Es gilt also auch
in diesem Fall die Schwarzsche Ungleichung.
Die Minkowskische Ungleichung folgt wegen (ai + bi )2 = ai · (ai + bi ) + bi (ai + bi )
aus
p
p
p
p
p
X
X
X
X
X
2
(ai + bi ) =
ai (ai + bi ) +
bi (ai + bi ) ≤ ai · (ai + bi ) + bi · (ai + bi )
i=1
i=1
i=1
i=1
i=1
 p
1
X 2  2
≤  ai 
i=1
 p
1
 21  p
X  2
X




·  (ai + bi )2  +  b2i 
i=1
i=1
 p
 21
X

·  (ai + bi )2  =
i=1

 12  p
 12
1   p
p
X
X  2  X










2
2
2







=  ai  +  bi   ·  (ai + bi )  .
i=1
i=1
i=1
❑
Beispiele von Metriken gibt es viele, und sie treten in verschiedensten Zusammenhängen auf.
3.1.5 Beispiel.
(i) Sei noch einmal X := R2 und setze
d1 (x, y) := |x1 − y1 | + |x2 − y2 |, x = (x1 , x2 ), y = (y1 , y2 ) ∈ R2 .
Dann ist d1 eine Metrik: Die Gültigkeit von (M1) und (M2) ist wieder aus der
Definition offensichtlich. Um die Dreiecksungleichung einzusehen, seien x, y, z ∈
R gegeben. Dann folgt mit Hilfe der Dreiecksungleichung für |.|,
d1 (x, z) = |x1 − z1 | + |x2 − z2 | ≤ |x1 − y1 | + |y1 − z1 | + |x2 − y2 | + |y2 − z2 | =
= |x1 − y1 | + |x2 − y2 | + |y1 − z1 | + |y2 − z2 | = d1 (x, y) + d1 (y, z) .
Diese Metrik ist offenbar nicht gleich der euklidischen
Metrik, denn zum Beispiel
√
ist d1 ((0, 0), (2, 1)) = 3 aber d2 ((0, 0), (2, 1)) = 5.
Anschaulich interpretiert bezeichnet man d1 manchmal als New York-Metrik“.
”
Denn stellt man sich in der Ebene einen Stadtplan mit lauter rechtwinkeligen Straßen vor (wie in New York), dann misst d1 (x, y) gerade die Länge des Fußweges
von der Kreuzung x zur Kreuzung y.
Ganz analog definiert man eine Metrik am R p :
d1 (x, y) =
p
X
j=1
|x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p .
Der Nachweis von (M1)-(M3) geht genauso wie im oben betrachteten Fall p = 2.
(ii) Ist wieder X = R p , so definieren wir nun die Metrik
d∞ (x, y) := max |x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p .
j=1,...,p
3.1. METRISCHE RÄUME
53
(M1),(M2) sind klar. Die Dreiecksungleichung folgt aus der Tatsache, dass für
alle nichtnegativen Zahlen
max{a1 + b1 , . . . , a p + b p } ≤ max{a1 , . . . , a p } + max{b1 , . . . , b p } .
Auch diese Metrik unterscheidet sich tatsächlich von den schon eingeführten Metriken d1 und d2 , da etwa im Falle p = 2 gilt, dass d∞ ((0, 0), (2, 1)) = 2.
(iii) Eine hauptsächlich aus theoretischer Sicht wichtige Metrik ist die diskrete Metrik.
Sie findet man auf jeder nichtleeren Menge X, indem man
(
0 , x=y
d(x, y) =
1 , x,y
setzt.
(iv)
Betrachte die ganzen Zahlen X := Z und halte eine Primzahl p fest. Setze
 1


 pn(p)
d(p) (x, y) := 

0
, x , y, x − y = ±
, x=y
Q
q prim
qn(q)
Q
Dabei ist ± q prim qn(q) die eindeutige Primfaktorzerlegung von x − y. Dann ist d(p) eine Metrik auf Z. Denn (M1)
ist nach Definition erfüllt, (M2) ist ebenfalls richtig, denn vertauscht man x und y, so ändert sich bei der Differenz
x − y nur das Vorzeichen, nicht jedoch die Primfaktoren und ihre Potenzen. Die Dreiecksungleichung ist wieder
schwieriger einzusehen. Wir zeigen, dass in diesem Fall sogar die stärkere Ungleichung
d(p) (x, z) ≤ max{d(p) (x, y), d(p) (y, z)}, x, y, z ∈ Z ,
gilt. Diese Ungleichung impliziert tatsächlich sofort die Dreiecksungleichung, denn für je zwei Zahlen a, b ≥ 0 ist
stets max(a, b) ≤ a + b.
Schreibe
x−z = ±
Y
q prim
sodass also
d(p) (x, z) =
qn1 (q) , x − y = ±
Y
q prim
qn2 (q) , y − z = ±
Y
qn3 (q) ,
q prim
1
1
1
, d(p) (x, y) = n (p) , d(p) (y, z) = n (p) .
pn1 (p)
p2
p3
Betrachte den Fall, dass d(p) (x, y) ≥ d(p) (y, z), d.h. n2 (p) ≤ n3 (p). Wegen n2 (p) ≤ n3 (p) teilt pn2 (p) sowohl x − y als
auch y − z, und daher auch (x − y) + (y − z) = x − z. Es folgt n2 (p) ≤ n1 (p), und somit d(p) (x, y) ≥ d(p) (x, z).
Der Fall d(p) (x, y) ≤ d(p) (y, z) wird genauso behandelt.
Auf Z haben wir natürlich auch die euklidische Metrik d2 (x, y) = |x − y|, denn Z ist ja eine Teilmenge von R. Diese
ist verschieden von der Metrik d(p) , denn zum Beispiel ist d(p) (0, p) =
1
p,
wogegen d2 (0, p) = p.
3.1.6 Bemerkung. Auf R stimmen die Metriken d1 , d2 , d∞ alle überein.
3.1.7 Bemerkung. Die oben kennengelernten Metriken d2 , d1 , d∞ auf dem R p sind allesamt von Normen erzeugte Metriken.
Eine Norm k.k auf R p ist eine Funktion von R p → R mit folgenden drei Eigenschaften x, y ∈ R p , λ ∈ R:
(i) kxk ≥ 0, wobei kxk = 0 ⇔ x = 0.
(ii) kλxk = |λ| · kxk.
(iii) kx + yk ≤ kxk + kyk.
Es gilt nun d(x, y) = kx − ykq
2 , d1 (x, y) = kx − yk1 , d∞ (x, y) = kx − yk∞ , wobei diese
Pp
Pp
2
drei Normen durch kxk2 :=
j=1 |x j | , kxk1 :=
j=1 |x j |, kxk∞ = max{|x1 |, . . . , |x p |}
definiert sind.
KAPITEL 3. DER GRENZWERT
54
3.2 Der Grenzwert in metrischen Räumen
Wir kommen nun zurück zu dem am Anfang des Kapitels motivierten Begriff der Konvergenz einer Folge.
3.2.1 Definition. Eine Folge in einer Menge X ist aus mathematischer Sicht nichts
anderes als eine Funktion
y : N → X,
wobei der Funktionswert y(n) von y an der Stelle n meist als yn geschrieben wird.
Für die Folge y als solche schreiben wir meist (yn )n∈N . Folgen werden auch oft als
y1 , y2 , y3 , . . . angeschrieben.
3.2.2 Definition. Sei hX, di ein metrischer Raum, (xn )n∈N eine Folge in X, und x ein
Element von X. Dann heißt (xn )n∈N konvergent gegen x, wenn gilt 4
∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N .
(3.3)
In diesem Fall schreibt man limn→∞ xn = x.
xN
x1
xN ′
x
ǫ′
ǫ
Ist (xn )n∈N eine Folge, und gibt es ein Element x ∈ X, sodass limn→∞ xn = x, so sagt
man die Folge (xn )n∈N ist konvergent. Ist
eine Folge nicht konvergent, so sagt man
sie ist divergent.
Man verwendet auch andere Schreibweisen für limn→∞ xn = x, wie zum Beispiel
n→∞
(xn )n∈N → x, n → ∞, oder x −→ x, oder
auch nur xn → x.
3.2.3 Bemerkung. Wegen |d(x, xn ) − 0| = d(x, xn ) folgt, dass eine Folge (xn )n∈N in
einem metrischen Raum hX, di genau dann gegen ein x ∈ X konvergiert, wenn die
Folge (d(x, xn ))n∈N in R (versehen mit der euklidischen Metrik) gegen 0 konvergiert.
Folgen müssen nicht immer mit dem Index 1 anfangen. Ist k eine feste ganze Zahl,
so setzen wir Z≥k := {n ∈ Z : n ≥ k}. Eine Abbildung x : Z≥k → X nennen wir ebenfalls
Folge, wobei ihre Konvergenz in analoger Weise wie in Definition 3.2.2 definiert ist.
3.2.4 Beispiel.
(i) Sei hX, di ein beliebiger metrischer Raum, und sei x ∈ X. Betrachte die konstante
Folge x1 = x2 = x3 = . . . = x. Dann gilt limi→∞ xi = x.
Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N
finden, sodass d(xi , x) < ǫ für alle i ≥ N. Wähle N := 1, dann gilt
d(xi , x) = d(x, x) = 0 < ǫ, i ≥ N .
Dieses Beispiel ist natürlich in gewissem Sinne trivial, denn die Folgenglieder xi
sind ja schon alle gleich dem Grenzwert x, kommen diesem also natürlich beliebig
nahe.
4 Kürzer
lässt sich folgendermaßen schreiben: ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : ∀n ≥ N ⇒ d(xn , x) < ǫ.
3.2. DER GRENZWERT IN METRISCHEN RÄUMEN
55
(ii) Sei X = R und d = d2 die euklidische Metrik d2 (x, y) = |x − y|. Dann gilt
lim j→∞ 1j = 0.
Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N
finden, sodass | 1j − 0| = 1j < ǫ gilt, wenn nur j ≥ N. Dazu benützen wir die
Tatsache, dass N als Teilmenge von R nicht nach oben beschränkt ist: Wähle
N ∈ N mit 1ǫ < N. Für alle j ∈ N mit j ≥ N gilt 1j ≤ N1 < ǫ.
(iii) Aus dem letzten Beispiel schließen wir lim j→∞ (1+ 1j ) = 1, da |(1+ 1j )−1| =
(vgl. Bemerkung 3.2.3).
1
j
→0
Die Vorgangsweise aus Beispiel 3.2.4, (ii), kommt öfters vor. Darum wollen wir sie
explizit formulieren.
3.2.5 Korollar. Sei hX, di ein metrischer Raum, xi , x ∈ X, i ∈ N. Dann gilt xi → x
genau dann, wenn
1
für alle i ≥ N .
(3.4)
M
Die jeweiligen Bedingungen (3.3) und (3.4) sind äquivalent zu den entsprechenden
Bedingungen, wenn man in diesen Beziehungen < durch ≤ ersetzt.
∀M ∈ N ∃N ∈ N : d(xi , x) <
Beweis. Gilt (3.4) und ist ǫ > 0, so gibt es wegen Lemma 2.7.2 ein M ∈ N, sodass
1
1
M < ǫ. Wegen (3.4) gibt es ein N ∈ N, sodass d(xi , x) < M < ǫ für i ≥ N. Also haben
wir (3.3) nachgewiesen.
Gilt umgekehrt (3.3), so folgt (3.4) sofort, da ja M1 spezielle ǫ > 0 sind.
Dass aus den jeweiligen Bedingungen die Bedingungen mit ≤ statt < folgt ist klar,
da aus < ja ≤ folgt.
Zur Umkehrung: Man wende die Bedingungen mit ≤ statt < auf 2ǫ an. Man erhält
dann ... ≤ 2ǫ < ǫ.
❑
3.2.6 Beispiel.
Jede Zahl x ∈ R ist Limes einer Folge (rn )n∈N bestehend aus rationalen Zahlen.
Um das einzusehen, wähle gemäß Satz 2.6.3 für jedes n ∈ N eine Zahl rn ∈ Q
so, dass x < rn < x + 1n . Nach unserer Wahl ist (3.4) erfüllt. Also limn→∞ rn = x.
Genauso gibt eine Folge irrationaler Zahlen größer x, die gegen x konvergiert.
Arbeitet man mit größerer mathematischen Strenge, so muss man obiges Argument folgendermaßen präzisieren.
Nach Satz 2.6.3 ist die Menge Mn der r ∈ Q mit x < r < x +
1
n
nicht leer. Nun sei ρ einfach eine nach dem
Auswahlaxiom existierende Funktion von N nach ∪n∈N Mn , sodass ρ(n) ∈ Mn . Nun setze einfach rn = ρ(n).
Mit einer etwas feineren Argumentation kann man (rn )n∈N sogar streng monoton
fallend (rn1 > rn2 wenn n1 < n2 ) wählen. Dazu definiert man rn induktiv so, dass
x < rn < min(x + 1n , rn−1 ). Genauso kann man eine streng monoton wachsende
Folge aus Q konstruieren, die gegen x konvergiert.
Lässt man auch hier mehr Strenge walten, so benötigt man zur Existenz der Folge (rn )n∈N den Rekursionssatz:
Für jedes y > x und jedes n ∈ N ist die Menge Q ∩ (x, min(y, n1 )) nicht leer. Sei ̺ : N × (x, +∞) → Q eine
Auswahlfunktion, sodass ̺(n, y) ∈ Q ∩ (x, min(y, 1n )). Nun sei a := (1, r1 ) ∈ N × ((x, +∞) ∩ Q) =: A und g : A → A
definiert durch g(n, y) = (n + 1, ̺(n, y)). Nach dem Rekursionssatz gibt es eine Funktion φ : N → A mit φ(1) = a
und φ(n + 1) = g(φ(n)). Ist für n ∈ N nun rn die zweite Komponente von φ(n), so hat (rn )n∈N die geforderten
Eigenschaften.
KAPITEL 3. DER GRENZWERT
56
Sei F ⊆ R nach oben beschränkt und x := sup F. Nun wähle gemäß der Definition des Supremums ein xn ∈ (x− 1n , x] , ∅ für jedes n ∈ N. Also gibt es eine Folge
(xn )n∈N , in F, die gegen sup F konvergiert. Man kann ähnlich wie oben (xn )n∈N
sogar monoton wachsend wählen.
Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum.
3.2.7 Beispiel. Es gibt viele Folgen, die nicht konvergieren. Zum Beispiel betrachte die
Folge zn := in in C, wobei wir wie immer, wenn wir nichts anderes explizit sagen, C
mit der euklidischen Metrik versehen. Dann hat (zn )n∈N das Aussehen
i, −1, −i, 1, i, −1, −i, 1, . . . ,
und ist divergent. Denn angenommen es wäre zn → z für ein gewisses z ∈ C, so wähle
man N ∈ N, sodass |zn − z| < 12 , n ≥ N. Ist nun n0 ≥ N durch 4 teilbar, so folgt der
Widerspruch
2 = |1 − (−1)| = |zn0 − zn0 +2 | ≤ |zn0 − z| + |z − zn0 +2 | <
1 1
+ = 1.
2 2
3.2.8 Definition. Eine Teilfolge einer gegebenen Folge (xn )n∈N ist (xn( j) ) j∈N , wobei n :
N → N eine streng monoton wachsende Funktion ist. Also n(1) < n(2) < n(3) < . . . .
Klarerweise ist eine solche Funktion n immer injektiv, und es gilt n( j) ≥ j.
Folgende elementare Sachverhalte von großer Bedeutung und werden in Beweisen
immer wieder Verwendung finden.
3.2.9 Satz. Sei hX, di ein metrischer Raum und sei (xn )n∈N eine Folge von Elementen
von X.
(i) Die Folge (xn )n∈N hat höchstens einen Grenzwert.
(ii) (xn )n∈N konvergiert gegen x ∈ X genau dann, wenn es ein k ∈ N gibt, sodass
(xn )n∈Z≥k gegen x ∈ X konvergiert. Es kommt also nicht auf endlich viele Folgenglieder an, ob und wohin eine Folge konvergiert.
(iii) Ist limn→∞ xn = x und k ∈ N, so konvergieren auch (xn+k )n∈N und (xn−k )n∈Z≥k+1
gegen x.
(iv) Ist limn→∞ xn = x, so konvergiert auch jede Teilfolge (xn( j) ) j∈N gegen x.
Beweis. Wir zeigen zunächst (i). Es gelte xn → x und xn → y, und angenommen x , y,
also d(x, y) > 0. Wähle N1 ∈ N, sodass d(xn , x) < d(x,y)
3 , n ≥ N1 , und N2 ∈ N, sodass
d(xn , y) < d(x,y)
,
n
≥
N
.
Dann
folgt
für
N
:=
max{N
,
N2 } der Widerspruch
2
1
3
d(x, y) ≤ d(x, xN ) + d(xN , y) <
d(x, y) d(x, y) 2d(x, y)
+
=
< d(x, y) ,
3
3
3
Wir zeigen auch noch (iv). Die restlichen Aussagen sind noch elementarer nachzuweisen. Sei also (xn( j) ) j∈N eine Teilfolge der gegen x konvergenten Folge (xn )n∈N . Ist ǫ > 0,
so gibt es ein N ∈ N, sodass d(xn , x) < ǫ, wenn nur n ≥ N.
Ist nun i0 ∈ N so groß, dass n(i0 ) ≥ N (z.B. i0 = N), so folgt für i ≥ i0 auch
n(i) ≥ N und somit d(xn(i) , x) < ǫ. Also lim j→∞ xn( j) = x.
❑
3.2. DER GRENZWERT IN METRISCHEN RÄUMEN
57
3.2.10 Beispiel.
(i) Ist p ∈ N, so gilt limn→∞ n1p = 0. Das folgt unmittelbar aus Satz 3.2.9 und der
ist.
Tatsache, dass diese Folge eine Teilfolge von n1
n∈N
Genauso gilt
limn→∞ √p1n
mit 1n < ǫ p ,
es ein N ∈ N
1
√
< ǫ für n ≥ N.
p
n
= 0. Ist nämlich ǫ > 0, so auch ǫ p > 0. Da
1
n
→ 0, gibt
wenn n ≥ N. Aus der Monotonie der p-ten Wurzel folgt
(ii) Sei q ∈ R, 0 ≤ q < 1, und betrachte die Folge (qn )n∈N . Dann gilt limn→∞ qn = 0.
Um das einzusehen, können wir q > 0 voraussetzen, da sonst die betreffliche
Folge identisch gleich Null ist. Wir verwenden zum Beweis die Bernoullische
Ungleichung aus Lemma 2.3.6. Setzt man in der Bernoullischen Ungleichung
x = q1 − 1 > 0, so erhält man
1
q
!n
!
1
−1 .
≥1+n
q
Da R archimedisch angeordnet ist, gibt es zu jedem ǫ > 0 eine Zahl N ∈ N mit
1 + N( q1 − 1) > 1ǫ und damit auch ( 1q )N > 1ǫ , also qN < ǫ. Es folgt d(0, qn ) = qn ≤
qN < ǫ für alle n ≥ N.
(iii) Sei z ∈ C, |z| < 1. Betrachte die Folge
S n :=
n
X
zk = 1 + z + z2 + . . . + zn .
k=0
1
Dann gilt limn→∞ S n = 1−z
. Das ist die sogenannte geometrische Reihe. Zum
Beweis: Es gilt (vgl. (2.8))
1n − zn = (1 − z)(1n−1 + 1n−2 z + . . . + 1zn−2 + zn−1 ) = (1 − z)(1 + z + . . . + zn−1 ) ,
und wir erhalten
S n−1 =
1
zn
−
.
1−z 1−z
(3.5)
Sei nun ǫ > 0 gegeben. Wähle N ∈ N mit |z|n < ǫ, n ≥ N (vgl. (ii)), dann folgt
S n−1 −
ǫ
1 |z|n
=
<
, n≥ N.
1−z
|1 − z| |1 − z|
Startet man nun anstelle von ǫ mit der ebenfalls positiven Zahl |1 − z| · ǫ, so erhält
1
man am Ende der Ungleichungskette nur ǫ. Also gilt S n−1 → 1−z
und wegen Satz
1
3.2.9 auch S n → 1−z .
Weil die im letzten Beispiel verwendete Vorgehensweise oftmals Anwendung findet, wollen wir hier auch explizit bemerken, dass xn → x genau dann, wenn
∀ǫ > 0 ∃N ∈ N d(xn , x) < K · ǫ, für alle n ≥ N,
wobei K irgendeine feste positive reelle Zahl ist.
(3.6)
KAPITEL 3. DER GRENZWERT
58
3.2.11 Bemerkung. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di und x ∈ X.
Angenommen diese Folge konvergiert nicht gegen x. Dann zeigt man leicht, dass
sie eine Teilfolge (xn(i) )i∈N hat, sodass d(xn(i) , x) ≥ ǫ für ein gewisses ǫ > 0 und alle
i ∈ N.
Ist nun (xn(i( j)) ) j∈N eine beliebige Teilfolge von (xn(i) )i∈N , so kann diese wegen
d(xn(i( j)) , x) ≥ ǫ sicherlich auch nicht gegen x konvergieren.
Somit haben wir gezeigt, dass wenn jede Teilfolge von (xn )n∈N wiederum eine Teilfolge hat, die gegen x konvergiert, so muss schon (xn )n∈N gegen x konvergieren.
Wegen Satz 3.2.9, (iv), gilt auch die Umkehrung.
3.2.12 Lemma. Sei hX, di ein metrischer Raum und seien (xn )n∈N , (yn )n∈N Folgen von
Elementen von X, sodass limn→∞ xn = x und limn→∞ yn = y. Dann folgt
lim d(xn , yn ) = d(x, y).
n→∞
Beweis. Zunächst wollen wir folgende Ungleichung beweisen:
d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , a2 ) + d(b1 , b2 ), a1 , a2 , b1 , b2 ∈ X .
(3.7)
Aus der Dreiecksungleichung folgt d(a1 , b1 ) − d(a2 , b1 ) ≤ d(a1 , a2 ) sowie d(a2 , b1 ) −
d(a1 , b1 ) ≤ d(a1 , a2 ). Also gilt
d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , b1 ) − d(a2 , b1 ) + d(a2 , b1 ) − d(a2 , b2 ) ≤
d(a1 , a2 ) + d(b1 , b2 ) .
Sei nun ǫ > 0 und N ∈ N so groß, dass d(xn , x), d(yn , y) < 2ǫ , wenn n ≥ N. Aus (3.7)
folgt
|d(xn , yn ) − d(x, y)| ≤ d(xn , x) + d(yn , y) < ǫ
für alle n ≥ N.
❑
Ein weiterer Begriff, der im Zusammenhang mit konvergenten Folgen auftritt, ist
der der Beschränktheit.
3.2.13 Definition. Sei hX, di ein metrischer Raum, und sei Y ⊆ X. Dann heißt Y beschränkt, wenn es eine Zahl M > 0 und einen Punkt x0 ∈ X gibt, sodass
d(y, x0 ) ≤ M, y ∈ Y .
Eine Folge (xn )n∈N heißt beschränkt, wenn die Bildmenge {xn : n ∈ N} beschränkt ist.
Allgemeiner heißt eine Funktion f : E → X beschränkt, wenn die Bildmenge f (E)
beschränkt ist.
Die Menge Y ist also beschränkt, wenn sie ganz in einem gewissen Kreis (Mittelpunkt x0 , Radius M) liegt.
3.2.14 Bemerkung. Y ist beschränkt genau dann, wenn es zu jedem Punkt x ∈ X eine
Zahl M x > 0 gibt mit d(y, x) ≤ M x , y ∈ Y. Denn, ist x ∈ X gegeben, so setze M x :=
M + d(x, x0 ). Dann gilt für jedes y ∈ Y
d(y, x) ≤ d(y, x0 ) + d(x0 , x) ≤ M + d(x, x0 ) = M x .
3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN
59
Mit Hilfe dieser Tatsache sieht man auch, dass Y ⊆ C (Y ⊆ R) versehen mit der
euklidischen Metrik genau dann beschränkt ist, wenn für ein gewisses M > 0 gilt, dass
∀x ∈ Y : |x| (= d(x, 0)) ≤ M.
Im Falle Y ⊆ R stimmt daher diese Definition von Beschränktheit mit der von Definition 2.2.4 überein.
3.2.15 Proposition. Jede konvergente Folge (xn )n∈N ist beschränkt.
Beweis. Wähle N ∈ N mit d(xn , x) < 1 für n ≥ N. Setzt man
M := 1 + max{d(x1 , x), . . . , d(xN−1 , x)} ,
so erhält man d(xn , x) ≤ M für jedes n ∈ N.
❑
3.2.16 Bemerkung. Die Umkehrung gilt nicht (außer der Raum X besteht aus nur einem Element), da für x, y ∈ X, x , y,
die Folge x, y, x, y, x, y, x, . . . zwar beschränkt, aber nicht konvergent ist.
3.2.17 Bemerkung. Insbesondere gibt es zu jeder konvergenten reell- bzw. komplexwertigen Folge (xn )n∈N ein Konstante M > 0, sodass |xn | ≤ M, n ∈ N.
3.2.18 Beispiel. Man betrachte die Folge (S n )n∈N aus Beispiel 3.2.10, (iii), für den Fall
|z| = 1 aber z , 1. Aus (3.5) sehen wir, dass
Sn =
1 − zn+1
.
1−z
n+1
|
2
= |1−z|
, und (S n )n∈N ist damit beschränkt. Sie ist aber nicht
Also ist |S n | ≤ 1+|z
|1−z|
konvergent, denn, wie man aus den Ergebnissen im nächsten Abschnitt sieht, wäre
dann auch (zn )n∈N konvergent. Das ist aber nicht der Fall. Man setze z.B. z = i oder
z = −1.
3.3 Folgen reeller und komplexer Zahlen
Wir wollen uns hier zunächst mit dem metrischen Raum hR, di beschäftigen, und folgendes einfaches, aber sehr nützliches Lemma bringen.
3.3.1 Lemma. Seien (xn )n∈N , (yn )n∈N zwei konvergente Folgen reeller Zahlen mit den
Grenzwerten x und y. Dann gilt:
(i) Ist c ∈ R mit x < c (c < x), so gibt es ein N ∈ N, sodass xn < c (c < xn ) für alle
n ≥ N.
(ii) Ist x < y, so gibt es ein N ∈ N, sodass xn < yn für alle n ≥ N.
(iii) Gilt ab einem gewissen N ∈ N die Ungleichung xn ≤ yn , so folgt x ≤ y.
Beweis.
(ii) Setzt man ǫ = y−x
2 , so folgt aus der Konvergenz die Existenz eines N ∈ N, sodass
und
|yn − y| < y−x
|xn − x| < y−x
2
2 für n ≥ N. Somit gilt
−(yn − y) − (x − xn ) ≤ |yn − y| + |x − xn | < (y − x).
Also
yn − xn = (y − x) + (yn − y) + (x − xn ) > 0.
KAPITEL 3. DER GRENZWERT
60
(i) Folgt aus (ii), wenn wir (yn )n∈N ((xn )n∈N ) als die identische Folge (c)n∈N wählen.
(iii) Wäre x > y, so würde aus (ii) folgen, dass xn > yn für alle n ≥ k mit einem
hinreichend großen k ∈ N. Das widerspricht der Annahme.
❑
Der nächste Satz dient häufig als Werkzeug zur Berechnung von Grenzwerten.
3.3.2 Satz (Einschluss-Satz). Seien (xn )n∈N , (yn )n∈N und (an )n∈N reelle Folgen mit xn ≤
an ≤ yn für alle bis auf endlich viele n ∈ N. Gilt
lim xn = lim yn ,
n→∞
n→∞
so existiert auch der Grenzwert limn→∞ an und ist gleich dem gemeinsamen Grenzwert
von (xn )n∈N und (yn )n∈N .
Beweis. Setze a := limn→∞ xn . Zu ǫ > 0 wähle N ∈ N mit |xn − a|, |yn − a| < ǫ und
xn ≤ an ≤ yn für n ≥ N. Für solche n folgt
−ǫ < xn − a ≤ an − a ≤ yn − a < ǫ,
d.h. |an − a| < ǫ.
❑
3.3.3 Beispiel. Als ganz einfache Beispiel betrachte man die Folge
sieht leicht, dass
1
1
0≤ 2
≤ , für n ≥ 3.
n − 3n + 3 n
Also folgt mit Satz 3.3.2, dass limn→∞
1
n2 −3n+3
1
.
n2 −3n+3 n∈N
Man
= 0.
Wir haben auf R und C algebraische Operationen und die Betragsfunktion. Im
nächsten Satz wollen wir zeigen, dass diese mit dem Grenzwertbegriff verträglich sind.
3.3.4 Satz (Rechenregeln für Folgen). Seien (zn )n∈N und (wn )n∈N konvergente Folgen
komplexer Zahlen, limn→∞ zn =: z, limn→∞ wn =: w, und sei λ ∈ C. Dann gilt für k ∈ N
(i) limn→∞ |zn | = |z|, limn→∞ z̄n = z̄.
(ii) limn→∞ (zn + wn ) = z + w, limn→∞ (−zn ) = −z.
(iii) Ist z = 0, also zn → 0, n → ∞, und ist (un )n∈N eine beschränkte Folge in C, dann
gilt limn→∞ (zn · un ) = 0.
(iv) limn→∞ (λzn ) = λz und limn→∞ (zn · wn ) = z · w.
(v) limn→∞ zkn = zk .
(vi) Falls z , 0 ist, gilt limn→∞
1
zn
= 1z .
√
√
(vii) Ist zn ∈ R und zn ≥ 0, so folgt limn→∞ k zn = k z.
Diese Aussagen gelten auch, wenn die Folgen bzw. der Skalar λ aus R sind.
3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN
61
3.3.5 Bemerkung. Bis auf den letzten Punkt werden wir Satz 3.3.4 für komplexe Folgen
beweisen. Fast derselbe Beweis funktioniert für reellwertige Folgen.
Man kann aber die Rechenregeln für reellwertige Folgen auch aus denen für komplexwertige Folgen herleiten, da, wie wir gleich zeigen wollen, eine Folge (xn )n∈N in R
genau dann konvergiert, wenn (xn +i0)n∈N in C konvergiert. Dabei ist limn→∞ (xn +i0) =
(limn→∞ xn ) + i0.
Ist (xn )n∈N eine reellwertige Folge, welche gegen ein x ∈ R konvergiert, so konvergiert (xn + i0)n∈N gegen x + i0, da ja |(xn + i0) − (x + i0)| = |xn − x| → 0 (vgl. Bemerkung
3.2.3).
Konvergiert umgekehrt für eine reellwertige Folge (xn )n∈N die Folge (xn + i0)n∈N in
C gegen x + iy ∈ C, so muss wegen
0 ≤ max(|xn − x|, |0 − y|) ≤ |(xn + i0) − (x + iy)| → 0, n → ∞,
gemeinsam mit Satz 3.3.2 folgen, dass xn → x und |y| → 0, d.h. y = 0.
Beweis. (Satz 3.3.4)
(i) Zu ǫ > 0 wähle N ∈ N, sodass |zn −z| < ǫ für n ≥ N. Mit der Dreiecksungleichung
nach unten erhält man
|zn | − |z| ≤ |zn − z| < ǫ, |z̄n − z̄| = |zn − z| < ǫ.
Man kann limn→∞ |zn | = |z| auch als Spezialfall von Lemma 3.2.12 sehen: |zn | =
d(zn , 0) → d(z, 0) = |z|.
(ii) Sei ǫ > 0 gegeben. Wähle N so, dass |zn − z| <
n ≥ N. Es gilt für solche n
ǫ
2
und auch |wn − w| <
|(zn + wn ) − (z + w)| = |(zn − z) + (wn − w)| ≤ |zn − z| + |wn − w| <
ǫ
2
für alle
ǫ ǫ
+ = ǫ.
2 2
Also ist (zn + wn )n∈N konvergent und der Grenzwert ist gleich z + w. Weiters gilt
für n so groß, dass |zn − z| < ǫ:
|(−zn ) − (−z)| = | − (zn − z)| = |zn − z| < ǫ,
also konvergiert (−zn )n∈N gegen −z.
(iii) Ist C > 0 so, dass |un | ≤ C, n ∈ N, und ist ǫ > 0, so gibt es wegen zn → 0 ein
N ∈ N, sodass |zn | < Cǫ , n ≥ N. Es folgt |zn ·un | < ǫ für alle n ≥ N, also zn ·un → 0.
(iv) Sei N so groß, dass für n ≥ N gilt |zn − z| < ǫ. Dann gilt
|λzn − λz| = |λ| · |zn − z| < λ · ǫ.
Gemäß (3.6) folgt daher λzn → λz.
Um zn wn → zw nachzuweisen, wollen wir zunächst bemerken, dass nach Bemerkung 3.2.17 konvergente Folgen beschränkt sind. Nach (ii) konvergiert (zn − z)
gegen Null, und mit (iii) daher auch (zn − z)wn → 0, n → ∞. Der schon bewiesene Teil von (iv) gibt nun zusammen mit (ii)
n→∞
zn wn = (zn − z)wn + zwn −→ 0 + zw.
KAPITEL 3. DER GRENZWERT
62
(v) Das folgt durch vollständige Induktion nach k aus (iv).
(vi) Sei nun z , 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z für hinreichend
großes n, dass |zn | > |z|2 . Es folgt die Abschätzung
1 − 1 = |z − zn | ≤ |z − z | · 2 ,
n
zn z |z| · |zn |
|z|2
und damit wird die Differenz
1
zn
−
1
z
für große n beliebig klein.
(vii) Sei zunächst z > 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z die Existenz von
N ∈ N, sodass für n ≥ N sicher zn > 2z > 0 und |zn − z| < ǫ. Gemäß (2.8) gilt für
solche n, da klarerweise auch z > 2z ,
√
√
|zn − z|
| k zn − k z| = √ k−1 √ k−2 √
≤
√
√
√
k
| kz + kz
zn + . . . + k zn k−2 k z + k zn k−1 |
|
pk z k−1
pk z k−2 pk z
|zn − z|
+ 2
2 +...+
√k
√k
Gemäß (3.6) folgt zn → z.
2
pk z k−2 pk z
2
2
ǫ
pk z k−1 < pk z k−1 .
+ 2 | k 2
Ist z = 0, so sei ǫ > 0 vorgegeben. Ist nun N ∈ N so, dass zn = |zn − 0| < ǫ k für
n ≥ N, dann folgt aus der Monotonie der Wurzelfunktion (vgl. Bemerkung 2.7.6)
√
√
√
| k zn − 0| = k zn < ǫ. Also k zn → 0.
❑
3.3.6 Beispiel.
√
(i) Die Folge xn = n n konvergiert gegen 1: Setze an := xn − 1, dann ist an ≥ 0 und
(1 + an )n = n. Nach dem Binomischen Lehrsatz gilt
!
n
X
n(n − 1) 2
n k n−k
an .
n = (an + 1)n =
an 1 ≥ 1 +
2
k
k=0
2(n−1)
Damit folgt a2n ≤ n(n−1)
= 2n → 0. Daraus folgt nach Satz 3.3.4, (vii), dass an → 0
und damit xn → 1 für n → ∞.
√
den Fall q > 1. Dann
(ii) Ist q > 0 fest, so gilt limn→∞ n q = 1. Betrachte zunächst
√
√
√
√n
gilt stets q ≥ 1. Für n hinreichend groß gilt n q ≤ n n. Also folgt n q → 1. Der
Fall q = 1 ist klar. Im Fall 0 < q < 1 betrachte √n1q .
3.4 Existenz von Grenzwerten
Bisher haben wir zwar gesehen, was aus der Konvergenz einer oder mehrerer Folgen
folgt. Die Problem, ob eine gegebene Folge konvergiert oder nicht haben wir jedoch
nicht betrachtet.
Wir wollen als erstes eine Methode angeben um auf Konvergenz einer reellen Zahlenfolge zu schließen. Diese Eigenschaft ist von herausragender Bedeutung.
Tatsächlich spiegelt sie genau die definierende Eigenschaft von R vollständig angeordnet zu sein wieder.
3.4. EXISTENZ VON GRENZWERTEN
63
3.4.1 Definition. Eine Folge (an )n∈N in R heißt monoton, wenn entweder
a1 ≤ a2 ≤ a3 ≤ . . . (monoton wachsend)
oder
a1 ≥ a2 ≥ a3 ≥ . . . (monoton fallend)
gilt.
3.4.2 Satz. Sei (xn )n∈N eine monoton wachsende und nach oben beschränkte Folge.
Dann konvergiert (xn )n∈N gegen sup{xn : n ∈ N}. Entsprechend konvergiert eine monoton fallende und nach unten beschränkte Folge (xn )n∈N gegen inf{xn : n ∈ N}.
Beweis. Sei (xn )n∈N monoton wachsend und nach oben beschränkt. Definiere x :=
sup{xn : n ∈ N}. Wir zeigen, dass limn→∞ xn = x. Sei ǫ > 0. Da x − ǫ < x, kann
x − ǫ keine obere Schranke der Menge {xn : n ∈ N} sein. Es gibt also ein N ∈ N mit
xN > x − ǫ. Wegen der Monotonie folgt auch xn > x − ǫ für alle n ≥ N. Da stets x ≥ xn
gilt, erhält man für n ≥ N
0 ≤ x − xn < ǫ,
also |xn − x| < ǫ.
Ist die Folge (xn )n∈N monoton fallend und nach unten beschränkt, so setze
x := inf{xn : n ∈ N} und schließe in analoger Art und Weise.
❑
3.4.3 Beispiel.
Man betrachte die Folge 1n
. Aus Beispiel 2.6.2 wissen wir, dass inf{ 1n : n ∈
n∈N
N} = 0. Also folgt aus obigem Satz, dass limn→∞ n1 = 0. Das haben wir aber auch
schon in Beispiel 3.2.4, (ii), festgestellt.
Die Bedingung in Satz 3.4.2 ist hinreichend
n für Konvergenz, aber nicht notwendig. Betrachte zum Beispiel die Folge (−1)
.
n
n∈N
Um in allgemeinen metrischen Räumen Folgen auf Konvergenz zu untersuchen,
führt man den Begriff der Cauchy-Folge ein.
3.4.4 Definition. Sei hX, di ein metrischer Raum, und sei (xn )n∈N eine Folge von Elementen von X. Diese Folge heißt Cauchy-Folge5, , falls
∀ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle n, m ≥ N.
Ähnlich wie in Proposition 3.2.15 gilt.
3.4.5 Proposition. Sei (xn )n∈N eine Cauchy-Folge. Dann ist {xn : n ∈ N} beschränkt.
Beweis. Wähle N ∈ N mit d(xn , xm ) < 1 für n, m ≥ N. Setzt man
M := 1 + max{d(x1 , xN ), . . . , d(xN−1 , xN )} ,
so erhält man, dass d(xn , xN ) ≤ M für jedes n ∈ N.
❑
Aus dem nächsten Resultat erkennt man einen Zusammenhang zum Begriff der
Konvergenz.
5 Augustin
Louis Cauchy. 21.8.1789 Paris - 22.5.1857 Sceaux (bei Paris)
64
KAPITEL 3. DER GRENZWERT
3.4.6 Proposition. Ist die Folge (xn )n∈N konvergent, so ist sie eine Cauchy-Folge.
Beweis. Sei ǫ > 0 gegeben. Aus der Definition der Konvergenz folgt die Existenz
einer Zahl N ∈ N mit der Eigenschaft, dass d(xn , x) < 2ǫ , n ≥ N. Hier bezeichnet
x den Grenzwert der Folge (xn )n∈N , der zwar nach Voraussetzung existiert, über den
sonst aber nichts bekannt zu sein braucht. Dann gilt nach der Dreiecksungleichung für
n, m ≥ N
ǫ ǫ
d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < + = ǫ.
2 2
❑
Also ist jede konvergente Folge eine Cauchy-Folge. Würde nun umgekehrt jede
Cauchy-Folge konvergieren, so könnten wir die Konvergenz einer Folge nachweisen,
ohne ihren Grenzwert explizit in der Hand zu haben. Leider ist dies bei vielen metrischen Räumen nicht der Fall.
3.4.7 Definition. Ein metrischer Raum hX, di heißt vollständig, wenn jede CauchyFolge von Elementen aus X in X einen Grenzwert besitzt.
3.4.8 Beispiel. Die rationalen Zahlen sind nicht vollständig. Dazu betrachte man z.B.
eine
√ Folge (rn )n∈N bestehend aus rationalen Zahlen wie in Beispiel 3.2.6, die gegen
2 ∈ R \ Q konvergiert.
Diese ist eine Cauchy-Folge in R und daher auch in Q. Sie konvergiert
aber nicht
√
in Q. Denn würde sie das tun, so würde sie in R einerseits gegen 2 und andererseits gegen einen Grenzwert in Q konvergieren. Das widerspricht der Eindeutigkeit des
Grenzwertes in R.
3.4.9 Lemma. Sei (xn )n∈N eine Cauchy-Folge in einem metrischen Raum hX, di, die
eine konvergente Teilfolge hat. Dann ist (xn )n∈N konvergent.
Proof. Sei (xn(k) )k∈N die konvergente Teilfolge mit limk→∞ xn(k) = x. Ist ǫ > 0 gegeben, so wähle N1 so groß, dass d(xn , xm ) < ǫ für n, m ≥ N1 . Wähle N2 so groß, dass
d(xn(k) , x) < ǫ für k ≥ N2 . Setze N := max{N1 , N2 }. Wählt man nun k ≥ N, so folgt
n(k) ≥ k ≥ N, und man erhält für n ≥ N:
d(xn , x) ≤ d(xn , xn(k) ) + d(xn(k) , x) < ǫ + ǫ = 2ǫ.
Das wichtigste Beispiel für einen vollständige metrischen Raum sind die reellen
Zahlen:
3.4.10 Satz (Cauchysches Konvergenzkriterium). Sei (xn )n∈N eine Cauchy-Folge reeller Zahlen. Dann existiert eine reelle Zahl x, sodass (xn )n∈N gegen x konvergiert.
Beweis. Jede Folge (an )n∈N hat eine monotone Teilfolge (an(k) )k∈N .
Wir sagen die Folge (an )n∈N besitzt beim Index k eine Spitze, falls ak ≥ an für
alle n ≥ k. Wenn es unendlich viele Spitzen gibt, bilden sie eine monoton fallende
Teilfolge6 .
Gibt es keine oder nur endlich viele Spitzen, so kann man einen Index k finden,
sodass ab diesem Index keine Spitzen mehr auftreten. Setze n(1) = k + 1. Da n(1) keine
6 Genau genommen muss man eine monoton wachsende Abbildung n : N → N, die als Bild genau die
Menge aller Spitzen hat, konstruieren. Das lässt sich mit Hilfe des Rekursionssatzes bewerkstelligen.
3.5. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN
65
Spitze ist, existiert n(2) > n(1) mit an(2) > an(1) . Wieder kann n(2) keine Spitze sein,
und daher muss n(3) existieren mit an(3) > an(2) . Verfährt man induktiv so weiter, erhält
man eine monoton wachsende Teilfolge7 .
Sei nun (xn )n∈N eine Cauchy-Folge. Dann ist (xn )n∈N beschränkt. Nach dem eben
gezeigten kann man eine monotone Teilfolge wählen, welche natürlich ebenfalls
beschränkt ist. Nach Satz 3.4.2 ist diese Teilfolge konvergent, und nach Lemma 3.4.9
daher auch die Folge (xn )n∈N selbst konvergent.
❑
3.4.11 Beispiel.
Der metrische Raum X = [0, 1] versehen mit der euklidischen Metrik ist auch
vollständig, denn ist (xn )n∈N eine Cauchy-Folge in X, so ist sie das auch in R.
Wegen Satz 3.4.10 gilt limn→∞ xn = x für ein x ∈ R.
Da immer 0 ≤ xn ≤ 1 folgt aus Lemma 3.3.1, (iii), dass auch x ∈ X. Also hat
jede Cauchy-Folge in X einen Grenzwert in X.
Ist dagegen etwa X = (0, 1] versehen mit der euklidischen Metrik, so ist n1
n∈N
eine
Cauchy-Folge in X. Sie hat aber in X keinen Grenzwert, denn sonst würde
1
n n∈N auch in R gegen diesen Grenzwert x ∈ X ⊆ R und andererseits gegen 0
streben. Wegen 0 < X muss x , 0 im Widerspruch zu Satz 3.2.9, (i).
3.5 Konvergenz in weiteren metrischen Räumen
Wir betrachten zunächst als Menge R p (p ∈ N) und versehen diesen mit den drei
schon vorgestellten Metriken d1 , d2 , d∞ . Wie bereits bemerkt, unterscheiden sich diese
Metriken voneinander.
Der Unterschied ist aber nicht allzu groß. In der Tat werden wir sehen, dass wenn
eine Folge bezüglich einer der Metriken konvergiert, dann auch bezüglicher der anderen konvergiert.
Der Grund dafür liegt in der Ungleichungskette
max {|xk |} ≤
k=1,...,p
p
X
k=1
|xk |2
12
≤
p
X
k=1
|xk | ≤ p · max {|xk |} .
k=1,...,p
(3.8)
Das zweite ≤“ sieht man durch quadrieren. Das erste und dritte ist klar.
”
Es sei aber hier auch darauf hingewiesen, dass es auf ein und der selben Menge Metriken d, d̃ geben kann, sodass eine gewissen Folge (xn )n∈N in dieser Menge bezüglich
d konvergiert, aber bezüglich d̃ divergiert.
3.5.1 Proposition. Sei (xn )n∈N eine Folge von Punkten xn = (xn,1 , . . . , xn,p ) ∈ R p , und
y = (y1 , . . . , y p ) ∈ R p . Dann impliziert limn→∞ xn = y bezüglich einer der Metriken d1 ,
d2 , d∞ auch limn→∞ xn = y bezüglich der anderen zwei Metriken aus d1 , d2 , d∞ .
Die Konvergenz von (xn )n∈N gegen y bezüglich einer und daher aller dieser Metriken ist wiederum äquivalent zur komponentenweisen Konvergenz 8
lim xn,k = yk für alle k = 1, . . . , p .
n→∞
7 Dass
man so verfahren kann, wird durch den Rekursionssatz gewährleistet.
Konvergenz versteht sich in R bezüglich der euklidischen Metrik.
8 Diese
(3.9)
KAPITEL 3. DER GRENZWERT
66
Beweis. Aus Ungleichung (3.8) schließen wir
d∞ (xn , x) ≤ d2 (xn , x) ≤ d1 (xn , x) ≤ p · d∞ (xn , x).
Ist nun limn→∞ xn = y bezüglich d∞ , so gibt es zu ǫ > 0 ein N ∈ N, sodass d∞ (xn , x) <
ǫ, n ≥ N. Nach der letzten Ungleichung bedingt das d1 (xn , x) < p · ǫ, n ≥ N, woraus
limn→∞ xn = y bezüglich d1 folgt (siehe (3.6)).
Fast genauso schließt man daraus auf die Konvergenz bezüglich d2 , und daraus
wiederum auf die bezüglich d∞ .
Sei nun limn→∞ xn = y bezüglich bezüglich einer dieser Metriken und daher insbesondere bezüglich d∞ . Ist ǫ > 0 gegeben, so gibt es ein N ∈ N, sodass
max {|xn,k − yk |} = d∞ (xn , y) < ǫ, n ≥ N .
k=1,...,p
Insbesondere gilt für jedes k = 1, . . . , p, dass |xn,k − yk | < ǫ, n ≥ N, und somit
limn→∞ xn,k = yk .
Sei umgekehrt (3.9) vorausgesetzt und ǫ > 0 gegeben. Wähle N1 , . . . , N p , sodass
für k = 1, . . . , p folgt |xn,k − yk | < ǫ, n ≥ Nk . Setzt man N := max{N1 , . . . , N p }, so folgt
d∞ (xn , y) = max {|xn,k − yk |} < ǫ .
k=1,...,p
Also gilt xn → y bezüglich d∞ .
❑
3.5.2 Beispiel. Man betrachte die Folge (xn )n∈N im R3 gegeben durch


n
X
1 
1 
n
xn = · (−1) , 2 − 3n,
.
n
2k 
k=0
P
Wegen | n1 · (−1)n | = 1n → 0 und 1n · nk=0 21k ≤ n2 → 0 konvergieren die erste und die
dritte Komponente gegen 0.
Die zweite konvergiert wegen n1 (2 − 3n) = 2n − 3 gegen −3. Also konvergiert unsere
Folge bezüglich d1 , d2 , d∞ gegen (0, −3, 0).
Die nächste Aussage setzt inhaltlich die Bemerkung 3.3.5 fort.
3.5.3 Korollar. Sei (zn )i∈N eine Folge komplexer Zahlen und z ∈ C. Dann gilt
limn→∞ zn = z genau dann, wenn
lim Re(zn ) = Re z und lim Im(zn ) = Im z .
n→∞
n→∞
Beweis. Das ist gerade die Aussage von Proposition 3.5.1 für den R2 und die
euklidische Metrik.
❑
3.5.4 Korollar. Der Raum R p versehen mit einer der Metriken d1 , d2 , d∞ ist
vollständig. Insbesondere sind die komplexen Zahlen vollständig.
Beweis. Zunächst sei bemerkt, dass wenn eine Folge (xn )n∈N von Punkten des R p eine
Cauchy-Folge bezüglich einer der Metriken d1 , d2 , d∞ ist, so ist sie das bezüglich aller
dieser Metriken. Das folgt aus (3.8) ganz ähnlich der entsprechenden Aussage über die
Konvergenz wie am Anfang des Beweises von Proposition 3.5.1.
3.5. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN
67
Sei nun (xn )n∈N eine Cauchy-Folge von Punkten des R p (bzgl. d1 , d2 , d∞), xn =
(xn,1 , . . . , xn,p ). Dann gibt es zu jedem vorgegebenen ǫ > 0 eine Zahl N ∈ N mit
d∞ (xn , xm ) < ǫ für n, m ≥ N. Es folgt für jedes k ∈ {1, . . . , p}
|xn,k − xm,k | ≤ d∞ (xn , xm ) < ǫ, n, m ≥ N ,
d.h. jede der Folgen (xn,k )n∈N , k = 1, . . . , p, ist eine Cauchy-Folge reeller Zahlen. Daher
existieren y1 , . . . , y p ∈ R mit
lim xi,k = yk , k = 1, . . . , p .
i→∞
Wegen Proposition 3.5.1 folgt limn→∞ xn = y mit y = (y1 , . . . , y p ).
❑
3.5.5 Bemerkung. Die in Satz 3.3.4 hergeleiteten Rechenregeln gelten zum Teil auch
in R p , wenn R p mit der euklidischen Metrik und mit den Verknüpfungen +“ und
”
skalares Multiplizieren“ wie aus der Linearen Algebra bekannt versehen wird. Sind
”
also (xn )n∈N , (yn )n∈N Folgen in R p , die gegen x bzw. y konvergieren, und ist (λn )n∈N
eine gegen ein λ ∈ R konvergente Folge in R, so gilt
(i) limn→∞ (xn + yn ) = x + y.
(ii) limn→∞ λn xn = λx.
(iii) limn→∞ (xn , yn ) = (x, y) (∈ R) (vgl. (3.2)).
Das folgt aus Proposition 3.5.1, da man die jeweiligen Konvergenzen auf die Komponenten von R p zurückführen kann. Eine andere Möglichkeit, diese Behauptungen zu
p
beweisen, besteht darin, den euklidischen
qPAbstand d2 (x, y) zweier Punkte x, y ∈ R als
p
2
kx − yk2 zu schreiben, wobei kxk2 =
k=1 |xk | , und im Beweis von Satz 3.3.4 den
Betrag durch k.k ersetzt. Siehe Bemerkung 3.1.7.
Dass es auf ein und derselben Menge zwei Metriken geben kann, sodass die Konvergenz einer Folge bezüglich der einen Metrik nicht die Konvergenz bezüglich der
anderen bedingt, zeigt folgendes Beispiel.
3.5.6 Beispiel. Man betrachte R einerseits versehen mit der Euklidischen Metrik d2 , also die von |.| induzierte Metrik, und andererseits mit der diskreten Metrik d aus Beispiel
3.1.5, (iii).
Außerdem betrachte man die Folge n1 n∈N , welche bekannterweise gegen 0 konvergiert. Bezüglich d tut sie das nicht, da ja immer d(0, 1n ) = 1, n ∈ N.
Man zeigt unschwer, dass eine Folge (xn )n∈N bezüglich d genau dann gegen x konvergiert, wenn xn = x ab einem Index n0 .
3.5.7 Beispiel. Sei p eine feste Primzahl. Die Folge (pn )n∈N ist bezüglich der Metrik d(p) auf Z gegen 0 konvergent, bezüglich
der euklidischen Metrik d2 auf Z jedoch divergent. Um das einzusehen, sei ǫ > 0 gegeben. Wählt man N ∈ N mit p1N < ǫ,
so gilt für alle n ≥ N
1
1
d(p) (pn , 0) = n ≤ N < ǫ .
p
p
Angenommen es existiere x ∈ Z, sodass pn → x bezüglich d2 . Wähle N ∈ N, sodass d2 (pn , x) < 1, n ≥ N. Dann folgt mit
der Bernoullischen Ungleichung
1 + n(p − 1) ≤ pn = d2 (pn , 0) ≤ d2 (pn , x) + d2 (x, 0) < 1 + |x|, n ≥ N ,
und weiter, dass n(p − 1) ≤ |x|, n ≥ N, was der Tatsache widerspricht, dass R archimedisch angeordnet ist.
Tatsächlich sind in hZ, d2 i nur die ab einem Index konstanten Folgen konvergent. Denn ist xi → x, und wählt man
N ∈ N mit |xi − x| < 21 , i ≥ N, so folgt xi = x, i ≥ N, da zwei verschiedene ganze Zahlen sicher einen Abstand von
mindestens 1 haben.
KAPITEL 3. DER GRENZWERT
68
3.6 Konvergenz gegen unendlich
Betrachte die Folge reeller Zahlen xn = n, n ∈ N. Ist diese konvergent? Nein, denn
sie ist ja nicht einmal beschränkt. Trotzdem zeigt sie ein doch recht determiniertes
Verhalten. Sie strebt gegen unendlich“. Wir wollen jetzt genau definieren, was es heißt,
”
dass eine Folge (xn )n∈N in R gegen +∞ strebt (xn → +∞):
∀M > 0 ∃N ∈ N : xn > M für n ≥ N .
(3.10)
Diese Bedingung besagt, dass jede vorgegebene Schranke ab einem Index überschritten
wird. Entsprechend sagen wir, dass eine Folge (xn ) in R gegen −∞ strebt (xn → −∞),
wenn
∀M < 0 ∃N ∈ N : xn < M für n ≥ N .
(3.11)
Folgen, die im obigen Sinne gegen +∞ oder −∞ streben, heißen auch bestimmt divergent.
3.6.1 Bemerkung. Ist (xn )n∈N in R und x ∈ R oder x = ±∞, so kann man x = limn→∞ xn
einheitlich folgendermaßen schreiben:
(∀ξ ∈ R, ξ < x ∃N ∈ N : ∀n ≥ N ⇒ xn > ξ) ∧
(∀η ∈ R, η > x ∃N ∈ N : ∀n ≥ N ⇒ xn < η).
Für diese Konvergenzbegriffe gelten ähnliche Regeln, wie bei der Konvergenz gegen Zahlen.
3.6.2 Satz. Seien (xn )n∈N und (yn )n∈N Folgen, sodass limn→∞ xn = +∞. Es gelten folgende Aussagen
(i) Ist yn ≥ C für ein gewisses C ∈ R und für alle n ∈ N, n ≥ K mit einem gewissen
K ∈ N, d.h. die Menge {yn : n ∈ N, n ≥ K} ist nach unten beschränkt, dann gilt
auch
lim (xn + yn ) = +∞.
n→∞
(ii) limn→∞ (−xn ) = −∞.
(iii) Ist yn ≥ C für ein gewisses C > 0 und für alle n ∈ N, n ≥ K mit einem gewissen
K ∈ N, so gilt limn→∞ xn yn = +∞.
(iv) Ist xn ≤ yn , für alle n ∈ N, n ≥ K für einen gewissen Index K ∈ N, so folgt
limn→∞ yn = +∞.
(v) Seien alle bis auf endlich viele, d.h. alle ab einem Index K ∈ N, yn positiv (negativ). Dann gilt limn→∞ yn = +∞ (−∞) genau dann, wenn limn→∞ y1n = 0.
(vi) Sei (yn )n∈N monoton wachsend (fallend). Ist (yn )n∈N beschränkt, so ist diese Folge
konvergent gegen eine reelle Zahl. Ist (yn )n∈N unbeschränkt, so konvergiert sie
gegen +∞ (−∞).
Analoge Aussagen gelten im Fall limn→∞ xn = −∞.
Beweis.
3.6. KONVERGENZ GEGEN UNENDLICH
69
(i) Sei M > 0 gegeben. Wählt man N so groß, dass xn ≥ M − C, n ≥ N, und sodass
N ≥ K, so folgt für n ≥ N auch
xn + yn ≥ (M − C) + C = M,
also ist (xn + yn ) → +∞.
(ii) Folgt unmittelbar aus xn > M ⇔ −xn < −M.
(iii) Wähle N so, dass xn ≥
auch
M
C
für n ≥ N und sodass N ≥ K. Dann folgt für n ≥ N
xn yn ≥
M
· C = M,
C
d.h. xn yn → +∞.
(iv) Ist xn ≥ M, so erst recht yn ≥ M.
(v) Nun nehmen wir zuerst an, dass x1n → 0. Ist M vorgegeben, so wähle N ≥ K so
groß, dass für n ≥ N gilt x1n < M1 . Es folgt xn ≥ M.
Gilt xn → +∞, und ist ǫ > 0, so wähle N so groß, dass für n ≥ N gilt xn > 1ǫ .
Daraus ersieht man | x1n | = x1n < ǫ.
(vi) Ist (yn )n∈N beschränkt, so folgt die Aussage aus Satz 3.4.2. Im Fall der Unbeschränktheit gibt es eben wegen dieser zu jedem M > 0 ein N ∈ N, sodass
yN > M. Wegen der Monotonie folgt dann auch yn > M, n ≥ N
❑
3.6.3 Beispiel. Sei q ∈ R und betrachte die Folge qn , n ∈ N. Dann gilt



+∞






1
lim qn = 


n→∞
0





∄
,
,
,
,
q>1
q=1
−1 < q < 1
q ≤ −1
Dabei haben wir den Fall 0 ≤ q < 1 schon in Beispiel 3.2.10 behandelt. Der Fall
q = 1 ist klar. Für q > 1 folgt aus 0 < 1q < 1 durch Anwendung von Satz 3.6.2,
dass qn → +∞. Ist −1 < q < 0, so beachte |qn | = |q|n → 0. Ist q ≤ −1, so hat man
qn ≥ 1 für n gerade und qn ≤ −1 für n ungerade. Insbesondere ist der Abstand zweier
aufeinanderfolgender Folgenglieder ≥ 2, und wir sehen, dass qn keine Cauchy-Folge
und erst recht keine konvergente Folge sein kann. Konvergenz gegen +∞ oder −∞
kann aber auch nicht stattfinden, denn dann müssten ja die Folgenglieder insbesondere
ab einem Index alle das gleiche Vorzeichen haben.
3.6.4 Beispiel. Seien p, q ∈ R[x], p, q , 0, zwei Polynome. Betrachte die Folge
xn :=
p(n)
, n ∈ N, q(n) , 0 .
q(n)
KAPITEL 3. DER GRENZWERT
70
R
−∞
+∞
Abbildung 3.1: Veranschaulichung von R
Beachte hier, dass q(n) für höchstens endlich viele Werte von n verschwinden kann,
also ist ab einem gewissen Index sicher stets q(n) , 0. Schreibe p und q als p(x) =
am xm + . . . + a0 , q(x) = bk xk + . . . + b0 , mit am , bk , 0 an. Dann gilt



0
, m<k




am


, m=k
 bk
lim xn = 


n→∞
+∞
, m > k, abmk > 0





−∞ , m > k, am < 0
bk
Um dieses einzusehen, betrachte zuerst den Fall, dass m ≤ k, und schreibe
xn =
am nm + am−1 nm−1 + . . . + a0 am nm−k + am−1 nm−1−k + . . . + a0 n−k
=
.
bk nk + bk−1 nk−1 + . . . + b0
bk + bk−1 n−1 + . . . + b0 n−k
Dann konvergiert der Nenner dieses Bruches gegen bk , 0. Ist m < k, so konvergiert
der Zähler gegen 0, insgesamt also xn → 0. Ist m = k, so strebt der Zähler gegen am
und wieder folgt unsere Behauptung.
Ist m > k, so schreiben wir xn als
nm−k
am + am−1 n−1 + . . . + a0 n−m
.
bk + bk−1 n−1 + . . . + b0 n−k
Also gilt xn = nm−k yn , wobei yn → abmk . Nach Lemma 3.3.1 hat yn für hinreichend große
Indizes dasselbe Vorzeichen, wie abmk . Da x1n → 0 folgt aus Satz 3.6.2 das behauptete
Konvergenzverhalten für xn .
Am Ende diese Kapitels wollen wir eine Möglichkeit vorstellen, wie man die eingeführte Konvergenz gegen ±∞ als
herkömmliche Konvergenz in einem metrischen Raum auffassen kann.
Als erstes müssen wir ±∞ als Elemente unseres Raumes anerkennen, denn eine Folge von Elementen eines Raumes X
kann gegen ein Element von X konvergieren aber nicht gegen irgendetwas. Betrachte also die Menge R = R ∪ {+∞, −∞},
wobei +∞ und −∞ zwei verschiedene formale Elemente sind, die nicht in R liegen.
Nun versehen wir die Menge R in naheliegender Weise mit einer Relation:
x ≤ y : ⇐⇒ (x ≤ y, x, y ∈ R) oder x = −∞ oder y = +∞ .
Diese Relation ist offensichtlicherweise eine Totalordnung, die die Supremumseigenschaft hat. Somit lässt sich R folgendermaßen veranschaulichen.
x
3.6.5 Lemma. Die Funktion φ : R → (−1, 1), wobei φ(x) = 1+|x|
, bildet R bijektiv auf das offene Intervall (−1, 1) ab. Ihre
y
−1
−1
Inverse φ : (−1, 1) → R ist gegeben durch φ (y) = 1−|y| .
Schließlich sind φ und ihre Inverse φ−1 streng monoton wachsend.
Beweis. Als erstes wollen wir festhalten, dass für x ∈ R stets |φ(x)| < 1, d.h. φ(x) ∈ (−1, 1) gilt, und dass φ(x) das gleiche
Vorzeichen wie x hat.
y
Ist ψ : (−1, 1) → R definiert durch ψ(y) = 1−|y|
, so folgt
φ ◦ ψ(y) =
1
und
ψ ◦ φ(x) =
1
y
1−|y|
|y|
+ 1−|y|
=
y
= y,
(1 − |y|) + |y|
x
1+|x|
|x|
− 1+|x|
=
x
= x.
(1 + |x|) − |x|
3.6. KONVERGENZ GEGEN UNENDLICH
71
Somit ist nach Satz 1.2.18 die Abbildung φ bijektiv und ψ ist die Inverse von φ.
Zur behaupteten Monotonieeigenschaft: Sind x1 , x2 ∈ R mit x1 = 0 ∨ x2 = 0 ∨ sgn(x1 ) = sgn(x2 ), so gilt dann wegen
x1 |x2 | = |x1 |x2
x1 < x2 ⇔ x1 (1 + |x2 |) = x1 + x1 |x2 | < x2 + x2 |x1 | = x2 (1 + |x1 |) ⇔ φ(x1 ) < φ(x2 ).
Da x und φ(x) dasselbe Vorzeichen haben, folgt für den verbleibenden Fall, dass x1 , x2 , 0, sgn(x1 ) = − sgn(x2 ), wobei
o.B.d.A. x1 < x2 , dass sowohl x1 < 0 < x2 als auch φ(x1 ) < 0 < φ(x2 ).
❑
Nun setzten wir φ fort zu einer Abbildung R → [−1, 1], indem wir
 x




 1+|x|
φ(x) := 
1



−1
definieren.
, x∈R
, x = +∞
, x = −∞
+∞
φ
R
[−1, 1]
φ−1
−∞
Abbildung 3.2: Die Abbildung φ
Offensichtlicher ist diese Fortsetzung, die wir ebenfalls φ nennen wollen, auch bijektiv und streng monoton wachsend,
wobei
 y

, −1 < y < 1



 1−|y|
−1
φ (y) := 
.
+∞
, y=1



−∞ , y = −1
Wir definieren nun eine Metrik auf R, indem wir die euklidische Metrik mittels φ nach R übertragen.
3.6.6 Definition. Definiere eine Abbildung d : R × R → R als
d(x, y) := φ(x) − φ(y) .
3.6.7 Lemma. Die Abbildung d ist eine Metrik.
Dabei konvergiert eine Folge (xn )n∈N in R gegen ein x ∈ R bezüglich d genau dann, wenn die Folge (φ(xn ))n∈N in
[−1, 1] gegen φ(x) ∈ [−1, 1] bezüglich der euklidischen Metrik d2 konvergiert.
Beweis. Da die Abbildung (a, b) 7→ |a − b| eine Metrik ist und φ injektiv, folgen die verlangten Eigenschaften (M1)-(M3)
von d: Setze a := φ(x), b := φ(y), dann gilt
(M1):
d(x, y) = |a − b| ≥ 0, und d(x, y) = 0 genau dann, wenn a = b. Da φ injektiv ist, ist dieses äquivalent dazu das x = y.
(M2):
d(x, y) := |a − b| = |b − a| = d(y, x)
(M3):
Sei zusätzlich z ∈ R und setze c := φ(z). Dann ist
d(x, z) = |a − c| ≤ |a − b| + |b − c| = d(x, y) + d(y, z) .
Die Aussage über die Konvergenz folgt leicht aus Bemerkung 3.2.3, da
xn → x (bzgl. d) ⇔ d(xn , x) = d2 (φ(xn ) → 0 ⇔ φ(xn ) → φ(x) (bzgl. d2 ).
KAPITEL 3. DER GRENZWERT
72
❑
Wir wissen jetzt also, was es bedeutet, dass eine Folge reeller Zahlen in hR, di gegen +∞ bzw. −∞ konvergiert. Haben
wir unser Modell nun richtig in dem Sinne gebaut, dass dieser Begriff von Konvergenz gegen ±∞ tatsächlich mit dem
eingangs eingeführten Begriff von Konvergenz gegen ±∞ übereinstimmt?
3.6.8 Proposition. Sei (xn )n∈N eine Folge reeller Zahlen. Dann gilt limn→∞ xn = +∞ im Sinne einer Konvergenz im metrischen Raum hR, di genau dann, wenn (3.10) gilt. Analog gilt limn→∞ xn = −∞ in hR, di genau dann, wenn (3.11) gilt.
Bleibt die Folge weg von ±∞, so bleibt unser alter Konvergenzbegriff reeller Zahlen erhalten: Sei x ∈ R, dann gilt
limn→∞ xn = x in hR, di genau dann, wenn limn→∞ xn = x in R bezüglich der euklidischen Metrik d2 .
Beweis. Sei nun vorausgesetzt, dass xn → +∞ in hR, di, und sei M > 0 gegeben. Setze ǫ := 1 − φ(M) > 0, und wähle N ∈ N
mit d(xn , +∞) < ǫ, n ≥ N. Dann ist
1 − φ(xn ) = |φ(xn ) − 1| = d(xn , +∞) < ǫ = 1 − φ(M) ,
und daher φ(M) < φ(xn ), also xn > M.
Gelte umgekehrt (3.10), und sei 0 < ǫ < 1 gegeben. Setze M := φ−1 (1 − ǫ) > 0, und wähle N ∈ N so, dass xn > M für
n ≥ N. Dann folgt
d(xn , +∞) = |φ(xn ) − 1| = 1 − φ(xn ) < 1 − φ(M) = ǫ, n ≥ N .
Wir sehen, dass xn → +∞ in hR, di äquivalent zu (3.10) ist. Die Behauptung für xn → −∞ sieht man genauso.
Sei nun x ∈ R, und xn → x in R bezüglich d2 . Dann folgt, wegen unserer Rechenregeln für Folgen, Satz 3.3.4, dass
auch φ(xn ) → φ(x). Wegen Lemma 3.6.7 erhalten wir xn → x in hR, di.
Gelte nun xn → x in hR, di, d.h. φ(xn ) → φ(x) in R (Lemma 3.6.7). Die Abbildung φ−1 ist von der gleichen Gestalt
wie φ, und wir schließen wieder wegen unserer Rechenregeln für Folgen, dass xn = φ−1 (φ(xn )) → φ−1 (φ(x)) = x in R
bezüglich d2 .
❑
Wir haben nun unser Zahlensystem etwas erweitert, um den Begriff des Strebens gegen unendlich“ als Konvergenz in
”
metrischen Räumen interpretieren zu können. Wir haben dabei jedoch auch sehr viel verloren, nämlich unsere algebraischen
Operationen + und ·. Gemäß Satz 3.6.2 macht es zwar Sinn
x + (+∞) = +∞, −(+∞) = −∞, y(+∞) = +∞,
1
= 0, usw.
±∞
für x, y ∈ R, y > 0 zu setzen, damit die Operationen mit den Grenzwertregeln verträglich bleiben. Aber wie sollte man z.B.
+∞ + (−∞) oder 0 · (+∞) definieren?
Als einfachstes Beispiel betrachte man[!ht] xn = 2n, yn = n. Es gilt xn , yn → +∞. Es gilt aber xn − yn = n → +∞, was
auf (+∞) − (+∞) = +∞“ deuten würde, wogegen yn − xn = −n → −∞, also (+∞) − (+∞) = −∞“.
”
”
3.7 Unendliche Reihen
Wir sind schon einmal einer Folge (S n )n∈N begegnet, die von der speziellen Gestalt
P
S n = nk=0 ak mit gewissen Zahlen ak war, nämlich der geometrischen Reihe S n =
1
1 + z + . . .+ zn mit |z| < 1. Wir haben gezeigt, dass diese Folge gegen den Grenzwert 1−z
Pn k
konvergiert. Das heißt also, dass für große Werte von n die Summe k=0 z den Wert
1
1−z beliebig gut approximiert. Es ist also naheliegend zu schreiben
X
1
=
zk .
1 − z k=0
∞
3.7.1 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen.
Allgemeiner kann (ak )k∈N auch eine Folge von Elementen eines metrischen Raumes sein, auf dem man eine Verknüpfung + hat; zum Beispiel Vektoren des R p ).
Bezeichne mit S n , n ∈ N die n-te Partialsumme
S n := a1 + a2 + . . . + an .
Die Folge (S n )n∈N heißt dann die unendliche Reihe mit den Summanden ak .
3.7. UNENDLICHE REIHEN
73
Hat die Folge (S n )n∈N einen Grenzwert, so sagen wir die Reihe sei konvergent. In
diesem Fall nennen wir ihren Grenzwert lim S n die Summe der (unendlichen) Reihe
n→∞
und benützen die Schreibweise
∞
X
ak := lim S n .
n→∞
k=1
Falls der Grenzwert lim S n nicht existiert heißt die Reihe divergent.
n→∞
Um die Notation zu vereinfachen, benützt man die Schreibweise
∞
P
Reihe (S n )n∈N selbst, und sagt dann
Ausdrücke, wie etwa
∞
P
∞
P
ak auch für die
k=1
ak sei konvergent oder divergent.
k=1
ak haben eine analoge Interpretation durch Grenzwerte
k=6
von Partialsummen.
3.7.2 Bemerkung.
(i) Gilt lim S n = +∞ bzw. = −∞ so heißt die Reihe konvergent gegen +∞ bzw. −∞
n→∞
(man sagt auch bestimmt divergent gegen +∞ bzw. −∞) und schreibt
∞
X
ak = +∞ bzw.
k=1
∞
X
k=1
ak = −∞.
(ii) Eine unendliche Reihe ist per definitionem die Folge ihrer Partialsummen, d.h. die Theorie der Reihen ist ein Spezialfall jener der Folgen. Umgekehrt kann man auch jede Folge als Folge der Partialsummen einer Reihe auffassen:
Ist (cn )n∈N irgendeine Folge, so setze
a1 := c1 , a2 := c2 − c1 , a3 := c3 − c2 , . . . , ak := ck − ck−1 , . . . .
Dann gilt cn =
n
P
ak .
k=1
Auf Grund der Definition einer unendlichen Reihe als Limes ihrer Partialsummen
können wir Aussagen über Folgen sofort auf Reihen übertragen.
3.7.3 Korollar. Sind
∞
P
ak , und
bk konvergent, so ist auch
∞  ∞ 
∞
X
X  X 
(ak + bk ) =  ak  +  bk  .
k=1
P∞
∞
P
(ak + bk ) konvergent.
k=1
k=1
k=1
Es gilt
∞
P
k=1
k=1
und λ eine feste (reelle oder komplexe) Zahl, so sind auch
k=1 ak konvergent
P∞
ā
und
(λa
)
konvergent.
Es gilt
k
k=1 k
k=1
Ist
P∞
∞
X
āk =
k=1
∞
X
k=1
ak ,
∞
∞
X
X
(λak ) = λ ·
ak .
k=1
Beweis. Für die entsprechenden Partialsummen S n =
n
P
k=1
n
P
k=1
(ak + bk ) gilt S n + T n = Un .
k=1
ak , T n =
n
P
k=1
bk und Un =
KAPITEL 3. DER GRENZWERT
74
Weiters gilt für Vn =
n
P
(λak ) und Wn =
n
P
āk sicher Vn = λS n und Wn = S̄ n . Also
k=1
k=1
folgen auch diese Rechenregeln aus den entsprechenden Regeln für Folgen.
❑
Beim letzten Beweis haben wir die Rechengesetze wie Kommutativität, Distributivität u.ä. für endliche Summen benützt. Das Verhalten dieser Rechenregeln bei unendlichen Reihen ist wesentlich komplizierter, vgl. u.a. Beispiel 3.9.1.
3.7.4 Fakta.
1. Man beachte, dass man endlich viele Reihenglieder beliebig abändern kann, ohne das Konvergenzverhalten zu stören. Das gilt deshalb, weil sich dabei die neue
Folge der Partialsummen ab einem gewissen Index von der alten nur um eine
additive Konstante unterscheidet. Natürlich verändert sich dabei die Summe der
Reihe.
P
2. Hat man eine konvergente Reihe ∞j=1 a j gegeben, so dürfen beliebig Klammern
”
gesetzt werden“, ohne das Konvergenzverhalten der Reihe zu verändern, was exakt formuliert bedeutet, dass für jede streng monoton wachsende Folge (k(n))n∈N
natürlicher Zahlen gilt, dass
∞
X
aj =
j=1
∞
X
An ,
n=1
wobei A1 = a1 + · · · + ak(1) und An = ak(n−1)+1 + · · · + ak(n) für n ≥ 2.
Dieser Sachverhalt folgt aus der einfachen Beobachtung, dass die Folge der ParP
tialsummen unserer neuen Reihe ∞
A genau die Teilfolge (S k(n) )n∈N der Folge
P∞n=1 n
(S k )k∈N der Partialsummen von j=1 a j ist (vgl. Satz 3.2.9, (iv)).
P
Die Umkehrung gilt hier nicht. Es kann nämlich vorkommen, dass ∞
n=1 An konP∞
vergiert, aber k=1 ak nicht. Man betrachte nur die Reihe 1 − 1 + 1 − 1 + . . . und
klammere immer zwei aufeinanderfolgende Summanden ein.
3. Sind
∞
P
k=1
ak und
∞
P
bk zwei konvergente Reihen mit reellen Summanden, sodass
k=1
ak ≤ bk für alle k ∈ N, so gilt für die Partialsummen klarerweise auch
n
P
k=1
n
P
k=1
ak ≤
bk für alle n ∈ N. Aus Lemma 3.3.1 erhalten wir dann für die Grenzwerte
dieser zwei Folgen von Partialsummen
∞
X
k=1
ak ≤
∞
X
bk .
k=1
Ist nun zusätzlich sogar al < bl für zumindest ein l ∈ N, so folgt al + δ ≤ bl für
n
n
P
P
ein hinreichend kleines δ > 0. Somit gilt für n ≥ l, dass δ +
ak ≤
bk . Für
k=1
n → ∞ folgt wieder aus Lemma 3.3.1, dass
∞
X
k=1
ak < δ +
∞
X
k=1
ak ≤
∞
X
k=1
bk .
k=1
3.7. UNENDLICHE REIHEN
75
3.7.5 Beispiel.
∞
P
Betrachte die Reihe
k=1
S n :=
1
k(k+1) .
n
X
k=1
Die Reihe
∞
P
k=1
1
k(k+1)
Wegen
1
k(k+1)
=
1
k
−
1
k+1
gilt (Teleskopreihe)
!
n
X
1
1
1
1
=1−
=
−
.
k(k + 1) k=1 k k + 1
n+1
konvergiert also gegen lim S n = 1.
n→∞
Lässt man die ersten drei Terme weg, d.h. ersetzt sie durch 0, so gilt für die
entsprechenden Partialsummen S n′ stets (n ≥ 3)
!
1
1
1
1
1
3
′
Sn = Sn −
−
−
= 1−
− → .
1·2 2·3 3·4
n+1
4
4
D.h. die Reihe
∞
P
k=4
1
k(k+1)
ist ebenfalls konvergent. Ihre Summe ist
Fasst man immer zwei Summanden der Reihe
die Reihe
∞
P
k=1
∞
P
k=1
2
(2k−1)(2k+1) ,
1
k(k+1)
1
4
.
zusammen, so erhält man
welche nach Fakta 3.7.4, 2, ebenfalls die Summe 1 hat.
3.7.6 Bemerkung. Aus dem entsprechenden Resultat für Folgen erhält man, dass eiP
ne Reihe ∞
bestehend aus komplexen Zahlen genau dann konvergiert, wenn die
n=1 z
Pn
P∞
reellen Reihen ∞
n=1 Re zn und n=1 Im zn beide konvergieren. In diesem Fall gilt
∞
X
zn = (
n=1
∞
X
Re zn ) + i(
n=1
∞
X
Im zn ).
n=1
Da jede konvergente Folge auch Cauchy-Folge ist, erhält man unmittelbar eine einfache notwendige Bedingung für die Konvergenz einer Reihe.
3.7.7 Proposition. Ist
∞
P
ak konvergent, so folgt limk→∞ ak = 0.
k=1
Beweis. Betrachte die Reihe
∞
P
k=1
bk , wobei b1 = 0 und bk+1 = ak für k ∈ N. Sind (S n )n∈N
und (T n )n∈N die Folgen der Partialsummen von
∞
P
k=1
S n − Tn =
n
X
k=1
ak −
n
X
ak bzw.
∞
P
bk , so folgt
k=1
ak−1 = an .
k=2
Wegen T n+1 = S n folgt aus Satz 3.2.9, dass (T n )n∈N gegen den gleichen Grenzwert,
wie (S n )n∈N konvergiert. Somit erhalten wir S n − T n = an → 0.
❑
Wie wir aus Beispiel 3.7.9 sehen werden, ist diese notwendige Bedingung bei weitem nicht hinreichend.
∞
P
ak eine Reihe mit reellen nichtnegativen Summanden, d.h. ak ∈
3.7.8 Satz. Sei
R, ak ≥ 0.
k=1
KAPITEL 3. DER GRENZWERT
76
(i) Die Reihe ist genau dann konvergent, wenn die Folge (S n )n∈N der Partialsummen
n
∞
P
P
beschränkt ist9 . In diesem Fall ist auch ak ≤
ak für alle n ∈ N. Anderenfalls
k=1
k=1
ist sie bestimmt gegen +∞ divergent.
(ii) Ist
∞
P
k=1
bk eine divergente Reihe nichtnegativer reeller Zahlen mit ak ≥ bk , k ∈ N,
so ist auch
∞
P
ak divergent (Minorantenkriterium).
k=1
(iii) Ist
∞
P
k=1
bk eine konvergente Reihe nichtnegativer reeller Zahlen mit ak ≤ bk , k ∈ N,
so ist auch
∞
P
ak konvergent (Majorantenkriterium), und
k=1
∞
P
k=1
ak ≤
∞
P
bk .
k=1
Beweis. Wegen der Voraussetzung ak ≥ 0 ist (S n )n∈N monoton wachsend. Somit folgt
(i) aus Satz 3.6.2, (vi). Die behauptete Ungleichung gilt, da im Falle der Konvergenz
der monoton wachsenden Folge (S n )n∈N der Grenzwert gemäß Satz 3.4.2 nichts anderes
als sup{S n : n ∈ N} ist.
∞
P
bk , so ist auch
Ist nun bk ≥ 0 und (T n )n∈N der Folge Partialsummen der Reihe
k=1
diese monoton wachsend.
Ist diese divergent, und ak ≥ bk , so gilt sicherlich S n ≥ T n . Also kann die Folge
(S n )n∈N nicht beschränkt sein.
∞
P
Ist dagegen
bk konvergent, und ak ≤ bk , so ist S n ≤ T n , und mit (T n )n∈N ist auch
k=1
die Folge (S n )n∈N ist nach oben beschränkt. Die behauptete Ungleichung folgt aus
Fakta 3.7.4, 3.
❑
3.7.9 Beispiel. Betrachte die harmonische Reihe
∞
X
1
k=1
k
.
Diese Reihe ist nicht konvergent (sie ist bestimmt divergent gegen +∞). Betrachtet
man nämlich die Folge der Partialsummen, S n = 1 + 21 + · · · + n1 , so ist diese monoton
wachsend. Für die Existenz des Limes ist es also notwendig und hinreichend, dass diese
Folge beschränkt ist (vgl. Satz 3.7.8, (i)). Nun gilt jedoch
S 2l = 1 +
1+
1 1 1 1 1 1 1 1
1
+ + + + + + + +...+ l ≥
2 3 4 5 6 7 8 9
2
1
1 1 1 1 1 1 1 1
1
+ + + + + + + +...+ l = 1+l · ,
2 |
4 {z4} |
8 8 {z8 8} 16
2
2
= 21
= 12
d.h. S 2l kann für l → ∞ nicht beschränkt bleiben.
3.7.10 Beispiel. Durch Vergleich mit der harmonischen Reihe ist nach dem Minoran∞
P
1
10
tenkriterium die Reihe
kα für α < 1 divergent .
k=1
9 Da
(S n ) monoton wachsend ist, ist sie genau dann beschränkt, wenn irgendeine Teilfolge davon beschränkt ist.
10 Bemerke, dass wir kα erst für rationales α definiert haben.
3.8. KONVERGENZKRITERIEN
77
3.7.11 Korollar (Cauchysches Konvergenzkriterium). Die Reihe
∞
P
ak ist genau dann
k=1
konvergent, wenn gilt
n
X
ak < ǫ, n > m ≥ N.
∀ǫ > 0 ∃N ∈ N : k=m+1 Beweis. Für die Partialsummen S n =
n
P
k=1
ak gilt S n − S m =
(3.12)
Pn
k=m+1 ak .
Also ist
(3.12) nichts anderes als das Cauchysches Konvergenzkriterium für die Folge der
Partialsummen.
❑
Wir werden später weitere Konvergenzkriterien kennenlernen. Diesen Abschnitt
beenden wir mit einer weiteren Begriffsbildung, die sich aus folgender Überlegung
motivieren lässt.
Will man mit Hilfe des Cauchyschen Konvergenzkriteriums
eine Reihe auf Kon
n
P
vergenz überprüfen, so muss man den Ausdruck a abschätzen. Verwendet man
k=m+1 k die Dreiecksungleichung, so erhält man
n
n
n
X
X
X
ak ≤
(3.13)
|ak | .
| ak |= k=m+1 k=m+1
k=m+1 Kennt man also eine hinreichend gute Abschätzung für den entsprechenden Ausdruck
P
der Reihe ∞
k=1 |ak |, so ist man fertig.
3.7.12 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Die Reihe
P∞
P∞
k=1 ak heißt absolut konvergent, wenn die Reihe der Beträge k=1 |ak | konvergiert.
Aus (3.13) und dem Cauchyschen Konvergenzkriterium erhalten wir sofort
3.7.13 Lemma. Jede absolut konvergente Reihe ist auch konvergent.
3.7.14 Bemerkung. Die Umkehrung gilt jedoch im Allgemeinen nicht. Zum Beispiel
P
k+1 1
ist die alternierende harmonische Reihe ∞
k=1 (−1)
k konvergent, wie man aus dem
Leibnizschen Konvergenzkriterium weiter unten erkennt.
P 1
Die Reihe der Beträge ∞
k=1 k ist die harmonische Reihe, also divergent.
3.7.15 Definition. Reihen, die konvergent, aber nicht absolut konvergent sind, heißen
auch bedingt konvergent.
3.8 Konvergenzkriterien
Wir wollen das Majorantenkriterium ausnützen, um durch Vergleich mit der geometrischen Reihe zwei oft einsetzbare hinreichende Bedingungen für die absolute Konvergenz einer Reihe herzuleiten.
3.8.1 Satz. Sei
∞
P
k=1
ak eine Reihe mit reellen oder komplexen Summanden. Dann gilt:
KAPITEL 3. DER GRENZWERT
78
(i) Wurzelkriterium: Gibt es eine feste Zahl q, 0 < q < 1, sodass ab einem Index k0
die Ungleichung
pk
|ak | ≤ q, k ≥ k0 ,
∞
P
so ist die Reihe
ak absolut konvergent. Gibt es eine Teilfolge (ak(l) )l∈N mit
k=1
pk
|ak(l) | ≥ 1, so ist sie divergent.
(ii) Quotientenkriterium: Gibt es eine Zahl q, 0 < q < 1, sodass ab einem Index k0
alle ak , 0 sind, und sodass
|ak+1 |
≤ q, k ≥ k0 ,
|ak |
so ist die Reihe
∞
P
ak absolut konvergent. Gibt es einen Index k0 , sodass ak , 0
k=1
und
|ak+1 |
|ak |
≥ 1 für k ≥ k0 , so ist sie divergent.
Beweis.
(i) Aus
∞
√k
P
|ak | ≤ q < 1 folgt |ak | ≤ qk . Da die Reihe
qk konvergiert, zeigt das
Majorantenkriterium, dass
∞
P
k=k0
k=k0
|ak |, und damit auch
∞
P
k=1
|ak | konvergiert.
√
Ist dagegen k |ak | ≥ 1 für unendlich viele Indizes k, so kann (|ak |)k∈N und damit
(ak )k∈N keine Nullfolge sein. Daher ist die Reihe divergent.
(ii) Es existiere q < 1, sodass für hinreichend große k ∈ N, d.h. für alle k ≥ k0 mit
einem geeigneten k0 , |ak+1 | ≤ q|ak | gilt. Dann folgt durch ein induktives Argument
|al | ≤ ql
|ak0 |
, l ≥ k0 ,
q k0
q
√
|a |
und wir erhalten l |al | ≤ q · l qkk00 . Da der zweite Faktor mit l → ∞ gegen 1 strebt,
können wir das Wurzelkriterium anwenden.
|
Aus |a|ak+1
≥ 1 für k ≥ k0 folgt |ak+1 | ≥ |ak |. Also kann (|ak |)k∈N keine Nullfolge
k|
sein, da sie ab dem Index k0 monoton wächst.
❑
Diese Bedingungen werden oft in der folgenden Form angewandt.
3.8.2 Korollar. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Ist
pk
|ak+1 |
< 1 bzw. lim |ak | < 1 ,
k→∞
k→∞ |ak |
lim
so ist die Reihe
Reihe divergent.
P∞
k=1
ak absolut konvergent. Ist dieser Limes dagegen > 1, so ist die
Beweis. Existiert der eine oder andere Limes η und ist η < 1, so folgt η < 1+η
2 < 1.
√k
1+η
1+η
|ak+1 |
Aus Lemma 3.3.1 sieht man, dass |ak | < 2 =: q bzw. |ak | < 2 =: q ab einem
3.8. KONVERGENZKRITERIEN
79
gewissen k0 . Im Falle η > 1 schließt man analog.
❑
Es sei darauf hingewiesen, dass es vorkommen kann, dass für eine Reihe Korollar 3.8.2 nicht anwendbar ist, weil der entsprechende Limes nicht existiert, Satz 3.8.1
jedoch schon anwendbar ist.
3.8.3 Beispiel.
P zn
(i) Betrachte die Reihe ∞
n=0 n! , wobei n! := 1 · 2 · 3 · . . . · n die Zahl n-faktorielle
bezeichnet und z ∈ C. Diese Reihe ist konvergent, denn es gilt
n+1 z 1· 2· ...·n
|z|
=
(n+1)!
|z| =
→ 0.
zn 1 · 2 · . . . · n · (n + 1)
n+1
n!
(ii) Betrachte die Reihe
P∞
1
n=1 (3+(−1)n )n .
s
n
Die Folge der n-ten Wurzeln
1
1
=
(3 + (−1)n )n (3 + (−1)n )
hat zwar keinen Grenzwert, aber ihre Glieder sind alle ≤ 21 . Somit kann man
zwar nicht Korollar 3.8.2 anwenden, aber das Wurzelkriterium aus Satz 3.8.1.
Der Grenzwert der Reihe lässt sich mit Hilfe der hergeleiteten Regeln für Reihen
berechnen:
! X
∞
∞
∞
∞
X
X
X
1
1
1
1
1
=
=
+
+
=
n )n
2k−1
2k
2k−1
2k
(3
+
(−1)
2
4
2
4
k=1
k=1
k=1
n=1

∞
∞
X
 1
1 X 1
2
+
= 2 
k
k
4
16
1−
k=1
k=1
1
4
 
 
− 1 + 

1

− 1 .
1
1 − 16
(iii) Bezeichne mit τ(n) die Anzahl der Teiler der natürlichen Zahl n. Wir betrachten
P
n
die Reihe ∞
n=1 τ(n)x wobei x > 0 ist. Wegen τ(n) ≤ n gilt
pn
pn
√
τ(n)xn = x · τ(n) ≤ x · n n → x .
Ist also x < 1, so ist die Reihe konvergent. Für x ≥ 1 ist sie sicher divergent, denn
dann bilden die Summanden keine Nullfolge.
Wir haben im Beweis von Satz 3.8.1 gesehen, dass das Quotientenkriterium
schwächer als das Wurzelkriterium ist. Das eben betrachtete Beispiel ist gerade
eines wo uns das Wurzelkriterium zum Ziel führt, das Quotientenkriterium aber
versagen würde. Denn ist n > 2 eine Primzahl, dann gilt τ(n) = 2. Weiters ist n
sicher ungerade, und damit kann n + 1 keine Primzahl sein, also gilt τ(n + 1) ≥ 3.
Wir erhalten damit
τ(n + 1)xn+1 3
≥ · x.
τ(n)xn
2
Für x ≥ 32 ist daher der Quotient ≥ 1. Da es unendlich viele Primzahlen gibt,
können wir also das Quotientenkriterium nicht anwenden.
Die nun präsentierten Kriterien basieren auf folgendem auch später verwendeten
Lemma.
KAPITEL 3. DER GRENZWERT
80
3.8.4 Lemma. Seien a1 , . . . , am und b1 , . . . , bm komplexe oder reelle Zahlen, so gilt
m
X
n=1
an bn = am βm −
wobei die βn die Partialsummen
n
P
m−1
X
(an+1 − an )βn ,
n=1
b j = βn bezeichnen.
j=1
Beweis.
m−1
X
n=1
m
X
n=2
(an+1 − an )βn =
an βn−1 −
m−1
X
n=1
m−1
X
n=1
an+1 βn −
an βn = am βm−1 −
am βm − am bm −
m−1
X
n=2
m−1
X
n=2
m−1
X
an βn =
n=1
an (βn − βn−1 ) − a1 β1 =
an bn − a1 b1 = am βm −
m
X
an bn .
n=1
❑
3.8.5 Satz (Dirichletsches11 Kriterium). Sei (an )n∈N eine monotone Nullfolge reeller
Zahlen und sei (bn )n∈N eine Folge reeller oder komplexer Zahlen. Gilt für eine Zahl
M>0
N
X
bn ≤ M, N ∈ N,
n=1 so ist die Reihe
∞
P
an bn konvergent.
n=1
Beweis. Sei N so groß, dass |an | < ǫ für n ≥ N. Dann folgt für k, m ≥ N, k < m aus
Lemma 3.8.4 und der Dreiecksungleichung

m
m
m−1 
n
X
X
X
X



an bn ≤ am
bi +
bi  .
|an+1 − an | n=k+1
n=k+1
i=k+1 i=k+1
P
P
P
Da | ni=k+1 bi | ≤ | ki=1 bi | + | ni=1 bi | ≤ 2M, schätzen wir diesen Ausdruck weiter nach
oben durch
m−1
X
2M|am | + 2M
|an+1 − an |
n=k+1
ab. Voraussetzungsgemäß haben die Ausdrücke der Form (an+1 − an ) niemals verschiedenes Vorzeichen. Also gilt


m−1
m−1
X

X


2M |am | +
|an+1 − an | = 2M |am | + (an+1 − an ) ≤
n=k+1
n=k+1
2M (|am | + |am | + |ak+1 |) ≤ 2M · 3ǫ.
∞
P
Nach dem Cauchyschen Kriterium ist die Reihe
an bn konvergent.
n=1
11 Johann
Peter Gustav Lejeune Dirichlet. 13.2.1805 Düren (bei Aachen) - 5.5.1859 Göttingen
❑
3.8. KONVERGENZKRITERIEN
81
3.8.6 Korollar (Leibniz12Kriterium). Sei
∞
P
(−1)n an eine alternierende Reihe, d.h.
n=1
an ≥ 0, n ∈ N. Ist (ak )k∈N monoton fallend und gilt lim an = 0, so konvergiert
n→∞
∞
P
(−1)nan .
n=1
Beweis. Setze im Dirichletschen Kriterium bn = (−1)n .
❑
∞
P
3.8.7 Beispiel. Für α > 1 ist die Reihe
k=1
1
kα
konvergent13.
m+1
Da m+1
m → 1, kann man m ∈ N so wählen, dass m ≤ α. Nach dem Majorantenkriterium genügt es, die Behauptung für den Exponenten m+1
m zu zeigen.
∞
P
Betrachte die nach dem Leibnizschen Kriterium konvergente Reihe (−1)k+1 11 .
km
k=1
Fassen wir immer je zwei Summanden zusammen, so konvergiert nach Fakta 3.7.4, 2,
auch die Reihe
!
∞
X
1
1
−
.
1
1
m
(2k) m
k=1 (2k − 1)
Nun ist
1
(2k − 1)
1
m
−
(2k)
1
1
1
=
1
m
(2k) m − (2k − 1) m
1
m
(2k − 1) (2k)
(2k) − (2k − 1)
1
m
=
1
1
1
(2k − 1) m (2k) m
·
≥
1
1
m−2
m−1
(2k − 1) m + . . . + (2k) m (2k − 1) m + (2k − 1) m
1
1
1
=
· m+1
≥
2
m−1
m+1
(2k) m m(2k) m
m2 m k m
∞
P
1
Nach dem Majorantenkriterium folgt somit, dass auch die Reihe
m+1 konvergiert.
·
(2k)
m−1
m
+ (2k)
m−2
m
k=1 k
3.8.8 Korollar (Abelsches14 Kriterium). Sei die Reihe
Folge. Dann ist die Reihe
∞
P
∞
P
m
bn konvergent, und sei (an )n∈N eine monotone und beschränkte
n=1
an bn konvergent.
n=1
Beweis. Die Folge (an )n∈N ist konvergent, an → a. Es gilt
N
X
an bn =
n=1
N
X
n=1
(an − a)bn + a
N
X
bn .
n=1
Für N → ∞ existiert für jeden der beiden Summanden auf der P
rechten Seite der Grenzwert, denn die Reihe
konvergiert nach dem Dirichletschen Kriterium und die Reihe ∞
n=1 bn nach Voraussetzung.
P∞
n=1 (an
− a)bn
❑
3.8.9 Satz (Kriterium von Raabe15 ). Sei (an )n∈N eine Folge reeller oder komplexer Zahlen. Gibt es eine Zahl β > 1, sodass
ab einem Index k0 alle ak , 0 sind, und
|ak+1 |
β
≤ 1 − , k ≥ k0 ,
|ak |
k
so ist die Reihe
∞
P
ak absolut konvergent.
k=1
Ist ab einem gewissen Index k0 jedoch
konvergent.
12 Gottfried
|ak+1 |
|ak |
≥ 1 − 1k , so ist sie nicht absolut konvergent, also höchstens bedingt
Wilhelm Leibniz. 1.7.1646 Leipzig - 14.11.1716 Hannover
dass wir kα erst für rationales α definiert haben.
14
Niels Henrik Abel. 5.8.1802 Finnö (Norwegen) - 6.4.1829 Froland (Norwegen)
15 Josef Ludwig Raabe. 1801 - 1859
13 Bemerke,
KAPITEL 3. DER GRENZWERT
82
Beweis. Für k ≥ k0 gilt wegen unserer Voraussetzung k|ak+1 | ≤ k|ak | − β|ak | und daher
(β − 1)|ak | ≤ (k − 1)|ak | − k|ak+1 |.
(3.14)
Wegen β > 1 ist (k−1)|ak | > k|ak+1 | > 0. Somit ist die Folge ((k−1)|ak |)k∈Z≥2 monoton und beschränkt, und daher konvergent.
Daraus ergibt sich die Konvergenz der Folge (in k)
k
X
n=2
((n − 1)|an | − n|an+1 |) = |a2 | − k|ak+1 |
von Partialsummen. Wegen (3.14) konvergiert die Reihe
|ak+1 |
|ak |
1
k
P∞
n=1
|an |.
≥ 1 − für k ≥ k0 (> 1), so folgt k|ak+1 | ≥ (k − 1)|ak | ≥ (k0 − 1)|ak0 | := α > 0. Also ist |ak+1 | ≥
Gilt nun
P
nach dem Minorantenkriterium kann ∞
n=1 |an | nicht konvergieren.
Wir wollen noch anmerken, dass man die Konvergenz von
( n1α )n∈N
α
k,
und
❑
für α ∈ N, n ≥ 2, mit dem Kriterium von Raabe
und der Bernouillsche Ungleichung zeigen kann.
3.9 Umordnungen von Reihen und Doppelreihen
Wir haben in Fakta 3.7.4 gesehen, dass die Konvergenz einer Reihe nicht verloren
geht, und der Grenzwert unverändert bleibt, wenn man beliebig Klammern setzt. Es
ist aber wesentlich, dass man die Summationsreihenfolge beibehält. Denn wie man am
P
folgenden Beispiel sieht, kann man für manche Reihen ∞
n=1 xn eine Bijektion σ : N →
P∞
P∞
N finden, sodass n=1 xσ(n) , n=1 xn . Diese neue Reihe heißt Umordnung der Reihe
P∞
n=1 xn .
PN
Das ist ein wesentlicher Unterschied zu endlichen Summen. Denn ist k=1
ak eine
endliche Summe, so können wir die Summanden beliebig umordnen ohne, dass sich
die Summe verändert. Anders ausgedrückt: Ist σ eine Permutation von {1, . . . , N}, d.h.
PN
PN
eine Bijektion von {1, . . . , N} auf sich, dann gilt k=1
ak = k=1
aσ(k) .
3.9.1 Beispiel. Betrachte die alternierende harmonische Reihe
S =1−
1 1 1 1 1
+ − + − + ....
2 3 4 5 6
Ordnen wir die Summanden in einer anderen Reihenfolge an 16 , z.B. als
1
1
1 1 1 1 1 1
1
1
1
− + −
− +... =
1− − + − − + −
2
4
3
6
8
5
10
12
7
14
16
|{z}
| {z }
| {z }
| {z }
= 12
=
= 16
1
= 10
1
= 14
1 1 1 1
1 1 1 1 1
1
1
1
1
1
− + − +
−
+
−
+... = 1− + − + − +... ,
2 4 6 8 10 12 14 16
2
2 3 4 5 6
so erhalten wir genau S2 . Die Summe einer Reihe kann also von der Reihenfolge der
Summanden abhängen. Tatsächlich kann man eine konvergente aber nicht absolut konvergente Reihe stets so umordnen, dass jede beliebige Summe einschließlich ±∞, oder
gar eine divergente Reihe, herauskommt, vgl. Satz 3.9.4.
Eine der herausragenden Eigenschaften von absolut konvergenten Reihen ist die,
dass bei Ihnen ein solches Verhalten nicht auftreten kann. Also hängt die Summe nicht
von der Ordnung der natürlichen Zahlen ab. Um das einzusehen, führen wir im folgenden Lemma eine neue Art von Grenzwertbegriff ein.
16 Die entsprechende Bijektion σ : N → N ist für k ∈ N durch σ(3k−2) = 2k−1, σ(3k−1) = 4k−2, σ(3k) =
4k bestimmt.
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
83
P
3.9.2 Lemma. Sei ∞
k=1 ak eine Reihe reeller oder komplexer Zahlen. Dann sind folgende Aussagen äquivalent:
(i) Die Reihe ist absolut konvergent.
P
(ii) Es gibt ein C > 0, sodass j∈M |a j | ≤ C für alle endlichen Teilmengen M von N.
P
(iii) Es gibt ein C > 0, sodass | j∈M a j | ≤ C für alle endlichen Teilmengen M von N.
(iv) Es gibt ein s ∈ R, sodass
X
∀ǫ > 0 ∃M0 ⊆ N, M0 endlich : a j − s < ǫ,
(3.15)
j∈M
für alle endlichen M, M0 ⊆ M ⊆ N.
Sind diese Bedingungen erfüllt, so ist die Zahl s aus (iv) genau die Summe der Reihe
P∞
k=1 ak .
Beweis. Ehe wir die Äquivalenzen zeigen, sei darauf hingewiesen, dass die Zahl s
in (iv) eindeutig
ist. Würde nämlich (iv) für s und ein s′ , s gelten, dann folgt mit
|s−s′ |
ǫ := 3 und M = M0 ∪ M0′ der Widerspruch (vgl. Satz 3.2.9)
X
X
|s − s′ | ≤ a j − s + a j − s′ < 2ǫ < |s − s′ |.
j∈M
j∈M
P
P
(i) ⇔ (ii): Für endliche Teilmengen M ⊆ N gilt klarerweise j∈M |a j | ≤ max(M)
|a j |.
j=1
Somit ist (ii) äquivalent zur Beschränktheit der Folge der Partialsummen der
P
Reihe ∞j=1 |a j |. Die Äquivalenz zu (i) folgt nun aus Satz 3.7.8, (i).
(i) ⇒ (iv): Sei ǫ > 0 gegeben. Wegen der absoluten Konvergenz gibt es ein N ∈ N,
sodass für n > m ≥ N
n
X
| ak |< ǫ.
k=m+1
Setze M0 = {1, . . . , N}. Ist M eine endliche Teilmenge von N, die M0 enthält, so
sind alle j ∈ M \ M0 größer als N. Also gilt für beliebiges m > N
max(M)
m
m
m
X
X
X
X
X
X
a j −
|a j | +
a j ≤
|a j | < 2ǫ.
a j = a j −
j=N+1
j∈M
j=N+1 j=N+1
j=1
j∈M
j>N
P
Strebt nun m gegen ∞, so folgt (siehe Lemma 3.3.1) | j∈M a j − s| ≤ 2ǫ. Da ǫ > 0
beliebig war folgt (3.15).
(iv) ⇒ (iii): Sei ǫ > 0 fest und M0 wie in (3.15). Für ein beliebiges endliches M ⊆ N
folgt aus (3.15) wegen (M0 \ M) ∪ M = M0 ∪ M ⊇ M0
X X
X
X
a j = a j +
aj − s + s −
a j ≤
j∈M j∈M
j∈M0 \M
j∈M0 \M X
X
X
a j − s + |s| +
|a j |.
|a j | ≤ ǫ + |s| +
j∈M0 ∪M
j∈M0
j∈M0 \M
KAPITEL 3. DER GRENZWERT
84
P
P
(iii) ⇒ (ii): Da |a j | ≤ | Re a j | + | Im a j |, genügt es, j∈M | Re a j |, j∈M | Im a j | ≤ 2C
nachzuweisen. Dazu setzt man M1 = {n ∈ M : Re an ≥ 0} und M2 = {n ∈ M :
Re an < 0}. Es folgt




X
X
X
 X 
 X 



Re an = Re 
Re an −
| Re an | =
an  − Re 
an  ≤
n∈M
n∈M2
n∈M1
n∈M1
n∈M2
X X an ≤ 2C.
an + n∈M1 n∈M2 P
Entsprechend schließt man für n∈M | Im an |.
❑
P
3.9.3 Satz. Die Reihe ∞
k=1 bk mit reellenPoder komplexen Summanden sei absolut konvergent. Dann ist auch jede Umordnung ∞
k=1 bσ(k) absolut konvergent und hat die gleiche Summe s.
P
Beweis. Wir wenden Lemma 3.9.2, (iv), auf s := ∞
k=1 bk an. Also gilt (3.15) mit
a j = b j . Diese Bedingung ist aber invariant unter jeder Bijektion σ : N → N. In
der Tat, ist ǫ > 0 und M0 so, dass (3.15) gilt, und ist σ−1 (M0 ) ⊆ M, so folgt wegen
M0 ⊆ σ(M)
X
X
X
bσ( j) − s = bσ( j) − s = bk − s < ǫ.
j∈M
σ( j)∈σ(M)
k∈σ(M)
Also gilt (3.15) auch mit a j = bσ( j) . Nach Lemma 3.9.2 konvergiert auch die umgeordP
nete Reihe ∞
n=1 bσ(n) gegen s.
❑
Der Grenzwertbegriff, dem wir in (3.15) begegnet sind, und die Konvergenz von
Folgen sind Spezialfälle eines allgemeineren Konzeptes, das wir am Ende von Kapitel
5 diskutieren werden.
Nun wollen wir Satz 3.9.3 umkehren.
3.9.4 Satz. Sei die Reihe
∞
P
ak reeller Zahlen konvergent mit der Summe S , aber nicht
k=1
absolut konvergent. Dann gibt es zu jeder vorgegebenen Zahl S ′ ∈ R ∪ {±∞} eine
∞
∞
P
P
Umordnung (bk )k∈N , bk = aσ(k) , mit
bk = S ′ . Weiters gibt es Umordnungen bk die
k=1
k=1
divergieren (aber nicht bestimmt divergieren).
Beweis. Bezeichne mit a+k := max(ak , 0), a−k := min(ak , 0), d.h. die Folgen der positiven
bzw. negativen Terme ak . Wir überlegen zuerst, dass
∞
X
k=1
a+k = +∞,
∞
X
k=1
a−k = −∞
(3.16)
gelten muss. Zunächst sind die Partialsummen dieser Reihen monotone Folgen, haben
also einen Grenzwert in R ∪ {±∞}. Angenommen einer der beiden wäre endlich, z.B.
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
∞
P
k=1
85
a+k = S + < ∞. Dann folgt
N
X
a−k =
k=1
und somit
N
X
k=1
N
X
k=1
| ak |=
ak −
N
X
k=1
N
X
k=1
a+k
N→∞
a+k −→ S − := S − S + > −∞.
−
N
X
k=1
N→∞
a−k −→ S + − S − < ∞,
∞
P
ak nicht absolut konvergiert.
P
′
Sei nun S ∈ R gegeben. Wir konstruieren eine Umordnung ∞
k=1 bk , die gegen S
+ + +
+
konvergiert. Zuerst addiert man Summanden a1 , a2 , a3 , . . . , an1 , bis man das erste Mal
> S ′ ist, dann Summanden a−1 , a−2 , . . . , a−l1 bis die Gesamtsumme das erste mal wieder
< S ′ ist. Dann a+n1 +1 , a+n1 +2 , . . . , a+n2 bis man das erste Mal wieder > S ′ ist. So verfährt
man weiter. Wegen (3.16) ist das stets möglich.
∞
P
ak . Ist S n′ eine Partialsumme,
Man erhält in dieser Weise eine Umordnung von
im Widerspruch zur Voraussetzung, dass
k=1
′
k=1
so ist S n′ − S ′ beschränkt nach oben durch das letzte aufgetretene a+k und nach unten
durch das letzte aufgetretene a−k . Wegen lim ak = 0 gilt auch
k→∞
lim (S n′ − S ′ ) = 0.
n→∞
In analoger Weise verfährt man, wenn man eine Umordnung konstruieren möchte, die
bestimmt divergiert gegen +∞ oder −∞, oder nicht einmal bestimmt divergiert.
❑
3.9.5 Bemerkung. Obiger Beweis verwendet bei der Definition der Umordnung implizit den Rekursionssatz. Die Tatsache, dass die dadurch definierte Funktion bijektiv auf
N ist und dass sie das gewünschte leistet, bedarf eigentlich eines strengeren Beweises.
Für den interessierten Leser bringen wir anschließend einen wasserdichten Beweis.
Wir zeigen wie oben, dass (3.16) zutrifft. Nun sei
M1 := {n ∈ N : an ≥ 0}, M2 := {n ∈ N : an < 0}.
˙ 2 . Wäre M1 endlich, so hätten wir a+n = 0 für n > max(M1 ), was aber (3.16)
Offensichtlicherweise gilt N = M1 ∪M
widerspricht. Also ist M1 und mit einer ganz ähnlichen Argumentation auch M2 unendlich.
Nun sei Fn die Menge aller Funktionen f : {1, . . . , n} → N, die folgende beiden Bedingungen erfüllen:
(i) 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M1 ⇒ f (i) < f ( j) und 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M2 ⇒ f (i) < f ( j).
(ii) f (i) ∈ M1 ⇒ {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) und f (i) ∈ M2 ⇒ {1, . . . , f (i)} ∩ M2 ⊆ f ({1, . . . , i}).
Fn ist nicht leer, da - wie man sich leicht überzeugt - die Funktion f (1) = min(M1 ), f (2) = min(M1 \ { f (1)}), . . . , f (n) =
min(M1 \ { f (1), .S. . , f (n − 1)}) in dieser Menge liegt.
n∈N Fn (⊆ N × N) und definiere g : F → F folgendermaßen: Sei f ∈ F , also f ∈ Fn für ein n ∈ N. Falls
Pn Setze F =
′
j=1 a f ( j) < S , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass
g( f )(n + 1) = min(M1 \ f ({1, . . . , n})).
Diese Fortsetzung liegt tatsächlich in Fn+1 ⊆ F . Um das zu sehen, sei 1 ≤ i < j ≤ n + 1, sodass beide Zahlen g( f )(i), g( f )( j)
gleichzeitig entweder in M1 oder in M2 liegen. Ist j ≤ n, dann folgt f (i) = g( f )(i), f ( j) = g( f )( j) ∈ M1 (M2 ) und daher
g( f )(i) = f (i) < f ( j) = g( f )( j).
Falls j = n+1, dann ist g( f )(n+1) = min(M1 \ f ({1, . . . , n})) ∈ M1 . Wegen i ∈ {1, . . . , n} muss auch g( f )(i) = f (i) ∈ M1 .
Falls g( f )(n + 1) ≤ f (i), so wäre nach (ii), g( f )(n + 1) = f (k) für ein k ≤ i ≤ n, und damit g( f )(n + 1) = f (k) <
M1 \ f ({1, . . . , n}), was aber nicht sein kann. Also gilt g( f )(n + 1) > f (i) und g( f ) erfüllt (i).
KAPITEL 3. DER GRENZWERT
86
Um (ii) zu zeigen, sei g( f )(i) ∈ M1 (M2 ) für ein i ∈ {1, . . . , n + 1}. Falls i ≤ n, so folgt
{1, . . . , g( f )(i)} ∩ M1 = {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) = g( f )({1, . . . , i}).
Dasselbe gilt für M2 . Sei nun i = n + 1. Dann ist g( f )(n + 1) ∈ M1 . Ist k ∈ M1 mit k < g( f )(n + 1), so muss k in f ({1, . . . , n})
sein, da wir sonst P
den Widerspruch g( f )(n + 1) = min(M1 \ f ({1, . . . , n})) ≤ k bekämen.
Ist dagegen nj=1 a f ( j) ≥ S ′ , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass g( f )(n + 1) = min(M2 \
f ({1, . . . , n})). Man zeigt genauso wie oben, dass auch in diesem Fall g( f ) ∈ Fn+1 ⊆ F .
Ist nun noch a ∈ F1 definiert durch a(1) = 1, so gibt es nach dem Rekursionssatz (Satz 2.3.3) eine Abbildung
φ : N → F , sodass φ(1) = a und φ(n + 1) = g(φ(n)). Wir setzen
[
φ(n).
σ=
n∈N
Durch vollständige Induktion zeigt man leicht, dass φ(n) ∈ Fn und dass φ(m) eine Fortsetzung von φ(n) für alle m, n ∈
N, m > n ist. Man sieht daher sofort, dass σ : N → N eine Funktion ist, wobei σ|{1,...,n} = φ(n).
Weiters ist σ injektiv, da für i < j ∈ N, unter der zusätzlichen Voraussetzung σ(i), σ( j) ∈ M1 (M2 ) nach (i) die Relation
σ(i) = φ(N)(i) < φ(N)( j) = σ( j) mit irgendeinem N ≥ i, j folgt. Ist σ(i) ∈ M1 ∧ σ( j) ∈ M2 bzw. σ(i) ∈ M2 ∧ σ( j) ∈ M1 , so
muss auch σ(i) , σ( j), da M1 ∩ M2 = ∅.
σ ist sogar surjektiv. Dazu sei k ∈ N. Wir nehmen an, dass k ∈ M1 . Wäre k < σ(N), so folgt aus σ( j) ∈ M1 wegen
σ( j) = φ( j)( j) und (ii), dass σ( j) < k. Also gilt {k, k + 1, . . . } ∩ σ(N) ⊆ M2 . Da σ injectiv ist, muss dieser Schnitt unendlich
viele Zahlen enthalten. Wegen (ii) ist mit m ∈ σ(N), m > k, auch {k, k + 1, . . . , m} ⊆ σ(N), und somit
{k, k + 1, . . . } = {k, k + 1, . . . } ∩ σ(N) ⊆ M2 .
Somit hätten wir den Widerspruch, dass M1 endlich ist. Entsprechend führt auch k ∈ M2 und k < σ(N) auf einen Widerspruch.
P
′
Nun gilt es noch zu zeigen, dass ∞
j=1 aσ( j) = S . Dazu sei ǫ > 0, und wähle k1 ∈ M1 (k2P∈ M2 ) so, dass |ak | < ǫ
für alle k ≥ k1 (k ≥ k2 ). Das ist möglich, da die Folge der Summanden der konvergenten Reihe ∞
j=1 a j ja eine Nullfolge
bildet. Sei N die kleinste Zahl in N, sodass σ(N) > k1 , σ(N) > k2 und sodass σ(N) ∈ M1 ∧ σ(N + 1) ∈ M2 oder σ(N) ∈
M2 ∧ σ(N + 1) ∈ M1 .
Für ein k ≥ N+1 sei m ∈ {N, . . . , k−1} die größte Zahl mit σ(m) ∈ M1 ∧σ(m+1) ∈ M2 oder σ(m) ∈ M2 ∧σ(m+1) ∈ M1 .
Im ersten Fall muss dann σ(m + 1), . . . , σ(k) ∈ M2 und im zweiten σ(m + 1), . . . , σ(k) ∈ M1 . Wegen g(σ|{1,...,l} ) = σ|{1,...,l+1}
muss im ersten Fall
m−1
m
k−1
m−1
X
X
X
X
aσ( j) + aσ(m) .
aσ( j) =
aσ( j) ≤
aσ( j) < S ′ ≤
m−1
X
j=1
j=1
j=1
und im zweiten
aσ( j) + aσ(m) =
m
X
j=1
j=1
In jedem Fall gilt
aσ( j) ≤
k−1
X
j=1
j=1
aσ( j) < S ′ ≤
m−1
X
aσ( j) .
j=1
k
X
aσ( j) − S ′ ≤ |aσ (k)| + |aσ(m) | < 2ǫ.
j=1
3.9.6 Bemerkung. Für komplexwertige Reihen gilt Satz 3.9.4 nicht.
Als nächstes wollen wir uns mit dem Distributivgesetz befassen. Für zwei endliche
Summen gilt ja
 n   m 
n,m
X
X  X 
 ai  ·  b j  =
ai b j .


i=1
Möchte man das Produkt
∞
P
i=1
!
ai ·
j=1
∞
P
b j von zwei Reihen ausrechnen, so muss man
j=1
also alle Einzelprodukte aufsummieren:
a1 b1
+
a2 b1
+
a3 b1
+
..
.
+
+
+
i=1, j=1
!
a1 b2
+
a2 b2
+
a3 b2
+
..
.
+
+
+
a1 b3
+
a2 b3
+
a3 b3
+
..
.
+ ...
+ ...
+ ...
(3.17)
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
87
Wie wir gesehen haben, ist es nicht unwesentlich, in welcher Reihenfolge man das
tut.
Die Problematik (3.17) aufzusummieren führt zu so genannten Doppelreihe. Es gilt
also gegebene Zahlen ai j , i, j ∈ N,
a11
a21
a31
..
.
a12
a22
a32
..
.
a13
a23
a33
..
.
...
...
...
..
.
in einer vernünftigen Art und Weise aufzusummieren. Eine Möglichkeit, das zu tun,
P
wären zuerst die Zeilen aufzusummieren, si = ∞j=1 ai j , und dann die Spalten:
∞

∞ X
X


 ai j  ;
S1 =
i=1
eine andere, zuerst die Spalten, v j =
P∞
i=1
S2 =
j=1
ai j , und dann die Zeilen



 ai j  .
∞ 
∞
X
X
j=1
Mann könnte auch längs der Diagonalen
i=1


∞ X
X



S3 =
ai j  ,
(3.18)
k=2 i+ j=k
oder überhaupt auf irgend eine andere Weise aufsummieren. Dass dabei aber viel
schiefgehen kann, zeigt das folgende Beispiel.
3.9.7 Beispiel. Betrachte man
1
+
0
+
0
+
0
+
..
.
−
+
+
+
1
+
1
+
0
+
0
+
..
.
+
−
+
+
0
+
1
+
1
+
0
+
..
.
+
+
−
+
0
+
0
+
1
+
1
+
..
.
+
... =
0
+
... =
0
+
... =
0
−
... =
0
..
.
=
1\0
=
=
=
=
1 + 0 + 0 + 0 + ... =
P∞ P∞
P P∞
d.h. ∞
j=1
i=1 ai j = 1. Summiert man längs der Diagonalen, so
i=1
j=1 ai j = 0,
erhält man
1 − 1 + 1 − 1 + 1 − 1 ± ...,
diese Summe ist also nicht einmal konvergent.
P
3.9.8 Definition. Eine Reihe ∞
k=1 bk heißt eine lineare Anordnung der Doppelreihe
P∞
17
i, j=1 ai j , falls bk = aτ(k) mit einer Bijektion τ : N → N × N .
17 Bekanntlich sind N und N × N gleich mächtig, was bedeutet, dass es solche linearen Anordnungen
tatsächlich gibt.
KAPITEL 3. DER GRENZWERT
88
3.9.9 Bemerkung. Von den drei oben genannten Summationsmethoden entspricht nur
die Summation längs der Diagonalen eine lineare Anordnung. Die dazugehörige Bijektion kann man folgendermaßen veranschaulichen:
i= 1
2
3
4
..
.
j=
1
•τ(1)
•τ(3)
•τ(6)
•τ(10)
..
.
2
•τ(2)
•τ(5)
•τ(9)
·
..
.
3
•τ(4)
•τ(8)
·
·
..
.
4
•τ(7)
·
·
·
..
.
···
···
···
···
···
Die Summe aus (3.18) ist dann nichts anderes als
 k(k+1)


∞ 
2
 X
X


a
 ,
τ(l) 


k(k−1)
k=1
l=
P∞
und stimmt wegen Fakta 3.7.4, 2, mit
2
l=1
+1
aτ(l) überein.
Um τ wasserdicht zu definieren, sei ψ : N × N → N × N mit ψ(i, j) = (i + j, i). Man sieht sofort, dass ψ injektiv ist.
Außerdem ist i + 1 ≤ i + j. Also liegt ψ(i, j) in D := {(d, p) ∈ N × N : p + 1 ≤ d}. Ist andererseits (d, p) in dieser Menge, so
ist ψ(p, d − p) = (d, p). Also ist ψ : N × N → D bijektiv.
+ p. Sei (d1 , p1 ) , (d2 , p2 ), wobei oBdA. d1 ≤ d2 . Ist d1 < d2 ,
Nun sei φ : D → N definiert durch φ(d, p) = (d−1)(d−2)
2
so gilt wegen p1 ≤ d1 − 1
(d1 − 1)(d1 − 2)
(d1 − 1)(d1 − 2)
d1 (d1 − 1)
(d2 − 1)(d2 − 2)
(d2 − 1)(d2 − 2)
+ p1 ≤
+ d1 − 1 =
≤
<
+ p2 ,
2
2
2
2
2
und somit φ(d1 , p1 ) , φ(d2 , p2 ). Ist d1 = d2 , so muss p1 , p2 und somit auch φ(d1 , p1 ) , φ(d2 , p2 ). Also ist φ injektiv. Sei
. Setzen wir p = n − (d−1)(d−2)
, so muss 1 ≤ p ≤ d − 1, da
umgekehrt n ∈ N und d ∈ N, d ≥ 2 maximal, sodass n > (d−1)(d−2)
2
2
im Falle p > d − 1
(d − 1)(d − 2)
d(d − 1)
(d − 1)(d − 2)
>d−1+
=
n= p+
2
2
2
folgen würde. Das widerspricht aber der Maximalität von d. Also ist φ : D → N bijektiv. Nun sei τ die Inverse von
φ ◦ ψ : N × N → N. Also ist τ : N → N × N bijektiv, wobei
τ−1 (i, j) =
(i + j − 1)(i + j − 2)
+ i.
2
3.9.10 Satz.
P
(i) Sei die Doppelreihe ∞
i,P
j=1 ai j reeller oder komplexer Zahlen gegeben. Ist eine
lineare Anordnung von ∞
i, j=1 ai j absolut konvergent, so auch alle anderen, und
alle haben die selbe Summe S .
(ii) Die absolute Konvergenz ist genau dann der Fall, wenn für ein C > 0 und allen
n∈N
n X
n
X
| ai j |≤ C
(3.19)
i=1 j=1
(iii) Die absolute Konvergenz
ist genau
dann der Fall, wenn sowohl
P P
j ∈ N also auch ∞j=1 ∞
|a
|
i=1 i j konvergiert. Dabei gilt

∞ 
∞
X
X

 ai j 
S =
j=1
i=1
P∞
i=1
|ai j | für alle
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
(iv) Die absolute Konvergenz ist genau dann der Fall, wenn sowohl
P P∞
i ∈ N also auch ∞
i=1
j=1 |ai j | konvergiert. Dabei gilt

∞
∞ X
X


 ai j 
S =
i=1
89
P∞
j=1
|ai j | für alle
j=1
Beweis.
(i) Da für zwei lineare Anordnungen τ1 , τ2 die Funktion τ−1
2 ◦ τ1 eine Bijektion auf
N ist, sind zwei lineare Anordnungen Umordnungen voneinander, und die erste
Behauptung folgt aus Satz 3.9.3.
(ii) Da jede endliche M ⊆ N × N für hinreichend großes n ∈ N in einem Quadrat
{1, . . . , n} × {1, . . . , n} enthalten ist, ist die Bedingung (3.19) äquivalent zu:
X
| ai j |≤ C
(3.20)
(i, j)∈M
für alle endlichen Teilmengen M ⊆ N × N.
Ist nun τ : N → N × N eine lineare Anordnung, so ist letztere Bedingung äquivalent zur Bedingung aus Lemma 3.9.2, (ii), wobei an = aτ(n) . Aus Lemma 3.9.2
P
folgt, dass (3.19) äquivalent zur absoluten Konvergenz von ∞
n=1 an ist.
P
Pn
P∞ P∞
(iii) Ist C := j=1 i=1 |ai j | < +∞ und n ∈ N, so folgt wegen i=1 |ai j | ≤ ∞
i=1 |ai j |
sicherlich (siehe Lemma 3.3.1)


n
∞ 
n
n 
X

X
 X
X
 |ai j | ≤ C.
 |ai j | ≤
j=1
i=1
j=1
i=1
Somit gilt (3.19).
Nehmen wir umgekehrt (3.19) an, so haben wir schon gesehen, dass dann (3.20)
gilt. Setzen wir speziell M = {1, . . . , k} × { j}, so folgt
k
X
i=1
Also sind alle Reihen
P∞
i=1
| ai j |≤ C, k ∈ N.
ai j absolut konvergent.
Aus der absoluten Konvergenz folgt wegen Lemma 3.9.2 die Bedingung (3.15).
Überträgt man nun diese mit einer lineare Anordnung τ : N → N × N auf unsere
Doppelreihe, so ist (3.15) äquivalent zu
X
∀ǫ > 0 ∃M0 ⊆ N × N, M0 endlich : a(i, j) − S < ǫ,
(i, j)∈M
für alle endlichen M, M0 ⊆ M ⊆ N × N.
Wie oben schon bemerkt, findet man zu einem endlichen M0 ⊆ N × N ein n0 ∈ N,
sodass M0 ⊆ {1, . . . , n0 } × {1, . . . , n0 }. Ist m ≥ n ≥ n0 , so ist sicher auch M0 ⊆
{1, . . . , m} × {1, . . . , n} =: Qm , und es gilt daher
n X
m
X
X
a(i, j) − S = a(i, j) − S < ǫ.
j=1 i=1
(i, j)∈Qm
KAPITEL 3. DER GRENZWERT
90
Lässt man nun bei festgehaltenem n die Zahl m gegen unendlich streben, so folgt
mit Lemma 3.3.1


n X
∞
X

 ai j  − S ≤ ǫ.


j=1
i=1
Somit haben wir aber gezeigt, dass
∞

n X
X


lim
 ai j  = S .
n→∞
j=1
i=1
Wendet man diese Argumentation
auf |a(i, j) | anstatt a(i, j) an, so folgt auch die
P∞ P∞
Konvergenz von j=1 i=1 |ai j | .
(iv) Man argumentiert wie im letzten Punkt.
❑
3.9.11 Bemerkung. Aus (iii) und (iv) von Satz 3.9.10 folgt insbesondere:
lim lim
u→∞ v→∞
u X
v
X
ai j = lim lim
v→∞ u→∞
i=1 j=1
u X
v
X
ai j .
i=1 j=1
P
P∞
3.9.12 Korollar. Seien die beiden Reihen ∞
i=1 ai und
j=1 b j absolut konvergent, und
sei
∞  ∞ 
X  X 
S =  ai  ·  b j  .
i=1
j=1
P
Dann ist jede lineare Anordnung der Doppelreihe ∞
i, j=1 ai b j absolut konvergent und
alle haben die Summe S . Weiters gilt
m−1

∞

∞

∞ X
∞ X
∞ X
X
 X
 X






 ai bm−i  =
 ai b j  =
S =
 ai b j  ,
m=2
i=1
i=1
j=1
j=1
i=1
wobei alle auftretenden Reihen absolut konvergieren.
P
P∞
Beweis. Sei ∞
j=1 |b j | = D, dann folgt
i=1 |ai | = C,
n X
m
X
i=1 j=1
|ai b j | =
n
X
i=1
m
X
|ai | ·
|b j | ≤ C · D ,
j=1
also sind nach Satz 3.9.10 alle linearen Anordnungen sowie die iterierten Reihen absolut konvergent und haben die gleiche Summe S ′ .
Diese kann man auch berechnen als
S ′ = lim lim
n→∞ m→∞
lim
n→∞
n X
m
X
ai b j = lim lim
n→∞ m→∞
i=1 j=1
m
n
i
X
h X
bj =
ai ·
i=1
j=1
∞
∞
∞
n
X
i X
X
h X
bj = S .
ai ·
bj =
ai ·
i=1
j=1
i=1
j=1
3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN
91
Ist schließlich τ : N → N × N die spezielle Bijektion aus Bemerkung 3.9.9, so folgt
wegen Fakta 3.7.4, 2, mit αi j = ai b j
S′ =
∞
X
l=1
da für l =
k(k−1)
2
ατ(l)
 k(k+1)
∞ 
2
 X
X

=

k=1 l= k(k−1) +1
2

m−1

 X
∞ X



 ai bm−i  ,
ατ(l)  =
 m=2 i=1
+ 1, . . . , k(k+1)
und τ(l) = (i, j) gerade i + j = k + 1.
2
❑
3.9.13 Beispiel. Definiere eine Funktion exp : C → C durch
exp(z) :=
∞
X
zn
, z ∈ C.
n!
n=0
Zunächst müssen wir diese Definition rechtfertigen, also zeigen, dass diese Reihe konvergiert. Für jedes feste z ∈ C gilt
n+1 z
(n+1)!
z
= 0.
lim zn = lim
n→∞ (n + 1)
n→∞ n!
P zn
Nach dem Quotientenkriterium ist die Reihe ∞
n=0 n! für jedes feste z ∈ C absolut
konvergent.
Wir wollen für zwei Zahlen z, w ∈ C das Produkt exp(z) exp(w) ausrechnen. Dazu verwenden wir Summation längs der Diagonalen. Wir erhalten aus Korollar 3.9.12
(unter Beachtung einer Indexverschiebung)
exp(z) · exp(w) =
∞ X
k
X
k=0
j=0
zk− j w j .
(k − j)! j!
Nach dem Binomischen Lehrsatz gilt
k
X
j=0
zk− j w j
1
= (z + w)k ,
(k − j)! j!
k!
und wir erhalten
∞
X
1
(z + w)k = exp(z + w) .
exp(z) exp(w) =
k!
k=0
Die Funktion exp heißt auch die Eulersche18 Exponentialfunktion. Sie ist eine der wichtigsten Funktionen, die es in der Mathematik gibt. Wir werden sie zum Beispiel auch
dafür benützen um Funktionen wie sin z oder cos z zu definieren, vgl. den Abschnitt
über elementare Funktionen.
3.9.14 Bemerkung. In analoger Weise kann man dreifach, vierfach, usw. Summen betrachten. Mit der entsprechend angepassten Definition von linearer Anordnung gelten
dabei ganz ähnliche Aussagen wie für Doppelsummen.
18 Leonhard
Euler. 15.4.1707 Basel - 18.9.1783 St.Petersburg
92
KAPITEL 3. DER GRENZWERT
Kapitel 4
Die Konstruktion der reellen
Zahlen
Wir wollen in diesem Kapitel die am Anfang verschobene Konstruktion der reellen
Zahlen nachholen und zeigen, dass diese eindeutig dadurch charakterisiert sind, dass R
ein vollständig angeordneter Körper ist.
Wir wollen uns als erstes mit einer Bemerkung beschäftigen, die uns zeigt, dass
die reellen Zahlen im Sinne der Theorie metrischer Räume ganz natürlich aus den
rationalen Zahlen entstehen. Dafür noch eine Definition:
4.1.1 Definition.
(i) Seien hY, dY i und hX, dX i metrische Räume. Eine Abbildung φ : Y → X heißt
isometrisch, wenn
dX (φ(a), φ(b)) = dY (a, b), a, b ∈ Y .
(ii) Seien hY, dY i und hX, dX i metrische Räume. Dann sagen wir hY, dY i ist isometrisch
in hX, dX i enthalten, wenn Y ⊆ X und
dY (a, b) = dX (a, b), a, b ∈ Y .
(iii) Sei hX, di ein metrischer Raum und sei Y ⊆ X. Dann heißt Y dicht in hX, di,
wenn es zu jedem Punkt x ∈ X eine Folge (yn )n∈N von Punkten aus Y gibt, mit
limn→∞ yn = x bezüglich der Metrik d.
4.1.2 Bemerkung. Hat man die reellen Zahlen als vollständig angeordneten Körper zur
Verfügung (was ja noch nicht der Fall ist), so wissen wir von Beispiel 3.2.6, dass Q
eine dichte Teilmenge von R (bezüglich der euklidischen Metrik) ist.
Wir sehen, dass die reellen Zahlen versehen mit der euklidischen Metrik ein
vollständiger metrischer Raum sind, der hQ, di (d(x, y) = |x − y|) isometrisch und dicht
enthält.
Es ist also jede reelle Zahl der Grenzwert einer Cauchy-Folge rationaler Zahlen.
Umgekehrt ist, wegen dem Cauchyschen Konvergenzkriterium, jede Cauchy-Folge rationaler Zahlen konvergent gegen eine gewisse reelle Zahl.
Da Metriken Werte in R haben, benötigt man die reellen Zahlen, um von CauchyFolgen sprechen zu können. Wenn wir aber den Begriff des metrischen Raumes hX, di
93
94
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
leicht dadurch verändern, dass wir annehmen, dass d nur Werte in Q hat, so kann man
dem Begriff der Cauchy-Folge auch Sinn geben, wenn man nur Q zur Verfügung hat.
Ein solcher metrischer Raum ist klarerweise hQ, di, wobei d(x, y) = |x − y|, siehe dazu
Bemerkung 3.1.2.
Eine Folge (xn )n∈N in einem solchen Raum X heißt dann konvergent gegen x ∈ X,
wenn
∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N ,
und sie heißt Cauchy-Folge, wenn
∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle m, n ≥ N .
Wir werden nun einen vollständig angeordneten Körper konstruieren, der aus rationalen Cauchy-Folgen besteht, wobei wir klarerweise Cauchy-Folgen, die sich nur um
eine Nullfolge unterscheiden, als gleich anzusehen haben.
(i) Sei X die Menge aller rationalen Cauchy-Folgen, und sei ∼⊆ X × X die Relation
(rn )n∈N ∼ (sn )n∈N : ⇐⇒ lim (rn − sn ) = 0.
n→∞
Diese Relation ist eine Äquivalenzrelation: Dabei ist Reflexivität und Symmetrie
klar, um die Transitivität nachzuweisen, seien (rn )n∈N ∼ (sn )n∈N und (sn )n∈N ∼
(tn )n∈N gegeben. Es ist limn→∞ (rn − sn ) = limn→∞ (sn − tn ) = 0, und somit gilt für
die Summe dieser Folgen limn→∞ (rn − tn ) = 0. Also ist (rn )n∈N ∼ (tn )n∈N .
Es sei bemerkt, dass wir die Rechenregeln für Folgen in Q-wertigen metrischen
Räumen nicht hergeleitet haben, obwohl wir sie hier und im Folgenden des öfteren verwenden. Das zu tun ist aber nur eine Abschreibübung für die Ergebnisse
aus Proposition 3.2.15, Lemma 3.3.1 und Satz 3.3.4 indem wir immer dann, wenn
von R als Bildmenge der Metrik die Rede ist, diese durch Q ersetzen.
(ii) Unser Ziel soll sein, X/∼ zu einem vollständig angeordneten Körper zu machen.
Dazu brauchen wir Operationen, die wir zunächst auf X definieren:
(rn )n∈N + (sn )n∈N := (rn + sn )n∈N ,
−(rn )n∈N := (−rn )n∈N ,
(rn )n∈N · (sn )n∈N := (rn · sn )n∈N .
Mit (rn )n∈N , (sn )n∈N sind auch (rn )n∈N + (sn )n∈N , −(rn )n∈N und (rn )n∈N · (sn )n∈N
Cauchy-Folgen. Um das z.B. für die Multiplikation zu zeigen, sei C ∈ Q, C > 0,
sodass |rn |, |sn | ≤ C, n ∈ N (siehe Proposition 3.4.5), und rechne
|rn sn − rm sm | ≤ |rn sn − rn sm | + |rn sm − rm sm | ≤ C|sn − sm | + C|rn − rm |.
Dieser Ausdruck ist kleiner als ǫ, wenn man N so groß wählt, dass
ǫ
|sn − sm |, |rn − rm | < 2C
für m, n ≥ N.
(iii) Da die Verknüpfungen + und · gliedweise definiert sind, folgt aus den Rechenregeln auf Q, dass für + und · das Kommutativgesetz, das Assoziativgesetz und das
Distributivgesetz gelten. Klarerweise gilt auch
(rn )n∈N + (0)n∈N = (rn )n∈N , − (rn )n∈N + (rn )n∈N = (0)n∈N ,
(rn )n∈N · (1)n∈N = (rn )n∈N .
Wir können aber X nicht zu einem Körper machen, denn ist (rn )n∈N , (0)n∈N , so
können wir noch lange nicht ein multiplikativ Inverses dazu finden.
95
(iv) Die Äquivalenzrelation ∼ lässt sich nun mit Hilfe obiger Verknüpfungen charakterisieren:
(rn )n∈N ∼ (sn )n∈N ⇔ (rn )n∈N + (−(sn )n∈N ) ist Nullfolge,
und
(rn )n∈N ist Nullfolge ⇔ (rn )n∈N ∼ (0)n∈N .
Daraus sieht man leicht, dass obige Verknüpfungen mit den Operationen verträglich sind: Sind (rn )n∈N ∼ (rn′ )n∈N und (sn )n∈N ∼ (s′n )n∈N , so folgt
(rn )n∈N + (sn )n∈N ∼ (rn′ )n∈N + (s′n )n∈N , −(rn )n∈N ∼ −(rn′ )n∈N sowie (rn )n∈N · (sn )n∈N ∼
(rn′ )n∈N · (s′n )n∈N . Letztere Relation folgt etwa aus
(rn )n∈N · (sn )n∈N + (−(rn′ )n∈N · (s′n )n∈N ) =
rn (sn − s′n ) + s′n (rn − rn′ )
da mit (sn −
sind.
s′n )n∈N
und
(rn − rn′ )n∈N
n∈N
auch rn (sn −
∼ (0)n∈N ,
s′n ) + s′n (rn
− rn′ )
n∈N
Nullfolgen
(v) Setzt man1
P = {(rn )n∈N ∈ X : ∃δ ∈ Q, δ > 0, rn > δ für fast alle n ∈ N},
so gilt folgende Aussage: Ist (rn )n∈N ∈ X so gehört diese Folge zu genau einer der
folgenden Teilmengen: P, [(0)n∈N ]∼ , − P. Ist (rn )n∈N ∼ (rn′ )n∈N , so gehört (rn′ )n∈N
zur selben Teilmenge.
Beweis. Da nicht gleichzeitig rn > δ und −rn > δ für fast alle n ∈ N sein kann,
folgt P∩−P = ∅. Ist (rn )n∈N ∼ (0)n∈N , so ist sie eine Nullfolge. Also unterschreitet
|rn | jedes vorgegebene δ > 0, wenn n hinreichend groß ist, und (rn )n∈N kann damit
weder in P noch in −P liegen.
Seien (rn )n∈N , (rn′ )n∈N ∈ X äquivalent, aber beide nicht äquivalent zu (0)n∈N . Also
sind beide keine Nullfolgen. Für (rn )n∈N bedeutet das:
∃δ > 0 : |rn | ≥ δ für alle n in einer unendlichen Teilmenge M von N.
Sei N ∈ N, sodass |rn − rm |, |rn′ − rn | ≤ 4δ , m, n ≥ N. Ist nun m ∈ M, m, n ≥ N, so
folgt
δ
|rn′ | ≥ |rm | − |rn′ − rn | − |rn − rm | ≥ .
2
Wegen |rn′ − rm | ≤ 2δ und |rm | ≥ δ haben rn′ und rm dasselbe Vorzeichen. Also gilt
für fast alle n ∈ N, dass |rn′ | ≥ 2δ und dass sgn(rn′ ) = sgn(rm ) für unendlich viele
m ∈ M.
Da (rn )n∈N ∼ (rn )n∈N , erhält man mit dieser Argumentation genauso für fast alle
n, m ∈ N, dass |rn | ≥ 2δ und sgn(rn ) = sgn(rm ).
Also liegen (rn )n∈N und (rn′ )n∈N gemeinsam in P bzw. −P je nach dem Vorzeichen
von rm .
❑
1 Fast
alle bedeutet hier ’alle bis auf endlich viele’.
96
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
(vi) Man sieht auch ganz leicht, dass aus (rn )n∈N , (sn )n∈N ∈ P folgt, dass (rn )n∈N +
(sn )n∈N , (rn )n∈N · (sn )n∈N ∈ P.
(vii) Nun betrachten wir X/ ∼ und definieren:
[(rn )n∈N ]∼ + [(sn )n∈N ]∼ := [(rn )n∈N + (sn )n∈N ]∼ ,
[(rn )n∈N ]∼ · [(sn )n∈N ]∼ := [(rn )n∈N · (sn )n∈N ]∼ ,
−[(rn )n∈N ]∼ = [−(rn )n∈N ]∼ ,
P/ ∼ = {[(rn )n∈N ]∼ : (rn )n∈N ∈ P}.
Aus (iv) wissen wir, dass die Verknüpfungen damit wohldefiniert sind und aus
(v), dass P/ ∼, [(0)n∈N]∼ , −P/ ∼ paarweise disjunkte Mengen sind, deren Vereinigung X/ ∼ ist.
Nun übertragen sich das Kommutativgesetz, das Assoziativgesetz und das Distributivgesetz für + und ·. Die Restklasse [(0)n∈N ]∼ ist das additiv neutrale Element,
und [(1)n∈N ]∼ ist das multiplikativ neutrale Element. Weiters ist −[(rn )n∈N ]∼ das
additiv Inverse von [(rn )n∈N ]∼ .
Was X/ ∼ noch fehlt ein Körper zu sein, ist die Existenz einer multiplikativ Inversen. Dazu sei [(rn )n∈N ]∼ , [(0)n∈N ]∼ .
Nach (v) wissen wir, dass |rn | > δ für ein rationales δ > 0 und alle n ∈ N, n ≥ N.
Also gilt für m, n ≥ N
1 − 1 ≤ |rn − rm | ,
rn rm δ
und wir sehen, dass (qn )n∈N mit qn = r1n für n ≥ N, und qn = 0 für n < N, eine
Cauchy-Folge ist, und dass [(rn )n∈N ]∼ · [(qn )n∈N ]∼ = [(1)n∈N ]∼ .
Schließlich ist hX/ ∼, +, ·, P/ ∼i wegen (vi) sogar ein angeordneter Körper. Wir
bemerken noch, dass wegen (v) für die Ordnung ≤ auf X/ ∼ gilt, dass
[(rn )n∈N ]∼ < [(sn )n∈N ]∼ ⇔ rn ≤ sn + δ, n ≥ N
für ein δ > 0 und ein N ∈ N. Insbesondere gilt rn ≤ sn , n ≥ N ⇒ [(rn )n∈N ]∼ ≤
[(sn )n∈N ]∼ .
(viii) Da für zwei verschiedene rationale Zahlen r, s die konstante Folge (r − s)n∈N niemals eine Nullfolge ist und damit [(r)n∈N ]∼ und [(s)n∈N ]∼ zwei verschiedene Elemente in X/∼ sind, ist klar, dass man vermöge der Abbildung r 7→ [(r, r, . . . )]∼
die rationalen Zahlen als Teilmenge von X/∼ wiederfinden kann. Diese Identifizierung ist verknüpfungstreu, und auch die Ordnung ≤ bleibt erhalten.
(ix) hX/ ∼, +, ·, P/ ∼i ist ein archimedisch angeordneter Körper: Wenn [(rn )n∈N ]∼ ∈
X/ ∼, dann ist (rn )n∈N eine Cauchy-Folge und daher beschränkt. Da Q archimedisch angeordnet ist, gibt es ein N ∈ N, sodass rn ≤ N, n ∈ N. Das bedingt aber
[(rn )n∈N ]∼ ≤ [(N)]∼ .
(x) Nun wollen wir zeigen, dass unser Körper vollständig angeordnet ist. Dazu sei
A ⊆ X/ ∼ eine nach oben beschränkte, nicht leere Menge. Also gilt A < [(N)]∼
für ein N ∈ N.
97
Für j ∈ N sei 2− j Z die Menge aller rationalen Zahlen der Form qp mit p ∈ Z und
q = 2 j . Man sieht leicht, dass 2− j Z ⊆ 2− j−1 Z und dass der Abstand von zwei
verschiedenen Zahlen aus 2− j Z immer ein Vielfaches von 2− j ist.
Nun sei D j := {r ∈ 2− j Z : ∀a ∈ A : [(r)n∈N ]∼ > a}. Wegen N ∈ D j sind diese
Mengen nicht leer, und es gilt D j ⊆ D j+1 . Daraus folgt für x j := min D j , dass
x j+1 ≤ x j . Es sei bemerkt, dass D j eine Minimum hat, da die Zähler p von r ∈ D j
die Ungleichung p ≥ 2 j M erfüllen müssen, wobei M ∈ Z mit [(M)]∼ ≤ a0 für
irgendein festes a0 ∈ A.
Für die x j gilt nun x j − x j+1 ≤ 2− j−1 . Wäre diese Differenz nämlich größer, so
wäre sie zumindest 22− j−1 , da die Abstände zwischen Elementen von D j+1 ja
Vielfache von 2− j−1 sind. Das würde aber [(x j − 2− j )n∈N ]∼ ≥ [(x j+1 )n∈N ]∼ > A
implizieren, was der Wahl von x j als kleinstes Element in 2− j Z mit [(x j )n∈N ]∼ > A
widerspricht.
Die Folge (xn )n∈N ist eine Cauchyfolge, denn ist ǫ > 0 und n0 ∈ N so, dass
2−n0 < ǫ, und sind n > l ≥ n0 , so folgt
|xl − xn | = xl − xn =
n
X
(xk−1 − xk ) ≤
k=l+1
n
X
2−k <
k=l+1
∞
X
2−k = 2−l ,
(4.1)
k=l+1
wobei dieser Ausdruck ist aber kleiner oder gleich 2−n0 und daher kleiner ǫ ist.
Nun gilt [(xn )n∈N ]∼ = sup A. Um das zu einzusehen, wollen wir zunächst zeigen,
dass [(xn )n∈N ]∼ eine obere Schranke von A ist.
Angenommen wir hätten a > [(xn )n∈N ]∼ für ein a = [(an )n∈N ] ∈ A. Dann gäbe
es ein δ > 0 und ein n1 ∈ N, sodass an ≥ xn + δ, n ≥ n1 . Nun wähle man ein
natürliches l ≥ n1 so groß, dass 2−l ≤ δ. Für n > l folgt mit (4.1)
xl = xn + (xl − xn ) < xn + 2−l ≤ an ,
und somit [(xl )n∈N ]∼ ≤ a, was aber xl ∈ Dl widerspricht.
Ist b = [(bn )n∈N ] eine obere Schranke von A, d.h. A ≤ b, und wäre b < [(xn )n∈N ]∼ ,
so wäre
bn ≤ xn − δ,
für alle n größer gleich einem n2 ∈ N.
Ist l ≥ n2 mit 2−l ≤ δ, so folgt aus der Monotonie der xn für n > l
bn ≤ xn − 2−l ≤ xl+1 − 2−l ,
und daher bn + 2−l−1 ≤ xl+1 − 2−l−1 , n > l. Damit haben wir A ≤ b < [(xl+1 −
2−l−1 )n∈N ]∼ bzw. xl+1 − 2−l−1 ∈ Dl+1 . Das widerspricht aber der Minimalität von
xl+1 .
Also können wir uns nun sicher sein, dass es vollständig angeordnete Körper gibt.
Es bleibt zu zeigen, dass diese bis auf Kopien eindeutig sind.
4.1.3 Satz. Ist hK, +, ·, Pi ein vollständig angeordneter Körper und hX/ ∼, +, ·, P/ ∼i
der soeben konstruierte Körper, dann gibt es eine Bijektion φ̃ : X/ ∼ → K, die
verknüpfungstreu und ordnungstreu ist.
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
98
Beweis. Nach Proposition 2.5.7 gibt es eine verknüpfungs- und ordnungstreue injektive
Abbildung φ : Q → K. Insbesondere sind die Bilder von Nullfolgen bzw. CauchyFolgen wieder Nullfolgen bzw. Cauchy-Folgen.
Ist [(rn )n∈N ]∼ ∈ X/ ∼, so definieren wir
φ̃([(rn )n∈N ]∼ ) := lim φ(rn ).
n→∞
Man beachte, dass der Grenzwert existiert, da K ja ein vollständig angeordneter Körper
ist (vgl. Satz 3.4.10), und dass der Grenzwert nicht von der Wahl des Repräsentanten
(rn )n∈N der Restklasse [(rn )n∈N ]∼ abhängt: Ist nämlich (rn )n∈N ∼ (sn )n∈N , so folgt
lim φ(rn ) = lim φ(sn ) + lim φ(rn − sn ) = lim φ(sn ).
n→∞
n→∞
n→∞
n→∞
φ̃ ist injektiv, da
[(rn )n∈N ]∼ = [(sn )n∈N ]∼ ⇔ lim (rn − sn ) = 0 ⇔ lim φ(rn ) = lim φ(sn ).
n→∞
n→∞
n→∞
Die Surjektivität folgt aus der Tatsache, dass jede Zahl aus K durch eine Folge rationaler Zahlen approximiert werden kann (siehe Beispiel 3.2.6).
Die Verträglichkeit mit + folgt aus (siehe Satz 3.3.4)
φ̃([(rn )n∈N ]∼ + [(sn )n∈N ]∼ ) = lim φ(rn + sn ) =
n→∞
lim φ(rn ) + lim φ(sn ) = φ̃([(rn )n∈N ]∼ ) + φ̃([(sn )n∈N ]∼ ),
n→∞
n→∞
und die für · zeigt man genauso. Um die Verträglichkeit mit der Ordnung zu zeigen sei
bemerkt, dass (siehe Lemma 3.3.1) φ̃([(rn )n∈N ]∼ ) ∈ P ⇔ limn→∞ φ(rn ) > 0 ⇔ ∃δ >
0, φ(rn ) > δ für alle n ≥ N. Das heißt aber genau [(rn )n∈N ]∼ ∈ P/ ∼.
❑
Somit haben wir die Existenz und die Eindeutigkeit eines vollständig angeordneten
Körpers und damit auch Satz 2.7.3 bewiesen.
4.1.4 Bemerkung. Die in diesem Abschnitt angegebene Vorgangsweise aus Q die reellen Zahlen zu konstruieren lässt sich auch anwenden um zu zeigen, dass es zu jedem
metrischen Raum hX, di einen vollständigen metrischen Raum hX̂, d̂i gibt, sodass hX, di
isometrisch und dicht in hX̂, d̂i enthalten ist.
In der Tat nimmt man auch hier die Menge X aller Cauchy-Folgen in hX, di, betrachtet genauso die Äquivalenzrelation ∼, die zwei Folgen identifiziert, falls deren
Differenz eine Nullfolge ist, und beweist, dass X/ ∼ versehen mit einer geeigneten
Metrik der gesuchte metrische Raum ist.
Kapitel 5
Geometrie metrischer Räume
5.1 ǫ-Kugeln, offene und abgeschlossene Mengen
Als erstes wollen wir uns dem anschaulich leicht verständlichen Begriff der Kugel in
metrischen Räumen zuwenden.
5.1.1 Definition. Sei hX, di ein metrischer Raum und x ∈ X. Dann heißt die Menge
Uǫ (x) := {y ∈ X : d(y, x) < ǫ} die offene ǫ-Kugel um den Punkt x, und die Menge
Kǫ (x) := {y ∈ X : d(y, x) ≤ ǫ} die abgeschlossene ǫ-Kugel um den Punkt x.
5.1.2 Beispiel.
(i) Man betrachte R versehen mit der euklidischen Metrik. Für x ∈ R ist dann
Uǫ (x) = (x − ǫ, x + ǫ) und Kǫ (x) = [x − ǫ, x + ǫ].
(ii) Sei X eine Menge, und sei diese mit der diskreten Metrik aus Beispiel 3.1.5 versehen. Ist ǫ ≤ 1, so gilt dann in diesem Raum Uǫ (x) = {x}. Falls ǫ > 1, so gilt
Uǫ (x) = X.
(iii) Betrachte R2 , und versehe diese Menge einerseits mit der Metrik, d1 , der euklidischen Metrik d2 und mit d∞ (siehe Beispiel 3.1.5). Die ǫ-Kugeln Uǫ1 (0) bzgl. d1
sowie Uǫ (0) bzgl. d2 bzw. Uǫ∞ (0) bzgl. d∞ lassen sich folgendermaßen darstellen.
Uǫ1 (0)
Uǫ∞ (0)
Uǫ (0)
ǫ
ǫ
ǫ
ǫ
ǫ
ǫ
Abbildung 5.1: ǫ-Umgebungen von 0
5.1.3 Bemerkung. Die Konvergenz einer Folge (xn )n∈N in metrischen Räumen lässt sich
durch obige Mengen folgendermaßen formulieren:
x = lim xn ⇔ ∀ǫ > 0 ∃N ∈ N : {xn : n ≥ N} ⊆ Uǫ (x).
n→∞
99
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
100
Da Uǫ (x) ⊆ Kǫ (x) ⊆ U2ǫ (x), können wir hier genauso Kǫ (x) anstatt Uǫ (x) schreiben.
Diese Sichtweise des Grenzwertbegriffes gewinnt zum Beispiel dann an Bedeutung, wenn man den Konvergenzbegriff bezüglich verschiedener Metriken vergleichen
will.
Wir betrachten zum Beispiel die Metriken d und d∞ aus Beispiel 5.1.2, (iii). Wegen
(3.8) gilt Uǫ (x) ⊆ Uǫ∞ (x) ⊆ U2ǫ (x). Nimmt man nun obiges Konvergenzkriterium her,
so folgt unmittelbar aus dieser Relation, dass eine Folge genau dann bzgl. d konvergiert,
wenn sie es bzgl. d∞ tut. Siehe Proposition 3.5.1.
5.1.4 Definition. Sei hX, di ein metrischer Raum. Eine Teilmenge O von X heißt offen,
wenn es zu jedem Punkt x ∈ O eine ǫ-Kugel gibt mit Uǫ (x) ⊆ O.
ǫ
x
ǫ ′′
x′′
ǫ
′
x′
O
Abbildung 5.2: Offene Mengen
5.1.5 Beispiel.
In (R, d) sind z.B. die Mengen (a, b) und R \ {0} offen. Denn ist etwa x ∈ (a, b),
b−x
so folgt für ǫ = min( x−a
2 , 2 ), dass U ǫ (x) = (x − ǫ, x + ǫ) ⊆ (a, b).
Man sieht sofort, dass in jedem metrischen Raum hX, di die Mengen ∅ und X
immer offen sind.
Ist hX, di ein metrischer Raum, so ist jede Kugel Uǫ (x) für beliebige x ∈ X, ǫ > 0
offen. In der Tat gilt für y ∈ Uǫ (x) definitionsgemäß d(x, y) < ǫ. Wählt man
δ = ǫ − d(x, y), so folgt für z ∈ Uδ (y) aus d(y, z) < δ, dass d(x, z) ≤ d(x, y) +
d(y, z) < d(x, y) + ǫ − d(x, y) = ǫ, und somit z ∈ Uǫ (x).
5.1.6 Proposition. Sei hX, di ein metrischer Raum. Dann gilt
Ist n ∈ N und sind O1 , . . . , On offene Teilmengen von X, so ist auch
Tn
i=1
Oi offen.
Ist I eine beliebige Indexmenge, und sind Oi offene Teilmengen von X, so auch
S
i∈I Oi .
5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN
101
Beweis. Seien O1 , . . . , On offen und x ∈ O1 ∩ . . . ∩ On . Definitionsgemäß gibt es
ǫ1 , . . . , ǫn > 0 mit Uǫi (x) ⊆ Oi , i = 1, . . . , n. Es folgt
Umin{ǫ1 ,...,ǫn } (x) = Uǫ1 (x) ∩ . . . ∩ Uǫn (x) ⊆ O1 ∩ . . . ∩ On .
Damit ist O1 ∩ . . . ∩ On offen.
S
Seien Oi , i ∈ I, offen, und x ∈ i∈I Oi . Dann existiert ein i ∈ I mit x ∈ Oi , und
S
daher ein ǫ > 0 mit Uǫ (x) ⊆ Oi . Insgesamt folgt Uǫ (x) ⊆ i∈I Oi .
❑
5.1.7 Definition. Sei hX, di ein metrischer Raum, E ⊆ X und x ∈ X.
Man nennt x einen Häufungspunkt von E, wenn jede ǫ-Kugel um x einen Punkt
aus E \ {x} enthält, bzw. wenn
∀ǫ > 0 ∃y ∈ E, x , y : d(x, y) < ǫ.
Wenn x ∈ E kein Häufungspunkt ist, so nennen wir ihn isolierten Punkt von E.
Das ist also ein Punkt aus E, sodass
∃ǫ > 0, Uǫ (x) ∩ E = {x}.
Wir sagen eine Menge A ⊆ X ist abgeschlossen, wenn jeder Häufungspunkt von
A schon in A enthalten ist.
5.1.8 Bemerkung. In jeder ǫ-Kugel Uǫ (x) um einen Häufungspunkt x von E liegen
sogar unendlich viele Punkte von E \{x}. Denn angenommen es wären nur endlich viele
x1 , . . . , xn , so erhielten wir mit δ := min{ǫ, d(x, x1 ), . . . , d(x, xn )} > 0 den Widerspruch
Uδ (x) ∩ E \ {x} = ∅.
5.1.9 Bemerkung. Sei E ⊆ X. Für ein x ∈ X tritt genau einer der folgenden Fälle ein:
(i) x ist isolierter Punkt von E.
(ii) x ∈ E und x ist Häufungspunkt von E.
(iii) x < E und x ist Häufungspunkt von E.
(iv) x < E und x ist nicht Häufungspunkt von E.
5.1.10 Definition. Die Menge aller x, die (i), (ii) oder (iii) erfüllen, wollen wir mit
c(E) (Abschluss der Menge E) bezeichnen.
5.1.11 Bemerkung. Klarerweise ist E ⊆ c(E), und x ∈ c(E) ⇔
∀ǫ > 0 ∃y ∈ E : d(x, y) < ǫ ⇔ ∀ǫ > 0 : E ∩ Uǫ (x) , ∅.
Außerdem ist E abgeschlossen genau dann, wenn c(E) = E.
Schließlich kann man einfach zeigen, dass c(c(E)) = c(E), also dass c(E) immer
abgeschlossen ist.
5.1.12 Beispiel.
Sei E = [0, 1) ∪ {2} als Teilmenge von R. Dann ist 1 ein Häufungspunkt von E,
da jede ǫ-Kugel (1 − ǫ, 1 + ǫ) um 1 sicherlich Punkte aus E enthält. Da 1 nicht
zu E gehört, ist E nicht abgeschlossen. Man weist auch leicht nach, dass [0, 1]
genau die Menge aller Häufungspunkte von E ist, und dass 2 ein isolierter Punkt
ist. Also ist c(E) = [0, 1] ∪ {2}
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
102
Ist hX, di ein beliebiger metrischer Raum, und E ⊆ X eine endliche Teilmenge,
so hat E keine Häufungspunkte, besteht daher nur aus isolierten Punkten und ist
daher immer abgeschlossen.
Ist hX, di ein beliebiger metrischer Raum, so sind auch ∅ und X abgeschlossen,
genauso wie jede abgeschlossene Kugel Kǫ (x). Ist nämlich y Häufungspunkt von
Kǫ (x), so gibt es zu jedem n ∈ N ein yn ∈ Kǫ (x) mit d(yn , y) < n1 . Also d(x, y) ≤
d(x, yn ) + d(yn , y) < ǫ + 1n , und, da die rechte Seite gegen ǫ konvergiert, folgt
d(x, y) ≤ ǫ (siehe Lemma 3.3.1). Somit ist y ∈ Kǫ (x).
Die im vorigen Beispiel gewählte Vorgangsweise lässt sich zu folgendem Ergebnis
ausbauen.
5.1.13 Lemma. Ein Punkt x ist ein Häufungspunkt einer Menge E genau dann, wenn
es eine Folge (xn )n∈N von Punkten xn ∈ E \ {x} gibt mit xn → x.
Ein Punkt x liegt genau dann in c(E), wenn es eine Folge (xn )n∈N von Punkten
xn ∈ E gibt mit xn → x.
Beweis. Ist x Häufungspunkt von E, so gibt es zu jedem n ∈ N ein xn ∈ E \ {x} mit
d(x, xn ) < 1n , also xn → x.
Ist x isolierter Punkt von E, so konvergiert die identische Folge x = xn , n ∈ N gegen
x. Diese Folge ist klarerweise aus E.
Sei nun umgekehrt x = limn→∞ xn für eine Folge aus E. Ist für ein n ∈ N, xn = x,
so folgt trivialerweise x = xn ∈ E ⊆ c(E).
Im Fall xn , x für alle n ∈ N ist die Folge (xn )n∈N sicher in E \ {x} enthalten, und
zu jedem ǫ > 0 gibt es ein N ∈ N, sodass ∅ , {xn : n ≥ N} ⊆ Uǫ (x). Jedes Element der
Menge auf der linken Seite ist in Uǫ (x) ∩ E \ {x} enthalten. x ist somit Häufungspunkt
von E.
❑
5.1.14 Beispiel. Ist F ⊆ R abgeschlossen und nach oben beschränkt, so sei x := sup F.
Nach Beispiel 3.2.6 gibt es in F eine Folge, die gegen sup F konvergiert. Die Abgeschlossenheit von F impliziert sup F ∈ F, d.h. sup F = max F.
Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum.
5.1.15 Bemerkung. In Definition 4.1.1 haben wir definiert, was es heißt, dass eine
Teilmenge E ⊆ X dicht in X ist. Wegen Lemma 5.1.13 ist das äquivalent zu c(E) = X.
5.1.16 Proposition. Sei hX, di ein metrischer Raum und sei A ⊆ X. Dann sind äquivalent:
(i) Ac (= X \ A) ist offen.
(ii) A ist abgeschlossen.
(iii) Ist (xn )n∈N eine Folge von Punkten aus A und ist (xn )n∈N konvergent, so liegt auch
ihr Grenzwert in A.
Beweis.
(i) ⇒ (ii): Sei Ac offen, und sei x ein Häufungspunkt von A. Wäre x < A, so folgt
aus Ac offen, dass Uǫ (x) ⊆ Ac für ein ǫ > 0, und daher Uǫ (x) ∩ A = ∅. Ein
Widerspruch, denn jede Umgebung von x muss mit A nichtleeren Schnitt haben.
Also muss x ∈ A.
5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN
103
(ii) ⇒ (i): Sei x ∈ Ac . Da A abgeschlossen ist, ist x kein Häufungspunkt von A. Also
gibt es ein ǫ > 0 mit Uǫ (x)∩A = Uǫ (x)∩A\{x} = ∅. Das ist aber gleichbedeutend
mit Uǫ (x) ⊆ Ac . Also ist Ac offen.
(ii) ⇔ (iii): Folgt unmittelbar aus der Tatsache, dass A abgeschlossen ist genau dann,
wenn c(A) = A, und aus Lemma 5.1.13.
❑
Diese einfache Charakterisierung von abgeschlossenen Mengen gibt uns unmittelbar das folgende Korollar von Proposition 5.1.6.
5.1.17 Korollar. Sei hX, di ein metrischer Raum. Dann gilt
S
Sind n ∈ N und A1 , . . . , An abgeschlossen, so auch ni=1 Ai .
Ist I eine beliebige Indexmenge, und sind alle Mengen Ai , i ∈ I, abgeschlossen,
T
so folgt, dass auch i∈I Ai abgeschlossen ist.
Beweis. Es gilt
n
[
i=1
Ai
c
=
n
[
\
\ (Ai )c .
(Aci ),
Ai c =
i=1
i∈I
i∈I
❑
5.1.18 Beispiel.
Korollar 5.1.17gestattet uns z.B. die Teilmenge T = {z ∈ C : |z| = 1} (Einheitskreislinie) als abgeschlossene Teilmenge von C zu identifizieren. In der Tat ist
T = K1 (0) ∩ (U1 (0))c , und damit Durchschnitt von abgeschlossenen Mengen.
Man betrachte M = {z ∈ C : Re z ≥ 0} als Teilmenge von C. Ist (zn )n∈N eine
Folge aus M, die gegen z ∈ C konvergiert, so muss nach Proposition 3.5.1 die
Folge (Re zn )n∈N in R gegen Re z konvergieren. Wegen Lemma 3.3.1 folgt aus
Re zn ≥ 0, n ∈ N, dass auch Re z ≥ 0 und damit z ∈ M. Nach Proposition 5.1.16
ist M abgeschlossen.
Die Teilmenge {z ∈ C : 0 ≤ Re z ≤ 1} von C lässt sich als Durchschnitt von
{z ∈ C : Re z ≥ 0} und {z ∈ C : Re z ≤ 1} schreiben. Nach dem vorhergehenden
Beispiel ist die erste Menge abgeschlossen. Entsprechendes gilt für die zweite
Menge. Also ist {z ∈ C : 0 ≤ Re z ≤ 1} der Durchschnitt von abgeschlossenen
Mengen und damit selber abgeschlossen.
Das Quadrat {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]} ist der Durchschnitt der
abgeschlossenen Mengen {z ∈ C : 0 ≤ Re z ≤ 1} und {z ∈ C : 0 ≤ Im z ≤ 1}, und
daher auch abgeschlossen.
Da die Menge {z ∈ C : Re z ≥ 0} abgeschlossen ist, folgt, dass ihr Komplement
M := {z ∈ C : Re z > 0} in C offen ist. Das kann man auch direkt nachweisen:
Ist z ∈ M beliebig, so wähle ǫ = Re z > 0. Ist w ∈ Uǫ (z), so folgt wegen
Re z − Re w ≤ | Re z − Re w| ≤ |z − w| und damit Re w > Re z − ǫ = 0, dass auch
w ∈ M, und daher Uǫ (z) ⊆ M.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
104
Das offene Quadrat M = {z ∈ C : Re z ∈ (0, 1), Im z ∈ (0, 1)} lässt sich als
Durchschnitt von endlich vielen offenen Mengen schreiben:
M = {z ∈ C : Re z > 0}∩{z ∈ C : Re z < 1}∩{z ∈ C : Im z > 0}∩{z ∈ C : Im z < 1}.
Sie ist daher selber offen.
5.2 Kompaktheit
Wir wollen nun auch Häufungspunkte für Folgen einführen.
5.2.1 Definition. Sei hX, di ein metrischer Raum. Dann heißt ein x ∈ X Häufungspunkt
einer Folge (xn )n∈N , falls es eine gegen x konvergente Teilfolge von (xn )n∈N gibt.
5.2.2 Lemma. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di.
(i) Konvergiert (xn )n∈N gegen x, so ist x der einzige Häufungspunkt (siehe Satz 3.2.9).
(ii) Ist (xn( j) ) j∈N eine Teilfolge von (xn )n∈N , so ist die Menge aller Häufungspunkte
von (xn( j) ) j∈N eine Teilmenge von der Menge aller Häufungspunkte von (xn )n∈N .
(iii) x ist Häufungspunkt der Folge (xn )n∈N genau dann, wenn für jedes N ∈ N der
Punkt x in c({xn : n ≥ N}) liegt.
Beweis.
(i) Das folgt unmittelbar aus Satz 3.2.9, da Teilfolgen konvergenter Folgen auch gegen den Grenzwert der Folge streben.
(ii) Da jede Teilfolge von (xn( j) ) j∈N erst recht eine Teilfolge von (xn )n∈N ist, muss jeder
Häufungspunkt von (xn( j) ) j∈N auch einer von (xn )n∈N sein.
(iii) Sei zunächst x Häufungspunkt der Folge (xn )n∈N . Also x = lim j→∞ xn( j) . Wir
halten N fest und wählen J ∈ N, sodass n(J) ≥ N. Dann ist (xn( j+J) ) j∈N eine Folge
in {xn : n ≥ N}, die gegen x konvergiert. Nach Lemma 5.1.13 ist x ∈ c({xn : n ≥
N}).
Ist umgekehrt x ∈ c({xn : n ≥ N}) für alle N ∈ N, so sei n(1) ∈ N so, dass
d(x, xn(1) ) < 1. Angenommen wir haben n(1) < · · · < n(k) gewählt, so sei n(k +
1
1) ∈ N, n(k + 1) > n(k) so, dass d(x, xn(k+1) ) < k+1
. So ein n(k + 1) existiert, da
x ∈ c({xn : n ≥ n(k) + 1}). Wir haben somit eine Teilfolge konstruiert, die gegen x
konvergiert. x ist somit Häufungspunkt der Folge (xn )n∈N .
❑
Folgender Satz ist ein sehr oft verwendetes Mittel in der Analysis.
5.2.3 Satz (Bolzano1-Weierstraß2 ). Sei (xn )n∈N eine beschränkte Folge in R p (versehen
mit der euklidischen Metrik). Dann hat (xn )n∈N einen Häufungspunkt.
1 Bernard
2 Karl
Bolzano. 5.10.1781 Prag - 18.12.1848 Prag
Theodor Wilhelm Weierstraß. 31.10.1815 Ostenfelde (Westfalen) - 19.12.1897 Berlin
5.2. KOMPAKTHEIT
105
Wir wollen uns diesem Satz zuerst im Falle p = 1 zuwenden. Betrachte also eine
reelle Folge (xn )n∈N , die beschränkt ist, d.h. |xn | ≤ C, n ∈ N. Für N ∈ N sei
yN := sup{xn : n ≥ N}.
Da R vollständig angeordnet ist, existieren diese Zahlen yN , und wegen
{xn : n ≥ N + 1} ⊆ {xn : n ≥ N} ist die Folge (yN )N∈N monoton fallend. Außerdem gilt
immer −C ≤ yN ≤ C. Also können wir Satz 3.4.2 anwenden und sehen, dass limN→∞ yN
existiert und mit inf{yN : N ∈ N} übereinstimmt.
5.2.4 Definition. Wir nennen diesen Grenzwert Limes Superior der Folge (xn )n∈N und
schreiben dafür
lim sup xn := inf sup xn = lim sup xn .
n→∞
N∈N n≥N
N∈N n≥N
Entsprechend existiert der Limes Inferior
lim inf xn := sup inf xn = lim inf xn .
n→∞
N∈N n≥N
N∈N n≥N
Ist (xn )n∈N nicht beschränkt, so kann man lim supn→∞ xn und lim inf n→∞ xn genauso
definieren, wobei diese dann Werte in R ∪ {−∞, +∞} annehmen.
5.2.5 Proposition. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen. Dann ist
lim supn→∞ xn ( lim inf n→∞ xn ) der größte (kleinste) Häufungspunkt von (xn )n∈N .
Insbesondere hat jede beschränkte Folge reeller Zahlen mindestens einen
Häufungspunkt.
Beweis. Wir zeigen die Behauptung für den Limes Superior. Den Fall des Limes Inferior behandelt man analog.
Um nachzuweisen, dass x = lim supn→∞ xn ein Häufungspunkt ist, bemühen wir
Lemma 5.2.2 und zeigen x ∈ c({xn : n ≥ k}) für jedes k ∈ N.
Ist ǫ > 0, so gibt es wegen der Konvergenz yN → x ein N0 ∈ N, sodass yN ∈
(x − ǫ, x + ǫ), N ≥ N0 . Wähle N ≥ max(N0 , k) beliebig. Da yN = sup{xn : n ≥ N} die
kleinste obere Schranke ist, gibt es xn , n ≥ N, sodass x − ǫ < xn ≤ yN < x + ǫ. Also
haben wir
xn ∈ (x − ǫ, x + ǫ) ∩ {xn : n ≥ k} , ∅,
und nach Bemerkung 5.1.9 ist x ∈ c({xn : n ≥ k}).
Ist schließlich y ein beliebiger Häufungspunkt von (xn )n∈N , so gibt es eine Teilfolge
(xn( j) ) j∈N , die gegen y konvergiert. Es folgt
yn( j) = sup{xk : k ≥ n( j)} ≥ xn( j)
für alle j ∈ N. Also y = lim j→∞ xn( j) ≤ lim j→∞ yn( j) = x.
❑
5.2.6 Fakta.
1. Aus lim supn→∞ xn = limN∈N supn≥N xn zusammen mit Satz 2.6.3 und Lemma
3.3.1 zeigt man, dass lim supn→∞ xn < ξ genau dann, wenn es ein q < ξ gibt,
sodass xn ≤ q für alle bis auf endlich viele n ∈ N. Entsprechendes gilt für
lim inf n→∞ xn .
2. Ähnlich zeigt man, dass lim supn→∞ xn > ξ genau dann, wenn es ein q > ξ gibt,
sodass xn ≥ q für unendlich viele n ∈ N. Entsprechendes gilt für lim inf n→∞ xn .
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
106
3. In der Tat ist lim supn→∞ xn jene eindeutige Zahl x, für die gilt:
Für jedes ǫ > 0 gibt es nur für endlich viele n ∈ N, die der Ungleichung xn ≥ x+ǫ
genügen, wogegen für unendlich viele n ∈ N die Ungleichung xn ≥ x − ǫ gilt.
Auch hier gilt entsprechendes für lim inf n→∞ xn .
4. Satz 3.8.1 lässt sich nun mit Hilfe von Limes Superior und Limes Inferior folgendermaßen formulieren, wobei die Divergenzkriterien schwächer als die in Satz
3.8.1 sind:
√
|
Falls lim supk→∞ k |ak | < 1 bzw. lim supk→∞ |a|ak+1
< 1, so konvergiert die Reihe
k|
∞
P
ak absolut.
k=1
√
Gilt lim supk→∞ k |ak | > 1 bzw. lim inf k→∞
|ak+1 |
|ak |
> 1, so divergieren diese Reihen.
5. Weiters folgt aus den Rechenregeln für Suprema und Infima, dass
lim supn→∞ (−xn ) = − lim inf n→∞ xn .
5.2.7 Beispiel. Man betrachte die Folge xn = (−1)n(1 + 1n ), n ∈ N in R. Die Teilfolge
1
1
konvergiert für k → ∞ gegen 1, und die Teilfolge x2k−1 = −1 − 2k−1
x2k = 1 + 2k
konvergiert für k → ∞ gegen −1.
Also sind −1 und 1 Häufungspunkte unserer Folge. Angenommen x ∈ R wäre ein
weiterer Häufungspunkt. Dann gäbe es eine Teilfolge (xn( j) ) j∈N , die gegen x konvergierte. Nun sei
J1 = { j ∈ N : n( j) ist ungerade} und J2 = { j ∈ N : n( j) ist gerade}.
˙ 2 , und somit ist zumindest eine dieser Mengen unendlich.
Klarerweise ist N = J1 ∪J
Ist J1 unendlich, so gibt es eine streng monoton wachsende Bijektion j : N →
J1 (vgl. Lemma 2.3.17). Also ist (xn( j(k)) )k∈N eine Teilfolge von (xn( j) ) j∈N und somit
ebenfalls gegen x konvergent. Andererseits konvergiert aber
xn( j(k)) = −1 −
1
n( j(k))
wegen n( j(k)) ≥ k gegen −1. Also muss x = −1. Ist J2 unendlich, so folgt analog
x = 1. Jedenfalls haben wir gezeigt, dass −1, 1 die einzigen Häufungspunkte sind. Aus
Proposition 5.2.5 folgt schließlich
lim inf xn = −1, lim sup xn = 1.
n→∞
n→∞
5.2.8 Korollar. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen. Dann sind folgende
drei Punkte äquivalent.
(i) (xn )n∈N ist konvergent.
(ii) (xn )n∈N hat nur einen Häufungspunkt.
(iii) lim inf n→∞ xn = lim supn→∞ xn .
Gilt (i)-(iii), so stimmt Grenzwert, einziger Häufungspunkt, sowie Limes Inferior und
Limes Superior überein.
Beweis.
5.2. KOMPAKTHEIT
107
(ii) ⇔ (iii): Folgt unmittelbar aus Proposition 5.2.5.
(i) ⇒ (ii): Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt
unserer Folge.
(iii) ⇒ (i): Die Voraussetzung x = lim inf n→∞ xn = lim supn→∞ xn bedeutet, dass x =
limN→∞ yN = limN→∞ zN , wobei yN = sup{xn : n ≥ N} und zN = inf{xn : n ≥ N}.
Also gibt es zu gegebenen ǫ > 0 einen Index N ∈ N, sodass y j , z j ∈ (x − ǫ, x + ǫ)
für alle j ≥ N. Wegen zN ≤ xn ≤ yN , n ≥ N folgt mit j = N
x − ǫ < zN ≤ xn ≤ yN < x + ǫ,
für alle n ≥ N. Also limn→∞ xn = x.
❑
Wir kommen nun zum Beweis des Satzes von Bolzano-Weierstrass.
Beweis. (von Satz 5.2.3) Für Folgen in R folgt der Satz aus Proposition 5.2.5.
Sei (xn )n∈N eine beschränkte Folge in R p , wobei xn = (xn,1 , . . . , xn,p ). Wegen (3.8)
gilt für k = 1, . . . , p
|xn,k | ≤ d2 (xn , 0),
und daher ist jede der Folgen (xn,k )n∈N beschränkt.
Da wir den Satz im Fall p = 1 schon gezeigt haben, gibt es eine konvergente
Teilfolge (xn( j1 ),1 ) j1 ∈N von (xn,1 )n∈N .
Nun betrachte (xn( j1 ),2 ) j1 ∈N . Dies ist wieder eine beschränkte Folge und hat daher
ihrerseits eine konvergente Teilfolge (xn( j1 ( j2 )),2 ) j2 ∈N . Man beachte, dass (xn( j1 ( j2 )),1 ) j2 ∈N
als Teilfolge der konvergenten Folge (xn( j1 ),1 ) j1 ∈N auch konvergiert.
Setzen wir diese Konstruktion fort, so erhalten wir eine Teilfolge (xn( j1 (...( j p )... )) ) j p ∈N
von (xn )n∈N , sodass (xn( j1 (...( j p )... )),k ) j p ∈N für jedes k = 1, . . . , p konvergiert. Nach
Proposition 3.5.1 konvergiert daher auch (xn( j1 (...( j p )... )) ) j p ∈N .
❑
Der Satz von Bolzano-Weierstrass legt folgende Begriffsbildung nahe.
5.2.9 Definition. Sei hX, di ein metrischer Raum, und sei K ⊆ X mit der Eigenschaft,
dass jede Folge (xn )n∈N aus K einen Häufungspunkt in K hat. Dann heißt K kompakt.
5.2.10 Beispiel.
Man betrachte R. Die Teilmenge N von R ist nicht kompakt, da die Folge (n)n∈N
keine konvergente Teilfolge besitzt.
Das Intervall (0, 1] ist auch nicht kompakt, da die Folge ( n1 )n∈N gegen 0 konvergiert und somit in (0, 1] keinen Häufungspunkt besitzt.
Ist K ⊆ R p eine abgeschlossene und beschränkte Menge, so hat nach Satz 5.2.3
jede Folge einen Häufungspunkt, der nach Proposition 5.1.16 zu K gehört.
Insbesondere sind alle abgeschlossenen Intervalle [a, b] in R und allgemeier alle
abgeschlossenen Kugeln Kr (x) in R p kompakt.
Wir sammeln einige elementare Eigenschaften von kompakten Teilmengen.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
108
5.2.11 Proposition. Sei hX, di ein metrischer Raum. Dann gilt:
(i) Ist K ⊆ X kompakt, dann ist K abgeschlossen.
(ii) Ist K ⊆ X kompakt, und F ⊆ X abgeschlossen, sodass F ⊆ K, dann ist auch F
kompakt.
(iii) Kompakte Teilmengen sind beschränkt.
Beweis.
(i) Wir verwenden Proposition 5.1.16. Sei x = limn→∞ xn für eine Folge aus K. Nun
gibt es definitionsgemäß eine gegen ein y ∈ K konvergente Teilfolge von (xn )n∈N .
Andererseits konvergieren Teilfolgen von gegen x konvergenten Folgen ebenfalls
gegen x. Nun sind aber Grenzwerte eindeutig. Also gilt x = y ∈ K.
(ii) Sei F ⊆ K abgeschlossen. Ist (xn )n∈N eine Folge aus F, so ist sie trivialerweise
auch eine Folge aus K. Also gilt x = lim j→∞ xn( j) für eine Teilfolge (xn( j) ) j∈N und
ein x ∈ K. Nun ist aber F abgeschlossen, und somit folgt aus Proposition 5.1.16,
dass x ∈ F. Also enthält jede Folge in F eine gegen einen Punkt in F konvergente
Teilfolge.
(iii) Sei y ∈ X. Wäre K nicht beschränkt, so wäre auch {d(y, x) : x ∈ K} ⊆ R nicht
beschränkt. Also könnten wir zu jedem n ∈ N ein xn ∈ K finden, sodass d(y, xn ) ≥
n.
Aus der Kompaktheit folgt die Existenz einer konvergenten Teilfolge xn( j) →
x, j → ∞. Aus Lemma 3.2.12 folgt d(y, xn( j) ) → d(y, x). Das widerspricht aber
d(y, xn( j) ) ≥ n( j), j ∈ N.
❑
5.2.12 Korollar. Sei (xn )n∈N eine Folge in einer kompakten Teilmenge eines metrischen Raumes hX, di. Dann konvergiert
(xn )n∈N genau dann, wenn (xn )n∈N nur einen Häufungspunkt hat.
Beweis. Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt unserer Folge.
Ist x der einzige Häufungspunkt unserer Folge, und wäre (xn )n∈N nicht gegen x konvergent, so gäbe es ein ǫ > 0, sodass
∀N ∈ N ∃n ≥ N, d(xn , x) ≥ ǫ.
Daraus definieren wir induktiv eine Teilfolge (xn(k) )k∈N . Sei n(1) ∈ N so, dass d(xn(1) , x) ≥ ǫ. Ist n(k) ∈ N definiert, so sei
n(k + 1) die kleinste Zahl in N, sodass n(k + 1) ≥ n(k) + 1 und d(xn(k+1) , x) ≥ ǫ.
Nun hat diese Folge wegen der Kompaktheit mindestens einen Häufungspunkt y ∈ K. Da (xn(k) )k∈N eine Teilfolge von
(xn )n∈N ist, muss y auch Häufungspunkt von (xn )n∈N und damit gleich x sein. Da y Häufungspunkt ist, gibt es eine Teilfolge
(xn(k( j)) ) j∈N von (xn(k) )k∈N , die gegen y konvergiert. Wegen d(x, y) = limn→∞ d(x, xn(k( j)) ) ≥ ǫ folgt aber y , x. Also muss
xn → x, n → ∞.
❑
Aus Proposition 5.2.11 und Beispiel 5.2.10 erhalten wir folgendes
5.2.13 Korollar. Eine Teilmenge K von R p ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist.
5.2.14 Bemerkung. Diese Charakterisierung von Kompaktheit gilt nicht in allen metrischen Räumen.
5.3. FOLGEN UND NETZE
109
5.3 Folgen und Netze
Bei der Motivation des Grenzwertbegriffes für Folgen haben wir gesagt eine Folge
(xi )i∈N solle konvergent gegen x heißen, wenn für alle hinreichend großen Indizes das
Folgenglied xi beliebig nahe an x herankommt.
Für den weiteren Aufbau der Analysis verwenden wir ähnliche Grenzwertbegriffe
z.B. für Funktionen f : (a, b) → R. Dabei soll f (t) konvergent für t → b gegen x
heißen, wenn f (t) beliebig nahe an x herankommt, sobald t nur hinreichend nahe an b
zu liegen kommt.
Um nicht jedesmal eine neue Konvergenztheorie aufbauen zu müssen, wollen wir
einen abstrakten Grenzwertbegriff einführen, von dem alle von uns benötigten Grenzwertbegriffe Spezialfälle sind. Was bei den Folgen die natürlichen Zahlen waren, ist
bei unserem allgemeinen Konzept nun die gerichtete Menge
5.3.1 Definition. Sei I eine nicht leere Menge, und sei eine Relation auf I. Dann
heißt (I, ) eine gerichtete Menge, wenn folgender drei Bedingungen genügt.
Reflexivität:
∀i ∈ I : i i
Transitivität:
∀i, j, k ∈ I : i j ∧ j k ⇒ i k
Richtungseigenschaft:
∀i, j ∈ I ∃k ∈ I : i k ∧ j k.
(5.1)
5.3.2 Beispiel.
(i) Neben (N, ≤) ist jede Totalordnung eine gerichtete Menge. Also etwa
((0, +∞), ≤), ((a, b), ≥), ((a, b), ≤), wobei a, b ∈ R, a < b.
Die Eigenschaft (5.1) wird bei einer Totalordnung zum Beispiel vom Maximum
zweier Elemente erfüllt.
(ii) Sei a, b, c ∈ R, a < b < c. Setze I := [a, b) ∪ (b, c] und definiere eine Relation auf I durch
x y : ⇐⇒ |y − b| ≤ |x − b| .
Dann ist reflexiv, transitiv, und je zwei Punkte sind vergleichbar. Also ist hI, i
eine gerichtete Menge. Man beachte, dass nicht antisymmetrisch und somit
keine Halbordnung ist.
(iii) Die gerichtete Menge aus dem letzten Beispiel ist ein Spezialfall des folgenden
Konzeptes.
Sei hX, dX i ein metrischer Raum, D ⊆ X und z ein Häufungspunkt von D. Auf
D \ {z} definieren wir :
x y : ⇐⇒ dX (y, z) ≤ dX (x, z)
Mit dieser Relation wird D\{z} zu einer gerichteten Menge, wobei - salopp gesagt
- ein Punkt bezüglich der Relation weiter oben als ein anderer ist, wenn er näher
an z liegt.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
110
(iv) Wir nennen eine endliche Teilmenge Z eines Intervalls [a, b] eine Zerlegung dieses Intervalls, wenn a, b ∈ Z. Die Menge aller solchen Zerlegungen wird mit Z
bezeichnet. Versieht man Z mit der Relation ⊆, so erhalten wir eine gerichtete
Menge.
n(R)
(v) Wir nennen das Paar R = ((ξ j )n(R)
j=0 ; (η j ) j=1 ) eine Riemann-Zerlegung eines Intervalls [a, b], falls
a = ξ0 < ξ1 < · · · < ξn(R) = b; η j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R),
und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Zerlegung.
Weiters sei R1 R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Zerlegungen, dann ist (R, ) eine gerichtete Menge. In diesem Beispiel ist sicher nicht
antisymmetrisch.
Dieser gerichteten Menge und der aus dem letzten Beispiel werden wir bei der
Einführung das Integrals wieder begegnen.
(vi) Sei I = N × N und (n1 , m1 ) (n2 , m2 ) :⇔ n1 ≤ n2 ∧ m1 ≤ m2 . Dann ist (I, ) eine
gerichtete Menge. Diese gerichtete Menge dient für Konvergenzbetrachtungen
bei Doppelfolgen.
(vii) Sind allgemeiner I und J gerichtete Mengen versehen mit Relationen I bzw. J ,
dann ist (I × J, ) ebenfalls eine gerichtete Menge, wenn wir (i1 , j1 ) (i2 , j2 ) :⇔
i1 I i2 ∧ j1 J j2 definieren.
5.3.3 Definition. In Analogie zu den Folgen nennen wir eine Abbildung x : I → X ein
Netz bzw. eine Moore-Smith-Folge in der Menge X über der gerichteten Menge (I, ),
und schreiben diese als (xi )i∈I .
Entsprechend Definition 3.2.2 sagen wir, dass ein Netz (xi )i∈I in einen metrischen
Raum hX, di gegen einen Punkt x ∈ X konvergiert, falls
∀ǫ > 0 ∃i0 ∈ I : d(xi , x) < ǫ, i i0 .
(5.2)
In diesem Falle schreiben wir x = lim xi .
i∈I
5.3.4 Beispiel.
(i) Wie bei den Folgen sieht man, dass konstante Netze xi = x, i ∈ I, immer gegen x
konvergieren.
(ii) Als konkreteres Beispiel betrachte man die gerichtete Menge ([−1, 0) ∪ (0, 1], ),
wobei x y ⇔ |y| ≤ |x|, und f (t) = t2 . Dann konvergiert das Netz ( f (t))t∈[−1,0)∪(0,1]
gegen Null:
p
Zu gegebenen ǫ > 0 sei t0 := 2ǫ . Ist t t0 , so folgt |0 − f (t)| = |t2 | ≤ |t02 | =
pǫ 2
2 < ǫ.
(iii) Sei M eine Menge und E die Menge aller endlichen Teilmengen von M. Setzt
man A B :⇔ A ⊆ B, so ist (E, ) eine gerichtete Menge: Die Reflexivität und
Transitivität sind klar, da die Mengeninklusion diese Eigenschaften hat.
Sind A, B ∈ E, so folgt A ∪ B ∈ E und A, B ⊆ A ∪ B. Also ist (5.1) erfüllt.
Im Falle M = N sind wir dieser gerichteten Menge schon begegnet. Ist nämlich
P∞
P
A∈E ein
n=1 an eine absolut konvergente Reihe mit der Summe s, so ist ( n∈A an )P
Netz, und in Lemma 3.9.2, (iv), haben wir nichts anderes als s = lim n∈A an
A∈E
hergeleitet.
5.3. FOLGEN UND NETZE
111
Nun gelten viele der für Folgen hergeleiteten Ergebnisse auch für Netze. Die Beweise sind im Wesentlichen die selben, wie für Folgen.
Der Grenzwert ist eindeutig:
Ist (xi )i∈I ein Netz, und sei angenommen, dass xi → x und xi → y mit x , y.
> 0. Dann gibt es wegen xi → x einen Index i1 , sodass für alle
Setze ǫ := d(x,y)
3
i ∈ I mit i1 i gilt d(xi , x) < ǫ. Wegen xi → y gibt es auch i2 ∈ I, sodass für alle
i ∈ I mit i2 i gilt d(xi , y) < ǫ. Ist nun i ∈ I so, dass wir beide Abschätzungen
zur Verfügung haben, also so, dass i1 i und i2 i, dann erhalten wir den
Widerspruch
d(x, y)
.
d(x, y) ≤ d(x, xi ) + d(xi , y) < 2
3
Die Tatsache, dass es bei Folgen auf endlich viele Glieder nicht ankommt hat
auch eine Verallgemeinerung für Netze. Ist nämlich k ∈ I, so ist auch (Ik , ) mit
Ik = {i ∈ I : k i} eine gerichtete Menge und
lim xi = lim xi ,
i∈I
i∈Ik
(5.3)
wobei der rechte Grenzwert genau dann existiert, wenn der linke existiert.
Im Allgemeinen sind konvergente Netze nicht beschränkt. Aber da ein gegen ein
x konvergentes Netz {xi : i i0 } ⊆ Uǫ (x) für ein i0 ∈ I erfüllt, ist zumindest das
Netz (xi )i∈Ii0 beschränkt.
Eine separate Betrachtung verdient das Analogon von Teilfolgen.
5.3.5 Definition. Sind (I, I ) und (J, J ) zwei gerichtete Mengen, ist X eine Menge
und (xi )i∈I ein Netz in X, so heißt (xi( j) ) j∈J eine Teilnetz von (xi )i∈I , wenn i : J → I
derart ist, dass
∀i ∈ I ∃k ∈ J : ∀ j J k ⇒ i( j) I i.
Ist (J, J ) = (N, ≤), so heißt (xi( j) ) j∈J = (xi(n) )n∈N eine Teilfolge 3 .
5.3.6 Bemerkung. Ist x = limi∈I xi , und ǫ > 0, so gibt es ein i0 ∈ I, sodass d(x, xi ) < ǫ
wenn i I i0 . Ist nun j0 ∈ J, sodass i( j) I i0 für alle j J j0 , so folgt d(x, xi( j) ) < ǫ
wenn j J j0 . Also gilt
x = lim xi ⇒ x = lim xi( j) .
(5.4)
i∈I
j∈J
Wie wir im nächsten Kapitel sehen werden, ist es oft wünschenswert die Konvergenz von Netzen auf die von Folgen zurück zu führen. Das geht nicht immer, aber in
vielen Fällen.
5.3.7 Definition. Wir sagen, dass eine gerichtete Menge (I, ) Teilfolgen gestattet,
wenn es eine abzählbare Teilmenge J von I gibt, sodass ∀i ∈ I∃ j ∈ J : i j.
Wie wir im folgenden Lemma 5.3.8 sehen werden, bedeutet diese Eigenschaft, dass
man hinreichend viele Teilfolgen konstruieren kann, damit man von der Konvergenz
von Teilfolgen auf die Konvergenz eines gegebenen Netzes schließen kann.
5.3.8 Lemma. Sei (Y, dY ) ein metrischer Raum und (I, ) eine gerichtete Menge, die
Teilfolgen gestattet. Ist (yi )i∈I ein Netz in Y, so gilt y = limi∈I yi genau dann, wenn
limn→∞ yi(n) = y für jede Teilfolge von (yi )i∈I .
3 Im
Gegensatz zu Teilfolgen von Folgen verlangen wir hier nicht, dass i : N → I monoton ist.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
112
Beweis. Ist y = limi∈I yi , und ist (yi(n) )n∈N eine Teilfolge, so folgt limn→∞ yi(n) = y
wegen (5.4).
Konvergiert (yi )i∈I nicht gegen y, so gibt es ein ǫ > 0, sodass
∀i ∈ I ∃k ∈ I, k i : d(yk , y) ≥ ǫ.
(5.5)
Daraus konstruieren wir eine Teilfolge, die nicht gegen y konvergiert. Dazu sei j : N →
J bijektiv, wobei J wie in Definition 5.3.7 ist.
Sei i1 ∈ I, i1 j(1) mit d(yi1 , y) ≥ ǫ (siehe (5.5)). Sind i1 · · · im ∈ I definiert,
so sei i ∈ I, i im , i j(m + 1). Gemäß (5.5) gibt es ein im+1 i, sodass d(yim+1 , y) ≥ ǫ.
Wegen im j(m), m ∈ N, gibt es zu jedem i ∈ I ein m0 ∈ N, sodass j(m0 ) i,
und daher im im0 j(m0 ) für alle m ≥ m0 . Also ist (yin )n∈N eine Teilfolge, sodass
d(yin , y) ≥ ǫ, und die daher nicht gegen y konvergiert.
❑
Nun zählen wir Sätze, Rechenregeln, etc. auf, die wir für Folgen hergeleitet haben,
und die sich auf Netze mit praktischen den selben Beweisen übertragen lassen:
Sind (xi )i∈I und (yi )i∈I konvergente Netze, oder nur eine Konstante, in R, und gilt
xi ≤ yi für alle i, die k für ein k ∈ I sind, so folgt
lim xi ≤ lim yi .
i∈I
(5.6)
i∈I
Ist umgekehrt limi∈I xi < limi∈I yi , so gilt xi < yi für alle i k mit einem gewissen
k ∈ I.
Man betrachte zwei konvergente Netze (zi )i∈I , (wi )i∈I über derselben gerichteten
Menge (I, ) in R oder in C. Dann folgt
lim(zi + wi ) = (lim zi ) + (lim wi ), lim −zi = − lim zi ..
i∈I
i∈I
i∈I
i∈I
i∈I
(5.7)
Dasselbe gilt für die Multiplikation. Um das zu zeigen muss man eine Spur anders vorgehen, als im Beweis von Satz 3.3.4, da Netze i.A. nicht beschränkt sind:
Sei ǫ > 0 oBdA. so, dass ǫ ≤ 1. Seien i1 , i2 so groß, dass i i1 ⇒ |zi − z| < ǫ und
i i2 ⇒ |wi − w| < ǫ. Insbesondere gilt für solche i auch |wi | ≤ |w| + ǫ ≤ |w| + 1.
Gemäß Definition 5.3.1 gibt es ein i0 i1 , i2 . Für i i0 folgt
|zi wi − zw| = |(zi − z)wi + z(wi − w)| ≤ |zi − z| · |wi | + |z| · |wi − w|
< ǫ|wi | + |z|ǫ ≤ (|w| + 1 + |z|)ǫ.
In Analogie zu (3.6) folgt daraus zi wi → zw, i ∈ I.
Ist (zi )i∈I ein Netz in R oder C, sodass zi , 0, i ∈ I, und limi∈I zi = z , 0. Dann
folgt limi∈I z1i = 1z .
Ist (xi )i∈I ein monoton wachsendes Netz in R: i j ⇒ xi ≤ x j und ist {xi : i ∈ I}
beschränkt, so folgt
lim xi = sup{xi : i ∈ I}.
(5.8)
i∈I
Entsprechendes gilt für monoton fallende Netze.
5.3. FOLGEN UND NETZE
113
Seien (xi )i∈I , (yi )i∈I und (ai )i∈I Netze in R über derselben gerichteten Menge,
sodass xi ≤ ai ≤ yi für alle i i0 mit einem gewissen i0 ∈ I. Gilt
lim xi = lim yi ,
i∈I
i∈I
so existiert auch der Grenzwert limi∈I ai und stimmt mit dem gemeinsamen
Grenzwert von (xi )i∈I und (yi )i∈I überein.
Man betrachte zwei Netze (xi )i∈I , (yi )i∈I über derselben gerichteten Menge (I, )
in einem metrischen Raum hX, di, die gegen x bzw. y konvergieren. Dann gilt
lim d(xi , yi ) = d(x, y).
i∈I
(5.9)
Sei (xi )i∈I ein Netz von Punkten xi = (xi,1 , . . . , xi,p ) ∈ R p , und y = (y1 , . . . , y p ) ∈
R p . Dann gilt limi∈I xi = y bezüglich einer der Metriken d1 , d2 oder d∞ genau
dann, wenn
lim xi,k = yk für alle k = 1, . . . , p .
(5.10)
i∈I
Sei hX, dX i ein metrischer Raum, D ⊆ X, z ein Häufungspunkt von D und auf
D \ {z} definiert als x y : ⇐⇒ dX (x, z) ≥ dX (y, z) wie in Beispiel 5.3.2, (iii).
5.3.9 Lemma. Die gerichtete Menge (D \ {z}, ) gestattet Teilfolgen.
Ist hY, dY i ein weiterer metrischer Raum und f : D → Y eine Abbildung, so gilt
limt∈D\{z} f (t) = y genau dann, wenn
∀ǫ > 0 ∃δ > 0 : dY ( f (t), y) < ǫ, ∀t ∈ D \ {z}, dX (t, z) < δ.
(5.11)
Außerdem gilt limt∈D\{z} f (t) = y genau dann, wenn limn→∞ f (tn ) = y für alle gegen z
konvergente Folgen (tn )n∈N aus D \ {z}.
Beweis. Laut Definition der Konvergenz eines Netzes gilt limt∈D\{z} f (t) = y genau
dann, wenn
∀ǫ > 0 ∃t0 ∈ D \ {z} : dY ( f (t), y) < ǫ, ∀t ∈ D \ {z}, dX (t, z) ≤ dX (t0 , z).
(5.12)
Um daraus (5.11) abzuleiten, setzen wir bei gegebenen ǫ > 0, δ = dX (t0 , z), wobei t0
wie in (5.12) ist. Nun folgt für t ∈ D \ {z}, dX (t, z) < δ = dX (t0 , z) wegen (5.12), dass
dY ( f (t), y) < ǫ.
Für die Umkehrung sei ǫ > 0 und δ > 0 wie in (5.11). Da z ein Häufungspunkt von
D ist, gibt es ein t0 ∈ D \ {z} ∩ Uδ (z). Ist nun t ∈ D \ {z}, dX (t, z) ≤ dX (t0 , z) < δ, so folgt
dY ( f (t), y) < ǫ.
Ist (tn )n∈N irgendeine Folge aus D \ {z} mit tn → z für n → ∞ - nach Lemma
5.1.13 gibt es eine solche - so ist J = {tn : n ∈ N} eine abzählbare Teilmenge von
D \ {z} mit der Eigenschaft, dass bei gegebenen t ∈ D \ {z} sicherlich tn t, d.h.
dX (tn , z) ≤ dX (t, z) (> 0), wenn n nur hinreichend groß ist. Also gestattet (D \ {z}, )
Teilfolgen (vgl. Definition 5.3.7).
Die letzte Aussage folgt aus Lemma 5.3.8 wenn wir zeigen können, dass ( f (tn ))n∈N
genau dann eine Teilfolge von ( f (t))t∈D\{z} ist, wenn tn → z.
Zunächst sei ( f (tn ))n∈N eine Teilfolge im Sinne von Definition 5.3.5. Zu gegebenen
δ > 0 gibt es ein t0 ∈ D \ {z} mit dX (t, z) < δ, weil z Häufungspunkt von D ist.
Gemäß Definition 5.3.5 gibt es ein n0 ∈ N, sodass tn t, wenn nur n ≥ n0 . Also folgt
dX (tn , z) ≤ dX (t, z) = δ, n ≥ n0 , und weil δ > 0 beliebig war, tn → z, n → ∞.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
114
Ist umgekehrt tn → z, n → ∞, und ist t ∈ D \ {z}, so gibt wegen tn → z ein n0 ∈ N,
sodass dX (tn , z) ≤ dX (t, z) (> 0) für alle n ≥ n0 . Das bedeutet aber tn t für n ≥ n0 .
Somit ist ( f (tn ))n∈N eine Teilfolge im Sinne von Definition 5.3.5.
❑
5.3.10 Definition. Konvergiert obiges Netz, so schreiben wir für den Grenzwert auch
lim f (t) := lim f (t),
t→z
(5.13)
t∈D\{z}
und nennen ihn Grenzwert der Funktion f für t → z.
5.3.11 Beispiel. Als Beispiel wollen wir
lim
t→0
1−
√
1 − t2
t2
√
2
berechnen, wobei das als der Limes limt∈(−1,1)\{0} 1− t21−t mit der gerichteten Menge
((−1, 1) \ {0}, ) wie im vorigen
√ verstehen ist.
√ Beispiel zu
Aus 1 − (1 − t2 ) = (1 − 1 − t2 )(1 + 1 − t2 ) folgt wegen der für Netze gültigen
Rechenregeln
√
1 − 1 − t2
1 − (1 − t2 )
=
lim
= lim
√
2
t→0
t→0 t2 (1 +
t
1 − t2 )
= lim
t→0
1
1
=
.
√
√
2
1+ 1−t
1 + limt→0 1 − t2
p
Nun ist aber wegen der für Folgen gültigen Rechenregeln limn→∞ √ 1 − tn2 = 1 für jede
gegen 0 konvergente Folge (tn )n∈N . Aus Lemma 5.3.9 folgt limt→0 1 − t2 = 1, und der
zu berechnende Grenzwert ist 12 .
5.3.12 Bemerkung. Ist t0 ∈ D \ {z}, so wissen wir aus (5.3), dass ( f (t))t∈D\{z} genau
dann konvergiert, wenn das Netz ( f (t))t∈D\{z}, tt0 = ( f (t))t∈D∩Kδ (z)\{z} mit δ = dX (z, t0 )
konvergiert. Das bedeutet, dass der Grenzwert (5.13) eigentlich nur von f auf einer
beliebig kleinen δ-Kugel um z abhängt.
√
2
5.3.13 Beispiel. Auf Beispiel 5.3.11 angewandt bedeutet das, dass auch 1− t21−t gegen
1
2 für t → 0 konvergiert, wenn man nicht t ∈ (−1, 1) \ {0} sondern zum Beispiel t ∈
(− 81 , 81 ) \ {0} laufen lässt.
5.3.14 Fakta.
1. Die Schreibweise limt→0 f (t) = x aus Definition 5.3.10 besagt, dass der Funktionswert f (t) beliebig nahe an x herankommt, wenn das Argument t nur hinreichend nahe an 0 ist. Oft ist man in der Situation, dass diese Annäherung nur von
einer Seite stattfindet.
√
Man betrachte etwa die Funktion t 7→ t für t → 0. Für negative Werte von
t macht dieser Ausdruck gar keinen Sinn (zumindest wenn wir reelle Wurzeln
suchen).
Hat man also a, b ∈ R, a < b, und eine Funktion f (t), t ∈ [a, b), so setzt man
D := [a, b) und definiert s t :⇔ |s − b| ≥ |t − b|. Wegen der Gestalt unserer
Menge D gilt x y ⇐⇒ x ≤ y. Dann ist limt∈D f (t) = x äquivalent zu
∀ǫ > 0 ∃δ > 0 : dY ( f (t), x) < ǫ, ∀t ∈ [a, b), b − t < δ .
5.3. FOLGEN UND NETZE
115
Man schreibt dafür auch limt→b− f (t) = x und spricht von dem linksseitigen
Grenzwert.
Die gerichtete Menge ([a, b), ) gestattet ebenfalls Teilfolgen, wobei ( f (tn ))n∈N
genau dann eine Teilfolge von ( f (t))t∈[a,b) ist, wenn (tn )n∈N eine gegen b konvergente Folge aus [a, b) ist. Also gilt limt→b− f (t) = x genau dann, wenn
limn→∞ f (tn ) = x für alle gegen b konvergente Folgen (tn )n∈N aus [a, b).
2. Analog definiert man den rechtsseitigen Grenzwert limt→a+ f (t) = x, wenn f
eine Funktion auf D := (a, b] ist. Dann ist limt∈D f (t) = x äquivalent zu
∀ǫ > 0 ∃δ > 0 : dY ( f (t), x) < ǫ, ∀t ∈ (a, b], t − a < δ .
Diese Konvergenz lässt sich auch dadurch charakterisieren, dass limn→∞ f (tn ) =
x für alle gegen a konvergente Folgen (tn )n∈N aus (a, b].
3. Sind a, b, c ∈ R, a < b < c, und ist f : [a, b) ∪ (b, c] → Y eine Funktion. Nun
gilt
y = lim f (t) ⇔ y = lim f (t) und y = lim f (t).
(5.14)
t→b
t→b−
t→b+
Um das einzusehen sei zunächst y = limt→b f (t). Also konvergiert das Netz
( f (t))t∈[a,b)∪(b,c] gegen y. Da alle drei Mengen [a, b) ∪ (b, c], [a, b) und (b, c] so
gerichtet sind, dass t1 t2 ⇔ d2 (t1 , b) ≥ d2 (t2 , b), sind ( f (t))t∈[a,b) und ( f (t))t∈(b,c]
Teilnetze von ( f (t))t∈[a,b)∪(b,c] , und konvergieren daher ebenfalls gegen y (vgl.
Bemerkung 5.3.6).
Sei nun umgekehrt limt→b− f (t) = y = limt→b+ f (t) und ǫ > 0. Es gibt somit
ein s1 ∈ [a, b) und ein t1 ∈ (b, c], sodass s ∈ [a, b), d2 (s, b) ≤ d2 (s1 , b) ⇒
dY ( f (s), y) < ǫ und t ∈ (b, c], d2 (t, b) ≤ d2 (t1 , b) ⇒ dY ( f (t), y) < ǫ.
Setze τ1 = s1 , wenn d2 (s1 , b) ≤ d2 (t1 , b), und τ1 = t1 , wenn d2 (t1 , b) < d2 (s1 , b).
Ist τ ∈ [a, b) ∪(b, c] mit d2 (τ, b) ≤ d2 (τ1 , b) = min(d2 (s1 , b), d2(t1 , b)), so folgt im
Falle τ ∈ [a, b) wegen d2 (τ, b) ≤ d2 (s1 , b), dass dY ( f (τ), y) < ǫ. Genauso folgt im
Falle τ ∈ (b, c] wegen d2 (τ, b) ≤ d2 (t1 , b), dass dY ( f (τ), y) < ǫ. Also konvergiert
( f (t))t∈[a,b)∪(b,c] gegen y
4. Ist f z.B. eine auf (a, +∞) definierte Funktion, und versieht man (a, +∞) mit der
Relation ≤, so erhält man ebenfalls eine gerichtete Menge. Für den möglichen
Grenzwert x := limt∈(a,+∞) f (t) schreibt man auch limt→+∞ f (t).
Die hier zugrunde liegende gerichtete Menge gestattet auch Teilfolgen, wobei
( f (tn ))n∈N genau dann eine solche ist, wenn tn → +∞ für n → ∞.
Entsprechend gibt es Grenzwerte für t → −∞.
5.3.15 Beispiel. Sei f : (1, +∞) → R, z.B. f (t) = t−3 . Um limt→+∞ f (t) auszurechnen ist es oft zielführend, das Netz ( f (t))t∈(1,+∞) als Teilnetz (g( 1t ))t∈(1,+∞) des Netzes
(g(s)) s∈(0,1) zu betrachten, wobei g(s) = f ( 1s ). Die Menge (0, 1) ist dabei so gerichtet,
dass s1 s2 :⇔ s1 ≥ s2 .
Dass (g( 1t ))t∈(1,+∞) ein Teilnetze von (g(s)) s∈(0,1) ist, gilt, da zu vorgegebenen s ∈
(0, 1) es ein t0 ∈ (1, +∞) gibt - z.B. t0 = 1s - sodass t ≥ t0 ⇒ 1t ≤ s (vgl. Definition
5.3.5). Man sieht damit, dass etwa
lim t−3 = lim s3 = 0.
t→+∞
s→0+
Statt der Funktion t 7→ 1t kann man Entsprechendes mit anderen bijektiven und monotonen Funktionen von einem Intervall auf ein anderes machen.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
116
5.3.16 Beispiel. Man betrachte die Menge I = C\{0} gerichtet durch z w ⇔ |z| ≤ |w|.
Für limz∈I f (z) = a schreibt man dann auch lim|z|→∞ f (z) = a.
Zum Beispiel sieht man leicht ein, dass lim|z|→∞ 1z = 0 und mit den Rechenregeln
(a0 , . . . , an ∈ C)
lim an + an−1 z−1 + . . . + a0 z−n = an .
|z|→∞
5.3.17 Bemerkung. Genauso wie für Folgen kann man definieren, was es heißt, dass
ein reellwertiges Netz (xi )i∈I gegen ±∞ konvergiert:
∀M > 0 ∃i0 ∈ I : ±xi > M für alle i i0 .
Es gelten sinngemäß die Aussagen in Satz 3.6.2 auch für Netze.
5.3.18 Beispiel. Ist I wie in Beispiel 5.3.16, so gilt für a0 , . . . , an ∈ C, an , 0,
lim |an zn + an−1 zn−1 + . . . + a0 | = lim |zn | · |an + an−1 z−1 + . . . + a0 z−n | = +∞.
|z|→∞
|z|→∞
Kapitel 6
Reelle und komplexe
Funktionen
6.1 Stetigkeit
Sei f eine Funktion und sei x ein Punkt ihres Definitionsbereiches. Sagen wir dass diese Funktion stetig an der Stelle x ist, so verstehen wir darunter anschaulich, dass der
Funktionswert f (t) sich beliebig wenig von f (x) unterscheidet, wenn nur t hinreichend
nahe bei x ist. Wir sehen, dass man diesem Begriff Sinn geben kann, wenn man verlangt, dass Definitionsbereich und Wertebereich der betrachteten Funktion metrische
Räume sind.
6.1.1 Definition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei f :
D → Y eine Funktion. Weiters sei x ∈ D. Dann heißt f stetig an der Stelle x, wenn gilt
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ ,
oder äquivalent
∀ǫ > 0 ∃δ > 0 : f (Uδ (x) ∩ D) ⊆ Uǫ ( f (x)) ,
Ist f an jeder Stelle x ihres Definitionsbereiches D stetig, so heißt f stetig auf D.
f (x) + ǫ
f (x)
f (x) − ǫ
x−δ
x
x+δ
Abbildung 6.1: ǫ-δ Kriterium für f : I (⊆ R) → R
117
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
118
6.1.2 Beispiel.
Sei f : X → Y eine konstante Funktion, d.h. f (x) := y0 , x ∈ X. Dann ist f stetig,
denn ist x ∈ X und ǫ > 0, so wähle etwa δ = 1. Für alle t ∈ X mit dX (t, x) < δ gilt
sicher
dY ( f (t), f (x)) = dY (y0 , y0 ) = 0 < ǫ .
Die identische Abbildung, f (x) := idX (x) = x, x ∈ X, ist stetig. Um das einzusehen seien x ∈ X und ǫ > 0 gegeben. Mit δ = ǫ folgt für alle t ∈ X, dX (t, x) < δ,
dass
dX ( f (t), f (x)) = dX (t, x) < δ = ǫ .
Allgemeiner gilt, dass jede isometrische1 Abbildung f : X → Y stetig ist, da zu
x ∈ X und ǫ > 0 mit δ = ǫ wieder für alle t ∈ X, dX (t, x) < δ
dY ( f (t), f (x)) = dX (t, x) < δ = ǫ .
Die Abbildung z 7→ z̄ als Funktion auf C ist isometrisch und daher stetig.
Sei f : C → R die Funktion z 7→ |z|. Dann ist f stetig. Denn bei gegebenen
z ∈ C und ǫ > 0 wähle δ := ǫ. Für alle w ∈ C mit |w − z| < δ gilt wegen der
Dreiecksungleichung nach unten
| f (w) − f (z)| = |w| − |z| ≤ |w − z| < δ = ǫ .
p
Sei π j : R p → R, j = 1, . . . , p die Funktion (xi )i=1
7→ x j . Diese ist überall stetig,
p
p
p
denn bei gegebenen (xi )i=1 ∈ R und ǫ > 0 wähle δ = ǫ. Für alle (ti )i=1
∈ R p mit
p
p
d2 ((xi )i=1 , (ti )i=1 ) < δ gilt
p
p
|x j − t j | ≤ d2 ((xi )i=1
, (ti )i=1
) < ǫ.
Sei f : R → R die Funktion f (x) := [x]. Dabei bezeichnet [x] die größte ganze
Zahl, die ≤ x ist, und sie wird als Gaußklammer bezeichnet. Diese Funktion ist
stetig an jeder Stelle x ∈ R \ Z, und nicht stetig an jeder Stelle x ∈ Z:
Ist x ∈ R \ Z, und ist ǫ > 0 gegeben, so wähle δ > 0, sodass das Intervall
(x − δ, x + δ) keine ganze Zahl enthält. Dann ist f auf (x − δ, x + δ) konstant, und
somit gilt
| f (t) − f (x)| = 0 < ǫ, falls |t − x| < δ .
Ist dagegen x ∈ Z, so enthält das Intervall (x − δ, x + δ) für jedes δ > 0 sowohl
Zahlen t, die größer als x sind, als auch Zahlen t, die kleiner als x sind. Nun ist
aber für t− < x und t+ > x sicher f (t− ) < f (t+ ) und daher, da ja beide Werte
ganze Zahlen sind, | f (t− ) − f (t+ )| ≥ 1. Wir können also für kein ǫ mit 0 < ǫ ≤ 1
ein δ finden, das der geforderten Bedingung genügt.
6.1.3 Fakta. Seien hX, dX i und hY, dY i metrische Räume, x ∈ D ⊆ X, und sei f : D → Y
eine Funktion.
1. Unmittelbar aus der Definition der Stetigkeit folgt, dass die Stetigkeit bei x eine
lokale Eigenschaft ist, d.h. f ist bei x stetig genau dann, wenn es ein ρ > 0 gibt,
sodass f |Uρ (x)∩D stetig bei x ist.
1 Isometrisch
bedeutet dY ( f (x), f (y)) = dX (x, y).
6.1. STETIGKEIT
119
2. Ist x ein isolierter Punkt von D, dann ist f immer stetig bei x. Ist nämlich δ > 0
so, dass Uδ (x)∩D = {x}, so folgt f (Uδ (x)∩D) = { f (x)} ⊆ Uǫ ( f (x)) für beliebiges
ǫ > 0.
3. Ist f : D → Y stetig auf D, so sicherlich auch f |C auf jeder Teilmenge C ⊆ D.
Also sind Einschränkungen stetiger Abbildungen wieder stetig.
Nun wollen wir die Stetigkeit an einer Stelle mit Hilfe verschiedener Grenzwertbegriffe charakterisieren.
6.1.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D →
Y eine Funktion. Ist x ∈ D ein fester Punkt, dann sind äquivalent:
(i) f ist stetig an der Stelle x.
(ii) Ist x kein isolierter Punkt, so gilt limt→x f (t) = f (x), wobei wir diesen Limes
verstehen als Limes des Netzes ( f (t))t∈D\{x} , wo D \ {x} mit der Relation
t u : ⇐⇒ dX (u, x) ≤ dX (t, x)
zu einer gerichteten Menge wird, vgl. Definition 5.3.10.
(iii) Für jede Folge (tn )n∈N aus D \ {x} mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x).
(iv) Für jede Folge (tn )n∈N aus D mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x).
(v) Für jedes Netz (ti )i∈I aus D mit limi∈I ti = x gilt limi∈I f (ti ) = f (x).
Beweis.
(i) ⇐⇒ (ii): Im Falle, dass x ein isolierter Punkt von D ist, wissen wir schon, dass f
bei x stetig ist.
Sei also x nicht isolierter Punkt von D. Die Stetigkeit von f an der Stelle x
bedeutet nach Definition
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ .
Die Beziehung limt→x f (t) = f (x) bedeutet gemäß Definition 5.3.10,
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D \ {x} mit dX (t, x) < δ .
(6.1)
Also sind diese beiden Aussagen äquivalent.
(ii) ⇐⇒ (iii): Das haben wir schon in Lemma 5.3.9 gesehen.
(v) ⇒ (iv) ⇒ (iii): (iv) ist Spezialfall von (v) und genauso (iii) von (iv).
(i) ⇒ (v): Sei ǫ > 0, dann gibt es ein δ > 0 mit f (Uδ (x)) ⊆ Uǫ ( f (x)). Sei nun i0 ∈ I mit
xi ∈ Uδ (x), i i0 . Für diese i folgt f (xi ) ∈ Uǫ ( f (x)), und daraus die behauptete
Grenzwertbeziehung.
❑
Ein immer wieder verwendete Eigenschaft der Stetigkeit folgt unmittelbar aus Proposition 6.1.4, (iii):
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
120
6.1.5 Korollar. Sind f, g : D → Y beide stetig und gilt f (x) = g(x) für alle x in einer
Teilmenge E ⊆ D, so gilt auch f (x) = g(x) für alle x ∈ c(E) ∩ D.
Insbesondere stimmen zwei stetige f und g auf D überein, wenn sie das nur auf
einer dichten Teilmenge E von D tun.
Beweis. Zu x ∈ D ∩ c(E) gibt es eine Folge (xn )n∈N in E ⊆ D, sodass xn → x. Wegen
f (xn ) = g(xn ) und aus der Stetigkeit beider Funktionen folgt
f (x) = lim f (xn ) = lim g(xn ) = g(x).
n→∞
n→∞
❑
Viele stetige Funktionen lassen sich mit Hilfe des nächsten Lemmas als solche
identifizieren.
6.1.6 Lemma. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, E ⊆ Y und f :
D → Y und g : E → Z mit f (D) ⊆ E. Ist f bei x ∈ D und g bei f (x) stetig ist, so ist
g ◦ f : D → Z bei x stetig.
Beweis. Zu ǫ > 0 gibt es wegen der Stetigkeit von g ein δ′ > 0, sodass g(Uδ′ ( f (x)) ∩
E) ⊆ Uǫ (g( f (x))), und wegen der Stetigkeit von f ein δ > 0, sodass f (Uδ (x) ∩ D) ⊆
Uδ′ ( f (x)). Setzt man das zusammen und beachtet, dass auch f (Uδ (x) ∩ D) ⊆ f (D) ⊆ E,
so erhält man
(g ◦ f )(Uδ (x) ∩ D) ⊆ g(Uδ′ ( f (x)) ∩ E) ⊆ Uǫ (g( f (x))).
❑
6.1.7 Beispiel. Aus unseren Rechenregeln für Folgen (Satz 3.3.4) folgern wir mit Hilfe
der Folgencharakterisierung der Stetigkeit (Proposition 6.1.4, (iv)), dass die algebraischen Operationen
(
(
R2 → R
R → R
+:
−:
(x, y) 7→ x + y
x 7→ −x
·:
(
R2 → R
(x, y) 7→ x · y
.−1 :
(
R \ {0} → R \ {0}
x 7→ 1x
stetig sind. Genauso sind die algebraischen Operationen auf C stetig. Hier sind
R, R2 , C, C2 (≃ R4 ) alle der euklidischen Metrik d2 versehen2.
6.1.8 Korollar. Sei hX, di ein metrischer Raum, D ⊆ X, und seien f, g : D → R stetige
Funktionen.
Dann ist auch die Abbildung x 7→ ( f (x), g(x)) von D nach R2 stetig.
Ebenso sind die Abbildungen
x 7→ − f (x), x 7→ f (x) + g(x), x 7→ f (x)g(x)
von D nach R stetig.
2 Diese
Feststellung gilt auch, wenn man d1 oder d∞ hernimmt (vgl. Proposition 3.5.1).
6.1. STETIGKEIT
121
Ist f (x) , 0, x ∈ D, so ist auch x 7→
1
f (x)
von D nach R stetig.
Die selben Aussagen sind wahr, wenn wir R durch C ersetzen.
Beweis. Ist x = limn→∞ xn mit x, xn ∈ D, n ∈ N, so folgt f (xn ) → f (x) und g(xn ) →
g(x). Nach Proposition 3.5.1 folgt ( f (xn ), g(xn )) → ( f (x), g(x)) in R2 . Also ist x 7→
( f (x), g(x)) stetig auf D.
Die anderen Funktionen sind Zusammensetzungen von stetigen Funktionen. Zum
Beispiel ist x 7→ f (x)g(x) die Zusammensetzung von x 7→ ( f (x), g(x)) und (u, v) 7→ uv
(siehe Beispiel 6.1.7).
❑
Eine wiederholte Anwendung von Korollar 6.1.8 ergibt:
p(x)
mit gewissen Polynomen
6.1.9 Beispiel. Sei f eine rationale Funktion, d.h. f (x) = q(x)
p und q mit reellen bzw. komplexen Koeffizienten. Dann ist
f : {x ∈ R bzw. C : q(x) , 0} → R bzw. C
stetig.
Anmerkung: Wem diese Tatsache trivial vorkommt, der versuche zu Fuß“, d.h.
”
durch explizite Angabe einer Zahl δ zu vorgegebenen ǫ und x, zu überprüfen, dass die
Funktion
x3 + x + 1
f (x) =
x2 + 1
auf ihrem Definitionsbereich R stetig ist.
Die folgende mengentheoretisch orientierte Charakterisierung der Stetigkeit einer
Funktion spielt eine wichtige Rolle.
6.1.10 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : X → Y
eine Funktion. Dann sind äquivalent:
(i) f ist stetig.
(ii) Für jede in hY, dY i offene Menge B ist das vollständige Urbild f −1 (B) := {x ∈ X :
f (x) ∈ B} offen in hX, dX i.
(iii) Für jede in hY, dY i abgeschlossene Menge F ist das vollständige Urbild f −1 (F) :=
{x ∈ X : f (x) ∈ F} abgeschlossen in hX, dX i.
Beweis.
(i) ⇒ (ii): Sei B ⊆ Y offen, und sei x ∈ f −1 (B). Da B offen ist und f (x) ∈ B, folgt
Uǫ ( f (x)) ⊆ B für ein ǫ > 0. Wegen der Stetigkeit existiert δ > 0 mit f (Uδ (x)) ⊆
Uǫ ( f (x)) ⊆ B, d.h. mit Uδ (x) ⊆ f −1 (B). Also enthält f −1 (B) mit jedem Punkt
eine ganze δ-Kugel, d.h. f −1 (B) ist offen.
(ii) ⇒ (i): Sei ǫ > 0 und x ∈ X gegeben. Die Menge Uǫ ( f (x)) ist offen, also ist
auch f −1 (Uǫ ( f (x))) offen. Wegen x ∈ f −1 (Uǫ ( f (x))) existiert ein δ > 0, sodass
Uδ (x) ⊆ f −1 (Uǫ ( f (x))). Das heißt aber gerade f (Uδ (x)) ⊆ Uǫ ( f (x)).
(ii) ⇔ (iii): Das folgt sofort aus Proposition 5.1.16 und der Tatsache, dass f −1 (M c ) =
f −1 (M)c .
122
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
❑
6.1.11 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y
eine stetige Funktion. Ist K ⊆ D kompakt, so ist auch f (K) ⊆ Y kompakt.
Beweis. Sei (yn )n∈N eine Teilfolge in f (K), und sei xn ∈ K, sodass f (xn ) = yn . Wegen
der Kompaktheit von K gibt es eine gegen ein x ∈ K konvergente Teilfolge (xn(k) )k∈N
von (xn )n∈N . Aus der Stetigkeit folgt
f (x) = lim f (xn(k) ) = lim yn(k) .
k→∞
k→∞
Also hat (yn )n∈N eine konvergente Teilfolge mit Grenzwert aus f (K). Also ist f (K)
kompakt.
❑
6.1.12 Korollar. Sei f : D → R stetig, und sei K ⊆ D kompakt. Dann ist f auf K
beschränkt und nimmt ein Maximum und ein Minimum an, d.h. es gibt Punkte x+ , x− ∈
K mit
f (x+ ) = max f (x), f (x− ) = min f (x) .
x∈K
x∈K
Insbesondere nimmt jede auf einem reellen Intervall [a, b] definierte und stetige reellwertige Funktion ein Maximum und ein Minimum an.
Beweis. Nach Proposition 6.1.11 ist f (K) ⊆ R kompakt, und wegen Proposition 5.2.11 damit beschränkt und abgeschlossen. Wegen Beispiel 5.1.14 ist
sup f (K) = max f (K) = f (x+ ) für irgendein x+ ∈ K. Genauso zeigt man die Aussage
für das Minimum.
❑
6.1.13 Proposition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X kompakt.
Ist f : D → Y stetig und injektiv, so ist es auch f −1 : ran( f ) → D.
Beweis. Wäre f −1 bei einem y nicht stetig, so gäbe es eine Folge (yn )n∈N in ran f mit
yn → y, aber xn = f −1 (yn ) 6→ f −1 (y). Es gibt dann eine Teilfolge (xn(m) )m∈N und ein
ǫ > 0, sodass (vgl. Bemerkung 3.2.11)
dX ( f −1 (y), xn(m) ) ≥ ǫ, m ∈ N.
Wegen der Kompaktheit hat aber (xn(m) )m∈N seinerseits eine Teilfolge (xn(m(l)) )l∈N mit
xn(m(l)) → x, l → ∞ für ein x in D. Nun ist aber wegen dX ( f −1 (y), xn(m(l)) ) ≥ ǫ auch
dX ( f −1 (y), x) ≥ ǫ und somit x , f −1 (y). Die Injektivität impliziert f (x) , y. Im Widerspruch dazu gilt
f (x) = lim f (xn(m(l)) ) = lim yn(m(l)) = y.
l→∞
l→∞
❑
6.2 Der Zwischenwertsatz
Sei I ⊆ R ein Intervall. Die Anschauung von Stetigkeit legt nahe, dass mit I auch f (I)
ein Intervall ist.
6.2. DER ZWISCHENWERTSATZ
123
6.2.1 Bemerkung. Man überlegt sich leicht, dass I ⊆ R genau dann ein Intervall ist,
d.h. genau dann eine der Formen (a, b ∈ R, a < b,)
∅, (a, b), [a, b], (a, b], [a, b), (a, +∞), (−∞, a), [a, +∞), (−∞, a], R,
hat, wenn für I gilt
∀x, y ∈ I, x < y ⇒ [x, y] ⊆ I.
Um zu rechtfertigen, dass f (I) wieder ein Intervall ist, werden wir eine weitere
charakteristische Eigenschaft von Intervallen herleiten.
6.2.2 Definition. Dazu nennen wir eine Teilmenge E eines metrischen Raumes zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen
schreiben kann. Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅.
6.2.3 Proposition. Sei I ⊆ R. Dann ist I genau dann ein Intervall, wenn I zusammenhängend ist.
Beweis. Ist I = ∅, so ist I (vgl. Bemerkung 6.2.1) ein Intervall, und I ist auch zusammenhängend, wie man sofort überprüft. Also sei I , ∅.
Angenommen es existieren x, y ∈ I, x < y, sodass [x, y] * I. Wähle z ∈ [x, y] \ I
und setze
A := (−∞, z] ∩ I, B := [z, +∞) ∩ I.
Dann sind A und B disjunkt, und jeder Häufungspunkt t von A ist in (−∞, z], da diese
Menge ja abgeschlossen ist. Wegen z < I folgt t < B und damit c(A) ∩ B = ∅. Genauso
sieht man A ∩ c(B) = ∅. Also ist I nicht zusammenhängend.
Sei umgekehrt I nicht zusammenhängend. Dann können wir I als A ∪ B mit nichtleeren A, B schreiben, wobei c(A) ∩ B = A ∩ c(B) = ∅. Wähle x ∈ A und y ∈ B, und sei
o.B.d.A. angenommen, dass x < y.
Man betrachte t = sup(A ∩ [x, y]). Insbesondere ist x ≤ t ≤ y. Weiters folgt aus
t ∈ c(A ∩ [x, y]) ⊆ c(A) (siehe Beispiel 3.2.6), dass t < B, und somit x ≤ t < y.
Wir wollen nun [x, y] * I zeigen, was im Fall t < A, sofort aus t ∈ [x, y] \ (A ∪ B) =
[x, y] \ I folgt.
Im Fall t ∈ A, folgt aus t < c(B) die Existenz einer ǫ-Kugel (t − ǫ, t + ǫ), sodass
(t − ǫ, t + ǫ) ∩ B = ∅,
wobei wir ǫ > 0 noch dazu so klein wählen, dass t + ǫ < y.
Somit ist t + 2ǫ < B, und wegen x < t + 2ǫ < y und t = sup(A ∩ [x, y]) kann t +
auch nicht in A liegen. Also t + 2ǫ ∈ [x, y] \ (A ∪ B) = [x, y] \ I und daher [x, y] * I.
ǫ
2
❑
6.2.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D →
Y eine stetige Funktion. Ist E ⊆ D zusammenhängend, so auch f (E).
Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A∪B mit
A, B , ∅ und c(A)∩B = A∩c(B) = ∅. Für die nichtleeren Mengen E∩ f −1 (A), E∩ f −1 (B)
folgt
E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅.
Jedes x ∈ c E ∩ f −1 (A) ∩ E ∩ f −1 (B) ist insbesondere Häufungspunkt von E ∩ f −1 (A).
Somit gibt es eine gegen x konvergente Folge (xn )n∈N in E ∩ f −1 (A) \ {x}. Es folgt
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
124
limn→∞ f (xn ) = f (x), und somit f (x) ∈ c f (E ∩ f −1 (A)) ⊆ c(A). Andererseits ist
−1
f (x) ∈ f E ∩ f (B) ⊆ B im Widerspruch zu c(A) ∩ B = ∅.
Also kann nur c E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅. Entsprechend gilt
−1
−1
c E ∩ f (B) ∩ E ∩ f (A) = ∅, und E wäre somit nicht zusammenhängend,
was unserer Annahme widerspricht.
❑
6.2.5 Beispiel. Wir werden später sehen, dass die Einheitskreislinie T = {z ∈ C :
|z| = 1} als das Bild von [0, 2π) unter der stetigen Abbildung x 7→ exp(ix) geschrieben
werden kann. Nach Proposition 6.2.4 identifizieren wir damit T als zusammenhängend.
6.2.6 Korollar (Zwischenwertsatz). Sei I ⊆ D ein Intervall und f : I → R stetig. Dann
ist auch f (I) ein Intervall. Ist insbesondere c ∈ R mit
(−∞ ≤) inf f (I) < c < sup f (I) (≤ +∞),
so existiert ein Punkt x ∈ I mit f (x) = c.
Insbesondere gilt: Ist f stetig auf [a, b] und c eine Zahl zwischen f (a) und f (b), dh.
f (a) < c < f (b) oder f (b) < c < f (a), so existiert ein Punkt x ∈ (a, b) mit f (x) = c.
Beweis. Mit I ist nach Proposition 6.2.4 auch f (I) ⊆ R zusammenhängend,
und somit nach Proposition 6.2.3 ein Intervall. Wählt man α, β ∈ f (I) mit
inf x∈I f (x) < α < c < β < sup x∈I f (x), dann enthält f (I) das ganze Intervall
[α, β] (siehe Bemerkung 6.2.1). Also gibt es ein x ∈ I mit f (x) = c.
❑
sup f (I)
f (I)
f (x) = c
inf f (I)
x
I
Abbildung 6.2: Veranschaulichung des Zwischenwertsatzes
6.3 Gleichmäßige Stetigkeit
Die Definition der Stetigkeit einer Funktion f : D → Y lautet, in logischen Formeln
angeschrieben,
∀x ∈ D ∀ǫ > 0 ∃δ > 0 : ∀t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ .
(6.2)
6.3. GLEICHMÄSSIGE STETIGKEIT
125
Die Zahl δ, die es zu jedem ǫ geben muss, hängt im Allgemeinen nicht nur von ǫ,
sondern auch von der Stelle x ab.
6.3.1 Beispiel. Betrachte die Funktion f (x) = x−1 : R+ → R+ . Ist x ∈ R und ǫ > 0
gegeben, so berechnet man:
1
δ
1
−
=
.
x x + δ (x + δ)x
2
ǫx
Damit dieser Ausdruck ≤ ǫ ist, darf δ höchstens 1−ǫ
x sein. Man sieht, dass diese größt
mögliche Wahl von δ immer kleiner wird, je kleiner x wird, und tatsächlich für x → 0
ebenfalls gegen 0 strebt. Man kann in diesem Beispiel also tatsächlich zu gegebenem ǫ
kein δ finden das von x unabhängig ist.
Sollte eine Funktion nun so beschaffen sein, dass dieses Phänomen nicht auftritt,
sollte also zu gegebenem ǫ stets ein δ existieren, welches für alle x funktioniert, so
nennt man die Funktion gleichmäßig stetig.
6.3.2 Definition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y eine
Funktion. Dann heißt f gleichmäßig stetig, wenn gilt
∀ǫ > 0 ∃δ > 0 ∀x, t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ .
Vergleicht man diese Definition mit der Formel (6.2), so sieht man, dass man hier
den Allquantor ∀x ∈ X und den Existenzquantor ∃δ > 0 vertauscht hat. Dies wird also
nicht den gleichen, sondern einen stärkeren Begriff liefern.
Ist f gleichmäßig stetig, so ist f auch stetig. Wie wir am obigen Beispiel sehen, gilt
die Umkehrung nicht. Interessant in diesem Zusammenhang ist nun der folgende Satz.
6.3.3 Satz. Seien hX, dX i und hY, dY i metrische Räume, und D ⊆ X kompakt. Dann ist
jede stetige Funktion f : D → Y sogar gleichmäßig stetig.
Beweis. Nehme man das Gegenteil an. Dann gibt es ein ǫ > 0, sodass es für alle n ∈ N
Punkte xn , yn ∈ D gibt, sodass dX (xn , yn ) < 1n und dY ( f (xn ), f (yn )) ≥ ǫ.
Die Folgen (xn )n∈N (yn )n∈N haben wegen der Kompaktheit von D Häufungspunkte
x bzw. y. Somit gilt
x = lim xn(k) , y = lim yn(k)
k→∞
k→∞
für Teilfolgen (xn(k) )k∈N und (yn(k) )k∈N . Aus dX (xn(k) , yn(k) ) <
3.2.12, dass
dX (x, y) = lim dX (xn(k) , yn(k) ) = 0,
1
n(k)
folgt mit Lemma
k→∞
also x = y und somit f (x) = f (y). Andererseits folgt aus der Stetigkeit zusammen mit
Lemma 3.3.1 der offensichtliche Widerspruch
dY ( f (x), f (y)) = dY ( lim f (xn(k) ), lim f (yn(k) )) = lim dY ( f (xn(k) ), f (yn(k) )) ≥ ǫ.
k→∞
k→∞
k→∞
❑
6.3.4 Beispiel. Sei E ⊆ R nicht kompakt. Dann gilt:
(i) Es gibt eine auf E stetige Funktion die nicht beschränkt ist.
(ii) Es gibt eine auf E stetige und beschränkte Funktion, die kein Maximum hat.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
126
(iii) Ist E beschränkt, so gibt es eine auf E stetige, aber nicht gleichmäßig stetige
Funktion.
Wir betrachten zuerst den Fall, dass E einen Häufungspunkt x0 hat, der nicht zu E
gehört (dieser Fall tritt sicher immer dann ein, wenn E beschränkt ist, denn dann würde
1
aus abgeschlossen kompakt folgen). Die Funktion x 7→ x−x
ist stetig auf E, aber nicht
0
1
beschränkt. Sie ist auch nicht gleichmäßig stetig. Die Funktion f (x) = 1+(x−x
2 ist
0)
stetig auf E und beschränkt (0 < f (x) < 1). Offenbar gilt lim x→x0 f (x0 ) = 1, also
supx∈E f (x) = 1.
Betrachte nun den Fall, dass E nicht beschränkt ist. (i) folgt mit f (x) = x, (ii) mit
x2
f (x) = 1+x
2.
In (iii) kann man die Forderung, dass E beschränkt ist, nicht ganz weglassen. Zum
Beispiel betrachte E = Z. Dann ist jede Funktion auf E gleichmäßig stetig, denn man
kann stets irgendein δ < 1 wählen, z.B. also δ = 21 ).
6.3.5 Satz. Seien hX, dX i und hY, dY i metrische Räume, wobei hY, dY i sogar vollständig ist. Weiters sei D ⊆ X und f : D → Y
gleichmäßig stetig.
Dann existiert eine eindeutige gleichmäßig stetige Fortsetzung F : c(D) → Y.
Beweis.
Sei (xn )n∈N eine Cauchy-Folge von Punkten aus D. Zu ǫ > 0 wähle δ > 0 so, dass
dY f (y), f (z) < ǫ für dX (y, z) < δ .
(6.3)
Weiters wähle N ∈ N so, dass dX (xn , xm ) < δ für alle n, m ≥ N. Dann folgt
dY f (xn ), f (xm ) < ǫ, n, m ≥ N,
d.h. ( f (xn ))n∈N ist eine Cauchy-Folge in Y. Somit existiert der Limes limn→∞ f (xn ).
Sei x ∈ X, und seien (xn )n∈N und (yn )n∈N zwei Folgen von Punkten in D mit xn → x sowie yn → x. Ist ǫ > 0
gegeben und δ > 0 wie in (6.3), so wähle N ∈ N mit
dX (xn , x) <
δ
δ
, dX (yn , x) < , n ≥ N.
2
2
Insbesondere gilt dX (xn , yn ) ≤ dX (xn , x) + dX (yn , x) < δ für alle n ≥ N. Es folgt dY ( f (xn ), f (yn )) < ǫ, n ≥ N, und
daher
dY lim f (xn ), lim f (yn ) ≤ ǫ.
n→∞
n→∞
Da ǫ > 0 beliebig war, folgt limn→∞ f (xn ) = limn→∞ f (yn ).
Zu jedem Sx ∈ c(D) gibt es definitionsgemäß eine Folge (xn )n∈N mit xn → x. Definiere
F(x) := lim f (xn ).
n→∞
Wegen der obigen Punkte ist F eine wohldefinierte Funktion von X nach Y.
Ist x ∈ D, so betrachte die konstante Folge xn := x. Dann gilt sicher xn → x und f (xn ) → f (x), also F(x) = f (x).
Somit ist F eine Fortsetzung von f .
Es bleibt zu zeigen, dass F gleichmäßig stetig ist. Sei dazu ǫ > 0 gegeben. Wähle δ > 0 so, dass dY ( f (x), f (y)) <
für x, y ∈ D mit dX (x, y) < δ.
ǫ
3
Seien nun x, y ∈ c(D) mit dX (x, y) < 3δ . Wähle xn , yn ∈ D mit xn → x, yn → y und N ∈ N mit
dX (xn , x) <
δ
δ
ǫ
ǫ
, dX (yn , y) < , dY (F(x), f (xn )) < , dY (F(y), f (yn )) < , n ≥ N .
3
3
3
3
Dann gilt dX (xn , yn ) < δ und daher dY ( f (xn ), f (yn )) < 3ǫ . Somit erhalten wir dY (F(x), F(y)) < ǫ.
Die Eindeutigkeit folgt sofort aus Korollar 6.1.5.
❑
6.4. UNSTETIGKEITSSTELLEN
127
6.4 Unstetigkeitsstellen
Sei,hY, dY i ein metrischer Raum, und sei f : (a, b) → Y mit a, b ∈ R, a < b. Weiters
sei x ∈ (a, b).
f ist gemäß Proposition 6.1.4 genau dann bei x stetig, wenn f (x) = limt→x f (t).
In (5.14) haben wir gesehen, dass f (x) = limt→x f (t) genau dann, wenn die Grenzwerte f (x−) := limt→x− f (t) und f (x+) := limt→x+ f (t) existieren und beide mit f (x)
übereinstimmen.
6.4.1 Bemerkung. Gilt zumindest f (x) = f (x−) ( f (x) = f (x+)), so spricht man von
Linksstetigkeit bzw. linksseitiger Stetigkeit (Rechtsstetigkeit bzw. rechtsseitiger Stetigkeit) der Funktion f bei x. Klarerweise ist f bei x stetig, wenn f bei x sowohl links- als
auch rechtsstetig ist.
Ist f nicht stetig, so unterscheidet man folgende Fälle.
6.4.2 Definition. Sei f unstetig bei x.
Man sagt, f habe eine Unstetigkeit 1. Art bei x, falls f (x−) := limt→x− f (t) und
f (x+) := limt→x+ f (t) existieren, aber nicht beide gleich f (x) sind.
Für Unstetigkeiten 1. Art gibt es zwei Möglichkeiten. Entweder f (x−) , f (x+),
in welchem Fall man von einer Sprungstelle spricht, oder f (x−) = f (x+) , f (x).
Dann spricht man von einer hebbaren Unstetigkeit.
Liegt keine Unstetigkeit 1. Art vor, so spricht man von einer Unstetigkeit 2. Art.
Den Begriff hebbar“hat man deswegen gewählt, weil man dann f an der Stelle x
”
so abändern kann, dass die neue Funktion bei x stetig ist.
6.4.3 Beispiel.
Betrachte die Funktion



1 , x rational
f (x) = 

0 , x irrational
Diese Funktion hat an jeder Stelle x eine Unstetigkeit 2.Art.
Sei



 x , x rational
g(x) = 

0 , x irrational
g ist stetig bei 0, hat aber an jeder Stelle x , 0 eine Unstetigkeit 2.Art. Es
gibt nämlich eine Folge (rn )n∈N aus Q ∩ (x, +∞) und eine Folge (xn )n∈N aus
R \ Q ∩ (x, +∞), die beide gegen x konvergieren (vgl. Beispiel 3.2.6). Nun ist
aber f (xn ) = 0 → 0 und f (rn ) = rn → x für n → ∞. Nach (5.14) kann somit limt→x+ f (t) nicht existieren. Ähnlich zeigt man, dass auch limt→x− f (t) nicht
extistiert.
Sei
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
128
h



x+2




h(x) = 
−x − 2




x + 2
2
, x ∈ (−3, −2)
, x ∈ [−2, 0)
, x ∈ [0, 1)
1
−3
−2
0
−1
1
−1
−2
Dann ist h stetig auf (−3, 1) \ {0} und hat bei 0 eine Sprungstelle.
Wir setzen den Begriff der Sinusfunktion (aus der Schule) voraus. Sei
f



sin 1x
f (x) = 

0
, x>0
, x≤0
0
1
π
Dann ist f stetig auf R \ {0} und hat eine Unstetigkeit 2.Art bei 0.
Es können also im Allgemeinen alle möglichen Varianten von Unstetigkeiten auftreten.
Thematisch dazu passend wollen wir uns der Fortsetzbarkeit von stetigen Funktionen auf um einen Punkt größere Mengen zuwenden.
6.4.4 Bemerkung. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei
f : D → Y eine stetige Funktion. Sei weiters x ∈ X \ D.
Wir fragen uns, ob wir eine Fortsetzung f˜ : D ∪ {x} → Y von f finden können, die
die Eigenschaft stetig zu sein beibehält.
Wenn x kein Häufungspunkt von D ist, so sieht man leicht, dass x ein isolierter
Punkt von D ∪ {x} ist, und daher jede Fortsetzung f˜ stetig ist.
Sei also x ein Häufungspunkt von D. Gibt es eine stetige Fortsetzung f˜, so muss
nach Proposition 6.1.4 f˜(x) = limt→x f (t). Existiert umgekehrt limt→x f (t), so setze
man


limt→x f (t) , s = x
˜f (s) = 
.


 f (s)
, s∈D
Klarerweise ist f˜ eine Fortsetzung von f . Wegen Proposition 6.1.4, (ii), ist f˜ bei x
stetig. Andererseits ist wegen Fakta 6.1.3 mit f auch f˜ bei allen t ∈ D stetig. Also ist f˜
eine auf D ∪ {x} stetige Fortsetzung.
6.5. MONOTONE FUNKTIONEN
129
6.4.5 Beispiel. Seien a, b, c ∈ R, c ≤ 0, D = (−∞, 0)∪(0, +∞) und f : D → R definiert
b
durch f (x) = a für x < 0 und f (x) = x−c
für x > 0. Dann gilt lim x→0− f (t) = a und



−b
, b , 0, c < 0



 c
lim f (t) = 
sgn(b) · ∞ , b , 0, c = 0 .


x→0+


0
, b=0
Aus Bemerkung 6.4.4 wissen wir, dass sich f genau dann zu einer Funktion f˜ : R →
R fortsetzen lässt, wenn limt→0 f (t) existiert. Nach (5.14) existiert dieser Grenzwert
genau dann, wenn a = b = 0 oder b , 0, c , 0, a = − bc . Dabei muss f˜(0) = 0 bzw.
f˜(0) = a = − bc .
6.5 Monotone Funktionen
6.5.1 Definition. Man sagt, dass für ein Intervall I ⊆ R, eine Funktion f : I → R
monoton wachsend ist, falls
x < y ⇒ f (x) ≤ f (y) .
Gilt sogar x < y ⇒ f (x) < f (y), so sagt man f sei streng monoton wachsend.
Analog sagt man, f sei monoton fallend, falls x < y ⇒ f (x) ≥ f (y). Sollte x < y
sogar f (x) > f (y) implizieren, so spricht von einer streng monoton fallenden Funktion.
Klarerweise ist eine streng monotone Funktion stets injektiv. Nun kommen wir zur
Diskussion der Unstetigkeitsstellen monotoner Funktionen.
6.5.2 Proposition. Sei f monoton wachsend auf einem reellen Intervall I, wobei a, b ∈
R ∪ {−∞, +∞}, a < b die Intervallränder bezeichnet.
Dann existieren für jeden Punkt x ∈ (a, b) sowohl f (x−) := lim s→x− f (s) als auch
f (x+) := limt→x+ f (t), wobei3
sup f (s) = f (x−) ≤ f (x) ≤ f (x+) = inf f (t).
(6.4)
x<t<b
a<s<x
Ist x = a ∈ I (x = b ∈ I), so gilt die rechte (linke) Seite von (6.4). Weiters gilt für x < y
immer f (x+) < f (y−).
Analoge Aussagen gelten für monoton fallende Funktionen.
Beweis. Wir beschränken uns auf x ∈ (a, b). Der Fall der Intervallränder betrachtet
man in analoger Weise.
Der Beweis folgt unmittelbar aus (5.8), da die Grenzwerte in (6.4) ja Grenzwerte
monotoner und beschränkter Netze sind.
Die Ungleichung in (6.4) folgt leicht aus der Tatsache, dass jeder Punkt aus { f (s) :
s ∈ (a, x)} kleiner oder gleich f (x) und f (x) kleiner oder gleich jedem Punkt aus { f (t) :
t ∈ (x, b)} ist.
Der zweite Teil der Behauptung folgt aus
lim f (t) = inf f (t) = inf f (t), lim f (s) = sup f (s) = sup f (s).
t→x+
x<t<b
x<t<y
t→y−
a<s<y
x<s<y
❑
3 Insbesondere
können in (a, b) nur Unstetigkeitsstellen 1.Art auftreten.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
130
f
f (x3 +)
f (x3 +)
f (x3 −)
= f (x2 −)
f (x2 )
= f (x2 +)
x1
x2
x3
f (x1 +)
f (x1 ) = f (x1 −)
Abbildung 6.3: Veranschaulichung monotoner Funktionen
6.5.3 Korollar. Sei I ⊆ R ein Intervall, f : I → R eine monoton wachsende Funktion
und J = f (I).
Das Bild ist genau dann ein Intervall, wenn f stetig ist.
Ist f streng monoton wachsend, so ist f −1 : J → I auch streng monoton wachsend. Dabei enthält I genau dann seinen linken (rechten) Intervallrand, wenn J
das tut.
Ist f streng monoton wachsend und stetig, so ist auch f −1 : J → I streng monoton wachsend und stetig.
Eine entsprechende Aussage gilt für streng monoton fallende Funktionen.
Beweis.
Ist f stetig, so ist wegen Korollar 6.2.6 auch f (I) ein Intervall.
Angenommen f ist nicht stetig an einem x ∈ I, das zunächst nicht ein Intervallrand von I sei. Wegen (6.4) muss lim s→x− f (s) < limt→x+ f (t). Es folgt
f (τ) ≤ lim f (s) = f (x−), τ < x und f (τ) ≥ lim f (t) = f (x+), τ > x .
s→x−
Also kann f keine Werte im Inter
vall f (x−), f (x+) bis auf unter
Umständen einen - nämlich f (x) annehmen.
t→x+
f (x+)
f (x)
f (x−)
6.6. GLEICHMÄSSIGE KONVERGENZ
131
Ist x der linke Intervallrand von I, so muss nach (6.4) f (x) < limt→x+ f (t). Somit
folgt ( f (x), limt→x+ f (t)) ∩ J = ∅. Entsprechend argumentiert man im Fall des
rechten Randes. Jedenfalls ist J kein Intervall.
Wegen der Strengen Monotonie ist f injektiv. Man sieht sofort, dass auch f −1 :
J → I auch streng monoton wachsend ist.
Enthält I seinen linken Rand4 a, so folgt aus der Monotonie, dass f (a) ≤ f (t), t ∈
I, und somit dass J auch seinen linken Rand enthält.
Enthält J = f (I) seinen linken Rand f (c) für ein c ∈ I, und wäre t ∈ I, t < c, so
folgt aus der strengen Monotonie der Widerspruch f (t) < f (c). Also ist c ∈ I der
linke Rand von I.
Ist f stetig, so ist J ein Intervall und die streng monoton wachsende Funktion
f −1 : J → I hat als Bild genau das Intervall I. Nach dem ersten Punkt muss
daher auch f −1 stetig sein.
❑
Wir werden später dieses Korollar verwenden, um z.B. zu zeigen, dass der Logarithmus eine stetige Funktion ist.
Thematisch zu obigem Ergebnis passt das nächste Lemma, das aus dem Zwischenwertsatz folgt.
6.5.4 Lemma. Seien I, J ⊆ R zwei Intervalle und f : I → J stetig und bijektiv. Dann
ist f streng monoton wachsend oder fallend.
Beweis. Wäre f weder streng monoton wachsend noch streng monoton fallend, so gibt
es x1 < x2 aus I mit f (x1 ) ≥ f (x2 ) und x3 < x4 aus I mit f (x3 ) ≤ f (x4 ). Weil f injektiv
ist, muss sogar f (x1 ) > f (x2 ) und f (x3 ) < f (x4 ). Daraus folgt, dass {x1 , x2 , x3 , x4 }
zumindest drei Elemente hat.
Durch Fallunterscheidungen je nachdem, wie diese Punkte angeordnet sind, findet
man immer a < b < c aus {x1 , x2 , x3 , x4 }, sodass entweder f (a) < f (b), f (b) > f (c)
oder f (a) > f (b), f (b) < f (c). Man beachte, dass dabei wegen der Injektivität alle drei
Werte f (a), f (b), f (c) untereinander verschieden sein müssen.
Im ersten Fall ist entweder f (a) ∈ ( f (c), f (b)) oder f (c) ∈ ( f (a), f (b)). Aus Korollar 6.2.6 folgt daher f (a) = f (t) für ein t ∈ (b, c) bzw. f (c) = f (t) für ein t ∈ (a, b), was
jedenfalls der Injektivität widerspricht.
Im zweiten Fall argumentiert man entsprechend.
❑
6.6 Gleichmäßige Konvergenz
P
n
Wir haben schon gesehen, dass z.B. die geometrische Reihe ∞
n=0 z für jedes z ∈ C,
|z| < 1, konvergiert. Betrachtet man diese Reihe nicht nur für ein festes vorgegebenes z,
sondern für alle z, so hat man eine Reihe, deren Summanden Funktionen (von z) sind,
1
).
und deren Summe ebenfalls eine Funktion von z ist (nämlich 1−z
4I
ist daher von der Form [a, b], [a, b), [a, +∞) mit b ∈ R, b > a.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
132
Betrachten wir also eine Folge ( fn )n∈N von Funktionen, die definiert ist, zum Beispiel, auf einer Menge E ⊆ R und die, zum Beispiel, reelle Werte annimmt. Wir würden
gerne erklären, was es bedeutet, dass diese Folge gegen eine Funktion f konvergiert.
Um einen vernünftigen“ Grenzwertbegriff zu bekommen, müssen wir jetzt eine
”
Metrik definieren, und zwar eine Metrik auf einer Menge von Funktionen f : E →
R. Aber man kann in diesem konkreten Fall auch naiver an die Sache herangehen.
Ist ( fn )n∈N , fn : E → R, eine Folge von Funktionen, dann ist für jedes feste x ∈ E
sicher ( fn (x))n∈N eine Folge von Zahlen, und für diese wissen wir, was es bedeutet zu
konvergieren. Man kann also definieren:
6.6.1 Definition. Sei E eine Menge und hY, dY i ein metrischer Raum. Eine Folge
( fn )n∈N , fn : E → Y, heißt punktweise konvergent gegen die Funktion f : E → Y,
wenn für jedes feste x ∈ E gilt limn→∞ fn (x) = f (x).
Entsprechend definiert man die punktweise Konvergenz von Netzen von Funktionen.
Es entsteht die Frage, ob sich Eigenschaften wie etwa die fundamentale Eigenschaft
der Stetigkeit der Funktionen fn auf die Grenzfunktion f übertragen. Die folgenden
Beispiele illustrieren, dass in dieser Angelegenheit etwas schiefgehen kann.
6.6.2 Beispiel.
Betrachte die Funktionen gn : [0, 1] → R, definiert durch gn (x) := xn , n ∈ N.
Bekannterweise gilt


0 , x ∈ [0, 1)

.
lim gn (x) = 

1 , x = 1
n→∞
Jede der Funktionen gn ist eine stetige Funktionen auf [0, 1], nicht jedoch die
Grenzfunktion.
Betrachte die Funktionen fn : R → R, definiert durch fn (x) :=
für jedes x , 0
∞
X
x2
n=0
x2
.
(1+x2 )n
Dann ist
(1 + x2 )n
eine konvergente geometrische Reihe. Ihre Summe ist 1 + x2 , x , 0.
Für x = 0 sind alle Summanden = 0, also auch ihre Summe. Man erhält

∞

X

1 + x2 x , 0
fn (x) = 

0
x=0
n=0
Alle Funktionen fn , und damit auch alle Partialsummen obiger Reihe sind stetige
Funktionen von x ∈ R, nicht jedoch die Grenzfunktion.
Die punktweise Konvergenz von Funktionen ist also nicht stark genug um etwa die
Eigenschaft der Stetigkeit zu erhalten.
6.6.3 Definition. Sei E eine Menge und hY, dY i ein metrischer Raum. Wir bezeichnen
mit B(E, Y) die Menge aller beschränkten Funktionen f : E → Y, d.h.
B(E, Y) := f : E → Y : ∃R > 0, y0 ∈ Y : ∀x ∈ E ⇒ dY ( f (x), y0 ) ≤ R .
6.6. GLEICHMÄSSIGE KONVERGENZ
133
Man definiert nun die Abbildung
(
B(E, Y) × B(E, Y) → R
d∞ :
( f, g) 7→ supx∈E dY ( f (x), g(x))
und spricht von der Supremumsmetrik.
f
g
Für reellwertige Funktionen
f, g : E → R = Y
ist dY (x, y) = |x − y|
und daher
d∞ ( f, g) = sup x∈E | f (x) − g(x)|.
d∞ ( f, g)
| f − g|
E
6.6.4 Lemma. Die Supremumsmetrik d∞ ist eine Metrik auf der Menge B(E, Y).
Beweis. Es gilt d∞ ( f, f ) = supx∈E dY ( f (x), f (x)) = sup x∈E 0 = 0. Ist umgekehrt
d∞ ( f, g) = sup x∈E dY ( f (x), g(x)) = 0, so folgt dY ( f (x), g(x)) = 0 für jedes x ∈ E,
und daher f (x) = g(x), x ∈ E. Also f = g.
Aus dY ( f (x), g(x)) = dY (g(x), f (x)) folgt d∞ ( f, g) = d∞ (g, f ). Ist h eine weitere
Funktion, so gilt für festes x ∈ E
dY ( f (x), g(x)) ≤ dY ( f (x), h(x)) + dY (h(x), g(x)) ,
und daher auch
dY ( f (x), g(x)) ≤ sup dY ( f (x), h(x)) + sup dY (h(x), g(x)) = d∞ ( f, h) + d∞ (h, g) .
x∈E
x∈E
Da diese Beziehung für jedes x ∈ E gilt, folgt auch d∞ ( f, g) = supx∈E dY ( f (x), g(x)) ≤
d∞ ( f, h) + d∞ (h, g).
❑
6.6.5 Definition. Eine Folge ( fn )n∈N von Funktionen aus B(E, Y) heißt gleichmäßig
gegen f , wenn limn→∞ fn = f bezüglich d∞ , d.h. wenn
∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) ≤ ǫ, n ≥ N,
(6.5)
oder äquivalent dazu ∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) < ǫ, n ≥ N.
Entsprechend definiert man die gleichmäßige Konvergenz von Netzen von Funktionen.
134
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
f
fn , n ≥ N
f +ǫ
f −ǫ
E
Abbildung 6.4: Veranschaulichung der gleichmäßigen Konvergenz
6.6.6 Bemerkung. Ist f ∈ B(E, Y) und g irgendeine Funktion von E → Y mit der
Eigenschaft, dass supt∈E dY ( f (t), g(t)) < ∞, so folgt aus der Dreiecksungleichung, dass
auch g eine beschränkte Funktion ist.
Ist daher ( fn )n∈N eine Folge aus B(E, Y), und gilt supt∈E dY ( fn (t), g(t)) → 0, so folgt
g ∈ B(E, Y) und fn → g gleichmäßig.
Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz liegt darin
begründet, dass man ein N finden muss, das für alle x ∈ E funktioniert.
In der Tat gilt d∞ ( fn , f ) ≤ ǫ ⇔ ∀x ∈ E ⇒ dY ( fn (x), f (x)) ≤ ǫ, und somit ist (6.5)
äquivalent zu
∀ǫ > 0 ∃N ∈ N ∀x ∈ E : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N ,
wogegen punktweise Konvergenz bedeutet
∀x ∈ E ∀ǫ > 0 ∃N ∈ N : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N .
Insbesondere sehen wir, dass jede gleichmäßig konvergente Folge auch punktweise
konvergiert und zwar zur gleichen Grenzfunktion.
6.6.7 Beispiel. Betrachte nochmals die reellwertigen Funktionen gn (x) := xn , n ∈ N
nun defniert für x ∈ [0, 1), vgl. Beispiel 6.6.2. Wir wissen schon, dass gn punktweise gegen die Nullfunktion auf [0, 1) konvergiert. Dabei gilt wegen xn < 1 für
x ∈ [0, 1), n ∈ N, und wegen lim x→1− xn = 1, dass
d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = 1.
x∈[0,1)
x∈[0,1)
Also d∞ (gn , 0) 6→ 0 für n → ∞, d.h. (gn )n∈N konvergiert nicht gleichmäßig gegen die
Nullfunktion.
6.6.8 Beispiel. Sei η ∈ (0, 1) fest, und betrachtet die Funktionenfolge gn (x) = xn ,
n ∈ N, auf dem Intervall [0, η]. Klarerweise konvergiert auch diese eingeschränkte
Funktionenfolge punktweise gegen die Nullfunktion auf [0, η]. Nun folgt aber wegen
d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = ηn ,
x∈[0,η]
x∈[0,η]
6.6. GLEICHMÄSSIGE KONVERGENZ
135
gn (x)
1
n=1
n=3
n=7
n = 13
1
2
0
1
2
η
1
x
Abbildung 6.5: Graph der Funktionen gn für ausgewählte n ∈ N
dass d∞ (gn , 0) → 0 für n → ∞. Also konvergiert gn sogar gleichmäßig gegen die
Nullfunktion.
1
2
6.6.9 Beispiel. Man untersuche die Funktionenfolge fn (x) := nxe− 2 nx , x ∈ [0, ∞),
n ∈ N, auf gleichmäßige Konvergenz. Dabei greifen wir der Definition der Funktion
x 7→ e x für x ∈ R weiter hinten vor. Wir verwenden auch die Tatsache, dass ye−y → 0
für y → +∞. Weiters verwenden wir die Differentialrechnung zur Bestimmung
von Extrema. Da dieses Beispiel nur zum besseren Verständnis des Begriffes der
gleichmäßigen Konvergenz dient und später nicht verwendet wird, sind diese Vorgriffe
gerechtfertigt.
Zunächst sei bemerkt, dass für alle n ∈ N die Funktion fn (x) stetig ist und fn (x) ≥ 0
für x ∈ [0, ∞). Eine getrennte Untersuchung der Fälle x , 0 und x = 0 liefert punktweise Konvergenz fn (x) → f (x) ≡ 0 für n → ∞. Um ( fn )n∈N auf gleichmäßige Konvergenz
gegen die Funktion f (x) ≡ 0 zu untersuchen betrachtet man die Supremumsmetrik
d∞ ( fn , 0) = sup dR ( fn (x), 0) = sup | fn (x)|.
x∈[0,∞)
x∈[0,∞)
Da für jedes n ∈ N die Funktion fn (x) nicht negativ ist, fn (0) = 0 und lim x→∞ fn (x) = 0
gilt, folgt, dass fn (x) sogar ein Maximum in [0, ∞) annimmt. Um das Maximum zu
berechnen, ist Satz 7.2.2 hilfreich. Für jedes n ∈ N ist fn (x) beliebig oft differenzierbar,
und setzt man die erste Ableitung gleich Null, so erhält man
1
1
1
±1
2
2
2
fn′ (x) = ne− 2 nx − n2 x2 e− 2 nx = e− 2 nx (n − n2 x2 ) = 0 ⇔ x = √ .
n
Also ist x = √1n die einzige Nullstelle der ersten Ableitung, die in [0, ∞) enthalten ist.
Wegen lim x→∞ fn (x) = 0 folgt daher, dass das Maximum der Funktion fn (x) an der
Stelle x = √1n liegt. Somit ergibt sich für die Supremumsmetrik
1 1
n
d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn √ = √ e− 2 .
x∈[0,∞)
n
n
x∈[0,∞)
Daraus folgt d∞ ( fn , 0) 6→ 0 für n → ∞, d.h. ( fn )n∈N konvergiert nicht gleichmäßig
gegen die Nullfunktion.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
136
fn (x)
7
n=1
n=5
6
n = 20
5
n = 120
4
3
2
1
0
1
1
2
3
2
2
5
2
3
x
7
2
Abbildung 6.6: Graph der Funktionen fn für ausgewählte n ∈ N
1
2
6.6.10 Beispiel. Sei η > 0 und betrachtet man die Funktionenfolge fn (x) := nxe− 2 nx ,
n ∈ N, auf dem Intervall [η, ∞). Aus dem vorigen Beispiel wissen wir bereits, dass die
Funktion fn (x) für x > √1n monoton fallend ist. Wegen
1
∀δ > 0 ∃n0 ∈ N : δ > √ ∀n ≥ n0
n
gibt es ein n0 ∈ N, sodass √1n < [η, ∞) für alle n ≥ n0 . Daher ergibt sich für n ≥ n0 in
diesem Fall für die Supremumsmetrik
1
2
d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn (η) = nηe− 2 nη .
x∈[η,∞)
x∈[η,∞)
Also folgt d∞ ( fn , 0) → 0 für n → ∞, d.h. ( fn )n∈N konvergiert gleichmäßig gegen die
Nullfunktion.
Gleichmäßige Konvergenz sichert nun (wie wir auch später immer wieder feststellen werden), dass sich Grenzübergänge brav“ verhalten.
”
6.6.11 Lemma. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer
Raum, E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N. Weiters sei (xk )k∈N eine Folge in E.
Ist die Folge ( fn )n∈N auf E gleichmäßig konvergent gegen f , und existiert für jedes
n ∈ N der Grenzwert
lim fn (xk ) = An ,
k→∞
dann konvergiert die Folge (An )n∈N und zwar gegen limk→∞ f (xk ). Also gilt
lim lim fn (xk ) = lim lim fn (xk ).
k→∞ n→∞
n→∞ k→∞
Beweis. Sei ǫ > 0 gegeben. Da ( fn )n∈N → f bezüglich d∞ , ist ( fn )n∈N in B(E, Y) eine
Cauchy-Folge. Es existiert also ein N ∈ N, sodass für n, m ≥ N und alle t ∈ E gilt
dY ( fn (t), fm (t)) ≤ ǫ.
6.6. GLEICHMÄSSIGE KONVERGENZ
137
Hält man n und m fest und lässt man t die Folge (xk )k∈N durchlaufen, so folgt mit
Lemma 3.2.12 und Lemma 3.3.1 die Beziehung dY (An , Am ) ≤ ǫ. Damit ist (An )n∈N eine
Cauchy-Folge in Y und daher konvergent, limn→∞ An =: A. Nun gilt
dY ( f (xk ), A) ≤ dY ( f (xk ), fn (xk )) + dY ( fn (xk ), An ) + dY (An , A).
Wähle n so groß, dass für alle t ∈ E und insbesondere für alle t = xk
dY ( f (t), fn (t)) < ǫ und dY (An , A) < ǫ.
Für dieses n existiert ein k0 ∈ N, sodass aus k ≥ k0 die Ungleichung dY ( fn (xk ), An ) < ǫ
folgt. Insgesamt erhalten wir
dY ( f (xk ), A) < 3ǫ, k ≥ k0 .
❑
6.6.12 Bemerkung. Wir werden später eine Verallgemeinerung dieses Lemmas für Netze zeigen. Der Beweis davon wird im Wesentlich derselbe sein.
6.6.13 Korollar. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer
Raum, E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N, sodass ( fn )n∈N auf E gleichmäßig gegen
f konvergiert.
Sind die Funktionen fn alle stetig bei einem x ∈ E, so ist es auch f . Sind alle fn auf
ganz E stetig, so ist es auch f .
k→∞
Beweis. Sei x ∈ E und sei (xk )k∈N eine Folge mit xk −→ x. Aus Lemma 6.6.11 folgt
lim f (xk ) = lim lim fn (xk ) = lim lim fn (xk ) = lim fn (x) = f (x).
k→∞
k→∞ n→∞
n→∞ k→∞
n→∞
Nach Proposition 6.1.4 ist f bei x stetig.
❑
6.6.14 Bemerkung. Nach Lemma 5.1.13 erhält man, dass die Menge C(E, Y) aller beschränkten und stetigen Funktionen von E → Y, eine abgeschlossene Teilmenge von
B(E, Y) versehen mit der Metrik d∞ ist. Dabei ist E Teilmenge eines metrischen Raumes.
6.6.15 Satz (Cauchy-Kriterium). Ist E eine Menge und hY, dY i ein vollständig metrischer Raum, so ist hB(E, Y), d∞i ebenfalls ein vollständig metrischer Raum.
Somit konvergiert eine Folge ( fn )n∈N von Funktionen aus B(E, Y) genau dann
gleichmäßig, wenn es zu jedem ǫ > 0 ein N ∈ N gibt, sodass für alle n, m ≥ N und
beliebiges x ∈ E gilt
dY ( fn (x), fm (x)) ≤ ǫ.
(6.6)
Beweis. Klarerweise ist eine konvergente Folge ( fn )n∈N von Funktionen aus B(E, Y)
eine Cauchy-Folge. Diese Tatsache gilt ja in allen metrischen Räumen.
Sei nun umgekehrt die Cauchy-Bedingung erfüllt. Man beachte, dass (6.6) für alle
x ∈ E zu d∞ ( fn , fm ) ≤ ǫ äquivalent ist.
Es folgt, dass insbesondere für jedes einzelne x die Folge ( fn (x))n∈N eine CauchyFolge in Y und daher konvergent ist. Also existiert der Grenzwert limn→∞ fn (x) punktweise auf E. Wir setzen
f (x) := lim fn (x).
n→∞
138
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
Wir müssen nun noch zeigen, dass f beschränkt ist und dass die Konvergenz sogar
gleichmäßig stattfindet.
Sei ǫ > 0 gegeben und wähle N ∈ N so, dass dY ( fn (x), fm (x)) ≤ ǫ für alle n, m ≥ N
und alle x ∈ E. Hält man x fest und lässt m → ∞ streben, so folgt für n ≥ N
dY ( fn (x), f (x)) ≤ ǫ.
Da x beliebig, war folgt d∞ ( fn , f ) ≤ ǫ, n ≥ N, d.h. fn → f gleichmäßig und mit
Bemerkung 6.6.6 ist f beschränkt.
❑
6.7 Reell- und komplexwertige Folgen und Reihen
6.7.1 Definition. Ist Y = R oder Y = C, dann setzt man für f : E → Y
k f k∞ := sup | f (x)|,
x∈E
und spricht von der Supremumsnorm.
d∞ ( f, g) lässt sich dann als k f − gk∞ schreiben. Klarerweise ist k f k∞ = d∞ ( f, 0),
wobei 0 hier die konstante Nullfunktion ist. Unmittelbar überprüft man, dass ( f, g ∈
B(E, Y))
k f k∞ ≥ 0 und k f k∞ = 0 ⇔ f = 0,
kλ · f k∞ = |λ| · k f k∞ für λ ∈ R bzw. λ ∈ C,
k f + gk∞ ≤ k f k∞ + kgk∞ ,
k f · gk∞ ≤ k f k∞ · kgk∞ .
6.7.2 Korollar. Sind ( fn )n∈N , (gn )n∈N Folgen von Funktionen aus B(E, R) bzw. B(E, C),
die gleichmäßig gegen f bzw. g konvergieren, so gilt
lim fn + gn = f + g, lim fn · gn = f · g,
n→∞
n→∞
und zwar gleichmäßig. Insbesondere gilt limn→∞ λ · fn = λ · f für alle λ ∈ R bzw. λ ∈ C.
Beweis. Wir beweisen exemplarisch nur die zweite Aussage. Es gilt
d∞ ( fn gn , f g) = k fn gn − f gk∞ ≤ kgn k∞ · k fn − f k∞ + k f k∞ · kgn − gk∞ .
Als konvergente Folge ist (gn )n∈N beschränkt, d.h. kgn k∞ = d∞ (gn , 0) ≤ C, n ∈ N.
Somit konvergiert d∞ ( fn gn , f g) gegen Null.
❑
P
6.7.3 Definition. Für n ∈ N sei fn : E → R (C). Man sagt, die Reihe ∞
n=1 fn konverP∞
giert punktweise, wenn für jedes x ∈ E die Reihe n=1 fn (x) in R (C) konvergiert.
P∞
Ist fn ∈ B(E,
PR) (∈ B(E,
C)), n ∈ N, so heißt n=1 fn gleichmäßig konvergent,
N
wenn die Folge n=1
fn (.)
von Partialsummen gleichmäßig konvergiert.
N∈N
P∞
Die Reihe n=1 fn konvergiert absolut als Funktionenreihe, wenn die Reihe
P∞
n=1 k fn k∞ konvergiert.
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
139
P
Klarerweis impliziert die absolute Konvergenz von ∞
n=1 fn als Funktionenreihe die
P∞
absolute Konvergenz von n=1 fn (x) für jedes x ∈ E. Wir haben aber auch folgendes
Ergebnis.
6.7.4 Korollar (Weierstraß Kriterium). Sei ( fn )n∈N eine Folge von beschränkten reellP
bzw. komplexwertigen Funktionen auf einer Menge E. Ist ∞
n=1 fn absolut konvergent
als Funktionenreihe, so ist diese Funktionenreihe auch gleichmäßig konvergent.
P∞
und somit auch gleichmäßig konvergent,
n=1 fn ist sicher dann absolut konvergent,P
wenn es Mn ∈ R, Mn ≥ 0, n ∈ N gibt, für die ∞
n=1 Mn konvergiert, und sodass
k fn k∞ ≤ Mn , n ∈ N.
Beweis. Nach dem Majorantenkriterium (vgl. Satz 3.7.8) folgt aus der Konvergenz von
P∞
P∞
n=1 Mn die von
n=1 k fn k∞ .
P
N
Ist nun letztere Reihe konvergent, so ist die Folge n=1
k fn k∞
von PartialsumN∈N
men eine Cauchy-Folge in R. Es gibt somit zu ǫ > 0 ein N ∈ N, sodass für k, m ≥ N
P
gilt m
n=k+1 k fn k∞ ≤ ǫ. Für solche m, k folgt auch
m
m
X
X
fn ≤
k fn k∞ ≤ ǫ, .
n=k+1 n=k+1
P
∞
N
fn
eine Cauchy-Folge in B(E, R) (∈ B(E, C)), und nach Satz 6.6.15
Also ist n=1
N∈N P
konvergent. Somit ist ∞
n=1 fn gleichmäßig konvergent.
❑
P∞
6.7.5
P Bemerkung. Man sagt eine Funktionenreihe n=1 fn konvergiert absolut und gleichmäßig, wenn die Funktionenreihe ∞
Man sieht unschwer ähnlich wie im Beweis von Korollar
n=1 | fn (.)| gleichmäßig konvergiert.
P 6.7.4, dass daraus die
P∞
gleichmäßige Konvergenz von n=1 fn folgt. Außerdem folgt aus der absoluten Konvergenz von ∞
n=1 fn ihre absolut und
gleichmäßige Konvergenz. Somit liegt dieser Konvergenzbegriff zwischen der gleichmäßigen Konvergenz und der absoluten
Konvergenz.
Die meisten Konvergenzkriterien für Reihen kann man so anpassen, dass sie auch
für Reihen von Funktionen anwendbar sind. Wir wollen das hier aber nicht weiter
ausführen.
Ein bedeutendes Beispiel für Reihen von Funktionen sind die sogenannten Potenzreihen.
6.7.6 Definition. Sind an ∈ C oder auch nur an ∈ R für n ∈ N ∪ {0}, und ist z ∈ C, so
nennt man die komplexwertige Reihe
∞
X
an zn
n=0
eine Potenzreihen5.
Als Konvergenzradius wollen wir die Zahl R ∈ [0, +∞] mit


∞


X




n
|z|
:
z
∈
C,
R = sup 
a
z
ist
konvergent

n




n=0
bezeichnen6.
5
Dabei ist es zunächst unerheblich, ob sie jetzt konvergiert oder nicht.
für z = 0 die Reihe immer absolut konvergiert, ist diese Menge nicht leer.
6 Da
(6.7)
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
140
6.7.7 Beispiel. sind solchen Reihen schon begegnet, z.B. sind die geometrische Reihe
P∞ n
P∞ zn
n=0 z und die Exponentialreihe n=0 n! Potenzreihen.
Erstere konvergiert genau für |z| < 1 und hat somit Konvergenzradius 1. Die Exponentialreihe konvergiert für alle z ∈ C und hat somit Konvergenzradius +∞.
P
n
6.7.8 Satz. Sei ∞
n=0 an z eine Potenzreihe und R ihr Konvergenzradius.
P
n
(i) Für jedes z ∈ C mit |z| > R ist ∞
n=0 an z divergent.
P
n
(ii) Für jedes z ∈ C mit |z| < R ist ∞
n=0 an z sogar absolut konvergent. Insbesondere
ist


∞


X




n
|z|
:
z
∈
C,
.
(6.8)
R = sup 
a
z
ist
absolut
konvergent

n




n=0
P∞
(iii) Für jedes r ∈ [0, R) ist n=0 an zn auf dem abgeschlossenen Kreis Kr (0) = {z ∈ C :
|z| ≤ r} absolut und gleichmäßig konvergent. Die Funktion
z 7→
∞
X
n=0
an zn , z ∈ Kr (0),
ist dabei eine stetige und beschränkte Funktion auf Kr (0).
Im
C
r
Re
−R
R
Abbildung 6.7: Konvergenzradius
(iv) Auf UR (0) = {z ∈ C : |z| < R} ist z 7→
P∞
n=0
an zn eine stetige Funktion7.
(v) Der Konvergenzradius lässt sich auch durch die Koeffizienten an bestimmen. Es
gilt
1
1
1
≤R=
.
≤
√n
|
|
lim supn→∞ | aan+1
lim
inf
| aan+1
lim
sup
|a
|
n→∞
n
n→∞
n
n
Beweis.
7 Im
Allgemeinen ist sie aber nicht mehr beschränkt
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
141
(i) Folgt sofort aus (6.7).
(ii) Folgt aus dem nächsten Punkt.
P
n
(iii) Nach (6.7) gibt es ein komplexes z0 mit r < |z0 | ≤ R, sodass ∞
n=0 an z0 konvergiert.
n
Somit ist die Summandenfolge eine Nullfolge; insbesondere |an z0 | ≤ C, n ∈ N
für ein C > 0. Für |z| ≤ r < |z0 | rechnet man
n
n
r
z
|an zn | = |an zn0 | · ≤ C · .
z0
z0
n
P
∞
r
r
Wegen z0 < 1 konvergiert n=0 C z0 .
PN
Die Partialsummen n=0
an zn , N ∈ N, sind Polynome und damit stetig. Da Kr (0)
kompakt ist (vgl. Beispiel 5.2.10), sind diese Partialsummen auf Kr (0) beschränkt.
Aus dem Weierstraßschen Kriterium (Korollar 6.7.4) folgt die absolute und somit
gleichmäßige Konvergenz unserer Potenzreihe auf Kr (0) gegen eine beschränkte
Funktion. Nach Korollar 6.6.13 ist die Grenzfunktion sogar stetig.
P
(iv) Betrachtet man z 7→ nn=0 an zn auf UR (0), so ist auch dies eine stetige Funktion.
In der Tat ist die Stetigkeit eine lokale Eigenschaft (siehe Fakta 6.1.3), und man
kann zu jedem komplexen z mit |z| < R ein δ > 0 und ein r ∈ [0, R) finden, sodass
Uδ (z) ⊆ Kr (0).
(v) Wäre
1 a lim supn→∞ n+1
an > R so wähle z ∈ C mit
1
> |z| > R.
lim supn→∞ aan+1
n
Wegen (i) divergiert die Potenzreihe. Andererseits folgt
an+1 zn+1 an+1 < 1.
lim sup =
|z|
·
lim
sup
an n n→∞ an z
n→∞
Nach dem Quotientenkriterium (vgl. Fakta 5.2.6 und Satz 3.8.1) ist unsere Potenzreihe aber konvergent. Also muss
1
≤ R.
lim supn→∞ aan+1
n
Analog zeigt man mit dem Wurzelkriterium, dass
Wäre
1 a lim inf n→∞ n+1
an 1 √
lim supn→∞ n |an |
≤ R.
< R, so wähle wieder z ∈ C mit
1
< |z| < R.
lim inf n→∞ aan+1
n
Wegen (ii) konvergiert
die
Potenzreihe. Andererseits sieht man ähnlich wie oben,
an+1 zn+1 dass lim inf n→∞ an zn > 1, und mit dem Quotientenkriterium (vgl. Fakta 5.2.6
und Satz 3.8.1) folgt die Divergenz der Potenzreihe. Also muss auch
1
≥ R.
lim inf n→∞ aan+1
n
Analog zeigt man mit dem Wurzelkriterium, dass
1 √
lim supn→∞ n |an |
≥ R.
142
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
❑
6.7.9 Beispiel. Das Konvergenzverhalten einer Potenzreihe ist durch den obigen Satz
relativ gut abgeklärt. Einzig über die Punkte mit |z| = R, wo R der Konvergenzradius
ist, hat man keine Aussage. Es können hier tatsächlich auch alle Fälle eintreten.
P ∞ zn
P
n P∞ zn
Betrachte die Potenzreihen ∞
. Alle haben Konvergenzn=0 z ,
n=0 n und
n2
P
Pn=0
∞ zn
n
radius 1. Jedoch ist ∞
z
für
|z|
=
1
divergent,
n=0
n=0 n2 absolut konvergent, und
P∞ zn
n=0 n (nicht absolut) konvergent außer bei z = 1, wo sie divergiert.
6.7.10 Korollar. Sei f (z) :=
R > 0.
P∞
n=0
an zn eine Potenzreihe und ihr Konvergenzradius sei
Verschwinden nicht alle an , so gibt es ein δ ∈ (0, R), sodass f (z) , 0 für z ∈
Uδ (0) \ {0}.
P
n
Sei ∞
n=0 bn z eine weitere Potenzreihen mit Konvergenzradien R̃ > 0. Gibt
es eine Menge E ⊆ Umin(R,R̃) (0), die Null als Häufungspunkt hat, und sodass
P∞
P∞
n
n
n=0 an z =
n=0 bn z für alle z ∈ E, so folgt an = bn , n ∈ N ∪ {0} und damit
R = R̃.
Beweis. Sei n0 ∈ N ∪ {0} der erste Index, sodass an0 , 0. Wegen den Rechenregeln
P
P∞
n
n
für Reihen konvergiert ∞
n=0 an z genau dann, wenn g(z) =
n=0 an+n0 z es tut, wobei
im Fall der Konvergenz zn0 g(z) = f (z). Letztere ist also auch eine Potenzreihe mit
Konvergenzradius R.
Wegen g(0) = an0 , 0 und wegen der Stetigkeit von g auf UR (0) gibt es ein δ ∈
(0, R), sodass |g(z) − g(0)| < |an0 | und somit g(z) , 0 für z ∈ Uδ (0). Also ist auch
f (z) , 0 für z ∈ Uδ (0) \ {0}.
Um die zweite Aussage zu zeigen betrachte man die Potenzreihe
P
n
h(z) = ∞
n=0 (an − bn )z , die zumindest für |z| < min(R, R̃) konvergiert, und damit einen
Konvergenzradius ≥ min(R, R̃) hat. Nach Voraussetzung und den Rechenregeln für
Reihen folgt h(z) = 0, z ∈ E. Da 0 ein Häufungspunkt von E ist, widerspricht das aber
der ersten Aussage, außer an − bn = 0, n ∈ N.
❑
6.7.11 Bemerkung. Ist |z| < R, so folgt aus Korollar 3.7.3
∞
X
an (z̄)n =
n=0
∞
X
ān zn .
(6.9)
n=0
P
n
Wir sehen insbesondere, dass wenn alle an reell sind und z = x ∈ R, auch ∞
n=0 an x ∈
R.
P
n
Ist umgekehrt ∞
n=0 an x ∈ R für alle x ∈ R, |x| < R, so folgt aus (6.9), dass die
Potenzreihen (beide mit Konvergenzradius R)
∞
X
n=0
an zn ,
∞
X
ān zn
n=0
für z ∈ R ∩ UR (0) übereinstimmen. Aus Korollar 6.7.10 folgt an = ān , also an ∈ R.
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
143
6.7.12 Bemerkung. Üblicherweise werden auch Reihen der Form
∞
X
n=0
an (z − z0 )n
(6.10)
für ein festes z0 als Potenzreihen bezeichnet. Die hergeleiteten Aussagen für Potenzreihen stimmen sinngemäß offensichtlich auch für solche Reihen. Dabei ist z.B. der
Bereich der Konvergenz UR (z0 ) mit entsprechend definierten Konvergenzradius.
Funktionen f : D → C mit offenem D ⊆ C heißen analytisch in einem Punkt
z0 ∈ D, falls es eine offene Kugel Ur (z0 ) ⊆ D mit r > 0 und eine Potenzreihe der
Form (6.10) gibt, sodass r kleiner oder gleich dem Konvergenzradius der Reihe ist und
sodass f (z) für alle z ∈ Ur (z0 ) mit dem Grenzwert der Reihe (6.10) übereinstimmt, f
also lokal um z0 als Grenzwert einer Potenzreihe dargestellt werden kann.
Ist f um jedes z0 ∈ D analytisch, so heißt f analytisch.
6.7.13 Satz. Sei P(z) =
Ist die Zahlenreihe s :=
P∞
j=0
P∞
a j z j eine Potenzreihe, R ihr Konvergenzradius mit 0 < R < ∞. Weiters sei z0 ∈ C mit |z0 | = R.
j
j=0 a j z0 konvergent, so gilt
lim P(tz0 ) = s.
(6.11)
t→1−
Beweis. Sei |z| < R und
sn :=
n
X
j
a j z0 , s := lim sn .
n→∞
j=0
Laut Voraussetzung existiert der Grenzwert s. Aus Lemma 3.8.4 folgt
n
X
a jz j =
j=0
!
!
!
!
n
n−1
X
X
z j
z j+1
z n
z j
(a j z0j )
sj (
=
sn −
−
)=
z0
z0
z0
z0
j=0
j=0
z
z0
Wegen
z
z0
n
!n
sn + 1 −
! n−1
!j
z
z X
sj
.
z0 j=0
z0
sn → 0 konvergiert die Reihe auf der rechten Seite, und wir erhalten
P(z) =
∞
X
j=0
Andererseits ist folgt aus
P∞
j=0
ζj =
1
1−ζ
a jz j = 1 −
! ∞
!j
z
z X
sj
, |z| < R.
z0 j=0
z0
, |ζ| < 1
s= 1−
! ∞
!
z j
z X
s
.
z0 j=0 z0
Für |z| < R und N ∈ N folgt
! !
N
∞
z X
z j z j
z X
|P(z) − s| ≤ 1 − |s − s j |
|s − s j |
+ 1 − z0 j=0
z0
z0 j=N+1
z0
Ist nun ǫ > 0 und N fest und so groß, dass |s − s j | < ǫ, j > N, so ist das kleiner oder gleich
!j
X
1 − z N
z0
z
1 − z .
|s − s j |
+ǫ
z0 j=0
z0
1 − z (6.12)
z0
Ist z = tz0 , t ∈ (0, 1), so sieht man, dass es ein t0 ∈ (0, 1) gibt, sodass für t > t0 dieser Ausdruck kleiner oder gleich 2ǫ ist.
Da ǫ > 0 beliebig war, gilt (6.11).
❑
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
144
Im
C
α
Re
α
Abbildung 6.8: Winkelraum Nα
6.7.14 Bemerkung. Mit einer etwas feiner Argumentationsweise läßt sich (6.11) folgendermaßen verallgemeinern.
Nähert sich z nichttangentiell dem Punkt z0 an, so konvergiert P(z) gegen s. Das bedeutet: Ist Nα , 0 < α < π der
Winkelraum
Nα = {reiβ ∈ C : r > 0, β ∈ [−α, α]},
so gilt
lim
τ∈Nα , τ→0
P((1 − τ)z0 ) = s.
(6.13)
Um das einzusehen, bemerke man zunächst, dass für τ = reiβ ∈ Nα mit r = |τ| ≤ cos α (für die Funktion cos siehe den
nächsten Abschnitt)
|τ|(1 + |1 − τ|)
2
2
2
|τ|
=
≤
≤
.
≤
1 − |1 − τ|
2 cos β − r
2 cos α − r
cos α
1 − |(1 − τ)|2
Nun folgt man dem Beweis von Satz 6.7.13 bis (6.12). Dann folgt mit z = (1 − τ)z0 , |τ| ≤ cos α, τ ∈ Nα
!j
N
z X
z
2
|s − s j |
|P(z) − s| ≤ 1 − .
+ǫ
z0 j=0
z0
cos α
Für |τ| → 0 konvergiert der erste Summand gegen Null. Also gibt es ein t0 ∈ (0, cos α), sodass |P(z) − s| ≤ ǫ cos3 α , wenn nur
|τ| ≤ t0 , τ ∈ Nα .
Da ǫ beliebig war, folgt (6.13).
6.8 Die Exponentialfunktion
Wir wollen jetzt einige der sogenannten elementaren Funktionen betrachten. Grundlage
für alle diese ist die Exponentialfunktion
exp(z) =
∞
X
zn
, z ∈ C.
n!
n=0
(6.14)
Wir haben schon gesehen, dass diese Reihe für alle z ∈ C konvergiert. Sie ist also eine
Potenzreihe mit Konvergenzradius +∞. Insbesondere ist exp : C → C stetig.
Weitere wichtige elementare Funktionen sind sin und cos.
6.8.1 Definition. Für z ∈ C seien
cos z =
exp(iz) − exp(−iz)
exp(iz) + exp(−iz)
, sin z =
,
2
2i
die sogenannten trigonometrischen Funktionen Cosinus und Sinus.
Als Zusammensetzung von stetigen Funktionen sind cos : C → C und sin : C → C
auf C stetig (siehe Lemma 6.1.6 und Korollar 6.1.8).
6.8. DIE EXPONENTIALFUNKTION
145
6.8.2 Lemma. Für alle z ∈ C gilt
cos z =
∞
∞
X
X
z2k
z2k+1
(−1)k
, sin z =
.
(−1)k
(2k)!
(2k + 1)!
k=0
k=0
Also sind cos und sin Grenzfunktionen obiger Potenzreihe mit Konvergenzradius +∞.
Beweis. Für gerade n = 2k gilt in + (−i)n = 2i2k = 2(−1)k , und für ungerade n = 2k + 1
gilt in + (−i)n = 0. Aus den Rechenregeln für Reihen folgt somit
z2k
exp(iz) + exp(−iz) X in + (−i)n zn X
=
=
.
(−1)k
2
2
n! k=0
(2k)!
n=0
∞
∞
Analog leitet man die Potenzreihenentwicklung für sin her.
❑
6.8.3 Satz. Sei z, w ∈ C und x, y ∈ R. Dann gilt
(i) exp(z) , 0, exp(z + w) = exp(z) exp(w) und exp(−z) =
(exp z)n = exp(zn), n ∈ Z.
1
exp(z) .
Schließlich ist
(ii) exp(iz) = cos z + i sin z. Allgemeiner gilt die Formel von de Moivre:
(cos z + i sin z)n = cos(nz) + i sin(nz), n ∈ Z.
(iii) exp(z̄) = exp(z), cos(z̄) = cos(z), sin(z̄) = sin(z).
Insbesondere sind exp |R , cos |R , sin |R Funktionen, die R nach R abbilden.
(iv) cos y = Re exp(iy), sin y = Im exp(iy) und exp(x + iy) = exp(x)(cos y + i sin y),
wobei exp(x) ∈ R.
Im
i exp(x) sin y
( x)
exp
i
exp(iy) =
cos y + i sin y
i sin y
0
−1
exp(x + iy) =
exp(x)(cos y + i sin y)
cos y 1
exp(x) cos y
Re
−i
Abbildung 6.9: Darstellung der Lage von exp(x + iy)
(v) Die Funktion exp eingeschränkt auf die reelle Achse ist eine streng monoton
wachsende bijektive Funktion von R auf R+ mit exp(0) = 1. Insbesondere gilt
lim exp(x) = +∞, lim exp(x) = 0.
x→+∞
x→−∞
(6.15)
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
146
(vi) | exp(z)| = exp(Re z). Insbesondere gilt | exp(z)| = 1 ⇔ Re z = 0 und
(cos y)2 + (sin y)2 = 1.
(vii) cos(−z) = cos z und sin(−z) = − sin z.
(viii) Es gelten die Summensätze für Sinus und Cosinus
cos(z + w) = cos z cos w − sin z sin w, sin(z + w) = sin z cos w + cos z sin w .
Beweis.
(i) exp(z + w) = exp(z) exp(w) haben wir in Beispiel 3.9.13 gesehen. Die beiden
nächsten Aussagen folgen aus exp(−z) · exp(z) = exp(0) = 1. Schließlich folgt
(exp z)n = exp(zn), n ∈ N, durch vollständige Induktion, und für n ∈ Z wegen
1
.
exp(−zn) = exp(zn)
(ii) exp(iz) = cos z + i sin z folgt leicht durch Nachrechnen, und daraus
(cos z + i sin z)n = (exp iz)n = exp(inz) = cos(nz) + i sin(nz).
(iii) Da die Koeffizienten in den Potenzreihenentwicklungen reell sind, folgt die Aussage sofort aus Bemerkung 6.7.11.
(iv) Folgt aus (i) und (ii), da nach dem letzten Punkt exp(x), cos y, sin y ∈ R.
(v) Für x > 0 folgt aus der Tatsache, dass alle Koeffizienten in der Potenzreihe (6.14)
von exp strikt positiv sind, immer exp(x) > 1 + x > 1. Klarerweise ist exp(0) = 1.
1
Für x < 0 folgt aus (i), dass exp(x)
= exp(−x) > 1 − x > 1 und somit exp(x) ∈
1
(0, 1), exp(x) < 1−x .
Aus diesen Abschätzungen schließen wir sofort auf (6.15). Aus x < y ergibt sich
wegen
exp(y) = exp(x + (y − x)) = exp(x) · exp(y − x) > exp(x)
die Tatsache, dass exp(x) streng monoton wachsende ist.
Nun ist exp(x) : R → R+ stetig. Somit muss wegen Korollar 6.5.3 exp(R) ein
offenes Intervall sein, das wegen (6.15) aber nur (0, +∞) = R+ sein kann.
(vi) Aus
| exp(z)|2 = exp(z)exp(z) = exp(z) exp(z) = exp(z + z) = exp(2 Re z) = exp(Re z)2
und aus der Tatsache, dass | exp(z)| und exp(Re z) positive reelle Zahlen sind,
folgt | exp(z)| = exp(Re z). Weiters gilt (cos y)2 + (sin y)2 = | cos y + i sin y|2 =
| exp(iy)|2 = exp(0) = 1.
(vii) Folgt aus der jeweiligen Potenzreihenentwicklung, da nur gerade bzw. nur ungerade Potenzen vorkommen.
(viii) Man setze die Definition von sin und cos ein und rechne die Gleichheit nach.
❑
+
Wie wir unter anderem gerade gesehen haben, ist exp : R → R eine Bijektion.
6.8. DIE EXPONENTIALFUNKTION
147
y
4
3
y = exp(x)
2
1
−3
−2
−1
1
0
2
x
3
−1
Abbildung 6.10: Funktionsgraphen der reellen Exponentialfunktion
y
y = ln(x)
3
2
1
−1
0
1
2
3
4
5
6
x
−1
−2
−3
Abbildung 6.11: Logarithmus naturalis
6.8.4 Definition. Mit ln : R+ → R wollen wir die Inverse von exp : R → R+ bezeichnen und sprechen vom natürlichen Logarithmus bzw. vom Logarithmus naturalis.
Aus Satz 6.8.3, Korollar 6.5.3 und durch elementares Nachrechnen folgt sofort
6.8.5 Korollar. Die Funktion ln : R+ → R ist eine stetige und streng monoton wachsende Bijektion. Es gilt
lim ln x = −∞, lim ln x = +∞ ,
x→0+
x→+∞
sowie
ln(xy) = ln x + ln y, x, y > 0, ln(xn ) = n ln x, x > 0, n ∈ Z .
Beachte, dass wir den Logarithmus nur für reelle Werte definiert haben. Dies ist
kein Zufall, will man den Logarithmus auch für komplexe Werte definieren, trifft man
auf Schwierigkeiten ganz essentieller Natur (vgl. Vorlesung zur Komplexen Analysis).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
148
Wir können nun mit Hilfe der Exponentialfunktion die bisher nur für rationale b
definierte Ausdrücke ab auch für beliebige b ∈ R definieren.
6.8.6 Korollar. Für a ∈ R+ und b ∈ Q gilt ab = exp(b ln a).
Setzen wir ab durch exp(b ln a) auf ganz (a, b) ∈ R+ × R fort, so gilt (a, a1, a2 ∈
R+ , b, b1 , b2 ∈ R)
ab1 +b2 = ab1 · ab2 , (a1 a2 )b = ab1 · ab2 .
Beweis. Ist b = qp ∈ Q mit p ∈ Z, q ∈ N, so ist exp(b ln a) nach Satz 6.8.3 eine positive
reelle Zahl mit der Eigenschaft, dass
(exp(b ln a))q = exp(bq ln a) = exp(p ln a) = exp(ln a p ) = a p . .
√q
Also ist exp(b ln a) = a p .
Die Funktionalgleichungen folgen aus denen von exp und ln.
❑
6.8.7 Bemerkung.
Als Zusammensetzung der stetigen Funktionen exp, ln und ·, ist (a, b) 7→ ab auf
(a, b) ∈ R+ × R stetig (vgl. Beispiel 6.1.7).
Die Funktion exp kann nun selbst mit dieser Notation als allgemeine Potenz
angeschrieben werden. Sei dazu e := exp(1), die Eulersche Zahl. Dann gilt nach
der Definition der allgemeinen Potenz
e x = exp(x ln e) = exp x ln exp(1) = exp(x) .
| {z }
=1
6.8.8 Bemerkung. Wir haben schon festgestellt, und auch demonstriert, dass die Eulersche Exponentialfunktion eine ganz zentrale Rolle spielt. Daher wird auch die reelle
Zahl e ein interessantes Objekt sein. Dazu wollen wir hier bemerken, dass man die
P
1
Eulersche Zahl e, neben ihrer Definition als e := exp(1) = ∞
n=0 n! auch in vielfacher
Weise anders charakterisieren kann. Zum Beispiel kann man zeigen, dass
e = lim 1 +
n→∞
z
1 n
bzw. ez = lim 1 + n ,
n→∞
n
n
gilt.
Diese Formel gibt auch Anlass zu alternativen Definitionen der Funktion exp(x),
nämlich als e x . Dafür muss man allerdings die allgemeine Potenz zuerst (ohne Verwendung
von exp) definieren. Dies kann man so machen, dass man von der Funktion
√q
a p : R+ ×Q → R+ ausgeht, und diese mittels stetiger Fortsetzung“ zu einer Funktion
”
R+ × R → R+ macht.
Wie aus der Schule bekannt, ist einer der wichtigsten Naturkonstanten die Zahl
π. Mit Hilfe der Funktion cos kann man nun die Existenz dieser Zahl mit all ihren
wichtigen Eigenschaften herleiten.
6.8.9 Lemma.
Für t ∈ [0, 2] und n ∈ N gilt
tn
n!
≥
tn+2
(n+2)! .
Die Funktion cos : R → R hat eine kleinste positive Nullstelle x0 , die im Intervall
(0, 2) liegt.
6.8. DIE EXPONENTIALFUNKTION
149
Für x0 gilt sin x0 = 1.
Beweis.
Durch Umformen ist die zu beweisende Ungleichung äquivalent zu
(n + 2)(n + 1) ≥ t2 , und somit richtig.
Wir betrachten die Potenzreihenentwicklung von cos in Lemma 6.8.2 und stellen
sofort cos 0 = 1 fest. Da man in Reihen Klammern setzen darf, folgt aus dem
letzten Punkt
!
∞
22 24
24l+4
1
22 24 X 24l+2
≤1−
+
−
−
+
=− .
cos 2 = 1 −
2
4! l=1 (4l + 2)! (4l + 4)!
2
4!
3
Nach dem Zwischenwertsatz Korollar 6.2.6 hat t 7→ cos t im Intervall (0, 2) sicher eine Nullstelle x.
Nun ist nach Proposition 6.1.10 die Menge {t ∈ R : cos t , 0} = cos−1 (R \ {0})
als Urbild einer offenen Menge unter einer stetigen Funktion selber offen. Somit
ist ihr Komplement N = {t ∈ R : cos t = 0} und daher auch N ∩ [0, +∞) abgeschlossen. In Beispiel 5.1.14 haben wir gesehen, dass N ∩ [0, +∞) ein Minimum
hat, welches wegen cos 0 = 1 sicher nicht 0 ist. Also gibt es eine kleinste positive
Nullstelle x0 von t 7→ cos t.
Aus Satz 6.8.3 folgt wissen wir (cos x0 )2 + (sin x0 )2 = 1, und daher (sin x0 )2 = 1.
Nun ist aber wegen dem ersten Punkt
sin x0 =
und somit sin x0 = 1.

∞ 
X
x4l+3

 x4l+1
0
 ≥ 0,
 0
−
(4l + 1)! (4l + 3)!
l=0
❑
6.8.10 Definition. Die Zahl π sei jene positive reelle Zahl, sodass
tive Nullstelle von cos : R → R ist.
π
2
y
die kleinste posi-
y = sin(x)
y = cos(x)
1
−2π
− 3π
2
−π
− π2
0
−1
π
2
π
3π
2
2π
Abbildung 6.12: Funktionsgraphen des reellen Sinus und Cosinus
x
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
150
6.8.11 Satz.
(i) exp(±i π2 ) = ±i, exp(±iπ) = −1, exp(±2iπ) = 1.
(ii) cos(± π2 ) = 0, cos(±π) = −1, cos(±2π) = 1,
sin(± π2 ) = ±1, sin(±π) = 0, sin(±2π) = 0.
(iii) exp(z + 2kπi) = exp(z), sin(z + 2kπ) = sin(z), cos(z + 2kπ) = cos(z), z ∈ C, k ∈ Z. .
(iv) exp(z) = 1 ⇐⇒ ∃k ∈ Z : z = 2kπi (⇔ z ∈ 2πiZ).
(v) cos z = 0 ⇔ ∃k ∈ Z : z =
π
2
+ πk, und sin z = 0 ⇔ ∃k ∈ Z : z = πk.
(vi) Es gilt exp(C) = C \ {0}, wobei exp(z) = exp(ζ) ⇔ z − ζ ∈ 2πiZ.
Beweis.
(i) Wegen Satz 6.8.3 und Lemma 6.8.9 gilt exp(i π2 ) = cos π2 + i sin π2 = i. Der Rest
folgt aus Satz 6.8.3, (i).
(ii) Folgt aus (i), indem man Real- und Imaginärteil betrachtet.
(iii) exp(z + 2kπi) = exp(z) · exp(2πi)k = exp(z). Daraus folgen durch Einsetzen von
Definition 6.8.1 die restlichen Aussagen.
(iv) Sei exp(z) = 1 gegeben. Aus Satz 6.8.3 wissen wir, dass damit Re z = 0.
Klarerweise ist y = η + 2lπi für ein l ∈ Z und η ∈ [0, 2π). Aus (iii) folgt
exp(iη) = exp(iy) = 1.
Angenommen η , 0. Schreibe
η
η
η
exp(i ) = cos + i sin =: u + iv mit u, v ∈ R .
4
4
4
Dabei ist wegen 0 < η4 < π2 , und der Definition von π2 , sicherlich u , 0. Im Fall
v = 0 wäre exp(i η4 ) = u = ±1 und somit
exp(i π2 )
i
π η
exp(i( − )) =
= ±i..
η =
2 4
±1
exp( 4 )
Also ist x1 = π2 − 4η eine Nullstelle von cos t mit x1 ∈ (0, π2 ) im Widerspruch zur
Definition von π2 . Also muss v , 0. Klarerweise gilt auch
1 = exp(iη) = (u + iv)4 = u4 − 6u2 v2 + v4 + i 4uv(u2 − v2 ) .
Die rechte Zahl ist genau dann reell, wenn u2 − v2 = 0. Wegen u2 + v2 = 1 ist das
äquivalent zu u2 = v2 = 12 . Dann ist aber u4 − 6u2 v2 + v4 = −1 , 1.
(v) Es ist cos z = 0 genau dann, wenn exp(iz) = − exp(−iz) = exp(iπ − iz), also
wenn exp(2iz − iπ) = 1. Dieses tritt genau dann ein, wenn 2iz−iπ
2πi ∈ Z, d.h. wenn
z ∈ π2 + πZ. Analog bestimmt man die Nullstellen des Sinus.
(vi) Sei w ∈ C, w , 0, gegeben. Da exp(x) eine Bijektion von R auf R+ ist, gibt es ein
w
x ∈ R mit exp(x) = |w|. Schreibe exp
x = u + iv mit u, v ∈ R.
Klarerweise ist u2 + v2 = 1. Insbesondere gilt u ∈ [−1, 1]. Wegen cos 0 = 1
und cos π = −1 gibt es nach dem Zwischenwertsatz (Korollar 6.2.6) gibt es eine
t ∈ [0, π] mit u = cos t.
6.8. DIE EXPONENTIALFUNKTION
151
Aus u2 + v2 = 1 = (cos t)2 + (sin t)2 folgt v2 = (sin t)2 . Ist v = sin t, so setze y = t.
Sonst muss v = − sin t, und dann setze man y = −t. In jedem Falle ist cos y = u
und sin y = v und somit
w = exp(x)(cos y + i sin y) = exp(x + iy).
Ist exp(z) = exp(ζ), so folgt 1 = exp(z − ζ), also z − ζ ∈ 2πiZ.
❑
Jede komplexe Zahl w , 0 lässt sich gemäß Satz 6.8.11 als exp(z) schreiben. Wählt
man z so, dass 0 ≤ Im z < 2π, so ist nach Satz 6.8.11, (v), z eindeutig bestimmt. Also
ist exp : R × [0, 2π) → C \ {0} bijektiv.
Im w
Im z
exp(1 + 12 πi) = ie
−1 +2πi
2πi
1 +2πi
−1 +23 πi
3
2 πi
1 +23 πi
exp(z) = w
exp( 21 πi) = i
√1 (1
2
exp(1 + πi) = −e
e = exp(1)
0
−1 +πi
πi
1 +πi
−1 +21 πi
1
2 πi
1 +21 πi
+ i) = exp( 41 πi)
exp(πi) = −1
1 = exp(0) = exp(2πi)
Re w
exp( 32 πi) = −i
1
4 πi
−1
0
1
exp(1 + 32 πi) = −ie
Re z
Abbildung 6.13: Exponentialfunktion als Abbildung von C auf C \ {0}
6.8.12 Definition. Setzt man r = exp(Re z) und t = Im z, so erhält man
w = r(cos t + i sin t).
Also ist (r, t) 7→ w eine Bijektion von T : R+ × [0, 2π) → C \ {0}. (r, t) heißen dabei die
Polarkoordinaten von w.
6.8.13 Bemerkung.
Wegen Satz 6.8.11, (iii), kann dabei auch das Intervall [0, 2π) durch irgendein
halboffenes Intervall der Länge 2π, z.B. (−π, π], ersetzen.
Offensichtlich ist T : R+ × [0, 2π) → C \ {0} als Zusammensetzung von
stetigen Funktionen selbst stetig. Die Umkehrung ist nicht stetig: Es gilt
limn→∞ exp(−i n1 ) = 1, aber
1
1
lim T −1 (exp(−i )) = lim (1, 2π − ) = (1, 2π) , (1, 0) = T −1 (1).
n→∞
n
n
n→∞
Nimmt man statt [0, 2π) z.B. das Intervall [a, a + 2π), so treten entsprechende
Probleme beim Winkel a auf.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
152
Nimmt man den kritischen Winkel aus, so sind die Polarkoordinaten in beide Richtungen stetig.
6.8.14 Proposition. Die Abbildung
T : R+ × (a, a + 2π) → C \ {r exp(ia) : r ∈ [0, +∞)}
ist bijektiv, und T und T −1 sind stetig.
Beweis. Es bleibt die Stetigkeit von T −1 : D := C \ {r exp(ia) : r ∈ [0, +∞)} → R+ × (a, a + 2π) zu zeigen. Dazu sei
limn→∞ zn = z ∈ D für eine Folge aus D. Somit können wir
zn = rn exp(iαn ), n ∈ N, z = r exp(iα),
mit rn , r ∈ (0, +∞) und αn , α ∈ (a, a + 2π) schreiben. Wegen rn = |zn |, r = |z| folgt rn → r.
Ist (αn(k) )k∈N eine Teilfolge, so hat diese wegen der Kompaktheit von [a, a + 2π] eine gegen ein β ∈ [a, a + 2π]
konvergente Teilfolge (αn(k(l)) )l∈N . Somit wäre wegen der Stetigkeit von T
exp(iβ) = lim exp(iαn(k(l)) ) = lim
l→∞
l→∞
zn(k(l))
z
= = exp(iα),
rn(k(l))
r
und nach Satz 6.8.11 β − α ∈ 2πZ. Also folgt α = β und nach Bemerkung 3.2.11 gilt αn → α.
❑
6.8.15 Bemerkung. Wir sehen nun auch, dass es für n ∈ N immer n viele n-te Wurzeln
einer jeder Zahl w ∈ C \ {0} gibt:
Ist w = r(cos t + i sin t), (r, t) ∈ R+ × [0, 2π), so sind ( j = 0, . . . , n − 1)
!
√n
t + 2 jπ
t + 2 jπ
+ i sin
η j = r · cos
n
n
komplexe Zahlen, die wegen der Formel von de Moivre alle ηnj = w erfüllen.
6.9 Fundamentalsatz der Algebra
Als Anwendung der bisher entwickelten Stetigkeitstheorie wollen wir den Fundamentalsatz der Algebra beweisen. Zunächst benötigen wir ein Lemma.
6.9.1 Lemma. Ist f (z) = an zn + . . . + a0 , an , 0 ein komplexes Polynom, so hat | f (z)|
ein Minimum, d.h. es gibt eine Zahl c ∈ C mit | f (c)| ≤ | f (z)| für alle z ∈ C.
Beweis. Wir haben in Beispiel 5.3.18 gesehen, dass lim|z|→∞ |an zn + . . . + a0 | = +∞.
Insbesondere gibt es eine Zahl R > 0, sodass | f (z)| ≥ |a0 | = | f (0)|, z ∈ C mit |z| > R.
Die Kreisscheibe K := {z ∈ C : |z| ≤ R} ist kompakt, und | f (z)| ist, als Zusammensetzung der stetigen Funktionen f und |.|, stetig auf K. Daher wird ein Minimum
angenommen, minz∈K | f (z)| = | f (c)| (≤ | f (0)|). Unsere Wahl von R sichert, dass
| f (c)| = minz∈C | f (z)|.
❑
6.9.2 Satz (Fundamentalsatz der Algebra). Sei p(z) = a0 + · · · + an zn ein komplexes Polynom vom Grad n. Dann existieren n (nicht notwendig verschiedene) Zahlen
z1 , . . . , zn ∈ C, sodass
n
Y
(z − zk ).
(6.16)
p(z) = an
k=1
Beweis.
6.9. FUNDAMENTALSATZ DER ALGEBRA
153
Sei h(z) ein Polynom der Form h(z) = 1 + bzk + zk g(z) mit k ∈ N, b ∈ C \ {0}
und einem Polynom g, wobei g(0) = 0. Wir zeigen die Existenz eines u ∈ C mit
|h(u)| < 1.
Dazu wählen wir eine k-te Wurzel von − b1 (vgl. Bemerkung 6.8.15), d.h. eine
Zahl d ∈ C mit bd k = −1. Für t ∈ (0, 1] gilt
|h(td)| ≤ |1 − tk | + |tk dk g(td)| = 1 − tk + tk |dk g(td)|.
Da |dk g(td)| = 0 für t = 0, folgt aus der Stetigkeit dieses Ausdruckes bei 0, dass
|dk g(td)| ≤ 12 für t ∈ (0, δ) mit einem δ > 0. Für jedes solche t gilt |h(td)| ≤
1 − 12 tk < 1.
Nun zeigen wir, dass jedes nichtkonstante Polynom f (z) eine Nullstelle in C hat.
Nach Lemma 6.9.1 gibt es ein c ∈ C, sodass | f (c)| = minz∈C | f (z)| (siehe Lemma
6.9.1). Wäre f (c) , 0, so betrachte
h(z) :=
f (z + c)
= 1 + bk zk + bk+1 zk+1 + . . . + bn zn , bk , 0.
f (c)
Nach dem ersten Beweisschritt existiert ein u ∈ C mit |h(u)| < 1 und daher
| f (u + c)| = |h(u)| · | f (c)| < | f (c)|
im Widerspruch zu | f (c)| = minz∈C | f (z)|.
Wir zeigen nun (6.16) durch Induktion nach dem Grad von p(z). Ist der Grad
eins, also p(z) = a1 z + a0 mit a1 , 0, so ist p(z) = a1 (z − (− aa10 )).
Stimme nun (6.16) für alle Polynome vom Grad kleiner als n, sei p(z) vom Grad
n. Nach dem vorigen Beweisschritt hat p eine Nullstelle z1 . Mittels Polynomdivision und Einsetzen von z = z1 erhält man p(z) = s(z)(z − z1 ). Das Polynom
s hat den gleichen Führungskoeffizienten wie p, und lässt sich nach Induktionsvoraussetzung in der angegebenen Weise faktorisieren.
❑
6.9.3 Bemerkung. Funktionen f : R → C der Bauart
f (t) =
N
X
cn exp(itn),
n=−N
für ein N ∈ N und cn ∈ C, n = 0, . . . , N nennt man trigonometrische Polynome.
Man sieht sofort, dass f (t) = exp(iNt) · p(exp(it)), wobei p : C \ {0} → C
p(z) =
2N
X
cn−N zn .
n=0
Also ist f stetig und 2π-periodisch. Weiters stimmen zwei trigonometrische Polynome überein, wenn das ihre Koeffizienten
tun. Ist nämlich
M
N
X
X
dn exp(itn),
cn exp(itn) =
n=−N
n=−M
PN
wobei o.B.d.A. N ≥ M, so folgt n=−N
(cn − dn ) exp(itn) = 0, wobei wir b j = 0, M < j ≤ N setzten. Es folgt
P
n
q(exp(it)) = 0, t ∈ R, mit q(z) = 2N
n=0 (cn−N − dn−N )z . Also hat das Polynom q(z) unendlich viele Nullstellen und ist
damit das Nullpolynom, d.h. cn = dn , n = −N, . . . , N.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
154
Schließlich lässt sich jedes trigonometrische Polynom wegen
N
X
cn exp(itn) =
n=−N
N
X
cn (cos nt + i sin nt) = c0 +
n=−N
N
X
(cn + c−n ) cos nt +
N
X
bn sin nt,
n=1
in der Form
a0 +
N
X
an cos nt +
N
X
n=1
(cn − ic−n ) sin nt,
(6.17)
n=1
n=1
schreiben. Umgekehrt lässt sich jede Funktion der Bauart (6.17) schreiben als
a0 +
N
X
an
n=1
N
−1
N
X
X
exp(int) + exp(−int) X exp(int) − exp(−int)
a−n + ib−n
an − ibn
bn
+
=
exp(itn) + a0 +
exp(itn).
2
2i
2
2
n=−N
n=1
n=1
Somit ist (6.17) eine zweite Art trigonometrische Polynome darzustellen, wobei die Koeffizienten in (6.17) ebenfalls eindeutig sind.
6.10 Weitere wichtige elementare Funktionen
Die Funktion
π
sin x
tan : R \ { + πn : n ∈ Z} → R, tan(x) =
,
2
cos x
wird als Tangens und
cot : R \ {πn : n ∈ Z} → R, cot(x) =
cos x
,
sin x
als Cotangens bezeichnet.
y
y = tan(x)
y = cot(x)
− 3π
2
−2π
−π
3π
2
π
2
− π2
0
π
2π
x
Abbildung 6.14: Tangens und Cotangens
Betrachtet man tan eingeschränkt auf (− π2 , π2 ), so zeigt man elementar, dass tan dieses Intervall bijektiv auf R abbildet. Entsprechend bildet cot das Intervall (0, π) bijektiv
auf R ab. Die jeweiligen Umkehrfunktionen heißen arctan (Arcustangens) bzw. arccot
(Arcuscotangens).
Man kann auch sin auf das Intervall [− π2 , π2 ] einschränken, und erhält eine Bijektion
von [− 2π , π2 ] auf [−1, 1]. Die Umkehrfunktion davon heißt arcsin (Arcussinus). Entsprechend bildet cos das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion davon
heißt arccos (Arcuscosinus).
6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN
155
y
y = arctan(x)
y = arccot(x)
π
π
2
−π
−2π
π
0
2π
x
− π2
Abbildung 6.15: Arcustangens und Arcuscotangens
y
y = arcsin(x)
y = arccos(x)
π
π
2
−2
−1
0
1
2
x
− π2
Abbildung 6.16: Arcussinus und Arcuscosinus
Ähnlich wie sin und cos sind Sinus Hyperbolicus sinh und Cosinus Hyperbolicus
cosh defininiert:
cosh z :=
exp(z) + exp(−z)
exp(z) − exp(−z)
, sinh z :=
, z ∈ C.
2
2
Die Werte von cosh z und sinh z liegen im allgemeinen in C. Für reelle z = x liegen
cosh x und sinh x offensichtlich in R.
Da sinh : R → R bijektiv ist, hat er eine Inverse die mit areasinh (Areasinus Hyperbolicus) bezeichnet wird. Die Funktion cosh eingeschränkt auf [0, +∞) bildet dieses
Intervall bijektiv auf [1, +∞) ab. Die entsprechende Umkehrfunktion von [1, +∞) auf
[0, +∞) heißt areacosh (Areacosinus Hyperbolicus).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
156
y
4
3
y = sinh(x)
y = cosh(x)
2
1
−3
−2
−1
−1
0
1
2
x
3
−2
−3
−4
Abbildung 6.17: Sinus Hyperbolicus und Cosinus Hyperbolicus
y
y = areasinh(x)
y = areacosh(x)
3
2
1
−6
−5
−4
−3
−2
−1
−1
0
1
2
3
4
5
6
x
−2
−3
Abbildung 6.18: Areasinus Hyperbolicus und Areacosinus Hyperbolicus
sinh x
Schließlich ist tanh : R → R definiert durch tanh x = cosh
x , und coth : R \ {0} → R
x
durch coth x = cosh
.
sinh x
Dabei bildet tanh die reellen Zahlen bijektiv auf (−1, 1) und coth die Menge R \ {0}
bijektiv auf R \ [−1, 1]. Die entsprechenden Umkehrfunktion heißen areatanh (Areatangens Hyperbolicus) und areacoth (Areacotangens Hyperbolicus).
6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN
157
y
y = tanh(x)
y = coth(x)
1
−2
−1
1
0
x
2
−1
Abbildung 6.19: Tangens Hyperbolicus und Cotangens Hyperbolicus
y
y = areatanh(x)
y = areacoth(x)
2
1
−6
−4
−2
0
2
4
6
x
−1
−2
Abbildung 6.20: Areatangens Hyperbolicus und Areacotangens Hyperbolicus
158
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
Kapitel 7
Differentialrechnung
Bewegt sich etwa ein Punkt, und bezeichnet s(t) den zum Zeitpunkt t zurückgelegten
Weg, so erhält man die Geschwindigkeit zum Zeitpunkt t, indem man
s(t + h) − s(t)
h
betrachtet, und h immer kleiner macht. Um derlei Betrachtungen, die in den Naturwissenschaften eine wichtige Rolle spielen, einen mathematisch exakten Hintergrund zu
geben, wollen wir den Begriff der Ableitung einführen.
7.1 Begriff der Ableitung
7.1.1 Definition. Sei f : (a, b) → R (C) und sei x ∈ (a, b). Dann heißt f differenzierbar
im Punkt x, falls der Grenzwert
lim
t→x
f (t) − f (x)
∈ R (C)
t−x
existiert. Dieser heißt dann die Ableitung von f an der Stelle x, und man schreibt dafür
f ′ (x) oder ddtf (x).
Ist f zumindest auf [a, b) definiert1 , und existiert
lim
t→a+
f (t) − f (a)
∈ R (C),
t−a
so spricht man von rechtsseitiger Differenzierbarkeit im Punkt a und schreibt f ′ (a)+
dafür.
Entsprechend definiert man die linksseitige Differenzierbarkeit im Punkt b und die
linksseitige Ableitung f ′ (b)− .
Anschaulich ist die Ableitung f ′ (x) gerade die Steigung der Tangente (in der folgenden Grafik als durchgehende Gerade gezeichnet) am Punkt (x, f (x)). Diese Steigung der Tangente erhält man als Grenzwert der Steigungen der Verbindungsgeraden
von (x, f (x)) und (t, f (t)) (als strichlierte Gerade gezeichnet) für t → x.
7.1.2 Fakta.
1 Klarerweise
könnte f sogar auf einer noch größeren Menge definiert sein.
159
KAPITEL 7. DIFFERENTIALRECHNUNG
160
f
Steigung =
f (t)− f (x)
t−x
Steigung = f ′ (x)
t′′
x
t′
t
Abbildung 7.1: Ableitung als Grenzwert der Differenzenquotienten
1. Wie in Fakta 5.3.14 bemerkt, existiert ein Grenzwert limt→x h(t) genau dann,
wenn die beiden einseitigen Grenzwerte limt→x− h(t) und limt→x+ h(t) existieren
und übereinstimmen.
Also ist f bei x ∈ (a, b) genau dann differenzierbar, wenn f bei x links- und
rechtsseitig differenzierbar ist und f ′ (x)− und f ′ (x)+ übereinstimmen. In diesem
Fall ist f ′ (x)− = f ′ (x) = f ′ (x)+ .
2. Da nach Lemma 5.3.8 genau dann y = limt→x h(t), wenn für jede gegen x konvergente Folge (tn )n∈N mit tn , x, n ∈ N, folgt, dass h(tn ) → y, ist f bei x genau
dann differenzierbar mit Ableitung f ′ (x), wenn für jede solche Folge
f ′ (x) = lim
n→∞
f (tn ) − f (x)
.
tn − x
Entsprechend lassen sich die einseitigen Ableitungen charakterisieren.
3. Entweder aus der letzten Behauptung oder aus (5.3) folgt, dass die Ableitung
f ′ (x) im Falle ihrer Existenz nur vom Aussehen von f lokal bei x, also von
f |(x−δ,x+δ) für jedes δ > 0, abhängt.
4. Wegen (5.10) ist eine Funktion f : (a, b) → C genau dann differenzierbar bei
x ∈ (a, b), wenn Re f, Im f : (a, b) → R es sind, wobei
f ′ (x) = (Re f )′ (x) + i(Im f )′ (x).
(7.1)
Analog kann man die Differenzierbarkeit von R p -wertigen Funktionen f auf (a, b) definieren. Dabei wird es sich herausstellen, dass dass solche Funktionen genau dann
differenzierbar sind, wenn alle Komponentenfunktionen π j ◦ f : (a, b) → R differenzierbar sind. Siehe die Analysis 2 Vorlesung.
7.1. BEGRIFF DER ABLEITUNG
161
7.1.3 Bemerkung. Ist f definiert auf einer offenen Teilmenge der komplexen Zahlen
f (w)
und bildet wieder in C hinein ab, so kann man analog f ′ (w) := limz→w f (z)−
bez−w
trachten. Existiert dieser Grenzwert, so heißt f in w komplex differenzierbar. Wir wollen das hier aber nicht weiter verfolgen, denn dies führt zur Theorie der komplexen
Analysis, die in einer eigenen Vorlesung behandelt wird.
7.1.4 Beispiel.
(i) Für jedes λ ∈ R (C) ist die konstante Funktion f (t) = λ, t ∈ (−∞, +∞), an jeder
Stelle x differenzierbar, und ihre Ableitung im Punkt x ist gleich 0.
(ii) Die reellwertige Funktion t 7→ f (t) = tn , n ∈ N für t ∈ (−∞, +∞) ist auch an
jedem Punkt x differenzierbar mit der Ableitung
lim
t→x
(t − x)(tn−1 + tn−2 x + . . . + txn−2 + tn−1 )
t n − xn
= lim
= nxn−1 .
t→x
t−x
t−x
(iii) Die stetige Funktion



t sin 1t ,
f (t) = 

0,
t,0
t=0
(7.2)
ist im Punkt x = 0 nicht differenzierbar. Denn es gilt
t sin 1t − 0
f (t) − f (0)
1
=
= sin .
t−0
t−0
t
P
n
(iv) Sei f (z) = ∞
n=0 an z eine Potenzreihe mit Konvergenzradius R > 0. Für f |(−R,R) :
(−R, R) → C gilt
∞
X
f (t) − f (0)
= lim
an tn−1 .
lim
t→0
t→0
t
n=1
P
n
Diese Potenzreihe rechts konvergiert genau dann, wenn ∞
n=0 an t es tut und hat
somit auch Konvergenzradius R. Sie ist daher stetig in t. Also ist obiger Limes
gleich a1 . Später werden wir f ′ (x) für alle x ∈ (−R, R) berechnen.
(v) Für ein festes w ∈ C gilt
lim
t→x
exp(w(t − x)) − 1
exp(wt) − exp(wx)
= exp(wx) lim
=
t→x
t−x
t−x
exp(wτ) − 1
= w exp(wx),
τ
wobei die letzte Gleichheit aus (iv) folgt, da der Koeffizient a1 in der Potenzreihe
P wn n
exp(wτ) = ∞
n=0 n! τ eben w ist.
exp(wx) lim
τ→0
Setzt man w = 1, so folgt exp′ (x) = exp(x).
(vi) Als weitere Anwendung der Rechnung im letzten Beispiel berechnen wir
Im exp(it) − Im exp(ix)
sin(it) − sin(ix)
= lim
=
t→x
t−x
t−x
!
exp(it) − exp(ix)
= Im(i exp(ix)) = Re(exp(ix)) = cos(x).
Im lim
t→x
t−x
sin′ (x) = lim
t→x
Dabei haben wir die Stetigkeit von z 7→ Im z verwendet. Genauso erhält man
cos′ (x) = − sin(x).
KAPITEL 7. DIFFERENTIALRECHNUNG
162
(vii) Für t ∈ R betrachte die Funktion f
t2



t2 sin 1t ,
f (t) = 

0 ,
t,0
t=0
f (t)
−t2
Die Funktion f ist an der Stelle x = 0 differenzierbar mit Ableitung 0, denn es
gilt
f (t) − f (0)
1
= t sin → 0 für t → 0.
t−0
t
An einer Stelle x , 0 ist f differenzierbar und es gilt wie wir später sehen werden
f ′ (x) = 2x sin
1
1
− cos .
x
x
7.1.5 Lemma. Ist f im Punkt x differenzierbar, so ist sie dort stetig.
Beweis. Aus limt→x
f (t)− f (x)
t−x
= α folgt
#
"
f (t) − f (x)
(t − x) = α · 0 = 0.
lim f (t) − f (x) = lim
t→x
t→x
t−x
❑
7.1.6 Bemerkung. Wie man am Beispiel der Funktion f aus (7.2) sieht, gilt die Umkehrung von Lemma 7.1.5 nicht.
7.1.7 Satz. Seien f, g : (a, b) → R (C) beide differenzierbar im Punkt x ∈ (a, b),
und α, β ∈ R (C). Dann sind auch α f + βg, f g und (falls g(x) , 0) gf an der Stelle x
differenzierbar, und es gilt
(α f + βg)′ (x) = α f ′ (x) + βg′ (x),
( f g)′ (x) = f ′ (x)g(x) + f (x)g′ (x) (Produktregel),
′
′
f (x)g′ (x)
(Quotientenregel).
gf (x) = f (x)g(x)−
g(x)2
Entsprechende Regeln gelten auch für einseitige Ableitungen.
Beweis.
lim
t→x
(α f + βg)(t) − (α f + βg)(x)
f (t) − f (x)
g(t) − g(x)
= α lim
+ β lim
.
t→x
t→x
t−x
t−x
t−x
Da f nach Lemma 7.1.5 bei x stetig ist, folgt aus den Rechenregeln für Grenzwerte
(vgl. Abschnitt 5.3)
!
!
f (t) − f (x)
g(t) − g(x)
f (t)g(t) − f (x)g(x)
+ lim
= lim f (t)
g(x) =
lim
t→x
t→x
t→x
t−x
t−x
t−x
7.1. BEGRIFF DER ABLEITUNG
163
f (t) − f (x)
g(t) − g(x)
+ g(x) lim
= f (x)g′ (x) + f ′ (x)g(x).
t→x
t→x
t→x
t−x
t−x
Die letzte Quotientenregel folgt ebenfalls aus der Stetigkeit und den Rechenregeln für
Grenzwerte indem man in
f (x)
f (t)
"
#
f (t) − f (x)
1
g(t) − g(x)
g(t) − g(x)
g(x)
.
=
− f (x)
t−x
g(t)g(x)
t−x
t−x
lim f (t) · lim
t → x streben lässt.
❑
7.1.8 Beispiel. Wir haben schon gesehen, dass f (t) = tn für alle n ∈ N differenzierbar
ist mit f ′ (x) = nxn−1 . Um das auch für n ∈ −N zu zeigen verwende man die Quotientenregel:
!′
1
(x|n| )′
n ′
(x ) = |n| = − 2|n| = nx|n|−1−2|n| = nxn−1 .
x
x
Weiters ist eine rationale Funktion in jedem Punkt, wo der Nenner nicht verschwindet,
differenzierbar.
7.1.9 Satz (Kettenregel). Sei f : (a, b) → R reellwertig und g : (c, d) → R (C), sodass
f (a, b) ⊆ (c, d), und x ∈ (a, b).
Ist f bei x und g bei f (x) differenzierbar, so ist g ◦ f bei x differenzierbar, wobei
(g ◦ f )′ (x) = g′ ( f (x)) · f ′ (x).
Beweis. Es zu zeigen, dass
(g ◦ f )(tn ) − (g ◦ f )(x)
→ g′ ( f (x)) · f ′ (x)
tn − x
(7.3)
für jede gegen x konvergente Folge (tn )n∈N aus (a, b) \ {x}. Wir unterscheiden dabei für
die Menge M = {n ∈ N : f (tn ) = f (x)} zwei Fälle.
Ist M endlich, so folgt für n ≥ max(M)
(g ◦ f )(tn ) − (g ◦ f )(x) g( f (tn )) − g( f (x)) f (tn ) − f (x)
=
·
→ g′ ( f (x)) · f ′ (x).
tn − x
f (tn ) − f (x)
tn − x
Ist dagegen M unendlich, so gilt für diese unendlich vielen n ∈ M, f (tntn)−−xf (x) = 0 und
g( f (tn )) = g( f (x)). Somit gilt f ′ (x) = 0 und
( g( f (tn ))−g( f (x)) f (tn )− f (x)
(g ◦ f )(tn ) − (g ◦ f )(x)
· tn −x , n < M
f (tn )− f (x)
.
=
tn − x
0,
n∈M
Wegen der Stetigkeit von f bei x gilt f (tn ) → f (x). Damit ist obiger Differenzenquotient beliebig nahe bei 0, wenn nur n hinreichend groß ist. Es folgt (7.3).
❑
7.1.10 Bemerkung. Es gelten diverse einseitige Varianten von Satz 7.1.9, deren
Beweise fast gleich verlaufen:
Ist f : (a, b) → (c, d], g : (c, d] → R (C), x ∈ (a, b), f (x) = d sowie f bei x differenzierbar und g bei f (x) = d linksseitig differenzierbar, so folgt (g ◦ f )′ (x) = g′ ( f (x))− · f ′ (x).
KAPITEL 7. DIFFERENTIALRECHNUNG
164
Ist f : [a, b) → (c, d), g : (c, d) → R (C), sowie f bei a rechtsseitig differenzierbar und
g bei f (a) differenzierbar, so folgt (g ◦ f )′ (a)+ = g′ ( f (a)) · f ′ (a)+ .
usw. .
7.1.11 Beispiel. Sei f (x) = x2 sin 1x , x , 0 wie in Beispiel 7.1.4, (vii). Durch Anwendung der Produkt und der Kettenregel ergibt sich (x , 0)
!′
!
!′
1
1
1
1
1
1
1
f ′ (x) = (x2 )′ sin + x2 sin
= 2x · sin + x2 · cos
= 2x · sin − cos .
·
x
x
x
x
x
x
x
7.1.12 Satz. Sei f : (a, b) → (c, d) bijektiv und streng monoton, und bezeichne mit
g : (c, d) → (a, b) ihre Umkehrfunktion. Ist f an einer Stelle x differenzierbar und gilt
f ′ (x) , 0, so ist g an der Stelle f (x) differenzierbar, und es gilt
g′ ( f (x)) =
1
.
f ′ (x)
Beweis. Wegen Korollar 6.5.3 sind f und g beide stetig. Ist daher (tn )N eine gegen f (x)
konvergente Folge aus (c, d) \ { f (x)}, so ist g(tn ) N eine gegen x = g( f (x)) konvergente
Folge aus (a, b) \ {x}. Mit τn := g(tn ) folgt
lim
n→∞
g(tn ) − x
1
1
g(tn ) − g( f (x))
= lim
= ′ .
=
f
(τ
)−
f
(x)
n
n→∞
tn − f (x)
f (x)
f g(tn ) − f (x) limn→∞
τn −x
❑
Auch bei obigem Satz gelten entsprechende Aussagen für einseitige Ableitungen,
wenn f und damit auch g an einem/beiden der Ränder definiert ist.
7.1.13 Beispiel. Betrachte die Funktion exp(t) : R → R+ . Diese ist stetig und bijektiv.
Ihre Umkehrfunktion ist ln(u) : R+ → R. Es folgt (y = exp(x))
ln′ (y) = ln′ ( f (x)) =
1
1
1
1
=
=
= .
exp′ (x) exp(x) exp(ln(y)) y
7.1.14 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem
Intervall I ⊆ R. Ist f an allen x ∈ I differenzierbar, wobei im Falle, dass x der linke
bzw. rechte Intervallrand von I ist und dieser in I liegt, die rechts- bzw. linksseitige
Differenzierbarkeit gemeint ist, so nennt man die Funktion
(
I → R (C)
′
f :
x 7→ f ′ (x)
Ableitung von f auf I. Ist x der linke bzw. rechte Intervallrand von I und liegt dieser in
I, so ist unter f ′ (x) die rechts- bzw. linksseitige Ableitung an der Stelle x zu verstehen.
Einer Funktion f wird also eine weitere Funktion zugeordnet, die die aus f abgeleitete Funktion f ′ genannt wird. Ihr Wert an einer Stelle x ist gerade der Limes
des Differenzenquotienten von f bei x. Diese Sichtweise erklärt auch die Schreibweise
f ′ (x) aus Definition 7.1.1. Die Schreibweise ddtf (x) erklärt sich aus der Interpretation
der Ableitung als Grenzfall des Zuwachses von f dividiert durch den Zuwachs von t.
Es ist also sinnvoll von Eigenschaften der Funktion f ′ , wie zum Beispiel Stetigkeit oder auch wieder Differenzierbarkeit zu sprechen. Wie wir in Beispiel 7.1.4, (vii),
gesehen haben, muss die Ableitung f ′ nicht notwendigerweise stetig sein.
7.2. MITTELWERTSÄTZE
165
7.1.15 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem
Intervall I ⊆ R, sodass die Ableitung f ′ von f auf ganz I existiert. Ist die Ableitung f ′
an einer Stelle x differenzierbar, so bezeichnet man ( f ′ )′ (x) mit f ′′ (x) und spricht von
der zweiten Ableitung von f an der Stelle x. Im Falle, dass x Intervallrand ist, so sei
wieder die entsprechende einseitige Ableitung gemeint.
Allgemeiner definiert man höhere Ableitungen rekursiv durch
f (n) (x) := ( f (n−1) )′ (x), n ∈ N,
wann immer f (n−1) auf I definiert ist und bei x differenzierbar ist. Man sagt dann, dass
f bei x n-mal differenzierbar ist.
Existiert f (n) an allen Stellen x ∈ I und ist f (n) stetig auf (a, b), so spricht man von
einer n-mal stetig differenzierbaren Funktion. Die Menge aller n-mal stetig differenzierbaren Funktionen auf I wird mit Cn (I) bezeichnet.
Mit f ∈ C∞ (I) wollen wir zum Ausdruck bringen, dass f auf I beliebig oft differenzierbar ist.
Aus der Produktregel erhält man mittels vollständiger Induktion die oft nützliche
Formel
!
n
X
n (k) (n−k)
(n)
( f g) =
f g
.
k
k=0
7.1.16 Beispiel.
Sei f (x) = x3 − 2x. Dann gilt
f ′ (x) = 3x2 − 2, f ′′ (x) = 6x, f ′′′ (x) = 6, f ′′′′ (x) = 0, f (5) (x) = 0, . . .
Man sieht genauso, dass jedes Polynom p beliebig oft differenzierbar ist und
wenn n der Grad von p ist, p(n+1) (x) = p(n+2) (x) = . . . = 0 gilt.
Sei f die Funktion



 x2
f (x) = 

−x2
, x≥0
, x≤0
Die Ableitung von f ist f ′ (x) = |x|. Die zweite Ableitung existiert also an der
Stelle x = 0 nicht.
7.2 Mittelwertsätze
7.2.1 Definition. Sei hX, dX i ein metrischer Raum, E ⊆ X und sei f : E → R. Man
sagt f hat ein lokales Maximum in einem Punkt x ∈ E, falls
∃ δ > 0 : f (x) ≥ f (t) für t ∈ E ∩ Uδ (x).
Analog definiert man ein lokales Minimum. Will man sich nicht festlegen, ob x ein
Minimum oder Maximum ist, so spricht man zusammenfassend von einem lokalen
Extremum.
Man beachte den Unterschied zum Begriff des Maximums. Das ist eine Stelle x ∈
E, sodass für jedes t ∈ E gilt f (x) ≥ f (t), also nicht nur lokal bei x sondern global.
Man spricht dann von einem absoluten Maximum. Analog für absolute Minima bzw.
zusammenfassend absolute Extrema. Natürlich ist ein absolutes Extremum stets auch
ein lokales.
KAPITEL 7. DIFFERENTIALRECHNUNG
166
7.2.2 Satz. Sei f : [a, b] → R. Hat f an einer Stelle x ∈ (a, b) ein lokales Extremum
und ist f bei x differenzierbar, so muss f ′ (x) = 0.
Beweis. Wir nehmen an, dass x ein lokales Maximum ist. Den Fall eines lokalen Minimums behandelt man analog.
Wähle δ > 0 wie in Definition 7.2.1. Es gilt also f (x) ≥ f (t) für alle |t − x| < δ. Im
Falle t > x gilt somit
f (t) − f (x)
≤ 0,
t−x
und daher f ′ (x) = limt→x+
f (t)− f (x)
t−x
≤ 0. Ist jedoch t < x, so impliziert f (x) ≥ f (t)
f (t) − f (x)
≥ 0.
t−x
Also muss auch f ′ (x) = limt→x−
f (t)− f (x)
t−x
≥ 0.
❑
Geometrisch bedeutet Satz 7.2.2, dass an
einem lokalen Extremum die Tangente
an die Kurve y = f (x), falls eine solche
existiert, waagrecht liegen muss.
7.2.3 Korollar (Satz von Rolle). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar.
Gilt f (a) = f (b) = 0, so gibt es ein ζ ∈ (a, b), sodass f ′ (ζ) = 0.
Beweis. Aus Korollar 6.1.12 wissen wir, dass f auf [a, b] ein Maximum und ein Minimum besitzt. Also gibt es x− , x+ ∈ [a, b], sodass
f (x− ) ≤ f (t) ≤ f (x+ ), für alle t ∈ [a, b].
Sind beide x− und x+ Randpunkte, d.h. x− , x+ ∈ {a, b}, so muss f (t) = 0 für alle
t ∈ [a, b] und daher f ′ (t) = 0 für alle t ∈ (a, b) sein.
Ist x− in (a, b) enthalten, so muss nach Satz 7.2.2 f ′ (x− ) = 0. Im Falle x+ ∈ (a, b)
schließt man genauso.
❑
a
ζ
b
Abbildung 7.2: Satz von Rolle
7.2. MITTELWERTSÄTZE
167
7.2.4 Korollar. Sei f : [a, b] → R stetig und n-mal differenzierbar auf (a, b). Weiters
habe f mindestens n + 1 Nullstellen in [a, b]. Dann existiert ξ ∈ (a, b) mit f (n) (ξ) = 0.
Beweis. Der Fall n = 1 folgt sofort aus Korollar 7.2.3. Angenommen der Satz gelte für
n − 1. Wir zeigen ihn für n.
Nach Korollar 7.2.3 liegt zwischen je zwei Nullstellen von f mindestens eine
Nullstelle von f ′ . Also hat f ′ mindestens n Nullstellen. Nach Induktionsvoraussetzung
existiert ein ξ mit f (n) (ξ) = ( f ′ )(n−1) (ξ) = 0.
❑
7.2.5 Satz (Mittelwertsatz). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar.
Dann existiert ein Punkt ζ ∈ (a, b) mit
f (b) − f (a)
= f ′ (ζ).
b−a
Beweis. Betrachte die Funktion F : [a, b] → R
F(t) := f (t) − f (a) −
f (b) − f (a)
(t − a).
b−a
Dann ist F auf [a, b] stetig (vgl. Korollar 6.1.8) und auf (a, b) differenzierbar (vgl.
Beispiel 7.1.4, (i), (ii) und Satz 7.1.7), wobei F(a) = F(b) = 0 und für x ∈ (a, b)
F ′ (x) = f ′ (x) −
f (b) − f (a)
.
b−a
Wenden wir Korollar 7.2.3 an, so folgt sofort die Behauptung.
❑
f (b)
f (a)
a
ζ
b
Abbildung 7.3: Mittelwertsatz
7.2.6 Bemerkung. Satz 7.2.5, welcher auch 1. Mittelwertsatz der Differentialrechnung
genannt wird, besagt, dass man (falls durchwegs Tangenten existieren) stets eine Tangente findet, welche parallel zur Sekante durch die Punkte (a, f (a)) und (b, f (b)) liegt.
Die Stelle ζ aus Satz 7.2.5, an der die Steigung der Kurve gleich der mittleren
Steigung im Intervall [a, b] ist, ist nicht eindeutig bestimmt.
KAPITEL 7. DIFFERENTIALRECHNUNG
168
Obwohl man es auf den ersten Blick nicht sieht, so hat der Mittelwertsatz doch
weitreichende Folgerungen.
7.2.7 Korollar. Sei I ⊆ R ein Intervall und f : I → R stetig. Sind a, b die Intervallränder von I, so sei f auf (a, b) differenzierbar. Dann gilt:
Ist f ′ (x) ≥ 0 (> 0), für alle x ∈ (a, b), so ist f (streng) monoton wachsend.
Ist f ′ (x) ≤ 0 (< 0), für alle x ∈ (a, b), so ist f (streng) monoton fallend.
Ist f ′ (x) = 0, für alle x ∈ (a, b), so ist f konstant.
Bezüglich der Umkehrung gilt nur, dass, wenn f monoton wachsend (fallend) ist,
für ihre Ableitung immer f ′ (x) ≥ 0 (≤ 0) gilt.
Beweis. Seien x1 , x2 ∈ I, x1 < x2 . Dann existiert eine Stelle x ∈ (x1 , x2 ) mit
f (x2 ) − f (x1 ) = (x2 − x1 ) f ′ (x).
Daraus folgt unmittelbar das behauptete Monotonieverhalten.
Ist umgekehrt f monoton wachsend (fallend), so gilt für den Differenzenquotient
für alle x, t ∈ (a, b)
f (t) − f (x)
≥ 0 (≤ 0).
t−x
Für t → x folgt f ′ (x) ≥ 0 (≤ 0).
❑
7.2.8 Beispiel. Dass aus der strengen Monotonie einer Funktion f nicht notwendigerweise f ′ (x) > 0 bzw. f ′ (x) < 0 für alle x folgt, sieht man anhand eines einfachen
Beispiels.
Die Funktion f (x) = x3 ist auf R streng monoton wachsend. Ihre Ableitung f ′ (x) =
3x2 ist nur ≥ 0, aber nicht > 0 für alle x ∈ R.
7.2.9 Bemerkung. Der Schluss f ′ (x) ≡ 0 ⇒ f ≡ c für ein festes c gilt auch für komplexwertige Funktionen. Das sieht man leicht, indem man f in Real- und Imaginärteil
aufspaltet (vgl. (7.1)).
7.2.10 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b. Weiters sei
f : I → R (C) stetig und auf (a, b) differenzierbar.
Ist a ∈ I und existiert limt→a+ f ′ (t), so ist f bei a rechtsseitig differenzierbar, sodass
limt→a+ f ′ (t) = f ′ (a)+ . Entsprechendes gilt für t → b−, wenn b ∈ I.
Somit gilt f ∈ C1 (I) genau dann, wenn f ∈ C1 (a, b) und aus a ∈ I die Existenz des
Grenzwertes limt→a+ f ′ (t) und aus b ∈ I die von limt→b− f ′ (t) folgt.
Beweis. Ist f reellwertig, so gibt es zu jedem t ∈ (a, b) ein x ∈ (a, t), sodass
f (a)
somit gegen f ′ (a)+ .
f ′ (x). Für t → a+ konvergiert f (t)−
t−a
Ist f komplexwertig, so betrachte man Real- und Imaginärteil.
f (t)− f (a)
t−a
=
❑
′
Obwohl die Ableitung f einer auf einem Intervall (a, b) differenzierbaren Funktion
nicht notwendig stetig sein muss, so gilt trotzdem stets die Zwischenwerteigenschaft.
7.2.11 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b und f : I →
R differenzierbar. Sind x1 , x2 ∈ I und c ∈ R mit f ′ (x1 ) < c < f ′ (x2 ), dann existiert eine
Stelle x , x1 , x2 zwischen x1 und x2 mit f ′ (x) = c.
7.2. MITTELWERTSÄTZE
169
Ist f ′ (x) , 0 für alle x ∈ I, so gilt entweder immer f ′ (x) > 0, x ∈ I, oder immer f ′ (x) < 0, x ∈ I. Sie sind daher entweder streng monoton wachsend oder streng
monoton fallend.
Beweis. Wir nehmen zunächst x1 < x2 an. Betrachte die Funktion g : I → R, g(t) =
f (t) − ct. Für ihre Ableitung gilt
g′ (x1 ) = f ′ (x1 ) − c < 0, g′ (x2 ) = f ′ (x2 ) − c > 0.
Sei x ∈ [x1 , x2 ] eine Stelle, an der g ihr Minimum annimmt. Wegen 0 = g′ (x) =
f ′ (x) − c, genügt es x , x1 , x2 zu zeigen. Wegen g′ (x1 ) < 0 existiert ein δ > 0 mit
g(t) − g(x1 )
< 0, x1 < t < x1 + δ.
t − x1
Also muss g(t) < g(x1 ) für solche Werte von t. Der Punkt x1 scheidet als Kandidat für
das Minimum also aus. Wegen g′ (x2 ) > 0 folgt die Existenz eines δ > 0, sodass
g(t) − g(x2 )
> 0, x2 − δ < t < x2 .
t − x2
Also ist g(t) < g(x2 ) für solche t, und der Punkt x2 kommt daher auch nicht in Frage.
Den Fall x1 > x2 führt man durch die Betrachtung von − f auf obigen Fall zurück.
Die letzte Aussage folgt sofort aus der eben bewiesenen Zwischenwerteigenschaft.
❑
7.2.12 Korollar. Sei f differenzierbar auf (a, b). Dann hat f ′ keine Sprungstelle in (a, b).
Beweis. An einer Sprungstelle existieren f ′ (x+) := limt→x+ f ′ (t) und f ′ (x−) := limt→x− f ′ (t), es sind jedoch nicht beide
gleich f ′ (x). Angenommen es ist f ′ (x+) < f ′ (x), also f ′ (x+) + ǫ ≤ f ′ (x) für ein ǫ > 0. Also gilt
f ′ (t) +
ǫ
≤ f ′ (x), für alle t ∈ (x, t0 ],
2
für ein t0 > x. Also nimmt f ′ (t) für x < t < t0 keine Werte in ( f ′ (x) − 2ǫ , f ′ (x))
obiger Zwischenwerteigenschaft.
⊆ ( f ′ (t0 ), f ′ (x)) an. Das widerspricht
❑
Wir benötigen im Folgenden eine Verallgemeinerung von Satz 7.2.5.
7.2.13 Satz (Verallgemeinerter Mittelwertsatz). Seien f, g : [a, b] → R stetig und
differenzierbar auf (a, b). Weiters gelte g′ (t) , 0 für alle t ∈ (a, b). Dann existiert eine
Stelle ζ ∈ (a, b) mit
f (b) − f (a)
f ′ (ζ)
= ′ .
(7.4)
g(b) − g(a)
g (ζ)
Beweis. Zunächst existiert nach Satz 7.2.5 ein x ∈ (a, b) mit g(b) − g(a) = g′ (x)(b − a),
woraus wir g(b) − g(a) , 0 schließen. Somit ist die Funktion F : [a, b] → R,
F(t) = f (t) − f (a) −
f (b) − f (a)
(g(t) − g(a)),
g(b) − g(a)
wohldefiniert, stetig und auf (a, b) differenzierbar, wobei
F ′ (t) = f ′ (t) −
f (b) − f (a) ′
g (t).
g(b) − g(a)
Weiters gilt F(a) = F(b) = 0. Somit gibt es nach Korollar 7.2.3 ein ζ ∈ (a, b) mit
F ′ (ζ) = 0, und daher (7.4).
❑
KAPITEL 7. DIFFERENTIALRECHNUNG
170
Beachte, dass man für g(t) = t gerade den Mittelwertsatz erhält. Satz 7.2.13 heißt
auch 2. Mittelwertsatz der Differentialrechnung. Wir werden ihn verwenden, um eine
sehr nützliche Methode herzuleiten, Limiten zu berechnen.
7.2.14 Korollar (Regel von de L’Hospital2 ). Seien f, g : (a, b) → R differenzierbar
auf (a, b), wobei a, b, ∈ R ∪ {±∞}, −∞ ≤ a < b ≤ +∞. Für x ∈ (a, b) hinreichend nahe
bei a gelte g′ (x) , 0, und
lim f (x) = lim g(x) = 0,
(7.5)
lim g(x) = +∞.
(7.6)
x→a+
x→a+
oder
x→a+
Dann gilt
lim
x→a+
f ′ (x)
f (x)
= A ⇒ lim
= A,
x→a+ g(x)
g′ (x)
(7.7)
mit A ∈ R ∪ {±∞}.
Die analoge Aussage ist richtig, wenn man überall x → a+ durch x → b− oder in
(7.6) +∞ durch −∞ ersetzt.
Beweis. Da die Grenzwerte in (7.7) nur von den Funktionswerten lokal bei x abhängen
(vgl. (5.3)), können wir b nötigenfalls kleiner machen, sodass g′ (x) , 0 auf ganz (a, b).
Damit kann g auf (a, b) höchstens eine Nullstelle haben, da sonst nach Korollar 7.2.3
g′ (ζ) = 0 für ein ζ ∈ (a, b). Machen wir b nötigenfalls nochmals kleiner, so können wir
auch g(x) , 0 auf ganz (a, b) annehmen.
Gilt (7.6), so muss wegen dem Zwischenwertsatz, Korollar 6.2.6, insbesondere
g(x) > 0 für alle x ∈ (a, b) gelten. Außerdem hat nach Korollar 7.2.11 g′ (x) immer
das selbe Vorzeichen. Wegen (7.6) gibt es aber sicher a < s < t < b mit g(s) > g(t).
Mit dem Mittelwertsatz Satz 7.2.5 folgt daraus g′ (x) < 0 für ein und daher für alle
x ∈ (a, b). Also ist g unter der Voraussetzung (7.6) auf ganz (a, b) streng monoton
fallend.
′
(t)
Sei α ∈ R, α > A, und wähle r ∈ R mit A < r < α. Wegen limt→a+ gf ′ (t)
= A
existiert ein c ∈ (a, b) mit
f ′ (t)
< r für t ∈ (a, c).
g′ (t)
Sind dann x, y ∈ (a, c), x < y beliebig, so folgt aus Satz 7.2.5
f ′ (t)
f (x) − f (y)
= ′
< r,
g(x) − g(y)
g (t)
(7.8)
für ein t ∈ (x, y) ⊆ (a, c).
Ist die Bedingung (7.5) erfüllt, so lässt man in obiger Beziehung x gegen a streben
und erhält
f (y)
≤ r < α für y ∈ (a, c).
g(y)
Ist nun Bedingung (7.6) ist erfüllt, so halte man y in (7.8) fest. Da g auf (a, b) streng
monoton fällt und g(x) > 0, folgt
!
f (x)
f (y)
f ′ (t) g(x) − g(y) f (y)
g(y)
+
=
+
<r 1−
, x ∈ (a, c).
g(x) g′ (t)
g(x)
g(x)
g(x)
g(x)
2 Guillaume
Francois L’Hospital, Marquis de Saint-Mesme, geb.1661 Paris, gest.3.2.1704 Paris
7.2. MITTELWERTSÄTZE
171
Lässt man hier x → a+ streben, so konvergiert die rechte Seite gegen r (> α). Also
folgt die Existenz eines d ∈ (a, c), sodass
f (x)
< α, a < x < d.
g(x)
Wir haben also unter jeder der Voraussetzungen (7.6) und (7.7) nachgewiesen, dass für
ein gewisses ρ ∈ (a, b)
f (t)
< α, wenn nur t ∈ (a, ρ).
g(t)
Wendet man das auf − f und −A statt f und A an, so sieht man, dass es auch zu jedem
β ∈ R, β < A ein ρ ∈ (a, b) gibt, sodass
f (t)
> β, wenn nur t ∈ (a, ρ).
g(t)
Somit folgt lim x→a+
f (x)
g(x)
= A (vgl. Bemerkung 3.6.1).
❑
7.2.15 Bemerkung. Indem man eine Funktion f : [a, b] → C in Real- und Imaginärteil
zerlegt, folgt sofort die Gültigkeit der Regel von de L’Hospital auch wenn f komplexwertig ist (vgl. (7.1)). Die Funktion g muss aber reellwertig sein.
7.2.16 Bemerkung. Oft findet man mit dem folgenden Spezialfall der Regel von de
L’Hospital: Seien f, g differenzierbar auf einem Intervall (c, d), sei x ∈ (c, d), f (x) =
g(x) = 0 und g′ (x) , 0. Dann gilt
lim
t→x
f (t)
f ′ (x)
= ′ .
g(t) g (x)
In manchen wichtigen Beispielen benötigt man jedoch die allgemeine Version der Regel von de L’Hospital, wie etwa für den ersten Grenzwert in Beispiel 7.2.17.
7.2.17 Beispiel.
(i)
1
x
x→0+ − 12
x
lim x ln x = lim
x→0+
(ii)
= 0.
sin x
cos x
(sin x)′
= lim
= lim
= 1.
′
x→0+ x
x→0+ 1
x→0+
x
lim
Genauso sieht man lim x→0−
sin x
x
= 1.
(iii) Man betrachte den Grenzwert
1
1
− 2
lim
2
x→0 (sin x)
x
!
Dieser Ausdruck ist von der Form ∞ − ∞. Wir rechnen
!
1
x2 − (sin x)2
1
=
−
.
(sin x)2 x2
(x sin x)2
(7.9)
KAPITEL 7. DIFFERENTIALRECHNUNG
172
Für x → 0 ist dieser Ausdruck von der Form 00 . Also stimmt der Grenzwert in
(7.9) nach der Regel von de L’Hospital mit
lim
x→0
2x − 2 sin x cos x
2x − sin(2x)
= lim
2x(sin x)2 + 2x2 sin x cos x x→0 2x(sin x)2 + x2 sin(2x)
überein. Wenden wir die Regel von de L’Hospital nochmals an, so erhalten wir
lim
x→0
2 − 2 cos(2x)
1 − cos(2x)
= lim
.
2(sin x)2 + 4x sin(2x) + 2x2 cos(2x) x→0 (sin x)2 + 2x sin(2x) + x2 cos(2x)
Dieser Ausdruck ist wieder von der Form 00 . Wir müssten die Regel von de
L’Hospital noch zweimal anwenden, um zu einem Ergebnis zu kommen. Etwas
einfach ist es, diesen Grenzwert als
x2
1 − cos(2x)
· lim
=
2
2
x→0 (sin x) + 2x sin(2x) + x2 cos(2x)
x→0
x
lim
lim
x→0
1 − cos(2x)
1
· lim x→0 sin x 2
sin(2x)
x2
+ 4 2x + cos(2x)
x
zu schreiben. Zweimal de L’Hospital liefert lim x→0
limx→0 sinx x = 1 gilt
lim x→0
sin x
x
Also ist (7.9) genau 13 .
2
1
=
+ 4 sin(2x)
2x + cos(2x)
1−cos(2x)
x2
= 2, und wegen
1
1
= .
1+4+1 6
(iv) Eine andere Möglichkeit den Grenzwert (7.9) zu berechnen, besteht darin, die
Potenzreihenentwicklung von sin x um 0 zu verwenden:
!
!
sin x
1 − ( sinx x )2
1
1
sin x 1 − x
·
=
−
=
1
+
=
x
(sin x)2 x2
(sin x)2
(sin x)2
P∞ (−1)n x2n
!
! P∞ (−1)n−1 x2n
sin x 1 − n=0 (2n+1)!
sin x
n=1 (2n+1)!
· P
· P
1+
= 1+
.
2
n
2n+1
x
x
∞ (−1) x
∞ (−1)n x2n+1 2
n=0
n=0
(2n+1)!
(2n+1)!
Oben und unten durch x2 dividieren ergibt
! P∞ (−1)n x2n
sin x
n=0 (2n+3)!
· P
1+
.
x
∞ (−1)n x2n 2
n=0 (2n+1)!
Man beachte, dass alle hier auftretenden Potenzreihen Konvergenzradius +∞ haben. Somit stehen in Zähler und Nenner stetige Funktionen in x (vgl. Satz 6.7.8).
Für x → 0 konvergiert die Potenzreihen gegen den nullten Summanden. Also
1
erhalten wir für den Grenzwert (7.9) abermals 2 3!1 = 13 .
7.2. MITTELWERTSÄTZE
173
(v) Sei w ∈ C mit einem Realteil, der kleiner als Null ist. Wir wollen zeigen, dass der
Grenzwert limt→+∞ t exp(wt) in C die komplexe Zahl 0 ist. Entweder wir betrachten dazu Real- und Imaginärteil des Grenzwertes gesondert, oder - was einfacher
ist - wir betrachten den Betrag von t exp(wt) für t > 0 (vgl. Satz 6.8.3):
|t exp(wt)| = t exp(t Re w) =
t
.
exp t(− Re w)
Wegen − Re w > 0 ist der Grenzwert davon für t → +∞ von der Form +∞
+∞ . Somit
stimmt nach Korollar 7.2.14 dieser Grenzwert überein mit (siehe (6.15))
exp(t Re w)
1
t′
= 0.
= lim
= lim
t→+∞
t→+∞ − Re w · exp t(− Re w)
t→+∞ exp t(− Re w) ′
− Re w
lim
Das Folgende bringen wir hier der Vollständigkeit halber, da es sich aus dem Mittelwertsatz ableitet. Wir werden diese
Problematik später (nach der Integrationstheorie) ausführlicher behandeln.
Sei ( fn )n∈N eine Folge von reellwertigen Funktionen, welche gegen eine Funktion f konvergiert. Überträgt sich diese
Eigenschaft auf die abgeleiteten Funktionen?
7.2.18 Beispiel. Sei fn (x) =
sin√ nx
n
für x ∈ R. Dann gilt
lim fn (x) = 0,
n→∞
und das sogar gleichmäßig auf ganz R. Man berechnet
fn′ (x) =
√
n cos nx,
also gilt z.B. limn→∞ fn′ (0) = +∞.
7.2.19 Satz. Sei ( fn )n∈N eine Folge von reellwertigen Funktionen, definiert und stetig auf [a, b] und differenzierbar auf
(a, b).
Es existiere ein Punkt x0 ∈ [a, b], sodass ( fn (x0 ))n∈N konvergiert. Ist dann die Folge ( fn′ )n∈N gleichmäßig konvergent
auf (a, b), so ist auch die Folge ( fn )n∈N gleichmäßig konvergent auf [a, b], und es gilt
d
d
lim fn (x) = lim
fn (x), x ∈ (a, b).
n→∞ dx
dx n→∞
Beweis. Sei ǫ > 0 gegeben. Wähle N ∈ N, sodass für n, m ≥ N stets
| fn (x0 ) − fm (x0 )| < ǫ,
und
| fn′ (t) − fm′ (t)| < ǫ, t ∈ (a, b).
Nach dem Mittelwertsatz gilt (x ∈ [a, b])
fn (x) − fm (x) = fn (x) − fm (x) − fn (x0 ) + fm (x0 ) + fn (x0 ) − fm (x0 ) =
= (x − x0 ) fn′ (t) − fm′ (t) + [ fn (x0 ) − fm (x0 )],
mit einer geeigneten Zwischenstelle t. Es folgt
| fn (x) − fm (x)| < (b − a)ǫ + ǫ.
Also konvergiert ( fn )n∈N gleichmäßig auf [a, b] gegen f = limn→∞ fn .
Sei nun x ∈ (a, b) festgehalten. Setze
φn (t) :=
f (t) − f (x)
fn (t) − fn (x)
, φ(t) :=
,
t−x
t−x
dann gilt für n fest aber beliebig
lim φn (t) = fn′ (x).
t→x
Weiters ist
fn (t) − fm (t) − fn (x) + fm (x)
= fn′ (s) − fm′ (s)
t−x
mit einer geeigneten Stelle s zwischen t und x. Da ( fn′ ) gleichmäßig konvergiert, existiert auch der Limes limn→∞ φn (t)
gleichmäßig für t ∈ [a, b] \ {x}. Man erhält daher
φn (t) − φm (t) =
lim lim φn (t) = lim lim φn (t).
t→x n→∞
Die linke Seite ist gleich f ′ (x), die rechte ist limn→∞ fn′ (x).
n→∞ t→x
❑
KAPITEL 7. DIFFERENTIALRECHNUNG
174
P
n
7.2.20 Beispiel. Sei f (x) = ∞
n=0 an (x − x0 ) eine um −x0 verschobene Potenzreihe mit positivem Konvergenzradius R.
Dann gilt für jedes x mit |x − x0 | < R
f ′ (x) =
∞
∞
X
d X
nan (x − x0 )n−1 .
an (x − x0 )n =
dx n=0
n=1
Denn die rechte Reihe hat den Konvergenzradius
1
1
=
= R.
√
√
√
lim supn→∞ n |nan+1 |
limn→∞ n n · lim supn→∞ n |an+1 |
Allgemein gilt für N ∈ N
f (N) (x) =
∞
X
nan (x − x0 )n−N .
n=N
7.3 Der Taylorsche Lehrsatz
Sei
P∞
n=0
an zn eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die Funktion
f : (−R, R) → C, f (t) =
∞
X
an tn .
n=0
Wir haben schon gesehen, dass diese Funktion bei t = 0 differenzierbar mit f ′ (0) = a1 ist.
Im Beweis von Lemma 7.3.2 benötigen folgendes Lemma.
7.3.1 Lemma. Sind (xn )n∈N , (yn )n∈N , (ξn )n∈N drei Folgen in R mit yn ≥ 0, xn > 0, ξn > 0, n ∈ N, sodass xn → x > 0 und
ξn → 1, so folgt
lim sup xn yξnn = x lim sup yn .
n→∞
n→∞
Beweis. Um das einzusehen, zeigen wir, dass t ∈ R genau dann Häufungspunkt von (xn yξnn )n∈N ist, wenn xt Häufungspunkt von (yn )n∈N ist. Dann ist insbesondere der größte Häufungspunkt t von (xn yξnn )n∈N von der Form xτ für den größten
Häufungspunkt τ von (yn )n∈N , also genau die gewünschte Gleichheit.
Ist τ Häufungspunkt von (yn )n∈N , also yn(k) → τ, k → ∞ für eine Teilfolge (yn(k) )k∈N , so folgt im Falle τ > 0 aus der
ξ
n(k)
Stetigkeit von (a, b) 7→ ab für (a, b) ∈ R+ × R (vgl. Bemerkung 6.8.7), dass yn(k)
→ τ1 = τ, k → ∞, und mit Satz 3.3.4
ξn(k)
xn(k) yn(k)
weiter dass
→ xτ.
Im Fall τ = 0 gilt für k ∈ N hinreichend groß sicherlich ξn(k) ≤ 2 und xn(k) ≤ x + 1. Für solche k folgt dann
ξ
ξ
n(k)
n(k)
0 ≤ xn(k) yn(k)
≤ (x + 1)y2n(k) , und wegen dem Einschluss-Satz, Satz 3.3.2, konvergiert (xn(k) yn(k)
)k∈N gegen 0 = xτ.
Ist umgekehrt t ein Häufungspunkt von (xn yξnn )n∈N , so wenden wir das gerade gezeigte auf die Folgen ( x1n )n∈N ,
(yξnn )n∈N und (1)n∈N an, und erhalten, dass xt Häufungspunkt von (yξnn )n∈N ist. Nun wenden wir das oben gezeigte auf die
Folgen (1)n∈N , (yξnn )n∈N und ( ξ1n )n∈N an, und sehen, dass xt Häufungspunkt von (yn )n∈N ist.
❑
P
P∞
n
n
7.3.2 Lemma. Die Potenzreihe ∞
n=0 (n + 1)an+1 z hat den selben Konvergenzradius R, wie n=0 an z .
Die Funktion f ist auf (−R, R) differenzierbar und hat die Ableitung
f ′ (x) =
∞
X
(n + 1)an+1 xn .
n=0
Sie ist sogar beliebig oft differenzierbar mit (l ∈ N)
∞
X
f (l) (x) =
n=0
(n + l) · · · (n + 1)an+l xn ,
(7.10)
wobei auch diese Potenzreihe Konvergenzradius R hat. Insbesondere gilt
f (l) (0) = l!al .
Beweis. Der Konvergenzradius von
und wegen
√
n
|an+1 | =
√
n+1
|an+1 |
P∞
n+1
n
lim supn→∞
n=0 (n+1)an+1 z
n
ist nach Satz 6.7.8
√
n
1√
. Wegen n
lim supn→∞ n |(n+1)an+1 |
+ 1 → 1, n → ∞,
folgt mit Lemma 7.3.1
1
√
n
|(n + 1)an+1 |
=
limn→∞
√
n
1
n + 1 · lim supn→∞
√
n+1
|an+1 |
= R.
(7.11)
7.3. DER TAYLORSCHE LEHRSATZ
175
Sei nun x ∈ (−R, R) und r ∈ (0, R) so, dass |x| < r. Ist (tk )k∈N eine gegen x konvergente Folge aus [−r, r] \ {x}, so gilt
lim
k→∞
Nun ist für |x|, |t| ≤ r
N
X
t n − xn
f (tk ) − f (x)
an k
= lim lim
.
k→∞ N→∞
tk − x
tk − x
n=1
(7.12)
n
n−1
n
X
a t − x ≤ |a | ·
|t| j · |x|n−1− j ≤ n|an ||r|n−1 .
n
n t−x j=0
Da
innerhalb ihres Konvergenzradius sogar absolut konvergieren, konvergiert wegen (7.11) die Reihe
P∞ Potenzreihen
n−1
. Nach dem Weierstraß Kriterium, Korollar 6.7.4, konvergiert die Funktionenfolge
n=1 n|an ||r|

 N
X tn − xn 

 an

t−x 
n=1
N∈N
in der Variable t gleichmäßig auf [−r, r] \ {0}. Nach Lemma 6.6.11 stimmt (7.12) überein mit
lim lim
N→∞ k→∞
N
X
n=1
an
∞
N
X
X
tkn − xn
nan xn−1 .
nan xn−1 =
= lim
N→∞
tk − x
n=1
n=1
Die Verallgemeinerung in (7.10) folgt nun leicht durch vollständige Induktion.
❑
P∞
1
7.3.3 Beispiel. Für x ∈ (−1, 1) ist die Funktion x 7→ ln(1 − x) beliebig oft differenzierbar. Da ln(1 − x)′ = − 1−x
=−
P
P∞
xn
nach Lemma 7.3.2 mit der Ableitung von x 7→ − ∞
n=1 n , x ∈ (−1, 1) übereinstimmt, und da ln(1 − x) und − n=1
x = 0 beide den Wert Null annehmen, folgt aus Korollar 7.2.7, dass
ln(1 − x) = −
n
n=1 x
xn
n für
∞
X
xn
für alle x ∈ (−1, 1).
n
n=1
Da diese Reihe auch für x = −1 (bedingt) konvergiert, folgt aus Satz 6.7.13, dass −
P∞
n=1
(−1)n
n
= ln(2).
Wir sehen insbesondere, dass Grenzfunktionen von Potenzreihen beliebig oft ableitbar sind. Ist etwa jede unendlich
oft differenzierbare Funktion Grenzfunktion einer Potenzreihe, und wie könnte man diese angeben? Das ist eine der
Fragestellungen, die auf den Taylorschen Lehrsatz führen.
Eine andere Motivation des Taylorschen Lehrsatz ergibt sich aus folgenden Interpolationsüberlegungen. Die Gerade,
die eine Kurve in einem Punkt am besten approximiert ist die Tangente (falls sie existiert). Approximiert man die Kurve mit
einem Polynom höheren Grades, so kann man hoffen, dass die Approximation genauer wird.
Wir haben die Tangente gefunden (eigentlich definiert) als die Grenzlage von Sekanten durch die Punkte (x, f (x)) und
(x + △x, f (x + △x)). Da eine Gerade durch zwei Punkte eindeutig bestimmt ist, sind diese Sekanten wohldefinierte Objekte.
Ein Polynom vom Grade ≤ n ist eindeutig festgelegt durch die Vorgabe der Werte y0 , . . . , yn an n + 1 verschiedenen
Stellen x0 , . . . , xn :
n
Y
X
x − xj
.
yk ·
p(x) =
x − xj
j∈{0,...,n}\{k} k
k=0
Die Eindeutigkeit folgt aus der Tatsache, dass ein Polynom vom Grad ≤ n höchstens n Nullstellen hat.
Betrachten wir nun n + 1 Punkte der Kurve f mit den x-Koordinaten x, x + △x, . . . , x + n△x, und legen ein Polynom p
durch diese Punkte.
Für große Schrittweiten △x wird das erhaltene Polynom nicht viel mit der Kurve zu tun haben, lässt man jedoch △x → 0
streben, so hofft man auf eine gute Approximation.
7.3.4 Satz (Newtonsche Interpolationsformel). Seien x, △x und Werte y0 , . . . , yn gegeben. Das Polynom, welches durch die
Punkte (x, y0 ), (x + △x, y1 ), . . . , (x + n△x, yn ) geht, ist gleich
p(x) = y0 +
... +
(x − x0 ) △y0 (x − x0 )(x − x1 ) △2 y0
+
+ ···
1!
△x
2!
△x2
(x − x0 )(x − x1 ) . . . (x − xn−1 ) △n y0
,
n!
△xn
wobei wir x j = x + j△x gesetzt haben und △ j y0 die j-te Differenz bezeichnet. Diese ist rekursiv definiert als
△yi = yi+1 − yi , △2 yi = △yi+1 − △yi , . . . .
KAPITEL 7. DIFFERENTIALRECHNUNG
176
Beweis. Offenbar gilt p(x0 ) = y0 . Man erhält p(x1 ) = y0 + (x1 − x0 )
p(x j ) = y0 + (x j − x0 )
... +
△y0
△x
= y0 + △x
△y0
△x
= y0 + (y1 − y0 ) = y1 . Allgemein gilt
(x j − x0 )(x j − x1 ) △2 y0
△y0
+
+ ...
△x
2
△x2
(x j − x0 ) · · · (x j − x j−1 ) △ j y0
=
j!
△x j
△y0
j△x( j − 1)△x △2 y0
j!△x j △ j y0
+
=
+ ··· +
△x
2
j!
△x j
△x2
!
!
!
!
j
j
j
j
=
y0 + △y0 + △2 y0 + · · · + △ j y0 .
0
1
2
j
= y0 + j△x
Wir zeigen nun mittels Induktion die folgende Behauptung: Für je j + 1 Werte y0 , . . . , y j gilt die Formel
yj =
!
j
X
j l
△ y0 .
l
l=0
Der Induktionsanfang j = 0 ist offensichtlich richtig. Sei die Formel also bereits gezeigt für je j Werte. Dann folgt
!
j−1 !
j
X
X
j l
j l
△ y0 + △ j y0 =
△ y0 = y0 +
l
l
l=1
l=0
= y0 +
= y0 +
!
!#
j−1 "
X
j−1
j−1
+
△l y0 + (△ j−1 y1 − △ j−1 y0 ) =
l−1
l
l=1
!
!
j−1
j−1
X
X
j − 1 l−1
j−1 l
(△ y1 − △l−1 y0 ) +
△ y0 + (△ j−1 y1 − △ j−1 y0 ) =
l−1
l
l=1
l=1
 j−2

X j − 1!

= 
△l y1 + △ j−1 y1  −
l
l=0
|
{z
}
=y j
 j−2
 

!
j−1
X
X j − 1!
 
j − 1 l 
− 
△l y0 + △ j−1 y0  + y0 +
△ y0  = y j
l
l
l=0
l=1
Ist f an der Stelle x differenzierbar, so gilt lim△x→0
△y0
△x
= lim△x→0
f (x+△x)− f (x)
△x
❑
= f ′ (x). Allgemein gilt:
7.3.5 Lemma. Sei f : [a, b] → R stetig und n-mal stetig differenzierbar auf (a, b). Ist x ∈ (a, b), so gilt (y j = f (x + j△x))
lim
△x→0
(x−x ) △y
(x−x )···(x−x
△n y0
= f (n) (x).
△xn
) △n y
0
n−1
0
Beweis. Sei p(x) = y0 + 1! 0 △x0 + . . . +
n!
△xn . Die Funktion h(x) := f (x) − p(x) hat die n + 1 Nullstellen
x0 , · · · , xn (∈ (a, b) für △x hinreichend klein). Mit Korollar 7.2.4 folgt die Existenz von ξ ∈ (x0 , xn ) mit h(n) (ξ) = 0. Nun gilt
0 = h(n) (ξ) = f (n) (ξ) − p(n) (ξ) = f (n) (ξ) −
Für △x → 0 folgt wegen der Stetigkeit von f (n) auch
△n y0
△xn
△n y0
.
△xn
→ f (n) (x).
❑
Man erhält also als Grenzfall des in einem Punkt x0 approximierenden Polynoms gerade
p(x) = f (x0 ) + (x − x0 ) f ′ (x0 ) +
(x − x0 ) (n)
(x − x0 )2 ′′
f (x0 ) + · · · +
f (x0 ).
2
n!
Wählt man den Grad von p immer größer, so wird (hoffentlich) p(x) die Kurve f (x) immer besser annähern.
Wir wollen im folgenden eine gegebene Funktion f auf einem reellen Intervall I
durch Polynome approximieren. Für hinreichend oft differenzierbare f werden wir das
durch das sogenannte Taylorpolynom zu bewerkstelligen suchen.
7.3. DER TAYLORSCHE LEHRSATZ
177
7.3.6 Definition. Sei n ∈ N, I ⊆ R ein Intervall und f : I → R (C) liege in Cn (I)3 Ist
y ∈ I fest, so nennt man das Polynom (in der Variablen x)
T n (x) =
n
X
(x − y)k (k)
f (y),
k!
k=0
das n-te Taylorsche Polynom an der Anschlussstelle y. Die Fehlerfunktion Rn (x) :=
f (x) − T n (x) nennt man das n-te Restglied.
Dass T n (x) eine gute Wahl ist, um ein reellwertiges f zu approximieren, folgt aus
dem nun folgenden Satz, welcher eine Art Verfeinerung des Mittelwertsatzes ist.
7.3.7 Satz (Taylorscher Lehrsatz). Sei I ⊆ R ein Intervall, und sei n ∈ N ∪ {0}. Weiters
sei f : I → R mit f ∈ Cn (I) und so, dass f (n) am Inneren von I - also auf I ohne seine
Randpunkte - differenzierbar ist, bzw. äquivalent dazu, dass f auf dem Inneren von I
sicher n + 1-mal differenzierbar ist.
Zu x, y ∈ I, x , y, gibt es immer ein ξ ∈ (min(x, y), max(x, y)), sodass sich das n-te
Restglied Rn (x) = f (x) − T n (x) schreiben lässt als (Lagrange Form des Restgliedes)
Rn (x) =
(x − y)n+1 (n+1)
f
(ξ).
(n + 1)!
Beweis. Seien F, G : [min(x, y), max(x, y)] → R definiert durch
F(t) = f (x) −
n
X
(x − t)k
k=0
k!
· f (k) (t), G(t) = (x − t)n+1 .
Voraussetzungsgemäß sind beide stetig auf [min(x, y), max(x, y)] und differenzierbar auf (min(x, y), max(x, y)), wobei G′ (t) = −(n + 1)(x − t)n , 0 für t ∈
(min(x, y), max(x, y)) und
F ′ (t) = −
n
n
X
X
(x − t)n (n+1)
k(x − t)k−1 (k)
(x − t)k (k+1)
f
(t) +
f (t) = −
f
(t).
k!
k!
n!
k=1
k=0
Nach dem verallgemeinerten Mittelwertsatz, Satz 7.2.13, gibt es ein ξ
(min(x, y), max(x, y)), sodass
∈
n
(n+1)
(ξ)
− (x−ξ)
Rn (x)
f (n+1) (ξ)
F(y) − F(x) F ′ (ξ)
n! f
=
=
=
.
=
(n + 1)!
(x − y)n+1 G(y) − G(x) G′ (ξ) −(n + 1)(x − ξ)n
❑
p
7.3.8 Bemerkung. Wählt man im obigen Beweis G(t) = (x−t) für ein festes aber beliebiges p ∈ N, so erhält man mit derselben Argumentation ein ξ ∈ (min(x, y), max(x, y)),
sodass
f (n+1) (ξ)
Rn (x) =
(x − y) p (x − ξ)n−p+1 .
n!p
Stellt man ξ durch ξ = θx + (1 − θ)y für ein θ ∈ (0, 1) dar, so erhält man die Schlömilchsche Form
f (n+1) (ξ)
Rn (x) =
(x − y)n+1 (1 − θ)n−p+1 .
n!p
des Restgliedes. Für p = n + 1 erhält man die Lagrange Form und für p = 1 die
sogenannte Cauchysche Form des Restgliedes.
3 Siehe
Definition 7.1.14 und Definition 7.1.15.
KAPITEL 7. DIFFERENTIALRECHNUNG
178
7.3.9 Fakta. Sei f : I → R (C) wie in Definition 7.3.6.
1. Man sieht unmittelbar durch Nachrechnen, dass T n (x) ein Polynom höchstens
n-ten Grades ist, sodass
T n (y) = f (y), T n′ (y) = f ′ (y), . . . , T n(n) (y) = f (n) (y).
(7.13)
Die höheren Ableitungen von T n verschwinden identisch, da es ein Polynom
höchstens n-ten Grades ist.
2. Ist p(x) ein weiteres Polynom höchstens n-ten Grades mit (7.13) (T n ersetzt durch
p), so verschwinden die Ableitungen 0-ten bis n-ten Grades von q(x) = p(x) −
T n (x) an der Stelle y.
Wenden wir Satz 7.3.7 auf die reellen Funktionen Re q(x) und Im q(x) oder auch
nur q(x), falls diese reell ist, an, so folgt wegen q(n+1) ≡ 0, dass q(x) = 0. Also
definiert die Eigenschaft (7.13) das Polynom T n (x) eindeutig.
3. Ist f selber ein Polynom vom Grad m, so muss insbesondere f (x) = T n (x) für
n ≥ m.
4. Für reellwertige Funktionen f gibt Satz 7.3.7 im Falle der Differenzierbarkeit von f (n) am Inneren von I eine Möglichkeit, das Restglied Rn (x) durch
(x−y)n+1 (n+1)
(ξ) auszudrücken. Das Problem dabei ist, dass man von ξ nur weiß,
(n+1)! f
dass es zwischen x und y liegt. Nichtsdestotrotz kann man manchmal f (n+1) so
gut abschätzen, dass man sicher sagen kann, dass Rn (x) klein wird; vgl. auch
Bemerkung 7.3.8.
5. Ist f beliebig oft differenzierbar, so kann man für jedes n ∈ N ∪ {0} das Taylorpolynom T n (x) an der Anschlussstelle y betrachten. Man erhält schließlich die
Taylorreihe von f an der Anschlussstelle y:
T (x) :=
∞
X
f (n) (y)
(x − y)n .
n!
n=0
Das ist eine Potenzreihe mit Konvergenzradius R ∈ [0, +∞]. Hier können alle
Fälle auftreten.
6. Ist R > 0, so konvergiert die Potenzreihe insbesondere auf (y − R, y + R). Nun
kann T (x) auf (y − R, y + R) ∩ I mit der Ausgangsfunktion f (x) übereinstimmen;
sie muss es aber nicht.
Klarerweise ist T (x) = f (x), x ∈ (y − R, y + R) ∩ I genau dann, wenn Rn (x) → 0
auf x ∈ (y − R, y + R) ∩ I.
P
n
7. Sei ∞
n=0 an z eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die
Funktion
∞
X
f : (y − R, y + R) → C, f (t) =
an (t − y)n .
n=0
Wir werden in Proposition 8.7.5 sehen (bzw. haben in Lemma 7.3.2 gesehen),
dass f (l) (y) = l! · al , l ∈ N ∪ {0}. Die Taylorreihe von f an der Anschlussstelle y
P
n
ist somit genau ∞
n=0 an (t − y) , und konvergiert daher auf (y − r, y + R).
Das Restglied Rn (x) konvergiert klarerweise gegen 0.
7.3. DER TAYLORSCHE LEHRSATZ
179
7.3.10 Beispiel. Sei n ∈ N ∪ {0}, I ⊆ R ein Intervall, und f : I → R so, dass f ∈ Cn (I)
und dass f auf dem Inneren des Intervalls I sogar (n + 1)-mal differenzierbar ist. Gilt
nun f (n+1) (ξ) = 0 für alle ξ im Inneren von I, so folgt Rn (x) = 0 und daher f (x) = T n (x)
für alle x ∈ I. Kurz zusammengefasst bedeutet das, dass genau die Polynome vom Grad
≤ n alle möglichen Lösungen der Differentialgleichung
f (n+1) (ξ) = 0,
sind. Indem man f in Real- und Imaginärteil zerlegt, folgt diese Tatsache auch für
komplexwertige f .
7.3.11 Beispiel.
Sei f (t) = et . Dann gilt f (n) (t) = et , also f (n) (0) = 1. Wir erhalten
ex =
wobei Rn (x) =
xn+1 ξ
(n+1)! e
x
n
X
xk
+ Rn (x),
k!
k=0
mit ξ ∈ (0, x).
Da e die Grenzfunktion einer Potenzreihe ist, - so wurde sie ja eingeführt muss Rn (x) → 0, vgl. Fakta 7.3.9, 7. Man kann dieses Grenzverhalten aber auch
unschwer durch eine elementare Abschätzung von Rn (x) erhalten.
Betrachte die Funktion
f (t) =
∞
X
cos(2k t)
.
k!
k=1
Differenziert man diese Reihe gliedweise, so erhält man
∞
∞
X
−2k sin(2k t) X −22k cos(2k t)
,
,...
k!
k!
k=1
k=1
P (2k )l
Da ∞
für jedes l ∈ N konvergiert, sind sämtliche dieser Reihen
k=1 k!
gleichmäßig konvergent auf R. Wie wir später in Korollar 8.7.4 sehen werden
(oder man verwende Satz 7.2.19), ist die Funktion f daher in jedem Punkt beliebig oft differenzierbar, und ihre Ableitungen werden durch obige Reihen dargestellt. Es gilt daher
f ′ (0) = f ′′′ (0) = . . . = f (2k+1) (0) = . . . = 0,
und
f (2n) (0) = (−1)n
∞
X
22nk
n
= (−1)n (e4 − 1).
k!
k=1
Die Taylorreihe von f bei 0 ist also gleich
n
∞
X
(−1)n (e4 − 1) 2n
x .
(2n)!
n=0
Wendet man das Quotientenkriterium an, so erhält man (an =
n
(−1)n (e4 −1)
(2n)!
an+1 (e4n 2 + 1)(e4n + 1) 2
=
x −→ ∞, x , 0.
an
(2n + 2)(2n + 1)
Diese Reihe ist für kein x (außer im Trivialfall x = 0) konvergent.
x2n ) .
KAPITEL 7. DIFFERENTIALRECHNUNG
180
Sei
1
 1


e− x ,
f (x) = 

0,
f
x>0
x≤0
1
2
0
1
2
3
4
Klarerweise ist f auf (−∞, 0] beliebig oft ableitbar mit f (n) (x) = 0, x ≤ 0.
Auf (0, +∞) gilt f ′ (x) =
(n ∈ N ∪ {0})
1 − 1x
e ,
x2
f
(n)
und durch vollständige Induktion sieht man, dass
(x) = pn
!
1 −1
e x , x > 0.
x
für Polynome pn (x) vom Grad 2n. Nun gilt mit Hilfe der Regel von de L’Hospital
Korollar 7.2.14
lim f (n) (x) = lim
x→0+
y→+∞
p′ (y)
p(2n) (y)
pn (y)
= lim n y = · · · = lim n y = 0,
y
y→+∞ e
y→+∞
e
e
da p(2n)
n (y) eine Konstante ist.
Wir sehen insbesondere, dass f auf [0, +∞) stetig ist, und dass wegen
limt→0+ f ′ (t) = 0 nach Korollar 7.2.10 f ′ (0)+ = 0. Wegen f ′ (0)− = 0 ist f
auch bei 0 differenzierbar mit f ′ (0), und somit f ∈ C1 (R).
Wiederholte Anwendung dieses Argumentes auf f ′ , f ′′ usw. zeigt, dass f auf R
beliebig oft differenzierbar ist, wobei f (n) (0) = 0, n ≥ 0.
Insbesondere ist das Taylorpolynom T n (x) stets identisch Null. Also ist f ein
Beispiel für eine C∞ -Funktion, deren Taylorreihe bei der Anschlussstelle 0 auf
ganz R konvergiert, aber nicht mit f übereinstimmt.
Wir haben gesehen, dass für eine differenzierbare Funktion f , welche an einer Stelle x ein lokales Extremum besitzt, f ′ (x) = 0 gelten muss, dass jedoch die Umkehrung im Allgemeinen nicht gilt (Beispiel: f (t) = t3 an der Stelle x = 0). Aus dem
Taylorschen Satz erhält man unmittelbar eine hinreichende Bedingung für ein lokales
Extremum.
7.3.12 Korollar. Für n ∈ N sei f : (c, d) → R eine zumindest n-mal stetig differenzierbare Funktion, x ∈ (c, d), und gelte
f ′ (x) = f ′′ (x) = . . . = f (n−1) (x) = 0, f (n) (x) , 0.
Ist n gerade, so liegt ein lokales Extremum vor, und zwar ein lokales Minimum falls
f (n) (x) > 0 und ein lokales Maximum falls f (n) (x) < 0. Ist n ungerade, so liegt kein
lokales Extremum vor.
7.3. DER TAYLORSCHE LEHRSATZ
181
Beweis. Nach der Taylorschen Formel gilt für t ∈ (c, d) mit einer geeigneten Zwischenstelle ξ zwischen t und x
f (t) = f (x) +
(t − x)n (n)
f (ξ).
n!
Ist z.B. f (n) (x) > 0, so gilt für ξ in einer hinreichend kleinen Umgebung (x − δ, x + δ)
von x ebenfalls f (n) (ξ) > 0. Da ξ zwischen t und x liegt, folgt aus t ∈ (x − δ, x + δ), dass
für gerades n
(t − x)n (n)
f (ξ) > 0.
n!
Somit folgt f (t) > f (x), und x ist ein lokales Minimum. Ist n ungerade, so hat (t − x)n
für t < x ein anderes Vorzeichen als für t > x. Also ist x kein lokales Extremum. Die
anderen Fälle beweist man genauso.
❑
7.3.13 Beispiel. Mit den bisher gesammelten Ergebnissen lassen sich sogenannte
Kurvendiskussionen von Funktionen durchführen.
f
4
Man betrachte z.B. die
Funktion f (x) = x x auf
(0, +∞).
3
2
1
0
1
e
1
2
Zunächst ist diese Funktion stetig und beliebig oft differenzierbar.
Klarerweise ist sie immer positiv, hat also keine Nullstellen.
Um die lokalen Extrema zu finden, betrachte
f ′ (x) = x x (1 + ln x), f ′′ (x) = x x−1 + x x (1 + ln x).
Die einzige Nullstelle von f ′ (x) ist 1e . Da f ′′ ( 1e ) > 0 folgt aus Korollar 7.3.12,
dass diese Stelle ein lokales Minimum ist.
Für 0 < x < 1e ist f ′ (x) < 0 also dort monoton fallend, und für 1e < x ist
f ′ (x) > 0, also dort monoton wachsend, vgl. Korollar 7.2.7. Insbesondere ist 1e
ein absolutes Minimum von f auf (0, +∞).
Schließlich erhält man mit de l’Hospital lim x→0+ f (x) = 1 und wegen x x ≥
e x , x ≥ e die Beziehung lim x→+∞ f (x) = +∞.
7.3.14 Beispiel. Wir wollen zeigen, dass die Gleichung
(1 − ln x)2 = x(3 − 2 ln x)
KAPITEL 7. DIFFERENTIALRECHNUNG
182
in (0, +∞) genau zwei Lösungen hat. Dazu betrachten wir die Funktion
f : (0, +∞) → R,
f (x) = (1 − ln x)2 − x(3 − 2 ln x).
Für diese gilt es zu zeigen, dass f genau zwei Nullstellen hat. Setzt man x = 1, so folgt
f (1) = −2 < 0. Andererseits folgt wegen limx→0+ x(3 − 2 ln x) = 0
lim f (x) = +∞.
x→0+
Wegen f (x) ≥ x(2 ln x − 3) ≥ x für x ≥ exp(2) folgt auch
lim f (x) = +∞.
x→+∞
Insbesondere gibt es ξ, η ∈ R mit 0 < ξ < 1 < η < +∞, sodass f (ξ) > 0, f (η) > 0.
Nach dem Zwischenwertsatz muss es einen Punkt α ∈ (ξ, 1) und einen Punkt β ∈ (1, η)
geben, sodass f (α) = 0 = f (β). Also hat f mindestens zwei Nullstellen.
Um zu zeigen, dass es nicht mehr sein können, berechnen wir
1
1
ln x − 1 2 4 − 2 ln x + 2x
f ′ (x) = 2(ln x − 1) + 2 ln x − 1, f ′′ (x) = 2 2 − 2
+ =
.
x
x
x
x2
x2
Für x ∈ (0, 1] ist ln x ≤ 0 und somit f ′′ (x) > 0. Für x ∈ (1, +∞) gilt wegen x > ln x
auch f ′′ (x) > 0. Also hat f ′′ keine Nullstelle. Nach dem Satz von Rolle kann f ′
höchstens eine und weiter f höchstens zwei Nullstellen haben (vgl. Korollar 7.2.4).
Der Vollständigkeit halber wollen wir f noch weiter diskutieren. Wegen f ′′ (x) > 0
muss f ′ streng monoton wachsen. Außerdem gilt wegen f ′ (x) ≤ − 1x für x ∈ (0, 1)
lim f ′ (x) = −∞,
x→0+
und wegen f ′ (x) ≥ 2 ln x − 1 für x > e
lim f ′ (x) = +∞.
x→+∞
Aus dem Zwischenwertsatz folgt, dass f ′ mindestens eine Nullstelle hat. Insgesamt hat
f ′ genau eine Nullstelle x0 . Wegen f ′′ (x0 ) > 0 muss x0 ein lokales Minimum sein.
Wegen der Monotonie von f ′ gilt
f ′ (s) < f ′ (x0 ) = 0 < f ′ (t) für 0 < s < x0 < t < +∞.
Also ist f auf (0, x0 ) monoton fallend und auf (x0 , +∞) monoton wachsend. Deswegen
muss x0 sogar ein globales Minimum sein.
7.4 Stammfunktion
Bei der Integration von Funktionen wird es wichtig sein, zu einer gegebenen Funktion
f : [a, b] → R (C) - falls möglich - eine Funktion F : [a, b] → R (C) zu finden, sodass
F′ = f .
7.4.1 Definition. Sei I ⊆ R ein Intervall und f : I → R (C). Wir nennen eine Funktion
F : I → R (C) eine Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I.
Hat ein f mindestens eine Stammfunktion, so heißt die Gesamtheit
aller StammR
funktionen von f das unbestimmte Integral von f und wird durch f bezeichnet.
7.4. STAMMFUNKTION
183
7.4.2 Bemerkung. Mit F ist offensichtlicherweise auch F + c für jedes c ∈ R (C) eine
Stammfunktion von f .
Sind umgekehrt F1 , F2 zwei Stammfunktionen der selben Funktion f , so gilt (F1 −
F2 )′ ≡ 0 auf I. Nach Korollar 7.2.7 bzw. Bemerkung 7.2.9 ist F1 − F2 eine Konstante.
Somit gibt es bis auf additive Konstanten eine eindeutige Stammfunktion F, und
Z
f = {F + c : c ∈ R (C)}.
Zum Aufsuchen von Stammfunktionen gegebener Funktionen ist folgendes Resultat sehr hilfreich.
7.4.3 Lemma. Seien I, J ⊆ R Intervalle und f, g : I → R (C), sowie α, β ∈ R (C).
Weiters sei h : J → I differenzierbar.
(i) Haben f und g Stammfunktionen, so auch α f + βg, wobei
Z
Z
Z
(α f + βg) = α
f +β g
.
(ii) Sind f und g differenzierbar auf I, sodass f ′ g eine Stammfunktion hat, dann hat
auch f g′ eine solche, und
Z
Z
f ′g = f g −
f g′ , Regel von der Partiellen Integration.
(7.14)
(iii) Mit f hat auch ( f ◦ h) · h′ : J → R (C) eine Stammfunktion, wobei
Z
Z !
(( f ◦ h) · h′ ) =
f ◦ h, Substitutionsregel)
Diese drei Beziehungen sind so zu verstehen, dass wenn
funktion steht, die Gleichheit bis auf eine Konstante gilt.
R
· · · für jeweils eine Stamm-
Beweis.
(i) Sind F und G Stammfunktionen von f und g, so folgt (αF + βG)′ = αF ′ + βG′ =
α f + βg. Also ist αF + βG eine Stammfunktion von α f + βg.
(ii) Ist H Stammfunktionen von f ′ g, so folgt aus der Produktregel ( f g − H)′ = ( f ′ g +
f g′ ) − f ′ g = f g′ . Somit ist f g − H Stammfunktionen von f g′ , und es gilt (7.14).
(iii) Ist F Stammfunktionen von f , so folgt aus der Kettenregel in Satz 7.1.9 bzw.
Bemerkung 7.1.10, dass (F ◦ h)′ = ( f ◦ h) · h′ . Also ist F ◦ h Stammfunktion von
( f ◦ h) · h′ .
❑
KAPITEL 7. DIFFERENTIALRECHNUNG
184
7.4.4 Bemerkung. Zur Substitutionsregel gibt es folgende Merkregel:
Seien I, J ⊆ R wieder Intervalle, f : I → R (C), und h : J → I differenzierbar.
Schreiben wir x = h(t) mit t ∈ J und formal dx = h′ (t) dt, so erhält man aus
Z !
Z
f (x) =:
f (x)dx
durch Ersetzen von x durch h(t) und dx durch h′ (t) dt
Z
Z
′
f (h(t)) · h (t) dt := (( f ◦ h) · h′ ).
Wie gesagt ist das eine Merkregel, die sich beim Bestimmen konkreter Stammfunktionen aber als durchaus praktikabel und übersichtlich herausgestellt hat, siehe etwa
Beispiel 7.4.8.
7.4.5 Beispiel. Man kann die Substitutionsregel verwenden, um einfache Differentialgleichungen der Form
y′ (t) · f (y(t)) = g(t), t ∈ I,
(7.15)
zu lösen. Hier sind I, J ⊆ R Intervalle und f : F → R sowie g : I → R stetige
Funktionen.
Angenommen man hat eine Funktion y : I → J ⊆ R, welche (7.15) erfüllt. Hat
f eine Stammfunktion F, so ist nach der Substitutionsregel die Funktion F ◦ y eine
Stammfunktion von t 7→ y′ (t) · f (y(t)) und daher auch von g.
Kennt man andererseits eine Stammfunktion G von g explizit, so folgt F ◦ y =
G + c für eine Konstante c ∈ R. Also hat man eine implizite Beschreibung von y(t). In
manchen Fällen lässt sich diese Gleichung nach y auflösen, wodurch man y(t) explizite
beschreiben kann.
Diese hier beschriebene Methode nennt man auch Trennung der Variablen .
7.4.6 Beispiel. Man betrachte die Differentialgleichung
y′ (t) = y(t), t ∈ R.
Eine reellwertige Lösung y dieser Differentialgleichung ist y ≡ 0. Angenommen y ist
eine weitere reellwertige Lösung mit y(t0 ) < 0 für ein t0 ∈ R. Wegen der Stetigkeit gilt
y(t) < 0 für alle t ∈ (t0 − ǫ, t0 + ǫ) =: I.
Ist f : I → (−∞, 0) die Funktion f (η) = η1 , so gilt für t ∈ I,
y′ (t) ·
1
= y′ (t) · f (y(t)) = 1.
y(t)
Eine Stammfunktion von f ist F(η) = ln(−η), also ist t 7→ ln(−y(t)) eine Stammfunkti1
auf I. Von 1 ist t 7→ t eine Stammfunktion. Es folgt ln(−y(t)) = t+c, t ∈
on von y′ (t)· y(t)
I, und weiter y(t) = −ec · et . Also muss y(t) = d · et , t ∈ I für ein reelles d ∈ (−∞, 0).
Man beachte, dass wir von der Gültigkeit von y′ (t) = y(t) auf y(t) = d · et , t ∈ I
geschlossen haben, wir uns also zunächst nicht sicher sein können, dass diese Funktion
tatsächlich y′ (t) = y(t) löst. Durch Einsetzen zeigt man aber sofort, dass tatsächlich
y(t) = d · et , t ∈ R, eine Lösung ist.
7.4. STAMMFUNKTION
185
Wir werden nun einige Funktionstypen auflisten und angeben, wie man die unbestimmten Integrale von diesen bestimmt.
(i) Ist Rf (x) = xn , n ∈ N ∪ {0} auf R, so ist F(x) =
1 n+1
x + c.
ist xn = n+1
1 n+1
n+1 x
eine Stammfunktion. Also
(ii) Ist f (x) = x−n , n ∈ N, n > 1 auf (−∞, 0) oder (0, +∞), so ist F(x) =
eine Stammfunktion.
1
−n+1
−n+1 x
(iii) Ist f (x) = x−1 , auf (−∞, 0) oder (0, +∞), so ist F(x) = ln |x|, x , 0 eine Stammfunktion.
(iv) Um die Stammfunktion von ln x, x > 0 zu ermitteln, wenden wir die Partielle
Integration an:
Z
Z
Z
1
ln(x) = (x′ ) ln(x) = x ln(x) −
x = x(ln(x) − 1) + c.
x
R
sinh x = cosh x + c, cosh x = sinh x + c.
R
R
(vi) sin x = − cos x + c, cos x = sin x + c.
(v)
R
e x = e x + c,
R
(vii) Sei n ∈ N, n ≥ 2. Mit partieller Integration sieht man
Z
Z
Z
n
n−1
n−1
cos t = (cos t) · (cos t) = (cos t)(sin t) + (n − 1) (cosn−2 t)(sin t)2 =
(cosn−1 t)(sin t) + (n − 1)
Z
(cosn−2 t) − (n − 1)
Z
(cosn t).
Also erhält man die Rekursionsgleichung
Z
Z
n−1
1
(cosn−2 t).
cosn t = (cosn−1 t)(sin t) +
n
n
(viii) Mit Hilfe von (i) und der Substitutionsregel folgt (k ∈ N, k > 1)
Z
Z
a
a
a
= a ln |x − b| + c,
=
+ c,
(x − b)
(x − b)k (−k + 1)(x − b)k−1
wobei man diese Funktionen auf einem Intervall betrachtet, das b nicht enthält.
R 1
sin
(ix) 1+x2 = arctan x + c. (Umkehrfunktion von tan = cos
: (− 2π , π2 ) → R).
R x
2
′
(x) Um 1+x
2 zu ermitteln, wende man die Substitutionsregel auf h(x) = x , h (x) =
1
2x und f (y) = 1+y an:
Z
x
1
=
2
2
1+x
Z
2x
1
=
2
2
1+x
Z
R
=
(xi) Ganz ähnlich sieht man
x
(1+x2 )k
1
1+y
!
=
y=x2
1
1
2(1−k) (1+x2 )k−1
1
1
(ln |1 + y|)y=x2 = ln |1 + x2 |.
2
2
für k ∈ N, k > 1.
KAPITEL 7. DIFFERENTIALRECHNUNG
186
(xii)
R
1
,
(1+x2 )k
k ∈ N, k > 1 lässt sich rekursiv berechnen, indem man
t = arctan x ∈ (− π2 , π2 ) substituiert
Z
Z
Z
Z
1
1
1
1
=
·
=
=
cos2k−2 t =
(1 + x2 )k
(1 + x2 )k−1 (1 + x2 )
(tan2 t + 1)k−1
Z
1
2k − 3
2k−2
(cos
t) · (tan t) +
(cos2k−4 t) =
2k − 2
2k − 2
Z
1
1
x
2k − 3
·
+
.
2k − 2 (1 + x2 )k−1 2k − 2
(1 + x2 )k−1
(xiii) Ist nun allgemein f (x) =
(D := q −
2
p
4
x+d
,
(x2 +px+q)k
> 0), so schreibe
f (x) =
Um
R
und hat x2 + px + q keine reellen Nullstellen
(x + 2p ) + (d − 2p )
((x + 2p )2 + q −
f (x) zu berechnen, substituiere
Z
1
f (x) = k
D
Z
√
Dy −
Dy +
p
2
√
p2 k
4 )
.
= x(y):
D(d − 2p )
(1 + y2 )k
.
Dieses Integral lässt sich mit Hilfe der oben behandelten Funktionen lösen.
(xiv) Zu guter letzt noch Stammfunktion von C-wertigen Funktionen (w ∈ C):
Z
Z
1
eix = −ieix + c,
ewx = ewx + c,
w
Z
Z
1 wx x wx
1
x
e = e − 2 ewx + c.
xewx = ewx −
w
w
w
w
P(x)
, wobei
Um die Stammfunktion einer beliebigen rationalen Funktion R(x) = Q(x)
P(x) und Q(x) zwei reelle Polynome sind, zu ermitteln, werden wir diese in eine Summe von Funktionen entwickeln, deren Stammfunktionen wir eben kennengelernt haben.
Als erstes folgt aus dem Euklidischen Algorithmus, dass
P(x) = S (x)Q(x) + T (x),
wobei S (x) und T (x) reelle Polynome sind, und wobei der Grad von T (x) kleiner als
der von Q(x) ist.
R
R T (x)
T (x)
Das Integral von R(x) = S (x) + Q(x)
ist daher S (x) + Q(x)
. Das erste Integral
T (x)
weiter zerlegen.
errechnet man leicht mit Hilfe von (i). Für das zweite müssen wir Q(x)
Dazu betrachten wir zuerst die auftretenden Polynome als komplexe Polynome.
Das hat den Vorteil, dass sich jedes komplexe Polynom bis auf eine Konstante als
Produkt von Faktoren (z − z j ) schreiben lässt.
7.4.7 Satz. Seien T (z), Q(z) zwei komplexe Polynome, sodass der Grad n von Q(z)
größer als der von T (z) ist. Schreiben wir Q(z) = an zn + · · · + a0 (an ∈ C \ {0}) als
Q(z) = an (z − z1 )ν1 · · · · · (z − zm )νm ,
7.4. STAMMFUNKTION
187
wobei zi , z j wenn i , j und wobei ν1 + · · · + νm = n, so gibt es eindeutige Zahlen
a jk ∈ C, sodass (z < {z1 , . . . , zm })
ν
j
m
T (z) X X a jk
=
.
Q(z)
(z − z j )k
j=1 k=1
Beweis. Unser Problem ist äquivalent zur Existenz und Eindeutigkeit von Zahlen a jk ,
sodass (z ∈ C)
νj
m X
m
X
Y
1
T (z) =
a jk (z − z j )ν j −k
(z − zl )νl .
(7.16)
an
j=1 k=1
l=1,l, j
Betrachte den Vektorraum Cn [z] aller komplexen Polynome vom Grad kleiner n. Dieser
hat Dimension n. Kann man nun zeigen, dass die n Stück Polynome
(z − z j )ν j −k
m
Y
(z − zl )νl , j = 1, . . . , m, k = 1, . . . , ν j ,
l=1,l, j
linear unabhängig in Cn [z] sind, so bilden sie sogar eine Basis, und unser Satz folgt
sofort aus der Linearen Algebra.
Wäre
m
Y
X
λ jk (z − z j )ν j −k
(z − zl )νl = 0,
j=1,...,m,k=1,...,ν j
l=1,l, j
und setzt man z = z1 , . . . , zm , so erhält man λ1ν1 = · · · = λmνm = 0. Nun kann man
Qm
j=1; ν j >1 (z − z j ) durchdividieren und erhält
X
j=1,...,m;k=1,...,ν j −1
λ jk (z − z j )ν j −1−k
m
Y
(z − zl )νl −1 = 0.
l=1,l, j
Wiederholt man obige Argumentation, so folgt λ j(ν j −1) = 0 für alle j ∈ {1, . . . , m}, ν j >
1, usw. bis man schließlich λ jk = 0 für alle j = 1, . . . , m, k = 1, . . . , ν j erhält.
❑
Aus (7.16) sehen wir auch, wie man die Zahlen a jk gewinnen kann. In der Tat, kann
man alle auftretenden Polynome ausmultiplizieren, und vergleicht dann die Koeffizienten, die bei jedem zk links und rechts vom Gleichheitszeichen stehen. Diese müssen
übereinstimmen, und so erhält man n Gleichungen für n Unbekannte.
Etwas weniger Arbeit hat man, wenn man den eben gebrachten Beweisgedanken
einfließen lässt. Man kann nämlich in (7.16) nacheinander z = z1 , . . . , zm setzen und
erhält so a jν j ganz leicht.
Wir kehren zu unseren reellen Polynomen T (x) und Q(x) zurück. Wenn wir auf
diese Satz 7.4.7 anwenden, hat das den Nachteil, dass man eine Partialbruchzerlegung
mit möglicherweise nicht nur reellen Komponenten erhält.
Um das wieder zu reparieren, schließt man zuerst aus Q(z̄) = Q(z) (Q(z) hat ja
reelle Koeffizienten), dass mit z j auch z̄ j eine Nullstelle von Q(z) ist, und dass diese die
gleiche Vielfachheit ν j haben.
Somit sind die Nullstellen von Q(z) von der Form x1 , . . . , x p , z1 , . . . zq , z̄1 , . . . z̄q , wobei x j ∈ R und z j ∈ C+ := {z ∈ C : Im z > 0}. Die Partialbruchzerlegung aus Satz 7.4.7
lässt sich nun schreiben als
!
µj
q X
p νj
X
c jk
b jk
T (z) X X a jk
+
+
.
=
Q(z)
(z − x j )k j=1 k=1 (z − z j )k (z − z̄ j )k
j=1 k=1
KAPITEL 7. DIFFERENTIALRECHNUNG
188
T (z)
T (z̄)
= Q(z)
, folgt aus der Eindeutigkeit der komplexen PartialbruchzerleDa aber auch Q(z̄)
gung a jk ∈ R und c jk = b̄ jk , und man erhält
!
!
b jk
c jk
b j (z − z̄ j )k + b̄ j (z − z j )k
=
,
+
(z − z j )k (z − z̄ j )k
(z2 − 2z Re(z j ) + |z j |2 )k
wobei das Polynom im Zähler ebenfalls reell ist. Summiert man nun über k auf, und
bringt die Summe auf gemeinsamen Nenner, so erhält man eine Funktion der Form
(z2
T j (x)
,
+ B j z + C j )µ j
wobei T j (x) ein reelles Polynom mit Grad kleiner 2µ j ist, und B j = −2 Re(z j ), C j =
|z j |2 . Durch wiederholte Anwendung des Euklidischen Algorithmus kann man dieses
Polynom als
µj
X
(d jk z + e jk )(z2 + B jz + C j )µ j −k
k=1
anschreiben. Somit folgt die Zerlegung
ν
µ
j
j
XX
d jk z + e jk
T (z) X X a jk
=
+
,
k
2 + B z + C )k
Q(z)
(z
−
x
)
(z
j
j
j
j=1 k=1
j=1 k=1
p
q
(7.17)
welche nur reellen Zahlen beinhaltet. Dabei haben die z2 + B j z + C j klarerweise keine
reellen Nullstellen.
Zur Praktischen Berechnung der Koeffizienten a jk in (7.17) multipliziert man Q(z)
links und rechts, und führt einen Koeffizientenvergleich durch. Durch Einsatzen von
z = x j lassen sich die a jν j auch schneller berechnen.
R T (x)
Um Q(x)
zu berechnen, genügt es nun die einzelnen Summanden in der Partialbruchzerlegung zu integrieren, und diese dann zu summieren.
R
7.4.8 Beispiel. Wir wollen das Integral tan x dx auf einem Intervall I berechnen, wobei keine Nullstelle von cos x enthalten darf:
Z
Z
Z
sin x
1
i −
tan x dx =
dx =h
dt =
cos x
t
t=cos x
dt=− sin xdx
= − ln |t| + C = − ln | cos x| + C .
Diese Methode beruht darauf, dass unser Integrand von der Gestalt f (t(x)) t′ (x) ist, und
noch dazu mit einer sehr einfachen Funktion f . Daher können wir die Substitutionsregel unmittelbar anwenden und die entstehende Funktion leicht integrieren.
R
7.4.9 Beispiel. Wir wollen das Integral x2 sin x dx auf einem beliebigen Intervall berechnen. Wir verwenden partielle Integration:
Z
Z
Z
2
2
2
x sin x dx = x (− cos x) − 2x(− cos x) dx = −x cos x + 2 x cos x dx =
2
= −x cos x + 2 x sin x −
Z
sin x dx = −x2 cos x + 2x sin x + 2 cos x + C
7.4. STAMMFUNKTION
189
Mit dieser Methode kann man zum Beispiel alle Integrale von der Form
Z
Z
Z
x
P(x)e dx,
P(x) sin x dx,
P(x) cos x dx ,
mit einem Polynom P berechnen.
7.4.10 Beispiel (Integration von R(e x )). Hat man eine Funktion f der Gestalt f (x) =
R(e x ), wobei R eine rationale Funktion ist, so kann man deren Integral stets mit Hilfe
der Substitution t = e x auf das Integral einer rationalen Funktion bringen. Denn es gilt,
mit t = e x ,
Z
Z
1
x
R(t) dt
R(e ) dx =h t=ex i
t
x
dt=e dx
dx= 1t dt
R 2x −1
7.4.11 Beispiel. Wir wollen das Integral eex +2
dx auf R berechnen. Zunächst gilt
Z
Z 2x
Z 2
x 2
(e ) − 1
e −1
t −1 1
i
dx
=
dx
=h
· dt
x
x
x
t=e
e +2
e +2
t+2 t
1
dx= t dt
Man beachte, dass nach der Substitution t(x) = t in (0, +∞) liegt; also immer positiv ist.
Nun haben wir ein Integral einer rationalen Funktion auf (0, +∞) zu berechnen. Dazu
schreiben wir
t2 − 1
t2 − 1 1
t2 + 2t − 2t − 1
2t + 1
· = 2
=
=1−
t+2 t
t(t + 2)
t + 2t
t2 + 2t
und versuchen nun den zweiten Summanden in Partialbrüche zu zerlegen:
2t + 1
A
B
(A + B)t + 2A
= +
=
t(t + 2)
t
t+2
t(t + 2)
Koeffizientenvergleich führt auf A =
1
2
und B = 32 . Also haben wir
t2 − 1 1
1
3
· =1− −
t+2 t
2t 2(t + 2)
und daher
Z
1
3
t2 − 1 1
· dt = t − ln t − ln(t + 2) =
t+2 t
2
2
x 3
= e x − − ln(e x + 2)
2 2
7.4.12 Beispiel (Integration von R(sin x, cos x)). Hat man eine Funktion f der Gestalt
f (x) = R(sin x, cos x), wobei R eine rationale Funktion ist, so kann man deren Integral
stets mit Hilfe der Substitution t = tan 2x auf das Integral einer rationalen Funktion
bringen. Denn es gilt, mit t = tan 2x ,
x
sin x = 2 sin
2 tan 2
x
x
cos =
2
2 1 + tan2
x
2
=
2t
1 + t2
x
1 − t2
x
x 1 − tan2 2
=
− sin2 =
2
2 1 + tan2 2x
1 + t2
dt
1
x
2
= (1 + tan2 ) also dx =
dt
dx 2
2
1 + t2
cos x = cos2
190
KAPITEL 7. DIFFERENTIALRECHNUNG
Literaturverzeichnis
[EL] K.Endl,W.Luh: Analysis I-III, Aula Verlag, Wiesbaden 1986.
[F] G.M.Fichtenholz: Differential- und Integralrechnung I-III, Deutscher Verlag der
Wissenschaften, Berlin 1964.
[H] H.Heuser: Lehrbuch der Analysis 1,2, Teubner Verlag, Stuttgart 1989.
[L] S.Lang: A first course in calculus, Springer Verlag, Heidelberg 1986.
[R] W.Rudin: Principles of Mathematical Analysis, McGraw-Hill, New York 1953,
third edition 1976.
[W] W.Walter: Analysis 1, Springer Verlag, Heidelberg, New York Tokoyo.
191
Index
ǫ-Kugel, 99
C∞ (I), 165
Cn (I), 165
überall definiert, 4
Abbildung, 4
identische, 4
Abel Kriterium, 81
Ableitung
einer Funktion, 164
höhere, 165
im Punkt x, 159
linksseitige, 159
rechtsseitige, 159
Abschluss, 101
absolut konvergent, 77
Addition, 9, 20
alternierende harmonische Reihe, 77
analytisch, 143
analytisch in einem Punkt, 143
Anschlussstelle, 177
Antisymmetrie, 12
Arcuscosinus, 154
Funktionsgraph, 155
Arcuscotangens, 154
Funktionsgraph, 155
Arcussinus, 154
Funktionsgraph, 155
Arcustangens, 154
Funktionsgraph, 155
Areacosinus Hyperbolicus, 155
Funktionsgraph, 156
Areacotangens Hyperbolicus, 156
Funktionsgraph, 157
Areasinus Hyperbolicus, 155
Funktionsgraph, 156
Areatangens Hyperbolicus, 156
Funktionsgraph, 157
Assoziativität, 7, 20
Auswahlaxiom, 55
Bernoullische Ungleichung, 19
beschränkt, 13
nach oben, 13
nach unten, 13
beschränkte
Folge, 58
Menge, 58
Betrag
komplexer Zahlen, 47
bijektiv, 5
Cauchy-Folge, 63
Cauchy-Kriterium, 137
Cauchysches Konvergenzkriterium
Folgen, 64
Reihen, 77
Cauchysches Restglied, 177
Charakteristik, 38
Cosinus, 144
Funktionsgraph, 149
Cosinus Hyperbolicus, 155
Funktionsgraph, 156
Cotangens, 154
Funktionsgraph, 154
Cotangens Hyperbolicus
Funktionsgraph, 157
Dedekindscher Schnitt, 43
Definitionsbereich, 5
dicht, 93
Dichteeigenschaft, 39
Differentialgleichung, 179, 184
Differentialgleichungen
Trennung der Variablen, 184
Differenz, 2
differenzierbar
n-mal, 165
im Punkt x, 159
rechtsseitig, 159
stetig, 165
Dirichlet Kriterium, 80
192
INDEX
diskrete Metrik, 53
Distributivgesetz, 3
Distributivität, 20
divergent, 54, 73
bestimmt, 68
Dividieren mit Rest, 29
Doppelreihe, 87
Dreiecksungleichung, 16, 50
Dreiecksungleichung nach unten, 16
Einheitskreislinie, 103, 124
Einschränkung, 5
Elemente, 1
endlich, 25
Euklidischer Algorithmus, 186, 188
Eulersche Exponentialfunktion, 91
Eulersche Zahl, 148
Existenz des neutralen Elementes, 20
Exponentialfunktion, 91, 144
Funktionsgraph, 147
Extremum
absolutes, 165
lokales, 165
faktorielle, 79
Folge, 54
Cauchy-Folge, 63
monoton fallende, 63
monoton wachsende, 63
monotone, 63
Rechenregeln für, 60
streng monoton fallend, 55
Formel von de Moivre, 145
Fortsetzung, 5
Funktion, 4
beschränkte, 58, 132
bijektive, 5
Einschränkung, 5
Fortsetzung, 5
injektive, 5
monoton fallende, 129
monoton wachsende, 129
stetige, 117
streng monoton fallende, 29, 129
streng monoton wachsende, 29, 129
surjektive, 5
unstetige, 127
zusammengesetzte, 6
Funktionen
trigonometrische, 144
193
Funktionswert, 4
Gaußklammer, 118
Gaussche Zahlenebene, 47
gerichtete Menge, 109
Graph, 4
Grenzwert
einer Funktion, 114
einseitige, 115
linksseitiger, 115
rechtsseitiger, 115
Häufungspunkt
einer Folge, 104
einer Menge, 101
harmonische Reihe, 76
hebbare Unstetigkeit, 127
Hintereinanderausführung, 6
imaginäre Einheit, 46
Imaginärteil, 46
Induktions
-anfang, 19
-prinzip, 19
-schritt, 19
Varianten d., 25
Infimum, 13
injektiv, 5
Integral
unbestimmtes, 182
Intervall, 123
Involution, 27
isolierter Punkt, 101
Isometrie, 93
isometrisch, 93
isometrisch enthalten, 93
Körper
angeordneter, 11
archimedisch angeordneter, 39
vollständig angeordneter, 40
Kürzungsregel, 20
kartesisches Produkt, 2
Kommutativität, 20
kompakt, 107
Komplement, 2
komplex differenzierbar, 161
konjugiert komplexen, 48
konvergent, 54, 73
absolut, 77
INDEX
194
bedingt, 77
gegen ±∞, 68
gegen x, 54
gleichmäßig, 133
punktweise, 132
Konvergenz
gleichmäßige einer Funktionenfolge,
133
absolute einer Funktionenreihe, 138
absolute und gleichmäßige einer
Funktionenreihe, 139
einer Folge, 54
eines Netzes, 110
gleichmäßige einer Funktionenreihe,
138
komponentenweise, 65
punktweise einer Funktionenfolge,
132
punktweise einer Funktionenreihe,
138
Konvergenzradius, 139
Kurvendiskussionen, 181
Lagranges Restglied, 177
leere Menge, 1
Leibniz Kriterium, 81
Lemma vom iterierten Supremum, 43
Limes Inferior, 105
Limes Superior, 105
linksstetig, 127
Logarithmus
natürlicher, 147
naturalis, 147
Logarithmus naturalis
Funktionsgraph, 147
lokale Eigenschaft, 118
Mächtigkeit, 25
Majorantenkriterium, 76
Maximum, 13
absolutes, 165
lokales, 165
Menge, 1
abgeschlossene, 101
Bild, 5
Differenz-, 2
Distributivgesetz-, 3
leere, 1
Ober-, 1
offene, 100
Potenz-, 3
Schnitt-, 2
Teil-, 1
Vereinigungs-, 2
zusammenhängende, 123
Mengen
getrennte, 123
Mengengleichheit, 1
Metrik, 50
euklidische, 50
Supremums-, 133
metrischer Raum
vollständiger, 64
Minimum, 13
absolutes, 165
lokales, 165
Minkowskische Ungleichung, 51
Minorantenkriterium, 76
Mittel
arithmetisches, 12
Mittelwertsatz, 167
monoton fallend, 63, 129
monoton wachsend, 63, 129
Moore-Smith-Folge, 110
Multiplikation, 9, 20
Nachfolgerabbildung, 16
natürliche Zahlen, 16
Netz, 110
Norm, 53
obere Schranke, 13
Obermenge, 1
Partialbruchzerlegung
komplexe, 186
reelle, 188
Partialsumme, 72
Permutation, 82
Pi, 149
Polarkoordinaten, 151
Polynom
trigonometrisches, 153
Potenzmenge, 3
Potenzreihe, 143
Potenzreihen, 139
Primfaktorzerlegung, 30
Primzahl, 30
Produktregel, 162
Quotientenkörper, 38
INDEX
Quotientenkriterium, 78
Quotientenregel, 162
Raabe Kriterium, 81
Raum
metrischer, 50
Realteil, 46
rechtsstetig, 127
Reflexivität, 12
Regel von de L’Hospital, 170
Regel von der Partiellen Integration, 183
Reihe, 72
alternierende harmonische, 77
bestimmt divergente, 73
divergente, 73
geometrische, 57
harmonische, 76
konvergent gegen ±∞, 73
konvergente, 73
lineare Anordnung, 87
Potenzreihen, 139
Rechenregeln für, 73
Summe der, 73
Teleskop-, 75
Umordnung, 82
Riemann-Zerlegung, 110
195
Sprungstelle, 127
Stammfunktion, 182
stetig, 117
an der Stelle x, 117
gleichmäßig, 125
linksseitig, 127
rechtsseitig, 127
streng monoton fallend, 129
streng monoton wachsend, 129
Substitutionsregel, 183
Summensätze, 146
Supremum, 13
Supremumsnorm, 138
surjektiv, 5
Tangens, 154
Funktionsgraph, 154
Tangens Hyperbolicus
Funktionsgraph, 157
Taylorreihe, 178
Taylorsche Polynom, 177
Teilfolge, 56
Teilfolgen
gestattet, 111
Teilmenge, 1
Teilnetz, 111
Totalität, 12
Satz
Transitivität, 12
1. Mittelwertsatz der Differenzial- Trennung der Variablen, 184
rechnung, 167
2. Mittelwertsatz der Differenzial- Unstetigkeit
rechnung, 169
1. Art, 127
Cauchysches Konvergenzkriterium,
2. Art, 127
64, 77
hebbare, 127
Eindeutigkeits-, 18
Sprungstelle, 127
Einschluss-, 60
untere Schranke, 13
Fundamentalsatz der Algebra, 152
Urbild, 5
Leibniz Kriterium, 81
vollständiges, 5
Rekursions-, 17
Taylorscher Lehrsatz, 177
Vereinigungsmenge, 2
von Bolzano-Weierstraß, 104
Verknüpfung, 9
von Rolle, 166
vollständige Induktion, 19
Zwischenwertsatz, 124
Weierstraß Kriterium, 139
Schlömilchsches Restglied, 177
Wertebereich, 5
Schnittmenge, 2
wohldefiniert, 4
Schwarzsche Ungleichung, 51
Wurzel
Sinus, 144
einer komplexen Zahl, 152
Funktionsgraph, 149
einer reellen Zahl ≥ 0, 41
Sinus Hyperbolicus, 155
Wurzelkriterium, 78
Funktionsgraph, 156
196
Zahl
komplexe, 46
rationale, 34
Zahlen
natürliche, 16
positive, 12
Zerlegung, 110
INDEX
Herunterladen