Analysis 1

Werbung
Analysis 1
WS 2012-2013
Michael Kaltenbäck
Inhaltsverzeichnis
Vorwort
iii
1
Mengen und Abbildungen
1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Die reellen Zahlen
2.1 Algebraische Struktur der reellen Zahlen
2.2 Ordnungsstruktur der reellen Zahlen . .
2.3 Die natürlichen Zahlen . . . . . . . . .
2.4 Der Ring der ganzen Zahlen . . . . . .
2.5 Der Körper Q . . . . . . . . . . . . . .
2.6 Archimedisch angeordnete Körper . . .
2.7 Das Vollständigkeitsaxiom . . . . . . .
2.8 Die komplexen Zahlen . . . . . . . . .
1
1
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
11
16
26
34
39
40
46
Der Grenzwert
3.1 Metrische Räume . . . . . . . . . . . . . .
3.2 Der Grenzwert in metrischen Räumen . . .
3.3 Folgen reeller und komplexer Zahlen . . . .
3.4 Monotone Folgen . . . . . . . . . . . . . .
3.5 Cauchy-Folgen . . . . . . . . . . . . . . .
3.6 Konvergenz in weiteren metrischen Räumen
3.7 Konvergenz gegen unendlich . . . . . . . .
3.8 Unendliche Reihen . . . . . . . . . . . . .
3.9 Konvergenzkriterien . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
51
51
56
61
65
69
70
73
78
83
4
Die Konstruktion der reellen Zahlen
4.1 Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
89
93
5
Geometrie metrischer Räume
5.1 ǫ-Kugeln, offene und abgeschlossene Mengen . . .
5.2 Kompaktheit . . . . . . . . . . . . . . . . . . . . .
5.3 Gerichtete Mengen und Netze . . . . . . . . . . .
5.4 Unbedingte Konvergenz und Umordnen von Reihen
5.5 Grenzwerte von Funktionen . . . . . . . . . . . .
3
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
97
97
104
108
114
123
INHALTSVERZEICHNIS
ii
6 Reelle und komplexe Funktionen
6.1 Stetigkeit . . . . . . . . . . . . . . . . . . . .
6.2 Der Zwischenwertsatz . . . . . . . . . . . . .
6.3 Gleichmäßige Stetigkeit . . . . . . . . . . . . .
6.4 Unstetigkeitsstellen . . . . . . . . . . . . . . .
6.5 Monotone Funktionen . . . . . . . . . . . . . .
6.6 Gleichmäßige Konvergenz . . . . . . . . . . .
6.7 Reell- und komplexwertige Folgen und Reihen
6.8 Die Exponentialfunktion . . . . . . . . . . . .
6.9 Fundamentalsatz der Algebra . . . . . . . . . .
6.10 Weitere wichtige elementare Funktionen . . . .
6.11 Abelscher Grenzwertsatz . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
129
129
136
138
140
143
146
152
158
166
168
172
7 Differentialrechnung
7.1 Begriff der Ableitung . .
7.2 Mittelwertsätze . . . . .
7.3 Der Taylorsche Lehrsatz
7.4 Stammfunktion . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
175
175
182
191
197
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Literaturverzeichnis
205
Index
206
Vorwort
Mit diesem Skriptum, liebe Studenten, möchte ich zu einem reibungslosen Start in ihr
Mathematikstudium beitragen. Den in dieser Vorlesung auftretenden Begriffen, Konzepten und Ergebnissen werden Sie im ganzen Studium immer wieder begegnen. So
Dinge wie Stetigkeit, Differenzierbarkeit und Konvergenz werden als selbstverständlich vorausgesetzt werden.
Bei der Gestaltung dieses Skriptums habe ich versucht darauf zu achten, dass selbiges nicht nur als Lernunterlage, sondern auch zum Nachschlagen in späteren Semestern
verwendet werden kann. Insbesondere findet sich ein ausführlicher Index am Ende des
Skriptums.
Obwohl die erste Analysis Vorlesung inhaltlich nicht viel Spielraum für den Vortragenden lässt, habe ich doch versucht, auf die Dinge besonderes Augenmerk zu legen,
die mir in meiner Arbeit als Mathematiker und im Hinblick auf zukünftige Vorlesungen wichtig scheinen. Ich möchte aber auch betonen, dass das meine ganz persönliche
Sicht der Materie ist. Es kann für Sie daher nur von Nutzen sein, wenn sie auch in
andere Analysis Skripten bzw. Bücher schauen und daraus lernen, um einen größeren
Blickwinkel zu bekommen.
Das ersten Kapitel ist als Einführung in die mathematischen Grundlagen bewusst
kurz gehalten, da diese in der parallel gehaltenen Vorlesung Lineare Algebra 1 ohnehin
ausführlicher behandelt werden, und somit allzu viele Doppelgleisigkeiten vermieden
werden.
Schließlich möchte ich den vielen Kolleginnen und Kollegen aus mittlerweile vier
Analysis Zyklen danken, die mich auf Fehler in den vorherigen Versionen dieses
Skriptums aufmerksam gemacht haben, und somit ein viel weniger holpriges Werk
ermöglicht haben.
Bezüglich der noch versteckten Fehler möchte ich die Leser bitten, mir entdeckte
Druckfehler mit Seiten und Zeilenangabe per Email zu schicken:
[email protected]
Michael Kaltenbäck
Wien, im September 2012
iii
iv
VORWORT
Kapitel 1
Mengen und Abbildungen
1.1 Mengen
Die Objekte der modernen Mathematik sind die Mengen. Obwohl die Logik einen
axiomatischen Zugang zur Mengenlehre bietet, wollen wir uns in dieser Vorlesung auf
den naiven Mengenbegriff stützen. Interessierte Studenten seien auf die Vorlesungen
über axiomatische Mengenlehre verwiesen.
1.1.1 Definition. Eine Menge ist eine Zusammenfassung von bestimmten, wohl unterschiedenen Objekten unserer Anschauung zu einem Ganzen. Die Objekte heißen
Elemente der Menge.
Ist x ein solches Element von M, so schreiben wir x ∈ M. Im Falle, dass x nicht
zu M gehört, schreiben wir x < M. Möglichkeiten Mengen darzustellen sind die
aufzählende Schreibweise:
M = {a, b, c, d, e}, oder M = {1, 2, . . . }
und die beschreibende Schreibweise:
M = {x : x ist ungerade ganze Zahl}.
1.1.2 Definition. Sind A, B Mengen, so sagt man A ist gleich B (A = B), wenn sie die
selben Elemente enthalten. Man sagt A ist eine Teilmenge von B (A ⊆ B), falls jedes
Element von A auch ein Element von B ist. In diesem Fall bezeichnet man auch B als
Obermenge von A (B ⊇ A).
Will man zum Ausdruck bringen, dass dabei A mit B nicht übereinstimmt, so
schreibt man A ( B.
Schreibweisen wie A , B, A ) B, o.ä. sind dann selbsterklärend. Einer bestimmten
Menge werden wir oft begegnen, nämlich der leeren Menge ∅, also der Menge, die
keine Elemente enthält.
Man beachte zum Beispiel, dass die Menge {a, b, c} gleich der Menge {c, a, b, a} ist,
und dass z.B. die Menge {1, 3, 5, . . . } mit
{x : x ist ungerade natürliche Zahl}
übereinstimmt.
1
KAPITEL 1. MENGEN UND ABBILDUNGEN
2
Hat man zwei oder mehrere Mengen, so kann man diese in verschiedener Weise
miteinander verknüpfen.
1.1.3 Definition. Seien A und B zwei Mengen:
Die Menge A ∪ B = {x : x ∈ A oder x ∈ B} heißt die Vereinigungsmenge von A
und B. Für A ∪ B sagt man kurz auch A vereinigt B.
Die Menge A ∩ B = {x : x ∈ A und x ∈ B} heißt die Schnittmenge von A und B.
Man sagt kurz auch A geschnitten B.
Die Menge B \ A = {x : x ∈ B und x < A} ist die Differenz von B und A. Man
sagt kurz auch B ohne A.
Betrachtet man Teilmengen A einer fixen Grundmenge M, so schreiben wir auch
Ac für M \ A und nennen es das Komplement von A in M, kurz A Komplement.
A × B := {(x, y) : x ∈ A, y ∈ B} das kartesische Produkt der Mengen A und B.
Das ist also die Menge, deren Elemente die geordneten Paare sind, deren erste
Komponente zu A und deren zweite Komponente zu B gehört1 . Für A×A schreibt
man auch A2 .
Auch Durchschnitt und Vereinigung von mehr als zwei Mengen kann man analog
definieren. Ist Mi , i ∈ I, eine Familie von Mengen, durch indiziert mit der Indexmenge
I, so ist
\
Mi := {x : x ∈ Mi für alle i ∈ I},
i∈I
[
i∈I
Mi := {x : es gibt ein i ∈ I mit x ∈ Mi }.
Das kartesische Produkt endlich vieler Mengen ist analog wie jenes für zwei Mengen
erklärt. Zum Beispiel ist
A × B × C := {(x, y, z) : x ∈ A, y ∈ B, z ∈ C}.
Für A × A × A schreibt man A3 , u.s.w.
1.1.4 Beispiel.
Einfache Beispiele für Durchschnitts- bzw. Vereinigungsbildung wären:
{1, 2, 3} ∩ {−1, 0, 1} = {1}, {a, b, 7} ∩ {3, 4, x} = ∅,
{2, 3, 4, 5} ∪ {4, 5, 6, 7} = {2, 3, 4, 5, 6, 7}, {a, b, c} ∪ ∅ = {a, b, c}.
Ist M2 = {x ∈ Z : es gibt ein y ∈ Z, sodass x = 2y}, so wäre Z \ M2 gerade die
Menge der ungeraden ganzen Zahlen.
Weiters ist
{1, 2, 3, 4} \ {4, 5, 6, 7} = {1, 2, 3}, {a, b, c} \ ∅ = {a, b, c}.
1 Anm.:
Ist x , y, so ist (x, y) , (y, x).
1.1. MENGEN
3
Bezeichnet man mit 2N die Menge der geraden natürlichen Zahlen, so ist das
kartesische Produkt N × 2N die Menge
N × 2N = {(1, 2), (1, 4), . . ., (2, 2), (2, 4), . . ., (3, 2), (3, 4), . . .}.
1.1.5 Definition. Ist M eine Menge, so bezeichnet man mit P(M) die Menge aller
Teilmengen von M,
P(M) = {A : A ⊆ M}.
Diese Menge heißt die Potenzmenge von M. Sie ist also die Menge, deren Elemente
alle Teilmengen von M sind.
1.1.6 Beispiel. Ist M = {1, 2, 3}, dann ist die Potenzmenge P(M) gleich
P(M) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}.
Die Potenzmenge der Menge N ist schon viel zu groß um sie noch in irgendeiner
aufzählenden Weise anschreiben zu können. Sie enthält ja neben Mengen des Typs
{1, 2, 3}, {4, 6, 7, 8, 1004} usw. auch noch unendliche Mengen wie zum Beispiel 2N oder
{n ∈ N : n ≥ 27} und viele mehr.
1.1.7 Bemerkung. Für das Verknüpfen von Mengen gelten diverse Rechenregeln. Es
gilt zum Beispiel das Distributivgesetz für drei Mengen A, B, C:
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
(1.1)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
Um z.B. (1.1) nachzuweisen beachte man, dass zwei Mengen übereinstimmen, wenn
ein beliebiges Element x genau dann in der einen Menge ist, wenn es auch in der
anderen Menge ist:
Ein x liegt in A ∩ (B ∪ C)
genau dann, wenn
x ∈ A und x ∈ B ∪ C.
Das ist gleichbedeutend mit:
x ∈ A, und x liegt zumindest in einer der Mengen B bzw. C.
Diese Aussage ist aber äquivalent zu:
Zumindest eine der Aussagen - x ∈ A und x ∈ B - oder - x ∈ A und x ∈ C - trifft zu.
Nun ist das dasselbe, wie:
x ∈ A ∩ B oder x ∈ A ∩ C.
Schließlich gilt das genau dann, wenn
x ∈ (A ∩ B) ∪ (A ∩ C).
Den an einem kleinen Abriss des axiomatischen Zugangs zur Mengenlehre interessierten Leser möchte ich hier an die Vorlesung Lineare Algebra verweisen.
KAPITEL 1. MENGEN UND ABBILDUNGEN
4
1.2 Funktionen
1.2.1 Definition. Seien M und N Mengen. Eine Teilmenge f ⊆ M × N wird als Funktion (oder auch als Abbildung) von M nach N bezeichnet, wenn
(i) für alle x ∈ M gibt es ein y ∈ N : (x, y) ∈ f ;
(ii) sind (x, y1 ) ∈ f und (x, y2 ) ∈ f , so folgt y1 = y2 .
Die Menge M wird als Definitionsmenge und die Menge N als Zielmenge bzw. Wertevorrat bezeichnet.
Die Bedingung (i) besagt, dass jedem x (mindestens) ein Funktionswert y zugeordnet wird, man sagt auch f ist überall definiert.
Die Bedingung (ii) besagt, dass einem x höchstens ein Funktionswert zugeordnet
wird. Man sagt auch f ist wohldefiniert.
Eine Funktion von M nach N lässt sich also als eine Vorschrift auffassen, durch die
jedem Element x aus der Menge M in eindeutiger Weise ein Element y aus der Menge
N zugeordnet wird. Man schreibt y = f (x) und bezeichnet y als den Funktionswert von
f an der Stelle x.
Offenbar stimmen zwei Funktionen f und g von M nach N überein, also f = g,
genau dann, wenn f (x) = g(x) für alle x ∈ M.
Sieht man eine Funktion eher als Abbildungsvorschrift, dann unterscheidet man
– obwohl mathematisch das Gleiche – die Funktion als Abbildungsvorschrift und die
Funktion als Teilmenge von M × N, und man bezeichnet diese Teilmenge von M × N
auch als Graph graph f von f .
1.2.2 Beispiel. Sei M die Menge aller Wörter in einem Wörterbuch. N = {1, 2, . . . } sei
die Menge der natürlichen Zahlen. Sei nun f jene Funktion auf M, die jedem Wort die
Anzahl seiner Buchstaben zuweist, d.h.
f (’gehen’) = 5.
1.2.3 Beispiel. Wir haben im Abschnitt über Familien von Mengen Mi , i ∈ I, gesprochen, ohne genau zu sagen, was das bedeutet. Das ist nämlich die Funktion i 7→ Mi von
der Indexmenge I in die Potenzmenge P(M), wobei M eine hinreichend große Menge
ist, die alle Mengen Mi enthält, z.B. M = ∪i∈I Mi .
Als Abbildungsvorschrift gibt man eine Funktion f von M nach N auch oft an als
(
M →
N
f :
.
x 7→ f (x)
Eine der wichtigen Funktionen soll nun derart angegeben werden.
1.2.4 Definition. Ist M eine Menge, so heißt die Abbildung
(
M → M
idM :
x 7→ x
die identische Abbildung auf der Menge M. Daher id M : M → M mit id M (x) = x.
1.2. FUNKTIONEN
5
1.2.5 Definition. Sei f eine Funktion von M nach N und sei A ⊆ M. Die Funktion, die
jedem x ∈ A den Funktionswert f (x) zuweist, heißt Einschränkung von f auf A und
wird mit f |A bezeichnet. Also
f |A = {(x, y) ∈ f : x ∈ A}.
Ist umgekehrt g eine Funktion von A nach N und M ⊇ A, so heißt eine Funktion
f : M → N Fortsetzung von g, falls g = f |A .
1.2.6 Definition. Sei f eine Funktion von M nach N.
Für eine Teilmenge A von M bezeichne
f (A) = {y ∈ N : es gibt ein x ∈ A, sodass f (x) = y},
das Bild der Menge A unter der Abbildung f .
Für f (M) schreibt man auch ran f (vom englischen Wort range). Diese Menge
wird als Wertebereich bzw. Bildmenge von f bezeichnet.
Das vollständige Urbild einer Teilmenge B von N ist die Menge
f −1 (B) = {x ∈ M : f (x) ∈ B}.
Für y ∈ N wird jedes x ∈ f −1 ({y}) als ein Urbild von y bezeichnet.
1.2.7 Bemerkung. Ist f : M → N eine Funktion, so muss die Zielmenge N im Allgemeinen nicht mit der Bildmenge f (M) übereinstimmen. Ist insbesondere B ⊆ N mit
f (M) ⊆ B, so kann man f auch als Funktion von M nach B betrachten.
1.2.8 Beispiel. Betrachte zum Beispiel die Funktion n 7→ 2n von N in N. Natürlich
kann man auch n 7→ 2n als Funktion von N in die Menge aller geraden natürlichen
Zahlen betrachten.
1.2.9 Bemerkung. In manchen Zusammenhängen betrachtet man auch Funktionen, die
nicht überall definiert sind. Das sind Teilmengen von f ⊆ M × N, die nur die Eigenschaft (ii) aus Definition 1.2.1 haben, d.h. dass es zu jedem Wert x ∈ M höchstens
einen – also keinen oder genau einen – Funktionswert y ∈ N gibt.
Eine interessante Menge ist dann offenbar der Definitionsbereich dom f (vom englischen Wort domain) der Funktion f :
dom f = {x ∈ M : es gibt ein y ∈ N, sodass (x, y) ∈ f }.
Betrachte zum Beispiel
f := {(x, y) ∈ N2 : x = 2y}.
(1.2)
Offenbar ist dieses f eine nur auf der Menge der geraden Zahlen definierte Funktion.
Folgende Begriffsbildung ist auf den ersten Blick nicht allzu kompliziert. Sie spielt
aber in der Mathematik eine immens wichtige Rolle.
1.2.10 Definition. Sei f : M → N eine Funktion. f heißt
KAPITEL 1. MENGEN UND ABBILDUNGEN
6
injektiv, wenn gilt
f (x1 ) = f (x2 ) ⇒ x1 = x2 ,
d.h. zu jedem Wert y ∈ N gibt es höchstens ein Urbild. Äquivalent dazu ist, dass
aus x1 , x2 folgt, dass f (x1 ) , f (x2 ).
surjektiv, wenn es zu jedem y ∈ N ein x ∈ M gibt, sodass f (x) = y, oder äquivalent ran f = N.
bijektiv, wenn sie sowohl injektiv als auch surjektiv ist.
1.2.11 Bemerkung. Man beachte, dass die Eigenschaft surjektiv, und somit auch bijektiv, zu sein, ganz wesentlich von der betrachteten Zielmenge der Funktion f abhängt.
Denn ist etwa f : M → N eine beliebige Funktion, und betrachtet man f als
Funktion von M nach f (M) und nicht nach N, so ist f : M → f (M) immer surjektiv.
Vergleiche auch Bemerkung 1.2.7.
1.2.12 Beispiel. Folgende drei Beispiele zeigen insbesondere, dass keine der beiden
Eigenschaften injektiv und surjektiv zu sein, die jeweils andere impliziert.
Sei A die Menge aller in Österreich amtlich registrierten Staatsbürger, und sei f
jene Funktion, die einer Person aus A ihre Sozialversicherungsnummer zuordnet.
Dann ist f : A → N keine surjektive (es gibt ja nur endlich viele Österreicher),
aber sehr wohl eine injektive Funktion, da zwei verschiedene Personen auch zwei
verschiedene Sozialversicherungsnummern haben.
Die Funktion g : A → N, die jeder Person ihre Körpergröße in Zentimeter (gerundet) zuordnet, ist weder injektiv noch surjektiv.
Sei h : N → N die Funktion, die einer Zahl (dargestellt im Dezimalsystem) ihre
Ziffernsumme zuordnet. Diese Funktion ist nicht injektiv (h(11) = 2 = h(2)),
aber sie ist surjektiv, denn ist n ∈ N, so gilt sicherlich
h(11
. . .}
1) = n.
| {z
n Stellen
1.2.13 Lemma. Sei f eine Funktion von M nach N. Ist f bijektiv, so ist
f −1 = {(y, x) ∈ N × M : (x, y) ∈ f }
eine bijektive Funktion von N nach M.
Beweis. Ist y ∈ N, dann existiert ein x ∈ M mit y = f (x), da f surjektiv ist. Also ist
die Forderung (i) von Definition 1.2.1 für f −1 erfüllt. Um auch (ii) nachzuprüfen, sei
(y, x1 ), (y, x2 ) ∈ f −1 . Dann sind (x1 , y), (x2 , y) ∈ f und wegen der Injektivität von f
folgt x1 = x2 .
❑
1.2.14 Bemerkung. Man sieht am obigen Beweis, dass die Inverse f −1 einer injektiven
Funktion f eine nicht notwendig überall definierte Funktion ist, vgl. Bemerkung 1.2.9.
Ihr Definitionsbereich ist gerade ran f . Ist dagegen f nicht injektiv, so ist f −1 nicht
einmal mehr eine nicht überall definierte Funktion.
1.2. FUNKTIONEN
7
Durch unmittelbares Nachprüfen der Definition sieht man, dass die Zusammensetzung von Funktionen wieder eine Funktion ist.
1.2.15 Definition. Seien f : M → N und g : N → P Funktionen. Dann bezeichne g ◦ f
jene Funktion von M nach P, die durch
(g ◦ f )(x) = g( f (x)), x ∈ M,
definiert ist. Man bezeichnet g ◦ f oft auch als die zusammengesetzte Funktion oder als
die Hintereinanderausführung von f und g.
Ist f eine Abbildung von M nach N, so gilt immer f = f ◦ idM = idN ◦ f .
Die Hintereinanderausführung ist assoziativ: Sind f : M → N, g : N → P und
h : P → Q Funktionen so gilt (x ∈ M)
((h ◦ g) ◦ f )(x) = (h ◦ g)( f (x)) = h(g( f (x))) =
h((g ◦ f )(x)) = (h ◦ (g ◦ f ))(x).
Also gilt (h ◦ g) ◦ f = h ◦ (g ◦ f ). Als Konsequenz schreiben wir auch h ◦ g ◦ f dafür.
1.2.16 Bemerkung. Man kann g ◦ f auch als
{(x, z) : ∃y ∈ N, (x, y) ∈ f, (y, z) ∈ g}
(1.3)
schreiben.
Für Mengen M, N, P und beliebige Teilmengen f ⊆ M × N, g ⊆ N × P – also f und g sind nicht notwendigerweise
Funktionen; man spricht von Relationen zwischen M und N bzw. zwischen N und P – kann man vermöge (1.3) auch g ◦ f
definieren. Man spricht vom Relationenprodukt von f und g.
1.2.17 Bemerkung. Sind f und g nicht mehr überall definiert, so muss man bei der
Komposition darauf achten, dass die Definitionsbereiche so zusammenpassen, dass der
Bildbereich von f im Definitionsbereich von g enthalten ist.
1.2.18 Satz. Sei f : M → N eine Funktion.
Ist f : M → N bijektiv, so gilt f −1 ◦ f = id M , f ◦ f −1 = idN .
Ist umgekehrt g : N → M eine Funktion mit
g ◦ f = id M , f ◦ g = idN ,
so ist f bijektiv und es gilt g = f −1 .
Für bijektives f ist f −1 auch bijektiv, wobei ( f −1 )−1 = f .
Sind f : M → N und h : N → P bijektiv, so gilt
(h ◦ f )−1 = f −1 ◦ h−1 .
Beweis. Sei zunächst f bijektiv. Offenbar gilt
( f −1 ◦ f )(x) = x, x ∈ M ,
und
( f ◦ f −1 )(y) = y, y ∈ N ,
(1.4)
8
KAPITEL 1. MENGEN UND ABBILDUNGEN
wodurch f −1 ◦ f = idM , f ◦ f −1 = idN .
Sei nun die Existenz einer Funktion g vorausgesetzt, die (1.4) erfüllt. Zu y ∈ N ist
x = g(y) ein Element aus M, welches f (x) = f (g(y)) = idN (y) = y erfüllt. Also ist f
surjektiv. Aus f (x1 ) = f (x2 ) folgt
x1 = g( f (x1 )) = g( f (x2 )) = x2 ,
womit sich f als injektiv herausstellt. Also ist f bijektiv und hat damit eine Inverse, für
die
g = id M ◦g = ( f −1 ◦ f ) ◦ g = f −1 ◦ ( f ◦ g) = f −1 ◦ idN = f −1
gilt.
Für bijektives f gilt f −1 ◦ f = id M , f ◦ f −1 = idN . Somit kann man das eben
gezeigte auf f −1 : N → M anwenden, um die Bijektivität von f −1 zu folgern. Dabei
gilt ( f −1 )−1 = f .
Seien nun f : M → N und h : N → P bijektiv. Die Funktion e := f −1 ◦ h−1 erfüllt
wegen der Assoziativität der Hintereinanderausführung
e ◦ (h ◦ f ) = f −1 ◦ (h−1 ◦ h) ◦ f = f −1 ◦ idN ◦ f = f −1 ◦ f = idM ,
sowie
(h ◦ f ) ◦ e = h ◦ ( f ◦ f −1 ) ◦ h−1 = h ◦ idN ◦h−1 = h ◦ h−1 = idP .
Nach dem ersten Teil des Satzes gilt e = (h ◦ f )−1 .
❑
Kapitel 2
Die reellen Zahlen
Die reellen Zahlen sind uns anschaulich schon aus der Schule bekannt. Wir wollen im
Folgenden die charakteristischen Eigenschaften der reellen Zahlen sammeln, von denen wir dann sehen werden, dass diese die reellen Zahlen (bis auf isomorphe Kopien)
eindeutig bestimmen. Dass es die reellen Zahlen (also eine Menge mit den charakteristischen Eigenschaften) unter der Annahme der Gültigkeit der Mengenlehre überhaupt
gibt, werden wir später sehen.
2.1 Algebraische Struktur der reellen Zahlen
Zuerst wollen wir uns den Operationen + und ·, also der algebraischen Struktur, zuwenden. Die reellen Zahlen mit diesen Operationen sind ein so genannter Körper:
2.1.1 Definition. Sei K eine nichtleere Menge, und es seien Abbildungen (sogenannte
Verknüpfungen)
+ : K × K → K (Addition)
und
· : K × K → K (Multiplikation)
gegeben. Das Tripel hK, +, ·i heißt Körper, falls es zwei ausgezeichnete Elemente 0, 1 ∈
K gibt, sodass folgende Gesetze (Axiome) gelten. Wir schreiben dabei x + y für +(x, y)
und x · y für ·(x, y).
(a1) Die Addition ist assoziativ:
(x + y) + z = x + (y + z), für alle x, y, z ∈ K.
(a2) 0 ist ein neutrales Element bezüglich +:
x + 0 = x, für alle x ∈ K.
(a3) Jedes Element x ∈ K besitzt ein Inverses −x ∈ K bezüglich +:
x + (−x) = 0, für alle x ∈ K.
(a4) Die Addition ist kommutativ:
x + y = y + x, für alle x, y ∈ K.
9
KAPITEL 2. DIE REELLEN ZAHLEN
10
(m1) Die Multiplikation ist assoziativ:
(x · y) · z = x · (y · z), für alle x, y, z ∈ K.
(m2) 1 ist ein neutrales Element von K \ {0} bezüglich ·:
x · 1 = x, für alle x ∈ K \ {0}.
(m3) Jedes von 0 verschiedene Element x besitzt ein Inverses bezüglich ·:
x · x−1 = 1, für alle x ∈ K \ {0}.
(m4) Die Multiplikation ist kommutativ:
x · y = y · x, für alle x, y ∈ K.
(d) Es gilt das Distributivgesetz:
x · (y + z) = (x · y) + (x · z), für alle x, y, z ∈ K.
2.1.2 Bemerkung. Da hK, +i und hK \ {0}, ·i Gruppen sind, folgt, dass die jeweiligen
neutralen Elemente 0 bzw. 1 eindeutig bestimmt sind1 . Wäre nämlich etwa 0̃ ein weiters
neutrales Element bezüglich +, so folgte aus (a2) und (a4), dass
0 = 0̃ + 0 = 0̃.
Dasselbe gilt für die Inversen −a und a−1 . Wäre etwa ã ein weiteres additiv Inverses zu
a, also a + ã = 0, so folgte
ã = ã + (a + (−a)) = (ã + a) +(−a) = 0 + (−a) = −a.
| {z } | {z }
=0
=0
Somit ist x 7→ −x eine – wie aus unten stehenden Rechenregeln folgt – bijektive Funktion von K auf sich selbst und x 7→ x−1 eine bijektive Funktion von K \ {0} auf sich
selbst. Siehe dazu die Lineare Algebra Vorlesung.
2.1.3 Beispiel. Man betrachte die Menge K = {≬, ⋔}. Die Verknüpfungen + und · seien
gemäß folgender Verknüpfungstafeln definiert.
+
≬
⋔
≬
≬
⋔
⋔
⋔
≬
·
≬
⋔
≬
≬
≬
⋔
≬
⋔
Man erkennt unschwer, dass alle Anforderungen an einen Körper, d.h. Axiome
(a1) − (a4), (m1) − (m4), (d), erfüllt sind, wobei ≬ des neutrale 0 Element bezüglich +
und ⋔ des neutrale Element 1 bezüglich · ist.
Es sei noch bemerkt, dass jeder Körper mindestens zwei Elemente hat, und somit
der hier vorgestellte Körper kleinst möglich ist.
1
Die ausgezeichneten Elemente 0 und 1 sind zunächst von den gleich bezeichneten, bekannten ganzen
Zahlen zu unterscheiden. Sie haben lediglich ähnliche Eigenschaften. Um zu betonen, dass es sich um das
additiv bzw. multiplikativ neutrale Element von K handelt, schreibt man auch 0K bzw. 1K .
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
11
Wir werden xy für x · y und, falls y , 0, für xy−1 oft yx schreiben. Um Klammern zu
sparen, wollen wir auch übereinkommen, dass Punkt- vor Strichrechnung kommt, also
zB. xy + xz = (xy) + (xz). Schließlich werden wir für x + (−y) bzw. (−x) + y auch x − y
bzw. −x + y schreiben.
2.1.4 Lemma. Für einen Körper hK, +, ·i gelten folgende Rechenregeln:
(i) Die Inverse von der Inversen ist die Zahl selbst:
−(−x) = x, x ∈ K und (x−1 )−1 = x, x ∈ K \ {0}.
(ii) −(x + y) = (−x) + (−y), x, y ∈ K.
(iii) x · 0 = 0, x, y , 0 ⇒ x · y , 0 und (xy)−1 = x−1 y−1 , sowie (−x)−1 = −(x−1 ).
Insbesondere (−1)(−1) = 1.
(iv) x(−y) = −xy, (−x)(−y) = xy, x(y − z) = xy − xz.
(v)
ac
bd
=
ac
bd .
Beweis. Exemplarisch wollen wir x · 0 = 0 und −(x + y) = (−x) + (−y) nachweisen.
Wegen (a2) gilt 0 + 0 = 0 und mit (d) damit auch x · 0 = x · (0 + 0) = x · 0 + x · 0.
Addieren wir das nach (a3) existierende additiv Inverse von x · 0, so folgt mit Hilfe von
(a1), dass
0 = x · 0 + (−x · 0) = (x · 0 + x · 0) + (−x · 0) = x · 0 + (x · 0 + (−x · 0)) = x · 0 + 0 = x · 0
Wegen dem Kommutativgesetz und Assoziativgesetz gilt
(x + y) + ((−x) + (−y)) = ((x + y) + (−x)) + (−y) = ((y + x) + (−x)) + (−y) =
(y + (x + (−x))) + (−y) = ((y + 0) + (−y)) = y + (−y) = 0.
Also ist (−x) + (−y) eine additiv Inverse von x + y. Wegen Bemerkung 2.1.2 ist diese
additiv Inverse aber eindeutig. Also (−x) + (−y) = −(x + y).
❑
Schließlich wollen wir noch einige Schreibweisen festlegen: Ist A Teilmenge unseres Körpers K, so sei
−A = {−a : a ∈ A}.
Also ist −A das Bild von A unter der Abbildung − : K → K.
Sind A, B ⊆ K, so sei
A + B = {a + b : a ∈ A, b ∈ B}.
Somit ist A + B das Bild von A × B (⊆ K × K) unter der Abbildung + : K × K → K.
Entsprechend seien A−1 , A − B, etc. definiert.
2.2 Ordnungsstruktur der reellen Zahlen
Eine weitere wichtige Eigenschaft der reellen Zahlen ist die, dass man je zwei Zahlen
x und y der Größe nach vergleichen kann. Dabei ist bekannterweise x < y genau dann,
wenn y − x eine positive reelle Zahle ist. Um diesen Sachverhalt mathematisch zu
fassen, definieren wir
KAPITEL 2. DIE REELLEN ZAHLEN
12
2.2.1 Definition. Sei hK, +, ·i ein Körper und sei P ⊆ K. Dann heißt K (streng genommen hK, +, ·, Pi) ein angeordneter Körper, wenn gilt, dass
2
˙ ∪(−P),
˙
(p1) K = P∪{0}
wobei P, −P disjunkt3 , und beide 0 nicht enthalten;
(p2) x, y ∈ P ⇒ x + y ∈ P;
(p3) x, y ∈ P ⇒ xy ∈ P.
Die Menge P heißt die Menge der positiven Zahlen.
Für x, y ∈ K sagen wir, dass
x kleiner als y ist, in Zeichen x < y, wenn y − x ∈ P;
x größer als y ist, in Zeichen x > y, wenn x − y ∈ P;
x kleiner oder gleich y ist, in Zeichen x ≤ y, wenn x < y oder x = y;
x größer oder gleich y ist, in Zeichen x ≥ y, wenn x > y oder x = y.
2.2.2 Lemma. In einem angeordneten Körper K gelten für beliebige a, b, x, y, z ∈ K
folgende Regeln:
(i) x ≤ x (Reflexivität).
(ii) (x ≤ y ∧ y ≤ x) ⇒ x = y (Antisymmetrie).
(iii) (x ≤ y ∧ y ≤ z) ⇒ x ≤ z (Transitivität).
(iv) x ≤ y ∨ y ≤ x (Totalität).
(v) (x ≤ y ∧ a ≤ b) ⇒ x + a ≤ y + b.
(vi) x ≤ y ⇒ −x ≥ −y.
(vii) (z > 0 ∧ x ≤ y) ⇒ xz ≤ yz und (z < 0 ∧ x ≤ y) ⇒ xz ≥ yz.
(viii) x , 0 ⇒ x2 > 0. Insbesondere: 1 > 0.
(ix) x > 0 ⇒ x−1 > 0 und x < 0 ⇒ x−1 < 0.
(x) 0 < x ≤ y ⇒ ( yx ≤ 1 ≤
y
x
∧ x−1 ≥ y−1 ).
(xi) (0 < x ≤ y ∧ 0 < a ≤ b) ⇒ xa ≤ yb.
(xii) x < y ⇒ x <
x+y
2
< y, wobei 2 := 1 + 1.
Beweis. Wir beweisen exemplarisch (ii), (iii), (viii) und (xii):
(ii): (x ≤ y ∧ y ≤ x) ist per Definitionem dasselbe, wie y − x ∈ P ∪ {0} ∧ x − y ∈ P ∪ {0}.
Also y − x ∈ (P ∪ {0}) ∩ (−P ∪ {0}) = {0}, und damit x = y.
2 Der
Punkt über ∪ soll die Disjunktheit der Mengen anzeigen.
ihr Schnitt ist leer.
3 Also
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
13
(iii): (x ≤ y ∧ y ≤ z) ⇔ (y − x ∈ P ∪ {0} ∧ z − y ∈ P ∪ {0}). Aus (p2) folgt
z − x = (z − y) + (y − x) ∈ P ∪ {0}, also x ≤ z.
(viii): Aus x , 0 folgt x ∈ P ∪ −P. Ist x ∈ P, so folgt wegen (p3), dass x2 = xx ∈ P
und damit x2 > 0. Ist x ∈ −P, so folgt −x ∈ P und wieder wegen (p3), dass x2 = xx =
(−x)(−x) ∈ P.
(xii): Aus x < y und (v) folgt x + x < x + y < y + y. Nun ist wegen dem Distributivgesetz
x + x = x(1 + 1) und y + y = y(1 + 1). Da wegen (p2), 1 + 1 ∈ P, folgt aus (vii), dass
x < x+y
2 < y.
❑
2.2.3 Bemerkung. Die Eigenschaften (i)−(iii) besagen genau, dass ≤ eine Halbordnung
auf K ist. Eigenschaft (iv) bedeutet dann, dass diese Halbordnung sogar eine Totalordnung ist.
Man kann also einen angeordneten Körper als Gerade veranschaulichen, wobei eine
Zahl x genau dann links von einer anderen Zahl y liegt, wenn sie kleiner ist:
0
x
y
K
Abbildung 2.1: Zahlengerade
2.2.4 Definition. Sei K eine Menge und ≤ eine Totalordnung darauf.
Sind x, y ∈ K, so sei max(x, y) das Maximum von x und y. Also max(x, y) = x,
falls x ≥ y, und max(x, y) = y falls y ≥ x. Entsprechend definiert man das
Minimum min(x, y) zweier Zahlen.
Ist A ⊆ K, und gibt es ein a0 ∈ A, sodass a ≤ a0 (a0 ≤ a) für alle a ∈ A, so nennt
man a0 das Maximum (Minimum) von A, und schreibt a0 = max A (a0 = min A).
Zum Maximum (Minimum) sagt man auch größtes (kleinstes) Element.
Ist A ⊆ K, so heißt A nach oben beschränkt, falls es ein x ∈ K gibt, sodass
A ≤ x, sodass also a ≤ x für alle a ∈ A. Jedes x ∈ K mit A ≤ x heißt dabei obere
Schranke von A. Entsprechend heißt eine Teilmenge A nach unten beschränkt,
wenn es eine untere Schranke in K hat, wenn also x ≤ A für ein x ∈ K. Eine nach
oben und nach unten beschränkte Teilmenge heißt beschränkt.
Sei A ⊆ K eine nach oben (unten) beschränkte Teilmenge. Hat nun die Menge
{x ∈ K : A ≤ x} ({x ∈ K : x ≤ A}) aller oberen (unteren) Schranken von A ein
Minimum (Maximum), so heißt dieses Supremum (Infimum) von A und wird mit
sup A (inf A) bezeichnet.
Die Tatsache, dass eine Menge A ⊆ K nicht nach oben (nicht unten) beschränkt
ist wollen wir mit der formalen Gleichheit sup A = +∞ (inf A = −∞) zum
Ausdruck bringen.
2.2.5 Bemerkung. Man sieht leicht, dass jedes Maximum (Minimum) einer Teilmenge
auch Supremum (Infimum) dieser Teilmenge ist. Die Umkehrung gilt im Allgemeinen
nicht.
KAPITEL 2. DIE REELLEN ZAHLEN
14
obere Schranken von M
M
sup M
Abbildung 2.2: Supremum der Menge M
Es kann auch vorkommen, dass eine beschränkte Teilmenge von K weder ein Supremum, noch ein Infimum hat.
2.2.6 Bemerkung. Wenn das Supremum einer Teilmenge A existiert, so gilt gemäß der
Definition A ≤ sup A, und sup A ≤ x für alle oberen Schranken x von A.
Ist umgekehrt y ∈ K mit A ≤ y und y ≤ x für alle oberen Schranken x von A,
so folgt aus A ≤ y, dass y eine obere Schranke von A ist, und aus der zweiten Voraussetzung, dass y das Minimum der oberen Schranken von A ist. Also ist y = sup A.
Entsprechendes lässt sich für das Infimum sagen.
2.2.7 Lemma. Ist A ⊆ B ⊆ K, so gilt
(i) {x ∈ K : A ≤ x} ⊇ {x ∈ K : B ≤ x} und {x ∈ K : x ≤ A} ⊇ {x ∈ K : x ≤ B}.
(ii) Haben A und B ein Maximum (Minimum), so folgt max A ≤ max B
(min A ≥ min B).
(iii) Haben A und B ein Supremum (Infimum), so folgt sup A ≤ sup B (inf A ≥ inf B).
Beweis.
(i) t ∈ {x ∈ K : B ≤ x} bedingt b ≤ t für alle b ∈ B. Wegen A ⊆ B gilt auch a ≤ t für
alle a ∈ A, und daher t ∈ {x ∈ K : A ≤ x}. Die zweite Mengeninklusion beweist
man genauso.
(ii) Das Maximum von B erfüllt definitionsgemäß max B ≥ b für alle b ∈ B, und damit insbesondere max B ≥ a für alle a ∈ A. Wegen max A ∈ A folgt insbesondere
max B ≥ max A. Analog zeigt man min A ≥ min B.
(iii) Definitionsgemäß haben wir sup A = min{x ∈ K : A ≤ x} und
sup B = min{x ∈ K : B ≤ x}. Nach (i) ist {x ∈ K : B ≤ x} ⊆ {x ∈ K : A ≤ x} und
daher nach (ii)
sup A = min{x ∈ K : A ≤ x} ≤ min{x ∈ K : B ≤ x} = sup B.
❑
Ist K ein angeordneter Körper, so gelten für die oben eingeführten Begriffe einfach
nachzuprüfende Rechenregeln:
(i) Aus x ≤ A ⇔ −x ≥ −A folgt, dass A ⊆ K genau dann nach oben (unten)
beschränkt ist, wenn −A nach unten (oben) beschränkt ist.
(ii) min(−A) = − max A, max(−A) = − min A,
(iii) inf(−A) = − sup(A), sup(−A) = − inf(A).
2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN
15
Diese Gleichheiten gelten in dem Sinn, dass die linke Seite des Gleichheitszeichen
genau dann existiert, wenn die rechte existiert.
2.2.8 Beispiel. Seien a, b ∈ K. Dann definiert man die Intervalle
(a, b) := {x ∈ K : a < x < b}, (a, b] := {x ∈ K : a < x ≤ b},
und entsprechend
[a, b] := {x ∈ K : a ≤ x ≤ b}, [a, b) := {x ∈ K : a ≤ x < b}.
Außerdem setzt man (+∞, −∞ sind hier nur formale Ausdrücke)
(−∞, b) := {x ∈ K : x < b}, (−∞, b] := {x ∈ K : x ≤ b},
(a, +∞) := {x ∈ K : a < x}, [a, +∞) := {x ∈ K : a ≤ x}.
Ist a < b, so sind die Mengen (a, b), [a, b], (a, +∞) z.B. nach unten beschränkt.
Nach oben beschränkt sind dagegen nur die ersten beiden. Die Mengen (a, b), (a, b]
haben das Supremum b, aber nur für die Menge (a, b] ist b ein Maximum.
Um etwa einzusehen, dass b = sup(a, b) argumentiert man folgendermaßen:
Zunächst ist wegen der Definition von Intervallen x ≤ b für alle x ∈ (a, b), also
(a, b) ≤ b.
Angenommen es gäbe eine obere Schranke y von (a, b) mit y < b. Im Falle y ≤ a
wäre y ≤ a < a+b
2 < b (vgl. Lemma 2.2.2, (xii)), womit aber y keine obere Schranke
a+b
sein kann, da 2 ∈ (a, b).
Im Falle a < y wäre a < y < y+b
2 < b, womit wiederum y keine obere Schranke sein
y+b
kann, da 2 ∈ (a, b).
Also ist b tatsächlich die kleinste obere Schranke von (a, b), sup(a, b) = b.
2.2.9 Beispiel. Dem Begriff der rationalen Zahlen vorgreifend seien K die rationalen
Zahlen und sei
M = {x ∈ K : x2 < 2}.
Dann hat diese Menge weder Maximum noch Supremum, obwohl sie nach oben beschränkt ist. Siehe dazu Satz 2.7.5.
Wir wollen noch zwei elementare Funktionen auf einem angeordneten Körper betrachten.
2.2.10 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Die Signumfunktion sgn
sei jene Funktion von K nach K, sodass für x ∈ K


1 , falls x ∈ P



0 , falls x = 0 .
sgn(x) = 


 −1 , falls x ∈ −P
Für x , 0 heißt sgn(x) auch das Vorzeichen von x.
Die Betragsfunktion |.| : K → K ist definiert durch
(
x , falls x ∈ P ∪ {0}
|x| =
.
−x , falls x ∈ −P
Sind x, y ∈ K, so bezeichnet man |x − y| auch als den Abstand von x und y.
KAPITEL 2. DIE REELLEN ZAHLEN
16
2.2.11 Lemma. Für x, y ∈ K gilt:
(i) |x| = sgn(x)x.
(ii) |xy| = |x||y|.
(iii) |x + y| ≤ |x| + |y| (Dreiecksungleichung).
(iv) |x + y| ≥ ||x| − |y|| (Dreiecksungleichung nach unten).
(v) max(x, y) =
x+y+|x−y|
,
2
min(x, y) =
x+y−|x−y|
.
2
Beweis. (i) und (ii) folgen ganz leicht, wenn wir die Fälle x > 0, x = 0, x < 0 unterscheiden.
Die Dreiecksungleichung folgt unmittelbar, wenn eine der Zahlen x oder y Null ist.
Sonst unterscheiden wir folgende zwei Fälle:
sgn(x) = sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| + |y|)| = |x| + |y|
sgn(x) = − sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| − |y|)| = ||x| − |y|| ≤ |x| + |y|
Letztere Ungleichung gilt, da sowohl |x| − |y| ≤ |x| + |y|, als auch −(|x| − |y|) = |y| − |x| ≤
|x| + |y|.
Um die Dreiecksungleichung nach unten einzusehen, bemerke
|x| = |(x + y) + (−y)| ≤ |x + y| + |y|,
(2.1)
also |x| − |y| ≤ |x + y|. Analog folgt
|y| ≤ |x + y| + |x|,
also auch |y| − |x| ≤ |x + y|.
Mit einer ähnlichen Fallunterscheidung beweist man die Aussage (v).
❑
2.3 Die natürlichen Zahlen
Ob es die oben diskutierten angeordneten Körper überhaupt gibt, davon haben wir uns
bisher nicht überzeugen können. Um solche Objekte zu konstruieren, wenden wir uns
zunächst den natürlichen Zahlen zu.
Die natürlichen Zahlen sind uns als Objekt des Alltages wohlvertraut, aber ihre
Existenz als mathematisches Objekt ist keine Trivialität. Trotzdem wollen wir diese
voraussetzen. In der Tat folgt sie aus den Axiomen der Mengenlehre.
2.3.1 Definition. Die natürlichen Zahlen sind eine Menge N, in der ein Element 1 ∈
N ausgezeichnet ist,4 und auf der eine Funktion (Nachfolgerabbildung) ′ : N → N
definiert ist, sodass gilt
(S1)
′
ist injektiv.
(S2) Es gibt kein n ∈ N mit n′ = 1.
4 Die Bezeichnung 1 hat zumindest zum gegenwärtigen Zeitpunkt nichts mit der gleichlautenden Bezeichnung für das multiplikative neutrale Element in einem Körper zu tun.
2.3. DIE NATÜRLICHEN ZAHLEN
17
(S3) Ist M ⊆ N, 1 ∈ M und m′ ∈ M für alle m ∈ M, so ist M = N.
Für n′ wollen wir auch n + 1 schreiben.
2.3.2 Bemerkung. Wir wollen anmerken, dass wir zunächst weder die Abbildungen
+, ·, die N × N nach N abbilden, noch die Möglichkeit zwei natürliche Zahlen der
Größe nach zu ordnen, zur Verfügung haben. Obige Festlegung, dass n′ = n + 1 ist nur
symbolisch zu verstehen.
Ehe wir uns an die Definition von Addition und Multiplikation machen, wollen wir
P
uns die Möglichkeit schaffen, Ausdrücke, wie nx, xn , nk=1 c(k) für n ∈ N zu definieren,
wenn z.B. x und c(k) für k ∈ N Elemente eines Körpers sind.
Alle diese Ausdrücke haben gemein, dass sie Funktionen n 7→ φ(n) auf N sind,
wobei φ(1) bekannt ist, und wobei φ(n′ ) bekannt ist, wenn φ(n) es ist. Im Falle von
′
n 7→ xn ist etwa x1 = x und xn = xn · x.
Um einzusehen, warum solche Funktionen eindeutig definiert sind, zeigen wir den
2.3.3 Satz (Rekursionssatz). Sei A eine Menge, a ∈ A, g : A → A (Rekursionsfunktion).
Dann existiert genau eine Abbildung φ : N → A mit φ(1) = a und φ(n′ ) = g(φ(n)).
Beweis. Betrachte alle Teilmengen H ⊆ N × A mit den Eigenschaften
(a) (1, a) ∈ H
(b) Ist (n, b) ∈ H, so gilt auch (n′ , g(b)) ∈ H.
Solche Teilmengen existieren, da z.B. N × A die Eigenschaften (a) und (b). Sei D der
Durchschnitt aller solchen Teilmengen:
\
D :=
H
H erfüllt (a) und (b)
Da (1, a) ∈ H für alle H, die (a) und (b) erfüllen, ist auch (1, a) ∈ D. Ist (n, b) ∈ D, so
gilt (n, b) ∈ H für alle (a) und (b) erfüllenden H. Nach (b) folgt (n′ , g(b)) ∈ H für alle
solchen H, und somit (n′ , g(b)) ∈ D.
Also hat D auch die Eigenschaften (a) und (b), und ist damit die kleinste Teilmenge
mit diesen Eigenschaften.
Wir behaupten, dass D eine Funktion von N nach A ist, also, dass es zu jedem n ∈ N
genau ein b ∈ A gibt, sodass (n, b) ∈ D, vgl. Definition 1.2.1. Dazu reicht es zu zeigen,
dass5
M = {n ∈ N : ∃! b ∈ A, (n, b) ∈ D}
mit N übereinstimmt. Wir prüfen das mit Hilfe von (S 3) nach.
Zunächst ist 1 ∈ M, da einerseits (1, a) ∈ D. Gäbe es andererseits ein weiteres
c ∈ A, c , a mit (1, c) ∈ D, so betrachte D \ {(1, c)}. Klarerweise hat D \ {(1, c)} die
Eigenschaft (a). Wegen (S 2) bleibt auch die Eigenschaft (b) erhalten. Ein Widerspruch
dazu, dass D kleinstmöglich ist.
Nun zeigen wir, dass mit n auch n′ in M liegt. Für n ∈ M gibt es aber genau ein
b ∈ A mit (n, b) ∈ D. Also ist auch (n′ , g(b)) ∈ D. Wäre noch (n′ , c) ∈ D mit c , g(b),
so kann man wieder D \ {(n′ , c)} betrachten. Weil n′ , 1, erfüllt D \ {(n′ , c)} Eigenschaft
(a).
Aus (k, d) ∈ D \ {(n′ , c)} ⊆ D folgt (k′ , g(d)) ∈ D. Ist k , n, so folgt wegen (S 1)
daher auch (k′ , g(d)) , (n′ , c). Ist n = k, so muss wegen n ∈ M die Gleichheit d = b
5 ∃!
steht für: Es gibt genau ein
KAPITEL 2. DIE REELLEN ZAHLEN
18
gelten. Es folgt (k′ , g(d)) = (n′ , g(b)) , (n′ , c). In jedem Fall gilt also (k′ , g(d)) ∈
D \ {(n′ , c)}, und D \ {(n′ , c)} erfüllt auch (b). Das ist wieder ein Widerspruch dazu, dass
D kleinstmöglich ist.
Aus (S 3) folgt M = N. Nach Definition 1.2.1 kann man also D auffassen als Abbildung φ : N → A. Die Eigenschaft (a) bedeutet φ(1) = a, und (b) besagt φ(n′ ) = g(φ(n)).
Wäre φ̃ eine weitere Funktion mit φ̃(1) = a und mit φ̃(n′ ) = g(φ̃(n)), und betrachtet
man φ̃ als Teilmenge D̃ von N × A, so erfüllt D̃ Eigenschaften (a), (b). Weil wir schon
wissen, dass D die kleinste solche Menge ist, folgt D ⊆ D̃. Da aber beide Funktionen
sind, muss D = D̃ bzw. φ = φ̃.
❑
2.3.4 Bemerkung. Satz 2.3.3 rechtfertigt rekursive Definitionen:
Zum Beispiel die Funktion n 7→ xn , wobei x in einem Körper K liegt. Dafür
nehmen wir A = K, a = x und g : K → K, y 7→ yx. Nach Satz 2.3.3 ist dann xn
für alle n ∈ N eindeutig definiert.
Genauso kann man n 7→ nx definieren.
Q
Um n 7→ nk=1 c(k) zu definieren, wenn c : N → K ist, wenden wir Satz 2.3.3
mit A = N × K, a = (1, c(1)) und g : N × K → N × K, (n, x) 7→ (n′ , x · c(n′ )) an,
Q
und definieren nk=1 c(k) als die zweite Komponente von φ(n).
P
Genauso kann man n 7→ nk=1 c(k), n 7→ maxk=1,...,n c(k) und ähnliche Ausdrücke
definieren.
n
P
Für
c(k) schreiben wir auch c(1) + · · · + c(n). Entsprechend setzen wir
k=1
c(1) · · · · · c(n) :=
n
Y
k=1
c(k) und max(c(1), . . . , c(n)) = max c(k) .
k=1,...,n
Als weitere Anwendung des Rekursionssatzes erhalten wir, dass die natürlichen
Zahlen im Wesentlichen eindeutig sind.
2.3.5 Korollar. Seien N und Ñ Mengen mit ausgezeichneten Elementen 1 ∈ N und
1̃ ∈ Ñ und Abbildungen ′ : N → N, ˜ : Ñ → Ñ, sodass für beide die Axiome (S1),
(S2) und (S3) gelten. Dann gibt es eine eindeutige bijektive Abbildung ϕ : N → Ñ mit
g = ϕ(n′ ), n ∈ N.
ϕ(1) = 1̃ und ϕ(n)
Beweis. Wendet man den Rekursionssatz an auf A = Ñ, a = 1̃, und g = ˜, so folgt, dass
g = ϕ(n′ ), n ∈ N.
genau eine Abbildung ϕ : N → Ñ existiert mit ϕ(1) = 1̃ und ϕ(n)
Durch Vertauschung der Rollen von N und Ñ erhält man eine Abbildung ψ : Ñ → N
mit ψ(1̃) = 1 und ψ(x)′ = ψ( x̃), x ∈ Ñ.
Betrachte die Abbildung Φ = ψ ◦ ϕ : N → N. Es gilt Φ(1) = 1 und
g = (ψ ◦ ϕ)(n′ ).
Φ(n)′ = (ψ(ϕ(n)))′ = ψ(ϕ(n))
Die identische Abbildung idN hat die selben Eigenschaften, also folgt nach der
Eindeutigkeitsaussage des Rekursionssatzes Φ = idN . Analog zeigt man ϕ ◦ ψ = idÑ ,
also ist ϕ bijektiv und es gilt ϕ−1 = ψ.
❑
2.3. DIE NATÜRLICHEN ZAHLEN
19
Wenn wir uns den Beweis des Rekursionssatzes nochmals anschauen, so haben wir
gezeigt, dass D eine Funktion auf N ist, es also zu jedem n ∈ N genau ein b ∈ A gibt
mit (n, b) ∈ D, indem wir die Menge M aller in diesem Sinne guten“ n ∈ N hernehmen
”
und davon zeigen, dass sie die Voraussetzungen von (S 3) erfüllen.
Diese Vorgangsweise kann man auf alle Aussagen A(n) ausdehnen, die für alle
natürliche Zahlen n gelten sollen. Das führt zum so genannten:
Prinzip der vollständigen Induktion: Für jedes n ∈ N sei A(n) eine Aussage über die
natürliche Zahl n. Gilt
(i) Induktionsanfang: Die Aussage A(1) ist wahr.
(ii) Induktionsschritt: Für jedes n ∈ N ist wahr, dass aus der Gültigkeit von A(n) die
Gültigkeit von A(n′ ) folgt.
Dann ist die Aussage A(n) für jede natürliche Zahl n richtig.
Um das einzusehen, betrachte man die Menge M aller n ∈ N, für die A(n) richtig
ist. Ist nun A(1) richtig, so ist 1 ∈ M, und aus A(n) ⇒ A(n′ ) sehen wir, dass mit m ∈ M
auch m′ ∈ M. Nach Axiom (S 3) ist M = N. Also ist A(n) für jede natürliche Zahl n
richtig.
Als Anwendung der Beweismethode der vollständigen Induktion bringen wir die
später verwendete Bernoullische Ungleichung.
2.3.6 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, und bezeichnen wir das multiplikative neutrale Element mit 1K , so folgt für x ∈ K, x ≥ −1K , und n ∈ N, dass
(1K + x)n ≥ 1K + nx .
Beweis. Induktionsanfang: Ist n = 1, so besagt die Bernoullische Ungleichung (1K +
x)n = 1K + x ≥ 1K + x, was offenbar stimmt.
Induktionsschritt: Angenommen die Bernoullische Ungleichung sei nun für n ∈ N
richtig. Dann folgt wegen 1K + x ≥ 0, dass
′
(1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 ≥ 1K + n′ x .
❑
Eine andere unmittelbare Anwendung des Beweisprinzipes der vollständigen InP
duktion ist die Verifikation der offensichtlich für Ausdrücke wie nk=1 c(k) geltenden
Rechenregeln. Zum Beispiel das Distributivgesetz
a
n
X
k=1
c(k) =
n
X
(ac(k)).
k=1
P
P
Induktionsanfang: Ist n = 1, so gilt a 1k=1 c(k) = ac(1) = 1k=1 (ac(k)).
Induktionsschritt: Angenommen die Rechenregel gilt für n, so rechnen wir:
a
n′
X
k=1

 n

 n

X

X
′



c(k) = a( c(k) + c(n )) = a  c(k) + ac(n′ ) =
k=1
k=1
KAPITEL 2. DIE REELLEN ZAHLEN
20
n
X
(ac(k)) + ac(n′ ) =
k=1
n′
X
(ac(k)).
k=1
Entsprechend zeigt man auch andere Rechenregeln für solche induktiv definierten Ausdrücke.
Wir kommen nun zur Diskussion der algebraischen Operationen Addition und Multiplikation, sowie der Ordnungsrelation auf N. Ihre Existenz und ihre Eigenschaften
müssen wir nun mit mathematischer Strenge herleiten, d.h. sie alleine aus den Axiomen
(S 1),(S 2),(S 3) mittels logischer Schlüsse zeigen. Hauptinstrument dabei wird wieder
der Rekursionssatz Satz 2.3.3 sein.
2.3.7 Definition. Wir definieren für jedes m ∈ N Abbildungen +m : N → N und
·m : N → N rekursiv:
+m (1) := m′ und +m (n′ ) = (+m (n))′ ,
·m (1) := m und ·m (n′ ) = +m (·m (n)).
Weiters definieren wir Relationen < und ≤ auf N durch
n < m : ⇐⇒ (∃t ∈ N : +t (n) = m),
n ≤ m : ⇐⇒ (n = m) oder (n < m).
Sind m, n ∈ N, so schreibt man
+m (n) =: m + n, ·m (n) =: m · n,
und spricht von der Addition bzw. Multiplikation auf N.
2.3.8 Satz.
Für jedes m ∈ N sind die Abbildungen +m und ·m injektiv, wobei +m (n) , m für
alle n ∈ N.
Die Addition im Bereich N der natürlichen Zahlen erfüllt die Gesetze
Für alle a, b, c ∈ N gilt (a + b) + c = a + (b + c). (Assoziativität)
Für alle a, b ∈ N gilt a + b = b + a. (Kommutativität)
sowie die Kürzungsregel
Sind n, m, k ∈ N und gilt k + m = k + n, so folgt m = n.
Die Multiplikation ist ebenfalls assoziativ, kommutativ und erfüllt die Kürzungsregel. Zusätzlich gilt noch
Für jedes a ∈ N ist a · 1 = 1 · a = a. (Existenz des neutralen Elementes)
Die Addition hängt mit der Multiplikation zusammen über das Distributivgesetz
Für a, b, c ∈ N gilt stets (b + c) · a = (b · a) + (c · a).
Die Relation ≤ ist eine Totalordnung mit 1 als kleinstes Element, und aus m < n
folgt m , n. Zudem gelten folgende Verträglichkeiten mit den Operationen Plus
und Mal:
2.3. DIE NATÜRLICHEN ZAHLEN
21
Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a + c < b + c (a + c ≤ b + c).
Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a · c < b · c (a · c ≤ b · c).
Es gilt weiters
Sind n, m, l ∈ N mit n + l < m + l (n + l ≤ m + l) oder n · l < m · l (n · l ≤ m · l),
so folgt n < m (n ≤ m).
Sind n, m ∈ N, n < m, so gibt es ein eindeutiges t ∈ N, sodass m = n + t.
Wir setzen in diesem Falle
m − n := t.
(2.2)
Sind m, n, t ∈ N, t < n < m, so folgt n − t < m − t.
Sind l, m, n ∈ N, n + m < l, so folgt n < l − m und
l − (m + n) = (l − m) − n.
(2.3)
Beweis.
Zur Assoziativität von +:
Seien k, m ∈ N fest gewählt, wir führen Induktion nach n durch.
Induktionsanfang: (k + m) + 1 = +k (m)′ = +k (m′ ) = k + (m + 1).
Induktionsschritt: Nach Induktionsvoraussetzung gilt (k + m) + n = k + (m + n).
Es folgt
(k + m) + (n′ ) = +k+m (n′ ) = +k+m (n)′ = ((k + m) + n)′ =
= (k + (m + n))′ = +k (m + n)′ = +k ((m + n)′ ) = k + (m + n′ ),
wobei letztere Gleichheit wegen des schon gezeigten Induktionsanfangs folgt.
Zur Kommutativität von +:
Wir zeigen ∀m, n ∈ N : m + n = n + m mittels Induktion nach m.
Induktionsanfang (m = 1): Wir zeigen
∀n ∈ N : 1 + n = n + 1
(2.4)
mittels Induktion nach n. Der Fall n = 1 ist klar, denn 1 + 1 = 1 + 1. Für
den Induktionsschritt n → n′ gehen wir aus von der Induktionsvoraussetzung
1 + n = n + 1. Daraus folgt
n′ + 1 = n′′ = (n + 1)′ = (1 + n)′ = 1 + n′ .
Induktionsschritt (m → m′ ): Wir zeigen
(∀n ∈ N : m + n = n + m) =⇒ (∀n ∈ N : m′ + n = n + m′ ).
Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1.
Nach der bereits bewiesenen Aussage (2.4) mit vertauschten Rollen von m und
n gilt m′ + 1 = 1 + m′ .
Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ + n =
n + m′ und wir erhalten
∗
m′ + n′ = (m′ + n)′ = (n + m′ )′ = (n + m)′′ = (m + n)′′ =
∗
= (m + n′ )′ = (n′ + m)′ = n′ + m′ .
An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m → m′ ) benützt worden.
KAPITEL 2. DIE REELLEN ZAHLEN
22
Zur Injektivität von +m und der Tatsache, dass +m (n) , m, für alle n ∈ N:
Für m = 1 ist +m (n) = n′ . Nach (S 1) ist +1 injektiv und nach (S 2) gilt +1 (n) , 1.
Sei nun m ∈ N und +m injektiv und erfülle +m (n) , m für alle n ∈ N.
Es folgt +m′ (n) = m′ + n = m + (n + 1) = +m (n′ ). Also ist +m′ die Zusammensetzung der injektiven Abbildungen (n → n′ ) und +m und somit selbst injektiv.
Aus m + 1 = m′ = +m′ (n) = (m + n) + 1 folgt wegen der Injektivität von +1 , dass
m = m + n = +m (n) im Widerspruch zur Induktionsvoraussetzung.
Die Kürzungsregeln für + folgt sofort aus der Injektivität von +k .
m < n bedeutet n = m + k mit einem k ∈ N. Aus m = n würde der Widerspruch
m = m + k = +m (k) folgen.
Es gilt a · 1 = 1 · a = a, a ∈ N:
Unmittelbar aus der Definition 2.3.7 folgt a · 1 = ·a (1) = a. Die zweite Gleichheit
zeigen wir mittels Induktion nach a:
Induktionsanfang (a = 1): 1 · a = 1 · 1 = 1 = a.
Induktionsschritt (a → a′ ): Wir nehmen also 1 · a = a an und schließen
1 · (a′ ) = ·1 (a′ ) = +1 (·1 (a)) = +1 (1 · a) = 1 + a = a′ .
Zur Kommutativität von ·:
Wir zeigen ∀m, n ∈ N : m · n = n · m mittels Induktion nach m.
Induktionsanfang (m = 1): Nach dem letzten Punkt gilt ∀n ∈ N : 1 ·n = n = n ·1.
Induktionsschritt (m → m′ ): Wir zeigen
(∀n ∈ N : m · n = n · m) =⇒ (∀n ∈ N : m′ · n = n · m′ ).
Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1.
Wieder nach dem letzten Punkt gilt (m′ ) · 1 = m′ = 1 · m′ .
Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ · n = n · m′
und wir erhalten
m′ · n′ = m′ + (m′ · n) = m′ + (n · m′ ) = (m + 1) + (n + (n · m)) =
∗
(n + 1) + (m + (n · m)) = (n + 1) + (m + (m · n)) =
∗
n′ + (m · n′ ) = n′ + (n′ · m) = n′ · m′ .
An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m → m′ ) benützt worden.
Zum Distributivgesetz:
Vollständige Induktion nach a:
Induktionsanfang (a = 1): Da 1 bezüglich · ein neutrales Element ist, folgt
(b + c) · 1 = b + c = (b · 1) + (c · 1).
Induktionsschritt:
∗
(b + c) · (a + 1) = (b + c) + ((b + c) · a) = (b + c) + ((b · a) + (c · a)) =
(b + (b · a)) + (c + (c · a)) = (b · (a + 1)) + (c · (a + 1)).
An der mit ∗ gekennzeichneten Stelle ist die Induktionsvoraussetzung eingegangen.
2.3. DIE NATÜRLICHEN ZAHLEN
23
Zur Assoziativität von ·:
Wir zeigen a · (b · c) = (a · b) · c mittels Induktion nach b.
Induktionsanfang: a · (1 · c) = a · c = (a · 1) · c.
Induktionsschritt: Nach Induktionsvoraussetzung gilt also (a · b) · c = a · (b · c).
Mittels Distributivgesetz folgt
(a · (b + 1)) · c = ((a · b) + (a · 1)) · c = ((a · b) · c) + ((a · 1) · c) =
(a · (b · c)) + (a · (1 · c)) = a · ((b · c) + (1 · c)) = a · ((b + 1) · c).
Zur Totalität von ≤ und zur Tatsache 1 ≤ n, n ∈ N:
Wir wollen zeigen, dass je zwei n, m ∈ N bezüglich ≤ vergleichbar sind, was wir
mittels Induktion nach m beweisen werden.
Für m = 1 zeigt man, leicht mittels Induktion nach n, dass immer n = 1, oder
∃t ∈ N, n = 1 + t, also immer 1 ≤ n.
Gelte die Vergleichbarkeit von m mit allen n ∈ N. Um sie für m′ zu zeigen,
machen wir eine Fallunterscheidung: Ist m = n, so folgt n + 1 = m′ also n ≤ m′ .
Aus n < m folgt m = n + t für ein t ∈ N, und daher m′ = n + (t + 1), also n < m′ .
Ist n = m + 1, so folgt m′ = n.
Ist schließlich m < n, n , m + 1, so gilt n = m + t mit t , 1. Aus der schon
bewiesenen Vergleichbarkeit mit 1 folgt, dass 1 < t, und somit t = 1 + s, s ∈ N.
Aus der Assoziativität folgt n = m′ + s, also m′ < n.
Die Reflexivität von ≤ ist klar.
Zur Transitivität von < und damit von ≤:
Sei k, l, m ∈ N und k ≤ l, l ≤ m. Ist k = l oder l = m, so sieht man sofort, dass
k ≤ m.
Im Fall k < l, l < m gibt es i, j ∈ N mit k + i = l, l + j = m. Es folgt k + (i + j) = m
und daher k < m.
Die Antisymmetrie von ≤ folgt, da aus n ≤ m und m ≤ n im Falle m , n wegen
dem vorletzten Punkt und wegen der Transitivität von < folgt, dass n < n, was
dem vorletzten Punkt widerspricht.
Zur Verträglichkeit von < mit + und ·:
Sei n < m und k ∈ N. Somit ist n + t = m mit t ∈ N, und es gilt
m + k = (n + t) + k = n + (t + k) = n + (k + t) = (n + k) + t,
sowie
m · k = (n + t) · k = (n · k) + (t · k).
Also folgt n + k < m + k und n · k < m · k.
Die Injektivität von ·k bzw. – was das selbe ist – die Kürzungsregel für · folgt
nun aus den gezeigten Eigenschaften von ≤:
Seien k, m, n ∈ N mit m , n. Wegen der Totalität gilt m < n oder n < m, was mit
der Verträglichkeit von < mit · bedingt, dass k · m < k · n oder k · n < k · m und
somit k · m , k · n.
KAPITEL 2. DIE REELLEN ZAHLEN
24
Zum Kürzen in Ungleichungen:
Aus n + l < m + l folgt definitionsgemäß m + l = (n + l) + k für ein k ∈ N. Gemäß
der Kürzungsregel für + folgt m = n + k und somit n < m.
Sei nun n ·l < m·l. Wäre m ≤ n, so folgte aus dem letzten Punkt der Widerspruch
m · l ≤ n · l. Wegen der Totalität muss n < m.
Zur Wohldefiniertheit von m − n:
Sei also n < m. Definitionsgemäß ist m = n + t für ein t ∈ N. Ist nun m = n + s für
eine weitere Zahl s ∈ N, so folgt aus der Kürzungsregel für + und n + t = n + s,
dass s = t. Also ist die m − n := t eindeutig dadurch definiert, dass n + t = m.
Zur Verträglichkeit von < mit −:
Ist t < n < m, so folgt n = t + s und m = n + l für s, l ∈ N, und weiters
m = t + (l + s). Somit ist m − t = l + s und n − t = s, und daher n − t < m − t.
Zu (2.3):
Die Ungleichung m + n < l bedeutet l = (m + n) + k für ein eindeutiges k ∈ N.
Definitionsgemäß ist daher k = l − (m + n). Andererseits gilt wegen m < m + n < l
auch l = m + s, s ∈ N.
Wegen der Kürzungsregel für + folgt s = n + k, und somit n < s = l − m.
Außerdem ist k = s − n = (l − m) − n.
❑
2.3.9 Bemerkung. Ist Ñ eine Kopie von N wie in Korollar 2.3.5, und werden die Operationen + und ·, sowie ≤ auf Ñ genauso definiert wie auf N, so sieht man leicht, dass
die nach Korollar 2.3.5 existierende Abbildung ϕ : N → Ñ mit den Operationen und ≤
verträglich ist:
ϕ(n + m) = ϕ(n) + ϕ(m), ϕ(n · m) = ϕ(n) · ϕ(m),
n ≤ m ⇔ ϕ(n) ≤ ϕ(m).
Folgende Eigenschaft der natürlichen Zahlen werden wir oft verwenden.
2.3.10 Satz. Ist ∅ , T ⊆ N, so hat T ein Minimum.
Beweis. Wir nehmen das Gegenteil an. Sei
M = {n ∈ N : ∀m ∈ T ⇒ n < m}.
Es ist nun 1 ∈ M, da sonst 1 das Minimum von T wäre.
Ist n ∈ M, und m ∈ T , so gilt n < m. Daraus schließen wir n + 1 ≤ m. Wäre
n + 1 = m0 für ein m0 ∈ T , so hätte T das Minimum m0 . Wir nehmen aber an, dass es
ein solches nicht gibt.
Also gilt immer n + 1 < m, m ∈ T , bzw. n + 1 ∈ M. Nach (S 3) folgt M = N. Ist
m ∈ T ⊆ N, so folgt m ∈ M und daher der Widerspruch m < m.
❑
Diese Eigenschaft der natürlichen Zahlen können wir hernehmen, um folgende
Varianten des Prinzips der vollständigen Induktion zu rechtfertigen. Zum Beispiel ist
2.3. DIE NATÜRLICHEN ZAHLEN
25
es oft zielführender die folgende Version zu benützen:
Sei A(n), n ∈ N, eine Aussage über die natürliche Zahl n. Gilt
(i) Die Aussage A(1) ist wahr.
(ii) Es gelte für jedes n ∈ N, n > 1: Ist die Aussage A(m) wahr für alle m < n, so ist
auch A(n) wahr.
Dann ist die Aussage A(n) für alle n ∈ N wahr. Denn wäre die Menge der n ∈ N, für
die A(n) falsch ist, nicht leer, so hätte sie ein Minimum n. Wegen (i) ist aber n > 1,
wegen (ii) ist A(n) wahr, was offensichtlich ein Widerspruch ist.
Ist eine Aussage erst ab einer gewissen Zahl n0 richtig, so kann man folgende
Varianten des Prinzips der vollständigen Induktion anzuwenden versuchen:
Gilt
(i) Die Aussage A(n0 ) ist wahr.
(ii) Ist A(n) wahr für ein n ≥ n0 , dann ist A(n + 1) wahr.
oder gilt
(i) Die Aussage A(n0 ) ist wahr.
(ii) Ist n > n0 und ist A(m) wahr für alle m mit n0 ≤ m < n, dann ist A(n) wahr.
Dann ist die Aussage A(n) für alle n ≥ n0 richtig.
2.3.11 Beispiel. Mit fast dem selben Beweis wie in Lemma 2.3.6 jedoch mit einer
Induktion bei 2 startend zeigt man, dass für x ≥ −1K und x , 0 sowie n ≥ 2 sogar
(1K + x)n > 1K + nx .
Induktionsanfang: Ist n = 2, so gilt wegen x2 > 0, dass (1K +x)2 = 1K +2x+x2 > 1K +2x.
Induktionsschritt: Angenommen die Ungleichung ist für n ∈ N richtig. Dann folgt
wegen 1K + x ≥ 0 und nx2 > 0, dass
′
(1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 > 1K + n′ x .
Klarerweise haben unendliche Teilmengen von N kein Maximum. Aber wie intuitiv
klar ist, hat jede endliche Teilmenge einer total geordneten Menge ein Maximum und
ein Minimum. Um das exakt nachzuweisen, benötigen wir die genaue Definition von
Endlichkeit.
2.3.12 Definition. Eine nichtleere Menge M heißt endlich, wenn es ein k ∈ N und eine
bijektive Funktion f : {n ∈ N : n ≤ k} → M gibt. Die Zahl k ist dann die Mächtigkeit
von M 6 . Man sagt auch, dass M genau k Elemente hat. Die leere Menge nennen wir
auch endlich, und ihre Mächtigkeit sei Null.
6
Damit die Mächtigkeit wohldefiniert ist, muss man noch zeigen, dass es im Fall k1 , k2 keine bijektive Funktion von {n ∈ N : n ≤ k1 } auf {n ∈ N : n ≤ k2 } gibt, was sich durch vollständige Induktion
bewerkstelligen lässt.
KAPITEL 2. DIE REELLEN ZAHLEN
26
2.3.13 Bemerkung. Man zeigt elementar durch vollständige Induktion nach der
Mächtigkeit der endlichen Menge M, dass alle ihre Teilmengen auch endlich sind.
2.3.14 Lemma. Jede endliche nichtleere Teilmenge M einer total geordneten Menge hT, ≤i hat ein Minimum und ein Maximum, das wir mit min(M) bzw. mit max(M)
bezeichnen.
Insbesondere gilt diese Aussage für endliche Teilmengen von angeordneten
Körpern und von N.
Beweis. Hat M nur ein Element, d.h. M = {m}, so ist klarerweise m das Maximum von
M.
Angenommen alle M̃ ⊆ T mit n Elementen haben ein Maximum. Hat nun M ⊆ T
genau n + 1 Elemente und ist m1 ∈ M, so hat M \ {m1 } genau n Elemente und laut
Induktionsvoraussetzung ein Maximum m2 ∈ M \ {m1 }. Da hT, ≤i eine Totalordnung
ist, gilt m1 ≤ m2 oder m1 ≥ m2 . Im ersten Fall ist dann m2 das Maximum von M und
im zweiten ist m1 das Maximum von M.
❑
Eine immer wieder verwendete Tatsache ist im folgenden Lemma vermerkt.
2.3.15 Lemma. Sei M ⊆ N nicht endlich. Dann gibt es eine streng monoton wachsende
Bijektion φ von N auf M. Für eine solche gilt immer φ(n) ≥ n.
Beweis. Sei g : M → M definiert durch g(s) = min{m ∈ M : m > s}, und sei
a = min M. Man beachte, dass g(s) für alle s ∈ M definiert ist, da {m ∈ M : m > s}
voraussetzungsgemäß niemals leer ist.
Nach dem Rekursionssatz gibt es eine eindeutige Abbildung φ : N → M mit φ(1) =
a = min M und so, dass φ(n + 1) = g(φ(n)) = min{m ∈ M : m > φ(n)}.
Offensichtlich gilt φ(n + 1) > φ(n). Daraus folgt durch vollständige Induktion, dass
φ(l) > φ(n), wenn l > n. Also ist φ streng monoton wachsende und somit auch injektiv.
Durch vollständige Induktion zeigt man auch leicht, dass φ(n) ≥ n für alle n ∈ N.
Wäre ein m1 ∈ M nicht im Bild von φ, so ist klarerweise m1 > min M = φ(1).
Angenommen m1 > φ(n). Dann ist m1 ∈ {m ∈ M : m > φ(n)} und wegen m1 ,
φ(n + 1) = min{m ∈ M : m > φ(n)} muss m1 > φ(n + 1).
Es folgt φ(n) < m1 für alle n ∈ N, was aber φ(m1 ) ≥ m1 widerspricht.
❑
2.4 Der Ring der ganzen Zahlen
Im Bereich der natürlichen Zahlen haben wir zuletzt Operationen + und · definiert. Ist
m < n, so haben wir auch n − m ∈ N definiert. Wir wollen nun aus den natürlichen Zahlen die ganzen Zahlen Z konstruieren, und die Operationen + und · auf Z so fortsetzen,
dass wir einen Ring hZ, +, ·i erhalten. Die Menge Z zu definieren, ist kein Problem.
2.4.1 Definition. Seien N1 und N2 zwei disjunkte Kopien der natürliche Zahlen, und
sei 0 ein Element, das in keiner dieser Mengen enthalten ist7 . Wir definieren
˙ ∪N
˙ 2.
Z := N1 ∪{0}
7 Man
kann z.B. für N j einfach die Menge N × { j} hernehmen, und für 0 das Element (1, 3)
2.4. DER RING DER GANZEN ZAHLEN
27
Ist ϕ : N1 → N2 eine bijektive Abbildung wie in Korollar 2.3.5, so definieren wir eine
Abbildung − : Z → Z


ϕ(n) , falls



0 , falls
−n = 


 ϕ−1 (n) , falls
n ∈ N1
n=0
n ∈ N2
Schreiben wir nun N für N1 , so gilt
˙ ∪N.
˙
Z = −N∪{0}
Man erkennt unschwer, dass − eine Bijektion ist, die mit sich selber zusammengesetzt
die Identität ergibt, also eine Involution ist.
Nun definieren wir die Operationen auf Z in der Art und Weise, wie wir sie der
Anschauung nach erwarten.
2.4.2 Definition. Für n ∈ N setzen wir sgn(n) := 1, sgn(−n) := −1, sgn(0) = 0 sowie
|n| := n, | − n| := n und |0| := 0. Weiters sei + : Z × Z → Z definiert durch


p + q , p, q ∈ N





−(|p|
+
|q|) , −p, −q ∈ N





p
−
|q| , p, −q ∈ N, p > −q






−(|q|
−
p) , p, −q ∈ N, p < −q



−(|p|
−
q) , −p, q ∈ N, − p > q ,
p + q := 




q
−
|p|
, −p, q ∈ N, − p < q





0
, q = −p






p
,
q=0




q , p=0
und · : Z × Z → Z durch


|p| · |q| ,



−(|p|
· |q|) ,
p · q := 



0 ,
q, p , 0, sgn(q) = sgn(p)
q, p , 0, sgn(q) = − sgn(p) .
q=0∨ p=0
Sind p, q ∈ Z, so schreibt man wie schon zuvor für p + (−q) meist p − q.
2.4.3 Satz. hZ, +, ·i ist ein kommutativer Integritätsring mit Einselement. Es gilt also:
Die Addition ist kommutativ und assoziativ, 0 ist ein bzgl. + neutrales Element
und −p ist das zu p ∈ Z bzgl. + inverse Element. Also gelten (a1)-(a4) von
Definition 2.1.1.
Die Multiplikation ist kommutativ und assoziativ, und 1 ist ein bzgl. · neutrales
Element. Also gelten (m1),(m2),(m4) von Definition 2.1.1.
Es gilt das Distributivgesetz.
Aus p , 0 ∧ q , 0 folgt pq , 0 (Integritätseigenschaft).
Beweis. Seien p, q ∈ Z. Zunächst folgen p + q = q + p und p · q = q · p unmittelbar aus
der Definition und eben der Tatsache, dass diese Operationen auf N kommutativ sind.
KAPITEL 2. DIE REELLEN ZAHLEN
28
Ebenfalls unmittelbar aus der Definition sieht man, dass p + 0 = p und p · 1 = p.
Also ist 0 ein bezüglich + und 1 ein bezüglich · neutrales Element. Genauso elementar
verifiziert man p + (−p) = 0 und p · q , 0, wenn p und q beide , 0.
Es bleibt die Assoziativität und das Distributivgesetz nachzuprüfen. Das ist in
der Tat mühsam und durch zahlreiche Fallunterscheidungen zu bewerkstelligen. Wir
wollen daher nur r + (q + p) = (r + q) + p im exemplarischen Fall r, q ∈ N, − p ∈ N
betrachten:
Ist |p| > r + q, so folgt (r + q) + p = −(|p| − (r + q)), und nach (2.3) ist dieser
Ausdruck gleich −((|p| − q) − r). Wegen |p| − q > r und |p| > q folgt definitionsgemäß
−((|p| − q) − r) = r + (−(|p| − q)) = r + (p + q).
Im Falle |p| = r + q gilt einerseits (r + q) + p = 0 und andererseits wegen |p| > q
und |p| − q = r (siehe (2.2)), dass r + (q + p) = r + (−(|p| − q)) = 0.
Sei nun |p| < r + q. Dann folgt (r + q) + p = (r + q) − |p| =: k ∈ N. Also ist k jene
Zahl, sodass |p| + k = r + q.
Ist q > |p|, so gilt andererseits r + (q + p) = r + (q − |p|), und wegen den bekannten
Rechenregeln auf N, |p| + (r + (q − |p|)) = r + q, also k = r + (q + p).
Wenn q = |p|, so folgt r+(q+ p) = r, und ebenfalls |p|+r = r+q, d. h. k = r+(q+ p).
Ist schließlich q < |p|, so folgt r + (q + p) = r + (−(|p| − q)). Da |p| < r + q folgt
r > |p| − q, und somit r + (−(|p| − q)) = r − (|p| − q) =: l ∈ N. Das ist also jene Zahl,
sodass (|p| − q) + l = r. Addiert man hier q und verwendet die Assoziativität von + auf
N, so folgt |p| + l = r + q, also l = k.
❑
2.4.4 Bemerkung. In Integritätsringen gilt die Kürzungsregel:
m , 0, xm = ym ⇒ y = x,
denn aus xm − ym = (x − y)m = 0 folgt ja x − y = 0.
Wir benötigen noch eine Totalordnung auf Z, welche ≤ auf N erweitert.
2.4.5 Definition. Wir definieren für p, q ∈ Z
q < p ⇔ p − q ∈ N und q ≤ p ⇔ q < p ∨ q = p.
(2.5)
Man sieht leicht ein, dass mit ≤ eine Totalordnung auf Z definiert ist, die ≤ auf N
erweitert, und die mit den Operationen + und · verträglich ist.
2.4.6 Bemerkung. Wenn man sich an die Definition eines angeordneten Körpers in
Definition 2.2.1 erinnert, so haben wir die Existenz einer Teilmenge P ⊆ K verlangt,
die (p1) - (p3) erfüllt. Genau diese Situation haben wir hier mit P = N, nur, dass Z kein
Körper, sondern ein Ring ist.
Die von uns definierte Totalordnung ≤ auf Z erfüllt nun auch alle Eigenschaften,
die für die entsprechende Totalordnung auf einem angeordneten Körper gelten (vgl.
Lemma 2.2.2). Ausgenommen sind nur die Eigenschaften, die sich auf die multiplikativ
Inverse beziehen.
Die ganzen Zahlen sind eindeutig in dem Sinn, dass wenn Z̃ neben Z eine weitere Menge versehen mit einer Involution −̃ : Z̃ → Z̃, mit Operationen +̃, ˜· und einer
2.4. DER RING DER GANZEN ZAHLEN
29
Relation ≤˜ ist, sodass Z̃ eine Kopie Ñ der natürlichen Zahlen enthält, Z̃ geschrieben
werden kann als die disjunkte Vereinigung von −Ñ, {0} und Ñ, die Operationen +̃ und ˜·
wie in Definition 2.4.2 durch die entsprechenden Operationen auf Ñ (siehe Bemerkung
2.3.9) definiert sind, und sodass ≤˜ wie in (2.5) definiert ist, es eine eindeutige Bijektion
φ : Z → Z̃ gibt, sodass
φ(−p) = −φ(p), φ(1) = 1̃, φ(n + 1) = φ(n)+̃1̃, p ∈ Z, n ∈ N.
Um das zu zeige, setzt man einfach die Bijektion ϕ aus Korollar 2.3.5 zu einer
Bijektion φ von Z auf Z̃ gemäß der Forderung φ(−p) = −φ(p) fort. Die erhaltene
Bijektion Z → Z̃ ist mit +, ·, − und ≤ verträglich. Siehe dazu auch Bemerkung 2.3.9.
Wir haben im Abschnitt über die natürlichen Zahlen für eine Zahl x aus einem
Körper ihre Potenzen xn , n ∈ N definiert (siehe Bemerkung 2.3.4). Das wollen wir auf
Z ausdehnen.
2.4.7 Definition. Sei hK, +, ·i ein Körper. Für eine ganze Zahl p und eine Zahl x ∈
K, x , 0 definieren wir
 p

x
, falls
p ∈N



1
,
falls
p =0 .
xp = 


 1 , falls −p ∈ N
−p
x
Für x ∈ K \ {0}, p, q ∈ Z gelten die aus der Schule bekannten Rechenregeln:
x p xq = x p+q , (x p )q = x pq , x−p =
1
.
xp
(2.6)
Den Beweis für diese Rechenregeln führt man mittels vollständige Induktion für
p, q ∈ N, und dann durch Fallunterscheidung für den allgemeinen Fall p, q ∈ Z.
2.4.8 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, so gilt für n ∈ N und x, y ≥ 0
x < y ⇔ xn < yn ,
und für x, y > 0
x < y ⇔ x−n > y−n .
Beweis. Zunächst zeigt man leicht durch vollständige Induktion und mit Hilfe von
(p3), dass aus 0 < t immer 0 < tn folgt.
Ist x < y, so folgt im Falle x = 0 daher xn = 0 < yn . Ist 0 < x < y, so zeigt man
n
x < yn durch vollständige Induktion:
Für n = 1 ist xn < yn offensichtlich. Gilt xn < yn , so folgt aus Lemma 2.2.2 und der
rekursiven Definition von xn (siehe Bemerkung 2.3.4)
xn+1 = xn · x < yn · x < yn · y = yn+1 .
Ist umgekehrt xn < yn , so muss x < y, da sonst y ≤ x, und aus dem eben bewiesenem
yn ≤ xn folgte.
Die letzte Behauptung folgt sofort aus x < y ⇔ x−1 > y−1 für alle x, y > 0.
❑
KAPITEL 2. DIE REELLEN ZAHLEN
30
Also ist x 7→ xn eine streng monoton wachsende Funktion und somit injektive
Funktion von P ∪ {0} nach P ∪ {0}. Wir werden später sehen, dass diese Funktionen in
vollständig angeordneten Körpern auch surjektiv sind.
Für p ∈ Z, p < 0 ist x 7→ x p eine streng monoton fallende Funktion und somit eine
injektive Funktion von P nach P.
Eine alternative Konstruktion von Z
Wir wollen in diesem Abschnitt einen alternativen Zugang zu den ganzen Zahlen vorstellen. Der Vorteil dieser vordergründig
aufwendigeren Methode ist, dass die Beweise der Rechengesetze struktureller und kürzer sind.
2.4.9 Definition. Sei ∼⊆ (N × N)2 die Relation
(x, n) ∼ (y, m) : ⇐⇒ x + m = y + n .
2.4.10 Lemma. Die Relation ∼ ist eine Äquivalenzrelation.
Beweis. Die Reflexivität und Symmetrie ist klar. Um zu zeigen, dass ∼ transitiv ist, seien (x, n) ∼ (y, m) und (y, m) ∼ (z, k)
gegeben. Dann gilt x + m = y + n und y + k = z + m. Es folgt
(x + k) + m = (x + m) + k = (y + n) + k = (y + k) + n = (z + m) + n = (z + n) + m ,
und wegen der Kürzungsregel in N daher x + k = z + n; also (x, n) ∼ (z, k).
❑
2.4.11 Definition. Wir bezeichnen mit Z die Faktormenge (N × N)/∼ .
Auf Z definieren wir algebraische Operationen + und · . Die Vorgangsweise dazu ist, zunächst Addition und
Multiplikation auf N × N zu definieren, und diese dann auf Z zu übertragen.
+:
(
(
(N × N)2
((x, n), (y, m))
·:
(N × N)2
((x, n), (y, m))
N×N
(x + y, n + m)
→
7→
→
7
→
N×N
(xy + nm, xm + ny)
2.4.12 Lemma. Die Operationen + und · auf N × N sind kommutativ, assoziativ und es gilt das Distributivgesetz.
Beweis. Seien (x, n), (y, m) ∈ N × N. Dann ist
(x, n) + (y, m) = (x + y, n + m) = (y + x, m + n) = (y, m) + (x, n) ,
(x, n) · (y, m) = (xy + nm, xm + ny) = (yx + mn, yn + mx) = (y, m) · (x, n) .
Sei zusätzlich (z, k) ∈ N × N. Dann gilt
(x, n) + (y, m) + (z, k) = (x + y, n + m) + (z, k) = (x + y) + z, (n + m) + k =
= x + (y + z), n + (m + k) = (x, n) + (y, m) + (z, k) .
Die Gültigkeit der Assoziativität der Multiplikation sowie des Distributivgesetzes rechnet man ähnlich, aber deutlich
mühsamer, nach.
❑
Um diese Operationen auf Z übertragen zu können benötigen die Verträglichkeit mit der Relation ∼.
2.4.13 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt, dass auch
(x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gegeben. Dann gilt
(x + y) + (n̂ + m̂) = (x + n̂) + (y + m̂) = ( x̂ + n) + (ŷ + m) = ( x̂ + ŷ) + (n + m) ,
und wir sehen, dass (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂).
2.4. DER RING DER GANZEN ZAHLEN
31
Um die Aussage für · zu zeigen, betrachten wir zuerst (x, n) ∼ ( x̂, n̂) und ein (y, m). Dann gilt
(xy + nm) + ( x̂m + n̂y) = (x + n̂)y + ( x̂ + n)m =
= ( x̂ + n)y + (x + n̂)m = ( x̂y + n̂m) + (xm + ny) ,
und wir erhalten (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Wegen der Kommutativität von · folgt auch, dass für (x, n) und (y, m) ∼ (ŷ, m̂)
stets (x, n) · (y, m) ∼ (x, n) · (ŷ, m̂) gilt. Die Aussage für · folgt nun aus der Transitivität von ∼ angewandt auf
(x, n) · (y, m) ∼ ( x̂, n̂) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
❑
2.4.14 Definition. Auf Z seien zwei algebraische Operationen + und · definiert, indem wir für a, b ∈ Z Paare (x, n), (y, m) ∈
N × N so wähle, dass [(x, n)]∼ = a und [(y, m)]∼ = b, und dann
setzen.
a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼
Dass durch diese Vorschrift tatsächlich zwei Funktionen wohldefiniert sind, verdanken wir gerade der Verträglichkeitsaussage in Lemma 2.4.13.
Im nächsten Schritt definieren wir die Relation ≤ auf Z. Dazu sei
(x, n) ≤ (y, m) : ⇐⇒ x + m ≤ y + n,
(x, n), (y, m) ∈ N × N .
2.4.15 Lemma. Die Relation ≤ auf N × N ist reflexiv, transitiv und total, dh. (x, n) ≤ (y, m) ∨ (y, m) ≤ (x, n) für alle
(x, n), (y, m) ∈ N × N. Zudem gilt
(x, n) ≤ (y, m) und (y, m) ≤ (x, n) ⇐⇒ (x, n) ∼ (y, m).
(2.7)
Außerdem folgt aus (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), dass
(x, n) ≤ (y, m) ⇐⇒ ( x̂, n̂) ≤ (ŷ, m̂) .
Beweis. Die Reflexivität folgt unmittelbar aus der Definition. Sei (x, n) ≤ (y, m) und (y, m) ≤ (z, k). Dann gilt x + m ≤ y + n
und y + k ≤ z + m, und wir erhalten
(x + k) + m = (x + m) + k ≤ (y + n) + k = (y + k) + n ≤ (z + m) + n = (z + n) + m .
Daraus folgt nun x + k ≤ z + n, d.h. (x, n) ≤ (z, k). Die Totalität folgt aus der Tatsache, dass ≤ eine Totalordnung auf N ist.
Da (x, n) ≤ (y, m) und (y, m) ≤ (x, n) mit x + m = y + n gleichbedeutend ist, folgt (2.7). Die letzte Aussage folgt
unmittelbar aus (2.7) und der Transitivität von ≤ auf N × N.
❑
Wegen der letzte Aussage von Lemma 2.4.15, ist folgende Definition unabhängig von den Repräsentanten der Restklassen a bzw. b. Wir erhalten damit eine Totalordnung auf Z.
2.4.16 Definition. Seien a, b ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ . Dann schreiben wir a ≤ b, falls (x, n) ≤ (y, m).
2.4.17 Satz. Die Addition und Multiplikation auf Z sind kommutativ, assoziativ und es gilt das Distributivgesetz. Das
Element 0 := [(1, 1)]∼ bzw. 1 := [(2, 1)]∼ ist neutrales Element bezüglich + bzw. ·. Jedes Element besitzt ein additiv Inverses
Element. Für · gilt die Kürzungsregel, d.h. ist a, b, c ∈ Z, c , 0, und gilt a · c = b · c, so folgt a = b.
Die Relation ≤ ist eine Totalordnung. Für alle a, b, c ∈ Z, a ≤ b, gilt auch a + c ≤ b + c und, falls c ≥ 0, auch
a · c ≤ b · c. Umgekehrt, ist c > 0 und a · c ≤ b · c, so folgt a ≤ b.
Die natürlichen Zahlen N sind in Z injektiv eingebettet vermöge der Abbildung
φ:
(
N
x
→
7
→
Z
[(x + 1, 1)]∼
Diese Einbettung erhält Addition, Multiplikation und Ordnung.
Beweis. Die Gültigkeit von Assoziativität, Kommutativität sowie Distributivität folgt wegen Lemma 2.4.12.
Sei a = [(x, n)]∼ ∈ Z. Dann gilt
a + 0 = [(x, n)]∼ + [(1, 1)]∼ = [(x + 1, n + 1)]∼ = [(x, n)]∼ = a ,
sowie
a · 1 = [(x, n)]∼ · [(2, 1)]∼ = [(2x + n, x + 2n)]∼ = [(x, n)]∼ = a ,
KAPITEL 2. DIE REELLEN ZAHLEN
32
also ist 0 neutrales Element der Addition und 1 neutrales Element der Multiplikation. Setze â := [(n, x)]∼ , dann gilt
a + â = [(x, n)]∼ + [(n, x)]∼ = [(x + n, n + x)]∼ = [(1, 1)]∼ = 0 ,
also hat a ein additives Inverses, nämlich â.
Wegen Lemma 2.4.15 ist ≤ auf Z eine Totalordnung. Seien a, b, c ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ , c = [(z, k)]∼ . Dann
gilt
a + c ≤ b + c ⇐⇒ (x + z, n + k) ≤ (y + z, m + k) ⇐⇒ x + z + m + k ≤ y + z + n + k
⇐⇒ x + m ≤ y + n ⇐⇒ a ≤ b .
Sei nun angenommen, dass a < b, d.h. dass x+m < y+n, und dass c ≥ 0, d.h. z ≥ k. Dann gibt es t ∈ N mit y+n = (x+m)+t.
Wegen z ≥ k folgt tz ≥ tk und daher auch (y + n)z = (x + m)z + tz ≥ (x + m)z + tk und schließlich
(x + m)k + (y + n)z ≥ (x + m)z + tk + (x + m)k = (x + m)z + (y + n)k .
Also haben wir (xk + nz) + (yz + mk) ≥ (xz + nk) + (yk + mz), und das heißt gerade a · c ≤ b · c.
Sei umgekehrt a · c ≤ b · c, d.h. nach obiger Rechnung (x + m)k + (y + n)z ≥ (x + m)z + (y + n)k, und c > 0, d.h. z > k.
Angenommen es wäre a > b, d.h. x + m > y + n. Dann gibt es t ∈ N mit (y + n) + t = x + m. Damit erhalten wir
tk + (y + n)(k + z) ≥ tz + (y + n)(z + k)
und daraus tk ≥ tz und schließlich den Widerspruch k ≥ z. Also muss a ≤ b gelten. Die Kürzungsregel für · folgt aus der
gerade bewiesenen Kürzungsregel für ≤.
Die Injektivität der Abbildung φ gilt, da (x + 1, 1) ∼ (y + 1, 1) gerade x + 2 = y + 2 bedeutet, und damit x = y folgt.
Außerdem gilt
φ(x) + φ(y) = [((x + 1) + (y + 1), 1 + 1)]∼ = [((x + y) + 1, 1)]∼ = φ(x + y) ,
φ(x) · φ(y) = ((x + 1)(y + 1) + 1, (x + 1) + (y + 1)) ∼ =
(xy + x + y + 1 + 1, x + y + 1 + 1) ∼ = [(xy + 1, 1)]∼ = φ(xy) ,
φ(x) ≤ φ(y) ⇐⇒ (x + 1) + 1 ≤ (y + 1) + 1 ⇐⇒ x ≤ y .
❑
Folgendes Resultat liefert insbesondere, dass die hier konstruierten ganzen Zahlen eine Kopie der eingangs konstruierten ganzen Zahlen sind.
2.4.18 Proposition. Versteht man die natürlichen Zahlen via φ eingebettet in Z wie in Satz 2.4.17, so gilt
˙ ∪N,
˙
Z = −N∪{0}
wobei diese drei Mengen disjunkt sind. Dabei gilt p ∈ N ⇔ p > 0 und p ∈ −N ⇔ p < 0.
Definieren wir sgn(x) = 0, wenn x = 0, sgn(x) = 1, wenn x ∈ N, und sgn(x) = −1, wenn x ∈ −N, und setzen
|p| = sgn(p)p, so gilt für p, q ∈ Z
und

p+q





−(|p| + |q|)





p − |q|







 −(|q| − p)
−(|p| − q)
p+q=




q − |p|





0





p



q


|p| · |q|



−(|p| · |q|)
p·q=



0
,
,
,
,
,
,
,
,
,
,
,
,
p, q ∈ N
−p, −q ∈ N
p, −q ∈ N, p > −q
p, −q ∈ N, p < −q
−p, q ∈ N, − p > q
−p, q ∈ N, − p < q
q = −p
q=0
p=0
,
q, p , 0, sgn(q) = sgn(p)
q, p , 0, sgn(p) = − sgn(p)
q= 0∨p =0
.
Schließlich gilt p < q ⇔ q − p ∈ N und p ≤ q ⇔ (p = q ∨ p < q).
Beweis. Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ > 0 = [(1, 1)]∼ , so gilt x + 1 > n + 1. Damit ist x − n ∈ N, und wegen (x − n + 1, 1) ∼ (x, n)
folgt φ(x − n) = [(x, n)]∼ . Umgekehrt ist für y ∈ N φ(y) = [(y + 1, 1)]∼ > [(1, 1)]∼ = 0.
Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ < 0 = [(1, 1)]∼ , so folgt aus den Rechenregeln von Satz 2.4.17 0 > −[(x, n)]∼ = [(n, x)]∼ .
Aus dem schon Bewiesenen folgt −[(x, n)]∼ = −φ(n − x), wobei n − x ∈ N. Umgekehrt ist für y ∈ N −φ(y) = [(1, y + 1)]∼ <
[(1, 1)]∼ = 0.
Also kann man N mit {p ∈ Z : p > 0} und −N mit {p ∈ Z : p < 0} identifizieren.
˙ ∪N,
˙
Z = −N∪{0}
folgt nun aus der Tatsache, dass ≤ eine Totalordnung ist.
Die restlichen Aussagen folgen aus der Definition von |.|, sgn(.) und der Tatsache, dass p < q ⇔ 0 < q − p, siehe Satz
2.4.17.
❑
2.4. DER RING DER GANZEN ZAHLEN
33
Dividieren mit Rest
Ausgerüstet mit unserem Grundwissen über die natürlichen und die ganzen Zahlen können wir nun in diesem Kapitel das
aus der Schule bekannte Dividieren mit Rest mathematisch rechtfertigen.
2.4.19 Satz. Sind m ∈ N, n ∈ Z, so gibt es eindeutige Zahlen l ∈ Z und r ∈ {0, . . . , m − 1}8 , sodass n = ml + r. Dabei ist
n ≥ 0 genau dann, wenn l ≥ 0.
Beweis. Sei zunächst n ∈ N ∪ {0} beliebig. Da die Menge aller l ∈ N ∪ {0} mit m · l + m > n nicht leer ist (n ist sicher in dieser
Menge), hat sie ein Minimum (Variante von Satz 2.3.10). Ist l = 0, so muss n ∈ {0, . . . , m − 1}, und ist l > 0, so folgt wegen
der Minimalität ml = m(l − 1) + m ≤ n < ml + m. Also muss immer n = ml + r für ein l ∈ N ∪ {0} und ein r ∈ {0, . . . , m − 1}.
Ist nun auch n = ml̂+ r̂ für lˆ ∈ N∪{0} und r̂ ∈ {0, . . . , m−1}, so folgt ml̂+m > n und wegen der Minimalitätseigenschaft
von l auch lˆ ≥ l. Andererseits gilt ml̂ ≤ n, weshalb nicht l̂ > l sein kann, da sonst n ≥ ml̂ = ml + m(l̂ − l) ≥ ml + m wäre.
Somit gibt es eindeutige l ∈ N ∪ {0} und r ∈ {0, . . . , m − 1}, sodass n = ml + r.
Für n < 0 ist −n−1 ≥ 0. Somit gibt es eindeutige s ∈ N∪{0}, t ∈ {0, . . . , m−1}, sodass −n−1 = sm+t = (s+1)m+(t−m),
und daher sodass −n = (s + 1)m + (t − m + 1), bzw. n = −(s + 1)m + (−t + m − 1). Setzen wir l = −(s + 1) und r = −t + m − 1,
so sehen wir, dass n = ml + r für ein eindeutiges l < 0 und ein eindeutiges r ∈ {0, . . . , m − 1}.
❑
2.4.20 Bemerkung. Die geraden (ungeraden) Zahlen sind genau alle ganzen Zahlen der Form 2k (2k + 1) für ein k ∈ Z. Aus
Satz 2.4.19 folgt insbesondere, dass jede gegebene ganze Zahl gerade oder ungerade ist, wobei aus der Eindeutigkeitsaussage
˙
in Satz 2.4.19 folgt, dass sie nicht gleichzeitig gerade und ungerade sein kann. Also gilt Z = 2Z∪(2Z
+ 1). Entsprechendes
gilt, wenn man 2 durch eine andere natürliche Zahl m ersetzt, wobei dann
˙
˙
Z = mZ∪(mZ
+ 1)∪˙ . . . ∪(mZ
+ m − 1).
2.4.21 Definition. Eine Zahl q ∈ N teilt eine Zahl p ∈ N, falls es ein m ∈ N gibt, sodass mq = p. Wir schreiben q|p dafür.
Teilt q die Zahl p nicht, so schreiben wir q ∤ p. Außerdem setzen wir p : q := m9 .
Eine Zahl p ∈ N \ {1} heißt Primzahl, wenn p nur von 1 und p geteilt wird. Die Menge aller Primzahlen sei P.
2.4.22 Fakta.
Falls q|p, so folgt aus mq = p und 1 ≤ m, dass q ≤ p, wobei q = p genau dann, wenn m = 1.
Um zu sehen, ob eine Zahl p eine Primzahl ist, genügt es somit zu überprüfen, dass q ∤ p für alle q ∈ N, 1 < q < p.
Man sieht sofort, dass 2, 3, 5, . . . Primzahlen sind.
Ist n ∈ N \ {1} und M = {r ∈ N \ {1} : r|n}, so ist M nicht leer, da zumindest n ∈ M. Gilt M = {n}, so ist n
definitionsgemäß eine Primzahl. Anderenfalls sei m das kleinste Element von M und k so, dass km = n. Nun ist
m eine Primzahl, da sonst m = pq mit 1 < p, q < m, und weiter p(qk) = n. Es wäre p ∈ M im Widerspruch zur
Minimalität von m.
Insbesondere wird jede Zahl in N \ {1} von einer Primzahl geteilt.
2.4.23 Lemma. Seien a, b ∈ N und p ∈ P. Gilt p|(ab), so folgt p|a ∨ p|b.
Beweis. Sei T ⊆ P die Menge aller Primzahlen, sodass die Aussage für gewisse a, b ∈ N falsch ist. Wir bringen die Annahme
T , ∅ auf einen Widerspruch.
Sei also T , ∅ und p die kleinste Zahl in T (siehe Satz 2.3.10). Somit gibt es a, b ∈ N mit p ∤ a ∧ p ∤ b, aber p|(ab),
bzw. pn = ab für ein n ∈ N. Daher ist
S = {n ∈ N : ∃a, b ∈ N : p ∤ a ∧ p ∤ b ∧ pn = ab},
die Menge aller solchen n nicht leer. Somit hat auch diese Menge ein Minimum s. Seien c, d ∈ N, sodass p ∤ c, p ∤ d und
ps = cd. Aus den ersten beiden Tatsachen folgt c, d , p, c, d , 1, und daraus zusammen mit der Tatsache, dass p eine
Primzahl ist, folgt s > 1.
Nun muss c < p sein, da sonst c − p ∈ N und damit p(s − d) = (c − p)d, was s − d ∈ N implizieren und somit der
Minimalität von s widersprechen würde. Genauso gilt d < p.
Daraus schließen wir wegen ps = cd auf s < p. Gemäß Fakta 2.4.22 gibt es eine Primzahl p′ ≤ s < p, sodass p′ |s, d.h.
s = p′ s′ für ein s′ ∈ N, s′ < s. Somit folgt p′ (ps′ ) = cd, also p′ |(cd). Wegen der Minimalität von p muss p′ |c oder p′ |d.
O.B.d.A. sei c = c′ p′ , c′ ∈ N, womit
p′ (ps′ ) = p′ (c′ d) und daraus ps′ = c′ d
folgt. Nun widerspricht das aber ebenfalls der Minimalität von s.
❑
2.4.24 Satz. Ist n ∈ N \ {1}, so gibt es eindeutige Primzahlen p1 , . . . , pm ∈ P und Exponenten e1 , . . . , em ∈ N, sodass
e
n = p11 · . . . pemm .
Diese Zerlegung heißt Primfaktorzerlegung.
8 {0, . . . , m
9 Da
− 1} steht für {k ∈ N ∪ {0} : 0 ≤ k < m}
wir in Z kürzen dürfen, ist p : q eindeutig definiert.
(2.8)
KAPITEL 2. DIE REELLEN ZAHLEN
34
Beweis. Wir zeigen zuerst die Existenz einer solche Zerlegung. Für n = 2 ist diese klar.
Angenommen für ein n > 2 gibt es zu allen k < n, k ≥ 2 eine solche Zerlegung. Nach Fakta 2.4.22 gibt es eine Primzahl
p ≤ n mit p|n. Ist n = p, so haben wir unsere Zerlegung. Ist p < n, so folgt n = (n : p)p, wobei nach Voraussetzung
n : p (< n) eine solche Zerlegung hat. Somit hat auch n eine solche Zerlegung. Nach einer Variante des Prinzips der
vollständigen Induktion gibt es eine Primfaktorzerlegung für alle n ∈ N \ {1}.
Die Eindeutigkeit ist für n = 2 wieder klar, da alle Produkte der Form (2.8) einen Wert > 2 ergeben, außer für m = 1
und e1 = 1, p1 = 2.
Angenommen mit einem n > 2 ist die Primfaktorzerlegung eindeutig für alle k < n, k ≥ 2, und angenommen
f
f
e
q11 · . . . ql l = n = p11 · . . . pemm ,
e
mit l, m ∈ N und e1 , . . . , em , f1 , . . . , fl ∈ N sowie p1 , . . . , pm , q1 , . . . , ql ∈ P. Insbesondere gilt q1 |p11 · . . . pemm . Nach Lemma
2.4.23 muss q1 |p j und daher q1 = p j für ein j ∈ {1, . . . , m}. Durch Umnummerierung können wir q1 = p1 annehmen. Es
folgt
f
e −1
f −1
q11 · . . . ql l = n : q1 = p11 · . . . pemm .
Ist n : q1 = 1, so muss n = p1 = q1 und l = 1 = m, e1 = 1 = f1 . Sonst folgt wegen 1 < n : q1 < n aus unserer Annahme,
dass auch l = m und e j = f j sowie p j = q j , j = 1, . . . , l.
❑
2.5 Der Körper Q
Oben haben wir den kommutativen Integritätsring hZ, +, ·i konstruiert. Diesen werden
wir nun zu einem angeordneten Körper, dem Körper der rationalen Zahlen erweitern,
und damit sehen, dass es zumindest einen angeordneten Körper gibt.
Der Grundgedanke der folgenden Konstruktion entspringt der Tatsache, dass in
einem Körper qp11 = qp22 genau dann, wenn p1 q2 = p2 q1 .
2.5.1 Definition. Sei ∼⊆ (Z × N)2 die Relation
(x, n) ∼ (y, m) : ⇐⇒ xm = yn .
2.5.2 Lemma. Die Relation ∼ ist eine Äquivalenzrelation.
Beweis. Die Reflexivität und Symmetrie sind offensichtlich. Sei nun (x, n) ∼ (y, m) und
(y, m) ∼ (z, k) dann gilt also xm = yn und yk = zm. Es folgt
(xk)m = (xm)k = (yn)k = (yk)n = (zm)n = (zn)m ,
und da hZ, +, ·i ein Integritätsring ist, gilt die Kürzungsregel, und wir erhalten xk = zn,
d.h. (x, n) ∼ (z, k).
❑
2.5.3 Definition. Wir bezeichnen mit Q die Menge (Z × N)/∼ aller Äquivalenzklassen.
Q heißt der Körper der rationalen Zahlen.
Um auf Q die algebraischen Operationen + und · zu definieren, definieren wir
zunächst Addition und Multiplikation auf Z × N, und übertragen diese dann durch
Faktorisieren auf Q.
(
(Z × N)2 → Z × N
+:
((x, n), (y, m)) 7→ (xm + yn, nm)
(
(Z × N)2 → Z × N
·:
((x, n), (y, m)) 7→ (xy, nm)
2.5. DER KÖRPER Q
35
Die Motivation für unsere Definition ergibt sich aus den Regeln der Bruchrechnung.
x y
xm yn
xm + yn x y
xy
+ =
+
=
,
· =
.
n m nm mn
nm
n m nm
2.5.4 Lemma. Für die Verknüpfungen +, · gilt das Kommutativ-, Assoziativ- und Distributivgesetz.
Beweis. Die Gesetze gelten, da man sie leicht auf die Gültigkeit dieser Gesetze auf Z
zurückführt. Zum Beispiel gilt das Assoziativgesetz wegen
((x, n) + (y, m)) + (z, k) = (xm + yn, nm) + (z, k) = ((xm + yn)k + z(nm), (nm)k) =
(x(mk) + (yk + zm)n, n(mk)) = (x, n) + ((y, m) + (z, k)).
❑
Um Q anordnen zu können, definieren wir noch
(
(Z × N) → Z
sgn :
.
(x, n) 7→ sgn(x)
2.5.5 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt sgn((x, n)) = sgn(( x̂, n̂))
und
(x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben. Zunächst folgt aus xn̂ = x̂n und
n, n̂ ∈ N, dass sgn((x, n)) = sgn(x) = sgn( x̂) = sgn(( x̂, n̂)). Weiters gilt
(xm + yn)n̂m = xmn̂m + ynn̂m =
= (xn̂ − x̂n) mm + x̂nmm + ynn̂m = ( x̂m + yn̂)nm ,
| {z }
=0
also (x, n) + (y, m) ∼ ( x̂, n̂) + (y, m). Wegen der Kommutativität folgt daraus mit vertauschter Notation, dass für ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) stets auch ( x̂, n̂) + (y, m) ∼
( x̂, n̂) + (ŷ, m̂). Wegen der Transitivität folgt
(x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂) .
Bei der Multiplikation geht man analog vor. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben.
Dann gilt
xyn̂m = (xn̂ − x̂n) ym + x̂nym = x̂ynm ,
| {z }
=0
also (x, n)·(y, m) ∼ ( x̂, n̂)·(y, m). Wegen der Kommutativität folgt daraus mit vertauschter Notation, dass für ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) stets auch ( x̂, n̂) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂).
Wegen der Transitivität folgt schließlich
(x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) .
❑
KAPITEL 2. DIE REELLEN ZAHLEN
36
2.5.6 Definition. Auf Q seien zwei algebraische Operationen + und · dadurch definiert, dass wir für a, b ∈ Q Paare (x, n), (y, m) ∈ Z×N mit [(x, n)]∼ = a und [(y, m)]∼ = b
wählen, und sgn(a) := sgn((x, n)) sowie
a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼
setzen.
Wegen Lemma 2.5.5 hängen sgn(a), a + b und a · b nicht von den gewählten Repräsentanten (x, n) bzw. (y, m) ab.
2.5.7 Satz. Setzt man nun P = {a ∈ Q : sgn(a) = 1}, so ist hQ, +, ·, Pi ist ein angeordneter Körper.
Dabei ist [(0, 1)]∼ das neutrale Element bzgl. +,
[(1, 1)]∼ das neutrale Element bezüglich ·.
Zu [(x, n)]∼ ∈ Q ist [(−x, n)]∼ das additiv Inverse, und
zu [(x, n)]∼ ∈ Q \ {0} ist [(sgn(x)n, |x|)]∼ das multiplikativ Inverse.
Außerdem gilt
[(x, n)]∼ ≤ [(y, m)]∼ ⇔ xm ≤ ny.
(2.9)
Die ganzen Zahlen Z sind in Q eingebettet durch
(
Z → Q
φ:
x 7→ [(x, 1)]∼
Diese Einbettung erhält Addition, Multiplikation und Ordnung.
Schließlich hat Q die Eigenschaft, dass die Teilmenge φ(N) von Q keine obere
Schranke hat.
Beweis. Die Gültigkeit der Rechenregeln wie Kommutativität, Assoziativität und Distributivität ergibt sich aus den entsprechenden Regeln für + und · auf Z × N.
Für a = [(x, n)]∼ ∈ Q gilt
a + [(0, 1)]∼ = [(x + 0, n · 1)]∼ = a, a · [(1, 1)]∼ = [(x · 1, n · 1)]∼ = a .
Weiters hat man für b := [(−x, n)]∼
a + b = [(xn − xn, nn)]∼ = [(0, nn)]∼ = [(0, 1)]∼ = 0 .
Sei nun a , 0, d.h. (x, n) / (0, 1) oder äquivalent x , 0. Mit c := [(sgn(x)n, |x|)]∼ folgt
ac = [(sgn(x)xn, n|x|)]∼ = [(1, 1)]∼.
Wegen sgn([(−x, n)]∼) = sgn(−x) = − sgn([(x, n)]∼) und sgn([(x, n)]∼) = 0 ⇔ x =
0 ⇔ [(x, n)]∼ = [(0, 1)]∼ gilt für a ∈ Q
a∈P
⇔ sgn(a) = 1
a ∈ {0} ⇔ sgn(a) = 0
a ∈ −P ⇔ sgn(a) = −1
Daraus folgt sofort
˙ ∪˙ − P,
Q = P∪{0}
2.5. DER KÖRPER Q
37
wobei das eine Vereinigung paarweiser disjunkter Mengen ist.
Aus sgn([(x, n)]∼ + [(y, m)]∼) = sgn(xm + yn) und sgn([(x, n)]∼ · [(y, m)]∼) = sgn(xy)
erhalten wir, dass a, b ∈ P die Tatsache a + b, a · b ∈ P nach sich zieht. Somit ist
hQ, +, ·, Pi ein angeordneter Körper, und wir haben damit eine Totalordnung ≤ auf Q.
(2.9) folgt aus
[(y, m)]∼ − [(x, n)]∼ = [(yn − xm, mn)]∼ ∈ {0} ∪ P ⇔ sgn(yn − xm) ≥ 0 ⇔ xm ≤ yn.
Betrachte nun die Abbildung φ : Z → Q. Diese ist injektiv, denn (x, 1) ∼ (y, 1) gilt
genau dann, wenn x = y. Dass φ die algebraischen Operationen erhält, rechnet man
leicht nach. Die Verträglichkeit mit der Ordnung gilt, da wegen (2.9)
x ≤ y ⇔ x · 1 ≤ y · 1 ⇔ [(x, 1)]∼ ≤ [(y, 1)]∼ ⇔ φ(x) ≤ φ(y).
Angenommen [(x, n)]∼ ist eine obere Schranke von φ(N), also mn ≤ x für alle
m ∈ N. Das ist aber offensichtlich falsch, wenn x ≤ 1 und man zum Beispiel m = 2
setzt. Ist x > 1, so erhält man mit m = x2 den Widerspruch x ≤ xn ≤ 1.
❑
x
n
Wir werden im Folgenden für die rationale Zahl [(x, n)]∼ stets das Symbol schreiben. Dieses Symbol drückt tatsächlich die Division von x durch n aus, denn man hat
[(x, 1)]∼ = [(x, n)]∼ · [(n, 1)]∼
Wir sehen insbesondere, dass jede rationale Zahl der Quotient von zwei ganzen Zahlen
ist.
Nun wollen wir zeigen, dass jeder angeordnete Körper die rationalen Zahlen, und
damit insbesondere auch die ganzen Zahlen, enthält.
2.5.8 Proposition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann gibt es eine eindeutige Abbildung φ : Q → K, die nicht identisch gleich 0K ist, und welche mit der Addition
und Multiplikation verträglich ist. Diese Abbildung ist dann injektiv und auch mit −
sowie mit den Ordnungen < und ≤ verträglich.
Beweis.
Für n ∈ N und x ∈ K haben wir im Abschnitt über die natürlichen Zahlen eine
Funktion n 7→ nx von N nach K rekursiv durch 1x = x und (n′ )x = nx + x
definiert; siehe Bemerkung 2.3.4. Nun nehmen wir für x ∈ K das multiplikativ
neutrale Element 1K von K, und bezeichnen mit φ : N → K die entsprechende
Funktion n 7→ n1K , welche offensichtlicherweise φ(1) = 1K und φ(n + 1) =
φ(n) + 1K erfüllt.
Mit vollständiger Induktion nach m zeigt man leicht, dass φ(n + m) = φ(n) + φ(m)
und φ(n · m) = φ(n) · φ(m) für alle n, m ∈ N.
Wegen 1K ∈ P (siehe Lemma 2.2.2) sieht man ebenfalls mit vollständiger Induktion, dass φ(n) ∈ P für alle n ∈ N. Insbesondere gilt immer φ(n) , 0K .
Nun setzen wir φ auf Z dadurch fort, dass wir φ(0) = 0K und φ(−n) = −φ(n), n ∈
N setzen. Man beweist durch Fallunterscheidungen mit der in Definition 2.4.2
angegebenen Form von + und · auf Z auf elementare Art und Weise, dass diese
Fortsetzung die Addition und Multiplikation erhält.
Wegen (p, q ∈ Z)
p < q ⇔ q − p ∈ N ⇔ φ(q − p) = φ(q) − φ(p) ∈ P ⇔ φ(p) < φ(q)
ist φ auch mit der Ordnung verträglich.
KAPITEL 2. DIE REELLEN ZAHLEN
38
Da ganz Q von den Quotienten
φ durch die Vorschrift
x
n
mit x ∈ Z, n ∈ N, ausgeschöpft wird, lässt sich
φ
x
n
:=
φ(x)
φ(n)
zu einer Abbildung von Q nach K fortsetzen. Man beachte hier, dass aus nx = n̂x̂
φ(x)
φ( x̂)
folgt, dass xn̂ = x̂n und daher φ(x)φ(n̂) = φ( x̂)φ(n) bzw. φ(n)
= φ(n̂)
. Also ist diese
Abbildung wohldefiniert.
Diese Fortsetzung erhält ebenfalls die Addition und Multiplikation, denn für
x y
n , m ∈ Q gilt
φ
x
+
φ
x
·
n
xm + yn φ(xm + yn)
y
=φ
=
=
m
nm
φ(nm)
y
x
φ(x)φ(m) + φ(y)φ(n) φ(x) φ(y)
+φ
,
=
+
=φ
φ(n)φ(m)
φ(n) φ(m)
n
m
xy φ(xy)
y
=φ
=
=
n m
nm
φ(nm)
x y φ(x) φ(y)
φ(x)φ(y)
·φ
.
=
·
=φ
φ(n)φ(m) φ(n) φ(m)
n
m
Sie erhält auch die Ordnung, denn es gilt
x
y
φ(x)
φ(y)
<
⇐⇒ xm < yn ⇐⇒ φ(x)φ(m) < φ(y)φ(n) ⇐⇒
<
.
n m
φ(n) φ(m)
Es folgt insbesondere, dass φ injektiv ist.
Um die Eindeutigkeit von φ nachzuweisen, sei φ̃ eine weitere mit Addition und
Multiplikation verträgliche Abbildung, sodass φ̃(x) , 0 für zumindest ein x ∈ Q.
Aus φ̃(x)φ̃(1) = φ̃(x1) = φ̃(x) folgt φ̃(1) = 1K , und aus φ̃(0) + φ̃(0) = φ̃(0 + 0) =
φ̃(0) folgt φ̃(0) = 0K .
Durch vollständige Induktion zeigt man, dass φ̃(n) = φ(n) für n ∈ N. Aus φ̃(−n)+
φ̃(n) = φ̃(0) = 0K = φ(−n) + φ(n) folgt φ̃(p) = φ(p), p ∈ Z. Schließlich folgt aus
φ̃( np )φ̃(n) = φ̃(p) = φ(p) = φ( np )φ(n), dass φ̃ = φ.
❑
Das letzte Resultat zeigt uns, dass die rationalen Zahlen in einem gewissen Sinn
der kleinste angeordnete Körper ist.
Wenn wir im Folgenden von den natürlichen (ganzen, rationalen) Zahlen als Teilmenge eines angeordneten Körpers sprechen, so wollen wir darunter die gemäß Proposition 2.5.8 existierende isomorphe Kopie φ(N) = {n1k : n ∈ N}, φ(Z), bzw. φ(Q)
verstehen und nicht mehr z.B. zwischen n und n · 1K unterscheiden.
2.5.9 Bemerkung. Die am Beginn vom Beweis von Proposition 2.5.8 konstruierte Einbettung φ der natürlichen Zahlen in
einen angeordneten Körper lässt sich auch auf beliebigen Körpern K durchführen.
Dabei kann es passieren, dass φ(n) = 0K für ein n ∈ N. Das kleinste derartige n ist dann eine Primzahl und heißt die
Charakteristik des Körpers K.
Ist hingegen immer φ(n) , 0K , so sagt man, dass K von Charakteristik Null ist. Insbesondere sind angeordnete Körper
von Charakteristik Null. Man sieht leicht ein, dass dann φ injektiv ist, und man denselben Beweis wie den von Proposition
2.5.8 hernehmen kann, um zu zeigen, dass sich Q injektiv in jeden Körper der Charakteristik Null einbetten lässt.
2.6. ARCHIMEDISCH ANGEORDNETE KÖRPER
39
2.5.10 Bemerkung. Die angegebene Art und Weise, aus Z die rationalen Zahlen zu konstruieren, lässt sich auf beliebige
kommutative Integritätsringe R ausdehnen. Dazu betrachtet man R × (R \ {0}) und die Äquivalenzrelation ∼ mit (x, a) ∼
(y, b) ⇔ xb = ya darauf.
Die in diesem Abschnitt gebrachten Ergebnisse (samt Beweise) gelten sinngemäß auch in dieser allgemeineren Situation, wobei man hier i.A. keine sgn-Funktion hat, und wobei das multiplikativ Inverse zu [(x, n)]∼ genau [(n, x)]∼ ist.
(R × (R \ {0}))/∼ ist dann ein Körper (Quotientenkörper von R), aber i.A. kein angeordneter Körper.
Wendet man diese Konstruktion auf Z an, so erhält man wieder Q.
2.6 Archimedisch angeordnete Körper
2.6.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K archimedisch
angeordnet, wenn N als Teilmenge von K nicht nach oben beschränkt ist.
In Satz 2.5.7 haben wir gesehen, dass die rationalen Zahlen archimedisch angeordnet sind. Wir werden auch sehen, dass die reellen Zahlen archimedisch angeordnet
sind.
2.6.2 Beispiel. Die Eigenschaft, dass hK, +, ·, Pi ein archimedisch angeordneter Körper
ist, ermöglicht es uns etwa das Infimum von Mengen wie
)
(
1
:n∈N
M=
n
zu berechnen. Der Vermutung nach ist inf M = 0.
Um das zu beweisen, sei zunächst bemerkt, dass 0 offensichtlich eine untere
Schranke von M ist. Wäre ǫ > 0 eine weitere untere Schranke von M, d.h. 0 < ǫ <
1
1
n , n ∈ N, so folgte n < ǫ , was aber der Eigenschaft von K, archimedisch angeordnet
zu sein, widerspricht.
In archimedisch angeordneten Körpern gilt der folgende für die später zu entwickelnde Konvergenztheorie wichtige
2.6.3 Satz. Sei hK, +, ·, Pi ein archimedisch angeordneter Körper. Sind x, y ∈ K, x < y,
dann existiert p ∈ Q mit x < p < y 10 .
Beweis. Seien zunächst x, y ∈ K mit 0 ≤ x < y gegeben. Dann ist y − x > 0 und damit
1
1
> 0. Da K archimedisch angeordnet ist, gibt es ein n ∈ N mit n > y−x
und
auch y−x
daher n(y − x) > 1.
Nach Satz 2.3.10 hat {k ∈ N : k > nx} ein Minimum, und somit gibt es eine kleinste
natürliche Zahl m ∈ N, sodass m > nx. Ist m > 1, so folgt aus der Wahl von m, dass
m − 1 ≤ nx. Ist m = 1, so folgt gemäß unserer Voraussetzung m − 1 = 0 ≤ nx. Also gilt
immer m − 1 ≤ nx < m. Kombiniert man diese Ungleichung mit n(y − x) > 1, so folgt
nx < m ≤ nx + 1 < ny ,
und damit x < mn < y.
Ist schließlich x < 0, so können wir ein k ∈ N wählen mit k ≥ |x|, da N ja nicht
nach oben beschränkt ist. Es folgt 0 ≤ x + k < y + k, und nach dem eben bewiesenen
x + k < mn < y + k. Nun ist mn − k eine rationale Zahl mit x < mn − k < y.
❑
10 Diese
Aussage nennt man auch die Dichteeigenschaft von Q in K.
40
KAPITEL 2. DIE REELLEN ZAHLEN
2.6.4 Bemerkung. Da man obigen Satz induktiv immer wieder anwenden kann, sieht
man, dass zwischen zwei Zahlen sogar unendlich viele rationale Zahlen liegen.
Ist Q ( K, so kann man mit einer linearen Transformation sogar zeigen, dass es
eine nicht rationale Zahl zwischen 0 und 1 gibt, und weiters unter Verwendung von
Satz 2.6.3, dass es zwischen zwei Zahlen von K auch eine nicht rationale Zahl gibt.
2.7 Das Vollständigkeitsaxiom
Wie wir später sehen werden, ist die Vollständigkeit die Eigenschaft der reellen Zahlen,
die sie unverwechselbar von anderen angeordneten Körpern unterscheidet.
2.7.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K vollständig
angeordnet, wenn jede nach oben beschränkte Menge ein Supremum hat. Diese Eigenschaft nennen wir (s).
Wie schon im vorhergehenden Abschnitt erwähnt, gilt
2.7.2 Lemma. Ist hK, +, ·, Pi ein vollständig angeordneter Körper, so ist er archimedisch angeordnet.
Beweis. Wäre nämlich N nach oben beschränkt, so existierte wegen (s)
η = sup N.
Sei n beliebig in N. Mit n gehört aber auch n + 1 zu N. Also gilt n + 1 ≤ η, und
somit n ≤ η − 1. Daher ist η − 1 eine obere Schranke von N, was den Widerspruch
η − 1 ≥ sup N = η nach sich zieht.
❑
Nun gilt folgender wichtige Satz, dessen Beweis wir später (am Ende dieses Abschnittes bzw. im Kapitel 4) bringen werden.
2.7.3 Satz. Es gibt einen vollständig angeordneten Körper hL, +, ·, L+ i.
Ist hK, +, ·, Pi ein weiterer vollständig angeordneter Körper, so gibt es einen eindeutigen Isomorphismus φ : L → K, also eine Bijektion, sodass φ mit den Operationen
verträglich ist und sodass φ(L+ ) = P.
Wenn wir ab jetzt von den reellen Zahlen sprechen, dann sei immer ein
vollständig angeordneter Körper hL, +, ·, L+ i gemeint. Wir schreiben im Folgenden immer hR, +, ·, R+ i dafür. Wegen Satz 2.7.3 ist hR, +, ·, R+ i bis auf Kopien eindeutig. Es
sei aber bemerkt, dass diese Eindeutigkeit für die restlichen Aussagen dieses Kapitels
und auch für Kapitel 3 unerheblich sind – diese also in jedem vollständig angeordneten
Körper gelten.
2.7.4 Bemerkung. Zusammenfassend sei nochmals betont, dass die reellen Zahlen R
einen vollständig angeordneter Körper bilden, der die Körperaxiome (a1)-(a4), (m1)(m4), (d), die Axiome eines angeordneten Körpers (p1)-(p3) und das Vollständigkeitsaxiom (s) erfüllt.
Alle bisher gezeigten Rechenregeln und Eigenschaften von R lassen sich alle aus
diesen Axiomen herleiten, bzw. haben wir hergeleitet. Auch die im Folgenden aufgebaute Analysis setzt nur auf diese Axiome auf.
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
41
Die Vollständigkeit von R garantiert zum Beispiel, dass es n-te Wurzeln von nichtnegativen Zahlen gibt.
2.7.5 Satz. Sei x ∈ R, x ≥ 0, und n ∈ N. Dann existiert genau eine Zahl y ∈ R, y ≥ 0,
sodass yn = x.
Beweis. Im Fall n = 1 ist die Aussage trivial. Sei also n ≥ 2.
Die Eindeutigkeit von y folgt unmittelbar aus Lemma 2.4.8, da aus 0 ≤ y1 < y2
immer yn1 < yn2 folgt. Somit können nicht beide der Gleichung yn = x genügen.
Zur Existenz: Ist x = 0, so ist klarerweise yn = x für y = 0. Im Fall x > 0 sei
E := {t ∈ R : t > 0, tn < x}.
x
Diese Menge ist nicht leer, denn für s = 1+x
gilt 0 < s < min(x, 1) und daher sn < s <
x; also s ∈ E.
Für τ := 1 + x gilt τ > 1 und daher τn > τ > x. Aus t ≥ τ folgt dann tn ≥ τn > x
und damit t < E. Also muss τ eine obere Schranke von E sein.
x
Da R vollständig angeordnet ist, existiert y := sup E. Wegen 0 < 1+x
∈ E ist sicher
n
y > 0. Wir zeigen im Folgenden, dass y = x, und zwar indem wir die beiden anderen
Möglichkeiten yn < x und yn > x ausschließen.
Dazu benötigen wir, dass die für beliebige Elemente a, b ∈ R geltende und mit
vollständiger Induktion nach n zu beweisende Gleichung
bn − an = (b − a)(bn−1 + bn−2 a + . . . + ban−2 + an−1 ) .
(2.10)
Für 0 < a < b erhalten wir daraus die Abschätzung
bn − an < (b − a)nbn−1 .
(2.11)
Angenommen yn < x, so gibt es gemäß Satz 2.6.3 ein ǫ ∈ Q mit
!
x − yn
,1 .
0 < ǫ < min
n(y + 1)n−1
Setzen wir in (2.11) a = y und b = y + ǫ, so folgt
(y + ǫ)n − yn < ǫn(y + ǫ)n−1 < ǫn(y + 1)n−1 < x − yn .
Also gilt (y + ǫ)n < x und daher y + ǫ ∈ E im Widerspruch zu y = sup E.
Wäre yn > x, so setze man
yn − x
δ := n−1 .
ny
Dann gilt 0 < δ < ny < y.
Wir zeigen, dass y − δ eine obere Schranke von E ist. Wäre dem nicht so, dann gilt
t > y − δ für ein t ∈ E. Aus (2.11) folgt aber mit b = y, a = (y − δ)
yn − tn < yn − (y − δ)n < δnyn−1 = yn − x .
Also tn > x, und daher der Widerspruch t < E.
Die Tatsache, dass y−δ eine obere Schranke von E ist, widerspricht aber y = sup E.
❑
KAPITEL 2. DIE REELLEN ZAHLEN
42
2.7.6 Definition. Die nach obigem √Satz eindeutig bestimmte Zahl y ≥ 0, die n-te
1
Wurzel von x, schreibt man auch als n x oder x n .
2.7.7 Bemerkung. Man betrachte die Funktion
( +
R ∪ {0} → R+ ∪ {0}
.
y
7→
yn
Gemäß Lemma 2.4.8 ist diese
√ Funktion streng monoton wachsend und daher injektiv.
Zu gegebenem x ist y = n x jene Zahl, sodass yn = x. Also ist y 7→ yn auch surjektiv
+
+
als Funktion von
und ihre Umkehrfunktion
√
√n R ∪ {0} nach R ∪ {0}. Sie ist also bijektiv
ist genau x 7→ x. Wegen Lemma 2.4.8 ist auch x 7→ n x streng monoton wachsend.
2.7.8 Bemerkung. Nun sehen wir auch, dass R nicht nur aus rationalen Zahlen bestehen
kann, also Q ( R gilt. Wäre nämlich
√
p
2 = ∈ Q,
q
(2.12)
so kann man p, q teilerfremd wählen, d.h. es gibt kein k ∈ N \ {1}, welches p und q
teilt11 . Insbesondere ist nur höchstens eine der Zahlen p oder q gerade. Ausquadrieren
und mit q2 Multiplizieren in (2.12) ergibt 2q2 = p2 . Da eine Zahl genau dann gerade
ist, wenn ihr Quadrat es ist, folgt, dass p gerade und damit q ungerade ist; siehe Satz
2.4.24. Schreibt man p = 2m, so folgt 2q2 = 4m2 , und damit q2 = 2m2 . Wir erhalten
daraus den Widerspruch, dass auch q gerade sein müsste.
2.7.9 Definition. Ist x > 0 und ist r ∈ Q dargestellt in der Form r =
so definieren wir
√ p
xr := q x .
p
q
mit p ∈ Z, q ∈ N,
Da die Darstellung einer rationalen Zahl als Bruch nicht eindeutig ist, müssen wir
nachweisen, dass die Definition von xr nicht von der Wahl von p, q abhängt. Dazu
brauchen wir
q
√ √
√
2.7.10 Lemma. Sind x > 0, z > 0 und p ∈ Z, q ∈ N, so gilt q 1x = √q1x , q xz = q x q z
sowie
√q
√
( q x) p = x p .
(2.13)
q
Beweis. q 1x = √q1x folgt aus ( √q1x )q = ( √q1x)q = 1x und der Tatsache, dass nach Satz 2.7.5
q
q 1
1
q
x die eindeutige Lösung y von y = x ist.
√q q √q q
√ √
√q √q q
√q
xz übereinstimmen.
Wegen ( x z) = ( x) ( z) = xz muss q x q z mit
√q
1
=
1. Sonst folgt (2.13)√wegen
Ist p = √
0, so ist (2.13)
trivialerweise
richtig,
da
ja
√
q
(2.6) aus (( q x) p )q = (( q x)q ) p = x p und aus der Tatsache, dass nach Satz 2.7.5 x p die
eindeutige Lösung y von yq = x p ist.
❑
Ist jetzt r =
p
q
=
m
n,
so folgt wegen pn = qm
√ pn √ qm
√ q
√ p
( q x ) n = q x = q x = ( q x ) m = xm .
11 Eine
ganze Zahl k , 0 teilt eine ganze Zahl n, wenn es ein m ∈ Z gibt, sodass km = n.
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
43
Zieht man links und rechts die n-te Wurzel, so gilt wegen (2.13)
√q p √n m
x = x ,
und damit ist xr wohldefiniert. Außerdem gelten die (mit einer Beweisführung ähnlich
wie der von Lemma 2.7.10 zu zeigenden) Rechenregeln (r, s ∈ Q, x > 0)
xr+s = xr x s , (xr ) s = xrs , x−r =
1
.
xr
2.7.11 Lemma (Lemma vom iterierten Supremum). Seien M, N zwei nichtleere Mengen und f : M × N → R eine nach oben beschränkte Funktion, dh. { f (m, n) : (m, n) ∈
M × N} ist nach oben beschränkt. Dann gilt
sup{sup{ f (m, n) : m ∈ M} : n ∈ N} = sup{ f (m, n) : (m, n) ∈ M × N} =
sup{sup{ f (m, n) : n ∈ N} : m ∈ M}.
Sind umgekehrt alle Mengen { f (m, n) : m ∈ M}, n ∈ N, nach oben beschränkt genauso
wie {sup{ f (m, n) : m ∈ M} : n ∈ N}, bzw. gilt entsprechendes mit M und N vertauscht,
so ist auch { f (m, n) : (m, n) ∈ M × N} nach oben beschränkt, womit obige Gleichung
wieder gilt. 12
Eine entsprechende Aussage gilt fürs Infimum.
Beweis. Wir setzen s = sup{ f (m, n) : (m, n) ∈ M × N} und für festes q ∈ N auch
sq = sup{ f (m, q) : m ∈ M}. Aus { f (m, q) : m ∈ M} ⊆ { f (m, n) : (m, n) ∈ M × N} folgt
dann sq ≤ s für jedes q ∈ N; also auch sup{sq : q ∈ N} ≤ s.
Umgekehrt folgt für festes (m, n) ∈ M × N, dass f (m, n) ∈ { f (m, q) : m ∈ M}, wenn
nur q = n. Für dieses q ist f (m, n) ≤ sq ; also gilt auch f (m, n) ≤ sup{sq : q ∈ N}. Da
(m, n) ∈ M × N beliebig war, folgt schließlich s ≤ sup{sq : q ∈ N}.
❑
Die Existenz und Eindeutigkeit der reellen Zahlen
Am Ende dieses Abschnitts werden wir beweisen, dass vollständig angeordnete Körper tatsächlich existieren, und dass alle
solche immer Kopien von einander sind. Eine andere Art und Weise, das zu tun, findet sich in Kapitel 4.
Um diese anspruchsvolle Konstruktion zu motivieren, denken wir uns eine Gerade gemeinsam mit einer Einheitsstrecke
gezeichnet. Auf dieser Geraden denken wir uns die rationalen Zahlen durch fortgesetztes unterteilen der Einheitsstrecke
aufgetragen. Obwohl es anschaulich beliebig nahe an jedem Punkt eine rationale Zahl gibt, gibt es gemäß Bemerkung 2.7.8
Punkte, welche nicht rational sind.
Unsere Konstruktion beruht auf der folgenden Bemerkung, die R.Dedekind13 gemacht hat: Zerfallen alle Punkte der
Geraden in zwei Klassen von der Art, dass jeder Punkt der ersten Klasse links von jedem Punkt der zweiten Klasse liegt, so
existiert ein und nur ein Punkt, welcher diese Einteilung aller Punkte in zwei Klassen, diese Zerschneidung der Geraden in
zwei Stücke, hervorbringt.
Man kann also einen Punkt P der Geraden identifizieren mit der Menge aller Punkte, die links von ihm liegen. Da man
nun aber mit den rationalen Punkten beliebig nahe an den Punkt P herankommt, genügt es, alle rationalen Punkte die links
von P liegen zu kennen, um P selbst eindeutig zu rekonstruieren.
2.7.12 Satz. Es gibt einen vollständig angeordneten Körper. Dieser ist bis auf Isomorphie eindeutig bestimmt.
Beweis. Der Beweis dieses Satzes ist relativ lang und wird in mehreren Schritten geführt von denen wir auch nicht alle im
Detail ausführen werden.
12 Also gilt obige Gleichung auch für nicht notwendigerweise nach oben beschränkte Funktionen, wenn
man auch den Wert +∞ zulässt.
13 Richard Dedekind. 6.10.1831 Braunschweig - 12.2.1916 Braunschweig
KAPITEL 2. DIE REELLEN ZAHLEN
44
Schritt 1: Eine Teilmenge α von Q heißt ein Dedekindscher Schnitt, wenn sie die folgenden drei Eigenschaften besitzt:
(I)
(II)
(III)
α , ∅, α , Q.
Aus p ∈ α folgt (−∞, p] ⊆ α.
Ist p ∈ α, so existiert ein ǫ ∈ Q, ǫ > 0, sodass p + ǫ ∈ α.
Die Menge aller Dedekindschen Schnitte bezeichnen wir mit K.
Dieser Begriff modelliert die Anschauung der Menge aller rationalen Punkte, die links von dem Punkt der Geraden
”
liegen“.
Die Eigenschaft (III) besagt, dass α kein größtes Element hat. Aus der Eigenschaft (II) erhält man unmittelbar die
folgenden beiden Aussagen.
(i)
Ist p ∈ α und q < α, dann ist p < q.
(ii)
Ist r < α und s > r, so ist s < α.
Schritt 2: Wir definieren eine Relation ≤ auf K durch
α ≤ β : ⇐⇒ α ⊆ β, α, β ∈ K ,
Diese Relation ist offenbar eine Halbordnung. Wir zeigen, dass sie sogar eine Totalordnung ist. Seien α, β ∈ K und
sei angenommen, dass α β, d.h. α * β. Dann existiert also p ∈ α mit p < β. Also folgt folgt aus q > p, dass q < β,
und aus q < p, dass q ∈ α. Ist also q ∈ β, so muss q < p sein und daher zu α gehören. Somit gilt β ≤ α.
Für α ( β schreiben wir auch α < β.
Schritt 3: In diesem Schritt zeigen wir, dass K mit der Ordnung ≤ die Supremumseigenschaft besitzt. Sei A ⊆ K eine
nichtleere und nach oben beschränkte Teilmenge von K, und setze
γ :=
[
α.
α∈A
Wir zeigen, dass γ ∈ K. Da A nichtleer ist, existiert ein α0 ∈ A. Nun ist α0 nichtleer und α0 ⊆ γ, also gilt auch
γ , ∅. Da A nach oben beschränkt ist, existiert β ∈ K mit α ⊆ β für alle α ∈ A, was γ ⊆ β nach sich zieht. Wegen
β , Q ist auch γ , Q. Also erfüllt γ die Eigenschaft (I). Ist p ∈ γ, so existiert α ∈ A mit p ∈ α. Also folgt
(−∞, p] ⊆ α ⊆ γ. Weiters existiert ein rationales ǫ > 0 mit r + ǫ ∈ α ⊆ γ. Wir sehen also, dass γ die Eigenschaften
(II) und (III) hat.
Es bleibt γ = sup A zu zeigen. Offenbar gilt α ≤ γ für alle α ∈ A. Ist β ∈ K mit β ≥ α bzw. β ⊇ α für alle α ∈ A, so
folgt β ⊇ γ. Also ist γ tatsächlich die kleinste obere Schranke von A.
Schritt 4: Wir definieren eine Addition auf K. Für α, β ∈ K setze
Weiters setze 0∗ := {p ∈ Q : p < 0}.
α + β := r + s : r ∈ α, s ∈ β .
Als erstes zeigen wir, dass α + β ∈ K. Da α , ∅ und β , ∅, folgt auch α + β , ∅. Wähle r′ < α und s′ < β, dann ist
r′ > r, r ∈ α, und s′ > s, s ∈ β. Also erhalten wir r′ + s′ > r + s, r ∈ α, s ∈ β. Damit kann r′ + s′ nicht zu α + β
gehören. Wir sehen, dass α + β die Eigenschaft (I) besitzt. Sei nun p ∈ α + β gegeben, und schreibe p = r + s mit
gewissen r ∈ α, s ∈ β. Für q < p folgt q − s < r und daher q − s ∈ α. Also q = (q − s) + s ∈ α + β, und wir sehen,
dass (II) gilt. Zu p = r + s ∈ α + β wähle ein rationales ǫ > 0 mit r + ǫ ∈ α, dann folgt r + s + ǫ ∈ α + β, also gilt
auch (III).
Die Addition ist kommutativ, denn
α + β = {r + s : r ∈ α, s ∈ β} = {s + r : r ∈ α, s ∈ β} = β + α .
Sie ist assoziativ, denn
α + (β + γ) = r + u : r ∈ α, u ∈ (β + γ) =
= r + (s + t) : r ∈ α, s ∈ β, t ∈ γ = (r + s) + t : r ∈ α, s ∈ β, t ∈ γ =
= v + t : v ∈ (α + β), t ∈ γ = (α + β) + γ .
Nun identifizieren wir 0∗ als das neutrale Element bezüglich der Addition: Ist r ∈ α und s ∈ 0∗ , so folgt r + s < r,
also r + s ∈ α. D.h. α + 0∗ ≤ α.
Sei umgekehrt p ∈ α, und wähle ein rationales ǫ > 0 mit p + ǫ ∈ α. Dann gilt p = p + ǫ + (−ǫ) ∈ α + 0∗ .
Es bleibt zu zeigen, dass jedes Element von K ein additives Inverses besitzt. Sei also α ∈ K gegeben. Setze
β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < −α .
Als erstes zeigen wir, dass β ∈ K. Sei s < α und setze p := −s − 1, dann ist p + 1 = −s < −α, also p ∈ β, d.h. β , ∅.
Aus q ∈ α folgt −q < β, da sonst q − ǫ < α, und somit q < α; also β , Q. Damit gilt (I). Sei nun p ∈ β gegeben.
2.7. DAS VOLLSTÄNDIGKEITSAXIOM
45
Wähle ǫ > 0, sodass −p − ǫ < α. Ist q < p, so gilt −q − ǫ > −p − ǫ und daher −q − ǫ < α, d.h. q ∈ β. Es gilt also
(II). Mit t := p + 2ǫ ist t > p und −t − 2ǫ = −p − ǫ < α, d.h. t ∈ β. Also gilt (III).
Ist r ∈ α und s ∈ β, so ist −s < α und daher r < −s. Daher ist r + s < 0, bzw, r + s ∈ 0∗ . Wir sehen, dass α + β ≤ 0∗ .
Umgekehrt sei v ∈ 0∗ . Setze w := − 2v > 0. Sei q < α. Da Q archimedisch angeordnet ist, gibt es ein n1 ∈ N mit
n1 w > q und daher mit n1 w < α. Zu q ∈ α gibt es auch ein n2 ∈ N mit n2 w > −q und daher mit −n2 w ∈ α.
Es existiert also ein n ∈ Z mit nw ∈ α und (n + 1)w < α. Setze p := −(n + 2)w. Dann ist p ∈ β, denn −p − w < α.
Wir haben also
v = nw + p ∈ α + β .
Schritt 5: Die Addition ist mit der Ordnung verträglich. Ist nämlich α ≤ β, d.h. α ⊆ β, und ist γ ∈ K, so folgt α+ γ ⊆ β + γ.
Addieren von −γ zeigt, dass in der Tat α ≤ β ⇔ α + γ ≤ β + γ.
Daraus folgt unmittelbar α < β ⇔ β − α ∈ P := {γ ∈ K : γ > 0}, und die Tatsache, dass mit α, β ∈ P auch
α + β > α + 0∗ > 0∗ und somit α + β ∈ P.
Schritt 6: Wir definieren eine Multiplikation auf K. Seien zunächst α, β > 0. Dann setze
α · β := p ∈ Q : ∃r ∈ α, s ∈ β, r, s > 0 : p ≤ rs .
Man zeigt genauso wie in Schritt 4, dass α· β tatsächlich ein Element von K ist, dass die Multiplikation kommutativ
und assoziativ ist, und dass das Distributivgesetz gilt.
Weiters definieren wir
1∗ := {p ∈ Q : p < 1} .
Wieder sieht man analog wie in den vorherigen Beweisschritten, dass 1∗ neutrales Element bezüglich der Multiplikation ist, und dass jedes Element α > 0 ein multiplikatives Inverses
1
β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < { : q ∈ α, q > 0}
q
besitzt.
Um nun die Multiplikation auch für Elemente α < 0 zu definieren, setze


(−α) · (−β)






(−α) · β
α · β := 


α · (−β)



 ∗

0
,
,
,
,
α < 0∗ , β < 0∗
α < 0∗ , β > 0∗
α > 0∗ , β < 0∗
α = 0∗ oder β = 0∗
falls
falls
falls
falls
Der Beweis der Rechengesetze folgt aus den bereits bekannten Regeln für die Multiplikation von positiven Zahlen
durch Fallunterscheidungen.
Um α, β ∈ P ⇒ α · β ∈ P einzusehen, wähle man a ∈ α \ 0∗ , b ∈ β \ 0∗ . Also a, b ≥ 0. Wegen (III) können wir
sogar a, b > 0 annehmen. Es folgt a · b ∈ α · β \ 0∗ und somit α, β ∈ P.
Wir haben also bewiesen, dass hK, +, ·, Pi ein vollständig angeordneter Körper ist.
Schritt 7: Wie jeder angeordnete Körper enthält K eine Kopie von Q, daher eine mit den Operationen und mit ≤
Verträgliche Injektion φ : Q → K, vgl. Proposition 2.5.8. Aus φ(1) = 1∗ folgt mit vollständiger Induktion
φ(n) = {p ∈ Q : p < n}.
Außerdem zeigt man, dass für r, s ∈ Q und αr = {p ∈ Q : p < r}, αs = {p ∈ Q : p < s}
αr + αs = {p ∈ Q : p < r + s}, − αr = {p ∈ Q : p < −r},
αr · αs = {p ∈ Q : p < rs}, α−1
r = {p ∈ Q : p <
1
}.
r
Für r > 0 sieht man z.B. letztere Tatsache folgendermaßen.
1
1
1
: q ∈ Q, 0 < q < r} = p ∈ Q : ∃ ǫ > 0 : p + ǫ ≤
= {p ∈ Q : p < }.
α−1
r = p ∈ Q : ∃ǫ > 0 : p + ǫ < {
q
r
r
Aus φ( nx ) = sgn(x) φ(|x|)
φ(n) für x ∈ Z, n ∈ N, folgt somit φ(r) = αr , r ∈ Q.
Schritt 8: Wir zeigen, dass jeder vollständig angeordnete Körper L isomorph zu dem oben konstruierten Körper K ist.
Beachte, dass L und K als angeordnete Körper den Körper der rationalen Zahlen enthalten. Definiere
ω:
(
L
x
→
7
→
K
{p ∈ Q : p < x}
,
ψ:
(
K
α
→
7→
L
sup α
KAPITEL 2. DIE REELLEN ZAHLEN
46
Die Abbildung ω ist wohldefiniert, denn {p ∈ Q : p < x} ist, wie man unmittelbar überprüft, ein Dedekindscher
Schnitt. Auch ψ ist wohldefiniert, denn α ist eine nichtleere und beschränkte Teilmenge von Q ⊆ L und besitzt
daher in L ein Supremum.
Außerdem sind diese beiden Abbildungen streng monoton wachsend, und für p ∈ Q gilt ω(p) = α p und ψ(α p ) =
sup α p = p.
Aus dem noch zu zeigenden Lemma 2.7.13 folgt, dass ω und ψ mit den Operationen verträglich sind. Wendet man
Lemma 2.7.13 nun auch auf ω ◦ ψ und ψ ◦ ω an, so folgt aus der Eindeutigkeitsaussage, dass ω ◦ ψ = idK und
ψ ◦ ω = id L . Also sind ω und ψ zueinander inverse Bijektionen, welche mit Addition, Multiplikation und Ordnung
verträglich sind. Daher sind L und K als angeordnete Körper isomorph. Mit derselben Argumentation zeigt man
auch, dass der von uns angegebene Isomorphismus eindeutig ist.
❑
2.7.13 Lemma. Seien K1 und K2 zwei vollständig angeordnete Körper, und bezeichne Q1 bzw. Q2 die gemäß Proposition
2.5.8 existierende Kopie von Q, welche in K1 bzw. K2 enthalten ist. Seien φ j : Q → K j , j = 1, 2, die entsprechenden
Einbettungen.
Ist ω : K1 → K2 streng monoton wachsend und so, dass ω(φ1 (p)) = φ2 (p) für alle p ∈ Q, dann ist ω mit + und ·
verträglich.
Weiters muss jede weitere streng monoton wachsend Abbildung ω̃ : K1 → K2 mit ω̃(φ1 (p)) = φ2 (p), p ∈ Q schon mit
ω übereinstimmen.
Beweis. Zunächst beweisen wir die letzte Aussage. Angenommen es gäbe ein x ∈ K1 , sodass ω(x) , ω̃(x). O.B.d.A. sei
ω(x) < ω̃(x). Nach Satz 2.6.3 gibt es ein p ∈ Q mit ω(x) < φ2 (p) < ω̃(x).
Nun muss x < φ1 (p), da widrigenfalls φ1 (p) ≤ x und daher ω(φ1 (p)) = φ2 (p) ≤ ω(x). Andererseits muss aber
φ1 (p) < x, da sonst x ≤ φ1 (p) und daher ω̃(x) ≤ φ2 (p) = ω̃(φ1 (p)). Beides kann aber nicht gleichzeitig gelten. Somit muss
ω = ω̃.
Zur Verträglichkeit mit + halte man zunächst ein p ∈ Q fest, und betrachte
ωp :
(
K1
x
→
7→
K2
ω(x + φ1 (p)) − φ2 (p)
.
Wegen den Eigenschaften von φ1 , φ2 aus Proposition 2.5.8 folgt ω p (φ1 (q)) = ω(φ1 (q + p)) − φ2 (p) = φ2 (q) für alle q ∈ Q.
Außerdem ist ω p offensichtlicherweise streng monoton wachsend.
Nach obiger Eindeutigkeitsaussage folgt ω = ω p bzw. ω(x + φ1 (p)) = ω(x) + φ2 (p) = ω(x) + ω(φ1 (p)) für alle x ∈ K1
und wegen der Beliebigkeit von p auch für alle p ∈ Q.
Nun betrachte man für ein festes y ∈ K1 die Abbildung ωy (x) = ω(x + y) − ω(y). Wegen dem eben gezeigten erfüllt
diese ωy (φ1 (q)) = φ2 (q), q ∈ Q, und sie ist ebenfalls streng monoton wachsend. Also folgt ωy = ω, bzw. ω(x + y) =
ω(x) + ω(y), x, y ∈ K1 .
ω(x·φ1 (p))
Indem man zunächst x 7→ φ (p)
für festes p ∈ Q \ {0} und dann x 7→ ω(x·y)
ω(y) für festes y ∈ K1 \ {0} betrachtet, folgt
1
wie oben auch die Verträglichkeit mit · .
❑
2.8 Die komplexen Zahlen
Betrachtet man die quadratische Gleichung x2 + 1 =
√ 0, und sucht die Lösungen davon,
indem man formal rechnet, so erhält man x1,2 = ± −1, also eigentlich kein Ergebnis.
Das stimmt mit der Tatsache überein, dass die Gleichung x2 + 1 = 0 keine reellen
Lösungen hat. Aus vielen Gründen wäre es trotzdem wünschenswert mit Wurzeln aus
negativen Zahlen rechnen zu können. Insbesondere hätte x2 + 1 = 0 zwei Lösungen.
Wir formalisieren nun das Konzept der Wurzel aus einer negativen Zahl.
2.8.1 Definition. Die Menge der komplexen Zahlen C wird definiert als die Menge der
Paare reeller Zahlen, C := R2 = R × R. Wir schreiben eine komplexe Zahl (a, b) ∈ C
an als a + ib. Hierbei ist i ein formales Symbol, die sogenannte imaginäre Einheit.
Ist z = a + ib ∈ C, so heißt a der Realteil und b der Imaginärteil von z. Man schreibt
auch a = Re z und b = Im z.
Für zwei komplexe Zahlen a + ib und c + id definieren wir eine Addition und eine
Multiplikation, indem wir
(a + ib) + (c + id) := (a + c) + i(b + d),
(2.14)
2.8. DIE KOMPLEXEN ZAHLEN
(a + ib) · (c + id) := (ac − bd) + i(bc + ad).
47
(2.15)
setzen.
Ist (a, b) ∈ C mit b = 0, so schreibt man auch a anstatt a + i0, und ist a = 0, so
schreibt man ib anstatt 0 + ib. Falls a = 0 und b = 1, so schreibt man kurz i. Anstatt
0 + i0 schreibt man auch 0.
Wir wollen die triviale aber nützliche Tatsache bemerken, dass zwei komplexe Zahlen genau dann übereinstimmen, wenn ihre Realteile und ihre Imaginärteile übereinstimmen.
√
Die imaginäre Einheit modelliert den Ausdruck −1. Tatsächlich gilt gemäß
(2.15), dass i2 = −1 sowie (−i)2 = −1.
2.8.2 Satz. Die komplexen Zahlen hC, +, ·i sind ein Körper, wobei 0 + i0 das neutrale
Element bezüglich +, 1 + i0 das neutrale Element bezüglich ·, (−a) + i(−b) die additiv
Inverse zu a + ib, und
a
−b
+i 2
(2.16)
2
2
a +b
a + b2
die multiplikativ Inverse zu a + ib , 0 + i0 ist.
Beweis. Wir müssen die Körperaxiome aus Definition 2.1.1 nachweisen. Die Kommutativität von + und ·, daher Axiome (a4),(m4), folgt unmittelbar aus der Definition in
(2.14) und (2.15). Genauso schnell überzeugt man sich von der Gültigkeit der Assoziativität von +, dh. (a1). Wegen
((a + ib) · (c + id)) · (x + iy) = ((ac − bd) + i(bc + ad)) · (x + iy) =
(acx − bdx − bcy − ady) + i(bcx + adx + acy − bdy) =
= (a + ib) · ((cx − dy) + i(cy + dx)) = (a + ib) · ((c + id) · (x + iy))
gilt (m1). Ganz leicht sieht man, dass 0 + i0 das additiv neutrale Element von C ist –
(a2) –, und dass (−a) + i(−b) das zu a + ib additiv inverse Element ist, dh. (a3).
Genauso elementar sieht man, dass 1 + i0 das multiplikativ neutrale Element ist –
(m2) –, und dass die in (2.16) angegebene komplexe Zahl das zu a + ib multiplikativ
inverse Element ist, dh. (m3). Schließlich gilt (d), da in R das Distributivgesetz gilt und
da
(x + iy) · ((a + ib) + (c + id)) = (x + iy) · ((a + c) + i(b + d)) =
(xa + xc − yb − yd) + i(xb + xd + ya + yc) =
((xa − yb) + i(xb + ya)) + ((xc − yd) + i(xd + yc)) = (x + iy) · (a + ib) + (x + iy) · (c + id).
❑
Die reellen Zahlen sind in C eingebettet vermöge der Abbildung a 7→ a + i · 0. Offenbar ist diese Einbettung ein Körperhomomorphismus, dh. verträglich mit den Verknüpfungen +, ·. Insbesondere sehen wir, dass C ein R-Vektorraum ist. Die dafür nötigen Rechengesetze gelten, da sie einfach Spezialfälle der Rechenregeln des Körpers C
sind. Eine Basis von C als R-Vektorraum lässt sich leicht angeben, nämlich {1, i}. Denn
es lässt sich ja jede komplexe Zahl in eindeutiger Weise als Linearkombination a·1+b·i
mit den reellen Koeffizienten a, b anschreiben. Wir sehen also, dass die Dimension von
C als R-Vektorraum zwei ist.
KAPITEL 2. DIE REELLEN ZAHLEN
48
Im
C
z = a + ib
ib
|z|
0
|z| = |z|
a
Re
z = a − ib
−ib
Abbildung 2.3: Zahlenebene
Graphisch lassen sich die Zahlen aus C als Punkte in der Ebene veranschaulichen,
man spricht auch von der Gaußschen Zahlenebene14. Dabei ist
√
|z| := a2 + b2 (≥ 0)
(2.17)
die Länge des Vektors von (0, 0) nach (a, b). Wir nennen |z| auch den Betrag von z.
Der Betrag auf den komplexen Zahlen wird gleich wie die Betragsfunktion auf
einem bewerteten Körper bezeichnet. Es gelten nämlich vergleichbare Regeln (z, w ∈
C):
(i) | Re z| ≤ |z|, | Im z| ≤ |z|
(ii) |zw| = |z||w|.
(iii) |z + w| ≤ |z| + |w|.
(iv) |z + w| ≥ ||z| − |w||.
(i) und (ii) lassen sich dabei elementar nachprüfen. Die Dreiecksungleichung folgt
durch Ausquadrieren, und die Dreiecksungleichung nach unten beweist man genauso,
wie bei den angeordneten Körpern (siehe (2.1)).
Eine weiters Begriffsbildung im Zusammenhang mit den komplexen Zahlen ist die
der konjugiert komplexen Zahl z zu einer komplexen Zahl z = a + ib:
z := a − ib .
14 Carl-Friedrich
Gauß. 30.4.1777 Braunschweig - 23.2.1855 Göttingen
2.8. DIE KOMPLEXEN ZAHLEN
49
Offenbar gilt |z| = |z|, |z|2 = zz, und z−1 = |z|z2 wenn z , 0. Der Übergang von z zu
seiner konjugierten z̄ entspricht bei der graphischen Veranschaulichung der komplexen
Zahlen genau dem Spiegeln an der reellen Achse.
50
KAPITEL 2. DIE REELLEN ZAHLEN
Kapitel 3
Der Grenzwert
In der Mathematik hat sich schon bald herausgestellt, dass eine rein algebraische Betrachtungsweise der reellen Zahlen nicht immer das geeignete Instrument zur Modellierung der in den Naturwissenschaften auftretenden Phänomene ist. Probleme wie un”
endlich oft immer kleiner werdende Größen zusammenzählen“ oder einer gewissen
”
Zahl immer näher kommen“, lassen sich mit den bisher rein algebraischen Methoden
nicht betrachten.
Man denke zum Beispiel an die Approximation der Zahl 2π, indem man einem
Kreis mit Radius eins regelmäßige n-Ecke einschreibt, von diesen den Umfang berechnet, und dann n immer größer werden lässt.
Das führt zu dem Begriff des Grenzwertes einer Folge von Zahlen. Dazu wollen
wir das einer Zahl immer näher Kommen“ bzw. Konvergieren mathematisch exaktifi”
zieren:
Eine Folge x1 , x2 , x3 , . . . von reellen Zahlen heißt konvergent gegen eine reelle Zahl
x, falls es zu jedem beliebig kleinen Abstand ǫ > 0 einen Folgenindex N gibt, sodass
ab diesem Index alle Folgenglieder einen Abstand von x kleiner als ǫ haben; sodass
also
|xn − x| < ǫ,
für alle n ≥ N.
Wir wollen nun aber Konvergenzbetrachtungen nicht nur für Folgen von reellen
Zahlen betrachten, sondern auch z.B. für Folgen von komplexen Zahlen oder für Folgen
von Punkten im Raum. Wie man aus der Definition der Konvergenz erahnen kann,
benötigt man dazu lediglich einen Abstandsbegriff auf dem betrachteten Objekt. Wir
führen dazu den Begriff des metrischen Raumes ein.
3.1 Metrische Räume
Um zu sagen, wann ein Punkt x nahe“ bei einem anderen Punkt y liegt, müssen wir in
”
irgendeiner Weise den Abstand von x zu y messen können. Betrachten wir zum Beispiel
die Menge X aller Punkte der Ebene. Dann ist es naheliegend, als Abstand zwischen
x und y die Länge l x,y der Strecke, die die beiden Punkte verbindet, zu nehmen. Man
erkennt dabei, dass folgende Regeln gelten: Stets ist l x,y ≥ 0, denn Längen sind immer positiv. Dabei gilt =“ genau dann, wenn x = y, denn eine Strecke hat dann und
”
nur dann Länge 0, wenn Anfangs- und Endpunkt gleich sind. Es ist stets l x,y = ly,x ,
denn vertauscht man Anfangs- und Endpunkt so bleibt die Länge der Strecke erhalten.
51
KAPITEL 3. DER GRENZWERT
52
Schwieriger einzusehen, aber anschaulich doch klar, ist die Gültigkeit der Dreiecksungleichung: In jedem Dreieck ist die Länge einer Seite höchstens so groß, wie die
Summe der Längen der anderen Seiten; also für je drei Punkte – die Eckpunkte des
Dreiecks – gilt l x,z ≤ l x,y + ly,z .
Es sind genau diese drei Eigenschaften, die es ausmachen, dass die Länge der
”
Verbindungsstrecke“ ein vernünftiger Abstandsbegriff ist.
3.1.1 Definition. Sei X eine Menge, d : X × X → R1 eine Funktion. Dann heißt d eine
Metrik auf X, und hX, di ein metrischer Raum, wenn gilt
(M1) Für alle x, y ∈ X ist d(x, y) ≥ 0. Dabei gilt d(x, y) = 0 genau dann, wenn x = y.
(M2) Für alle x, y ∈ X gilt d(x, y) = d(y, x).
(M3) Sind x, y, z ∈ X, so gilt die Dreiecksungleichung:
d(x, z) ≤ d(x, y) + d(y, z) .
3.1.2 Bemerkung. Man kann allgemeiner auch Metriken d betrachten, die X × X nicht
nach R, sondern nach K abbilden, wobei hK, +, ·, Pi ein archimedisch angeordneter
Körper ist. Wir werden darauf im Kapitel 4 zurück kommen.
3.1.3 Beispiel.
Ist X = R und d(x, y) = |x − y| für x, y ∈ R, so sieht man sofort, dass (M1) und
(M2) erfüllt sind. (M3) folgt aus der Dreiecksungleichung für den Betrag (siehe
Lemma 2.2.11):
|x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z|, x, y, z ∈ R.
(3.1)
Ist X = C R2 und d(z, w) = |z − w| für z, w ∈ C, wobei |.| hier der komplexe
Betrag ist, so erfüllt d offensichtlich p
(M2) und d(z, w) ≥ 0. Schreibt man z = a+ib
und w = c + id, so gilt d(z, w) = (a − c)2 + (b − d)2 = 0 genau dann, wenn
a − c = 0 und b − d = 0, also z = w. Somit ist (M1) erfüllt. (M3) folgt aus der
Dreiecksungleichung für den komplexe Betrag ähnlich wie in (3.1).
Um eine Metrik auf X := R p zu definieren, setzen wir
d2 (x, y) :=
p
X
j=1
21
(x j − y j )2 , x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ X .
Man spricht von der euklidischen Metrik auf Rn . Die Gültigkeit von (M1) und
(M2) ist aus der Definition offensichtlich. Die Dreiecksungleichung (M3) folgt
hingegen aus dem unten folgenden Lemma 3.1.4.
Im Falle p = 1, also X = R, gilt d2 (x, y) = |x − y|. Damit ist der Abstand zweier
Zahlen bzgl. der euklidischen Metrik nichts anderes als der Betrag der Differenz
dieser Zahlen.
Die euklidische Metrik auf R2 hat eine analoge Interpretation mit Hilfe des Betrages√einer komplexen Zahl. Für z = a+ib ∈ C haben wir den Betrag definiert als
|z| = a2 + b2 . Daraus erkennt man, dass die euklidische Metrik auf R2 gerade
d2 (z, w) = |z − w|, z, w ∈ C ,
1 Wie
unmittelbar nach Satz 2.7.3 bemerkt, ist R ein vollständig angeordneter Körper.
3.1. METRISCHE RÄUME
53
ist, wobei wir hier die komplexen Zahlen in der Gaußschen Zahlenebene, also
als Elemente von R2 interpretieren.
(M3) folgt in den Fällen p = 1, 2 wie schon oben gezeigt, aus der bereits bewiesenen Dreiecksungleichung für die Betragsfunktion
3.1.4 Lemma. Seien p ∈ N, a1 , . . . , a p , b1 , . . . , b p ∈ R. Dann gilt (CauchySchwarzsche Ungleichung2)
 p
2
X

 ai bi  ≤
i=1
und (Minkowskische Ungleichung3)
 p

X 2 
 ai  ·
i=1
 p

X 2 

bi  ,
i=1
 p
1  p
 12
 p
 12
X  2 X

X

 (ai + bi )2  ≤  a2i  +  b2i  .
i=1
i=1
i=1
Beweis. Wir verwenden die Bezeichnungen a := (a1 , . . . , a p ), b := (b1 , . . . , b p ) ∈ R p
und definieren4
p
X
(a, b) :=
ai bi .
i=1
p
Für Zahlen λ, µ ∈ R und a, b ∈ R setzen wir
λa + µb := (λa1 + µb1 , . . . , λa p + µb p ) .
Offenbar gilt für a, b, c ∈ R p
(λa + µb, c) =
p
X
(λai + µbi )ci =
i=1
p
X
i=1
λai ci +
p
X
µbi ci = λ(a, c) + µ(b, c) .
i=1
Man spricht von der Linearität von (., .) in der vorderen Komponente. Wegen (a, b) =
(b, a) ist (., .) auch in der hinteren Komponente linear (vgl. den Begriff des Skalarproduktes auf einem Vektorraum in der Linearen Algebra).
Um die Cauchy-Schwarzsche Ungleichung zu zeigen, gehen wir von der trivialen
Bemerkung aus, dass für jedes p-Tupel x = (x1 , . . . , x p ) ∈ R p
(x, x) =
p
X
i=1
x2i ≥ 0.
Für alle t ∈ R gilt nun
0 ≤ (a + tb, a + tb) = (a, a) + 2t(a, b) + t2 (b, b).
2 Hermann
Amandus Schwarz. 25.1.1843 Hermsdorf (Sobiecin, Polen) - 30.11.1921 Berlin
Minkowski. 22.6.1864 Alexoten (bei Kaunas, Litauen) - 12.1.1909 Göttingen
4 Also ist (., .) eine Abbildung von R p × R p nach R.
3 Hermann
(3.2)
KAPITEL 3. DER GRENZWERT
54
Ist (b, b) , 0, so setze man t = − (a,b)
(b,b) in obige Ungleichung ein, und erhält
0 ≤ (a, a) −
(a, b)2
.
(b, b)
Daraus folgt unmittelbar die Cauchy-Schwarzsche Ungleichung.
Im Falle (b, b) = 0 folgt b = (0, . . . , 0), und damit (a, b) = 0. Es gilt also auch in
diesem Fall die Cauchy-Schwarzsche Ungleichung.
Die Minkowskische Ungleichung folgt wegen (ai + bi )2 = ai · (ai + bi ) + bi (ai + bi )
aus
p
p
p
p
p
X
X
X
X
X
(ai + bi )2 =
ai (ai + bi ) +
bi (ai + bi ) ≤ ai · (ai + bi ) + bi · (ai + bi )
i=1
i=1
i=1
i=1
i=1
 p
1
X 2  2
≤  ai 
i=1
 p
1
 21  p
X
X 2  2

2
·  (ai + bi )  +  bi 
i=1
i=1
 p
 21
X

2
·  (ai + bi )  =
i=1

1   p
 12  p
 12
p
X
X 2  2  X




2
2
=  ai  +  bi   ·  (ai + bi )  .
i=1
i=1
i=1
❑
Beispiele von Metriken gibt es viele, und sie treten in verschiedensten Zusammenhängen auf.
3.1.5 Beispiel.
(i) Sei noch einmal X := R2 und setze
d1 (x, y) := |x1 − y1 | + |x2 − y2 |, x = (x1 , x2 ), y = (y1 , y2 ) ∈ R2 .
Dann ist d1 eine Metrik. Die Gültigkeit von (M1) und (M2) ist wieder aus der
Definition offensichtlich. Um die Dreiecksungleichung einzusehen, seien x, y, z ∈
R gegeben. Dann folgt mit Hilfe der Dreiecksungleichung für |.|
d1 (x, z) = |x1 − z1 | + |x2 − z2 | ≤ |x1 − y1 | + |y1 − z1 | + |x2 − y2 | + |y2 − z2 | =
= |x1 − y1 | + |x2 − y2 | + |y1 − z1 | + |y2 − z2 | = d1 (x, y) + d1 (y, z) .
Diese Metrik ist offenbar
√ ungleich der euklidischen Metrik, denn es gilt etwa
d1 ((0, 0), (2, 1)) = 3 , 5 = d2 ((0, 0), (2, 1)).
Anschaulich interpretiert bezeichnet man d1 manchmal als New York-Metrik.
Denn stellt man sich in der Ebene einen Stadtplan mit lauter rechtwinkeligen
Straßen – wie etwa in New York – vor, dann misst d1 (x, y) gerade die Länge des
Fußweges von der Kreuzung x zur Kreuzung y.
Ganz analog definiert man eine Metrik am R p
d1 (x, y) =
p
X
j=1
|x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p .
Der Nachweis von (M1)-(M3) geht genauso wie im oben betrachteten Fall p = 2.
3.1. METRISCHE RÄUME
55
(ii) Ist wieder X = R p , so definieren wir nun die Metrik
d∞ (x, y) := max |x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p .
j=1,...,p
(M1),(M2) sind klar. Die Dreiecksungleichung folgt aus der Tatsache, dass für
alle nichtnegativen Zahlen
max{a1 + b1 , . . . , a p + b p } ≤ max{a1 , . . . , a p } + max{b1 , . . . , b p } .
Auch diese Metrik unterscheidet sich tatsächlich von den schon eingeführten Metriken d1 und d2 , da etwa im Falle p = 2 gilt, dass d∞ ((0, 0), (2, 1)) = 2.
(iii) Ist X = C p , so definiert man für z = (z1 , . . . , z p ), w = (w1 , . . . , w p ) ∈ C p
v
u
tX
p
d2 (z, w) =
|z j − w j |2 .
j=1
Identifiziert man z mit dem Vektor x ∈ R2p , indem man x1 = Re z1 , x2 =
Im z1 , . . . , x2p−1 = Re z p , x2p = Im z p setzt, und identifiziert man w entsprechend
mit dem Vektor y ∈ R2p , so gilt
v
u
tX
p
(Re(z j − w j )2 + Im(z j − w j )2 ) = d2 (x, y) .
d2 (z, w) =
j=1
p
Insbesondere ist auch C versehen mit d2 ein metrischer Raum.
(iv) Eine hauptsächlich aus theoretischer Sicht wichtige Metrik ist die diskrete Metrik.
Sie findet man auf jeder nichtleeren Menge X, indem man
(
0 , falls x = y
d(x, y) =
1 , falls x , y
setzt.
(v)
Betrachte die ganzen Zahlen X := Z und halte eine Primzahl p fest. Setze



d(p) (x, y) := 

1
pn(p)
0
, falls
, falls
x , y, x − y = ±
x=y
Q
q prim
qn(q)
Q
Dabei ist ± q prim qn(q) die eindeutige Primfaktorzerlegung von x − y. Dann ist d(p) eine Metrik auf Z. Denn (M1)
ist nach Definition erfüllt, (M2) ist ebenfalls richtig, denn vertauscht man x und y, so ändert sich bei der Differenz
x − y nur das Vorzeichen, nicht jedoch die Primfaktoren und ihre Potenzen. Die Dreiecksungleichung ist wieder
schwieriger einzusehen. Wir zeigen, dass in diesem Fall sogar die stärkere Ungleichung
d(p) (x, z) ≤ max{d(p) (x, y), d(p) (y, z)}, x, y, z ∈ Z ,
gilt. Diese Ungleichung impliziert tatsächlich sofort die Dreiecksungleichung, denn für je zwei Zahlen a, b ≥ 0 ist
stets max(a, b) ≤ a + b.
Schreibe
x−z = ±
Y
q prim
sodass also
d(p) (x, z) =
qn1 (q) , x − y = ±
Y
q prim
qn2 (q) , y − z = ±
Y
qn3 (q) ,
q prim
1
1
1
, d(p) (x, y) = n (p) , d(p) (y, z) = n (p) .
pn1 (p)
p2
p3
Betrachte den Fall, dass d(p) (x, y) ≥ d(p) (y, z), d.h. n2 (p) ≤ n3 (p). Wegen n2 (p) ≤ n3 (p) teilt pn2 (p) sowohl x − y als
auch y − z, und daher auch (x − y) + (y − z) = x − z. Es folgt n2 (p) ≤ n1 (p), und somit d(p) (x, y) ≥ d(p) (x, z).
Der Fall d(p) (x, y) ≤ d(p) (y, z) wird genauso behandelt.
Auf Z haben wir natürlich auch die euklidische Metrik d2 (x, y) = |x − y|, denn Z ist ja eine Teilmenge von R. Diese
ist verschieden von der Metrik d(p) , denn zum Beispiel ist d(p) (0, p) =
1
p,
wogegen d2 (0, p) = p.
KAPITEL 3. DER GRENZWERT
56
3.1.6 Bemerkung. Auf R stimmen die Metriken d1 , d2 , d∞ alle überein.
3.1.7 Bemerkung. Die oben kennengelernten Metriken d2 , d1 , d∞ auf dem R p sind allesamt von Normen erzeugte Metriken.
Eine Norm k.k auf R p ist eine Funktion von R p → R mit folgenden drei Eigenschaften x, y ∈ R p , λ ∈ R:
(i) kxk ≥ 0, wobei kxk = 0 ⇔ x = 0.
(ii) kλxk = |λ| · kxk.
(iii) kx + yk ≤ kxk + kyk.
Es gilt nun d(x, y) = kx − ykq
2 , d1 (x, y) = kx − yk1 , d∞ (x, y) = kx − yk∞ , wobei diese
Pp
Pp
2
drei Normen durch kxk2 :=
j=1 |x j | , kxk1 :=
j=1 |x j |, kxk∞ = max{|x1 |, . . . , |x p |}
definiert sind.
3.2 Der Grenzwert in metrischen Räumen
Wir kommen nun zurück zu dem am Anfang des Kapitels motivierten Begriff der Konvergenz einer Folge.
3.2.1 Definition. Eine Folge in einer Menge X ist aus mathematischer Sicht nichts
anderes als eine Funktion
y : N → X,
wobei der Funktionswert y(n) von y an der Stelle n meist als yn geschrieben wird.
Für die Folge y als solche schreiben wir meist (yn )n∈N . Folgen werden auch oft als
y1 , y2 , y3 , . . . angeschrieben.
3.2.2 Definition. Sei hX, di ein metrischer Raum, (xn )n∈N eine Folge in X, und x ein
Element von X. Dann heißt (xn )n∈N konvergent gegen x, wenn gilt 5
∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N .
(3.3)
In diesem Fall schreibt man limn→∞ xn = x.
xN
x1
xN ′
x
ǫ′
ǫ
5 Kürzer
Ist (xn )n∈N eine Folge, und gibt es ein Element x ∈ X, sodass limn→∞ xn = x, so sagt
man die Folge (xn )n∈N ist konvergent. Ist
eine Folge nicht konvergent, so sagt man
sie ist divergent.
Man verwendet auch andere Schreibweisen für limn→∞ xn = x, wie zum Beispiel
n→∞
(xn )n∈N → x, n → ∞, oder x −→ x, oder
auch nur xn → x.
lässt sich folgendermaßen schreiben: ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : ∀n ≥ N ⇒ d(xn , x) < ǫ.
3.2. DER GRENZWERT IN METRISCHEN RÄUMEN
57
3.2.3 Bemerkung. Wegen |d(x, xn ) − 0| = d(x, xn ) konvergiert eine Folge (xn )n∈N in einem metrischen Raum hX, di genau dann gegen ein x ∈ X, wenn die Folge (d(x, xn ))n∈N
in R (versehen mit der euklidischen Metrik) gegen 0 konvergiert.
Folgen müssen nicht immer mit dem Index 1 anfangen. Ist k eine feste ganze Zahl,
so setzen wir Z≥k := {n ∈ Z : n ≥ k}. Eine Abbildung x : Z≥k → X nennen wir ebenfalls
Folge, wobei ihre Konvergenz in analoger Weise wie in Definition 3.2.2 definiert ist.
3.2.4 Beispiel.
(i) Sei hX, di ein beliebiger metrischer Raum, und sei x ∈ X. Betrachte die konstante
Folge x1 = x2 = x3 = . . . = x. Dann gilt lim j→∞ x j = x.
Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N
finden, sodass d(x j , x) < ǫ für alle j ≥ N. Wähle N := 1, dann gilt
d(x j , x) = d(x, x) = 0 < ǫ für alle j ≥ N .
Dieses Beispiel ist natürlich in gewissem Sinne trivial, denn die Folgenglieder x j
sind ja schon alle gleich dem Grenzwert x, kommen diesem also natürlich beliebig
nahe.
(ii) Sei X = R und d = d2 die euklidische Metrik d2 (x, y) = |x − y|. Dann gilt
lim j→∞ 1j = 0.
Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N
finden, sodass | 1j − 0| = 1j < ǫ gilt, wenn nur j ≥ N. Dazu benützen wir die
Tatsache, dass N als Teilmenge von R nicht nach oben beschränkt ist. Wähle
N ∈ N mit 1ǫ < N. Für alle j ∈ N mit j ≥ N gilt dann 1j ≤ N1 < ǫ.
(iii) Aus dem letzten Beispiel zusammen mit Bemerkung 3.2.3 schließen wir auf
lim j→∞ (1 + 1j ) = 1, da |(1 + 1j ) − 1| = 1j → 0.
(iv) Sei q ∈ R, 0 ≤ q < 1, und betrachte die Folge (qn )n∈N . Dann gilt limn→∞ qn = 0.
Um das einzusehen, können wir q > 0 voraussetzen, da sonst die betreffliche
Folge identisch gleich Null ist. Wir verwenden zum Beweis die Bernoullische
Ungleichung aus Lemma 2.3.6. Setzt man in der Bernoullischen Ungleichung
x = q1 − 1 > 0, so erhält man
1
q
!n
!
1
≥1+n
−1 .
q
Da R archimedisch angeordnet ist, gibt es zu jedem ǫ > 0 eine Zahl N ∈ N mit
1 + N( q1 − 1) > 1ǫ und damit auch ( 1q )N > 1ǫ , also qN < ǫ. Es folgt d(0, qn ) = qn ≤
qN < ǫ für alle n ≥ N.
(v) Sei z ∈ C mit |z| < 1. Setzen wir q := |z|, so folgt aus dem vorherigen Beispiel,
dass d(0, zn ) = |zn − 0| = qn → 0 für n → ∞. Also gilt auch limn→∞ zn = 0 in C.
3.2.5 Beispiel. Es gibt viele Folgen, die nicht konvergieren. Die Folge zn := in in C,
dh.
i, −1, −i, 1, i, −1, −i, 1, . . . ,
KAPITEL 3. DER GRENZWERT
58
zum Beispiel, ist divergent, wobei wir immer, wenn wir nichts anderes explizit angeben, C mit der euklidischen Metrik versehen.
Um das nachzuprüfen, nehmen wir an, dass zn → z für ein gewisses z ∈ C. Wählt
man N ∈ N, sodass |zn − z| < 21 für alle n ≥ N, und nimmt ein n0 ≥ N, welches durch 4
teilbar ist, so folgt der Widerspruch
2 = |1 − (−1)| = |zn0 − zn0 +2 | ≤ |zn0 − z| + |z − zn0 +2 | <
1 1
+ = 1.
2 2
Es gelten folgende, zu (3.3) äquivalente Konvergenzbedingungen.
3.2.6 Lemma. Sei hX, di ein metrischer Raum, x ∈ X und (xn )n∈N eine Folge aus X.
Dann gilt limn→∞ xn = x, dh. es gilt (3.3), genau dann, wenn für gewisse K ∈ (0, +∞)
und α ∈ (0, +∞) ∪ {+∞}
∀ǫ ∈ (0, α) ∃N ∈ N : d(xn , x) < K · ǫ für alle n ≥ N.
(3.4)
Die Konvergenz von (xn )n∈N gegen x ist auch äquivalent zu (3.3) bzw. (3.4), wenn man
in diesen Bedingungen · · · < ǫ bzw. · · · < K · ǫ durch · · · ≤ ǫ bzw. · · · ≤ K · ǫ ersetzt.
Beweis. Offenbar folgt (3.4) aus (3.3). Gelte umgekehrt (3.4). Für ǫ > 0 gilt
min Kǫ , α2 ∈ (0, α). Nimmt man diese Zahl als ǫ in (3.4), so gibt es ein N ∈ N, sodass
ǫ α
≤ ǫ, für alle n ≥ N .
,
d(xn , x) < K · min
K 2
Also gilt auch (3.3).
Dass aus (3.3) bzw. (3.4) die jeweiligen Bedingungen mit ≤ anstatt < folgt, ist klar,
da aus < ja immer ≤ folgt.
Für die Umkehrung wende die Bedingungen mit ≤ statt < auf 2ǫ an. Man erhält
dann · · · ≤ 2ǫ < ǫ bzw. · · · ≤ K · 2ǫ < K · ǫ.
❑
3.2.7 Definition. Ist (xn )n∈N eine Folge und n : N → N eine streng monoton wachsende
Funktion6, dh. n(1) < n(2) < n(3) < . . . , so nennt man (xn( j) ) j∈N eine Teilfolge von
(xn )n∈N .
Folgende elementare Sachverhalte sind von großer Bedeutung und werden in Beweisen immer wieder Verwendung finden.
3.2.8 Satz. Sei hX, di ein metrischer Raum und sei (xn )n∈N eine Folge von Elementen
aus X.
(i) Die Folge (xn )n∈N hat höchstens einen Grenzwert.
(ii) (xn )n∈N konvergiert gegen x ∈ X genau dann, wenn es ein k ∈ N gibt, sodass
(xn )n∈Z≥k gegen x ∈ X konvergiert. Es kommt also nicht auf endlich viele Folgenglieder an, ob und wogegen eine Folge konvergiert.
(iii) Ist limn→∞ xn = x und k ∈ N, so konvergieren auch (xn+k )n∈N und (xn−k )n∈Z≥k+1
gegen x.
(iv) Ist limn→∞ xn = x, so konvergiert auch jede Teilfolge (xn( j) ) j∈N gegen x.
6 Klarerweise
ist eine solche Funktion n immer injektiv, und es gilt n( j) ≥ j.
3.2. DER GRENZWERT IN METRISCHEN RÄUMEN
59
Beweis. Wir zeigen zunächst (i). Es gelte xn → x und xn → y, wobei x , y, dh.
d(x, y) > 0. Wähle N1 ∈ N, sodass d(xn , x) < d(x,y)
3 , n ≥ N1 , und N2 ∈ N, sodass
d(x,y)
d(xn , y) < 3 , n ≥ N2 . Dann folgt für N := max{N1 , N2 } der Widerspruch
d(x, y) ≤ d(x, xN ) + d(xN , y) <
d(x, y) d(x, y) 2d(x, y)
+
=
< d(x, y) ,
3
3
3
Wir zeigen auch noch (iv). Die restlichen Aussagen sind noch elementarer nachzuweisen. Sei also (xn( j) ) j∈N eine Teilfolge der gegen x konvergenten Folge (xn )n∈N . Ist ǫ > 0,
so gibt es ein N ∈ N, sodass d(xn , x) < ǫ, wenn nur n ≥ N.
Ist nun i0 ∈ N so groß, dass n(i0 ) ≥ N (z.B. i0 = N), so folgt für i ≥ i0 auch
n(i) ≥ N und somit d(xn(i) , x) < ǫ. Somit gilt lim j→∞ xn( j) = x.
❑
3.2.9 Beispiel.
(i) Ist p ∈ N, so gilt limn→∞ n1p = 0. Das folgt unmittelbar aus Satz 3.2.8 und der
ist.
Tatsache, dass diese Folge eine Teilfolge von n1
n∈N
(ii) Sei z ∈ C, |z| < 1. Betrachte die Folge (die sogenannte geometrische Reihe)
S n :=
n
X
zk = 1 + z + z2 + . . . + zn .
k=0
Aus (2.10) folgt
1n − zn = (1 − z)(1n−1 + 1n−2 z + . . . + 1zn−2 + zn−1 ) = (1 − z)(1 + z + . . . + zn−1 ) ,
und wir erhalten
zn
1
−
.
(3.5)
1−z 1−z
Sei nun beliebig ǫ > 0 vorgegeben. Wähle N ∈ N mit |z|n < ǫ, n ≥ N (vgl.
Beispiel 3.2.4, (iv)), dann folgt
S n−1 =
S n−1 −
ǫ
|z|n
1 =
<
, n≥ N.
1−z
|1 − z| |1 − z|
Wegen Lemma 3.2.6 gilt somit S n−1 →
1
limn→∞ S n = 1−z
.
1
1−z ,
und wegen Satz 3.2.8 auch
3.2.10 Lemma. Sei hX, di ein metrischer Raum und seien (xn )n∈N , (yn )n∈N Folgen von
Elementen von X, sodass limn→∞ xn = x und limn→∞ yn = y. Dann folgt
lim d(xn , yn ) = d(x, y).
n→∞
Beweis. Zunächst wollen wir folgende Ungleichung
d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , a2 ) + d(b1 , b2 ), a1 , a2 , b1 , b2 ∈ X .
(3.6)
beweisen. Aus der Dreiecksungleichung folgt d(a1 , b1 ) − d(a2 , b1 ) ≤ d(a1 , a2 ) sowie
d(a2 , b1 ) − d(a1 , b1 ) ≤ d(a1 , a2 ). Also gilt
d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , b1 ) − d(a2 , b1 ) + d(a2 , b1 ) − d(a2 , b2 ) ≤
KAPITEL 3. DER GRENZWERT
60
d(a1 , a2 ) + d(b1 , b2 ) .
Sei nun ǫ > 0 und N ∈ N so groß, dass d(xn , x), d(yn , y) < 2ǫ , wenn n ≥ N. Aus (3.6)
folgt
|d(xn , yn ) − d(x, y)| ≤ d(xn , x) + d(yn , y) < ǫ
für alle n ≥ N.
❑
Ein weiterer Begriff, der im Zusammenhang mit konvergenten Folgen auftritt, ist
der der Beschränktheit.
3.2.11 Definition. Sei hX, di ein metrischer Raum, und sei Y ⊆ X. Dann heißt Y beschränkt, wenn es eine Zahl C > 0 und einen Punkt x0 ∈ X gibt, sodass
d(x0 , y) ≤ C, y ∈ Y .
Eine Folge (xn )n∈N heißt beschränkt, wenn die Bildmenge {xn : n ∈ N} beschränkt ist.
Allgemeiner heißt eine Funktion f : E → X beschränkt, wenn die Bildmenge f (E)
beschränkt ist.
Die Menge Y ist also beschränkt, wenn sie ganz in einem gewissen Kreis7 (Mittelpunkt x0 , Radius C) liegt.
3.2.12 Bemerkung. Y ist beschränkt genau dann, wenn es zu jedem Punkt x ∈ X eine
Zahl C x > 0 gibt mit d(x, y) ≤ C x , y ∈ Y. Denn ist x ∈ X gegeben, so setze C x :=
d(x, x0 ) + C. Dann gilt für jedes y ∈ Y
d(x, y) ≤ d(x, x0 ) + d(x0 , y) ≤ d(x, x0 ) + C = C x .
Mit Hilfe dieser Tatsache sieht man auch, dass Y ⊆ C (Y ⊆ R) versehen mit der
euklidischen Metrik genau dann beschränkt ist, wenn für ein gewisses C > 0 gilt, dass
∀x ∈ Y ⇒ |x| = d(x, 0) ≤ C.
Im Falle Y ⊆ R stimmt somit diese Definition von Beschränktheit mit der von Definition 2.2.4 überein.
3.2.13 Proposition. In einem metrischen Raum ist jede konvergente Folge (xn )n∈N auch
beschränkt.
Beweis. Wähle N ∈ N mit d(xn , x) < 1 für alle n ≥ N. Setzt man
C := 1 + max{d(x1 , x), . . . , d(xN−1 , x)} ,
so erhält man d(xn , x) ≤ C für jedes n ∈ N.
❑
Insbesondere gibt es zu jeder konvergenten reell- bzw. komplexwertigen Folge
(xn )n∈N ein Konstante C > 0, sodass |xn | ≤ C, n ∈ N.
3.2.14 Bemerkung. Die Umkehrung von Proposition 3.2.13 ist falsch und zwar in jedem metrischen Raum, der mehr als
einen Punkt enthält. In der Tat gilt für x, y ∈ X mit x , y, dass die Folge x, y, x, y, x, y, x, . . . zwar beschränkt, aber nicht
konvergent ist.
7 Ein
Kreis in einem metrischen Raum hX, di ist hier zu verstehen als {y ∈ X : d(x0 , y) ≤ C}.
3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN
61
3.2.15 Beispiel. Man betrachte die Folge (S n )n∈N aus Beispiel 3.2.9, (ii), für den Fall
|z| = 1 aber z , 1. Wegen (3.5) gilt
Sn =
1 − zn+1
;
1−z
n+1
|
2
also |S n | ≤ 1+|z
|1−z| = |1−z| . Die Folge (S n )n∈N ist damit beschränkt. Sie ist aber nicht konvergent, denn gemäß den Ergebnissen im nächsten Abschnitt wäre dann auch (zn )n∈N
konvergent. Das ist aber nicht der Fall. Man setze z.B. z = i oder z = −1.
3.3 Folgen reeller und komplexer Zahlen
Wir wollen uns hier zunächst mit dem metrischen Raum hR, di beschäftigen, und folgendes einfaches, aber sehr nützliches Lemma bringen.
3.3.1 Lemma. Für zwei konvergente Folgen (xn )n∈N , (yn )n∈N reeller Zahlen mit den
Grenzwerten x bzw. y gilt:
(i) Ist c ∈ R mit x < c (c < x), so gibt es ein N ∈ N, sodass xn < c (c < xn ) für alle
n ≥ N.
(ii) Ist x < y, so gibt es ein N ∈ N, sodass xn < yn für alle n ≥ N.
(iii) Gilt ab einem gewissen N ∈ N die Ungleichung xn ≤ yn , so folgt x ≤ y.
Beweis.
(ii) Setzt man ǫ = y−x
2 , so folgt aus der Konvergenz die Existenz eines N ∈ N, sodass
und
|yn − y| < y−x
|xn − x| < y−x
2
2 für n ≥ N. Somit gilt
−(yn − y) − (x − xn ) ≤ |yn − y| + |x − xn | < (y − x) ;
also
yn − xn = (y − x) + (yn − y) + (x − xn ) > 0.
(i) Folgt aus (ii), wenn wir (yn )n∈N ((xn )n∈N ) als die identische Folge (c)n∈N wählen.
(iii) Wäre x > y, so würde aus (ii) folgen, dass xn > yn für alle n ≥ k mit einem
hinreichend großen k ∈ N. Das widerspricht der Annahme.
❑
Der nächste Satz dient häufig als Werkzeug zur Berechnung von Grenzwerten.
3.3.2 Satz (Einschluss-Satz). Seien (xn )n∈N , (yn )n∈N und (an )n∈N drei reelle Folgen mit
xn ≤ an ≤ yn für alle bis auf endlich viele n ∈ N.
Existieren zudem die Grenzwerte limn→∞ xn und limn→∞ yn , und gilt
lim xn = lim yn ,
n→∞
n→∞
so existiert auch der Grenzwert limn→∞ an und stimmt mit dem gemeinsamen Grenzwert
von (xn )n∈N und (yn )n∈N überein.
KAPITEL 3. DER GRENZWERT
62
Beweis. Setze a := limn→∞ xn . Zu ǫ > 0 wähle N ∈ N mit |xn − a|, |yn − a| < ǫ und
xn ≤ an ≤ yn für n ≥ N. Für solche n folgt
−ǫ < xn − a ≤ an − a ≤ yn − a < ǫ,
d.h. |an − a| < ǫ.
❑
3.3.3 Beispiel. Als einfaches Beispiel betrachte man die Folge
leicht, dass
1
1
0≤ 2
≤ , für n ≥ 3.
n − 3n + 3 n
Also folgt mit Satz 3.3.2, dass limn→∞
1
n2 −3n+3
1
n2 −3n+3
n∈N
. Man sieht
= 0.
3.3.4 Beispiel.
Jede Zahl x ∈ R ist Limes einer Folge (rn )n∈N bestehend aus rationalen Zahlen.
Um das einzusehen, wähle gemäß Satz 2.6.3 für jedes n ∈ N eine Zahl rn ∈ Q,
sodass x < rn < x + 1n . . Aus Satz 3.3.2 folgt limn→∞ rn = x. Genauso gibt eine
Folge irrationaler Zahlen größer x, die gegen x konvergiert.
Arbeitet man mit größerer mathematischen Strenge, so muss man obiges Argument folgendermaßen präzisieren:
Nach Satz 2.6.3 ist die Menge Mn der r ∈ Q mit x < r < x +
1
n
nicht leer. Nun sei ρ einfach eine nach dem
Auswahlaxiom existierende Funktion von N nach ∪n∈N Mn , sodass ρ(n) ∈ Mn . Nun setze einfach rn = ρ(n).
Mit einer etwas feineren Argumentation kann man (rn )n∈N sogar streng monoton
fallend (rn1 > rn2 wenn n1 < n2 ) wählen. Dazu definiert man rn induktiv so, dass
x < rn < min(x + 1n , rn−1 ). Genauso kann man eine streng monoton wachsende
Folge aus Q konstruieren, die gegen x konvergiert.
Lässt man auch hier mehr Strenge walten, so benötigt man zur Existenz der Folge (rn )n∈N den Rekursionssatz:
Für jedes y > x und jedes n ∈ N ist die Menge Q ∩ (x, min(y, x + 1n )) nicht leer. Sei ̺ : N × (x, +∞) → Q eine
Auswahlfunktion, sodass ̺(n, y) ∈ Q ∩ (x, min(y, x + 1n )). Nun sei a := (1, r1 ) ∈ N × ((x, +∞) ∩ Q) =: A und
g : A → A definiert durch g(n, y) = (n + 1, ̺(n, y)). Nach dem Rekursionssatz gibt es eine Funktion φ : N → A
mit φ(1) = a und φ(n + 1) = g(φ(n)). Ist für n ∈ N nun rn die zweite Komponente von φ(n), so hat (rn )n∈N die
geforderten Eigenschaften.
Sei F ⊆ R nach oben beschränkt und x := sup F. Gemäß der Definition des
Supremums gilt (x − 1n , x] ∩ F , ∅ für alle n ∈ N. Wählt man für jedes n ∈ N eine
reelle Zahl xn ∈ (x − n1 , x] ∩ F, so erhält man eine Folge (xn )n∈N , in F, die gegen
sup F konvergiert. Man kann ähnlich wie oben (xn )n∈N sogar monoton wachsend
wählen.
Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum.
Im nächsten Satz wollen wir zeigen, dass die algebraischen Operationen und die
Betragsfunktion auf R und C mit dem Grenzwertbegriff verträglich sind.
3.3.5 Satz (Rechenregeln für Folgen). Seien (zn )n∈N und (wn )n∈N konvergente Folgen
reeller oder komplexer Zahlen, limn→∞ zn =: z, limn→∞ wn =: w, und sei λ ∈ R bzw.
λ ∈ C. Dann gilt für k ∈ N
3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN
63
(i) limn→∞ |zn | = |z|, limn→∞ z̄n = z̄.
(ii) limn→∞ (zn + wn ) = z + w, limn→∞ (−zn ) = −z.
(iii) Ist z = 0, also zn → 0, n → ∞, und ist (un )n∈N eine beschränkte Folge aus R bzw.
C, dann gilt limn→∞ (zn · un ) = 0.
(iv) limn→∞ (λzn ) = λz und limn→∞ (zn · wn ) = z · w.
(v) limn→∞ zkn = zk .
(vi) Falls z , 0 ist, gilt limn→∞
1
zn
= 1z .
√
√
(vii) Ist zn ∈ R und zn ≥ 0, so folgt limn→∞ k zn = k z.
3.3.6 Bemerkung. Bis auf den letzten Punkt werden wir Satz 3.3.5 für komplexe Folgen
beweisen. Fast derselbe Beweis funktioniert für reellwertige Folgen.
Man kann aber die Rechenregeln für reellwertige Folgen auch aus denen für
komplexwertige Folgen herleiten, da – wie wir gleich zeigen wollen – eine Folge
(xn )n∈N in R genau dann konvergiert, wenn (xn + i0)n∈N in C konvergiert. Dabei gilt
limn→∞ (xn + i0) = (limn→∞ xn ) + i0.
Ist (xn )n∈N eine reellwertige Folge, welche gegen ein x ∈ R konvergiert, so konvergiert (xn + i0)n∈N gegen x + i0, da ja |(xn + i0) − (x + i0)| = |xn − x| → 0; vgl. Bemerkung
3.2.3.
Konvergiert umgekehrt für eine reellwertige Folge (xn )n∈N die Folge (xn + i0)n∈N in
C gegen x + iy ∈ C, so muss wegen
0 ≤ max(|xn − x|, |0 − y|) ≤ |(xn + i0) − (x + iy)| → 0, n → ∞,
gemeinsam mit Satz 3.3.2 folgen, dass xn → x und |y| → 0, d.h. y = 0.
Beweis. (Satz 3.3.5)
(i) Zu ǫ > 0 wähle N ∈ N, sodass |zn −z| < ǫ für n ≥ N. Mit der Dreiecksungleichung
nach unten erhält man
|zn | − |z| ≤ |zn − z| < ǫ, |z̄n − z̄| = |zn − z| < ǫ.
Man kann limn→∞ |zn | = |z| auch als Spezialfall von Lemma 3.2.10 sehen: |zn | =
d(zn , 0) → d(z, 0) = |z|.
(ii) Sei ǫ > 0 gegeben. Wähle N so, dass |zn − z| <
n ≥ N. Es gilt für solche n
ǫ
2
und auch |wn − w| <
|(zn + wn ) − (z + w)| = |(zn − z) + (wn − w)| ≤ |zn − z| + |wn − w| <
ǫ
2
für alle
ǫ ǫ
+ = ǫ.
2 2
Also ist (zn + wn )n∈N konvergent und der Grenzwert ist z + w. Weiters gilt für N
so groß, dass |zn − z| < ǫ, wenn nur n ≥ N, auch
|(−zn ) − (−z)| = | − (zn − z)| = |zn − z| < ǫ, n ≥ N.
Also konvergiert (−zn )n∈N gegen −z.
KAPITEL 3. DER GRENZWERT
64
(iii) Ist C > 0 so, dass |un | ≤ C, n ∈ N, und ist ǫ > 0, so gibt es wegen zn → 0 ein
N ∈ N, sodass |zn | < Cǫ , n ≥ N. Es folgt |zn ·un | < ǫ für alle n ≥ N, also zn ·un → 0.
(iv) Ist N so groß, dass |zn − z| < ǫ für n ≥ N, so gilt
|λzn − λz| = |λ| · |zn − z| < λ · ǫ, n ≥ N.
Gemäß (3.4) folgt daher λzn → λz.
Um zn wn → zw nachzuweisen, sei daran erinnert, dass gemäß Proposition 3.2.13
konvergente Folgen beschränkt sind. Nach (ii) konvergiert (zn − z) gegen Null,
und mit (iii) daher auch (zn − z)wn → 0, n → ∞. Der schon bewiesene Teil von
(iv) gibt nun zusammen mit (ii)
n→∞
zn wn = (zn − z)wn + zwn −→ 0 + zw.
(v) Das folgt durch vollständige Induktion nach k aus (iv).
(vi) Sei nun z , 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z für hinreichend
großes n, dass |zn | > |z|2 . Es folgt die Abschätzung
1 − 1 = |z − zn | ≤ |z − z | · 2 ,
n
zn z |z| · |zn |
|z|2
und damit wird die Differenz
1
zn
−
1
z
für große n beliebig klein.
(vii) Sei zunächst z > 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z die Existenz von
N ∈ N, sodass für n ≥ N sicher zn > 2z > 0 und |zn − z| < ǫ. Gemäß (2.10) gilt für
solche n
√
√
|zn − z|
≤
| k zn − k z| = √ k−1 √ k−2 √
√
√
√
k
k
k
| z + z
zn + . . . + k zn k−2 k z + k zn k−1 |
|zn − z|
ǫ
pk z k−1 < pk z k−1 ,
+ 2
| k 2
| 2
2 + ...+
2
2 +
2
√
√
da klarerweise auch z > 2z . Gemäß (3.4) folgt k zn → k z.
pk z k−1
pk z k−2 pk z
pk z k−2 pk z
Ist z = 0, so sei ǫ > 0 vorgegeben. Ist nun N ∈ N so, dass zn = |zn − 0| < ǫ k für
n ≥ N, dann folgt aus der Monotonie der Wurzelfunktion (vgl. Bemerkung 2.7.7)
√
√
√
| k zn − 0| = k zn < ǫ. Also k zn → 0.
❑
3.3.7 Beispiel.
(i) Wegen limn→∞ n1 = 0 folgt aus Satz 3.3.5, (vii), dass limn→∞ √p1n = 0. Zusammen
mit Satz 3.3.5, (v), erhält man also, dass für alle r ∈ Q, r > 0,
lim
n→∞
1
=0.
nr
3.4. MONOTONE FOLGEN
65
√
√
(ii) Um für xn = n3 + 1 − n3 + 2n den Grenzwert zu berechnen, verwenden wir
(2.10) und erhalten
√
n3 + 1 −
Wegen
√
(n3 + 1) − (n3 + 2n)
n3 + 2n = √
=
√
n3 + 1 + n3 + 2n
1 − 2n
= q
√
√
3
n + 1 + n3 + 2n
n+
0≤ q
n+
1
1
n2
q
+ n+
2
n
1
n
−2
q
1
+ n+
n2
.
2
n
1
≤ √
n
ergibt Satz 3.3.2, dass der mittlere Ausdruck gegen Null konvergiert. Zusammen
mit Satz 3.3.5, (iv), folgt limn→∞ xn = 0.
√
(iii) Die Folge xn = n n konvergiert gegen 1. In der Tat gilt für die Folge an := xn − 1,
dass an ≥ 0 und (1 + an )n = n. Nach dem Binomischen Lehrsatz gilt
!
n
X
n(n − 1) 2
n k n−k
an .
n = (an + 1)n =
an 1 ≥ 1 +
2
k
k=0
Damit folgt a2n ≤
xn → 1, n → ∞.
2(n−1)
n(n−1)
=
2
n
→ 0. Gemäß Satz 3.3.5, (vii), gilt an → 0 und damit
(iv) Ist q > 0 fest, so gilt limn→∞
gilt für n ≥ q
Nach Satz 3.3.2 folgt
verwende Satz 3.3.5.
√n
q = 1. Betrachte zunächst den Fall q ≥ 1. Dann
1≤
√
√n
q ≤ nn.
√n
q → 1. Im Fall 0 < q < 1 betrachte
1
√
nq
=
q
n
1
q
und
(v) Um für z ∈ C mit |z| < 1 und√ k ∈ N den Grenzwert limn→∞ nk · zn zu berechnen,
sei N ∈ N so groß, dass | nk · z| < 1+|z|
2 (< 1) für alle n ≥ N, was wegen
√
k
limn→∞ n · |z| = |z| zusammen mit Lemma 3.3.1 möglich ist. Für n ≥ N gilt
dann
!n
1 + |z|
k
n
0 ≤ |n · z | ≤
,
2
und somit limn→∞ nk · zn = 0.
3.4 Monotone Folgen
Bisher haben wir zwar gesehen, was aus der Konvergenz einer oder mehrerer Folgen
folgt. Das Problem, ob eine gegebene Folge konvergiert oder nicht haben wir jedoch
nicht betrachtet. Die definierende Eigenschaft von R, vollständig angeordnet zu sein,
wird uns in R die Existenz von Grenzwerten bestimmter Folgen liefern.
3.4.1 Definition. Eine Folge (an )n∈N in R heißt monoton wachsend, falls an ≤ an+1 für
alle n ∈ N, dh.
a1 ≤ a2 ≤ a3 ≤ . . .
KAPITEL 3. DER GRENZWERT
66
Sie heißt monoton fallend, falls an ≥ an+1 für alle n ∈ N, dh.
a1 ≥ a2 ≥ a3 ≥ . . .
Eine Folge heißt monoton, wenn monoton wachsend oder monoton fallend ist.
3.4.2 Satz. Sei (xn )n∈N eine monoton wachsende und nach oben beschränkte Folge.
Dann konvergiert (xn )n∈N , wobei
lim xn = sup{xn : n ∈ N} .
n→∞
Entsprechend konvergiert eine monoton fallende und nach unten beschränkte Folge
(xn )n∈N gegen inf{xn : n ∈ N}.
Beweis. Sei (xn )n∈N monoton wachsend und nach oben beschränkt. Somit existiert
x := sup{xn : n ∈ N}. Wir zeigen, dass limn→∞ xn = x. Sei ǫ > 0. Wegen x − ǫ < x kann
x − ǫ keine obere Schranke der Menge {xn : n ∈ N} sein. Es gibt also ein N ∈ N mit
xN > x − ǫ. Wegen der Monotonie folgt auch xn > x − ǫ für alle n ≥ N. Da stets x ≥ xn
gilt, erhält man für n ≥ N
0 ≤ x − xn < ǫ,
und damit |xn − x| < ǫ.
Für monoton fallende Folgen schließt man in analoger Art und Weise.
❑
3.4.3 Beispiel.
(i) Betrachte die Folge n1
. Gemäß Beispiel 2.6.2 gilt inf{ n1 : n ∈ N} = 0. Also
n∈N
folgt aus Satz 3.4.2, dass limn→∞ 1n = 0. Dieses Konvergenzverhalten haben wir
übrigens auch schon in Beispiel 3.2.4, (ii), festgestellt.
(ii) Die Bedingung in Satz 3.4.2 ist
für Konvergenz, aber nicht notwen hinreichend
n
dig. Betrachte dazu die Folge (−1)
.
n
n∈N
√
√
(iii) Nach dem Rekursionssatz Satz 2.3.3 ist durch a1 = 2 und an+1 = 2 + an eine
Folge in [0, +∞) wohldefiniert. Wir behaupten, dass dabei an ≤ 2 und an ≤ an+1
für alle n ∈ N, was wir mittels vollständiger Induktion zeigen wollen.
q
√
√
√
Für n = 1 gilt offenbar a1 = 2 ≤ 2 und a1 = 2 ≤ 2 + 2 ≤ a2 .
√
√
Gelte nun an √
≤ 2 und an √≤ an+1 . Daraus folgt an+1 = 2 + an ≤ 2 + 2 = 2 und
auch an+1 = 2 + an ≤ 2 + an+1 = an+2 .
Gemäß Satz
√ 3.4.2 konvergiert (an )n∈N gegen a = sup{an : n ∈ N}, welches sicher
a ≥ a1 = 2 > 0 erfüllt. Um a genau zu berechnen, sei bemerkt, dass auch (vgl.
Satz 3.3.5)
p
√
a = lim an+1 = lim 2 + an = 2 + a .
n→∞
n→∞
2
Somit erfüllt a die Gleichung a − a − 2 = 0. Also gilt a = 2 oder a = −1, wobei
die zweite Möglichkeit wegen a > 0 ausgeschlossen werden kann.
(iv) Für n ∈ N sei
1
en = 1 +
n
!n
1
und fn = 1 +
n
!n+1
.
3.4. MONOTONE FOLGEN
67
Offenbar gilt immer 1 < en < fn . Wir rechnen mit Hilfe der Version der Bernoullische Ungleichung aus Beispiel 2.3.11

!n+1
!
1 n+1
en+1
1  1 + n+1 
n + 1 n2 + 2n + 1 − 1
=
= 1+
=



en
n
n
n2 + 2n + 1
1 + 1n
n+1
1
1−
n
(n + 1)2
!n+1
>
!
1
n+1 n
n
1 − (n + 1)
=
= 1.
n+1
(n + 1)2
n n+1
Ähnlich gilt
fn
fn+1
1
=
1+
1
n
1+ 2
n+1
n + 2n
1
n

n+2
!n+2
 1 + 1n 
n2 + 2n + 1

 = n
=
1
n+1
n2 + 2n
1 + n+1
!n+2
!
n
1
n n+1
>
=1.
1 + (n + 2) 2
=
n+1
n + 2n
n+1 n
Also ist (en )n∈N streng monoton wachsend und ( fn )n∈N streng monoton fallend.
Wegen 1 < en < fn ≤ f1 = 4 für alle n ∈ N sind diese Folgen auch beschränkt,
und somit konvergent, wobei
!
1
lim fn = lim 1 +
· en = 1 · lim en .
n→∞
n→∞
n→∞
n
Den gemeinsamen Grenzwert dieser Folgen nennt man die Eulersche Zahl e.
Für nach oben beschränkte, aber nicht notwendigerweise monotone Folgen gilt folgende schwächere Aussage.
3.4.4 Lemma. Sei (xn )n∈N eine beschränkte Folge aus R. Für N ∈ N sei
yN := inf{xn : n ≥ N}.
Dann ist die Folge (yN )N∈N monoton wachsend, beschränkt, und konvergiert daher gegen sup{yN : N ∈ N}. Also existiert der sogenannte Limes Inferior
lim inf xn := sup inf xn = lim inf xn .
n→∞
N∈N n≥N
N→∞ n≥N
Schließlich gibt es eine Teilfolge (xn( j) ) j∈N von (xn )n∈N , die ebenfalls gegen
lim inf n→∞ xn konvergiert.
Entsprechendes gilt, wenn man alle Infima durch Suprema und umgekehrt ersetzt.
Also ist (zN )N∈N mit zN = sup{xn : n ≥ N} monoton fallend und beschränkt. Ihren
Grenzwert nennt man Limes Superior
lim sup xn := inf sup xn = lim sup xn .
n→∞
N∈N n≥N
N→∞ n≥N
Beweis. Gemäß Voraussetzung gilt |xn | ≤ C, n ∈ N für ein reelles C > 0. Somit
existiert für jedes N ∈ N
yN := inf{xn : n ≥ N} ≤ C ,
KAPITEL 3. DER GRENZWERT
68
und in Folge auch y := sup{yN : N ∈ N}. Aus {xn : n ≥ N + 1} ⊆ {xn : n ≥ N} folgt
yN+1 ≥ yN , und aus Satz 3.4.2 die Tatsache limn→∞ yn = y, wobei ym ≤ y für alle m ∈ N.
Wir definieren nun rekursiv eine Teilfolge8 (xn( j) ) j∈N von (xn )n∈N , indem wir
zunächst n(1) = 1 setzen. Ist n( j) ∈ N definiert, so existiert wegen yn( j)+1 ≤ y ein
n( j + 1) ∈ N derart, dass n( j + 1) > n( j) und
yn( j)+1 = inf{xk : k > n( j)} ≤ xn( j+1) < y +
1
.
j+1
1
Wegen yn( j) ≤ yn( j)+1 ≤ xn( j+1) < y + j+1
liefert das Einschlusskriterium Satz 3.3.2 die
Konvergenz von (xn( j) ) j∈N gegen y.
Der Beweis für den Limes Superior verläuft entsprechend.
❑
3.4.5 Fakta.
1. Aus inf n≥N xn ≤ supn≥N xn , N ∈ N folgt unmittelbar
lim inf xn ≤ lim sup xn .
n→∞
n→∞
2. Weiters folgt aus den Rechenregeln für Suprema und Infima sofort, dass
lim supn→∞ (−xn ) = − lim inf n→∞ xn sowie lim supn→∞ an ≤ lim supn→∞ bn und
lim inf n→∞ an ≤ lim inf n→∞ bn für beschränkte Folgen (an )n∈N , (bn )n∈N mit an ≤
bn ab einem Index N ∈ N.
3. Ist (xn )n∈N konvergent, so folgt aus Lemma 3.4.4 und Satz 3.2.8, (iv), dass
lim inf xn = lim xn = lim sup xn .
n→∞
n→∞
(3.7)
n→∞
4. Gilt umgekehrt y := lim inf n→∞ xn = lim supn→∞ xn , so gibt es zu jedem ǫ > 0
ein N1 ∈ N, sodass y − ǫ < inf n≥N xn ≤ y für alle N ≥ N1 , und ein N2 ∈ N, sodass
y ≤ supn≥N < y + ǫ für alle N ≥ N2 . Für N ≥ max(N1 , N2 ) folgt
y − ǫ < inf xn ≤ xN ≤ sup < y + ǫ ,
n≥N
n≥N
und damit die Konvergenz von (xn )n∈N gegen y; also gilt (3.7).
5. Aus lim supn→∞ xn = limN→∞ supn≥N xn zusammen mit Satz 2.6.3 und Lemma
3.3.1 zeigt man, dass lim supn→∞ xn < ξ genau dann, wenn es ein q < ξ gibt,
sodass xn ≤ q für alle bis auf endlich viele n ∈ N. Entsprechendes gilt für
lim inf n→∞ xn > ξ.
6. Ähnlich gilt lim supn→∞ xn > ξ genau dann, wenn es ein q > ξ gibt, sodass xn ≥ q
für unendlich viele n ∈ N. Entsprechendes gilt für lim inf n→∞ xn < ξ.
7. In der Tat ist lim supn→∞ xn jene eindeutige Zahl x, für die gilt:
Für jedes ǫ > 0 gibt es nur für endlich viele n ∈ N, die der Ungleichung xn ≥ x + ǫ genügen, wogegen für unendlich
viele n ∈ N die Ungleichung xn ≥ x − ǫ gilt. Auch hier gilt entsprechendes für lim inf n→∞ xn .
8 Dass
man so verfahren kann, wird durch den Rekursionssatz gewährleistet.
3.5. CAUCHY-FOLGEN
69
3.5 Cauchy-Folgen
Um in Allgemeinen metrischen Räumen Folgen auf Konvergenz zu untersuchen, führt
man den Begriff der Cauchy-Folge ein.
3.5.1 Definition. Sei hX, di ein metrischer Raum. Eine Folge (xn )n∈N von Elementen
aus X heißt Cauchy-Folge9, falls
∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle n, m ≥ N .
(3.8)
3.5.2 Bemerkung. Da es wegen Satz 2.6.3 zwischen jedem ǫ ∈ R, ǫ > 0 und der Zahl 0
ein ε ∈ Q mit 0 < ε < ǫ gibt, erhält man eine zu Definition 3.5.1 äquivalente Definition,
wenn man in (3.8) statt ∀ǫ ∈ R, ǫ > 0 . . . den Ausdruck ∀ǫ ∈ Q, ǫ > 0 . . . schreibt.
Aus dem selben Grund lässt sich die Konvergenz einer Folge durch (3.3) charakterisieren, wenn man in eben dieser Gleichung ∀ǫ ∈ Q, ǫ > 0 . . . anstatt ∀ǫ ∈ R, ǫ > 0 . . .
schreibt.
Ähnlich wie in Proposition 3.2.13 gilt.
3.5.3 Proposition. Sei (xn )n∈N eine Cauchy-Folge. Dann ist {xn : n ∈ N} beschränkt.
Beweis. Wähle N ∈ N mit d(xn , xm ) < 1 für n, m ≥ N. Setzt man
C := 1 + max{d(x1 , xN ), . . . , d(xN−1 , xN )} ,
so gilt d(xn , xN ) ≤ C für jedes n ∈ N.
❑
Aus dem nächsten Resultat erkennt man einen Zusammenhang zum Begriff der
Konvergenz.
3.5.4 Proposition. Ist die Folge (xn )n∈N konvergent, so ist sie eine Cauchy-Folge.
Beweis. Sei ǫ > 0 gegeben. Aus der Definition der Konvergenz folgt die Existenz
einer Zahl N ∈ N mit der Eigenschaft, dass d(xn , x) < 2ǫ , n ≥ N. Hier bezeichnet
x den Grenzwert der Folge (xn )n∈N , der zwar nach Voraussetzung existiert, über den
sonst aber nichts bekannt zu sein braucht. Dann gilt nach der Dreiecksungleichung für
n, m ≥ N
ǫ ǫ
d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < + = ǫ.
2 2
❑
Also ist jede konvergente Folge eine Cauchy-Folge. Würde nun umgekehrt jede
Cauchy-Folge konvergieren, so könnten wir die Konvergenz einer Folge nachweisen,
ohne ihren Grenzwert explizit in der Hand zu haben. Leider ist dies bei vielen metrischen Räumen nicht der Fall.
3.5.5 Definition. Ein metrischer Raum hX, di heißt vollständig, wenn jede CauchyFolge von Elementen aus X in X einen Grenzwert besitzt.
9 Augustin
Louis Cauchy. 21.8.1789 Paris - 22.5.1857 Sceaux (bei Paris)
KAPITEL 3. DER GRENZWERT
70
3.5.6 Beispiel. Die rationalen Zahlen sind nicht vollständig. Dazu betrachte man z.B.
eine
√ Folge (rn )n∈N bestehend aus rationalen Zahlen wie in Beispiel 3.3.4, die gegen
2 ∈ R \ Q konvergiert.
Diese ist eine Cauchy-Folge in R und daher auch in Q. Sie konvergiert
aber nicht
√
in Q. Denn würde sie das tun, so würde sie in R einerseits gegen 2 und andererseits gegen einen Grenzwert in Q konvergieren. Das widerspricht der Eindeutigkeit des
Grenzwertes in R.
3.5.7 Lemma. Sei (xn )n∈N eine Cauchy-Folge in einem metrischen Raum hX, di, die
eine konvergente Teilfolge hat. Dann ist (xn )n∈N konvergent.
Proof. Sei (xn(k) )k∈N die konvergente Teilfolge mit limk→∞ xn(k) = x. Zu ǫ > 0 wähle
N1 so groß, dass d(xn , xm ) < ǫ für n, m ≥ N1 . Wähle N2 so groß, dass d(xn(k) , x) < ǫ für
k ≥ N2 . Setze N := max{N1 , N2 }. Wählt man nun k ≥ N, so folgt n(k) ≥ k ≥ N, und
man erhält für n ≥ N
d(xn , x) ≤ d(xn , xn(k) ) + d(xn(k) , x) < ǫ + ǫ = 2ǫ.
Das wichtigste Beispiel für einen vollständige metrischen Raum sind die reellen
Zahlen.
3.5.8 Satz (Cauchysches Konvergenzkriterium). Sei (xn )n∈N eine Cauchy-Folge reeller
Zahlen. Dann existiert eine reelle Zahl x, sodass (xn )n∈N gegen x konvergiert.
Beweis. Gemäß Proposition 3.5.3 ist die Cauchy-Folge (xn )n∈N beschränkt. Nach
Lemma 3.4.4 hat (xn )n∈N eine konvergente Teilfolge. Schließlich konvergiert gemäß
Lemma 3.5.7 auch die Folge (xn )n∈N selbst.
❑
3.5.9 Beispiel.
Der metrische Raum X = [0, 1] versehen mit der euklidischen Metrik ist auch
vollständig, denn ist (xn )n∈N eine Cauchy-Folge in X, so ist sie das auch in R.
Wegen Satz 3.5.8 gilt limn→∞ xn = x für ein x ∈ R.
Wegen 0 ≤ xn ≤ 1, n ∈ N, folgt aus Lemma 3.3.1, (iii), dass auch x ∈ X. Also
hat jede Cauchy-Folge in X einen Grenzwert in X.
Ist dagegen etwa X = (0, 1] versehen mit der euklidischen Metrik, so ist n1
n∈N
eine
Cauchy-Folge in X. Sie hat aber in X keinen Grenzwert, denn sonst würde
1
n n∈N auch in R gegen diesen Grenzwert x ∈ X ⊆ R und andererseits gegen 0
streben. Wegen 0 < X muss x , 0 im Widerspruch zu Satz 3.2.8, (i).
3.6 Konvergenz in weiteren metrischen Räumen
Wir betrachten die Menge R p (p ∈ N) und versehen diesen mit den drei schon vorgestellten Metriken d1 , d2 , d∞ . Wie bereits bemerkt, unterscheiden sich diese Metriken
voneinander.
3.6. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN
71
Der Unterschied ist aber nicht allzu groß. In der Tat werden wir sehen, dass wenn
eine Folge bezüglich einer der drei Metriken konvergiert, diese dann auch bezüglicher
der anderen zwei konvergiert10.
Der Grund dafür liegt in der Ungleichungskette
max {|xk |} ≤
k=1,...,p
p
X
k=1
|xk |2
21
≤
p
X
k=1
|xk | ≤ p · max {|xk |} .
k=1,...,p
(3.9)
Das zweite ≤“ sieht man durch quadrieren. Das erste und dritte ist klar.
”
3.6.1 Proposition. Sei (xn )n∈N eine Folge von Punkten xn = (xn,1 , . . . , xn,p ) ∈ R p , und
x = (x1 , . . . , x p ) ∈ R p . Dann impliziert limn→∞ xn = x bezüglich einer der Metriken d1 ,
d2 , d∞ auch limn→∞ xn = x bezüglich der anderen zwei Metriken aus d1 , d2 , d∞ .
Die Konvergenz von (xn )n∈N gegen x bezüglich einer und daher aller dieser Metriken ist wiederum äquivalent zur komponentenweisen Konvergenz 11
lim xn,k = xk für alle k = 1, . . . , p .
n→∞
(3.10)
Insbesondere konvergiert eine Folge (zn )i∈N komplexer Zahlen gegen ein z ∈ C genau
dann, wenn12
lim Re(zn ) = Re z und lim Im(zn ) = Im z .
n→∞
n→∞
Beweis. Aus Ungleichung (3.9) schließen wir auf
d∞ (xn , x) ≤ d2 (xn , x) ≤ d1 (xn , x) ≤ p · d∞ (xn , x).
Das Einschlusskriterium Satz 3.3.2 liefert nun sofort, dass, wenn eine der Folgen
d1 (xn , x) n∈N , d2 (xn , x) n∈N bzw. d∞ (xn , x) n∈N eine Nullfolge ist, es dann die beiden
anderen Folgen auch sind. Aus Bemerkung 3.2.3 folgt, dass die Konvergenzbegriffe
bzgl. der drei Metriken übereinstimmen.
Sei nun limn→∞ xn = x bezüglich bezüglich einer dieser Metriken und daher insbesondere bezüglich d∞ . Für k = 1, . . . , p gilt
0 ≤ |xn,k − xk | ≤ max {|xn, j − x j |} = d∞ (xn , x) .
j=1,...,p
Wieder nach dem Einschlusskriterium Satz 3.3.2 zusammen mit Bemerkung 3.2.3 folgt
limn→∞ xn,k = xk .
Sei umgekehrt (3.10) vorausgesetzt und ǫ > 0 gegeben. Wähle N1 , . . . , N p , sodass
für k = 1, . . . , p folgt |xn,k − xk | < ǫ, n ≥ Nk . Setzt man N := max{N1 , . . . , N p }, so folgt
d∞ (xn , x) = max {|xn,k − xk |} < ǫ .
k=1,...,p
Also gilt xn → x bezüglich d∞ .
❑
10 Es sei aber hier auch darauf hingewiesen, dass es auf ein und der selben Menge Metriken d, d̃ geben
kann, sodass eine gewissen Folge (xn )n∈N in dieser Menge bezüglich d konvergiert, aber bezüglich d̃ divergiert.
11 Diese Konvergenz versteht sich in R bezüglich der euklidischen Metrik.
12 Vergleiche Bemerkung 3.3.6.
KAPITEL 3. DER GRENZWERT
72
3.6.2 Beispiel. Man betrachte die Folge (xn )n∈N im R3 gegeben durch


n
X
1 
1 
n
xn = · (−1) , 2 − 3n,
.
n
2k 
k=0
P
Wegen | n1 · (−1)n | = 1n → 0 und 1n · nk=0 21k ≤ n2 → 0 konvergieren die erste und die
dritte Komponente gegen 0.
Die zweite konvergiert wegen n1 (2 − 3n) = 2n − 3 gegen −3. Also konvergiert unsere
Folge bezüglich d1 , d2 , d∞ gegen (0, −3, 0).
3.6.3 Korollar. Der Raum R p versehen mit einer der Metriken d1 , d2 , d∞ ist
vollständig. Insbesondere sind die komplexen Zahlen vollständig.
Beweis. Zunächst sei bemerkt, dass wenn eine Folge (xn )n∈N von Punkten des R p eine
Cauchy-Folge bezüglich einer der Metriken d1 , d2 , d∞ ist, so ist sie das wegen
d∞ (xn , xm ) ≤ d2 (xn , xm ) ≤ d1 (xn , xm ) ≤ p · d∞ (xn , xm )
auch bezüglich der beiden anderen Metriken.
Sei nun (xn )n∈N eine Cauchy-Folge von Punkten des R p (bzgl. d1 , d2 , d∞ ), wobei
xn = (xn,1 , . . . , xn,p ). Dann gibt es zu jedem vorgegebenen ǫ > 0 eine Zahl N ∈ N mit
d∞ (xn , xm ) < ǫ für n, m ≥ N. Es folgt für jedes k ∈ {1, . . . , p}
|xn,k − xm,k | ≤ d∞ (xn , xm ) < ǫ, n, m ≥ N ,
d.h. jede der Folgen (xn,k )n∈N , k = 1, . . . , p, ist eine Cauchy-Folge reeller Zahlen. Daher
existieren y1 , . . . , y p ∈ R mit
lim xi,k = yk , k = 1, . . . , p .
i→∞
Wegen Proposition 3.6.1 folgt limn→∞ xn = y mit y = (y1 , . . . , y p ).
❑
3.6.4 Bemerkung. Die in Satz 3.3.5 hergeleiteten Rechenregeln gelten zum Teil auch
in R p , wenn R p mit der euklidischen Metrik und mit den Verknüpfungen +“ und
”
skalares Multiplizieren“ wie aus der Linearen Algebra bekannt versehen wird. Sind
”
p
also (xn )n∈N , (yn )n∈N Folgen in R , die gegen x bzw. y konvergieren, und ist (λn )n∈N
eine gegen ein λ ∈ R konvergente Folge in R, so gilt
(i) limn→∞ (xn + yn ) = x + y.
(ii) limn→∞ λn xn = λx.
(iii) limn→∞ (xn , yn ) = (x, y) (∈ R) (vgl. (3.2)).
Das folgt aus Proposition 3.6.1, da man die jeweiligen Konvergenzen auf die Komponenten von R p zurückführen kann. Eine andere Möglichkeit, diese Behauptungen zu
p
beweisen, besteht darin, den euklidischen
qPAbstand d2 (x, y) zweier Punkte x, y ∈ R als
p
2
kx − yk2 zu schreiben, wobei kxk2 =
k=1 |xk | , und im Beweis von Satz 3.3.5 den
Betrag durch k.k ersetzt. Siehe Bemerkung 3.1.7.
3.7. KONVERGENZ GEGEN UNENDLICH
73
Dass es auf ein und derselben Menge zwei Metriken geben kann, sodass die Konvergenz einer Folge bezüglich der einen Metrik nicht die Konvergenz bezüglich der
anderen bedingt, zeigt folgendes Beispiel.
3.6.5 Beispiel. Man betrachte R einerseits versehen mit der Euklidischen Metrik d2 , also die von |.| induzierte Metrik, und andererseits mit der diskreten Metrik d aus Beispiel
3.1.5, (iv).
Außerdem betrachte man die Folge n1
, welche bekannterweise gegen 0 konn∈N
vergiert. Bezüglich d tut sie das nicht, da ja immer d(0, 1n ) = 1, n ∈ N.
Man zeigt unschwer, dass eine Folge (xn )n∈N bezüglich d genau dann gegen x konvergiert, wenn xn = x ab einem Index n0 .
3.6.6 Beispiel. Sei p eine feste Primzahl. Die Folge (pn )n∈N ist bezüglich der Metrik d(p) auf Z gegen 0 konvergent, bezüglich
der euklidischen Metrik d2 auf Z jedoch divergent. Um das einzusehen, sei ǫ > 0 gegeben. Wählt man N ∈ N mit p1N < ǫ,
so gilt für alle n ≥ N
1
1
d(p) (pn , 0) = n ≤ N < ǫ .
p
p
Angenommen es existiere x ∈ Z, sodass pn → x bezüglich d2 . Wähle N ∈ N, sodass d2 (pn , x) < 1, n ≥ N. Dann folgt mit
der Bernoullischen Ungleichung
1 + n(p − 1) ≤ pn = d2 (pn , 0) ≤ d2 (pn , x) + d2 (x, 0) < 1 + |x|, n ≥ N ,
und weiter, dass n(p − 1) ≤ |x|, n ≥ N, was der Tatsache widerspricht, dass R archimedisch angeordnet ist.
Tatsächlich sind in hZ, d2 i nur die ab einem Index konstanten Folgen konvergent, da konvergente Folgen auch CauchyFolgen sind, und damit insbesondere ab einem gewissen Index der Abstand zweier Folgenglieder kleiner als 1 ist. Zwei
verschiedene ganze Zahlen haben aber sicher einen Abstand von mindestens 1.
3.7 Konvergenz gegen unendlich
Die Folge xn = n, n ∈ N, als Folge in R ist nicht konvergent. Sie ist ja nicht einmal
beschränkt. Trotzdem zeigt sie ein doch recht determiniertes Verhalten. Aus dem Bauch
heraus würde man sagen, dass sie gegen unendlich“ strebt.
”
3.7.1 Definition. Eine Folge (xn )n∈N aus R heißt konvergent gegen +∞, in Zeichen
xn → +∞, n → ∞, falls
∀M > 0 ∃N ∈ N : xn > M für n ≥ N .
(3.11)
Entsprechend sagen wir, dass eine Folge (xn )n∈N aus R gegen −∞ strebt, in Zeichen
xn → −∞, n → ∞, wenn
∀M < 0 ∃N ∈ N : xn < M für n ≥ N .
(3.12)
Folgen, die im obigen Sinne gegen +∞ oder −∞ streben, heißen auch bestimmt divergent.
3.7.2 Bemerkung. Unmittelbar aus (3.11) bzw. (3.12) und Lemma 3.3.1, (i), erkennt
man, dass sich für eine Folge (xn )n∈N und ein x ∈ R die Konvergenzen limn∞∞ xn = +∞
und limn∞∞ xn = x gegenseitig ausschließen. Genauso kann limn∞∞ xn = −∞ und
limn∞∞ xn = x nicht gleichzeitig stattfinden. Ebenso schließen sich limn∞∞ xn = +∞
und limn∞∞ xn = −∞ gegenseitig aus.
KAPITEL 3. DER GRENZWERT
74
Ist (xn )n∈N in R und x ∈ R oder x = ±∞, so kann man x = limn→∞ xn einheitlich
folgendermaßen schreiben:
(∀ξ ∈ R, ξ < x ∃N ∈ N : ∀n ≥ N ⇒ xn > ξ) ∧
(∀η ∈ R, η > x ∃N ∈ N : ∀n ≥ N ⇒ xn < η).
Für die Konvergenzbegriffe aus Definition 3.7.1 gelten ähnliche Regeln, wie bei der
Konvergenz gegen Zahlen.
3.7.3 Satz. Für Folgen (xn )n∈N und (yn )n∈N aus R, sodass limn→∞ xn = +∞, gelten
folgende Aussagen.
(i) Ist die Menge {yn : n ∈ N, n ≥ k} für ein gewisses k ∈ N nach unten beschränkt,
dann gilt
lim (xn + yn ) = +∞.
n→∞
(ii) limn→∞ (−xn ) = −∞.
(iii) Ist yn ≥ C für ein gewisses C > 0 und für alle n ∈ N, n ≥ k mit einem gewissen
k ∈ N, so gilt limn→∞ xn yn = +∞.
(iv) Ist xn ≤ yn , für alle n ∈ N, n ≥ k für einen gewissen Index k ∈ N, so folgt
limn→∞ yn = +∞.
(v) Seien alle bis auf endlich viele, d.h. alle ab einem Index k ∈ N, yn positiv (negativ).
Dann gilt limn→∞ yn = +∞ (−∞) genau dann, wenn limn→∞ y1n = 0.
(vi) Sei (yn )n∈N monoton wachsend (fallend). Ist (yn )n∈N beschränkt, so ist diese Folge
konvergent gegen eine reelle Zahl. Ist (yn )n∈N unbeschränkt, so konvergiert sie
gegen +∞ (−∞).
Analoge Aussagen gelten im Fall limn→∞ xn = −∞.
Beweis.
(i) Sei C eine untere Schranke von {yn : n ∈ N, n ≥ k}. Zu M > 0 wähle N so groß,
dass xn > M − C für alle n ≥ N, so folgt für n ≥ max(N, k)
xn + yn > (M − C) + C = M ;
also (xn + yn ) → +∞.
(ii) Folgt unmittelbar aus xn > M ⇔ −xn < −M.
(iii) Wähle N so, dass xn >
M
C
für n ≥ N und sodass N ≥ k. Dann folgt für n ≥ N auch
xn yn >
d.h. xn yn → +∞.
(iv) Ist xn > M, so erst recht yn > M.
M
· C = M,
C
3.7. KONVERGENZ GEGEN UNENDLICH
75
(v) Seien alle yn mit n ≥ k positiv. Wir nehmen zuerst an, dass y1n → 0. Zu vorgegebenem M wähle N ≥ k so groß, dass für n ≥ N gilt y1n < M1 . Es folgt yn > M.
Gilt umgekehrt yn → +∞, und ist ǫ > 0, so wähle N so groß, dass für n ≥ N gilt
yn > 1ǫ . Daraus folgt | y1n | = y1n < ǫ.
(vi) Ist (yn )n∈N beschränkt, so folgt die Aussage aus Satz 3.4.2. Im Fall der Unbeschränktheit gibt es eben wegen dieser zu jedem M > 0 ein N ∈ N, sodass
yN > M. Wegen der Monotonie folgt dann auch yn > M für alle n ≥ N
❑
3.7.4 Beispiel. Sei q ∈ R und betrachte die Folge qn , n ∈ N. Dann gilt


+∞ , falls q > 1





1 , falls q = 1

lim qn = 


0
, falls −1 < q < 1
n→∞



 ∄ , falls q ≤ −1
Dabei haben wir den Fall 0 ≤ q < 1 schon in Beispiel 3.2.9 behandelt. Der Fall q = 1 ist
klar. Für q > 1 folgt aus 0 < 1q < 1 durch Anwendung von Satz 3.7.3, dass qn → +∞.
Ist −1 < q < 0, so beachte |qn | = |q|n → 0. Ist q ≤ −1, so hat man qn ≥ 1 für n gerade
und qn ≤ −1 für n ungerade. Insbesondere ist der Abstand zweier aufeinanderfolgender
Folgenglieder ≥ 2, und wir sehen, dass qn keine Cauchy-Folge und erst recht keine
konvergente Folge sein kann. Konvergenz gegen +∞ oder −∞ kann aber auch nicht
stattfinden, denn dann müssten ja die Folgenglieder insbesondere ab einem Index alle
das gleiche Vorzeichen haben.
3.7.5 Beispiel. Seien p, q aus R[x], p, q , 0, dh. zwei Polynome mit reellen Koeffizienten ungleich dem Nullpolynom. Betrachte die Folge
xn :=
p(n)
q(n)
für alle n ∈ N mit q(n) , 0. Da Polynome nur endlich viele Nullstellen haben, ist xn
sicher für alle n ∈ N, n ≥ n0 mit einem gewissen n0 ∈ N definiert. Schreiben wir p und
q als p(x) = am xm + . . . + a0 und q(x) = bk xk + . . . + b0 mit am , bk , 0 an, so gilt gilt


0 ,



am


 bk ,
lim xn = 

+∞ ,

n→∞



 −∞ ,
falls
falls
falls
falls
m<k
m=k
m > k, abmk > 0
m > k, abmk < 0
Um dieses einzusehen, betrachte zuerst den Fall, dass m ≤ k, und schreibe
xn =
am nm + am−1 nm−1 + . . . + a0 am nm−k + am−1 nm−1−k + . . . + a0 n−k
=
.
bk nk + bk−1 nk−1 + . . . + b0
bk + bk−1 n−1 + . . . + b0 n−k
Dann konvergiert der Nenner dieses Bruches gegen bk , 0. Ist m < k, so konvergiert
der Zähler gegen 0, insgesamt also xn → 0. Ist m = k, so strebt der Zähler gegen am
und wieder folgt unsere Behauptung.
KAPITEL 3. DER GRENZWERT
76
R
−∞
+∞
Abbildung 3.1: Veranschaulichung von R
Ist m > k, so schreiben wir xn als
nm−k
am + am−1 n−1 + . . . + a0 n−m
.
bk + bk−1 n−1 + . . . + b0 n−k
Also gilt xn = nm−k yn , wobei yn → abmk . Nach Lemma 3.3.1 hat yn für hinreichend große
Indizes dasselbe Vorzeichen, wie abmk . Wegen x1n → 0 folgt aus Satz 3.7.3 das behauptete
Konvergenzverhalten für xn .
3.7.6 Beispiel. Ist (xn )n∈N eine Folge aus R, die nicht nach oben beschränkt ist, es also
kein reelles C > 0 gibt mit xn ≤ C für alle n ∈ N, so hat (xn )n∈N eine Teilfolge (xn(k) )k∈N ,
die limk→∞ xn(k) = +∞ erfüllt.
Dazu wählt man n(1) ∈ N so, dass xn(1) ≥ 1, und definiert n(k + 1) ∈ N rekursiv so,
dass n(k + 1) > n(k) und xn(k+1) ≥ k + 1. Aus Satz 3.7.3, (iv), folgt dann wegen xn(k) ≥ k,
dass limk→∞ xn(k) = +∞.
Am Ende diese Kapitels wollen wir eine Möglichkeit vorstellen, wie man die eingeführte Konvergenz gegen ±∞ als
herkömmliche Konvergenz in einem metrischen Raum auffassen kann.
Als erstes müssen wir ±∞ als Elemente unseres Raumes anerkennen, denn eine Folge von Elementen eines Raumes X
kann gegen ein Element von X konvergieren aber nicht gegen irgendetwas. Betrachte also die Menge R = R ∪ {+∞, −∞},
wobei +∞ und −∞ zwei verschiedene formale Elemente sind, die nicht in R liegen.
Nun versehen wir die Menge R in naheliegender Weise mit einer Relation:
x ≤ y : ⇐⇒ (x ≤ y, x, y ∈ R) oder x = −∞ oder y = +∞ .
Diese Relation ist offensichtlicherweise eine Totalordnung, die die Supremumseigenschaft hat. Somit lässt sich R folgendermaßen veranschaulichen.
3.7.7 Lemma. Die Funktion φ : R → (−1, 1), wobei φ(x) =
y
.
Inverse φ−1 : (−1, 1) → R ist gegeben durch φ−1 (y) = 1−|y|
x
1+|x| ,
bildet R bijektiv auf das offene Intervall (−1, 1) ab. Ihre
Schließlich sind φ und ihre Inverse φ−1 streng monoton wachsend.
Beweis. Als erstes wollen wir festhalten, dass für x ∈ R stets |φ(x)| < 1, d.h. φ(x) ∈ (−1, 1) gilt, und dass φ(x) das gleiche
Vorzeichen wie x hat.
y
, so folgt
Ist ψ : (−1, 1) → R definiert durch ψ(y) = 1−|y|
φ ◦ ψ(y) =
1
und
ψ ◦ φ(x) =
1
y
1−|y|
|y|
+ 1−|y|
=
y
= y,
(1 − |y|) + |y|
x
1+|x|
|x|
− 1+|x|
=
x
= x.
(1 + |x|) − |x|
Somit ist nach Satz 1.2.18 die Abbildung φ bijektiv und ψ ist die Inverse von φ.
Für die behaupteten Monotonieeigenschaft seien x1 , x2 ∈ R mit x1 = 0 oder x2 = 0 oder sgn(x1 ) = sgn(x2 ). Wegen
x1 |x2 | = |x1 |x2 gilt dann
x1 < x2 ⇔ x1 (1 + |x2 |) = x1 + x1 |x2 | < x2 + x2 |x1 | = x2 (1 + |x1 |) ⇔ φ(x1 ) < φ(x2 ).
Da x und φ(x) dasselbe Vorzeichen haben, folgt für den verbleibenden Fall x1 , x2 , 0, sgn(x1 ) = − sgn(x2 ), wobei o.B.d.A.
x1 < x2 , dass sowohl x1 < 0 < x2 als auch φ(x1 ) < 0 < φ(x2 ).
❑
3.7. KONVERGENZ GEGEN UNENDLICH
77
+∞
φ
R
[−1, 1]
φ−1
−∞
Abbildung 3.2: Die Abbildung φ
Nun setzten wir φ fort zu einer Abbildung R → [−1, 1], indem wir





φ(x) := 



x
1+|x|
1
−1
, falls
, falls
, falls
x∈R
x = +∞
x = −∞
definieren.
Offensichtlicher ist diese Fortsetzung, die wir ebenfalls φ nennen wollen, auch bijektiv und streng monoton wachsend,
wobei
 y

, falls
−1 < y < 1


 1−|y|
φ−1 (y) := 
+∞ , falls
y=1


 −∞ , falls
y = −1
Wir definieren nun eine Metrik auf R, indem wir die euklidische Metrik mittels φ nach R übertragen.
3.7.8 Definition. Definiere eine Abbildung d : R × R → R als
d(x, y) := φ(x) − φ(y) .
3.7.9 Lemma. Die Abbildung d ist eine Metrik.
Dabei konvergiert eine Folge (xn )n∈N in R gegen ein x ∈ R bezüglich d genau dann, wenn die Folge (φ(xn ))n∈N in
[−1, 1] gegen φ(x) ∈ [−1, 1] bezüglich der euklidischen Metrik d2 konvergiert.
Beweis. Da die Abbildung (a, b) 7→ |a − b| eine Metrik und φ injektiv ist, verifizieren die verlangten Eigenschaften (M1)(M3) von d folgendermaßen.
Setze a := φ(x), b := φ(y), dann gilt
(M1):
d(x, y) = |a − b| ≥ 0, und d(x, y) = 0 genau dann, wenn a = b. Da φ injektiv ist, ist dieses äquivalent dazu das x = y.
(M2):
d(x, y) := |a − b| = |b − a| = d(y, x)
(M3):
Sei zusätzlich z ∈ R und setze c := φ(z). Dann ist
d(x, z) = |a − c| ≤ |a − b| + |b − c| = d(x, y) + d(y, z) .
Die Aussage über die Konvergenz folgt leicht aus Bemerkung 3.2.3, da
xn → x (bzgl. d) ⇔ d(xn , x) = d2 (φ(xn ) → 0 ⇔ φ(xn ) → φ(x) (bzgl. d2 ).
❑
Wir wissen jetzt also, was es bedeutet, dass eine Folge reeller Zahlen in hR, di gegen +∞ bzw. −∞ konvergiert. Haben
wir unser Modell nun richtig in dem Sinne gebaut, dass dieser Begriff von Konvergenz gegen ±∞ tatsächlich mit dem
eingangs eingeführten Begriff von Konvergenz gegen ±∞ übereinstimmt?
3.7.10 Proposition. Sei (xn )n∈N eine Folge reeller Zahlen. Dann gilt limn→∞ xn = +∞ im Sinne einer Konvergenz im
metrischen Raum hR, di genau dann, wenn (3.11) gilt. Analog gilt limn→∞ xn = −∞ in hR, di genau dann, wenn (3.12) gilt.
Bleibt die Folge weg von ±∞, so bleibt unser alter Konvergenzbegriff reeller Zahlen erhalten: Sei x ∈ R, dann gilt
limn→∞ xn = x in hR, di genau dann, wenn limn→∞ xn = x in R bezüglich der euklidischen Metrik d2 .
KAPITEL 3. DER GRENZWERT
78
Beweis. Angenommen xn → +∞ in hR, di. Zu gegebenen M > 0 gegeben setze ǫ := 1 − φ(M) > 0, und wähle N ∈ N mit
d(xn , +∞) < ǫ, n ≥ N. Dann folgt
1 − φ(xn ) = |φ(xn ) − 1| = d(xn , +∞) < ǫ = 1 − φ(M) ,
und daher φ(M) < φ(xn ), also xn > M.
Gelte umgekehrt (3.11), und sei 0 < ǫ < 1 gegeben. Setze M := φ−1 (1 − ǫ) > 0, und wähle N ∈ N so, dass xn > M für
n ≥ N. Dann folgt
d(xn , +∞) = |φ(xn ) − 1| = 1 − φ(xn ) < 1 − φ(M) = ǫ, n ≥ N .
Wir sehen, dass xn → +∞ in hR, di äquivalent zu (3.11) ist. Die Behauptung für xn → −∞ sieht man genauso.
Sei nun x ∈ R, und xn → x in R bezüglich d2 . Dann folgt, wegen unserer Rechenregeln für Folgen, Satz 3.3.5, dass
auch φ(xn ) → φ(x). Wegen Lemma 3.7.9 erhalten wir xn → x in hR, di.
Gelte nun xn → x in hR, di, d.h. φ(xn ) → φ(x) in R (Lemma 3.7.9). Die Abbildung φ−1 ist von der gleichen Gestalt
wie φ, und wir schließen wieder wegen unserer Rechenregeln für Folgen, dass xn = φ−1 (φ(xn )) → φ−1 (φ(x)) = x in R
bezüglich d2 .
❑
Wir haben nun unser Zahlensystem etwas erweitert, um den Begriff des Strebens gegen unendlich“ als Konvergenz in
”
metrischen Räumen interpretieren zu können. Wir haben dabei jedoch auch sehr viel verloren, nämlich unsere algebraischen
Operationen + und ·. Gemäß Satz 3.7.3 macht es zwar Sinn
x + (+∞) = +∞, −(+∞) = −∞, y(+∞) = +∞,
1
= 0, usw.
±∞
für x, y ∈ R, y > 0 zu setzen, damit die Operationen mit den Grenzwertregeln verträglich bleiben. Aber wie sollte man z.B.
+∞ + (−∞) oder 0 · (+∞) definieren?
Als einfachstes Beispiel betrachte man xn = 2n, yn = n. Es gilt xn , yn → +∞. Es gilt aber xn − yn = n → +∞, was auf
(+∞) − (+∞) = +∞“ deuten würde, wogegen yn − xn = −n → −∞, also (+∞) − (+∞) = −∞“.
”
”
3.8 Unendliche Reihen
Wir sind schon einmal einer Folge (S n )n∈N begegnet, die von der speziellen Gestalt
P
S n = nk=0 ak mit gewissen Zahlen ak war. In Beispiel 3.2.9 haben wir nämlich die
Folge S n = 1 + z + . . . + zn mit |z| < 1 betrachtet. Dort haben wir gezeigt, dass diese
1
konvergiert. Das heißt also, dass für große Werte von
Folge gegen den Grenzwert 1−z
Pn k
1
n die Summe k=0 z den Wert 1−z
beliebig gut approximiert. Es ist also naheliegend
zu schreiben
∞
X
1
=
zk .
1 − z k=0
3.8.1 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen13 . Bezeichne
mit S n , n ∈ N die n-te Partialsumme
S n := a1 + a2 + . . . + an .
Die Folge (S n )n∈N nennen wir auch die Reihe mit den Summanden ak .
Hat die Folge (S n )n∈N einen Grenzwert, so sagen wir die Reihe sei konvergent. In
diesem Fall nennen wir ihren Grenzwert lim S n die Summe der Reihe und benützen
n→∞
die Schreibweise
∞
X
ak := lim S n .
k=1
n→∞
Falls der Grenzwert lim S n nicht existiert, so heißt die Reihe divergent.
n→∞
13 Allgemeiner kann (a )
k k∈N auch eine Folge von Elementen eines metrischen Raumes sein, auf dem man
eine Verknüpfung + hat; zum Beispiel im R p .
3.8. UNENDLICHE REIHEN
79
Sind die ak alle reell und, gilt lim S n = +∞ bzw. lim S n = −∞ im Sinne von
n→∞
n→∞
Definition 3.7.1, so heißt die Reihe konvergent gegen +∞ bzw. −∞ und schreibt
∞
X
ak = +∞ bzw.
k=1
∞
X
k=1
ak = −∞.
Man nennt die Reihe dann auch bestimmt divergent gegen +∞ bzw. −∞.
Um die Notation zu vereinfachen, benützt man die Schreibweise
∞
P
Reihe (S n )n∈N selbst, und sagt dann
∞
P
Ausdrücke, wie etwa
∞
P
ak auch für die
k=1
ak sei konvergent oder divergent.
k=1
ak haben eine sinngemäß analoge Interpretation durch
k=6
Grenzwerte von Partialsummen.
3.8.2 Bemerkung. Eine unendliche Reihe ist per definitionem die Folge ihrer Partialsummen, d.h. die Theorie der Reihen
ist ein Spezialfall jener der Folgen. Umgekehrt kann man auch jede Folge reeller oder komplexer Zahlen als Folge der
Partialsummen einer Reihe auffassen: Ist (cn )n∈N irgendeine Folge, so setze
a1 := c1 , a2 := c2 − c1 , a3 := c3 − c2 , . . . , ak := ck − ck−1 , . . . .
Dann gilt cn =
n
P
ak .
k=1
Auf Grund der Definition einer unendlichen Reihe als Limes ihrer Partialsummen
können wir Aussagen über Folgen sofort auf Reihen übertragen.
3.8.3 Korollar. Sind
∞
P
ak , und
k=1
Es gilt
∞
P
bk konvergent, so ist auch
k=1
k=1
Ist
P∞
(ak + bk ) konvergent.
k=1
∞  ∞ 
∞
X
X  X 
(ak + bk ) =  ak  +  bk  .
P∞
∞
P
k=1
k=1
und λ eine feste (reelle oder komplexe) Zahl, so sind auch
k=1 ak konvergent
P∞
ā
und
(λa
)
konvergent.
Weiters gilt
k
k
k=1
k=1
∞
X
āk =
∞
X
k=1
k=1
ak ,
∞
∞
X
X
(λak ) = λ ·
ak .
k=1
k=1
Beweis. Für die entsprechenden Partialsummen S n =
n
P
n
P
k=1
(ak + bk ) gilt S n + T n = Un .
k=1
Weiters gilt für Vn =
n
P
(λak ) und Wn =
k=1
n
P
ak , T n =
n
P
bk und Un =
k=1
āk sicher Vn = λS n und Wn = S̄ n . Also
k=1
folgen auch diese Rechenregeln aus den entsprechenden Regeln für Folgen.
❑
Beim letzten Beweis haben wir die Rechengesetze wie Kommutativität, Distributivität u.ä. für endliche Summen benützt. Das Verhalten dieser Rechenregeln bei unendlichen Reihen ist wesentlich komplizierter, vgl. u.a. Beispiel 5.4.1.
3.8.4 Fakta.
KAPITEL 3. DER GRENZWERT
80
1. Man beachte, dass man endlich viele Reihenglieder beliebig abändern kann, ohne das Konvergenzverhalten zu stören. Das gilt deshalb, weil sich dabei die neue
Folge der Partialsummen ab einem gewissen Index von der alten nur um eine
additive Konstante unterscheidet. Natürlich verändert sich dabei die Summe der
Reihe.
P
P∞
Ähnlich konvergiert für ein k ∈ Z \ {0} mit ∞
n=1 an auch die Reihe
n=1 an+k ,
wobei man im Falle k < 0 die Summanden ak+1 , . . . , a−1 , a0 alle
Null
setzt. In
PN
PN+k
P
der Tat gilt für k > 0 immer n=1
an+k = n=1
an − kn=1 an und damit für
N → ∞, dass mit der rechten Seite auch die linke konvergiert. Für k < 0 gilt
PN
PN+k
n=1 an für alle N ∈ N, N > −k.
n=1 an+k =
P
2. Hat man eine konvergente Reihe ∞j=1 a j gegeben, so dürfen beliebig Klammern
gesetzt werden, ohne das Konvergenzverhalten der Reihe zu verändern. Exakt
formuliert bedeutet das, dass für jede streng monoton wachsende Folge (k(n))n∈N
natürlicher Zahlen
∞
∞
X
X
aj =
An ,
j=1
n=1
gilt, wobei A1 = a1 + · · · + ak(1) und An = ak(n−1)+1 + · · · + ak(n) für n ≥ 2.
Dieser Sachverhalt folgt aus der einfachen Beobachtung, dass die Folge der ParP
tialsummen unserer neuen Reihe ∞
A genau die Teilfolge (S k(n) )n∈N der Folge
P∞n=1 n
(S k )k∈N der Partialsummen von j=1 a j ist; vgl. Satz 3.2.8, (iv).
P
Die Umkehrung gilt hier nicht. Es kann nämlich vorkommen, dass ∞
n=1 An konP∞
vergiert, aber k=1 ak nicht. Man betrachte nur die Reihe 1 − 1 + 1 − 1 + . . . und
klammere immer zwei aufeinanderfolgende Summanden ein.
3. Sind
∞
P
k=1
ak und
∞
P
bk zwei konvergente Reihen mit reellen Summanden, sodass
k=1
ak ≤ bk für alle k ∈ N, so gilt für die Partialsummen klarerweise auch
n
P
k=1
n
P
k=1
ak ≤
bk für alle n ∈ N. Aus Lemma 3.3.1 erhalten wir dann für die Grenzwerte
dieser zwei Folgen von Partialsummen
∞
X
k=1
ak ≤
∞
X
bk .
k=1
Ist nun zusätzlich sogar al < bl für zumindest ein l ∈ N, so folgt al + δ ≤ bl für
n
n
P
P
ein hinreichend kleines δ > 0. Somit gilt für n ≥ l, dass δ +
ak ≤
bk . Für
k=1
n → ∞ folgt wieder aus Lemma 3.3.1, dass
∞
X
ak < δ +
k=1
∞
X
k=1
ak ≤
∞
X
bk .
k=1
3.8.5 Beispiel.
Betrachte die Reihe
∞
P
k=1
S n :=
1
k(k+1) .
n
X
k=1
Wegen
1
k(k+1)
=
1
k
−
1
k+1
gilt
!
n
X
1
1
1
1
=1−
=
−
.
k(k + 1) k=1 k k + 1
n+1
k=1
3.8. UNENDLICHE REIHEN
Die Reihe
∞
P
k=1
1
k(k+1)
81
konvergiert also gegen lim S n = 1. Reihen, deren Grenzwert
n→∞
sich derartig berechnen lässt, nennt man auch Teleskopreihen.
Lässt man die ersten drei Terme weg, d.h. ersetzt sie durch 0, so gilt für die
entsprechenden Partialsummen S n′ stets (n ≥ 3)
!
3
1
1
1
1
1
− → .
S n′ = S n −
−
−
= 1−
1·2 2·3 3·4
n+1
4
4
Somit ist die Reihe
∞
P
1
k(k+1)
k=4
ebenfalls konvergent. Ihre Summe ist
Fasst man immer zwei Summanden der Reihe
die Reihe
∞
P
k=1
∞
P
k=1
2
(2k−1)(2k+1) ,
1
k(k+1)
1
4
.
zusammen, so erhält man
welche nach Fakta 3.8.4, 2, ebenfalls die Summe 1 hat.
3.8.6 Bemerkung. Aus dem entsprechenden Resultat für Folgen erhält man, dass eiP
ne Reihe ∞
bestehend aus komplexen Zahlen genau dann konvergiert, wenn die
n=1 z
Pn
P∞
reellen Reihen ∞
n=1 Re zn und n=1 Im zn beide konvergieren. In diesem Fall gilt
∞
X
zn = (
n=1
∞
X
Re zn ) + i(
n=1
∞
X
Im zn ).
n=1
Folgendes Resultat liefert uns eine einfache notwendige Bedingung für die Konvergenz einer Reihe. Wie wir in Beispiel 3.8.9 sehen werden, ist diese notwendige
Bedingung bei weitem nicht hinreichend.
3.8.7 Proposition. Ist
∞
P
ak konvergent, so folgt limk→∞ ak = 0.
k=1
Beweis. Betrachte die Reihe
∞
P
k=1
bk , wobei b1 = 0 und bk+1 = ak für k ∈ N. Sind (S n )n∈N
und (T n )n∈N die Folgen der Partialsummen von
∞
P
ak bzw.
S n − Tn =
k=1
ak −
n
X
bk , so folgt
k=1
k=1
n
X
∞
P
ak−1 = an .
k=2
Wegen T n+1 = S n folgt aus Satz 3.2.8, dass (T n )n∈N gegen den gleichen Grenzwert,
wie (S n )n∈N konvergiert. Somit erhalten wir S n − T n = an → 0.
❑
3.8.8 Lemma. Sei
R, ak ≥ 0.
∞
P
k=1
ak eine Reihe mit reellen nichtnegativen Summanden, d.h. ak ∈
(i) Die Reihe ist genau dann konvergent, wenn die Folge (S n )n∈N der Partialsummen
n
∞
P
P
beschränkt ist. In diesem Fall ist auch
ak ≤
ak für alle n ∈ N. Anderenfalls
k=1
ist sie bestimmt gegen +∞ divergent.
k=1
KAPITEL 3. DER GRENZWERT
82
(ii) Ist
∞
P
k=1
bk eine divergente Reihe nichtnegativer reeller Zahlen mit ak ≥ bk , k ∈ N,
so ist auch
∞
P
ak divergent (Minorantenkriterium).
k=1
(iii) Ist
∞
P
k=1
bk eine konvergente Reihe nichtnegativer reeller Zahlen mit ak ≤ bk , k ∈ N,
so ist auch
∞
P
ak konvergent (Majorantenkriterium), und
∞
P
k=1
k=1
ak ≤
∞
P
bk .
k=1
Beweis. Wegen der Voraussetzung ak ≥ 0 ist (S n )n∈N monoton wachsend. Somit folgt
(i) aus Satz 3.7.3, (vi). Die behauptete Ungleichung gilt, da im Falle der Konvergenz
der monoton wachsenden Folge (S n )n∈N der Grenzwert gemäß Satz 3.4.2 nichts anderes
als sup{S n : n ∈ N} ist.
∞
P
bk , so ist auch
Ist nun bk ≥ 0 und (T n )n∈N der Folge Partialsummen der Reihe
k=1
diese monoton wachsend.
Ist diese divergent, und ak ≥ bk , so gilt sicherlich S n ≥ T n . Also kann die Folge
(S n )n∈N nicht beschränkt sein.
∞
P
Ist dagegen
bk konvergent, und ak ≤ bk , so ist S n ≤ T n , und mit (T n )n∈N ist auch
k=1
die Folge (S n )n∈N ist nach oben beschränkt. Die behauptete Ungleichung folgt aus
Fakta 3.8.4, 3.
❑
3.8.9 Beispiel. Betrachte die harmonische Reihe
∞
X
1
k=1
k
.
Diese Reihe ist nicht konvergent. Genauer gesagt ist sie bestimmt divergent gegen +∞.
Betrachtet man nämlich die Partialsummen S n = 1 + 21 + · · · + n1 , so ist diese monoton
wachsend. Für die Existenz des Limes ist es also notwendig und hinreichend, dass diese
Folge beschränkt ist; vgl. Lemma 3.8.8, i. Somit wäre auch jede Teilfolge beschränkt.
Nun gilt jedoch
S 2l = 1 +
1+
1 1 1 1 1 1 1 1
1
+ + + + + + + +...+ l ≥
2 3 4 5 6 7 8 9
2
1
1 1 1 1 1 1 1 1
1
+ + + + + + + +...+ l = 1+l · ,
2 |
4 {z4} |
8 8 {z8 8} 16
2
2
= 21
= 12
Insbesondere ist die Teilfolge (S 2l )l∈N nicht beschränkt.
3.8.10 Beispiel. Durch Vergleich mit der harmonischen Reihe ist nach dem Minoran∞
P
1
14
tenkriterium die Reihe
kα für α < 1 divergent .
k=1
14 Bemerke,
dass wir kα erst für rationales α definiert haben.
3.9. KONVERGENZKRITERIEN
83
3.8.11 Lemma (Cauchysches Konvergenzkriterium). Die Reihe
∞
P
ak mit reellen oder
k=1
komplexen Summanden ist genau dann konvergent, wenn gilt
n
X
ak < ǫ, n > m ≥ N.
∀ǫ > 0 ∃N ∈ N : k=m+1 (3.13)
Beweis. Da R und C vollständig metrische Räume sind, ist die Konvergenz der
n
P
Folge der Partialsummen S n =
ak mit der Tatsache gleichbedeutend, dass (S n )n∈N
k=1
P
eine Cauchy-Folge ist. Wegen S n −S m = nk=m+1 ak ist das aber zu (3.13) äquivalent.
❑
Wir werden später weitere Konvergenzkriterien kennenlernen. Diesen Abschnitt
beenden wir mit einer weiteren ganz wichtigen Begriffsbildung.
3.8.12 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Die Reihe
P∞
P∞
k=1 ak heißt absolut konvergent, wenn die Reihe der Beträge k=1 |ak | konvergiert.
3.8.13 Lemma. Jede absolut konvergente Reihe ist auch konvergent.
Beweis. Laut Voraussetzung und
P gemäß Lemma 3.8.11 gibt es zu jedem ǫ > 0 ein
P
N ∈ N, sodass nk=m+1 |ak | = nk=m+1 |ak | < ǫ für alle n > m ≥ N. Daraus und der
Dreiecksungleichung erhält man
n
n
X
X
ak ≤
| ak |< ǫ .
k=m+1 k=m+1
Wieder wegen Lemma 3.8.11 konvergiert damit die Reihe.
❑
Die Umkehrung von Lemma 3.8.13 gilt im Allgemeinen nicht.
P
k+1 1
3.8.14 Beispiel. Die alternierende harmonische Reihe ∞
k=1 (−1)
k ist konvergent,
wie man aus dem Leibnizschen Konvergenzkriterium, Korollar 3.9.7, weiter unten erP 1
kennt. Die Reihe der Beträge ∞
k=1 k ist gemäß Beispiel 3.8.9 aber divergent.
3.9 Konvergenzkriterien
Wir wollen das Majorantenkriterium ausnützen, um durch Vergleich mit der geometrischen Reihe zwei oft einsetzbare hinreichende Bedingungen für die absolute Konvergenz einer Reihe herzuleiten.
3.9.1 Satz (Wurzelkriterium). Sei
∞
P
an eine Reihe mit reellen oder komplexen Sum-
n=1
manden.
Gibt es eine feste Zahl q ∈ [0, 1) und ein N ∈ N, sodass
pn
|an | ≤ q für alle n ≥ N ,
(3.14)
√
oder gilt die äquivalente Bedingung, dass ( n |an |)n∈N beschränkt ist mit
∞
√
P
lim supn→∞ n |an | < 1, so ist die Reihe
an absolut konvergent.
n=1
KAPITEL 3. DER GRENZWERT
84
p
Gibt es dagegen eine Teilfolge (an(k) )k∈N mit n(k) |an(k) | ≥ 1, k ∈ N, so ist die Rei∞
√
P
he
an divergent. Diese Teilfolgenbedingung ist sicher dann erfüllt, wenn ( n |an |)n∈N
n=1
√
nach oben nicht beschränkt ist oder wenn lim supn→∞ n |an | > 1.
√
Beweis. Dass
(3.14) zur Beschränktheit von ( n |an |)n∈N samt der Bedingung
√n
lim supn→∞ |an | < 1 äquivalent ist, folgt unmittelbar aus Fakta 3.4.5, 5.
∞
√
P
Aus n |an | ≤ q folgt |an | ≤ qn für alle n ≥ N. Da die Reihe
qn konvergiert,
∞
P
zeigt das Majorantenkriterium aus Lemma 3.8.8, dass auch
n=N
n=N
|an |, und damit
∞
P
n=1
|an |
konvergiert.
√
Ist ( n |an |)n∈N nach oben
p nicht beschränkt, so haben√wir in Beispiel 3.7.6 eine Teilfolge konstruiert, die n(k) |an(k) | ≥ k, k ∈ N, erfüllt. Ist ( n |an |)n∈N nach oben beschränkt
√
und
gilt lim supn→∞ n |an | > 1, so folgt aus Fakta 3.4.5,
p
√ 6, und Lemma 3.3.1, (i), dass
n(k)
|an(k) | > 1, k ∈ N, für eine gewisse Teilfolge von ( n |an |)n∈N .
p
Gibt es eine Teilfolge (an(k) )k∈N mit n(k) |an(k) | ≥ 1, so folgt |an(k) | ≥ 1. Also kann
(|an(k) |)k∈N keine und damit auch (an )n∈N keine Nullfolge sein. Wegen Proposition 3.8.7
∞
P
ist
an divergent.
n=1
❑
3.9.2 Beispiel.
(i) Betrachte die Reihe
P∞
1
n=1 (3+(−1)n )n .
s
n
Die Folge der n-ten Wurzeln
1
1
=
(3 + (−1)n )n (3 + (−1)n)
hat zwar keinen Grenzwert, aber ihre Glieder sind alle ≤ 12 . Somit kann man auch
Satz 3.9.1 anwenden. Der Grenzwert der Reihe lässt sich mit Hilfe der hergeleiteten Regeln für Reihen berechnen:
∞
X
n=1
! X
∞
∞
∞
X
X
1
1
1
1
1
=
+
+
=
=
n
n
2k−1
2k
2k−1
(3 + (−1) )
2
4
2
42k
k=1
k=1
k=1

∞
∞
X
 1
1 X 1

2
+
=
2
k
k
4
16
1−
k=1
k=1
1
4
 
 
− 1 + 
(ii) Wie wir in Beispiel 3.9.8 sehen werden ist die Reihe


1
− 1 .
1
1 − 16
∞
P
n=1
1
nα
für rationales α > 1
absolut konvergent. Das Wurzelkriterium können wir wegen (vgl. Satz 3.3.5 und
Beispiel 3.3.7)
pn
√
lim sup |n−α | = lim ( n n)−α = 1
|
{z }
n→∞
n→∞
<1
weder dazu verwenden, um auf absolute Konvergenz noch auf Divergenz zu
schließen.
3.9. KONVERGENZKRITERIEN
3.9.3 Satz (Quotientenkriterium). Sei
85
∞
P
an eine Reihe mit reellen oder komplexen
n=1
Summanden.
Gibt es eine feste Zahl q ∈ [0, 1) und ein N ∈ N, sodass15
|an+1 |
≤ q für alle n ≥ N ,
|an |
(3.15)
|
oder gilt die äquivalente Bedingung, dass ( |a|an+1
)n∈Z≥N für ein gewissen N ∈ N ben|
∞
P
|an+1 |
an absolut konvergent.
schränkt ist mit lim supn→∞ |an | < 1, so ist die Reihe
n=1
Gibt es dagegen einen Index N ∈ N, sodass an , 0 und
∞
P
die Reihe
an divergent.
|an+1 |
|an |
≥ 1 für n ≥ N, so ist
n=1
|
)n∈Z≥N samt der Bedingung
Beweis. Dass (3.15) zur Beschränktheit von ( |a|an+1
n|
|an+1 |
lim supn→∞ |an | < 1 äquivalent ist, folgt unmittelbar aus Fakta 3.4.5, 5.
Unter dieser Voraussetzung gilt |an+1 | ≤ q|an| für alle n ≥ N. Durch vollständige
Induktion erhalten wir
|aN |
|an | ≤ qn N für alle n ≥ N ,
q
q
√n
woraus |an | ≤ q · n |aqNN | für n ≥ N folgt. Da der zweite Faktor mit n → ∞ gegen 1
√
′
′
strebt, gilt wegen Lemma 3.3.1, (i), dass n |an | < 1+q
2 für alle n ≥ N mit einem N ≥ N.
Also können wir das Wurzelkriterium anwenden und erhalten die absolute Konvergenz.
|
≥ 1 für n ≥ N folgt |an+1 | ≥ |an | ≥ · · · ≥ |aN | > 0. Also kann (an )n∈N keine
Aus |a|an+1
n|
Nullfolge sein.
❑
3.9.4 Beispiel.
P zn
(i) Betrachte die Reihe ∞
n=0 n! , wobei n! := 1 · 2 · 3 · . . . · n die Zahl n-faktorielle
bezeichnet und z ∈ C beliebig ist. Diese Reihe ist konvergent, denn es gilt
n+1 z 1· 2· ...·n
|z|
=
(n+1)!
|z| =
→ 0.
zn 1 · 2 · . . . · n · (n + 1)
n
+1
n!
Insbesondere ist auch der Limes Superior der linken Seite gleich Null und damit
kleiner 1.
(ii) Bezeichne mit τ(n) die Anzahl der Teiler der natürlichen Zahl n. Wir betrachten
P
n
die Reihe ∞
n=1 τ(n)x wobei x > 0 ist. Wegen τ(n) ≤ n gilt
pn
pn
√
τ(n)xn = x · τ(n) ≤ x · n n → x .
Ist also x < 1, so ist die Reihe konvergent. Für x ≥ 1 ist sie sicher divergent, denn
dann bilden die Summanden keine Nullfolge.
Im Beweis von Satz 3.9.3 haben wir das Wurzelkriterium verwendet, um das Quotientenkriterium herzuleiten. Also ist ersteres stärker, wenn auch nicht immer am
15 Dies
beinhaltet die Bedingung an , 0 für n ≥ N.
KAPITEL 3. DER GRENZWERT
86
praktiabelsten. Das eben betrachtete Beispiel – genauso wie Beispiel 3.9.2 – ist
gerade eines, wo uns das Wurzelkriterium zum Ziel führt, das Quotientenkriterium aber versagen würde. Denn ist n > 2 eine Primzahl, so gilt τ(n) = 2. Weiters ist n sicher ungerade, und damit kann n + 1 keine Primzahl sein. Also gilt
τ(n + 1) ≥ 3. Wir erhalten damit
τ(n + 1)xn+1 3
≥ · x.
τ(n)xn
2
Für x ≥ 32 ist daher der Quotient ≥ 1. Da es unendlich viele Primzahlen gibt,
können wir somit das Quotientenkriterium nicht anwenden.
Die nächsten Kriterien basieren auf folgendem, auch später verwendeten Lemma.
3.9.5 Lemma. Seien a1 , . . . , am und b1 , . . . , bm komplexe oder reelle Zahlen, so gilt
m
X
n=1
an bn = am βm −
wobei die βn die Partialsummen
n
P
m−1
X
(an+1 − an )βn ,
n=1
b j = βn bezeichnen.
j=1
Beweis.
m−1
X
n=1
m
X
n=2
(an+1 − an )βn =
an βn−1 −
m−1
X
n=1
m−1
X
n=1
an+1 βn −
an βn = am βm−1 −
am βm − am bm −
m−1
X
n=2
m−1
X
n=2
m−1
X
an βn =
n=1
an (βn − βn−1 ) − a1 β1 =
an bn − a1 b1 = am βm −
m
X
an bn .
n=1
❑
3.9.6 Satz (Dirichletsches16 Kriterium). Sei (an )n∈N eine monotone Nullfolge reeller
Zahlen und sei (bn )n∈N eine Folge reeller oder komplexer Zahlen. Gilt für eine Zahl
C>0
N
X
bn ≤ C, N ∈ N,
n=1 so ist die Reihe
∞
P
an bn konvergent.
n=1
Beweis. Sei N so groß, dass |an | < ǫ für n ≥ N. Dann folgt für m > k ≥ N aus Lemma
3.9.5 und der Dreiecksungleichung

m
m
m−1 
n
X
X
X
X


|an+1 − an | an bn ≤ am
bi +
bi  .
n=k+1
n=k+1
i=k+1 i=k+1
16 Johann
Peter Gustav Lejeune Dirichlet. 13.2.1805 Düren (bei Aachen) - 5.5.1859 Göttingen
3.9. KONVERGENZKRITERIEN
87
P
P
P
Wegen | ni=k+1 bi | ≤ | ki=1 bi | + | ni=1 bi | ≤ 2C schätzen wir diesen Ausdruck weiter
nach oben durch
m−1
X
2C|am | + 2C
|an+1 − an |
n=k+1
ab. Voraussetzungsgemäß haben die Ausdrücke der Form (an+1 − an ) niemals verschiedenes Vorzeichen. Also gilt


m−1
m−1
X

X

2C |am | +
|an+1 − an | = 2C |am | + (an+1 − an ) ≤
n=k+1
n=k+1
2C (|am | + |am | + |ak+1 |) ≤ 2C · 3ǫ.
Nach dem Cauchyschen Kriterium, Lemma 3.8.11, ist die Reihe
∞
P
an bn konvergent.
n=1
3.9.7 Korollar (Leibniz17Kriterium). Sei
∞
P
❑
(−1)n an eine alternierende Reihe, d.h. an ∈
n=1
R, an ≥ 0, n ∈ N. Ist (ak )k∈N monoton fallend und gilt lim an = 0, so konvergiert
n→∞
∞
P
n
(−1) an .
n=1
Beweis. Setze im Dirichletschen Kriterium bn = (−1)n .
❑
3.9.8 Beispiel. Für α > 1 ist die Reihe
∞
P
k=1
1
kα
konvergent18.
m+1
Wegen m+1
m → 1 kann man m ∈ N so wählen, dass m ≤ α. Nach dem Majorantenkriterium genügt es, die Behauptung für den Exponenten m+1
m zu zeigen.
∞
P
Betrachte die nach dem Leibnizschen Kriterium konvergente Reihe (−1)k+1 11 .
k=1
km
Fassen wir immer je zwei Summanden zusammen, so konvergiert nach Fakta 3.8.4, 2,
auch die Reihe
!
∞
X
1
1
.
−
1
1
m
(2k) m
k=1 (2k − 1)
Nun ist
1
(2k − 1)
1
m
−
(2k)
1
1
1
1
m
=
(2k) m − (2k − 1) m
1
m
(2k − 1) (2k)
(2k) − (2k − 1)
1
m
1
=
1
1
(2k − 1) m (2k) m
·
≥
1
1
m−2
m−1
(2k − 1) m + . . . + (2k) m (2k − 1) m + (2k − 1) m
1
1
1
=
· m+1
≥
m−1
2
m+1
(2k) m m(2k) m
m2 m k m
∞
P
1
Nach dem Majorantenkriterium folgt somit, dass auch die Reihe
m+1 konvergiert.
·
(2k)
m−1
m
+ (2k)
m−2
m
k=1 k
3.9.9 Korollar (Abelsches19 Kriterium). Sei die reell- oder komplexwertige Reihe
monotone und beschränkte Folge aus R. Dann ist die Reihe
∞
P
∞
P
bn konvergent, und sei (an )n∈N eine
n=1
an bn konvergent.
n=1
17 Gottfried
Wilhelm Leibniz. 1.7.1646 Leipzig - 14.11.1716 Hannover
dass wir kα erst für rationales α definiert haben.
19 Niels Henrik Abel. 5.8.1802 Finnö (Norwegen) - 6.4.1829 Froland (Norwegen)
18 Bemerke,
m
KAPITEL 3. DER GRENZWERT
88
Beweis. Gemäß Satz 3.4.2 konvergiert die Folge (an )n∈N gegen ein a. Für N → ∞ existiert in
N
X
an bn =
n=1
N
X
n=1
(an − a)bn + a
N
X
bn
n=1
für jeden der beiden Summanden auf derPrechten Seite der Grenzwert, denn die Reihe
Dirichletschen Kriterium und die Reihe ∞
n=1 bn nach Voraussetzung.
P∞
n=1 (an
− a)bn konvergiert nach dem
❑
3.9.10 Satz (Kriterium von Raabe20 ). Sei (an )n∈N eine Folge reeller oder komplexer Zahlen. Gibt es eine Zahl β > 1, sodass
ab einem Index k0 alle ak , 0 sind, und
|ak+1 |
β
≤ 1 − , k ≥ k0 ,
|ak |
k
so ist die Reihe
∞
P
ak absolut konvergent.
k=1
Ist ab einem gewissen Index k0 jedoch
konvergent.
|ak+1 |
|ak |
≥ 1−
1
k,
so ist sie nicht absolut konvergent, also höchstens bedingt
Beweis. Für k ≥ k0 gilt wegen unserer Voraussetzung k|ak+1 | ≤ k|ak | − β|ak | und daher
(β − 1)|ak | ≤ (k − 1)|ak | − k|ak+1 |.
(3.16)
Wegen β > 1 ist (k−1)|ak | > k|ak+1 | > 0. Somit ist die Folge ((k−1)|ak |)k∈Z≥2 monoton und beschränkt, und daher konvergent.
Daraus ergibt sich die Konvergenz der Folge (in k)
k
X
n=2
((n − 1)|an | − n|an+1 |) = |a2 | − k|ak+1 |
P
von Partialsummen. Wegen (3.16) konvergiert die Reihe ∞
n=1 |an |.
|ak+1 |
1
Gilt nun |a | ≥ 1 − k für k ≥ k0 (> 1), so folgt k|ak+1 | ≥ (k − 1)|ak | ≥ (k0 − 1)|ak0 | := α > 0. Also ist |ak+1 | ≥
k
P
nach dem Minorantenkriterium kann ∞
n=1 |an | nicht konvergieren.
α
k,
und
❑
Wir wollen noch anmerken, dass man die Konvergenz von ( n1α )n∈N für α ∈ N, n ≥ 2, mit dem Kriterium von Raabe
und der Bernouillsche Ungleichung zeigen kann.
20 Josef
Ludwig Raabe. 1801 - 1859
Kapitel 4
Die Konstruktion der reellen
Zahlen
Wir wollen in diesem Kapitel die am Anfang verschobene Konstruktion der reellen
Zahlen nachholen und zeigen, dass diese eindeutig dadurch charakterisiert sind, dass R
ein vollständig angeordneter Körper ist.
4.1 Existenz
4.1.1 Bemerkung. Hat man die reellen Zahlen als vollständig angeordneten Körper zur
Verfügung – was ja noch nicht der Fall ist, so wissen wir aus Beispiel 3.3.4, dass sich
jedes x ∈ R als Grenzwert einer Folge bestehend aus rationalen Zahlen darstellen lässt.
Diese Folgen sind gemäß Proposition 3.5.4 auch Cauchy-Folgen.
Da R ein vollständig metrischer Raum ist, konvergiert andererseits jede CauchyFolge bestehend aus rationalen Zahlen gegen ein x ∈ R. Dabei konvergieren offenbar
zwei solche Folgen genau dann gegen dieselbe reelle Zahl, wenn die Differenzenfolge
eine Nullfolge ist.
Die Überlegung in Bemerkung 4.1.1 legt es nahe, einen vollständig angeordneten
Körper mit Hilfe von rationalen Cauchy-Folgen zu konstruieren, wobei zwei solche
Folgen zu identifizieren sind, wenn ihre Differenzenfolge eine Nullfolge ist.
Ein Problem dabei ist, dass wir die Begriffe Cauchy-Folge bzw. konvergente Folge
in Definition 3.5.1 bzw. Definition 3.2.2 mit Hilfe der reellen Zahlen definiert haben,
da in (3.8) bzw. (3.3) die ǫ > 0 aus den reellen Zahlen sind. Wie wir Bemerkung 3.5.2
gesehen haben, können wir diese ǫ > 0 auch aus Q wählen, und erhalten den selben
Begriff von Cauchy-Folge bzw. von konvergenter Folge.
Eine weitere Obstruktion ist, die Tatsache, dass wir Konvergenztheorie immer von
Folgen in metrischen Räumen betrieben haben. Die Metrik hat definitionsgemäß aber
Werte in R. Diesem Problem können wir dadurch begegnen, dass wir den Begriff des
metrischen Raumes hX, di leicht dadurch verändern, dass wir annehmen, dass d nur
Werte in Q hat; siehe Definition 3.1.1 und Bemerkung 3.1.2. Ein solcher metrischer
Raum ist klarerweise hQ, di, wobei d(x, y) = |x − y|.
Eine Folge (xn )n∈N in einem solchen metrischen Raum X heißt dann konvergent
89
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
90
gegen x ∈ X, wenn
∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N ,
und sie heißt Cauchy-Folge, wenn
∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle m, n ≥ N .
Fasst man eine Q-wertige Metrik wieder als R-wertig auf, so wissen wir aus Bemerkung 3.5.2, dass diese Konvergenzbegriffe mit den schon bekannten übereinstimmen.
Die Konstruktion eines vollständig angeordneten Körpers erfolgt nun in einigen
Schritten.
(i) Sei X die Menge aller rationalen Cauchy-Folgen, und sei ∼⊆ X × X die Relation
(rn )n∈N ∼ (sn )n∈N : ⇐⇒ lim (rn − sn ) = 0.
n→∞
Diese Relation ist eine Äquivalenzrelation. Dabei ist Reflexivität und Symmetrie
klar. Um die Transitivität nachzuweisen, seien (rn )n∈N ∼ (sn )n∈N und (sn )n∈N ∼
(tn )n∈N gegeben. Es ist limn→∞ (rn − sn ) = limn→∞ (sn − tn ) = 0, und somit gilt für
die Summe dieser Folgen limn→∞ (rn − tn ) = 0. Also ist (rn )n∈N ∼ (tn )n∈N .
Es sei bemerkt, dass wir die verwendeten Regeln für Folgen in Q-wertigen metrischen Räumen nicht hergeleitet haben, obwohl wir sie hier und im Folgenden des
öfteren verwenden. Das zu tun ist aber nur eine Abschreibübung für die Ergebnisse aus Proposition 3.5.3, Lemma 3.3.1 und Satz 3.3.5 indem wir immer dann,
wenn von R die Rede ist, diese durch Q ersetzen.
(ii) Unser Ziel soll sein, X/∼ zu einem vollständig angeordneten Körper zu machen.
Dazu brauchen wir Operationen, die wir zunächst auf X definieren:
(rn )n∈N + (sn )n∈N := (rn + sn )n∈N ,
−(rn )n∈N := (−rn )n∈N ,
(rn )n∈N · (sn )n∈N := (rn · sn )n∈N .
Mit (rn )n∈N , (sn )n∈N sind auch (rn )n∈N + (sn )n∈N , −(rn )n∈N und (rn )n∈N · (sn )n∈N
Cauchy-Folgen. Um das z.B. für die Multiplikation zu zeigen, sei C ∈ Q, C > 0,
sodass |rn |, |sn | ≤ C, n ∈ N (siehe Proposition 3.5.3), und rechne
|rn sn − rm sm | ≤ |rn sn − rn sm | + |rn sm − rm sm | ≤ C|sn − sm | + C|rn − rm |.
Dieser Ausdruck ist kleiner als ein vorgegebenes rationales ǫ > 0, wenn man N
so groß wählt, dass
ǫ
für m, n ≥ N.
|sn − sm |, |rn − rm | < 2C
(iii) Da die Verknüpfungen + und · gliedweise definiert sind, folgt aus den Rechenregeln auf Q, dass für + und · das Kommutativgesetz, das Assoziativgesetz und das
Distributivgesetz gelten. Klarerweise gilt auch
(rn )n∈N + (0)n∈N = (rn )n∈N , − (rn )n∈N + (rn )n∈N = (0)n∈N ,
(rn )n∈N · (1)n∈N = (rn )n∈N .
Wir können aber X nicht zu einem Körper machen, denn ist (rn )n∈N , (0)n∈N , so
können wir noch lange keine multiplikativ Inverses dazu finden.
4.1. EXISTENZ
91
(iv) Die Äquivalenzrelation ∼ lässt sich nun mit Hilfe obiger Verknüpfungen charakterisieren:
(rn )n∈N ∼ (sn )n∈N ⇔ (rn )n∈N + (−(sn )n∈N ) ist Nullfolge,
und
(rn )n∈N ist Nullfolge ⇔ (rn )n∈N ∼ (0)n∈N .
Daraus sieht man leicht, dass obige Verknüpfungen mit den Operationen verträglich sind. Sind nämlich (rn )n∈N ∼ (rn′ )n∈N und (sn )n∈N ∼ (s′n )n∈N , so folgt
(rn )n∈N + (sn )n∈N ∼ (rn′ )n∈N + (s′n )n∈N , −(rn )n∈N ∼ −(rn′ )n∈N sowie (rn )n∈N · (sn )n∈N ∼
(rn′ )n∈N · (s′n )n∈N . Letztere Relation etwa folgt aus
(rn )n∈N · (sn )n∈N + (−(rn′ )n∈N · (s′n )n∈N ) =
rn (sn − s′n ) + s′n (rn − rn′ )
n∈N
∼ (0)n∈N ,
da mit (sn − s′n )n∈N und (rn − rn′ )n∈N auch rn (sn − s′n ) + s′n (rn − rn′ )
sind.
n∈N
Nullfolgen
(v) Setzt man1
P = {(rn )n∈N ∈ X : ∃δ ∈ Q, δ > 0, rn ≥ δ für fast alle n ∈ N},
und −P = {(−rn )n∈N ∈ X : (rn )n∈N ∈ P}, so gehört jede Folge (rn )n∈N ∈ X zu
genau einer der drei Teilmengen P, [(0)n∈N ]∼ , − P. Ist (rn )n∈N ∼ (ρn )n∈N , so
gehört (ρn )n∈N zur selben Teilmenge.
Beweis. Da nicht gleichzeitig −rn ≥ δ und rn ≥ δ für fast alle n ∈ N sein kann,
folgt −P ∩ P = ∅. Aus (rn )n∈N ∼ (0)n∈N folgt rn → 0. Also unterschreitet |rn | jedes
vorgegebene δ > 0, wenn nur n hinreichend groß ist. (rn )n∈N kann damit weder in
P noch in −P liegen.
Seien (rn )n∈N , (ρn )n∈N ∈ X äquivalent, aber beide nicht äquivalent zu (0)n∈N . Also
sind beide keine Nullfolgen. Für (rn )n∈N bedeutet das
∃δ ∈ Q, δ > 0 : ∀N ∈ N ∃ : m(N) ≥ N : |rm(N) | ≥ δ .
(4.1)
Sei N ∈ N, sodass |rn − rm | < 4δ , |ρn − rn | < 4δ , m, n ≥ N. Aus der Dreiecksungleichung folgt unmittelbar |ρn − rm | < 2δ und weiter
δ
δ
|rn | ≥ |rm | − |rn − rm | > |rm | − , |ρn | ≥ |rm | − |ρn − rm | > |rm | − .
4
2
(4.2)
Wählt man hier m = m(N) wie in (4.1), so folgt wegen |rm | ≥ δ aus |rn − rm | <
und |ρn − rm | < 2δ , dass
δ
4
sgn(rn ) = sgn(rm ) = sgn(ρn ) .
Aus (4.2) folgt |rn |, |ρn | ≥ 2δ . Also liegen (rn )n∈N und (ρn )n∈N gemeinsam in P
bzw. −P je nach dem Vorzeichen von rm .
❑
1 Fast
alle bedeutet hier alle bis auf endlich viele“.
”
92
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
(vi) Man sieht auch ganz leicht, dass aus (rn )n∈N , (sn )n∈N ∈ P folgt, dass (rn )n∈N +
(sn )n∈N , (rn )n∈N · (sn )n∈N ∈ P.
(vii) Nun betrachten wir X/∼ und definieren
[(rn )n∈N ]∼ + [(sn )n∈N ]∼ := [(rn )n∈N + (sn )n∈N ]∼ ,
[(rn )n∈N ]∼ · [(sn )n∈N ]∼ := [(rn )n∈N · (sn )n∈N ]∼ ,
−[(rn )n∈N ]∼ = [−(rn )n∈N ]∼ ,
P/∼ = {[(rn )n∈N ]∼ : (rn )n∈N ∈ P}.
Aus (iv) wissen wir, dass die Verknüpfungen damit wohldefiniert sind und aus (v),
dass P/∼ , [(0)n∈N]∼ , −P/∼ paarweise disjunkte Mengen sind, deren Vereinigung
X/∼ ist.
Nun übertragen sich das Kommutativgesetz, das Assoziativgesetz und das Distributivgesetz für + und · . Die Restklasse [(0)n∈N ]∼ ist das additiv neutrale Element,
und [(1)n∈N ]∼ ist das multiplikativ neutrale Element. Weiters ist −[(rn )n∈N ]∼ das
additiv Inverse von [(rn )n∈N ]∼ .
Was X/∼ noch fehlt, ein Körper zu sein, ist die Existenz einer multiplikativ Inversen. Dazu sei [(rn )n∈N ]∼ , [(0)n∈N ]∼ .
Nach (v) wissen wir, dass |rn | > δ für ein rationales δ > 0 und alle n ∈ N, n ≥ N.
Also gilt für m, n ≥ N
1 − 1 ≤ |rn − rm | ,
rn rm δ
und wir sehen, dass (qn )n∈N mit qn = r1n für n ≥ N, und qn = 0 für n < N, eine
Cauchy-Folge ist, und dass [(rn )n∈N ]∼ · [(qn )n∈N ]∼ = [(1)n∈N ]∼ .
Schließlich ist hX/∼ , +, ·, P/∼i wegen (vi) sogar ein angeordneter Körper. Wir bemerken noch, dass wegen (v) für die Ordnung ≤ auf X/∼ gilt, dass
[(rn )n∈N ]∼ < [(sn )n∈N ]∼ ⇔ rn + δ ≤ sn , n ≥ N
für ein δ > 0 und ein N ∈ N. Insbesondere gilt folgt aus rn ≤ sn , n ≥ N für ein
N ∈ N, dass [(rn )n∈N ]∼ ≤ [(sn )n∈N ]∼ .
(viii) Die Abbildung r 7→ [(r)n∈N ]∼ von Q nach X/∼ ist offenbar nicht identisch gleich
[(0)n∈N]∼ und mit der Addition und Multiplikation verträglich. Somit ist dies die
eindeutige Abbildung φ : Q → X/∼ aus Proposition 2.5.8, die für jeden angeordneten Körper existiert. Wegen Proposition 2.5.8 ist diese Abbildung auch injektiv
und mit −, < und ≤ verträglich.
(ix) hX/∼ , +, ·, P/∼i ist ein archimedisch angeordneter Körper, denn für jedes
[(rn )n∈N ]∼ ∈ X/∼ , ist (rn )n∈N eine Cauchy-Folge und daher beschränkt. Da Q archimedisch angeordnet ist, gibt es ein N ∈ N, sodass rn ≤ N, n ∈ N. Das bedingt
aber [(rn )n∈N ]∼ ≤ [(N)]∼ < [(N + 1)]∼, womit [(rn )n∈N ]∼ keine obere Schranke von
{[(k)n∈N ]∼ : k ∈ N} sein kann.
(x) Nun wollen wir zeigen, dass unser Körper vollständig angeordnet ist. Dazu sei
A ⊆ X/∼ eine nach oben beschränkte, nicht leere Menge. Wegen dem vorherigen
Punkt gilt somit A ≤ [(N+ )]∼ für ein festes N+ ∈ N. Wegen A , ∅ existiert
4.2. EINDEUTIGKEIT
93
ebenfalls nach dem vorherigen Punkt auch ein N− ∈ Z, sodass [(N− )]∼ keine
untere Schranke von A ist.
Für j ∈ N sei 1j! Z die Menge aller rationalen Zahlen der Form qp mit p ∈ Z und
1
q = j!. Man sieht leicht, dass Z ⊆ 1j! Z ⊆ ( j+1)!
Z ⊆ Q. Weiters sei
D j = {r ∈
1
Z : A ≤ [(r)n∈N ]∼ } ,
j!
für die D j ⊆ D j+1 gilt.
Wegen N+ ∈ D j ist D j nicht leer und wegen N− < D j ist D j nach unten beschränkt. Somit ist ( j!)(D j − N− ) + 1 eine nicht leere Teilmenge von N und hat somit ein Minimum. Also existiert auch das Minimum x j von D j . Wegen D j ⊆ D j+1
gilt x j+1 ≤ x j .
Wegen D j = {r ∈ 1j! Z : x j ≤ r} ist die Zahl y j := x j − 1j! ∈ 1j! Z das Maximum aller
r ∈ 1j! Z, die keine obere Schranke von A sind, also das Maximum von 1j! Z \ D j .
1
Aus 1j! Z \ D j ⊆ ( j+1)!
Z \ D j+1 folgt y j+1 ≥ y j . Wegen
0 ≤ xm − xn < xm − yn ≤ xm − ym =
1
m!
und
0 ≤ yn − ym < xn − ym ≤ xm − ym =
1
für m < n ,
m!
für m < n gilt (xn )n∈N , (yn )n∈N ∈ X, wobei (xn )n∈N ∼ (yn )n∈N ; also s := [(xn )n∈N ]∼ =
[(yn )n∈N ]∼ .
Nun gilt A ≤ s, denn anderenfalls gäbe es ein a ∈ A mit s < a und gemäß Satz
2.6.3 weiter ein r ∈ Q mit s < [(r)n∈N ] < a. Für j0 ∈ N mit r ∈ j10 ! Z – ein solches
gibt es offenbar – gilt r ∈ 1j! Z \ D j und somit r ≤ y j für alle j ≥ j0 . Es folgt der
Widerspruch [(r)n∈N ] ≤ [(yn )n∈N ]∼ = s.
Nun ist s die kleinste obere Schranke von A, da aus A ≤ b < s wieder mit Satz
2.6.3 die Existenz eines r ∈ Q mit A ≤ b < [(r)n∈N ] < s folgte. Für j0 ∈ N
mit r ∈ j10 ! Z gilt r ∈ D j und somit x j ≤ r für alle j ≥ j0 . Das ergibt aber den
Widerspruch s = [(xn )n∈N ]∼ ≤ [(r)n∈N ].
Also können wir uns nun sicher sein, dass es vollständig angeordnete Körper gibt.
4.2 Eindeutigkeit
4.2.1 Satz. Ist hK, +, ·, Pi ein vollständig angeordneter Körper und hX/∼ , +, ·, P/∼i der
soeben konstruierte Körper, dann gibt es eine eindeutige Abbildung φ̃ : X/∼ → K, die
nicht identisch gleich 0K und mit Addition und Multiplikation verträglich ist. Diese
Abbildung ist dann auch bijektiv, mit − sowie mit den Ordnungen < und ≤ verträglich.
Beweis. Nach Proposition 2.5.8 gibt es eine verknüpfungs- und ordnungstreue injektive
Abbildung φ : Q → K. Wegen Bemerkung 3.5.2 sind die Bilder von Nullfolgen bzw.
Cauchy-Folgen wieder Nullfolgen bzw. Cauchy-Folgen.
Ist [(rn )n∈N ]∼ ∈ X/∼ , so definieren wir
φ̃([(rn )n∈N ]∼ ) := lim φ(rn ).
n→∞
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
94
Man beachte, dass der Grenzwert existiert, da K wegen Satz 3.5.8 ein vollständig angeordneter Körper ist, und dass der Grenzwert nicht von der Wahl des Repräsentanten
(rn )n∈N der Restklasse [(rn )n∈N ]∼ abhängt. Ist nämlich (rn )n∈N ∼ (sn )n∈N , so folgt
lim φ(rn ) = lim φ(sn ) + lim φ(rn − sn ) = lim φ(sn ).
n→∞
n→∞
n→∞
n→∞
φ̃ ist injektiv, da
[(rn )n∈N ]∼ = [(sn )n∈N ]∼ ⇔ lim (rn − sn ) = 0 ⇔
n→∞
lim φ(rn − sn ) = 0 ⇔ lim φ(rn ) = lim φ(sn ).
n→∞
n→∞
n→∞
Die Surjektivität folgt aus der Tatsache, dass jede Zahl aus K durch eine Folge rationaler Zahlen approximiert werden kann; vgl. Beispiel 3.3.4. Die Verträglichkeit mit +
folgt aus (siehe Satz 3.3.5)
φ̃([(rn )n∈N ]∼ + [(sn )n∈N ]∼ ) = lim φ(rn + sn ) =
n→∞
lim φ(rn ) + lim φ(sn ) = φ̃([(rn )n∈N ]∼ ) + φ̃([(sn )n∈N ]∼ ),
n→∞
n→∞
und die für − sowie · zeigt man genauso. Um die Verträglichkeit mit der Ordnung zu
zeigen sei bemerkt, dass wegen Lemma 3.3.1 und Satz 2.6.3
φ̃([(rn )n∈N ]∼ ) ∈ P ⇔ lim φ(rn ) > 0 ⇔ ∃δ > 0, φ(rn ) ≥ δ für alle n ≥ N.
n→∞
Da φ ordnungstreu ist, bedeutet das aber genau [(rn )n∈N ]∼ ∈ P/∼ .
Sei φ̂ : X/∼ → K eine weitere, mit + und · verträgliche Abbildung mit φ̂ . 0K .
Aus φ̂(x)φ̂([(1)n∈N]∼ ) = φ̂(x · [(1)n∈N ]∼ ) = φ̂(x) für ein x ∈ X/∼ mit φ̂(x) , 0K folgt
φ̂([(1)n∈N]∼ ) = 1K ; also ist insbesondere die Abbildung r 7→ φ̂([(r)n∈N ]∼ ) nicht identisch
gleich 0K und offenbar mit + und · verträglich.
Die Eindeutigkeitsaussage in Proposition 2.5.8 impliziert φ̂([(r)n∈N ]∼ ) = φ(r) für
alle r ∈ Q, woraus wegen φ̂(a) + φ̂(−a) = φ̂([(0)n∈N]∼ ) = 0K und daher φ̂(−a) =
−φ̂(a) für jedes a ∈ X/∼ auch die Verträglichkeit mit − folgt. Für a , [(0)n∈N]∼ folgt
φ̂(a) · φ̂(a−1 ) = φ̂(a · a−1 ) = 1K , und daher φ̂(a) , 0K .
Für [(rn )n∈N ]∼ ∈ X/∼ folgt aus [(rn )n∈N ]∼ > [(0)n∈N]∼ wegen Satz 2.7.5
∃[(sn )n∈N ]∼ ∈ X/∼ , [(sn )n∈N ]∼ , [(0)n∈N ]∼ : [(sn )n∈N ]2∼ = [(rn )n∈N ]∼ .
Wegen φ̂([(sn )n∈N ]∼ ) , 0K ⇔ [(sn )n∈N ]∼ , [(0)n∈N ]∼ folgt daraus φ̂([(rn )n∈N ]∼ ) =
φ̂([(sn )n∈N ]∼ )2 > 0K . Somit ist φ̂ mit < und daher auch mit ≤ verträglich.
Wäre nun φ̂(x) < φ̃(x) für ein x ∈ X/∼ , und sind r, ρ ∈ Q gemäß Satz 2.6.3 so
gewählt, dass φ̂(x) < φ(r) < φ(ρ) < φ̃(x), so erhielten wir
x < [(r)n∈N ]∼ und [(ρ)n∈N ]∼ < x ,
(4.3)
da aus x ≥ [(r)n∈N ]∼ ( x ≤ [(ρ)n∈N ]∼ ) wegen der Ordnungstreue von φ̂ ( φ̃ ) die
Beziehung φ̂(x) ≥ φ̂([(r)n∈N ]∼ ) = φ(r) ( φ̃(x) ≤ φ̃([(ρ)n∈N ]∼ ) = φ(ρ) ) folgt. (4.3)
impliziert ρ < r, wogegen φ(r) < φ(ρ) die Ungleichung r < ρ nach sich zieht.
Da man genauso aus φ̂(x) > φ̃(x) einen Widerspruch erhält, muss φ̂ = φ̃.
❑
Somit haben wir die Existenz und die Eindeutigkeit eines vollständig angeordneten
Körpers und damit auch Satz 2.7.3 bewiesen.
4.2. EINDEUTIGKEIT
95
4.2.2 Bemerkung. Die in diesem Abschnitt angegebene Vorgangsweise aus Q die reellen Zahlen zu konstruieren lässt sich auch anwenden um zu zeigen, dass es zu jedem
metrischen Raum hX, di einen vollständigen metrischen Raum hX̂, d̂i gibt, sodass hX, di
isometrisch und dicht in hX̂, d̂i enthalten ist.
In der Tat nimmt man auch hier die Menge X aller Cauchy-Folgen in hX, di, betrachtet genauso die Äquivalenzrelation ∼, die zwei Folgen identifiziert, falls deren
Differenz eine Nullfolge ist, und beweist, dass X/∼ versehen mit einer geeigneten Metrik der gesuchte metrische Raum ist.
96
KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN
Kapitel 5
Geometrie metrischer Räume
5.1 ǫ-Kugeln, offene und abgeschlossene Mengen
Als erstes wollen wir uns dem anschaulich leicht verständlichen Begriff der Kugel in
metrischen Räumen zuwenden.
5.1.1 Definition. Sei hX, di ein metrischer Raum und x ∈ X. Dann heißt die Menge
Uǫ (x) := {y ∈ X : d(y, x) < ǫ} die offene ǫ-Kugel um den Punkt x, und die Menge
Kǫ (x) := {y ∈ X : d(y, x) ≤ ǫ} die abgeschlossene ǫ-Kugel um den Punkt x.
5.1.2 Beispiel.
(i) Man betrachte R versehen mit der euklidischen Metrik. Für x ∈ R ist dann
Uǫ (x) = (x − ǫ, x + ǫ) und Kǫ (x) = [x − ǫ, x + ǫ].
(ii) Sei X eine Menge, und sei diese mit der diskreten Metrik aus Beispiel 3.1.5 versehen. Ist ǫ ≤ 1, so gilt dann in diesem Raum Uǫ (x) = {x}. Für ǫ > 1 gilt Uǫ (x) = X.
(iii) Betrachte R2 , und versehe diese Menge einerseits mit der Metrik, d1 , der euklidischen Metrik d2 und mit d∞ ; siehe Beispiel 3.1.5. Die ǫ-Kugeln Uǫ1 (0) bzgl. d1
sowie Uǫ2 (0) bzgl. d2 bzw. Uǫ∞ (0) bzgl. d∞ lassen sich folgendermaßen darstellen.
Uǫ1 (0)
Uǫ∞ (0)
Uǫ2 (0)
ǫ
ǫ
ǫ
ǫ
ǫ
Abbildung 5.1: ǫ-Umgebungen von 0
97
ǫ
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
98
5.1.3 Bemerkung. Die Konvergenz einer Folge (xn )n∈N in metrischen Räumen lässt sich
durch obige Mengen folgendermaßen formulieren:
x = lim xn ⇔ ∀ǫ > 0 ∃N ∈ N : {xn : n ≥ N} ⊆ Uǫ (x).
n→∞
Wegen Uǫ (x) ⊆ Kǫ (x) ⊆ U2ǫ (x) können wir hier genauso Kǫ (x) anstatt Uǫ (x) schreiben.
Diese Sichtweise des Grenzwertbegriffes gewinnt zum Beispiel dann an Bedeutung, wenn man den Konvergenzbegriff bezüglich verschiedener Metriken vergleichen
will.
Betrachten wir etwa die Metriken d und d∞ aus Beispiel 5.1.2, (iii), so folgt aus
2
(3.9), dass Uǫ2 (x) ⊆ Uǫ∞ (x) ⊆ U2ǫ
(x). Nimmt man nun obiges Konvergenzkriterium
her, so sieht man unmittelbar, dass eine Folge genau dann bzgl. d konvergiert, wenn sie
es bzgl. d∞ tut; siehe Proposition 3.6.1.
5.1.4 Definition. Sei hX, di ein metrischer Raum. Eine Teilmenge O von X heißt offen,
wenn es zu jedem Punkt x ∈ O eine ǫ-Kugel gibt mit Uǫ (x) ⊆ O.
ǫ
x
ǫ ′′
x′′
ǫ′
x′
O
Abbildung 5.2: Offene Mengen
5.1.5 Beispiel.
In (R, d) sind z.B. die Mengen (a, b) und R \ {0} offen. Denn ist etwa x ∈ (a, b),
b−x
so folgt für ǫ = min( x−a
2 , 2 ), dass U ǫ (x) = (x − ǫ, x + ǫ) ⊆ (a, b).
Man sieht sofort, dass in jedem metrischen Raum hX, di die Mengen ∅ und X
immer offen sind.
5.1.6 Bemerkung. Sei hX, di ein metrischer Raum und sei x ∈ X sowie ǫR, ǫ > 0.
Ist y ∈ Uǫ (x), dh. d(x, y) < ǫ, und ist 0 < δ ≤ ǫ − d(x, y), so folgt für z ∈ Uδ (y) aus
d(y, z) < δ, dass
d(x, z) ≤ d(x, y) + d(y, z) < d(x, y) + δ ≤ d(x, y) + ǫ − d(x, y) = ǫ ,
und somit z ∈ Uǫ (x). Also gilt Uδ (y) ⊆ Uǫ (x). Insbesondere sind alle offenen Kugeln
in metrischen Räumen offen.
5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN
5.1.7 Proposition. Sei hX, di ein metrischer Raum. Dann gilt
Ist n ∈ N und sind O1 , . . . , On offene Teilmengen von X, so ist auch
99
Tn
i=1
Oi offen.
Ist I eine beliebige Indexmenge, und sind Oi offene Teilmengen von X, so auch
S
i∈I Oi .
Beweis. Seien O1 , . . . , On offen und x ∈ O1 ∩ . . . ∩ On . Definitionsgemäß gibt es
ǫ1 , . . . , ǫn > 0 mit Uǫi (x) ⊆ Oi , i = 1, . . . , n. Es folgt
Umin{ǫ1 ,...,ǫn } (x) = Uǫ1 (x) ∩ . . . ∩ Uǫn (x) ⊆ O1 ∩ . . . ∩ On .
Damit ist O1 ∩ . . . ∩ On offen.
S
Seien Oi , i ∈ I, offen, und x ∈ i∈I Oi . Dann existiert ein i ∈ I mit x ∈ Oi , und
S
daher ein ǫ > 0 mit Uǫ (x) ⊆ Oi . Insgesamt folgt Uǫ (x) ⊆ i∈I Oi .
❑
5.1.8 Definition. Sei hX, di ein metrischer Raum, E ⊆ X und x ∈ X.
Man nennt x einen Häufungspunkt von E, wenn jede ǫ-Kugel um x einen Punkt
aus E \ {x} enthält, dh.
∀ǫ > 0 ⇒ Uǫ (x) ∩ (E \ {x}) , ∅ ,
oder anders formuliert,
∀ǫ > 0 ∃y ∈ E, x , y : d(x, y) < ǫ.
Wenn x ∈ E kein Häufungspunkt ist, so nennen wir ihn isolierten Punkt von E.
Das ist also ein Punkt aus E, sodass
∃ǫ > 0, Uǫ (x) ∩ E = {x}.
Wir sagen eine Menge A ⊆ X ist abgeschlossen, wenn jeder Häufungspunkt von
A schon in A enthalten ist.
5.1.9 Bemerkung. Sei E ⊆ X. Für jedes x ∈ X tritt genau einer der folgenden Fälle ein:
(i) x ist isolierter Punkt von E.
(ii) x ∈ E und x ist Häufungspunkt von E.
(iii) x < E und x ist Häufungspunkt von E.
(iv) x < E und x ist nicht Häufungspunkt von E.
5.1.10 Definition. Die Menge aller x, die eine der Bedingungen (i), (ii) oder (iii)
erfüllen, wollen wir mit Abschluss der Menge E, in Zeichen c(E), bezeichnen.
Sind E ⊆ F ⊆ X derart, dass c(E) ⊇ F, so nennt man E dicht in F.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
100
5.1.11 Fakta.
1. Man zeigt unmittelbar, dass aus E ⊆ F die Inklusion c(E) ⊆ c(F) folgt.
2. Klarerweise ist E ⊆ c(E), wobei c(E) = E genau dann, wenn E abgeschlossen
ist.
3. Für ein x ∈ X gilt x ∈ c(E) genau dann, wenn
∀ǫ > 0 ∃y ∈ E : d(x, y) < ǫ
bzw. genau dann, wenn
∀ǫ > 0 ⇒ E ∩ Uǫ (x) , ∅.
(5.1)
4. Ist x ∈ c(c(E)), so folgt aus dieser Bedingung angewandt auf c(c(E)), dass
c(E) ∩ U 2ǫ (x) für beliebiges ǫ > 0 ein y enthält. Nochmals diese Bedingung
angewandt auf c(E) ergibt E ∩ U 2ǫ (y) , ∅, was zusammen mit U 2ǫ (y) ⊆ Uǫ (x)
(siehe Bemerkung 5.1.6) E∩Uǫ (x) , ∅ nach sich zieht. Also gilt x ∈ c(E) und somit c(c(E)) ⊆ c(E). Die umgekehrte Inklusion gilt ohnehin, dh. c(c(E)) = c(E).
Insbesondere ist c(E) immer abgeschlossen.
5. In jeder ǫ-Kugel Uǫ (x) um einen Häufungspunkt x von E liegen sogar unendlich viele Punkte von E \ {x}. Denn angenommen es wären nur endlich viele
x1 , . . . , xn , so erhielten wir mit δ := min{ǫ, d(x, x1 ), . . . , d(x, xn )} > 0 den Widerspruch Uδ (x) ∩ E \ {x} = ∅.
5.1.12 Beispiel.
Sei E = [0, 1) ∪ {2} als Teilmenge von R. Dann ist 1 ein Häufungspunkt von
E, da jede ǫ-Kugel (1 − ǫ, 1 + ǫ) um 1 sicherlich Punkte aus E enthält – etwa
max(1 − 12 ǫ, 12 ). Da 1 nicht zu E gehört, ist E nicht abgeschlossen.
Für x ∈ [0, 1) und jedes ǫ > 0 gilt sicher
x < y := min(
x+1
1
, x + ǫ) < min(x + ǫ, 1) ,
2
2
also y ∈ E ∩ Uǫ (x) \ {x}. Somit sind auch alle Punkte aus [0, 1) Häufungspunkt
von E.
Für x < [0, 1] folgt mit ǫ = min(|x|, |x − 1|) sicherlich E ∩ Uǫ (x) \ {x} = ∅, womit
[0, 1] genau die Menge aller Häufungspunkte von E und 2 ein isolierter Punkt
ist. Also gilt schließlich c(E) = [0, 1] ∪ {2}.
Ist hX, di ein beliebiger metrischer Raum, so sind auch ∅ und X abgeschlossen.
Erstere Menge hat offenbar keine Häufungspunkte und enthält somit trivialerweise alle solchen, und X enthält auch alle seine Häufungspunkte, da diese ja als
Punkte von X definiert sind.
Ist hX, di ein beliebiger metrischer Raum, und E ⊆ X eine endliche Teilmenge,
so hat E keine Häufungspunkte, besteht daher nur aus isolierten Punkten und ist
daher immer abgeschlossen.
5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN
101
5.1.13 Lemma. Ein Punkt x ist ein Häufungspunkt einer Menge E genau dann, wenn
es eine Folge (xn )n∈N von Punkten xn ∈ E \ {x} gibt mit xn → x.
Ein Punkt x liegt genau dann in c(E), wenn es eine Folge (xn )n∈N von Punkten
xn ∈ E gibt mit xn → x.
Beweis. Ist x Häufungspunkt von E, so gibt es zu jedem n ∈ N ein xn ∈ E \ {x} mit
d(x, xn ) < n1 , also xn → x.
Ist x isolierter Punkt von E, so konvergiert die identische Folge x = xn , n ∈ N gegen
x. Diese Folge ist klarerweise aus E.
Sei nun umgekehrt x = limn→∞ xn für eine Folge aus E. Ist für ein n ∈ N, xn = x,
so folgt trivialerweise x = xn ∈ E ⊆ c(E).
Im Fall xn , x für alle n ∈ N ist die Folge (xn )n∈N sicher in E \ {x} enthalten, und
zu jedem ǫ > 0 gibt es ein N ∈ N, sodass ∅ , {xn : n ≥ N} ⊆ Uǫ (x). Jedes Element der
Menge auf der linken Seite ist in Uǫ (x) ∩ E \ {x} enthalten. x ist somit Häufungspunkt
von E.
❑
5.1.14 Beispiel.
Ist F ⊆ R abgeschlossen und nach oben beschränkt, so sei x := sup F. Nach
Beispiel 3.3.4 gibt es in F eine Folge, die gegen sup F konvergiert. Die Abgeschlossenheit von F impliziert sup F ∈ F, d.h. sup F = max F.
Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum.
Ist hX, di ein beliebiger metrischer Raum, so ist jede abgeschlossene Kugel Kǫ (x)
abgeschlossen. Ist nämlich y ∈ c(Kǫ (x)) von Kǫ (x), so gibt es gemäß Lemma
5.1.13 eine Folge (yn )n∈N aus Kǫ (x) mit limn→∞ yn = y. Wegen Lemma 3.2.10
und Lemma 3.3.1 folgt
d(x, y) = lim d(x, yn ) ≤ ǫ .
n→∞
Also haben wir y ∈ Kǫ (x). Somit gilt c(Kǫ (x)) = Kǫ (x), weshalb Kǫ (x) abgeschlossen ist; vgl. Fakta 5.1.11.
Die rationalen Zahlen liegen dicht in R. In der Tat haben wir in Beispiel 3.3.4
für ein beliebiges x ∈ R eine Folge aus Q \ {x} konstruiert haben, die gegen x
konvergiert. Wegen Lemma 5.1.13 ist x somit Häufungspunkt von Q.
5.1.15 Proposition. Ist hX, di ein metrischer Raum und A ⊆ X, so sind folgende Aussagen äquivalent.
(i) Ac (= X \ A) ist offen.
(ii) A ist abgeschlossen.
(iii) Ist (xn )n∈N eine Folge von Punkten aus A und ist (xn )n∈N konvergent, so liegt auch
ihr Grenzwert in A.
Beweis.
(i) ⇒ (ii): Ein Punkt x ∈ c(A) kann nicht in Ac liegen, denn anderenfalls folgt aus Ac
offen, dass Uǫ (x) ⊆ Ac für ein ǫ > 0, und damit der Widerspruch Uǫ (x) ∩ A = ∅
zu (5.1). Also muss x ∈ A und daher A = c(A).
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
102
(ii) ⇒ (i): Da A abgeschlossen ist, ist jedes x ∈ Ac kein Häufungspunkt von A. Also
gibt es ein ǫ > 0 mit Uǫ (x)∩A = Uǫ (x)∩A\{x} = ∅. Das ist aber gleichbedeutend
mit Uǫ (x) ⊆ Ac . Also ist Ac offen.
(ii) ⇔ (iii): Folgt unmittelbar aus der Tatsache, dass A genau dann abgeschlossen ist,
wenn c(A) = A, und aus Lemma 5.1.13.
❑
Diese einfache Charakterisierung von abgeschlossenen Mengen zusammen mit
n
[
i=1
Ai
c
=
n
[
\
\ c
(Ai )c
(Aci ),
Ai =
i=1
i∈I
i∈I
und Proposition 5.1.7 liefert uns sofort das folgende
5.1.16 Korollar. Sei hX, di ein metrischer Raum. Dann gilt
S
Sind n ∈ N und A1 , . . . , An abgeschlossen, so auch ni=1 Ai .
Ist I eine beliebige Indexmenge, und sind alle Mengen Ai , i ∈ I, abgeschlossen,
T
so folgt, dass auch i∈I Ai abgeschlossen ist.
5.1.17 Beispiel.
Korollar 5.1.16 gestattet uns z.B. Einheitskreislinie T = {z ∈ C : |z| = 1} als
abgeschlossene Teilmenge von C zu identifizieren. In der Tat ist T = K1 (0) ∩
(U1 (0))c , und damit Durchschnitt von abgeschlossenen Mengen.
Man betrachte M = {z ∈ C : Re z ≥ 0} als Teilmenge von C. Ist (zn )n∈N eine
Folge aus M, die gegen z ∈ C konvergiert, so muss nach Proposition 3.6.1 die
Folge (Re zn )n∈N in R gegen Re z konvergieren. Wegen Lemma 3.3.1 folgt aus
Re zn ≥ 0, n ∈ N, dass auch Re z ≥ 0 und damit z ∈ M. Nach Proposition 5.1.15
ist M abgeschlossen.
Die Teilmenge {z ∈ C : 0 ≤ Re z ≤ 1} von C lässt sich als Durchschnitt von
{z ∈ C : Re z ≥ 0} und {z ∈ C : Re z ≤ 1} schreiben. Nach dem vorhergehenden
Beispiel ist die erste Menge abgeschlossen. Entsprechendes gilt für die zweite
Menge. Also ist {z ∈ C : 0 ≤ Re z ≤ 1} der Durchschnitt von abgeschlossenen
Mengen und damit selber abgeschlossen.
Das Quadrat {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]} ist der Durchschnitt der
abgeschlossenen Mengen {z ∈ C : 0 ≤ Re z ≤ 1} und {z ∈ C : 0 ≤ Im z ≤ 1}, und
daher auch abgeschlossen.
Da die Menge {z ∈ C : Re z ≥ 0} abgeschlossen ist, folgt, dass ihr Komplement
M := {z ∈ C : Re z < 0} in C offen ist. Das kann man auch direkt nachweisen:
Ist z ∈ M beliebig, so wähle ǫ = − Re z > 0. Ist w ∈ Uǫ (z), so folgt wegen
− Re z + Re w ≤ | Re z − Re w| ≤ |z − w| und damit − Re w ≥ − Re z − |z − w| >
− Re z − ǫ = 0, dass auch w ∈ M, und daher Uǫ (z) ⊆ M.
5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN
103
Das Quadrat M = {z ∈ C : Re z ∈ (0, 1), Im z ∈ (0, 1)} lässt sich als Durchschnitt
von endlich vielen offenen Mengen schreiben:
M = {z ∈ C : Re z > 0}∩{z ∈ C : Re z < 1}∩{z ∈ C : Im z > 0}∩{z ∈ C : Im z < 1} .
Sie ist daher selber offen.
Um sich c(M) für M aus dem vorherigen Beispiel auszurechnen, sei zunächst
bemerkt, dass c(M) ⊆ c({z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]}) = {z ∈ C : Re z ∈
[0, 1], Im z ∈ [0, 1]}; vgl. Fakta 5.1.11.
Sei nun z ∈ C mit Re z ∈ [0, 1], Im z ∈ [0, 1]. Im Fall Re z ∈ (0, 1), Im z ∈ (0, 1)
gilt offenbar z ∈ M ⊆ c(M). Anderenfalls muss Re z = 0, Re z = 1, Im z = 0 oder
Re z = 1 sein.
1
+ i Im z)n∈N eine Folge aus M, die gegen z konvergiert,
Im ersten Fall ist ( n+1
dh. z ∈ c(M). In den anderen Fällen konstruiert man ähnliche Folgen und erhält
genauso z ∈ c(M). Insgesamt gilt also
c(M) = {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]} .
Betrachte die Teilmenge M von R definiert durch
[ 1 1
M=
(
, ).
n+1 n
n∈2N
Diese Menge ist als Vereinigung von offenen Mengen offen.
S
Um alle Häufungspunkte zu ermitteln, sei zunächst x ∈
x ≤ n1 für ein n ∈ 2N. Für jedes ǫ > 0 gilt
M ∩ Uǫ (x) \ {x} ⊇ (
1
1
1
n∈2N [ n+1 , n ], also n+1
≤
1 1
, ) ∩ (x − ǫ, x + ǫ) \ {x} =
n+1 n
1
1 max(x − ǫ,
), min(x + ǫ, ) \ {x} .
n+1
n
1
1
≤ x ≤ n1 immer max(x−ǫ, n+1
) < min(x+ǫ, 1n ), folgt M ∩Uǫ (x)\{x} ,
Da für n+1
1 1
+ 2k
aus M heraus
∅. Somit ist x ein Häufungspunkt. Da die Folge 12 2k+1
k∈N
gegen 0 konvergiert, muss auch 0 ein Häufungspunkt sein; vgl. Lemma 5.1.13.
Also ist die Menge
[ " 1 1#
,
H = {0} ∪
n+1 n
n∈2N
in der Menge aller Häufungspunkte von M enthalten.
Ist andererseits x ein Häufungspunkte von M und (x j ) j∈N eine Folge aus M mit
Grenzwert x, so gibt es zwei Möglichkeiten:
1 1
, n ) existieren, so gibt
Falls für jedes n ∈ 2N nur endlich viele j ∈ N mit x j ∈ ( n+1
1
es zu jedem ǫ > 0 ein K ∈ N mit 2K+2 < ǫ und in Folge nur endlich viele j ∈ N
S
1
mit x j ∈ k∈{1,...,K} ( 2k+1
, 2k1 ). Insbesondere gibt es ein J ∈ N, sodass
xj ∈ M \
[
(
k∈{1,...,K}
[
1
1
1
1
, )⊆
(
, )
2k + 1 2k
2k
+
1
2k
k∈{K+1,k+2,... }
⊆ (−
1
1
,
) ⊆ (−ǫ, ǫ),
2K + 2 2K + 2
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
104
für alle j ≥ J, womit x = lim j→∞ x j = 0.
1
Falls es ein n ∈ 2N gibt, sodass x j ∈ ( n+1
, 1n ) für unendlich viele j ∈ N, so liegt
1
1
, 1n ) ⊆ [ n+1
, 1n ]. Wegen Satz 3.2.8 ist x auch
eine Teilfolge von (x j ) j∈N ganz in ( n+1
1
, 1n ] liegt.
Grenzwert dieser Teilfolge, der wegen Lemma 3.3.1 auch in [ n+1
Also haben wir gezeigt, dass jeder Häufungspunkte von M in H liegt, und damit
H genau die Menge der Häufungspunkte von M ist. Schließlich gilt noch c(M) =
M ∪ H = H.
Um zu zeigen, dass es außerhalb von H keine anderen Häufungspunkte von M
gibt, kann man alternativ auch
R \ H = (−∞, 0) ∪
[
n∈2N
(
1
1
1
,
) ∪ ( , +∞)
n+2 n+1
2
nachweisen und damit R \ H als offen bzw. H als abgeschlossen identifizieren.
Als abgeschlossene Teilmenge enthält H daher alle Häufungspunkte von H und
damit auch von M.
5.2 Kompaktheit
Wir wollen auch Häufungspunkte für Folgen einführen.
5.2.1 Definition. Sei hX, di ein metrischer Raum. Dann heißt ein x ∈ X Häufungspunkt
einer Folge (xn )n∈N , falls es eine gegen x konvergente Teilfolge von (xn )n∈N gibt.
5.2.2 Lemma. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di.
(i) Konvergiert (xn )n∈N gegen x, so ist x der einzige Häufungspunkt.
(ii) Ist (xn( j) ) j∈N eine Teilfolge von (xn )n∈N , so ist die Menge aller Häufungspunkte
von (xn( j) ) j∈N eine Teilmenge von der Menge aller Häufungspunkte von (xn )n∈N .
(iii) x ist Häufungspunkt der Folge (xn )n∈N genau dann, wenn für jedes N ∈ N der Punkt x in c({xn : n ≥ N}) liegt.
Beweis.
(i) Das folgt unmittelbar aus Satz 3.2.8, da Teilfolgen konvergenter Folgen auch gegen den Grenzwert der Folge streben.
(ii) Da jede Teilfolge von (xn( j) ) j∈N erst recht eine Teilfolge von (xn )n∈N ist, muss jeder
Häufungspunkt von (xn( j) ) j∈N auch einer von (xn )n∈N sein.
(iii) Sei zunächst x Häufungspunkt der Folge (xn )n∈N . Also x = lim j→∞ xn( j) . Wir halten N fest und wählen J ∈ N, sodass
n(J) ≥ N. Dann ist (xn( j+J) ) j∈N eine Folge in {xn : n ≥ N}, die gegen x konvergiert. Es folgt x ∈ c({xn : n ≥ N}) nach
Lemma 5.1.13.
Ist umgekehrt x ∈ c({xn : n ≥ N}) für alle N ∈ N, so sei n(1) ∈ N, sodass d(x, xn(1) ) < 1. Haben wir n(1) < · · · < n(k)
gewählt, so sei n(k + 1) ∈ N mit n(k + 1) > n(k) derart, dass d(x, xn(k+1) ) <
1
k+1 .
So ein n(k + 1) existiert, weil x ∈
c({xn : n ≥ n(k)+ 1}). Wir haben somit eine Teilfolge konstruiert, die gegen x konvergiert. x ist somit Häufungspunkt
der Folge (xn )n∈N .
❑
Bezüglich Häufungspunkte von Folgen aus R haben wir
5.2. KOMPAKTHEIT
105
5.2.3 Proposition. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen.
Dann ist lim supn→∞ xn ( lim inf n→∞ xn ) der größte (kleinste) Häufungspunkt
von (xn )n∈N . Insbesondere hat jede beschränkte Folge reeller Zahlen mindestens einen
Häufungspunkt.
Außerdem ist (xn )n∈N konvergent genau dann, wenn ihr Limes Inferior mit dem Limes Superior übereinstimmt, bzw. genau dann, wenn (xn )n∈N genau einen Häufungspunkt hat.
Beweis. Dass lim inf n→∞ xn und lim supn→∞ xn Häufungspunkte von (xn )n∈N sind, folgt
aus Lemma 3.4.4. Ist y ein weiterer Häufungspunkt samt dazugehöriger Teilfolge
(xn( j) ) j∈N , so folgt
sup{xn : n ≥ n( j)} ≥ xn( j)
für alle j ∈ N, und daher
y = lim xn( j) ≤ lim sup{xn : n ≥ n( j)} = lim sup{xn : n ≥ N} = lim sup xn .
j→∞
j→∞
N→∞
n→∞
Entsprechend zeigt man lim inf n→∞ xn ≤ y.
Dass (xn )n∈N genau dann konvergiert, wenn lim inf n→∞ xn = lim supn→∞ xn haben
wir in Fakta 3.4.5 gesehen. Da lim inf n→∞ xn der kleinste und lim supn→∞ xn der größte
Häufungspunkt ist, gibt es genau einen solchen, wenn der kleinste und der größte
übereinstimmen.
❑
5.2.4 Beispiel. Man betrachte die Folge xn = (−1)n (1 + n1 ), n ∈ N in R. Die Teilfolge
1
1
konvergiert für k → ∞ gegen 1, und die Teilfolge x2k−1 = −1 − 2k−1
x2k = 1 + 2k
konvergiert für k → ∞ gegen −1.
Also sind −1 und 1 Häufungspunkte unserer Folge. Angenommen x ∈ R wäre ein
weiterer Häufungspunkt. Dann gäbe es eine Teilfolge (xn( j) ) j∈N , die gegen x konvergierte. Nun sei
J1 = { j ∈ N : n( j) ist ungerade} und J2 = { j ∈ N : n( j) ist gerade}.
˙ 2 , und somit ist zumindest eine dieser Mengen unendlich.
Klarerweise ist N = J1 ∪J
Ist J1 unendlich, so gibt es eine streng monoton wachsende Bijektion j : N → J1 ;
vgl. Lemma 2.3.15. Also ist (xn( j(k)) )k∈N eine Teilfolge von (xn( j) ) j∈N und somit ebenfalls
gegen x konvergent. Andererseits konvergiert aber
xn( j(k)) = −1 −
1
n( j(k))
wegen n( j(k)) ≥ k gegen −1. Also muss x = −1. Ist J2 unendlich, so folgt analog
x = 1. Jedenfalls haben wir gezeigt, dass −1, 1 die einzigen Häufungspunkte sind. Aus
Proposition 5.2.3 folgt schließlich
lim inf xn = −1, lim sup xn = 1.
n→∞
n→∞
Folgender Satz ist ein sehr wichtiges Ergebnis der Analysis.
5.2.5 Satz (Bolzano1 -Weierstraß2 ). Sei (xn )n∈N eine beschränkte Folge in R p (versehen
mit der euklidischen Metrik). Dann hat (xn )n∈N einen Häufungspunkt.
1 Bernard
2 Karl
Bolzano. 5.10.1781 Prag - 18.12.1848 Prag
Theodor Wilhelm Weierstraß. 31.10.1815 Ostenfelde (Westfalen) - 19.12.1897 Berlin
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
106
Beweis. Wir zeigen den Satz durch vollständige Induktion nach p. Für Folgen in R
folgt der Satz aus Proposition 5.2.3.
Angenommen der Satz gilt für p ∈ N. Sei (xn )n∈N eine beschränkte Folge in R p+1 ,
wobei xn = (xn,1 , . . . , xn,p+1 ). Aus der Definition von d2 folgt für alle n ∈ N
|xn,p+1 | ≤ d2 (0, xn ) und d2 (0, (xn,1, . . . , xn,p ))2 ≤ d2 (0, xn ) .
|
{z
}
∈R p
Da (xn )n∈N in R p+1 beschränkt ist, sind es auch (xn,p+1 )n∈N in R und (xn,1 , . . . , xn,p ) n∈N
in R p .
Da wir den Satz im Fall p = 1 schon gezeigt haben, gibt es eine in R konvergente Teilfolge (xn( j),p+1 ) j∈N von (xn,p+1 )n∈N . Laut Induktionsvoraussetzung hat dann aber
auch (xn( j),1 , . . . , xn( j),p ) j∈N eine konvergente Teilfolge (xn( j(k)),1 , . . . , xn( j(k)),p ) k∈N in
Rp .
Man beachte, dass (xn( j(k)),p+1 )k∈N als Teilfolge der konvergenten Folge (xn( j),p+1 ) j∈N
auch konvergiert. Nach Proposition 3.6.1 konvergiert daher auch (xn( j(k)) )k∈N in R p+1 .
❑
5.2.6 Definition. Sei hX, di ein metrischer Raum, und sei K ⊆ X mit der Eigenschaft,
dass jede Folge (xn )n∈N aus K einen Häufungspunkt in K hat. Dann heißt K kompakt.
5.2.7 Beispiel.
Man betrachte R. Die Teilmenge N von R ist nicht kompakt, da die Folge (n)n∈N
keine konvergente Teilfolge besitzt.
Das Intervall (0, 1] ist auch nicht kompakt, da die Folge ( n1 )n∈N gegen 0 konvergiert und somit in (0, 1] keinen Häufungspunkt besitzt.
Ist K ⊆ R p eine abgeschlossene und beschränkte Menge, so hat nach Satz 5.2.5
jede Folge einen Häufungspunkt, der nach Proposition 5.1.15 zu K gehört.
Insbesondere sind alle abgeschlossenen Intervalle [a, b] in R und allgemeiner
alle abgeschlossenen Kugeln Kr (x) in R p kompakt.
Wir sammeln einige elementare Eigenschaften von kompakten Teilmengen.
5.2.8 Proposition. Sei hX, di ein metrischer Raum. Dann gilt:
(i) Ist K ⊆ X kompakt, dann ist K abgeschlossen.
(ii) Ist K ⊆ X kompakt, und F ⊆ X abgeschlossen, sodass F ⊆ K, dann ist auch F
kompakt.
(iii) Kompakte Teilmengen sind beschränkt.
Beweis.
(i) Wir verwenden Proposition 5.1.15. Sei x = limn→∞ xn für eine Folge aus K. Nun
gibt es definitionsgemäß eine gegen ein y ∈ K konvergente Teilfolge von (xn )n∈N .
Andererseits konvergieren Teilfolgen von gegen x konvergenten Folgen ebenfalls
gegen x. Nun sind aber Grenzwerte eindeutig. Also gilt x = y ∈ K.
5.2. KOMPAKTHEIT
107
(ii) Sei F ⊆ K abgeschlossen. Ist (xn )n∈N eine Folge aus F, so ist sie trivialerweise
auch eine Folge aus K. Also gilt x = lim j→∞ xn( j) für eine Teilfolge (xn( j) ) j∈N und
ein x ∈ K. Nun ist aber F abgeschlossen, und somit folgt aus Proposition 5.1.15,
dass x ∈ F. Also enthält jede Folge in F eine gegen einen Punkt in F konvergente
Teilfolge.
(iii) Sei y ∈ X. Wäre K nicht beschränkt, so wäre auch {d(y, x) : x ∈ K} ⊆ R nicht
beschränkt. Also könnten wir zu jedem n ∈ N ein xn ∈ K finden, sodass d(y, xn ) ≥
n.
Aus der Kompaktheit folgt die Existenz einer konvergenten Teilfolge xn( j) →
x, j → ∞. Aus Lemma 3.2.10 folgt d(y, xn( j) ) → d(y, x). Das widerspricht aber
d(y, xn( j) ) ≥ n( j), j ∈ N.
❑
Aus Proposition 5.2.8 und Beispiel 5.2.7 erhalten wir folgende Charakterisierung
für die Kompaktheit einer Teilmenge von R p . Diese Charakterisierung der Kompaktheit
gilt jedoch nicht in allen metrischen Räumen.
5.2.9 Korollar. Eine Teilmenge K von R p ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist.
5.2.10 Beispiel.
Das Intervall (−∞, c] mit c ∈ R ist zwar abgeschlossen, aber nicht beschränkt in
R und somit nicht kompakt.
Die Menge M = {(x, y) ∈ R2 : 2x2 + 4x + y2 − y − 3 ∈ [7, 13]} ist kompakt in R2
versehen mit d2 . Wegen Korollar 5.2.9 müssen wir zeigen, dass M abgeschlossen
und beschränkt ist.
Dazu ((ξn , ηn ))n∈N sei eine beliebige Folge aus M mit Grenzwert (ξ, η) ∈ R2 .
Können wir nun zeigen, dass (ξ, η) ∈ M, so ist M gemäß Proposition 5.1.15
abgeschlossen. Wegen (ξn , ηn ) ∈ M gilt für alle n ∈ N
7 ≤ 2ξn2 + 4ξn + η2n − ηn − 3 ≤ 13 .
Für n → ∞ folgt mit Proposition 3.6.1 und Lemma 3.3.1
7 ≤ 2ξ2 + 4ξ + η2 − η − 3 ≤ 13 ,
und somit tatsächlich (ξ, η) ∈ M.
Um die Beschränktheit zu zeigen, bemerken wir zunächst, dass für (x, y) ∈ R2
2x2 + 4x + y2 − y − 3 =
1
1
1
21
2(x + 1)2 + (y − )2 − 3 − 2 − ≥ (x + 1)2 + (y − )2 −
.
2
4
2
4
Damit ist M in der Menge
n
o
21
1
≤ 13 =
(x, y) ∈ R2 : (x + 1)2 + (y − )2 −
2
4
r
n
73 o
1
2
(x, y) ∈ R : d s ((x, y), (−1, )) ≤
,
2
4
108
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
also in der abgeschlossenen Kugel K √ 73 ((−1, 21 )) in R2 bzgl. d2 enthalten.
4
Wir wollen diesen Abschnitt mit einem Konvergenzkriterium für Folgen beenden.
5.2.11 Lemma. Eine Folge (xn )n∈N in einem metrischen Raum hX, di konvergiert genau dann gegen einen Punkt x ∈ X, wenn jede Teilfolge von (xn )n∈N den Punkt x als
Häufungspunkt hat – oder äquivalent wenn jede Teilfolge von (xn )n∈N wiederum eine
Teilfolge hat, die gegen x konvergiert.
Gilt {xn : n ∈ N} ⊆ K für eine kompakte Teilmenge K von X, so ist die Konvergenz
von (xn )n∈N gegen x sogar dazu äquivalent, dass (xn )n∈N höchstens x als Häufungspunkt
hat.
Beweis. Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt
von (xn )n∈N und auch von allen ihren Teilfolgen.
Falls (xn )n∈N nicht gegen x konvergiert, so bedeutet das
∃ǫ > 0 : ∀N ∈ N ∃n ≥ N, d(xn , x) ≥ ǫ .
Daraus definieren wir induktiv eine Teilfolge (xn(k) )k∈N . Sei n(1) ∈ N, sodass
d(xn(1) , x) ≥ ǫ. Ist n(k) ∈ N definiert, so sei n(k + 1) die kleinste Zahl in N, sodass
n(k + 1) ≥ n(k) + 1 und d(xn(k+1) , x) ≥ ǫ.
Nun kann (xn(k) )k∈N den Punkt x nicht als Häufungspunkt haben, da wir sonst für
die entsprechende Teilfolge den Widerspruch
0 = d(x, x) = lim d(x, xn(k( j)) ) ≥ ǫ.
j→∞
erhielten. Somit haben wir den ersten Teil des Lemmas gezeigt.
Gilt nun {xn : n ∈ N} ⊆ K für eine kompakte Teilmenge K von X, so hat (xn(k) )k∈N
immer mindestens einen Häufungspunkt y, der auch Häufungspunkt von (xn )n∈N ist.
Falls diese nur höchstens x als Häufungspunkt hat, so muss y = x sein, und wir
erhalten wie oben einen Widerspruch.
❑
5.3 Gerichtete Mengen und Netze
Bei der Motivation des Grenzwertbegriffes für Folgen haben wir gesagt eine Folge
(xn )n∈N solle konvergent gegen x heißen, wenn für alle hinreichend großen Indizes das
Folgenglied xn beliebig nahe an x herankommt.
Für den weiteren Aufbau der Analysis verwenden wir ähnliche Grenzwertbegriffe
z.B. für Funktionen f : (a, b) → R. Dabei soll f (t) konvergent für t → b gegen x
heißen, wenn f (t) beliebig nahe an x herankommt, sobald t nur hinreichend nahe an b
zu liegen kommt.
Um nicht jedes Mal eine neue Konvergenztheorie aufbauen zu müssen, wollen wir
einen allgemeinen Grenzwertbegriff einführen, von dem alle von uns benötigten Grenzwertbegriffe Spezialfälle sind. Was bei den Folgen die natürlichen Zahlen waren, ist bei
unserem allgemeinen Konzept die gerichtete Menge.
5.3.1 Definition. Sei I eine nicht leere Menge, und sei eine Relation auf I. Dann
heißt (I, ) eine gerichtete Menge, wenn folgender drei Bedingungen genügt.
5.3. GERICHTETE MENGEN UND NETZE
109
Reflexivität:
∀i ∈ I : i i
Transitivität:
∀i, j, k ∈ I : i j ∧ j k ⇒ i k
Richtungseigenschaft:
∀i, j ∈ I ∃k ∈ I : i k ∧ j k.
(5.2)
An dieser Stelle sei explizit herausgehoben, dass wir hier weder Symmetrie noch
Antisymmetrie fordern. Im Allgemeinen muss (I, ) auch keine Totalordnung sein.
5.3.2 Beispiel.
(i) Neben (N, ≤) ist jede Totalordnung eine gerichtete Menge. Also etwa
((0, +∞), ≤), ((a, b), ≥), ((a, b), ≤), wobei a, b ∈ R, a < b.
Die Eigenschaft (5.2) wird bei einer Totalordnung zum Beispiel vom Maximum
zweier Elemente erfüllt.
(ii) Sei a, b, c ∈ R, a < b < c. Setze I := [a, b) ∪ (b, c] und definiere eine Relation auf I durch
x y : ⇐⇒ |y − b| ≤ |x − b| .
Dann ist reflexiv, transitiv, und je zwei Punkte sind vergleichbar. Also ist hI, i
eine gerichtete Menge. Man beachte, dass nicht antisymmetrisch und somit
keine Halbordnung ist.
(iii) Die gerichtete Menge aus dem letzten Beispiel ist ein Spezialfall des folgenden
Konzeptes.
Sei hX, dX i ein metrischer Raum, D ⊆ X und z ein Häufungspunkt von D. Auf
D \ {z} definieren wir durch
x y : ⇐⇒ dX (y, z) ≤ dX (x, z)
Mit dieser Relation wird D\{z} zu einer gerichteten Menge, wobei – salopp gesagt
– ein Punkt bezüglich der Relation weiter oben als ein anderer ist, wenn er näher
an z liegt.
(iv) Ist M eine nichtleere Menge, so ist die Potenzmenge P(M) versehen mit ⊆ eine
gerichtete Menge.
Die Menge E(M) aller endlichen Teilmengen von M versehen mit ⊆ ist ebenfalls
eine gerichtete Menge.
(v) Wir nennen eine endliche Teilmenge Z eines Intervalls [a, b] eine Zerlegung dieses Intervalls, wenn a, b ∈ Z. Die Menge aller solchen Zerlegungen wird mit Z
bezeichnet. Versieht man Z mit der Relation ⊆, so erhalten wir eine gerichtete
Menge.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
110
n(R)
(vi) Wir nennen das Paar R = ((ξ j )n(R)
j=0 ; (η j ) j=1 ) eine Riemann-Zerlegung eines Intervalls [a, b], falls
a = ξ0 < ξ1 < · · · < ξn(R) = b; η j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R),
und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Zerlegung.
Weiters sei R1 R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Zerlegungen, dann ist (R, ) eine gerichtete Menge. In diesem Beispiel ist sicher nicht
antisymmetrisch.
Dieser gerichteten Menge und der aus dem letzten Beispiel werden wir bei der
Einführung das Integrals wieder begegnen.
(vii) Sei I = N × N und
(n1 , m1 ) (n2 , m2 ) :⇔ n1 ≤ n2 ∧ m1 ≤ m2 .
(5.3)
Dann ist (I, ) eine gerichtete Menge. Diese gerichtete Menge dient für Konvergenzbetrachtungen bei Doppelfolgen.
(viii) Sind allgemeiner I und J gerichtete Mengen versehen mit Relationen I bzw. J ,
dann ist (I × J, ) ebenfalls eine gerichtete Menge, wenn wir
(i1 , j1 ) (i2 , j2 ) :⇔ i1 I i2 ∧ j1 J j2
(5.4)
definieren.
5.3.3 Definition. In Analogie zu den Folgen nennen wir eine Abbildung x : I → X ein
Netz bzw. eine Moore-Smith-Folge in der Menge X über der gerichteten Menge (I, ),
und schreiben diese als (xi )i∈I .
Entsprechend Definition 3.2.2 sagen wir, dass ein Netz (xi )i∈I in einem metrischen
Raum hX, di gegen einen Punkt x ∈ X konvergiert, falls
∀ǫ > 0 ∃i0 ∈ I : d(xi , x) < ǫ für alle i i0 .
(5.5)
In diesem Falle schreiben wir x = lim xi .
i∈I
5.3.4 Beispiel.
(i) Wie bei den Folgen sieht man, dass konstante Netze xi = x, i ∈ I, immer gegen x
konvergieren.
(ii) Als konkreteres Beispiel betrachte man die gerichtete Menge ([−1, 0) ∪ (0, 1], ),
wobei x y ⇔ |y| ≤ |x|, und f (t) = t2 . Dann konvergiert das Netz ( f (t))t∈[−1,0)∪(0,1]
gegen Null:
p
p
Zu gegebenen ǫ > 0 sei t0 = 2ǫ . Aus t t0 folgt |0− f (t)| = |t2 | ≤ |t02 | = 2ǫ 2 < ǫ.
(iii) Hat eine gerichtete Menge (I, ) mindestens ein maximales Element, dh. es gibt
ein j ∈ I mit j i für alle i ∈ I, – das ist wegen (5.2) sicher der Fall, wenn I
endlich ist –, so konvergiert ein Netz (xi )i∈I genau dann, wenn x j = xk für alle
maximalen j, k ∈ I, und zwar gegen x j , wobei j ∈ I ein solch maximales Element
ist. Insbesondere konvergiert (xi )i∈I , wenn es genau ein maximales Element j in I
gibt und zwar gegen x j .
5.3. GERICHTETE MENGEN UND NETZE
111
(iv) Man überzeugt sich leicht, dass eine Folge (xn )n∈N in einem metrischen Raum
hX, di genau dann eine Cauchy-Folge ist, wenn lim(m,n)∈N×N d(xm , xm ) = 0, wobei
N × N wie in (5.3) gerichtet ist.
Für Netze gelten viele der für Folgen hergeleiteten Ergebnisse. Die Beweise sind
im Wesentlichen die selben, wie für Folgen. Meist muss nur ≤ durch ersetzt werden.
5.3.5 Fakta.
1. Der Grenzwert ist eindeutig – vgl. Satz 3.2.8, (i) :
Ist (xi )i∈I ein Netz, und sei angenommen, dass xi → x und xi → y mit x , y.
Setze ǫ := d(x,y)
> 0. Dann gibt es wegen xi → x einen Index i1 , sodass für alle
3
i ∈ I mit i1 i gilt d(xi , x) < ǫ. Wegen xi → y gibt es auch i2 ∈ I, sodass für alle
i ∈ I mit i2 i gilt d(xi , y) < ǫ. Für i ∈ I mit i1 i und i2 i – solche gibt es
gemäß (5.2) – erhalten wir den Widerspruch
d(x, y) ≤ d(x, xi ) + d(xi , y) < 2
d(x, y)
.
3
2. Die Tatsache, dass es bei Folgen auf endlich viele Glieder nicht ankommt, hat
auch eine Verallgemeinerung für Netze; siehe Satz 3.2.8, (ii). Ist nämlich k ∈ I,
so ist auch (Ik , ) mit Ik = {i ∈ I : k i} eine gerichtete Menge und
lim xi = lim xi ,
i∈I
i∈Ik
(5.6)
wobei der rechte Grenzwert genau dann existiert, wenn der linke existiert.
3. Im Allgemeinen sind konvergente Netze nicht beschränkt. Aber da ein gegen ein
x konvergentes Netz {xi : i i0 } ⊆ Uǫ (x) für ein i0 ∈ I erfüllt, ist zumindest das
Netz (xi )i∈Ii0 beschränkt.
4. Man betrachte zwei Netze (xi )i∈I , (yi )i∈I über derselben gerichteten Menge (I, )
in einem metrischen Raum hX, di, die gegen x bzw. y konvergieren. Dann gilt
(siehe Lemma 3.2.10)
lim d(xi , yi ) = d(x, y).
(5.7)
i∈I
Eine genauere Betrachtung verdient das Analogon von Teilfolgen.
5.3.6 Definition. Sind (I, I ) und (J, J ) zwei gerichtete Mengen, ist X eine Menge
und (xi )i∈I ein Netz in X, so heißt (xi( j) ) j∈J eine Teilnetz von (xi )i∈I , wenn i : J → I
derart ist, dass3
∀i0 ∈ I ∃ j0 ∈ J : ∀ j J j0 ⇒ i( j) I i0 .
Ist (J, J ) = (N, ≤), so heißt (xi( j) ) j∈J = (xi(n) )n∈N eine Teilfolge 4 .
5.3.7 Lemma. Sei hX, di ein metrischer Raum, (I, ) eine gerichtete Menge und (xi )i∈I
ein Netz in X.
Ist (J, J ) eine weitere gerichtete Menge derart, dass (xi( j) ) j∈J ein Teilnetz von (xi )i∈I
ist, so folgt aus x = limi∈I xi , dass auch x = lim j∈J xi( j) .
3 Dies ist eigentlich eine Bedingung an die gerichteten Mengen (I, ) und (J, ) und nicht an das konI
J
krete Netz.
4 Im Gegensatz zu Teilfolgen von Folgen verlangen wir hier nicht, dass i : N → I streng monoton ist.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
112
Beweis. Ist x = limi∈I xi , und ǫ > 0, so gibt es ein i0 ∈ I, sodass d(x, xi ) < ǫ wenn
i i0 . Ist nun j0 ∈ J, sodass i( j) i0 für alle j J j0 , so folgt d(x, xi( j) ) < ǫ wenn
j J j0 . Also gilt x = lim j∈J xi( j) .
❑
5.3.8 Fakta. Wir zählen einige Sätze, Rechenregeln, etc. auf, die wir für Folgen hergeleitet haben, und die sich auf Netze mit praktisch denselben Beweisen übertragen
lassen.
1. Sind (xi )i∈I und (yi )i∈I 5 konvergente Netze in R, und gilt xi ≤ yi für alle i, die k
für ein k ∈ I sind, so folgt (vgl. Lemma 3.3.1)
lim xi ≤ lim yi .
i∈I
(5.8)
i∈I
Ist umgekehrt limi∈I xi < limi∈I yi , so gilt xi < yi für alle i k mit einem gewissen
k ∈ I.
2. Seien (xi )i∈I , (yi )i∈I und (ai )i∈I Netze in R über derselben gerichteten Menge,
sodass xi ≤ ai ≤ yi für alle i i0 mit einem gewissen i0 ∈ I. Gilt
lim xi = lim yi ,
i∈I
i∈I
so existiert auch der Grenzwert limi∈I ai und stimmt mit dem gemeinsamen
Grenzwert von (xi )i∈I und (yi )i∈I überein; vgl. Satz 3.3.2.
3. Für zwei konvergente Netze (zi )i∈I und (wi )i∈I über derselben gerichteten Menge
(I, ) in R oder in C gilt
lim(zi + wi ) = (lim zi ) + (lim wi ) , lim(zi · wi ) = (lim zi ) · (lim wi ) ,
i∈I
i∈I
i∈I
i∈I
i∈I
i∈I
(5.9)
lim −zi = − lim zi , lim |zi | = lim zi .
i∈I
i∈I
i∈I
i∈I
Da Netze i.A. nicht beschränkt sind, verläuft der Beweis für · eine Spur anders,
als im Beweis von Satz 3.3.5:
Sei ǫ > 0 oBdA. so, dass ǫ ≤ 1. Seien i1 , i2 so groß, dass i i1 ⇒ |zi − z| < ǫ und
i i2 ⇒ |wi − w| < ǫ. Insbesondere gilt für solche i auch |wi | ≤ |w| + ǫ ≤ |w| + 1.
Gemäß Definition 5.3.1 gibt es ein i0 i1 , i2 . Für i i0 folgt
|zi wi − zw| = |(zi − z)wi + z(wi − w)| ≤ |zi − z| · |wi | + |z| · |wi − w|
< ǫ|wi | + |z|ǫ ≤ (|w| + 1 + |z|)ǫ.
In Analogie zu (3.4) folgt daraus zi wi → zw, i ∈ I.
4. Ist (zi )i∈I ein Netz in R oder C, sodass zi , 0, i ∈ I, und limi∈I zi = z , 0. Dann
folgt limi∈I z1i = 1z ; vgl. Satz 3.3.5.
5 Klarerweise
ist dabei nicht ausgeschlossen, dass eines dieser Netze konstant ist.
5.3. GERICHTETE MENGEN UND NETZE
113
5. Ist (xi )i∈I ein monoton wachsendes Netz in R, dh. i j ⇒ xi ≤ x j und ist
{xi : i ∈ I} nach oben beschränkt, so folgt (vgl. Satz 3.4.2)
lim xi = sup{xi : i ∈ I} .
i∈I
(5.10)
Entsprechende Aussagen gelten für monoton fallende Netze.
Zum Nachweis von (5.10) wollen wir hier den Beweis angeben, der fast wörtlich
der selbe, wie für Satz 3.4.2 ist.
Da (xi )i∈I nach oben beschränkt ist, existiert x := sup{xi : i ∈ I}. Wir zeigen,
dass limi∈I xi = x. Sei ǫ > 0. Wegen x − ǫ < x kann x − ǫ keine obere Schranke
der Menge {xi : i ∈ I} sein. Es gibt also ein i0 ∈ I mit xi0 > x − ǫ. Wegen der
Monotonie folgt auch xi > x − ǫ für alle i i0 . Da stets x ≥ xi gilt, erhält man
für i i0
0 ≤ x − xi < ǫ,
und damit |xi − x| < ǫ.
6. Sei (xi )i∈I ein Netz von Punkten xi = (xi,1 , . . . , xi,p ) ∈ R p , und y = (y1 , . . . , y p ) ∈
R p . Dann gilt limi∈I xi = y bezüglich einer der Metriken d1 , d2 oder d∞ genau
dann, wenn
lim xi,k = yk für alle k = 1, . . . , p .
(5.11)
i∈I
5.3.9 Bemerkung. Genauso wie für Folgen kann man definieren, was es heißt, dass ein
reellwertiges Netz (xi )i∈I gegen ±∞ konvergiert:
∀M > 0 ∃i0 ∈ I : ±xi > M für alle i i0 .
Offenbar schließt sich die Konvergenz von (xi )i∈I gegen +∞ und gegen −∞ gegenseitig aus. Genauso kann (xi )i∈I nicht gleichzeitig gegen ±∞ und gegen eine reelle Zahl
konvergieren.
Ist (xi )i∈I ein Netz in R und x ∈ R oder x = ±∞, so kann man x = limi∈I xi
einheitlich folgendermaßen schreiben:
(∀ξ ∈ R, ξ < x ∃i0 ∈ I : ∀i i0 ⇒ xi > ξ) ∧
(∀η ∈ R, η > x ∃i0 ∈ I : ∀i i0 ⇒ xi < η). (5.12)
Es gelten sinngemäß die Aussagen in Satz 3.7.3 auch für reellwertige Netze
(xi )i∈I , (yi )i∈I :
(i) Gilt yi ≥ K für alle i k mit festen K ∈ R, k ∈ I, so folgt aus limi∈I xi = +∞
auch limi∈I (xi + yi ) = +∞.
(ii) Gilt yi ≥ C für alle i k mit festen C > 0, k ∈ I, so folgt aus limi∈I xi = +∞ auch
limi∈I (xi · yi ) = +∞.
(iii) Ist xi ≤ yi für alle i k mit festem k ∈ I, so folgt aus limi∈I xi = +∞ auch
limi∈I yi = +∞.
(iv) limi∈I xi = +∞ ⇔ limi∈I (−xi ) = −∞.
(v) Gilt yi > 0 (yi < 0) für alle i k mit festem k ∈ I, so gilt limi∈I yi = +∞
(limi∈I yi = −∞) genau dann, wenn limi∈I y1i = 0.
114
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
(vi) Sei (yi )i∈I monoton wachsend (fallend). Ist (yi )i∈I nach oben (nach unten) beschränkt, so ist dieses Netz konvergent gegen eine reelle Zahl. Im anderen Fall
gilt limi∈I yi = +∞ (limi∈I yi = −∞).
In der Tat gibt es zu jedem M > 0 ein i0 ∈ I mit yi0 > M. Wegen der Monotonie
folgt auch yi ≥ yi0 > M für alle i i0 .
Schließlich wollen wir das Analogon zu Cauchy-Folge betrachten.
5.3.10 Definition. Sei hX, di ein metrischer Raum und (I, ) eine gerichtete Menge.
Dann heißt ein Netz (xi )i∈I in X Cauchy-Netz, wenn
∀ǫ > 0 ∃i0 ∈ I : d(xi , x j ) < ǫ ∀i, j i0 .
(5.13)
Die Bedingung (5.13) ist offenbar zu lim(i, j)∈I×I d(xi , x j ) = 0 äquivalent, wenn man
I × I wie in (5.4) zu einer gerichteten Menge macht.
Für Folgen ist (5.13) genau die Cauchy-Folgen Bedingung. Also liegt die Aussage
des nächsten Lemma nahe.
5.3.11 Lemma. In einem metrischen Raum ist jedes konvergente Netz auch ein
Cauchy-Netz.
In einem vollständigen metrischen Raum ist ein Netz genau dann konvergent, wenn
es ein Cauchy-Netz ist.
Beweis. Ist (xi )i∈I ein Netz, und konvergiert dieses gegen x ∈ X, so gibt es zu jedem
ǫ > 0 ein i0 ∈ I, sodass d(xi , x) < 2ǫ für i i0 . Wegen der Dreiecksungleichung folgt
d(xi , x j ) < ǫ für i, j i0 ; also (5.13).
Gilt umgekehrt (5.13) in einem vollständigen metrischen Raum, so definieren wir
induktiv eine Folge in ∈ I, n ∈ N, durch die Forderung, dass
1
, i, j in ,
n
indem wir zuerst i1 ∈ I so wählen, dass d(xi , x j ) < 1 für i, j i1 . Zu gegebenem in ∈ I
1
wähle dann gemäß (5.13) jn+1 ∈ I so, dass d(xi , x j ) < n+1
für i, j jn+1 . Nun sei
in+1 ∈ I gemäß (5.2) so gewählt, dass in+1 in , jn+1 .
Offensichtlich ist (xin )n∈N eine Cauchy-Folge und damit konvergent gegen ein x ∈
X. Ist n ≤ m, so folgt aus d(xim , xin ) < 1n durch Grenzübergang m → ∞ die Tatsache,
dass d(x, xin ) ≤ n1 , n ∈ N.
Ist nun ǫ > 0, so wähle n ∈ N, sodass n2 ≤ ǫ. Für i in folgt
in+1 in und d(xi , x j ) <
d(x, xi ) ≤ d(x, xin ) + d(xin , xi ) <
bzw. xi ∈ Uǫ (x), und somit konvergiert (xi )i∈I gegen x.
2
≤ ǫ,
n
❑
5.4 Unbedingte Konvergenz und Umordnen von Reihen
Ist M irgendeine Menge und ist jedem i ∈ M eine Zahl ai aus R oder C zugeordnet,
P
so eröffnet uns der Begriff des Netzes eine Möglichkeit Ausdrücken wie i∈M ai sogar
einen Sinn zu geben, wenn M nicht endlich und nicht abzählbar unendlich ist.
5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN
115
Ist M abzählbar unendlich, so könnten wir einfach eine Bijektion σ : N → M
P
P
hernehmen und i∈M ai einfach als ∞
n=1 aσ(n) definieren. Das hat aber den Schönheitsfehler, dass diese Definition von dem σ abhängt.
5.4.1 Beispiel. Sei M = N und a j =
alternierende harmonische Reihe
(−1) j+1
j
S :=
für j ∈ M. Ist σ = idN so erhalten wir die
∞
X
(−1)n+1
n=1
n
,
welche nach dem Leibnizkriterium, Korollar 3.9.7, konvergiert. Ordnen wir die Summanden in einer anderen Reihenfolge an, dh. betrachten wir die Bijektion σ : N → N
definiert durch σ(3k − 2) = 2k − 1, σ(3k − 1) = 4k − 2, σ(3k) = 4k für k ∈ N, so erhalten
wir
∞
X
(−1)σ(n)+1
n=1
σ(n)
1
1
1 1 1 1 1 1
1
1
1
− + −
− +... =
=1− − + − − + −
2 4 |
3 {z6} 8 |
5 {z10
7 {z14} 16
|{z}
} 12 |
= 12
= 61
1
= 14
1
= 10
S
1 1 1 1 1
1
1
1
1
1
1 1 1 1
− + − +
−
+
−
+... = 1− + − + − +... = .
2 4 6 8 10 12 14 16
2
2 3 4 5 6
2
Die Summe einer Reihe kann also von der Reihenfolge der Summanden abhängen.
Tatsächlich kann man eine konvergente aber nicht absolut konvergente Reihe stets so
umordnen, dass jede beliebige Summe einschließlich ±∞, oder gar eine divergente
Reihe, herauskommt, vgl. Satz 5.4.6.
Zu der nichtleeren Menge M sei E = E(M) die Menge aller endlichen Teilmengen
von M. Setzt man A B :⇔ A ⊆ B, so ist (E, ) eine gerichtete Menge, denn ⊆
ist Reflexivität und Transitivität sind klar. Sind A, B ∈ E, so folgt A ∪ B ∈ E und
A, B ⊆ A ∪ B. Also ist auch (5.2) erfüllt.
5.4.2 Definition. Sei M , ∅ und sei a j für jedes j ∈ M eine reelle bzw. komplexe
P
P
Zahl. Falls das Netz ( j∈A a j )A∈E in R bzw. C konvergiert, so sagen wir, dass j∈M a j
6
unbedingt konvergiert und setzen
X
X
aj .
a j = lim
j∈M
A∈E
j∈A
Ist s dieser Grenzwert, so bedeutet das also
X
∀ǫ > 0 ∃A0 ⊆ M, A0 endlich : ∀A ⊇ A0 , A endlich ⇒ a j − s < ǫ.
(5.14)
j∈A
Der Ausdruck “unbedingte Konvergenz rührt daher, dass es bei diesem Grenzwert”
begriff nicht darauf ankommt, in welcher Reihenfolge aufsummiert wird; siehe Fakta
5.4.3, 4.
5.4.3 Fakta.
6 Die
Summe über die leere Indexmenge sei dabei per definitionem Null.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
116
1. Man zeigt ganz einfach, dass für unbedingt konvergente Reihen Rechenregeln
gelten, die denen in Korollar 3.8.3 entsprechen, dh. (λ, µ, a j , b j ∈ R (C), j ∈ M)




X
X 
X 
(λa j + µb j ) = λ  a j  + µ  b j 
j∈M
j∈M
j∈M
in dem Sinn, dass die linke Seite unbedingt konvergiert, wenn die Summen rechts
es tun.
P
2. Das Netz ( j∈A |a j |)A∈E ist offenbar monoton wachsend. Gemäß (5.10) ist es also
genau denn konvergent, falls es beschränkt ist, dh.
X
|a j | ≤ C für alle A ∈ E
(5.15)
j∈A
mit einem festen C > 0. Dabei gilt
X
X
|a j | = sup
|a j |.
j∈M
A∈E j∈A
P
Falls (5.15) nicht gilt, so konvergiert ( j∈A |a j |)A∈E im Sinne von Bemerkung
P
5.3.9 gegen +∞. Wir schreiben j∈M |a j | = +∞ dafür.
P
Gilt
konvergiert
auch j∈M a j unbedingt, denn ist A0 ∈ E so groß, dass
P (5.15), so
P
j∈A |a j | − j∈B |an | < ǫ, wenn A0 ⊆ A, B ∈ E (vgl. Lemma 5.3.11), so gilt
auch7
X
X
X X
X
X X
a j −
a j = |a j | = aj −
a j ≤
|a j | −
|an | < ǫ .
j∈A
j∈B
j∈A△B
j∈A∪B
j∈A∩B
j∈A\B
j∈B\A P
Als Cauchy-Netz konvergiert somit ( j∈A a j )A∈E .
P
3. Ist P ⊆ M eine nichtleere Teilmenge und konvergiert j∈M a j unbedingt, so
P
P
tut es auch j∈P a j , denn aus der Konvergenz von ( j∈A a j )A∈E(M) folgt, dass
dieses Netz auch ein Cauchy-Netz ist. Ist nun ǫ > 0 und A0 ∈ E(M), sodass aus
A0 ⊆ A, B ∈ E(M) die Ungleichung
X
X a j −
a j < ǫ,
j∈A
j∈B
folgt, so folgt aus A0 ∩ P ⊆ C, D ∈ E(P) zunächst A0 ⊆ C ∪ A0 , B ∪ A0 ∈ E(M)
und damit
X
X X
X
X
X a j −
a j = a j +
aj −
aj −
a j =
j∈C
j∈D
j∈C
j∈D
j∈A0 \P
j∈A0 \P X
X
a j < ǫ.
aj −
j∈C∪A0
Also ist auch (
gent.
7A △
P
j∈A
j∈D∪A0
a j )A∈E(P) ein Cauchy-Netz und wegen Lemma 5.3.11 konver-
B = A \ B ∪ B \ A ist die symmetrische Mengendifferenz von A und B.
5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN
117
4. Ist M̃ eine weitere Menge – es kann auch M̃ = M sein – und σ : M̃ → M eine
P
P
Bijektion, so konvergiert j∈M a j genau dann unbedingt, wenn j∈ M̃ aσ( j) es tut.
Denn ist ǫ > 0 und A0 , sodass (5.14) gilt, und ist σ−1 (A0 ) ⊆ A ∈ E( M̃), so folgt
wegen A0 ⊆ σ(A) ∈ E(M)
X
X
X
aσ( j) − s = aσ( j) − s = ak − s < ǫ .
j∈A
σ( j)∈σ(A)
k∈σ(A)
P
Also gilt (5.14) für j∈ M̃ aσ( j) . Die Umkehrung ergibt sich durch dasselbe Argument angewendet auf σ−1 .
P
5. Im Falle M = N folgt aus der unbedingten Konvergenz von j∈N a j die KonverP∞
genz von n=1 an im Sinne von Definition 3.8.1 gegen den gleichen Grenzwert.
PN
P
Es ist nämlich ( n=1
a)
= ( j∈A(N) a j )N∈N mit A(N) := {1, . . . , N} eine TeilP n N∈N
folge des Netzes ( j∈A a j )A∈E(N) im Sinne von Definition 5.3.6, da es zu jedem
A ∈ E(N) ein N ∈ N gibt sodass
{1, . . . , n} ⊇ A für alle n ≥ N.
P
P
6. Angenommen ∞
C := ∞
n=1 an konvergiert absolut, dh.
n=1 |an | < +∞ konvergiert
P
im Sinne von Definition 3.8.1, so konvergiert j∈N |a j | auch unbedingt, denn für
jedes A ∈ E(N) gibt es ein N ∈ N mit A ⊆ {1, . . . , N}. Wegen
X
j∈A
ist das Netz (
P
j∈A
|a j | ≤
N
X
n=1
|an | ≤ C
|a j |)A∈E beschränkt.
Aus 2 folgt dann auch die unbedingte Konvergenz von
P
P
herigen Punkt gilt dabei j∈N a j = ∞
n=1 an .
P
j∈N
a j . Wegen dem vor-
Aus Fakta 5.4.3, 6 und 5 erkennen wir insbesondere, dass für M = N die KonverP
P
genz von ∞
j∈N |a j | ist. Nun
n=1 |an | äquivalent zu der unbedingten Konvergenz von
gilt sogar
5.4.4 Satz. Für reelle oder komplexe Koeffizienten a j , j ∈ M, sind folgende Aussagen
äquivalent.
P
j∈M |a j | konvergiert unbedingt.
P
j∈M a j konvergiert unbedingt.
P
Für M = N ist das zur absoluten Konvergenz von ∞
n=1 an äquivalent.
P
Beweis. Wegen Fakta 5.4.3, 2, folgt aus der unbedingten Konvergenz von j∈M |a j |
P
auch die von j∈M a j .
Für die Umkehrung seien die a j zunächst reell. Wir schreiben M als
M = { j ∈ M : a j ≥ 0} ∪˙ { j ∈ M : a j < 0}
{z
}
|
{z
} |
=:M+
=:M−
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
118
Wegen Fakta 5.4.3, 3 und 1, folgt aus der unbedingten Konvergenz von
P
P
die von C1 := j∈M+ a j und C2 := j∈M− (−a j ). Wegen
X
X
X
(−a j ) ≤ C1 + C2
aj +
|a j | =
j∈A
P
j∈M
a j auch
j∈A∩M−
j∈A∩M+
P
für jedes A ∈ E(M) folgt die unbedingte Konvergenz von j∈M |a j | aus Fakta 5.4.3, 2.
P
Sind die a j komplex, so folgt aus der unbedingten Konvergenz von j∈M a j mit
P
P
(5.11) auch die von j∈M Re a j und j∈M Im a j . Nach dem schon gezeigten konvergieP
P
ren dann j∈M | Re a j | und j∈M | Im a j | unbedingt, was wegen |a j | ≤ | Re a j | + | Im a j |
P
und Fakta 5.4.3, 2, auch die von j∈M |a j | nach sich zieht.
P
Die Äquivalenz zur absoluten Konvergenz von ∞
n=1 an haben wir schon oben
gesehen.
❑
Da für reell- bzw. komplexwertige Reihen absolute und unbedingte Konvergenz
dasselbe bedeuten, nennen wir Reihen, die konvergent, aber nicht absolut konvergent
sind, auch bedingt konvergent.
P
5.4.5 Korollar. Die Reihe ∞
absolut
k=1 bk mit reellen oder komplexen Summanden sei
P
konvergent. Dann ist für jede Bijektion σ : N → N auch die Umordnung ∞
k=1 bσ(k)
absolut konvergent und hat die gleiche Summe.
Beweis. Das folgt unmittelbar aus Satz 5.4.4 und Fakta 5.4.3, 4.
❑
Nun wollen wir Korollar 5.4.5 umkehren.
∞
P
5.4.6 Satz. Sei die Reihe
ak reeller Zahlen konvergent mit der Summe S , aber nicht
k=1
absolut konvergent. Dann gibt es zu jeder vorgegebenen Zahl S ′ ∈ R ∪ {±∞} eine
∞
∞
P
P
bk = S ′ . Weiters gibt es Umordnungen bk die
Umordnung (bk )k∈N , bk = aσ(k) , mit
k=1
k=1
divergieren – aber nicht bestimmt divergieren.
Beweis. Bezeichne mit a+k := max(ak , 0), a−k := min(ak , 0), d.h. die Folgen der positiven
bzw. negativen Terme ak . Wir überlegen zuerst, dass
∞
X
∞
X
a+k = +∞,
k=1
k=1
a−k = −∞
(5.16)
gelten muss. Zunächst sind die Partialsummen dieser Reihen monotone Folgen, haben
also einen Grenzwert in R ∪ {±∞}. Angenommen einer der beiden wäre endlich, z.B.
∞
P
a+k = S + < ∞. Dann folgt
k=1
N
X
a−k =
k=1
und somit
N
X
k=1
N
X
k=1
| ak |=
ak −
N
X
k=1
N
X
k=1
N→∞
a+k −→ S − := S − S + > −∞.
a+k −
N
X
k=1
im Widerspruch zur Voraussetzung, dass
N→∞
a−k −→ S + − S − < ∞,
∞
P
k=1
ak nicht absolut konvergiert.
5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN
119
P
′
Sei nun S ′ ∈ R gegeben. Wir konstruieren eine Umordnung ∞
k=1 bk , die gegen S
+ + +
+
konvergiert. Zuerst addiert man Summanden a1 , a2 , a3 , . . . , an1 , bis man das erste Mal
> S ′ ist, dann Summanden a−1 , a−2 , . . . , a−l1 bis die Gesamtsumme das erste mal wieder
< S ′ ist. Dann a+n1 +1 , a+n1 +2 , . . . , a+n2 bis man das erste Mal wieder > S ′ ist. So verfährt
man weiter. Wegen (5.16) ist das stets möglich.
∞
P
ak . Ist S n′ eine Partialsumme,
Man erhält in dieser Weise eine Umordnung von
k=1
so ist S n′ − S ′ beschränkt nach oben durch das letzte aufgetretene a+k und nach unten
durch das letzte aufgetretene a−k . Wegen lim ak = 0 gilt auch
k→∞
lim (S n′ − S ′ ) = 0.
n→∞
In analoger Weise verfährt man, wenn man eine Umordnung konstruieren möchte, die
bestimmt divergiert gegen +∞ oder −∞, oder nicht einmal bestimmt divergiert.
❑
5.4.7 Bemerkung. Obiger Beweis verwendet bei der Definition der Umordnung implizit den Rekursionssatz. Die Tatsache, dass die dadurch definierte Funktion bijektiv auf
N ist und dass sie das gewünschte leistet, bedarf eigentlich eines strengeren Beweises.
Für den interessierten Leser bringen wir anschließend einen wasserdichten Beweis.
Wir zeigen wie oben, dass (5.16) zutrifft. Nun sei
M1 := {n ∈ N : an ≥ 0}, M2 := {n ∈ N : an < 0}.
˙ 2 . Wäre M1 endlich, so hätten wir a+n = 0 für n > max(M1 ), was aber (5.16)
Offensichtlicherweise gilt N = M1 ∪M
widerspricht. Also ist M1 und mit einer ganz ähnlichen Argumentation auch M2 unendlich.
Nun sei Fn die Menge aller Funktionen f : {1, . . . , n} → N, die folgende beiden Bedingungen erfüllen:
(i) 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M1 ⇒ f (i) < f ( j) und 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M2 ⇒ f (i) < f ( j).
(ii) f (i) ∈ M1 ⇒ {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) und f (i) ∈ M2 ⇒ {1, . . . , f (i)} ∩ M2 ⊆ f ({1, . . . , i}).
Fn ist nicht leer, da - wie man sich leicht überzeugt - die Funktion f (1) = min(M1 ), f (2) = min(M1 \ { f (1)}), . . . , f (n) =
min(M1 \ { f (1), .S. . , f (n − 1)}) in dieser Menge liegt.
n∈N Fn (⊆ N × N) und definiere g : F → F folgendermaßen: Sei f ∈ F , also f ∈ Fn für ein n ∈ N. Falls
Pn Setze F =
′
j=1 a f ( j) < S , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass
g( f )(n + 1) = min(M1 \ f ({1, . . . , n})).
Diese Fortsetzung liegt tatsächlich in Fn+1 ⊆ F . Um das zu sehen, sei 1 ≤ i < j ≤ n + 1, sodass beide Zahlen g( f )(i), g( f )( j)
gleichzeitig entweder in M1 oder in M2 liegen. Ist j ≤ n, dann folgt f (i) = g( f )(i), f ( j) = g( f )( j) ∈ M1 (M2 ) und daher
g( f )(i) = f (i) < f ( j) = g( f )( j).
Falls j = n+1, dann ist g( f )(n+1) = min(M1 \ f ({1, . . . , n})) ∈ M1 . Wegen i ∈ {1, . . . , n} muss auch g( f )(i) = f (i) ∈ M1 .
Falls g( f )(n + 1) ≤ f (i), so wäre nach (ii), g( f )(n + 1) = f (k) für ein k ≤ i ≤ n, und damit g( f )(n + 1) = f (k) <
M1 \ f ({1, . . . , n}), was aber nicht sein kann. Also gilt g( f )(n + 1) > f (i) und g( f ) erfüllt (i).
Um (ii) zu zeigen, sei g( f )(i) ∈ M1 (M2 ) für ein i ∈ {1, . . . , n + 1}. Falls i ≤ n, so folgt
{1, . . . , g( f )(i)} ∩ M1 = {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) = g( f )({1, . . . , i}).
Dasselbe gilt für M2 . Sei nun i = n + 1. Dann ist g( f )(n + 1) ∈ M1 . Ist k ∈ M1 mit k < g( f )(n + 1), so muss k in f ({1, . . . , n})
sein, da wir sonst P
den Widerspruch g( f )(n + 1) = min(M1 \ f ({1, . . . , n})) ≤ k bekämen.
Ist dagegen nj=1 a f ( j) ≥ S ′ , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass g( f )(n + 1) = min(M2 \
f ({1, . . . , n})). Man zeigt genauso wie oben, dass auch in diesem Fall g( f ) ∈ Fn+1 ⊆ F .
Ist nun noch a ∈ F1 definiert durch a(1) = 1, so gibt es nach dem Rekursionssatz (Satz 2.3.3) eine Abbildung
φ : N → F , sodass φ(1) = a und φ(n + 1) = g(φ(n)). Wir setzen
σ=
[
φ(n).
n∈N
Durch vollständige Induktion zeigt man leicht, dass φ(n) ∈ Fn und dass φ(m) eine Fortsetzung von φ(n) für alle m, n ∈
N, m > n ist. Man sieht daher sofort, dass σ : N → N eine Funktion ist, wobei σ|{1,...,n} = φ(n).
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
120
Weiters ist σ injektiv, da für i < j ∈ N, unter der zusätzlichen Voraussetzung σ(i), σ( j) ∈ M1 (M2 ) nach (i) die Relation
σ(i) = φ(N)(i) < φ(N)( j) = σ( j) mit irgendeinem N ≥ i, j folgt. Ist σ(i) ∈ M1 ∧ σ( j) ∈ M2 bzw. σ(i) ∈ M2 ∧ σ( j) ∈ M1 , so
muss auch σ(i) , σ( j), da M1 ∩ M2 = ∅.
σ ist sogar surjektiv. Dazu sei k ∈ N. Wir nehmen an, dass k ∈ M1 . Wäre k < σ(N), so folgt aus σ( j) ∈ M1 wegen
σ( j) = φ( j)( j) und (ii), dass σ( j) < k. Also gilt {k, k + 1, . . . } ∩ σ(N) ⊆ M2 . Da σ injektiv ist, muss dieser Schnitt unendlich
viele Zahlen enthalten. Wegen (ii) ist mit m ∈ σ(N), m > k, auch {k, k + 1, . . . , m} ⊆ σ(N), und somit
{k, k + 1, . . . } = {k, k + 1, . . . } ∩ σ(N) ⊆ M2 .
Somit hätten wir den Widerspruch, dass M1 endlich ist. Entsprechend führt auch k ∈ M2 und k < σ(N) auf einen Widerspruch.
P
′
Nun gilt es noch zu zeigen, dass ∞
j=1 aσ( j) = S . Dazu sei ǫ > 0, und wähle k1 ∈ M1 (k2P∈ M2 ) so, dass |ak | < ǫ
für alle k ≥ k1 (k ≥ k2 ). Das ist möglich, da die Folge der Summanden der konvergenten Reihe ∞
j=1 a j ja eine Nullfolge
bildet. Sei N die kleinste Zahl in N, sodass σ(N) > k1 , σ(N) > k2 und sodass σ(N) ∈ M1 ∧ σ(N + 1) ∈ M2 oder σ(N) ∈
M2 ∧ σ(N + 1) ∈ M1 .
Für ein k ≥ N+1 sei m ∈ {N, . . . , k−1} die größte Zahl mit σ(m) ∈ M1 ∧σ(m+1) ∈ M2 oder σ(m) ∈ M2 ∧σ(m+1) ∈ M1 .
Im ersten Fall muss dann σ(m + 1), . . . , σ(k) ∈ M2 und im zweiten σ(m + 1), . . . , σ(k) ∈ M1 . Wegen g(σ|{1,...,l} ) = σ|{1,...,l+1}
muss im ersten Fall
m−1
m
k−1
m−1
X
X
X
X
aσ( j) + aσ(m) .
aσ( j) =
aσ( j) ≤
aσ( j) < S ′ ≤
m−1
X
aσ( j) + aσ(m) =
j=1
j=1
In jedem Fall gilt
m
X
j=1
j=1
j=1
j=1
und im zweiten
aσ( j) ≤
k−1
X
j=1
aσ( j) < S ′ ≤
m−1
X
aσ( j) .
j=1
k
X
aσ( j) − S ′ ≤ |aσ (k)| + |aσ(m) | < 2ǫ.
j=1
5.4.8 Bemerkung. Korollar 5.4.5 zusammen mit Satz 5.4.6 wird auch Riemannscher
Umordnungssatz genannt. Für komplexwertige Reihen gilt Satz 5.4.6 nicht.
Für den folgenden Satz schreiben wir unsere nichtleere Menge M als disjunkte
Vereinigung
[
˙
M=
Mi
i∈I
mit nichtleerer Indexmenge I und nichtleeren Mengen Mi , i ∈ I.
5.4.9 Proposition. Sind die a j , j ∈ M, reelle oder komplexe Zahl, und konvergiert
P
P
s := j∈M a j unbedingt, so konvergieren alle Ausdrücke si := j∈Mi a j , i ∈ I, unbeP P
P P
dingt genauso wie i∈I j∈Mi a j – dazu sagen wir kurz, dass i∈I j∈Mi a j unbedingt
konvergiert –, wobei
X
XX
aj =
aj .
(5.17)
j∈M
i∈I j∈Mi
P
Beweis. Wegen Fakta 5.4.3, 3, konvergieren alle Ausdrücke si = j∈Mi a j , i ∈ I,
unbedingt. Zu ǫ > 0 sei A0 ∈ E(M), sodass aus A0 ⊆ A ∈ E(M) die Ungleichung
X s −
a j < ǫ
j∈A
folgt. Dann ist K0 := {i ∈ I : Mi ∩ A0 , ∅} sicherlich auch endlich.
Für jedes endliche K ⊇ K0 bezeichne #K seine Mächtigkeit. Wähle nun für jedes
i ∈ K ein Bi ∈ E(Mi ), sodass
X ǫ
si −
, wenn Bi ⊆ B ∈ E(Mi ) .
a j <
#K
j∈B
5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN
121
Da man Bi sicherlich größer machen kann, ohne diese Bedingung zu verlieren, können
wir annehmen, dass auch Bi ⊇ Mi ∩ A0 .
S
S
Mit A := i∈K Bi ⊇ i∈K0 Mi ∩ A0 = A0 folgt
X X X X si −
s −
si ≤ s −
a j +
a j < 2ǫ .
i∈K
Also gilt s = limK∈E(I)
P
i∈K
i∈K
j∈A
j∈Bi
si .
P
P
❑
Im Allgemeinen kann man aber nicht von der Existenz von i∈I j∈Mi a j auf die
P
unbedingte Konvergenz von j∈M a j schließen; vgl. Beispiel 5.4.11. Es gilt jedoch
5.4.10 Lemma. Sind die a j , j ∈ M, reelle oder komplexe Zahl, und konvergieren alle
P
P P
Ausdrücke j∈Mi |a j |, i ∈ I, unbedingt genauso wie i∈I j∈Mi |a j | – dazu sagen wir
P P
P
kurz, dass i∈I j∈Mi |a j | unbedingt konvergiert –, so konvergiert auch j∈M |a j | unbeP P
P
P P
P
dingt . In dem Fall gilt i∈I j∈Mi |a j | = j∈M |a j | und i∈I j∈Mi a j = j∈M a j .
P
Beweis. Konvergieren alle Ausdrücke j∈Mi |a j |, i ∈ I, unbedingt genauso wie C :=
P P
i∈I
j∈Mi |a j |, so folgt für jedes A ∈ E(M) mit K = {i ∈ I : Mi ∩ A , ∅}
XX
X
X X
|a j | ≤ C.
|a j | ≤
|a j | =
j∈A
i∈K j∈Mi
i∈K j∈A∩Mi
Aus Fakta 5.4.3, 2, folgt somit die unbedingte Konvergenz von
Die behaupteten Gleichungen folgen aus Proposition 5.4.9.
P
j∈M
|a j |.
❑
Die beiden letzten Resultate lassen sich zum Beispiel auf so genannte Doppelreihen
anwenden. Dazu sei M = N×N, und sei zu jedem (m, n) ∈ N×N eine reelle (komplexe)
Zahl am,n gegeben.
P
Wegen Satz 5.4.4 sind die unbedingte Konvergenz von (m,n)∈N×N |am,n| und von
P
(m,n)∈N×N am,n äquivalent. Wegen Proposition 5.4.9 und Lemma 5.4.10 angewandt
Ṡ
auf die Zerlegung N × N = i∈N {i} × N ist das auch zur unbedingten Konvergenz
P P
von
|a | äquivalent. Wegen Fakta 5.4.3, 6, bedeutet letzteres genau, dass
P∞ i∈N j∈N i, j
|a
|
für
alle
i ∈ N konvergiert genauso wie
i,
j
j=1
∞ X
∞
X
i=1 j=1
|ai, j | < +∞.
(5.18)
Analoges gilt für die vertauschte Reihenfolge. Trifft eine dieser äquivalenten Bedingungen zu, so konvergieren folgende Ausdrücke unbedingt und es gilt
XX
X
XX
ai, j =
am,n =
ai, j .
(5.19)
i∈N j∈N
(m,n)∈N×N
Ṡ
j∈N j∈N
Zerlegt man schließlich N × N in N × N = d∈N≥2 {(k, l) ∈ N × N : k + l = d} – also in
die Diagonalen {(k, l) ∈ N × N : k + l = d} –, so erhalten wir aus Proposition 5.4.9, dass
auch folgender Ausdruck unbedingt konvergiert und (5.19) mit

 d−1
X X

 ak,d−k 
(5.20)
d∈N≥2
k=1
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
122
übereinstimmt. Dieser Ausdruck konvergiert sogar unbedingt, wenn man die Summanden durch ihre Beträge ersetzt.
P
Dass die unbedingte Konvergenz von (m,n)∈N×N am,n notwendig dafür ist, dass die
Ausdrücke ganz links und ganz rechts übereinstimmen, zeigt
5.4.11 Beispiel. Seien die Zahl ai, j der (i, j)-te Eintrag von
1
+
0
+
0
+
0
+
..
.
+ −1
+
+ 1
+
+ 0
+
+ 0
+
..
.
=
1
+
+
0
+
−1
+
1
+
0
+
..
.
+
+
+
=
0
+
+
+
+
0
+
0
+
−1
+
1
+
..
.
+
... =
0
+
... =
0
+
... =
0
+
... =
0
..
.
=
1\0
=
0
=
+ 0 + ... =
P P
P P
Dann gilt i∈N j∈N ai, j = 0 und j∈N i∈N ai, j = 1.
+
P
P∞
5.4.12 Korollar. Sind die beiden Reihen ∞
m=1 am und
n=1 bn absolut konvergent, so
konvergiert
X
am bn
(m,n)∈N×N
unbedingt, wobei
X
(m,n)∈N×N
 ∞
 i−1
 ∞ 
∞ X
X
 X  X



 ak bi−k  =  am  ·  bn  .
am bn =
m=1
k=1
i=2
n=1
Der mittlere Ausdruck konvergiert dabei auch absolut.
Beweis. Wegen8
∞ X
∞
X
m=1 n=1
|am bn | =
∞
X
m=1
|am | ·
|
∞
X
|bn | =
n=1
{z
}
∞
X
m=1
∞
X
|am | ·
|bn | < +∞
n=1
<+∞
P
folgt aus der Bedingung (5.18), dass S := (m,n)∈N×N am · bn unbedingt konvergent.
Nach (5.19) und Fakta 5.4.3, 1, gilt




X 
XX
X
X
X 





 lim
S =
ai · b j = lim
ai · b j  = lim
ai ·  lim
b j  =
A∈E(N)
B∈E(N)
A∈E(N)
B∈E(N)
i∈A
i∈N j∈N
j∈B
i∈A
j∈B
∞  
 ∞  ∞
 ∞ 
X
X  X
X  
 X  X



ai ·  bn  =  lim
lim
ai  ·  bn  =  am  ·  bn  .
A∈E(N)
A∈E(N)
i∈A
n=1
i∈A
n=1
m=1
n=1
8 Diese Gleichung ist am besten von rechts nach links zu lesen. In dieser Reihenfolge erkennt man am
besten, dass alle vorkommenden Reihen konvergieren.
5.5. GRENZWERTE VON FUNKTIONEN
123
P Pi−1
S = ∞
i=2
k=1 ak bi−k ergibt sich sofort aus (5.20), wenn man bedenkt, dass aus der
unbedingten auch die absolute Konvergenz folgt.
❑
5.4.13 Beispiel. Definiere eine Funktion exp : C → C durch
exp(z) :=
∞
X
zn
, z ∈ C.
n!
n=0
Zunächst müssen wir diese Definition rechtfertigen, also zeigen, dass diese Reihe konvergiert. Für jedes feste z ∈ C gilt
n+1 z
(n+1)!
z
lim zn = lim
= 0.
n→∞ n→∞ (n + 1)
n!
P zn
Nach dem Quotientenkriterium ist die Reihe ∞
n=0 n! für jedes feste z ∈ C absolut
konvergent.
Wir wollen für zwei Zahlen z, w ∈ C das Produkt exp(z) exp(w) ausrechnen. Dazu verwenden wir Summation längs der Diagonalen. Wir erhalten aus Korollar 5.4.12
unter Beachtung einer Indexverschiebung
exp(z) · exp(w) =
k
∞ X
X
k=0
j=0
zk− j w j .
(k − j)! j!
Nach dem Binomischen Lehrsatz gilt
k
X
j=0
1
zk− j w j
= (z + w)k ,
(k − j)! j!
k!
und wir erhalten
exp(z) exp(w) =
∞
X
1
(z + w)k = exp(z + w) .
k!
k=0
Die Funktion exp heißt auch die Eulersche9 Exponentialfunktion. Sie ist eine der wichtigsten Funktionen, die es in der Mathematik gibt. Wir werden sie zum Beispiel auch
dafür benützen um Funktionen wie sin z oder cos z zu definieren, vgl. den Abschnitt
über elementare Funktionen.
5.5 Grenzwerte von Funktionen
In diesem Abschnitt wollen wir vornehmlich Grenzwerte über gerichtete Mengen betrachten, die folgende Eigenschaft haben.
5.5.1 Definition. Wir sagen, dass eine gerichtete Menge (I, ) Teilfolgen gestattet,
wenn es eine abzählbare Teilmenge L von I gibt, sodass
∀i ∈ I ∃ j ∈ L : i j .
9 Leonhard
Euler. 15.4.1707 Basel - 18.9.1783 St.Petersburg
(5.21)
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
124
Es sei hier angemerkt, dass nicht alle gerichteten Mengen Teilfolgen gestatten.
Wie wir im folgenden Lemma 5.5.2 sehen werden, bedeutet die Eigenschaft gestattet
”
Teilfolgen“, dass man hinreichend viele Teilfolgen konstruieren kann, damit man von
der Konvergenz von Teilfolgen auf die Konvergenz eines gegebenen Netzes schließen
kann.
5.5.2 Lemma. Sei hX, di ein metrischer Raum, (I, ) eine gerichtete Menge und (xi )i∈I
ein Netz in X.
Gestattet (I, ) Teilfolgen, so gilt x = limi∈I xi genau dann, wenn limn→∞ xi(n) = x
für jede Teilfolge von (xi )i∈I .
Beweis. Falls x = limi∈I xi , so folgt aus Lemma 5.3.7, dass auch limn→∞ xi(n) = x für
alle Teilfolgen von (xi )i∈I .
Konvergiert umgekehrt (xi )i∈I nicht gegen x, so gibt es ein ǫ > 0, sodass
∀i ∈ I ∃k ∈ I, k i : d(xk , x) ≥ ǫ.
(5.22)
Daraus konstruieren wir eine Teilfolge, die nicht gegen x konvergiert. Dazu sei j : N →
L bijektiv, wobei L wie in Definition 5.5.1 ist.
Sei i1 ∈ I, i1 j(1) mit d(xi1 , x) ≥ ǫ; vgl. (5.22). Sind i1 · · · im ∈ I definiert, so
sei i ∈ I, i im , i j(m + 1). Gemäß (5.22) gibt es ein im+1 i, sodass d(xim+1 , x) ≥ ǫ.
Zu jedem i ∈ I gibt wegen (5.21) es ein m0 ∈ N, sodass j(m0 ) i. Wegen
im j(m), m ∈ N, folgt im im0 j(m0 ) i für alle m ≥ m0 . Also ist (xin )n∈N eine
Teilfolge, sodass d(xin , x) ≥ ǫ. Sie kann somit nicht gegen x konvergieren.
❑
Sei hX, dX i ein metrischer Raum, D ⊆ X, z ein Häufungspunkt von D und auf
D \ {z} definiert als
x y : ⇐⇒ dX (x, z) ≥ dX (y, z)
wie in Beispiel 5.3.2, (iii). (D \ {z}, ) ist dann eine gerichtete Menge. Weiters sei
f : D \ {z} → Y eine Funktion, wobei hY, dY i ein weiterer metrischer Raum ist.
5.5.3 Definition. Konvergiert das Netz ( f (t))t∈D\{z} , so schreiben wir für den Grenzwert
auch
lim f (t) := lim f (t),
(5.23)
t→z
t∈D\{z}
und nennen ihn Grenzwert der Funktion f für t → z.
5.5.4 Fakta.
1. Es gilt limt→z f (t) = y genau dann, wenn
∀ǫ > 0 ∃δ > 0 : ∀t ∈ D \ {z}, dX (t, z) < δ ⇒ dY ( f (t), y) < ǫ .
(5.24)
In der Tat gilt gemäß der Definition der Konvergenz eines Netzes limt∈D\{z} f (t) =
y genau dann, wenn
∀ǫ > 0 ∃t0 ∈ D\ {z} : ∀t ∈ D\ {z}, dX (t, z) ≤ dX (t0 , z) ⇒ dY ( f (t), y) < ǫ . (5.25)
Falls (5.25) zutrifft, so setze man zu einem ǫ > 0, δ = dX (t0 , z). Offenbar gilt
dann (5.24).
Gilt umgekehrt (5.24), und wählt man dem entsprechend zu ǫ > 0 ein passendes
δ > 0, so gibt es ein t0 ∈ D \ {z} ∩ Uδ (z), da z ja Häufungspunkt von D ist. Für
t t0 folgt dann dX (t, z) < δ und somit dY ( f (t), y) < ǫ.
5.5. GRENZWERTE VON FUNKTIONEN
125
2. Die gerichtete Menge (D \ {z}, ) gestattet Teilfolgen, denn setzt man
L = {tn : n ∈ N}
für irgendeine Folge (tn )n∈N aus D \ {z} mit tn → z für n → ∞ – nach Lemma
5.1.13 gibt es eine solche – so ist L abzählbar und zu gegebenem t ∈ D \ {z} gibt
es wegen dX (tn , z) → 0, n → ∞ ein n ∈ N mit dX (tn , z) ≤ dX (t, z) – also tn t.
Also hat L die Eigenschaft (5.21).
3. Für ein Netz (ti )i∈I aus D \ {z} gilt limi∈I ti = z genau dann, wenn ( f (ti ))i∈I ein
Teilnetz von ( f (t))t∈D\{z} ist.
Um das einzusehen, sei daran erinnert, dass gemäß Definition 5.3.6 ( f (ti ))i∈I
genau dann ein Teilnetz ist, wenn
∀t0 ∈ D \ {z} ∃i0 ∈ I : dX (ti , z) ≤ dX (t0 , z) für alle i i0 .
(5.26)
Setzt man limi∈I ti = z voraus, so gibt es zu t0 ∈ D \ {z} wegen ǫ := dX (t0 , z) > 0
ein i0 ∈ I mit dX (ti , z) < ǫ = dX (t0 , z) für alle i i0 , also insbesondere (5.26).
Gilt umgekehrt (5.26) und ist ǫ > 0, so gibt es – da z Häufungspunkt von D
ist – ein t0 ∈ D \ {z} mit dX (t0 , z) < ǫ und eben wegen (5.26) ein i0 ∈ I mit
dX (ti , z) ≤ dX (t0 , z) < ǫ für alle i i0 , also limi∈I ti = z.
4. Wegen Lemma 5.5.2 zusammen mit den vorherigen beiden Punkten gilt
lim f (t) = y ⇔ ∀(tn )n∈N aus D \ {z}, lim tn = z ⇒ lim f (tn ) = y . (5.27)
t→z
n→∞
n→∞
5. Aus (5.24) erkennt man unmittelbar, dass für ein C ⊆ D, das z ebenfalls als
Häufungspunkt hat, aus limt→z f (t) = y auch limt→z f |C\{z} (t) = y folgt. Dabei ist
letzterer Grenzwert als limt∈C\{z} f (t) zu verstehen, wobei für s, t ∈ C \ {z} auch
s t ⇔ dX (s, z) ≥ dX (t, z).
Aus limt→z f |C\{z} (t) = y folgt im allgemeinen aber nicht limt→z f (t) = y, vgl.
Beispiel 5.5.7.
6. Ist ρ > 0 beliebig, so gilt wegen dem vorherigen Punkt, dass aus limt→z f (t) = y
auch limt→z f |Uρ (z)∩D (t) = y folgt, da z ja auch ein Häufungspunkt von Uρ (z) ∩ D
ist.
Gelte umgekehrt limt→z f |Uρ (z)∩D\{z} (t) = y für ein ρ > 0. Zu ǫ > 0 gibt es also ein
δ > 0, sodass aus t ∈ Uρ (z) ∩ D \ {z}, dX (t, z) < δ immer dY ( f (t), y) < ǫ folgt. Aus
t ∈ D \ {z} mit dX (t, z) < min(δ, ρ) ergibt sich dann t ∈ Uρ (z) ∩ D \ {z}, dX (t, z) < δ
und damit dY ( f (t), y) < ǫ. Also gilt limt→z f (t) = y.
Alternativ kann man die Äquivalenz von limt→z f |Uρ (z)∩D (t) = y und limt→z f (t) =
y auch mit Hilfe von (5.6) herleiten, da beide Aussagen wegen
(D \ {z})s = KdX (s,z) (z) ∩ D \ {z} = (Uρ (z) ∩ D \ {z})s
für ein s ∈ Uρ (z) ∩ D \ {z} zu limt∈D\{z}s f (t) = y äquivalent sind.
5.5.5 Beispiel.
Ist X = Y = D ein beliebiger metrischer Raum, z ∈ X ein Häufungspunkt davon,
so gilt für f (t) = t sicher limt→z t = z, wie man z.B. aus (5.27) sofort erkennt.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
126
Wir wollen
lim
t→0
√
1 − t2
t2
1−
√
2
berechnen, wobei das als der Limes limt∈(−1,1)\{0} 1− t21−t mit der gerichteten
Menge ((−1, 1) \ {0}, ) gerichtet durch s t ⇔ |s| ≥ |t| zu verstehen ist.
√
√
Aus 1 − (1 − t2 ) = (1 − 1 − t2 )(1 + 1 − t2 ) folgt wegen der für Netze gültigen
Rechenregeln
lim
t→0
1−
√
1 − (1 − t2 )
1 − t2
=
lim
=
√
t→0 t2 (1 +
t2
1 − t2 )
1
1
=
.
√
√
2
1+ 1−t
1 + limt→0 1 − t2
p
Nun ist aber wegen der für Folgen gültigen Rechenregeln limn→∞ 1 − tn2 =
1 für √
jede gegen 0 konvergente Folge (tn )n∈N . Aus Fakta 5.5.4 folgt
limt→0 1 − t2 = 1, und der zu berechnende Grenzwert ist 21 .
lim
t→0
Betrachtet man
√
1− 1−t2
t2
als Funktion etwa auf (− 18 , 81 ) \ {0}, so wissen wir, dass
wegen Fakta 5.5.4, 6, ebenfalls
√
1− 1−t2
t2
→ 0 für t ∈ (− 81 , 81 ) \ {0}, t → 0.
Die Schreibweise – hier sei etwa D = (−1, 1) mit X = R und z = 0 – limt→0 f (t) = y
aus Definition 5.5.3 besagt, dass der Funktionswert f (t) beliebig nahe an y herankommt, wenn das Argument t nur hinreichend nahe an 0 ist. Oft ist man in der Situation,
dass diese Annäherung nur von einer Seite stattfindet.
5.5.6 Fakta.
1. Sei X = R und D = (a, b) für a, b ∈ R, a < b. Ist nun z = b und f eine Funktion,
die zumindest auf D definiert ist und Werte in einem metrischen Raum Y hat, so
schreibt man für limt∈D\{b} f (t) = y auch
lim f (t) = y .
t→b−
Man spricht von dem linksseitigen Grenzwert. .
Analog definiert man für D = (a, b) und z = a den rechtsseitigen Grenzwert
limt→a+ f (t) = y als limt∈D\{a} f (t) = y, wenn f eine Funktion auf D = (a, b) mit
Werten in einem metrischen Raum Y ist.
2. Sind a, b, c ∈ R, a < b < c, und ist f : (a, b) ∪ (b, c) → Y eine Funktion, so gilt
y = lim f (t) ⇔ y = lim f (t) und y = lim f (t) .
t→b
t→b−
t→b+
(5.28)
Dass aus y = limt→b f (t) sich die beiden anderen Grenzwerte ergeben, folgt
sofort aus Fakta 5.5.4, 5.
Gelten umgekehrt y = limt→b− f (t) und y = limt→b+ f (t), so gibt es zu einem
ǫ > 0 gemäß (5.24) Zahlen δ+ , δ− > 0, sodass aus t ∈ (b, c), |t − b| < δ+ oder
t ∈ (a, b), |t − b| < δ− immer dY ( f (t), y) < ǫ folgt. Mit δ := min(δ− , δ+ ) folgt aus
t ∈ (a, b) ∪ (b, c), |t − b| < δ die Ungleichung dY ( f (t), y) < ǫ; also y = limt→b f (t).
5.5. GRENZWERTE VON FUNKTIONEN
127
5.5.7 Beispiel.
Sei f : R → R definiert als f (t) = sgn(t). Dann gilt limt→0+ f (t) = 1, da f |(0,+∞) ≡
1, und limt→0− f (t) = −1, da f |(−∞,0) ≡ −1; vgl. Beispiel 5.3.4, (i). Wegen (5.28)
kann dann limt→0 f (t) gar nicht existieren.
Sei f : (0, +∞) → R definiert als f (t) = t2 [ 1t ]. Dabei bezeichnet für reelles x der
Ausdruck [x] die größte ganze Zahl, die kleiner oder gleich x ist. Diese wird als
Gaußklammer bezeichnet.
Wegen limt→0+ t = 0 (vgl. (5.9) und Beispiel 5.5.5) und mit Fakta 5.3.8, 2, folgt
aus 0 ≤ t2 [ 1t ] ≤ t für t > 0, dass limt→0+ f (t) = 0.
5.5.8 Definition. Ist f eine auf (a, +∞) definierte Funktion mit Werten in einem metrischen Raum Y, und versieht man (a, +∞) mit der Relation ≤, so erhält man ebenfalls
eine gerichtete Menge. Für den möglichen Grenzwert limt∈(a,+∞) f (t) schreibt man auch
limt→+∞ f (t).
Entsprechend definiert man Grenzwerte für t → −∞.
Die hier zugrunde liegende gerichtete Menge gestattet auch Teilfolgen, wobei
( f (tn ))n∈N genau dann eine solche ist, wenn tn → +∞ für n → ∞. Also gilt (5.27)
auch wenn z = +∞. Entsprechendes gilt für −∞.
5.5.9 Bemerkung. Sei f : (a, b) → Y eine Funktion, wobei a, b ∈ R ∪ {−∞, +∞}
mit a < b. Um limt→b− f (t) – im Sinne von Definition 5.5.8 im Fall b = +∞ und im
Sinne Definition 5.5.3 im Falle b ∈ R – zu bestimmen, ist es manchmal zweckmäßig
für eine gewisse bijektive, streng monotone Abbildung φ : (c, d) → (a, b) mit c, d ∈
R ∪ {−∞, +∞}, c < d, den Grenzwert
lim f ◦ φ(s) für monoton wachsendes φ
s→d−
bzw.
lim f ◦ φ(s) für monoton fallendes φ
s→c+
zu eruieren. Dieser Grenzwert stimmt dann mit dem ursprünglich gesuchten
limt→b− f (t) überein.
In der Tat kann man für monoton wachsendes φ das Netz ( f (t))t∈(a,b) als das Teilnetz
f ◦ φ(φ−1 (t)) t∈(a,b) des Netzes f ◦ φ(s) s∈(c,d) betrachten, da zu s0 ∈ (c, d) das Element
t0 := φ(s0 ) ja derart ist, dass wegen der Monotonie von φ−1 aus t t0 – hier bedeutet
das t ≥ t0 – immer φ−1 (t) ≥ φ−1 (t0 ) = s0 , daher φ−1 (t) s0 , folgt. Entsprechend
argumentiert man für monoton fallendes φ.
Ähnlich kann man vorgehen, wenn limt→a+ f (t) zu bestimmen ist.
5.5.10 Beispiel. Betrachte g : (0, +∞) → R definiert als g(t) = t12 [t]. Um limt→+∞ g(t)
zu berechnen, betrachte die monoton fallende Bijektion φ(s) = 1s von (0, +∞) auf sich
selbst. Aus Beispiel 5.5.7 ist bekannt, dass
" #
2 1
lim g ◦ φ(s) = lim s
=0.
s→0+
s→0+
s
Gemäß Bemerkung 5.5.9 gilt dann auch limt→+∞ g(t) = 0.
KAPITEL 5. GEOMETRIE METRISCHER RÄUME
128
Schließlich wollen wir auch noch definieren, was limz→∞ f (z) = y bedeutet, wenn
f : D → Y mit einem nicht beschränkten D ⊆ C und einem metrischen Raum Y. Dazu
versehen wir D mit der Richtung z w ⇔ |z| ≤ |w|, und setzen
lim f (z) := lim f (z) ,
z→∞
z∈D
falls dieser Grenzwert existiert. Manchmal schreibt man dafür auch lim|z|→+∞ f (z).
Die gerichtete Menge (D, ) gestattet ebenfalls Teilfolgen, wobei limz→∞ f (z) = y
genau dann, wenn f (zn ) → y für alle komplexen Folgen (zn )n∈N mit |zn | → +∞.
5.5.11 Beispiel. Man sieht leicht ein, dass limz→∞
Netze aus Fakta 5.3.8 folgt (a0 , . . . , an ∈ C)
1
z
= 0. Mit den Rechenregeln für
lim an + an−1 z−1 + . . . + a0 z−n = an .
z→∞
Für an , 0 folgt daraus (siehe Bemerkung 5.3.9)
lim |an zn + an−1 zn−1 + . . . + a0 | = lim |zn | · |an + an−1 z−1 + . . . + a0 z−n | = +∞ .
z→∞
z→∞
Kapitel 6
Reelle und komplexe
Funktionen
6.1 Stetigkeit
Sei f eine Funktion und sei x ein Punkt ihres Definitionsbereiches. Sagen wir dass diese Funktion stetig an der Stelle x ist, so verstehen wir darunter anschaulich, dass der
Funktionswert f (t) sich beliebig wenig von f (x) unterscheidet, wenn nur t hinreichend
nahe bei x ist. Wir sehen, dass man diesem Begriff Sinn geben kann, wenn man verlangt, dass Definitionsbereich und Wertebereich der betrachteten Funktion metrische
Räume sind.
6.1.1 Definition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei f :
D → Y eine Funktion. Weiters sei x ∈ D. Dann heißt f stetig an der Stelle x, wenn gilt
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ ,
oder äquivalent
∀ǫ > 0 ∃δ > 0 : f (UδX (x) ∩ D) ⊆ UǫY ( f (x)) ,
Ist f an jeder Stelle x ihres Definitionsbereiches D stetig, so heißt f stetig auf D. Die
Menge aller stetigen Funktionen von X nach Y wird mit C(X, Y) bezeichnet.
6.1.2 Beispiel.
Sei f : X → Y eine konstante Funktion, d.h. f (x) := y0 , x ∈ X. Dann ist f stetig,
denn ist x ∈ X und ǫ > 0, so wähle etwa δ = 1. Für alle t ∈ X mit dX (t, x) < δ gilt
sicher
dY ( f (t), f (x)) = dY (y0 , y0 ) = 0 < ǫ .
Die identische Abbildung, f (x) := idX (x) = x, x ∈ X, ist stetig. Um das einzusehen seien x ∈ X und ǫ > 0 gegeben. Mit δ = ǫ folgt für alle t ∈ X, dX (t, x) < δ,
dass
dX ( f (t), f (x)) = dX (t, x) < δ = ǫ .
Allgemeiner gilt, dass jede isometrische Abbildung 1 f : X → Y stetig ist, da zu
x ∈ X und ǫ > 0 mit δ = ǫ wieder für alle t ∈ X, dX (t, x) < δ
dY ( f (t), f (x)) = dX (t, x) < δ = ǫ .
1 Isometrisch
bedeutet dY ( f (x), f (y)) = dX (x, y).
129
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
130
f (x) + ǫ
f (x)
f (x) − ǫ
x−δ
x
x+δ
Abbildung 6.1: ǫ-δ Kriterium für f : I (⊆ R) → R
Die Einbettungsabbildungen ιyj : R → R p für j = 1, . . . , p und für y ∈ R p
definiert durch
ξ 7→ (0, . . . , ξ − y j , 0 . . . , 0) + y
|{z}
j−te Stelle
sind isometrisch und daher stetig, wenn man R und R p mit d2 versieht. Insbesondere sind die Abbildungen ι1 : R → C, x 7→ x + i0 und ι2 : R → C, y 7→ 0 + iy
stetig.
Die Abbildung z 7→ z̄ als Funktion auf C ist isometrisch und daher stetig.
Sei f : C → R die Funktion z 7→ |z|. Dann ist f stetig. Denn bei gegebenen
z ∈ C und ǫ > 0 wähle δ := ǫ. Für alle w ∈ C mit |w − z| < δ gilt wegen der
Dreiecksungleichung nach unten
| f (w) − f (z)| = |w| − |z| ≤ |w − z| < δ = ǫ .
p
Sei π j : R p → R, j = 1, . . . , p, die Funktion x = (xi )i=1
7→ x j . Diese ist
p
überall stetig, denn bei gegebenen (xi )i=1 ∈ R p und ǫ > 0 wähle δ = ǫ. Für alle
p
p
p
(ti )i=1
∈ R p mit d2 ((xi )i=1
, (ti )i=1
) < δ gilt
p
p
|x j − t j | ≤ d2 ((xi )i=1 , (ti )i=1 ) < ǫ.
Genauso zeigt man, dass auch die Abbildungen π j : C p → C, j = 1, . . . , p,
p
definiert durch z = (zi )i=1 7→ z j stetig sind, wobei C p und C mit d2 versehen sind;
vgl. Beispiel 3.1.5, (iii).
Sei f : R → R die Funktion f (x) := [x]. Dabei bezeichnet [x] wieder die
Gaußklammer. Diese Funktion ist stetig an jeder Stelle x ∈ R \ Z, und nicht
stetig an jeder Stelle x ∈ Z:
Ist x ∈ R \ Z, und ist ǫ > 0 gegeben, so wähle δ > 0, sodass das Intervall
(x − δ, x + δ) keine ganze Zahl enthält. Dann ist f auf (x − δ, x + δ) konstant, und
somit gilt
| f (t) − f (x)| = 0 < ǫ, falls |t − x| < δ .
Ist dagegen x ∈ Z, so enthält das Intervall (x − δ, x + δ) für jedes δ > 0 sowohl
Zahlen t, die größer als x sind, als auch Zahlen t, die kleiner als x sind. Nun ist
6.1. STETIGKEIT
131
aber für t− < x sicher f (t− ) < f (x) und – da ja beide Werte ganze Zahlen sind –
| f (t− ) − f (x)| ≥ 1. Wir können also für kein ǫ mit 0 < ǫ ≤ 1 ein δ finden, das der
geforderten Bedingung genügt.
6.1.3 Fakta. Seien hX, dX i und hY, dY i metrische Räume, x ∈ D ⊆ X, und sei f : D → Y
eine Funktion.
1. Unmittelbar aus der Definition der Stetigkeit folgt, dass die Stetigkeit bei x eine
lokale Eigenschaft ist, d.h. f ist bei x stetig genau dann, wenn es ein ρ > 0 gibt,
sodass f |Uρ (x)∩D stetig bei x ist.
2. Ist x ein isolierter Punkt von D, dann ist f immer stetig bei x. Ist nämlich δ > 0
so, dass Uδ (x)∩D = {x}, so folgt f (Uδ (x)∩D) = { f (x)} ⊆ Uǫ ( f (x)) für beliebiges
ǫ > 0.
3. Ist f : D → Y stetig auf D, so sicherlich auch f |C auf jeder Teilmenge C ⊆ D.
Also sind Einschränkungen stetiger Abbildungen wieder stetig.
Nun wollen wir die Stetigkeit an einer Stelle mit Hilfe verschiedener Grenzwertbegriffe charakterisieren.
6.1.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D →
Y eine Funktion. Ist x ∈ D ein fester Punkt, dann sind äquivalent:
(i) f ist stetig an der Stelle x.
(ii) Ist x kein isolierter Punkt, so gilt limt→x f (t) = f (x), wobei wir diesen Limes
verstehen als Limes des Netzes ( f (t))t∈D\{x} , wo D \ {x} mit der Relation
t u : ⇐⇒ dX (u, x) ≤ dX (t, x)
zu einer gerichteten Menge wird, vgl. Definition 5.5.3.
(iii) Für jede Folge (tn )n∈N aus D \ {x} mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x).
(iv) Für jede Folge (tn )n∈N aus D mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x).
(v) Für jedes Netz (ti )i∈I aus D mit limi∈I ti = x gilt limi∈I f (ti ) = f (x).
Beweis.
(i) ⇐⇒ (ii): Im Falle, dass x ein isolierter Punkt von D ist, wissen wir schon, dass f
bei x stetig ist.
Sei also x nicht isolierter Punkt von D. Die Stetigkeit von f an der Stelle x
bedeutet nach Definition
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ .
Die Beziehung limt→x f (t) = f (x) bedeutet gemäß Definition 5.5.3,
∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D \ {x} mit dX (t, x) < δ .
Also sind diese beiden Aussagen äquivalent.
(ii) ⇐⇒ (iii): Das haben wir schon in Fakta 5.5.4 gesehen.
(6.1)
132
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
(v) ⇒ (iv) ⇒ (iii): (iv) ist Spezialfall von (v) und genauso (iii) von (iv).
(i) ⇒ (v): Sei ǫ > 0, dann gibt es ein δ > 0 mit f (Uδ (x)) ⊆ Uǫ ( f (x)). Sei nun i0 ∈ I mit
xi ∈ Uδ (x), i i0 . Für diese i folgt f (xi ) ∈ Uǫ ( f (x)), und daraus die behauptete
Grenzwertbeziehung.
❑
Eine immer wieder verwendete Eigenschaft der Stetigkeit folgt unmittelbar aus
Proposition 6.1.4, (iv):
6.1.5 Korollar. Sind f, g : D → Y beide stetig und gilt f (x) = g(x) für alle x in einer
Teilmenge E ⊆ D, so gilt auch f (x) = g(x) für alle x ∈ c(E) ∩ D.
Insbesondere stimmen zwei stetige f und g auf D überein, wenn sie das nur auf
einer dichten Teilmenge E von D tun.
Beweis. Zu x ∈ D ∩ c(E) gibt es eine Folge (xn )n∈N in E ⊆ D, sodass xn → x. Wegen
f (xn ) = g(xn ) und aus der Stetigkeit beider Funktionen folgt
f (x) = lim f (xn ) = lim g(xn ) = g(x).
n→∞
n→∞
❑
Viele stetige Funktionen lassen sich mit Hilfe des nächsten Lemmas als solche
identifizieren.
6.1.6 Lemma. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, E ⊆ Y und f :
D → Y und g : E → Z mit f (D) ⊆ E. Ist f bei x ∈ D und g bei f (x) stetig ist, so ist
g ◦ f : D → Z bei x stetig.
Beweis. Zu ǫ > 0 gibt es wegen der Stetigkeit von g ein δ′ > 0, sodass g(Uδ′ ( f (x)) ∩
E) ⊆ Uǫ (g( f (x))), und wegen der Stetigkeit von f ein δ > 0, sodass f (Uδ (x) ∩ D) ⊆
Uδ′ ( f (x)). Setzt man das zusammen und beachtet, dass auch f (Uδ (x) ∩ D) ⊆ f (D) ⊆ E,
so erhält man
(g ◦ f )(Uδ (x) ∩ D) ⊆ g(Uδ′ ( f (x)) ∩ E) ⊆ Uǫ (g( f (x))).
❑
6.1.7 Beispiel. Aus unseren Rechenregeln für Folgen (Satz 3.3.5) folgern wir mit Hilfe
der Folgencharakterisierung der Stetigkeit (Proposition 6.1.4, (iv)), dass die algebraischen Operationen
(
(
R2 → R
R → R
+:
−:
(x, y) 7→ x + y
x 7→ −x
(
(
R \ {0} → R \ {0}
R2 → R
·:
.−1 :
(x, y) 7→ x · y
x 7→ 1x
stetig sind. Genauso sind die algebraischen Operationen auf C stetig. Hier sind
R, R2 , C, C2 alle mit der euklidischen Metrik d2 versehen, wobei C und C2 als metrischer Raum mit R2 bzw. R4 indentifiziert wird; vgl Beispiel 3.1.5, (iii). 2 .
2 Diese
Feststellung gilt für den reellen Fall auch, wenn man d1 oder d∞ hernimmt; vgl. Proposition 3.6.1.
6.1. STETIGKEIT
133
6.1.8 Korollar. Sei hX, di ein metrischer Raum, x ∈ D ⊆ X, λ ∈ R, und seien f, g :
D → R Funktionen.
Dann ist die Abbildung t 7→ ( f (t), g(t)) von D nach R2 genau dann bei x stetig,
wenn f und g es sind.
Sind f und g stetig bei x, so auch die Abbildungen
von D nach R.
t 7→ λ · f (t), t 7→ f (t) + g(t), t 7→ f (t)g(t)
Ist f stetig bei x und gilt f (t) , 0, t ∈ D, so ist auch t 7→
x stetig.
1
f (t)
von D nach R bei
Die selben Aussagen sind wahr, wenn wir R durch C ersetzen.
Beweis. Für eine beliebige Folge (xn )n∈N aus D mit limn→∞ xn = x gilt gemäß Proposition 3.6.1, dass limn→∞ f (xn ) = f (x) gemeinsam mit limn→∞ g(xn ) = g(x) genau dann,
wenn limn→∞ ( f (xn ), g(xn)) = ( f (x), g(x)). Wegen Proposition 6.1.4, (iv), folgt daher
die erste Behauptung.
Für bei x stetige f und g sind t 7→ f (t)+g(t), t 7→ f (t)·g(t) und t 7→ f 1(t) Zusammensetzungen von einer bei x stetigen und einer überall stetigen Funktion. Zum Beispiel
ist t 7→ f (t)g(t) die Zusammensetzung von t 7→ ( f (t), g(t)) und (u, v) 7→ uv; siehe
Beispiel 6.1.7. Für g(t) = λ ist das konstante g stetig. Also ist auch t 7→ λ· f (t) stetig.
❑
6.1.9 Bemerkung. Mit fast identer Argumentation sieht man, dass für Abbildungen
f1 , . . . , f p : D → R mit x ∈ D ⊆ X für einen metrischen Raum X genau dann alle diese
Abbildungen stetig in x sind, wenn die Abbildung t 7→ ( f1 (t), . . . , f p (t)) von D nach R p
stetig in x ist.
Diese Feststellung können wir auch so formulieren, dass eine Abbildung φ : D →
R p genau dann stetig ist, wenn alle Abbildungen π j ◦ φ : D → R für j = 1, . . . , p stetig
sind.
Entsprechendes gilt für Abbildungen f1 , . . . , f p : D → C.
6.1.10 Beispiel.
Weil x 7→ x als Abbildung von R nach R stetig ist, folgt mit Korollar 6.1.8
nacheinander auch die Stetigkeit der Abbildungen x 7→ x · x, x 7→ x · x · x usw. .
Also sind die Abbildungen x 7→ xm von R nach R für jedes m ∈ N stetig genauso
wie die konstante Abbildung x 7→ x0 := 1.
Wieder mit einigen Anwendungen von Korollar 6.1.8 folgt, dass für jedes Polynom p mit reellen Koeffizienten an , . . . , a0 ∈ R die Abbildung
x 7→ p(x) = an xn + · · · + a0 , R → R .
Für zwei Polynomen p und q mit reellen Koeffizienten betrachten wir die ratiop(x)
nale Funktion f : D → R definiert durch f (x) = q(x)
mit D = {x ∈ R : q(x) , 0}.
Wegen Fakta 6.1.3, 3, sind p|D und q|D stetig und wegen Korollar 6.1.8 auch 3 f .
3 Wem diese Tatsache trivial vorkommt, der versuche zu Fuß“, d.h. durch explizite Angabe einer Zahl δ
”
3
zu vorgegebenen ǫ und x, zu überprüfen, dass etwa die Funktion f (x) = x x+x+1
2 +1 auf ihrem Definitionsbereich
R stetig ist.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
134
Für ein Polynom p mit komplexen Koeffizienten an , . . . , a0 ∈ C können wir auch
die Abbildung z 7→ an zn +· · ·+a0 = p(z) als Abbildung von C nach C betrachten.
Man zeigt wie im vorherigen Beispiel, dass auch diese Abbildung stetig ist.
Für zwei Polynomen p und q mit komplexen Koeffizienten ist auch die rationale
p(z)
mit D = {z ∈ C : q(z) , 0}
Funktion f : D → C definiert durch f (z) = q(z)
stetig.
Für zwei Polynome p und q mit komplexen Koeffizienten sind auch die Funktiop(x)
nen x 7→ p(x) und x 7→ q(x) als Abbildungen von R nach C sowie x 7→ q(x)
als
Abbildungen von {x ∈ R : q(x) , 0} von R nach C stetig, denn sie lassen sich
schreiben als Zusammensetzung der stetigen Abbildung ι1 : x 7→ x + i0 und der
entsprechenden Funktion aus dem letzten Punkt.
Da für ein lineares Funktional f : R p → R der Ausdruck f (x) als Linearkombination der Einträge von x ∈ R p geschrieben werden kann, folgt leicht mit Hilfe
von Proposition 6.1.4, (iv), dass ein jedes solches f stetig ist.
Daraus und mit Hilfe von Bemerkung 6.1.9 sieht man allgemeiner, dass auch
alle linearen Abbildungen A : R p → Rq stetig sind. Entsprechendes gilt für
C-linearen Abbildungen A : C p → Cq .
Aus dem letzten Beispiel oder direkt mit Hilfe von Proposition 6.1.4, (iv), zusammen mit Bemerkung 6.1.9 erkennt man auch, dass (x, y) 7→ x + y als Abbildung
von R2p R p × R p nach R p sowie (λ, x) 7→ λx als Abbildung von R p+1 R × R p
nach R p stetig sind. Entsprechendes gilt im komplexen Fall.
6.1.11 Beispiel. Ist D ⊆ R p , Y ein metrischer Raum und f : D → Y stetig, so folgt aus
Beispiel 6.1.2, Fakta 6.1.3, 3 und Lemma 6.1.6 für alle j = 1, . . . , p und alle y ∈ R p die
Stetigkeit von f ◦ ιyj : {t ∈ R : ιyj (t) ∈ D} → Y.
Umgekehrt kann man aber nicht von der Stetigkeit aller f ◦ ιyj auf die von f schließen, wie die Funktion f : R2 → R definiert durch
 ξη

, (ξ, η) , (0, 0)


 ξ2 +η2
f (ξ, η) := 


0
, (ξ, η) = (0, 0)
zeigt. Diese Funktion ist bei (0, 0) nicht stetig, da etwa f ( 1n , 1n ) =
1
2
für alle n ∈ N.
Die folgende mengentheoretisch orientierte Charakterisierung der Stetigkeit einer
Funktion spielt eine wichtige Rolle. Man beachten, dass dabei für die Funktion f der
Definitionsbereich gleich dem ganzen metrischen Raum X ist.
6.1.12 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : X → Y
eine Funktion. Dann sind äquivalent:
(i) f ist stetig.
(ii) Für jede in hY, dY i offene Teilmenge B von Y ist f −1 (B) = {x ∈ X : f (x) ∈ B}
offen in hX, dX i.
(iii) Für jede in hY, dY i abgeschlossene Teilmenge F von Y ist das Urbild f −1 (F) =
{x ∈ X : f (x) ∈ F} abgeschlossen in hX, dX i.
6.1. STETIGKEIT
135
Beweis.
(i) ⇒ (ii): Sei B ⊆ Y offen, und sei x ∈ f −1 (B). Da B offen ist und f (x) ∈ B, folgt
Uǫ ( f (x)) ⊆ B für ein ǫ > 0. Wegen der Stetigkeit existiert δ > 0 mit f (Uδ (x)) ⊆
Uǫ ( f (x)) ⊆ B, d.h. mit Uδ (x) ⊆ f −1 (B). Also enthält f −1 (B) mit jedem Punkt
eine ganze δ-Kugel, d.h. f −1 (B) ist offen.
(ii) ⇒ (i): Sei ǫ > 0 und x ∈ X gegeben. Die Menge Uǫ ( f (x)) ist offen, also ist
auch f −1 (Uǫ ( f (x))) offen. Wegen x ∈ f −1 (Uǫ ( f (x))) existiert ein δ > 0, sodass
Uδ (x) ⊆ f −1 (Uǫ ( f (x))). Das heißt aber gerade f (Uδ (x)) ⊆ Uǫ ( f (x)).
(ii) ⇔ (iii): Das folgt sofort aus Proposition 5.1.15 und der Tatsache, dass f −1 (M c ) =
f −1 (M)c .
❑
6.1.13 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y
eine stetige Funktion. Ist K ⊆ D kompakt, so ist auch f (K) ⊆ Y kompakt und damit
auch beschränkt.
Beweis. Sei (yn )n∈N eine Teilfolge in f (K), und sei xn ∈ K, sodass f (xn ) = yn . Wegen
der Kompaktheit von K gibt es eine gegen ein x ∈ K konvergente Teilfolge (xn(k) )k∈N
von (xn )n∈N . Aus der Stetigkeit folgt
f (x) = lim f (xn(k) ) = lim yn(k) .
k→∞
k→∞
Also hat (yn )n∈N eine konvergente Teilfolge mit Grenzwert aus f (K). Also ist f (K)
kompakt und wegen Proposition 5.2.8.
❑
6.1.14 Korollar. Sei hX, dX i ein metrischer Raum, D ⊆ X, f : D → R stetig, und
sei K ⊆ D kompakt. Dann ist f auf K beschränkt und nimmt ein Maximum und ein
Minimum an, d.h. es gibt Punkte xmax , xmin ∈ K mit
f (xmax ) = max f (x), f (xmin ) = min f (x) .
x∈K
x∈K
Insbesondere nimmt jede auf einem reellen Intervall [a, b] definierte und stetige reellwertige Funktion ein Maximum und ein Minimum an.
Beweis. Nach Proposition 6.1.13 ist f (K) ⊆ R kompakt, und wegen Proposition 5.2.8 damit beschränkt und abgeschlossen. Wegen Beispiel 5.1.14 ist
sup f (K) = max f (K) = f (xmax ) für ein xmax ∈ K. Entsprechend zeigt man die
Aussage für das Minimum.
❑
6.1.15 Proposition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X kompakt.
Ist f : D → Y stetig und injektiv, so ist es auch f −1 : ran( f ) → D ⊆ X.
Beweis. Sei (yn )n∈N eine Folge in ran f mit yn → y, und setze xn = f −1 (yn ), n ∈
N. Wegen der Kompaktheit von D hat jede beliebige Teilfolge (xn(m) )m∈N von (xn )n∈N
seinerseits eine Teilfolge (xn(m(l)) )l∈N mit xn(m(l)) → x, l → ∞ für ein x in D.
Aus der Stetigkeit folgt yn(m(l)) = f (xn(m(l)) ) → f (x) für l → ∞. Da (yn(m(l)) )l∈N als
Teilfolge auch gegen y konvergiert, folgt f (x) = y und mit der Injektivität x = f −1 (y).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
136
Gemäß Lemma 5.2.11 konvergiert daher ( f −1 (yn ))n∈N gegen f −1 (y). Also ist f −1 in y
stetig.
❑
6.1.16 Beispiel. Sei n ∈ N. Für ein festes c > 0 sei f : [0, c] → R definiert durch die
Vorschrift f (t) = tn . Wegen Beispiel 6.1.10 und Fakta 6.1.3, 3, ist f stetig. Zudem gilt
f ([0, c]) = [0, cn ], vgl. Bemerkung 2.7.7.
√
Die Umkehrfunktion f −1 : [0, cn ] → [0, c] ⊆ R, t 7→ n t, ist gemäß Proposition
6.1.15 stetig. Wegen cn → +∞ für c → +∞ und da die Stetigkeit wegen Fakta 6.1.3, 1,
√
eine lokale Eigenschaft ist, folgt sogar die Stetigkeit von n . : [0, +∞) → R.
Die Stetigkeit der Wurzelfunktion kann man auch mit Hilfe von Satz 3.3.5, (vii),
leicht zeigen.
6.2 Der Zwischenwertsatz
Sei I ⊆ R ein Intervall. Die Anschauung von Stetigkeit legt nahe, dass mit I auch f (I)
ein Intervall ist.
6.2.1 Bemerkung. Man überlegt sich leicht, dass I ⊆ R genau dann ein Intervall ist,
d.h. genau dann eine der Formen (a, b ∈ R, a < b,)
∅, (a, b), [a, b], [a, a], (a, b], [a, b), (a, +∞), (−∞, a), [a, +∞), (−∞, a], R,
hat, wenn für I gilt
∀x, y ∈ I, x < y ⇒ [x, y] ⊆ I.
Um zu rechtfertigen, dass f (I) wieder ein Intervall ist, werden wir eine weitere
charakteristische Eigenschaft von Intervallen herleiten.
6.2.2 Definition. Dazu nennen wir eine Teilmenge E eines metrischen Raumes zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen
schreiben kann. Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅.
6.2.3 Proposition. Sei I ⊆ R. Dann ist I genau dann ein Intervall, wenn I zusammenhängend ist.
Beweis. Im Falle, dass I nur ein oder gar kein Element enthält – also I = {x} oder
I = ∅ –, erkennt man sofort mit Bemerkung 6.2.1 und Definition 6.2.2, dass I ein
Intervall und I auch zusammenhängend ist. Wir können also für den Rest des Beweises
annehmen, dass I zumindest zwei verschiedene Elemente enthält.
Angenommen es existieren x, y ∈ I, x < y, sodass [x, y] * I. Wähle z ∈ [x, y] \ I
und setze
A := (−∞, z] ∩ I, B := [z, +∞) ∩ I.
Dann sind A und B disjunkt, und jeder Häufungspunkt t von A ist in (−∞, z], da diese
Menge ja abgeschlossen ist. Wegen z < I folgt t < B und damit c(A) ∩ B = ∅. Genauso
sieht man A ∩ c(B) = ∅. Also ist I nicht zusammenhängend.
Sei umgekehrt I nicht zusammenhängend. Dann können wir I als A ∪ B mit nichtleeren A, B schreiben, wobei c(A) ∩ B = A ∩ c(B) = ∅. Wähle x ∈ A und y ∈ B, und sei
o.B.d.A. angenommen, dass x < y.
Man betrachte t = sup(A ∩ [x, y]). Insbesondere ist x ≤ t ≤ y. Weiters folgt aus
t ∈ c(A ∩ [x, y]) ⊆ c(A) (siehe Beispiel 3.3.4), dass t < B, und somit x ≤ t < y.
6.2. DER ZWISCHENWERTSATZ
137
Wir wollen nun [x, y] * I zeigen, was im Fall t < A, sofort aus t ∈ [x, y] \ (A ∪ B) =
[x, y] \ I folgt.
Im Fall t ∈ A, folgt aus t < c(B) die Existenz einer ǫ-Kugel (t − ǫ, t + ǫ), sodass
(t − ǫ, t + ǫ) ∩ B = ∅ .
Also ist t + 2ǫ < B, und weil y ∈ B, gilt x < t + 2ǫ < t + ǫ ≤ y bzw. t + 2ǫ ∈ (x, y). Wegen
t = sup(A∩[x, y]) kann t+ 2ǫ aber nicht in A liegen. Also t+ 2ǫ ∈ [x, y]\(A∪ B) = [x, y]\ I
und daher [x, y] * I.
❑
6.2.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D →
Y eine stetige Funktion. Ist E ⊆ D zusammenhängend, so auch f (E).
Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A∪B mit
A, B , ∅ und c(A)∩B = A∩c(B) = ∅. Für die nichtleeren Mengen E∩ f −1 (A), E∩ f −1 (B)
folgt
E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅.
Zu jedem x ∈ c E ∩ f −1 (A) ∩ E ∩ f −1 (B) gibt es wegen Lemma 5.1.13 eine gegen
x konvergente Folge (xn )n∈N aus E ∩ f −1 (A). Es folgt limn→∞ f (xn ) = f (x), und somit
f (x) ∈ c f (E ∩ f −1 (A)) ⊆ c(A). Andererseits ist f (x) ∈ f E ∩ f −1 (B) ⊆ B im
Widerspruch zu c(A) ∩ B = ∅.
Also kann nur c E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅. Entsprechend gilt
c E ∩ f −1 (B) ∩ E ∩ f −1 (A) = ∅, und E wäre somit nicht zusammenhängend,
was unserer Annahme widerspricht.
❑
6.2.5 Beispiel. Wir werden später sehen, dass die Einheitskreislinie T = {z ∈ C :
|z| = 1} als das Bild von [0, 2π) unter der stetigen Abbildung x 7→ exp(ix) geschrieben
werden kann. Nach Proposition 6.2.4 identifizieren wir damit T als zusammenhängend.
6.2.6 Korollar (Zwischenwertsatz). Sei I ⊆ D ein Intervall und f : I → R stetig. Dann
ist auch f (I) ein Intervall. Ist insbesondere c ∈ R mit
(−∞ ≤) inf f (I) < c < sup f (I) (≤ +∞),
so existiert ein Punkt x ∈ I mit f (x) = c.
Insbesondere gilt: Ist f stetig auf [a, b] und c eine Zahl zwischen f (a) und f (b), dh.
f (a) < c < f (b) oder f (b) < c < f (a), so existiert ein Punkt x ∈ (a, b) mit f (x) = c.
Beweis. Mit I ist nach Proposition 6.2.4 auch f (I) ⊆ R zusammenhängend,
und somit nach Proposition 6.2.3 ein Intervall. Wählt man α, β ∈ f (I) mit
inf x∈I f (x) < α < c < β < supx∈I f (x), dann enthält f (I) das ganze Intervall
[α, β] (siehe Bemerkung 6.2.1). Also gibt es ein x ∈ I mit f (x) = c.
❑
6.2.7 Beispiel. Die Funktion f : [0, +∞) → R definiert durch f (t) = tn für ein festes
n ∈ N ist stetig. In Bemerkung 2.7.7 hatten wir in Folge der Existenz von n-ten Wurzeln
– vgl. Satz 2.7.5 – schon festgestellt, dass f ([0, +∞)) = [0, +∞).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
138
sup f (I)
f (I)
f (x) = c
inf f (I)
x
I
Abbildung 6.2: Veranschaulichung des Zwischenwertsatzes
Ohne Satz 2.7.5 zu verwenden, können wir das auch aus Korollar 6.2.6 herleiten.
In der Tat folgt aus Korollar 6.2.6, dass f ([0, +∞)) ein Intervall ist. Wegen f (t) ≥ 0
für t ∈ [0, +∞) folgt f ([0, +∞)) ⊆ [0, +∞). Aus limt→∞ f (t) = +∞ schließen wir, dass
das Intervall f ([0, +∞)) beliebig große Zahlen enthält, also nicht beschränkt sein kann.
Zusammen mit f (0) = 0 folgt daraus, dass f ([0, +∞)) nur von der Form [0, +∞) sein
kann.
Da f streng monoton wachsend und somit f : [0, +∞) → [0, +∞) bijektiv ist, folgt
somit auch ohne Satz 2.7.5, dass tn = x für jedes reelle x ≥ 0 eine eindeutige Lösung
in [0, +∞) hat – also dass es eindeutige n-te Wurzeln von Zahl aus [0, +∞) in [0, +∞)
gibt.
6.3 Gleichmäßige Stetigkeit
Die Definition der Stetigkeit einer Funktion f : D → Y lautet, in logischen Formeln
angeschrieben,
∀x ∈ D ∀ǫ > 0 ∃δ > 0 : ∀t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ .
(6.2)
Die Zahl δ, die es zu jedem ǫ geben muss, hängt im Allgemeinen nicht nur von ǫ,
sondern auch von der Stelle x ab.
6.3.1 Beispiel. Betrachte die Funktion f (x) = x−1 : R+ → R+ . Ist x ∈ R und ǫ > 0
gegeben, so berechnet man:
1
1
δ
−
=
.
x x + δ (x + δ)x
2
ǫx
Damit dieser Ausdruck ≤ ǫ ist, darf δ höchstens 1−ǫ
x sein. Man sieht, dass diese größt
mögliche Wahl von δ immer kleiner wird, je kleiner x wird, und tatsächlich für x → 0
ebenfalls gegen 0 strebt. Man kann in diesem Beispiel also tatsächlich zu gegebenem ǫ
kein δ finden das von x unabhängig ist.
6.3. GLEICHMÄSSIGE STETIGKEIT
139
Sollte eine Funktion nun so beschaffen sein, dass dieses Phänomen nicht auftritt,
sollte also zu gegebenem ǫ stets ein δ existieren, welches für alle x funktioniert, so
nennt man die Funktion gleichmäßig stetig.
6.3.2 Definition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y eine
Funktion. Dann heißt f gleichmäßig stetig, wenn gilt
∀ǫ > 0 ∃δ > 0 ∀x, t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ .
Vergleicht man diese Definition mit der Formel (6.2), so sieht man, dass man hier
den Allquantor ∀x ∈ X und den Existenzquantor ∃δ > 0 vertauscht hat. Dies wird also
nicht den gleichen, sondern einen stärkeren Begriff liefern.
Ist f gleichmäßig stetig, so ist f auch stetig. Wie wir am obigen Beispiel sehen, gilt
die Umkehrung nicht. Interessant in diesem Zusammenhang ist nun der folgende Satz.
6.3.3 Satz. Seien hX, dX i und hY, dY i metrische Räume, und D ⊆ X kompakt. Dann ist
jede stetige Funktion f : D → Y sogar gleichmäßig stetig.
Beweis. Nehme man das Gegenteil an. Dann gibt es ein ǫ > 0, sodass es für alle n ∈ N
Punkte xn , yn ∈ D gibt, sodass dX (xn , yn ) < 1n und dY ( f (xn ), f (yn )) ≥ ǫ.
Die Folgen (xn )n∈N (yn )n∈N haben wegen der Kompaktheit von D Häufungspunkte
x bzw. y. Somit gilt
x = lim xn(k) , y = lim yn(k)
k→∞
k→∞
für Teilfolgen (xn(k) )k∈N und (yn(k) )k∈N . Aus dX (xn(k) , yn(k) ) <
3.2.10, dass
dX (x, y) = lim dX (xn(k) , yn(k) ) = 0,
1
n(k)
folgt mit Lemma
k→∞
also x = y und somit f (x) = f (y). Andererseits folgt aus der Stetigkeit zusammen mit
Lemma 3.3.1 der offensichtliche Widerspruch
dY ( f (x), f (y)) = dY ( lim f (xn(k) ), lim f (yn(k) )) = lim dY ( f (xn(k) ), f (yn(k) )) ≥ ǫ.
k→∞
k→∞
k→∞
❑
6.3.4 Beispiel. Für nicht kompaktes E ⊆ R gilt:
(i) Es gibt eine auf E stetige Funktion die nicht beschränkt ist.
(ii) Es gibt eine auf E stetige und beschränkte Funktion, die kein Maximum hat.
(iii) Ist E beschränkt, so gibt es eine auf E stetige, aber nicht gleichmäßig stetige
Funktion.
Wir betrachten zuerst den Fall, dass E einen Häufungspunkt x0 hat, der nicht zu E
gehört (dieser Fall tritt sicher immer dann ein, wenn E beschränkt ist, denn dann würde
1
ist stetig auf E, aber nicht
aus abgeschlossen kompakt folgen). Die Funktion x 7→ x−x
0
1
beschränkt. Sie ist auch nicht gleichmäßig stetig. Die Funktion f (x) = 1+(x−x
2 ist
0)
stetig auf E und beschränkt (0 < f (x) < 1). Offenbar gilt limx→x0 f (x0 ) = 1, also
sup x∈E f (x) = 1.
Betrachte nun den Fall, dass E nicht beschränkt ist. (i) folgt mit f (x) = x, (ii) mit
x2
f (x) = 1+x
2.
In (iii) kann man die Forderung, dass E beschränkt ist, nicht ganz weglassen. Zum
Beispiel betrachte E = Z. Dann ist jede Funktion auf E gleichmäßig stetig, denn man
kann stets irgendein δ < 1 wählen, z.B. also δ = 21 ).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
140
6.3.5 Satz. Seien hX, dX i und hY, dY i metrische Räume, wobei hY, dY i sogar vollständig ist. Weiters sei D ⊆ X und f : D → Y
gleichmäßig stetig.
Dann existiert eine eindeutige gleichmäßig stetige Fortsetzung F : c(D) → Y.
Beweis.
Sei (xn )n∈N eine Cauchy-Folge von Punkten aus D. Zu ǫ > 0 wähle δ > 0 so, dass
dY f (y), f (z) < ǫ für dX (y, z) < δ .
(6.3)
Weiters wähle N ∈ N so, dass dX (xn , xm ) < δ für alle n, m ≥ N. Dann folgt
dY f (xn ), f (xm ) < ǫ, n, m ≥ N,
d.h. ( f (xn ))n∈N ist eine Cauchy-Folge in Y. Somit existiert der Limes limn→∞ f (xn ).
Sei x ∈ X, und seien (xn )n∈N und (yn )n∈N zwei Folgen von Punkten in D mit xn → x sowie yn → x. Ist ǫ > 0
gegeben und δ > 0 wie in (6.3), so wähle N ∈ N mit
dX (xn , x) <
δ
δ
, dX (yn , x) < , n ≥ N.
2
2
Insbesondere gilt dX (xn , yn ) ≤ dX (xn , x) + dX (yn , x) < δ für alle n ≥ N. Es folgt dY ( f (xn ), f (yn )) < ǫ, n ≥ N, und
daher
dY lim f (xn ), lim f (yn ) ≤ ǫ.
n→∞
n→∞
Da ǫ > 0 beliebig war, folgt limn→∞ f (xn ) = limn→∞ f (yn ).
Zu jedem Sx ∈ c(D) gibt es definitionsgemäß eine Folge (xn )n∈N mit xn → x. Definiere
F(x) := lim f (xn ).
n→∞
Wegen der obigen Punkte ist F eine wohldefinierte Funktion von X nach Y.
Ist x ∈ D, so betrachte die konstante Folge xn := x. Dann gilt sicher xn → x und f (xn ) → f (x), also F(x) = f (x).
Somit ist F eine Fortsetzung von f .
Es bleibt zu zeigen, dass F gleichmäßig stetig ist. Sei dazu ǫ > 0 gegeben. Wähle δ > 0 so, dass dY ( f (x), f (y)) <
für x, y ∈ D mit dX (x, y) < δ.
ǫ
3
Seien nun x, y ∈ c(D) mit dX (x, y) < 3δ . Wähle xn , yn ∈ D mit xn → x, yn → y und N ∈ N mit
dX (xn , x) <
δ
δ
ǫ
ǫ
, dX (yn , y) < , dY (F(x), f (xn )) < , dY (F(y), f (yn )) < , n ≥ N .
3
3
3
3
Dann gilt dX (xn , yn ) < δ und daher dY ( f (xn ), f (yn )) < 3ǫ . Somit erhalten wir dY (F(x), F(y)) < ǫ.
Die Eindeutigkeit folgt sofort aus Korollar 6.1.5.
❑
6.4 Unstetigkeitsstellen
Sei hY, dY i ein metrischer Raum, und sei f : (a, b) → Y mit a, b ∈ R, a < b. Weiters sei
x ∈ (a, b).
f ist gemäß Proposition 6.1.4 genau dann bei x stetig, wenn f (x) = limt→x f (t).
In (5.28) haben wir gesehen, dass f (x) = limt→x f (t) genau dann, wenn die Grenzwerte f (x−) := limt→x− f (t) und f (x+) := limt→x+ f (t) existieren und beide mit f (x)
übereinstimmen.
6.4.1 Bemerkung. Gilt zumindest f (x) = f (x−) ( f (x) = f (x+)), so spricht man von
Linksstetigkeit bzw. linksseitiger Stetigkeit (Rechtsstetigkeit bzw. rechtsseitiger Stetigkeit) der Funktion f bei x. Klarerweise ist f bei x stetig, wenn f bei x sowohl links- als
auch rechtsstetig ist.
6.4. UNSTETIGKEITSSTELLEN
141
Ist f nicht stetig, so unterscheidet man folgende Fälle.
6.4.2 Definition. Sei f unstetig bei x.
Man sagt, f habe eine Unstetigkeit 1. Art bei x, falls f (x−) := limt→x− f (t) und
f (x+) := limt→x+ f (t) existieren, aber nicht beide gleich f (x) sind.
Für Unstetigkeiten 1. Art gibt es zwei Möglichkeiten. Entweder f (x−) , f (x+),
in welchem Fall man von einer Sprungstelle spricht, oder f (x−) = f (x+) , f (x).
Dann spricht man von einer hebbaren Unstetigkeit.
Liegt keine Unstetigkeit 1. Art vor, so spricht man von einer Unstetigkeit 2. Art.
Den Begriff hebbar“hat man deswegen gewählt, weil man dann f an der Stelle x
”
so abändern kann, dass die neue Funktion bei x stetig ist.
6.4.3 Beispiel.
Betrachte die Funktion



1 , falls x rational
f (x) = 

0 , falls x irrational
Diese Funktion hat an jeder Stelle x eine Unstetigkeit 2.Art.
Sei



x
g(x) = 

0
, falls x rational
, falls x irrational
g ist stetig bei 0, hat aber an jeder Stelle x , 0 eine Unstetigkeit 2.Art. Es
gibt nämlich eine Folge (rn )n∈N aus Q ∩ (x, +∞) und eine Folge (xn )n∈N aus
R \ Q ∩ (x, +∞), die beide gegen x konvergieren (vgl. Beispiel 3.3.4). Nun ist
aber f (xn ) = 0 → 0 und f (rn ) = rn → x für n → ∞. Nach (5.28) kann somit limt→x+ f (t) nicht existieren. Ähnlich zeigt man, dass auch limt→x− f (t) nicht
existiert.
Sei
h



x+2




h(x) = 
−x
−2




x + 2
2
, falls x ∈ (−3, −2)
, falls x ∈ [−2, 0)
, falls x ∈ [0, 1)
1
−3
−2
−1
0
−1
−2
Dann ist h stetig auf (−3, 1) \ {0} und hat bei 0 eine Sprungstelle.
Wir setzen den Begriff der Sinusfunktion (aus der Schule) voraus. Sei
1
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
142
f

1


sin x
f (x) = 

0
, x>0
, x≤0
0
1
π
Dann ist f stetig auf R \ {0} und hat eine Unstetigkeit 2.Art bei 0.
Es können also im Allgemeinen alle möglichen Varianten von Unstetigkeiten auftreten.
Thematisch dazu passend wollen wir uns der Fortsetzbarkeit von stetigen Funktionen auf um einen Punkt größere Mengen zuwenden.
6.4.4 Bemerkung. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei
f : D → Y eine stetige Funktion. Sei weiters x ∈ X \ D.
Wir fragen uns, ob wir eine Fortsetzung f˜ : D ∪ {x} → Y von f finden können, die
die Eigenschaft stetig zu sein beibehält.
Wenn x kein Häufungspunkt von D ist, so sieht man leicht, dass x ein isolierter
Punkt von D ∪ {x} ist, und daher jede Fortsetzung f˜ stetig ist.
Sei also x ein Häufungspunkt von D. Gibt es eine stetige Fortsetzung f˜, so muss
nach Proposition 6.1.4 f˜(x) = limt→x f (t). Existiert umgekehrt limt→x f (t), so setze
man



limt→x f (t) , falls s = x
˜
f (s) = 

 f (s)
, falls s ∈ D
Klarerweise ist f˜ eine Fortsetzung von f . Wegen Proposition 6.1.4, (ii), ist f˜ bei x
stetig. Andererseits ist wegen Fakta 6.1.3 mit f auch f˜ bei allen t ∈ D stetig. Also ist f˜
eine auf D ∪ {x} stetige Fortsetzung.
6.4.5 Beispiel.
Seien a, b, c ∈ R, c ≤ 0, D = (−∞, 0) ∪ (0, +∞) und f : D → R definiert durch
b
f (x) = a für x < 0 und f (x) = x−c
für x > 0. Dann gilt lim x→0− f (t) = a und



, falls b , 0, c < 0
−b



 c
lim f (t) = 
sgn(b) · ∞ , falls b , 0, c = 0


x→0+


0
, falls b = 0
Aus Bemerkung 6.4.4 wissen wir, dass sich f genau dann zu einer Funktion
f˜ : R → R fortsetzen lässt, wenn limt→0 f (t) existiert. Nach (5.28) existiert
dieser Grenzwert genau dann, wenn a = b = 0 oder b , 0, c , 0, a = − bc . Dabei
muss f˜(0) = 0 bzw. f˜(0) = a = − bc .
Die komplexwertige Funktion
f (z) =
iz + 1
z3 + z
6.5. MONOTONE FUNKTIONEN
143
ist zunächst definiert auf D = {z ∈ C : z3 + z , 0} = C \ {0, i, −i}, dh. f :
D → C. Das zu Beispiel 6.1.10 analoge Beispiel für komplexe Polynome zeigt
die Stetigkeit von f auf D. Zudem gilt wegen Fakta 5.3.8
lim f (z) = lim
z→i
z→i
i
i(z − i)
i
i
i
=− .
= lim
=
=
z(z + i)(z − i) z→i z(z + i) limz→i z(z + i) 2i2
2
Somit lässt sich f stetig auf D̃ = D ∪ {i} durch f (i) = − 2i fortsetzen.
Eine Fortsetzung auf eine noch größere Menge – etwa auf D̃ ∪ {−i} – ist nicht
möglich, da dann auch limz→−i f (z) und wegen (5.9) auch limz→−i | f (z)| existieren
müsste. Nun gilt aber ( vgl. Bemerkung 5.3.9)
lim | f (z)| = lim
z→−i
z→−i
1
= +∞ ,
|z| · |z + i|
da für den Nenner rechts limz→−i |z| · |z + i| = (limz→−i |z|) · (limz→−i |z + i|) = 0 gilt.
6.5 Monotone Funktionen
6.5.1 Definition. Man sagt, dass für ein Intervall I ⊆ R, eine Funktion f : I → R
monoton wachsend ist, falls
x < y ⇒ f (x) ≤ f (y) .
Gilt sogar x < y ⇒ f (x) < f (y), so sagt man f sei streng monoton wachsend.
Analog sagt man, f sei monoton fallend, falls x < y ⇒ f (x) ≥ f (y). Sollte x < y
sogar f (x) > f (y) implizieren, so spricht von einer streng monoton fallenden Funktion.
Klarerweise ist eine streng monotone Funktion stets injektiv. Nun kommen wir zur
Diskussion der Unstetigkeitsstellen monotoner Funktionen.
6.5.2 Proposition. Sei f monoton wachsend auf einem reellen Intervall I, wobei a, b ∈
R ∪ {−∞, +∞}, a < b die Intervallränder bezeichnet.
Dann existieren für jeden Punkt x ∈ (a, b) sowohl f (x−) := lim s→x− f (s) als auch
f (x+) := limt→x+ f (t), wobei4
sup f (s) = f (x−) ≤ f (x) ≤ f (x+) = inf f (t).
(6.4)
x<t<b
a<s<x
Ist x = a ∈ I (x = b ∈ I), so gilt die rechte (linke) Seite von (6.4). Weiters gilt für x < y
immer f (x+) < f (y−).
Analoge Aussagen gelten für monoton fallende Funktionen.
Beweis. Wir beschränken uns auf x ∈ (a, b). Der Fall der Intervallränder betrachtet
man in analoger Weise.
Der Beweis folgt unmittelbar aus (5.10), da die Grenzwerte in (6.4) ja Grenzwerte
monotoner und beschränkter Netze sind.
Die Ungleichung in (6.4) folgt leicht aus der Tatsache, dass jeder Punkt aus { f (s) :
s ∈ (a, x)} kleiner oder gleich f (x) und f (x) kleiner oder gleich jedem Punkt aus { f (t) :
t ∈ (x, b)} ist.
Der zweite Teil der Behauptung folgt aus
lim f (t) = inf f (t) = inf f (t), lim f (s) = sup f (s) = sup f (s).
t→x+
x<t<b
x<t<y
t→y−
a<s<y
x<s<y
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
144
f
f (x3 +)
f (x3 +)
f (x3 −)
= f (x2 −)
f (x2 )
= f (x2 +)
x1
x2
x3
f (x1 +)
f (x1 ) = f (x1 −)
Abbildung 6.3: Veranschaulichung monotoner Funktionen
❑
6.5.3 Korollar. Sei I ⊆ R ein Intervall, f : I → R eine monoton wachsende Funktion
und J = f (I).
Das Bild ist genau dann ein Intervall, wenn f stetig ist.
Ist f streng monoton wachsend, so ist f −1 : J → I auch streng monoton wachsend. Dabei enthält I genau dann seinen linken (rechten) Intervallrand, wenn J
sein Infimum (Supremum) enthält – also J ein Minimum (Maximum) hat.
Ist f streng monoton wachsend und stetig, so ist auch f −1 : J → I streng monoton wachsend und stetig.
Entsprechende Aussagen gelten für (streng) monoton fallende Funktionen.
Beweis.
Ist f stetig, so ist wegen Korollar 6.2.6 auch f (I) ein Intervall.
Angenommen f ist nicht stetig an einem x ∈ I, das zunächst nicht ein Intervallrand von I sei. Wegen (6.4) muss lim s→x− f (s) < limt→x+ f (t). Es folgt
f (τ) ≤ lim f (s) = f (x−), τ < x und f (τ) ≥ lim f (t) = f (x+), τ > x .
s→x−
4 Insbesondere
t→x+
können in (a, b) nur Unstetigkeitsstellen 1.Art auftreten.
6.5. MONOTONE FUNKTIONEN
Also kann f keine Werte im Inter
vall f (x−), f (x+) bis auf unter
Umständen einen - nämlich f (x) annehmen.
145
f (x+)
f (x)
f (x−)
Ist x der linke Intervallrand von I, so muss nach (6.4) f (x) < limt→x+ f (t). Somit
folgt ( f (x), limt→x+ f (t)) ∩ J = ∅. Entsprechend argumentiert man im Fall des
rechten Randes. Jedenfalls ist J kein Intervall.
Wegen der strengen Monotonie ist f injektiv. Ist x, y ∈ J, x < y, und gilt f −1 (x) ≥
f −1 (y), so folgt wegen der vorausgesetzten Monotonie von f der Widerspruch
x = f ( f −1 (x)) ≥ f ( f −1 (y)) = y; also gilt f (x) < f (y), womit f −1 : J → I streng
monoton wachsend ist.
Enthält I seinen linken Rand5 a, so folgt aus der Monotonie, dass f (a) ≤ f (t), t ∈
I, und somit dass f (a) Minimum von J ist.
Hat J = f (I) das Minimum y, so folgt aus der Monotonie von f −1 , dass f −1 (y) ≤
f −1 (x), x ∈ J, und somit dass f −1 (y) Minimum von I ist; also a = f −1 (y) ∈ I.
Ist f stetig, so ist J ein Intervall und die streng monoton wachsende Funktion
f −1 : J → I hat als Bild genau das Intervall I. Nach dem ersten Punkt muss
daher auch f −1 stetig sein.
❑
Wir werden später dieses Korollar verwenden, um z.B. zu zeigen, dass der Logarithmus eine stetige Funktion ist.
6.5.4 Beispiel. Die Funktion f : [0, +∞) → R definiert durch f (t) = tn für ein festes n ∈ N ist stetig und streng monoton wachsend. Korollar 6.5.3 bietet uns nun ei√
ne weitere Möglichkeit, einzusehen, dass f −1 = . von f ([0, +∞)) = [0, +∞) nach
[0, +∞) (⊆ R) stetig ist; vgl. Beispiel 6.1.16 und Beispiel 6.2.7.
Thematisch zu obigem Ergebnis passt das nächste Lemma, das aus dem Zwischenwertsatz folgt.
6.5.5 Lemma. Seien I, J ⊆ R zwei Intervalle und f : I → J stetig und bijektiv. Dann
ist f streng monoton wachsend oder fallend.
Beweis. Wäre f weder streng monoton wachsend noch streng monoton fallend, so gibt
es x1 < x2 aus I mit f (x1 ) ≥ f (x2 ) und x3 < x4 aus I mit f (x3 ) ≤ f (x4 ). Weil f injektiv
ist, muss sogar f (x1 ) > f (x2 ) und f (x3 ) < f (x4 ). Daraus folgt, dass {x1 , x2 , x3 , x4 }
zumindest drei Elemente hat.
Durch Fallunterscheidungen je nachdem, wie diese Punkte angeordnet sind, findet
man immer a < b < c aus {x1 , x2 , x3 , x4 }, sodass entweder f (a) < f (b), f (b) > f (c)
oder f (a) > f (b), f (b) < f (c). Man beachte, dass dabei wegen der Injektivität alle drei
Werte f (a), f (b), f (c) untereinander verschieden sein müssen.
5I
ist daher von der Form [a, a], [a, b], [a, b), [a, +∞) mit b ∈ R, b > a.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
146
Im ersten Fall ist entweder f (a) ∈ ( f (c), f (b)) oder f (c) ∈ ( f (a), f (b)). Aus Korollar 6.2.6 folgt daher f (a) = f (t) für ein t ∈ (b, c) bzw. f (c) = f (t) für ein t ∈ (a, b), was
jedenfalls der Injektivität widerspricht.
Im zweiten Fall argumentiert man entsprechend.
❑
6.6 Gleichmäßige Konvergenz
P
n
Wir haben schon gesehen, dass z.B. die geometrische Reihe ∞
n=0 z für jedes z ∈ C,
|z| < 1, konvergiert. Betrachtet man diese Reihe nicht nur für ein festes vorgegebenes
z, sondern für alle z, so hat man eine Reihe, deren Summanden Funktionen von z sind,
1
und deren Summe ebenfalls eine Funktion von z nämlich 1−z
ist.
Betrachten wir also eine Folge ( fn )n∈N von Funktionen, die definiert ist, zum Beispiel, auf einer Menge E ⊆ R und die, zum Beispiel, reelle Werte annimmt. Wir würden
gerne erklären, was es bedeutet, dass diese Folge gegen eine Funktion f konvergiert.
Um einen vernünftigen Grenzwertbegriff zu bekommen, definieren wir eine Metrik,
und zwar eine Metrik auf einer Menge von Funktionen f : E → R. Aber man kann in
diesem konkreten Fall auch naiver an die Sache herangehen. Ist ( fn )n∈N , fn : E → R,
eine Folge von Funktionen, dann ist für jedes feste x ∈ E sicher ( fn (x))n∈N eine Folge
von Zahlen, und für diese wissen wir, was es bedeutet zu konvergieren.
6.6.1 Definition. Sei ∅ , E eine Menge und hY, dY i ein metrischer Raum. Eine Folge
( fn )n∈N , fn : E → Y, heißt punktweise konvergent gegen die Funktion f : E → Y, wenn
für jedes feste x ∈ E gilt limn→∞ fn (x) = f (x).
Entsprechend definiert man die punktweise Konvergenz von Netzen von Funktionen.
Es entsteht die Frage, ob sich Eigenschaften wie etwa die fundamentale Eigenschaft
der Stetigkeit der Funktionen fn auf die Grenzfunktion f übertragen. Die folgenden
Beispiele illustrieren, dass in dieser Angelegenheit etwas schiefgehen kann.
6.6.2 Beispiel.
Betrachte die Funktionen gn : [0, 1] → R, definiert durch gn (x) := xn , n ∈ N.
Bekannterweise gilt
(
0 , falls x ∈ [0, 1)
lim gn (x) =
1 , falls x = 1
n→∞
Jede der Funktionen gn ist eine stetige Funktionen auf [0, 1], nicht jedoch die
Grenzfunktion.
Betrachte die Funktionen fn : R → R, definiert durch fn (x) :=
für jedes x , 0
∞
X
x2
n=0
x2
.
(1+x2 )n
(1 + x2 )n
eine konvergente geometrische Reihe. Ihre Summe ist 1 + x2 , x , 0.
Für x = 0 sind alle Summanden = 0, also auch ihre Summe. Man erhält
(
∞
X
1 + x2 , falls x , 0
fn (x) =
0 , falls x = 0
n=0
Dann ist
6.6. GLEICHMÄSSIGE KONVERGENZ
147
Alle Funktionen fn , und damit auch alle Partialsummen obiger Reihe sind stetige
Funktionen von x ∈ R, nicht jedoch die Grenzfunktion.
Die punktweise Konvergenz von Funktionen ist also nicht stark genug um etwa die
Eigenschaft der Stetigkeit zu erhalten.
6.6.3 Definition. Sei ∅ , E eine Menge und hY, dY i ein metrischer Raum. Wir bezeichnen mit B(E, Y) die Menge aller beschränkten Funktionen f : E → Y, d.h.
B(E, Y) := f : E → Y : ∃R > 0, y ∈ Y : ∀x ∈ E ⇒ dY ( f (x), y) ≤ R .
Man definiert nun die Abbildung
(
B(E, Y) × B(E, Y) → R
d∞ :
( f, g) 7→ sup{dY ( f (x), g(x)) : x ∈ E}
und spricht von der Supremumsmetrik6 .
d∞ ( f, g) ist in der Tat eine reelle Zahl, da es wegen f, g ∈ B(E, Y) reelle R1 , R2 > 0
und y1 , y2 ∈ Y gibt, sodass dY ( f (x), y1 ) ≤ R1 und dY (g(x), y2) ≤ R2 und somit
dY ( f (x), g(x)) ≤ dY ( f (x), y1 ) + dY (y1 , y2 ) + dY (y2 , g(x)) ≤ R1 + dY (y1 , y2 ) + R2
für alle t ∈ E gilt. Also ist die nichtleere Teilmenge {dY ( f (x), g(x)) : x ∈ E} von R nach
oben beschränkt.
f
g
Für reellwertige Funktionen
f, g : E → R = Y
ist dY (x, y) = |x − y|
und daher
d∞ ( f, g) = sup x∈E | f (x) − g(x)|.
d∞ ( f, g)
| f − g|
E
6.6.4 Lemma. Die Supremumsmetrik d∞ ist eine Metrik auf der Menge B(E, Y).
Beweis. Für f, g ∈ B(E, Y) ist {dY ( f (x), g(x)) : x ∈ E} eine nichtleere Teilmenge von
[0, +∞), wodurch d∞ ( f, g) ≥ 0. Dabei gilt offenbar d∞ ( f, g) = sup{dY ( f (x), g(x)) : x ∈
E} = 0 genau dann, wenn {dY ( f (x), g(x)) : x ∈ E} = {0} – also genau dann, wenn
dY ( f (x), g(x)) = 0 für jedes x ∈ E. Letzteres ist aber zu f (x) = g(x), x ∈ E – also f = g
äquivalent.
6 Identifiziert man R p mit der Menge aller Funktionen von {1, . . . , p} nach R, so stimmt auf R p die Supremumsmetrik hier mit mit der aus Beispiel 3.1.5, (ii), überein.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
148
Aus dY ( f (x), g(x)) = dY (g(x), f (x)) folgt d∞ ( f, g) = d∞ (g, f ). Ist h eine weitere
Funktion, so gilt für festes x ∈ E
dY ( f (x), g(x)) ≤ dY ( f (x), h(x)) + dY (h(x), g(x)) ,
und daher auch
dY ( f (x), g(x)) ≤ sup dY ( f (t), h(t)) + sup dY (h(t), g(t)) = d∞ ( f, h) + d∞ (h, g) .
t∈E
t∈E
Da diese Beziehung für jedes x ∈ E gilt, folgt auch d∞ ( f, g) = sup x∈E dY ( f (x), g(x)) ≤
d∞ ( f, h) + d∞ (h, g).
❑
6.6.5 Definition. Eine Folge ( fn )n∈N von Funktionen aus B(E, Y) heißt gleichmäßig
gegen f , wenn limn→∞ fn = f bezüglich d∞ , d.h. wenn
∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) ≤ ǫ, n ≥ N,
(6.5)
oder äquivalent dazu ∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) < ǫ, n ≥ N.
Entsprechend definiert man die gleichmäßige Konvergenz von Netzen von Funktionen.
f
fn , n ≥ N
f +ǫ
f −ǫ
E
Abbildung 6.4: Veranschaulichung der gleichmäßigen Konvergenz
6.6.6 Bemerkung. Ist f ∈ B(E, Y) und g irgendeine Funktion von E → Y mit der
Eigenschaft, dass supt∈E dY ( f (t), g(t)) < ∞, so folgt aus der Dreiecksungleichung, dass
auch g eine beschränkte Funktion ist.
Ist daher ( fn )n∈N eine Folge aus B(E, Y), und gilt supt∈E dY ( fn (t), g(t)) → 0, so folgt
g ∈ B(E, Y) und fn → g gleichmäßig.
Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz liegt darin
begründet, dass man ein N finden muss, das für alle x ∈ E funktioniert.
In der Tat gilt d∞ ( fn , f ) ≤ ǫ ⇔ ∀x ∈ E ⇒ dY ( fn (x), f (x)) ≤ ǫ, und somit ist (6.5)
äquivalent zu
∀ǫ > 0 ∃N ∈ N ∀x ∈ E : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N ,
6.6. GLEICHMÄSSIGE KONVERGENZ
149
wogegen punktweise Konvergenz bedeutet
∀x ∈ E ∀ǫ > 0 ∃N ∈ N : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N .
Insbesondere sehen wir, dass jede gleichmäßig konvergente Folge auch punktweise
konvergiert und zwar zur gleichen Grenzfunktion.
6.6.7 Beispiel. Betrachte nochmals die reellwertigen Funktionen gn (x) := xn , n ∈ N
nun definiert für x ∈ [0, 1), vgl. Beispiel 6.6.2. Wir wissen schon, dass gn punktweise gegen die Nullfunktion auf [0, 1) konvergiert. Dabei gilt wegen xn < 1 für
x ∈ [0, 1), n ∈ N, und wegen limx→1− xn = 1, dass
d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = 1.
x∈[0,1)
x∈[0,1)
Also d∞ (gn , 0) 6→ 0 für n → ∞, d.h. (gn )n∈N konvergiert nicht gleichmäßig gegen die
Nullfunktion.
gn (x)
1
n=1
n=3
n=7
n = 13
1
2
0
1
2
η
1
x
Abbildung 6.5: Graph der Funktionen gn für ausgewählte n ∈ N
6.6.8 Beispiel. Sei η ∈ (0, 1) fest, und betrachtet die Funktionenfolge gn (x) = xn ,
n ∈ N, auf dem Intervall [0, η]. Klarerweise konvergiert auch diese eingeschränkte
Funktionenfolge punktweise gegen die Nullfunktion auf [0, η]. Nun folgt aber wegen
d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = ηn ,
x∈[0,η]
x∈[0,η]
dass d∞ (gn , 0) → 0 für n → ∞. Also konvergiert gn sogar gleichmäßig gegen die
Nullfunktion.
1
2
6.6.9 Beispiel. Man untersuche die Funktionenfolge fn (x) := nxe− 2 nx , x ∈ [0, ∞),
n ∈ N, auf gleichmäßige Konvergenz. Dabei greifen wir der Definition der Funktion
x 7→ e x für x ∈ R weiter hinten vor. Wir verwenden auch die Tatsache, dass ye−y → 0
für y → +∞. Weiters verwenden wir die Differentialrechnung zur Bestimmung
von Extrema. Da dieses Beispiel nur zum besseren Verständnis des Begriffes der
gleichmäßigen Konvergenz dient und später nicht verwendet wird, sind diese Vorgriffe
gerechtfertigt.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
150
Zunächst sei bemerkt, dass für alle n ∈ N die Funktion fn (x) stetig ist und fn (x) ≥ 0
für x ∈ [0, ∞). Eine getrennte Untersuchung der Fälle x , 0 und x = 0 liefert punktweise Konvergenz fn (x) → f (x) ≡ 0 für n → ∞. Um ( fn )n∈N auf gleichmäßige Konvergenz
gegen die Funktion f (x) ≡ 0 zu untersuchen betrachtet man die Supremumsmetrik
d∞ ( fn , 0) = sup dR ( fn (x), 0) = sup | fn (x)|.
x∈[0,∞)
x∈[0,∞)
Da für jedes n ∈ N die Funktion fn (x) nicht negativ ist, fn (0) = 0 und lim x→∞ fn (x) = 0
gilt, folgt, dass fn (x) sogar ein Maximum in [0, ∞) annimmt. Um das Maximum zu
berechnen, ist Satz 7.2.2 hilfreich. Für jedes n ∈ N ist fn (x) beliebig oft differenzierbar,
und setzt man die erste Ableitung gleich Null, so erhält man
1
1
1
2
2
2
±1
fn′ (x) = ne− 2 nx − n2 x2 e− 2 nx = e− 2 nx (n − n2 x2 ) = 0 ⇔ x = √ .
n
Also ist x = √1n die einzige Nullstelle der ersten Ableitung, die in [0, ∞) enthalten ist.
Wegen lim x→∞ fn (x) = 0 folgt daher, dass das Maximum der Funktion fn (x) an der
Stelle x = √1n liegt. Somit ergibt sich für die Supremumsmetrik
1 1
n
d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn √ = √ e− 2 .
x∈[0,∞)
n
n
x∈[0,∞)
Daraus folgt d∞ ( fn , 0) 6→ 0 für n → ∞, d.h. ( fn )n∈N konvergiert nicht gleichmäßig
gegen die Nullfunktion.
fn (x)
7
n=1
n=5
6
n = 20
5
n = 120
4
3
2
1
0
1
2
1
3
2
2
5
2
3
7
2
x
Abbildung 6.6: Graph der Funktionen fn für ausgewählte n ∈ N
1
2
6.6.10 Beispiel. Sei η > 0 und betrachtet man die Funktionenfolge fn (x) := nxe− 2 nx ,
n ∈ N, auf dem Intervall [η, ∞). Aus dem vorigen Beispiel wissen wir bereits, dass die
Funktion fn (x) für x > √1n monoton fallend ist. Wegen
1
∀δ > 0 ∃n0 ∈ N : δ > √ ∀n ≥ n0
n
6.6. GLEICHMÄSSIGE KONVERGENZ
151
gibt es ein n0 ∈ N, sodass √1n < [η, ∞) für alle n ≥ n0 . Daher ergibt sich für n ≥ n0 in
diesem Fall für die Supremumsmetrik
1
2
d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn (η) = nηe− 2 nη .
x∈[η,∞)
x∈[η,∞)
Also folgt d∞ ( fn , 0) → 0 für n → ∞, d.h. ( fn )n∈N konvergiert gleichmäßig gegen die
Nullfunktion.
Gleichmäßige Konvergenz sichert nun – wie wir auch später immer wieder feststellen werden – , dass sich Grenzübergänge gutmütig verhalten.
6.6.11 Lemma. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer
Raum, ∅ , E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N. Weiters sei (xk )k∈N eine Folge in
E.
Ist die Folge ( fn )n∈N auf E gleichmäßig konvergent gegen f , und existiert für jedes
n ∈ N der Grenzwert
lim fn (xk ) = An ,
k→∞
dann konvergieren die Folgen (An )n∈N und ( f (xk ))k∈N in Y und zwar gegen denselben
Grenzwert. Also gilt
lim lim fn (xk ) = lim lim fn (xk ).
k→∞ n→∞
n→∞ k→∞
Beweis. Sei ǫ > 0 gegeben. Da ( fn )n∈N → f bezüglich d∞ , ist ( fn )n∈N in B(E, Y) eine
Cauchy-Folge. Es existiert also ein N ∈ N, sodass für n, m ≥ N und alle t ∈ E gilt
dY ( fn (t), fm (t)) ≤ ǫ.
Hält man n und m fest und lässt man t die Folge (xk )k∈N durchlaufen, so folgt mit
Lemma 3.2.10 und Lemma 3.3.1 die Beziehung dY (An , Am ) ≤ ǫ. Damit ist (An )n∈N eine
Cauchy-Folge in Y und daher konvergent, limn→∞ An =: A. Nun gilt
dY ( f (xk ), A) ≤ dY ( f (xk ), fn (xk )) + dY ( fn (xk ), An ) + dY (An , A).
Wähle n so groß, dass für alle t ∈ E und insbesondere für alle t = xk
dY ( f (t), fn (t)) < ǫ und dY (An , A) < ǫ.
Für dieses n existiert ein k0 ∈ N, sodass aus k ≥ k0 die Ungleichung dY ( fn (xk ), An ) < ǫ
folgt. Insgesamt erhalten wir
dY ( f (xk ), A) < 3ǫ, k ≥ k0 .
❑
6.6.12 Bemerkung. Wir werden später eine Verallgemeinerung dieses Lemmas für Netze zeigen. Der Beweis davon wird im Wesentlich derselbe sein.
6.6.13 Korollar. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer
Raum, ∅ , E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N, sodass ( fn )n∈N auf E gleichmäßig
gegen f konvergiert.
Sind die Funktionen fn alle stetig bei einem x ∈ E, so ist es auch f . Sind alle fn auf
ganz E stetig, so ist es auch f .
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
152
k→∞
Beweis. Sei x ∈ E und sei (xk )k∈N eine Folge mit xk −→ x. Aus Lemma 6.6.11 folgt
lim f (xk ) = lim lim fn (xk ) = lim lim fn (xk ) = lim fn (x) = f (x).
k→∞
k→∞ n→∞
n→∞ k→∞
n→∞
Nach Proposition 6.1.4 ist f bei x stetig.
❑
6.6.14 Bemerkung. Nach Lemma 5.1.13 erhält man, dass die Menge Cb (E, Y) aller
beschränkten und stetigen Funktionen von E → Y, eine abgeschlossene Teilmenge
von B(E, Y) versehen mit der Metrik d∞ ist. Dabei ist E Teilmenge eines metrischen
Raumes.
6.6.15 Satz. Ist ∅ , E eine Menge und hY, dY i ein vollständig metrischer Raum, so ist
hB(E, Y), d∞i ebenfalls ein vollständig metrischer Raum.
Somit konvergiert eine Folge ( fn )n∈N von Funktionen aus B(E, Y) genau dann
gleichmäßig, wenn es zu jedem ǫ > 0 ein N ∈ N gibt, sodass für alle n, m ≥ N und
beliebiges x ∈ E gilt
dY ( fn (x), fm (x)) ≤ ǫ.
(6.6)
Beweis. Klarerweise ist eine konvergente Folge ( fn )n∈N von Funktionen aus B(E, Y)
eine Cauchy-Folge. Diese Tatsache gilt ja in allen metrischen Räumen.
Sei nun umgekehrt die Cauchy-Bedingung erfüllt. Man beachte, dass (6.6) für alle
x ∈ E zu d∞ ( fn , fm ) ≤ ǫ äquivalent ist.
Es folgt, dass insbesondere für jedes einzelne x die Folge ( fn (x))n∈N eine CauchyFolge in Y und daher konvergent ist. Also existiert der Grenzwert limn→∞ fn (x) punktweise auf E. Wir setzen
f (x) := lim fn (x).
n→∞
Wir müssen nun noch zeigen, dass f beschränkt ist und dass die Konvergenz sogar
gleichmäßig stattfindet.
Sei ǫ > 0 gegeben und wähle N ∈ N so, dass dY ( fn (x), fm (x)) ≤ ǫ für alle n, m ≥ N
und alle x ∈ E. Hält man x fest und lässt m → ∞ streben, so folgt für n ≥ N
dY ( fn (x), f (x)) ≤ ǫ.
Da x beliebig, war folgt d∞ ( fn , f ) ≤ ǫ, n ≥ N, d.h. fn → f gleichmäßig und mit
Bemerkung 6.6.6 ist f beschränkt.
❑
6.7 Reell- und komplexwertige Folgen und Reihen
6.7.1 Definition. Ist Y = R oder Y = C und ∅ , E eine Menge, dann setzt man für
f :E→Y
k f k∞ := sup | f (x)| (∈ [0, +∞]),
x∈E
und spricht von der Supremumsnorm.
Unmittelbar überprüft man, dass für f, g : E → Y
k f k∞ < +∞ ⇔ f ∈ B(E, R) bzw. f ∈ B(E, C)
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
153
k f k∞ ≥ 0 und k f k∞ = 0 ⇔ f = 0.
Für f, g ∈ B(E, R) bzw. f, g ∈ B(E, C) gilt zudem
d∞ ( f, g) = k f − gk∞ und k f k∞ = d∞ ( f, 0), wobei 0 hier die konstante Nullfunktion ist.
kλ · f k∞ = |λ| · k f k∞ für λ ∈ R bzw. λ ∈ C,
k f + gk∞ ≤ k f k∞ + kgk∞ ,
k f · gk∞ ≤ k f k∞ · kgk∞ .
6.7.2 Korollar. Sind ( fn )n∈N , (gn )n∈N Folgen von Funktionen aus B(E, R) bzw. B(E, C),
die gleichmäßig gegen f bzw. g konvergieren, so gilt
lim fn + gn = f + g, lim fn · gn = f · g,
n→∞
n→∞
und zwar gleichmäßig. Insbesondere gilt limn→∞ λ · fn = λ · f für alle λ ∈ R bzw. λ ∈ C.
Beweis. Wir beweisen exemplarisch nur die zweite Aussage. Es gilt
d∞ ( fn gn , f g) = k fn gn − f gk∞ ≤ kgn k∞ · k fn − f k∞ + k f k∞ · kgn − gk∞ .
Als konvergente Folge ist (gn )n∈N beschränkt, d.h. kgn k∞ = d∞ (gn , 0) ≤ C, n ∈ N.
Somit konvergiert d∞ ( fn gn , f g) gegen Null.
❑
6.7.3 Definition. Für n ∈ N sei fn : E → R (C).
P
Man sagt, die Reihe ∞
n=1 fn konvergiert punktweise, wenn für jedes x ∈ E die
P∞
Reihe n=1 fn (x) in R (C) konvergiert.
P∞
Ist fn ∈ B(E, R) (∈ B(E, C)),
n ∈ N, so heißt n=1 fn gleichmäßig konvergent,
PN
wenn die Folge n=1 fn (.) N∈N von Partialsummen gleichmäßig konvergiert.
P
Die Reihe ∞
n=1 fn konvergiert absolut als Funktionenreihe, wenn die Reihe
P∞
n=1 k fn k∞ konvergiert.
P
Klarerweise impliziert die absolute Konvergenz von ∞
n=1 fn als Funktionenreihe
P∞
die absolute Konvergenz von n=1 fn (x) für jedes x ∈ E. Wir haben aber auch folgendes
Ergebnis.
6.7.4 Korollar (Weierstraß Kriterium). Sei ( fn )n∈N eine Folge von beschränkten reellP
bzw. komplexwertigen Funktionen auf einer Menge E , ∅. Ist ∞
n=1 fn absolut konvergent als Funktionenreihe, so ist diese Funktionenreihe auch gleichmäßig konvergent.
P∞
und somit auch gleichmäßig konvergent,
n=1 fn ist sicher dann absolut konvergent,P
wenn es Mn ∈ R, Mn ≥ 0, n ∈ N gibt, für die ∞
n=1 Mn konvergiert, und sodass
k fn k∞ ≤ Mn , n ∈ N.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
154
Beweis. Nach dem Majorantenkriterium in Lemma 3.8.8 folgt aus der Konvergenz von
P∞
P∞
n=1 Mn die von n=1 k fn k∞ .
P
N
Ist nun letztere Reihe konvergent, so ist die Folge n=1
k fn k∞
von PartialsumN∈N
men eine Cauchy-Folge in R. Es gibt somit zu ǫ > 0 ein N ∈ N, sodass für k, m ≥ N
P
gilt m
n=k+1 k fn k∞ ≤ ǫ. Für solche m, k folgt auch
m
m
X
X
fn ≤
k fn k∞ ≤ ǫ, .
n=k+1 n=k+1
P
N
∞
Also ist n=1 fn
eine Cauchy-Folge in B(E, R) (∈ B(E, C)), und nach Satz 6.6.15
N∈N P
konvergent. Somit ist ∞
n=1 fn gleichmäßig konvergent.
❑
Die meisten Konvergenzkriterien für Reihen kann man so anpassen, dass sie auch
für Reihen von Funktionen anwendbar sind. Wir wollen das hier aber nicht weiter
ausführen.
Ein bedeutendes Beispiel für Reihen von Funktionen sind die sogenannten Potenzreihen.
6.7.5 Definition. Sind an ∈ C oder auch nur an ∈ R für n ∈ N ∪ {0}, und ist z ∈ C, so
nennt man die komplexwertige Reihe
∞
X
an zn
n=0
eine Potenzreihen7 . Als Konvergenzradius wollen wir die Zahl R ∈ [0, +∞] mit


∞


X




n
R = sup 
|z|
:
z
∈
C,
a
z
ist
konvergent

n




(6.7)
n=0
bezeichnen8.
6.7.6 Beispiel. Wir sind solchen Reihen schon begegnet, z.B. sind die geometrische
P
P∞ zn
n
Reihe ∞
n=0 z und die Exponentialreihe n=0 n! Potenzreihen.
Erstere konvergiert genau für |z| < 1 und hat somit Konvergenzradius 1. Die Exponentialreihe konvergiert für alle z ∈ C und hat somit Konvergenzradius +∞.
P∞
an zn eine Potenzreihe und R ihr Konvergenzradius.
P
n
(i) Für jedes z ∈ C mit |z| > R ist ∞
n=0 an z divergent.
P
n
(ii) Für jedes z ∈ C mit |z| < R ist ∞
n=0 an z sogar absolut konvergent. Insbesondere
ist


∞


X




n
.
(6.8)
|z|
:
z
∈
C,
a
z
ist
absolut
konvergent
R = sup 

n




6.7.7 Satz. Sei
n=0
n=0
7 Dabei
8 Da
ist es zunächst unerheblich, ob sie jetzt konvergiert oder nicht.
für z = 0 die Reihe immer absolut konvergiert, ist diese Menge nicht leer.
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
155
P
n
(iii) Für jedes r ∈ [0, R) ist ∞
n=0 an z auf dem abgeschlossenen Kreis Kr (0) = {z ∈ C :
|z| ≤ r} absolut konvergent als Funktionenreihe. Die Funktion
z 7→
∞
X
n=0
an zn , z ∈ Kr (0),
ist dabei eine stetige und beschränkte Funktion auf Kr (0).
Im
C
r
Re
−R
R
Abbildung 6.7: Konvergenzradius
(iv) Auf UR (0) = {z ∈ C : |z| < R} ist z 7→
P∞
n=0
an zn eine stetige Funktion9.
(v) Der Konvergenzradius lässt sich durch die Koeffizienten an unmittelbar bestimmen durch10
1
.
R=
√
lim supn→∞ n |an |
Gilt dabei an , 0 für alle hinreichend großen n, so gilt auch
1
|
lim supn→∞ | aan+1
n
≤R≤
1
|
lim inf n→∞ | aan+1
n
.
(6.9)
Beweis.
(i) Folgt sofort aus (6.7).
(ii) Folgt aus dem nächsten Punkt.
P
n
(iii) Nach (6.7) gibt es ein komplexes z0 mit r < |z0 | ≤ R, sodass ∞
n=0 an z0 konvergiert.
Somit ist die Summandenfolge eine Nullfolge; insbesondere |an zn0 | ≤ C, n ∈ N
für ein C > 0. Für |z| ≤ r < |z0 | rechnet man
n
n
z
r
|an zn | = |an zn0 | · ≤ C · .
z0
z0
9 Im
10 Ist
Allgemeinen
√ ist sie aber nicht mehr beschränkt
die Folge ( n |an |)n∈N nicht nach oben beschränkt, so sei
1 √
lim supn→∞ n |an |
= 0.
156
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
n
P
r
Wegen zr0 < 1 konvergiert ∞
n=0 C z0 .
PN
Die Partialsummen n=0
an zn , N ∈ N, sind Polynome und damit stetig. Da Kr (0)
kompakt ist (vgl. Beispiel 5.2.7), sind diese Partialsummen auf Kr (0) beschränkt.
Aus dem Weierstraßschen Kriterium (Korollar 6.7.4) angewandt auf E = Kr (0)
folgt die absolute Konvergenz als Funktionenreihe und somit die gleichmäßige
Konvergenz der entsprechenden Funktionenfolge von Partialsummen auf Kr (0)
gegen eine beschränkte Funktion. Nach Korollar 6.6.13 ist die Grenzfunktion sogar stetig auf E = Kr (0).
P
n
(iv) Betrachtet man z 7→ ∞
n=0 an z auf U R (0), so ist auch dies eine stetige Funktion.
In der Tat ist die Stetigkeit eine lokale Eigenschaft (siehe Fakta 6.1.3), und man
kann zu jedem komplexen z mit |z| < R ein δ > 0 und ein r ∈ [0, R) finden, sodass
Uδ (z) ⊆ Kr (0).
√
(v) Für jedes z ∈ C mit |z| < lim sup 1 √n |a | gilt lim supn→∞ n |an zn | = |z| ·
n
n→∞
√
P
n
lim supn→∞ n |an | < 1. Nach dem Wurzelkriterium, Satz 3.9.1, ist ∞
n=0 an z konvergent. Gemäß (6.7) folgt
pn
lim sup |an | ≤ R.
n→∞
Wäre lim sup 1 √n |a | < R, so wähle z ∈ C mit lim sup 1 √n |a | < |z| < R. Wegen
n
n
n→∞
n→∞
(ii) konvergiert
die
Potenzreihe.
Andererseits
sieht
man
ähnlich
wie oben, dass
√
lim supn→∞ n |an zn | > 1, und mit dem Wurzelkriterium, Satz 3.9.1, folgt die Divergenz der Potenzreihe. Also muss auch
1
lim supn→∞
√n
|an |
≥ R.
Analog beweist man (6.9) mit Hilfe des Quotientenkriteriums.
❑
6.7.8 Beispiel. Das Konvergenzverhalten einer Potenzreihe ist durch den obigen Satz
relativ gut abgeklärt. Einzig über die Punkte mit |z| = R, wo R der Konvergenzradius ist,
hat man keine Aussage. Es können hier tatsächlich auch alle Fälle eintreten. Betrachte
dazu die Potenzreihen
∞
∞ n
∞
X
X
X
z
zn
.
zn ,
und
n
n2
n=0
n=0
n=0
P
P∞ zn
n
Alle haben Konvergenzradius 1. Jedoch ist ∞
n=0 z für |z| = 1 divergent, n=0 n2 absolut
P zn
konvergent, und ∞
n=0 n (nicht absolut) konvergent außer bei z = 1, wo sie divergiert.
6.7.9 Korollar. Sei f (z) :=
R > 0.
P∞
n=0
an zn eine Potenzreihe und ihr Konvergenzradius sei
Verschwinden nicht alle an , so gibt es ein δ ∈ (0, R), sodass f (z) , 0 für z ∈
Uδ (0) \ {0}.
6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN
157
P
n
Sei ∞
n=0 bn z eine weitere Potenzreihen mit Konvergenzradien R̃ > 0. Gibt
es eine Menge E ⊆ Umin(R,R̃) (0), die Null als Häufungspunkt hat, und sodass
P∞
P∞
n
n
n=0 an z =
n=0 bn z für alle z ∈ E, so folgt an = bn , n ∈ N ∪ {0} und damit
R = R̃.
Beweis. Sei n0 ∈ N ∪ {0} der erste Index, sodass an0 , 0. Wegen den Rechenregeln
P
P∞
n
n
für Reihen konvergiert ∞
n=0 an z genau dann, wenn g(z) =
n=0 an+n0 z es tut, wobei
n0
im Fall der Konvergenz z g(z) = f (z). Letztere ist also auch eine Potenzreihe mit
Konvergenzradius R.
Wegen g(0) = an0 , 0 und wegen der Stetigkeit von g auf UR (0) gibt es ein δ ∈
(0, R), sodass |g(z) − g(0)| < |an0 | und somit g(z) , 0 für z ∈ Uδ (0). Also ist auch
f (z) , 0 für z ∈ Uδ (0) \ {0}.
Um die zweite Aussage zu zeigen betrachte man die Potenzreihe
P
n
h(z) = ∞
n=0 (an − bn )z , die zumindest für |z| < min(R, R̃) konvergiert, und damit einen
Konvergenzradius ≥ min(R, R̃) hat. Nach Voraussetzung und den Rechenregeln für
Reihen folgt h(z) = 0, z ∈ E. Da 0 ein Häufungspunkt von E ist, widerspricht das aber
der ersten Aussage, außer an − bn = 0, n ∈ N.
❑
6.7.10 Bemerkung. Ist |z| < R, so folgt aus Korollar 3.8.3
∞
X
an (z̄)n =
n=0
∞
X
ān zn .
(6.10)
n=0
P
n
Insbesondere folgt aus an ∈ R, n ∈ N, und z = x ∈ R, dass auch ∞
n=0 an x ∈ R.
P∞
n
Ist umgekehrt n=0 an x ∈ R für alle x ∈ R, |x| < R, so folgt aus (6.10), dass die
Potenzreihen (beide mit Konvergenzradius R)
∞
X
an zn ,
n=0
∞
X
ān zn
n=0
für z ∈ R ∩ UR (0) übereinstimmen. Aus Korollar 6.7.9 folgt an = ān , also an ∈ R.
6.7.11 Bemerkung. Üblicherweise werden auch Reihen der Form
∞
X
n=0
an (z − z0 )n
(6.11)
für ein festes z0 als Potenzreihen bezeichnet. Die hergeleiteten Aussagen für Potenzreihen stimmen sinngemäß offensichtlich auch für solche Reihen. Dabei ist z.B. der
Bereich der Konvergenz UR (z0 ) mit entsprechend definierten Konvergenzradius.
Funktionen f : D → C mit offenem D ⊆ C heißen analytisch in einem Punkt
z0 ∈ D, falls es eine offene Kugel Ur (z0 ) ⊆ D mit r > 0 und eine Potenzreihe der
Form (6.11) gibt, sodass r kleiner oder gleich dem Konvergenzradius der Reihe ist und
sodass f (z) für alle z ∈ Ur (z0 ) mit dem Grenzwert der Reihe (6.11) übereinstimmt, f
also lokal um z0 als Grenzwert einer Potenzreihe dargestellt werden kann.
Ist f um jedes z0 ∈ D analytisch, so heißt f analytisch.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
158
6.8 Die Exponentialfunktion
Wir wollen jetzt einige der sogenannten elementaren Funktionen betrachten. Grundlage
für alle diese ist die Exponentialfunktion
exp(z) =
∞
X
zn
, z ∈ C.
n!
n=0
(6.12)
Wir haben schon gesehen, dass diese Reihe für alle z ∈ C konvergiert. Sie ist also eine
Potenzreihe mit Konvergenzradius +∞. Insbesondere ist exp : C → C stetig.
Weitere wichtige elementare Funktionen sind sin und cos.
6.8.1 Definition. Für z ∈ C seien
cos z =
exp(iz) + exp(−iz)
exp(iz) − exp(−iz)
, sin z =
,
2
2i
die sogenannten trigonometrischen Funktionen Cosinus und Sinus.
Als Zusammensetzung von stetigen Funktionen sind cos : C → C und sin : C → C
auf C stetig (siehe Lemma 6.1.6 und Korollar 6.1.8).
6.8.2 Lemma. Für alle z ∈ C gilt
cos z =
∞
X
k=0
(−1)k
X
z2k+1
z2k
, sin z =
.
(−1)k
(2k)!
(2k + 1)!
k=0
∞
Also sind cos und sin Grenzfunktionen von Potenzreihe11 mit Konvergenzradius +∞.
Beweis. Für gerade n = 2k gilt in + (−i)n = 2i2k = 2(−1)k , und für ungerade n = 2k + 1
gilt in + (−i)n = 0. Aus den Rechenregeln für Reihen folgt somit
exp(iz) + exp(−iz) X in + (−i)n zn X
z2k
=
=
.
(−1)k
2
2
n! k=0
(2k)!
n=0
∞
∞
Analog leitet man die Potenzreihenentwicklung für sin her.
❑
6.8.3 Satz. Sei z, w ∈ C und x, y ∈ R. Dann gilt
(i) exp(z) , 0, exp(z + w) = exp(z) exp(w) und exp(−z) =
(exp z)n = exp(zn), n ∈ Z.
1
exp(z) .
Schließlich ist
(ii) exp(iz) = cos z + i sin z. Allgemeiner gilt die Formel von de Moivre:
(cos z + i sin z)n = cos(nz) + i sin(nz), n ∈ Z.
(iii) exp(z̄) = exp(z), cos(z̄) = cos(z), sin(z̄) = sin(z).
Insbesondere sind exp |R , cos |R , sin |R Funktionen, die R nach R abbilden.
(iv) cos y = Re exp(iy), sin y = Im exp(iy) und exp(x + iy) = exp(x)(cos y + i sin y),
wobei exp(x) ∈ R.
11 Ganz genau genommen ist eine Reihe der Bauart P∞ c z2k keine Potenzreihe, da sie nicht von der
k=0 k
P
n
Form ∞
man aber a2k = ck für k ∈ N ∪ {0} und an = 0 für ungerade n, so überzeugt man
n=0 an z ist. Setzt
P
P
2k
n
sich leicht davon, dass ∞
genau dann konvergiert, wenn ∞
n=0 an z esPtut, wobei die Grenzwerte
k=0 ck z
2k+1
dieser Reihen dann übereinstimmen. Entsprechendes gilt für Reihen der Bauart ∞
k=0 ck z
6.8. DIE EXPONENTIALFUNKTION
159
Im
exp(x + iy) =
exp(x)(cos y + i sin y)
i exp(x) sin y
( x)
exp
i
exp(iy) =
cos y + i sin y
i sin y
0
−1
cos y 1
exp(x) cos y
Re
−i
Abbildung 6.8: Darstellung der Lage von exp(x + iy)
(v) Die Funktion exp eingeschränkt auf die reelle Achse ist eine streng monoton
wachsende bijektive Funktion von R auf R+ mit exp(0) = 1. Insbesondere gilt
lim exp(x) = +∞, lim exp(x) = 0.
x→+∞
x→−∞
(6.13)
(vi) | exp(z)| = exp(Re z). Insbesondere gilt | exp(z)| = 1 ⇔ Re z = 0 und
(cos y)2 + (sin y)2 = 1.
(vii) cos(−z) = cos z und sin(−z) = − sin z.
(viii) Es gelten die Summensätze für Sinus und Cosinus
cos(z + w) = cos z cos w − sin z sin w, sin(z + w) = sin z cos w + cos z sin w .
Beweis.
(i) exp(z + w) = exp(z) exp(w) haben wir in Beispiel 5.4.13 gesehen. Die beiden
nächsten Aussagen folgen aus exp(−z) · exp(z) = exp(0) = 1. Schließlich folgt
(exp z)n = exp(zn), n ∈ N, durch vollständige Induktion, und für n ∈ Z wegen
1
.
exp(−zn) = exp(zn)
(ii) exp(iz) = cos z + i sin z folgt leicht durch Nachrechnen, und daraus
(cos z + i sin z)n = (exp iz)n = exp(inz) = cos(nz) + i sin(nz).
(iii) Da die Koeffizienten in den Potenzreihenentwicklungen reell sind, folgt die Aussage sofort aus Bemerkung 6.7.10.
(iv) Folgt aus (i) und (ii), da nach dem letzten Punkt exp(x), cos y, sin y ∈ R.
(v) Für x > 0 folgt aus der Tatsache, dass alle Koeffizienten in der Potenzreihe (6.12)
von exp strikt positiv sind, immer exp(x) > 1 + x > 1. Klarerweise ist exp(0) = 1.
1
Für x < 0 folgt aus (i), dass exp(x)
= exp(−x) > 1 − x > 1 und somit exp(x) ∈
1
(0, 1), exp(x) < 1−x .
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
160
Aus diesen Abschätzungen schließen wir sofort auf (6.13). Aus x < y ergibt sich
wegen
exp(y) = exp(x + (y − x)) = exp(x) · exp(y − x) > exp(x)
die Tatsache, dass exp(x) streng monoton wachsende ist.
Nun ist exp(x) : R → R+ stetig. Somit muss wegen Korollar 6.5.3 exp(R) ein
offenes Intervall sein, das wegen (6.13) aber nur (0, +∞) = R+ sein kann.
(vi) Aus
| exp(z)|2 = exp(z) exp(z) = exp(z) exp(z) = exp(z + z) = exp(2 Re z) = exp(Re z)2
und aus der Tatsache, dass | exp(z)| und exp(Re z) positive reelle Zahlen sind,
folgt | exp(z)| = exp(Re z). Weiters gilt (cos y)2 + (sin y)2 = | cos y + i sin y|2 =
| exp(iy)|2 = exp(0) = 1.
(vii) Folgt aus der jeweiligen Potenzreihenentwicklung, da nur gerade bzw. nur ungerade Potenzen vorkommen.
(viii) Man setze die Definition von sin und cos ein und rechne die Gleichheit nach.
❑
y
4
3
y = exp(x)
2
1
−3
−2
−1
0
1
2
3
x
−1
Abbildung 6.9: Funktionsgraphen der reellen Exponentialfunktion
Wie wir unter anderem gerade gesehen haben, ist exp : R → R+ eine Bijektion.
6.8.4 Definition. Mit ln : R+ → R wollen wir die Inverse von exp : R → R+ bezeichnen und sprechen vom natürlichen Logarithmus bzw. vom Logarithmus naturalis.
Aus Satz 6.8.3, Korollar 6.5.3 und durch elementares Nachrechnen folgt sofort
6.8.5 Korollar. Die Funktion ln : R+ → R ist eine stetige und streng monoton wachsende Bijektion. Es gilt
lim ln x = −∞, lim ln x = +∞ ,
x→0+
x→+∞
sowie
ln(xy) = ln x + ln y, x, y > 0, ln(xn ) = n ln x, x > 0, n ∈ Z .
6.8. DIE EXPONENTIALFUNKTION
161
y
y = ln(x)
3
2
1
−1
0
1
2
3
4
5
6
x
−1
−2
−3
Abbildung 6.10: Logarithmus naturalis
Beachte, dass wir den Logarithmus nur für reelle Werte definiert haben. Dies ist
kein Zufall, will man den Logarithmus auch für komplexe Werte definieren, trifft man
auf Schwierigkeiten ganz essentieller Natur (vgl. Vorlesung zur Komplexen Analysis).
Wir können nun mit Hilfe der Exponentialfunktion die bisher nur für rationale b
definierte Ausdrücke ab auch für beliebige b ∈ R definieren.
6.8.6 Korollar. Für a ∈ R+ und b ∈ Q gilt ab = exp(b ln a).
Setzen wir ab durch exp(b ln a) auf ganz (a, b) ∈ R+ × R fort, so gilt (a, a1, a2 ∈
R+ , b, b1 , b2 ∈ R)
ab1 +b2 = ab1 · ab2 , (a1 a2 )b = ab1 · ab2 .
Beweis. Ist b = qp ∈ Q mit p ∈ Z, q ∈ N, so ist exp(b ln a) nach Satz 6.8.3 eine positive
reelle Zahl mit der Eigenschaft, dass
(exp(b ln a))q = exp(bq ln a) = exp(p ln a) = exp(ln a p ) = a p . .
√q
Also ist exp(b ln a) = a p .
Die Funktionalgleichungen folgen aus denen von exp und ln.
❑
6.8.7 Bemerkung.
Als Zusammensetzung der stetigen Funktionen exp, ln und ·, ist (a, b) 7→ ab auf
(a, b) ∈ R+ × R stetig (vgl. Beispiel 6.1.7).
Die Funktion exp kann nun selbst mit dieser Notation als allgemeine Potenz
angeschrieben werden. Sei dazu e := exp(1), die Eulersche Zahl. Dann gilt nach
der Definition der allgemeinen Potenz
e x = exp(x ln e) = exp x ln exp(1) = exp(x) .
| {z }
=1
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
162
6.8.8 Bemerkung. Wir haben schon festgestellt, dass die Eulersche Exponentialfunktion eine ganz zentrale Rolle spielt. Daher wird auch die reelle Zahl e ein interessantes
Objekt sein. Dazu wollen wir hier bemerken, dass man die Eulersche Zahl e, neben
P
1
ihrer Definition als e := exp(1) = ∞
n=0 n! auch in vielfacher Weise anders charakterisieren kann. Zum Beispiel kann man zeigen, dass
e = lim 1 +
n→∞
1 n
z n
bzw. ez = lim 1 +
,
n→∞
n
n
gilt.
Diese Formel gibt auch Anlass zu alternativen Definitionen der Funktion exp(x),
nämlich als e x . Dafür muss man allerdings die allgemeine Potenz zuerst –ohne Verwendung
von exp – definieren. Dies kann man so machen, dass man von der Funktion
√q
a p : R+ × Q → R+ ausgeht, und diese mittels stetiger Fortsetzung zu einer Funktion
R+ × R → R+ macht.
Wie aus der Schule bekannt, ist einer der wichtigsten Naturkonstanten die Zahl
π. Mit Hilfe der Funktion cos kann man nun die Existenz dieser Zahl mit all ihren
wichtigen Eigenschaften herleiten.
6.8.9 Lemma.
Für t ∈ [0, 2] und n ∈ N gilt
tn
n!
≥
tn+2
(n+2)! .
Die Funktion cos : R → R hat eine kleinste positive Nullstelle x0 , die im Intervall
(0, 2) liegt.
Für x0 gilt sin x0 = 1.
Beweis.
Durch Umformen ist die zu beweisende Ungleichung äquivalent zu
(n + 2)(n + 1) ≥ t2 , und somit richtig.
Wir betrachten die Potenzreihenentwicklung von cos in Lemma 6.8.2 und stellen
sofort cos 0 = 1 fest. Da man in Reihen Klammern setzen darf, folgt aus dem
letzten Punkt
!
∞
22 24
24l+4
1
22 24 X 24l+2
≤1−
+
−
−
+
=− .
cos 2 = 1 −
2
4! l=1 (4l + 2)! (4l + 4)!
2
4!
3
Nach dem Zwischenwertsatz Korollar 6.2.6 hat t 7→ cos t im Intervall (0, 2) sicher eine Nullstelle x.
Nach Proposition 6.1.12 ist die Menge N = {t ∈ R : cos t = 0} = cos |−1
R ({0}) und
daher auch N ∩ [0, +∞) abgeschlossen. In Beispiel 5.1.14 haben wir gesehen,
dass N ∩ [0, +∞) ein Minimum hat, welches wegen cos 0 = 1 sicher nicht 0 ist.
Also gibt es eine kleinste positive Nullstelle x0 von t 7→ cos t.
Aus Satz 6.8.3 folgt wissen wir (cos x0 )2 + (sin x0 )2 = 1, und daher (sin x0 )2 = 1.
Nun ist aber wegen dem ersten Punkt

∞ 
X
x4l+3

 x4l+1
0
 ≥ 0,
 0
−
sin x0 =
(4l + 1)! (4l + 3)!
l=0
und somit sin x0 = 1.
6.8. DIE EXPONENTIALFUNKTION
163
❑
6.8.10 Definition. Die Zahl π sei jene positive reelle Zahl, sodass
tive Nullstelle von cos : R → R ist.
π
2
die kleinste posi-
y
y = sin(x)
y = cos(x)
1
−2π
− 3π
2
−π
− π2
0
π
2
π
−1
3π
2
2π
x
Abbildung 6.11: Funktionsgraphen des reellen Sinus und Cosinus
6.8.11 Satz.
(i) exp(±i 2π ) = ±i, exp(±iπ) = −1, exp(±2iπ) = 1.
(ii) cos(± 2π ) = 0, cos(±π) = −1, cos(±2π) = 1,
sin(± π2 ) = ±1, sin(±π) = 0, sin(±2π) = 0.
(iii) exp(z + 2kπi) = exp(z), sin(z + 2kπ) = sin(z), cos(z + 2kπ) = cos(z), z ∈ C, k ∈ Z. .
(iv) exp(z) = 1 ⇐⇒ ∃k ∈ Z : z = 2kπi (⇔ z ∈ 2πiZ).
(v) cos z = 0 ⇔ ∃k ∈ Z : z =
π
2
+ πk, und sin z = 0 ⇔ ∃k ∈ Z : z = πk.
(vi) Es gilt exp(C) = C \ {0}, wobei exp(z) = exp(ζ) ⇔ z − ζ ∈ 2πiZ.
Beweis.
(i) Wegen Satz 6.8.3 und Lemma 6.8.9 gilt exp(i π2 ) = cos π2 + i sin π2 = i. Der Rest
folgt aus Satz 6.8.3, (i).
(ii) Folgt aus (i), indem man Real- und Imaginärteil betrachtet.
(iii) exp(z + 2kπi) = exp(z) · exp(2πi)k = exp(z). Daraus folgen durch Einsetzen von
Definition 6.8.1 die restlichen Aussagen.
(iv) Sei exp(z) = 1 gegeben. Aus Satz 6.8.3 wissen wir, dass damit Re z = 0 und damit
z = 0 + iy für ein y ∈ R. Klarerweise ist y = η + 2lπ für ein eindeutiges l ∈ Z und
η ∈ [0, 2π)12. Aus (iii) folgt exp(iη) = exp(iy) = 1.
Angenommen η , 0. Schreibe
η
η
η
exp(i ) = cos + i sin =: u + iv mit u, v ∈ R .
4
4
4
12 Für
l nehme man das Maximum von {k ∈ Z : 2kπ ≤ y}.
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
164
Dabei ist wegen 0 < 4η < π2 , und der Definition von π2 , sicherlich u , 0. Im Fall
v = 0 wäre exp(i η4 ) = u = ±1 und somit
exp(i π2 )
i
π η
=
exp(i( − )) =
= ±i .
2 4
exp(i 4η ) ±1
Also ist α = π2 − η4 eine Nullstelle reelle von cos mit α ∈ (0, π2 ) im Widerspruch
zur Definition von π2 . Also muss v , 0. Klarerweise gilt auch
1 = exp(iη) = (u + iv)4 = u4 − 6u2 v2 + v4 + i 4uv(u2 − v2 ) .
Die rechte Zahl ist genau dann reell, wenn u2 − v2 = 0. Wegen u2 + v2 = 1 ist das
äquivalent zu u2 = v2 = 12 . Dann ist aber u4 − 6u2 v2 + v4 = −1 , 1.
(v) Es ist cos z = 0 genau dann, wenn exp(iz) = − exp(−iz) = exp(iπ − iz), also
wenn exp(2iz − iπ) = 1. Dieses tritt genau dann ein, wenn 2iz−iπ
2πi ∈ Z, d.h. wenn
z ∈ π2 + πZ. Analog bestimmt man die Nullstellen des Sinus.
(vi) Sei w ∈ C, w , 0, gegeben. Da exp(x) eine Bijektion von R auf R+ ist, gibt es ein
w
x ∈ R mit exp(x) = |w|. Schreibe exp
x = u + iv mit u, v ∈ R.
Klarerweise ist u2 + v2 = 1. Insbesondere gilt u ∈ [−1, 1]. Wegen cos 0 = 1
und cos π = −1 gibt es nach dem Zwischenwertsatz (Korollar 6.2.6) gibt es eine
t ∈ [0, π] mit u = cos t.
Aus u2 + v2 = 1 = (cos t)2 + (sin t)2 folgt v2 = (sin t)2 . Ist v = sin t, so setze y = t.
Sonst muss v = − sin t, und dann setze man y = −t. In jedem Falle ist cos y = u
und sin y = v und somit
w = exp(x)(cos y + i sin y) = exp(x + iy).
Ist exp(z) = exp(ζ), so folgt 1 = exp(z − ζ), also z − ζ ∈ 2πiZ.
❑
Jede komplexe Zahl w , 0 lässt sich gemäß Satz 6.8.11 als exp(z) schreiben. Wählt
man z so, dass 0 ≤ Im z < 2π, so ist nach Satz 6.8.11, (v), z eindeutig bestimmt. Also
ist exp : R × [0, 2π) → C \ {0} bijektiv.
6.8.12 Definition. Ist zu einem gegebenen w ∈ C \ {0} das komplexe z ∈ R ×
[0, 2π) ⊆ (C) die eindeutige Lösung von exp(z) = w, und setzt man r = exp(Re z)
und t = Im z, so erhält man
w = exp(Re z) exp(i Im z) = r(cos t + i sin t) .
Somit ist (r, t) 7→ r(cos t + i sin t) eine Bijektion T : R+ × [0, 2π) → C \ {0}. Das Paar
(r, t) nennt man dabei die Polarkoordinaten von w.
Betrachtet man (r, t) 7→ r(cos t + i sin t) als Abbildung von [0, +∞) × [0, 2π), so
erreicht man alle komplexen w – auch w = 0 – zu dem Preis, dass diese Abbildung
dann nicht mehr injektiv ist.
6.8.13 Bemerkung.
6.8. DIE EXPONENTIALFUNKTION
165
Im w
Im z
exp(1 + 12 πi) = ie
−1 +2πi
2πi
1 +2πi
−1 +23 πi
3
2 πi
1 +23 πi
exp(z) = w
exp( 21 πi) = i
√1 (1
2
exp(1 + πi) = −e
e = exp(1)
0
−1 +πi
πi
1 +πi
−1 +21 πi
1
2 πi
1 +21 πi
+ i) = exp( 41 πi)
exp(πi) = −1
1 = exp(0) = exp(2πi)
Re w
exp( 32 πi) = −i
1
4 πi
−1
0
1
exp(1 + 32 πi) = −ie
Re z
Abbildung 6.12: Exponentialfunktion als Abbildung von C auf C \ {0}
Wegen Satz 6.8.11, (iii), kann dabei auch das Intervall [0, 2π) durch irgendein
halboffenes Intervall der Länge 2π, z.B. (−π, π], ersetzen.
Offensichtlich ist T : R+ × [0, 2π) → C \ {0} als Zusammensetzung von
stetigen Funktionen selbst stetig. Die Umkehrung ist nicht stetig: Es gilt
limn→∞ exp(−i 1n ) = 1, aber
1
1
lim T −1 (exp(−i )) = lim (1, 2π − ) = (1, 2π) , (1, 0) = T −1 (1).
n→∞
n→∞
n
n
Nimmt man statt [0, 2π) z.B. das Intervall [a, a + 2π), so treten entsprechende
Probleme beim Winkel a auf.
Nimmt man den kritischen Winkel aus, so sind die Polarkoordinaten in beide Richtungen stetig.
6.8.14 Proposition. Die Abbildung
T : R+ × (a, a + 2π) → C \ {r exp(ia) : r ∈ [0, +∞)}
ist bijektiv, und T und T −1 sind stetig.
Beweis. Es bleibt die Stetigkeit von T −1 : D := C \ {r exp(ia) : r ∈ [0, +∞)} → R+ × (a, a + 2π) zu zeigen. Dazu sei
limn→∞ zn = z ∈ D für eine Folge aus D. Somit können wir
zn = rn exp(iαn ), n ∈ N, z = r exp(iα),
mit rn , r ∈ (0, +∞) und αn , α ∈ (a, a + 2π) schreiben. Wegen rn = |zn |, r = |z| folgt rn → r.
Ist (αn(k) )k∈N eine Teilfolge, so hat diese wegen der Kompaktheit von [a, a + 2π] eine gegen ein β ∈ [a, a + 2π]
konvergente Teilfolge (αn(k(l)) )l∈N . Somit wäre wegen der Stetigkeit von T
exp(iβ) = lim exp(iαn(k(l)) ) = lim
l→∞
l→∞
zn(k(l))
z
= = exp(iα),
rn(k(l))
r
und nach Satz 6.8.11 β − α ∈ 2πZ. Also folgt α = β und nach Lemma 5.2.11 gilt αn → α.
❑
6.8.15 Bemerkung. Wir sehen nun auch, dass es für n ∈ N immer n viele n-te Wurzeln
einer jeder Zahl w ∈ C \ {0} in C gibt:
Schreiben wir w in Polarkoordinaten w = r(cos t + i sin t), (r, t) ∈ R+ × [0, 2π), so
gilt für ein ζ ∈ C
exp(ζ)n = w ⇔ exp(nζ) = r(cos t + i sin t) = exp(ln(r) + it) .
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
166
Wegen Satz 6.8.11 ist das genau dann der Fall, wenn nζ = ln(r) + i(t + 2 jπ) für ein
j ∈ Z. Da die Lösungen der Gleichung zn = w nur in C \ {0} = exp(C) zu suchen sind,
erhalten wir mit
!
!
√n
t + 2 jπ
ln(r) + i(t + 2 jπ)
t + 2 jπ
= r · cos
∈ C, j ∈ Z ,
+ i sin
η j = exp
n
n
n
genau alle Lösungen dieser Gleichung. Wieder wegen Satz 6.8.11 sind aber nur
η0 , . . . , ηn−1 paarweise verschieden, und für j < {0, . . . , n − 1} stimmt η j mit einem
der η0 , . . . , ηn−1 überein.
6.9 Fundamentalsatz der Algebra
Als Anwendung der bisher entwickelten Stetigkeitstheorie wollen wir den Fundamentalsatz der Algebra beweisen. Zunächst benötigen wir ein Lemma.
6.9.1 Lemma. Ist p(z) ∈ C[z] vom Grad n, dh. p(z) = an zn + . . . + a0 , an , 0 ein
komplexes Polynom, so hat |p(z)| ein Minimum, d.h. es gibt eine Zahl c ∈ C mit |p(c)| ≤
|p(z)| für alle z ∈ C.
Beweis. Wir haben in Beispiel 5.5.11 gesehen, dass limz→∞ |an zn + . . . + a0 | = +∞.
Insbesondere gibt es eine Zahl R > 0, sodass |p(z)| ≥ |a0 | = |p(0)|, z ∈ C mit |z| > R.
Die Kreisscheibe K := {z ∈ C : |z| ≤ R} ist kompakt, und |p(z)| ist, als Zusammensetzung der stetigen Funktionen p und |.|, stetig auf K. Daher wird ein Minimum
angenommen, minz∈K |p(z)| = |p(c)| ≤ |p(0)|. Unsere Wahl von R sichert, dass
|p(c)| = minz∈C |p(z)|.
❑
6.9.2 Satz (Fundamentalsatz der Algebra). Sei p(z) = a0 + · · · + an zn ein komplexes
Polynom vom Grad n. Dann existieren n nicht notwendigerweise verschiedene Zahlen
z1 , . . . , zn ∈ C, sodass
n
Y
(z − zk ).
(6.14)
p(z) = an
k=1
Beweis.
Sei h(z) ein Polynom der Form h(z) = 1 + bzk + zk g(z) mit k ∈ N, b ∈ C \ {0}
und einem Polynom g, wobei g(0) = 0. Wir zeigen die Existenz eines u ∈ C mit
|h(u)| < 1.
Dazu wählen wir eine k-te Wurzel von − b1 (vgl. Bemerkung 6.8.15), d.h. eine
Zahl d ∈ C mit bdk = −1. Für t ∈ (0, 1] gilt
|h(td)| ≤ |1 − tk | + |tk dk g(td)| = 1 − tk + tk |dk g(td)| = 1 − tk (1 − |d k g(td)|) .
Wegen |dk g(td)| = 0 für t = 0 folgt aus der Stetigkeit dieses Ausdruckes bei
0, dass |dk g(td)| ≤ 12 für t ∈ (0, δ) mit einem δ > 0. Für jedes solche t gilt
|h(td)| ≤ 1 − tk 12 < 1.
Nun zeigen wir, dass jedes nichtkonstante Polynom f (z) eine Nullstelle in C hat.
Nach Lemma 6.9.1 gibt es ein c ∈ C, sodass | f (c)| = minz∈C | f (z)|. Wäre f (c) , 0,
so betrachte
f (z + c)
= 1 + bk zk + bk+1 zk+1 + . . . + bn zn , bk , 0.
h(z) :=
f (c)
6.9. FUNDAMENTALSATZ DER ALGEBRA
167
Nach dem ersten Beweisschritt existiert ein u ∈ C mit |h(u)| < 1 und daher
| f (u + c)| = |h(u)| · | f (c)| < | f (c)|
im Widerspruch zu | f (c)| = minz∈C | f (z)|.
Wir zeigen nun (6.14) durch Induktion nach dem Grad von p(z). Ist der Grad
eins, also p(z) = a1 z + a0 mit a1 , 0, so ist p(z) = a1 (z − (− aa10 )).
Stimme nun (6.14) für alle Polynome vom Grad kleiner als n, sei p(z) vom Grad
n. Nach dem vorigen Beweisschritt hat p eine Nullstelle z1 . Mittels Polynomdivision und Einsetzen von z = z1 erhält man p(z) = s(z)(z − z1 ). Das Polynom
s hat den gleichen Führungskoeffizienten wie p, und lässt sich nach Induktionsvoraussetzung in der angegebenen Weise faktorisieren.
❑
6.9.3 Bemerkung. Funktionen f : R → C der Bauart
f (t) =
N
X
cn exp(itn),
n=−N
für ein N ∈ N und cn ∈ C, n = 0, . . . , N nennt man trigonometrische Polynome.
Man sieht sofort, dass f (t) = exp(iNt) · p(exp(it)), wobei p : C \ {0} → C
p(z) =
2N
X
cn−N zn .
n=0
Also ist f stetig und 2π-periodisch. Weiters stimmen zwei trigonometrische Polynome
überein, wenn das ihre Koeffizienten tun. Ist nämlich
N
X
cn exp(itn) =
n=−N
M
X
dn exp(itn),
n=−M
PN
(cn − dn ) exp(itn) = 0, wobei wir b j = 0, M <
wobei o.B.d.A. N ≥ M, so folgt n=−N
P
n
j ≤ N setzten. Es folgt q(exp(it)) = 0, t ∈ R, mit q(z) = 2N
n=0 (cn−N − dn−N )z . Also
hat das Polynom q(z) unendlich viele Nullstellen und ist damit das Nullpolynom, d.h.
cn = dn , n = −N, . . . , N.
Schließlich lässt sich jedes trigonometrische Polynom wegen
N
X
cn exp(itn) =
n=−N
N
X
cn (cos nt+i sin nt) = c0 +
n=−N
N
X
n=1
in der Form
a0 +
N
X
n=1
an cos nt +
N
X
(cn +c−n ) cos nt+
N
X
(cn −ic−n ) sin nt,
n=1
bn sin nt,
n=1
schreiben. Umgekehrt lässt sich jede Funktion der Bauart (6.15) schreiben als
a0 +
N
X
n=1
exp(int) + exp(−int) X exp(int) − exp(−int)
+
=
bn
2
2i
n=1
N
an
(6.15)
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
168
−1
N
X
X
a−n + ib−n
an − ibn
exp(itn) + a0 +
exp(itn).
2
2
n=−N
n=1
Somit ist (6.15) eine zweite Art trigonometrische Polynome darzustellen, wobei die
Koeffizienten in (6.15) ebenfalls eindeutig sind.
6.10 Weitere wichtige elementare Funktionen
Die Funktion
π
sin x
tan : R \ { + πn : n ∈ Z} → R, tan(x) =
,
2
cos x
wird als Tangens und
cot : R \ {πn : n ∈ Z} → R, cot(x) =
cos x
,
sin x
als Cotangens bezeichnet.
y
y = tan(x)
y = cot(x)
− 3π
2
−2π
− π2
−π
3π
2
π
2
0
π
Abbildung 6.13: Tangens und Cotangens
2π
x
6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN
169
Betrachtet man tan eingeschränkt auf (− 2π , π2 ), so zeigt man elementar, dass tan dieses Intervall bijektiv auf R abbildet. Entsprechend bildet cot das Intervall (0, π) bijektiv
auf R ab. Die jeweiligen Umkehrfunktionen heißen arctan (Arcustangens) bzw. arccot
(Arcuscotangens).
y
y = arctan(x)
y = arccot(x)
π
π
2
−π
−2π
π
0
2π
x
− π2
Abbildung 6.14: Arcustangens und Arcuscotangens
Man kann auch sin auf das Intervall [− 2π , π2 ] einschränken, und erhält eine Bijektion
von [− π2 , π2 ] auf [−1, 1]. Die Umkehrfunktion davon heißt arcsin (Arcussinus). Entsprechend bildet cos das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion davon
heißt arccos (Arcuscosinus).
y
y = arcsin(x)
y = arccos(x)
π
π
2
−2
−1
0
1
2
x
− π2
Abbildung 6.15: Arcussinus und Arcuscosinus
Ähnlich wie sin und cos sind Sinus Hyperbolicus sinh und Cosinus Hyperbolicus
cosh definiert:
cosh z :=
exp(z) + exp(−z)
exp(z) − exp(−z)
, sinh z :=
, z ∈ C.
2
2
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
170
Die Werte von cosh z und sinh z liegen im allgemeinen in C. Für reelle z = x liegen
cosh x und sinh x offensichtlich in R.
y
4
3
y = sinh(x)
y = cosh(x)
2
1
−3
−2
−1
−1
0
1
2
3
x
−2
−3
−4
Abbildung 6.16: Sinus Hyperbolicus und Cosinus Hyperbolicus
Da sinh : R → R bijektiv ist, hat er eine Inverse die mit areasinh (Areasinus Hyperbolicus) bezeichnet wird. Die Funktion cosh eingeschränkt auf [0, +∞) bildet dieses
Intervall bijektiv auf [1, +∞) ab. Die entsprechende Umkehrfunktion von [1, +∞) auf
[0, +∞) heißt areacosh (Areacosinus Hyperbolicus).
6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN
y
171
y = areasinh(x)
y = areacosh(x)
3
2
1
−6
−5
−4
−3
−2
−1
−1
1
0
2
3
4
5
6
x
−2
−3
Abbildung 6.17: Areasinus Hyperbolicus und Areacosinus Hyperbolicus
y
y = tanh(x)
y = coth(x)
1
−2
−1
0
1
2
x
−1
Abbildung 6.18: Tangens Hyperbolicus und Cotangens Hyperbolicus
sinh x
Schließlich ist tanh : R → R definiert durch tanh x = cosh
x , und coth : R \ {0} → R
cosh x
durch coth x = sinh x .
Dabei bildet tanh die reellen Zahlen bijektiv auf (−1, 1) und coth die Menge R \ {0}
bijektiv auf R \ [−1, 1]. Die entsprechenden Umkehrfunktion heißen areatanh (Areatangens Hyperbolicus) und areacoth (Areacotangens Hyperbolicus).
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
172
y
y = areatanh(x)
y = areacoth(x)
2
1
−6
−4
−2
0
2
4
6
x
−1
−2
Abbildung 6.19: Areatangens Hyperbolicus und Areacotangens Hyperbolicus
6.11 Abelscher Grenzwertsatz
Thematisch passt zu diesem Kapitel – insbesondere zum Begriff der Potenzreihe – der
sogenannte Abelsche Grenzwertsatz.
P
6.11.1 Satz. Sei P(z) = ∞j=0 a j z j eine Potenzreihe, R ihr Konvergenzradius mit 0 <
P
R < ∞. Weiters sei z0 ∈ C mit |z0 | = R. Ist die Zahlenreihe s := ∞j=0 a j z0j konvergent,
so gilt
lim P(tz0 ) = s.
(6.16)
t→1−
Beweis. Sei |z| < R und
sn :=
n
X
a j z0j , s := lim sn .
n→∞
j=0
Laut Voraussetzung existiert der Grenzwert s. Aus Lemma 3.9.5 folgt
!j
!n
! j+1
!j
n−1
n
n
X
X
X
z
z
z
z
j
j
=
sn −
−
)=
s j(
a jz =
(a j z0 )
z0
z0
z0
z0
j=0
j=0
j=0
z
z0
Wegen
n
z
z0
!n
! n−1
!j
z
z X
sj
sn + 1 −
.
z0 j=0
z0
sn → 0 konvergiert die Reihe auf der rechten Seite, und wir erhalten
P(z) =
∞
X
j=0
Andererseits ist folgt aus
P∞
a jz j = 1 −
j=0 ζ
j
=
1
1−ζ
s= 1−
! ∞
!j
z X
z
sj
, |z| < R.
z0 j=0
z0
für |ζ| < 1, dass
! ∞
!j
z X z
s
.
z0 j=0 z0
Für |z| < R und N ∈ N folgt
!j !j
N
∞
z X
z
z
z X
|P(z) − s| ≤ 1 − |s − s j |
|s − s j |
+ 1 − z0 j=0
z0
z0 j=N+1
z0
6.11. ABELSCHER GRENZWERTSATZ
173
Ist nun ǫ > 0 und N fest und so groß, dass |s − s j | < ǫ, j > N, so ist das kleiner oder
gleich
!j
X
1 − z N
z
z
1 − z 0 .
|s − s j |
+ǫ
(6.17)
z0 j=0
z0
1 − zz0 Ist z = tz0 , t ∈ (0, 1), so sieht man, dass es ein t0 ∈ (0, 1) gibt, sodass für t > t0 dieser
Ausdruck kleiner oder gleich 2ǫ ist. Da ǫ > 0 beliebig war, gilt (6.16).
❑
6.11.2 Bemerkung. Mit einer etwas feiner Argumentationsweise lässt sich (6.16) folgendermaßen verallgemeinern.
Nähert sich z nichttangentiell dem Punkt z0 an, so konvergiert P(z) gegen s. Das
bedeutet: Ist Nα , 0 < α < π der Winkelraum
Nα = {reiβ ∈ C : r > 0, β ∈ [−α, α]},
Im
C
α
Re
α
Abbildung 6.20: Winkelraum Nα
so gilt
lim
τ∈Nα , τ→0
P((1 − τ)z0 ) = s.
(6.18)
Um das einzusehen, bemerke man zunächst, dass für τ = reiβ ∈ Nα mit r = |τ| ≤ cos α
(für die Funktion cos siehe den nächsten Abschnitt)
2
|τ|(1 + |1 − τ|)
2
2
|τ|
≤
=
≤
≤
.
1 − |1 − τ|
2 cos β − r 2 cos α − r cos α
1 − |(1 − τ)|2
Nun folgt man dem Beweis von Satz 6.11.1 bis (6.17). Dann folgt mit z = (1−τ)z0 , |τ| ≤
cos α, τ ∈ Nα
!j
N
z
2
z X
|s − s j |
.
+ǫ
|P(z) − s| ≤ 1 − z0 j=0
z0
cos α
Für |τ| → 0 konvergiert der erste Summand gegen Null. Also gibt es ein t0 ∈ (0, cos α),
sodass |P(z) − s| ≤ ǫ cos3 α , wenn nur |τ| ≤ t0 , τ ∈ Nα .
Da ǫ beliebig war, folgt (6.18).
174
KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN
Kapitel 7
Differentialrechnung
Bewegt sich etwa ein Punkt, und bezeichnet s(t) den zum Zeitpunkt t zurückgelegten
Weg, so erhält man die Geschwindigkeit zum Zeitpunkt t, indem man
s(t + h) − s(t)
h
betrachtet, und h immer kleiner macht. Um derlei Betrachtungen, die in den Naturwissenschaften eine wichtige Rolle spielen, einen mathematisch exakten Hintergrund zu
geben, wollen wir den Begriff der Ableitung einführen.
7.1 Begriff der Ableitung
7.1.1 Definition. Sei f : (a, b) → R (C) und sei x ∈ (a, b). Dann heißt f differenzierbar
im Punkt x, falls der Grenzwert
lim
t→x
f (t) − f (x)
∈ R (C)
t−x
existiert. Dieser heißt dann die Ableitung von f an der Stelle x, und man schreibt dafür
f ′ (x) oder ddtf (x).
Ist f zumindest auf [a, b) definiert1 , und existiert
lim
t→a+
f (t) − f (a)
∈ R (C),
t−a
so spricht man von rechtsseitiger Differenzierbarkeit im Punkt a und schreibt f ′ (a)+
dafür.
Entsprechend definiert man die linksseitige Differenzierbarkeit im Punkt b und die
linksseitige Ableitung f ′ (b)− .
Anschaulich ist die Ableitung f ′ (x) gerade die Steigung der Tangente (in der folgenden Grafik als durchgehende Gerade gezeichnet) am Punkt (x, f (x)). Diese Steigung der Tangente erhält man als Grenzwert der Steigungen der Verbindungsgeraden
von (x, f (x)) und (t, f (t)) (als strichlierte Gerade gezeichnet) für t → x.
7.1.2 Fakta.
1 Klarerweise
könnte f sogar auf einer noch größeren Menge definiert sein.
175
KAPITEL 7. DIFFERENTIALRECHNUNG
176
f
Steigung =
f (t)− f (x)
t−x
Steigung = f ′ (x)
t′′
x
t′
t
Abbildung 7.1: Ableitung als Grenzwert der Differenzenquotienten
1. Wie in Fakta 5.5.6 bemerkt, existiert ein Grenzwert limt→x h(t) genau dann, wenn
die beiden einseitigen Grenzwerte limt→x− h(t) und limt→x+ h(t) existieren und
übereinstimmen.
Also ist f bei x ∈ (a, b) genau dann differenzierbar, wenn f bei x links- und
rechtsseitig differenzierbar ist und f ′ (x)− und f ′ (x)+ übereinstimmen. In diesem
Fall ist f ′ (x)− = f ′ (x) = f ′ (x)+ .
2. Da nach Lemma 5.3.7 genau dann y = limt→x h(t), wenn für jede gegen x konvergente Folge (tn )n∈N mit tn , x, n ∈ N, folgt, dass h(tn ) → y, ist f bei x genau
dann differenzierbar mit Ableitung f ′ (x), wenn für jede solche Folge
f ′ (x) = lim
n→∞
f (tn ) − f (x)
.
tn − x
Entsprechend lassen sich die einseitigen Ableitungen charakterisieren.
3. Entweder aus der letzten Behauptung oder aus (5.6) folgt, dass die Ableitung
f ′ (x) im Falle ihrer Existenz nur vom Aussehen von f lokal bei x, also von
f |(x−δ,x+δ) für jedes δ > 0, abhängt. Entsprechendes gilt für einseitige Ableitungen.
4. Wegen (5.11) ist eine Funktion f : (a, b) → C genau dann differenzierbar bei
x ∈ (a, b), wenn Re f, Im f : (a, b) → R es sind, wobei
f ′ (x) = (Re f )′ (x) + i(Im f )′ (x).
Entsprechendes gilt für einseitige Ableitungen.
(7.1)
7.1. BEGRIFF DER ABLEITUNG
177
Man kann auch die Differenzierbarkeit von R p -wertigen Funktionen f definieren.
Dabei wird es sich herausstellen, dass dass solche Funktionen genau dann differenzierbar sind, wenn alle Komponentenfunktionen π j ◦ f differenzierbar sind. Siehe die
Analysis 2 Vorlesung.
7.1.3 Bemerkung. Ist f definiert auf einer offenen Teilmenge der komplexen Zahlen
f (w)
beund bildet wieder in C hinein ab, so kann man analog f ′ (w) := limz→w f (z)−
z−w
trachten. Existiert dieser Grenzwert, so heißt f in w komplex differenzierbar. Wir wollen das hier aber nicht weiter verfolgen, denn dies führt zur Theorie der komplexen
Analysis, die in einer eigenen Vorlesung behandelt wird.
7.1.4 Beispiel.
(i) Für jedes λ ∈ R (C) ist die konstante Funktion f (t) = λ, t ∈ (−∞, +∞), an jeder
Stelle x differenzierbar, und ihre Ableitung im Punkt x ist gleich 0.
(ii) Die reellwertige Funktion t 7→ f (t) = tn , n ∈ N für t ∈ (−∞, +∞) ist auch an
jedem Punkt x differenzierbar mit der Ableitung
lim
t→x
(t − x)(tn−1 + tn−2 x + . . . + txn−2 + tn−1 )
t n − xn
= lim
= nxn−1 .
t→x
t−x
t−x
(iii) Die stetige Funktion

1


t sin t
f (t) = 

0
, falls t , 0
, falls t = 0
(7.2)
ist im Punkt x = 0 nicht differenzierbar. Denn es gilt
t sin 1t − 0
1
f (t) − f (0)
=
= sin .
t−0
t−0
t
P
n
(iv) Sei f (z) = ∞
n=0 an z eine Potenzreihe mit Konvergenzradius R > 0. Für die
Einschränkung f |(−R,R) : (−R, R) → C gilt
lim
t→0
∞
X
f (t) − f (0)
= lim
an tn−1 .
t→0
t
n=1
P
n
Diese Potenzreihe rechts konvergiert genau dann, wenn ∞
n=0 an t es tut und hat
somit auch Konvergenzradius R. Sie ist daher stetig in t. Also ist obiger Limes
gleich a1 . Später werden wir f ′ (x) für alle x ∈ (−R, R) berechnen.
(v) Für ein festes w ∈ C gilt
lim
t→x
exp(wt) − exp(wx)
exp(w(t − x)) − 1
= exp(wx) lim
=
t→x
t−x
t−x
exp(wτ) − 1
= w exp(wx),
τ
wobei die letzte Gleichheit aus (iv) folgt, da der Koeffizient a1 in der Potenzreihe
P wn n
exp(wτ) = ∞
n=0 n! τ eben w ist.
exp(wx) lim
τ→0
Setzt man w = 1, so folgt exp′ (x) = exp(x).
KAPITEL 7. DIFFERENTIALRECHNUNG
178
(vi) Als weitere Anwendung der Rechnung im letzten Beispiel berechnen wir
Im exp(it) − Im exp(ix)
sin(it) − sin(ix)
= lim
=
t→x
t−x
t−x
!
exp(it) − exp(ix)
Im lim
= Im(i exp(ix)) = Re(exp(ix)) = cos(x).
t→x
t−x
sin′ (x) = lim
t→x
Dabei haben wir die Stetigkeit von z 7→ Im z verwendet. Genauso erhält man
cos′ (x) = − sin(x).
(vii) Für t ∈ R betrachte die Funktion f
t2



t2 sin 1t
f (t) = 

0
, falls t , 0
, falls t = 0
f (t)
−t2
Die Funktion f ist an der Stelle x = 0 differenzierbar mit Ableitung 0, denn es
gilt
f (t) − f (0)
1
= t sin → 0 für t → 0.
t−0
t
An einer Stelle x , 0 ist f differenzierbar und es gilt wie wir später sehen werden
f ′ (x) = 2x sin
1
1
− cos .
x
x
7.1.5 Lemma. Ist f im Punkt x differenzierbar, so ist sie dort stetig.
Beweis. Aus limt→x
f (t)− f (x)
t−x
= α folgt
"
#
f (t) − f (x)
lim f (t) − f (x) = lim
(t − x) = α · 0 = 0.
t→x
t→x
t−x
❑
7.1.6 Bemerkung. Wie man am Beispiel der Funktion f aus (7.2) sieht, gilt die Umkehrung von Lemma 7.1.5 nicht.
7.1.7 Satz. Seien f, g : (a, b) → R (C) beide differenzierbar im Punkt x ∈ (a, b),
und α, β ∈ R (C). Dann sind auch α f + βg, f g und (falls g(x) , 0) gf an der Stelle x
differenzierbar, und es gilt
(α f + βg)′ (x) = α f ′ (x) + βg′ (x),
( f g)′ (x) = f ′ (x)g(x) + f (x)g′ (x) (Produktregel),
′
′
f (x)g′ (x)
(Quotientenregel).
gf (x) = f (x)g(x)−
g(x)2
7.1. BEGRIFF DER ABLEITUNG
179
Entsprechende Regeln gelten auch für einseitige Ableitungen.
Beweis.
f (t) − f (x)
g(t) − g(x)
(α f + βg)(t) − (α f + βg)(x)
= α lim
+ β lim
.
t→x
t→x
t−x
t−x
t−x
Da f nach Lemma 7.1.5 bei x stetig ist, folgt aus den Rechenregeln für Grenzwerte
(vgl. Abschnitt 5.3)
!
!
f (t) − f (x)
g(t) − g(x)
f (t)g(t) − f (x)g(x)
+ lim
lim
= lim f (t)
g(x) =
t→x
t→x
t→x
t−x
t−x
t−x
lim
t→x
f (t) − f (x)
g(t) − g(x)
+ g(x) lim
= f (x)g′ (x) + f ′ (x)g(x).
t→x
t−x
t−x
Die letzte Quotientenregel folgt ebenfalls aus der Stetigkeit und den Rechenregeln für
Grenzwerte indem man in
f (t)
f (x)
"
#
1
g(t) − g(x)
f (t) − f (x)
g(t) − g(x)
=
− f (x)
g(x)
.
t−x
g(t)g(x)
t−x
t−x
lim f (t) · lim
t→x
t→x
t → x streben lässt.
❑
n
7.1.8 Beispiel. Wir haben schon gesehen, dass f (t) = t für alle n ∈ N differenzierbar
ist mit f ′ (x) = nxn−1 . Um das auch für n ∈ −N zu zeigen verwende man die Quotientenregel:
!′
1
(x|n| )′
n ′
(x ) = |n| = − 2|n| = nx|n|−1−2|n| = nxn−1 .
x
x
Weiters ist eine rationale Funktion in jedem Punkt, wo der Nenner nicht verschwindet,
differenzierbar.
7.1.9 Satz (Kettenregel). Sei f : (a, b) → R reellwertig und g : (c, d) → R (C), sodass
f (a, b) ⊆ (c, d), und x ∈ (a, b).
Ist f bei x und g bei f (x) differenzierbar, so ist g ◦ f bei x differenzierbar, wobei
(g ◦ f )′ (x) = g′ ( f (x)) · f ′ (x).
Beweis. Die vorausgesetzte Differenzierbarkeit von f bei x lässt sich dadurch charakterisieren, dass die reellwertige Funktion definiert auf (a, b) durch
 f (t)− f (x)


, falls t , x
 t−x
φ(t) = 

 f ′ (x)
, falls t = x
bei x stetig ist; vgl. Proposition 6.1.4. Genauso ist ψ : (c, d) → R (C) definiert durch
 g(s)−g( f (x))


, falls s , f (x)
 s− f (x)
ψ(s) = 

g′ ( f (x))
, falls s = f (x)
bei f (x) stetig. Somit gilt für alle t ∈ (a, b) \ {x} – auch für die t mit f (x) = f (t) –
(g ◦ f )(t) − (g ◦ f )(x)
= ψ( f (t)) · φ(t) .
t−x
Wegen Lemma 7.1.5, Lemma 6.1.6 und Korollar 6.1.8 ist dieser Ausdruck in x stetig.
Also gilt (g ◦ f )′ (x) = limt→x ψ( f (t)) · φ(t) = ψ( f (x)) · φ(x) = g′ ( f (x)) · f ′ (x).
❑
KAPITEL 7. DIFFERENTIALRECHNUNG
180
7.1.10 Bemerkung. Es gelten diverse einseitige Varianten von Satz 7.1.9, deren
Beweise fast gleich verlaufen:
Ist f : (a, b) → (c, d], g : (c, d] → R (C), x ∈ (a, b), f (x) = d sowie f bei x differenzierbar und g bei f (x) = d linksseitig differenzierbar, so folgt (g ◦ f )′ (x) = g′ ( f (x))− · f ′ (x).
Ist f : [a, b) → (c, d), g : (c, d) → R (C), sowie f bei a rechtsseitig differenzierbar und
g bei f (a) differenzierbar, so folgt (g ◦ f )′ (a)+ = g′ ( f (a)) · f ′ (a)+ .
usw. .
7.1.11 Beispiel. Sei f (x) = x2 sin 1x , x , 0 wie in Beispiel 7.1.4, (vii). Durch Anwendung der Produkt und der Kettenregel ergibt sich (x , 0)
!′
!
!′
1
1
1
1
1
1
1
′
2 ′
2
2
f (x) = (x ) sin + x sin
= 2x · sin + x · cos
= 2x · sin − cos .
·
x
x
x
x
x
x
x
7.1.12 Satz. Sei f : (a, b) → (c, d) bijektiv und streng monoton, und bezeichne mit
g : (c, d) → (a, b) ihre Umkehrfunktion. Ist f an einer Stelle x differenzierbar und gilt
f ′ (x) , 0, so ist g an der Stelle f (x) differenzierbar, und es gilt
g′ ( f (x)) =
1
f ′ (x)
.
Beweis. Wegen Korollar 6.5.3 sind f und g beide stetig. Ist daher (tn )n∈N eine gegen
f (x) konvergente Folge aus (c, d) \ { f (x)}, so ist g(tn ) n∈N eine gegen x = g( f (x))
konvergente Folge aus (a, b) \ {x}. Mit τn := g(tn ) folgt
lim
n→∞
g(tn ) − x
g(tn ) − g( f (x))
1
1
= lim
= ′ .
=
f (τn )− f (x)
n→∞ f g(tn ) − f (x)
tn − f (x)
f
(x)
limn→∞ τn −x
❑
Auch bei obigem Satz gelten entsprechende Aussagen für einseitige Ableitungen,
wenn f und damit auch g an einem/beiden der Ränder definiert ist.
7.1.13 Beispiel. Betrachte die reelle Exponentialfunktion exp : R → R+ . Diese ist
stetig und bijektiv. Ihre Umkehrfunktion ist ln : R+ → R. Für ein festes y ∈ R+ und das
entsprechende x ∈ R mit y = exp(x) folgt
ln′ (y) = ln′ ( f (x)) =
1
1
1
1
=
=
= .
exp′ (x) exp(x) exp(ln(y)) y
7.1.14 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem
Intervall I ⊆ R. Ist f an allen x ∈ I differenzierbar, wobei im Falle, dass x der linke
bzw. rechte Intervallrand von I ist und dieser in I liegt, die rechts- bzw. linksseitige
Differenzierbarkeit gemeint ist, so nennt man die Funktion
(
I → R (C)
′
f :
x 7→ f ′ (x)
Ableitung von f auf I. Ist x der linke bzw. rechte Intervallrand von I und liegt dieser in
I, so ist unter f ′ (x) die rechts- bzw. linksseitige Ableitung an der Stelle x zu verstehen.
7.1. BEGRIFF DER ABLEITUNG
181
Einer Funktion f wird also eine weitere Funktion zugeordnet, die die aus f abgeleitete Funktion f ′ genannt wird. Ihr Wert an einer Stelle x ist gerade der Limes
des Differenzenquotienten von f bei x. Diese Sichtweise erklärt auch die Schreibweise
f ′ (x) aus Definition 7.1.1. Die Schreibweise ddtf (x) erklärt sich aus der Interpretation
der Ableitung als Grenzfall des Zuwachses von f dividiert durch den Zuwachs von t.
Es ist also sinnvoll von Eigenschaften der Funktion f ′ , wie zum Beispiel Stetigkeit oder auch wieder Differenzierbarkeit zu sprechen. Wie wir in Beispiel 7.1.4, (vii),
gesehen haben, muss die Ableitung f ′ nicht notwendigerweise stetig sein.
7.1.15 Definition.
Sei f eine reell- oder komplexwertige Funktion definiert auf einem Intervall I ⊆
R, sodass die Ableitung f ′ von f auf ganz I existiert. Ist die Ableitung f ′ an
einer Stelle x differenzierbar, so bezeichnet man ( f ′ )′ (x) mit f ′′ (x) und spricht
von der zweiten Ableitung von f an der Stelle x. Im Falle, dass x Intervallrand
ist, so sei wieder die entsprechende einseitige Ableitung gemeint.
Allgemeiner definiert man höhere Ableitungen rekursiv durch
f (n) (x) := ( f (n−1) )′ (x), n ∈ N,
wann immer f (n−1) auf I definiert ist und bei x differenzierbar ist. Die Funktion
f heißt bei x dann n-mal differenzierbar.
Existiert f (n) an allen Stellen x ∈ I und ist f (n) stetig auf I, so spricht man von
einer n-mal stetig differenzierbaren Funktion. Die Menge aller n-mal stetig differenzierbaren Funktionen auf I wird mit C n (I) bezeichnet.
Für n = 0 steht C 0 (I) oder auch C(I) für die Menge aller stetigen reell- oder
komplexwertigen Funktion definiert auf dem Intervall I.
Mit f ∈ C ∞ (I) wollen wir zum Ausdruck bringen, dass f auf I beliebig oft
differenzierbar ist.
Aus der Produktregel erhält man mittels vollständiger Induktion die oft nützliche
Formel
!
n
X
n (k) (n−k)
f g
.
( f g)(n) =
k
k=0
7.1.16 Beispiel.
Sei f (x) = x3 − 2x. Dann gilt
f ′ (x) = 3x2 − 2, f ′′ (x) = 6x, f ′′′ (x) = 6, f ′′′′ (x) = 0, f (5) (x) = 0, . . .
Man sieht genauso, dass jedes Polynom p beliebig oft differenzierbar ist und
wenn n der Grad von p ist, p(n+1) (x) = p(n+2) (x) = . . . = 0 gilt.
Sei f die Funktion



 x2
f (x) = 

−x2
, falls x ≥ 0
, falls x < 0
Die Ableitung von f ist f ′ (x) = |x|. Die zweite Ableitung existiert also an der
Stelle x = 0 nicht.
KAPITEL 7. DIFFERENTIALRECHNUNG
182
7.2 Mittelwertsätze
7.2.1 Definition. Sei hX, dX i ein metrischer Raum, E ⊆ X und sei f : E → R. Man
sagt f hat ein lokales Maximum in einem Punkt x ∈ E, falls
∃ δ > 0 : f (x) ≥ f (t) für t ∈ E ∩ Uδ (x).
Analog definiert man ein lokales Minimum. Will man sich nicht festlegen, ob x ein
Minimum oder Maximum ist, so spricht man zusammenfassend von einem lokalen
Extremum.
Man beachte den Unterschied zum Begriff des Maximums. Das ist eine Stelle x ∈
E, sodass für jedes t ∈ E gilt f (x) ≥ f (t), also nicht nur lokal bei x sondern global.
Man spricht dann von einem absoluten Maximum. Analog für absolute Minima bzw.
zusammenfassend absolute Extrema. Natürlich ist ein absolutes Extremum stets auch
ein lokales.
7.2.2 Satz. Hat f : (a, b) → R an einer Stelle x ∈ (a, b) ein lokales Extremum und ist
f bei x differenzierbar, so muss f ′ (x) = 0.
Beweis. Wir nehmen an, dass x ein lokales Maximum ist. Den Fall eines lokalen Minimums behandelt man analog.
Wähle δ > 0 wie in Definition 7.2.1. Es gilt also f (x) ≥ f (t) für alle |t − x| < δ. Im
Falle t > x gilt somit
f (t) − f (x)
≤ 0,
t−x
und daher f ′ (x) = limt→x+
f (t)− f (x)
t−x
≤ 0. Ist jedoch t < x, so impliziert f (x) ≥ f (t)
f (t) − f (x)
≥ 0.
t−x
Also muss auch f ′ (x) = limt→x−
f (t)− f (x)
t−x
≥ 0.
❑
Geometrisch bedeutet Satz 7.2.2, dass an
einem lokalen Extremum die Tangente
an die Kurve y = f (x), falls eine solche
existiert, waagrecht liegen muss.
7.2.3 Korollar (Satz von Rolle). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar.
Gilt f (a) = f (b) = 0, so gibt es ein ζ ∈ (a, b), sodass f ′ (ζ) = 0.
Beweis. Aus Korollar 6.1.14 wissen wir, dass f auf [a, b] ein Maximum und ein Minimum besitzt. Also gibt es x− , x+ ∈ [a, b], sodass
f (x− ) ≤ f (t) ≤ f (x+ ), für alle t ∈ [a, b].
7.2. MITTELWERTSÄTZE
183
Sind beide x− und x+ Randpunkte, d.h. x− , x+ ∈ {a, b}, so muss f (t) = 0 für alle
t ∈ [a, b] und daher f ′ (t) = 0 für alle t ∈ (a, b) sein.
Ist x− in (a, b) enthalten, so muss nach Satz 7.2.2 f ′ (x− ) = 0. Im Falle x+ ∈ (a, b)
schließt man genauso.
❑
a
ζ
b
Abbildung 7.2: Satz von Rolle
7.2.4 Korollar. Sei f : [a, b] → R stetig und n-mal differenzierbar auf (a, b). Weiters
habe f mindestens n + 1 Nullstellen in [a, b]. Dann existiert ξ ∈ (a, b) mit f (n) (ξ) = 0.
Beweis. Der Fall n = 1 folgt sofort aus Korollar 7.2.3. Angenommen der Satz gelte für
n − 1. Wir zeigen ihn für n.
Nach Korollar 7.2.3 liegt zwischen je zwei Nullstellen von f mindestens eine
Nullstelle von f ′ . Also hat f ′ mindestens n Nullstellen. Nach Induktionsvoraussetzung
existiert ein ξ mit f (n) (ξ) = ( f ′ )(n−1) (ξ) = 0.
❑
7.2.5 Beispiel. Wir wollen zeigen, dass die Gleichung
(1 − ln x)2 = x(3 − 2 ln x)
in (0, +∞) genau zwei Lösungen hat. Dazu betrachten wir die Funktion
f : (0, +∞) → R,
f (x) = (1 − ln x)2 − x(3 − 2 ln x).
Für diese gilt es zu zeigen, dass f genau zwei Nullstellen hat. Setzt man x = 1, so folgt
f (1) = −2 < 0. Andererseits folgt wegen lim x→0+ x(3 − 2 ln x) = 0
lim f (x) = +∞.
x→0+
Wegen f (x) ≥ x(2 ln x − 3) ≥ x für x ≥ exp(2) folgt auch
lim f (x) = +∞.
x→+∞
Insbesondere gibt es ξ, η ∈ R mit 0 < ξ < 1 < η < +∞, sodass f (ξ) > 0, f (η) > 0.
Nach dem Zwischenwertsatz muss es einen Punkt α ∈ (ξ, 1) und einen Punkt β ∈ (1, η)
geben, sodass f (α) = 0 = f (β). Also hat f mindestens zwei Nullstellen.
Um zu zeigen, dass es nicht mehr sein können, berechnen wir
1
ln x − 1 2 4 − 2 ln x + 2x
1
f ′ (x) = 2(ln x − 1) + 2 ln x − 1, f ′′ (x) = 2 2 − 2
+ =
.
x
x
x2
x
x2
Für x ∈ (0, 1] ist ln x ≤ 0 und somit f ′′ (x) > 0. Für x ∈ (1, +∞) gilt wegen x > ln x auch
f ′′ (x) > 0. Also hat f ′′ keine Nullstelle. Nach dem Satz von Rolle kann f ′ höchstens
eine und weiter f höchstens zwei Nullstellen haben (vgl. Korollar 7.2.4).
KAPITEL 7. DIFFERENTIALRECHNUNG
184
7.2.6 Satz (Mittelwertsatz). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar.
Dann existiert ein Punkt ζ ∈ (a, b) mit
f (b) − f (a)
= f ′ (ζ).
b−a
Beweis. Betrachte die Funktion F : [a, b] → R
F(t) := f (t) − f (a) −
f (b) − f (a)
(t − a).
b−a
Dann ist F auf [a, b] stetig (vgl. Korollar 6.1.8) und auf (a, b) differenzierbar (vgl.
Beispiel 7.1.4, (i), (ii) und Satz 7.1.7), wobei F(a) = F(b) = 0 und für x ∈ (a, b)
F ′ (x) = f ′ (x) −
f (b) − f (a)
.
b−a
Wenden wir Korollar 7.2.3 an, so folgt sofort die Behauptung.
❑
Für g(t) = t ist Satz 7.2.6 ein Spezialfall folgender Verallgemeinerung.
7.2.7 Satz (Verallgemeinerter Mittelwertsatz). Seien f, g : [a, b] → R stetig und differenzierbar auf (a, b). Weiters gelte g′ (t) , 0 für alle t ∈ (a, b). Dann existiert eine Stelle
ζ ∈ (a, b) mit
f ′ (ζ)
f (b) − f (a)
= ′ .
(7.3)
g(b) − g(a)
g (ζ)
Beweis. Zunächst existiert nach Satz 7.2.6 ein x ∈ (a, b) mit g(b) − g(a) = g′ (x)(b − a),
woraus wir g(b) − g(a) , 0 schließen. Somit ist die Funktion F : [a, b] → R,
F(t) = f (t) − f (a) −
f (b) − f (a)
(g(t) − g(a)),
g(b) − g(a)
wohldefiniert, stetig und auf (a, b) differenzierbar, wobei
F ′ (t) = f ′ (t) −
f (b) − f (a) ′
g (t).
g(b) − g(a)
Weiters gilt F(a) = F(b) = 0. Somit gibt es nach Korollar 7.2.3 ein ζ ∈ (a, b) mit
F ′ (ζ) = 0, und daher (7.3).
❑
7.2.8 Bemerkung. Satz 7.2.6, welcher auch 1. Mittelwertsatz der Differentialrechnung
genannt wird, besagt, dass man – falls durchwegs Tangenten existieren – stets eine
Tangente findet, welche parallel zur Sekante durch die Punkte (a, f (a)) und (b, f (b))
liegt.
Die Stelle ζ aus Satz 7.2.6, an der die Steigung der Kurve gleich der mittleren
Steigung im Intervall [a, b] ist, ist nicht eindeutig bestimmt.
Satz 7.2.7 heißt auch 2. Mittelwertsatz der Differentialrechnung.
Obwohl man es auf den ersten Blick nicht sieht, so hat der Mittelwertsatz doch
weitreichende Folgerungen.
7.2. MITTELWERTSÄTZE
185
f (b)
f (a)
a
ζ
b
Abbildung 7.3: Mittelwertsatz
7.2.9 Korollar. Sei I ⊆ R ein Intervall und f : I → R stetig. Sind a, b die Intervallränder von I, so sei f auf (a, b) differenzierbar. Dann gilt:
Ist f ′ (x) ≥ 0 (> 0), für alle x ∈ (a, b), so ist f (streng) monoton wachsend.
Ist f ′ (x) ≤ 0 (< 0), für alle x ∈ (a, b), so ist f (streng) monoton fallend.
Ist f ′ (x) = 0, für alle x ∈ (a, b), so ist f konstant.
Bezüglich der Umkehrung gilt nur, dass, wenn f monoton wachsend (fallend) ist,
für ihre Ableitung immer f ′ (x) ≥ 0 (≤ 0) gilt.
Beweis. Seien x1 , x2 ∈ I, x1 < x2 . Dann existiert eine Stelle x ∈ (x1 , x2 ) mit
f (x2 ) − f (x1 ) = (x2 − x1 ) f ′ (x).
Daraus folgt unmittelbar das behauptete Monotonieverhalten.
Ist umgekehrt f monoton wachsend (fallend), so gilt für den Differenzenquotient
für alle x, t ∈ (a, b)
f (t) − f (x)
≥ 0 (≤ 0).
t−x
Für t → x folgt f ′ (x) ≥ 0 (≤ 0).
❑
7.2.10 Beispiel. Dass aus der strengen Monotonie einer Funktion f nicht notwendigerweise f ′ (x) > 0 bzw. f ′ (x) < 0 für alle x folgt, sieht man anhand eines einfachen
Beispiels.
Die Funktion f (x) = x3 ist auf R streng monoton wachsend. Ihre Ableitung f ′ (x) =
3x2 ist nur ≥ 0, aber nicht > 0 für alle x ∈ R.
7.2.11 Bemerkung. Der Schluss f ′ (x) ≡ 0 ⇒ f ≡ c für ein festes c gilt auch für komplexwertige Funktionen. Das sieht man leicht, indem man f in Real- und Imaginärteil
aufspaltet; vgl. (7.1).
KAPITEL 7. DIFFERENTIALRECHNUNG
186
Obwohl die Ableitung f ′ einer auf einem Intervall (a, b) differenzierbaren Funktion
nicht notwendig stetig sein muss, so gilt trotzdem stets die Zwischenwerteigenschaft.
7.2.12 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b und f : I →
R differenzierbar. Sind x1 , x2 ∈ I und c ∈ R mit f ′ (x1 ) < c < f ′ (x2 ), dann existiert eine
Stelle x ∈ (min(x1 , x2 ), max(x1 , x2 )) mit f ′ (x) = c.
Ist f ′ (x) , 0 für alle x ∈ I, so gilt entweder immer f ′ (x) > 0, x ∈ I, oder immer f ′ (x) < 0, x ∈ I. Sie sind daher entweder streng monoton wachsend oder streng
monoton fallend.
Beweis. Wir nehmen zunächst x1 < x2 an. Betrachte die Funktion g : I → R, g(t) =
f (t) − ct. Für ihre Ableitung gilt
g′ (x1 ) = f ′ (x1 ) − c < 0, g′ (x2 ) = f ′ (x2 ) − c > 0.
Sei x ∈ [x1 , x2 ] eine Stelle, an der g ihr Minimum annimmt. Wegen Satz 7.2.2 und
g′ (x) = f ′ (x) − c, genügt es x , x1 , x2 zu zeigen. Wegen g′ (x1 ) < 0 existiert ein δ > 0
mit
g(t) − g(x1 )
< 0, x1 < t < x1 + δ.
t − x1
Also muss g(t) < g(x1 ) für solche Werte von t. Der Punkt x1 scheidet als Kandidat für
das Minimum also aus. Wegen g′ (x2 ) > 0 folgt die Existenz eines δ > 0, sodass
g(t) − g(x2 )
> 0, x2 − δ < t < x2 .
t − x2
Also ist g(t) < g(x2 ) für solche t, und der Punkt x2 kommt daher auch nicht in Frage.
Den Fall x1 > x2 führt man durch die Betrachtung von − f auf obigen Fall zurück.
Die letzte Aussage folgt sofort aus der eben bewiesenen Zwischenwerteigenschaft.
❑
7.2.13 Korollar. Sei f differenzierbar auf (a, b). Dann hat f ′ keine Sprungstelle in (a, b).
Beweis. An einer Sprungstelle existieren f ′ (x+) := limt→x+ f ′ (t) und f ′ (x−) := limt→x− f ′ (t), es sind jedoch nicht beide
gleich f ′ (x). Angenommen es ist f ′ (x+) < f ′ (x), also f ′ (x+) + ǫ ≤ f ′ (x) für ein ǫ > 0. Also gilt
f ′ (t) +
ǫ
≤ f ′ (x), für alle t ∈ (x, t0 ],
2
für ein t0 > x. Also nimmt f ′ (t) für x < t < t0 keine Werte in ( f ′ (x) − 2ǫ , f ′ (x))
obiger Zwischenwerteigenschaft.
⊆ ( f ′ (t0 ), f ′ (x)) an. Das widerspricht
❑
Wir werden nun Satz 7.2.7 verwenden, um eine sehr nützliche Methode herzuleiten,
Limiten zu berechnen.
7.2.14 Satz (Regel von de L’Hospital2 ). Seien f, g : (a, b) → R differenzierbar auf
(a, b), wobei a, b, ∈ R ∪ {±∞}, −∞ ≤ a < b ≤ +∞. Für x ∈ (a, b) hinreichend nahe bei
a gelte g′ (x) , 0, und
lim f (x) = lim g(x) = 0,
(7.4)
x→a+
x→a+
oder
lim g(x) = +∞.
x→a+
2 Guillaume
Francois L’Hospital, Marquis de Saint-Mesme, geb.1661 Paris, gest.3.2.1704 Paris
(7.5)
7.2. MITTELWERTSÄTZE
Dann gilt
lim
x→a+
187
f (x)
f ′ (x)
= A ⇒ lim
= A,
x→a+ g(x)
g′ (x)
(7.6)
mit A ∈ R ∪ {±∞}.
Die analoge Aussage ist richtig, wenn man überall x → a+ durch x → b− oder in
(7.5) +∞ durch −∞ ersetzt.
Beweis.
Da die Grenzwerte in (7.6) nur von den Funktionswerten lokal bei x abhängen
(vgl. (5.6)), können wir b nötigenfalls kleiner machen, sodass g′ (x) , 0 auf ganz
(a, b). Damit kann g auf (a, b) höchstens eine Nullstelle haben, da sonst nach
Korollar 7.2.3 g′ (ζ) = 0 für ein ζ ∈ (a, b). Machen wir b nötigenfalls nochmals
kleiner, so können wir auch g(x) , 0 auf ganz (a, b) annehmen.
Gilt (7.5), so muss wegen dem Zwischenwertsatz, Korollar 6.2.6, g(x) > 0 für
alle x ∈ (a, b) gelten. Außerdem hat nach Korollar 7.2.12 g′ (x) immer das selbe
Vorzeichen. Wegen (7.5) gibt es aber sicher a < s < t < b mit g(s) > g(t). Mit
dem Mittelwertsatz Satz 7.2.6 folgt daraus g′ (x) < 0 für ein und daher für alle
x ∈ (a, b). Also ist g unter der Voraussetzung (7.5) auf ganz (a, b) streng monoton
fallend.
Sei α ∈ R, α > A, und wähle r ∈ R mit A < r < α. Wegen limt→a+
existiert ein c ∈ (a, b) mit
f ′ (t)
g′ (t)
=A
f ′ (t)
< r für t ∈ (a, c).
g′ (t)
Sind dann x, y ∈ (a, c), x < y beliebig, so folgt aus Satz 7.2.7
f ′ (t)
f (x) − f (y)
= ′
< r,
g(x) − g(y)
g (t)
(7.7)
für ein t ∈ (x, y) ⊆ (a, c).
Ist die Bedingung (7.4) erfüllt, so lässt man in obiger Beziehung x gegen a streben und erhält
f (y)
≤ r < α für y ∈ (a, c).
g(y)
Ist nun Bedingung (7.5) ist erfüllt, so halte man y in (7.7) fest. Da g auf (a, b)
streng monoton fällt und g(x) > 0, folgt
!
f (y)
f ′ (t) g(x) − g(y) f (y)
g(y)
f (x)
+
= ′
+
<r 1−
, x ∈ (a, c).
g(x) g (t)
g(x)
g(x)
g(x)
g(x)
Lässt man hier x → a+ streben, so konvergiert die rechte Seite gegen r (> α).
Also folgt die Existenz eines d ∈ (a, c), sodass
f (x)
< α, a < x < d.
g(x)
Wir haben also unter jeder der Voraussetzungen (7.4) und (7.5) nachgewiesen,
dass für ein gewisses ρ ∈ (a, b)
f (t)
< α, wenn nur t ∈ (a, ρ).
g(t)
KAPITEL 7. DIFFERENTIALRECHNUNG
188
Wendet man das auf − f und −A statt f und A an, so sieht man, dass es auch zu
jedem β ∈ R, β < A ein ρ ∈ (a, b) gibt, sodass
f (t)
> β, wenn nur t ∈ (a, ρ).
g(t)
Somit folgt lim x→a+
f (x)
g(x)
= A (vgl. (5.12)).
❑
7.2.15 Bemerkung. Indem man eine Funktion f : [a, b] → C in Real- und Imaginärteil
zerlegt, folgt sofort die Gültigkeit der Regel von de L’Hospital auch wenn f komplexwertig ist (vgl. (7.1)). Die Funktion g muss aber reellwertig sein.
7.2.16 Beispiel.
(i)
1
x
x→0+ − 12
x
lim x ln x = lim
x→0+
= 0.
(ii) Um lim x→0+ x x zu bestimmen, sei zunächst bemerkt, dass x x = exp(x ln x) für
x > 0. Aus dem vorherigen Beispiel und wegen der Stetigkeit von exp gilt nun
lim x x = lim exp(x ln x) = exp( lim x ln x) = exp(0) = 1 .
x→0+
x→0+
x→0+
1
(iii) Weil ( n1 n )n∈N eine Teilfolge3 des Netzes (x x ) x∈(0,+∞) ist, wobei (0, +∞) so gerichtet ist, dass x1 x2 ⇔ x1 ≥ x2 , folgt aus dem letzten Beispiel, dass
1
lim
n→∞ n
! 1n
= 1.
Diese Tatsache folgt offenbar auch aus limn→∞
(iv)
√n
n = 1; vgl. Beispiel 3.3.7.
sin x
cos x
(sin x)′
= lim
= lim
= 1.
x→0+ x
x→0+ 1
x→0+
x′
lim
Genauso sieht man lim x→0−
sin x
x
= 1.
(v) Man betrachte den Grenzwert
1
1
− 2
lim
x→0 (sin x)2
x
!
Dieser Ausdruck ist von der Form ∞ − ∞. Wir rechnen
!
1
x2 − (sin x)2
1
=
−
.
2
2
(sin x)
x
(x sin x)2
3 Siehe
Definition 5.3.6!
(7.8)
7.2. MITTELWERTSÄTZE
189
Für x → 0 ist dieser Ausdruck von der Form 00 . Also stimmt der Grenzwert in
(7.8) nach der Regel von de L’Hospital angewandt auf den rechtsseitigen Grenzwert und den linksseitigen Grenzwert mit
2x − sin(2x)
2x − 2 sin x cos x
= lim
2
2
x→0 2x(sin x)2 + x2 sin(2x)
x→0 2x(sin x) + 2x sin x cos x
lim
überein, falls letzterer existiert. Wenden wir die Regel von de L’Hospital nochmals beidseitig an, so erhalten wir (wieder falls der rechte Limes existiert)
lim
x→0
2 − 2 cos(2x)
1 − cos(2x)
= lim
.
2(sin x)2 + 4x sin(2x) + 2x2 cos(2x) x→0 (sin x)2 + 2x sin(2x) + x2 cos(2x)
Dieser Ausdruck ist wieder von der Form 00 . Wir müssten die Regel von de
L’Hospital noch zweimal anwenden, um zu einem Ergebnis zu kommen. Etwas
einfach ist es, diesen Grenzwert als
1 − cos(2x)
x2
·
lim
=
x→0
x→0 (sin x)2 + 2x sin(2x) + x2 cos(2x)
x2
lim
lim
x→0
1 − cos(2x)
1
· lim x→0 sin x 2
sin(2x)
x2
+ 4 2x + cos(2x)
x
zu schreiben. Zweimal de L’Hospital (jeweils für den links- und rechtsseitigen
= 2, und wegen lim x→0 sinx x = 1 gilt
Grenzwert) liefert lim x→0 1−cos(2x)
x2
lim x→0
sin x 2
x
1
+
4 sin(2x)
2x
=
+ cos(2x)
1
1
= .
1+4+1 6
Also ist (7.8) genau 31 .
(vi) Eine andere Möglichkeit den Grenzwert (7.8) zu berechnen, besteht darin, die
Potenzreihenentwicklung von sin x um 0 zu verwenden:
!
!
sin x
1 − ( sinx x )2
1
1
sin x 1 − x
·
=
−
=
1
+
=
x
(sin x)2 x2
(sin x)2
(sin x)2
P∞ (−1)n x2n
!
! P∞ (−1)n−1 x2n
sin x 1 − n=0 (2n+1)!
sin x
n=1 (2n+1)!
· P
· P
1+
= 1+
.
2
n
2n+1
x
x
∞ (−1) x
∞ (−1)n x2n+1 2
n=0
n=0
(2n+1)!
(2n+1)!
2
Oben und unten durch x dividieren ergibt
! P∞ (−1)n x2n
sin x
n=0 (2n+3)!
· P
1+
.
x
∞ (−1)n x2n 2
n=0 (2n+1)!
Man beachte, dass alle hier auftretenden Potenzreihen Konvergenzradius +∞ haben. Somit stehen in Zähler und Nenner stetige Funktionen in x (vgl. Satz 6.7.7).
Für x → 0 konvergiert die Potenzreihen gegen den nullten Summanden. Also
1
erhalten wir für den Grenzwert (7.8) abermals 2 3!1 = 13 .
KAPITEL 7. DIFFERENTIALRECHNUNG
190
(vii) Sei w ∈ C mit einem Realteil, der kleiner als Null ist. Wir wollen zeigen, dass der
Grenzwert limt→+∞ t exp(wt) in C die komplexe Zahl 0 ist. Entweder wir betrachten dazu Real- und Imaginärteil des Grenzwertes gesondert, oder – was einfacher
ist – wir betrachten den Betrag von t exp(wt) für t > 0 (vgl. Satz 6.8.3):
|t exp(wt)| = t exp(t Re w) =
t
.
exp t(− Re w)
Wegen − Re w > 0 ist der Grenzwert davon für t → +∞ von der Form
stimmt nach Satz 7.2.14 dieser Grenzwert überein mit (siehe (6.13))
+∞
+∞ .
Somit
exp(t Re w)
1
t′
= 0.
= lim
= lim
t→+∞
t→+∞ − Re w · exp t(− Re w)
t→+∞ exp t(− Re w) ′
− Re w
lim
7.2.17 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b und f : I →
R (C) eine Abbildung, die auf (a, b) differenzierbar ist.
Ist a ∈ I, f dort stetig und existiert limt→a+ f ′ (t) in R (C), so ist f bei a rechtsseitig
differenzierbar, wobei limt→a+ f ′ (t) = f ′ (a)+ . Entsprechendes gilt für t → b−, wenn
b ∈ I.
Beweis. Wegen der Stetigkeit von f bei a können wir Satz 7.2.14 im reellwertigen Fall
bzw. Bemerkung 7.2.15 im komplexwertigen Fall anwenden und erhalten
f ′ (a)+ = lim
t→a+
f ′ (t)
f (t) − f (a)
= lim
.
t→a+ 1
t−a
❑
7.2.18 Bemerkung. Ist mit der Notation aus Korollar 7.2.17 f reellwertig und gilt a ∈ I
sowie limt→a+ f ′ (t) = +∞ (= −∞), so lässt sich Satz 7.2.14 genauso wie im Beweis
von Korollar 7.2.17 anwenden, und man erhält, dass f bei a nicht rechtsseitig differenzierbar ist. Entsprechendes gilt für t → b−, wenn b ∈ I.
7.2.19 Bemerkung. Wegen Korollar 7.2.17 gilt f ∈ C 1 (I) genau dann, wenn f ∈ C(I),
f |(a,b) ∈ C 1 (a, b) und sich ( f |(a,b) )′ auf ganz I stetig fortsetzen lässt. Dabei bezeichnen
a und b wieder die Randpunkte des Intervalls I.
7.2.20 Beispiel. Sei
1
 1


e− x
f (x) = 

0
, falls x > 0
, falls x ≤ 0
f
1
2
0
1
2
3
4
7.3. DER TAYLORSCHE LEHRSATZ
191
Klarerweise ist f auf (−∞, 0] beliebig oft ableitbar mit f (n) (x) = 0, x ≤ 0.
1
Auf (0, +∞) gilt f ′ (x) = x12 e− x , und durch vollständige Induktion sieht man, dass
(n ∈ N ∪ {0})
!
1 −1
(n)
f (x) = pn
e x , x > 0.
x
für Polynome pn (x) vom Grad 2n. Nun gilt mit Hilfe der Regel von de L’Hospital Satz
7.2.14
lim f (n) (x) = lim
x→0+
y→+∞
p′n (y)
pn (y)
p(2n)
n (y)
=
lim
=
·
·
·
=
lim
= 0,
y
y
y→+∞ e
y→+∞
e
ey
da p(2n)
n (y) eine Konstante ist.
Wir sehen insbesondere, dass f auf [0, +∞) stetig ist, und dass wegen
limt→0+ f ′ (t) = 0 nach Korollar 7.2.17 f ′ (0)+ = 0. Wegen f ′ (0)− = 0 ist f auch bei 0
differenzierbar mit f ′ (0), und somit f ∈ C 1 (R).
Wiederholte Anwendung dieses Argumentes auf f ′ , f ′′ usw. zeigt, dass f auf R
beliebig oft differenzierbar ist, wobei f (n) (0) = 0, n ≥ 0.
7.3 Der Taylorsche Lehrsatz
Wir wollen im folgenden eine gegebene Funktion f auf einem reellen Intervall I durch
Polynome approximieren. Für hinreichend oft differenzierbare f werden wir das durch
das sogenannte Taylorpolynom zu bewerkstelligen suchen.
Eine Motivation des Taylorschen Lehrsatz ergibt sich aus folgenden Interpolationsüberlegungen. Die Gerade, die eine
Kurve in einem Punkt am besten approximiert, ist die Tangente (falls sie existiert). Approximiert man die Kurve mit einem
Polynom höheren Grades, so kann man hoffen, dass die Approximation genauer wird.
Wir haben die Tangente gefunden (eigentlich definiert) als die Grenzlage von Sekanten durch die Punkte (x, f (x)) und
(x + △x, f (x + △x)). Da eine Gerade durch zwei Punkte eindeutig bestimmt ist, sind diese Sekanten wohldefinierte Objekte.
Ein Polynom vom Grade ≤ n ist eindeutig festgelegt durch die Vorgabe der Werte y0 , . . . , yn an n + 1 verschiedenen
Stellen x0 , . . . , xn :
n
Y
X
x − xj
yk ·
p(x) =
.
x − xj
j∈{0,...,n}\{k} k
k=0
Die Eindeutigkeit folgt aus der Tatsache, dass ein Polynom vom Grad ≤ n höchstens n Nullstellen hat.
Betrachten wir nun n + 1 Punkte der Kurve f mit den x-Koordinaten x, x + △x, . . . , x + n△x, und legen ein Polynom p
durch diese Punkte.
Für große Schrittweiten △x wird das erhaltene Polynom nicht viel mit der Kurve zu tun haben, lässt man jedoch △x → 0
streben, so hofft man auf eine gute Approximation.
7.3.1 Satz (Newtonsche Interpolationsformel). Seien x, △x und Werte y0 , . . . , yn gegeben. Das Polynom, welches durch die
Punkte (x, y0 ), (x + △x, y1 ), . . . , (x + n△x, yn ) geht, ist gleich
p(x) = y0 +
... +
(x − x0 ) △y0 (x − x0 )(x − x1 ) △2 y0
+ ···
+
1!
△x
2!
△x2
(x − x0 )(x − x1 ) . . . (x − xn−1 ) △n y0
,
n!
△xn
wobei wir x j = x + j△x gesetzt haben und △ j y0 die j-te Differenz bezeichnet. Diese ist rekursiv definiert als
△yi = yi+1 − yi , △2 yi = △yi+1 − △yi , . . . .
Beweis. Offenbar gilt p(x0 ) = y0 . Man erhält p(x1 ) = y0 + (x1 − x0 )
p(x j ) = y0 + (x j − x0 )
... +
△y0
△x
= y0 + △x
△y0
△x
= y0 + (y1 − y0 ) = y1 . Allgemein gilt
△y0 (x j − x0 )(x j − x1 ) △2 y0
+
+...
△x
2
△x2
(x j − x0 ) · · · (x j − x j−1 ) △ j y0
=
j!
△x j
KAPITEL 7. DIFFERENTIALRECHNUNG
192
j△x( j − 1)△x △2 y0
△y0
j!△x j △ j y0
+
=
+ ··· +
△x
2
j!
△x j
△x2
!
!
!
!
j
j
j
j
=
y0 + △y0 + △2 y0 + · · · + △ j y0 .
0
1
2
j
= y0 + j△x
Wir zeigen nun mittels Induktion die folgende Behauptung: Für je j + 1 Werte y0 , . . . , y j gilt die Formel
yj =
!
j
X
j l
△ y0 .
l
l=0
Der Induktionsanfang j = 0 ist offensichtlich richtig. Sei die Formel also bereits gezeigt für je j Werte. Dann folgt
!
j−1 !
j
X
X
j l
j l
△ y0 + △ j y0 =
△ y0 = y0 +
l
l
l=1
l=0
= y0 +
= y0 +
!
!#
j−1 "
X
j−1
j−1
+
△l y0 + (△ j−1 y1 − △ j−1 y0 ) =
l
−
1
l
l=1
!
!
j−1
j−1
X
X
j − 1 l−1
j−1 l
(△ y1 − △l−1 y0 ) +
△ y0 + (△ j−1 y1 − △ j−1 y0 ) =
l−1
l
l=1
l=1

 j−2

X j − 1!
△l y1 + △ j−1 y1  −
= 
l
l=0
|
{z
}
=y j

 
 j−2
!
j−1
X
 
X j − 1!
j − 1 l 
△ y0  = y j
△l y0 + △ j−1 y0  + y0 +
− 
l
l
l=1
l=0
Ist f an der Stelle x differenzierbar, so gilt lim△x→0
△y0
△x
= lim△x→0
f (x+△x)− f (x)
△x
❑
= f ′ (x). Allgemein gilt:
7.3.2 Lemma. Sei f : [a, b] → R stetig und n-mal stetig differenzierbar auf (a, b). Ist x ∈ (a, b), so gilt (y j = f (x + j△x))
lim
△x→0
(x−x ) △y
(x−x )···(x−x
△n y0
= f (n) (x).
△xn
) △n y
0
n−1
0
Beweis. Sei p(x) = y0 + 1! 0 △x0 + . . . +
n!
△xn . Die Funktion h(x) := f (x) − p(x) hat die n + 1 Nullstellen
x0 , · · · , xn (∈ (a, b) für △x hinreichend klein). Mit Korollar 7.2.4 folgt die Existenz von ξ ∈ (x0 , xn ) mit h(n) (ξ) = 0. Nun gilt
0 = h(n) (ξ) = f (n) (ξ) − p(n) (ξ) = f (n) (ξ) −
Für △x → 0 folgt wegen der Stetigkeit von f (n) auch
△n y0
△xn
△n y0
.
△xn
→ f (n) (x).
❑
Man erhält also als Grenzfall des in einem Punkt x0 approximierenden Polynoms gerade
p(x) = f (x0 ) + (x − x0 ) f ′ (x0 ) +
(x − x0 ) (n)
(x − x0 )2 ′′
f (x0 ) + · · · +
f (x0 ).
2
n!
Wählt man den Grad von p immer größer, so wird (hoffentlich) p(x) die Kurve f (x) immer besser annähern.
7.3.3 Definition. Sei n ∈ N, I ⊆ R ein Intervall, y ∈ I fest und f : I → R (C). Weiters
sei f mindestens n-mal differenzierbar bei y; vgl. Definition 7.1.15. Das Polynom (in
der Variablen x)
n
X
(x − y)k (k)
f (y),
T n (x) =
k!
k=0
nennt man dann das n-te Taylorsche Polynom an der Anschlussstelle y. Die Fehlerfunktion Rn (x) := f (x) − T n (x) nennt man das n-te Restglied.
7.3. DER TAYLORSCHE LEHRSATZ
193
Dass T n (x) eine gute Wahl ist, um ein reellwertiges f zu approximieren, folgt aus
dem nun folgenden Satz, welcher eine Art Verfeinerung des Mittelwertsatzes ist.
7.3.4 Satz (Taylorscher Lehrsatz). Sei I ⊆ R ein Intervall, und sei n ∈ N ∪ {0}. Weiters
sei f : I → R mit f ∈ C n (I) und so, dass f (n) am Inneren von I – also auf I ohne seine
Randpunkte – differenzierbar ist, bzw. äquivalent dazu, dass f auf dem Inneren von I
sicher n + 1-mal differenzierbar ist.
Zu x, y ∈ I, x , y, gibt es immer ein ξ ∈ (min(x, y), max(x, y)), sodass sich das n-te
Restglied Rn (x) = f (x) − T n (x) schreiben lässt als (Lagrange Form des Restgliedes)
Rn (x) =
(x − y)n+1 (n+1)
f
(ξ).
(n + 1)!
Beweis. Seien F, G : [min(x, y), max(x, y)] → R definiert durch
F(t) = f (x) −
n
X
(x − t)k
k=0
k!
· f (k) (t), G(t) = (x − t)n+1 .
Voraussetzungsgemäß sind beide stetig auf [min(x, y), max(x, y)] und differenzierbar auf (min(x, y), max(x, y)), wobei G′ (t) = −(n + 1)(x − t)n , 0 für t ∈
(min(x, y), max(x, y)) und
F ′ (t) = −
n
n
X
X
(x − t)n (n+1)
k(x − t)k−1 (k)
(x − t)k (k+1)
f
(t) +
f (t) = −
f
(t).
k!
k!
n!
k=1
k=0
Nach dem verallgemeinerten Mittelwertsatz, Satz 7.2.7, gibt es ein ξ
(min(x, y), max(x, y)), sodass
∈
n
(n+1)
(ξ)
− (x−ξ)
f (n+1) (ξ)
F(y) − F(x) F ′ (ξ)
Rn (x)
n! f
=
=
=
.
=
′
n
n+1
G(y) − G(x) G (ξ) −(n + 1)(x − ξ)
(n + 1)!
(x − y)
❑
7.3.5 Bemerkung. Wählt man im obigen Beweis G(t) = (x−t) p für ein festes aber beliebiges p ∈ N, so erhält man mit derselben Argumentation ein ξ ∈ (min(x, y), max(x, y)),
sodass
f (n+1) (ξ)
Rn (x) =
(x − y) p (x − ξ)n−p+1 .
n!p
Stellt man ξ durch ξ = θx + (1 − θ)y für ein θ ∈ (0, 1) dar, so erhält man die Schlömilchsche Form
f (n+1) (ξ)
Rn (x) =
(x − y)n+1 (1 − θ)n−p+1 .
n!p
des Restgliedes. Für p = n + 1 erhält man die Lagrange Form und für p = 1 die
sogenannte Cauchysche Form des Restgliedes.
7.3.6 Fakta. Sei f : I → R (C) wie in Definition 7.3.3.
1. Man sieht unmittelbar durch Nachrechnen, dass T n (x) ein Polynom höchstens
n-ten Grades ist, sodass
T n (y) = f (y), T n′ (y) = f ′ (y), . . . , T n(n) (y) = f (n) (y).
(7.9)
Die höheren Ableitungen von T n verschwinden identisch, da es ein Polynom
höchstens n-ten Grades ist.
KAPITEL 7. DIFFERENTIALRECHNUNG
194
2. Ist p(x) ein weiteres Polynom höchstens n-ten Grades mit (7.9) (T n ersetzt durch
p), so verschwinden die Ableitungen 0-ten bis n-ten Grades von q(x) = p(x) −
T n (x) an der Stelle y.
Wenden wir Satz 7.3.4 auf die reellen Funktionen Re q(x) und Im q(x) oder auch
nur q(x), falls diese reell ist, an, so folgt wegen q(n+1) ≡ 0, dass q(x) = 0. Also
definiert die Eigenschaft (7.9) das Polynom T n (x) eindeutig.
3. Ist f selber ein Polynom vom Grad m, so muss insbesondere f (x) = T n (x) für
n ≥ m.
4. Für reellwertige Funktionen f gibt Satz 7.3.4 im Falle der Differenzierbarkeit von f (n) am Inneren von I eine Möglichkeit, das Restglied Rn (x) durch
(x−y)n+1 (n+1)
(ξ) auszudrücken. Das Problem dabei ist, dass man von ξ nur weiß,
(n+1)! f
dass es zwischen x und y liegt. Nichtsdestotrotz kann man manchmal f (n+1) so
gut abschätzen, dass man sicher sagen kann, dass Rn (x) klein wird; vgl. auch
Bemerkung 7.3.5.
5. Ist f beliebig oft differenzierbar, so kann man für jedes n ∈ N ∪ {0} das Taylorpolynom T n (x) an der Anschlussstelle y betrachten. Man erhält schließlich die
Taylorreihe von f an der Anschlussstelle y:
T (x) :=
∞
X
f (n) (y)
(x − y)n .
n!
n=0
Das ist eine Potenzreihe mit Konvergenzradius R ∈ [0, +∞]. Hier können alle
Fälle auftreten.
6. Ist R > 0, so konvergiert die Potenzreihe insbesondere auf (y − R, y + R). Nun
kann T (x) auf (y − R, y + R) ∩ I mit der Ausgangsfunktion f (x) übereinstimmen;
sie muss es aber nicht.
Klarerweise ist T (x) = f (x), x ∈ (y − R, y + R) ∩ I genau dann, wenn Rn (x) → 0
für x ∈ (y − R, y + R) ∩ I.
P
n
7. Sei ∞
n=0 an z eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die
Funktion
∞
X
f : (y − R, y + R) → C, f (t) =
an (t − y)n .
n=0
(l)
Wir werden in Proposition 8.7.5 sehen, dass f (y) = l! · al , l ∈ N ∪ {0}. Die
P
n
Taylorreihe von f an der Anschlussstelle y ist somit genau ∞
n=0 an (t − y) , und
konvergiert daher auf (y − r, y + R).
Das Restglied Rn (x) konvergiert dann klarerweise gegen 0.
7.3.7 Beispiel. Sei n ∈ N ∪ {0}, I ⊆ R ein Intervall, und f : I → R so, dass f ∈ C n (I)
und dass f auf dem Inneren des Intervalls I sogar (n + 1)-mal differenzierbar ist. Gilt
nun f (n+1) (ξ) = 0 für alle ξ im Inneren von I, so folgt Rn (x) = 0 und daher f (x) = T n (x)
für alle x ∈ I. Kurz zusammengefasst bedeutet das, dass genau die Polynome vom Grad
≤ n alle möglichen Lösungen der Differentialgleichung
f (n+1) (ξ) = 0,
sind. Indem man f in Real- und Imaginärteil zerlegt, folgt diese Tatsache auch für
komplexwertige f .
7.3. DER TAYLORSCHE LEHRSATZ
195
7.3.8 Beispiel.
Sei f (t) = et . Dann gilt f (n) (t) = et , also f (n) (0) = 1. Wir erhalten
ex =
wobei Rn (x) =
xn+1 ξ
(n+1)! e
x
n
X
xk
+ Rn (x),
k!
k=0
mit ξ ∈ (0, x).
Da e die Grenzfunktion einer Potenzreihe ist, – so wurde sie ja eingeführt –
muss Rn (x) → 0, vgl. Fakta 7.3.6, 7. Man kann dieses Grenzverhalten aber auch
unschwer durch eine elementare Abschätzung von Rn (x) erhalten.
Betrachte die Funktion
f (t) =
∞
X
cos(2k t)
.
k!
k=1
Differenziert man diese Reihe gliedweise, so erhält man
∞
∞
X
−2k sin(2k t) X −22k cos(2k t)
,
,...
k!
k!
k=1
k=1
P (2k )l
für jedes l ∈ N konvergiert, sind sämtliche dieser Reihen
Da ∞
k=1 k!
gleichmäßig konvergent auf R. Wie wir später in Korollar 8.7.4 sehen werden,
ist die Funktion f daher in jedem Punkt beliebig oft differenzierbar, und ihre
Ableitungen werden durch obige Reihen dargestellt. Es gilt daher
f ′ (0) = f ′′′ (0) = . . . = f (2k+1) (0) = . . . = 0,
und
f (2n) (0) = (−1)n
∞
X
22nk
n
= (−1)n (e4 − 1).
k!
k=1
Die Taylorreihe von f bei 0 ist also gleich
n
∞
X
(−1)n (e4 − 1) 2n
x .
(2n)!
n=0
n
Wendet man das Quotientenkriterium an, so erhält man (an =
(−1)n (e4 −1)
(2n)!
x2n ) .
an+1 (e4n 2 + 1)(e4n + 1) 2
=
x −→ ∞, x , 0.
an
(2n + 2)(2n + 1)
Diese Reihe ist für kein x (außer im Trivialfall x = 0) konvergent.
Das Taylorpolynom T n (x) der Funktion f aus Beispiel 7.2.20 stets identisch
Null. Also ist f ein Beispiel für eine C ∞ -Funktion, deren Taylorreihe bei der
Anschlussstelle 0 auf ganz R konvergiert, aber nicht mit f übereinstimmt.
Wir haben gesehen, dass für eine differenzierbare Funktion f , welche an einer Stelle x ein lokales Extremum besitzt, f ′ (x) = 0 gelten muss. Wie das Beispiel f (t) = t3
zeigt, gilt die Umkehrung im Allgemeinen nicht. Aus dem Taylorschen Satz erhält man
unmittelbar eine hinreichende Bedingung für ein lokales Extremum.
KAPITEL 7. DIFFERENTIALRECHNUNG
196
7.3.9 Korollar. Für m ∈ N, m > 1 sei f : (c, d) → R eine zumindest m-mal differenzierbare Funktion, x ∈ (c, d), f (m) bei x stetig, und gelte
f ′ (x) = f ′′ (x) = . . . = f (m−1) (x) = 0, f (m) (x) , 0.
Ist m gerade, so ist x ein lokales Extremum von f , und zwar ein lokales Minimum falls
f (m) (x) > 0 und ein lokales Maximum falls f (m) (x) < 0. Ist dagegen m ungerade, so ist
x sicher kein lokales Extremum von f .
Beweis. Gemäß Satz 7.3.4 mit Anschlussstelle x und n + 1 = m gilt für t ∈ (c, d) mit
einer geeigneten Zwischenstelle ξ zwischen t und x
f (t) = f (x) +
(t − x)m (m)
f (ξ) .
m!
Ist f (m) (x) > 0, so gilt für ξ in einer hinreichend kleinen Umgebung (x − δ, x + δ) von x
ebenfalls f (m) (ξ) > 0. Da ξ zwischen t und x liegt, folgt aus t ∈ (x − δ, x + δ), dass für
gerades m
(t − x)m (m)
f (ξ) > 0 .
m!
Somit folgt f (t) > f (x), und x ist ein lokales Minimum. Ist m ungerade, so hat (t − x)m
für t < x ein anderes Vorzeichen als für t > x. Also ist x kein lokales Extremum. Ganz
analog verläuft die Argumentation für f (m) (x) < 0.
❑
7.3.10 Beispiel. Mit den bisher gesammelten Ergebnissen lassen sich sogenannte
Kurvendiskussionen von Funktionen durchführen.
f
4
Man betrachte z.B. die
Funktion f (x) = x x auf
(0, +∞).
3
2
1
0
1
e
1
2
Zunächst ist diese Funktion stetig und beliebig oft differenzierbar.
Klarerweise ist sie immer positiv, hat also keine Nullstellen.
Um die lokalen Extrema zu finden, betrachte
f ′ (x) = x x (1 + ln x), f ′′ (x) = x x−1 + x x (1 + ln x).
Die einzige Nullstelle von f ′ (x) ist 1e . Da f ′′ ( 1e ) > 0 folgt aus Korollar 7.3.9,
dass diese Stelle ein lokales Minimum ist.
Für 0 < x < 1e ist f ′ (x) < 0 also dort monoton fallend, und für 1e < x ist
f ′ (x) > 0, also dort monoton wachsend, vgl. Korollar 7.2.9. Insbesondere ist 1e
ein absolutes Minimum von f auf (0, +∞).
7.4. STAMMFUNKTION
197
Schließlich haben wir in Beispiel 7.2.16 gesehen, dass limx→0+ f (x) = 1. Wegen
x x ≥ e x , x ≥ e gilt auch die Beziehung lim x→+∞ f (x) = +∞.
7.3.11 Beispiel. Wir wollen die Funktion f : (0, +∞) → R
f (x) = (1 − ln x)2 − x(3 − 2 ln x).
aus Beispiel 7.2.5 weiter diskutieren, für die wir schon berechnet haben, dass
ln x − 1 2 4 − 2 ln x + 2x
1
1
+ =
.
f ′ (x) = 2(ln x − 1) + 2 ln x − 1, f ′′ (x) = 2 2 − 2
x
x
x2
x
x2
Zudem haben wir festgestellt, dass f ′′ (x) > 0 für x ∈ (0, +∞) und dass f genau zwei
Nullstellen ξ, η hat, wobei 0 < ξ < 1 < η < +∞.
Nach dem Satz von Rolle hat dann auch f ′ mindestens eine Nullstelle x0 mit ξ <
x0 < η. Wegen f ′′ (x) > 0 und dem Satz von Rolle kann es davon aber nur ein geben,
und mit Korollar 7.3.9 erkennen wir aus f ′′ (x0 ) > 0, dass x0 ein lokales Minimum von
f ist.
In der Tat muss f ′ wegen f ′′ (x) > 0 streng monoton wachsen. Außerdem gilt wegen
′
f (x) ≤ − 1x für x ∈ (0, 1)
lim f ′ (x) = −∞,
x→0+
′
und wegen f (x) ≥ 2 ln x − 1 für x > e
lim f ′ (x) = +∞.
x→+∞
Daraus erkennen wir auch, dass f eine eindeutige Nullstelle haben muss.
Wegen der Monotonie von f ′ gilt
f ′ (s) < f ′ (x0 ) = 0 < f ′ (t) für 0 < s < x0 < t < +∞.
Also ist f auf (0, x0 ) monoton fallend und auf (x0 , +∞) monoton wachsend, weshalb
x0 sogar ein globales Minimum von f sein muss.
7.4 Stammfunktion
Bei der Integration von Funktionen wird es wichtig sein, zu einer gegebenen Funktion
f : [a, b] → R (C) – falls möglich – eine Funktion F : [a, b] → R (C) zu finden, sodass
F′ = f .
7.4.1 Definition. Sei I ⊆ R ein Intervall und f : I → R (C). Wir nennen eine Funktion
F : I → R (C) eine Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I.
Hat ein f mindestens eine Stammfunktion, so heißt die Gesamtheit
aller StammR
funktionen von f das unbestimmte Integral von f und wird durch f bezeichnet.
7.4.2 Bemerkung. Mit F ist offensichtlicherweise auch F + c für jedes c ∈ R (C) eine
Stammfunktion von f .
Sind umgekehrt F1 , F2 zwei Stammfunktionen der selben Funktion f , so gilt (F1 −
F2 )′ ≡ 0 auf I. Nach Korollar 7.2.9 bzw. Bemerkung 7.2.11 ist F1 − F2 eine Konstante.
Somit gibt es bis auf additive Konstanten eine eindeutige Stammfunktion F, und
Z
f = {F + c : c ∈ R (C)}.
KAPITEL 7. DIFFERENTIALRECHNUNG
198
7.4.3 Beispiel. Ist f : R \ {0} → R gegeben durch f (x) = 1x , so überzeugt man sich
sofort, dass F : R \ {0} → R, F(x) = ln |x| die Gleichung F ′ (x) = f (x) für alle
x ∈ R \ {0} erfüllt. Für die Funktion G : R \ {0} → R, G(x) = sgn(x) + ln |x| gilt ebenfalls
G′ (x) = f (x) für alle x ∈ R \ {0}. Dieser scheinbare Widerspruch zu Bemerkung 7.4.2
lässt sich dadurch erklären, dass R \ {0} ja kein Intervall ist – Korollar 7.2.9 lässt sich
darauf also nicht anwenden.
Zum Aufsuchen von Stammfunktionen gegebener Funktionen ist folgendes Resultat sehr hilfreich.
7.4.4 Lemma. Seien I, J ⊆ R Intervalle und f, g : I → R (C), sowie α, β ∈ R (C).
Weiters sei h : J → I differenzierbar.
(i) Haben f und g Stammfunktionen, so auch α f + βg, wobei
Z
Z
Z
(α f + βg) = α
f +β g
.
(ii) Sind f und g differenzierbar auf I, sodass f ′ g eine Stammfunktion hat, dann hat
auch f g′ eine solche, und
Z
Z
f ′g = f g −
f g′ , Regel von der Partiellen Integration.
(7.10)
(iii) Mit f hat auch ( f ◦ h) · h′ : J → R (C) eine Stammfunktion, wobei
Z
Z !
(( f ◦ h) · h′ ) =
f ◦ h, (Substitutionsregel)
Diese drei Beziehungen sind so zu verstehen, dass wenn
funktion steht, die Gleichheit bis auf eine Konstante gilt.
R
· · · für jeweils eine Stamm-
Beweis.
(i) Sind F und G Stammfunktionen von f und g, so folgt (αF + βG)′ = αF ′ + βG′ =
α f + βg. Also ist αF + βG eine Stammfunktion von α f + βg.
(ii) Ist H Stammfunktionen von f ′ g, so folgt aus der Produktregel ( f g − H)′ = ( f ′ g +
f g′ ) − f ′ g = f g′ . Somit ist f g − H Stammfunktionen von f g′ , und es gilt (7.10).
(iii) Ist F Stammfunktionen von f , so folgt aus der Kettenregel in Satz 7.1.9 bzw.
Bemerkung 7.1.10, dass (F ◦ h)′ = ( f ◦ h) · h′ . Also ist F ◦ h Stammfunktion von
( f ◦ h) · h′ .
❑
7.4.5 Bemerkung. Zur Substitutionsregel gibt es folgende Merkregel:
Seien I, J ⊆ R wieder Intervalle, f : I → R (C), und h : J → I differenzierbar.
Schreiben wir x = h(t) mit t ∈ J und formal dx = h′ (t) dt, so erhält man aus
Z !
Z
f (x) =:
f (x)dx
7.4. STAMMFUNKTION
199
durch Ersetzen von x durch h(t) und dx durch h′ (t) dt
Z
Z
f (h(t)) · h′ (t) dt := (( f ◦ h) · h′ ).
Wie gesagt ist das eine Merkregel, die sich beim Bestimmen konkreter Stammfunktionen aber als durchaus praktikabel und übersichtlich herausgestellt hat, siehe etwa
Beispiel 7.4.9.
7.4.6 Beispiel. Man kann die Substitutionsregel verwenden, um einfache Differentialgleichungen der Form
y′ (t) · f (y(t)) = g(t), t ∈ I,
(7.11)
zu lösen. Hier sind I, J ⊆ R Intervalle und f : J → R sowie g : I → R stetige
Funktionen.
Angenommen man hat eine Funktion y : I → J ⊆ R, welche (7.11) erfüllt. Hat
f eine Stammfunktion F, so ist nach der Substitutionsregel die Funktion F ◦ y eine
Stammfunktion von t 7→ y′ (t) · f (y(t)) und daher auch von g.
Kennt man andererseits eine Stammfunktion G von g explizit, so folgt F ◦ y =
G + c für eine Konstante c ∈ R. Also hat man eine implizite Beschreibung von y(t). In
manchen Fällen lässt sich diese Gleichung nach y auflösen, wodurch man y(t) explizite
beschreiben kann.
Diese hier beschriebene Methode nennt man auch Trennung der Variablen .
7.4.7 Beispiel. Man betrachte die Differentialgleichung
y′ (t) = y(t), t ∈ R.
Eine reellwertige Lösung y dieser Differentialgleichung ist y ≡ 0. Angenommen y ist
eine weitere reellwertige Lösung mit y(t0 ) < 0 für ein t0 ∈ R. Wegen der Stetigkeit gilt
y(t) < 0 für alle t ∈ (t0 − ǫ, t0 + ǫ) =: I.
Ist f : I → (−∞, 0) die Funktion f (η) = η1 , so gilt für t ∈ I,
y′ (t) ·
1
= y′ (t) · f (y(t)) = 1.
y(t)
Eine Stammfunktion von f ist F(η) = ln(−η), also ist t 7→ ln(−y(t)) eine Stammfunkti1
auf I. Von 1 ist t 7→ t eine Stammfunktion. Es folgt ln(−y(t)) = t+c, t ∈
on von y′ (t)· y(t)
I, und weiter y(t) = −ec · et . Also muss y(t) = d · et , t ∈ I für ein reelles d ∈ (−∞, 0).
Man beachte, dass wir von der Gültigkeit von y′ (t) = y(t) auf y(t) = d · et , t ∈ I,
geschlossen haben, wir uns also zunächst nicht sicher sein können, dass diese Funktion
tatsächlich y′ (t) = y(t) löst. Durch Einsetzen zeigt man aber sofort, dass tatsächlich
y(t) = d · et , t ∈ R, eine Lösung ist.
Wir werden nun einige Funktionstypen auflisten und angeben, wie man die unbestimmten Integrale von diesen bestimmt.
(i) Ist Rf (x) = xn , n ∈ N ∪ {0} auf R, so ist F(x) =
1 n+1
ist xn = n+1
x + c.
1 n+1
n+1 x
eine Stammfunktion. Also
(ii) Ist f (x) = x−n , n ∈ N, n > 1 auf (−∞, 0) oder (0, +∞), so ist F(x) =
eine Stammfunktion.
1
−n+1
−n+1 x
KAPITEL 7. DIFFERENTIALRECHNUNG
200
(iii) Ist f (x) = x−1 , auf (−∞, 0) oder (0, +∞), so ist F(x) = ln |x|, x , 0 eine Stammfunktion.
(iv) Um die Stammfunktion von ln x, x > 0 zu ermitteln, wenden wir die Partielle
Integration an:
Z
Z
Z
1
′
ln(x) = (x ) ln(x) = x ln(x) −
x = x(ln(x) − 1) + c.
x
R
sinh x = cosh x + c, cosh x = sinh x + c.
R
R
(vi) sin x = − cos x + c, cos x = sin x + c.
(v)
R
e x = e x + c,
R
(vii) Sei n ∈ N, n ≥ 2. Mit partieller Integration sieht man
Z
Z
Z
n
n−1
n−1
cos t = (cos t) · (cos t) = (cos t)(sin t) + (n − 1) (cosn−2 t)(sin t)2 =
n−1
(cos
t)(sin t) + (n − 1)
Z
n−2
(cos
t) − (n − 1)
Z
(cosn t).
Also erhält man die Rekursionsgleichung
Z
Z
1
n−1
cosn t = (cosn−1 t)(sin t) +
(cosn−2 t).
n
n
(viii) Mit Hilfe von (i) und der Substitutionsregel folgt (k ∈ N, k > 1)
Z
Z
a
a
a
= a ln |x − b| + c,
=
+ c,
k
(x − b)
(x − b)
(−k + 1)(x − b)k−1
wobei man diese Funktionen auf einem Intervall betrachtet, das b nicht enthält.
R 1
sin
: (− π2 , π2 ) → R).
(ix) 1+x2 = arctan x + c. (Umkehrfunktion von tan = cos
R x
2
′
(x) Um 1+x
2 zu ermitteln, wende man die Substitutionsregel auf h(x) = x , h (x) =
1
2x und f (y) = 1+y an:
Z
x
1
=
2
2
1+x
Z
2x
1
=
2
2
1+x
Z
1
1+y
!
=
y=x2
1
1
(ln |1 + y|)y=x2 = ln |1 + x2 |.
2
2
R
1
1
(xi) Ganz ähnlich sieht man (1+xx 2 )k = 2(1−k)
für k ∈ N, k > 1.
(1+x2 )k−1
R
(xii) (1+x1 2 )k , k ∈ N, k > 1 lässt sich rekursiv berechnen, indem man
t = arctan x ∈ (− π2 , π2 ) substituiert
Z
Z
Z
Z
1
1
1
1
=
·
=
=
cos2k−2 t =
(1 + x2 )k
(1 + x2 )k−1 (1 + x2 )
(tan2 t + 1)k−1
Z
2k − 3
1
(cos2k−2 t) · (tan t) +
(cos2k−4 t) =
2k − 2
2k − 2
Z
1
x
1
2k − 3
·
+
.
2k − 2 (1 + x2 )k−1 2k − 2
(1 + x2 )k−1
7.4. STAMMFUNKTION
(xiii) Ist nun allgemein f (x) =
(D := q −
p2
4
201
x+d
,
(x2 +px+q)k
und hat x2 + px + q keine reellen Nullstellen
> 0), so schreibe
f (x) =
(x + 2p ) + (d − 2p )
.
2
((x + 2p )2 + q − p4 )k
R
√
Um f (x) zu berechnen, substituiere Dy − 2p = x(y):
√
Z
Z
Dy + D(d − 2p )
1
f (x) = k
.
D
(1 + y2 )k
Dieses Integral lässt sich mit Hilfe der oben behandelten Funktionen lösen.
(xiv) Zu guter letzt noch Stammfunktion von C-wertigen Funktionen (w ∈ C):
Z
Z
1
eix = −ieix + c,
ewx = ewx + c,
w
Z
Z
1 wx x wx
1
x
e = e − 2 ewx + c.
xewx = ewx −
w
w
w
w
P(x)
Um die Stammfunktion einer beliebigen rationalen Funktion R(x) = Q(x)
, wobei
P(x) und Q(x) zwei reelle Polynome sind, zu ermitteln, werden wir diese in eine Summe von Funktionen entwickeln, deren Stammfunktionen wir eben kennengelernt haben.
Als erstes folgt aus dem Euklidischen Algorithmus, dass
P(x) = S (x)Q(x) + T (x),
wobei S (x) und T (x) reelle Polynome sind, und wobei der Grad von T (x) kleiner als
der von Q(x) ist.
R
R T (x)
T (x)
ist daher S (x) + Q(x)
. Das erste Integral
Das Integral von R(x) = S (x) + Q(x)
T (x)
errechnet man leicht mit Hilfe von (i). Für das zweite müssen wir Q(x) weiter zerlegen.
Dazu betrachten wir zuerst die auftretenden Polynome als komplexe Polynome.
Das hat den Vorteil, dass sich jedes komplexe Polynom bis auf eine Konstante als
Produkt von Faktoren (z − z j ) schreiben lässt.
7.4.8 Satz. Seien T (z), Q(z) zwei komplexe Polynome, sodass der Grad n von Q(z)
größer als der von T (z) ist. Schreiben wir Q(z) = an zn + · · · + a0 mit an ∈ C \ {0} als
Q(z) = an (z − z1 )ν1 · · · · · (z − zm )νm ,
wobei zi , z j wenn i , j und wobei ν1 , . . . , νm ∈ N, ν1 + · · · + νm = n, so gibt es
eindeutige Zahlen a jk ∈ C, sodass (z ∈ C \ {z1 , . . . , zm })
ν
j
m
T (z) X X a jk
=
.
Q(z)
(z − z j )k
j=1 k=1
Beweis. Unser Problem ist äquivalent zur Existenz und Eindeutigkeit von Zahlen a jk ,
sodass für z ∈ C
νj
m X
m
X
Y
1
T (z) =
a jk (z − z j )ν j −k
(z − zl )νl .
an
j=1 k=1
l=1,l, j
(7.12)
KAPITEL 7. DIFFERENTIALRECHNUNG
202
Betrachte den Vektorraum Cn−1 [z] aller komplexen Polynome vom Grad kleiner n. Dieser hat Dimension n. Kann man nun zeigen, dass die n Stück Polynome
(z − z j )ν j −k
m
Y
(z − zl )νl , j = 1, . . . , m, k = 1, . . . , ν j ,
l=1,l, j
linear unabhängig in Cn−1 [z] sind, so bilden sie sogar eine Basis, und unser Satz folgt
sofort aus der Linearen Algebra.
Wäre
m
Y
X
λ jk (z − z j )ν j −k
(z − zl )νl = 0,
j=1,...,m,k=1,...,ν j
l=1,l, j
und setzt man z = z1 , . . . , zm , so erhält man λ1ν1 = · · · = λmνm = 0. Nun kann man
Qm
j=1 (z − z j ) durchdividieren und erhält
X
j=1,...,m;k=1,...,ν j −1
λ jk (z − z j )ν j −1−k
m
Y
(z − zl )νl −1 = 0.
l=1,l, j
Wiederholt man obige Argumentation, so folgt λ j(ν j −1) = 0 für alle j ∈ {1, . . . , m}, ν j >
1, usw. bis man schließlich λ jk = 0 für alle j = 1, . . . , m, k = 1, . . . , ν j erhält.
❑
Aus (7.12) sehen wir auch, wie man die Zahlen a jk gewinnen kann. In der Tat, kann
man alle auftretenden Polynome ausmultiplizieren, und vergleicht dann die Koeffizienten, die bei jedem zk links und rechts vom Gleichheitszeichen stehen. Diese müssen
übereinstimmen, und so erhält man n Gleichungen für n Unbekannte.
Etwas weniger Arbeit hat man, wenn man den eben gebrachten Beweisgedanken
einfließen lässt. Man kann nämlich in (7.12) nacheinander z = z1 , . . . , zm setzen und
erhält so a jν j ganz leicht.
Wir kehren zu unseren reellen Polynomen T (x) und Q(x) zurück. Wenn wir auf
diese Satz 7.4.8 anwenden, hat das den Nachteil, dass man eine Partialbruchzerlegung
mit möglicherweise nicht nur reellen Komponenten erhält.
Um das wieder zu reparieren, schließt man zuerst aus Q(z̄) = Q(z) – Q(z) hat ja
reelle Koeffizienten –, dass mit z j auch z̄ j eine Nullstelle von Q(z) ist, und dass diese
die gleiche Vielfachheit ν j haben.
Somit sind die Nullstellen von Q(z) von der Form x1 , . . . , x p , z1 , . . . zq , z̄1 , . . . z̄q , wobei x j ∈ R und z j ∈ C+ := {z ∈ C : Im z > 0}. Die Partialbruchzerlegung aus Satz 7.4.8
lässt sich nun schreiben als
!
µj
p νj
q X
X
c jk
b jk
T (z) X X a jk
=
.
+
+
Q(z)
(z − x j )k j=1 k=1 (z − z j )k (z − z̄ j )k
j=1 k=1
T (z̄)
T (z)
= Q(z)
, folgt aus der Eindeutigkeit der komplexen PartialbruchzerleDa aber auch Q(z̄)
gung a jk ∈ R und c jk = b̄ jk , und man erhält
!
!
c jk
b j (z − z̄ j )k + b̄ j (z − z j )k
b jk
=
,
+
(z − z j )k (z − z̄ j )k
(z2 − 2z Re(z j ) + |z j |2 )k
wobei die Polynome in Zähler und Nenner reell sind. Summiert man nun über k auf,
und bringt die Summe auf gemeinsamen Nenner, so erhält man eine Funktion der Form
T j (z)
,
(z2 + B jz + C j )µ j
7.4. STAMMFUNKTION
203
wobei T j (z) ein reelles Polynom mit Grad kleiner 2µ j ist, und B j = −2 Re(z j ), C j =
|z j |2 . Durch wiederholte Anwendung des Euklidischen Algorithmus kann man dieses
Polynom als
µj
X
T j (z) =
(d jk z + e jk )(z2 + B j z + C j )µ j −k
k=1
anschreiben. Somit folgt die Zerlegung
ν
µ
j
j
XX
d jk z + e jk
T (z) X X a jk
=
+
,
k
2 + B z + C )k
Q(z)
(z
−
x
)
(z
j
j
j
j=1 k=1
j=1 k=1
p
q
(7.13)
welche nur reellen Zahlen beinhaltet. Dabei haben die z2 + B j z + C j klarerweise keine
reellen Nullstellen.
Zur Praktischen Berechnung der Koeffizienten a jk in (7.13) multipliziert man Q(z)
links und rechts, und führt einen Koeffizientenvergleich durch. Durch Einsetzen von
z = x j lassen
R T (x)sich die a jν j auch schneller berechnen.
Um Q(x)
zu berechnen, genügt es nun die einzelnen Summanden in der Partialbruchzerlegung zu integrieren, und diese dann zu summieren.
R
7.4.9 Beispiel. Wir wollen das Integral tan x dx auf einem Intervall I berechnen, wobei keine Nullstelle von cos x enthalten darf:
Z
Z
Z
1
sin x
i −
dx =h
dt =
tan x dx =
t=cos
x
cos x
t
dt=− sin xdx
= − ln |t| + C = − ln | cos x| + C .
Diese Methode beruht darauf, dass unser Integrand von der Gestalt f (t(x)) t′ (x) ist, und
noch dazu mit einer sehr einfachen Funktion f . Daher können wir die Substitutionsregel unmittelbar anwenden und die entstehende Funktion leicht integrieren.
R
7.4.10 Beispiel. Wir wollen das Integral x2 sin x dx auf einem beliebigen Intervall
berechnen. Wir verwenden partielle Integration:
Z
Z
Z
2
2
2
x sin x dx = x (− cos x) − 2x(− cos x) dx = −x cos x + 2 x cos x dx =
= −x2 cos x + 2 x sin x −
Z
sin x dx = −x2 cos x + 2x sin x + 2 cos x + C
Mit dieser Methode kann man zum Beispiel alle Integrale von der Form
Z
Z
Z
P(x)e x dx,
P(x) sin x dx,
P(x) cos x dx ,
mit einem Polynom P berechnen.
7.4.11 Beispiel (Integration von R(e x )). Hat man eine Funktion f der Gestalt f (x) =
R(e x ), wobei R eine rationale Funktion ist, so kann man deren Integral stets mit Hilfe
der Substitution t = e x auf das Integral einer rationalen Funktion bringen. Denn es gilt,
mit t = e x ,
Z
Z
1
x
R(t) dt
R(e ) dx =h t=ex i
t
dt=e x dx
dx= 1t dt
204
KAPITEL 7. DIFFERENTIALRECHNUNG
7.4.12 Beispiel. Wir wollen das Integral
R
Z
e2x − 1
dx =
ex + 2
Z
e2x −1
e x +2
dx auf R berechnen. Zunächst gilt
(e x )2 − 1
dx =h
ex + 2
t=e x
dx= 1t dt
Z
i
t2 − 1 1
· dt
t+2 t
Man beachte, dass nach der Substitution t(x) = t in (0, +∞) liegt; also immer positiv ist.
Nun haben wir ein Integral einer rationalen Funktion auf (0, +∞) zu berechnen. Dazu
schreiben wir
t2 + 2t − 2t − 1
2t + 1
t2 − 1 1
t2 − 1
=
=1−
· = 2
t+2 t
t(t + 2)
t + 2t
t2 + 2t
und versuchen nun den zweiten Summanden in Partialbrüche zu zerlegen:
A
B
(A + B)t + 2A
2t + 1
= +
=
t(t + 2)
t
t+2
t(t + 2)
Koeffizientenvergleich führt auf A =
1
2
und B = 32 . Also haben wir
1
3
t2 − 1 1
· =1− −
t+2 t
2t 2(t + 2)
und daher
Z
t2 − 1 1
1
3
· dt = t − ln t − ln(t + 2) =
t+2 t
2
2
= ex −
x 3
− ln(e x + 2)
2 2
7.4.13 Beispiel (Integration von R(sin x, cos x)). Hat man eine Funktion f der Gestalt
f (x) = R(sin x, cos x), wobei R eine rationale Funktion ist, so kann man deren Integral
stets mit Hilfe der Substitution t = tan 2x auf das Integral einer rationalen Funktion
bringen. Denn es gilt, mit t = tan 2x ,
x
sin x = 2 sin
cos x = cos2
2 tan 2
x
x
cos =
2
2 1 + tan2
x
2
x 1 − tan2
x
− sin2 =
2
2 1 + tan2
=
x
2
x
2
2t
1 + t2
=
1 − t2
1 + t2
1
x
2
dt
dt
= (1 + tan2 ) also dx =
dx 2
2
1 + t2
Literaturverzeichnis
[EL] K.Endl,W.Luh: Analysis I-III, Aula Verlag, Wiesbaden 1986.
[F] G.M.Fichtenholz: Differential- und Integralrechnung I-III, Deutscher Verlag der
Wissenschaften, Berlin 1964.
[H] H.Heuser: Lehrbuch der Analysis 1,2, Teubner Verlag, Stuttgart 1989.
[L] S.Lang: A first course in calculus, Springer Verlag, Heidelberg 1986.
[R] W.Rudin: Principles of Mathematical Analysis, McGraw-Hill, New York 1953,
third edition 1976.
[W] W.Walter: Analysis 1, Springer Verlag, Heidelberg, New York Tokoyo.
205
Index
C(I), 181
C(X, Y), 129
C 0 (I), 181
C ∞ (I), 181
C n (I), 181
Cb (E, Y), 152
C[z], 166
R, 40
Z, 26
ǫ-Kugel, 97
limi∈I xi , 110
limt→+∞ f (t), 127
limt→−∞ f (t), 127
limt→z f (t), 124
limz→∞ f (z), 128
P, 33
B(E, Y), 147
d(x, y), 52
d1 (x, y), 54
d2 (x, y), 52
d∞ ( f, g), 147
d∞ (x, y), 55
C+ , 202
Q, 34
R[x], 75
C, 46
Cn−1 [z], 202
N, 16
überall definiert, 4
Abbildung, 4
identische, 4
isometrische, 129
Abel Kriterium, 87
Abelscher Grenzwertsatz, 172
Ableitung
einer Funktion, 180
höhere, 181
im Punkt x, 175
linksseitige, 175
rechtsseitige, 175
Abschluss, 99
absolut konvergent, 83
Addition, 9, 20
alternierende harmonische Reihe, 83
analytisch, 157
analytisch in einem Punkt, 157
Anschlussstelle, 192
Antisymmetrie, 12
Arcuscosinus, 169
Funktionsgraph, 169
Arcuscotangens, 169
Funktionsgraph, 169
Arcussinus, 169
Funktionsgraph, 169
Arcustangens, 169
Funktionsgraph, 169
Areacosinus Hyperbolicus, 170
Funktionsgraph, 171
Areacotangens Hyperbolicus, 171
Funktionsgraph, 172
Areasinus Hyperbolicus, 170
Funktionsgraph, 171
Areatangens Hyperbolicus, 171
Funktionsgraph, 172
Assoziativität, 7, 20
Auswahlaxiom, 62
Axiome, 9
Bernoullische Ungleichung, 19
beschränkt, 13
nach oben, 13
nach unten, 13
beschränkte
Folge, 60
Menge, 60
Betrag
komplexer Zahlen, 48
bijektiv, 6
Bildmenge, 5
Cauchy-Folge, 69
206
INDEX
Cauchy-Netz, 114
Cauchy-Schwarzsche Ungleichung, 53
Cauchysches Konvergenzkriterium
Folgen, 70
Reihen, 82
Cauchysches Restglied, 193
Charakteristik, 38
Cosinus, 158
Funktionsgraph, 163
Cosinus Hyperbolicus, 169
Funktionsgraph, 170
Cotangens, 168
Funktionsgraph, 168
Cotangens Hyperbolicus
Funktionsgraph, 171
Dedekindscher Schnitt, 44
Definitionsbereich, 5
Definitionsmenge, 4
dicht, 99
Dichteeigenschaft, 39
Differentialgleichung, 194, 199
Differentialgleichungen
Trennung der Variablen, 199
Differenz, 2
differenzierbar
n-mal, 181
im Punkt x, 175
rechtsseitig, 175
stetig, 181
Dirichlet Kriterium, 86
diskrete Metrik, 55
Distributivgesetz, 3
Distributivität, 20
divergent, 56, 78
bestimmt, 73
Dividieren mit Rest, 33
domain, 5
Doppelreihen, 121
Dreiecksungleichung, 16, 52
Dreiecksungleichung nach unten, 16
Einheitskreislinie, 102, 137
Einschränkung, 5
Elemente, 1
endlich, 25
Euklidischer Algorithmus, 201, 203
Eulersche Exponentialfunktion, 123
Eulersche Zahl, 67, 161
Existenz des neutralen Elementes, 20
207
Exponentialfunktion, 123, 158
Funktionsgraph, 160
Extremum
absolutes, 182
lokales, 182
faktorielle, 85
Folge, 56
Cauchy-Folge, 69
monoton fallende, 66
monoton wachsende, 65
monotone, 66
Rechenregeln für, 62
streng monoton fallend, 62
Formel von de Moivre, 158
Fortsetzung, 5
Funktion, 4
beschränkte, 60, 147
bijektive, 6
Einschränkung, 5
Fortsetzung, 5
injektive, 6
monoton fallende, 143
monoton wachsende, 143
stetige, 129
streng monoton fallende, 30, 143
streng monoton wachsende, 30, 143
surjektive, 6
unstetige, 141
zusammengesetzte, 7
Funktionen
trigonometrische, 158
Funktionswert, 4
Gaußklammer, 127
Gaußsche Zahlenebene, 48
gerichtete Menge, 108
Graph, 4
Grenzwert
einer Funktion, 124
einseitige, 126
linksseitiger, 126
rechtsseitiger, 126
Häufungspunkt
einer Folge, 104
einer Menge, 99
harmonische Reihe, 82
hebbare Unstetigkeit, 141
Hintereinanderausführung, 7
INDEX
208
imaginäre Einheit, 46
Imaginärteil, 46
Induktions
-anfang, 19
-prinzip, 19
-schritt, 19
Varianten d., 24
Infimum, 13
injektiv, 6
Integral
unbestimmtes, 197
Intervall, 136
Involution, 27
isolierter Punkt, 99
isometrische Abbildung, 129
Körper
angeordneter, 12
archimedisch angeordneter, 39
vollständig angeordneter, 40
Kürzungsregel, 20
kartesisches Produkt, 2
Kommutativität, 20
kompakt, 106
Komplement, 2
komplex differenzierbar, 177
konjugiert komplexen, 48
konvergent, 56, 78
absolut, 83
bedingt, 118
gegen ±∞, 73
gegen x, 56
gleichmäßig, 148
punktweise, 146
Konvergenz
gleichmäßige einer Funktionenfolge,
148
absolute einer Funktionenreihe, 153
einer Folge, 56
eines Netzes, 110
gleichmäßige einer Funktionenreihe,
153
komponentenweise, 71
punktweise einer Funktionenfolge,
146
punktweise einer Funktionenreihe,
153
unbedingte, 115
Konvergenzradius, 154
Kurvendiskussionen, 196
Lagranges Restglied, 193
leere Menge, 1
Leibniz Kriterium, 87
Lemma vom iterierten Supremum, 43
Limes Inferior, 67
Limes Superior, 67
linksstetig, 140
Logarithmus
natürlicher, 160
naturalis, 160
Logarithmus naturalis
Funktionsgraph, 161
lokale Eigenschaft, 131
Mächtigkeit, 25
Majorantenkriterium, 82
Maximum, 13
absolutes, 182
lokales, 182
Menge, 1
abgeschlossene, 99
Bild, 5
Differenz-, 2
Distributivgesetz-, 3
leere, 1
Ober-, 1
offene, 98
Potenz-, 3
Schnitt-, 2
Teil-, 1
Vereinigungs-, 2
zusammenhängende, 136
Mengen
getrennte, 136
Mengengleichheit, 1
Metrik, 52
euklidische, 52
Supremums-, 147
metrischer Raum
vollständiger, 69
Minimum, 13
absolutes, 182
lokales, 182
Minkowskische Ungleichung, 53
Minorantenkriterium, 82
Mittel
arithmetisches, 12
Mittelwertsatz, 184
monoton fallend, 66, 143
monoton wachsend, 65, 143
INDEX
Moore-Smith-Folge, 110
Multiplikation, 9, 20
Nachfolgerabbildung, 16
natürliche Zahlen, 16
Netz, 110
Cauchy-, 114
Teilfolge, 111
Teilnetz, 111
Norm, 56
obere Schranke, 13
Obermenge, 1
Partialbruchzerlegung
komplexe, 201
reelle, 203
Partialsumme, 78
Pi, 163
Polarkoordinaten, 164
Polynom
trigonometrisches, 167
Potenzmenge, 3
Potenzreihe, 157
Potenzreihen, 154
Primfaktorzerlegung, 33
Primzahl, 33
Produktregel, 178
Quotientenkörper, 39
Quotientenkriterium, 85
Quotientenregel, 178
Raabe Kriterium, 88
range, 5
Raum
metrischer, 52
Realteil, 46
rechtsstetig, 140
Reflexivität, 12
Regel von de L’Hospital, 186
Regel von der Partiellen Integration, 198
Reihe, 78
alternierende harmonische, 83
bestimmt divergente, 79
divergente, 78
geometrische, 59
harmonische, 82
konvergent gegen ±∞, 79
konvergente, 78
Potenzreihen, 154
209
Rechenregeln für, 79
Summe der, 78
Teleskop-, 81
Relationen, 7
Relationenprodukt, 7
Riemann-Zerlegung, 110
Riemannscher Umordnungssatz, 120
Satz
1. Mittelwertsatz der Differenzialrechnung, 184
2. Mittelwertsatz der Differenzialrechnung, 184
Cauchysches Konvergenzkriterium,
70, 82
Einschluss-, 61
Fundamentalsatz der Algebra, 166
Grenzwert- Abelscher, 172
Leibniz Kriterium, 87
Rekursions-, 17
Riemannscher Umordnungs-, 120
Taylorscher Lehrsatz, 193
von Bolzano-Weierstraß, 105
von Rolle, 182
Zwischenwertsatz, 137
Schlömilchsches Restglied, 193
Schnittmenge, 2
Sinus, 158
Funktionsgraph, 163
Sinus Hyperbolicus, 169
Funktionsgraph, 170
Sprungstelle, 141
Stammfunktion, 197
stetig, 129
an der Stelle x, 129
gleichmäßig, 139
linksseitig, 140
rechtsseitig, 140
streng monoton fallend, 143
streng monoton wachsend, 143
Substitutionsregel, 198
Summensätze, 159
Supremum, 13
Supremumsnorm, 152
surjektiv, 6
symmetrische Mengendifferenz, 116
Tangens, 168
Funktionsgraph, 168
Tangens Hyperbolicus
210
Funktionsgraph, 171
Taylorreihe, 194
Taylorsche Polynom, 192
Teilfolge, 58
Teilfolge eines Netzes, 111
Teilfolgen
gestattet, 123
Teilmenge, 1
Teilnetz, 111
teilt, 33
Totalität, 12
Transitivität, 12
Trennung der Variablen, 199
Unstetigkeit
1. Art, 141
2. Art, 141
hebbare, 141
Sprungstelle, 141
untere Schranke, 13
Urbild, 5
vollständiges, 5
Vereinigungsmenge, 2
Verknüpfung, 9
vollständige Induktion, 19
Weierstraß Kriterium, 153
Wertebereich, 5
Wertevorrat, 4
wohldefiniert, 4
Wurzel
einer komplexen Zahl, 165
einer reellen Zahl ≥ 0, 42
Wurzelkriterium, 83
Zahl
komplexe, 46
rationale, 34
Zahlen
natürliche, 16
positive, 12
Zerlegung, 109
Zielmenge, 4
INDEX
Herunterladen