Analysis I Version 10.2.2016

Werbung
Analysis I
Version 10.2.2016
Prof. Dr. D. Müller
WS 2015/16
Inhaltsverzeichnis
0 Übergang von der Schulmathematik zur Mathematik als wissenschaftlichem Fach: Exemplarisch
am Beispiel der Analysis
4
0.1 Relle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
0.2 Zur naiven“ Differentialrechnung der Schulmathematik . . . . . . . 6
”
1 Einleitung
17
2 Einige Grundbegriffe
2.1 Aussagen . . . . . . . . . . . . . . . . . . . . .
2.2 Mengen . . . . . . . . . . . . . . . . . . . . . .
2.3 Sätze und Beweise. Verknüpfung von Aussagen .
2.4 Quantoren . . . . . . . . . . . . . . . . . . . . .
2.5 Rechenregeln für Mengen. Indexmengen . . . . .
2.6 Mengen von Mengen . . . . . . . . . . . . . . .
2.7 Das kartesische Produkt zweier Mengen . . . . .
2.8 Funktionen . . . . . . . . . . . . . . . . . . . .
2.9 Direkte Beweise und Widerspruchsbeweise . . .
.
.
.
.
.
.
.
.
.
20
20
21
25
28
30
32
33
33
40
3 Natürliche Zahlen und vollständige Induktion
3.1 Beispiele zur vollständigen Induktion . . . . . . . . . . . . . . . . . .
3.2 Rekursion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Die axiomatische Methode . . . . . . . . . . . . . . . . . . . . . . . .
41
44
47
49
4 Die
4.1
4.2
4.3
4.4
4.5
4.6
4.7
51
51
53
55
56
59
62
63
reellen Zahlen
Körper . . . . . . . . . . . . . . .
Angeordnete Körper . . . . . . .
Der Absolutbetrag . . . . . . . .
Schranken . . . . . . . . . . . . .
Der Körper R . . . . . . . . . . .
Intervalle . . . . . . . . . . . . . .
Das Intervallschachtelungsprinzip
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Folgen, Grenzwerte, Unendliche Reihen
5.1 Rechenregeln für Grenzwerte und Kovergenzssätze
5.2 Teilfolgen, Häufungspunkte . . . . . . . . . . . .
5.3 Unendliche Reihen . . . . . . . . . . . . . . . . .
5.4 Uneigentliche Konvergenz . . . . . . . . . . . . .
5.5 b-adische Brüche . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
66
70
75
79
83
85
6 Abzählbare und überabzählbare Mengen
88
7 Die
7.1
7.2
7.3
91
93
94
96
komplexen Zahlen
Elementare Eigenschaften von C . . . . . . . . . . . . . . . . . . . . .
Konvergenz in C . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Algebraische Abgeschlossenheit von C . . . . . . . . . . . . . . . . . .
8 Mehr zur Konvergenz von Reihen
8.1 Weitere Konvergenzkriterien für Reihen
8.2 Limes superior und Limes inferior . . .
8.3 Das Wurzelkriterium . . . . . . . . . .
8.4 Potenzreihen. . . . . . . . . . . . . . .
8.5 Die Exponentialreihe . . . . . . . . . .
8.6 Bedingt konvergente Reihen. . . . . . .
8.7 Umordnung von Reihen . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9 Stetige Funktionen
9.1 Grenzwerte von Funktionen . . . . . . . .
9.2 Rechenregeln . . . . . . . . . . . . . . . .
9.3 Einseitige Grenzwerte . . . . . . . . . . . .
9.4 Stetigkeit . . . . . . . . . . . . . . . . . .
9.5 Der Zwischenwertsatz . . . . . . . . . . . .
9.6 Der Satz vom Maximum . . . . . . . . . .
9.7 Existenz von Umkehrfunktionen . . . . . .
9.8 Der Logarithmus, allgemeine Potenzen und
9.9 Hyperbelfunktionen . . . . . . . . . . . . .
9.10 Trigonometrische Funktionen: 1. Teil . . .
9.11 Gleichmäßige Konvergenz . . . . . . . . .
10 Differenzierbare Funktionen
10.1 Rechenregeln für die Ableitung
10.1.1 Einige Beispiele. . . . .
10.2 Ableitungen höherer Ordnung .
10.3 Extrema . . . . . . . . . . . . .
10.3.1 Satz von l’Hospital . . .
10.3.2 Fehlerabschätzung . . .
10.3.3 Monotonie . . . . . . . .
.
.
.
.
.
.
.
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Wurzeln
. . . . .
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
98
98
100
103
104
105
109
111
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
. 113
. 116
. 117
. 117
. 120
. 121
. 123
. 125
. 128
. 130
. 131
.
.
.
.
.
.
.
134
. 138
. 140
. 143
. 144
. 146
. 147
. 148
10.4 Trigonometrische Funktionen: 2. Teil. . . . . . . . . . . . . . . . . . . 148
10.5 Konvexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
11 Anhang A: Zur Konstruktion des Körpers R
11.1 Konstruktion der ganzen Zahlen . . . . . . . . .
11.2 Zu Konstruktion der rationalen Zahlen . . . . .
11.3 Zur Konstruktion der reellen Zahlen . . . . . .
11.4 Ein angeordneter Körper, der nicht archimedisch
4
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
angeordnet ist
.
.
.
.
.
.
.
.
159
. 159
. 163
. 164
. 169
Danksagung
Die in diesem Skript enthaltenen Graphiken verdanken ihre Existenz dem unermüdlichen Einsatz sowie der Sachkunde von Herrn Dipl. math. Martin Paulat, dem ich
an dieser Stelle ganz besonders danken möchte.
Literatur
1. Einige Standardlehrbücher, welche alle im Kern mehr oder weniger
denselben Standardlehrstoff vermitteln, doch mit teils deutlich unterschiedlichem Stil:
[F]
O. Forster, Analysis 1. Vieweg Studium
[K]
K. Königsberger, Analysis 1, Springer-Lehrbuch 1992
[AE] A. Amann, J. Escher, Analysis I, Birkhäuser 1998
[Br] Th. Bröcker, Analysis I, BI Wissenschaftsverlag 1992
[B]
C. Blatter, Analysis I, Heidelberger Taschenbuch 151
2. Ein Klassiker, zwar mit einem etwas altmodischen Zugang, dafür aber
sehr konkret und insbesondere für Lehramtsstudierende als Ergänzung
zur Vorlesung sehr zu empfehlen:
[C]
R. Courant, Vorlesungen über Differential- und Integralrechnung
Bd. 1, Springer 1971
3. Ausländische Klassiker“, teils im Stoff deutlich weitergehend:
”
[R]
W. Rudin, Analysis, Oldenbourg Verlag München, 2009 (Der
Baby-Rudin“)
”
[L]
S. Lang, Real and Functional Analysis, Springer Graduate Texts in
Math., 1993
[D]
J. Dieudonné, Foundations of modern analysis, Academic Press
1960
[HS] E. Hewitt, K. Stromberg, Real and Abstract Analysis, Springer
1969
4. Ein kürzlich ins Deutsche übersetztes typisches amerikanisches text”
book“, welches sehr ausführlich und umfangreich an den Lehrstoff heranführt, mit sehr vielen Beispielen und Übungsaufgaben:
G.B. Thomas, M.D. Weir, J. Hass, Analysis 1, Pearson Higher Education,
München 2013.
5
Kapitel 0
Übergang von der Schulmathematik zur Mathematik als
wissenschaftlichem Fach:
Exemplarisch am Beispiel der
Analysis
0.1
Relle Zahlen
Die Grundlage der Analysis bilden die Reellen Zahlen: R. In der Schule werden
diese i.d.R. auf zwei Arten veranschaulicht:
a) Als Punkte auf einer gedachten Zahlengeraden“
”
R
-3
-2
-1
0
1
√
2
2
e 3
Abbildung 1: Die reelle Zahlengerade
Dahinter verbirgt sich die Vorstellung der Euklidischen Geometrie, in der sich
Zahlen als Längen von Geradensegmenten in der Ebene ergeben:
√
Beispiel: Nach Pythagoras ist 2 die Länge der Hypothenuse in einem rechtwinkligen gleichschenkligen Dreieck mit Kathetenlänge 1.
Problem: Was genau ist denn eine Zahlengerade,“ oder die Ebene,“ in der
”
”
solch ein Dreieck liegt? Physikalisch lässt sich dies nicht begründen, denn in
jedem endlichen Raumbereich gibt es nur endlich viele Atome (z.B. in einem
Kreidestrich). Dagegen sollen ja wohl selbst in Intervallen endlicher Länge der
Zahlengeraden unendlich viele Zahlen liegen, falls das Intervall positive Länge
hat.
6
π/2
1
1
√
2
Problem des Unendlichen! Wieviele Arten von Unendlich gibt es? Diese
Frage führt rasch hinein in die Tiefen der Mathematischen Logik, der Philosophie, etc..
b) Durch die Dezimalbruchentwicklung reeller Zahlen.
Mit Hilfe des Intervallschachtelungsprinzips wird in der Schule gezeigt,“ dass
”
man jede reelle Zahl in einen in der Regel unendlichen Dezimalbruch entwickeln
kann.
Beispiel:
√
2 = 1, 414213562373095...
Aber: Was heißt das genau? Die obige Entwicklung ist letztlich eine Kurzschreibweise für die unendliche Reihe
√
2 = 1 · 100 + 4 · 10−1 + 1 · 10−2 + 4 · 10−3 + 2 · 10−4 + 1 · 10−5 + 3 · 10−6 + · · · ,
d.h. für den Grenzwert der Folge der Partialsummen welche man erhält,
wenn man die obige Reihenentwicklung jeweils nach endlich vielen Schritten
abbricht, d.h. der Folge
a0 = 1 · 100 = 1,
a1 = 1 · 100 + 4 · 10−1 = 1, 4,
a2 = 1 · 100 + 4 · 10−1 + 1 · 10−2 = 1, 41 ,
..
.
Fragen: Hier wird unterstellt, dass die Folge a0 , a1 , a2 , a3 , a4 , a5 , · · · (rationaler
Zahlen) einem Grenzwert zustrebt! Was heißt dies denn genau? Und worin liegt
denn dieser Grenzwert?
Fazit: Eigentlich ist ziemlich unklar, was R ist! Offenbar ist der Begriff der
reellen Zahl aufs Engste mit dem Begriff des Grenzwertes verknüpft, welcher
in der Schule meist nur noch vage beschrieben wird.
All diese Fragen haben historisch in der Entwicklung der Mathematik zu diversen Grundlagenkrisen geführt:
18. u. frühes 19. Jahrhundert: Der Begriff der infinitesimalen“ Größe/ Grenz”
wertbegriff.
7
Beginn 20. Jahrhundert: Der Mengenbegriff, Eigenschaften von R (z.B. Kontinuumshypothese).
Diese Krisen haben dazu geführt, dass man in der modernen Mathematik
formal logisch nach strengen Regeln argumentiert, ausgehend von gewissen
Grundannahmen (Axiomen). Studienanfänger müssen all dies erst erlernen, sowie sich einem hohem Abstraktionsniveau stellen!
0.2 Zur naiven“
”
Schulmathematik
Differentialrechnung der
Betrachte eine Funktion f : D −→ R, wobei D ⊂ R eine geeignete“ Teilmen”
ge von R sei (z.B. ein offenes Intervall ]a, b[, mit a < b).
Frage: Was genau ist eine Funktion?
Ist x ∈ D ein Punkt in D, so heiße f im Punkt x differenzierbar, wenn der
Grenzwert
f ′ (x) = lim
h→0
h6=0
f (x + h) − f (x)
h
in R existiert.
Beachte: Damit für genügend kleines“ h 6= 0 der Ausdruck f (x + h) Sinn
”
macht, muss f auf einer Umgebung“(ein topologischer Begriff) definiert sein.
”
Achtung: Wieder spielt der Begriff des Grenzwerts eine zentrale Rolle!
Beispiele:
a) f (x) = x, D = R: Hier ist
f (x + h) − f (x)
x+h−x
=
=1
h
h
für alle h 6= 0. Also folgt: die Ableitung f ′ (x) existiert für jedes x ∈ R, und es
ist f ′ (x) = 1.
b) f (x) = x2 , D = R : Hier sieht man mittels der binomischen Formel, dass
f (x + h) − f (x)
(x + h)2 − x2
x2 + 2xh + h2 − x2
=
=
= 2x + h.
h
h
h
Und, für h → 0 strebt 2x + h gegen 2x (Beweis?). Hinter diesem etwas vagen
Argument verbirgt sich schon der Begriff der Stetigkeit einer Funktion, wie
8
auch die Gültigkeit gewisser Grenzwertsätze über stetige Funktionen,
welche wir später beweisen werden.
Folge:
f (x+h)−f (x)
h
→ 2x für h → 0, d.h. f ′ (x) = 2x.
Der Begriff der Ableitung besitzt folgende wohlbekannte Geometrische Interpretation:
Seien
∆y := f (x + h) − f (x) und ∆x := x + h − x = h.
Dann ist anschaulich
∆y
f (x + h) − f (x)
=
∆x
h
die Steigung der Sekante durch die Punkte (x, f (x)) und (x + h, f (x + h))
des Graphen von f.
Anschauliche Vorstellung: für ∆x = h → 0 strebt“ die Steigung ∆y/∆x
”
df
(x) der Tangente an den Graphen
der Sekante gegen die Steigung f ′ (x) = dx
von f im Punkt (x, f (x)):
∆y
dy
df (x)
=
(x) =
= f ′ (x).
∆x→0 ∆x
dx
dx
lim
Physiker interpretieren dx und dy oft als infinitesimale Größen“ oder
”
Differentiale“ . Streng genommen macht dies allerdings keinen Sinn! Ei”
ne mathematisch solide Definition von Differentialen ist erst von Elie Cartan
(1869-1951) gegeben worden!
Je komplizierter eine Funktion wird, desto schwieriger wird es im allgemeinen,
ihre Ableitung zu bestimmen (falls diese überhaupt existiert).
Bereits für allgemeine Monome f (x) = xn , mit n ∈ N = {0, 1, 2, 3, ...}, ist es
nicht mehr ganz so einfach, oder auch allgemeinere Polynome
f (x) = a0 + a1 + a2 x2 + ... + an xn ,
√
6
wie z.B. f (x) = −6x5 + 11x1001 − 3 x10 .
mit a0 , a1 , ..., an ∈ R,
Hier helfen die grundlegenden Rechenregeln für das Differenzieren:
Satz 0.1 Es seien f und g im Punkte x ∈ R differenzierbare Funktionen,
sowie α,β ∈ R. Dann sind auch die Funktionen αf + βg, f g und f /g (falls
g(x) 6= 0) differenzierbar in x, und es gilt:
(i) (αf +βg)′(x) = αf ′ (x)+βg ′(x) ( Linearität der Ableitung; s.Lin.Alg.),
(ii) (f g)′(x) = f ′ (x)g(x) + f (x)g ′ (x) (Produktregel),
(iii) ( fg )′ (x) =
f ′ (x)g(x)−f (x)g ′ (x)
g(x)2
(Quotientenregel).
9
Ein solcher mathematischer Satz bedarf eines sauberen Beweises! Dazu
müssten allerdings alle verwendeten Begriffe sauber definiert sein- dies leistet
die Schulmathematik im allgemeinen jedoch nicht mehr! Z.B. bedarf es einer
sauberen Definition des Grenzwertbegriffs - dies soll im Laufe der Vorlesung
bereitgestellt werden! Eine mögliche Begründung von Satz 0.1, wie sie vielleicht
in der Schule geliefert wurde, sieht folgendermaßen aus:
Schulbeweis“ von Satz 0.1:
”
Zu (i): Es gilt
(αf + βg)(x + h) − (αf + βg)(x)
h
αf (x + h) + βg(x + h) − (αf (x) + βg(x)
=
h
g(x + h) − g(x)
f (x + h) − f (x)
+β
.
=α
h
h
Dieser Ausdruck strebt“ für h → 0 gegen αf ′ (x) + βg ′ (x). Also ist
”
(αf + βg)′(x) = αf ′(x) + βg ′(x).
Zu (ii): Es gilt
f (x + h)g(x + h) − f (x)g(x)
(f g)(x + h) − (f g)(x)
=
h
h
(f (x + h) − f (x))g(x + h) + f (x)(g(x + h) − g(x))
=
h
g(x + h) − g(x)
f (x + h) − f (x)
g(x + h) + f (x)
.
=
h
h
Dieser letzte Ausdruck sollte anschaulich“ für h → 0 gegen
”
′
f (x)g(x) + f (x)g ′(x)
streben.
Eine genaue Begründung der letzten Aussage ist jedoch gar nicht so einfach:
sie erfordert die Stetigkeit von g in Punkt x (d.h. lim g(x + h) = g(x)), sowie
gewisse Rechenregeln für Grenzwerte!
Zu (iii): Übung!
Q.E.D.
Beispiel c): Für n ∈ N sei fn (x) := xn , x ∈ R.
Dann gilt
(1)
h→0
dxn
dfn
(x) =
= nxn−1 .
dx
dx
10
Beweis. Für n = 0, 1, 2 ist dies einfach (s. Beispiele a) und b)).
Angenommen, wir haben (1) für irgendein n bewiesen. Wir zeigen dann,
dass es auch für n + 1 gilt (stellen Sie sich z.B. n = 2, n + 1 = 3 vor, etc.). Wir
zerlegen dazu fn+1 als Product
fn+1 (x) = xn+1 = x · xn = f1 (x) · fn (x).
Mit der Produktregel folgt daher: fn+1 ist differenzierbar, da ja f1 und fn dies
sind, und es folgt:
′
fn+1
(x) =
=
=
=
=
f1′ (x)fn (x) + f1 (x)fn′ (x)
1 · xn + x · n · xn−1
1 · xn + n · x · xn−1 (Kommutativität von R !)
1 · xn + n · xn
(n + 1) · xn (Distributivität von R !).
Mit Hilfe des Prinzips der vollständigen Induktion (einer fundamentalen
Eigenschaft der Menge N der natürlichen Zahlen!) folgert man daraus, dass
(1) für jede natürliche Zahl n ∈ N gilt:
Die Formel (1) gilt für n = 0, 1, 2, d.h. für 1, x, x2 , folglich auch für x3 , folglich
auch für x4 , folglich auch für x5 , dann auch für x6 , ....
Somit sollte sie auch für alle n gelten; beweisen lässt sich dieses Prinzip jedoch
nicht, denn niemand von uns lebt lang genug, um dieses Verfahren bis in alle
Ewigkeit fortzusetzen.
Q.E.D.
Weitere klassische Funktionen:
Die Exponentialfunktion exp : R → R, exp(x) = ex , e = Eulersche Zahl,
exp
besitzt die Ableitung exp′ (x) = d dx
(x) = exp(x), kurz:
dex
dx
= ex
(später werden wir eine saubere Definition der Exponentialfunktion geben und
dann diese Formel auch beweisen. Ähnliches gilt für die nachfolgenden Funktionen).
Die Trigonometrischen Funktionen: Diese werden in der Schule bekanntlich geometrisch definiert anhand von Seitenverhältnissen rechtwinkliger Dreiecke. Insbesondere gilt nach Pythagoras die Formel
sin2 α + cos2 α = 1
11
für alle α ∈ R
Ferner sei an die Additionstheoreme für die trigonometrischen Funktionen erinnert, wie z.B. das für den Sinus:
sin(α + β) = sin α cos β + cos α sin β
Wählt man α = x und β = π/2, so liefert dieses wegen sin(π/2) = 1 und
cos(π/2) = 0 insbesondere folgenden wohlbekannten Zusammenhang zwischen
dem Sinus und dem Cosinus:
cos x = sin(x +
π
).
2
Für die Ableitungen dieser Funktionen gelten folgende Formeln:
d sin x
dx
= cos x,
d cos x
dx
= − sin x
Der Tangens sowie der Cotangens sind definiert durch:
x 6∈ { π2 + kπ : k ∈ Z},
x 6∈ {kπ : k ∈ Z}.
sin x
,
tan x := cos
x
cos x
cot x
:= sin x ,
Für die Ableitung des Tangens ergibt sich aus der Quotientenregel
sin′ x cos x − sin x cos′ x
d tan x
=
dx
cos2 x
cos x cos x − sin x(− sin x)
=
cos2 x
2
cos x + sin2 x
=
,
cos2 x
d.h. es gilt
d tan x
dx
=
1
cos2 x
Analog zeigt man:
d cot x
dx
= − sin12 x
Hyperbelfunktionen: Der hyperbolischer Cosinus und der hyperbolische Sinus sind definiert durch
cosh x :=
ex + e−x
,
2
12
sinh x :=
ex − e−x
,
2
und der hyperbolischer Tangens sowie der hyperbolische Cotangens durch
tanh x :=
sinh x
,
cosh x
coth x =
cosh x
,
sinh x
wobei der hyperbolische Cotangens offenbar nur für x 6= 0 definiert ist, da
bei 0 der hyperbolische Sinus eine (und auch die einzige) Nullstelle hat. Für
die Ableitungen von sinh und cosh erhält man mit Hilfe unserer Rechenregeln
ganz leicht folgende Formeln:
d cosh x
dx
= sinh x,
d sinh x
dx
= cosh x
Zur Übung bestimme man die Ableitung von coth x und tanh x.
Die Umkehrfunktion der Exponentialfunktion: der natürliche Logarithmus:
Die Exponentialfunktion
exp : R → R+
bildet R bijektiv“ (d.h. umkehrbar) auf die positive Halbachse ]0, ∞[=: R+
”
ab (dies werden wir später beweisen!). Die Umkehrfunktion der Exponentialfunktion, d.h. der natürliche Logarithmus
log : R+ → R,
bildet daher R+ bijektiv auf ganz R ab:
Falls y = ex ist, so ist y > 0 und x = log y , und umgekehrt!
Achtung: Aus gutem Grund werde ich den natürlichen Logarithmus, der oft
auch mit x = ln y bezeichnet wird, mit log bezeichnen (log x steht ärgerlicherweise in der Schule manchmal für den Logarithmus von x zu Basis 10, was
eher nicht natürlich ist – die Wahl der Basis 10 hat wohl eher etwas damit zu
tun, dass wir zufällig 10 Finger haben). Der Logarithmus zu Basis 10 wird bei
mir mit log10 bezeichnet.
Um zusammengesetzte Funktionen abzuleiten, insbesondere Umkehrfunktionen, benötigt man noch die Kettenregel. Diese werde ich an dieser Stelle
nur eher so formulieren, wie man es vielleicht in der Schule gesehen hat, also
etwas unsauber – im Verlauf der Vorlesung wird auch dies präzisiert werden:
Satz 0.2 (Kettenregel) Wenn u 7→ f (u) an der Stelle u = g(x) und x 7→
g(x) an der Stelle x differenzierbar ist, so ist auch die zusammengesetzte“
”
oder verkettete“ Funktion (f ◦ g)(x) := f (g(x)) differenzierbar an der Stelle
”
x, und es gilt
(f ◦ g)′(x) = f ′ (g(x)) g ′ (x).
13
In der
”
gilt also für y = f (x) und u = g(x):
Leibniz-Schreibweise“
dy du
dy
=
· ,
dx
du dx
wobei
dy
du
bei u = g(x) bestimmt wird.
(Gottfried Wilhelm Leibniz (1646 - 1716) war neben Isaac Newton (1642
- 1726) einer der Hauptbegründer der Differentialrechnung, wobei zuvor bereits
René Descartes (1596 - 1650) sowie Bonaventura Cavalieri (1598 - 1647)
als wichtige Wegbereiter für diesen Infinitesimalkalkül“ fungierten).
”
Schulbeweis“ der Kettenregel: Sei
”
∆u := g(x + ∆x) − g(x) = g(x + ∆x) − u
die Veränderung von u, wenn sich x um ∆x verändert. Dann ändert sich y =
f ◦ g(x) um
∆y = f (g(x + ∆x))) − f (g(x)) = f (u + ∆u) − f (u).
Für ∆u 6= 0 können wir den Bruch
f ◦ g(x + ∆x) − f ◦ g(x)
∆y
=
∆x
∆x
also schreiben als
∆y ∆u
∆y
=
·
,
∆x
∆u ∆x
(2)
und dann den Grenzübergang für ∆x → 0 durchführen:
dy
=
dx
∆y
∆y ∆u
= lim
·
∆x→0 ∆x
∆x→0 ∆u ∆x
lim
=
∆y
∆u
· lim
∆x→0 ∆u ∆x→0 ∆x
=
∆y
∆u
· lim
∆u→0 ∆u ∆x→0 ∆x
=
dy du
· .
du dx
lim
lim
(Grenzwertsätze !)
(es gilt ∆u → 0 für ∆x → 0, da g stetig !)
Achtung: Dieses Argument hat einen Haken: Auch für ∆x 6= 0 kann ∆u = 0
sein, so dass die Erweiterung mit ∆u in Gleichung (2) nicht mehr möglich ist!
14
Wir werden später einen sauberen Beweis liefern, welcher eine völlig andere
Charakterisierung des Begriffs der Ableitung mittels Linearisierung benutzt.
Beispiel: Ableitung des natürlichen Logarithmus log:
Da log die Umkehrfunktion von exp ist, gilt
(3)
elog y = exp(log y) = y
log(ex ) = log(exp x) = x
für alle y > 0,
für alle x ∈ R.
Insbesondere gilt also exp ◦ log y = y für alle y > 0, d.h. exp ◦ log ist die
identische Abbildung y 7→ y. Mit der Kettenregel folgt daher mit x = log y
d exp
d log
dy
=
(log y) ·
(y)
dy
dx
dy
d log
(y)
= exp(log y) ·
dy
d log
= y·
(y).
dy
1 =
Hieraus folgt sofort
d log
(y)
dy
= y1 , also
log′ (y) = y1 ,
y>0
Bemerkungen zur Einführung des natürlichen Logarithmus und der
Exponentialfunktion in der Schule:
In der Schule geht man besser anders vor und führt am besten zunächst den
natürlichen Logarithmus ein durch das Integral
Z y
1
dt,
y > 0.
ln y :=
1 t
Dann zeigt man, dass ln : R+ → R eine umkehrbar eindeutige (d.h. bijektive)
Funktion ist, und definiert dann exp : R → R+ als deren Umkehrfunktion. Der
Hauptsatz der Differential- und Integralrechnung zeigt dann, dass ln′ (y) = 1/y
ist, und ähnlich wie zuvor (nur unter Vertauschung der Rollen von exp und
ln) folgert man mittels Kettenregel, dass dann exp′ (x) = exp(x) ist.
Man erhält mit diesem Zugang zugleich einen kurzen Beweis der folgenden
fundamentalen Identitäten:
(4)
(5)
ln(ab) = ln(a) + ln(b)
für alle a, b > 0.
ex+z = ex · ez
für alle x, z ∈ R.
15
In der Tat folgt (4) aus den Regeln für das Rechnen mit Integralen:
Z
ln(ab) =
ab
1
Z
1
dt =
t
a
1
1
dt +
t
Z
ab
a
1
dt,
t
wobei die Substitution t = as im zweiten Integral zeigt, dass
Z
a
ab
1
dt =
t
Z
1
b
1
ds = ln b
s
ist.
(5) ergibt sich dann sofort aus (4): setze dazu a := ex , b := ey . Nach (4) gilt
dann also
ln(ex · ey ) = ln(ex ) + ln(ey ) = x + y,
woraus durch Anwendung von exp auf beiden Seiten dieser Identität (5) folgt.
In der Fachmathematik geht man jedoch anders vor: aus exp′ = exp folgt (per
Induktion!), dass auch für jede höhere Ableitung der Ordnung k gilt exp(k) =
exp . Die sogenannte Taylorreihe von exp (all dies wird später behandelt
werden) sieht dann folgendermaßen aus:
exp(x) = 1 +
x
x2 x3 x4
+
+
+
+··· .
1! 2!
3!
4!
In der Tat werden wir die Exponentialfunktion später durch diese unendliche
Reihe definieren! Dieser Zugang wird den Vorteil haben, dass wir dies auch
gleich für komplexe Zahlen x ∈ C werden tun können, was, wie wir sehen
werden, große Vorteile mit sich bringt. Für die Schulmathematik ist dieser
Zugang, der allerdings tiefere Erkenntnisse mit sich bringt, jedoch ungeeignet!
Allgemeine Exponentialfunktionen/Potenzen:
Für allgemeines a > 0 setzt man
ax := ex log a = exp(x log a),
x∈R
Nach der Kettenregel gilt dafür
dax
d
= exp′ (x log a) · (x log a)
dx
dx
= exp(x log a) · log a
= ax log a,
d.h. es gilt
16
dax
dx
= log a · ax ,
a > 0, x ∈ R
Vertauscht man die Rollen von a und x, so erhält man die allgemeine Potenzfunktion
xα := eα log x , (x > 0, α ∈ R).
Hierfür folgt mit der Kettenregel:
d
dxα
=
(exp ◦(α log))(x)
dx
dx
d
= exp′ (α log x) · (α log)(x)
dx
1
= exp(α log x) · (α · )
x
α α
= x · ,
x
d.h.
d
(xα )
dx
= α xα−1 ,
x > 0, α ∈ R
Für α = −1 ergibt sich insbesondere
d −1
1
d 1
( )=
(x ) = −x−2 = − 2 ,
dx x
dx
x
x > 0.
Übung: Zeige, dass diese Formel allgemein für x 6= 0 gültig ist (Hinweis:
Produktregel !), und leite damit sowie der Kettenregel die Quotientenregel für
die Ableitung von f /g her (zunächst für f = 1).
Einige Beispiele:
(a) Sei y(t) = (t tan t)10 .
Der natürliche Definitionsbereich von y ist der von tan, d.h. die Menge D =
R \ { π2 + kπ : k ∈ Z}.
Mit f (u) := u10 und u = g(t) = t tan t gilt dann y(t) = f (g(t)) = f ◦ g(t).
Ferner ist nach der Produktregel
1
cos2 t
sin t · cos t
t
=
+
2
cos t
cos2 t
t + sin t cos t
.
=
cos2 t
g ′ (t) = 1 · tan t + t ·
17
Da f ′ (u) = 10u9 ist, folgt zusammen mit der Kettenregel also
y ′(t) = f ′ (g(t))g ′(t)
t + sin t cos t
= 10 g(t)9
cos2 t
t + sin t cos t
= 10(t tan t)9
.
cos2 t
(b) Sei f (x) = xx für x > 0.
Hier ist der Definitionsbereich also die Menge D = R+ .
Achtung: Es gilt nicht f ′ (x) = x xx−1 !
Sondern: Per definitionem ist xx = ex log x , d.h. es ist
f (x) = exp(x log x).
Setzen wir g(x) := x log x, so it also f = exp ◦g, so dass nach der Kettenregel
f ′ (x) = exp′ (g(x)g ′(x)
= exp(g(x))g ′(x)
= f (x) g ′ (x)
1
= xx · (1 · log x + x · ) (Produktregel)
x
x
= (1 + log x) x .
Somit ist also
dxx
= (1 + log x) xx ,
dx
18
x > 0.
Kapitel 1
Einleitung
Die reellen Zahlen bilden das Fundament der klassischen Analysis. In der Schule
werden in der Regel gewisse Vorstellungen von den Begriffen natürliche Zahl“,
”
ganze Zahl“, rationale Zahl“, reelle Zahl“ und vielleicht auch schon komplexe
”
”
”
”
Zahl“ vermittelt. Unter einer reellen Zahl stellt man sich dann meist einen Punkt
auf einer gedachten Zahlengeraden vor, d.h. einer unendlichen Geraden, auf der man
einen beliebigen Punkt als den Nullpunkt festgelegt hat, und einen anderen als den
Punkt 1. Die Strecke zwischen diesen beiden Punkten dient dann als Maßstab, um
zunächst jeder positiven oder negativen rationalen Zahl eine bestimmte Stelle auf der
Zahlengeraden zuzuordnen. Dass man damit nicht alle Punkte auf der Zahlengeraden
erhält, wussten schon die alten Griechen“, aber selbst der mathematische Gigant
”
Pythagoras konnte sich mit der Existenz irrationaler Zahlen nicht abfinden (der
Legende nach ging dies soweit, dass er seinen√Schüler Hippasus töten ließ, als dieser
ihm einen Beweis für die Irrationalität von 2 präsentierte, mit der Begründung,
er habe damit gegen die Grundregeln des Bundes der sogenannten Pythagoräer“
”
verstoßen).
Betrachtet man nämlich beispielsweise ein rechtwinkliges gleichschenkliges Dreieck,
dessen Katheten die Länge 1 haben, und bezeichnen wir mit r die Länge der Hypotenuse, so gilt nach Pythagoras r 2 = 12 + 12 = 2. r sollte natürlich einer reellen
Zahl entsprechen, nämlich dem Punkt auf der Zahlengeraden, dessen Abstand zum
Punkt Null (in positiver Richtung) gleich der Länge der Hypotenuse des gegebenen Dreiecks ist. Zweihundert Jahre nach Pythagoras argumentierte Euklid nun wie
folgt:
Wäre r rational, d.h. von der Form r = pq mit ganzzahligen, von Null verschiedenen
p und q, so folgte p2 = 2q 2 . Dabei können wir annehmen, dass p und q keinen
gemeinsamen Teiler haben, weil wir durch solch einen von vornherein hätten kürzen
können. Da p2 aufgrund der obigen Gleichung gerade sein muss, so muss auch p
gerade sein, d.h. von der Form p = 2m mit ganzzahligem m. Hieraus folgt 2q 2 =
p2 = 4m2 , d.h. q 2 = 2m2 , und mit demselben Argument wie oben schließt man, dass
auch q gerade sein muss.
Somit besäßen also p und q den gemeinsamen Teiler 2, entgegen unserer Annahme,
dass beide teilerfremd seien. Unsere Annahme, dass r rational sei, hat somit zu
19
einem Widerspruch geführt, und ist damit falsch.
Die eben durchgeführte - für das Wesen eines√indirekten Beweises charakteristische - Schlussweise lehrt, dass dem Zeichen 2 keine rationale Zahl entsprechen
kann.
Nun möchte man man mit reellen Zahlen natürlich auch rechnen, womit sich die alten
Griechen aufgrund ihrer rein geometrischen Vorstellungen von Zahlen als Punkten
auf der Zahlengeraden jedoch schwertaten. Um mit reellen Zahlen zu rechnen, ordnen
wir heutzutage daher in der Regel einem gegebenen Punkt auf der Zahlengeraden
eine endliche oder auch unendliche Dezimalzahl zu, wie beispielsweise
987, 654321,
−5, 78787878 . . . ,
3, 41421 . . . .
Für Punkte im Intervall zwischen 0 und 1 geschieht dies beispielsweise, indem wir
das Intervall zunächst in 10 gleichlange Teilintervalle einteilen, welche wir der Reihe nach durch die Ziffern 0,1,2,. . . ,9 kennzeichnen. Liegt der gegebene Punkt r nun
beispielsweise im Intervall mit der Ziffer a1 (Achtung: dieses Intervall muss nicht eindeutig sein!), so unterteilen wir in einem zweiten Schritt dieses Intervall wieder in 10
gleichlange Teilintervalle, welche wieder durch die Ziffern 0,1,2,. . . ,9 gekennzeichnet
werden. Es sei dann a2 die Ziffer desjenigen Intervalles, welches den Punkt r enthält.
Teilt man nun wiederum dieses Teilintervall in 10 Teilintervalle ein, und fährt mit
diesem Verfahren fort, so erhält man eine unendliche Folge von Ziffern a1 , a2 , a3 , . . .
zwischen 0 und 9. Dem Punkt r wird dann die unendliche Dezimalzahl 0, a1 a2 a3 . . .
zugeordnet. Diese unendliche Dezimalzahl wird dann wie folgt interpretiert:
Bricht man die unendliche Dezimalzahl an der n-ten Stelle ab, d.h. betrachtet man
die rationale Zahl rn = 0, a1 a2 . . . an , so beträgt der Abstand zwischen r und rn
höchstens 101n .
Wir rechnen“ dann mit reellen Zahlen wie folgt:
”
Sind beispielsweise r = 0, a1 a2 a3 . . . und s = 0, b1 b2 b3 zwei reelle Zahlen, und rn =
0, a1 . . . , an , sn = 0, b1 . . . , bn die approximierenden Folgen rationaler Zahlen, so
multiplizieren wir beispielsweise r und s, indem wir zunächst die Produkte rn sn
betrachten und anschließend den Grenzwert“ von rn sn bestimmen, wenn n gegen
”
Unendlich“ strebt. Diesen bezeichnen wir als das Produkt rs.
”
Leider mussten wir bei diesem Verfahren Begriffe benutzen, wie z.B. den des Grenz”
wertes“, aber auch den des Unendlichen“, die noch gar nicht klar definiert sind,
”
sondern von denen wir nur gewisse intuitive Vorstellungen besitzen (gleiches gilt für
den Begriff unendliche Gerade“). Ferner wissen wir, dass gewisse reelle Zahlen zwei
”
verschiedene unendliche Dezimalzahldarstellungen besitzen, wie beispielsweise der
Punkt 1 die Darstellungen 1,000... und 0,9999... hat – wie erklärt sich dies? Schließlich haben wir bei der Wahl des Dezimalsystems Willkür walten lassen – wir hätten
ebensogut das Dualsystem, das Hexadezimalsystem oder jedes andere b-adische System benutzen können. Dies würde zu anderen Approximationen der reellen Zahlen
r und s durch rationale Zahlenfolgen (rn′ ) und (s′n ) führen. Können wir dann sicher
20
sein, dass die Produkte von r und s, welche wir in diesen Zahlensystemen berechnen, stets dieselbe reelle Zahl ergeben? Historisch betrachtet haben Mathematiker
noch bis Mitte des 19. Jahrhunderts mit solch vagen Begriffen von reellen Zahlen
hantiert, bevor durch R. Dedekind und G. Cantor ein systematischer Aufbau einer
allgemeinen Theorie der reellen Zahlen erfolgte.
Da ein solcher systematischer Aufbau des Zahlensystems jedoch ein gewisses Maß
an Abstraktion voraussetzt und zudem recht zeitaufwendig ist, werden wir in der
Vorlesung die reellen Zahlen dadurch beschreiben, dass wir ein Axiomensystem für
die Menge R der reellen Zahlen mit den Operationen + und · sowie die Anordnung
≤ angeben, also ein System von Sätzen, welche wir immer voraussetzen werden und
aus denen alles Weitere mit den Regeln der Logik gefolgert wird. Es bleibt dann
natürlich die Frage, ob es irgendwo in der Welt oder außerhalb derselben etwas gibt
oder etwas konstruierbar ist, welches alle diese vorausgesetzten Axiome erfüllt, d.h.
ob es R überhaupt gibt.
Ausgehend von der Existenz der Menge der natürlichen Zahlen N (welche wiederum auf die sogenannten Peano-Axiome zurückgeführt werden kann), werden wir in
Anhang A andeuten, wie man tatsächlich mittels N die Menge der ganzen Zahlen
Z, anschließend die der rationalen Zahlen Q und schließlich die der reellen Zahlen
R konstruieren kann.
Bevor wir uns den Fragen der reellen Analysis zuwenden können, werden wir
zunächst eine Reihe von für die moderne Mathematik grundlegenden Begriffen behandeln.
21
Kapitel 2
Einige Grundbegriffe
2.1
Aussagen
Unter einer Aussage versteht man jeden Satz, von dem man sinvollerweise
behaupten kann, dass er entweder wahr oder falsch ist. Eine andere Möglichkeit
gibt es nicht, und eine Aussage kann nicht gleichzeitig wahr und falsch sein.
Beispiele.
• Die Aussage 4 ist größer als 3“ ist wahr.
”
• Die Aussage Es gibt eine größte natürliche Zahl“ ist falsch.
”
• Aber der Satz Dieser Satz ist falsch“
”
ist keine Aussage: Wäre er eine Aussage, und wäre sie wahr, so wäre der Satz
falsch, was sich widerspricht, und wäre sie falsch, so träfe der Sachverhalt nicht
zu, also wäre der Satz wahr, und nicht falsch.
Ist A eine Aussage, so erhält man durch Negation, d.h. die Verneinung”, die
”
neue Aussage ¬A (in Worten: nicht A“). Hierbei ist ¬A wahr dann und nur dann,
”
wenn A falsch ist, und ¬A ist falsch genau dann, wenn A wahr ist.
Beispiele.
• Ist A1 die Aussage es regnet“, so ist ¬A1 die Aussage es regnet nicht“.
”
”
• Die Negation der Aussage A2 Alle Menschen sind blond“ ist die Aussage ¬A2
”
Es gibt mindestens einen Menschen, der nicht blond ist“,
”
(und nicht etwa Kein Mensch ist blond“!).
”
Achtung: Anstelle der Aussage ¬A2 sagt man in der Mathematik oft kürzer Es
”
gibt einen Menschen, der nicht blond ist“. Damit ist aber nicht gemeint, dass
es genau einen Menschen gibt, der nicht blond ist, sondern wenigstens einen,
22
eventuell auch mehrere.
Allgemein gilt das Prinzip der doppelten Verneinung”:
”
(2.1)
Die Aussage ¬¬A := ¬(¬A) ist gleichbedeutend zur Aussage A.
Das Symbol
:=“ steht dabei in der Mathematik für ist definitionsgemäß gleich“.
”
”
Sprachlich gefaßt: Ist es falsch, dass die Aussage A falsch ist, so ist die Aussage
”
A wahr, und umgekehrt, d.h. die Aussagen ¬¬A und A sind gleichbedeutend (oder
äquivalent”.)
”
2.2
Mengen
Die Gegenstände, Begriffe und Objekte, mit denen in der Mathematik hantiert
werden, existieren im Denken. Sie können unmittelbare Entsprechungen im Alltagsbereich haben, aber auch sehr weit von sinnlichen Erfahrungen entfernt sein. Über
das Verhältnis von Mathematik und Realität lässt sich viel sagen und kontrovers
diskutieren – das wollen wir hier nicht tun.
Mathematische Objekte, wie immer man sie auch interpretieren will, werden seit
geraumer Zeit in der Sprache der Mengenlehre formuliert. Wir wollen gemäß der
naiven Mengenlehre“ den Vorstellungen Georg Cantors folgen, welcher um 1895
”
folgenden Begriff vorschlug:
Unter einer Menge verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die
Elemente von M genannt werden) zu einem Ganzen.
Ist m Element von M, so schreiben wir
m∈M
( m ist Element von M“).
”
Liegt ein Objekt x nicht in M, so schreiben wir
x∈
/M
( x ist kein Element von M“).
”
Eine Menge lässt sich z.B. dadurch angeben, dass man ihre Elemente einzeln aufschreibt, wie z.B.
{1, 3, 5, 7} .
Es kann aber sein, dass man dies nicht will oder kann (z.B. weil die Menge unendlich
viele Elemente hat), wie etwa bei
(2.2)
N = {0, 1, 2, 3, 4, . . .}
23
oder
(2.3)
Z = {0, 1, −1, 2, −2, 3, −3, . . .}
Mit den Pünktchen unterstellt man, dass es klar ist, wie es weitergeht“. Eine an”
dere Möglichkeit, neue Mengen zu erhalten, ist die Bildung von Teilmengen bereits
bekannter Mengen. Eine Menge N heißt Teilmenge einer Menge M, geschrieben,
N ⊂M,
wenn jedes Element von N auch ein Element von M ist. Man kann Teilmengen
dadurch angeben, dass man eine definierende Eigenschaft“ ihrer Elemente vorgibt.
”
Beispiel.
G := {n ∈ N : es gibt ein m ∈ N mit n = 2m}
definiert die Menge der geraden Zahlen als Teilmenge von N. Eine solche Beschreibung hat die Form
N := {x ∈ M : A(x) ist wahr} ,
wobei A(x) eine Aussage über die Variable x ist.
Zwei Mengen A und B heißen gleich, geschrieben A = B, wenn sowohl A ⊂ B als
auch B ⊂ A gelten, d.h. wenn sie dieselben Elemente enthalten. Sind A und B nicht
gleich, so schreibt man A 6= B. Beispiel.
{1, 3, 5, 7} = {1, 5, 7, 3} = {1, 3, 5, 1, 5, 7}
Bei einer so expliziten Auflistung wird man normalerweise kein Element doppelt
angeben. Bei der Beschreibung der Menge Q der rationalen Zahlen durch
(2.4)
Q :=
p
: p, q ∈ Z, q 6= 0
q
tauchen aber alle rationalen Zahlen mehrfach (und zwar unendlich oft) auf; es wäre
sehr unzweckmäßig, würde man nur solche Beschreibungen von Mengen zulassen,
in denen jedes Element genau einmal auftritt.
Das Symbol ∅ bezeichnet die leere Menge. Es gibt also keine Elemente x ∈ ∅, und
jede Aussage über die Elemente von ∅ ist trivialerweise richtig. Beispielsweise ist
{x ∈ R : x > 0 und x < 0} = ∅.
Für gewisse Standardmengen haben sich Standardbezeichnungen eingebürgert,
nämlich N für die Menge der natürlichen Zahlen, Z für die Menge der ganzen Zahlen,
Q für die Menge der rationalen Zahlen, R für die Menge der reellen Zahlen und C
für die Menge der komplexen Zahlen.
24
Achtung: In der Analysis wird oftmals auch die 0 als natürliche Zahl betrachtet,
und dieser Konvention werde ich hier folgen, d.h. 0 ∈ N. Dies wird in der Mathematik nicht einheitlich so gehandhabt; häufig findet man auch die Notationen
N = {1, 2, 3, . . . } und N0 = {0, 1, 2, 3, . . . }.
Da sicherlich eine gewisse Vertrautheit mit diesen Zahlensystemen (von denen später
noch ausführlich die Rede sein wird) vorausgesetzt werden kann, dürften die folgenden Beispiele verständlich sein:
√ √
{x ∈ R : x4 − 2x2 = 0} = {0, − 2, 2},
{x ∈ Q : x4 − 2x2 = 0} = {0},
{z ∈ C : z = z und z 2 = −4} = ∅.
Dass der Cantorsche Mengenbegriff nicht unproblematisch ist, zeigt das folgende
Beispiel:
Wir betrachten die Bedingung für Mengen, sich nicht selbst zu enthalten: M 6∈ M.
Dies trifft z.B. auf die Menge {2, 3} zu, und allgemein auf die Mengen, die man
in der Mathematik üblicherweise trifft. Es ist dagegen nicht einfach, eine Menge A
anzugeben, welche sich selbst als Element enthält, aber hier ist ein solche:
A sei die Menge aller Mengen, welche sich durch weniger als zwanzig Wörter beschreiben lassen. Offenbar ist dann A ein Element von A.
Im Sinne Cantors kann die Menge
X := {M : M ist eine Menge und M 6∈ M}
gebildet werden, d.h. die Menge aller Mengen, die sich nicht selbst als Element
enthalten. M ∈ X gilt also genau dann, wenn M 6∈ M. Wir fragen nun, ob X ∈ X
oder X 6∈ X. Die Annahme X ∈ X ist gleichbedeutend mit X 6∈ X, also nicht
zulässig. Die Annahme X 6∈ X ist gleichbedeutend mit X ∈ X, also ebenfalls
unzulässig. Dies ist die Russelsche Antinomie.
Veranschaulicht wird sie durch die paradoxe Geschichte des Dorfbarbiers, der alle
Männer des Dorfes rasiert, die sich nicht selbst rasieren, und nur diese. Von ihm
selbst gilt, dass er sich genau dann selbst rasiert, wenn er sich nicht selbst rasiert.
In der naiven Mengenlehre hält man trotzdem an den Vorstellungen Cantors
fest, und vermeidet lediglich Begriffsbildungen, die sich als inkonsistent erwiesen
haben, wie beispielsweise die oben beschriebene Menge“. Eine streng axiomatische
”
Begründung der Mengenlehre wurde im Jahre 1908 von E. Zermelo initiiert. Dies
reicht tief in den Bereich der Logik und Philosophie hinein, worauf wir hier nicht
eingehen wollen.
Wir hatten bereits die Inklusion A ⊂ B zweier Mengen A, B kennengelernt. Gilt
A ⊂ B, jedoch A 6= B, so schreiben wir A $ B: es gibt also mindestens ein Element
in B, welches nicht in A liegt.
25
Der Durchschnitt A ∩ B zweier Mengen A und B ist die Menge aller gemeinsamen
Elemente von A und B:
A ∩ B := {x : x ∈ A und x ∈ B} .
B
111111111
000000000
000000000
111111111
000000000
111111111
A
000000000
111111111
000000000
111111111
A∩B
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
A und B heißen disjunkt, wenn es kein gemeinsames Element von A und B gibt,
d.h. wenn A ∩ B = ∅.
Die Vereinigung A ∪ B ist die Menge aller Elemente, die mindestens einer der
Mengen A und B angehören:
A ∪ B := {x : x ∈ A oder x ∈ B} .
000000000
111111111
B
000000000
111111111
111111111
000000000
000000000
111111111
000000000
111111111
A
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
A∪B
000000000
111111111
000000000
111111111
000000000
111111111
Offenbar ist stets A ∪ ∅ = A, A ∩ ∅ = ∅. Die leere Menge spielt also unter den
Mengen eine ähnliche zentrale Rolle wie die Null bei den Zahlen.
Die Differenzmenge A \ B zweier Mengen A und B besteht aus denjenigen x ∈ A,
welche nach Entfernung aller Elemente von B, welche in A liegen, übrigbleiben:
A \ B := {x ∈ A : x ∈
/ B} .
Z.B. ist R \ Q die Menge der irrationalen Zahlen.
A
11111111
00000000
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
A\B
00000000
11111111
00000000
11111111
00000000
11111111
26
B
Sind die betrachteten Mengen allesamt Teilmengen einer gemeinsamen Grundmen”
ge“ X, so schreibt man anstelle von X \ B auch kürzer B c (oftmals auch ∁B), und
nennt B c das Komplement von B (in X). Es gilt dann
X c = ∅, ∅c = X, (B c )c = B .
X
111111111111111
000000000000000
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
Bc
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
B
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
Die symmetrische Differenz A △ B zweier Mengen A und B besteht aus denjenigen x, die genau einer der beiden Mengen angehören:
A △ B := (A ∪ B) \ (A ∩ B) .
Es gilt (Übung)
A △ B = (A \ B) ∪ (B \ A) .
111111111
000000000
000000000
111111111
00000000
11111111
000000000
111111111
00000000
11111111
000000000
111111111
A
00000000
11111111
000000000
111111111
00000000
11111111
000000000
111111111
00000000
11111111
000000000
111111111
00000000
11111111
000000000
111111111
00000000
11111111
000000000
111111111
00000000
11111111
000000000
111111111
00000000
11111111
00000000
11111111
A∆B
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
00000000
11111111
2.3
B
Sätze und Beweise. Verknüpfung von Aussagen
Ein mathematischer Satz enthält Voraussetzungen und Behauptungen. Er
ist wahr (oder gültig“), falls die Behauptungen immer dann wahr sind, wenn die
”
Voraussetzungen erfüllt, d.h. wahr sind.
Beispiel eines mathematischen Satzes:
Voraussetzung: Sei n eine durch 6 teilbare natürliche Zahl.
Behauptung: Dann ist n durch 3 teilbar.
Dieser Satz ist wahr, da jede Zahl, die durch 6 = 2 · 3 teilbar ist, auch durch 3 teilbar
ist. Noch ein Beispiel.
Voraussetzung: wie zuvor.
Behauptung: Dann ist n ist durch 5 teilbar.
27
Dieser Satz ist falsch, da es wenigstens eine Zahl gibt, die durch 6, aber nicht
durch 5 teilbar ist – z.B. die 6. (Es gibt sogar unendlich viele solcher Zahlen; dieser
Sachverhalt ist jedoch unerheblich für die Frage, ob dieser Satz wahr ist.)
Ein Beweis besteht darin, durch schrittweises logisches Schließen“ von den
”
Voraussetzungen zu den Behauptungen zu gelangen. Dabei werden oftmals auch
mehrere Zwischenbehauptungen, die bereits vorher aus den Voraussetzungen
hergeleitet wurden, verwendet.
Beim Hantieren mit Aussagen wird eine Reihe von logischen Verknüpfungen
verwendet. Der Wahrheitswert (oder -gehalt) der durch die Verknüpfung erzeugten
Aussage ist durch den Wahrheitsgehalt der beteiligten Aussagen festgelegt.
a) Die Konjunktion zweier Aussagen A und B:
A und B“ (geschrieben A ∧ B)
”
bezeichnet die Aussage, dass sowohl A als auch B gelten. A ∧ B ist also wahr
genau dann, wenn A und B gleichzeitig wahr sind.
b) Die Adjunktion zweier Aussagen A und B:
A oder B“ (geschrieben: A ∨ B)
”
ist wahr genau dann, wenn mindestens eine der beiden Aussagen wahr ist
(eventuell auch beide – nicht ausschließendes oder“).
”
Z.B. ist die Aussage
Es regnet oder es regnet nicht“
”
wahr (allgemein ist A ∨ ¬A stets wahr); ebenso ist für jede ganze Zahl m ∈ Z
die Aussage
m ≥ 0 oder m ≤ 0
wahr (für m = 0 gilt sogar beides).
Eine Aussage, die stets wahr ist, bezeichnet man übrigens als eine Tautologie.
c) Die Implikation
A impliziert B“ (geschrieben: A ⊃ B)
”
ist wahr genau dann, wenn die Aussagen A und B beide wahr sind, oder wenn
A falsch ist. Sie ist also falsch nur dann, wenn A wahr ist, aber B falsch.
Die logische Verknüpfung der Implikation erlaubt es, Schlüsse, d.h. Schlussfolgerungen, zu beschreiben, und ist daher für die Mathematik von fundamentaler Bedeutung
(s. [KB]):
Der Schluss “Aus A folgt B,” geschrieben A ⇒ B, ist wahr, wenn die Aussage
A ⊃ B wahr ist. Übersetzt in die deutsche Sprache:
28
Wann immer die Voraussetzung oder “Prämisse” A erfüllt, d.h. wahr ist, so ist die
Folgerung oder “Konklusion” B auch erfüllt.
Ist die Voraussetzung A nicht erfüllt, d.h. falsch, so ist also nichts zu zeigen. Nur,
wenn A wahr ist, so muss gearbeitet werden und gezeigt werden, dass dann stets
auch B wahr ist.
Beispiel: Die Behauptung Alle Menschen, die größer als 1,9 m und kleiner als 180
”
cm sind, sind blond“ ist wahr:
Man kann diese nämlich folgendermaßen formulieren: Betrachte die Aussagen A :=
M ist ein Mensch, der größer als 1,9 m und kleiner als 180 cm ist” und B :=
”
M ist ein Mensch, der blond ist”. Obige Behauptung ist dann gleichbedeutend zur
”
Aussage: Für alle Menschen M gilt die Implikation A impliziert B.““Diese ist aber
”
”
wahr, da es offenbar keinen einzigen Menschen M gibt, der die Voraussetzungen A
erfüllt, so dass A stets falsch ist.
Mathematische Sätze sind Ausssagen der Form A ⇒ B“. A heißt die Vorausset”
zung (oftmals bestehend aus einer Liste von Voraussetzungen), B die Folgerung
des Schlusses A ⇒ B. Man sagt dann auch: A ist eine hinreichende Bedingung
für B, B ist eine notwendige Bedingung für A.
Beispiel: Die Aussage
Für alle Zahlen n ∈ N gilt: Aus n < 3 folgt n < 5“
”
ist wahr. Hier sind n ∈ N“ und n < 3“ die Voraussetzungen, und n < 5“ die
”
”
”
Behauptung.
Äquivalenz von Aussagen: Sind A und B zwei Aussagen, und kann man zeigen,
dass A genau dann wahr ist, wenn B wahr ist, so sagt man, beide Aussagen seien
äquivalent, und schreibt dafür
A ⇔ B.
Die Aussagen A und B sind also äquivalent genau dann, wenn beide Schlüsse A ⇒ B
und B ⇒ A gelten.
Beispielsweise gilt für alle x ∈ R:
x≥0
⇔
Es gibt ein y ∈ R mit x = y 2 .
Für beliebige Aussagen A, B gilt:
(2.5)
¬(A ∧ B)
⇔
(¬A) ∨ (¬B)
( A und B gelten nicht gleichzeitig dann und nur dann, wenn A nicht gilt oder B
”
nicht gilt (oder beide nicht - nicht ausschließendes oder“ )“).
”
Beispiel: Die Negation der Aussage
n ∈ N ist gerade und durch 7 teilbar“
”
ist
n ∈ N ist ungerade oder nicht durch 7 teilbar“
”
29
(aber nicht etwa: n ∈ N ist ungerade und nicht durch 7 teilbar“).
”
In der Mathematik wird der Schluss A ⇒ B i.d.R. ebenfalls als die “Implikation”
A ⇒ B bezeichnet. Aus dem bisher Gesagten sollte klar sein, dass dies nicht ganz
korrekt ist, da die Implikation ja eigentlich für die logische Verknüpfung ⊃ steht, aber
wir werden uns im Folgenden ebenfalls diesem gängigen Sprachgebrauch anschließen.
2.4
Quantoren
Es ist gelegentlich praktisch, in der Formulierung von Aussagen den Existenzquantor
∃ (in Worten: es gibt“)
”
und den Allquantor
∀ in Worten: für alle“
”
zur Abkürzung zu benutzen. Mit dem Gebrauch sollte man jedoch sparsam sein, da
gerade Studienanfänger Gefahr laufen, die inhaltliche ( semantische“) Bedeutung
”
von Aussagen aus dem Auge zu verlieren und dazu tendieren, rein formal mit den
Quantoren zu hantieren.
Beispiel: Die Aussage
Es gibt eine natürliche Zahl, die größer als 1000 ist“
”
ist wahr. Man kann sie auch schreiben als
∃ n ∈ N mit n > 1000“ ,
”
oder noch kürzer als
∃ n ∈ N : n > 1000
(die An-und Ausführungszeichen zur Kennzeichnung von Aussagen werden wir bei
solchen Kurzschreibweisen in Zukunft meist weglassen).
Die Negation dieser Aussage ist
Für alle n ∈ N gilt n ≤ 1000“ ,
”
oder kürzer
∀ n ∈ N : n ≤ 1000 .
Allgemein gilt: Ist A(x) eine Aussage über Elemente x einer Menge M (A(x) beschreibt also eine Eigenschaft von x), so ist die Negation der Aussage Für alle x in
”
der Menge M ist die Aussage A(x) wahr ”, oder, sprachlich eleganter, Alle x aus
”
der Menge M besitzen die Eigenschaft A(x) ”, kurz:
∀x ∈ M : A(x),
30
die Aussage
∃ x ∈ M : ¬A(x) .
Dies können wir formalisiert durch die Äquivalenz
¬(∀ x ∈ M : A(x)) ⇔ (∃ x ∈ M : ¬A(x))
beschreiben. Entsprechend gilt
¬(∃ x ∈ M : A(x)) ⇔ (∀ x ∈ M : ¬A(x))
(man mache sich diese Äquivalenz sprachlich-logisch klar!). Fazit:
Die Quantoren ∃ und ∀ werden bei der Negation mitineinander vertauscht.
Zur Erinnerung: Mit es gibt“ ist in der Mathematik immer gemeint es gibt minde”
”
stens ein“. Will man ausdrücken, dass es auch nicht mehr als eins geben kann, sagt
man
es gibt genau ein“ (kurz : ∃˙ oder ∃!).
”
Aussagen können mehrere Quantoren enthalten.
Beispiel:
∀ n ∈ N ∃ p ∈ N : p > n und p ist Primzahl
In Worten: Zu jeder natürlichen Zahl n gibt es eine Primzahl p, welche größer ist
”
als n“. Die Negation dieser Aussage ist
∃ n ∈ N ∀ p ∈ N : p ≤ n oder p ist keine Primzahl“ ,
in Worten:
Es gibt eine natürliche Zahl n, so dass für alle natürlichen Zahlen p gilt, dass p
”
kleiner oder gleich n oder keine Primzahl ist“.
Gleichbedeutend hierzu ist die vermutlich verständlichere Aussage
Es gibt eine natürliche Zahl n, so dass jede Primzahl p kleiner oder gleich n ist“.
”
Die Reihenfolge der Quantoren ist wesentlich! Die Aussage
∃ p ∈ N ∀ n ∈ N : p > n und p ist Primzahl“
”
ist eine völlig andere (und falsch, während die ursprüngliche Aussage ein wahrer
mathematischer Satz ist). Noch ein Beispiel.
In jeder deutschen Stadt gibt es einen Bürger, der ein Haus besitzt“
”
ist eine (vermutlich wahre) Aussage, während
Es gibt einen Bürger, der in jeder deutschen Stadt ein Haus besitzt“
”
eine völlig andere (vermutlich falsche) Aussage ist.
31
2.5
Rechenregeln für Mengen. Indexmengen
Seien A, B, C Mengen. Dann gilt
(2.6)
A ⊂ B und B ⊂ C ⇒ A ⊂ C
(Transitivität der Inklusion)
Insbesondere folgt hieraus: Ist A = B und B = C, so ist A = C.
Beweis. Ist x ∈ A, so ist wegen A ⊂ B auch x ∈ B und weiter wegen B ⊂ C dann
auch x ∈ C .
Q.E.D.
Wie in diesem Beispiel werden wir Beweise stets abschließen mit dem Kürzel Q.E.D.:
quod erat demonstrandum“, d.h. was zu beweisen war“; oft werden dafür auch
”
”
Kürzel wie ✷ oder y anstelle von Q.E.D. verwendet.
Desweiteren gelten folgende Regeln, welche sich unmittelbar aus den logischen Verknüpfungen ∨ und ∧ ergeben und mehr oder weniger evident sind:
A ∪ A = A,
A∩A= A
A ∪ B = B ∪ A,
A∩B = B∩A
(Kommutativität)
(A ∪ B) ∪ C = A ∪ (B ∪ C),
(A ∩ B) ∩ C = A ∩ (B ∩ C) (Assoziativität)
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
(Distributivität I)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
(Distributivität II)
Wir beweisen hier nur die Assoziativität der Vereinigung; die übrigen Regeln seien
als Übung überlassen:
Es gilt:
x ∈ (A ∪ B) ∪ C ⇔
⇔
⇔
⇔
⇔
x ∈ A ∪ B oder x ∈ C
(x ∈ A oder x ∈ B) oder x ∈ C
x ∈ A oder (x ∈ B oder x ∈ C)
x ∈ A oder (x ∈ B ∪ C)
x ∈ A ∪ (B ∪ C) .
Beim Übergang von der zweiten zur dritten Zeile wurde eine Tautologie benutzt,
nämlich die Assoziativität (A ∨ B) ∨ C ⇔ A ∨ (B ∨ C) der logischen Verknüpfung
oder“. Solche Standardschlüsse des logischen Denkes dürfen Sie in meiner
”
Vorlesung ohne weiteren Kommentar anwenden.
Wegen der Assoziativität von ∪ und ∩ kann man die Klammern weglassen und
einfach
A ∪ B ∪ C, A ∩ B ∩ C
schreiben.
32
Sei nun I eine Menge, und für jedes i ∈ I eine Menge Ai gegeben. In diesem Kontext
heißt i der Index von Ai und I eine Indexmenge. Wir definieren dann die Vereinigung und den Durchschnitt der Familie oder des Systems der Mengen Ai , i ∈ I,
(geschrieben: {Ai }i∈I ) durch
[
(2.7)
i∈I
Ai := {x : es gibt ein i ∈ I mit x ∈ Ai } ,
\
(2.8)
i∈I
Ai := {x : für alle i ∈ I gilt x ∈ Ai } .
Wir führen hier noch folgende Notation ein: Ist m ∈ N gegeben, so bezeichnen wir
mit Nn≥m ⊂ N die Teilmenge aller natürlichen Zahlen n ≥ m, d.h.
Nn≥m := {n ∈ N : n ≥ m} = {m, m + 1, m + 2, m + 3, . . . }.
Analog definiert man z.B. auch Nn>m oder Nn≤m , etc..
Beispiel. Sei für n ∈ N≥1 = {1, 2, 3, 4, . . .} die Menge An definiert durch
o
np
:p∈Z .
An :=
n
Dann ist offenbar
[
An = Q ,
n∈N≥1
und
\
An = Z
(wieso?) .
n∈N≥1
Ist I ⊂ Z von der Form I = {i ∈ Z : k ≤ i ≤ l}, mit k, l ∈ Z, so schreibt man auch
l
[
Ai
statt
[
Ai ,
i∈I
i=k
und
l
\
statt
∞
[
Ai
Ai ;
i∈I
i=k
ebenso schreibt man
\
statt
[
i∈N≥k
i=k
etc..
33
Ai ,
Beachte: Ist k > l, so ist in diesem Fall I = ∅. Um auch solche pathologischen“
”
Situationen berücksichtigen zu können, definiert man
[
Ai := ∅ ,
i∈∅
und, falls die Ai allesamt in einer Grundmenge X liegen,
\
Ai := X .
i∈∅
(dies steht logisch im Einklang zu den Definitionen (2.7), (2.8)).
Die Distributivgesetze für ∪ und ∩ verallgemeinern sich dann zu
[
[
\
\
B∩
Ai =
B ∩ Ai , B ∪
Ai = (B ∪ Ai ).
i∈I
i∈I
i∈I
i∈I
Sind die Mengen Ai der Familie {Ai }i∈I paarweise disjunkt, d.h. ist Ai ∩ Aj = ∅
für
S alle i, j ∈ I mit i 6= j, so spricht man auch von einer disjunkten Vereinigung
i∈I Ai , und schreibt gelegentlich dafür
[
˙
Ai .
i∈I
Für eine beliebige Familie {Ai }i∈I von Teilmengen einer Grundmenge X gilt (Übung)
!c
[
\
Ai =
Aci
(1. Formel von De Morgan) ,
i∈I
\
i∈I
2.6
i∈I
Ai
!c
=
[
Aci
(2. Formel von De Morgan) .
i∈I
Mengen von Mengen
Die Elemente einer Menge können ohne weiteres selbst wieder Mengen sein.
Beispiele:
a)
{{1, 2}, {1, 3}, {1, 4}} = {{1, n} : n ∈ N, 2 ≤ n ≤ 4}
ist eine Menge mit drei Elementen, die selbst zweielementige Mengen sind.
b) {∅} ist nicht etwa die leere Menge, sondern die Menge, welche als einziges
Element die leere Menge enthält.
34
Die Potenzmenge einer Menge M ist die Menge
P(M) := {A : A ⊂ M}
aller Teilmengen von M. Da stets ∅ ⊂ M, ist P(M) nie leer.
Beispiele.
P({1, 2}) = {∅, {1}, {2}, {1, 2}} ,
P({2, 3, 4}) = {∅, {2}, {3}, {4}, {2, 3}, {2, 4}, {3, 4}, {2, 3, 4}} .
2.7
Das kartesische Produkt zweier Mengen
Ein fundamentaler Grundbegriff der Mathematik ist derjenige der Produktmenge
oder des Produktes A × B zweier Mengen A und B. Dies ist die Menge aller
(geordneten) Paare (x, y) mit x ∈ A und y ∈ B.
Wir wollen diesen Begriff nicht weiter hinterfragen und nur darauf hinweisen, dass
zum Begriff des Paares gehört, dass zwei Paare (x1 , y1) und (x2 , y2) gleich sind dann
und nur dann, wenn x1 = x2 und y1 = y2 . Insbesondere ist für x 6= y das Paar (x, y)
verschieden vom Paar (y, x). Das geordnete Paar (x, y) ist also wohl zu unterscheiden
von der Menge {x, y}, bei der es nicht auf die Reihenfolge der Elemente ankommt.
Wir haben also
A × B := {(x, y) : x ∈ A, y ∈ B}.
Sind beispielsweise A und B zwei Intervalle in R, so lässt sich die Menge A × B als
ein Rechteck in einem kartesischen Koordinatensystem darstellen:
A×B
B
A
Allgemein bezeichnet man die Mengen A und B als die Faktoren von A × B. Wenn
man will, kann man den Begriff des geordneteten Paares auf den Mengenbegriff
zurückführen, indem man setzt
(x, y) := {{x}, {x, y}} .
2.8
Funktionen
Es seien A und B zwei beliebige Mengen. Unter einer Funktion oder Abbildung
f von A nach B, in Zeichen:
f : A → B,
35
versteht man eine Vorschrift, die für jeden Punkt x ∈ A genau einen Bildpunkt
y ∈ B festlegt, in Zeichen:
f : x 7→ y.
Dieses y heißt Funktionswert an der Stelle x oder Bildpunkt von x und wird
mit f (x) bezeichnet. Die Menge A ist der Definitionsbereich, B der Wertevorrat
oder der Wertebereich von f . Den Definitionsbereich kürzen wir gelegentlich mit
D(f ) ab.
Unsere obige Definition einer Funktion ist vielleicht relativ anschaulich, jedoch im
Grunde sehr vage, da der Begriff Vorschrift“ nicht wohldefiniert ist. Der Funk”
tionsbegriff lässt sich folgendermaßen auch direkt auf schon eingeführte Begriffe
abstützen.
Zu jeder Funktion f : A → B gehört ihr Graph
G(f ) := {(x, y) ∈ A × B : x ∈ A, y = f (x)},
eine wohlbestimmte Teilmenge von A × B.
Beispielsweise ist der Graph der Funktion, die durch f (x) := x2 auf R definiert wird,
eine Parabel in R × R:
f (x)
(x, f (x))
x
Der Graph G := G(f ) besitzt folgende Eigenschaft:
(2.9)
Zu jedem x ∈ A gibt es genau ein y ∈ B mit (x, y) ∈ G.
Ist umgekehrt G eine Teilmenge von A × B mit der Eigenschaft (2.9), so gibt es
eine wohlbestimmte Funktion f : A → B, deren Graph die Menge G ist: Der Funktionswert f (x) ist für jedes Argument x ∈ A das eindeutig bestimmte y ∈ B mit
(x, y) ∈ G.
Da also Funktion und Graph einander gegenseitig bestimmen, werden sie oft als ein
und dasselbe betrachtet. In diesem Sinne definiert man dann:
Eine Funktion oder Abbildung f : A → B ist eine Teilmenge G ⊂ A × B, die die
Eigenschaft (2.9) besitzt.
In der Praxis ist man meist jedoch weniger präzise und spricht beispielsweise von
der Funktion y = f (x)“, oder auch z.B. von der Funktion 2x/ (1 − x2 ), womit man
”
im letzteren Fall die Funktion
2x
f : x 7→
1 − x2
36
gemeint ist, deren Definitionsbereich natürlicherweise R \ {−1, 1} ist, wenn wir als
Grundmenge“ für x die reellen Zahlen betrachten. Allgemein soll eine solchermaßen
”
durch einen Ausdruck“ definierte Funktion als Definitionsbereich die Menge all
”
derjenigen x einer von vornherein vereinbarten Grundmenge X sein, für die der
betreffende Ausdruck ausgewertet werden kann.
Zwei Funktionen f1 : A1 → B1 und f2 : A2 → B2 heißen gleich (in Zeichen :
f1 = f2 ), wenn gilt : A1 = A2 , B1 = B2 und f1 (x) = f2 (x) für alle x ∈ A1 = A2 .
Ist f : A → B eine Funktion, und ist U ⊂ A eine Teilmenge von A, so bezeichnet
man die Menge
f (U) := {f (x) : x ∈ U}
als die Bildmenge von U unter f. Die Bildmenge f (A) von A bezeichnen wir als
das Bild von f. Im allgemeinen ist f (A) eine echte Teilmenge von B.
Die Abbildung f : A → B heißt surjektiv oder eine Surjektion oder auch eine
Abbildung von A auf B, falls gilt
f (A) = B,
d.h. falls jeder Punkt y ∈ B als Bildpunkt f (x) wenigstens eines Punktes x ∈ A
auftritt.
Sie heißt injektiv oder eineindeutig oder eine Injektion, wenn keine zwei verschiedenen Punkte x1 , x2 ∈ A denselben Bildpunkt y ∈ B besitzen, d.h. wenn für
beliebige x1 , x2 ∈ A gilt
x1 6= x2 ⇒ f (x1 ) 6= f (x2 ),
oder, äquivalent dazu,
f (x1 ) = f (x2 ) ⇒ x1 = x2 .
Ist f : A → B gleichzeitig surjektiv und injektiv, so heißt f bijektiv, und man
nennt f eine Bijektion.
Diese Eigenschaften lassen sich äquivalent auch durch das Lösungsverhalten der Gleichung y = f (x) beschreiben:
(i) f : A → B ist surjektiv genau dann, wenn die Gleichung y = f (x) für jedes
y ∈ B (mindestens) eine Lösung x ∈ A besitzt.
(ii) f : A → B ist injektiv genau dann, wenn die Gleichung y = f (x) für jedes
y ∈ B höchstens eine Lösung x ∈ A besitzt.
(iii) f : A → B ist bijektiv genau dann, wenn die Gleichung y = f (x) für jedes
y ∈ B eine eindeutige Lösung x ∈ A besitzt.
Beispiele. a) Betrachte die Funktionen f, g, h, k : R → R, welche durch
f (x) := 2x, g(x) := x3 − x, h(x) := ex , k(x) := x2
37
definiert sind. Dann gilt
f (R) = R, g(R) = R, h(R) = {y : y > 0}, k(R) = {y : y ≥ 0}.
f und g sind also surjektiv, h und k nicht.
f und h sind injektiv, g und k nicht, da z.B. g(0) = g(1) = 0 und k(1) = k(−1) = 1.
Folglich ist nur f bijektiv.
−2
2
2
1
1
1
−1
2
−2
1
−1
−1
−1
✄
3
✂g(x) = x − x ✁
✄
✂f (x) = 2x ✁
−2
2
−2
−2
2
2
1
1
1
−1
2
−2
−1
1
−1
2
−1
✄
2
✂k(x) = x ✁
✄
x
✂h(x) = e ✁
−2
−2
b) Ist M eine nichtleere Menge, so heißt die durch Id M (x) := x definierte Abbildung
Id M : M → M die Identität auf M (oder auch die identische Abbildung von
M nach M).
c) Ist M eine nichtleere Menge, so wird durch f (x) := {x} eine Abbildung f : M →
P(M) definiert. Ist diese surjektiv?
Ist f : A → B bijektiv, so erfüllt der Graph G von f neben (2.9) auch die Eigenschaft:
(2.10)
Zu jedem y ∈ B gibt es genau ein x ∈ A mit (x, y) ∈ G.
D.h., die Teilmenge
t
G := {(y, x) ∈ B × A : (x, y) ∈ G}
von B × A erfüllt (2.9) und ist damit der Graph einer Funktion f −1 : B → A, der
Umkehrfunktion oder Umkehrabbildung von f . Die Umkehrabbildung
f −1 : B → A, y 7→ “dasjenige x ∈ A mit f (x) = y“
38
macht die Wirkung von f wieder rückgängig, und ihr Graph G(f −1 ) = tG(f ) entsteht
durch Spiegeln von G(f ) an der Achse y = x“.
”
Es gilt also:
f −1 (f (x)) = x für alle x ∈ A, und f (f −1 (y)) = y
x = f −1 (y)
für alle y ∈ B.
(y, f −1 (y))
y = f (x)
(x, f (x))
y
x
Beispielsweise ist die Umkehrfunktion der obigen Funktion f (x) = 2x die Funktion
f −1 : R → R, y 7→ 12 y.
Weiter lässt sich, wie wir bereits diskutiert hatten, die injektive Exponentialfunktion
h(x) := ex als bijektive Abbildung h : R → R+ auf die Menge
R+ := {y ∈ R : y > 0}
auffassen, deren Umkehrfunktion
h−1 : R+ → R, y 7→ log y
der natürliche Logarithmus ist.
Ist f : A → B eine beliebige (nicht notwendig bijektive) Funktion, und ist W ⊂ B,
so nennt man die Menge
f −1 (W ) := {x ∈ A : f (x) ∈ W }
das Urbild von W unter f. Im Falle einer bijektiven Abbildung f stimmt diese
Menge mit dem Bild von W unter der Umkehrabbildung f −1 überein.
39
ACHTUNG: Das Symbol f −1 steht also einerseits für die Umkehrfunktion einer
bijektiven Funktion f , andererseits wird es auch bei nicht-bijektiven Funktionen f
verwendet, um Urbilder zu beschreiben!
Für die Funktion g(x) = x3 − x ist beispielsweise g −1({0}) = {0, −1, 1}.
Für Bild- und Urbildmengen gelten ebenfalls eine Reihe von Rechenregeln. Sei f :
M → N eine Abbildung, und seien A, B ⊂ M. Dann gilt für die Bildmengen
(2.11)
(2.12)
f (A ∪ B) = f (A) ∪ f (B),
f (A ∩ B) ⊂ f (A) ∩ f (B).
Machen Sie sich anhand eines Beispiels klar, dass in (2.12) im Allgemeinen nicht die
Gleichheit gilt!
Sind C, D ⊂ N, so gilt für die Urbilder
(2.13)
(2.14)
f −1 (C ∪ D) = f −1 (C) ∪ f −1 (D),
f −1 (C ∩ D) = f −1 (C) ∩ f −1 (D).
Wir beweisen (2.11), und überlassen den Beweis der anderen Behauptung der Leserin
oder dem Leser zur Übung. Es gilt
f (A) ∪ f (B) =
=
=
=
{y : y ∈ f (A) oder y ∈ f (B)}
{y : (∃x ∈ A mit f (x) = y) oder (∃x ∈ B mit f (x) = y)}
{y : ∃x ∈ A ∪ B mit f (x) = y}
f (A ∪ B).
Ist f : A → B eine Funktion und U ⊂ A eine Teilmenge von A, so bezeichnet man
die Funktion
f |U : U → B, x 7→ f (x)
als die Einschränkung von f auf U. Offenkundig ist
G(f |U ) = {(x, f (x)) : x ∈ U} ⊂ G(f ).
Ist umgekehrt à eine Obermenge von A, d.h. à ⊃ A, und f˜ : à → B eine
Funktion, die auf A mit f übereinstimmt, d.h. ist
f˜|A = f,
so heißt f˜ eine Fortsetzung von f auf die Menge Ã.
Wird beispielsweise die Funktion k(x) = x2 auf die positiven Zahlen eingeschränkt,
so entsteht die bijektive Abbildung
k|R+ : R+ → R+ , x 7→ x2 ,
40
mit der Umkehrabbildung
(k|R+ )−1 : R+ → R+ , y 7→
√
y.
Sind f : A → B und g : B → C zwei Funktionen, so definieren wir die zusammengesetzte Funktion g ◦ f (Sprechweise: g nach f “) oder auch Komposition von
”
f und g als die Funktion
g ◦ f : A → C, x 7→ g(f (x)),
d.h. g ◦ f (x) := g(f (x)).
g◦f
g(f (x))
x
A
f
g
C
y = f (x)
B
Für die Funktionen f (x) = 2x und h(x) = ex gilt beispielsweise
f ◦ h(x) = 2ex ,
h ◦ f (x) = e2x .
Man sieht leicht, dass für je drei Funktionen das Assoziativgesetz für die Komposition gilt:
(f1 ◦ f2 ) ◦ f3 = f1 ◦ (f2 ◦ f3 ).
Ist f : A → B bijektiv, und ist f −1 : B → A die Umkehrabbildung, so gilt also
f −1 ◦ f = Id A , f ◦ f −1 = Id B .
Allgemein bezeichnet man jede Teilmenge R ⊂ A × B von A × B als eine Relation,
und schreibt xRy, falls (x, y) ∈ R. Damit will man deutlich machen, dass zwischen
x und y eine Beziehung besteht (nämlich dass (x, y) ∈ R). Ist R eine Relation in
X × X, so nennt man R auch eine Relation auf X.
Damit ist eine Funktion f : A → B also nichts anderes als eine Relation G ⊂ A × B,
welche der Bedingung (2.9) genügt.
41
Ist X eine fest gegebene Menge, so definiert man schließlich die charakteristische
Funktion oder auch Indikatorfunktion 1A : X → R einer beliebigen Teilmenge
A ⊂ X wie folgt:
(
1, falls x ∈ A,
1A (x) :=
0, falls x ∈
/ A.
Man findet oft auch die Notation χA anstelle von 1A .
2.9
Direkte Beweise und Widerspruchsbeweise
Ein Beweis der Wahrheit des Satzes (oder kürzer: ein Beweis des Satzes“)
”
A ⇒ B
kann dadurch geführt werden, dass man eine Kette von wahren Implikationen
A ⇒ C1 , C1 ⇒ C2 , . . . , Cn−1 ⇒ Cn , Cn ⇒ B
findet. Soetwas nennt man einen direkten Beweis.
Äquivalent dazu ist der Beweis der Aussage
¬B ⇒ ¬A .
Dies beruht auf folgender Tautologie ( Kontrapositionsprinzip“)
”
(2.15)
(A ⇒ B) ⇔ (¬B ⇒ ¬A) .
Dies macht man sich wie folgt klar: Angenommen, aus A folgt B, aber die Aussage
B ist falsch, so kann A nicht wahr sein, da ja sonst auch B wahr sein müsste. Dies
beweist die Implikation ⇒ in (2.15), und mit dem gleichen Schluss folgert man, dass
¬B ⇒ ¬A impliziert ¬¬A ⇒ ¬¬B, also A ⇒ B. Wir haben (2.15) mit Hilfe eines
Widerspruchsbeweises begründet. Formal funktioniert ein solcher wie folgt:
”
Um zu beweisen, dass A ⇒ B, nehmen wir an, dass A wahr, jedoch B falsch ist,
d.h. A ∧ (¬B) wahr ist. Wir zeigen dann (eventuell wieder mit Hilfe einer Kette von
Implikationen), dass dies die Wahrheit einer weiteren Aussage C impliziert, und mit
Hilfe anderer Implikationen, dass C falsch sein muss :
A ∧ (¬B) ⇒ E1 ⇒ · · · ⇒ En ⇒ C ,
A ∧ (¬B) ⇒ F1 ⇒ · · · ⇒ Fl ⇒ ¬ C .
Da aber nicht gleichzeitig C und ¬ C gelten können, hat man einen Widerspruch
hergeleitet aus der Annahme, dass A und ¬B gleichzeitig wahr sind: Wenn A wahr
ist, muss folglich auch B wahr sein, d.h. A impliziert B.
Man mache sich dieses Prinzip
noch einmal am Beispiel des Euklidschen Beweises
√
für die Irrationalität von 2 klar!
42
Kapitel 3
Natürliche Zahlen und
vollständige Induktion
Wie bereits gesagt, lassen sich die reellen Zahlen stufenweise durch gewisse Konstruktionen aus einfacheren Strukturen gewinnen. Auf diese Weise entsteht ein
Turm“ von Zahlbereichen
”
N ⊂ Z ⊂ Q ⊂ R,
an dessen Basis die natürlichen Zahlen N stehen. Wir verstehen darunter solche
Zahlen, die wir zum Abzählen benutzen:
0, 1, 2, 3, . . . , 2056, 2057, . . . .
Im Folgenden verwenden wir dafür meistens kleine lateinische Buchstaben:
a, b, c, . . . , m, n, . . . . Bekanntlich kann man die natürlichen Zahlen addieren, multiplizieren und ordnen. Hierfür gelten die folgenden Regeln, die wir als bekannt
voraussetzen wollen:
Addition:
(A+ ) (a + b) + c = a + (b + c)
(K+ ) a + b = b + a
(N)
a+0=a
(S)
a+c= b+c ⇒a=b
(Assoziativität der Addition)
(Kommutativität der Addition)
(Existenz der Null)
(Kürzungsregel der Addition)
Multiplikation:
(A· )
(K· )
(E)
(Q)
Dabei sei 0 6= 1.
(ab)c = a(bc)
(Assoziativität der Multiplikation)
ab = ba
(Kommutativität der Multiplikation)
a·1=a
(Existenz der Eins)
ac = bc und c 6= 0 ⇒ a = b
(Kürzungsregel der Multiplikation)
Beziehung zwischen Addition und Multiplikation:
(D) a(b + c) = ab + ac
(Distributivgesetz)
43
Ordnung:
(V)
(R)
(T)
(I)
(M+ )
(M· )
(P)
Stets gilt a ≤ b oder b ≤ a
a≤a
a ≤ b und b ≤ c ⇒ a ≤ c
a ≤ b und b ≤ a ⇒ a = b
a≤b ⇒ a+c≤ b+c
a ≤ b ⇒ ac ≤ bc
Ist a ≤ b, so existiert c mit b = a + c.
Ferner ist stets a ≥ 0.
Und, aus a ≤ 1 folgt a = 0 oder a = 1.
(Vergleichbarkeit aller Elemente)
(Reflexivität der Ordnung)
(Transitivität)
(Identitivität)
(Monotonie der Addition)
(Monotonie der Multiplikation)
Falls a ≤ b und a 6= b, so schreiben wir auch a < b. Statt a ≤ b schreiben wir auch
b ≥ a.
Von grundlegender Bedeutung ist letztendlich das sicherlich sehr plausible
(VI) Prinzip der vollständigen Induktion:
Sei n0 ∈ N. Für jedes n ∈ Nn≥n0 , d.h. n ≥ n0 , bezeichne A(n) eine Aussage. Nehmen
wir an, dass
A(n0 ) wahr ist.
(Induktionsanfang)
Für beliebiges n ∈ Nn≥n0 gilt: Falls A(n) wahr ist, so ist auch A(n + 1) wahr.
(Induktionsschritt)
Dann ist A(n) für alle n ≥ n0 wahr.
(I)
(II)
Bisher ist es noch niemandem gelungen, für eine der obigen Regeln ein Gegenbeispiel
anzugeben. Wir betrachten deshalb diese Regeln oder Axiome als allgemein gültig
für die natürlichen Zahlen. Beweisen“ lassen sich diese Regeln nicht – allerdings ist
”
es möglich, das so beschriebene System der natürlichen Zahlen auf erheblich weniger
Axiome zurückführen, die sogenannten Peano-Axiome (siehe Abschnitt 3.3 sowie
[B]). Zu diesen gehört insbesondere das Prinzip der vollständigen Induktion, welches
also auf jeden Fall vorausgesetzt werden muss.
Natürlich kann man noch beliebig viele andere Regeln für die natürlichen Zahlen
aufstellen, es zeigt sich jedoch, dass weitere Eigenschaften durchweg Konsequenzen
der obigen sind, mit anderen Worten:
Es handelt sich bei weiteren Regeln, Formeln usw. um mathematische Sätze, die sich
aus den obigen Grundsätzen“ mit den Mitteln der Logik ohne weitere Annahmen
”
über die natürlichen Zahlen herleiten lassen, d.h. also, es handelt sich um beweisbare
Sätze.
Ein wichtiges Hilfsmittel ist der folgende Satz, dessen Beweis auf dem Prinzip der
vollständigen Induktion beruht:
Satz 3.1 Jede nichtleere Teilmenge A ⊂ N besitzt ein kleinstes Element (ein Mi”
nimum“), d.h. es gibt ein m ∈ A, so dass m ≤ k für alle k ∈ A.
44
Beweis. Wir führen einen indirekten Beweis, und nehmen also an, A sei eine Menge natürlicher Zahlen ohne kleinstes Element. Dann bezeichne B die Menge aller
unteren Schranken von A.
Dabei verstehen wir unter einer unteren (oberen) Schranke einer Teilmenge
C ⊂ N ein Element n ∈ N, so dass n ≤ c (n ≥ c) für alle c ∈ C (diese Begriffe
lassen sich genauso für beliebige geordnete Mengen definieren - darauf werden wir
zurückkommen).
Sicherlich ist dann 0 ∈ B, da 0 ≤ k für alle k ∈ A. Ist weiter n ∈ B, so ist k ≥ n für
alle k ∈ A, und n kann nicht in A liegen, da sonst entgegen unserer Voraussetzung
n ein kleinstes Element von A wäre. Nach (P ) gibt es zu jedem k ∈ A ein ℓ ∈ N so,
dass k = n + ℓ, und wie eben gezeigt, muss ℓ von 0 verschieden sein, d.h. ℓ ≥ 1. Mit
(M + ) und (K + ) folgert man nun, dass n + ℓ ≥ n + 1 ist, also k = n + ℓ ≥ n + 1 für
alle k ∈ A, d.h. n + 1 ist ebenfalls eine untere Schranke von A und liegt daher in B.
Betrachte nun die Aussage
A(n) : n liegt in der Menge B.
Wir habe gesehen, dass A(0) wahr ist (da ja 0 ∈ B), und dass aus der Wahrheit von
A(n) stets auch die von A(n + 1) folgt (da ja mit n ∈ B auch stets n + 1 ∈ B gilt).
Nach dem Prinzip der vollständigen Induktion (VI) ist somit A(n) wahr für jedes
n ∈ N, d.h. es ist B = N.
Dann muss aber A leer sein, denn aus n ∈ A folgt n + 1 6∈ B.
Q.E.D.
Als Folgerung erhalten wir den Satz über die Division mit Rest:
Satz 3.2 (Euklidischen Algorithmus) Zu a und b aus N mit b > 0 existieren
durch a und b eindeutig bestimmte Zahlen n und r aus N so, dass gilt:
0 ≤ r < b.
a = nb + r,
Beweis: Wir zeigen zunächst die Existenz einer solchen Zerlegung. Dazu definieren
wir die Menge
A := {m ∈ N : (m + 1)b > a}.
Da wegen unserer Grundregeln“
”
(a + 1)b = ab + b > ab ≥ a
gilt, ist a ∈ A, d.h. A 6= ∅. Nach Satz 3.1 besitzt A somit ein kleinstes Element n.
Für n gilt folglich
nb ≤ a < (n + 1)b,
und wegen (P ) gibt es ein r ∈ N mit a = nb + r. Wäre r ≥ b, so folgte a ≥ nb + b =
(n + 1)b, was nicht der Fall ist. Somit ist 0 ≤ r < b.
45
Nun beweisen wir die Eindeutigkeit. Sei auch a = n′ b + r ′ , mit 0 ≤ r ′ < b. Wir
können annehmen, dass etwa n ≥ n′ ist. Dann gibt es ein ℓ ∈ N so, dass n = n′ + ℓ,
und wir erhalten a = (n′ + ℓ)b + r = (n′ b + ℓb) + r = n′ b + (ℓb + r). Damit ist nach
(S) jedoch r ′ = ℓb + r. Dies ist nur möglich, wenn ℓ = 0 ist, da andernfalls ℓ ≥ 1
Q.E.D.
wäre, also r ′ ≥ ℓb ≥ b. Somit ist r ′ = r und n = n′ .
Im Folgenden wollen wir mit den natürlichen Zahlen rechnen, wie wir es gewohnt
sind, ohne die jeweiligen Rechenschritte durch die Grundregeln“ zu rechtfertigen ”
dies wäre auf Dauer zu mühsam.
Bevor wir einige Beispiele für das Beweisprinzip der vollständigen Induktion besprechen, kurz zur Notation: Sind m, n ∈ N mit m ≤ n, so schreiben wir
n
X
k=m
ak := am + am+1 + · · · + an ,
und verabreden die Konvention
n
X
n
Y
k=m
n
Y
ak := 0,
k=m
ak := am · am+1 · · · · an ,
ak := 1,
k=m
falls m > n.
3.1
Beispiele zur vollständigen Induktion
a) Für jedes n ∈ N≥1 gilt die Formel
n
X
k=1
k = 1+2+···+n =
n(n + 1)
.
2
Beweis. Durch vollständige Induktion nach n :
Induktionsanfang: Die behauptete Formel ist offenbar richtig für n = 1, da
ja
1
X
1·2
k=1=
.
2
k=1
Induktionsvoraussetzung: Wir nehmen nun an, dass die Formel wahr ist
für (irgend-) ein n ∈ N≥1 .
Induktionsschritt: Dann gilt
n+1
X
k=1
k = (
n
X
k) + (n + 1) =
k=1
n(n + 1)
+ (n + 1)
2
(n + 1)((n + 1) + 1)
(n + 1)(n + 2)
=
.
=
2
2
46
Der letzte Ausdruck ist aber gerade die behauptete Formel für n + 1 anstelle
von n. Somit ist nach (VI) die Formel wahr für alle natürlichen Zahlen n ≥ 1.
Bemerkung: Nach unserer obigen Konvention gilt die Formel übrigens auch
für n = 0, d.h. sie gilt für alle n ∈ N. Wir hätten daher auch n = 0 als
Induktionsanfang wählen können.
Q.E.D.
b) Bemerkung: Der Induktionsschritt lässt sich auch für die falsche Behauptung
n
X
(n + 21 )2
k=
2
k=1
(3.1)
durchführen: Ist diese Formel richtig für n, so folgt
n+1
X
k=1
k = (
n
X
k=1
2
k) + (n + 1) =
n + 3n +
=
2
9
4
(n + 21 )2
+ (n + 1)
2
((n + 1) + 12 )2
=
,
2
d.h. (3.1) ist dann auch richtig für n + 1. Trotzdem ist (3.1) für alle n ≥ 1
falsch.
Dieses Beispiel lehrt, wie wichtig es bei Induktionsbeweisen ist, auch
den Induktionsanfang zu verifizieren!
c) Bernoullische Ungleichung: Für alle x ∈ R mit x ≥ −1 und n ∈ N gilt
(3.2)
(1 + x)n ≥ 1 + nx.
Beweis. Durch vollständige Induktion nach n :
Induktionsanfang: Für n = 0 gilt die Ungleichung trivialerweise, da per
definitionem
(1 + x)0 = 1 ≥ 1 = 1 + 0 · x.
Induktionsvorausetzung: Die Ungleichung (3.2) gelte für ein n ∈ N.
Induktionsschritt: Der Schluss von n auf n + 1 ergibt sich wegen 1 + x ≥ 0
dann folgendermaßen:
(1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x.
Q.E.D.
Mit Hilfe der vollständigen Induktion zeigt man auch folgende Aussagen, welche wir üblicherweise als selbstverständlich ansehen, welche strenggenommen
jedoch bewiesen werden müssen.
47
d) Sei ∗ eine assoziative binäre Operation auf einer Menge X, d.h. eine Abbildung (a, b) 7→ a ∗ b von X × X in X, welche dem Assoziativgesetz genügt:
(a ∗ b) ∗ c = a ∗ (b ∗ c) ∀a, b, c ∈ X.
Dann kommt es auch bei mehr als drei Operanden nicht auf die Stellung der
Klammern an. D.h., es gilt z.B. (a1 ∗ a2 ) ∗ (a3 ∗ a4 ) = a1 ∗ ((a2 ∗ a3 ) ∗ a4 ) etc..
Beweis. Per Induktion nach der Anzahl n der Faktoren aj . Für n = 3 (Induktionsanfang) ist nichts zu beweisen. Wir nehmen an, dass in Produkten
von höchstens n (n ≥ 3) Faktoren die Klammern beliebig umgeordnet werden
können, ohne den Wert des Produktes zu verändern (Induktionsvoraussetzung), und betrachten ein Produkt b von n + 1 Faktoren a1 , . . . , an+1 mit einer
vorgegebenen Klammerung. Es genügt zu zeigen, dass dieses denselben Wert
besitzt wie das Produkt
a1 ∗ (a2 ∗ (a3 ∗ · · · ∗ (an−1 ∗ (an ∗ an+1 )) . . . )).
Eine Klammerung dieses Typs wollen wir als Standardklammerung bezeichnen.
Nun gibt es zwei Möglichkeiten:
(i) b besitzt die Gestalt a1 ∗ (c), wobei c = [a2 ∗ · · · ∗ an+1 ] das Produkt von
a2 , . . . , an+1 mit einer gewissen Klammerung ist. Nach Induktionsvoraussetzung können wir die Klammerung in c in die Standardklammerung überführen,
ohne den Wert zu verändern. Danach besitzt aber auch b die Standardklammerung.
(ii) b besitzt die Gestalt (d) ∗ (e), wobei d = [a1 ∗ · · · ∗ ak ] das Produkt von
a1 , . . . , ak mit einer gewissen Klammerung ist und 2 ≤ k ≤ n. Nach Induktionsvoraussetzung dürfen wir dann die Klammerung von d in die Standardklammerung überführen, ohne den Wert zu verändern. Danach besitzt b also
die Gestalt
b = (a1 ∗ f ) ∗ (e),
so dass nach dem Assoziativitätsgesetz b = a1 ∗ (f ∗ (e)) gilt. Damit haben wir
diesen Fall auf den Fall (i) zurückgeführt und den Induktionsschritt nachgewiesen.
Q.E.D.
Ähnlich zeigt man:
e) Ist ∗ eine kommutative und assoziative binäre Operation auf einer Menge X,
d.h. gilt zusätzlich a ∗ b = b ∗ a für alle a, b ∈ X, so kommt es auch bei mehr
als zwei Operanden nicht auf deren Reihenfolge an.
Z.B. gilt (a1 ∗ a2 ) ∗ (a3 ∗ a4 ) = a3 ∗ ((a2 ∗ a4 ) ∗ a1 ), etc..
48
Aufgrund von d) lässt man in der Regel auch in Ausdrücken mit mehr als zwei
Operanden sämtliche Klammern weg, falls Assoziativität vorliegt. Dies trifft
beispielsweise auf die Addition und die Multiplikation in N zu.
(Vorsicht: Es gibt auch nicht-assoziative Operationen in der Mathematik!)
3.2
Rekursion
Oftmals werden Funktionen f : N → X rekursiv definiert, d.h. durch Angabe von
f (0) sowie einer Vorschrift, die für jedes n ∈ N aus f (0), f (1), . . . , f (n) den Wert
f (n+1) zu berechnen gestattet. Dass hierdurch eine eindeutige Funktion f : N → X
definiert ist, folgt aus dem Prinzip der vollständigen Induktion, soll hier aber nicht
genau formalisiert werden.
Beispiele.
a) Die Rekursionsvorschrift
f (0) := 0, f (1) := 1, f (n + 1) := f (n) + f (n − 1), n ≥ 1,
liefert die Folge der Fibonacci-Zahlen
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, . . . .
Diese Rekursion wurde übrigens als Modellierung für das Wachstum einer
Kaninchenpopulation eingeführt:
Beschreibt f (n) die Anzahl der Kaninchen im Jahre n, und nimmt man an,
dass jedes Kaninchen nach einem Jahr geschlechtsreif ist und im Schnitt jedes
Jahr einen Nachkommen erzeugt, so sind im Jahre n nur die f (n−1) Kaninchen
aus der Population des Vorjahres unter den f (n) Kaninchen geschlechtsreif, so
dass im Jahre n + 1 die Population um f (n − 1) Kaninchen wächst, d.h. es ist
f (n + 1) = f (n) + f (n − 1).
Natürlich ist dies ein sehr grobes Modell, welches u.a. die Sterblichkeit ignoriert.
b) Ist K ein Körper“, wie beispielsweise Q, R oder C, so werden für festes a ∈ K
”
die Potenzen an , n ∈ N, rekursiv definiert durch
a0 := 1, an+1 := a · an , n ≥ 0
(auch 00 := 1 !).
49
c) Ist + eine als Addition interpretierte binäre Operation auf einer Menge X
(solche sollen
Pn stets assoziativ sein), und sind a1 , . . . , an ∈ X, so ist im
Grunde
k=1 ak = a1 + · · · + an rekursiv definiert mittels der Funktion
f : {0, 1, . . . , n} → X, welche durch
f (0) := 0, f (k + 1) := f (k) + ak+1 ,
festgelegt ist, wobei
n
P
k=1
0
P
Summe“
0≤k ≤n−1
ak := f (n) ist. Danach hat insbesondere die leere
”
ak den Wert 0 = f (0) (vergleiche dies mit der von uns getroffenen
k=1
Konvention!).
Q
Ähnlich definiert man per Rekursion nk=1 ak , wobei das leere Produkt“
”
0
Q
ak den Wert 1 hat (falls X ein neutrales Einselement 1 besitzt).
k=1
Ist die Addition + zusätzlich kommutativ, und ist für jeden Index i einer
endlichen P
Indexmenge I ein Element ai ∈ X bestimmt, so definiert man allgemeiner
ai als die Summe über alle Elemente ai mit i ∈ I. Nach Beispiel
i∈I
3.1 e) kommt
P es hier auf die Reihenfolge der Summanden nicht an. Per definitionem ist
ai := 0. Ist beispielsweise I = {k ∈ N : m ≤ k ≤ n}, so schreibt
man auch
i∈∅
X
ak =
k∈I
X
m≤k≤n
Ähnlich definiert man Produkte
Q
per definitionem
ai := 1.
Q
ak =
n
X
ak .
k=m
ai über eine endliche Indexmenge I, wobei
i∈I
i∈∅
d) Die Fakultät, eine Funktion von N → N, wird rekursiv definiert durch
0! := 1, (n + 1)! := n!(n + 1), n ≥ 0;
es gilt offenbar
n! =
n
Y
k=1
k = 1 · 2 · 3 · · · n,
n ≥ 1.
n! hat folgende kombinatorische Interpretation:
Es gibt genau n! verschiedene Anordnungen der Elemente einer gegebenen
n-elementigen Menge A.
Für k, n ∈ N mit k ≤ n definiert man den Binomialkoeffizienten
n!
n
.
:=
k!(n − k)!
k
50
Mittels vollständiger Induktion beweist man dann folgende Aussagen (Übung):
(i) nk ist die Anzahl aller k-elementigen Teilmengen einer n-elementigen Menge.
(ii) Für alle reellen Zahlen a, b ∈ R und jedes n ∈ N gilt folgende binomische
Formel:
n X
n k n−k
n
a b .
(3.3)
(a + b) =
k
k=0
3.3
Die axiomatische Methode
Mit den Sätzen 3.1 und 3.2 haben wir erste fundamentale Beispiele für die sogenannte
axiomatische Methode kennengelernt, welche sich in der Mathematik seit einiger Zeit
durchgesetzt hat. Dabei geht man folgendermaßen vor:
Gewisse Grundaussagen werden einfach für wahr erklärt, indem man sie als Axiome
bezeichnet. Im Rahmen unserer axiomatischen Beschreibung der natürlichen Zahlen
waren dies die Axiome (A+ ) bis (P ), sowie (V I). Die Wahrheit weiterer Aussagen wird dadurch festgestellt, dass man sie aus den Axiomen und aus schon als
wahr erkannten Aussagen beweist. Die Wahrheit – im Sinne der Mathematik – eines
mathematischen Satzes ist daher immer zu verstehen als bezogen auf ein explizit
zu nennendes (oder implizit gemeintes) Axiomensystem. Der mathematische Wahrheitsbegriff ist also zunächst vollkommen relativ, da jeder Mathematiker die Freiheit
hat, beliebige Axiomensysteme als Ausgangspunkt festzulegen (natürlich sollten diese zumindest irgendwie plausibel sein und sich nicht gegenseitig widersprechen). Die
Frage, welches Axiomensystem nach welchen Kriterien auch immer man bevorzugen
sollte, ist für manche Mathematiker mehr, für andere weniger interessant. Wer sich
vor allem für die Grundlagen der Mathematik interessiert wird z.B. bemüht sein,
eine möglichst kleine Anzahl an Axiomen zu suchen, auf welche ein gegebenes Theoriegebäude zurückgeführt werden kann. Im Falle von N etwa kann man tatsächlich
mit sehr viel weniger Axiomen auskommen, als wir dies getan haben, nämlich den
folgenden Peanoschen Axiomen:
Die natürlichen Zahlen N sind eine Menge mit einem Anfang“
”
(P1) 0 ∈ N.
Der Zählprozess wird beschrieben durch eine Funktion ν : N → N,
genannt Nachfolgefunktion, mit den Eigenschaften
(P2) 0 6∈ ν(N) ( 0 ist kein Nachfolger“)
”
(P3) ν : N → N ist injektiv.
(P4) Ist A ⊂ N, und ist 0 ∈ A und ν(A) ⊂ A, so ist A = N.
Die Existenz einer Menge N mit diesen Eigenschaften (P1)-(P4) lässt sich nicht
beweisen, sondern wird als Axiom postuliert.
51
In unserer üblichen Vorstellung von N ist natürlich ν gegeben durch ν(n) = n + 1.
Nach Peano definiert man daher die natürlichen Zahlen durch
1 := ν(0), 2 := ν(1), 3 := ν(2), . . .
Die Eigenschaft (P4) ist übrigens äquivalent zum Prinzip der vollständigen Induktion.
Nach John von Neumann (1903– 1957), einem der bedeutendsten Mathematiker
des letzten Jahrhunderts, kann man ein Modell für N sogar auf den Mengenbegriff
zurückführen, indem man die Zahlen folgendermaßen als Mengen definiert:
0 := ∅, 1 := {∅}, 2 := {∅, {∅}}, 3 := {∅, {∅}, {∅, {∅}}}, . . . ,
mit Nachfolgefunktion
ν(n) := n ∪ {n} .
Pikanterweise wird bei diesem Zugang der ganze Reichtum der Phänomene der Zahlenwelt auf ein einziges mathematisches Objekt zurückgeführt, und bei diesem Objekt handelt es sich auch noch um die leere Menge.
Für die meisten Bereiche der Mathematik ist ein solches minimalistisches“ Vorgehen
”
jedoch äußerst unpraktisch. Dies war einer der Gründe, weshalb wir anstelle der
Peanoschen Axiome die erheblich praxisnäheren“ Eigenschaften (A+ ) − (P ) sowie
”
(V I) postuliert haben.
52
Kapitel 4
Die reellen Zahlen
Um die reellen Zahlen axiomatisch einzuführen, benötigen wir zwei weitere fundamentale Begriffe der Mathematik, nämlich den des Körpers sowie den der Ordnungsrelation.
4.1
Körper
Definition. Unter einem Körper versteht man eine Menge K, versehen mit zwei
binären Operationen + : K × K → K, der Addition, und · : K × K → K, der
Multiplikation, so dass für alle x, y, z ∈ K gilt:
(A+ )
(K + )
(x + y) + z = x + (y + z),
x + y = y + x,
(A· ) (x · y) · z = x · (y · z)
(Assoziativität)
(K · ) x · y = y · x
(Kommutativität)
Es existieren Elemente 0, 1 ∈ K, 0 6= 1, so dass
(N)
(AI)
(MI)
(D)
x + 0 = x,
(E) x · 1 = x ( Nullelement und Einselement)
∀x ∈ K ∃y ∈ K mit x + y = 0,
(additives Inverses)
∀x ∈ K, x 6= 0 ∃z ∈ K mit x · z = 1,
(multiplikatives Inverses)
x · (y + z) = x · y + x · z
(Distributivgesetz)
Diese Regeln sind uns von der Schule für die Zahlbereiche Q und R vertraut.
In der Algebra wird gezeigt, dass in einem Körper das Nulllement 0 und das Einselement 1 eindeutig sind, und dass es zu jedem x ∈ K genau ein additives Inverses gibt,
welches mit −x bezeichnet wird, und zu jedem x 6= 0 genau ein multiplikatives Inverses, welches mit x−1 bezeichnet wird (s. auch [F]). Exemplarisch zeige ich hier nur:
Es gibt genau ein Nullelement bzgl. der Addition in K.
Beweis. Sei 0′ ein weiteres Element mit a + 0′ = a für alle a ∈ K. Dann gilt
insbesondere 0 + 0′ = 0. Andererseits ist nach (K + ) 0 + 0′ = 0′ + 0, also nach (N)
0 + 0′ = 0′ . Es folgt insgesamt 0 = 0′ .
53
Q.E.D.
Wir verwenden Subtraktion und Division in K, indem wir definieren
x − y := x + (−y),
x
:= xy −1 (falls y 6= 0) .
y
Aus den Eigenschaften (A+ ) − (D) folgen unmittelbar die üblichen“ Rechenregeln
”
für x, y ∈ K:
(4.1)
(4.2)
−(−x) = x, x · 0 = 0,
(−x)y = −(xy), −(x + y) = −x − y,
(−x)(−y) = xy ,
(x−1 )−1 = x, (xy)−1 = x−1 y −1, falls x, y ∈ K \ {0},
(4.3)
xy = 0
⇔
x = 0 oder y = 0 .
Anstelle von x · y schreibt man, wie hier bereits praktiziert, oft kürzer xy.
Beispielhaft möchte ich einmal die Identität in der zweiten Zeile von (4.1) beweisen,
wobei ich annehme, dass die Identitäten in der ersten Zeile bereits nachgewiesen
sind:
Aus 0 = (−x) · 0 = (−x)(−y + y) folgt mit dem Distributivgesetz 0 = (−x)(−y) +
(−x)y = (−x)(−y) − xy. Addiert man xy zu beiden Seiten der Gleichung, so folgt
(−x)(−y) = xy.
Für alle a, b ∈ K ist x := b − a die eindeutige Lösung der Gleichung a + x = b,
und y := b/a die eindeutige Lösung der Gleichung a · y = b, falls a 6= 0. Aus
den Assoziativgesetzen (A+ ), (A· ) folgt gemäß der Bemerkung in Beispiel 3.1 d) die
Unabhängigkeit von der Klammerung bei endlichen Summen und Produkten und
damit die Wohldefiniertheit von
n
X
k=m
xk ,
n
Y
k=m
xk ,
xk ∈ K,
m ≤ k ≤ n.
Aus den Kommutativgesetzen (K + ), (K · ) folgt nach Beispiel 3.1 e) die Unabhängigkeit von der Reihenfolge bei endlichen Summen und Produkten. Dies wird formuliert
durch den Begriff der Permutation.
Unter einer Permutation einer Menge M versteht man eine bijektive Abbildung
σ : M → M von M auf sich. Ist insbesondere M die endliche Menge {1, . . . , n},
so beschreibt σ offenbar eine Umordnung der Reihenfolge. Man kann σ dann in der
Form
(i1 , . . . , in ) mit ik := σ(k)
54
aufschreiben. Es gilt dann für x1 , . . . , xn ∈ K :
n
X
(4.4)
xk =
k=1
n
X
xik ,
k=1
n
Y
xk =
k=1
n
Y
xik .
k=1
Aus (4.4) folgt als Spezialfall die Vertauschbarkeit der Summen- und Produktzeichen
bei Doppelsummen und -produkten:
n X
m
X
(4.5)
xij =
i=1 j=1
m X
n
X
xij ,
j=1 i=1
n Y
m
Y
xij =
i=1 j=1
m Y
n
Y
xij ,
j=1 i=1
falls xij ∈ K für i = 1, . . . , n, j = 1, . . . , m.
Das Distributivgesetz für endliche Summen lautet
!
!
n
m
n X
m
X
X
X
(4.6)
xi ·
xi yj .
yj =
i=1
j=1
i=1 j=1
All diese Formeln werden mit vollständiger Induktion bewiesen. Wir definieren ganzzahlige Potenzen rekursiv durch
x0 := 1, xn := x · xn−1 = x
· · x}, n ≥ 1, x ∈ K,
| ·{z
n-mal
−n
−1 n
x := (x ) , n ∈ N, x ∈ K \ {0} .
Aus den Eigenschaften der Multiplikation folgt dann für alle x, y ∈ K und n, m ∈ Z
(bei negativen Exponenten wird natürlich x 6= 0 bzw. y 6= 0 verlangt):
xn xm = xn+m , (xn )m = xnm , xn y n = (xy)n .
(4.7)
4.2
Angeordnete Körper
Definition. Unter einer Ordnungsrelation oder kurz Ordnung auf einer nichtleeren Menge X versteht man eine Relation R ⊂ X × X auf X mit folgenden Eigenschaften: Schreibt man x ≤ y anstelle von (x, y) ∈ R, so gelten die Eigenschaften
(R), (T) und (I) aus Kapitel 3, d.h. für alle x, y, z ∈ X gilt:
(R) x ≤ x
(T) x ≤ y und y ≤ z ⇒ x ≤ z
(I) x ≤ y und y ≤ x ⇒ x = y
(Reflexivität)
(Transitivität)
(Identitivität)
Beispiele.
a) Die natürliche Ordnung ≤ auf N.
55
b) Auf der Potenzmenge P(M) einer Menge M wird durch
A ≤ B,
falls A ⊂ B,
(A, B ⊂ M),
eine Ordnung definiert.
c) Die lexikographische Ordnung auf der Menge aller Wörter einer gegebenen
Sprache, wie sie z.B. in Wörterbüchern oder Telefonbüchern verwendet wird.
Ist x ≤ y und x 6= y, so schreibt man x < y (oder auch y > x) ( x ist echt kleiner
”
als y“, bzw. y ist echt größer als x“). Anstelle von x ≤ y ( x kleiner gleich y“)
”
”
schreibt man auch y ≥ x ( y größer gleich x“). Die Ordnung ≤ auf X heiße lineare
”
oder totale Ordnung, falls zusätzlich (V) gilt, d.h. wenn für alle x, y ∈ X gilt:
(V)
x ≤ y oder y ≤ x (Vergleichbarkeit aller Elemente).
Die natürliche Ordnung auf N aus Beispiel a) ist total, die aus Beispiel b) auf P(M)
nicht, falls M mindestens 2 Elemente enthält. Ist nämlich z.B. M = {1, 2}, so
sind die Mengen {1} und {2} nicht vergleichbar in P({1, 2}). Die lexikographische
Ordnung aus Beispiel c) ist wiederum total, und dies sollte sie besser auch sein,
denn sonst wäre sie für das Aufsuchen eines Wortes in einem Lexikon wenig hilfreich!
Im Falle einer totalen Ordnung auf X gilt für alle x, y ∈ X genau eine der drei
Beziehungen,
x < y, x = y oder x > y .
Definition. Unter einem angeordneten Körper versteht man einen Körper K,
versehen mit einer totalen Ordnung ≤ so, dass zusätzlich Ordnung und algebraische
Struktur von K verträglich sind in folgendem Sinne: Für alle x, y, z ∈ K gilt
(M+ )
(M· )
x≤y ⇒ x+z ≤y+z
x ≤ y und z ≥ 0 ⇒ xz ≤ yz
(Monotonie der Addition)
(Monotonie der Multiplikation)
Dann gilt offenbar:
(4.8)
x≤y ⇔
insbesondere ist x ≥ 0
y − x ≥ 0 ⇔ −y ≤ −x ;
genau dann, wenn − x ≤ 0 .
Beweis: Ist x ≤ y, so gilt mit z := −x nach (M+ ) x − x ≤ y − x, also 0 ≤ y − x,
und analog folgt aus y − x ≥ 0 wieder y ≥ x. Die zweite Äquivalenz folgt aus der
ersten, indem man x durch −y und y durch −x ersetzt.
Q.E.D.
Ähnlich kann man beweisen, dass in einem angeordneten Körper K all die üblichen
Rechenregeln“ gelten, wie wir sie von der Schule für Q oder R gewohnt sind. Ich
”
will dies für die folgenden Regeln exemplarisch nachweisen.
Lemma 4.1 Sei K ein angeordneter Körper, und seien x, y ∈ K. Dann gilt:
56
a) x ≥ 0 und y ≥ 0 ⇒ x + y ≥ 0,
b) x > 0 und y ≥ 0 ⇒ x + y > 0,
c) x2 ≥ 0; insbesondere ist 1 > 0.
Beweis. Zu a) Aus x ≥ 0 folgt nach (M + ) x + y ≥ 0 + y = y. Ist zusätzlich y ≥ 0,
so folgt mit (T ) x + y ≥ 0.
Zu b) Nach a) folgt aus x > 0 und y ≥ 0 zumindest x+y ≥ 0. Wäre nun x+y = 0, so
wäre y = −x, und wegen y ≥ 0 nach (4.8) x = −y ≤ 0. Dies stünde im Widerspruch
zu unserer Annahme x > 0.
Zu c) Es gilt nach (V) stets x ≥ 0 oder x ≤ 0.
(i) Ist x ≥ 0, so gilt nach (M· ) x2 = x · x ≥ 0.
(ii) Ist x ≤ 0, so ist −x ≥ 0, also nach (i) (−x)2 ≥ 0, und somit x2 = (−x)2 ≥ 0.
Insbesondere ist 1 = 12 ≥ 0, und wegen 1 6= 0 ist 1 > 0.
Q.E.D.
4.3
Der Absolutbetrag
In jedem angeordneten Körper K, wie beispielsweise Q oder R, können wir den
absoluten Betrag |x| und das Signum sgn x eines Elementes x definieren durch


 x, x > 0
 1, x > 0
0, x = 0 ,
0, x = 0 .
|x| :=
sgn x :=


−x, x < 0
−1, x < 0
Hierfür gelten folgende Regeln: sind x, y, a Elemente des Körpers, so ist
(a) x = |x| sgn x,
|x| = | − x|,
(b) |x · y| = |x| · |y|,
(c) |x| ≥ 0,
sgn (x · y) = sgn x · sgn y,
und |x| = 0 ⇔ x = 0,
(d) Für beliebiges ε ≥ 0 gilt
(4.9)
|x| ≤ ε ⇔ −ε ≤ x ≤ ε,
bzw. allgemeiner
(4.10)
(e) |x + y| ≤ |x| + |y|
|x − a| ≤ ε ⇔ a − ε ≤ x ≤ a + ε,
(Dreiecksungleichung)
57
(f) |x + y| ≥ |x| − |y|
(inverse Dreiecksungleichung).
Beweis. Wir beweisen nur (e), (f) und setzen bereits (a) – (d) voraus.
Ist x + y ≥ 0, so gilt |x + y| = x + y ≤ |x| + |y|, denn es ist z ≤ |z| für alle z.
Ist aber x + y < 0, so ist (−x) + (−y) = −(x + y) > 0, und wir erhalten aufgrund
des bereits Bewiesenen und (a)
|x + y| = |(−x) + (−y)| ≤ | − x| + | − y| = |x| + |y|.
Damit ist (e) gezeigt. Da nach (e) und (a)
|x| = |(x + y) + (−y)| ≤ |x + y| + | − y| = |x + y| + |y|,
so ist |x| − |y| ≤ |x + y|. Vertauscht man hier x und y, so ist auch |y| − |x| ≤ |x + y|,
d.h.
−|x + y| ≤ |x| − |y| ≤ |x + y|.
Mit (d) folgert man, dass |x| − |y| ≤ |x + y|, womit auch (f) bewiesen ist.
Die Beweise von (a) - (d) seien als Übungsaufgabe überlassen.
Q.E.D.
4.4
Schranken
Definition. Sei X eine durch ≤ geordnete Menge, und sei A ⊂ X. Ein Element
s ∈ X heiße eine
• obere Schranke für A, wenn a ≤ s für alle a ∈ A.
• untere Schranke für A, wenn s ≤ a für alle a ∈ A.
A heiße nach oben (unten) beschränkt, falls es eine obere (untere) Schranke für
A gibt.
Ein Element z ∈ X heiße
• kleinste obere Schranke oder Supremum von A, wenn z eine obere Schranke für A ist, und wenn für jede obere Schranke s von A gilt: z ≤ s.
• größte untere Schranke oder Infimum von A, wenn z eine untere Schranke
für A ist, und wenn für jede untere Schranke s von A gilt: z ≥ s.
58
Falls existent, so sind Supremum bzw. Infimum von A eindeutig. Sind nämlich z.B.
z und z ′ Suprema von A, so gilt z ′ ≤ z und z ≤ z ′ , also z = z ′ .
Man spricht daher auch von dem Supremum von A, und bezeichnet es mit dem
Symbol
sup A .
Analog bezeichnet man das Infimum von A, falls existent, mit
inf A .
• Ein Element M ∈ A heißt das Maximum (oder größtes Element) von A,
wenn gilt:
a ≤ M ∀a ∈ A.
Da M in A liegt, gilt dann für jede obere Schranke s von A die Ungleichung
M ≤ s, d.h. M ist auch das Supremum von A. Insbesondere ist das Maximum
eindeutig. Man bezeichnet es mit dem Symbol
max A.
Falls das Maximum existiert, so stimmt es also mit dem Supremum überein:
sup A = max A, falls max A existiert.
• m ∈ A heißt das Minimum (oder kleinstes Element) von A, wenn gilt:
m ≤ a ∀a ∈ A.
Analog wie beim Maximum ist das Minimum eindeutig, und man bezeichnet
es mit dem Symbol
min A.
Falls das Minimum existiert, so stimmt es mit dem Infimum überein:
inf A = min A, falls min A existiert.
Das Maximum bzw. Minimum einer Menge A existiert nicht immer:
z.B. ist für die Teilmenge A := {{1}, {2}} der Potenzmenge X := P({1, 2}) offenbar
sup A = {1, 2}, aber diese Menge liegt nicht in A.
Die Ordnung ≤ auf X wird als Wohlordnung bezeichnet und X als wohlgeordnet,
falls jede nichtleere Teilmenge A ⊂ X von X ein kleinstes Element besitzt, d.h. wenn
min A stets existiert.
Z.B. ist N mit der natürlichen Ordnung wohlgeordnet (vergl. Satz 3.1).
Sei nun K ein angeordneter Körper, und sei A ⊂ K eine nichtleere Teilmenge von
K. Der folgende Satz liefert nützliche Kriterien um zu prüfen, ob eine Schranke für
A das Supremum bzw. Infimum ist:
59
Satz 4.2 (Test auf Supremum bzw. Infimum) Sei z ∈ K eine obere (bzw. untere) Schranke für A. Dann sind die folgenden Aussagen äquivalent:
(i) z ist das Supremum (bzw. Infimum) von A, d.h. z = sup A (bzw. z = inf A).
(ii) Zu jedem y ∈ K mit y < z (bzw. y > z) gibt es ein a ∈ A mit a > y (bzw.
a < y).
(iii) Zu jedem ε > 0 in K existiert ein a ∈ A mit a > z − ε (bzw. a < z + ε).
Beweis. Wir beweisen die Aussagen zum Supremum – der Beweis der Aussagen
über das Infimum wird analog geführt.
Sei also z ∈ K eine obere Schranke für A. Es genügt, die Äquivalenz von (i) und (ii)
zu beweisen. Es gilt nämlich y < z dann und nur dann, wenn sich y schreiben lässt
als y = z − ε mit ε > 0. Somit sind (ii) und (iii) offenkundig äquivalent.
Per definitionem ist z = sup A genau dann, wenn für jedes y ∈ K gilt: ist y eine
obere Schranke für A, so ist y ≥ z.
Nach dem Kontrapositionsprinzip ist dies ist gleichbedeutend zu folgender Eigenschaft:
Für jedes y ∈ K gilt: ist y < z, so ist y keine obere Schranke für A.
Aufgrund der Definition des Begriffs der oberen Schranke ist jedoch y keine obere
Schranke für A dann und nur dann, wenn es ein a ∈ A gibt mit a > y.
Damit ist die Äquivalenz von (i) und (ii) nachgewiesen.
Q.E.D.
Beispiele.
a) Betrachte das halboffene Intervall A := [0, 1[:= {x ∈ K : 0 ≤ x < 1}. Dann
gilt inf A = min A = 0 und sup A = 1, wobei max A nicht existiert, denn:
Da 0 in A liegt und da x ≥ 0 ist für alle x ∈ K, ist per definitionem 0 das
kleinste Element von A, d.h. min A = 0, und damit existiert auch inf A =
min A = 0.
Ferner ist 1 eine obere Schranke für A, da ja x ≤ 1 gilt für alle x ∈ A. Sei nun
y ∈ K mit y < 1. Wir zeigen, dass dann ein a ∈ A existiert mit a > y. Ist
nämlich y < 0, so können wir dazu a := 0 wählen, und ist y ≥ 0, so ist y ∈ A,
und wir können a := (y + 1)/2 wählen. Für dieses a gilt nämlich offenbar
0≤y<a=
y+1
< 1,
2
so dass insbesondere a ∈ A ist. Nach dem Kriterium (ii) in Satz 4.2 ist somit
sup A = 1. Da jedoch 1 ∈
/ A, ist 1 kein Maximum von A.
60
b) Jede endliche Teilmenge A = {a1 , a2 , . . . , an } ⊂ K hat ein Maximum und
ein Minimum, denn:
durch Umordnen der Elemente und etwaiges Umbenennen kann man erreichen,
dass a1 ≤ a2 ≤ · · · ≤ an ist. Dann ist aber a1 = min A, an = max A.
c) Ist P(M) durch die Mengeninklusion geordnet, und ist A ⊂ P(M), so ist
[
sup A =
N =: S ∈ P(M) ,
N ∈A
denn es ist N ⊂ S für jedes N ∈ A, so dass S ∈ P(M) eine obere Schranke
für A ist, und ist umgekehrt T ∈ P(M) eine beliebige
S obere Schranke für A,
d.h. gilt N ⊂ T für jedes N ∈ A, so gilt auch S = N ∈A N ⊂ T, d.h. S ist die
kleinste obere Schranke für A.
.
4.5
Der Körper R
Definition. Ein geordneter Körper K heiße ordnungsvollständig, wenn folgendes
Supremumsaxiom “ erfüllt ist:
”
(OV) Jede nichtleere nach oben beschränkte Teilmenge A ⊂ K besitzt eine kleinste
obere Schranke sup A ∈ K.
Axiomatisch können wir den Körper R der reellen Zahlen nun wie folgt beschreiben:
(R) R ist ein ordnungsvollständiger angeordneter Körper.
Genauer kann man zeigen: Es gibt einen Körper R mit der Eigenschaft (R), und
dieser ist eindeutig bis auf Isomorphie“, (d.h. zwischen je zwei solcher Körper gibt
”
es eine Bijektion, welche sowohl die algebraische als auch die Ordnungsstruktur
überträgt“). Hierauf soll hier aber nicht näher eingegangen werden.
”
Einbettung von N, Z und Q in R
Die Bedingungen in (R) implizieren automatisch, dass R den Körper Q der rationalen
Zahlen enthalten muss . Betrachte dazu die Abbildung

 0 7→ 0R ,
ι : N → R,
n 7→ nR := 1R + · · · + 1R , falls n ≥ 1 .
|
{z
}

n−mal
wobei 0R und 1R vorübergehend die Null und die Eins in R bezeichnen.
61
Man folgert aus 0R < 1R dann leicht per Induktion, dass
für alle n ∈ N,
nR < (n + 1)R
so dass diese Abbildung ι injektiv ist, und dass durch ι die Addition, die Multiplikation und die Ordnungsstruktur von N und R respektiert werden, was es uns
gestattet, die natürlichen Zahlen N als Teilmenge (nämlich ι(N)) von R aufzufassen.
Anders formuliert: Die Teilmenge ι(N) von R aller Zahlen der Form nR mit n ∈ N
erfüllt alle Axiome, die wir von den natürlichen Zahlen postuliert hatten, so dass
wir fortan mit dieser Menge als Menge der natürlichen Zahlen arbeiten können und
unsere ursprüngliche Menge N vergessen dürfen.
In diesem Sinne ist dann N ⊂ R (man sagt auch, dass wir N mit der Menge ι(N)
identifiziert“ haben, indem wir n ∈ N mit nR identifiziert haben). Man schreibt
”
dann unter leichtem Mißbrauch der Notation wieder n anstelle von nR .
Damit liegen aufgrund der Körperaxiome dann auch Z und Q in R.
Definition. Ein angeordneter Körper K heiße archimedisch geordnet, wenn gilt:
(AR) Für alle x > 0, y ≥ 0 gibt es ein n ∈ N mit nx > y.
Hierbei steht nx für das Element
n
P
x=(
k=1
n
P
1)x, wobei hier 1 das Einselement des
k=1
Körpers K bezeichne.
Es ist leicht zu zeigen, dass der Köper Q der rationalen Zahlen archimedisch geordnet
ist (Übung).
Es gibt allerdings auch angeordnete Körper, welche nicht archimedisch geordnet sind
(siehe Abschnitt 11.4 von Anhang A, Kapitel 11).
Unsere Axiome für den Körper R implizieren jedoch, dass auch der Köper der reellen
Zahlen archimedisch geordnet ist:
Satz 4.3 R ist archimedisch geordnet.
Beweis: Seien x, y ∈ R, x > 0, y ≥ 0, und setze A := {nx : n ∈ N}. Wäre A
nach oben beschränkt, so existierte s = sup A ∈ R, und es wäre nx ≤ s für alle
n ∈ N. Dann wäre auch (n + 1)x ≤ s, d.h. nx ≤ s − x für alle n ∈ N, und somit
wäre auch s − x eine obere Schranke von A. Folglich wäre s ≤ s − x, d.h. x ≤ 0, ein
Widerspruch.
Somit kann y keine obere Schranke von A sein, d.h. es gibt ein n ∈ N mit nx > y.
Q.E.D.
Für Teilmengen A ⊂ R vereinbaren wir
sup A := +∞, falls A nicht nach oben beschränkt ist ,
sup ∅ := −∞ .
62
Dabei stehen ±∞ für neue Objekte, ± Unendlich“genannt. Wir erweitern die
”
Ordnung auf R zu einer Ordnung auf R ∪ {−∞, +∞}, indem wir verlangen, dass
−∞ ≤ x ≤ +∞ für alle x ∈ R. Anstelle von +∞ schreiben wir auch ∞.
Damit existiert für jede Teilmenge das Supremum sup A ∈ R∪{−∞, +∞} in diesem
verallgemeinerten Sinne, wobei sup A allerdings endlich ist (d.h. in R liegt) dann und
nur dann, wenn A nach oben beschränkt ist!
Achtung: −∞ und +∞ sind keine reellen Zahlen!
Für nichtleere Teilmengen A, B ⊂ R folgt aus A ⊂ B stets sup A ≤ sup B. Unsere Setzung von sup ∅ stellt sicher, dass dies auch noch für A = ∅ gültig bleibt.
Entsprechend sei
inf A := −∞ ,
inf ∅ := +∞ .
falls A nicht nach unten beschränkt ist,
Für x ∈ R, A ⊂ R sei xA ⊂ R definiert durch
xA := {xa : a ∈ A} .
Für x = −1 schreiben wir auch −A statt (−1)A.
Weiter vereinbaren wir
−(+∞) := −∞,
−(−∞) := +∞ .
Satz 4.4 Sei A ⊂ R. Dann gilt
inf A = − sup(−A) .
(4.11)
Beweis. Für A = ∅ ist dies klar. Sei nun A 6= ∅. Sei x ∈ R. Wir behaupten:
(4.12)
x ist untere Schranke von A ⇔ −x ist obere Schranke von − A .
In der Tat gilt
∀a ∈ A : x ≤ a
⇔ ∀a ∈ A : −x ≥ −a
⇔ ∀b ∈ −A : −x ≥ b .
Wegen (4.12) ist A nach unten beschränkt genau dann, wenn −A nach oben beschränkt ist. Falls A nicht nach unten beschränkt ist, steht also −∞ auf beiden
Seiten von (4.11). Andernfalls existiert s := sup(−A) ∈ R, und wegen (4.12) ist
dann −s eine untere Schranke von A. Ist x eine beliebige untere Schranke von A, so
ist nach (4.12) s ≤ −x, also x ≤ −s. Damit ist −s = inf A, und es folgt (4.11).
Q.E.D.
63
Es ist sinnvoll, auch für Teilmengen A, B ⊂ R deren Summe und Produkt wie folgt
zu definieren:
A + B := {a + b : a ∈ A, b ∈ B} ,
AB = A · B := {ab : a ∈ A, b ∈ B} .
Im Folgenden wollen wir in R rechnen wie gewohnt, dabei aber letztlich nur von (R)
Gebrauch machen.
Wir merken noch in Analogie zu Satz 4.2 folgende Tatsache über sup A und inf A
an, von der wir frei Gebrauch machen werden.
Satz 4.5 Ist A ⊂ R, A 6= ∅ und x < sup A, so gibt es ein a ∈ A mit a > x, und
zwar auch im Falle sup A = ∞.
Ist x > inf A, so gibt es ein a ∈ A mit a < x, und zwar auch im Falle inf A = −∞.
Beweis. Wir betrachten nur die Behauptung bzgl. sup A. Gibt es in A kein Element
a mit a > x, so ist a ≤ x für alle a ∈ A, d.h. x ist eine obere Schranke von A. Damit
ist sup A ∈ R, und mithin sup A ≤ x. Die Behauptung folgt also per Widerspruch
(genauer: Kontraposition).
Q.E.D.
4.6
Intervalle
Definitionen. Ein Intervall in R ist eine nichtleere Teilmenge I ⊂ R, die mit je
zwei Zahlen auch alle dazwischenliegenden Zahlen enthält, d.h. für die gilt:
(4.13)
∀x1 , x2 ∈ I ∀y ∈ R : x1 < y < x2 ⇒ y ∈ I.
Jedes Intervall I besitzt einen linken Endpunkt, inf I, und einen rechten Endpunkt, sup I (welche nicht notwendig in I liegen müssen und auch die Werte ±∞
annehmen können). I heiße endlich, falls I beschränkt ist, d.h. nach oben und
nach unten beschränkt ist.
Satz 4.6 Es seien I ⊂ R ein Intervall, und
α := inf I ≥ −∞,
β := sup I ≤ ∞
die Endpunkte von I. Sind α, β ∈ R, so ist I eine der vier folgenden Mengen:
[α, β]
[α, β[
]α, β]
]α, β[
:=
:=
:=
:=
{x ∈ R :
{x ∈ R :
{x ∈ R :
{x ∈ R :
64
α ≤ x ≤ β},
α ≤ x < β},
α < x ≤ β},
α < x < β}.
Ist α ∈ R, β = ∞, so ist I eine der Mengen [α, ∞[ := {x ∈ R : α ≤ x} oder
]α, ∞[ := {x ∈ R : α < x}, und ist α = −∞, β ∈ R, so ist I eine der Mengen
] − ∞, β] := {x ∈ R : x ≤ β} oder ] − ∞, β[ := {x ∈ R : x < β}. Im Falle
α = −∞, β = ∞ schließlich ist I =] − ∞, ∞[:= R.
Beweis. Wir betrachten nur den Fall α, β ∈ R; die übrigen Fälle werden ähnlich
behandelt. Es genügt dann offenbar, die folgenden Inklusionen zu beweisen:
]α, β[⊂ I ⊂ [α, β].
Die rechte Inklusion ist trivial, da α und β untere bzw. obere Schranken von I sind.
Für die linke Inklusion betrachten wir ein beliebiges y ∈]α, β[, es ist also α < y < β.
Nach Satz 4.5 gibt es dann Punkte x1 , x2 ∈ I mit x1 < y und x2 > y. Hieraus folgt
nach (4.13) aber y ∈ I.
Q.E.D.
Alle endlichen Intervalle I mit denselben Endpunkten α und β besitzen dieselbe
Länge |I| := β − α (≥ 0). Das Intervall I heiße abgeschlossen, wenn es alle
im Endlichen gelegenen Endpunkte enthält, offen, wenn es diese Endpunkte nicht
enthält. Hiernach sind alle Intervalle der Form [α, β] abgeschlossen, die Intervalle der
Form ]α, β[ stets offen. Die Intervalle der Form [α, β[ und ]α, β] heißen halboffen,
falls sie beschränkt sind.
Für die offene und abgeschlossene positive Halbachse benutzen wir im allgemeinen
die folgenden Bezeichnungen:
]0, ∞[=: R+ ,
[0, ∞[=: R+
0.
Ferner bezeichnet man die Menge R := R ∪ {−∞, ∞} als die erweiterte Zahlengerade. Beachte, dass ±∞ nicht in R liegen!
4.7
Das Intervallschachtelungsprinzip
Satz 4.7 (Intervallschachtelungsprinzip) Es sei
(In )n∈N = I0 ⊃ I1 ⊃ I2 ⊃ · · · ⊃ In ⊃ In+1 ⊃ · · ·
eine Folge ineinander geschachtelter abgeschlossener beschränkter Intervalle In =
[αn , βn ] ⊂ R. Dann enthalten die Intervalle In mindestens einen gemeinsamen
Punkt, d.h.
∞
\
In 6= ∅.
n=0
Strebt zusätzlich die Länge dieser Intervalle gegen 0, d.h. gibt es zu jedem ε > 0
∞
T
einen Index n(ε) ≥ 1 so, dass für alle n ≥ n(ε) gilt |In | < ε, so besteht
In aus
n=0
genau einem Punkt.
65
Beweis. Es sei A = {αn : n ∈ N} die Menge der linken Endpunkte der Intervalle
In , B = {βn : n ∈ N} die Menge der rechten Endpunkte. Aufgrund der Inklusion
In+1 ⊂ In gilt stets αn ≤ αn+1 ≤ βn+1 ≤ βn , woraus man per vollständiger Induktion
nach m folgert: Ist m ≥ n, so gilt
αn ≤ αm ≤ βm ≤ βn .
Insbesondere ist also a ≤ b für alle a ∈ A, b ∈ B. Es sei dann x := sup A. Dann ist
x ∈ R, und es gilt a ≤ x ≤ b für alle a ∈ A, b ∈ B. Insbesondere gilt αn ≤ x ≤ βn
für alle n ∈ N, und somit x ∈ In für alle n ∈ N.
Strebt die Länge dieser Intervalle gegen 0, so zeigen wir durch Widerspruch, dass es
∞
T
nur einen einzigen Punkt in
In gibt: Angenommen, es seien x < y zwei verschien=0
dene Punkte in dieser Menge. Dann sei ε := y − x > 0 deren Abstand. Für n = n(ε)
gilt dann offenbar x, y ∈ In , d.h. ε = y − x ≤ βn − αn = |In |, im Widerspruch zu
unserer Annahme, dass |In | < ε.
Q.E.D.
Wir bemerken, dass das Intervallschachtelungsprinzip i.a. für nicht-abgeschlossene
oder unbeschränkte Intervalle falsch ist. Beispielsweise gilt
(4.14)
∞
\
n=0
[n, ∞[= ∅,
∞
\
1
]0, [= ∅,
n
n=1
denn aufgrund der archimedischen Anordnung von R (Satz 4.3) gibt es zu jedem
x ≥ 0 ein n ∈ N mit n = n · 1 > x, so dass x 6∈ [n, ∞[, und ist weiter x > 0, so gibt
es ein m ∈ N mit mx > 1, d.h. x > m1 , so dass x 6∈ ]0, m1 [. Dagegen ist natürlich
∞
\
1
[0, ] = {0}.
n
n=1
Es ist in der Tat sogar möglich, eine äquivalente Beschreibung von R durch
das Intervallschachtelungsprinzip zu geben; dies kommt dem Zugang in der
Schulmathematik vielleicht am nächsten:
Bemerkungen 4.8 (a) Definiert man in einem beliebigen angeordneten Körper
K Summen und Produkte von Teilmengen sowie Intervalle ähnlich wie in R,
so kann man zeigen, dass Summen und Produkte abgeschlossener beschränkter
Intervalle ebenso abgeschlossene beschränkte Intervalle sind (Übung).
(b) Ist K ein archimedisch angeordneter Körper, in dem das Intervallschachtelungsprinzip aus Satz 4.7 gilt, so ist er ordnungsvollständig, also ( isomorph“
”
zu) R (Übung).
Eine der vielen möglichen Konstruktionen des Körpers R besteht daher darin,
die Menge R aller Intervallschachtelungen (In )n abgeschlossener beschränkter Intervalle In im Köper Q der rationalen Zahlen zu betrachten, deren Längen |In | im
66
Körper Q gegen 0 streben, und auf dieser Menge eine Äquivalenzrelation ∼ einzuführen (siehe Kapitel 11), indem man zwei solche Intervallschachtelungen (In )n
und (Jn )n als äquivalent bezeichnet, wenn die Folge der Durchschnitte (In ∩ Jn )n
ebenso in der Menge R liegt. Anschaulich bedeutet dies nämlich gerade, dass die
beiden Intervallschachtelungen denselben Punkt einschachteln.
Auf R kann man leicht eine Addition und eine Multiplikation wie folgt einführen:
(In )n + (Jn )n := (In + Jn )n ;
(In )n · (Jn )n := (In · Jn )n .
Ferner schreiben wir (In )n < (Jn )n , falls ein n0 ∈ N existiert so, dass für alle n ≥ n0
gilt In < Jn in dem Sinne, dass βn < an ist, falls In = [αn , βn ] und Jn = [an , bn ].
Man kann dann zeigen (siehe Kapitel 11), dass sich diese Strukturen auf den Quotienten K = R/ ∼ von R nach dieser Äquivalenzrelation vererben “, und dass
”
K dadurch auf natürliche Weise zu einem angeordneten Körper wird, welcher ordnungsvollständig ist (also ein Modell für den Körper R der reellen Zahlen ist).
Diese Konstruktion des Körpers R kommt der Beschreibung der reellen Zahlen durch
ihre Dezimalbruchentwicklung vermutlich am nächsten. Dabei wird ja einem gegebenen Punkt auf einer gedachten Zahlengeraden” , sagen wir der Einfachheit halber
”
im Intervall [0, 1], eine unendliche Folge von Intervallen In der Länge 10−n zugeordnet, indem man das Startintervall der Länge 1 immer wieder in 10 gleichlange
Teilintervalle zerlegt und schaut, in welchem dieser Teilintervalle der Punkt jeweils
liegt. Man beachte auch, dass die Wahl eines anderen b-adischen Systems, z.B. des
Dualsystems, zu einer jeweils anderen Folge geschachtelter Intervalle führt, welche
dennoch dieselbe reelle Zahl beschreiben soll. Dies begründet die Einführung der
Äquivalenzrelation ∼ auf R.
Leopold Kronecker (1823 –1891): Die ganzen Zahlen hat der liebe Gott gemacht,
”
alles andere ist Menschenwerk.“
67
Kapitel 5
Folgen, Grenzwerte, Unendliche
Reihen
Definitionen. a) Sei X eine beliebige Menge. Eine Folge in X ist eine Abbildung
f : N → X. Da f für jedes n ∈ N einen Punkt xn = f (n) ∈ X festlegt, spricht
man dann meist von der Folge (xn )n∈N , (xn )n oder noch kürzer (xn ) anstatt von der
“Folge f ”, oder auch von der “Folge xn := f (n)” oder (x0 , x1 , x2 , x3 , x4 , . . . ) bzw.
kürzer x0 , x1 , x2 , x3 , x4 , . . . .
b) Sind X, Y nichtleere Mengen, so bezeichne X Y die Menge aller Abbildungen
f : Y → X.
Eine Folge in X ist dann also gerade ein Element von X N .
Beispielsweise nimmt die Folge xn := (−1)n nur die Werte 1 und −1 an. In Satz 4.7
haben wir Folgen von Intervallen betrachtet.
Beachte: Wir haben hier Folgen, wie z.B. auch in [F], durch die Indices n ∈ N
parametrisiert”; dies macht durchaus Sinn, wie wir sehen werden. Gelegentlich
”
ist es auch nützlich, Folgen x1 , x2 , x3 , . . . mit Indexbereich N≥1 anstelle von N zu
betrachten, oder auch allgemeiner mit Indexbereich Nn≥m .
Im Folgenden werden wir meist reelle Folgen betrachten, d.h. Folgen in R. Dazu
gehören beispielsweise
(a) (xn )n mit xn := a, d.h. die Folge (a, a, a, a, . . . ),
(b) (xn )n∈N≥1 mit xn := n1 , d.h. die Folge (1, 12 , 31 , 41 , 51 , . . . ),
(c) (xn )n mit xn := (−1)n , d.h. die Folge (1, −1, 1, −1, 1, −1, . . . )
(d) (xn )n mit xn := n, d.h. die Folge (0, 1, 2, 3, 4, 5, . . . ).
Ein Punkt a ∈ R heiße Grenzwert oder Limes der (reellen) Folge (xn )n , in Zeichen:
xn → a
für n → ∞,
68
wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt so, dass
|xn − a| < ε für alle n ≥ n(ε).
Wir werden in Zukunft auch sagen, dass eine Aussage A(n), welche von natürlichen
Zahlen n abhängt, für genügend großes n bzw. alle genügend großen n gelte,
falls es ein n0 ∈ N gibt so, dass die Aussage A(n) für alle n ≥ n0 wahr ist.
Dies ist offenbar gleichbedeutend damit, dass die Teilmenge A ⊂ N aller n ∈ N, für
welche die Aussage falsch ist, endlich ist. Z.B. sind die Folgenglieder der Folge
1, 5, 7, 11, 12, 14, 16, 18, 20, 22, . . .
für genügend großes n gerade Zahlen (nämlich für n ≥ 5, d.h. wir können hier
n0 := 5 wählen; n0 = 100 wäre aber auch ein mögliche Wahl). Folgender Satz, der
sich leicht auch auf endliche viele Aussagen ausdehnen lässt, ist sehr oft nützlich:
Satz 5.1 Sowohl die Aussage A(n) gelte für genügend großes n, als auch die Aussage B(n). Dann gilt auch die Aussage A(n) ∧ B(n) für genügend großes n.
Beweis. Laut Voraussetzung gibt es n1 und n2 in N so, dass für alle n ≥ n1 die
Aussage A(n) wahr ist, und für alle n ≥ n2 die Aussage B(n) wahr ist. Sei dann
n3 := max{n1 , n2 }.
Für alle n ≥ n3 ist dann sowohl die Aussage A(n) als auch die Aussage B(n) wahr,
also auch die Aussage A(n) ∧ B(n).
Q.E.D.
Ein weiterer wichtiger Begriff ist der der ε - Umgebung eines Punktes a ∈ R : für
ε > 0 ist dies per definitionem das offene Intervall
Uε (a) := {x ∈ R : |x − a| < ε} =]a − ε, a + ε[,
a−ǫ
a
a+ǫ
Damit kann die obige Konvergenz der Zahlenfolge (xn )n gegen die Zahl a ∈ R auch
wie folgt beschrieben werden:
Für jedes ε > 0 liegen die Folgenglieder xn für alle genügend großen n stets in der
ε-Umgebung Uε (a) von a.
Beachte: Was genügend groß” bedeutet, darf hier von dem gewählten ε abhängen,
”
da ja der Index n(ε), ab dem xn in Uε (a) liegen soll, von ε abhängen darf!
Besitzt die Folge (xn )n einen Grenzwert a ∈ R, so heißt sie konvergent, andernfalls
divergent.
Achtung: Divergenz bedeutet nicht notwendig, dass die Folge irgendwie nach
”
Unendlich” strebt! Betrachte dazu das nachfolgende Beispiel (c).
Betrachten wir einmal die obigen Beispiele (a) – (d).
69
(a) Die konstante Zahlenfolge mit xn := a ist konvergent und besitzt a als Grenzwert, d.h.
xn → a für n → ∞,
denn offensichtlich ist |xn − a| = |a − a| = 0 < ε für jedes ε > 0 und jedes
n ∈ N, also insbesondere für genügend großes n.
(b) Die Zahlenfolge mit xn :=
d.h.
1
n
ist konvergent und besitzt a = 0 als Grenzwert,
1
→ 0 für n → ∞.
n
Aufgrund der archimedischen Anordnung von R (vgl. Satz 4.3) gibt es nämlich
zu jedem ε > 0 ein m ∈ N≥1 mit ε > m1 . Wählen wir daher n(ε) := m, so gilt
für n ≥ n(ε):
1
− 0 = 1 ≤ 1 < ε.
n
n
m
(c) Die Folge mit xn = (−1)n ist divergent.
Dies zeigen wir durch Widerspruch: Angenommen, es gäbe einen Grenzwert
a ∈ R dieser Folge. Wählen wir nun ε := 1/2, so müsste dann insbesondere
für alle genügend großen n gelten
a−
1
1
< (−1)n < a + .
2
2
Ist nun n eine genügend große gerade Zahl (d.h. n ≥ n(1/2)), so folgte also
a − 21 < 1 < a + 12 . Dann ist zudem n + 1 ungerade und ebenfalls genügend
groß, und ersetzen wie in der obigen Ungleichungskette n durch n + 1, so folgte
ebenso a − 21 < −1 < a + 21 . Hieraus zusammen folgte aber 12 < a < − 12 , ein
offensichtlicher Widerspruch.
(d) Die Folge mit xn = n ist ebenso divergent, denn wäre a ∈ R ein Grenzwert,
so läge mit ε := 1 für genügend großes n die Zahl n in dem Intervall ]a −
1, a + 1[, d.h. es wäre insbesondere n < a + 1 für alle genügend großen n. Dies
widerspräche jedoch der archimedischen Anordnung von R (vgl. Satz 4.3).
Satz 5.2 Eine konvergente Folge hat genau einen Grenzwert.
Beweis. Wir nehmen an, dass die Folge (xn )n sowohl gegen a als auch gegen b
konvergiert. Sei dann ε > 0 beliebig gegeben. Dann gilt für alle genügend großen n
sowohl
|xn − a| < ε/2,
als auch
|xn − b| < ε/2.
70
Damit gelten diese beiden Ungleichungen nach Satz 5.1 auch simultan für jedes
genügend große n. Insbesondere gibt es dann mindestens ein n, so dass
|a − b| ≤ |a − xn | + |xn − b| < ε/2 + ε/2 = ε.
Die Ungleichung |a−b| < ε gilt somit für jedes ε > 0. Dann muss jedoch insbesondere
auch |a − b| = 0 gelten, denn andernfalls wäre ε := |a − b| > 0, und die Ungleichung
|a − b| < ε = |a − b| lieferte einen Widerspruch. Aus |a − b| = 0 folgt aber a − b = 0,
also a = b.
Q.E.D.
Der nach diesem Satz eindeutige Grenzwert der konvergenten Folge (xn )n wird mit
lim xn oder einfach lim xn
n→∞
bezeichnet; für die Aussage “xn → a für n → ∞” schreiben wir von jetzt an auch:
lim xn = a.
n→∞
Eine reelle Folge (xn )n heiße nach oben beschränkt (bzw. nach unten beschränkt, bzw. beschränkt), wenn ebendies auf die Bildmenge {xn : n ∈ N} ⊂ R
der Folge zutrifft. Offenbar ist die Folge (xn )n genau dann beschränkt, wenn es ein
M ≥ 0 gibt, so dass |xn | ≤ M für alle n.
Satz 5.3 Jede konvergente Folge ist beschränkt.
Beweis. Gilt a = lim xn , so gibt es zu ε := 1 ein n0 ∈ N mit |xn − a| < 1 für alle
n→∞
n > n0 . Wir setzen
M := max{|x1 |, . . . , |xn0 |, |a| + 1}.
Da |xn | ≤ |xn − a| + |a| < |a| + 1 für n > n0 , so ist dann offenbar |xn | ≤ M für jedes
n ≥ 1.
Q.E.D.
Bemerkung: Die Umkehrung von Satz 5.3 gilt nicht. Beispielsweise ist die Folge
xn = (−1)n beschränkt, aber divergent. Die Divergenz der Folge in Beispiel (d) ist
übrigens eine unmittelbare Konsequenz aus Satz 5.3.
Wir wollen hier gleich ein erstes, sehr nützliches Konvergenzkriterium angeben.
Wir sagen, eine reelle Zahlenfolge (xn )n sei monoton wachsend oder kurz wachsend, wenn für alle n gilt: xn+1 ≥ xn , d.h.
x0 ≤ x1 ≤ x2 ≤ x3 ≤ x4 ≤ · · · ;
sie heiße streng monoton wachsend oder kurz streng wachsend, wenn für alle
n gilt: xn+1 > xn . Gelten dagegen die Ungleichungen xn+1 ≤ xn bzw. xn+1 < xn ,
so heiße die Folge monoton fallend oder kurz fallend, bzw. streng monoton
fallend oder streng fallend. Die Folge sei monoton, wenn sie wachsend oder
fallend ist.
71
Satz 5.4 (Grenzwerte monotoner Folgen) Jede monoton wachsende und nach
oben beschränkte, bzw. monoton fallende und nach unten beschränkte reelle Zahlenfolge (xn )n ist konvergent, und zwar gilt mit F := {xn : n ∈ N} ⊂ R:
lim xn = sup F bzw. lim xn = inf F,
n→∞
n→∞
je nachdem, ob die Folge wächst, oder fällt.
Beweis. Wir betrachten den Fall einer wachsenden Folge (xn )n (der Fall einer fallenden Folge kann analog behandelt werden). Da die Menge F laut Voraussetzung
nach oben beschränkt ist, existiert a := sup F ∈ R. Zu jedem ε > 0 gibt es nach
Satz 4.5 daher ein n0 mit xn0 > a − ε. Wegen der Monotonie folgt daher
a − ε < xn0 ≤ xn ≤ a < a + ε
für alle n ≥ n0 ,
und somit xn ∈ Uε (a) für alle n ≥ n0 . Damit konvergiert die Folge gegen a. Q.E.D.
Beispiel. Durch die Rekursionsvorschrift
x0 := 1, xn :=
(2n − 1)(2n + 1)
xn−1 ,
(2n)2
n ≥ 1,
wird wegen 0 < (2n − 1)(2n + 1)/(2n)2 = (4n2 − 1)/4n2 < 1 eine (streng) monoton fallende Folge positiver Zahlen definiert (mit Indexmenge N); ihr allgemeines
Folgenglied lautet:
xn =
1 3 3 5 5 7
2n − 1 2n + 1
· · · · · ···
·
,
2 2 4 4 6 6
2n
2n
n ≥ 1.
Die Folge ist nach Satz 5.4 konvergent. Wir werden später zeigen, dass lim xn = 2/π.
5.1
Rechenregeln für Grenzwerte und Kovergenzssätze
Satz 5.5 Es seien (an )n und (bn )n zwei konvergente Zahlfolgen mit lim an = a
und lim bn = b. Ferner sei λ ∈ R. Dann sind auch die Folgen (an + bn )n ,
(an − bn )n , (an bn )n und (λan )n konvergent, und es gilt:
(i)
lim(an + bn ) = a + b = lim an + lim bn ,
(ii)
lim(an − bn ) = a − b = lim an − lim bn ,
(iii)
lim(an bn ) = ab = (lim an )(lim bn ),
72
(iv)
lim(λan ) = λa = λ lim an .
(v) Ist ferner b 6= 0, so gibt es ein n0 ∈ N, so dass bn 6= 0 für n ≥ n0 , und die
Folge (an /bn )n≥n0 ist konvergent. Für ihren Grenzwert gilt
lim
an a
lim an
= =
.
bn
b
lim bn
Beweis. Wir überlassen (i) als Übungsaufgabe.
Zu (iii): Da die Folge (an ) konvergent ist, gibt es nach nach Satz 5.3 eine Konstante
M ≥ 0, so dass |an | ≤ M für alle n. Damit können wir den Abstand von an bn zu ab
wie folgt nach oben abschätzen:
|ab − an bn | = |(a − an )b + an (b − bn )| ≤ |(a − an )b| + |an (b − bn )|
= |b||a − an | + |an ||b − bn | ≤ |b||a − an | + M|b − bn |
≤ N|a − an | + N|b − bn |,
wobei wir N := |b| + M + 1 gesetzt haben. Beachte, dass N > 0. Sei nun ε > 0. Da
a = lim an existiert, und da ε/(2N) > 0 ist, gilt |a − an | < ε/(2N) für alle genügend
großen n, und ähnlich gilt wegen b = lim bn die Abschätzung |b − bn | < ε/(2N) für
alle genügend großen n.
Somit gelten nach Satz 5.1 für alle genügend großen n die beiden Abschätzungen
|a − an | < ε/(2N) und |b − bn | < ε/(2N) gleichzeitig, also auch
|ab − an bn | ≤ N|a − an | + N|b − bn | < N
ε
ε
+N
= ε.
2N
2N
Somit ist lim(an bn ) = ab.
Zu (iv): Dies folgt sofort aus (iii), indem wir für (bn ) die konstante Folge bn := λ
wählen.
Zu (ii): Nach (iv) ist lim(−bn ) = − lim(bn ). Damit folgt (ii) dann aus (i).
Zu (v): Aufgrund von (iii) genügt es, denn Fall an = 1 zu betrachten, da ja an /bn =
an (1/bn ) ist.
Sei also lim bn = b 6= 0. Dann ist δ := |b|/2 > 0, und zu diesem δ gibt es ein n0 ≥ 1,
so dass |bn − b| < δ = |b|/2 für alle n ≥ n0 . Hieraus folgt für n ≥ n0 (also alle
genügend großen n)
|bn | = |b + (bn − b)| ≥ | |b| − |bn − b| | = |b| − |bn − b| > |b| −
|b|
|b|
= ,
2
2
d.h. |bn | > δ > 0. Insbesondere ist bn 6= 0 für n ≥ n0 , so dass wir 1/bn bilden können.
Wir schätzen den Abstand von 1/bn zu 1/b für n ≥ n0 wie folgt nach oben ab:
1
bn − b |bn − b|
1
|bn − b|
− =
=
≤
= M|bn − b|,
b bn bn b |bn ||b|
(|b|/2)|b|
73
mit M := 2/|b|2 > 0.
Sei nun ε > 0. Wegen b = lim bn und da die Zahl ε/M > 0 positiv ist, gilt für alle
genügend großen n die Ungleichung |bn − b| < ε/M. Wieder mit Satz 5.1 folgt, dass
für alle genügend großen n gilt
1
− 1 ≤ M|bn − b| < M ε = ε.
b bn M
Es folgt, dass lim(1/bn ) = 1/b.
Q.E.D.
Beispiel. Betrachte die Folge
3n2 + 13n
,
n2 − 2
Für n ≥ 1 lässt sich an schreiben als
n ∈ N.
an :=
3+
an =
1−
13
n
2
n2
.
Da lim(1/n) = 0, ist nach (iii) auch lim(1/n2 ) = 0, also nach (iv) auch lim(2/n2 ) = 0,
und ebenso nach (iv) lim(13/n) = 0. Mit (i) folgt hieraus lim(3 + 13/n) = 3 und
lim(1 − 2/n2 ) = 1 6= 0. Somit lässt sich schließlich (v) anwenden, und wir erhalten
3n2 + 13n
= 3.
n→∞
n2 − 2
lim
Satz 5.6 Seien (an )n und (bn )n zwei konvergente reelle Folgen, und sei an ≤ bn für
alle genügend großen n. Dann gilt auch
lim an ≤ lim bn .
Beweis. Angenommen, es sei b := lim bn < a := lim an . Dann ist ε := (a − b)/2 > 0.
Somit gilt für genügend großes n die Abschätzung |an − a| < ε, und ebenso gilt für
genügend großes n die Abschätzung |bn − b| < ε. Wieder nach Satz 5.1 gelten daher
diese beiden Abschätzungen für genügend großes n gleichzeitig, d.h. es gibt ein n(ε)
so, dass für alle n ≥ n(ε) gilt
a − ε < an < a + ε
und
b − ε < bn < b + ε,
und insbesondere also
bn < b + ε = (a + b)/2 = a − ε < an .
Dies steht jedoch Widerspruch zu unserer Voraussetzung, dass an ≤ bn ist für
genügend großes n.
Q.E.D.
Vorsicht: Aus an < bn für alle n folgt nicht unbedingt lim an < lim bn , sondern i.a.
nur lim an ≤ lim bn .
Beispiel. Wähle an := 0 und bn := 1/n, n ≥ 1.
Eine unmittelbare Folgerung aus dem vorangehenden Satz ist
74
Korollar 5.7 Sei (an )n eine konvergente reelle Folge mit A ≤ an ≤ B für genügend
große n. Dann gilt auch
A ≤ lim an ≤ B.
Satz 5.8 (Einschließungssatz) Besitzen die beiden Zahlenfolgen (an )n und (bn )n
denselben Grenzwert ξ, und ist (xn )n eine weitere Folge so, dass für alle genügend
großen n (sagen wir n ≥ n0 ) gilt
an ≤ xn ≤ bn ,
so ist auch lim xn = ξ.
Beweis. Sei ε > 0. Da lim an = ξ ist, gilt für genügend großes n dann |an − ξ| < ε,
also insbesondere an > ξ − ε. Analog folgert man aus lim bn = ξ, dass für genügend
großes n gilt bn < ξ + ε. Zusammen mit unserer Voraussetzung, dass an ≤ xn ≤ bn
für alle genügend großen n gilt, folgern wir wieder mit Satz 5.1 (in der Version
mit drei Aussagen), dass diese drei Ungleichungen für genügend großes n simultan
gelten. Insbesondere gilt damit für genügend großes n
ξ − ε < an ≤ xn ≤ bn ≤ ξ + ε,
d.h. xn ∈ Uε (ξ). Damit ist gezeigt, dass lim xn = ξ.
Q.E.D.
Satz 5.9 Sei A eine nichtleere nach oben (bzw. unten) beschränkte Teilmenge von
R. Dann existiert eine Folge (an )n in A mit sup A = lim an (bzw. inf A = lim an ).
Beweis. Wir zeigen dies für das Supremum s := sup A. Zu jedem n ∈ N≥1 gibt es
nach Satz 4.5 zu ε := 1/n ein an ∈ A mit an ≥ s − 1/n. Wegen an ≤ s gilt somit für
alle n ∈ N
1
s − ≤ an ≤ s.
n
Mit dem Einschließungssatz folgern wir daraus, dass s = lim an .
Q.E.D.
Als Anwendung dieser Sätze beweisen wir die Existenz k-ter Wurzeln: Sind x > 0
eine positive reelle Zahl und k ≥ 1 eine natürliche Zahl, so bezeichnen wir y ∈ R als
eine k-te Wurzel aus x, falls y k = x gilt.
Satz 5.10 Jede positive reelle Zahl a > 0 besitzt für jedes k ≥ 2 aus N eine und
nur eine positive reelle k-te Wurzel.
√
Wir bezeichnen diese eindeutige positive k-te Wurzel aus a mit k a.
Beweis. Sei A := {x ≥ 0 : xk ≤ a}, und setze b := sup A.
Die Menge A ist nach oben beschränkt durch 1 + a, da aus x > 1 + a mit der
Bernoullischen Ungleichung folgt xk > (1 + a)k ≥ 1 + ka > a. Da 0 in A liegt, ist
75
zudem A nichtleer, so dass b ∈ R und b ≥ 0. Wähle gemäß Satz 5.9 eine Folge (xn )n
in A mit lim xn = b. Nach unseren Grenzwertsätzen ist dann bk = lim xkn ≤ a.
n→∞
Um zu zeigen, dass bk = a ist, bemerken wir, dass für alle ε ∈]0, 1] nach der binomischen Formel
k k X
X
k k−j
k j−1 k−j
k
k
k
b
= bk + εC
ε b
≤b +ε
(b + ε) = b + ε
j
j
j=1
j=1
gilt. Wäre nun bk < a, so wäre
n a − bk o
∈]0, 1].
ε0 := min 1,
C
Für ε := ε0 folgte damit (b+ε0)k ≤ bk +(a−bk ) = a, d.h. b+ε0 ∈ A, im Widerspruch
zur Definition von b. Folglich ist bk = a.
Die Eindeutigkeit der positiven k-ten Wurzel von a folgt sofort aus der Beobachtung,
dass 0 < b1 < b2 die Ungleichungt bk1 < bk2 impliziert.
Q.E.D.
Alternativ kann man die Existenz der k-ten Wurzeln auch mit Hilfe des Newtonverfahrens nachweisen, welches z.B. in [K] besprochen wird. Studieren Sie diesen Beweis
in [K]! (Übung).
Bemerkung: Aus dem Beweis von Satz 5.10 folgert man leicht, dass der Körper Q
nicht ordnungsvollständig ist (Übung).
Eine Folge (xn )n heiße Nullfolge, falls lim xn = 0. Wir fassen im nächsten Satz
einige im Grunde offensichtliche, aber doch nützliche Regeln zusammen:
Satz 5.11 (i) Ist (an )n eine konvergente Folge, so ist auch die Folge (|an |)n konvergent, und es gilt
lim |an | = | lim an |.
(ii) Die Folge (xn )n ist genau dann eine Nullfolge, wenn die Folge (|xn |)n eine Nullfolge ist.
(iii) Ist (xn )n eine Nullfolge, und ist (yn )n eine weitere Folge so, dass |yn | ≤ |xn | für
alle genügend großen n, so ist auch (yn )n eine Nullfolge.
(iv) Der Grenzwert einer konvergenten Folge ändert sich nicht, wenn man sie durch
eine Nullfolge abändert, d.h. gilt an → a und xn → 0, so folgt (an + xn ) → a.
Insbesondere ändert sich der Grenzwert nicht, wenn man endlich viele Folgenglieder
abändert.
Beweis. (i) folgt leicht aus der Ungleichung
| |a| − |an | | ≤ |a − an |,
und die übrigen Aussagen sind vollkommen trivial.
Q.E.D.
76
5.2
Teilfolgen, Häufungspunkte
Definition. Sei (xn )n∈N ∈ X N eine Folge in einer vorgegebenen Menge X, und sei
n0 < n1 < n2 < n3 < . . .
eine streng wachsende Folge (nk )k natürlicher Zahlen. Dann heißt die Folge
(xnk )k∈N = (xn0 , xn1 , xn2 , xn3 , . . . ) eine Teilfolge der Folge (xn )n .
Mit anderen Worten: Bezeichnen f : N → X die Abbildung f : n 7→ xn und
g : N → N die streng monoton wachsende Abbildung g : k 7→ nk , so ist (xnk )k∈N die
zusammengesetzte Abbildung f ◦ g.
Beispiel. Ist (xn )n die Folge mit xn :=
(−1)n
,
n+1
d.h. die Folge
1 1 1 1 1 1
(1, − , , − , , − , , . . . ),
2 3 4 5 6 7
so ist mit nk := 2k die Teilfolge yk := xnk =
(1, 13 , 51 , 17 , . . . ).
(−1)2k
2k+1
=
1
2k+1
gewählt, d.h. die Teilfolge
Dagegen erhält man für mk := 2k + 1 die Teilfolge zk := xmk =
d.h. die Teilfolge (− 12 , − 41 , − 16 , . . . ).
(−1)2k+1
2k+2
1
= − 2k+2
,
Satz 5.12 Ist lim xn = a, so hat auch jede Teilfolge von (xn )n∈N den Grenzwert a.
n→∞
Beweis. Ist n0 < n1 < n2 < . . . eine aufsteigende Folge natürlicher Zahlen, so gilt
nk ≥ k für alle k.
Dies zeigt man leicht mittels vollständiger Induktion: Für k = 0 ist dies klar, da
n0 ≥ 0, und haben wir dies bereits für ein k ≥ 0 bewiesen, so folgt
nk+1 ≥ nk + 1 ≥ k + 1.
Ist nun lim xn = a, und ist ε > 0, so gibt es ein n(ε) ∈ N so, dass xn ∈ Uε (a) für
alle n ≥ n(ε). Für k ≥ n(ε) ist jedoch nk ≥ k ≥ n(ε), so dass auch xnk ∈ Uε (a).
Q.E.D.
Beispielsweise folgt aus Satz 5.12 leicht, dass für jedes ganzzahlige p ≥ 2 gilt:
(5.1)
1
= 0.
k→∞ pk
lim
Die Folge (nk )k := (pk )k ist nämlich eine aufsteigende Folge natürlicher Zahlen, so
dass die Folge (1/pk )k die Teilfolge (xnk )k∈N der Nullfolge (xn )n≥1 := (1/n)n≥1 ist.
77
(5.1) lässt sich übrigens folgendermaßen verallgemeinern: für jedes r ∈ R mit 0 ≤
r < 1 gilt:
lim r k = 0.
(5.2)
k→∞
Für r = 0 ist dies klar. Sei also 0 < r < 1. Offenbar ist die Folge (r k )k fallend und
durch 0 nach unten beschränkt, so dass nach Satz 5.4
lim r k = inf r k =: a ≥ 0
k→∞
k∈N
existiert. Wäre nun a > 0, so folgte aus r k ≥ a für alle k ≥ 1 auch r k−1 ≥ a/r, d.h.
a = inf r k−1 ≥ a/r > a,
k≥1
ein Widerspruch. Somit ist a = 0.
Definition. Ein Punkt a ∈ R heiße Häufungspunkt der Zahlenfolge (xn )n∈N , wenn
in jeder (noch so kleinen) ε-Umgebung von a unendlich viele Folgenglieder xn liegen,
d.h., wenn es unendlich viele n ∈ N gibt mit xn ∈ Uε (a). Hierzu äquivalent ist die
folgende Eigenschaft (wieso? Übung):
Zu jedem ε > 0 und zu jedem m ∈ N gibt es ein n > m mit xn ∈ Uε (a).
Beispielsweise besitzt die Folge xn = (−1)n die beiden Häufungspunkte 1 und -1.
Satz 5.13 Seien (xn )n eine Zahlenfolge und a ∈ R. Dann ist a ein Häufungspunkt
der Folge (xn )n dann und nur dann, wenn es eine Teilfolge (xnk )k gibt mit lim xnk =
k→∞
a.
Beweis. Es sei a ein Häufungspunkt der Folge (xn )n . Um rekursiv eine geeignete
Auswahlfolge (nk )k zu konstruieren, setzen wir n0 = 0.
Nach Definition des Häufungspunktes gibt es dann zu m := n0 ein n > n0 mit
|xn − a| < 1; wir wählen als n1 das kleinste solche n.
Nehmen wir nun an, es seien n0 < n1 < · · · < nk für ein k ≥ 1 bereits so bestimmt,
dass |xnj − a| < 1j für j = 1, . . . , k (n0 fällt hier offenbar heraus). Dann gibt es ein
1
n > nk mit |xn − a| < k+1
; wir wählen als nk+1 das kleinste solche n. Damit ist die
Folge (nk )k wohldefiniert und streng wachsend, und es gilt nach Konstruktion der
nk :
1
|xnk − a| <
k
für alle k ≥ 1. Da die Folge (1/k)k≥1 gegen 0 konvergiert, schließt man hieraus, dass
xnk → a für k → ∞.
Die umgekehrte Implikation ist trivial.
Q.E.D.
Wir haben bereits gesehen, dass nicht jede beschränkte Folge konvergent ist. Es gilt
aber das wichtige
78
Theorem 5.14 (Satz von Bolzano-Weierstraß) Jede beschränkte Folge reeller
Zahlen besitzt eine konvergente Teilfolge.
Beweis. Sei (xn )n eine beschränkte Folge reeller Zahlen. Nach Satz 5.13 genügt es
zu zeigen, dass die Folge (xn )n einen Häufungspunkt besitzt. Dazu definieren wir in
einem ersten Schritt rekursiv eine Folge ineinandergeschachtelter, abgeschlossener
und beschränkter Intervalle I0 ⊃ I1 ⊃ I2 ⊃ . . . mit der Eigenschaft, dass jedes
der Intervalle Ik unendlich viele der Folgenglieder xn enthält (d.h. genauer, dass es
unendlich viele n gibt mit xn ∈ Ik ), wobei die Länge der Intervalle gegen 0 strebt.
Für I0 wählen wir irgendein beschränktes, abgeschlossenes Intervall I0 = [α0 , β0 ],
welches alle xn enthält – ein solches existiert, da die Folge (xn )n beschränkt ist.
Nehmen wir nun an, dass die Intervalle I0 ⊃ I0 ⊃ · · · ⊃ Ik für ein k ≥ 0 bereits so
gewählt sind, dass für j = 0, . . . , k die Länge von Ij jeweils 2−j L beträgt, wobei L =
β0 − α0 die Länge von I0 bezeichne, und so, dass Ik unendlich viele der Folgenglieder
xn enthält, so legen wir Ik+1 wie folgt fest:
Ist Ik das Intervall Ik = [αk , βk ], so unterteilen wir Ik in die beiden Teilintervalle
k
k
J1 := [αk , αk +β
] und J2 := [ αk +β
, βk ] der Länge 21 · 2−k L = 2−(k+1) L. Dann muss
2
2
offensichtlich mindestens eines der beiden Teilintervalle unendlich viele Folgenglieder
xn enthalten, und wir wählen für Ik+1 eines der Teilntervalle mit dieser Eigenschaft.
Nach (5.1) strebt dann offenbar die Länge der Ik gegen 0.
Nach dem Intervallschachtelungsprinzip (Satz 4.7) gibt es nun genau einen Punkt
a, welcher in allen Intervallen Ik liegt.
Wir werden zeigen, dass a ein Häufungspunkt der Folge (xn )n ist. Dazu betrachten
wir eine beliebige ε-Umgebung Uε (a), ε > 0, von a. Da die Länge βk − αk des
Intervalls Ik = [αk , βk ] für k → ∞ gegen 0 strebt, gibt es ein k0 so, dass ℓ :=
βk0 − αk0 < ε. Da ferner a ∈ Ik0 ist, gilt |a − αk0 | ≤ ℓ < ε, und ebenso |βk0 − a| < ε,
d.h. αk0 , βk0 ∈ Uε (a). Da Uε (a) ein Intervall ist, ist folglich Ik0 ⊂ Uε (a). Es gibt aber
unendlich viele n mit xn ∈ Ik0 , und folglich trifft dies auch auf Uε (a) zu.
Q.E.D.
Wir kommen nun zu dem wohl wichtigsten Konvergenzkriterium für reelle Folgen,
dem Cauchy-Kriterium:
Definition. Eine reelle Folge (xn )n heiße Cauchy-Folge, wenn es zu jedem ε > 0
ein n(ε) ∈ N gibt so, dass
|xn − xm | < ε
für alle n, m ≥ n(ε).
Grob gesprochen: eine Folge ist eine Cauchy-Folge, wenn der Abstand beliebiger
”
Folgenglieder beliebig klein wird, falls deren Indizes nur genügend groß sind “.
Lemma 5.15 Sei (xn )n eine Cauchy-Folge in R. Dann gilt:
(i) Die Folge (xn )n ist beschränkt.
(ii) Besitzt die Folge (xn )n eine konvergente Teilfolge (xnk )k mit Grenzwert a :=
lim xnk , so konvergiert auch die komplette Folge (xn )n ebenfalls gegen a.
k→∞
79
Beweis. (i) Zu ε = 1 gibt es ein n0 ∈ N, so daß
|xn − xm | < 1
für n, m ≥ n0 .
Insbesondere gilt für n ≥ n0 :
|xn | ≤ |xn − xn0 | + |xn0 | < |xn0 | + 1.
Somit bildet M := max{|x0 |, . . . , |xn0 −1 |, |xn0 | + 1} eine Schranke für die Folge (xn ).
(ii) Sei ε > 0. Dann gibt es ein n(ε) ∈ N, so daß |xn −xm | < ε/2 für alle m, n ≥ n(ε).
Wegen xnk → a gibt es ferner ein k0 ∈ N, so daß |xnk0 − a| < ε/2 und nk0 ≥ n(ε).
Dann gilt aber für n ≥ n(ε)
|xn − a| ≤ |xn − xnk0 | + |xnk0 − a|
< ε/2 + ε/2 = ε.
Somit konvergiert die Folge (xn )n gegen a.
Q.E.D.
Theorem 5.16 Eine reelle Zahlenfolge (xn )n ist konvergent dann und nur dann,
wenn sie eine Cauchy-Folge ist.
Beweis. (i) Es ist leicht einzusehen, dass jede konvergente Folge eine Cauchy-Folge
ist:
Ist nämlich lim xn = a, und wählt man ε > 0, so gibt es nach Definition ein n(ε) so,
dass
|xn − a| < ε/2 für alle n ≥ n(ε).
Sind daher n, m ≥ n(ε), so folgt aus der Dreiecksgleichung
|xn − xm | = |(xn − a) + (a − xm )|
≤ |xn − a| + |xm − a| <
ε ε
+ = ε.
2 2
(ii) Wir zeigen nun die Umkehrung:
Sei (xn )n eine Cauchy-Folge. Da diese nach Lemma 5.15 beschränkt ist, können
wir auf sie den Satz von Bolzano-Weierstraß anwenden und finden damit eine konvergente Teilfolge (xnk )k . Wieder mit Lemma 5.15 ist damit auch die Folge (xn )n
konvergent.
Q.E.D.
Bemerkung. Die Tatsache, dass in R jede Cauchy-Folge konvergent ist, ist von so
fundamentaler Bedeutung, dass man für sie einen eigenen Begriff eingeführt hat:
Man sagt, der Körper R sei vollständig (für einen archimedisch geordneten Körper
sind Vollständigkeit und Ordnungsvollständigkeit übrigens äquivalente Begriffe – die
eine Richtung davon haben wir soeben bewiesen).
Der große Vorteil des Cauchy-Kriteriums besteht darin, dass es mit ihm oft gelingt,
die Konvergenz einer gegebenen Folge nachzuweisen, ohne dass deren Grenzwert
explizit bekannt ist.
80
5.3
Unendliche Reihen
Folgen treten häufig in Form unendlicher Reihen auf, d.h. als Folge (sn )n∈N der
Partialsummen
sn :=
n
X
k=0
ak = a0 + a1 + · · · + an , n ∈ N,
welche zu einer gegebenen Zahlenfolge (an )n∈N gebildet werden. Für die unendliche
∞
X
Reihe (sn )n benutzt man in der Regel das Symbol
ak . Konvergiert die Folge
(sn )n , so wird ihr Grenzwert ebenfalls mit
k=0
ak bezeichnet.
k=0
zweierlei:
i) Die Folge
∞
X
n
X
ak
k=0
n∈N
∞
X
ak bedeutet also
k=0
der Partialsummen.
ii) Im Falle der Konvergenz den Limes lim
n→∞
gegebenen Reihe genannt wird.
n
X
ak , welcher auch der Wert der
k=0
Übrigens lässt sich jede Folge (cn )n auch als ( teleskopische“) Reihe
”
cn = c0 + (c1 − c0 ) + (c2 − c1 ) + · · · + (cn − cn−1 )
n
X
(ck − ck−1 ),
n ∈ N.
= c0 +
k=1
darstellen.
Bemerkungen. a) Natürlich kann die Summation in einer Reihe statt mit k = 0
auch mit irgendeinem k0 ∈ Z beginnen. Es genügt, dass die Terme ak für alle k ≥ k0
definiert sind. Durch Indexverschiebung um k0 lässt sich dieser allgemeinere Fall
jedoch sofort auf den bisher betrachteten zurückführen, d.h.:
∞
P
ak eine unendliche Reihe mit kleinstem Summationsindex k0 , und setzt man
Ist
k=k0
a′l := ak0 +l , l ∈ N, so erhält man die Reihe
kP
0 +n
k=k0
ak bzw. s′n :=
n
P
l=0
∞
P
l=0
a′l . Für die Partialsummen sn :=
a′l dieser Reihen gilt dann sn = s′n , d.h. die beiden Reihen
besitzen dieselben Folgen von Partialsummen und sind somit gleich.
P
P
b) Sei k0 ≥ 1. Da sich die Partialsummen nk=0 ak = a0 + · · · + an und nk=k0 ak =
P 0 −1
ak unterscheiden, ist die
ak0 + · · · + an für alle n ≥ k0 nur um die feste Zahl kk=0
81
P
P∞
Reihe ∞
k=0 ak konvergent dann und nur dann, wenn die Reihe
k=k0 ak konvergent
ist, d.h. es ist erlaubt, endlich viele Summanden in einer Reihe abzuändern, ohne
dass sich das Konvergenzverhalten ändert (natürlich wird sich der Wert dabei i.a.
jedoch verändern).
Von dieser Tatschen werden wir gelegentlich ohne weitere Erwähnung Gebrauch
machen.
Um die Notation nicht unnötig kompliziert werden zu lassen, werden wir in den
folgenden Sätzen daher stets k0 = 0 annehmen - sie gelten aber natürlich auch bei
beliebigen Anfangsindices k0 .
Ist aufgrund des Kontextes
klar,
X
X über welchen Bereich summiert wird, so schreiben
wir auch einfach
ak oder
ak .
k
Beispiel. (a) Für die Partialsummen der Reihe
n
X
k=1
∞
X
k=1
1
gilt sn
k(k + 1)
:=
n
1
=
; dies weist man leicht durch Induktion nach. Ein besserer Weg
k(k + 1)
n+1
1
besteht darin, den Summanden ak = k(k+1)
zu zerlegen in
wird sn zu einer telekopischen Summe
1
k(k+1)
=
1
k
−
1
.
k+1
Dann
n
X
1
1
),
sn =
( −
k k+1
k=1
und man sieht daran sofort, dass
sn =
1
n
1
−
=
.
1 n+1
n+1
Da sn → 1, ist die Reihe konvergent, und für ihren Wert gilt:
∞
X
k=1
1
= 1.
k(k + 1)
Satz 5.17 ( Unendliche geometrische Reihe) Sei |x| < 1. Dann gilt
∞
X
1
.
1−x
xk =
k=0
Beweis. Für die Partialsummen sn :=
n
X
k=0
sn =
xk gilt (für beliebiges x ∈ R \ {1}) :
1 − xn+1
,
1−x
82
da
(1 − x)sn =
n
X
k=0
k
x −
n
X
k+1
x
=
k=0
n
X
k=0
k
x −
n+1
X
k=1
xk = 1 − xn+1 .
Ist |x| < 1, so gilt nach Satz 5.11 und (5.2) ferner lim xn+1 = 0, und somit lim sn =
n→∞
n→∞
1
.
1−x
Q.E.D.
Das Cauchy-Kriterium für Folgen findet seine Entsprechung in folgendem
P
Satz 5.18 ( Cauchy-Kriterium für Reihen) Eine Reihe k ak ist genau dann
konvergent, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt so, dass
m
X
für alle m ≥ n ≥ n(ε).
a
k < ε
k=n
Beweis. Sei sp :=
p
P
k=0
ak die p-te Partialsumme der Reihe. Dann ist für m ≥ n ≥ 1
m
X
ak ,
|sm − sn−1 | = k=n
und die angegebene Bedingung drückt somit einfach aus, dass die Folge (sn ) der Partialsummen eine Cauchy-Folge ist. Satz 5.18 ist damit eine unmittelbare Konsequenz
der Vollständigkeit von R (Theorem 5.14).
Q.E.D.
Korollar 5.19 EinePnotwendige (aber nicht hinreichende) Bedingung für die Konvergenz einer Reihe k ak ist, dass lim ak = 0.
k→∞
Beweis. Sei ε > 0. Ist die Reihe konvergent, so gibt es nach Satz 5.18 ein n(ε) ∈ N,
so dass
m
X
ak < ε
für m ≥ n ≥ n(ε).
k=n
Ist daher n ≥ n(ε), und wählen wir m = n, so gilt insbesondere |an | < ε. Hieraus
folgt lim an = 0.
Q.E.D.
∞
P k
x divergent.
Beispielsweise ist für beliebiges x ∈ R mit |x| ≥ 1 die Reihe
k=0
Denn, ist |x| ≥ 1, so ist |xk | = |x|k ≥ 1 für alle k ∈ N, und folglich kann die Folge
(xk ) keine Nullfolge sein.
Aus Satz 5.4 gewinnen wir folgendes Kriterium.
83
P∞
ak nur nicht-negative Terme ak ≥ 0, so ist sie
n
P
konvergent genau dann, wenn die Folge der Partialsummen sn =
ak nach oben
Satz 5.20 Besitzt die Reihe
k=0
k=0
beschränkt ist. In diesem Falle gilt
∞
X
ak = sup
( n
X
k=0
k=0
)
ak : n ∈ N .
Beweis. Sind alle Terme ak ≥ 0, so ist die Folge (sn ) monoton wachsend. Falls die
Folge der sn nach oben beschränkt ist, so konvergiert sie somit nach Satz 5.4 gegen
sup{sn : n ∈ N}. Ist sie dagegen unbeschränkt, so divergiert sie nach Satz 5.3.
Q.E.D.
Beispiele.
(a) Die harmonische Reihe
∞
P
k=1
(1/k)k eine Nullfolge ist.
1
k
ist divergent, obwohl die Folge ihrer Terme
Für jedes n ≥ 1 gilt nämlich
n-Terme
z
}|
{
2n
X
1
1
1
1
1
1
1
=
+
+···+
≥
+···+
= ,
k
n+1 n+2
2n
2n
2n
2
k=n+1
und damit erfüllt die Reihe nicht das Cauchy-Kriterium in Satz 5.18.
∞
X
1
(b) Die Reihe
konvergiert.
k2
k=1
Nach Beispiel (a) gilt nämlich
daher
∞
X
k=1
1
= 1. Durch Vergleich erhalten wir
k(k + 1)
n
n−1
n−1
X
X
X
1
1
1
sn =
=1+
≤1+
≤1+1=2
2
2
k
(k
+
1)
k(k
+
1)
k=1
k=1
k=1
für alle n ≥ 1. Die Folge der Partialsummen ist also durch 2 nach oben beschränkt, und wir können Satz 5.20 anwenden. Man kann übrigens beweisen,
∞
X
π2
1
=
.
dass
2
k
6
k=1
Wir leiten aus den Rechenregeln für Grenzwerte noch folgende Rechenregeln für
unendliche Reihen ab.
84
X
X
Satz 5.21 Seien
ak und
bk zwei konvergente Reihen und λ ∈ R. Dann sind
kX
Xk
X
auch die Reihen
(ak + bk ),
(ak − bk ) und
(λak ) konvergent und es gilt:
k
k
X
k
k
(ak ± bk ) =
X
X
k
λak = λ
k
ak ±
X
ak .
X
bk ,
k
k
Beweis. Beispielsweise gilt die Identität
n
X
(ak + bk ) = (
n
X
ak ) + (
n
X
da es sich hier um endliche Summen handelt. Da
für n → ∞, konvergiert nach Satz 5.5 (i) somit
!
!
∞
∞
X
X
gegen
ak +
bk .
k=0
bk ),
k=0
k=0
k=0
n
X
ak →
k=0
n
X
k=0
∞
X
ak und
k=0
n
X
k=0
bk →
∞
X
bk
k=0
(ak + bk ) für n → ∞, und zwar
k=0
Die anderen Formeln werden ähnlich gezeigt.
Q.E.D.
Bemerkung. Für das Produkt zweier unendlicher Reihen gilt keine so einfache
Formel – dies soll später betrachtet werden.
5.4
Uneigentliche Konvergenz
Definitionen. Eine Folge (xn ) reeller Zahlen heiße bestimmt divergent gegen
+∞ ( bzw. −∞), wenn es zu jedem K ∈ R+ ein N(K) ∈ N gibt, so dass
xn > K
(bzw. xn < −K)
für alle n ≥ N(K).
Bezeichnen wir als ε-Umgebungen von ∞ und −∞ die Mengen
Uε (∞) := ]1/ε, ∞[,
Uε (−∞) := ] − ∞, −1/ε[,
(ε > 0),
so sieht man leicht ein, dass die Folge (xn ) bestimmt gegen ∞ divergiert, wenn es
zu jedem ε > 0 ein n(ε) ∈ N gibt, so dass
xn ∈ Uε (∞)
für alle n ≥ n(ε),
85
und ähnliches gilt für die bestimmte Divergenz gegen −∞ (man wähle dazu einfach
1
K = und n(ε) = N(1/ε).). Da diese Definition formal der der Konvergenz gegen
ε
einen endlichen Punkt gleicht, sagt man auch häufig: Die Folge xn ist uneigentlich
konvergent gegen ∞ (bzw. −∞), und schreibt dafür:
xn −→ ∞ (bzw. xn −→ −∞.)
Wir sagen ferner, die reelle Zahlenfolge (xn ) besitze ∞ (bzw. −∞) als uneigentlichen Häufungspunkt, wenn in jeder ε-Umgebung Uε (∞) (bzw. Uε (−∞)) unendlich viele Folgenglieder xn liegen.
Damit haben wir auf der ganzen erweiterten Zahlengeraden R = R∪{−∞, ∞} einen
Konvergenzbegriff eingeführt.
Beispiele.
(a) Die Folge xn = n, n ∈ N, ist uneigentlich konvergent gegen ∞.
(b) Die Folge xn = −2n , n ∈ N, ist uneigentlich konvergent gegen −∞.
(c) Die Folge xn = (−1)n n, n ∈ N, ist weder uneigentlich konvergent gegen ∞
noch gegen −∞, und natürlich divergiert sie. Sie besitzt jedoch ∞ und −∞
als uneigentliche Häufungspunkte.
Die Grenzwertsätze 5.2, 5.4, 5.6 und 5.8 lassen sich, unter geringfügiger Modifizierung der Beweise, auf die betrachtete Situation uneigentlicher Konvergenz übertragen. Beispielsweise lässt sich Satz 5.4 wie folgt erweitern:
Ist (xn ) eine wachsende reelle Zahlenfolge, und ist (xn ) unbeschränkt, so gilt
xn → ∞ = sup{xn : n ∈ N}.
Dies ist natürlich trivial.
Anders ist es mit den Rechenregeln, denn ±∞ ist ja keine Zahl. Diese lassen sich
in der in Satz 5.5 angegebenen Form nicht verallgemeinern.
Sei etwa an = n, bn = 1, und cn = an + bn = n + 1. Dann gilt an → ∞, bn → 1, cn →
∞. Könnte man mit ∞ so rechnen wie mit reellen Zahlen, so würde nach Satz 5.5
gelten: ∞ + 1 = ∞, also 1 = 0, ein Widerspruch.
Es gelten jedoch die folgenden Beziehungen, deren einfacher Beweis hier nicht angegeben werden soll.
(a) an → ∞ und bn ≥ C für alle n =⇒ an + bn → ∞.
(b) an → ∞ und bn ≥ C > 0 für alle genügend großen n =⇒ an bn → ∞.
(c) |xn | → ∞ ⇐⇒ lim x1n = 0.
86
(d) Ist xn > 0 für alle n, so gilt: lim xn = 0 ⇐⇒
1
xn
→ ∞.
Man definiert daher manchmal:
a±∞
+∞ + ∞
a·∞
∞·∞
1/∞
:=
:=
:=
:=
:=
±∞ für a ∈ R,
+∞, −∞ − ∞ := −∞
( sgn a)∞ für a 6= 0,
(−∞)(−∞) := ∞, ∞ · (−∞) := (−∞) · ∞ := −∞,
0,
um einen Teil der Rechenregeln in Satz 5.5 auf den Fall uneigentlicher Konvergenz
zu erweitern.
VORSICHT: Auf keinen Fall ist es möglich, z.B. 0 · ∞ oder +∞ − ∞ sinnvoll zu
definieren!
Beispielsweise gilt nämlich für die Folgen an := n1 , bn := n13 und cn := n2 : lim an =
lim bn = 0, cn → ∞, jedoch an cn → ∞, bn cn → 0. Man überlege sich analog Beispiele
die zeigen, dass sich +∞ − ∞ nicht sinnvoll definieren läßt. Die verallgemeinerte
Zahlengerade besitzt also nicht die Struktur eines Körpers, sondern sollte eher als
ein gelegentlich nützliches Hilfskonstrukt betrachtet werden.
Konvergiert für eine unendliche Reihe mit positiven Termen P
an ≥ 0 die Folge der
Partialsummen uneigentlich gegen ∞, so schreiben wir auch
ak = ∞. Beispielsweise ist
∞
P
n=1
k
1
n
= ∞.
Damit lässt sich Satz 5.20 auch folgendermaßen ausdrücken:
P
Eine unendliche Reihe
ak mit nicht-negativen Termen ak ≥ 0 ist divergent genau
k
P
ak = ∞.
dann, wenn
k
5.5
b-adische Brüche
Definitionen. Sei b eine natürliche Zahl ≥ 2. Unter einem b-adischen Bruch
versteht man eine Reihe der Gestalt
±
∞
X
an b−n .
n=−k
Dabei ist k ≥ 0, und die an sind natürliche Zahlen mit 0 ≤ an < b.
Falls die Basis b festgelegt ist, kann man den b-adischen Bruch auch einfach durch
Aneinanderreihung der Ziffern an als unendliche b-adische Zahl
±a−k a−k+1 . . . a−1 a0 , a1 a2 a3 . . .
87
angeben. Für b = 10 spricht man von Dezimalbrüchen, für b = 2 von dyadischen
Brüchen.
Satz 5.22 Jeder b-adische Bruch konvergiert gegen eine reelle Zahl, und umgekehrt
lässt sich jede reelle Zahl in einen b-adischen Bruch entwickeln.
Beweis. Um die Konvergenz b-adischer Brüche zu zeigen, genügt es, einen positiven
∞
P
b-adischen Bruch
an b−n zu betrachten. Dann ist für jedes N ≥ 0
n=−k
sN =
N
−k
X
n=−k
−n
an b
≤
also nach Satz 5.17
sN ≤ b1+k ·
N
−k
X
1−n
b
1+k
=b
N
X
b−j ,
j=0
n=−k
1
bk+2
=
.
1 − 1/b
b−1
Die Konvergenz folgt daher aus Satz 5.20.
Wir wollen nun umgekehrt eine gegebene reelle Zahl x in einen b-adischen Bruch
entwickeln. Es genügt dies für x ≥ 0 zu tun. Da bn → ∞, gibt es mindestens eine
natürliche Zahl m mit x < bm+1 . Sei k eine solche , d.h.
(5.3)
0 ≤ x < bk+1 .
Wir definieren nun rekursiv eine Folge (aj )j≥−k−1 von natürlichen Zahlen aj mit
0 ≤ aj ≤ b − 1, so dass für
n
X
aj b−j
xn :=
j=−k−1
stets gilt:
(5.4)
xn ≤ x < xn + b−n ,
n ≥ −k − 1.
Dazu wählen wir für n = −k − 1 einfach a−k−1 := 0. Offensichtlich gilt dann (5.4)
aufgrund von (5.3).
Sind nun bereits a−k−1 , . . . , an rekursiv definiert, und gilt (5.4) für n, so unterteilen
wir das Intervall [xn , xn + b−n [ in die b disjunkten Teilintervalle
Ip := [xn + pb−n−1 , xn + (p + 1)b−n−1 [,
p = 0, 1, . . . , b − 1.
Es gibt genau ein p mit x ∈ Ip . Wählen wir für an+1 dieses p, so gilt offenbar
xn + an+1 b−n−1 ≤ x < xn + an+1 b−n−1 + b−n−1 ,
d.h. xn+1 ≤ x < xn+1 + b−n−1 , und somit gilt (5.4) auch für n + 1 anstelle von n.
88
Nach (5.4) gilt nun |x − xn | < b−n für alle n ≥ −k, und damit lim xn = x. Also ist
∞
X
aj b−j .
x=
Q.E.D.
j=−k
Da jede der Partialsummen
NP
−k
aj b−j eine rationale Zahl ist, erhalten wir sofort
j=−k
Korollar 5.23 Die rationalen Zahlen liegen dicht“ in R, d.h. zu jedem x ∈ R gibt
”
es (mindestens) eine Folge rationaler Zahlen (xn )n ∈ QN mit x = lim xn .
89
Kapitel 6
Abzählbare und überabzählbare
Mengen
Definitionen. Sei X eine nichtleere Menge. X heiße abzählbar, wenn es eine surjektive Abbildung ϕ : N → X gibt, d.h. wenn eine Folge (xk )k∈N existiert mit
X = {xk : k ∈ N} (eine solche Folge nennen wir dann auch eine Abzählung von
X); andernfalls heiße X überabzählbar.
Beispiele. (a) Jede endliche Menge M = {a0 , . . . , an } ist abzählbar. Man wähle
xk := ak für k = 0, . . . , n, xk = an für k > n. Dann ist M = {xk , k ∈ N}.
(b) Die Menge Z aller ganzen Zahlen ist abzählbar, denn Z ist Bildmenge der Folge
(x0 , x1 , x2 , . . . ) := (0, +1, −1, +2, −2, . . . )
(d.h. x0 = 0, und x2k−1 := k, x2k := −k für k ≥ 1).
Satz 6.1 Die Vereinigung abzählbar vieler abzählbarer Mengen Xn , n ∈ N, ist wieder abzählbar.
Beweis. Sei Xn =S{xnm : m ∈ N}. Wir schreiben die Elemente der Vereinigungsmenge X :=
Xn in einem quadratischen unendlichen Schema an.
n∈N
X0 :
x00
X1 :
x10
↓
x20
X2 :
X3 :
X4 :
..
.
x30
↓
x40
..
.
→ x01
x02 → x03
...
ւ
ր
ւ
ր
x11
x12
x13
...
ր
ւ
ր
x21
x22
x23
...
ւ
ր
x31
x32
x33
...
ր
...
90
Die durch die Pfeile angedeutete Abzählvorschrift liefert eine Folge
(y0 , y1 , y2 , . . . ) := (x00 , x01 , x10 , x20 , x11 , x02 , x03 , . . . ),
deren Bildmenge gleich der Vereinigungsmenge X ist.
Q.E.D.
Korollar 6.2 Die Menge Q der rationalen Zahlen ist abzählbar.
Beweis. Für jede natürliche Zahl n ≥ 1 sind die Mengen
k
An :=
: k∈Z
n
S
abzählbar. Nach Satz 6.1 ist somit Q =
An abzählbar.
n≥1
Q.E.D.
Satz 6.3 Die Menge R aller reellen Zahlen ist überabzählbar.
Beweis. Wir verwenden das sogenannte Cantorsche Diagonalverfahren. Es
genügt zu zeigen, dass das Intervall [0, 1[ nicht abzählbar ist. Nach dem Beweis
von Satz 5.22 besitzt jede Zahl x ∈ [0, 1[ eine Dezimalbruchentwicklung der Form
∞
P
x=
an 10−n mit 0 ≤ an ≤ 9. Wir schreiben dafür auch x = 0, a1 a2 a3 . . . . Ferner
n=1
liefert das im Beweis dieses Satzes angegebene Verfahren nur Entwicklungen, bei denen die Folge der an nicht von einem gewissen Index n0 an konstant 9 ist (wieso?).
Wir wollen daher nur derartige Dezimalbrüche betrachten.
Man zeigt dann relativ leicht, dass zwei verschiedene Folgen (an )n≥1 und (bn )n≥1 mit
∞
∞
P
P
dieser Eigenschaft verschiedene reelle Zahlen
an 10−n und
bn 10−n bestimmen
n=1
n=1
(Übung).
Angenommen, [0, 1[ wäre abzählbar. Dann gäbe es also eine Folge (xk )k≥1 reeller
Zahlen, so dass [0, 1[= {xk : k ≥ 1}. Die Dezimalbruchentwicklungen der xk seien
x1 = 0, a11 a12 a13 . . . ,
x2 = 0, a21 a22 a23 . . . ,
x3 = 0, a31 a32 a33 . . . ,
..
.
Wir definieren eine Zahl y ∈ [0, 1[ durch deren Dezimalbruchentwicklung
y = 0, b1 b2 b3 . . . ,
91
welche gegeben sei durch
bn :=
(
5,
4,
falls ann =
6 5,
falls ann = 5.
Insbesondere gilt bn 6= ann für alle n ≥ 1. Die Dezimalbruchentwicklung von y kann
offenbar nicht ab einem gewissen Index n0 an nur Neunen aufweisen (da nur die
Ziffern 4 und 5 auftreten). Es muss jedoch laut Annahme ein Index m existieren mit
xm = y, d.h. insbesondere mit amm = bm , womit ein Widerspruch hergeleitet ist.
Q.E.D.
Korollar 6.4 Die Menge R \ Q der irrationalen Zahlen ist überabzählbar.
Beweis. Wäre R \ Q abzählbar, so träfe dies nach Korollar 6.2 und Satz 6.1 auch
auf R = (R \ Q) ∪ Q zu.
Q.E.D.
92
Kapitel 7
Die komplexen Zahlen
Der Übergang von den natürlichen zu den ganzen und rationalen Zahlen war motiviert durch den Wunsch, beliebige lineare Gleichungen ax + b = 0 mit a 6= 0 stets
lösen zu können. Dies ist natürlich auch in R für a, b ∈ R möglich. Wie sieht dies
nun für quadratische Gleichungen der Form ax2 + bx + c = 0 aus?
Schon die Gleichung
(7.1)
x2 + 1 = 0 bzw. x2 = −1
besitzt in R keine Lösung mehr, da x2 ≥ 0 für jedes x ∈ R.
Wir stellen uns jetzt vor, dass K ein Erweiterungskörper von R sei, in dem die
Gleichung (7.1) lösbar ist. Es gibt also ein Element i ∈ K mit i2 = −1. Offenbar ist
dann i 6∈ R. Aufgrund der Körperaxiome enthält K wenigstens alle Zahlen der Form
(7.2)
x, y ∈ R.
z := x + iy,
Offenbar ist K ein Vektorraum über R. Ferner sind die Elemente 1 und i linear
unabhängig über R, denn ist
x′ + y ′i = 0,
x′ , y ′ ∈ R,
so ist entweder y ′ = 0 oder i = −x′ /y ′ ∈ R, was nicht der Fall ist. Aus y ′ = 0 folgt
aber offenbar dann auch x′ = 0.
Die lineare Algebra lehrt, dass daher der Realteil x =: Re z und der Imaginärteil
y =: Im z von z in (7.2) durch z eindeutig bestimmt sind.
Es sei jetzt
C := {x + iy ∈ K : x, y ∈ R}.
C ist abgeschlossen bzgl. der Addition und der Multiplikation:
Sind z := x + iy, z ′ := x′ + iy ′ ∈ C, so ist
(7.3)
z + z ′ = x + x′ + i(y + y ′) ∈ C,
z · z ′ = xx′ + xiy ′ + iyx′ + i2 yy ′,
93
also wegen i2 = −1:
(7.4)
z · z ′ = xx′ − yy ′ + i(xy ′ + yx′ ).
Ferner besitzt z das additive Inverse −z = −x + i(−y), und das multiplikative
1
1
x − iy
x − iy
Inverse =
=
= 2
, d.h.
z
x + iy
(x + iy)(x − iy)
x + y2
(7.5)
x
−y
1
= 2
+i 2
, falls z 6= 0.
2
z
x +y
x + y2
Offenkundig bildet C daher selbst schon einen Erweiterungskörper von R.
Unsere Überlegungen zeigen: Falls es überhaupt einen Erweiterungskörper von R
gibt, in dem die Gleichung (7.1) lösbar ist, so gibt es einen kleinsten solchen Körper,
und dieser ist (“bis auf Isomorphie”) wohlbestimmt: Die Operationen in dieser minimalen Erweiterung sind durch die Formeln (7.3) und (7.4) festgelegt. Der so charakterisierte Körper heißt Körper der komplexen Zahlen und wird mit C bezeichnet.
Um die Existenz von C wirklich nachzuweisen, geben wir eine explizite Konstruktion
an.
Wir wissen ja bereits, dass C einen 2-dimensionalen Vektorraum über R bilden sollte,
und dass in Koordinaten (x, y) ∈ R2 bzgl. der Basis 1, i gelten sollte:
(7.6)
(x, y) + (x′ , y ′ ) = (x + x′ , y + y ′ ),
(x, y) · (x′ , y ′ ) = (xx′ − yy ′, xy ′ + yx′).
Wir definieren nun einfach C, indem wir auf der Menge R2 eine Addition und eine
Multiplikation durch die Formeln (7.6) einführen. Man rechnet leicht nach, dass R2 ,
versehen mit diesen Operationen, tatsächlich einen Körper bildet. Ferner lässt sich
R durch die Einbettung x 7→ x· (1, 0) = (x, 0) als Unterkörper von C auffassen, denn
offenbar gilt:
(x, 0) + (x′ , 0) = (x + x′ , 0),
(x, 0) · (x′ , 0) = (xx′ , 0).
Schließlich ist (0, 1)2 = (0, 1) · (0, 1) = (0 · 0 − 1 · 1, 0 · 1 + 1 · 0) = (−1, 0), d.h. die
imaginäre Einheit i := (0, 1) löst die Gleichung i2 = −1. Komplexe Zahlen der
Gestalt iy mit y ∈ R heißen rein imaginär.
Bemerkung. Der Körper C läßt sich nicht anordnen.
Andernfalls würde nämlich nach Lemma 4.1 c) gelten i2 ≥ 0, sowie 1 ≥ 0, also
−1 ≥ 0 und 1 ≥ 0. Damit folgte 1 = 0, was den Körperaxiomen widerspräche.
94
7.1
Elementare Eigenschaften von C
Man veranschaulicht sich die komplexen Zahlen als Punkte einer Ebene, der sogenannten Gaußschen Zahlenebene.
y
i
z = x + iy
|z |
x
1
−y
z
Die Addition in C entspricht nach (7.6) dann gerade der Vektoraddition.
C besitzt eine ausgezeichnete Selbstabbildung, die (komplexe) Konjugation:
z = x + iy 7→ x − iy =: z.
Man nennt z die zu z konjugiert komplexe Zahl. z und z liegen spiegelbildlich
zur reellen Achse. Die folgenden Regeln sind leicht nachzurechnen:
z−z
z+z
, Im z =
,
2
2i
(b) z ∈ R ⇐⇒ z = z,
(c) z = z,
(d) z1 + z2 = z 1 + z 2 , (e) z1 · z2 = z 1 · z 2 .
(a) Re z =
(7.7)
(7.8)
Diese Identitäten zeigen insbesondere, dass die Konjugation eine bijektive Selbstabbildung ist, die die algebraische Struktur reproduziert, d.h. ein sogenannter Automorphismus.
Sei z = x + iy ∈ C. Dann ist
zz = (x + iy)(x − iy) = x2 + y 2 ≥ 0.
Somit existiert
|z| :=
√
zz =
p
x2 + y 2 ≥ 0,
und man nennt |z| den (absoluten) Betrag von z. Geometrisch interpretiert ist |z|
der Euklidische Abstand des Punktes z vom Ursprung. Offenbar ist |z| = |z|.
Satz 7.1 Für alle z, z1 , z2 ∈ C gilt:
95
(i) |z| ≥ 0;
|z| = 0 ⇔ z = 0,
(ii) |z1 + z2 | ≤ |z1 | + |z2 |,
(Dreiecksungleichung),
(iii) |z1 z2 | = |z1 | |z2 |,
(iv) |Re z| ≤ |z|,
|Im z| ≤ |z|.
Beweis: (i) und (iv) sind trivial.
(iii) Wir haben
|z1 z2 |2 = (z1 z2 ) · (z1 z2 ) = z1 z2 z 1 z 2 = z1 z 1 z2 z 2 = |z1 |2 |z2 |2 .
Die Behauptung folgt, indem man die Wurzel zieht.
(ii) Da nach (iv) stets Re z ≤ |z| gilt, so ist
|z1 + z2 |2 =
=
≤
=
(z1 + z2 )(z 1 + z 2 ) = z1 z 1 + z1 z 2 + z2 z 1 + z2 z 2
|z1 |2 + 2 Re (z1 z 2 ) + |z2 |2
|z1 |2 + 2|z1 | |z2 | + |z2 |2
(|z1 | + |z2 |)2 ,
also |z1 + z2 | ≤ |z1 | + |z2 |.
Q.E.D.
Natürlich stimmt für x = x + i · 0 ∈ R der “komplexe” Betrag
auf R definierten Betrag überein.
7.2
√
x2 mit dem bereits
Konvergenz in C
Der Betrag in C besitzt nach Satz 7.1 ganz analoge Eigenschaften wie der in R. Wir definieren daher analog zu R als
ε-Umgebung eines Punktes z ∈ C die Menge
Uε (z) := {w ∈ C : |w − z| < ε}.
ǫ
z
Entsprechend heißt eine Folge (zn )n∈N komplexer Zahlen konvergent gegen eine komplexe Zahl c, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt, so
dass für alle n ≥ n(ε) die Folgenglieder zn in Uε (c) liegen, d.h. wenn
|zn − c| < ε für alle n ≥ n(ε).
Eine Teilmenge A ⊂ C heißt beschränkt, wenn es ein reelles R ≥ 0 gibt, so dass
|z| ≤ R für alle z ∈ A. Dann gelten in C die Sätze 5.2 und 5.3 genau wie in R,
96
bei identischen Beweisen, d.h. jede konvergente Folge (zn ) in C ist beschränkt und
besitzt einen eindeutigen Grenzwert lim zn . Offenbar gilt zn → c genau dann, wenn
n→∞
|zn − c| → 0.
Satz 7.2 Sei (zn )n eine Folge komplexer Zahlen. Die Folge konvergiert genau dann,
wenn die beiden reellen Folgen (Re zn )n und (Im zn )n konvergieren. Im Falle der
Konvergenz gilt
lim zn = lim (Re zn ) + i lim (Im zn ) .
n→∞
n→∞
n→∞
Beweis. Sei zn = xn + iyn , xn , yn ∈ R.
a) Die Folge (zn ) konvergiere gegen c = a + ib, a, b ∈ R. Da
|xn − a| = |Re (zn − c)| ≤ |zn − c|
und
|yn − b| = |Im (zn − c)| ≤ |zn − c|,
so folgt dann auch lim |xn − a| = lim |yn − b| = 0, d.h. xn → a und yn → b.
b) Die beiden Folgen (xn ) und (yn ) seien konvergent gegen a bzw b, d.h. |xn −a| →
0 und |yn − b| → 0. Es sei c := a + ib. Wegen
|zn − c| = |(xn − a) + i(yn − b)| ≤ |xn − a| + |i| |yn − b| = |xn − a| + |yn − b|
folgt dann auch |zn − c| → 0, d.h. zn konvergiert gegen c.
Q.E.D.
Definieren wir die Begriffe Cauchy-Folge“, Häufungspunkt“ und unendliche
”
”
”
Reihe“ in C genauso wie in R, so behalten sämtliche Sätze über Zahlenfolgen,
Häufungspunkte und Reihen, welche wir zuvor bewiesen haben und welche nur vom
Begriff des Betrages bzw. der ε-Umgebung Gebrauch machen, nicht jedoch von der
Ordnung in R, ihre Gültigkeit.
Dies sind explizit die Sätze 5.2, 5.3, 5.5, 5.11, 5.12, 5.13, 5.17, 5.18, Korollar 5.19
und Satz 5.21, in deren Formulierung nötigenfalls “R” durch “C” zu ersetzen sind –
die angegebenen Beweise bleiben wortwörtlich auch im komplexen Fall gültig. Auch
Theorem 5.14 bleibt wahr:
Theorem 7.3 (Bolzano-Weierstraß für C) Jede beschränkte Folge (zn ) komplexer Zahlen besitzt eine konvergente Teilfolge.
Beweis. Sei (zn )n eine komplexe Zahlenfolge, und sei |zn | ≤ R für alle n ∈ N. Ist
zn = xn + iyn , xn , yn ∈ R, so folgt insbesondere:
|xn | ≤ R und |yn | ≤ R für alle n ∈ N.
97
Nach Theorem 5.14 besitzt die reelle Folge (xn )n daher eine konvergente Teilfolge
(xnk )k . Es sei a = lim xnk . Wenden wir nun erneut Theorem 5.14 auf die beschränkte
k→∞
Folge (ynk )k an, so besitzt diese eine konvergente Teilfolge (ynkℓ )ℓ . Es sei b = lim ynkℓ .
ℓ→∞
Dann ist auch a = lim xnkℓ , und damit ist nach Satz 7.2 die Teilfolge (znkℓ )ℓ der
ℓ→∞
Folge (zn )n konvergent, und zwar gegen a + ib.
Q.E.D.
Schließlich bleibt ebenso Theorem 5.16 gültig in C :
Theorem 7.4 Eine Folge komplexer Zahlen (zn ) ist konvergent dann und nur dann,
wenn sie eine Cauchy-Folge ist. Somit ist auch der Körper C vollständig.
Beweis. Dies lässt sich entweder durch wortwörtliche Übernahme des Beweises von
Theorem 5.16 beweisen, indem auf Theorem 7.3 zurückgegriffen wird, oder leicht
mittels Satz 7.2 direkt auf Theorem 5.16 zurückführen, indem Real- und Imaginärteil
der Folgenglieder betrachtet werden.
Q.E.D.
Insbesondere gelten alle Rechenregeln, wie wir sie für reelle Folgen und Reihen aufgestellt haben, auch für komplexe Folgen und Reihen.
7.3
Algebraische Abgeschlossenheit von C
Mit der Gleichung z 2 + 1 = 0 kann man in C auch jede beliebige quadratische
Gleichung az 2 + bz + c = 0, a, b, c ∈ C, a 6= 0, lösen.
√ Wir werden nämlich sehen,
dass jede komplexe Zahl z mindestens eine
Wurzel
z ∈ C besitzt. Dann sind für
√
2
−b ± b − 4ac
Lösungen von az 2 + bz + c, wie
a 6= 0 die komplexen Zahlen z± :=
2a
man leicht nachrechnet.
Wie sieht es mit algebraischen Gleichungen höheren Grades aus? Der folgende Satz,
welcher hier nicht bewiesen werden soll, lehrt, dass auch diese stets Lösungen in
C besitzen, so dass keine neuerlichen Körpererweiterungen von C mehr erforderlich
sind, um algebraische Gleichungen lösen zu können.
Fundamentalsatz der Algebra. Seien a0 , a1 , . . . , an ∈ C. Sind nicht alle Koeffizienten a1 , . . . , an gleich Null, so besitzt die Gleichung an z n +an−1 z n−1 +· · ·+a1 z+a0 =
0 stets (mindestens) eine Lösung z ∈ C.
Die Galois-Theorie lehrt allerdings, dass sich solche Lösungen für Polynome vom
Grade 5 und höher nicht mehr durch explizite Formeln“ mit Hilfe von Wurzelaus”
”
drücken” wie im quadratischen Fall angeben lassen (N. H. Abel (1802-1829) hatte
dies bereits vor E. Galois (1811-1832) für Gleichungen 5. Grades gezeigt, was Galois
allerdings wohl nicht bekannt war).
98
Für Polynome vom Grad 3 gibt es noch eine Lösungsformel von G. Cardano
(um 1545). Eine kubische Gleichung lässt sich nämlich leicht in folgende Normalform
bringen
(7.9)
x3 + px + q = 0,
und für diese lassen sich die Lösungen wie folgt darstellen:
s
s
r
r
p
p 3
q
q
q 2
q
3
2
3
3
(7.10)
x= − +
+
+ − −
+
.
2
3
2
2
3
2
Selbst wenn p und q reell sind und sämtliche Lösungen x1 , x2 , x3 der Gleichung (7.9)
reell sind, treten in der Formel (7.10) oftmals Wurzeln komplexer Zahlen auf. Ein
Beispiel ist die Gleichung x3 − 3x + 1 = 0.
Eine einfache Kurvendiskussion des Graphen von x 7→ x3 − 3x + 1 zeigt, dass diese
Gleichung genau drei reelle Nullstellen besitzt. Der Ausdruck (7.10) für diese lautet
jedoch (mit p = −3 und q = 1)
s
s
r
r
1
1
1
1
3
3
− + (−1 + + − − (−1 +
x =
2
4
2
4
s
s
√
√
1
1
3
3
3
3
− +i
+ − −i
.
=
2
2
2
2
99
Kapitel 8
Mehr zur Konvergenz von Reihen
8.1
Weitere Konvergenzkriterien für Reihen
Wir werden ab jetzt Reihen der Form
∞
P
ak betrachten, deren Terme ak reell oder
k=0
auch komplex sein dürfen.
Eine solche Reihe heiße absolut konvergent, falls die Reihe
∞
P
k=0
Beispiel. Die alternierende harmonische Reihe
sieht man, indem man die Terme wir folgt sortiert:
∞
X
(−1)k+1
k=1
k
∞
P
k=1
(−1)k+1
k
|ak | konvergiert.
ist konvergent. Dies
1
1 1
1
1
= (1 − ) + ( − ) + · · · + (
−
)+···
2
3 4
2k + 1 2k + 2
=
1
1
+···+
+··· ,
1·2
(2k + 1)(2k + 2)
und die letzte Reihe ist offenbar konvergent (vgl. Beispiel (a) in Kapitel
P 1 5.3).
Sie ist jedoch nicht absolut konvergent, da die harmonische Reihe
divergiert.
k
k=1
Satz 8.1 Eine absolut konvergente Reihe konvergiert auch im gewöhnlichen Sinn.
∞
P
ak eine absolut konvergente Reihe. Nach dem Cauchy-Kriterium
Beweis. Sei
k=0
P
(Satz 5.18) für die Reihe
|ak | gibt es zu jedem ε > 0 ein n(ε) ∈ N, so dass
k
m
X
k=n
|ak | < ε für alle m ≥ n ≥ n(ε).
Hieraus folgt mittels der Dreiecksungleichung
m
m
X
X
|ak | < ε für alle m ≥ n ≥ n(ε).
ak ≤
k=n
k=n
100
Wiederum nach Satz 5.18 ist somit die Reihe
P
k
ak konvergent.
Q.E.D.
Für die absolute Konvergenz gibt es eine Anzahl von Kriterien:
Satz 8.2 (Majorantenkriterium) Ist (ak )k≥0 eine Folge komplexer Zahlen, und
gibt es eine Folge (bk )k≥0 nicht-negativer reeller Zahlen mit |ak | ≤ bk für alle k ≥ 0,
∞
∞
P
P
so dass die Reihe
bk konvergiert, so konvergiert die Reihe
ak absolut.
k=0
k=0
Beweis. Für n ≥ 0 gilt:
n
X
k=0
|ak | ≤
n
X
bk ≤
k=0
Damit konvergiert nach Satz 5.20 die Reihe
∞
X
k=0
∞
P
k=0
bk < ∞.
|ak |.
Q.E.D.
Satz 8.3 (Quotientenkriterium)
eine Zahl Θ mit 0 ≤ Θ < 1 sowie
Existieren
ak+1 ein k0 ∈ N, so dass ak 6= 0 und ak ≤ Θ für alle k ≥ k0 gilt, so konvergiert die
∞
P
Reihe
ak absolut.
k=0
Beweis. Da ein Abändern endlich vieler Summanden das Konvergenzverhalten der
Reihe nicht ändert, können wir o.B.d.A. annehmen, dass k0 = 0 ist, d.h. dass
ak+1 ak ≤ Θ für alle k ≥ 0.
Hieraus ergibt sich mittels vollständiger Induktion:
|ak | ≤ |a0 |Θk für alle k ≥ 0.
Da die Reihe
∞
X
k=0
|a0 |Θk = |a0 |
∞
X
Θk
k=0
für 0 ≤ Θ < 1 konvergiert (geometrische Reihe), konvergiert somit die Reihe
nach dem Majorantenkriterium absolut.
P
ak
k
Q.E.D.
Beispiel. Die Reihe
P∞
n=1
n2−n ist konvergent, da
n+11
3
(n + 1)2−(n+1)
=
≤ <1
−n
n2
n 2
4
101
für n ≥ 2.
Achtung: Das Quotientenkriterium gibt eine hinreichende, jedoch keine notwendige
Bedingung für die Konvergenz einer Reihe. Beispielsweise haben wir gesehen, dass
∞
X
1
konvergiert. Es gilt jedoch
die Reihe
2
n
n=1
1/(n + 1)2
=
1/n2
n
n+1
2
→1
1/(n + 1)2
≤ Θ < 1 für alle n, und somit greift
1/n2
das Quotientenkriterium hier nicht.
ak+1 Es sei ferner ausdrücklich erwähnt, dass die Bedingung ak < 1 für alle k nicht
P
=
hinreichend für die Konvergenz der Reihe
ak ist. Beispielsweise gilt 1/(n+1)
1/n
P∞ 1
n
< 1 für alle n, die Reihe n=1 n divergiert jedoch.
n+1
für n → ∞, d.h. es gibt kein Θ mit
Ein weiteres wichtiges Konvergenzkriterium liefert der folgende
Satz 8.4 (Wurzelkriterium, schwache
Form) Existieren eine Zahl Θ mit 0 ≤
p
k
Θ < 1 sowie ein k0 ∈ N, so dass |ak | ≤ Θ für alle k ≥ k0 gilt, so konvergiert die
∞
X
ak absolut.
Reihe
k=0
p
Beweis. Aus k |ak | ≤ Θ folgt |ak | ≤ Θk für alle k ≥ k0 . Damit können wir wie im
Beweis von Satz 8.3 argumentieren.
Q.E.D.
Das Wurzelkriterium lässt sich noch verfeinern. Dazu führen wir im folgenden Abschnitt weitere fundamentale Begriffe ein, welche auch in anderen Zusammenhängen
von großer Bedeutung sind.
8.2
Limes superior und Limes inferior
Definitionen. a) Wir setzen zunächst die Ordnung auf R zu einer totalen Ordnung
≤ auf der erweiterten Zahlengeraden R = R∪{−∞, +∞} fort, indem wir definieren,
dass
−∞ ≤ a und a ≤ +∞ für alle a ∈ R.
b) Es sei (an )n∈N eine Folge reeller Zahlen. Wir setzen für n ∈ N
An := {ak : k ≥ n},
sowie
an := sup An ∈ R ∪ {+∞},
an := inf An ∈ R ∪ {−∞}.
102
Aus An+1 ⊂ An folgt dann
an ≤ an+1 ≤ an+1 ≤ an
(8.1)
für alle n. Insbesondere ist die Folge (an )n monoton steigend, und die Folge (an )n
monoton fallend. Zudem gilt
an ≤ am
(8.2)
für alle n, m,
denn ist m ≥ n, so folgt aus (8.1) per Induktion nach m sofort an ≤ am ≤ am , und
ist m < n, so folgt aus (8.1) analog an ≤ an ≤ am .
Aus (8.2) folgt nun
a := sup{an : n ∈ N} ≤ a := inf{an : n ∈ N}.
a ∈ R bezeichnet man als den Limes inferior, a ∈ R als den Limes superior der
Folge (an )n∈N , und schreibt dafür auch:
a =: lim inf an
(oder auch a =: lim an )
a =: lim sup an
(oder auch a =: lim an ).
n→∞
n→∞
bzw.
n→∞
n→∞
Es gilt dann also
a0 ≤ a1 ≤ a2 ≤ · · · ≤ an · · · ≤ a ≤ a ≤ · · · ≤ an ≤ · · · ≤ a2 ≤ a1 ≤ a0 .
Ist die Folge (an )n∈N beschränkt, und ist genauer
für alle n ∈ N,
s ≤ an ≤ S
mit s, S ∈ R, so ist offenbar s ≤ an ≤ am ≤ S für alle n, m, und somit s ≤ a ≤ a ≤ S.
Insbesondere liegen dann a und a in R. Da die Folge (an )n wachsend und die Folge
(an )n fallend ist, gilt nach Satz 5.4 ferner für jede beschränkte Folge (an )n∈N :
lim inf an =
lim an = lim (inf An ),
n→∞
(8.3)
n→∞
lim an = lim (sup An ).
lim sup an =
n→∞
n→∞
n→∞
a0
n→∞
a1
a2
a3
a4
a3
a4
3
4
a
a
a0
a1
a2
1
2
5
103
6
7
8
9
n
Es sei auch noch daran erinnert, dass wir ∞ (bzw. −∞) als uneigentlichen
Häufungspunkt der Folge (an )n bezeichnen, wenn es eine Teilfolge (ank )k gibt
mit ank → ∞ (bzw. ank → −∞).
Dies ist offenbar gleichbedeutend damit, dass die Folge (an )n nicht nach oben (bzw.
nach unten) beschränkt ist.
Unsere Definitionen des Limes Inferior und Limes superior mögen auf den ersten
Blick sehr technisch erscheinen. Die wahre Bedeutung dieser Begriffe erschließt sich
jedoch durch den folgenden Satz bzw. das nachfolgende Korollar, welches sich unmittelbar aus dem Satz ergibt.
Satz 8.5 Sei (an )n eine reelle Zahlenfolge.
(i) Dann besitzt diese einen größten (eventuell uneigentlichen) Häufungspunkt,
und zwar ist dies gerade lim sup an . Entsprechend ist lim inf an gerade der kleinn→∞
n→∞
ste (eventuell uneigentliche) Häufungspunkt.
(ii) Ist c ∈ R mit lim sup an < c, so gibt es nur endlich viele k mit ak ≥ c, und
n→∞
ist d ∈ R mit lim inf an > d, so gibt es entsprechend nur endlich viele k mit
n→∞
ak ≤ d.
Korollar 8.6 Bezeichnet H ⊂ R die Menge aller eigentlichen oder auch uneigentlichen Häufungspunkte der Folge (an )n ∈ RN , so gilt bzgl. der Ordnung auf R
lim sup an = sup H = max H,
n→∞
lim inf an
n→∞
= inf H = min H.
Beweis. Wir zeigen jeweils nur die Aussagen über den größten Häufungspunkt; die
Aussagen über den kleinsten Häufungspunkt werden analog bewiesen.
(i) Ist a = ∞, so ist die Aussage in (i) offenkundig wahr.
Sei also a ∈ R, und sei ε > 0. Dann gibt es ein n0 (ε) ∈ N, so dass für alle n ≥ n0 (ε)
gilt: an ∈ Uε (a). Insbesondere ist dann an < ∞ für genügend großes n. Damit
ist aber die Folge (an )n nach oben beschränkt. Aufgrund der Definition von an =
sup An liegen ferner auch unendlich viele Folgenglieder ak in Uε (a), d.h. a ist ein
Häufungspunkt der Folge (an )n .
Sei b dann ein beliebiger, eventuell uneigentlicher Häufungspunkt der Folge (an )n .
Wir zeigen, dass b ≤ a ist, womit dann die Behauptung folgt.
Für b = −∞ ist dies klar. Sei also b ∈ R. Dann gibt es eine Teilfolge (ank )k mit
b = lim ank .
k→∞
Da für jedes m ∈ N die Zahl sup{ank : k ≥ m} eine obere Schranke für die Menge
aller ank mit k ≥ m bildet, folgt dann mit Korollar 5.7
b ≤ sup{ank : k ≥ m} ≤ sup{an : n ≥ nm } = anm ,
104
und damit b ≤ a, da mit der Folge (an )n auch die Teilfolge (anm )m gegen a konvergiert.
(ii) Ist lim sup an < c, so gibt es ein m mit am < c, d.h. an < c für alle n ≥ m.
n→∞
Q.E.D.
Satz 8.7 Die reelle Folge (an )n∈N konvergiert dann und nur dann, wenn lim inf an =
a = lim sup an = a ∈ R ist, d.h., wenn sie genau einen, endlichen Häufungspunkt
besitzt.
Beweis. (i) Konvergiert die Folge (an )n gegen a ∈ R, so besitzt sie nach den Sätzen
5.12 und 5.13 genau einen Häufungspunkt, nämlich a, und nach Korollar 8.6 ist
dann a = a = a.
(ii) Sei a = a =: a ∈ R, und sei ε > 0. Nach Satz 8.5 (ii) gibt es nur endlich viele n
mit an ≥ a + ε, und ebenso nur endlich viele n mit an ≤ a − ε. Für alle genügend
großen n, sagen wir n ≥ n0 , gilt somit
a − ε < an < a + ε,
d.h. an ∈ Uε (a). Folglich konvergiert (an )n gegen a.
8.3
Q.E.D.
Das Wurzelkriterium
Das schwache Wurzelkriterium aus Satz 8.4 lässt sich nun wie folgt verbessern:
Satz 8.8 (Wurzelkriterium) Sei (ak )k≥0 eine Folge komplexer Zahlen, und sei
∞
p
P
s := lim sup k |ak |. Ist s < 1, so konvergiert die Reihe
ak absolut, und ist s > 1,
k→∞
k=0
so divergiert sie.
Beweis. Ist s < 1, so wähle ein Θ mit s < Θ < 1. Nach Satz 8.5 (ii) gibt es dann
∞
p
P
ak folgt nun
ein k0 mit k |ak | ≤ Θ für alle k ≥ k0 . Die Konvergenz der Reihe
k=0
mit Satz 8.4.
p
Ist dagegen s > 1, so ist für unendlich viele k offenbar k |ak | ≥ 1, d.h. |ak | ≥ 1.
Damit ist die Reihe nach Korollar 5.19 divergent.
Q.E.D.
Achtung: Ist s = 1 in Satz 8.8, so kann man weder auf Konvergenz noch auf
Divergenz der Reihe schließen; vergleiche dazu die Beispiele 8.10.
105
8.4
Potenzreihen.
Das Wurzelkriterium lässt sich besonders nutzbringend auf die wichtige Klasse der
Potenzreihen anwenden.
Definitionen. Eine Reihe der Form
∞
X
an z n ,
n=0
z ∈ C,
heißt Potenzreihe in z. Die reellen oder komplexen Zahlen an heißen die Koeffizienten der Potenzreihe. Für eine feste Koeffizientenfolge (an )n∈N hängt die
Potenzreihe nur von z ∈ C ab. Wir schreiben
(8.4)
P (z) =
∞
X
an z n ,
n=0
z ∈ C.
P
n
P (z) steht hier also für die Folge der Partialsummen ( N
n=0 an z )N . Wollen wir
andeuten, dass wir uns nur für reelle Werte von z interessieren, so schreiben wir
anstelle von z oftmals x, bzw. genauer
P (x) =
∞
X
an xn ,
n=0
x ∈ R.
Satz 8.9 (Cauchy-Hadamard) Sei S := lim sup
n→∞
p
n
|an |, und sei R := 1/S, wobei
in diesem Zusammenhang definitionsgemäß 1/∞ := 0 und 1/0 := ∞ sei. Die Potenzreihe P (z) konvergiert absolut für alle z ∈ C mit |z| < R , und sie divergiert für
alle z ∈ C mit |z| > R.
Beweis.pFür z = 0 ist die Aussage trivial. Sei also z 6= 0, und setze s :=
lim sup n |an z n |. Dann gilt offenbar s = S|z|, und somit ist |z| < R genau dann,
wenn s < 1, und |z| > R genau dann, wenn s > 1. Die Behauptung folgt damit
unmittelbar aus dem Wurzelkriterium Satz 8.8
Q.E.D.
Definition. Die Zahl R in Satz 8.9 heißt der Konvergenzradius der Potenzreihe
P (z) (dieser kann auch ∞ sein). Nach Satz 8.9 ist R charakterisiert als dasjenige
r ∈ [0, ∞] := [0, ∞[∪{∞}, für welches die Potenzreihe P (z) für |z| < r konvergent,
und für |z| > r divergent ist.
Das Konvergenzverhalten für z auf dem Kreis |z| = R hängt von den an ab, und es
kann i.a. für solche z sowohl Konvergenz als auch Divergenz vorliegen.
Konvergiert die Reihe in z, so bezeichnet man den Wert der Reihe in z meist ebenfalls
mit P (z). Dies ist formal eigentlich nicht ganz korrekt, da damit dem Symbol P (z)
zweierlei Bedeutung zukommt: zum einen bezeichnet es die formale Potenzreihe
106
(8.4), zum anderen den Wert dieser Reihe im Punkte z, d.h. eine komplexe Zahl. Aus
dem Kontext ist in der Regel jedoch ersichtlich, welche Bedeutung gerade gemeint
ist.
Beispiele 8.10 a) Die Potenzreihe
∞
X
zn
n=1
n
besitzt den Konvergenzradius R = 1.
Wie in den Übungen gezeigt, ist nämlich
√
(8.5)
lim n n = 1,
n→∞
q
q
und somit auch limn→∞ n n1 = 1, so dass insbesondere lim supn→∞ n n1 = 1.
Man kann dies leicht auch ohne die Grenzwertbeziehung (8.5) wie folgt einsehen:
n
Für |z| < 1 gilt nämlich |zn | ≤ |z|n , d.h. durch Vergleich mit der geometrischen Reihe
P
∞
n
n=1 |z| sieht man, dass die Reihe P (z) absolut konvergiert. Somit ist sicherlich
R ≥ 1. Wäre nun R > 1, so müßte die Reihe insbesondere
für z = 1 konvergieren.
P
1
Für z = 1 erhält man jedoch die harmonische Reihe ∞
,
n=1 n welche divergiert. Also
ist R = 1.
Man kann q
daraus übrigens umgekehrt mit Satz 8.9 auch wiederum (8.5) herleiten:
Die Folge
1
n
ist nämlich für genügend große n monoton wachsend (dies zeigt man
q
q
relativ leicht), so dass 1 = 1/R = lim sup n n1 = lim n n1 .
n
n→∞
n→∞
Für z = −1 erhält man bis auf das Vorzeichen die alternierende harmonische
Reihe
∞
X
(−1)n+1
.
n
n=1
Wir werden später mit Hilfe des Abelschen Konvergenzkriteriums einen weiteren
Beweis dafür geben, dass diese konvergiert.
√
P
n
zn
b) Aus (8.5) folgt lim n2 = 1, so dass auch die Reihe ∞
n=1 n2 den Konvergenzn→∞
radius 1 besitzt. Diese konvergiert für alle z mit |z| = 1 absolut.
8.5
Die Exponentialreihe
Satz 8.11 Für jedes z ∈ C ist die Exponentialreihe
exp z :=
∞
X
zn
n=0
n!
absolut konvergent. Sie besitzt also den Konvergenzradius R = ∞.
107
z n+1 z n / n! =
Beweis. Sei z 6= 0 gegeben. Dann gilt (n+1)!
|z|
n+1
≤
|z|
|z|+1
|z|
.
n+1
Für n ≥ |z| ist aber
=: Θ < 1, so dass die Behauptung aus dem Quotientenkriterium folgt.
Q.E.D.
Wir werden mit exp z ebenfalls den Wert der Exponentialreihe in z bezeichnen.
Für x ∈ R ist offenbar exp x ebenfalls in R. Die Abbildung
exp : R → R, x 7→ exp x
wird als Exponentialfunktion bezeichnet, während wir die Abbildung exp : C →
C, z 7→ exp z als die komplexe Exponentialfunktion bezeichnen wollen (das
Symbol exp“hat für uns also verschiedene Bedeutungen – streng genommen hätten
”
wir jeweils unterschiedliche Symbole verwenden müssen).
Für x = 1 erhalten wir die Eulersche Zahl
e := exp 1 =
∞
X
1
.
n!
n=0
Wir wollen (exp z1 )(exp z2 ) berechnen. Dazu beweisen wir allgemeiner folgenden
Satz über das Produkt von Reihen, welcher im Kern einen wichtigen Spezialfall des
später zu beweisenden Umordnungssatzes für Reihen darstellt:
Satz 8.12 (Cauchy-Produkt von Reihen) Es seien
lut konvergente komplexe Reihen. Für n ∈ N setzen wir
cn :=
n
X
P∞
k=0
ak und
P∞
k=0 bk
abso-
an−ℓ bℓ .
ℓ=0
Dann ist auch die Reihe
P∞
n=0 cn
absolut konvergent, und es gilt
! ∞ !
∞
∞
X
X
X
cn =
ak
bℓ .
n=0
k=0
ℓ=0
Bemerkung. Die absolute Konvergenz ist wesentlich für die Gültigkeit des Satzes.
Beweis. Für jedes N ∈ N gilt:
N
X
k=0
sowie, da cn =
P
ak
!
N
X
ℓ=0
bℓ
!
=
X
ak bℓ ,
0≤k≤N
0≤ℓ≤N
ak bℓ ist,
{(k,ℓ)∈N2 : k+ℓ=n}
N
X
n=0
cn =
X
{(k,ℓ)∈N2 :
108
k+ℓ≤N }
ak bℓ .
Folglich ist
N
X
cn −
N
X
n=0
ak
k=0
!
N
X
ℓ=0
!
bℓ X
X
|ak bℓ | =: RN .
ak bℓ ≤
=
0≤k,ℓ≤N
0≤k,ℓ≤N
k+ℓ>N
k+ℓ>N
(8.6)
Ist nun k + ℓ > N, so ist wenigstens eine der Zahlen k oder ℓ größer als N/2. Daher
ist
X
X
|ak | |bℓ |
RN ≤
|ak | |bℓ | +
0≤k≤N
N/2<ℓ≤N
N/2<k≤N
0≤ℓ≤N
(8.7)

X
= 
N/2<k≤N

X
≤ 
N/2<k≤N
P∞

|ak |
X
0≤ℓ≤N

|bℓ |
!

|ak | B + A 
X
+
0≤k≤N
X
N/2<ℓ≤N
P∞

!
|ak | 
X
N/2<ℓ≤N

|bℓ |
|bℓ | ,
wobei
wir AP
:= k=0 |ak | < ∞, B := ℓ=0 |bℓ | < ∞ gesetzt haben. Da die Reihen
P
von (8.7) nach dem
k ak und
ℓ bℓ absolut konvergieren, strebt die rechte Seite P
P
ak
ak → ∞
Cauchy-Kriterium für N → ∞ gegen 0, also auch RN . Da ferner N
k=0
PN
P∞
Pk=0
∞
sowie ℓ=0 bℓ → ℓ=0 bℓ für N → ∞, so folgt aus (8.6), dass die Reihe n=0 cn
konvergiert, und dass
! ∞ !
∞
∞
X
X
X
cn =
ak
bℓ .
(8.8)
n=0
k=0
ℓ=0
Ersetzen wir schließlich ak durch |ak | sowie bℓ durch |bℓ | in obigem Argument, so
folgt nach (8.8):
! ∞
!
∞
∞
X
X
X
c̃n =
|ak |
|bℓ | < ∞,
n=0
wobei c̃n :=
Pn
so konvergiert
ℓ=0
k=0
ℓ=0
|an−ℓ | |bℓ |. Da jedoch
|cn | ≤
P∞
n=0 cn
n
X
ℓ=0
|an−ℓ | |bℓ | = c̃n ,
nach dem Majorantenkriterium absolut.
Es seien nun z1 , z2 ∈ C gegeben. Wir setzen
ak :=
z1k
zℓ
, bℓ := 2 ,
k!
ℓ!
109
Q.E.D.
sowie
cn
n
X
z1n−ℓ z2ℓ
an−ℓ bℓ =
:=
(n − ℓ)!ℓ!
ℓ=0
ℓ=0
n
1 X n n−ℓ ℓ
z z.
=
n! ℓ=0 ℓ 1 2
n
X
Nach der binomischen Formel (3.3) ist dann
cn =
(z1 + z2 )n
,
n!
und mittels Satz 8.11 und Satz 8.12 erhalten wir unmittelbar
Satz 8.13 (Funktionalgleichung der Exponentialfunktion) Es gilt
(8.9)
(exp z1 )(exp z2 ) = exp(z1 + z2 )
für alle z1 , z2 ∈ C.
Korollar 8.14 Sei z ∈ C. Dann gilt
(i) exp z 6= 0, und (exp z)−1 = exp(−z).
(ii) exp z = exp z.
(iii) Ist x ∈ R, so ist exp x > 0.
(iv) exp m = em für jede ganze Zahl m ∈ Z.
Bemerkung. Die Formel exp m = em , m ∈ Z, verallgemeinernd wollen wir künftig
für exp z auch ez , z ∈ C, schreiben.
Beweis. (i) Nach (8.9) ist
(exp z)(exp(−z)) = exp 0 = 1,
woraus (i) folgt.
P
P
N
zn
zn
(ii) Es gilt
= N
n=0 n! für jedes N ∈ N. Ferner zeigt Satz 7.2, dass eine
n=0 n!
Folge komplexer Zahlen cn gegen c ∈ C konvergiert dann und nur dann, wenn die
Folge cn gegen c strebt. Somit folgt (ii) mittels Grenzübergang für N → ∞.
P∞ xn
(iii) Für x ≥ 0 ist sicherlich exp x =
n=0 n! ≥ 1 > 0. Für x < 0 ist nach (i)
exp x = (exp(−x))−1 , wobei exp(−x) > 0. Folglich ist ebenfalls exp x > 0.
(iv) Für m ∈ N erhält man per Induktion mit (8.9) leicht, dass exp m = em gilt.
Ist m ∈ Z \ N, so ist nach (i) exp m = (exp(−m))−1 = ((e−m )−1 = em .
Q.E.D.
110
8.6
Bedingt konvergente Reihen.
P
Bei absolut konvergenten Reihen
Konvergenz allein durch das
k ak kommt die P
“Kleinwerden” der Beträge |ak | zustande. Eine Reihe k ak , welche konvergent ist,
jedoch nicht absolut konvergent ist, heiße bedingt konvergent. Für solche Reihen
kommt die Konvergenz in erster Linie durch den Ausgleich zwischen positiven und
negativen Folgengliedern (zumindest bei reellen Reihen) zustande.
Eine große Klasse bedingt konvergenter Reihen wird durch den folgenden Satz erfaßt:
Satz 8.15 (Abelsches Konvergenzkriterium)
Sind die Partialsummen der (reP
a
beschränkt,
und
ist (pk )k∈N eine monoton falellen oder komplexen) Reihe ∞
k=0 k
P
lende Nullfolge reeller Zahlen pk ≥ 0, so ist die Reihe ∞
k=0 ak pk konvergent.
Beweis: Wir benötigen folgende Formel, welche in Analogie zur Formel der partiellen Integration auch partielle Summationsformel genannt wird:
Seien (pk )k und (sk )k beliebige Zahlenfolgen. Dann gilt für alle m ≥ n + 1:
m
X
(8.10)
k=n+1
pk (sk − sk−1 ) = (pm+1 sm − pn+1 sn ) −
m
X
(pk+1 − pk )sk .
k=n+1
Zum Beweis zerlegen wir die linke Seite von (8.10) in zwei Summen und ersetzen in
der zweiten den Summationsindex k durch k + 1. Es ergibt sich
m
X
k=n+1
pk (sk − sk−1 ) =
=
m
X
k=n+1
m
X
pk sk −
pk sk −
k=n+1
m
X
= −
m−1
X
pk+1 sk
k=n
m
X
k=n+1
pk+1sk + pm+1 sm − pn+1 sn
(pk+1 − pk )sk + pm+1 sm − pn+1 sn .
k=n+1
Um nun Satz 8.15 zu beweisen, setzen wir
sn :=
n
X
ak .
k=0
Nach Voraussetzung gibt es ein M > 0, so dass |sn | ≤ M ist für alle n ∈ N. Für
beliebige m ≥ n + 1 ≥ 0 gilt nach (8.10)
m
X
k=n+1
ak pk =
m
X
k=n+1
pk (sk − sk−1 ) = pm+1 sm − pn+1 sn −
111
m
X
(pk+1 − pk )sk ,
k=n+1
und da die Folge (pk )k fallend ist folgt hieraus weiter
m
m
X
X
(pk − pk+1 )|sk |
ak pk ≤ pm+1 |sm | + pn+1 |sn | +
k=n+1
k=n+1
!
m
X
(pk − pk+1 ) M.
≤
pm+1 + pn+1 +
k=n+1
Der teleskopische Ausdruck
wir erhalten
(8.11)
Pm
k=n+1 (pk
− pk+1 ) summiert sich zu pn+1 − pm+1 und
m
X
ak pk ≤ 2pn+1 M.
k=n+1
Zu gegebenem ε > 0 gibt es nun ein n0 ∈ N, so dass pn <
ist für m ≥ n + 1 ≥ n0 nach (8.11)
m
X
ak pk < ε,
ε
2M
für alle n ≥ n0 . Somit
k=n+1
und die betrachtete Reihe konvergiert nach dem Cauchy-Kriterium.
Fehlerabschätzung. Sei w :=
wir
P∞
k=0
Q.E.D.
ak pk der Wert der Reihe in Satz 8.15. Setzen
n
X
ak : n ∈ N},
S := sup{
k=0
so können wir M := S in (8.11) wählen, und für m → ∞ folgt
∞
X
ak pk ≤ 2pn+1S,
k=n+1
d.h.
(8.12)
|w −
n
X
k=0
ak pk | ≤ 2S pn+1 .
Beispiel. Die alternierende harmonische Reihe
Setzen wir pk := k1 , ak := (−1)k+1 , so ist wegen
(
n
n
X
X
1,
sn :=
ak =
(−1)k+1 =
0,
k=1
k=1
112
∞
X
(−1)k+1
k=1
k
.
falls n ungerade,
falls n gerade,
die Folge der Partialsummen der ak beschränkt, während die Folge (pk )k = ( k1 )k eine
fallende Nullfolge ist. Die Reihe konvergiert also nach Satz 8.15.
Allgemein weist man mittels Satz 8.15 nach, dass jede alternierende Reihe, d.h.
jede Reihe der Gestalt
∞
X
(−1)k pk
k=0
mit monoton fallender reeller Nullfolge (pk )k konvergent ist (Leibnizsches Kriterium). Für den Wert einer solchen Reihe läßt sich die Fehlerabschätzung (8.12)
noch um den Faktor 1/2 verbessern (vgl. [B, (7.17)]).
8.7
Umordnung von Reihen
P∞
Sei P
k=0 ak eine komplexe Reihe. Ist σ : N → N eine Permutation, so heißt die
Reihe ∞
k=0 aσ(k) eine Umordnung der gegebenen Reihe.
Satz
konvergenten Reihe
P∞ 8.16 (Umordnungssatz) Jede Umordnung einer absolutP
∞
k=0 ak ist absolut konvergent und besitzt denselben Wert wie
k=0 ak .
Beweis. Zu ε > 0 gibt es nach dem Cauchy-Kriterium für Reihen ein N ∈ N mit
m
X
k=N +1
|ak | < ε für alle m > N.
P
Für m → ∞ ergibt sich daraus die Abschätzung ∞
k=N +1 |ak | ≤ ε.
Es sei nun σ : N → N eine Permutation von N. Dann gibt es ein M ∈ N mit
{0, . . . , N} ⊂ {σ(0), . . . , σ(M)}.
Für n ≥ N und m ≥ M gilt somit:
|
m
X
k=0
aσ(k) −
n
X
k=0
ak | ≤
∞
X
k=N +1
|ak | ≤ ε.
Im Grenzwert für n → ∞ ergibt sich daraus
|
m
X
k=0
aσ(k) −
∞
X
k=0
ak | ≤ ε,
m ≥ M.
P
ak konDies zeigt, dass die Umordnung k=0 aσ(k) gegen den Wert der Reihe
vergiert. Ersetzen wir in diesen Betrachtungen
a
durch
|a
|,
so
finden
wir
entsprek
k
P∞
chend,
dass
die
umgeordnete
Reihe
|a
|
der
Beträge
gegen den Wert von
σ(k)
P
P k=0
|ak | konvergiert, d.h. die Reihe k aσ(k) ist absolut konvergent.
Q.E.D.
P∞
Ist eine Reihe dagen nur bedingt konvergent, so gilt der folgende
113
P∞
Satz 8.17 (Umordnungssatz von Riemann) Die reelle Reihe
k=0 ak sei bedingt konvergent, und es sei ξ ∈PR eine beliebige reelle Zahl. Dann gibt es eine
Permutation σ : N → N, so dass ∞
k=0 aσ(k) konvergiert und den Wert ξ besitzt.
Dieser erstaunliche Satz, welcher als Übung gelassen sei, zeigt, dass beim Umgang
mit bedingt konvergenten Reihen Vorsicht geboten ist – die Analogie im Verhalten
endlicher Summen und unendlicher absolut konvergenter Reihen, welche durch Satz
8.16 ausgedrückt wird, nämlich die Gültigkeit des Kommutativitätsgesetzes, bricht
bei bedingt konvergenten Reihen dramatisch zusammen. Dazu ein konkretes
Beispiel. Wir ordnen die alternierende harmonische Reihe
S =1−
1 1 1
1
1
+ − +···+
−
+ ...
2 3 4
2k − 1 2k
so um, dass auf ein positives Glied zwei negative folgen:
T =1−
1
1
1
1 1 1 1 1
− + − − +···+
−
−
+ ···+ ....
2 4 3 6 8
2k − 1 4k − 2 4k
Zum Nachweis der Konvergenz von T vergleichen wir die Partialsummenfolge
t3 , t6 , t9 , . . . dieser Reihe mit den Partialsummen sn von S. Wegen
1
1
1
1
1
1
−
−
=
−
2k − 1 4k − 2 4k
2 2k − 1 2k
ist
t3n =
n X
k=1
2n
1
1 1 X (−1)m+1
1
1
=
−
−
= s2n .
2k − 1 4k − 2 4k
2 m=1
m
2
Da s2n → S, und da die Glieder der Reihe T eine Nullfolge bilden, gibt es zu jedem
ε > 0 ein N ∈ N, so dass für n > N gleichzeitig gilt:
1
ε
|t3n − S| < ,
2
2
ε
|t3n+1 − t3n | < ,
2
ε
|t3n+2 − t3n | < .
2
Hieraus folgt |tm − 12 S| < ε für alle m > 3N + 2, d.h. die umgeordnete Reihe T
konvergiert zwar, aber nicht gegen S, sondern gegen 21 S.
Diese Beispiel zeigt deutlich, dass das Kommutativitätsgesetz für diese unendliche,
bedingt konvergente Reihe ungültig ist!
114
Kapitel 9
Stetige Funktionen
9.1
Grenzwerte von Funktionen
Im Folgenden stehen E und F jeweils für R oder C, und wir werden Funktionen f
betrachten, deren Definitionsbereich D(f ) in E und deren Werte in F liegen. Hierunter fallen insbesondere die auf einem Intervall definierten reellwertigen Funktionen.
Wir wollen zunächst das Verhalten von f (x) studieren, wenn sich x ∈ D(f ) einem
Punkt ξ ∈ E nähert. Dies macht natürlich nur Sinn, wenn es in jeder noch so kleinen
ε-Umgebung von ξ Punkte aus D(f ) gibt.
Definitionen. Sei ε > 0. Die Menge
U̇ε (ξ) := Uε (ξ) \ {ξ} = {x ∈ E : 0 < |x − ξ| < ε}
wird als punktierte ε-Umgebung von ξ ∈ E bezeichnet. (Sinngemäß ist
U̇ε (±∞) := Uε (±∞), falls E = R ist.)
ξ ∈ E heiße Häufungspunkt der Menge A ⊂ E, wenn U̇ε (ξ) ∩ A 6= ∅ für jedes
ε > 0, d.h., wenn in jeder noch so kleinen ε-Umgebung von ξ ein Punkt a ∈ A liegt
mit a 6= ξ. Ein Häufungspunkt von A braucht nicht zu A gehören.
Häufungspunkte von Mengen lassen sich auch leicht wie folgt charakterisieren
(Übung):
ξ ∈ E ist ein Häufungspunkt von A dann und nur dann, wenn es (mindestens) eine
Folge (an )n in A \ {ξ} gibt, welche gegen ξ konvergiert.
Beispiele. a) Die Häufungspunkte der Menge A :=]0, 1[⊂ R sind die Punkte des
abgeschlossenen Intervalls [0, 1].
b) Jede reelle Zahl ξ ist Häufungspunkt der Menge Q ⊂ R.
c) Ist ξ ein Häufungspunkt der Folge (an )n , so braucht ξ nicht ein Häufungspunkt
der Menge A := {an : n ∈ N} der Folgenglieder zu sein:
Man betrachte etwa die konstante Folge, an := ξ für alle n ∈ N. Hier ist U̇ε (ξ)∩A = ∅
für alle ε > 0, d.h. die Menge A besitzt keinen Häufungspunkt, während die Folge
den Häufungspunkt ξ besitzt.
115
ACHTUNG: Der Begriff des Häufungspunktes einer Menge und der des Häufungspunktes einer Folge sind zu unterscheiden! Ein Punkt ξ ist ein Häufungspunkt der
Menge A dann und nur dann, wenn es eine Folge (an )n in A\{ξ} gibt mit lim an = ξ.
Dies ist nicht gleichbedeutend damit, dass ξ ein Häufungspunkt einer Folge in A
ist, da ja an 6= ξ verlangt wird!
∞ bzw. −∞ heißen uneigentliche Häufungspunkte von A ⊂ R, wenn es eine
Folge (an )n in A gibt mit an → ∞ bzw. an → −∞ (d.h., wenn für jedes ε > 0 in
Uε (∞) bzw. Uε (−∞) wenigstens ein Element von A liegt).
Beispiele. Die Mengen N und auch ]c, ∞[ besitzen ∞ als uneigentlichen Häufungspunkt.
Ist der Punkt a ∈ A kein Häufungspunkt von A, so heißt a ein isolierter Punkt
von A. a ist also isoliert in A dann und nur dann, wenn es ein δ > 0 gibt, so dass
die δ− Umgebung Uδ (a) von a außer a keinen weiteren Punkt aus A enthält.
Definitionen. Sei f : A → W eine Funktion, wobei A ⊂ E und W ⊂ F sei. Der
Einfachheit halber nehmen wir an, dass W = F ist, d.h. W = R oder W = C, obwohl
dies für die folgenden Betrachtungen nicht notwendig ist. Sei ξ ein eigentlicher oder
uneigentlicher Häufungspunkt von A. Wir sagen, die Funktion f besitze für x → ξ
den Grenzwert η ∈ F , in Zeichen:
f (x) → η für x → ξ,
wenn es zu jedem ε > 0 ein δ = δ(ε) > 0 gibt, so dass
f (x) ∈ Uε (η) ist für alle x ∈ U̇δ (ξ) ∩ A.
(9.1)
Für einen endlichen Punkt ξ heißt dies: Zu jedem ε > 0 gibt es ein δ > 0, so dass
gilt:
|x − ξ| < δ, x ∈ A \ {ξ} =⇒ |f (x) − η| < ε.
(9.2)
U̇δ (ξ) ∩ A
1111
0000
0000
1111
0000
1111
Uǫ (η)
ξ
f
x
111
000
000
111
000
111
η
f (x)
f (A)
A
Offenbar spielt der Wert f (ξ) von f für x = ξ für die Bestimmung des Grenzwertes
von f für x → ξ keine Rolle.
116
Satz 9.1 Es sei ξ ∈ E ein Häufungspunkt von A ⊂ E. f : A → F besitzt η ∈ F als
Grenzwert für x → ξ dann und nur dann, wenn für jede Folge (xn )n in A \ {ξ} mit
xn → ξ gilt: f (xn ) → η.
Eine analoge Charakterisierung gilt für den Fall eines uneigentlichen Häufungspunktes ξ.
Beweis: Wir nehmen zunächst an, dass gilt f (x) → η für x → ξ. Sei (xn )n eine
Folge in A \ {ξ} mit xn → ξ, und sei ε > 0. Wähle dann δ > 0 so, dass f (x) ∈ Uε (η)
ist für alle x ∈ U̇δ (ξ) ∩ A. Da xn 6= ξ ist für alle n, existiert zu δ ein n0 = n0 (δ) ∈ N,
so dass gilt: xn ∈ U̇δ (ξ) für alle n ≥ n0 . Folglich ist f (xn ) ∈ Uε (η) für n ≥ n0 , und
es folgt: f (xn ) → η.
Es gelte nun umgekehrt, dass f (xn ) → η für jede Folge (xn )n in A \ {ξ} mit xn → ξ.
Sei ε > 0. Gäbe es nun kein δ > 0, so dass f (x) ∈ Uε (η) für alle x ∈ U̇δ (ξ) ∩ A,
so gäbe es insbesondere zu jedem n ≥ 1 ein yn ∈ U̇1/n (ξ) ∩ A mit f (yn ) 6∈ Uε (η).
Die Folge (yn )n würde dann gegen ξ konvergieren, die Folge (f (yn ))n dagegen nicht
gegen η, was im Gegensatz zu unserer Annahme stünde.
Somit gibt es ein δ > 0, so dass f (x) ∈ Uε (η) für alle x ∈ U̇δ (ξ) ∩ A.
Q.E.D.
Da der Grenzwert einer konvergenten Folge eindeutig bestimmt ist, gibt es nach
Satz 9.1 höchstens ein η ∈ F mit f (x) → η für x → ξ. Der Grenzwert von f (x) für
x → ξ, falls vorhanden, wird mit dem Symbol
lim f (x)
x→ξ
bezeichnet.
Beispiele. a) Sei f (x) := sgn x, x ∈ R, und seien D1 :=] − ∞, 0[, D2 :=
[0, ∞[, D3 := R. Wir setzen fj := f |Dj , j = 1, 2, 3. Dann gilt:
lim f1 (x) = −1,
x→0
lim f2 (x) = 1
x→0
(wobei f2 (0) = 0) ,
und der Grenzwert von f3 (x) für x → 0 existiert nicht. Ferner gilt:
lim f1 (x) = −1, lim f2 (x) = 1.
x→−∞
x→∞
b) lim c = c (c eine Konstante).
x→ξ
c) lim x = ξ
x→ξ
(ξ 6= ±∞).
Bemerkung. Ist f : N → F eine Folge, so stimmt die obige Definition des Grenzwertes limx→∞ f (x) mit der früher gegebenen von limn→∞ f (n) für die Folge (f (n))n∈N
überein.
117
9.2
Rechenregeln
Sind f und g reell- oder komplexwertige Funktionen, so definieren wir Funktionen
f + g, f g und f /g durch
f +g :
fg :
f /g :
x 7→ f (x) + g(x),
x 7→ f (x)g(x),
x 7→ f (x)/g(x);
der Definitionsbereich von f + g und f g ist dabei die Menge D(f ) ∩ D(g), und
der von f /g die Menge D(f ) ∩ {x ∈ D(g) : g(x) 6= 0}, welche jeweils als nichtleer
vorausgesetzt werden.
Ist f komplexwertig, so definieren wir ferner die reellwertigen Funktionen Re f und
Im f durch
(Re f )(x) := Re f (x), (Im f )(x) = Im f (x),
x ∈ D(f ).
Satz 9.2 Es seien f, g : A → F Funktionen, sowie ξ ∈ E ein Häufungspunkt von
A (eventuell ein uneigentlicher). Es gelte limx→ξ f (x) = α, limx→ξ g(x) = β. Dann
existieren auch die Grenzwerte der Funktionen f + g, f g und f /g (falls β 6= 0) für
x → ξ, und es gilt:
lim (f + g)(x) = α + β,
x→ξ
lim (f g)(x) = αβ,
x→ξ
lim (f /g)(x) =
x→ξ
α
β
(falls β 6= 0).
Ist f komplexwertig, so gilt ferner:
lim f (x) = lim Re f (x) + i lim Im f (x).
x→ξ
x→ξ
x→ξ
Beweis. Diese Regeln lassen sich unmittelbar durch Übertragung der Rechenregeln
in Satz 5.5 herleiten. Ist nämlich (xn )n eine Folge in A \ {ξ} mit xn → ξ, so konvergieren nach Satz 9.1 die Folgen (f (xn ))n und (g(xn ))n , und es ist limn→∞ f (xn ) =
α, limn→∞ g(xn ) = β. Nach Satz 5.5 ist folglich lim (f (xn ) + g(xn )) = α +
n→∞
f (xn )
n→∞ g(xn )
β, lim (f (xn )g(xn )) = αβ und lim
n→∞
folgt: lim (f + g)(x) = α + β, etc. .
= αβ , falls β 6= 0. Wieder mit Satz Satz 9.1
x→ξ
Die letzte Behauptung folgt analog aus Satz 7.2.
Q.E.D.
Weitere Regeln für das Rechnen mit Grenzwerten von Funktionen ergeben sich aus
den analogen Regeln für das Rechnen mit konvergenten Folgen in Kapitel 5 (vergleiche [B, § 89]).
118
9.3
Einseitige Grenzwerte
Definitionen. Es seien A ⊂ R und ξ ∈ R. Wir setzen
A− := {x ∈ A : x < ξ}.
A+ := {x ∈ A : x > ξ},
Ist ξ ein Häufungspunkt von A+ bzw. A− , und existiert η + := lim f |A+ (x) bzw.
x→ξ
η − := lim f |A− (x), so sagen wir, f besitze den rechtsseitigen Grenzwert η + für
x→ξ
x → ξ bzw. den linksseitigen Grenzwert η − für x → ξ, und schreiben dafür
f (x) → η + für x → ξ+,
bzw.
f (x) → η − für x → ξ−,
oder auch
f (ξ−) = lim f (x) := η − .
f (ξ+) := lim f (x) := η + ,
x→ξ+
x→ξ−
Existieren die Grenzwerte f (ξ−) und f (ξ+), und sind sie verschieden, so besitzt f
im Punkte ξ eine Sprungstelle.
Beispiel. sgn (0+) = 1, sgn (0−) = −1.
Wie für Folgen lassen sich auch für allgemeinere Funktionen uneigentliche Grenzwerte definieren. Hierzu sei z.B. auf [B, §85] verwiesen.
9.4
Stetigkeit
Definitionen. Sei f : A → F eine Funktion wie zu Beginn dieses Paragraphen, und
sei a ∈ A. f heiße stetig im Punkte a, wenn es zu jedem ε > 0 ein δ = δ(ε) > 0
gibt, so dass gilt:
(9.3)
f (x) ∈ Uε (f (a)) für alle x ∈ Uδ (a) ∩ A,
oder äquivalent:
(9.4)
x ∈ A und |x − a| < δ =⇒ |f (x) − f (a)| < ε.
f (a)
ǫ
ǫ
Uǫ (f (a))
δ δ
a
119
Uδ (a)
Ist a ein Häufungspunkt der Menge A, so ist dies offenbar äquivalent dazu, dass f
den Grenzwert f (a) besitzt für x → a.
Ist dagegen a ein isolierter Punkt von A, so ist f automatisch stetig in a
Im letzten Fall gibt es nämlich eine Umgebung Uδ0 (a) mit Uδ0 (a) ∩ A = {a}. Für
δ < δ0 ist folglich a der einzige Punkt x aus A in Uδ (a), und für diesen gilt: f (x) =
f (a) ∈ Uε (f (a)) für alle ε > 0.
Die Stetigkeit in a drückt folgende anschauliche Beziehung aus:
f (x) kommt f (a) beliebig nahe, wenn nur x genügend nahe bei a liegt“.
”
Die folgende Charakterisierung der Stetigkeit lässt sich analog wie Satz 9.1 beweisen
(oder sogar leicht daraus ableiten):
Satz 9.3 f : A → F ist stetig in a ∈ A dann und nur dann, wenn für jede Folge
(xn )n in A mit xn → a gilt: f (xn ) → f (a).
Ist f in jedem Punkt von D(f ) stetig, so heißt f stetig bzw. eine stetige Funktion.
Ist f stetig, so ist auch die Einschränkung von f auf irgendeine Teilmenge A von
D(f ) stetig.
Beispiele.
a) f : A → F heiße Lipschitz-stetig, wenn es eine Konstante C ≥ 0 gibt mit
|f (x) − f (y)| ≤ C|x − y| für alle x, y ∈ A.
Eine solche Funktion ist stetig, denn sind ε > 0, y ∈ A, so gilt für δ :=
ε/(C + 1):
x ∈ A, |x − y| < δ =⇒ |f (x) − f (y)| ≤ C|x − y| < Cδ < ε.
b) Eine konstante Funktion ist trivialerweise stetig.
c) Die identische Abbildung IdA : A → A, x 7→ x, ist Lipschitz-stetig, also stetig.
d) Die Konjugation z 7→ z in C ist wegen |z 1 − z 2 | = |z1 − z2 | (Lipschitz-) stetig.
e) Die Funktion sgn : R → R ist unstetig in 0, aber stetig in allen Punkten von
R \ {0}.
f) Die Indikatorfunktion 1Q : R → R der Menge der rationalen Zahlen (die
sogenannte Dirichletfunktion) ist nirgends, d.h. in keinem Punkt a ∈ R,
stetig.
Zu jedem a ∈ R gibt es nämlich eine Folge (xn )n in Q sowie eine Folge (yn )n
in R \ Q mit xn → a und yn → a. Dann gilt aber f (xn ) = 1 → 1 und
f (yn ) = 0 → 0 für n → ∞.
120
Ganz analog wie Satz 9.2 lässt sich mittels Satz 9.3 folgender Satz beweisen.
Satz 9.4 (i) Sind die reell- oder komplexwertigen Funktionen f und g stetig im
Punkt a, so sind auch die Funktionen |f |, f + g, f g und f /g stetig in a (im
Falle von f /g muss natürlich a in D(f /g) liegen, d.h. g(a) 6= 0 gelten).
(ii) Sind die Funktionen f und g stetig, so auch die Funktionen |f |, f + g, f g und
f /g.
Definitionen. Ein Polynom (oder genauer: eine Polynomfunktion ) auf R (bzw.
C) ist eine Funktion der Gestalt
p(x) := a0 + a1 x + · · · + an−1 xn−1 + an xn ,
wobei die reellen oder auch komplexen Koeffizienten a0 , . . . , an als gegeben betrachtet werden. Nehmen wir o.B.d.A. an, dass der Koeffizient an von Null verschieden ist, so heißt n der Grad des Polynoms.
Da alle konstanten Funktionen wie auch die Funktion IdR (bzw. IdC ) stetig sind,
leitet man aus Satz 9.4 mittels vollständiger Induktion nach dem Grad des Polynoms
leicht:
Jede Polynomfunktion ist stetig auf R bzw. C.
Mit Satz 9.4 folgt damit allgemeiner sofort:
Jede rationale Funktion, d.h. jeder Quotient p/q von Polynomfunktionen p und q
( q nicht die konstante Funktion 0), ist stetig auf ihrem Definitionsbereich.
Satz 9.5 Seien f : A → B und g : B → C zwei Funktionen, wobei A, B und C
Teilmengen von R oder C seien. Ist f stetig (bzw. stetig im Punkt a) und g stetig
(bzw. stetig im Punkt b := f (a)), so ist auch die aus f und g zusammengesetzte
Funktion g ◦ f stetig (bzw. stetig im Punkt a).
Beweis. Es genügt, die in Klammern gesetzte Aussage zu beweisen. Ist ε > 0
gegeben, so existiert wegen der Stetigkeit von g in b ein ε′ > 0 mit
(9.5)
g(y) ∈ Uε (g(b)) für alle y ∈ Uε′ (b) ∩ B.
Ferner gibt es wegen der Stetigkeit von f in a ein δ > 0 mit
(9.6)
f (x) ∈ Uε′ (f (a)) für alle x ∈ Uδ (a) ∩ A.
(9.5) und (9.6) implizieren, dass
g(f (x)) ∈ Uε (g(f (a))) für alle x ∈ Uδ (a) ∩ A.
Q.E.D.
Vorschlag: Geben Sie einen Beweis von Satz 9.5, welcher Satz 9.3 ausnutzt.
√
Beispiele. Die Funktion x → x ist stetig auf [0, ∞[ (Übung). Mit Satz 9.5 und
der vorangehenden Bemerkung folgt hieraus leicht:
121
(i) Die Funktion f (t) =
(ii) Die Funktion g(t) =
p
√
1 + 2t2 + 1 + 3t4 ist stetig auf R.
√ 1
1−t2
(iii) Die Funktion h(z) = √ 2z2
ist stetig auf ] − 1, 1[.
|z| +1
ist stetig auf C.
Bei der Betrachtung stetiger Funktionen wollen wir uns ab jetzt auf den Fall E =
F = R beschränken, d.h. wir wollen reellwertige Funktionen mit Definitionsbereich
in R betrachten.
9.5
Der Zwischenwertsatz
Theorem 9.6 Sei I ⊂ R ein Intervall, und sei f : I → R stetig. Dann ist das Bild
f (I) von I unter f ebenfalls ein Intervall.
f (b)
η
f (a)
a
ξ1
ξ2
ξ3 = ξ b
Beweis. Seien f (a) und f (b) mit a, b ∈ I zwei verschiedene Punkte in f (I), wobei
wir o.B.d.A. a < b voraussetzen wollen. Es ist zu zeigen, dass jeder Punkt η, welcher
zwischen f (a) und f (b) liegt, zu f (I) gehört. O.B.d.A. dürfen wir f (a) < f (b)
voraussetzen (andernfalls betrachte man −f anstelle von f ). Sei also f (a) < η <
f (b). Es sei
A := {x ∈ [a, b] : f (x) ≤ η}.
Da a ∈ A, ist A 6= ∅. Ferner ist A als Teilmenge des Intervalls [a, b] beschränkt, so
dass folglich ξ := sup A ∈ [a, b] existiert. Wir behaupten, dass f (ξ) = η ist.
Nach Definition des Supremums gibt es nämlich eine Folge (xn )n in A mit xn → ξ
(vergl. Satz 5.9), so dass wegen der Stetigkeit von f die Folge (f (xn ))n gegen f (ξ)
konvergiert. Da f (xn ) ≤ η ist für alle n, ist dann f (ξ) ≤ η.
122
Insbesondere ist damit ξ < b, und somit gibt es weiter eine Folge (zn )n mit ξ < zn ≤ b
und zn → ξ. Aufgrund der Definition von ξ ist η < f (zn ) für alle n, und folglich
η ≤ limn→∞ f (zn ) = f (ξ).
Damit haben wir gezeigt, dass f (ξ) ≤ η ≤ f (ξ) und somit η = f (ξ) gilt.
Q.E.D.
Korollar 9.7 (Zwischenwertsatz) Es seien I ⊂ R ein Intervall und f : I → R
stetig. Ferner sei
α := inf f (I) ∈ R ∪ {−∞},
β := sup f (I) ∈ R ∪ {∞}.
Dann nimmt f jeden Wert η ∈]α, β[ wenigstens einmal an.
Beweis. Nach Theorem 9.6 ist f (I) ein Intervall, und nach Satz 4.6 ist daher ]α, β[⊂
f (I).
Q.E.D.
Beispiel. Jedes Polynom ungeraden Grades der Form
p(x) = x2m+1 + a2m x2m + · · · + a1 x + a0
mit reellen Koeffizienten besitzt wenigstens eine reelle Nullstelle.
Für x 6= 0 ist nämlich
a0 a2m
2m+1
+ · · · + 2m+1 .
1+
p(x) = x
x
x
Hier strebt für x → ±∞ der Ausdruck in der Klammer gegen 1, so dass
p(x) → −∞ für x → −∞
p(x) → +∞ für x → +∞.
Mit den Bezeichnungen von Korollar 9.7 ist demnach α = −∞, β = +∞, also
p(R) = R.
9.6
Der Satz vom Maximum
Definitionen. Wir sagen, die Funktion f : A → R besitze im Punkt ξ ∈ A ein
globales Maximum (bzw. globales Minimum), wenn
f (x) ≤ f (ξ) ( bzw.f (ξ) ≤ f (x)) für alle x ∈ A
(dies ist äquivalent zu: f (ξ) = max f (A) bzw. f (ξ) = min f (A)).
Gibt es eine Umgebung Uε (ξ), so dass
f (x) ≤ f (ξ) ( bzw.f (ξ) ≤ f (x)) für alle x ∈ Uε (ξ) ∩ A,
so sagt man, f besitze in ξ ein lokales Maximum (bzw. lokales Minimum).
Schließlich sagen wir, dass f in ξ ein lokales (bzw. globales) Extremum besitzt,
falls f in ξ ein lokales (bzw. globales) Minimum oder Maximum hat.
123
lokales Maximum
lokales Minimum
x0
Uδ (x0 )
Ein abgeschlossenes und beschränktes Intervall, d.h. ein Intervall der Form [a, b] mit
a, b ∈ R, a ≤ b, heiße ein kompaktes Intervall.
Theorem 9.8 (Satz vom Maximum) Sind I ⊂ R ein kompaktes Intervall und
f : I → R eine stetige Funktion, so nimmt f auf I ein globales Maximum und ein
globales Minimum an.
Beweis. Es sei I = [a, b], f : I → R stetig. Wir setzen
d := sup f (I) ∈ R ∪ {∞},
c := inf f (I) ∈ R ∪ {−∞}.
d
c
a
b
Nach Definition des Supremums einer Menge gibt es eine Folge (xn )n in I mit
f (xn ) → d (im eigentlichen Sinne, falls d ∈ R, und im uneigentlichen Sinne, falls
d = +∞ ist).
Ferner gibt es nach Bolzano-Weierstraß eine konvergente Teilfolge (xnk )k der Folge
(xn )n . Durch Übergang zu dieser Folge können wir annehmen, dass unsere Folge
(xn )n bereits konvergiert. Sei ξ := lim xn . Da a ≤ xn ≤ b für alle n ∈ N ist, ist
n→∞
a ≤ ξ ≤ b, d.h. ξ ∈ I. Die Stetigkeit von f impliziert dann, dass
f (ξ) = lim f (xn )
n→∞
ist. Damit konvergiert die Folge (f (xn ))n im eigentlichen Sinne, und es ist d = f (ξ) ∈
f (I). Somit nimmt f in ξ ein globales Maximum an.
Mit einem analogen Argument weist man die Existenz eines ξ ′ ∈ I mit f (ξ ′) = c (∈
R) nach. f nimmt dann in ξ ′ ein globales Minimum an.
Q.E.D.
124
Korollar 9.9 (von Weierstraß) Das Bild eines kompakten Intervalls unter einer
stetigen reellwertigen Funktion ist ein kompaktes Intervall.
Beweis. Nach Satz 9.8 existieren d := max f (I) und c := min f (I).
Für jedes x ∈ I gilt dann: c ≤ f (x) ≤ d, d.h. f (I) ⊂ [c, d]. Da ferner c, d ∈ f (I)
sind, ist nach Theorem 9.6 [c, d] ⊂ f (I), also schließlich f (I) = [c, d].
Q.E.D.
Beispiele.
a) Die stetige Funktion f (x) = x2 auf R nimmt auf R kein globales Maximum
an: Die Menge R ist unbeschränkt.
b) Die stetige Funktion f (x) = x3 nimmt auf ]0, 1[ weder ein Maximum noch ein
Minimum an: Das Intervall ]0, 1[ ist nicht abgeschlossen.
c) Die Funktion
(
|x|, x 6= 0,
f (x) :=
1,
x = 0,
nimmt auf [−1, 1] kein Minimum an: f ist unstetig in 0.
9.7
Existenz von Umkehrfunktionen
Satz 9.10 Seien I ⊂ R ein Intervall und f : I → R eine stetige Funktion. Dann ist
f injektiv dann und nur dann, wenn f streng monoton ist.
Beweis. Nehmen wir zuerst an, dass f streng monoton ist. O.B.d.A. können wir
dann voraussetzen, dass f streng wachsend ist (sonst betrachte −f anstelle von f ).
Damit gilt für x1 , x2 ∈ I: Ist x1 < x2 , so ist f (x1 ) < f (x2 ). Folglich ist f injektiv.
Wir setzen nun umgekehrt voraus, dass f injektiv und stetig ist. Seien a < b zwei
feste Punkte aus I. Dann gilt entweder f (a) < f (b) oder f (a) > f (b).
1. Fall: f (a) < f (b). Wir zeigen zunächst:
(9.7)
f (a) < f (x) < f (b) für alle x mit a < x < b.
Falls nämlich f (x) ≤ f (a) wäre für ein x ∈]a, b[, so wäre wegen der Injektivität
von f sogar f (x) < f (a), also f (a) ∈]f (x), f (b)[, und nach dem Zwischenwertsatz
existierte ein ξ ∈]x, b[ mit f (ξ) = f (a). Dann wäre aber a < x < ξ und f (ξ) = f (a),
im Widerspruch zur Injektivität von f .
Ähnlich schließt man aus, dass f (x) ≥ f (b) gilt für ein x ∈]a, b[.
125
Wir schließen aus (9.7), dass f streng wachsend auf [a, b] ist.
Gilt nämlich a < x < y < b, so gilt nach (9.7):
f (a) < f (y),
also wieder nach (9.7) (indem man b durch y ersetzt):
f (a) < f (x) < f (y).
2. Fall: f (a) > f (b). Mit ähnlichen Argumenten wie zuvor (oder indem man f durch
−f ersetzt) zeigt man, dass hier f streng fallend auf [a, b] ist.
Zusammengefaßt sehen wir:
f ist streng monoton auf jedem Intervall [α, β] ⊂ I.
(9.8)
Ist aber f streng wachsend (bzw. fallend) auf einem festgehaltenem Teilintervall
[a, b] ⊂ I mit a < b, so ist f streng wachsend (bzw. fallend) auf ganz I.
Sind nämlich x, y ∈ I mit x < y, so sei [α, β] ein Teilintervall von I, welches a, b, x
und y enthält. Ist nun f streng wachsend (bzw. fallend) auf [a, b], so ist f nach
(9.8) streng wachsend (bzw. fallend) auf [α, β], und es gilt insbesondere f (x) < f (y)
(bzw. f (x) > f (y)).
Q.E.D.
Ist also I ein Intervall, so ist die stetige Funktion f : I → f (I) bijektiv dann
und nur dann, wenn sie streng monoton ist. Trifft dies zu, so existiert folglich die
Umkehrfunktion f −1 : f (I) → I und ist streng wachsend (streng fallend) dann und
nur dann, wenn f streng wachsend (streng fallend) ist.
Satz 9.11 Sei f : I → f (I) eine stetige injektive Funktion auf dem Intervall I.
Dann ist die Umkehrfunktion f −1 : f (I) → I ebenfalls stetig.
Beweis: Sei o.B.d.A. f streng wachsend. Wir zeigen, dass f −1 stetig ist. Ist (yn )n eine
Folge in J := f (I) mit yn → y ∈ J, so setzen wir xn := f −1 (yn ), x := f −1 (y) ∈ I.
Wir müssen zeigen, dass xn → x.
Sei dazu ξ ∈ R ∪ {−∞, ∞} ein eigentlicher oder uneigentlicher Häufungspunkt der
Folge (xn )n .
1. Fall. ξ ∈ I.
Dann gibt es eine Teilfolge (xnk )k mit ξ = lim xnk . Wegen der Stetigkeit von f folgt:
k→∞
f (ξ) = lim f (xnk ) = lim ynk = y = f (x), also ξ = x.
k→∞
k→∞
2. Fall. ξ 6∈ I.
Dann muss ξ einer der Endpunkte des Intervalls I sein, z.B. der rechte, d.h. es ist
I = [a, ξ[ oder I =]a, ξ[
126
mit a ∈ R ∪ {−∞}. Aus der Definition des Häufungspunktes leitet man dann leicht
die Existenz einer streng wachsenden Teilfolge (xnk )k her mit xnk → ξ für k → ∞.
Da x ∈ I, gibt es ein l ∈ N, so dass xnk > x für alle k ≥ l.
Für k > l folgt dann:
f (x) < f (xnl ) < f (xnk ),
d.h.
y < y nl < y nk .
lässt man hier k → ∞ streben, so folgt:
y < ynl ≤ y,
ein Widerspruch. Der 2. Fall kann also gar nicht auftreten, und wir sehen, dass die
Folge (xn )n genau einen, endlichen Häufungspunkt, nämlich x, besitzt. Nach Satz
8.7 konvergiert sie folglich gegen x.
Q.E.D.
9.8
Der Logarithmus, allgemeine Potenzen und
Wurzeln
Lemma 9.12 Die Exponentialabbildung exp : R → R+ ist stetig und bijektiv.
Beweis. Eine Funktion f ist stetig im Punkte a dann und nur dann, wenn gilt:
(9.9)
lim f (a + h) = f (a), bzw. lim (f (a + h) − f (a)) = 0
h→0
h→0
Ist nämlich x = a + h, so ist lim f (x) = lim f (a + h).
x→a
h→0
Die Funktion exp ist stetig in 0, da
∞
∞
∞
X
n
X
X
|h|n−1
1
h ≤ |h|
≤ e|h|
| exp(h) − exp(0)| = ≤ |h|
n! n!
n!
n=1
n=1
n=1
für |h| ≤ 1. Dies impliziert limh→0(exp(h) − exp(0)) = 0.
Hieraus folgt leicht die Stetigkeit von exp in einem beliebigen Punkt a ∈ R mittels
der Funktionalgleichung. Es ist nämlich
(9.10)
exp(a + h) − exp(a) = exp(a)(exp(h) − exp(0)),
also
| exp(a + h) − exp(a)| ≤ exp(a) e |h|
für |h| ≤ 1.
127
Ferner gilt für h > 0 wegen (9.10), und da exp(h)−exp(0) =
exp(a + h) − exp(a) > 0 für h > 0,
P∞
hn
n=1 n!
> 0 für h > 0:
d.h. exp ist streng wachsend. Schließlich gilt:
(9.11)
exp x → +∞
für
x → +∞,
exp x → 0
für
x → −∞.
Für x > 0 ist nämlich exp x > x, woraus die erste Behauptung folgt, und da exp x =
1
ist, so folgt die zweite aus der ersten.
exp(−x)
Der Zwischenwertsatz impliziert damit, dass exp(R) = R+ ist.
Q.E.D.
Satz 9.11 zeigt, dass exp : R → R+ eine stetige, streng wachsende Umkehrfunktion
besitzt, welche als (natürlicher) Logarithmus bezeichnet wird; in Zeichen:
exp−1 =: log : R+ → R.
Es gilt also:
log(ex ) = x ∀x ∈ R,
elog t = t ∀t ∈ R+ .
Da inf log(R+ ) = −∞, sup log(R+ ) = +∞, und da log wachsend ist, gilt außerdem:
log x → −∞
log x → ∞
für
x → 0+,
für
x → ∞.
y
y
=
ex
(9.12)
1
y=
log x
1
x
Sind u, v ∈ R+ , so gibt es eindeutige x, y ∈ R mit u = ex , v = ey , und damit ist
log(u v) = log(ex ey ) = log(ex+y ) = x + y.
128
Es gilt also die Funktionalgleichung:
(9.13)
log(uv) = log u + log v,
u, v ∈ R+ .
Für eine beliebige “Basis” a > 0 setzen wir
ax := exp(x log a),
(9.14)
x ∈ R.
ax ist die x-te Potenz von a. Beachte, dass ax für x = 1 wie zu erwarten den Wert
a annimmt. Die folgenden Rechenregeln lassen sich leicht aus den Funktionalgleichungen von exp und log herleiten:
(a)
(b)
(c)
(d)
(9.15)
log ax = x log a,
ax+y = ax ay ,
(ax )y = axy ,
ax bx = (ab)x .
Die Umkehrfunktion loga : R+ → R der Funktion x 7→ ax ist der Logarithmus zur
Basis a. Ferner gilt
(9.16)
loga (x) =
log x
,
log a
x > 0,
denn nach (9.15) (a) ist die Identität ay = x äquivalent zu y log a = log x, wobei per
definitionem y = loga x ist.
Es sei ferner angemerkt, dass sich mittels az := exp(z log a), z ∈ C, auch komplexe
Potenzen von a definieren lassen. Ferner ist die Abbildung x 7→ ax als Komposition
stetiger Funktionen stetig auf R.
Beachte: Ist k ∈ N, k ≥ 2, und wählen wir x := 1/k, so gilt für y := a1/k nach
1
(9.15) (c) y k = a(k k ) = a1 = a, d.h. y ist eine positive k-te Wurzel aus√a. Da es nach
Satz 5.10 genau eine solche positive k-te Wurzel von a gibt, nämlich k a, so gilt also
√
k
(9.17)
a = a1/k ,
a > 0, k ∈ N, k ≥ 2.
Für einen positiven Exponenten α > 0 setzen wir schließlich
(
exp(α log x), x > 0,
xα :=
0,
x = 0.
Die Potenzfunktion pα (x) := xα ist dann stetig auf der positiven Halbachse
+
R+
0 = [0, ∞[. Auf R ist pα als Komposition stetiger Funktionen sicherlich stetig,
und im Nullpunkt folgt die Stetigkeit aus
lim (pα (x) − pα (0)) = lim eα log x = lim eαy = 0.
x→0+
x→0+
129
y→−∞
9.9
Hyperbelfunktionen
Für z ∈ C definieren wir den (komplexen) hyperbolischen Cosinus und den
(komplexen) hyperbolischen Sinus von z durch
ez + e−z
,
2
ez − e−z
sinh z :=
.
2
cosh z :=
Eine reell- oder komplexwertige Funktion
f heiße gerade bzw. ungerade, falls
y=
f (−x) = −f (x)
gilt für alle x ∈ D(f ), wobei D(f ) als
symmetrisch bzgl. 0 vorausgesetzt sei.
Offenbar ist dann cosh gerade, sinh ungerade. Mittels der Funktionalgleichung der
Exponentialfunktion weist man leicht die
Identität
1
=
y
x
cosh2 z − sinh2 z = 1
(9.18)
x
hx
s
h
s in
bzw.
co
f (−x) = f (x)
y
für alle z ∈ C,
sowie die Additionstheoreme
cosh(z + w) = cosh z cosh w + sinh z sinh w,
sinh(z + w) = sinh z cosh w + cosh z sinh w,
(9.19)
nach, welche für beliebige z, w ∈ C gelten. Z.B. folgt die erste Formel aus
ez+w + e−z−w
(ez + e−z )(ew + e−w ) (ez − e−z )(ew − e−w )
=
+
.
2
2·2
2·2
Es gilt ferner
1
2
1
2
z n (−z)n
+
n!
n!
z n (−z)
−
n!
n!
n
=
=
(
zn
,
n!
0,
(
0,
zn
,
n!
n gerade,
n ungerade,
n gerade,
n ungerade,
womit die (komplexen) Hyperbelfunktionen folgende Potenzreihenentwicklungen besitzen:
130
cosh z =
(9.20)
sinh z =
∞
X
z 2m
z2 z4 z6
=1+
+
+
+ ...,
(2m)!
2!
4!
6!
m=0
∞
X
z3 z5
z 2m+1
=z+
+
+ ...,
(2m + 1)!
3!
5!
m=0
für beliebiges z ∈ C.
Als Differenz einer streng wachsenden und einer streng fallenden Funktion ist die
(reelle) Hyperbelfunktion sinh streng wachsend; ferner gilt
sinh 0 = 0,
sinh x → ±∞ für x → ±∞.
Natürlich ist sinh auch stetig, so dass die Umkehrfunktion sinh−1 =: arsinh : R → R
existiert, genannt Areasinus.
Analog überlegt man sich (vgl. [B]), dass cosh : R+
0 → [1, ∞[ eine Umkehrfunktion
cosh−1 =: arcosh : [1, ∞[→ R+
0
besitzt, genannt Areacosinus.
Schließlich ist der hyperbolische Tangens definiert durch
tanh x :=
sinh x
ex − e−x
= x
,
cosh x
e + e−x
x ∈ R.
Man überlegt sich leicht, dass
lim tanh x = ±1
x→±∞
ist, und weist später mittels der Differentialrechnung nach, dass tanh streng wachsend ist.
y
1
y=
hx
tan
x
−1
Die Umkehrfunktion tanh −1 := artanh :] − 1, 1[→ R bezeichnet man als Areatangens.
131
9.10
Trigonometrische Funktionen: 1. Teil
Wir definieren auf R die komplexwertige cis-Funktion durch
t 7→ eit .
cis : R → C,
1/2
1/2
1/2
= (eit e−it ) = (e0 ) = 1 ist für t ∈ R, bildet cis die reelle
Da |eit | = eit eit
Achse stetig ab in den Einheitskreis
S 1 := {z ∈ C : |z| = 1} ⊂ C.
Weiter definieren wir die auf ganz R stetigen Funktionen Cosinus und Sinus durch
it
e +e
,
2
eit − e−it
.
sin t := Im eit =
2i
cos t := Re eit =
eit
sin t
−it
t
cos t
S1
Dann gilt offenbar die Eulersche Formel
(9.21)
eit = cos t + i sin t,
t ∈ R.
Wegen|eit |2 = 1 folgt hieraus:
(9.22)
cos2 t + sin2 t = 1
für alle t ∈ R.
Natürlich lassen sich cos und sin mittels
cos z :=
eiz + e−iz
,
2
sin z :=
eiz − e−iz
,
2i
z ∈ C,
auch für beliebige komplexe z ∈ C definieren. Der Vergleich mit den komplexen
Hyperbelfunktionen zeigt dann sofort, dass folgender Zusammenhang mit den Hyperbelfunktionen besteht:
(9.23)
cos z = cosh(iz),
sin z =
1
sinh(iz),
i
z ∈ C.
Mittels (9.18) schließen wir hiermit, dass (9.22) dann auch für beliebiges t ∈ C
gültig bleibt. Ferner erhalten wir durch Ersetzen von z durch iz in (9.20) sofort die
folgenden Potenzreihenentwicklungen von cos z und sin z:
132
∞
X
cos z =
(−1)m
z2 z4 z6
z 2m
=1−
+
−
± ...,
(2m)!
2!
4!
6!
(−1)m
z3 z5
z 2m+1
=z−
+
∓ ...,
(2m + 1)!
3!
5!
m=0
(9.24)
∞
X
sin z =
m=0
gültig für alle z ∈ C (also insbesondere für z ∈ R).
Aus (9.23) und (9.19) erhält man schließlich die Additionstheoreme
cos(x + y) = cos x cos y − sin x sin y,
(9.25)
sin(x + y) = sin x cos y + cos x sin y.
Z.B. erhält man die erste Identität wie folgt:
cos(x + y) = cosh(ix + iy) = cosh(ix) cosh(iy) + sinh(ix) sinh(iy)
= cos x cos y + i sin x · i sin y = cos x cos y − sin x sin y.
9.11
Gleichmäßige Konvergenz
Die Exponentialfunktion wie auch die Funktionen cosh, sinh, cos, sin besitzen auf
ganz R (oder auch C) konvergente Potenzreihenentwicklungen. Ferner sind alle diese
Funktionen stetig.
∞
P
Sei nun allgemeiner
ak z k eine gegebene Potenzreihe mit Konvergenzradius R.
k=0
Dann konvergiert diese Reihe für alle z im Konvergenzkreis D := {z ∈ C : |z| <
R} und definiert folglich eine Funktion
u : D → C,
∞
X
ak z k
z 7→
k=0
(lässt man nur reelle Werte zu, so erhält man eine Funktion
P
k
v :] − R, R[→ C, x 7→ ∞
k=0 ak x ).
Für n ∈ N bezeichne
un (z) :=
n
X
ak z k
k=0
die n-te Partialsumme der gegebenen Potenzreihe. un ist ein Polynom (vom Grade
≤ n), also auf ganz C definiert und stetig. Ferner gilt:
(9.26)
lim un (z) = u(z) für jedes z ∈ D.
n→∞
133
Mit den Bezeichnungen zu Beginn dieses Paragraphen definieren wir:
Definitionen. Seien un , n ∈ N, sowie u Funktionen auf einer Teilmenge A von
E mit Werten in F . Die Folge (un )n der Funktionen un konvergiere punktweise
gegen die Funktion u, falls gilt:
lim un (x) = u(x) für alle x ∈ A.
n→∞
Angenommen, alle Funktionen un sind stetig, so wie in (9.26). Lässt sich daraus
bereits folgern, dass auch die Grenzfunktion u stetig ist?
Das folgende Beispiel lehrt, dass dies i.a. falsch ist.
Beispiel. Für n ≥ 1 sei un : R → R definiert durch


 −1, x < −1/n,
un (x) :=
nx, |x| ≤ 1/n,


1, x > 1/n.
Dann gilt offenbar lim un (x) = sgn x für jedes x ∈ R, d.h. die Folge (un )n≥1 konvern→∞
giert punktweise gegen die Signumsfunktion u = sgn . Offenbar sind alle Funktionen
un stetig, die Grenzfunktion u jedoch nicht.
Der folgende, stärkere Konvergenzbegriff dagegen führt zu einer positiven Antwort
auf die gegebene Frage.
Die Funktionenfolge (un )n∈N konvergiere gleichmäßig auf der Menge A gegen
die Funktion u, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt, so dass für alle n ≥ n(ε)
gilt:
(9.27)
|un (x) − u(x)| < ε für alle x ∈ A.
Im Vergleich dazu bedeutet die punktweise Konvergenz der Funktionenfolge (un )n∈N
gegen die Funktion u, dass es zu jedem ε > 0 und jedem x ∈ A ein eventuell von x
abhängiges n(ε, x) ∈ N gibt, so dass für alle n ≥ n(ε, x) gilt:
|un (x) − u(x)| < ε.
Offenbar impliziert die gleichmäßige Konvergenz die punktweise. Die Umkehrung
hiervon gilt jedoch nicht, wie wieder obiges Beispiel in Verbindung mit dem folgenden
Satz zeigt.
Satz 9.13 Es sei (un )n∈N eine Folge stetiger Funktionen un : A → F , welche
gleichmäßig auf A gegen die Funktion u : A → F konvergiert. Dann ist auch die
Funktion u stetig.
Beweis. Sei a ∈ A, und sei ε > 0. Nach (9.27) gibt es ein n0 = n(ε/3) ∈ N, so dass
für alle n ≥ n0 gilt:
(9.28)
|un (x) − u(x)| < ε/3
134
für alle x ∈ A.
Da ferner die Funktion un0 stetig ist im Punkte a, existiert ein δ = δ(ε/3, n0) > 0,
so dass gilt:
|un0 (x) − un0 (a)| < ε/3
(9.29)
für alle x ∈ A ∩ Uδ (a).
Aus (9.28) (für n = n0 ) und (9.29) folgt mittels der Dreiecksungleichung:
|u(x) − u(a)| = |(u(x) − un0 (x)) + (un0 (x) − un0 (a)) + (un0 (a) − u(a))|
≤ |u(x) − un0 (x)| + |un0 (x) − un0 (a)| + |un0 (a) − u(a)|
< ε/3 + ε/3 + ε/3 = ε
für alle x ∈ A ∩ Uδ (a). Damit ist u stetig im Punkte a.
Q.E.D.
Als Anwendung erhalten wir
Satz 9.14 Es bezeichne D = {z ∈ C : |z| < R} den Konvergenzkreis der Potenzrei∞
∞
P
P
he
ak z k . Dann ist die auf D durch u(z) :=
ak z k definierte Funktion stetig.
k=0
k=0
Beweis. Für n ∈ N bezeichne un das Polynom un (z) :=
n
P
ak z k . Für festes r mit
k=0
0 ≤ r < R betrachten wir die Einschränkungen v := u|Dr sowie vn := un |Dr , wobei
Dr die offene“Kreisscheibe
”
Dr := {z ∈ C : |z| < r}
bezeichne. Für z ∈ Dr gilt dann:
|v(z) − vn (z)| = |
(9.30)
gilt:
k=n+1
∞
P
k=0
k
k
k=n+1
Sei nun ε > 0. Da die Reihe
∞
P
∞
X
ak z | ≤
∞
X
k=n+1
k
|ak | |z| ≤
∞
X
k=n+1
|ak |r k .
|ak |r k konvergiert, gibt es zu ε ein n(ε) ∈ N, so dass
|ak |r < ε für alle n ≥ n(ε). Nach (9.30) folgt hieraus:
|v(z) − vn (z)| < ε
für alle z ∈ Dr , n ≥ n(ε).
Die Funktionenfolge (vn )n konvergiert also gleichmäßig auf Dr gegen v, und da alle
Funktionen vn stetig sind, so ist auch v stetig.
Wir sehen also: u|Dr ist stetig für jedes r < R. Hieraus folgt die Stetigkeit von u auf
D. Ist nämlich z ∈ D, so sei r so gewählt, dass |z| < r < R (z.B. r := (|z| + R)/2).
Konvergiert nun eine Folge (zn )n in D gegen z, so ist lim |zn | = |z| < r, so dass
n→∞
fast alle, d.h. alle bis auf höchstens endlich viele Folgenglieder bereits in Dr liegen
müssen. Da u auf Dr stetig ist, folgt dann jedoch: u(zn ) → u(z) für n → ∞. Die
Funktion u ist also stetig im Punkte z.
Q.E.D.
135
Kapitel 10
Differenzierbare Funktionen
In diesem Paragraphen werden wir ausschließlich reell- oder komplexwertige Funktionen betrachten, deren Definitionsbereich ein reelles Intervall ist. Dabei wollen wir
zudem annehmen, dass alle betrachteten Intervalle positive Länge besitzen.
Sei also f : I → R (bzw. f : I → C) eine auf dem Intervall I definierte Funktion,
und sei x0 ∈ I.
Definitionen. f heiße differenzierbar im Punkte x0 , wenn es eine Zahl A ∈ R
(bzw. A ∈ C) gibt mit
f (x) − f (x0 )
= A.
x→x0
x − x0
(10.1)
lim
Beachte, dass A dann auch gleich dem Grenzwert
f (x0 + h) − f (x0 )
=A
h→0
h
lim
(x0 )
ist. Der eindeutige Grenzwert A der Funktion x 7→ f (x)−f
im Punkte x0 heißt
x−x0
Differentialquotient oder Ableitung von f im Punkte x0 und wird mit f ′ (x0 )
df
df
(x0 ) bzw. dx
|x=x0 bezeichnet. Gelegentlich betrachtet man auch die einseitigen
oder dx
Grenzwerte
f (x) − f (x0 )
,
x→x0 +
x − x0
f ′ (x0 +) := lim
f (x) − f (x0 )
,
x→x0 −
x − x0
f ′ (x0 −) := lim
die als rechtsseitige bzw. linksseitige Ableitung von f im Punkte x0 bezeichnet
werden.
Die Menge der Punkte x ∈ I, in denen f differenzierbar ist, bildet den Definitionsbereich der Funktion
f ′ : x 7→ f ′ (x),
genannt Ableitung von f. Anstelle von f ′ werden auch die Bezeichnungen
df
d
, dx
f (x), Df u.ä. verwendet. Ist D(f ′) = I, so heißt f differenzierbar auf
dx
136
I, und ist die Ableitung f ′ sogar stetig auf I, so heißt f stetig differenzierbar auf
I.
Beispiele.
a) Die Funktion IdR : R → R, x 7→ x, besitzt die Ableitung Id′R (x) = 1; die konstante
Funktion f (x) := α besitzt die Ableitung f ′ (x) = 0:
lim
x→x0
x − x0
α−α
= 1, lim
=0
x→x
x − x0
0 x − x0
b) Für die Funktion f (x) =
1
x
1
x
−
für alle x0 ∈ R.
auf R \ {0} ist
1
x0
−1
x0 − x
−1
= lim
= 2,
x→x0 x − x0
x→x0 x x0 (x − x0 )
x→x0 x x0
x0
1
d
= − x12 ,
d.h. f ist also auf R \ {0} (stetig) differenzierbar, und es ist dx
x
f ′ (x0 ) = lim
= lim
c) Sei g(x) := |x|, x ∈ R.
Da
|x| − 0
=
x→0+ x − 0
|x| − 0
=
lim
x→0− x − 0
lim
x 6= 0.
x
= 1,
x→0+ x
−x
lim
= −1,
x→0− x
lim
existieren im Punkte 0 die einseitigen Ableitungen von g, und es ist g ′(0+) =
1, g ′ (0−) = −1. Da diese verschieden sind, existiert die Ableitung von g in 0 nicht.
Satz 10.1 (Äquivalente Charakterisierungen der Differenzierbarkeit) Sei
f eine auf dem Intervall I definierte Funktion, und sei x0 ∈ I. Die folgenden
Aussagen sind dann äquivalent.
(i) f ist differenzierbar im Punkte x0 .
(ii) Es gibt eine Zahl A, so dass gilt:
(10.2)
f (x) = f (x0 ) + A(x − x0 ) + r(x)(x − x0 ), x ∈ I,
wobei r eine Funktion auf I mit lim r(x) = 0 ist.
x→x0
(iii) Es gibt eine im Punkte x0 stetige Funktion u auf I, so dass gilt:
(10.3)
f (x) − f (x0 ) = u(x)(x − x0 )
für alle x ∈ I.
Trifft (ii) zu, so ist A = f ′ (x0 ), und trifft (iii) zu, so ist u(x0 ) = f ′ (x0 ).
137
Bemerkungen: (a) Setzt man in (10.2) ϕ(x) := r(x)(x − x0 ), so erhält man f (x) =
f (x0 ) + A(x − x0 ) + ϕ(x), und die Bedingung lim r(x) = 0 ist äquivalent zur
x→x0
ϕ(x)
x→x0 |x−x0 |
Bedingung lim
= 0. Dies wird die Charakterisierung der Differenzierbarkeit
von Funktionen mehrere Veränderlicher sein, die wir in der Analysis II betrachten
werden.
(b) Differenzierbarkeit ist eine lokale Eigenschaft, so dass es offenbar genügt, die
Eigenschaften in (ii) bzw. (iii) auf einer δ-Umgebung I ∩ Uδ (x0 ) nachzuweisen.
Beweis. (i) ⇒ (iii): Ist f differenzierbar in x0 , so setzen wir
(
f (x)−f (x0 )
, x ∈ I \ {x0 },
x−x0
u(x) :=
′
f (x0 ),
x = x0 .
Dann ist nach (10.1) u stetig in x0 , und die Identität (10.3) folgt unmittelbar aus
der Definition von u. Offenbar ist u(x0 ) = f ′ (x0 ).
(iii) ⇒ (ii): Gilt (10.3), so setzen wir r(x) := u(x) − u(x0 ). Dann ist
f (x) = f (x0 ) + u(x)(x − x0 )
= f (x0 ) + u(x0 )(x − x0 ) + r(x)(x − x0 ).
Es gilt also (10.2), mit A = u(x0 ), und wegen der Stetigkeit von u in x0 ist
lim r(x) = lim (u(x) − u(x0 )) = u(x0 ) − u(x0 ) = 0.
x→x0
x→x0
(ii) ⇒ (i): Aus (10.2) folgt:
f (x) − f (x0 )
= A + r(x), x ∈ I \ {x0 },
x − x0
und wegen lim r(x) = 0 ist
x→x0
f (x) − f (x0 )
= A.
x − x0
Somit ist f differenzierbar in x0 , und f ′ (x0 ) = A.
lim
x→x0
Q.E.D.
Geometrische Interpretationen (f reellwertig)
Sekante
∆f
∆x
x0
x1
138
Tangente
a) Sind x0 und x1 zwei verschiedene Punkte von I, so schreibt man ∆x := x1 −
x0 , ∆f = f (x1 ) − f (x0 ).
Der Differenzenquotient ∆f
ist dann gerade die Steigung der Sekante, wel∆x
che die Punkte (x0 , f (x0 )) und (x1 , f (x1 )) auf dem Graphen von f miteinander
verbindet.
∆f
x1 →x0 ∆x
Die Existenz des Grenzwertes f ′ (x0 ) = lim
lässt sich geometrisch so inter-
pretieren, dass die obige Sekante für x1 → x0 gegen eine Grenzposition strebt,
nämlich die der (nicht vertikalen) Tangente an den Graphen von f im Punkte
(x0 , f (x0 )), und die Ableitung f ′ (x0 ) ist die Steigung dieser Tangente.
b) Die Eigenschaft (ii) in Satz 10.1 lässt sich dahingehend interpretieren, dass die
Funktion f in der Nähe von x0 eine gute“ Approximation durch eine affin
”
lineare Funktion besitzt.
Setzen wir nämlich
g(x) := f (x0 ) + A(x − x0 ),
so ist g affin linear, und für die Differenz zwischen f und g gilt
f (x) − g(x) = r(x)(x − x0 );
(10.4)
wegen lim r(x) = 0 geht diese für x → x0 “schneller” gegen 0 als |x − x0 |.
x→x0
Oft benutzt man auch das Landau-Symbol o, um dies in Kurzform auszudrücken:
Sind ϕ und h Funktionen auf einer punktierten Umgebung U̇ von x0 (in R oder in
C), so schreibt man
ϕ(x) = o(h(x))
für x → x0 ,
falls
ϕ(x) = r(x)h(x) mit lim r(x) = 0.
x→x0
Ist h(x) 6= 0 auf dieser punktierten Umgebung, so ist dies gleichbedeutend mit
lim
x→x0
ϕ(x)
= 0.
h(x)
Gilt hingegen nur, dass r auf dieser punktierten Umgebung beschränkt ist, d.h. gilt
|r(x)| ≤ C für alle x ∈ U̇ , wobei C ≥ 0 eine Konstante ist, so schreibt man
ϕ(x) = O(h(x))
für x → x0 .
Offenbar ist dies gleichbedeutend mit
|ϕ(x)| ≤ C|h(x)| für alle x ∈ U̇ .
139
Damit läßt sich (10.4) kürzer schreiben als
f (x) − g(x) = o(x − x0 ) für x → x0 .
Der Graph von g ist natürlich gerade die oben beschriebene Tangente an den Graphen von f im Punkte (x0 , f (x0 )).
Als Korollar aus Satz 10.1 erhalten wir:
Korollar 10.2 Ist f im Punkte x0 differenzierbar, so ist f in x0 stetig.
Beweis. Aus (10.3) folgt unmittelbar:
lim (f (x) − f (x0 )) = 0.
x→x0
Q.E.D.
10.1
Rechenregeln für die Ableitung
Satz 10.3 Es seien f und g im Punkte x0 differenzierbare Funktionen, sowie α ∈ C.
Dann sind auch die Funktionen αf, f +g, f g und f /g (falls g(x0 ) 6= 0) differenzierbar
in x0 , und es gilt:
(i) (αf )′ (x0 ) = αf ′(x0 ),
(ii) (f + g)′(x0 ) = f ′ (x0 ) + g ′ (x0 ),
(iii) (f g)′(x0 ) = f ′ (x0 )g(x0 ) + f (x0 )g ′(x0 ),
′
f ′ (x0 )g(x0 ) − f (x0 )g ′ (x0 )
f
(iv) g (x0 ) =
.
g(x0 )2
(Produktregel)
(Quotientenregel)
Beweis. Wir benutzen die Charakterisierung (iii) in Satz 10.1. Danach existieren in
x0 stetige Funktionen u und v mit u(x0 ) = f ′ (x0 ) und v(x0 ) = g ′ (x0 ), so dass gilt:
f (x) − f (x0 ) = u(x)(x − x0 ),
g(x) − g(x0 ) = v(x)(x − x0 ).
Dann ist
(αf )(x) − (αf )(x0 ) = (αu)(x)(x − x0 ),
(f + g)(x) − (f + g)(x0 ) = (u + v)(x)(x − x0 ),
(f g)(x) − (f g)(x0 ) = f (x)(g(x) − g(x0 )) + g(x0 )(f (x) − f (x0 ))
= [f (x)v(x) + g(x0 )u(x)](x − x0 )
=: w(x)(x − x0 ),
f
f
f (x) − f (x0 )
f (x0 )
(x) − (x0 ) =
−
(g(x) − g(x0 ))
g
g
g(x)
g(x)g(x0 )
u(x)g(x0 ) − f (x0 )v(x)
(x − x0 )
=
g(x)g(x0 )
=: q(x)(x − x0 ).
140
Im letzten Fall ist zu beachten, dass wegen 0 6= g(x0 ) = lim g(x) auch g(x) 6= 0 ist,
x→x0
falls |x − x0 | genügend klein ist.
Aufgrund der Rechenregeln für im Punkte x0 stetige Funktionen sind nun aber die
Funktionen αu, u + v, w und q stetig in x0 und es gilt:
(αu)(x0 ) = αu(x0 ) = αf ′ (x0 ),
(u + v)(x0 ) = u(x0 ) + v(x0 ) = f ′ (x0 ) + g ′ (x0 ),
w(x0 ) = f (x0 )g ′(x0 ) + g(x0 )f ′ (x0 ),
f ′ (x0 )g(x0 ) − f (x0 )g ′ (x0 )
q(x0 ) =
,
g(x0 )2
womit die behaupteten Regeln folgen.
Q.E.D.
Satz 10.4 (Ableitung zusammengesetzter Funktionen) Es sei f : I → R differenzierbar im Punkte x0 ∈ I, sowie g : J → R (bzw. C) differenzierbar im Punkte
f (x0 ), wobei J ein Intervall sei, welches f (I) enthalte. Dann ist die Funktion g ◦ f
differenzierbar in x0 , und es gilt die Kettenregel:
(g ◦ f )′ (x0 ) = g ′ (f (x0 ))f ′ (x0 ).
Beweis. Mit denselben Bezeichnungen wie im Beweis von Satz 10.3 ist
g ◦ f (x) − g ◦ f (x0 ) =
=
=
=:
g(f (x)) − g(f (x0 ))
v(f (x))(f (x) − f (x0 ))
(v ◦ f (x))u(x)(x − x0 )
w(x)(x − x0 ),
wobei u stetig in x0 mit u(x0 ) = f ′ (x0 ) ist, sowie v stetig in f (x0 ) mit v(f (x0 )) =
g ′ (f (x0 )) ist. Damit ist offenbar w stetig in x0 , und es gilt:
w(x0 ) = v(f (x0 ))u(x0 ) = g ′ (f (x0 ))f ′ (x0 ).
Q.E.D.
Für Umkehrfunktionen erhält man folgende Regel:
Satz 10.5 (Ableitung der Umkehrfunktion) Es seien I und J zwei Intervalle,
und f : I → J eine stetige, bijektive Funktion. Ist f differenzierbar im Punkte
x0 ∈ I, und ist f ′ (x0 ) 6= 0, so ist die Umkehrfunktion f −1 : J → I differenzierbar
im Punkte y0 := f (x0 ), und es gilt:
(f −1 )′ (y0 ) =
1
f ′ (x0 )
141
=
1
f ′ (f −1 (y
0 ))
.
Beispiel: Die Funktion f : R → R, x 7→ x3 , ist stetig und streng wachsend, und
√
besitzt somit eine stetige Umkehrfunktion 3 : R → R, welche definiert ist durch
√
3
x :=
(
1
x 3 , falls x ≥ 0,
1
−|x| 3 , falls x < 0.
f ist differenzierbar auf ganz R, √
und es ist f ′ (x) 6= 0 genau dann, wenn x 6= 0. Nach
Satz 10.5 ist die Funktion x 7→ 3 x daher auf R \ {0} differenzierbar. In 0 gilt dies
offenbar jedoch nicht.
Beweis. Da f stetig ist und im Punkte x0 differenzierbar, gibt es eine auf ganz I
stetige Funktion u mit u(x0 ) = f ′ (x0 ) 6= 0, so dass
f (x) − f (x0 ) = u(x)(x − x0 ).
Ferner gibt es ein δ > 0 so, dass auch für alle x mit 0 < |x − x0 | < δ stets u(x) 6= 0
ist, und somit
1
x − x0 =
(f (x) − f (x0 )).
u(x)
Setzen wir y = f (x), also x = f −1 (y), so bedeutet dies:
f −1 (y) − f −1 (y0 ) =
1
(y − y0 ) =: w(y)(y − y0 ).
u ◦ f −1 (y)
Aufgrund der Rechenregeln für stetige Funktionen ist die Funktion y 7→ w(y) =
1
1
.
stetig im Punkte y0 , und es ist w(y0 ) = u(x1 0 ) = f ′ (x
−1
0)
u(f (y))
Q.E.D.
10.1.1
Einige Beispiele.
(a)
d k
x
dx
= kxk−1 ,
(b)
d x
e
dx
= ex
(c)
d
dx
(d)
d α
x
dx
(e)
d
dx
sinh x = cosh x,
(f)
d
dx
tanh x =
(g)
d
arsinh
dx
log |x| =
1
x
(k ∈ Z)
(x 6= 0)
= αxα−1
(α ∈ R, x > 0)
d
dx
cosh x = sinh x
1
.
cosh2 x
x= √
1
x2
+1
,
d
arcosh x
dx
=√
142
1
x2
−1
(h)
(i)
d ix
e
dx
d
dx
= ieix
sin x = cos x,
d
dx
cos x = − sin x
Diese Regeln lassen sich leicht folgendermaßen beweisen:
(a) wurde für k = 0 bereits bewiesen. Nach der Produktregel gilt weiter (per
Induktion)
d
d k
d k
d k+1
(x ) =
(x · x) =
x · x + xk · x
dx
dx
dx
dx
k−1
k
k
= kx
· x + x · 1 = (k + 1)x .
Für k < 0 folgt damit mittels der Quotientenregel:
d 1
−|k|x|k|−1
d k
x =
=
= kxk−1 .
dx
dx x|k|
x2|k|
(b) Setzen wir h := x − x0 , so ist
x
x0
e −e
x0
h
x0
= e (e − 1) = e
=
x0
e
∞
X
k=0
hk
(k + 1)!
∞
X
hk
k=1
!
k!
(x − x0 ).
P
hk
Die Potenzreihe ∞
k=0 (k+1)! konvergiert offenbar für alle h ∈ C und definiert
nach Satz 9.14 eine stetige Funktion v(h) mit v(0) = 1. Damit ist
ex − ex0 = (ex0 v(x − x0 ))(x − x0 ) =: u(x)(x − x0 ),
wobei u stetig in x0 ist, und u(x0 ) = ex0 .
Somit ist exp differenzierbar in x0 , und
d x
e |x=x0
dx
= ex0 .
(c) Für x > 0 ist nach Satz 10.5
log′ (x) =
1
exp′ (log x)
=
1
1
= .
exp(log x)
x
Für x < 0 ist nach der Kettenregel
d
d
1
log |x| =
log(−x) =
·
dx
dx
−x
d(−x)
dx
=
1
.
x
(d) Nach der Kettenregel ist
d
d(α log x)
d α
x =
exp(α log x) = exp(α log x) ·
dx
dx
dx
1
= xα · α · = αxα−1 .
x
143
d
d
(ex ) = ex , und somit nach der Kettenregel dx
(e−x ) =
(e) Nach (b) ist dx
d
e−x dx
(−x) = −e−x . Es folgt
1
1 d x
d
d
sinh(x) =
(e ) − (e−x ) = (ex + e−x ) = cosh(x).
dx
2 dx
dx
2
′
Analog zeigt man cosh (x) = sinh(x).
(f) Nach der Quotiententregel und (9.18) ist
1
d
d sinh x
cosh x cosh x − sinh x sinh x
=
.
tanh (x) =
=
2
dx
dx cosh x
cosh x
cosh2 x
(g) Nach Satz 10.5 ist
d
1
arsinh x =
.
dx
cosh(arsinh x)
Ferner ist aufgrund von (9.18)
cosh2 y = sinh2 y + 1,
also cosh y =
p
sinh2 y + 1, da stets cosh y ≥ 1. Es folgt
1
d
arsinh x = √
.
2
dx
x +1
Die zweite Formel wird ähnlich bewiesen.
(h) Wir können hier ähnlich argumentieren wie in (b). Es ist
eix − eix0 = eix0 (eih − 1),
mit h = x − x0 . Mit der in (b) definierten Funktion v ist also
eix − eix0 = (eix0 v(i(x − x0 )))i(x − x0 ),
und wie in (b) folgern wir, dass
(10.5)
cis′ (x0 ) = ieix0 = icis(x0 )
ist.
(i) Man überlegt sich leicht, dass eine komplexwertige Funktion f differenzierbar
in x0 ist dann und nur dann, wenn die beiden reellwertigen Funktionen Ref
und Im f differenzierbar sind in x0 , und dass dann
(10.6)
f ′ (x0 ) = (Ref )′ (x0 ) + i(Imf )′ (x0 )
gilt.
Angewandt auf f = cis folgt nach (10.5):
cos′ (t0 ) + i sin′ (t0 ) = cis′ (t0 ) = icis(t0 )
= i(cos t0 + i sin t0 ) = − sin t0 + i cos t0 ,
woraus (h) unmittelbar folgt.
144
10.2
Ableitungen höherer Ordnung
Es seien wieder I ⊂ R ein Intervall positiver Länge und f : I → R (bzw. f : I → C)
eine Funktion, sowie x0 ein fester Punkt von I.
Definitionen. Die Ableitungen höherer Ordnung von f sind rekursiv definiert
durch
f (0) := f, f (k+1) := (f (k) )′ , k ≥ 0.
k
Anstelle von f (k) schreibt man auch ddxfk .
Sei m ∈ N, m ≥ 1. Die Funktion f heiße im Punkte x0 m-mal differenzierbar,
wenn es eine ε-Umgebung Uε (x0 ), ε > 0, gibt, sowie Funktionen f (0) , . . . , f (m−1) auf
Uε (x0 ) ∩ I, so dass f (k) = (f (k−1) )′ ist für k = 1, . . . , m − 1, und so dass f (m) (x0 ) :=
(f (m−1) )′ (x0 ) existiert. Natürlich hängt f (m) (x0 ) dann nicht von ε ab. Man schreibt
häufig auch:
f (1) = f ′ , f (2) = f ′′ , f (3) = f ′′′ .
Existiert f (m) auf ganz I, so heißt f m-mal differenzierbar auf I. Ist zusätzlich
die m-te Ableitung f (m) stetig auf I, so heißt f m-mal stetig differenzierbar auf
I, oder auch Funktion der Klasse C m .
Mit C m (I) oder auch C m (I, C), m ∈ N, bezeichnen wir die Menge aller m-mal stetig
differenzierbaren Funktionen auf I mit Werten in C, mit C m (I, R) die Menge aller
m-mal stetig differenzierbaren Funktionen auf I mit Werten in R.
Entspreched bezeichne C ∞ (I) etc. die Menge aller beliebig oft differenzierbaren
Funktionen auf I.
Insbesondere ist f ∈ C 0 (I, C) bzw. f ∈ C 0 (I, R) genau dann, wenn f eine stetige,
komplex- bzw. reellwertige Funktion auf I ist. Man schreibt auch C(I) bzw. C(I, C)
für C 0 (I, C) und C(I, R) für C 0 (I, R).
Mit Hilfe der Rechenregeln für stetige bzw. differenzierbare Funktionen sieht man
sofort, dass C m (I, C) einen C-Vektorraum und C m (I, R) einen R-Vektorraum bildet.
Für höhere Ableitungen gelten folgende Rechenregeln.
Satz 10.6 (Leibniz-Regel) Sind sowohl f als auch g m-mal (stetig) differenzierbare Funktionen auf dem Intervall I, so ist auch das Produkt f ·g dort m-mal (stetig)
differenzierbar, und es gilt:
m X
m (m−k) (k)
(m)
f
g .
(10.7)
(f · g) =
k
k=0
Beweis. Dies folgert man leicht mittels vollständiger Induktion aus der Produktregel
(Übung).
Q.E.D.
Satz 10.7 Es seien I und J zwei Intervalle, sowie f : I → R mit f (I) ⊂ J und g :
J → R (oder auch g : J → C) zwei Funktionen. Ist f m-mal (stetig) differenzierbar
auf I, und ist g m-mal (stetig) differenzierbar auf J, so ist g ◦ f m-mal (stetig)
differenzierbar auf I.
145
Satz 10.8 Es sei f : I → R eine m-mal stetig differenzierbare Funktion auf dem
Intervall I, m ≥ 1. Ist f ′ (x) 6= 0 für alle x ∈ I, so ist die Umkehrfunktion f −1
m-mal stetig differenzierbar auf f (I).
Diese Regeln lassen sich leicht aus den bereits bewiesenen Regeln für 1-mal (stetig)
differenzierbare Funktionen mittels vollständiger Induktion herleiten (siehe [B]).
Beispielsweise gilt für die 2. Ableitung der Umkehrfunktion g = f −1 von f :
g ′′ (y) = −
(10.8)
Es ist nämlich
g ′ (y) =
wobei h(t) =
f ′′ (g(y))
.
[f ′ (g(y))]3
1
= h ◦ f ′ ◦ g(y),
f ′ (g(y))
1
sei. Die Kettenregel liefert daher
t
g ′′ (y) = h′ (f ′(g(y)) f ′′ (g(y)) g ′ (y)
1
1
= − ′
f ′′ (g(y)) ′
.
2
[f (g(y))]
f (g(y))
10.3
Extrema
Definition. Es sei A eine Teilmenge von R oder C. Ein Punkt x0 ∈ A heiße innerer
Punkt von A, wenn es ein ε > 0 gibt mit Uε (x0 ) ⊂ A.
Ab jetzt sei wieder A = I ein Intervall, und f : I → R eine reellwertige Funktion.
Satz 10.9 Sei f : I → R gegeben, und sei x0 ein innerer Punkt von I. Ist f
differenzierbar in x0 , und besitzt f in x0 ein lokales Extremum, so ist f ′ (x0 ) = 0.
Beweis. Wir dürfen annehmen, dass f in x0 ein lokales Minimum besitzt (andernfalls betrachte man −f anstelle von f ). Sei ε > 0 so, dass Uε (x0 ) ⊂ I, und so dass
ferner f (x) ≥ f (x0 ) für alle x ∈ Uε (x0 ) gilt. Dann folgt für solche x
(
f (x) − f (x0 ) ≤ 0 für x < x0
x − x0
≥ 0 für x > x0 ,
also f ′ (x0 +) ≥ 0, f ′ (x0 −) ≤ 0. Somit ist f ′ (x0 ) = f ′ (x0 +) = f ′ (x0 −) = 0.
Q.E.D.
Punkte x0 , in denen f ′ (x0 ) = 0 ist, heißen kritische oder auch stationäre Punkte
von f .
146
Lokale Extremalpunkte einer differenzierbaren Funktion sind also kritische Punkte
– die Umkehrung hiervon gilt aber nicht.
Beispiel. 0 ist ein kritischer Punkt der Funktion f (x) = x3 auf R, jedoch kein
Extremalpunkt.
Wie schon die Graphik zum Satz 9.8 vom Maximum zeigt, ist übrigens die Voraussetzung, dass x0 ein innerer Punkt von I ist, wichtig für die Gültigkeit von Satz
10.9.
In den folgenden Sätzen werden wir meist folgende Annahme über die Funktion f
machen:
(∗)
f : [a, b] → R ist stetig auf dem abgeschlossenen Intervall [a, b]
und differenzierbar auf dem offenen Intervall ]a, b[.
Dabei soll wieder a < b sein. Der Verzicht auf die Differenzierbarkeit
√ in den Endpunkten macht die betreffenden Sätze z.B. auf die Funktion f (x) = 1 − x2 , D(f ) =
[−1, 1], anwendbar.
Satz 10.10 (Rolle) Genügt f der Voraussetzung (∗) und ist f (a) = f (b), so gibt
es einen Punkt ξ ∈]a, b[ mit f ′ (ξ) = 0.
Beweis. Nach dem Satz vom Maximum bzw. Minimum gibt es ξ1 , ξ2 ∈ [a, b] mit
f (ξ1 ) ≤ f (x) ≤ f (ξ2 ) für alle x ∈ [a, b]. Ist nun ξ1 ein innerer Punkt von [a, b] , d.h.
ξ1 ∈]a, b[, so ist nach Satz 10.9 f ′ (ξ1 ) = 0, und ebenso ist f ′ (ξ2 ) = 0, falls ξ2 ∈]a, b[.
Es bleibt der Fall zu betrachten, dass ξ1 und ξ2 in {a, b} liegen. Dann ist aber wegen
f (a) = f (b) auch f (ξ1) = f (ξ2), d.h. f (x) = f (ξ1 ) = f (ξ2 ) für alle x ∈ [a, b]. f ist
also konstant, und somit f ′ (ξ) = 0 für alle ξ ∈]a, b[.
Q.E.D.
Theorem 10.11 (Verallgemeinerter Mittelwertsatz) Genügen f und g der
Voraussetzung (∗) und ist g ′(x) 6= 0 für alle x ∈]a, b[, so ist g(a) =
6 g(b). Ferner
gibt es einen Punkt ξ ∈]a, b[ mit
(10.9)
f (b) − f (a)
f ′ (ξ)
= ′ .
g(b) − g(a)
g (ξ)
Beweis. Aus g(a) = g(b) folgte nach dem Satz von Rolle, dass g ′ (x) = 0 für mindestens ein x ∈]a, b[. Somit ist g(a) 6= g(b).
Indem wir anstelle von f die Funktion f˜(x) := f (x) − f (a) und anstelle von g
die Funktion g̃(x) := g(x) − g(a) betrachten dürfen wir in einem ersten Schritt
o.B.d.A annehmen, dass f (a) = 0 = g(a). Dann ist g(b) 6= 0, und indem wir dann
noch g(x)/g(b) anstelle von g(x) betrachten, dürfen wir zusätzlich noch g(b) = 1
147
annehmen, d.h. g(b) = 1 und f (a) = g(a) = 0. Unter diesen Voraussetzungen ist
dann (10.9) äquivalent dazu, dass ein ξ ∈]a, b[ existiert, für welches gilt
f (b) =
f ′ (ξ)
,
g ′(ξ)
d.h. f ′ (ξ) − f (b)g ′ (ξ) = 0.
Wir definieren daher die Hilfsfunktion h : [a, b] → R durch
h(x) := f (x) − f (b)g(x).
Für diese gilt h(a) = h(b) = 0. Nach dem Satz von Rolle gibt es daher ein ξ ∈]a, b[
mit
0 = h′ (ξ) = f ′ (ξ) − f (b)g ′ (ξ).
Damit ist (10.9) gezeigt.
Q.E.D.
Korollar 10.12 (Mittelwertsatz) Genügt f der Voraussetzung (∗), so gibt es
einen Punkt ξ ∈]a, b[ mit
(10.10)
f (b) − f (a) = f ′ (ξ)(b − a)
Beweis. Wende Theorem 10.11 mit g(x) = x an.
Q.E.D.
a
ξ
b
Der Mittelwertsatz hat verschiedenste Anwendungen, von denen wir hier drei betrachten.
10.3.1
Satz von l’Hospital
Satz 10.13 (Regel von l’Hospital) Wir nehmen an, dass f und g der Voraussetzung (∗) genügen, und dass x ∈ [a, b] eine gemeinsame Nullstelle von f und g ist,
d.h. f (x) = g(x) = 0. Ferner sei g ′ (ξ) 6= 0 für alle ξ ∈]a, b[ mit ξ 6= x. Dann gilt:
Falls der Grenzwert
f ′ (ξ)
lim
ξ→x g ′ (ξ)
148
existiert, so existiert auch der Grenzwert
f (ξ)
,
ξ→x g(ξ)
lim
und beide sind gleich:
f (ξ)
f ′ (ξ)
= lim
.
′
ξ→x g(ξ)
ξ→x g (ξ)
lim
Beweis. Sei (xn )n eine beliebige Folge in [a, b] mit xn → x und xn 6= x für alle x.
Nach Theorem 10.11 gibt es für alle n ∈ N ein ξn zwischen x und xn mit
f (xn )
f (xn ) − f (x)
f ′ (ξn )
=
= ′
.
g(xn )
g(xn ) − g(x)
g (ξn )
Aus xn → x folgt ξn → x und damit
f (xn )
f ′ (ξ)
f ′ (ξn )
= lim ′
= lim ′ .
n→∞ g(xn )
n→∞ g (ξn )
ξ→x g (ξ)
lim
Da die Folge (xn )n beliebig war, folgt die Behauptung.
Q.E.D.
Beispiel:
cos x
sin x
= lim
= cos(0) = 1.
x→0
x→0 x
1
lim
10.3.2
Fehlerabschätzung
Genügt f der Voraussetzung (∗), und ist
(10.11)
|f ′ (x)| ≤ M
für alle x ∈]a, b[,
so gilt für beliebige x, x0 ∈ [a, b]:
f (x) = f (x0 ) + r(x),
wobei
(10.12)
|r(x)| ≤ Mε, falls |x − x0 | ≤ ε.
Es ist nämlich f (x) − f (x0 ) = f ′ (ξ)(x − x0 ) für ein ξ ∈]a, b[, also
|r(x)| = |f ′(ξ)(x − x0 )| ≤ M|x − x0 |.
149
10.3.3
Monotonie
Satz 10.14 f genüge der Voraussetzung (∗). Dann gilt:
(i) f ist monoton wachsend auf [a, b] genau dann, wenn f ′ (x) ≥ 0 ist für alle
x ∈]a, b[.
(ii) f ist konstant genau dann, wenn f ′ (x) = 0 ist für alle x ∈]a, b[.
(iii) f ist streng monoton wachsend, falls f ′ (x) > 0 ist für alle x ∈]a, b[.
Beweis. Sind x1 , x2 ∈ [a, b] mit x1 < x2 , so gilt nach dem Mittelwertsatz:
∆f := f (x2 ) − f (x1 ) = f ′ (ξ)(x2 − x1 ),
mit einem ξ = ξ(x1 , x2 ) ∈]x1 , x2 [. Aus f ′ (x) ≥ 0, bzw. f ′ (x) = 0 bzw. f ′ (x) > 0 für
alle x ∈]a, b[ folgt daher ∆f ≥ 0, bzw. ∆f = 0, bzw. ∆f > 0, d.h. f ist wachsend
bzw. konstant, bzw. streng wachsend.
Die zu beweisenden umgekehrten Implikationen sind klar.
Q.E.D.
Beispiel: Die Funktion f : R≥0 → R mit
1
1+x
ist streng monoton wachsend. Insbesondere ist f (x) ≥ 1 für alle x ≥ 0, da ja
f (0) = 1.
Es ist nämlich
1
x
1
−
=
> 0 für alle x > 0.
f ′ (x) =
2
1 + x (1 + x)
(1 + x)2
f (x) := log(1 + x) +
10.4
Trigonometrische Funktionen: 2. Teil.
Lemma 10.15 Es gilt sin x > 0 für alle x ∈]0, 2], sowie cos 2 < 0.
Beweis. Es ist sin x = x + r(x), mit
∞
r(x) X (−1)k x2k
=
.
x
(2k
+
1)!
k=1
Setzen wir pk := x2k /(2k + 1)!, so gilt für |x| ≤ 3 : pk+1/pk ≤ 1, wie man leicht
∞
P
nachprüft, und natürlich ist (pk )k eine Nullfolge, d.h. die Reihe
(−1)k pk = −p1 +
k=1
p2 − p3 + . . . genügt dem Leibnizkriterium. Da pk − pk+1 ≥ 0 für alle k gilt, und da
s2n =
2n
X
k=1
(−1)k pk = −(p1 − p2 ) − (p3 − p4 ) − · · · − (p2n−1 − p2n )
= −p1 + (p2 − p3 ) + (p4 − p5 ) + · · · + (p2n−2 − p2n−1 ) + p2n
150
ist, folgt
−p1 ≤ s2n ≤ 0.
Ganz analog erhält man aus
s2n+1 = −p1 + (p2 − p3 ) + · · · + (p2n − p2n+1 )
= −(p1 − p2 ) − · · · − (p2n−1 − p2n ) − p2n+1
auch
−p1 ≤ s2n+1 ≤ 0.
≤ p1 =
Somit ist r(x)
x Abschätzung
x2
3!
=
x2
6
≤
2
3
für |x| ≤ 2. Für 0 < x ≤ 2 ergibt sich die
r(x)
2
x
) ≥ x(1 − ) = > 0.
x
3
3
Mit ähnlichen Überlegungen zeigt man, dass cos 2 < 0 ist.
sin x = x(1 +
Q.E.D.
Lemma 10.16 Die Cosinus-Funktion ist im Intervall [0, 2] streng fallend und besitzt
darin genau eine Nullstelle.
Beweis. Nach Lemma 10.15 ist cos′ (x) = − sin(x) < 0 für x ∈]0, 2[, so dass cos
auf [0, 2] nach Satz 10.14 streng fallend, also insbesondere injektiv ist. Ferner ist
cos 0 = 1, cos 2 < 0, so dass cos nach dem Zwischenwertsatz auf ]0, 2[ eine Nullstelle
besitzt. Diese ist aufgrund der Injektivität eindeutig.
Q.E.D.
Die eindeutige Nullstelle des Cosinus in ]0, 2[ wird mit
π = 2 · π2 die Kreiszahl. Aus cos π2 = 0 folgt:
sin2
π
2
bezeichnet, und man nennt
π
π
= 1 − cos2 = 1,
2
2
und da sin π2 > 0 gilt nach Lemma 10.15, ist sin π2 = 1. Es folgt
π
ei 2 = cos
π
π
+ i sin = i,
2
2
und somit
(10.13)
π
3
ei 2 = i, eiπ = −1, ei 2 π = −i, ei2π = 1.
Eine auf ganz R definierte Funktion f heiße periodisch, wenn es eine Zahl T > 0
gibt, so dass für alle t ∈ R gilt:
f (t + T ) = f (t).
151
Ein solches T heißt eine Periode von f . Die Funktion
cis : t 7→ eit ,
t ∈ R,
ist periodisch mit Periode 2π. Es gilt nämlich
ei(t+2π) = eit ei2π = eit .
Folglich sind auch sin und cos 2π-periodisch. Es gilt ferner
ei(t+π) = eit eiπ = −eit ,
(10.14)
woraus
(10.15)
cos(t + π) = − cos t,
sin(t + π) = − sin t
folgt. Schließlich ist
π
π
ei(t+ 2 ) = eit ei 2 = ieit ,
(10.16)
woraus
cos(t +
π
π
) = − sin t, sin(t + ) = cos t,
2
2
d.h.
(10.17)
cos t = sin(
π
π
− t), sin t = cos( − t)
2
2
folgt.
Diese Identitäten zeigen insbesondere, dass es genügt, die Funktion cos im Intervall [0, π2 ] zu kennen, um den Gesamtverlauf der Funktionen cos und sin auf R zu
bestimmen.
Satz 10.17 Die cis-Funktion bildet das Intervall [0, 2π[ bijektiv und stetig auf den
Einheitskreis S 1 ab.
Beweis. Nach Lemma 10.16 und dem Zwischenwertsatz bildet cos das Intervall [0, π2 [
bijektiv auf das Intervall ]0, 1] ab; dies impliziert, dass cis das Intervall [0, π2 [ bijektiv
auf den Viertelkreis SI1 := {x + iy ∈ S 1 : x > 0, y ≥ 0} abbildet.
eit
1
SII
SI1
cos t
1
SIV
1
SIII
152
Da die Abbildung
J : C → C,
z 7→ iz
wegen i(x + iy) = −y + ix einer Vierteldrehung der Ebene um 0 entspricht, und da
cis(t +
π
) = i cis(t) = J ◦ cis(t)
2
1
, das Intervall
ist, bildet cis damit offenbar das Intervall [ π2 , π[ auf den Viertelkreis SII
3
3
1
1
[π, 2 π[ auf den Viertelkreis SIII und das Intervall [ 2 π, 2π[ auf den Viertelkreis SIV
(siehe Zeichnung) ab, und zwar jeweils bijektiv.
Q.E.D.
Wir zeigen nun noch, dass cis die reelle Achse längentreu“ auf den Einheitskreis
”
aufwickelt,“d.h. dass t tatsächlich den Winkel zwischen den Punkten eit = cos t +
”
i sin t und der positiven Halbachse R+ , gemessen im Bogenmaß, beschreibt:
Für festes t ∈ [0, 2π[ betrachten wir dazu die Kurve γ(s) := eis , s ∈ [0, t], welche
den Punkt 1 mit dem Punkt eit entlang des Einheitskreises verbindet. Wir müssen
zeigen, dass der dadurch definierte Kreisbogen die (Bogen-)länge t besitzt. Die Länge
einer Kurve werden wir später allgemeiner definieren. Eine ad hoc- Definition sieht
offenbar folgendermassen aus:
Gegeben N ∈ N≥1 , zerlege das Intervall [0, t[ in N gleichlange Teilintervalle der
Form [sk , sk+1 [, k = 0, . . . , N − 1, mit sk := kt/N. Wir stellen uns dann die Kurve
approximiert vor durch den Polygonzug PN , welchen man dadurch erhält, dass man
die Punkte γ(sk−1 ) und γ(sk ) jeweils durch ein Geradensegment der Länge ∆k :=
|γ(sk−1) − γ(sk )| verbindet. Der Polygonzug besitzt dann offenbar die Gesamtlänge
L(PN ) =
N
−1
X
∆k .
k=0
Ferner gilt
itk
∆2k = |e N − e
it(k−1)
N
it
it
−it
|2 = |e N − 1|2 = (e N − 1)(e N − 1) = 2 1 − cos(
t ) .
N
Ferner gilt bekanntlich 1 − cos x = 2 sin2 (x/2) (Additionstheorem auf cos(x/2 + x/2)
t
anwenden!). Für genügend großes N erhalten wir somit ∆k = 2 sin 2N
, und folglich
L(PN ) = N2 sin
sin t t
2N
.
=t·
t
2N
2N
Für N → ∞ strebt dies gegen t, und man definiert in der Tat die Länge von γ durch
diesen Grenzwert:
L(γ) := lim L(PN ) = t.
N →∞
Mit Hilfe von Satz 10.17 und der obigen Formeln (10.17) zeigt man leicht (Übung):
153
Ist z ∈ C, so gilt sin z = 0 genau dann, wenn z = kπ für ein k ∈ Z, und cos z = 0
genau dann, wenn z = π2 + kπ, für ein k ∈ Z.
Die Funktionen
cos : [0, π] → [−1, 1]
und
π π
sin : [− , ] → [−1, 1]
2 2
sind streng monoton und stetig, und wieder mit dem Zwischenwertsatz zeigt man,
dass sie auch surjektiv sind. Sie besitzen daher Umkehrfunktionen
arccos : [−1, 1] → [0, π]
bzw.
π π
arcsin : [−1, 1] → [− , ],
2 2
den Arcuscosinus bzw. Arcussinus.
Abbildung 10.1: Arcuscosinus
Abbildung 10.2: Arcussinus
Mit ähnlichen Überlegungen wie in den Beispielen 10.1.1(g) zeigt man, dass
(10.18)
1
d
arccos(x) = √
,
dx
1 − x2
−1
d
arcsin(x) = √
,
dx
1 − x2
x ∈] − 1, 1[.
Außerhalb der Nullstellen von Cosinus bzw. Sinus definiert man den (komplexen)
Tangens bzw. Cotangens durch
tan z :=
sin z
,
cos z
cot z :=
154
cos z
.
sin z
Die Einschränkungen auf die reelle Achse werden mit denselben Symbolen bezeichnet. Tangens und Cotangens sind offenbar auch 2π-periodisch, nach (10.17) sogar
π-periodisch, und mit der Quotientenregel erhält man
(10.19)
d
1
tan(x) =
,
dx
cos2 x
d
−1
.
cot(x) =
dx
sin2 x
Ferner ist die Einschränkung des Tangens auf das reelle Intervall ] − π2 , π2 [ eine streng
wachsende Bijektion auf R, und besitzt somit eine Umkehrfunktion
π π
arctan : R →] − , [,
2 2
den Arcustangens (genauer den Hauptzweig des Arcustangens). Dessen Ableitung
ist gegeben durch
1
d
arctan(x) =
,
dx
1 + x2
(10.20)
denn ist y = arctan x, d.h. x = tan y, so gilt wegen tan′ (y) =
tan2 y =
1
sowie
cos2 y
sin2 y
1 − cos2 y
1
=
=
−1
cos2 y
cos2 y
cos2 y
offenbar
tan′ (y) = 1 + (tan y)2 ,
so dass (10.20) mit dem Satz 10.5 über die Ableitung von Umkehrfunktionen folgt.
Abbildung 10.3: Arcustangens
Mehr zu diesen Themen, insbesondere zu trigonometrischen Funktionen, findet man
beispielsweise in [F] und [B] oder [K].
Korollar 10.18 (Polarzerlegung in C) Jede komplexe Zahl z besitzt eine Darstellung
z = reiϕ mit r = |z| und ϕ ∈ R.
ϕ ist im Fall z 6= 0 bis auf die Addition eines ganzzahligen Vielfachen von 2π
bestimmt, im Falle z = 0 beliebig.
155
Beweis. Sei z 6= 0 (der Fall z = 0 ist trivial). Mit r := |z| gilt dann zr ∈ S 1 , so
dass nach Satz 10.17 ein eindeutiges t ∈ [0, 2π[ existiert mit zr = eit , also z = reit .
Da die Funktion cis 2π-periodisch ist, gilt somit z = reiϕ für jedes ϕ der Gestalt
ϕ = t + k2π, k ∈ Z, und umgekehrt folgert man, dass jedes ϕ mit z = reiϕ von
dieser Gestalt sein muss .
Q.E.D.
Man nennt eine Zahl ϕ wie im obigen Korollar dann ein Argument von z.
10.5
Konvexität
Definition. Es sei f : I → R eine Funktion auf dem Intervall I. f heiße konvex
auf I, wenn für alle Punkte x, y ∈ I und jedes t ∈ [0, 1] gilt:
(K)
f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y).
Hierzu sei angemerkt:
Für x < y besitzt jeder Punkt z des Intervalls [x, y] eine eindeutige Darstellung der
Form
z = (1 − t)x + ty,
mit t ∈ [0, 1],
(warum?), und es gilt dann
(10.21)
(z − x) = t(y − x),
(y − z) = (1 − t)(y − x).
Ferner ist die Sekante durch die Punkte (x, f (x)) und (y, f (y)) gegeben als Graph
der Funktion
f (y) − f (x)
g(s) := f (x) +
(s − x).
y−x
Da dann
f (y) − f (x)
((1 − t)x + ty − x)
y−x
= (1 − t)f (x) + tf (y)
g(z) = f (x) +
ist, bedeutet (K), dass f (z) ≤ g(z) ist für alle z ∈ [x, y], d.h. dass der Graph von f
unterhalb der Sekante liegt.
x
y
156
Satz 10.19 (Jensensche Ungleichung) Es sei f : I → R eine konvexe Funktion.
Dann gilt für alle n ∈ N, n ≥ 1: Sind x1 , . . . , xn ∈ I und α1 , . . . , αn ∈ [0, 1] mit
α1 + · · · + αn = 1, so ist α1 x1 + · · · + αn xn ∈ I, und
(K′ )
f (α1 x1 + · · · + αn xn ) ≤ α1 f (x1 ) + · · · + αn f (xn ).
Beweis (per vollständiger Induktion). Für n = 1 ist (K′ ) klar.
Setzen wir die Gültigkeit von (K′ ) für ein n ≥ 1 voraus, und sind x1 , . . . , xn+1 ∈ I
sowie α1 , . . . , αn+1 ∈ [0, 1] mit α1 + · · · + αn+1 = 1 gegeben, so unterscheiden wir
zwei Fälle:
Ist αn+1 = 1, so ist die Ungleichung
f (α1 x1 + · · · + αn xn + αn+1 xn+1 )
≤ α1 f (x1 ) + . . . αn f (xn ) + αn+1 f (xn+1 )
(10.22)
offensichtlich, da dann α1 = · · · = αn = 0 ist.
Ist αn+1 < 1, so ist 1 − αn+1 > 0, und wir setzen
α1
αn
, . . . , βn :=
,
1 − αn+1
1 − αn+1
y := β1 x1 + · · · + βn xn .
β1 :=
Da die βj ≥ 0 sind, und da
β1 + · · · + βn = (α1 + · · · + αn )/(1 − αn+1 ) = (1 − αn+1 )/(1 − αn+1 ) = 1
ist, ist nach Induktionsvoraussetzung y ∈ I. Damit liegt dann auch
α1 x1 + · · · + αn xn + αn+1 xn+1 = (1 − αn+1 )y + αn+1 xn+1
in I, und mit (K) folgt
f (α1 x1 + · · · + αn xn + αn+1 xn+1 ) = f ((1 − αn+1 )y + αn+1 xn+1 )
≤ (1 − αn+1 )f (y) + αn+1 f (xn+1 ).
Ferner gilt nach Induktionsvoraussetzung
f (y) = f (β1 x1 + · · · + βn xn ) ≤ β1 f (x1 ) + · · · + βn f (xn ).
Zusammen erhalten wir
f (α1 x1 + · · · + αn+1 xn+1 )
≤ (1 − αn+1 )β1 f (x1 ) + · · · + (1 − αn+1 )βn f (xn ) + αn+1 f (xn+1 ) ,
also (10.22) .
Q.E.D.
Sind x1 , . . . , xn Vektoren in einem reellen Vektorraum E, so bezeichnet man jede
Linearkombination α1 x1 + · · · + αn xn mit α1 , . . . , αn ∈ [0, 1] und α1 + · · · + αn = 1
übrigens als eine konvexe Linearkombination dieser Vektoren.
157
Satz 10.20 Ist f : I → R 2-mal differenzierbar, so sind die folgenden Eigenschaften
äquivalent:
(i) f ist konvex auf I.
(ii) f ′ ist monoton wachsend auf I.
(iii) f ′′ (x) ≥ 0 für alle x ∈ I.
Beweis. (i) ⇒ (ii)“.
”
Es seien x, z, y ∈ I mit x < z < y. Schreiben wir wieder z als z = (1 − t)x + ty, so
ist nach (K)
f (z) − f (x) = f ((1 − t)x + ty) − f (x)
≤ t[f (y) − f (x)],
also wegen z − x = t(y − x):
f (y) − f (x)
f (z) − f (x)
≤
.
z−x
y−x
(10.23)
Analog ist nach (K)
f (z) − f (y) ≤ (1 − t)[f (x) − f (y)],
also wegen z − y = (1 − t)(x − y):
f (y) − f (x)
f (y) − f (z)
≥
.
y−z
y−x
(10.24)
Aus (10.23) und (10.24) ergibt sich
f (z1 ) − f (x)
f (y) − f (z2 )
≤
z1 − x
y − z2
für alle x, z1 , z2 , y ∈ I mit x < z1 , z2 < y. Lässt man in dieser Ungleichung z1 gegen
x und z2 gegen y streben, so folgt:
f ′ (x) ≤ f ′ (y).
Somit ist f ′ wachsend.
(ii) ⇒ (i)“. Es seien x, z, y ∈ I mit x < z < y. Nach dem Mittelwertsatz gibt es
”
dann ein ξ1 ∈]x, z[ sowie ein ξ2 ∈]z, y[, so dass gilt:
f (z) − f (x)
= f ′ (ξ1 ),
z−x
f (y) − f (z)
= f ′ (ξ2 ).
y−z
158
Wegen der Monotonie von f ′ erhalten wir hieraus:
f (z) − f (x)
f (y) − f (z)
≤
.
z−x
y−z
Schreiben wir hier wieder z = (1 − t)x + ty, so ergibt sich durch Umformen mittels
(10.21) rasch (K).
(ii) ⇔ (iii)“. Dies folgt leicht aus Satz 10.14 , da f ′′ = (f ′ )′ ist.
”
Q.E.D.
Als Anwendungen der obigen Sätze beweisen wir einige fundamentale Ungleichungen, welche später benötigt werden.
Satz 10.21 Es seien s1 , . . . , sn ∈ [0, 1] mit s1 +· · ·+sn = 1, sowie x1 , . . . , xn ∈ R>0 .
Dann gilt
xs11 · · · xsnn ≤ s1 x1 + · · · + sn xn .
(10.25)
Beweis. Da exp′′ (y) = exp(y) > 0 gilt für alle y ∈ R, ist nach Satz 10.20 die
Funktion exp konvex auf R. Wenden wir also die Jensensche Ungleichung auf exp
an, so erhalten wir für alle y1 , . . . , yn ∈ R
exp(s1 y1 + · · · + sn yn ) ≤ s1 exp y1 + · · · + sn exp yn ,
also
(ey1 )s1 · · · (eyn )sn ≤ s1 (ey1 ) + · · · + sn (eyn ).
Setzen wir hierin yj := log(xj ), j = 1, . . . , n, so folgt (10.25).
Q.E.D.
Für s1 = · · · = sn =
(10.26)
1
n
erhalten wir insbesondere folgende Ungleichung
1
(x1 + · · · + xn )
n
1
(x1 . . . xn ) n ≤
1
zwischen dem geometrischen Mittel (x1 . . . xn ) n der Zahlen x1 , . . . , xn und ihrem
arithmetischen Mittel n1 (x1 + · · · + xn ).
Satz 10.22 (Höldersche Ungleichung) Es seien p > 1, q > 1 mit
Dann gilt für alle x1 , . . . , xn , y1 , . . . , yn ∈ R≥0 :
(10.27)
n
X
k=1
xk yk ≤
n
X
xpk
k=1
159
! p1
n
X
k=1
ykq
! 1q
.
1 1
+ = 1.
p q
Beweis. Wir können o.B.d.A. annehmen, dass x1 , . . . , xn , y1 , . . . , yn in R>0 liegen.
n q1
1
n
P q
P p p
und yk durch yk /
ersetzen, können wir
yℓ
Indem wir xk durch xk /
xℓ
ferner annehmen, dass
ℓ=1
ℓ=1
n
X
xpk
=
k=1
n
X
ykq = 1
k=1
ist, und müssen zeigen, dass dann
n
X
k=1
xk yk ≤ 1
gilt. Nach Satz 10.21 ist jedoch für k = 1, . . . , n
1
1
1
1
xk yk = (xpk ) p (ykq ) q ≤ xpk + ykq ,
p
q
also
n
X
n
n
1X p 1X q 1 1
x +
y = + = 1.
xk yk ≤
p k=1 k q k=1 k p q
k=1
160
Q.E.D.
Kapitel 11
Anhang A: Zur Konstruktion des
Körpers R
11.1
Konstruktion der ganzen Zahlen
In N lässt sich die Gleichung b+x = a für gegebenes a und b in N nach (P) dann lösen,
wenn a ≥ b ist, aber auch nur dann, denn existiert ein x ∈ N mit b+x = a, so ist nach
(M + ), (N) und (P) a = b + x ≥ b + 0 = b. Der Wunsch, die Gleichung b + x = a stets
lösen zu können, hat schon früh zur Erweiterung des Systems der natürlichen Zahlen
zum System der ganzen Zahlen geführt. Wir wollen hier eine konkrete Konstruktion
des Systems der ganzen Zahlen angeben, welche nur auf den bereits eingeführten
Begriffsbildungen fußt. Natürlich haben Sie bereits gewisse Vorstellungen davon,
was ganze Zahlen sind und wie man damit rechnet; diese wollen wir uns zunutze
machen und insbesondere ausnutzen, dass sich bekanntlich“ jede ganze Zahl γ als
”
Differenz a − b zweier natürlicher Zahlen darstellen lässt. Eine solche Darstellung ist
jedoch nicht eindeutig, da (a + c) − (b + c) = a − b für alle c ∈ N. Wir werden also
versuchen, γ durch das geordnete Paar (a, b) zu beschreiben, wobei aber noch gewisse
geordnete Paare miteinander zu identifizieren“ sind, nämlich alle Paare (a+ c, b+ c)
”
mit c ∈ N.
Dazu führen wir zunächst den grundlegenden Begriff der Äquivalenzrelation ein.
Ist X eine beliebige Menge, und ist R ⊂ X × X eine Teilmenge von X × X, so
wollen wir schreiben x ∼ y“, wenn das Paar (x, y) in R liegt. Damit wollen wir
”
deutlich machen, dass zwischen gewissen x, y ∈ X eine Beziehung besteht, nämlich
denjenigen, für die (x, y) ∈ R. Wir nennen dann R (bzw. ∼) eine Relation auf X.
Beispielsweise haben wir schon die Ordnungsrelation ≤“ auf N kennengelernt. Eine
”
Relation ∼ (oder genauer R) auf X heißt Äquivalenzrelation auf X, wenn für
beliebige x, y, z ∈ X gilt:
(A1) x ∼ x
(A2) x ∼ y ⇒ y ∼ x
(A3) x ∼ y, y ∼ z ⇒ x ∼ z
(Reflexivität)
(Symmetrie)
(Transitivität)
Das Zeichen ∼ wird i.d.R. nur für Äquivalenzrelationen benutzt. Gilt x ∼ y, so
161
heißen die Elemente x und y äquivalent.
Ist x ∈ X, so bezeichnen wir mit [x] := {y ∈ X : y ∼ x} die sogenannte Äquivalenzklasse von x. Je zwei verschiedene Äquivalenzklassen [x] und [y] sind disjunkt.
Ist nämlich z ∈ [x] ∩ [y], so ist z ∼ x und z ∼ y, also auch y ∼ z wegen (A2), und
folglich y ∼ x wegen (A3). Ist nun u ∈ [y], so ist u ∼ y und ferner y ∼ x, also
u ∼ x, d.h. u ∈ [x]. Folglich ist [y] ⊂ [x], und analog zeigt man [x] ⊂ [y], so dass
[x] = [y].
Der letzte Schluss zeigte außerdem, dass aus x ∼ y stets [x] = [y] folgt. Ist umgekehrt
[x]=[y], so ist wegen x ∼ x natürlich x ∈ [x] = [y], d.h. x ∼ y. Wir sehen also:
Für x, y ∈ X gilt x ∼ y genau dann, wenn [x] = [y].
Jedes Element z ∈ [x] heißt Repräsentant der Klasse [x].
Wir bezeichnen die Menge aller Äquivalenzklassen [x], x ∈ X, mit Ẋ oder auch
X/R, X/ ∼. Da schließlich x ∈ [x] für jedes x ∈ X, so sehen wir:
Eine Äquivalenzrelation auf der Menge X bewirkt eine Zerlegung von X in disjunkte
nicht-leere Teilmengen, die Äquivalenzklassen:
(11.1)
X=
[
˙
C.
C∈X
Durch Übergang von der Menge X zur Menge Ẋ mittels der Abbildung x 7→ [x]
hören wir also auf, zwei Punkte x und y zu unterscheiden, wenn sie äquivalent sind,
d.h. wenn [x] = [y] – wir identifizieren“ x und y.
”
Kehren wir zu unserem Problem der Konstruktion von Z zurück. Wir setzen dazu
X = N × N, und definieren, wie angedeutet, eine Äquivalenzrelation R auf X wie
folgt: Zwei Paare (a1 , b1 ) und (a2 , b2 ) in X seien äquivalent, wenn es c1 , c2 ∈ N gibt
so, dass
(11.2)
a1 + c1 = a2 + c2 , b1 + c1 = b2 + c2 ,
(d.h. (a1 , b1 ) + (c1 , c1 ) = (a2 , b2 ) + (c2 , c2 )). Man prüft leicht nach, dass es sich hier
tatsächlich um eine Äquivalenzrelation handelt, und wir definieren nun Z als die
Menge aller Äquivalenzklassen in X : Z := Ẋ = X/R.
Anmerkung: In einem kartesichen Koordinatensystem (welches wir strenggenommen noch gar nicht zur Verfügung haben, da R ja noch nicht konstruiert ist) lassen
sich die Äquivalenzklassen dieser Relation leicht beschreiben als die Mengen von
Paaren (a, b) ∈ N × N, welche jeweils auf einer Geraden der Steigung 1 liegen.
Da mit (a, b) auch (a−b, 0) auf derselben Geraden der Steigung 1 liegt, ist auch klar,
mit welcher ganzen Zahl eine solche Äquivalenzklasse zu identifizieren ist, nämlich
mit dem Schnittpunkt dieser Geraden mit der x-Achse des Koordinatensystems.
Die Addition und Multiplikation definieren wir auf Z wie folgt:
162
(11.3)
[(a1 , b1 )] + [(a2 , b2 )] := [(a1 + a2 , b1 + b2 )],
[(a1 , b1 )] · [(a2 , b2 )] := [(a1 a2 + b1 b2 , a1 b2 + a2 b1 )].
Dies wird motiviert durch die Formeln
(a1 − b1 ) + (a2 − b2 ) = (a1 + a2 ) − (b1 + b2 ),
(a1 − b1 )(a2 − b2 ) = (a1 a2 + b1 b2 ) − (a1 b2 + a2 b1 ).
Man überzeugt sich zunächst, dass Summe und Produkt in Z durch (11.3) wohldefiniert sind, d.h. nicht von der Wahl der Repräsentanten abhängen.
Ersetzt man beispielsweise (a1 , b1 ) durch das äquivalente Paar
(a1 + c, b1 + c), c ∈ N, so ist
((a1 + c) + a2 , (b1 + c) + b2 ) = ((a1 + a2 ) + c, (b1 + b2 ) + c)
∼ (a1 + a2 , b1 + b2 ),
d.h.
[(a1 + c) + a2 , (b1 + c) + b2 )] = [(a1 + a2 , b1 + b2 )],
und
((a1 + c)a2 + (b1 + c)b2 , (a1 + c)b2 + a2 (b1 + c))
= ((a1 a2 + b1 b2 ) + (a2 + b2 )c, (a1 b2 + a2 b1 ) + (a2 + b2 )c)
∼ (a1 a2 + b1 b2 , a1 b2 + a2 b1 ),
d.h.
[(a1 + c)a2 + (b1 + c)b2 , (a1 + c)b2 + a2 (b1 + c)] = [(a1 a2 + b1 b2 , a1 b2 + a2 b1 )],
und der allgemeine Fall wird ähnlich gezeigt.
Mit ein wenig Fleiß zeigt man anschließend, dass die Addition und Multiplikation in
Z den Regeln (A+ ), (K+ ), (A· ), (K· ) und (D) genügen, d.h. assoziativ, kommutativ
und distributiv sind. Setzen wir weiter 0 := [(0, 0)], 1 := [(1, 0)], so gilt wegen
(a + 0, b + 0) = (a, b),
(a · 1 + b · 0, a · 0 + 1 · b) = (a, b)
offenbar [(a, b)] + 0 = [(a, b)], [(a, b)] · 1 = [(a, b)] für alle [(a, b)] ∈ Z, d.h. es gelten
auch die Regeln (N) und (E). Auch die Kürzungsregel der Multiplikation (Q) bleibt
in Z erhalten (Übung), es gilt im Gegensatz zu N aber nun noch folgende Regel in
Z:
(AI) Für jedes γ ∈ Z existiert ν ∈ Z mit γ + ν = 0 (Existenz eines additiven
Inversen).
163
In der Tat, ist γ = [(a, b)] ∈ Z, und setzen wir ν := [(b, a)], so ist γ + ν = 0, da
(a + b, b + a) = (a + b, a + b) ∼ (0, 0).
Man schreibt daher für [(b, a)] auch −[(a, b)]. (AI) gestattet es, für gegebenes γ, ν ∈ Z
stets eine (eindeutige) Lösung der Gleichung γ + x = ν zu finden. x := ν + (−γ) ist
nämlich eine Lösung dieser Gleichung, da γ + ν + (−γ) = ν + (γ + (−γ)) = ν + 0 = ν,
und umgekehrt folgt aus γ + x = ν natürlich x = γ + x + (−γ) = ν + (−γ). Für
ν + (−γ) schreiben wir wie üblich auch ν − γ.
Die natürlichen Zahlen lassen sich kanonisch in Z einbetten“. Dazu definieren wir
”
eine Abbildung
ι : N → Z, a 7→ [(a, 0)].
ι ist injektiv, denn sind a, b ∈ N so, dass ι(a) = ι(b), so ist (a, 0) ∼ (b, 0), d.h. es
existieren c1 , c2 ∈ N mit
a + c1 = b + c2 , 0 + c1 = 0 + c2 ,
woraus c1 = c2 und a + c1 = b + c1 folgt. Mit der Kürzungsregel der Addition (S)
schließt man, dass
a = b.
Ferner respektiert ι die Addition und Multiplikation auf N bzw. Z, d.h. für beliebige
a, b ∈ N gilt
(11.4)
ι(a + b) = ι(a) + ι(b), ι(0) = 0,
ι(a · b) = ι(a) · ι(b), ι(1) = 1,
wie man sich leicht überzeugt. Die Teilmenge ι(N) ⊂ Z ist also ein isomorphes
”
Bild“ von N, d.h. wir können die natürlichen Zahlen als den Teil von Z aller ganzen
Zahlen der Form [(a, 0)] auffassen.
In einem letzten Schritt wollen wir noch eine Ordnung auf Z einführen. Dazu setzen
wir [(a1 , b1 )] :≤ [(a2 , b2 )], wenn a1 + b2 ≤ b1 + a2 .
Wieder überzeugt man sich, dass diese Relation wohldefiniert ist und den Regeln
(R), (T), (I) und (V) genügt, und somit eine lineare Ordnungsrelation auf Z definiert.
Auch die Regeln (M+ ), (M· ) lassen sich leicht nachprüfen, wobei hier in (M· ) c ≥ 0
vorausgesetzt werden muss . Die so definierte Ordnung, wenn eingeschränkt auf ι(N),
stimmt mit derjenigen von N überein, d.h. es gilt für alle a, b ∈ N
(11.5)
a ≤ b ⇔ ι(a) ≤ ι(b).
In der Tat, da ι(a) = [(a, 0)], ι(b) = [(b, 0)], ist a ≤ b äquivalent zu a + 0 ≤ 0 + b,
d.h. ι(a) ≤ ι(b).
Wir bemerken abschließend noch, dass für ein Element [(a, b)] ∈ Z gilt: [(a, b)] ≥ 0
genau dann, wenn a ≥ b. Ist aber a ≥ b, so ist nach der Kürzungsregel der Addition
164
für N a von der Form b + c, d.h. [(a, b)] = [(c, 0)] = ι(c), und ist a ≤ b, so ist
−[(a, b)] = [(b, a)] ≥ 0, d.h. [(a, b)] = −ι(d) für ein d ∈ N:
Eine ganze Zahl ist eine natürliche Zahl, oder das Negative einer natürlichen Zahl.
Nachdem wir hiermit die grundlegendsten Regeln für den Umgang mit ganzen Zahlen für die von uns konstruierten ganzen Zahlen nachgewiesen haben, ist die Existenz der ganzen Zahlen auf die der natürlichen zurückgeführt, und wir wollen
im Folgenden ganze Zahlen wieder wie üblich mit kleinen lateinischen Buchstaben
a, b, . . . , p, q, r, . . . etc. bezeichnen.
11.2
Zu Konstruktion der rationalen Zahlen
Der Übergang von Z nach Q erfolgt mit ähnlichen Überlegungen wie der von N
nach Z. Als Motivation dient hier der Wunsch, die Gleichung ax = b für beliebiges
a 6= 0 und b lösen zu können, was in Z bekanntlich nicht möglich ist. Um nun Q
aus Z zu konstruieren, machen wir uns unsere Kenntnis“ zunutze, dass sich jede
”
p
rationale Zahl als Quotient zweier ganzer Zahlen p und q , q ∈ N \ {0}, darstellen
q
lässt, und beachten: Sind p1 , p2 , q1 , q2 in Z, q1 , q2 von Null verschieden, und existieren
p1
p2
c1 , c2 ∈ N \ {0}, so dass p1 c1 = p2 c2 , q1 c1 = q2 c2 , so ist
= .
q1
q2
Wir definieren daher auf Y := Z × (N \ {0}) die folgende Äquivalenzrelation:
(p1 , q1 ) ∼ (p2 , q2 )
genau dann, wenn es c1 , c2 ∈ N \ {0} gibt so, dass
(11.6)
p1 c1 = p2 c2 , q1 c1 = q2 c2 ,
und definieren Q als Menge aller Äquivalenzklassen in Y . Addition, Multiplikation
und Ordnung auf Q werden dann wie folgt festgesetzt:
(11.7)
[(p1 , q1 )] + [(p2 , q2 )] := [(p1 q2 + p2 q1 , q1 q2 )]
[(p1 , q1 )] · [(p2 , q2 )] := [(p1 p2 , q1 q2 )]
[(p1 , q1 )] ≤ [(p2 , q2 )] ,
falls p1 q2 ≤ p2 q1 .
Die Null und die Eins in Q werden definiert durch 0 := [(0, 1)], 1 := [(1, 1)].
Die Einbettung von Z in Q erfolgt durch die Abbildung ̺ : a 7→ [(a, 1)].
Mit diesen Setzungen weist man nach, dass Q ein angeordneter Körper ist.
6 0, so ist
Bezeichnen wir mit a1 = a−1 das multiplikative Inverse von a = [(p, q)] =
−1
−1
offenbar [(p, q)] = [(q, p)], falls p > 0, und [(p, q)] = [(−q, −p)], falls p < 0, und
165
insbesondere ̺(q)−1 = [(q, 1)]−1 = [(1, q)] für q ∈ N \ {0}. Jedes Element a = [(p, q)]
von Q lässt sich somit schreiben als
a = ̺(p)̺(q)−1 = ̺(p)
1
̺(p)
=:
, mit p ∈ Z, q ∈ N \ {0}.
̺(q)
̺(q)
p
q
zweier ganzer Zahlen p ∈ Z und q ∈ N\{0} zurückgefunden, und wollen im Folgenden
mit den rationalen Zahlen umgehen, wie wir es gewohnt sind. Dafür genügen uns
die oben angegebenen Regeln – die genaue Definition der Menge Q wird dabei i.d.R.
keine Rolle mehr spielen.
Damit haben wir zu der üblichen Darstellung einer rationalen Zahl als Quotient
Es sei noch daran erinnert, dass die obige Darstellung einer rationalen Zahl als
p
Quotient
zweier ganzer Zahlen auch leicht genutzt werden kann um zu zeigen,
q
dass der Körper Q archimedisch geordnet ist.
11.3
Zur Konstruktion der reellen Zahlen
Wir haben mit Satz 7.1, ausgehend von der Eigenschaft (R), die gewohnte Darstellung der reellen Zahlen z.B. als unendliche Dezimalbrüche wiedergefunden. Ferner
haben wir am Ende von Kapitel 4 die Konstruktion eines Modells des Köpers der
reellen Zahlen mit Hilfe von Intervallschachtelungen im Körper Q der rationalen
Zahlen angedeutet. Hier soll nun gezeigt werden, dass damit tatsächlich ein Körper
konstruiert wird, der den Axiomen genügt, welche wir für den Körper der reellen
Zahlen R verlangt haben.
Zur Erinnerung: Mit R hatten wir die Menge aller Intervallschachtelungen (An )n
abgeschlossener beschränkter Intervalle An ⊂ Q mit lim |An | = 0 (im Köper Q)
bezeichnet, und auf dieser Menge hatten wir eine Äquivalenzrelation ∼ eingeführt,
indem wir zwei solche Intervallschachtelungen (An )n und (Bn )n als äquivalent bezeichnet hatten, wenn die Folge der Durchschnitte (An ∩ Bn )n ebenso in der Menge
R liegt.
Auf R hatten wir eine Addition und eine Multiplikation wie folgt eingeführt: Sind
(An )n und (Bn )n in R, so sei
(An )n + (Bn )n := (An + Bn )n ,
(An )n · (Bn )n := (An · Bn )n .
Ferner schreiben wir (An )n < (Bn )n , falls ein n0 ∈ N existiert so, dass für alle n ≥ n0
gilt An < Bn , in dem Sinne, dass x < y ist für alle x ∈ An und alle y ∈ Bn . Dies ist
offenbar gleichbedeutend damit, dass max An < min Bn .
Die folgende einfache Beobachtung wird für uns sehr oft nützlich sein:
166
Lemma 11.1 Sind a = (An )n und b = (Bn )n in R, und gilt An ⊂ Bn für alle n, so
ist a ∼ b.
Beweis. Wegen An ∩ Bn = An ist (An ∩ Bn )n in R.
Q.E.D.
Auf der Menge K = R/ ∼ definieren wir nun eine Addition und eine Multiplikation wie folgt: Sind a = (An )n und b = (Bn )n in R, und bezeichnet wie üblich [a]
bzw. [b] die Äquivalenzklasse von a bzw. b in K, so setzen wir
[a] + [b] := [a + b],
[a] · [b] := [a · b],
sowie
[a] < [b],
falls
a < b.
Theorem 11.2 Die obigen Setzungen für die Addition + und die Multiplikation ·
sowie die Relation ≤ sind wohldefiniert. K, versehen mit dieser Addition und Multiplikation, ist ein Körper, und die Relation ≤ eine totale Ordnung auf K, mit der
K zu einem ordnungsvollständigen angeordneten Körper wird, d.h. einem Modell für
den Köper R.
Beweis.
1. Wohldefiniertheit. Wir müssen zeigen, dass die obigen Setzungen wohldefiniert sind, d.h. dass sie nicht von der Wahl des Repräsentanten a ∈ [a] der Klasse
[a] bzw. b ∈ [b] der Klasse [b] abhängen.
Dazu betrachten wir zwei weitere Repräsentanten a′ = (A′n )n ∈ [a] von [a] und
b ∈ (Bn′ )n ∈ [b] von [b]. Dann gilt also a′ ∼ a und b′ ∼ b, d.h. für jedes n gilt
An ∩ A′n 6= ∅ und Bn ∩ Bn′ 6= ∅.
(11.8)
a) Für die Addition und Multiplikation muss dann gezeigt werden, dass [a′ + b′ ] =
[a + b] und [a′ · b′ ] = [a · b], d.h. dass a′ + b′ ∼ a + b und a′ · b′ ∼ a · b. Wir werden dies
nur für die Addition durchführen; für die Multiplikation läuft das Argument ganz
analog.
Es ist
a′ + b′ = (A′n + Bn′ )n , a + b = (An + Bn )n ,
und offenbar gilt
(A′n + Bn′ ) ∩ (An + Bn ) ⊃ (A′n ∩ An ) + (Bn′ ∩ Bn ) =: Dn ,
wobei Dn 6= ∅ ein abgeschlossenes beschränktes Intervall in Q ist, dessen Länge für
n → ∞ gegen 0 strebt. Damit ist offenbar d := (Dn )n ∈ R, und nach Lemma 11.1
ist
(A′n + Bn′ )n ∼ (Dn )n ∼ (An + Bn )n ,
167
so dass wegen der Transitivität der Relation ∼ auch (A′n + Bn′ )n ∼ (An + Bn )n gilt,
d.h. a′ + b′ ∼ a + b.
b) Für unsere Ordnungsrelation müssen wir zeigen, dass a < b äquivalent zu a′ < b′
ist. Hierzu genügt es, eine der beiden Implikationen zu zeigen. Sei also a < b, d.h.
für genügend großes n gelte An < Bn . Dann gibt es ein ε ∈ Q mit ε > 0 so, dass für
genügend großes n sogar
max An < min Bn − ε.
Ferner gilt für genügend großes n offenbar auch
max{|An |, |A′n |, |Bn |, |Bn′ | < ε/4.
Wegen (11.8) gilt damit für genügend großes n
max A′n ≤ max An + |A′n | < max An + ε/4,
min Bn′ ≥ min Bn − |Bn′ | > min Bn − ε/4,
und somit insgesamt für genügend großes n
max A′n < min Bn − ε + ε/4 < min Bn′ + ε/4 − ε + ε/4 = min Bn′ − ε/2.
Somit gilt auch a′ < b′ .
Wir setzen in K schließlich [a] ≤ [b], falls [a] < [b] oder [a] = [b]. Damit sind auf
K nun eine Addition +, , eine Multiplikation · sowie eine Relation ≤ wohldefiniert.
Wir zeigen als nächstes:
2. (K, +, ·) ist ein Körper: Die Assoziativität von Addition (A+ ) und Multiplikation (A. ), ebenso die Kommutativität von Addition (K + ) und Multiplikation (M . )
sowie die Distributivität (D) folgen unmittelbar aus den entsprechenden Eigenschaften des Körpers Q, welche für alle a = (An )n , b = (Bn )n , c = (Cn )n ∈ R die folgenden
Identitäten bzw. die letzte Inklusion implizieren:
(An + Bn ) + Cn = An + (Bn + Cn ), (An · Bn ) · Cn = An · (Bn · Cn ),
An + Bn = Bn + An , An · Bn = Bn · An ,
An · (Bn + Cn ) ⊂ An · Bn + An · Cn .
Beachte, dass die letzte Inklusion wieder mit Lemma 11.1 impliziert, dass [a]([b] +
[c]) = [a(b + c)] = [ab] + [ac]. Das Nullelement 0K in K ist offenbar gegeben durch
0K := [(Nn )n ], wobei Nn := [0, 0] = {0} ⊂ Q die konstante Folge der Intervalle
bezeichnet, die nur das Nullelement 0 in Q enthalten, denn es gilt ja stets An + Nn =
An . Analog ist das Einselement 1K in K ist gegeben durch 1K := [(En )n ], wobei
En := [1, 1] = {1} ⊂ Q die konstante Folge der Intervalle bezeichnet, die nur das
Einselement 1 in Q enthalten.
Auch die Existenz eines additiven inversen Elements (AI) sowie eines multiplikativen
inversen Elements (MI) sind leicht nachzuweisen:
168
Ist [a] ∈ K mit a = (An )n ∈ R, so sei −[a] := [(−An )n ]. Dann ist −[a] ∈ K, und da
[0, 0] ⊂ An + (−An ) ist, folgt mit Lemma 11.1, dass [a] + (−[a]) = 0K . Analog für
(MI) :
Ist [a] 6= 0K , so gibt es ein n0 ∈ N so, dass für alle n ≥ n0 gilt 0 ∈
/ An (sonst
wäre [0, 0] ⊂ An für alle n, und damit [a] = 0K ). Dann sind jedoch, wie man leicht
−1
sieht, die Mengen A−1
: x ∈ An } wohldefinierte abgeschlossene beschränkte
n := {x
Intervalle, deren Längen gegen Null streben, so dass [a]−1 := [(A−1
n )n≥n0 ] in K liegt,
−1
und wegen [1, 1] ∈ An · A−1
ist
offenbar
[a]
·
[a]
=
1
.
K
n
3. Die Relation ≤ ist eine totale Ordnung auf der Menge K: Seien wieder
a = (An )n , b = (Bn )n , c = (Cn )n ∈ R. Die Eigenschaft (R), d.h. [a] ≤ [a], ist klar
aufgrund der Definition von ≤ . Um die Transitivität (T) nachzuweisen genügt es
offenbar, folgendes zu zeigen:
Ist [a] < [b] und [b] < [c], so ist [a] < [c]. Nach Voraussetzung gilt aber für genügend
großes n sowohl max An < min Bn als auch max Bn < min Cn , und somit insbesondere max An < min Cn , da die Ordnung auf Q transitiv ist. Damit folgt in der Tat
[a] < [c].
Wir nehmen als nächstes an, dass [a] 6= [b] ist, und werden daraus folgern, dass
entweder [a] < [b] oder [b] < [a] gilt.
Dies stellt dann offenbar per Kontraposition auch die Eigenschaft (I), dass aus
[a] ≤ [b] und [b] ≤ [a] stets [a] = [b] folgt, sicher, wie auch die totale Anordnung von
K.
Sei also [a] 6= [b]. Dann gilt a ≁ b, d.h. es gibt ein n0 ∈ N mit An0 ∩ Bn0 = ∅. Dann
gilt auch An ∩ Bn = ∅ für alle n ≥ n0 , also entweder An < Bn , oder Bn < An . Damit
folgt [a] < [b], oder [b] < [a].
4. K ist ein angeordneter Körper: Um (M + ) nachzuweisen, seien wieder a =
(An )n , b = (Bn )n , c = (Cn )n ∈ R, und wir nehmen an, dass [a] ≤ [b]. Wir wollen
zeigen, dass dann [a] + [c] ≤ [b] + [c].
Ist [a] = [b], so gilt dies trivialerweise. Sei daher [a] < [b]. Für genügend großes n
gilt dann An < Bn , also auch An + Cn < Bn + Cn (dies folgt mit einem ähnlichen
Argument wie im Beweisabschnitt 1. zur Wohldefiniertheit, da die Intervalllängen
gegen Null streben). Damit folgt aber [a] + [c] < [b] + [c].
Ganz analog zeigt man auch die Eigenschaft (M . ).
5. Einbettung von Q in K : Wir betten den Körper Q in den Körper K ein durch
die Abbildung q 7→ [([q, q])n ] ∈ K, q ∈ Q. Wir werden dann der Einfachheit halber
(etwas unsauber) auch wieder q anstelle von schreiben [([q, q])n ] schreiben.
6. Ordnungsvollständigkeit von K: Sei M ⊂ K nach oben beschränkt. Wir
definieren dann rekursiv eine Intervallschachtelung (In )n ∈ R, In = [qn , sn ], indem
wir zwei Folgen (qn )n und (sn )n rationaler Zahlen konstruieren mit qn ≤ sn und den
folgenden Eigenschaften, wobei L := s0 − q0 sei: Für alle n ∈ N gelte
(i) qn ≤ qn+1 und sn+1 ≤ sn .
169
(ii) sn − qn = 2−n L.
(iii) sn ist eine obere Schranke für M.
(iv) Es gibt ein xn ∈ M mit qn ≤ xn .
Für n = 0 wählen wir dazu einen beliebigen Punkt x0 = [(An )n ] ∈ M sowie eine
beliebige obere Schranke S = [(In )n ] ∈ K von M und setzen q0 := min A0 ∈ Q und
s0 := max I0 ∈ Q. Dann gilt offenbar q0 ≤ x0 , da ja [q0 , q0 ] ≤ An ist für alle n, und
ebenso ist S ≤ s0 , so dass q0 ≤ x0 ≤ S ≤ s0 .
Nehmen wir an, wir hätten bereits q0 , . . . , qn sowie s0 , . . . , sn mit den obigen Eigenschaften konstruiert, so definieren wir qn+1 und sn+1 wie folgt:
Sei an := (qn + sn )/2 ∈ Q der Mittelpunkt des Intervalls In .
1. Fall: Es existiert ein y ∈ M mit an ≤ y. Dann setzen wir qn+1 := an , sn+1 := sn
und xn+1 := y ∈ M.
2. Fall: Für alle x ∈ M gilt x < an . Dann ist an eine obere Schranke für M, und
wir setzen qn+1 := qn , sn+1 := an und xn+1 := xn .
In beiden Fällen ist dann leicht nachzuprüfen, dass die Eigenschaften (i) –(iv) auch
für qn+1 , sn+1 und xn+1 gelten.
Da der Körper Q archimedisch geordnet ist, konvergiert die Folge (2−n L)n in Q
gegen Null, d.h. lim |In | = 0. Somit zeigen die Eigenschaften (i) –(iv), dass in der
Tat die Intervallschachtelung (In )n in R liegt.
Wir betrachten nun die Zahl“ s := [(In )n ] ∈ K und behaupten, dass s = sup M :
”
a) s ist eine obere Schranke für M : Angenommen, es gäbe ein a = [(An )n ] ∈ M
mit s < a. Für genügend großes n, sagen wir n ≥ n0 , wäre dann [qn , sn ] = In < An .
Insbesondere wäre {sn0 } = [sn0 , sn0 ] < An für alle n ≥ n0 , und somit sn0 < [(An )n ] =
a, so dass sn0 im Gegensatz zu unserer Konstruktion keine obere Schranke für M
wäre. Unsere Annahme führt also zu einem Widerspruch.
b) s ist die kleinste obere Schranke für M : Angenommen, t = [(Tn )n ] ∈ K
wäre eine obere Schranke für M mit t < s. Für genügend großes n würde dann
Tn < In = [qn , sn ] gelten, also auch Tk < In = [qn , sn ] für jedes k ≥ n. Wegen
qn ≤ xn ≤ sn würde insbesondere für alle k ≥ n die Relation Tk < [xn , xn ] gelten,
und folglich wäre t < xn in K. xn liegt jedoch in M, und somit wäre t keine obere
Schranke für M, im Widerspruch zu unserer Annahme.
Damit haben wir gezeigt, dass K alle vom Köper R der reellen Zahlen geforderten
Eigenschaften besitzt, d.h. wir könnten definieren R := K.
Q.E.D.
170
11.4
Ein angeordneter Körper, der nicht archimedisch angeordnet ist
Es sei K der Körper aller reellen, rationalen Funktionen
f (x) :=
n
P
j=0
m
P
aj xj
bk xk
k=0
mit n, m ∈ N und aj , bk ∈ R, wobei das Nennerpolynom nicht identisch verschwinde,
versehen mit der üblichen Addition sowie Multiplikation von rationalen Funktionen.
Dabei dürfen wir stets annehmen, dass bm 6= 0, und dass an 6= 0, es sei denn, f = 0.
Man sieht dann leicht, dass für alle genügend großen x > 0 entweder f (x) > 0,
oder f (x) < 0 gilt, je nachdem, ob an /bm > 0, oder an /bm < 0 ist. Im ersten Fall
sagen wir, dass f positiv ist und schreiben f > 0, im zweiten, dass f negativ ist und
schreiben f < 0. Wir können daher eine vollständige Ordung auf K einführen indem
wir für f, g ∈ K setzen f > g, falls f − g > 0, und f ≥ g, falls f > g oder f = g
(dies entspricht nicht der üblichen Ordnung, welche man auf dem Raum aller reellen
Funktionen einführt!). Damit wird in der Tat K zu einem angeordneten Körper, wie
man leicht zeigt. Das Einselement in K ist die konstante Funktion 1.
Es gibt jedoch kein n ∈ N mit n · 1 > id, wobei id ∈ K die identische Abbildung
id(x) := x bezeichne (Übung!). Somit ist der Körper K nicht archimedisch geordnet.
171
Herunterladen