Analysis I

Werbung
ii
4 Differenzierbarkeit
4.1 Definition und grundlegende Eigenschaften . . .
4.2 Der Mittelwertsatz . . . . . . . . . . . . . . . .
4.3 Anwendungen des Mittelwertsatzes . . . . . . .
4.4 Folgen und Reihen differenzierbarer Funktionen
Analysis I
Walter Bergweiler
WS 2006/07
Fassung vom 6. Februar 2007
Inhaltsverzeichnis
1 Grundlagen
1.1 Einleitung . . . . . . . . . .
1.2 Aussagenlogik . . . . . . . .
1.3 Mengen . . . . . . . . . . .
1.4 Quantoren . . . . . . . . . .
1.5 Relationen und Funktionen .
1.6 Vollständige Induktion . . .
1.7 Körper . . . . . . . . . . . .
1.8 Reelle Zahlen . . . . . . . .
1.9 Komplexe Zahlen . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Folgen und Reihen
2.1 Folgen . . . . . . . . . . . . . . . . . . . . . .
2.2 Rechenregeln . . . . . . . . . . . . . . . . . .
2.3 Konvergenzkriterien . . . . . . . . . . . . . . .
2.4 Limes superior und inferior sowie uneigentliche
2.5 Die allgemeine Potenz . . . . . . . . . . . . .
2.6 Reihen . . . . . . . . . . . . . . . . . . . . . .
2.7 Absolute und bedingte Konvergenz . . . . . .
2.8 Kriterien für absolute Konvergenz . . . . . . .
2.9 Potenzreihen . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
3
6
9
14
16
21
26
. . . . . . .
. . . . . . .
. . . . . . .
Grenzwerte
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
30
30
33
36
40
43
43
46
48
50
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
54
54
56
57
60
65
66
70
.
.
.
.
.
.
.
.
.
3 Stetigkeit und Grenzwerte von Funktionen
3.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . .
3.2 Der Zwischenwertsatz . . . . . . . . . . . . . . .
3.3 Grenzwerte von Funktionen . . . . . . . . . . .
3.4 Trigonometrische und hyperbolische Funktionen
3.5 Polarkoordinaten . . . . . . . . . . . . . . . . .
3.6 Kompakte Mengen . . . . . . . . . . . . . . . .
3.7 Folgen stetiger Funktionen . . . . . . . . . . . .
i
INHALTSVERZEICHNIS
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
72
72
77
80
86
INHALTSVERZEICHNIS
iii
1
1
Grundlagen
1.1
Einleitung
“Was ist Mathematik?” Dies ist der Titel eines (lesenswerten) Buches von R. Courant und H. Robbins. Die Antwort ist nicht einfach, und das genannte Buch gibt
sie, indem es in mathematische Methoden und Denkweisen einführt. Wir verzichten
auf eine “Definition” des Begriffs “Mathematik”, sondern begnügen uns zunächst
mit der Feststellung, dass die Mathematik eine Wissenschaft ist, die Aussagen über
(abstrakte) Objekte wie Zahlen, Mengen, Funktionen, usw. macht.
Die Vorgehensweise ist dabei folgende: Man beginnt mit gewissen Grundaussagen, den sogenannten Axiomen. Neue Aussagen gewinnt man aus diesen Axiomen
(und bereits gewonnenen Aussagen) durch logisches Schließen. Eine so gewonnene
Aussage nennt man Satz (oder auch Theorem), in manchen Fällen auch Hilfssatz
(Lemma), Folgerung (Korollar) oder ähnlich. Die Herleitung einer solchen Aussage
durch logisches Schließen nennt man Beweis. Die Festlegung eines neuen Begriffs
nennt man Definition.
Was ist Analysis? Auch auf eine Definition des Begriffs “Analysis” soll hier
verzichtet werden. Wir nennen lediglich einige der Grundbegriffe: reelle und komplexe Zahlen, Funktionen, Stetigkeit, Ableitung, Integral,... Wie die meisten anderen mathematischen Disziplinen hat auch die Analysis vielfältige Anwendungen.
So bedient man sich etwa bei der mathematischen Beschreibung von Vorgängen in
Naturwissenschaft und Technik oft der Sprache und Methoden der Analysis. Stellt
man beispielsweise die Position eines beweglichen Teilchens als Funktion der Zeit
dar, so ist seine Geschwindigkeit durch die Ableitung und seine Beschleunigung
durch die zweite Ableitung gegeben.
1.2
Aussagenlogik
(Mathematische) Aussagen können wahr (w) oder falsch (f) sein:
• 2+3=4 (f)
• 7 ist eine Primzahl (w)
Es muss nicht bekannt sein, ob eine Aussage wahr oder falsch ist:
• Es gibt unendlich viele natürliche Zahlen n, so dass n und n + 2 beide Primzahlen sind (?)
Die Verneinung (Negation) einer Aussage A wird mit ¬A bezeichnet; gesprochen
”nicht A”. Es ist ¬A genau dann wahr, wenn A falsch ist.
Aus Aussagen A und B lassen sich durch die folgenden Operationen neue Aussagen gewinnen:
• A ∧ B, gesprochen “A und B”: wahr genau dann, wenn A und B beide wahr
sind.
• A ∨ B, gesprochen “A oder B”: wahr genau dann, wenn mindestens eine der
Aussagen A, B wahr ist.
2
1 GRUNDLAGEN
• A ⇒ B, gesprochen “aus A folgt B”, “A impliziert B” oder “wenn A, dann
B”: nur dann falsch, wenn A wahr und B falsch; gleichbedeutend mit ¬A∨B.
(Mit ¬A ∨ B ist hier (¬A) ∨ B und nicht (¬A ∨ B) gemeint.) Man schreibt
auch B ⇐ A statt A ⇒ B.
• A ⇔ B, gesprochen “A ist äquivalent zu B”: genau dann wahr, wenn A und B
beide wahr oder beide falsch sind; gleichbedeutend mit (A ⇒ B) ∧ (B ⇒ A).
Die Wahrheitswerte der Aussagen ¬A, A ∧ B, A ∨ B, A ⇒ B sowie A ⇔ B sind
also durch die von A und B festgelegt. Man stellt dies auch in einer sogenannten
Wahrheitstafel dar:
A B ¬A A ∧ B A ∨ B A ⇒ B ¬A ∨ B A ⇔ B
w w
f
w
w
w
w
w
f
f
f
w
f
f
f
w
f
w
w
f
w
w
w
f
f
f
w
f
f
w
w
w
Man erkennt hier die Äquivalenz von A ⇒ B und ¬A ∨ B. Anders gesagt, die
Aussage (A ⇒ B) ⇔ ¬A ∨ B ist immer wahr, unabhängig vom Wahrheitswert von
A und B.
Ebenso erkennt man, dass A ⇒ B immer dann wahr ist, wenn A falsch ist. Aus
einer falschen Aussage kann also jede Aussage gefolgert werden!
Schließlich beachte man, dass A ∨ B auch dann wahr ist, wenn A und B beide
gelten. In der Mathematik ist mit “oder” also immer das “einschließende oder” und
nicht “entweder-oder, aber nicht beides” gemeint.
Mathematische Sätze haben in der Regel die Form A ⇒ B. Dann heißt A die
Voraussetzung und B die Behauptung. Man sagt auch, dass A eine hinreichende
Bedingung für B ist und B eine notwendige Bedingung für A ist.
Gleichbedeutend mit A ⇒ B ist ¬B ⇒ ¬A. Hiervon überzeugt man sich anhand
der Wahrheitstafel:
A B ¬A ¬B A ⇒ B ¬B ⇒ ¬A
w w
f
f
w
w
w
f
f
w
f
f
w
w
f
w
w
f
f
f
w
w
w
w
Die Aussage ¬B ⇒ ¬A heißt Kontraposition der Aussage A ⇒ B. Die Kontraposition der (wahren) Aussage “Wenn eine natürliche Zahl durch 9 teilbar ist,
dann ist sie auch durch 3 teilbar” lautet beispielsweise: “Wenn eine natürliche Zahl
nicht durch 3 teilbar ist, so ist sie auch nicht durch 9 teilbar”.
Die Gültigkeit der folgenden Aussagen verifiziert man leicht durch Aufstellen
der Wahrheitstafel. Dabei sind A, B und C beliebige Aussagen.
(i) A ∧ B ⇔ B ∧ A
(ii) A ∨ B ⇔ B ∨ A
(iii) (A ∧ B) ∧ C ⇔ A ∧ (B ∧ C)
(iv) (A ∨ B) ∨ C ⇔ A ∨ (B ∨ C)
3
1.3 Mengen
(v) A ∧ (B ∨ C) ⇔ (A ∧ B) ∨ (A ∧ C)
(vi) A ∨ (B ∧ C) ⇔ (A ∨ B) ∧ (A ∨ C)
(vii) ¬(¬A) ⇔ A
(viii) ¬(A ∨ B) ⇔ ¬A ∧ ¬B
(ix) ¬(A ∧ B) ⇔ ¬A ∨ ¬B
Man nennt (i) und (ii) Kommutativgesetz, (iii) und (iv) Assoziativgesetz sowie (v)
und (vi) Distributivgesetz. Aufgrund des Assoziativgesetzes kann man bei den Ausdrücken A ∧ B ∧ C sowie A ∨ B ∨ C also auf Klammern ganz verzichten.
Zum Beweis eines Satzes der Form “A⇒ B” gibt es zwei Möglichkeiten.
Direkter Beweis. Man findet Aussagen A1 , A2 , ..., , An mit
(A ⇒ A1 ) ∧ (A1 ⇒ A2 ) ∧ ... ∧ (An ⇒ B).
Man schreibt dies auch kurz als
A ⇒ A1 ⇒ A2 ⇒ ... ⇒ An ⇒ B.
Man überzeugt sich (durch Aufstellen der Wahrheitstafel), dass (A ⇒ A1 ) ∧ (A1 ⇒
B) tatsächlich A ⇒ B impliziert, d.h., es gilt
((A ⇒ A1 ) ∧ (A1 ⇒ B)) ⇒ (A ⇒ B)
für Aussagen A, A1 , B. Dies ist obige Situation falls n = 1. Wir werden später sehen,
wie man den Fall beliebiger natürlicher Zahlen n behandeln kann (vollständige
Induktion).
Indirekter Beweis. Die einfachste Form des indirekten Beweises ist der direkte Beweis der Kontraposition ¬B ⇒ ¬A. Eine andere Form ist der Beweis durch
Widerspruch. Man nimmt A ∧ ¬B sowie eventuell weitere bekannte (wahre) Aussagen an, und erzielt ein Widerspruch zu bekannten (wahren) Aussagen. Formal
zeigt man also mit wahren Aussagen C und D, dass A ∧ ¬B ∧ C ⇒ ¬D gilt. (Man
beachte, dass ¬(A ⇒ B) ⇔ ¬(¬A ∨ B) ⇔ A ∧ ¬B.)
1.3
Mengen
Nach G. Cantor (1895) ist eine Menge M eine “Zusammenfassung aus wohlbestimmten und wohlunterschiedenen Objekten unserer Anschauung oder unseres
Denkens (welche die Elemente von M genannt werden) zu einer Gesamtheit”.
Ist x ein Element der Menge M, so bezeichnen wir dies mit x ∈ M. Ist x kein
Element von M, so schreiben wir x ∈
/ M. Es gilt also x ∈
/ M ⇔ ¬(x ∈ M).
Mengen können durch explizite Angabe ihrer Elemente definiert werden. So ist
M = {x1 , x2 , ..., xn } die aus den Elementen x1 , ..., xn bestehende Menge M. Mengen
können auch durch die Eigenschaften ihrer Elemente definiert werden:
M = {x : x hat die Eigenschaft E}.
4
1 GRUNDLAGEN
Zum Beispiel ist
{x : x ist Primzahl ∧ x ≤ 10} = {2, 3, 5, 7}.
Die leere Menge ist die Menge, die kein Element enthält. Sie wird mit ∅ bezeichnet.
Wir definieren einige weitere wichtige Mengen. Das Zeichen “:=” bedeutet hier
und im folgenden “wird definiert als”. (Bei der Definition von Aussagen benutzt
man analog das Zeichen “:⇔”.)
5
1.3 Mengen
Vereinigung von M und N.
Die Mengen M und N heißen disjunkt falls M ∩ N = ∅. Weiter ist M\N :=
{x : x ∈ M ∧ x 6∈ N}, gesprochen “M ohne N”. Im Falle N ⊂ M heißt M\N auch
Komplement von N (in M).
Für M = {1, 2} und N = {2, 3} ist also M ∩ N = {2}, M ∪ N = {1, 2, 3} und
M\N = {1}.
Die folgenden Regeln für Mengen L, M, N sind analog zu den entsprechenden
Regeln der Aussagenlogik:
• N := {1, 2, 3, ...} ist die Menge der natürlichen Zahlen,
(i) M ∩ N = N ∩ M
• N0 := {0, 1, 2, 3, ...},
(ii) M ∪ N = N ∪ M
• Z := {0, ±1, ±2, ...} = {..., −2, −1, 0, 1, 2, ...} ist die Menge der ganzen Zahlen,
(iii) (L ∩ M) ∩ N = L ∩ (M ∩ N)
• Q :=
{ pq
: p, q ∈ Z ∧ q 6= 0} ist die Menge der rationalen Zahlen
• R ist die Menge der reellen Zahlen.
Eine Menge N heißt Teilmenge der Menge M, falls x ∈ N impliziert, dass x ∈ M
gilt. Wir bezeichnen dies mit N ⊂ M oder M ⊃ N. Insbesondere bei Benutzung der
zweiten Schreibweise sagen wir auch, dass M Obermenge von N ist. Man beachte,
dass N = M zugelassen ist. Es gilt
N = M ⇔ (N ⊂ M) ∧ (M ⊂ N).
Zum Beispiel gilt N ⊂ Z ⊂ Q ⊂ R. (Dies ist eine kurze Schreibweise für (N ⊂
Z) ∧ (Z ⊂ Q) ∧ (Q ⊂ R).)
Weiter heißt N echte Teilmenge von M falls N ⊂ M und N 6= M. Dafür
benutzen wir die Schreibweise N ( M oder M ) N. Analog spricht man auch von
echten Obermengen. Es gilt auch N ( Z ( Q ( R.
Hinweis. Die Terminologie ist in der Literatur uneinheitlich. Manche Autoren benutzen das Symbol “⊆” anstelle von “⊂”, und dort entspricht “⊂” dann dem hier
verwandten “(”.
Die Potenzmenge P (M) einer Menge M ist die Menge aller Teilmengen von M,
also
P (M) = {N : N ⊂ M}.
Zum Beispiel ist P ({1, 2}) = {∅, {1}, {2}, {1, 2}}.
Für Mengen M und N heißen
M ∩ N := {x : x ∈ M ∧ x ∈ N}
Durchschnitt und
M ∪ N := {x : x ∈ M ∨ x ∈ N}
(iv) (L ∪ M) ∪ N = L ∪ (M ∪ N)
(v) L ∩ (M ∪ N) = (L ∩ M) ∪ (L ∩ N)
(vi) L ∪ (M ∩ N) = (L ∪ M) ∩ (L ∪ N)
(vii) M\(M\N) = M ∩ N
(viii) L\(M ∪ N) = L\M ∩ L\N
(ix) L\(M ∩ N) = L\M ∪ L\N.
Im Falle N ⊂ M gilt mit (vii) also M\(M\N) = N. Man bezeichnet (i)-(vi)
wieder als Kommutativ-, Assoziativ- bzw. Distributivgesetz. Die Gleichungen (viii)
und (ix) heißen Regeln von de Morgan.
Wir führen hier nur den Beweis von (v):
⇔
⇔
⇔
⇔
⇔
x ∈ L ∩ (M ∪ N)
x ∈ L ∧ (x ∈ M ∪ N)
x ∈ L ∧ (x ∈ M ∨ x ∈ N)
(x ∈ L ∧ x ∈ M) ∨ (x ∈ L ∧ x ∈ N)
(x ∈ L ∩ M) ∨ (x ∈ L ∩ N)
x ∈ (L ∩ M) ∪ (L ∩ N)
Die Behauptung folgt. Die anderen Regeln beweist man analog.
Das kartesische Produkt M × N zweier Mengen M und N ist die Menge aller
geordneten Paare (x, y) mit x ∈ M und y ∈ N, also
M × N = {(x, y) : x ∈ M ∧ y ∈ N}.
Man beachte, dass M × N 6= N × M für M 6= N und (x, y) 6= (y, x) für x 6= y.
Allgemeiner setzt man für n ∈ N und Mengen M1 , M2 , ..., Mn auch
M1 × M2 × ... × Mn := {(x1 , x2 , ..., xn ) : x1 ∈ M1 ∧ ... ∧ xn ∈ Mn }.
6
1 GRUNDLAGEN
Im Falle M1 = M2 = ... = Mn = M schreibt man statt
M
| × M ×{zM... × M}
n − mal
auch M n . So ist R2 = R × R und R3 = R × R × R. Die Punkte des R3 entsprechen
den Punkten des dreidimensionalen Raumes, die des R2 denen der Ebene.
Der hier verwandte “naive” Mengenbegriff führt zu Widersprüchen (Antinomien). Klassisches Beispiel ist die Russellsche Antinomie: Sei M die Menge aller
Mengen, die sich nicht selbst als Element enthalten, d.h.,
M = {x : x Menge ∧ x 6∈ x}
Aus M ∈
/ M folgt dann M ∈ M, und umgekehrt. Es gilt also
M ∈ M ⇔ ¬(M ∈ M),
was ein Widerspruch ist. Der Widerspruch ist nur behebbar durch eine genauere
Definition des Begriffs Menge - wir verzichten aber hier darauf.
Das obige Problem tritt nicht auf, falls – wie wir es tun werden – nur Teilmengen
gewisser “unproblematischer” Grundmengen betrachtet werden.
1.4
Quantoren
In mathematischen Aussagen treten häufig Variable auf, etwa die Variable x in der
durch “x ist Primzahl” gegebenen Aussage A(x). Sinnvoll sind solche Aussagen
im allgemeinen nur für Variable aus gewissen Mengen, im genannten Beispiel etwa
x ∈ M mit M = N.
Mit Hilfe der Quantoren ∀ (“für alle”) und ∃ (“es existiert”) lassen sich aus
einer für x ∈ M erklärten Aussage A(x) neue Aussagen bilden. Die Aussage
∀x ∈ M : A(x),
bedeutet: “Für alle x ∈ M gilt A(x)”. Formal kann man die Aussage “∀x ∈ M :
A(x)” definieren, indem man sie als wahr definiert falls M = {x ∈ M : A(x)}, und
als falsch sonst. Die Aussage
∃x ∈ M : A(x)
bedeutet: “Es gibt ein x ∈ M für welches A(x) gilt”. Dies gilt falls {x ∈ M :
A(x)} 6= ∅. Ist etwa M = {a, b}, so gilt
(∀x ∈ M : A(x)) ⇔ A(a) ∧ A(b)
und
(∃x ∈ M : A(x)) ⇔ A(a) ∨ A(b)
Analoges gilt für beliebige endliche Mengen M. Quantoren erlauben eine Verallgemeinerung auf unendliche Mengen M.
7
1.4 Quantoren
Regeln wie ¬(A ∧ B) ⇔ ¬A ∨ ¬B verallgemeinern sich wie folgt:
¬(∀x ∈ M : A(x)) ⇔ ∃x ∈ M : ¬A(x),
¬(∃x ∈ M : A(x)) ⇔ ∀x ∈ M : ¬A(x).
Der Beweis der ersten Äquivalenz folgt aus
⇔
⇔
⇔
⇔
⇔
¬(∀x ∈ M : A(x))
¬(M = {x ∈ M : A(x)})
M 6= {x ∈ M : A(x)}
M\{x ∈ M : A(x)} 6= ∅
{x ∈ M : ¬A(x)}) 6= ∅
∃x ∈ M : ¬A(x).
Der Beweis der zweiten Äquivalenz ist analog.
Als Beispiel betrachten wir die (falsche) Aussage “Alle Primzahlen sind ungerade”. Ist A(x) die (für ganze Zahlen erklärte) Aussage “x ist ungerade” und M
die Menge der Primzahlen, so können wir die Aussage “Alle Primzahlen sind ungerade” in der Form “∀x ∈ M : A(x)” schreiben. Die Negation davon ist die (wahre)
Aussage “∃x ∈ M : ¬A(x)”, die wir in Worten als “Es gibt eine Primzahl, die
nicht ungerade ist” ausdrücken können. (Die Aussage ist wahr, da 2 eine gerade
Primzahl ist.) Ein häufiger Fehler ist, als Negation der Aussage “∀x ∈ M : A(x)”
die Aussage “∀x ∈ M : ¬A(x)” anzugeben (“Alle Primzahlen sind gerade.”).
Eine Aussage kann mehrere Quantoren enthalten. Bei verschiedenen Quantoren
kommt es dabei auf die Reihenfolge an. Sei zum Beispiel S die Menge der deutschen
Städte, M die Menge der Menschen und A(x, y) die für x ∈ S und y ∈ M erklärte
Aussage: y besitzt ein Haus in x. So ist die Aussage
∀x ∈ S ∃y ∈ M : A(x, y),
d.h., “Zu jeder Stadt existiert ein Mensch, der dort ein Haus besitzt”, vermutlich
richtig, während
∃y ∈ M ∀x ∈ S : A(x, y),
d.h., “Es existiert ein Mensch, der in jeder deutschen Stadt ein Haus besitzt”,
vermutlich falsch ist. Auf jeden Fall sind beide Aussagen verschieden. Die Negation
der letzten Aussage lässt sich rein formal bilden:
¬(∃y ∈ M ∀x ∈ S : A(x, y))
⇔ ∀y ∈ M : ¬(∀x ∈ S : A(x, y))
⇔ ∀y ∈ M ∃x ∈ S : ¬A(x, y)
Wir erhalten: “Zu jedem Mensch existiert eine Stadt, in der er kein Haus besitzt”.
(Auch wenn sich Verneinungen oder andere Operationen mit Aussagen also auf rein
formalem Wege bilden lassen, so ist es definitiv ratsam und in jedem Fall eine gute
Übung, das Ergebnis “mit dem gesunden Menschenverstand” zu überprüfen.)
8
1 GRUNDLAGEN
Quantoren erlauben auch, Vereinigung und Durchschnitt von unendlich vielen
Mengen zu definieren. Für eine Menge S von Mengen setzen wir
\
M ∈S
M := {x : (∀M ∈ S : x ∈ M)}
und
[
M ∈S
M := {x : (∃M ∈ S : x ∈ M)}.
9
1.5 Relationen und Funktionen
1.5
Relationen und Funktionen
Seien M, N Mengen und R ⊂ M ×N. Dann heißt R Relation (zwischen M und N).
Im Falle M = N nennen wir R auch Relation auf M. Statt (x, y) ∈ R schreiben
wir im allgemeinen xRy. Anstelle von Buchstaben benutzen wir meistens suggestive
Symbole wie ∼, ≃, <, ⊂, usw. zur Bezeichnung von Relationen.
Beispiel. M = N = R, R = {(x, y) ∈ R2 : x2 ≥ y 2}. Es gilt also xRy ⇔ x2 ≥ y 2,
also xRy ⇔ |x| ≥ |y|. Die durch R gegebene Teilmenge von R2 kann auch graphisch
dargestellt werden (Abbildung 1).
Die Regeln von de Morgan gelten dann entsprechend. Mit einer Menge N ist dann
N\
\
M=
[
2
N\M
1
M ∈S
M ∈S
und
N\
[
M=
M ∈S
\
N\M.
–2
–1
2
M ∈S
–1
Neben den Quantoren ∀ und ∃ benutzen wir auch noch das Symbol “∃!” für “es gibt
genau ein”. Die Aussage “∃!x ∈ M : A(x)” ist also definiert durch “{x ∈ M : A(x)}
besteht aus genau einem Element”.
Bemerkung zum Gebrauch von Quantoren. Benützt man die (übliche) Bezeichnung
“m|n” für “m ist Teiler von n”, so kann man die Aussage
(A) Wenn eine natürliche Zahl durch 9 teilbar ist, so ist sie auch durch 3 teilbar
auch in der Form
–2
Abbildung 1: Graphische Darstellung der durch x2 ≥ y 2 gegebenen Relation.
Wir betrachten drei wichtige Spezialfälle.
(a) Äquivalenzrelationen. Sei M Menge, ∼ Relation auf M, also ∼⊂ M × M.
Dann heißt ∼
(B) ∀n ∈ N : 9|n ⇒ 3|n
1
schreiben. Der geübte Mathematiker erkennt sofort, dass es sich hier um die gleiche Aussage handelt, die lediglich in zwei verschiedenen Formen ausgedrückt ist.
In mathematischen Texten (Seminarausarbeitung, Diplom- oder Staatsexamensarbeit, Buch,. . . ) wird man im allgemeinen die Form (A) bevorzugen. Bei Vorträgen
und Vorlesungen wird man aus Zeitgründen häufig die Form (B) wählen – die Quantoren werden also als abkürzende Schreibweise benutzt. Um mit der Schreibweise
vertraut zu machen und um die Diskrepanz zwischen Tafelbild und Vorlesungsskript gering zu halten, wird in diesem Vorlesungsskript die Quantorenschreibweise
häufiger benutzt als dies üblicherweise in einem mathematischen Text der Fall ist.
Um einem gerade bei Studienanfängern verbreiteten Irrglauben entgegenzuwirken, sei ausdrücklich darauf hingewiesen, dass die Schreibweise (B) nicht präziser
(oder “mathematischer”) as (A) ist.
1
1
x
Wer dies auch nach mehreren Monaten Mathematikstudium nicht sofort erkennt, hat nicht
genug geübt.
• reflexiv, falls ∀x ∈ M : x ∼ x,
• symmetrisch, falls ∀x, y ∈ M : x ∼ y ⇒ y ∼ x,
• transitiv, falls ∀x, y, z ∈ M : x ∼ y ∧ y ∼ z ⇒ x ∼ z.
Eine reflexive, symmetrische und transitive Relation heißt Äquivalenzrelation.
Beispiel 1. Die Gleichheitsrelation ist eine Äquivalenzrelation.
Beispiel 2. Sei M die Menge der “Landpunkte” der Erdoberfläche (also die Menge
der Punkte, die nicht im Meer oder anderen Gewässern liegen). Für x, y ∈ M
gelte x ∼ y falls x mit y auf dem Landweg verbunden werden kann. Dann ist ∼
Äquivalenzrelation.
Grundlegende Eigenschaft einer Äquivalenzrelation ∼ auf einer Menge M ist,
dass sie eine Zerlegung von M in disjunkte Teilmengen - die sogenannten Äquivalenzklassen - liefert, so dass für x, y ∈ M genau dann x ∼ y gilt, wenn x, y in
10
1 GRUNDLAGEN
derselben Teilmenge liegen. Formal kann man dies wie folgt ausdrücken:
⇔
∼ ist Äquivalenzrelation auf M
[
∃A ⊂ P (M) :
N =M
11
1.5 Relationen und Funktionen
Satz 1.5.1 Sei M Menge, A ⊂ M und ≺ Halbordnung auf M.
(i) Ein Maximum von A ist auch Supremum von A.
(ii) A besitzt höchstens ein Supremum.
N ∈A
∧ [∀L, N ∈ A : L 6= N ⇒ L ∩ N = ∅]
∧ [∀x, y ∈ M : (x ∼ y ⇔ ∃N ∈ A : x ∈ N ∧ y ∈ N)]
Wir skizzieren den Beweis nur. Für x ∈ M setzen wir [x] := {y ∈ M : x ∼ y}. Sei
nun x, y ∈ M mit x ∼ y. Ist dann z ∈ [y], also y ∼ z, so ist nach Transitivität auch
x ∼ z, also z ∈ [x]. Es folgt [y] ⊂ [x]. Aus Symmetriegründen ist auch [x] ⊂ [y],
also [x] = [y]. Im Falle x 6∼ y (was nach Definition ¬(x ∼ y) bedeuten soll) zeigt
man [x] ∩ [y] = ∅, woraus dann die Behauptung folgt.
Wir werden die Bezeichnung [x] für die Äquivalenzklasse {y ∈ M : x ∼ y}
auch im folgenden verwenden. Man beachte, dass x ∈ [x], da Äquivalenzrelationen
insbesondere symmetrisch sind.
Im obigen Beispiel 1 (Gleichheitsrelation) gilt [x] = {x} für alle x ∈ M. Im
Beispiel 2 nennt man die Äquivalenzklassen (je nach Größe) Erdteil oder Insel.
(b) Ordnungsrelationen. Eine Relation ≺ auf einer Menge M heißt antisymmetrisch (oder identitiv) falls für alle x, y ∈ M aus x ≺ y und y ≺ x folgt, dass x = y
gilt, d. h., falls
∀x, y ∈ M : x ≺ y ∧ y ≺ x ⇒ x = y.
Eine reflexive, antisymmetrische und transitive Relation heißt Halbordnung.
Beispiel 1. M = R, ≺=≤
Beispiel 2. X Menge, M = P (X), ≺=⊂.
Eine Relation ≺ auf M heißt total (oder vollständig), falls für alle x, y ∈ M
mindestens eine der Aussagen x ≺ y und y ≺ x gilt, d. h., falls
∀x, y ∈ M : x ≺ y ∨ y ≺ x.
Eine totale Halbordnung heißt Ordnung. Das Paar (M, ≺) heißt dann geordnete
Menge.
Im obigem Beispiel 1 ist ≤ Ordnung, während ⊂ in Beispiel 2 keine Ordnung
ist, wenn M mindestens zwei Elemente hat. Denn sind a, b ∈ M, a 6= b, so ist
{a} ⊂ P (M) und {b} ⊂ P (M), aber weder {a} ⊂ {b} noch {b} ⊂ {a}.
Sei ≺ Halbordnung auf M und A ⊂ M. Dann heißt A nach oben beschränkt,
falls s ∈ M existiert, so dass a ≺ s für alle a ∈ A gilt. Ein solches s heißt obere
Schranke von A. Eine obere Schranke von A, die in A enthalten ist, heißt Maximum
von A. Eine obere Schranke s von A heißt Supremum (oder kleinste obere Schranke)
von A, wenn für jede obere Schranke t von A gilt, dass s ≺ t.
Beispiel 1. X = {a, b, c}, M = P (X), A = {∅, {a}, {b}}, ≺=⊂. Die Menge {a, b}
ist Supremum, aber kein Maximum von A.
Beispiel 2. M = A = N, ≺=≤. Hier besitzt A kein Supremum.
Beweis. (i) Sei s Maximum von A, d.h., s ist obere Schranke von A und es
gilt s ∈ A. Zu zeigen ist, dass s Supremum ist. Sei dazu t obere Schranke von A.
Zu zeigen ist, dass s ≺ t. Dies gilt aber wegen s ∈ A nach Definition der oberen
Schranke.
(ii) Seien r und s Suprema. Dann gelten sowohl r ≺ s wie auch s ≺ r, also folgt
r = s. Hier und im folgenden wird durch das Symbol das Ende eines Beweises
markiert.
Aus Satz 1.5.1 folgt, dass eine Menge höchstens ein Maximum haben kann.
Wir bezeichnen das Maximum (bzw. Supremum) einer Menge A mit max A (bzw.
sup A), falls es existiert.
Völlig analog definiert man nach unten beschränkt, untere Schranke, Infimum
(größte untere Schranke), inf A, Minimum, min A. Satz 1.5.1 gilt entsprechend.
Eine geordnete Menge (M ≺) heißt ordnungsvollständig, wenn jede nichtleere,
nach oben beschränkte Teilmenge von M ein Supremum besitzt.
Man kann zeigen, dass (M, ≺) genau dann ordnungsvollständig ist, wenn jede
nichtleere, nach unten beschränkte Teilmenge von M ein Infimum besitzt.
Ist ≺ Ordnung auf M, so heißt die durch
≺
x y :⇔ x ≺ y ∧ x 6= y
6=
definierte Relation strikte Ordnung auf M. Für x, y ∈ M gilt dann genau einer der
≺
drei Fälle x ≺
y, x = y oder y 6=
x. Ist umgekehrt ≺
eine transitive Relation mit der
6=
6=
letzten Eigenschaft, so ist ≺
strikte
Ordnung, und die zugehörige Ordnung ≺ ist
6=
durch
≺
x≺y ⇔x y∨x=y
6=
gegeben.
Für M = R, ≺=≤ ist natürlich
auch y > x bzw. y ≥ x.
≺
6
=
=<. Statt x < y bzw. x ≤ y schreiben wir
(c) Funktionen. Eine Relation f zwischen Mengen M und N heißt Funktion
(oder Abbildung) von M nach N (oder in N) falls zu jedem x ∈ M genau ein
y ∈ N mit xf y existiert, d.h., falls
∀x ∈ M∃!y ∈ N : (x, y) ∈ f.
Wir bezeichnen das zu x ∈ N existierende, eindeutig bestimmte y, welches xf y
erfüllt, mit f (x) und nennen es Bild von x (unter f ) oder Wert von f an der Stelle
x. Man muss zwischen der Funktion f (Teilmenge von M × N) und dem Wert f (x)
(Element von N) unterscheiden.
12
1 GRUNDLAGEN
Obwohl eine Funktion f von M nach N also formal nichts anderes als eine
Teilmenge von M × N mit gewissen Eigenschaften ist, ist es oft hilfreich, sich f als
Vorschrift vorzustellen, die jedem Wert x ∈ M sein Bild y ∈ N zuordnet. Dieser
Gedanke kommt auch in den Schreibweisen
f : M → N, f (x) = ...
und
f : M → N, x 7→ ...,
die wir für Funktionen benutzen, zum Ausdruck.
Man kann den obigen Gedanken, sich f als Vorschrift vorzustellen, auch zur
Definition des Funktionsbegriffes verwenden. In diesem Falle würde man {(x, f (x)) :
x ∈ M} als Graph der Funktion f bezeichnen. Wir haben hier die Funktion f über
ihren Graphen definiert, d.h., es gilt f = {(x, f (x)) : x ∈ M}.
Man sollte die Vorstellung, dass eine Funktion f : M → N eine Vorschrift ist,
die jedem x ∈ M ein y ∈ N zuordnet, aber nicht so interpretieren, dass dieses y
auch immer effektiv berechnet werden kann. Beispielsweise ist bei der Funktion
f : N → N, x 7→ größte Primzahl, die x teilt
der Wert f (x) für große x (mit mehreren hundert Stellen) kaum zu berechnen.
Für eine Funktion f : M → N nennen wir M Definitionsbereich und N Zielbereich. Man beachte, dass M durch f eindeutig festgelegt ist, denn M = {x : ∃y :
(x, y) ∈ f )}. Der Zielbereich ist durch die Funktion f (also durch die Menge f )
aber nicht eindeutig festgelegt. Zum Beispiel kann er durch jede Obermenge ersetzt
werden, d.h., ist f Funktion von M nach N und ist N ′ ⊃ N, so ist f auch Funktion
von M nach N ′ .
Sei f Funktion von M nach N, A ⊂ M und B ⊂ N. Dann heißt
f (A) := {f (x) : x ∈ A}
Bild von A (unter f ) und
f −1 (B) := {x ∈ M : f (x) ∈ B}
Urbild von B (unter f ). Das Bild von M, also die Menge f (M), heißt Wertebereich
(von f ). Man beachte, dass die Bezeichnungen hier uneinheitlich sind: in manchen
Büchern wird auch N als Wertebereich bezeichnet. Für y ∈ N schreibt man statt
f −1 ({y}) auch f −1 (y).
Eine Funktion f : M → N heißt injektiv (oder eineindeutig) falls für alle
x, y ∈ M mit x 6= y auch f (x) 6= f (y) gilt, d. h., falls
∀x, y ∈ M : x 6= y ⇒ f (x) 6= f (y).
(Äquivalent zu obiger Implikation ist natürlich ihre Kontraposition: f (x) = f (y) ⇒
x = y). Eine Funktion f : M → N heißt surjektiv (oder Funktion von M auf N)
falls f (M) = N, d.h., falls gilt:
∀y ∈ N∃x ∈ M : f (x) = y.
1.5 Relationen und Funktionen
13
Eine Funktion heißt bijektiv, wenn sie injektiv und surjektiv ist. Ist f : M → N
bijektiv, so gilt
∀y ∈ N∃!x ∈ M : f (x) = y.
Man beachte, dass Surjektivität und damit Bijektivität keine Eigenschaft der Funktion (also Menge) selbst ist, sondern die Angabe eines Zielbereiches erfordert. Bei
Injektivität ist dies nicht der Fall.
Beispiel 1. Die Funktion f : Z → Z, x 7→ x2 , ist weder injektiv noch surjektiv.
Denn wegen f (−1) = f (1) ist sie nicht injektiv, und wegen f −1 (2) = ∅ ist sie nicht
surjektiv.
Beispiel 2. f : Z → Z, x 7→ x3 , ist injektiv aber nicht surjektiv.
√
Beispiel 3. Sei f : N → N, x 7→ größte natürliche Zahl, die nicht größer als x ist.
2
Dann ist f surjektiv, da für jedes y ∈ N zum Beispiel f (y ) = y gilt. Die Funktion
f ist aber nicht injektiv, da zum Beispiel f (1) = f (2).
Man bezeichnet zu einer reellen Zahl x die größte ganze Zahl, die nicht größer
als x ist, auch mit [x]. Durch x 7→ [x] wird damit eine Funktion von R nach Z
definiert. Man nennt [x] auch Gaußklammer
von x. Die Funktion f aus Beispiel 3
√
kann damit als f : N → N, f (x) = [ x], geschrieben werden.
Ist f : M → N bijektiv, so existiert zu jedem y ∈ N genau ein x ∈ M mit
f (x) = y. Damit existiert eine Funktion von N nach M, die jedem y ∈ N dieses
x ∈ M zuordnet. Sie heißt Umkehrfunktion (oder inverse Funktion) von f und wird
mit f −1 bezeichnet. Formal gilt einfach f −1 = {(f (x), x) : x ∈ M} ⊂ N × M.
Seien f : M → N und g : P → Q Funktionen mit f (M) ⊂ P . Dann ist die
Komposition (oder Zusammensetzung) g ◦ f definiert durch
g ◦ f : M → Q, x 7→ g(f (x)).
Sei idM : M → M, x 7→ x die Identität (oder identische Abbildung) einer Menge
M. Ist dann f : M → N bijektiv, so ist f −1 ◦ f = idM und f ◦ f −1 = idN .
Satz 1.5.2 Sei f : M → N Funktion. Dann gilt:
(i) f ist injektiv ⇔ Es existiert g : N → M mit g ◦ f = idM .
(ii) f ist surjektiv ⇔ Es existiert h : N → M mit f ◦ h = idN .
Der Beweis sei als Übung überlassen. Funktionen g, h wie in (i),(ii) nennt man
auch Links- bzw. Rechtsinverse.
Beispiel. Die Funktion f : N → N\{1}, x 7→ x + 1, ist bijektiv und f −1 : N\{1} →
N, x 7→ x − 1.
Sei f : M → N Funktion, L ⊂ M. Die Funktion g : L → N, x 7→ f (x), heißt
Einschränkung (oder Restriktion) von f auf L und wird mit f |L bezeichnet. Ist g
Einschränkung von f , so nennt man f auch Fortsetzung von g. Die Fortsetzung
einer Funktion ist natürlich nicht eindeutig.
Es sei f : M → N Funktion und es sei auf N eine Ordnung gegeben. Dann
heißt f nach oben (bzw. unten) beschränkt, falls f (M) nach oben (bzw. unten)
14
1 GRUNDLAGEN
beschränkte Teilmenge von N ist. Eine nach oben und unten beschränkte Funktion
heißt beschränkt.
Sei nun zusätzlich auch auf M eine Ordnung gegeben. Wir bezeichnen die Ordnung auf M mit ≺M und die auf N mit ≺N . Dann heißt f monoton steigend,
falls
∀x, y ∈ M : x ≺M y ⇒ f (x) ≺N f (y)
15
1.6 Vollständige Induktion
(ii) Es sei n ∈ N und es gelte A(n). Zu zeigen ist, dass A(n + 1) gilt, d.h.
1 + 2 + 3 + ... + n + (n + 1) =
Dies gilt aber wegen
1 + 2 + 3 + ... + n + (n + 1)
und monoton fallend, falls
=
A(n)
=
∀x, y ∈ M : x ≺M y ⇒ f (y) ≺N f (x).
=
Eine monoton steigende bzw. fallende Funktion, die injektiv ist, heißt streng monoton steigend bzw. fallend. Im streng monoton steigenden Fall etwa gilt dann
∀x, y ∈ M : x
≺
≺
f (y)
y ⇒ f (x)
6= N
6= M
Beispiel. f : R → R, x 7→ x2 ist weder monoton fallend noch monoton steigend. Es
ist aber f |{x ∈ R : x ≥ 0} streng monoton steigend und f |{x ∈ R : x ≤ 0} streng
monoton fallend.
1.6
Vollständige Induktion
Wir setzen die natürlichen Zahlen N = {1, 2, 3, ...} als gegeben voraus. Wichtiges
Beweismittel bei Aussagen über natürliche Zahlen ist das
Beweisprinzip der vollständigen Induktion. Es sei für alle n ∈ N eine Aussage A(n) gegeben. Gilt dann
und
(ii) für alle n ∈ N folgt die Wahrheit von A(n + 1) aus der von A(n),
so ist A(n) für alle n ∈ N wahr.
Man nennt dabei (i) den Induktionsanfang und (ii) den Induktionsschluss (oder
Induktionsschritt). Im Induktionsschluss nennt man auch A(n) Induktionsvoraussetzung und A(n+1) Induktionsbehauptung. Formal ausgedrückt lautet das Prinzip
der vollständigen Induktion wie folgt:
[A(1) ∧ (∀n ∈ N : A(n) ⇒ A(n + 1))] ⇒ ∀n ∈ N : A(n).
Beispiel. Man zeige, dass 1 + 2 + 3 + ... + n = n(n+1)
für alle n ∈ N gilt. Sei dazu
2
A(n) die (für natürliche Zahlen n) erklärte Aussage
1 + 2 + 3 + ... + n =
(i) A(1) ist wahr, denn 1 =
1(1+1)
.
2
n(n + 1)
.
2
(1 + 2 + 3 + ... + n) + n + 1
n(n + 1)
+n+1
2
(n + 1)(n + 2)
. 2
Wir haben oben die Stelle, an der die Induktionsvoraussetzung A(n) benutzt
wurde, mit einem entsprechenden Vermerk über dem Gleichheitszeichen markiert.
Dies ist in mathematischen Texten eher unüblich, wird aber als Kurzschreibweise
in Vorlesungen (oder Vorträgen) verwendet.
Ausdrücke der Form f (m)+f
(m+1)+...+f (n) mit m, n ∈ Z, m ≤ n, schreiben
P
wir im folgenden kurz als nk=m f (k). Die oben bewiesene Formel lautet dann
n
X
k=
k=1
n(n + 1)
.
2
Eine analoge Schreibweise gilt für Produkte:
n
Y
k=m
(i) A(1) ist wahr
(n + 1)(n + 2)
2
f (k) := f (m) · f (m + 1) · ... · f (n).
Q
Für n ∈ N definieren wir n! := nk=1 k, gesprochen n Fakultät. Wir setzen außerdem
0! := 1. Für k, n ∈ Z, 0 ≤ k ≤ n, setzen wir
n!
n
:=
,
k
k!(n − k)!
gesprochen n über k. Die Zahlen
n
k
heißen Binomialkoeffizienten.
2n
≥ 2n für alle n ∈ N gilt.
n
2!
1·2
2
=
=
= 2 = 21 gilt die Ungleichung für
Induktionsanfang. Wegen
1
1! · 1!
1·1
n = 1.
2n
≥ 2n . Zu zeigen ist, dass
Induktionsschritt. Sei n ∈ N und es gelte
n
Beispiel. Man zeige, dass
2(n + 1)
n+1
≥ 2n+1 .
16
1 GRUNDLAGEN
Dies folgt aber wegen
2(n + 1)
n+1
=
=
=
=
=
2n + 2
n+1
(2n + 2)!
(n + 1)!(n + 1)!
(2n + 2)(2n + 1)(2n)!
(n + 1)2 (n!)2
2(2n + 1) (2n)!
·
n+1
(n!)2
2(2n + 1)
2n
·
n
n+1
Ind.-Vor. 2(2n + 1) n
·2
≥
n+1
2n + 1 n+1
=
·2
n+1
n+1
≥
2 .
Will man für gegebenes N ∈ Z Aussagen über {n ∈ Z : n ≥ N} beweisen, kann
man dies durch geeignete Modifikation des obigen Prinzips tun (Induktionsanfang
für n = N). Es ist auch möglich, im Induktionsschritt nicht nur die Gültigkeit von
A(n), sondern die von A(k) für alle k ≤ n vorauszusetzen.
1.7
Körper
1.7 Körper
17
Beispiele sind (Q, +, ·), (R, +, ·) sowie (Menge der rationalen Funktionen, +, ·). (Eine rationale Funktion ist ein Quotient von Polynomen.) Statt “(K, +, ·) ist Körper”
sagt man oft auch “K ist Körper”.
Man nennt (A1)-(A4) Axiome der Addition, (M1)-(M4) Axiome der Multiplikation und (D) Distributivgesetz. (A1) und (M1) heißen Kommutativgesetze und
(A2) und (M2) heißen Assoziativgesetze. Insgesamt nennt man die obigen Regeln
die Körperaxiome.
Wir ziehen einige Folgerungen aus den Körperaxiomen.
Satz 1.7.1 Die mit 0 und 1 bezeichneten Elemente sind eindeutig bestimmt.
Beweis. Seien 0 und 0′ Elemente von K mit der in (A3) geforderten Eigenschaft,
d.h., ∀x ∈ K : x + 0 = x und ∀x ∈ K : x + 0′ = x. Zu zeigen ist 0 = 0′ .
Wählt man oben x = 0′ bzw. x = 0, so erhält man 0′ + 0 = 0′ bzw. 0 + 0′ = 0.
Mit (A1) folgt also 0 = 0 + 0′ = 0′ + 0 = 0′ . Analog zeigt man die Eindeutigkeit
der 1. Man beachte, dass zum Beweis der Eindeutigkeit der 0 lediglich (A1) und (A3)
verwandt wurden. Genaugenommen sollte man diesen Beweis erst führen, bevor
man (A4) formuliert. Entsprechendes gilt für (M4).
Satz 1.7.2 Die in (A4) und (M4) genannten Elemente y sind eindeutig.
Beweis. Wir beschränken uns auf (A4). Der Beweis für (M4) ist analog.
Seien y, y ′ ∈ K mit x + y = 0 und x + y ′ = 0. Es folgt x + y = x + y ′ und damit
y + (x + y) = y + (x + y ′). Mit (A2) folgt (y + x) + y = (y + x) + y ′. Wegen (A1)
ist aber y + x = x + y, also y + x = 0. Wir erhalten 0 + y = 0 + y ′ und damit
y = y ′. (A1) ∀x, y ∈ K : x + y = y + x
Wir bezeichnen für x ∈ K das (nach Satz 1.7.2) eindeutig bestimmte y mit
x + y = 0 mit −x. Analog wird für x ∈ K\{0} das eindeutig bestimmte y mit
x · y = 1 mit x−1 oder x1 bezeichnet. Weiter schreiben wir auch a − b statt a + (−b)
und ab oder a/b statt a · 1b .
Sind a, b ∈ K, so existiert ein eindeutig bestimmtes x ∈ K mit a + x = b,
nämlich x = b − a. Analog existiert zu a, b ∈ K\{0} ein eindeutig bestimmtes
x ∈ K mit ax = b, nämlich x = ab . Auf den einfachen Beweis dieser Tatsachen
verzichten wir.
(A2) ∀x, y, z ∈ K : (x + y) + z = x + (y + z)
Satz 1.7.3 Sei K Körper, x, y ∈ K. Dann gilt: xy = 0 ⇔ x = 0 ∨ y = 0.
(A3) ∃0 ∈ K∀x ∈ K : x + 0 = x
Beweis. “⇐”: Wegen xy = yx kann man ohne Beschränkung der Allgemeinheit
(o.B.d.A.) annehmen, dass y = 0 gilt. Zu zeigen ist x · 0 = 0.
Nun ist 0+0 = 0 nach (A3), nach (D) also x0+x0 = x(0+0) = x0. Andererseits
ist nach (A3) auch x0+0 = x0. Wegen der Eindeutigkeit der Lösungen von a+x = b
folgt x0 = 0.
“⇒”: Sei x·y = 0 und x 6= 0. Zu zeigen ist, dass y = 0. (Wir haben eine Aussage
der Form A ⇒ (B ∨ C) zu zeigen, und wir haben benutzt, dass diese äquivalent zu
(A ∧ ¬B) ⇒ C ist.) Nun ist y = y · 1 = y(xx−1 ) = (yx)x−1 = (xy)x−1 = 0 · x−1 =
0. Wir formalisieren jetzt Addition und Multiplikation sowie ihre Eigenschaften.
Definition 1.7.1 Sei K Menge und seien + : K × K → K und · : K → K
Funktionen (wobei wir aber im folgenden x + y statt +((x, y)) und x · y oder xy
statt ·((x, y)) schreiben). Das Tripel (K, +, ·) heißt Körper (englisch: field), falls
die folgenden neun Eigenschaften gelten:
(A4) ∀x ∈ K∃y ∈ K : x + y = 0
(M1) ∀x, y ∈ K : x · y = y · x
(M2) ∀x, y, z ∈ K : (x · y) · z = x · (y · z)
(M3) ∃1 ∈ K\{0}∀x ∈ K\{0} : x · 1 = x
(M4) ∀x ∈ K\{0}∃y ∈ K\{0} : x · y = 1
(D) ∀x, y, z ∈ K : (x + y) · z = x · z + y · z
Wir geben einige weitere Rechenregeln, die leicht aus den Körperaxiomen gefolgert werden können, ohne Beweis an:
18
1 GRUNDLAGEN
(i) ∀x ∈ K : −(−x) = x
(ii) ∀x ∈ K\{0} : (x−1 )−1 = x
(iii) ∀x, y ∈ K : −(x + y) = (−x) + (−y)
(iv) ∀x, y ∈ K\{0} : (xy)−1 = x−1 y −1
(v) ∀x, y ∈ K : (−x)y = −(xy) = x(−y)
Auch einige Rechenregeln, die hier nicht explizit aufgeführt sind, werden im weiteren benutzt werden.
Es sei eine Menge K mit einer “Verknüpfung” + gegeben. Gelten dann (A1)(A4), so heißt das Paar (K, +) kommutative Gruppe (oder abelsche Gruppe).
Ist (K, +, ·) Körper, so ist also (K, +) kommutative Gruppe. Aus (M1)-(M4)
folgt, dass auch (K\{0}, ·) kommutative Gruppe ist. Ist umgekehrt (K\{0}, ·) kommutative Gruppe, so folgen hieraus nicht unmittelbar (M1) und (M2), da dort ja
auch x = 0, y = 0 oder z = 0 zugelassen ist. Setzt man aber voraus, dass (K, +)
und (K\{0}, ·) kommutative Gruppen sind und dass (D) gilt, so folgt wie im Beweis von Satz 1.7.3, dass (M1) und (M2) auch dann gelten, wenn ein Faktor 0
ist. Damit erhält man, dass (K, +, ·) genau dann ein Körper ist, wenn (K, +) und
(K\{0}, ·) kommutative Gruppen sind und (D) gilt. Dies macht die Körperaxiome
einprägsamer. Körper und (kommutative) Gruppen sind Beispiele für algebraische
Strukturen. Eine genauere Untersuchung dieser und anderer Strukturen wie Ring,
Halbgruppe, Schiefkörper, Vektorraum, usw. findet in der (linearen) Algebra statt.
Wir notieren hier noch, dass (K, +, ·) Integritätsbereich heißt, falls alle Körperaxiome bis auf (M4) gelten und außerdem noch
∀x, y ∈ K : xy = 0 ⇒ x = 0 ∨ y = 0
gilt. Die letzte Eigenschaft nennt man Nullteilerfreiheit. Für Körper wurde sie mit
Hilfe von (M4) in Satz 1.7.3 gezeigt. Beispiel eines Integritätsbereichs ist (Z, +, ·).
Exkurs: Konstruktion der rationalen Zahlen. Wir skizzieren, wie man den
Integritätsbereich (Z, +, ·) zu einem Körper erweitern kann. Dazu betrachten wir
die auf Z × Z\{0} durch (a, b) ∼ (c, d) :⇔ ad = bc definierte Relation ∼. Die Idee
dabei ist, (a, b) mit dem Bruch ab zu identifizieren.
Zunächst zeigen wir, dass ∼ Äquivalenzrelation ist. Um etwa die Transitivität
zu zeigen, sei (a, b) ∼ (c, d) und (c, d) ∼ (e, f ). Es ist dann ad = bc und cf = de.
Zu zeigen ist (a, b) ∼ (e, f ), also af = be. Nun ist aber (af − be)d = af d − bed =
(ad)f −(de)b = (bc)f −(cf )b = 0. Wegen d 6= 0 und Nullteilerfreiheit folgt af = be.
Als nächstes definiert man auf der Menge der Äquivalenzklassen [(a, b)] eine
Addition und eine Multiplikation durch
[(a, b)] + [(c, d)] := [(ad + bc, bd)]
und
[(a, b)] · [(c, d)] := [(a · b, c · d)].
19
1.7 Körper
Zunächst muss man jetzt zeigen, dass diese Addition und Multiplikation von Äquivalenzklassen wohldefiniert ist, d.h., nicht von den Repräsentanten der Äquivalenzklassen abhängt.
Sei dazu (a, b) ∼ (a′ , b′ ) und (c, d) ∼ (c′ , d′ ), d. h., ab′ = ba′ und cd′ = dc′ . Dann
ist
(ad + bc)b′ d′ =
=
=
=
adb′ d + bcb′ d′
ab′ dd′ + cd′ bb′
ba′ dd′ + dc′ bb′
bd(a′ d′ + b′ c′ )
also (ad + bc, bd) ∼ (a′ d′ + b′ c′ , b′ d′ ). Analog (aber einfacher) zeigt man die Wohldefiniertheit der Multiplikation von Äquivalenzklassen.
Schließlich zeigt man, dass die Menge der Äquivalenzklassen mit der so definierten Addition und Multiplikation einen Körper bildet, d.h., ({[(a, b)] : a ∈ Z ∧ b ∈
Z\{0}}, +, ·) ist Körper.
Beispielsweise folgt (A1) da [(a, b)] + [(c, d)] = [(ad + bc, bd)] = [(cb + da, db)] =
[(c, d)] + [(a, b)]. Die anderen Körperaxiome sind ebenfalls leicht nachzurechnen.
Dabei ist [(0, 1)] das Nullelement und [(1, 1)] das Einselement, −[(a, b)] = [(−a, b)]
und [(a, b)]−1 = [(b, a)]. Wie bezeichnen den erhaltenen Körper mit (Q, +, ·) und
nennen ihn Körper der rationalen Zahlen.
Man kann eine ganze Zahl n mit der Äquivalenzklasse [(n, 1)] identifizieren.
Denn es gilt [(n, a)] + [(m, 1)] = [(n + m, 1)] und [(n, 1)] · [(m, 1)] = [(n · m, 1)] für
m, n ∈ Z. In diesem Sinne ist Z in Q enthalten.
Für eine formale Beschreibung dieses Sachverhalts betrachtet man die Funktion
i : Z → Q, n 7→ [(n, 1)]. Dann gilt i(n + m) = i(n) + i(m) und i(n · m) = i(n) · i(m).
Außerdem ist i injektiv.
Bemerkungen. 1. Mit dem oben angegebenen Verfahren kann man jeden Integritätsbereich zu einem Körper erweitern, dem sogenannten Quotientenkörper. Ein weiteres Beispiel ist etwa durch den Integritätsbereich der Polynome gegeben, der zum
Körper der rationalen Funktionen erweitert werden kann.
2. Auf ähnliche Weise kann man Z aus N konstruieren. Später werden wir R
aus Q konstruieren. Insgesamt wird so R über Z und Q aus N konstruiert. Zuvor
geben wir aber eine axiomatische Beschreibung von R.
Definition 1.7.2 Sei (K, +, ·) Körper und sei ≤ Ordnung auf K, d.h., (K, ≤) ist
geordnete Menge. Dann heißt (K, +, ·, ≤) angeordneter Körper, falls gilt:
(O1) ∀x, y, z ∈ K : x ≤ y ⇒ x + z ≤ y + z,
(O2) ∀x, y ∈ K : 0 ≤ x ∧ 0 ≤ y ⇒ 0 ≤ xy.
Man nennt (O1) und (O2) die Ordnungsaxiome.
Beispiele angeordneter Körper sind Q und R. (Wir schreiben statt (K, +, ·, ≤)
oft wieder nur K.)
Sei K angeordneter Körper. Wir schreiben wieder x < y oder y > x statt
(x ≤ y ∧ x 6= y) und auch y ≥ x statt x ≤ y. Wir nennen x ∈ K positiv falls x > 0
und negativ falls x < 0.
20
1 GRUNDLAGEN
Aus den Körper- und Ordnungsaxiomen (und den Eigenschaften der Ordnung)
erhält man die folgenden Regeln. Dabei sind x, y, u, v, a ∈ K.
(i) x ≤ y ⇔ x − y ≤ 0 ⇔ y − x ≥ 0,
(iv) |x · y| = |x| · |y|
(v) |x + y| ≤ |x| + |y|
(vi) ||x| − |y|| ≤ |x − y|
(ii) x ≤ y ∧ u ≤ v ⇒ x + u ≤ y + v,
(iii) a ≥ 0 ∧ x ≤ y ⇒ ax ≤ ay,
(iv) x ≤ 0 ⇒ −x ≥ 0,
(v) xy > 0 ⇔ (x > 0 ∧ y > 0) ∨ (x < 0 ∧ y < 0),
(vi) x2 ≥ 0,
(vii) x 6= 0 ⇒ x2 > 0,
Regel (v) heißt Dreiecksungleichung. Zu ihrem Beweis beachte man, dass x ≤ |x|
und y ≤ |y| nach (iii). Es folgt x + y ≤ |x| + |y|. Weiter ist −x ≤ | − x| =
|(−1) · x| = | − 1| · |x| = −(−1) · |x| = 1 · |x| = |x| und analog −y ≤ |y|. Wir
erhalten −(x + y) = −x + (−y) ≤ |x| + |y|. Insgesamt folgt x + y ≤ |x| + |y| und
−(x + y) ≤ |x| + |y|. Hieraus folgt die Behauptung. (Wir haben (iii) im Beweis von
(v) benutzt. Natürlich muss man sich noch überzeugen, dass (iii) ohne Zuhilfenahme
von (v) bewiesen werden kann, aber dies ist leicht zu sehen.)
Definition 1.7.3 Ein angeordneter Körper (K, +, ·, ≤) heißt vollständig, falls die
geordnete Menge (K, ≤) ordnungsvollständig ist.
(viii) 1 > 0,
(ix) x > 0 ⇒ x−1 > 0,
(x) x > y > 0 ⇒ (y −1 > x−1 ) ∧ (xy −1 > 1).
Dabei ist in (vi) natürlich x2 := x · x. Allgemeiner ist
xn := x
· ... · x}
| · x {z
n − mal
für n ∈ N.
Zum Beweis von (i) braucht man nur (O1) mit z = −y bzw. z = −x verwenden.
Regel (ii) folgt durch zweimalige Anwendung von (O1) und (A1):
x + u ≤ y + u = u + y ≤ v + y = y + v.
Um (iii) zu zeigen, beachten wir zunächst, dass y − x ≥ 0 nach (i). Mit (O2)
folgt a(y − x) ≥ 0, also ay − ax ≥ 0 wegen (D). Mit (i) folgt schließlich ax ≤ ay.
Wir verzichten auf die (einfachen) Beweise von (iv)-(x). Es gibt auch noch
viele weitere Rechenregeln, die wir gelegentlich benutzen werden, aber hier nicht
ausdrücklich aufführen.
Wir definieren für x ∈ K
|x| :=
x,
−x,
falls x ≥ 0
falls x < 0
und nennen |x| den Betrag von x. Für x, y ∈ K gelten dann die folgenden Rechenregeln:
(i) |x| ≥ 0
21
1.8 Reelle Zahlen
In einem vollständigen angeordneten Körper besitzt also jede nach oben beschränkte Menge ein Supremum. Das Supremum lässt sich in Körpern auch wie folgt charakterisieren.
Satz 1.7.4 Sei (K, +, ·, ≤) angeordneter Körper und A nach oben beschränkte Teilmenge von K. Sei s eine obere Schranke A. Dann ist s Supremum von A genau
dann, wenn zu jedem ε > 0 ein x ∈ A existiert, so dass s − ε < x, d.h.
∀ε > 0∃x ∈ A : s − ε < x.
(∗)
Beweis: “⇒”: Wir führen den Beweis indirekt (genauer: durch Kontraposition) und
nehmen an, dass (∗) nicht gilt. Es folgt
∃ε > 0∀x ∈ A : s − ε ≥ x,
d.h.
∃ε > 0 : s − ε ist obere Schranke von A.
Da aber s − ε < s falls ε > 0, ist s also kein Supremum von A.
“⇐”: Es gelte (∗) und es sei s′ obere Schranke von A. Zu zeigen ist, dass s′ ≥ s.
Wir nehmen an, dass dies nicht gilt. Dann ist s′ < s und damit ε := s − s′ > 0.
Nach (∗) existiert x ∈ A mit x > s − ε = s′ . Dies ist ein Widerspruch, da s′ obere
Schranke von A.
1.8
Reelle Zahlen
(ii) |x| = 0 ⇔ x = 0
Grundlegend für die Analysis ist das folgende Resultat.
(iii) |x| ≥ x
Satz 1.8.1 Es gibt einen vollständigen angeordneten Körper.
22
1 GRUNDLAGEN
Wir werden später einen Beweis dieses Satzes skizzieren, indem wir andeuten werden, wie man den angeordneten Körper der rationalen Zahlen “vervollständigen”
kann. Den so erhaltenen vollständigen angeordneten Körper nennen wir den Körper
der reellen Zahlen und bezeichnen ihn mit (R, +, ·, ≤), kurz auch R.
Darüberhinaus kann man sogar zeigen, dass die reellen Zahlen im wesentlichen
der einzige vollständige angeordnete Körper sind: ist (K, +K , ·K , ≤K ) ein vollständiger angeordneter Körper, so existiert eine bijektive Funktion f : K → R mit
f (x +K y) = f (x) + f (y), f (x ·K y) = f (x) · f (y) und x ≤K y ⇔ f (x) ≤ f (y) für
alle x, y ∈ K. Wir verzichten hier auf einen Beweis dieser Tatsache. Stattdessen
entwickeln wir die Theorie des vollständige angeordneten Körpers (R, +, ·, ≤) anhand der in §1.7 gegebenen Körper- und Ordnungsaxiome sowie der Vollständigkeit.
Dabei betrachten wir N, Z und Q als Teilmengen von R:
n = |1 + 1 +{z· · · + 1},
n − mal
m
= m · n−1 .
n
Beweisprinzips der vollständigen Induktion also A = N gelten. Formal sieht dieser
Schluss wie folgt aus:
⇔
⇔
⇔
1∈A
⇒
¬(∃k ∈ N : k ∈ A ∧ k + 1 ∈
/ A)
∀k ∈ N : ¬(k ∈ A ∧ k + 1 ∈
/ A)
∀k ∈ N : k ∈
/ A∨k+1∈A
∀k ∈ N : k ∈ A ⇒ k + 1 ∈ A
A = N.
Sei nun also k ∈ A mit k + 1 ∈
/ A. Dann ist k untere Schranke von M wegen k ∈ A.
Wegen k + 1 ∈
/ A existiert m ∈ M mit m < k + 1. Da aber auch k ≤ M gilt, und
zwischen k und k + 1 keine natürliche Zahl liegt, folgt k = m, also k ∈ M. Damit
ist k Minimum von M. Wir haben im Beweis die Behauptung auf die folgende Aussage reduziert: jede
nichtleere Teilmenge von N besitzt ein Minimum. Hierzu sagt man auch: N ist
wohlgeordnet.
Den folgenden Satz drückt man auch mit den Worten “Q ist dicht in R” aus.
Satz 1.8.2 N ist nicht nach oben beschränkt (in R).
Beweis. Wir führen einen Widerspruchsbeweis und nehmen an, dass N nach oben
beschränkt ist. Sei s = sup N. Dann gilt n ≤ s für alle n ∈ N. Nach Satz 1.7.4
existiert N ∈ N mit N > s − 1. Es folgt N + 1 > s. Dies ist ein Widerspruch, da
N + 1 ∈ N. Folgerung 1.8.1 Seien a, b ∈ R, a > 0. Dann existiert n ∈ N mit na > b.
Beweis. Andernfalls gilt na ≤ b und damit n ≤ b/a für alle n ∈ N, im Widerspruch
zu Satz 1.8.2. Folgerung 1.8.2 Sei a ∈ R, a > 0. Dann existiert n ∈ N mit
23
1.8 Reelle Zahlen
1
n
< a.
Beweis. Man wende Folgerung 1.8.1 mit b = 1 an. Satz 1.8.2 und die beiden Folgerungen daraus heißen Satz des Archimedes oder
Satz des Eudoxos; die Bezeichnungen sind hier uneinheitlich.
Satz 1.8.3 Es sei M ⊂ Z, M 6= ∅. Weiter sei M nach oben (bzw. unten) beschränkt. Dann hat M ein Maximum (bzw. Minimum).
Beweis. Wir betrachten nur den Fall, dass M nach unten beschränkt ist. Der andere
Fall ist analog. Weiter kann man annehmen, dass M ⊂ N gilt, dass also 1 untere
Schranke von M ist. (Denn ist M ⊂ Z und s ∈ Z untere Schranke, so betrachten
wir M ′ := {n − s + 1 : n ∈ M}. Dann ist M ′ ⊂ N und ist µ Minimum von M ′ , so
ist µ + s − 1 Minimum von M.)
Wir betrachten die Menge A aller natürlichen Zahlen, die untere Schranke von
M sind, also A = {n ∈ N : (∀m ∈ M : n ≤ m)}. Dann ist 1 ∈ A wegen M ⊂ N.
Andererseits ist A nach oben beschränkt, da jedes Element von M obere Schranke
von A ist. Nach Satz 1.8.2 gilt damit A 6= N.
Damit existiert aber k ∈ N, so dass k ∈ A und k+1 ∈
/ A. Denn andernfalls würde
für alle k ∈ N die Aussage k ∈ A die Aussage k + 1 ∈ A implizieren, aufgrund des
Satz 1.8.4 Seien a, b ∈ R, a < b. Dann existiert r ∈ Q mit a < r < b.
Beweis. Es ist b − a > 0 und damit existiert nach Folgerung 1.8.2 ein n ∈ N mit
1
< b − a. Wir betrachten die Menge M := {k ∈ Z : k > na}. Nach Satz 1.8.2 gilt
n
dann M 6= ∅. Außerdem ist M nach unten (durch na) beschränkt. Nach Satz 1.8.3
. Außerdem ist
hat M also ein Minimum m. Es gilt dann m > na und damit a < m
n
m − 1 ≤ na und damit m ≤ na + 1, also m
≤ a + n1 < a + (b − a) = b. Also leistet
n
r := m
das Verlangte. n
Wir führen einige Bezeichnungen ein. Seien dazu a, b ∈ R, a < b. Dann heißen
• (a, b) := {x ∈ R : a < x < b} offenes Intervall,
• [a, b] := {x ∈ R : a ≤ x ≤ b} abgeschlossenes Intervall,
• (a, b] := {x ∈ R : a < x ≤ b} und [a, b) := {x ∈ R : a ≤ x < b} halboffene
Intervalle.
Bei Mengen der Form {x ∈ R : a < x} setzen wir formal b = ∞ und bezeichnen
auch sie als offenes Intervall, also (a, ∞) := {x ∈ R : a < x}. Analog definiert
man das offene Intervall (−∞, b) sowie die abgeschlossenen Intervalle [a, ∞) und
(−∞, b]. Wir bezeichnen (−∞, ∞) := R sowohl als offenes Intervall wie auch als
abgeschlossenes Intervall. Weiter setzen wir noch R+ := (0, ∞).
Man beachte, dass wir für offene Intervalle und geordnete Paare die gleiche
Notation verwenden! Dies sollte aber nicht zu Missverständnissen führen. Eine
andere übliche Notation für das offene Intervall (a, b) ist ]a, b[, mit einer analogen
Notation für halboffene Intervalle.
In der jetzt eingeführten Terminologie lautet Satz 1.8.4 etwa: Ist I offenes Intervall, so gilt I ∩ Q 6= ∅.
Satz 1.8.5 Q ist nicht vollständig.
24
1 GRUNDLAGEN
Beweis. Sei M := {x ∈ Q : x2 ≤ 2}. Dann ist M 6= ∅ (etwa 0 ∈ M) und M ist
nach oben beschränkt (etwa durch 2). Wir nehmen an, dass Q vollständig ist. Dann
besitzt M ein Supremum s ∈ Q. Wegen 0 ∈ M gilt s ≥ 0.
Wir zeigen zunächst, dass s2 = 2 gilt. Dazu nehmen wir an, dass s2 < 2. Dann
2
, 1} > 0 und nach Satz 1.8.4 existiert r ∈ (s, s + m) ∩ Q. Es folgt
ist m := min{ 2−s
2s+1
2 − s2
2 − s2
+
= 2,
r 2 < (s + m)2 = s2 + 2sm + m2 ≤ s2 + 2sm + m ≤ s2 + 2s
2s + 1 2s + 1
also r ∈ M und s < r, im Widerspruch zu s = sup M. Ähnlich führt man s2 > 2
zum Widerspruch. Es gilt also s2 = 2.
Wegen s ∈ Q existieren p, q ∈ Z, q 6= 0, mit s = pq . Man kann annehmen, dass
p und q teilerfremd sind, insbesondere also, dass p und q nicht beide gerade sind.
2
Wegen 2 = s2 = pq2 gilt p2 = 2q 2 . Dies impliziert, dass p2 gerade ist. Damit ist aber
auch p gerade, etwa p = 2n mit n ∈ Z. Es folgt, dass 2q 2 = p2 = (2n)2 = 4n2 ,
also q 2 = 2n2 . Dies impliziert aber, dass q 2 und damit q gerade ist. Dies ist ein
Widerspruch. Bemerkung. Die Menge M aus dem obigen Beweis besitzt wegen der Vollständigkeit von R ein Supremum s ∈ R, und das obige √
Argument zeigt, dass s2 = 2 gilt.
Wir bezeichnen diese reelle Zahl s natürlich mit 2.
Diese Idee benutzt man allgemeiner zur Definition rationaler Potenzen.
Definition 1.8.1 Seien m, n ∈ N und a ∈ R+ . Man setzt
√
√
m
m
1
n
a := sup{x ∈ R : xn ≤ a}, a n := n am , a− n := m
an
√
√
sowie a0 := 1 und a := 2 a.
√ n
Ähnlich wie im Beweis
von Satz 1.8.5 zeigt man ( n a) = a. Darüberhinaus
√
sieht man leicht, das n a die einzige√positive reelle Zahl ist, deren n-te Potenz a
m
ist, d. h., {x ∈ R : xn = a} = { n a}. Desweiteren zeigt man leicht, dass a n
wohldefiniert ist, d. h., dass für
m
n
=
m′
n′
m
m′
auch a n = a n′ gilt.
Satz 1.8.6 Seien a, b ∈ R+ und r, s ∈ Q. Dann gilt
25
1.8 Reelle Zahlen
Definition 1.8.2 Es sei M Menge, M 6= ∅.
• M heißt endlich, falls es ein n ∈ N und eine Bijektion (d. h., eine bijektive
Abbildung) φ : {1, . . . , n} → M gibt.
• M heißt abzählbar, falls es eine Bijektion φ : N → M gibt.
• M heißt höchstens abzählbar, falls M endlich oder abzählbar ist.
• M heißt überabzählbar, falls M nicht endlich oder abzählbar ist.
Satz 1.8.7 Q ist abzählbar.
Beweisskizze. Wir beginnen mit 0, durchlaufen die Zahlen m
mit m, n ∈ N wie in
n
hinter m
ein.
dem folgenden Schema angedeutet und fügen die Zahl − m
n
n
1
1
1
2
1
2
3
4
5
...
↓
1
3
1
4
↓
1
5
→
ւ
ր
ւ
ր
2
2
1
2
3
1
2
3
3
ր
ւ
ր
2
5
3
2
→
ւ
ր
4
4
2
5
5
ր
5
2
4
3
5
3
3
4
1
5
4
3
5
4
5
1
1
...
...
...
Bereits einmal durchlaufene Zahlen lassen wir weg und kommen so zu folgender
Anordnung der rationalen Zahlen:
1 1 1 1
3 3
0, 1, −1, 2, −2, , − , , − , 3, −3, 4, −4, , − , . . .
2 2 3 3
2 2
(i) ar as = ar+s ,
(ii) (ar )s = ars ,
Die durch φ(1) = 0, φ(2) = 1, φ(3) = −1, φ(4) = 2, . . . definierte Funktion φ : N →
Q ist dann bijektiv. (iii) (ab)r = ar br ,
r
r
(iv) ab = abr ,
Satz 1.8.8 R ist überabzählbar.
(v) a < b ∧ r > 0 ⇒ ar < br und a < b ∧ r < 0 ⇒ ar > br ,
r
s
(vi) r < s ∧ a > 1 ⇒ a < a
r
s
und r < s ∧ a < 1 ⇒ a > a .
Der Beweis sei als Übung überlassen. Man kann die Idee in Definition 1.8.1 auch
benutzen, um die Potenz ax für a ∈ R+ und x ∈ R durch ax := sup{ar : r ∈ Q∧r ≤
x} zu definieren. Wir werden dies später (in §2.5) auf etwas anderem Wege tun.
Mit Hilfe der folgenden Definition werden wir einen weiteren wichtigen Unterschied zwischen Q und R beschreiben.
Bevor wir diesen Satz beweisen, formulieren wir folgendes Resultat.
Satz 1.8.9 Für alle n ∈ N sei ein beschränktes, abgeschlossenes Intervall I(n)
gegeben, d. h., es sei I eine Abbildung von N in die Menge der beschränkten, abgeschlossenen Intervalle. Für alle n ∈ N sei I(n + 1) ⊂ I(n). Dann gilt
∞
\
n=1
I(n) 6= ∅.
26
1 GRUNDLAGEN
T∞
Der Beweis sei als Übung überlassen.
T (In der Formulierung des Satzes ist n=1 I(n)
eine abkürzende Schreibweise für I∈{I(N)} I. Entsprechende Schreibweisen werden
wir im folgenden häufiger benutzen.)
Oft wird die in Satz 1.8.9 angegebene Eigenschaft auch als Definition der
Vollständigkeit genommen (anstelle der Eigenschaft, dass jede nichtleere, nach oben
beschränkte Menge ein Supremum besitzt). Dies führt aber zu einem anderen Vollständigkeitsbegriff, und zur Charakterisierung von R muss dann noch eine der Aussagen von Satz 1.8.2, Folgerung 1.8.1 oder Folgerung 1.8.2 hinzugenommen werden.
Die hinzugenommene Aussage wird dann als Archimedisches Axiom bezeichnet.
Beweis von Satz 1.8.8. Sei φ : N → R. Dann existiert ein abgeschlossenes Intervall
I(1) mit φ(1) ∈
/ I(1). Weiter existiert ein abgeschlossenes Intervall I(2) ⊂ I(1)
mit φ(2) ∈
/ I(2). Induktiv erhält man für jedes n ∈ N, n ≥ 2, ein
T abgeschlossenes
Intervall I(n) ⊂ I(nT− 1) mit φ(n) ∈
/ I(n). Nach Satz 1.8.9 ist ∞
n=1 I(n) 6= ∅ und
damit existiert s ∈ ∞
n=1 I(n).
Für alle n ∈ N gilt damit s ∈ I(n), wegen φ(n) ∈
/ I(n) also s 6= φ(n). Es folgt
s∈
/ φ(N). Daher ist φ nicht surjektiv. 1.9
Komplexe Zahlen
Historisch tauchten komplexen Zahlen zuerst im 16. Jahrhundert bei der Lösung
kubischer Gleichungen durch del Ferro, Tartaglia und
auf. So hat die
p Cardano
√
Gleichung x3 = 6x + 2 drei reelle Lösungen. Mit y := 3 1 + −7 ist x := y + 2/y
eine Lösung, denn
3
x
=
2
y+
y
3
12
8
+ 3
y
y
√
2
8
√
+
= 1 + −7 + 6 y +
y
1 + −7
√
√
8(1 − −7)
√
√
= 1 + −7 + 6x +
(1 + −7)(1 − −7)
√
√
= 1 + −7 + 6x + 1 − −7
= 6x + 2.
p
√
√
All dies gilt natürlich nur dann, wenn man die Objekte −7 und 3 1 + −7 mit
Sinn füllen kann und die üblichen Rechenregeln dafür gelten. Außerdem ist alles
andere als klar, dass es sich bei obigem Ausdruck für x um eine reelle Zahl handelt
und wie man diese gegebenenfalls berechnet.
Die Idee ist also, den Körper R der reellen Zahlen so zu erweitern, dass Gleichungen wie x2 + 1 = 0 eine Lösung haben. Ist etwa i eine Lösung dieser Gleichung,
also i2 = −1, so kann man Elemente der Form a + ib mit a, b ∈ R betrachten.
Für a, b, c, d ∈ R erhält man, wenn man die üblichen Rechenregeln als gegeben
hinnimmt, und zusätzlich die Regel i2 = −1 benutzt, dann (a + ib) · (c + id) =
ac + aid + ibc + i2 bd = ac − bd + i(ad + bc).
= y 3 + 6y +
27
1.9 Komplexe Zahlen
Formal geht man wie folgt vor: auf R2 = R × R definieren wir eine Addition
“+” und eine Multiplikation “·” wie folgt:
(a, b) + (c, d) := (a + c, b + d),
(a, b) · (c, d) := (ac − bd, ad + bc).
Es gilt dann, dass (R2 , +, ·) Körper ist. Dabei ist (0, 0) das Nullelement und (1, 0)
das Einselement.
Wir verzichten darauf, alle Körperaxiome nachzuweisen, sondern beschränken
uns exemplarisch auf zwei, nämlich (M4) (Existenz des multiplikativen Inversen)
und (D) (Distributivgesetz).
Nachweis von (M4). Sei (a, b) ∈ R2 , (a, b) 6= (0, 0). Dann ist a2 + b2 > 0 und es
gilt
a
a
−b
−b
−b
a
(a, b) ·
=
a
,
−
b
,
a
+
b
a2 + b2 a2 + b2
a2 + b2
a2 + b2 a2 + b2
a2 + b2
2
2
a + b −ab + ab
,
=
a2 + b2 a2 + b2
= (1, 0).
Es gilt also
(a, b)−1 =
a
−b
,
a2 + b2 a2 + b2
.
Nachweis von (D). Seien a, b, c, d, e, f ∈ R. Dann gilt
((a, b) + (c, d)) · (e, f ) =
=
=
=
=
(a + c, b + d) · (e, f )
((a + c)e − (b + d)f, (a + c)f + (b + d)e)
(ae − bf + ce − df, af + be + cf + de)
(ae − bf, af + be) + (ce − df, cf + de)
(a, b) · (e, f ) + (c, d) · (e, f )
Wir nennen den erhaltenen Körper den Körper der komplexen Zahlen und bezeichnen ihn mit (C, +, ·) oder kurz auch C. (Es gilt also C = R2 !)
Weiter zeigt man leicht, dass ({(a, 0) : a ∈ R}, +, ·) ein Teilkörper von (C, +, ·)
ist. Dieser Teilkörper ist “isomorph” zum Körper (R, +, ·), denn die Abbildung
φ : R → {(a, 0) : a ∈ R}, a 7→ (a, 0) ist bijektiv und erfüllt φ(a + b) = φ(a) + φ(b)
und φ(a · b) = φ(a) · φ(b) für a, b ∈ R.
Wir identifizieren daher die reelle Zahl a mit der komplexen Zahl (a, 0) und
betrachten in diesem Sinne die reellen Zahlen als Teilmenge von C. Weiter setzen
wir i := (0, 1). Es gilt dann i2 = (0, 1) · (0, 1) = (−1, 0) = −1 und i · a = (0, 1) ·
(a, 0) = (0, a) für a ∈ R. Damit ist (a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1) · (b, 0) =
a + ib für a, b ∈ R. Im allgemeinen schreiben wir komplexe Zahlen in der letzten
Form.
Wir führen einige weitere Bezeichungen ein. Dazu seien x, y ∈ R und damit
z := (x, y) = x + iy ∈ C. Wir nennen x den Realteil von z und y den Imaginärteil
von z. Dafür benutzen wir die Notation x = Re z und y = Im z.
28
1 GRUNDLAGEN
p
Weiter heißt z := x − iy die zu z konjugiert komplexe Zahl und |z| := x2 + y 2
der Betrag von z. (Man beachte, dass für z ∈ R der hier definierte Betrag mit dem
vorher definierten übereinstimmt.) Wir stellen einige Rechenregeln zusammen, die
für alle z, w ∈ C gelten.
(i) |z| ≥ 0
(ii) |z| = 0 ⇔ z = 0
(iii) z + w = z + w
(iv) z · w = z · w
(v) z + z = 2Re z
(vi) z − z = 2iIm z
(vii) z = z ⇔ z ∈ R
(viii) z · z = |z|2
(ix) z 6= 0 ⇒ z −1 = 1 2 z
|z|
29
1.9 Komplexe Zahlen
und damit |z · w| = |z| · |w|.
zu (xiv): Es ist
|z + w|2 =
=
=
=
=
≤
=
=
(z + w)(z + w)
(z + w)(z + w)
zz + zw + wz + ww
|z|2 + zw + zw + |w|2
|z|2 + 2Re(zw) + |w|2
|z|2 + 2|zw| + |w|2
|z|2 + 2|z| · |w| + |w|2
(|z| + |w|)2
und damit |z + w| ≤ |z| + |w|.
Identifizieren wir die komplexe Zahl z = x + iy = (x, y) ∈ C = R2 mit dem
Punkt der Ebene mit Koordinaten x und y, so können wir die Addition komplexer Zahlen geometrisch deuten. Sie entspricht der Addition von Vektoren; siehe
Abbildung 2. Der Betrag |z| ist der Abstand von z zum Ursprung des Koordinatensystems.
3
(x) |z| = |z|
z+w
(xi) |Re z| ≤ |z|
2
w
(xii) |Im z| ≤ |z|
1
(xiii) |z · w| = |z| · |w|
(xiv) |z + w| ≤ |z| + |w| (Dreiecksungleichung)
–2
–1
0
z
1
2
(xv) ||z| − |w|| ≤ |z − w|
Wir beweisen hier nur einige der obigen Rechenregeln. Dazu sei z = x + iy und
w = u + iv, mit x, y, u, v ∈ R.
zu (iv):
zw =
=
=
=
=
=
(x + iy)(u + iv)
xu − yv + i(xv + yu)
xu − yv − i(xv + yu)
xu − (−y)(−v) + i(x(−v) + (−y)u)
(x − iy)(u − iv)
zw
zu (viii): zz = (x + iy)(x − iy) = x2 + y 2 = |z|2
zu (xiii): Nach den gerade bewiesenen Rechenregeln ist
|z · w|2 = z · w · z · w = z · w · z · w = z · z · w · w = |z|2 · |w|2
–1
Abbildung 2: Geometrische Interpretation der Addition komplexer Zahlen.
Auch die Multiplikation komplexer Zahlen kann geometrisch gedeutet werden.
Dies wird erst später erfolgen.
Satz 1.9.1 Sei w ∈ C. Dann existiert ein z ∈ C mit z 2 = w.
√
Beweis. Ist w ∈ R, w ≤ 0, so hat z = i −w die gewünschte Eigenschaft. Andernfalls gilt |w| + Re w > 0 und (zur Übung empfohlenes!) Nachrechnen zeigt,
dass
|w| + w
z=√ p
2 |w| + Re w
die geforderte Eigenschaft hat. 30
2 FOLGEN UND REIHEN
Allgemeiner zeigt man (durch quadratische Ergänzung), dass für beliebige a, b ∈
C die Gleichung z 2 + az + b = 0 eine Lösung hat. Noch allgemeiner gilt der folgende
Satz.
Satz 1.9.2 (Fundamentalsatz der Algebra) Sei n ∈ N und sei p ein Polynom
vom Grad n, das heißt, es existieren a0 , a1 , . . . , an ∈ C mit an 6= 0, so dass p(z) =
an z n + an−1 z n−1 + · · ·+ a1 z + a0 für z ∈ C gilt. Dann existiert z1 ∈ C mit p(z1 ) = 0.
31
2.1 Folgen
Beweis. Seien m, n ∈ N mit m ≤ n. Zu zeigen ist, dass an ≤ am . Nun gilt aber
m+1
n+1
≤
n
m
⇔ (n + 1)m ≤ (m + 1)n
⇔ nm + m ≤ mn + n
⇔ m ≤ n. an ≤ am ⇔
Einen Beweis dieses Satzes lernt man z. B. in einer Einführung in die Funktionentheorie kennen, wie sie i. a. in der Analysis IV geboten wird.
Sind p und z1 wie in Satz 1.9.2, so existiert ein Polynom vom Grad n − 1,
so dass p(z) = (z − z1 )p1 (z) für z ∈ C. Ist n ≥ 2, so kann Satz 1.9.2 auf p1
angewendet werden, und induktiv erhält man, dass z1 , z2 , . . . , zn ∈ C existieren, so
dass p(z) = an (z − z1 ) · (z − z2 ) · . . . · (z − zn ).
Genauso sieht man, dass (an ) sogar streng monoton fallend ist.
Behauptung 2. (an ) ist beschränkt.
Beweis. (i) Da (an ) monoton fallend ist, gilt an ≤ a1 = 2 für alle n ∈ N. Also ist 2
obere Schranke von (an ) und damit ist (an ) nach oben beschränkt.
(ii) Sei n ∈ N. Dann ist n+ 1 > n, also an = n+1
> 1. Also ist 1 untere Schranke
n
von (an ) und damit ist (an ) nach unten beschränkt.
Aus (i) und (ii) folgt, dass (an ) beschränkt ist. Satz 1.9.3 Der Körper (C, +, ·) kann nicht angeordnet werden.
Im obigen Beispiel ist an nahe dem Wert 1, wenn n groß ist. Wir präzisieren
diesen Gedanken in der folgenden Definition.
Beweis. Es sei ≤ Ordnung und < die zugehörige strikte Ordnung. Dann ist 0 <
i2 = −1 und 0 < 12 = 1. Es folgt 0 < −1 + 1 = 0. Widerspruch! 2
2.1
Folgen und Reihen
Folgen
Definition 2.1.1 Eine Funktion mit Definitionsbereich N heißt Folge. Falls außerdem der Zielbereich R oder C ist, heißt sie (reelle bzw. komplexe) Zahlenfolge.
Sei M Menge und f : N → M Folge. Für n ∈ N schreiben wir statt f (n) im
allgemeinen fn . Wir bezeichnen die Folge f mit (fn )n∈N oder kurz auch einfach mit
(fn ). Gelegentlich schreiben wir auch (f1 , f2 , f3 , . . . ). Jede reelle Zahlenfolge kann
auch als komplexe Zahlenfolge betrachtet werden.
Manchmal werden wir für ein N ∈ Z und eine Menge M auch Funktionen
f : {n ∈ Z : n ≥ N} → M betrachten. Wir werden auch diese (Zahlen)folgen
nennen und mit (fn )n≥N bezeichnen.
Begriffe wie “injektiv” sind, da sie für Funktionen definiert sind, insbesondere
auch für Folgen erklärt. Begriffe wie “(nach oben/unten) beschränkt” oder “(streng)
monoton fallend/steigend” definiert man für reelle Zahlenfolgen, indem man auf N
und R die Ordnung “≤” zugrunde legt.
Eine komplexe Zahlenfolge (an ) heißt beschränkt, falls die reelle Zahlenfolge
(|an |) beschränkt ist. (Dabei kommt es natürlich nur darauf an, dass (|an |) nach
oben beschränkt ist, denn nach unten ist diese Folge immer durch 0 beschränkt).
Beispiel. Wir betrachten die reelle Zahlenfolge (an ) wobei an =
ist also (an ) = (2, 23 , 34 , 54 , . . . ).
Behauptung 1. (an ) ist monoton fallend.
n+1
n
für n ∈ N. Es
Definition 2.1.2 Sei (an ) (komplexe) Zahlenfolge. Dann heißt (an ) konvergent,
falls a ∈ C mit folgender Eigenschaft existiert:
Zu jedem ε > 0 existiert ein N ∈ N, so dass |an − a| < ε für alle n ∈ N mit
n ≥ N.
Wir schreiben in diesem Falle a = limn→∞ an oder an → a (für n → ∞) und
sagen, dass (an ) gegen a konvergiert. Wir nennen a den Grenzwert der Folge (an ).
Eine Zahlenfolge, die nicht konvergent ist, heißt divergent.
Es ist nützlich, die Definition der Konvergenz noch einmal mit Quantoren zu
schreiben. Es ist (an ) konvergent, falls gilt:
∃a ∈ C ∀ε ∈ R+ ∃N ∈ N ∀n ∈ N : n ≥ N ⇒ |an − a| < ε.
Die Idee bei der Definition der Konvergenz ist, |an − a| als Abstand von an zu a zu
interpretieren. Dieser Abstand kann dann im Konvergenzfall beliebig klein gemacht
werden, indem man n groß wählt.
Dieser Gedanke kann wesentlich verallgemeinert werden. So werden wir später
in recht allgemeinem Rahmen einen Abstandsbegriff (Metrik) definieren, und Konvergenz von Folgen in mit diesem Abstandsbegriff versehene Mengen (metrische
Räume) untersuchen.
Beispiel (Fortsetzung). Sei wieder an = n+1
.
n
Behauptung. (an ) ist konvergent und limn→∞ an = 1.
Beweis. Sei ε > 0. Zu zeigen ist, dass ein N ∈ N existiert, so dass |an − 1| < ε für
alle n ∈ N mit n ≥ N.
Wir behaupten, dass N := [1/ε] + 1 die verlangte Eigenschaft hat. (Es sei daran
erinnert, dass für eine reelle Zahl x mit der Gaußklammer [x] die größte ganze Zahl
bezeichnet wird, die nicht größer als x ist.) Zunächst ist dann N > 1/ε und damit
1/N < ε. Sei nun n ∈ N, n ≥ N. Dann ist
n + 1 − n 1 1
n + 1
= = ≤ 1 < ε. − 1 = |an − 1| = n n
n
n
N
32
2 FOLGEN UND REIHEN
Im folgenden werden wir statt “(an ) ist konvergent und limn→∞ an = a” oft
nur kurz “limn→∞ an = a” schreiben. Wenn wir also den Grenzwert angeben, wird
damit seine Existenz (also die Konvergenz) impliziert.
Eine andere Beschreibung des Konvergenzbegriffs erhält man wie folgt. Sei X =
R oder X = C, a ∈ X und ε ∈ R+ . Dann heißt {x ∈ X : |x − a| < ε} die εUmgebung von a (in X). Geometrisch ist die ε-Umgebung von a im Falle X = C
eine Kreisscheibe vom Radius ε um a und im Falle X = R eine offenes Intervall
der Länge 2ε um a. Eine Teilmenge U von X heißt Umgebung von a, wenn ε > 0
existiert, so dass die ε-Umgebung von a in U enthalten ist.
Es zeigt sich, dass (an ) genau dann gegen a konvergiert, wenn für jede Umgebung U von a ein N ∈ N existiert, so dass an ∈ U für n ≥ N.
Der Begriff der Umgebung lässt sich in noch allgemeineren Zusammenhängen
erklären als der der Metrik. Insofern ist die Beschreibung der Konvergenz über
Umgebungen stärker verallgemeinerungsfähig als die in Definition 2.1.1 gegebene.
Solche Fragen werden in der Topologie behandelt.
Wir haben bei einer konvergenten Folge bereits von dem Grenzwert und nicht
nur von einem Grenzwert gesprochen. Dies wird durch den folgenden Satz gerechtfertigt.
Satz 2.1.1 Eine konvergente Zahlenfolge hat genau einen Grenzwert.
Beweis. Die Existenz eines Grenzwertes folgt aus der Definition. Wir haben also
nur die Eindeutigkeit des Grenzwertes zu zeigen.
Dazu nehmen wir an, dass a und b Grenzwerte der konvergenten Zahlenfolge
(an ) seien, mit a 6= b. Dann ist |a − b| > 0 und mit ε := |a−b|
auch ε > 0.
2
Nach Definition 2.1.1 existiert nun Na ∈ N mit |an − a| < ε für n ≥ Na und es
existiert Nb ∈ N mit |an − b| < ε für n ≥ Nb . Mit N := max{Na , Nb } folgt dann
|a − b| = |(a − aN ) + (aN − b)| ≤ |a − aN | + |aN − b| < ε + ε = 2ε = |a − b|.
Dies ist ein Widerspruch.
Zur Übung führen wir denselben Beweis in der Terminologie der Umgebungen:
Seien a, b, ε wie vorher. Dann sind die ε-Umgebungen von a und b disjunkt, denn
ist x aus beiden Umgebungen, so gilt
|a − b| = |(a − x) + (x − b)| ≤ |a − x| + |x − b| < ε + ε = 2ε = |a − b|.
33
2.2 Rechenregeln
Beispiel 1. Es sei q ∈ C und die komplexe Zahlenfolge (an ) sei gegeben durch
an = q n .
Fall 1. |q| > 1. Wir zeigen, dass (an ) unbeschränkt und damit wegen Satz 2.1.2
divergent ist.
Sei dazu M ∈ R+ . Wir haben zu zeigen, dass n ∈ N mit |q n | > M existiert.
Dazu setzen wir h := |q| − 1. Dann ist h > 0 und |q| = 1 + h. Es folgt
|q n | = |q|n = (1 + h)n =
Mit M := max{|a1 |, |a2 |, . . . , |aN −1 |, 1 + |a|} folgt dann |an | ≤ M für alle n ∈ N. k=0
Fall 3. |q| = 1. Hier zeigt sich, dass für q = 1 Konvergenz gegen 1 vorliegt,
während die Folge für q 6= 1 divergent ist. Wir verzichten hier auf die Details.
Bemerkung. Die in Fall 1 benutzte Ungleichung (1+h)n ≥ 1+nh heißt Bernoullische
Ungleichung. Sie gilt nicht nur für h > 0 sondern sogar für h > −1 (und n ∈ N).
Der Beweis sei als Übung überlassen.
√
Beispiel 2. limn→∞ n n = 1.
√
Beweis. Sei ε > 0. Zu zeigen ist, dass ein N ∈ N mit | n n − 1| < ε für n ≥ N
existiert.
√
Dazu notieren
wir zunächst, dass offensichtlich n n ≥ 1 für alle n ∈ N gilt. Wir
√
setzen hn := n n − 1 für n ∈ N. Dann gilt also hn ≥ 0. Für n ≥ 2 folgt
n X
√ n
n 2
n(n − 1) 2
n
hn .
n = n n = (1 + hn )n =
hkn ≥
h =
k
2
2 n
k=0
Es gilt also h2n ≤
max{2,
2
ε2
2
n−1
und damit hn ≤
+ 1}, so folgt für n ≥ N, dass
√
n
| n − 1| = |hn | = hn ≤
Satz 2.1.2 Eine konvergente Zahlenfolge ist beschränkt.
|an | = |(an − a) + a| ≤ |an − a| + |a| < 1 + |a|.
k=0
Für n > M/h folgt also |an | ≥ nh > M.
Fall 2. |q| < 1. Wir zeigen, dass limn→∞ an = 0.
Sei dazu ε ∈ R+ . Wir haben zu zeigen, dass N ∈ N mit |q n − 0| < ε für n ≥ N
1
− 1. Es ist
existiert. Dies ist klar falls q = 0. Sei also q 6= 0. Wir setzen h := |q|
1
1
1
dann |q| = 1+h . Wegen |q| > 1 ist h > 0. Wählt man N > εh , so folgt für n ≥ N,
dass
n
1
1
1
1
≤
≤
< ε.
=
|q n − 0| = |q|n =
1+h
(1 + h)n
nh
Nh
Damit kann jedes an nur in höchstens einer dieser Umgebungen liegen, womit nur
eine der Zahlen a und b Grenzwert von (an ) sein kann.
Beweis. Sei (an ) eine konvergente Folge und sei a := limn→∞ an . Dann existiert
N ∈ N mit |an − a| < 1 für n ≥ N. (Wir haben in Definition 2.1.2 ε := 1 gewählt.)
Damit folgt für n ≥ N, dass
n 1 X
X
n
n
hk ≥
hk = 1 + nh ≥ nh.
k
k
2.2
r
2
≤
n−1
q
r
2
n−1
für n ≥ 2. Wählt man also N >
2
<
N −1
s
Rechenregeln
2
ε2
2
= ε. +1 −1
Satz 2.2.1 Seien (an ), (bn ) konvergente Zahlenfolgen mit an → a, bn → b. Sei
c ∈ C. Dann gilt
(i) (an + bn ) ist konvergent und an + bn → a + b,
(ii) (an · bn ) ist konvergent und an · bn → a · b,
34
2 FOLGEN UND REIHEN
(iii) (c · an ) ist konvergent und c · an → c · a,
(iv) Ist b 6= 0, so
N ∈ N mit der Eigenschaft, dass bn 6= 0 für n ≥ N,
existiert
und es ist abnn
konvergent mit abnn → ab .
35
2.2 Rechenregeln
Beweis. “⇐”. Dies folgt aus Satz 2.2.1, (i) und (iii).
“⇒”. Sei a = limn→∞ an . Die Behauptung folgt dann aus |Re an − Re a| =
|Re(an − a)| ≤ |an − a| und |Im an − Im a| = |Im(an − a)| ≤ |an − a|. n≥N
Beweis. (i). Sei ε > 0. Dann existieren Na , Nb ∈ N mit |an − a| < 2ε für n ≥ Na und
|bn − b| < 2ε für n ≥ Nb . Mit N := max{Na , Nb } folgt dann für n ≥ N, dass
|(an + bn ) − (a + b)| = |(an − a) + (bn − b)| ≤ |an − a| + |bn − b| <
ε ε
+ = ε.
2 2
(ii). Es ist
an bn − ab = an bn − abn + abn − ab = (an − a)bn + a(bn − b).
Nach Satz 2.1.2 ist (bn ) beschränkt, d. h., es existiert M ∈ R+ mit |bn | ≤ M für
alle n ∈ N.
ε
Sei nun ε > 0. Dann existieren Na , Nb ∈ N mit |an − a| < 2M
für n ≥ Na und
ε
|bn − b| < 2(|a|+1)
für n ≥ Nb . Mit N := max{Na , Nb } folgt dann für n ≥ N, dass
|an bn − ab| = |(an − a)bn + a(bn − b)|
≤ |(an − a)bn | + |a(bn − b)|
= |an − a| · |bn | + |a| · |bn − b|
ε
ε
M + |a|
<
2M
2(|a| + 1)
ε ε
<
+
2 2
= ε.
(iii). Dies folgt aus (ii) mit bn = c für alle n ∈ N.
> 0 und damit existiert N ∈ N, so dass |bn −b| < |b|
(iv). Sei b 6= 0. Dann gilt |b|
2
2
|b|
für n ≥ N. Es folgt 2 > |b| − |bn | und damit |bn | > |b|
für n ≥ N. Insbesondere
2
gilt also bn 6= 0 für n ≥ N.
Wir zeigen jetzt, dass b1n
gegen 1b konvergiert. Dazu notieren wir zunächst,
dass für n ≥ N
n≥N
1
− 1 = b − bn = |b − bn | ≤ 2|b − bn |
bn
b
bn b |bn | · |b|
|b|2
gilt. Sei nun ε > 0. Dann existiert N ′ ∈ N mit |bn − b| <
N ′′ := max{N, N ′ } folgt dann für N ≥ N ′′ , dass
1
− 1 ≤ 2|b − bn | < ε.
bn
b
|b|2
Damit gilt
1
bn
→ 1b . Aus (ii) folgt jetzt
an
bn
|b|2 ε
2
für n ≥ N ′ . Mit
→ ab . Satz 2.2.2 Eine komplexe Zahlenfolge (an ) konvergiert genau dann, wenn die reellen Zahlenfolgen (Re an ) und (Im an ) konvergieren. Es gilt dann limn→∞ Re an =
Re(limn→∞ an ) und limn→∞ Im an = Im(limn→∞ an ).
Satz 2.2.3 Wenn die komplexe Zahlenfolge (an ) gegen a konvergiert, so konvergieren (|an |) gegen |a| und (an ) gegen a.
Beweis. Die Behauptung folgt aus ||an | − |a|| ≤ |an − a| und |an − a| = |an − a| =
|an − a|. Wir betrachten noch einmal das Beispiel der durch an := q n definierten komplexen Zahlenfolge (an ), wobei q ∈ C, |q| = 1. Gilt dann an → a, so folgt |an | → |a|.
Wegen |an | = |q n | = |q|n = 1n = 1 für alle n ∈ N impliziert dies |a| = 1. Weiter
gilt auch an+1 → a. Andererseits gilt aber auch an+1 = qan → qa. Es folgt a = qa.
Wegen |a| = 1 ist aber a 6= 0. Damit folgt q = 1. Für q ∈ C, |q| = 1, konvergiert
also die komplexe Zahlenfolge (q n ) genau dann, wenn q = 1.
Satz 2.2.4 Seien (an ), (bn ) konvergente reelle Zahlenfolgen. Es existiere N ∈ N
mit an ≤ bn für alle n ≥ N. Dann gilt limn→∞ an ≤ limn→∞ bn .
Beweis. Sei a := limn→∞ an und b := limn→∞ bn . Wir nehmen an, dass a > b gilt.
> 0. Also existieren Na , Nb ∈ N mit
Dann ist a − b > 0 und damit auch ε := a−b
2
|an − a| < ε für n ≥ Na und |bn − b| < ε für n ≥ Nb . Sei N ′ := max{Na , Nb }. Für
n ≥ N ′ gilt dann bn − b < ε und a − an < ε. Es folgt (bn − b) + (a − an ) < 2ε und
damit bn − an < 2ε + b − a = 0 für n ≥ N ′ . Es folgt bn < an für n ≥ N ′ . Dies ist
ein Widerspruch. Man beachte, dass aus an < bn für n ≥ N nicht limn→∞ an < limn→∞ bn gefolgert werden kann. Ein Gegenbeispiel ist etwa durch an = − n1 und bn = n1 gegeben.
Hier sind beide Grenzwerte 0.
Eine wichtiger Spezialfall von Satz 2.2.4 ist der Fall, dass eine der Folgen (an ),
(bn ) konstant ist. So folgt etwa aus an → a und an ≤ b für n ≥ N, dass a ≤ b gilt.
Satz 2.2.5 Seien (an ), (bn ), (cn ) reelle Zahlenfolgen. Es existiere N ∈ N mit an ≤
bn ≤ cn für alle n ≥ N. Sind dann (an ) und (cn ) konvergent mit limn→∞ an =
limn→∞ cn , so ist auch (bn ) konvergent und hat den gleichen Grenzwert wie (an )
und (cn ).
Beweis. Sei a := limn→∞ an = limn→∞ cn und sei ε > 0. Dann existieren Na , Nc ∈ N
mit |an −a| < ε für n ≥ Na und |cn −a| < ε für n ≥ Nc . Mit Nb := max{N, Na , Nc }
folgt dann für n ≥ Nb , dass a − bn ≤ a − an ≤ |an − a| < ε und bn − a ≤ cn − a ≤
|cn − a| < ε, also |bn − a| < ε. Beispiel. Sei b ∈ R+ . Für n ≥ max{b, 1b } ist dann
√
√
√
√
n
b ≤ n n. Wegen n n → 1 folgt n b → 1.
1
n
≤ b ≤ n und damit
1
√
nn
≤
36
2.3
2 FOLGEN UND REIHEN
Konvergenzkriterien
Satz 2.3.1 Sei (an ) eine monoton steigende (bzw. fallende) und nach oben (bzw.
unten) beschränkte reelle Zahlenfolge. Dann ist (an ) konvergent.
Ist A := {an : n ∈ N}, so gilt limn→∞ an = sup A (bzw. limn→∞ an = inf A).
Beweis. Wir betrachten nur den Fall, dass (an ) monton steigend und nach oben
beschränkt ist. (Der andere Fall kann darauf zurückgeführt werden.) Sei a := sup A.
Zu zeigen ist, dass an → a. Sei dazu ε > 0. Nach Satz 1.7.4 existiert N ∈ N mit
aN > a − ε. Wegen der Monotonie von (an ) folgt an > a − ε für alle n ≥ N.
Andererseits gilt an ≤ a für alle n ∈ N wegen a = sup A. Es folgt |an − a| =
a − an < ε für alle n ≥ N. Beispiel 1. Wir betrachten die rekursiv definierte Folge (an ) mit a1 = 2 und
1
2
an+1 =
an +
2
an
für n ∈ N. Offensichtlich gilt an > 0 für alle n ∈ N.
√ (Formaler Beweis durch
vollständige Induktion.) Genauer gilt sogar, dass an ≥ 2 für alle n ∈ N. Dies ist
klar für n = 1 und folgt für n ≥ 2 wegen
a2n − 2 =
=
=
=
≥
2
1
2
−2
an−1 +
4
an−1
1
4
−2
a2n−1 + 4 + 2
4
an−1
4
1
a2n−1 − 4 + 2
4
an−1
2
1
2
an−1 −
4
an−1
0
und an > 0. Desweiteren gilt für alle n ∈ N, dass an+1 ≤ an , denn
√
2 an ≥ 2 1
2
1
an+1
≥
1+ 2
1+
= 1.
=
an
2
an
2
2
Hieraus folgt unmittelbar (durch vollständige Induktion), dass am ≤ an für m ≥ n
gilt, d. h., die Folge (an ) ist monoton fallend. Nach Satz 2.3.1 konvergiert (an ) also
gegen a = inf{an : n ∈ N}.
√
Um den Grenzwert a zu bestimmen,
notieren wir zunächst, dass wegen an ≥ 2
√
nach Satz 2.2.4 auch a ≥ 2 gilt. Außerdem gilt auch an+1 → a, und aus der
Rekursionsformel und Satz 2.2.1 folgt damit a = 21 a + a2 . Dies ergibt aber a2 = a1
√
√
und damit a2 = 2, wegen a ≥ 2 also a = 2.
Allgemeiner kann man wie oben zeigen, dass für c > 0, a1 > 0 und
1
c
an+1 =
an +
2
an
37
2.3 Konvergenzkriterien
√
folgt, dass an → c.
Mit diesem Verfahren kann man die Quadratwurzel einer natürlichen Zahl beliebig genau durch rationale Zahlen approximieren. Das Verfahren ist nach Heron von
Alexandria (1. Jhdt. n. Chr.) benannt, war aber den Babyloniern bereits 2000 Jahre
vorher bekannt. Heute wird es im Schulunterricht i. a. in der 9. Klasse behandelt.
n
n
n+1
Beispiel 2. Für n ∈ N sei an = 1 + n1
= n+1
und bn = 1 + n1
=
n
n+1
n+1
= 1 + n1 an . Dann ist (an ) monoton steigend, denn für n ≥ 2 ist
n
an
an−1
=
=
=
=
Bernoulli
≥
=
n n−1
n+1
n−1
n
n
n
(n + 1)(n − 1)
n
n2
n−1
n
2
n
n −1
2
n
n−1
n
1
n
1− 2
n
n−1
n
1
1−n 2
n n−1
1.
Ähnlich zeigt man, dass (bn ) monoton fallend ist. Damit gilt
1
a1 ≤ an < an 1 +
= bn ≤ b1
n
für alle n ∈ N. Nach
Satz 2.3.1 existieren damit a, b ∈ R mit an → a and bn → b.
Wegen an 1 + n1 = bn folgt a = b nach Satz 2.2.1, (ii).
Der gemeinsame Grenzwert von (an ) und (bn ) heißt Eulersche Zahl und wird
mit e bezeichnet. Es gilt e = 2, 718 . . . .
Definition 2.3.1 Sei (an ) Zahlenfolge und a ∈ C. Dann heißt a Häufungswert von
(an ), falls für jedes ε ∈ R+ unendlich viele n ∈ N mit |an − a| < ε existieren.
Die Bedingung, dass unendlich viele n ∈ N mit |an −a| < ε existieren, ist äquivalent
dazu, dass zu vorgegebenem N ∈ N ein n ∈ N mit n ≥ N und |an −a| < ε existiert.
In Quantorenschreibweise lautet die letzte Bedingung wie folgt:
∀ε ∈ R+ ∀N ∈ N∃n ∈ N : n ≥ N ∧ |an − a| < ε.
Als Beispiel betrachten wir die durch an = (−1)n gegebene Folge (an ). Hier sind 1
und −1 Häufungswerte.
Definition 2.3.2 Sei X Menge, a : N → X Folge und ν : N → N streng monoton
steigende Folge. Dann heißt die Folge a ◦ ν : N → X eine Teilfolge von a. Sie wird
mit (aν(k) )k∈N oder (aνk )k∈N bezeichnet.
Satz 2.3.2 Sei (an ) Zahlenfolge und a ∈ C. Dann gilt:
38
2 FOLGEN UND REIHEN
(i) a ist Häufungswert von (an ) ⇔ Es existiert eine Teilfolge von (an ), die gegen
a konvergiert.
Beweis. “⇒” Sei a = limn→∞ an and ε > 0. Dann existiert N ∈ N mit |an − a| <
für alle n ≥ N. Gilt dann m ≥ N und n ≥ N, so folgt
(ii) a ist Grenzwert von (an ) ⇔ Alle Teilfolgen von (an ) konvergieren gegen a.
Der Beweis sei als Übung überlassen.
Satz 2.3.3 (Satz von Bolzano-Weierstraß) Jede beschränkte Zahlenfolge besitzt eine konvergente Teilfolge.
Im Beweis des Satzes von Bolzano-Weierstraß werden wir folgenden Satz benutzen.
Satz 2.3.4 Jede reelle Zahlenfolge besitzt eine monotone Teilfolge.
Hierbei bedeutet “monoton” natürlich “monoton steigend oder monoton fallend”.
Beweis von Satz 2.3.4. Sei (an ) reelle Zahlenfolge. Wir nennen m ∈ N Gipfel von
(an ), falls an < am für alle n > m.
Fall 1. Es existieren unendlich viele Gipfel. Seien m1 , m2 , m3 , . . . Gipfel mit
m1 < m2 < m3 < . . . . Dann ist (amk ) monoton fallende Teilfolge von (an ).
Fall 2. Es existieren höchstens endlich viele Gipfel. Dann existiert n1 ∈ N, so
dass alle n ∈ N mit n ≥ n1 keine Gipfel sind. Insbesondere ist n1 kein Gipfel
und damit existiert n2 > n1 mit an2 ≥ an1 . Auch n2 ist kein Gipfel, also existiert
n3 > n2 mit an3 ≥ an2 , und n3 ist kein Gipfel. Induktiv erhält man so eine monoton
steigende Teilfolge (ank ) von (an ). Beweis des Satzes von Bolzano-Weierstraß. Sei (an ) beschränkte Zahlenfolge. Wir
betrachten zunächst den Fall, dass (an ) reelle Zahlenfolge ist. Dann besitzt (an )
nach Satz 2.3.4 eine monotone Teilfolge besitzt. Diese Teilfolge ist natürlich auch
beschränkt, und damit konvergent nach Satz 2.3.1.
Wir betrachten jetzt den Fall, dass (an ) (beschränkte) komplexe Zahlenfolge
ist. Dann sind die Folgen (Re an ) und (Im an ) reell und beschränkt. Nach dem
bereits bewiesenen besitzt (Re an ) eine konvergente Teilfolge
(Re
ank )k∈N , und die
Folge (Im ank )k∈N besitzt eine konvergente Teilfolge Im ankj
ankj
eine konvergente Teilfolge von (an )n∈N ist. j∈N
. Es folgt, dass
j∈N
Definition 2.3.3 Eine Zahlenfolge (an ) heißt Cauchyfolge, falls für jedes ε ∈ R+
ein N ∈ N existiert, so dass |an − am | < ε für alle m, n ≥ N.
|an − am | = |(an − a) + (a − am )| ≤ |an − a| + |a − am | <
Satz 2.3.5 (Cauchykriterium für Folgen) Eine Zahlenfolge konvergiert genau
dann, wenn sie Cauchyfolge ist.
ε
2
ε ε
+ = ε.
2 2
“⇐”: Sei (an ) Cauchyfolge. Zu zeigen ist, dass (an ) konvergiert. Wir zeigen
zunächst (ähnlich wie im Beweis von Satz 2.1.2), dass (an ) beschränkt ist. Dazu
notieren wir, dass ein N ∈ N existiert mit |an − am | < 1 für m, n ≥ N. Es folgt
|an | = |an − aN + aN | ≤ |an − aN | + |aN | < 1 + |aN | für n ≥ N, und damit
|an | ≤ max{|a1 |, |a2 |, . . . , |aN −1 |, 1 + |aN |} für alle n ∈ N.
Nach dem Satz von Bolzano-Weierstraß existiert also eine konvergente Teilfolge
von (an ), etwa ank → a.
Wir zeigen jetzt, dass an → a gilt. Sei dazu ε > 0. Dann existiert K ∈ N mit
|ank −a| < 2ε für k ≥ K. Außerdem existiert N ∈ N mit |an −am | < 2ε für m, n ≥ N.
Sei nun n ≥ N. Dann existiert ℓ ∈ N mit ℓ ≥ K und nℓ ≥ N. Es folgt
|an − a| ≤ |an − anℓ | + |anℓ − a| <
ε ε
+ = ε. 2 2
Wichtig bei obigem Satz sowie den Sätzen 2.3.1 und 2.3.2 ist, dass sie erlauben,
die Konvergenz einer Folge nachzuweisen, ohne den Grenzwert zu kennen. Das
Entscheidende dabei ist die Vollständigkeit von R.
Umgekehrt könnte man auch wieder die Vollständigkeit dadurch definieren, dass
man die Konvergenz jeder Cauchyfolge verlangt. Dann müsste man aber, um dem
Vollständigkeitsbegriff von Definition 1.7.3 zu erhalten, noch zusätzlich das Archimedische Axiom verlangen; vgl. die Diskussion nach Satz 1.8.9. (Wir werden aber
später in metrischen Räumen Vollständigkeit auf diesem Wege definieren.)
Exkurs: Konstruktion der reellen Zahlen. Wir wollen den Körper (Q, +, ·)
der rationalen Zahlen zum Körper (R, +, ·) der reellen Zahlen “vervollständigen”.
Dazu sei C die Menge der Cauchyfolgen rationaler Zahlen. Wir betrachten die auf
C durch
(xn ) ∼ (yn ) :⇔ lim (xn − yn ) = 0
n→∞
definierte Relation ∼.
Man zeigt leicht, dass ∼ Äquivalenzrelation ist. Um etwa die Transivität zu
zeigen, seien (xn ), (yn ), (zn ) ∈ C mit (xn ) ∼ (yn ) und (yn ) ∼ (zn ). Dann gilt
(xn − yn ) → 0 und (yn − zn ) → 0 und damit (xn − zn ) = (xn − yn ) + (yn − zn ) → 0,
also (xn ) ∼ (zn ).
Auf der Menge C/∼ der Äquivalenzklassen definieren wir eine Addition und
eine Multiplikation durch
In Quantorenschreibweise lautet die Definition wie folgt:
(an ) ist Cauchyfolge
⇔ ∀ε ∈ R+ ∃N ∈ N∀m, n ∈ N : (m ≥ N ∧ n ≥ N) ⇒ |an − am | < ε.
39
2.3 Konvergenzkriterien
[(xn )] + [(yn )] := [(xn + yn )]
und
[(xn )] · [(yn )] := [(xn · yn )].
Zunächst muss man zeigen, dass diese Addition und Multiplikation von Äquivalenzklassen wohldefiniert sind. Dazu muss man zum einen zeigen, dass mit (xn ), (yn ) ∈
C auch (xn + yn ) ∈ C und (xn · yn ) ∈ C gilt, und zum andern, dass für (xn ) ∼ (x′n )
40
2 FOLGEN UND REIHEN
und (yn ) ∼ (yn′ ) auch (xn + yn ) ∼ (x′n + yn′ ) und (xn · yn ) ∼ (x′n · yn′ ) gilt. Wir
verzichten hier auf den Beweis dieser Aussagen.
Es gilt dann, dass (C/ ∼, +, ·) Körper ist. Auf einen Nachweis der einzelnen
Körperaxiome verzichten wir. Das Nullelement des Körpers ist [(0, 0, 0, . . . )] und
das Einselement ist [(1, 1, 1, . . . )].
Wir definieren eine Ordnung ≤ auf C/∼ wie folgt:
[(xn )] ≤ [(yn )] :⇔ ∀ε > 0∃N ∈ N : n ≥ N ⇒ xn ≤ yn + ε.
(Man beachte hier, dass die “naive” Setzung [(xn )] ≤ [(yn )] :⇔ ∀n ∈ N : xn ≤ yn
hier nicht zum Erfolg führt. Diese ist noch nicht einmal wohldefiniert. Beispielsweise
ist ja [( n1 )] = [(− n1 )].)
Zunächst muss man wieder zeigen, dass ≤ wohldefiniert ist. Sei dazu (xn ) ∼ (x′n )
und (yn ) ∼ (yn′ ) und es gelte
∀ε > 0∃N ∈ N : n ≥ N ⇒ xn ≤ yn + ε.
Zu zeigen ist
∀ε > 0∃N ∈ N : n ≥ N ⇒ x′n ≤ yn′ + ε.
Sei dazu ε > 0. Dann existiert M mit xn ≤ yn + 3ε für n ≥ M. Weiter existieren
Nx , Ny ∈ N mit |xn − x′n | < 3ε für n ≥ Nx und |yn − yn′ | < 3ε für n ≥ Ny . Für
n ≥ max{M, Nx , Ny } folgt dann
ε
ε
ε
x′n < xn + < yn + 2 < yn′ + 3 = yn′ + ε.
3
3
3
Es ist leicht zu sehen, dass ≤ tatsächlich Ordnung ist. Ebenso kann man nachrechnen, dass die Ordnungsaxiome (O1) und (O2) erfüllt sind. Damit erhält man,
dass (C/∼, +, ·) ein angeordneter Körper ist.
Man kann r ∈ Q mit der Äquivalenzklasse [(r, r, r, . . . )] identifizieren. In diesem Sinne ist Q Teilkörper von C/∼. Formal betrachtet man wieder die injektive Abbildung i : Q → C/ ∼, r 7→ [(r, r, r, . . . )]. Es gilt für r, s ∈ Q dann, dass
i(r + s) = i(r) + i(s), i(r · s) = i(r) · i(s) und r ≤ s ⇔ i(r) ≤ i(s).
Schließlich zeigt man dann, dass (C/ ∼, +, ·) vollständig ist. Dies kann man
beispielsweise tun, indem man Folgendes zeigt:
• Jede Cauchyfolge in (C/∼, +, ·) ist konvergent.
• In (C/∼, +, ·) gilt das Archimedische Axiom.
• Ein angeordneter Körper, in dem das Archimedische Axiom gilt und in dem
jede Cauchyfolge konvergiert, ist vollständig.
Wir verzichten hier auf die Einzelheiten.
2.4
Limes superior und inferior sowie uneigentliche Grenzwerte
Sei (an ) eine beschränkte reelle Zahlenfolge. Für n ∈ N sei An := {ak : k ≥ n}.
Dann ist An beschränkt und damit existiert sup An . Ist m ≤ n, so gilt An ⊂
2.4 Limes superior und inferior sowie uneigentliche Grenzwerte
41
Am und damit sup An ≤ sup Am . Die Folge (sup An ) ist also monoton fallend.
Außerdem ist sie beschränkt. Deshalb ist sie nach Satz 2.3.1 konvergent und es gilt
limn→∞ sup An = inf n∈N sup An = inf n∈N supk≥n ak .
Definition 2.4.1 Sei (ak ) reelle Zahlenfolge. Dann heißen
lim sup an := inf sup ak
n→∞
n∈N k≥n
Limes superior und
lim inf an := sup inf ak
n→∞
n∈N k≥n
Limes inferior von (an ), falls die Suprema und Infima rechts existieren.
Statt lim sup schreibt man auch lim und statt lim inf schreibt man auch lim. Aus
den obigen Überlegungen folgt, dass Limes superior und inferior immer existieren,
wenn (an ) beschränkt ist. Umgekehrt sieht man sofort, dass aus der Existenz des
Limes superior die Beschränktheit von (an ) nach oben und aus der des Limes
inferior die Beschränktheit nach unten folgt.
Wegen lim supn→∞ an = limn→∞ sup An , lim inf n→∞ an = limn→∞ inf An und
inf An ≤ sup An für alle n ∈ N folgt mit Satz 2.2.4, dass
lim inf an ≤ lim sup an
n→∞
n→∞
gilt.
Satz 2.4.1 Eine reelle Zahlenfolge (an ) ist genau dann konvergent, wenn der Limes
superior und inferior beide existieren und den gleichen Wert haben.
Beweis. “⇒”. Sei a := limn→∞ an und ε > 0. Dann existiert N ∈ N mit |an − a| < ε
für n ≥ N. Es folgt a − ε < an < a + ε für n ≥ N und damit a − ε < inf k≥N ak ≤
supk≥N ak < a + ε. Damit gilt a − ε < supn∈N inf k≥n ak = lim inf n→∞ an ≤
lim supn→∞ an = inf n∈N supk≥n ak < a + ε.
“⇐”. Sei lim inf n→∞ an = lim supn→∞ an = a und ε > 0. Dann existiert N ∈ N
mit a − ε < inf k≥n ak ≤ supk≥n ak < a + ε für n ≥ N. Es folgt a − ε < an < a + ε
und damit |an − a| < ε für n ≥ N. Satz 2.4.2 Sei (an ) eine beschränkte reelle Zahlenfolge und sei H die Menge der
Häufungswerte von (an ). Dann ist H 6= ∅ und es gilt lim supn→∞ an = max H und
lim inf n→∞ an = min H.
Beweis. Es genügt, lim supn→∞ an = max H zu zeigen.
Sei wieder An := {ak : k ≥ n} und damit a := lim supn→∞ an = limn→∞ sup An .
Wir zeigen zunächst, dass a ∈ H. Aufgrund der Bemerkung nach Definition 2.3.1
haben wir Folgendes zu zeigen:
∀ε > 0∀N ∈ N∃k ∈ N : k ≥ N ∧ |ak − a| < ε.
Sei also ε > 0 und N ∈ N. Zunächst existiert N ′ ∈ N mit | sup An − a| < 2ε
für n ≥ N ′ . Sei nun n ≥ max{N, N ′ }. Nach Satz 1.7.4 existiert x ∈ An mit
42
2 FOLGEN UND REIHEN
x > sup An − 2ε , das heißt, es existiert k ≥ n ≥ N mit ak > sup An − 2ε . Wegen
ak ≤ sup An ist also | sup An − ak | < 2ε . Es folgt
|ak − a| ≤ |ak − sup An | + | sup An − a| <
ε ε
+ = ε.
2 2
Also gilt a ∈ H.
Wir zeigen nun, dass a = max H. Sei dazu b ∈ H. Wir haben zu zeigen, dass
b ≤ a gilt. Wir nehmen an, dass b > a gilt. Dann ist ε := b−a > 0. Wieder existiert
N ′ ∈ N mit | sup An − a| < 2ε für n ≥ N ′ . Außerdem existiert k ∈ N mit k ≥ N ′
und |ak − b| < 2ε . Es folgt
ε = b − a = b − ak + ak − a ≤ |b − ak | + | sup Ak − a| <
ε ε
+ = ε,
2 2
was ein Widerspruch ist. Wir erweitern nun R durch hinzufügen zweier Elemente ∞ (gelegentlich auch
mit +∞ bezeichnet) und −∞ zu einer Menge R, also R = R ∪ {∞, −∞}. Die
Ordnung ≤ auf R erweitern wir zu einer Ordnung auf R, indem wir −∞ < x
und x < ∞ für x ∈ R und außerdem −∞ < ∞ setzen. Man rechnet leicht nach,
dass (R, ≤) geordnete Menge ist. Es ist dabei jede Teilmenge von R beschränkt,
denn ∞ ist immer obere und −∞ ist immer untere Schranke. Außerdem ist die
geordnete Menge (R, ≤) ordnungsvollständig. Um dies einzusehen, bezeichnen wir
(vorübergehend) das Supremum in (R, ≤) mit supR und das in (R, ≤) mit supR .
Sei nun A ⊂ R. Es zeigt sich dann, dass supR A = ∞ falls ∞ ∈ A oder falls A ∩ R
nicht nach oben beschränkt ist, und dass supR A = supR (A ∩ R) falls ∞ ∈
/ A und
A ∩ R nicht leer und nach oben beschränkt ist. Im verbleibenden Fall ist ∞ ∈
/ A
und A∩R = ∅, also A = {−∞} oder A = ∅, und es folgt sup A = −∞. Analog lässt
sich auch das Infimum von Teilmengen von R kennzeichnen. Wir halten also fest,
dass jede Teilmenge von R ein Supremum und ein Infimum (bzgl. der geordneten
Menge (R, ≤)) besitzt.
Nach Definition 2.4.1 und Satz 2.4.1 sind Limes superior, Limes inferior und
Grenzwert einer reellen Zahlenfolge Suprema und Infima gewisser Teilmengen von
R. Wir nehmen nun diese Suprema und Infima bzgl. der geordneten Menge (R, ≤).
Es folgt, dass Limes superior und Limes inferior dann für jede reelle Zahlenfolge
(und sogar für jede Folge nach R) existieren, möglicherweise aber den Wert ∞
oder −∞ haben. Gilt für eine reelle Zahlenfolge (an ), dass lim inf n→∞ an = ∞ (und
damit auch lim supn→∞ an = ∞), so schreiben wir auch limn→∞ an = ∞ und nennen
(an ) bestimmt divergent gegen ∞. Analog definiert man bestimmte Divergenz gegen
−∞. Man bezeichnet ∞ und −∞ auch als uneigentliche Grenzwerte.
Beispiel 1. Sei an = n. Dann ist limn→∞ an = ∞, denn mit An := {ak : k ≥ n}
ist inf R An = inf R An = n und folglich lim inf n→∞ an = supR {inf R An : n ∈ N} =
supR N = ∞.
Beispiel 2. Sei an = (−1)n . Dann ist An := {−1, 1} für alle n ∈ N. Hieraus folgt,
dass lim supn→∞ an = 1 und lim inf n→∞ an = −1.
2.5 Die allgemeine Potenz
2.5
43
Die allgemeine Potenz
In Definition 1.8.1 hatten wir die Potenz ar für a ∈ R+ und r ∈ Q erklärt. Wir
wollen dies jetzt für r ∈ R tun. Eine Möglichkeit dafür wurde bereits im Anschluss
an Satz 1.8.6 angegeben, aber wir beschreiten jetzt einen anderen Weg.
Hilfssatz 2.5.1 Sei (rn ) eine Folge rationaler Zahlen mit rn → 0 und sei a ∈ R+ .
Dann gilt arn → 1.
Beweis. Ohne Einschränkung der Allgemeinheit kann man a > 1 annehmen. Sei
ε ∈ R+ .Wegen a1/k → 1 für k → ∞ (vgl. Beispiel nach Satz 2.2.5) existiert K ∈ N
1/k
mit |a1/k − 1| < ε und |a−1/k − 1| = | a1
− 1| < ε für k ≥ K. Weiter existiert
N ∈ N mit |rn | < K1 für n ≥ N. Es folgt −ε < a−1/K − 1 < arn − 1 < a1/K − 1 < ε,
also |arn − 1| < ε, für n ≥ N. Hilfssatz 2.5.2 Sei (rn ) eine Folge rationaler Zahlen und sei a ∈ R+ . Konvergiert
(rn ), so konvergiert auch (arn ). Dabei hängt limn→∞ arn nur von r := limn→∞ rn ab
und es gilt limn→∞ arn = ar falls r ∈ Q
Beweis. Ohne Einschränkung der Allgemeinheit kann man wieder a > 1 annehmen.
Sei (sn ) eine monoton fallende Folge mit sn → r. (Die Existenz einer solchen
Folge kann man aus Satz 1.8.4 ableiten, welcher besagt, dass Q dicht in R ist.) Sei
m ∈ Z mit m ≤ r. Dann gilt sn ≥ r ≥ m für alle n ∈ N und damit asn ≥ am
nach Satz 1.8.6. Folglich ist (asn ) nach unten beschränkt. Außerdem ist (asn ) nach
Satz 1.8.6 monoton fallend, und damit nach Satz 2.3.1 konvergent.
Sei nun (rn ) eine Folge rationaler Zahlen mit rn → r. Dann gilt rn − sn → 0,
nach Hilfssatz 2.5.1 also arn −sn → 1. Wegen arn = asn +rn −sn = asn arn −sn ist dann
auch (arn ) konvergent und hat den gleichen Grenzwert wie (asn ).
Ist r ∈ Q, so kann man sn = r für alle n ∈ N wählen, und damit ist ar der
gemeinsame Grenzwert von (arn ) und (asn ). Definition 2.5.1 Sei a ∈ R+ und r ∈ R. Dann setzen wir ar := limn→∞ arn , wobei
(rn ) eine rationale Zahlenfolge mit rn → r ist.
Hilfssatz 2.5.2 zeigt, dass ar wohldefiniert ist (und im Beweis wurde bemerkt, dass
eine Folge (rn ) mit den gewünschten Eigenschaften für jedes r ∈ R existiert).
Aus dieser Definition folgt unmittelbar, dass die in Satz 1.8.6 formulierten Potenzgesetze auch für reelle Exponenten richtig bleiben. Ebenso bleiben auch die
Behauptungen der obigen Hilfssätze richtig, wenn man rn , r ∈ R zulässt.
2.6
Reihen
P
Definition 2.6.1 Sei N ∈ N und (an )n≥N Zahlenfolge. Die durch sn := nk=N ak
definierte Folge (sn )n≥N
P
P heißt die zu (an ) gehörige (unendliche) Reihe. Sie wird mit
∞
an bezeichnet. Die Reihe heißt konvergent, wenn die Folge
n=N an oder auch
(s
)
konvergiert.
In
diesem
Fall heißt der Grenzwert
von (sn ) die Summe der Reihe
n
P
P
an . Gilt limn→∞ sn = s, so schreibt man ∞
n=N an = s.
Reihen, die nicht konvergieren, heißen divergent (und bei Existenz des uneigentlichen Grenzwertes ∞ oder −∞ auch bestimmt divergent).P
Die Folge (sn ) heißt
auch Folge der Partialsummen (oder Teilsummen) der Reihe
an .
44
2 FOLGEN UND REIHEN
P
P
an also sowohl die Reihe selbst, wie auch
Wir bezeichnen mit ∞
n=N an bzw.
– im Konvergenzfall – ihre Summe. Das sollte im allgemeinen aber nicht zu Verwechslungen führen.
P
n
n
Beispiel. Sei q ∈ C. Wir betrachten die Reihe ∞
n=0 q . Es ist also an = q . Diese
Reihe heißt geometrische Reihe.
Pn
Fall 1. q = 1. Dann gilt an = 1 und sn =
k=0 1 = n + 1. Die Reihe ist
(bestimmt) divergent.
P
n+1
, denn
Fall 2. q 6= 1. Es gilt sn = nk=0 q k = 1−q
1−q
(1 − q)
n
X
qk =
k=0
n
X
k=0
=
n
X
k=0
(1 − q)q k
q k − q k+1
Wegen q n+1 → 0 für |q| < 1 folgt, dass
k=0
qk =
1
1−q
Beweis. Mit sn =
Pn
k=1 ak
ist
s2n+1 −1 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9 + · · · + a2n+1 −1
≤ a1 + a2 + a2 + a4 + a4 + a4 + a4 + a8 + a8 + · · · + a2n
n
X
=
2k a2k
k=0
≤ a1 + a2 + a2 + a3 + a3 + a4 + a4 + a5 + a5 + · · · + a2n
= 2s2n − a1
≤ 2s2n .
Die Behauptung folgt mit Satz 2.6.1. 1
Beispiel. Sei α > 0 und
P∞an 1= nα . Dann sind die Voraussetzungen von Satz 2.6.2
erfüllt und damit ist n=1 nα genau dann konvergent, wenn
= 1 − q + q − q 2 + q 2 − q 3 + · · · + q n − q n+1
= 1 − q n+1 .
∞
X
45
2.6 Reihen
für |q| < 1,
d. h., die Reihe konvergiert für |q| < 1 und ihre Summe ist
Für |q| ≥ 1 divergiert die Reihe.
1
.
1−q
Da Reihen nach Definition also nichts anderes als Folgen sind, haben Sätze
über Folgen Analoga
Aus Satz
P für Reihen.
P
P 2.2.1, (i), erhält man z. B., dass aus der
Konvergenz von
bn die von (an +bn ) folgt, und dass für die Summen
P
P an und
P
(an + bn ) = an + bn gilt. Analog überträgt sich Satz 2.2.1, (iii).
P
Satz 2.6.1 Sei an eine Reihe
P nichtnegativer reeller Zahlen, d. h., es gelte an ≥ 0
für alle n. Dann konvergiert
an genau dann, wenn die Folge der Partialsummen
beschränkt ist.
Beweis. “⇒” folgt aus Satz 2.1.2 (“Konvergente Folgen sind beschränkt”), und
“⇐” folgt aus Satz 2.3.1, da die Folge der Partialsummen wegen an ≥ 0 monoton
steigend ist. Satz 2.6.2 (Cauchyscher Verdichtungssatz) Sei (aP
k )k∈N eine monoton fallende Folge nichtnegativer reeller Zahlen. Dann konvergiert ∞
k=1 ak genau dann, wenn
P
∞
k
2
a
k konvergiert.
2
k=0
∞
X
k=0
2k
∞
∞
k=0
k=0
X
X
k
1
21−α
2k(1−α) =
=
(2k )α
konvergiert. Dies ist aber die geometrische Reihe, und diese konvergiert genau dann,
wenn 21−α < 1, also wenn α > P
1 gilt.
1
für 0 < α ≤ 1.
Insgesamt konvergiert also ∞
n=1 nα für α > 1, und divergiert
P
1
Insbesondere divergiert die sogenannte harmonische Reihe ∞
n=1 n .
Satz 2.6.3 (Leibnizkriterium) Sei (ak )k∈N eine monoton
fallende Folge positiver
P
k+1
ak . Für die Folge
reeller Zahlen mit limk→∞ ak = 0. Dann konvergiert ∞
k=1 (−1)
(sn ) der Partialsummen gilt dabei
s2n ≤
n
X
k=1
(−1)k+1 ak ≤ s2n−1
für n ∈ N.
Beweis. Es ist s2n+1 − s2n−1 = (−1)2n+2 a2n+1 + (−1)2n+1 a2n = a2n+1 − a2n ≤ 0
für n ∈ N, also ist (s2n−1 ) monoton fallend. Analog ist (s2n ) monoton steigend.
Außerdem gilt s2n − s2n−1 = (−1)2n+1 a2n = −a2n < 0 und damit s2 ≤ s2n <
s2n−1 ≤ s1 .
Nach Satz 2.3.1 konvergieren damit die Folgen (s2n−1 ) und (s2n ), und wegen
s2n − s2n−1 = −a2n → 0 haben sie den gleichen Grenzwert. Daraus folgt die Behauptung. P
(−1)n+1
Beispiel. ∞
= 1 − 12 + 13 − . . . ist konvergent. Für die Summe s gilt
n=1
n
s2 = 21 ≤ s ≤ 1 = s1 . (Tatsächlich gilt es = 2, und es ist s = 0, 6931471806 . . . .)
P∞
Satz 2.6.4 (Cauchykriterium für Reihen) Eine Reihe
k=K ak konvergiert
genau dann, wenn für alle ε ∈ R+ ein N ∈ NPmit N ≥ K existiert, so dass für alle
m, n ∈ N mit n > m ≥ N die Ungleichung nk=m+1 ak < ε gilt, d. h., falls
n
X
∀ε ∈ R+ ∃N ≥ K∀m, n ∈ N : n > m ≥ N ⇒ ak < ε.
k=m+1
46
2 FOLGEN UND REIHEN
Beweis. Wegen sn − sm =
Satz 2.6.5 Konvergiert
Pn
k=m+1
P∞
k=K
ak folgt die Behauptung aus Satz 2.3.5. ak , so gilt limk→∞ ak = 0.
Beweis. Man wähle n = m + 1 im Cauchykriterium.
Die harmonische Reihe zeigt, dass in Satz 2.6.5 nicht die Umkehrung gilt.
2.7
Absolute und bedingte Konvergenz
Definition 2.7.1 Eine Reihe
giert.
P
an heißt absolut konvergent, wenn
P
|an | konver-
s
2
=
3s
2
= 1
+ 31
1
2
− 41
+ 51
− 14
+ 13
− 21
− 16
+ 71
+ 16
+ 51
+ 17
n
n
X
X
aν(k) −
|tn − sn | = ak k=1
k=1
n
X
X
ak −
= ak k∈ν({1,2,...,n})
k=1
n
X
X
= ak −
ak k∈ν({1,2,...,n})\{1,2,...,N }
k=N +1
≤
P
P
Der Beweis folgt wegen nk=m+1 ak ≤ nk=m+1 |ak | unmittelbar aus dem Cauchykriterium. P
(−1)n+1
konvergent, aber nicht
Die Umkehrung des Satzes gilt nicht. So ist ∞
n=1
n
absolut konvergent.
Wir betrachten dieses Beispiel genauer:
= 1 − 12
Sei ε ∈ R+ .Wegen der P
absoluten Konvergenz und aufgrund des Cauchykriteriums existiert N ∈ N mit nm+1 |ak | < ε für n > m ≥ N. Weiter existiert M ∈ N
mit M > N und ν({1, 2, . . . , M}) ⊃ {1, 2, . . . , N}. Für n ≥ M folgt dann
max ν({1,2,...,n})
Satz 2.7.1 Absolut konvergente Reihen sind konvergent.
s
47
2.7 Absolute und bedingte Konvergenz
− 81
+...
− 81
+...
− 41
+...
Es zeigt sich, dass in der Reihe für 3s
dieselben Folgenglieder auftreten wie in der
2
Reihe für s, aber in anderer Reihenfolge.
P
DefinitionP2.7.2 Sei ν : N → N bijektiv und sei P ∞
k=1 ak eine Reihe. Dann heißt
∞
die Reihe k=1 aν(k) eine Umordnung der Reihe ∞
k=1 ak . Eine Reihe heißt unbedingt konvergent, wenn jede ihrer Umordnungen konvergiert, und zwar zur selben
Summe. Eine konvergente, aber nicht unbedingt konvergente Reihe heißt bedingt
konvergent.
X
|ak |
k=N +1
< ε. P
P∞
Satz 2.7.3 Seien ∞
k=0 ak und
k=0 bk absolut konvergente Reihen mit Summen
a und b. Dann ist die aus allen Produkten aj bk , j, k ∈ N0 , gebildete Reihe absolut
konvergent und ihre Summe ist ab.
Eine etwas formalere Fassung der Behauptung des Satzes ist folgende: ist φP: N0 →
∞
N0 × N0 eine Bijektion
und ist pn := aj bk falls φ(n) = (j, k), so ist
n=0 pn
P∞
konvergent mit n=0 pn = ab.
Beweis von Satz 2.7.3. Seien φ und pn wie oben, mit φ(n) = (φ1 (n), φ2 (n)) für
n ∈ N. Für i ∈ {1, 2} und n ∈ N sei Mi,n := max φi ({1, 2, . . . , n}). Dann ist
n
X
ℓ=0
|pℓ | =
≤
n
X
|aφ1 (ℓ) ||bφ2 (ℓ) |
ℓ=0
M1,n M2,n
XX
j=0 k=0
Bemerkung. Es gilt auch die Umkehrung.
P
P
Beweis von Satz 2.7.2. Sei ∞
sei ∞
k=1 ak absolut
k=1 aν(k)
Pn konvergente Reihe
Pund
n
eine Umordnung der Reihe. Sei sn = k=1 ak und sei tn = k=1 aν(k) . Dann ist
(sn ) konvergent, und wir müssen zeigen, dass (tn ) ebenfalls konvergent ist und
denselben Grenzwert hat. Dazu reicht es zu zeigen, dass tn − sn → 0.
!
M2,n
!
∞
X
M1,n
=
X
j=0
Satz 2.7.2 Absolut konvergente Reihen sind unbedingt konvergent.
|aj ||bk |
≤
∞
X
j=0
|aj |
|aj |
X
k=0
k=0
|bk |
!
!
|bk | .
P
Also konvergiert ∞
n=0 |pn | nach Satz 2.7.1.
P
Es reicht nun, ∞
n=0 pn = ab für eine Summationsreihenfolge (d. h., für eine
Funktion φ) zu zeigen. Dazu betrachten wir die im folgenden Diagramm angedeutete Summationsreihenfolge:
48
2 FOLGEN UND REIHEN
a0 b0
a1 b0
↓
a2 b0
a3 b0
↓
a4 b0
→ a0 b1
↓
← a1 b1
→ a2 b1
a0 b2
↑
a1 b2
↑
→ a2 b2
← a3 b1
← a3 b2
→ a0 b3
↓
a1 b3
↓
a2 b3
↓
← a3 b3
→ a4 b1
→ a4 b2
→ a4 b3
für n ∈ N. Dann gilt
a0 b4
↑
a1 b4
↑
a2 b4
↑
a3 b4
↑
a4 b4
→
|an | =
Da
X
pk =
und damit
k=0
aj
j=0
k=0
Pn
n
X
!
n
X
k=0
bk
!
→ ab
pk → ab. Nach Satz 2.7.3 ist das Cauchyprodukt zweier absolut konvergenter Reihen ebenfalls absolut konvergent. Darüberhinaus kann man zeigen, daß das Cauchyprodukt
auch dann konvergiert, und zwar zur “richtigen” Summe, wenn nur eine der beiden
beteiligten Reihen absolut konvergiert und die andere nur im gewöhnlichen Sinne
konvergiert.
P∞
1
n=1 n3/2
P∞
n=N
an und
(i) Existiert
M ≥ N mit |an | ≤ bn für n ≥ M und ist
P
ist ∞
n=N an absolut konvergent.
P∞
n=N
n=N bn konvergent, so
an :=
√
n
n2 + 1
3 + 4i
5
n
n
=
!n
√
√
√
3 2 + 42
n
n
1
≤ 2 = 3/2 .
= 2
5
n +1
n
n
√
n
n2 + 1
konvergiert, ist auch
P∞
n=1
an absolut konvergent.
P∞
n=N
an :=
für n ∈ N. Dann gilt
p
n
Wegen
1
e
|an | =
in
n+1
P∞
n=N
bn divergent, so
n(n+1)
!1
n+1
in n(n+1) n
n
=
=
n + 1
n+1
< 1 folgt, dass
P∞
n=N
1
1+
an absolut konvergent ist.
Satz 2.8.3 (Quotientenkriterium) Sei
In (i) kann an komplex sein, in (ii) muss an reell sein. Sowohl in (i) wie in (ii) ist
bn reell. Man nennt (i) Majorantenkriterium und (ii) Minorantenkriterium.
Pn
Pn
Beweis. (i).
P∞Mit sn = k=M |an | und tn = k=M bn ist sn ≤ tn für n ≥ M. Konvergiert n=N bn , so ist auch (tn )k≥M konvergent und folglich
P beschränkt. Damit
ist (sn )k≥M beschränkt, also konvergent, und damit auch ∞
n=N |an | konvergent.
Der Beweis von (ii) ist analog. Beispiel. Sei
|3 + 4i|
5
Beispiel. Sei
bn Reihen.
P∞
(ii) Existiert
M ≥ N mit 0 ≤ bn ≤ an für n ≥ M und ist
P
ist ∞
n=N an divergent.
p
Bemerkung. Die Voraussetzung in (i) ist äquivalent zuplim supn→∞ n |an | < 1, und
die Voraussetzung in (ii) ist erfüllt, falls lim supn→∞ n |an | > 1.
p
Beweis von Satz 2.8.2. (i). Aus n |an | ≤ q folgt |an | ≤ q n , und damit
P nfolgt die
Behauptung aus dem Vergleichskriterium, da die geometrische Reihe
q für 0 ≤
q < 1 konvergiert.
p
(ii). Aus n |an | ≥ 1 folgt |an | ≥ 1.
PGilt dies für unendlich viele n, so ist (an )
keine Nullfolge, und damit die Reihe
an divergent nach Satz 2.6.5. Kriterien für absolute Konvergenz
Satz 2.8.1 (Vergleichskriterium) Seien
n
n2 + 1
an Reihe.
p
P
n
(i) Existiert q ∈ [0, 1) und M ∈ N mit
|an | ≤ q für n ≥ M, so ist ∞
n=N an
absolut konvergent.
p
P
(ii) Ist n |an | ≥ 1 für unendlich viele n, so ist ∞
n=N an divergent.
Eine andere wichtige Summationsreihenfolge wird durch die folgende Definition
gegeben.
P
P∞
Definition
2.7.3 Seien P ∞
∈ N0 sei
cn :=
k=0 ak und
k=0 bk Reihen. Für
Pn
Pn
P∞
∞
∞
k=0 ak bn−k . Dann heißt
n=0 cn Cauchyprodukt der Reihen
k=0 ak und
k=0 bk .
2.8
√
Satz 2.8.2 (Wurzelkriterium) Sei
Es gilt dann
(n+1)2 −1
49
2.8 Kriterien für absolute Konvergenz
1 n+1
n
1
→ .
e
P∞
an Reihe.
≤ q für n ≥ M, so ist
(i) Existiert q ∈ [0, 1) und M ∈ N mit an 6= 0 und an+1
an P∞
a
absolut
konvergent.
n
n=N
P
≥ 1 für n ≥ M, so ist ∞
(ii) Existiert M ∈ N mit an 6= 0 und an+1
n=N an
an divergent.
n=N
Bemerkung. Es gelte an 6= 0 für n ≥ M. Die Voraussetzung in (i) ist dann äqui
valent zu lim supn→∞ an+1
< 1, und die Voraussetzung in (ii) ist erfüllt, falls
an an+1 lim inf n→∞ an > 1.
Beweis von Satz 2.8.3. (i). Es ist |an | ≤ q|an−1 | ≤ q 2 |an−2 | ≤ · · · ≤ q n−M |aM | =
q n q −M |aM | für n ≥ M. Die Behauptung folgt aus dem Vergleichskriterium.
50
2 FOLGEN UND REIHEN
(ii)
P Analog zu (i) folgt |an | ≥ |aM | für n ≥ M. Damit ist (an ) keine Nullfolge,
also
an divergent.
Beispiel. Sei
an :=
für n ∈ N. Dann gilt
an+1 an =
7n (2n)!n!
7n
3n =
(3n)!
n
7n+1 (2n + 2)!(n + 1)! (3n)!
(3n + 3)!
7n (2n)!n!
n
7 · 7 (2n + 2)(2n + 1)(2n)!(n + 1)n! (3n)!
=
(3n + 3)(3n + 2)(3n + 1)(3n)! 7n (2n)!n!
7(2n + 2)(2n + 1)(n + 1)
=
(3n + 3)(3n + 2)(3n + 1)
7(2n + 2)(2n + 1)(n + 1)
=
(3n + 3)(3n + 2)(3n + 1)
7 2 + n2 2 + n1 1 + n1
=
3 + n3 3 + n2 3 + n1
7·2·2·1
→
3·3·3
28
=
.
27
P
> 1 divergiert die Reihe
an .
Wegen
28
27
2.9
Potenzreihen
P∞
Definition 2.9.1 Eine Reihe der Form n=0 an (z − z0 )n , mit z, z0 ∈ C und einer
Folge (an ) komplexer Zahlen, heißt Potenzreihe.
Ist z0 und (an ) gegeben, so stellt sich die Frage, für welche z ∈ C die Reihe konvergiert. Dies wird weitgehend durch den folgenden Satz geklärt.
p
P
n
n
|an | und
Satz 2.9.1 Sei ∞
n=0 an (z − z0 ) Potenzreihe. Es sei ℓ := lim supn→∞
1
r := ℓ falls ℓ ∈ R+ , r := 0 falls ℓ = ∞ und r := ∞ falls ℓ = 0. Dann konvergiert
die Potenzreihe absolut falls |z − z0 | < r und sie divergiert falls |z − z0 | > r
p
p
n
n
Beweis. Sei bp
|bn | = n |an ||z − z0 |. Hieraus ergibt sich
n := an (z − z0 ) . Dann ist
n
lim supn→∞ |bn | = ℓ|z − z0 |. Die Behauptung folgt jetzt aus dem Wurzelkriterium. Bemerkung 1. Ist 0 < r < ∞, so konvergiert die Potenzreihe innerhalb eines Kreises
vom Radius r um z0 , und sie divergiert außerhalb dieses Kreises. Daher nennt man
das in Satz 2.9.1 definierte r den Konvergenzradius der Potenzreihe.
Bemerkung 2. Satz 2.9.1 macht keine Aussage für den Fall, dass |z − z0 | = r. Hier
ist in der Tat “alles möglich”, wie die folgenden Beispiele belegen:
51
2.9 Potenzreihen
P∞
also z0 = 0, an = n1 für n ∈ N und a0 = 0. Es gilt ℓ =
p
1
lim supn→∞ n |an | = lim supn→∞ √
n n = 1 und damit r = 1. Damit liegt (absolute) Konvergenz für |z| < 1 und Divergenz für |z| > 1 vor. Für z = 1 liegt
Divergenz vor, für z = −1 Konvergenz.
P∞ 1 n
(ii)
n=1 n2 z . Wieder gilt r = 1, aber diesmal liegt Konvergenz für alle z ∈ C
mit |z| = 1 vor.
P∞ n
(iii)
n=1 z . Wieder gilt r = 1, aber jetzt liegt Divergenz für alle z ∈ C mit
|z| = 1 vor.
P
n
r. Existiert
Satz 2.9.2 Sei ∞
n=0 an (z−z0 ) Potenzreihe mit Konvergenzradius
der
an an (möglicherweise uneigentliche) Grenzwert limn→∞ an+1
, so gilt r = limn→∞ an+1
.
(i)
1 n
n=1 n z ,
Der Beweis ist analog zum Beweis von Satz 2.9.1, wobei man statt des Wurzelkriteriums aber jetzt das Quotientenkriterium verwendet.
an (n+1)!
Beispiel. Sei an := n!1 für n ∈ N0 . Dann gilt limn→∞ an+1
= limn→∞ n! =
P∞ 1 n
limn→∞ n + 1 = ∞. Es folgt, dass die Potenzreihe n=0 n! z für alle z ∈ C konver√
giert. Ein Nebenergebnis ist, dass limn→∞ n n! = ∞.
Definition 2.9.2 Die durch exp(z) :=
heißt Exponentialfunktion.
P∞
1 n
n=0 n! z
definierte Funktion exp : C → C
Gemäß obigem Beispiel konvergiert die Reihe für alle z ∈ C. Statt exp(z) schreibt
man auch exp z.
Satz 2.9.3 Für z, w ∈ C gilt exp(z + w) = exp(z) · exp(w).
Beweis. Es gilt
exp(z) · exp(w)
=
Cauchy−Prod.
=
=
=
=
∞
X
1 n
z
n!
n=0
1
,
exp z
∞
X
1
(z + w)n
n!
n=0
exp(z + w). insbesondere also exp z 6= 0.
(ii) exp(nz) = (exp z)n .
·
∞
X
1 n
w
n!
n=0
!
n
∞
X
X
1 k
1
z
w n−k
k!
(n
−
k)!
n=0
k=0
!
∞
n X
1 X n k n−k
z w
n! k=0 k
n=0
Folgerung 2.9.1 Sei z ∈ C und n ∈ Z. Dann gilt:
(i) exp(−z) =
!
!
52
2 FOLGEN UND REIHEN
53
2.9 Potenzreihen
10
Man erhält hier (i) wegen exp(−z) exp z = exp(−z + z) = exp(0) = 1, und auch
(ii) folgt leicht.
n
Satz 2.9.4 Für z ∈ C gilt exp z = limn→∞ 1 + nz .
8
6
Beweis. Es reicht zu zeigen, dass
4
n
X
1 k z n
z − 1+
→0
k!
n
k=0
für n → ∞. Nun gilt für n ≥ 2, dass
n
n
n X 1
X 1
X
n
z n z k
k
k
z − 1+
z −
=
k
k!
n k!
n k=0
k=0
k=0
n
X
n!
1
1−
zk =
k!
(n − k)!nk
k=2
n
X 1
n(n − 1) · · · · · (n − k + 1)
1−
|z|k
≤
k!
nk
k=2
k !
n
X
1
n−k+1
≤
|z|k
1−
k!
n
k=2
k !
n
X
k−1
1
|z|k
1− 1−
=
k!
n
k=2
n
Bernoulli X 1
k−1
≤
1− 1−k
|z|k
k!
n
k=2
=
n
X
1 k(k − 1) k
|z|
k!
n
k=2
n
=
2
–8
≤
Dabei ist e = limn→∞ 1 +
Abbildung 3 zeigt den Graphen (der auf
Expon
Pein Intervall eingeschränkten)
nentialfunktion sowie die Graphen von x 7→ nk=0 k!1 xk und x 7→ 1 + nx für n = 3.
(Statt exp |R schreiben wir nur exp und nennen auch die eingeschränkte Funktion wieder Exponentialfunktion. Eine entsprechende Konvention wird auch für in
späteren Abschnitten eingeführte Funktionen wie Sinus und Cosinus gelten.)
Folgerung 2.9.2 exp 1 = e.
1 n
n
= 2, 718 . . . die in §2.3 definierte Eulersche Zahl.
Satz 2.9.5 Für x ∈ R gilt exp x = ex .
Aufgrund dieses Satzes setzt man ez := exp z für z ∈ C.
q
Beweis von Satz 2.9.5. Für p ∈ Z und q ∈ N ist exp 1q = exp q 1q = exp 1 = e,
p
p
also exp 1q = e1/q und damit exp pq = exp 1q = e1/q = ep/q . Daraus folgt die
Behauptung für alle r ∈ Q. Ist nun r ∈ R, so wähle man eine Folge (rn ) rationaler
Zahlen mit rn → r. Es gilt dann nach Definition von er , dass ern → er . Ähnlich
kann man (und werden wir später) zeigen, dass auch exp rn → exp r gilt. Hieraus
folgt dann die Behauptung. Wir verzichten jetzt auf die Details.
Satz 2.9.6 e ist irrational.
Beweis. Wir nehmen an, dass e rational ist, etwa e =
(q − 1)!p = q!e = q!
also
1 2
|z| exp |z|.
n
Hieraus folgt die Behauptung. 2
Abbildung 3: Die Exponentialfunktion und approximierende Polynome.
1X
1
|z|k
n k=2 (k − 2)!
1 2X 1 j
|z|
|z|
n
j!
j=0
0
–2
–2
n−2
=
–4
–6
S :=
∞
X
k=0
1
=
k!
∞
X
k=0
p
q
mit p, q ∈ N. Dann ist
q
∞
X
q! X q!
q!
=
+
,
k! k=0 k! k=q+1 k!
q
∞
X
X
q!
q!
= (q − 1)!p −
∈ N.
k!
k!
k=q+1
k=0
Dies steht im Widerspruch zu
1
1
1
+
+
+ ...
q + 1 (q + 1)(q + 2) (q + 1)(q + 2)(q + 3)
2 3
1
1
1
+
+
+ ...
<
q+1
q+1
q+1
∞
j
1
1 X
=
q + 1 j=0 q + 1
S =
54
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
1
1
1
q + 1 1 − q+1
1
=
q
≤ 1. =
3
Stetigkeit und Grenzwerte von Funktionen
3.1
55
3.1 Stetigkeit
3. Sei f : Z → C eine Funktion. Dann ist f stetig. Denn ist ξ ∈ Z und (xn )
Folge in Z mit xn → ξ, so existiert N ∈ N mit |xn − ξ| < 21 für n ≥ N. Es folgt
xn = ξ und damit f (xn ) = f (ξ) für n ≥ N, also f (xn ) → ξ.
Analog sieht man, dass Zahlenfolgen (also Funktionen von N nach C) stetig
sind.
4. Sei f : R+ → R,
(
0 falls x irrational,
f (x) =
1
falls x rational, mit x = pq , p, q ∈ N teilerfremd.
q
Behauptung. Die Funktion f ist stetig in irrationalen und unstetig in rationalen
Zahlen.
Stetigkeit
Definition 3.1.1 Seien M, N ⊂ C und sei f : M → N eine Funktion. Sei ξ ∈ M.
Dann heißt f stetig (englisch: continuous) in ξ, falls für jede Folge (xn ) in M mit
xn → ξ gilt, dass f (xn ) → f (ξ). Für A ⊂ M heißt f stetig in A, falls f stetig in
jedem Punkt von A ist. Schließlich heißt f stetig, wenn f stetig in M ist.
Es genügt natürlich im folgenden, den Fall N = C zu betrachten.
Aus den Sätzen aus §2.2 erhält man unmittelbar die folgenden Regeln:
• Sind f, g : M → C stetig (in ξ ∈ M), so sind auch f + g, f · g und mit c ∈ C
auch c · f stetig (in ξ). Falls g(ξ) 6= 0, so ist auch (die in M\g −1 (0) definierte)
Funktion fg stetig in ξ.
• f ist stetig (in ξ) genau dann, wenn Re f und Im f stetig (in ξ) sind.
• Die durch z 7→ |z| und z 7→ z definierten Funktionen sind stetig.
In §2.5 wurde gezeigt, dass für a ∈ R+ die durch x → ax definierte Funktion von
R nach R+ stetig ist.
Offensichtlich ist für M ⊂ C auch die Funktion idM stetig.
Satz 3.1.1 Seien M, N, P, Q ⊂ C mit N ⊂ P und seien g : M → N stetig (in
ξ ∈ M) und f : P → Q stetig (in g(ξ) ∈ g(M) ⊂ N ⊂ P ). Dann ist f ◦ g stetig
(in ξ).
Beweis. Sei (xn ) Folge in M mit xn → ξ. Da g stetig, folgt g(xn ) → g(ξ). Nun
ist aber (g(xn )) Folge in P und damit folgt aus der Stetigkeit von f in g(ξ), dass
f (g(xn )) → f (g(ξ)), also (f ◦ g)(xn ) → (f ◦ g)(ξ). Beispiele. 1. Die Funktion f : C → C, z 7→ |z 2 + z| ist stetig. Denn die Funktionen
f1 := idC , f2 : C → C, f2 (z) = z, und f3 : C → C, f3 (z) = |z|, sind alle stetig und
damit auch f1 · f1 , f1 · f1 + f2 und f = f3 ◦ (f1 · f1 + f2 ).
2. Die Funktion f : R+ → R,
f (x) =
x3 |x4 − 7|
,
(ex − 9x)2 + 11
ist stetig, da sie durch Verknüpfungen wie +, ·, ◦, . . . aus stetigen Funktionen aufgebaut ist. (Man beachte, dass der Nenner keine Nullstellen hat.)
√
Beweis. Sei ξ ∈ Q. Dann ist durch xn = ξ + n2 eine Folge (xn ) in R+ \Q mit xn → ξ
gegeben. Es gilt dann f (xn ) = 0 für alle n ∈ N, also f (xn ) → 0, wegen f (ξ) 6= 0
also f (xn ) 6→ f (ξ).
Sei nun ξ ∈ R+ \Q und sei (xn ) Folge in R+ \Q mit xn → ξ. Zu
ist,
zeigen
dass f (xn ) → f (ξ). Sei dazu ε ∈ R+ . Für q ∈ N sei δq := minp∈N ξ − pq . Dann
gilt δq > 0 für alle q ∈ N und damit folgt δ := minq≤ 1 δq > 0. Nach Wahl von
ε
δ gilt für x ∈ R+ ∩ Q mit |x − ξ| < δ, dass aus x = pq mit p, q ∈ N teilerfremd
q > 1ε und damit |f (x)| = 1q < ε folgt. Außerdem gilt natürlich |f (x)| = 0 < ε für
x ∈ R+ \Q und damit insgesamt |f (x)| < ε für alle x ∈ R+ mit |x − ξ| < δ. Nun
existiert N ∈ N mit |xn − ξ| < δ für n ≥ N. Es folgt |f (xn )| < ε für n ≥ N, also
f (xn ) → 0 = f (ξ). Satz 3.1.2 Sei M ⊂ C, f : M → C und ξ ∈ M. Dann ist f stetig in ξ genau
dann, wenn zu jedem ε ∈ R+ ein δ ∈ R+ existiert, so dass für jedes x ∈ M mit
|x − ξ| < δ gilt, dass |f (x) − f (ξ)| < ε ist.
In Quantorenschreibweise lautet die hier angegebene, zur Stetigkeit in ξ äquivalente, Bedingung wie folgt:
∀ε ∈ R+ ∃δ ∈ R+ ∀x ∈ M : |x − ξ| < δ ⇒ |f (x) − f (ξ)| < ε.
Man nimmt diese Bedingung oft auch zur Definition der Stetigkeit.
Beweis von Satz 3.1.2. “⇐”. Die “ε-δ-Bedingung” sei erfüllt und es sei (xn ) Folge
in M mit xn → ξ. Zu zeigen ist, dass f (xn ) → f (ξ). Sei dazu ε > 0. Dann existiert
δ > 0, so dass für alle x ∈ M
|x − ξ| < δ ⇒ |f (x) − f (ξ)| < ε
gilt. Wegen xn → ξ existiert N ∈ N mit |xn − ξ| < δ für n ≥ N. Es folgt |f (xn ) −
f (ξ)| < ε für n ≥ N.
“⇒”. Wir zeigen die Kontraposition und nehmen an, dass die “ε-δ-Bedingung”
nicht erfüllt ist. Dann existiert ε ∈ R+ mit folgender Eigenschaft:
∀δ ∈ R+ ∃x ∈ M : |x − ξ| < δ ∧ |f (x) − f (ξ)| ≥ ε.
Insbesondere existiert dann zu n ∈ N ein xn ∈ M mit |xn − ξ| < n1 und |f (xn ) −
f (ξ)| ≥ ε. Es folgt xn → ξ und f (xn ) 6→ f (ξ). Damit ist f nicht stetig in ξ. 56
3.2
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Der Zwischenwertsatz
Satz 3.2.1 (Zwischenwertsatz) Seien a, b ∈ R mit a < b und sei f : [a, b] → R
stetig. Sei η ∈ R ein Wert zwischen f (a) und f (b), d. h., es gilt entweder f (a) <
η < f (b) oder f (b) < η < f (a). Dann existiert ξ ∈ (a, b) mit f (ξ) = η.
Beweis. Ohne Beschränkung der Allgemeinheit sei f (a) < η < f (b). Es sei M :=
{t ∈ [a, b] : f (t) ≤ η}. Dann ist M 6= ∅ wegen a ∈ M. Außerdem ist M durch b nach
oben beschränkt und damit existiert ξ := sup M. Nun existiert eine Folge (xn ) in M
mit xn → ξ. Da f stetig, folgt f (xn ) → f (ξ). Wegen f (xn ) ≤ η ergibt sich f (ξ) ≤ η,
also ξ ∈ M. Wegen b ∈
/ M existiert auch eine Folge (yn ) in (ξ, b] ⊃ [a, b]\M mit
yn → ξ, etwa yn := ξ + b−ξ
. Es folgt f (yn ) → f (ξ), wegen f (yn ) > η also f (ξ) ≥ η.
n
Insgesamt ergibt sich f (ξ) = η. Beispiel. Die Funktion f : R → R, x 7→ ex + x, hat eine Nullstelle in (−1, 0),
d. h., es existiert ξ ∈ (−1, 0) mit f (ξ) = 0. Denn f ist stetig in R ⊃ [−1, 0] und
f (−1) = e−1 − 1 < 0 und f (0) = e0 + 0 = 1 > 0.
[ξ − r, ξ + r] ⊂ I. Sei nun 0 < ε ≤ r. Wir setzen δ := min{f (ξ + ε) − η, η − f (ξ − ε)}.
Für y ∈ J mit |y − η| < δ gilt dann
f (ξ − ε) ≤ η − δ < y < η + δ ≤ f (ξ + ε)
und damit wegen der strengen Monotonie ξ − ε < f −1 (y) < ξ + ε, also |f −1 (y) −
f −1 (η)| < ε. Damit ist f −1 stetig in η.
Den Fall, dass ξ Randpunkt von I ist, kann man ähnlich behandeln. Ist etwa
I = [ξ, b], so wählt man δ := f (ξ + ε) − η für 0 < ε ≤ b − ξ. Wir verzichten auf die
Details. Beispiel. Es sei a > 1 und f : R → R+ , x 7→ ax . Dann ist f streng monoton steigend,
stetig und bijektiv. Damit existiert die Umkehrfunktion und sie ist ebenfalls stetig
und streng monoton steigend. Sie heißt Logarithmus zur Basis a und wird mit loga
bezeichnet. Im Falle a = e nennen wir sie natürlicher Logarithmus oder einfach
Logarithmus und schreiben log x oder ln x statt loge x. Der Fall 0 < a < 1 ist
analog. Hier sind f und f −1 streng monoton fallend.
5
Eine andere Formulierung von Satz 3.2.1 ist die folgende: ist f : [a, b] → R
stetig, so gilt [f (a), f (b)] ⊂ f ([a, b]) falls f (a) < f (b) und [f (b), f (a)] ⊂ f ([a, b])
falls f (b) < f (a).
4
3
2
Satz 3.2.2 Sei I Intervall und sei f : I → R stetig und nicht konstant. Dann ist
f (I) ein Intervall.
1
Ist f konstant, so besteht f (I) aus einem Punkt. Wir haben konstante Funktionen in Satz 3.2.2 ausgeschlossen, da wir einpunktige Mengen nicht als Intervalle
betrachtet haben.
Beweis von Satz 3.2.2. Sei α := inf f (I) und β := sup f (I) (wobei die Werte
±∞ zugelassen sind). Dann gilt α < β, da f nicht konstant. Wir zeigen, dass
(α, β) ⊂ f (I). Sei dazu η ∈ (α, β), also α < η < β. Dann existieren a, b ∈ I mit
α ≤ f (a) < η < f (b) ≤ β. (Es muss nicht a < b gelten.) Nach Zwischenwertsatz
existiert ξ ∈ I mit f (ξ) = η. Es folgt η ∈ f (I), also (α, β) ⊂ f (I).
Da aber für η > β und η < α sicher η ∈
/ f (I) gilt, ergibt sich, dass f (I) eines
der vier Intervalle (α, β), [α, β), (α, β] und [α, β] ist. Beispiel. Für f : (−1, 1) → R, f (x) = x2 , gilt f ((−1, 1)) = [0, 1).
Satz 3.2.3 Seien I, J Intervalle und sei f : I → J stetig und surjektiv. Ist f
streng monoton steigend (bzw. fallend), so ist f bijektiv und die Umkehrfunktion
f −1 : J → I ist ebenfalls stetig und streng monoton steigend (bzw. fallend).
Beweis. Zunächst folgt aus der strengen Monotonie von f die Injektivität und damit
die Bijektivität von f . Desweiteren sieht man unmittelbar, dass f −1 ebenfalls streng
monoton ist.
Wir zeigen jetzt, dass f −1 stetig ist. Ohne Beschränkung der Allgemeinheit sei
f streng monoton steigend. Sei η ∈ J = f (I) und ξ := f −1 (η). Wir betrachten
zunächst den Fall, dass ξ kein “Randpunkt” von I ist. Dann existiert r > 0 mit
57
3.3 Grenzwerte von Funktionen
–2
–1 0
–1
1
2
3
4
5
–2
Abbildung 4: Die Graphen von exp, ln und idR .
Für a, b, c ∈ R+ gilt also aloga b = b und eln c = c. Für u ∈ R+ und v ∈ R ist
damit
v
uv = eln u = ev·ln u = exp(v · ln u).
Dies zeigt einerseits, dass für a > 0 die durch x 7→ xa definierte Funktion g :
R+ → R+ stetig ist. Zum anderen legt es für a ∈ R+ und z ∈ C die Definition
az := exp(z · ln a) nahe. Die durch z →
7 az definierte Funktion von C nach C ist
dann ebenfalls stetig.
3.3
Grenzwerte von Funktionen
Definition 3.3.1 Sei M ⊂ C und ξ ∈ C. Dann heißt ξ Häufungspunkt von M,
falls eine Folge (xn ) in M\{ξ} mit xn → ξ existiert.
In obiger Definition ist sowohl ξ ∈ M wie auch ξ ∈
/ M zugelassen.
Der Begriff des Häufungspunktes (einer Menge) sollte nicht mit dem Begriff des
Häufungswerts (einer Folge) verwechselt werden.
58
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
59
3.3 Grenzwerte von Funktionen
Definition 3.3.2 Sei M ⊂ C, ξ Häufungspunkt von M und f : M → C Funktion.
Wir sagen, dass f (x) für x → ξ konvergiert, falls η ∈ C existiert, so dass für
jede Folge (xn ) in M\{ξ} mit xn → ξ auch f (xn ) → η gilt. Dieses η heißt dann
Grenzwert von f für x → ξ und wird mit limx→ξ f (x) bezeichnet.
existiert, so dass für alle x ∈ M\{ξ} mit |x − ξ| < δ die Ungleichung |f (x) − η| < ε
gilt, d. h., wenn
Ist in obiger Definition M ⊂ R oder f : M → R, so können wir auch uneigentliche
Grenzwerte zulassen, d. h., es kann ξ = ±∞ oder η = ±∞ sein.
Beispiel. Es gilt
Satz 3.3.1 Sei M ⊂ C und ξ ∈ M. Weiter sei ξ Häufungspunkt von M und
f : M → C eine Funktion. Dann ist f stetig in ξ genau dann, wenn limx→ξ f (x) =
f (ξ).
Beweis. Für z 6= 0 gilt
Hierbei bedeutet limx→ξ f (x) = f (ξ) natürlich wieder, dass der Grenzwert existiert
und den Wert f (ξ) hat.
Falls ξ ∈ M gilt, aber ξ kein Häufungspunkt von M ist, so ist jede Funktion
f : M → C stetig in ξ (denn für jede Folge (xn ) in M mit xn → ξ existiert N ∈ N
mit xn = ξ falls n ≥ N).
Beweis von Satz 3.3.1. “⇐”. Sei (xn ) eine Folge in M mit xn → ξ. Zu zeigen
ist, dass f (xn ) → f (ξ). Dies ist trivial, falls ein N ∈ N mit xn = ξ für n ≥ N
existiert. Andernfalls sei (xnk ) die Teilfolge aller xn mit xn 6= ξ. Dann ist (xnk )
Folge in M\{ξ}. Nach Voraussetzung gilt also f (xnk ) → f (ξ). Sei nun ε > 0. Dann
existiert K ∈ N mit |f (xnk ) − f (ξ)| < ε für k ≥ K. Sei jetzt n ≥ nK . Existiert
dann k ∈ N mit n = nk , so gilt k ≥ K und damit |f (xn ) − f (ξ)| < ε. Ist aber
n 6= nk für alle k ∈ N, so gilt xn = ξ, also |f (xn ) − f (ξ)| = 0 < ε. Es folgt
f (xn ) → f (ξ).
“⇒”. Diese Richtung ist trivial. Satz 3.3.2 Sei M ⊂ C, ξ Häufungspunkt von M, f : M → C eine Funktion und
η ∈ C. Dann ist die durch
f (x) falls x ∈ M\{ξ} ,
F (x) =
η
falls x = ξ
definierte Funktion F : M ∪{ξ} → C genau dann stetig in ξ, wenn limx→ξ f (x) = η
gilt.
Der Beweis folgt aus Satz 3.3.1, da limx→ξ F (x) = limx→ξ f (x) gilt. (Die letzte
Gleichung ist dabei in dem Sinne zu verstehen, dass aus der Existenz des einen
Grenzwertes die des anderen folgt, und dass die Grenzwerte dann den gleichen
Wert haben.)
Ist ξ ∈
/ M und limx→ξ f (x) = η, so heißt die in Satz 3.3.2 definierte Funktion F
stetige Ergänzung (oder stetige Fortsetzung) von f (in ξ).
Für Grenzwerte von Summen, Produkten, usw. von Funktionen gelten wieder
die üblichen Rechenregeln. Auch die ε-δ-Definition der Stetigkeit (angewandt auf
die Funktion F von oben) überträgt sich entsprechend.
Satz 3.3.3 Sei M ⊂ C, ξ Häufungspunkt von M, f : M → C eine Funktion und
η ∈ M. Dann gilt limx→ξ f (x) = η genau dann, wenn für alle ε ∈ R+ ein δ ∈ R+
∀ε ∈ R+ ∃δ ∈ R+ ∀x ∈ M\{ξ} : |x − ξ| < δ ⇒ |f (x) − η| < ε.
lim
z→0
1
ez − 1
=
z
z
Es folgt
∞
X
zk
k=0
k!
ez − 1
= 1.
z
−1
!
=
∞
X
z k−1
k=1
k!
=
∞
X
j=0
zj
.
(j + 1)!
z
∞
∞
e − 1
X z j X
|z|j
=
−
1
.
≤
z
(j + 1)! (j + 1)!
j=1
j=1
Für 0 < |z| < 1 gilt damit
z
∞
X
e − 1
1
≤ |z|
−
1
= |z|(e − 2).
z
(j
+
1)!
j=1
z
ε
Dies ergibt e z−1 − 1 < ε für |z| < min{ e−2
, 1}. Satz 3.3.4 (Cauchykriterium für Funktionengrenzwerte) Sei M ⊂ C, ξ
Häufungspunkt von M und f : M → C eine Funktion. Dann existiert der Grenzwert
limx→ξ f (x) genau dann, wenn für alle ε ∈ R+ ein δ ∈ R+ existiert, so dass für
alle x, y ∈ M\{ξ} mit |x − ξ| < δ und |y − ξ| < δ die Ungleichung |f (x) − f (y)| < ε
gilt, d. h., wenn
∀ε ∈ R+ ∃δ ∈ R+ ∀x, y ∈ M\{ξ} : |x − ξ| < δ ∧ |y − ξ| < δ ⇒ |f (x) − f (y)| < ε.
Beweis. “⇒”. Sei η := limx→ξ f (x). Sei ε > 0. Nach Satz 3.3.3 existiert δ > 0, so
dass |f (x)−η| < 2ε für x ∈ M \{ξ} mit |x−ξ| < δ. Für x, y ∈ M \{ξ} mit |x−ξ| < δ
und |y − ξ| < δ folgt dann |f (x) − f (y)| ≤ |f (x) − f (η)| + |f (η) − f (y)| < 2ε + 2ε = ε.
“⇐”. Sei (xn ) Folge in M\{ξ} mit xn → ξ. Sei ε > 0 und sei δ > 0 mit der
im Satz angegebenen Eigenschaft gewählt. Dann existiert N ∈ N mit |xn − ξ| < δ
für n ≥ N. Für m, n ≥ N folgt dann |f (xm ) − f (xn )| < ε. Damit ist (f (xn ))
Cauchyfolge, also konvergent. Sei η := limn→∞ f (xn ).
Ist nun (x′n ) eine Folge in M\{ξ} mit x′n → ξ, so existiert ebenfalls η ′ :=
limn→∞ f (x′n ). Da aber auch (x1 , x′1 , x2 , x′2 , x3 , x′3 , . . . ) eine Folge in M\{ξ} mit
Grenzwert ξ ist, folgt η ′ = η und damit die Behauptung. Definition 3.3.3 Sei M ⊂ R, ξ Häufungspunkt von Mr := M ∩ [ξ, ∞) und
f : M → C eine Funktion. Existiert dann ηr := limx→ξ (f |Mr )(x), so heißt ηr
rechtsseitiger Grenzwert von f (x) für x → ξ und wird mit limx→ξ+ f (x) bezeichnet.
Analog heißt limx→ξ− f (x) := limx→ξ (f |Ml )(x) linksseitiger Grenzwert von f (x)
für x → ξ (falls er existiert), wobei Ml := M ∩ (−∞, ξ].
60
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Ist ξ Häufungspunkt von Mr , so ist ξ auch Häufungspunkt von M. Existiert dann
limx→ξ f (x), so existiert auch limx→ξ+ f (x) und die Werte sind gleich. Analoges gilt
falls ξ Häufungspunkt von Ml ist.
Ist ξ Häufungspunkt von Mr und Ml , so existiert limx→ξ f (x) genau dann, wenn
limx→ξ+ f (x) und limx→ξ− f (x) beide existieren und gleich sind. In diesem Falle gilt
limx→ξ f (x) = limx→ξ+ f (x) = limx→ξ− f (x).
Definition 3.3.4 Sei M ⊂ R, ξ ∈ M und f : M → C eine Funktion. Seien Mr
und Ml wie in Definition 3.3.3. Dann heißt f rechtsseitig stetig in ξ falls f |Mr stetig
in ξ ist und linksseitig stetig in ξ falls f |Ml stetig in ξ ist.
Ist ξ Häufungspunkt von Mr bzw. Ml , so erhält man aus Satz 3.3.1 unmittelbar,
dass f genau dann rechts- bzw. linksseitig stetig in ξ ist, wenn limx→ξ+ f (x) = f (ξ)
bzw. limx→ξ− f (x) = f (ξ).
Weiter sieht man leicht ein, dass f genau dann stetig in ξ ist, wenn f rechtsund linksseitig stetig in ξ ist.
Beispiel. Sei f : R → R,
f (x) =
(
ex −1
falls x < 0 ,
e
falls x ≥ 0.
√x
x
3.4 Trigonometrische und hyperbolische Funktionen
61
Die Potenzreihendarstellung des Cosinus erhält man wie folgt. Zunächst ist
!
∞
∞
∞
X
1 X 1 n n X 1
11 n
cos z =
i z +
(−i)n z n =
([i + (−i)n ]) z n
2 n=0 n!
n!
n!
2
n=0
n=0
Für n ungerade folgt 21 (in + (−i)n) = 0. Für n gerade, etwa n = 2k, k ∈ N0 , folgt
1 n
(i + (−i)n ) = 12 (−1)k + (−1)k = (−1)k . Es ergibt sich
2
cos z =
∞
X
(−1)k
k=0
(2k)!
1
1
z 2k = 1 − z 2 + z 4 − . . . .
2
24
Analog folgt
sin z =
∞
X
1
1 5
(−1)k 2k+1
z
= z − z3 +
z − ....
(2k
+ 1)!
6
120
k=0
Insbesondere folgt, dass für x ∈ R auch cos x ∈ R und sin x ∈ R gilt. Weiter ist für
x ∈ R auch Re (eix ) = cos x, Im (eix ) = sin x und |eix | = 1.
Es ist leicht zu sehen, dass f stetig in R\{0} ist.
Außerdem gilt limx→0− f (x) = 1 wegen des Beispiels nach Satz 3.3.3 und
limx→0+ f (x) = f (0) = e0 = 1 da f |[0, ∞) stetig ist. Es folgt, dass f stetig in
0 ist.
Insgesamt ist f also stetig (in R).
3.4
Trigonometrische und hyperbolische Funktionen
Definition 3.4.1 Die durch cos z := 21 (eiz + e−iz ) und sin z :=
nierten Funktionen von C nach C heißen Cosinus und Sinus.
1
2i
(eiz − e−iz ) defi-
Da exp stetig ist, sind nach §3.1 auch cos und sin stetig. Wir stellen einige einfache
Eigenschaften zusammen (dabei sind im folgenden immer z, w ∈ C):
cos 0 = 1, sin 0 = 0, cos(−z) = cos z, sin(−z) = − sin z.
z+w
Aus e
Abbildung 5: Die Graphen des (auf R eingeschränkten) Sinus und Cosinus.
z w
= e e erhält man mit kurzer Rechung die Additionstheoreme
cos(z + w) = cos z cos w − sin z sin w,
sin(z + w) = sin z cos w + cos z sin w.
Mit w = −z folgt insbesondere
cos2 z + sin2 z = 1.
(Hierbei steht cos2 z für (cos z)2 .) Weiterhin gilt
1 iz
1 iz
e + e−iz + i
e − e−iz = eiz .
cos z + i sin z =
2
2i
Satz 3.4.1 Für x ∈ [0, 2] gilt
1
1
1
1 − x2 ≤ cos x ≤ 1 − x2 + x4
2
2
24
und
1
x − x3 ≤ sin x ≤ x.
6
Insbesondere gilt cos 1 > 0, cos 2 < 0 und sin x > 0 für alle x ∈ (0, 2].
Beweis. Sei x ∈ [0, 2]. Für k ∈ N sei ck :=
ck+1 =
x2k
.
(2k)!
Dann gilt
x2k+2
x2k
x2k 4
1
x2
=
≤
= ck ≤ ck .
(2k + 2)!
(2k)! (2k + 1)(2k + 2)
(2k)! 3 · 4
3
Die Folge (ck ) ist also monoton fallend. Außerdem konvergiert
sie gegen 0. Das
P∞
k
Leibnizkriterium liefert nun einerseits, dass die Reihe
k=1 (−1) ck konvergiert,
und andererseits, dass für die Summe s der Reihe und die Partialsummen sn die
62
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
63
3.4 Trigonometrische und hyperbolische Funktionen
Ungleichung s1 ≤ s ≤ s2 gilt. Die Konvergenzaussage ist nun nicht neu, denn wir
kennen ja sogar schon die Summe s = cos x − 1 der Reihe. Wir benutzen aber jetzt
die Ungleichung für die Partialsummen und erhalten
Satz 3.4.4
Es ist cos π2 = 0, sin π2 = 1 und für z ∈ C gilt sin z + π2 = cos z,
cos z + π2 = − sin z, sin (z + π) = − sin z, cos (z + 2π) = cos z, sin (z + 2π) =
sin z und ez+2πi = ez .
1
1
1
1 − x2 = 1 + s1 ≤ 1 + s = cos x ≤ 1 + s2 = 1 − x2 + x4 .
2
2
24
Beweis. Nach Definition von π gilt cos π2 = 0. Wegen cos2 π2 + sin2 π2 = 1 und
sin π2 > 0 folgt hieraus sin π2 = 1.
Für z ∈ C ist
π
π
π
= sin z cos + cos z sin = cos z.
sin z +
2
2
2
π
Analog beweist man cos z + 2 = − sin z. Hieraus folgen die weiteren Gleichungen
leicht. Bei der letzten benutze man ez = cos zi + i sin zi . Die Abschätzung für sin x erhält man analog.
Die Behauptungen cos 1 > 0, cos 2 < 0 und sin x > 0 für alle x ∈ (0, 2] folgen
unmittelbar aus den Abschätzungen für cos x und sin x. Die Graphen des Cosinus und Sinus sowie der in Satz 3.4.1 auftretenden Teilsummen der Potenzreihen sind in Abbildung 6 dargestellt.
2
2
1
1
0
–1
0.5
1
1.5
2
2.5
3
0
0.5
1
1.5
2
2.5
3
–1
Da der Cosinus im Intervall [0, π2 ] streng monoton fallend ist und cos2 x + sin2 x
und sin x ≥ 0 für 0 ≤ x ≤ π2 gilt, folgt, dass der Sinus in diesem Intervall streng
monoton steigend ist. Wegen sin 0 = 0 und sin(−x) = − sin x folgt, dass
der Sinus
sogar im Intervall [− π2 , π2 ] streng monoton steigend ist. Wegen sin −π2 = −1
und
sin π2 = 1 ist damit durch x 7→ sin x eine bijektive Funktion von − π2 , π2 nach
[−1, 1] definiert; vgl. Satz 3.2.3. Ihre Umkehrfunktion
heißt Arcus Sinus und wird
mit arcsin bezeichnet, also arcsin : [−1, 1] → − π2 , π2 , mit
sin(arcsin(x)) = x für x ∈ [−1, 1]
–2
und
–2
Abbildung 6: Cosinus (links), Sinus (rechts) und Teilsummen der Potenzreihen.
Satz 3.4.2 Der Cosinus ist im Intervall [0, 2] streng monoton fallend, d. h., die
Funktion cos |[0, 2] ist streng monoton fallend.
Beweis. Sei 0 ≤ x < y ≤ 2. Mit s := (y + x)/2 und t := (y − x)/2 gilt x = s − t
und y = s + t sowie 0 < s < 2 und 0 < t < 2. Wegen cos(−x) = cos x und
sin(−x) = − sin x folgt aus dem Additionstheorem
h π πi
arcsin(sin(x)) = x für x ∈ − ,
.
2 2
π π
Man beachte, dass die letzte Gleichung nicht für x ∈ R\ − 2 , 2 gilt. Aus Satz 3.2.3
folgt, dass arcsin stetig ist.
Ähnlich sieht man, dass der Cosinus sogar auf dem Intervall [0, π] streng monoton fallend ist. Durch x 7→ cos x wird also eine bijektive Funktion von [0, π] nach
[−1, 1] definiert. Ihre Umkehrfunktion heißt Arcus Cosinus und wird mit arccos
bezeichnet.
3
cos y − cos x = cos(s + t) − cos(s − t)
= cos s cos t − sin s sin t − (cos s cos(−t) − sin s sin(−t))
= −2 sin s sin t.
Nach Satz 3.4.1 gilt sin s > 0 und sin t > 0 und damit cos y < cos x.
Satz 3.4.3 Der Cosinus hat im Intervall [0, 2] genau eine Nullstelle ξ. Es gilt
1 < ξ < 2.
Beweis. Da cos 1 > 0 und cos 2 < 0 folgt die Existenz einer Nullstelle ξ aus dem
Zwischenwertsatz. Die Eindeutigkeit folgt aus der strengen Monotonie. arccos 2
1
–1
0
1
arcsin –1
Abbildung 7: Die Graphen des Arcus Sinus und Arcus Cosinus.
Wir benutzen jetzt obigen Satz zur Definition der “Kreiszahl” π.
Definition 3.4.2 Die Zahl π ist definiert durch π := 2ξ, wobei ξ die Nullstelle des
Cosinus aus Satz 3.4.3 ist.
Zur Definition von zwei weiteren Funktionen Tangens und Cotangens benötigen
wir noch folgenden Satz.
64
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
8
Satz 3.4.5 Sei z ∈ C. Es gilt cos z = 0 genau dann, wenn k ∈ Z mit z = π2 + kπ
existiert, und es gilt sin z = 0 genau dann, wenn k ∈ Z mit z = kπ existiert.
cosh
Die Funktionen tan und cot sind stetig. Für z aus dem entsprechenden Definitionsbereich gilt
− sin z
sin(z + π)
=
= tan z
tan(z + π) =
cos(z + π)
− cos z
und analog cot(z + π) = cot z. Viele weitere Eigenschaften von Tangens und Cotangens lassen sich leicht aus denen von Cosinus und Sinus ableiten.
Insbesondere sieht man leicht, dass der Tangens streng monoton steigend im
Intervall (− π2 , π2 ) ist und dieses Intervall auf R abbildet. Die Umkehrfunktion heißt
Arcus Tangens und wird mit arctan bezeichnet. Es gilt also arctan : R → (− π2 , π2 ).
Schließlich ist der Cotangens streng monoton fallend im Intervall (0, π) und er
bildet dieses Intervall auf R ab. Die Umkehrfunktion heißt Arcus Cotangens und
wird mit arccot bezeichnet.
3
2
arctan
cot
–1 0
2
–3
–2
–1
0
tanh
1
2
3
–2
–4
sinh
–6
–8
Abbildung 9: Die Graphen der hyperbolischen Funktionen.
Die in Definition 3.4.1 und 3.4.3 definierten Funktionen heißen trigonometrische
Funktionen. Die in Definition 3.4.4 definierten Funktionen heißen hyperbolische
Funktionen.
Auch die hyperbolischen Funktionen sind wieder stetig. Es gilt cosh z = cos iz,
sinh z = −i sin iz, tanh z = −i tan iz und coth z = i cot iz.
Wir verzichten hier auf eine Diskussion der Umkehrfunktionen der (auf geeignete Intervalle eingeschränkten) hyperbolischen Funktionen. Diese werden Area sinus
hyperbolicus, Area cosinus hyperbolicus, usw., genannt und mit arsinh, arcosh,
artanh, arcoth bezeichnet.
3.5
Polarkoordinaten
Mit Hilfe der Umkehrfunktionen der trigonometrischen Funktionen kann man folgenden Satz beweisen.
Satz 3.5.1 Sei z ∈ C \ {0}. Dann existiert genau ein ϕ ∈ (−π, π] mit z = |z|eiϕ .
tan
1
–2
coth
3
2
–3
6
4
Beweis. “⇐”. Dies ist klar nach Satz 3.4.4
“⇒”. Sei cos z = 0, z = x + iy, x, y ∈ R. Nach Definition des Cosinus folgt dann
2
eiz = −e−iz = − e1iz , also (eiz ) = 1, insbesondere |eiz | = 1. Wegen |eiz | = |eix−y | =
ix −y
ix −y
−y
|e e | = |e | e = e folgt e−y = 1, also y = 0. Damit ist z = x ∈ R.
Sei nun k := max{j ∈ Z : jπ ≤ x} und t := x − kπ. Dann gilt 0 ≤ t < π und
cos t = − cos(t + π) = cos(t + 2π) = · · · = (−1)k cos(t + kπ) = (−1)k cos x = 0.
Nach Definition von π folgt t ≥ π2 . Wegen cos(π − t) = − cos(−t) = − cos t = 0
folgt aber auch π − t ≥ π2 , insgesamt also t = π2 und damit x = π2 + kπ.
Die entsprechende Aussage für den Sinus folgt wegen sin z = − cos z + π2 . sin z
cos z
Definition
π 3.4.3 Die durch
tan z := cos z und cot z := sin z definierten Funktionen
tan : C\ 2 + kπ : k ∈ Z → C und cot : C\ {kπ : k ∈ Z} → C heißen Tangens
und Cotangens.
65
3.5 Polarkoordinaten
1
1
2
3
arccot
2
–1
–4
–2
4
–2
–1
–3
Abbildung 8: Der Tangens, Cotangens und ihre Umkehrfunktionen.
Definition 3.4.4 Die durch cosh z := 21 (ez + e−z ), sinh z := 12 (ez − e−z ), sowie
sinh z
cosh z
tanh z := cosh
und
z :=
Funktionen cosh : C → C, sinh :
z
sinh z definierten
coth
π
C → C, tanh : C\ i 2 + kπ : k ∈ Z → C und coth : C\ {ikπ : k ∈ Z} → C heißen Cosinus hyperbolicus, Sinus hyperbolicus, Tangens hyperbolicus und Cotangens
hyperbolicus.
Beweis. Sei z/|z| = u + iv mit u, v ∈ R. Dann gilt u2 + v 2 = 1 und daher |u| ≤ 1
und |v| ≤ 1. Wir setzen ψ := arccos u und ϕ := ψ falls v ≥ 0 und ϕ := −ψ falls
v < 0. Nun gilt cos ϕ = cos ψ = u. Außerdem gilt sin2 ψ = 1 − cos2 ψ = 1 − u2 = v 2
und daher sin ψ = | sin ψ| = |v|. (Man beachte, dass sin ψ ≥ 0 wegen 0 ≤ ψ ≤ π.)
Dies liefert sin ϕ = v. Es folgt
z = |z|(u + iv) = |z|(cos ϕ + i sin ϕ) = |z|eiϕ .
Umgekehrt folgt aus eiϕ = u + iv mit u, v ∈ R sofort dass cos ϕ = u, und hieraus
folgt leicht, dass ϕ = arccos u falls ϕ ∈ [0, π] und ϕ = − arccos u sonst. Damit ist
also ϕ eindeutig bestimmt. Man nennt dies die Darstellung
z = |z|eiϕ = |z|(cos ϕ + i sin ϕ)
aus Satz 3.5.1 die Polarkoordinatendarstellung von z und nennt ϕ das Argument
von z.
66
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Die Polarkoordinaten liefern eine geometrische Interpretation der Multiplikation
i(t1 +t2 )
komplexer Zahlen: mit z1 = r1 eit1 und z2 √
= r2 eit2 ist z1 z2 = r√
. Im
1 r2 e
Abbildung 10 etwa ist z1 = 2eiπ/3 = 1 + i 3, z2 = 23 eiπ/4 = 43 2(1 + i) und
z1 z2 = 3ei7π/12 .
3.6 Kompakte Mengen
67
Beweis. Sei (xn ) Folge in [a, b]. Nach dem Satz von Bolzano-Weierstraß hat (xn ) eine
konvergente Teilfolge, etwa xnk → x. Nach Satz 2.2.4 (man vgl. den im Anschluss
an Satz 2.2.4 betrachteten Spezialfall) folgt a ≤ x ≤ b, das heißt, x ∈ [a, b]. Beispiel 2. Für R > 0 ist {z ∈ C : |z| ≤ R} kompakt. Der Beweis ist analog zu
Beispiel 1, wenn man noch Satz 2.2.3 beachtet.
Beispiel 3. A := n1 : n ∈ N ist nicht kompakt, da n1 Folge in A, n1 → 0, aber
0∈
/ A. Es ist aber A ∪ {0} kompakt.
Beispiel 4. Endliche Teilmengen von C sind kompakt.
Satz 3.6.1 Kompakte Mengen sind beschränkt.
Beweis. Sei K ⊂ C kompakt. Wir nehmen an, dass K nicht beschränkt ist. Dann
existiert zu jedem n ∈ N ein xn ∈ K mit |xn | > n. Es ist dann jede Teilfolge von
(xn ) unbeschränkt und damit divergent. Also hat (xn ) keine konvergente Teilfolge,
ein Widerspruch. Satz 3.6.2 Kompakte Teilmengen von R haben ein Minimum und ein Maximum.
Abbildung 10: Geometrische Interpretation der Multiplikation komplexer Zahlen.
Satz 3.5.2 Für n ∈ N hat die Gleichung z n = 1 genau n Lösungen, nämlich
z = ωk := exp(2πik/n), wobei k ∈ {0, 1, 2, . . . , n − 1}.
Beweis. Wegen ωkn = (exp(2πik/n))n = exp(2πi) = 1 leisten die ωk das Verlangte.
Da ein Polynom vom Grad n nicht mehr als n Nullstellen haben kann, folgt die
Behauptung. Bemerkung. Die ωk heißen n-te Einheitswurzeln.
Wir können jetzt Satz 1.9.1 über die Existenz von Quadratwurzeln wie folgt
verallgemeinern.
Satz 3.5.3 Sei w ∈ C \ {0} und n ∈ N. Dann hat die Gleichung z n = w eine Lösung. Ist ζ eine Lösung, so ist {ζω0, ζω1, . . . , ζωn−1} die Lösungsmenge der
Gleichung.
Beweis. Sei K ⊂ R kompakt. Nach Satz 3.6.1 ist K beschränkt und damit existiert
sup K ∈ R. Desweiteren existiert eine Folge (xn ) in K mit xn → sup K. Da K
kompakt ist, folgt sup K ∈ K, das heißt, K hat ein Maximum. Analog sieht man,
dass K ein Minimum hat. Satz 3.6.3 Sei K ⊂ C kompakt und sei f : K → C stetig. Dann ist f (K) kompakt.
Beweis. Sei (yn ) Folge in f (K). Dann existiert eine Folge (xn ) ∈ K mit f (xn ) = yn
für alle n ∈ N. Da K kompakt, existiert eine Teilfolge (xnk ) und ξ ∈ K mit xnk → ξ.
Da f stetig in ξ, folgt ynk = f (xnk ) → f (ξ) ∈ f (K). Ist K ⊂ M ⊂ C und f : M → C stetig in K, so ist auch f |K stetig; vgl.
Übung. Für kompaktes K kann dann Satz 3.6.3 auf f |K angewandt werden, und
man erhält, dass f (K) kompakt ist. Eine analoge Bemerkung gilt für den folgenden
Satz.
Satz 3.6.4 Sei K ⊂ C kompakt und sei f : K → R stetig. Dann nimmt f auf
K sein Minimum und Maximum an, d. h., es existieren α, β ∈ K mit f (α) =
min f (K) und f (β) = max f (K).
Beweis. Nach Satz p
3.5.1 existiert ϕ ∈ [−π, π) mit w = |w|eiϕ . Damit erhalten wir
eine Lösung ζ := n |w|eiϕ/n . Dass die Lösungsmenge die angegebene Form hat,
folgt leicht aus Satz 3.5.1. Beweis. Es ist f (K) kompakt nach Satz 3.6.3 und damit folgt die Behauptung aus
Satz 3.6.2. 3.6
Mit Hilfe von Satz 3.5.3 und Satz 3.6.4 können wir einen Beweis des Fundamentalsatzes der Algebra (Satz 1.9.2) geben.
Kompakte Mengen
Definition 3.6.1 Sei K ⊂ C. Dann heißt K kompakt, falls jede Folge in K eine
konvergente Teilfolge besitzt, deren Grenzwert in K liegt.
Beispiel 1. Abgeschlossene Intervalle sind kompakt, d. h., sind a, b ∈ R mit a < b,
so ist das Intervall [a, b] kompakt.
Beweis des Fundamentalsatzes
der Algebra. Sei n ∈ N und sei p ein Polynom vom
P
Grad n, etwa p(z) = nj=0 aj z j mit a0 , a1 , . . . , an ∈ C, an 6= 0. Wir können ohne
Beschränkung der Allgemeinheit an = 1 annehmen. Wir werden zuerst zeigen, die
Funktion |p| ihr Minimum in einem Punkt z1 annimmt, und wir zeigen dann, dass
p(z1 ) = 0 gilt.
68
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Dazu wählen wir
(
n−1
X
R > max 2
|aj |, 1
j=0
Für t ∈ (0, δ) gilt dann
)
|h(t)| ≤ tℓ+1
und betrachten K := {z ∈ C : |z| ≤ R}. Dann ist K kompakt. Nach Satz 3.6.4
nimmt |p| sein Minimum in K in einem Punkt z1 ∈ K an. Für |z| ≥ R gilt nun
n−1
X
|p(z)| ≥ |z n | −
≥ Rn −
j=0
n−1
X
j=0
= Rn−1
> Rn−1
R−
n−1
X
j=0
j=0
j=0
|aj |
!
|aj |
≥ |a0 |
= |p(0)|
≥ |p(z1 )|
j=ℓ
Nach Satz 3.5.3 existiert nun ζ ∈ C \ {0} mit ζ ℓ = −1/aℓ . Wir erhalten
p(ζt) = b0 1 − tℓ + h(t)
h(t) :=
Sei
δ :=
Definition 3.6.2 Sei M ⊂ C und f : M → C. Dann heißt f gleichmäßig stetig
falls zu jedem ε ∈ R+ ein δ ∈ R+ existiert, so dass für alle x, y ∈ M mit |x − y| < δ
gilt, dass |f (x) − f (y)| < ε ist.
Für K ⊂ M heißt f gleichmäßig stetig in K (oder auf K), falls f |K gleichmäßig
stetig ist.
In Quantorenschreibweise lautet die in der Definition angegebene Eigenschaft wie
folgt:
∀ε ∈ R+ ∃δ ∈ R+ ∀x, y ∈ M : |x − y| < δ ⇒ |f (x) − f (y)| < ε.
Zum Vergleich betrachten wir noch einmal die ε-δ-Definition der Stetigkeit im
Punkte x (Satz 3.1.2):
Es folgt |z1 | < R und |p(z1 )| = minz∈C |p(z)|.
Wir zeigen nun, dass p(z1 ) = 0 gilt. Dazu können wir ohne Beschränkung der
Allgemeinheit annehmen, dass z1 = 0 gilt, da wir andernfalls das durch q(z) :=
p(z + z1 ) definierte Polynom q statt p betrachten können. (Man überzeugt sich
leicht, dass q tatsächlich ein Polynom ist.) Sei ℓ := min{j ∈ {1, 2, . . . , n} : aj 6= 0}.
Mit aj := aj /a0 erhalten wir
!
n
X
p(z) = a0 1 +
cj z j .
mit
|p(ζt)| = |a0 1 − tℓ + h(t) | < |a0 | = |p(0)|.
Da |p| sein Minimum in z1 = 0 annimmt, ist dies ein Widerspruch.
|aj |
n−1
X
1 − tℓ + h(t) ≤ Re 1 − tℓ + h(t) + Im 1 − tℓ + h(t)
Wir erhalten
|aj |Rj
n−1
X
und damit
n n X
X
cj cj 1 ℓ
≤ tℓ δ
< t
ζj ζj 2
j=ℓ+1
j=ℓ+1
= 1 − tℓ + Re h(t) + Im h(t)
≤ 1 − tℓ + 2|h(t)| < 1.
|aj z j |
≥ Rn − Rn−1
69
3.6 Kompakte Mengen
n
X
cj j
t.
j
ζ
j=ℓ+1
1
.
n X
cj +1
2
ζj j=ℓ+1
∀ε ∈ R+ ∃δ ∈ R+ ∀y ∈ M : |x − y| < δ ⇒ |f (x) − f (y)| < ε.
Im Unterschied zur gleichmäßigen Stetigkeit darf δ hier also nicht nur von ε, sondern
auch noch von x abhängen. Insbesondere erkennt man, dass aus der gleichmäßigen
Stetigkeit die Stetigkeit folgt. (Aus der gleichmäßigen Stetigkeit von f in K folgt
aber nicht die Stetigkeit von f in K, sondern nur die von f |K.)
Beispiel. Sei f : R → R, x 7→ x2 . Dann ist f stetig, aber nicht gleichmäßig stetig in
R. Denn ist ε = 1 und δ > 0, so gilt für y := 1δ und x := y + δ2 , dass |x − y| = 2δ < δ,
aber
1 δ 2 1 2 δ2
−
+
> 1 = ε.
|f (x) − f (y)| = =1+
δ 2
δ 4
Satz 3.6.5 Sei K ⊂ C kompakt und f : K → C stetig. Dann ist f gleichmäßig
stetig.
Beweis. Wir nehmen an, dass f nicht gleichmäßig stetig ist. Dann existiert ε ∈ R+
mit folgender Eigenschaft:
∀δ ∈ R+ ∃x, y ∈ K : |x − y| < δ ∧ |f (x) − f (y)| ≥ ε.
Insbesondere existieren zu jedem n ∈ N damit xn , yn ∈ K mit |xn − yn | < n1 und
|f (xn ) − f (yn )| ≥ ε. Da K kompakt, existiert eine Teilfolge (xnk ) von (xn ) und
ξ ∈ K mit xnk → ξ. Wegen |xn − yn | < n1 folgt auch ynk → ξ. Wegen der Stetigkeit
von f folgt f (xnk ) → f (ξ) und f (ynk ) → f (ξ), also f (xnk ) − f (ynk ) → 0, im
Widerspruch zu |f (xnk ) − f (ynk )| ≥ ε. 70
3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
3.7
Folgen stetiger Funktionen
n
Wir betrachten für n ∈ N die Funktionen fn : [0, 1] → R, x 7→ x . Dann gilt
fn (x) → f (x) für alle x ∈ [0, 1], wobei f : [0, 1] → R,
0 falls 0 ≤ x < 1,
f (x) =
1 falls x = 1.
Es ist hier f unstetig, aber alle fn sind stetig.
Definition 3.7.1 Sei M ⊂ C, f : M → C und sei (fn ) eine Folge von Funktionen
von M nach C. Dann heißt (fn ) punktweise konvergent gegen f , falls fn (x) → f (x)
für alle x ∈ M gilt, d. h., falls
∀x ∈ M∀ε ∈ R+ ∃N ∈ N∀n ≥ N : |fn (x) − f (x)| < ε.
Die Folge (fn ) heißt gleichmäßig konvergent gegen f , falls für alle ε ∈ R+ ein N ∈ N
existiert, so dass für alle x ∈ M und für alle n ∈ N mit n ≥ N die Abschätzung
|fn (x) − f (x)| < ε gilt, d. h. falls
∀ε ∈ R+ ∃N ∈ N∀x ∈ M∀n ≥ N : |fn (x) − f (x)| < ε.
Wir schreiben auch fn → f gleichmäßig (bzw. punktweise). Für K ⊂ M heißt
f gleichmäßig (bzw. punktweise) konvergent in K, falls f |K gleichmäßig (bzw.
punktweise) konvergiert.
Der Unterschied zwischen den beiden Konvergenzbegriffen ist, dass bei punktweiser Konvergenz die Zahl N nicht nur von ε, sondern auch von x abhängen darf,
während sie bei gleichmäßiger unabhängig von x gewählt werden kann.
Seien fn , f, gn , g : M → C und c ∈ C. Aus den Rechenregeln für Grenzwerte
folgt unmittelbar, dass aus der punktweisen Konvergenz von (fn ) gegen f und der
der punktweisen Konvergenz von (gn ) gegen g auch die punktweise Konvergenz von
(fn + gn ) gegen f + g, die von (cfn ) gegen cf und die von (fn · gn ) gegen f · g folgt.
Die dortigen Beweise zeigen, dass aus der der gleichmäßigen Konvergenz von (fn )
gegen f und (gn ) gegen g auch die gleichmäßige Konvergenz von (fn + gn ) gegen
f + g und die von (cfn ) gegen cf folgt. Das entsprechende Resultat für (fn · gn ) gilt
nicht, wie das Gegenbeispiel fn , gn : R → R, fn (x) = x, gn (x) = x + n1 zeigt. Die
entsprechende Aussage gilt aber, falls f und g beschränkt sind.
Den folgenden Satz beweist man genauso wie bei Zahlenfolgen (vgl. Satz 2.3.5).
Satz 3.7.1 (Cauchykriterium für Funktionenfolgen) Sei M ⊂ C und sei
(fn ) eine Folge von Funktionen von M nach C. Dann konvergiert (fn ) genau dann
gleichmäßig, wenn für alle ε ∈ R+ ein N ∈ N existiert, so dass für alle x ∈ M und
für alle m, n ∈ N mit n ≥ N und m ≥ N die Abschätzung |fm (x) − fn (x)| < ε gilt,
d. h. falls
∀ε ∈ R+ ∃N ∈ N∀x ∈ M∀m, n ∈ N : m ≥ N ∧ n ≥ N ⇒ |fm (x) − fn (x)| < ε.
Satz 3.7.2 Sei M ⊂ C, f : M → C und sei (fn ) eine Folge von Funktionen von
M nach C. Es gelte fn → f gleichmäßig. Sind dann alle fn stetig (in ξ ∈ M), so
ist f stetig (in ξ ∈ M).
71
3.7 Folgen stetiger Funktionen
Beweis. Sei ξ ∈ M und seien alle fn stetig in ξ. Zu zeigen ist, dass f stetig in ξ ist.
Sei dazu ε > 0. Da fn → f gleichmäßig, existiert N ∈ N mit |fn (x) − f (x)| < 3ε
für alle n ≥ N. Da fN stetig in ξ, existiert δ > 0 mit |fN (x) − fN (ξ)| < 3ε für alle
x ∈ M mit |x − ξ| < δ. Es folgt für x ∈ M mit |x − ξ| < δ, dass
|f (x) − f (ξ)| = |f (x) − fN (x) + fN (x) − fN (ξ) + fN (ξ) − f (ξ)|
= |f (x) − fN (x)| + |fN (x) − fN (ξ)| + |fN (ξ) − f (ξ)|
ε ε ε
+ +
<
3 3 3
= ε. Definition 3.7.1, Satz 3.7.2 sowie obige Bemerkungen gelten analog für Reihen (denn
diese sind ja nichts anderes als Folgen).
∈ N und ist die Reihe
P∞Sind also etwa die Funktionen fk : M → C stetig für alle k P
∞
k=1 fk gleichmäßig konvergent, so ist auch die durch x 7→
k=1 fk (x) definierte
Funktion von M nach C stetig. Insbesondere erhält man auch den folgenden Satz
(vgl. Satz 2.6.4).
Satz 3.7.3 (Cauchykriterium für Funktionenreihen) Sei MP⊂ C und sei
(fk ) eine Folge von Funktionen von M nach C. Dann konvergiert ∞
k=1 fk genau
dann gleichmäßig, wenn
m
X
fk (x) < ε.
∀ε ∈ R+ ∃N ∈ N∀x ∈ M∀m, n ∈ N : m > n ≥ N ⇒ k=n+1
Satz 3.7.4 (Majorantenkriterium)
P∞ Sei M ⊂ C und sei (fk ) eine Folge von
Funktionen von M nach C. Sei
k=1 ck eine konvergente Reihe nichtnegativer
reeller Zahlen. Existiert
dann
L
∈
N
mit |fk (x)| ≤ ck für alle k ≥ L und alle
P
x ∈ M, so konvergiert ∞
k=1 fk gleichmäßig.
Pm
P
Beweis. Sei ε > 0. Da ∞
k=n+1 ck < ε
k=1 ck konvergiert, existiert N ∈ N mit
für m > n ≥ N. Es folgt
m
m
m
X
X
X
fk (x) ≤
|fk (x)| ≤
ck < ε
k=n+1
k=n+1
k=n+1
für m > n ≥ max{N, L} und x ∈ M. Die Behauptung folgt aus dem Cauchykriterium für Funktionenreihen. Wir bezeichnen die ε-Umgebung eines Punktes a mit U(a, ε), d. h., U(a, ε) :=
{z ∈ C : |z − a| < ε}. Es ist also U(a, ∞) := C.
P
k
Satz 3.7.5 Sei ∞
k=0 ak (z − z0 )PPotenzreihe mit Konvergenzradius r. Es sei 0 <
k
r ≤ ∞. Dann ist die durch z 7→ ∞
k=0 ak (z −z0 ) definierte Funktion f : U(z0 , r) →
C stetig. Ist 0 < ρ < r, so konvergiert die Potenzreihe gleichmäßig in U(z0 , ρ).
Beweis. Es genügt die zweite Aussage zu beweisen, da hieraus die erste leicht mit
Satz 3.7.2 folgt.
72
4 DIFFERENZIERBARKEIT
p
Sei dazu 0 < ρ < s < r. Dann gilt lim supk→∞ k |ak | < 1s . Damit existiert
p
K ∈ N mit k |ak | ≤ 1s für k ≥ K. Für z ∈ U(z0 , ρ) und k ≥ K folgt damit
k
ρ k
1
k
k
ρk =
.
ak (z − z0 ) = |ak | · |z − z0 | ≤
s
s
Die Behauptung folgt nun mit ck :=
ρ k
s
aus Satz 3.7.4. Zum Beispiel folgt aus obigem Satz, dass die Funktion exp : C → C stetig ist.
(Dies wurde bereits im Beweis von Satz 2.9.5 benutzt.) Allgemeiner sieht man, dass
für a ∈ R+ die durch z 7→ az := exp(z · ln a) definierte Funktion von C nach C
stetig ist.
4
4.1
Differenzierbarkeit
Definition 4.1.1 Sei M ⊂ R, f : M → C und ξ ∈ M Häufungspunkt von M.
Dann heißt f differenzierbar in ξ, wenn
lim
73
schreiben.
Beispiel 1. Sei n ∈ N0 , f : R → R, f (x) = xn .
Behauptung. Die Funktion f ist differenzierbar und f ′ (x) = nxn−1 für x ∈ R.
Beweis. Für x, h ∈ R, h 6= 0, ist
n f (x + h) − f (x)
(x + h)n − xn X n n−k k−1
n n−2
x h+ . . . ,
x h
= nxn−1 +
=
=
2
h
h
k
k=1
und daraus folgt für h → 0 die Behauptung. Beispiel 2. Sei a ∈ C, f : R → C, f (x) = eax (= exp ax).
Behauptung. Die Funktion f ist differenzierbar und f ′ (x) = aeax für x ∈ R.
Beweis. Für x, h ∈ R, h 6= 0, ist
eax+ah − eax
eax eah − eax
eah − 1
f (x + h) − f (x)
=
=
= aeax
.
h
h
h
ah
Definition und grundlegende Eigenschaften
x→ξ
4.1 Definition und grundlegende Eigenschaften
f (x) − f (ξ)
x−ξ
existiert. Dieser Grenzwert heißt dann Ableitung von f in ξ (oder an der Stelle ξ).
df
Er wird mit f ′ (ξ) oder dx
(ξ) bezeichnet.
Ist M ′ die Menge der Häufungspunkte von M, in denen f differenzierbar ist,
so wird durch x 7→ f ′ (x) eine Funktion f ′ : M ′ → C definiert, die Ableitung von f .
df
bezeichnet.
Diese wird auch mit dx
Ist A ⊂ M, so heißt f differenzierbar in A falls A ⊂ M ′ . Ist M ′ = M, so heißt
f differenzierbar.
Bemerkungen. 1. Für f ′ bzw. f ′ (x) wird auch die (etwas problematische) Bezeich(x)
nung dfdx
verwandt.
2. Die Idee ist (für reellwertiges f ) natürlich folgende: durch
f (x) − f (ξ)
x−ξ
ist die Steigung der Sekante durch die Punkte (x, f (x)) und (ξ, f (ξ)) gegeben, und
im Grenzwert x → ξ sollte man die Steigung der Tangente an den Graph von f im
Punkte (ξ, f (ξ)) erhalten. Durch x 7→ f (ξ) + f ′ (ξ)(x − ξ) ist dann die Tangente an
den Graphen von f im Punkte (ξ, f (ξ)) gegeben.
3. Auch bei Funktionen f : M → R sind in Definition 4.1.1 uneigentliche
Grenzwerte (also f ′ (ξ) = ±∞) nicht zugelassen.
4. Man kann den Grenzwert in Definition 4.1.1 auch in der Form
f (ξ + h) − f (ξ)
lim
h→0
h
z
Wegen limz→0 e z−1 = 1 (vgl. §3.3) folgt die Behauptung. Satz 4.1.1 Sei M ⊂ R, f : M → C und ξ ∈ M Häufungspunkt von M. Dann ist
f genau dann differenzierbar in M, wenn eine in ξ stetige Funktion q : M → C mit
f (x) = f (ξ) + q(x)(x − ξ) für x ∈ M existiert. Ist dies der Fall, so gilt q(ξ) = f ′ (ξ).
Beweis. Sei η ∈ C. Nach Satz 3.3.2 gilt
lim
x→ξ
genau dann, wenn die durch
(
q(x) =
f (x) − f (ξ)
=η
x−ξ
f (x) − f (ξ)
falls x ∈ M\{ξ} ,
x−ξ
η
falls x = ξ
definierte Funktion q : M → C stetig in ξ ist. Daraus folgt die Behauptung. Satz 4.1.2 Sei M ⊂ R, f : M → C und ξ ∈ M Häufungspunkt von M. Ist f
differenzierbar in ξ, so ist f stetig in ξ.
Der Satz besagt also, dass differenzierbare Funktionen stetig sind. Sein Beweis folgt
unmittelbar aus Satz 4.1.1.
Satz 4.1.3 Sei M ⊂ R, ξ ∈ M Häufungspunkt von M, f, g : M → C differenzierbar in ξ und c ∈ C. Dann sind f + g, c · f , f · g und im Falle g(ξ) 6= 0 auch die (in
M\g −1 (0) definierte) Funktion fg differenzierbar in ξ und es gilt
(i) (f + g)′(ξ) = f ′ (ξ) + g ′ (ξ),
(ii) (c · f )′ (ξ) = c · f ′ (ξ),
(iii) (f · g)′(ξ) = f ′ (ξ) · g(ξ) + f (ξ) · g ′(ξ),
74
(iv)
4 DIFFERENZIERBARKEIT
′
f ′ (ξ) · g(ξ) − f (ξ) · g ′ (ξ)
f
(ξ) =
.
g
g(ξ)2
Man nennt (iii) Produktregel und (iv) Quotientenregel.
Der Beweis von (i) und (ii) ist sehr einfach und hier ausgelassen. Zum Beweise
von (iii) beachte man, dass für x 6= ξ
f (x)g(x) − f (ξ)g(ξ)
(f · g)(x) − (f · g)(ξ)
=
x−ξ
x−ξ
f (x)g(x) − f (ξ)g(x) + f (ξ)g(x) − f (ξ)g(ξ)
=
x−ξ
f (x) − f (ξ)
g(x) − g(ξ)
=
g(x) + f (ξ)
x−ξ
x−ξ
gilt. Da limx→ξ g(x) = g(ξ) wegen Satz 4.1.2, folgt hieraus die Behauptung.
Die Quotientenregel (iv) folgt auf ähnliche Weise. Wir verzichten auf die Details. Beispiele. 1. Sinus und Cosinus (auf R eingeschränkt) sind differenzierbar mit
sin′ = cos und cos′ = − sin. Denn wegen sin x = 2i1 (eix − e−ix ), Beispiel 2 zu
Definition 4.1.1 und Satz 4.1.3, (i) und (ii), ist der Sinus differenzierbar und
sin′ x =
1 ix
1
ieix − (−i)e−ix =
e + e−ix = cos x
2i
2
′
für x ∈ R. Analog zeigt man cos = − sin.
2. Tangens und Cotangens sind differenzierbar mit tan′ = 1 + tan2 = cos1 2 und
cot′ = −1 − cot2 = − sin1 2 . Dies folgt aus der Quotientenregel. Zum Beispiel ist
tan′ =
sin
cos
′
=
sin′ cos − sin cos′
cos2 + sin2
1
=
=
= 1 + tan2 .
cos2
cos2
cos2
Satz 4.1.4 (Kettenregel) Seien M, N, L ⊂ R, N ⊂ L, g : M → N, f : L → C.
Sei ξ ∈ M Häufungspunkt von M und g(ξ) Häufungspunkt von L. Sei g differenzierbar in ξ und sei f differenzierbar in g(ξ). Dann ist f ◦ g differenzierbar in ξ
und es gilt (f ◦ g)′ (ξ) = f ′ (g(ξ))g ′(ξ).
Beweis. Nach Satz 4.1.1 existieren in ξ bzw. η := g(ξ) stetige Funktionen p : M → C
und q : L → C mit g(x) = g(ξ)+(x−ξ)p(x) für x ∈ M und f (y) = f (η)+(y−η)q(y)
für y ∈ L, und es gilt g ′ (ξ) = p(ξ) und f ′ (η) = q(η). Mit y = g(x) folgt
(f ◦ g)(x) = (f ◦ g)(ξ) + (g(x) − g(ξ))q(g(x)) = (f ◦ g)(ξ) + (x − ξ)p(x)q(g(x)).
Da die durch x 7→ p(x)q(g(x)) definierte Funktion stetig in ξ ist und dort den Wert
p(ξ)q(g(ξ)) = g ′ (ξ)f ′(g(ξ)) hat, folgt mit Satz 4.1.1 die Behauptung. Beispiele. 1. Die Funktion exp ◦ cos ist differenzierbar und
(exp ◦ cos)′ (x) = exp′ (cos x) cos′ x = −ecos x sin x.
75
4.1 Definition und grundlegende Eigenschaften
2. Ist f : M → R differenzierbar in ξ ∈ M, so ist für n ∈ N auch f n : M → R
differenzierbar in ξ mit (f n )′ (ξ) = nf n−1 (ξ)f ′ (ξ). Dies folgt aus der Kettenregel
und Beispiel 1 zu Definition 4.1.1. Ist etwa f : R → R, f (x) = sin3 x, so gilt
f ′ (x) = 3 sin2 x cos x.
Wir haben Differenzierbarkeit hier nur für Funktionen mit Definitionsbereich in
R (und Zielbereich in C) betrachtet. Lässt man in Definition 4.1.1 den Definitionsbereich in C zu, so erhält man den Begriff der komplexen Differenzierbarkeit. Es sei
angemerkt, dass die bisherigen Resultate über Differenzierbarkeit – mit denselben
Beweisen – auch für komplexe Differenzierbarkeit gelten. (Auch die im folgenden
Satz auftauchende Formel für die Ableitung der Umkehrfunktion gilt noch für komplexe Differenzierbarkeit.) Ansonsten treten bei der Untersuchung der komplexen
Differenzierbarkeit aber ganz andere Phänomene auf wie bei der Differenzierbarkeit von Funktionen mit Definitionsbereich in R. Komplexe Differenzierbarkeit wird
später (voraussichtlich in Analysis IV) ausführlich behandelt. Zuvor wird in Analysis II Differenzierbarkeit von Funktionen mit Definitionsbereich in Rn (und Zielbereich in Rm ) untersucht. (Für Funktionen von Teilmengen von C = R2 nach C
erhalten wir also zwei Differenzierbarkeitsbegriffe!)
Im folgenden untersuchen wir Differenzierbarkeit nur für auf Intervallen definierte Funktionen. Ist I das Intervall [a, b], [a, b), (a, b] oder (a, b), so nennen wir
das Intervall (a, b) das Innere von I und bezeichnen es mit int(I). Die Punkte a, b
nennen wir auch Randpunkte von I.
Satz 4.1.5 Seien I, J ⊂ R Intervalle, f : I → J stetig, streng monoton und
surjektiv (und damit bijektiv nach Satz 3.2.3). Sei ξ ∈ I und sei f differenzierbar
in ξ mit f ′ (ξ) 6= 0. Dann ist f −1 differenzierbar in η := f (ξ) und es gilt
(f −1 )′ (η) =
1
1
= ′ −1
.
f ′ (ξ)
f (f (η))
Beweis. Sei (yn ) Folge in J\{η} mit yn → η. Sei xn := f −1 (yn ). Da f −1 nach
Satz 3.2.3 stetig ist, folgt xn → f −1 (η) = ξ. Wegen der Bijektivität von f ist auch
xn 6= ξ für alle n ∈ N. Es folgt
f −1 (yn ) − f −1 (η)
xn − ξ
1
=
→ ′ ,
yn − η
f (xn ) − f (ξ)
f (ξ)
und daraus die Behauptung. Beispiele. 1. Der natürliche Logarithmus ln : R+ → R ist die Umkehrfunktion der
Exponentialfunktion exp : R → R+ , nach Satz 4.1.5 also differenzierbar mit
(ln)′ (x) =
1
1
1
=
=
exp′ (ln x)
exp(ln x)
x
für x ∈ R+ .
Hieraus erhält man, dass für a ∈ C die durch x 7→ xa definierte Funktion
f : R+ → C differenzierbar ist und f ′ (x) = axa−1 gilt. Denn dies folgt wegen
f (x) = exp(a ln x) aus der Kettenregel:
f ′ (x) = a exp(a ln x)(ln)′ (x) = axa
1
= axa−1 .
x
76
4 DIFFERENZIERBARKEIT
Für a ∈ N ist dies das Beispiel 1 zu Definition 4.1.1.
2. Sei f : R → R, f (x) = x3 . Dann ist f streng monoton steigend, stetig und
bijektiv. Außerdem ist f differenzierbar mit f ′ (x) = 3x2 . Die Umkehrfunktion f −1
ist gegeben durch f −1 (y) = y 1/3 (wobei wir dies für y < 0 durch y 1/3 = −(−y)1/3
definiert haben). Für y 6= 0 erhält man mit Satz 4.1.5 (oder durch die Wahl a = 31
′
im vorigen Beispiel) sofort (f −1 ) (y) = 31 y −2/3 .
Für y = 0 ist aber x := f −1 (y) = 0, also f ′ (x) = 0, und damit Satz 4.1.5 nicht
anwendbar. Tatsächlich sieht man leicht, dass
f −1 (y) − f −1 (0)
1
= 2/3 → ∞
y−0
y
77
4.2 Der Mittelwertsatz
und damit
f ′ (0) = lim
x→0
zu (ii): Sei xk =
1
2πk
f (x) − f (0)
= 0.
x−0
für k ∈ N. Dann gilt xk → 0 und
f ′ (xk ) = 2xk sin 2πk − cos 2πk = −1 6→ 0 = f ′ (0).
Damit ist f ′ nicht stetig in 0.
Der Graph dieser Funktion ist in Abbildung 11 dargestellt.
für y → 0, also f −1 nicht differenzierbar in 0 ist.
3. Wegen sin′ x = cos x > 0 für x aus dem Intervall (− π2 , π2 ) ist arcsin differenzierbar im Intervall (−1, 1) und es gilt dort
arcsin′ x =
1
1
1
1
.
=√
=
=p
sin′ (arcsin x)
cos(arcsin x)
1 − x2
1 − sin2 (arcsin x)
In den Punkten ±1 ist arcsin nicht differenzierbar.
Analog sieht man, dass die Funktion arccos : [−1, 1] → [0, π] im Intervall (−1, 1)
differenzierbar ist und dort
arccos′ x = − √
1
1 − x2
Abbildung 11: Der Graph der für x 6= 0 durch f (x) = x2 sin x1 gegebenen Funktion.
gilt. Ebenso zeigt eine kurze Rechnung, dass arctan : R → − π2 , π2 und arccot :
R → (0, π) auf ganz R differenzierbar sind und
arctan′ x =
1
1 + x2
und arccot′ x = −
1
1 + x2
für alle x ∈ R gilt.
Die Ableitung einer differenzierbaren Funktion muss nicht stetig sein. Als Beispiel betrachten wir die Funktion f : R → R,
2
x sin x1 falls x 6= 0,
f (x) =
0
falls x = 0
Wir zeigen: (i) f ist differenzierbar, (ii) f ′ ist nicht stetig.
zu (i): Mit Produkt- und Kettenregel folgt, dass f differenzierbar in R\{0} ist,
mit
1
1
1
1
1
− 2 = 2x sin − cos
f ′ (x) = 2x sin + x2 cos
x
x
x
x
x
für x ∈ R\{0}. Um die Differenzierbarkeit in 0 zu untersuchen, notieren wir
zunächst, dass | sin t| ≤ 1 für t ∈ R wegen sin2 t + cos2 t = 1. Es folgt
f (x) − f (0) = x sin 1 ≤ |x|
x−0 x
Dieses Beispiel zeigt auch, dass die Interpretation der Ableitung als Tangentensteigung problematisch sein kann.
Definition 4.1.2 Sei I Intervall und f : I → C differenzierbar. Dann heißt f stetig
differenzierbar, falls f ′ stetig ist.
Für n ∈ N heißt f n-mal (stetig) differenzierbar, falls die induktiv durch f (n) :=
(f (n−1) )′ , f (0) := f , definierte n-te Ableitung f (n) existiert (und stetig ist). Man
schreibt f ′′ statt f (2) = (f ′ )′ und f ′′′ statt f (3) .
Zum Beispiel ist der Cosinus beliebig oft differenzierbar mit cos′ = − sin,
cos′′ = − cos, cos′′′ = sin, cos(4) = cos und damit cos(4k) = cos, cos(4k+1) = − sin,
cos(4k+2) = − cos und cos(4k+3) = sin für k ∈ N.
4.2
Der Mittelwertsatz
Definition 4.2.1 Sei M ⊂ C, f : M → R, ξ ∈ M. Gilt f (ξ) ≥ f (x) für alle
x ∈ M, so sagt man, dass f in ξ ein globales Maximum hat. Existiert ε > 0 mit
f (ξ) ≥ f (x) für alle x ∈ M mit |x − ξ| < ε, so sagt man, dass f in ξ ein lokales
Maximum hat. Der Wert f (ξ) wird dann als lokales Maximum bezeichnet.
Entsprechend spricht man von einem globalen bzw. lokalen Minimum. Ein Extremum ist ein Maximum oder Minimum.
78
4 DIFFERENZIERBARKEIT
79
4.2 Der Mittelwertsatz
3
2
1
1
0.5
1.5
2
–1
Abbildung 12: Der Graph der durch f (x) = x4 − 2x2 gegebenen Funktion f .
Abbildung 13: Illustration des Mittelwertsatzes.
Offensichtlich sind globale Extrema auch lokale Extrema, aber nicht umgekehrt.
Man betrachte etwa f : R → R, f (x) = x4 − 2x2 = (x2 − 1)2 − 1; vgl. Abbildung 12. Wie man durch einen Blick auf den Graphen erkennt, und durch eine
kurze Rechnung auch leicht verifiziert, hat diese Funktion in 0 ein lokales Maximum, aber sie besitzt kein globales Maximum. In 1 und −1 hat f ein globales (und
lokales) Minimum.
Satz 4.2.3 (Satz von Rolle) Sind a, b, f wie in Satz 4.2.2 und ist außerdem noch
f (a) = f (b), so existiert ξ ∈ (a, b) mit f ′ (ξ) = 0.
Ist M ⊂ C kompakt und f : M → R stetig, so existieren nach Satz 3.6.4 immer
Punkte, in denen f sein globales Minimum und Maximum hat.
Satz 4.2.1 Sei I ⊂ R Intervall, f : I → R stetig und ξ innerer Punkt von I. Ist f
differenzierbar in ξ und hat f in ξ ein lokales Extremum, so ist f ′ (ξ) = 0.
Beweis. Ohne Beschränkung der Allgemeinheit habe f ein lokales Minimum in ξ.
Dann existiert ε > 0 mit mit f (x) − f (ξ) ≥ 0 für alle x ∈ I mit |x − ξ| < ε. Es folgt
f (x) − f (ξ)
f (x) − f (ξ)
f ′ (ξ) = lim
≥ 0 und f ′ (ξ) = lim
≤ 0,
x→ξ+
x→ξ−
x−ξ
x−ξ
also f ′ (ξ) = 0. Satz 4.2.2 (Mittelwertsatz) Seien a, b ∈ R, a < b. Sei f : [a, b] → R stetig und
in (a, b) differenzierbar. Dann existiert ξ ∈ (a, b) mit
f (b) − f (a)
.
f (ξ) =
b−a
′
Der Mittelwertsatz hat eine einfache anschauliche Interpretation: es existiert ein
Punkt, wo die Steigung der Tangente an den Graphen von f gleich der Steigung
der Sekante durch (a, f (a)) und (b, f (b)) ist.
Im Beispiel f : [0, 2] → R, f (x) = x + sin(πx) haben ξ = 21 und ξ = 23 die
verlangte Eigenschaft; siehe Abbildung 13
Ein Spezialfall des Mittelwertsatzes ist der folgende Satz.
Wir beweisen zuerst diesen Spezialfall, und führen den allgemeinen Fall dann darauf
zurück.
Beweis von Satz 4.2.3. Nach Satz 3.6.4 existieren α, β ∈ [a, b] so dass f (α) =
min f ([a, b]) und f (β) = max f ([a, b]). Nach Satz 4.2.1 folgt f ′ (α) = 0 falls α ∈
(a, b) und f ′ (β) = 0 falls β ∈ (a, b). Damit folgt die Behauptung, außer wenn
{α, β} ⊂ {a, b}. In diesem Fall ist aber wegen f (a) = f (b) auch f (α) = f (β), also
f konstant und damit f ′ (x) = 0 für alle x ∈ (a, b). Beweis von Satz 4.2.2. Wir betrachten h : [a, b] → R,
h(x) = f (x) −
Dann gilt
f (b) − f (a)
(x − a).
b−a
f (b) − f (a)
(b − a) = h(a).
b−a
Nach Satz von Rolle existiert also ξ ∈ (a, b) mit
h(b) = f (b) −
f (b) − f (a)
. b−a
Ersetzt man in obigem Beweis h(x) durch
0 = h′ (ξ) = f ′ (ξ) −
h(x) = f (x) −
f (b) − f (a)
(g(x) − g(a))
g(b) − g(a)
mit einer Funktion g, wobei g(a) 6= g(b), so erhält man folgendes Resultat.
Satz 4.2.4 (Verallgemeinerter Mittelwertsatz) Seien a, b ∈ R, a < b, f, g :
[a, b] → R stetig und in (a, b) differenzierbar. Sei g ′ (x) 6= 0 für x ∈ (a, b). Dann ist
g(a) 6= g(b) und es existiert ξ ∈ (a, b) mit
f (b) − f (a)
f ′ (ξ)
=
.
g ′(ξ)
g(b) − g(a)
80
4 DIFFERENZIERBARKEIT
Hierbei folgt g(a) 6= g(b) aus dem Satz von Rolle, angewandt auf g.
Der Satz von Rolle – und folglich der (verallgemeinerte) Mittelwertsatz – gelten
nicht für komplexwertige Funktionen. Zum Beispiel gilt für f : [0, 2π] → C, x 7→ eix ,
dass f (0) = f (2π) = 0, aber f ′ (x) = ieix 6= 0 für alle x.
Es gilt aber immerhin noch der folgende Satz.
Satz 4.2.5 Seien a, b ∈ R, a < b. Sei f : [a, b] → C stetig und in (a, b) differenzierbar. Dann existiert ξ ∈ (a, b) mit
|f ′(ξ)| ≥
|f (b) − f (a)|
.
b−a
Beweis. Die Behauptung ist trivial für f (a) = f (b). Andernfalls setzt man
q :=
|f (b) − f (a)|
f (b) − f (a)
und g : [a, b] → R, g(x) = Re(qf (x)). Der Mittelwertsatz liefert ξ ∈ (a, b) mit
g ′(ξ) =
|f (b) − f (a)|
g(b) − g(a)
=
b−a
b−a
4.3 Anwendungen des Mittelwertsatzes
Existiert zusätzlich noch f ′′ (ξ), so gilt:
(iii) Ist f ′′ (ξ) < 0, so hat f ein lokales Maximum in ξ.
(iv) Ist f ′′ (ξ) > 0, so hat f ein lokales Minimum in ξ.
Beweis. (i) und (ii) folgen sofort aus Satz 4.3.2.
zu (iii): Wegen
f ′ (x) − f ′ (ξ)
f ′ (x)
= lim
x→ξ+
x→ξ+ x − ξ
x−ξ
0 > f ′′ (ξ) = lim
existiert β ∈ I, β > ξ, mit f ′ (x) < 0 für x ∈ (ξ, β). Analog existiert α ∈ I mit der
geforderten Eigenschaft. Die Behauptung folgt jetzt aus (i).
Analog folgt (iv) aus (ii). √
√
Beispiel. Sei f : [0, 5] → R, f (x) = x + 2 5 − x. Dann ist f stetig und differenzierbar in (0, 5) mit
√ 1
1
2 x
1
.
(−1) = √
f ′ (x) = √ + 2 √
1− √
2 x
2 x
2 5−x
5−x
Es gilt (für 0 < x < 5)
√
√
f ′ (x) > 0 ⇔ 2 x ≤ 5 − x ⇔ 4x < 5 − x ⇔ x ∈ (0, 1)
und die Behauptung folgt wegen |f ′(ξ)| = |qf ′(ξ)| ≥ Re(qf ′ (ξ)) = g ′ (ξ). 4.3
Anwendungen des Mittelwertsatzes
Satz 4.3.1 Sei I Intervall und seien f, g : I → C stetig und in int(I) differenzierbar. Gilt dann f ′ (x) = g ′(x) für alle x ∈ int(I), so existiert c ∈ C mit
f (x) = g(x) + c für alle x ∈ I.
Beweis. Die Funktion h := f − g ist stetig in I, differenzierbar in int(I) und erfüllt
h′ (x) = 0 für x ∈ int(I). Aus Satz 4.2.5 folgt h(x) = h(y) für x, y ∈ I. Damit ist h
konstant. 81
und analog
f ′ (x) < 0 ⇔ x ∈ (1, 5) und f ′ (x) = 0 ⇔ x = 1.
Es folgt, dass f streng monoton steigend in [0, 1] ist (d. h., f |[0, 1] ist streng monoton steigend), dass f streng monoton fallend in [1, 5] ist und dass f in 1 ein lokales
Maximum hat. Dieses ist sogar
√ Maximum. Es gilt f (1) = 5. Das globale
√ globales
Minimum wird wegen f (5) = 5 < 2 5 = f (0) in 5 angenommen, in 0 hat f ein
lokales Minimum.
Der Graph von f ist in Abbildung 14 dargestellt.
Satz 4.3.2 Sei I Intervall und f : I → R stetig und in int(I) differenzierbar. Dann
ist f monoton wachsend falls f ′ (x) ≥ 0 für alle x ∈ int(I) und monoton fallend
falls f ′ (x) ≤ 0 für alle x ∈ int(I). Falls f ′ (x) > 0 bzw. f ′ (x) < 0 für alle x ∈ int(I),
so liegt strenge Monotonie vor.
Definition 4.3.1 Sei I Intervall. Eine Funktion f : I → R heißt konvex, wenn für
x1 , x2 , x ∈ I mit x1 < x < x2
Beweis. Ist x1 , x2 ∈ I, x1 < x2 , so existiert nach Mittelwertsatz ξ ∈ (x1 , x2 ) ⊂ int(I)
mit f (x2 ) − f (x1 ) = (x2 − x1 )f ′ (ξ). Daraus folgt die Behauptung. gilt. Gilt hier immer “<”, so heißt f streng konvex. Gilt immer “≥” bzw. “>”, so
heißt f (streng) konkav.
Satz 4.3.3 Sei I Intervall, f : I → R und ξ ∈ int(I). Sei f differenzierbar in ξ
mit f ′ (ξ) = 0. Dann gilt:
Die Bedingung in Definition 4.3.1 besagt, dass der Graph von f unterhalb der
Sekanten liegt. Äquivalent ist, dass die Sekante durch (x1 , f (x1 )) und (x, f (x))
kleinere Steigung hat als die durch (x, f (x)) und (x2 , f (x2 )), dass also
(i) Existieren α, β ∈ I mit α < ξ < β, so dass f differenzierbar in (α, β) ist und
f ′ (x) ≥ 0 für x ∈ (α, ξ) und f ′ (x) ≤ 0 für x ∈ (ξ, β) gilt, so hat f ein lokales
Maximum in ξ.
(ii) Existieren α, β ∈ I mit α < ξ < β, so dass f differenzierbar in (α, β) ist und
f ′ (x) ≤ 0 für x ∈ (α, ξ) und f ′ (x) ≥ 0 für x ∈ (ξ, β) gilt, so hat f ein lokales
Minimum in ξ.
f (x) ≤
x − x1
x2 − x
f (x1 ) +
f (x2 )
x2 − x1
x2 − x1
f (x2 ) − f (x)
f (x) − f (x1 )
≤
x − x1
x2 − x
gilt.
In Abbildung 15 ist dies für f (x) = 1 + (x − 4)2 = x2 + 8x + 17, x1 = 1, x = 3
und x2 = 6 dargestellt.
82
4 DIFFERENZIERBARKEIT
83
4.3 Anwendungen des Mittelwertsatzes
und existiert
lim
f ′ (x)
,
g ′ (x)
lim
f (x)
g(x)
x→a
so existiert auch
x→a
und es gilt
f ′ (x)
f (x)
= lim ′ .
x→a g (x)
x→a g(x)
lim
Abbildung 14: Der Graph von f : [0, 5] → R, f (x) =
√
√
x + 2 5 − x.
Entsprechendes gilt für den Grenzübergang x → b.
Es sind a = −∞ und b = ∞ zugelassen und die auftretenden Grenzwerte von
f /g bzw. f ′ /g ′ können auch uneigentliche Grenzwerte sein.
Beweis. Wir beschränken uns auf den Fall, dass limx→a f (x) = limx→a g(x) = 0 und
a ∈ R gilt. Wir betrachten die stetigen Ergänzungen F, G : [a, b) → R, die durch
f (x) falls x ∈ (a, b) ,
F (x) =
0
falls x = a
und
G(x) =
g(x) falls x ∈ (a, b) ,
0
falls x = a
gegeben sind. Nach dem Satz von Rolle und wegen G′ (ξ) = g ′ (ξ) 6= 0 für ξ ∈ (a, b)
gilt dann g(x) = G(x) 6= G(a) = 0 für x ∈ (a, b). Nach dem verallgemeinerten
Mittelwertsatz folgt für x ∈ (a, b) dann
Abbildung 15: Konvexität.
Satz 4.3.4 Sei I Intervall und f : I → R differenzierbar und in int(I) zweimal
differenzierbar. Gilt f ′′ (x) ≥ 0 für alle x ∈ int(I), so ist f konvex. Gilt f ′′ (x) ≤ 0
für alle x ∈ int(I), so ist f konkav. Gilt immer “>” bzw. “<”, so liegt strenge
Konvexität bzw. Konkavität vor.
Für den Beweis sei auf die Übung verwiesen.
Eine Anwendung des verallgemeinerten Mittelwertsatzes führt auf das folgende
Ergebnis.
Satz 4.3.5 (Regeln von de l’Hospital) Sei (a, b) offenes Intervall und seien
f, g : (a, b) → R differenzierbar. Sei g ′(x) 6= 0 für alle x ∈ (a, b). Gilt dann
f (x)
F (x) − F (a)
F ′ (ξ)
f ′ (ξ)
=
= ′
= ′
g(x)
G(x) − G(a)
G (ξ)
g (ξ)
mit einem ξ ∈ (a, x). Hieraus folgt die Behauptung, da mit x → a auch ξ → a. Wir haben Satz 4.3.5 für einseitige Grenzwerte formuliert, aber daraus folgt
natürliche eine entsprechende Aussage für allgemeine Grenzwerte unmittelbar.
Beispiele. 1. Es gilt
lim
x→0
√
denn wegen arcsin′ x = 1/ 1 − x2 → 1 und tan′ (x) = 1/ cos2 x → 1 folgt
arcsin′ x
= 1.
x→0 tan′ x
lim
2. Wir untersuchen die Existenz des Grenzwertes
L := lim
1
1
−
.
ln(1 + x) arctan x
L = lim
arctan x − ln(1 + x)
,
ln(1 + x) arctan x
x→0
lim f (x) = lim g(x) = 0
x→a
arcsin x
= 1,
tan x
x→a
Zunächst gilt,
oder
lim f (x) = lim g(x) = ∞
x→a
x→a
x→0
84
4 DIFFERENZIERBARKEIT
85
4.3 Anwendungen des Mittelwertsatzes
falls L existiert. Nach Satz 4.3.5 folgt
3
3
L = lim
x→0
= lim
x→0
1
1+x2
1
1+x
−
1
1+x
(1 +
2
2
1
arctan x + ln(1 + x) 1+x
2
x − x2
,
+ (1 + x) ln(1 + x)
1
1
x2 ) arctan x
falls der Grenzwert auf der rechten Seite existiert. Auch dort konvergieren für x → 0
wieder Zähler und Nenner gegen 0. Satz 4.3.5 liefert
1 − 2x
x→0 2x arctan x + 1 + ln(1 + x) + 1
1 − 2x
= lim
x→0 2x arctan x + 2 + ln(1 + x)
–1
Wir diskutieren einige numerische Verfahren zur Auflösung von Gleichungen.
Wir wollen eine Nullstelle ξ einer differenzierbaren Funktion f : I → R bestimmen,
wobei I ein Intervall ist. Wir beginnen mit einem Näherungswert x1 und berechnen
den Schnittpunkt x2 der Tangente an f im Punkte (x1 , f (x1 ) mit der x-Achse.
(Dieser Schnittpunkt existiert falls f ′ (x1 ) 6= 0.) Dies führt auf die Gleichung f (x1 )+
f ′ (x1 )(x2 − x1 ) = 0, also
f (x1 )
.
x2 = x1 − ′
f (x1 )
In vielen Fällen ist x2 ein besserer Näherungswert für ξ als x1 . Man definiert nun
rekursiv eine Folge (xn ) durch
xn+1 := xn −
f (xn )
.
f ′ (xn )
Wir werden sehen, dass unter geeigneten Voraussetzungen and f und x1 tatsächlich
limn→∞ xn = ξ gilt.
Das hier beschriebene Verfahren zur näherungsweisen Bestimmung einer Nullstelle heißt Newton-Verfahren. Man nennt x1 den Startwert. Man sagt, dass das
Verfahren (gegen ξ) konvergiert, falls die Folge (xn ) definiert werden kann, also
xn ∈ I und f ′ (xn ) 6= 0 für n ∈ N gilt, und falls limn→∞ xn = ξ.
Im Beispiel nach dem Zwischenwertsatz 3.2.1 hatten wir gesehen, dass die Funktion f : R → R, f (x) = ex + x, eine Nullstelle im Intervall (0, 1) hat. Als Rekursionsformel erhalten wir
exp(xn ) + xn
xn+1 := xn −
.
exp(xn ) + 1
Wir wählen als Startwert x1 := 0 und erhalten x2 = − 12 ,
√
3 e
x3 = − √
= −0, 56631 . . .
2( e + 1)
1
0.5
–1
–1
–0.5
0
0.5
1
–1
Abbildung 16: Das Newton-Verfahren für f (x) = ex + x.
L = lim
falls der letzte Grenzwert existiert. Dies ist aber offensichtlich der Fall und der
Grenzwert ist 12 . Wir erhalten L = 21 .
–0.5
x4 = −0, 5671431650 . . ., x5 = −0, 5671432902 . . ., usw. Der Graph von f sowie der
Tangenten an die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) ist in Abbildung 16 dargestellt.
Man kann (mit Hilfe der folgenden Sätze) zeigen, dass tatsächlich limn→∞ xn = ξ =
−0, 56714 . . . gilt.
Zunächst beweisen wir folgenden Satz.
Satz 4.3.6 Sei I Intervall und g : I → R stetig differenzierbar. Sei ξ ∈ int(I) mit
g(ξ) = ξ und |g ′(ξ)| < 1. Dann existiert ε > 0 mit folgender Eigenschaft:
Es ist J := (ξ − ε, ξ + ε) ⊂ I und ist x1 ∈ J und die Folge (xn ) rekursiv definiert
durch xn+1 := g(xn ), so gilt xn ∈ J für alle n ∈ N und limn→∞ xn = ξ.
Beweis. Wegen der Stetigkeit von g ′ existiert ε > 0 und α ∈ (0, 1) mit J :=
(ξ − ε, ξ + ε) ⊂ I und |g ′(x)| ≤ α für alle x ∈ J. Für x ∈ J existiert nach
dem Mittelwertsatz y ∈ J mit (g(x) − g(ξ)) = g ′ (y)(x − ξ). Es folgt |g(x) − ξ| =
|g(x) − g(ξ)| ≤ α|x − ξ|. Insbesondere folgt |xn+1 − ξ| = |g(xn ) − ξ| ≤ α|xn − ξ|.
Induktion liefert |xn − ξ| ≤ αn−1 |x1 − ξ| und dies impliziert wegen α < 1, dass
limn→∞ xn = ξ gilt. Bemerkung. Der Beweis zeigt, dass die Behauptung für alle ε mit
sup |g ′(x)| < 1
|x−ξ|<ε
gilt.
Beispiel. Sei g : R → R, g(x) = cos x. Wegen cos 21 > cos π3 = 21 und cos 1 < 1
folgt mit Hilfe des Zwischenwertsatzes
leicht,
dass ξ ∈ (0, 1) mit g(ξ) = ξ existiert.
Für ε := 21 gilt 12 , 1 ⊂ (ξ−ε, ξ+ε) ⊂ 0, 23 und damit |g ′ (x)| = sin x ≤ sin 23 < 1
für |x − ξ| < ε. Mit Satz 4.3.6 und der dem Satz folgenden Bemerkung folgt,
dass die rekursiv
durch xn+1 := g(xn ) definierte Folge (xn ) für jeden Startwert
x1 ∈ 12 , 1 konvergiert. Zum Beispiel für x1 = 1 erhält man x2 = 0.5403023059 . . .,
x3 = 0.8575532158 . . ., x19 = 0.7393038924 . . ., x20 = 0.7389377567 . . ., usw. Es gilt
ξ = 0.7390851332 . . ..
Satz 4.3.7 Sei I Intervall und sei f : I → R zweimal stetig differenzierbar. Sei
ξ ∈ int(I) mit f (ξ) = 0 und f ′ (ξ) 6= 0. Dann existiert ε > 0 mit J := (ξ −ε, ξ +ε) ⊂
I, so dass das Newton-Verfahren für alle Startwerte aus J gegen ξ konvergiert.
86
4 DIFFERENZIERBARKEIT
f (x)
f ′ (x)
an. Die Funktion g kann in einem Intervall definiert werden, welches ξ im Innern
enthält. Es gilt g(ξ) = ξ. Wegen
g ′ (x) =
f (x)f ′′ (x)
f ′ (x)2
′
folgt g (ξ) = 0, und damit die Behauptung aus Satz 4.3.6.
Bemerkungen. 1. Die Behauptung von Satz 4.3.7 gilt auch dann, wenn f nur einmal
stetig differenzierbar ist. Der Beweis sei als Übung überlassen.
2. Wendet man das Newton-Verfahren auf f (x) = x2 −√
c an, so erhält man das
in §2.3 besprochene Heron-Verfahren zur Berechnung von c.
4.4
Folgen und Reihen differenzierbarer Funktionen
Satz 3.7.2 besagt, dass der Grenzwert einer gleichmäßig konvergenten Folge stetiger
Funktionen ebenfalls stetig ist. Wir beweisen ein analoges Resultat für Differenzierbarkeit.
Satz 4.4.1 Sei I beschränktes Intervall und (fn ) eine Folge von differenzierbaren
Funktionen von I nach C. Die Folge (fn′ ) konvergiere gleichmäßig. Existiert dann
α ∈ I, so dass (fn (α)) konvergiert, so konvergiert (fn ) gleichmäßig gegen eine
differenzierbare Funktion f : I → C und es gilt f ′ (x) = limn→∞ fn′ (x) für alle
x ∈ I.
Der Satz besagt also, dass man unter den gemachten Voraussetzungen den Grenzübergang n → ∞ mit der Differentiation (die ja auch eine Grenzwertbildung ist)
vertauschen kann, dass also (limn→∞ fn )′ = limn→∞ fn′ gilt.
Man beachte, dass die letzte Gleichung nicht gelten muss, wenn fn → f gleichmäßig und f und alle fn differenzierbar sind. Dies zeigt das Beispiel fn : R → R,
fn (x) = n1 sin(nx). Hier gilt fn → 0 gleichmäßig, aber fn′ (0) = cos(n0) = 1 6→ 0.
Beweis von Satz 4.4.1. Sei a := inf I und b := sup I. Wir zeigen zunächst mit
dem Cauchykriterium, dass (fn ) gleichmäßig konvergiert. Sei dazu ε > 0. Nach
Cauchykriterium für (fn′ ) existiert N1 ∈ N mit
′
|fm
(x) − fn′ (x)| <
ε
2(b − a)
für m, n ≥ N1 und x ∈ I. Nach Cauchykriterium für (fn (α) existiert N2 ∈ N mit
|fm (α) − fn (α)| <
87
für m, n ≥ N2 . Nach Satz 4.2.5 gilt dann für m, n ≥ N := max{N1 , N2 } und x ∈ I
mit einem ξ ∈ I:
Beweis. Wir wenden Satz 4.3.6 auf
g(x) := x −
4.4 Folgen und Reihen differenzierbarer Funktionen
ε
2
|fm (x) − fn (x)| ≤ |(fm (x) − fn (x)) − (fm (α) − fn (α))| + |fm (α) − fn (α)|
ε
′
(ξ) − fn′ (ξ)| · |x − α| +
≤ |fm
2
ε
ε
<
(b − a) +
2(b − a)
2
= ε.
Damit ist (fn ) gleichmäßig konvergent. Sei f : I → C, f (x) = limn→∞ fn (x).
Wir zeigen jetzt, dass f differenzierbar ist und f ′ (x) = limn→∞ fn′ (x) gilt. Sei
dazu x ∈ I. Für n ∈ N definieren wir Fn : I → C durch
(
fn (y) − fn (x)
falls y 6= x,
y−x
Fn (y) =
fn′ (x)
falls y = x.
Dann ist Fn stetig nach Satz 3.3.2. Nach Satz 4.2.5 existiert zu y ∈ I wieder ξ ∈ I
mit
′
|Fm (y) − Fn (y)| ≤ |fm
(ξ) − fn′ (ξ)| .
Hierbei wählt man ξ = x falls y = x. Aus der gleichmäßigen Konvergenz von (fn′ )
folgt nun die gleichmäßige Konvergenz von (Fn ). Damit ist nach Satz 3.7.2 die
durch y 7→ limn→∞ Fn (y) definierte Funktion F : I → C stetig. Offensichtlich gilt
(
f (y) − f (x)
falls y 6= x,
y−x
F (y) =
′
limn→∞ fn (x) falls y = x.
Aus Satz 3.3.2. folgt jetzt die Differenzierbarkeit von f in x ist und f ′ (x) =
limn→∞ fn′ (x). Ist in obigem Satz I unbeschränkt, so gelten noch alle gemachten Behauptungen,
außer dass (fn ) nicht mehr gleichmäßig konvergieren muss. Dies sieht man durch
Einschränkung auf beschränkte Teilintervalle ein.
Wie bei Satz 3.7.2 gilt wieder ein Analogon für Reihen.
P
n
Satz 4.4.2 Sei ∞
n=0 an (x − x0 ) Potenzreihe mit x0 ∈ R und an ∈ C für n ∈ N.
Für den Konvergenzradius r gelte 0 < r ≤ ∞. Sei I :=P(x0 − r, x0 + r) falls r < ∞
∞
n
und I = R falls r = ∞. Dann ist die durch x 7→
n=0
P an (x − x0 ) definierte
Funktion f : I → C differenzierbar und es gilt f ′ (x) = ∞
na
(x
−
x0 )n−1 für
n
n=1
x ∈ I.
P
√
n−1
Beweis. Wegen n n → 1 hat die Potenzreihe ∞
ebenfalls Konn=1 nan (x − x0 )
vergenzradius r. Für n ∈ N0 sei gn : I → C, gn (x) = an (x − x0 )n . Dann gilt
n−1
gn′ (x) = nan (x − xP
. Sei 0 < ρ < r und J := (x0 − ρ, x0 + ρ). Nach
3.7.5
0)
PSatz
∞
∞
′
konvergiert dann
n=0 gn gleichmäßig in J. Außerdem konvergiert
n=0 gn (x0 )
(zur Summe a0 .) Mit Satz 4.4.1
Version
dass f differenP (in der
P∞für Reihen) folgt,
′
n−1
zierbar in J ist mit f ′ (x) = ∞
für x ∈ J. Die
n=0 gn (x) =
n=1 nan (x − x0 )
Behauptung folgt für ρ → r; vgl. Satz 3.7.5. 88
4 DIFFERENZIERBARKEIT
Beispiel. Wir betrachten die Potenzreihe
∞
X
n=0
Umgekehrt
kann man nun für beliebig oft in x0 differenzierbares f die PotenzP∞
k
(k)
(x0 )/k! bilden und sich fragen, ob sie zur
reihe
k=0 ak (x − x0 ) mit ak = f
Summe f (x) konvergiert. Man nennt diese Reihe, also die Reihe
(−1)n 2n+1
x
.
2n + 1
√
k
Der Konvergenzradius ist 1 (wegen k → 1). Aus dem Leibnizkriterium erhält
man, dass die Reihe sogar für x ∈ [−1, 1] gleichmäßig konvergiert. Durch
x 7→
∞
X
(−1)n 2n+1
x
2n
+1
n=0
f ′ (x) =
(−1)n x2n =
n=0
∞
X
(−x2 )n =
n=0
0
die Taylorreihe von f in x0 und für n ∈ N ihre n-te Teilsumme
n
X
f (k) (x0 )
k!
k=0
(x − x0 )k
das n-te Taylorpolynom (von f in x0 ). Weiter heißt
das n-te Restglied der Taylorentwicklung (von f in x0 ).
Man beachte, dass aus der Konvergenz der Taylorreihe von f noch nicht folgen
muss, dass ihre Summe f (x) ist. Man betrachte etwa das Beispiel f : R → R,
exp − x12 falls x 6= 0,
f (x) =
0
falls x = 0,
mit x0 = 0. Man kann zeigen, dass f beliebig oft differenzierbar ist und f (k) (0) = 0
für alle k ∈ N gilt. Damit konvergiert die Taylorreihe für alle x ∈ R zur Summe 0.
1
–1
(x − x0 )k ,
Rn (x) := Rn (x, f, x0 ) := f (x) − Tn (x)
2
–2
k!
k=0
1
= arctan′ x.
1 + x2
Mit Satz 4.3.1 und wegen f (0) = 0 = arctan 0 folgt f (x) = arctan x für x ∈ [−1, 1].
Man beachte, dass die Reihe für f ′ nur in (−1, 1) konvergiert, und auch dort nicht
gleichmäßig.
–3
∞
X
f (k) (x0 )
Tn (x) := Tn (x, f, x0 ) :=
wird also eine stetige Funktion f : [−1, 1] → R definiert. Diese ist nach Satz 4.4.2
differenzierbar in (−1, 1) mit
∞
X
89
4.4 Folgen und Reihen differenzierbarer Funktionen
1
2
3
–1
Satz 4.4.3 Sei I Intervall, x0 , x ∈ I, x0 6= x und n ∈ N0 . Die Funktion f : I →
R sei n-mal differenzierbar in I und (n + 1)-mal differenzierbar in int(I). Dann
existiert ξ zwischen x0 und x mit
–2
Rn (x) =
Abbildung 17: Teilsummen (vom Grad 5 und 10) der Reihe des Arcus Tangens.
f (n+1) (ξ)
(x − x0 )n+1 .
(n + 1)!
Der Spezialfall n = 0 ist der Mittelwertsatz. Die Beweisidee hier ist ähnlich.
Wegen tan π4 = 1 folgt insbesondere
∞
X (−1)n
1 1 1
π
= arctan 1 =
= 1 − + − + ....
4
2n
+
1
3 5 7
n=0
Diese Reihe wird auch nach Leibniz benannt.
Aus Satz 4.4.2 folgt, dass mit f, I wie dort die Funktion f unendlich oft differenzierbar ist und dass
f (k) (x) =
∞
X
n=k
n(n − 1) · · · · · (n − k + 1)an (x − x0 )n−k
für k ∈ N und x ∈ I gilt. Insbesondere gilt f (k) (x0 ) = k!ak für alle k ∈ N.
Beweis von Satz 4.4.3. Zunächst existiert ρ ∈ R mit
f (x) =
n
X
f (k) (x0 )
k=0
k!
(x − x0 )k +
ρ
(x − x0 )n+1 .
(n + 1)!
Zu zeigen ist, dass ρ von der Form ρ = f (n+1) (ξ) ist. Sei dazu F : I → R,
F (t) = f (x) −
n
X
f (k) (t)
k=0
k!
(x − t)k −
ρ
(x − t)n+1 .
(n + 1)!
Dann ist F stetig in I und differenzierbar in int(I) und eine kurze Rechnung zeigt,
dass
(x − t)n (n+1)
F ′ (t) =
f
(t) − ρ .
n!
90
4 DIFFERENZIERBARKEIT
Weiter gilt F (x0 ) = F (x) = 0 und nach dem Satz von Rolle existiert ξ zwischen x0
und x mit F ′ (ξ) = 0. Beispiel 1. Sei f : R+ → R, f (x) = ln x, x0 = 1. Dann ist f beliebig oft differenzierbar mit f ′ (x) = 1/x, f ′′ (x) = −1/x2 und f ′′′ (x) = 2/x3 . Durch vollständige
Induktion zeigt man leicht, dass
f (k) (x) = (−1)k+1
(n+1)
f
(−1)n x − 1 n+1 (ξ)
1
n+1 |Rn (x)| = (x − x0 ) = .
≤
n+1
n+1
(n + 1)!
ξ
Es folgt Rn (x) → 0 für n → ∞ und damit
ln x =
k=1
k
(x − 1)
g ′(x) =
∞
X
(−1)k (x − 1)k =
Beispiel 2. Sei α ∈ R und f : R+ → R, f (x) = xα . Wir betrachten wieder die
Taylorentwicklung um x0 = 1. Durch vollständige Induktion sieht man leicht, dass
f (k) (x) = α(α − 1)(α − 2) · . . . · (α − k + 1)xα−k
gilt. Mit
α
α(α − 1)(α − 2) · . . . · (α − k + 1)
:=
k!
k
k
folgt
für x ∈ (1, 2].
f (k) (x)
=
k!
4
2
1
–0.5
α α−k
x .
k
(Man überzeugt sich leicht, dass obige Definition von αk für α ∈ N mit der Definition der Binomialkoeffizienten aus §1.6 übereinstimmt.) Wir erhalten die Taylorreihe
3
0
1
1
=
1 − (1 − x)
x
definiert, und damit folgt g ′(x) = ln′ x und wegen g(1) = 0 = ln 1 auch g(x) = ln x
für x ∈ (0, 2).
Für x ∈ (1, 2] existiert dann ξ ∈ (1, x) mit
∞
X
(−1)k+1
für alle x ∈ (0, 2] gilt, kann man ähnlich wie bei der Reihe des Arcus Tangens
vorgehen. Durch die Reihe auf der rechten Seite wird eine differenzierbare Funktion
g : (0, 2) → R mit
k=0
(k − 1)!
.
xk
91
4.4 Folgen und Reihen differenzierbarer Funktionen
1
0.5
1.5
2
2.5
∞ X
α
(x − 1)k .
k
k=0
3
–1
–2
Wegen
lim
k→∞
–3
–4
Abbildung 18: Der Logarithmus und die Taylorpolynome vom Grad 5 und 10.
α k α k+1
k + 1 = lim
=1
k→∞ α − k und Satz 2.9.2 ist der Konvergenzradius dieser Reihe 1.
3
3
2
2
1
1
Insbesondere gilt
ln 2 =
∞
X
(−1)k+1
k=1
k
=1−
1 1 1
+ − + ....
2 3 4
Für x ∈ [ 21 , 1) gilt 12 ≤ x < ξ < 1 und obiges Argument liefert wieder Rn (x) → 0.
Tatsächlich gilt dies (und damit obige Potenzreihenentwicklung des Logarithmus)
für x ∈ (0, 2], aber für x ∈ (0, 12 ) können wir dies mit obiger Darstellung des
Restglieds Rn (x) nicht zeigen.
Um zu zeigen, dass
∞
X
(−1)k+1
(x − 1)k
ln x =
k
k=1
0
–1
1
2
3
0
1
2
3
–1
Abbildung 19: Taylorpolynome vom Grad 5 und 10 für
√
√
x und 1/ x.
92
4 DIFFERENZIERBARKEIT
Um zu zeigen, dass die Taylorreihe für x ∈ (1, 2) gegen f (x) = xα konvergiert,
betrachten wir das Restglied Rn . Es existiert wieder ξ ∈ (1, x) mit
(n+1)
f
α
(ξ)
(x − 1)n+1 = ξ α−n−1 (x − 1)n+1 .
|Rn (x)| = (n + 1)!
n+1
Da ξ > 1 folgt
α
|Rn (x)| ≤ (x − 1)k k
falls n ≥ α−1. Da die Taylorreihe den Konvergenzradius 1 hat, folgt Rn (x) → 0 für
n → ∞. Das gleiche Argument funktioniert auch wieder für x ∈ ( 21 , 2). Tatsächlich
gilt
∞ X
α
(x − 1)k
xα =
k
k=0
aber sogar für alle x ∈ (0, 2).
Herunterladen